W 2020 roku Apple wykonał odważny ruch; porzucili Intela i przeszli na swój własny krzem do zasilania swoich MacBooków. Chociaż przejście na architekturę ARM z języka projektowania x86 wzbudziło kilka brwi, Apple udowodnili, że wszyscy się mylą, gdy MacBooki zasilane krzemem Apple oferowały oszałamiającą wydajność na wat.

Według kilku ekspertów przejście na architekturę ARM było ważnym powodem wzrostu wydajności na wat. Jednak nowa architektura ujednoliconej pamięci odegrała również kluczową rolę w poprawie wydajności MacBooków nowej generacji.

Czym więc jest architektura ujednoliconej pamięci firmy Apple i jak działa? Cóż, dowiedzmy się.

Dlaczego Twój komputer potrzebuje pamięci?

Przed wejściem w architekturę ujednoliconej pamięci firmy Apple należy najpierw zrozumieć, dlaczego podstawowe systemy pamięci masowej, takie jak pamięć o dostępie swobodnym (RAM), są potrzebne w pierwszej kolejności.

Widzisz, tradycyjny procesor działa z częstotliwością zegara 4 GHz podczas turbodoładowanie. Przy tej szybkości zegara procesor może wykonywać zadania w ćwierć nanosekundy. Jednak dyski pamięci masowej, takie jak dyski SSD i dyski twarde, mogą dostarczać dane do procesora tylko co dziesięć milisekund — to 10 milionów nanosekund. Oznacza to, że w czasie między zakończeniem przetwarzania danych, nad którymi pracuje, a otrzymaniem następnej porcji informacji, procesor jest bezczynny.

To wyraźnie pokazuje, że dyski pamięci masowej nie nadążają za szybkością procesora. Komputery rozwiązują ten problem, używając podstawowych systemów pamięci masowej, takich jak pamięć RAM. Chociaż ten system pamięci nie może przechowywać danych na stałe, jest znacznie szybszy w porównaniu z dyskami SSD — może wysyłać dane w zaledwie 8,8 nanosekundy: nieskończenie szybciej niż obecnie najszybsze dyski SSD.

Ten krótki czas dostępu umożliwia procesorowi szybsze odbieranie danych, co pozwala mu na ciągłe przeglądanie informacji zamiast czekania na wysłanie przez dysk SSD kolejnej partii do przetworzenia.

Dzięki tej architekturze projektowej programy w dyskach pamięci są przenoszone do pamięci RAM, a następnie dostępne dla procesora poprzez rejestry procesora. Dlatego szybszy system podstawowej pamięci masowej poprawia wydajność komputera i właśnie to robi Apple dzięki swojej architekturze Unified Memory Architecture.

Zrozumienie, jak działają tradycyjne systemy pamięci

Teraz, gdy wiemy, dlaczego potrzebna jest pamięć RAM, musimy zrozumieć, w jaki sposób wykorzystują ją GPU i procesor. Chociaż zarówno procesor graficzny, jak i procesor są przeznaczone do przetwarzania danych, procesor jest przeznaczony do wykonywania obliczeń ogólnego przeznaczenia. Wręcz przeciwnie, GPU został zaprojektowany do wykonywania tego samego zadania na różnych rdzeniach. Ze względu na tę różnicę w konstrukcji GPU jest bardzo wydajny w przetwarzaniu i renderowaniu obrazu.

Chociaż procesor i procesor graficzny mają różne architektury, do pobierania danych zależą od podstawowych systemów pamięci masowej. W tradycyjnym systemie z dedykowanym procesorem graficznym istnieją dwa rodzaje pamięci o dostępie swobodnym. To jest VRAM i systemowa pamięć RAM. Znany również jako Video RAM, VRAM jest odpowiedzialny za wysyłanie danych do GPU, a systemowa pamięć RAM przesyła dane do procesora.

Aby jednak lepiej zrozumieć systemy zarządzania pamięcią, spójrzmy na prawdziwy przykład grania w grę.

Po otwarciu gry procesor pojawia się na obrazie, a dane programu gry są przenoszone do systemowej pamięci RAM. Następnie procesor przetwarza dane i przesyła je do pamięci VRAM. Następnie GPU przetwarza te dane i wysyła je z powrotem do pamięci RAM, aby procesor wyświetlał informacje na ekranie. W przypadku zintegrowanego systemu GPU oba urządzenia komputerowe współdzielą tę samą pamięć RAM, ale uzyskują dostęp do różnych przestrzeni w pamięci.

To tradycyjne podejście wiąże się z dużym przepływem danych, co powoduje, że system jest nieefektywny. Aby rozwiązać ten problem, Apple wykorzystuje architekturę Unified Memory Architecture.

Jak działa architektura ujednoliconej pamięci w Apple Silicon?

Apple robi kilka rzeczy inaczej, jeśli chodzi o systemy pamięci.

W przypadku systemów generycznych pamięć RAM jest podłączona do procesora za pomocą gniazda na płycie głównej. To połączenie ogranicza ilość danych wysyłanych do procesora.

Z drugiej strony, Krzem jabłkowy używa tego samego podłoża do montażu pamięci RAM i SoC. Chociaż pamięć RAM nie jest częścią SoC w takiej architekturze, Apple używa podłoża interposera (tkaniny) do połączenia pamięci RAM z SoC. Interposer to nic innego jak warstwa krzemu między SOC a pamięcią RAM.

W porównaniu z tradycyjnymi gniazdami, które do przesyłania danych opierają się na przewodach, interposer umożliwia połączenie pamięci RAM z chipsetem za pomocą krzemowych przelotek. Oznacza to, że MacBooki zasilane krzemem Apple mają pamięć RAM bezpośrednio zapieczoną w pakiecie, co przyspiesza przesyłanie danych między pamięcią a procesorem. Pamięć RAM jest również fizycznie bliżej miejsca, w którym potrzebne są dane (procesory), dzięki czemu dane szybciej docierają tam, gdzie są potrzebne.

Ze względu na tę różnicę w łączeniu pamięci RAM z chipsetem może uzyskać dostęp do dużych przepustowości danych.

Źródło obrazu: Jabłko

Oprócz wspomnianej powyżej różnicy, Apple zmienił również sposób, w jaki CPU i GPU uzyskują dostęp do systemu pamięci.

Jak wyjaśniono wcześniej, procesor graficzny i procesor mają różne pule pamięci w tradycyjnych ustawieniach. Wręcz przeciwnie, Apple pozwala GPU, procesorowi i silnikowi neuronowemu na dostęp do tej samej puli pamięci. Dzięki temu dane nie muszą być przenoszone z jednego systemu pamięci do drugiego, co jeszcze bardziej poprawia wydajność systemu.

Ze względu na wszystkie te różnice w architekturze pamięci, Unified Memory System oferuje wysoką przepustowość danych dla SoC. W rzeczywistości M1 Ultra zapewnia przepustowość 800 GB/s. Ta przepustowość jest znacznie większa w porównaniu z wydajnymi procesorami graficznymi, takimi jak AMD Radeon RX 6800 i 6800XT, które oferują przepustowość 512 GB/s.

Ta wysoka przepustowość umożliwia CPU, GPU i Neural Engine dostęp do ogromnych pul danych w ciągu nanosekund. Ponadto Apple wykorzystuje w serii M2 moduły RAM LPDDR5 o taktowaniu 6400 MHz, aby dostarczać dane z zadziwiającymi prędkościami.

Ile potrzebujesz ujednoliconej pamięci?

Teraz, gdy mamy podstawową wiedzę na temat architektury ujednoliconej pamięci, możemy sprawdzić, ile jej potrzebujesz.

Chociaż architektura ujednoliconej pamięci ma kilka zalet, nadal ma pewne wady. Po pierwsze, pamięć RAM jest podłączona do SoC, więc użytkownicy nie mogą aktualizować pamięci RAM w swoim systemie. Co więcej, CPU, GPU i Neural Engine mają dostęp do tej samej puli pamięci. Z tego powodu ilość pamięci wymaganej przez system drastycznie wzrasta.

Dlatego jeśli jesteś osobą, która surfuje po Internecie i używa mnóstwa edytorów tekstu, wystarczy 8 GB pamięci. Ale jeśli często korzystasz z programów Adobe Creative Cloud, lepszym rozwiązaniem jest uzyskanie wariantu 16 GB, ponieważ będziesz mieć płynniejszą edycję zdjęć, filmów i grafiki na swoim komputerze.

Powinieneś również rozważyć M1 Ultra z 128 GB pamięci RAM, jeśli trenujesz wiele modeli głębokiego uczenia lub pracujesz na osiach czasu wideo z mnóstwem warstw i materiału 4K.

Czy architektura ujednoliconej pamięci służy wyłącznie dobru?

Architektura Unified Memory Architecture na krzemie Apple wprowadza kilka zmian w systemach pamięci w komputerze. Od zmiany sposobu łączenia pamięci RAM z jednostkami obliczeniowymi po przedefiniowanie architektury pamięci, Apple zmienia sposób projektowania systemów pamięci w celu poprawy wydajności ich systemów.

To powiedziawszy, nowa architektura tworzy warunki wyścigu między procesorem, procesorem graficznym i silnikiem neuronowym, zwiększając ilość pamięci RAM, której potrzebuje system.