메모리 대역폭 최대 400GB/s
LPDDR5 16채널 구성으로 대역폭 늘려

최근 애플이 신제품 발표 행사를 통해 공개한 ‘M1 프로’와 ‘M1 맥스’는 여러 면에서 기존 프로세서들을 압도한다. 그 중에서도 M1 프로⋅맥스의 메모리 대역폭은 이전의 PC나 노트북PC로는 범접하기 어려운 수준까지 도달했다. 

이는 M1 프로⋅맥스 칩과 메모리를 일체형으로 패키지(SiP⋅System in Package)한 커스텀 디자인과 다중 메모리 채널 구성 덕분이다.

애플 M1 프로와 M1 맥스. /사진=애플
애플 M1 프로와 M1 맥스. /사진=애플

최대 400GB/s의 메모리 대역폭, DDR5 듀얼채널 구성의 4배

 

지난 19일 공개한 M1 프로⋅맥스는 지난해 애플이 공개한 M1에서 성능이 개선된 버전이다. M1 프로의 CPU는 최대 10개의 코어, GPU는 최대 16개 코어로 구성된다. 이전 M1과 비교하면 CPU 성능은 70%, GPU 성능은 2배로 높아졌다. 

상위 버전인 M1 맥스는 CPU 구성은 M1 프로와 동일하나, GPU에 최대 32개 코어가 장착됐다. 종전 M1 대비 CPU 성능은 70%, GPU 성능은 4배 향상됐다. 덕분에 M1 프로⋅맥스가 장착된 애플 맥북 프로는 노트북 형태지만 하이엔드급 데스트톱 PC를 능가하는 성능을 보여준다.

특히 눈여겨 볼 대목은 메모리 대역폭이다. M1 프로의 메모리 대역폭은 200GB/s, M1 맥스는 두 배인 400GB/s 대역폭을 지원한다. 최근 한 해외 벤치마크에서 인텔의 신규 프로세서 ‘앨더레이크’와 DDR5 D램과의 조합으로 88~90GB/s 대역폭이 나왔다는 점을 감안하면 M1 프로⋅맥스의 메모리 대역폭이 획기적으로 높다.

메모리 대역폭은 CPU⋅GPU가 메모리와 데이터를 주고 받는 속도를 뜻한다. 컴퓨터가 특정 작업을 수행하기 위해서는 메모리에 파일을 얹어 놓고 CPU⋅GPU와 데이터를 주고 받아야 한다. CPU⋅GPU 성능이 아무리 좋아도 메모리 대역폭이 낮으면 충분한 성능을 발휘할 수 없다. 

맥북 프로. /사진=애플
맥북 프로. /사진=애플

메모리 대역폭을 개선하기 위해서는 칩셋과 메모리간 전송 클럭(Clock⋅신호 전송주기)을 높이거나, 비트로 표현되는 버스(Bus)를 확장해야 한다. 대역폭을 고속도로에 비유하면, 통행량을 늘리기 위해 도로 내 차량의 속도를 높이거나 차선을 넓히는 것과 같은 이치다. 

애플은 메모리와 칩셋을 병렬로 연결해 채널수를 늘리는 방식으로 대역폭을 늘렸다. M1 맥스는 LPDDR5 6400mt/s 규격의 램을 사용했는데, 이를 16채널로 병렬 연결해 512비트(32비트 X 16)의 버스폭을 만들어냈다. 

데스크톱 PC도 메모리를 병렬로 구성할 수 있으나, 기껏해야 듀얼채널 정도다. 하이엔드급 데스크톱 PC도 쿼드채널 연결을 넘어서지는 못한다. 채널 수가 늘어날수록 연결이 복잡해지고, 관련 생태계가 싱글채널용 메모리 모듈과 듀얼채널용 메모리 모듈로 통일돼 있기 때문이다. 

한 반도체 설계업체 CTO(최고기술책임자)는 “애플의 M1 프로⋅맥스는 외부 판매용으로 만든 게 아니라 애플이 자체적으로 쓰기 위해 만든 칩셋”이라며 “이 때문에 시장 생태계와 상관 없이 원하는 성능을 최대한 강조해서 칩을 디자인 하는 게 가능하다”고 말했다.

 

CPU⋅GPU가 공유하는 유니파이드 메모리

 

실제 애플의 M1 프로⋅맥스는 이전 M1과 마찬가지로 메모리가 칩셋과 일체형으로 패키지된 SiP다. 메모리를 제외한 각종 프로세서들은 하나의 실리콘 위에서 SoC(System on Chip) 형태로 제조되고, 이후 메모리를 SoC 바로 옆에 붙여 한번에 패키지 하는 방식이다. 

M1 맥스 주변으로 메모리가 동시에 패키지 되어 있는 모습. /사진=애플
M1 맥스 주변으로 메모리가 동시에 패키지 되어 있는 모습. /사진=애플

메인보드와 소켓을 통해 프로세서와 메모리가 데이터를 주고 받는 기존 방식과 비교하면 SiP가 데이터 송수신 거리가 단축된다. 이는 데이터 전송 속도는 물론 전력 소모 측면에서도 유리하다. 다만 처음부터 프로세서와 메모리가 붙어서 나온다는 점에서 소비자가 컴퓨터를 구매한 이후 메모리를 확장하는게 원천적으로 불가능하다. 더군다나 외장 GPU에 따로 GPU 전용 메모리가 붙는 방식과 달리, M1 시리즈는 CPU와 GPU가 메모리를 같이 쓴다.

이 때문에 향후 사용하면서 메모리가 부족할 것으로 보는 시각도 있었으나, 유니파이드 메모리(Unified Memory)의 독특한 데이터 공유 기술은 이 같은 우려를 불식시켰다. 유니파이드 메모리는 CPU⋅GPU가 메모리 공간을 공유할 뿐만 아니라 데이터까지 같이 공유하는 형태다. 

일반 PC에서 CPU가 작업을 처리하다가 그래픽과 관련된 작업은 GPU가 넘겨받는데, 이 때 GPU는 관련 데이터를 그대로 복사해간다. 메모리 전체로 보면 동일한 내용의 데이터가 중복해서 존재하는 셈이다. 애플의 유니파이드 메모리는 같은 내용의 데이터라면 CPU와 GPU가 데이터까지 공유함으로써 메모리 공간 낭비를 방지한다. 

한 반도체 업체 임원은 “이전에 메모리는 소비자가 필요한 만큼 확장해서 쓰는 게 일반적이었는데, 애플은 최적화된 용량을 제공함으로써 메모리 시장의 룰을 깨고 있다”며 “CPU⋅GPU가 메모리 공간은 물론 데이터까지 공유한다는 점도 기존의 메모리 상식을 뛰어 넘는다”고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지