낸드도 되고, D램도 되고… 기존 메모리 계층구조 한계 타파
구글·바이두·알리바바·네이버 등 국내외 클라우드 업체 도입

하이퍼스케일 데이터센터에서 흔히 발생하는 문제 중 하나는 데이터 병목 현상이다. 

데이터센터에서 데이터는 스토리지에서 메모리로, 메모리에서 프로세서로, 다시 시스템에서 메모리, 스토리지로 향한다. 프로세서의 데이터 처리 능력이 아무리 뛰어나도 메모리·스토리지가 이를 받쳐주지 않으면 전체 성능을 높이는 데 한계가 있다.

이를 극복하기 위해 구글·바이두·알리바바 등 주요 클라우드 업체들은 인텔의 옵테인 DC 퍼시스턴트 메모리를 도입했다. 

 

성능 개선 발목 잡는 데이터 병목현상

하이퍼스케일 데이터센터는 기존 데이터센터와 구축 목적부터 다르다. 

기존 데이터센터는 특정 응용 분야에 활용하기 위해 시스템·메모리·스토리지·네트워크를 맞춤형으로 구성한다. 그만큼 유연성도, 확장성도 떨어진다.

하이퍼스케일 데이터센터는 가상 환경 등을 통해 여러 애플리케이션에 쓸 수 있게 설계됐다. 최소 5000대에서 많게는 수십만대에 달하는 서버를 활용, 원하는 대로 시스템·메모리·스토리지·네트워크 등을 유동적으로 확장할 수 있다. 

 

데이터센터 메모리·스토리지 계층 구조./computerscience
데이터센터 메모리·스토리지 계층 구조./computerscience

하지만 프로세서의 성능이 아무리 빨라져도 처리해야할 데이터의 이동 방식에 변화가 없다면 전체 시스템의 성능을 높이기 어렵다. 하이퍼스케일 데이터센터의 메모리 계층 구조는 기존 데이터센터와 똑같다. 데이터를 저장할 수는 없지만 빠르게 데이터를 주고받을 수 있는 D램(메모리)도, 용량은 크지만 속도가 느린 스토리지도 그대로다.

게다가 대부분의 하이퍼스케일 데이터센터는 가상 머신(VM) 환경에서 수많은 프로그램을 가동한다. 그렇다보니 한 번 가동이 중단되면 1분에 수천만달러의 피해를 본다. 복구를 하려면 D램이 다시 스토리지에서 데이터를 불러와야해 수분의 시간이 걸린다.

그렇다고 무작정 메모리·스토리지의 용량을 확장할 수도 없다. 프로세서마다 지원하는 메모리 개수에 한계가 있고 스토리지가 비대해지면 오히려 데이터를 찾는 데 더 오랜 시간이 걸린다. 총소유비용(TCO) 문제는 말할 것도 없다.

 

옵테인 DC 퍼시스턴스 메모리, 메모리 병목 한계를 해결하다

인텔의 옵테인 DC 퍼시스턴스 메모리는 상변화메모리(P램)의 일종인 ‘3차원 크로스포인트(3D Xpoint)’를 기반으로 한다. 

D램은 메모리로만, 솔리드스테이트드라이브(SSD)와 하드디스크드라이브(HDD)는 스토리지로만 쓸 수 있는 기존 메모리 계층 구조를 깨고 빠른 스토리지 혹은 대용량 메모리로 활용할 수 있는 메모리다.

 

인텔 옵테인 DC 퍼시스먼스 메모리는 기존 메모리 계층 구조의 한계를 돌파할 수 있다./인텔
인텔 옵테인 DC 퍼시스먼스 메모리는 기존 메모리 계층 구조의 한계를 돌파할 수 있다./인텔

출시 초기에는 D램만큼 빠르지도, 낸드만큼 고용량을 구현하지도 못해 이도저도 아니란 평가를 들었지만 엄밀히 따지자면 이 제품은 기존 D램·낸드를 대체하는 게 아니라 보완하는 용도로 쓰인다.

옵테인 DC 퍼시스턴트 메모리는 메모리 계층 구조에서 메모리(D램)와 스토리지 사이에 배치된다. 메모리 모드와 앱 다이렉트 모드, 듀얼 모드 등 3가지 작동 모드가 있다.

메모리 모드는 스토리지가 아닌 메모리 용량을 늘리고 싶을 때 쓰는 모드다. 메모리는 프로세서가 작업을 처리하기 위해 필요한 데이터를 미리 가져다놓고 쓰는 임시저장소로, 용량을 늘리면 프로그램을 더 많이 가동할 수 있다.

메모리 모드를 선택하면 퍼시스턴트 메모리는 기존 D램이 하던 메모리의 역할을 하고, D램은 퍼시스턴트 메모리의 캐시 메모리로 활용된다. 현재 DDR4 D램 모듈은 최대 용량이 256GB지만, 옵테인 DC 퍼시스턴트 메모리 기반 모듈(PMM)은 최대 512GB라 전체 메모리 용량을 크게 늘릴 수 있는 셈이다.

 

D램만 썼을 때와 D램과 옵테인 DC 퍼시스턴트 메모리를 동시에 활용했을 때의 차이. 속도는 13배 늘리고 비용은 39% 절감할 수 있다./인텔
D램만 썼을 때와 D램과 옵테인 DC 퍼시스턴트 메모리를 동시에 활용했을 때의 차이. 속도는 13배 늘리고 비용은 39% 절감할 수 있다./인텔

앱 다이렉트 모드에서 옵테인은 고속 SSD 역할을 한다. 소프트웨어 및 응용 프로그램이 직접 옵테인에 접근해 SSD보다 데이터 읽기·쓰기 속도가 빠르다. 

특히 데이터 처리량이 많을수록 이 모드는 유용하게 쓰인다. 전원이 꺼져도 데이터가 사라지지 않기 때문에 D램이 기존 스토리지 장치에서 데이터를 가져올 때보다 데이터를 빠르게 저장하고 불러낼 수 있어 복구 및 다운에 걸리는 시간을 수 초로 줄일 수 있다.

듀얼모드는 옵테인의 일부는 메모리 모드로, 일부는 앱 다이렉트 모드로 배치하는 모드다. 

옵테인 DC 퍼시스턴트 메모리는 128·256·512기가바이트(GB) 등 세 가지 용량으로 제공된다. 표준 DDR4 D램 모듈(DIMM) 슬롯 자리에 끼우면 되는데, 채널 당 하나씩, 소켓 기준으로는 최대 6개를 넣을 수 있다.

여기에 CPU 내 캐시메모리와 메인메모리인 D램 사이를 연결하는 블록인 캐시 라인으로도 활용할 수 있어 CPU가 데이터를 물리적 메모리 페이지 크기인 4KB로 일일이 묶는 작업이 필요치 않다. CPU의 부하를 줄일 수 있다는 얘기다.

지난해 3D Xpiont 메모리 개발 및 생산 협력을 해온 마이크론과 결별한 뒤 인텔은 3D Xpoint를 미국 뉴멕시코주 리우란초 소재 생산라인(Fab) ‘11x’에서 생산하고 있다. 2세대 옵테인 DC 퍼시스턴트 메모리(코드명 Barlow pass)도 이 곳에서 연구한다. 

롭 크룩 인텔 수석부사장은 “데이터 중심 업체를 선언한 지난 2017년부터 메모리는 인텔이 선정한 6대 기술 중 하나로, 그 중요성이 점점 커지고 있다”며 “옵테인 DC 퍼시스턴트 메모리는 메모리 병목 현상을 해결할 수 있는 혁신적인 기술로, 2세대 옵테인 DC 퍼시스턴트 메모리도 파일럿 생산을 준비하고 있다”고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지