CXL(컴퓨터 익스프레스 링크) 스위치 팹리스 스타트업인 파네시아(대표 정명수)는 유럽 최대 고성능컴퓨팅(HPC) 전시회인 'ISC 2025'에 참가해 주요 제품인 CXL 3.x 설계자산(Intellectual Property, IP)과 CXL 3.x 스위치를 탑재한 HPC향 풀 스택 서버 솔루션을 선보였다고 16일 밝혔다.
ISC 2025는 유럽에서 개최되는 최대 규모의 HPC 전시회로 미국 SC 전시회와 함께 HPC 분야 대표 행사로 꼽힌다. 올해는 40주년을 맞아 3,000명 이상의 HPC 관련 분야 종사자들이 행사에 참석해 HPC 하드웨어 및 이를 관리하기 위한 소프트웨어, AI 가속 솔루션 등 최신 기술에 대한 논의를 진행했다.
올해 ISC 전시회에 처음으로 참석한 파네시아가 선보인 솔루션은 하드웨어와 소프트웨어 스택으로 구성돼 사용자가 수요에 맞춰 자원의 양을 유연하게 조절할 수 있도록 하며, 메모리 공유 기능을 통해 병렬 컴퓨팅 성능을 개선하는 것이 특징이다.
파네시아의 솔루션 중 하드웨어 스택은 기존 HPC 시스템의 비용 효율 측면 문제를 해결한다.
통상 HPC 시스템은 연산자원과 메모리자원이 고정된 비율로 장착되는 방식이어서 메모리 부족 문제가 발생하면 전체 서버의 수를 늘림으로써 메모리 용량을 확보하는 방식을 채택해왔다. 이는 메모리가 부족해 서버를 추가할 때마다 불필요한 연산 자원까지 함께 구매해야 하기 때문에 사용자의 입장에서 비용을 필요 이상으로 부담하는 문제가 발생한다.
반면 파네시아의 하드웨어 솔루션은 기존 시스템과는 다른 서버 구성 방식을 적용함으로써 이러한 문제를 해결한다. 이번 전시회에 출품한 하드웨어인 CXL 3.x 컴포저블 서버(CXL 3.x Composable Server)는 연산자원(CXL 탑재 CPU 노드, CXL 탑재 GPU 노드)과 메모리 자원(CXL 탑재 메모리 노드)이 서로 다른 노드에 분리되어 있으며, 이들이 CXL 스위치를 통해 서로 연결되는 형태를 띄고 있다. 사용자들은 수요에 맞춰 원하는 자원이 장착된 노드만 선택적으로 추가하는 것이 가능하며, 이를 통해 불필요한 자원 구매 비용을 최소화할 수 있다. 예를 들어 메모리 용량이 부족할 때에는 연산 자원의 추가 없이 메모리 노드만 추가 장착함으로써 부족한 메모리 용량을 확보하는 것이 가능하다.
이같은 방식으로 서버를 구성할 때 핵심이 바로 파네시아의 CXL 설계자산과 CXL 스위치이다. 파네시아의 CXL 스위치는 여러 개의 노드들을 연결해 하나의 통합된 시스템을 구성하는 것을 가능하게 한다. 특히 파네시아의 CXL 스위치는 장치의 종류, 시스템의 규모, 연결의 형태 측면에서 자유로운 구성을 지원한다는 점에서 차별화된다. 구체적으로 파네시아 스위치를 활용하면 CPU, 메모리 뿐만 아니라 GPU, NPU등 다양한 장치를 연결할 수 있다. CXL 최신 표준의 고확장성 관련 기능(멀티-레벨 스위칭, 포트 기반 라우팅)을 지원함으로써 여러 개의 서버 노드/서버 랙(rack)에 탑재된 장치들을 다양한 형태로 연결할 수 있도록 한다.
파네시아의 CXL 설계자산은 이처럼 CXL 스위치로 연결된 다양한 장치들이 통합된 메모리 공간을 서로 공유하고 접근하는 것을 가능하게 한다. 세계 최초로 두 자리 수 나노초 지연시간을 달성한 파네시아의 저지연 CXL 설계자산이 메모리 공간에 대한 일련의 관리 동작을 자동으로 처리해주기에 사용자들은 성능 오버헤드가 최소화된 형태로 메모리에 접근할 수 있게 된다.
파네시아는 CXL 스위치 및 CXL 설계자산을 기반으로 한 하드웨어의 장점을 극대화해 병렬 컴퓨팅 응용을 가속하는 소프트웨어 스택 또한 공개했다.
일반적으로 HPC 시스템에서는 대규모 응용을 실행하기 위해 여러 서버 노드가 병렬적으로 연산을 처리한다. 응용에서 처리해야하는 데이터를 각 서버 노드에 있는 메모리에 나누어 저장한 후 각 서버 노드의 연산장치들이 동시 연산을 수행하는 방식이다. 이 때 다른 서버 노드의 메모리에 저장된 데이터를 필요로 할 경우 네트워크를 통해 데이터를 주고받는데 이 과정에서 성능이 저하된다.
파네시아는 이하 문제를 해결하기 위해 네트워크 통신 대신 CXL의 메모리 공유 기능을 활용해 병렬 컴퓨팅을 수행하는 형태로 소프트웨어 스택을 설계했다. 각 노드에 장착된 메모리에 데이터를 나누어 저장하는 것이 아니라, CXL을 통해 연결된 시스템 장치들 간에 공유되는 통합 메모리 공간(일반적으로 메모리 노드에 해당)에 데이터를 저장해두고, 병렬 컴퓨팅을 수행하는 것이다. 통합 메모리 공간에 대한 관리/접근 동작은 CXL 설계자산이 자동으로 수행해주기 때문에 CPU 등 각 연산장치 입장에서는 단순한 메모리 접근 명령을 통해 통합 메모리 공간에 접근할 수 있고, 그 결과 네트워크 기반 통신 및 이에 수반되는 불필요한 복사 동작을 최소화할 수 있다.
파네시아는 이처럼 메모리 공유 기능을 활용해 병렬 컴퓨팅 응용을 수행하도록 리눅스 운영체제 위에 소프트웨어 스택을 구현한 후 해당 솔루션 상에서 대표적인 병렬 컴퓨팅 응용인 과학 시뮬레이션(유체 역학 시뮬레이션)을 실행했다. 해당 데모를 통해 실행 시간을 44% 단축할 수 있음을 보였다.

