아마존웹서비스, 에픽 프로세서 기반 C5a 및 C5ad 인스턴스 서비스 준비
GPU 컴퓨팅을 위한 오픈소스 구성요소 ROCm 3.0 공개… HPC 지원 늘려

2세대 AMD 에픽 프로세서./AMD
2세대 AMD 에픽 프로세서./AMD

AMD는 '슈퍼컴퓨팅 2019(SC 19)'에서 전 세계 최상위 연구 시스템과 다수의 새로운 플랫폼에 AMD 에픽(EPYC) 프로세서 및 라데온 인스팅트(Radeon Instinct) 가속 카드 지원을 발표했다고 20일 밝혔다.

이와 함께 ROCm 3.0을 공개, 새로운 컴파일러 및 고성능(HPC) 애플리케이션을 지원한다고 발표했다.

HPC 기관들은 더욱 강력하고 효율적인 슈퍼컴퓨팅 시스템을 위해 지속적으로 2세대 AMD EPYC 프로세서와 라데온 인스팅트 가속 카드를 채택하고 있다. 

2세대 EPYC 프로세서는 경쟁 솔루션 대비 두 배 높은 제조 애플리케이션 성능과 최대 60% 빠른 생명 과학 시뮬레이션 성능을 제공한다.

라데온 인스팅트 그래픽처리장치(GPU) 가속 카드는 HPC 워크로드에서 이론적으로 최대 6.6 TFLOPS 더블 프리시전(Double Precision) 성능을 낸다. 두 제품 모두 PCIe 4.0을 지원해 이기종 시스템 전반에서 더 빠른 컴퓨팅을 위한 고대역폭을 제공한다.

 

HPC 인스턴스 확대 제공

HPC 산업은 새로운 워크로드, 더 높은 성능에 대한 요구, 그리고 더욱 손쉬운 장기적 또는 단기적 사용을 지원하도록 변화하고 있다. 이러한 변화는 클라우드를 통해 실행되고 있다.

아마존웹서비스(AWS)는 AMD EPYC 프로세서를 도입, 아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2) 인스턴스 C5a 및 C5ad를 곧 서비스한다.

두 인스턴스는 최대 3.3㎓ 속도로 구동된다. 최대 96개의 가상 CPU(vCPU)를 활용 가능하며 8개 클러스터로 묶을 수 있어 고객이 일괄 처리, 분산 애널리틱스, 웹 애플리케이션을 비롯한 다양한 컴퓨팅 워크로드에 대한 비용과 성능 모두 최적화할 수 있도록 추가적인 선택권을 제공한다.

또 두 인스턴스 모두 베어 메탈(bare metal)로 구성돼 고객이 기본 서버의 프로세서 및 메모리 리소스에 직접 액세스 가능한 애플리케이션을 실행할 수 있도록 지원한다. 네트워크 대역폭은 100Gbps까지 지원되며 인스턴스용 저지연 네트워크 어댑터인 엘라스틱 패브릭 어댑터(Elastic Fabric Adapter)와 호환 가능하다.

이번 인스턴스는 192개의 로지컬 프로세서와 96개의 물리적 코어로 구성돼 EC2 인스턴스 제품군 중 가장 큰 인스턴스 대비 두 배 더 크다.

마이크로소프트 애저(Azure)는 1세대 AMD EPYC 프로세서 기반 시스템에서 실행되는 애저 HB 클라우드 인스턴스를 활용, 과거 달성할 수 없었던 수준의 컴퓨터 유체 역학(CFD) 성능을 달성했다.

애저는 고성능 컴퓨팅을 위한 애저 HBv2 가상 머신(Azure HBv2 virtual machines)를 소개하며 클라우드에서 HPC의 경계를 더욱 확장시켜나가고 있다. AMD EPYC 7742 프로세서를 기반으로 한 이 가상 머신은 클라우드를 통해 쉽고 간편하게 2000Gbps HDR 인피니밴드(InfiniBand)와 단일 워크로드에 최대 8만 개의 코어를 지원하여 슈퍼컴퓨터 성능에 대한 액세스를 고객에게 제공한다.

 

ROCm 3.0 공개

AMD는 이와 함께 프리-엑사스케일(pre-exascale) 소프트웨어 생태계를 지원하기 위해 GPU 컴퓨팅을 위한 기본 오픈 소스 구성 요소 'ROCm 3.0'을 선보였다.  

ROCm는 매달 개발자에게 지속적으로 컴파일러(compiler), 라이브러리(library), 프로파일러(profiler), 디버거(debugger) 및 시스템 관리 도구(system management tools)에 대한 개선사항과 업데이트를 제공한다.

ROCm 3.0 버전에는 LLVM을 기반으로 구축된 컴파일러, hipify-클랭(hipify-clang)을 갖춘 향상된 CUDA 변환 능력, PC와 ML을 위한 라이브러리 최적화 등이 담겼다.

텐서플로우(TensorFlow), 파이토치(PyTorch) 등 강화 학습, 자율 주행, 이미지 및 비디오 감지 등의 응용 분야를 위한 선도적인 기계학습 프레임워크를 통합할 수 있도록 했고 OpenMP 프로그래밍, LAMMPS 및 NAMD와 같은 HPC 프로그래밍 모델 및 애플리케이션에 대한 확장된 가속화를 지원한다.

쿠버네티스(Kubernetes), 싱귤래리티(Singularity), SLURM, TAU 등 시스템 및 워크로드 구축 툴도 활용할 수 있게 했다.

AMD 수석 부사장 겸 최고기술책임자(CTO) 마크 페이퍼마스터(Mark Papermaster)는 “AMD는 2021년 출시되는 세계 최고 성능의 프론티어(Frontier) 슈퍼컴퓨터에 탑재될 프로세서 공급자로서 SC19에 참여하게 됐다”며 “이번 행사에서 고성능 AMD EPYC CPU와 라데온 인스팅트 GPU가 함께 최고의 속도에서 구동되는 것부터 AMD 오픈 소프트웨어 생태계까지 모두 공개될 예정”이라고 전했다.

 

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지