HPC 및 AI 워크로드에 엑사스케일급 성능 지원

AMD는 23일 새로운 AMD 인스팅트™ MI210(AMD Instinct™ MI210) 액셀러레이터와 ROCM™ 5 소프트웨어를 발표했다.

에이수스(ASUS), 델(Dell), 기가바이트(Gigabyte), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, 이하 HPE), 레노버(Lenovo) 및 슈퍼마이크로(Supermicro) 등 주요 파트너사의 시스템과 폭넓게 호환되는 AMD 인스팅트 MI210 액셀러레이터와 ROCM 5 소프트웨어는 고성능 컴퓨팅(High Performance Computing, 이하 HPC)과 인공지능(AI) 워크로드에서 고객에게 엑사스케일급 성능을 제공한다. 또 날로 증가하는 가속 컴퓨팅 데이터 센터 워크로드 수요에 대응하고 연구자와 과학자, 엔지니어 등 전문가들이 다양한 연구 활동을 보다 빠르게 진행할 수 있도록 도울 예정이다.

AMD 인스팅트 MI200 시리즈 액셀러레이터는 엑사스케일 시스템 기반의 연구를 가속화하기 위해 설계됐으며, 연구자와 과학자, 엔지니어 등 전문가들이 기후 변화 관련 연구 및 백신 개발까지 광범위한 분야에서 중요한 과제들을 해결할 수 있도록 지원한다. AMD 인스팅트 MI210 액셀러레이터는 AMD CDNA™ 2 아키텍처를 기반으로 설계됐으며, 엑사스케일급 기술을 기반으로 고객에게 압도적인 HPC 및 AI 성능을 PCIe® 형식으로 제공한다. 또 PCIe 폼 팩터 카드에서 선도적인 배정밀도(FP64) 컴퓨팅 성능을 지원하며, AMD 매트릭스 코어 기술(Matrix Core Technology)을 기반으로 폭넓은 혼합 정밀도(mixed-precision) 성능을 제공하는 등 고속 딥 러닝 트레이닝 가속화에 최적화된 환경을 구현한다.

AMD ROCm 플랫폼은 오픈 소프트웨어 플랫폼으로 최상위 HPC 및 AI 애플리케이션을 지원하는 수많은 도구 및 라이브러리로 구성돼 있으며, 전문가들이 AMD 인스팅트 액셀러레이터의 성능을 활용해 유의미한 과학적 발전을 촉진하기 위해 구축됐다.

AMD ROCm 5 소프트웨어는 AMD 인스팅트 MI200 시리즈 액셀러레이터 및 AMD 라데온™ 프로 W6800 (AMD Radeon™ PRO W6800) 전문가용 그래픽 카드 등 새로운 하드웨어 제품과 호환된다. 또한, 레드햇® 엔터프라이즈 리눅스® 8.5(Red Hat® Enterprise Linux® 8.5)를 지원하여 개발자들에게도 더 나은 접근성을 제공하고 독보적인 성능으로 워크로드 전반에 걸쳐 추진력을 강화한다.

이와 함께 사용자는 AMD GPU 간 전송 및 성능 최적화를 위한 오픈 소스 애플리케이션을 제공하는 AMD 인피니티 허브(Infinity Hub)에서 컨테이너형 HPC 애플리케이션 및 ML 프레임워크를 쉽게 다운로드 및 설치할 수 있다. AMD 인피니티 허브 애플리케이션 컨테이너는 사용자가 보다 편리하게 소프트웨어를 찾아 설치하고, 다른 사용자들과 사용 경험을 공유하며 함께 문제 해결 방안을 모색할 수 있는 환경을 제공한다.

AMD는 ROCm 및 인스팅트 액셀러레이터를 지원하는 애플리케이션이 증가함에 따라 앤시스®(Ansys®), 케스케이드 테크놀로지(Cascade Technologies), 템포퀘스트(TempoQuest)를 비롯한 상용 ISV를 추가 지원하며 소프트웨어 생태계를 지속적으로 성장시키고 있다. ROCm 및 인스팅트 액셀러레이터를 지원하는 ISV는 여러 애플리케이션에서 전산 유체 역학(Computational Fluid Dynamics, CFD), 기후, 컴퓨터 지원 엔지니어링(Computer Aided Engineering, CAE) 등 가속화된 워크로드를 지원한다. 또 기존 ROCm 지원 애플리케이션과 함께 HPC, AI, 머신 러닝, 앰버(AMBER), 크로마(Chroma), CP2K, 그리드(GRID), 그로맥스(GROMACs), 램스(LAMMPS), MILC, 미니-HAAC(Mini-HAAC), NAMD, NAMD 3.0, ONNX-RT, 오픈MM(OpenMM), 파이토치(PyTorch), 릴리온(RELION), SPECFEM3D Cartesian, SPECFEM3D Globe, 및 텐서플로우(TensorFlow)를 추가 제공한다.

AMD는 에이수스, 델, 기가바이트, HPE, 레노버, 슈퍼마이크로 등 주요 파트너사와 콜팩스(Colfax), 익잭트(Exxact), 코이 컴퓨터(KOI Computers), 노-텍(Nor-Tech), 팽귄(Penguin), 시메트릭(Symmetric) 등 SI 업체에게 차세대 컴퓨팅을 위한 차별화된 솔루션을 공급한다고 밝혔다. 일부 파트너사는 오크리지 국립연구소(Oak Ridge National Laboratory), KTH/다르델(KTH/Dardel), CSC/ 루미(CSC/LUMI), 씨넥스/아다스트라(Cinex/Adastra) 등 새로운 고객을 확보하여 프론티어(Frontier) 슈퍼컴퓨터를 제공하고 있다.

AMD 액셀러레이터 클라우드(AMD Accelerator Cloud)는 사용자들이 원격으로 AMD 인스팅트 액셀러레이터와 AMD ROCm 소프트웨어에 접근할 수 있는 환경을 마련한다. AMD 액셀러레이터 클라우드는 레거시 코드(legacy code) 전송, 애플리케이션 벤치마킹, 멀티 GPU 테스트 및 멀티 노드 확장 작업에서 사용자가 최신 GPU 및 소프트웨어에 빠르고 쉽게 접근할 수 있도록 돕는다. 또 모든 사용자에게 해커톤(hackathons) 및 ROCm 교육 세션 등을 제공하여 개발자가 기술을 배우고 AMD 인스팅트 액셀러레이터 활용도를 최대한으로 높일 수 있도록 지원한다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지

키워드

Tags #AMD #ROCM