▲엔비디아 A100 GPU는 MLPerf 1.1 테스트의 8개 부문 모두에서 최고의 칩당 트레이닝 성능을 제공했다.
▲엔비디아 A100 GPU는 MLPerf 1.1 테스트의 8개 부문 모두에서 최고의 칩당 트레이닝 성능을 제공했다.

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 MLPerf 벤치마크에서 엔비디아 AI 기반 시스템을 통해 훈련 성능을 입증했다고 3일 밝혔다. 

델 테크놀로지스(Dell Technologies), 인스퍼(Inspur), 슈퍼마이크로(Supermicro) 및 마이크로소프트 애저(Microsoft Azure)는 각각 엔비디아 AI를 사용해 MLPerf 벤치마크 AI 트레이닝 부문에서 신기록을 세웠다. 해당 시스템들은 새롭게 발표된 MLPerf 트레이닝(training) 1.1의 주요 워크로드 8개 부문 모두에서 기록을 경신했다

MLPerf 벤치마크에서 엔비디아 A100 텐서 코어(Tensor Core) GPU는 각 시스템에 최고 수준의 표준화된 칩당 성능(per-chip performance)을 제공했다. 엔비디아 인피니밴드(InfiniBand) 네트워킹 및 소프트웨어 스택은 엔비디아 DGX 슈퍼(Super)POD 기반 AI 슈퍼컴퓨터 셀린(Selene)의 훈련 시간을 획기적으로 단축했다.

최근 결과에 따르면 AI 모델 훈련 부문에서 애저의 NDm A100 v4 인스턴스가 세계에서 가장 빠른 것으로 입증됐다. NDm A100 v4는 해당 벤치마크의 모든 테스트를 거쳤으며 2,048개의 A100 GPU로 확장된 시스템이다.

OEM중 인스퍼는 8방향 GPU 시스템 NF5688M6과 액상 냉각식 NF5488A5를 사용해 단일 노드 성능에서 가장 우수한 기록을 세웠다. 한편, 델과 슈퍼마이크로는 4방향 A100 GPU 시스템에서 신기록을 세웠다.

8개의 OEM과 2개의 클라우드 서비스를 비롯해 총 10개의 엔비디아 파트너가 테스트 결과를 제출했으며, 이들의 결과는 제출된 모든 결과의 90% 이상을 차지했다.

바이두 패들패들(Baidu PaddlePaddle), 델 테크놀로지스, 후지츠(Fujitsu), 기가바이트(GIGABYTE), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise), 인스퍼, 레노버(Lenovo) 및 슈퍼마이크로는 로컬 데이터 센터에 단일 및 다중 노드의 작업에서 실행되는 결과를 제출했다.

대부분의 OEM 파트너는 가속화 컴퓨팅을 추구하는 기업 고객을 위해 검증된 서버인 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 테스트를 실행했다. 광범위하게 제출된 결과를 통해 엔비디아는 모든 규모의 기업에 최적의 솔루션을 제공하는 엔비디아 플랫폼의 다양성과 전문성을 입증했다.

엔비디아 AI는 모든 벤치마크 및 활용사례를 제출하는 데 사용된 유일한 플랫폼 참가자이며, 이를 통해 고성능 및 다용도성을 증명했다. 빠르고 유연한 시스템은 고객이 작업 속도를 높이는 데 필수적인 생산성을 지원한다. AI 훈련 벤치마크는 컴퓨터 비전, 자연어 처리, 추천 시스템, 강화 학습 등 오늘날 가장 인기있는 AI 워크로드 및 시나리오 8가지를 다룬다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지

키워드

Tags #엔비디아 #AI