엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 AWS 리인벤트(re:Invent)에서 아마존닷컴(Amazon.com)의 자회사인 아마존웹서비스(Amazon Web Services, AWS)와 전략적 협력을 확대한다고 29일 발표했다. 이번 협력으로 양사는 고객의 생성형 AI 혁신을 위한 최첨단 인프라, 소프트웨어, 서비스를 제공할 수 있도록 지원한다.

양사는 파운데이션 모델(Foundation Model) 훈련과 생성형 AI 애플리케이션 구축에 이상적인 엔비디아와 AWS의 최고 기술을 결합할 예정이다. 여기에는 차세대 GPU, CPU와 AI 소프트웨어를 갖춘 엔비디아의 최신 멀티노드 시스템부터 AWS 니트로(Nitro) 시스템 고급 가상화와 보안, EFA(Elastic Fabric Adapter) 상호 연결과 울트라클러스터(UltraCluster) 확장성까지 다양한 기술이 포함된다.

이들은 초기 머신러닝(ML) 선구자들에게 최첨단 기술 발전에 필요한 컴퓨팅 성능을 제공해왔다. 이번 협력 확대는 이처럼 생성형 AI 시대를 견인해 온 장기적인 관계를 기반으로 이루어졌다.

이번 협력에 따라우선 AWS는 새로운 멀티노드 NV링크(NVLink)™ 기술이 적용된 엔비디아® GH200 그레이스 호퍼 슈퍼칩(Grace Hopper Superchips)을 클라우드에 도입한 최초의 클라우드 제공업체가 된다. 

또 엔비디아의 서비스형 AI 훈련인 엔비디아 DGX™ 클라우드(DGX Cloud)를 AWS에 호스팅한다. 이 클라우드는 GH200 NVL32를 탑재한 최초의 DGX 클라우드로 개발자에게 단일 인스턴스에서 가장 큰 공유 메모리를 제공한다. 

이와 함께 엔비디아와 AWS는 세계에서 가장 빠른 GPU 기반 AI 슈퍼컴퓨터를 구축하기 위해 프로젝트 세이바(Project Ceiba)에서 협력하고 있다. 이 슈퍼컴퓨터는 엔비디아의 리서치와 개발팀을 위해 AWS가 호스팅하는 GH200 NVL32와 아마존 EFA 인터커넥트를 갖춘 대규모 시스템이다. 이는 16,384개의 엔비디아 GH200 슈퍼칩을 탑재하고 65 엑사플롭(exaflops)의 AI를 처리할 수 있다. 이러한 업계 최초의 슈퍼컴퓨터는 엔비디아가 차세대 AI 혁신을 추진하는 데 사용될 예정이다.

더불어 AWS는 세 가지 새로운 아마존 EC2 인스턴스를 추가로 출시할 예정이다. 여기에는 대규모 최첨단 생성형 AI와 HPC 워크로드를 위한 엔비디아 H200 텐서 코어(Tensor Core) GPU 기반의 P5e 인스턴스가 포함된다. 

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지

키워드

Tags #엔비디아 #AWS