'엔비디아 DGX 슈퍼 POD'… DGX-2H 96개와 멜라녹스 인터커넥트 기술 적용

엔비디아가 자율주행 기술 개발 전용 슈퍼컴퓨터 '엔비디아 DGX 슈퍼POD'을 내놨다.

자율주행 기술을 연구개발(R&D)하기 위해서는 그만한 환경을 갖춰야 한다. 하지만 자율주행 기술 개발의 역사가 짧기 때문에, 어느 정도 성능을 갖춘 시스템을 장만해야하는지부터 고민이다. 이 문제를 해결해줄 수 있는 자율주행 전용 슈퍼컴퓨터가 나왔다.

엔비디아는 자율주행 개발 전용 슈퍼컴퓨터 'DGX 슈퍼POD(SuperPOD)'를 출시했다고 18일 밝혔다. 무려 세계에서 22번째로 빠른 슈퍼컴퓨터다.

이 시스템은 엔비디아 DGX-2H 시스템 96개와 멜라녹스(Mellanox) 인터커넥트(Interconnect) 기술로 3주만에 구축됐다.

9.4 페타플롭(PetaFLOP)의 처리 능력을 제공, 자율주행 차량에 요구되는 수많은 딥 뉴럴 네트워크(DNN)을 훈련시킬 수 있다. 

자율주행차를 위한 AI 훈련은 가장 복잡한 AI 연산 중 하나다. 수년간 한 가지 종류의 데이터만 수집해도 용량이 페타바이트급에 달하고, 이 데이터를 기반으로 알고리즘을 계속해서 학습시켜야한다. 엄청난 양의 데이터를 빠르게 계산할 수 있는 능력이 무엇보다 중요하다는 뜻이다.

이 시스템은 엔비디아 NV스위치(NVSwitch)와 멜라녹스 네트워크 패브릭(network fabric)과 엔비디아 V100 텐서 코어(Tensor Core) 그래픽처리장치(GPU) 1536개가 상호연결돼 구동된다. 같은 크기의 슈퍼컴퓨터에 비해 탁월한 성능으로 데이터를 처리할 수 있다.

자율주행 소프트웨어를 최적화하고 이전에 가능했던 시간보다 더 빠른 시간으로 뉴럴 네트워크를 재교육하면서 24시간 내내 작동시킬 수 있다.

지난 2015년 출시된 엔비디아 K80 GPU 하나로 레스넷-50(ResNet-50)을 교육시킬 때는 25일이 걸렸지만, DGX 슈퍼POD 하드웨어와 소프트웨어 플랫폼으로 하면 2분 미만이 걸린다. 속도가 1만8000배 빠른 셈이다.

비슷한 성능 수준을 가진 다른 상위 500개의 시스템은 수천 대의 서버로 구성되는 반면, DGX 슈퍼POD는 크기가 400배 작아 공간을 훨씬 적게 차지한다.

이 시스템은 이미 BMW, 콘티넨털(Continental), 포드(Ford), 제뉴이티(Zenuity)와 같은 자동차 업체에서부터 페이스북(Facebook), 마이크로소프트(Microsoft), 후치필름(Fujifilm)을 포함한 기업 및 일본이화학연구소(RIKEN), 미 에너지국(US Department of Energy)와 같은 선구적인 연구소에서 채택됐다.

뿐만 아니라, 모듈식, 엔터프라이즈급 설계로 구축 속도 자체가 빠르다. 보통 이 규모의 시스템을 구축하는 데 6~9개월이 걸리지만 DGX 슈퍼POD는 엔지니어들이 규범적이고 검증된 접근법을 따르면서도 불과 3주 안에 작업을 완료하도록 해준다. 

엔비디아는 DGX 슈퍼POD을 개발하면서 AI 머신을 위한 시스템 설계 구축법을 터득했다. 업체들을 지원할 수 있는 자체 데이터 센터는 없지만, DGX-레디 데이터 센터 프로그램(DGX-Ready Data Center program)을 통해 단순하고 신속한 구현을 제공한다. 

클레멘트 패러베트(Clement Farabet) 엔비디아 AI 인프라 부문 부사장은 "극한의 정확도를 충족시키기 위해 뉴럴 네트워크를 수만번 재교육해야하는 자율주행차 교육만큼 까다로운 AI 도전과제는 없다"며 "또한, DGX 슈퍼POD와 같은 대용량 처리 기능을 갖춘 대체할 제품은 없다”고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지