바이두·텐센트도 엔비디아 AI 가속기 서버 활용한다
바이두·텐센트도 엔비디아 AI 가속기 서버 활용한다
  • 김주연 기자
  • 승인 2018.11.22 12:47
  • 댓글 0
이 기사를 공유합니다

엔비디아 HGX-2 채용 급증… 최신 GPU 'T4'도 인기 높아

인공지능(AI) 열풍에 힘입어 엔비디아의 그래픽처리장치(GPU) 기반 가속기가 빠르게 서버에 도입되고 있다.

 

▲엔비디아의 AI 및 HPC 가속기 서버 'HGX-2'./엔비디아
▲엔비디아의 AI 및 HPC 가속기 서버 'HGX-2'./엔비디아

엔비디아는 인공지능(AI) 딥 러닝, 머신 러닝 및 고성능 컴퓨팅(HPC)을 위한 자사 가속 서버 플랫폼 '엔비디아 HGX-2'의 채용이 빠르게 확대되고 있다고 22일 밝혔다.

'HGX-2 클라우드 서버 플랫폼'은 다중 정밀 컴퓨팅 기능을 갖추고 있어 미래의 컴퓨팅을 지원할 수 있는 고유한 유연성을 제공한다. HPC에서 요구되는 고정밀 계산을 위해 FP64 및 FP32를 사용할 수 있는 동시에, AI 학습 및 추론을 위해서는 보다 빠른 반정밀도 연산(FP16) 및 INT8을 사용할 수 있다.

엔비디아 NV스위치(NVSwitch) 연결 패브릭을 통해 16개의 엔비디아 테슬라(Tesla) V100 텐서(Tensor) 코어 GPU를 연결, 2페타플롭의 AI 성능을 제공하는 단일의 거대한 GPU로 작동한다. 또한, 0.5TB의 메모리와 16TB/s의 전체 메모리 대역폭을 제공한다.

단일 노드에서 2페타플롭(Petaflop)의 컴퓨팅 성능을 제공한다. 중앙처리장치(CPU) 전용 서버보다 AI 머신 러닝 워크로드는 550배, AI 딥 러닝 워크로드는 300배, HPC 워크로드는 160배 빠르게 실행할 수 있다.

이번 'GTC(GPU Technology Conference) 차이나'에서 엔비디아는 바이두와 텐센트가 사내 및 클라우드 사업의 광범위한 AI 서비스를 지원하기 위해 HGX-2를 사용하고 있다고 밝혔다.

인스퍼(Inspur)는 중국 처음으로 HGX-2 서버를 구축, AI와 딥 러닝, HPC의 성능 확장 문제를 해결했다. 화웨이(Huawei), 레노버(Lenovo) 및 수곤(Sugon)은 엔비디아 HGX-2 클라우드 서버 플랫폼의 파트너가 됐다.

지난 달 오라클(Oracle)은 베어메탈 및 가상머신(VM) 인스턴스에서 엔비디아 HGX-2 플랫폼을 오라클 클라우드 인프라에 도입하여 고객이 통합 HPC 및 AI 컴퓨팅 아키텍처에 액세스 할 수 있도록 할 계획이라고 발표했다.

튜링 아키텍처 기반의 최신 GPU 'T4'도 인기를 끌고 있다. 단일 노드에서 1~20개를 넣을 수 있는데, 개당 70W 전력만 소모한다. AI 추론 워크로드의 경우 T4 GPU 2개를 탑재한 서버로 CPU 전용 서버 54개를 대체할 수 있고, AI 훈련에서는 T4 GPU 2개를 이중 소켓 CPU 전용 서버 9개 대신 쓸 수 있다.

바이두와 텐센트, 징동닷컴(JD.com), 아이플라이텍은 자체 하이퍼스케일 데이터센터를 확장·가속화하기 위해 T4를 도입했다. 중국 서버기업 중 T4를 사용 중인 곳은 인스퍼, 화웨이, 레노버, 수곤, IPS, H3C 등이 있다. 

이안 벅(Ian Buck) 엔비디아 엑셀레이티드 컴퓨팅 담당 부사장 겸 총괄은 “업계 선도적인 기술 기업들은 역사상 가장 강력한 클라우드 노드인 HGX-2를 빠르게 채택해 활용하고 있다"며 "HGX-2의 탁월한 컴퓨팅 성능과 유연한 설계를 통해 전 세계 기업들은 방대한 컴퓨팅 문제는 물론, 가장 시급한 몇몇 도전과제를 해결할 수 있는 새로운 제품과 서비스를 개발할 수 있다”고 설명했다.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.