번역 인공지능(AI), 6.2분만에 학습시킨다
번역 인공지능(AI), 6.2분만에 학습시킨다
  • 김주연 기자
  • 승인 2018.12.14 12:40
  • 댓글 0
이 기사를 공유합니다

엔비디아, 텐서 코어 벤치마크 테스트 결과 발표… 6개 부문 최우수

엔비디아 텐서(Tensor) 코어의 성능은 다른 업체의 코어보다 얼마나 좋은걸까.

 

▲엔비디아 텐서 코어가 AI 연산 벤치마크 테스트 결과에서 좋은 성적을 받았다./엔비디아
▲엔비디아 텐서 코어가 AI 연산 벤치마크 테스트 결과에서 좋은 성적을 받았다./엔비디아

엔비디아는 최근 발표된 'MLPerf 벤치마크 테스트' 결과에서 자사의 텐서(Tensor) 코어 그래픽처리장치(GPU)가 6개 부문의 최고 성능을 기록했다고 14일 밝혔다.

'MLPerf'는 새로운 인공지능(AI) 벤치마크 스위트(Suite)로 엔비디아를 비롯해 구글, 인텔, 바이두 등 수 십여 개의 기술 선도업체들의 지원 아래 광범위한 딥 러닝 워크로드를 측정한다.

업계 최초의 포괄적인 AI 벤치마크 스위트를 목표로, 컴퓨터 비전, 언어 번역, 맞춤형 추천, 강화 학습 과제 등을 다룬다.

엔비디아는 이 중 이미지 분류, 객체 인스턴스 분류, 객체 탐지, 비 반복 번역, 반복 번역, 추천 시스템 부문 벤치마크 결과에서 최고 성능을 달성했다. 

엔비디아는 강화 학습과 관련된 일곱 번째 부문의 결과는 제출하지 않았는데, 이는 GPU 가속을 최대한 활용하지 않았기 때문이다. 특히, 엔비디아 기술이 두각을 나타낸 주요 벤치마크는 언어 번역으로, 단 6.2분 만에 트랜스포머(Transformer) 신경망을 훈련시켰다.

엔비디아 엔지니어들은 16개의 V100 텐서 코어 GPU를 장착한 업계에서 가장 강력한 AI 시스템인 엔비디아 DGX-2가 포함된 엔비디아 DGX 시스템으로 이 같은 성과를 달성했다. 

엔비디아는 6개의 MLPerf 벤치마크를 기록한 유일한 업체로, 이번 결과를 통해 다양한 AI 워크로드를 위한 V100 텐서 코어 GPU의 활용성을 증명했다.

복잡하고 다양한 컴퓨팅 워크로드를 위한 성능에는 뛰어난 칩 이상의 것이 요구된다. 마찬가지로, 가속 컴퓨팅은 단순한 가속기 이상의 것, 즉 풀 스택(full stack)을 필요로 한다. 

엔비디아의 스택에는 엔비디아 텐서 코어, NV링크(NVLink), NV스위치(NVSwitch), DGX 시스템, 쿠다(CUDA), cnDNN, NCCL, 최적화된 딥 러닝 프레임워크 컨테이너 및 엔비디아 소프트웨어 개발자 키트가 포함돼 있다.

엔비디아의 AI 플랫폼은 접근성이 높고 가격도 합리적이다. 텐서 코어 GPU는 주요 클라우드 서비스 제공업체와 컴퓨터 제조사, 그리고 모든 지역에서 이용 가능하며, 가장 강력한 데스크톱 GPU인 엔비디아 타이탄(TITAN) RTX가 장착된 데스크탑에서 동일하게 사용할 수 있다. 

소프트웨어 가속 스택은 엔비디아 GPU 클라우드(NGC) 클라우드 레지스트리에서 상시 업데이트 된다. 이번 벤치마크에 쓰인 소프트웨어는 엔비디아의 최신 NGC 딥 러닝 컨테이너에서 무료로 제공되며, NGC 컨테이너 레지스트리에서 다운로드 할 수 있다. 

이안 벅(Ian Buck) 엔비디아 가속 컴퓨팅 담당 부사장 겸 총괄은 “새로운 MLPerf 벤치마크를 통해 엔비디아 텐서 코어 GPU의 탁월한 성능과 활용성이 다시한번 입증됐다”고 설명했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.