세계 최대 언어모델 구축… 83억 개 매개변수 가져
AI 언어모델 'BERT' 훈련에 1시간, 추론에 2㎳ 걸려

엔비디아의 실시간 대화형 인공지능(AI) 플랫폼./엔비디아
엔비디아의 실시간 대화형 인공지능(AI) 플랫폼./엔비디아

사람의 말을 제대로 알아듣는 대화형 인공지능(AI) 서비스가 나온다. 지금까지 출시된 챗봇, 지능형 개인비서, 검색 엔진 서비스는 사람의 말을 100% 알아듣지 못하고 지원하는 언어 모델도 많지 않다. 이를 해결할 수 있는 열쇠를 엔비디아가 찾아냈다.

엔비디아는 실시간 대화형 AI을 통해 기업이 고객과 보다 자연스럽게 소통할 수 있는 언어이해 모델을 출시했다고 14일 밝혔다.

대화형 AI 서비스는 몇 년 동안 제한적으로 존재해왔다. 현재까지 엄청나게 방대한 AI 모델을 배치하는 것이 불가능해 이같은 서비스가 인간 수준의 이해력 갖춘 채로 작동되기 어려웠다. 

엔비디아는 AI 플랫폼에 핵심 최적화 기능을 추가, 이러한 문제를 해결했다. 그 결과 최첨단 AI 언어모델 중 하나인 버트(BERT)를 한 시간 내에 훈련시키고, 2㎳ 만에 AI 추론을 완료했다. 현재까지의 모델 중 가장 방대한 언어 모델을 지원한다고 엔비디아는 설명했다.

엔비디아는 AI 훈련에 'DGX 슈퍼POD'을 활용해 BERT-라지(BERT-Large)의 훈련 시간을 수 일에서 53분으로 단축했다. 'DGX 슈퍼POD'은 V100 그래픽처리장치(GPU) 1472개가 들어간 'DGX-2H' 924개로 구성된다. 

추론에는 텐서RT(TensorRT)를 사용하는 T4 GPU가 활용됐고 이를 통해 엔비디아는 BERT-베이스 스쿼드(BERT-Base SQuAD) 데이터세트 추론을 단 2.2㎳만에 끝냈다.

엔비디아 리서치는 점점 더 방대한 모델을 요구하는 개발자에 부응, BERT에 사용되는 기술 빌딩 블록(building block)과 점점 더 늘어나는 다른 자연어 AI 모델을 기반으로 세계 최대 언어모델을 구축하고 훈련시켰다. 엔비디아의 맟춤형 모델은 83억 개의 매개변수를 가졌으며, 이는 BERT-라지 크기의 24배다.

이를 통해 개발자는 전세계 수억 명의 소비자가 사용할 수 있는 대규모 애플리케이션용 최신 언어이해 기능을 사용할 수 있다.

마이크로소프트(Microsoft)와 몇몇 스타트업을 포함한 기업들은 초기부터 엔비디아를 채택, 성능 향상을 확인했다. 이들은 엔비디아 플랫폼을 활용해 자사의 고객을 위해 매우 직관적이고 즉각적인 반응형 언어 기반 서비스를 개발하고 있다.

자연어 이해에 기반한 AI 서비스는 향후 몇 년 동안 기하급수적으로 성장할 것으로 예상된다. 주니퍼리서치(Juniper Research)는 디지털 음성 비서만의 사용건수가 향후 4년 내에 25억건에서 80억건으로 증가할 것으로 예측했다. 가트너(Gartner)는 2021년까지 모든 고객 서비스 상호작용의 15%가 AI로 완전히 처리되고, 2017년도 대비 400% 증가할 것으로 예측했다.

브라이언 카탄자로(Bryan Catanzaro) 엔비디아 응용 딥 러닝 리서치(Applied Deep Learning Research) 부사장은 “대화형 언어 모델은 자연어용 AI를 혁신시키고 있다”며 “엔비디아는 이러한 모델을 가속화하는 획기적인 작업을 통해 이전에는 상상도 못했던 방식으로 고객을 돕고 이들을 기쁘게 할 수 있는 새로운 첨단 서비스를 만들고 있다”고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지