소프트웨어는 물론 FPGA 기반 AI 가속기까지 직접 개발해 성능 최적화
음성인식 이어 영상인식까지 적용… 향후 API 공개 및 AI 서비스 확대

아담 스크라바(Adam Scraba) 자일링스 데이터센터 제품 마케팅 디렉터와 샘 로간(Sam Rogan) 자일링스 APAC 지역 부사장, 이강원 SKT 클라우드랩스장, 정무경 SKT 클라우드랩스 ML 클라우드 개발팀장, 박진효 SKT ICT기술센터장이 1일 기자간담회에서 포즈를 취하고 있다./자일링스
아담 스크라바(Adam Scraba) 자일링스 데이터센터 제품 마케팅 디렉터와 샘 로간(Sam Rogan) 자일링스 APAC 지역 부사장, 이강원 SKT 클라우드랩스장, 정무경 SKT 클라우드랩스 ML 클라우드 개발팀장, 박진효 SKT ICT기술센터장이 1일 기자간담회에서 포즈를 취하고 있다./자일링스

SK텔레콤(SKT)의 인공지능(AI) 전략은 다른 통신사들과 결이 다르다. 

협력사의 제품을 사다 쓰거나 소프트웨어만 개발하는 타사와 달리, SKT는 소프트웨어와 하드웨어를 모두 자체 개발한다. 공은 들지만 시스템 관점에서 솔루션을 최적화해 성능과 효율성을 모두 끌어올리는 방법을 택한 셈이다.

지난해 자일링스의 프로그래머블반도체(FPGA)를 기반으로 한 AI 가속기(AIX)로 AI 스피커 ‘누구(NUGU)’의 음성 인식 알고리즘을 구현했던 SKT는 지난 6월경 콜센터용 음성 인식 서비스 ‘바네사(Vanessa)’로 적용처를 넓혔다.

이번엔 영상 인식이다. 자일링스의 최신 적응형컴퓨팅플랫폼(ACAP) 버텍스(Vertex) 기반 알비오(Alveo) U250을 바탕으로 2세대 AIX를 개발, AI 기반 무단 침입 탐지 및 도난 감지 서비스를 선보인다.

당장은 자체 지능형 영상 보안 솔루션인 티뷰(T View)와 자회사인 ADT캡스가 이를 활용하지만, 향후 애플리케이션프로그래밍인터페이스(API)를 공개해 타사가 이 플랫폼을 쓸 수 있게 할 계획이다.

 

SKT는 왜 하드웨어까지 직접 개발할까? 그것도 비싼 FPGA로

엄밀히 따지자면 AI는 소프트웨어다. 얼핏 소프트웨어만 잘 만들면 AI를 아무 문제 없이 구현할 수 있을 것처럼 보이지만 그렇지 않다. 접시에 국을 담을 수 없듯, 소프트웨어와 이를 담는 그릇인 하드웨어가 서로 잘 맞물려야 최적의 성능을 낼 수 있다.

만약 AI 알고리즘의 크기가 크면, 하드웨어도 전력소모량이 높고 가격도 비싼 제품을 살 수밖에 없다. 직접 하드웨어를 개발할 수 있다면 전력 효율성을 높이고 성능도 최적화할 수 있다. SKT가 하드웨어와 소프트웨어를 다 개발하는 건 이 때문이다. 

AI 가속기는 크게 중앙처리장치(CPU)·그래픽처리장치(GPU) 같은 범용 반도체(ASSP)와 구글의 텐서프로세싱유닛(TPU) 같은 전용 반도체(ASIC), 그리고 프로그래머블 반도체(FPGA)로 나뉜다.

ASSP는 성능을 조절할 수 없는 반도체로, 그냥 사다 쓰는 제품이다. ASIC은 소프트웨어를 아예 하드웨어 형태로 고정(Hardening)시켜 해당 기능만 하게 한 솔루션이다. ASSP는 소프트웨어·하드웨어를 서로 최적화하기 어렵고, ASIC은 한 번 개발에 2년이 걸리는 데다 한 번 개발하고 나면 수정이 불가능하다.

 

자일링스는 FPGA와 CPU코어, AI 엔진을 결합한 적응형 컴퓨트 가속 플랫폼(ACAP) ‘버살’을 발표한 바 있다. 사진은 ACAP의 기능 블록 다이어그램./자일링스
자일링스는 FPGA와 CPU코어, AI 엔진을 결합한 적응형 컴퓨트 가속 플랫폼(ACAP) ‘버살’을 발표한 바 있다. 사진은 ACAP의 기능 블록 다이어그램./자일링스

FPGA는 두 선택지의 중간에 있다. 자일링스 같은 제조사는 각 기능을 하는 블록(Block)을 만들어 제공하면 고객사가 레고를 쌓듯 원하는 기능을 원하는 성능만큼 넣는 식이다. 개발 후에도 소프트웨어로 수정할 수 있어 유연성이 높다. 총 소유가격(TCO)은 ASSP보다 비싸지만, 레고부터 만들어야하는 ASIC보다 저렴하다.

이런 이유로 SKT는 FPGA를 택했다. 특히 개발 후 서버에 적용하고 난 후에도 소프트웨어로 기능을 바꿀 수 있다는 점이 매력적이었다고 SKT는 설명했다. 다시 말해 새로운 서비스를 위해 기존 자원을 재분배해 서버 투자 비용을 줄일 수 있다는 얘기다.

이강원 SKT 클라우드랩스장은 “FPGA를 선택한 이유는 성능만이 아니다”라며 “FPGA는 서버에 적용하고 난 다음에도 소프트웨어로 기능을 바꿀 수 있는 이기종 컴퓨팅 솔루션”이라고 설명했다.

 

시작은 음성인식

SKT는 컴파일러부터 런타임까지 AIX의 소프트웨어, 하드웨어를 모두 개발했다./SKT
SKT는 컴파일러부터 런타임까지 AIX의 소프트웨어, 하드웨어를 모두 개발했다./SKT

SKT는 AI 스피커 ‘누구(NUGU)’의 자동 음성 인식(ASR) 알고리즘을 강화하기 위해 3년 전부터 자일링스와 협력, 자일링스의 FPGA ‘킨텍스 울트라스케일(Kintex UltraScale)’ 기반 AIX를 개발하기 시작했다. 

단순히 소프트웨어만 개발하고 하드웨어를 끼워맞췄다면 각 프로젝트당 3~6개월만에 개발이 끝났겠지만 SKT는 소프트웨어와 하드웨어를 동시에 개발하면서 최적 조합을 찾아냈다. 

이 회사는 통상 60~70%에 그치는 FPGA 내 디지털신호처리장치(DSP)의 가용성을 95%까지 끌어올려 GPU 대비 3~5배 성능을 내는 데 성공했다. FPGA는 개발 환경이 독특해 이 정도로 다룰 수 있는 업체가 많지 않다. 자일링스도 지난해 ‘자일링스 개발자 포럼(XDF) 2018’에서 이같은 성과를 집중 조명했다.

그 다음 프로젝트는 지난 7월경 시작한 ‘바네사 스피치 노트(Vanessa Speech Note)’다. SKT는 자연어 이해(NLP) 및 데이터 분석 알고리즘을 개발하는 동시에 AIX를 통해 말을 글로 실시간 변환해주는(STT) 기능을 가속화했다. 

 

이번엔 영상 인식

3차 프로젝트는 영상 인식이다. 1일 SKT는 자일링스의 최신 FPGA ‘버텍스(Vertex) 울트라스케일’ 기반 2세대 AIX를 개발, 무단 침입 탐지 서비스를 시작했다고 발표했다. SKT의 ‘티뷰’ 서비스와 자회사 ADT캡스가 이를 활용하고 있고 내년 3분기 전 세계 시장에 공급될 예정이다. 

현재 구축된 보안 카메라로는 움직이는 물체가 바람에 휘청이는 나무인지, 사람인지 직접 눈으로 확인하지 않는 이상 구분할 수 없다. 하지만 보안 업체는 일단 카메라에 비정상적인 움직임을 보이는 물체가 포착되면 즉시 출동해야한다. 오인식으로 출동, 자원을 낭비하는 경우가 많았다는 얘기다.

SKT는 심층학습 신경망(DNN)을 활용, 수천 대의 카메라에서 전송되는 대규모의 데이터를 처리하길 원했다. 특히 이같은 데이터를 빠르게 처리하기 위해서는 초당 프레임 속도(FPS)를 극대화해 지연시간을 줄이는 게 중요했다.

 

자일링스의 알베오 U250와 SKT의 2세대 AIX 성능 비교./SKT
자일링스의 알베오 U250와 SKT의 2세대 AIX 성능 비교./SKT

SKT는 버텍스 FPGA 기반 ‘알비오(Alveo) U250’를 맞춤화해 2세대 AIX를 만들었다. 

2세대 AIX는 전력소모량은 200W로 알비오와 같지만 FPGA가 2개 들어가있고, 성능은 32TOPS로 알비오(29TOPS)보다 높다. D램 대역폭 또한 77GB/s에서 115GB/s로 늘렸다. FPS는 GPU 성능의 갑절에 달한다.

 

다음은 무엇?

SKT는 5세대(5G) 이동통신망 기술과 AI를 접목, 저지연 AI 서비스를 제공하겠다는 계획을 세웠다. 단순히 AI를 자사가 활용할 목적이 아닌, 서비스를 위해 개발했다는 얘기다.

5G는 이전 세대 통신 기술과 달리 클라우드와 네트워크, 단말 사이에 엣지 컴퓨팅의 개념이 들어간다. 현재는 단말에서 서비스를 요청하면 네트워크를 거쳐 클라우드에서 정보를 처리하는데, 5G는 클라우드에 가기 전 네트워크와 엣지 클라우드 단계에서 시간에 민감한, 중요한 데이터를 처리한다. 

 

SKT는 AI에 포함된 모든 기술을 개발, 서비스할 계획이다./SKT
SKT는 AI에 포함된 모든 기술을 개발, 서비스할 계획이다./SKT

SKT는 당장 현재 구축 중인 5G 모바일엣지컴퓨팅(MEC)에 AIX를 넣고 자사가 개발한 AI 알고리즘을 다른 업체들이 활용할 수 있도록 API를 공개할 예정이다. 예를 들어 무단 침입 탐지 서비스에 적용된 딥러닝 알고리즘을 타사가 자동차의 블랙박스 등에 적용할 수 있게 된다는 얘기다.

이와 함께 고객사 맞춤형 신경망 서비스도 제공할 계획이다. 

박진효 SK텔레콤 ICT기술센터장은 “우리는 클라우드 시스템의 혁신을 통해 다양한 부문의 안정적이고 효율적인 서비스를 개발해 고객에게 더 많은 가치를 제공하기 위해 계속해서 노력하고 있다”고 말하고, “AIX는 고품질 고성능 클라우드 기반 AI 서비스를 위한 우리의 노력 중 하나”라고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지