화웨이·애플 이어 삼성도 중저가·프리미엄AP에 NPU 탑재

모바일 애플리케이션프로세서(AP)에 인공지능(AI)이 속속 결합되고 있다. 서버 단에서 실행되던 AI가 이제는 단말기에서 구현(On-device AI)되는 모습이다. 단말기 내부에서 AI 기능이 작동하게 되면 응답 속도나 보안 측면에서 유리하다.

 

삼성전자, 프리미엄 AP으로 NPU 확대 적용

 

▲삼성전자의 프리미엄 모바일 AP '엑시노스 9820'에는 NPU가 탑재됐다./삼성전자
▲삼성전자의 프리미엄 모바일 AP '엑시노스 9820'에는 NPU가 탑재됐다./삼성전자

삼성전자는 AI 연산 속도를 약 7배 향상시킨 프리미엄 모바일 AP '엑시노스 9(9820)'을 공개하고 연내 양산한다고 14일 밝혔다.

이 제품에는 회사가 자체 개발한 4세대 중앙처리장치(CPU) 코어와 Arm의 최신 그래픽처리장치(GPU) ‘말리-G76(Mali-G76)’, 8CA LTE 모뎀, 그리고 신경망처리장치(NPU)가 탑재됐다.

NPU는 AI와 관련된 연산을 처리한다. 앞서 삼성전자는 중저가 AP ‘엑시노스 9610’에 처음으로 NPU를 도입했다. 프리미엄 AP에 NPU를 넣은 건 이번이 처음이다.

이전까지 삼성전자의 프리미엄 AP 속 AI 기능은 대부분 소프트웨어 알고리즘으로 동작했는데, 클라우드(Cloud) 서버와 데이터를 주고 받아야해 속도도 느렸고 보안 위험도 있었다.

모바일 기기 내에 NPU를 넣으면 AI 연산 속도가 빨라져 카메라, 증강현실(AR), 가상현실(VR) 프로그램을 구동할 때 인물과 사물의 특징을 신속·정확하게 파악할 수 있다. 예를 들어 사진을 촬영할 때 피사체의 형태, 장소, 주변 밝기 등의 환경을 순간적으로 파악하고 최적 값을 자동으로 설정하는 식이다.

 

▲삼성전자가 올해 출시한 모바일 AP 성능 비교./삼성전자, KIPOST 재구성
▲삼성전자가 올해 출시한 모바일 AP 성능 비교./삼성전자, KIPOST 재구성

엑시노스에 적용된 4세대 CPU 코어는 이전 3세대 코어보다 싱글 코어 기준 성능이 20% 향상됐다. 같은 성능을 구현할 때 전력 소모량은 35% 적다. 스마트폰 사용 환경에 맞게 각 영역의 코어가 유기적으로 동작할 수 있도록 트라이클러스터(2+2+4) 구조를 적용, 멀티코어 성능을 15% 향상시켰다.

 

아이폰 속 AI, ‘뉴럴 엔진’

 

지난 2016년 애플은 러슈 살쿠트디노브(Russ Salakhutdinov) 교수를 AI 연구 총괄로 영입하면서 AI를 자사 기기에 적용할 것임을 시사했다. 러슈 살쿠트디노브 교수는 구글 브레인을 이끄는 신경망의 아버지 제프리 힌튼(Geoffrey Hinton) 교수의 제자다.

애플은 지난해 출시한 ‘아이폰8’ 및 ‘아이폰X’ 시리즈에 탑재된 AP ‘A11 바이오닉’에 처음으로 AI 전용 칩 ‘뉴럴 엔진’을 탑재했다. 그리고 앞으로 하드웨어와 AI, 소프트웨어를 더한 ‘HAS’ 개념을 기반으로 AP를 설계하겠다고 강조했다.

애플의 첫 ‘뉴럴 엔진’은 1초에 최대 6000억개의 연산을 수행한다. 이를 기반으로 애플은 아이폰의 이미지 및 모션 인식 기능을 강화했다.

 

▲A12 바이오닉 프로세서 내부 NPU의 위치./애플, KIPOST 재구성
▲A12 바이오닉 프로세서 내부 NPU의 위치./애플, KIPOST 재구성

애플은 올해 나온 ‘아이폰XS’ 시리즈에 탑재된 7나노 AP ‘A12 바이오닉’에 8코어 2세대 뉴럴 엔진을 탑재했다.

2세대 뉴럴 엔진은 초당 5조번의 연산을 수행할 수 있다. 가장 많이 활용되는 건 실시간 기계 학습(ML)이다. 사용자의 패턴을 인식, 이를 알고리즘화해 미래 동작에 반영하는 식이다.

뉴럴 엔진은 몰입형 AR 앱(애플리케이션)을 구동할 때도 쓰인다. 화면에서 평평한 부분을 빠르게 감지하고, 그 위에 AR을 입혀 생동감을 불어넣는 식이다.

이와 함께 애플은 개발자들이 자신의 앱(애플리케이션)을 구동할 때 뉴럴 엔진을 활용할 수 있도록 ‘Core ML 플랫폼’을 열었다. 생태계를 확장하겠다는 전략이다.

 

NPU 도입 선발주자, 화웨이

 

AP에 NPU를 처음으로 도입한 건 화웨이다. 화웨이는 지난해 9월 ‘IFA 2017’에서 NPU를 내장한 AP ‘기린 970’을 발표했다. 당시 화웨이는 NPU를 써서 AI 기능을 구현할 때가 CPU로 구동할 때보다 성능은 25배, 효율성은 50배 높다고 설명했다.

화웨이의 NPU는 1.92TFLOPS의 부동 소수점 연산 성능을 갖췄다. 이전 ‘기린 960’의 부동 소수점 연산 성능이 0.6TFLOPS에 불과했던 것을 감안하면, 3배 이상 높아졌다. 화웨이는 1분에 2005장의 이미지를 분석, 애플의 아이폰8플러스(889장)보다 성능이 좋다는 벤치마크 결과도 설명했다.

첫 NPU는 주로 이미지에서 사람·사물·풍경(조도)을 인식해 기기가 스스로 카메라 설정을 최적화하는 데 활용됐다. 오픈 AI 생태계를 채택, 앱 개발자들이 NPU를 활용해 실행 속도와 효율성을 높일 수 있게 했다.

올해 9월 내놓은 ‘기린 980’에도 역시 NPU가 담겼다. 1개만 넣었던 이전보다 갯수를 하나 더 늘렸다. 듀얼 NPU는 카메라로 사물을 비췄을 때 이미지는 물론 초당 30 프레임 속도로 화면이 지나가는 동영상에서도 물체와 배경을 구분, 카메라가 최적화될 수 있게 도와준다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지