2017년 이후 NPU 업체 다수 창업
1~2년 내 양산...실물 칩 출시 후 시장에서 승부

팹리스 스타트업에 칩 양산은 아기새가 첫 비행에 나서는 과정에 비유된다. 실물 칩을 설계하고 파운드리에 맡겨 생산하는데 적어도 수백억원 이상 소요되기 때문에 자본의 대부분을 소진하게 된다. 

양산칩이 시장에서 인정받지 못하면 추가 자금확보에 나서거나, 회사가 존폐 기로에 설 수도 있다. 그만큼 치열한 검증과정을 거쳐 양산이 이뤄지는데, 스타트업들의 장기 전망을 가늠할 기회이기도 하다.

지난 2017년 이후 새로 창업된 NPU(신경망처리장치) 스타트업들의 양산 돌입에 시선이 쏠리는 이유다.

NPU는 AI 연산에 특화된 반도체를 뜻한다. 범용성이 강한 GPU와 달리 AI에 특화돼 있어 전력소모량이 낮고, 연산 속도가 빠르다. /사진=삼성전자
NPU는 AI 연산에 특화된 반도체를 뜻한다. 범용성이 강한 GPU와 달리 AI에 특화돼 있어 전력소모량이 낮고, 연산 속도가 빠르다. /사진=삼성전자

퓨리오사AI⋅딥엑스 내년에 양산칩 출하

 

퓨리오사AI는 내년 4분기에 첫 번째 양산칩이 출하된다. NPU는 데이터센터 내 서버에서 병렬연산을 하기 위한 서버용과 스마트폰⋅웨어러블⋅자율주행차 등 애플리케이션에 탑재되는 엣지용으로 나뉜다. 이 중에 퓨리오사AI는 서버용 NPU 설계 전문 팹리스다. 

퓨리오사AI의 첫 양산칩은 삼성전자 14nm(나노미터) 공정을 이용해 생산될 예정이다. 현재 디자인하우스에서 막바지 백엔드 설계 작업을 진행하고 있다. 

이 회사가 양산에 앞서 샘플 제작한 서버용 NPU ‘워보이’는 ML.Perf(엠엘퍼프)에서 엔비디아의 AI용 GPU(그래픽처리장치) ‘T4’ 대비 높은 성능이 측정되기도 했다. ML.Perf는 AI용 반도체 회사들이 각사 칩을 제출해 성능을 평가하는 일종의 경진대회다. 

ML.Perf 결과에 따르면 ‘이미지 분류(Image Classification)’ 작업시 워보이의 지연시간은 0.74ms, 엔비디아 T4는 0.82ms로 측정됐다. 사물탐지(Object Detection)시에는 워보이가 0.42ms, T4가 0.51ms로 각각 측정됐다. 

퓨리오사AI '워보이'와 엔비디아 'T4'를 비교한 ML.Perf 결과치. /자료=퓨리오사AI
퓨리오사AI '워보이'와 엔비디아 'T4'를 비교한 ML.Perf 결과치. /자료=퓨리오사AI

퓨리오사AI는 이미 워보이 대비 성능이 크게 개선된 두 번째 칩 양산도 준비 중이다. 두 번째칩은 대만 TSMC 5nm(나노미터) 공정에서 생산되며, 백엔드 설계는 TSMC 자회사 GUC에 맡기기로 했다. 

엣지용 NPU를 설계하는 딥엑스도 내년에 양산 대열에 뛰어든다. 딥엑스의 첫 양산칩은 삼성전자 파운드리를 통해 생산된다. 제품에 따라 28nm⋅14nm⋅5nm 공정에서 생산되며, 내년 6월에 팹인에 들어간다. 팹인은 파운드리에서 생산될 웨이퍼가 투입되는 시점을 뜻하며, 제품이 출하되는 팹아웃은 10월로 예정돼 있다. 

딥엑스는 엣지용 NPU를 표방하는 만큼 다양한 애플리케이션에 적용될 수 있도록 출시할 계획이다. 우선 스마트폰과 스마트워치⋅TV 탑재용 등으로 출시된다. 

딥엑스는 회사를 창업한 김녹원 대표 이력으로도 유명한 회사다. 김 대표는 딥엑스 창업 전 애플에서 ‘아이폰X(텐)’용 AP(애플리케이션프로세서) ‘A11 바이오닉’ 설계에 참여한 바 있다. 아이폰용 AP는 A11 이전까지 칩 이름 뒤로 다른 네이밍이 붙지 않았으나, A11부터 ‘바이오닉’이 붙었다. 이 칩부터 AP 내에 AI 연산을 위한 뉴럴엔진이 붙어 있다는 의미다. 애플의 첫 아이폰용 NPU 융합 AP를 설계하는데 김 대표가 참여한 셈이다.

애플 아이폰X에 탑재된 'A11 바이오닉' 칩. /사진=애플
애플 아이폰X에 탑재된 'A11 바이오닉' 칩. /사진=애플

서버용 NPU와 달리 엣지용 NPU는 성능은 물론 저전력 특성 요구치가 높다. 엣지 디바이스 대부분이 배터리를 통해 구동되기에 전력 소모량이 많으면 실 제품에 탑재할 수 없다. 엣지용 NPU 분야에서 가장 유명한 회사는 이스라엘 헤일로인데, 딥엑스 NPU는 필드 테스트에서 헤일로 제품 대비 높은 성능이 측정된 것으로 알려졌다. 

또 다른 엣지용 NPU 회사인 모빌린트도 내년에 MPW(멀티프로젝트웨이퍼)에 참여한다. MPW는 한 장의 웨이퍼 위에 여러 회사 칩 디자인을 새겨 한번에 생산하는 방식을 뜻한다. 상대적으로 적은 양의 칩 완제품이 출하되는데, 양산 보다는 ‘준 양산’ 성격에 가깝다. 

MPW에서 생산된 칩은 고객사에 성능검증용로 공급하거나 일부 양산용으로 공급할 수도 있다. 여기서 충분한 성능을 내면 한 웨이퍼에 모빌린트 칩 디자인만 새겨 대규모 양산으로 넘어간다.

모빌린트 역시 국내서 몇 안 되는 ML.Perf 테스트 결과를 보유한 회사다. 지난해와 올해 2회 연속 ML.Perf에 참여해 높은 결과치를 받았다. ML.Perf는 참가 업체에 워낙 높은 신뢰도⋅정확도를 요구하기로 악명이 높다. 

한 디자인하우스 업체 임원은 “이미 양산에 돌입하기 전 PoC(성능검증)을 통해 고객사로부터 성능을 평가 받는다”며 “그래도 자본력이 취약한 스타트업들에게 첫 양산은 리스크가 크다”고 말했다. 

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지