자일링스, 적응형 컴퓨팅 가속화 플랫폼(ACAP) 공식 발표

자일링스가 지난 4년간 총 10억달러(약 1조1200억원)를 투입해 만든 차세대 프로그래머블반도체(FPGA) 솔루션 ‘적응형 컴퓨팅 가속화 플랫폼(ACAP)’, 프로젝트명 에베레스트(Everest)의 베일이 벗겨졌다. 


인공지능(AI) 시장에서 주도권을 쥔 엔비디아 등 시장 선도 업체들의 기세를 꺾을 수 있을지 주목된다.



인공지능 시장의 떠오르는 샛별, FPGA



▲리암 메든(Liam Madden) 자일링스 하드웨어 및 시스템 부문 수석 부사장이 ACAP 솔루션의 이점에 대해 설명하고 있다./자일링스


자일링스(지사장 안흥식)는 3일(현지 시각) 열린 ‘자일링스 개발자 포럼(XDF)’에서 첫 ACAP 솔루션 ‘버살(Versal)’을 공식 발표하고 내년 하반기 출시한다고 밝혔다.


반도체 설계를 그림을 그리는 일에 비유하면 FPGA는 밑그림이 그려진 종이다. 전체 기능 중 일부분은 범용 프로세서처럼 이미 만들어져있고, 나머지 부분은 기능별로 분류돼 고객이 기능 추가 등 내부 구성을 설정·변경할 수 있다.


이같은 특성 덕에 주로 R&D용으로 활용됐지만, 인공지능(AI) 시장이 개화하면서 새롭게 주목받았다. 


불필요한 그래픽 연산 기능이 담긴 그래픽처리장치(GPU)와 달리 원하는 연산 기능만 추가할 수 있었고, 발전 속도가 빠른  AI 알고리즘을 반영할 수 있었기 때문이다. 


비용도 저렴해 SKT, 네이버, 다음카카오 등 국내 IT 업계를 포함해 다수의 업체들이 FPGA 기반 AI 서비스를 준비 중이다.(2018년 8월 16일 KIPOST <SKT, 인공지능(AI) 가속기로 FPGA 채택했다> 참고)



엣지(Edge)부터 클라우드까지… ACAP로 총 공략



▲Versal ACAP 솔루션의 구조도./자일링스


ACAP는 이같은 점을 겨냥, FPGA에 애플리케이션프로세서(AP), 실시간(Realtime) 프로세서, 디지털신호처리장치(DSP), 아날로그 소자 등을 담은 플랫폼이다. 연산 성능을 높일 수 있는 가속기도 도메인별로 적용됐다. 


특히 각 회로 블럭 및 기능 클러스터 사이의 연결을 제어하는 네트워크온칩(NoC)과 ‘하드웨어·소프트웨어 프로그래머블 엔진 및’ AI 엔진이 내장돼 반도체가 적용될 기기나 작업량을 스스로 인식, 하드웨어 레벨에서 스스로 성능을 조절할 수 있게 했다.


예를 들어 메모리 컨트롤러의 소프트웨어에 동작에 관한 알고리즘을 입력하면, 메모리가 밀리초 단위로 알고리즘에 따라 동작을 제어한다. 어떤 형식의 데이터든든 처리할 수 있어 데이터 형식별로 일일이 프로그래밍할 필요가 없다.


‘ACAP Versal’는 TSMC의 7나노 핀펫(FinFET) 공정에 최적화됐다. 용도에 따라 ‘버살 AI 코어(Versal AI core)’, ‘버살 프라임(Versal Prime)’으로 나뉜다. 


엣지(Edge) 및 무선통신(RF) 시리즈로 구성된 ‘Versal AI core’는 컴퓨팅 및 전력 소모량 특성이 가장 좋다. 엔비디아의 GPU보다 AI 추론(inference) 성능이 8배 높았다고 자일링스는 설명했다.


‘Versal AI core’에는 실시간 데이터 처리를 하는 듀얼 코어 Arm 코어텍스(Cortex)-R5 프로세서와 오류정정코드(ECC)가 적용된 온칩 메모리, 128~400개의 AI 엔진, 고정밀 부동소수점 연산에 최적화된 저지연 DSP 엔진 1900개 이상이 포함돼있다.


모든 엔진에 직접 접근, 기능을 제어할 수 있고 메모리 계층도 맞춤형으로 구성할 수 있다. 소프트웨어도 변경 가능하다. 특히 서버(클라우드 및 네트워크), 자율 시스템에 적합하다.


‘Versal Prime’은 중급(mid-range) 시장을 겨냥한 제품군으로, 다양한 시장에 광범위하게 적용할 수 있다. ‘프리미엄(premium)’과 고대역폭메모리(HBM)를 내장한 ‘HBM’으로 나뉜다.


9개의 반도체로 구성되는데 각 반도체마다 듀얼코어 Arm 코어텍스-A72 프로세서 및 코어텍스-R5 실시간 프로세서, 온칩 메모리가 포함돼있다. 별도 AI 엔진 대신 DSP 엔진이 4000여개 적용됐다.


이날 빅터 펭(Victor Peng) 자일링스 최고경영자(CEO)는 “AI 및 빅데이터의 폭발과 무어의 법칙의 쇠퇴로 반도체 설계 주기는 더 이상 혁신의 속도를 따라갈 수 없다”며 “Versal 플랫폼은 애플리케이션 전체를 가속화하고, 빠르게 진화하는 기술에 발 맞춰 이들 모두를 즉시 적용할 수 있도록 설계된 플랫폼”이라고 말했다.



AI 전용 카드형 가속기까지 출시



뿐만 아니다. 자일링스는 이날 ‘Versal’과 함께 서버용 가속기 카드 제품군 ‘알베오(Alveo)’를 출시한다고 밝혔다.


‘알베오’는 자일링스의 FPGA ‘울트라스케일(UltraScale)’ 기반으로, 하드웨어를 재구성해 서버를 교체하지 않고도 기존 서버에 적용해 작업량을 늘리고 신규 표준 및 알고리즘으로 시스템을 업데이트할 수 있다.


심층학습(ML)에서는 고성능 중앙처리장치(CPU)보다 실시간 처리량이 20배 높고, 지연시간이 2㎳ 이하로 짧아도 프리미엄급 GPU보다 4배 이상 높은 성능을 보인다. 데이터베이스(DB) 검색 등 보다 간단한 작업에서는 CPU 50배 이상의 성능을 낼 수 있다.


매니쉬 뮤탈(Manish Muthal) 자일링스 데이터센터 부문 부사장은 “알베오 출시와 함께 플랫폼 회사로 나아가면서 혁신 속도가 빨라졌다”며 “생태계 내 14곳의 협력사와 협업하는 한편 추가 협력사 확보로 고객 지원을 강화할 것”이라고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지