라민 론 자일링스 AI 및 소프트웨어 솔루션 부문 부사장 인터뷰

프로그래머블반도체(FPGA)의 새 시대가 열렸다. 

이전까지는 연구개발(R&D)과 고성능 제품에 주로 쓰였지만, 최근 들어 주류 응용 프로그램으로 영역을 넓히고 있다. 인공지능(AI)⋅자율주행⋅5세대(5G) 이동통신 등 새로운 응용처가 등장하면서다.

FPGA는 다양한 기능을 하나의 반도체에 원하는 대로 집적할 수 있는데다 전력 소모 대비 성능도 높다. 하드웨어 엔지니어는 물론 소프트웨어 엔지니어도 개발할 수 있다는 매력까지 겸비했다.

전체 반도체 시장 성장세가 꺾였지만, FPGA 업계 매출은 매분기 두자릿수 비율로 증가하고 있다. FPGA 업계 1위 자일링스(Xilinx)의 라민 론(Ramine Roane) 소프트웨어 및 AI 솔루션 부문 마케팅 겸 기획 담당 부사장을 만났다.

 

라민 론 자일링스 AI 및 소프트웨어 솔루션 부문 부사장./KIPOST
라민 론 자일링스 AI 및 소프트웨어 솔루션 부문 부사장./KIPOST

 

FPGA, R&D·고성능에 이어 주류로

자일링스가 FPGA를 발명한 건 1980년대다. 마치 빈 테이프처럼 사용자가 직접 기술을 프로그래밍하는 반도체를 목표로 만들어진 당시 FPGA는 논리(Logic) 회로와 입출력(I/O), 메모리를 하나로 집적해놓은 반도체에 불과했다. 이 때 FPGA는 양산보다는 R&D에 주로 활용됐다. 

1990년대 들어 FPGA는 중앙처리장치(CPU)가 감당할 수 없는 고성능 제품에 쓰이기 시작했다. 프리미엄 자동차와 고성능 모니터, 이동통신 인프라 등은 물론, 우주·항공·과학·의료 등에도 FPGA가 들어갔다. 

유럽입자물리학연구소(CERN)에 있는 대형이온충돌기실험(ALICE)에서 원자 수천 개의 궤적을 매핑하는 것도, 미 항공 우주국(NASA)이 화성에 보낸 탐사차 로버(Rover)에도 자일링스의 FPGA가 들어있다.

 

나사가 화성에 발사한 탐사체 로버(Rover)./위키백과
나사가 화성에 발사한 탐사체 로버(Rover)./위키백과

특히 2011년 자일링스가 Arm 프로세서 기반 컴퓨트 엔진과 그래픽처리장치(GPU), FPGA 회로 블록(Block)으로 구성된 시스템온칩(SoC) ‘징크(Zynq)’를 출시하면서 고성능 시스템에서의 채용률이 급격히 높아졌다.

라민 론 부사장은 “이게 지금까지의 FPGA라면 무어의 법칙이 느려지기 시작한 몇 년 전부터는 FPGA가 주류 안으로 들어오고 있다”며 “CPU가 AI 같은 주류 응용처를 감당하지 못하면서 이를 대체하기 위해 FPGA가 쓰이는 것”이라고 말했다.

 

새로운 주류, AI·자율주행·5G

현재 기술 발전이 가장 빠르게 이뤄지고 있는 분야는 AI와 자율주행, 5G다. 문제는 이 기술들의 발전 속도가 반도체 설계 속도보다 빠르다는 것이다. 

알고리즘을 만들고 전용반도체(ASIC)를 설계하기까지는 보통 2년이 걸린다. 2년 후에 반도체로 내놔봤자 구세대 제품이다. 스타트업이면 이보다 더 긴 기간이 필요하고 여기에 애플리케이션에 반도체를 집어넣을 때의 최적화 기간까지 필요하다. 

반면 FPGA는 설계 후에도 원하는 대로 기능을 바꿀 수 있다. 

실제 SK텔레콤(SKT)의 AI 스피커 ‘누구(NUGU)’의 음성 인식 기능에도 자일링스의 FPGA가 쓰인다. 자일링스와 5G로 협력하고 있는 삼성전자의 장비를 활용, 5G를 구현해보이기도 했다.

 

SKT의 데이터센터에 들어간 자일링스의 FPGA는 AI 스피커 '누구'의 음성인식을 가속화하는 역할을 한다./자일링스
(좌측부터)안흥식 자일링스 지사장, 라민 론 자일링스 부사장, 이강원 SKT 기술원장, 정무경 SKT 팀장, SKT의 데이터센터에 들어간 자일링스의 FPGA는 AI 스피커 '누구'의 음성인식을 가속화하는 역할을 한다. /SKT

그나마 무어의 법칙이 통했던 시대에는 1년 반만 기다리면 성능·전력효율·면적(PPA)을 2배로 개선할 수 있었다. 알고리즘의 개발 속도와의 차이를 그나마 상쇄할 수 있었다는 얘기다. 하지만 공정 난이도가 높아지고 개선 정도가 낮아지면서 이 법칙은 이제 통하지 않고 있다. 

같은 정도의 혁신을 이끌어내기 위해서는 사용자 정의 메모리를 가지고 있고 원하는 대로 설계를 할 수 있는 FPGA가 해답이 될 수 있다고 그는 설명했다.

라민 론 부사장은 “아무리 돈이 많은 기업이라도 ASIC 설계엔 최소 1년 반이 걸린다”며 “10~20년 후 알고리즘의 혁신 속도가 느려지면 몰라도, 그 전에는 알고리즘의 발전 속도보다 ASIC을 만드는 데 걸리는 시간이 훨씬 오래 걸릴 것”이라고 말했다.

 

전력 소모량, 시스템 측면에서 보면 더 적다

FPGA의 가장 큰 한계로 꼽힌 전력 소모량도 전체 시스템 측면에서 보면 ASIC이나 범용 반도체(ASSP)를 썼을 때보다 적다고 론 부사장은 설명했다.

단순히 반도체만 놓고 보자면 FPGA의 전력소모량이 더 많을 수 있지만, FPGA는 여러 기능이 집적돼있기 때문에 수 개의 ASIC 및 ASSP를 대체할 수 있다는 것이다.

여기에 CPU·GPU 등 기존 컴퓨팅 아키텍처는 외부 메모리, 다른 칩과 데이터를 주고 받는 데 전체 전력소모량의 60%를 쓴다. CPU와 GPU 내 메모리는 용량이 적은 캐시 메모리에 불과하다. 반면 FPGA는 프로세서부터 메모리까지 사용자가 원하는 대로 집어넣을 수 있기 때문에 이 과정에서 들어가는 에너지를 줄일 수 있다.

AI도 마찬가지다. 단일 AI 성능만 비교하면 AI만 하게 설계된 ASIC이 더 좋을 수 있다. 하지만 FPGA는 AI 전처리 기능과 AI, AI 후처리 기능까지 하나의 칩으로 수행할 수 있다.

라민 론 부사장은 “전체 애플리케이션을 살펴볼 때 FPGA가 여러 기능과 외부 메모리를 합친 제품이라는 점을 고려하면 전력 소모량은 실제로 훨씬 적다”며 “이게 자동차 업계에서 FPGA를 찾는 이유”라고 말했다.

 

FPGA의 미래

이 회사는 지난해 FPGA에서 적응형 컴퓨트 가속화 플랫폼(ACAP)으로의 세대 전환을 발표했다. 

ACAP는 기본적으로 AI 엔진을 내장해 전용 반도체(ASIC)에 필적하는 성능을 낸다. 칩 내부 메모리 용량도 커 외부 메모리와 신호를 주고받는 데 드는 전력 소모량이 적다.

 

ACAP 다이어그램./자일링스
ACAP 다이어그램./자일링스

이전 세대의 FPGA는 I/O 속도를 높이기 위해 FPGA 로직 자체를 썼지만, ACAP는 최대한 많은 데이터를 가지고 있게 하기 위해 기가헤르츠(㎓) 속도로 데이터를 움직이는 네트워크온칩(NoC)을 넣고 I/O와 메모리 컨트롤러 등도 강화했다.

자일링스는 이와 함께 하드웨어 엔지니어는 물론 소프트웨어 엔지니어도 FPGA를 설계할 수 있도록 지난 5년간 순차적으로 각종 산업 표준 프레임워크에 대한 지원을 시작했다. 지난해 중국 디파이(Deephi)를 인수한 것도 소프트웨어 역량을 키우기 위해서다. 

올해 자일링스개발자포럼(XDF)도 소프트웨어를 중심으로 프로그램이 짜여졌다. 자일링스는 오는 10월 열리는 이 행사에서 소프트웨어 지원에 관한 중대 발표를 할 예정이다.

라민 론 부사장은 “기본적으로 우리는 소프트웨어 커뮤니티, 오픈 소스 커뮤니티, 라이브러리 및 프레임 워크에 중점을 두고 있다”며 “이들을 지원, 소프트웨어 개발자들을 수용하는 방향으로 나아가고 있다”고 말했다.

 

라민 론 자일링스 AI 및 소프트웨어 솔루션 부문 부사장은 지난 2010년 자일링스에 입사하기 전에는 FPGA 스타트업 및 대형 소프트웨어 업체에서 소프트웨어 아키텍처 개발·관리를 맡았습니다. 자일링스에 들어오고 난 후에는 최신 반도체 설계자동화(EDA) 툴인 비바도 디자인 스위트(Vivado Design Suite) 개발을 주도했습니다. 현재 그는 자일링스의 설계 환경을 소프트웨어 프로그래밍과 AI 가속화를 가능하게끔 바꾸고 있습니다. 
저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지