이진 신경망 추론 성능 20TOPS, 부동 소수점 연산 성능 400GFLOPS

세바(CEVA)는 다양한 센서들을 효율적으로 처리할 수 있는 고성능 센서 허브 디지털신호처리장치(DSP) 아키텍처 '센스프로(SensPro)'를 출시했다./세바

세바(CEVA)는 다양한 센서들을 효율적으로 처리할 수 있는 고성능 센서 허브 디지털신호처리장치(DSP) 아키텍처 '센스프로(SensPro)'를 출시했다고 8일 밝혔다.

스마트폰은 물론 로봇, 자동차, 증강현실(AR) 및 가상현실(VR) 헤드셋, 인공지능(AI) 스피커 등 첨단 기기에는 카메라, 레이더, 라이다(LiDAR), 비행시간차(ToF), 마이크 및 관성측정장치(IMU) 등 다양한 센서가 들어간다. 각 센서들은 이미지, 사운드, 무선통신(RF) 등 다양한 유형의 데이터를 저마다 다른 속도로(비트 전송률) 생성하기 때문에 이를 효율적으로 관리할 수 있는 특수 프로세서가 필요한 상황이다.

센스프로 아키텍처는 다중 센서 데이터를 처리할 때 와트 당 성능을 극대화하기 위해 설계됐다. 높은 다이나믹 레인지 신호 처리, 포인트 클라우드 생성 및 고성능 단일 및 반정밀도 부동 소수점 연산 기능을 제공한다. 음성, 이미지, 심층신경망(DNN) 추론 처리 및 SLAM(Simultaneous Localization and Mapping)에 필요한 8bit 및 16bit 병렬 처리 용량을 갖췄다. 세바의 DSP 'CEVA-BX 스칼라'를 통합, 단일 센서 시스템을 상황 인식 기반 다중 센서 시스템으로 빠르게 전환할 수 있고 VLIW 아키텍처를 기반으로 하고 있어 다양한 장치에 맞게 옵션을 조정할 수 있다.

센스프로는 스칼라 및 벡터 처리 장치를 모두 포함하며, 7나노 공정 기준 동작 속도 1.6㎓를 구현하는 고급 딥 파이프라인을 통합했다. 

병렬 처리를 위해 광범위한 SIMD 확장 가능 프로세서 아키텍처를 채택하고 최대 1024 개의 8x8 MAC, 256 16x16 MAC, 전용 8x2 이진 신경망 지원, 64 단정밀도 및 128 반정밀도 부동소수점 MAC을 구현했다. 이를 통해 8x8 네트워크 추론성능은 3TOPS, 이진 신경망 추론 성능은 20TOPS, 부동 소수점 연산 성능은 400GFLOPS를 제공한다.

SensPro DSP는 CEVA-BX2 스칼라 프로세서와 최적의 사용 사례 처리를 위해 구성된 다양한 벡터 장치를 포함한다. 

란 스니르(Ran Snir) 세바 연구개발 부사장은 “현대 시스템에서 센서의 수와 다양한 센서의 성장과 실질적으로 다른 계산 요구에 따라, 우리는 아예 처음부터 새로운 아키텍처를 설계했다"며 "SensPro는 스칼라, 벡터 처리 및 AI 가속의 조합을 사용해 집중적인 워크로드를 처리할 수 ​​있고 심층 파이프 라이닝, 병렬 처리 및 멀티 태스킹의 최신 마이크로 아키텍처 설계 기술을 활용할 수있는 고도로 구성 가능한 전체론적 아키텍처"라고 설명했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지

키워드

Tags #세바 #센서허브 #DSP