학습용 NNP-T, 추론용 NNP-I… NNP-T는 TSMC 공정에서

인텔이 고성능 인공지능(AI) 가속기 '인텔 너바나(Interl Nervana)' 신경망 프로세서에 대한 세부 정보를 공개했다.

엔비디아가 독점하고 있는 AI 학습용 프로세서 시장 도전을 멈추지 않을 것이라던 윌리엄 기아드(Wiliam Giard) 인텔 데이터센터그룹(DCG) IT 트랜스포메이션 담당 최고기술책임자(CTO)의 말처럼 학습용 프로세서도 내용에 담겼다.

인텔은 '핫칩스2019(Hot Chips 2019)'에서 '인텔 너바나(Intel Nervana) 신경망 프로세서'가 학습용 프로세서인 'NNP-T'와 추론용 프로세서 'NNP-I' 등으로 출시될 것이라고 21일 밝혔다.

이와 함께 하이브리드 칩 패키징 기술, 인텔 옵테인 DC(Intel Optane DC) 퍼시스턴트 메모리및 광학 입출력용 칩렛 기술에 대해 발표했다.

데이터를 정보로, 지식으로 바꾸려면 이를 지원하는 하드웨어 아키텍처와 패키징·메모리·스토리지·인터커넥트 기술이 모두 발전해야한다. 인텔은 고객에게 올바른 지능형 시스템을 적재적소에 제공하기 위해 처음부터 AI에 중점을 두고 설계됐다.

나빈 라오(Naveen Rao) 인텔 부사장 겸 AI 제품 그룹의 총괄 매니저는 “'모든 곳에 인공지능(AI everywhere)'을 구현하기 위해서는 생성되는 대량의 데이터를 기업에서 효율적으로 처리하고 활용할 수 있도록 지원해야 한다”며 “하드웨어에서 소프트웨어, 애플리케이션에 이르는 종합적인 접근 방식이 필요하다”고 전했다.

 

인텔 너바나 NNP-T: 딥러닝 학습용 프로세서

 

인텔 너바나 NNP-T의 블록 다이어그램./인텔
인텔 너바나 NNP-T의 블록 다이어그램. TSMC의 16나노 핀펫 공정에서 생산된다./인텔

'인텔 너바나 NNP-T'(코드명 스프링 크레스트, Spring Crest)는 딥러닝 학습 전용으로 설계됐다. 목표는 주어진 전력 범위 내에서 네트워크를 가능한 빨리 학습시키는 것이다.

특히 유연성과 프로그래머블 기능으로 구축돼 기존 워크로드와 추후에 나타날 새로운 워크로드 모두를 가속화하도록 설계됐다. 

인텔 제온 스케일러블 프로세서(Intel Xeon Scalable processors)가 특정 AI를 지원한다면 NNP-T는 처음부터 레거시 기술을 지원하는 데 필요한 고정경비 없이 대형 모델을 해결하는 데 필요한 기능과 요구 사항을 내재했다.

 

인텔 너바나 NNP-I: 고성능 딥러닝 추론

'인텔 너바나 NNP-I'(코드명 스프링 힐, Spring Hill)는 추론을 위해 특수 제작돼 대규모로 딥러닝 구축을 가속화하도록 설계됐다. 모든 주요 데이터 센터 워크로드에 걸쳐 와트 당 업계 최고의 성능을 제공하기 위해 아이스레이크(Ice Lake) 코어를 이용한 인텔의 10나노 공정 기술을 활용한다.

성능이나 전력 효율성 저하 없이 높은 수준의 프로그래머블 기능을 제공한다. AI가 모든 워크로드에서 보편화되면서 쉬운 프로그래밍, 짧은 지연 시간, 빠른 코드 포팅 및 모든 주요 딥러닝 프레임워크 지원을 포함하는 전용 추론 가속기를 사용할 수 있게 했다.

 

레이크필드(Lakefield): 3차원 패키지의 하이브리드 코어

레이크필드는 새로운 차원의 모바일 디바이스를 위한 3차원(3D) 스태킹 및 AI 하이브리드 컴퓨팅 아키텍처를 갖췄다. 인텔의 최신 10나노 공정 및 포베로스(Foveros) 첨단 패키징 기술을 활용, 이전 세대의 기술에 비해 대기 전력, 코어 영역 및 패키지 높이를 극적으로 감소시킨다.

동급 최강의 컴퓨팅 성능과 초저열 설계 성능을 통해 새로운 얇은 폼 팩터 디바이스, 투인원 및 듀얼 디스플레이 디바이스는 아주 낮은 대기 전력에서 상시 켜진 상태와 연결된 상태로 작동할 수 있다. 

 

테라피(TeraPHY): 패키지 내 광학 I/O 칩렛

인텔과 아야 랩(Ayar Lab)은 업계 최초의 고성능 시스템온칩(SoC)과 일체형 패키지 내 광학(MIPO)의 통합을 시연했다.

아야 랩 테라피(Ayar Labs TeraPHY) 광학 I/O 칩렛은 인텔 임베디드 멀티-다이 인터커넥트 브릿지 기술(EMIB)을 사용해 인텔 스트라틱스 10 FPGA(Intel Stratix 10 FPGA)에 통합 패키징 됐다. 높은 대역폭, 저전력 데이터 통신을 제공해 최대 2km 거리까지 낮은 지연 속도를 지원한다.

이러한 협력은 데이터 이동의 전통적인 성능, 전력 및 비용 병목 현상을 제거해 무어의 법칙(Moore’s Law)의 다음 단계를 위한 컴퓨팅 시스템 설계에 대한 새로운 접근 방식을 제공한다. 

 

인텔 옵테인 DC 퍼시스턴트 메모리: 아키텍쳐 및 성능

인텔 옵테인 DC 퍼시스턴트 메모리(Intel Optane DC persistent memory)는 다양한 메모리 및 스토리지 티어 중에서도 새로운 개념의 퍼시스턴트 메모리 티어의 첫 제품이다.

인텔 3D 크로스포인트 (Intel 3D XPoint) 기술 및 메모리 모듈 폼 팩터 기반으로 메모리와 가까운 속도, 나노 초 단위의 짧은 지연시간, 그리고 대용량을 제공하며 스토리지의 지속성도 지원한다.

두 가지 작동 모드(메모리 모드, 앱 다이렉트 모드)를 지원하며, 해당 메모리와 같은 새로운 티어가 완전히 재설계된 데이터 공급 서브시스템을 지원해 새로운 워크로드를 더욱 빠르게 지원한다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지