3D 반도체 '포베로스(Foveros)' 및 차세대 CPU 아키텍처 '서니 코브' 발표

시스템 반도체 업계에서 최고의 기술력을 갖춘 곳은 '인텔'이다. 양산 경쟁에선 삼성전자와 TSMC가 승리했지만 인텔의 10나노 공정과 두 업체의 7나노 공정은 비슷한 수준의 성능을 보인다. 

인텔은 내년 어떤 기술을 내놓을까. 10나노 공정 양산이 목록에 오른 가운데 후공정 기술과 인공지능(AI) 등에 적합한 설계구조(Architecture)까지 추가될 전망이다.

 

로직도 쌓는다… 3D 패키지 기술 '포베로스(Foveros)'

 

인텔은 '아키텍처 데이(Architecture Day)'에서 3D 반도체 기술 '포베로스(Foveros)'와 신규 중앙처리장치(CPU) 설계구조 등 차세대 신기술을 발표했다고 13일 밝혔다.

 

▲인텔이 3D 반도체 후공정 기술 '포베로스'를 발표했다./인텔
▲인텔이 3D 반도체 후공정 기술 '포베로스'를 발표했다./인텔

가장 눈에 띄는 기술은 로직 반도체 위에 로직 반도체를 올린 3D 패키징 기술 ‘포베로스'다.

20여년간의 연구개발(R&D) 끝에 개발된 포베로스는 능동 인터포저 기판 위에 입출력(I/O), S램, 전원공급회로가 있는 베이스 다이(Base die)와 고성능 로직 칩렛(Chiplet)을 올리는 기술이다.

앞서 삼성전자는 '김기남 프로젝트'라는 이름으로 3D 반도체를 연구하기 시작했지만 메모리와 여러 로직 반도체의 I/O 숫자가 달라 어려움을 겪었다. 

레고를 쌓을 때 위아래 짝이 맞아야 하는 것처럼 전자가 오가는 길이 서로 맞아야 여러 반도체를 겹칠 수 있는데 고성능 로직 반도체는 I/O 수가 많은 반면 메모리 반도체는 I/O 수가 적었다.

인텔은 각 기능별 반도체 블럭인 '칩렛'의 개념을 도입, I/O 수가 맞는 블럭끼리 겹칠 수 있도록 유연성을 높였다. 메모리는 PoP로 패키지 위에 올린다는 방안을 제시했다. 이 방식이라면 서로 다른 공정에서 생산된 반도체라도 하나로 패키징할 수 있다.

인텔은 내년 하반기부터 포베로스를 활용한 다양한 제품을 출시할 계획이라고 밝혔다. 먼저 저전력 22FFL(22나노 핀펫) 공정에서 생산된 베이스 다이 위에 10나노 공정에서 제작된 고성능 연산 칩렛을 쌓은 제품을 출시할 계획이다. 서로 다른 코어를 상황에 따라 가동, 전력 소모량을 줄이는 Arm의 빅리틀 구조와 비슷한 개념이다. 

 

AI 담긴 차세대 CPU 아키텍처 및 GPU

 

인공지능(AI) 및 암호화처럼 부동소수점 연산 가속 기능을 담은 차세대 CPU 마이크로아키텍처 '서니 코브(Sunny Cove)'도 발표됐다. 내년 말 출시되는 인텔의 서버용 CPU '제온(Xeon)' 시리즈 및 클라이언트 CPU '코어(Core)' 시리즈의 기반이 된다.

AI, 암호화, 멀티미디어 작업은 한번에 하나의 작업만 수행하는 컴퓨팅 구조보다 여러 코어가 동시 동작해 여러 작업을 소화할 수 있는 병렬 처리 능력이 중요하다.

서니코브는 병렬 실행 기능을 강화했고 데이터 중심 워크로드에 최적화할 수 있도록 키 버퍼(key buffer) 및 캐시 크기를 늘렸다. 지연을 줄이기 위한 새로운 알고리즘도 적용됐다. 

내년 출시되는 10나노 기반 프로세서에 내장되는 그래픽 아키텍처도 업그레이드됐다. 9세대 그래픽보다 2배 이상 많은 64개의 실행 유닛(EU)을 갖춘 11세대 그래픽 아키텍처다.

클럭 당 연산 성능도 9세대 그래픽보다 2배 이상 높고, 1테라플롭스(TFLOPS)를 넘어서 게임 플레이 성능을 강화할 수 있을 것이라고 인텔은 설명했다. 사진 인식 등 AI 추론 알고리즘에서도 2배 이상의 성능을 제공한다.

향상된 미디어 인코더 및 디코더 기능을 지원, 전력 공급이 제한적이더라도 4K 동영상 스트림과 8K 콘텐츠를 제작할 수 있고 '인텔 어댑티브 싱크(Intel Adaptive Sync)' 기술을 지원해 게이밍을 위한 매끄러운 프레임 레이트를 제공한다.

인텔은 또한 2020년까지 외장 그래픽 프로세서를 도입할 계획임을 재확인했다.

인텔은 이와 함께 CPU, GPU, FPGA, AI 및 기타 가속기 등 다양한 컴퓨팅 엔진에서의 프로그래밍을 단순화하기 위한 ‘One API’ 프로젝트를 발표했다. 

해당 프로젝트에는 코드의 가속화를 최대로 이끌어낼 수 있도록 소프트웨어에서 하드웨어로 매핑된 개발자용 툴을 포괄적으로 포함·통합한 포트폴리오도 들어있다. 프로젝트 공개 시점은 내년이다.

'인텔 제온 케일러블 플랫폼'에 최적화된 통합, 고성능 오픈 소스 스택인 딥 러닝 레퍼런스 스택(Deep Learning Reference Stack)도 공개했다.

 

AI 및 빅데이터 처리, '옵테인'으로 해결

 

인텔은 3D 크로스포인트(Xpoint) 메모리인 '인텔 옵테인(Intel Optane)'에 대한 새소식도 전했다.

'인텔 옵테인 DC 퍼시스턴트 메모리(Intel Optane DC persistent memory)'는 메모리와 같은 성능을 데이터 지속과 대용량 스토리지와 융합한 신규 제품으로 캐시 메모리 역할을 하면서 CPU에 캐시 라인(64B) 읽기를 전달한다.

요청한 데이터가 D램에 없거나 읽기 작업이 옵테인 퍼시스턴트 메모리로 온 경우 평균 유휴 읽기 지연 시간(Average idle read latency)은 약 350나노초로 예상된다. 확장시 1개의 옵테인 솔리드스테이트드라이브(SSD)에서 평균 유휴 읽기 지연 시간은 1만 나노초다.

CPU의 기억 제어기에 캐시되어 있거나 애플리케이션에 의해 다이렉트되는 등, 요청받은 데이터가 DRAM에 있는 경우 메모리 서브시스템의 반응 속도는 100 나노세컨 이하로 DRAM과 동일할 것으로 예상된다.

인텔 옵테인 SSD와 QLC NAND SSD를 결합하면 자주 사용되는 데이터에 빠르게 접근할 수 있다. 

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지