7나노 첫 제품으로 GPU 낙점… 엔비디아·AMD과의 차이는?

인텔이 7나노 반도체의 첫 주인공으로 중앙처리장치(CPU)가 아닌 그래픽처리장치(GPU)를 택했다. 고성능컴퓨팅(HPC) 서버를 중심으로 병렬 컴퓨팅 수요가 폭발적으로 늘어나고 있기 때문이다.

인텔의 가세로 서버용 GPU 시장은 엔비디아와 AMD, 인텔의 3각 구도로 재편될 전망이다.

 

GPU 꺼내든 인텔, AI·HPC

인텔은 10나노 이후의 로드맵을 발표하면서 2021년 7나노 공정의 첫 제품으로 ‘Xe’ 설계구조(Architecture) 기반 GPU를 출시할 계획이라고 밝혔다. 내년에는 10나노 공정에서 만든 GPU를 선보인다. 모두 서버용이다.

인텔이 개별 GPU를 출시하는 게 이번이 처음은 아니다.

지난 1998년 출시한 GPU ‘인텔 740(i740)’은 엔비디아의 ‘리바 128’, ‘리바 TNT’에 밀렸고, 차세대 제품인 ‘i754’는 경쟁사 제품에 밀려 출시가 취소되는 수모를 겪었다. 2000년대 초반부터 GPU 기반 병렬 컴퓨팅 프로젝트 ‘라라비(Larrabee)’를 진행했지만, 그마저도 2009년 중단했다.

2016년에는 GPU만큼 병렬 처리 성능이 높다며 CPU 코어 ‘x86’ 설계구조(Architecture) 기반 ‘제온 파이(ZEON Phi)’ 프로세서를 내놓기도 했다. 하지만 결국 지난해 8종이 단종됐고, 로드맵에서도 사라졌다.

그럼에도 인텔이 다시 GPU를 꺼내든 건 HPC 서버 시장을 중심으로 병렬 컴퓨팅 수요가 급증하고 있기 때문이다. HPC 서버는 인공지능(AI), 빅데이터 연산, 클라우드 등을 수행하는 시스템으로 대용량의 데이터를 빠르게 처리해야한다.

 

▲중앙처리장치(CPU)와 그래픽처리장치(GPU)의 내부 구조. 연산처리장치(ALU)를 코어(Core)로 보면 된다./Google image
▲중앙처리장치(CPU)와 그래픽처리장치(GPU)의 내부 구조. 연산처리장치(ALU)를 코어(Core)로 보면 된다./Google image

프로세서 내에서 데이터를 처리하는 건 코어(core)다. CPU는 개별 코어의 성능이 좋지만 전체 코어 수가 적고 GPU는 각 코어의 성능은 떨어지지만 코어 수가 많다. CPU를 1차선 고속도로라고 치면, GPU는 수백개 차선의 일반국도인 셈이다.

인텔이 올해 출시한 ‘2세대 제온 스케일러블 프로세서’만 봐도 가장 고성능 제품의 코어 수가 56개에 불과하다. 엔비디아가 지난해 출시한 GPU ‘T4’에는 튜링 텐서 코어가 320개, 쿠다 코어가 2560개 있다.

서버용 GPU 시장은 엔비디아가 사실상 독점하고 있다. 또다른 GPU 업체 AMD의 시장 점유율은 한자릿수 초반에 불과하다.

HPC용 GPU 시장에서도 독점적이다. AI 학습용 프로세서 시장에서는 100%의 점유율을 가지고 있고, 지난해 상위 500개 슈퍼컴퓨터에 신규 등재된 슈퍼컴퓨터 중 3분의1이 엔비디아의 GPU를 가속기로 썼다.

매출도 고공행진이다. 엔비디아의 데이터센터 사업부 매출액은 2016년부터 매년 2배 가까이 늘고 있다. 이 기간 인텔 데이터센터그룹(DCG)의 연평균 성장률(CAGR)은 15%에 불과했다.

HPC 시장은 앞으로도 빠르게 성장할 것으로 예상된다. 시장 조사 기관 그랜드뷰리서치에 따르면 HPC 시장은 2018년부터 연평균 7.2% 성장해 2025년 596억5000만달러(약 70조8000억원)에 달할 전망이다.

 

엔비디아 vs AMD vs 인텔, 각 사 전략은

인텔이 서버용 GPU 시장에 뛰어들면서 시장 주자는 엔비디아, AMD, 인텔 3개사로 늘었다.

먼저 엔비디아는 AI 등 HPC에서 다루는 각 영역을 중심으로 제품군을 종횡으로 넓히고 있다. AI를 예로 들면 AI 알고리즘을 학습시킬 데이터를 모아 처리하는 것부터 알고리즘을 만드는 것, 이를 기반으로 결과값을 추론하는 것까지 각 과정에 적합한 GPU를 마련했다.

 

▲엔비디아 DGX-2 시리즈./엔비디아
▲엔비디아 DGX-2 시리즈./엔비디아

위로는 GPU 기반 슈퍼컴퓨터 ‘DGX’ 시리즈가 꼽힌다. 이전에는 CPU 서버에 GPU 카드를 꼽아 쓰는 방식이었는데, 둘의 성능이 다르면 병목현상이 발생했고 발열량이 커지는 만큼 냉각기 확장 등의 보완투자가 불가피했다.

엔비디아의 GPU 기반 슈퍼컴퓨터 ‘DGX’ 시리즈는 그 자체로 AI를 학습 또는 구동하는 서버 역할을 한다. 내부 CPU와 GPU를 서로 최적화해 전력소모량과 발열을 줄였고 크기도 작다.

아래로는 지난 3월 출시한 소형 AI 컴퓨터 ‘젯슨 나노(Jetson nano)’가 대표적이다. 99달러(약 12만원) 짜리인 이 제품은 출시되자마자 전 세계적으로 공급 부족 현상을 겪고 있다.

엔비디아 관계자는 “쿠다(CUDA) 프로그래밍 언어 외 다양한 프로그래밍 언어와의 통합을 추진하고 워크샵 등을 꾸준히 진행하면서 개발 생태계를 확장하고 있다”며 “HPC, AI 학습 및 추론, 머신러닝(ML) 등 각 작업의 워크로드(Workload)에 따라 제품군도 확장하고 있다”고 설명했다.

AMD는 CPU ‘에픽(Epyc) 프로세서’와 함께 GPU ‘라데온 인스팅트(Radeon Instinct)’ 제품군을 내세우고 있다. 타사와 뚜렷하게 다른 점은 공정이다. 엔비디아의 서버용 GPU가 10나노대 공정을 쓰는 것과 달리 AMD의 ‘라데온 인스팅트’는 최첨단 공정인 7나노로 생산된다.

AMD는 TSMC에서 칩을 외주생산하는데, TSMC의 7나노 공정은 10나노 공정보다 트랜지스터 밀도는 1.6배 높고, 칩의 전력소모량과 성능을 각 40%, 20% 개선할 수 있다. 하지만 후발주자인만큼 좀처럼 시장 점유율은 늘리지 못하고 있다.

업계 관계자는 “CPU는 인텔 천하, GPU는 엔비디아 천하라 AMD가 끼어들 자리가 없다”며 “데이터센터 업계가 신규 프로세서 플랫폼은 리스크(Risk)가 커 선호하지 않는다”고 설명했다.

인텔은 어떨까. 당장 겨냥하는건 고성능 HPC 서버 시장이다.

인텔이 출시할 서버용 GPU의 성능은 테라플롭스(TFLOPS)에서 페타플롭스(PFLOPS) 사이로, GPU 여러 개를 묶어 페타플롭스 성능을 구현할 가능성이 높다. 엔비디아 GPU 16개로 구성된 ‘DGX-2’의 성능이 2PFLOPS다.

 

▲인텔 GPU 로드맵./인텔
▲인텔 GPU 로드맵./인텔

인텔은 지난 3월 자사 GPU를 활용한 엑사플롭(ExaFLOP)급의 슈퍼컴퓨터를 만들어 미국 에너지부(DoE)에 납품하겠다고 발표했다. 애초에 이 프로젝트에는 엔비디아도 참여하고 있었지만, 채택된 건 인텔의 GPU다.

하지만 업계에서 인텔의 GPU를 조기 도입할 가능성은 낮다. GPU로는 AMD처럼 인텔도 신규 주자이기 때문이다. 서버용 CPU 시장의 장악력을 바탕으로 시장 점유율을 차츰 넓혀갈 것으로 추정된다.

인텔은 서버용 GPU에 여러 공정에서 생산된 반도체들을 하나로 패키징하는 이기종 패키지(heterogeneous package) 기술을 적용하겠다고 한 것도 이같은 전략을 암시한다.

AI 업계 관계자는 “내년 칩이 출시되고 자세한 성능이 나와봐야 알겠지만, 자체적으로 병렬 컴퓨팅 프로그래밍 언어를 개발한 엔비디아를 넘어서는 건 현실적으로 어렵다”며 “옵테인 메모리처럼 FPGA나 CPU에 GPU를 넣어 파는 식이 될 것”이라고 내다봤다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지