엔비디아 H20 조달 막힌 중국
화웨이 '어센드 910c'가 유일한 대안
"HBM은 2.5D 패키지에서 떼내어 조달"

미국 행정부 제재 탓에 고성능 AI(인공지능) 반도체 조달 통로가 막힌 중국이 AI 학습 인프라를 어떻게 구축할 지 관심이 모인다. 이미 화웨이를 통해 GPU 설계를 완성하기는 했지만, 선단공정 파운드리 확보와 GPU에 붙는 HBM(고대역폭메모리) 조달은 대안을 마련해야 한다. 

엔비디아 H20 GPU. /사진=엔비디아
엔비디아 H20 GPU. /사진=엔비디아

 

중국, 스펙 낮춘 H20도 조달 막혀

 

지난달까지 중국 AI 기업들이 구매한 엔비디아 H20은 H100에서 연산능력을 의도적으로 두 번 떨어뜨린 제품이다. 엔비디아는 지난 2022년 10월 바이든 행정부가 처음 H100 중국 수출을 제한하자 대역폭을 절반(400GB/s)으로 낮춘 H800을 중국 수출용으로 내놨다. 1년 뒤 H800마저 수출 제한에 걸리면서 내놓은 게 H20이다. H20의 연산능력은 H100 대비 6분의 1에 그친다. 

그러나 트럼프 행정부는 이번에 H20의 수출마저 무기한 제한하기로 결정했다. 금번 수출 제한 조치로 엔비디아는 회계연도 1분기(2∼4월)에 55억달러(7조8567억원)의 손실이 발생할 것으로 예상한다고 밝혔다.

H20 구매마저 막힌 중국으로서는 AI용 반도체 자립이 더욱 시급한 과제가 됐다. 대안이 없지는 않다. 화웨이가 개발한 ‘어센드(Ascend) 910c’가 현재 중국에서 개발된 GPU 중에서는 가장 진보된 AI 반도체다. 어센드 910c의 성능은 엔비디아의 최신 GPU인 ‘GB200’과 비교하면 성능이 3분의 1 정도다. 개별 칩 성능만 놓고 보면 어센드 910c 성능은 엔비디아 수준에 못미친다. 

'어센드 910c'와 'GB200' 비교. 개별 칩 성능은 떨어지지만 시스템으로 연결했을 때(아래) 엔비디아 NVL72를 넘어선다. /자료=세미애널리시스
'어센드 910c'와 'GB200' 비교. 개별 칩 성능은 떨어지지만 시스템으로 연결했을 때(아래) 엔비디아 NVL72를 넘어선다. /자료=세미애널리시스

그러나 화웨이는 어센드 910c 384개를 엮어서 ‘클라우드매트릭스 384’라는 AI 서버 시스템을 만든다. 클라우드매트릭스 384의 연산성능은 320PFLOPS(페타플롭스)로, 엔비디아 GB200 72개를 엮어 만든 ‘NVL72’ 대비 1.7배다. 

물론 훨씬 많은 수의 GPU를 집적시키다 보니 전력 소모량도 NVL72 대비 4배 많고, HBM 탑재량도 3배 이상이다. NVL72와 비교하면 대단히 소모적인 인프라다. 그러나 중국 내에서는 AI 학습에 따른 전력소모량 증대는 큰 고려사항이 아니다. 국가적으로 AI 산업을 집중 지원하고, 전력 인프라도 충분하기 때문이다. 개별 칩 성능이 떨어지면, 이를 거대 클러스터로 엮어 성능을 높이는 방식이 중국에서는 통한다. 

 

선단 파운드리, HBM 조달은 어떻게

 

어센드 910c가 엔비디아 GPU를 대체한다고 해도 문제는 남는다. 바로 선단공정 파운드리와 HBM이다. 화웨이는 지난해 소프고라는 중국 팹리스를 대리인으로 내세워 TSMC에 어센드 칩 위탁생산을 맡겼다가 적발됐다. 이 때문에 TSMC는 미국 상무부로부터 조사를 받고 있으며, 10억달러(약 1조4700억원)에 이르는 벌금을 납부할 처지다.

향후 대리인을 내세운 방식으로도 TSMC에 반도체 생산을 맡기지 못한다면 SMIC가 생산해주는 것 외에 방법은 없다. 어센드 910c는 TSMC 7nm(나노미터) 공정으로 생산됐는데, SMIC도 7nm 공정이 있기는 하다. 대신 EUV(극자외선) 노광장비를 도입하지 못했기 때문에 수율이 낮은 멀티패터닝 기술을 구현해야 한다. 생산 원가가 비쌀 수 밖에 없다.

HBM은 선단공정 파운드리보다 조달 루트가 더 난망하다. 이제 막 DDR5 시장 진입을 노리고 있는 CXMT(창신메모리)가 대규모 HBM을 공급하기에는 최소 1년 이상의 시간이 필요하다. 최근 AI 학습 기술 발전상을 감안하면 1년간 반도체 조달이 막힐 경우, 경쟁사들을 따라잡기가 불가능해진다.

2.5D 패키지 된 HBM(주황색). 230도 정도로 온도를 올리면 HBM을 패키지에서 '디솔더링' 할 수 있다.
2.5D 패키지 된 HBM(주황색). 230도 정도로 온도를 올리면 HBM을 패키지에서 '디솔더링' 할 수 있다.

이에 화웨이는 HBM이 2.5D 방식으로 패키지 된 저사양 GPU를 구매해 ‘디솔더링(Desoldering)’하는 방식으로 HBM을 조달하는 방안을 추진 중인 것으로 알려졌다. HBM을 중국에 직수출하는 건 미국 제재에 걸리지만, 저사양 GPU가 포함된 패키지로 수출하는 건 가능하다. 

HBM을 GPU와 2.5D 패키지 하려면 실리콘 인터포저 위에 본딩해야 하는데, 본딩 부위에 열을 가해 HBM만 떼어 내는 게 디솔더링이다. 

한 반도체 산업 전문가는 “반도체 본딩에 쓰이는 솔더(납땜)는 대체로 230℃ 정도면 반고체 상태로 녹아내린다”며 “모듈 조립 과정에서도 B급 제품을 디솔더링 하는 기술을 발달돼 있어 HBM을 떼어 내는데 문제는 없을 것”이라고 말했다.

따라서 화웨이로서는 디솔더링 할 수 있는 2.5D GPU 패키지를 최대한 많이 조달해야 한다. 시장조사업체 세미애널리시스에 따르면 화웨이는 최근 반도체 디자인하우스 패러데이를 통해 대규모의 16nm 공정 GPU를 주문했다. 이 GPU에 함께 패키지 된 HBM은 대만 코아시아일렉트로닉스가 공급한 것으로 추정된다.

쓸모도 없는 GPU까지 같이 주문해야 하고, 디솔더링하는데 비용이 들어가겠지만 이렇게라도 HBM을 수급하는 게 화웨이의 유일한 대안책이다. 

세미애널리시스는 “HBM에 대한 미국 제재가 강화된 올해 1월부터 코아시아일렉트로닉스의 매출이 60% 이상 급증했다”며 “이는 결코 우연이 아니다”라고 설명했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지