더 추상화된 API 제공, 공통 프로그래밍 접근
하드웨어 가속 레이트레이싱 지원 변수
기존 쿠다 사용자에게 유인 없을 수도

아마존의 시작은 온라인 서점이었다. 책을 필두로 DVD⋅의류⋅식품⋅생필품까지 손을 뻗은 아마존은 고객 락인(Lock in)에 성공한다. 아마존이 구축한 생태계에서 고객은 모든 것을 쉽고, 편하게 구매할 수 있다.

인텔이 지난해 첫 서버용 GPU를 출시하며 XPU 전략을 공개했다. XPU 전략 핵심은 '원API'다. CPU⋅GPU⋅FPGA까지 인텔만의 기기 호환성을 강화해 다양한 고객군을 인텔 생태계에 묶어두려는 전략으로 풀이된다. 

인텔 XPU 전략은 고객 락인에 성공할 수 있을까. 서버용 GPU까지 손을 뻗은 인텔에게 엔비디아의 벽은 공고하다. 인텔은 이 싸움을 '장기전'으로 예상한다. 인텔의 XPU전략 핵심과 넘어야 할 산은 무엇인지 살펴봤다. 

 

인텔 전경./사진=인텔

더 추상화된 API제공 

인텔 원API(Application Programming Interface) 핵심은 이종(heterogeneous) 디바이스들을 하나의 매개체로 지원하는 것이다. 개발자들은 인텔의 원API 툴킷으로 공통의 프로그래밍 모델에 접근할 수 있다. 

API는 쉽게 말해 소프트웨어⋅하드웨어가 서로 호환돼 작업할 수 있도록 하는 연결고리다. 인텔의 x86이 CPU(중앙처리장치)만을 위한 ISA(명령어 세트)였다면, GPU(그래픽처리장치)⋅FPGA(프로그래머블 반도체)는 이보다 추상화된 형태의 각각의 API를 필요로 한다. 'OpenCL'⋅ 'OpenGL'의 등장 이유다. 

OpenGL(Open Graphics Library)이 GPU에 대한 API라면 OpenCL(Open Computing Language)은 GPU병렬 프로그래밍 언어다. CPU⋅GPU의 이종 플랫폼에서 실행되는 프로그램 작성을 가능케 하는 것으로 업계 표준으로 제정돼 있다.

 

OpenCL 프레임워크 관련 설명./자료=AMD 

원API는 여기서 추상화 수준을 한 단계 더 높였다. CPU⋅GPU⋅FPGA 등 각기 다른 플랫폼에서 나오는 데이터들을 이용 가능하게 호환해 주는 것이다. 장점은 명확하다. 개발이 쉬워지는 것이다. CPU⋅GPU 소스코드가 다르다면 개발자는 GPU에 맞는 코드로 다시 프로그램을 짜야 한다. 인텔 x86 아키텍처와 연계한 GPU코드가 제공된다면 개발 시간⋅비용을 줄일 수 있다.

박민진 인텔 상무는 "독점 벤더별 솔루션보다 더 빠른 컴퓨팅 구현이 가능하다"며 "개발자 입장에서 보면 CPU⋅GPU 등 각각 디바이스에 맞는 API를 가지고 개발해야 한다. 원 API는 인텔 제품에 대해서는 개발 기반을 동일하게 주는 것"이라고 설명했다. 

한 GPU IP업체 CTO도 "데이터 포맷을 더 추상화된 수준에서 C⋅C+로 정의하는 것"이라며 "같은 형식으로 데이터가 정의되고 나뉜다면 각각 다른 디바이스들을 불러내는 데이터 형식을 바꿔서 사용하지 않아도 될 것"이라고 말했다. 

자원의 효율적 사용도 가능하다. CPU 구동모드, GPU 구동모드, CPU⋅GPU 구동모드를 한 프로그램에서 쓴다면 필요에 따라 프로세싱을 최적화해 제공할 수 있다는 것이 인텔 측 설명이다. 

 

인텔 원API 소프트웨어 스택./자료=인텔
인텔 원API 소프트웨어 스택./자료=인텔

복수의 CPU⋅GPU로 구성된 칩을 가정한다면 개발자는 가진 자원을 최대한 효율적으로 쓰도록 CPU⋅GPU를 선택한다. 그런데 이때 개발자가 GPU가 더 효율적이라고 판단했지만 실제로는 CPU를 더 많이 구동하는 게 효율적인 판단이었을 수 있다. 만약 한 프로그램 내에서 쓴다면 GPU에 더 적합하거나 CPU에 더 적합한 프로그램을 최적화해 구동할 수 있다는 것이다. 

한 시스템 반도체 스타트업 대표는 "인텔 전략은 알고리즘 프로그램은 하나를 썼는데  CPU에 적합하다면 CPU에 돌리고, GPU에 맞으면 GPU에 최적화해 구동하겠다는 것"이라며  "하드웨어를 잘 아는 플랫폼 쪽에서 한 프로그램으로 적재적소에 리소스를 배치한다면 프로세싱 효율이 높아질 것이라는 구상으로 보인다"고 분석했다. 

락인 전략은 성공할 수 있을까

문제는 원API 전략 유인이 크지 않을 수 있다는 것이다. 

엔비디아를 오랜 기간 사용한 이들에게 원API 전략은 그리 새롭지 않을 수 있다. 이미 엔비디아 쿠다(CUDA)를 활용했던 사용자들에게 GPU⋅CPU 이종 디바이스 간 일종의 원API는 익숙한 개념이다. 

쿠다는 C언어 기반 엔비디아 GPU 병렬 프로그래밍 언어다. CPU로 짠 C프로그램을 GPU로 가속하는 것은 어렵지만, GPU 가속기 일부를 CPU로 돌리는 것은 상대적으로 쉽다. 

한 GPU IP 개발 업체 이사는 "CPU⋅GPU가 같이 돌아간다는 측면에서 이미 엔비디아 역시 좁은 범위의 원API를 구축했다"며 "인텔은 조금 더 넓은 범위에서 모든 애플리케이션을 원API로 통합하겠다는 구상이지만, 기존 엔비디아 사용자에게 큰 유인이 없을 수도 있다"고 말했다. 한 시스템 반도체 설계 스타트업 대표도 "엔비디아 GPU를 쓰던 사람에게 CPU⋅GPU간 호환은 이미 매우 쉽다. 거기다 언어도 익숙하다"며 "물론 XPU 전략의 범위가 더 넓다는 장점은 있을 것"이라고 전했다. 

 

CPU⋅GPU 아키텍처 비교./자료=엔비디아

인텔의 GPU 진입에 대한 의구심도 계속된다. 인텔은 AI 프로세서 경쟁에서는 GPU진영의 엔비디아에 밀리고, CPU 경쟁에서는 AMD에 밀리기 시작했다. 인텔이 10나노미터 공정에 머무는 사이 설계⋅생산을 분리한 AMD는 5나노 공정에 진입했다. 인텔은 외장형 GPU도 내놓으면서 GPU시장 영향력을 확대하겠다는 구상이다. 

그러나 성능⋅효율로 봤을 때 엔비디아와 동급 GPU를 금세 내놓을 수 있을 것인가에 대한 전망은 회의적이다. 순차 연산에 특화된 CPU는 다중 연산 능력에서는 GPU에 뒤처진다. 밀집된 수천 개 코어로 이뤄진 GPU는 수 개의 코어로 연산하는 CPU에 비해 숫자⋅알고리즘 처리에 월등한 성능을 보인다. 

그만큼 개발도 쉽지 않다. 특히 하드웨어 가속 레이트레이싱(Ray Tracing) 기능을 완전하게 지원할 정도 궤도에 오르는 것은 쉽지 않을 것이란 전망이다. 

 

엔비디아의 실시간 레이트레이싱 기술 데모./엔비디아 유튜브
엔비디아의 실시간 레이트레이싱 기술 데모./자료=엔비디아 유튜브

한 시스템 반도체 업체 CTO는 "엔비디아의 레이트레이싱은 모두 하드웨어 가속"이라며 "인텔이 AMD에 있던 인력을 상당 부분 영입해 GPU개발에 나서고 있는데 성능이 얼마나 나올지는 벤치마크 결과가 나와야 알 것"이라고 분석했다. 한 GPU IP업체 이사도 "레이트레이싱에 대응하려면 상당히 많은 하드웨어 가속이 필요하다"며 "GPU 진입보다 그런 부분을 어느 정도 성능으로 지원하는지가 관건이 될 것"이라고 밝혔다. 

인텔의 새로운 에코시스템이 개발자에게 익숙해지기까지도 시간이 걸릴 것으로 보인다. 우선 데이터 센터용으로 진입한 후 일반 사용자들에게 점점 확산되는 시나리오는 가능하다. 한 팹리스 업체 CTO는 "새 시스템이 개발자에게 받아들여지기까지 굉장히 오랜 시간이 걸릴 것"이라며 "다만 아마존처럼 하이퍼스케일 데이터센터들의 기술력은 높은 편이다. 다른 유인이 많다면 장시간에 걸쳐 접근할 수는 있을 것"이라고 말했다. 

박민진 인텔 상무는 "쿠다 역시 처음에 개발자들이 익숙해지는 시간이 필요했듯이 프로그램을 새로 배우고, 에코시스템이 정착되는 기간이 필요한 것은 맞다"면서도 "장기전으로 본다. 시스템 구성⋅운영이 편하다는 점에서 시간이 걸리더라도 개발자로서 효용이 분명히 있을 것"이라고 밝혔다. 

 

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지