1%신호만 분석해 90% 이상 정확도 유지
하드웨어 에뮬레이터 파워모델 통합 계획
GPU 최적화로 평균파워 22.7% 감소

지난 2015년 삼성전자 무선사업부는 ‘갤럭시S6’용 AP(애플리케이션프로세서)로 퀄컴 스냅드래곤이 아닌 시스템LSI의 엑시노스를 선택했다. 스냅드래곤 810 시리즈 발열 논란 때문이다. 발열은 스냅드래곤의 성능을 절반 수준으로 끌어내렸다. 

전력소모량은 칩의 성능⋅내구성과 직결된다. 저전력으로 설계됐더라도 실제 공정에서 어긋나는 요소들이 생긴다면 성능은 설계된 대로 구현될 수 없다. 

자율주행 시뮬레이션 관련 사진./사진=게티이미지뱅크
자율주행 시뮬레이션 관련 사진./사진=게티이미지뱅크

전력분석으로 성능을 최적화하는 일의 중요성은 5G⋅전장⋅사물인터넷(IoT) 전반에서 높아졌지만 현실화는 어려웠다. 시간도 오래 걸리고, 정확도가 낮았기 때문이다. 고속전력분석으로 반도체 성능 최적화에 나선 국내 스타트업 이준환 바움 대표를 만나 이야기를 나눴다. 

1%신호만 분석해 90%이상 정확도 유지

전력분석은 시뮬레이션 시간과 전력계산 시간을 더해 이뤄진다. 시뮬레이션은 시나리오에 따른 스윗칭(switching) 정보를 추출하는 것을 의미한다. 0⋅1로 이뤄지는 디지털 신호 변환 때마다 소모하는 에너지를 계산해 특정 시나리오마다 전력을 얼마나 소모하는지를 계산하는 것이다.

시뮬레이션 방법에는 게이트 레벨⋅ RTL(Register Transfer Level)⋅ESL(Electric System Level) 시뮬레이션과 하드웨어 에뮬레이션(Hardware emulation)이 있다.

정확도는 게이트 레벨이 가장 높다. 게이트 내 작고 세부적인 것까지 보는 시그널들이 많기 때문이다. 문제는 시간이 너무 많이 걸린다는 것이다. 

/자료=바움
/자료=바움

이준환 바움 대표는 “'클럭(Clock)'이 한 번 바뀔 때마다 신호가 수십 번에서 수백 번까지 바뀐다”며 “평균 10번씩 뛴다고 가정하면 10의 10승번 뛰는 데 기존에는 그 모든 신호를 다 분석했기 때문에 전력 분석에 수년이 걸렸다”고 말했다. 실제 테스트용 시나리오로 게이트레벨 전력 분석 시 2.7년이 걸렸다. 속도는 하드웨어 에뮬레이터가 가장 빠르다. 에뮬레이터는 설계한 것을 그대로 보는 것이 아닌, FPGA용으로 바꾸는 것이다. 속도는 빠르지만 칩에서 동작하는 것과 다르기 때문에 내부 스위칭 정보를 정확하게 뽑아낼 수 없다. 기존 전력분석의 한계다.

물론 시간당 파워가 아닌 평균파워를 본다면 어느 정도 문제가 해결된다. 그러나 평균파워는 프로세서 성능 최적화를 위해 사용자에게 주는 정보가 거의 없다. 이준환 대표는 “시간당 파워분석을 통해 파워그래프를 그려야 최적화를 위한 정보를 얻을 수 있는데 이건 수년이 걸린다”며 “대안으로 평균파워를 분석해도 이마저 수개월이 걸리고, 정보 정확성도 낮아 전력분석을 안 하게 된 상황”이라고 강조했다. 

바움의 전력분석솔루션은 게이트 레벨의 정확도는 유지하면서도 하드웨어 에뮬레이터를 이용해 전력분석 속도는 높였다. 자사 반도체 전력분석 솔루션 '파워바움'을 이용해 전력 모델 생성 속도와 정확도를 높인 것이다. 게이트 레벨 대비 1000배 이상까지 고속분석이 가능하다. 

삼성전자 시스템반도체의 브랜드 '엑시노스'./삼성전자
삼성전자 스마트폰용 AP '엑시노스'./사진=삼성전자

전체 신호가 아닌 1% 내외의 신호만 보기 때문에 가능했다. 시뮬레이션 속도는 높이면서 90% 이상의 정확도를 유지한다. 일부 신호만 보기 때문에 디버깅 과정에서 속도가 느려지는 현상도 최소화할 수 있다. 디버깅은 프로그래밍에서 잘못된 부분을 찾아 고치는 것을 말한다. 하드웨어 성능은 칩 안보다 칩 간이 느리고, 보드 간 등 거리가 멀어질수록 느려진다. 잘못된 부분을 꺼내서 확인하는 디버깅 데이터 생성 과정에서 속도는 느려질 수밖에 없다.

이 대표는 “시스템에 문제가 생기면 서버를 꺼내서 정보를 봐야 하는데 I/O인터페이스를 통과하는 순간 속도가 느려진다”며 “하지만 1% 신호만 보기 때문에 이것 역시 100분의 1로 줄일 수 있다”고 설명했다.   

GPU최적화로 평균파워 22.7% 감소

목적은 칩 구동 최적화다. 반도체 전 분야에서 반도체의 전력 소모와 열 처리 문제가 중요해지고 있다. 특히 전력소모가 중요한 자동차⋅사물인터넷⋅모바일 서버 등에서 활용도가 높을 것으로 전망된다. 

실제 바움은 전력분석솔루션으로 한 글로벌 업체 GPU를 안정적인 상태로 최적화할 수 있었다. GPU로 게임 구동을 가정한다면 대기 시 전력과 게임이 끝난 후 전력소모량이 같아야 한다. 대기구간의 파워가 그대로 유지되지 않고 전력을 많이 소모한다면 전체 전력에 큰 영향을 미친다. 

이 대표는 “실제 한 글로벌 업체 GPU 시나리오를 돌린 후 평균파워를 22.7% 줄일 수 있었다”며 “게임 전 전력 대기 구간에서 20mw에서 게임 플레이가 끝난 후 38mw로 올라가는 것을 확인했다. 평균파워만 봤을 때는 확인할 수 없는 것을 파워그래프를 그려 확인 후 최적화했다”고 말했다. 

글로벌 업체 GPU 전력분석 및 최적화 관련./자료=바움

바움은 반도체 전력분석 솔루션 기업으로 2013년 11월 설립됐다. 최근 한 국내반도체 대기업과 구매계약을 체결했으며, 퓨리오사AI⋅파두 등 국내외 업체와 구매계약 체결을 완료했다. 올해 안으로 하드웨어 에뮬레이터를 파워모델에 통합하는 것을 계획하고 있다. FSDB 파일들을 뽑는 과정에서 오버헤드를 없애고, 궁극적으로 파워모델 속도를 에뮬레이터만큼 높이기 위함이다. 

이 대표는 "EDA산업 전체 파이는 전 세계 10조원 정도에 불과하지만 내용적으로는 굉장히 중요한 기술"이라며 "EDA가 없다면 아무리 설계를 잘해도 결국 칩 제작까지 갈 수가 없다. 계속해서 국제관계 변화가 진행되고 있기 때문에 우리 역시 핵심 기술력 확보에 나서야 할 것"이라고 강조했다. 

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지