여분 코어 집어넣고, 자가 치유 기능 넣고, 예지보전 기능까지 도입
차량용 및 서버 반도체 수요 증가하면서 요구 수명 까다로워져

자동차, 산업 설비 등 수명이 긴 기기에 들어가는 논리 반도체 숫자가 늘어나면서 반도체 수명을 연장하기 위한 노력이 이어지고 있다.

인간이 조금 더 오래 살기 위해 의료 기술을 진보시켜온 것처럼 반도체도 수명을 늘리기 위해 여러 방법들이 고안돼왔다. 설계·공정에서 발생하는 결함을 찾고 이를 줄이기 위해 테스트 기술이 발전했으며, 메모리에는 오류보상코드(ECC)가 도입됐다. 

관건은 논리(Logic) 회로다. 메모리는 ECC가 오류를 치료해주는 역할을 하지만 논리 집적회로(IC)에는 아직 그런 기능이 없다. 테스트 또한 치료보다 예방에 초점을 맞추고 있는데다, 패키지 기술 발전조차 따라잡지 못하고 있는 상황이다.

 

갈수록 중요해지는 반도체 수명

반도체 수명곡선(Bathhub Curve). 반도체의 수명은 크게 ▲초기 불량기(DFR) ▲안정기간(CFR) ▲마모기간(IFR)의 세 단계로 나뉜다. /위키피디아
반도체 수명곡선(Bathhub Curve). 반도체의 수명은 크게 ▲초기 불량기(DFR) ▲안정기간(CFR) ▲마모기간(IFR)의 세 단계로 나뉜다. /위키피디아

반도체의 수명에 가장 직접적인 손상을 주는 건 열이다. 전류가 흘러 전구에서 빛과 열 에너지가 나오는 것처럼, 전자회로로 구성된 반도체도 전류가 흐르면 열이 발생한다. 열이 일정 정도 이상으로 올라가면 전압이 급격히 치솟고 이를 견디지 못한 반도체는 특성이 저하되거나 아예 회로가 끊어져버린다. 

제조사가 요구하는 반도체 요구 수명은 산업마다 다르지만, 대체적으로 점점 길어지고 있다. 모바일 기기용 반도체의 요구 수명은 기기 교체주기를 따라간다. 초기에는 2년이었지만 최근에는 4년까지 늘어났다. 

차량용 반도체의 요구 수명은 최소 10년으로, 우주 방사선으로 인한 소프트에러 등에 대한 추가 요구 사항을 만족해야한다. 여기에 언제 발생할지 모르는 불량에 대비, 보통 같은 기능을 하는 로직 반도체를 2개 넣는다. 서버용 반도체 요구 수명도 5~10년 사이인데, 서버의 경우 열에 취약하기 때문에 별도의 열 테스트를 통과한 제품만 쓰일 수 있다. 

하지만 로직 반도체는 불량을 잡아내는 테스트조차 어려워지고 있다. 팬아웃, 적층 패키지 등 첨단 후공정 기술의 일부는 한 번 패키지에 담고 나면 내부 결함을 검사하는 게 거의 불가능에 가깝기 때문이다. 

예를 들어 팬아웃 기술은 마더보드와 반도체를 금속 선(Wire)이나 범프(Bump) 대신 재배선층(RDL)으로 연결한다. 두께는 기존 패키지의 절반 수준으로까지 줄일 수 있고, 방열 특성도 강해지지만 한 번 칩을 패키지에 넣고 나면 마더보드에 붙이기 전까지는 결함을 찾아낼 수 없다.

 

수명을 늘리는 첫 번째 방법, 마진(Margin)을 남겨라

인피니언과 시높시스가 차세대 AI 기반 차량용 MCU 개발에 협력한다./인피니언

로직 반도체 수명을 늘리는 방법으로 가장 먼저 대두되는 건 로직 반도체에 여분의 코어(Core)를 넣는 것이다. 이 방법이 가장 선호되는 건 부품비용(BoM)을 줄여야하는 차량용 반도체다. 

차량용 반도체의 신뢰·안전성 최고 등급인 ASIL-D 등급은 문제가 생기더라도 반도체가 제 기능을 해야한다고 요구한다. 

이를 충족하기 위해 보통은 ASIL-B 등급의 반도체 2개를 넣고, 만약 한 반도체에 문제가 생겨 동작이 중단되면 나머지 하나의 반도체가 해당 기능을 대신하게 한다. 하지만 ASIL-B 등급 반도체를 2개 쓴다 해도 하나의 반도체가 고장나고 다른 반도체가 그 역할을 대신하기까지 지연시간이 걸린다.

로직 반도체에 여분의 코어를 넣는 건 굳이 반도체를 두 개 쓸 필요 없이, 내부에 코어를 추가로 탑재해 칩 수명 기간 동안 필요할 때 켤 수 있도록 하는 방법이다. 이 방법을 활용하면 제조 후 하나 혹은 2개의 코어가 작동하지 않더라도 반도체 내 다른 코어가 이 역할을 대신할 수 있어 수율이 크게 올라간다.

향후 차량 내 전자 아키텍처가 점점 더 중앙집중화되면 이 방식은 추가 이점을 줄 수 있다. 현재는 차량 내 전자부품 아키텍처가 분산형이라 모든 반도체가 제대로 작동하는 지 살펴보고 문제가 생기면 다른 반도체로 대체하는 데 지연시간이 걸린다. 

 

▲자동차에서 라이다(LiDAR)는 전방에 있는 사물의 위치와 형태, 이동방향, 속도 등을 측정한다./VIAVI Solution

하지만 이 방식을 활용하면 한 번 시동을 껐다 켤 때마다 중앙에서 모든 반도체에 대한 점검을 하고 문제가 있는 반도체는 여분의 코어를 동작시킬 수 있다.

반도체 신뢰성 검사 업체 CRT 관계자는 “승용차의 경우 주행시간이 상대적으로 짧아 이 방식으로도 가능하지만, 주행시간이 긴 상용차나 미래 자율주행차의 경우 짧으면 12시간에서 길면 하루종일 주행하기 때문에 ASIL-B 등급 2개로는 쉽지 않다”고 말했다.

 

두 번째 방법, 자체 치유 기능을 넣어라

학계에서는 로직 반도체 내에 자체적으로 문제가 발생하면 이를 치유할 수 있는 기능을 넣는 방안을 가장 활발히 연구개발(R&D) 중이다. 일부 소자 업체들도 선행연구 단계에서 이를 개발하고 있는 것으로 알려졌다.

한국과학기술원(KAIST)과 미항공우주국(NASA)은 열을 활용했다. KAIST와 NASA는 지난 2016년 차세대 항성간 탐사를 위한 ‘자체복구 가능형 반도체 회로’를 개발했다. 이들이 개발한 반도체는 게이트 회로에 나노 와이어를 활용한다. 우주 방사선에 의해 회로가 끊어지면 트랜지스터가 전류를 누설하게 되고, 이 열로 다시 나노 와이어가 결합되는 형태다. 

 

한국과학기술원(KAIST)과 미항공우주국(NASA)은 지난 2016년 차세대 항성간 탐사를 위한 ‘자체복구 가능형 반도체 회로’를 개발했다./KAIST

탄소나노튜브(CNT)를 마치 붕대처럼 활용해 전기가 계속 흐를 수 있도록 하는 것도 연구 중이다. 이때 CNT는 고분자 소재의 작은 캡슐 안에 들어가있다가 회로 등에 균열이 생기면 터져나와 주변을 감싸고 스스로가 마치 회로 같은 기능을 한다.

물론 나노 와이어나 CNT 모두 상용화되기엔 이르다. 같은 기능을 하는 반도체보다 재료 혹은 공정 비용이 더 들어가기 때문에 배보다 배꼽이 크기 때문이다. 하지만 로직 반도체 공정이 5나노까지 내려가면서 칩 제조비용이 기하급수적으로 증가한터라 상용화 가능성이 아예 없는 건 아니다.

학계 관계자는 “CNT보다는 열을 활용한 나노와이어 쪽 기술 개발이 더 활발하다”며 “메모리에 오류를 찾아내 보상하는 ECC 기능이 들어가있듯 로직에서도 문제를 발견하고 치유하는 기술 개발이 한창”이라고 말했다.

 

세 번째 방법, 더 세밀하게 들여다보기

반도체 이미지./NI

고장을 예측하고 모델링하는 테스트 기법을 다각화하려는 움직임도 있다. 가장 좋은 방법은 사전에 문제가 될 수 있는 원인을 찾아 빠르게 적절한 조치를 취하는 것이기 때문이다.

현재도 일부 신뢰성 업체들은 소자 업체의 요청에 따라 고전압·고압력·고습도 등 높은 스트레스 조건에서 칩을 테스트해 고장 요건을 점검하고 수명곡선에 맞출 수 있도록 컨설팅 서비스를 하고 있다.

그럼에도 아키텍처가 복잡하면 고장 요건을 찾아내는 것조차 어려울 수 있다. 제조사들이 제조 공정의 다양한 단계에서 보다 효과적인 테스트 기법과 회로 분석 기법 등을 적용하는 건 이 때문이다.

업계 관계자는 “예전에는 공정에서 테스트 담당자가 할 일이 많지 않았지만 최근 미세 공정에서는 어떤 공정이든 문제가 발생하면 전부 테스트 엔지니어들이 도맡기 때문에 입지가 더 커지고 있다”고 말했다.

칩 내부에 오류 체크 기능(온칩 모니터링)을 넣는 것도 일반화되고 있다. 온칩 모니터링 기능이 있으면 실시간으로 열화를 감지, 조치를 취할 수 있다. 이 데이터는 또다시 테스트 기법을 강화하는 데 도움이 된다.

QRT 관계자는 “현장에서 고장이 나면 전압 불안정, 전원 공급 문제, 오버클럭 등 성능 저하의 원인을 파악할 수 있고 이 정보를 테스트 데이터와 매칭, 다른 칩과 어떤 공통점이 있는지 파악할 수 있다”며 “무선통신(RF) 반도체처럼 극한 환경에서 사용해야하는 반도체의 경우 주기적으로 이같은 데이터를 모으기도 한다”고 말했다.

저작권자 © KIPOST(키포스트) 무단전재 및 재배포 금지