과기부⋅산자부로부터 161억원 규모 수주
AI 분야 '핫 이슈' 벡터 데이터베이스 기술 전문
창업 2년차 스타트업이 LLM(대형언어모델) ‘할루시네이션(환각, AI가 잘못된 정보를 사실처럼 출력하는 현상)’을 줄여주는 ‘벡터 데이터베이스' 기술로 대규모 국책과제를 수주했다.
AI 스타트업 디노티시아는 과학기술정보통신부⋅산업통상자원부로부터 총 161억원 규모의 국책과제를 수주했다고 10일 밝혔다. 과기부는 ‘초거대 AI모델의 장기 기억 저장을 위한 벡터 DB개발(4년 88억원)', 산자부는 ‘거대언어모델을 위한 벡터데이터베이스 가속기 개발(3년 73억원)' 과제를 각각 디노티시아에 발주했다.
두 과제 모두 벡터 데이터베이스를 통해 AI 기술을 업그레이드하는데 방점이 찍혔다. 벡터 데이터베이스는 기존에 ‘열'과 ‘행'으로 변형돼 저장되던 데이터를 ‘벡터'값으로 저장하는 기술을 뜻한다. 유사한 의미를 갖는 데이터를 공간상에 가로⋅세로⋅높이 등으로 치환해 저장하는 것이다. 이때 다른 두 데이터의 벡터값 차이를 통해 유사성을 판단할 수 있다.
이를 활용하면 이미지 검색, 추천 시스템, 의료⋅바이오사이언스 등 유사성을 바탕으로 작업을 수행하는 애플리케이션 활용도를 높일 수 있다. LLM 학습에 이용하는 데이터들이 대체로 정형화 되어 있지 않다는 점에서 AI의 정확성을 한층 높일 수 있는 기술로 평가된다.
특히 모델의 학습이 끝나면 다시금 새로운 데이터를 학습시키는 게 어려운 기존 AI 기술과 달리, 벡터 데이터베이스는 계속해서 새로운 데이터를 학습시킬 수 있다. 예컨대 과학 분야에서 새로운 발견이 나타나거나 역사적인 새로운 사실이 드러 났을때, 신규 데이터들을 모델에 학습시킬 수 있다. 덕분에 AI의 고질적 문제인 할루시네이션을 최소화 할 수 있다.
디노티시아의 과기부 과제에는 데이터베이스 시스템 학계에서 권위가 높은 서울대학교 이상원⋅도재영 교수팀, 그래프 데이터베이스 분야 권위자인 한욱신 포항공과대학교 교수 연구팀이 참여한다. 또 하드웨어 및 소프트웨어 수직최적화 관련 연구실적을 보유한 성균관대학교 조형민⋅이성길 교수팀도 참여한다.
산자부 과제에서는 TSMC 디자인하우스인 에이직랜드, 미국 UCSD 강민구 교수 연구팀, 이화여자대학교 김지훈 교수 연구팀, 경희대학교 최승규 교수 연구팀 등이 참여하기로 했다.
정무경 디노티시아 대표는 “이번에 선정된 두 과제를 통해 벡터 데이터베이스 소프트웨어 기술과 전용 하드웨어 가속기 개발을 동시에 추진할 것"이라며 “세계 최고 벡터 데이터베이스 회사로 자리매김하겠다”고 말했다.
한편 디노티시아는 사피온코리아 CTO(최고기술책임자) 출신인 정무경 대표가 지난해 10월 설립한 AI 전문 스타트업이다. 고성능 벡터 데이터베이스와 LLM을 위한 최적화된 서비스 시스템을 개발하고, 최적 AI서비스를 위한 ▲SLM(Small Language Model) 및 생성형 인공지능에 필수적인 ▲RAG (Retrieval-Augmented Generation) 시스템을 개발하고 있다.

