KT, 국가대표 데이터 산학연 협의체 ‘K 데이터 얼라이언스’ 결성
KT(대표 김영섭)는 16일 서울 송파구 소피텔 앰배서더 서울에서 ‘K 데이터 얼라이언스’ 협약식을 개최했다고 밝혔다. 한국적 AI 경쟁력의 핵심 자산이자 AI 모델 성능을 좌우하는 올바르고 신뢰할 수 있는 고품질 데이터 교류를 위해 한국 대표 기업과 공공, 학계가 공고한 협력을 추진하겠다는 취지다.
이날 KT를 비롯해 고려대학교 민족문화연구원, 두산디지털이노베이션, 아이스크림에듀, 중앙일보, 한국교육방송공사(EBS), 한글학회 등 총 7개 기관 관계자가 참석해 ‘K 데이터 얼라이언스’ 결성을 위한 협약을 맺었다. 이어 AI 데이터 생태계 구축에 대해 밀도 있게 논의하는 자리도 마련됐다.
특히 이 자리에서 KT는 K 데이터 얼라이언스의 주관사로서 한국적 AI 철학을 구현하기 위해 한국어 고유 표현과 사회·문화적 맥락, 사용자의 다양한 목적을 반영할 수 있는 고품질 데이터의 중요성을 강조했다. 또 각 분야에서 선도적 역할을 하고 있는 대표 기관들이 보유한 한국적 데이터를 공유하는 것이 어떤 의미와 가치가 있는지 역설했다.
K 데이터 얼라이언스 결성은 한국적 AI의 구현과 안전하고 가치있는 활용에서 나아가 협력과 개방을 통한 확산으로 함께 성장하고 발전하는 생태계를 조성해 글로벌 경쟁력을 갖추겠다는 공감대가 원동력이 됐다.
각 기관들은 앞으로 ▲한국적 AI를 위한 데이터 구축 ▲한국적 AI 관련 도메인 선도 사례 창출 ▲한국적 AI 관련 활동·성과에 대한 홍보 및 대외 확산 ▲한국적 AI 데이터에 기반한 인문·사회분야 연구를 위해 긴밀한 상호 협력을 이어갈 예정이다.
KT는 한국의 정신과 언어, 문화, 지식 등의 정체성을 담아 한국을 가장 잘 이해하고 안전하며 신뢰할 수 있는 ‘한국적 AI’를 개발해 대한민국의 산업과 일상 속 AI 대중화를 위해 앞장서고 있다. 이를 위해 최우선으로 올바르고 신뢰할 수 있는 데이터의 중요성을 강조하며 교육, 인문, 역사, 한국어, 언론 등 각 영역에서 대표 콘텐츠를 보유한 기업과 기관들이 K 데이터 얼라이언스로 결집할 수 있도록 주도했다.
KT는 각 기관이 보유한 콘텐츠들을 선별해 고품질 데이터로 가공하고, AI가 학습할 수 있는 형태로 구조화해 독자 개발 모델인 믿:음 2.0, 마이크로소프트 협력 기반 GPT 모델, 이외 오픈소스 모델 등의 한국적 AI 모델과 서비스로 연결한다.
특히 EBS가 보유한 검증된 학습·교양 콘텐츠와 함께 질문-답변 형태로 구조화된 피드백 기반 학습 데이터는 AI 모델의 핵심 기능인 추론 능력을 향상시킬 수 있는 최적화된 자원이다. 이는 한국어 사용자 특유의 질문 방식과 문맥을 이해하는 데 있어 매우 높은 가치를 지닌다.
정치·사회·문화 전반의 시대 흐름을 빠짐없이 기록해 온 언론 분야에서도 참여한다. 중앙일보의 뉴스 콘텐츠는 한국 사회를 입체적으로 반영하는 고유한 언어 자산으로 모델의 문맥 이해와 사실 기반 응답 생성에 있어 신뢰할 수 있는 학습 자원으로 평가된다.
앞으로 K 데이터 얼라이언스에 참여하는 각 기관들은 KT를 구심점으로 정기 협의체를 운영하고 추진 성과를 공유하며 한국적 AI 확산을 위한 신규 과제를 발굴하는 등 실행력과 결속력을 더한다. 또 참여기관의 지속적인 확장을 추진해 데이터-모델-서비스로 이어지는 정교한 한국적 AI 데이터 생태계를 구축해 나갈 방침이다.