Home chevron_right Ai chevron_right Article

AI 학습용 데이터 100종, 정부와 공공기관이 전수조사 후 공개한다!

과학기술정보통신부가 한국지능정보사회진흥원(NIA)와 범부처 현황조사 '인공지능(AI) 학습용 데이터 현황조사'를 실시한다. 각 부처·공공기관이 보유한 AI 학습용 데이터 현황을 체계적으로 파악하고, AI 활용이 가능한 고품질 데이터 확보 기반을 마련하기 위한 'AI 학

이정원기자

Apr 10, 2026 • 1 min read

과학기술정보통신부는 한국지능정보사회진흥원(NIA)과 함께 다양한 부처와 공공기관이 소유한 AI 학습용 데이터를 체계적으로 조사하는 '인공지능(AI) 학습용 데이터 현황조사'를 진행할 예정이다. 이 프로젝트는 AI 활용을 위한 고품질 데이터를 확보하기 위한 기반을 마련하고자 하는 것이다.

현재 공공기관이 보유한 AI 학습용 데이터는 각기 분산되어 관리되고 있어 종합적인 파악이 어렵고, AI기업들이 이를 활용하는 데 제한이 있습니다. 따라서 과기정통부는 AI기본법 제15조에 따라 AI 학습용 데이터 관련 정책을 수립하기 위해 부처 대상으로 첫 전수조사를 실시하기로 결정했습니다.

이번 조사를 통해 각 기관이 보유한 AI 학습용 데이터를 진단하고, AI 학습에 활용 가능한 데이터 100종을 발굴하여 60억원 규모의 'AI 학습용데이터 통합제공체계'를 구축할 계획입니다. 이 통합제공체계는 기존의 'AI허브'를 개편하여 공공 및 민간이 보유한 AI 학습용 데이터를 집적하고 누구나 쉽게 검색하고 활용할 수 있는 플랫폼으로 국가 차원에서 지원될 것입니다.

이번 센서스는 AI 학습용 데이터 뿐만 아니라 향후 가공이 가능한 데이터까지 조사할 예정이며, AI 학습에 활용 가능한 데이터 후보군을 도출하는 것이 목표입니다. 조사 항목은 AI 학습용 데이터의 유형, 구조, 목적 및 제공 가능 범위 등을 중심으로 구성되어 있으며, 표준화된 조사체계를 통해 일관성과 신뢰성을 확보할 계획입니다.

선정된 데이터 100종은 품질 개선과 비식별처리 등의 기술 및 재정적 지원을 받아 제공될 예정이며, 온라인 공개가 어려운 경우에는 '데이터 안심구역'을 통해 제공될 수도 있습니다. 김경만 과기정통부 인공지능정책실장은 AI 성능과 품질의 핵심은 활용 가능한 데이터에 있다고 강조하며, AI 학습용 데이터 통합 제공 기반을 계속 발전시켜 가겠다고 밝혔습니다.

#ai #data collection #artificial intelligence #technology #survey #government initiative

에이테크뉴스 이정원기자(ethegarden@nolm.kr)