중국 국가발전개혁위원회와 국가데이터국, 재정부, 인력자원사회보장부가 지난 13일 공동으로 '데이터 라벨링 산업의 고품질 발전 촉진에 관한 시행 의견'(이하 '의견')을 발표했다.
'데이터 라벨링'이란 텍스트, 오디오, 이미지, 동영상 등 다양한 데이터에 특정 정보로 표기되는 '라벨을 붙이는' 작업을 말한다. 이번에 발간된 문서는 처음 국가 차원에서 신흥 산업인 데이터 라벨링을 체계적으로 계획했다.
데이터 라벨링 산업의 육성 및 확장은 인공지능의 혁신과 발전을 촉진하는 데 중요한 지원 역할을 한다.
칭화(清華)대학 계산사회과학 및 국가관리실험실의 멍칭궈(孟慶國) 주임은 인터뷰에서 고품질 데이터 부족은 중국의 일부 대형 모델의 발전 과정에서 직면한 병목 현상이라고 말했다.
'의견'은 또한 괄목할 만한 성과와 독특한 특성을 가진 데이터 표시 기반을 구축하여 비교적 완전한 데이터 표시 산업 생태계를 형성할 것을 제안하였다. 현재 중국은 청두(成都), 선양(沈陽), 허페이(合肥), 창사(長沙)를 포함한 7개 도시에서 데이터 표시 기지 건설 임무를 수행하기로 결정했다.
'의견'은 13가지 구체적인 측면에서 데이터 라벨링 산업의 육성 및 확장을 포괄적으로 계획했으며 특히 수요 견인 및 혁신 주도를 강조했다.
수요 견인 심화 측면에서 '의견'은 처음으로 공공 데이터 라벨링 수요를 방출하고 법률 및 규정에 따라 공공 데이터 라벨링 및 개발과 활용을 순차적으로 촉진하며 현대 농업, 스마트 제조, 정보 서비스 등 핵심 분야에서 공공 데이터 라벨링 수요를 발굴할 것을 제안했다.
칭화대학 컴퓨터사회과학 및 국가관리실험실의 멍칭궈 주임은 중앙경제실무회의에서 '인공지능+' 행동을 제안했고, 각 지방에서도 정무 대형 모델 배치를 가속화하고 있다고 말했다.
멍칭궈 주임은 교통, 기상, 의료 등 민생 분야에서 대형 모델의 응용이 갈수록 많아질 것이며 공공 데이터에 기반한 라벨링 수요도 끊임없이 늘 것으로 내다봤다. 이어 그는 공공 데이터가 가치를 방출하게 하려면 방대한 공공 데이터를 라벨링하는 것이 핵심이라고 언급했다.
혁신 주도력을 높이는 측면에서 '의견'은 데이터 라벨링 표준을 개선하고 소프트웨어와 하드웨어를 통합하며 독립적으로 제어 가능한 데이터 라벨링 분야의 기술 및 핵심 장비의 연구 개발을 지원할 것을 강조했다.
또한 지원 시스템 최적화 측면에서 '의견'은 재정과 세수 및 금융 지원을 늘리고 데이터 라벨링 서비스가 정부 조달 범위에 포함되도록 촉진할 것을 지적했다. 동시에 데이터 라벨링 직업 시스템 구축을 촉진하고 산업 인재 지원을 강화한다는 방침이다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지