AI 테크 기업 크라우드웍스가 데이터셋 공식 판매 채널을 오픈하고 법적 리스크가 없는 고품질 데이터셋 유통·판매 비즈니스를 본격화한다고 18일 밝혔다.
크라우드웍스가 공식 채널을 통해 유통하는 데이터셋은 라이선스를 확보한 산업 특화 데이터셋으로 ▲웍스원(WorksOne) ▲광고 분석 ▲건강검진 결과 ▲전문 지식 Q&A ▲기업 정보 ▲도서 ▲뉴스 기사 데이터셋 등으로 구성됐다.
이 데이터셋들은 저작권 침해와 개인정보보호 등 법적 리스크가 없다는 점에서 기업들이 활용하기 용이하다. AI가 아닌 검증된 전문가가 구축해 전문성과 신뢰성이 높은 것이 특징이다.
특히 ‘웍스원 데이터셋’은 기업에서 자주 사용하는 답변 형식 또는 기업이 선호하는 표현을 AI가 학습할 수 있도록 설계된 데이터셋으로 대기업에서 15년 이상 기획 업무를 수행한 베테랑 기획자들이 직접 구축했다.
‘광고 분석 데이터셋’은 국내 광고 1만여 건을 분석해 제작됐다. 광고 정보, 타깃, 목표, 카피 표현 방식, T&M 등 메타 데이터가 포함됐다.
이 외에도 240개 국가 3억 개 이상의 최신 기업 정보를 포함하는 ‘기업 정보 데이터셋’, 장르와 카테고리별로 구성된 ‘도서(e-book) 데이터셋’, 1만 5000여 건의 ‘건강검진 결과 데이터셋’, 5억 건 이상의 ‘뉴스 기사 데이터셋’, 16개 분야별 전문가가 생성한 ‘전문 지식 Q&A 데이터셋’ 등 다양한 데이터셋을 제공한다.
회사는 앞으로 데이터 유통 시장의 활성화를 위해 모빌리티, 테크, 법률, 교육, 미디어 등 다양한 특화 데이터 라인업을 확대할 계획이다.
김우승 크라우드웍스 대표이사는 “AI 프로젝트가 성공하려면 데이터의 양적 확대보다 품질에 집중해야 한다”며 “양질의 데이터가 부족한 상황에서 신뢰할 수 있는 데이터셋 공급을 통해 기업의 AI 프로젝트 성공을 돕고 건강한 AI 생태계를 만들어갈 것”이라고 밝혔다.
한편, 최근 AI 시장에서 데이터 라이선스와 투명성이 강조되고 있다. 유럽연합(EU)은 AI 기업들에게 학습 데이터 정보 공개를 의무화했고, 미국에서는 저작권 침해 소송이 증가하는 추세다.
2028년까지 연평균 21.5% 증가해 약 8조 원(57억 3000만 달러)에 이를 것으로 전망된다.
<파이낸스스코프 임영재 기자 withhy@finance-scope.com>
본 기사는 투자 참고용으로 이를 근거로 한 투자 손실에 대해 책임을 지지 않습니다.
해당 기사는 파이낸스스코프(http://www.finance-scope.com)가 제공한 것으로 저작권은 파이낸스스코프에 있습니다.
본 기사는 이데일리와 무관하며 이데일리의 논조 및 편집 방향과 다를 수 있습니다.
기사 내용 관련 문의는 파이낸스스코프로 하시기 바랍니다.