원스톱 데이터셋 제작 데이터 구축 사업

고객의 니즈에 따라 도메인에 특화된 경쟁력 있는 AI 학습용 데이터를 설계하여

컨설팅부터 운영관리까지 데이터 라이프사이클 전반을 책임지는 일원화된 서비스를 제공합니다. 

Data Tech 사업

데이터 제작에 특화된 전문가 조직과 관리 솔루션

‘데이터 팩토리’를 통해 고품질 데이터셋를 구축하세요. 

TEXT

데이터셋 

LLM(대용량 언어모델) 생성 텍스트 학습 데이터셋

채용 면접 질문 생성 학습 데이터셋

채용 면접 답변 요약 학습 데이터셋

채용 면접 답변 내용 감정 및 의도 판단 학습 데이터셋

학술 문헌 출처 영역 인식 학습 데이터셋

학술 문헌 출처 개체명 인식 학습 데이터셋

법률 및 경찰 매뉴얼 QA 학습 데이터셋 

활용분야


VISION

데이터셋

문서 내 표/이미지 개체명 인식 학습데이터

시선 분석 모듈용 학습 데이터

표정 분석 모듈용 학습 데이터

복장 분석 모듈용 학습 데이터

머리 움직임 분석 모듈용 학습 데이터 

활용분야


SOUND

(음성) 데이터셋

음성 표현력 판단 모듈용 학습 데이터

음성 유사도 판단 모듈용 학습 데이터

발화상태 불량(버벅임) 판단 모듈용 학습 데이터 

활용분야


Data TECH 레퍼런스

case 01. 국회도서관 융복합서비스 데이터셋 구축 사업

•국회도서관의 '인공지능 법률 Q&A' 서비스에서 자연어 질의응답 서비스를 실현하기 위한 질의 답변 등 데이터셋 구축

•법률에 해당하는 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보와 통계표의 제목 및 매칭 키워드 구축 

case 02. 과학기술정보통신부 채용면접 인터뷰 데이터 구축 사업 

•직업군별·성별·경력여부별·연령대별 데이터를 구축하고, 특히 감정을 12가지로 세분화해 분류하는데 성공

•7개 직군별 발화자의 의도를 분류해 답변을 요약하는 등 단순 음성 데이터를 넘어 채용 면접에 필요한 감정·의도·요약 학습 데이터 구축

•약 2200시간의 면접 영상 데이터 및 17만 건의 음성 데이터, 약 8만 4000건의 라벨링 데이터 확보 


무하유의 기술과
서비스에 대해 문의하세요