국회도서관 융복합서비스 데이터셋 구축사업

국가통계포털 통계표에 출현되는 전문용어와 뉴스기사 내 일반용어간 매핑데이터를 구축했습니다. 미디어 및 저널리즘의 분야에서 사용자 친화적인 데이터를 구축하는데 활용할 수 있습니다.


Data 종류
통계일반용어 데이터셋
수량
5,000건
Client
국회도서관
유형텍스트 데이터
소개
국가통계포털 통계표 출현 전문용어와 뉴스기사 출현 일반용어간 매핑데이터 구축
구축목적
뉴스기사 출현 주요 키워드에 대한 연관 통계 검색 – 표출 재현율 제고를 통한 정보 접근성 개선
특징
  • 문서 전처리 기술
  • 텍스트 데이터 라벨링
제작기간
2023/06~2023/11



자연어 처리용 학습 데이터셋 제작 문의





데이터셋 제작 문의