인공지능(AI) 전문 무하유(대표 신동호)는 난해한 법률 용어를 대화형 문답으로 설명할 수 있는 '국회도서관 융복합서비스 데이터셋 구축 사업'을 완료했다고 15일 밝혔다.
국회도서관에서 제공 중인 AI 의정 분석 서비스 '아르고스'에 법률 관련 Q&A 데이터셋을 구축, 국회 및 공공 관련 법규 등 법률 관련 질의사항에 대화형 문답 시스템을 적용해 이용자 편의성을 높였다는 설명이다.
특히 법률 지식을 보유한 전문가를 포함해 데이터셋 구축인력을 구성했다. 법률 관련 이슈 키워드와 제개정일, 의안, 회의록, 주요 사건과 인물 정보는 물론 통계 표의 제목 및 매칭 키워드 등 광범위 영역을 포함했다. 이를 통해 고품질 데이터셋 구축을 완료할 수 있었다고 전했다.
HWP와 PDF 파일 내 법률 관련 통계 표나 이미지의 제목 및 매칭 키워드 데이터도 구축했다. 무하유 표절검사 서비스 내에 적용된 이미지 인식 및 추출 기술을 활용해 자동으로 해당 데이터를 추출, 다차원의 품질 검수를 실시했다.
데이터 관리 올인원 플랫폼인 ‘데이터 팩토리(DF)’를 활용해 데이터셋 구축에 효율을 높였다고 전했다. 필요 데이터를 자체적으로 구축한 후 정제 및 가공하기 때문에 인력소싱, 계약, 데이터 구축, 품질관리, 저작권 관리까지 가능하다는 장점이 있다는 설명이다.
AI 학습데이터에 대한 저작권 및 소유권 우려도 해결했다고 밝혔다. DF는 작업자별 품질 관리가 가능하고, 저작권 관계를 명확히 할 수 있어 법적 분쟁 요소나 품질 저하의 최소화가 가능하다고 전했다.
신동호 무하유 대표는 "기술로 공정의 효율화를 높이고, 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다"라며 "앞으로도 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것"이라고 말했다.
> 기사 원문 읽기 https://www.aitimes.com/news/articleView.html?idxno=157191
인공지능(AI) 전문 무하유(대표 신동호)는 난해한 법률 용어를 대화형 문답으로 설명할 수 있는 '국회도서관 융복합서비스 데이터셋 구축 사업'을 완료했다고 15일 밝혔다.
국회도서관에서 제공 중인 AI 의정 분석 서비스 '아르고스'에 법률 관련 Q&A 데이터셋을 구축, 국회 및 공공 관련 법규 등 법률 관련 질의사항에 대화형 문답 시스템을 적용해 이용자 편의성을 높였다는 설명이다.
특히 법률 지식을 보유한 전문가를 포함해 데이터셋 구축인력을 구성했다. 법률 관련 이슈 키워드와 제개정일, 의안, 회의록, 주요 사건과 인물 정보는 물론 통계 표의 제목 및 매칭 키워드 등 광범위 영역을 포함했다. 이를 통해 고품질 데이터셋 구축을 완료할 수 있었다고 전했다.
HWP와 PDF 파일 내 법률 관련 통계 표나 이미지의 제목 및 매칭 키워드 데이터도 구축했다. 무하유 표절검사 서비스 내에 적용된 이미지 인식 및 추출 기술을 활용해 자동으로 해당 데이터를 추출, 다차원의 품질 검수를 실시했다.
데이터 관리 올인원 플랫폼인 ‘데이터 팩토리(DF)’를 활용해 데이터셋 구축에 효율을 높였다고 전했다. 필요 데이터를 자체적으로 구축한 후 정제 및 가공하기 때문에 인력소싱, 계약, 데이터 구축, 품질관리, 저작권 관리까지 가능하다는 장점이 있다는 설명이다.
AI 학습데이터에 대한 저작권 및 소유권 우려도 해결했다고 밝혔다. DF는 작업자별 품질 관리가 가능하고, 저작권 관계를 명확히 할 수 있어 법적 분쟁 요소나 품질 저하의 최소화가 가능하다고 전했다.
신동호 무하유 대표는 "기술로 공정의 효율화를 높이고, 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다"라며 "앞으로도 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것"이라고 말했다.
> 기사 원문 읽기 https://www.aitimes.com/news/articleView.html?idxno=157191