무하유 보도자료

무하유의 서비스와 기술에 대해 궁금하신 사항이 있으신 경우
문의 내용을 작성하시면 빠른 시일 내에 답변드릴 수 있도록 하겠습니다.

[인터뷰] 신동호 무하유 대표 “AI 기술로 생성 AI 부작용 예방”

챗GPT 같은 생성 AI에 관심이 커지는 가운데 부작용 우려도 함꼐 늘고 있다. 생성 AI 기술이 발전할수록 사람이 직접 창작한 것과 결과물을 구분하기 어려워서다. 미국 등 선거를 앞둔 국가에서는 생성 AI를 악용해 제작된 그럴듯한 가짜뉴스 우려도 커지고 있다.


무하유는 이런 상황에서 논문에 챗GPT가 쓴 문장을 찾아내는 ‘GPT킬러’ 솔루션을 개발했다. AI 기술로 생성 AI 부작용을 예방하기 위해서다. GPT킬러는 콘텐츠를 AI로 분석해 생성 AI가 만든 것인지를 역으로 검증한다.


무하유는 2011년 신동호 대표가 설립한 실용 AI 솔루션 기업이다. 무하유는 보유한 자연어 처리 AI 기술을 바탕으로 2011년부터 논문 표절 검사 솔루션 ‘카피킬러’를 서비스하고 있다. IT조선은 신동호 무하유 대표와 AI가 생성한 콘텐츠 역검증에 대해 이야기를 나눴다.


세계 전역에서 생성 AI 콘텐츠 저작권·신뢰성 우려


생성 AI를 두고 부작용 우려가 나오는 이유는 AI가 사람이 직접 하는 단순 반복 작업을 넘어 글을 써주거나 그림(이미지)를 만들고 영상까지 활용되기 때문이다.


생성 AI 콘텐츠는 AI가 얼굴과 목소리까지 합성할 수 있게 되면서 가짜뉴스나 명예훼손에 관한 지적이 제기된다. AI를 이용해 실존 인물의 외모를 합성하는 딥페이크 기술을 악용하면 실제 인물이 하지 않은 행동을 마치 한 것처럼 만들 수 있다. 현재 기술로도 평범한 사진을 이미지 생성 AI에 학습시키면 수 시간 만에 AI가 딥페이크 이미지를 만들어 낼 수 있다.


특히 한국과 미국 등 선거를 앞둔 국가는 민감하게 반응할 수밖에 없다. 생성 AI로 만든 거짓 정보가 유포되면 사실 여부를 검증하는 것뿐 아니라 해명도 어렵기 때문이다. 딥페이크까지 악용하면 상황은 더욱 악화된다. 가짜뉴스의 대상이 된 이는 하지 않은 일을 하지 않았다고 해명해야 하기 때문이다.


실제 최근 프랑스 축구선수 킬리안 음바페가 이강인 선수 이적설에 관해 입장을 밝히는 유튜브 영상이 AI로 만든 거짓 정보로 밝혀졌다. 해당 영상의 조회수는 1100만회를 넘겼다.


한국 국회는 이 같은 생성 AI 부작용을 줄이기 위해 ‘AI 제작 표기 의무화법’을 발의했다. 이상헌 국회 문화체육관광위원회 소속 의원(더불어민주당)이 5월 22일 대표발의한 콘텐츠산업 진흥법 개정안이다. 법안은 AI로 콘텐츠를 만들면 이를 AI가 제작한 콘텐츠라는 사실 표기 의무를 부과했다. 해외에서도 생성 AI 부작용을 우려해 관련 법안이 나오고 있다. 유럽연합(EU)은 6월 14일(현지시각) 본회의에서 AI 제작 시 출처 표기를 의무화하는 법안을 통과시켰다.


문제는 AI를 사용했는데 표기하지 않았을 때 AI가 만든 콘텐츠라는 것을 검증할 수단이 마땅치 않다는 것이다. 세계 전역에서 생성 AI의 부작용을 우려하고 관련 규제를 도입하고 있지만 빈틈이 존재하는 셈이다. AI가 정교해질수록 육안으로 구분하기 어려워서다.


에릭 슈밋 전 구글 CEO는 6월 26일(현지시각) 미 경제매체 CNBC에 "SNS 기업이 많은 이가 AI로 만든 거짓 정보를 접하는 것을 막지 않고 있어 2024년 미국 대통령선거가 혼탁해질 것이다"라며 "SNS 기업은 AI의 거짓 정보를 걸러내는 방안을 연구하고 있지만 아직 해결하지 못했다"고 밝혔다.


무하유 GPT킬러, 생성 AI의 고유 특성 탐지


무하유의 고객사도 생성 AI 부작용을 우려해왔다. 무하유가 고객사 담당자 9328명을 대상으로 챗GPT 탐지 프로그램이 필요한지 조사한 결과 79.7%가 그렇다고 답변했다. 신동호 대표와 무하유가 GPT킬러를 개발한 배경이다. GPT킬러는 생성 AI 사용 여부를 검증하는 국내 최초의 디텍트GPT 솔루션이다. 무하유가 AI를 활용한 텍스트 분석 솔루션을 장기간 운영하며 쌓인 노하우가 활용됐다.


GPT킬러는 현재 챗GPT에 한해 적용된다. 챗GPT가 글로벌 생성 AI 경쟁을 주도한 만큼 챗GPT 사용량이 많아서다. GPT킬러는 문장 형태의 줄글(텍스트)을 한국어 이해모델을 학습한 AI가 문단 단위로 분석해 해당 문장을 생성 AI가 작성했을 확률을 도출한다. 신 대표는 다른 디텍트GPT 솔루션은 영어에 특화돼 있지만 GPT킬러는 한국어를 학습해 한글 문장을 분석했을 때 결과의 정확도가 다른 솔루션보다 월등히 높다고 강조한다.


신동호 대표는 "생성 AI가 작성한 문장은 AI가 학습한 데이터의 평균값으로 수렴하는 특징이 나타난다"며 "길이가 짧은 문장은 정확하게 구분하기 어렵지만 문장의 길이가 길수록 AI가 작성한 문장인지 더 정확하게 탐지할 수 있다"고 말했다.


그는 이어 "생성 AI는 확률적으로 자주 사용하는 단어, 출현 빈도, 맥락의 일관성 등에 학습 데이터 영향을 받는다"며 "문장 길이가 짧으면 이런 요소가 줄어들기 때문에 상대적으로 정확도가 낮아질 수 있다"고 덧붙였다.


"이미지·오디오·비디오 등도 역검증 가능"


신동호 대표는 생성 AI가 발전한다는 것은 사람의 창작과 다른 특성을 갖게 된다는 의미라고 설명한다. 텍스트를 예로 들면 생성 AI가 발전하기 위해 더 많은 데이터를 학습할수록 사람이 직접 쓴 글과 다른 특성이 발현된다는 것이다.


그는 이 같은 생성 AI의 구조를 파악하고 기술을 고도화하면 GPT킬러가 생성 AI 사용 여부를 탐지할 수 있다고 봤다. 그는 또 그림·소리·영상 등 다른 미디어 형태여도 콘텐츠를 보고 기술적으로 생성 AI가 사용됐는지 역검증이 가능할 것으로 봤다.


신 대표는 "예를 들어 생성 AI가 만든 이미지는 손가락 여섯 개처럼 실제 세상에서 어색한 결과물이 나올 가능성이 큰데 이런 점이 다 역검증이 가능한 단서로 작용한다"며 "다른 미디어에도 생성 AI 사용 여부를 탐지하는 솔루션이 나올 수 있다고 본다"고 말했다.


기사 원문 > https://it.chosun.com/site/data/html_dir/2023/07/06/2023070602015.html