무하유 보도자료

무하유의 서비스와 기술에 대해 궁금하신 사항이 있으신 경우
문의 내용을 작성하시면 빠른 시일 내에 답변드릴 수 있도록 하겠습니다.

[폴인] AI가 쓴 글 100% 찾는다, 채용 바꾸는 무하유 AI 기술

고객을 게으르게 만들면 그 사업은 성공이에요.

한 번 게을러진 고객은 다시 부지런해지지 않거든요.

aebad178f7623.png

무하유 신동호 대표. ©폴인, 박일규


"서류전형 합격을 축하드립니다. 1차 면접 전형으로 AI 역량검사를 진행합니다."


AI 면접 도입 기업이 3년새 3배 이상 증가했어요. 입사 지원 서류는 떠도는 합격 자소서 또는 AI가 써준 글을 그대로 퍼오진 않았는지 AI로 확인하고요. 1차 역량 면접을 AI로 진행하는 거죠. 이들 기업의 공통점은 바로 무하유의 서비스를 이용한다는 겁니다.


무하유는 AI를 전공한 엔지니어 신동호 대표가 15년 전 창업한 회사예요. 표절 검사에 어려움을 겪던 교육 관계자의 말이 창업의 계기가 됐고요. 이후 자소서 검토에 어려움을 겪던 인사 담당자들의 고민을 해결하기 위해 HR 서비스까지 확장했죠. 그렇게 만든 서비스들이 지금 국내 채용 방식에 변화를 일으키고 있어요.


AI가 쓴 자소서를 가려내고, 사람의 역량을 검증하는 일까지. 무하유는 어떻게 이 문제를 풀어냈을까요. 국내 매출 100억을 넘기고, 이제 해외 시장을 바라보고 있는 신동호 대표를 직접 만났습니다.


AI가 쓴 자소서 100% 찾아낸다?

무하유가 AI 흔적 잡아내는 법


Q. AI가 쓴 글과 사람이 쓴 글, 완벽하게 구분할 수 있나요?


그럼요. 만약 자소서를 AI로 썼다면, 찾아내는 건 너무 쉽죠. 분량이 한 단락만 넘으면 거의 100% 확률로 '이건 AI가 쓴 글이다'라고 알 수 있거든요.


Q. 어떻게요?


생각보다 직관적인데요. 일종의 '필적 감정'이랑 비슷해요. 글의 내용이 아니라, 문체와 서술 방식의 특징을 보는 거예요. 사람도 자기만의 표현 습관이나 스타일이 있어서, 글만 보고도 누구의 글인지 짐작할 수 있잖아요.


AI도 그래요. ChatGPT, Gemini, Claude 같은 모델들은 각각 다른 데이터를 학습하다 보니, 고유의 문체와 패턴이 생기거든요. 어떤 문장은 특정 모델에서 자주 나오는 방식이고, 또 어떤 표현은 다른 모델의 특징으로 구분할 수 있어요. '이건 Gemini 글이고, 이건 ChatGPT 글이네'라고 알 수 있는 거죠.


Q. 문체 패턴이라고요?


네. 이걸 이해하려면 AI의 답변 생성 원리를 알아야 하는데요. AI는 문장을 만들 때 앞에 나온 단어를 바탕으로 다음에 올 단어의 확률을 계산하면서 이어 붙이는 방식으로 작동해요. 그래서 넥스트 토큰Next Token의 확률 값이 어떻게 되는지를 보면 AI별 문체 패턴을 확인할 수 있어요.


예로 'I am a'라는 표현이 나오면, 높은 확률로 'boy'나 'girl'같은, 자연스럽게 이어지는 단어가 선택되는 경향이 있어요. 'I am a desk' 같은 문장은 잘 나오지 않죠. 그래서 문장은 매끄럽지만 비슷한 패턴이 반복되고요. 


사람이 쓴 글은 단어 활용이 들쑥날쑥, 난리예요(웃음). 문법에 맞지 않는 문장이나 맥락에서 벗어나는 문장도 있고요. 의도적으로 문학적인 표현이나 낯선 단어를 쓰기도 하죠. 예측하기 어려운 '튀는 지점'이 많은 거예요.


그래서 전체 문장의 확률 분포를 보면 알 수 있습니다. 넥스트 토큰의 확률 값이 일정하다면 'AI가 쓴 글'이라고 할 수 있는 거죠.


88487a1b3c848.png

"글의 내용이 아니라, 어떻게 쓰였는지를 보면 구분이 됩니다. AI는 예측 가능한 패턴을 반복하고, 사람은 그렇지 않거든요." ©폴인, 박일규


Q. AI 기술이 발전하면 분간하기 어려워지지 않을까요?


'AI가 쓴 글이 사람이 쓴 것만큼 자연스러워지면 어떡하지?'라는 생각을 주변에서도 많이 하시더라고요. 그런데 오히려 분간하기 더 쉬워져요. 사람이 읽어보면 'AI가 쓴 것 같지 않은데?'하는 문장이라도 넥스트 토큰의 확률 값을 보면 알 수 있거든요. 그렇게 만들어진 문장이라 어쩔 수 없는 거죠.


문장의 퀄리티보다 더 큰 영향을 미치는 건 '분량'이에요. 글이 길어질수록 숨은 패턴이 더 많이 드러나기 때문에 탐지가 쉬워지고, 짧을수록 판단이 어렵거든요.


> 아티클 전문 읽기: https://www.folin.co/article/14153