논문에서 챗GPT가 쓴 문장 찾아낸다

[더테크=조명의 기자] 무하유가 챗GPT가 쓴 문장을 찾아내는 GPTKiller(이하 GPT킬러) 솔루션을 개발했다고 21일 밝혔다.

무하유는 지난 12년간 AI 기반의 표절검사 서비스인 카피킬러를 운영하며 축적된 문서 데이터와 무하유만의 한국어 자연어 이해(NLU) 노하우를 접목시키며 디텍트GPT(Detect GPT) 기술 개발에 성공했다.

오는 9월부터 카피킬러에 GPT 킬러 기능을 추가 적용하고, 제출된 과제물 및 논문에 챗GPT가 작성한 문장이 있는지 찾을 수 있도록 서비스할 방침이다.

GPT 킬러는 문장 속 단어와 어순 관계를 추적해 맥락과 의미를 학습하는 AI 신경 모델인 트랜스포머를 기반으로 한다. 한국어 자연어 이해모델을 학습한 AI가 검사 문서를 문단 단위로 분할한 후 각 문단에 대한 챗GPT 작성 확률을 분석한다.

검출을 원하는 문단과 이전 맥락을 고려한 후, 입력된 값을 결과에 따라 참 또는 거짓 형태로 분류해 챗GPT 작성 여부를 판단하는 이진분류(Binary Classification) 방식이다.

무하유에 따르면, 지금까지 기존 챗GPT가 만든 문장을 찾아내는 디텍트 GPT 솔루션 중 한국어 학습 AI를 적용한 사례는 없었다. 한국어 입력이 가능한 서비스일지라도 내용을 정상적으로 판별할 수 없는 경우가 대다수다. 반면 GPT 킬러는 디텍트 GPT 솔루션 중 유일하게 AI가 쓴 한국어 문장까지 잡아낼 수 있다.

실제 해외 디텍트 GPT 프로그램들과 비교해 본 결과, GPT 킬러는 한국어를 사용했을 때 타사 솔루션 대비 거짓 데이터를 찾아낸 비율이 더 높고, 오검출 없이 실제로 잡아내야 하는 문제를 더 잘 잡아냈다고 설명했다.

무하유는 GPT 킬러가 수식이 많은 실험 보고서나 프로그래밍 코드 등도 탐지 가능하도록 솔루션 적용 범위를 확장해 나갈 계획이다. 또한 자기소개서와 같이 채용 과정에서 작성되는 문서에 대한 탐지도 가능하도록 고도화해, 자사 AI 서류 자동화 평가 서비스 ’프리즘‘에도 해당 기능을 추가할 예정이다.

신동호 무하유 대표는 “챗GPT가 쓴 글의 유효성을 검사하는 일은 카피킬러로 12년간 논문 표절 검사를 진행하면서 과탐지 및 오탐지에 대한 기준을 확립해 온 무하유가 제일 잘 할 수 있는 일이다”라며 “카피킬러로 쌓아온 비즈니스 경쟁력과 시장 점유율을 활용해 GPT킬러를 생성 AI를 올바르게 활용할 수 있는 도구로 만드는 게 목표”라고 말했다.

CATEGORY