오픈AI가 챗GPT가 작성한 글을 식별하는 기술을 개발했음에도 외부 부정적 반응 우려로 출시 여부를 결정하지 못하고 있다고 월스트리트저널(WSJ)이 4일 보도했다.
WSJ는 익명의 소식통을 인용해 오픈AI가 수년간 일명 ‘챗GPT 워터마크’ 기술을 개발하고 있다고 보도했다. 이 기술은 챗GPT와 인간이 작성한 텍스트를 구별하기 위한 것으로, 주로 교육기관에서 과제나 논문 작성에 챗GPT를 남용하는 사례를 방지하기 위해 만들어졌다. WSJ에 따르면, 오픈AI는 2년 전부터 이 기술의 출시 여부를 내부적으로 적극 논의해왔으나, 아직 명확한 결론에 이르지 못해 출시를 보류하고 있다.
챗GPT 워터마크 기술은 2023년 7월 개발이 중단된 ‘AI 분류기’와 다른 기술로, 문서 전체 또는 일부를 분석하고 챗GPT로 작성되었을 가능성을 점수로 제시한다. 챗GPT 답변은 문장을 생성하면서 다음 단어(토큰)를 예측하는 구조를 가지고 있는데, 해당 워터마크 기술은 토큰 선택 방식을 약간 변경하면서 특정 패턴을 남기고 이를 점수화한다고 한다. WSJ가 입수한 오픈AI 내부 문서에 따르면, 적절한 분량의 텍스트가 있을 경우 이 워터마크 기술의 정확도는 99.9%에 달한다.
WSJ는 또한 오픈AI가 2023년 4월 설문조사를 진행한 결과, 4대 1의 비율로 AI 탐지 도구 기술을 지지하는 사용자가 많은 것을 확인했다고 보도했다. 하지만 또 다른 자체 설문 조사 결과, 챗GPT 사용자의 약 30%가 워터마킹 적용 시 챗GPT 사용을 줄이겠다고 응답한 것으로 나타났다. 워터마크 기술에 대한 긍정적인 반응과 부정적인 반응이 동시에 있는 셈이다. 오픈AI의 CEO와 샘 알트만과 CTO 미라 무라티는 이 기술 개발을 장려했지만 출시를 추진하지는 않았다고 한다.
WSJ 보도가 나오자, 오픈AI는 공식 블로그를 통해 “텍스트 워터마크 기술은 높은 정확도를 보였으며, 문장 재구성하는 등 일부 내용을 수정해도 챗GPT가 작성한 콘텐츠임을 파악해냈다”라며 “하지만 번역 시스템을 사용하거나, 다른 생성 모델를 활용하거나, 단어 사이에 특수 문자를 삽입한 후 그 문자를 삭제하는 등의 방식을 이용하면 챗GPT 콘텐츠임을 파악하지 못했다”라고 설명했다. 또한 “오픈AI 연구 결과에 따르면, 텍스트 워터마크 방법이 특정 그룹에 불공평한 영향을 줄 수 있었다”라며 “AI 텍스트 워터마킹은 비영어권 사용자들의 AI 활용을 노출시킬 수 있다. 이로 인해 AI를 글쓰기 보조 도구로 사용하는 것에 대한 부정적 인식을 초래할 우려가 있다”라고 설명했다.
오픈AI는 아직 해당 도구의 출시 여부에 대해 구체적으로 밝히지 않았다. 오픈AI 대변인은 WSJ를 통해 “오픈AI가 개발 중인 텍스트 워터마크 방식은 기술적으로는 가치가 있지만 여러 위험 요소가 포함된 상태”라며 “오픈AI는 워터마크 기술의 복잡성과 관련 생태계에 끼칠 영향을 고려해, 신중한 접근법을 취하고 있다”라고 설명했다.
dl-ciokorea@foundryco.com