메타는 자사 AI에 도발적이고 논란의 여지가 있는 행동을 허용한 정책 문서가 실제로 존재했다는 사실을 인정했다.

Credit: Ascannio / Shutterstock
로이터가 14일 공개한 메타의 내부 정책 문서에 따르면, 이 회사의 인공지능(AI) 가이드라인은 미성년자와의 ‘선정적’ 대화를 포함해 도발적이고 논란이 될 수 있는 행위를 허용했던 것으로 나타났다.
로이터가 해당 문서를 검토한 결과, 메타 AI와 소셜미디어 전반에 적용되는 챗봇 운영 기준은 AI가 미성년자와 ‘로맨틱하거나 선정적인’ 대화를 나누는 것을 허용했고, 허위 의료정보를 생성하거나 흑인이 백인보다 ‘더 어리석다’는 주장을 돕는 기능도 가능하도록 설계돼 있었다.
문서는 ‘허용 가능한 언어’와 ‘허용 불가능한 언어’를 구분하면서, 노골적인 성적 대상화나 인간성 부정은 금지했지만, 모욕적 표현은 일정 수준까지는 허용하는 기준을 설정한 것으로 전해졌다.
메타는 해당 문서의 진위를 인정하면서도, 챗봇이 아동과 연애 감정을 표현하거나 감정적 관계를 모방하는 대화를 허용하는 내용은 이후 삭제했다고 주장했다. 다른 메타 대변인은 이 정책 문서를 현재 수정 중이며, “아동을 성적 대상화하는 콘텐츠와 성인과 미성년자 간 성적 역할극을 금지하는 자사 정책은 명확히 존재한다”라고 설명했다.
그럼에도 불구하고, 이 문서는 메타의 법무, 공공정책, 엔지니어링 부서뿐 아니라 최고 윤리 책임자까지 승인한 것으로 확인됐다고 로이터는 전했다.
dl-ciokorea@foundryco.com