자세히 보기

이지현
Senior Editor

오픈AI, 음성 복제 기술 ‘보이스 엔진’ 발표··· 교육,의료,공공 활용 사례 공개

뉴스
2024.04.012분

오픈AI가 15초 길이의 샘플 목소리 파일로 음성을 복제하는 AI 모델 ‘보이스 엔진’을 3월 29일 공개했다.

보이스 엔진은 음성 샘플을 활용해 특정 화자의 억양, 말투, 감정 등을 반영해 음성을 합성해 주는 기술이다. 현재 보이스 엔진은 프리뷰 형태로 제한된 파트너사만 활용할 수 있다. 오픈AI는 “음성 합성 기술이 잘못 활용될 가능성이 있기 때문에 일반 사용자를 위한 대규모 출시는 보다 신중하게 고려해서 진행할 것”이라고 밝혔다.

오픈AI는 보이스 엔진의 가능성을 보여주기 위해 구체적인 활용 사례를 공개했다. 여기에는 교육, 공공, 의료 분야 사례가 포함됐다.

먼저 교육 기업 에이지오브러닝은 보이스 엔진을 통해 다양한 목소리와 외국어로 교육 콘텐츠를 제작하고 있다. 과학, 수학, 언어 과목에 필요한 해설 및 맞춤형 교육 콘텐츠를 보이스 엔진으로 보다 편리하게 만들고 있다고 한다. AI 영상 생성 도구를 내놓고 있는 헤이젠은 보이스 엔진을 활용해 영상 콘텐츠를 다국어로 번역하는 서비스를 선보였다.

비영리 의교 기관인 라이프스팬은 뇌종양 수술 등으로 돌발성 혹은 퇴행성 언어 질환을 겪는 환자를 치료하기 위한 음성을 보이스 엔진으로 생성하고 있다. 리복스라는 기관도 의사소통에 어려움 겪는 환자 및 장애인을 위한 기술을 만드는 과정에서 보이스 엔진으로 목소리를 생성하고 있다.

개발도상국 지역 주민의 보건 상담을 지원하는 디마지는 현지 언어로 제작한 음성 교육 자료를 보이스 엔진을 통해 생성하고 있다. 여기에느 스와힐리어, 쉥 언어 등 소수민족 언어 기반 음성 자료도 있다. 디마지는 이런 기술로 현지 직원의 업무 부담을 줄이는 동시에 보다 다양한 지역 주민에게 의료 상담을 제공하고 있다고 한다.

오픈AI는 블로그를 통해 “사람의 목소리와 유사한 음성을 생성하는 것은 심각한 위험을 수반하며, 특히 선거가 있는 해에는 더욱 주의해야 한다”라며 “오픈AI는 정부, 미디어, 엔터테인먼트, 교육, 시민 사회 등 다양한 분야의 미국 및 국제 파트너와 협력하고 피드백을 받아 음성 엔진을 구축하고 있다”라고 설명했다.

오픈AI 파트너사는 보이스 엔진을 이용하기 위해 동의나 법적 권리 없이 다른 개인이나 단체를 사칭하는 것을 금지하는 사용 정책에 동의해야 한다. 또한 오픈AI 파트너사는 워터마크 등으로 생성된 음성이 AI가 만든 음성임을 명확히 밝히고 있다.
jihyun_lee@idg.co.kr

이지현

2022년부터 CIO 코리아 책임 기자로 일하며 AI, 디지털 전환, 클라우드 등 주요 기술 이슈에 대한 최신 트렌드와 인사이트를 전달하고 있습니다. 국내외 IT 리더들을 대상으로 한 심층 인터뷰와 리더십 취재를 꾸준히 이어가고 있으며, 다양한 현장을 찾아 업계 흐름을 생생하게 전하고자 합니다. 아울러, 한국IDG가 주관하는 콘퍼런스와 조찬 세미나에도 참여하며, 국내 IT 리더들이 자연스럽게 교류하고 의견을 나눌 수 있는 자리를 만드는 데 힘쓰고 있습니다.

CIO 코리아 합류 전에는 2013년부터 기술 전문 매체 블로터에서 IT 기자로 활동했으며, 그보다 앞서 한국에서 컴퓨터공학을 전공하고 미국 뉴욕에서 1년간 프로그래머 인턴으로 근무한 경험이 있습니다. 현재도 취미로 프로그래밍을 이어가며, IT 업계에 종사하는 분들을 늘 응원하는 마음으로 취재 활동을 이어가고 있습니다.

이 저자의 추가 콘텐츠