자세히 보기

오픈AI, 챗GPT-위스퍼용 API 출시 “10배 저렴해진다”

뉴스
2023.03.033분

음성-텍스트 서비스 위스퍼(Whisper)와 AI 기반 챗GPT의 이용 비용이 10배 더 저렴해질 수 있다고 오픈AI가 밝혔다.

오픈AI가 챗GPT용 API와 회사의 AI 기반 전사(transcription) 및 번역 서비스 ‘위스퍼’용 API를 공개했다. 이들 API를 이용하면 기업들이 챗GPT 및 위스퍼를 통합한 대화 플랫폼을 더 쉽게 개발할 수 있다. 또 기존 언어 모델을 이용하는 것보다 더 저렴하게 개발할 수 있게 된다.

오픈AI는 “시스템 전반에 걸친 일련의 최적화를 통해 12월 이후 챗GPT 비용을 90% 절감했다. 우리는 이제 이러한 절감액을 API 사용자에게 전달하고자 한다”라고 블로그를 통해 밝혔다. 

오픈AI는 지난해 9월에 위스퍼를, 11월에 챗GPT를 출시했다. 이번 API들은 챗GPT와 위스퍼를 다른 소프트웨어와 통합하는 작업을 수월하게 한다. 회사는 “이제 우리 API 상에서 챗GPT와 위스퍼 모델에 접근할 수 있다. (외부의) 개발자들은 첨단 언어(챗에 그치지 않는다!)와 스피치-투-텍스트 역량에 접근할 접근할 수 있다”라고 밝혔다.


위스퍼를 사용한 음성 텍스트 변환

위스퍼는 여러 언어에 대해 전사 기능을 지원하며, 해당 언어를 영어로 변역하는 서비스다. 오픈AI에 따르면 위스퍼는 개발자 커뮤니티로부터 찬사를 받았지만 “실행하기 까다로운 면도 있다.” 회사는 “이제 API를 통해 대형 v2 모델을 이용할 수 있다. 이 모델은 0.006달러/분(오디오 입력)의 가격으로 편리한 온디맨드 액세스를 제공한다”라고 전했다. 

위스퍼는 M4A, MP3, MP4, MPEG, MPGA, WAV 및 WEBM을 포함한 여러 형식의 파일을 허용한다. 웹에서 수집한 68만 시간의 다국어 및 멀티태스킹 감독 데이터에 기반해 교육됐다. 

GPT 3.5 터보 기반 챗GPT API
챗GPT API는 최신 버전의 챗GPT에서 사용되는 것과 ‘패밀리’인 GPT 3.5 터보 언어 모델에 기반한다. 챗GPT를 사용하는 회사는 1,000개 토큰(약 750단어)당 0.002달러를 지불해야 한다. 오픈AI는 기업에 사용자 쿼리 비용당 토큰 수를 평가하고 이를 고객 쿼리 규모와 일치하도록 변환하는 도구를 제공하고 있다. 

오픈AI는 새로운 가격 정책이 기존 챗GPT를 지원하는 버전인 기존 GPT 3.5 모델보다 10배 저렴하다고 주장했다. 회사는 “챗GPT API를 사용하면 지속적인 모델 개선과 모델에 대한 더 깊은 제어를 위한 전용 용량을 선택할 수 있는 옵션을 기대할 수 있다”라고 말했다.

상승일로의 챗GPT 인기
11월에 출시된 챗GPT는 빠르게 인기를 끌었다. 출시 두 달 만에 1억 명의 활성 사용자를 기록했다. 그러나 이러한 막대한 수요로 인해 회사는 오히려 어려움을 겪었다.

“지난 2개월 동안 챗GPT 가동 시간은 사용자의 기대치도 충족하지 못했다. 우리 엔지니어링 팀의 최우선 순위는 이제 프로덕션 사용 사례의 안정성이다”라고 오픈AI가 말했다.

이미 구글, 아마존, 애플 및 메타와 같은 거대 기술 기업을 비롯한 여러 조직에서 고급 음성 인식 시스템을 만들었다. 오픈AI가 음성-텍스트 시장에서 크게 자리를 잡을 수 있다면 마이크로소프트가 지분을 보유한 이 회사는 상당한 이익을 기대할 수 있다.

마켓앤마켓의 보고서에 따르면 텍스트 음성 변환 시장은 2021년 22억 달러에서 2026년까지 54억 달러 규모로 성장할 성장이다. dl-ciokorea@foundryco.com