By 이지현

Senior Editor

“피아노로 웃는 소리를 표현해줘”···엔비디아, AI 음악 생성기 ‘푸가토’ 선봬

뉴스

2024.11.262분

생성형 AI미디어 및 엔터테인먼트 산업엔비디아

엔비디아가 텍스트를 입력하면 음악을 생성해주는 ‘푸가토(Fugatto)’라는 AI 모델을 26일 공개했다.

‘Foundational Generative Audio Transformer Opus 1’의 약자인 푸가토는 텍스트와 오디오를 활용해 다양한 소리를 생성하고 변환하는 AI 모델이다. 2.5억 개의 파라미터로 구성된 이 모델은 NVIDIA H100 텐서 코어 GPU 32개가 탑재된 DGX 시스템에서 학습되었다.

엔비디아는 사용자가 묘사할 수 있는 것이면 푸가토는 거의 무엇이든 생성 가능하다고 소개했다. 예를 들어, 텍스트 입력만으로 짧은 음악을 만들고, 기존 곡의 악기를 편집하며, 음성의 억양과 감정을 조절할 수 있다. 또한 트럼펫으로 강아지가 짖는 소리나 색소폰으로 고양이 울음소리를 구현하는 등 이전에 없던 새로운 소리도 창작할 수 있다.

엔비디아는 기존 텍스트-음악 생성 도구와 달리 푸가토가 3가지 측면에서 새로운 기술이라고 설명했다. 먼저 독립적으로 훈련된 명령을 조합해 실행하며, 생성되는 음악의 억양 강도나 감정 깊이를 세밀하게 조정할 수 있다. ‘프랑스 억양의 슬픈 감정으로 말하는 음성’처럼 복합적인 명령을 수행할 수 있다는 것이다. 두 번째, 시간 변화에 따른 특정 조건을 적용해 ‘천둥이 치는 폭풍우가 멈추고 점차 새소리가 들리는 새벽 소리’과 같은 명령이 가능하다. 마지막으로 훈련 데이터에 없는 완전히 새로운 소리도 만들 수 있다.

푸가토는 오케스트라 지휘자 겸 작곡가인 라파엘 발레가 엔비디아 응용 오디오 연구 매니저로 참여해 개발됐다. 발레는 “인간이 소리를 이해하고 만들어내는 방식과 유사한 모델을 개발하고자 했다”라고 설명했다.

엔비디아는 푸가토가 음악 작곡, 광고 제작, 게임 개발, 교육 콘텐츠 생성 과정에서 활용될 수 있을 것으로 기대했다. 푸가토의 구체적인 출시 시점을 밝히지 않았지만, 가까운 시일 안에 공개할 예정이라고 밝혔다.
jihyun.lee@foundryco.com

By 이지현

Senior Editor

Follow 이지현 on LinkedIn

2022년부터 CIO 코리아 책임 기자로 일하며 AI, 디지털 전환, 클라우드 등 주요 기술 이슈에 대한 최신 트렌드와 인사이트를 전달하고 있습니다. 국내외 IT 리더들을 대상으로 한 심층 인터뷰와 리더십 취재를 꾸준히 이어가고 있으며, 다양한 현장을 찾아 업계 흐름을 생생하게 전하고자 합니다. 아울러, 한국IDG가 주관하는 콘퍼런스와 조찬 세미나에도 참여하며, 국내 IT 리더들이 자연스럽게 교류하고 의견을 나눌 수 있는 자리를 만드는 데 힘쓰고 있습니다.

CIO 코리아 합류 전에는 2013년부터 기술 전문 매체 블로터에서 IT 기자로 활동했으며, 그보다 앞서 한국에서 컴퓨터공학을 전공하고 미국 뉴욕에서 1년간 프로그래머 인턴으로 근무한 경험이 있습니다. 현재도 취미로 프로그래밍을 이어가며, IT 업계에 종사하는 분들을 늘 응원하는 마음으로 취재 활동을 이어가고 있습니다.

Africa

Americas

Asia

Europe

Oceania

토픽

About

정책

네트워크

자세히 보기

“피아노로 웃는 소리를 표현해줘”···엔비디아, AI 음악 생성기 ‘푸가토’ 선봬

엔비디아가 텍스트를 입력하면 음악을 생성해주는 ‘푸가토(Fugatto)’라는 AI 모델을 26일 공개했다.

이 저자의 추가 콘텐츠

“마블·스타워즈, 세로 스크롤 웹툰으로” 네이버웹툰-디즈니, 글로벌 파트너십 체결

퍼플렉시티, 구글 크롬 47조 원에 인수 제안

“7만 5,000줄 코드 한 번에 처리 가능”···앤트로픽, 클로드에 100만 토큰 컨텍스트 지원

코파일럿 혁신 이끈 깃허브 CEO, 2025년 말 퇴임···MS와 통합 가속되나

“한국 HR 테크 산업 최대 규모 거래” 리멤버, 스웨덴 투자사에 5,000억 원에 매각

샘 알트먼 발언으로 읽는 GPT-5 핵심 특징과 AI의 미래

AWS, 오픈AI 모델 첫 지원···생성형 AI 선택지 넓힌다

한국 정부, K-AI 모델 개발 시동···정예팀 5곳와 함께하는 50여 개 기관은 어디?

추천 콘텐츠

현직 IT 리더들이 말하는 ‘실패 없는 벤더 관계 관리법’

사례 | "유행에 무작정 뛰어들지 않아 성공했다" 美 엠플리파이헬스의 AI 도입 전략

'美 연방정부 투자설 나오는 가운데…' 인텔, 전현직 CEO 간 갈등은 심화

“피아노로 웃는 소리를 표현해줘”···엔비디아, AI 음악 생성기 ‘푸가토’ 선봬

엔비디아가 텍스트를 입력하면 음악을 생성해주는 ‘푸가토(Fugatto)’라는 AI 모델을 26일 공개했다.

글로벌 뉴스와 IT 트렌드 보고서를 무료로 받으세요!

이 저자의 추가 콘텐츠

“마블·스타워즈, 세로 스크롤 웹툰으로” 네이버웹툰-디즈니, 글로벌 파트너십 체결

퍼플렉시티, 구글 크롬 47조 원에 인수 제안

“7만 5,000줄 코드 한 번에 처리 가능”···앤트로픽, 클로드에 100만 토큰 컨텍스트 지원

코파일럿 혁신 이끈 깃허브 CEO, 2025년 말 퇴임···MS와 통합 가속되나

“한국 HR 테크 산업 최대 규모 거래” 리멤버, 스웨덴 투자사에 5,000억 원에 매각

샘 알트먼 발언으로 읽는 GPT-5 핵심 특징과 AI의 미래

AWS, 오픈AI 모델 첫 지원···생성형 AI 선택지 넓힌다

한국 정부, K-AI 모델 개발 시동···정예팀 5곳와 함께하는 50여 개 기관은 어디?

추천 콘텐츠

현직 IT 리더들이 말하는 ‘실패 없는 벤더 관계 관리법’

사례 | "유행에 무작정 뛰어들지 않아 성공했다" 美 엠플리파이헬스의 AI 도입 전략

'美 연방정부 투자설 나오는 가운데…' 인텔, 전현직 CEO 간 갈등은 심화