자세히 보기

이지현
Senior Editor

이미지가 살아 움직인다···미드저니, ‘사진 기반 영상 생성’ 기능 출시

뉴스
2025.06.202분
생성형 AI미디어 및 엔터테인먼트 산업동영상

AI 이미지 생성 기술을 만드는 미드저니(Midjourney)가 영상 생성 기능 '비디오 모델(Video Model)'의 첫 번째 버전을 16일 공개했다. 이 모델로 사용자는 사진 하나를 기반으로 애니메이션 및 동영상으로 전환할 수 있다.

미드저니 비디오 모델로 만든 영상 예시 (출처:미드저니)

이번 업데이트의 핵심은 ‘이미지 투 비디오(Image-to-Video)’ 기능이다. 미드저니에서 AI로 이미지를 만든 뒤 ‘애니메이트(Animate)’ 버튼을 클릭하면, 정적인 장면에 생동감 있는 움직임이 더해진다. 생성되는 영상 스타일은 2D 또는 3D 애니메이션부터 실사 촬영 느낌, 그림체 기반의 장면까지 다양하다. 애니메이션 모드는 자동과 수동 두 가지 방식으로 제공된다. 자동 모드에서는 시스템이 직접 ‘모션 프롬프트’를 생성해 다양한 움직임을 연출하며, 수동 모드에서는 사용자가 카메라 이동, 장면 전환 방식 등을 설정할 수 있다.

움직임의 강도도 설정할 수 있다. 미드저니에 따르면 ‘로우 모션(Low motion)’은 배경이나 카메라가 거의 고정된 채 피사체만 천천히 움직이는 정적인 장면에 적합하고, ‘하이 모션(High motion)’은 카메라와 피사체가 모두 활발히 움직이는 동적인 장면을 위한 설정이다. 다만, 움직임이 지나치면 오류가 발생할 수 있다.

외부 이미지를 활용해 영상을 만드는 것도 가능하다. 기존 이미지를 프롬프트 바에 드래그해 ‘프레임 시작(start frame)’으로 지정한 뒤, 원하는 움직임을 설명하는 모션 프롬프트를 입력하면 해당 이미지를 기반으로 동영상을 생성할 수 있다. 미드저니의 창립자이자 CEO인 데이비드 홀츠는 블로그를 통해 “이 기능은 기존 사진이나 창작물에 새로운 생명을 불어넣는 데 특히 유용할 것”이라고 밝혔다.

이 서비스는 월 10달러에 제공되며, 영상 길이는 기본 5초 단위로 생성된다. 이후 4초씩 최대 4회까지 연장할 수 있다. 현재는 웹 기반에서만 사용 가능하다. 홀츠는 “이 모델을 개발하는 데 들어간 실제 비용과 사용자에게 제공하는 가격을 일치시키기는 어렵지만, 누구나 바로 써볼 수 있도록 먼저 문을 열었다”라며 “향후 한 달간 이용 데이터를 바탕으로 지속 가능한 운영을 위한 가격 정책을 조정해 나갈 것”이라고 말했다.

홀츠는 또한 이번 기능이 단순한 이미지 생성 도구를 넘어, 미드저니가 실시간 오픈월드 시뮬레이션 기술로 확장해 나가기 위한 기반이 될 것이라고 기대했다. 여기서 말하는 오픈월드 시뮬레이션이란, AI 시스템이 실시간으로 이미지를 생성하고 사용자가 3D 공간 안에서 움직임을 지시하면 배경과 캐릭터가 함께 반응하며, 모든 요소와 상호작용할 수 있는 세계를 의미한다. 홀츠는 “앞으로 1년간 이러한 요소들을 하나씩 개발하고 공개한 뒤, 점차 통합된 하나의 시스템으로 결합해 나갈 것”이라고 밝혔다.
jihyun.lee@foundryco.com

이지현

2022년부터 CIO 코리아 책임 기자로 일하며 AI, 디지털 전환, 클라우드 등 주요 기술 이슈에 대한 최신 트렌드와 인사이트를 전달하고 있습니다. 국내외 IT 리더들을 대상으로 한 심층 인터뷰와 리더십 취재를 꾸준히 이어가고 있으며, 다양한 현장을 찾아 업계 흐름을 생생하게 전하고자 합니다. 아울러, 한국IDG가 주관하는 콘퍼런스와 조찬 세미나에도 참여하며, 국내 IT 리더들이 자연스럽게 교류하고 의견을 나눌 수 있는 자리를 만드는 데 힘쓰고 있습니다.

CIO 코리아 합류 전에는 2013년부터 기술 전문 매체 블로터에서 IT 기자로 활동했으며, 그보다 앞서 한국에서 컴퓨터공학을 전공하고 미국 뉴욕에서 1년간 프로그래머 인턴으로 근무한 경험이 있습니다. 현재도 취미로 프로그래밍을 이어가며, IT 업계에 종사하는 분들을 늘 응원하는 마음으로 취재 활동을 이어가고 있습니다.

이 저자의 추가 콘텐츠