자세히 보기

김유성
Senior Editor

오픈AI, 추론 모델 o3 및 o4 미니 공개··· “이미지에서 의도 읽는 기능 탑재”

뉴스
2025.04.182분

오픈AI가 이미지를 보고 해석할 수 있는 기능이 추가된 추론 특화 모델 ‘o3’와 경량화 모델 ’o4 미니’를 지난 17일 공개했다.

KI
Credit: ioda/Shutterstock.com

오픈AI에 따르면 ‘o3’는 지난해 9월 출시된 추론 특화 모델 ‘o1’의 후속 제품이다. 추론 특화 모델은 논리적인 사고 과정을 거쳐 복잡한 문제를 해결하고, 학습 데이터에 없는 새로운 답을 도출해 내는 모델을 의미한다. 오픈AI는 ‘o3’가 코딩, 수학, 과학, 시각적 이해 능력 등 다양한 영역에서 기존 모델을 능가하는 성능을 보인다고 밝혔다.

경량화 모델인 ‘o4 미니’는 빠르고 비용 효율적인 추론을 위해 설계된 모델로, 오픈AI는 “더 낮은 비용으로 수학, 코딩, 시각적 작업에서 기존 ‘o3 미니’보다 높은 성능을 제공한다”라고 설명했다.

또한 o3와 o4 미니에는 이미지를 해석하고 사고 과정에 통합할 수 있는 기능이 추가됐다. 사용자가 화이트보드나 스케치나 도표 등을 업로드할 수 있으며, 품질이 낮은 이미지에서도 의도를 해석할 수 있다. 이 과정에서 모델이 추론 과정의 일부로 이미지를 회전, 확대 및 축소, 변형할 수 있다.

open ai thinking with images

Open AI

두 모델 모두 강화 학습(RL)을 통해 도구를 사용하도록 훈련됐다. 오픈AI는 단순히 도구를 사용하는 방법뿐만 아니라 언제 사용해야 하는지 추론할 수 있다면서, 모델이 원하는 결과에 기반해 도구를 배치할 수 있다고 설명했다. 두 모델은 챗GPT 내 모든 도구에 액세스 권한을 갖고 웹 브라우징과 파이썬 코드 실행, 이미지 처리, 이미지 생성에 활용할 수 있다.

o3 및 o4 미니 모델은 챗GPT 플러스, 프로 또는 팀 구독 등 유료 가입자에게 제공된다. 오픈 AI는 향후 몇 주 내에 o3 상위 버전으로 더 강력한 성능을 내는 ‘o3 프로’를 출시한다고 밝혔다.
yuseong.kim@foundryco.com

김유성
Senior Editor

CIO 코리아 에디터로 국내외 IT 산업 콘텐츠의 기획 및 취재를 담당하고 있습니다. 디지털 전환, 클라우드, 보안, AI 등 최신 기술 트렌드 취재를 바탕으로 IT 리더를 위한 맞춤형 콘텐츠를 기획하며 심층 인터뷰, 트렌드 분석 등을 통해 다양한 정보를 전달하고 있습니다. 또한, 한국IDG가 주관하는 행사에 참여해 국내 IT 리더들이 통찰을 나눌 수 있는 장을 마련하고, 현장의 목소리를 반영하기 위해 힘쓰고 있습니다.

이 저자의 추가 콘텐츠