오픈AI의 주요 임원들의 이직 및 사임 소식이 나오는 가운데, 오픈AI가 새로운 모델을 선보였다. 이 모델은 마이크로소프트(MS) 애저를 통해 제공된다.
오픈AI는 GPT-4o의 새 버전을 ‘원하는 명확하고 체계적인 정보를 쉽게 얻을 수 있도록 설계된 모델’이라고 소개했다. GPT-4o-2024-08-06이라고 명명된 오픈AI의 새로운 모델은 개발자를 공략해 출시됐다. 개발자는 새로운 모델로 출력물의 형태나 구조를 직접 지정할 수 있다.
오픈AI는 블로그를 통해 “새 버전은 특히 AI 결과물의 유효성을 검사하고 JSON 스키마 같은 구조로 AI 결과물을 출력해야 하는 개발자에게 유용하다. 과거 개발자는 AI 출력을 JSON 스키마와 같이 잘 정의된 구조로 검증하고 형식을 지정하는 데 어려움을 겪었는데, 이런 문제를 새 버전으로 해결할 수 있을 것”이라고 설명했다. 단 새 버전은 MS 애저 오픈AI 서비스에서만 현재 이용할 수 있다.
오픈AI 및 MS에 따르면, JSON 스키마를 통해 개발자는 플랫폼 간 일관성을 유지하고, 모델 중심의 UI 제약 조건을 구동하며, 사용자 인터페이스를 자동으로 생성할 수 있다. 양사는 “JSON 문서의 구조와 제약 조건을 정의하고 필수 속성 및 값 유형이 있는 특정 형식을 따르도록 하는 데 중요하다. 또한 주석을 통해 데이터의 이해도를 높이고, 특정 도메인에 최적화된 형식으로 데이터를 제공하며, 애플리케이션의 효율성을 향상시킬 수 있다”라며 “JSON 스키마는 자동화된 테스트, 스키마 추론, 기계 판독 가능한 웹 프로파일을 지원해 데이터 상호 운용성을 높인다”라고 밝혔다.
GPT-4o-2024-08-06은 두 가지 종류의 구조화된 출력을 지원한다. JSON 스키마 기반의 사용자 정의 모드 그리고 더 정확한 도구 출력을 위한 ‘엄격(strict) 모드’가 있다. 이때 사용자 정의 모드를 통해 개발자는 AI 출력물에 적용할 JSON 스키마를 정의할 수 있다. 엄격 모드에선 함수 시그니처를 지정해 특정 도구를 사용할 때 필요한 입력값의 유형과 형식, 출력값이 어떻게 나와야 하는지를 세부적으로 설정할 수 있다.
사용자 정의 출력은 GPT-4o-2024-08-06 및 GPT-4o-미니-2024-07-18 모델에서 지원된다. 엄격 모드는 함수 호출을 지원하는 모든 모델에서 지원되며, 여기에는 GPT-3.5 터보, GPT-4, GPT-4 터보 및 GPT-4o 모델이 포함된다.
GPT-4o는 2024년 5월 멀티모달 모델로 처음 발표되었으며, 2024년 7월에는 GPT-4o 미니가 출시되었다. MS는 새 모델에 대한 가격을 공개하지 않았다.
최근 오픈AI는 초기부터 함께했던 여러 고위 임원들이 잇따라 회사를 떠나는 상황에 직면해 있다. 동시에 오픈AI는 LLM에 대한 치열한 경쟁에 직면해 있다. 메타가 새롭게 공개한 라마 3.1 대규모 언어 모델(LLM) 제품군에는 4,050억 개의 파라미터 모델과 700억 개의 파라미터 및 80억 개의 파라미터 등이 포함되어 있다.
일부 업계 전문가는 라마 3.1 모델 제품군의 개방성과 정확성이 오픈AI처럼 폐쇄적인 LLM을 개발하는 제공업체에 위협이 되고 있다고 분석하고 있다. 메타는 블로그를 통해 “405B 라마 3.1 모델이 MMLU, MATH, GSM8K, ARC 챌린지 등의 벤치마크 테스트에서 네모트론-4 340B Instruct, GPT-4, 클로드 3.5 소네트 같은 모델보다 성능이 뛰어났다”라고 설명했다.
해당 테스트에서 라마 3.1 모델의 성능은 GPT-4o와 비슷한 수준으로 나타났다. 참고로 MMLU 벤치마크에서 GPT-4o는 88.7점, 라마 3.1 405B는 88.6점을 기록했다. MMLU, MATH, GSM8K 및 ARC 챌린지는 일반 지능, 수학 및 추론 영역에서 LLM을 테스트하는 벤치마크다.
더 큰 컨텍스트 창과 여러 언어 지원으로 업데이트된 라마 3.1 모델인 8B와 70B도 동일한 벤치마크 테스트에서 상용 LLM보다 더 우수하거나 비슷한 성능을 보였다.
또 다른 강력한 경쟁 모델은 6월에 출시된 클로드 3.5 소넷이다. 클로드 개발사인 앤트로픽에 따르면 클로드 3.5 소넷은 대학원 수준의 추론(GPQA), MMLU, 코딩 능력 테스트인 HumanEval 등 업계 벤치마크에서 새로운 기록을 세웠다.
현재 오픈AI는 GPT-5 개발을 진행 중인 것으로 알려졌다. 최근 샘 알트먼 CEO가 X에 여름 정원과 딸기에 관한 글을 올리면서, 오픈AI가 웹 크롤링 능력을 갖춘 차세대 AI 모델을 개발하고 있다는 추측이 제기되고 있다.
dl-ciokorea@foundryco.com