자세히 보기

이지현
Senior Editor

“PDF 속 복잡한 차트·표 분석 가능”··· 미스트랄, 문서 분석 특화 OCR AI 기술 공개

뉴스
2025.03.072분
애널리틱스인공지능문서 데이터베이스

미스트랄이 문서 정보 추출에 용이한 '미스트랄 OCR' 기술을 6일 출시했다.

Female Analyst at Her Desk Works on a Laptop Showing Statistics, Graphs and Charts. She Works on the Wooden Table in Creative Office. Over the Shoulder Footage.
Credit: Gorodenkoff / Shutterstock

미스트랄 OCR은 문서 분석 특화 API로, 문서 내 미디어, 텍스트, 표, 수식 등을 정밀하게 분석할 수 있다. 미스트랄에 따르면, 이 기술은 기존 AI 모델이나 OCR과 달리 단순한 문자 인식이 아니라 문서의 의미와 구조를 깊이 이해한다.

미스트랄이 OCR 특화 기술을 공개한 이유는 대부분의 기업 데이터가 문서 형태로 저장되어 있어 이를 처리하는 도구가 매우 유용할 것이라고 판단했기 때문이다. 미스트랄은 공식 블로그를 통해 “현재 전 세계 조직 데이터의 약 90%가 문서 형태로 저장되어 있으며, 미스트랄 OCR은 이러한 방대한 정보의 잠재력을 활용하기 위해 개발되었다”라고 설명했다.

미스트랄 OCR의 기술 원리는 이렇다. 업로드된 이미지 또는 PDF 파일을 분석하고 문서 내 요소들의 원래 배치와 순서를 보존하면서 텍스트와 이미지를 함께 추출해낸다. 과학 논문의 차트, 그래프, 수식, 그림도 맥락을 파악하며 이해한다. 미스트랄은 “특히 슬라이드나 복잡한 PDF와 같은 다중모달 문서를 RAG(Retrieval-Augmented Generation) 시스템에 연결하면 더욱 결과를 얻을 수 있다”라고 밝혔다.

사용자는 이 기술을 활용해 PDF나 이미지에 대한 특정 질문에 정확한 답변을 받을 수 있다. 예를 들어, PDF로 작성된 계약서를 업로드하고 ‘계약서에 명시된 납기일을 찾아줘’와 같은 구체적인 질문을 할 수 있다. 이때 답변은 일반 문장뿐만 아니라 JSON과 같은 구조화된 형식으로도 추출 가능하다.

미스트랄은 이 OCR 기술을 자사 챗봇 서비스인 ‘르챗’에 지원하며, 개발자 플랫폼인 ‘라 플라트폼(la Plateforme)’에서도 이용할 수 있다. 가격은 1달러당 1,000페이지(배치 추론 시 약 두 배 비용)를 분석할 수 있다. 미스트랄은 이번 기술이 과학 연구 디지털화, 역사적 문서 보전, 고객 서비스 혁신 등에 활용될 수 있을 것으로 기대했다.
jihyun.lee@foundryco.com

이지현

2022년부터 CIO 코리아 책임 기자로 일하며 AI, 디지털 전환, 클라우드 등 주요 기술 이슈에 대한 최신 트렌드와 인사이트를 전달하고 있습니다. 국내외 IT 리더들을 대상으로 한 심층 인터뷰와 리더십 취재를 꾸준히 이어가고 있으며, 다양한 현장을 찾아 업계 흐름을 생생하게 전하고자 합니다. 아울러, 한국IDG가 주관하는 콘퍼런스와 조찬 세미나에도 참여하며, 국내 IT 리더들이 자연스럽게 교류하고 의견을 나눌 수 있는 자리를 만드는 데 힘쓰고 있습니다.

CIO 코리아 합류 전에는 2013년부터 기술 전문 매체 블로터에서 IT 기자로 활동했으며, 그보다 앞서 한국에서 컴퓨터공학을 전공하고 미국 뉴욕에서 1년간 프로그래머 인턴으로 근무한 경험이 있습니다. 현재도 취미로 프로그래밍을 이어가며, IT 업계에 종사하는 분들을 늘 응원하는 마음으로 취재 활동을 이어가고 있습니다.

이 저자의 추가 콘텐츠