데이터브릭스가 프로덕션 품질(production-quality)의 생성형 AI 구축을 지원하는 모자이크(Mosaic AI)에 일련의 신기능을 출시한다고 발표했다.
생성형 AI 프로젝트를 시범 단계에서 본격적인 프로덕션 단계로 전환하기란 쉽지 않다. 개인정보 보호, 품질 및 비용 문제 등이 주요 원인이다. 파운데이션 모델들이 크게 개선됐지만 고품질의 결과를 생성하는 데에는 여전히 한계가 있다. 부정확하거나 안전하지 않은 응답을 제공하거나 기밀 데이터를 노출할 위험이 있다.
데이터브릭스는 오늘날 조직들이 이러한 문제를 해결하기 위해 하나의 초대형 모델보다는 복합 AI 시스템을 배포하는 데 집중하고 있다고 진단했다. 다양한 모델, 검색기(retriever), 벡터 데이터베이스, 평가, 모니터링, 보안 및 거버넌스를 위한 도구 등 여러 구성 요소를 사용함으로써, 보다 정확하고 안전하며 관리 가능한 AI 애플리케이션을 구려하려는 움직임이다.
마테이 자하리아 데이터브릭스 공동창업자 겸 CTO는 “복합 AI 시스템은 향후 AI 애플리케이션의 품질, 신뢰성 및 평가를 극대화할 가장 좋은 수단으로서, 2024년 가장 중요한 AI 트렌드 중 하나가 될 것이라 기대한다”라고 밝혔다.
데이터브릭스가 고객의 프로덕션 품질 생성형 AI 애플리케이션 구축을 지원하기 위해 새롭게 출시한 기능으로는 모자이크 AI 에이전트 프레임워크(Agent Framework), 모자이크 AI 에이전트 이밸류에이션(Agent Evaluation), 모자이크 AI 툴 카탈로그(Tools Catalog), 모자이크 AI 모델 트레이닝(Model Training), 모자이크 AI 게이트웨이(Gateway)가 있다.
설명에 따르면 모자이크 AI 에이전트 프레임워크는 개발자가 파운데이션 모델과 엔터프라이즈 데이터를 사용해 고품질 RAG 애플리케이션을 신속하고 안전하게 구축할 수 있도록 지원한다. 모자이크 AI 에이전트 이밸류에이션은 결과물의 품질이 우수한지 자동으로 판단하고 직관적인 UI를 제공해 이해관계자의 피드백을 받도록 하는 AI 지원 평가 도구다. 이 모든 기능은 조직이 프로덕션 품질의 생성형 AI 솔루션을 배포할 수 있도록 돕는다.
이 밖에 모자이크 AI 툴 카탈로그는 조직이 데이터브릭스 유니티 카탈로그(Unity Catalog)를 사용해 도구를 관리, 공유 및 등록할 수 있도록 지원한다. 모자이크 AI 모델 트레이닝은 조직의 비공개 데이터로 오픈소스 기반 모델을 미세 조정해 해당 도메인이나 업무에 특화된 새로운 지식을 제공한다.
모자이크 AI 게이트웨이는 모든 오픈 소스 또는 독점 모델을 쿼리, 관리 및 배포할 수 있는 통합 인터페이스를 제공해 고객이 애플리케이션 코드를 복잡하게 변경할 필요 없이 애플리케이션을 구동하는 대규모 언어 모델(LLM)을 쉽게 전환할 수 있도록 지원한다고 데이터브릭스는 설명했다.
데니스 카모츠키 코닝(Corning) 수석 소프트웨어 엔지니어는 “미국 특허청 데이터를 포함한 수십만 개의 문서를 색인화하기 위해 데이터브릭스 모자이크 AI 에이전트 이밸류에이션을 사용해 AI 연구 어시스턴트를 구축했다”라고 말했다.
그는 이어 “연구원이 작업 중인 과제를 찾아 진행할 수 있도록 하기 위해서는 LLM 기반 어시스턴트가 높은 정확도로 질문에 응답하는 것이 매우 중요했다. 이를 구현하고자 데이터브릭스 모자이크 AI 에이전트 프레임워크를 사용해 미국 특허청 데이터로 증강된 생성형 AI 솔루션을 구축했으며, 데이터브릭스 데이터 인텔리전스 플랫폼을 활용해 검색 속도, 응답 품질 및 정확성을 크게 개선할 수 있었다”라고 말했다.
한편, 모자이크 AI 에이전트 프레임워크, 모자이크 AI 에이전트 이밸류에이션, 모자이크 AI 모델 트레이닝 및 모자이크 AI 게이트웨이는 현재 공개 프리뷰로 제공되며, 모자이크 AI 도구 카탈로그는 현재 비공개 프리뷰로 제공된다. 보다 자세한 내용은 데이터브릭스의 안내 페이지에서 확인할 수 있다. dl-ciokorea@foundryco.com