자세히 보기

By CIOKR Staff

업스테이지, AWS 기반 소형언어모델 출시

뉴스
2024.03.212분

한국의 AI 스타트업 ‘업스테이지’가 아마존웹서비스(이하 AWS)의 솔라 미니(Solar Mini) 소형언어모델(SLM)을 출시했다고 AWS는 발표했다.

솔라 미니는 한국어와 영어로 이해와 요약, 번역 및 새로운 콘텐츠 예측 등 다양한 언어 작업을 수행하도록 쉽게 맞춤화하고 미세 조정(fine-tuning)할 수 있는 다목적 모델로, 추후 태국어와 일본어로도 제공될 예정이다. 업스테이지 고객들은 솔라 미니를 활용해 자사 모델을 처음부터 훈련시킬 필요 없이 생성형 AI를 쉽게 시작할 수 있으며, 산업별 사용 사례에 적합한 새로운 애플리케이션을 출시할 수 있다.

현재 솔라 미니는 파운데이션 모델(FM)을 제공하는 머신러닝(ML) 허브인 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)와 타사 소프트웨어 공급업체의 솔루션을 쉽게 배포할 수 있는 AWS의 엄선된 디지털 카탈로그인 AWS 마켓플레이스(AWS Marketplace)에서 만나볼 수 있다. 업스테이지 고객들은 메타버스 엔터테인먼트(Metaverse Entertainment), 쿼라(Quora), 커넥트웨이브(ConnectWave), 콴다(Qanda) 등 국내외 기업에서 이미 사용하고 있는 도메인별 학습 데이터를 활용해 솔라 미니를 미세 조정할 수 있다.

AWS코리아 공공부문 윤정원 대표는 “AWS상에 구축된 업스테이지의 솔라 미니는 모든 규모의 기업이 다양한 지역의 요구사항에 따라 생성형 AI를 쉽게 도입할 수 있도록 지원하는 강력한 솔루션”이라며, “업스테이지는 이런 역량을 활용해 AI 제품을 확장하고, 다양한 산업에 생성형 AI를 애플리케이션에 쉽게 배포할 수 있는 도구를 제공하고 있다”라고 말했다.

언어 모델은 컨텍스트, 메모리 기능 및 텍스트 생성을 제공해 생성형 AI 서비스를 가능케 한다. SLM은 수천억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)에 비해 경량으로, 200억 개 미만의 파라미터를 사용한다. 솔라 미니는 107억 개의 파라미터로 구성된 더 작은 학습 데이터세트로 추론(학습된 ML 모델을 사용해 새로운 입력 데이터를 기반으로 예측을 수행하는 과정)을 더 낮은 비용으로 실행할 수 있다.

업스테이지는 솔라 미니를 학습시키기 위해 우수한 컴퓨팅 성능과 비용 효율성을 갖춘 AWS를 선택했다. 한국어에 특화된 LLM 개발을 위해 ML 모델 개발 및 배포 서비스인 아마존 세이지메이커(Amazon SageMaker)를 활용했으며, 업스테이지가 설립한 업계 얼라이언스인 1T 클럽(1조 토큰 클럽)에서 제공한 데이터를 사용했다. 

여기에는 업스테이지의 고급 데이터 전처리(입력 데이터를 학습에 사용하기 전에 준비 및 정리하는 단계)와 검색 증강 생성(Retrieval-Augmented Generation, RAG–LLM의 출력을 최적화하는 과정) 등의 미세 조정 기술을 사용했다. 텍스트, 서적, 뉴스 기사, 보고서, 논문 등 저작권이 없는 다양한 고품질 한국어 학습 데이터로 구성된 이 데이터는, 문화적 뉘앙스에 대한 솔라 미니의 이해를 발전시키는 동시에 응답의 정확도를 높여 잘못되거나 부적절한 답변을 생성하는 ‘AI 할루시네이션(AI hallucination)’을 방지한다.

업스테이지 김성훈 대표는 “업스테이지는 AWS를 클라우드 우선 사업자로 선정하고, 크레딧과 기술 지원을 제공하는 AWS 액티베이트(AWS Activate) 등의 지원 프로그램을 통해 업스테이지의 스타트업 여정을 시작하고 비즈니스를 빠르게 확장했다”라고 말했다.dl-ciokorea@foundryco.com