자세히 보기

이지현
Senior Editor

“AI 훈련 효율 20% 향상”··· 서비스나우, ‘패스트LLM’ 오픈소스 라이브러리 공개

뉴스
2024.12.112분
생성형 AI오픈소스

서비스나우가 내부적으로 사용해온 AI 모델 훈련용 라이브러리'패스트LLM(Fast-LLM)'을 오픈소스로 10일 공개했다.

open source digital screen
Credit: Norman Chan / Shutterstock

서비스나우는 공식 블로그를 통해 “LLM을 훈련하는 것은 하드웨어, 데이터셋, 인력 등 막대한 자원이 요구되고 있다”라며 “더 많은 기관과 연구자들이 자체 모델 훈련을 시도하면서, AI 연구 및 개발 커뮤니티는 운영 비용 및 환경 비용을 낮추면서 책임감 있는 모델 훈련을 돕는 프로그램이 필요한 상태”라며 패스트LLM 개발 배경을 소개했다.

서비스나우에 따르면, 패스트LLM은 커널 효율성 및 메모리 사용을 최적화하면 훈련 시간과 비용을 최소화할 수 있다. 3D 병렬 처리(데이터, 텐서, 파이프라인)를 사용해 다중 GPU 및 노드에서 분산 훈련을 지원하면서 높은 확장성을 가진다. 여기에 사전 빌드된 도커 이미지로 신속한 배포가 가능하며, 간단한 YAML 구성 파일로 편리하게 설정할 수 있는 등 간편하게 사용할 수 있다.

파이토치와 트리톤 기반으로 개발된 패스트LLM은 1B에서 70B 이상의 매개변수를 가진 모델까지 훈련할 수 있다. 또한 고급 병렬 처리 기술을 적용해 최적화된 성능을 제공하며, 대규모 연속 사전 훈련과 미세 조정 작업에 모두 활용 가능하다. GPT 계열 언어 모델에 대한 통합된 지원도 제공된다. 서비스나우는 허깅페이스, 엔비디아와 협력해 개발한 LLM 스타코더의 후속 버전 훈련에 패스트LLM을 활용했다고 설명하기도 했다.

서비스나우 리서치 부문 니콜라스 샤파도스 부사장은 “패스트LLM로 기업은 AI 훈련 과정에서 최대 20% 효율성을 높일 수 있으며, 이를 통해 훈련 비용과 시간, CO2 배출량을 크게 줄일 수 있을 것”이라며 “수백만 달러가 소요되는 훈련 작업과 대규모 컴퓨팅 클러스터 운영에서 20%의 절감은 매우 중요한 차이를 만들 수 있다”고 밝혔다.

아파치 2.0 라이선스로 공개된 패스트LLM은 공식 깃허브 페이지를 통해 이용할 수 있다.
jihyun.lee@foundryco.com

이지현

2022년부터 CIO 코리아 책임 기자로 일하며 AI, 디지털 전환, 클라우드 등 주요 기술 이슈에 대한 최신 트렌드와 인사이트를 전달하고 있습니다. 국내외 IT 리더들을 대상으로 한 심층 인터뷰와 리더십 취재를 꾸준히 이어가고 있으며, 다양한 현장을 찾아 업계 흐름을 생생하게 전하고자 합니다. 아울러, 한국IDG가 주관하는 콘퍼런스와 조찬 세미나에도 참여하며, 국내 IT 리더들이 자연스럽게 교류하고 의견을 나눌 수 있는 자리를 만드는 데 힘쓰고 있습니다.

CIO 코리아 합류 전에는 2013년부터 기술 전문 매체 블로터에서 IT 기자로 활동했으며, 그보다 앞서 한국에서 컴퓨터공학을 전공하고 미국 뉴욕에서 1년간 프로그래머 인턴으로 근무한 경험이 있습니다. 현재도 취미로 프로그래밍을 이어가며, IT 업계에 종사하는 분들을 늘 응원하는 마음으로 취재 활동을 이어가고 있습니다.

이 저자의 추가 콘텐츠