대규모 언어 모델(LLM)은 다양한 산업 분야에서 혁신과 효율성을 이끌어내고 있다. 기업은 모델을 선택할 때 사용 목적, 속도, 보안, 비용, 언어, 사용 편의성 등을 고려해야 한다.
생성형 AI는 다른 인공지능 기술보다 비교적 새로운 기술이지만, 이미 입사 지원자 심사부터 질병 진단 및 치료법 추천에 이르기까지 다양한 업무을 지원하는 데 활용되고 있다. IDC에 따르면 2028년까지 CIO의 80%가 분석 가속화, 의사 결정 향상, 고객 서비스 개선 등을 위해 생성형 AI 도구를 사용할 것으로 예상됐다.
기업들은 고객 만족도와 직원 생산성을 높일 수 있는 생성형 AI 기술의 가능성을 최대한 활용하기 위해 경쟁하고 있다. 이를 위해 AI 코파일럿이나 챗봇 같은 생성형 AI 애플리케이션을 구동하는 데 가장 적합한 LLM을 찾고 있다.
LLM의 다양성 이해하기
다양한 LLM을 선택할 수 있다는 것은 기업이 획일화된 옵션에 의존하지 않고 특정 요구 사항에 적합한 LLM을 찾을 가능성도 높다는 의미다. 이를 통해 혁신을 앞당길 수는 있지만, 수백 가지 모델 중에서 모델을 선택하기란 쉽지 않다.
LLM을 고를 때 기업은 사용 목적, 속도, 보안, 비용, 언어, 사용 편의성 등을 고려해야 한다. 모델의 유형은 다음과 같다.
• 상업용 모델: 의료 및 금융 서비스 산업에서 널리 사용되며, 특수한 맞춤형 설정이나 보안 제한이 필요한 프로젝트에 사용된다.
• 오픈소스 모델: 접근성과 경제성으로 인해 연구 분야, 스타트업, 소규모 조직에서 자주 사용된다.
범용 모델: 방대한 양의 데이터로 학습되며, 맞춤형 AI 애플리케이션 구축을 위한 파운데이션 모델로 사용될 수 있다.
• 도메인 특화 모델: 의료나 금융 서비스 등 특정 산업이나 사용 사례에 맞게 학습된 모델이다.
• 작업 특화 모델: 요약, 질의응답, 번역 등 단일 자연어 처리(NLP) 기능에 최적화된 맞춤형 모델이다.
• 비전-언어 모델: VLM으로 불리는 이 모델은 컴퓨터 비전과 NLP를 결합해 텍스트 설명으로 이미지를 생성하고 이미지에서 객체를 인식한다. 텍스트와 코드를 모두 사용하기 때문에 시각 데이터에 대한 직접적인 학습 없이도 이미지를 생성하고 이해할 수 있다.
모델의 크기도 중요한 고려 사항이다. 크기에 따라 모델의 기능과 한계가 달라지기 때문이다. 그 외에 고려해야 할 요소는 다음과 같다.
• 추론 속도: 일반적으로 모델이 작을수록 추론 시간이 빨라져 실시간 처리가 가능해지고 에너지 효율과 비용 절감 효과가 높아진다.
• 정확도: 검색 증강 생성(RAG)으로 강화된 더 큰 모델이 종종 더 높은 정확도를 제공한다.
• 배포 가능성: 소규모 모델은 엣지 디바이스와 모바일 애플리케이션에 적합하고, 대규모 모델은 클라우드나 데이터 센터에서 이상적으로 실행된다.
• 비용: 대규모 모델은 실행하는 데 더 많은 컴퓨팅 인프라가 필요하다.
개발자는 또한 AI 모델을 사용할 대상과 적용 위치에 따라 지원하는 언어를 고려해야 한다. 이는 직원들이 다양한 언어를 사용하는 현대의 직장에서 특히 중요하다. 모델이 언어를 원활하게 번역할 수 있도록 하는 것은 사용 간의 효과적인 커뮤니케이션과 협업에 필수적이다.
또한 주권(sovereign) AI의 중요성이 커지면서 많은 국가에서 현지 언어와 데이터 세트로 학습된 자체 모델을 구축하고 있다. 이를 통해 각 국가는 AI에 대한 통제력과 자율성을 유지하고, 이러한 기술의 개발과 적용이 고유한 문화적, 윤리적, 법적 기준에 부합하도록 보장할 수 있다.
기업의 LLM 활용 방식
LLM은 챗봇과 예측 분석 도구 등 AI 애플리케이션을 지원해 다양한 산업 분야에서 혁신과 효율성을 제공하고 있다.
• 의료: 생성형 AI 기반 신약 개발 기업인 인실리코 메디신(Insilico Medicine)은 생물의학 질문에 답하고 새로운 분자를 합성하는 새로운 LLM 트랜스포머인 ‘nach0’을 개발했다. 연구자들은 멀티 도메인 모델을 통해 메모리 요구 사항을 줄이고 처리 속도를 높여 대규모 데이터 세트를 효율적으로 처리하고 분석할 수 있다.
• 통신: 암독스(Amdocs)는 ‘amAIz’ 플랫폼을 사용해 비즈니스 효율성을 개선하고 새로운 수익원을 창출하며 고객 경험을 향상시키고 있다. 여기에는 LLM 기반 데이터 인사이트와 자동화에 즉각적으로 액세스해 고객 청구 문의를 해결하는 고객 청구 에이전트가 포함돼 있다.
• 금융 서비스: 뱅크 네가라(Bank Negara, BNI)는 클라우데라의 AI 추론 서비스를 통합해 고객 경험을 개선하고 생성형 AI를 사용해 운영 효율성을 높이고 있다. 이를 통해 BNI는 안전한 엔터프라이즈 환경 내에서 대규모 AI 모델을 효율적으로 배포 및 관리해 높은 성능과 데이터 프라이버시를 제공할 수 있게 됐다.
특정 요구 사항에 맞춰진 다양한 모델은 반복 작업을 자동화하는 데 도움이 되는 AI 솔루션과 도구를 신속히 구현할 수 있다. 이를 통해 사용자는 기업과 조직의 발전을 위해 가치 있는 프로젝트에 집중할 수 있는 시간과 공간을 더 많이 확보할 수 있다.
앞으로 개발자들은 산업별 애플리케이션을 강화할 수 있는 LLM을 구축하고 배포할 뿐만 아니라 시스템 간 상호 운용성 개선, 운영 비용 절감, 효율성 향상에도 주력할 전망이다. 맞춤형 LLM을 통해 기업은 고객 만족도를 향상하고 운영 우수성을 촉진하는 데 필요한 고유 요구 사항을 충족하는 AI 애플리케이션을 구축할 수 있다.
* Amanda Saunders는 엔비디아(Nvidia)의 엔터프라이즈 생성형 AI 제품 마케팅 이사다.