하이퍼스케일 컴퓨팅 시나리오에서 생성형 AI 모델 실행하는 반도체가 부족한 가운데, 아마존과 구글과 같은 클라우드 서비스 업체는 자체 기술로 프로세서 수요를 충족해야 하는 상황에 직면했다는 연구 결과가 발표됐다.
시장조사기업 글로벌 데이터가 20일 발표한 자료에 따르면, AI 전용 워크로드용 GPU를 위해 엔비디아 협력하는 데 따른 비용 커지고 있다. 글로벌 데이터의 엔터프라이즈 기술 및 서비스 부문 수석 애널리스트 베아트리즈 발레는 “GPU 프로세서의 시장에서 수요와 공급 사이에 상당한 불균형이 존재한다”라고 지적하며, 특히 이미지와 동영상을 생성하는 생성형 AI 모델의 경우 GPU의 병렬 처리 기능성을 크게 필요로 한다고 설명했다.
자체 AI 칩 개발 움직임
이러한 추세에 대응하기 위해 구글과 아마존뿐만 아니라 메타, 마이크로소프트와 같은 주요 생성형 AI 기업들은 워크로드를 실행하기 위해 자체 독점 칩 기술에 상당한 투자를 단행하며 시장 공략에 나서고 있다.
2015년부터 발빠르게 움직인 구글은 텐서 처리 장치에서 머신러닝 애플리케이션을 가속화하기 위한 특수 칩을 개발할 계획으로 계속해서 박차를 가하고 있다. 아마존은 2018년부터 인퍼런시아(Inferentia) 및 트레이니움(Trainium) 아키텍처를 개발하고 있다.
페이스북과 인스타그램의 모기업인 메타도 AI 프로세서 경쟁에 뛰어들었다. 이 회사는 최근 소셜 미디어 플랫폼에서 AI 기반 랭킹 및 추천 광고를 지원하는 차세대 맞춤형 칩을 공개했다.
발레 애널리스트는 이러한 변화를 가장 잘 보여주는 신호로 마이크로소프트의 움직임을 언급했다. 마이크로소프트가 경쟁사보다 뒤늦게 마이크로프로세서 제작을 시도하기는 했지만 이후 막대한 생성형 AI 투자에 대응하는 프로세서 전략을 공개했다는 설명이다.
그녀에 따르면 마이크로소프트가 클라우드 인프라를 위해 설계한 최초의 맞춤형 실리콘 칩인 애저 마이아 100(Azure Maia 100)과 코발트 100(Cobalt 100) 칩은 특히 AI 워크로드를 위해 설계됐다. 마이크로소프트는 코발트 100 ARM 서버 CPU를 범용 작업에 사용하고, 마이아 100 AI 가속기를 애저 데이터센터에 사용하여 오픈AI 및 코파일럿용 서비스를 지원할 계획이다.
발레는 “마이크로소프트 이 단계를 밟는다는 것은 야심찬 AI 계획을 추진하기 위해 혁신에 많은 돈을 투자하고 있다는 것을 의미한다”라고 말했다.
칩 환경의 변화
“이들 네 회사의 투자는 시장이 매우 경쟁이 치열하며 하이퍼스케일러들이 야심찬 AI 계획을 추진하기 위해 새로운 아키텍처에 적극적으로 투자하고 있다는 증거다. 아직 시장 초기 단계이기 때문에 각 기업에게는 초기 경쟁 우위를 확보할 수 있는 시간이 남아 있다”라고 발레는 평가했다.
단 이러한 움직임이 엔비디아의 지배적인 위치에 도전하는 성격을 지니지만 당장은 아니라는 진단이다. 또 ‘AI 칩 경쟁’은 대규모 언어 모델을 제공하기 위한 경쟁과 비슷한 경로를 따를 것이며, 오픈AI를 비롯한 일부 기업도 이 경쟁에 참여할 가능성이 높다고 그녀는 예상했다.
발레는 “더 빠르게 작동하고 전력을 덜 소비하며 신경망 훈련과 추론에 더 효과적으로 최적화할 수 있는 맞춤형 AI 칩을 만드는 데 초점을 맞추고 있는 스타트업들도 있다. 세라브라스(Cerebras), 그록(Groq), 미틱(Mythic), 그래프코어(Graphcore), 캠브리콘(Cambricon), 호라이즌 로보틱스(Horizon Robotics) 등이다”라고 말했다.
발레에 따르면 이러한 업체들은 모두 엔비디아를 비롯한 기존 업체들에게 압력을 가할 전망인 가운데, 업계의 기성 기업과 신생 기업 모두는 저마다 고유한 도전에 직면할 가능성이 높다. 하지만 이를 통해 업계 전체에 “전례 없는 성장을 견인”할 전망이다.
그녀는 “생성형 AI에 특화된 칩이 등장함에 따라 엔비디아 및 AMD의 GPU에 대한 대안으로 부상할 것”이라면서도 “하지만 스타트업들은 고객 기업과의 관계, 제조 역량, 자본 측면에서 장벽에 직면할 수 있다”라고 말했다. dl-ciokorea@foundryco.com