자세히 보기

By 편집부

HPE, 美 로렌스 리버모어 국립연구소에 DLC 엑사스케일 슈퍼컴퓨터 ‘엘 캐피탄’ 구축

뉴스
2024.11.213분

HPE는 미국 애틀란타에서 열린 ‘슈퍼컴퓨팅 2024 (SC24)’에서 미국 에너지부(DOE) 로렌스 리버모어 국립 연구소(Lawrence Livermore National Laboratory, LLNL)에 세계에서 가장 빠른 슈퍼컴퓨터인 ‘엘 캐피탄(El Capitan)’을 구축했다고 발표했다.

HPE El capitan
Credit: HPE

이번 구축으로 HPE는 지금까지 출시된 3개의 엑사스케일 시스템을 모두 담당한 기업이 됐다. 엘 캐피탄은 1.742 엑사플롭스의 성능을 자랑하며, 와트당 58.89 기가플롭스의 성능을 달성한 100% 팬리스 직접 수냉 방식(DLC) 시스템이다. 세계에서 가장 에너지 효율적인 시스템 상위 20위에 이름을 올렸다.

HPE의 HPC 및 AI 인프라 솔루션 부문 수석 부사장 겸 총괄 트리시 댐크로거는 “엘 캐피탄은 엑사스케일 슈퍼컴퓨팅의 중요한 이정표를 세웠다. 엘 캐피탄은 뛰어난 성능과 에너지 효율성을 제공하며, AI 기반 과학적 발견을 가속화하고 국가 안보를 강화하는 동시에 재생 가능 에너지 분야에서 새로운 기회를 창출할 수 있는 역량을 갖추고 있다. 미국 에너지부, 국가핵안보국, LLNL 및 AMD와의 강력한 파트너십과 수년간의 연구개발 결과로 이루어진 이 성과를 자랑스럽게 생각하며, 엘 캐피탄이 이끌어낼 미래의 성과와 엔지니어링 혁신을 기대한다”라고 말했다.

HPE에 따르면 엘 캐피탄은 미국이 국가 안보 분야에서 경쟁력을 유지할 수 있도록 지원하며, 국가핵안보국(NNSA)의 세 연구 기관(LLNL, 샌디아 국립 연구소, 로스앨러모스 국립 연구소)이 증가하는 요구사항을 충족하고, 국가 핵무기 비축의 안전성, 보안 및 신뢰성을 보장하며, 현재를 포함한 향후 비축 현대화 작업을 수행할 수 있도록 한다. 또한, LLNL은 기밀과 비기밀 작업에 인공지능(AI) 모델을 적극적으로 활용할 계획이다.

LLNL의 무기 시뮬레이션 및 컴퓨팅 프로그램 책임자 로브 닐리는 “지난 5년간 HPE 및 AMD와 협력하여 엘 캐피탄을 성공적으로 구축하게 됐다. 오랫동안 기다려온 이 시스템은 고정밀 3D 모델링과 시뮬레이션을 통해 국가 안보 임무를 효과적으로 수행할 수 있는 기반을 제공한다. 많은 팀원들이 전문가 그룹에 속한 HPE의 지원을 받으며 애플리케이션을 준비해 시스템의 성능을 최대한 발휘할 수 있도록 노력했다. 이제 이 시스템의 역량을 후원자와 지지자들에게 선보일 날을 기다리고 있다. 또한, 엘 캐피탄에서 AI에 대한 투자를 지속적으로 확대할 계획이며, 대규모 AI 학습 및 추론을 통해 계산을 더 빠르고 효율적으로, 그리고 잠재적으로 더 정확하게 수행할 것이다. 모델링, 시뮬레이션 및 AI 워크로드를 단일 시스템에서 모두 처리할 수 있는 역량을 갖추게 된 것은 중요한 진전을 이룬 것”이라고 말했다.

엘 캐피탄은 핵 확산 방지 및 대테러 활동 등 국가 안보 유지를 위한 부차적인 임무뿐만 아니라 재료 발견, 핵 데이터, 고에너지 밀도와 같은 과학 분야에서도 활용될 예정이다. 특히, 국가 점화 시설(National Ignition Facility)에서 진행되는 관성 구속 핵융합 연구를 지원할 계획이다. 엘 캐피탄에서 진행된 연구를 통해 확보한 인사이트는 에너지 안보, 기후 변화, 전력망 현대화, 신약 개발 등 다양한 분야의 비기밀 프로젝트에도 폭넓게 활용될 전망이다.

엘 캐피탄의 성능은 HPE의 슈퍼컴퓨팅 솔루션인 HPE 크레이 EX(HPE Cray EX)를 기반으로 한 혁신적인 플랫폼에서 비롯된다. 이 플랫폼은 CPU 코어, GPU 코어 및 고대역폭 메모리(HBM)를 단일 패키지로 통합한 AMD 인스팅트 MI300A APU와 HPE 슬링샷(HPE Slingshot) 인터커넥트, 그리고 맞춤형 스토리지 솔루션을 갖추고 있다. HPE 슬링샷은 시스템의 백본 역할을 하는 이더넷 기반의 고속 패브릭으로, 엘 캐피탄의 11,000개 이상의 노드를 연결해 대규모 계산을 수행할 수 있게 한다.

또한, HPE와 LLNL은 공공-민간 파트너십의 일환으로 맞춤형 근접 노드 로컬 스토리지 솔루션을 공동 개발했다. 지연 시간을 줄이기 위해 만들어진 이 솔루션은 동적으로 구성되며, 모든 컴퓨팅 노드에서 공유되는 글로벌 러스터(Lustre) 기반 파일 시스템에 계층적으로 연결되어 운영 효율성을 극대화한다.

엘 캐피탄은 뛰어난 성능은 물론 에너지 효율성을 최우선으로 고려해 설계되었다. HPE의 업계 최초 100% 팬리스 직접 수냉 방식(DLC) 시스템 아키텍처를 통해 고집적도 설계를 가능하게 했으며, 8개의 냉각 요소를 통해 효율성을 극대화했다.
dl-ciokorea@foundryco.com