AMD의 CIO인 하스무크 란잔은 클라우드와 관련해 복합적인 입장을 취하고 있다. 칩 제조사인 AMD는 퍼블릭 클라우드 업계에 필수적인 동력을
AMD와 같은 칩 제조업체는 설계 작업과 관련해 페타바이트 단위의 스토리지뿐만 아니라 메가 코어의 컴퓨터 파워 및 메모리를 필요로 한다. 그가 부임한 지 1년이 지난 현재 AMD의 비즈니스 애플리케이션의 약 95%가 퍼블릭 클라우드에서 실행되고 있다. 그러나 AMD가 프로세서를 만들기 위해 생성하는 거대한 엔지니어링 애플리케이션은 클라우드에서 실행되지 않는다.
그는 “적어도 우리 비즈니스의 핵심인 엔지니어링 작업은 특이성을 지닌다. 클라우드 공급업체는 우리가 찾는 고급 머신을 거의 보유하고 있지 않다”라고 설명했다. 그에 따르면 AMD의 설계 애플리케이션은 코어당 64GB를 필요로 한다. 란잔은 “내부 시스템을 2~4 테라바이트 규모로 확장하고 있다”라고 말했다.
그는 또한 AMD의 확장 중인 제품 포트폴리오, AMD 설계 작업의 높은 속도, 칩 설계 프로세스에서 생성되는 방대한 양의 데이터를 언급하며, 이러한 엄청난 요구사항이 3가지 벡터(vectors)인 ‘다양성(variety), 속도(velocity), 규모(volume)’에서 지속적으로 증가하고 있다고 설명했다.
이로 인해 대규모 HPC 워크로드가 퍼블릭 클라우드에서 광범위하게 지원될 때까지 비즈니스 프로세스는 클라우드에, 엔지니어링은 온프레미스에 있을 전망이다. AMD의 디지털 인프라가 당분간 하이브리드로 유지된다는 의미다.
칩 설계의 변화하는 특성
AMD의 모든 칩 엔지니어링 프로세스가 온프레미스에서 수행되는 것은 아니다. 란잔은 AMD의 연산 작업 중 10~15%가 클라우드에서 이루어지며, 이는 이 업계에서 일반적인 수준이라고 밝혔다.
엔지니어링 요구사항으로 인해 대부분의 칩 제조업체는 케이던스 디자인 시스템즈(Cadence Design Systems), 시놉시스(Synopsys), 지멘스(Siemens)와 같은 전자설계자동화(electronic design automation, EDA) 벤더와 처음부터 끝까지 온프레미스에서 협력하곤 한다. 이러한 긴밀히 통합된 프로세스는 데이터 무결성 및 보안 또한 보장한다.
그러나 상황이 변화하고 있는 것도 사실이다. AMD의 란잔은 2월에 발표된 마벨 세미컨덕터(Marvell Semiconductor)와 AWS의 파트너십을 언급했다. 양사의 파트너십은 반도체 회사들이 생산의 모든 측면에서 클라우드를 더 많이 사용하도록 유도하는 지표라는 설명이다. 이 발표에 따르면, 마벨은 칩 설계에 클라우드 우선 접근방식을 취하기 위해 EDA의 클라우드 공급업체로 AWS를 선택했다.
란잔은 “반도체 업계는 기술적인 이유 및 상업적인 이유로 퍼블릭 클라우드를 다소 늦게 채택했다. 하이엔드 시스템의 경우, 아직까지는 그라운드(ground)와 클라우드의 가격 차가 상당히 클 수 있다”라고 설명했다.
그러나 업계 애널리스트들에 따르면 거의 모든 반도체 기업이 클라우드 공급업체와 긴밀한 파트너십을 이미 맺은 상태다. 예를 들어, 반도체 기업들은 중요한 버티컬(vertical)을 위한 일부 워크로드를 수용할 수 있도록 전문화된 HPC 클라우드 서비스를 클라우드 서비스 기업들과 함께 설계하고 구축했다.
케이던스, 시놉시스 및 마벨과 같은 칩 설계 서비스는 본질적으로 반도체 산업을 위한 산업 클라우드다. 유일한 차이점은 칩 제조업체가 제품 생산을 위한 온프레미스 엔지니어링 설계 이동을 목적으로 제조 파트너 혹은 팹과 직접 협력한다는 점이다.
캘리포니아주 산호세에 위치한 기술 제조 컨설팅 회사인 테크인사이트(TechInsights)의 제품 담당 이사인 리스토 푸하카는 “반도체 설계와 제조의 비즈니스 규모는 기존 클라우드가 감당할 수 있는 범위를 넘어서고 있다. 이러한 데이터 흐름은 놀라울 정도로 방대하다. 웨이퍼 프로세싱을 위한 마스크를 만들기 위해 데이터를 TSMC로 이동하기 위한 전용 파이프라인을 생성해야 할 정도다”라고 설명했다.
내부 IT 혁신
이와 동시에 란잔은 클라우드를 최대한 활용해 비즈니스 목표를 충족하도록 회사의 디지털 인프라를 혁신하고 있다. 예를 들어, AMD는 최근 SAP 애플리케이션을 퍼블릭 클라우드로 이동했다.
그는 회사의 엔지니어링 팀에 충분한 리소스를 제공할 수 있도록 대규모 데이터 리포지토리 및 애널리틱스를 갖추도록 보장하는 임무 또한 맡고 있다. 이를 위해 AMD는 AWS, 마이크로소프트 애저, 구글 클라우드 플랫폼 및 오라클 클라우드에 선도적인 데이터 레이크하우스, 자동화된 애플리케이션 및 AI 알고리즘을 구현했다.
란잔은 칩을 설계할 최첨단 하이브리드 플랫폼을 엔지니어에게 제공하고자 하며, 아직까지는 이 모든 게 순조롭다고 전했다.
그는 “연산의 대부분은 미국에 위치한 대규모 데이터센터에서 이루어진다. 하나는 애틀란타에 있고 나머지는 전 세계에 흩어져 있다”라고 언급했다. 또한 그는 AMD 서버 제품군의 54%가 2년이 채 되지 않았다고 덧붙인다. 그는 “이는 상당히 효율적인 컴퓨팅을 가능케할 뿐만 아니라 지속 가능성을 위한 스위트 스폿이기도 하다”라고 이야기했다.
AI 도입
지난 10년 동안 반도체 분야에서는 수요와 공급이 롤러코스터처럼 움직였다. 최근에는 팬데믹으로 인해 재료 공급 지연이 제조 공정 지연으로 이어져 심각한 칩 부족 현상이 발생했다. 그러나 경기 침체 가능성이 소비자 기기, PC 및 서버 수요를 둔화시킴에 따라 이러한 부족 현상이 완화된 상태다. 자동차 산업에서만 일부 잔존하고 있다.
그러나 클라우드 하이퍼바이저(cloud hypervisors)의 지속적인 증가, 가장 최근의 경우 챗GPT와 같은 머신러닝 모델 및 플랫폼에 대한 수요 증가로 인해 AMD, 인텔 및 엔비디아와 같은 기업에 대한 수요가 지속적으로 증가하고 있다.
AMD의 설계자들 또한 AI의 큰 소비자이며, 이러한 도구들은 AMD의 설계 프로세스에 꾸준히 통합되고 있다. 케이던스, 시놉시스 및 지멘스의 고도로 전문화된 EDA 도구 외에도 반도체 워크플로는 소스 코드 관리 시스템 및 AI를 점차 요구하고 있다.
란잔은 “사용 가능한 새로운 AI 기술 및 도구를 검토해 상황을 개선하고자 시도하고 있다. 여러 도구가 각기 다른 배포 단계에 있으며, 일부는 내부적으로 개발되고 있고 또 일부는 각기 다른 AI 벤더와 파트너십을 맺고 있다”라고 설명했다.
“반 발자국만 앞서겠다”
반도체 기업의 CIO가 클라우드와 맺는 관계는 다른 업종의 CIO들과 비슷하지 않을 수 있다. 그러나 란잔의 주요 업무는 다른 모든 기업의 CIO가 맡고 있는 업무와 동일하다고 그는 전했다. 즉, IT 투자를 조직 전반의 비즈니스 요구사항 및 목표와 정렬하는 것이다.
란잔은 자신의 회사의 변화하는 지침을 규모에 맞게 확장 및 지원하기 위해, 그리고 비즈니스 및 기술 모두에서 회사의 다양한 구성원이 필요로 하는 인프라를 제공하기 위해 비즈니스 측면에서 반 발자국만 앞서고자 한다고 말했다.
그는 “회사의 가치를 창출하고 회사의 비즈니스와 부합되는 게 꿈이다. 만들고 있는 솔루션이 회사의 변화하는 비즈니스 요구사항에 100% 부합하는지 여부를 가장 먼저 찾는다. 매일 이러한 모드에 있길 소망한다”라고 말했다. dl-ciokorea@foundryco.com