비용 절감, 탄소 배출량 감소, 규정 준수, 고성능 AI 워크로드 수용 등 여러 가지 이유로 기업은 더욱 에너지 효율적인 데이터센터를 운영하고자 한다. 이런 목표를 달성하기 위한 핵심은 장비와 구성요소를 냉각하는 데 도움이 되는 올바른 기술을 선택하는 것이다. 과열된 장비는 성능과 신뢰성뿐만 아니라 데이터센터의 에너지 효율에도 영향을 미칠 수 있으므로 적절한 냉각 시스템이 필수적이다.
서버 및 기타 데이터센터 장비를 냉각하는 가장 좋은 방법은 냉각 방식의 유형, 장비에 냉각을 분배하는 방법, 냉각 시스템을 제어하는 방법, 냉각 성능을 측정하는 방법 등 여러 가지 요인에 따라 달라진다.
3가지 유형의 공랭 시스템
오늘날의 데이터센터 냉각 방식은 크게 공랭식과 수랭식 두 가지로 나뉜다. IDC의 연구에 따르면, 공랭시스템은 3가지 접근 방식으로 나눌 수 있으며, 각 접근법에는 장단점이 있다.
CRAC(Computer Room Air Conditioning). 데이터센터의 격벽을 따라 냉각 시스템을 배치해 장비에 찬 공기를 배포하는 방식이다. 냉각 시스템은 외부에서 공기를 끌어들여 냉각한 후 팬과 덕트를 사용해 데이터센터 전체에 분배한다. 장비에서 나오는 뜨거운 공기는 다시 냉각 시스템으로 흡입되어 외부로 배출된다. 이 방식의 장점은 간단하고 비용 효율적이며 유연하고 확장 가능하며 유지 관리가 비교적 쉽다는 것이다. 하지만 다른 데이터센터 냉각 시스템에 비해 효율성이 떨어진다. 특히 대규모 데이터센터의 경우 냉기가 고르게 분배되지 않을 수 있으며, 다른 냉각 시스템보다 더 많은 바닥 공간이 필요하다는 단점이 있다.
이중바닥 차폐 CRAC. 기본적으로는 CRAC와 같은 방식의 냉각 시스템이다. IDC에 따르면 이 방식은 차폐 장치가 추가되어 더운 공기와 찬 공기가 섞이는 것을 방지한다. CRAC와 비교해 냉각 효율이 향상되고 에너지 비용이 절감되며 핫스팟의 위험이 줄어든다. 하지만 초기 비용과 복잡성 증가, 공간 활용도 감소, 결로 위험 증가 등의 단점이 있다.
랙 기반 냉각. 전용 냉각 장치를 사용해 서버 랙의 개별 행을 냉각하는 방식이다. 냉각 시스템은 서버 랙의 행별로 설치되며, 더운 공기와 차가운 공기를 분리하기 위해 차폐 장치를 사용한다. 이를 통해 냉각 효율이 향상되고 에너지 비용이 절감된다. 냉각 효율 향상, 에너지 비용 절감, 핫스팟 위험 감소 등의 장점을 얻을 수 있지만, 초기 비용과 복잡성 증가, 공간 활용도 감소, 결로 위험 증가 등의 단점도 있다.
3가지 유형의 수랭 시스템
데이터센터 코로케이션 서비스 업체 에퀴닉스(Equinix)의 글로벌 IBX 운영 엔지니어링 담당 부사장인 아노 반 제닙은 공랭식 냉각에는 한계가 있다고 말한다. 제닙은 “프로세서의 전력 사용량이 꾸준히 증가함에 따라 일부 애플리케이션에서는 공랭식 냉각만으로는 충분하지 않을 것”이라고 지적했다. 이로 인해 데이터센터 냉각 기술의 또 다른 주요 범주인 수랭 시스템이 주목받고 있다.
제닙은 “에퀴닉스는 고밀도 데이터센터를 지원하기 위한 기술로 수랭 시스템이 다시 부상하고 있다. 지금까지는 공랭식 냉각이 지배적인 방식이었지만, 이제는 공기보다 열을 더 효율적으로 전달할 수 있는 수랭 시스템을 도입하려는 기업이 늘고 있다”라고 밝혔다.
액침 냉각(Immersion Cooling). 액침 냉각은 서버와 기타 IT 장비를 비전도성 액체에 담그는 방식으로, 감전 위험 없이 서버를 액체에 완전히 담글 수 있다. 액침 냉각은 냉각수가 전체 공정에서 액체 상태로 유지되는 단상 또는 냉각 시 기체로 변환됐다가 다시 액체로 돌아오는 2상 방식이 있다. 액침 냉각은 열을 가장 잘 방출하고 에너지 효율과 환경에 미치는 영향도 개선할 수 있다. 단점은 서버를 개조해야 하고 구현 및 유지 관리가 복잡하다는 점이다. 액침 냉각을 통해 기업은 데이터센터 내에서 높은 전력 밀도를 구현할 수 있지만, 서버 기술과 데이터센터 아키텍처에 큰 변화가 필요하다. 제닙은 “액침 냉각은 기존 IT 장비 배치 방식에서 크게 벗어나기 때문에 초기 비용과 고려 사항이 상당히 많을 것”이라고 지적했다.
칩 직접 냉각(Direct-to-Chip Cooling). 칩 직접 냉각은 CPU 또는 기타 열을 발생시키는 구성 요소 위로 액체 냉각수를 직접 순환시켜 장비에서 열을 흡수한 다음 열 교환기를 사용해 주변 공기나 물로 열을 방출한다. 액침 냉각과 마찬가지로 단상 또는 2상 방식으로 구현할 수 있다. 칩 직접 냉각은 액침 냉각과 비교해 높은 열 방출, 에너지 효율 및 환경 영향 개선, 공간 절약 등의 장점이 있다. 마찬가지로 서버를 개조해야 하고 구현 및 유지 관리가 복잡하다. 제닙은 칩 직접 냉각 방식은 표준 설치 공간에 적합하지만 “액체를 캐비닛에 전달하고 개별 서버에 분배하기 위해 아키텍처 변경과 추가 장비가 필요하다”고 설명했다.
공기 보조 수랭(Air-assisted liquid cooling, AALC). 데이터센터 랙 후면에 액체로 채워진 라디에이터를 부착해 공기 냉각을 강화하는 방식이다. 데이터센터 서비스 및 코로케이션 업체인 디지털 리얼티(Digital Realty)의 CTO 크리스 샤프는 “AALC 방식으로 일반적인 공랭 구성의 35KW 상한을 초과하는 밀도의 데이터센터를 구축할 수 있으며, 때로는 70KW까지 높일 수도 있다”고 설명했다. AALC 방식은 장비를 개조할 필요가 없기 때문에 공랭식과 수랭식 간의 좋은 중간 지점이다. 수랭 시스템은 대부분 100KW 이상을 냉각할 수 있기 때문에 AI/ML 등에 사용되는 고성능 고밀도 랙에 가장 적합하지만, 운영 및 배포 측면에서 가장 복잡하다. 데이터센터 운영자는 랙에 액체를 공급해야 하고, 기업은 서버 내부에서 열을 발생시키는 구성 요소에 히트 블록을 부착할 수 있는 호환 장비도 갖춰야 한다.
수랭 시스템을 사용하더라도 일부 공랭식 냉각은 여전히 필요하다. 샤프는 “특정 서버 내에서 모든 것을 수랭 시스템으로 냉각할 수는 없다. 즉, 공랭 시스템으로 시작해 시간이 지나면서 수랭 시스템을 추가하는 것이 보통은 가장 좋은 방법”이라고 강조했다.
데이터센터 시설은 대부분 공랭식 냉각을 전제로 설계된다. 많은 경우 기존 시설을 개조해 AALC 또는 직접 액체 냉각을 사용할 수 있지만, 모듈식으로 설계되지 않은 시설에서는 구현 자체가 어려울 수도 있다. 샤프는 “데이터센터 운영자는 예상되는 고객 공간에 맞게 시설에 수랭 시스템을 적용하는 가치를 평가해야 한다. 모든 환경에 수랭 시스템이 필요한 것은 아니다”라고 지적했다. 또 “새로 구축된 데이터센터라면, 수랭 시스템을 구현할 수 있어야 한다. 처음부터 수랭 시스템을 구축할 수 있어야 하고 나중에 추가하기도 쉬워야 한다”고 덧붙였다.
새로운 데이터센터 냉각 기술
데이터센터 기획자와 구축자는 지열 냉각을 비롯한 몇 가지 새로운 냉각 기술을 고려할 수 있다.
지열 냉각은 지표면 아래는 비교적 일정한 지구의 온도를 이용해 데이터센터 장비를 냉각하는 기술이다. IDC의 클라우드 엣지 데이터센터 트렌드 리서치 책임자 션 그레이엄은 “장비에서 발생하는 열은 유체로 전달되어 지하 열교환기를 통해 순환된다. 유체는 열교환기를 통과하면서 냉각되고, 다시 데이터센터로 돌아와 장비를 냉각시킨다”고 설명했다.
업계에서는 이미 공기 이코노마이저(Economizer), 냉수 이코노마이저, 증발식 냉각을 조합해 사용할 수 있는 공기 보조 냉각의 이점을 실현하고 있다. 그레이엄은 “이런 기술은 에너지 소비를 줄이고 지속 가능성을 개선하는 것으로 입증됐다. 다만, 특정 기후에서만 사용할 수 있다는 단점이 있다. 하지만 지열 냉각은 이런 제약이 없다”라고 강조했다.
지열 냉각은 에너지 소비와 물 소비를 크게 줄일 수 있으며, 데이터센터 장비의 신뢰성을 개선하는 데도 도움이 된다. 특히 공기 보조 냉각과 달리 모든 지역에서 사용할 수 있다. 하지만 폐열을 제거할 수 있는 지리적 특성이 필요하다. 가트너의 인프라 및 운영 부문 수석 애널리스트 토니 하비는 “지열 발전과 마찬가지로 이를 사용할 수 있는 위치에 있어야 한다. 또한 방열판에 환경적 영향이 있을 수 있다. 예를 들어 호수에 따뜻한 부분이 생기면 수생 생물에 변화가 생길 수 있다. 반드시 나쁜 영향은 아니지만, 영향이 있는 것은 사실이다. 특히 냉매가 일반 물이 아닌 경우 유출도 유의해야 한다”고 설명했다.
AI를 활용한 데이터센터 냉각 개선
AI 기반 애플리케이션에서 생성되는 데이터센터 냉각 요구 사항으로 인해 발생하는 문제를 해결하기 위해 AI를 사용하는 것은 흥미로운 접근 방식이다. 그레이엄은 “일부 데이터센터는 이미 냉각을 최적화하기 위해 AI를 사용하고 있으며, 그 사용례와 기능이 확대되고 있다”고 밝혔다.
AI는 냉각 요구 사항을 예측하고 그에 따라 냉각 용량을 조정하는 데 사용되며, 알고리즘은 최적의 성능을 보장하기 위해 냉각 시스템을 실시간으로 조정할 수 있다. 또한 냉각 효율을 개선하기 위해 장비 업그레이드 또는 구성 변경에 대한 권장 사항을 제공할 수도 있다.
AI를 활용할 수 있는 또 다른 영역은 성능 분석이다. 그레이엄은 “AI는 냉각 시스템의 성능에 대한 귀중한 인사이트를 제공해 개선이 필요한 부분을 파악하고 시스템이 효율적으로 운영되고 있는지 확인할 수 있다”라고 말했다.
데이터센터 냉각에 AI를 사용하는 것은 아직 초기 단계이다. 샤프는 “현재는 유체 역학 관점에서 시설의 열 모델링을 지원해 핫스팟을 격리하고 방지하는 데 AI를 사용할 수 있다. 앞으로는 데이터센터의 장비에서 대량의 운영 데이터를 수집해 단일 사이트의 다양한 랙 밀도에 걸쳐 냉각을 최적화할 수 있는 더 많은 운영 시스템에서 AI가 사용될 것”이라고 전망했다.
AI로 인해 데이터센터의 평균 랙 밀도가 증가하고 있으며, 이 때문에 더 많은 수랭 시스템이 필요해졌다. 샤프는 “비전도성 냉각제, 고객 장비를 시설의 액체 루프에 쉽게 연결할 수 있는 업계 표준 백플레인 커넥터, 지능형 유량 제어 시스템 등 이 분야의 혁신은 모두 데이터센터의 안전성, 접근성, 성능, 환경 영향을 개선하는 데 유망한 기술이다”라고 강조했다.
제닙은 냉각 시스템의 에너지 사용량을 줄이기 위해 기존 제어 시스템을 대체하는 제어 시스템으로 AI/ML 기술을 시험적으로 사용하고 있으며, “초기 결과는 매우 유망해 보인다”고 말했다.
기존 데이터센터와 새로 건설된 시설에 적합한 기술이 따로 있을까? 그레이엄은 “궁극적으로 모든 데이터센터에 적합한 냉각 방법은 데이터센터의 설계, 기후, 환경 목표, 냉각 요구 사항, 예산 등 여러 가지 요인에 따라 달라진다”며, 최신 데이터센터, 특히 생성형 AI와 같은 고밀도 워크로드에 중점을 둔 데이터센터는 칩 직접 냉각이나 액침 냉각이 더 적합할 것”이라고 덧붙였다.
editor@itworld.co.kr