자세히 보기

jim_duffy
By jim_duffy

미래의 서버, 스위치의 필요성을 없앨까?

가상화되는 서버가 증가하고 있으며, 가상 스위치로 연결을 처리하는 경우가 늘어나고 있다. 그렇다면 ToR(Top Of Rack) 데이터 네트워크의 스위칭은 결국 서버에 흡수되고 마는 것일까?

그렇다고 주장하는 이들이 있다. 현대적 서버들은 멀티코어 프로세서, 추가된 레이어2 인텔리전스, 밀집된 광 커넥터를 탑재하고 있다는 점에서 그렇다는 주장이다. 이때, 서버의 방향 지시에 따라 트래픽을 이동시키는 광 교환기가 업스트림의 핵심 연결성을 제공할 수 있다.

그러나 지금 당장은 현실성이 없는 이야기라고 말하는 사람들도 있다. 서버가 가상 머신에서 스위치의 역할을 더 많이 수행하겠지만, 당분간은 ToR이 존속할 것이라는 주장이다.

델오로 그룹(Dell’Oro Group)의 스위칭 전문가인 앨런 웨켈은 서버가 ToR 스위치를 대체할 것인지 묻는 질문에 “단순히 대답하면 ‘그렇지 않다’가 대답이다. 아직까지는 랙 서버를 ToR 스위치에 연결하는 것이 중요하다. 이런 방식이 현재 시장의 80%를 차지하고 있다. ToR은 당분간 끄떡 없을 것이다”라고 말했다.

“아직까지는 랙 서버를 ToR 스위치에 연결하는 것이 중요하다. 이런 방식이 현재 시장의 80%를 차지하고 있다. ToR은 당분간 끄떡 없을 것이다.”

– 델오로 그룹의 스위칭 전문가 앨런 웨켈


그러나 파이버 마운틴(Fiber Mountain)은 이에 반대하는 회사 가운데 하나다. 이 신생 기업은 데이터센터 서버 포트간 직접 점대점 파이버 링크를 구현해 패킷 처리를 (가능한) 많이 없애는 소프트웨어 제어 기반의 광 교환기를 생산하고 있다.

파이버 마운틴을 창업한 MH 라자 CEO는 “스위치 계층, 스위치간 링크 계층 등 계층을 없애고 있다. 스위칭이라는 기능이 스위치라고 불리는 상자 내부에서 서버라고 불리는 상자 내부에 공존하는 기능으로 바뀌고 있다. 스위칭 기능을 서버 내부로 집어넣는다고 가정하자. 이는 여러 서비스를 프론트 엔딩하는 랙과 동일한 논리다. 스위치가 있고, 내부에서 여러 VM을 프론트 엔딩하는 서버 하우징이다. 서버에서 이런 결정을 내리지 못할 이유가 있을까? 서버에서 구현이 가능하다”라고 말했다.

라자는 (이름을 공개하지는 않았지만) 브로드컴 트라이던트 II (Broadcom Trident II) 스위치 칩과 고성능 광 커넥터가 내장된 인텔 멀티코어 서버 머더보드를 공급하는 벤더가 이미 있다고 전했다.

이 1U 디바이스에는 800G~1.6Tbps의 성능으로 최대 64개의 25Gbps 레인을 지원할 수 있는 광 포트가 한 개 있다. 인텔과 Corning MXC 커넥터를 사용했을 때와 유사한 성능이다. MXC 또는 유사한 실리콘 포토닉스가 있는 서버는 스위치 없이 직접 통신을 할 수 있다.

그는 “서버 단계에서 결정을 내릴 수 있는 것이다. 나는 필요한 레인으로 패킷을 지정할 수 있다. 얼만 많은 레인을 지원해야 할까? 10개, 12개, 40개? 문제 없다. MXX 커넥터가 있다면 32개의 방향으로 패킷을 보낼 수 있다”라고 말했다.

라자는 현재도 충분히 가능한 기술임에도 불구하고 오히려 그 파괴적인 잠재력 때문에 이를 이야기하는 사람이 없는 설정이라고 말했다. 기존의 네트워크적 사고에 눈이 가려져 있는 상태라는 진단이다.

라자는 “실리콘 포토닉스가 얼마나 빨리 도입될지에 달려있기 때문에 이야기를 하는 사람이 없다. 그러나 지금도 가능하다. 시기는 기술과 시장의 변화, 투자에 달려 있다”라고 말했다.

VM웨어(VMware)의 NSX 제품은 VM웨어 가상 서버 환경에서 가상 스위칭을 처리하도록 설계돼 있다. 이런 점을 감안하면, VM웨어 또한 서버가 궁극적으로 스위치를 흡수할 것이라는 주장을 지지하는 회사로 생각될 수 있다.

그러나 VM웨어 네트워크 보안 사업 부문의 구이도 아펜젤러 최고 기술 전략 책임자는 하이퍼 스케일 환경에서 ToR 스위치로 기능을 하는 서버에 대한 아키텍처 모델을 제시했지만, 실제 사용 사례는 단 한 건도 없다고 전했다.

아펜젤러는 “ToR을 모두 없애려면 서버에 새 실리콘이 필요하다. 또 미니 스위치가 필요할 수 있다. 현재 아키텍처에서는 지원하지 않는 부분이다”라고 설명했다.

직접적인 방식의 서버와 서버간 패브릭을 구현하는 이더넷 장치가 이런 미니 스위치로 기능할 수 있다. 서버 머더보드의 멀티플랙서와 1계층 교환기도 또 다른 선택지가 될 수 있다.

아펜젤러는 이더넷 미니 스위치에 더 높은 점수를 줬다. 현재 서버 환경과 유사하고, 광 교환기는 처리할 수 없는 가상 LAN 분리가 가능하기 때문이다. 아펜젤러는 그러나 “어느 쪽이든 도입된 사례가 없다”라고 말했다. 또 ToR 스위치 포트 가격이 계속 하락하고 있다는 점을 감안하면, 둘 모두 비실용적일 수도 있다고 덧붙였다.

델오로 그룹도 “ToR 가격이 급하락하고 있다”라며 동의했다. 이 회사의 조사에 따르면, 10G 이더넷 포트 가격은 2011~2016년 사이에 715달러에서 212달러로 하락했다.

베어메탈 스위치용 네트워크 운영 시스템 소프트웨어 개발사인 커뮬루스 네트워크(Cumulus Networks)를 공동 창업한 JR 리버스 CEO는 브로드컴(Broadcom)과 멜라녹스(Mellanox) 같은 회사들의 네트워크 실리콘 가격/성능이 범용 CPU를 앞선다고 평가했다. 또 CPU에 네트워킹 기능을 집어 넣으면 그 가치가 하락할 소지도 있다고 언급했다.

리버스는 “CPU 실리콘 가운데 ‘두터운’ 무언가를 넣어야 하는데, 그 경우 투자 수익이 감소한다”라고 주장했다.

광 인터커넥트와 백플레인도 검토가 됐었다. 그러나 가격과 복잡성 때문에 중단됐다. 소프트웨어를 기반으로 컴퓨팅, 네트워킹, 스토리지를 해체 및 통합해 더 탄력적이고 민첩한 IT 랙을 구현하는 인텔의 랙스케일(RackScale) 아키텍처는 이들 통합 자원을 묶어 구현하는 패브릭으로 포토닉 인터커넥트를 제시한다.

그러나 너무 복잡해 실용적이지 못하다는 단점이 드러났다.

리버스는 “광 백플레인은 너무 복잡해 실용성이 떨어졌다. 랙스케일은 네트워크 규모와 속도에 따라 이동을 할 수 있는 느슨하게 연결된 시스템과 달리 지나치게 촘촘하게 연결돼 있고, 많은 엔지니어링이 필요하다. 랙스케일은 하나로 모든 것을 충족하려는 아키텍처다. 이는 불가능하며, 이런 이유로 고객들에게도 도움이 되지 않는 경우가 많다”라고 설명했다.

그는 이를 블레이드 서버에 블레이드 스위치를 탑재시키려 했던 시도에 비교했다. 사용자들이 관심을 갖지 않았던 시도였다. 대신 시스코 스위치 포트에서 패스스루 모듈을 사용했다.

같은 맥락에서, 리버스는 또 서버를 직접 연결해 ToR 스위치를 피하기 위해, 데이터센터에서 광 기술을 사용하는 생각에 의구심을 갖고 있다고 밝혔다.

리버스는 “큰 파일 전송에 걸리는 시간이 1초 미만으로, 이 기술에는 레버리지가 없다. 광 크로스포인트(Crosspoint) 스위치가 네트워킹 기술을 영구적으로 바꿀 기반 기술이 될 것이라고는 보기 힘들다. 과거부터 존재했던 기술이다”라고 말했다.

인텔에 따르면, ToR 스위치 또한 마찬가지다. 서버가 더 많은 스위치 지능과 로컬 기능을 대체하겠지만, 물리적으로 분리되는 스위치의 영향력은 그대로 유지될 것이라는 전망이다.

인텔 커뮤니케이션 인프라 부문(Communications Infrastructure Division)의 스티브 프라이스 제너럴 매니저는 “ToR은 데이터센터에서 계속 입지를 유지할 것이다. 서버 셸프의 네트워크 지능이 증가하고 있는 추세이다. 예를 들어, 현재 vSwitch나 ToR 중 하나에서 정책 집행과 멀티테넌트 터널링 기능을 지원한다. 랙의 컴퓨팅 밀도가 높아지고, 서버에 SDN과 NFV가 도입되면서, 가상 스위칭과 물리적 스위칭 모두에서 셸프 수준의 이스트-웨스트 트래픽이 증가할 것이다. 서버는 인텔 아키텍처에서는 소프트웨어를 통해 패킷을 처리하고, 셸프 단계의 스위치로 여러 서버의 트래픽 워크로드를 통합 및 관리하는 하이브리드 플랫폼이 될 것이다”라고 예상했다.

그에 따르면 서버의 셸프 단계 스위칭은 해당 셸프의 여러 서버 슬레드에 레이턴시가 낮은 연결성을 제공한다. 또 ToR의 100G 이더넷 업링크를 통해 트래픽을 통합한다. 여기에 더해, 동일 서버 셸프에서 하이 포트 카운트 스위칭을 구현하기 위해서는 케이블링 원가가 올라간다. 이에 인텔은 ToR의 100G 업링크를 통해 모든 서버 셸프 트래픽을 통합하는 방법을 제시했다.

인텔의 전략은 ‘Open vSwitch’ 커뮤니티 프로젝트에 대한 투자를 늘리는 것이다. 인텔 아키텍처에서 가상 스위치 성능을 높이고, 필요 시 NIC와 물리적 스위치로의 하드웨어 오프로딩을 구현하는 DPDK(Data Plane Development Kit)에 초점이 맞춰진 전략이다. DPDK는 현재 ‘Open vSwitch 2.4’에 포함되도록 예정돼 있다.

랙스케일 아키텍처 이니셔티브의 경우, 관리가 TCO를 줄이고, 자원의 유연성과 민첩성을 높일 수 있는 하이퍼스케일 데이터센터에 초점이 맞춰져 있다.

시스코 컴퓨팅 시스템 제품 그룹(Computing Systems Product Group)의 댄 핸슨 기술 마케팅 디렉터는 인텔과 시스코가 서버/스위치 분할과 분산형 메모리를 중심으로 랙스페이스 아키텍처를 논의했다고 전했다. 핸슨에 따르면, 시스코의 스위치 분할에 관한 시각은 인텔과 상호보완적이다. 그러나 이를 구현하는 최상의 방법에 이견을 갖고 있다.

핸슨은 “많은 잠재력이 있는 아이디어다. 이런 방향을 추구하는 사람들이 많다. 다만 최상의 방법을 찾아야 한다. 우리는 이를 위해 노력하고 있다”fk고 말했다.

핸슨은 인텔의 DPDK가 구현요소(enabler)라며, 하드웨어 중 일부는 범용 x86 플랫폼의 성능이 미흡한 네트워크 기능 가상화(Network Functions Virtualization) 애플리케이션에서 시스코의 UCS 서버 기능을 지원한다고 말했다. 그러나 분산되고 분할된 스위칭과 메모리 관리를 가장 잘 처리할 수 있는 방법, 산업이 이에 대한 준비를 마칠 시기에 대한 논쟁이 계속되고 있다고 진단했다.

핸슨은 “우리가 인텔과 랙스케일에 관해 논의를 하는 이유는 보완적 아키텍처 구현을 위해서다. 우리는 서버 랙 전반에 분산 및 분할된 서버 요소를 확대할 방법을 모색하고 있다. 지금 당장도 USC 서버에서 이들 요소 가운데 일부를 공유할 수 있다. 그러나 인텔이 추구하는 메모리 채널까지는 아니다”라고 말했다.

핸슨에 따르면, 시스코가 3달 전 발표한 UCS M 시리즈 서버의 시스템 링크(System Link) 기술을 랙스케일에 탑재시킬 수 있는 기능으로 제시했다. 시스템 링크는 M 시리즈가 분할된 하위시스템을 애플리케이션에 따라 소프트웨어로 자원을 정의, 정책을 바탕으로 준비, 배치, 관리할 수 있게끔 지원하는 실리콘이다.

그러나 핸슨은 델오로의 웨켈과 달리 고객들이 시스템 링크, 랙스케일, 서버/스위치 분할을 도입하는 속도가 서버가 ToR 스위치를 대체할지 여부, 그 시기를 결정할 것이라고 예상했다.

핸슨은 “얼마나 빨리 구현되고, 얼마나 깊이 구현될 지가 문제다. 반드시 극복해야 할 근본적인 기술 장벽이 있을 것이다. 고객의 기술 변화 수용 역량이 주요 동인이 될 것이다. 우리는 더 뛰어난 신기술을 추구하고 있다. 그러나 고객의 기술 도입 속도, 역량에 따라 크게 달라질 것이다”라고 말했다. dl-ciokorea@foundryco.com