자세히 보기

By Richard Leonarz

벤더 기고 | 데이터센터 스토리지 효율성을 극대화하는 SSD 신기술들

* 본 기고문은 업체 관계자가 작성한 것이지만 업체 솔루션이나 시각과 관련한 내용을 직접 포함하지 않도록 네트워크 월드 편집진의 편집을 거쳤다.

SSD(Solid State Drives)는 IT 관리자가 급격하게 발전하는 데이터센터 환경에서 스토리지 효율성을 극대화할 수 있도록 도움을 준다. 특히 V-NAND(Vertical NAND), NVMe(Non-Volatile Memory Express), PCIe(PCI Express) 등 신기술은 SSD의 대역폭을 늘리고, 대기시간(latency)을 낮추는 데 필수적이다. 반면 HDD(Hard Disk Drive)는 성능에 대한 요구가 낮은 환경에서 많은 데이터를 효율적으로 저장하는 데 유용하다.

효율성과 비용 절감을 극대화하는 가장 효과적인 방법은 성능과 용량을 투자와 일치시키는 것이다. SSD와 HDD를 적당히 혼용하면 성능을 높이는 동시에 비용을 줄일 수 있다.

시장조사업체 IDC에 따르면, 전 세계 데이터 중 90%가 저장된 후 다시 읽는 작업이 별로 없는 ‘콜드 데이터(cold data)’이다. 나머지 10% 정도만 저장한 후 많이 읽어 들이는 ‘핫 데이터’이다. 트위터를 예로 들면, 최근 피드로 푸시되거나 리트윗되는 것이 핫 데이터다. 반면 1주 이상 된 트윗 대부분은 검색은 되지만 무관심 상태가 되는데 이것을 콜드 데이터로 볼 수 있다.

모든 데이터를 레이턴시가 낮은 고성능 스토리지 장치에 저장하는 것은 불필요한 예산 낭비다. 따라서 데이터 특성에 따라 가장 알맞는 성능을 제공하는 ‘계층화된 스토리지 아키텍처’를 활용하는 것이 좋다.

– CPU 캐시와 인 메모리 프로세싱 관련 데이터는 가장 ‘핫’한 계층에서 담당한다.
– ‘핫’ 계층은 메모리에서 스토리지로 이동하는 데이터를 처리하고, 고성능의 쓰기 기능을 지원한다. 여기에 필요한 트랜잭션 속도와 쓰기 수명(endurance)을 가장 훌륭하게 제공하는 기술이 PCIe NVMe SSD이다.
– 데이터 용량이 증가하는 ‘웜(Warm)’ 계층에는 2비트 및 3비트 MLC SATA(Serial ATA)를 이용한다. 기가바이트를 기준으로 더 저렴한 비용에 꽤 우수한 트랜잭션 성능과 수명을 제공한다.
– ‘콜드’ 계층은 가장 낮은 비용으로 HDD에 많은 데이터를 아카이브(보관)하는 계층이다.

데이터는 자연스럽게 ‘핫’에서 ‘웜’, ‘콜드’ 계층으로 이동해야 한다. 아카이브 데이터 중 접속이 늘어나는 데이터는 ‘웜’이나 ‘핫’ 계층으로 이동시켜 처리하면 된다. 이러첨 적당한 기술로 각 계층을 완벽하게 최적화하면 불필요한 비용 지출 없이 데이터센터 전반의 성능을 높일 수 있다.

SSD 성능을 개선하는 V-NAND 기술
NAND 플래시 기술 관련해서는 기술 발전과 버전별 비용, 수명, 성능의 차이를 이해하는 것이 중요하다. NAND 플래시 기술 발전은 오랫동안 각 셀에 더 많은 데이터를 집어넣을 데 집중했다. 그러나 결국 셀이 가득 차, 서로를 방해하면서 신뢰도를 낮추는 문제점에 봉착했다. 셀이 작아지면서 내구성이 취약해졌고, NAND 플래시 수명도 한계에 도달했다.

그 대안이 V-NAND 기술이다. 확장 방식이 2D에서 3D로 발전하면서, 여러 계층을 쌓아 ‘셀의 탑’을 만들어 기존 한계점을 극복했다. 이제 2D NAND처럼 셀을 더 작게 만들지 않는다. V-NAND는 셀 사이가 넓으면서도 용량이 더 큰 것이 특징이다. 그 결과 플래너(Planar, 2차원) NAND보다 높은 성능과 수명을 제공한다.

V-NAND는 이를 통해 데이터센터의 성능과 수명을 향상한다. 셀의 구조(Cell geometry)를 크게 만들어 플래너 NAND에서 볼 수 있는 오류 정정(Error Correction) 요건을 낮춘다. 이에 따라 회전 모터가 장착된 HDD보다는 훨씬 적은 에너지, 전통적인 플래너 NAND SSD보다 적은 에너지로 운영할 수 있다. V-NAND 플래시는 SSD가 더 빠른 인터페이스의 이점을 십분 활용할 수 있도록 만들어준다.

V-NAND 기반 SSD는 수명이 훨씬 길다. ECC 요건과 에너지 소비를 낮추기 때문이다. 이런 특성은 애플리케이션에 따라 여러 가지 장점을 제공한다. 예를 들어, 더 많은 사용자가 같은 네트워크의 데이터에 접속할 수 있고, 데이터 분석 응답 시간이 향상되고, SSD 스토리지의 드라이브 쓰기 성능이 개선된다.

속도와 성능을 높인 PCIe와 NVMe
NAND 구조를 개선해 수명을 많이 늘렸지만, 성능을 최대한 향상하려면 SSD와 컴퓨터를 연결하는 소프트웨어 인터페이스를 개선해야 한다.

그 대안이 NVMe(Non-Volatile Memory Express)와 PCIe(PCI Express) SSD 기술이다. PCIe 인터페이스와 NVMe 프로토콜, 스토리지 하위 시스템을 통해 더 높은 대역폭, 더 낮은 레이턴시를 제공하고, 성능 병목을 없앤다. 모두 데이터센터의 성능을 끌어올리는 요소다. 데이터센터는 SATA를 SAS, PCIe 인터페이스로 바꿔, 이전 세대의 SATA 인터페이스보다 대역폭을 많이 증가시킬 수 있다. 동시에 호스트 버스 어댑터(Host Bus Adapter) 없이 CPU와 PCIe SSD를 직접 연결, 레이턴시를 크게 낮출 수 있다.

스토리지 성능을 높이려면 운영 시스템의 소프트웨어 인터페이스도 개선해야 한다. 기존에는 SSD와 HDD에 AHCI(Advanced Host Controller Interface)를 이용했는데, 레이턴시가 높은 SATA 인터페이스의 HDD용으로 만들어진 인터페이스여서 SSD에 병목 현상을 초래했다.

AHCI는 그 설계에 따라 해석(Translation) 계층을 추가하고, 최대 32개의 아웃스탠딩 커맨드(Outstanding command)와 1개의 큐(Queue)만 지원한다. SSD는 더 낮은 레이턴시로 더 높은 전송 속도를 지원할 수 있는 기술이므로 이 차이를 줄인 최적화된 소프트웨어 인터페이스가 있어야 이를 완전하게 이용할 수 있다.

이후 쉽지 않은 과정을 거쳐 기술을 개선했다. 표준화된 방식이 구현되기 전에는, PCIe 인터페이스를 채택한 SSD 업체가 성능 향상을 위해 독자적으로 드라이버를 개발해야 했다. 그러나 새로운 사양인 NVMe가 등장했다. 애플리케이션과 SSD 레이턴시 스택이 낮아 I/O 오버헤드를 줄이고, 성능과 효율성을 높이는 기술이다.

AHCI는 1개의 큐와 32개의 커맨드만 지원하지만, NVMe에는 향상된 큐 시스템이 탑재돼 있다. 수천 개의 큐, 6만 5,536개 커맨드를 지원한다. NVMe와 PCIe SSD는 AHCI 프로토콜을 이용하는 SATA 인터페이스 SSD보다 무작위 및 순차적 성능이 높다.

데이터센터는 트랜잭션 IOPS(Input/Output Operations Per Second)와 새롭게 개선된 기술을 이용해 최대 4배의 성능 향상을 달성할 수 있다. 이제 데이터센터는 데이터 접속이 더 많이 발생하는 ‘핫’ 계층을 중심으로 PCIe와 NVMe SSD를 이용해 속도를 극대화하고 성능을 높이고 있다.

가장 집약적인 트랜잭션 처리
각 드라이브 수준에서 V-NAND SSD와 PCI 인터페이스, NVMe 드라이버를 도입하면 데이터센터의 중요 지점의 트랜잭션 속도를 크게 향상할 수 있다. 데이터가 기하급수적으로 증가하고 있으므로 ‘핫’과 ‘콜드’ 데이터를 파악, 이를 비용 효과적으로 처리할 수 있는 아키텍처를 구현할 수 있다.

이처럼 계층화된 스토리지는 가장 비용 효과적인 기술을 이용한다. 대부분 데이터센터에 HDD를 이용하는 ‘콜드’ 계층, 중간급 SSD를 이용하는 ‘웜’ 계층이 존재할 것이다. 여기에 성능이 높고, 수명이 긴 SSD로 지원하는 ‘핫’ 계층을 추가하면 큰 비용 투자 없이 데이터센터 성능을 새로운 단계로 끌어올릴 수 있다.

* Richard Leonarz는 삼성전자 비즈니스 부문 메모리 마케팅 디렉터다. dl-ciokorea@foundryco.com