자세히 보기

By CIOKR Staff

델 테크놀로지스, 데이터 레이크하우스 신기능 적용 발표 “비용 절감·성능 향상”

뉴스
2024.07.262분

한국 델 테크놀로지스가 개방형 풀스택 데이터 플랫폼 ‘델 데이터 레이크하우스(Dell Data Lakehouse)’에 쿼리 성능 가속화를 위한 ‘워프 스피드(Warp Speed)’ 기능을 탑재해 제공한다고 26일 밝혔다.

올해 3월 공개된 ‘델 데이터 레이크하우스’는 데이터 소스에 관계없이 분산된 데이터에 대규모의 동시접속이 가능한 고성능 턴키 솔루션이다. ‘스타버스트(Starburst)’ 쿼리 엔진을 채용한 이 플랫폼은 델 S3 호환 스토리지를 기반으로 설계되어 아이스버그(Iceberg)와 같은 개방형 형식의 데이터를 저장하고 쿼리할 수 있는 고성능, 고가용성 스토리지 계층을 제공한다. 

회사에 따르면 오늘날 많은 조직들이 제한적인 예산 내에서 분석 및 AI를 위한 가속화를 실시해야 하는 과제에 직면해 있다. 데이터 레이크하우스 기술은 적은 비용으로 성능 이점을 제공하지만, 데이터 엔지니어링 및 IT 팀에서는 어떤 데이터를 최적화하고 캐싱(caching)해야 할지, 혹은 어떤 데이터를 데이터 레이크 내에 두어야 할지 결정하는데 어려움을 겪을 수 있다.

이번에 추가된 ‘워프 스피드’를 이용하면 쿼리 패턴을 자율적으로 학습하고 자주 액세스하는 데이터를 식별하여 최적의 인덱스와 캐시를 생성하는 동시에, 빈번하게 액세스하지 않는 데이터는 제자리에 유지시킬 수 있다. 

결과적으로 ‘워프 스피드’는 쿼리 성능 가속화와 비용 절감이라는 상충된 두가지 요구를 모두 만족시킨다고 델은 강조했다. 회사가 설명하는 ‘워프 스피드’는 주요 이점 및 특장점은 다음과 같다. 

– 데이터 레이크 가속화: 데이터 엔지니어링 없이도 데이터 레이크를 자율적으로 색인하고 온디맨드 방식으로 탐색 데이터 세트를 가속화할 수 있다. 

– 고성능 대시보드 구축: 사용자 환경을 변경하지 않고도 테라바이트(TB) 부터 페타바이트(PB) 단위까지 데이터를 더 빠르게 드릴다운(drill down) 할 수 있다. 

– 자율 인덱싱: 각 데이터 블록에 맞는 적절한 인덱스 유형(비트맵, 딕셔너리, 트리)을 생성하여 조인(join), 필터, 검색과 같은 작업을 가속화한다. 빠른 액세스를 위해 컴퓨팅 노드의 SSD에 인덱스가 저장된다. 

– 스마트 캐싱: 데이터 사용 빈도에 따라 성능을 최적화하는 독점적인 SSD 컬럼형 블록 캐싱을 제공한다. 불필요한 테이블 스캔을 없애고 쿼리 간 데이터를 더 많이 재사용하여 컴퓨팅 비용을 절감한다. 

한편 델 데이터 레이크하우스 사용 고객은 현재 새로운 워프 스피드 기능을 사용할 수 있으며, ‘파워스케일(PowerScale)’ 및 ‘델 ECS’와 같이 S3와 호환되는 델 스토리지를 데이터 레이크로 사용하는 고객들에게도 지원된다. 

김경진 한국 델 테크놀로지스 총괄사장은 “새로운 워프 스피드를 통해 지금껏 가능하지 않았던 효율성과 속도로 데이터에 담긴 잠재력을 이끌어냄으로써 합리적인 예산으로도 얼마든지 혁신을 도모할 수 있게끔 지원한다”라고 말했다. dl-ciokorea@foundryco.com