자세히 보기

Thor Olavsrud
Senior Writer

클라우드용 DBMS는 따로 있다’ 데이터스택스의 도전

데이터스택스가 다양한 데이터 모델을 위해 키 값부터 태뷸러, 제이슨(JSON), 그래프까지 운영 데이터베이스 지원을 강화하고 있으며, 자사 제품군에 데이터스택스 엔터프라이즈 그래프를 추가했다.

아파치 카산드라와 아파치 팅커팝의 오픈소스재단에 구축된 클라우드 애플리케이션용 데이터베이스 소프트웨어 전문업체인 데이터스택스(DataStax)는 데이터 문제에 대한 포인트 솔루션의 시대가 지나갔다는 주장을 내놨다.

미국 캘리포니아 산타클라라에 있는 신생벤처인 데이터스택스의 엔지니어링 담당 수석 부사장 마틴 반 라이스윅은 “대신 운영 DBMS의 미래는 다양한 데이터 모델을 지원하는 것”이라고 밝혔다.

그는 “아주 놀라운 새 기술로 사람들은 이전까지 해결하지 못했던 문제들을 해결하기 위해 처음에는 포인트 솔루션을 사용하려 한다. 하지만 시간이 지나면 통합 제품군을 원한다”며 “현재 우리가 보는 추세는 진정세에 가깝다. 사람들은 수많은 문제 공간을 보완할 수 있는 플랫폼을 원한다”고 말했다.

가트너 애널리스트 닉 휴데커, 머브 애드리안, 에티샴 자이디도 반 라이스윅과 비슷한 의견을 이미 내놓은 바 있다. 이들 셋은 작년 8월에 발표한 ‘NoSQL DBMS의 시장 가이드’에서 “DBMS 아키텍처와 배치의 미래는 멀티 모델이 될 것이다”고 적었다.

또 가트너 세 애널리스트들은 “2017년까지 모든 선도적 운영 DBMS가 멀티 데이터 모델, 관계형 DBMS, NoSQL을 단일 플랫폼에서 제공할 것”이라고 덧붙였다.


반 라이스윅은 현대의 클라우드 작업 부하가 데이터 모델 지원 요건에서 서로 다른 수많은 요건을 포함한다고 설명했다.

그는 RDBMS(relational DBMS) 생태계가 수많은 점에서 유리하다고 덧붙였다. RDBMS 생태계는 DBMS의 논리적 개발자와 물리적 사용자(DBA)를 잘 구분해 정리한 SQL 형태에서 개발자가 특정 업체에 종속되지 않는 언어를 사용하게 하고, 어떤 애플리케이션이 데이터베이스와 상호작용할 수 있느냐에 따라 움직이기 때문이다.

반면 RDBMS는 클라우드 애플리케이션과는 잘 맞지 않는 것으로 알려졌다. 그 이유는 다음과 같은 어려운 점들 때문이다.

• 업타임과 복원성에 대해 요구하는 마스터-슬레이브 아키텍처
• 클라우드 애플리케이션 작업 부하를 위한 라이트-앤-디스트리뷰트-애니웨어(write-and-distribute-anywhere) 제약과 규모
• 애플리케이션 민첩성보다 스토리지 효율성에 더 가치를 두는 논리적 데이터 레이어에 대한 엄격한 고수
• 준-비정형 데이터의 활용을 엄두도 못 낼 정도로 가격을 올리는 융통성 없는 데이터 모델
• 운영 비용을 기하급수적으로 높이는 샤딩 아키텍처의 ‘임시방편 처방’

NoSQL 기술은 이런 문제점들을 해결하지만, 기업 고객들에게 매우 파편화된 솔루션을 제공한다는 2가지 문제점을 안겨 준다.

• 다중 언어 고집은 고객이 데이터 모델(키 값, 태뷸러, 제이슨, 그래프)의 제한된 세트 중 하나를 활용하거나 데이터 스토어에 걸쳐 ETL(extract-transform-load) 운영해야 함을 의미한다. MDM(master data management)과 고객-360도-시야 권한 ETL을 포함한 수많은 사용 사례는 총소유비용(TCO)의 상승으로 이어질 수 있다.
• 데이터스토어와 소통하기 위한 NoSQL 업체의 메커니즘 각각은 방언과 논리적/물리적 분할이 어디에 있는지에 따라 달라진다. 이는 애플리케이션 개발자가 자신의 애플리케이션에 단일 모델 이상을 필요로 할 때 추상화 계층을 작성할 수밖에 없게 만들고, 추상화 계층은 논리적/물리적 스펙트럼의 각기 다른 레벨에 걸쳐 작동해야 애플리케이션 개발이 부합하게 된다.

반 라이스윅은 멀티-모델 데이터베이스가 NoSQL 기술의 차세대 진화라고 주장했다. 멀티-모델 데이터베이스는 단일의, 통합된 백엔드와 달리 수많은 데이터 모델을 지원하는 것이 특징이다. 데이터스택스는 멀티-모델 데이터베이스 플랫폼이 다음과 같아야 한다고 전했다.

• 애플리케이션 개발자들의 개발 편리성을 위해 한가지 관계형 데이터 모델(예를 들어, 태뷸러, 제이슨, 그래프) 이상을 논리적 레이어에서 지원해야 한다.
• 모든 모델이 결합적 메커니즘에 노출되도록 해 개발자들의 인지적 맥락 전환을 방지해야 한다.
• 지리적 중복, 지속해서로 사용할 수 있는 특성, 보안, 프로비저닝, 재난 복구 등의 운영 측면을 위한 공통 프레임워크를 제공하는 통일된 지속 레이어를 가져야 한다.
• OLTP와 OLAP 작업부하에 걸쳐 다양한 사용 사례를 가능케 한다.
• 중앙집중된 IT팀 내에서 광범위하게 채택될 수 있게 하려고 오랜 기간 높은 TCO 효율을 제공해야 한다.

데이터스택스 엔터프라이즈 그래프
지난 12일 데이터스택스는 자체 멀티-모델 기능성에 고도로 연결된 데이터를 관리해야 하는 클라우드 애플리케이션용의 확장 그래프 데이터베이스인 DSE(DataStax Enterprise) 그래프를 추가로 발표했다.

그래프 데이터베이스는 관계형 데이터를 해결하려는 의도지만 효율성과 확장에서 훨씬 효율적인 NoSQL 데이터베이스의 특별 형태다.

가트너의 휴데커와 동료 애널리스트 마크 베이어는 2015년 7월 발간된 보고서인 ‘그래프 애널리틱스로 빅데이터를 평범하게 만들기(Marking Big Data Normal with Graph Analytics)’에서 “그래프는 이전까지 데이터에서 인식되지 않았던 관계를 평가, 표현, 분석하는 훌륭한 방법”이라고 밝혔다. 이들은 “별도의 서로 무관한 개별 세트로 데이터를 검사하고 분석하는 대신 그래프는 빈도, 강도, 데이터에서의 데이터 관계성을 탐구할 수 있게 한다”고 전했다.

지난해 클라우드 애플리케이션용 데이터베이스 소프트웨어 제공업체인 데이터스택스는 오픈소스 그래프 데이터베이스 타이탄(Titan)을 만든 팀인 아우렐리우스(Aurelius)를 인수했다. 이 팀은 지난해 타이탄의 기본 기능성을 넘어서면서도 하위 호환성을 가진 새로운 소프트웨어 세트 구축에 시간을 투자해 타이탄과 다른 팅커팝 지원 그래프 데이터베이스 사용자들이 마이그레이션을 손쉽게 할 수 있도록 만들었다.

반 라이스윅은 DSE 그래프가 데이터스택스의 기존 카산드라에서 구축됐기 때문에 지속적인 업타임, 읽기/쓰기/전체활동적 기능성, 선형 확장성, 예측 가능한 저-지연시간 응답 시간, 운영적 성숙도 등의 카산드라의 주요 혜택을 물려받았다고 말했다. 또 DSE 그래프는 데이터스택스 엔터프라이즈에서 찾을 수 있는 대기업 수준의 확장 기능인 고급 보안, 임베디드 애널리틱스, 기업 검색, 시각적 관리 모니터링, 개발 툴 등을 포함했다.

IT 솔루션 업체인 엠파시스(Mphasis)에서 은행 및 자본시장 솔루션을 담당하는 아닐 구르나니는 12일 성명서에서 “우리의 대형 은행고객 몇몇을 위해 데이터스택스 기업 그래프를 전통적인 데이터베이스에 비교해 평가했고, DSE 그래프가 금융 서비스의 클라이언트 데이터 같은 사용 사례에서 수많은 노드와 관계를 포함한 데이터 세트와 함께 작업했을 때 자릿수 단위로 성능이 향상됨을 발견했다”고 이야기했다.

DSE 그래프에는 다음의 기능이 들어 있다.

o 데이터스택스 기업 서버. 적응적 쿼리 옵티마이저, 자동 그래프 데이터 분할, 분산 쿼리 실행 엔진, 그래프-특정 인덱스 구조 등을 포함한 고급 그래프 데이터베이스 기능성을 제공한다.
o 데이터스택스 Ops센터. Ops센터(OpsCenter)는 풀 프로비저닝, 관리, DSE그래프의 모니터링을 제공하기 위해 업데이트됐다.
o 데이터스택스 스튜디오. 새로운 웹-기반 솔루션으로 개발자들이 그래프를 시각화하고 그래프 쿼리를 작성/실행하는 데 도움을 준다.
o 데이터스택스 드라이버. 드라이버들이 모든 인기 개발 언어에 맞춰 준비돼 있고, CQL, DSE 애널리틱스/검색 API 등에 추가로 그렘린(Gremlin) 그래프 언어 지원을 위해 향상됐다.

DSE 그래프는 DSE 스탠다드(Standard) 혹은 DSE 맥스(Max) 사용료 지급 모델로 판매될 예정이다. 반 라이스윅은 2/4분기에 시장에 회복될 것으로 전망했다. dl-ciokorea@foundryco.com

Thor Olavsrud

Thor Olavsrud is an award-winning senior writer for CIO.com, with 20+ years of experience covering IT and the tech industry. He focuses on AI, analytics, and automation. The American Society of Business Publication Editors (ASBPE) recognized him with a national silver award for his article, “How big data analytics helped hospitals stop a killer.” He also contributed to CIO.com’s 2018 and 2021 Azbee Awards of Excellence for Website of the Year and a 2024 Azbee national silver award for online industry news coverage.

이 저자의 추가 콘텐츠