자세히 보기

By George V. Hulme

안전한 빅 데이터’를 위한 노력이 시작됐다

대형 금융회사, 제약회사, 클라우드 회사 등 많은 산업에서 빅 데이터 전략을 추진하고 있지만, 대다수 기업에는 아직 새로운 개념에 멈춰있다. 이

그러나 안타깝게도 이들 시스템을 안전하게 만들려는 노력과 활동은 그 정도로 폭증하지 않고 있다. 그나마 다행인 것은 조금씩 변화가 시작됐다는 것이다.

애널리스트들은 IT의 감독이나 간섭 없이 작은 부서나 팀 단위로 빅 데이터 전략이 시작되는 사례가 많다고 말하고 있다. 최근 IDG 엔터프라이즈가 IT 의사결정권자 750여 명을 설문조사한 결과에 따르면, 절반에 가까운 48%는 향후 3년 이내에 전사적으로 빅 데이터를 활용할 것으로 예상했다. 그리고 또 다른 26%는 현업에서 이를 많이 활용할 것으로 전망했다.

빅 데이터 보안의 도전
빅 데이터는 보안에서 많은 흥미로운 도전에 직면해 있다. 이 가운데는 많은 기업들에게 도전을 제시했던 IT소비자화 및 BYOD 트렌드와 이유가 유사한 도전들이 일부 존재한다. 정보 보안 조사 회사인 시큐로시스(Securosis)의 애널리스트이자 CTO인 애드리언 레인은 “보안 측면에서 크게 주목해야 하는 트렌드다. 작은 조직들이 오픈소스 툴과 몇 명 되지 않는 개발자를 활용해 초대형 오라클 데이터베이스를 몰아낼 수 있는 트렌드기 때문이다”라고 밝혔다. 이어서 레인은 “수백 만 달러의 인프라, 인력 구성에 수백 만 달러를 투자해야 하는 서비스 팀을 이야기하는 것이 아니다. 누구나 신속하게 준비를 할 수 있는 민첩하고, 비용 효율적이며, 확장성이 높은 모듈식 데이터베이스를 이야기하고 있는 것이다”고 설명했다.

저렴하게 이용할 수 있는 대형 데이터세트가 일반화됐지만 이를 안전하게 보안 처리하는 방법을 모르는 기업들이 많다. 게다가 기업에 필요한 보안 기능을 제공하지 못하는 IT업체와 오픈소스 프로젝트가 많다. 이는 대형 프라이버스 침해 또는 많은 비용이 초래되는 기업 보안 침해 사고로 이어질 수 있다.

기업 내부의 그룹들이 이들 데이터를 활용하기 시작한 것으로 드러나고 있다. 레인은 기업을 설문조사 한 결과 내부 그룹들이 실제 이들 툴을 사용하고 있다는 사실을 발견했다. 레인은 “부서 예산으로 데이터 아키텍트를 채용한 마케팅 부서가 있었다. 분석을 해 활용하고 싶었던 흥미로운 데이터를 보유하고 있었기 때문이다. 일부는 클라우드에 존재한다. 또 다른 일부는 내부에 위치해 있다. 그러나 보안을 통제하지 않고 있었다. 보안은 애초 프로젝트의 일부가 아니었기 때문이다”고 말했다.

많은 경우 내부 그룹들이 행동이나 트렌드를 파악하기 위해 필요로 하는 고객 데이터들이다. 레인과 시큐로시스의 또 다른 애널리스트인 데이빗 모트먼은 대부분의 부서들은 데이터베이스에 중요한 비밀 데이터가 없다고 믿고 있지만, 이는 사실이 아니었다고 지적했다. 그는 “이들 부서에 어떤 방법으로 보안에 대처하고 있는지 물으면 ‘로그인’을 적용하고 있다고 말한다. 딱 그 정도다. 애초 프로젝트의 일부에 포함돼 있지 않았기 때문이다”고 설명했다.

빅 데이터 보안, 불모지 넘어 초기 단계
다행이 보안과 관련해 희망적인 소식이 들려오기 시작했다. 최근 미네소타의 세인트폴(St. Paul)에서 개최된 시큐어360 컨퍼런스에서 ‘데이터는 커졌는데 보안은 취약해졌다(Bigger Data, Less Security)’라는 주제의 토론에 참가한 레인과 모트먼에 따르면, 빅 데이터 시스템을 구축하는데 사용되는 애플리케이션들이 보안을 염두에 두기 시작했으며, 일부 기업들이 이를 도입하고 있다.

레인과 모트먼은 1년 전 동일한 주제의 토론을 준비했을 때만 하더라도 빅 데이터의 보안은 불모지나 다름 없었다고 말했다.

레인은 “하둡과 클라우데라, 제타셋(Zettaset)에 가용한 보안 기능은 극소수였다. 하둡 환경에 잘 맞도록 상품을 수정한 업체들이 많지 않았기 때문이다”고 설명했다.

그러나 지난 해부터 변화가 시작됐다. IT업체와 기업들이 이들 시스템을 안전하게 만드는 방법을 더 자세히 조사하기 시작한 것이다. 레인과 모트먼에 따르면, 최근 빅 데이터 애플리케이션에 아이덴티티 및 접근 관리 기능을 통합시킨 업체들이 증가했다. 리눅스에 탑재된 아이덴티티 관련 기술을 이용하거나, 커베로스(Kerberos)와 통합성을 높이는 방법 등이다.

기업들도 내부적으로 더 많은 전략을 추진하고 있다. 모트먼은 “보안 및 프라이버시 위험을 방지하거나, 정부의 규제를 준수하기 위해 이들 데이터베이스에 보안 계층을 추가하는 최적의 방법들을 찾고 있다”고 전했다.

안전이냐, 민첩성이냐
일부 기업들은 보안 태세를 높이기 위해 ‘월드 가든(Walled Garden, 폐쇄형 네트워크)’이나 메인프레임 데이터 보안에서 많이 쓰였던 폐쇄형 소프트웨어 시스템을 이용하고 있다. 소규모 개발 팀들은 민첩성을 높이기 위해 웹 애플리케이션의 보안에서 사용되는 방법과 유사한 방법을 사용하고 있다. 애플리케이션과 사용자 아이덴티티 계층 위에 보안 계층을 추가하는 방법이다.

또 레인과 모트먼은 기업들이 아이덴티티를 이용해 접근관리에 능숙해지기 시작했다고 설명했다. 애플리케이션 사용자의 애플리케이션 접근이 여기에 해당된다. 이들은 계층별 암호화 구축 방법에도 눈길을 주고 있다. 이는 보안 태세를 높일뿐더러 빅 데이터 클러스터의 확장과 성능 향상을 가능하도록 만든다. 모트먼은 “이런 방식의 암호화를 이용하면 휴지 상태의 데이터를 안전하게 보호하고, 플랫폼 관리자가 파일에 접근하지 못하도록 만들 수 있다”고 설명했다.

그러나 불행히도 빅 데이터 및 차세대 데이터베이스와 관련해 해야 할 일이 많이 남아 있다. 그 중 한 가지는 데이터베이스 모니터링과 관련이 있다. 기업들은 오랜 기간 네트워크, 애플리케이션, 데이터베이스를 모니터링 해왔는데, 이를 빅 데이터까지 확대 적용해야 한다. 모트먼은 “좋은 쿼리와 나쁜 쿼리를 판단하기 위해 메타데이터 정보, 행동 프로파일, 유시지 프로파일 등을 조사하는 방법이 있다. 그러나 빅 데이터에는 이런 기능이 없다”고 지적했다.

다행히 기업들이 독자적으로 빅 데이터 로깅 솔루션 구축에 사용할 수 있는 범용 로깅 툴이 다수 존재한다. 모트먼은 “모든 로그를 대상으로 독자적인 쿼리를 만들어야 한다”고 말했다.

아무런 대책이 없는 것보다 낫다. 빅 데이터와 관련된 툴셋과 모델이 발전할 때까지 많은 기업들은 빅 데이터를 안전하게 활용하기 위한 독자적인 방법을 개발해야 한다.

dl-ciokorea@foundryco.com