자세히 보기

By Park Hae Jeong

CIO 어워드 2013 | “앞으로 모든 시 정책에 빅 데이터 활용한다” 서울시 김경서 정

한국IDG가 오는 12월 4일 서울 리츠칼튼호텔에서 ‘IT Leader’s Summit - The Year Ahead 20

서울시가 빅 데이터를 이용해 심야 버스 노선을 정했다. 국내 기업들 사이에서 빅 데이터는 큰 관심사지만 아직 이렇다 할 성공사례가 나오지 않았고, 성공사례가 있다 해도 핵심 경쟁력이라서 선뜻 공개하지 않은 시점에서 서울시가 시 정책에 빅 데이터를 활용했다고 발표했다. 김 단장은 “심야버스 노선을 정하는데 빅 데이터를 활용한 것은 시작에 불과하다”며 “앞으로 서울시의 많은 행정이 빅 데이터 기반으로 바꿀 것”이라고 밝혔다. 다음은 김 단장과의 일문일답이다.

CIO KR : 심야 버스 노선을 정하는데 빅 데이터를 활용하게 된 배경은 무엇인가?

김경서 정보기획단장(이하 김 단장) : 서울시는 빅 데이터를 활용하기에 좋은 도시다. 그 이유는 크게 3가지다.

첫 번째, 리더십이 매우 중요한데, 시장님이 빅 데이터의 중요성을 잘 알고, 데이터를 적극적으로 시정에 활용하고자 하는 의지와 아이디어가 많으시다. 시장님의 이런 생각을 우리가 따르다 보니 도움이 되었다. 서울시는 빅 데이터나 IT에 대한 전반적인 리더십들이 매우 강하다.

두 번째, 서울시는 빅 데이터를 하기 적합한 환경이다. 세계 어느 곳을 보아도 서울시만큼 it인프라가 잘되어 있는 곳이 없다. 시민들이 스마트폰을 많이 사용하고 와이파이존, 3G, 4G 등 모든 환경들이 우수하다.

세계의 유수의 기업들이 서울시를 베타테스트 지역으로 삼고 있으며, 아주 긴박하게 돌아가는 스마트 IT환경이 갖춰져 있기 때문이다. 예를 들면 심야버스 노선을 만들 때에도 기지국의 위치가 매우 중요한데 서울시만큼 기지국 위치가 조밀하게 나와 있는 곳이 없다. 조밀하게 나와 있다는 것들은 사용자들이 위치정보를 100미터 200미터 내의 오차 안에서 뽑아낼 수 있다는 것을 뜻하며 그만큼 좋은 환경을 가진 데가 없다. IT 인프라뿐만 아니라 교통정보 같은 데도 서울만한 도시가 없다.

세 번째는 서울시는 빅 데이터를 통해 시민의 목소리를 듣고자 한다. 서울시는 트위터나 블로그에 있는 데이터를 분석해서 시민들의 목소리를 굉장히 많이 듣는다. 다산콜센터만 해도 작년에 걸려왔던 정보가 60만 건이 되는데, 그것도 다 분석을 해보면 시민들의 목소리를 들을 수 있다.
이런 새로운 것들을 자꾸 시도하는 이유는 시민들의 요구사항을 우리가 듣기 위함이고 시민의 참여와 공유라는 시정철학에도 맞는다. 서울시에서의 빅 데이터는 직접 민주주의로 가는 다른 SNS라 생각한다.

정리하면 첫 번째는 시장님의 리더십, 두 번째는 IT와 교통의 첨단 인프라, 세 번째는 시민이 함께 해나가는 문화가 만들어지는 과정 속에서 자연스럽게 좋은 결과가 있었다고 생각한다.

서울시는 이렇게 좋은 조건을 갖추고 있기도 하지만 그만큼 문제도 많다. 문제라는 것은 서울시민들이 느끼는 불편이나 불만인데, 대표적인 것이 심야버스다.

심야버스의 노선을 정하는 것은 그리 간단한 게 아니다. 야간 이동패턴에 대해 조사한 자료도 없는 상태였다.

이른바 올빼미버스라고 하는 밤 0시부터 5시까지 운행하는 심야버스는 시민들의 제안에서 시작됐다. 그렇다면 어떻게 이 버스의 노선을 정할까? 콜럼버스의 달걀보다 더 간단한 아이디어를 이용했다.

우선, 서울시는 시 전역을 지름 1km의 1,252개 구역(셀)으로 나눠 심야시간인 0시부터 5시까지의 약 30억건의 KT 통화량 통계데이터에 대해 유동인구 밀집도를 분석하고 이를 시각화했다. 이들 중에서는 야간 근무를 하는 경우도 있겠지만 대부분은 집에 가야 하는 사람들이다.

30억건의 통화량 통계데이터를 분석해 청구지 주소에서 크게 벗어난 사람들을 잠재적인 심야버스 수요자로 파악했다. 택시의 경우 승하차 정보가 있기 때문에 통화량 정보와 택시 승하차 정보를 검증했다. 그 결과 유동인구 밀집지역 상위 10개 중 7개는 겹치는 것으로 나타났다.

시각화한 유동인구를 노선별, 요일별로 패턴을 분석해 심야버스 노선을 최적화했다. 그 다음 분석된 유동인구 데이터를 정류장 단위로 통행량을 산출한 뒤 이를 선굵기로 표현하여 요일별 배차간격 조정에 활용할 수 있도록 했다.

도시교통본부와 함께 유동인구 검증 시뮬레이션을 통해 노선을 일부 변경했다. 심야버스다 보니 경로를 조금 돌아가도 운행시간이 크게 차이 나지 않는다. 가령 사평로 자이아파트에서 좌회전하지 않고 그보다 먼저 좌회전해 다시 나오는, 조금 돌아가는 노선을 택해 더 많은 유동인구를 확보할 수 있었다. 버스가 신호를 한 번 더 받겠지만 야간 시간대로 막히지 않아 전체 운행시간에는 큰 차이가 없어서 시민들도 불편하게 생각하지 않았다.

CIO KR : 통화 데이터와 위치 정보를 분석했다고 하는데, 개인정보 유출에 대한 우려는 없나?
김 단장 : 
KT에서 유동인구 밀집지역을 파악할 수 있는 통화량 통계데이터를 서울시에 제공했다. 개인정보를 식별할 수 없는 통계데이터를 활용하여 심야버스 노선 수립과 같은 공익 목적으로 사용했다. 개인정보를 수집하지 않기 때문에 유출의 우려도 없다. 소비자들이나 시민들이 받아들이기에 회사가 내 정보 쓰는 것에 대해 불편하게 생각한다. 하지만 공익을 위해 공공기관이나 행정기관이 사용하는 것에 대해 동의를 하면 그 목적에 맞게 활용 할 수 있다.

빅 데이터가 기업의 핵심 경쟁력이기 때문에 기업은 성공사례를 공개하기 꺼려할지 모르지만, 공공기관은 아니다. 앞으로 빅 데이터를 활용한 정책 수립 사례와 불편 해소 사례들을 계속해서 공개할 계획이다.

공공기관에서 빅 데이터 리더십 가져야 하는 이유는 명확하다. 서울시가 빅 데이터로 풀어야 할 문제가 많기 때문이다. 모든 행정은 자료를 근거로 풀어야 하는데 그 핵심이 바로 빅 데이터다.

시민들의 일상을 돕는 게 정책이라고 생각한다. 빅 데이터 하면, 주로 소셜 미디어 데이터만 생각하는데 그렇지 않다. 광범위한 행정 데이터, 시계열 정형 데이터도 있고 이들을 결합해 정확한 분석 결과를 얻을 수 있다. 그리고 정확한 분석은 정확한 정책을 만들어 내도록 해준다.

CIO KR : 서울시가 심야버스 프로젝트를 추진하면서 어려움은 없었나?
김 단장 : 
제가 2월에 서울시 CIO로 오고 나서 ‘정보화기획단’을 ‘정보기획단’으로 바꿨는데 이것은 매우 의미 있는 일이다. 정보기획단은 정보 자체를 어떻게 쓸 것인가를 기획하는 부서다. 정보화기획단은 그렇게 할 명문이 없다. 정보기획단으로 바꾸고 어떤 정보를 어떻게 기획할 지를 직접 고민하고 도시교통본부에 유동인구 정보를 통해 심야버스 노선 수립에 도움을 줄 수 있다고 먼저 제안한 것이다.

CIO KR : 빅 데이터 전문가 부족으로 고민하는 기업들이 많다. 서울시의 경우 빅 데이터 전문가 양성에 대해 어떻게 하고 있는가?
김 단장 : 
서울시는 현재 청년 미취업자를 대상으로 빅 데이터 전문가 지도하에 전문지식과 직무경험을 축적시키고, 서울시 빅 데이터 전략수립 및 빅 데이터 기반 과제를 발굴하고자 공공기관 최초로 올 10월부터 12월까지 ‘빅 데이터 큐레이터 양성 프로젝트’를 진행 중이다.

이 프로젝트에서 서울시의 사업들도 알려주고 어떤 사업과 어떤 빅 데이터를 매칭시키면 좋을지 고민하고 연구하고 있다. 현재 44명이 교육을 받고 있는데, 올해는 시범적으로 실시했으나 내년에는 이를 상설화할 계획이다.

처음에는 청년 일자리 창출을 목적으로 20여명을 선발하기 위해 매우 까다로운 조건으로 공고를 냈다. 그런데 여기에 지원한 사람은 당초 목표의 2배가 넘었다. 이것만 보더라도 생각보다 빅 데이터 전문가 양성에 대한 요구가 큰 것으로 판단해 이 사업을 단기가 아닌 장기로 바꿨다.

CIO KR : 서울시가 빅 데이터를 활용할 수 있는 방안은 무궁무진할 것 같다. 앞으로 어떤 계획을 가지고 있나?
김 단장 : 
시의 많은 부분에 빅 데이터를 적용할 수 있다. 예를 들어 복지, 세금 체납, 자살문제 등 민감하고도 중요한 문제를 정보 관점에서 다시 보기 시작했다. 심야버스는 시작에 불과하다. 앞으로 서울시의 많은 행정이 빅 데이터 기반으로 바뀔 것이다.

우선, 올 하반기에는 계획 시설의 입지 분석에도 빅 데이터를 활용했다. 어르신을 위한 인생이모작센터가 현재 은평구에 하나 있는데 이는 후보지 중 어디에 지어야 좋을지, 어디에 어르신들이 많이 거주하며 어떤 이동 경로를 보이는지 분석했다. 후보지인 종로에 대해 설치 타당성을 분석하였다.

서울시는 광범위하고 다양하게 빅 데이터를 활용할 계획이다. 내년에는 상권분석에서 빅 데이터를 활용할 계획이다. 이를 위해 서울시내 전역에 걸쳐 어느 지역에 어떤 상권에 어떤 점포가 많고 비즈니스 유형이 무엇인지를 분석하는 것이다. 가령 치킨집이 나은지, 어떤 업종이 유리한지 그 자리에 얼마나 자주 폐업과 개업이 일어났는지를 분석해 소상공인을 지원하려고 한다.

소상공인들은 정보가 부족하다. 세번째 치킨집의 비극이라고 들어봤나? 한 동네에 첫번째 치킨집과 두번째 치킨집의 영업이 잘 된다고 해서 세번째 치킨집이 들어서면 셋 다 문닫게 된다는 말이 있다. 창업할 때 과거 이력들 중 상권 주변의 평균 소득, 유동인구, 거주인구, 카드매출 통계데이터를 사용하여 투자가 적정한지 여부를 예측하는 상권 분석을 시작할 예정이다.

이밖에 서울시는 유동인구 정보, 택시 승하차 정보 등의 데이터를 이용하여 택시 이용객들에게는 택시를 쉽게 탈 수 있는 지역을, 택시 기사들에게는 손님을 쉽게 태울 수 있는 지역을 알려주기 위한 서비스를 통해 택시 공차율 감소 및 택시잡기 좋은 위치 제공으로 택시 이용 불편 해소 등 시민 체감 편익 서비스 증대하고자 한다.

서울시는 『시민의 작은(Small) 고충까지도 해결하는 큰(Big) 데이터』라는 슬로건과 함께, 서울 시민들 구석구석의 작은 고민들을 데이터로 풀어 나갈 것이며, 이와 같이 교통, 복지, 경제, 문화, 도시 등 각 분야의 여러 가지 시정 현안 해결을 위한 빅 데이터를 활용하여 과거와는 차원이 다른 정확한 정보를 토대로 예산집행의 효율성과 시민 중심의 전혀 새로운 행정서비스로 창조적 시정을 구현하는데 선도적 역할을 할 계획이다.

*올 2월 서울시에 합류한 김경서 단장은, 다음커뮤니케이션에서 다음소프트로 분사한 이후 2001년부터 서울시 CIO로 영입되기 전인 2013년 1월말까지 다음소프트의 대표이사를 역임했다. 다음소프트는 빅 데이터 분석 전문 업체로, 김 단장은 이 때의 경험을 토대로 공공 빅 데이터를 정책 수립에 어떻게 활용할 지를 고민 하고 있다.

dl-ciokorea@foundryco.com