10여 년 전, 한창 빅데이터 열풍이 불 때에도 적극적으로 이 분야의 IT전문가를 유치하려는 기업은 별로 없었다. 아마존, 넷플릭스, 구글 등 몇몇 거대 기업이 전부였다. 다행히도 지난 몇 년간 기술과 툴, 그리고 교육 프로그램 등이 개선됨에 따라, 그리고 데이터가 비즈니스 가치를 창출해 낼 수 있음이 증명됨에 따라 현재는 거의 대부분 산업의 기업들이 데이터 과학자를 채용하기 위해 노력하고 있다.
최근 채용 검색 사이트 몬스터닷컴의 구인 정보를 살펴보면 정부 기관에서부터 헬스케어 업체, 컨설팅 업체, 그리고 소프트웨어 기업에 이르기까지 다양한 범위의 산업에서 1,000여 건이 넘는 풀타임 데이터 과학자 채용 공고를 확인할 수 있다. 데이터 과학 전문가에 대한 수요가 너무 많아서 시장에 있는 데이터 과학자나 수학 박사 학위를 지닌 전문가들 만으로는 이러한 수요를 다 충족하지 못할 정도다.
게다가 데이터 과학 전문가 인재를 찾아내고, 또 선발하는 과정은 데이터 과학 분야 자체의 특성 때문에 더욱 쉽지 않아지고 있다고 부즈 앨런 해밀턴(Booz Allen Hamilton)의 SVP이자 애널리틱스 담당자인 마크 제이콥슨은 전했다.
그는 “다른 직군과 달리, 데이터 과학 분야에는 일반적으로 권위를 인정받는 중앙 인증 체계나 자격증 같은 것이 없다. 게다가 데이터 과학이라는 용어의 의미 자체에 대해서도 완전히 합의가 이루어졌다고 하기 어렵다. 사정이 이러하기 때문에 데이터 과학자의 채용이나 교육은 더 어려울 수 밖에 없다”라고 설명했다.
이로 인해 많은 기업들이 내부로 눈을 돌리고 있다. 자체적으로 데이터 과학 전문인력 수요를 충족하려는 것이다. 회사 내에 교육 프로그램을 만들고 기존의 인력에게 최신 툴이나 데이터 과학 기술을 익히게 하여 실무에 투입하려는 생각이다.
데이터 과학 전문 인재를 직접 양성 중인 기업들의 사례를 통해 그 과정과 방법을 알아본다.
비즈니스의 어떤 부분에 활용할 것인지를 분명히
데이터 과학 인재 양성 및 교육 프로그램을 만들기 전에, 우선 이러한 투자가 어떤 분야에서 도움이 될 지를 확실히 해야 한다. 데이터 과학은 애널리틱스 기술을 비즈니스 의사 결정에 적용하는 기술이기 때문에, 특정 분야의 전문성을 지닌 직원들을 대상으로 교육 시 그 효과가 커진다. 많은 경우 데이터 과학은 마케팅이나 테크놀로지 플랫폼 분야에서 큰 비즈니스 가치를 창출해 낸다.
이보타의 데이터 상품 및 애널리틱스 부대표 바이알 샤아는 “최근 우리 기업에서 도입한 추천 알고리즘으로 애플리케이션 상의 소비자 참여 건수가 비약적으로 증가했다. 이러한 알고리즘을 전체 유저 베이스에 모두 확장 적용할 경우 이보타(Ibotta) 사의 수익 최저 한도선을 최소 200만 달러 이상 끌어 올릴 전망이다”라고 말했다. 소프트웨어 업체인 이보타는 앱을 통해 결제 시 일부 금액을 캐시-백 해주고 있다.
세일즈 및 마케팅 외 분야에서도 데이터 과학과 애널리틱스 기술은 생산성을 증대시킴으로써 비즈니스 가치를 창출한다. 예를 들어 GE 사는 철강기업과 협력해 고부가가치 생산 장비들의 효율성을 증대시켰다. 철강 생산의 경우, 고부가가치 생산 장비에 부착된 센서를 통해 데이터를 얻고 데이터 과학 분석 기술로 예방적 유지, 보수 기술을 적용할 최적의 타이밍을 예측했다. 이러한 시도는 예기치 못한 다운타임을 방지할 수 있도록 해주었다.
부즈 앨런 해밀턴은 향후 수 년 이내로 수백 명의 직원에게 데이터 과학 기술을 교육할 예정이다. 이 기업이 이처럼 자체적으로 데이터 과학 인재를 양성하기로 결정하게 된 데에는 산업 자체의 특수성에 대한 고려가 있었다.
제이콥슨은 “정부 기관과 일해야 하는 우리 기업 특성상 채용하는 직원의 신원이 완전히 검증되어야 하는데, 그러면서도 전문성을 갖춘 데이터 과학 전문가를 찾기란 쉽지 않다. 우리 회사는 이러한 이유로 자체적으로 인재 양성을 하기로 결정하게 되었다”라고 설명했다.
직원 전체의 데이터 해독력을 개선
때때로 데이터 과학 인력 양성은 기업 전반에 걸쳐 적용되는, 기업 문화의 문제이기도 하다. 데이터 애널리틱스 플랫폼 업체 클리크의 데이터 역량 개발 프로그램 매니저인 조던 모로우는 다음과 같이 말했다.
“현재 클리크(Qlik)에서는 데이터 문맹률이 낮은 문화를 조성하기 위해 노력 중이다. 우리의 데이터 과학 교육 및 개발 프로그램은 초보자, 중급자, 그리고 고급자 코스를 모두 갖추고 있다. 우리 프로그램은 특히 데이터에 대한 관점을 변화시키는 데 역점을 두고 있다. 많은 이들이 데이터를 그저 단순한 통계나 리포팅으로 생각하고 있다. 우리는 이런 직원들이 데이터를 가지고 더 심도 있는 질문을 던질 수 있도록 교육하려 한다.”
데이터 해독력에 집중하는 클리크의 이러한 접근 방식은 장기적으로 보면 데이터 과학의 미래를 잘 반영하고 있다고 할 수 있다. AI를 비롯한 각종 툴들이 발전해 나갈수록 데이터와 관련된 질문을 던질 수 있는 역량을 지닌 사람들도 늘어날 것이다.
처음 스프레드시트 소프트웨어가 개발되었을 때만 해도 모두들 이것은 전문 회계사들만 사용할 것이라고 생각했었다. 데이터 과학 분야에서도 마찬가지로 툴이 발전하고 이와 관련된 교육이 광범위하게 이루어지면 데이터 과학 기술이 일반적으로 보편화 되는 날이 오게 될 지도 모른다.
데이터 과학 역량 갖춘 직원 양성해 내기 위해서는…
아직도 많은 기업들에서 가장 널리 사용하는 데이터 과학 툴은 파이썬(Python)과 R이다. 그러나 이런 툴이 제대로 활용되기 위해서는 직원들이 이에 대한 기초 지식을 지니고 있어야 한다. 부즈 앨런 해밀턴 애널리틱스 그룹의 브래드 모가트은 자신의 경험을 전했다.
“나 역시 회사에서 제공하는 2주짜리 데이터 과학 교육 프로그램을 수강했는데 이를 통해 파이썬 및 머신러닝 기술 사용 등 다양한 관련 기술을 익힐 수 있었다. 과거에는 엑셀이나 액세스만을 활용해 데이터 작업을 했다. 나는 학부에서 경제학과 경영학을 전공했기 때문에 통계학이나 분석의 기초 정도는 알고 있는 상태였다. 그럼에도 불구하고 이런 코스를 수강함으로써 업무 시 훨씬 방대한 양의 데이터를, 전보다 훨씬 빠르게 분석할 수 있게 됐다.”
모가트의 사례를 보면 미래의 데이터 과학 전문가들은 컴퓨터 과학이나 수학만을 공부해서 양성될 수 없음을 알 수 있다. 부즈 앨런에서 행한 것과 같은 기초 교육 프로그램이 중요한 이유는 직원들에게 데이터 소프트웨어 툴을 쥐어주는 것만으로 유의미한 질문을 던지고, 데이터 과학을 비즈니스 니즈에 구체적으로 적용하는 역량이 저절로 생기지는 않기 때문이다.
그러나 상기 2주 과정 교육 프로그램은 부즈 앨런 해밀턴이 추진하는 데이터 과학 인재 양성 계획의 일부일 뿐이다. 제이콥슨은 “현재 직원 교육 및 리크루팅 등 다양한 측면으로 데이터 과학에 많은 투자를 하고 있다. 우리 클라이언트들 사이에서도 데이터 과학 기술에 대한 수요가 아주 높다. 직원들의 교육을 돕기 위해 온라인 강의를 제공하고, 멘토 프로그램도 운영 중이다”라고 덧붙였다.
자체적인 교육 프로그램 운영이 어렵다면? 외부 업체의 도움 받아야
그렇지만 자체적인 데이터 과학 교육 프로그램을 운영하는 것이 모든 기업의 현실에 맞는 솔루션은 아닐 것이다. 이 경우 외부기관과 협력을 통해 인 하우스 인재 양성을 꾀해 볼 수 있다. AT&T가 시도하고 있는 방법이다.
AT&T의 최고 교육 책임자이자 인사 부대표 존 파머는 “400명이 넘는 AT&T 직원들이 조지아 공과대학 온라인 컴퓨터 과학 프로그램에 등록해 이를 수강했다. 본 과정의 500여 명의 졸업생들 중 50명 가까이가 AT&T 직원들이었다. 뿐만 아니라 우리는 유다시티(Udacity)의 나노디그리(Nanodegree) 프로그램에도 참여했다. 나노디그리 프로그램은 기계 학습, 인공 지능, 데이터 애널리틱스와 같은 분야의 기술 교육 및 인증 프로그램으로 수강생의 자체적인 참여로 이뤄진다. 현재 이 나노디그리 프로그램에 등록되어 있는 전 세계 3만여 명의 수강생들 중 약 2,000명 이상이 AT&T 직원들이다”라고 말했다.
AT&T는 이런 프로그램들을 기존 직원들을 교육시키는 것 외에도 새로운 인재를 물색하는 소스로 활용했다. 파머는 “유다시티의 나노디그리 프로그램 졸업생 중 총 100 명을 인턴으로 채용하기도 했다. 이들은 2015~17년 동안 하계 인턴으로 우리 회사에서 근무했다. 이들 중 상당수가 풀타임 근로자로 전환됐다”라고 말했다.
데이터 과학 인재 양성에서 매니저의 역할
직원 교육이 끝나면 다음 단계는 배운 것을 실전에 활용해 보는 것이다. 이보타의 데이터 상품 애널리스트 샤를리 프라치에는 다음과 같이 설명했다.
“나는 우리 기업 애널리틱스 부대표인 바이알 샤아에게 ‘프로젝트 천(Project Churn)’에 참여하고 싶다는 의사를 전하였다. 프로젝트 천은 예측 모델링을 통해 유저 유지(user retention)의 주요 지표들을 파악하는 프로젝트였다. 내가 팀에서 가장 경력이 적은 멤버였음에도 불구하고, 바이알은 리스크를 감수하면서까지 내가 해당 프로그램에서 상당한 역할을 할 수 있도록 해줬다. 이를 통해 나는 자신감을 얻었을 뿐 아니라 기술적으로, 또 전략적으로 새로운 역량을 개발할 수 있었다.”
그는 이어 “내가 데이터 과학 분야에 뛰어들 수 있었던 이유 중 하나는 여러 매니저들, 멘토들로부터 새로운 기술을 배우고, 새로운 도전을 하고, 실패를 두려워하지 않아야 한다는 것을 배웠기 때문이다”라고 덧붙였다.
회사 밖에서 역량 개발하기
보다 심층적인 공부를 하고 싶은 전문가들에게는 회사에서 제공하는 프로그램만으로는 부족하다고 느껴질 수 있다. 이런 직원들의 경우 앞서 언급한 온라인 강의나 컨퍼런스 등 회사 밖의 전문 교육 기관을 통해 기술을 향상시킬 수 있도록 장려해 주어야 한다.
프라치에는 “나 역시 머신러닝의 기초, 파이썬 프로그래밍 등을 배우기 위해 업무 외적으로 많은 시간을 투자했다”라고 말했다.
그는 특히 관련 기술을 습득하는 데 온라인 코스가 많은 도움이 되었다며 다음과 같이 말했다.
“다양한 팀 출신의 직원들이 팀을 맺고 앤드류 Ng의 머신러닝 코세라 클래스(ANdrew Ng’s Machine Learning Coursera class)와 같은 MOOC(massive open online course) 코스를 수강하기도 했다. 이보타는 매년 테크놀로지 관련 팀 직원들이 원하는 컨퍼런스에 참석할 수 있도록 장려하고 비용도 지원한다.”
데이터 과학 관련 행사나 컨퍼런스는 스타일에 따라, 또 역점을 두는 부분에 따라 여러 가지로 나뉜다. 클라우데라(Cloudera)와 오라일리 미디어(O’Reilly Media)가 진행하는 스트라타 데이터 컨퍼런스(Strata Data Conference)는 마이크로소프트, GE 디지털 등의 프레젠테이션과 함께 여러 소프트웨어 애플리케이션에 관한 기술 프레젠테이션을 실시한다.
스폰서들을 제외한 채 전문가들의 관심사에만 포커스를 두는 행사도 있다. 최근 아마존, 올스테이트, 딜로이트, 이베이, 페이스북, 마이크로소프트와 같은 기업에서 연사를 초청했던 ‘데이터 사이언스 컨퍼런스(Data Science Conference)’도 이런 행사들 중 하나이다. 데이터 과학이 아직까지는 새롭게 떠오르는 분야이기 때문에, 이런 행사는 직원들이 새로운 기술을 개발하고, 또 새로운 인재를 채용하기 위한 중요한 경로이다.
데이터 과학 전문가 채용, 앞으로는 좀 더 쉬워질 것
근래 들어 데이터 과학 전문가를 채용하는 일은 쉽지 않았다. 예를 들어 마이크로소프트의 리크루터들은 이 분야 전문가를 채용하기 위해 전문 연구자들이 참석하는 컨퍼런스에 주목하기도 했다. 만일 박사학위 소지자들이 혹할 만큼의 기회와 특전을 제공할 수 있는 기업이라면 이런 채용 방식이 효과가 있을 지도 모른다. 그렇지만 이 정도의 연구 지향적 환경을 제공하기 어려운 기업이라면 어떻게 해야 할까?
“지난 몇 년간 우리는 학부 및 대학원 수준의 데이터 과학 교육 프로그램이 증가하는 현상을 목격해왔다. 실제로 2017년 우리 회사에서 인턴으로 근무한 이들 중 상당수가 상당한 수준의 데이터 과학 이해도와 역량을 보여주었다. 앞으로 몇 년 뒤면 이러한 프로그램들을 통해 배출된 인재를 리크루팅 하는 것이 가능해 질 지도 모른다. 그 동안은 적당히 외부 인재 리크루팅과 자체적 인재 육성 간 균형을 맞출 수 밖에 없다”라고 제이콥슨은 말했다. dl-ciokorea@foundryco.com