자세히 보기

Maria Korolov
Contributing writer

AI가 BI를 만났을 때’ 더 똑똑해지고 유용해진다

데이터 과학이 대중화되고 있다. 데이터 과학자들이 데이터를 취합하고 분석하기까지 몇 달이 걸렸지만, 이제는 현업 사용자가 신속하게 데이터를

머신러닝이 약속하는 데이터 분석을 활용에서 의외의 기술이 등장한다. 바로 비즈니스 인텔리전스(BI)다. 성과 분석 영역이었던 BI 시스템을 인공지능으로 재단장하여 기존의 보고 기능에 예측 기능까지 결합하려는 것이다.

이러한 시도를 하는 조직 중 하나가 심포니 포스트 어큐트 네트워크(Symphony Post Acute Network)다. 미국 일리노이, 인디애나, 위스콘신주 28개 의료시설에 5,000개의 침상을 보유한 의료회사인 심포니는 무릎 수술 등에서 회복 중이거나 투석 치료를 받는 연 8만 명의 환자에 대한 간호를 개선하고자 인공지능과 머신러닝을 활용하고자 했다. 예를 들면, 어떤 환자는 특히 낙상 위험이 있으므로 주의를 더욱 기울여야 한다는 점을 찾아낼 수도 있기 때문이다.

개별적인 데이터 포인트나 미묘한 데이터 패턴으로 나타날 수 있는 이러한 지표를 찾아내는 것이야말로 머신러닝의 완벽한 활용 사례다. 그러나 모델 구축 작업은 간단하지 않다.

심포니의 데이터 과학 및 분석 책임자 네이선 패트릭 테일러는 “예측에 관해 질문 공세를 받았다”고 밝혔다. “온종일 머신러닝 모델 구축에 매달린다고 해도 그 모든 것을 혼자 다 해내는 것은 불가능하다”고 덧붙였다.

심포니는 2명의 데이터 과학자를 추가로 채용했다. 테일러는 “이들의 몸값이 비싸다. 그런데 우리가 필요로 한 결과를 얻지 못하고 있었다. 매우 어렵고 비용이 많이 드는 일이었다”고 말했다.

그래서 2년 전 심포니는 외부에서 대안을 모색하기 시작했다. 즉, 이미 머신러닝 모델 구축을 마치고 활용할 준비가 된 업체를 찾았다. 이제 심포니는 자체 데이터 저장소에 들어 있던 데이터를 데이터로봇(DataRobot)이라는 업체의 클라우드 기반 AI 엔진을 통해 전송한다. 데이터 처리 결과는 4시간에 한번씩 심포니의 마이크로소프트 파워BI 대시보드로 전달된다. 테일러는 “즉각적으로 나와 CIO가 이해했고 깊은 인상을 받았다”면서 “마치 마술 같았다”고 회상했다.

현재 240명의 의사와 간호사들은 태블릿과 스마트폰으로 접속할 수 있는 파워BI 대시보드에서 직접 예측과 추천을 받고 있다. 예를 들면, 낙상 위험이 높은 환자는 자동으로 계단 아이콘이 표시되고 재입원의 위험이 높은 환자들은 구급차 아이콘이 표시되는 식이다.
 

—————————————————————
AI·머신러닝과 BI 인기기사
->유비쿼터스 AI 시대··· 머신러닝이 차세대 BI인 이유
-> 성공하는 BI 전략의 7가지 특징
->머신러닝과 예측 알고리즘에 ‘안성맞춤’ 데이터 과학 툴 10선
->데이터 과학자·머신러닝을 비즈니스에 활용하는 방법(태도)
->‘데이터 입력, 지능 출력’ 알기 쉽게 설명하는 머신러닝 파이프라인
->연대별로 본 비즈니스 인텔리전스 변천사
->8가지 사례로 본 헤지펀드의 AI·머신러닝 사용법
—————————————————————
BI에 AI 주입
테일러에 따르면, 재입원 비율은 심포니에게 큰 문제였다. 병원과 보험회사는 재입원 비율을 검토했다. 재입원 1건당 회사는 미화 1만 3,500달러를 부담하게 된다. 테일러는 “무시할 수 없는 액수”라고 지적했다.

데이터로봇의 예측이 유용했는지를 알아내기 위해서 심포니는 데이터로봇 피드를 자체 시설 중 일부에서 활용하면서 6개월간 재입원 비율에 차이가 있었는지 조사했다. “1%라도 움직일 수 있다면 아주 잘하고 있는 것”으로 간주했다.

실제로 비율은 21%에서 18.8%로 낮아졌으며 “이는 의미 있는 수치였기 때문에 CEO를 설득할 수 있었다”고 그는 전했다.

오늘날 심포니는 보험회사와의 계약을 검토할 때도 똑같은 접근법을 적용하고 있다. 테일러는 “서비스에 대해 제대로 비용을 청구하지 않는다면 돈을 버리는 것이나 마찬가지기 때문”이라고 설명했다.

최초의 설치에는 약 20시간이 걸렸다. 데이터 피드를 연결하고 학습 모델을 설정하는 작업이 필요했다. 이제 새로운 종류의 예측을 원할 경우 평일 기준 사흘에 걸쳐 6시간 내지 8시간이면 새로운 학습 모델을 설정할 수 있다고 한다.

또한 기존 모델도 언제든지 재훈련이 가능하다고 한다. 예를 들면 규정이 바뀌거나 의료진이 새로운 수술을 시작하기도 하고 시간이 지나면서 모델이 표류하기도 한다. 테일러는 3개월에 한번씩, 또는 중대한 정책 변경이 있을 때마다 모델을 재훈련 시킨다. 큰 변화가 있으면 새로운 정책이 발효된 이후에 들어온 데이터만을 기준으로 학습 모델을 훈련해야 한다.

시스템 관리에는 이제 더 이상 고도로 훈련된 데이터 과학자가 필요 없지만 기본적인 통계 지식을 갖춘 사람이 필요하다고 한다. 심포니에서는 R 코드도 사용해서 모델을 설정한다.

데이터로봇은 또한 파이썬도 즉각 지원한다. 데이터로봇의 제품 마케팅 책임자 콜린 프리스트에 따르면 자바, C#, SAS, 자바스크립트, 비주얼 베이직 등 다른 언어를 사용하는 고객들도 레스트(Rest) API 인식 언어를 사용해 데이터로봇 레스트 API를 호출할 수 있다.

AI의 다음 단계는 셀프서비스
포레스터 리서치의 부사장 겸 수석 애널리스트 보리스 에벨슨은 “AI가 대중화되었다”며 “최근까지만 해도 코드를 작성하려면 데이터 과학자가 필요했다. 지금은 BI시스템 덕분에 몇몇 데이터 포인트를 지목해 클릭하고 예측하고자 하는 변수(예: 고객의 구매 성향)를 선택하기만 하면 예측 모델이 자동으로 생성된다”고 설명했다.

한때는 데이터 과학 전문가가 몇 달씩 걸려 수집하던 것이 이제는 데이터를 이해하고 엑셀을 다룰 줄 아는 사람이라면 며칠 만에 수집할 수 있게 되었다고 한다.

“마케터들은 고객 행동 예측 및 대응에, 비즈니스 관리자들은 위험 점검 및 예측에, 공급망 관계자들은 물류 점검 및 최적화에 이를 활용하고 있다”고 한다.

최근 포레스트에서 전세계 의사결정권자를 대상으로 한 설문조사에 따르면, 데이터, 분석 또는 통찰 플랫폼 개선이 인공지능 기술의 3대 활용 사례 가운데 하나로 나타났다. 또한, IBM, 오라클, 마이크로소프트 등 주요 BI업체는 모두 이 분야에 열중하고 있다.

8시간이 새로운 기계학습 모델 설정 시간치고는 너무 길다고 느끼는 사람을 위한 간편한 옵션도 등장할 예정이다. 머지않아 사용자들은 가장 흔한 종류의 예측을 자동으로 받게 될 것이며 추천도 받고 내장된 이미지 인식 및 자연어 처리 기능도 사용할 수 있게 된다. 가트너는 향후 2년 이내에 자연어 생성 및 인공지능이 최신 BI 플랫폼 중 90%의 표준 기능이 될 것으로 내다보고 있다.

문자 및 시각 분석에 BI 활용
스프링보드에이아이(SpringBoard.ai)의 CEO 브루스 몰로이에 따르면, 사용자는 자연어 처리를 통해 정보가 필요할 때 평소에 쓰는 말로 질문할 수 있게 될 것이다. 몰로이는 “그것이 자연스러운 발전 방향이라고 본다”고 덧붙였다.

영역이 좁으면 좁을수록, 플랫폼이 접근할 수 있는 데이터의 연관성이 높으면 높을수록, 업체가 AI 기능을 추가하기 더 쉬워질 것이다. 회계 플랫폼이나 세일즈포스 같은 CRM시스템은 이미 필요한 데이터를 보유하고 있으며 사용자들이 할만한 가능성 높은 질문은 정해져 있다. 몰로이는 “세일즈포스로 어떤 일을 하는지 지켜보는 것은 매우 흥미로울 것”이라며 “이미 작업은 부분적으로 돼 있다. AI업체는 이러한 시각이 중요하다고 판단을 내렸으며 그 위에 AI 기능을 추가할 수 있다”고 이야기했다.

인공지능의 활용은 처리 성능 향상, 똑똑해진 알고리즘, 클라우드 컴퓨팅, 표준 인터페이스로 더욱 탄력을 받고 있다. 데이터로봇만 해도 클라우드 컴퓨팅과 표준 레스트 API를 모두 활용하고 있다. 그 결과 트리팩타(Trifacta), 알터릭스(Alteryx), 도미노 데이터 랩(Domino Data Labs) IB시스템뿐 아니라 파워BI, 태블로(Tableau), 클릭(Qlik), 엑셀, 알 샤이니(R Shiny) 등 다른 대시보드 도구들도 지원된다.

AI로 구동되는 BI대시보드는 예전보다 훨씬 다양한 데이터도 처리할 수 있다. 예를 들어 심포니는 환자 기록에서 구체적인 숫자만이 아니라 의사와 간호사가 남긴 환자의 경과 기록도 살펴본다.

컨설팅 회사 퍼블리시스사피엔트(Publicis.Sapient)의 데이터 및 인공지능 글로벌 책임자 조시 서튼은 비정형 형태로 저장된 정보가 많으며 이는 유용한 통찰이나 예측으로 이어질 수 있다고 보았다. 문자 정보에 국한되지 않는다.

서튼은 “비정형 데이터 중에서 BI를 제공해 주는 가장 큰 원천은 시각적 정보”라고 밝혔다. 예를 들면 마케팅 부서는 고객이 SNS에 공유하는 사진을 기준으로 고객의 제품과의 상호 작용 방식을 분석하여 활용할 수 있다.

서술적 분석을 넘어
인터내셔널 데이터(International Data)의 인지 및 인공지능 시스템의 연구 책임자 데이빗 슈멜에 따르면, 예측과 통찰은 AI가 BI 대시보드에 추가할 수 있는 것의 첫 단계에 불과하다. AI로 구동되는 대시보드는 조언을 제공할 수도 있고 사용자가 다음에 해야 할 구체적인 행동을 제안해 줄 수도 있으며 심지어는 사용자 대신 그러한 행동을 대신해 주겠다고 하기도 한다.

슈멜은 “만일 위젯[영업] 실적이 떨어지고 있다면 그것이 미래에 의미하는 것은 무엇인지 지금 어떤 조처를 해야 하는지 말해 줄 수 있다”고 말했다.

그래서 BI가 더욱 가치 있다.

세일즈포스의 아인슈타인 예측이 최근 하루 10억 건을 돌파했다. 모범적인 인텔리전스를 통해 사람들은 새로운 사업을 마감하고 새로운 실마리를 파악해 행동 지향적인 기능을 만들어 내는 데 도움을 얻고 있다. 이는 사람들이 단순히 서술적인 비즈니스 분석 그 이상의 것을 원하고 있음을 나타낸다고 보고 있다.

슈멜은 “아직 상당히 초기 단계에 있다”며 “향후 2년에서 3년 안에 완전히 성숙하게 될 것이다. 사람들은 인공지능과 머신러닝에 어떤 가능성이 있는지 이해하기 시작했다”고 덧붙였다.

액센츄어의 수석 애널리스트 겸 인공지능 글로벌 책임자인 러먼 차우드허리는 특히 AI에는 아직 상식이 없다고 지적했다.

차우드허리는 “좁은 AI의 세계에 있다”고 말했다. 특정 플랫폼에 AI모델이 내장되어 사용될 준비가 되어 있다고 해도 여전히 사용자는 사용되고 있는 데이터와 그것이 현안에 갖는 의미를 이해해야만 한다.

그는 “출력 결과가 적절한지 확인해야 한다”며 “이러한 분야에서 인간의 판단을 완전히 대체할지는 모르겠다. 실질적인 의사결정을 완전히 자동화할 수 있는지, 그래도 되는지도 잘 모르겠다”고 이야기했다. dl-ciokorea@foundryco.com

Maria Korolov
Contributing writer

Maria Korolov is an award-winning technology journalist with over 20 years of experience covering enterprise technology, mostly for Foundry publications -- CIO, CSO, Network World, Computerworld, PCWorld, and others. She is a speaker, a sci-fi author and magazine editor, and the host of a YouTube channel. She ran a business news bureau in Asia for five years and reported for the Chicago Tribune, Reuters, UPI, the Associated Press and The Hollywood Reporter. In the 1990s, she was a war correspondent in the former Soviet Union and reported from a dozen war zones, including Chechnya and Afghanistan.

Maria won 2025 AZBEE awards for her coverage of Broadcom VMware and Quantum Computing.

이 저자의 추가 콘텐츠