1997년 5월 11일, 세계인이 즐기는 한 게임 분야에서 컴퓨터가 인간을 넘어서는 일이 발생했다. 카네기 멜론 대학이 칩테스트(ChipTest)라는 이름의 시스템으로 개발한 IBM의 딥블루(Deep Blue)가 세계 체스 챔피언 개리 카스파로브(Garry Kasparov)와의 대국에서 승리를 거뒀던 것이다.
당시 딥블루 개발팀의 일원이던 머레이 캠벨이 IDG 뉴스 서비스와의 인터뷰를 통해 인공지능에 대한 시각을 공유했다. 컴퓨터가 인간과 대등한, 혹은 인간을 능가할 수 있는 영역들을 진단하는 한편, 미래에의 의미에 대한 것들이다. 주요 인터뷰 내용은 다음과 같다.
IDGN : 딥블루 런칭에 맞춰 IBM에 합류했다는 소개가 옳은 내용인가?
머레이 캠벨(MC): 완전히 옳은 표현은 아닌 것 같다. 당시 난 피츠버그 카네기 멜론 대학 소속이었고, 1989년 동료들과 함께 IBM에 합류하게 됐다. ‘딥블루’라는 이름이 쓰이기 시작한 것은 그로부터 일 년 뒤다.
그렇다면 딥블루 프로젝트에 전속으로 참여한 것인가?
입사 후 세계 챔피언십이 치러진 1997년까지는 내 역할이었다. 우리는 딥블루를 개발하고, 개선하는 작업을 진행해나갔다.
딥블루에 말을 직선으로 옮기도록 하는 버그가 존재했고, 그것이 카스파로브에게 혼란을 줘 패배를 야기했다는 의견도 있다. 사실인가?
근거 있는 의견이라고 확언하긴 어려울 것 같다. 당시 상황을 설명하자면, 1회전 후반부, 딥블루는 패배가 예견되는 상황이었다. 딥블루에게 불리한 판세 속에서 몇 수가 오갔고, 카스파로브 역시 승기를 읽고 있었을 것이다. 카스파로브는 분명 이기는 수를 알고 있었다고 본다. 그런 상황 속에서 딥블루는 버그로 인해 예측하지 못한 수를 두게 된다. 분명 잘못된 수였고, 카스파로브가 대응수를 뒀을 때 우리는 패배를 선언했다.
이 1차전에 관해 일부에서는 카스파로브가 딥블루의 사고방식과 역량을 제대로 이해하는데 방해를 줬다고 이야기하기도 한다. 그러나 개인적으론 이런 의견은 어디까지나 추측일 뿐이라 생각한다.
해당 버그는 어떻게 발생한 것인가? 당시 관련 원인을 이해할 수 있었나?
일단 원인은, 이해 가능했고 수정 역시 이뤄졌다. 수정의 경우 2차전이 끝난 뒤에야 가능했기에 결국 한 차례 더 버그가 존재하는 상황에서 대국을 치른 셈이다. 다행히 발생 빈도가 낮은 버그였기에 2차전에서는 문제가 발생하지 않고 게임 진행이 가능했다.
분석에 따르면 버그는 특정 상황 하에서 발현되는 것이었다. 딥블루는 말 이동 계산에 시간 제한을 설정하고 있었는데, 해당 시간을 전부 소모할 경우 말을 랜덤으로 이동시키는 문제가 발생했다. 해당 버그는 대국 수 개월 전 이미 확인된 내용이었고, 팀 내부에서는 이미 수정된 내용으로 파악하고 있던 부분이다. 돌이켜보면 버그 동작을 야기하는 상황은 5가지였는데, 우리는 그 중 4가지를 수정하고 하나를 놓친 것으로 보인다. 그리고 그 하나가 첫 대국에서 발생하게 된 것이다.
당시의 대국 이후, 딥마인드(DeepMind)의 알파고(Alpha Go)는 세계 바둑 최고수로 등극했고, IBM의 왓슨(Watson)은 그보다 먼저 제퍼디 챔피언 자리에 올랐다 본인이 생각하는 AI의 다음 핵심 과제는 무엇인가?
체스나 바둑 같은 보드 게임에서는 AI의 역량이 충분히 증명됐다고 본다. 해당 영역에서의 실험은 더 이상 필요하지는 않다고 생각한다. 이제는 보다 높은 복잡도의, 현실적인 문제들에 도전할 시점이다.
체스와 같은 게임은 매우 구체적인 정의가 가능한 영역이다. 모든 결정은 논리적으로 이뤄지고, 정보 역시 온전히 공개된 상태로 게임이 진행된다. 어떤 움직임이 가능하고 어떤 상황에서 체크메이트가 선언되는지 분명한 것이다.
그러나 현실 세계는 이런 모습이 아니다. 현실 속의 모든 의사결정은 상당한 복잡성을 내포하고 있다. 이 영역의 과제나 문제를 다룸에 있어서는, 보다 깊은 층위의 복잡성을 고려해봐야 할 것이다.
컴퓨터 게임 분야에서도 흥미로운 도전들은 가능할 것이다. 이를테면 최근 전문 포커 플레이어와 프로그램 간의 게임 대결이 주목을 받은 사례가 있다. 이 게임에서 흥미로웠던 점은 상대방(인간)의 패에 대한 정보가 감춰진, 불완전 정보를 기반으로 의사결정이 이뤄졌다는 점이다. 불완전한 정보는 의사결정의 복잡도를 증대시키는 요인으로 작용한다. 이런 사례는 이 밖에도 다양할 것이다.
장기적인 관점에서 AI 산업의 목적은 특정 문제를 인간과 같은 수준으로, 혹은 인간보다 뛰어나게 해결하는 시스템을 개발하는 것이 아니다. 우리가 진정으로 원하는 것은, 우리 인간을 보완해주고, 우리의 의사결정에 도움을 주는 시스템이다.
체스 얘기로 돌아가보면, 초기 딥블루를 통해 우리가 달성하고자 했던 목표는 ‘세계 최고의 인간과 대등하게 경쟁할 수 있는’ 시스템을 만드는 것이 가능할지를 증명하는데 있었다. 그리고 우리는 인간과 완전히 다른 방식으로 체스를 두는 시스템을 개발하는데 성공했다. 인간의 접근법은 나름의 강점과 약점을 동시에 가지고 있으며, 우리가 활용한 컴퓨터의 접근법 역시 나름의 강점과 약점을 가지고 있다. 그리고 이 둘을 결합한다면 중단기적으로 개별 인간, 혹은 개별 컴퓨터를 능가하는 체스 플레이어를 개발하는 것이 가능하다는 점은 이미 증명됐다.
이 시각은 20년이 지난 지금도 여전히 유효하다. 우리가 얻은 이 교훈은 오늘날 우리가 상상할 수 있는 사실상 모든 현실의 문제들에 적용 가능하다고 생각한다.
의료 활동을 예로 들어보자. 의사는 환자를 진찰해 증상을 파악하고, 관련 처방을 내릴 수 있다. 그런데 이런 그에게 문제를 다른 시각에서 해석하고, 다른 처치법을 제안할 수 있는 조수가 제공된다면 어떤 변화가 있을까? 이 조수는 학계의 모든 최신 논문과 의약 실험을 분석해 인간이 내린 판단과 다른 대안적 진단, 처방을 제안할 수 있다. 물론 이 경우에도 해당 제안을 고려하고 수용, 거부하는 최종 결정권은 인간의 몫으로 남게 된다. 이런 협력의 구조는 두 존재가 각각 기능하는 것 이상의 시너지를 창출하며 우리의 사고를 확장해줄 것이다.
최종 결정권은 인간의 몫으로 남게 되는 이런 증강 지식 시스템이 상용화될 경우, 책임소재와 관련한 법적 논쟁이 발생하지는 않을까?
일단 앞서 의료 활동을 예로 들었지만, 우리 삶의 모든 문제들이 생사와 관련한 것은 아니라는 점을 덧붙이고 싶다. 영화나 책을 추천해주는 시스템이라면, 그것의 실수가 세상을 망쳐버리는 일은 없을 것이다. 물론 의료 활동처럼 의사결정의 중요성이 매우 큰 영역도 분명 존재한다. 이와 관련해 개인적으로 할 수 있는 제안이라면, 앞으로도 한동안 판단의 근거를 분석하고 최종 의사결정을 내리는 역할은 인간에게 맡겨져야 한다는 정도인 것 같다.
하지만 우리 인간이 다른 존재가 제안하는 대안의 합리성을 분석하고 그것의 장단점을 이해하는데 보다 익숙해질 경우, 장기적으로는 최종 의사결정의 품질에 분명한 개선이 있을 것이라 생각한다.
앞서 딥블루의 버그 검증에 관해 이야기했지만, 최신 세대의 AI들은 그 이해나 감사 과정이 딥블루에 비해 한층 어려워진 것이 사실이다. AI가 어떤 검색과 판단 과정을 거쳐 우리에게 해답을 전달하는지를 회귀분석할 수 없어지는 것이다. 특히 위에서 강조한 현실 세계의 문제들과 관련해서는 그 어려움이 한층 심화될 것으로 보인다.
좋은 지적이다. 오늘날 AI가 내포한 가장 중요한 문제 가운데 하나가 그것이다. 그간 우리는 특정 문제에 맞춰 훈련된 대규모 신경망이나 딥러닝 분야에서 여러 성공 사례를 발굴해왔고, 그것들의 현실적 실용성도 분명이 입증된 상태다. 하지만 여기에는 거대한 사각지대가 존재한다. 인공지능 스스로도 자신의 의사결정에 관해 ‘설명’하지는 못한다는 점이다.
이 문제를 해결하려는 연구 프로젝트는 딥블루 시절부터 진행된 바 있는 내용이다. 딥블루의 경우에는 신경망 기반이 아닌 수 십억의 가능성을 분석하는 대형 검색 기능의 측면이 컸지만, 이에 관해서도 그 판단 기준을 해석할 현실적 방안은 마련하지 못했던 기억이 있다. 만일 우리가 본격적으로 딥블루가 제안한 내용을 이해하고 그 판단 근거를 이해하려 했다면, 무척 많은 노력이 필요했을 것이다.
당시 내가 속한 팀의 핵심 연구 과제 중 하나는 AI를 해석하는 작업이었다. AI가 스스로를 설명하도록 함으로써 증강 지능 시스템과 인간 의사 결정권자 간의 논리적 커뮤니케이션을 구현해 효율성을 증진한다는 구상이었다.
해당 목표를 위해 구체적으로 어떤 접근법을 취했나?
머신러닝 자체의 해석을 돕는 머신러닝 방법론을 연구하는 시도가 있었다. 의사결정 혹은 예측을 제시하는 시스템에 더해, 해당 시스템의 판단기준을 인간이 이해 가능한 방식으로 해석해 해당 결정이 어떤 측면에서 이뤄졌고, 어떤 이유로 적절한 것인지를 설명할 도구를 구성한다는 아이디어였다. 실제 개발이 이뤄졌다면 상당한 비용을 소요했을 것이라 생각한다. 이 추가적 시스템이 제공하는 각종 결정 및 설명 사례를 통해 우리는 유효한 해석 방법론에 대한 시각을 확보할 수 있을 것이다.
이외의 방식으로는 몇 가지 표준적 머신러닝 접근법으로서, 고려할 수 있는 규정들에 기반한 높은 해석가능성의 시스템들을 개발하는 것도 생각해볼 수 있다. 규정이란, 예를 들자면 온도가 특정 기준을 넘어서고, 습도가 이런저런 상황이면 인간이 불쾌감을 느낀다는 식의 판단기준을 의미하는 개념으로, 우리 인간이 매우 직관적으로 받아들일 수 있는 대상이라는 장점이 있다.
단 여기에 역시 한계가 존재한다. 현실 세계의 문제들은 그 복잡도가 매우 높아 단순한 규정 설정만으로는 해석에 한계가 있다. 많은 이들이 이를 중요한 연구 주제로 삼고 있는 이유 역시 여기 있다고 본다. 해석에서 중요한 점은 그것의 신뢰성뿐 아니라, 유용성 역시 고려해야 한다는 점이다. 이 두 요소 간의 고려가 현재 우리가 고민하고 있는 부분이다.
앞서 법적 책임에 관한 내용도 언급됐다. 해석의 신뢰성을 보증하고 AI 시스템의 판단을 법률 절차 상의 신뢰 기준과 연결 짓기 위한 시도 역시 진행 중일까?
기술을 넘어 법적 관점에서 시스템을 바라보는 질문으로 드린다. 기본적으로는 내 지식만으론 답변이 어려운 부분 같다. 그럼에도 아는 한도에서 답변해보자면, 해당 문제는 ‘의사결정’과 관련한 부분이고, 앞으로도 수십 년간은 그 최종적 책임이 인간에게 맡겨져야 한다는 입장이다.
컴퓨터는 의미 있는 제안, 그리고 나아가서는 그 제안에 관한 설명을 제공할 수 있는 존재지만, 그 역할은 어디까지나 도구적 역할에 한정돼야 한다. 그리고 궁극적으로 책임을 지는 것은 인간 의사결정권자가 되어야 할 것이다.
컴퓨터가 인간을 보조하는 구조에 대한 구체적 사례나, 해당 구조가 적용될 수 있는 구체적 영역들에 관한 소개를 부탁한다.
앞서 언급한 의료 분야를 좀 더 구체적으로 예증해보자. 딥러닝 접근법을 활용해 IBM에서 우리는 피부암 진단 목적의 이미지 인식 시스템을 개발한 바 있다. 피부 병변 사진을 입력하면 해당 병변의 특성을 확인, 분류하는 시스템이다. 분류 정확도는 상당한 수준으로, 많은 경우 인간 전문가보다도 높은 정확도를 구현하고 있다.
하지만 환자의 전체 이력을 이해하는 것은 이 시스템으로 진행할 수 없는 작업이다. 결국 실제 환자를 진단하고 관련 정보를 시스템에 입력하는 의사의 역할은 여전히 필요한 것이다. 더불어, 시스템을 통해 ‘피부암으로 악화될 가능성이 85%’로 분석된 병변이라도, 개인의 특성에 따라 단순 병변으로 남아있을 가능성 역시 15%의 확률로 존재한다. 이러한 세부적 진단을 위해 환자를 진찰하고 그의 이력을 살피는 일을 맡는 것은 언제까지나 의사다.
개인적으로 흥미 있게 접한 또 다른 사례는 일명 ‘노년의 공간’이라 불리는 작업이다. 이는 노년층을 타깃으로 한 일종의 스마트 홈으로, 각종 센서와 사물인터넷 테크놀로지, 그리고 해당 센서들을 AI 기반 시스템이 갖춰진 공간이다. AI 시스템은 센서를 통해 문제 상황으로 추측되는 이상 징후들을 포착하고 보호자에게 경고 알림을 전달하는 역할을 한다.
현대인들은 자신의 주의를 어디에 쏟을지 혼란스러워하고 있다. 이런 우리에게 시스템은 우리가 집중해야 할 부분을 알려주는 보조자로서, 협업적 구조를 구성하는 핵심 축으로 기능할 것이다.
개인적으로 보기에, 오늘날 AI 산업에서 전개되고 있는 활동 가운데 본인의 삶에 가장 큰 영향을 미칠, 개인적으로 기대하고 있는 작업은 어떤 것인가?
은퇴 후 보다 세부적인 정보들이 관리되고, 내가 그것들을 활용할 수 있는 한층 발전한 ‘노년의 공간’에서 생활할 수 있다면 좋겠다. AI의 발전을 통해 현재는 제한적으로 활용되고 있는 시스템들이 보다 현실적인 가치들을 전달해나갈 것이다.
딥러닝 분야에서 여러 진보들이 목격되고 있지만, 개인적으로는 그 초점이 인지적 요소들에 집중된 점에 아쉬움을 느끼고 있다. 좀 더 설명하자면, 우리에게 전달되는 정보는 이미지나 오디오 클립 등이 대부분이며 우리가 할 수 있는 활동 역시 이미지를 분류하거나 오디오 클립을 기반으로 텍스트를 생산하는 정도라는 말이다.
반면 다단계 논증과 기획, 전략적 사고 분야와 관련한 연구에서는 아직 AI 시스템의 강점이 온전히 발휘되고 있지 못하다고 본다. 앞으로 우리가 집중해야 할 영역은 여기다. 앞서 우리 인간이 집중해야 할 영역을 결정하는데 도움을 주는 AI 시스템의 역할을 이야기한 것과 비슷한 맥락에서, 무언가 중요한 것이 존재한다는 직감이 드는 영역으로 AI의 문제 검증, 방향성 초점을 설정하는 것이 인간의 역할이 아닐까 생각한다.
이후의 10년은 인간의 종합적 역량이 기계의 역량과 조화를 이루는 시스템의 시대가 될 것이다. 의료, 교육, 노인 복지까지, 상상 가능한 모든 영역에서 새로운 변화들이 관측될 것이다.
AI 시스템 개발을 직업으로 삼아온 입장에서, 업무 진행 과정에 AI 시스템의 도움을 받은 경우도 있는가?
물론 다양한 툴들을 연구에 활용 중이다. 웹 서치를 비롯해 기술 논문을 검토하는 과정에서 내가 집중해야 할 부분들을 파악하게 해주는 도구의 도움을 받고 있다. 하지만 내가 제시한 질문에 답을 전달한다거나 내게 작업 방향성을 제시해주는, 또는 연구의 수익성이나 실현 가능성의 측면을 분석해주는 활동과 관련해서는 마땅한 툴을 만나보지 못했다. 연구 과정을 개선해주는 AI 툴을 개발해 연구 효율성을 개선한다니, 상당히 흥미로운 프로젝트 아이디어다.
해당 아이디어가 업계의 다음 과제가 될 수 있을까?
충분히 가능성 있다. 물론 산업에서는 수백 만, 수십 억의 일상에 가치를 제공할 여러 현실적 문제가 연구되고 있기에 모두가 이 주제에 관심을 가지지는 못할 것이다. 하지만 AI 연구 커뮤니티 내부에서 정보의 홍수 속에 혼란을 겪는 일은 분명 간과할 수 없는 문제다. 산업에는 매일 수 많은 논문이 쏟아지고 있으며, 불과 5년 전과 비교해도 완전히 다른 모습으로 변화하고 있다. 다른 현실의 영역들과 마찬가지로, 우리 역시 AI의 도움을 필요로 하는 상황이다. dl-ciokorea@foundryco.com