컴퓨터가 처음 발명된 그 순간부터 우리는 기계와 커뮤니케이션 하는 다양한 방식을 시도해 왔다. 키보드, 마우스처럼 전통적인 인풋 장치가 오랜 시
음성 인식
최근에 애플의 시리나 마이크로소프트의 코타나, 또는 구글의 어시스턴트(‘오케이 구글’)를 사용해 본 적이 있다면, 짧은 시간 안에 음성 인식 기술이 눈에 띄게 발전했음을 알 수 있을 것이다. 심지어 고객 서비스 전화의 자동 응답 메시지조차 예전보다 훨씬 친절하고 효율적으로 바뀐 것 같다. 과연 어떻게 이것이 가능해졌을까?
간단히 말해 인공지능의 힘이다. 음성 인식 전용 머신러닝 시스템이 지속해서 (대화 및 발화로부터 얻어낸) 막대한 양의 데이터를 소화해 그 속에서 패턴을 찾아냈기 때문이다. 구글, 애플 등 음성인식 분야의 거물들이라 할 수 있는 기업들도 AI가 수년간 쌓인 음성 녹음 데이터를 뒤지고 분석하여 발화자가 어떤 말을 하고자 하는지 정확히 예측하는 알고리즘을 완성해 냈다. 이메일이나 문자 앱의 자동완성 기능과 비슷한 방식이다.
이러한 인공지능 알고리즘이 마이크 기술의 발전과 만나면서 효율적이고도 정확한 음성 인식 기술을 실현해 낸 것이다. 앞으로 몇 년 뒤면 이러한 시스템이 우리와 컴퓨터 간 커뮤니케이션 방식을 완전히 장악하게 될 것이다. 스마트폰 음성인식 기술이나 아마존 에코, 애플의 홈팟 같은 테이블용 스마트 스피커는 그 시작일 뿐이다.
음성 인식, 더 효율적이라는 증거는?
낙관적인 전망만 하지 말고 증거를 보여달라고 말하고 싶은 독자들이 있을 것 같다. 공교롭게도 최근 스탠퍼드대학교에서 음성 인식과 스마트폰 타이핑 간 효율성 정도를 비교한 연구 결과를 내놓았기에 살펴보고자 한다.
연구팀은 애플 스마트폰과 바이두의 딥 스피치 2(Deep Speech 2) 엔진(딥 스피치 2는 다수의 상업용 음성인식 앱을 기저에서 구동하고 있다)을 사용하여 실험한 결과 음성 인식 사용자는 스마트폰 사용자보다 문자나 이메일을 보낼 때 평균적으로 3배 가까이 빠른 속도를 보였다. 그 뿐만 아니라 오타율 역시 음성 인식 사용 시 2.93%, 키보드 사용 시 3.68%로 더 낮았다. 즉 음성 인식이 타이핑보다 훨씬 빠를 뿐 아니라 정확하기까지 하다는 증거를 보여준 것이다. (이 연구팀은 중국어로도 같은 실험을 하였는데 여기에서도 음성 인식이 2.8배 빨랐고, 오타율은 일반 키보드가 20.54%인 것에 반해 7.51%로 낮게 나왔다.)
단, 이러한 실험 결과는 어디까지나 터치스크린 키보드와 비교한 것이지 컴퓨터의 쿼티 자판과 비교한 것은 아니다. 스탠퍼드대학에서 실험 대상으로 스마트폰을 선택한 것은 향후 음성 인식 기술이 만연할 가능성이 가장 높은 경로가 바로 스마트폰을 통해서이기 때문이었다.
동작 인식
수백만 년에 이르는 긴 세월 진화해 오면서, 인류는 다양한 언어를 통해 서로 커뮤니케이션 하는 방식을 더욱 정교하고 세련되게 발전시켜 왔다. 바디 랭귀지도 그러한 언어 중 하나이다. 동작 인식 시스템은 이러한 바디 랭귀지 사용을 데이터 입력 장치로 활용하고자 하는 시도다. 음성 인식이 가장 자연스러운 인풋 방식이라고 한다면, 동작 인식은 아마 음성인식 다음으로 자연스러운 방식일 것이다.
전 세계적으로 수백 개 기업, 연구소에서 동작 인식 시스템 개발에 몰두하고 있지만, 흥미롭게도 가장 선두에 선 것은 자동차 산업이다. BMW 7 시리즈 같은 첨단기술 초호화 상품들은 손동작만으로 라디오, 대시보드 등을 조작할 수 있다.
일터에서는 립 모션(Leap Motion) 컨트롤러와 같은 주변 기기들을 통해 동작 인식의 가까운 미래를 엿볼 수 있다. 적외선 카메라 및 센서를 이용한 립 모션 시스템은 정해진 구역 내에서 사용자의 손 및 손가락 움직임을 추적하며, 사용 중인 소프트웨어에 따라 명령어를 입력한다. 기업들에서 립 모션 시스템이 사용된 것은 벌써 몇 년 되었으며 개발자들의 경우 특히 이 기술을 가상 현실 애플리케이션(이를테면 가상 조각 활동 앱) 등 여러 가지 흥미로운 목적으로 사용하고 있다.
또 다른 관점
립 모션의 외장 카메라 및 동작 인식 센서 등으로도 동작 인식 기술을 실현할 수 있지만, 이것이 전부는 아니다. 가상 현실 글러브 역시 아직 연구, 개발할 것이 무궁무진한 상태로 남아 있다.
마누스 VR(Manus VR), 글로브원(Gloveone)같은 VR 전용 글러브가 이미 써드파티 개발자의 손에 들어간(?) 상태다. 앞으로 이 기술은 하드코어 VR 사용자에서 주류 사용자들로 확산되어 나갈 가능성이 크다. 특히 VR 기술을 일반적인 사무실에서도 사용하기 시작한다면 말이다. 한편 MIT 미디어 랩(Media Lab)의 연구진은 아직 콘셉트 단계긴 하지만 사무실에서 데일리로 사용이 가능한 T 글러브(또는 테더 글러브, Tether glove)와 같은 햅틱 인풋 장치들을 설계하고 있다.
그런가 하면 글러브로 만족하지 못하는 이들도 있다. 예를 들어 마이오(Myo) 암밴드(사진 참조)는 웨어러블 모션 컨트롤러로 착용자의 팔 근육 움직임을 포착하여 컴퓨터, 휴대전화, TV, 게임 시스템 등과 상호작용 할 수 있는 입력 장치다. 이 시스템은 주먹을 쥐거나, 손가락을 가리키는 등 특정 제스처들을 인식할 수 있으며 써드파티 개발자들은 현재 미오 기술을 응용하여 가상의 키보드에 대고 타이핑을 할 수 있는 기술을 개발 중이다.
디지털 타투
좀더 공상과학다운 발명들도 빼놓을 수 없다. 공상과학적 발명이라면 MIT 미디어 랩이 대표주자 격인데, 이들의 온라인 프로젝트 페이지를 탐색해 보는 것도 흥미로울 것이다. 정말 쉬지 않고 미친 짓(?)을 시도하는구나 싶을 것이다.
지난해 MIT의 한 연구팀은 듀오스킨 시스템(DuoSkin system)이라는, 기상천외한 입력 장치 개념을 소개했다. 바로 비영구적 ‘디지털 타투’의 개념이었다. 듀오스킨은 무선으로 컴퓨터나 휴대전화, 전자 기기와 연결되어 착용자의 피부 표면에 다양한 문양을 새기는 기술이다. 이러한 디지털 타투는 금박 재질의 전도성을 이용하고 있으며 사용자가 움직임에 따라 발생하는 마찰 및 운동 에너지를 작은 서킷을 통해 얻는다.
물론 이 모든 것은 아직 콘셉트 단계지만, MIT 연구팀은 이미 그래픽 소프트웨어와 일반 프린터를 이용하여 나만의 타투를 제작하고 착용할 수 있는 시스템의 프로토타입을 완성해 냈다. 이러한 전자 타투는 음악 재생기의 제어 인터페이스나 트랙패드 기능을 할 수 있고, 여기서 좀 더 나아가면 팔뚝이나 심지어 손톱 위에 실제 키보드를 구현해 낼 수도 있을 것이다.
진정한 의미에서의 스마트 의복 기술, 현실화될까
사실 초기 웨어러블 컴퓨팅 디바이스들은 아무리 좋게 말해도 ‘어색하다’고 밖에 표현할 수 없는 부분이 있었다. 그러나 스마트 패브릭 기술과 플렉서블한 전자 기기 기술이 빠르게 발전하면서, 머지않아 진정한 의미에서의 웨어러블 컴퓨터, 실제로 착용자와 상호작용하는 의류를 매장에서 만나볼 날이 올 것 같다.
어떻게 알 수 있을까? 사실 미래 기술 동향을 파악하는 가장 확실한 방법의 하나는 특허권의 흐름을 보는 것이다. 최근 사례들을 보자. 2017년 8월, 애플은 스마트 패브릭 및 웨어러블 디바이스와 관련한 3건의 주요 특허권 신청을 냈다. 이들 중에는 애플이 ‘섬유 기반 터치 센서티브 테크놀로지’라 부르는 광범위한 이니셔티브도 포함되어 있다.
이러한 개념은 키보드나 터치스크린 같은 기존의 입력 기술과 확연히 구분되는 새로운 부류의 입력 방식이다. 애플의 특허권 신청서에 따르면, 이 신소재는 전도성 섬유를 사용하여 그 어떤 옷이나 패브릭 재질의 물체(예컨대 지갑, 소파 등)도 터치스크린 입력 장치로 만들 수 있다고 한다. 그동안 이름만 스마트한 ‘스마트 의류’를 많이 봐왔지만, 만일 애플의 특허 기술이 현실화 된다면 다시 한 번 애플이 남들과 다른 사고를 통해 혁신을 이루어낸 사례가 될 것이다.
시선 인식 기술
(적어도 아직은) 컴퓨터가 사용자의 생각을 읽을 수는 없다. 그렇게 되려면 시간이 좀 더 걸릴 것이다. 그렇지만 컴퓨터는 사용자의 시선이 머무르는 곳을 파악할 수는 있다. 시선 인식이라고 알려진 이 기술을 활용하면 가능하다. 사용자의 눈동자 위치나 모양을 읽고 사용자가 무엇을, 얼마나 오랜 시간 바라보고 있는지를 파악하는 것이다. 사실 이 개념은 생각보다 아주 오래된 개념으로 유쾌하고 특이한 알루미늄 콘택트렌즈라는 개념까지 포함한다.
대부분의 현대적 시선 인식 시스템들은 적외선을 눈동자에 반사한 후 이를 또 다른 카메라로 포착하고, 수학적 계산을 거쳐 눈동자의 위치를 추적한다. 첨단 VR 시스템부터 소비자의 시선을 사로잡은 상품이 무엇인지를 파악하는 마케팅 연구에 이르기까지, 오늘날 이러한 시선 인식 기술은 다양한 형태로 사용되고 있다. 이런 시스템은 그러나 입력 장치로도 사용될 수 있다. 특정 스크린 버튼을 오랫동안 쳐다보고 있으면 시스템에서 사용자가 그 버튼을 클릭하고 싶은 것으로 인지하는 식이다. 이러한 방식으로 속도는 느릴지 몰라도 확실히 손 움직임이 필요 없는 타이핑이 가능해질 것이다. 실제로 최근에는 장애인들을 위하여 이 방법을 응용한 타이핑 기술이 개발되기도 했다.
머지않아 일터에서도 이러한 입력 장치가 사용될 것으로 보인다. 마이크로소프트는 최근 향후 메이저 윈도우 10 업데이트에서 시선 인식 기능을 지원하게 될 것이라 발표하였다. 또한 시선 인식 기술이 발전하다 보면 결국 음성 및 동작 인식 기술과 결합하게 될 것을 어렵지 않게 추측해 볼 수 있다.
한물간 키보드? No, no!
PC 초기 시절부터 키보드는 언어와 단어를 사용한 커뮤니케이션 수단으로서 친숙하고 오래된 입력 장치의 지위를 누려왔다. 최근에는 이모티콘의 발달로 언어, 단어의 사용 비중이 좀 줄어든 것 같긴 하지만 말이다. 아마도 앞으로도 키보드가 완전히 사라질 일은 없을 것이다. 단, 예전보다 훨씬 더 스마트해 질 것은 분명하다.
특히 문장 자동 완성 기능이나 자동 수정 기능 등의 소프트웨어를 통해 키보드는 더욱 스마트해지고 있다. 스마트폰이나 태블릿에서 사용하는 터치스크린 키보드 전용 앱인 스와이프(Swype), 터치팔(TouchPal), 플렉시(Fleksy) 등은 머신러닝 알고리즘과 동작 인식 옵션을 통해 작은 키보드에서 더욱 빠르고 직관적인 타이핑을 가능케 했다.
일반적인 컴퓨터 키보드에서도 프로젝션 키보드, 종이 키보드, 접는 키보드, 돌돌 마는 키보드, 심지어 투명 키보드에 이르기까지 다양한 변화를 이미 목격했다. 기술적 측면에서 이러한 전통적 의미의 키보드는 거의 가능한 모든 방식으로 응용되었다고 볼 수 있다. 따라서 아마도 미래의 키보드는 기능보다는 형태에 중점을 두고 발전해 나갈 것이다. 일례로, 크라우드 펀딩을 받은 아지오 레트로 클래식(Azio Retro Classic, 그림 참조)은 가죽과 아연 합성소재로 만든 금속-디지털 하이브리드 키보드이다.
뇌-컴퓨터 인터페이스
특이점 이론의 지지자들 및 클래식 공상과학 장르 팬들은 인간과 기계의 결합이 가능할 뿐만 아니라 불가피하다고까지 말할 것이다. 우리가 컴퓨터를 받아들이게 되든지, 아니면 컴퓨터가 우리를 융합하게 되든지 간에, 인류의 다음 진화 단계는 기계와의 결합으로 시작될 것이라고 이들은 생각한다. 그렇게 하지 않으면 인류는 도태될 것이라고 말이다.
그렇지만 일단은 낙관적인 전망을 유지한 채, 입력 장치 측면부터 살펴보자. 뇌-컴퓨터 인터페이스(brain-computer interface), 또는 BCI는 인간의 뇌와 외부 기기 간 직접적 연결을 가능케 하려는 새로운 시도다. 사실 이러한 시도는 우리 생각보다 오래전부터 있었다. 특히 인간의 뇌파를 두피를 통해 읽어내고, 이를 해석해 특정 형태로 컴퓨터나 게이밍 시스템에 입력하는 헤드셋은 이미 시장에 존재한다.
영국 기업인 마인드플레이(MyndPlay)는 이러한 EEG 헤드셋을 통해 두뇌의 특정 전자 신호를 포착, 분석하는 게임 및 앱을 개발했다. 미국 기업인 뉴로스카이(NeuroSky) 역시 마인드웨이브 모바일(MindWave Mobile)을 비롯하여 유사한 EEG 바이오센서 기술을 사용한다. 이런 기기들은 현재로서는 그 기능이 제한적이지만, 이는 어디까지나 사용자들이 두개골 안쪽에 센서를 부착하는 데에는 거부감을 가지고 있기 때문이다. 뭐 어쩌겠는가? 뇌 수술 같은 것이라면 질겁을 하는 사람들도 있다는 것을. 하지만 만일 그런 것에 개의치 않는 독자들이라면, 다음 단락을 아주 흥미롭게 읽을 수 있을 것이다.
텔레파시 타이핑
2017년 초, 스탠퍼드대학의 한 연구팀이 사지가 마비된 환자에게 뇌 컨트롤을 통해 분당 39글자를 타이핑할 수 있는 놀라운 BCI 시스템을 소개했다. 엄청나게 복잡한 바이오테크 알고리즘이 적용된 이 시스템은 환자의 뇌파를 컴퓨터 스크린의 클릭 명령으로 변환하는 것이 가능했다.
이 시스템의 단점은 수술을 통해 사용자의 뇌 표면에 소형 전극을 부착하고, 이를 케이블을 통해 외부에 연결해야 한다는 것이다. 그렇지만 스탠퍼드 연구팀은 이 기술이 종국에는 무선으로 가능하게 될 것이며, 심지어는 수술 없이도 기기를 이식할 수 있는 기술이 개발될 것이라고 자신하고 있다.
이러한 기술 발전 사례들은 입력 장치의 미래가 아주 역동적이고 여러 가능성으로 가득 차 있음을 보여준다. 이미 전 세계 곳곳의 연구소들은 뇌와 컴퓨터 간의 직접적 연결을, 뇌 수술 없이 가능케 하기 위한 기술 개발에 착수하고 있다. 뉴욕에 위치한 CTRL Labs라는 기업의 최근 프로필을 살펴보면 BCI 분야의 놀랄만한 발전이 바로 코앞에 다가와 있음을 알 수 있을 것이다.
입력 장치의 세계는 빠르게 변화하고, 오래된 기술들은 빠르게 사라져 가고 있다. 이제 여러분 손에 쥐어진 마우스가 조금 불쌍해 보이지 않는가? 머지않아 박물관에서나 보게 될 수 있을지도 모른다. 측은한 마음이 든다면 오늘은 귀여운 마우스에게 배터리를 갈아줘 보자. 아주 행복해할 것이다.
*Glenn McDonald는 자유기고가다. ciokr@idg.co.kr