컴퓨터와 알고리즘을 이용해 사진 속 사람의 얼굴을 식별할 수 있는 기술 개발에 열을 올리는 기업들이 있다. 대표적인 기업 2 곳이 페이스북과 구글이다. 이미 그 완성도가 상당한 수준이다.
그러나 이들 거대 IT 기업들이 안면 인식 기술로 무엇을 하려는 지는 아직 명확하지 않다. 어떤 경우가 발생할 수 있는지, 가능한 위험성은 무엇인지 살펴본다. 감안해야 할 사항은 무엇들이 있는지 점검해본다.
페이스북의 사용자 안면 인식 기술
페이스북은 안면 인식 알고리즘을 개발하는 주요 기업 중 하나다. 페이스북의 소프트웨어는 이제 사진 속의 사람을 식별할 수 있다. 페이스북의 딥페이스(DeepFace, 농담이 아니라 정말로 딥페이스라고 부른다)는 2개의 사진에 등장하는 사람이 동일 인물인지 97%의 정확도로 판단해낸다. 심지어 FBI의 자체 NGI(Next Generation Identification) 시스템보다 낫다.
딥페이스는 얼굴을 분석하고 3D 모델화함으로써 이같이 놀라운 인식률을 달성했다. 이 기술은 무려 1억 2,000만 개 이상의 파라미터를 이용하는 것으로 전해졌다. 페이스북의 검색 웹 사이트의 페이지에서는 ” 4,000명 이상의 사람을 촬영한 400만 장의 안면 사진을 이용하고 현존하는 최대 규모의 안면 데이터세트를 이용해 이 소프트웨어를 개발했다”라고 설명돼 있다.
하지만 페이스북에게는 이것으로는 부족해보인다. 페이스북은 심지어 사람들의 얼굴이 보이지 않는 상태에서도 사람들을 식별할 수 있기를 원한다. 이를 위해 페이스북 연구원들은 헤어스타일, 몸매, 자세, 복장 등을 인식하는 시스템을 개발하고 있다. 이미 83%의 정확도를 달성한 것으로 전해진다.
한편 이 과정에서 페이스북은 자사의 것이 아닌 플리커(Flickr)의 사진을 이용해 이 알고리즘을 개발함으로써 이 연구에 대한 사람들의 거부 반응을 회피하고자 했다.
구글이 사용자를 식별하지 않고 사용자를 식별하는 방법
구글(Google)도 이에 못지 않다. 지난 달 구글 I/O에서 구글이 새로운 구글 포토(Google Photos) 서비스의 검색 기능을 시연했을 때 많은 사람들이 놀라움을 금치 못했다.
사실 구글+ 사용자들은 수 년 동안 이 기능을 활용하고 있었다. 구글 포토의 검색 엔진은 고양이와 강아지의 차이점을 구별할 수 있을 뿐 아니라 개의 종류도 식별해낸다. 이 밖에 불가능해 보이는 다른 검색 기능을 수행한다.
심지어 묘사된 이미지를 설명하는데 사용할 수 있는 형용사에 기초하여 사진을 찾을 수 있다. 예를 들어, 필자가 맛있는(delicious)이란 단어로 필자의 사진 콜렉션을 검색하자 필자가 실제로 맛있었던 음식과 음료를 촬영한 수 백 장의 사진을 보여줬다.
(또한 필자가 케냐의 마사이 마라(Masai Mara)에서 사파리 중 가젤을 게걸스럽게 먹고 있는 치타의 모습을 촬영한 사진도 보여주었다. 아마도 치타에겐 가젤이 맛있었을 것이고 구글의 소프트웨어는 어떤 식으로든 이를 알아 차렸던 것 같다).
‘맛있는’ 것에 대한 필자의 사진 라이브러리 검색 결과. Credit: Mike Elgan
구글 포토 검색 툴은 사람을 검색할 때도 찾을 수 있다. 검색 표시줄로 이동하고 클릭하여 선택하면 사람(People), 장소(Places), 사물(Things) 등 3가지 옵션이 바로 제공된다. 사람 옵션에서 더 보기(More) 링크를 클릭하면 자신이 촬영한 모든 사람들의 사진을 가장 자주 촬영한 순서로 표시한다.
사진을 클릭하면 그 사람의 모든 사진을 볼 수 있다. 이 때, 흥미로운 점을 발견할 수 있다. 얼굴을 명확히 알 수 있는 사진뿐만이 아니라 사람의 얼굴을 거의 알아볼 수 없는 사진도 보여준다는 것이다.
하지만 페이스북의 접근방식과는 달리 구글 포토 검색이 인식하는 모든 얼굴은 육안으로 구분이 가능하다. 필자는 등을 돌리고 있는 사람이 찍힌 사진을 보지 못했다.
또한 흥미롭게도 페이스북의 기술이 이론적으로는 더욱 뛰어난 것처럼 보이지만 여전히 연구 수준에 머무르고 있으며 공개되지 않은 반면에 구글의 검색 도구는 이미 출시된 제품이다. 그리고 이미 모든 사람들이 무료로 사용할 수 있다.
구글은 사진 검색의 메커니즘에 대해 자세히 공개하지 않고 있지만 페이스북의 기술과 유사한 방법일 것이 유력하다.
구글 포토 검색의 가장 흥미로우면서도 잘 알려지지 않은 기능은 구글이 사람들의 사진을 그들의 신원과 연계시키지 않기로 결정했다는 점이다. 예를 들어, 필자가 구글+를 포함해 구글을 사용하고 있는 필자의 아들 케빈(Kevin)을 검색하면 구글 포토는 데이터베이스 내에서 아들의 사진과 아들의 신원을 연계시키지 않는다.
필자가 구글 포토 검색으로 이동하여 케빈의 얼굴을 보고 클릭하면 수 백 장의 사진이 표시된다. 하지만 케빈 또는 케빈 엘간(Kevin Elgan)이라는 이름을 검색하면 동일한 사진이 표시되지 않는다. 대신에 태그 처리하거나 게시물에서 직접 이름을 언급한 사진만 표시된다.
즉 구글은 언제든지 알고리즘을 적용하여 사람 검색을 신원과 연계시킬 수 있겠지만 지금까지는 그렇게 하지 않기로 결정한 것이 분명하다.
페이스북과 구글은 ‘연계에 의한 식별’을 어떻게 활용하고 있을까?
예전에는 안면 인식 기술이 더욱 단순했다. 말 그대로 얼굴을 분석하여 눈썹과 코 사이 그리고 귀 아랫부분과 턱 사이의 상대적인 거리 등을 찾았다.
이제는 페이스북과 구글의 안면 인식 시스템의 인공지능이 사람이 사람을 인식하는 것과 마찬가지의 방식으로 사람을 인식한다. 예를 들어, 충분한 사진을 제공하면 등장 인물에 대해 학습하게 된다. 따라서 한 장의 사진에서 얼굴을 찾으면 설정, 조명, 착용하고 있는 복장, 머리 등을 기억한다. 등을 돌리고 있는 상태로 얼굴이 보이지 않으면 “마이크(Mike)가 등을 돌리고 있다”고 할 수도 있다.
아마도 지금의 구글 포토 그리고 미래의 페이스북은 안면 인식으로 사회적 참여에 대한 데이터도 수집할 것이다. 예를 들어, 필자가 할로윈 복장을 갖춘 아들 케니의 사진을 게시한 경우 이 정보를 이용해 마스크를 착용한 그를 식별할 뿐 아니라 동일한 행사에서 마스크를 착용하고 있는 아들의 다른 모든 사진에서 아들을 찾을 것이며, (구글 포토 자동 백업 기능을 이용해 자동으로 업로드된) 심지어 게시되지 않은 사진에서도 찾을 것이다.
그렇다면?
여기에서 3가지 사항이 중요하다. 우선 이런 인공 지능 사진 인식 기술에 대한 연구와 개발이 지속되고 시스템이 훨씬 더 발전하게 될 것이라는 점이다. 현실적으로 무엇이 가능한지 그리고 미래에 무엇이 가능할 지에 대해 알 필요가 있다.
가능한 개연성 중 하나는 머지 않아 소셜 네트워크, 사법당국, 기타 조직들이 웹 캡, ATM의 보안 카메라, 톨 게이트에 설치된 카메라, 교통 카메라 등을 이용해 촬영한 것들을 포함하여 모든 사진을 이용해 매우 높은 확률로 즉시 우리의 신원을 식별할 수 있게 된다는 사실이다. 안면 인식 기술은 2,800만 개 이상의 기기에서 사용할 수 있으며 이 수치는 2024년까지 약 1억 2,300만 개로 증가할 것이다.
두 번째로 기억해야 할 것은 이 기술의 등장이 이 기술의 이행 또는 남용과 반드시 연관된 것은 아니라는 점이다. 미래에는 우리의 프라이버시가 아무렇지도 않게 침해될 것이라고 가정하는 사람들이 있는 듯 하다. 하지만 꼭 그렇지만은 않다.
항상 모든 사람을 식별할 수 있는 기술의 개발은 필연적이다 하지만 우리가 페이스북과 구글에서 보았듯이 이 기술을 이용해 반드시 우리의 프라이버시를 침해할 필요는 없다.
페이스북은 대중의 반응을 너무 의식한 나머지 최신 인식 기술을 시험하기 위해 페이스북의 사진조차 이용하고 있지 않다. 구글은 대중의 반응을 너무 의식한 나머지 얼굴과 신원을 연계시키지 않고 있다. 두 기업 모두 분명 대중의 우려와 이 기술을 적극 활용할 때의 잠재적인 의도하지 않은 경과에 대해 잘 알고 있다 (최소한 현재로써는 그렇다).
애플은 WWDC(World Wide Developers Conference)에서 프라이버시 침해 없이 개인화를 제공할 수 있다고 밝혔다. 시리(Siri)를 위한 새로운 프로액티브(Proactive) 기능은 이메일, 일정 등으로부터 데이터를 수집하지만 데이터를 휴대폰 밖으로 유출시키지 않으며 사용자의 ID와 연계되는 일도 없다. 클라우드에 업로드되거나 일부 영구적인 데이터베이스에 입력되는 일도 없다. 애플 스스로도 접근하지 않는다.
개인화 또는 인식 기술이 반드시 프라이버시를 침해해야 한다는 필연성은 존재하지 않는다. 실제로 스마트폰과 컴퓨터를 통해 발생하고 있는 최근의 프라이버시 침해 사건 중 상당 부분을 줄일 수 있다. 이를 위해서는 우선 무엇이 가능한지 그리고 프라이버시 위반의 측면에서 무엇이 필요한지 사이의 연결 고리에 관해 더욱 잘 알아야 한다.
기업이 사진에서 사람을 인식할 수 있는 기능에 대한 세 번째 중요한 사항은 자신의 프라이버시에 도리어 유익이 될 수 있다는 점이다. 예를 들어, 미래의 검색 엔진이 언제든지 다른 곳에서 누군가가 (심지어 배경으로 촬영된) 사진의 사진을 사용하거나 게시하고 있음을 알려줄 수 있다. 그리고 이런 사진의 남용 또는 오용이 발생했을 때 조치를 취할 수도 있다.
또 이런 종류의 안면 인식 기술은 기업 및 기관의 사용자 데이터 해킹이 증가하는 상황에서 신원 도난을 방지할 수도 있을 것이다.
얼굴이 보이지 않더라도 99%의 정확도로 사진 속의 인물을 인식할 수 있게 되는 날이 빠르게 다가오고 있다. 이런 능력으로 인해 프라이버시 자체가 불가능한 세상이 될 수도 있다. 하지만 꼭 그렇지만은 않다.
우선 무엇이 가능한지를 이해하고 기술의 영향 범위를 파악하자. 둘째로 우리의 프라이버시를 보호하기 위해 질문하고 답변을 요구하며 목소리를 높이자.
스스로 포기하고 우리의 프라이버시는 이미 끝났다고 말하기는 쉽다. 하지만 실제로 그렇지 않으며, 그렇게 생각할 필요도 없다. 인류는 프라이버시를 포기하지 않고도 발전될 기술을 영위할 수 있다.
dl-ciokorea@foundryco.com