페이스북 뉴스 피드에 당신과 밀접한 주제의 광고가 게재됐다면, 이는 이 소셜 네트워크의 거인이 당신에 대해 아주 잘 알고 있다는 의미이다. 페이스북은 2017년 한 해 광고주에게 타깃화 한 정보를 판매해 399억 달러의 광고 매출을 기록했다. 22억 명에 달하는 사용자 데이터를 마이닝 한 것이 비결이었다.
여기에 그치지 않는다. 페이스북은 더 사악하게 사용자 정보를 활용하는 방법을 갖고 있다. 소셜 분야를 연구하는 마이클 코진스키는 사용자의 페이스북 ‘좋아요’를 분석해 인종과 문화, 성적 지향성, 정치적 신념 같은 정보를 예측해 개인의 심리 프로파일을 찾거나 만드는 모델을 고안해 눈길을 끈 바 있다.
이와 유사한 데이터 분석 전략이 도널드 트럼프의 미국 대통령 당선을 도왔을 수도 있다. 캠브리지 애널리티카(Cambridge Analytica)는 약 8,700만 명의 페이스 북 사용자로부터 데이터를 수집하고 분석한 후, 이를 개인의 필요 및 요구 사항에 부합하는 타깃화 한 정치 선거 광고에 사용하도록 지원했다. 페이스북 마크 주커버그 CEO는 이 프라이버시 사건 때문에 의회 청문회에 불려 나갔다.
위키리크스(Wikileaks)의 설립자인 줄리안 어산지는 러시아 뉴스 사이트인 RT와 가진 인터뷰에서 페이스북을 ‘역대 가장 소름 끼치는 스파이 머신’이라고 표현했다. 어산지는 “전세계적으로 사람, 사람들 간 관계, 이름, 주소, 장소, 소통 및 통신, 친척에 대한 가장 큰 데이터베이스이다. 모든 정보가 미국에 소재하며, 모든 미국 정보 기관이 액세스 할 수 있다’라고 주장했다.
그는 2014년 출판한 책에서는 “파티에 참석해 사진을 촬영한 후 페이스북에 게시할 때마다 스파이나 밀고자가 되는 것이다”라고 덧붙였다.
그러나 이렇게 주장하는 어산지의 위키리크스 또한 페이스북에 가입할 수밖에 없었다. 위키리크스 또한 팔로워가 350여 만 명인 페이스북 페이지를 운영하고 있다.
페이스북은 꺼림칙할 정도로 상세히 사용자의 데이터 세트를 수집한다. 또 이의 사용 방식 및 용도에 대해 투명하지 않은 경우들이 있다.
1. 앱을 통해 대대적인 정보수집 및 감시를 한다는 소송 진행 중
현재 캘리포니아에서는 페이스북을 피고로 하는 소송이 진행되고 있다. 페이스북에 제기된 혐의는 사용자와 (페이스북 사용자가 아닐 수도 있는) 사용자의 친구를 추적하고, 이들의 문자 메시지를 읽고, 위치를 추적하고, 전화기에 저장된 사진에 접근을 하고 있다는 것이다.
사실로 밝혀질 경우 ‘대중 감시’나 다름 없는 혐의에 대해 소송을 제기한 회사는 식스4쓰리(Six4Three)라는 이름의 스타트업 기업이다. 2년째 소송이 진행되고 있는 상태다.
식스4쓰리는 페이스북이 상업적인 목적에서 사용자 전화기의 정보를 조사한다고 주장하고 있다. 페이스북은 이 주장에 대해 “근거 없는 주장이다. 우리는 계속해서 스스로를 변호하고 방어할 계획이다”라고 단호하게 반박하고 있다.
페이스북은 아이폰 사용자가 (페이스북에 업로드한 사진이 아닌) 아이폰에 저장해둔 모든 사진에 대한 접근을 시도하고 있으며, 사용자의 안드로이드 스마트폰에서는 메타데이터와 콘텐츠를 수집하고 있다는 의심도 받고 있다.
이와 관련, 페이스북은 최근 사용자의 스마트폰 및 문자 메시지 데이터에 액세스해 로그를 기록한 적이 있다고 인정했다. 단 사용자로부터 동의를 받은 후에 이렇게 했다고 주장했다. 그러나 가디안의 보도에 따르면, 일부 사용자는 명시적인 동의 없이 이런 행위에 노출된 것으로 드러났다.
고소장에는 “페이스북은 사용자를 더 쉽게 인증하기 위해 문자 메시지를 읽는다고 공지하고 있다. 그러나 이 공지는 완전하지 않은 부분적인 공지에 불과하다. 페이스북이 안드로이드 사용자와 관련해 액세스하는 데이터의 종류, 액세스하는 시간 및 기간, 데이터에 액세스하는 이유를 정확히 설명하고 있지 않기 때문이다”라는 내용이 담겨 있다.
사용자 스마트폰의 사진에 액세스하는 것과 관련된 고소 내용에는, 페이스북이 iOS 카메라 롤의 사진을 전처리하는 방식을 완벽하게 공개하지 않고 있다는 주장 또한 담겨 있다.
2. ‘클리어 히스토리’ 도구를 공개한 페이스북
캠브리지 애널리티카 데이터 유출 스캔들에 따른 후폭풍은 페이스북에게 창립 이래 가장 큰 위협이 되었다. 아직까지 ‘#deletefacebook’ 운동이 매출에 큰 영향을 초래하지 않았지만, 페이스북은 피해를 최소화하기 위해 여러 새로운 도구와 정책을 런칭했다.
페이스북의 연례 개발자 컨퍼런스인 F8에서 마크 저커버그 CEO는 사용자가 더 쉽게 브라우징 히스토리(기록)를 관리 및 삭제할 수 있는 ‘클리어 히스토리’라는 새로운 도구를 개발할 계획이라고 발표했다.
페이스북의 VP 겸 개인정보 보호 책임자(Chief Privacy Officer)인 에린 에간은 보도자료에서 “사용자가 페이스북을 사용할 때 페이스북에 사용자 정보를 보내는 웹사이트와 앱을 확인할 수 있고, 계정에서 이런 정보를 삭제하고, 앞으로 사용자 계정에서 이와 관련된 정보를 저장하지 못하도록 끌 수 있는 기능”이라고 설명했다. 그는 이어 도구 구현에 몇 개월이 소요될 예정이며, 페이스북은 또 다른 방법으로 데이터 보호를 강화할 계획이라고 설명했다.
3. 데이터 수집을 제한하라는 의회의 요청은 거절한 저커버그
2018년 4월 국회의 케임브리지 애널리티카 데이터 침해 사건 청문회에서 마크 저커버그 CEO는 몇몇 회사들이 개인 ‘퀴즈’를 통해 수집된 것과 동일한 데이터를 구매했을 수 있다고 언급했다.
33세의 저커버그 CEO는 페이스북이 스마트폰 마이크의 오디오를 마이닝하는 방식으로 개인 대화를 엿듣는다는 ‘음모론’을 부인했다. 그러나 데이터 수집을 줄이라는 요청은 거부했다.
프랭크 팔로네 의원은 저커버그 CEO가 ‘데이터 수집은 간단히 대답할 수 없는 복잡한 문제’라고 대답한 것에 대해 기대 이하라고 비난했다.
4. 페이스북, 자신의 정보를 케임브리지 애널리티카에 공유했을 수 있는 사용자에게 ‘알림’
페이스북은 4월 9일(월)부터 케임브리지 애널리티카와 데이터를 공유했을 것으로 추정되는 사용자 8,700만 명에게 이와 같은 사실을 알리기 시작했다.
영향을 받은 사용자는 페이스북을 사용해 데이터를 수집해 케임브리지 애널리티카에 판매한 ‘디스 이스 유어 디지털 라이프(This Is Your Digital Life)’라는 앱에 본인이나 친구가 로그인했는지 알려주는 메시지를 자신의 뉴스 피드에서 받게 될 예정이다.
또 22억 명의 페이스북 사용자 전원이 ‘당신의 개인 정보를 보호하세요(Protecting Your Information)’라는 제목의 알림을 받게 될 예정이다. 여기에는 사용한 정보, 공유된 정보에 대한 내용이 들어 있다.
페이스북은 마크 저커버그 CEO가 캠브리지 애널리티카 스캔들에 대한 의회 청문회에 출석하기 전에 이런 계획에 대해 발표를 했다.
5. ‘심리학적 데이터’를 수집하는 페이스북의 VPN
VPN 비교 사이트인 VPN스페셜(VPNspecial)에 따르면, 페이스북의 오나보(Onavo) VPN은 ‘HotKnot’이라는 기능을 통해 수 많은 사용자의 개인 선호도에 대한 상세 정보와 심리 프로필을 수집했을 수도 있다. VPN스페셜은 이 도구가 HotKnot 모바일 결제 칩이 내장된 안드로이드 장치를 이용한 구매 내역을 추적했을 수 있다고 주장했다.
VPN스페셜은 소속 직원이 리뷰를 준비하면서 오나보에 HotKnot 라이브러리의 흔적이 포함된 것을 발견했다고 설명했다. 설명에 따르면 HotKnot는 두 호환 장치를 접촉시켜 데이터를 교환시킬 때 주로 사용하는 기술이다. 그러나 결제에도 사용할 수 있다.
만약 페이스북이 HotKnot를 VPN과 결합시켰다면 사용자의 쇼핑 행동양태를 파악할 수 있다. 또 지리적 위치와 결합시켜 심리적 프로파일링을 하고 개인 선호도를 상세히 파악할 수 있다.
한편 이 앱은 페이스북과 오나보를 향상시키기 위해 데이터를 수집한다고 공지하고 있다. VPN의 목적과 일정 수준 상충되는 부분이 있는 내용이다.
6. 전화를 걸고 문자를 보낸 상대방을 알고 있는 페이스북
페이스북은 안드로이드 장치에서 몇 년간의 상세한 통화 로그 및 문자 메시지 메타데이터를 수집해 보관한다. 캠브리지 애널리티카 스캔들에 화가 난 페이스북 사용자들이 페이스북이 자신에 대해 무엇을 알고 있는지 확인하기 위해 페이스북 데이터를 다운로드 받으면서, 이와 같은 사실이 알려졌다.
이들은 페이스북이 2015년부터 날짜와 통화 시간, 수신자의 이름과 전화번호 등이 포함된 통화 기록을 수집해 보관하고 있다는 것을 발견했다. 기술 사이트인 아스 테크니카는 자신의 계정을 공개하고, 페이스북에 연락해 ‘어떻게 된 일’인지 물었다.
그러자 페이스북은 블로그 게시글을 통해 잘못된 일을 하지 않았다고 반박했다. 페이스북은 사용자가 안드로이드용 메신저나 페이스북 라이트(Facebook Lite)에서 옵트-인 기능을 통해 명시적으로 동의를 한 경우에만 이런 데이터를 로그로 기록하고 있다고 주장했다. 또 이런 정보들을 수집하는 목적은 사용자가 더 쉽게 알고 있는 사람들을 찾아 연락하고, 페이스북의 사용자 경험을 향상시키기 위한 것이라고 설명했다.
또 전화나 문자를 걸거나 받는 시간 등의 정보를 수집하지만, 그 내용에 대해서는 수집하지 않으며, 제3자에 판매하지도 않는다고 강조했다. 그리고 사용자가 페이스북 설정에서 이 기능을 끌 수 있다고 덧붙였다.
7. 사용자의 ‘신념’에 대해 알고 있는 페이스북
케임브리지 애널리티카 스캔들은 개인의 정치적 신념(색깔)과 관련해 페이스북 데이터가 가지고 있는 가치를 ‘조명’했다. 이 영국의 데이터 분석회사는 투표 ‘성향’을 예측해 개인화된 정치 선거 광고를 표적화해 제시하기 위해, 페이스북 사용자 수백만 명의 개인 정보를 수집했다.
이것이 미국의 2016년 대통령 선거와 영국의 브렉시트(Brexit) 투표 결과를 바꿔 놓았을 수도 있다.
케임브리지 애널리티카는 영국의 학자인 알렉산더 코간이 고안한 ‘성격’ 테스트를 이용해 데이터를 수집했다. 페이스북은 코건이 정책(약관)을 위반, 케임브리지 애널리티카에 정보를 넘겼다고 주장한다. 그러나 이 소셜 네트워크 사이트 또한 개인 신념을 파악하는 또 다른 방법을 보유하고 있다.
정치적 선호도나 성향을 표현하거나, 이를 드러낼 수 있는 페이지에 ‘좋아요’를 할 경우, 페이스북은 이런 정보를 사용해 특정 개인의 정치적 관점을 예측할 수 있다.
개인 신념에 대한 직접적인 증거가 있어야만 이렇게 할 수 있는 것이 아니다. 일반적으로 특정한 시각이나 입장을 대변하는 것으로 간주되는 페이지에 좋아요를 할 경우, 페이스북은 이 사용자가 이런 시각이나 입장에 동의한다고 가정한다. 예를 들어, 엑슨(Exxon)에 좋아요를 표시하는 경우 보수적인 성향을 갖고 있다고 가정할 수 있다.
페이스북은 이런 상세한 정보와 인구통계학적 정보를 결합해 사용자를 ‘보수’, ‘중도’, ‘진보’ 성향으로 분류한다. 이 정보를 익명화 한 후 선거 본부 관리자나 광고주에게 판매한다.
8. 사용자와 사용자의 가족, 친구에 대해 알고 있는 페이스북
페이스북 프로필은 사이트의 행동에 기반을 두고 있다. 사용자가 제공하는 프로필 정보, 클릭한 광고, 생성하거나 참석한 이벤트, 좋아하는 항목, 게시한 정보 등이 여기에 포함된다. 이런 행동 정보는 페이스북이 연령과 성별, 언어, 교육 수준, 사용하는 장치, 인터넷 접속 및 연결 방식을 추측할 수 있도록 도와준다.
사용자의 게시글과 프로필은 개인 페이스북 데이터 ‘발자국’의 튼튼한 토대가 된다. 나아가 페이스북은 다른 소스의 다양한 정보를 통합해, 사용자가 업로드 한 것 이상으로 상세한 개인 상세 정보를 구축한다.
사용자의 온라인 행동과 서드파티 소스의 정보는 페이스북에 해당 사용자가 하는 일, 기혼인지 미혼인지 여부, 약혼 여부, 임박한 기념일, 자녀 부양 여부, 출산 예정 여부 등을 알려준다.
또 가족 구성원, 이들 구성원이 살고 있는 장소, 결혼 기념일 등 가족 기념일, 친구들, 새로운 친구들, 이들의 생일 등에 대해 알려준다.
9. 사용자의 재정 상태와 지출 습관에 대해 알고 있는 페이스북
페이스북은 익스페리안(Experian) 같은 데이터 중개 회사로부터 이들이 오랜 기간 정부 기록, 서베이, 잡지 구독 리스트 같은 상업적 소스로부터 수집한 추가 정보를 구입하고 있다. 이는 사용자의 쇼핑 장소와 차량 소유 여부 등에 대한 정보를 제공한다. 또 살고 있는 집의 가치, 크기, 구성 형태, 건축 시기 등을 추측할 수 있도록 도와준다.
페이스북은 사용자가 소유한 것에 더해 원하는 것 또한 알고 있다. 기호를 알고 있으며, 무언가를 업그레이드할지 여부와 시기를 알고 있다.
개인의 재정 정보도 확보할 수 있다. 페이스북은 사용자의 투자 대상, 신용카드 소유 여부, 부채, 소득, 순수익을 추측할 수 있다. 또 신용조합, 국영은행, 지역은행 회원인지 여부를 파악할 수 있다.
10. 방문한 웹사이트와 사용한 앱에 대해 알고 있는 페이스북
페이스북은 소셜 미디어 사이트의 온라인 행동만 추적하는 것이 아니다. 페이스북 픽셀(Facebook Pixel) 같은 페이스북 기술을 사용하는 웹 페이지를 방문할 경우, 해당 웹 페이지 퍼블리셔와 페이스북이 모두 사용자의 방문을 추적할 수 있다.
광고주들이 이런 정보를 사용, 웹사이트를 방문하거나 모바일 앱을 사용한 사람들에게 맞춤형 광고를 제시한다. ‘좋아요’나 ‘공유’ 버튼이 있는 모든 웹 페이지가 해당된다. 이는 페이스북에 사용자의 방문 및 탐색 내용, 모바일 앱 다운로드 여부, 물건 구매 여부, 장바구니에 물건 추가 여부를 알려준다.
페이스북은 산하에 인스타그램(Instagram)과 왓츠앱(WhatsApp) 같은 많은 앱과 서비스를 거느리고 있다. 이 또한 페이스북에 데이터를 공급하는 역할을 한다.
11. 사용자의 과거 및 현재 위치를 알고 있는 페이스북
페이스북은 위치 데이터를 사용, 광고주가 특정 장소 인근에 위치한 사람들에 타깃화 광고를 제시할 수 있도록 도와준다. 사용자가 인터넷에 접속한 장소의 IP 주소, 전화기의 GPS 및 위치 서비스, 페이스북과 인스타그램 프로필에 게시한 위치, 체크-인 등이 이런 위치 정보를 제공한다.
2016년 6월, 페이스북은 스마트폰의 위치 정보를 이용해 친구 제안을 했다는 ‘의혹’에 대해 처음에는 인정했다가 나중에 이를 번복해 부인하면서 논란이 일었다. 이 회사는 결국 2015년에 잠깐 이런 일을 했다고 시인했다.
12. 사용자가 게재하지 않은 ‘비밀’을 알고 있는 페이스북
‘생각하고 말하라!’는 격언이 ‘엔터’ 키 한 번이 많은 후회를 불러올 수 있는 소셜 미디어 시대에 새롭게 조명을 받고 있다.
데이터 사이언티스트인 비키 보야키스는 최근 페이스북이 사용자가 표현을 하지 않았을 때에도 사용자의 생각을 파악한다는 점을 드러냈다. 구체적으로 설명하면, 페이스북은 ‘타이핑’을 추적해 사용자의 생각을 읽을 수 있다.
페이스북은 브라우저에 코드를 보내 사용자가 입력한 텍스트를 수집할 수 있다. 이 코드는 브라우저에서 사용자의 키스트로크를 분석하고 메타데이터를 보고한다. 여기에는 삭제한 게시글, 코멘트, 체크-인도 포함된다. 이 회사는 이렇게 공개하지 않은 생각들을 ‘자기 검열(Self-censorship)’이라고 부르고 있으며, 이런 데이터를 인간 행동 연구에 사용한 적이 있다.
2014년 페이스북 엔지니어들의 추정에 따르면, 매일 600 TB 달하는 데이터가 추가된다. 보야키스는 매일 ‘전쟁과 평화(War and Peace)’ 1억 9,300만 권이 업로드 되는 것에 해당된다고 설명했다.
13. 페이스북이 당신에 대해 무엇을 알고 있는지 확인하는 방법
페이스북은 데이터 정책(Data Policy) 페이지를 통해 수집하는 정보가 어떤 정보인지 간략히 설명하고 있다. 그러나 수집 방법 등 상세 정보는 공개하지 않는다.
페이스북이 당신에 대해 어떻게 생각하고 있는지 알고 싶다면 소셜 네트워크의 개인 광고 선호도 항목을 방문한다. 이곳에서 프로필 정보, 관심 분야(카테고리), 고객이나 사용자, 또는 광고 클릭을 통해 상호작용을 한 광고주를 확인할 수 있다. 또 페이스북 광고 설정(Facebook ads settings) 페이지를 방문해 보고 싶지 않은 광고를 숨길 수도 있다.
그렇지만 페이스북과 관련된 데이터 수집자와 파트너의 마수를 탈출하는 유일한 방법은 페이스북 탈퇴이다. 이 경우도 완전한 탈출은 아니다. 자신의 데이터에 지워지지 않는 흔적이 남아있는 상태이다. 한번 넘겨주면 되찾을 방법이 없다. 그렇지만 페이스북이 개발한 셀프 서비스 도구를 사용해 페이스북 데이터 히스토리 전체를 ZIP 압축 파일로 다운로드 받을 수 있다.dl-ciokorea@foundryco.com