
여행을 준비하느라 항공편을 검색한 적이 있는가. 아마도 브라우저와 쇼핑 사이트에 온갖 여행 상품 광고가 뜰 것이다. 알리와 테무 같은 중국 전자상거래 앱에서 한 번이라도 구매한 경험이 있다면, 검색해 본 상품이 할인한다는 내용의 문자가 날아오기도 한다. 다양한 미디어와 전자상거래 기업은 우리가 무심결에 누른 ‘좋아요’나 별생각 없이 넘겨준 위치 등 개인 데이터를 기반으로 우리 취향을 우리보다 더 잘 알고, 거기에 맞춘 서비스로 돈을 벌고 있다. ‘알고리즘, 생각을 조종하다’는 일상에 파고든 맞춤형 알고리즘이 우리의 선택과 생각까지 조종할 수 있게 된 현실을 보여준다. 그런데 여기서 그친다면 ‘그래서 어쩌란 말인가’라는 생각이 들 수 있다. 저자는 개인이 자신의 데이터에 대한 주권을 찾고, 더 나은 사회를 위해 빅데이터를 활용할 수 있도록 데이터 게임을 재설계해야 한다고 주장한다. 책은 이를 가능하게 하기 위한 대안도 제시하고 있다.
디지털 발자국으로 만드는 개인 프로파일링
저자인 산드라 마츠 미국 컬럼비아대 석좌교수는 빅데이터 및 심리 프로파일링 전문가다. 40세 이하 최고 경영학 석사(MBA) 교수 40인에 속하며, 데이터 분야 세계 최고 전문가 100인 중 한 명이다. 저자는 책 전반부에서 빅데이터에 관한 통찰과 그에 내재된 위험성을 소름 끼치는 사례로 보여준다. 빅데이터를 기반으로 심리적 특성을 예측하고 이를 토대로 사람들의 생각, 감정, 행동에 영향을 미치는 심리 타기팅(Psychographic Targeting)1)이 이미 일상화됐기 때문에 가능한 일이다. 대부분 개인은 인터넷에서 검색하고 유튜브 등에 남긴 ‘좋아요’와 시청 목록 같은 행동 잔여물, 즉 디지털 발자국을 무수하게 남긴다. 여기에 위치 정보나 쇼핑 기록이 더해지면 기업은 개인의 취향부터 소득수준까지 속속들이 파악할 수 있다. 인공지능(AI)의 딥러닝까지 결합하면 개인에 대한 프로파일링이 가능해진다. 이 프로필을 기반으로 기술 기업은 편리함을 제공하지만 나아가 개인의 생각과 행동을 통제할 수도 있다. 빅데이터와 알고리즘의 두려운 측면이다. 개인 데이터는 이제 석유나 금 같은 자원이 됐다. 더 많이 확보할수록 권력이 되고 자산이 되기 때문이다. 2008년 언론인 코리 닥터로는 영국 가디언에 ‘개인 데이터는 핵폐기물’이라고 비유한 바 있다. 플루토늄처럼 위험하고 오래 지속되며 일단 유출되면 돌이킬 수 없다는 의미다.
이런 상황에서 정부나 기술 대기업이 개인의 생각과 감정 행동에 충분히 영향을 미치는 것이 가능하다고 저자는 지적한다. 이미 개인 데이터를 모아 정치적 조작에 활용한 사례가 있다. 2016년 케임 브리지 애널리티카2)는 영국 업체가 미국의 대통령 선거에 개입한 게 대표적이다. 케임브리지 애널리티카는 미국 유권자 8700만 명의 페이스북 데이터를 기반으로 정치 성향을 분석했는데, 힐러리 클린턴에게 투표할 가능성이 좀 더 큰 부동층에 거짓 정보를 퍼뜨려 투표하지 않도록 유도한 혐의가 드러났다. 물론 부정적 측면만 있는 건 아니다. 저자는 사회 전체를 개선하는 데 빅데이터와 알고리즘을 활용할 방법도 소개한다. 저자가 인용한 사례를 보면 요하네스 아이히슈테트라는 학자가 683명의 페이스북 상태 업데이트와 의료 기록을 조사해 페이스북에서 쓴 단어만으로도 72% 확률로 우울증 여부를 예측했다. 이는 정신 건강 진단에 일반적으로 사용되는 짧은 설문 조사의 정확도와 비슷한 수준이다. 범지구위치결정시스템(GPS) 데이터만 가지고도 우울증 여부를 파악할 수 있다는 저자의 연구도 있다. 챗GPT 같은 생성 AI는 한 개인의 소셜미디어(SNS) 게시물만 보고도 사용자의 성격을 정확하게 예측한다.
개인 데이터 사용에 세금 부과하고, 일정 시간 지나면 삭제해야
개인 데이터를 악이 아닌 선의 힘으로 바꾸기 위해서 저자는 두 가지를 제안한다. 첫째는 개인 데이터 사용과 수집에 세금 형태로 비용을 부과해야한다는 제안이다. 어느 한 기관이 개인 데이터를 너무 많이 축적해서 나쁜 용도로 전환할 수도 있는 사태를 예방해야 한다는 주장이다. 거대 기술 기업은 보관하는 개인의 디지털 발자국을 상업적으로 이용해 막대한 돈을 벌어들이고 있다. 다소 비용을 지불하고서라도 개인 데이터를 수집할 동기가 충분하다는 설명이다. 기업이 수집하는 개인 데이터에 세금을 부과하는 방식은 일반적으로 매출과 이익에 부과되는 디지털세와는 다르다. 디지털세는 기존의 법인세가 물리적 사업장을 기준으로 과세하기 때문에 글로벌 기술 기업이나 전자상거래 기업이 막대한 이익을 거둬도 매출이나 이익 대비 세금을 적게 내는 것을 해결하기 위한 것이다. 이미 이탈리아·프랑스 등 유럽연합(EU) 여러 국가가 시행 중이고 우리나라도 2026년부터 도입을 놓고 논의를 진행 중이다. 다만 미국이 디지털세에 강력히 반발하고 있어 전망은 불투명하다. 도널드 트럼프 미국 대통령이 “중국 거대 기술 기업과 비교해 차별적”이라며 디지털세를 부과하는 나라에 추가 관세를 부과하겠다고 위협하고 있기 때문이다. 이런 이유로 디지털세 대신 개인 데이터 수집에 대한 세금 부과는 개인정보 유출 사고가 빈번한 한국에서는 더 필요해 보인다. 둘째는 어느 특정 기관이 개인 데이터를 과도하게 축적하는 것을 막기 위해 일정량 또는 일정 기간이 지나면 데이터를 삭제하도록 법제화하는 것이다. 일정량을 넘는 개인 데이터 보유에 대해 더 많은 세금을 부과하는 방법도 생각할 수 있다.
데이터 공동체 만들어 자기 데이터 통제권 찾아야
저자는 빅데이터와 알고리즘이 우리 모두에게 더 나은 미래를 만드는 방향으로 움직이기 위해 데이터에 대한 인식과 통제권을 재설계해야 한다고 주장한다. 저자가 제안하는 방안은 데이터 공동체를 만드는 것이다. 데이터 공동체는 데이터 신탁 또는 데이터 협동조합 형태가 될 수 있다. 공동체가 구성원의 개인 데이터를 모으고, 모은 개인 데이터를 거대 기술 기업에 유료로 제공하는 방식이다. 즉 우리가 우리의 개인 데이터를 누구와 어떤 목적으로 공유할 것인지 우리가 선택해야 한다는 것이다. 개인 데이터 규모가 커질수록 빅데이터로서 가치도 생기는 만큼 거대 기술 기업과 협상할 수 있는 협상력도 생긴다고 저자는 언급한다. 저자의 주장은 무수히 많은 개인 데이터가 만들어지는 환경에서 현실적인 대안으로 여겨진다. 저자는 ‘개인 데이터를 보호’하지 않고는 우리의 삶을 스스로 통제할 수 없다고 강조한다. 기업이나 AI가 개인 데이터에 접근하고 그 데이터를 이용해 추론하는 것을 우리가 제한할 수 있어야, 진정한 의미의 선택권이 우리에게 주어진다는 뜻이다. 따라서 삶의 주인이 되려면 개인 데이터 보호가 필수적이라고 저자는 단언한다. 더 늦기 전에 개인 데이터 보호에 대한 각별한 관심과 정책이 필요해 보인다.
용어설명
- 1심리 타기팅
사람의 심리적 특성을 기반으로 맞춤형 메시지를 전달하거나 행동을 유도하는 마케팅 전략을 말한다. 나이, 성별, 지역 같은 인구통계학적 정보가 아니라 개인의 성격, 가치관, 관심사, 라이프스타일, 감정 상태 등을 분석해 그 사람에게 가장 효과적인 콘텐츠나 광고 등을 보여주는 것이다.
- 2케임브리지 애널리티카
영국의 정치 컨설팅 회사로 2016년 미국 대선을 전후로 벌어진 정치적 데이터 조작 사건의 장본인이다. 페이스북 사용자 8700만 명의 개인 데이터를 동의 없이 수집해 정치 광고에 활용했다. 이 회사는 성격 테스트 앱을 통해 개인 데이터를 수집해 유권자의 성향을 분석했다. 이를 토대로 거짓 정보를 뿌려 힐러리 클린턴에게 투표하지 않도록 유도한 혐의가 드러났다. 내부 고발자의 폭로로 실상이 드러나자, 페이스북은 미국 연방거래위원회(FTC)에 50억달러의 벌금을 냈고, 케임브리지 애널리티카는 2018년 폐업했다.