VFX 업계에서 20년을 일하며 수백 테라바이트의 데이터를 다뤘습니다. 영화 한 편을 만들려면 배우의 표정 하나하나, 움직임의 미세한 떨림까지 모두 데이터로 포착합니다. 그 데이터가 없으면 아무것도 만들 수 없습니다. 그런데 최근 첫째 아이의 유튜브 시청 기록을 보다가 섬뜩한 생각이 들었습니다. "이 아이가 5년간 남긴 클릭 하나하나, 머문 시간 1초 1초가 누군가의 수익이 되고 있구나."
서울에 아파트 한 채 사려면 월급을 한 푼도 쓰지 않고 30년을 모아야 합니다. 하지만 우리는 매일 그보다 더 귀한 자산을 공짜로 내주고 있습니다. 바로 우리의 데이터입니다. AI 시대, 부의 공식이 근본적으로 바뀌고 있습니다. 문제는 대부분의 사람들이 이 변화를 감지하지 못한다는 것입니다.
우리는 디지털 소작농입니다
ChatGPT에게 질문을 던질 때마다, 구글에서 검색할 때마다, 우리는 AI를 ‘학습’시키고 있습니다. 하버드 비즈니스 스쿨의 쇼샤나 주보프 교수는 이를 ‘감시 자본주의(Surveillance Capitalism)’라고 명명했습니다. 기업들이 우리의 사적 경험을 ‘공짜 원자재’로 채굴하고, 그것을 가공해 우리의 행동을 예측하고 조작하는 상품으로 만들어 판다는 것입니다.
VFX 작업을 하면서 느낀 것이 있습니다. AI는 본질적으로 텅 빈 깡통입니다. 그 깡통을 채우는 것은 인간의 데이터입니다. 제가 작업한 얼굴 스캔 데이터, 모션 캡처 데이터가 없었다면 지금의 디지털 휴먼은 존재할 수 없었을 것입니다. 그런데 그 데이터를 제공한 배우와 스태프들은 정당한 대가를 받았을까요?
2023년 할리우드 파업은 바로 이 질문에서 시작되었습니다. 작가들과 배우들은 "내 연기 데이터, 내 대사 데이터를 AI 학습용으로 공짜로 쓰지 마라"고 외쳤습니다. 이것은 역사상 최초의 ‘데이터 노동 투쟁’이었습니다. 앞으로 이런 싸움은 더 많아질 것입니다. 왜냐하면 AI가 똑똑해질수록, 그 AI를 가르치는 인간 데이터의 가치는 폭등할 것이기 때문입니다.
데이터는 노동입니다: 새로운 경제학의 등장
"데이터를 제공한 대가로 돈을 받는다면 어떨까요?"
가상현실의 선구자 재런 러니어와 경제학자 글렌 웨일은 ‘데이터 존엄성(Data Dignity)’이라는 개념을 제안합니다. 핵심은 간단합니다. "데이터는 자본이 아니라 노동입니다." 우리가 SNS에 글을 올리고, AI와 대화하는 행위는 단순한 여가가 아니라 가치를 창출하는 ‘노동’이라는 것입니다.
실제로 숫자를 보면 놀랍습니다. 메타(페이스북)의 2023년 수익은 1,340억 달러입니다. 이 돈은 어디서 왔을까요? 30억 명의 사용자가 매일 남기는 데이터에서 나왔습니다. 1인당 연간 약 45달러의 수익을 창출한 셈입니다. 그런데 우리는 그 대가로 ‘무료 메신저’를 받습니다.
2020년 미국 대선 후보였던 앤드류 양은 ‘데이터 배당(Data Dividend)’ 정책을 제안했습니다. "데이터는 21세기의 석유다. 석유가 나온 땅 주인에게 돈을 주듯, 데이터가 나온 사람에게 돈을 줘야 한다"는 것이었습니다. 캘리포니아 주지사도 비슷한 정책을 추진했습니다.
만약 이 개념이 실현된다면 어떨까요? 저는 VFX 전문가로서, 그리고 AI 개발자로서 이것이 단순한 상상이 아니라는 것을 압니다. AI가 생성한 데이터로 AI를 학습시키면 ‘모델 붕괴(Model Collapse)’가 일어납니다. 인간의 ‘오리지널 데이터’는 갈수록 희소하고 비싼 자원이 될 것입니다.
뉴질랜드가 가르쳐준 것: 느린 것의 가치
첫째 아이가 다섯 살 때 뉴질랜드 데이케어에 보냈습니다. 선생님이 말씀하셨습니다. "아이들이 모래를 만지고, 물을 쏟고, 나무를 만지는 이 경험들은 디지털로 대체할 수 없어요." 그때는 그 말이 잘 이해되지 않았습니다. 한국에 돌아와 영어유치원에 보내면서도 "뉴질랜드는 너무 느리다"고 생각했습니다.
하지만 지금은 압니다. AI가 아무리 똑똑해져도 진짜 흙을 만진 경험, 진짜 바람을 느낀 기억은 복제할 수 없습니다. 실리콘밸리가 속도로 승부한다면, 뉴질랜드는 ‘결’로 승부합니다. ChatGPT는 1초에 수천 개의 답을 만들지만, 아이가 모래성을 쌓으며 느끼는 무게감과 촉감은 10년이 지나도 복제하지 못합니다.
데이터도 마찬가지입니다. 양이 아니라 질입니다. AI가 생성한 합성 데이터는 무한히 만들 수 있지만, 인간이 진짜 경험에서 만든 데이터는 희소합니다. 둘째는 한국 어린이집을 선택했지만, 주말마다 아이와 숲을 걷습니다. 그 경험이 아이 안에 쌓입니다. 그것이 진짜 데이터입니다.
아이들에게 "개인정보 유출 조심해"라고만 가르치지 마십시오. 그것은 소극적인 방어입니다. 대신 이렇게 말해야 합니다. "네가 그린 그림 하나하나, 네가 쓴 글 하나하나가 미래에는 ‘자산’이 될 수 있어. 함부로 공짜로 주지 말고, 네가 주인으로서 관리해야 해."
이것이 데이터나 AI가 나쁘다는 얘기가 아닙니다. 저도 매일 AI를 사용하며 VFX 작업을 합니다. 문제는 그 관계의 ‘공정성’입니다. 지금 우리는 땅을 가진 지주에게 쌀을 바치고 떡 한 조각을 받는 소작농입니다. 하지만 우리는 지주가 될 수도 있습니다. 선택은 우리에게 있습니다.
정리하면 이렇습니다.
첫째, 우리가 매일 생성하는 데이터는 거대 테크 기업의 수익이 되고 있지만, 우리는 그 대가를 받지 못하고 있습니다. 이것은 공정하지 않습니다.
둘째, ‘데이터 존엄성’과 ‘데이터 배당’ 논의는 이미 시작되었습니다. 할리우드 파업은 시작일 뿐이며, 이것은 AI 시대의 새로운 경제 모델이 될 것입니다.
셋째, 지금부터 내 데이터의 소유권을 명확히 인식하고, 아이들에게도 ‘데이터 리터러시’를 가르쳐야 합니다. 미래의 부는 아파트가 아니라 양질의 데이터를 소유한 사람에게 갈 것입니다.
10년 뒤, 여러분의 아이가 취업 면접을 볼 때 이력서와 함께 ‘데이터 포트폴리오’를 제출할 수도 있습니다. "저는 지난 10년간 3만 시간의 고품질 언어 데이터, 5천 시간의 창작 데이터를 생성했습니다"라고 말할 수도 있습니다. 그것이 연봉을 결정할 수도 있습니다.
부동산이 전 세대의 자산이었다면, 데이터는 다음 세대의 자산입니다. 당신은 지금, 당신과 아이들의 가장 소중한 자산을 지키고 있습니까, 아니면 공짜로 뿌리고 있습니까?
