칼럼

딥페이크, 진실과 거짓 사이

엘노스 2025. 6. 25. 13:36

 

2023년 이후, 도널드 트럼프의 연설을 인공지능으로 합성한 영상들이 온라인에 반복적으로 등장했다. 일부는 존재하지 않는 발언을 기반으로 제작됐고, 그 중에는 상대 정치인을 조롱하는 내용도 있었다. 영상 속 표정과 목소리는 실제처럼 정교했고, 일부는 실제 언론 보도와 뒤섞여 유통되기도 했다.

딥페이크(deepfake)는 딥러닝과 페이크의 합성어로, 인공지능이 사람의 얼굴과 목소리를 학습해 실제 하지 않은 말이나 행동을 사실처럼 만들어낸다. 특히 이 기술은 정치, 연예, 광고를 넘어 여성의 신체를 대상으로 한 디지털 성착취의 도구로 악용되며 사회적 문제로 떠오르고 있다.

딥페이크 기술의 핵심은 GAN(Generative Adversarial Network), 즉 생성적 적대 신경망 구조다. 두 개의 인공지능 모델이 하나는 가짜 데이터를 만들고, 다른 하나는 그것이 진짜인지 판별하는 식으로 경쟁하며 점점 더 사실적인 결과물을 만들어낸다.

 

처음 GAN을 제안한 이안 굿펠로우는 GAN을 경찰과 위조지폐범 사이의 게임에 비유했다. 위조지폐범은 최대한 진짜 같은 화폐를 만들어(생성) 경찰을 속이기 위해 노력하고, 경찰은 진짜 화폐와 가짜 화폐를 완벽히 판별해 위조지폐범을 검거하는 일을 목표로 세운다. 이런 과정이 수없이 반복되면 구별이 극히 힘든 가짜 화폐를 만들어낼 수 있다.  

영상 제작 과정은 예전만큼 복잡하지 않다. AI에 특정 인물의 얼굴 데이터를 학습시키고, 그것을 다른 영상에 입히는 방식이다. 표정, 움직임, 조명까지 학습된 데이터가 대상 영상의 인물 위에 자연스럽게 덧입혀진다. 음성 합성 기술도 발전하면서, 10초 정도의 음성 샘플만으로 특정인의 말투와 억양을 거의 흡사하게 구현할 수 있다.

 



이 과정에 필요한 도구는 대부분 무료 또는 저비용으로 제공된다. DeepFaceLab, FaceSwap 같은 오픈소스 프로그램과 ElevenLabs, Descript 같은 웹 기반 음성 합성 서비스는 프로그래밍 지식 없이도 얼마든지 사용할 수 있다. 클라우드 기반 처리와 자동화된 인터페이스 덕분에 영상 한 편을 몇 시간 안에 제작하는 것도 가능하다.

딥페이크 기술은 영화·광고·게임 등 합법적 용도를 갖고 있지만, 현재 가장 널리 악용되는 분야는 음란물 제작이다.

2019년 보안 기업 딥트레이스(Deeptrace, 현 Sensity AI)는 당시 온라인에 유통되는 딥페이크 영상의 96%가 포르노이며, 피해자의 100%가 여성이라고 밝혔다. 피해자는 대부분 유명인 여성으로, 얼굴이 노출되어 있다는 이유만으로 합성 대상이 된다. 일반인 여성도 예외는 아니다. 얼굴 사진 몇 장만 온라인에 있으면 음란 영상에 합성될 수 있다.

제작보다 더 빠른 건 배포다. 완성된 딥페이크 영상은 주로 익명성이 보장되는 경로를 통해 퍼진다. 4chan, Reddit 같은 해외 커뮤니티를 포함해, 국내외 웹하드, 파일 공유 플랫폼, 심지어 텔레그램과 디스코드 같은 폐쇄형 메신저 채널에서도 유통된다.

영상 파일 자체를 공유하기보다는, 스트리밍 가능한 웹사이트 링크나 클라우드 다운로드 주소를 공유하는 방식이 일반적이다. 이렇게 퍼진 영상은 삭제 요청 이전에 수십 개의 복제 링크로 확산되고, URL이 삭제돼도 콘텐츠는 재생산된다.

문제는 이 유통 구조가 익명성과 분산성을 바탕으로 하기 때문에 추적과 처벌이 어렵다는 점이다. 피해자는 자신이 피해자인지도 모른 채 오랜 시간 방치되기도 하며, 영상의 원본 유포자를 특정하기란 거의 불가능에 가깝다.

 

반응형