쫓고 쫓기는 ‘딥페이크 전쟁’… AI업계, 탐지·표시 기술 개발 분주

인텔 ‘페이크캐처’ 96% 걸러내
딥브레인AI, 가짜 음성도 탐지
구글·네이버, 워터마크로 표시

▲ 도널드 트럼프 전 미국 대통령이 경찰에 체포된 것처럼 조작된 딥페이크 사진물. 지난해 초 온라인상에 퍼진 이 사진은 인공지능(AI) 이미지 생성 프로그램 ‘미드저니’가 만든 가짜 사진으로 판명됐다(왼쪽 사진). 오른쪽 사진은 조 바이든 미국 대통령이 안면 경련을 일으켜 혓바닥을 내민 것처럼 보이게 조작한 딥페이크 영상의 한 장면. 엑스 캡처
사용자가 딥페이크 영상에 속는 일을 막기 위해 인공지능(AI)이 생성한 이미지나 영상을 감지하거나 콘텐츠에 ‘표지’를 남기는 기술도 계속 개발되고 있다. 하지만 대체로 딥페이크를 잡는 기술은 나날이 정교해지는 딥페이크 기술의 발달 속도를 따라잡지 못하고 있다.

19일 AI 업계에 따르면 딥페이크에 대응하는 기술은 크게 ‘탐지’하는 방식과 ‘표지’를 남기는 방식으로 나뉜다. 이 중 탐지 방식은 딥페이크의 특징을 학습한 AI가 가짜 영상을 찾아내 확산되기 전에 막는 기술이다. 합성한 얼굴과 합성 이미지를 덧씌운 대상의 얼굴 경계에 있는 미세한 차이, 모델의 데이터가 부족할 때 나타나는 부정확한 표정, 딥페이크에서만 나타나는 미묘한 음성 지연 등 얼굴이나 음성을 합성할 때만 나타나는 현상을 인간의 눈, 귀보다 빠르고 정확하게 찾아낸다.


2020년 마이크로소프트(MS)와 구글, 메타 등은 우승 상금 100만 달러(현재 환율로 약 133억 3550만원)를 걸고 ‘딥페이크 디텍터 챌린지’를 열었다. 전 세계 연구자와 개발자들의 기술과 아이디어를 끌어모으기 위해서다. 대회를 통해 탐지용 AI를 학습시킬 수 있는 딥페이크 데이터 세트가 만들어졌고, 누구나 탐지 모델을 만들 때 쓸 수 있도록 소스코드도 공유됐다. 하지만 2000명 이상의 참가작 중 1위 AI 모델조차 탐지 정확도가 65%에 그쳤다.

지난해엔 인텔이 ‘페이크캐처’라는 딥페이크 탐지 소프트웨어를 공개했다. 인텔은 페이크캐처가 사람의 심장이 뛸 때마다 얼굴에 나타나는 미세한 색 변화 등을 감지해 무려 96%의 정확도로 딥페이크를 걸러낸다고 밝혔다. 하지만 BBC 등에 따르면 이는 조명, 대상 인종 등 실험 조건이 통제된 상황에서만 달성될 가능성이 높다.

국내에선 딥브레인AI가 딥페이크 탐지 기술을 꾸준히 개발하고 있다. 자사에 축적된 AI 아바타 제작 데이터와 기술력을 딥페이크 탐지에도 활용해 솔루션을 만들어 출시하고 있다. 지난달 출시한 서비스는 클라우드 환경에서 운영되는 서비스형 소프트웨어(SaaS) 2종으로, 조작된 이미지와 동영상 탐지 서비스, 음성 탐지 서비스를 각각 제공한다.


생성형 AI가 학습할 데이터에 눈엔 보이지 않는 ‘딱지’를 붙여 딥페이크 생성 과정에서 이를 드러나게 하는 ‘워터마크’ 방식도 최근 주목을 받고 있다. 구글 딥마인드가 지난해 8월 공개한 ‘신스ID’(SynthID)가 대표적이며, 네이버 제페토와 메타 등도 워터마크 정책을 도입했다.

하지만 워터마크를 지우는 기술 역시 다양하고 빠르게 확산되고 있다. 미국 메릴랜드대 연구진은 지난해 10월 신스ID를 포함한 주요 AI 워터마크를 모두 깨뜨렸다는 연구 결과를 발표하기도 했다.

<저작권자 ⓒ 매일한국, 무단 전재 및 재배포 금지>

박진영 기자 다른기사보기