“2초 샘플로도 가능”…AI보이스피싱, 돌발질문 던져라

20일 CBS 라디오 ‘김현정의 뉴스쇼’ 인터뷰
“딥보이스 특징 급변해 탐지도 쉽지는 않아”
“공격자가 알 수 없는 질문 던지며 판별해야”
“범죄 노출 시…당황하지 말고 확인 거쳐야”
  • 등록 2023-09-20 오후 6:28:27

    수정 2023-09-20 오후 6:28:27

[이데일리 이재은 기자] 특정 개인의 목소리를 이용한 인공지능기술(AI) 보이스피싱 사례가 이어지는 가운데 전문가들이 범죄 상황에서 반드시 본인 확인 질문을 거쳐야 한다고 강조했다.

위 사진은 기사 사진과 직접 관련 없음. (사진=게티이미지)
정수환 숭실대학교 정보통신전자공학부 교수는 20일 CBS 라디오 ‘김현정의 뉴스쇼’와의 인터뷰에서 “(특정인의 목소리를 딥 러닝 기술로 학습시켜 만든) 딥보이스가 최근 발전해 일반인이 들었을 때 사람의 목소리인지 합성음인지 구분하지 못하는 단계까지 왔다”며 이같이 말했다.

그는 “여러 사람의 목소리로 트레이닝한 기본 모델에 짧은 샘플을 입혀 특정인의 목소리와 비슷하게 들리게 할 수 있다”며 “2초 (목소리) 샘플을 가지고도 품질이 괜찮은 딥보이스가 나온다”고 설명했다.

이어 공격자가 타깃을 정해 딥보이스로 범행할 때는 피해를 당하기 쉬운 상황이 만들어진다고 덧붙였다.

정 교수는 2021년 아랍에미리트 은행에서 기업 임원을 사칭한 딥보이스 피싱에 3500만달러를 송금하고, 지난 3월 캐나다의 한 부모가 아들의 치료비를 보내달라는 딥보이스 피싱에 속아 2만1000달러를 보낸 사례를 언급했다.

또 지난 4월 중국 네이멍구의 한 기업 대표가 지인 번호로 걸려온 딥페이크 영상 피싱으로 430만위안을 송금한 사건에 대해서도 설명했다. 그러면서 “딥페이크 영상은 음성과 영상을 함께 맞추다 보니 조금 이상한 부분이 있었지만 지금은 굉장히 정교해져 사실상 구분이 굉장히 어려운 상황”이라고 밝혔다.

정 교수는 딥페이크 음성 탐지 기술을 연구하고 있다면서도 합성기술의 특징이 달라져 탐지하기가 쉽지 않다고 설명했다. 이어 “깨끗한 상태에서 녹음된 음성은 비교적 탐지가 잘 되지만 잡음이 많거나 중첩되는 경우 등은 탐지율이 떨어진다”며 “공격자들은 일부러 잡음을 실어 탐지를 어렵게 한다”고 했다.

정 교수는 이 같은 딥페이크, 딥보이스 피싱에 노출될 경우 공격자가 미리 만들지 못하는 당사자들만이 알 수 있는 질문을 해야 한다고 당부했다. 그는 화장대에 있는 화장품의 개수, 필통 안의 샤프 수, 가족 구성원들만의 경험을 바탕으로 한 질문 등을 예시로 들었다.

아울러 이 같은 질문을 할 때 “(공격자가) 준비되지 않은 상태에서 답변을 만들며 (딥보이스의) 품질이 떨어질 수 있고 답변을 못 할 수 있다”며 “당황하지 말고 본인 확인을 반드시 해야 한다”고 강조했다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 누가 왕이 될 상인가
  • 몸풀기
  • 6년 만에 '짠해'
  • 결혼 후 미모 만개
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원 I 청소년보호책임자 고규대

ⓒ 이데일리. All rights reserved