위스콘신 연구원들은 PVC 파이프의 도움으로 일부 음성 인식 시스템을 속였습니다.

2024-01-08 09:00

PVC Piping

시마아 Ahmed는 UW-Madison의 박사과정 학생입니다. 그녀는 자동 화자 식별 장치를 무력화하기 위해 음성의 공명 또는 특정 주파수 진동을 변경하는 것이 가능한지 조사했습니다.


사람의 목소리를 암호로 사용하는 컴퓨터 시스템을 속이는 것이 가능합니까? 일부 위스콘신 엔지니어들은 대답이 '그렇다'고 말하며 철물점에서 찾을 수 있는 플라스틱 파이프를 사용하여 부분적으로 그렇게 했다고 말합니다.


일부 온라인 뱅킹 시스템은 자동 화자 식별(간단히 말하면)을 사용하여 계정 소유자의 음성을 암호로 사용합니다. UW-매디슨 전기 및 컴퓨터 공학 교수인 카셈 Fawaz는 또한 사과 아이폰 사용자는 소유자에게만 응답하는 가상 비서 Siri에 익숙할 것이라고 말합니다.


"Siri가 사용자에게만 응답하는 이유는 화자 식별이라는 기술을 사용하기 때문입니다. 그래서 그들은 지문과 유사한 일종의 성문을 얻고 그것이 당신에게서 나온 것인지, 아니면 다른 사람에게서 나온 것인지 확인할 수 있습니다. 이것이 바로 Siri가 사용자나 휴대폰 소유자가 대화 중인지 확인하는 방법입니다."Fawaz는 말합니다.


하지만 Fawaz와 두 명의 UW-매디슨 Ph.D. 학생들은 디지털 보안을 개선하기 위한 여러 대학의 노력에 참여하고 있습니다. 그래서 그들은 컴퓨터 시스템을 속일 수 있는 방법을 모색해 왔습니다. 그들과 다른 사람들은 이미 인간의 목소리를 복제하고 컴퓨터가 그 사람처럼 말하도록 하는 작업을 진행해 왔습니다.


최근 Fawaz는 엔지니어들이 디지털에서 물러나 아날로그로 전환하여 많은 화자 식별 시스템을 속일 수 있다는 것을 깨달았다고 말합니다.


"그리고 이것이 우리가 다른 사람을 흉내낼 수 있는 어떤 종류의 디지털 전자 장치도 없는 일종의 아날로그 장치를 설계하려는 아이디어를 갖게 된 방법입니다."Fawaz는 말합니다.


박사. 학생 시마아 Ahmed는 유명 인사를 흉내 내면서 많은 종이 타월 롤에서 발견되는 판지 튜브를 통해 처음으로 말을 시도했다고 말했습니다.


"그리고 그것은 효과가 있었습니다. 몇몇 유명인의 목소리를 키친 페이퍼 타월 튜브에 통과시키면서 그 유명인의 예측이 바뀌었습니다."아흐메드는 말합니다.


결국 Fawaz는 플라스틱을 구입했습니다PVC 파이프철물점 배관 부품 통로에서 가져온 제품을 팀에서 사용하기 시작했습니다.

pvc drain pipe

위스콘신대학교 매디슨 공과대학 전기 및 컴퓨터 공학과 조교수인 카삼 Fawaz가 2022년 2월 15일 스튜디오 초상화에 사진이 찍혀 있습니다. Fawaz는 2022년 우수 교육상 수상자 12명 중 한 명입니다. 수상 (DTA). (사진: 알테아 도조르 / UW–매디슨)

drain down hose


Fawaz는 튜브에 단점이 있다는 것을 깨달았다고 말했습니다.


"일반 배관 튜브의 치수는 고정되어 있습니다. 그렇죠? 잘라서 길이를 조절할 수 있습니다. 하지만 직경을 조절할 수는 없습니다. 일부 실험에는 에이스 Hardware에서는 찾을 수 없는 특별한 직경의 튜브가 필요했습니다. 그래서 우리가 이 튜브를 제작하기 위해 필요했던 것은 튜브를 제작하는 가장 쉬운 방법은 3D 프린팅하는 것이었습니다."Fawaz는 말합니다.


팀은 당시 학부생이었으며 지금은 박사 학위를 취득했습니다. 튜브를 3D로 인쇄한 학생 야쉬 와니. Wani는 이 연구가 그의 학문적 초점을 바꾸었다고 말했습니다.


"솔직히 말해서 제가 박사 학위를 취득하게 된 것은 매우 멋진 일이었습니다. 그 일을 계속할 수 있을 만큼 멋있었고,"그는 말한다.


연구자들은 다른 목소리를 모방하기 위해 거의 모든 목소리의 공명(음조 강도와 품질)을 변환하는 데 필요한 파이프 치수를 파악하는 알고리즘 또는 엄격한 지침을 개발했습니다.


한 녹음에서 Ahmed는 기존 음성 데이터 세트를 읽었으며 여배우 리사 Kudrow와 약간 비슷하게 들렸습니다. 친구.


"바위에는 아무것도 없었지만,"독서하러 갔다. 아흐메드는 또한 TV 시리즈에 출연한 여배우 켈리 라일리의 흉내를 시도했다. 옐로스톤."필립은 '나는 모른다'고 대답했다."아흐메드는 녹음에서 이렇게 말했습니다.


그것들은 정확한 모방이 아니었습니다. 하지만 음성인증 시스템의 디지털 공격 필터를 뚫고 속일 수 있을 만큼 뛰어났다. 또한 UW-매디슨 엔지니어들은 실험에서 다른 학생의 목소리를 사용하여 91개의 목소리 테스트에서 보안 시스템을 속이는 비율이 60%라고 보고했습니다.


논문을 작성하고 Ahmed가 이번 달 캘리포니아에서 열리는 보안 심포지엄에서 결과를 발표하기에 충분했습니다.


"사람들은 튜브와 같은 장치를 어떻게 만들 수 있는지 궁금해했지만 더 복잡한 것은 어떤 사람이라도 흉내낼 수 있다는 점이었습니다."아흐메드는 말합니다.


Fawaz는 사과, Google, IBM, 마이크로소프트 등 모든 화자 식별 시스템 제조업체가 자사 기술의 다양한 단점을 인식하고 이를 해결하기 위해 노력하고 있다고 말합니다.


UW 연구의 자금 지원자에는 국립 과학 재단(국가의 과학 기반)과 국방부의 대규모 연구 기관인 DARPA가 포함됩니다.


최신 가격을 받으시겠습니까? 우리는 가능한 한 빨리 응답 할 것이다 (12 시간 이내에)
  • Required and valid email address
  • This field is required
  • This field is required
  • This field is required
  • This field is required