Diffsinger 썸네일형 리스트형 음성 변조를 잡아내는 앱 계획서 최근에 텍스트를 읽어주던 인공지능에서 음성이 변조가 가능한 인공지능으로 음성 인공지능이 발달하고 있다. https://www.youtube.com/watch?v=JMCxsc-kJ24 위의 유튜브 동영상처럼 30분과 12시간의 학습이면 자신의 목소리로 노래하고 랩을 할 수 있는 세상이 온 것이다. 이는 보이스 피싱에 이용될 가능성이 충분히 보이며, 어쩌면 근시일내에 해당 음성변조를 통해 일어날 수 있다. Chat-Gpt를 잡아내는 Gpt-zero와 같이 전화통화시 상대의 음성변조를 잡아내는 방법을 고안해보자. Diffsinger는 Diffusion 모델을 사용한 모델인 만큼 그림에 기반해 두고 있다. 즉, 소리의 파형 학습시켰다는 이야기와 동일하다. 해당 파형을 학습시킨 후, 2개의 데이터를 Concate.. 더보기 이전 1 다음