ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images

Leading NLP Ninja - Ein Podcast von jojonki

Kategorien:

ICASSP 2020より,ビジュアル情報を利用し,マスクされた音声信号を復元できるマルチモーダルASRを解説しました. 今回紹介した記事はこちらのissueで解説しています. https://github.com/jojonki/arXivNotes/issues/384 サポーターも募集中です. https://www.patreon.com/jojonki