WO2022107393A1

WO2022107393A1 - Approche basée sur réseau neuronal pour déclaration de débruitage vocal concernant la recherche subventionnée au niveau fédéral

Info

Publication number: WO2022107393A1
Application number: PCT/JP2021/027243
Authority: WO
Inventors: Changxi Zheng; Ruilin Xu; Rundi WU; Carl Vondrick; Yuko ISHIWAKA
Original assignee: The Trustees Of Columbia University In The City Of New York; Softbank Corp.
Priority date: 2020-11-20
Filing date: 2021-07-20
Publication date: 2022-05-27
Also published as: JP2023552090A; US20230306981A1; US11894012B2

Abstract

L'invention concerne des procédés, des systèmes, des dispositif, ainsi que d'autres modes de réalisation, notamment un procédé consistant : à recevoir une représentation de signal audio ; à détecter dans la représentation de signal audio reçue, au moyen d'un premier modèle d'apprentissage, au moins un intervalle silencieux à niveaux sonores d'avant-plan réduits ; à déterminer, en fonction dudit intervalle silencieux détecté au moins, un profil de bruit total estimé correspondant à la représentation de signal audio ; et à générer avec un deuxième modèle d'apprentissage, en fonction de la représentation de signal audio reçue et du profil de bruit complet estimé déterminé, une représentation de signal audio résultante à niveau de bruit réduit.