EP3516653B1

EP3516653B1 - Appareil et procédé permettant de générer des estimations de bruit

Info

Publication number: EP3516653B1
Application number: EP16784821.7A
Authority: EP
Inventors: Wenyu Jin; Wei Xiao
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2016-10-12
Filing date: 2016-10-12
Publication date: 2021-08-11
Anticipated expiration: 2036-10-12
Also published as: EP3516653A1; WO2018068846A1

Claims

Estimateur de bruit permettant de générer une estimation de bruit globale pour un signal audio, l'estimateur de bruit comprenant des microphones permettant de capturer des sons, les sons étant représentés par une pluralité de signaux audio comprenant le signal audio, chacun de la pluralité de signaux audio étant formé, au moins partiellement, par un signal de bruit et comprenant une pluralité de composantes spectrales, et l'estimation de bruit globale comprenant, pour chaque composante spectrale dans le signal audio, une estimation de bruit spectral respective, l'estimateur de bruit comprenant :
un estimateur (304) configuré pour générer l'estimation de bruit globale par :
l'application d'une première technique d'estimation au signal audio pour générer des estimations de bruit spectral pour des composantes spectrales du signal audio qui sont inférieures à une fréquence de coupure ;

l'application d'une seconde technique d'estimation différente au signal audio pour générer, sur la base de la pluralité de signaux audio, des estimations de bruit spectral pour des composantes spectrales du signal audio qui sont supérieures à la fréquence de coupure ; et

la formation de l'estimation de bruit globale pour comprendre, pour des composantes spectrales inférieures à la fréquence de coupure, les estimations de bruit spectral générées à l'aide de la première technique d'estimation et, pour des composantes spectrales supérieures à la fréquence de coupure, les estimations de bruit spectral générées à l'aide de la seconde technique d'estimation ; caractérisé par une unité d'adaptation (306) configurée pour ajuster la fréquence de coupure de façon à prendre en compte des changements de cohérence du signal de bruit qui sont reflétés dans le signal audio, l'unité d'adaptation étant configurée pour sélectionner la fréquence de coupure pour être la fréquence la plus basse au niveau de laquelle l'un de la pluralité de signaux audio présente un degré prédéterminé de cohérence avec un autre de la pluralité de signaux audio.
Estimateur de bruit selon la revendication 1, l'estimateur (308) étant configuré pour appliquer :
en tant que première technique d'estimation, une technique qui est adaptée à une cohérence du signal de bruit qui est censé prédominer dans le signal audio en dessous de la fréquence de coupure ; et

en tant que seconde technique d'estimation, une technique qui est adaptée à une cohérence du signal de bruit qui est censé prédominer dans le signal audio au-dessus de la fréquence de coupure.
Estimateur de bruit selon la revendication 1 ou 2, l'estimateur étant configuré pour générer les estimations de bruit spectral pour une fréquence supérieure à la fréquence de coupure à l'aide d'une fonction d'optimisation qui prend la pluralité de signaux audio en tant qu'entrées.
Estimateur de bruit selon l'une quelconque des revendications 1 à 3, l'estimateur étant configuré pour générer les estimations de bruit spectral pour une fréquence supérieure à la fréquence de coupure en comparant chacun de la pluralité de signaux audio avec tous les autres de la pluralité de signaux audio.
Estimateur de bruit selon l'une quelconque des revendications 1 à 4, l'estimateur étant configuré pour générer les estimations de bruit spectral pour une fréquence supérieure à la fréquence de coupure en fonction de la cohérence entre chaque signal de la pluralité de signaux audio et tous les autres de la pluralité de signaux audio.
Estimateur de bruit selon l'une quelconque des revendications 1 à 4, l'estimateur étant configuré pour générer les estimations de bruit spectral supérieures à la fréquence de coupure en fonction d'une covariance entre chacun de la pluralité de signaux audio avec tous les autres de la pluralité de signaux audio.
Estimateur de bruit selon l'une quelconque des revendications précédentes, l'estimateur (308) étant configuré pour générer les estimations de bruit spectral inférieures à la fréquence de coupure en fonction d'un seul signal audio qui est représentatif du signal de bruit.
Estimateur de bruit selon l'une quelconque des revendications précédentes, l'estimateur (308) étant configuré pour générer les estimations de bruit spectral pour une fréquence inférieure à la fréquence de coupure et/ou les estimations de bruit spectral pour une fréquence supérieure à la fréquence de coupure par application de la première ou de la seconde technique d'estimation respective uniquement aux parties du signal audio qui sont déterminées en tant que ne comprenant pas de parole.
Procédé permettant de générer une estimation de bruit globale d'un signal audio à l'aide d'un estimateur de bruit qui comprend des microphones permettant de capturer des sons, les sons étant représentés par une pluralité de signaux audio comprenant le signal audio, chacun de la pluralité de signaux audio étant formé, au moins partiellement, par un signal de bruit et comprenant une pluralité de composantes spectrales, et l'estimation de bruit globale comprenant, pour chaque composante spectrale dans le signal audio, une estimation de bruit spectral respective, le procédé comprenant :
l'application (S202) d'une première technique d'estimation au signal audio pour générer des estimations de bruit spectral pour des composantes spectrales du signal audio qui sont inférieures à une fréquence de coupure ;

l'application (S203) d'une seconde technique d'estimation différente au signal audio pour générer des estimations de bruit spectral pour des composantes spectrales du signal audio qui sont supérieures à la fréquence de coupure ;

la formation (S204) de l'estimation de bruit globale pour comprendre, pour des composantes spectrales inférieures à la fréquence de coupure, les estimations de bruit spectral générées à l'aide de la première technique d'estimation et, pour des composantes spectrales supérieures à la fréquence de coupure, les estimations de bruit spectral générées, sur la base de la pluralité de signaux audio, à l'aide de la seconde technique d'estimation ; et

l'ajustement (S205) de la fréquence de coupure de façon à prendre en compte des changements de cohérence du signal de bruit qui sont reflétés dans le signal audio, la fréquence de coupure étant sélectionnée pour être la fréquence la plus basse au niveau de laquelle l'un de la pluralité de signaux audio présente un degré prédéterminé de cohérence avec un autre de la pluralité de signaux audio.
Support de stockage non transitoire lisible par machine sur lequel sont stockées des instructions exécutables par un processeur mettant en œuvre un procédé permettant de générer une estimation de bruit globale d'un signal audio à l'aide d'un estimateur de bruit qui comprend des microphones permettant de capturer des sons, les sons étant représentés par une pluralité de signaux audio comprenant le signal audio, chacun de la pluralité de signaux audio étant formé, au moins partiellement, par un signal de bruit et comprenant une pluralité de composantes spectrales, et l'estimation de bruit globale comprenant, pour chaque composante spectrale dans le signal audio, une estimation de bruit spectral respective, le procédé comprenant :
l'application (S202) d'une première technique d'estimation au signal audio pour générer des estimations de bruit spectral pour des composantes spectrales du signal audio qui sont inférieures à une fréquence de coupure ;

l'application (S203) d'une seconde technique d'estimation différente au signal audio pour générer des estimations de bruit spectral pour des composantes spectrales du signal audio qui sont supérieures à la fréquence de coupure ;

la formation (S204) de l'estimation de bruit globale pour comprendre, pour des composantes spectrales inférieures à la fréquence de coupure, les estimations de bruit spectral générées à l'aide de la première technique d'estimation et, pour des composantes spectrales supérieures à la fréquence de coupure, les estimations de bruit spectral générées, sur la base de la pluralité de signaux audio, à l'aide de la seconde technique d'estimation ; et

l'ajustement (S407) de la fréquence de coupure de façon à prendre en compte des changements de cohérence du signal de bruit qui sont reflétés dans le signal audio, la fréquence de coupure étant sélectionnée pour être la fréquence la plus basse au niveau de laquelle l'un de la pluralité de signaux audio présente un degré prédéterminé de cohérence avec un autre de la pluralité de signaux audio.