EP3032536B1

EP3032536B1 - Filtre vocal adaptatif pour l'atténuation de bruit ambiant

Info

Publication number: EP3032536B1
Application number: EP15198584.3A
Authority: EP
Inventors: Tilman Herberger; Titus Tost
Original assignee: Bellevue Investments GmbH and Co KGaA
Current assignee: Bellevue Investments GmbH and Co KGaA
Priority date: 2014-12-12
Filing date: 2015-12-09
Publication date: 2020-04-01
Anticipated expiration: 2035-12-09
Also published as: EP3032536A1

Claims

Une méthode qui consiste à améliorer un signal de voix parlée comportant du bruit et qui englobe les étapes suivantes :
réalisation, au moyen de matériel de traitement informatique, d'opérations de :
a. lecture d'un signal audio contenant le signal de voix parlée

b. transformation du signal audio vers le domaine fréquentiel et formation d'un signal audio transformé

c. détermination, au moyen d'une analyse spectrale récursive dans le domaine fréquentiel, des composants spectraux les plus énergiques du signal audio transformé

d. détermination de points zéro dans le domaine temporel pour chacun des composants spectraux déterminés comme les plus énergiques

e. calcul du gradient de chacun des points zéro déterminés pour chacun des composants spectraux déterminés comme les plus énergiques

f. calcul de la variance de chacune des valeurs de gradient déterminées pour chacun des composants spectraux déterminés comme les plus énergiques

g. analyse de la variance de chacun des gradients calculés pour chacun des composants spectraux déterminés comme les plus énergiques et attribution à chacun des composants d'au moins une d'une pluralité de catégories

h. constatation si chacun des composants spectraux déterminés comme les plus énergiques appartient à une série harmonique

i. calcul d'une courbe de filtre pour chacun des composants spectraux déterminés comme les plus énergiques en utilisant l'analyse de la variance des valeurs de gradient et constatation si les composants appartiennent à la série harmonique

j. application de la courbe de filtre à chacun des composants spectraux déterminés comme les plus énergiques et application de la courbe de filtre au signal audio transformé, formant ainsi un signal audio filtré

k. transformation inverse du signal audio filtré, formant ainsi le signal de voix parlée amélioré.
Une méthode qui équivaut à la revendication 1, l'étape (c) englobant les étapes suivantes :
(c1) mise en œuvre d'une analyse spectrale de haute résolution pour le signal audio

(c2) détermination du spectre de densité de puissance à court terme, c'est-à-dire de l'amplitude

(c3) détermination des maxima et minima locaux de l'amplitude déterminée

(c4) segmentation de l'amplitude en composants spectraux uniques conformément à la détermination des maxima et minima locaux

(c5) détermination du composant spectral le plus énergique parmi les composants spectraux uniques segmentés

(c6) transformation du composant spectral dans le domaine temporel, générant ainsi un signal de domaine temporel

(c7) génération d'un signal différentiel entre le signal audio et le signal de domaine temporel généré

(c8) utilisation du signal différentiel lors de la prochaine exécution des étapes (c1) à (c7).
Une méthode qui équivaut à la revendication 1, l'étape (g) englobant l'étape suivante :
(g1) segmentation des catégories en catégories pour les valeurs de gradient avec des valeurs de variance élevées, catégories pour les valeurs de gradient avec des valeurs de variance moyennes et catégories pour les valeurs de gradient avec des valeurs de variance faibles.
Une méthode qui équivaut à la revendication 3, les composants spectraux déterminés comme les plus énergiques dont les valeurs de gradient présentent des valeurs de variance élevées étant considérés comme bruyants
Une méthode qui équivaut à la revendication 3, les composants spectraux déterminés comme les plus énergiques dont les valeurs de gradient présentent des valeurs de variance moyennes étant considérés comme faisant partie d'une partie tonale du signal d'entrée
Une méthode qui équivaut à la revendication 3, les composants spectraux déterminés comme les plus énergiques dont les valeurs de gradient présentent des valeurs de variance faibles étant considérés comme une partie tonale du signal d'entrée, et non comme faisant partie du signal de voix parlée
Une méthode qui équivaut à la revendication 1, l'étape (i) englobant l'étape suivante :
i1) si une appartenance des composants spectraux déterminés comme les plus énergiques à une série harmonique a été constatée et si plus de la moitié de ces composants ont été considérés comme faisant partie d'une partie tonale du signal d'entrée, utilisation de tous les composants dans le calcul de la courbe de filtre, puis paramétrage du filtre à un état ouvert pour toutes les largeurs de bande des composants.
Une méthode qui équivaut à la revendication 1, l'étape (i) englobant l'étape suivante :
i2) si une appartenance des composants spectraux à une série harmonique n'a pas été constatée et si les composants spectraux uniques déterminés comme les plus énergiques ont été considérés comme faisant partie d'une partie tonale du signal d'entrée, paramétrage du filtre à un état ouvert pour les largeurs de bande des composants.
Une méthode qui équivaut à la revendication 1, l'étape (j) englobant l'étape suivante :
j1) multiplication du spectre complexe par la courbe de filtre pour chacun des composants spectraux déterminés comme les plus énergiques.
Une méthode qui équivaut à la revendication 1, l'étape (k) englobant l'étape suivante :
k1) utilisation d'un algorithme FFT inverse pour la transformation inverse

k2) fenêtrage et agrégation de chaque composant spectral individuel,
formant ainsi le signal de voix parlée amélioré.
Une méthode qui équivaut à la revendication 1, cette dernière englobant en outre les étapes suivantes :
l) détermination de l'amplitude du signal de voix parlée amélioré

m) détermination de l'amplitude du signal audio

n) comparaison de l'amplitude du signal audio avec l'amplitude du signal de voix parlée amélioré

o) si l'amplitude du signal de voix parlée amélioré est significativement plus élevée dans une pluralité de plages de fréquences que l'amplitude du signal audio, paramétrage d'un filtre avant et après suroscillation à un état fermé afin de filtrer les différences.