EP2372707B1

EP2372707B1 - Transformation spectrale adaptative pour signaux vocaux acoustiques

Info

Publication number: EP2372707B1
Application number: EP10156530A
Authority: EP
Inventors: Jochen Withopf; Patrick Hannon; Mohamed Krini; Gerhard Uwe Schmidt
Original assignee: SVOX AG
Current assignee: SVOX AG
Priority date: 2010-03-15
Filing date: 2010-03-15
Publication date: 2013-03-13
Anticipated expiration: 2030-03-15
Also published as: EP2372707A1

Claims

Procédé pour la transformation spectrale adaptive pour des signaux vocaux acoustiques comprenant les étapes suivantes :
réception d'au moins une représentation spectrale d'entrée, qui correspond à au moins une fenêtre d'un signal d'entrée de plage de temporisation pour une langage acoustique,

sélection d'au moins une représentation spectrale d'entrée à transformer parmi les représentations spectrales d'entrée,

attribution des représentations spectrales sélectionnées à un centre de cluster d'un jeu de centres de cluster, dans laquelle
les centres de cluster sont définis par un algorithme de clustering sur la base des segments de représentations spectrales d'intervalles de temps d'un corpus linguistique,

que des représentations spectrales de classe sont associées aux centres de cluster et sont des éléments d'un livre de codes, et

que le livre de codes assigne au moins une transformation spectrale à chaque représentation spectrale de classe, qui améliore la représentation spectrales de classe correspondante,

transformation de chaque représentation spectrale sélectionnée en une représentation spectrale de sortie, dans laquelle la transformation appliquée correspond à l'au moins une transformation spectrale assignés au centre de cluster, qui est attribué à la représentation spectrale respective sélectionnée, et

mettre en place des représentations spectrales de sortie pour synthétiser un signal vocal acoustique.
Procédé selon la revendication 1, dans lequel l'attribution des représentations spectrales sélectionnées à un centre de cluster d'un jeu de centres de cluster comprend le suivait:
calculer des mesures de distances entre représentation spectrale sélectionnée et toutes les représentations spectrales de classe du livre de codes, et

attribuer l'au moins une représentation spectrale sélectionnée au centre de cluster ayant les mesures de distance plus courtes entre la représentation spectrale sélectionnée et les représentations spectrales de classe du centre de cluster.
Procédé selon la revendication 2, dans lequel le calcul des mesures de distance comprend le suivant :
calculer les vecteurs de caractéristiques pour les représentations spectrales, et les mesures de distance sont des distances entre les vecteurs de caractéristiques.
Procédé selon la revendication 3, dans lequel les vecteurs de caractéristiques sont calculés à parti des représentations spectrales par une transformation à filtrage, de préférence par un Mel banc de filtres, dans lequel le Mel banc de filtres utilise, le cas échéant, des fenêtres triangulaires chevauchants l'une par rapport à l'autre ayant des largeurs variables avec la fréquence.
Procédé selon une quelconque des revendications 1 à 4, dans lequel le livre de codes comprend au moins huit, de préférence trente deux, le cas échéant 128 centres de cluster.
Procédé selon une quelconque des revendications 1 à 5, dans lequel les représentations spectrales de classe pour les centres de cluster sont des représentations spectrales moyennées, qui ont été moyennées pour les classes respectives via des représentation spectrales des éléments de cluster correspondants.
Procédé selon une quelconque des revendications 1 à 6, dans lequel la définition des centres de classe est effectuée par l'algorithme de clustering à la base d'un sous-corpus du corpus linguistique.
Procédé selon la revendication 7, dans lequel la présélection d'un sous-corpus comprend la réduction aux représentations spectrales du corpus linguistique, qui ont un centre spectral, qui est au-dessus d'une fréquence d'un nombre, de préférence au-dessus de 3 kHz.
Procédé selon une quelconque des revendications 1 à 8, dans lequel une transformation spectrale attribuée au moins une de chaque représentation de classe du livre de codes est une transformation spectrale de compression, qui imagine un intervalle de fréquence de la représentation spectrale sélectionnée à un intervalle de fréquence plus petit de la représentation spectrale de sortie.
Procédé selon la revendication 9, dans lequel chaque transformation spectrale de compression attribuée à chaque représentation spectrale de classe du livre de codes d'une largeur de bande de 0 à 8 kHz est comprimée à une largeur de bande de 0 à 4 kHz, de préférence avec une compression seulement au bout supérieur ou inférieur de la largeur de bande, le cas échéant avec pas de compression linéairement correspondante au moins dans la largeur médiane de bande de fréquence, si la pente est égale à 1.
Procédé selon une quelconque des revendications 1 à 7, dans lequel une des transformations spectrales attribuée à au moins une de chaque représentation de classe du livre de codes est une fonction d'amplification de formants.
Procédé selon la revendication 11, dans lequel la fonction d'amplification de formants attribuée à chaque représentation spectrale de classe du livre de codes amplifie au moins un formant, de préférence deux ou trois, avec des fréquences basses.
Procédé selon la revendication 8, dans lequel la sélection d'au moins une représentation spectrale sélectionnée comprend le calcul du centre spectrale de chaque représentation spectrale d'entrée, ainsi que la sélection de ceux représentations spectrales d'entrée, qui ont un centre spectral, qui est au-dessus d'une fréquence d'un nombre, de préférence au-dessus de 3 kHz.
Procédé selon une quelconque des revendications 1 à 13, dans lequel la sélection d'au moins une représentation spectrale sélectionnée à transformer comprend déterminer au moins l'activité linguistique ou le niveau de bruit de fond ainsi que la sélection des représentations spectrales d'entrée comprenant de langage à transformer.
Programme d'ordinateur comprenant des moyens de programme adaptés pour réaliser toutes les étapes d'une des revendications 1 à 14, quand le programme tourne à un ordinateur.