EP1194923B1

EP1194923B1 - Verfahren und system für audio analyse und synthese

Info

Publication number: EP1194923B1
Application number: EP00953223A
Authority: EP
Inventors: François CAPMAN; Carlo Murgia
Original assignee: Nortel Networks France SAS
Current assignee: Nortel Networks France SAS
Priority date: 1999-07-05
Filing date: 2000-07-04
Publication date: 2006-01-18
Anticipated expiration: 2020-07-04
Also published as: DE60025615D1; FR2796194A1; EP1194923A1; FR2796194B1; AU6575100A; WO2001003116A1; ATE316284T1

Claims

Verfahren zum Analysieren eines Audiosignals (x), das in Form von aufeinander folgenden Rahmen mit N Abtastwerten verarbeitet wird, wobei die Abtastwerte jedes Rahmens mittels eines Analysefensters (f_A) vom Typ Hamming, Hanning, Kaiser oder dergleichen gewichtet werden, wobei ein Spektrum des Audiosignals berechnet wird, indem jeder Rahmen aus gewichteten Abtastwerten im Frequenzbereich transformiert wird, und wobei das Spektrum des Audiosignals verarbeitet wird, um Syntheseparameter (cx_sup, cx_inf, Emix) eines von dem analysierten Audiosignal abgeleiteten Signals auszugeben, dadurch gekennzeichnet, dass die aufeinander folgenden Rahmen eine abwechselnde Folge von Rahmen aufweisen, für die vollständige Sätze von Syntheseparametern ausgegeben werden, und von Rahmen, für die unvollständige Sätze von Syntheseparametern ausgegeben werden, und dass diejenigen aufeinander folgenden Rahmen, für die vollständige Sätze von Syntheseparametern ausgegeben werden, eine gegenseitige Überdeckung von mindestens N/2-Abtastwerten aufweisen.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die unvollständigen Sätze von Syntheseparametern Werte (icx[n-1/2]) beinhalten, die einen Interpolationsfehler (ecx[n-1/2]) wenigstens eines der Syntheseparameter darstellen.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die unvollständigen Sätze von Syntheseparametern Werte (iP) beinhalten, die einen Interpolationsfilter (128) wenigstens eines der Syntheseparameter darstellen.
Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Verarbeitung des Spektrums des Audiosignals (x) ein Extrahieren von Codierungsparametern (cx_sup, cx_inf, Emix) für die Übertragung und / oder Speicherung des codierten Audiosignals beinhaltet.
Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Verarbeitung des Spektrums des Audiosignals (x) ein Entrauschen durch spektrale Subtraktion beinhaltet.
Audioverarbeitungsvorrichtung mit Analysemitteln, die zur Durchführung eines Verfahrens nach einem der Ansprüche 1 bis 5 ausgebildet sind.
Verfahren zum Synthetisieren eines Audiosignals, wobei eine Gesamtheit von überlappenden, aufeinander folgenden Rahmen mit N mittels eines Analysefensters (f_A) gewichteten Abtastwerten des Audiosignals ausgewertet werden, indem den jeweiligen Rahmen entsprechende spektrale Schätzwerte (Y) im Zeitbereich transformiert werden, und wobei die ausgewerteten Rahmen zum Erzeugen des synthetisierten Signals (x̂) kombiniert werden, dadurch gekennzeichnet, dass für eine Untermenge der ausgewerteten Rahmen die spektralen Schätzwerte erhalten werden, indem den jeweiligen Rahmen der Untergruppe zugeordnete Syntheseparameter (cx_sup_q, cx_inf_q, Emix) verarbeitet werden, wohingegen für die nicht zu der Untermenge gehörigen Rahmen die spektralen Schätzwerte mit einer Interpolation wenigstens einer Teilmenge der Syntheseparameter erhalten werden, dass die aufeinander folgenden Rahmen der Untermenge zueinander zeitliche Verschiebungen von M Abtastwerten aufweisen, wobei die Zahl M größer ist als N/2, wohingegen die aufeinander folgenden Rahmen der Gesamtheit zueinander zeitliche Verschiebungen von M/p Abtastwerten aufweisen, wobei p eine ganze Zahl größer als 1 ist, dass jeder ausgewertete Rahmen modifiziert wird, indem auf ihn eine Verarbeitung entsprechend einer Division durch das Analysefenster (f_A) und entsprechend einer Multiplikation mit einem Synthesefenster (f_S') angewendet wird und wobei das synthetisierte Signal als ein Overlap-Add der modifizierten Rahmen gebildet wird, und dass bei Anordnung der Abtastwerte eines Rahmens in von 0 bis N-1 nummerierten Rängen das Synthesefenster f_S'(i) eine auf die Ränge i von N/2 - M/p bis N/2 + M/p begrenzte Breite hat und der Beziehung f_S'(i) + f_S'(i+M/p) = A für N/2 - M/p ≤i < N/2 genügt, wobei A eine positive Konstante ist.
Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass das Synthesefenster fs'(i) für i zwischen N/2 - M/p bis N/2 ansteigt.
Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass das Synthesefenster f_S'(i) für N/2 - M/p ≤ i < N/2 + M/p eine überhöhte Sinuskurve ist.
Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, dass einen Interpolationsfehler (ecx_q[n-1/2]) darstellenden Werte (icx_q[n-1/2]) denjenigen Rahmen zugeordnet sind, die nicht zu der Untermenge gehören, und dazu verwendet werden, wenigstens einen der interpolierten Syntheseparameter (cx_i[n-1/2]) zu korrigieren.
Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, dass einen Interpolationsfilter (128) darstellende Werte (iP) denjenigen Rahmen zugeordnet sind, die nicht zu der Untermenge gehören, und dazu verwendet werden, wenigstens einen der Syntheseparameter zu interpolieren.
Verfahren nach einem der Ansprüche 7 bis 11, dadurch gekennzeichnet, dass die Syntheseparameter Cepstralkoeffizienten (cx[n]) beinhalten, die in der Interpolation unterworfen sind.
Audioverarbeitungsvorrichtung mit Synthesemitteln, die zur Durchführung eines Verfahrens nach einem der Ansprüche 7 bis 12 ausgebildet sind.