EP1192619B1

EP1192619B1 - Audio-kodierung, dekodierung zur interpolation

Info

Publication number: EP1192619B1
Application number: EP00949621A
Authority: EP
Inventors: François CAPMAN; Carlo Murgia
Original assignee: Nortel Networks France SAS
Current assignee: Nortel Networks France SAS
Priority date: 1999-07-05
Filing date: 2000-07-04
Publication date: 2004-09-22
Anticipated expiration: 2020-07-04
Also published as: DE60014085D1; WO2001003118A1; AU6292000A; ATE277403T1; FR2796191B1; EP1192619A1; FR2796191A1

Claims

Verfahren zum Decodieren eines digitalen Eingangsdatenstroms (Φ), der ein codiertes Audiosignal bildet, bei dem eine Gruppe von aufeinander folgenden Blöcken von N Abtastwerten des Audiosignals ausgehend von Codierungsdaten zusammengesetzt wird, die in dem digitalen Eingangsdatenstrom enthalten sind, bei dem die Codierungsdaten für nur eine Untergruppe von Blöcken Daten umfassen, die für Spektralamplituden, die Frequenzen des Spektrums des Audiosignals zugeordnet sind, repräsentativ sind,
dadurch gekennzeichnet, dass auf der Basis der Codierungsdaten für jeden der Blöcke der Untergruppe Cepstralkoeffizienten bestimmt werden, die für wenigstens einige der Spektralamplituden repräsentativ sind, und dass für die nicht zu dieser Untergruppe gehörenden Blöcke diese Cepstralkoeffizienten interpoliert werden und mit Hilfe der interpolierten Ceptstralkoeffizienten eine Spektralschätzung (Y) des Audiosignals erzeugt wird, das in den Zeitbereich umgesetzt wird, um den zusammengesetzten Block zu erhalten.
Verfahren nach Anspruch 1,
bei dem die Codierungsdaten Daten zur Quantisierung dieser Cepstralkoeffizienten umfassen.
Verfahren nach Anspruch 1 oder 2,
bei dem eine Grundfrequenz (F₀) des Audiosignals ausgehend von Quantisierungsdaten, die in dem binären Eingangsdatenstrom (Φ) enthalten sind, bestimmt wird, bei dem ausgehend von den Codierungsdaten für jeden Block dieser Untergruppe eine obere Spektraleinhüllende (X_sup) des Audiosignals bestimmt wird, die Spektralamplituden entspricht, die Vielfachfrequenzen der Grundfrequenz zugeordneten sind, und bei dem für jeden nicht zur Untergruppe gehörenden Block die obere Spektraleinhüllende des Audiosignals ausgehend von den interpolierten Cepstralkoeffizienten bestimmt wird.
Verfahren nach einem der Ansprüche 1 bis 3,
bei dem eine Grundfrequenz (F₀) des Audiosignals ausgehend von Quantisierungsdaten bestimmt wird, die in dem binären Eingangsdatenstrom (Φ) enthalten sind, bei dem ausgehend von den Codierungsdaten für jeden Block dieser Untergruppe eine untere Spektraleinhüllende (X_inf) des Audiosignals bestimmt wird, die Spekralamplituden entspricht, die Frequenzen zugeordnet sind, die in Bezug auf die Vielfachfrequenzen der Grundfrequenz in Zwischenbereichen des Spektrums liegen, und bei dem für jeden nicht zur Untergruppe gehörenden Block die untere Spektraleinhüllende des Audiosignals ausgehend von den interpolierten Cepstralkoeffizienten bestimmt wird.
Verfahren nach einem der Ansprüche 1 bis 4,
bei dem die aufeinander folgenden Blöcke dieser Gruppe überlappend und aus N Abtastwerten des Audiosignals zusammengesetzt sind, die durch ein Analysefenster (f_A) gewichtet sind, bei dem die aufeinander folgenden Blöcke dieser Untergruppe gegenseitige Zeitverschiebungen um M Abtastwerte aufweisen, wobei die Zahl M größer ist als N/2, wogegen die aufeinander folgenden Blöcke dieser Gruppe gegenseitige Zeitverschiebungen um M/p Abtastwerte aufweisen, wobei p eine Ganzzahl größer 1 ist, bei dem jeder zusammengesetzte Block der Gruppe verändert wird, indem eine Verarbeitung durchgeführt wird, die einer Division durch dieses Analysefenster (f_A) und einer Multiplikation mit einem Synthesefenster (f '_S) entspricht, und das decodierte Audiosignal (x and) als eine Summe zum Überlappen der veränderten Blöcke gebildet wird, und bei dem das Synthesefenster f '_s(i) einen Träger hat, der auf die Reihen i von N/2 - M/p bis N/2 + M/p begrenzt ist, da die Abtastwerte eines Blocks von 0 bis N-1 nummerierte Reihen i haben, und f '_s(i) + f '_s(i+M/p) = A für N/2 - M/p ≤ i < N/2 prüft, wobei A eine positive Konstante ist.
Verfahren nach einem der Ansprüche 1 bis 5,
bei dem für die nicht zur Untergruppe gehörenden Blöcke die interpolierten Cepstralkoeffizienten (cx_i[n-1/2]) auf der Basis von Daten (icx[n-1/2]) zur Quantisierung von Interpolationsfehlern (ecx_[n-1/2]) korrigiert werden, die in den Codierungsdaten enthalten sind.
Verfahren nach einem der Ansprüche 1 bis 5,
bei dem für die nicht zur Untergruppe gehörenden Blöcke die Cepstralkoeffizienten (cx_q[n]) durch einen Filter (128) interpoliert werden, der auf der Basis von Daten (iP) zur Quantisierung eines Interpolationsfilters bestimmt wird, die in den Codierungsdaten enthalten sind.
Audio-Decodierer mit Mitteln, die zum Durchführen eines Verfahrens nach einem der Ansprüche 1 bis 7 angeordnet sind.
Verfahren zum Codieren eines Audiosignals (x),
bei dem ein Spektrum des Audiosignals durch eine Transformation in den Frequenzbereich eines Blocks des Audiosignals bestimmt wird und einem digitalen Ausgangsdatenstrom (Φ) Daten hinzugefügt werden, die für Spektralamplituden repräsentativ sind, die wenigstens einigen der Frequenzen des Spektrums zugeordnet sind, bei dem das Spektrum des Audiosignals für eine Gruppe von aufeinander folgenden Blöcken von N Abtastwerten des Audiosignals bestimmt wird, und bei dem für jeden der Blöcke dieser Gruppe Cepstralkoeffizienten bestimmt werden, die wenigstens für einige der Spektralamplituden repräsentativ sind,
dadurch gekennzeichnet, dass die für die Spektralamplituden repräsentativen Daten in dem digitalen Ausgangsdatenstrom für nur eine Untergruppe der Blöcke enthalten sind, und dass für die nicht zu dieser Untergruppe gehörenden Blöcke dem digitalen Ausgangsdatenstrom (Φ) Daten (icx[n-1/2]) zur Quantisierung eines Interpolationsfehlers (ecx[n-1/2]) der Cepstralkoeffizienten hinzugefügt werden.
Verfahren zum Codieren eines Audiosignals (x), bei dem ein Spektrum des Audiosignals durch eine Transformation in den Frequenzbereich eines Blocks des Audiosignals bestimmt wird und einem digitalen Ausgangsdatenstrom (Φ) Daten hinzugefügt werden, die für Spektralamplituden repräsentativ sind, die wenigstens einigen der Frequenzen des Spektrums zugeordnet sind, bei dem das Spektrum des Audiosignals für eine Gruppe von aufeinander folgenden Blöcken von N Abtastwerten des Audiosignals bestimmt wird, und bei dem für jeden der Blöcke dieser Gruppe Cepstralkoeffizienten bestimmt werden, die für wenigstens einige der Spektralamplituden repräsentativ sind,
dadurch gekennzeichnet, dass die für die Spektralamplituden repräsentativen Daten in dem digitalen Ausgangsdatenstrom für nur eine Untergruppe der Blöcke enthalten sind, und dass für die nicht zu der Untergruppe gehörenden Blöcke ein optimaler Interpolationsfilter (128) für die Cepstralkoeffizienten bestimmt wird und dem digitalen Ausgangsdatenstrom (Φ) Daten (iP) hinzugefügt werden, die diesen optimalen Interpolationsfilter bilden.
Verfahren nach Anspruch 9 oder 10,
bei dem die für die Spektralamplituden repräsentativen Daten Daten zur Quantisierung der Ceptstralkoeffizienten umfassen.
Verfahren nach einem der Ansprüche 9 bis 11,
bei dem eine Grundfrequenz (F₀) des Audiosignals geschätzt wird, und bei dem die interpolierten Cepstralkoeffizienten Cepstralkoeffizienten umfassen, die durch Transformieren einer komprimierten oberen Einhüllenden (LX_sup) des Spektrums des Audiosignals in den Cepstralbereich berechnet werden.
Verfahren nach Anspruch 12,
bei dem die komprimierte obere Einhüllende (LX_sup) durch Interpolation von Spektralamplituden, die Vielfachfrequenzen der Grundfrequenz (F₀) zugeordnet sind, unter Anwendung einer Funktion zur Spektralkompression bestimmt wird.
Verfahren nach einem der Ansprüche 9 bis 13,
bei dem eine Grundfrequenz (F₀) des Audiosignals geschätzt wird, und bei dem die interpolierten Cepstralkoeffizienten Cepstralkoeffizienten umfassen, die durch Transformieren einer komprimierten unteren Einhüllenden (LX_inf) des Spektrums des Audiosignals in den Cepstralbereich berechnet werden.
Verfahren nach Anspruch 14,
bei dem die komprimierte untere Einhüllende (LX_inf) unter Anwendung einer Funktion zur Spektralkompression durch Interpolation von Spektralamplituden bestimmt wird, die Frequenzen zugeordnet sind, die in Bezug auf die Vielfachfrequenzen der Grundfrequenz (F₀) in Zwischenbereichen des Spektrums liegen.
Verfahren nach einem der Ansprüche 9 bis 15,
bei dem die aufeinander folgenden Blöcke der Untergruppe gegenseitige Zeitverschiebungen um mehr als N/2 Abtastwerte aufweisen, und die aufeinander folgenden Blöcke der Gruppe gegenseitige Zeitverschiebung um wenigstens N/2 Abtastwerte aufweisen.
Audio-Codierer mit Mitteln, die zum Durchführen eines Verfahrens nach einem der Ansprüche 9 bis 16 angeordnet sind.