EP1836699B1

EP1836699B1 - Verfahren und Vorrichtung zur Ausführung einer optimalizierten Audiokodierung zwischen zwei Langzeitvorhersagemodellen

Info

Publication number: EP1836699B1
Application number: EP06709052A
Authority: EP
Inventors: Mohamed Ghenania; Claude Lamblin
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2005-01-11
Filing date: 2006-01-09
Publication date: 2011-06-29
Anticipated expiration: 2026-01-09
Also published as: WO2006075078A1; CN101124625B; FR2880724A1; US8670982B2; ATE515019T1; US20080306732A1; CN101124625A; EP1836699A1

Claims

Verfahren zum Codieren eines Audiosignals in einem zweiten Format anhand von Informationen, die durch Ausführen wenigstens eines Schrittes zum Codieren in einem ersten Format erhalten werden, wobei das erste und das zweite Format, insbesondere zum Codieren eines Sprachsignals, einen Schritt zum Suchen von LTP-Parametern zur langfristigen Vorhersage durch Untersuchen wenigstens eines Wörterbuchs, das Kandidatenparameter enthält, ausführen, wobei das erste und/oder das zweite Codierungsformat eine Filterung mit mehreren Koeffizienten für eine feine Suche von LTP-Parametern verwenden, dadurch gekennzeichnet, dass es die folgenden Schritte umfasst:
- Zugreifen auf Ergebnisse einer statistischen und/oder analytischen Untersuchung, die als Funktion aufeinander folgender Sätze von LTP-Parametern in dem ersten Codierungsformat ausgeführt werden, um eine Anzahl von Befehlen und geeignete Befehle in einem Wörterbuch, das das zweite Codierungsformat verwendet, zu bestimmen,

- Wiedergewinnen einer hypothetischen Information für die Partition des ersten Wörterbuchs, die eine Klasse der Partition betrifft, zu der ein während der Codierung in dem ersten Format erhaltener LTP-Parameter gehört und die nach der Bestimmung der LTP-Parameter während der Codierung in dem ersten Format erhalten wird, um wenigstens einen Befehl des Wörterbuchs zu wählen, das das zweite Codierungsformat verwendet,

- Anwenden des gewählten Befehls auf Kandidaten des Wörterbuchs, das das zweite Codierungsformat verwendet, um eine begrenzte Anzahl erster Kandidaten zu wählen, und

- zum Ausführen der zweiten Codierung Ausführen der LTP-Suche ausschließlich in der begrenzten Anzahl von Kandidaten.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass zunächst eine elementare Partition des ersten Wörterbuchs vorgesehen wird, die N Elemente in N disjunkten Klassen mit der Größe 1 enthält.
Verfahren nach Anspruch 1, wobei das erste Codierungsformat ein erstes Wörterbuch verwendet und das zweite Codierungsformat ein zweites Wörterbuch verwendet, dadurch gekennzeichnet, dass eine Partition des ersten Wörterbuchs in nicht disjunkten Klassen vorgesehen wird, derart, dass dasselbe Element mehr als einem Befehl des zweiten Wörterbuchs zugeordnet sein kann.
Verfahren nach einem der Ansprüche 1 bis 3, wobei das erste Codierungsformat ein erstes Wörterbuch verwendet und das zweite Codierungsformat ein zweites Wörterbuch verwendet, dadurch gekennzeichnet, dass eine Umgruppierung ähnlicher Befehle vorgesehen ist, um die anfängliche Partition des ersten Wörterbuchs und von hier aus die Anzahl von Befehlen des zweiten Wörterbuchs dynamisch zu modifizieren.
Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass außerdem eine Operation vorgesehen ist, die darin besteht, die Befehle des zweiten Wörterbuchs nacheinander neu zu berechnen, sobald sie umgruppiert worden sind, und dass die anfängliche Partition des ersten Wörterbuchs und/oder die auf diese Weise umgruppierten Befehle dynamisch modifiziert werden.
Verfahren nach einem der Ansprüche 4 bis 5, wobei das erste Codierungsformat ein erstes Wörterbuch verwendet und das zweite Codierungsformat ein zweites Wörterbuch verwendet, dadurch gekennzeichnet, dass für jeden der Befehle des zweiten Wörterbuchs eine zu berücksichtigende maximale Anzahl von Elementen des zweiten Wörterbuchs als Funktion der Klassen des ersten Wörterbuchs und/oder der Befehle des zweiten Wörterbuchs gewählt wird, um ein für die Speicherung der Befehle des zweiten Wörterbuchs verwendetes Speicherbetriebsmittel zu begrenzen.
Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die begrenzte Anzahl von Kandidaten als Funktion eines Kompromisses zwischen der Qualität und der Komplexität der zweiten Codierung gewählt wird.
Verfahren nach Anspruch 7, wobei ein zu codierendes Eingangssignal in Datenblöcken verarbeitet wird, dadurch gekennzeichnet, dass der Kompromiss bei jedem zu verarbeitenden Datenblock als Funktion von Parametern des ersten Codierungsformats und/oder von Charakteristiken des zu codierenden Signals und vorzugsweise als Funktion von LTP-Unterrahmen, die jeder Datenblock enthält, festgelegt wird.
Verfahren nach einem der Ansprüche 1 bis 8, wobei ein zu codierendes Eingangssignal in Datenblöcken verarbeitet wird, wovon jeder für das erste Codierungsformat erste LTP-Unterrahmen enthält und für das zweite Codierungsformat zweite LTP-Unterrahmen enthält, dadurch gekennzeichnet, dass für die ersten und zweiten Unterrahmen mit gleicher Dauer jedem momentanen Unterrahmen des zweiten Codierungsformats ein einziger Unterrahmen des ersten Codierungsformats entspricht, und dass:
- das erste Codierungsformat einen ersten Satz von LTP-Parametern für den momentanen Unterrahmen wählt,

- anhand der Partition nach Klassen des Wörterbuchs, die einem der LTP-Parameter des ersten Formats zugeordnet ist, ein Befehl zum Auswerten des Wörterbuchs des zweiten Formats gewählt wird, indem ein der Klasse des Elements des ersten Satzes zugeordneter Befehl gewählt wird, und

- gemäß dem auf diese Weise gewählten Befehl eine begrenzte Anzahl erster Kandidaten des Wörterbuchs des zweiten Formats untersucht wird.
Verfahren nach einem der Ansprüche 1 bis 8, wobei ein zu codierendes Eingangssignal in Datenblöcken verarbeitet wird, wovon jeder für das erste Codierungsformat erste LTP-Unterrahmen und für das zweite Codierungsformat zweite LTP-Unterrahmen enthält, dadurch gekennzeichnet, dass für erste und zweite Unterrahmen mit unterschiedlicher Dauer:
- das erste Codierungsformat mehrere Sätze von LTP-Parametern für erste Unterrahmen, die im Wesentlichen einem momentanen zweiten Unterrahmen entsprechen, wählt,

- anhand der Partition nach Klassen des Wörterbuchs, die einem der LTP-Parameter des ersten Formats zugeordnet ist, im Voraus Befehle zum Untersuchen des Wörterbuchs des zweiten Formats gewählt werden, indem die den Klassen der Elemente der Sätze von LTP-Parametern zugeordneten Befehle gewählt werden,

- anhand der Vorauswahl dieser Befehle wenigstens ein bevorzugter Befehl bestimmt wird und

- das Wörterbuch des zweiten Formats gemäß dem bevorzugten Befehl untersucht wird, indem eine Beschränkung auf seine ersten Elemente erfolgt.
Verfahren nach einem der vorhergehenden Ansprüche, wobei das erste Codierungsformat eine Filterung mit einem einzigen Koeffizienten für die ersten LTP-Unterrahmen verwendet, während das zweite Codierungsformat eine Filterung mit mehreren Koeffizienten für die zweiten LTP-Unterrahmen verwendet, dadurch gekennzeichnet, dass:
- für jeden ersten Unterrahmen durch Verwenden des ersten Codierungsformats ein Paar erster Parameter (λ_e, β_e) des LTP-Filters mit einem einzigen Koeffizienten bestimmt wird,

- für die Codierung eines momentanen zweiten Unterrahmens mehrere Paare von Parametern (λ_s, (β_i)_s) des LTP-Filters mit mehreren Koeffizienten auf der Grundlage des Satzes von Parametern (λ_e, β_e) des ersten Formats bestimmt werden, mit:
einer Bestimmung einer LTP-Verzögerung (λ_s), die vorzugsweise jener entspricht, die durch das erste Codierungsformat an einem ersten Unterrahmen bestimmt wird, die den momentanen zweiten Unterrahmen am weitesten abdeckt,

einer Bestimmung eines Vektors von Verstärkungen (β_i)_s für den momentanen zweiten Unterrahmen anhand wenigstens einer Verstärkung β_e der ersten Unterrahmen für die Ausführung der Schritte b), c) und d), wobei die Befehle des Wörterbuchs des zweiten Formats einer Gesamtheit von Verstärkungsvektoren (β_i)_s des zweiten Unterrahmens entsprechen.
Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass für die Codierung eines zweiten momentanen Unterrahmens:
- anhand erster LTP-Verstärkungen des ersten Formats (β_e), die für einen oder mehrere erste Unterrahmen gewählt werden, die einem zweiten momentanen Unterrahmen entsprechen, die Befehle des Wörterbuchs des zweiten Formats, die Klassen erster LTP-Verstärkungen zugeordnet sind, im Voraus gewählt werden,

- ein einziger dieser Befehle vorzugsweise dynamisch anhand der im Voraus gewählten Befehle für den zweiten momentanen Unterrahmen gebildet wird, und

- N erste Vektoren von zweiten Verstärkungen, die durch den gebildeten Befehl bestimmt werden, getestet werden, um gemäß einem gewählten Kriterium einen besten Verstärkungsvektor zu wählen, der dem zweiten Unterrahmen zugeordnet werden soll.
Verfahren nach einem der Ansprüche 1 bis 10, wobei das zweite Codierungsformat eine Filterung mit einem einzigen Koeffizienten für zweite LTP-Unterrahmen verwendet, während das erste Codierungsformat eine Filterung mit mehreren Koeffizienten für erste LTP-Unterrahmen verwendet, dadurch gekennzeichnet, dass:
- für jeden ersten Unterrahmen für die Verwendung des ersten Codierungsformats ein erster Satz von LTP-Parametern λ_e, (β_i)_e bestimmt wird, der einem Paar entspricht, das eine LTP-Verzögerung λ_e und einen Vektor (β_i)_e zugeordneter Verstärkungen des LTP-Filters mit mehreren Koeffizienten enthält,

- eine Partition eines Wörterbuchs von Verstärkungsvektoren (β_i)_e des ersten Formats ausgeführt wird,

- für die Codierung eines zweiten momentanen Unterrahmens mit dem zweiten Format Befehle eines Wörterbuchs des zweiten Formats für erste Unterrahmen, die dem zweiten momentanen Unterrahmen entsprechen, bestimmt werden, wobei das Wörterbuch des zweiten Formats aus einer Gesamtheit von Jitter-Werten gebildet ist und die Befehle dieses Wörterbuchs der Partition des Wörterbuchs des ersten Formats zugeordnet sind,

- ein Befehl der Jitter-Werte bestimmt wird und nacheinander Werte von LTP-Verzögerungen für das zweite Format an den Jitter-Werten, die auf diese Weise geordnet worden sind, und um eine oder mehrere Verankerungsverzögerungen, die als Funktion der Verzögerungen λ_e in den ersten Unterrahmen bestimmt werden, untersucht werden.
Verfahren nach einem der Ansprüche 1 bis 10, wobei das erste Codierungsformat eine Filterung mit mehreren Koeffizienten an ersten LTP-Unterrahmen verwendet und das zweite Codierungsformat eine Filterung mit mehreren Koeffizienten an zweiten LTP-Unterrahmen verwendet, dadurch gekennzeichnet, dass:
- anhand wenigstens eines ersten Satzes von Parametern, der durch das erste Format gewählt wird und wenigstens einem Vektor von Verstärkungen (β_i)_e enthält, der für wenigstens einen ersten Unterrahmen bestimmt wird, eine Partition des Wörterbuchs des ersten Formats vorgenommen wird, die einem Wörterbuch von Verstärkungsvektoren des ersten Formats (β_i)_e entspricht,

- daraus Befehle des Wörterbuchs des zweiten Formats abgeleitet werden, die einem Wörterbuch von Verstärkungsvektoren (β_i)_s des zweiten Formats entsprechen, wobei diese Befehle der Partition zugeordnet sind,

- anhand der Verstärkungsvektoren (β_i)_e, die mit dem ersten Format für erste Unterrahmen gewählt werden, die im Wesentlichen den momentanen zweiten Unterrahmen abdecken, im Voraus Befehle des zweiten Wörterbuchs gewählt werden, die Klassen dieser Partition zugeordnet sind,

- einer der im Voraus gewählten Befehle berücksichtigt wird,

- mehrere Verstärkungsvektoren, die dem zweiten momentanen Unterrahmen zugeordnet werden sollen, als Funktion des berücksichtigten Befehls bestimmt werden und

- durch Tests an den mehreren Verstärkungsvektoren der beste Verstärkungsvektor gemäß einem gewählten Kriterium ausgewählt wird.
Vorrichtung zum Codieren eines Audiosignals mit einem zweiten Format, die dazu ausgelegt ist, erhaltene Codierungsinformationen für die Ausführung einer Codierung mit einem ersten Format zu verwenden, wobei das erste und das zweite Format, insbesondere für das Codieren eines Sprachsignals, eine Suche von LTP-Parametern zur langfristigen Vorhersage durch Untersuchen eines Wörterbuchs, das Kandidatenparameter enthält, ausführen, wobei das erste und/oder das zweite Codierungsformat eine Filterung mit mehreren Koeffizienten für eine feine Suche von LTP-Parametern verwenden, dadurch gekennzeichnet, dass sie umfasst:
- einen Speicher, der eine Korrespondenztabelle speichert, die als Funktion von LTP-Parametern, die durch das erste Codierungsformat bestimmt werden, Befehle eines Wörterbuchs definiert, das das zweite Codierungsformat verwendet, wobei die Korrespondenztabelle anhand von Ergebnissen einer statistischen und/oder analytischen Untersuchung definiert ist, die als Funktion von aufeinander folgenden Sätzen von LTP-Parametern mit dem ersten Codierungsformat vorgenommen wird, um eine Anzahl von Befehlen und geeignete Befehle in einem Wörterbuch, das das zweite Codierungsformat verwendet, zu bestimmen,

- Mittel, um ein Signal wiederzugewinnen, das wenigstens eine hypothetische Information für die Partition des ersten Wörterbuchs angibt, die eine Klasse der Partition betrifft, zu der ein LTP-Parameter gehört, der während der Codierung mit dem ersten Format erhalten wird, und die nach der Bestimmung von LTP-Parametern während einer Codierung mit dem ersten Format erhalten wird, um wenigstens einen Befehl des Wörterbuchs zu wählen, das das zweite Codierungsformat verwendet,

- aktive Mittel zum Empfangen des Signals, um die Korrespondenztabelle abzufragen und um wenigstens einen Befehl des Wörterbuchs, das das zweite Codierungsformat verwendet, zu wählen,

- Rechenmittel, um:
das Wörterbuch, das das zweite Codierungsformat verwendet, gemäß dem gewählten Befehl zu ordnen, um eine begrenzte Anzahl erster Kandidaten in dem Wörterbuch zu wählen, und

die Codierung mit dem zweiten Format fortzusetzen, indem die LTP-Suche ausschließlich in dieser begrenzten Anzahl von Kandidaten vorgenommen wird.
Codierungsverfahren, das wenigstens ein erstes und ein zweites Codierungsformat verwendet, dadurch gekennzeichnet, dass es wenigstens eine Vorrichtung für die Codierung mit dem ersten Format und eine Codierungsvorrichtung nach Anspruch 15, die das zweite Format anwendet, umfasst.
Computerprogrammprodukt, das in einem Speicher einer Verarbeitungseinheit oder in einem entnehmbaren Träger, der dazu vorgesehen ist, mit einem Lesegerät der Verarbeitungseinheit zusammenzuwirken, gespeichert ist oder das von einem entfernten Ort fernladbar ist, dadurch gekennzeichnet, dass es Befehle für die Ausführung aller oder einiger Schritte des Verfahrens nach einem der Ansprüche 1 bis 14 enthält.