EP0608174B1

EP0608174B1 - System zur prädiktiven Kodierung/Dekodierung eines digitalen Sprachsignals mittels einer adaptiven Transformation mit eingebetteten Kodes

Info

Publication number: EP0608174B1
Application number: EP94400109A
Authority: EP
Inventors: Bruno Lozach
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1993-01-21
Filing date: 1994-01-18
Publication date: 1998-08-12
Anticipated expiration: 2014-01-18
Also published as: US5583963A; DE69412294D1; DE69412294T2; EP0608174A1; FR2700632A1; FR2700632B1

Claims

System zur prädiktiven Kodierung eines digitalen Signals in ein digitales Signal mit eingebetteten Kodes, welches durch adaptive Transformation mit eingebetteten Kodes kodiert ist, wobei das kodierte digitale Signal aus einem kodierten Sprachsignal und gegebenenfalls aus einem Hilfsdatensignal gebildet ist, welches in das kodierte Sprachsignal nach Kodierung dieses letztgenannten eingefügt wird, wobei das System einen Wahrnehmungsbewertungsfilter (11) enthält, welcher durch eine die Erzeugung eines Wahrnehmungssignals
erlaubende Kurzzeit-Prädiktionsschleife gesteuert wird, und einen ein geschätztes Wahrnehmungssignal P and 1 / n liefernden Langzeit-Prädiktionskreis enthält, wobei dieser Langzeit-Prädiktionskreis eine Langzeit-Prädiktionsschleife bildet, die es erlaubt, vom Wahrnehmungssignal und vom geschätzten vergangenen Anregungssignal ausgehend ein modelliertes Wahrnehmungsanregungssignal zu liefem, und Mittel zur adaptiven Transformation und Quantisierung enthält, die es erlauben, vom Wahmehmungsanregungssignal ausgehend das kodierte Sprachsignal zu erzeugen, dadurch gekennzeichnet, daß der Wahrnehmungsbewertungsfilter aus einem Kurzzeit-Prädiktionsfilter für das zu kodierende Sprachsignal besteht, um eine Frequenzverteilung des Quantisierungsrauschens zu bewirken, daß es Mittel (12) zur Subtraktion des Beitrags des vergangenen Anregungssignals P and 0 / n vom Wahrnehmungssignal umfaßt, um ein aktualisiertes Wahrnehmungssignal P_n zu liefern, daß der Langzeit-Prädiktionskreis als geschlossene Schleife ausgehend von einem Verzeichnis ausgebildet ist, welches durch die der geringsten Rate entsprechende modellierte vergangene Anregung aktualisiert wird, was es erlaubt, eine optimale Wellenform und eine geschätzte mit dieser verbundene Verstärkung zu liefern, welche wesentlich sind für das geschätzte Wahrnehmungssignal, und daß die Transformationsmittel durch ein Modul zur orthonormierten Transformation gebildet sind, das ein Modul zur adaptiven orthogonalen Transformation und ein Modul zum progressiven Modellieren mittels orthogonaler Vektoren umfaßt, wobei diese Mittel zum progressiven Modellieren und der Langzeit-Prädiktionskreis es erlauben, für das kodierte Sprachsignal repräsentative Indizes zu liefern, wobei das System ferner Mittel (19) zum Einfügen angehängter Hilfsdaten in den Übertragungskanal umfaßt.
Kodiersystem nach Anspruch 1, dadurch gekennzeichnet, daß das Modul zur adaptiven orthogonalen Transformation umfaßt:

einen Filter, der eine Linearkombination der Basisvektoren bewirkt, die ausgehend von einer Zerlegung der darstellenden Matrix des Wahrnehmungsbewertungsfilters in singuläre Werte erhalten werden.
Kodiersystem nach Anspruch 2, dadurch gekennzeichnet, daß der Filter für jede darstellende Matrix W des Wahrnehmungsbewertungsfilters umfaßt:

ein erstes Matrixmodul U = (U₁,...,U_N) und

ein zweites Matrixmodul V = (V₁,...,V_N), wobei das erste und das zweite Matrixmodul die Relation U^TWV = D erfüllen, worin U^T das transponierte Matrixmodul des Moduls U bezeichnet, und worin D ein diagonales Matrixmodul ist, dessen Koeffizienten die singulären Werte bilden, wobei U_i und V_j den i-ten singulären linken Vektor beziehungsweise den j-ten singulären rechten Vektor bezeichnen, wobei die singulären rechten Vektoren {V_j} eine Orthonormalbasis bilden, was es erlaubt, den Vorgang der Filterung mittels Faltungsprodukt durch einen Vorgang der Filterung mittels einer Linearkombination zu transformieren.
Kodiersystem nach Anspruch 1, dadurch gekennzeichnet, daß das Modul zur orthonormierten Transformation aufgebaut ist aus:

einem zur Initialisierung durch Ziehung einer gaußschen Zufallsvariablen gebildeten Submodul zur stochastischen Transformation,

einem Modul zur globalen Mittelung über eine Mehrzahl von Vektoren, die aus einem prädiktiven Transformationskodierer stammen,

einem Modul zur Neuanordnung,

einem Modul zur Behandlung nach Gram-Schmidt, wobei eine Reiteration der Behandlungen durch die vorhergehenden Module es erlaubt, eine orthonormierte, außerhalb der Reihe durchgeführte, durch Erlernen gebildete Transformation zu erhatten,

aus einem Speicher vom Typ Lesespeicher, der es erlaubt, die orthonormierte Transformation in Gestalt transformierter Vektoren zu speichern.
Kodiersystem nach Anspruch 4, dadurch gekennzeichnet, daß die Transformation durch orthonormierte Wellenformen gebildet ist, deren Frequenzspektren Bandpässe und relativ zueinander geordnet sind, wobei die erste Wellenforrn aus den orthonormierten, relativ zueinander geordneten Wellenformen gleich der optimalen normierten Wellenform ist, die aus dem adaptiven Verzeichnis stammt, und daß die erste Komponente der geschätzten Verstärkung gleich der normierten Langzeitprädiktions-Verstärkung ist.
Kodiersystem nach Anspruch 2 und 5, dadurch gekennzeichnet, daß das adaptive Transformationsmodul umfaßt:

ein Householder-Transformationsmodul, welches das aus der optimalen Wellenform und der geschätzten Verstärkung gebildete geschätzte Wahrnehmungssignal p and 1 / 1 und das Wahrnehmungssignal empfängt, um ein transformiertes Wahrnehmungssignal P" in Gestalt eines Vektors des transformierten Wahrnehmungssignals mit Komponenten P"_k zu erzeugen,

eine Mehrzahl von N Registern zur Speicherung der orthonormierten Wellenformen, wobei die Mehrzahl der Register den Lesespeicher bildet, jedes Register vom Rang r N Speicherzellen umfaßt, und eine Komponente vom Rang k jedes Vektors in einer Zelle entsprechenden Rangs gespeichert ist,

eine die Mehrzahl von Speicherregistern bildende Mehrzahl von N jedem Register zugeordneten Multiplikatorkreisen, wobei jeder Multiplikatorkreis vom Rang k einerseits die Komponente vom Rang k des gespeicherten Vektors und andererseits die Komponente P"_k des Vektors des transformierten Wahrnehmungssignals vom Rang k empfängt, und das Produkt P"_k·f^k _orth(k) der Komponenten des Vektors des transformierten Wahrnehmungssignals liefert,

eine Mehrzahl von N-1 jedem Register vom Rang r zugeordneten Summierkreisen, wobei jeder Summierkreis vom Rang k das durch den Multiplikatorkreis des vorhergehenden Rangs gelieferte Produkt des vorhergehenden Rangs k-1 und das durch den Multiplikatorkreis des vorhergehenden Rangs gelieferte Produkt des entsprechenden Rangs k und das durch den Multiplikatorkreis vom gleichen Rang k gelieferte Produkt des entsprechenden Rangs k empfängt, wobei der Summierkreis des höchsten Rangs, N-1, eine Komponente g(r) der als Verstärkungsvektor G ausgedrückten geschätzten Verstärkung liefert.
System nach Anspruch 1, dadurch gekennzeichnet, daß das Modul zum progressiven Modellieren mittels orthogonaler Vektoren umfaßt:

ein Modul zur Normierung des Verstärkungsvektors, um mittels Vergleichs des normierten Werts des Verstärkungsvektors G hinsichtlich eines Schwellenwerts einen normierten Verstärkungsvektor Gk zu erzeugen, wobei das Modul zur Normierung es erlaubt, als Funktion des Grads des Modellierens ferner ein Signal von der Länge des normierten Verstärkungsvektors Gk in Richtung des Dekodiersystems zu erzeugen,

eine Stufe zum progressiven Modellieren mittels orthogonaler Vektoren, die genau gesagt den normierten Vektor Gk empfängt und die repräsentativen Indizes des kodierten Sprachsignals liefert, wobei die Indizes für die ausgewählten Vektoren und ihre zugeordneten Verstärkungen repräsentativ sind, wobei die Übertragung der durch die Indizes gebildeten Hilfsdaten durch Auslöschung der Teile des Rasters bewirkt wird, die den Indizes und Bereichsnummern zum Bilden des Hilfsdatensignals zugewiesen sind.
System zur prädiktiven Dekodierung mittels adaptiver Transformation eines kodierten digitalen Signals mit eingebetteten Kodes, wobei das kodierte digitale Signal aus einem kodierten Sprachsignal und gegebenenfalls aus einem Hilfsdatensignal besteht, welches in das kodierte Sprachsignal nach Kodierung dieses letztgenannten eingefügt wird, dadurch gekennzeichnet, daß es umfaßt:

Mittel zum Auslesen des Datensignals, die einerseits das Auslesen der Daten in Hinsicht auf eine Hilfsnutzung und andererseits die Übertragung der repräsentativen Indizes des kodierten Sprachsignals erlauben,

Mittel zum Modellieren des Sprachsignals bei minimaler Rate,

Mittel zum Modellieren des Sprachsignals bei wenigstens einer Rate, die höher als die minimale Rate ist.
Dekodiersystem nach Anspruch 8, dadurch gekennzeichnet, daß dieser Dekodierer außer dem System zum Datenauslesen umfaßt

ein erstes Modul zum Modellieren des Sprachsignals bei minimaler Rate, welches direkt das kodierte Signal empfängt und ein erstes geschätzes Sprachsignal S and 1 / n liefert,

ein zweites Modul zum Modellieren des Sprachsignals bei einer mittleren Rate, welches mit dem System zum Datenauslesen mit Hilfe von Mitteln zur bedingten Kommutation nach dem Kriterium des Werts der Indizes verbunden ist und ein zweites geschätztes Sprachsignal S and 2 / n liefert,

ein drittes Modul zum Modellieren des Sprachsignals bei einer maximalen Rate, welches mit dem System zum Datenauslesen mit Hilfe von Mitteln zur bedingten Kommutation nach dem Kriterium des Werts der Indizes verbunden ist und ein drittes geschätztes Sprachsignal S and 3 / n liefert,

einen Summierkreis, der an seinen Summiereingängen das erste, das zweite beziehungsweise das dritte geschätzte Sprachsignal empfängt und an seinem Ausgang ein resultierendes geschätztes Sprachsignal liefert, und mit dem Ausgang des Summierkreises in Kaskade verbunden

einen adaptiven Filterkreis, der das resultierende geschätzte Sprachsignal empfängt und ein wiederhergestelltes geschätztes Sprachsignal liefert, und einen Digital/Analog-Konverter, der das wiederhergestellte geschätzte Sprachsignal empfängt und ein wiederhergestelltes Audiofrequenz-Sprachsignal liefert.
Dekodiersystem nach Anspruch 9, dadurch gekennzeichnet, daß jedes der Module zum Modellieren des Sprachsignals bei minimaler, mittlerer oder maximaler Rate ein Submodul zur inversen adaptiven Transformation umfaßt, auf das ein inverser Wahrnehmungsbewertungsfilter folgt.