EP0782128B1

EP0782128B1 - Verfahren zur Analyse eines Audiofrequenzsignals durch lineare Prädiktion, und Anwendung auf ein Verfahren zur Kodierung und Dekodierung eines Audiofrequenzsignals

Info

Publication number: EP0782128B1
Application number: EP96402715A
Authority: EP
Inventors: Catherine Quinquis; Alain Le Guyader
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1995-12-15
Filing date: 1996-12-12
Publication date: 2000-06-21
Anticipated expiration: 2016-12-12
Also published as: JPH09212199A; DE69608947T2; US5787390A; KR970050107A; EP0782128A1; FR2742568B1; CN1159691A; DE69608947D1; FR2742568A1; KR100421226B1; JP3678519B2

Claims

Verfahren zur Analyse eines Tonfrequenzsignals (s⁰(n)) durch lineare Prädiktion der Ordnung M zur Bestimmung von Spektralparametern abhängig von einem Kurzzeitspektrum des Tonfrequenzsignals,
dadurch gekennzeichnet, daß das Verfahren unterteilt ist in q aufeinanderfolgende Prädiktionsstufen (5_p), wobei q eine ganze Zahl größer als 1 ist, und daß man in jeder Prädiktionsstufe p (1 ≤ p ≤ q) Parameter bestimmt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl Mp von linearen Prädiktionskoeffizienten a₁ ^p,..., a_Mp ^p eines Eingangssignals der Stufe repräsentieren, wobei das zu analysierende Tonfrequenzsignal das Eingangssignal (s⁰(n)) der ersten Stufe bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p gebildet ist, wobei für die Prädiktionsordnung M
gilt.
Analyseverfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Zahl Mp der linearen Prädiktionskoeffizienten von einer Stufe zur nächsten zunimmt.
Verfahren zur Codierung eines Tonfrequenzsignals, umfassend die folgenden Schritte:

Analysieren des in aufeinanderfolgende Blöcke digitalisierten Tonfrequenzsignals (s(n)) durch lineare Prädiktion zur Bestimmung von Parametern (LPC), welche ein Kurzzeitsynthesefilter (16) definieren,

Bestimmen von Anregungsparametern (k, β, LTP), welche ein Anregungssignal (u(n)) definieren, das zur Erzeugung eines das Tonfrequenzsignal repräsentierenden Synthesesignals (s and(n)) an das Kurzzeitsynthesefilter (16) anzulegen ist, und

Erzeugen von Quantisierungswerten der das Kurzzeitsynthesefilter definierenden Parameter und der Anregungsparameter,

dadurch gekennzeichnet, daß die Analyse durch lineare Prädiktion ein Vorgang in q aufeinanderfolgenden Stufen (5_p) ist, wobei q eine ganze Zahl größer als 1 ist, wobei dieser Vorgang in jeder Prädiktionsstufe p (1 ≤ p ≤ q) die Bestimmung von Parametern umfaßt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl Mp vom linearen Prädiktionskoeffizienten a₁ ^p,..., a_Mp ^p eines Eingangssignals der Stufe repräsentieren, wobei das zu codierende Tonfrequenzsignal (s(n)) das Eingangssignal (s⁰(n)) der ersten Stufe bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p gebildet ist, wobei das Kurzzeitsynthesefilter (16) eine Übertragungsfunktion der Form 1/A(z) mit
besitzt.
Codierverfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Zahl Mp der linearen Prädiktionskoeffizienten von einer Stufe zur nächsten zunimmt.
Codierverfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß zumindest einige der Anregungsparameter bestimmt werden, indem die Energie eines Fehlersignals minimiert wird, welches aus der Filterung der Differenz zwischen dem Tonfrequenzsignal (s(n)) und dem Synthesesignal (s and(n)) mittels mindestens eines Wahrnehmungswichtungsfilters (38) resultiert, dessen Übertragungsfunktion die Form W(z) = A(z/γ₁) / A(z/γ₂) besitzt, wobei γ₁ und γ₂ spektrale Ausdehnungskoeffizienten mit 0 ≤ γ₂ ≤ γ₁ ≤ 1 bezeichnen.
Codierverfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß zumindest einige der Anregungsparameter bestimmt werden, indem die Energie eines Fehlersignals minimiert wird, welches aus der Filterung der Differenz zwischen dem Tonfrequenzsignal (s(n)) und dem Synthesesignal (s and(n)) mittels mindestens eines Wahrnehmungswichtungsfilters (38) resultiert, dessen Übertragungsfunktion die Form
besitzt, wobei γ₁ ^p, γ₂ ^p Paare von spektralen Ausdehnungskoeffizienten mit 0 ≤ γ₂ ^p ≤ γ₁ ^p ≤ 1 für 1 ≤ p ≤ q bezeichnen.
Verfahren zur Decodierung eines binären Stroms zur Erzeugung eines durch den binären Strom codierten Tonfrequenzsignals,
dadurch gekennzeichnet, daß man:

Quantisierungswerte von Parametern (LPC), welche ein Kurzzeitsynthesefilter (16) definieren, und von Anregungsparametern (k, β, LTP) erhält, wobei die das Synthesefilter definierenden Parameter eine Zahl q, die größer als 1 ist, von Sätzen von linearen Prädiktionskoeffizienten (a_i ^p) repräsentieren, wobei jeder Satz p eine im voraus festgelegte Zahl Mp von Koeffizienten umfaßt,

auf Grundlage der Quantisierungswerte der Anregungsparameter ein Anregungssignal (u(n)) erzeugt und

ein synthetisiertes Tonfrequenzsignal (s and(n)) erzeugt, indem das Anregungssignal mittels eines Synthesefilters (16) mit einer Übertragungsfunktion der Form 1/A(z) mit
gefiltert wird, wobei die Koeffizienten a₁ ^p,..., a_Mp ^p dem p-ten Satz von linearen Prädiktionskoeffizienten entsprechen, wobei 1 ≤ p ≤ q.
Decodierverfahren nach Anspruch 7, dadurch gekennzeichnet, daß das synthetisierte Tonfrequenzsignal (s and(n)) an ein Nachfilter (17) angelegt wird, dessen Übertragungsfunktion (H_PF(z)) einen Term der Form A(z/β₁/A(zβ₂) umfaßt, wobei β₁ und β₂ Koeffizienten bezeichnen, für die 0 ≤ β₁ ≤ β₂ ≤ 1 gilt.
Decodierverfahren nach Anspruch 7, dadurch gekennzeichnet, daß das synthetisierte Tonfrequenzsignal (s and(n)) an ein Nachfilter (17) angelegt wird, dessen Übertragungsfunktion (H_PF(z)) einen Term der Form
umfaßt, wobei β₁ ^p, β₂ ^p Paare von Koeffizienten bezeichnen, für die 0 ≤ β₁ ^p ≤ β₂ ^p ≤ 1 für 1 ≤ p ≤ q gilt, und wobei A^p(z) für den p-ten Satz von linearen Prädiktionskoeffizienten die Funktion
repräsentiert.
Verfahren zur Codierung eines ersten, in aufeinanderfolgende Blöcke digitalisierten Tonfrequenzsignals, umfassend die folgenden Schritte:

Analysieren eines zweiten Tonfrequenzsignals (s and(n)) durch lineare Prädiktion zur Bestimmung von Parametern (LPC), welche ein Kurzzeitsynthesefilter (16) definieren,

Bestimmen von Anregungsparametern (k, β, LTP), welche ein Anregungssignal (u(n)) definieren, das zur Erzeugung eines das erste Tonfrequenzsignal repräsentierenden Synthesesignals (s and(n)) an das Kurzzeitsynthesefilter (16) anzulegen ist, wobei dieses Synthesesignal für mindestens einen nachfolgenden Block das zweite Tonfrequenzsignal bildet, und

Erzeugen von Quantisierungswerten der Anregungsparameter,

dadurch gekennzeichnet, daß die Analyse durch lineare Prädiktion ein Vorgang in q aufeinanderfolgenden Stufen (5_p) ist, wobei q eine ganze Zahl größer als 1 ist, wobei dieser Vorgang in jeder Prädiktionsstufe p (1 ≤ p ≤ q) die Bestimmung von Parametern umfaßt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl Mp von linearen Prädiktionskoeffizienten a₁ ^p,..., a_Mp ^p eines Eingangssignals der Stufe repräsentieren, wobei das zweite Tonfrequenzsignal (s and(n)) das Eingangssignal (s⁰(n)) der ersten Stufe bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p gebildet ist, wobei das Kurzzeitsynthesefilter (16) eine Übertragungsfunktion der Form 1/A(z) mit
besitzt.
Codierverfahren nach Anspruch 10, dadurch gekennzeichnet, daß die Zahl Mp von linearen Prädiktionskoeffizienten von einer Stufe zur nächsten zunimmt.
Codierverfahren nach Anspruch 10 oder 11, dadurch gekennzeichnet, daß zumindest einige der Anregungsparameter bestimmt werden, indem die Energie eines Fehlersignals minimiert wird, welches aus der Filterung der Differenz zwischen dem ersten Tonfrequenzsignal (s(n)) und dem Synthesesignal (s and(n)) mittels mindestens eines Wahrnehmungswichtungsfilters (38) resultiert, dessen Übertragungsfunktion die Form W(z) = A(z/γ₁)/A(z/γ₂) besitzt, wobei γ₁ und γ₂ spektrale Ausdehnungskoeffizienten bezeichnen, für die 0 ≤ γ₂ ≤ γ₁ ≤ 1 gilt.
Codierverfahren nach Anspruch 10 oder 11, dadurch gekennzeichnet, daß zumindest einige der Anregungsparameter bestimmt werden, indem die Energie eines Fehlersignals minimiert wird, welches aus der Filterung der Differenz zwischen dem ersten Tonfrequenzsignal (s(n)) und dem Synthesesignal (s and(n)) mittels mindestens eines Wahrnehmungswichtungsfilters (38) resultiert, dessen Übertragungsfunktion die Form
besitzt, wobei γ₁ ^p, γ₂ ^p Paare von spektralen Ausdehnungskoeffizienten bezeichnen, für die 0 ≤ γ₂ ^p ≤ γ₁ ^p ≤ 1 für 1 ≤ p ≤ q gilt.
Verfahren zur Decodierung eines binären Stroms zur Erzeugung eines durch den binären Strom codierten Tonfrequenzsignals in aufeinanderfolgenden Blöcken,
dadurch gekennzeichnet, daß man:

Quantisierungswerte von Anregungsparametern (k, β, LTP) erhält,

auf Grundlage der Quantisierungswerte der Anregungsparameter ein Anregungssignal (u(n)) erzeugt,

durch Filterung des Anregungssignals mittels eines Kurzzeitsynthesefilters (16) ein synthetisiertes Tonfrequenzsignal (s and(n)) erzeugt,

eine Analyse des synthetisierten Signals (s and(n)) durch lineare Prädiktion vornimmt, um für mindestens einen nachfolgenden Block Koeffizienten des Kurzzeitsynthesefilters (16) zu erhalten,

und daß die Analyse durch lineare Prädiktion ein Vorgang in q aufeinanderfolgenden Stufen (5_p) ist, wobei q eine ganze Zahl größer als 1 ist, wobei dieser Vorgang in jeder Prädiktionsstufe p (1 ≤ p ≤ q) die Bestimmung von Parametern umfaßt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl Mp von linearen Prädiktionskoeffizienten a₁ ^p,..., a_Mp ^p eines Eingangssignals der Stufe repräsentierten, wobei das synthetisierte Signal (s and(n)) das Eingangssignal (s⁰(n)) der ersten Stufe bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p gebildet ist, wobei das Kurzzeitsynthesefilter (16) eine Übertragungsfunktion der Form 1/A(z) mit
besitzt.
Decodierverfahren nach Anspruch 14, dadurch gekennzeichnet, daß das synthetisierte Tonfrequenzsignal (s(n)) an ein Nachfilter (17) angelegt wird, dessen Übertragungsfunktion (H_PF(z)) einen Term der Form A(z/β₁)/A(z/β₂) umfaßt, wobei β₁ und β₂ Koeffizienten bezeichnen, für die 0 ≤ β₁ ≤ β₂ ≤ 1 gilt.
Decodierverfahren nach Anspruch 14, dadurch gekennzeichnet, daß das synthetisierte Tonfrequenzsignal (s and(n)) an ein Nachfilter (17) angelegt wird, dessen Übertragungsfunktion (H_PF(z)) einen Term der Form
umfaßt, wobei β₁ ^p, β₂ ^p Paare von Koeffizienten bezeichnen, für die 0 ≤ β₁ ^p ≤ β₂ ^p ≤ 1 für 1 ≤ p ≤ q gilt.
Verfahren zur Codierung eines ersten, in aufeinanderfolgende Blöcke digitalisierten Tonfrequenzsignals,
dadurch gekennzeichnet, daß es die folgenden Schritte umfaßt:

Analysieren des ersten Tonfrequenzsignals (s(n)) durch lineare Prädiktion zur Bestimmung von Parametern (LPC/F), welche einen ersten Bestandteil eines Kurzzeitsynthesefilters (16) definieren,

Bestimmen von Anregungsparametern (k, β, LTP), welche ein Anregungssignal (u(n)) definieren, das zur Erzeugung eines das erste Tonfrequenzsignal repräsentierenden Synthesesignals (s and(n)) an das Kurzzeitsynthesefilter (16) anzulegen ist,

Erzeugen von Quantisierungswerten der den ersten Bestandteil des Kurzzeitsynthesefilters definierenden Parameter und der Anregungsparameter,

Filtern des Synthesesignals (s and(n)) mittels eines Filters mit einer Übertragungsfunktion, die der Inversen der Übertragungsfunktion des ersten Bestandteils des Kurzzeitsynthesefilters entspricht, und

Analysieren des gefilterten Synthesesignals (s and⁰(n)), um für mindestens einen nachfolgenden Block Koeffizienten eines zweiten Bestandteils des Kurzzeitsynthesefilters zu erhalten, und daß die Analyse des ersten Tonfrequenzsignals (s(n)) durch lineare Prädiktion ein Vorgang in q_F aufeinanderfolgenden Stufen (5_p) ist, wobei q_F eine ganze Zahl ist, die zumindest gleich 1 ist, wobei dieser q_F-stufige Vorgang in jeder Prädiktionsstufe p (1 ≤ p ≤ q_F) die Bestimmung von Parametern umfaßt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl MFp von linearen Prädiktionskoeffizienten a₁ ^F,p,..., a_MFp ^F,p eines Eingangssignals der Stufe repräsentieren, wobei das erste Tonfrequenzsignal (s(n)) das Eingangssignal (s⁰(n)) der ersten Stufe des q_F-stufigen Vorgangs bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 des q_F-stufigen Vorgangs von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p des q_F-stufigen Vorgangs gebildet ist, wobei der erste 3estandteil des Kurzzeitsynthesefilters (16) eine Übertragungsfunktion der Form 1/A^F(z) mit
besitzt,

und daß die Analyse des gefilterten Synthesesignals durch lineare Prädiktion ein Vorgang in q_B aufeinanderfolgenden Stufen (5p) ist, wobei q_B eine ganze Zahl ist, die wenigstens gleich 1 ist, wobei dieser q_B-stufige Vorgang in jeder Prädiktionsstufe p (1 ≤ p ≤ q_B) die Bestimmung von Parametern umfaßt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl MBp von linearen Prädiktionskoeffizienten a₁ ^B,p,..., a_MBp ^B,p eines Eingangssignals der Stufe repräsentieren, wobei das gefilterte Synthesesignal (s and⁰(n)) das Eingangssignal (s⁰(n)) der ersten Stufe des q_B-stufigen Vorgangs bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 des q_B-stufigen Vorgangs von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p des q_B-stufigen Vorgangs gebildet ist, wobei der zweite Bestandteil des Kurzzeitsynthesefilters (16) eine Übertragungsfunktion der Form 1/A^B(z) mit
besitzt und das Kurzzeitsynthesefilter (16) eine übertragungsfunktion der Form 1/A(z) mit A(z) = A^F(z)·A^B(z) besitzt.
Codierverfahren nach Anspruch 17, dadurch gekennzeichnet, daß zumindest einige der Anregungsparameter bestimmt werden, indem die Energie eines Fehlersignals minimiert wird, welches aus der Filterung der Differenz zwischen dem ersten Tonfrequenzsignal (s(n)) und dem Synthesesignal (s and(n)) mittels mindestens eines Wahrnehmungswichtungsfilters (38) resultiert, dessen Übertragungsfunktion die Form W(z)=A(z/γ₁)/A(z/γ₂) besitzt, wobei γ₁ und γ₂ spektrale Ausdehnungskoeffizienten bezeichnen, für die 0 ≤ γ₂ ≤ γ₁ ≤ 1 gilt.
Codierverfahren nach Anspruch 17, dadurch gekennzeichnet, daß zumindest einige der Anregungsparameter bestimmt werden, indem die Energie eines Fehlersignals minimiert wird, welches aus der Filterung der Differenz zwischen dem ersten Tonfrequenzsignal (s(n)) und dem Synthesesignal (s and(n)) mittels mindestens eines Wahrnehmungswichtungsfilters (38) resultiert, dessen Übertragungsfunktion die Form
besitzt, wobei γ₁ ^F,p, γ₂ ^F,p Paare von spektralen Ausdehnungskoeffizienten bezeichnen, für die 0 ≤ γ₂ ^F,p ≤ γ₁ ^F,p ≤ 1 für 1 ≤ p ≤ q_F gilt, und γ₁ ^B,p, γ₂ ^B,p Paare von spektralen Ausdehnungskoeffizienten bezeichnen, für die 0 ≤ γ₂ ^B,p ≤ γ₁ ^B,p ≤ 1 für 1 ≤ p ≤ q_B gilt.
Verfahren zur Decodierung eines binären Stroms zur Erzeugung eines durch den binären Strom codierten Tonfrequenzsignals in aufeinanderfolgenden Blöcken,
dadurch gekennzeichnet, daß man:

Quantisierungswerte von Parametern (LPC/F), welche einen ersten Bestandteil eines Kurzzeitsynthesefilters (16) definieren, und von Anregungsparametern (k, β, LTP) erhält, wobei die den ersten Bestandteil des Kurzzeitsynthesefilters definierenden Parameter eine Zahl q_F, die wenigstens gleich 1 ist, von Sätzen von linearen Prädiktionskoeffizienten a₁ ^F,p,..., a_MFp ^F,p für 1 ≤ p ≤ q_F repräsentieren, wobei jeder Satz p eine im voraus festgelegte Zahl MFp von Koeffizienten umfaßt, wobei der erste Bestandteil des Kurzzeitsynthesefilters (16) eine Übertragungsfunktion der Form 1/A^F(z) mit
besitzt,

auf Grundlage der Quantisierungswerte der Anregungsparameter ein Anregungssignal (u(n)) erzeugt,

ein synthetisiertes Tonfrequenzsignal (s and(n)) erzeugt, indem das Anregungssignal mittels eines Kurzzeitsynthesefilters (16) der Übertragungsfunktion 1/A(z) mit A(z) = A^F(z)·A^B(z), gefiltert wird, wobei 1/A^B(z) die Übertragungsfunktion eines zweiten Bestandteils des Kurzzeitsynthesefilters (16) repräsentiert,

das synthetisierte Signal (s and(n)) mittels eines Filters der Übertragungsfunktion A^F(z) filtert und

eine Analyse des gefilterten synthetisierten Signals (s and⁰(n)) durch lineare Prädiktion durchführt, um für mindestens einen nachfolgenden Block Koeffizienten des zweiten Bestandteils des Kurzzeitsynthesefilters (16) zu erhalten, und daß die Analyse des gefilterten synthetisierten Signals durch lineare Prädiktion ein Vorgang in q_B aufeinanderfolgenden Stufen (5_p) ist, wobei q_B eine ganze Zahl ist, die wenigstens gleich 1 ist, wobei dieser Vorgang in jeder Prädiktionsstufe p (1 ≤ p ≤ q_B) die Bestimmung von Parametern umfaßt, welche eine für die jeweilige Stufe p im voraus festgelegte Zahl MBp von linearen Prädiktionskoeffizienten a₁ ^B,p,..., a_MBp ^B,p eines Eingangssignals der Stufe repräsentieren, wobei das gefilterte synthetisierte Signal (s and⁰(n)) das Eingangssignal (s⁰(n)) der ersten Stufe bildet und das Eingangssignal (s^p(n)) einer Stufe p+1 von dem mittels eines Filters der Übertragungsfunktion
gefilterten Eingangssignal (s^p-1(n)) der Stufe p gebildet ist, wobei der zweite Bestandteil des Kurzzeitsynthesefilters (16) eine Übertragungsfunktion der Form 1/A^B(z) mit
besitzt.
Decodierverfahren nach Anspruch 20, dadurch gekennzeichnet, daß das synthetisierte Tonfrequenzsignal (s and(n)) an ein Nachfilter (17) angelegt wird, dessen Übertragungsfunktion (H_PF(z)) einen Term der Form A(z/β₁)/A(z/β₂) umfaßt, wobei β₁ und β₂ Koeffizienten bezeichnen, für die 0 ≤ β₁ ≤ β₂ ≤ 1 gilt.
Decodierverfahren nach Anspruch 20, dadurch gekennzeichnet, daß das synthetisierte Tonfrequenzsignal (s and(n)) an ein Nachfilter (17) angelegt wird, dessen Übertragungsfunktion (H_PF(z)) einen Term der Form
besitzt, wobei β₁ ^F,p, β₂ ^F,p Paare von Koeffizienten bezeichnen, für die 0 ≤ β₁ ^F,p ≤ β₂ ^F,p ≤ 1 für 1 ≤ p ≤ q_F gilt, und β₁ ^B,p, β₂ ^B,p Paare von Koeffizienten bezeichnen, für die 0 ≤ β₁ ^B,p ≤ β₂ ^B,p ≤ 1 für 1 ≤ p ≤ q_B gilt.