DE69922388T2 - Linear-prädiktives Analyse-durch-Synthese-Kodierverfahren und Kodierer - Google Patents

Linear-prädiktives Analyse-durch-Synthese-Kodierverfahren und Kodierer Download PDF

Info

Publication number
DE69922388T2
DE69922388T2 DE69922388T DE69922388T DE69922388T2 DE 69922388 T2 DE69922388 T2 DE 69922388T2 DE 69922388 T DE69922388 T DE 69922388T DE 69922388 T DE69922388 T DE 69922388T DE 69922388 T2 DE69922388 T2 DE 69922388T2
Authority
DE
Germany
Prior art keywords
vector
encoder
subframes
gains
subframe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69922388T
Other languages
English (en)
Other versions
DE69922388D1 (de
Inventor
Erik Ekudden
Roar Hagen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20412633&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69922388(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE69922388D1 publication Critical patent/DE69922388D1/de
Publication of DE69922388T2 publication Critical patent/DE69922388T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft ein Codierungsverfahren und einen Codierer mit linearer prädiktiven Analyse-durch-Synthese (LPAS = Linear Predictive Analysis-by-Synthesis).
  • HINTERGRUND DER ERFINDUNG
  • Das vorherrschende Codierermodell bei einer zellularen Anwendung ist die Technologie einer codeerregten linearen Prädiktion (CELP = Code Excited Linear Prediction). Für diese Wellenformanpassungsprozedur ist es bekannt, dass sie wenigstens für Bitraten von sagen wir 8 kb/s oder darüber gut arbeitet. Wenn jedoch die Bitrate erniedrigt wird, wird die Codierungseffizienz geringer, da die Anzahl von Bits, die für jeden Parameter verfügbar sind, kleiner wird und die Quantisierungsgenauigkeit leidet.
  • [1] und [2] schlagen Verfahren zur kollektiven Vektorquantisierung eines Verstärkungsparameters vor, der sich auf Information über mehrere Unterframes bezieht. Jedoch berücksichtigen diese Verfahren nicht die internen Zustände des Codierers und Decodierers. Das Ergebnis wird darin bestehen, dass sich das decodierte Signal bei dem Decodierer von dem optimalen synthetisierten Signal beim Codierer unterscheiden wird.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Eine Aufgabe der vorliegenden Erfindung ist ein auf einer linearen prädiktiven Analyse-durch-Synthese (LPAS) CELP basierendes Codierungsverfahren und ein Codierer, die bei niedrigen Bitraten, wie typischerweise bei Bitraten unter 8 kbits/s, effizient sind und die ihre internen Zustände mit denjengen des Decodierers synchronisieren.
  • Diese Aufgabe wird gemäß den beigefügten Ansprüchen gelöst.
  • Kurz gesagt erhöht die vorliegende Erfindung die Codierungseffizienz durch eine Vektorquantisierung von optimalen Verstärkungsparametern von mehreren Unterframes. Darauffolgend werden die internen Codiererzustände unter Verwendung der einer Vektorquantisierung unterzogenen Verstärkungen aktualisiert. Dies reduziert die Anzahl von Bits, die zum Codieren eines Frames erforderlich sind, während die Synchronisation zwischen internen Zuständen des Codierers und Decodierers beibehalten wird.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung, zusammen mit weiteren Aufgaben und Vorteilen von ihr, kann am besten durch Bezugnahme auf die folgende Beschreibung verstanden werden, genommen zusammen mit den beigefügten Zeichnungen, wobei:
  • 1 ein Blockdiagramm ist, das einen typischen LPAS-Codierer nach dem Stand der Technik darstellt;
  • 2 ein Ablaufdiagramm ist, das das Verfahren gemäß der vorliegenden Erfindung darstellt; und
  • 3 ein Blockdiagramm ist, das ein Ausführungsbeispiel eines LPAS-Codierers gemäß der vorliegenden Erfindung darstellt.
  • DETAILLIERTE BESCHREIBUNG BEVORZUGTER AUSFÜHRUNGSBEISPIELE
  • Zum besseren Verstehen der vorliegenden Erfindung wird diese Beschreibung mit einer kurzen Beschreibung eines typischen LPAS-Codierers beginnen.
  • 1 ist ein Blockdiagramm, das einen solchen typischen LPAS-Codierer nach dem Stand der Technik darstellt. Der Codierer weist einen Analyseteil und einen Syntheseteil auf.
  • Im Analyseteil empfängt ein linearer Prädiktor 10 Sprachframes s (typischerweise 20 ms von Sprache, abgetastet bei 8000 Hz) und bestimmt Filterkoeffizienten zum Steuern nach einer Quantisierung in einem Quantisierer 12, eines Synthesefilters 12 (typischerweise ein Allpolfilter der Größenordnung 10). Die nicht quantisierten Filterkoeffizienten werden auch zum Steuern eines Gewichtungsfilters 16 verwendet.
  • Im Syntheseteil werden Codevektoren von einem adaptiven Codebuch 18 und einem festen Codebuch 20 jeweils in Saklierungselementen 22 und 24 skaliert, und die skalierten Vektoren werden in einem Addierer 26 addiert, um einen Erregungsvektor zu bilden, der ein Synthesefilter 14 erregt. Dies resultiert in einem synthetischen Sprachsignal. Eine Rückkoppelleitung 28 aktualisiert das adaptive Codebuch 18 mit neuen Erregungsvektoren.
  • Ein Addierer 30 bildet die Differenz e zwischen dem aktuellen Sprachsignal s und dem synthetischen Sprachsignal s ^. Dieses Fehlersignal e wird im Gewichtungsfilter 16 gewichtet, und das gewichtete Filtersignal ew wird zu einem Suchalgorithmusblock 32 weitergeleitet. Der Suchalgorithmusblock 32 bestimmt die beste Kombination von Codevektoren ca, cf aus den Codebüchern 18, 20 und von Verstärkungen ga, gf in den Skalierungselementen 22, 24 über Steuerleitungen 34, 36, 38 bzw. 40 durch Minimieren des Entfernungs- bzw. Abstandsmaßes D = ||ew||2 = ||W·(s – s ^)|| = ||W·s – W·H·(ga·ca + gf·cf)||2 (1)über einem Frame. Hier bezeichnet W eine Gewichtungsfiltermatrix und bezeichnet H eine Synthesefiltermatrix.
  • Der Suchalgorithmus kann wie folgt zusammengefasst werden:
  • Für jeden Frame:
    • 1. Berechnen des Synthesefilters 14 durch eine lineare Prädiktion und Quantisieren der Filterkoeffizienten.
    • 2. Interpolieren der Koeffizienten linearer Prädiktion zwischen dem aktuellen und dem vorherigen Frame (in irgendeinem Bereich, z.B. den Linienspektrumsfrequenzen), um Koeffizienten linearer Prädiktion für jeden Unterframe zu erhalten (typischerweise 5 ms von Sprache, abgetastet mit 8000 Hz, d.h. 40 Abtastungen). Das Gewichtungsfilter 16 wird aus den Filterkoeffizienten linearer Prädiktion berechnet.
  • Für jeden Unterframe innerhalb des Frames:
    • 1. Finden eines Codevektors ca durch ein Durchsuchen des adaptiven Codebuchs 18 unter der Annahme, dass gf Null ist und dass ga gleich dem optimalen (nicht quantisierten) Wert ist.
    • 2. Finden eines Codevektors cf durch ein Durchsuchen des festen Codebuchs 20 und unter Verwendung des Codevektors ca und der Verstärkung ga, die im vorherigen Schritt gefunden sind. Für die Verstärkung gf wird angenommen, dass sie gleich dem (nicht quantisierten) optimalen Wert ist.
    • 3. Quantisieren der Verstärkungsfaktoren ga und gf. Das Quantisierungsverfahren kann entweder eine skalare Quantisierung oder eine Vektorquantisierung sein.
    • 4. Aktualisieren des adaptiven Codebuchs 18 mit einem aus ca und cf und den quantisierten Werten von ga und gf erzeugten Erregungssignal. Aktualisieren des Zustands des Synthese- und Gewichtungsfilters.
  • Bei der beschriebenen Struktur wird jeder Unterframe getrennt codiert. Dies macht es einfach, den Codierer und den Decodierer zu synchronisieren, was ein wesentliches Merkmal einer LPAS-Codierung ist. Aufgrund der getrennten Codierung von Unterframes werden die internen Zustände des Decodierers, der dem Syntheseteil eines Codierers entspricht, auf dieselbe Weise während eines Decodierens aktualisiert, wie die internen Zustände des Codierens während eines Codierens aktualisiert wurden. Dies synchronisiert die internen Zustände des Codierers und des Decodierers. Jedoch ist es auch wünschenswert, die Verwendung einer Vektorquantisierung um so viel wie möglich zu erhöhen, da dieses Verfahren dafür bekannt ist, dass es eine genaue Codierung bei niedrigen Bitraten ergibt. Wie es nachfolgend gezeigt werden wird, ist es gemäß der vorliegenden Erfindung möglich, Verstärkungen in mehreren Unterframes gleichzeitig einer Vektorquantisierung zu unterziehen und noch eine Synchronisation zwischen einem Codierer und einem Decodierer beizubehalten.
  • Die vorliegende Erfindung wird nun unter Bezugnahme auf die 2 und 3 beschrieben werden.
  • 2 ist ein Ablaufdiagramm, das das Verfahren gemäß der vorliegenden Erfindung darstellt. Der folgende Algorithmus kann zum Codieren von 2 aufeinanderfolgenden Unterframes verwendet werden (unter der Annahme, dass eine lineare Prädiktionsanalyse, eine Quantisierung und eine Interpolation bereits gemäß dem Stand der Technik durchgeführt worden sind):
    • S1. Finden des besten adaptiven Codebuchvektors ca1 (einer Unterframelänge) für einen Unterframe 1 durch Minimieren des gewichteten Fehlers: DA1 = ||sw1 – s ~w1||2 = ||W1·s1 – W1·H1·ga1·ca1||2 (2)des Unterframes 1. Hier bezieht sich "1" in der gesamten Gleichung (2) auf den Unterframe 1. Weiterhin ist angenommen, dass der optimale (nicht quantisierte) Wert von ga1 verwendet wird, wenn jeder mögliche Vektor ca1 ausgewertet wird.
    • S2. Finden des besten festen Codebuchvektors cf1 für den Unterframe 1 durch Minimieren des gewichteten Fehlers: DF1 = ||sw1 – s ~w1||2 = ||W1·s1 – W1·H1·(ga1·ca1 + gf1·cf1)||2 (3)unter der Annahme, dass der optimale Wert gf1 verwendet wird, wenn jeder mögliche Vektor cf1 ausgewertet wird. In diesem Schritt werden der Vektor ca1, der im Schritt S1 bestimmt wurde, und der optimale Wert ga1 verwendet.
    • S3. Speichern einer Kopie des aktuellen adaptiven Codebuchzustands, des aktuellen Synthesefilterzustands sowie des aktuellen Gewichtungsfilterzustands. Das adaptive Codebuch ist ein FIFO-(First-In-First-Out)-Element. Der Zustand dieses Elements wird durch die Werte dargestellt, die gegenwärtig im FIFO sind. Ein Filter ist eine Kombination aus Verzögerungselementen, Skalierungselementen und Addierern. Der Zustand eines Filters wird durch die aktuellen Eingangssignale zu den Verzögerungselementen und die Skalierungswerte (Filterkoeffizienten) dargestellt.
    • S4. Aktualisieren des adaptiven Codebuchzustands, des Synthesefilterzustands sowie des Gewichtungsfilterzustands unter Verwendung des temporären Erregungsvektors x ~1 = ga1·ca1 + gf1·cf1des Unterframes 1, der in den Schritten S1 und S2 gefunden ist. Somit wird dieser Vektor in das adaptive Codebuch verschoben (und ein Vektor derselben Länge wird aus dem adaptiven Codebuch am anderen Ende herausgeschoben. Der Synthesefilterzustand und der Gewichtungsfilterzustand werden durch Aktualisieren der jeweiligen Filterkoeffizienten mit ihren interpolierten Werten und durch Zuführen dieses Erregungsvektors durch Synthesefilter und des resultierenden Fehlervektors durch das Gewichtungsfilter aktualisiert.
    • S5. Finden des besten adaptiven Codebuchvektors ca2 für einen Unterframe 2 durch Minimieren des gewichteten Fehlers: DA2 = ||sw2 – s ~w2||2 = ||W2·s2 – W2·H2·ga2·ca2||2 (4)des Unterframes 2. Hier bezieht sich "2" in der gesamten Gleichung (4) auf den Unterframe 2. Weiterhin ist angenommen, dass der (nicht quantisierte) optimale Wert von ga2 verwendet wird, wenn jeder mögliche Vektor ca2 ausgewertet wird.
    • S6. Finden des besten festen Codebuchvektors cf2 für den Unterframe 2 durch Minimieren des gewichteten Fehlers: DF2 = ||sw2 – s ~w2||2 = ||W2·s2 – W2·H2·(ga2·ca2 + gf2·cf2)||2 (5)unter der Annahme, dass der optimale Wert gf2 verwendet wird, wenn jeder mögliche Vektor cf2 ausgewertet wird. In diesem Schritt werden der Vektor ca2, der im Schritt S5 bestimmt wurde, und der optimale Wert ga2 verwendet.
    • S7. Unterziehen aller 4 Verstärkungen ga1, gf1, ga2 und gf2 einer Vektorquantisierung. Der entsprechende quantisierte Vektor [g ^a1 g ^f1 g ^a2 g ^f2] wird aus einem Verstärkungscodebuch durch den Vektorquantisierer erhalten. Dieses Codebuch kann dargestellt werden als:
      Figure 00080001
      wobei ci(0), ci(1), ci(2) und ci(3) die spezifischen Werte sind, zu welchen die Verstärkungen quantisiert werden können. Somit wird ein Index i, der von 0 bis N-1 variiert werden kann, ausgewählt, um alle vier Verstärkungen darzustellen, und die Aufgabe des Vektorquantisierers besteht im Finden dieses Index. Dies wird durch Minimieren des folgenden Ausdrucks erreicht: DG = α·DG1 + β· DG2 (7)wobei α, β Konstanten sind und die Verstärkungsquantisierungskriterien für den 1-ten und 2-ten Unterframe gegeben sind durch: DG1 = ||sw1 – s ~w1||2 = ||W1·s1 – W1·H1·(ci(0)·ca1 + ci(1)·cf1)||2 (8) DG2 = ||sw2 – s ~w2||2 = ||W2·s2 – W2·H2·(ci(2)·ca2 + ci(3)·cf2)||2 (9) Daher gilt:
      Figure 00090001
      und [g ^a1 g ^f1 g ^a2 g ^f2]T = [cj(0) cj(1) cj(2) cj(3)]T (11)
    • S8. Wiederherstellen des adaptiven Codebuchzustands, des Synthesefilterzustands und des Gewichtungsfilterzustands durch Wiedergewinnen der im Schritt S3 gespeicherten Zustände.
    • S9. Aktualisieren des adaptiven Codebuchs, des Synthesefilters und des Gewichtungsfilters unter Verwendung der schließlichen Erregung für den 1-ten Unterframe, und zwar dieses Mal mit quantisierten Verstärkungen, d.h. x ~1 = g ^a1·ca1 + g ^f1·cf1.
    • S10. Aktualisieren des adaptiven Codebuchs, des Synthesefilters und des Gewichtungsfilters unter Verwendung der schließlichen Erregung für den 2-ten Unterframe, und zwar dieses Mal mit quantisierten Verstärkungen, d.h. x ~2 = g ^a2·ca2 + g ^f2·cf2.
  • Der Codierungsprozess ist nun für beide Unterframes beendet. Der nächste Schritt besteht im Wiederholen der Schritte S1–S10 für die nächsten 2 Unterframes, oder dann, wenn das Ende eines Frames erreicht worden ist, im Beginnen eines neuen Codierungszyklus mit linearer Prädiktion des nächsten Frames.
  • Der Grund für ein Speichern und ein Wiederherstellen von Zuständen des adaptiven Codebuchs, des Synthesefilters und des Gewichtungsfilters besteht darin, dass noch nicht quantisierte (optimale) Verstärkungen zum Aktualisieren dieser Elemente im Schritt S4 verwendet werden. Jedoch sind diese Verstärkungen beim Decodierer nicht verfügbar, da sie aus dem aktuellen Sprachsignal s berechnet werden. Statt dessen werden nur die quantisierten Verstärkungen beim Decodierer verfügbar sein, was bedeutet, dass die richtigen internen Zustände nach einer Quantisierung der Verstärkungen beim Codierer neu erzeugt werden müssen. Sonst werden der Codierer und der Decodierer nicht dieselben internen Zustände haben, was in unterschiedlichen synthetischen Sprachsignalen beim Codierer und beim Decodierer für dieselben Sprachparameter resultieren würde.
  • Die Gewichtungsfaktoren α, β in den Gleichungen (7) und (10) sind enthalten, um die relative Wichtigkeit des 1-ten und 2-ten Unterframes zu berücksichtigen. Sie werden vorteilhaft durch die Energieparameter bestimmt, so dass Unterframes hoher Energie zu einem niedrigeren Gewicht als Unterframes niedriger Energie werden. Dies verbessert eine Leistungsfähigkeit bei Onsets (Start eines Wortes) und Offsets (Ende eines Wortes). Andere Gewichtungsfaktoren, die beispielsweise auf einer Sprachgebung während keiner Onset- oder Offset-Segmente basieren, sind auch möglich. Ein geeigneter Algorithmus für diesen Gewichtungsprozess kann zusammengefasst werden als:
    Wenn die Energie des Unterframes 2 > 2-mal die Energie des Unterframes 1
    dann lass α = 2β sein
    Wenn die Energie des Unterframes 2 > 0,25-mal die Energie des Unterframes 1
    dann lass α = 0,5β sein
    sonst lass α = β sein
  • 3 ist ein Blockdiagramm, das ein Ausführungsbeispiel eines LPAS-Codierers gemäß der vorliegenden Erfindung darstellt. Elemente 1040 entsprechen ähnlichen bzw. gleichen Elementen in 1. Jedoch ist der Suchalgorithmusblock 32 durch einen Suchalgorithmusblock 50 ersetzt worden, der zusätzlich zu den Codebüchern und den Skalierungselementen Speicherblöcke 52, 54, 56 und einen Vektorquantisierer 58 über jeweilige Steuerleitungen 60, 62, 64 und 66 steuert. Die Speicherblöcke 52, 54 und 56 werden jeweils zum Speichern und Wiederherstellen von Zuständen des adaptiven Codebuchs 18, des Synthesefilters 14 und des Gewichtungsfilters 16 verwendet. Der Vektorquantisierer 58 findet den besten Verstärkungsquantisierungsvektor aus einem Verstärkungscodebuch 68.
  • Die Funktionalität des Algorithmussuchblocks 50 und des Vektorquantisierers 58 ist beispielsweise als ein oder mehrere Mikroprozessoren oder Mikro/Signalprozessor-Kombinationen implementiert.
  • In der obigen Beschreibung ist angenommen worden, dass Verstärkungen von 2 Unterframes einer Vektorquantisierung unterzogen werden. Wenn ein Erhöhen der Komplexität akzeptierbar ist, kann eine weitere Leistungsverbesserung durch Ausdehnen dieser Idee und durch eine Vektorquantisierung der Verstärkungen von allen Unterframes eines Sprachframes erhalten werden. Dies erfordert eine Rückführung von mehreren Unterframes, um die richtigen internen Endzustände im Codierer nach einer Vektorquantisierung der Verstärkungen zu erhalten.
  • Somit ist gezeigt worden, dass eine Vektorquantisierung von Verstärkungen über Unterframegrenzen möglich ist, ohne die Synchronisation zwischen einem Codierer und einem Decodierer zu opfern. Dies verbessert signifikant eine Kompressionsleistungsfähigkeit und lässt signifikante Bitrateneinsparungen zu. Beispielsweise ist herausgefunden worden, dass dann, wenn 6 Bits für eine 2-dimensionale Vektorquantisierung von Verstärkungen in jedem Unterframe verwendet werden, 8 Bits bei einer 4-dimensionalen Vektorquantisierung von Verstärkungen von 2 Unterframes ohne einen Verlust an Qualität verwendet werden können. Somit werden 2 Bits pro Unterframe eingespart (½(2·6 – 8)). Dies entspricht 0,4 kbits/s für Unterframes von 5 ms, was eine sehr signifikante Einsparung bei niedrigen Bitraten ist (beispielsweise unterhalb von 8 kbits/s).
  • Es ist zu beachten, dass keine zusätzliche algorithmische Verzögerung eingeführt wird, da eine Verarbeitung nur bei einem Unterframe und nicht auf einer Frameebene geändert wird. Weiterhin ist diese geänderte Verarbeitung nur mit einer geringen Erhöhung bezüglich der Komplexität verbunden.
  • Das bevorzugte Ausführungsbeispiel, das eine Fehlergewichtung zwischen Unterframes (α, β) enthält, führt zu einer verbesserten Sprachqualität.
  • Es wird von Fachleuten auf dem Gebiet verstanden werden, dass verschiedene Modifikationen und Änderungen an der vorliegenden Erfindung ohne Abweichung von ihrem Schutzumfang durchgeführt werden können, der durch die beigefügten Ansprüche definiert ist.
  • REFERENZEN
    • [1] EP 0 764 939 (AT & T), Seite 9, Absatz A – Seite 7.
    • [2] EP 0 684 705 (Nippon Telegraph & Telephone), Spalte 39, Zeile 17 – Spalte 40, Zeile 4

Claims (14)

  1. Lineares prädiktives Analyse-durch-Synthese Kodierungsverfahren, gekennzeichnet durch Bestimmen unquantisierter Werte von Gewinnen einer Vielzahl von Unterrahmen; Vektorquantisieren der unquantisierten Gewinne; und Aktualisieren interner Kodiererzustände unter Verwendung der vektorquantisierten Gewinne.
  2. Verfahren nach Anspruch 1, gekennzeichnet durch Speichern eines internen Kodiererzustands nach der Kodierung eines Unterrahmens mit unquantisierten Gewinnen; Wiederherstellen des internen Kodiererzustands nach der Vektorquantisierung der Gewinne mehrerer Unterrahmen; und Aktualisieren der internen Kodiererzustände durch Verwenden bestimmter Kodebuch-Vektoren und der vektorquantisierten Gewinne.
  3. Verfahren nach Anspruch 2, gekennzeichnet durch die internen Filterzustände, die einen adaptiven Kodebuchzustand, einen Synthesefilterzustand und einen Gewichtungsfilterzustand enthalten.
  4. Verfahren nach Anspruch 1, 2 oder 3, gekennzeichnet durch Vektorquantisieren der Gewinne zweier Unterrahmen.
  5. Verfahren nach Anspruch 1, 2 oder 3, gekennzeichnet durch Vektorquantisieren aller Gewinne aller Unterrahmen des Rahmens.
  6. Verfahren nach Anspruch 1, gekennzeichnet durch: Gewichtungs-Fehlerbeiträge verschiedener Unterrahmen durch Gewichtungsfaktoren; und Minimieren der Summe der Gewichtungs-Fehlerbeiträge.
  7. Verfahren nach Anspruch 6, gekennzeichnet durch die Abhängigkeit jedes Gewichtungsfaktors von der Energie seines entsprechenden Unterrahmens.
  8. Linearer prädiktiver Analyse-durch-Synthese Kodierer, gekennzeichnet durch einen Suchalgorithmus-Block (50) zum Bestimmen unquantisierter Werte von Gewinnen einer Vielzahl von Unterrahmen; einen Vektorquantisierer (58) zum Vektorquantisieren der unquantisierten Gewinne; und eine Einrichtung (50, 52, 54, 56) zum Aktualisieren interner Kodiererzustände unter Verwendung der vektorquantisierten Gewinne.
  9. Kodierer nach Anspruch 8, gekennzeichnet durch eine Einrichtung (52, 54, 56) zum Speichern eines internen Kodiererzustands nach der Kodierung eines Unterrahmens mit unquantisierten Gewinnen; eine Einrichtung (50) zum Wiederherstellen des internen Kodiererzustands nach der Vektorquantisierung von Gewinnen mehrerer Unterrahmen; und eine Einrichtung (50) zum Aktualisieren der internen Kodiererzustände durch Verwenden bestimmter Kodebuch-Vektoren und der vektorquantisierten Gewinne.
  10. Kodierer nach Anspruch 9, gekennzeichnet durch die Einrichtung zum Speichern interner Filterzustände, die eine Speichereinrichtung für adaptive Kodebuchzustände (52), eine Speichereinrichtung für Synthesefilterzustände (54) und eine Speichereinrichtung für Gewichtungsfilterzustände (56) enthält.
  11. Kodierer nach Anspruch 8, 9 oder 10, gekennzeichnet durch eine Einrichtung zum Vektorquantisieren der Gewinne zweier Unterrahmen.
  12. Kodierer nach Anspruch 8, 9 oder 10, gekennzeichnet durch eine Einrichtung zum Vektorquantisieren aller Gewinne aller Unterrahmen eines Sprachrahmens.
  13. Kodierer nach Anspruch 8, gekennzeichnet durch: eine Einrichtung (58) zum Gewichten von Fehlerbeiträgen verschiedener Unterrahmen durch Gewichtungsfaktoren und zum Minimieren der Summe der gewichteten Fehlerbeiträge.
  14. Kodierer nach Anspruch 13, gekennzeichnet durch eine Einrichtung (58) zum Bestimmen der Gewichtungsfaktoren, die von der Energie der entsprechenden Unterrahmen abhängen.
DE69922388T 1998-09-16 1999-08-24 Linear-prädiktives Analyse-durch-Synthese-Kodierverfahren und Kodierer Expired - Lifetime DE69922388T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9803165A SE519563C2 (sv) 1998-09-16 1998-09-16 Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
SE9803165 1998-09-16
PCT/SE1999/001433 WO2000016315A2 (en) 1998-09-16 1999-08-24 Linear predictive analysis-by-synthesis encoding method and encoder

Publications (2)

Publication Number Publication Date
DE69922388D1 DE69922388D1 (de) 2005-01-05
DE69922388T2 true DE69922388T2 (de) 2005-12-22

Family

ID=20412633

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69922388T Expired - Lifetime DE69922388T2 (de) 1998-09-16 1999-08-24 Linear-prädiktives Analyse-durch-Synthese-Kodierverfahren und Kodierer

Country Status (15)

Country Link
US (1) US6732069B1 (de)
EP (1) EP1114415B1 (de)
JP (1) JP3893244B2 (de)
KR (1) KR100416363B1 (de)
CN (1) CN1132157C (de)
AR (1) AR021221A1 (de)
AU (1) AU756491B2 (de)
BR (1) BR9913715B1 (de)
CA (1) CA2344302C (de)
DE (1) DE69922388T2 (de)
MY (1) MY122181A (de)
SE (1) SE519563C2 (de)
TW (1) TW442776B (de)
WO (1) WO2000016315A2 (de)
ZA (1) ZA200101867B (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
JP5326465B2 (ja) * 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2593937B1 (de) 2010-07-16 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Audiokodierer und -dekodierer sowie Verfahren zur Kodierung und Dekodierung eines Audiosignals
CN104025191A (zh) * 2011-10-18 2014-09-03 爱立信(中国)通信有限公司 用于自适应多速率编解码器的改进方法和设备
US20230336594A1 (en) * 2022-04-15 2023-10-19 Google Llc Videoconferencing with Reduced Quality Interruptions Upon Participant Join

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
JP2776050B2 (ja) * 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
EP0751496B1 (de) * 1992-06-29 2000-04-19 Nippon Telegraph And Telephone Corporation Verfahren und Vorrichtung zur Sprachkodierung
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
CA2118986C (en) * 1994-03-14 1998-09-22 Toshiki Miyano Speech coding system
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
CN1100396C (zh) * 1995-05-22 2003-01-29 Ntt移动通信网株式会社 语音解码器
DE69620967T2 (de) * 1995-09-19 2002-11-07 At & T Corp Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
KR100277096B1 (ko) * 1997-09-10 2001-01-15 윤종용 음성압축을 위한 코드워드와 양자화된 이득 선택방법
US6199037B1 (en) * 1997-12-04 2001-03-06 Digital Voice Systems, Inc. Joint quantization of speech subframe voicing metrics and fundamental frequencies
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal

Also Published As

Publication number Publication date
AU6375799A (en) 2000-04-03
CN1132157C (zh) 2003-12-24
CN1318190A (zh) 2001-10-17
MY122181A (en) 2006-03-31
CA2344302C (en) 2010-11-30
BR9913715B1 (pt) 2013-07-30
ZA200101867B (en) 2001-09-13
AU756491B2 (en) 2003-01-16
KR20010075134A (ko) 2001-08-09
US6732069B1 (en) 2004-05-04
BR9913715A (pt) 2001-05-29
TW442776B (en) 2001-06-23
JP3893244B2 (ja) 2007-03-14
WO2000016315A3 (en) 2000-05-25
DE69922388D1 (de) 2005-01-05
SE9803165D0 (sv) 1998-09-16
WO2000016315A2 (en) 2000-03-23
JP2002525897A (ja) 2002-08-13
AR021221A1 (es) 2002-07-03
EP1114415A2 (de) 2001-07-11
SE519563C2 (sv) 2003-03-11
EP1114415B1 (de) 2004-12-01
SE9803165L (sv) 2000-03-17
KR100416363B1 (ko) 2004-01-31
CA2344302A1 (en) 2000-03-23

Similar Documents

Publication Publication Date Title
DE4492048C2 (de) Vektorquantisierungs-Verfahren
DE3244476C2 (de)
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE69029120T2 (de) Stimmenkodierer
DE69839407T2 (de) Verfahren und Vorrichtung zum Generieren von Vektoren für die Sprachdekodierung
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE69309557T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE60011051T2 (de) Celp-transkodierung
DE3853916T2 (de) Digitaler-sprachkodierer mit verbesserter vertoranregungsquelle.
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE19647298C2 (de) Kodiersystem
DE69932460T2 (de) Sprachkodierer/dekodierer
DE68912692T2 (de) Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale.
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE69633944T2 (de) Verfahren und gerät zum kodieren von digitalen daten
DE69121411T2 (de) Methode und gerät zur codierung von analogen signalen
DE60309651T2 (de) Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens
DE602005003358T2 (de) Audiokodierung
DE69033510T3 (de) Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE68917584T2 (de) Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung.
DE19722705A1 (de) Verfahren zur Abschätzung der Verstärkung zur Sprachkodierung
DE68913691T2 (de) System zur Sprachcodierung und -decodierung.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition