DE69929069T2 - Verfahren und vorrchtung zur celp kodierung und dekodierung - Google Patents

Verfahren und vorrchtung zur celp kodierung und dekodierung Download PDF

Info

Publication number
DE69929069T2
DE69929069T2 DE69929069T DE69929069T DE69929069T2 DE 69929069 T2 DE69929069 T2 DE 69929069T2 DE 69929069 T DE69929069 T DE 69929069T DE 69929069 T DE69929069 T DE 69929069T DE 69929069 T2 DE69929069 T2 DE 69929069T2
Authority
DE
Germany
Prior art keywords
codebook
codebooks
signal block
identification
selector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69929069T
Other languages
English (en)
Other versions
DE69929069D1 (de
Inventor
Anders Uvliden
Jonas Svedberg
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20412632&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69929069(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of DE69929069D1 publication Critical patent/DE69929069D1/de
Application granted granted Critical
Publication of DE69929069T2 publication Critical patent/DE69929069T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich auf ein Multicodebuch-Fixbitraten-CELP-Signalblock-Kodierungs-/Dekodierungsverfahren und eine Vorrichtung und eine Multicodebuchstruktur.
  • HINTERGRUND DER ERFINDUNG
  • CELP-Sprachkodierer verwenden typischerweise Codebücher, um Anregungsvektoren (excitation vectors) zu speichern, die gedacht sind, Synthesefilter anzuregen, um ein synthetisches Sprachsignal zu erzeugen. Für hohe Bitraten enthalten diese Codebücher eine große Vielfalt von Anregungsvektoren, um ein großes Spektrum von Klangtypen zu bewältigen. In geringen Bitraten, z.B. um 4-7 kbit/s herum, ist jedoch die Zahl von Bits begrenzt, die für den Codebuchindex verfügbar sind, was bedeutet, dass die Zahl von Vektoren reduziert werden muss, von denen ausgewählt wird. Deshalb werden Kodierer geringer Bitrate eine Codebuchstruktur haben, die ein Kompromiss zwischen Genauigkeit und Reichhaltigkeit ist. Derartige Kodierer werden für einige Typen von Klang eine ausreichende Sprachqualität und für andere Typen von Klang eine kaum akzeptable Qualität ergeben.
  • Um dieses Problem mit Kodierern geringer Bitrate zu lösen, wurde eine Reihe von Multimoduslösungen präsentiert [1-5].
  • Literaturstellen [1-2] beschreiben Kodierungsverfahren variabler Bitrate, die dynamische Bitzuordnung verwenden, wo der Typ vom Klang, der zu kodieren ist, die Zahl von Bits steuert, die zum Kodieren verwendet werden.
  • Literaturstellen [3-4] beschreiben Kodierungsverfahren konstanter Bitrate, die mehrere Codebücher gleicher Größe verwenden, die für unterschiedliche Klangtypen optimiert sind. Der Klangtyp, der zu kodieren ist, steuert, welches Codebuch verwendet wird.
  • Diese Kodierungsverfahren vom Stand der Technik haben alle den Nachteil, dass Modusinformation vom Kodierer zum Dekodierer transferiert werden muss, damit der Dekodierer den richtigen Dekodierungsmodus verwendet. Derartige Modusinformation erfordert jedoch zusätzliche Bandbreite.
  • Literaturstelle [5] beschreibt ein Multimodus-Kodierungsverfahren konstanter Bitrate, das auch Codebücher gleicher Größe verwendet. In diesem Fall wird eine bereits bestimmte adaptive Codebuchverstärkung des vorherigen Teilrahmens verwendet, um von einem Kodierungsmodus zu einem anderen Kodierungsmodus umzuschalten. Da dieser Parameter vom Kodierer zum Dekodierer in jedem Fall transferiert wird, ist keine zusätzliche Modusinformation erforderlich. Dieses Verfahren ist jedoch gegenüber Bitfehlern in dem Verstärkungsfaktor empfindlich, die durch den Transferkanal verursacht werden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Ein Ziel der vorliegenden Erfindung ist ein Kodierungs-/Dekodierungsschema, in dem Kodierung ohne die Notwendigkeit für explizite Übertragung von Kodierungsmodusinformation von einem Kodierer zu einem Dekodierer verbessert wird.
  • Dieses Ziel wird in Übereinstimmung mit den eingeschlossenen Ansprüchen gelöst.
  • Kurz gesagt erreicht die vorliegende Erfindung das obige Ziel durch Verwenden mehrerer unterschiedlicher Codebücher gleicher Größe. Jedes Codebuch ist für einige Signale schwach, aber die anderen Codebücher teilen diese Schwäche für jene Signale nicht. Durch deterministisches (ohne Beachtung des Signaltyps) Umschalten zwischen diesen Codebüchern von Sprachblock zu Sprachblock wird die Kodierungsqualität verbessert. Es gibt keine Notwendigkeit, Information darüber zu transferieren, welches Codebuch für einen bestimmten Sprachblock ausgewählt wurde, da sowohl der Kodierer als auch der Dekodierer den gleichen deterministischen Umschaltungsalgorithmus verwenden.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung, zusammen mit weiteren Zielen und Vorteilen von ihr, kann am besten durch Verweis auf die folgende Beschreibung, aufgenommen zusammen mit den begleitenden Zeichnungen, verstanden werden, in denen:
  • 1 ein Blockdiagramm des Syntheseteils eines CELP-Kodierers/Dekodierers ist;
  • 2 ein Blockdiagramm des Syntheseteils eines CELP-Kodierers/Dekodierers in Übereinstimmung mit der vorliegenden Erfindung ist;
  • 3 ein Diagramm ist, das die Struktur von 4 unterschiedlichen algebraischen Codebüchern veranschaulicht, die in einer bevorzugten Ausführungsform der vorliegenden Erfindung verwendet werden können;
  • 4 ein Blockdiagramm des Syntheseteils eines anderen CELP-Kodierers/Dekodierers in Übereinstimmung mit der vorliegenden Erfindung ist; und
  • 5. ein Flussdiagramm ist, das das CELP-Kodierungs-/Dekodierungsverfahren der vorliegenden Erfindung veranschaulicht.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • In der folgenden Beschreibung und in den Ansprüchen ist der Ausdruck "Kodierer/Dekodierer" gedacht, entweder einen Kodierer oder einen Dekodierer zu bedeuten, da die Erfindung gleichermaßen auf beide Fälle anwendbar ist.
  • 1 ist ein Blockdiagramm des Syntheseteils eines CELP (Codeanregungs-Linearvorhersage, Code Excited Linear Predictive) Kodierers/Dekodierers vom Stand der Technik. Codevektoren, die aus einem Codebuch 10 ausgewählt werden, werden durch einen Skalierungsfaktor G in einem Verstärkungsblock 12 skaliert und zu einer Langzeit-Vorhersageeinrichtung 14 und danach zu einer Kurzzeit-Vorhersageeinrichtung 16 weitergeleitet. Das Ausgangssignal von der Kurzzeit-Vorhersageeinrichtung 16 ist das endgültige synthetische Sprachsignals(n) (vor einer möglichen Nachverarbeitung). Die Langzeit-Vorhersageeinrichtung 14 wird durch Steuersignale auf einer Steuerleitung 18 gesteuert, wobei die Steuersignale einen Skalierungsfaktor (Verstärkung) und eine Verzögerung (Rückstand) enthalten. Ähnlich wird die Kurzzeit-Vorhersageeinrichtung 16 durch Steuersignale, die Filterkoeffizienten darstellen, auf einer Steuerleitung 20 gesteuert. Ein Kodierer bestimmt die Steuersignale auf Steuerleitungen 18, 20 und einen besten Codebuchvektor durch eine Suchprozedur (Analyse durch Synthese), wohingegen ein Dekodierer die gleichen Steuersignale und Codebuchvektor aus Information bestimmt, die über einen Übertragungskanal empfangen wird.
  • Die Basisprinzipien der vorliegenden Erfindung werden nun mit Bezug auf 2 und 3 beschrieben.
  • 2 ist ein Blockdiagramm des Syntheseteils eines CELP-Kodierers/Dekodierers in Übereinstimmung mit der vorliegenden Erfindung. Elemente 12-20 entsprechen Elementen mit den gleichen Bezugszeichen in der Vorrichtung vom Stand der Technik von 1. An Stelle einer Bereitstellung von nur einem Codebuch 10, wie in 1, stellt die Vorrichtung der vorliegenden Erfindung jedoch eine Menge von Codebüchern gleicher Größe 10A-D mit Vektoren gleicher Länge bereit. In 2 gibt es 4 Codebücher, aber die Zahl von Codebüchern in der Menge kann sowohl größer als auch kleiner als diese Zahl sein. Die Menge sollte jedoch mindestens 2 Codebücher enthalten. Da die Bitrate gering ist, wird jedes Codebuch einige Schwachpunkte haben. Deshalb sind die Codebücher auf eine derartige Weise ausgelegt/trainiert, dass unterschiedliche Codebücher in der Menge nicht die gleichen Schwachpunkte haben.
  • Eine Betrachtungsweise eines Codebuchs ist als ein multidimensionales (typischerweise 40-dimensionales) "Nadelkissen", in dem die "Nadeln" Codevektoren darstellen. In diesem Modell würde ein nicht-trainiertes stochastisches Codebuch durch ein "hyper-sphärisches" Nadelkissen dargestellt, in dem die Codevektoren in jeder "Richtung" gleich verteilt sind (das Codebuch ist "weiß"). Der oben erwähnte Trainingsprozess verteilt diese Vektoren auf eine derartige Weise um, dass gewisse "Richtungen" dichter als andere "Richtungen" besetzt sind. Die am wenigsten dicht besetzten "Richtungen" entsprechen den Schwachpunkten des Codebuchs. Jedes Codebuch wird auf eine Weise unterschiedlich trainiert, die sicherstellt, dass die Codebücher keine gemeinsamen Schwachpunkte haben.
  • Häufig wird ein stochastisches Codebuch durch ein algebraisches Codebuch angenähert, siehe [6]. Ein derartiges Codebuch kann z.B. Codevektoren mit einer Länge von 40 Abtastungen enthalten. Es haben jedoch tatsächlich nur sehr wenige Abtastungspositionen Werte, die sich von Null unterscheiden. Des weiteren sind in vielen derartigen algebraischen Codebüchern die einzigen zulässigen Werte (von Null verschieden) +1 oder –1.
  • 3 ist ein Diagramm, das die Struktur von 4 unterschiedlichen algebraischen Codebüchern A-D veranschaulicht, die in einer beispielhaften Ausführungsform der vorliegenden Erfindung verwendet werden können. Diese Codebücher haben eine Länge von 40 Abtastungen und entsprechen einem Teilrahmen von 5 ms von Sprache. Jedes Codebuch hat zwei Spurenpaare (track pairs) SPUR 0, SPUR 1. Jede Spur hat 8 zulässige Impulspositionen P. Z.B. hat die zweite Spur in dem ersten Spurenpaar SPUR 0 in Codebuch B zulässige Impulspositionen in Abtastungspositionen 3, 8, 13, 18, 23, 28, 33, 38. Wie aus 3 gesehen werden kann, haben die anderen Spuren in einem Codebuch andere zulässige Impulspositionen. Des weiteren kann eine Spur von einem Codebuch auch in anderen Codebüchern, aber in einer anderen Spur gefunden werden. Schließlich hat jedes Codebuch ausgeschlossene Abtastungspositionen, die in 3 ausgekreuzt sind. Diese sind die "Schwachpunkte" des Codebuchs. Diese Codebuchstruktur ist in der folgenden Tabelle zusammengefasst: CODEBUCHSTRUKTUR
    Figure 00070001
  • Wenn eines dieser Codebücher durchsucht wird, ist 1 Impuls in einer der zulässigen Positionen von Spur 0 positioniert, und 1 Impuls ist in einer der zulässigen Positionen von Spur 1 eines Spurenpaars positioniert. Diese Impulskombination wird als eine potenzielle Codevektorgruppe verwendet. Die Gruppe enthält 4 mögliche Codevektoren, nämlich 1 Vektor mit 2 positiven Impulsen, 1 Vektor mit 2 negativen Impulsen und 2 Vektoren mit 1 positiven und 1 negativen Impuls. Durch Verlagern von Impulspositionen innerhalb jeder der 2 Spuren in dem Spurenpaar ist es möglich, andere derartige Codevektorgruppen zu bilden. Die gleichen Prinzipien treffen auf Spurenpaar 1 zu. Durch Testen jeder möglichen Kombination wird der beste Codevektor ausgewählt. Dieser Codevektor ist durch sein entsprechendes Spurenpaar, 2 Impulspositionen in den Spuren dieses Paars und das Impulsvorzeichen definiert. Dies erfordert 1 Bit, um ein Spurenpaar zu spezifizieren, 2·3 = 6 Bits, um Impulspositionen (es gibt 8 Positionen in einer Spur, was 3 Bits erfordert) in den Spuren dieses Paares zu spezifizieren, und 2 Bits, um das Vorzeichen von jedem Impuls zu spezifizieren. Somit definieren insgesamt 9 Bits einen Codevektor.
  • Zu 2 zurückkehrend wählt ein Codebuchselektor 22 eines der Codebücher in der Menge zum Kodieren/Dekodieren eines Signalblocks, z.B. einen Sprachrahmen oder Teilrahmen (typischerweise hat ein Block eine Länge von 5-10 ms). Dies geschieht durch Steuern eines Schalters 23 mit einem Steuersignal auf einer Steuerleitung 24. Schalter 23 wird in Übereinstimmung mit einer deterministischen Auswahlprozedur gesteuert, die vom Signaltyp unabhängig ist. Hier bedeutet "deterministisch", dass der Codebuchselektor 22 Codebücher aus der Menge zum Kodieren/Dekodieren von jedem Signalblock auswählt, dies aber ohne jegliches Wissen über den Signaltyp tut, und dass der Auswahlalgorithmus für sowohl Kodierer als auch Dekodierer der gleiche ist und nicht vom Kodierer zum Dekodierer transferiert werden muss. Der Kodierer bestimmt den besten Vektor aus dem ausgewählten Codebuch in Übereinstimmung mit der oben erwähnten Suchprozedur, wohingegen der Dekodierer den entsprechenden Vektor in dem gleichen Codebuch durch Verwenden des empfangenen "Index" (Codevektoridentifikator) auswählt.
  • Die Codebücher 10A-D haben die gleiche Bitrate, ihre schwächsten Leistungsverhaltenspunkte sind nicht gemeinsam. Durch deterministisches Umschalten zwischen den Codebüchern von Signalblock zu Signalblock werden die Unzulänglichkeiten von jedem Codebuch mit der Zeit kompensiert. Es wurde herausgefunden, dass die mittlere wahrgenommene Klangqualität der kodierten und danach dekodierten Audiosignale sich ungeachtet der Tatsache tatsächlich erhöht, dass der Signaltyp in dem Umschaltungsalgorithmus außer Acht gelassen wird. Dies kann erklärt werden, indem bemerkt wird, dass die resultierende Verzerrung von einem einzelnen Codebuch nicht in jedem Teilrahmen oder Block wiederholt wird. Stattdessen werden die variierenden Verzerrungen ausgeglichen. Somit wird die Verzerrung von diesem (Multi-) Codebuch geringer Bitrate als weni ger ärgerlich wahrgenommen, da sie nicht kontinuierlich wiederholt wird.
  • Eine Ausführungsform des Auswahlalgorithmus ist, jedes Codebuch 10A-D sequenziell und zyklisch auszuwählen. Der Kodierer und Dekodierer sind automatisch in Synchronismus, falls die Zahl von Codebüchern der Zahl von Teilrahmen in einem Rahmen entspricht und ein Codebuchzähler in Kodierer und Dekodierer jeden Rahmen zurückgesetzt wird. Anderenfalls kann Synchronisation erreicht werden durch Rücksetzen eines Modulo-n-Zählers, wobei n die Zahl von Codebüchern ist, in sowohl dem Kodierer als auch Dekodierer bei Rufeinrichtung und Übergabe.
  • Ein anderer Auswahlalgorithmus ist, eine pseudozufällige Sequenz zu verwenden, um Codebücher aus der Menge auszuwählen. In diesem Fall ist der Grundstock (seed) des Algorithmus, der die pseudozufällige Sequenz generiert, sowohl Kodierer als auch Dekodierer bekannt. Synchronisation zwischen Kodierer und Dekodierer kann z.B. durch eine pseudozufällige Sequenz erreicht werden, die auf übertragenen und empfangenen Rahmenparametern basiert, die vor der Codebuchsuche bestimmt und analysiert werden.
  • 4 ist ein Blockdiagramm des Syntheseteils eines anderen CELP-Kodierers/Dekodierers in Übereinstimmung mit der vorliegenden Erfindung. Diese Ausführungsform ist der Ausführungsform von 2 ähnlich, aber in diesem Fall gibt es mehrere Mengen 26A-C von Codebüchern. Jede Menge enthält Codebücher, die nicht die gleichen Schwachpunkte teilen, so wie in 2, aber jede Menge ist auch ausgelegt, unterschiedliche Umgebungen zu bewältigen, z.B. unterschiedliche Signaltypen oder Pegel von Hintergrundklängen. Die Auslegung jeder Menge kann z.B. in Übereinstimmung mit den Prinzipien durchgeführt werden, die in [5] beschrieben sind. 4 veranschaulicht 3 Mengen von Codebüchern, es sind aber auch 2 oder mehr als 3 Mengen möglich.
  • Wie in 2 wird ein Codebuch für jeden Signalblock deterministisch ausgewählt, in dieser Ausführungsform über Schalter 23A-C und Steuerleitungen 24A-C. Bevor jedoch ein Codebuch aus einer Menge ausgewählt wird, bestimmt ein Mengenselektor 28, welche Menge zu verwenden ist, über einen Schalter 29 und eine Steuerleitung 30. Mengenselektor 28 basiert seine Auswahl auf Information, die in den anderen, zuvor bestimmten, Parametern auf Leitungen 18, 20 und in Verstärkungselement 12 enthalten sind. Diese Information kann z.B. aus den Parametern von LPC (lineare vorhersagende Kodierung, Linear Predictive Coding) oder LTP (Langzeit-Vorhersageeinrichtung, Long Term Predictor) oder aus einer Kombination von LPC- und LTP-Parametern bestimmt werden. Z.B. kann erfasste Unbeweglichkeit (stationary) von LTP-Parametern verwendet werden, um einen Signaltyp anzuzeigen.
  • Wegen der Tatsache, dass die Parameter, die für Mengenauswahl verwendet werden, vom Kodierer zum Dekodierer in jedem Fall transferiert werden, geht keine Bandbreite zum Transferieren der Mengenauswahlinformation verloren. Vorzugsweise werden nur kanalgeschützte Parameter zur Mengenerfassung verwendet. Des weiteren verwendet eine besonders bevorzugte Ausführungsform des Kodierers/Dekodierers von 4 nur die Teile der kanalgeschützten Parameter, die Fehlererfassung haben, um die Codebuchmenge zu bestimmen, die zu verwenden ist. Z.B. sind in dem GSM-System 6 der 9 Rückstandsbits und 3 der 4 Verstärkungsbits der LTP-Parameter mit Fehlererfassung versehen. Vorzugsweise werden diese Bits verwendet, um Unbeweglichkeit (sagen wir über 20 ms) zu testen, um eine Codebuchmenge zu bestimmen.
  • Da die Mengenauswahl der Codebuchauswahl vorausgeht, erlaubt die Ausführungsform von 4 eine unterschiedliche Zahl von Codebüchern in jeder Menge 26A-C. Dies erfordert eine getrennte Steuerleitung für jeden Schalter 23A-C und einen getrennten Umschaltungsalgorithmus im Codebuchselektor 22 für jede Menge. Falls alle Mengen die gleiche Zahl von Codebüchern haben, kann eine gemeinsame Steuerleitung für alle Schalter verwendet werden. Des weiteren erlaubt diese Ausführungsform die Möglichkeit einer Umkehrung der Mengen- und Codebuchauswahlen (falls aus Betrachtungen von Kausalität zulässig).
  • Typischerweise wird die Funktionalität von Mengen- und Codebuchselektoren 22, 28 durch einen oder mehrere Mikroprozessoren oder Mikro-/Signalprozessor-Kombinationen implementiert.
  • 5 ist ein Flussdiagramm, das das CELP-Kodierungs-/Dekodierungsverfahren der vorliegenden Erfindung veranschaulicht. Das Verfahren beginnt in Schritt S1 durch Auswählen des nächsten Blocks, der zu kodieren/dekodieren ist. Schritt S2 wählt eine Codebuchnummer in Übereinstimmung mit einem deterministischen Auswahlalgorithmus aus. Schritt S3 wählt aus/ruft ab den besten Vektor aus dem ausgewählten Codebuch. Danach bildet die Prozedur eine Schleife zurück zu Schritt S1. Falls mehrere Codebuchmengen verwendet werden, wie in der Ausführungsform von 3, wird es einen zusätzlichen Schritt S4 (gezeigt mit gestrichelten Linien in 5) geben, der die richtige Codebuchmenge bestimmt. Dieser Schritt S4 kann Schritt S2 vorausgehen oder folgen (falls aus Betrachtungen von Kausalität zulässig).
  • Durch einen Fachmann wird verstanden, dass verschiedene Modifikationen und Änderungen an der vorliegenden Erfindung durchgeführt werden können, ohne von dem Bereich von ihr abzuweichen, der durch die angefügten Ansprüche definiert ist.
  • LITERATURSTELLEN
    • [1] M. Yong und A. Gersho, "Vector Excitation Coding with Dynamic Bit Allocation", Proc. GLOBCOM, S. 290-294, Dez. 1988.
    • [2] N.S. Jayant und J.H. Chen, "Speech Coding with Time-Varying Bit Allocation to Excitation and LPC Parameters", Proc. ICASSP, S. 65-68, Mai 1989.
    • [3] T. Taniguchi et al, "Multimode Coding: Application to CELP", Proc. ICASSP, S. 156-159, Mai 1989.
    • [4] M. Akamine und K. Miseki, "CELP Coding with an Adaptive Density Pulse Excitation Model", Proc. ICASSP, S. 29-32, 1990.
    • [5] K. Ozawa und M. Serizawa, "High Quality Multi-Pulse Based CELP Speech Coding at 6.4 kb/s and its Subjective Evaluation", Proc. ICASSP, S. 153-156, 1998.
    • [6] J-P Adoul et al, "Fast CELP Coding Based on Algebraic Codes", Proc. ICASSP, S. 1957-1960, 1987.

Claims (24)

  1. Codebuchauswahlverfahren für Multicodebuch-Fixbitraten-Codeanregungs-Linearvorhersage-Signalblock-Kodierung/Dekodierung, gekennzeichnet durch: Selektieren, für jeden Signalblock, einer entsprechenden Codebuchidentifikation in Übereinstimmung mit einer deterministischen Auswahlprozedur, die unabhängig vom Signaltyp ist.
  2. Verfahren nach Anspruch 1, gekennzeichnet durch die deterministische Auswahlprozedur, die durch zyklisches Durchschreiten jeder Codebuchidentifikation in einer Menge von Codebüchern definiert ist.
  3. Verfahren nach Anspruch 1, gekennzeichnet durch die deterministische Auswahlprozedur, die durch zufälliges Durchschreiten jeder Codebuchidentifikation in einer Menge von Codebüchern definiert ist.
  4. Multicodebuch-Fixbitraten-Codeanregungs-Linearvorhersage-Signalblock-Kodierungs-/Dekodierungsverfahren, gekennzeichnet durch das Codebuchauswahlverfahren nach Anspruch 1 zum Selektieren, für jeden Signalblock, einer entsprechenden Codebuchidentifikation in Übereinstimmung mit einer deterministischen Auswahlprozedur, die unabhängig vom Signaltyp ist; und Kodieren/Dekodieren von jedem Signalblock durch Verwenden eines Codebuchs mit der selektierten Codebuchidentifikation.
  5. Verfahren nach Anspruch 4, gekennzeichnet durch Vorsehen mehrerer Mengen von Codebüchern; Bestimmen, für jeden Signalblock, einer entsprechenden Menge von Codebüchern basierend auf zuvor bestimmten Werten von anderen Signalblock-Charakterisierungsparametern; Selektieren, für jeden Signalblock, einer entsprechenden Codebuchidentifikation in der bestimmten Menge in Übereinstimmung mit einer deterministischen Auswahlprozedur, die unabhängig vom Signaltyp ist; und Kodieren/Dekodieren von jedem Signalblock durch Verwenden eines Codebuchs aus der bestimmten Menge mit der selektierten Codebuchidentifikation.
  6. Verfahren nach Anspruch 4, gekennzeichnet durch Vorsehen mehrerer Mengen von Codebüchern; Bestimmen, für jeden Signalblock, einer entsprechenden Menge von Codebüchern basierend auf zuvor bestimmten Werten von anderen Signalblock-Charakterisierungsparametern; und Kodieren/Dekodieren von jedem Signalblock durch Verwenden eines Codebuchs aus der bestimmten Menge mit der selektierten Codebuchidentifikation.
  7. Verfahren nach Anspruch 5 oder 6, gekennzeichnet durch die anderen Parameter, die kanalgeschützt sind.
  8. Verfahren nach Anspruch 7, gekennzeichnet durch Verwenden nur von Teilen der kanalgeschützten Parameter, die Fehlererfassung erlauben.
  9. Verfahren nach beliebigen der vorangehenden Ansprüche 4-8, gekennzeichnet durch die deterministische Auswahlprozedur, die durch zyklisches Durchschreiten jeder Codebuchidentifikation in den Mengen von Codebüchern definiert ist.
  10. Verfahren nach beliebigen der vorangehenden Ansprüche 4-8, gekennzeichnet dadurch, dass die deterministische Auswahlprozedur durch zufälliges Durchschreiten jeder Codebuchidentifikation in den Mengen von Codebüchern definiert ist.
  11. Verfahren nach beliebigen der vorangehenden Ansprüche 4-10, gekennzeichnet durch die Codebücher, die fixierte Codebücher sind.
  12. Verfahren nach Anspruch 11, gekennzeichnet durch die Codebücher, die algebraische Codebücher sind.
  13. Verfahren nach beliebigen der vorangehenden Ansprüche 4-12, gekennzeichnet durch den Signalblock, der ein Audiorahmen ist.
  14. Verfahren nach beliebigen der vorangehenden Ansprüche 4-12, gekennzeichnet dadurch den Signalblock, der ein Audioteilrahmen ist.
  15. Codebuchselektor für Multicodebuch-Fixbitraten-Codeanregungs-Linearvorhersage-Signalblock-Kodierung/Dekodierung, gekennzeichnet durch: einen Selektor (22) zum Selektieren, für jeden Signalblock, einer entsprechenden Codebuchidentifikation in Übereinstimmung mit einer deterministischen Auswahlprozedur, die unabhängig vom Signaltyp ist.
  16. Codebuchselektor nach Anspruch 15, gekennzeichnet durch den Codebuchselektor (22), der jede Codebuchidentifikation in einer Menge von Codebüchern zyklisch durchschreitet.
  17. Codebuchselektor nach Anspruch 15, gekennzeichnet durch den Codebuchselektor (22), der jede Codebuchidentifikation in einer Menge von Codebüchern zufällig durchschreitet.
  18. Multicodebuch-Fixbitraten-Codeanregungs-Linearvorhersage-Signalblock-Kodierer/Dekodierer, gekennzeichnet durch einen Codebuchselektor (22) in Übereinstimmung mit Anspruch 15 zum Selektieren, für jeden Signalblock, einer entsprechenden Codebuchidentifikation in Übereinstimmung mit einer deterministischen Auswahlprozedur, die unabhängig vom Signaltyp ist; und Mittel zum Kodieren/Dekodieren von jedem Signalblock durch Verwenden eines Codebuchs mit der selektierten Codebuchidentifikation.
  19. Kodierer/Dekodierer nach Anspruch 18, gekennzeichnet durch mehrere Mengen (26A-C) von Codebüchern; einen Mengenselektor (28) zum Bestimmen, für jeden Signalblock, einer entsprechenden Menge von Codebüchern basierend auf zuvor bestimmten Werten von anderen Signalblock-Charakterisierungsparametern; einen Codebuchselektor (22) zum Selektieren, für jeden Signalblock, einer entsprechenden Codebuchidentifikation in der bestimmten Menge in Übereinstimmung mit einer deterministischen Auswahlprozedur, die unabhängig vom Signaltyp ist; und Mittel zum Kodieren/Dekodieren von jedem Signalblock durch Verwenden eines Codebuchs aus der bestimmten Menge mit der selektierten Codebuchidentifikation.
  20. Kodierer/Dekodierer nach Anspruch 18, gekennzeichnet durch mehrere Mengen (26A-C) von Codebüchern; einen Mengenselektor (28) zum Bestimmen, für jeden Signalblock, einer entsprechenden Menge von Codebüchern basierend auf zuvor bestimmten Werten von anderen Signalblock-Charakterisierungsparametern; Mittel zum Kodieren/Dekodieren von jedem Signalblock durch Verwenden eines Codebuchs aus der bestimmten Menge mit der selektierten Codebuchidentifikation.
  21. Kodierer/Dekodierer nach Anspruch 18, 19 oder 20, gekennzeichnet durch den Codebuchselektor (22), der jede Codebuchidentifikation in den Mengen von Codebüchern zyklisch durchschreitet.
  22. Kodierer/Dekodierer nach Anspruch 18, 19 oder 20, gekennzeichnet durch den Codebuchselektor (22), der jede Codebuchidentifikation in den Mengen von Codebüchern zufällig durchschreitet.
  23. Kodierer/Dekodierer nach beliebigen der vorangehenden Ansprüche 18-22, gekennzeichnet durch die Codebücher (10A-D), die fixierte Codebücher sind.
  24. Kodierer/Dekodierer nach Anspruch 23, gekennzeichnet durch die Codebücher (10A-D), die algebraische Codebücher sind.
DE69929069T 1998-09-16 1999-08-24 Verfahren und vorrchtung zur celp kodierung und dekodierung Expired - Lifetime DE69929069T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9803164A SE521225C2 (sv) 1998-09-16 1998-09-16 Förfarande och anordning för CELP-kodning/avkodning
SE9803164 1998-09-16
PCT/SE1999/001432 WO2000016314A2 (en) 1998-09-16 1999-08-24 Celp encoding/decoding method and apparatus

Publications (2)

Publication Number Publication Date
DE69929069D1 DE69929069D1 (de) 2006-01-26
DE69929069T2 true DE69929069T2 (de) 2006-07-20

Family

ID=20412632

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69929069T Expired - Lifetime DE69929069T2 (de) 1998-09-16 1999-08-24 Verfahren und vorrchtung zur celp kodierung und dekodierung

Country Status (15)

Country Link
US (2) US7146311B1 (de)
EP (1) EP1114413B1 (de)
JP (1) JP4651195B2 (de)
KR (1) KR100416362B1 (de)
CN (1) CN1143270C (de)
AR (1) AR020466A1 (de)
AU (1) AU756483B2 (de)
BR (1) BRPI9913756B8 (de)
CA (1) CA2343191C (de)
DE (1) DE69929069T2 (de)
MY (1) MY121083A (de)
SE (1) SE521225C2 (de)
TW (1) TW516275B (de)
WO (1) WO2000016314A2 (de)
ZA (1) ZA200101866B (de)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1959435B1 (de) * 1999-08-23 2009-12-23 Panasonic Corporation Sprachenkodierer
JP3900000B2 (ja) 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100465316B1 (ko) * 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
WO2006096099A1 (en) * 2005-03-09 2006-09-14 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8031583B2 (en) 2005-03-30 2011-10-04 Motorola Mobility, Inc. Method and apparatus for reducing round trip latency and overhead within a communication system
KR100795727B1 (ko) * 2005-12-08 2008-01-21 한국전자통신연구원 Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법
US8712766B2 (en) * 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
ES2366551T3 (es) * 2006-11-29 2011-10-21 Loquendo Spa Codificación y decodificación dependiente de una fuente de múltiples libros de códigos.
KR101398836B1 (ko) * 2007-08-02 2014-05-26 삼성전자주식회사 스피치 코덱들의 고정 코드북들을 공통 모듈로 구현하는방법 및 장치
WO2009114656A1 (en) * 2008-03-14 2009-09-17 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
KR101520685B1 (ko) * 2008-07-04 2015-05-15 엘지전자 주식회사 복수의 코드북을 이용하는 다중 셀 환경에서의 셀 간 간섭 제거 방법
US20120008687A1 (en) * 2010-07-06 2012-01-12 Apple Inc. Video coding using vector quantized deblocking filters
US9628821B2 (en) 2010-10-01 2017-04-18 Apple Inc. Motion compensation using decoder-defined vector quantized interpolation filters
SG191771A1 (en) * 2010-12-29 2013-08-30 Samsung Electronics Co Ltd Apparatus and method for encoding/decoding for high-frequency bandwidth extension
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
CN103477387B (zh) 2011-02-14 2015-11-25 弗兰霍菲尔运输应用研究公司 使用频谱域噪声整形的基于线性预测的编码方案
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
ES2639646T3 (es) * 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
PL2676264T3 (pl) 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH02250100A (ja) * 1989-03-24 1990-10-05 Mitsubishi Electric Corp 音声符合化装置
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
JP2796408B2 (ja) * 1990-06-18 1998-09-10 シャープ株式会社 音声情報圧縮装置
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
JPH04333900A (ja) * 1991-05-10 1992-11-20 Matsushita Electric Ind Co Ltd 音声符号化装置
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JPH05265496A (ja) * 1992-03-18 1993-10-15 Hitachi Ltd 複数のコードブックを有する音声符号化方法
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
DE4335305A1 (de) * 1993-10-16 1995-04-20 Philips Patentverwaltung Verfahren und Schaltungsanordnung zur Übertragung von Sprachsignalen
JPH07202820A (ja) 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
JP3020819B2 (ja) * 1994-10-20 2000-03-15 ダイワ精工株式会社 魚釣用リ−ル
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
TW321810B (de) 1995-10-26 1997-12-01 Sony Co Ltd
KR0176788B1 (ko) * 1995-12-27 1999-04-01 구자홍 음성인식의 자동모델 결정방법
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JPH1020889A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化装置および記録媒体
JPH1020891A (ja) * 1996-07-09 1998-01-23 Sony Corp 音声符号化方法及び装置
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
KR19990061297A (ko) * 1997-12-31 1999-07-26 정몽규 자동차의 음성명령 인식방법 및 음성명령 인식장치

Also Published As

Publication number Publication date
US7146311B1 (en) 2006-12-05
EP1114413B1 (de) 2005-12-21
TW516275B (en) 2003-01-01
JP2002525666A (ja) 2002-08-13
SE9803164L (sv) 2000-03-17
EP1114413A2 (de) 2001-07-11
ZA200101866B (en) 2001-09-11
SE9803164D0 (sv) 1998-09-16
DE69929069D1 (de) 2006-01-26
CA2343191A1 (en) 2000-03-23
BR9913756A (pt) 2001-06-05
US7194408B2 (en) 2007-03-20
JP4651195B2 (ja) 2011-03-16
AR020466A1 (es) 2002-05-15
WO2000016314A2 (en) 2000-03-23
KR100416362B1 (ko) 2004-01-31
KR20010075133A (ko) 2001-08-09
CN1143270C (zh) 2004-03-24
MY121083A (en) 2005-12-30
US20050096901A1 (en) 2005-05-05
BRPI9913756B1 (pt) 2016-07-05
WO2000016314A3 (en) 2000-06-08
SE521225C2 (sv) 2003-10-14
BRPI9913756B8 (pt) 2016-08-02
AU6375699A (en) 2000-04-03
AU756483B2 (en) 2003-01-16
CA2343191C (en) 2009-10-27
CN1318189A (zh) 2001-10-17

Similar Documents

Publication Publication Date Title
DE69929069T2 (de) Verfahren und vorrchtung zur celp kodierung und dekodierung
DE69837822T2 (de) Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen
DE69029120T2 (de) Stimmenkodierer
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69836624T2 (de) Audiokodierer und -dekodierer
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE69613360T2 (de) Linear-prädiktiver analyse-durch-synthese sprachkodierer
DE69329569T2 (de) Digitale Kodierung von Sprachsignalen
DE69900786T2 (de) Sprachkodierung
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE69636209T2 (de) Vorrichtung zur Sprachkodierung
EP1080464B1 (de) Verfahren und anordnung zur sprachcodierung
DE69615870T2 (de) Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
EP2385521A1 (de) Steganographie in digitalen Signal-Codierern
DE69425226T2 (de) Sprachdekoder zur Erzeugung von Hintergrundgeräuschen
DE68923771T2 (de) Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.
EP1286331A1 (de) Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
DE69624449T2 (de) Vorrichtung zur Sprachkodierung
DE69324732T2 (de) Selektive Anwendung von Sprachkodierungstechniken
DE60016305T2 (de) Verfahren zum Betrieb eines Sprachkodierers
DE69630177T2 (de) Sprachkodierer mit der Fähigkeit zur wesentlichen Vergrösserung der Codebuchgrösse ohne aber die Zahl der übertragenen Bits zu vergrössern
DE69614101T2 (de) Kodierverfahren für anregungsimpulsparameterfolgen
DE69526926T2 (de) Lineare vorhersage durch impulsanregung
DE69614761T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69609539T2 (de) Bestimmung der Verstärkung für die Signalperiode bei der Kodierung eines Sprachsignales

Legal Events

Date Code Title Description
8364 No opposition during term of opposition