DE60127566T2 - Mehrkanal-signalcodierung und -decodierung - Google Patents

Mehrkanal-signalcodierung und -decodierung Download PDF

Info

Publication number
DE60127566T2
DE60127566T2 DE60127566T DE60127566T DE60127566T2 DE 60127566 T2 DE60127566 T2 DE 60127566T2 DE 60127566 T DE60127566 T DE 60127566T DE 60127566 T DE60127566 T DE 60127566T DE 60127566 T2 DE60127566 T2 DE 60127566T2
Authority
DE
Germany
Prior art keywords
channel
leading
inter
trailing
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60127566T
Other languages
English (en)
Other versions
DE60127566D1 (de
Inventor
Tor Björn Minde
Tomas Lundberg
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE60127566D1 publication Critical patent/DE60127566D1/de
Publication of DE60127566T2 publication Critical patent/DE60127566T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Error Detection And Correction (AREA)

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich auf Kodierung und Dekodierung von Mehrkanalsignalen, wie etwa Stereoaudiosignalen.
  • HINTERGRUND DER ERFINDUNG
  • Konventionelle Sprachkodierungsverfahren basieren im allgemeinen auf Einzelkanal-Sprachsignalen. Ein Beispiel ist die Sprachkodierung, die in einer Verbindung zwischen einem regulären Telefon und einem zellularen Telefon verwendet wird. Sprachkodierung wird in der Funkverknüpfung verwendet, um Bandbreitenverwendung in der in der Frequenz begrenzten Luftschnittstelle zu reduzieren. Gut bekannte Beispiele von Sprachkodierung sind PCM (Impulscodemodulation, Pulse Code Modulation), ADPCM (adaptive differenzielle Impulscodemodulation, Adaptive Differential Pulse Code Modulation), Teilbandkodierung, Transformationskodierung, LPC-(lineare vorhersagende Kodierung, Linear Predictive Coding)Sprachkodierung und hybride Kodierung, wie etwa CELP (durch Code angeregte lineare vorhersagende, Code-Excited Linear Predictive) Kodierung [1–2].
  • In einer Umgebung, wo die Audio-/Sprachkommunikation mehr als ein Eingangssignal verwendet, z.B. einer Computerarbeitsstation mit Stereolautsprechern und zwei Mikrofonen (Stereomikrofonen), sind zwei Audio-/Sprachkanäle erforderlich, um die Stereosignale zu übertragen. Ein anderes Beispiel einer Mehr kanalumgebung wäre ein Konferenzraum mit zwei, drei oder vier Kanaleingabe/Ausgabe. Von diesem Typ von Anwendungen wird erwartet, in dem Internet und in zellularen Systemen dritter Generation verwendet zu werden.
  • In einem Kommunikationssystem hängt die verfügbare Bruttobitrate für einen Sprachkodierer von der Fähigkeit der unterschiedlichen Verknüpfungen ab. In gewissen Situationen, z.B. hoher Interferenz in einer Funkverknüpfung oder Netzüberlastung in einer festen Verknüpfung, kann die verfügbare Bitrate absinken. In einer Situation von Stereokommunikation bedeutet dies entweder Paketverlust/fehlerhafte Rahmen oder für einen Multimodus-Kodierer eine geringere Bitrate für beide Kanäle, was in beiden Fällen geringere Qualität für beide Kanäle bedeutet.
  • Ein anderes Problem ist die Aufstellung von zu Stereo fähigen Endgeräten. Alle Audiokommunikationsendgeräte implementieren einen Monokanal, z.B. adaptive Multiraten-(AMR)Sprachkodierung/Dekodierung, und der Rückfallmodus für ein Stereoendgerät wird ein Monokanal sein. In einer Mehrparteien-Stereokonferenz (z.B. einer Mehrpunktverbindungssitzung (multicast session)) wird ein Monoendgerät die Verwendung von Stereokodierung und höhere Qualität wegen der Notwendigkeit von Interoperabilität einschränken.
  • Allgemeine Prinzipien für Mehrkanal-Linearvorhersage-Analyse-durch-Synthese-(LPAS, multi-channel linear predictive analysis-by-synthesis)Signalkodierung/Dekodierung sind in [3] beschrieben. Der beschriebene Kodierer ist jedoch nicht flexibel genug, um die beschriebenen Probleme zu bewältigen. EP 0 858 067 und EP 0 878 798 beschreiben jeweils einen Mehrkanal-Sprachkodierer, der vorhersagende Kodierung, wie etwa CELP, und Kodierung von Stereo-Audio-Signalen verwendet.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Ein Ziel der vorliegenden Erfindung besteht darin, einen effizienten Mehrkanal-LPAS-Sprachkodierungsaufbau zu finden, der Interkanal-Signalkorrelation ausnutzt und einen eingebetteten Bitstrom beibehält.
  • Ein anderes Ziel ist ein Kodierer, der für ein M-Kanal-Sprachsignal, einen Bitstrom erzeugen kann, der im Durchschnitt beträchtlich unter M mal dem eines Einzelkanal-Sprachkodierers ist, während die gleiche oder bessere Klangqualität in einer gegebenen mittleren Bitrate bewahrt wird.
  • Andere Ziele enthalten vernünftige Implementierung und Berechnungskomplexität für Realisierungen von Kodierern innerhalb dieses Rahmens.
  • Diese Ziele werden in Übereinstimmung mit den angefügten Ansprüchen erreicht.
  • Kurz gesagt bezieht die vorliegende Erfindung Einbettung eines Monokanals in den Mehrkanalkodierungs-Bitstrom ein, um die Qualitätsprobleme zu überwinden, die mit variierenden Bruttobitraten wegen z.B. variierender Verknüpfungsqualität in Verbindung stehen. Mit dieser Anordnung kann, falls es eine Notwendigkeit gibt, die Bruttobitrate abzusenken, der eingebettete Monokanal-Bitstrom beibehalten werden und die anderen Kanäle können außer Acht gelassen werden. Die Kommunikation wird nun auf eine Monokodierungsoperation mit einer geringeren Bruttobitrate "zurückfallen", wird aber dennoch eine hohe Monoqualität beibehalten. Die "Stereo"-Bits können in einem beliebigen Kommunikationspunkt fallen gelassen werden, und es können mehr Kanalkodierungsbits für eine höhere Robustheit in einem Funkkommunikationsszenarium hinzugefügt werden. Die "Stereo"-Bits können auch abhängig von den Fähig keiten der Empfängerseite fallen gelassen werden. Falls der Empfänger für eine Seite in einer Mehrparteienkonferenz einen Monodecoder enthält, kann der eingebettete Monobitstrom durch Fallenlassen des anderen Teils des Bitstroms verwendet werden.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung, zusammen mit anderen Zielen und Vorteilen von ihr, kann durch Verweis auf die folgende Beschreibung am besten verstanden werden, die zusammen mit den begleitenden Zeichnungen aufgenommen wird, in denen:
  • 1 ein Blockdiagramm eines konventionellen Einzelkanal-LPAS-Sprachkodierers ist;
  • 2 ein Blockdiagramm einer Ausführungsform des Analyseteils eines Mehrkanal-LPAS-Sprachkodierers vom Stand der Technik ist;
  • 3 ein Blockdiagramm einer Ausführungsform des Syntheseteils eines Mehrkanal-LPAS-Sprachkodierers vom Stand der Technik ist;
  • 4 ein Blockdiagramm einer beispielhaften Ausführungsform des Syntheseteils eines Mehrkanal-LPAS-Sprachkodierers in Übereinstimmung mit der vorliegenden Erfindung ist;
  • 5 ein Flussdiagramm einer beispielhaften Ausführungsform eines Suchverfahren mit einem mehrteiligen festen Codebuch ist; und
  • 6 ein Blockdiagramm einer beispielhaften Ausführungsform des Analyseteils eines Mehrkanal-LPAS-Sprachkodierers in Übereinstimmung mit der vorliegenden Erfindung ist.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • In der folgenden Beschreibung werden die gleichen Bezugszeichen für äquivalente oder ähnliche Elemente verwendet.
  • Die vorliegende Erfindung wird nun durch Einführung eines konventionellen Einzelkanal-Linearvorhersage-Analyse-durch-Synthese-(LPAS)Sprachkodierers, und eines allgemeinen Mehrkanal-Linearvorhersage-Analyse-durch-Synthese-Sprachkodierers, der in [3] beschrieben wird, beschrieben.
  • 1 ist ein Blockdiagramm eines konventionellen Einzelkanal-LPAS-Sprachkodierers. Der Kodierer umfasst zwei Teile, nämlich einen Syntheseteil und einen Analyseteil (ein entsprechender Dekodierer wird nur einen Syntheseteil enthalten).
  • Der Syntheseteil umfasst ein LPC-Synthesefilter 12, das ein Anregungssignal i(n) empfängt und ein synthetisches Sprachsignal ŝ(n) ausgibt. Das Anregungssignal i(n) wird durch Addieren zweier Signale u(n) und v(n) in einem Addierer 22 gebildet. Das Signal u(n) wird durch Skalieren eines Signals f(n) aus einem festen Codebuch 16 durch eine Verstärkung gF in einem Verstärkungselement 20 gebildet. Das Signal v(n) wird durch Skalieren einer verzögerten (um einen Verzögerungs-"Nachlauf") Version des Erregungssignals i(n) aus einem adaptiven Codebuch 14 mit einer Verstärkung gA in einem Verstärkungselement 18 gebildet. Das adaptive Codebuch wird gebildet durch eine Rückkopplungsschleife (geschlossene Schleife), die ein Verzögerungselement 24 enthält, welches das Erregungssignal i(n) eine Teilrahmenlänge N verzögert. Somit wird das adaptive Codebuch vergangene Anregungen i(n) enthalten, die in das Codebuch verschoben sind (die ältesten Anregungen werden aus dem Codebuch heraus verschoben und verwor fen). Die LPC-Synthesefilterparameter werden typischerweise jeden 20–40 ms Rahmen aktualisiert, während das adaptive Codebuch jeden 5–10 ms Teilrahmen aktualisiert wird.
  • Der Analyseteil des LPAS-Kodierers führt eine LPC-Analyse des eingehenden Sprachsignals s(n) durch, und führt auch eine Anregungsanalyse durch.
  • Die LPC-Analyse wird durch ein LPC-Analysefilter 10 durchgeführt. Dieses Filter empfängt das Sprachsignal s(n) und baut ein parametrisches Modell dieses Signals auf einer Basis Rahmen für Rahmen auf. Die Modellparameter sind so ausgewählt, um die Energie eines Restvektors zu minimieren, der durch die Differenz zwischen einem tatsächlichen Sprachrahmenvektor und dem entsprechenden Signalvektor, der durch das Modell erzeugt wird, gebildet wird. Die Modellparameter werden durch die Filterkoeffizienten des Analysefilters 10 dargestellt. Diese Filterkoeffizienten definieren die Transferfunktion A(z) des Filters. Da das Analysefilter 12 eine Transferfunktion hat, die mindestens annähernd gleich 1/A(z) ist, werden diese Filterkoeffizienten auch das Synthesefilter 12 steuern, wie durch die gestrichelte Steuerlinie angezeigt wird.
  • Die Anregungsanalyse wird durchgeführt, um die beste Kombination des festen Codebuchvektors (Codebuchindex), Verstärkung gF, adaptiven Codebuchvektors (Nachlauf) und Verstärkung gA zu bestimmen, was zu dem synthetischen Signalvektor {ŝ(n)} führt, der am besten zu dem Sprachsignalvektor {s(n)} passt (hier bezeichnet {} eine Sammlung von Abtastungen, die einen Vektor oder Rahmen bilden). Dies geschieht in einer erschöpfenden Suche, die alle möglichen Kombinationen dieser Parameter testet (suboptimale Suchschemata, in denen einige Parameter unabhängig von den anderen Parametern bestimmt werden und dann während der Suche nach den verbleibenden Parametern fixiert gehalten werden, sind auch möglich). Um zu testen, wie nahe ein synthetischer Vektor {ŝ(n)} dem entsprechenden Sprachvektor {s(n)} ist, kann die Energie des Differenzvektors {e(n)} (gebildet in einem Addierer 26) in einem Energiekalkulator 30 kalkuliert werden. Es ist jedoch effizienter, die Energie eines gewichteten Fehlersignalvektors {ew(n)} zu betrachten, worin die Fehler auf eine derartige Weise neu verteilt wurden, dass große Fehler durch große Amplitudenfrequenzbänder maskiert sind. Dies geschieht in dem Gewichtungsfilter 28.
  • Die Modifikation des Einzelkanal-LPAS-Kodierers von 1 zu einem Mehrkanal-LPAS-Kodierer in Übereinstimmung mit [3] wird nun mit Verweis auf 23 beschrieben. Es wird ein Zweikanal-(Stereo)Sprachsignal angenommen, die gleichen Prinzipien können aber auch für mehr als zwei Kanäle verwendet werden.
  • 2 ist ein Blockdiagramm einer Ausführungsform des Analyseteils des Mehrkanal-LPAS-Sprachkodierers, der in [3] beschrieben wird. In 2 ist das Eingangssignal nun ein Mehrkanalsignal, wie durch Signalkomponenten s1(n), s2(n) angezeigt wird. Das LPC-Analysefilter 10 in 1 wurde durch einen LPC-Analysefilterblock 10M mit einer Matrixwert-Transferfunktion A(z) ersetzt. Ähnlich werden der Addierer 26, das Gewichtungsfilter 28 und der Energiekalkulator 30 durch entsprechende Mehrkanalblöcke 26M, 28M bzw. 30M ersetzt.
  • 3 ist ein Blockdiagramm einer Ausführungsform des Syntheseteils des Mehrkanal-LPAS-Sprachkodierers, der in [3] beschrieben wird. Ein Mehrkanaldekoder kann auch durch einen derartigen Syntheseteil gebildet werden. Hier wurde das LPC-Synthesefilter 12 in 1 durch einen LPC-Synthesefilterblock 12M mit einer Matrixwert-Transferfunktion A–1(z) ersetzt, die (wie durch die Notation angezeigt) mindestens annähernd gleich der Umkehrung von A(z) ist. Ähnlich werden der Addierer 22, das feste Codebuch 16, das Verstärkungselement 20, das Verzögerungselement 24, das adaptive Codebuch 14 und das Verstärkungselement 18 durch entsprechende Mehrkanalblöcke 22M, 16M, 24M, 14M bzw. 18M ersetzt.
  • Die folgende Beschreibung eines eingebetteten Mehrkanal-LPAS-Kodierers in Übereinstimmung mit der vorliegenden Erfindung wird nun beschreiben, wie die Kodierungsflexibilität in den verschiedenen Blöcken erhöht werden kann. Es ist jedoch zu verstehen, dass nicht alle Blöcke auf die beschriebene Weise konfiguriert werden müssen. Der genaue Ausgleich zwischen Kodierungsflexibilität und Komplexität muss für die einzelne Kodiererimplementierung entschieden werden.
  • 4 ist ein Blockdiagramm einer beispielhaften Ausführungsform des Syntheseteils eines Mehrkanal-LPAS-Sprachkodierers in Übereinstimmung mit der vorliegenden Erfindung.
  • Ein wesentliches Merkmal des Kodierers ist der Aufbau des mehrteiligen festen Codebuchs. Es enthält einzelne feste Codebücher FC1, FC2 für jeden Kanal. Typischerweise umfassen die festen Codebücher algebraische Codebücher, in denen die Anregungsvektoren durch Einheitenimpulse gebildet werden, die über jedem Vektor in Übereinstimmung mit gewissen Regeln verteilt sind (dies ist in der Technik gut bekannt und wird hierin nicht weiter detailliert beschrieben). Die einzelnen festen Codebücher FC1, FC2 stehen mit einzelnen Verstärkungen gF1, gF2 in Verbindung. Ein wesentliches Merkmal der vorliegenden Erfindung besteht darin, dass eines der festen Codebücher, typischerweise das Codebuch, das mit dem stärksten oder führenden (Mono) Kanal in Verbindung steht, auch durch den schwächeren oder nacheilenden Kanal über ein Nachlauf- oder Verzögerungselement D (welches entweder ganzzahlig oder fraktional sein kann) und eine Interkanalverstärkung gF12 gemeinsam genutzt werden kann.
  • In dem Idealfall, wo jeder Kanal aus einer skalierten und übersetzten Version des gleichen Signals (echofreier Raum) besteht, ist nur das gemeinsam genutzte Codebuch des führenden Kanals erforderlich, und der Nachlaufwert D entspricht direkt der Schallausbreitungszeit. In dem entgegengesetzten Fall, wo Interkanalkorrelation sehr gering ist, sind zwei getrennte feste Codebücher für die nachlaufenden Kanäle erforderlich.
  • Mit nur einem Kreuzkanalzweig in dem festen Codebuch müssen der führende und nachlaufende Kanal Rahmen für Rahmen bestimmt werden. Da sich der führende Kanal ändern kann, gibt es synchron gesteuerte Schalter SW1, SW2, um den Nachlauf D und die Verstärkung gF12 mit dem richtigen Kanal in Verbindung zu bringen. In der Konfiguration in 4 ist Kanal 1 der führende Kanal, und Kanal 2 ist der nachlaufende Kanal. Durch Schalten beider Schalter SW1, SW2 zu ihren entgegengesetzten Zuständen werden die Rollen umgekehrt. Um starkes Schalten des führenden Kanals zu vermeiden, kann es erforderlich sein, dass eine Änderung nur möglich ist, falls der gleiche führende Kanal für eine Zahl von fortlaufenden Rahmen ausgewählt wurde.
  • Eine mögliche Modifikation besteht darin, weniger Impulse für das feste Codebuch des nachlaufenden Kanals als für das feste Codebuch des führenden Kanals zu verwenden. In dieser Ausführungsform wird die feste Codebuchlänge verringert, wenn ein Kanal zu einem nachlaufenden Kanal zurückgestuft und zurück zu der ursprünglichen Größe erhöht wird, wenn er zurück zu einem führenden Kanal geändert wird.
  • Obwohl 4 einen Zweikanal-Festcodebuchaufbau veranschaulicht, wird erkannt, dass die Konzepte leicht auf mehr Kanäle verallgemeinert werden, indem die Zahl einzelner Codebücher und die Zahl von Nachläufen und Interkanalverstärkungen erhöht wird.
  • Die festen Codebücher des führenden und nachlaufenden Kanals werden typischerweise in serieller Reihenfolge durchsucht. Die bevorzugte Reihenfolge besteht darin, zuerst den festen Codebuchanregungsvektor des führenden Kanals, Nachläufe und Verstärkungen zu bestimmen. Danach werden die einzelnen festen Codebuchvektoren und Verstärkungen von nachlaufenden Kanälen bestimmt.
  • 5 ist ein Flussdiagramm einer Ausführungsform eines Suchverfahrens eines mehrteiligen festen Codebuchs in Übereinstimmung mit der vorliegenden Erfindung. Schritt S1 bestimmt und kodiert einen führenden Kanal, typischerweise den stärksten Kanal (den Kanal, der die größte Rahmenenergie hat). Schritt S2 bestimmt die Kreuzkorrelation zwischen jedem nacheilenden Kanal und dem führenden Kanal für ein vorbestimmtes Intervall, z.B. einen Teil von einem oder einen vollständigen Rahmen. Schritt S3 speichert Nachlaufkandidaten für jeden nachlaufenden Kanal. Diese Nachlaufkandidaten werden durch die Positionen einer Zahl der höchsten Kreuzkorrelationsspitzen und der engsten Positionen um jede Spitze herum für jeden nachlaufenden Kanal definiert. Man könnte z.B. die 3 höchsten Spitzen auswählen, und dann die engsten Positionen auf beiden Seiten für jede Spitze hinzufügen, was insgesamt 9 Nachlaufkandidaten pro nachlaufendem Kanal ergibt. Falls Hochauflösungs-(fraktionale)Nachläufe verwendet werden, kann die Zahl von Kandidaten um jede Spitze herum auf z.B. 5 oder 7 erhöht werden. Die höhere Auflösung kann durch Auf-Abtasten (up-sampling) des Eingangssignals erhalten werden. Schritt S4 wählt die beste Nachlaufkombination. Schritt S5 bestimmt die optimalen Interkanalverstärkungen. Schließlich bestimmt Schritt S6 die Nachlaufkanalanregungen und Verstärkungen.
  • Für die festen Codebuchverstärkungen erfordert jeder nachlaufende Kanal eine Interkanalverstärkung zu dem festen Codebuch des führenden Kanals und eine Verstärkung für das einzelne Codebuch. Diese Verstärkungen werden typischerweise signifikante Korrelation zwischen den Kanälen aufweisen. Sie werden auch zu Verstärkungen in dem adaptiven Codebuch korreliert sein. Somit werden Interkanalvorhersagen dieser Verstärkungen möglich sein.
  • Zurückkehrend zu 4 enthält das mehrteilige adaptive Codebuch ein adaptives Codebuch AC1, AC2 für jeden Kanal. Ein mehrteiliges adaptives Codebuch kann auf eine Reihe von Wegen in einem Mehrkanalkodierer konfiguriert sein. Beispiele sind:
    • 1. Alle Kanäle nutzen einen einzelnen Tonhöhennachlauf (pitch lag) gemeinsam. Jeder Kanal kann getrennte Tonhöhenverstärkungen gA11, gA22 für eine verbesserte Vorhersage aufweisen. Der gemeinsam genutzte Tonhöhennachlauf wird auf eine Weise einer geschlossenen Schleife in dem führenden (Mono) Kanal gesucht und dann in den nachlaufenden Kanälen verwendet.
    • 2. Jeder Kanal hat einen getrennten Tonhöhennachlauf P11, P22. Die Tonhöhennachlaufwerte der nachlaufenden Kanäle können verschieden von dem Tonhöhennachlauf des führenden Kanals oder absolut kodiert werden. Die Suche nach den Tonhöhennachläufen des nachlaufen Kanals kann um den Tonhöhennachlaufwert des führenden (Mono) Kanals herum geschehen.
    • 3. Die Anregungshistorie kann auf eine Kreuzkanalweise verwendet werden. Es kann ein einzelner Kreuzkanal-Anregungszweig verwendet werden, wie etwa Vorhersagekanal 2 mit der Anregungshistorie vom führenden Kanal 1 in einem Nachlauf abstand P12. Synchron gesteuerte Schalter SW3, SW4 verbinden, abhängig davon, welcher Kanal führend ist, die Kreuzkanalanregung mit dem richtigen Addierer AA1, AA2 über eine Kreuzkanalverstärkung gA12.
  • Wie in dem Fall mit dem festen Codebuch ist der beschriebene adaptive Codebuchaufbau sehr flexibel und für Multimodusoperation geeignet. Die Wahl, ob gemeinsam genutzte oder individuelle Tonhöhennachläufe verwendet werden, kann auf der Restsignalenergie beruhen. In einem ersten Schritt wird die Restenergie des optimalen gemeinsam genutzten Tonhöhennachlaufs bestimmt. In einem zweiten Schritt wird die Restenergie der optimalen einzelnen Tonhöhennachläufe bestimmt. Falls die Restenergie des Falls des gemeinsam genutzten Tonhöhennachlaufs die Restenergie des Falls des einzelnen Tonhöhennachlaufs um einen vorbestimmten Betrag überschreitet, werden einzelne Tonhöhennachläufe verwendet. Anderenfalls wird ein gemeinsam genutzter Tonhöhennachlauf verwendet. Falls gewünscht, kann ein beweglicher Durchschnitt der Energiedifferenz verwendet werden, um die Entscheidung zu glätten.
  • Diese Strategie kann als eine Strategie einer "geschlossenen Schleife" betrachtet werden, um zwischen gemeinsam genutzten oder einzelnen Tonhöhennachläufen zu entscheiden. Eine andere Möglichkeit ist eine Strategie einer "offenen Schleife", die z.B. auf Interkanalkorrelation beruht. In diesem Fall wird ein gemeinsam genutzter Tonhöhennachlauf verwendet, falls die Interkanalkorrelation eine vorbestimmte Schwelle überschreitet. Anderenfalls werden einzelne Tonhöhennachläufen verwendet.
  • Es können ähnliche Strategien verwendet werden um zu entscheiden, ob Interkanal-Tonhöhennachläufe verwendet werden oder nicht.
  • Des weiteren ist eine beträchtliche Korrelation zwischen den adaptiven Codebuchverstärkungen unterschiedlicher Kanäle zu erwarten. Diese Verstärkungen können aus der internen Verstärkungshistorie des Kanals, aus Verstärkungen in dem gleichen Rahmen, der aber zu anderen Kanälen gehört; und auch aus festen Codebuchverstärkungen vorhergesagt werden.
  • In dem LPC-Synthesefilterblock 12M in 4 verwendet jeder Kanal ein einzelnes LPC-(Linearvorhersagekodierungs-)Filter. Diese Filter können auf die gleiche Weise wie in dem Fall eines einzelnen Kanals unabhängig abgeleitet werden. Einige oder alle der Kanäle können jedoch auch das gleiche LPC-Filter gemeinsam nutzen. Dies erlaubt Umschaltung zwischen Multi- und Einzelfiltermodi abhängig von Signaleigenschaften, z.B. spektralen Abständen zwischen LPC-Spektra. Falls Interkanalvorhersage für die LSP-(Linienspektralpaare)Parameter verwendet wird, wird die Vorhersage für Modi geringer Korrelation ausgeschaltet oder reduziert.
  • 6 ist ein Blockdiagramm einer beispielhaften Ausführungsform des Analyseteils eines Mehrkanal-LPAS-Sprachkodierers in Übereinstimmung mit der vorliegenden Erfindung. Zusätzlich zu den Blöcken, die mit Verweis auf 1 und 2 bereits beschrieben wurden, enthält der Analyseteil in 7 einen Multimodus-Analyseblock 40. Block 40 bestimmt die Interkanalkorrelation um zu bestimmen, ob es ausreichend Korrelation zwischen den nachlaufenden Kanälen und dem führenden Kanal gibt, um Kodierung der nachlaufenden Kanäle unter Verwendung nur des festen Codebuchs des führenden Kanals, Nachlauf D und Verstärkung gF12 zu rechtfertigen. Falls nicht, wird es notwendig sein, die einzelnen festen Codebücher und Verstärkungen für die nachlaufenden Kanäle zu verwenden. Die Korrelation kann durch die gewöhnliche Korrelation in der Zeitdomäne bestimmt werden, d.h. durch Verschieben der sekundären Kanalsignale mit Bezug auf das primäre Signal, bis die beste Anpassung erhalten wird. Falls es mehr als zwei Kanäle gibt, wird das feste Codebuch des führenden Kanals als ein gemeinsam genutztes festes Codebuch verwendet, falls der kleinste Korrelationswert eine vorbestimmte Schwelle überschreitet. Eine andere Möglichkeit besteht darin, ein gemeinsam genutztes festes Codebuch für die Kanäle, die eine Korrelation zu dem führenden Kanal aufweisen, die eine vorbestimmte Schwelle überschreitet, und einzelne feste Codebücher für die verbleibenden Kanäle zu verwenden. Die genaue Schwelle kann durch Hörtests bestimmt werden.
  • Die Funktionalität der verschiedenen Elemente der beschriebenen Ausführungsformen der vorliegenden Erfindung werden typischerweise durch einen oder mehrere Mikroprozessoren oder Mikro-/Signalprozessorkombinationen und entsprechende Software implementiert.
  • In den Figuren sind mehrere Blöcke und Parameter optional und können basierend auf den Charakteristika des Mehrkanalsignals und einer übergreifenden Sprachqualitätsanforderung verwendet werden. Bits in dem Kodierer können zugeordnet werden, wo sie am besten benötigt werden. Auf einer Basis Rahmen für Rahmen kann der Kodierer wählen, Bits zwischen dem LPC-Teil, dem adaptiven und festen Codebuch unterschiedlich zu verteilen. Dies ist ein Typ einer Intrakanal-Multimodusoperation.
  • Ein anderer Typ von Multimodusoperation besteht darin, Bits in dem Kodierer zwischen den Kanälen zu verteilen (asymmetrische Kodierung). Dies wird als Interkanal-Multimodusoperation bezeichnet. Ein Beispiel hier wäre ein größeres festes Codebuch für einen/einige der Kanäle oder Kodiererverstärkungen, die mit mehr Bits in einem Kanal kodiert sind. Die zwei Typen von Multimodusoperation können kombiniert werden, um die Quellensignalcharakteristika effizient auszunutzen.
  • Die Multimodusoperation kann auf eine Weise einer geschlossenen Schleife oder mit einem Verfahren offener Schleife gesteuert werden. Das Verfahren geschlossener Schleife bestimmt einen Modus abhängig von einem Restkodierungsfehler für jeden Modus. Dies ist ein konzeptionell aufwändiges Verfahren. In einem Verfahren offener Schleife wird der Kodierungsmodus durch Entscheidungen basierend auf Eingangssignalcharakteristika bestimmt. In dem Intrakanalfall wird der Modus variabler Rate basierend auf z.B. Stimmhaftigkeit, spektralen Charakteristika und Signalenergie bestimmt, wie in [4] beschrieben wird. Für Interkanalmodusentscheidungen können die Interkanal-Kreuzkorrelationsfunktion oder eine Spektralabstandsfunktion verwendet werden, um den Modus zu bestimmen. Für Rauschen und stimmlose Kodierung ist es relevanter, die Mehrkanal-Korrelationseigenschaften in der Frequenzdomäne zu verwenden. Eine Kombination von Techniken offener Schleife und geschlossener Schleife ist auch möglich. Die Analyse offener Schleife entscheidet über einige Kandidatenmodi, die kodiert werden, und dann wird der endgültige Restfehler in einer Entscheidung geschlossener Schleife verwendet.
  • Mehrkanalvorhersage (zwischen dem führenden Kanal und den nacheilenden Kanälen) kann für hohe Interkanal-Korrelationsmodi verwendet werden, um die Zahl von Bits zu reduzieren, die für die Mehrkanal-LPAS-Verstärkung und LPC-Parameter erforderlich sind.
  • Es kann auch eine Technik, die als verallgemeinerte LPAS (siehe [5]) bekannt ist, in einem Mehrkanal-LPAS-Kodierer der vorliegenden Erfindung verwendet werden. Kurz gesagt bezieht diese Technik Vorverarbeitung des Eingangssignals auf einer Basis Rahmen für Rahmen vor einer tatsächlichen Kodierung ein. Es werden mehrere mögliche modifizierte Signale untersucht, und das eine, das mit der geringsten Verzerrung ko diert werden kann, wird als das Signal ausgewählt, das zu kodieren ist.
  • Die obige Beschreibung hat sich hauptsächlich auf einen Kodierer gerichtet. Der entsprechende Dekodierer würde nur den Syntheseteil eines derartigen Kodierers enthalten. Typischerweise wird eine Kombination aus Kodierer/Dekodierer in einem Endgerät verwendet, das kodierte Signale über einen in der Bandbreite begrenzten Kommunikationskanal überträgt/empfängt. Das Endgerät kann ein Funkendgerät in einem zellularen Telefon oder eine Basisstation sein. Ein derartiges Endgerät würde auch verschiedene andere Elemente enthalten, wie etwa eine Antenne, einen Verstärker, einen Entzerrer, einen Kanalkodierer/Dekodierer etc. Diese Elemente sind jedoch für eine Beschreibung der vorliegenden Erfindung nicht wesentlich und wurden deshalb weggelassen.
  • Es wird durch einen Fachmann verstanden, dass verschiedene Modifikationen und Änderungen an der vorliegenden Erfindung durchgeführt werden können, ohne von ihrem Bereich abzuweichen, der durch die angefügten Ansprüche definiert wird.
  • LITERATURSTELLEN
    • [1] A. Gersho, "Advances in Speech and Audio Compression", Proc. of the IEEE, Vol. 82, Nr. 6, S. 900–918, Juni 1994
    • [2] A. S. Spanias, "Speech Coding: A Tutorial Review", Proc. of the IEEE, Vol. 82, Nr. 6, S. 1541–1582, Okt. 1994
    • [3] WO 00/19413 (Telefonaktiebolaget LM Ericsson)
    • [4] Allen Gersho et al, "Variable rate speech coding for cellular networks", S. 77–84, Speech and audio coding for wireless and network applications, Kluwer Academic Press, 1993
    • [5] Bastiaan Kleijn et al, "Generalized analysis-by-synthesis coding and its application to pitch prediction", S. 337–340, In Proc. IEEE Int. Conf. Acoust., Speech and Signal Processing, 1992

Claims (17)

  1. Ein Mehrkanal-Linearvorhersage-Analyse-durch-Synthese-Signalkodierungsverfahren, umfassend: Bestimmen eines führenden Kanals und mindestens eines nachlaufenden Kanals, der dem führenden Kanal nacheilt; Kodieren des führenden Kanals als einen eingebetteten Bitstrom; Kodieren der nachlaufenden Kanäle als einen Bitstrom, der verworfen werden kann; und Auswählen eines Nachlaufkanal-Kodierungsmodus abhängig von Interkanalkorrelation zu dem führenden Kanal.
  2. Das Verfahren nach Anspruch 1, gekennzeichnet dadurch, dass auswählbare Kodierungsmodi zu einer festen Bruttobitrate führen.
  3. Das Verfahren nach Anspruch 1 oder 2, gekennzeichnet dadurch, dass auswählbare Kodierungsmodi zu einer variablen Bruttobitrate führen können.
  4. Das Verfahren nach beliebigen der vorangehenden Ansprüche, gekennzeichnet durch Verwenden kanalspezifischer LPC-Filter für geringe Interkanalkorrelation; und gemeinsames Nutzen des LPC-Filters des führenden Kanals für hohe Interkanalkorrelation.
  5. Das Verfahren nach beliebigen der vorangehenden Ansprüche, gekennzeichnet durch Verwenden kanalspezifischer fester Codebücher für geringe Interkanalkorrelation; und gemeinsames Nutzen des festen Codebuchs des führenden Kanals für hohe Interkanalkorrelation.
  6. Das Verfahren nach Anspruch 5, gekennzeichnet durch Verwenden eines Interkanalnachlaufs von dem festen Codebuch des führenden Kanals zu jedem nachlaufenden Kanal.
  7. Das Verfahren nach beliebigen der vorangehenden Ansprüche, gekennzeichnet durch adaptives Verteilen von Bits zwischen festen Codebüchern des nachlaufenden Kanals und dem festen Codebuch des führenden Kanals abhängig von Interkanalkorrelation.
  8. Das Verfahren nach beliebigen der vorangehenden Ansprüche, gekennzeichnet durch Verwenden kanalspezifischer Adaptivcodebuchnachläufe für geringe Interkanalkorrelation; und Verwenden eines gemeinsam genutzten Adaptivcodebuchnachlaufes für hohe Interkanalkorrelation.
  9. Das Verfahren nach Anspruch 8, gekennzeichnet durch Verwenden eines Interkanal-Adaptivcodebuchnachlaufes von dem adaptiven Codebuch des führenden Kanals zu jedem nachlaufenden Kanal.
  10. Ein Mehrkanal-Linearvorhersage-Analyse-durch-Synthese-Signalkodierer, umfassend: Mittel (40) zum Bestimmen eines führenden Kanals und mindestens eines nachlaufenden Kanals, der dem führenden Kanal nacheilt; Mittel zum Kodieren des führenden Kanals als einen eingebetteten Bitstrom; Mittel zum Kodieren von nachlaufenden Kanälen als einen Bitstrom, der verworfen werden kann; und Mittel (40) zum Auswählen eines Nachlaufkanal-Kodierungsmodus abhängig von Interkanalkorrelation zu dem führenden Kanal.
  11. Der Kodierer nach Anspruch 10, gekennzeichnet durch kanalspezifische LPC-Filter für geringe Interkanalkorrelation; und ein gemeinsam genutztes Führungskanal-LPC-Filter für hohe Interkanalkorrelation.
  12. Der Kodierer nach Ansprüchen 10 oder 11, gekennzeichnet durch kanalspezifische feste Codebücher für geringe Interkanalkorrelation; und ein gemeinsam genutztes festes Codebuch des führenden Kanals für hohe Interkanalkorrelation.
  13. Der Kodierer nach Anspruch 12, gekennzeichnet durch einen Interkanalnachlauf (D) von dem festen Codebuch des führenden Kanals zu jedem nachlaufenden Kanal.
  14. Der Kodierer nach beliebigen der vorangehenden Ansprüche 10–13, gekennzeichnet durch Mittel (40) zum adaptiven Verteilen von Bits zwischen festen Codebüchern des nachlaufenden Kanals und dem festen Codebuch des führenden Kanals abhängig von Interkanalkorrelation.
  15. Der Kodierer nach beliebigen der vorangehenden Ansprüche 10–14, gekennzeichnet durch kanalspezifische Adaptivcodebuchnachläufe (P11, P22) für geringe Interkanalkorrelation; und einen gemeinsam genutzten Adaptivcodebuchnachlauf für hohe Interkanalkorrelation.
  16. Der Kodierer nach Anspruch 15, gekennzeichnet durch einen Interkanal-Adaptivcodebuchnachlauf (P12) von dem adaptiven Codebuch des führenden Kanals zu jedem nachlaufenden Kanal.
  17. Ein Endgerät, das einen Mehrkanal-Linearvorhersage-Analyse-durch-Synthese-Signalkodierer nach beliebigen von Ansprüchen 10–16 enthält.
DE60127566T 2000-09-15 2001-09-05 Mehrkanal-signalcodierung und -decodierung Expired - Lifetime DE60127566T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0003287 2000-09-15
SE0003287A SE519985C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler
PCT/SE2001/001886 WO2002023529A1 (en) 2000-09-15 2001-09-05 Multi-channel signal encoding and decoding

Publications (2)

Publication Number Publication Date
DE60127566D1 DE60127566D1 (de) 2007-05-10
DE60127566T2 true DE60127566T2 (de) 2007-08-16

Family

ID=20281034

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60127566T Expired - Lifetime DE60127566T2 (de) 2000-09-15 2001-09-05 Mehrkanal-signalcodierung und -decodierung

Country Status (8)

Country Link
US (1) US7263480B2 (de)
EP (1) EP1325495B1 (de)
JP (1) JP4498677B2 (de)
AT (1) ATE358317T1 (de)
AU (1) AU2001286350A1 (de)
DE (1) DE60127566T2 (de)
SE (1) SE519985C2 (de)
WO (1) WO2002023529A1 (de)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
SE519976C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
FI121583B (fi) * 2002-07-05 2011-01-14 Syslore Oy Symbolijonon etsintä
US7742912B2 (en) * 2004-06-21 2010-06-22 Koninklijke Philips Electronics N.V. Method and apparatus to encode and decode multi-channel audio signals
WO2006009075A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
BRPI0514998A (pt) * 2004-08-26 2008-07-01 Matsushita Electric Ind Co Ltd equipamento de codificação de sinal de canal múltiplo e equipamento de decodificação de sinal de canal múltiplo
EP1801782A4 (de) * 2004-09-28 2008-09-24 Matsushita Electric Ind Co Ltd Vorrichtung und verfahren zur skalierbaren codierung
US7904292B2 (en) * 2004-09-30 2011-03-08 Panasonic Corporation Scalable encoding device, scalable decoding device, and method thereof
RU2007120056A (ru) 2004-11-30 2008-12-10 Мацусита Электрик Индастриал Ко. Устройство стереокодирования, устройство стереодекодирования и способы стереокодирования и стереодекодирования
WO2006070751A1 (ja) 2004-12-27 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JP4842147B2 (ja) * 2004-12-28 2011-12-21 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
CN101116137B (zh) 2005-02-10 2011-02-09 松下电器产业株式会社 语音编码中的脉冲分配方法
EP1691348A1 (de) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametrische kombinierte Kodierung von Audio-Quellen
EP1851866B1 (de) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bitzuweisung für die mehrkanal-audiokodierung
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
JP4599558B2 (ja) * 2005-04-22 2010-12-15 国立大学法人九州工業大学 ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
US8428956B2 (en) 2005-04-28 2013-04-23 Panasonic Corporation Audio encoding device and audio encoding method
CN101167124B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
FR2916079A1 (fr) 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
CN101802907B (zh) 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
NO2669468T3 (de) * 2011-05-11 2018-06-02
CN110728986B (zh) 2018-06-29 2022-10-18 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
GB2580899A (en) * 2019-01-22 2020-08-05 Nokia Technologies Oy Audio representation and associated rendering
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744511B2 (ja) * 1988-09-14 1995-05-15 富士通株式会社 高郊率多重化方式
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
EP0464839B1 (de) * 1990-07-05 2000-09-27 Fujitsu Limited Digitalmultiplex-Übertragungssystem
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
US6345246B1 (en) 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP3099876B2 (ja) * 1997-02-05 2000-10-16 日本電信電話株式会社 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
TW510830B (en) * 1999-08-10 2002-11-21 Sumitomo Metal Ind Method for treating hazardous material
DE19959156C2 (de) * 1999-12-08 2002-01-31 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals

Also Published As

Publication number Publication date
US7263480B2 (en) 2007-08-28
JP2004509367A (ja) 2004-03-25
ATE358317T1 (de) 2007-04-15
EP1325495B1 (de) 2007-03-28
AU2001286350A1 (en) 2002-03-26
WO2002023529A1 (en) 2002-03-21
EP1325495A1 (de) 2003-07-09
JP4498677B2 (ja) 2010-07-07
SE519985C2 (sv) 2003-05-06
SE0003287L (sv) 2002-03-16
US20030191635A1 (en) 2003-10-09
SE0003287D0 (sv) 2000-09-15
DE60127566D1 (de) 2007-05-10

Similar Documents

Publication Publication Date Title
DE60127566T2 (de) Mehrkanal-signalcodierung und -decodierung
DE60128711T2 (de) Mehrkanal-signalcodierung und -decodierung
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE60131009T2 (de) Mehrkanal-signalcodierung
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE60024123T2 (de) Lpc-harmonischer sprachkodierer mit überrahmenformat
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE60219351T2 (de) Signaländerungsverfahren zur effizienten kodierung von sprachsignalen
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE69735097T2 (de) Verfahren und vorrichtung zur verbesserung der sprachqualität in tandem-sprachkodierern
CN102411933B (zh) 解码装置和解码方法
DE60124274T2 (de) Codebuchstruktur und suchverfahren für die sprachkodierung
DE602004004950T2 (de) Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
DE60021083T2 (de) Verfahren zur verbesserung der kodierungseffizienz eines audiosignals
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
AU2001282801A1 (en) Multi-channel signal encoding and decoding
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE4491015C2 (de) Verfahren zum Erzeugen eines Spektralrauschbewertungsfilters zur Verwendung in einem Sprachcoder

Legal Events

Date Code Title Description
8364 No opposition during term of opposition