DE69630477T2 - Breitbandsignalcodierer - Google Patents

Breitbandsignalcodierer Download PDF

Info

Publication number
DE69630477T2
DE69630477T2 DE69630477T DE69630477T DE69630477T2 DE 69630477 T2 DE69630477 T2 DE 69630477T2 DE 69630477 T DE69630477 T DE 69630477T DE 69630477 T DE69630477 T DE 69630477T DE 69630477 T2 DE69630477 T2 DE 69630477T2
Authority
DE
Germany
Prior art keywords
circuit
signal
block
transformation
output signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69630477T
Other languages
English (en)
Other versions
DE69630477D1 (de
Inventor
Kazunori Minato-ku Ozawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Application granted granted Critical
Publication of DE69630477D1 publication Critical patent/DE69630477D1/de
Publication of DE69630477T2 publication Critical patent/DE69630477T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Description

  • Die Erfindung betrifft einen Breitbandsignalcodierer zum hochqualitativen Codieren von Breitbandsignalen, z. B. Tonsignalen, mit niedrigen Bitraten, insbesondere etwa 64 kb/s.
  • Als System zum Codieren eines Breitbandsignals, z. B. eines Tonsignals mit einer niedrigen Bitrate, normalerweise etwa 128 kb/s pro Kanal, ist ein bekanntes Toncodiersystem offenbart in Jonston et al., "Transform Coding of Audio Signals Using Perceptual Noise Criteria", IEEE J. Sel. Areas Common., Seite 314–323, 1988 (Dokument 1).
  • In dem in Dokument 1 offenbarten Verfahren wird auf der Sendeseite ein Eingangssignal durch FFT (schnelle Fourier-Transformation) in Frequenzkomponenten für jeden Block (z. B. 2048 Abtastwerte) umgesetzt, die derartig ermittelten FFT-Komponenten werden dann in 25 kritische Bänder unterteilt, eine akustische Ausblendschwelle wird dann für jede Ausblendschwelle errechnet, und jedem kritischen Band wird auf der Grundlage der Ausblendschwelle eine Quantisierungsbitanzahl zugewiesen. Außerdem werden die FFT-Komponenten einer Untersetzungsquantisierung entsprechend den Quantisierungsbitanzahlen unterzogen. Die Untersetzungsquantisierungsinformation, die Bitzuweisungsinformation und die Quantisierungsschrittgrößeninformation werden kombiniert für jeden Block zur Empfangsseite übertragen. Die Empfangsseite wird nicht beschrieben.
  • In dem oben beschriebenen bekannten Verfahren, das in Dokument 1 dargestellt ist, ist (1) die Quantisierungseffizienz wegen der Untersetzungsquantisierung, die zur Quantisierung der FFT-Komponenten verwendet wird, nicht so hoch und (2) keine Zwischenblockbitzuweisung vorgesehen, obwohl eine Bitzuweisung für die Innenblock-FFT-Komponenten erfolgt, so daß aufgrund der Bitzuweisung keine ausreichende Verstärkung für Übergangssignale erreicht werden kann. Deshalb führt eine Bitratenverringerung bis auf 64 kb/s zu einer Quantisierungseffizienzverringerung, die die Tonqualität extrem verschlechtert.
  • Unter einem ersten Aspekt der Erfindung wird gemäß den Ansprüchen 1 bis 6 die Blocklänge dadurch bestimmt, daß eine Merkmalsgröße aus dem Eingangssignal ermittelt wird und eine Transformation des Eingangssignals in Frequenzkomponenten für jede Blocklänge ausgeführt wird. Die Transformation, die denkbar ist, ist die MDCT (modifizierte diskrete Cosinustransformation), DCT (diskrete Cosinustransformation) oder die Transformation mit bandgeteilter Bandpaßfilterbank. Näheres zu MDCT findet sich in Priecen et al., "Analysis-Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation", IEEE Trans. ASSP, Seite 1153–1165, 1986 (Dokument 2). Eine Ausblendschwelle wird aus dem Ausgangssignal der Transformationsschaltung oder dem Eingangssignal auf der Grundlage einer akustischen Ausblendcharakteristik ermittelt, und eine Zwischenblockquantisierungsbitanzahl und/oder Zuweisungen einer Innenblockquantisierungsbitanzahl entsprechend einem Transformationsschaltungsausgangsvektor werden auf der Grundlage der Ausblendschwelle bestimmt. Das Transformationsausgangssignal wird unter Verwendung eines Codebuchs einer Bitanzahl entsprechend der Bitzuweisung vektorquantisiert, und ein optimaler Codevektor wird aus dem Codebuch gewählt.
  • Unter einem zweiten Aspekt der Erfindung wird ein Vorhersagefehlersignal durch Vorhersage eines Transformationssignals für den gegenwärtigen Block aus dem quantisierten Ausgangssignal für einen vergangenen Block ermittelt. Die Ausblendschwelle wird aus dem Transformationsausgangssignal, dem Eingangssignal oder dem Vorhersagefehlersignal auf der Grundlage einer akustischen Ausblendcharakteristik ermittelt. Zuweisungen der Zwischenblockquantisierungsbitanzahl und/oder der Innenblockquantisierungsbitanzahl entsprechend dem Transformationsausgangsvektor werden auf der Grundlage der über mittelten Ausblendschwelle bestimmt. Das Transformationsausgangssignal wird unter Verwendung eines Codebuchs der Bitanzahl entsprechend der Bitzuweisung vektorquantisiert, und ein optimaler Codevektor wird aus dem Codebuch gewählt.
  • Unter einem dritten Aspekt der Erfindung wird ein Vorhersagefehlersignal ermittelt, indem das Transformationsausgangssignal für den gegenwärtigen Block unter Verwendung des quantisierten Ausgangssignals für einen vergangenen Block und eines Vorhersagesignals für einen vergangenen Block ermittelt wird. Die Ausblendschwelle wird aus dem Transformationsausgangssignal, dem Eingangssignal oder dem Vorhersagefehlersignal auf der Grundlage einer akustischen Ausblendcharakteristik ermittelt. Die Zuweisung der Innenblockquantisierungsbitanzahl wird auf der Grundlage des Ausblendwerts ermittelt. Das Transformationsausgangssignal wird unter Verwendung eines Codebuchs einer Bitanzahl entsprechend der Bitzuweisung vektorquantisiert.
  • Unter einem vierten Aspekt der Erfindung wird die Blocklängenbewertungsschaltung und Zwischenblockbitzuweisung aus dem Codierer gemäß dem zweiten Aspekt der Erfindung entfernt.
  • Unter einem fünften Aspekt der Erfindung wird die Blocklängenbewertungsschaltung und die Zwischenblockbitzuweisung aus dem Codierer gemäß dem dritten Aspekt der Erfindung entfernt.
  • Unter einem sechsten Aspekt der Erfindung wird das Transformationsausgangssignal oder das Vorhersagefehlersignal im Codierer gemäß einem des ersten bis fünften Aspekts der Erfindung vektorquantisiert, während das Signal unter Verwendung der Ausblendschwelle gewichtet wird.
  • Unter einem siebten Aspekt der Erfindung wird das Transformationsausgangssignal oder das Vorhersagefehlersignal im Codierer gemäß einem des ersten bis fünften Aspekts der Erfindung vektorquantisiert, nachdem das Signal auf der Grundlage einer psychoakustischen Eigenschaft verarbeitet worden ist.
  • Unter einem achten Aspekt der Erfindung wird ein Niederstufenspektrumkoeffizient, der eine Frequenzhüllkurve des Transformationsausgangssignals der Transformationsschaltung oder des Vorhersagefehlersignals gemäß einem des ersten bis fünften Aspekts der Erfindung darstellt, ermittelt, und das Transformationsausgangssignal oder das Vorhersagefehlersignal wird unter Verwendung der Frequenzhüllkurve und des Ausgangssignals der Bitzuweisungsschaltung quantisiert.
  • Weitere Aufgaben und Merkmale werden in der nachfolgenden Beschreibung mit Bezug auf die beigefügten Zeichnungen deutlich.
  • Kurzbeschreibung der Zeichnungen
  • 1 ist ein Blockschaltbild, das eine Ausführungsform eines Breitbandsignalcodierers gemäß einem ersten Aspekt der Erfindung zeigt;
  • 2 ist ein Blockschaltbild, das eine Ausführungsform eines Breitbandsignalcodierers gemäß einem zweiten Aspekt der Erfindung zeigt;
  • 3 ist ein Blockschaltbild, das eine Struktur gemäß einem dritten Aspekt der Erfindung zeigt;
  • 4 ist ein Blockschaltbild, das eine Struktur gemäß einem vierten Aspekt der Erfindung zeigt;
  • 5 ist ein Blockschaltbild, das eine Struktur gemäß einem fünften Aspekt der Erfindung zeigt;
  • 6 ist ein Blockschaltbild, das eine Struktur gemäß einem sechsten Aspekt der Erfindung zeigt;
  • 7 ist ein Blockschaltbild, das ein Beispiel einer Wichtungsvektorquantisierungsschaltung 700 zeigt;
  • 8 ist ein Blockschaltbild, das eine Struktur gemäß einem siebten Aspekt der Erfindung zeigt;
  • 9 ist ein Blockschaltbild, das eine Struktur gemäß einem achten Aspekt der Erfindung zeigt; und
  • 10 ist ein Blockschaltbild, das eine Anordnung zeigt, in der ein Vorhersagefehlersignal quantisiert wird.
  • Ausführliche Beschreibung der bevorzugten Ausführungsformen
  • Mit Bezug auf 1, die eine Ausführungsform des Breitbandcodierers gemäß dem ersten Aspekt der Erfindung zeigt, wird auf der Sendeseite eines Systems ein Breitbandsignal von einem Eingangsanschluß 100 eingegeben, und ein Signalblock mit einer maximalen Blocklänge (z. B. 1.024 Abtastwerte) wird in einem Pufferspeicher 110 gespeichert. Eine Blocklängenbewertungsschaltung 120 schaltet die Blocklänge durch eine Entscheidung unter Verwendung einer vorbestimmten Merkmalgröße um, nämlich ob das Innenblocksignal ein Übergangs- oder Dauersignal ist. In der Schaltung 120 sind mehrere verschiedene Blocklängen verfügbar. Um die Beschreibung zu verkürzen, wird angenommen, daß zwei verschiedene Blocklängen, z. B. ein Block mit 1024 Abtastwerten und ein Block mit 256 Abtastwerten, verfügbar sind. Die Merkmalsgröße kann sein: Innenblocksignalleistungsänderungen mit der Zeit, vorhergesagte Verstärkung usw.
  • Eine Transformationsschaltung 200 empfängt ein Signal aus dem Pufferspeicher 110 und Blocklängendaten (die beispielsweise entweder einen Block mit 1024 oder 256 Abtastwerten darstellen) von der Blocklängenbewertungsschaltung 120, gibt ein Signal entsprechend der jeweiligen Blocklänge aus, multipliziert das ausgegebene Signal mit einem Fenster und führt mit dem multiplizierten Signal eine Transformation, nämlich eine MDCT, durch. Näheres zur Konfiguration des Fensters und zur MDCT findet sich beispielsweise in Dokument 2. Eine Ausblendschwellenberechnungsschaltung 250 empfängt das Ausgangssignal der Blocklängenbewertungsschaltung 120 und das Ausgangssignal aus dem Pufferspeicher 110 und berechnet einen Ausblendschwellwert entsprechend dem Signal für die Blocklänge. Die Ausblendschwellenberechnung kann folgendermaßen erfolgen. Mit dem Eingangssignal x(n) für die Blocklänge erfolgt eine FFT, um das Spektrum X(k) zu ermitteln (wobei k gleich 0 bis N – 1 ist) und außerdem ein Leistungsspektrum |X(k)|2 zu ermitteln, das unter Verwendung eines kritischen Bandpaßfilters oder eines akustischen Modells analysiert wird, um die Leistung oder den Effektivwert für jedes kriti sche Band zu berechnen. Die Leistungsberechnung erfolgt folgendermaßen. B(i) = Σk=bli bhi|X(k)|2 (i = 1 bis R) (1)wobei bli und bhi die untere bzw. die obere Grenzfrequenz im i-ten kritischen Band sind. R ist die Anzahl der kritischen Bänder, die im Sprachsignalband enthalten sind. Zu den kritischen Bändern siehe Dokument 1.
  • Dann wird eine Varianzfunktion zu dem kritischen Bandspektrum gefaltet, nämlich Ci = Σj=1 bmaxB1 sprd(j, i) (2)wobei sprd(j, i) die Varianzfunktion ist. Zu spezifischen Werten der Funktion siehe Dokument 1. bmax ist die Anzahl der kritischen Bänder, die bis zur Winkelfrequenz π enthalten sind.
  • Dann wird das Abdeckungsschwellspektrum Thi berechnet, nämlich T'i = Ci Ti (3)wobei gilt: Ti = 10–(oi/10) (4) Oi = α(14,5 + i) + 1(1 – α) 5,5 (5) α = minM [(NG/R), 1,0] (6)
  • Hier ist NG die Vorhersagbarkeit, und zu deren Berechnungsverfahren siehe im oben erwähnten Dokument 1. Wenn die absolute Schwelle verwendet wird, ergibt sich folgendes Ausblendschwellenspektrum, nämlich T''i = max[Ti, absthi] (7)wobei absthi die absolute Schwelle im kritischen Band i ist und im oben genannten Dokument 1 offenbart wird.
  • Die Ausblendschwellenspektrumdaten werden an eine Zwischenblock/Innenblockbitzuweisungsschaltung 300 ausgegeben. Die Zwischenblock/Innenblockbitzuweisungsschaltung 300 empfängt die Ausblendschwelle für jedes kritische Band und das Ausgangssignal der Blocklängenbewertungsschaltung 120 und führt, wenn die Blocklänge 1024 Abtastwerte lang ist, nur die Innenblockbitzuweisung aus. Wenn die Blocklänge 256 Abtastwerte lang ist, berechnet die Schaltung 300 die Bitanzahl B1 (wobei i gleich 1 bis 4 ist) jedes der vier aufeinanderfol genden Blöcke (d. h. insgesamt 1024 Abtastwerte) und führt dann die Innenblockzuweisung in bezug auf jeden der vier Blöcke aus. Bei der Innenblockzuweisung wird die Bitzuweisung für jedes kritische Band ausgeführt.
  • Die Innenblockzuweisung erfolgt folgendermaßen. Ein Signal/Ausblendschwellen-Verhältnis SMRji (wobei j gleich 1 bis Bmax, i gleich 1 bis 4 und Bmax gleich der Anzahl der kritischen Bänder ist) wird ermittelt, nämlich Ri = R + 1/2 log2[IIj=0 M–1SMRji]1/M/[IIi=1 LIIj=0 M-1SMRji]1/MxL (8)wobei Ri die Anzahl der Zuweisungsbits zum i-ten Teilrahmen ist, R die mittlere Bitanzahl der Quantisierung, M die Anzahl der kritischen Bänder und L die Anzahl der Blöcke. Ein weiteres Verfahren der Bitzuweisung ist folgendes. Ri = R + 1/2 log2j=0 M–1SMRji]1/M/[IIi=1 LΣj=0 M-1SMRji]1/M (9)
  • Die Bitzuweisung des kritischen Bandes k im i-ten Block ist Rki = R + 1/2 log2[SMRki]/[IIi=1 LSMRki]1/L (10)oder Rki = R + 1/2 log2[SMRki]/[IIK=1 MSMRki]1/L (11)wobei Rki das k-te Band im i-ten Teilrahmen ist (wobei i gleich 1 bis L, k gleich 1 bis Bmax ist) und SMRki = Pki/Tki (12)wobei Pki die Eingangssignalleistung in jedem geteilten Band des i-ten Blocks und Tki die Ausblendschwelle für jedes kritische Band des i-ten Blocks ist.
  • Damit die Bitanzahl im gesamten Block ein vorbestimmter Wert ist, wie unten angegeben, wird die Bitanzahländerung ausgeführt, um die Teilrahmenzuweisungsbitanzahl zwischen einer Bitanzahl einer unteren Grenze und einer Bitanzahl einer oberen Grenze zu begrenzen. Σj=1 LRj = RT (13) Rmin < Rj < Rmax (14)wobei Rj die Anzahl der Bits, die dem j-ten Block zugewiesen sind, RT die Gesamtbitanzahl in mehreren Blöcken (d. h. in vier Blöcken), Rmin die Bitanzahl der unteren Grenze im Block und Rmax die Bitanzahl der oberen Grenze im Block ist. L ist die Anzahl der Blöcke (d. h. vier in diesem Beispiel). Die Bitzuweisungsdaten, die infolge der oben beschriebenen Verarbeitung ermittelt werden, werden an eine Vektorquantisierungsschaltung 350 und auch an einen Multiplexer 400 ausgegeben.
  • Die Vektorquantisierungsschaltung 350 hat mehrere Erregungscodebücher 3601 bis 360n , die sich in der Zuweisungsbitanzahl von einer minimalen Bitanzahl bis zu einer maximalen Bitanzahl unterscheiden. Die Schaltung 350 empfängt Zuweisungsbitanzahldaten für jedes kritische Innenblockband und wählt ein Codebuch entsprechend der Bitanzahl. Dann wählt sie einen Erregungscodevektor für jedes kritische Band, um die folgenden Em zu minimieren: Em = Σn=0 Nk–1[Xk(n) – γkm · Ckm(n)]2 (15)wobei Xk(n) ein MDCT-Koeffizient, der im k-ten kritischen Band enthalten ist, Nk die Anzahl der MDCT-Koeffizienten, die im k-ten kritischen Band enthalten sind, und γkm die optimale Verstärkung für einen Codevektor Ckm(n) ist (wobei m gleich 0 bis 2BK – 1, Bk die Bitanzahl des Erregungscodebuchs für das k-te kritische Band ist). Ein Index, der den gewählten Erregungscodevektor darstellt, wird an den Multiplexierer 400 ausgegeben.
  • Das Erregungscodebuch kann anhand Gaußscher Zufallszahlen oder durch vorherige Beobachtung organisiert werden. Ein Verfahren der Codebuchorganisation durch Beobachtung ist beispielsweise beschrieben in Linde et al., "An Algorithm for Vector Quantization Design", IEEE Trans. COM-28, Seite 84–95, 1980 (Dokument 3).
  • Unter Verwendung des gewählten Erregungscodevektors Ckm(n) und eines Verstärkungscodebuchs 370 wird der Verstärkungscodevektor, der den Em der folgenden Gleichung minimiert, gesucht und ausgegeben. Em = Σn=0 Nk–1 [Xk(n) – gkm · Ckm(n)]2 (16)wobei gkm der m-te Verstärkungscodevektor im k-ten kritischen Band ist. Ein Index des gewählten Verstärkungscodevektors wird an den Multiplexer 400 ausgegeben.
  • Der Multiplexer 400 gibt das Ausgangssignal der Blocklängenbewertungsschaltung 120, das Ausgangssignal der Innenblock/Zwischenblockbitzuweisungsschaltung 300 und die Indizes des Erregungscodevektors und des Verstärkungscodevektors als die Ausgangssignale der Vektorquantisierungsschaltung 350 kombiniert aus.
  • 2 ist ein Blockschaltbild, das eine Ausführungsform des Breitbandsignalcodierers gemäß dem zweiten Aspekt der Erfindung zeigt. In der Figur arbeiten die Bestandselemente, die mit den gleichen Bezugszeichen wie in 1 bezeichnet sind, genauso und werden hier nicht beschrieben.
  • Eine Verzögerungsschaltung 510 bewirkt eine Verzögerung des Ausgangssignals Z'(k) der Vektorquantisierungsschaltung 350 für einen vergangenen Block in einem Grad, der einer vorbestimmten Anzahl von Blöcken entspricht. Die Anzahl der Blöcke kann irgendeine Zahl sein, es wird jedoch zur Verkürzung der Beschreibung angenommen, daß sie 1 ist.
  • Eine Vorhersageschaltung 500 sagt die Transformationskomponente unter Verwendung des Ausgangssignals Z(k)'–1 und der Verzögerungsschaltung voraus, nämlich Y(k) = A(k) · Z(k)–1 (k = 1 bis L/2) (17)wobei A(K) ein Vorhersagekoeffizient und L die Blocklänge ist. A(k) wird vorher in bezug auf ein Trainingssignal bemessen. Y(k) wird an einen Subtrahierer 410 ausgegeben.
  • Der Subtrahierer 410 berechnet das Vorhersagesignal Y(k) aus dem Ausgangssignal X(k) der Transformationsschaltung 200 wie folgt und gibt ein Vorhersagefehlersignal Z(k) aus. Z(k) = X(k) – Y(k) (k = 1 bis L/2) (18)
  • 3 ist ein Blockschaltbild, das eine Struktur gemäß dem dritten Aspekt der Erfindung zeigt. In der Figur arbeiten die Bestandselemente, die mit dem gleichen Bezugszeichen bezeichnet sind wie in 1 und 2, genauso und werden hier nicht beschrieben.
  • Ein Addierer 420 addiert das Ausgangssignal Y(k) der Vorhersageschaltung 530 und das Ausgangssignal Z'(k) der Vektorquantisierungsschaltung 350 und gibt die Summe S(k) an die Verzögerungsschaltung 510 aus.
  • Die Vorhersageschaltung 530 führt die Vorhersage unter Verwendung des Ausgangssignals der Verzögerungsschaltung 510 folgendermaßen aus: Y(k) = B(k) · S(k)–1 (k = 1 bis L/2) (19)wobei B(k) ein Vorhersagekoeffizient und L die Blocklänge ist. B(k) wird vorher in bezug auf ein Trainingssignal bemessen. Y(k) wird an den Subtrahierer 410 ausgegeben.
  • 4 ist ein Blockschaltbild, das eine Struktur gemäß dem vierten Aspekt der Erfindung zeigt. In der Figur arbeiten Bestandselemente, die mit den gleichen Bezugszeichen bezeichnet sind wie in 2, genauso und werden hier nicht beschrieben. Gemäß dem vierten Aspekt der Erfindung ist die Blocklänge für die Transformation fest, und auch die Gesamtbitanzahl jedes Blocks ist fest. Dieser Aspekt der Erfindung unterscheidet sich vom zweiten Aspekt der Erfindung darin, daß die Blocklängenbewertungsschaltung 120 unnötig ist und daß lediglich die Innenblockbitzuweisung erfolgt.
  • Eine Innenblockzuweisungsschaltung 600 führt die Bitzuweisung in bezug auf eine Transformationskomponente in jedem kritischen Innenblockband auf der Grundlage der Gleichungen (10) bis (14) aus.
  • 5 ist ein Blockschaltbild, das eine Struktur gemäß dem fünften Aspekt der Erfindung zeigt. In der Figur arbeiten die Bestandselemente, die mit den gleichen Bezugszeichen bezeichnet sind wie in 3 und 4, genauso und werden hier nicht beschrieben. Gemäß dem fünften Aspekt der Erfindung ist, wie im dritten Aspekt der Erfindung, die Blocklänge für die Transformation fest, und auch die Gesamtbitanzahl jedes Blocks ist fest. Die Unterschiede zum dritten Aspekt der Erfindung bestehen darin, daß die Blocklängenbewertungsschaltung 120 unnötig ist und daß lediglich die Innenblockbitzuweisung erfolgt.
  • 6 ist ein Blockschaltbild, das eine Struktur gemäß dem sechsten Aspekt der Erfindung zeigt. Diese Struktur unterscheidet sich von der Struktur in 1 gemäß dem ersten Aspekt der Erfindung in einer Wichtungsvektorquantisierungsschaltung 700 und in Codebüchern 6101 bis 610N . Die Struktur der Wichtungsvektorquantisierungsschaltung 700 wird nachstehend beschrieben.
  • 7 ist ein Blockschaltbild, das ein Beispiel der Wichtungsvektorquantisierungsschaltung 700 zeigt. Eine Wichtungskoeffizientenberechnungsschaltung 710 empfängt Ausblendschwellendaten Tki von der Ausblendschwellenberechnungsschaltung 250 und berechnet einen Wichtungskoeffizienten für die Vektorquantisierung und gibt diesen aus. Zur Berechnung verwende man folgende Formel: ηki = 1/Tki (k = 1 bis Bmax)wobei Bmax die Anzahl der kritischen Bänder ist, die in einem Block enthalten sind.
  • Eine Wichtungsvektorquantisierungsschaltung 720 empfängt Daten der Anzahl Rki von Bits, die einem k-ten kritischen Band im i-ten Block zugeordnet sind, wählt eines der Codebücher 6101 bis 610N entsprechend der Bitanzahl und führt eine Wichtungsvektorquantisierung des Transformationskoeffizienten X(n) aus, nämlich Em = Σn=0 Nk–1[Xk(n) – γkm · Ckm(n)]2 · ηki (20)Außerdem führt die Schaltung 720 eine Verstärkungsquantisierung unter Verwendung eines Verstärkungscodebuchs 370 aus.
  • Die Wichtungsvektorquantisierungsschaltung 700 kann dem zweiten bis fünften Aspekt der Erfindung hinzugefügt werden, indem die Vektorquantisierungsschaltung 350 durch diese ersetzt wird.
  • 8 ist ein Blockschaltbild, das die Struktur gemäß dem siebten Aspekt der Erfindung zeigt. Bei dieser Struktur wird ein Prozeß auf der Grundlage einer psychoakustischen Eigenschaft in den ersten Aspekt der Erfindung eingeführt, der in 1 gezeigt ist.
  • Eine psychoakustische Eigenschaftsprozeßschaltung 820 führt eine Transformation auf der Grundlage einer psychoakustischen Eigenschaft in Bezug auf das Ausgangssignal X(n) der Transformationsschaltung 200 aus, nämlich Q(n) = F[X(n)] (21)wobei F[X(n)] die Transformation auf der Grundlage der psychoakustischen Eigenschaft darstellt. Insbesondere sind sol che Transformationen wie die Burke-Transformation, ein Ausblendprozeß, Lautstärketransformation usw. denkbar. Näheres zu diesen Transformationen siehe Wang et al., "An Objective Measure for Predicting Subjective Quality of Speech Coders", IEEE J. Sel. Areas. Commun., Seite 819–829, 1992 (Dokument 4), und diese Transformationen werden hier nicht beschrieben.
  • Eine Vektorquantisierungsschaltung 800 schaltet Codebücher 3601 bis 360N gemäß den Zuweisungsbitanzahldaten um, die für jedes kritische Band in jedem Block von der Zwischenblock/Innenblockbitzuweisungsschaltung 300 empfangen werden, und der Vektor quantisiert Q(n) nämlich Em = Σn=0 Nk–1[Qk(n) – γkm · F[Ckm(n)]]2 (22)Hierbei wird ein Verfahren der Codevektorsuche verwendet, während eine Transformation auf der Grundlage einer psychoakustischen Eigenschaft in bezug auf den Codevektor Ckm(n) ausgeführt wird, der aus dem Codebuch aufgenommen wird. Wenn der Codevektor, der als Ergebnis einer Transformation auf der Grundlage einer psychoakustischen Eigenschaft ermittelt wird, d. h. der Codevektor F[Ckm(n)], vorher im Codebuch gespeichert worden ist, kann die Vektorquantisierung, nämlich Em = Σn=0 Nk–1[Qk(n) – γkm · Pkm(n)]2 (23)ausgeführt werden. Hier gilt: Pkm(n) = F[Ckm(n)] (24)
  • Nach der Codevektorsuche kann die Verstärkung γkm unter Verwendung des Verstärkungscodevektors 370 quantisiert werden.
  • Der Prozeß auf der Grundlage einer psychoakustischen Eigenschaft kann in den zweiten bis fünften Aspekt der Erfindung eingeführt werden, indem die Vektorquantisierungsschaltung 350 durch die Vektorquantisierungsschaltung 800 ersetzt und eine psychoakustische Eigenschaftsprozeßschaltung 820 dem Eingangsteil der Schaltung 800 hinzugefügt wird.
  • 9 ist ein Blockschaltbild, das eine Struktur gemäß dem achten Aspekt der Erfindung zeigt. In dieser Figur arbeiten die Bestandselemente, die mit dem gleichen Bezugszeichen bezeichnet sind wie in 1, genauso und werden hier nicht beschrieben.
  • Eine Spektrumkoeffizientenberechnungsschaltung 900 berechnet einen Niederstufenspektrumkoeffizienten, der sich als das Ausgangssignal der Transformationsschaltung 200 der Frequenzhüllkurve des MDCT-Koeffizienten X(n) nähert (wobei n gleich 1 bis L ist). Als der Spektrumkoeffizient sind dem Fachmann LPC (linearer Vorhersagekoeffizient), Cepstrum, Mercepstrum usw. bekannt. Es wird nachstehend angenommen, daß der LPC verwendet wird. Das Quadrat X2(n) (n = 1 bis L) jedes MDCT-Koeffizienten wird einer inversen MDCT oder einer inversen FFT unterzogen, um die Eigenkorrelation R(n) zu ermitteln. Die Eigenkorrelation R(n) wird bis zu einem vorbestimmten Grad τ geführt, und der LPC-Koeffizient α(i) (wobei i 1 bis τ ist) wird aus R(n) berechnet, das unter Verwendung des Eigenkorrelationsprozesses gewählt wird.
  • Eine Quantisierungsschaltung 910 quantisiert den LPC-Koeffizienten. Die Schaltung 910 wandelt vorläufig den LPC-Koeffizienten in einem LSP-(Linienspektrumpaar-)Koeffizienten mit einer höheren Quantisierungseffizienz für die Quantisierung mit einer vorbestimmten Anzahl von Bits um. Zur Umwandlung des LPC-Koeffizienten in den LSP-Koeffizienten siehe Sugamura et al., "Quantizer Design in LSP Speech Analysis-Synthesis", IEEE J. Sel. Areas in Commun., Seite 432– 440, 1988 (Dokument 5). Die Quantisierung kann eine Untersetzungsquantisierung oder eine Vektorquantisierung sein. Der Index des quantisierten LSP wird an den Multiplexer 400 ausgegeben. Außerdem wird der quantisierte LSP decodiert und dann invers in LPCα'(i) umgewandelt (wobei i gleich 1 bis τ ist). Der derartig ermittelte LPCα'(i) wird dann einer MDCT oder FFT zur Berechnung des Frequenzspektrums H(n) unterzogen (wobei n 1 bis L/2 ist), das an eine Vektorquantisierungsschaltung 930 ausgegeben wird.
  • Die Vektorquantisierungsschaltung 930 normiert einmalig das Ausgangssignal X(n) der Transformationsschaltung 200 unter Verwendung des Spektrums H(n). X'(n) = X(n)/H(n) (n = 1 bis L/2) (25)
  • Dann erfolgt die Vektorquantisierung X'(n) unter Verwendung des Codebuchs. Em = Σn=0 Nk–1[X'k(n) – Ckm(n)]2 (26)
  • Das verwendete Spektrum H(n) hat einen Effekt, nämlich die Normierung der Verstärkung, so daß kein Verstärkungscodebuch erforderlich ist.
  • Die Struktur in 9 kann auch die Blocklängenbewertungsschaltung 120 zum Umschalten der Blocklänge und die Zwischenblock/Innenblockbitzuweisungsschaltung 300 verwenden.
  • 10 ist ein Blockschaltbild, das eine Anordnung zeigt, in der ein Vorhersagefehlersignal quantisiert wird. In der Figur arbeiten Bestandselemente, die mit dem gleichen Bezugszeichen wie in 1 und 9 bezeichnet sind, genauso und werden hier nicht beschrieben.
  • In diesem Fall normiert eine Vektorquantisierungsschaltung 950 das Vorhersagefehlersignal Z(n) als das Ausgangssignal des Subtrahierers 410. Z'(n) = Z(n)/H(n) (n = 1 bis L/2) (27)
  • Dann erfolgt die Vektorquantisierung von Z'(n), indem ein Codevektor gewählt wird, der minimiert, nämlich Em = Σn=0 Nk–1[Z'k(n) – Ckm(n)]2 (28)
  • Die Struktur in 10 kann auch die Blocklängenbewertungsschaltung 120 zum Umschalten der Blocklängen und die Zwischenblock/Innenblockbitzuweisungsschaltung 300 verwenden. Als weitere Alternative zur Vorhersage kann das Vorhersagefehlersignal unter Verwendung des Verfahrens in 3 berechnet werden.
  • Erfindungsgemäß können, wie oben beschrieben, als Verfahren zur Bitzuweisungsbestimmung Bitzuweisungscodebücher entsprechend der Anzahl bis zu einer vorbestimmten Anzahl von Mustern (z. B. 2B, wobei B eine Bitanzahl ist, die ein Muster bezeichnet) durch Bündelung des SMR und durch Tabellierung jedes SMR-Bündels und jeder Zuweisungsbitanzahl zusammengestellt werden, und diese Codebücher können in der Bitzuweisungsschaltung für die Bitzuweisungsberechnung verwendet werden. Bei dieser Anordnung kann die zu übertragende Zuweisungsinformation nur B Bits pro Block groß sein, und somit ist es möglich, die zu übertragende Bitzuweisungsinformation zu reduzieren.
  • Eine weitere Alternative besteht darin, daß die Vektorquantisierungsschaltung 350 den Transformationskoeffizienten oder das Vorhersagefehlersignal unter Verwendung eines anderen Größenmaßes vektorquantisieren kann. Noch eine weitere Alternative besteht darin, daß die Wichtungsvektorquantisierung, die die Ausblendschwelle gemäß dem sechsten Aspekt der Erfindung verwendet, unter Verwendung eines anderen Größenmaßes durchgeführt werden kann.
  • Eine weitere Alternative besteht darin, daß die Innenblockbitzuweisung gemäß dem ersten bis achten Aspekt der Erfindung für jeden vorbestimmten Teil anstelle jedes kritischen Bandes durchgeführt werden kann.
  • Noch eine weitere Alternative besteht darin, daß die Bitzuweisung für jedes kritische Zwischenblock- und/oder Innenblockband gemäß dem ersten bis dritten, sechsten und siebten Aspekt der Erfindung unter Verwendung einer anderen Gleichung als der Gleichung (4) durchgeführt werden kann, z. B. Rkj = R + 1/2 log2[IIm=1 QkSMRkmj]/[IIj=1 LIIm=1 QkSMRkmj]1/QL (29)wobei Qk die Anzahl der kritischen Bänder ist, die in dem k-ten Teilungsband enthalten sind.
  • Als Alternative des Bitzuweisungsverfahrens in der Bitzuweisungsschaltung ist es möglich, daß, nachdem eine vorläufige Bitzuweisung auf der Grundlage der Gleichungen (8) bis (12) erfolgt ist, die Quantisierung unter Verwendung eines Codebuchs entsprechend der tatsächlich zugewiesenen Bitanzahl zum Messen eines quantisierten Rauschens und zur Änderung der Bitzuweisung ausgeführt wird, um zu maximieren, nämlich MNRj = [IIi=1 M–1SMRij]1/Mnj 2 (30)wobei σnj 2 ein quantisiertes Rauschen ist, das im j-ten Teilrahmen gemessen wird.
  • Das oben beschriebene Ausblendschwellenspektrumberechnungsverfahren kann durch ein anderes bekanntes Verfahren ersetzt werden.
  • Die Ausblendschwellenberechnungsschaltung 250 kann eine Bandteilungsfiltergruppe anstelle der Fourier-Trans formation verwenden, um die Menge der Operationen zu reduzieren. Für die Bandteilung werden QMFs (Quadraturspiegelfilter) verwendet. Das QMF ist ausführlich beschrieben in P. Vaidyanathan et al., "Multirate Digital Filters, Filter Banks, Polyphase Networks, and Applications: A Tutorial", Proc. IEEE, Seite 56–93, 1990 (Dokument 6).
  • Wie oben bereits beschrieben worden ist, wird der Transformationskoeffizient oder das Vorhersagefehlersignal, das durch Vorhersage des Transformationskoeffizienten ermittelt wird, erfindungsgemäß vektorquantisiert, nachdem die Zwischenblock- und/oder Innenblockbitanzahlzuweisung erfolgt ist. Es ist somit möglich, eine zufriedenstellende Codierung eines Breitbandsignals auch mit einer niedrigeren Bitrate als nach dem Stand der Technik durchzuführen. Außerdem ist die Reduzierung von Zusatzinformation erfindungsgemäß möglich, indem der Transformationskoeffizient oder die Vorhersagefehlersignalfrequenzhüllkurve mit einem Niederstufenspektrumkoeffizienten angegeben wird, und somit kann die Realisierung von niedrigeren Bitraten als nach dem Stand der Technik ermöglicht werden.
  • Änderungen im Aufbau sind für den Fachmann erkennbar, und verschiedene, offensichtlich unterschiedliche Modifikationen und Ausführungsformen sind möglich, ohne den Schutzbereich der Erfindung zu verlassen, wie er in den beigefügten Ansprüchen definiert ist.

Claims (6)

  1. Breitbandsignalcodierer mit einer Blocklängenbewertungsschaltung (120) zum Bestimmen einer Blocklänge auf der Grundlage einer Merkmalgröße, die aus einem Eingangssignal ermittelt wird, einer Transformationsschaltung (200) zum Ausführen einer Transformation des Eingangssignals in Frequenzkomponenten durch Teilung des Eingangssignals in mehrere Blöcke mit einer vorbestimmten Zeitlänge, einer Ausblendschwellenberechnungsschaltung (250) zum Ermitteln einer Ausblendschwelle aus dem Ausgangssignal der Transformationsschaltung oder aus dem Eingangssignal auf der Grundlage einer akustischen Ausblendcharakteristik unter Verwendung eines akustischen Modells zur Teilung der Frequenzkomponenten in vorbestimmte Teile, wobei jeder Teil nicht kleiner ist als die Blocklänge, einer Bitzuweisungsschaltung (300) zum Bestimmen einer Zwischenblockquantisierungsbitanzahl und/oder einer Innenblockquantisierungsbitanzahl für jeden vorbestimmten Teil auf der Grundlage der ermittelten Ausblendschwelle und einer Vektorquantisierungsschaltung (350) zum Quantisieren des Ausgangssignals der Transformationsschaltung (200) entsprechend dem Ausgangssignal der Bitzuweisungsschaltung (300).
  2. Breitbandsignalcodierer nach Anspruch 1 mit einer Vorhersageschaltung (500) zum Ermitteln eines Vorhersagefehlers durch Vorhersage des Ausgangssignals der Transformationsschaltung (200) für den gegenwärtigen Block aus einem quantisierten Ausgangssignal für einen vergangenen Block, einer Ausblendschwellenberechnungsschaltung (250) zum Ermitteln einer Ausblendschwelle aus dem Ausgangssignal der Transformationsschaltung, aus dem Eingangssignal oder aus dem Vorhersagefehlersignal auf der Grundlage einer akustischen Ausblend charakteristik und einer Vektorquantisierungsschaltung (350) zum Quantisieren des Vorhersagefehlersignals gemäß dem Ausgangssignal der Bitzuweisungsschaltung.
  3. Breitbandsignalcodierer mit einer Blocklängenbewertungsschaltung (120) zum Bestimmen einer Blocklänge auf der Grundlage einer Merkmalgröße, die aus einem Eingangssignal ermittelt wird, einer Transformationsschaltung (200) zum Ausführen einer Transformation des Eingangssignals in Frequenzkomponenten durch Teilung des Eingangssignals in mehrere Blöcke, einer Vorhersageschaltung (500, 530) zum Ermitteln eines Vorhersagefehlers durch Berechnen eines Vorhersagesignals entsprechend des Transformationsausgangssignals für den gegenwärtigen Block unter Verwendung eines quantisierten Ausgangssignals für einen vergangenen Block und eines Vorhersagesignals für einen vergangenen Block, einer Ausblendschwellenberechnungsschaltung (250) zum Ermitteln einer Ausblendschwelle aus dem Ausgangssignal der Transformationsschaltung, aus dem Eingangssignal oder aus dem Vorhersagefehlersignal auf der Grundlage einer akustischen Ausblendcharakteristik unter Verwendung eines akustischen Modells zur Teilung der Frequenzkomponenten in vorbestimmte Teile, wobei jeder Teil nicht kürzer ist als die Blocklänge, einer Bitzuweisungsschaltung (300) zum Bestimmen einer Zwischenblockquantisierungsbitanzahl und/oder einer Innenblockquantisierungsbitanzahl für jeden vorbestimmten Teil auf der Grundlage der ermittelten Ausblendschwelle und einer Vektorquantisierungsschaltung (350, 700, 800) zum Quantisieren des Vorhersagefehlersignals gemäß dem Ausgangssignal der Bitzuweisungsschaltung.
  4. Breitbandsignalcodierer nach einem der Ansprüche 1 bis 3, wobei die Vektorquantisierungsschaltung (700) eine Vektorquantisierung des Ausgangssignals der Transformationsschaltung oder des Vorhersagefehlersignals ausführt, während das Signal unter Verwendung der Ausblendschwelle gewichtet wird.
  5. Breitbandsignalcodierer nach einem der Ansprüche 1 bis 3, wobei die Vektorquantisierungsschaltung (800) eine Vektorquantisierung des Ausgangssignals der Transformationsschaltung oder des Vorhersagefehlersignals ausführt, nachdem das Signal durch eine Transformation auf der Grundlage einer psychoakustischen Eigenschaft verarbeitet worden ist.
  6. Breitbandsignalcodierer nach einem der Ansprüche 1 bis 5, der ferner eine Spektrumkoeffizientenberechnungsschaltung (900) zum Ermitteln eines Niederstufenspektrumkoeffizienten aufweist, der eine Frequenzhüllkurve des Ausgangssignals der Transformationsschaltung (200) oder des Vorhersagefehlersignals darstellt, und einer Quantisierungsschaltung (910) zum Quantisieren des Ausgangssignals der Transformationsschaltung oder des Vorhersagefehlersignals unter Verwendung der Frequenzhüllkurve und des Ausgangssignals der Bitzuweisungsschaltung.
DE69630477T 1995-02-24 1996-02-23 Breitbandsignalcodierer Expired - Lifetime DE69630477T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP7036662A JP2842276B2 (ja) 1995-02-24 1995-02-24 広帯域信号符号化装置
JP3666295 1995-02-24

Publications (2)

Publication Number Publication Date
DE69630477D1 DE69630477D1 (de) 2003-12-04
DE69630477T2 true DE69630477T2 (de) 2004-08-12

Family

ID=12476078

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69630477T Expired - Lifetime DE69630477T2 (de) 1995-02-24 1996-02-23 Breitbandsignalcodierer

Country Status (5)

Country Link
US (1) US5822722A (de)
EP (1) EP0729132B1 (de)
JP (1) JP2842276B2 (de)
CA (1) CA2169999C (de)
DE (1) DE69630477T2 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904404B1 (en) * 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3067676B2 (ja) 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
KR100249235B1 (ko) * 1997-12-31 2000-03-15 구자홍 에이치디티브이 비디오 디코더
US6976063B1 (en) * 2000-11-02 2005-12-13 Microsoft Corporation Method and system for dynamically configuring a server computer
JP5007020B2 (ja) 2004-12-20 2012-08-22 株式会社アルバック 金属薄膜の形成方法及び金属薄膜
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
DE3688980T2 (de) * 1986-10-30 1994-04-21 Ibm Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3131542B2 (ja) * 1993-11-25 2001-02-05 シャープ株式会社 符号化復号化装置
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor

Also Published As

Publication number Publication date
CA2169999A1 (en) 1996-08-25
CA2169999C (en) 2000-09-05
JP2842276B2 (ja) 1998-12-24
EP0729132B1 (de) 2003-10-29
JPH08237136A (ja) 1996-09-13
US5822722A (en) 1998-10-13
EP0729132A2 (de) 1996-08-28
DE69630477D1 (de) 2003-12-04
EP0729132A3 (de) 1998-01-28

Similar Documents

Publication Publication Date Title
DE69915400T2 (de) Vorrichtung zur Kodierung und Dekodierung von Audiosignalen
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE69815242T2 (de) Verfahren zur Quantisierung der LPC Parameter mittels geschalteter prädiktiver Quantisierung
DE69333786T2 (de) Verfahren zum Kodieren und Dekodieren von Audiodaten
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69724126T2 (de) Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer
DE60308567T2 (de) Dekodierungsgerät, Kodierungsgerät, Dekodierungsverfahren und Kodierungsverfahren
DE69732159T2 (de) Geschaltete Filterbank für Audiosignalkodierung
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE60034026T2 (de) Sprachverbesserung mit durch sprachaktivität gesteuerte begrenzungen des gewinnfaktors
DE60038279T2 (de) Beitband Sprachkodierung mit parametrischer Kodierung des Hochfrequenzanteils
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE69619284T3 (de) Vorrichtung zur Erweiterung der Sprachbandbreite
DE69838305T2 (de) Orthogonalisierungssuche für die CELP basierte Sprachkodierung
DE69332994T2 (de) Hocheffizientes Kodierverfahren
EP1697931B1 (de) Vorrichtung und verfahren zum ermitteln eines schätzwerts
EP1397799B1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
DE4320990A1 (de) Verfahren zur Redundanzreduktion
EP1525576B1 (de) Vorrichtung und verfahren zum erzeugen einer komplexen spektraldarstellung eines zeitdiskreten signals
DE60124079T2 (de) Sprachverarbeitung
DE3310480C2 (de) Digitales Codierverfahren für Audiosignale
DE602004004445T2 (de) Vorrichtungen zum Komprimieren und Dekomprimieren von Sprache und Verfahren zum Bereitstellen von skalierbaren Bandbreitestrukturen
DE69727256T2 (de) Sprachkodierer hoher Qualität mit niedriger Bitrate
EP0485390B1 (de) Verfahren zur übertragung eines signals

Legal Events

Date Code Title Description
8364 No opposition during term of opposition