DE60217612T2 - Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen - Google Patents

Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen Download PDF

Info

Publication number
DE60217612T2
DE60217612T2 DE60217612T DE60217612T DE60217612T2 DE 60217612 T2 DE60217612 T2 DE 60217612T2 DE 60217612 T DE60217612 T DE 60217612T DE 60217612 T DE60217612 T DE 60217612T DE 60217612 T2 DE60217612 T2 DE 60217612T2
Authority
DE
Germany
Prior art keywords
bits
section
speech
optimum value
dequantizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60217612T
Other languages
English (en)
Other versions
DE60217612D1 (de
Inventor
Yutaka Yamato-shi Banba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of DE60217612D1 publication Critical patent/DE60217612D1/de
Application granted granted Critical
Publication of DE60217612T2 publication Critical patent/DE60217612T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf eine Sprachcodiervorrichtung, eine Sprachdecodiervorrichtung und ein Sprachcodier-/Decodierverfahren bei einer Teilband-ADPCM (Adaptive Differentialimpuls-Codiermodulation).
  • 2. Beschreibung des Standes der Technik
  • Normalerweise sind als Sprachcodiervorrichtung und Sprachdecodiervorrichtung, die bei der Teilband-ADPCM verwendet werden, Vorrichtungen bekannt, die die Vorgabe G.722 der ITU-T (International Telecommunication Union, Telcommunication sector) erfüllen.
  • 1 ist ein Blockschaltbild, das Konfigurationen einer Sprachcodiervorrichtung 300 und einer Sprachdecodiervorrichtung 400 darstellt, die bei einer Zwei-Teilband-ADPCM verwendet werden, die in der Vorgabe G.722 beschrieben ist.
  • Die Sprachcodiervorrichtung 300 besteht aus einer 24-Tap-Teil-Filterbank 310, die ein Frequenzband eines Eingangssignals in zwei Teilbänder aufteilt und Teilbandsignale ausgibt, ADPCM-Quantisierern 320a und 320b, die entsprechende Zwei-Teilungs-Teilbandsignale quantisieren, und einem Multiplexer 330, der Codewörter multiplexiert, die in den ADPCM-Quantisierern 320a und 320b quantisiert werden, um einen Bitstrom zu erzeugen.
  • Daneben besteht die Sprachdecodiervorrichtung 400 aus einem Demultiplexer 410, der Codewörter für jedes Teilband ausgibt, das man aus den gesendeten Datenströmen erhält, ADPCM-Dequantisierern 420a und 420b, die entsprechende Codewörter für jedes Teilband dequantisieren, das aus dem Demultiplexer 410 ausgegeben wird, um Teilbandsignale auszugeben, und einer 24-Tap-Synthesefilterbank 430, die eine Synthesefilterung an den Teilbandsignalen ausführt.
  • Vorgänge der Sprachcodiervorrichtung 300 und der Sprachdecodiervorrichtung 400, die jeweils in der oben beschriebenen Art und Weise aufgebaut sind, werden im folgenden beschrieben.
  • Ein Frequenzband eines Eingangssignals wird in zwei Teilbänder in der Teil-Filterbank 310 geteilt, wobei zwei Teilbandsignale erzeugt werden. Jedem der Teilbandsignale wird eine vorbestimmte Zahl von Quantisierbits zugeordnet, wobei die Teilbandsignale in jeweils einem der ADPCM-Quantisierer 320a und 320b quantisiert werden. Die Codewörter, die man durch die Quantisierung erhält, werden im Multiplexer 330 in die Bitströme multiplexiert.
  • Daneben werden in der Sprachdecodiervorrichtung 400 die Bitströme mit einer Vielzahl multiplexierter Codewörter im Demultiplexer 410 zu Codewörtern für jedes Teilband demultiplexiert. Die Codewörter für jedes Teilband, die man beim Demultiplexieren erhält, werden in den ADPCM-Dequantisierern 420a und 420b dequantisiert, um zu Teilbandsignalen zu werden. Die Teilbandsignale werden einer Synthese in der Synthesefilterbank 430 unterzogen, um zu einem decodierten Signal zu werden.
  • Da jedoch bei der herkömmlichen Sprachcodiervorrichtung und der Sprachdecodiervorrichtung, die oben beschrieben wurden, die Zahl der Quantisierbits, die jedem Teilbandsignal in einem ADPCM-Quantisierer in der Sprachcodiervorrichtung zugewiesen ist, insbesondere dann fixiert ist, wenn sich eine Abtastfrequenz eines Eingangssignals erhöht, besteht das Risiko, dass die Bitzuweisung nicht optimal ist und dass die Audioqualität der decodierten Signale in der Sprachdecodiervorrichtung beeinträchtigt wird.
  • Das US-Patent 5.974.380 beschreibt eine Sprachcodier-/Decodiervorrichtung und ein zugehöriges Verfahren gemäß dem Oberbegriff der Ansprüche 1, 8 und 16. Es kommen Perfekt-/Nicht-Perfekt-Wiederherstellungsfilter, die prädiktive/nichtprädiktive Teilbandcodierung, die Transientenanalyse sowie die psychoakustische/minimale mittlere quadratische Fehlbitzuordnung über die Zeit, die Frequenz und die mehrfachen Audiokanäle zur Anwendung, um einen Datenstrom zu codieren/decodieren, um wiederhergestelltes Audio hoher Wiedergabetreue zu erzeugen. Die Bitzuordnung für den ADPCM-Quantisierer ist für jeden Teilframe je Teilband-Audiokanal auf der Basis des Teilbandsignals festgelegt, das in den Teilbandcodierer eingegeben wird. Es werden Bitzuordnungsindizes zum Decoder entweder unter Verwendung eines ganzzahligen Codes oder einer Entropietabelle gesendet.
  • ÜBERSICHT ÜBER DIE ERFINDUNG
  • Ein Ziel der vorliegenden Erfindung besteht darin, die Audioqualität codierter Sprache zu verbessern, ohne die Sendefrequenz zu beeinträchtigen.
  • Dieses Ziel wird durch eine Sprachcodiervorrichtung nach Anspruch 1, eine Sprachdecodiervorrichtung nach Anspruch 8, ein digitales Drahtlosmikrofon-Sendesystem nach Anspruch 14, ein digitales Drahtlosmikrofon-Empfangssystem gemäß Anspruch 15, ein Sprachcodierverfahren gemäß Anspruch 16 und ein Sprachdecodierverfahren gemäß Anspruch 17 erreicht. Bevorzugte Ausführungsformen sind Gegenstand der abhängigen Ansprüche.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die obigen und andere Ziele sowie Merkmale der Erfindung werden aus der folgenden Beschreibung in Verbindung mit den beiliegenden Zeichnungen besser verständlich, in denen ein Beispiel exemplarisch dargestellt ist.
  • 1 ist ein Blockschaltbild, das Konfigurationen einer herkömmlichen Sprachcodiervorrichtung und einer Sprachdecodiervorrichtung darstellt, die bei einer Zwei-Teilband-ADPCM verwendet werden;
  • 2 ist ein Blockschaltbild, das eine Konfiguration einer Sprachcodiervorrichtung gemäß einer ersten und einer zweiten Ausführungsform der vorliegenden Erfindung darstellt;
  • 3 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt;
  • 4 ist eine Ansicht, die ein Beispiel einer Quantisierbitzahl-Zuordnung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt;
  • 5 ist ein Blockschaltbild, das eine Konfiguration einer Sprachdecodiervorrichtung gemäß der ersten und der zweiten Ausführungsform der vorliegenden Erfindung zeigt;
  • 6 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt;
  • 7 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt; und
  • 8 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung darstellt.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Ausführungsformen der vorliegenden Erfindung werden im folgenden mit spezieller Bezugnahme auf die beiliegenden Zeichnungen erläutert.
  • (Erste Ausführungsform)
  • 2 ist ein Blockschaltbild, das eine Konfiguration einer Sprachcodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt. In 2 teilt eine Teil-Filterbank 100 ein Frequenzband eines Eingangssignals in vier Teilbänder mit derselben Bandbreite und führt einen Ausdünnungsvorgang unter Verwendung von "4" als Ausdünnungszahl durch, die die Anzahl von Teilungen ist. Band-Teil-FIR-Filter 110a und 110d in der Teil-Filterbank 100 führen eine Teil-Filterung an einem Eingangssignal für vorbestimmte Frequenzbänder durch. Die Teil-Filterbank 100 ist eine Kosinusmodulations-Filterbank, wobei die Impulsantwortverhalten der Band-Teil-FIR-Filter 110a bis 110d, die Basisfilter sind, asymmetrisch sind.
  • Weiterhin führen Downsample-Einrichtungen 120a bis 120d in der Teil-Filterbank 100 die Ausdünnungsverarbeitung an den entsprechenden Ausgaben der Band-Teil-FIR-Filter 110a bis 110d zur Codiereffizienz unter Verwendung von "4" als Ausdünnungszahl aus, die gleich der Zahl von Teilungen in der Teil-Filterbank 100 ist, und geben entsprechende Teilband-Signale aus.
  • Jeder der ADPCM-Quantisierer 130a bis 130d quantisiert ein Restsignal zwischen dem entsprechenden Teilbandsignal und einem Prädiktionswert, der aus dem letzten Frame des Teilbandsignals berechnet wird, um ein skalierbares Codewort auszugeben. Weiterhin berechnen die ADPCM-Quantisierer 130a bis 130d einen dequantisierten Wert und Skalierfaktor aus dem Restsignal.
  • Eine adaptive Bitzuweisungseinrichtung 140 bestimmt die Zahl von Quantisierbits, die jedem der Restsignale zugewiesen werden soll, auf der Basis eines Energiewertes des dequantisierten Wertes, der in einem entsprechenden der ADPCM-Quantisierer 130a und 130d berechnet wird.
  • Der Multiplexer 150 multiplexiert Codewörter, die aus den ADPCM-Quantisierern 130a bis 130d ausgegeben werden, um einen Bitstrom zu erzeugen, der ein multiplexiertes Signal ist.
  • 3 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt. Wenngleich 3 einen Aufbau eines ADPCM-Quantisierers 130a und einer adaptiven Bitzuordnungseinrichtung 140 zeigt, haben die anderen ADPCM-Quantisierer 130b bis 130d denselben Aufbau, wie jener des Quantisierers 130a, und sind mit der adaptiven Bitzuweisungseinrichtung 140 verbunden.
  • In 3 berechnet eine Addiervorrichtung 131 eine Differenz zwischen dem Teilbandsignal, das in einen entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben wird, und einem Prädiktionswert, um ein Restsignal zu erzeugen. Der Quantisierabschnitt 132 quantisiert das erzeugte Restsignal mit Hilfe des Skalierfaktors und gibt ein Codewort mit der Zahl der Quantisierbits aus, die in der adaptiven Bitzuordnungseinrichtung 140 bestimmt werden. Ein Kern-Bit-Extrahierabschnitt 133 löscht die geringstwertigen Bits (im folgenden "LSB" genannt) aus dem Codewort, das aus dem Quantisierabschnitt 132 ausgegeben wird, um Kern-Bits zu extrahieren. Der Skalierfaktor-Adaptierabschnitt 134 berechnet einen Skalierfaktor aus den extrahierten Kern-Bits. Der Dequantisierabschnitt 135 dequantisiert die extrahierten Kern-Bits und gibt einen dequantisierten Wert an den Prädiktionsabschnitt 136, die Addiereinrichtung 137 und die adaptive Bitzuordnungseinrichtung 140 aus. Der Prädiktionsabschnitt 136 führt eine Null-Prädiktion und Pol-Prädiktion unter Verwendung des dequantisierten Wertes und eines Ausgangs aus dem Prädiktionsabschnitt 136 aus und berechnet einen Prädiktionswert eines nächsten Frames des Teilbandsignals. Die Addiereinrichtung 137 berechnet die Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 136 berechnet wird.
  • Der Betrieb der Sprachcodiervorrichtung, die den oben beschriebenen Aufbau hat, wird im folgenden beschrieben.
  • Ein Sprachsignal, das in die Sprachcodiervorrichtung eingegeben wird, wird in vier Teilbandsignale in der Teil-Filterdatenbank 100 geteilt. Da die Teil-Filterdatenbank 100 eine Kosinusmodulations-Filterbank ist und die Impulsantwortverhalten der Band-Teil-FIR-Filter 110a bis 110d, die Basisfilter sind, asymmetrisch sind, wird eine Gruppenverzögerung, die beim Filtern auftritt, verringert, wodurch es möglich ist, den Berechnungsaufwand zu verringern. Die geteilten Teilbandsignale werden jeweils in die ADPCM-Quantisierer 130a bis 130d eingegeben.
  • Die Addiereinrichtung 131 berechnet ein Restsignal zwischen dem Teilbandsignal, das in einen entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben wird, und einem Prädiktionswert, der aus dem letzten Frame im Prädiktionsabschnitt 136 berechnet wird, und gibt das berechnete Restsignal in den Quantisierabschnitt 132 ein. Das Restsignal wird im Quantisierabschnitt 132 zu einem Codewort mit der Zahl der Quantisierbits quantisiert, die durch die adaptive Bitzuweisungseinrichtung 140 zugewiesen werden. Bei der Quantisierung des Restsignals kommt der Skalierfaktor zur Anwendung, der im Skalierfaktor-Adaptierabschnitt 134 berechnet wird. Das Codewort, das im Quantisierabschnitt 132 quantisiert wird, wird an den Multiplexer 150 und zudem an den Kern-Bit-Extrahierabschnitt 133 ausgegeben. Der Abschnitt 133 löscht das LSB, um Kern-Bits zu extrahieren. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 134, um bei der Berechnung eines Skalierfaktors verwendet zu werden, und zudem in den Dequantisierabschnitt 135 eingegeben. Hier wird das Codewort, das im Quantisierabschnitt 132 quantisiert wird, skalierbar, um die Konsistenz des Skalierfaktors beizubehalten.
  • Der Dequantisierabschnitt 135 dequantisiert die Kern-Bits unter Verwendung des Skaliertaktors, der im Skalierfaktor-Adaptierabschnitt 134 berechnet wurde. Der dequantisierte Wert, den man durch Dequantisieren der Kern-Bits erhält, wird in den Prädiktionsabschnitt 136 eingegeben. Dieser eingegebene Wert wird Null-Prädiktions-Eingabewert genannt. Der dequantisierte Wert wird in der Addiereinrichtung 137 einem Prädiktionswert eines letzten Frames hinzugefügt, der aus dem Prädiktionsabschnitt 136 ausgegeben wird, und wieder in den Prädiktionsabschnitt 136 eingegeben. Dieser Eingabewert wird Pol-Prädiktions-Eingabewert genannt. Unter Verwendung des Null-Prädiktions-Eingabewertes und des Pol-Prädiktions-Eingabewertes berechnet der Prädiktionsabschnitt 136 einen Prädiktionswert eines nächsten Frames des Teilbandsignals.
  • Der dequantisierte Wert wird in die adaptive Bitzuweisungseinrichtung 140 gemäß einer vorbestimmten Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 140 berechnet eine Energie des dequantisierten Wertes, d.h. eine Quadratsumme des dequantisierten Wertes als Muster, der aus jedem der ADPCM-Quantisierer 130a bis 130d ausgegeben wird, und bestimmt auf der Basis der berechneten Energie des dequantisierten Wertes die Zahl von Bits, die jedem Restsignal zugewiesen werden, das in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert werden soll.
  • Die bestimmten Zahlen der Quantisierbits werden an die jeweiligen Quantisierabschnitte 132 in den ADPCM-Quantisierern 130a bis 130d ausgegeben. Wie es oben erwähnt wurde, quantisiert jeder Quantisierabschnitt 132 das Restsignal des nächstens Frames unter Verwendung des Skalierfaktors und gibt ein Codewort mit der Zahl der zugewiesenen Bits aus. Die Codewörter, die in den ADPCM-Quantisierern 130a bis 130d quantisiert werden, werden im Multiplexer 150 zu einem Bitstrom quantisiert, der ein multiplexiertes Signal ist.
  • 4 zeigt ein Beispiel einer Quantisierbitzahl-Zuweisung. In 4 kennzeichnen Bits, die mit einer schrägen Linie dargestellt sind, Kern-Bits in jedem Band. Die Zahl der Kern-Bits ist fünf im ersten Band, vier im zweiten Band, drei im dritten Band und zwei im vierten Band. Der Kern-Bits sind in jedem Band immer konstant, wobei Bits, die adaptiv durch die adaptive Bitzuweisungseinrichtung 140 zugewiesen werden, zwei Bits sind, die mit Weiß in 4 dargestellt sind. Die beiden Bits werden adaptiv jedem Band entsprechend der Energie des dequantisierten Wertes zugewiesen.
  • Eine Sprachdecodiervorrichtung gemäß der ersten Ausführungsform wird im folgenden beschrieben.
  • 5 ist ein Blockschaltbild, das eine Konfiguration der Sprachdecodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt. In 5 zerlegt der Demultiplexer einen Eingangsbitstrom für jede Anzahl von Bits, die durch die adaptive Bitzuweisungseinrichtung 220, die später beschrieben wird, zugewiesen werden, und teilt somit den Bitstrom in Codewörter für jedes Teilband auf. Jeder der ADPCM-Quantisierer 210a bis 201d gibt eine Summe aus einem decodierten Restsignal, das man durch Dequantisieren eines entsprechenden Codewortes erhält, und einem Prädiktionswert, der aus einem Codewort eines letzten Frames berechnet wird, als decodiertes Teilbandsignal aus. Weiterhin berechnet jeder der ADPCM-Dequantisierer 210a bis 210d einen dequantisierten Wert lediglich aus Kern-Bits, die man durch Löschen der LSB aus dem Codewort erhält, und den Skalierfaktor. Auf der Basis der Energie des dequantisierten Wertes der Kern-Bits, der in jedem der ADPCM-Quantisierer 210a bis 210d berechnet wird, berechnet die adaptive Bitzuweisungseinrichtung 220 die Zahl von Quantisierbits, die dem jeweiligen Restsignal in der Sprachcodiervorrichtung zugewiesen werden.
  • Die Synthesefilterbank 230 kombiniert decodierte Teilbandsignale, die aus den ADPCM-Quantisierern 210a bis 210d ausgegeben werden, um ein decodiertes Signal zu erhalten. Upsample-Einrichtungen 240a bis 240d in der Synthesefilterbank 230 führen eine Interpolation der jeweiligen ausgedünnten decodierten Teilbandsignale aus. Bandsynthese-FIR-Filter 250a bis 250d in der Synthesefilter-Bank 230 führen die Synthesefilterung an entsprechenden interpolierten decodierten Teilbandsignalen aus. Die Synthesefilterbank 230 ist eine Kosinusmodulations-Filterbank, wobei die Impulsantwortverhalten der Bandsynthese-FIR-Filter 250a bis 250d, die Basisfilter sind, asymmetrisch sind.
  • 6 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt. Wengleich 6 eine Konfiguration eines ADPCM-Dequantisierers 210a und einer adaptiven Bitzuweisungseinrichtung 220 darstellt, haben die anderen ADPCM-Dequantisierer 210b bis 210d dieselbe Konfiguration wie jene des Dequantisierers 210a und sind mit der adaptiven Bitzuweisungseinrichtung 220 verbunden.
  • In 6 löscht der Kern-Bit-Extrahierabschnitt 211 die LSB aus dem Codewort, das in den entsprechenden der ADPCM-Quantisierer 210a bis 210d eingegeben wird, um Kern-Bits zu extrahieren. Der Dequantisierabschnitt 212 dequantisiert die extrahierten Kern-Bits und gibt einen dequantisierten Wert an die Addiereinrichtung 214, den Prädiktionsabschnitt 215 und die adaptive Bitzuweisungseinrichtung 220 aus. Der Skalierfaktor-Adaptierabschnitt 213 berechnet einen Skalierfaktor aus den extrahierten Kern-Bits. Die Addiereinrichtung 214 berechnet die Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 215 berechnet wird. Der Prädiktionsabschnitt 215 führt eine Null-Prädiktion und eine Pol-Prädiktion unter Verwendung des dequantisierten Wertes und einer Ausgabe des Prädiktionsabschnittes 215 aus und berechnet einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals. Der Dequantisierabschnitt 216 dequantisiert das eingegebene Codewort für jede Zahl von Quantisierbits, die in der adaptiven Bitzuweisungseinrichtung 220 unter Verwendung des Skalierfaktors berechnet wurden, und gibt ein decodiertes Restsignal aus. Die Addiereinrichtung 217 berechnet die Summe aus dem decodierten Restsignal, das aus dem Dequantisierabschnitt 216 ausgegeben wird, und dem Prädiktionswert, um ein decodiertes Teilbandsignal zu erzeugen.
  • Der Betrieb der Sprachdecodiervorrichtung, die den oben beschriebenen Aufbau hat, wird als nächstes beschrieben.
  • Ein Bitstrom, der in die Sprachdecodiervorrichtung eingegeben wird, wird pro Anzahl von Quantisierbits, die durch die Bitzuweisungseinrichtung 220 zugewiesen werden, zerlegt und somit werden alle vier Teilbänder in Codewörter zerlegt. Die zerlegten Codewörter werden in die jeweiligen ADPCM-Dequantisierer 210a bis 210d eingegeben.
  • Das Codewort, das in jeden der ADPCM-Dequantisierer 210a bis 210d eingegeben wird, wird im Dequantisierabschnitt 216 entsprechend der Zahl der Quantisierbits dequantisiert, die von der adaptiven Bitzuweisungseinrichtung 220 zugewiesen werden, und als decodiertes Restsignal ausgegeben. Aus dem Codewort, das in den entsprechenden der ADPCM-Dequantisierer 210a bis 210d eingege ben wird, werden die LSB gelöscht und werden Kern-Bits im Kern-Bit-Extrahierabschnitt 211 extrahiert. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 213, um bei der Berechnung eines Skalierfaktors verwendet zu werden, und zudem in den Dequantisierabschnitt 212 eingegeben. Im Dequantisierabschnitt 212 werden die Kernbits unter Verwendung des Skalierfaktors dequantisiert, der im Skalierfaktor-Adaptierabschnitt 213 berechnet wird. Der dequantisierte Wert, den man durch Dequantisierung der Kern-Bits erhält, wird in den Prädiktionsabschnitt 215 eingegeben. Dieser eingegebene Wert wird Null-Prädiktionseingabewert genannt. Der dequantisierte Wert wird in der Addiereinrichtung 214 zu einem Prädiktionswert eines letzten Frames addiert, der aus dem Prädiktionsabschnitt 215 ausgegeben wird, und erneut in den Prädiktionsabschnitt 215 eingegeben. Dieser eingegebene Wert wird Pol-Prädiktionseingabewert genannt. Unter Verwendung des Null-Prädiktionseingabewertes und des Pol-Prädiktionseingabewertes berechnet der Prädiktionsabschnitt 215 einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals.
  • Der dequantisierte Wert wird in die adaptive Bitzuweisungseinrichtung 220 je vorbestimmte Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 220 berechnet eine Energie des dequantisierten Wertes, d.h. die Quadratsumme des dequantisierten Wertes als Muster, der aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben wird, und berechnet auf der Basis der berechneten Energie des dequantisierten Wertes die Zahl der Quantisierbits, die jedem Restsignal zugewiesen werden, das in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d in der Sprachcodiervorrichtung quantisiert wird.
  • Die berechneten Anzahlen der Quantisierbits werden an den Dequantisierabschnitt 216 im entsprechenden der ADPCM-Dequantisierer 210a bis 210d ausgegeben, wobei, wie es oben beschrieben ist, der Dequantisierabschnitt 216 ein Codewort eines nächsten Frames unter Verwendung des Skalierungsfaktors entsprechend des Zahl von Bits dequantisiert, die in der adaptiven Bitzuweisungseinrichtung 220 zugewiesen werden, und ein decodiertes Restsignal ausgibt. Das ausgegebene decodierte Restsignal wird in der Addiereinrichtung 217 dem Prädiktionswert hinzugefügt, der aus dem Prädiktionsabschnitt 215 ausgegeben wird, um zu einem decodierten Teilbandsignal zu werden, wobei das decodierte Teilbandsignal aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben wird.
  • Die decodierten Teilbandsignale, die in den ADPCM-Dequantisieren 210a bis 210d dequantisiert werden, werden einer Interpolation in den Upsample-Einrichtungen 240a bis 240d in der Synthesefilter-Datenbank 230 und einer Synthesefilterung in den Bandsynthese-FIR-Filtern 250a bis 250d unterzogen. Die jeweiligen Ausgaben aus den Bandsynthese-FIR-Filtern 250a bis 250d werden in den Addiereinrichtungen 260a bis 260c zu einem decodierten Signal addiert. Da hier die Synthesefilterbank 230 eine Kosinusmodulations-Filterbank ist und die Impulsantwortverhalten der Bandsynthese-FIR-Filter 250a bis 250b, die Basisfilter sind, asymmetrisch sind, wird eine Gruppenverzögerung, die beim Filtern auftritt, verringert, wodurch es möglich ist, den Berechnungsaufwand zu verringern.
  • Somit wird gemäß der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung dieser Ausführungsform in der Sprachcodiervorrichtung ein Restsignal zwischen einem Teilbandsignal für jedes Frequenzband und einem Prädiktionswert quantisiert, um es zu einem Codewort auszugeben, wird das ausgegebene Codewort dequantisiert, um eine Energie des dequantisierten Wertes zu berechnen, und wird die Zahl der Quantisierbits, die beim Quantisieren eines nächsten Frames jedes Restsignals zugewiesen werden, auf der Basis der berechneten Energie bestimmt. In der Sprachdecodiervorrichtung wird dasselbe Codewort, wie jenes, das in der Sprachcodiervorrichtung dequantisiert wird, dequantisiert, um die Energie des dequantisierten Wertes zu berechnen, und wird auf der Basis der berechneten Energie die Zahl der Quantisierbits berechnet, die in der Sprachcodiervorrichtung bestimmt werden, um sie einem nächsten Frame jedes Restsignals zuzuweisen. Infolgedessen ist die Sprachcodiervorrichtung in der Lage, die Zahl der Quantisierbits adaptiv jedem Restsignal zuzuordnen, und selbst wenn die Sprachcodiervorrichtung die Zahl der zugewiesenen Quantisierbits ändert, ist die Sprachdecodiervorrichtung in der Lage, eine Dequantisierung synchron mit Änderungen der Bitzuweisung in der Sprachcodiervorrichtung auszuführen, ohne Informationen über die geänderte Bitzuweisung zu erhalten. Da die Sprachcodier vorrichtung der Sprachdecodiervorrichtung keine Informationen über die Änderung der Bitzuweisung für die Synchronisierung mitteilen muss, ist es demzufolge möglich, die Audioqualität zu verbessern, ohne die Sendeeffizienz der Sprachinformationen zu beeinträchtigen.
  • (Zweite Ausführungsform)
  • Es ist ein Merkmal der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung, einen Skalierfaktor bei der Bestimmung eines optimalen Wertes der Zahl von Quantisierbits zu verwenden. Darüber hinaus sind die Konfigurationen der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform dieselben wie jene der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung, die in 2 bzw. 5 der ersten Ausführungsform dargestellt sind, weshalb auf deren Beschreibung verzichtet wird.
  • 7 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt. Wenngleich 7 eine Konfiguration des ADPCM-Quantisierers 130a und der adaptiven Bitzuweisungseinrichtung 140a darstellt, haben die anderen ADPCM-Quantisierer 130b und 130d dieselbe Konfiguration wie jene des Quantisierers 130a und sind mit der adaptiven Bitzuweisungseinrichtung 140a verbunden. Darüber hinaus sind dieselben Abschnitte wie in 3 mit denselben Bezugszeichen versehen, um deren Beschreibung auszulassen.
  • In 7 berechnet der Skalierfaktor-Adaptierabschnitt 134a einen Skalierfaktor aus den Kern-Bits, die im Kern-Bit-Extrahierabschnitt 133 extrahiert werden, um ihn an die adaptive Bitzuweisungseinrichtung 140a auszugeben. Der Dequantisierabschnitt 135a dequantisiert die Kern-Bits, die im Kern-Bit-Extrahierabschnitt 133 extrahiert werden, und gibt einen dequantisierten Wert an den Prädiktionsabschnitt 136 und die Addiereinrichtung 137 aus. Die adaptive Bitzuweisungseinrichtung 140a bestimmt die Zahl von Quantisierbits, um sie jedem Restsignal auf der Basis eines Skaliertaktors zuzuweisen, der in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d berechnet wird.
  • Der Betrieb der Sprachcodiervorrichtung, die den oben beschriebenen Aufbau hat, wird als nächstes erläutert.
  • Teilbandsignale, die in der Teil-Filterbank 100 geteilt werden, werden jeweils in die ADPCM-Quantisierer 130a bis 130d eingegeben. Die Addiereinrichtung 131 berechnet ein Restsignal zwischen dem Teilbandsignal, das in den entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben wird, und einem Prädiktionswert eines letzten Frames, der im Prädiktionsabschnitt 136 berechnet wird, und gibt das berechnete Restsignal in den Quantisierabschnitt 132 ein. Das Restsignal wird im Quantisierabschnitt 132 zu einem Codewort quantisiert, wobei die Zahl von Quantisierbits von der adaptiven Bitzuweisungseinrichtung 140a zugewiesen wird. Die Quantisierung des Restsignals verwendet den Skaliertaktor, der im Skalierfaktor-Adaptierabschnitt 134a berechnet wird. Das Codewort, das im Quantisierabschnitt 132 quantisiert wird, wird an den Multiplexer 150 und zudem an den Kern-Bit-Extrahierabschnitt 133 ausgegeben. Der Abschnitt 133 löscht die LSB, um Kern-Bits zu extrahieren. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 134a, um bei der Berechnung eines Skalierfaktors verwendet zu werden, und zudem in den Dequantisierabschnitt 135a eingegeben. Hier wird das Codewort, das im Quantisierabschnitt 132 quantisiert wird, skalierbar, um die Konsistenz des Skalierfaktors beizubehalten.
  • Der Dequantisierabschnitt 135 dequantisiert die Kern-Bits unter Verwendung des Skalierfaktors, der im Skalierfaktor-Adaptierabschnitt 134a berechnet wurde. Aus dem dequantisierten Wert, den man durch Dequantisieren der Kern-Bits erhält, berechnet der Prädiktionsabschnitt 136 einen Prädiktionswert eines nächsten Frames des Teilbandsignals.
  • Der Skalierfaktor wird in die adaptive Bitzuweisungseinrichtung 140a gemäß einer vorbestimmten Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 140a berücksichtigt als Energie einen Durchschnittswert des Skalierungsfaktors, der aus den ADPCM- Quantisierern 130a bis 130d ausgegeben wird, und bestimmt wie bei der ersten Ausführungsform die Zahl von Quantisierbits, die jedem Restsignal zugewiesen werden, das im entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert werden soll.
  • Die bestimmten Zahlen der Quantisierbits werden an die jeweiligen Quantisierabschnitte 132 in den ADPCM-Quantisierern 130a bis 130d ausgegeben. Wie es oben erwähnt wurde, quantisiert jeder Quantisierabschnitt 132 das Restsignal des nächstens Frames unter Verwendung des Skalierfaktors und gibt ein Codewort mit der Zahl der zugewiesenen Bits aus. Die Codewörter, die in den ADPCM-Quantisierern 130a bis 130d quantisiert werden, werden im Multiplexer 150 zu einem Bitstrom quantisiert, der ein multiplexiertes Signal ist.
  • Die Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung wird im folgenden beschrieben. Eine Konfiguration der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform ist dieselbe, wie jene der Sprachdecodiervorrichtung, die in 5 der ersten Ausführungsform dargestellt ist, weshalb auf deren Beschreibung verzichtet wird.
  • 8 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt. Wenngleich 8 eine Konfiguration des ADPCM-Dequantisierers 210a und der adaptiven Bitzuweisungseinrichtung 220a darstellt, haben die anderen ADPCM-Dequantisierer 210b bis 210d dieselbe Konfiguration, wie jene des Dequantisierers 210a, und sind mit der adaptiven Bitzuweisungseinrichtung 220a verbunden.
  • In 8 löscht der Kern-Bit-Extrahierabschnitt 211 das LSB aus dem Codewort, das in den entsprechenden der ADPCM-Quantisierer 210a bis 210d eingegeben wird, um Kern-Bits zu extrahieren. Der Dequantisierabschnitt 212a dequantisiert die extrahierten Kern-Bits und gibt einen dequantisierten Wert an die Addiereinrichtung 214 und den Prädiktionsabschnitt 215 aus. Der Skalierfaktor-Adaptierabschnitt 213a berechnet einen Skalierfaktor aus den extrahierten Kern-Bits, um ihn an die adaptive Bitzuweisungseinrichtung 220a auszugeben. Die Addiereinrichtung 214 berechnet die Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 215 berechnet wird. Der Prädiktionsabschnitt 215 führt eine Null-Prädiktion und eine Pol-Prädiktion unter Verwendung des dequantisierten Wertes und einer Ausgabe des Prädiktionsabschnittes 215 aus und berechnet einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals. Der Dequantisierabschnitt 216 dequantisiert das eingegebene Codewort für jede Zahl von Quantisierbits, die in der adaptiven Bitzuweisungseinrichtung 220a unter Verwendung des Skalierfaktors berechnet wurden, und gibt ein decodiertes Restsignal aus. Die Addiereinrichtung 217 berechnet die Summe aus dem decodierten Restsignal, das aus dem Dequantisierabschnitt 216 ausgegeben wird, und dem Prädiktionswert, um ein decodiertes Teilbandsignal zu erzeugen. Die adaptive Bitzuweisungseinrichtung 220a bestimmt die Zahl der Quantisierbits, die jedem der Restsignale zugewiesen werden sollen, auf der Basis eines Skalierungsfaktors, der im entsprechenden der ADPCM-Dequantisierer 210a bis 210d berechnet wird.
  • Der Betrieb der Sprachdecodiervorrichtung, die den oben beschriebenen Aufbau hat, wird im folgenden beschrieben.
  • Codewörter, die im Demultiplexer 200 geteilt werden, werden in die entsprechenden ADPCM-Dequantisierer 210a bis 210d eingegeben. Das Codewort, das in jeden der ADPCM-Dequantisierer 210a bis 210d eingegeben wird, wird im Dequantisierabschnitt 216 entsprechend der Zahl der Quantisierbits dequantisiert, die durch die adaptive Bitzuweisungseinrichtung 220a zugewiesen sind, und es wird ein decodiertes Restsignal ausgegeben. Aus dem Codewort, das in den entsprechenden der ADPCM-Dequantisierer 210a bis 210d eingegeben wird, werden die LSB gelöscht und werden Kern-Bits im Kern-Bit-Extrahierabschnitt 211 extrahiert. Die extrahierten Kern-Bits werden in den Skaliertaktor-Adaptierabschnitt 213a zur Verwendung bei der Berechnung eines Skalierfaktors und zudem in den Dequantisierabschnitt 212a eingegeben. Im Dequantisierabschnitt 212a werden die Kern-Bits mit Hilfe des Skalierfaktors dequantisiert, der im Skalierfaktor-Adaptierabschnitt 213a berechnet wurde. Der dequantisierte Wert, den man durch Dequantisieren der Kern-Bits erhält, wird in den Prädiktionsabschnitt 215 eingegeben. Der Prädiktionsabschnitt 215 berechnet einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals unter Verwendung des eingegebenen dequantisierten Wertes.
  • Der Skalierfaktor wird in die adaptive Bituzweisungseinrichtung 220a je vorbestimmter Zahl of Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 220a berücksichtigt als Energie einen Durchschnittswert des Skalierungsfaktors, der aus den ADPCM-Dequantisierern 210a bis 210d ausgegeben wird, und berechnet wie bei der ersten Ausführungsform die Zahl von Quantisierbits, die jedem Restsignal zugewiesen werden, das im entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert wird.
  • Die berechneten Zahlen der Quantisierbits werden an den Dequantisierabschnitt 216 im entsprechenden der ADPCM-Dequantisierer 210a bis 210d ausgegeben, und wie es oben erläutert wurde, dequantisiert der Dequantisierabschnitt 216 ein Codewort eines nächstes Frames unter Verwendung des Skalierfaktors entsprechend der Zahl von Bits, die in der adaptiven Bitzuweisungseinrichtung 220a zugewiesen werden, und gibt ein decodiertes Restsignal aus. Das ausgegebene decodierte Restsignal wird in der Addiereinrichtung 217 zum Prädiktionswert addiert, der aus dem Prädiktionsabschnitt 215 ausgegeben wird, um zu einem decodierten Teilbandsignal zu werden, wobei das decodierte Teilbandsignal aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben wird. Die decodierten Teilbandsignale, die im entsprechenden der ADPCM-Dequantisierer 210a bis 210d dequantisiert werden, werden einer Synthese in der Synthesefilterbank 230 unterzogen, um zu einem decodierten Signal zu werden.
  • Somit wird gemäß der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung dieser Ausführungsform in der Sprachcodiervorrichtung ein Restsignal zwischen einem Teilbandsignal für jedes Frequenzband und einem Prädiktionswert quantisiert, um es zu einem Codewort auszugeben, wird ein Skalierfaktor aus den Kernbits des ausgegebenen Codewortes berechnet, und wird auf der Basis des berechneten Skalierfaktors die Zahl der Quantisierbits, die beim Quantisieren eines nächsten Frames jedes Restsignals zugewiesen werden, berechnet. In der Sprachdecodiervorrichtung wird der Skalierfaktor unter Verwendung desselben Codewortes berechnet, wie jenes, das in der Sprachcodiervorrichtung dequanti siert wird, und wird auf der Basis des berechneten Skalierfaktors die Zahl der Quantisierbits berechnet, die in der Sprachcodiervorrichtung bestimmt werden, um sie dem nächsten Frame jedes Restsignals zuzuweisen. Infolgedessen ist die Sprachcodiervorrichtung in der Lage, die Zahl der Quantisierbits adaptiv jedem Restsignal zuzuordnen, und selbst wenn die Sprachcodiervorrichtung die Zahl der zugewiesenen Quantisierbits ändert, ist die Sprachdecodiervorrichtung in der Lage, eine Dequantisierung synchron mit Änderungen der Bitzuweisung in der Sprachcodiervorrichtung auszuführen, ohne Informationen über die geänderte Bitzuweisung zu erhalten. Demzufolge ist es möglich, die Audioqualität zu verbessern, ohne die Sendeeffizienz der Sprachinformationen zu beeinträchtigen.
  • Wenngleich darüber hinaus jede der oben erwähnten Ausführungsformen den Fall beschreibt, bei dem ein Eingangssignal in vier Teilbandsignale in einer Teil-Filterbank geteilt wird, ist die vorliegende Erfindung nicht auf einen derartigen Fall beschränkt, wobei es lediglich erforderlich ist, ein Eingangssignal in mehr als zwei Signale entsprechend dem Frequenzband zu teilen. Darüber hinaus führt die Erhöhung der Zahl von Teilungen zu einer Glättung der zu quantisierenden Signale und verbessert die folgenden Eigenschaften des Skalierfaktors. Wenn zudem eine Teil-Filterbank ein Kosinusmodulationsfilter ist, vergrößert die Erhöhung der Anzahl von Teilungen die Zahl von Taps des Basisfilters und unterdrückt einen Anstieg des Verzögerungsumfangs.
  • Wie es oben erläutert wurde, ist es gemäß der vorliegenden Erfindung möglich, eine Sprachcodiervorrichtung, eine Sprachdecodiervorrichtung und ein Sprachcodier-/Decodierverfahren anzugeben, die eine verbesserte Audioqualität ermöglichen.
  • Die vorliegende Erfindung ist nicht auf die oben beschriebenen Ausführungsformen beschränkt, wobei unterschiedliche Abweichungen und Abänderungen möglich sind, ohne vom Geltungsbereich der vorliegenden Erfindung abzuweichen, wie er in den beigefügten Ansprüchen definiert ist.
  • Diese Anmeldung basiert auf der japanischen Patentanmeldung No. 2001-347408, die am 13. November 2001 eingereicht wurde.

Claims (19)

  1. Sprachcodiervorrichtung, die zum Durchführen von Codierung von Sprachsignalen ausgeführt ist, die mit einem Teilband-ADPCM-Schema codiert sind, wobei sie umfasst: einen Quantisierabschnitt (132), der so konfiguriert ist, dass er ein Restsignal eines bestimmten Teilbandsignals gemäß einer Zahl zugewiesener Bits quantisiert, um ein Codewort zu erzeugen; und einen Bestimmungsabschnitt, der zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits konfiguriert ist, die in dem Quantisierabschnitt (132) verwendet werden, gekennzeichnet durch einen Extrahierabschnitt (133), der zum Extrahieren von Kern-Bits aus dem erzeugten Codewort konfiguriert ist; und dadurch, dass der Bestimmungsabschnitt des Weiteren zum Bestimmen des optimalen Wertes der Zahl zugewiesener Bits, die beim Quantisieren einem nächsten Rahmen des Restsignals zugewiesen werden, auf Basis einer Energie konfiguriert ist, die den extrahierten Kern-Bits entspricht.
  2. Sprachcodiervorrichtung nach Anspruch 1, wobei der Bestimmungsabschnitt einen Dequantisierabschnitt (135) umfasst, der zum Dequantisieren der extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis einer Energie des von dem Dequantisierabschnitt (135) ausgegebenen dequantisierten Signals konfiguriert ist.
  3. Sprachcodiervorrichtung nach Anspruch 2, wobei der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem Dequantisierabschnitt (135) ausgegebenen dequantisierten Signals auf Basis der Energie des dequantisierten Signals konfiguriert ist.
  4. Sprachcodiervorrichtung nach Anspruch 1, wobei der Bestimmungsabschnitt einen Skaliertaktor-Erfassungsabschnitt (134) umfasst, der zum Erfassen eines Skaliertaktors aus den extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis des erfassten Skaliertaktors konfiguriert ist, der als die Energie betrachtet wird, die den extrahierten Kern-Bits entspricht.
  5. Sprachcodiervorrichtung nach Anspruch 4, wobei der Bestimmungsabschnitt des Weiteren einen Dequantisierabschnitt (135) umfasst, der zum Dequantisieren der extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem Dequantisierabschnitt (135) ausgegebenen dequantisierten Signals konfiguriert ist.
  6. Sprachcodiervorrichtung nach Anspruch 1, wobei der Quantisierabschnitt (132) des Weiteren zum Erzeugen skalierbarer Codewörter konfiguriert ist.
  7. Sprachcodiervorrichtung nach Anspruch 1, die des Weiteren umfasst: einen Teil-Abschnitt (100), der zum Teilen eines Eingangssignals in eine Vielzahl von Signalen mit unterschiedlichen Frequenzbändern zum Erzeugen des Teilbandsignals konfiguriert ist, wobei der Teil-Abschnitt (100) eine Kosinusmodulations-Filterbank aufweist und die Kosinusmodulations-Filterbank ein Basisfilter aufweist, durch das ihr Impulsantwortverhalten asymmetrisch ist.
  8. Sprachdecodiervorrichtung, die zum Durchführen von Decodieren von Sprachsignalen konfiguriert ist, die mit einem Teilband-ADPCM-Schema codiert sind, wobei sie umfasst: einen ersten Dequantisierabschnitt (216), der so konfiguriert ist, dass er ein bestimmtes Codewort gemäß einer Zahl zugewiesener Bits dequantisiert, um ein decodiertes Restsignal eines Teilbandsignals zu erzeugen; einen Bestimmungsabschnitt, der zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits konfiguriert ist, die in dem ersten Dequantisierabschnitt (216) verwendet werden, gekennzeichnet durch einen Extrahierabschnitt (211), der zum Extrahieren von Kern-Bits aus dem bestimmten Codewort konfiguriert ist; und dadurch, dass der Bestimmungsabschnitt des Weiteren zum Bestimmen des optimalen Wertes der Zahl zugewiesener Bits, die einem nächsten Rahmen des decodierten Restsignals zugewiesen werden, auf Basis einer Energie konfiguriert ist, die den extrahierten Kern-Bits entspricht.
  9. Sprachdecodiervorrichtung nach Anspruch 8, wobei der Bestimmungsabschnitt einen zweiten Dequantisierabschnitt (212) umfasst, der zum Dequantisieren der extrahierten Kern-Bits bestimmt ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis einer Energie des von dem zweiten Dequantisierabschnitt (212) ausgegebenen dequantisierten Signals konfiguriert ist.
  10. Sprachdecodiervorrichtung nach Anspruch 9, wobei der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem zweiten Dequantisierabschnitt (212) ausgegebenen dequantisierten Signals konfiguriert ist.
  11. Sprachdecodiervorrichtung nach Anspruch 8, wobei der Bestimmungsabschnitt einen Skalierfaktor-Erfassungsabschnitt (213) umfasst, der zum Erfassen eines Skaliertaktors aus den extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis des erfassten Skaliertaktors konfiguriert ist, der als die Energie betrachtet wird, die den extrahierten Kern-Bits entspricht.
  12. Sprachdecodiervorrichtung nach Anspruch 11, wobei der Bestimmungsabschnitt des Weiteren einen zweiten Dequantisierabschnitt (212) umfasst, der zum Dequantisieren der extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem zweiten Dequantisierabschnitt (212) ausgegebenen dequantisierten Signals konfiguriert ist.
  13. Sprachdecodiervorrichtung nach Anspruch 8, die des Weiteren umfasst: einen Syntheseabschnitt (230), der zum Durchführen von Synthese von in den Erzeugungsabschnitten (210a, 210b, 210c, 210d) erzeugten decodierten Teilbandsignalen konfiguriert ist, wobei der Syntheseabschnitt (230) eine Kosinusmodulations-Filterbank aufweist und die Kosinusmodulations-Filterbank ein Basisfilter aufweist, durch das ihr Impulsantwortverhalten asymmetrisch ist.
  14. Digitales Drahtlos-Mikrofonsendesystem, das die Sprachcodiervorrichtung nach Anspruch 1 aufweist.
  15. Digitales Drahtlos-Mikrofonempfangssystem, das die Sprachdecodiervorrichtung nach Anspruch 8 aufweist.
  16. Sprachcodierverfahren zum Durchführen von Codierung von Sprachsignalen, die mit einem Teilband-ADPCM-Schema codiert sind, wobei es umfasst: einen Quantisierschritt des Quantisierens eines Restsignals eines bestimmten Teilbandsignals gemäß einer Zahl zugeordneter Bits zum Erzeugen eines Codeworts; einen Erfassungsschritt des Erfassens eines optimalen Wertes der Zahl zugewiesener Bits; und einen Quantisierschritt des Quantisierens eines Restsignals eines nächsten Rahmens eines bestimmten Teilbandsignals gemäß dem erfassten optimalen Wert der Zahl zugewiesener Bits zum Erzeugen eines Codeworts des nächsten Rahmens, gekennzeichnet durch einen Extrahierschritt des Extrahierens von Kern-Bits aus dem erzeugten Codewort; und dadurch, dass der Erfassungsschritt den optimalen Wert der Zahl zugewiesener Bits, die beim Quantisieren dem nächsten Rahmen des Restsignals zugewiesen werden, auf Basis einer Energie erfasst, die den extrahierten Kern-Bits entspricht.
  17. Sprachdecodierverfahren zum Durchführen von Decodierung von Sprachsignalen, die mit einem Teilband-ADPCM-Schema codiert sind, wobei es umfasst: einen Dequantisierschritt des Dequantisierens eines bestimmten Codeworts gemäß einer Zahl zugewiesener Bits zum Erzeugen eines decodierten Restsignals eines Teilbandsignals; einen Erfassungsschritt des Erfassens eines optimalen Wertes der Zahl zugewiesener Bits; und einen Dequantisierschritt des Dequantisierens eines Codeworts eines nächsten Rahmens gemäß dem erfassten optimalen Wert der Zahl zugewiesener Bits zum Erzeugen eines decodierten Restsignals des nächsten Rahmens eines Teilbandsignals, gekennzeichnet durch einen Extrahierschritt des Extrahierens von Kern-Bits aus dem bestimmten Codewort; und dadurch, dass der Erfassungsschritt den optimalen Wert der Zahl zugewiesener Bits, die dem nächsten Rahmen des decodierten Restsignals zugewiesen werden, auf Basis einer Energie erfasst, die den extrahierten Kern-Bits entspricht.
  18. Sprachdecodierverfahren nach Anspruch 17, wobei in dem Erfassungsschritt das gleiche Codewort dequantisiert wird, das während des Codierens zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits verwendet worden ist, und auf Basis einer Energie eines ausgegebenen dequantisierten Signals ein optimaler Wert der Zahl zugewiesener Bits erfasst wird.
  19. Sprachdecodierverfahren nach Anspruch 17, wobei in dem Erfassungsschritt die gleichen Kern-Bits wie die eines Codeworts extrahiert werden, das beim Codieren verwendet worden ist, ein Skalierfaktor aus den extrahierten Kern-Bits berechnet wird und auf Basis des berechneten Skaliertaktors ein optimaler Wert der Zahl zugewiesener Bits bestimmt wird.
DE60217612T 2001-11-13 2002-11-12 Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen Expired - Fee Related DE60217612T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001347408A JP4245288B2 (ja) 2001-11-13 2001-11-13 音声符号化装置および音声復号化装置
JP2001347408 2001-11-13

Publications (2)

Publication Number Publication Date
DE60217612D1 DE60217612D1 (de) 2007-03-08
DE60217612T2 true DE60217612T2 (de) 2007-05-16

Family

ID=19160417

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60217612T Expired - Fee Related DE60217612T2 (de) 2001-11-13 2002-11-12 Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen

Country Status (5)

Country Link
US (1) US7155384B2 (de)
EP (1) EP1310943B1 (de)
JP (1) JP4245288B2 (de)
CN (1) CN100440758C (de)
DE (1) DE60217612T2 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1959435B1 (de) * 1999-08-23 2009-12-23 Panasonic Corporation Sprachenkodierer
EP1869673B1 (de) 2005-04-01 2010-09-22 Qualcomm Incorporated Verfahren und vorrichtungen zum kodieren und dekodieren eines hochbandteils eines sprachsignals
EP1875464B9 (de) 2005-04-22 2020-10-28 Qualcomm Incorporated Verfahren, speichermedium und vorrichtung zur verstärkungsfaktor-dämpfung
US20090164211A1 (en) * 2006-05-10 2009-06-25 Panasonic Corporation Speech encoding apparatus and speech encoding method
EP2040251B1 (de) 2006-07-12 2019-10-09 III Holdings 12, LLC Audiodekodierungseinrichtung und audiokodierungseinrichtung
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
JP5269195B2 (ja) * 2009-05-29 2013-08-21 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム
CN101989428B (zh) * 2009-07-31 2012-07-04 华为技术有限公司 比特分配方法、编码方法、解码方法、编码器及解码器
CN102280107B (zh) * 2010-06-10 2013-01-23 华为技术有限公司 边带残差信号生成方法及装置
CN106409300B (zh) 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
CN114708874A (zh) 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
CN111294147B (zh) * 2019-04-25 2023-01-31 北京紫光展锐通信技术有限公司 Dmr系统的编码方法及装置、存储介质、数字对讲机

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02264520A (ja) 1989-04-04 1990-10-29 Nec Corp 帯域分割符号化復号方式並びに帯域分割符号化器及び帯域分割復号器
JPH03181232A (ja) 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP3111459B2 (ja) 1990-06-11 2000-11-20 ソニー株式会社 音声データの高能率符号化方法
DE69132427D1 (de) * 1990-07-05 2000-11-02 Fujitsu Ltd Digitalmultiplex-Übertragungssystem
JPH05181497A (ja) 1991-12-27 1993-07-23 Toshiba Corp ピッチ変換装置
JPH05183523A (ja) 1992-01-06 1993-07-23 Oki Electric Ind Co Ltd 音声・楽音符号化装置
JPH0669811A (ja) 1992-08-21 1994-03-11 Oki Electric Ind Co Ltd 符号化回路及び復号化回路
US5517511A (en) * 1992-11-30 1996-05-14 Digital Voice Systems, Inc. Digital transmission of acoustic signals over a noisy communication channel
JP2888129B2 (ja) 1994-03-15 1999-05-10 松下電器産業株式会社 デジタル信号記録装置
US5493647A (en) 1993-06-01 1996-02-20 Matsushita Electric Industrial Co., Ltd. Digital signal recording apparatus and a digital signal reproducing apparatus
JP3398457B2 (ja) 1994-03-10 2003-04-21 沖電気工業株式会社 量子化スケールファクタ生成方法、逆量子化スケールファクタ生成方法、適応量子化回路、適応逆量子化回路、符号化装置及び復号化装置
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3519859B2 (ja) 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
JP3263347B2 (ja) * 1997-09-20 2002-03-04 松下電送システム株式会社 音声符号化装置及び音声符号化におけるピッチ予測方法
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
JP2001007769A (ja) 1999-04-22 2001-01-12 Matsushita Electric Ind Co Ltd 低遅延サブバンド分割/合成装置
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
EP1104101A3 (de) 1999-11-26 2005-02-02 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur Teilbandtrennung / Zusammensetzung eines digitalen Signal zur erzeugung einer Filterung mit Bandtrennung und Bandzusammensetzung mit verringerten Gruppenlaufzeit
AU2110001A (en) 1999-12-31 2001-07-16 Thomson Licensing S.A. Subband adpcm voice encoding and decoding

Also Published As

Publication number Publication date
US20030093266A1 (en) 2003-05-15
EP1310943A3 (de) 2004-02-11
CN1419349A (zh) 2003-05-21
EP1310943B1 (de) 2007-01-17
JP4245288B2 (ja) 2009-03-25
DE60217612D1 (de) 2007-03-08
EP1310943A2 (de) 2003-05-14
CN100440758C (zh) 2008-12-03
US7155384B2 (en) 2006-12-26
JP2003150198A (ja) 2003-05-23

Similar Documents

Publication Publication Date Title
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
DE602004013031T2 (de) Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
DE69024033T2 (de) Kodierungssystem mit variabler Bitrate.
DE69705642T2 (de) Audio-kodierverfahren mit veränderlicher kodelänge unter verwendung einer mehrzahl von teilband-bitverteilungsmoden
DE60038082T2 (de) Audio Teilbandkodierer mit differentiell kodierten Skalenfaktoren
DE69732761T2 (de) Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69015695T2 (de) Einrichtung zur Transformationskodierung.
DE60012860T2 (de) Verfahren zur Verarbeitung mehrerer digitaler Audiodatenströme
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE3883519T2 (de) Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
DE69014440T2 (de) Sprachcodierungs-/-decodierungssystem.
DE19549621B4 (de) Vorrichtung zum Codieren von Audiosignalen
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
DE60217612T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen
DE4241131B4 (de) Einrichtung zum Kodieren und Dekodieren von Übertragungssignalen mittels Transformationen
DE69826529T2 (de) Schnelle datenrahmen-optimierung in einem audio-kodierer
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE60017825T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
DE60214627T2 (de) Verfahren und Vorrichtung zur Bitratenkonversion
DE69329568T2 (de) Verfahren zur Sprachkodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PANASONIC CORP., KADOMA, OSAKA, JP

8339 Ceased/non-payment of the annual fee