DE60217612T2

DE60217612T2 - Verfahren und Vorrichtung zur Kodierung und Dekodierung von Sprachsignalen

Info

Publication number: DE60217612T2
Application number: DE60217612T
Authority: DE
Inventors: Yutaka Yamato-shi Banba
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp
Priority date: 2001-11-13
Filing date: 2002-11-12
Publication date: 2007-05-16
Anticipated expiration: 2022-11-13
Also published as: US20030093266A1; EP1310943A3; CN1419349A; EP1310943B1; JP4245288B2; DE60217612D1; EP1310943A2; CN100440758C; US7155384B2; JP2003150198A

Description

HINTERGRUND DER ERFINDUNG
1. Gebiet der Erfindung
Die vorliegende Erfindung bezieht sich auf eine Sprachcodiervorrichtung, eine Sprachdecodiervorrichtung und ein Sprachcodier-/Decodierverfahren bei einer Teilband-ADPCM (Adaptive Differentialimpuls-Codiermodulation).
2. Beschreibung des Standes der Technik
Normalerweise sind als Sprachcodiervorrichtung und Sprachdecodiervorrichtung, die bei der Teilband-ADPCM verwendet werden, Vorrichtungen bekannt, die die Vorgabe G.722 der ITU-T (International Telecommunication Union, Telcommunication sector) erfüllen.
1 ist ein Blockschaltbild, das Konfigurationen einer Sprachcodiervorrichtung 300 und einer Sprachdecodiervorrichtung 400 darstellt, die bei einer Zwei-Teilband-ADPCM verwendet werden, die in der Vorgabe G.722 beschrieben ist.
Die Sprachcodiervorrichtung 300 besteht aus einer 24-Tap-Teil-Filterbank 310, die ein Frequenzband eines Eingangssignals in zwei Teilbänder aufteilt und Teilbandsignale ausgibt, ADPCM-Quantisierern 320a und 320b, die entsprechende Zwei-Teilungs-Teilbandsignale quantisieren, und einem Multiplexer 330, der Codewörter multiplexiert, die in den ADPCM-Quantisierern 320a und 320b quantisiert werden, um einen Bitstrom zu erzeugen.
Daneben besteht die Sprachdecodiervorrichtung 400 aus einem Demultiplexer 410, der Codewörter für jedes Teilband ausgibt, das man aus den gesendeten Datenströmen erhält, ADPCM-Dequantisierern 420a und 420b, die entsprechende Codewörter für jedes Teilband dequantisieren, das aus dem Demultiplexer 410 ausgegeben wird, um Teilbandsignale auszugeben, und einer 24-Tap-Synthesefilterbank 430, die eine Synthesefilterung an den Teilbandsignalen ausführt.
Vorgänge der Sprachcodiervorrichtung 300 und der Sprachdecodiervorrichtung 400, die jeweils in der oben beschriebenen Art und Weise aufgebaut sind, werden im folgenden beschrieben.
Ein Frequenzband eines Eingangssignals wird in zwei Teilbänder in der Teil-Filterbank 310 geteilt, wobei zwei Teilbandsignale erzeugt werden. Jedem der Teilbandsignale wird eine vorbestimmte Zahl von Quantisierbits zugeordnet, wobei die Teilbandsignale in jeweils einem der ADPCM-Quantisierer 320a und 320b quantisiert werden. Die Codewörter, die man durch die Quantisierung erhält, werden im Multiplexer 330 in die Bitströme multiplexiert.
Daneben werden in der Sprachdecodiervorrichtung 400 die Bitströme mit einer Vielzahl multiplexierter Codewörter im Demultiplexer 410 zu Codewörtern für jedes Teilband demultiplexiert. Die Codewörter für jedes Teilband, die man beim Demultiplexieren erhält, werden in den ADPCM-Dequantisierern 420a und 420b dequantisiert, um zu Teilbandsignalen zu werden. Die Teilbandsignale werden einer Synthese in der Synthesefilterbank 430 unterzogen, um zu einem decodierten Signal zu werden.
Da jedoch bei der herkömmlichen Sprachcodiervorrichtung und der Sprachdecodiervorrichtung, die oben beschrieben wurden, die Zahl der Quantisierbits, die jedem Teilbandsignal in einem ADPCM-Quantisierer in der Sprachcodiervorrichtung zugewiesen ist, insbesondere dann fixiert ist, wenn sich eine Abtastfrequenz eines Eingangssignals erhöht, besteht das Risiko, dass die Bitzuweisung nicht optimal ist und dass die Audioqualität der decodierten Signale in der Sprachdecodiervorrichtung beeinträchtigt wird.
Das US-Patent 5.974.380 beschreibt eine Sprachcodier-/Decodiervorrichtung und ein zugehöriges Verfahren gemäß dem Oberbegriff der Ansprüche 1, 8 und 16. Es kommen Perfekt-/Nicht-Perfekt-Wiederherstellungsfilter, die prädiktive/nichtprädiktive Teilbandcodierung, die Transientenanalyse sowie die psychoakustische/minimale mittlere quadratische Fehlbitzuordnung über die Zeit, die Frequenz und die mehrfachen Audiokanäle zur Anwendung, um einen Datenstrom zu codieren/decodieren, um wiederhergestelltes Audio hoher Wiedergabetreue zu erzeugen. Die Bitzuordnung für den ADPCM-Quantisierer ist für jeden Teilframe je Teilband-Audiokanal auf der Basis des Teilbandsignals festgelegt, das in den Teilbandcodierer eingegeben wird. Es werden Bitzuordnungsindizes zum Decoder entweder unter Verwendung eines ganzzahligen Codes oder einer Entropietabelle gesendet.
ÜBERSICHT ÜBER DIE ERFINDUNG
Ein Ziel der vorliegenden Erfindung besteht darin, die Audioqualität codierter Sprache zu verbessern, ohne die Sendefrequenz zu beeinträchtigen.
Dieses Ziel wird durch eine Sprachcodiervorrichtung nach Anspruch 1, eine Sprachdecodiervorrichtung nach Anspruch 8, ein digitales Drahtlosmikrofon-Sendesystem nach Anspruch 14, ein digitales Drahtlosmikrofon-Empfangssystem gemäß Anspruch 15, ein Sprachcodierverfahren gemäß Anspruch 16 und ein Sprachdecodierverfahren gemäß Anspruch 17 erreicht. Bevorzugte Ausführungsformen sind Gegenstand der abhängigen Ansprüche.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Die obigen und andere Ziele sowie Merkmale der Erfindung werden aus der folgenden Beschreibung in Verbindung mit den beiliegenden Zeichnungen besser verständlich, in denen ein Beispiel exemplarisch dargestellt ist.
1 ist ein Blockschaltbild, das Konfigurationen einer herkömmlichen Sprachcodiervorrichtung und einer Sprachdecodiervorrichtung darstellt, die bei einer Zwei-Teilband-ADPCM verwendet werden;
2 ist ein Blockschaltbild, das eine Konfiguration einer Sprachcodiervorrichtung gemäß einer ersten und einer zweiten Ausführungsform der vorliegenden Erfindung darstellt;
3 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt;
4 ist eine Ansicht, die ein Beispiel einer Quantisierbitzahl-Zuordnung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt;
5 ist ein Blockschaltbild, das eine Konfiguration einer Sprachdecodiervorrichtung gemäß der ersten und der zweiten Ausführungsform der vorliegenden Erfindung zeigt;
6 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt;
7 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt; und
8 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung darstellt.
DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
Ausführungsformen der vorliegenden Erfindung werden im folgenden mit spezieller Bezugnahme auf die beiliegenden Zeichnungen erläutert.
(Erste Ausführungsform)
2 ist ein Blockschaltbild, das eine Konfiguration einer Sprachcodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt. In 2 teilt eine Teil-Filterbank 100 ein Frequenzband eines Eingangssignals in vier Teilbänder mit derselben Bandbreite und führt einen Ausdünnungsvorgang unter Verwendung von "4" als Ausdünnungszahl durch, die die Anzahl von Teilungen ist. Band-Teil-FIR-Filter 110a und 110d in der Teil-Filterbank 100 führen eine Teil-Filterung an einem Eingangssignal für vorbestimmte Frequenzbänder durch. Die Teil-Filterbank 100 ist eine Kosinusmodulations-Filterbank, wobei die Impulsantwortverhalten der Band-Teil-FIR-Filter 110a bis 110d, die Basisfilter sind, asymmetrisch sind.
Weiterhin führen Downsample-Einrichtungen 120a bis 120d in der Teil-Filterbank 100 die Ausdünnungsverarbeitung an den entsprechenden Ausgaben der Band-Teil-FIR-Filter 110a bis 110d zur Codiereffizienz unter Verwendung von "4" als Ausdünnungszahl aus, die gleich der Zahl von Teilungen in der Teil-Filterbank 100 ist, und geben entsprechende Teilband-Signale aus.
Jeder der ADPCM-Quantisierer 130a bis 130d quantisiert ein Restsignal zwischen dem entsprechenden Teilbandsignal und einem Prädiktionswert, der aus dem letzten Frame des Teilbandsignals berechnet wird, um ein skalierbares Codewort auszugeben. Weiterhin berechnen die ADPCM-Quantisierer 130a bis 130d einen dequantisierten Wert und Skalierfaktor aus dem Restsignal.
Eine adaptive Bitzuweisungseinrichtung 140 bestimmt die Zahl von Quantisierbits, die jedem der Restsignale zugewiesen werden soll, auf der Basis eines Energiewertes des dequantisierten Wertes, der in einem entsprechenden der ADPCM-Quantisierer 130a und 130d berechnet wird.
Der Multiplexer 150 multiplexiert Codewörter, die aus den ADPCM-Quantisierern 130a bis 130d ausgegeben werden, um einen Bitstrom zu erzeugen, der ein multiplexiertes Signal ist.
3 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt. Wenngleich 3 einen Aufbau eines ADPCM-Quantisierers 130a und einer adaptiven Bitzuordnungseinrichtung 140 zeigt, haben die anderen ADPCM-Quantisierer 130b bis 130d denselben Aufbau, wie jener des Quantisierers 130a, und sind mit der adaptiven Bitzuweisungseinrichtung 140 verbunden.
In 3 berechnet eine Addiervorrichtung 131 eine Differenz zwischen dem Teilbandsignal, das in einen entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben wird, und einem Prädiktionswert, um ein Restsignal zu erzeugen. Der Quantisierabschnitt 132 quantisiert das erzeugte Restsignal mit Hilfe des Skalierfaktors und gibt ein Codewort mit der Zahl der Quantisierbits aus, die in der adaptiven Bitzuordnungseinrichtung 140 bestimmt werden. Ein Kern-Bit-Extrahierabschnitt 133 löscht die geringstwertigen Bits (im folgenden "LSB" genannt) aus dem Codewort, das aus dem Quantisierabschnitt 132 ausgegeben wird, um Kern-Bits zu extrahieren. Der Skalierfaktor-Adaptierabschnitt 134 berechnet einen Skalierfaktor aus den extrahierten Kern-Bits. Der Dequantisierabschnitt 135 dequantisiert die extrahierten Kern-Bits und gibt einen dequantisierten Wert an den Prädiktionsabschnitt 136, die Addiereinrichtung 137 und die adaptive Bitzuordnungseinrichtung 140 aus. Der Prädiktionsabschnitt 136 führt eine Null-Prädiktion und Pol-Prädiktion unter Verwendung des dequantisierten Wertes und eines Ausgangs aus dem Prädiktionsabschnitt 136 aus und berechnet einen Prädiktionswert eines nächsten Frames des Teilbandsignals. Die Addiereinrichtung 137 berechnet die Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 136 berechnet wird.
Der Betrieb der Sprachcodiervorrichtung, die den oben beschriebenen Aufbau hat, wird im folgenden beschrieben.
Ein Sprachsignal, das in die Sprachcodiervorrichtung eingegeben wird, wird in vier Teilbandsignale in der Teil-Filterdatenbank 100 geteilt. Da die Teil-Filterdatenbank 100 eine Kosinusmodulations-Filterbank ist und die Impulsantwortverhalten der Band-Teil-FIR-Filter 110a bis 110d, die Basisfilter sind, asymmetrisch sind, wird eine Gruppenverzögerung, die beim Filtern auftritt, verringert, wodurch es möglich ist, den Berechnungsaufwand zu verringern. Die geteilten Teilbandsignale werden jeweils in die ADPCM-Quantisierer 130a bis 130d eingegeben.
Die Addiereinrichtung 131 berechnet ein Restsignal zwischen dem Teilbandsignal, das in einen entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben wird, und einem Prädiktionswert, der aus dem letzten Frame im Prädiktionsabschnitt 136 berechnet wird, und gibt das berechnete Restsignal in den Quantisierabschnitt 132 ein. Das Restsignal wird im Quantisierabschnitt 132 zu einem Codewort mit der Zahl der Quantisierbits quantisiert, die durch die adaptive Bitzuweisungseinrichtung 140 zugewiesen werden. Bei der Quantisierung des Restsignals kommt der Skalierfaktor zur Anwendung, der im Skalierfaktor-Adaptierabschnitt 134 berechnet wird. Das Codewort, das im Quantisierabschnitt 132 quantisiert wird, wird an den Multiplexer 150 und zudem an den Kern-Bit-Extrahierabschnitt 133 ausgegeben. Der Abschnitt 133 löscht das LSB, um Kern-Bits zu extrahieren. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 134, um bei der Berechnung eines Skalierfaktors verwendet zu werden, und zudem in den Dequantisierabschnitt 135 eingegeben. Hier wird das Codewort, das im Quantisierabschnitt 132 quantisiert wird, skalierbar, um die Konsistenz des Skalierfaktors beizubehalten.
Der Dequantisierabschnitt 135 dequantisiert die Kern-Bits unter Verwendung des Skaliertaktors, der im Skalierfaktor-Adaptierabschnitt 134 berechnet wurde. Der dequantisierte Wert, den man durch Dequantisieren der Kern-Bits erhält, wird in den Prädiktionsabschnitt 136 eingegeben. Dieser eingegebene Wert wird Null-Prädiktions-Eingabewert genannt. Der dequantisierte Wert wird in der Addiereinrichtung 137 einem Prädiktionswert eines letzten Frames hinzugefügt, der aus dem Prädiktionsabschnitt 136 ausgegeben wird, und wieder in den Prädiktionsabschnitt 136 eingegeben. Dieser Eingabewert wird Pol-Prädiktions-Eingabewert genannt. Unter Verwendung des Null-Prädiktions-Eingabewertes und des Pol-Prädiktions-Eingabewertes berechnet der Prädiktionsabschnitt 136 einen Prädiktionswert eines nächsten Frames des Teilbandsignals.
Der dequantisierte Wert wird in die adaptive Bitzuweisungseinrichtung 140 gemäß einer vorbestimmten Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 140 berechnet eine Energie des dequantisierten Wertes, d.h. eine Quadratsumme des dequantisierten Wertes als Muster, der aus jedem der ADPCM-Quantisierer 130a bis 130d ausgegeben wird, und bestimmt auf der Basis der berechneten Energie des dequantisierten Wertes die Zahl von Bits, die jedem Restsignal zugewiesen werden, das in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert werden soll.
Die bestimmten Zahlen der Quantisierbits werden an die jeweiligen Quantisierabschnitte 132 in den ADPCM-Quantisierern 130a bis 130d ausgegeben. Wie es oben erwähnt wurde, quantisiert jeder Quantisierabschnitt 132 das Restsignal des nächstens Frames unter Verwendung des Skalierfaktors und gibt ein Codewort mit der Zahl der zugewiesenen Bits aus. Die Codewörter, die in den ADPCM-Quantisierern 130a bis 130d quantisiert werden, werden im Multiplexer 150 zu einem Bitstrom quantisiert, der ein multiplexiertes Signal ist.
4 zeigt ein Beispiel einer Quantisierbitzahl-Zuweisung. In 4 kennzeichnen Bits, die mit einer schrägen Linie dargestellt sind, Kern-Bits in jedem Band. Die Zahl der Kern-Bits ist fünf im ersten Band, vier im zweiten Band, drei im dritten Band und zwei im vierten Band. Der Kern-Bits sind in jedem Band immer konstant, wobei Bits, die adaptiv durch die adaptive Bitzuweisungseinrichtung 140 zugewiesen werden, zwei Bits sind, die mit Weiß in 4 dargestellt sind. Die beiden Bits werden adaptiv jedem Band entsprechend der Energie des dequantisierten Wertes zugewiesen.
Eine Sprachdecodiervorrichtung gemäß der ersten Ausführungsform wird im folgenden beschrieben.
5 ist ein Blockschaltbild, das eine Konfiguration der Sprachdecodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt. In 5 zerlegt der Demultiplexer einen Eingangsbitstrom für jede Anzahl von Bits, die durch die adaptive Bitzuweisungseinrichtung 220, die später beschrieben wird, zugewiesen werden, und teilt somit den Bitstrom in Codewörter für jedes Teilband auf. Jeder der ADPCM-Quantisierer 210a bis 201d gibt eine Summe aus einem decodierten Restsignal, das man durch Dequantisieren eines entsprechenden Codewortes erhält, und einem Prädiktionswert, der aus einem Codewort eines letzten Frames berechnet wird, als decodiertes Teilbandsignal aus. Weiterhin berechnet jeder der ADPCM-Dequantisierer 210a bis 210d einen dequantisierten Wert lediglich aus Kern-Bits, die man durch Löschen der LSB aus dem Codewort erhält, und den Skalierfaktor. Auf der Basis der Energie des dequantisierten Wertes der Kern-Bits, der in jedem der ADPCM-Quantisierer 210a bis 210d berechnet wird, berechnet die adaptive Bitzuweisungseinrichtung 220 die Zahl von Quantisierbits, die dem jeweiligen Restsignal in der Sprachcodiervorrichtung zugewiesen werden.
Die Synthesefilterbank 230 kombiniert decodierte Teilbandsignale, die aus den ADPCM-Quantisierern 210a bis 210d ausgegeben werden, um ein decodiertes Signal zu erhalten. Upsample-Einrichtungen 240a bis 240d in der Synthesefilterbank 230 führen eine Interpolation der jeweiligen ausgedünnten decodierten Teilbandsignale aus. Bandsynthese-FIR-Filter 250a bis 250d in der Synthesefilter-Bank 230 führen die Synthesefilterung an entsprechenden interpolierten decodierten Teilbandsignalen aus. Die Synthesefilterbank 230 ist eine Kosinusmodulations-Filterbank, wobei die Impulsantwortverhalten der Bandsynthese-FIR-Filter 250a bis 250d, die Basisfilter sind, asymmetrisch sind.
6 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt. Wengleich 6 eine Konfiguration eines ADPCM-Dequantisierers 210a und einer adaptiven Bitzuweisungseinrichtung 220 darstellt, haben die anderen ADPCM-Dequantisierer 210b bis 210d dieselbe Konfiguration wie jene des Dequantisierers 210a und sind mit der adaptiven Bitzuweisungseinrichtung 220 verbunden.
In 6 löscht der Kern-Bit-Extrahierabschnitt 211 die LSB aus dem Codewort, das in den entsprechenden der ADPCM-Quantisierer 210a bis 210d eingegeben wird, um Kern-Bits zu extrahieren. Der Dequantisierabschnitt 212 dequantisiert die extrahierten Kern-Bits und gibt einen dequantisierten Wert an die Addiereinrichtung 214, den Prädiktionsabschnitt 215 und die adaptive Bitzuweisungseinrichtung 220 aus. Der Skalierfaktor-Adaptierabschnitt 213 berechnet einen Skalierfaktor aus den extrahierten Kern-Bits. Die Addiereinrichtung 214 berechnet die Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 215 berechnet wird. Der Prädiktionsabschnitt 215 führt eine Null-Prädiktion und eine Pol-Prädiktion unter Verwendung des dequantisierten Wertes und einer Ausgabe des Prädiktionsabschnittes 215 aus und berechnet einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals. Der Dequantisierabschnitt 216 dequantisiert das eingegebene Codewort für jede Zahl von Quantisierbits, die in der adaptiven Bitzuweisungseinrichtung 220 unter Verwendung des Skalierfaktors berechnet wurden, und gibt ein decodiertes Restsignal aus. Die Addiereinrichtung 217 berechnet die Summe aus dem decodierten Restsignal, das aus dem Dequantisierabschnitt 216 ausgegeben wird, und dem Prädiktionswert, um ein decodiertes Teilbandsignal zu erzeugen.
Der Betrieb der Sprachdecodiervorrichtung, die den oben beschriebenen Aufbau hat, wird als nächstes beschrieben.
Ein Bitstrom, der in die Sprachdecodiervorrichtung eingegeben wird, wird pro Anzahl von Quantisierbits, die durch die Bitzuweisungseinrichtung 220 zugewiesen werden, zerlegt und somit werden alle vier Teilbänder in Codewörter zerlegt. Die zerlegten Codewörter werden in die jeweiligen ADPCM-Dequantisierer 210a bis 210d eingegeben.
Das Codewort, das in jeden der ADPCM-Dequantisierer 210a bis 210d eingegeben wird, wird im Dequantisierabschnitt 216 entsprechend der Zahl der Quantisierbits dequantisiert, die von der adaptiven Bitzuweisungseinrichtung 220 zugewiesen werden, und als decodiertes Restsignal ausgegeben. Aus dem Codewort, das in den entsprechenden der ADPCM-Dequantisierer 210a bis 210d eingege ben wird, werden die LSB gelöscht und werden Kern-Bits im Kern-Bit-Extrahierabschnitt 211 extrahiert. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 213, um bei der Berechnung eines Skalierfaktors verwendet zu werden, und zudem in den Dequantisierabschnitt 212 eingegeben. Im Dequantisierabschnitt 212 werden die Kernbits unter Verwendung des Skalierfaktors dequantisiert, der im Skalierfaktor-Adaptierabschnitt 213 berechnet wird. Der dequantisierte Wert, den man durch Dequantisierung der Kern-Bits erhält, wird in den Prädiktionsabschnitt 215 eingegeben. Dieser eingegebene Wert wird Null-Prädiktionseingabewert genannt. Der dequantisierte Wert wird in der Addiereinrichtung 214 zu einem Prädiktionswert eines letzten Frames addiert, der aus dem Prädiktionsabschnitt 215 ausgegeben wird, und erneut in den Prädiktionsabschnitt 215 eingegeben. Dieser eingegebene Wert wird Pol-Prädiktionseingabewert genannt. Unter Verwendung des Null-Prädiktionseingabewertes und des Pol-Prädiktionseingabewertes berechnet der Prädiktionsabschnitt 215 einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals.
Der dequantisierte Wert wird in die adaptive Bitzuweisungseinrichtung 220 je vorbestimmte Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 220 berechnet eine Energie des dequantisierten Wertes, d.h. die Quadratsumme des dequantisierten Wertes als Muster, der aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben wird, und berechnet auf der Basis der berechneten Energie des dequantisierten Wertes die Zahl der Quantisierbits, die jedem Restsignal zugewiesen werden, das in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d in der Sprachcodiervorrichtung quantisiert wird.
Die berechneten Anzahlen der Quantisierbits werden an den Dequantisierabschnitt 216 im entsprechenden der ADPCM-Dequantisierer 210a bis 210d ausgegeben, wobei, wie es oben beschrieben ist, der Dequantisierabschnitt 216 ein Codewort eines nächsten Frames unter Verwendung des Skalierungsfaktors entsprechend des Zahl von Bits dequantisiert, die in der adaptiven Bitzuweisungseinrichtung 220 zugewiesen werden, und ein decodiertes Restsignal ausgibt. Das ausgegebene decodierte Restsignal wird in der Addiereinrichtung 217 dem Prädiktionswert hinzugefügt, der aus dem Prädiktionsabschnitt 215 ausgegeben wird, um zu einem decodierten Teilbandsignal zu werden, wobei das decodierte Teilbandsignal aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben wird.
Die decodierten Teilbandsignale, die in den ADPCM-Dequantisieren 210a bis 210d dequantisiert werden, werden einer Interpolation in den Upsample-Einrichtungen 240a bis 240d in der Synthesefilter-Datenbank 230 und einer Synthesefilterung in den Bandsynthese-FIR-Filtern 250a bis 250d unterzogen. Die jeweiligen Ausgaben aus den Bandsynthese-FIR-Filtern 250a bis 250d werden in den Addiereinrichtungen 260a bis 260c zu einem decodierten Signal addiert. Da hier die Synthesefilterbank 230 eine Kosinusmodulations-Filterbank ist und die Impulsantwortverhalten der Bandsynthese-FIR-Filter 250a bis 250b, die Basisfilter sind, asymmetrisch sind, wird eine Gruppenverzögerung, die beim Filtern auftritt, verringert, wodurch es möglich ist, den Berechnungsaufwand zu verringern.
Somit wird gemäß der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung dieser Ausführungsform in der Sprachcodiervorrichtung ein Restsignal zwischen einem Teilbandsignal für jedes Frequenzband und einem Prädiktionswert quantisiert, um es zu einem Codewort auszugeben, wird das ausgegebene Codewort dequantisiert, um eine Energie des dequantisierten Wertes zu berechnen, und wird die Zahl der Quantisierbits, die beim Quantisieren eines nächsten Frames jedes Restsignals zugewiesen werden, auf der Basis der berechneten Energie bestimmt. In der Sprachdecodiervorrichtung wird dasselbe Codewort, wie jenes, das in der Sprachcodiervorrichtung dequantisiert wird, dequantisiert, um die Energie des dequantisierten Wertes zu berechnen, und wird auf der Basis der berechneten Energie die Zahl der Quantisierbits berechnet, die in der Sprachcodiervorrichtung bestimmt werden, um sie einem nächsten Frame jedes Restsignals zuzuweisen. Infolgedessen ist die Sprachcodiervorrichtung in der Lage, die Zahl der Quantisierbits adaptiv jedem Restsignal zuzuordnen, und selbst wenn die Sprachcodiervorrichtung die Zahl der zugewiesenen Quantisierbits ändert, ist die Sprachdecodiervorrichtung in der Lage, eine Dequantisierung synchron mit Änderungen der Bitzuweisung in der Sprachcodiervorrichtung auszuführen, ohne Informationen über die geänderte Bitzuweisung zu erhalten. Da die Sprachcodier vorrichtung der Sprachdecodiervorrichtung keine Informationen über die Änderung der Bitzuweisung für die Synchronisierung mitteilen muss, ist es demzufolge möglich, die Audioqualität zu verbessern, ohne die Sendeeffizienz der Sprachinformationen zu beeinträchtigen.
(Zweite Ausführungsform)
Es ist ein Merkmal der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung, einen Skalierfaktor bei der Bestimmung eines optimalen Wertes der Zahl von Quantisierbits zu verwenden. Darüber hinaus sind die Konfigurationen der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform dieselben wie jene der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung, die in 2 bzw. 5 der ersten Ausführungsform dargestellt sind, weshalb auf deren Beschreibung verzichtet wird.
7 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt. Wenngleich 7 eine Konfiguration des ADPCM-Quantisierers 130a und der adaptiven Bitzuweisungseinrichtung 140a darstellt, haben die anderen ADPCM-Quantisierer 130b und 130d dieselbe Konfiguration wie jene des Quantisierers 130a und sind mit der adaptiven Bitzuweisungseinrichtung 140a verbunden. Darüber hinaus sind dieselben Abschnitte wie in 3 mit denselben Bezugszeichen versehen, um deren Beschreibung auszulassen.
In 7 berechnet der Skalierfaktor-Adaptierabschnitt 134a einen Skalierfaktor aus den Kern-Bits, die im Kern-Bit-Extrahierabschnitt 133 extrahiert werden, um ihn an die adaptive Bitzuweisungseinrichtung 140a auszugeben. Der Dequantisierabschnitt 135a dequantisiert die Kern-Bits, die im Kern-Bit-Extrahierabschnitt 133 extrahiert werden, und gibt einen dequantisierten Wert an den Prädiktionsabschnitt 136 und die Addiereinrichtung 137 aus. Die adaptive Bitzuweisungseinrichtung 140a bestimmt die Zahl von Quantisierbits, um sie jedem Restsignal auf der Basis eines Skaliertaktors zuzuweisen, der in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d berechnet wird.
Der Betrieb der Sprachcodiervorrichtung, die den oben beschriebenen Aufbau hat, wird als nächstes erläutert.
Teilbandsignale, die in der Teil-Filterbank 100 geteilt werden, werden jeweils in die ADPCM-Quantisierer 130a bis 130d eingegeben. Die Addiereinrichtung 131 berechnet ein Restsignal zwischen dem Teilbandsignal, das in den entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben wird, und einem Prädiktionswert eines letzten Frames, der im Prädiktionsabschnitt 136 berechnet wird, und gibt das berechnete Restsignal in den Quantisierabschnitt 132 ein. Das Restsignal wird im Quantisierabschnitt 132 zu einem Codewort quantisiert, wobei die Zahl von Quantisierbits von der adaptiven Bitzuweisungseinrichtung 140a zugewiesen wird. Die Quantisierung des Restsignals verwendet den Skaliertaktor, der im Skalierfaktor-Adaptierabschnitt 134a berechnet wird. Das Codewort, das im Quantisierabschnitt 132 quantisiert wird, wird an den Multiplexer 150 und zudem an den Kern-Bit-Extrahierabschnitt 133 ausgegeben. Der Abschnitt 133 löscht die LSB, um Kern-Bits zu extrahieren. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 134a, um bei der Berechnung eines Skalierfaktors verwendet zu werden, und zudem in den Dequantisierabschnitt 135a eingegeben. Hier wird das Codewort, das im Quantisierabschnitt 132 quantisiert wird, skalierbar, um die Konsistenz des Skalierfaktors beizubehalten.
Der Dequantisierabschnitt 135 dequantisiert die Kern-Bits unter Verwendung des Skalierfaktors, der im Skalierfaktor-Adaptierabschnitt 134a berechnet wurde. Aus dem dequantisierten Wert, den man durch Dequantisieren der Kern-Bits erhält, berechnet der Prädiktionsabschnitt 136 einen Prädiktionswert eines nächsten Frames des Teilbandsignals.
Der Skalierfaktor wird in die adaptive Bitzuweisungseinrichtung 140a gemäß einer vorbestimmten Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 140a berücksichtigt als Energie einen Durchschnittswert des Skalierungsfaktors, der aus den ADPCM- Quantisierern 130a bis 130d ausgegeben wird, und bestimmt wie bei der ersten Ausführungsform die Zahl von Quantisierbits, die jedem Restsignal zugewiesen werden, das im entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert werden soll.
Die bestimmten Zahlen der Quantisierbits werden an die jeweiligen Quantisierabschnitte 132 in den ADPCM-Quantisierern 130a bis 130d ausgegeben. Wie es oben erwähnt wurde, quantisiert jeder Quantisierabschnitt 132 das Restsignal des nächstens Frames unter Verwendung des Skalierfaktors und gibt ein Codewort mit der Zahl der zugewiesenen Bits aus. Die Codewörter, die in den ADPCM-Quantisierern 130a bis 130d quantisiert werden, werden im Multiplexer 150 zu einem Bitstrom quantisiert, der ein multiplexiertes Signal ist.
Die Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung wird im folgenden beschrieben. Eine Konfiguration der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform ist dieselbe, wie jene der Sprachdecodiervorrichtung, die in 5 der ersten Ausführungsform dargestellt ist, weshalb auf deren Beschreibung verzichtet wird.
8 ist ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt. Wenngleich 8 eine Konfiguration des ADPCM-Dequantisierers 210a und der adaptiven Bitzuweisungseinrichtung 220a darstellt, haben die anderen ADPCM-Dequantisierer 210b bis 210d dieselbe Konfiguration, wie jene des Dequantisierers 210a, und sind mit der adaptiven Bitzuweisungseinrichtung 220a verbunden.
In 8 löscht der Kern-Bit-Extrahierabschnitt 211 das LSB aus dem Codewort, das in den entsprechenden der ADPCM-Quantisierer 210a bis 210d eingegeben wird, um Kern-Bits zu extrahieren. Der Dequantisierabschnitt 212a dequantisiert die extrahierten Kern-Bits und gibt einen dequantisierten Wert an die Addiereinrichtung 214 und den Prädiktionsabschnitt 215 aus. Der Skalierfaktor-Adaptierabschnitt 213a berechnet einen Skalierfaktor aus den extrahierten Kern-Bits, um ihn an die adaptive Bitzuweisungseinrichtung 220a auszugeben. Die Addiereinrichtung 214 berechnet die Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 215 berechnet wird. Der Prädiktionsabschnitt 215 führt eine Null-Prädiktion und eine Pol-Prädiktion unter Verwendung des dequantisierten Wertes und einer Ausgabe des Prädiktionsabschnittes 215 aus und berechnet einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals. Der Dequantisierabschnitt 216 dequantisiert das eingegebene Codewort für jede Zahl von Quantisierbits, die in der adaptiven Bitzuweisungseinrichtung 220a unter Verwendung des Skalierfaktors berechnet wurden, und gibt ein decodiertes Restsignal aus. Die Addiereinrichtung 217 berechnet die Summe aus dem decodierten Restsignal, das aus dem Dequantisierabschnitt 216 ausgegeben wird, und dem Prädiktionswert, um ein decodiertes Teilbandsignal zu erzeugen. Die adaptive Bitzuweisungseinrichtung 220a bestimmt die Zahl der Quantisierbits, die jedem der Restsignale zugewiesen werden sollen, auf der Basis eines Skalierungsfaktors, der im entsprechenden der ADPCM-Dequantisierer 210a bis 210d berechnet wird.
Der Betrieb der Sprachdecodiervorrichtung, die den oben beschriebenen Aufbau hat, wird im folgenden beschrieben.
Codewörter, die im Demultiplexer 200 geteilt werden, werden in die entsprechenden ADPCM-Dequantisierer 210a bis 210d eingegeben. Das Codewort, das in jeden der ADPCM-Dequantisierer 210a bis 210d eingegeben wird, wird im Dequantisierabschnitt 216 entsprechend der Zahl der Quantisierbits dequantisiert, die durch die adaptive Bitzuweisungseinrichtung 220a zugewiesen sind, und es wird ein decodiertes Restsignal ausgegeben. Aus dem Codewort, das in den entsprechenden der ADPCM-Dequantisierer 210a bis 210d eingegeben wird, werden die LSB gelöscht und werden Kern-Bits im Kern-Bit-Extrahierabschnitt 211 extrahiert. Die extrahierten Kern-Bits werden in den Skaliertaktor-Adaptierabschnitt 213a zur Verwendung bei der Berechnung eines Skalierfaktors und zudem in den Dequantisierabschnitt 212a eingegeben. Im Dequantisierabschnitt 212a werden die Kern-Bits mit Hilfe des Skalierfaktors dequantisiert, der im Skalierfaktor-Adaptierabschnitt 213a berechnet wurde. Der dequantisierte Wert, den man durch Dequantisieren der Kern-Bits erhält, wird in den Prädiktionsabschnitt 215 eingegeben. Der Prädiktionsabschnitt 215 berechnet einen Prädiktionswert eines nächsten Frames des decodierten Teilbandsignals unter Verwendung des eingegebenen dequantisierten Wertes.
Der Skalierfaktor wird in die adaptive Bituzweisungseinrichtung 220a je vorbestimmter Zahl of Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben. Die adaptive Bitzuweisungseinrichtung 220a berücksichtigt als Energie einen Durchschnittswert des Skalierungsfaktors, der aus den ADPCM-Dequantisierern 210a bis 210d ausgegeben wird, und berechnet wie bei der ersten Ausführungsform die Zahl von Quantisierbits, die jedem Restsignal zugewiesen werden, das im entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert wird.
Die berechneten Zahlen der Quantisierbits werden an den Dequantisierabschnitt 216 im entsprechenden der ADPCM-Dequantisierer 210a bis 210d ausgegeben, und wie es oben erläutert wurde, dequantisiert der Dequantisierabschnitt 216 ein Codewort eines nächstes Frames unter Verwendung des Skalierfaktors entsprechend der Zahl von Bits, die in der adaptiven Bitzuweisungseinrichtung 220a zugewiesen werden, und gibt ein decodiertes Restsignal aus. Das ausgegebene decodierte Restsignal wird in der Addiereinrichtung 217 zum Prädiktionswert addiert, der aus dem Prädiktionsabschnitt 215 ausgegeben wird, um zu einem decodierten Teilbandsignal zu werden, wobei das decodierte Teilbandsignal aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben wird. Die decodierten Teilbandsignale, die im entsprechenden der ADPCM-Dequantisierer 210a bis 210d dequantisiert werden, werden einer Synthese in der Synthesefilterbank 230 unterzogen, um zu einem decodierten Signal zu werden.
Somit wird gemäß der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung dieser Ausführungsform in der Sprachcodiervorrichtung ein Restsignal zwischen einem Teilbandsignal für jedes Frequenzband und einem Prädiktionswert quantisiert, um es zu einem Codewort auszugeben, wird ein Skalierfaktor aus den Kernbits des ausgegebenen Codewortes berechnet, und wird auf der Basis des berechneten Skalierfaktors die Zahl der Quantisierbits, die beim Quantisieren eines nächsten Frames jedes Restsignals zugewiesen werden, berechnet. In der Sprachdecodiervorrichtung wird der Skalierfaktor unter Verwendung desselben Codewortes berechnet, wie jenes, das in der Sprachcodiervorrichtung dequanti siert wird, und wird auf der Basis des berechneten Skalierfaktors die Zahl der Quantisierbits berechnet, die in der Sprachcodiervorrichtung bestimmt werden, um sie dem nächsten Frame jedes Restsignals zuzuweisen. Infolgedessen ist die Sprachcodiervorrichtung in der Lage, die Zahl der Quantisierbits adaptiv jedem Restsignal zuzuordnen, und selbst wenn die Sprachcodiervorrichtung die Zahl der zugewiesenen Quantisierbits ändert, ist die Sprachdecodiervorrichtung in der Lage, eine Dequantisierung synchron mit Änderungen der Bitzuweisung in der Sprachcodiervorrichtung auszuführen, ohne Informationen über die geänderte Bitzuweisung zu erhalten. Demzufolge ist es möglich, die Audioqualität zu verbessern, ohne die Sendeeffizienz der Sprachinformationen zu beeinträchtigen.
Wenngleich darüber hinaus jede der oben erwähnten Ausführungsformen den Fall beschreibt, bei dem ein Eingangssignal in vier Teilbandsignale in einer Teil-Filterbank geteilt wird, ist die vorliegende Erfindung nicht auf einen derartigen Fall beschränkt, wobei es lediglich erforderlich ist, ein Eingangssignal in mehr als zwei Signale entsprechend dem Frequenzband zu teilen. Darüber hinaus führt die Erhöhung der Zahl von Teilungen zu einer Glättung der zu quantisierenden Signale und verbessert die folgenden Eigenschaften des Skalierfaktors. Wenn zudem eine Teil-Filterbank ein Kosinusmodulationsfilter ist, vergrößert die Erhöhung der Anzahl von Teilungen die Zahl von Taps des Basisfilters und unterdrückt einen Anstieg des Verzögerungsumfangs.
Wie es oben erläutert wurde, ist es gemäß der vorliegenden Erfindung möglich, eine Sprachcodiervorrichtung, eine Sprachdecodiervorrichtung und ein Sprachcodier-/Decodierverfahren anzugeben, die eine verbesserte Audioqualität ermöglichen.
Die vorliegende Erfindung ist nicht auf die oben beschriebenen Ausführungsformen beschränkt, wobei unterschiedliche Abweichungen und Abänderungen möglich sind, ohne vom Geltungsbereich der vorliegenden Erfindung abzuweichen, wie er in den beigefügten Ansprüchen definiert ist.
Diese Anmeldung basiert auf der japanischen Patentanmeldung No. 2001-347408, die am 13. November 2001 eingereicht wurde.

Claims

Sprachcodiervorrichtung, die zum Durchführen von Codierung von Sprachsignalen ausgeführt ist, die mit einem Teilband-ADPCM-Schema codiert sind, wobei sie umfasst: einen Quantisierabschnitt (132), der so konfiguriert ist, dass er ein Restsignal eines bestimmten Teilbandsignals gemäß einer Zahl zugewiesener Bits quantisiert, um ein Codewort zu erzeugen; und einen Bestimmungsabschnitt, der zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits konfiguriert ist, die in dem Quantisierabschnitt (132) verwendet werden, gekennzeichnet durch einen Extrahierabschnitt (133), der zum Extrahieren von Kern-Bits aus dem erzeugten Codewort konfiguriert ist; und dadurch, dass der Bestimmungsabschnitt des Weiteren zum Bestimmen des optimalen Wertes der Zahl zugewiesener Bits, die beim Quantisieren einem nächsten Rahmen des Restsignals zugewiesen werden, auf Basis einer Energie konfiguriert ist, die den extrahierten Kern-Bits entspricht.
Sprachcodiervorrichtung nach Anspruch 1, wobei der Bestimmungsabschnitt einen Dequantisierabschnitt (135) umfasst, der zum Dequantisieren der extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis einer Energie des von dem Dequantisierabschnitt (135) ausgegebenen dequantisierten Signals konfiguriert ist.
Sprachcodiervorrichtung nach Anspruch 2, wobei der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem Dequantisierabschnitt (135) ausgegebenen dequantisierten Signals auf Basis der Energie des dequantisierten Signals konfiguriert ist.
Sprachcodiervorrichtung nach Anspruch 1, wobei der Bestimmungsabschnitt einen Skaliertaktor-Erfassungsabschnitt (134) umfasst, der zum Erfassen eines Skaliertaktors aus den extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis des erfassten Skaliertaktors konfiguriert ist, der als die Energie betrachtet wird, die den extrahierten Kern-Bits entspricht.
Sprachcodiervorrichtung nach Anspruch 4, wobei der Bestimmungsabschnitt des Weiteren einen Dequantisierabschnitt (135) umfasst, der zum Dequantisieren der extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem Dequantisierabschnitt (135) ausgegebenen dequantisierten Signals konfiguriert ist.
Sprachcodiervorrichtung nach Anspruch 1, wobei der Quantisierabschnitt (132) des Weiteren zum Erzeugen skalierbarer Codewörter konfiguriert ist.
Sprachcodiervorrichtung nach Anspruch 1, die des Weiteren umfasst: einen Teil-Abschnitt (100), der zum Teilen eines Eingangssignals in eine Vielzahl von Signalen mit unterschiedlichen Frequenzbändern zum Erzeugen des Teilbandsignals konfiguriert ist, wobei der Teil-Abschnitt (100) eine Kosinusmodulations-Filterbank aufweist und die Kosinusmodulations-Filterbank ein Basisfilter aufweist, durch das ihr Impulsantwortverhalten asymmetrisch ist.
Sprachdecodiervorrichtung, die zum Durchführen von Decodieren von Sprachsignalen konfiguriert ist, die mit einem Teilband-ADPCM-Schema codiert sind, wobei sie umfasst: einen ersten Dequantisierabschnitt (216), der so konfiguriert ist, dass er ein bestimmtes Codewort gemäß einer Zahl zugewiesener Bits dequantisiert, um ein decodiertes Restsignal eines Teilbandsignals zu erzeugen; einen Bestimmungsabschnitt, der zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits konfiguriert ist, die in dem ersten Dequantisierabschnitt (216) verwendet werden, gekennzeichnet durch einen Extrahierabschnitt (211), der zum Extrahieren von Kern-Bits aus dem bestimmten Codewort konfiguriert ist; und dadurch, dass der Bestimmungsabschnitt des Weiteren zum Bestimmen des optimalen Wertes der Zahl zugewiesener Bits, die einem nächsten Rahmen des decodierten Restsignals zugewiesen werden, auf Basis einer Energie konfiguriert ist, die den extrahierten Kern-Bits entspricht.
Sprachdecodiervorrichtung nach Anspruch 8, wobei der Bestimmungsabschnitt einen zweiten Dequantisierabschnitt (212) umfasst, der zum Dequantisieren der extrahierten Kern-Bits bestimmt ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis einer Energie des von dem zweiten Dequantisierabschnitt (212) ausgegebenen dequantisierten Signals konfiguriert ist.
Sprachdecodiervorrichtung nach Anspruch 9, wobei der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem zweiten Dequantisierabschnitt (212) ausgegebenen dequantisierten Signals konfiguriert ist.
Sprachdecodiervorrichtung nach Anspruch 8, wobei der Bestimmungsabschnitt einen Skalierfaktor-Erfassungsabschnitt (213) umfasst, der zum Erfassen eines Skaliertaktors aus den extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits auf Basis des erfassten Skaliertaktors konfiguriert ist, der als die Energie betrachtet wird, die den extrahierten Kern-Bits entspricht.
Sprachdecodiervorrichtung nach Anspruch 11, wobei der Bestimmungsabschnitt des Weiteren einen zweiten Dequantisierabschnitt (212) umfasst, der zum Dequantisieren der extrahierten Kern-Bits konfiguriert ist; und der Bestimmungsabschnitt des Weiteren zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits für jede Pitch-Periode des von dem zweiten Dequantisierabschnitt (212) ausgegebenen dequantisierten Signals konfiguriert ist.
Sprachdecodiervorrichtung nach Anspruch 8, die des Weiteren umfasst: einen Syntheseabschnitt (230), der zum Durchführen von Synthese von in den Erzeugungsabschnitten (210a, 210b, 210c, 210d) erzeugten decodierten Teilbandsignalen konfiguriert ist, wobei der Syntheseabschnitt (230) eine Kosinusmodulations-Filterbank aufweist und die Kosinusmodulations-Filterbank ein Basisfilter aufweist, durch das ihr Impulsantwortverhalten asymmetrisch ist.
Digitales Drahtlos-Mikrofonsendesystem, das die Sprachcodiervorrichtung nach Anspruch 1 aufweist.
Digitales Drahtlos-Mikrofonempfangssystem, das die Sprachdecodiervorrichtung nach Anspruch 8 aufweist.
Sprachcodierverfahren zum Durchführen von Codierung von Sprachsignalen, die mit einem Teilband-ADPCM-Schema codiert sind, wobei es umfasst: einen Quantisierschritt des Quantisierens eines Restsignals eines bestimmten Teilbandsignals gemäß einer Zahl zugeordneter Bits zum Erzeugen eines Codeworts; einen Erfassungsschritt des Erfassens eines optimalen Wertes der Zahl zugewiesener Bits; und einen Quantisierschritt des Quantisierens eines Restsignals eines nächsten Rahmens eines bestimmten Teilbandsignals gemäß dem erfassten optimalen Wert der Zahl zugewiesener Bits zum Erzeugen eines Codeworts des nächsten Rahmens, gekennzeichnet durch einen Extrahierschritt des Extrahierens von Kern-Bits aus dem erzeugten Codewort; und dadurch, dass der Erfassungsschritt den optimalen Wert der Zahl zugewiesener Bits, die beim Quantisieren dem nächsten Rahmen des Restsignals zugewiesen werden, auf Basis einer Energie erfasst, die den extrahierten Kern-Bits entspricht.
Sprachdecodierverfahren zum Durchführen von Decodierung von Sprachsignalen, die mit einem Teilband-ADPCM-Schema codiert sind, wobei es umfasst: einen Dequantisierschritt des Dequantisierens eines bestimmten Codeworts gemäß einer Zahl zugewiesener Bits zum Erzeugen eines decodierten Restsignals eines Teilbandsignals; einen Erfassungsschritt des Erfassens eines optimalen Wertes der Zahl zugewiesener Bits; und einen Dequantisierschritt des Dequantisierens eines Codeworts eines nächsten Rahmens gemäß dem erfassten optimalen Wert der Zahl zugewiesener Bits zum Erzeugen eines decodierten Restsignals des nächsten Rahmens eines Teilbandsignals, gekennzeichnet durch einen Extrahierschritt des Extrahierens von Kern-Bits aus dem bestimmten Codewort; und dadurch, dass der Erfassungsschritt den optimalen Wert der Zahl zugewiesener Bits, die dem nächsten Rahmen des decodierten Restsignals zugewiesen werden, auf Basis einer Energie erfasst, die den extrahierten Kern-Bits entspricht.
Sprachdecodierverfahren nach Anspruch 17, wobei in dem Erfassungsschritt das gleiche Codewort dequantisiert wird, das während des Codierens zum Bestimmen eines optimalen Wertes der Zahl zugewiesener Bits verwendet worden ist, und auf Basis einer Energie eines ausgegebenen dequantisierten Signals ein optimaler Wert der Zahl zugewiesener Bits erfasst wird.
Sprachdecodierverfahren nach Anspruch 17, wobei in dem Erfassungsschritt die gleichen Kern-Bits wie die eines Codeworts extrahiert werden, das beim Codieren verwendet worden ist, ein Skalierfaktor aus den extrahierten Kern-Bits berechnet wird und auf Basis des berechneten Skaliertaktors ein optimaler Wert der Zahl zugewiesener Bits bestimmt wird.