-
HINTERGRUND
DER ERFINDUNG
-
1. Gebiet
der Erfindung
-
Die
vorliegende Erfindung bezieht sich auf eine Sprachcodiervorrichtung,
eine Sprachdecodiervorrichtung und ein Sprachcodier-/Decodierverfahren
bei einer Teilband-ADPCM (Adaptive Differentialimpuls-Codiermodulation).
-
2. Beschreibung des Standes
der Technik
-
Normalerweise
sind als Sprachcodiervorrichtung und Sprachdecodiervorrichtung,
die bei der Teilband-ADPCM verwendet werden, Vorrichtungen bekannt,
die die Vorgabe G.722 der ITU-T (International Telecommunication
Union, Telcommunication sector) erfüllen.
-
1 ist
ein Blockschaltbild, das Konfigurationen einer Sprachcodiervorrichtung 300 und
einer Sprachdecodiervorrichtung 400 darstellt, die bei
einer Zwei-Teilband-ADPCM
verwendet werden, die in der Vorgabe G.722 beschrieben ist.
-
Die
Sprachcodiervorrichtung 300 besteht aus einer 24-Tap-Teil-Filterbank 310,
die ein Frequenzband eines Eingangssignals in zwei Teilbänder aufteilt
und Teilbandsignale ausgibt, ADPCM-Quantisierern 320a und 320b,
die entsprechende Zwei-Teilungs-Teilbandsignale quantisieren, und
einem Multiplexer 330, der Codewörter multiplexiert, die in
den ADPCM-Quantisierern 320a und 320b quantisiert werden,
um einen Bitstrom zu erzeugen.
-
Daneben
besteht die Sprachdecodiervorrichtung 400 aus einem Demultiplexer 410,
der Codewörter
für jedes
Teilband ausgibt, das man aus den gesendeten Datenströmen erhält, ADPCM-Dequantisierern 420a und 420b,
die entsprechende Codewörter
für jedes
Teilband dequantisieren, das aus dem Demultiplexer 410 ausgegeben
wird, um Teilbandsignale auszugeben, und einer 24-Tap-Synthesefilterbank 430,
die eine Synthesefilterung an den Teilbandsignalen ausführt.
-
Vorgänge der
Sprachcodiervorrichtung 300 und der Sprachdecodiervorrichtung 400,
die jeweils in der oben beschriebenen Art und Weise aufgebaut sind,
werden im folgenden beschrieben.
-
Ein
Frequenzband eines Eingangssignals wird in zwei Teilbänder in
der Teil-Filterbank 310 geteilt,
wobei zwei Teilbandsignale erzeugt werden. Jedem der Teilbandsignale
wird eine vorbestimmte Zahl von Quantisierbits zugeordnet, wobei
die Teilbandsignale in jeweils einem der ADPCM-Quantisierer 320a und 320b quantisiert
werden. Die Codewörter, die
man durch die Quantisierung erhält,
werden im Multiplexer 330 in die Bitströme multiplexiert.
-
Daneben
werden in der Sprachdecodiervorrichtung 400 die Bitströme mit einer
Vielzahl multiplexierter Codewörter
im Demultiplexer 410 zu Codewörtern für jedes Teilband demultiplexiert.
Die Codewörter
für jedes
Teilband, die man beim Demultiplexieren erhält, werden in den ADPCM-Dequantisierern 420a und 420b dequantisiert,
um zu Teilbandsignalen zu werden. Die Teilbandsignale werden einer Synthese
in der Synthesefilterbank 430 unterzogen, um zu einem decodierten
Signal zu werden.
-
Da
jedoch bei der herkömmlichen
Sprachcodiervorrichtung und der Sprachdecodiervorrichtung, die oben
beschrieben wurden, die Zahl der Quantisierbits, die jedem Teilbandsignal
in einem ADPCM-Quantisierer in der Sprachcodiervorrichtung zugewiesen
ist, insbesondere dann fixiert ist, wenn sich eine Abtastfrequenz
eines Eingangssignals erhöht,
besteht das Risiko, dass die Bitzuweisung nicht optimal ist und
dass die Audioqualität
der decodierten Signale in der Sprachdecodiervorrichtung beeinträchtigt wird.
-
Das
US-Patent 5.974.380 beschreibt eine Sprachcodier-/Decodiervorrichtung
und ein zugehöriges
Verfahren gemäß dem Oberbegriff
der Ansprüche
1, 8 und 16. Es kommen Perfekt-/Nicht-Perfekt-Wiederherstellungsfilter,
die prädiktive/nichtprädiktive
Teilbandcodierung, die Transientenanalyse sowie die psychoakustische/minimale
mittlere quadratische Fehlbitzuordnung über die Zeit, die Frequenz
und die mehrfachen Audiokanäle
zur Anwendung, um einen Datenstrom zu codieren/decodieren, um wiederhergestelltes
Audio hoher Wiedergabetreue zu erzeugen. Die Bitzuordnung für den ADPCM-Quantisierer
ist für
jeden Teilframe je Teilband-Audiokanal auf der Basis des Teilbandsignals festgelegt,
das in den Teilbandcodierer eingegeben wird. Es werden Bitzuordnungsindizes
zum Decoder entweder unter Verwendung eines ganzzahligen Codes oder
einer Entropietabelle gesendet.
-
ÜBERSICHT ÜBER DIE
ERFINDUNG
-
Ein
Ziel der vorliegenden Erfindung besteht darin, die Audioqualität codierter
Sprache zu verbessern, ohne die Sendefrequenz zu beeinträchtigen.
-
Dieses
Ziel wird durch eine Sprachcodiervorrichtung nach Anspruch 1, eine
Sprachdecodiervorrichtung nach Anspruch 8, ein digitales Drahtlosmikrofon-Sendesystem nach
Anspruch 14, ein digitales Drahtlosmikrofon-Empfangssystem gemäß Anspruch 15, ein Sprachcodierverfahren
gemäß Anspruch
16 und ein Sprachdecodierverfahren gemäß Anspruch 17 erreicht. Bevorzugte
Ausführungsformen
sind Gegenstand der abhängigen
Ansprüche.
-
KURZE BESCHREIBUNG DER
ZEICHNUNGEN
-
Die
obigen und andere Ziele sowie Merkmale der Erfindung werden aus
der folgenden Beschreibung in Verbindung mit den beiliegenden Zeichnungen
besser verständlich,
in denen ein Beispiel exemplarisch dargestellt ist.
-
1 ist
ein Blockschaltbild, das Konfigurationen einer herkömmlichen
Sprachcodiervorrichtung und einer Sprachdecodiervorrichtung darstellt,
die bei einer Zwei-Teilband-ADPCM verwendet werden;
-
2 ist
ein Blockschaltbild, das eine Konfiguration einer Sprachcodiervorrichtung
gemäß einer ersten
und einer zweiten Ausführungsform
der vorliegenden Erfindung darstellt;
-
3 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung darstellt;
-
4 ist
eine Ansicht, die ein Beispiel einer Quantisierbitzahl-Zuordnung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung darstellt;
-
5 ist
ein Blockschaltbild, das eine Konfiguration einer Sprachdecodiervorrichtung
gemäß der ersten
und der zweiten Ausführungsform
der vorliegenden Erfindung zeigt;
-
6 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung zeigt;
-
7 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung
gemäß der zweiten
Ausführungsform
der vorliegenden Erfindung zeigt; und
-
8 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung
gemäß der zweiten
Ausführungsform
der vorliegenden Erfindung darstellt.
-
DETAILLIERTE
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
-
Ausführungsformen
der vorliegenden Erfindung werden im folgenden mit spezieller Bezugnahme
auf die beiliegenden Zeichnungen erläutert.
-
(Erste Ausführungsform)
-
2 ist
ein Blockschaltbild, das eine Konfiguration einer Sprachcodiervorrichtung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung zeigt. In 2 teilt
eine Teil-Filterbank 100 ein Frequenzband eines Eingangssignals
in vier Teilbänder mit
derselben Bandbreite und führt
einen Ausdünnungsvorgang
unter Verwendung von "4" als Ausdünnungszahl
durch, die die Anzahl von Teilungen ist. Band-Teil-FIR-Filter 110a und 110d in
der Teil-Filterbank 100 führen eine Teil-Filterung an einem
Eingangssignal für
vorbestimmte Frequenzbänder durch.
Die Teil-Filterbank 100 ist eine Kosinusmodulations-Filterbank,
wobei die Impulsantwortverhalten der Band-Teil-FIR-Filter 110a bis 110d,
die Basisfilter sind, asymmetrisch sind.
-
Weiterhin
führen
Downsample-Einrichtungen 120a bis 120d in der
Teil-Filterbank 100 die Ausdünnungsverarbeitung an den entsprechenden
Ausgaben der Band-Teil-FIR-Filter 110a bis 110d zur
Codiereffizienz unter Verwendung von "4" als
Ausdünnungszahl
aus, die gleich der Zahl von Teilungen in der Teil-Filterbank 100 ist,
und geben entsprechende Teilband-Signale aus.
-
Jeder
der ADPCM-Quantisierer 130a bis 130d quantisiert
ein Restsignal zwischen dem entsprechenden Teilbandsignal und einem
Prädiktionswert,
der aus dem letzten Frame des Teilbandsignals berechnet wird, um
ein skalierbares Codewort auszugeben. Weiterhin berechnen die ADPCM-Quantisierer 130a bis 130d einen
dequantisierten Wert und Skalierfaktor aus dem Restsignal.
-
Eine
adaptive Bitzuweisungseinrichtung 140 bestimmt die Zahl
von Quantisierbits, die jedem der Restsignale zugewiesen werden
soll, auf der Basis eines Energiewertes des dequantisierten Wertes,
der in einem entsprechenden der ADPCM-Quantisierer 130a und 130d berechnet
wird.
-
Der
Multiplexer 150 multiplexiert Codewörter, die aus den ADPCM-Quantisierern 130a bis 130d ausgegeben
werden, um einen Bitstrom zu erzeugen, der ein multiplexiertes Signal
ist.
-
3 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung zeigt. Wenngleich 3 einen
Aufbau eines ADPCM-Quantisierers 130a und einer adaptiven
Bitzuordnungseinrichtung 140 zeigt, haben die anderen ADPCM-Quantisierer 130b bis 130d denselben
Aufbau, wie jener des Quantisierers 130a, und sind mit der
adaptiven Bitzuweisungseinrichtung 140 verbunden.
-
In 3 berechnet
eine Addiervorrichtung 131 eine Differenz zwischen dem
Teilbandsignal, das in einen entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben
wird, und einem Prädiktionswert,
um ein Restsignal zu erzeugen. Der Quantisierabschnitt 132 quantisiert
das erzeugte Restsignal mit Hilfe des Skalierfaktors und gibt ein
Codewort mit der Zahl der Quantisierbits aus, die in der adaptiven
Bitzuordnungseinrichtung 140 bestimmt werden. Ein Kern-Bit-Extrahierabschnitt 133 löscht die
geringstwertigen Bits (im folgenden "LSB" genannt)
aus dem Codewort, das aus dem Quantisierabschnitt 132 ausgegeben
wird, um Kern-Bits zu extrahieren. Der Skalierfaktor-Adaptierabschnitt 134 berechnet
einen Skalierfaktor aus den extrahierten Kern-Bits. Der Dequantisierabschnitt 135 dequantisiert
die extrahierten Kern-Bits und gibt einen dequantisierten Wert an
den Prädiktionsabschnitt 136,
die Addiereinrichtung 137 und die adaptive Bitzuordnungseinrichtung 140 aus. Der
Prädiktionsabschnitt 136 führt eine
Null-Prädiktion
und Pol-Prädiktion
unter Verwendung des dequantisierten Wertes und eines Ausgangs aus
dem Prädiktionsabschnitt 136 aus
und berechnet einen Prädiktionswert
eines nächsten
Frames des Teilbandsignals. Die Addiereinrichtung 137 berechnet die
Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 136 berechnet
wird.
-
Der
Betrieb der Sprachcodiervorrichtung, die den oben beschriebenen
Aufbau hat, wird im folgenden beschrieben.
-
Ein
Sprachsignal, das in die Sprachcodiervorrichtung eingegeben wird,
wird in vier Teilbandsignale in der Teil-Filterdatenbank 100 geteilt.
Da die Teil-Filterdatenbank 100 eine Kosinusmodulations-Filterbank
ist und die Impulsantwortverhalten der Band-Teil-FIR-Filter 110a bis 110d,
die Basisfilter sind, asymmetrisch sind, wird eine Gruppenverzögerung,
die beim Filtern auftritt, verringert, wodurch es möglich ist,
den Berechnungsaufwand zu verringern. Die geteilten Teilbandsignale
werden jeweils in die ADPCM-Quantisierer 130a bis 130d eingegeben.
-
Die
Addiereinrichtung 131 berechnet ein Restsignal zwischen
dem Teilbandsignal, das in einen entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben
wird, und einem Prädiktionswert,
der aus dem letzten Frame im Prädiktionsabschnitt 136 berechnet
wird, und gibt das berechnete Restsignal in den Quantisierabschnitt 132 ein.
Das Restsignal wird im Quantisierabschnitt 132 zu einem Codewort
mit der Zahl der Quantisierbits quantisiert, die durch die adaptive
Bitzuweisungseinrichtung 140 zugewiesen werden. Bei der
Quantisierung des Restsignals kommt der Skalierfaktor zur Anwendung,
der im Skalierfaktor-Adaptierabschnitt 134 berechnet wird.
Das Codewort, das im Quantisierabschnitt 132 quantisiert
wird, wird an den Multiplexer 150 und zudem an den Kern-Bit-Extrahierabschnitt 133 ausgegeben.
Der Abschnitt 133 löscht
das LSB, um Kern-Bits
zu extrahieren. Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 134, um
bei der Berechnung eines Skalierfaktors verwendet zu werden, und
zudem in den Dequantisierabschnitt 135 eingegeben. Hier
wird das Codewort, das im Quantisierabschnitt 132 quantisiert
wird, skalierbar, um die Konsistenz des Skalierfaktors beizubehalten.
-
Der
Dequantisierabschnitt 135 dequantisiert die Kern-Bits unter
Verwendung des Skaliertaktors, der im Skalierfaktor-Adaptierabschnitt 134 berechnet wurde.
Der dequantisierte Wert, den man durch Dequantisieren der Kern-Bits
erhält,
wird in den Prädiktionsabschnitt 136 eingegeben.
Dieser eingegebene Wert wird Null-Prädiktions-Eingabewert
genannt. Der dequantisierte Wert wird in der Addiereinrichtung 137 einem
Prädiktionswert
eines letzten Frames hinzugefügt,
der aus dem Prädiktionsabschnitt 136 ausgegeben
wird, und wieder in den Prädiktionsabschnitt 136 eingegeben.
Dieser Eingabewert wird Pol-Prädiktions-Eingabewert genannt.
Unter Verwendung des Null-Prädiktions-Eingabewertes und
des Pol-Prädiktions-Eingabewertes
berechnet der Prädiktionsabschnitt 136 einen
Prädiktionswert
eines nächsten Frames
des Teilbandsignals.
-
Der
dequantisierte Wert wird in die adaptive Bitzuweisungseinrichtung 140 gemäß einer
vorbestimmten Zahl von Frames, wie etwa auf Basis einer Pitch-Periode,
eingegeben. Die adaptive Bitzuweisungseinrichtung 140 berechnet
eine Energie des dequantisierten Wertes, d.h. eine Quadratsumme des
dequantisierten Wertes als Muster, der aus jedem der ADPCM-Quantisierer 130a bis 130d ausgegeben
wird, und bestimmt auf der Basis der berechneten Energie des dequantisierten
Wertes die Zahl von Bits, die jedem Restsignal zugewiesen werden, das
in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert
werden soll.
-
Die
bestimmten Zahlen der Quantisierbits werden an die jeweiligen Quantisierabschnitte 132 in den
ADPCM-Quantisierern 130a bis 130d ausgegeben.
Wie es oben erwähnt
wurde, quantisiert jeder Quantisierabschnitt 132 das Restsignal
des nächstens
Frames unter Verwendung des Skalierfaktors und gibt ein Codewort
mit der Zahl der zugewiesenen Bits aus. Die Codewörter, die
in den ADPCM-Quantisierern 130a bis 130d quantisiert
werden, werden im Multiplexer 150 zu einem Bitstrom quantisiert,
der ein multiplexiertes Signal ist.
-
4 zeigt
ein Beispiel einer Quantisierbitzahl-Zuweisung. In 4 kennzeichnen
Bits, die mit einer schrägen
Linie dargestellt sind, Kern-Bits in jedem Band. Die Zahl der Kern-Bits
ist fünf
im ersten Band, vier im zweiten Band, drei im dritten Band und zwei
im vierten Band. Der Kern-Bits sind in jedem Band immer konstant,
wobei Bits, die adaptiv durch die adaptive Bitzuweisungseinrichtung 140 zugewiesen
werden, zwei Bits sind, die mit Weiß in 4 dargestellt
sind. Die beiden Bits werden adaptiv jedem Band entsprechend der
Energie des dequantisierten Wertes zugewiesen.
-
Eine
Sprachdecodiervorrichtung gemäß der ersten
Ausführungsform
wird im folgenden beschrieben.
-
5 ist
ein Blockschaltbild, das eine Konfiguration der Sprachdecodiervorrichtung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung zeigt. In 5 zerlegt
der Demultiplexer einen Eingangsbitstrom für jede Anzahl von Bits, die
durch die adaptive Bitzuweisungseinrichtung 220, die später beschrieben
wird, zugewiesen werden, und teilt somit den Bitstrom in Codewörter für jedes
Teilband auf. Jeder der ADPCM-Quantisierer 210a bis 201d gibt eine
Summe aus einem decodierten Restsignal, das man durch Dequantisieren
eines entsprechenden Codewortes erhält, und einem Prädiktionswert,
der aus einem Codewort eines letzten Frames berechnet wird, als
decodiertes Teilbandsignal aus. Weiterhin berechnet jeder der ADPCM-Dequantisierer 210a bis 210d einen
dequantisierten Wert lediglich aus Kern-Bits, die man durch Löschen der
LSB aus dem Codewort erhält,
und den Skalierfaktor. Auf der Basis der Energie des dequantisierten
Wertes der Kern-Bits, der in jedem der ADPCM-Quantisierer 210a bis 210d berechnet
wird, berechnet die adaptive Bitzuweisungseinrichtung 220 die
Zahl von Quantisierbits, die dem jeweiligen Restsignal in der Sprachcodiervorrichtung
zugewiesen werden.
-
Die
Synthesefilterbank 230 kombiniert decodierte Teilbandsignale,
die aus den ADPCM-Quantisierern 210a bis 210d ausgegeben
werden, um ein decodiertes Signal zu erhalten. Upsample-Einrichtungen 240a bis 240d in
der Synthesefilterbank 230 führen eine Interpolation der
jeweiligen ausgedünnten
decodierten Teilbandsignale aus. Bandsynthese-FIR-Filter 250a bis 250d in
der Synthesefilter-Bank 230 führen die
Synthesefilterung an entsprechenden interpolierten decodierten Teilbandsignalen
aus. Die Synthesefilterbank 230 ist eine Kosinusmodulations-Filterbank,
wobei die Impulsantwortverhalten der Bandsynthese-FIR-Filter 250a bis 250d,
die Basisfilter sind, asymmetrisch sind.
-
6 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung
gemäß der ersten
Ausführungsform
der vorliegenden Erfindung darstellt. Wengleich 6 eine
Konfiguration eines ADPCM-Dequantisierers 210a und einer adaptiven
Bitzuweisungseinrichtung 220 darstellt, haben die anderen
ADPCM-Dequantisierer 210b bis 210d dieselbe Konfiguration
wie jene des Dequantisierers 210a und sind mit der adaptiven
Bitzuweisungseinrichtung 220 verbunden.
-
In 6 löscht der
Kern-Bit-Extrahierabschnitt 211 die LSB aus dem Codewort,
das in den entsprechenden der ADPCM-Quantisierer 210a bis 210d eingegeben
wird, um Kern-Bits zu extrahieren. Der Dequantisierabschnitt 212 dequantisiert
die extrahierten Kern-Bits und gibt einen dequantisierten Wert an
die Addiereinrichtung 214, den Prädiktionsabschnitt 215 und
die adaptive Bitzuweisungseinrichtung 220 aus. Der Skalierfaktor-Adaptierabschnitt 213 berechnet
einen Skalierfaktor aus den extrahierten Kern-Bits. Die Addiereinrichtung 214 berechnet die
Summe des dequantisierten Wertes und des Prädiktionswertes, der im Prädiktionsabschnitt 215 berechnet
wird. Der Prädiktionsabschnitt 215 führt eine Null-Prädiktion
und eine Pol-Prädiktion
unter Verwendung des dequantisierten Wertes und einer Ausgabe des
Prädiktionsabschnittes 215 aus
und berechnet einen Prädiktionswert
eines nächsten
Frames des decodierten Teilbandsignals. Der Dequantisierabschnitt 216 dequantisiert
das eingegebene Codewort für
jede Zahl von Quantisierbits, die in der adaptiven Bitzuweisungseinrichtung 220 unter
Verwendung des Skalierfaktors berechnet wurden, und gibt ein decodiertes
Restsignal aus. Die Addiereinrichtung 217 berechnet die
Summe aus dem decodierten Restsignal, das aus dem Dequantisierabschnitt 216 ausgegeben
wird, und dem Prädiktionswert,
um ein decodiertes Teilbandsignal zu erzeugen.
-
Der
Betrieb der Sprachdecodiervorrichtung, die den oben beschriebenen
Aufbau hat, wird als nächstes
beschrieben.
-
Ein
Bitstrom, der in die Sprachdecodiervorrichtung eingegeben wird,
wird pro Anzahl von Quantisierbits, die durch die Bitzuweisungseinrichtung 220 zugewiesen
werden, zerlegt und somit werden alle vier Teilbänder in Codewörter zerlegt.
Die zerlegten Codewörter
werden in die jeweiligen ADPCM-Dequantisierer 210a bis 210d eingegeben.
-
Das
Codewort, das in jeden der ADPCM-Dequantisierer 210a bis 210d eingegeben
wird, wird im Dequantisierabschnitt 216 entsprechend der
Zahl der Quantisierbits dequantisiert, die von der adaptiven Bitzuweisungseinrichtung 220 zugewiesen
werden, und als decodiertes Restsignal ausgegeben. Aus dem Codewort,
das in den entsprechenden der ADPCM-Dequantisierer 210a bis 210d eingege ben
wird, werden die LSB gelöscht
und werden Kern-Bits im Kern-Bit-Extrahierabschnitt 211 extrahiert.
Die extrahierten Kern-Bits werden in den Skalierfaktor-Adaptierabschnitt 213,
um bei der Berechnung eines Skalierfaktors verwendet zu werden,
und zudem in den Dequantisierabschnitt 212 eingegeben.
Im Dequantisierabschnitt 212 werden die Kernbits unter
Verwendung des Skalierfaktors dequantisiert, der im Skalierfaktor-Adaptierabschnitt 213 berechnet
wird. Der dequantisierte Wert, den man durch Dequantisierung der
Kern-Bits erhält,
wird in den Prädiktionsabschnitt 215 eingegeben.
Dieser eingegebene Wert wird Null-Prädiktionseingabewert genannt.
Der dequantisierte Wert wird in der Addiereinrichtung 214 zu
einem Prädiktionswert
eines letzten Frames addiert, der aus dem Prädiktionsabschnitt 215 ausgegeben wird,
und erneut in den Prädiktionsabschnitt 215 eingegeben.
Dieser eingegebene Wert wird Pol-Prädiktionseingabewert
genannt. Unter Verwendung des Null-Prädiktionseingabewertes
und des Pol-Prädiktionseingabewertes
berechnet der Prädiktionsabschnitt 215 einen
Prädiktionswert
eines nächsten Frames
des decodierten Teilbandsignals.
-
Der
dequantisierte Wert wird in die adaptive Bitzuweisungseinrichtung 220 je
vorbestimmte Zahl von Frames, wie etwa auf Basis einer Pitch-Periode, eingegeben.
Die adaptive Bitzuweisungseinrichtung 220 berechnet eine
Energie des dequantisierten Wertes, d.h. die Quadratsumme des dequantisierten Wertes
als Muster, der aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben
wird, und berechnet auf der Basis der berechneten Energie des dequantisierten
Wertes die Zahl der Quantisierbits, die jedem Restsignal zugewiesen
werden, das in einem entsprechenden der ADPCM-Quantisierer 130a bis 130d in
der Sprachcodiervorrichtung quantisiert wird.
-
Die
berechneten Anzahlen der Quantisierbits werden an den Dequantisierabschnitt 216 im
entsprechenden der ADPCM-Dequantisierer 210a bis 210d ausgegeben,
wobei, wie es oben beschrieben ist, der Dequantisierabschnitt 216 ein
Codewort eines nächsten
Frames unter Verwendung des Skalierungsfaktors entsprechend des
Zahl von Bits dequantisiert, die in der adaptiven Bitzuweisungseinrichtung 220 zugewiesen
werden, und ein decodiertes Restsignal ausgibt. Das ausgegebene
decodierte Restsignal wird in der Addiereinrichtung 217 dem Prädiktionswert
hinzugefügt,
der aus dem Prädiktionsabschnitt 215 ausgegeben
wird, um zu einem decodierten Teilbandsignal zu werden, wobei das
decodierte Teilbandsignal aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben
wird.
-
Die
decodierten Teilbandsignale, die in den ADPCM-Dequantisieren 210a bis 210d dequantisiert werden,
werden einer Interpolation in den Upsample-Einrichtungen 240a bis 240d in
der Synthesefilter-Datenbank 230 und einer Synthesefilterung
in den Bandsynthese-FIR-Filtern 250a bis 250d unterzogen.
Die jeweiligen Ausgaben aus den Bandsynthese-FIR-Filtern 250a bis 250d werden
in den Addiereinrichtungen 260a bis 260c zu einem
decodierten Signal addiert. Da hier die Synthesefilterbank 230 eine
Kosinusmodulations-Filterbank ist und die Impulsantwortverhalten
der Bandsynthese-FIR-Filter 250a bis 250b, die
Basisfilter sind, asymmetrisch sind, wird eine Gruppenverzögerung,
die beim Filtern auftritt, verringert, wodurch es möglich ist,
den Berechnungsaufwand zu verringern.
-
Somit
wird gemäß der Sprachcodiervorrichtung
und der Sprachdecodiervorrichtung dieser Ausführungsform in der Sprachcodiervorrichtung
ein Restsignal zwischen einem Teilbandsignal für jedes Frequenzband und einem
Prädiktionswert
quantisiert, um es zu einem Codewort auszugeben, wird das ausgegebene
Codewort dequantisiert, um eine Energie des dequantisierten Wertes
zu berechnen, und wird die Zahl der Quantisierbits, die beim Quantisieren
eines nächsten
Frames jedes Restsignals zugewiesen werden, auf der Basis der berechneten Energie
bestimmt. In der Sprachdecodiervorrichtung wird dasselbe Codewort,
wie jenes, das in der Sprachcodiervorrichtung dequantisiert wird,
dequantisiert, um die Energie des dequantisierten Wertes zu berechnen,
und wird auf der Basis der berechneten Energie die Zahl der Quantisierbits
berechnet, die in der Sprachcodiervorrichtung bestimmt werden, um sie
einem nächsten
Frame jedes Restsignals zuzuweisen. Infolgedessen ist die Sprachcodiervorrichtung
in der Lage, die Zahl der Quantisierbits adaptiv jedem Restsignal
zuzuordnen, und selbst wenn die Sprachcodiervorrichtung die Zahl
der zugewiesenen Quantisierbits ändert,
ist die Sprachdecodiervorrichtung in der Lage, eine Dequantisierung
synchron mit Änderungen
der Bitzuweisung in der Sprachcodiervorrichtung auszuführen, ohne
Informationen über die
geänderte
Bitzuweisung zu erhalten. Da die Sprachcodier vorrichtung der Sprachdecodiervorrichtung
keine Informationen über
die Änderung
der Bitzuweisung für
die Synchronisierung mitteilen muss, ist es demzufolge möglich, die
Audioqualität
zu verbessern, ohne die Sendeeffizienz der Sprachinformationen zu
beeinträchtigen.
-
(Zweite Ausführungsform)
-
Es
ist ein Merkmal der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung
gemäß der zweiten
Ausführungsform
der vorliegenden Erfindung, einen Skalierfaktor bei der Bestimmung
eines optimalen Wertes der Zahl von Quantisierbits zu verwenden.
Darüber
hinaus sind die Konfigurationen der Sprachcodiervorrichtung und
der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform
dieselben wie jene der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung,
die in 2 bzw. 5 der ersten Ausführungsform
dargestellt sind, weshalb auf deren Beschreibung verzichtet wird.
-
7 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachcodiervorrichtung
gemäß der zweiten
Ausführungsform
der vorliegenden Erfindung zeigt. Wenngleich 7 eine Konfiguration
des ADPCM-Quantisierers 130a und der adaptiven Bitzuweisungseinrichtung 140a darstellt,
haben die anderen ADPCM-Quantisierer 130b und 130d dieselbe Konfiguration
wie jene des Quantisierers 130a und sind mit der adaptiven
Bitzuweisungseinrichtung 140a verbunden. Darüber hinaus
sind dieselben Abschnitte wie in 3 mit denselben
Bezugszeichen versehen, um deren Beschreibung auszulassen.
-
In 7 berechnet
der Skalierfaktor-Adaptierabschnitt 134a einen Skalierfaktor
aus den Kern-Bits, die im Kern-Bit-Extrahierabschnitt 133 extrahiert
werden, um ihn an die adaptive Bitzuweisungseinrichtung 140a auszugeben.
Der Dequantisierabschnitt 135a dequantisiert die Kern-Bits,
die im Kern-Bit-Extrahierabschnitt 133 extrahiert werden, und
gibt einen dequantisierten Wert an den Prädiktionsabschnitt 136 und
die Addiereinrichtung 137 aus. Die adaptive Bitzuweisungseinrichtung 140a bestimmt
die Zahl von Quantisierbits, um sie jedem Restsignal auf der Basis
eines Skaliertaktors zuzuweisen, der in einem entsprechenden der
ADPCM-Quantisierer 130a bis 130d berechnet wird.
-
Der
Betrieb der Sprachcodiervorrichtung, die den oben beschriebenen
Aufbau hat, wird als nächstes
erläutert.
-
Teilbandsignale,
die in der Teil-Filterbank 100 geteilt werden, werden jeweils
in die ADPCM-Quantisierer 130a bis 130d eingegeben.
Die Addiereinrichtung 131 berechnet ein Restsignal zwischen
dem Teilbandsignal, das in den entsprechenden der ADPCM-Quantisierer 130a bis 130d eingegeben
wird, und einem Prädiktionswert
eines letzten Frames, der im Prädiktionsabschnitt 136 berechnet wird,
und gibt das berechnete Restsignal in den Quantisierabschnitt 132 ein.
Das Restsignal wird im Quantisierabschnitt 132 zu einem
Codewort quantisiert, wobei die Zahl von Quantisierbits von der
adaptiven Bitzuweisungseinrichtung 140a zugewiesen wird.
Die Quantisierung des Restsignals verwendet den Skaliertaktor, der
im Skalierfaktor-Adaptierabschnitt 134a berechnet wird.
Das Codewort, das im Quantisierabschnitt 132 quantisiert
wird, wird an den Multiplexer 150 und zudem an den Kern-Bit-Extrahierabschnitt 133 ausgegeben.
Der Abschnitt 133 löscht
die LSB, um Kern-Bits zu extrahieren. Die extrahierten Kern-Bits
werden in den Skalierfaktor-Adaptierabschnitt 134a, um
bei der Berechnung eines Skalierfaktors verwendet zu werden, und
zudem in den Dequantisierabschnitt 135a eingegeben. Hier wird
das Codewort, das im Quantisierabschnitt 132 quantisiert
wird, skalierbar, um die Konsistenz des Skalierfaktors beizubehalten.
-
Der
Dequantisierabschnitt 135 dequantisiert die Kern-Bits unter
Verwendung des Skalierfaktors, der im Skalierfaktor-Adaptierabschnitt 134a berechnet
wurde. Aus dem dequantisierten Wert, den man durch Dequantisieren
der Kern-Bits erhält,
berechnet der Prädiktionsabschnitt 136 einen
Prädiktionswert eines
nächsten
Frames des Teilbandsignals.
-
Der
Skalierfaktor wird in die adaptive Bitzuweisungseinrichtung 140a gemäß einer
vorbestimmten Zahl von Frames, wie etwa auf Basis einer Pitch-Periode,
eingegeben. Die adaptive Bitzuweisungseinrichtung 140a berücksichtigt
als Energie einen Durchschnittswert des Skalierungsfaktors, der aus
den ADPCM- Quantisierern 130a bis 130d ausgegeben
wird, und bestimmt wie bei der ersten Ausführungsform die Zahl von Quantisierbits,
die jedem Restsignal zugewiesen werden, das im entsprechenden der
ADPCM-Quantisierer 130a bis 130d quantisiert werden
soll.
-
Die
bestimmten Zahlen der Quantisierbits werden an die jeweiligen Quantisierabschnitte 132 in den
ADPCM-Quantisierern 130a bis 130d ausgegeben.
Wie es oben erwähnt
wurde, quantisiert jeder Quantisierabschnitt 132 das Restsignal
des nächstens
Frames unter Verwendung des Skalierfaktors und gibt ein Codewort
mit der Zahl der zugewiesenen Bits aus. Die Codewörter, die
in den ADPCM-Quantisierern 130a bis 130d quantisiert
werden, werden im Multiplexer 150 zu einem Bitstrom quantisiert,
der ein multiplexiertes Signal ist.
-
Die
Sprachdecodiervorrichtung gemäß der zweiten
Ausführungsform
der vorliegenden Erfindung wird im folgenden beschrieben. Eine Konfiguration
der Sprachdecodiervorrichtung gemäß der zweiten Ausführungsform
ist dieselbe, wie jene der Sprachdecodiervorrichtung, die in 5 der
ersten Ausführungsform
dargestellt ist, weshalb auf deren Beschreibung verzichtet wird.
-
8 ist
ein Blockschaltbild, das eine primäre Konfiguration der Sprachdecodiervorrichtung
gemäß der zweiten
Ausführungsform
der vorliegenden Erfindung zeigt. Wenngleich 8 eine Konfiguration
des ADPCM-Dequantisierers 210a und der adaptiven Bitzuweisungseinrichtung 220a darstellt,
haben die anderen ADPCM-Dequantisierer 210b bis 210d dieselbe
Konfiguration, wie jene des Dequantisierers 210a, und sind
mit der adaptiven Bitzuweisungseinrichtung 220a verbunden.
-
In 8 löscht der
Kern-Bit-Extrahierabschnitt 211 das LSB aus dem Codewort,
das in den entsprechenden der ADPCM-Quantisierer 210a bis 210d eingegeben
wird, um Kern-Bits zu extrahieren. Der Dequantisierabschnitt 212a dequantisiert
die extrahierten Kern-Bits und gibt einen dequantisierten Wert an
die Addiereinrichtung 214 und den Prädiktionsabschnitt 215 aus.
Der Skalierfaktor-Adaptierabschnitt 213a berechnet
einen Skalierfaktor aus den extrahierten Kern-Bits, um ihn an die adaptive Bitzuweisungseinrichtung 220a auszugeben.
Die Addiereinrichtung 214 berechnet die Summe des dequantisierten
Wertes und des Prädiktionswertes,
der im Prädiktionsabschnitt 215 berechnet
wird. Der Prädiktionsabschnitt 215 führt eine
Null-Prädiktion
und eine Pol-Prädiktion
unter Verwendung des dequantisierten Wertes und einer Ausgabe des
Prädiktionsabschnittes 215 aus
und berechnet einen Prädiktionswert
eines nächsten
Frames des decodierten Teilbandsignals. Der Dequantisierabschnitt 216 dequantisiert
das eingegebene Codewort für
jede Zahl von Quantisierbits, die in der adaptiven Bitzuweisungseinrichtung 220a unter
Verwendung des Skalierfaktors berechnet wurden, und gibt ein decodiertes Restsignal
aus. Die Addiereinrichtung 217 berechnet die Summe aus
dem decodierten Restsignal, das aus dem Dequantisierabschnitt 216 ausgegeben
wird, und dem Prädiktionswert,
um ein decodiertes Teilbandsignal zu erzeugen. Die adaptive Bitzuweisungseinrichtung 220a bestimmt
die Zahl der Quantisierbits, die jedem der Restsignale zugewiesen
werden sollen, auf der Basis eines Skalierungsfaktors, der im entsprechenden
der ADPCM-Dequantisierer 210a bis 210d berechnet
wird.
-
Der
Betrieb der Sprachdecodiervorrichtung, die den oben beschriebenen
Aufbau hat, wird im folgenden beschrieben.
-
Codewörter, die
im Demultiplexer 200 geteilt werden, werden in die entsprechenden
ADPCM-Dequantisierer 210a bis 210d eingegeben.
Das Codewort, das in jeden der ADPCM-Dequantisierer 210a bis 210d eingegeben
wird, wird im Dequantisierabschnitt 216 entsprechend der
Zahl der Quantisierbits dequantisiert, die durch die adaptive Bitzuweisungseinrichtung 220a zugewiesen
sind, und es wird ein decodiertes Restsignal ausgegeben. Aus dem
Codewort, das in den entsprechenden der ADPCM-Dequantisierer 210a bis 210d eingegeben
wird, werden die LSB gelöscht
und werden Kern-Bits im Kern-Bit-Extrahierabschnitt 211 extrahiert.
Die extrahierten Kern-Bits werden in den Skaliertaktor-Adaptierabschnitt 213a zur
Verwendung bei der Berechnung eines Skalierfaktors und zudem in
den Dequantisierabschnitt 212a eingegeben. Im Dequantisierabschnitt 212a werden
die Kern-Bits mit Hilfe des Skalierfaktors dequantisiert, der im
Skalierfaktor-Adaptierabschnitt 213a berechnet
wurde. Der dequantisierte Wert, den man durch Dequantisieren der Kern-Bits
erhält,
wird in den Prädiktionsabschnitt 215 eingegeben.
Der Prädiktionsabschnitt 215 berechnet einen
Prädiktionswert
eines nächsten
Frames des decodierten Teilbandsignals unter Verwendung des eingegebenen
dequantisierten Wertes.
-
Der
Skalierfaktor wird in die adaptive Bituzweisungseinrichtung 220a je
vorbestimmter Zahl of Frames, wie etwa auf Basis einer Pitch-Periode,
eingegeben. Die adaptive Bitzuweisungseinrichtung 220a berücksichtigt
als Energie einen Durchschnittswert des Skalierungsfaktors, der
aus den ADPCM-Dequantisierern 210a bis 210d ausgegeben wird,
und berechnet wie bei der ersten Ausführungsform die Zahl von Quantisierbits,
die jedem Restsignal zugewiesen werden, das im entsprechenden der ADPCM-Quantisierer 130a bis 130d quantisiert
wird.
-
Die
berechneten Zahlen der Quantisierbits werden an den Dequantisierabschnitt
216 im entsprechenden der ADPCM-Dequantisierer 210a bis 210d ausgegeben,
und wie es oben erläutert
wurde, dequantisiert der Dequantisierabschnitt 216 ein
Codewort eines nächstes
Frames unter Verwendung des Skalierfaktors entsprechend der Zahl
von Bits, die in der adaptiven Bitzuweisungseinrichtung 220a zugewiesen
werden, und gibt ein decodiertes Restsignal aus. Das ausgegebene
decodierte Restsignal wird in der Addiereinrichtung 217 zum
Prädiktionswert
addiert, der aus dem Prädiktionsabschnitt 215 ausgegeben
wird, um zu einem decodierten Teilbandsignal zu werden, wobei das
decodierte Teilbandsignal aus jedem der ADPCM-Dequantisierer 210a bis 210d ausgegeben
wird. Die decodierten Teilbandsignale, die im entsprechenden der
ADPCM-Dequantisierer 210a bis 210d dequantisiert
werden, werden einer Synthese in der Synthesefilterbank 230 unterzogen,
um zu einem decodierten Signal zu werden.
-
Somit
wird gemäß der Sprachcodiervorrichtung
und der Sprachdecodiervorrichtung dieser Ausführungsform in der Sprachcodiervorrichtung
ein Restsignal zwischen einem Teilbandsignal für jedes Frequenzband und einem
Prädiktionswert
quantisiert, um es zu einem Codewort auszugeben, wird ein Skalierfaktor
aus den Kernbits des ausgegebenen Codewortes berechnet, und wird
auf der Basis des berechneten Skalierfaktors die Zahl der Quantisierbits,
die beim Quantisieren eines nächsten
Frames jedes Restsignals zugewiesen werden, berechnet. In der Sprachdecodiervorrichtung
wird der Skalierfaktor unter Verwendung desselben Codewortes berechnet,
wie jenes, das in der Sprachcodiervorrichtung dequanti siert wird,
und wird auf der Basis des berechneten Skalierfaktors die Zahl der
Quantisierbits berechnet, die in der Sprachcodiervorrichtung bestimmt
werden, um sie dem nächsten
Frame jedes Restsignals zuzuweisen. Infolgedessen ist die Sprachcodiervorrichtung
in der Lage, die Zahl der Quantisierbits adaptiv jedem Restsignal
zuzuordnen, und selbst wenn die Sprachcodiervorrichtung die Zahl
der zugewiesenen Quantisierbits ändert,
ist die Sprachdecodiervorrichtung in der Lage, eine Dequantisierung
synchron mit Änderungen
der Bitzuweisung in der Sprachcodiervorrichtung auszuführen, ohne
Informationen über
die geänderte
Bitzuweisung zu erhalten. Demzufolge ist es möglich, die Audioqualität zu verbessern,
ohne die Sendeeffizienz der Sprachinformationen zu beeinträchtigen.
-
Wenngleich
darüber
hinaus jede der oben erwähnten
Ausführungsformen
den Fall beschreibt, bei dem ein Eingangssignal in vier Teilbandsignale
in einer Teil-Filterbank
geteilt wird, ist die vorliegende Erfindung nicht auf einen derartigen
Fall beschränkt, wobei
es lediglich erforderlich ist, ein Eingangssignal in mehr als zwei
Signale entsprechend dem Frequenzband zu teilen. Darüber hinaus
führt die
Erhöhung
der Zahl von Teilungen zu einer Glättung der zu quantisierenden
Signale und verbessert die folgenden Eigenschaften des Skalierfaktors.
Wenn zudem eine Teil-Filterbank ein Kosinusmodulationsfilter ist, vergrößert die
Erhöhung
der Anzahl von Teilungen die Zahl von Taps des Basisfilters und
unterdrückt
einen Anstieg des Verzögerungsumfangs.
-
Wie
es oben erläutert
wurde, ist es gemäß der vorliegenden
Erfindung möglich,
eine Sprachcodiervorrichtung, eine Sprachdecodiervorrichtung und
ein Sprachcodier-/Decodierverfahren anzugeben, die eine verbesserte
Audioqualität
ermöglichen.
-
Die
vorliegende Erfindung ist nicht auf die oben beschriebenen Ausführungsformen
beschränkt,
wobei unterschiedliche Abweichungen und Abänderungen möglich sind, ohne vom Geltungsbereich
der vorliegenden Erfindung abzuweichen, wie er in den beigefügten Ansprüchen definiert
ist.
-
Diese
Anmeldung basiert auf der japanischen Patentanmeldung No. 2001-347408, die am 13.
November 2001 eingereicht wurde.