DE69309557T2 - Verfahren und Vorrichtung zur Sprachkodierung - Google Patents
Verfahren und Vorrichtung zur SprachkodierungInfo
- Publication number
- DE69309557T2 DE69309557T2 DE69309557T DE69309557T DE69309557T2 DE 69309557 T2 DE69309557 T2 DE 69309557T2 DE 69309557 T DE69309557 T DE 69309557T DE 69309557 T DE69309557 T DE 69309557T DE 69309557 T2 DE69309557 T2 DE 69309557T2
- Authority
- DE
- Germany
- Prior art keywords
- vector
- sub
- selecting
- output
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 131
- 239000013598 vector Substances 0.000 claims description 897
- 238000013139 quantization Methods 0.000 claims description 156
- 238000004364 calculation method Methods 0.000 claims description 46
- 230000005284 excitation Effects 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 18
- 238000001914 filtration Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims 6
- 230000008447 perception Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 53
- 230000015572 biosynthetic process Effects 0.000 description 30
- 238000003786 synthesis reaction Methods 0.000 description 30
- 238000012546 transfer Methods 0.000 description 23
- 230000003044 adaptive effect Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 238000010276 construction Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000002940 Newton-Raphson method Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0003—Backward prediction of gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein Sprachcodierungsverfahren und eine zugehörige Vorrichtung zur Durchführung einer hocheffizienten Sprachcodierung zur Verwendung in digitalen Zellentelephonsystemen. Genauer bezieht sich die vorliegende Erfindung auf ein Parametercodierungsverfahren und eine zugehörige Vorrichtung zum Codieren unterschiedlicher Typen von Parametern wie z. B. einer Spektralhülleninformation und einer Gradinformation bzw. Intensitätsinformation, die im obenerwähnten Sprachcodierungsverfahren und in der zugehörigen Vorrichtung verwendet werden; die vorliegende Erfindung bezieht sich ferner auf ein Mehrstufen-Vektorquantisierungsverfahren und eine zugehörige Vorrichtung für die Durchführung einer Nehrstufen-Vektorquantisierung zur Verwendung im obenerwähnten Sprachcodierungsprozeß und in der zugehörigen Vorrichtung.
- Seit kurzem sind auf solchen technischen Gebieten wie z. B. der digitalen Zellenübertragung und dem Sprachspeicherdienst mit dem Ziel der effektiven Nutzung elektrischer Signalform- und Speichermedien verschiedene hocheffiziente Codierungsverfahren in Gebrauch. Unter diesen verschiedenen Codierungsverfahren stellen die code-erregte lineare Prädiktionscodierung (CELP), die vektorsummen-erregte lineare Prädiktionscodierung (VSELP) und die Mehrfachimpulscodierung hocheffiziente Codierungsverfahren dar, die Sprache mit einer Codierungsgeschwindigkeit von ungefähr 8 kb/s codieren.
- Fig. 15 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches CELP-Codierungsverfahren verwendet. Das analoge Sprachsignal wird mit einer Abtastfrequenz von 8 kHz abgetastet, wobei die erzeugten Eingangssprachdaten von einem Eingangsanschluß 1 eingegeben werden. In einem Analyseabschnitt 2 zur linearen Prädiktionscodierung (LPC) werden mehrere der vom Eingangsanschluß 1 eingegebenen Eingangssprachdatenabtastwerte zu einem Rahmen in einem Vektor codiert (im folgenden mit "ein Eingangssprachvektor" bezeichnet), wobei die lineare Prädiktionsanalyse für diesen Eingangssprachvektor durchgeführt wird und anschließend die LPC-Koeffizienten berechnet werden. In einem LSP-Koeffizientenquantisierungsabschnitt 4 werden die LPC-Koeffizienten quantisiert, woraufhin die LPC-Koeffizienten eines Synthesefilters 3 eingestellt werden, der die Übertragungsfunktion {1/A(z)} besitzt.
- Ein Adaptivcodebuch 5 wird so gebildet, daß mehrere Schrittweitenvektoren gespeichert werden, die den Schrittweiten der Sprachintervalle in der Sprache entsprechen. In einem Verstärkungsfaktorabschnitt 6 wird ein Verstärkungsfaktor, der von einem später erläuterten Abweichungs- bzw. Verzerrungsgrad-Berechnungsabschnittsabschnitt 13 eingestellt wird, mit dem Schrittweitenvektor multipliziert, der aus dem Adaptivcodebuch 5 vom Abweichungsgrad-Berechnungsabschnitt 13 ausgewählt und ausgegeben wird, und wird anschließend vom Verstärkungsfaktorabschnitt 6 ausgegeben.
- Mehrere Rauschsignalformvektoren (z. B. Zufallsvektoren), die den stimmlosen Intervallen in der Sprache entsprechen, werden im voraus in einem Zufallscodebuch 7 gespeichert. In einem Verstärkungsfaktorabschnitt 8 wird der vom Abweichungsgrad-Berechnungsabschnitt 13 eingestellte Verstärkungsfaktor mit dem Rauschsignalformvektor multipliziert, der vom Abweichungsgrad-Berechnungsabschnitt 13 aus dem Zufallscodebuch 7 ausgewählt und ausgegeben wird, und wird vom Verstärkungsfaktorabschnitt 8 ausgegeben.
- In einem Addierer 9 werden der Ausgangsvektor des Verstärkungsfaktorabschnitts 6 und der Ausgangsvektor des Verstärkungsfaktorabschnitts 8 addiert, wobei der Ausgangsvektor des Addierers 9 anschließend als Erregungsvektor dem Synthesefilter 3 zugeführt wird. Im Synthesefilter 3 wird der Sprachvektor (im folgenden mit "synthetischer Sprachvektor" bezeichnet) auf der Grundlage des gesetzten LPC-Koeffizienten synthetisiert.
- Außerdem wird in einem Grad- bzw. Intensitätsquantisierungsabschnitt 10 zuerst der Grad bzw. die Intensität des Eingangssprachvektors berechnet, woraufhin dieser Grad quantisiert wird. Auf diese Weise werden unter Verwendung des quantisierten Grades des Eingangssprachvektors der Eingangssprachvektor und der Schrittweitenvektor normiert. In einem Subtrahierer 11 wird der synthetische Sprachvektor vom normierten Eingangssprachvektor, der vom Gradquantisierungsabschnitt 10 ausgegeben worden ist, subtrahiert, womit die Abweichungsdaten berechnet werden.
- Anschließend werden die Abweichungsdaten in einem perzeptualen Gewichtungsfilter 12 entsprechend den Koeffizienten gewichtet, die den perzeptualen Eigenschaften von Menschen zugeordnet werden. Das obenerwähnte perzeptuale Gewichtungsfilter verwendet einen Maskierungseffekt der perzeptualen Eigenschaften von Menschen und reduziert die Hörbereiche des quantisierten Zufallsrauschens im Formantenbereich der Sprachdaten.
- Ein Abweichungsgrad-Berechnungsabschnitt 13 berechnet den Grad der Abweichungsdaten, die vom perzeptualen Gewichtungsfilter 12 ausgegeben werden, wählt den Schrittweitenvektor und den Rauschsignalformvektor, die den Grad der Abweichungsdaten minimieren, aus dem Adaptivcodebuch 5 bzw. dem Zufallscodebuch 7 und setzt die Verstärkungsfaktoren in den jeweiligen Verstärkungsfaktorabschnitten 6 und 8. Auf diese Weise werden die Informationen (Codes) und Verstärkungsfaktoren, die entsprechend den LPC-Koeffizienten ausgewählt worden sind, der Grad des Eingangssprachvektors, des Schrittweitenvektors und des Rauschsignalformvektors zu Codes aus Bitserien ungesetzt, ausgegeben und anschließend übertragen.
- Fig. 16 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches VSELP-Codierungsverfahren verwendet. In dieser Fig. 16 behalten die Komponenten, die denjenigen der Fig. 15 entsprechen, die ursprünglichen Bezugszeichen, wobei aeren Beschreibung hier nicht wiederholt wird. Wie in Fig. 16 gezeigt, ist der Aufbau dieser Sprachcodierungsvorrichtung, die das VSELP-Codierungsverfahren verwendet, insgesamt derjenigen der obenerwähnten Sprachcodierungsvorrichtung ähnlich, die das CELP-Codierungsverfahren verwendet. Statt jedoch wie im CLP-Codierungsverfahren jeden separaten Verstärkungsfaktor mit dem ausgewählten Schrittweitenvektor bzw. dem Rauschsignalformvektor zu multiplizieren, verwendet das VSELP-Codierungsverfahren ein Vektorquantisierungsverfahren, das gleichzeitig die Verstärkungsfaktoren ermittelt, die mit dem ausgewählten Schrittweitenvektor bzw. dem Rauschsignalformvektor multipliziert werden sollen, und setzt diese in die Verstärkungsfaktorabschnitte 15a und 15b eines Verstärkers 15 ein, um die Quantisierungseffizienz zu steigern.
- Die genauen Einzelheiten des (1) CLP-Codierungsverfahrens, (2) VSELP-Codierungsverfahrens und (3) des Mehrfachimpuls-Codierungsverfahrens können gefunden werden, indem entsprechend Bezug genommen wird auf (1) Schroeder, M. R., u. a., (Code-Excited Linear Prediction (CELP): High-quality Speech at Very Low Rates: Proc. ICASSP '85, 25.1.1, S. 937-940, 1985), (2) Gerson, I. A., u. a., (Vector Sum Excited Linear Prediction (VSELP) Speech Coding at 8 kps: Proc. ICASSP '90, S9.3, S. 461-464, 1990), und (3) Ozawa, u. a., (9.6-4.8 kbit/s Multi-pass Speech Coding Method Using Pitch Information [übersetzt]: Shingakushi (D-II), J72-D-II, 8, S. 1125-1132, 1989).
- Außerdem ist ein code-erregtes lineares Prädiktionscodierungsverfahren mit geringer Verzögerung (LD-CELP) ein hocheffizientes Codierungsverfahren, das Sprache mit einer Codierungsgeschwindigkeit von 16 kb/s codiert, wobei aufgrund der Verwendung eines Rückwärtsprädiktionsverfahrens in bezug auf die LPC-Koeffizienten und den Grad des Eingangssprachvektors die Übertragung der LPC-Koeffizientencodes und der Gradcodes des Eingangssprachvektors nicht erforderlich ist. Fig. 17 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die das herkömmliche LD-CELP-Codierungsverfahren verwendet. In dieser Fig. 17 behalten die Komponenten, die denjenigen der Fig. 15 entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird.
- In einem LPC-Analyseabschnitt 16 werden die lineare Prädiktionsanalyse und die Berechnung der LPC-Koeffizienten des Synthesefilters 3 nicht für die Eingangssprachdaten durchgeführt, die vom Eingangsanschluß 1 eingegeben worden sind und sich in dem Rahmen befinden, der momentan der Quantisierung unterworfen wird. Statt dessen wird eine höhere lineare Prädiktionsanalyse der 50. Ordnung durchgeführt, die die Schrittweitenperiodizität der Sprache einschließt, wobei die LPC-Koeffizienten des Analysefilters 3 für den vorher verarbeiteten Ausgangsvektor des Synthesefilters 3 berechnet und ermittelt werden. Auf diese Weise werden die ermittelten LPC-Koeffizienten in den Synthesefilter 3 eingesetzt.
- In ähnlicher Weise wird bei dieser Sprachcodierungsvorrichtung, nachdem die Berechnung des Grads der Eingangssprachdaten im Rahmen im Grandquantisierungsabschnitt 10 der Quantisierung unterworfen worden sind, die Quantisierung dieses Grades nicht durchgeführt, wie in der in Fig. 15 gezeigten Sprachcodierungsvorrichtung. Statt dessen wird in einem Verstärkungsfaktor-Anpassungsabschnitt 17 eine lineare Prädiktionsanalyse für den vorher verarbeiteten Grad des Ausgangsvektors vom Verstärkungsfaktorabschnitt 8 durchgeführt, wobei der Grad (mit anderen Worten der vorhergesagte Verstärkungsfaktor), der dem ausgewählten Rauschsignalformvektor in der momentanen Rahmenoperation zur Verfügung gestellt werden soll, berechnet, ermittelt und anschließend in den Vorhersageverstärkungsfaktorabschnitt 18 eingesetzt wird.
- Folglich wird im Vorhersageverstärkungsfaktorabschnitt 18 der vorhergesagte Verstärkungsfaktor, der vom Verstärkungsfaktor-Anpassungsabschnitt 17 eingestellt worden ist, mit dem Rauschsignalformvektor multipliziert, der vom Abweichungsgrad-Berechnungsabschnitt 13 aus dem Zufallscodebuch 7 ausgewählt und ausgegeben worden ist. Anschließend wird der vom Abweichungsgrad-Berechnungsabschnitt 13 eingestellte Verstärkungsfaktor mit dem Ausgangsvektor vom Vorhersageverstärkungsfaktorabschnitt 18 im Verstärkungsfaktorabschnitt 8 multipliziert und anschließend ausgegeben. Der Ausgangsvektor des Verstärkungsfaktorabschnitts 8 wird anschließend als Erregungsvektor dem Synthesefilter 3 zugeführt, wobei im Synthesefilter 3 auf der Grundlage der gesetzten LPC-Koeffizienten ein synthetischer Sprachvektor synthetisiert wird.
- Anschließend wird im Subtrahierer 11 der synthetische Sprachvektor vom Eingangssprachvektor subtrahiert, wobei die Abweichungsdaten berechnet werden. Nachdem diese Abweichungsdaten im perzeptualen Gewichtungsfilter 12 unter Verwendung der Koeffizienten, die den menschlichen perzeptualen Eigenschaften zugeordnet sind, gewichtet worden sind, wird der Grad der aus dem perzeptualen Gewichtungsfilter 12 ausgegebenen Abweichungsdaten berechnet, der Rauschsignalformvektor, der den Grad der Abweichungsdaten minimiert, aus dem Zufallscodebuch 7 ausgewählt und anschließend der Verstärkungsfaktor im Verstärkungsfaktorabschnitt 8 gesetzt. Auf diese Weise werden im Codeausgabeabschnitt 14 die Codes und Verstärkungsfaktoren, die entsprechend den Rauschsignalformvektoren ausgewählt worden sind, in Codes von Bitserien umgesetzt, ausgegeben und anschließend übertragen.
- Wie oben beschrieben, ist beim herkömmlichen LD-CELP-Codierungsverfahren diese Übertragung der LPC-Koeffizienten und des Grads des Eingangssprachvektors unnötig, da die im voraus von beiden Sprachcodierungs- und Decodierungsvorrichtungen verarbeiteten synthetischen Sprachvektoren gemeinsam verwendet werden können.
- Weitere Einzelheiten des LD-CELP-Codierungsverfahrens können gefunden werden unter Bezugnahme auf (2) Chen, J., (High Quality 16 kb/s Speech Coding with a One-Way Delay Less Than 2 ms: Proc. ICASSP '90, 33, S9.1, 1990).
- Unter den obenerwähnten herkömmlichen Sprachcodierungsverfahren werden bei der CLP-Sprachcodierung die lineare Prädiktionsanalyse durchgeführt, die LPC-Koeffizienten des Synthesefilters 3 berechnet und diese LPC-Koeffizienten anschließend nur für die Eingangssprachdaten in dem momentan der Quantisierung unterworfenen Rahmen quantisiert. Es besteht somit der Nachteil, daß beim Übertragungsempfänger mit der decodierten, hochqualitativen Sprache (im folgenden mit "die decodierte Sprache" bezeichnet) für die LPC-Koeffizientenquantisierung eine große Anzahl von Bits erforderlich ist.
- Außerdem wird der Grad des Eingangssprachvektors quantisiert, wobei der als Antwort auf den quantisierten Grad des Eingangssprachvektors ausgewählte Code als Codierungssignal übertragen wird, wodurch in dem Fall, in dem auf der Übertragungsleitung ein Übertragungsfehler des Codes auftritt, insofern Probleme bestehen, als in den stimmlosen Intervallen eine unerwünschte Sprache der decodierten Sprache erzeugt wird, wobei die gewünschte Sprache häufig unterbrochen wird, wodurch decodierte Sprache mit geringer Qualität erzeugt wird. Außerdem wird die Quantisierung des Grads des Eingangssprachvektors unter Verwendung einer begrenzten Anzahl von Bits durchgeführt, wodurch in dem Fall, indem die Größe des Eingangssprachvektors klein ist, der Nachteil besteht, daß das Quantisierungsrauschen zunimmt.
- Ferner wird der Rauschsignalformvektor durch einen Rauschsignalformvektor dargestellt, der in einem Zufallscodebuch 7 gespeichert ist, wobei der als Antwort auf diesen Rauschsignalformvektor ausgewählte Code als Codierungssignal übertragen wird, so daß in dem Fall, indem auf der Übertragungsleitung ein Übertragungsfehler des Codes auftritt, in der Sprachdecodierungsvorrichtung des Übertragungsempfängers ein völlig anderer Rauschsignalformvektor verwendet wird, wodurch eine decodierte Sprache mit geringer Qualität erzeugt wird.
- Außerdem verwendet der im Zufallscodebuch zu speichernde Rauschsignalformvektor normalerweise eine Sprachdatenbasis, in der eine große Menge an wirklichen Sprachdaten gespeichert ist, und führt ein Lernen aus, um sich diesen wirklichen Sprachdaten anzupassen. In dem Fall jedoch, in dem der Rauschsignalformvektor durch einen Rauschsignalformvektor eines Zufallscodebuches 7 dargestellt wird, ist eine große Speicherkapazität erforderlich, weshalb die Größe des Codebuches sehr groß wird. Folglich besteht der Nachteil, daß das obenerwähnte Lernen nicht durchgeführt wird und der Rauschsignalformvektor nicht gut an die wirklichen Sprachdaten angepaßt wird.
- Außerdem werden im obenerwähnten herkömmlichen VSELP-Codierungsverfahren in dem Fall, indem auf der Leitung ein Übertragungsfehler des Codes auftritt, der dem Verstärkungsfaktor entspricht, der mit dem Schrittweitenvektor und dem Rauschsignalformvektor, die gleichzeitig eingestellt werden, zu übertragend ist, dieser Schrittweitenvektor und der Rauschsignalformvektor in der Sprachdecodierungsvorrichtung des Übertragungsempfängers mit einem völlig anderen Verstärkungsfaktor multipliziert, wodurch eine decodierte Sprache mit geringer Qualität erzeugt wird.
- Ferner werden bei den obenerwähnten herkömmlichen CELEP- und VSELP-Codierungsverfahren der Schrittweitenvektor und der Rauschsignalformvektor, die den Grad der Abweichungsdaten minimieren, aus dem Adaptivcodebuch 5 bzw. dem Zufallscodebuch 7 ausgewählt. Da jedoch der Grad der Abweichungsdaten d, wie in einer Formel (1) unten gezeigt, in einer geschlossenen Schleife, die mittels der Strukturelemente 3, 5-9 und 11-13 oder der Strukturelemente 3, 5, 7, 9, 11-13 und 15 gebildet wird, im Abweichungsgrad-Berechnungsabschnitt 13 für alle Schrittweitenvektoren und Rauschsignalformvektoren, die im Adaptivcodebuch 5 bzw. im Zufallscodebuch 7 gespeichert sind, berechnet werden muß, um den optimalen Schrittweitenvektor und den optimalen Rauschsignalformvektor auszuwählen, ergeben sich insofern Nachteile, als eine hohe Berechnungskomplexität erforderlich ist.
- d = IX - gHVj ² (1)
- In der Formel (1) wird der Eingangssprachvektor, dessen Grad quantisiert ist, durch X dargestellt; der Schrittweitenvektor oder der Rauschsignalformvektor, die aus dem Adaptivcodebuch 7 bzw. dem Zufallscodebuch 5 ausgewählt werden, werden durch Vj (j = 1 - N; N ist die Codebuchgröße) dargestellt; der in den Verstärkungsfaktorabschnitten 6 und 8 oder in den Verstärkungsfaktorabschnitten 15a und 15b eingestellte Verstärkungsfaktor wird durch g dargestellt; die Impulsantwortkoeffizienten, die in dem Fall, in dem das Synthesefilter 3 und das perzeptuale Gewichtungsfilter 12 von einem FIR-Filter gebildet werden, die Koeffizienten es FIR-Filters darstellen, werden durch H dargestellt; und die Abweichungsdaten werden durch d dargestellt.
- Andererseits wird im obenerwähnten herkömmlichen LD-CELP- Codierungsverfahren während der Berechnung der LPC-Koeffizienten des Synthesefilters 3 ein Rückwärtsprädiktionsverfahren verwendet, bei dem die lineare Prädiktionsanalyse nur für den vorher verarbeiteten synthetischen Sprachvektor durchgeführt wird. Somit ist im Vergleich zu den in den obenerwähnten CELP- und VSELP-Codierungsverfahren verwendeten Vorwärtsprädiktionsverfahren der Prädiktionsfehler groß. Als Folge hiervon treten bei einer Codierungsgeschwindigkeit von ungefähr 8 kb/s plötzliche Anstiege in der Signalformabweichung auf, die ihrerseits eine decodierte Sprache von geringer Qualität erzeugen.
- Bei den obenerwähnten herkömmlichen hocheffizienten Codierungsverfahren werden mehrere Abtastwerte jedes Parametertyps von den Informationen, die sich auf die Spektralhüllkurven, den Grad und die Ähnlichkeit beziehen, als ein Rahmen in einem Vektor gesammelt, im jeweiligen Rahmen codiert und anschließend übertragen. Außerdem sind bei den obenerwähnten herkömmlichen hocheffizienten Codierungsverfahren Verfahren zum Erhöhen der Rahmenaktualisierungsperiode und zum Quantisieren der Unterschiede zwischen dem aktuellen Rahmen und dem vorangehenden Rahmen sowie der vorhergesagten Werte bekannt, um die Informationskompressionseffizienz zu steigern.
- Wenn jedoch die Rahmenaktualisierungsperiode 40 ms oder mehr beträgt, tritt das Problem auf, das die Codierungsabweichung aufgrund der Unfähigkeit des Systems, Änderungen in den Spektraleigenschaften der Sprachsignalform sowie Schwankungen der Leistung zu verfolgen, zunimmt. Wenn außerdem die Parameter durch Codierungsfehler zerstört werden, werden in der codierten Sprache Abweichungen über lange Intervall erzeugt.
- Wenn andererseits die Unterschiede zwischen den Parametern des aktuellen und der vergangenen Rahmen und die vorhergesagten Werte quantisiert werden, werden selbst im Fall kurzer Rahmenaktualisierungsperioden die Verwendung einer Zeitkontinuität der Parameter und eine Informationskompression möglich. Jedoch besteht der Nachteil, daß die Auswirkungen von vergangenen Codierungsfehlern sich weiterhin über lange Zeitperioden ausbreiten.
- Ferner wird in den in den Fig. 15 und 16 gezeigten obenerwähnten Sprachcodiererungsvorrichtungen im LSP-Koeffizientenquantisierungsabschnitt 4 eine Quantisierung durchgeführt, nachdem die LPC-Koeffizienten, die im LPC- Analyseabschnitt 2 ermittelt worden sind, in die LSP-Parameter umgesetzt worden sind, wobei die quantisierten LSP-Parameter anschließend wieder zurück in die LPC-Koeffizienten umgesetzt werden. Während diese LSP-Parameter quantisiert werden, bewirkt ein Vektorquantisierungsverfahren die Quantisierung eines Bits oder weniger je Abtastwert. Bei diesem Vektorquantisierungsverfahren wird wie in Fig. 18 gezeigt im Abweichungs-Berechnungsabschnitt 19 der LSP-Codevektor, der die geringste Abweichung vom LSP-Parametervektor besitzt, der aus mehreren Abtastwerten der LSP-Parameter zu bilden ist, aus dem Codebuch 20 ausgewählt, wobei dessen Code übertragen wird. Auf diese Weise ist es durch Ausbilden des Codebuchs 20 in Übereinstimmung mit der Quantisierung möglich, die LSP-Parameter mit kleiner Abweichung zu quantisieren.
- Da jedoch sowohl die Speicherkapazität des Codebuches 20 als auch die Berechnungskomplexität bei der Berechnung entsprechend der Exponentialfunktion der Anzahl der Quantisierungsbits zunehmen, ist es schwierig, die Quantisierung einer großen Anzahl von Bits zu bewerkstelligen. Diesbezüglich stellt ein Mehrstufen-Vektorquantisierungsverfahren einen Weg dar, mit dem dieses Problem gelöst werden kann. Das heißt, das Codebuch 20 wird aus mehreren Codebüchern gebildet, wobei im Codierungsabschnitt im LSP-Koeffizientenquantisierungsabschnitt 4 der Quantisierungsfehler, der bei der Vektorquantisierung eines bestimmten Schritts auftritt, als Eingangsvektor bei der Vektorquantisierung des nächsten Schritts verwendet wird. Im Decodierungsabschnitt des LSP-Koeffizientenquantisierungsabschnitts 4 wird dann der Ausgangsvektor gebildet, indem mehrere der LSP-Codevektoren addiert werden, die aus den mehreren Codebüchern ausgewählt worden sind. Auf diese Weise wird die Vektorquantisierung möglich, während die Speicherkapazität und die Berechnungskomplexität auf realistische Bereiche beschränkt werden. Bei diesem Mehrstufen-Vektorquantisierungsverfahren wird jedoch im Vergleich zum idealen Einstufen-Vektorquantisierungsverfahren eine Abweichung mit beträchtlichem Anteil beobachtet.
- Der Grund für die große Abweichung bei diesem Mehrstufen- Vektorquantisierungsverfahren wird im folgenden mit Bezug auf die Fig. 19 bis 22 erläutert. Erstens, um das Synthesefilter 3 stabil zu erregen, in das der LSP-Parametervektor eingesetzt wird, müssen die Werte der LSP-Parameter ω&sub1; bis ωp, die den LSP-Parametervektor der Dimension p bilden, die durch die folgende Formel (2) gegebene Beziehung erfüllen.
- 0 < ω&sub1; < ω&sub2; < ... < ωp < π (2)
- Fig. 19 zeigt einen Fall, in dem ein LSP-Parametervektor zweiter Ordnung, d. h. p 2, verwendet wird. Die LSP-Parameter müssen gemäß Formel (2) innerhalb des in Fig. 19 gezeigten stabilen Dreieckbereichs A1 liegen. Gemäß den statistischen Eigenschaften von Sprache ist außerdem die Erwartung der LSP-Parameter hoch, die in dem schrägen Bereich liegen, der mit A2 bezeichnet ist.
- Im folgenden wird mit Bezug auf das in Fig. 20 gezeigte Flußdiagramm der Ablauf der Prozeduren des LSP-Koeffizientenquantisierungsabschnitts 4 im Fall der Durchführung der Vektorquantisierung dieser LSP-Parameter erläutert. Um ferner die Speicherkapazität des Codebuches 20 zu reduzieren, wird der LSP-Codierungsvektor als die Summe von zwei Vektoren dargestellt. Das Codebuch 20 wird somit von einem ersten Codebuch #1 und einem zweiten Codebuch #2 gebildet. In diesem Codierungsabschnitt wird im Schritt SA1 ein erstes 3-Bit-Codebuch #1 ähnlich dem Eingangsvektor gebildet. Auf diese Weise kann ein in Fig. 21 gezeigter, rekonstruierter Vektor V1 erhalten werden. Anschließend wird eine zweite Vektorquantisierung des Quantisierungsfehlers durchgeführt, der während der Quantisierung im Schritt SA1 aufgetreten ist. Das heißt, in dem in Fig. 20 gezeigten Schritt SA2 wird die Gruppe der rekonstruierten Vektoren V2, die innerhalb des in Fig. 22 gezeigten kreisförmigen Bereiches liegen (d. h. die Inhalte des zweiten Codebuches #2) zentral mit dem rekonstruierten Vektor V1 kombiniert, der durch die erste Vektorquantisierung ausgewählt worden ist, wodurch ein Ausgangspunkt gebildet wird. Wenn wie in Fig. 22 gezeigt zwei Ausgangsvektoren des Codebuches #1 bzw. des Codebuches #2 addiert werden, kann ein Ausgangspunkt in einem Bereich gebildet werden, der ursprünglich nicht vorhanden war. Folglich wird im Schritt SA3 beurteilt, ob der addierte Vektor stabil oder instabil ist, wobei instabile Vektoren vom Prozeß ausgeschlossen werden. Im Schritt SA4 werden die Abweichung des Eingangsvektors und der obenerwähnten rekonstruierte Vektor berechnet. Anschließend wird im Schritt SA5 ein Vektor ermittelt, der die obenerwähnte Abweichung minimiert, wobei dessen Code zum Decodierungsabschnitt des LSP-Koeffizientenquantisierungsabschnitts 4 übertragen wird.
- Auf diese Weise wird im Decodierungsabschnitt im Schritt SA6 das Codebuch #1 verwendet, um einen ersten Ausgangsvektor zu ermitteln, wobei im Schritt SA7 ein zweiter Ausgangsvektor, der im Codebuch #2 enthalten ist, zu diesem obenerwähnten ersten Ausgangsvektor addiert wird, um den endgültigen Ausgangsvektor zu erhalten.
- Wie oben erwähnt bestehen bei den herkömmlichen Codierungsprozessen folglich insofern Probleme, als neben dem Ausschließen des instabilen Vektors keine alternativen zur Verfügung stehen, was zu einer Verschwendung von Informationen führt.
- Ein Artikel mit dem Titel "Multiple stage Vector Quantization for Speech Coding", von Bing-Hwang Duang und A. H. Gray, J2 (1982, IEEE), bezieht sich auf das Mehrstufen-Vektorquantisierungsverfahren.
- Die Erfindung ist durch die beigefügten Ansprüche definiert.
- Im Hinblick auf das Obenerwähnte ist es eine erste Aufgabe der vorliegenden Erfindung, ein Sprachcodierungsverfahren und eine zugehörige Vorrichtung zu schaffen, bei denen selbst in dem Fall, in dem auf der Übertragungsleitung Übertragungsfehler auftreten, eine hochqualitative Sprachcodierung und -decodierung mit einer niedrigen Codierungsgeschwindigkeit möglich ist, die durch die obenerwähnten Fehler kaum beeinträchtigt wird. Außerdem ist es eine zweite Aufgabe der vorliegenden Erfindung, ein Parametercodierungsverfahren und eine zugehörige Vorrichtung zu schaffen, die dann, wenn unterschiedliche Typen von Parametern, wie z. B. diejenigen von Spektralhüllkurveninformationen, Gradinformationen und dergleichen, mit niedriger Codierungsgeschwindigkeit codiert werden, die Übertragung von Codierungsfehlern verhindern, eine vergleichsweise kurze Rahmenaktualisierungsperiode beibehalten und fähig sind, die Quantisierungsabweichung durch Nutzung der Zeitkontinuität der Parameter zu reduzieren. Ferner ist es eine dritte Aufgabe der vorliegenden Erfindung, ein Mehrstufen-Vektorquantisierungsverfahren und eine zugehörige Vorrichtung zu schaffen, die fähig sind, das Aufkommen einer Quantisierungsabweichung zu unterdrücken, während die Speicherkapazität des Codebuches klein gehalten wird.
- Um die erste Aufgabe zu lösen, schafft die vorliegende Erfindung ein Sprachcodierungsverfahren zum Codieren von Sprachdaten, die mehrere Abtastwerte als Einheit einer Rahmenoperation umfassen, wobei: die mehreren Abtastwerte der Sprachdaten durch eine lineare Prädiktionsanalyse analysiert werden und somit Prädiktionskoeffizienten berechnet werden und quantisiert werden; die quantisierten Prädiktionskoeffizienten in ein Synthesefilter eingesetzt werden; der synthetisierte Sprachvektor synthetisiert wird, indem das Synthesefilter mit einem Schrittweitenvektor erregt wird, der aus einem Adaptivcodebuch ausgewählt wird, in dem mehrere Schrittweitenvektoren gespeichert sind, und der mit einem ersten Verstärkungsfaktor und mit einem Rauschsignalformvektor multipliziert wird, der aus einem Zufallscodebuch ausgewählt wird, in dem mehrere Rauschsignalformvektoren gespeichert sind, und mit einem zweiten Verstärkungsfaktor multipliziert wird; und wobei das Verfahren das Auswählen der ersten und zweiten Verstärkungsfaktoren zum gleichen Zeitpunkt, das Vorsehen eines Multiplizierers zum Multiplizieren des ausgewählten Rauschsignalformvektors mit einem vorhergesagten Verstärkungsfaktor sowie das Vorhersagen des vorhergesagten Verstärkungsfaktors umfaßt, der mit dem Rauschsignalformvektor multipliziert wird, der in einer nachfolgenden Rahmenoperation ausgewählt wird, und auf dem aktuellen Rauschsignalformvektor basiert, der mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor in der aktuellen Rahmenoperation multipliziert wird und auf dem vorangehenden Rauschsignalformvektor basiert, der mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor in der vorangegangenen Rahmenoperation multipliziert worden ist.
- Die vorliegende Erfindung schafft ferner eine Sprachcodierungsvorrichtung zum Codieren von Sprachdaten, die mehrere Abtastwerte als Einheit einer Rahmenoperation umfassen, wobei: die mehreren Abtastwerte der Sprachdaten durch eine lineare Prädiktionsanalyse analysiert werden und somit Prädiktionskoeffizienten berechnet und quantisiert werden; die quantisierten Prädiktionskoeffizienten in ein Synthesefilter eingesetzt werden; der synthetische Sprachvektor synthetisiert wird, indem das Synthesefilter mit einem Schrittweitenvektor erregt wird, der aus einem Adaptivcodebuch ausgewählt worden ist, in dem mehrere Schrittweitenvektoren gespeichert sind, und der mit einem ersten Verstärkungsfaktor und mit einem Rauschsignalformvektor, der aus einem Zufallscodebuch ausgewählt worden ist, in dem mehrere Rauschsignalformvektoren gespeichert sind, multipliziert wird und mit einem zweiten Verstärkungsfaktor multipliziert wird; und wobei die Vorrichtung einen Verstärkungsfaktorvorhersageabschnitt zum Multiplizieren des ausgewählten Rauschsignalformvektors mit einem vorhergesagten Verstärkungsfaktor; einen Verstärkungsfaktorabschnitt zum Multiplizieren des ausgewählten Schrittweitenvektors und eines aus dem Verstärkungsfaktorvorhersageabschnitt abgeleiteten Ausgangsvektors unter Verwendung des ersten bzw. zweiten Verstärkungsfaktors, eine Abweichungsberechnungsvorrichtung zum entsprechenden Auswählen des Schrittweitenvektors und des Rauschsignalformvektors und zum gleichzeitigen Einstellen der ersten und zweiten Verstärkungsfaktoren, so daß eine Quantisierungsabweichung zwischen einem Eingangssprachvektor, der mehrere Abtastwerte der Sprachdaten enthält, und einem synthetischen Sprachvektor minimiert wird; und eine Verstärkungsfaktor-Anpassungsvorrichtung zum Vorhersagen des vorhergesagten Verstärkungsfaktors umfaßt, der mit dem in der nachfolgenden Rahmenoperation ausgewählten Rauschsignalformvektor multipliziert werden soll und auf dem aktuellen Rauschsignalformvektor, der mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor in der aktuellen Rahmenoperation multipliziert wird, und auf dem vorangehenden Rauschsignalformvektor basiert, der in der vorangegangenen Rahmenoperation mit dem vorhergesagten Verstärkungsfaktor und dem zweiten Verstärkungsfaktor multipliziert worden ist.
- Gemäß diesem Verfahren und der zugehörigen Vorrichtung ist selbst in dem Fall, in dem auf der Übertragungsleitung Übertragungsfehler auftreten, eine hochqualitative Sprachcodierung und -decodierung mit einer niedrigen Codierungsgeschwindigkeit möglich, die durch die obenerwähnten Fehler kaum beeinträchtigt wird.
- Um die zweite Aufgabe zu lösen, schafft die vorliegende Erfindung ein Parametercodierungsverfahren für Sprache zum Quantisieren von Parametern wie z. B. der Spektralhüllkurveninformation und der Gradinformation in einer Einheit einer Rahmenoperation, die mehrere Abtastwerte von Sprachdaten umfaßt, wobei das Verfahren in einem Codierungsabschnitt, in dem der Parameter quantisiert wird, versehen ist mit den Schritten (a) Darstellen des resultierenden quantisierten Parametervektors durch das gewichtete Mittel eines prospektiven Parametervektors, der aus einem Parameter-Codebuch ausgewählt worden ist, in dem mehrere prospektive Parametervektoren gespeichert sind, in der aktuellen Rahmenoperation und eines Teils des prospektiven Parametervektors, der aus dem Parameter- Codebuch in der vorangegangenen Rahmenoperation ausgewählt worden ist, (b) Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß eine Quantisierungsabweichung zwischen dem quantisierten Parametervektor und einem Eingangsparametervektor minimiert wird, und (c) Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; und in einem Decodierungsabschnitt versehen ist mit den Schritten (a) Berechnen des gewichteten Mittels des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist und dem übertragenen Vektorcode entspricht, und des prospektiven Parametervektors in der vorangegangenen Rahmenoperation, und (b) Ausgeben des resultierenden Vektors.
- Außerdem schafft die vorliegende Erfindung eine Parametercodierungsvorrichtung für Sprache zum Quantisieren von Parametern, wie z. B. der Spektralhüllkurveninformation und der Gradinformation, als Einheit einer Rahmenoperation, die mehrere Abtastwerte von Sprachdaten umfaßt, wobei die Vorrichtung einen Codierungsabschnitt enthält, der versehen ist mit (a) einem Parameter-Codebuch zum Speichern mehrerer Prädiktionsparametervektoren und (b) einem Vektorquantisierungsabschnitt zum Berechnen des gewichteten Mittels des prospetiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist, des Teils des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der vorangegangenen Rahmenoperation ausgewählt worden ist, Verwenden des resultierenden Vektors als resultierenden, quantisierten Parametervektor der Quantisierung der Prädiktionskoeffizienten, Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß eine Quantisierungsabweichung zwischen dem quantisierten Parametervektor und einem Eingangsparametervektor minimiert wird, und Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; und einem Decodierungsabschnitt zum Berechnen des gewichteten Mittels des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist und dem übertragenen Vektorcode entspricht, und des prospektiven Parametervektors in der vorangegangenen Rahmenoperation und Ausgeben des resultierenden Vektors.
- Gemäß diesem Verfahren und der zugehörigen Vorrichtung stellt der Codierungsabschnitt den resultierenden quantisierten Parametervektor durch die gewichteten Mittel des prospektiven Parametervektors, der aus dem Parameter- Codebuch in der aktuellen Rahmenoperation ausgewählt worden ist, und durch den Teil des prospektiven Parametervektors dar, der aus dem Parameter-Codebuch in der vorangegangenen Rahmenoperation ausgewählt worden ist. Anschließend wählt der Codierungsabschnitt den prospektiven Parametervektor aus dem Parameter-Codebuch aus, so daß die quantisierte Abweichung zwischen dem quantisierten Parametervektor und dem Eingangsparametervektor minimiert wird. Ferner überträgt der Codierungsabschnitt den Vektorcode, der dem ausgewählten prospetiven Parametervektor entspricht. Außerdem berechnet der Decodierungsabschnitt das gewichtete Mittel des prospektiven Parametervektors, der aus dem Parameter-Codebuch in der aktuellen Parameteroperation ausgewählt worden ist und dem übertragenen Vektorcode entspricht, sowie des prospektiven Parametervektors in der vorangegangenen Rahmenoperation und gibt den resultierenden Vektor aus.
- Da gemäß der vorliegenden Erfindung an den jeweiligen Rahmen übertragen wird nur der Code, der einem Parameter- Codebuch zugeordnet ist, bleibt die Menge der übertragenen Information selbst dann klein, wenn die Rahmenlänge verkürzt ist. Außerdem kann die Quantisierungsabweichung reduziert werden, wenn die Kontinuität zum vorangegangenen Rahmen hoch ist. Selbst in dem Fall, in dem Codierungsfehler auftreten, ist die Auswirkung der Codierungsfehler klein, da der prospektive Parametervektor in der aktuellen Rahmenoperation auf einen prospektiven Parametervektor in der vorangegangenen Rahmenoperation abgestimmt wird. Außerdem kann sich die Auswirkung der Codierungsfehler in der aktuellen Rahmenoperation nur bis zu zwei Rahmenoperationen nach vorne erstrecken. Wenn Codierungsfehler unter Verwendung eines redundanten Codes detektiert werden können, wird der Parameter mit Fehlern ausgeschlossen, wobei durch Berechnung des obenbeschriebenen Mittels die Wirkung der Fehler ebenfalls reduziert werden kann.
- Um die dritte Aufgabe zu lösen, schafft die vorliegende Erfindung ein Mehrstufen-Vektorquantisierungsverfahren zum Auswählen des prospektiven Parametervektors aus einem Parameter-Codebuch, so daß die Quantisierungsabweichung zwischen dem prospektiven Parametervektor und einem Eingangsparametervektor minimiert wird, ein Vektorcode übertragen wird, der dem ausgewählten prospektiven Parametervektor entspricht, und wobei das Verfahren in einem Codierungsabschnitt versehen ist mit den Schritten (a) Darstellen des prospektiven Parametervektors durch die Summe der Unterparametervektoren, die jeweils aus den Stufen der Unterparameter-Codebücher ausgewählt worden sind (b) entsprechendes Auswählen der Unterparametervektoren aus den Stufen der Unterparameter-Codebücher, (c) Addieren der ausgewählten Unterparametervektoren, um den prospektiven Parametervektor in der aktuellen Rahmenoperation zu erhalten, (d) Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, (e) Umsetzen des prospektiven Parametervektors unter Verwendung der festen Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, (f) Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß die Quantisierungsabweichung minimiert wird, und (g) Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; und das in einem Decodierungsabschnitt versehen ist mit den Schritten (a) entsprechendes Auswählen der Unterparametervektoren, die dem übertragenen Vektorcode entsprechen, aus den Stufen der Unterparameter-Codebücher, (b) Addieren der ausgewählten Unterparametervektoren, um dem prospektiven Parametervektor in der aktuellen Rahmenoperation zu erhalten, (c) Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, (d) Umsetzen des prospektiven Parametervektors unter Verwendung der festen Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, und (e) Verwenden des umgesetzten prospektiven Parametervektors als endgültigen prospektiven Parametervektor in der aktuellen Rahmenoperation.
- Die vorliegende Erfindung schafft ferner eine Mehrstufen- Vektorquantisierungsvorrichtung zum Auswählen des prospektiven Parametervektors aus einem Parameter-Codebuch, so daß die Quantisierungsabweichung zwischen dem prospektiven Parametervektor und einem Eingangsparametervektor minimiert wird, und zum Senden eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht, wobei die Vorrichtung versehen ist mit dem Parameter-Codebuch, das Stufen von Unterparametercodebüchern umfaßt, in denen die jeweiligen Parametervektoren gespeichert sind, einem Codierungsabschnitt, der einen Vektorquantisierungsabschnitt enthält zum entsprechenden Auswählen der Unterparametervektoren aus den Stufen der Unterparameter- Codebücher, und zum Addieren der ausgewählten Unterparametervektoren, um den prospektiven Parametervektor in der aktuellen Operation zu erhalten, zum Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, zum Umsetzen des prospektiven Parametervektors unter Verwendung der festen Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, zum Auswählen des prospektiven Parametervektors aus dem Parameter-Codebuch, so daß die Quantisierungsabweichung minimiert wird, und zum Übertragen eines Vektorcodes, der dem ausgewählten prospektiven Parametervektor entspricht; sowie einem Decodierungsabschnitt zum wahlweisen Auswählen der Unterparametervektoren, die dem übertragenen Vektorcode entsprechen, aus den Stufen der Unterparameter-Codebücher, zum Addieren der ausgewählten Unterparametervektoren, um den prospektiven Parametervektor in der aktuellen Rahmenoperation zu erhalten, zum Beurteilen, ob der prospektive Parametervektor in der aktuellen Rahmenoperation stabil ist, zum Umsetzen des prospektiven Parametervektors unter Verwendung der festen Regel in einen neuen prospektiven Parametervektor, so daß der prospektive Parametervektor in der aktuellen Rahmenoperation stabil wird, in dem Fall, in dem der prospektive Parametervektor in der aktuellen Rahmenoperation nicht stabil ist, und zum Verwenden des umgesetzten prospektiven Parametervektors als endgültigen prospektiven Parametervektor in der aktuellen Rahmenoperation.
- Gemäß diesem Verfahren und der zugehörigen Vorrichtung wird der Ausgangspunkt von der zweiten Stufe der Mehrstufen-Vektorquantisierung untersucht, um zu ermitteln, ob er der geeignete Ausgangspunkt ist (es wird ermittelt, ob er stabil oder instabil ist). In dem Fall, in dem festgestellt wird, daß ein Ausgangsvektor in dem Bereich liegt, der ursprünglich nicht vorhanden war, wird dieser Vektor unter Verwendung der festen Regel in einen neuen Ausgangsvektor in dem Bereich umgesetzt, der immer vorhanden war, und wird anschließend quantisiert. Auf diese Weise werden nicht ausgewählte Kombinationen von Codes beseitigt, wobei die Quantisierungsabweichung reduziert werden kann.
- Gemäß der vorliegenden Erfindung werden außerdem instabile, nutzlose Ausgangsvektoren, die nach der ersten Stufe der Mehrstufen-Vektorquantisierung auftreten, unter Verwendung der festen Regel in wirksame Ausgangsvektoren umgesetzt, die anschließend verwendet werden können. Als Ergebnis können Vorteile erhalten werden, wie z. B. eine größere Reduktion der Quantisierungsabweichung der Informationen von einem Äquivalenzmaß im Vergleich zu den herkömmlichen Verfahren.
- Fig. 1(A) ist ein Blockschaltbild, das einen Teil einer Konstruktion einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
- Fig. 1(B) ist ein Blockschaltbild, das einen Teil einer Konstruktion einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
- Fig. 2 ist ein Blockschaltbild, das einen ersten Aufbau eines Vektorquantisierungsabschnitts zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
- Fig. 3 ist ein Referenzschaubild zur Verwendung bei der Erläuterung eines ersten Beispiels eines Vektorquantisierungsverfahrens, das auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
- Fig. 4 ist ein Referenzschaubild zur Verwendung bei der Erläuterung eines zweiten Beispiels eines Vektorquantisierungsverfahrens, das auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
- Fig. 5 ist ein Blockschaltbild, das einen zweiten Aufbau eines Vektorquantisierungsverfahrens zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
- Fig. 6 ist ein Blockschaltbild, das einen dritten Aufbau eines Vektorquantisierungsverfahrens zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
- Fig. 7 zeigt ein Beispiel eines Aufbaus des LSP-Codebuches 37.
- Fig. 8 ist ein Flußdiagramm zur Verwendung bei der Erläuterung eines Mehrstufen-Vektorquantisierungsverfahrens gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung.
- Fig. 9 zeigt die Umsetzung eines rekonstruierten Vektors gemäß der in Fig. 8 gezeigten bevorzugten Ausführungsform.
- Fig. 10 ist ein Blockschaltbild, das einen vierten Aufbau eines Vektorquantisierungsabschnitts zeigt, der auf ein Parametercodierungsverfahren gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angewendet wird.
- Fig. 11 zeigt ein Beispiel eines Aufbaus eines Vektorquantisierungs-Verstärkungsfaktor-Suchabschnitts 65.
- Fig. 12 zeigt ein Beispiel der Geräuschabstand-Kennlinie, die über dem Übertragungsleitungs-Fehlerprozentsatz in einer Sprachcodierungsvorrichtung des Standes der Technik angetragen ist, sowie eine entsprechende Kennlinie gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung.
- Fig. 13 zeigt ein Beispiel eines Aufbaus eines Vektorquantisierungs-Codebuches 31.
- Fig. 14 zeigt ein Beispiel von Meinungswerten von decodierter Sprache, die über unterschiedlichen Bewertungsbedingungen in einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung angetragen sind.
- Fig. 15 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches CELP-Codierungsverfahren verwendet.
- Fig. 16 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches VSELP-Codierungsverfahren verwendet.
- Fig. 17 ist ein Blockschaltbild, das ein Konstruktionsbeispiel einer Sprachcodierungsvorrichtung zeigt, die ein herkömmliches LD-CELP-Codierungsverfahren verwendet.
- Fig. 18 ist ein Blockschaltbild, das ein Konstruktionsbeispiel eines herkömmlichen Vektorquantisierungsabschnitts zeigt.
- Fig. 19 zeigt den Existenzbereich eines zweidimensionalen LSP-Parameters entsprechend einem herkömmlichen Mehrstufen-Vektorquantisierungsverfahren.
- Fig. 20 ist ein Flußdiagramm zur Verwendung bei der Erläuterung eines herkömmlichen Mehrstufen-Vektorquantisierungsverfahrens.
- Fig. 21 zeigt einen rekonstruierten Vektor einer ersten Stufe in dem Fall, in dem die in Fig. 19 gezeigte Vektorquantisierung der LSP-Parameter durchgeführt wird.
- Fig. 22 zeigt einen Vektor, zu dem ein rekonstruierter Vektor einer zweiten Stufe addiert worden ist, in dem Fall, in dem die in Fig. 19 gezeigte Vektorquantisierung der LSP-Parameter durchgeführt wird.
- Im folgenden wird mit Bezug auf die Figuren eine genaue Beschreibung der bevorzugten Ausführungsformen gegeben. Die Fig. 1(A) und (B) sind Blockschaltbilder, die eine Konstruktion einer Sprachcodierungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung zeigen. Im folgenden wird mit Bezug auf die Fig. 1(A) und 1(B) eine Übersicht eines Sprachcodierungsverfahrens erläutert. Die Eingangssprachdaten, die durch Abtasten des analogen Sprachsignals mit einer Abtastfrequenz von 8 kHz erzeugt werden, werden von einem Eingangsanschluß 21 eingegeben. Anschließend werden 80 Abtastwerte als ein Rahmen in einem Vektor erhalten und als Eingangssprachvektor in einem Puffer 22 gespeichert. Der Rahmen wird anschließend weiter in zwei Unterrahmen zerlegt, die jeweils eine Einheit von 40 Abtastwerten umfassen. Alle nachfolgenden Prozesse werden in Rahmeneinheiten oder Unterrahmeneinheiten durchgeführt.
- In einem weichen Begrenzungsabschnitt 23, wird die Größe des vom Puffer 22 ausgegebenen Eingangssprachvektors unter Verwendung einer Rahmeneinheit geprüft, wobei in dem Fall, in dem der Absolutwert der Größe des Eingangssprachvektors größer ist als ein vorgegebener Schwellenwert, eine Kompression durchgeführt wird. Anschließend wird in einem LPC-Analyseabschnitt 24 eine lineare Prädiktionsanalyse durchgeführt, wobei die LPC-Koeffizienten für die Eingangssprachdaten der mehreren Abtastwerte, die vom weichen Begrenzungsabschnitt 23 ausgegeben worden sind, berechnet werden. Anschließend werden in einem LSP- Koeffizientenquantisierungsabschnitt 25 die LPC-Koeffizienten quantisiert und anschließend in ein Synthesefilter 26 eingesetzt.
- Ein Schrittweitenvektor und ein Rauschsignalformvektor, die von einem Abweichungsgrad-Berechnungsabschnitt 35 ausgewählt worden sind, werden aus einem Adaptivcodebuch- Suchabschnitt 27 bzw. einem Zufallscodebuch-Suchabschnitt 28 ausgegeben, wobei der Rauschsignalformvektor anschließend in einem Vorhersageverstärkungsfaktorabschnitt 30 mit dem vorhergesagten Verstärkungsfaktor multipliziert wird, der von einem Verstärkungsfaktor-Anpassungsabschnitt 29 gesetzt worden ist.
- Im Verstärkungsfaktor-Anpassungsabschnitt 29 wird die lineare Prädiktionsanalyse auf der Grundlage des Grades des Ausgangsvektors von einem Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 in der aktuellen Rahmenoperation und des gespeicherten Grades des Ausgangsvektors der Zufallscodebuchkomponente des Vektorquantisierungs-Verstärkungsfaktorcodebuches 31, der in der vorangegangenen Rahmenoperation verwendet worden ist, durchgeführt. Der Grad (d. h. der vorhergesagte Verstärkungsfaktor), der mit dem Rauschsignalformvektor zu multiplizieren ist, der in der nachfolgenden Rahmenoperation ausgewählt wird, wird anschließend berechnet, ermittelt und in den Vorhersageverstärkungsabschnitt 30 eingesetzt.
- Anschließend werden im Abweichungsgrad-Berechnungsabschnittsabschnitt 35 der ausgewählte Schrittweitenvektor und der Ausgangsvektor des Vorhersageverstärkungsfaktorabschnitts 30 ermittelt, multipliziert, in den Unterverstärkungsfaktor-Codebüchern 31a und 31b des Vektorquantisierungs-Verstärkungsfaktorcodebuches 31 mit den Verstärkungsfaktoren multipliziert, die von diesen Unterverstärkungsfaktorcodebüchern 31a und 31b ausgegeben werden, und anschließend ausgegeben. Auf diese Weise werden die Ausgangsvektoren der Unterverstärkungsfaktorcodebücher 31a und 31b in einem Addierer 32 addiert, wobei der resultierende Ausgangsvektor des Addierers 32 als Erregungsvektor dem Synthesefilter 26 zugeführt wird. Anschließend wird im Synthesefilter 26 der synthetische Sprachvektor synthetisiert.
- Als nächstes wird in einem Subtrahierer 33 der synthetische Sprachvektor vom Eingangssprachvektor subtrahiert, wobei die Abweichungsdaten berechnet werden. Nachdem diese Abweichungsdaten in einem perzeptualen Gewichtungsfilter 34 entsprechend den Koeffizienten gewichtet worden sind, die den menschlichen perzeptualen Kennlinien entsprechen, wird der Grad der Abweichungsdaten, die vom perzeptualen Gewichtungsfilter 34 ausgegeben werden, im Abweichungsgrad-Berechnungsabschnittsabschnitt 35 berechnet. Anschließend werden der Schrittweitenvektor und der Rauschsignalformvektor, die den obenerwähnten Grad der Abweichungsdaten minimieren, entsprechend aus dem Adaptivcodebuch-Suchabschnitt 27 und dem Rauschcodebuch- Suchabschnitt 28 ausgewählt, woraufhin die Verstärkungsfaktoren der Unterverstärkungsfaktorcodebücher 31a und 31b zugewiesen werden. Auf diese Weise werden in einem Codeausgabeabschnitt 36 die entsprechenden Codes und Verstärkungsfaktoren, die in Abhängigkeit von den LPC-Koeffizienten ausgewählt worden sind, der Schrittweitenvektor und der Rauschsignalformvektor in Codes aus Bitserien umgesetzt und, falls nötig, Fehlerkorrekturcodes hinzugeführt, woraufhin diese übertragen werden. Um den Prozeß für den nachfolgenden Rahmen in der Codierungsvorrichtung der vorliegenden Erfindung vorzubereiten, verwendet der lokale Decodierungsabschnitt LDEC außerdem dieselben Daten, die von der jeweiligen in Fig. 1 gezeigten Strukturkomponente ausgegeben und zur Decodierungsvorrichtung übertragen werden, und synthetisiert einen Sprachdecodierungsvektor.
- Im folgenden werden die Operationen des LSP-Koeffizientenquantisierungsabschnitts 25 genauer erläutert. Im LPC- Koeffizientenquantisierungsabschnitt 25 werden die im LPC-Analyseabschnitt 24 erhaltenen LPC-Koeffizienten zuerst in LSF-Parameter umgesetzt, quantisiert und anschließend diese quantisierten LSP-Parameter zurück in LPC-Koeffizienten umgesetzt. Die LPC-Koeffizienten, die mittels dieser Serie von Prozessen erhalten werden, sind daher quantisiert; die LPC-Koeffizienten können z. B. unter Verwendung des Newton-Raphson-Verfahrens in LSP-Parameter umgesetzt werden. Da eine kurze Rahmenlänge von 10 ms und eine hohe Korrelation zwischen den jeweiligen Rahmen vorliegt, wird durch Verwenden dieser Eigenschaften eine Quantisierung der LSP-Parameter unter Verwendung eines Vektorquantisierungsverfahrens durchgeführt. In der vorliegenden Erfindung sind die LSP-Parameter durch einen gewichteten Mittelwertsvektor dargestellt, der aus mehreren Vektoren früherer und aktueller Rahmen berechnet wird. Bei den herkömmlichen Differentialcodierungs- und Prädiktionscodierungsverfahren werden die Ausgangsvektoren in der vergangenen Rahmenoperation ohne Veränderung verwendet; in der vorliegenden Erfindung werden jedoch von den Vektoren, die durch Berechnen des gewichteten Mittels gebildet werden, nur diejenigen Vektoren verwendet, die in der unmittelbar vorangehenden Rahmenoperation aktualisiert worden sind. Ferner werden in der vorliegenden Erfindung von den Vektoren, die durch Berechnen des gewichteten Mittels gebildet worden sind, nur diejenigen Vektoren verwendet, die von Codierungsfehlern unbeeinflußt sind, sowie diejenigen Vektoren, bei denen Codierungsfehler detektiert worden sind und die umgesetzt worden sind. Außerdem ist die vorliegende Erfindung ferner dadurch gekennzeichnet, daß das Verhältnis des gewichteten Mittels entweder ausgewählt oder gesteuert wird.
- Fig. 2 zeigt eine erste Konstruktion eines Vektorquantisierungsabschnitts, der im LPC-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. Ein LSP-Codevektor Vk-1 (k ist die Rahmennummer), der aus einem LSP-Codebuch 37 in der Rahmenoperation erzeugt worden ist, die der aktuellen Rahmenoperation unmittelbar voranging, wird in einem Multiplizierer 38 mit einem Multiplikationskoeffizienten (1 - g) multipliziert und anschließend einem Eingangsanschluß eines Addierers 39 zugeführt. Eine Marke g stellt eine Konstante dar, die durch das Verhältnis des gewichteten Mittels bestimmt ist.
- Ein LSP-Codevektor Vk, der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugt worden ist, wird jedem Eingangsanschluß eines Übertragungsschalters 40 zugeführt. Dieser Übertragungsschalter 40 wird als Antwort auf das Abweichungsberechnungsergebnis von einem Abweichungsberechnungsabschnitt 41 aktiviert. Der ausgewählte LSP-Codevektor Vk wird zuerst in einem Multiplizierer 42 mit dem Multiplikationskoeffizienten g multipliziert und anschließend dem anderen Eingangsanschluß des Addierers 39 zugeführt. Auf diese Weise werden die Ausgangsvektoren der Multiplizierer 38 und 42 im Addierer 39 summiert, woraufhin der quantisierte LSP-Parametervektor Ωk der Rahmennummer k ausgegeben wird. Genauer kann dieser LSP- Parametervektor Ωk durch die folgende Formel (3) ausgedrückt werden.
- Ωk = (1 - g)Vk-1 + gVk (3)
- Anschließend werden im Abweichungsberechnungsabschnitt 41 die Abweichungsdaten zwischen einem LSP-Parametervektor Ψk der Rahmennummer k vor der Quantisierung und der LSP- Parametervektor Ωk der Rahmennummer k nach der Quantisierung berechnet, wobei der Übertragungsschalter 40 so aktiviert ist, daß diese Abweichungsdaten minimiert werden. Auf diese Weise wird der Code für den LSP-Codevektor Vk, der von der Abweichungsberechnungsvorrichtung 41 ausgewählt worden ist, als Code S&sub1; ausgegeben. Ferner wird der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugte LSP-Codevektor Vk in der nachfolgenden Rahmenoperation als LSP-Codevektor Vk-1 verwendet, der vom LSP-Codebuch 37 in der vorangegangenen Rahmenoperation erzeugt worden ist.
- Im folgenden wird mit Bezug auf Fig. 3 ein LSP-Parametervektorquantisierungsverfahren erläutert, das die zwei LSP-Codevektoren verwendet, die jeweils von zwei LSP- Codebüchern in den zwei Rahmenoperationen erzeugt worden sind, die der aktuellen Rahmenoperation vorausgehen. Bei diesem Verfahren werden drei Typen von Codebüchern 37, 43 und 44 entsprechend der Rahmennummer verwendet. Der quantisierte LSP-Parametervektor Ωk kann unter Verwendung eines Mittels der drei Vektoren in den Rahmen in der folgenden Formel (4) berechnet werden.
- Ωk = Vk-2 + Vk-1 + Vk/3 (4)
- Ein LSP-Codevektor Vk-2 stellt den LSP-Codevektor dar, der vom LSP-Codebuch 43 in den zwei Rahmenoperationen vor der aktuellen Rahmenoperation erzeugt worden ist, während ein LSP-Codevektor Vk-1 den LSP-Codevektor darstellt, der vom LSP-Codebuch 44 in der Rahmenoperation erzeugt worden ist, die der aktuellen Rahmenoperation unmittelbar vorausgeht. Als LSP-Codevektor Vk in der Operation des Rahmens k wird aus dem LSP-Codebuch 37 ein LSP-Codevektor ausgewählt, der die Abweichungsdaten zwischen dem LSP-Parametervektor Ψk der Rahmennummer k vor der Quantisierung und dem LSP-Parametervektor Ωk der Rahmennummer k (des k-ten Rahmens) nach der Quantisierung minimiert. Der Code, der dem ausgewählten LSP-Codevektor Vk entspricht, wird anschließend als Code S1 ausgegeben. Der LSP-Codevektor Vk-1 kann ferner in der nachfolgenden Rahmenoperation verwendet werden, wobei in ähnlicher Weise der LSP- Codevektor Vk in den nächsten beiden Rahmenoperationen verwendet werden kann. Obwohl der LSP-Codevektor Vk in der k-ten Rahmenoperation ermittelt werden kann, kann außerdem dann, wenn diese Entscheidung verzögert werden kann, die Quantisierungsabweichung reduziert werden, wenn diese Entscheidung bezüglich der LSP-Parametervektoren Ωk+1 und Ωk+2, die im nachfolgenden Rahmen und zwei Rahmenoperationen später erscheinen, verzögert wird.
- Ein weiteres Beispiel eines LSP-Parametervektorquantisierungsverfahrens, das die zwei LSP-Codierungsvektoren verwendet, die jeweils von zwei LSP-Codebüchern in den zwei Rahmenoperationen erzeugt worden sind, die der aktuellen Rahmenoperation vorausgehen, wird im folgenden mit Bezug auf Fig. 4 erläutert. Dieses Vektorquantisierungsverfahren ist dem in Fig. 3 gezeigten Vektorquantisierungsverfahren ähnlich, jedoch wird der quantisierte LSP-Parametervektor Ωk der Rahmennummer k unter Verwendung der folgenden Formel (5) ausgedrückt.
- Ωk = Vk-2 + Vk-1 + Vk + Uk/4 (5)
- In diesem Fall werden die LSP-Codierungsvektoren Vk und Uk in der k-ten Rahmenoperation ermittelt, woraufhin deren Codes übertragen werden. Der LSP-Codevektor Uk ist der Ausgangsvektor eines zusätzlichen LSP-Codebuches.
- In den in den Fig. 3 und 4 gezeigten Beispielen sind ferner die Codebücher 37, 43 und 44 separat dargestellt; es ist jedoch auch möglich, diese Codebücher zu einem gemeinsamen Codebuch zu kombinieren. Bei den in den Fig. 2 bis 4 gezeigten Vektorquantisierungsverfahren ist außerdem der ideale LSP-Parametervektor Ψk im voraus vorgegeben, wobei ein Verfahren verwendet wird, das den LSP-Parametervektor Ωk ermittelt, der unter Verwendung des in den Parameterdimensionen berechneten Mittels quantisiert worden ist. In bezug auf die LSP-Parameter gibt es jedoch ein Verfahren zum Ermitteln der LSP-Parameter des aktuellen Rahmens durch mehrmaliges Analysieren der Abweichungsdaten, die von einem Inversionsfilter ausgegeben werden, in den die in einer vorangegangenen Rahmenoperation ermittelten LSP-Parameter eingesetzt werden. Außerdem wird im Parametermittelwertberechnungsverfahren das aus den Koeffizienten der Polynomausdrücke der einzelnen Synthesefilter berechnete Mittel zu den endgültigen Synthesefilterkoeffizienten. Im Fall der Verfahren, die der Mehrfachanalyse folgen, wird das Produkt der Terme der einzelnen Polynomterme zum endgültigen Synthesefilter-Polynomterm.
- Im folgenden wird ein Vektorquantisierungsverfahren erläutert, bei dem Erhöhungen der Abweichung insbesondere durch Codierungsfehler, die auf der Übertragungsleitung auftreten, unterdrückt werden können. Bei diesem Vektorquantisierungsverfahren wird der LSP-Codevektor so gewählt, daß die Abweichungsdaten zwischen einem erwarteten Wert Ω*k im lokalen Decodierungsabschnitt LDEC in bezug auf eine Codierungsfehlerrate anstelle des Ausgangsvektors, des LSP-Parametervektors Ωk in Fig. 2, und dem Eingangsvektor, dem LSP-Parametervektor Ψk, minimiert werden. Dieser erwartete Wert Ω*k kann unter Verwendung der folgenden Formel (6) geschätzt werden.
- Ω*k = (1 - mε)Ωk + ΣεΩe (6)
- In der Formel (6) stellt 8 die Codierungsfehlerrate auf der Übertragungsleitung dar (eine 1-Bit-Fehlerrate), während m die Übertragungsbitzahl je Vektor darstellt. Außerdem stellt in der Formel (6) Ωe die m Typen von Vektoren dar, die in dem Fall ausgegeben werden, in dem ein Fehler in nur einem Bit von m Teilen des Übertragungsleitungscodes, der dem LSP-Parametervektor Ωk entspricht, auftritt, wobei ein zweiter Term auf der rechten Seite der Gleichung die Summe aus diesen m Typen von Vektoren Ωe darstellt.
- In Fig. 5 ist eine zweite Konstruktion eines Vektorquantisierungsabschnitts gezeigt, der im LPC-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. In dieser Fig. 5 behalten die Komponenten, die den in Fig. 2 gezeigten Komponenten entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. In diesem Vektorquantisierungsabschnitt ist eine Konstante g, die vom Verhältnis des gewichteten Mittels bestimmt wird, nicht fest, vielmehr wird entsprechend dem jeweiligen LSP-Code Vk, der im LSP-Codebuch 37 gespeichert ist, eine Verhältniskonstante gk zugewiesen. In Fig. 5 wird der jeweilige LSP-Codevektor Vk, der vom LSP-Codebuch 37 ausgegeben worden ist, mit dem geeigneten Multiplikationskoeffizienten g&sub1;, g&sub2;, ..., gn-1, gn in den Multiplizieren 45&sub1;, 45&sub2;, ..., 45n-1, 45n multipliziert, in die die jeweilige individuelle Verhäitniskonstante gk (k = 0, 1, ..., n) eingesetzt worden ist, und wird anschließend allen Eingangsanschlüsse des Übertragungsschalters 46 zugeführt.
- Der Abweichungsberechnungsabschnitt 41 ist 50 konstruiert, daß der LSP-Codevektor Vk, der die Abweichungsdaten zwischen dem quantisierten LSP-Parametervektor Ωk, der vom Addierer 39 ausgegeben wird, und dem LSP-Parametervektor Ψk vor der Quantisierung minimiert, durch Übertragen des Übertragungsschalters 46 ausgewählt wird, wobei der entsprechende Multiplikationskoeffizient gk ausgewählt wird. Außerdem ist der obenerwähnte Aufbau so beschaffen, daß das Verhältnis (1 - gk), das dem Multiplizierer 47 zugeführt wird, gesperrt ist und mittels des Übertragungsschalters 46 geändert wird.
- Auf diese Weise kann der quantisierte LSP-Parametervektor Ωk unter Verwendung der folgenden Formel (7) ausgedrückt werden.
- Ωk = (1 - gk)Vk-1 + gkVk (7)
- In der Formel (7) ist der Multiplikationskoeffizient gk ein Skalarwert, der dem LSP-Codevektor Vk entspricht; es ist jedoch auch möglich, mehrere der LSP-Codevektoren zu einer Gruppe zusammenzufassen, wobei dieser Skalarwert jedem dieser Typen von Gruppen entspricht. Außerdem ist es möglich, in der umgekehrten Weise vorzugehen, indem an jeder Komponente des LSP-Codevektors der Multiplikationskoeffizient eingesetzt wird. In jedem Fall ist der LSP- Codevektor Vk-1, der vom LSP-Codebuch 37 in der vorangegangenen Rahmenoperation erzeugt worden ist, gegeben, wobei die am besten geeignete Kombination aus dem Verhältnis gk, das das Verhältnis des gewichteten Mittels zwischen dem LSP-Codevektor Vk, der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugt worden ist, und dem LSP-Codevektor Vk-1, der aus dem LSP-Codebuch 44 in der vorangegangenen Rahmenoperation erzeugt worden ist, darstellt, und den LSP-Codevektor Vk ausgewählt werden, um die Abweichungsdaten zwischen dem quantisierten LSP-Parametervektor Ωk und dem LSP-Parametervektor Ψk vor der Quantisierung zu minimieren.
- Fig. 6 zeigt einen dritten Aufbau eines Vektorquantisierungsabschnitts, der im LSP-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. In dieser Fig. 6 behalten die Komponenten, die denjenigen der Fig. 2 entsprechen, ihre ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. Der in Fig. 6 gezeigte Vektorquantisierungsabschnitt ist dadurch gekennzeichnet, daß der Verhältniswert mehrerer unterschiedlicher Typen von gewichteten Mitteln unabhängig von den LSP-Codevektoren gesetzt wird. Der LSP-Codevektor Vk-1, der vom LSP- Codebuch 37 in der Rahmenoperation unmittelbar vor der aktuellen Rahmenoperation erzeugt worden ist, wird in den Multiplizierern 47 und 48 mit den Multipiikationskoeffizienten (1 - g&sub1;) bzw. (1 - g&sub2;) multipliziert und anschließend den Eingangsanschlüssen Ta und Tb eines Übertragungsschalters 49 zugeführt. Der Übertragungsschalter 49 wird als Antwort auf die Abweichungsberechnung aktiviert, die sich aus dem Abweichungsberechnungsabschnitt 41 ergibt, woraufhin der Ausgangsvektor von einem der Multiplizierer 47 oder 48 ausgewählt wird und über einen gemeinsamen Anschluß Tc einem der Eingangsanschlüsse des Addierers 39 zugeführt wird. Andererseits wird der LSP- Codevektor Vk, der vom LSP-Codebuch 37 in der aktuellen Rahmenoperation erzeugt worden ist, jedem Eingangsanschluß des Übertragungsschalters 40 zugeführt. Der Übertragungsschalter 40 wird auf dieselbe Weise wie der Übertragungsschalter 49 als Antwort auf das Abweichungsberechnungsergebnis von der Abweichungsberechnungsvorrichtung 41 aktiviert. Auf diese Weise wird der ausgewählte LSP-Codevektor Vk in den Multiplizierern 50 und 51 mit den Multiplikationskoeffizienten g&sub1; bzw. g&sub2; multipliziert und anschließend den Eingangsanschlüssen Ta und Tb eines Übertragungsschalters 52 zugeführt. Der Übertragungsschalter 52 wird auf dieselbe Weise wie die Übertragungsschalter 40 und 49 als Antwort auf das Abweichungsberechnungsergebnis von der Abweichungsberechnungsvorrichtung 41 aktiviert, wobei der Ausgangsvektor entweder vom Multiplizierer 50 oder 51 ausgewählt wird und über den gemeinsamen Anschluß Tc einem Eingangsanschluß des Addierers 39 zugeführt wird.
- Auf diese Weise werden die Ausgangsvektoren der Übertragungsschalter 49 und 52 im Addierer 39 summiert, woraufhin der quantisierte LSP-Parametervektor Ωk der Rahmennummer k ausgegeben wird. Genauer kann dieser LSP-Parametervektor Ωk durch die folgende Formel (8) ausgedrückt werden. In der Formel (8) ist m gleich 1 oder 2.
- Ωk = (1 - gm)Vk-1 + gmVk (8)
- Anschließend werden im Abweichungsberechnungsabschnitt 41 die Abweichungsdaten zwischen dem LSP-Parametervektor Ωk der Rahmennummer k vor der Quantisierung und dem LSP-Parametervektor Ωk der Rahmennummer k nach der Quantisierung berechnet, wobei die Übertragungsschalter 49 und 52 so aktiviert werden, daß diese Abweichungsdaten minimiert werden. Als Folge hiervon werden vom t 41 als Code S1 der Code des ausgewählten LSP-Codevektors Vk und die Auswahlinformation S2, die anzeigt, welcher Ausgangsvektor der jeweiligen Multiplizierer 47 und 48 bzw. 50 und 51 verwendet wird, ausgegeben.
- Um die Speicherkapazität des LSP-Codebuches 37 zu verringern, wird ferner der LSP-Codevektor Vk ausgedrückt als Summe zweier Vektoren. Wie z. B. in Fig. 7 gezeigt, wird das LSP-Codebuch 37 aus einem ersten Stufen-LSP-Codebuch 37a, in dem zehn Vektoren E&sub1; gespeichert worden sind, und einem zweiten Stufen-LSP-Codebuch 37b1 gebildet, das zwei separate LSP-Codebücher enthält, ein zweites Stufen-LSP- Codebuch niedriger Ordnung 37b1 und ein zweites Stufen- LSP-Codebuch hoher Ordnung 37b2, die jeweils fünf Vektoren speichern. Der LSP-Codevektor Vk kann unter Verwendung der folgenden Formeln (9) und (10) ausgedrückt werden.
- Wenn f < 5, Vk = E1n + EL2f (9)
- Wenn f ³ 5, Vk = E1n + EH2f (10)
- In den Formeln (9) und (10) ist E1n ein Ausgangsvektor des ersten Stufen-LSP-Codebuches 25a, wobei n von 1 bis 128 läuft. Mit anderen Worten, im ersten Stufen-LSP-Codebuch 25a sind 128 Ausgangsvektoren E&sub1; gespeichert. Außerdem ist EL2f ein Ausgangsvektor des zweiten Stufen-LSP- Codebuches niedriger Ordnung 37b1, während EH2f ein Ausgangsvektor des zweiten Stufen-LSP-Codebuches hoher Ordnung 37b2 ist.
- Das (in den Figuren nicht gezeigte) Vektorquantisierungsverfahren, das in diesem Vektorquantisierungsabschnitt verwendet wird, reduziert die Auswirkungen von Codierungsfehlern in dem Fall, in dem diese Fehler im Decodierungsabschnitt detektiert werden. Ahnlich dem in Fig. 2 gezeigten Vektorquantisierungsabschnitt berechnet dieses Verfahren im Codierungsabschnitt den LSP-Vektor Vk, der die Abweichungsdaten minimiert. In dem Fall, in dem die Codierungsfehler detektiert werden oder entweder im Decodierungsabschnitt im LSP-Codevektor Vk-1 in der vorangehenden Rahmenoperation oder nur im Decodierungsabschnitt im LSP-Codevektor Vk in der aktuellen Rahmenoperation sehr wahrscheinlich sind, berechnet dieses Verfahren einen Ausgangsvektor, indem es das Verhältnis des gewichteten Mittels der LSP-Vektoren reduziert, die die Fehler enthalten.
- In dieser Variation wird z. B. in dem Fall, in dem ein Übertragungsleitungsfehler in der Rahmenoperation detektiert wird, die der aktuellen Rahmenoperation unmittelbar vorausgeht, die Information vom vorausgehenden Rahmen vollständig verworfen, wobei der quantisierte LSP-Parametervektor Ωk durch die folgende Formel (11) ausgedrückt wird.
- Ωk = Vk (11)
- Alternativ kann der LSP-Parametervektor Ωk durch die folgende Formel (12) ausgedrückt werden, um die Auswirkungen der Übertragungsleitungsfehler vom vorangegangenen Rahmen zu reduzieren.
- Im folgenden werden mit Bezug auf das in Fig. 8 gezeigte Flußdiagramm die Prozeduren des in Fig. 6 gezeigten Vektorquantisierungsabschnitts erläutert. Im Schritt SB1 wählt der Abweichungsberechnungsabschnitt 41 mehrere Ausgangsvektoren E1n ähnlich dem LSP-Parametervektor Ψk vom ersten Stufen-LSP-Codebuch 37a aus, indem er den Übertragungsschalter 40 geeignet aktiviert. Im anschließenden Schritt SB2 addiert der Abweichungsberechnungsabschnitt 41 entsprechend zu jedem der ausgewählten Ausgangsvektoren E1n hoher und niedriger Ordnung die Ausgangsvektoren EL2f und EH2f, die jeweils vom zweiten Stufen-LSP-Codebuch niedriger Ordnung 37b1 und vom zweiten Stufen-LSP-Codebuch hoher Ordnung 37b2 des zweiten Stufencodebuches 37b ausgewählt worden sind, und erzeugt den LSP-Codevektor Vk. Das System rückt anschließend zum Schritt 583 vor.
- Im Schritt 583 beurteilt der Abweichungsberechnungsabschnitt 41, ob der im Schritt SB2 erhaltene LSP-Codevektor Vk stabil ist. Diese Beurteilung wird durchgeführt, um das Synthesefilter 26 (siehe Fig. 1), in das der obenerwähnte LSP-Codevektor Vk eingesetzt wird, zu stabilisieren und zu aktivieren. Um somit das Synthesefilter 26 zu stabilisieren und zu aktivieren, müssen die Werte der LSP-Parameter ω&sub1; bis ωp die die Anzahl p der LSP-Codevektoren Vk bilden, die in der obenerwähnten Formel (2) gezeigte Beziehung erfüllen.
- Wenn eine instabile Situation vorhanden ist (siehe Code P in Fig. 9), da die Werte der LSF-Parameter ω&sub1; bis ωp nicht die in Formel (2) gezeigte Beziehung erfüllen, setzt der Abweichungsberechnungsabschnitt 41 den Ausgangsvektor P in einen neuen Ausgangsvektor P1 um, der bezüglich der in Fig. 9 gezeigten gestrichelten Linie L1 symmetrisch ist, um eine stabile Situation zu erreichen.
- Anschließend wird der LSP-Codevektor Vk, der entweder stabil ist oder zur Stabilisierung umgesetzt worden ist, entsprechend in den Multiplizierern 50 und 51 mit den Multiplikationskoeffizienten g&sub1; und g&sub2; multipliziert. Der Ausgangsvektor entweder des Multiplizierers 50 oder 51 wird anschließend über den Übertragungsschalter 52 dem anderen Eingangsanschluß des Addierers 39 zugeführt. Andererseits wird der LSP-Codevektor Vk-1, der vom LSP- Codebuch 37 in der Rahmenoperation unmittelbar vor der aktuellen Rahmenoperation erzeugt worden ist, in den Multiplizierern 47 und 48 mit den Multiplikationskoeffizienten (1 - g&sub1;) bzw. (1 - g&sub2;) multipliziert, woraufhin der Ausgangsvektor entweder des Multiplizierers 47 oder 48 über den Übertragungsschalter 49 einem Eingangsanschluß des Addierers 39 zugeführt wird. Auf diese Weise wird im Addierer 39 das gewichtete Mittel der Ausgangsvektoren der Übertragungsschalter 49 und 52 berechnet, wobei der LSP-Parametervektor Ωk ausgegeben wird.
- Im Schritt SB4 berechnet die Abweichungsberechnungsvorrichtung 41 die Abweichungsdaten zwischen dem LSP-Parametervektor Ψk und dem LSP-Parametervektor Ωk, woraufhin der Prozeß zum Schritt SB5 vorrückt Im Schritt SB5 beurteilt der Abweichungsberechnungsabschnitt 41, ob die im Schritt SB4 berechneten Abweichungsdaten minimal sind. In dem Fall, in dem die Beurteilung "NEIN" ergibt, aktiviert der Abweichungsberechnungsabschnitt 41 einen der Übertragungsschalter 49 oder 51, woraufhin der Prozeß zum Schritt SB2 zurückkehrt. Die obenerwähnten Schritte SB2 bis SB5 werden anschließend in bezug auf mehrere der Ausgangsvektoren E1n wiederholt, die im Schritt SB1 ausgewählt worden sind. Wenn die im Schritt SB4 berechneten Abweichungsdaten ein Minimum erreichen, ergibt die Beurteilung im Schritt SB5 "JA", woraufhin als Ergebnis der Abweichungsberechnungsabschnitt 51 den LSP-Codevektor Vk ermittelt, diesen Code als Code S&sub1; ausgibt, die Auswahlinformation S&sub2; ausgibt und diese entsprechend zum Decodierungsabschnitt im Vektorquantisierungsabschnitt überträgt. Der Decodierungsabschnitt umfaßt das LSP-Codebuch 37 und die Übertragungsschalter 40, 49 und 52, die in Fig. 6 gezeigt sind.
- Nach dem Vorrücken zu Schritt SB6 aktiviert der Decodierungsabschnitt den Übertragungsschalter 40 auf der Grundlage des übertragenen Codes S&sub1; und wählt den Ausgangsvektor E1n aus dem ersten Stufencodebuch 37a. Der Prozeß rückt anschließend zum Schritt SB7 vor. Im Schritt SB7 aktiviert der Decodierungsabschnitt den Übertragungsschalter 40 auf der Grundlage der übertragenen Auswahlinformation S&sub2;, um entsprechend die Ausgangsvektoren EL2f und EH2f aus dem zweiten Stufen-LSP-Codebuch niedriger Ordnung 37b1 und dem zweiten Stufen-LSP-Codebuch hoher Ordnung 37b2 des zweiten Stufencodebuches 37b auszuwählen, addiert diese jeweils zu den ausgewählten Ausgangsvektoren E1n hoher und niedriger Ordnung und erzeugt somit den LSP-Codevektor Vk. Das System rückt anschließend zum Schritt SB8 vor. Im Schritt SB8 beurteilt der Decodierungsabschnitt, ob der im Schritt SB7 erhaltene LSP- Codevektor Vk stabil ist. Wenn der Decodierungsabschnitt feststellt, daß der LSP-Vektor Vk instabil ist, wie im obigen Schritt SB3, setzt er den Ausgangsvektor P in einen neuen Ausgangsvektor P1 um, der bezüglich der in Fig. 9 gezeigten gestrichelten Linie L1 symmetrisch ist, um eine stabile Situation zu erreichen. Auf diese Weise kann der LSP-Codevektor Vk, der entweder stabil ist oder zur Stabilisierung umgesetzt worden ist, in der nachfolgenden Rahmenoperation als LSP-Codevektor Vk-1 verwendet werden.
- Das in Fig. 6 gezeigte Mehrstufen-Vektorquantisierungsverfahren ist dadurch gekennzeichnet, daß dann, wenn die Ausgangsvektoren EL2f und EH2f entsprechend aus dem zweiten Stufen-LSP-Codebuch niedriger Ordnung 37b1 und dem zweiten Stufen-LSP-Codebuch hoher Ordnung 37b2 des zweiten Stufencodebuches 37b ausgewählt worden sind, summiert werden, in dem Fall, in dem ein instabiler Ausgangsvektor vorliegt, die Ausgangsposition verschoben wird, wobei der Ausgangsvektor P in den Ausgangsvektor P1 umgesetzt wird, der bezüglich der in Fig. 9 gezeigten gestrichelten Linie L1 symmetrisch liegt. In Fig. 22 stellt die diagonale Linie den Satz von Werten dar, bei dem die LSP-Parameter ω&sub1; und ω&sub2; gleich sind. Die Veränderung der Ausgangsposition in diejenige, die um die gestrichelte Linie L1 symmetrisch liegt, welche zur obenerwähnten diagonalen Linie parallel liegt, verändert somit die Reihenfolge der LSP- Parameter ω und erweitert das Intervall der benachbarten LSP-Parameter.
- Außerdem ist es im obenerwähnten Mehrstufen-Vektorquantisierungsverfahren wichtig, die notwendigen Umsetzungen vor der Berechnung der Abweichungsdaten durchzuführen und diese Konversionen sowohl im Codierungs- als auch im Decodierungsabschnitt in genau derselben Reihenfolge durchzuführen. Ferner ist es auch dann, wenn das LSP-Codebuch 37 gelernt wird, erforderlich, die Berechnungen für den Abstand und den Schwerpunkt unter Berücksichtigung der obigen Umsetzungen durchzuführen.
- Ferner ist im obenerwähnten Mehrstufen-Vektorquantisierungsverfahren ein zweistufiges Beispiel des LSP-Codebuches 37 gegeben, jedoch ist es auch möglich, ein dreistufiges LSP-Codebuch 37 zu verwenden, in welchem die Stabil/Instabil-Beurteilung in der abschließenden Stufe durchgeführt wird. Außerdem ist es möglich, die Beurteilung in jeder Stufe durchzuführen, die der ersten Stufe folgt. Die erste Stufe ist immer stabil, so daß es nicht erforderlich ist, die Stabil/Instabil-Beurteilung in dieser Stufe durchzuführen.
- Fig. 10 zeigt einen vierten Aufbau eines Vektorquantisierungsabschnitts, der im LSP-Koeffizientenquantisierungsabschnitt 25 vorgesehen ist. In dieser Fig. 10 behalten die Komponenten, die denjenigen der Fig. 6 entsprechen, die ursprünglichen Bezugszeichen, wobei deren Beschreibung hier nicht wiederholt wird. Die Addierer 53 bis 55, die Multiplizierer 56 bis 61 und die Übertragungsschalter 62 bis 64 besitzen dieselben Funktionen wie der Addierer 39, der Multiplizierer 47 bzw. der Übertragungsschalter 49. Der in Fig. 10 gezeigte Vektorquantisierungsabschnitt berechnet den LSP-Parametervektor Ωk, ausgedrückt in Formel (13), unter Verwendung der gewichteten Mittel mehrerer vergangener LSP-Codevektoren Vk-4 bis Vk-1 und des aktuellen LSP-Codevektors Vk.
- Ωk = g4mVk-4 + g3mVk-3 + g2mVk-2 + g1mVk-1 + gmVk (13)
- In der Formel 13 sind g4m bis gm die Konstanten der gewichteten Mittel, wobei m gleich 1 oder 2 ist.
- Ferner sind die Operationen des in Fig. 10 gezeigten Vektorquantisierungsabschnitts den Operationen des in Fig. 6 gezeigten Vektorquantisierungsabschnitts ähnlich, so daß die zugehörige Beschreibung weggelassen wird. Außerdem verwendet der in Fig. 10 gezeigte Vektorquantisierungsabschnitt die LSP-Codierungsvektoren, die sich über vier Rahmenoperationen vor der aktuellen Rahmenoperation zurück erstrecken, wobei jedoch die Verwendung der LSP- Codevektoren von den vergangenen Rahmen nicht besonders beschränkt ist.
- Im folgenden wird ein Vektorquantisierungs-Verstärkungsfaktor-Suchabschnitt 65 beschrieben, der den Verstärkungsfaktor-Anpassungsabschnitt 29, den Vorhersageverstärkungsfaktorabschnitt 30 und das Vektorquantisierungs- Verstärkungsfaktorcodebuch 31 umfaßt, wie in Fig. 1 gezeigt ist. Fig. 11 zeigt ein genaues Blockschaltbild des Vektorquantisierungs-Verstärkungsfaktor-Suchabschnitts 65. Im Verstärkungsfaktor-Anpassungsabschnitt 29 wird die lineare Prädiktionsanalyse für den Grad des Ausgangsvektors vom Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 in der aktuellen Operation und für den Grad des Ausgangsvektors der Zufallscodebuchkomponente vom Vektorquantisierungs-Verstärkungsfaktorcodebuch 31, die in der vergangenen Operation verwendet worden ist und im Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 gespeichert ist, durchgeführt. Anschließend wird im Verstärkungsfaktor-Anpassungsabschnitt 29 der vorhergesagte Verstärkungsfaktor, mit dem der Rauschsignalformvektor multipliziert wird, der in der nächsten Rahmenoperation ausgewählt wird, berechnet und zugewiesen, wobei der zugewiesene vorhergesagte Verstärkungsfaktor in den Verstärkungsfaktor-Anpassungsabschnitt 30 eingesetzt wird.
- Das Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 ist in Unterverstärkungsfaktorcodebücher 31a und 31b unterteilt, um die Quantisierungseffizienz durch die Vektorquantisierung zu erhöhen und die Auswirkungen auf die decodierte Sprache in dem Fall zu verringern, in dem auf einer Übertragungsleitung ein Fehler des Verstärkungsfaktorcodes auftritt. Die vom Adaptivcodebuch-Suchabschnitt 27 ausgegebene Schrittweite wird den Unterverstärkungsfaktorcodebüchern 31a und 31b im Block einer Hälfte zugeführt, wobei die Hälfte des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 den Unterverstärkungsfaktorcodebüchern 31a und 31b im Block einer Hälfte zugeführt wird. Der mit jedem der Vektoren multiplizierte Verstärkungsfaktor wird vom Abweichungsgrad-Berechnungsabschnitt wie in Fig. 1 gezeigt als Block ausgewählt, so daß die Abweichungsdaten, die die Differenz zwischen einem Eingangssprachvektor und einem synthetisierten Sprachvektor darstellen, insgesamt minimiert werden. Durch Aufteilen des Vektorquantisierungs-Verstärkungsfaktorcodebuches 31 wie oben beschrieben, ist es selbst dann, wenn auf der Übertragungsleitung ein Fehler in einem der Verstärkungscodes auftritt, möglich, den Fehler des einen Verstärkungsfaktorcodes mit dem anderen Verstärkungsfaktorcode zu kompensieren. Dementsprechend ist es möglich, die Wirkung des Fehlers auf der Übertragungsleitung zu verringern. Fig. 12 zeigt ein Beispiel der Geräuschabstand-Kennlinie (SNR) für die Übertragungsfehlerrate im Fall der Darstellung des Verstärkungsfaktors, mit dem der Schrittweitenvektor bzw. der Rauschsignalformvektor mit dem Ausgangsvektor vom herkömmlichen Verstärkungsfaktor-Codebuch multipliziert werden, sowie in dem Fall der Darstellung von 1 mal der Summe der Ausgangsvektoren von den zwei Unterverstärkungsfaktorcodebüchern. In Fig. 12 zeigt eine Kurve a die Geräuschabstand-Kennlinie gemäß dem herkömmlichen Verstärkungsfaktorcodebuch, während eine Kurve b diejenige gemäß den Unterverstärkungsfaktorcodebüchern dieser Ausführungsform der vorliegenden Erfindung zeigt. In Fig. 12 wird deutlich, daß die Technik der Darstellung des Verstärkungsfaktors durch die Summe von Ausgangsvektoren von zwei Untercodebüchern eine große Toleranz gegenüber Übertragungsfehlern aufweist.
- Als eine Gegenmaßnahme im Fall des Auftretens des Übertragungsfehlers des Verstärkungsfaktorcodes auf der Übertragungsleitung besteht das Vektorquantisierungs-Verstärkungsfaktorcodebuch 31 aus den Unterverstärkungsfaktorcodebüchern 31a und 31b, die wie in Fig. 13 gezeigt seriell verbunden sind. Der Verstärkungsfaktor, mit dem der Schrittweitenvektor multipliziert wird, wird ausgewählt aus (gp0, gp1, ..., gpM). Andererseits wird der Verstärkungsfaktor, mit dem der Ausgangsvektor des Vorhersageverstärkungsfaktorabschnitts 30 multipliziert wird, ausgewählt aus (Gc0, Gc1, ..., GcM). Durch den Aufbau der Unterverstärkungsfaktorcodebücher 31a und 31b wie oben beschrieben, wird selbst dann, wenn auf der Übertragungsleitung ein Übertragungsfehler des Verstärkungsfaktorcodes des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 auftritt, der Verstärkungsfaktorcode des Schrittweitenvektors letztendlich nicht durch den Übertragungsfehler des Verstärkungsfaktorcodes des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitts 30 beeinflußt. Im Gegensatz dazu tritt in dem Fall, in dem ein Übertragungsfehler des Verstärkungsfaktorcodes des Schrittweitenvektors auf der Übertragungsleitung auftritt, der Übertragungsfehler des Verstärkungsfaktorcodes des Ausgangsvektors vom Vorhersageverstärkungsfaktorabschnitt 30 ebenfalls auf. Durch geeignetes Anordnen der Verstärkungsfaktorcodes dieser Verstärkungsfaktoren ist es jedoch möglich, die Auswirkung des Übertragungsfehlers des Verstärkungsfaktorcodes auf der Übertragungsleitung zu verringern.
- Als nächstes wird eine Vorauswahl beschrieben, die im Adaptivcodebuch-Suchabschnitt 27 und im Zufallscodebuch- Suchabschnitt 28 durchgeführt wird. Im Adaptivcodebuch- Suchabschnitt 27 und im Zufallscodebuch-Suchabschnitt 26 werden der Schrittweitenvektor und der Rauschsignalformvektor entsprechend aus mehreren Schrittweitenvektoren und mehreren Rauschsignalformvektoren ausgewählt, die jeweils im Adaptivcodebuch 27 und im Zufallscodebuch 28 gespeichert sind, so daß der Grad der Abweichung d', der durch die folgende Formel (14) dargestellt wird, minimiert wird.
- d' = XT - g'HV'i ² (14)
- In der Formel (14) stellt XT einen Soll-Eingangsprachvektor dar, der verwendet wird, wenn der optimale Vektor im Adaptivcodebuch-Suchabschnitt 27 und im Zufallscodebuch- Suchabschnitt 28 gesucht wird. Der Soll-Eingangssprachvektor XT wird erhalten durch Subtrahieren eines Nulleingang-Antwortvektors XZ des decodierten Sprachvektors, der in der vorangehenden Rahmenoperation decodiert worden ist und im perzeptualen Gewichtungsfilter 34 perzeptual gewichtet worden ist, vom Eingangssprachvektor XW, der im perzeptualen Gewichtungsfilter 34 perzeptual gewichtet worden ist, wie in Formel (15) gezeigt ist. Der Nulleingang-Antwortvektor XZ ist die Komponente des decodierten Sprachvektors, der bis einen Rahmen vor dem aktuellen Rahmen verarbeitet worden ist, und die den aktuellen Rahmen beeinträchtigt, und wird erhalten durch Eingeben eines Vektors in das Synthesefilter 26, der eine Nullsequenz umfaßt.
- XT = XW - XZ (15)
- In der Formel (14) ist ferner V'i (i = 1, 2, ..., N; N bezeichnet eine Codebuchgröße) der Schrittweitenvektor oder der Rauschsignalformvektor, der aus dem Adaptivcodebuch 66 oder dem Zufallscodebuch 67 ausgewählt wird, während g' der Verstärkungsfaktor ist, der im Unterverstärkungsfaktorcodebuch 31a oder 31b des in Fig. 1 gezeigten Vektorquantisierungs-Verstärkungs faktorcodebuches 31 gesetzt wird, H der obenerwähnte Impulsantwortkoeffizient ist und HV'i der synthetisierte Sprachvektor ist.
- Um den optimalen Schrittweitenvektor oder Rauschsignalformvektor Vopt für den Soll-Eingangssprachvektor XT zu suchen, wie oben beschrieben, muß die Berechnung der Formel (14) mit Bezug auf die Gesamtheit des Vektors V'i durchgeführt werden. Dementsprechend nimmt die Berechnungskomplexität stark zu. Folglich ist es aufgrund von Hardwarebetrachtungen notwendig, die Berechnungskomplexität zu verringern, um die obenerwähnten Berechnungen durchzuführen. Da insbesondere eine Filterberechnung des synthetischen Sprachvektors HV'i einen Großteil der Berechnungen umfaßt, führt die Verringerung der Filterzeit zu einer Verringerung der Gesamtberechnungskomplexität in allen der Suchabschnitten.
- Daher wird die unten beschriebene Vorauswahl durchgeführt, um die Filterzeit zu verringern. Anfangs kann die obenerwähnte Formel (14) zu der in Formel (16) gezeigten Formel erweitert werden.
- d' = XT ² - 2g'XTTHV'i + g'HV'i ² (16)
- Im zweiten Term der Formel (16) wird in dem Fall, in dem ein Korrelationswert zwischen dem Soll-Eingangssprachvektor XT und dem Synthesesprachvektor HV'i groß ist, die Gesamtabweichung d' klein. Dementsprechend wird der Vektor V'i aus jedem der Codebücher auf der Grundlage dieses Korrelationswerts XTTHV'i ausgewählt. Die Abweichung d' wird nicht für den gesamten Vektor V'i berechnet, der in den jeweiligen Codebüchern gespeichert ist, sondern es wird nur der Korrelationswert für den gesamten Vektor V'i berechnet, wobei die Abweichung d' nur für den Vektor V'i berechnet wird, der den großen Korrelationswert XTTHV'i aufweist.
- Bei der Berechnung des Korrelationswerts XTTHV'i wird im allgemeinen nach der Berechnung des Synthesesprachvektors HV' die Korrelationsberechnung zwischen dem Soll-Eingangssprachvektor XT und dem Synthesesprachvektor HV' durchgeführt. Jedoch sind bei dem Berechnungsverfahren wie oben beschrieben für die Berechnung des Synthesesprachvektors HV' die N-malige Filterberechnung und die N-malige Durchführung der Korrelationsberechnung notwendig, da die Anzahl der Vektoren V'i gleich der Codebuchgröße N ist.
- In dieser Ausführungsform wird eine Rückwärtsfilterung verwendet, die in "Fast CELP Coding based on algebraic codes", Proc. ICASSP'87, S. 1957-1960, J. P. Adoul, u. a., offenbart ist. Bei dieser Rückwärtsfilterung wird bei der Berechnung des Korrelationswerts XTTHV'i anfangs XTTH berechnet und (XTTH)V' berechnet. Durch Verwenden dieses Berechnungsverfahrens wird der Korrelationswert XTTHV'i erhalten durch einmaliges Filtern und N-maliges Durchführen der Korrelationsberechnung. Anschließend werden die willkürlichen Zahlen des Vektors V'i mit dem großen Korrelationswert XTTHV'i ausgewählt, wobei die Filterung des Synthesesprachvektors HV'i nur für die ausgewählte willkürliche Zahl des Vektors V'i durchgeführt zu werden braucht. Folglich ist es möglich, die Berechnungskomplexität erheblich zu verringern.
- Als nächstes wird die in Fig. 1 gezeigte Sprachcodierungsvorrichtung genauer erläutert. Der Adaptivcodebuch- Suchabschnitt 37 umfaßt das Adaptivcodebuch 66 und den Vorauswahlabschnitt 68. Im Adaptivcodebuch-Suchabschnitt 37 wird der vergangene Signalformvektor (Schrittweitenvektor), der für die Signalform des aktuellen Rahmens am besten geeignet ist, als Einheit eines Unterrahmens gesucht. Jeder der im Adaptivcodebuch 66 gespeicherten Schrittweitenvektoren wird erhalten durch Weiterleiten des decodierten Sprachvektors über einen Umkehrfilter. Der Koeffizient des Umkehrfilters ist der quantisierte Koeffizient, wobei der Ausgangsvektor vom Umkehrfilter der Restsignalformvektor des decodierten Sprachvektors ist. Im Vorauswahlabschnitt 68 wird die Vorauswahl einer Vorschau des Schrittweitenvektors (im folgenden als Schrittweitenvorschau bezeichnet), der ausgewählt werden soll, zweimal durchgeführt. Durch zweimaliges Durchführen der Vorauswahl werden schließlich M Elemente (z. B. 16 Elemente) der Schrittweitenvorschau ausgewählt. Als nächstes wird im Vorauswahlabschnitt 68 die optimale Schrittweitenvorschau unter den Schrittweitenvorschauen als auszugebender Schrittweitenvektor zugewiesen. Wenn der optimale Verstärkungsfaktor g' wie in Formel (17) gezeigt gesetzt worden ist, kann die obenerwähnte Formel (16) wie in Formel (18) gezeigt modifiziert werden.
- Anschließend ist die Schrittweitenvorschau, die nach der kleinsten Abweichung d' sucht, die erhalten werden kann, gleich der Schrittweitenvorschau, die nach dem maximierten zweiten Term der Formel (18) sucht. Entsprechend wird im Vorauswahlabschnitt 68 der zweite Term der Formel (18) für M Elemente der ausgewählten Schrittweitenvorschau berechnet, wobei die Schrittweitenvorschau, die das Berechnungsergebnis maximiert, als auszugebender Schrittweitenvektor HP festgelegt wird.
- Der Zufallscodebuch-Suchabschnitt 28 umfaßt ein Zufallscodebuch 67 und Vorauswahlabschnitte 69 und 70. Im Zufallscodebuch-Suchabschnitt 28 wird unter mehreren Rauschsignalformvektoren, die im Zufallscodebuch 67 als Einheit eines Unterrahmens gespeichert sind, ein Signalformvektor (ein Rauschsignalformvektor) gesucht, der für die Signalform des aktuellen Rahmens am besten geeignet ist. Das Zufallscodebuch 67 umfaßt die Untercodebücher 67a und 67b. In den Untercodebüchern 67a und 67b sind jeweils mehrere Erregungsvektoren gespeichert. Der Rauschsignalformvektor Cd wird durch die Summe der zwei Erregungsvektoren dargestellt, wie in Formel (19) gezeigt ist.
- Cd = θ&sub1; Csub1p + θ&sub2; Csub2q (19)
- In Formel (19) sind Csub1p und Csub2q die Erregungsvektoren, die in den Untercodebüchern 67a bzw. 67b gespeichert sind, während e&sub1; und e&sub2; das positive und das negative Vorzeichen der Erregungsvektoren Csub1p und Csub2q sind und d = 1 128, p = 1 128, q = 1 128.
- Wie oben beschrieben worden ist, ist es durch Darstellen des Rauschsignalformvektors Cd durch zwei Erregungsvektoren Csub1p und Csub2q und durch Übertragen des Codes, der den zwei Erregungsvektoren Csub1p und Csub2q entspricht, als Code aus Bit-Serien selbst dann, wenn auf der Übertragungsleitung ein Fehler in einem dieser Codes auftritt, möglich, die Auswirkung des Fehlers auf der Übertragungsleitung durch Verwendung des anderen Codes zu verringern.
- Ferner werden in dieser Ausführungsform die Erregungsvektoren Csub1p und Csub2q durch 7 Bits dargestellt, während die Vorzeichen θ&sub1; und θ&sub2; durch 1 Bit dargestellt werden. Wenn der Rauschsignalformvektor Cd wie beim Stand der Technik durch einen einzelnen Vektor dargestellt wird, werden die Erregungsvektoren Csub1p und Csub2q durch 15 Bits dargestellt und die Vorzeichen θ&sub1; und θ&sub2; durch 1 Bit dargestellt. Da dementsprechend für das Zufallscodebuch eine große Menge an Speicher benötigt wird, ist die Codebuchgröße zu groß. Da jedoch in dieser Ausführungsform der Rauschsignalformvektor Cd durch die Summe der zwei Erregungsvektoren Csub1p und Csub2q dargestellt wird, kann die Codebuchgröße des Codebuches 67 im Vergleich zu derjenigen des Standes der Technik erheblich verringert werden. Folglich ist es möglich, die im Zufallscodebuch 67 zu speichernden Rauschsignalformvektoren Cd zu lernen und zu erhalten, indem eine Sprachdatenbank verwendet wird, in der mehrere aktuelle Sprachvektoren gespeichert sind, so daß die Rauschsignalformvektoren Cd mit den aktuellen Sprachvektoren übereinstimmen.
- Um den Rauschsignalformvektor auszuwählen, der für den Soll-Eingangssprachvektor XT am besten geeignet ist, werden in den Vorauswahlabschnitten 69 und 70 entsprechend die Erregungsvektoren Csub1p und Csub2q aus den Codebüchern 67a und 67b vorausgewählt. Mit anderen Worten, der Korrelationswert zwischen den Erregungsvektoren Csub1p und Csub2q und dem Soll- Eingangssprachvektor XT wird entsprechend berechnet, wobei die auszugebende Vorauswahl einer Vorschau eines Rauschsignalformvektors (im folgenden mit Zufallsvorschau bezeichnet) ausgegeben wird. Nach dem Rauschsignalformvektor wird gesucht, indem jede der Zufallsvorschauen gegen den gesuchten Schrittweitenvektor HP orthogonalisiert wird, um die Quantisierungseffizienz zu steigern. Der gegen den Schrittweitenvektor HP orthogonalisierte Rauschsignalformvektor (HPD) wird durch die folgende Formel (20) dargestellt.
- (HCd) = HCd - (HCd)THP/ HP ² HP (20)
- Anschließend wird der Korrekturwert XTT(HCd) zwischen diesem orthogonalisierten Rauschsignalformvektor (HCd) und dem Soll-Eingangssprachvektor XTT durch die Formel (21) dargestellt.
- XTT(HCd) = XTTHCd - (HCd)THP/ HP ² XTTHP (21)
- Anschließend wird die Vorauswahl der Zufallsvorschau unter Verwendung des Korrelationswertes XTT(HCd) durchgeführt. In der Formel (21) ist der Nennerterm (HCd)THP des zweiten Terms äquivalent zu (HP)THCd. Dementsprechend wird die obenerwähnte Rückwärtsfilterung auf den ersten Term XTTHCd der Formel (21) und auf (HP)THCd angewendet. Da der Rauschsignalformvektor Cd die Summe der Erregungsvektoren Csub1p und Csub2q ist, wird der Korrelationswert XTT(HCd) durch die Formel (22) dargestellt.
- XTT(HCd) = XTT(HCsub1p) + XTT(HCsub2q) (22)
- Entsprechend wird die von der Formel (22) gezeigte Berechnung für die Erregungsvektoren Csub1p und Csub2q durchgeführt, wobei unter diesen entsprechend M Elemente der berechneten Korrelationswerte ausgewählt werden, deren Wert groß ist. Anschließend werden unter den M Elementen der in den Vorauswahlabschnitten 69 und 70 ausgewählten Erregungsvektoren Csub1p und Csub2q entsprechend diejenigen Zufallsvorschauen als auszugebender Rauschsignalformvektor ausgewählt, die die am besten geeignete Kombination enthalten. Auf dieselbe Weise wie bei der obenbeschriebenen Technik der Auswahl der optimalen Vorschau der Schrittweitenvorschau wird nach der Kombination der Erregungsvektoren Csub1p und Csub2q gesucht, deren zweiter Term der Formel (23) die unter Verwendung des Soll-Eingangssprachvektors XT und der Zufallsvorschau berechnete Abweichung d" darstellt.
- d" = XT ² - (XTT(HCd))²/ (HCd) ² (23)
- Da die M Elemente der Erregungsvektoren Csub1p und Csub2q unter Verwendung der obenerwähnten Vorauswahl entsprechend aus jedem der Untercodebücher 67a und 67b ausgewählt werden, kann die in Formel (23) gezeigte Berechnung insgesamt M² mal ausgeführt werden.
- Wie oben beschrieben worden ist, werden in dieser Ausführungsform die M Elemente der Erregungsvektoren Csub1p und Csub2q entsprechend in den Vorauswahlabschnitten 69 und 70 ausgewählt, während die optimale Kombination unter den M Elementen der vorausgewählten Erregungsvektoren Csub1p und Csub2q ausgewählt wird, so daß es möglich ist, die Toleranz gegenüber einem Übertragungsfehler weiter zu erhöhen. Da wie vorher erwähnt ein Rauschsignalformvektor Cd durch die zwei Erregungsvektoren Csub1p und Csub2q dargestellt wird, ist es selbst dann, wenn auf der Übertragungsleitung ein Fehler in einem der Codes auftritt, die den Erregungsvektoren Csub1p und Csub2q entsprechen, möglich, den Übertragungsfehler des einen Codes durch den anderen Code zu kompensieren. Außerdem werden die Erregungsvektoren Csub1p und Csub2q, die eine hohe Korrelation mit dem Soll-Eingangssprachvektor aufweisen, von der Vorauswahl ausgewählt, woraufhin die optimale Kombination der Erregungsvektoren Csub1p und Csub2q als auszugebender Rauschsignalformvektor ausgewählt wird, wobei der Rauschsignalformvektor, bei dem der Übertragungsfehler nicht aufgetreten ist, eine hohe Korrelation mit dem Soll-Eingangssprachvektor XTT aufweist. Somit ist es im Vergleich zur Nichtdurchführung der Vorauswahl möglich, die Auswirkungen von Übertragungsfehlern zu verringern.
- Fig. 14 zeigt ein Ergebnis, bei dem die Sprachqualität der decodierten Sprache mittels eines Meinungstests in dem Fall geschätzt wurde, in dem die Sprachdaten mittels der Sprachcodierungsvorrichtung des Standes der Technik bzw. der vorliegenden Erfindung codiert, übertragen und decodiert wurden. In Fig. 14 ist die Sprachqualität der decodierten Sprache dargestellt, wobei der Pegel der in die Sprachcodierungsvorrichtung eingegebenen Sprachdaten jeweils auf 3 Stufen eingestellt wurde (A: hoher Pegel, B: mittlerer Pegel, C: niedriger Pegel), für den Fall, in dem kein Übertragungsfehler auftrat, sowie die Sprachqualität (siehe Marke D) der decodierten Sprache dargestellt für den Fall, in dem ein Zufallsfehlerverhältnis 0,1 % betrug. In Fig. 14 zeigen die schräg schraffierten Balken das Ergebnis gemäß dem herkömmlichen adaptiven Differentialimpulscodierungsmodulation-(ADPCM)-Verfahren, während die kreuzweise schraffierten Balken das Ergebnis gemäß dieser Ausführungsform der vorliegenden Erfindung zeigen. Gemäß Fig. 14 ist klar, daß in dem Fall, in dem kein Übertragungsfehler aufgetreten ist, unabhängig vom Pegel der eingegebenen Sprachdaten eine Sprachqualität der decodierten Sprache erreicht wird, die derjenigen gemäß dem ADPCM-Verfahren gleicht, während in dem Fall, in dem ein Übertragungsfehler aufgetreten ist, die Sprachqualität der decodierten Sprache besser ist als diejenige gemäß dem ADPCM-Verfahren. Somit ist die Sprachcodierungsvorrichtung gemäß dieser Ausführungsform robust gegen Übertragungsfehler.
- Wie oben beschrieben worden ist, ist es gemäß der obenerwähnten Ausführungsform möglich, die Codierung und Decodierung von Sprache bei 8 kb/s zu verwirklichen, eine Sprachcodierung mit einer hohen Sprachqualität der decodierten Sprache, die derjenigen einer decodierten Sprache bei 32 kb/s ADPCM entspricht, was internationaler Standard ist. Ferner ist es gemäß dieser Ausführungsform selbst dann, wenn auf der Übertragungsleitung ein Bitfehler auftritt, möglich, eine qualitativ hochwertige decodierte Sprache ohne Auswirkung des Bitfehlers zu erhalten.
- Die Ausführungsform der Erfindung ist bis zu diesem Punkt mit Bezug auf die Figuren genauer erläutert worden; jedoch ist der konkrete Aufbau der Erfindung nicht auf diese Ausführungsform beschränkt. Die vorliegende Erfindung umfaßt Abwandlungen und dergleichen, die in die vorliegende Erfindung, wie sie beansprucht wird, fallen.
Claims (30)
1. Sprachcodierungsverfahren, mit wenigstens vier
Abläufen von Schritten, wobei ein erster Ablauf enthält:
einen ersten Schritt (22) zum Bilden eines
Vektors aus Sprachsignalen, der mehrere Abtastwerte enthält,
als Einheit einer Rahmenoperation und Speichern des
Vektors als Spracheingangsvektor;
einen zweiten Schritt (23) zum
aufeinanderfolgenden Prüfen, ein Rahmen zu einem Zeitpunkt, der Amplitude
jedes Spracheingangsvektors und zum Komprimieren der
Amplitude, wenn der Absolutwert der Amplitude einen
vorgegebenen Wert übersteigt;
einen dritten Schritt (24) zum Ausführen einer
linearen Prädiktionsanalyse und zum Berechnen eines LPC-
Koeffizienten für jeden vom zweiten Schritt ausgegebenen
Spracheingangsvektor;
einen vierten Schritt zum Umsetzen jedes im
dritten Schritt berechneten LPC-Koeffizienten in einen LSP-
Parameter;
einen fünften Schritt zum Quantisieren des LSP-
Parameters unter Verwendung eines
Vektorquantisierungsprozesses;
einen sechsten Schritt zum Umsetzen des
quantisierten LSP-Parameters in einen quantisierten
LPC-Koeffizienten;
einen siebten Schritt (26) zum Synthetisieren
eines synthetischen Sprachvektors auf der Grundlage eines
von außerhalb zugeführten Treibervektors und des
quantisierten LPC-Koeffizienten;
einen achten Schritt (33) zum Berechnen von
Abweichungsdaten durch Subtrahieren des im siebten Schritt
ausgegebenen synthetischen Sprachvektors von dem vom
zweiten Schritt ausgegebenen Spracheingangsvektor;
einen neunten Schritt (34) zum Gewichten der im
achten Schritt berechneten Abweichungsdaten;
einen zehnten Schritt (35) zum Berechnen des
Abweichungsgrades der Abweichungsdaten in bezug auf jede
Abweichungsdateneinheit, die im neunten Schritt gewichtet
wurde;
wobei ein zweiter Ablauf enthält:
einen elften Schritt (27) zum Auswählen eines
Schrittweitenvektors aus mehreren Schrittweitenvektoren;
einen zwölften Schritt (28) zum Auswählen eines
Rauschsignalformvektors aus mehreren
Rauschsignalformvektoren;
einen dreizehnten Schritt (29) zum Berechnen
eines Prädiktionsverstärkungsfaktors für jeden im zwölften
Schritt gewählten Rauschsignalformvektor;
einen vierzehnten Schritt (30) zum Multiplizieren
des im dreizehnten Schritt berechneten
Prädiktionsverstärkungsfaktors mit dem im zwölften Schritt ausgewählten
Rauschsignalformvektor;
einen fünfzehnten Schritt (31) zum Multiplizieren
eines aus mehreren Verstärkungsfaktoren ausgewählten
Verstärkungsfaktors mit dem im elften Schritt ausgewählten
Schrittweitenvektor bzw. mit einem Ausgangsvektor des
vierzehnten Schrittes;
einen sechzehnten Schritt (32) zum Addieren von
zwei im fünfzehnten Schritt erhaltenen
Multiplikationsergebnissen und zum Liefern des Additionsergebnisses an
den siebten Schritt als Treibervektor;
wobei ein dritter Ablauf einen Wert auswählt, der
den im zehnten Schritt berechneten Abweichungsgrad
minimiert, wenn ein Schrittweitenvektor gemäß dem elften
Schritt ausgewählt wird, ein Rauschsignalformvektor gemäß
dem zwölften Schritt ausgewählt wird und ein
Verstärkungsfaktor
gemäß dem fünfzehnten Schritt ausgewählt
wird;
wobei ein vierter Ablauf (36) verarbeitete
Informationen, die von den Struktureinrichtungen erhalten
werden, in Bitreihen codiert und, falls notwendig, eine
Fehlerkorrekturcodierung hinzufügt und dann die codierten
Bitreihen überträgt;
wobei der im fünften Schritt quantisierte
LSP-Parameter durch einen gewichteten Mittelwertvektor mehrerer
Vektoren der laufenden Rahmenoperation und der
vorhergehenden Rahmenoperationen gegeben ist.
2. Sprachcodierungsverfahren nach Anspruch 1, in dem
der fünfte Schritt enthält:
einen ersten Unterschritt zum Auswählen eines
Vektors aus mehreren Vektoren, die in einer vorgegebenen
Vektorspeichereinrichtung (37) gespeichert sind;
einen zweiten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (g) eines gewichteten
Mittelwerts mit dem im ersten Unterschritt ausgewählten Vektor;
einen dritten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (1 - g) eines gewichteten
Mittelwerts mit dem während der Verarbeitung des der
laufenden Rahmenoperation unmittelbar vorhergehenden Rahmens
(eines Rahmens vor der laufenden Rahmenoperation) im
ersten Unterschritt ausgewählten Vektor;
einen vierten Unterschritt zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors des zweiten Unterschritts und eines
Ausgangsvektors des dritten Unterschritts;
einen fünften Unterschritt zum Berechnen der
Abweichungsdaten zwischen einem LSP-Parameter (Ψk) vor der
Quantisierung und dem quantisierten LSP-Parameter (Ωk);
einen sechsten Unterschritt zum Auswählen eines
Vektors, der die im fünften Unterschritt berechneten
Abweichungsdaten minimal macht, zu dem Zeitpunkt, zu dem
ein Vektor gemäß dem ersten Unterschritt gewählt wird,;
einen siebten Unterschritt zum Liefern von
Identifizierungsinformationen (S1) eines im ersten
Unterschritt ausgewählten Vektors als die verarbeiteten
Informationen an den vierten Ablauf.
3. Sprachcodierungsverfahren nach Anspruch 1, in dem
der fünfte Schritt enthält:
einen ersten Unterschritt zum Auswählen eines
Vektors aus mehreren Vektoren, die in einer vorgegebenen
Vektorspeichereinrichtung gespeichert sind;
einen zweiten Unterschritt zum Erhalten der Summe
der Vektoren, die von der laufenden Rahmenoperation bis
zu einer Rahmenoperation, die n Rahmen vor der laufenden
Rahmenoperation liegt, verarbeitet wurden, für jeden
gemäß dem ersten Unterschritt ausgewählten Vektor;
einen dritten Unterschritt zum Erhalten des
quantisierten LSP-Parameters durch Dividieren eines
Ausgangsvektors des zweiten Unterschritts durch n + 1;
einen vierten Unterschritt zum Berechnen der
Abweichungsdaten zwischen einem LSP-Parameter vor der
Quantisierung und dem quantisierten LSP-Parameter;
einen fünften Unterschritt zum Auswählen eines
Vektors, der die im vierten Unterschritt berechneten
Abweichungsdaten minimal macht, zu dem Zeitpunkt, zu dem
ein Vektor gemäß dem ersten Unterschritt ausgewählt wird;
einen sechsten Unterschritt zum Liefern von
Identifizierungsinformationen eines gemäß dem ersten
Unterschritt ausgewählten Vektors als die verarbeiteten
Informationen an den vierten Ablauf.
4. Sprachcodierungsverfahren nach Anspruch 1, in dem
der fünfte Schritt enthält:
einen ersten Unterschritt zum Auswählen eines
Vektors aus mehreren Vektoren, die in einer vorgegebenen
Vektorspeichereinrichtung gespeichert sind;
einen zweiten Unterschritt zum Auswählen eines
Vektors aus mehreren Vektoren, die in einer separaten
Vektorspeichereinrichtung gespeichert sind;
einen dritten Unterschritt zum Erhalten der Summe
von Vektoren, die von der laufenden Rahmenoperation bis
zu einer Rahmenoperation, die n Rahmen vor der laufenden
Rahmenoperation liegt, verarbeitet wurden, für jeden
gemäß dem ersten Unterschritt ausgewählten Vektor;
einen vierten Unterschritt zum Addieren eines
Ausgangsvektors des dritten Unterschritts und des im
zweiten Unterschritt ausgewählten Vektors;
einen fünften Unterschritt zum Erhalten des
quantisierten LSP-Parameters durch Dividieren des
Ausgangsvektors des vierten Unterschritts durch n + 2;
einen sechsten Unterschritt zum Berechnen der
Abweichungsdaten zwischen einem LSP-Parameter vor der
Quantisierung und dem quantisierten LSP-Parameter;
einen siebten Unterschritt zum Auswählen eines
Vektors, der die im sechsten Unterschritt berechneten
Abweichungsdaten minimal macht, zu dem Zeitpunkt, zu dem
Vektoren gemäß dem ersten Unterschritt und dem zweiten
Unterschritt ausgewählt werden;
einen achten Unterschritt zum Liefern von
Identifizierungsinformationen von gemäß dem ersten Unterschritt
und dem zweiten Unterschritt ausgewählten Vektoren als
die verarbeiteten Informationen an den vierten Ablauf.
5. Sprachcodierungsverfahren nach Anspruch 1, in dem
der fünfte Schritt enthält:
einen ersten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (gk) eines gewichteten
Mittelwerts mit jedem in einer vorgegebenen
Vektorspeichereinrichtung (37) gespeicherten Vektor;
einen zweiten Unterschritt zum Auswählen eines
Vektors aus den multiplizierten Vektoren;
einen dritten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (1 - gk) eines gewichteten
Mittelwerts des während der Verarbeitung des der laufenden
Rahmenoperation unmittelbar vorhergehenden Rahmens (eines
Rahmens vor der laufenden Rahmenoperation) gemäß dem
zweiten Unterschritt ausgewählten Vektors;
einen vierten Unterschritt zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors des zweiten Unterschritts und eines
Ausgangsvektors des dritten Unterschritts;
einen fünften Unterschritt zum Berechnen der
Abweichungsdaten zwischen einem LSP-Parameter (Ψk) vor der
Quantisierung und dem quantisierten LSP-Parameter (Ωk);
einen sechsten Unterschritt zum Auswählen eines
Vektors, der die im fünften Unterschritt berechneten
Abweichungsdaten minimal macht, zu dem Zeitpunkt, zu dem
ein Vektor gemäß dem zweiten Unterschritt ausgewählt
wird;
einen siebten Unterschritt zum Liefern von
Identifizierungsinformationen (S1) eines gemäß dem zweiten
Unterschritt ausgewählten Vektors als die verarbeiteten
Informationen an den vierten Ablauf.
6. Sprachcodierungsverfahren nach Anspruch 1, in dem
der fünfte Schritt enthält:
einen ersten Unterschritt zum Auswählen eines
Vektors aus mehreren Vektoren, die in einer vorgegebenen
Vektorspeichereinrichtung (37) gespeichert sind;
einen zweiten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (g1) eines ersten gewichteten
Mittelwerts mit einem im ersten Unterschritt ausgewählten
Vektor;
einen dritten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (g2) eines zweiten gewichteten
Mittelwerts mit dem im ersten Unterschritt ausgewählten
Vektor;
einen vierten Unterschritt zum Auswählen eines
Vektors aus einem Ausgangsvektor des zweiten
Unterschritts und einem Ausgangsvektor des dritten
Unterschritts;
einen fünften Unterschritt zum Multiplizieren
einer Verhältniskonstanten (1 - g1) eines dritten
gewichteten Mittelwerts mit dem während der Verarbeitung des der
laufenden Rahmenoperation unmittelbar vorhergehenden
Rahmens (eines Rahmens vor der laufenden Rahmenoperation) im
ersten Unterschritt ausgewählten Vektor;
einen sechsten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (1 - g2) eines vierten
gewichteten Mittelwerts mit der während der Verarbeitung des
der laufenden Rahmenoperation unmittelbar vorhergehenden
Rahmens (eines Rahmens vor der laufenden Rahmenoperation)
im ersten Unterschritt ausgewählten Vektor;
einen siebten Unterschritt zum Auswählen eines
Vektors aus einem Ausgangsvektor des fünften
Unterschritts und einem Ausgangsvektor des sechsten
Unterschritts;
einen achten Unterschritt zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors des vierten Unterschritts und eines
Ausgangsvektors des siebten Unterschritts;
einen neunten Unterschritt zum Berechnen der
Abweichungsdaten zwischen einem LSP-Parameter (Ψk) vor der
Quantisierung und dem quantisierten LSP-Parameter (Ωk);
einen zehnten Unterschritt zum Auswählen eines
Vektors, der die im neunten Unterschritt berechneten
Abweichungsdaten minimal macht, zu dem Zeitpunkt, zu dem
ein Vektor gemäß dem ersten Unterschritt, dem vierten
Unterschritt und dem siebten Unterschritt ausgewählt wird;
einen elften Unterschritt zum Liefern von
Identifizierungsinformationen (31, 32) eines gemäß dem ersten
Unterschritt, dem vierten Unterschritt und dem siebten
Unterschritt ausgewählten Vektors als die verarbeiteten
Informationen an den vierten Ablauf.
7. Sprachcodierungsverfahren nach Anspruch 1, in dem
der fünfte Schritt enthält:
einen ersten Unterschritt zum Auswählen eines
Vektors aus mehreren Vektoren, die in einer vorgegebenen
Vektorspeichereinrichtung (37) gespeichert sind;
einen zweiten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (g1) eines ersten gewichteten
Mittelwerts mit dem im ersten Unterschritt ausgewählten
Vektor;
einen dritten Unterschritt zum Multiplizieren
einer Verhältniskonstanten (g2) eines zweiten gewichteten
Mittelwerts des im ersten Unterschritt ausgewählten
Vektors;
einen vierten Unterschritt zum Auswählen eines
Vektors aus einem Ausgangsvektor des zweiten
Unterschritts und einem Ausgangsvektor des dritten
Unterschritts;
einen fünften Unterschritt zum Ausführen einer
Verarbeitung jedes Rahmens von dem der laufenden
Rahmenoperation unmittelbar vorhergehenden Rahmen zu einer
Rahmenoperation, die n Rahmen vor der laufenden
Rahmenoperation liegt, wobei die Verarbeitung umfaßt:
einen Multiplikationsschritt zum Multiplizieren
einer Verhältniskonstanten eines vorgegebenen gewichteten
Mittelwerts mit einem während der Verarbeitung eines
vorhergehenden Rahmens im ersten Unterschritt ausgewählten
Vektor;
einen separaten Multiplikationsschritt zum
Multiplizieren einer Verhältniskonstanten eines vorgegebenen
gewichteten Mittelwerts mit einem während der
Verarbeitung eines vorhergehenden Rahmens im ersten Unterschritt
ausgewählten Vektor;
einen Auswähischritt zum Auswählen eines Vektors
aus den Ausgangsvektoren der zwei
Multiplikationsschritte;
einen sechsten Unterschritt zum Erhalten der
Summe von n Vektoren, die im fünften Unterschritt
ausgewählt worden sind;
einen siebten Unterschritt zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors des vierten Unterschritts und eines
Ausgangsvektors des sechsten Unterschritts;
einen achten Unterschritt zum Berechnen der
Abweichungsdaten zwischen einem LSP-Parameter (Ψk) vor der
Quantisierung und dem quantisierten LSP-Parameter (Ωk);
einen neunten Unterschritt zum Auswählen eines
Vektors, der die im achten Unterschritt berechneten
Abweichungsdaten minimal macht, zu dem Zeitpunkt, zu dem
ein Vektor gemäß dem ersten Unterschritt, dem vierten
Unterschritt und dem fünften Unterschritt ausgewählt wird;
einen zehnten Unterschritt zum Liefern von
Identifizierungsinformationen (S 1, S 2) eines im ersten
Unterschritt, im vierten Unterschritt und im fünften
Unterschritt ausgewählten Vektors als die verarbeiteten
Informationen an den vierten Ablauf.
8. Sprachcodierungsverfahren nach einem der
Ansprüche 2-7, in dem sich die Verhältniskonstante (g, 1 - g,
gk, 1 - gk, g1, g2, 1 - g1, 1 - g2) eines gewichteten
Mittelwerts von jedem Vektorelement unterscheidet, mit
dem die Verhältniskonstante multipliziert wird.
9. Sprachcodierungsverfahren nach einem der
Ansprüche 2-8, in dem jeder in der Vektorspeichereinrichtung
(37) gespeicherte Vektor durch die Summe mehrerer
Vektoren mit unterschiedlichen Dimensionen gegeben ist.
10. Sprachcodierungsverfahren nach einem der
Ansprüche 2-9, in dem der Schritt zum Auswählen eines Vektors
für die Minimierung der Abweichungsdaten in bezug auf
Parameter w1, w2, w3, ... , wp - 2, wp - 1, wp, die einen
aus der Vektorspeichereinrichtung (37) ausgewählten
p-dimensionalen Vektor {w1, w2, w3, ... , wp - 2, wp - 1, wp}
bilden, das Einstellen der Parameter umfaßt, sofern die
Beziehung
0 < w1 < w2 < w3 < ... < wp - 2 < wp - 1 < wp < p nicht
erfüllt ist, damit die Beziehung erfüllt wird.
11. Sprachcodierungsverfahren nach einem der
Ansprüche 1-10, in dem der dreizehnte Schritt das Berechnen des
Prädiktionsverstärkungsfaktors durch Ausführen einer
linearen Prädiktionsanalyse auf der Grundlage des Grades
eines Ausgangsvektors des vierzehnten Schrittes, der
während der Verarbeitung des fünfzehnten Schrittes für den
laufenden Rahmen mit einem Verstärkungsfaktor
multipliziert wird, und des Grades eines Ausgangsvektors des
vierzehnten Schrittes, der während der Verarbeitung des
fünfzehnten Schrittes für einen vergangenen Rahmen mit
einem Verstärkungsfaktor multipliziert wird, enthält.
12. Sprachcodierungsverfahren nach einem der
Ansprüche 1-11, in dem der fünfzehnte Schritt enthält:
einen ersten Unterschritt zum Multiplizieren
eines Verstärkungsfaktors, der aus mehreren in einer
vorgegebenen Verstärkungsfaktor-Speichereinrichtung (31a)
gespeicherten Verstärkungsfaktoren ausgewählt wird, mit der
Hälfte des Schrittweitenvektors, der im elften Schritt
ausgewählt wird, und der Hälfte des Ausgangsvektors des
vierzehnten Schrittes;
einen zweiten Unterschritt zum Multiplizieren
eines Verstärkungsfaktors, der aus mehreren in einer
vorgegebenen Verstärkungsfaktor-Speichereinrichtung (31b)
gespeicherten Verstärkungsfaktoren ausgewählt wird, mit der
verbleibenden Hälfte des im elften Schritt ausgewählten
Schrittweitenvektors und der verbleibenden Hälfte des
Ausgangsvektors des vierzehnten Schrittes;
einen dritten Unterschritt zum Liefern der Summe
aus einem mit einem Verstärkungsfaktor gemäß dem ersten
Unterschritt multiplizierten Schrittweitenvektor und aus
einem mit einem Verstärkungsfaktor gemäß dem zweiten
Unterschritt multiplizierten Schrittweitenvektor als
Schrittweitenvektor, der mit einem Verstärkungsfaktor
gemäß dem fünfzehnten Schritt multipliziert ist, an den
sechzehnten Schritt;
einen vierten Unterschritt zum Liefern der Summe
aus einem mit einem Verstärkungsfaktor gemäß dem ersten
Unterschritt multiplizierten Ausgangsvektor des
vierzehnten Schrittes und aus einem mit einem Verstärkungsfaktor
gemäß dem zweiten Unterschritt multiplizierten
Ausgangsvektor des vierzehnten Schrittes als Ausgangsvektor des
vierzehnten Schrittes, der mit einem Verstärkungsfaktor
gemäß dem fünfzehnten Schritt multipliziert ist, an den
sechzehnten Schritt.
13. Sprachcodierungsverfahren nach einem der
Ansprüche 1-12, in dem der elfte Schritt enthält:
Berechnen eines Korrelationswertes zwischen einem
vom zweiten Schritt ausgegebenen Eingangssprachvektor und
einem vom siebten Schritt ausgegebenen synthetischen
Sprachvektor durch Ausführen einer Rückwärtsfilterung in
bezug auf sämtliche Schrittweitenvektoren, die in einer
vorgegebenen Schrittweitenvektor-Speichereinrichtung (66)
gespeichert sind;
Auswählen eines Schrittweitenvektors, der
ermöglicht, daß der Korrelationswert vorgegebene Bedingungen
erfüllt;
Liefern des ausgewählten Schrittweitenvektors an
den fünfzehnten Schritt.
14. Sprachcodierungsverfahren nach einem der
Ansprüche 1-13, in dem der zwölfte Schritt enthält:
einen ersten Unterschritt zum Berechnen eines
Korrelationswerts zwischen einem vom zweiten Schritt
ausgegebenen Eingangssprachvektor und einem vom siebten
Schritt ausgegebenen synthetischen Sprachvektor durch
Ausführen einer Rückwärtsfilterung in bezug auf sämtliche
Erregungsvektoren, die in einer ersten Erregungsvektor-
Speichereinrichtung (67a) gespeichert sind, und durch
Auswählen eines Erregungsvektors, der ermöglicht, daß der
Korrelationswert vorgegebene Bedingungen erfüllt;
einen zweiten Unterschritt zum Berechnen eines
Korrelationswerts zwischen einem vom zweiten Schritt
ausgegebenen Eingangssprachvektor und einem vom siebten
Schritt ausgegebenen synthetischen Sprachvektor durch
Ausführen einer Rückwärtsfilterung in bezug auf sämtliche
Erregungsvektoren, die in einer zweiten Erregungsvektor-
Speichereinrichtung (67b) gespeichert sind, und durch
Auswählen eines Erregungsvektors, der ermöglicht, daß der
Korrelationswert vorgegebene Bedingungen erfüllt;
einen dritten Unterschritt zum Addieren eines
Ausgangsvektors des ersten Unterschritts und eines
Ausgangsvektors des zweiten Unterschritts und zum Liefern
des Additionsergebnisses an den vierzehnten Schritt als
Rauschsignalformvektor.
15. Sprachcodierungsverfahren nach einem der
Ansprüche 13, 14, in dem dann, wenn der Eingangssprachvektor
mit XT bezeichnet ist, ein Impulsantwortkoeffizient des
siebten Schrittes mit H bezeichnet ist und entweder der
Schrittweitenvektor oder der Rauschsignalformvektor mit
V'i bezeichnet ist, der synthetische Sprachvektor HV'i
lautet, der Korrelationswert XTTHV'i lautet und die
Rückwärtsfilterung dadurch ausgeführt wird, daß zuerst XTTH
berechnet wird, gefolgt von der Berechnung von (XTTH)
V'i.
16. Sprachcodierungsvorrichtung, mit:
einem Puffer (22) zum Bilden eines Vektors aus
Sprachsignalen, der mehrere Abtastwerte enthält, als
Einheit einer Rahmenoperation und Speichern des Vektors als
Spracheingangsvektor;
einer Amplitudenbegrenzungseinrichtung (23) zum
sequentiellen Prüfen, ein Rahmen zu einem Zeitpunkt, der
Amplitude jedes im Puffer (22) gespeicherten
Spracheingangsvektors und zum Komprimieren der Amplitude, wenn der
Absolutwert der Amplitude einen vorgegebenen Wert
übersteigt;
einer LPC-Analyseeinrichtung (24) zum Ausführen
einer linearen Prädiktionsanalyse und zum Berechnen eines
LPC-Koeffizienten für jeden von der
Amplitudenbegrenzungseinrichtung (23) ausgegebenen Spracheingangsvektor;
einer LPC-Parameter-Umsetzungseinrichtung zum
Umsetzen jedes von der LPC-Analyseeinrichtung (24)
berechneten LPC-Koeffizienten in einen LSP-Parameter;
einer Vektorquantisierungseinrichtung zum
Quantisieren des LSP-Parameters unter Verwendung eines
Vektorquantisierungsprozesses;
einer LPC-Koeffizienten-Umsetzungseinrichtung zum
Umsetzen des quantisierten LSP-Parameters in einen
quantisierten LPC-Koeffizienten;
einer Synthetisierungseinrichtung (26) zum
Synthetisieren eines synthetischen Sprachvektors auf der
Grundlage eines von außerhalb gelieferten Treibervektors
und des quantisierten LPC-Koeffizienten;
einer Abweichungsdaten-Berechnungseinrichtung
(33) zum Berechnen von Abweichungsdaten durch
Subtrahieren des von der Synthetisierungseinrichtung (26)
ausgegebenen synthetischen Sprachvektors von dem von der
Amplitudenbegrenzungseinrichtung (23) ausgegebenen
Spracheingangsvektor;
einer Wahrnehmungsgewichtungseinrichtung (34) zum
Gewichten der von der
Abweichungsdaten-Berechnungseinrichtung (33) erhaltenen Abweichungsdaten;
einer Abweichungsgrad-Berechnungseinrichtung (35)
zum Berechnen des Abweichungsgrades der Abweichungsdaten
in bezug auf jede Abweichungsdateneinheit, die von der
Wahrnehmungsgewichtungseinrichtung (34) gewichtet wird;
einer Schrittweitenvektor-Sucheinrichtung (27)
zum Speichern mehrerer Schrittweitenvektoren und zum
Auswählen eines Schrittweitenvektors aus den mehreren
gespeicherten Schrittweitenvektoren;
einer Rauschsignalformvektor-Sucheinrichtung (28)
zum Speichern mehrerer Rauschsignalformvektoren und zum
Auswählen eines Rauschsignalformvektors aus den mehreren
gespeicherten Rauschsignalformvektoren;
einer Verstärkungsfaktor-Anpassungseinrichtung
(29) zum Berechnen eines Prädiktionsverstärkungsfaktors
für jeden durch die
Rauschsignalformvektor-Sucheinrichtung (28) ausgewählten Rauschsignalformvektor;
einer
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30) zum Multiplizieren des von der
Verstärkungsfaktor-Anpassungseinrichtung (29) berechneten
Prädiktionsverstärkungsfaktors mit dem von der
Rauschsignalformvektor-Sucheinrichtung (28) ausgewählten
Rauschsignalformvektor;
einer
Verstärkungsfaktor-Multiplikationseinrichtung (31) zum Speichern mehrerer Verstärkungsfaktoren und
zum Multiplizieren eines aus den mehreren gespeicherten
Verstärkungsfaktoren ausgewählten Verstärkungsfaktors mit
dem von der Schrittweitenvektor-Sucheinrichtung (27)
ausgewählten Schrittweitenvektor bzw. mit einem
Ausgangsvektor der
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30);
einer Addiereinrichtung (32) zum Addieren zweier
Multiplikationsergebnisse, die von der
Verstärkungsfaktor-Multiplikationseinrichtung (31) erhalten werden, und
Liefern des Additionsergebnisses an die
Synthetisierungseinrichtung (26) als den Treibervektor;
einer Steuereinrichtung zum Auswählen eines
Werts, der den von der
Abweichungsgrad-Berechnungseinrichtung (35) berechneten Abweichungsgrad minimal macht,
wenn ein Schrittweitenvektor durch die
Schrittweitenvektor-Sucheinrichtung (27) ausgewählt wird, zum Auswählen
eines Rauschsignalformvektors durch die
Rauschsignalformvektor-Sucheinrichtung (28) und zum Auswählen eines
Verstärkungsfaktors durch die
Verstärkungsfaktor-Multiplikationseinrichtung (31);
einer Codeausgabeeinrichtung (36) zum Codieren
von von den Struktureinrichtungen erhaltenen
verarbeiteten Informationen in Bitreihen, zum Addieren einer
Fehlerkorrekturcodierung, falls notwendig, und zum
anschließenden Übertragen der codierten Bitreihen;
wobei der durch die
Vektorquantisierungseinrichtung quantisierte LSP-Parameter durch einen gewichteten
Mittelwertvektor mehrerer Vektoren der laufenden
Rahmenoperation und vorhergehender Rahmenoperationen gegeben
ist.
17. Sprachcodierungsvorrichtung nach Anspruch 16, in
der die Vektorquantisierungseinrichtung enthält:
eine Vektorspeichereinrichtung (37) zum Speichern
mehrerer Vektoren;
eine Auswähleinrichtung (40) zum Auswählen eines
Vektors aus mehreren in der Vektorspeichereinrichtung
(37) gespeicherten Vektoren;
eine erste Multiplikationseinrichtung (42) zum
Multiplizieren einer Verhältniskonstanten (g) eines
gewichteten Mittelwerts mit dem von der Auswähleinrichtung
(40) ausgewählten Vektor;
eine zweite Multiplikationseinrichtung (38) zum
Multiplizieren einer Verhältniskonstanten (1 - g) eines
gewichteten Mittelwerts mit dem während der Verarbeitung
des der laufenden Rahmenoperation unmittelbar
vorhergehenden Rahmens (eines Rahmens vor der laufenden
Rahmenoperation) von der Auswähleinrichtung (40)
ausgewählten Vektor;
eine Addiereinrichtung (39) zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors der ersten Multiplikationseinrichtung
(42) und eines Ausgangsvektors der zweiten
Multiplikationseinrichtung (38);
eine Abweichungsdaten-Berechnungseinrichtung (41)
zum Berechnen der Abweichungsdaten zwischen einem
LSP-Parameter (Ψk) vor der Quantisierung und dem quantisierten
LSP-Parameter (Ωk);
eine Steuereinrichtung zum Auswählen eines
Vektors, der die von der
Abweichungsdaten-Berechnungseinrichtung (41) berechneten Abweichungsdaten minimal macht,
zu dem Zeitpunkt, zu dem ein Vektor von der
Auswähleinrichtung (40) gewählt wird;
eine Liefereinrichtung zum Liefern von
Identifizierungsinformationen (S1) eines von der
Auswähleinrichtung (40) ausgewählten Vektors als die verarbeiteten
Informationen an die Codeausgabeeinrichtung (36).
18. Sprachcodierungsvorrichtung nach Anspruch 16, in
der die Vektorquantisierungseinrichtung enthält:
eine Vektorspeichereinrichtung zum Speichern
mehrerer Vektoren;
eine Auswähleinrichtung zum Auswählen eines
Vektors aus mehreren in der Vektorspeichereinrichtung
gespeicherten Vektoren;
eine Addiereinrichtung zum Berechnen der Summe
von Vektoren, die von der laufenden Rahmenoperation bis
zu einer Rahmenoperation, die n Rahmen vor der laufenden
Rahmenoperation liegt, verarbeitet wurden, für jeden von
der Auswähleinrichtung ausgewählten Vektor;
eine Dividiereinrichtung zum Berechnen des
quantisierten LSP-Parameters durch Dividieren eines
Ausgangsvektors des zweiten Unterschrittes durch n + 1;
eine Abweichungsdaten-Berechnungseinrichtung zum
Berechnen der Abweichungsdaten zwischen einem
LSP-Parameter vor der Quantisierung und dem quantisierten
LSP-Parameter;
eine Steuereinrichtung zum Auswählen eines
Vektors, der die von der
Abweichungsdaten-Berechnungseinrichtung berechneten Abweichungsdaten minimal macht, zu
dem Zeitpunkt, zu dem von der Auswähleinrichtung ein
Vektor ausgewählt wird;
eine Liefereinrichtung zum Liefern von
Identifizierungsinformationen eines von der Auswähleinrichtung
ausgewählten Vektors als die verarbeiteten Informationen
an die Codeausgabeeinrichtung (36).
19. Sprachcodierungsvorrichtung nach Anspruch 16, in
der die Vektorquantisierungseinrichtung enthält:
eine erste Vektorspeichereinrichtung zum
Speichern von mehreren Vektoren;
eine erste Auswähleinrichtung zum Auswählen eines
Vektors aus mehreren in der Vektorspeichereinrichtung
gespeicherten Vektoren;
eine zweite Vektorspeichereinrichtung zum
Speichern mehrerer Vektoren;
eine zweite Auswähleinrichtung zum Auswählen
eines Vektors aus mehreren in der zweiten
Vektorspeichereinrichtung gespeicherten Vektoren;
eine erste Addiereinrichtung zum Erhalten der
Summe von Vektoren, die von der laufenden Rahmenoperation
bis zu einer Rahmenoperation, die n Rahmen vor der
laufenden Rahmenoperation liegen, verarbeitet wurden, für
jeden von der ersten Auswähleinrichtung ausgewählten
Vektor;
eine zweite Addiereinrichtung zum Addieren eines
Ausgangsvektors der ersten Addiereinrichtung und des von
der zweiten Auswähleinrichtung ausgewählten Vektors;
eine Dividiereinrichtung zum Erhalten des
quantisierten LSP-Parameters durch Dividieren des
Ausgangsvektors der zweiten Addiereinrichtung durch n + 2;
eine Abweichungsdaten-Berechnungseinrichtung zum
Berechnen der Abweichungsdaten zwischen einem
LSP-Parameter vor der Quantisierung und dem quantisierten
LSP-Parameter;
eine Steuereinrichtung zum Auswählen eines
Vektors, der die von der
Abweichungsdaten-Berechnungseinrichtung berechneten Abweichungsdaten minimal macht, zu
dem Zeitpunkt, zu dem von der ersten Auswähleinrichtung
und von der zweiten Auswähleinrichtung Vektoren
ausgewählt werden;
eine Liefereinrichtung zum Liefern von
Identifizierungsinformationen von von der ersten
Auswähleinrichtung und von der zweiten Auswähleinrichtung ausgewählten
Vektoren als die verarbeiteten Informationen an die
Codeausgabeeinrichtung (36).
20. Sprachcodierungsvorrichtung nach Anspruch 16, in
der die Vektorquantisierungseinrichtung enthält:
eine Vektorspeichereinrichtung (37) zum Speichern
mehrerer Vektoren;
eine Multiplikationseinrichtung (45&sub1; - 45n) zum
Multiplizieren einer Verhältniskonstanten (gk) eines
gewichteten Mittelwerts mit jedem in der
Vektorspeichereinrichtung (37) gespeicherten Vektor;
eine Auswähleinrichtung (46) zum Auswählen eines
Vektors aus den multiplizierten Vektoren;
eine Multiplikationseinrichtung (47) zum
Multiplizieren einer Verhältniskonstanten (1 - gk) eines
gewichteten Mittelwerts mit dem während der Verarbeitung
des der laufenden Rahmenoperation unmittelbar
vorhergehenden
Rahmens (eines Rahmens vor der laufenden
Rahmenoperation) von der Auswähleinrichtung (46)
ausgewählten Vektor;
eine Addiereinrichtung (39) zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors der Auswähleinrichtung (46) und eines
Ausgangsvektors der Multiplikationseinrichtung (47);
eine Abweichungsdaten-Berechnungseinrichtung (41)
zum Berechnen der Abweichungsdaten zwischen einem
LSP-Parameter (Ψk) vor der Quantisierung und dem quantisierten
LSP-Parameter (Ωk);
eine Steuereinrichtung zum Auswählen eines
Vektors, der die von der
Abweichungsdaten-Berechnungseinrichtung (41) berechneten Abweichungsdaten minimal macht,
zu dem Zeitpunkt, zu dem von der Auswähleinrichtung (46)
ein Vektor ausgewählt wird;
eine Liefereinrichtung zum Liefern von
Identifizierungsinformationen (5 1) eines von der
Auswähleinrichtung (46) ausgewählten Vektors als die verarbeiteten
Informationen an die Codeausgabeeinrichtung (36).
21. Sprachcodierungsvorrichtung nach Anspruch 16, in
der die Vektorquantisierungseinrichtung enthält:
eine Vektorspeichereinrichtung (37) zum Speichern
mehrerer Vektoren;
eine erste Auswähleinrichtung (40) zum Auswählen
eines Vektors aus mehreren Vektoren, die in der
Vektorspeichereinrichtung (37) gespeichert sind;
eine erste Multiplikationseinrichtung (50) zum
Multiplizieren einer Verhältniskonstanten (g1) eines
ersten gewichteten Mittelwerts mit dem von der ersten
Auswähleinrichtung (40) ausgewählten Vektor;
einer zweiten Multiplikationseinrichtung (51) zum
Multiplizieren einer Verhältniskonstanten (g2) eines
zweiten gewichteten Mittelwerts mit dem von der ersten
Auswähleinrichtung (40) ausgewählten Vektor;
eine zweite Auswähleinrichtung (52) zum Auswählen
eines Vektors aus einem Ausgangsvektor der ersten
Multiplikationseinrichtung (50) und einem Ausgangsvektor der
zweiten Multiplikationseinrichtung (51);
eine dritte Multiplikationseinrichtung (47) zum
Multiplizieren einer Verhältniskonstanten (1 - g1) eines
dritten gewichteten Mittelwerts mit dem während der
Verarbeitung des der laufenden Rahmenoperation unmittelbar
vorhergehenden Rahmens (eines Rahmens vor der laufenden
Rahmenoperation) von der ersten Auswähleinrichtung (40)
ausgewählten Vektor;
eine vierte Multiplikationseinrichtung (48) zum
Multiplizieren einer Verhältniskonstanten (1 - g2) eines
vierten gewichteten Mittelwerts mit dem während der
Verarbeitung des der laufenden Rahmenoperation unmittelbar
vorhergehenden Rahmens (eines Rahmens vor der laufenden
Rahmenoperation) von der ersten Auswähleinrichtung (40)
ausgewählten Vektor;
eine dritte Auswähleinrichtung (49) zum Auswählen
eines Vektors aus einem Ausgangsvektor der dritten
Multiplikationseinrichtung (47) und einem Ausgangsvektor der
vierten Multiplikationseinrichtung (48);
eine Addiereinrichtung (39) zum Erhalten des
quantisierten LSP-Parameters (Ωk) durch Addieren eines
Ausgangsvektors der zweiten Auswähleinrichtung (52) und
eines Ausgangsvektors der dritten Auswähleinrichtung
(49);
eine Abweichungsdaten-Berechnungseinrichtung (41)
zum Berechnen der Abweichungsdaten zwischen einem
LSP-Parameter (Ψk) vor der Quantisierung und dem quantisierten
LSP-Parameter (Ωk);
eine Steuereinrichtung zum Auswählen eines
Vektors, der die von der
Abweichungsdaten-Berechnungseinrichtung (41) berechneten Abweichungsdaten minimal macht,
zu dem Zeitpunkt, zu dem ein Vektor von der ersten
Auswähleinrichtung (40), von der zweiten Auswähleinrichtung
(52) und von der dritten Auswähleinrichtung (49)
ausgewählt wird;
eine Liefereinrichtung zum Liefern von
Identifizierungsinformationen (S1, S2) eines von der ersten
Auswähleinrichtung (40), von der zweiten Auswähleinrichtung
(52) und von der dritten Auswähleinrichtung (49)
ausgewählten Vektors als die verarbeiteten Informationen an
die Codeausgabeeinrichtung (36).
22. Sprachcodierungsvorrichtung nach Anspruch 16, in
der die Vektorquantisierungseinrichtung enthält:
eine Vektorspeichereinrichtung (37) zum Speichern
mehrerer Vektoren;
eine erste Auswähleinrichtung (40) zum Auswählen
eines Vektors aus mehreren in der
Vektorspeichereinrichtung (37) gespeicherten Vektoren;
eine erste Multiplikationseinrichtung (50) zum
Multiplizieren einer Verhältniskonstanten (g1) eines
ersten gewichteten Mittelwerts mit dem von der ersten
Auswähleinrichtung (40) ausgewählten Vektor;
eine zweite Multiplikationseinrichtung (51) zum
Multiplizieren einer Verhältniskonstanten (g2) eines
zweiten gewichteten Mittelwerts mit dem von der ersten
Auswähleinrichtung (40) ausgewählten Vektor;
eine zweite Auswähleinrichtung (52) zum Auswählen
eines Vektors aus einem Ausgangsvektor der ersten
Multiplikationseinrichtung (50) und einem Ausgangsvektor der
zweiten Multiplikationseinrichtung (51);
eine mehrstufige Gewichtungseinrichtung, die eine
Verarbeitungseinrichtung zum Ausführen einer Verarbeitung
für jeden Rahmen von dem der laufenden Rahmenoperation
unmittelbar vorhergehenden Rahmen bis zu einer
Rahmenoperation, die n Rahmen vor der laufenden Rahmenoperation
liegt, besitzt, wobei die Verarbeitungseinrichtung
enthält:
eine Multiplikationseinrichtung (47, 56, 58, 60)
zum Multiplizieren einer Verhältniskonstanten eines
vorgegebenen gewichteten Mittelwerts mit einem während der
Verarbeitung eines vorhergehenden Rahmens von der ersten
Auswähleinrichtung (40) ausgewählten Vektor;
eine separate Multiplikationseinrichtung (48, 57,
59, 61) zum Multiplizieren einer Verhältniskonstanten
eines vorgegebenen gewichteten Mittelwerts mit einem
während der Verarbeitung eines vorhergehenden Rahmens von
der ersten Auswähleinrichtung (40) ausgewählten Vektor;
eine Auswähleinrichtung (49, 62, 63, 64) zum
Auswählen eines Vektors aus den Ausgangsvektoren der beiden
Multiplikationseinrichtungen;
eine erste Addiereinrichtung (53, 54, 55) zum
Erhalten der Summe aus n Vektoren, die von der mehrstufigen
Gewichtungseinrichtung ausgewählt werden;
eine zweite Addiereinrichtung (39) zum Erhalten
des quantisierten LSP-Parameters (Ωk) durch Addieren
eines Ausgangsvektors der zweiten Auswähleinrichtung (52)
und eines Ausgangsvektors der ersten Addiereinrichtung
(53);
eine Abweichungsdaten-Berechnungseinrichtung (41)
zum Berechnen der Abweichungsdaten zwischen einem
LSP-Parameter (Ψk) vor der Quantisierung und dem quantisierten
LSP-Parameter (Ωk);
eine Steuereinrichtung zum Auswählen eines
Vektors, der die von der
Abweichungsdaten-Berechnungseinrichtung (41) berechneten Abweichungsdaten minimal macht,
zu dem Zeitpunkt, zu dem von der Auswähleinrichtung (40,
52, 49, 62, 63, 64) ein Vektor ausgewählt wird;
eine Liefereinrichtung zum Liefern von
Identifizierungsinformationen (S1, S2) eines von der
Auswähleinrichtung (40, 52, 491 62, 63, 64) ausgewählten Vektors
als die verarbeiteten Informationen an die
Codeausgabeeinrichtung (36).
23. Sprachcodierungsvorrichtung nach einem der
Ansprüche 17-22, in der sich die Verhältniskonstante (g,
1 - g, gk, 1 - gk, g1, g2, 1 - g1, 1 - g2) eines
gewichteten Mittelwerts von jedem Vektorelement unterscheidet,
mit dem die Verhältniskonstante multipliziert wird.
24. Sprachcodierungsvorrichtung nach einem der
Ansprüche 17-23, in der jeder in der
Vektorspeichereinrichtung (37) gespeicherte Vektor durch die Summe mehrerer
Vektoren mit unterschiedlichen Dimensionen gegeben ist.
25. Sprachcodierungsvorrichtung nach einem der
Ansprüche 17-24, in der die Steuereinrichtung in bezug auf
Parameter w1, w2, w3, ... , wp - 2, wp - 1, wp, die einen
aus der Vektorspeichereinrichtung (37) ausgewählten
p-dimensionalen Vektor {w1, w2, w3, ... , wp - 2, wp - 1, wp}
bilden, die Parameter einstellt, sofern die Beziehung
0 < w1 < w2 < w3 < ... < wp - 2 < wp - 1 < wp < p nicht
erfüllt ist, damit die Beziehung erfüllt wird.
26. Sprachcodierungsvorrichtung nach einem der
Ansprüche 16-25, in der die
Verstärkungsfaktor-Anpassungseinrichtung (29) den Prädiktionsverstärkungsfaktor durch
Ausführen einer linearen Prädiktionsanalyse auf der
Grundlage des Grades eines Ausgangsvektors einer
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30),
der während der Verarbeitung der
Verstärkungsfaktor-Multiplikationseinrichtung (31) des laufenden Rahmens mit
einem Verstärkungsfaktor multipliziert wird, und des
Grades eines Ausgangsvektors einer
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), der während der
Verarbeitung der
Verstärkungsfaktor-Multiplikationseinrichtung (31) für einen vergangenen Rahmen mit einem
Verstärkungsfaktor multipliziert wird, berechnet.
27. Sprachcodierungsvorrichtung nach einem der
Ansprüche 16-26, in der die
Verstärkungsfaktor-Multiplikationseinrichtung (31) enthält:
eine erste
Unterverstärkungsfaktor-Multiplikationseinrichtung (31a) zum Multiplizieren eines
Verstärkungsfaktors, der aus mehreren darin gespeicherten
Verstärkungsfaktoren ausgewählt ist, mit der Hälfte des von
der Schrittweitenvektor-Sucheinrichtung (27) ausgewählten
Schrittweitenvektors und der Hälfte des Ausgangsvektors
der
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30);
eine zweite
Unterverstärkungsfaktor-Multiplikationseinrichtung (31b) zum Multiplizieren eines
Verstärkungsfaktors, der aus mehreren darin gespeicherten
Verstärkungsfaktoren ausgewählt ist, mit der verbleibenden
Hälfte des von der Schrittweitenvektor-Sucheinrichtung
(27) ausgewählten Schrittweitenvektors und der
verbleibenden Hälfte des Ausgangsvektors der
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30);
eine erste Addiereinrichtung zum Liefern der
Summe aus einem Schrittweitenvektor, der von der ersten
Unterverstärkungsfaktor-Multiplikationseinrichtung (31a)
mit einem Verstärkungsfaktor multipliziert ist, und einem
Schrittweitenvektor, der von der zweiten
Unterverstärkungsfaktor-Multiplikationseinrichtung (31b) mit einem
Verstärkungsfaktor multipliziert ist, als
Schrittweitenvektor, der von der
Verstärkungsfaktor-Multiplikationseinrichtung (31) mit einem Verstärkungsfaktor
multipliziert ist, an die Addiereinrichtung (32);
eine zweite Addiereinrichtung zum Liefern der
Summe aus einem Ausgangsvektor der
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), der von der
ersten Unterverstärkungsfaktor-Multiplikationseinrichtung
(31a) mit einem Verstärkungsfaktor multipliziert ist, und
einem Ausgangsvektor der Prädiktionsverstärkungsfaktor-
Multiplikationseinrichtung (30), der von der zweiten
Unterverstärkungsfaktor-Multiplikationseinrichtung (31b)
mit einem Verstärkungsfaktor multipliziert ist, als
Ausgangsvektor der
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung (30), der von der Verstärkungsfaktor-
Multiplikationseinrichtung (31) mit einem
Verstärkungsfaktor multipliziert ist, an die Addiereinrichtung (32).
28. Sprachcodierungsvorrichtung nach einem der
Ansprüche 16-27, in der die
Schrittweitenvektor-Sucheinrichtung (27) enthält:
eine Vorauswähleinrichtung (68) zum Berechnen
eines Korrelationswerts zwischen einem von der
Amplitudenbegrenzungseinrichtung (23) ausgegebenen
Eingangssprachvektor und einem von der Synthetisierungseinrichtung (26)
ausgegebenen synthetischen Sprachvektor durch Ausführen
einer Rückwärtsfilterung in bezug auf sämtliche
Schrittweitenvektoren, die in der
Schrittweitenvektor-Speichereinrichtung (66) gespeichert sind; zum Auswählen
eines Schrittweitenvektors, der ermöglicht, daß der
Korrelationswert vorgegebene Bedingungen erfüllt; und zum
Liefern des ausgewählten Schrittweitenvektors an die
Verstärkungsfaktor-Multiplikationseinrichtung (31).
29. Sprachcodierungsvorrichtung nach einem der
Ansprüche 16-28, in der die
Rauschsignalformvektor-Sucheinrichtung (28) enthält:
eine erste Erregungsvektor-Speichereinrichtung
(67a) zum Speichern mehrerer Erregungsvektoren;
eine erste Vorauswähleinrichtung (69) zum
Berechnen eines Korrelationswerts zwischen einem von der
Amplitudenbegrenzungseinrichtung (23) ausgegebenen
Eingangssprachvektor und einem von der
Synthetisierungseinrichtung (26) ausgegebenen synthetischen Sprachvektor durch
Ausführen einer Rückwärtsfilterung in bezug auf sämtliche
Erregungsvektoren, die in der ersten Erregungsvektor-
Speichereinrichtung (67a) gespeichert sind, und zum
Auswählen
eines Erregungsvektors, der ermöglicht, daß der
Korrelationswert vorgegebene Bedingungen erfüllt;
eine zweite Erregungsvektor-Speichereinrichtung
(67b) zum Speichern mehrerer Erregungsvektoren;
eine zweite Vorauswähleinrichtung (70) zum
Berechnen eines Korrelationswerts zwischen einem von der
Amplitudenbegrenzungseinrichtung (23) ausgegebenen
Eingangssprachvektor und einem von der
Synthetisierungseinrichtung (26) ausgegebenen synthetischen Sprachvektor
durch Ausführen einer Rückwärtsfilterung in bezug auf
sämtliche Erregungsvektoren, die in der zweiten
Erregungsvektor-Speichereinrichtung (67b) gespeichert sind,
und zum Auswählen eines Erregungsvektors, der ermöglicht,
daß der Korrelationswert vorgegebene Bedingungen erfüllt;
eine Addiereinrichtung zum Addieren eines
Ausgangsvektors der ersten Vorauswähleinrichtung (69) und
eines Ausgangsvektors der zweiten Vorauswähleinrichtung
(70) und zum Liefern des Additionsergebnisses an die
Prädiktionsverstärkungsfaktor-Multiplikationseinrichtung
(30) als den Rauschsignalformvektor.
30. Sprachcodierungsvorrichtung nach einem der
Ansprüche 28, 29, in der dann, wenn der
Eingangssprachvektor mit XT bezeichnet ist, ein Impulsantwortkoeffizient
der Synthetisierungseinrichtung (26) mit H bezeichnet ist
und entweder der Schrittweitenvektor oder der
Rauschsignalformvektor mit V'i bezeichnet ist, der synthetische
Sprachvektor HV'i lautet, der Korrelationswert XTTHV'i
lautet und die Rückwärtsfilterung dadurch ausgeführt
wird, daß zuerst XTTH berechnet wird, gefolgt von der
Berechnung von (XTTH) V'i.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04170895A JP3087796B2 (ja) | 1992-06-29 | 1992-06-29 | 音声の予測符号化装置 |
JP4265194A JP2853824B2 (ja) | 1992-10-02 | 1992-10-02 | 音声のパラメータ情報符号化法 |
JP26519592A JP2776474B2 (ja) | 1992-10-02 | 1992-10-02 | 多段ベクトル量子化法 |
JP07053493A JP3148778B2 (ja) | 1993-03-29 | 1993-03-29 | 音声の符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69309557D1 DE69309557D1 (de) | 1997-05-15 |
DE69309557T2 true DE69309557T2 (de) | 1997-10-09 |
Family
ID=27465260
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69309557T Expired - Lifetime DE69309557T2 (de) | 1992-06-29 | 1993-06-28 | Verfahren und Vorrichtung zur Sprachkodierung |
DE69328450T Expired - Lifetime DE69328450T2 (de) | 1992-06-29 | 1993-06-28 | Verfahren und Vorrichtung zur Sprachkodierung |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69328450T Expired - Lifetime DE69328450T2 (de) | 1992-06-29 | 1993-06-28 | Verfahren und Vorrichtung zur Sprachkodierung |
Country Status (3)
Country | Link |
---|---|
US (1) | US5787391A (de) |
EP (2) | EP0751496B1 (de) |
DE (2) | DE69309557T2 (de) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3559588B2 (ja) * | 1994-05-30 | 2004-09-02 | キヤノン株式会社 | 音声合成方法及び装置 |
US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
US5648989A (en) * | 1994-12-21 | 1997-07-15 | Paradyne Corporation | Linear prediction filter coefficient quantizer and filter set |
SE504397C2 (sv) * | 1995-05-03 | 1997-01-27 | Ericsson Telefon Ab L M | Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
TW317051B (de) * | 1996-02-15 | 1997-10-01 | Philips Electronics Nv | |
JP3259759B2 (ja) * | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
CA2213909C (en) * | 1996-08-26 | 2002-01-22 | Nec Corporation | High quality speech coder at low bit rates |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US7024355B2 (en) * | 1997-01-27 | 2006-04-04 | Nec Corporation | Speech coder/decoder |
JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
US6021325A (en) * | 1997-03-10 | 2000-02-01 | Ericsson Inc. | Mobile telephone having continuous recording capability |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
KR100900113B1 (ko) | 1997-10-22 | 2009-06-01 | 파나소닉 주식회사 | 확산 펄스 벡터 생성 장치 및 방법 |
JP3842432B2 (ja) | 1998-04-20 | 2006-11-08 | 株式会社東芝 | ベクトル量子化方法 |
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
JP2000056799A (ja) * | 1998-08-06 | 2000-02-25 | Matsushita Electric Ind Co Ltd | 励振信号生成装置並びに音声符号化装置及び音声復号化装置 |
US6714907B2 (en) | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US6556966B1 (en) | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6493665B1 (en) * | 1998-08-24 | 2002-12-10 | Conexant Systems, Inc. | Speech classification and parameter weighting used in codebook search |
SE519563C2 (sv) * | 1998-09-16 | 2003-03-11 | Ericsson Telefon Ab L M | Förfarande och kodare för linjär prediktiv analys-genom- synteskodning |
CA2259094A1 (en) * | 1999-01-15 | 2000-07-15 | Universite De Sherbrooke | A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
JP4005359B2 (ja) * | 1999-09-14 | 2007-11-07 | 富士通株式会社 | 音声符号化及び音声復号化装置 |
EP1221162B1 (de) * | 1999-09-30 | 2005-06-29 | STMicroelectronics Asia Pacific Pte Ltd. | G.723.1 audiokodierer |
EP2040253B1 (de) * | 2000-04-24 | 2012-04-11 | Qualcomm Incorporated | Prädikitve Dequantisierung von stimmhaften Sprachsignalen |
KR100355033B1 (ko) * | 2000-12-30 | 2002-10-19 | 주식회사 실트로닉 테크놀로지 | 선형예측 분석을 이용한 워터마크 삽입/추출 장치 및 그방법 |
US7647223B2 (en) * | 2001-08-16 | 2010-01-12 | Broadcom Corporation | Robust composite quantization with sub-quantizers and inverse sub-quantizers using illegal space |
US7617096B2 (en) * | 2001-08-16 | 2009-11-10 | Broadcom Corporation | Robust quantization and inverse quantization using illegal space |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
JP2005202262A (ja) * | 2004-01-19 | 2005-07-28 | Matsushita Electric Ind Co Ltd | 音声信号符号化方法、音声信号復号化方法、送信機、受信機、及びワイヤレスマイクシステム |
JP4599558B2 (ja) * | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
US7831420B2 (en) * | 2006-04-04 | 2010-11-09 | Qualcomm Incorporated | Voice modifier for speech processing systems |
US20090198491A1 (en) * | 2006-05-12 | 2009-08-06 | Panasonic Corporation | Lsp vector quantization apparatus, lsp vector inverse-quantization apparatus, and their methods |
US8189621B2 (en) * | 2006-05-12 | 2012-05-29 | Microsoft Corporation | Stack signaling to application with lack of requested bandwidth |
US20110004469A1 (en) * | 2006-10-17 | 2011-01-06 | Panasonic Corporation | Vector quantization device, vector inverse quantization device, and method thereof |
US8144793B2 (en) | 2006-12-12 | 2012-03-27 | Microsoft Corporation | Cognitive multi-user OFDMA |
WO2008072732A1 (ja) * | 2006-12-14 | 2008-06-19 | Panasonic Corporation | 音声符号化装置および音声符号化方法 |
US20080162150A1 (en) * | 2006-12-28 | 2008-07-03 | Vianix Delaware, Llc | System and Method for a High Performance Audio Codec |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
US8195452B2 (en) * | 2008-06-12 | 2012-06-05 | Nokia Corporation | High-quality encoding at low-bit rates |
ES2650492T3 (es) * | 2008-07-10 | 2018-01-18 | Voiceage Corporation | Dispositivo y método de cuantificación de filtro LPC de múltiples referencias |
WO2010007211A1 (en) | 2008-07-17 | 2010-01-21 | Nokia Corporation | Method and apparatus for fast nearestneighbor search for vector quantizers |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
CN104751850B (zh) * | 2013-12-25 | 2021-04-02 | 北京天籁传音数字技术有限公司 | 一种用于音频信号的矢量量化编解码方法及装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3779351D1 (de) * | 1986-03-28 | 1992-07-02 | American Telephone And Telegraph Co., New York, N.Y., Us | |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
US5010574A (en) * | 1989-06-13 | 1991-04-23 | At&T Bell Laboratories | Vector quantizer search arrangement |
US4975956A (en) * | 1989-07-26 | 1990-12-04 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
EP0481107B1 (de) * | 1990-10-16 | 1995-09-06 | International Business Machines Corporation | Sprachsyntheseeinrichtung nach dem phonetischen Hidden-Markov-Modell |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5432883A (en) * | 1992-04-24 | 1995-07-11 | Olympus Optical Co., Ltd. | Voice coding apparatus with synthesized speech LPC code book |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
US5426460A (en) * | 1993-12-17 | 1995-06-20 | At&T Corp. | Virtual multimedia service for mass market connectivity |
-
1993
- 1993-06-28 EP EP96202584A patent/EP0751496B1/de not_active Expired - Lifetime
- 1993-06-28 DE DE69309557T patent/DE69309557T2/de not_active Expired - Lifetime
- 1993-06-28 EP EP93401656A patent/EP0577488B9/de not_active Expired - Lifetime
- 1993-06-28 DE DE69328450T patent/DE69328450T2/de not_active Expired - Lifetime
-
1996
- 1996-06-05 US US08/658,303 patent/US5787391A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69309557D1 (de) | 1997-05-15 |
EP0577488B9 (de) | 2007-10-03 |
EP0751496A2 (de) | 1997-01-02 |
EP0577488A1 (de) | 1994-01-05 |
DE69328450T2 (de) | 2001-01-18 |
EP0751496A3 (de) | 1997-01-22 |
EP0751496B1 (de) | 2000-04-19 |
EP0577488B1 (de) | 1997-04-09 |
DE69328450D1 (de) | 2000-05-25 |
US5787391A (en) | 1998-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69309557T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
DE19647298C2 (de) | Kodiersystem | |
DE69023402T2 (de) | Verfahren zur Sprachkodierung und -dekodierung. | |
DE69634179T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung | |
DE69932460T2 (de) | Sprachkodierer/dekodierer | |
DE69029232T2 (de) | System und Methode zur Sprachkodierung | |
DE69836624T2 (de) | Audiokodierer und -dekodierer | |
DE60126149T2 (de) | Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen | |
DE69531642T2 (de) | Synthese eines Anregungssignals bei Ausfall von Datenrahmen oder Verlust von Datenpaketen | |
DE69531471T2 (de) | Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung | |
DE69828725T2 (de) | Sprachcodier- und -decodiersystem | |
DE69928288T2 (de) | Kodierung periodischer sprache | |
DE4492048C2 (de) | Vektorquantisierungs-Verfahren | |
DE3853916T2 (de) | Digitaler-sprachkodierer mit verbesserter vertoranregungsquelle. | |
DE60226308T2 (de) | Quantisierung der Anregung in einem Geräuschrückkopplungskodierungssytem mit allgemeiner Rauschformung | |
DE69916321T2 (de) | Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen | |
DE69729527T2 (de) | Verfahren und Vorrichtung zur Kodierung von Sprachsignalen | |
DE69731588T2 (de) | Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem | |
DE69832358T2 (de) | Verfahren zur Sprachkodierung und -dekodierung | |
DE60309651T2 (de) | Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens | |
DE69033510T3 (de) | Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung | |
DE60028500T2 (de) | Sprachdekodierung | |
DE69725945T2 (de) | Sprachkodierer mit niedriger Bitrate | |
DE69017842T2 (de) | Verfahren und Einrichtung zur Codierung von Prädiktionsfiltern in Vocodern mit sehr niedriger Datenrate. | |
DE68917584T2 (de) | Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |