DE69828725T2 - Sprachcodier- und -decodiersystem - Google Patents

Sprachcodier- und -decodiersystem Download PDF

Info

Publication number
DE69828725T2
DE69828725T2 DE69828725T DE69828725T DE69828725T2 DE 69828725 T2 DE69828725 T2 DE 69828725T2 DE 69828725 T DE69828725 T DE 69828725T DE 69828725 T DE69828725 T DE 69828725T DE 69828725 T2 DE69828725 T2 DE 69828725T2
Authority
DE
Germany
Prior art keywords
signal
hierarchy
circuit
pulse
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69828725T
Other languages
English (en)
Other versions
DE69828725D1 (de
Inventor
Toshiyuki Minato-ku Nomura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of DE69828725D1 publication Critical patent/DE69828725D1/de
Application granted granted Critical
Publication of DE69828725T2 publication Critical patent/DE69828725T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Sprachcodier- und -decodiersystem auf der Grundlage einer hierarchischen Codierung.
  • Beschreibung des Stands der Technik
  • Herkömmlicherweise wurde ein Sprachcodier- und -decodiersystem, das auf einer hierarchischen Codierung beruht, wobei eine Abtastfrequenz eines Reproduktionssignals, abhängig von einer zu decodierenden Bitrate, veränderlich ist, verwendet, um es zu ermöglichen, ein Sprachsignal mit einer verhältnismäßig hohen Qualität zu decodieren, während die Bandbreite schmal ist, selbst wenn ein Teil der Pakete beim Übertragen des Sprachsignals auf einem Paketkommunikationsnetzwerk verlorengeht. Beispielsweise wurden in der ungeprüften japanischen Patentveröffentlichung Heisei 8-263096 (nachstehend als "Veröffentlichung 1'' bezeichnet) ein Codierverfahren und ein Decodierverfahren zum Ausführen einer hierarchischen Codierung eines akustischen Signals durch Bandzerlegung vorgeschlagen. Bei diesem Codierverfahren wird bei der Verwirklichung einer hierarchischen Codierung mit N Hierarchien ein aus einer niedrigen Bandkomponente eines Eingangssignals bestehendes Signal in einer ersten Hierarchie codiert und ein durch Subtrahieren von n – 1 bis zur (n – 1)-ten Hierarchie codierten und decodierten Signalen von einem aus einer Komponente des Eingangssignals mit einem breiteren Band als dasjenige der (n – 1)-ten Hierarchie bestehenden Signal abgeleitetes differentielles Signal in der n-ten Hierarchie (n = 2, ..., N – 1) codiert. In der N-ten Hierarchie wird ein durch Subtrahieren von N – 1 bis zur (N – 1)-ten Hierarchie codier ten und decodierten Signalen vom Eingangssignal abgeleitetes differentielles Signal codiert.
  • Mit Bezug auf 12 wird die Arbeitsweise des Sprachcodier- und -decodiersystems, bei dem ein CELP-Codierverfahren ("Code Excited Linear Predictive Coding Method") bei der Codierung jeder Hierarchie verwendet wird, erörtert. Zur Vereinfachung der Darlegung wird die Erörterung für den Fall gegeben, in dem die Anzahl der Hierarchien zwei ist. Eine ähnliche Erörterung wird in bezug auf drei oder mehr Hierarchien gegeben. In 12 ist eine Anordnung dargestellt, bei der ein durch ein Sprachcodiersystem codierter Bitstrom durch zwei Arten von Bitraten (nachstehend als hohe Bitrate und niedrige Bitrate bezeichnet) in einem Sprachdecodiersystem decodiert werden kann. Es sei bemerkt, daß 12 von den Erfindern für eine Technologie vorbereitet wurde, die für die vorliegende Erfindung auf der Grundlage der vorstehenden Veröffentlichung und später angegebener Veröffentlichungen relevant ist.
  • Das Sprachcodiersystem wird anhand 12 erörtert. Eine Downsampling-Schaltung 1 führt ein Downsampling eines Eingangssignals aus (konvertiert beispielsweise eine Abtastfrequenz von 16 kHz in 8 kHz), um ein erstes Eingangssignal zu erzeugen und es an eine erste CELP-Codierschaltung 2 auszugeben. Die Arbeitsweise der Downsampling-Schaltung 1 wurde in P. P. Vaidyanathan, "Multirate Systems and Filter Banks", Kapitel 4.1.1 (4.1–7) (nachstehend als Veröffentlichung 2 bezeichnet) erörtert. Weil auf die Erörterung in der Veröffentlichung 2 verwiesen werden kann, wird hier auf die Erörterung verzichtet.
  • Die erste CELP-Codierschaltung 2 führt eine lineare Vorhersageanalyse des ersten Eingangssignals für jeden vorbestimmten Rahmen aus, um einen linearen Vorhersagekoeffizienten abzuleiten, der Eigenschaften einer Spektrumseinhüllenden eines Sprachsignals ausdrückt, und codiert ein Erregungssignal eines entsprechenden Linearvorhersage-Synthesefilters bzw. des abgeleiteten linearen Vorhersage koeffizienten. Hierbei besteht das Erregungssignal aus einer Frequenzkomponente, die eine Tonhöhen- bzw. Pitchfrequenz, eine verbleibende Restkomponente und Verstärkungen davon angibt. Die die Tonhöhenfrequenz angebende Frequenzkomponente wird durch einen adaptiven Codevektor ausgedrückt, der in einem frühere Erregungssignale speichernden Codebuch, das als ein adaptives Codebuch bezeichnet wird, gespeichert ist. Die vorstehend erwähnte Restkomponente wird als ein Mehrfachimpulssignal ausgedrückt, wie in J-P. Adoul u.a. "Fast CELP Coding Based on Algebraic Codes" (Proc. ICASSP, S. 1957–1960, 1987) (nachstehend als "Veröffentlichung 3'' bezeichnet) offenbart ist.
  • Durch gewichtetes Summieren des vorstehend erwähnten adaptiven Codevektors und des Mehrfachimpulssignals mit einer im Verstärkungscodebuch gespeicherten Verstärkung wird das Erregungssignal erzeugt.
  • Ein reproduziertes Signal kann durch Ansteuern des vorstehend erwähnten Linearvorhersage-Synthesefilters durch das vorstehend erwähnte Erregungssignal synthetisiert werden. Hierbei wird die Auswahl des adaptiven Codevektors, des Mehrfachimpulssignals und der Verstärkung vorgenommen, um den Fehlerbetrag durch ein Hörbarkeitsgewichten eines Fehlersignals zwischen dem reproduzierten Signal und dem ersten Eingangssignal zu minimieren. Anschließend wird ein dem adaptiven Codevektor, dem Mehrfachimpulssignal, der Verstärkung und dem linearen Vorhersagekoeffizienten entsprechender Index an eine erste CELP-Decodierschaltung 3 und einen Multiplexer 7 ausgegeben.
  • In der ersten CELP-Decodierschaltung 3 wird die Decodierung ausgeführt, wobei der dem adaptiven Codevektor, dem Mehrfachimpulssignal, der Verstärkung und dem linearen Vorhersagekoeffizienten entsprechende Index als jeweilige Eingabe verwendet wird. Durch gewichtetes Summieren des adaptiven Codevektors und des mit der Verstärkung gewichteten Mehrfachimpulssignals wird das Erregungssignal abgeleitet. Durch Ansteuern des Linearvorhersage-Synthesefilters durch das Erregungssignal wird das reproduzierte Signal erzeugt. Weiterhin wird das reproduzierte Signal durch eine Upsampling-Schaltung 4 ausgegeben.
  • Die Upsampling-Schaltung 4 erzeugt ein Signal durch Upsampling (beispielsweise durch Konvertieren der Abtastfrequenz von 8 kHz zu 16 kHz) des reproduzierten Signals zur Ausgabe an eine Differenzierschaltung 5. Hier wird auf die Erörterung der Upsampling-Schaltung 4 verzichtet, weil auf Kapitel 4.1.1 (4.1–8) Bezug genommen werden kann.
  • Die Differenzierschaltung 5 erzeugt ein Differenzsignal des Eingangssignals und des einem Upsampling unterzogenen Reproduktionssignals und gibt es an eine zweite CELP-Codierschaltung 6 aus.
  • Die zweite CELP-Codierschaltung 6 bewirkt, ähnlich der ersten CELP-Codierschaltung 2, ein Codieren des differentiellen Eingangssignals. Der dem adaptiven Codevektor, dem Mehrfachimpulssignal, der Verstärkung und dem linearen Vorhersagekoeffizienten entsprechende Index wird an den Multiplexer 7 ausgegeben. Der Multiplexer 7 gibt die vier Arten von der ersten CELP-Codierschaltung 2 eingegebener Indizes und die vier Arten von der zweiten CELP-Codierschaltung 6 eingegebener Indizes bei einer Konvertierung in den Bitstrom aus.
  • Als nächstes wird das Sprachdecodiersystem erörtert. Das Sprachdecodiersystem schaltet den Betrieb, abhängig von einem Steuersignal, das zwei Arten von Bitraten, die für den Decodiervorgang geeignet sind, identifiziert, durch einen Demultiplexer 8 und eine Schaltstufe 13 um.
  • In den Demultiplexer 8 werden der Bitstrom und das Steuersignal eingegeben. Wenn das Steuersignal die hohe Bitrate angibt, werden die vier in der ersten CELP-Codierschaltung 2 codierten Indexarten und die vier von der zweiten CELP-Codierschaltung 6 codierten Indexarten extrahiert, um sie an eine erste CELP-Decodierschaltung 9 bzw. eine zweite CELP-Decodierschaltung 10 auszugeben. Wenn das Steuersignal andererseits eine niedrige Bitrate angibt, werden die vier in der ersten CELP-Codierschaltung 2 codierten Indexarten extrahiert, um nur sie an die erste CELP-Decodierschaltung 9 auszugeben.
  • Die erste CELP-Decodierschaltung 9 decodiert den adaptiven Codevektor, das Mehrfachimpulssignal, die Verstärkung bzw. den linearen Vorhersagekoeffizienten anhand der vier eingegebenen Indexarten durch den gleichen Vorgang wie derjenige der ersten Decodierschaltung 3, um das erste reproduzierte Signal zu erzeugen und es an die Schaltstufe 13 auszugeben.
  • In der Upsampling-Schaltung 11 wird das über die Schaltstufe 13 eingegebene erste reproduzierte Signal ähnlich wie in der Upsampling-Schaltung 4 einem Upsampling unterzogen, um das dem Upsampling unterzogene erste reproduzierte Signal an die Addierschaltung 12 auszugeben.
  • Die zweite CELP-Decodierschaltung 10 decodiert den adaptiven Codevektor, das Mehrfachimpulssignal, die Verstärkung bzw. den linearen Vorhersagekoeffizienten von den vier eingegebenen Indexarten, um das reproduzierte Signal zu erzeugen und es an die Addierschaltung 12 auszugeben.
  • Die Addierschaltung 12 addiert das eingegebene reproduzierte Signal und das von der Upsampling-Schaltung 11 einem Upsampling unterzogene erste reproduzierte Signal, um es als ein zweites reproduziertes Signal an die Schaltstufe 13 auszugeben.
  • In die Schaltstufe 13 werden das erste reproduzierte Signal, das zweite reproduzierte Signal und das Steuersignal eingegeben. Wenn das Steuersignal eine hohe Bitrate angibt, wird das eingegebene erste reproduzierte Signal an die Upsampling-Schaltung 11 ausgegeben, um das eingegebene zweite reproduzierte Signal als das reproduzierte Signal des Sprachcodiersystems auszugeben. Wenn andererseits das Steuersignal eine niedrige Bitrate angibt, wird das eingegebene erste reproduzierte Signal als das reproduzierte Signal des Sprachcodiersystems ausgegeben.
  • Als nächstes wird die Codierschaltung mit Bezug auf 13 auf der Grundlage des in der ersten CELP-Codierschaltung 2 und der zweiten CELP-Codierschaltung 6, die in 12 dargestellt sind, verwendeten CELP-Codierverfahrens erörtert.
  • Mit Bezug auf 13 sei bemerkt, daß eine Rahmenzerlegungsschaltung 101 das über einen Eingangsanschluß 100 eingegebene Eingangssignal in die einzelnen Rahmen zerlegt, um es an eine Unterrahmen-Zerlegungsschaltung 102 auszugeben. Die Unterrahmen-Zerlegungsschaltung 102 zerlegt das Eingangssignal in dem Rahmen weiter in die einzelnen Unterrahmen, um es an eine Linearvorhersage-Analyseschaltung 103 und eine Zielsignal-Erzeugungsschaltung 105 auszugeben. Die Linearvorhersage-Analyseschaltung 103 führt eine lineare Vorhersageanalyse des über die Unterrahmen-Zerlegungsschaltung 102 eingegebenen Signals für die einzelnen Unterrahmen aus, um den linearen Vorhersagekoeffizienten a(i), i = 1, ..., Np an eine Schaltung 104 zum Quantisieren linearer Vorhersagekoeffizienten, eine Zielsignal-Erzeugungsschaltung 105, eine Schaltung 107 zum Suchen im adaptiven Codebuch und eine Mehrfachimpuls-Suchschaltung 108 auszugeben. Hierbei ist Np die Ordnung der linearen Vorhersageanalyse, beispielsweise "10". Als Verfahren für die lineare Vorhersageanalyse sind das Autokorrelationsverfahren, das Kovarianzverfahren und dergleichen bekannt. Einzelheiten sind in Furui, "Digital Voice Processing" (Tokai University Shuppan Kai), Kapitel 5 (nachstehend als "Veröffentlichung 4'' bezeichnet) erörtert.
  • In der Schaltung 104 zum Quantisieren linearer Vorhersagekoeffizienten werden die je Unterrahmen erhaltenen linearen Vorhersagekoeffizienten ansammelnd je Rahmen quantisiert. Zum Verringern der Bitrate wird die Quantisierung beim letzten Unterrahmen in dem Rahmen ausgeführt. Zum Erhalten des quantisierten Werts eines anderen Unterrahmens wird häufig ein Verfahren zur Verwendung eines interpolierten Werts der quantisierten Werte des relevanten Rahmens und des unmittelbar vorhergehenden Rahmens verwendet. Die Quantisierung und die Interpolation werden nach der Konvertierung des linearen Vorhersagekoeffizienten in ein lineares Spektrumspaar (LSP) ausgeführt. Die Konvertierung des linearen Vorhersagekoeffizienten in das LSP wurde in Sugamura u.a. "Voice Information Compression by Linear Spectrum Pair (LSP) Voice Analysis Synthesizing Method" (Veröffentlichung von "Institute of Electronics and Communication Engineers of Japan", J64-A, S. 599–606, 1981 (nachstehend als "Veröffentlichung 5'' bezeichnet)) dargelegt. Als das Quantisierungsverfahren des LSPs kann ein bekanntes Verfahren verwendet werden. Ein spezielles Verfahren ist beispielsweise in der ungeprüften japanischen Patentveröffentlichung Heisei 4-171500 (Patentanmeldung 2-297600) (nachstehend als "Veröffentlichung 6'' bezeichnet) offenbart. Es sei hiermit auf die Offenbarung der Veröffentlichung 6 verwiesen.
  • Weiterhin konvertiert die Schaltung 104 zum Quantisieren linearer Vorhersagekoeffizienten das quantisierte LSP in quantisierte lineare Vorhersagekoeffizienten a'(i), i = I, ..., Np und gibt dann den quantisierten linearen Vorhersagekoeffizienten an die Zielsignal-Erzeugungsschaltung 105, die Schaltung 107 zum Suchen im adaptiven Codebuch und die Mehrfachimpuls-Suchschaltung 108 aus, um den Index, der den quantisierten linearen Vorhersagekoeffizienten angibt, an einem Ausgangsanschluß 113 auszugeben.
  • Die Zielsignal-Erzeugungsschaltung 105 erzeugt ein hörbarkeitsgewichtetes Signal durch Ansteuern eines durch die folgende Gleichung (1) ausgedrückten hörbarkeitsgewichteten Filters Hw(z) mit dem Eingangssignal:
    Figure 00070001
    wobei R1 und R2 Gewichtungskoeffizienten sind, die den Hörbarkeitsgewichtungsbetrag steuern, wobei beispielsweise R1 = 0,6 und R2 = 0,9 ist.
  • Als nächstes werden das Linearvorhersage-Synthesefilter (siehe die nächste Gleichung (2)) des in derselben Schaltung gehaltenen unmittelbar vorhergehenden Unterrahmens und ein hörbarkeitsgewichtetes Synthesefilter Hsw(z), das die hörbarkeitsgewichteten Filter Hw(z) kontinuierlich verbindet, durch das Erregungssignal des unmittelbar vorhergehenden Unterrahmens angesteuert. Anschließend wird ein Filterkoeffizient des hörbarkeitsgewichteten Synthesefilters durch einen aktuellen Unterrahmen modifiziert, um dasselbe Filter durch ein Null-Eingangssignal, bei dem alle Signalwerte null sind, anzusteuern, um ein Null-Eingangsantwortsignal abzuleiten.
  • Figure 00080001
  • Weiterhin werden durch Subtrahieren des Null-Eingangsantwortsignals vom hörbarkeitsgewichteten Signal die Zielsignale X(n), n = 0, ..., N – 1 erzeugt. Hierbei ist N eine Unterrahmenlänge. Andererseits wird das Zielsignal X(n) an die Schaltung 107 zum Suchen im adaptiven Codebuch, die Mehrfachimpuls-Suchschaltung 108 und die Verstärkungssuchschaltung 109 ausgegeben.
  • In der Schaltung 107 zum Suchen im adaptiven Codebuch wird durch das Erregungssignal des über einen Unterrahmenpuffer 106 erhaltenen unmittelbar vorhergehenden Unterrahmens das frühere Erregungssignale speichernde adaptive Codebuch aktualisiert. Die adaptiven Codevektorsignale Adx(n), n = 0, ..., N – 1, die einer Tonhöhe bzw. Pitch dx entsprechen, sind mit N Abtastwerten abgetastete Signale, die gegenüber dem Abtastwert des dem aktuellen Unterrahmen unmittelbar vorhergehenden Unterrahmens um dx Abtastwerte zurückgehen. Wenn die Tonhöhe dx hierbei kürzer ist als die Unterrahmenlänge N, werden die abgetasteten dx Abtastwerte bis zur Unterrahmenlänge wiederholt verbunden, um das adaptive Codevektorsignal zu erzeugen.
  • Unter Verwendung des erzeugten adaptiven Codevektorsignals Adx(n), n = 0, ..., N – 1 wird das je Unterrahmen initialisierte hörbarkeitsgewichtete Synthesefilter (nachstehend als hörbarkeitsgewichtetes Synthesefilter Zsw(z) im Nullzustand bezeichnet) angesteuert, um ein reproduziertes Signal SAdx(n), n = 0, ..., N – 1 zu erzeugen. Anschließend wird eine Tonhöhe d, die einen Fehler E1(dx) des Zielsignals X(n) und des reproduzierten Signals SAdx(n) bildet, wie durch die folgende Gleichung (3) ausgedrückt wird, aus einem vorgegebenen Suchbereich (beispielsweise dx = 17, ..., 144) ausgewählt. Das adaptive Codevektorsignal mit der Tonhöhe d und das reproduzierte Signal werden als Ad(n) bzw. SAd(n) festgelegt.
  • Figure 00090001
  • Andererseits gibt die Schaltung 107 zum Suchen im adaptiven Codebuch den Index der ausgewählten Tonhöhe d an einen Ausgangsanschluß 110 und das ausgewählte adaptive Codevektorsignal Ad(n) an die Verstärkungssuchschaltung 109 und das davon reproduzierte Signal SAd(n) an die Verstärkungssuchschaltung 109 und die Mehrfachimpuls-Suchschaltung 108 aus.
  • In der Impulssuchschaltung 108 werden P das Mehrfachimpulssignal bildende von Null verschiedene Impulse gesucht. Hierbei sind die Positionen der jeweiligen Impulse nicht auf Impulspositionskandidaten beschränkt. Alle Impulspositionskandidaten werden jedoch voneinander verschiedene Werte. Wenn beispielsweise die Unterrahmenlänge N = 40 ist und die Im pulsanzahl P = 5 ist, ergibt sich das in 15 dargestellte Beispiel für die Impulspositionskandidaten.
  • Andererseits ist die Amplitude des Impulses nur durch die Polarität gegeben. Dementsprechend kann das Codieren des Mehrfachimpulssignals unter der Annahme, daß die Gesamtzahl der Kombinationen der Impulspositionskandidaten und der Polaritäten J ist, durch Festlegen des Mehrfachimpulssignals Cjx(n), n = 0, ..., N – 1 in bezug auf den die Kombinationen angebenden Index jx, Ansteuern des hörbarkeitsgewichteten Synthesefilters Zsw(z) im Nullzustand durch das Mehrfachimpulssignal, Erzeugen reproduzierter Signale SCjx(n), n = 0, ..., N – 1 und Auswählen des Index j, so daß der durch die folgende Gleichung (4) ausgedrückte Fehler E2(jx) minimal ist, vorgenommen werden. Dieses Verfahren wurde in der vorstehenden Veröffentlichung 3 und der ungeprüften japanischen Patentveröffentlichung Heisei 9-160596 (Patentanmeldung 7-318071) (nachstehend als "Veröffentlichung 7'' bezeichnet) dargelegt. Es sei hiermit auf diese Offenbarung verwiesen. Das dem ausgewählten Index j entsprechende Mehrfachimpulssignal und das davon reproduzierte Signal werden als Cj (n) und SCj (n) angenommen.
    Figure 00100001
    wobei X'(n), n = 0, ..., N – 1 durch Orthogonalisieren des Zielsignals X(n) in bezug auf das reproduzierte Signal SAd(n) des adaptiven Codevektorsignals abgeleitete Signale sind, wie durch die folgende Gleichung (5) ausgedrückt ist.
  • Figure 00100002
  • Andererseits gibt die Mehrfachimpuls-Suchschaltung 108 das ausgewählte Mehrfachimpulssignal Cj(n) und das davon reproduzierte Signal SCj(n) an die Verstärkungssuchschaltung 109 und den entsprechenden Index an den Ausgangsanschluß 111 aus.
  • In der Verstärkungssuchschaltung 109 werden die Verstärkungen des adaptiven Codevektorsignals und des Mehrfachimpulssignals zu einem zweidimensionalen Vektor quantisiert. Es wird angenommen, daß die Verstärkungen des adaptiven Codevektorsignals und des Mehrfachimpulssignals, die im Verstärkungscodebuch mit der Codebuchgröße K angesammelt sind, Gkx(0), Gkx(1), kx = 0, ..., K – 1 sind. Der Index k der optimalen Verstärkung wird so ausgewählt, daß der durch die folgende Gleichung (6) ausgedrückte Fehler E3(kx) unter Verwendung des reproduzierten Signals SAd(n) des adaptiven Codevektors, des reproduzierten Signals SCj(n) des Mehrfachimpulses und des Zielsignals X(n) minimal wird. Es wird angenommen, daß die Verstärkungen des adaptiven Codevektorsignals und des Mehrfachimpulssignals des ausgewählten Index k Gk(0) bzw. Gk(1) sind.
  • Figure 00110001
  • Andererseits wird das Erregungssignal unter Verwendung der ausgewählten Verstärkung, des adaptiven Codevektors und des Mehrfachimpulssignals erzeugt und an einen Unterrahmenpuffer 106 ausgegeben. Weiterhin wird der der Verstärkung entsprechende Index am Ausgangsanschluß 112 ausgegeben.
  • Als nächstes wird mit Bezug auf 14 ein Aufbau der auf dem CELP-Codiersystem beruhenden Decodierschaltung, die in der ersten CELP-Decodierschaltung 3 auf der Codierseite verwendet wird und auch in der ersten CELP-Decodierschaltung 9 und der zweiten CELP-Decodierschaltung auf der Decodierseite verwendet wird, erörtert.
  • In der Schaltung 118 zum Decodieren linearer Vorhersagekoeffizienten werden die vom über den Eingangsanschluß 114 eingegebenen Index decodierten quantisierten linearen Vorhersagekoeffizienten a'(i), i = 1, ..., Np an die Reproduktionssignal-Erzeugungsschaltung 122 ausgegeben.
  • In der Schaltung 119 zum Decodieren des adaptiven Codebuchs wird das anhand des Index der vorhergehenden Tonhöhe über den Eingangsanschluß decodierte adaptive Codevektorsignal Ad(n) an die Verstärkungsdecodierschaltung 121 ausgegeben, und in der Mehrfachimpuls-Decodierschaltung 120 wird das anhand des über den Eingangsanschluß 117 eingegebenen Index des Mehrfachimpulssignals decodierte Mehrfachimpulssignal Cj(n) auch an die Verstärkungsdecodierschaltung 121 ausgegeben.
  • In der Verstärkungsdecodierschaltung 121 werden die Verstärkungen Gk(0) und Gk(1) anhand des über den Eingangsanschluß 115 eingegebenen Index der Verstärkungen decodiert, um das Erregungssignal unter Verwendung des adaptiven Codevektorsignals, des Mehrfachimpulssignals und der Verstärkung zu erzeugen, um es an die Reproduktionssignal-Erzeugungsschaltung 122 auszugeben.
  • In der Reproduktionssignal-Erzeugungsschaltung 122 wird das reproduzierte Signal durch Ansteuern des Linearvorhersage-Synthesefilters Hs(z) durch das Erregungssignal zur Ausgabe an einen Ausgangsanschluß 123 erzeugt.
  • Beim mit Bezug auf die 12 bis 14 erörterten Sprachcodier- und -decodiersystem tritt jedoch das Problem auf, daß die Codierwirksamkeit bei der hierarchischen CELP-Codierung des Sprachsignals in der zweiten und nachfolgenden Hierarchien ungenügend ist.
  • Der Grund hierfür besteht darin, daß in der n-ten Hierarchie (n = 2, ..., N) das durch Subtrahieren von n – 1 bis zur (n – 1)-ten Hierarchie CELP-codierten und decodierten repro duzierten Signalen vom Eingangssignal abgeleitete Differenzsignal CELP-codiert ist.
  • Insbesondere sind in der n-ten Hierarchie jeweilige Codierparameter (der lineare Vorhersagekoeffizient, die Tonhöhe, das Mehrfachimpulssignal und die Verstärkung) bei der CELP-Codierung des Differenzsignals vom Quantisierungsfehlerwert des entsprechenden Parameters bis zur (n – 1)-ten Hierarchie verschieden. Daher überlappen durch das Codieren jedes Parameters der (n – 1)-ten Hierarchie ausgedrückte Informationen und durch das Codieren der n-ten Hierarchie ausgedrückte Informationen einander, wodurch die Codierwirksamkeit der jeweiligen Codierparameter nicht verbessert wird und die Qualität des reproduzierten Signals demgemäß nicht verbessert wird.
  • Dementsprechend wurde die durch die anliegenden unabhängigen Ansprüche definierte vorliegende Erfindung angesichts der vorstehend dargelegten Mängel gemacht. Eine Aufgabe der vorliegenden Erfindung besteht daher darin, ein Sprachcodiersystem nach Anspruch 1 und ein Sprachdecodiersystem nach Anspruch 9 bereitzustellen, wodurch eine hohe Wirksamkeit in einem Sprachcodier- und -decodiersystem auf der Grundlage einer hierarchischen Codierung erreicht werden kann, wobei die Abtastfrequenz des reproduzierten Signals, abhängig von der Bitrate für die Decodierung, veränderlich ist.
  • Die vorliegende Erfindung läßt sich anhand der nachstehend angegebenen detaillierten Beschreibung und der anliegenden Zeichnung der bevorzugten Ausführungsform der vorliegenden Erfindung besser verstehen, wobei diese jedoch nicht als die Erfindung beschränkend angesehen werden sollten, sondern nur der Erklärung und dem Verständnis dienen.
  • Es zeigen:
  • 1 ein Blockdiagramm, in dem eine Anordnung eines Sprachcodier- und -decodiersystems gemäß der ersten Ausführungsform der vorliegenden Erfindung dargestellt ist,
  • 2 ein Blockdiagramm, in dem eine Anordnung einer zweiten CELP-Codierschaltung in dem Sprachcodier- und -decodiersystem gemäß der ersten Ausführungsform der Erfindung dargestellt ist,
  • 3 ein Blockdiagramm, in dem eine Anordnung einer zweiten CELP-Decodierschaltung in dem Sprachcodier- und -decodiersystem gemäß der ersten Ausführungsform der Erfindung dargestellt ist,
  • 4 ein Blockdiagramm einer Anordnung eines Sprachcodier- und -decodiersystems gemäß der zweiten Ausführungsform der vorliegenden Erfindung,
  • 5 ein Blockdiagramm einer Anordnung einer ersten CELP-Codierschaltung in dem Sprachcodier- und -decodiersystem gemäß der zweiten Ausführungsform der Erfindung,
  • 6 ein Blockdiagramm einer Anordnung einer zweiten CELP-Codierschaltung in dem Sprachcodier- und -decodiersystem gemäß der zweiten Ausführungsform der Erfindung,
  • 7 ein Blockdiagramm einer Anordnung einer ersten CELP-Decodierschaltung in dem Sprachcodier- und -decodiersystem gemäß der zweiten Ausführungsform der Erfindung,
  • 8 ein Blockdiagramm einer Anordnung einer zweiten CELP-Decodierschaltung in dem Sprachcodier- und -decodiersystem gemäß der zweiten Ausführungsform der Erfindung,
  • 9 ein Blockdiagramm einer Anordnung des Sprachcodier- und -decodiersystems gemäß der dritten Ausführungsform der vorliegenden Erfindung,
  • 10 ein Blockdiagramm einer Anordnung einer zweiten CELP-Codierschaltung in dem Sprachcodier- und -decodiersystem gemäß der dritten Ausführungsform der Erfindung,
  • 11 ein Blockdiagramm einer Anordnung einer zweiten CELP-Decodierschaltung in dem Sprachcodier- und -decodiersystem gemäß der dritten Ausführungsform der Erfindung,
  • 12 ein Blockdiagramm einer Anordnung des Sprachcodiersystems, auf das die vorliegende Erfindung gerichtet ist,
  • 13 ein Blockdiagramm eines Beispiels für die Anordnung einer CELP-Codierschaltung,
  • 14 ein Blockdiagramm eines Beispiels für die Anordnung einer CELP-Decodierschaltung,
  • 15 eine Entsprechung zwischen einer Impulsanzahl und einem Impulspositionskandidaten und
  • 16 eine Entsprechung zwischen einer Impulsanzahl und einem Impulspositionskandidaten.
  • Die vorliegende Erfindung wird nachstehend detailliert anhand der bevorzugten Ausführungsform der vorliegenden Erfindung mit Bezug auf die anliegende Zeichnung erörtert. In der folgenden Beschreibung sind zahlreiche spezifische Einzelheiten dargelegt, um ein gründliches Verständnis der vorliegenden Erfindung bereitzustellen. Es wird jedoch für Fachleute offensichtlich sein, daß die vorliegende Erfindung auch ohne diese spezifischen Einzelheiten verwirklicht werden kann. Es sei am Rande bemerkt, daß wohlbekannte Strukturen nicht detailliert dargestellt sind, um zu vermeiden, daß die vorliegende Erfindung unnötig überdeckt wird.
  • Die vorliegende Erfindung ist dadurch gekennzeichnet, daß eine mehrstufige Codierung je Codierparameter in einer hierarchischen CELP-Codierung ausgeführt wird. Insbesondere umfaßt gemäß der bevorzugten Ausführungsform ein Sprachcodiersystem, das eine Anzahl N – 1 von Signalen mit veränderlichen Abtastfrequenzen der eingegebenen Sprachsignale erzeugt und die eingegebenen Sprachsignale und die mit veränderlichen Abtastfrequenzen abgetasteten Signale mit summierenden Indizes, welche durch Codieren, Tonhöhen, mehrere Signale und Verstärkungen erhaltene lineare Vorhersagekoeffizienten angeben, für N Hierarchien vom Signal mit der niedrigsten Abtastfrequenz in sequentieller Reihenfolge multiplexiert, eine Schaltung zum Suchen in einem adaptiven Codebuch (durch die Bezugszahl 127 in 2 angegeben), welche beim Codieren der (n)-ten Hierarchie (n = 2, ..., N) ein entsprechendes adaptives Codevektorsignal durch Codieren einer differentiellen Tonhöhe in Bezug auf eine bis zur (n – 1)-ten Hierarchie codierte und decodierte Tonhöhe erzeugt (beispielsweise die zweite CELP-Codierschaltung in 1), eine Mehrfachimpuls-Erzeugungsschaltung (durch die Bezugszahl 128 in 2 angegeben), welche ein erstes Mehrfachimpulssignal von (n – 1) bis zur (n – 1)-ten Hierarchie codierten und decodierten Mehrfachimpulssignalen erzeugt, eine Mehrfachimpuls-Suchschaltung (durch die Bezugszahl 129 in 2 angegeben), welche eine Impulsposition des zweiten Mehrfachimpulssignals bei der n-ten Hierarchie unter Impulspositionskandidaten codiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, eine Verstärkungssuchschaltung (durch die Bezugszahl 130 in 2 angegeben), welche Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals codiert, eine Linearvorhersage-Analyseschaltung (durch die Bezugszahl 103 in 2 angegeben), welche eine lineare Vorhersageanalyse des abgeleiteten linearen Vorhersage-Fehlersignals ausführt, um einen linearen Vorhersagekoeffizienten abzuleiten, eine Schaltung zum Quantisieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 104 in 2 angegeben), welche den neu abgeleiteten linearen Vorhersagekoeffizienten quantisiert, und eine Zielsignal-Erzeugungsschaltung mit einem gewichteten Filter für die Hörbarkeit der n-ten Stufe.
  • Andererseits umfaßt gemäß der bevorzugten Ausführungsform ein Sprachdecodiersystem, das die Abtastfrequenz des reproduzierten Signals, abhängig von der zu decodierenden Bitrate, hierarchisch ändert, eine Decodiereinrichtung, die N Arten decodierbarer Bitraten entspricht, einen Demultiplexer (durch die Bezugszahl 18 in 1 angegeben), der die Decodiereinrichtung der n-ten Hierarchie (n = 1, ..., N) unter den Decodiereinrichtungen auswählt und einen Index, der die Tonhöhe bis zur n-ten Hierarchie und die Verstärkung des Mehrfachimpulssignals angibt, und einen Index, der den linearen Vorhersagekoeffizienten der n-ten Hierarchie extrahiert, wobei die Decodiereinrichtung der n-ten Hierarchie (n = 2, ..., N) eine Schaltung zum Decodieren eines adaptiven Codebuchs (durch die Bezugszahl 134 in 3 angegeben) aufweist, die die Tonhöhe von dem Index, der die Tonhöhe bis zur n-ten Hierarchie angibt, decodiert und ein adaptives Codevektorsignal erzeugt, eine Mehrfachimpuls-Erzeugungsschaltung (durch die Bezugszahl 136 in 3 angegeben), die das erste Mehrfachimpulssignal von einem Index erzeugt, der das Mehrfachimpulssignal und die Verstärkung bis zur n-ten Hierarchie angibt, eine Mehrfachimpuls-Decodierschaltung (durch die Bezugszahl 135 in 3 angegeben), welche das zweite Mehrfachimpulssignal von dem Index decodiert, der das Mehrfachimpulssignal der n-ten Hierarchie auf der Grundlage der Impulspositionskandidaten angibt, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, eine Verstärkungsdecodierschaltung (durch die Bezugszahl 137 in 3 angegeben), welche die Verstärkung von dem Index decodiert, der die Verstärkung der n-ten Hierarchie angibt, und ein Erregungssignal von dem adaptiven Codevektorsignal, dem ersten Mehrfachimpulssignal, dem zweiten Mehrfachimpulssignal und der decodierten Verstärkung erzeugt, eine Schaltung zum Decodieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 118 in 3 angegeben), welche den quantisierten linearen Vorhersagekoeffizienten a'(i), i = 1, ..., Np, von dem über den Eingangsanschluß (durch die Bezugszahl 114 in 3 angegeben) eingegebenen Index decodiert, und eine Schaltung zum Erzeugen des reproduzierten Signals (durch die Bezugszahl 122 in 3 angegeben), welche das reproduzierte Signal durch Ansteuern des Linearvorhersage-Synthesefilters mit dem Erregungssignal erzeugt, um es an den Ausgangsanschluß (durch die Bezugszahl 123 in 3 angegeben) auszugeben.
  • Die bevorzugte Ausführungsform des Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung wird in bezug auf die Ausführungsform erörtert, wobei der von dem Sprachcodiersystem codierte Bitstrom bei zwei verschiedenen Bitraten (nachstehend als hohe Bitrate und niedrige Bitrate bezeichnet) decodiert wird. Eine Downsampling-Schaltung (durch die Bezugszahl 1 in 1 angegeben) gibt ein erstes Eingangssignal, das durch Downsampling vom Eingangssignal erhalten wurde, an eine erste CELP-Codierschaltung (durch die Bezugszahl 14 in 1 angegeben) aus. Die erste CELP-Codierschaltung codiert das erste Eingangssignal, um eine codierte Ausgabe an den Multiplexer (durch die Bezugszahl 7 in 1 angegeben) auszugeben. Der Multiplexer (durch die Bezugszahl 7 in 1 angegeben) wandelt die codierte Ausgabe der ersten CELP-Codierschaltung (durch die Bezugszahl 14 in 1 angegeben) und der zweiten CELP-Codierschaltung (durch die Bezugszahl 15 in 1 angegeben) in einen Bitstrom zur Ausgabe um. Der Demultiplexer (durch die Bezugszahl 18 in 1 angegeben) nimmt einen Bitstrom und ein Steuersignal auf. Wenn das Steuersignal eine niedrige Bitrate angibt, wird die codierte Ausgabe der ersten CELP-Codierschaltung (durch die Bezugszahl 14 in 1 angegeben) an die erste CELP-Decodierschaltung (durch die Bezugszahl 16 in 1 angegeben) von dem Bitstrom ausgegeben. Wenn das Steuersignal die hohe Bitrate angibt, werden ein Teil der codierten Ausgabe der ersten CELP-Codierschaltung (durch die Bezugszahl 14 in 1 angegeben) und der codierten Ausgabe der zweiten CELP-Codierschaltung (durch die Bezugszahl 15 in 1 angegeben) extrahiert, um sie an die zweite CELP-Decodierschaltung (durch die Bezugszahl 17 in 1 angegeben) auszugeben. Abhängig vom Steuersignal, wird das reproduzierte Signal in der ersten CELP-Decodierschaltung (durch die Bezugszahl 16 in 1 angegeben) und der zweiten CELP-Decodierschaltung (durch die Bezugszahl 17 in 1 angegeben) decodiert, um es über die Schaltstufe 1 (durch die Bezugszahl 9 in 1 angegeben) auszugeben.
  • Andererseits umfaßt gemäß der bevorzugten Ausführungsform das Sprachcodiersystem gemäß der vorliegenden Erfindung eine Schaltung zum Suchen in einem adaptiven Codebuch (durch die Bezugszahl 147 in 6 angegeben), welche eine differentielle Tonhöhe in bezug auf die Tonhöhe der (n – 1)-ten Hierarchie codiert und ein entsprechendes adaptives Codevektorsignal in der n-ten Hierarchie erzeugt, eine Mehrfachimpuls-Erzeugungsschaltung (durch die Bezugszahl 148 in 6 angegeben), die n – 1 bis zur (n – 1)-ten Hierarchie codierte Mehrfachimpulssignale decodiert, die Abtastfrequenz des decodierten Mehrfachimpulssignals in die Abtastfrequenz des Eingangssignals in der n-ten Hierarchie konvertiert und das durch gewichtetes Summieren von n – 1 durch die Abtastfrequenz konvertierten Mehrfachimpulssignalen anhand der Verstärkung in jeder Hierarchie erzeugt, eine Mehrfachimpuls-Suchschaltung (durch die Bezugszahl 149 in 6 angegeben), welche die Impulsposition des zweiten Mehrfachimpulssignals in der n-ten Hierarchie unter den Impulspositionskandidaten codiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, und eine Verstärkungssuchschaltung (durch die Bezugszahl 130 in 6 angegeben), die die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals codiert.
  • Überdies umfaßt das Sprachcodiersystem zum mehrstufigen Codieren des linearen Vorhersagekoeffizienten eine Schaltung zum Konvertieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 142 in 6 angegeben), welche den von der (n – 1)-ten Hierarchie abgeleiteten linearen Vorhersagekoeffizienten in den Koeffizienten bei der Abtastfrequenz des Eingangssignals bei der n-ten Hierarchie konvertiert, eine Linearvorhersage-Restdifferenzsignal-Erzeugungsschaltung (durch die Bezugszahl 143 in 6 angegeben), welche ein Linearvorhersage-Restdifferenzsignal des Eingangssignals anhand der n – 1 konvertierten linearen Vorhersagekoeffizienten ableitet, eine Linearvorhersage-Analyseschaltung (durch die Bezugszahl 144 in 6 angegeben), welche den neu abgeleiteten linearen Vorhersagekoeffizienten quantisiert, und eine Zielsignal-Erzeugungsschaltung (durch die Bezugszahl 146 in 6 angegeben), welche das gewichtete Filter für die Hörbarkeit der n-ten Stufe aufweist. Die Schaltung zum Suchen im adaptiven Codebuch (durch die Bezugszahl 147 in 6 angegeben) weist ein n-stufiges hörbarkeitsgewichtetes Wiedergabefilter auf.
  • Gemäß einer anderen bevorzugten Ausführungsform ändert das Sprachdecodiersystem gemäß der vorliegenden Erfindung hierarchisch die Abtastfrequenz des reproduzierten Signals, abhängig von der decodierten Bitrate, und es umfaßt die Decodiereinrichtung, die von n decodierbaren Bitraten abhängt, und den Demultiplexer (durch die Bezugszahl 18 in 4 angegeben), welcher die n-te Hierarchie (n = 1, ..., N) von den Decodiereinrichtungen auswählt und den Index extrahiert, der den linearen Vorhersagekoeffizienten, die Tonhöhe, das Mehrfachimpulssignal und die Verstärkung angibt, und weiterhin die Schaltung zum Decodieren des adaptiven Codebuchs (durch die Bezugszahl 134 in 8 angegeben), welche die Tonhöhe anhand des Index decodiert, der die Tonhöhe bis zur n-ten Hierarchie angibt, um das adaptive Codevektorsignal zu erzeugen, die Mehrfachimpuls-Erzeugungsschaltung (durch die Bezugszahl 136 in 1 angegeben), welche das erste Mehrfachimpulssignal anhand des Index erzeugt, der das Mehrfachimpulssignal und die Verstärkung bis zur (n – 1)-ten Hierarchie angibt, die Mehrfachimpuls-Decodierschaltung (durch die Bezugszahl 135 in 8 angegeben), die Verstärkungsdecodierschaltung (durch die Bezugszahl 137 in 8 angegeben), welche die Verstärkung anhand des Index decodiert, der die Verstärkung der n-ten Hierarchie angibt, und das Erregungssignal anhand des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals, des zweiten Mehrfachimpulssignals und der decodierten Verstärkung erzeugt, eine Schaltung zum Konvertieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 152 in 8 angegeben), welche den bis zur (n – 1)-ten Hierarchie abgeleiteten linearen Vorhersagekoeffizienten in Koeffizienten bei der Abtastfrequenz des Eingangssignals bei der n-ten Hierarchie konvertiert, eine Schaltung zum Erzeugen des reproduzierten Signals (durch die Bezugszahl 153 in 8 angegeben), welche das durch das nstufige Linearvorhersage-Synthesefilter gesteuerte reproduzierte Signal anhand des Erregungssignals erzeugt, und eine Schaltung zum Decodieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 118 in 6 angegeben), welche einen quantisierten linearen Vorhersagekoeffizienten anhand des über den Eingangsanschluß eingegebenen Index decodiert und an eine Schaltung zum Erzeugen des reproduzierten Signals (durch die Bezugszahl 153 in 6 angegeben) ausgibt.
  • Nachstehend wird die Arbeitsweise der bevorzugten Ausführungsformen der vorliegenden Erfindung erörtert. Wenn eine Tonhöhenanalyse für dasselbe Sprachsignal mit verschiedenen Abtastfrequenzen ausgeführt wird, wird nur eine geringe Änderung der Tonhöhe hervorgerufen. Demgemäß wird bei der Schaltung zum Suchen im adaptiven Codebuch, welche die Tonhöhe bei der n-ten Hierarchie (n = 2, ..., N) codiert, die Codierwirksamkeit verbessert, indem nur ein Differenzwert in bezug auf die Tonhöhe bei der (n – 1)-ten Hierarchie codiert wird.
  • Gemäß der bevorzugten Ausführungsform der vorliegenden Erfindung wird bei der Mehrfachimpuls-Erzeugungsschaltung bei der n-ten Hierarchie die Abtastfrequenz des bis zur (n – 1)-ten Hierarchie codierten und decodierten Mehrfachimpulssignals in die gleiche Abtastfrequenz wie diejenige des Eingangssignals bei der n-ten Hierarchie konvertiert, um das erste Mehrfachimpulssignal zu erzeugen, das durch mit den Verstärkungen bei jeder Hierarchie gewichtetes Summieren der n – 1 Mehrfachimpulssignale, deren Abtastfrequenzen konvertiert sind, abgeleitet wird. Bei der Mehrfachimpuls-Suchschaltung bei der n-ten Hierarchie kann anhand der Impulspositionskandidaten, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, die Impulsposition des zweiten Mehrfachimpulssignals bei der n-ten Hierarchie codiert werden, um dazu beizutragen, die Anzahl der Bits zu reduzieren.
  • Weil andererseits die Verstärkungen bis zur n-ten Hierarchie in das erste Mehrfachimpulssignal multipliziert werden, kann die Verstärkung im ersten Mehrfachimpulssignal in der Verstärkungssuchschaltung bei der n-ten Hierarchie als ein Verhältnis in bezug auf die Verstärkung bis zur n-ten Hierarchie codiert werden, und die Codierwirksamkeit kann dadurch verbessert werden.
  • In der Schaltung zum Konvertieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 142 in 6 angegeben) bei der n-ten Hierarchie wird der bis zur (n – 1)-ten Hierarchie codierte und decodierte quantisierte lineare Vorhersagekoeffizient in einen Koeffizienten bei der gleichen Abtastfrequenz wie diejenige des Eingangssignals bei der n-ten Hierarchie konvertiert. In der Schaltung zum Erzeugen des Linearvorhersage-Restdifferenzsignals (durch die Bezugszahl 143 in 6 angegeben) wird durch die n – 1 Stufen des invertierten linearen Vorhersagefilters unter Verwendung des konvertierten linearen Vorhersagekoeffizienten das Linearvorhersage-Restdifferenzsignal des Eingangssignals erzeugt. In der Linearvorhersage-Analyseschaltung (durch die Bezugszahl 144 in 6 angegeben) wird der lineare Vorhersagekoeffizient in bezug auf das Linearvorhersage-Restdifferenzsignal neu abgeleitet. In der Schaltung zum Quantisieren linearer Vorhersagekoeffizienten (durch die Bezugszahl 145 in 6 angegeben) wird der abgeleitete lineare Vorhersagekoeffizient quantisiert.
  • Weil im Eingangssignal eine Bandspektrumseinhüllende, die bei der m-ten Hierarchie (m = 1, ..., n – 1) codiert ist, durch den bei der m-ten Hierarchie codierten linearen Vorhersagekoeffizienten ausgedrückt werden kann, wird es hierdurch unnötig, den Code bei der n-ten Hierarchie neu zu übertragen. Demgemäß kann der durch Analyse neu erhaltene lineare Vorhersagekoeffizient nur durch die Spektrumseinhüllende des ande ren Bands ausgedrückt werden, und er kann demgemäß mit einer kleineren Anzahl von Bits übertragen werden.
  • In der Zielsignal-Erzeugungsschaltung wird das n-stufige hörbarkeitsgewichtete Filter verwendet. In der Schaltung zum Suchen im adaptiven Codebuch und der Mehrfachimpuls-Suchschaltung wird das n-stufige hörbarkeitsgewichtete Wiedergabefilter verwendet. Andererseits kann in der Schaltung zum Erzeugen des reproduzierten Signals durch die Verwendung des n-stufigen Linearvorhersage-Synthesefilters die Spektrumseinhüllende des Eingangssignals der n-ten Hierarchie ausgedrückt werden. Dementsprechend kann das Codieren der Tonhöhe und des Mehrfachimpulssignals durch das mit der Hörbarkeit gewichtete Reproduktionssignal verwirklicht werden, um die Qualität des reproduzierten Signals zu verbessern.
  • Zur detaillierten Erörterung der bevorzugten Ausführungsform der vorliegenden Erfindung werden Ausführungsformen der vorliegenden Erfindung mit Bezug auf die Zeichnung erörtert.
  • 1 ist ein Blockdiagramm, in dem der Aufbau der ersten Ausführungsform eines Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung dargestellt ist.
  • Anhand 1 wird die erste Ausführungsform des Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung erörtert. Zur Vereinfachung der Offenbarung wird die folgende Erörterung für den Fall gegeben, in dem die Anzahl der Hierarchien zwei ist. Es sei bemerkt, daß eine ähnliche Erörterung auf den Fall anwendbar ist, in dem die Anzahl der Hierarchien drei beträgt oder größer ist. In 1 wird ein durch das Sprachcodiersystem codierter Bitstrom durch zwei Arten von Bitraten (nachstehend als die hohe Bitrate und die niedrige Bitrate bezeichnet) decodiert.
  • Wie in 1 dargestellt ist, gibt die Downsampling-Schaltung 1 das durch Downsampling vom Eingangssignal (beispielsweise mit einer Abtastfrequenz von 16 kHz) erhaltene erste Eingangssignal (beispielsweise mit einer Abtastfrequenz von 8 kHz) an die erste CELP-Codierschaltung 14 aus.
  • Die erste CELP-Codierschaltung codiert das erste Eingangssignal in ähnlicher Weise wie die in 13 dargestellte CELP-Codierschaltung, um den Index ILd des adaptiven Codevektors, den Index ILj des Mehrfachimpulssignals und den Index ILk der Verstärkung an die zweite CELP-Codierschaltung 15 und den Multiplexer 7 auszugeben und den dem linearen Vorhersagekoeffizienten entsprechenden Index ILa an den Multiplexer 7 auszugeben.
  • 2 ist ein Blockdiagramm, in dem die zweite CELP-Codierschaltung 15 gemäß der ersten Ausführungsform des Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung dargestellt ist. Anhand 2 wird eine detaillierte Erörterung für die zweite CELP-Codierschaltung 15 gegeben. Verglichen mit der in 13 dargestellten herkömmlichen CELP-Codierschaltung werden die Operationen der Schaltung 127 zum Suchen im adaptiven Codebuch, der Mehrfachimpuls-Erzeugungsschaltung 128, der Mehrfachimpuls-Suchschaltung 129 und der Verstärkungssuchschaltung 130 unterschieden. Nachstehend wird diese Schaltung erörtert.
  • In der Schaltung 127 zum Suchen im adaptiven Codebuch wird anhand des über den Eingangsanschluß 124 erhaltenen Index ILd die Tonhöhe d' in der ersten CELP-Codierschaltung 14 decodiert und in eine erste Tonhöhe d1 umgewandelt, die der Abtastfrequenz des Eingangssignals der zweiten CELP-Codierschaltung 15 entspricht. Wenn beispielsweise die Abtastfrequenz von 8 kHz zu 16 kHz konvertiert wird, wird d1 = 2d' festgelegt. Weiterhin wird in einem Suchbereich (beispielsweise d1 – 8, ..., d1 + 7), der bei der ersten Tonhöhe d1 zentriert ist, eine zweite Tonhöhe d2, bei der der durch die vorstehende Gleichung (3) ausgedrückte Fehler minimal wird, in ähnlicher Weise wie bei der Schaltung 107 zum Suchen im adaptiven Codebuch aus 13 ausgewählt.
  • Andererseits nimmt die Schaltung 127 zum Suchen im adaptiven Codebuch den Differenzwert der ausgewählten zweiten Tonhöhe d2 und der ersten Tonhöhe d1 als die differentielle Tonhöhe und gibt ihn nach dem Konvertieren zum Index Id an den Ausgangsanschluß 110 aus. Andererseits wird das selektive, adaptive Codevektorsignal Ad(n) an die Verstärkungssuchschaltung 130 ausgegeben, und ihr reproduziertes Signal SAd(n) wird an die Verstärkungssuchschaltung 130 und die Mehrfachimpuls-Suchschaltung 129 ausgegeben.
  • In der Mehrfachimpuls-Erzeugungsschaltung 128 wird der erste Mehrfachimpuls auf der Grundlage des durch die erste CELP-Codierschaltung 14 codierten Mehrfachimpulses erzeugt. Auf der Grundlage des Index ILj des Mehrfachimpulssignals und des Index ILk der Verstärkung in der ersten CELP-Codierschaltung 14, die über die Eingangsanschlüsse 125 und 126 erhalten wurden, wird das erste Mehrfachimpulssignal DL(n), n = 0, ..., N – 1 durch die folgende Gleichung (7) ausgedrückt. DL(n) = Gk(0)Cj'(n), (7) n = 0, ..., N – 1
  • Hierbei ist Cj'(n) ein mit der Abtastfrequenz vom Mehrfachimpulssignal in der ersten CELP-Codierschaltung 14 konvertiertes Signal. Wenn beispielsweise die Abtastfrequenz von 8 kHz zu 16 kHz konvertiert wird, wird Cj'(n) durch die folgende Gleichung (8) ausgedrückt.
  • Figure 00250001
  • Hierbei sind A(p) und M(p) die Amplitude und die Position des den Mehrfachimpuls in der ersten CELP-Codierschaltung 14 bildenden Impulses in der p-ten sequentiellen Reihenfolge und ist P' die Anzahl der Impulse. Andererseits ist es gemäß einer alternativen Ausführungsform beim Ableiten von Cj'(n) möglich, die Schwankung der Impulsposition zu berück sichtigen. In diesem Fall läßt sich Cj'(n) durch die folgende Gleichung (9) ausdrücken.
  • Figure 00260001
  • Hierbei stellt D die Schwankung der Impulsposition bei der Abtastfrequenzkonvertierung des Mehrfachimpulssignals dar. Beim dargestellten Beispiel ist D entweder 0 oder 1. Demgemäß sind als Kandidat des ersten Mehrfachimpulssignals zwei Signale vorhanden. Weiterhin ist es möglich, die Schwankung der Impulsposition für jeden Impuls zu bilden. In diesem Fall kann Cj'(n) durch Ersetzen von D in der vorstehenden Gleichung (9) durch D(p), p = 0, ..., p' – 1 ausgedrückt werden.
  • In diesem Beispiel sind 2p' Kandidaten für das erste Mehrfachimpulssignal vorhanden. In jedem Fall wird das erste Mehrfachimpulssignal DL(n) aus diesen Kandidaten ausgewählt, so daß der Fehler in der vorstehenden Gleichung (4) ähnlich wie bei der in 13 dargestellten Mehrfachimpuls-Suchschaltung 108 minimal wird.
  • Andererseits gibt die Mehrfachimpuls-Erzeugungsschaltung 128 das erste Mehrfachimpulssignal DL(n) und das reproduzierte Signal SDL(n) davon an die Verstärkungssuchschaltung 130 und die Mehrfachimpuls-Suchschaltung 129 aus.
  • In der Mehrfachimpuls-Suchschaltung 129 werden das zum ersten Mehrfachimpulssignal orthogonale zweite Mehrfachimpulssignal und das adaptive Codevektorsignal neu gesucht. Zuerst werden die Impulspositionskandidaten zum Suchen des zweiten Mehrfachimpulssignals so festgelegt, daß die Positionen der das erste Mehrfachimpulssignal bildenden Impulse und die Positionen der das zweite Mehrfachimpulssignal bildenden Impulse einander nie überlappen. Wenn beispielsweise das erste Mehrfachimpulssignal auf der Grundlage der vorste henden Gleichung (8) erzeugt wird, wobei angenommen wird, daß die Unterrahmenlänge N = 80 ist und die Impulsanzahl P = 5 ist, werden die in 16 dargestellten Impulspositionskandidaten verwendet.
  • Auf der Grundlage der festgelegten Impulspositionskandidaten wird das zweite Mehrfachimpulssignal codiert, so daß der durch die folgende Gleichung (10) ausgedrückte Fehler E4(j) ähnlich wie bei der in 13 dargestellten Mehrfachimpuls-Suchschaltung 108 minimal wird.
  • Figure 00270001
  • Hierbei werden X''(n), n = 0, ..., N – 1 durch Orthogonalisieren des Zielsignals X(n) durch das reproduzierte Signal SAd(n) des adaptiven Codevektorsignals und das reproduzierte Signal SDL(n) des ersten Mehrfachimpulssignals, das durch die folgende Gleichung (11) abgeleitet wird, abgeleitet.
  • Figure 00270002
  • Andererseits gibt die Mehrfachimpuls-Suchschaltung 129 das zweite Mehrfachimpulssignal Cj(n) und das davon reproduzierte Signal SCj(n) an die Verstärkungssuchschaltung 130 und den entsprechenden Index an den Ausgangsanschluß 111 aus.
  • In der Verstärkungssuchschaltung 130 sind die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals ein dreidimensionaler quantisierter Vektor. Es wird angenommen, daß die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals, die im Verstärkungscodebuch mit einer Codebuchgröße K gesammelt sind, Gkx(0), Gkx(1), Gkx(2), kx = 0, ..., K – 1 sind. Ein Index k einer optimalen Verstärkung wird so ausgewählt, daß ein durch die folgende Gleichung (12) unter Verwendung des reproduzierten Signals SAd(n) des adaptiven Codevektors, des reproduzierten Signals SDL(n) des ersten Mehrfachimpulses, des reproduzierten Signals SCj(n) des zweiten Mehrfachimpulses und des Zielsignals X(n) ausgedrückter Fehler E5(k) minimiert werden kann. Es wird angenommen, daß die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals des ausgewählten Index k Gk(0), Gk(1) bzw. Gk(2) sind.
  • Figure 00280001
  • Andererseits wird das Erregungssignal unter Verwendung der ausgewählten Verstärkung, des adaptiven Codevektors, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals erzeugt und an den Unterrahmenpuffer 106 ausgegeben, und der der Verstärkung entsprechende Index wird an den Ausgangsanschluß 112 ausgegeben.
  • Anhand 1 wird die dargestellte Ausführungsform des Sprachcodiersystems erörtert. Der Multiplexer 7 konvertiert die vier Arten der von der ersten CELP-Codierschaltung 14 eingegebenen Indizes und die vier Arten der von der zweiten CELP-Codierschaltung 15 eingegebenen Indizes zum Bitstrom für die Ausgabe.
  • Als nächstes wird das Sprachdecodiersystem erörtert. Der Betrieb des Sprachdecodiersystems wird vom Demultiplexer 18 und von der Schaltstufe 19, abhängig vom Steuersignal, umgeschaltet, das zwei Arten vom Sprachdecodiersystem decodierbarer Bitraten identifiziert.
  • Der Demultiplexer 18 gibt den Bitstrom und das Steuersignal ein. Wenn das Steuersignal eine niedrige Bitrate aufweist, werden die codierten Indizes ILd, ILj, ILk und ILa aus dem Bitstrom in der ersten CELP-Codierschaltung 14 extrahiert, um sie an die erste CELP-Decodierschaltung 16 auszugeben. Wenn andererseits das Steuersignal eine hohe Bitrate aufweist, werden die Indizes ILd, ILj und ILk von den vier Arten in der ersten CELP-Codierschaltung 14 codierter Indizes und die in der zweiten CELP-Codierschaltung 15 codierten Indizes Id, Ij, Ik und Ia extrahiert, um sie an die zweite CELP-Decodierschaltung 17 auszugeben.
  • Die erste CELP-Decodierschaltung 16 decodiert den adaptiven Codevektor, das Mehrfachimpulssignal, die Verstärkung und den linearen Vorhersagekoeffizienten vom Index ILd des adaptiven Codevektors, vom Index ILj des Mehrfachimpulssignals, vom Index ILk der Verstärkung und vom Index ILa entsprechend dem linearen Vorhersagekoeffizienten, um das erste reproduzierte Signal zur Ausgabe an die Schaltstufe 19 zu erzeugen.
  • Die zweite CELP-Decodierschaltung 17 decodiert das zweite reproduzierte Signal anhand der Indizes ILd, ILj und ILk, die in der ersten CELP-Codierschaltung 14 codiert wurden, und der Indizes Id, Ij, Ik und Ia, die in der zweiten CELP-Codierschaltung 15 codiert wurden, um sie an die Schaltstufe 19 auszugeben.
  • 3 ist ein Blockdiagramm, in dem die zweite CELP-Decodierschaltung 17 gemäß der ersten Ausführungsform des Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung dargestellt ist. Nachstehend wird die zweite CELP-Decodierschaltung 17 mit Bezug auf 3 erörtert. Die zweite CELP-Decodierschaltung 17 unterscheidet sich hinsichtlich der Operationen einer adaptiven Codebuch-Decodier schaltung 134, einer Mehrfachimpuls-Decodierschaltung 135, einer Mehrfachimpuls-Erzeugungsschaltung 136 und einer Verstärkungsdecodierschaltung 137 von der in 14 dargestellten CELP-Decodierschaltung. Nachstehend werden die Operationen dieser Schaltungen erörtert.
  • In der Schaltung 134 zum Decodieren eines adaptiven Codebuchs wird eine erste Tonhöhe d1 ähnlich wie in der Schaltung 127 zum Suchen im adaptiven Codebuch von dem über einen Eingangsanschluß 131 eingegebenen Index ILd abgeleitet. Eine von dem über einen Eingangsanschluß 116 eingegebenen Index ILd decodierte differentielle Tonhöhe und die erste Tonhöhe d1 werden addiert, um eine zweite Tonhöhe d2 zu decodieren. Auf der Grundlage der decodierten zweiten Tonhöhe d2 wird ein adaptives Codevektorsignal Ad(n) abgeleitet, um es an eine Verstärkungsdecodierschaltung 137 auszugeben.
  • In der Mehrfachimpuls-Erzeugungsschaltung 136 wird das erste Mehrfachimpulssignal DL(n) anhand der über die Eingangsanschlüsse 132 und 133 eingegebenen Indizes ILj und ILk ähnlich wie bei der Mehrfachimpuls-Erzeugungsschaltung 128 decodiert, um es an die Verstärkungsdecodierschaltung 137 und die Mehrfachimpuls-Decodierschaltung 135 auszugeben.
  • In der Mehrfachimpuls-Decodierschaltung 135 wird der Impulspositionskandidat (in 16 dargestellt) zum Decodieren des zweiten Mehrfachimpulssignals in ähnlicher Weise wie bei der Mehrfachimpuls-Suchschaltung 129 unter Verwendung des ersten Mehrfachimpulssignals erzeugt. Auf der Grundlage des erzeugten Impulspositionskandidaten wird das zweite Mehrfachimpulssignal Cj(n) anhand des über den Eingangsanschluß 117 eingegebenen Index Id decodiert. Anschließend wird das decodierte zweite Mehrfachimpulssignal DL(n) an die Verstärkungsdecodierschaltung 137 ausgegeben.
  • In der Verstärkungsdecodierschaltung 137 werden die Verstärkungen Gk(0), Gk(1) und Gk(3) anhand des über den Eingangsanschluß 115 eingegebenen Index Ik decodiert, und das Erregungssignal wird unter Verwendung des adaptiven Codevektorsignals Ad(n), des ersten Mehrfachimpulssignals DL(n) und des zweiten Mehrfachimpulssignals Cj(n) und der Verstärkungen GA(k), GC1(k) und GC2(k) erzeugt, um sie an die Schaltung 122 zum Erzeugen des reproduzierten Signals auszugeben.
  • Wiederum mit Bezug auf 1 wird die dargestellte Ausführungsform des Sprachdecodiersystems erörtert. In den Schalter 19 werden das erste reproduzierte Signal, das zweite reproduzierte Signal und das Steuersignal eingegeben. Wenn das Steuersignal eine hohe Bitrate aufweist, wird das eingegebene zweite reproduzierte Signal als das reproduzierte Signal an das Sprachcodiersystem ausgegeben. Andererseits weist das Steuersignal eine niedrige Bitrate auf und wird das eingegebene erste reproduzierte Signal als das reproduzierte Signal an das Sprachcodiersystem ausgegeben.
  • Wenngleich die vorstehende erste Ausführungsform des Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung vorstehend anhand der mehrstufigen Codierung der Tonhöhe, des Mehrfachimpulssignals und der Verstärkung erörtert worden ist, kann eine ähnliche Erörterung auch auf den Fall angewendet werden, in dem eines von dem Mehrfachimpulssignal und der Verstärkung einer mehrstufigen Codierung unterzogen wird.
  • 4 ist ein Blockdiagramm, in dem eine Anordnung des Sprachcodier- und -decodiersystems gemäß der zweiten Ausführungsform der vorliegenden Erfindung dargestellt ist. Anhand 4 wird die zweite Ausführungsform des Sprachcodier- und -decodiersystems erörtert. Zur Vereinfachung der Darlegung wird die folgende Erörterung in Bezug auf den Fall vorgenommen, in dem die Anzahl der Hierarchien zwei ist. Es sei bemerkt, daß eine ähnliche Erörterung auf den Fall anwendbar ist, in dem die Anzahl der Hierarchien drei beträgt oder größer ist.
  • Bei der dargestellten Ausführungsform wird der vom Sprachcodiersystem codierte Bitstrom bei zwei verschiedenen Bitraten decodiert (nachstehend als eine "hohe Bitrate" und eine "niedrige Bitrate" bezeichnet).
  • Die zweite Ausführungsform des Sprachcodier- und -decodiersystems gemäß der vorliegenden Erfindung unterscheidet sich von der ersten Ausführungsform nur durch die erste CELP-Codierschaltung 20, die zweite CELP-Codierschaltung 21, die erste CELP-Decodierschaltung 22 und die zweite CELP-Decodierschaltung 23. Daher konzentriert sich die folgende Offenbarung auf diese Schaltungen, die von jenen gemäß der ersten Ausführungsform verschieden sind, um die Offenbarung durch Vermeiden einer redundanten Erörterung einfach genug zu halten und dadurch das klare Verständnis der vorliegenden Erfindung zu erleichtern.
  • Die erste CELP-Codierschaltung 20 codiert das von der Downsampling-Schaltung 1 eingegebene erste Eingangssignal zur Ausgabe des Index ILd des adaptiven Codevektors, des Index ILj des Mehrfachimpulssignals und des Index ILk der Verstärkung an die zweite CELP-Codierschaltung 21 und den Multiplexer 7 und zur Ausgabe des dem linearen Vorhersagekoeffizienten entsprechenden Index ILa an den Multiplexer 7 und des linearen Vorhersagekoeffizienten und des quantisierten linearen Vorhersagekoeffizienten an die zweite CELP-Codierschaltung 21.
  • 5 ist ein Blockdiagramm, in dem eine Anordnung der ersten CELP-Codierschaltung 20 des Sprachcodier- und -decodiersystems gemäß der zweiten Ausführungsform der vorliegenden Erfindung dargestellt ist. Anhand 5 wird der Unterschied zwischen der ersten CELP-Codierschaltung 20 gemäß der dargestellten Ausführungsform und der in 13 dargestellten CELP-Codierschaltung erörtert.
  • Die erste CELP-Codierschaltung 20 unterscheidet sich von der in 13 dargestellten CELP-Codierschaltung nur dadurch, daß der lineare Vorhersagekoeffizient von der Linearvorhersage-Analyseschaltung 103 ausgegeben wird und der quantisierte lineare Vorhersagekoeffizient von der Schaltung 104 zum Quantisieren linearer Vorhersagekoeffizienten ausgegeben wird, wobei die Ausgabe an den Ausgangsanschlüssen 138 und 139 geschieht. Dementsprechend wird die Erörterung der Arbeitsweise der die erste CELP-Codierschaltung 20 bildenden Schaltung vernachlässigt.
  • Wiederum mit Bezug auf 4 sei bemerkt, daß die zweite CELP-Codierschaltung 21 das Eingangssignal auf der Grundlage von drei verschiedenen Indizes ILd, ILj und ILk als Ausgabe der ersten CELP-Codierschaltung 20, des linearen Vorhersagekoeffizienten und des quantisierten linearen Vorhersagekoeffizienten codiert, um den Index Id des adaptiven Codevektors, den Index Ij des Mehrfachimpulssignals, den Index Ik der Verstärkung und den dem linearen Vorhersagekoeffizienten entsprechenden Index Ia an den Multiplexer 7 auszugeben.
  • 6 ist ein Blockdiagramm, in dem der Aufbau der zweiten CELP-Codierschaltung 21 dargestellt ist. Anhand 6 wird die zweite CELP-Codierschaltung 21 erörtert. Eine Rahmenzerlegungsschaltung 101 zerlegt das über den Eingangsanschluß 100 eingegebene Eingangssignal in Rahmen, um diese an eine Unterrahmen-Zerlegungsschaltung 102 auszugeben.
  • Die Unterrahmen-Zerlegungsschaltung 102 zerlegt das Eingangssignal in dem Rahmen in Unterrahmen, um sie an eine Linearvorhersage-Restsignal-Erzeugungsschaltung 143 und eine Zielsignal-Erzeugungsschaltung 146 auszugeben. In eine Schaltung 142 zum Konvertieren linearer Vorhersagekoeffizienten werden der lineare Vorhersagekoeffizient und der von der CELP-Codierschaltung 20 abgeleitete quantisierte lineare Vorhersagekoeffizient über die Eingangsanschlüsse 140 und 141 eingegeben, und sie wandelt sie entsprechend einer Abtastfrequenz des Eingangssignals der zweiten CELP-Codierschaltung 21 in einen ersten linearen Vorhersagekoeffizienten und einen ersten quantisierten linearen Vorhersagekoeffizienten um.
  • Die Abtastfrequenzkonvertierung des linearen Vorhersagekoeffizienten kann durch Ableiten eines Impulsantwortsignals eines Linearvorhersage-Synthesefilters mit der gleichen Konfiguration wie gemäß der vorstehenden Gleichung (2) in bezug auf den jeweiligen linearen Vorhersagekoeffizienten und den jeweiligen quantisierten linearen Vorhersagekoeffizienten ausgeführt werden, und es wird nach dem Ausführen eines Upsamplings (die gleiche Operation wie diejenige der Upsampling-Schaltung 4 aus dem Stand der Technik) des Impulsantwortsignals eine Autokorrelation abgeleitet, um ein Linearvorhersage-Analyseverfahren anzuwenden.
  • Andererseits gibt die Schaltung 142 zum Konvertieren linearer Vorhersagekoeffizienten die ersten linearen Vorhersagekoeffizienten a1(i), i = 1, ..., Np an die Linearvorhersage-Restdifferenzsignal-Erzeugungsschaltung 143, die Zielsignal-Erzeugungsschaltung 146, die Schaltung 147 zum Suchen im adaptiven Codebuch, die Mehrfachimpuls-Erzeugungsschaltung 148 und die Mehrfachimpuls-Suchschaltung 149 aus und gibt auch den ersten quantisierten linearen Vorhersagekoeffizienten a1'(i), i = 1, ..., Np an die Zielsignal-Erzeugungsschaltung 146, die Schaltung 147 zum Suchen im adaptiven Codebuch, die Mehrfachimpuls-Erzeugungsschaltung 148 und die Mehrfachimpuls-Suchschaltung 149 aus.
  • In der Linearvorhersage-Restdifferenzsignal-Erzeugungsschaltung 143 wird das Linearvorhersage-Invertierungsfilter (siehe die folgende Gleichung (13)) durch das von der Unterrahmen-Zerlegungsschaltung 102 eingegebene Eingangssignal angesteuert, um das Linearvorhersage-Restdifferenzsignal abzuleiten und es an die Linearvorhersage-Analyseschaltung 144 auszugeben.
  • Figure 00340001
  • Die Linearvorhersage-Analyseschaltung 144 führt in ähnlicher Weise wie die in 13 dargestellte Linearvorhersage-Analyseschaltung 103 eine lineare Vorhersageanalyse des Linearvorhersage-Restdifferenzsignals aus, um zweite lineare Vorhersagekoeffizienten aw(i), i = 1, ..., Np' an die Schaltung 145 zum Quantisieren linearer Vorhersagekoeffizienten, die Zielsignal-Erzeugungsschaltung 146, die Schaltung 147 zum Suchen im adaptiven Codebuch, die Mehrfachimpuls-Erzeugungsschaltung 148 und die Mehrfachimpuls-Suchschaltung 149 auszugeben. Hierbei ist Np' die Ordnung der linearen Vorhersageanalyse, beispielsweise "10" gemäß der dargestellten Ausführungsform.
  • Die Schaltung 145 zum Quantisieren linearer Vorhersagekoeffizienten quantisiert, ähnlich der in 13 dargestellten Schaltung 104 zum Quantisieren linearer Vorhersagekoeffizienten, den zweiten linearen Vorhersagekoeffizienten, um den zweiten quantisierten linearen Vorhersagekoeffizienten aw'(i), i = 1, ..., Np' an die Zielsignal-Erzeugungsschaltung 146, die Schaltung 147 zum Suchen im adaptiven Codebuch, die Mehrfachimpuls-Erzeugungsschaltung 148 und die Mehrfachimpuls-Suchschaltung 149 auszugeben und den Index, der den zweiten quantisierten linearen Vorhersagekoeffizienten angibt, an den Ausgangsanschluß 113 auszugeben.
  • In der Zielsignal-Erzeugungsschaltung 146 wird das durch die folgende Gleichung (14) ausgedrückte hörbarkeitsgewichtete Filter durch das von der Unterrahmen-Zerlegungsschaltung 102 eingegebene Eingangssignal angesteuert, um ein hörbarkeitsgewichtetes Signal zu erzeugen.
  • Figure 00350001
  • Hierbei sind R1, R2, R3 und R4 Gewichtungskoeffizienten, welche den hörbarkeitsgewichteten Betrag steuern. Beispielsweise gilt R1 = R3 = 0,6 und R2 = R4 = 0,9.
  • Als nächstes wird ein hörbarkeitsgewichtetes Synthesefilter Hsw'(z), bei dem das Linearvorhersage-Synthesefilter (siehe die folgende Gleichung (15)) des unmittelbar vorhergehenden Unterrahmens und das hörbarkeitsgewichtete Filter Hw'(z) in einer Kaskadenschaltung, verbunden sind, durch das Erregungssignal des vom Unterrahmenpuffer 106 erhaltenen unmittelbar vorhergehenden Unterrahmens angesteuert. Anschließend wird der Filterkoeffizient des hörbarkeitsgewichteten Synthesefilters zu dem Wert des aktuellen Unterrahmens geändert. Danach wird das hörbarkeitsgewichtete Synthesefilter unter Verwendung eines Null-Eingangssignals, bei dem alle Signalwerte null sind, angesteuert, um ein Eingangsantwortsignal von Null abzuleiten.
  • Figure 00360001
  • Weiterhin wird das Null-Eingangsantwortsignal vom hörbarkeitsgewichteten Signal subtrahiert, um das Zielsignal X(n), n = 0, ... N – 1 zu erzeugen. Hierbei ist n eine Unterrahmenlänge. Andererseits wird das Zielsignal X(n) an die Schaltung 147 zum Suchen im adaptiven Codebuch, die Mehrfachimpuls-Suchschaltung 149 und die Verstärkungssuchschaltung 130 ausgegeben.
  • In der Schaltung 147 zum Suchen im adaptiven Codebuch wird ähnlich der Schaltung 127 zum Suchen im adaptiven Codebuch (siehe 2) gemäß der ersten Ausführungsform die erste Tonhöhe d1 von dem über den Eingangsanschluß 124 erhaltenen Index ILd abgeleitet. Weiterhin wird in dem bei der ersten Tonhöhe d1 zentrierten Suchbereich die zweite Tonhöhe d2, bei der der durch die vorstehende Gleichung (3) ausgedrückte Fehler minimal wird, ausgewählt. Als das hörbarkeitsgewichtete Synthesefilter im Nullzustand wird ein durch Initialisieren des hörbarkeitsgewichteten Synthesefilters Hsw'(z) für jeden Unterrahmen erzeugtes Filter Zsw'(z) verwendet.
  • Anschließend bildet die Schaltung 147 zum Suchen im adaptiven Codebuch einen Differenzwert der ausgewählten zweiten Tonhöhe d2 und der ersten Tonhöhe d1 als die differentielle Tonhöhe und gibt sie nach der Konvertierung in den Index Id an den Ausgangsanschluß 110 aus. Andererseits wird das ausgewählte adaptive Codevektorsignal Ad(n) an die Verstärkungssuchschaltung 130 ausgegeben, und das reproduzierte Signal SAd(n) wird an die Verstärkungssuchschaltung 130 und die Mehrfachimpuls-Suchschaltung 149 ausgegeben.
  • In der Mehrfachimpuls-Erzeugungsschaltung 148 wird ähnlich wie bei der Mehrfachimpuls-Erzeugungsschaltung 128 gemäß der ersten Ausführungsform das erste Mehrfachimpulssignal DL(n) auf der Grundlage des von der ersten CELP-Codierschaltung 20 codierten Mehrfachimpulssignals erzeugt. Andererseits wird unter Verwendung des hörbarkeitsgewichteten Synthesefilters Zsw'(z) im Nullzustand das reproduzierte Signal SDL(n) des ersten Mehrfachimpulssignals erzeugt, um das erste Mehrfachimpulssignal und das davon reproduzierte Signal an die Verstärkungssuchschaltung 130 auszugeben.
  • In der Mehrfachimpuls-Suchschaltung 149 wird ähnlich wie in der Mehrfachimpuls-Suchschaltung 129 gemäß der ersten Ausführungsform das zum ersten Mehrfachimpulssignal und zum adaptiven Codevektorsignal orthogonale zweite Mehrfachimpulssignal unter Verwendung des hörbarkeitsgewichteten Synthesefilters Zsw'(z) im Nullzustand neu gesucht. Andererseits gibt die Mehrfachimpuls-Suchschaltung 149 das zweite Mehrfachimpulssignal Cj(n) und das davon reproduzierte Signal SCj(n) an die Verstärkungssuchschaltung 130 aus und den entsprechenden Index an den Ausgangsanschluß 111 aus.
  • Anschließend wird das Sprachdecodiersystem erörtert. 7 ist ein Blockdiagramm, in dem der Aufbau der ersten CELP-Decodierschaltung des Sprachcodier- und -decodiersystems gemäß der zweiten Ausführungsform der vorliegenden Erfindung dargestellt ist. Anhand 7 wird der Unterschied zwischen der ersten CELP-Decodierschaltung 22 und der in 14 dargestellten CELP-Decodierschaltung erörtert.
  • Die erste CELP-Decodierschaltung 22 unterscheidet sich von der in 14 dargestellten CELP-Decodierschaltung nur dadurch, daß der quantisierte lineare Vorhersagekoeffizient als die Ausgabe der Schaltung 118 zum Decodieren linearer Vorhersagekoeffizienten als die Ausgabe des Ausgangs anschlusses 150 verwendet wird. Dementsprechend wird die Arbeitsweise der die erste CELP-Decodierschaltung 22 bildenden Schaltung nicht erörtert, um die Offenbarung durch Vermeiden einer redundanten Erörterung einfach genug zu halten und das klare Verständnis der vorliegenden Erfindung zu erleichtern.
  • 8 ist ein Blockdiagramm, in dem eine Anordnung der zweiten CELP-Decodierschaltung des Sprachcodier- und -decodiersystems gemäß der zweiten Ausführungsform der vorliegenden Erfindung dargestellt ist. Anhand 8 wird die zweite CELP-Decodierschaltung 23 erörtert, die das Sprachdecodiersystem gemäß der zweiten Ausführungsform der vorliegenden Erfindung bildet.
  • Die zweite CELP-Decodierschaltung 23 unterscheidet sich von der zweiten CELP-Decodierschaltung 17 gemäß der vorstehenden Ausführungsform nur in den Arbeitsweisen der Schaltung 152 zum Konvertieren linearer Vorhersagekoeffizienten und der Reproduktionssignal-Erzeugungsschaltung 153. Die folgende Offenbarung konzentriert sich auf jene Schaltungen, die von der vorstehenden ersten Ausführungsform verschieden sind.
  • Anhand 8 sei bemerkt, daß die Schaltung 152 zum Konvertieren linearer Vorhersagekoeffizienten den von der ersten CELP-Decodierschaltung 22 decodierten quantisierten linearen Vorhersagekoeffizienten über den Eingangsanschluß 151 entgegennimmt, um ihn ähnlich wie die Schaltung 142 zum Konvertieren linearer Vorhersagekoeffizienten auf der Codierseite in den ersten quantisierten linearen Vorhersagekoeffizienten zu konvertieren und ihn an die Reproduktionssignal-Erzeugungsschaltung 153 auszugeben. In der Reproduktionssignal-Erzeugungsschaltung 153 wird das reproduzierte Signal durch Ansteuern des Linearvorhersage-Synthesefilters Hs'(z) durch das in der Verstärkungsdecodierschaltung 137 erzeugte Erregungssignal erzeugt, um es an den Ausgangsanschluß 123 auszugeben.
  • Beim vorstehend erwähnten Sprachcodier- und -decodiersystem gemäß der zweiten Ausführungsform der vorliegenden Erfindung erfolgte die Erörterung anhand der mehrstufigen Codierung der Tonhöhe, des Mehrfachimpulses und des linearen Vorhersagekoeffizienten, und Ähnliches ist auf den Fall anwendbar, in dem eines oder zwei von der Tonhöhe, dem Mehrfachimpuls und dem linearen Vorhersagekoeffizienten durch eine mehrstufige Codierung codiert werden.
  • 9 ist ein Blockdiagramm, in dem der Aufbau des Sprachcodier- und -decodiersystems gemäß der dritten Ausführungsform der vorliegenden Erfindung dargestellt ist. Anhand 9 wird die dritte erfindungsgemäße Ausführungsform des Sprachcodier- und -decodiersystems erörtert. Zur Vereinfachung der Darlegung wird die Erörterung für den Fall vorgenommen, in dem die Anzahl der Hierarchien zwei ist. Eine ähnliche Erörterung wird in Bezug auf drei oder mehr Hierarchien vorgenommen. Gemäß der dargestellten Ausführungsform kann der durch ein Sprachcodiersystem codierte Bitstrom durch zwei verschiedene Bitraten (nachstehend als hohe Bitrate und niedrige Bitrate bezeichnet) in einem Sprachdecodiersystem decodiert werden.
  • Die dritte erfindungsgemäße Ausführungsform des Sprachcodier- und -decodiersystems unterscheidet sich von der ersten Ausführungsform nur in den Arbeitsweisen der zweiten CELP-Codierschaltung 24 und der zweiten CELP-Decodierschaltung 25. Nachstehend konzentriert sich die Darlegung daher auf jene Schaltungen, die von denen gemäß der ersten Ausführungsform verschieden sind, um die Darlegung durch Vermeiden einer redundanten Erörterung einfach genug zu halten und dadurch das Verständnis der vorliegenden Erfindung zu erleichtern.
  • Die CELP-Codierschaltung 24 codiert das Eingangssignal auf der Grundlage der vier verschiedenen Indizes ILd, ILj, ILk und ILa und gibt den Index Id des adaptiven Codevektors, den Index Ij des Mehrfachimpulssignals, den Index Ik der Verstärkung und den Index Ia des linearen Vorhersagekoeffizienten an den Multiplexer 7 aus.
  • 10 ist ein Blockdiagramm, in dem der Aufbau der zweiten Ausführungsform der CELP-Codierschaltung 24 dargestellt ist. Die zweite CELP-Codierschaltung 24 wird anhand 10 erörtert. Die zweite CELP-Codierschaltung 24 unterscheidet sich von der zweiten CELP-Codierschaltung 15 (siehe 2) gemäß der ersten Ausführungsform nur in der Arbeitsweise der Schaltung 155 zum Quantisieren linearer Vorhersagekoeffizienten. Die folgende Darlegung konzentriert sich auf die Arbeitsweise der Schaltung 155 zum Quantisieren linearer Vorhersagekoeffizienten, und es wird auf die Darlegung der gemeinsamen Teile verzichtet.
  • In bezug auf 10 sei bemerkt, daß in der Schaltung 155 zum Quantisieren linearer Vorhersagekoeffizienten ein quantisiertes LSP f(i), i = 1, ..., Np – 1 vorhanden ist (Np ist die der linearen Vorhersageanalyse zu unterziehende Ordnung, beispielsweise "10"). Das decodierte quantisierte LSP wird vom ersten quantisierten LSP f1(i), i = 0, ..., Np' – 1 (Np' ist die Ordnung der linearen Vorhersageanalyse in der zweiten CELP-Codierschaltung 24, beispielsweise "20"), entsprechend der Abtastfrequenz des Eingangssignals der zweiten CELP-Codierschaltung 24 konvertiert. Anschließend wird ein differentielles LSP des vom durch die Linearvorhersage-Analyseschaltung 103 erhaltenen linearen Vorhersagekoeffizienten abgeleitet, und das erste quantisierte LSP wird durch ein bekanntes LSP-Quantisierungsverfahren quantisiert, um ein quantisiertes differentielles LSP abzuleiten. Danach werden ein differentielles LSP des von dem durch die Linearvorhersage-Analyseschaltung 103 erhaltenen linearen Vorhersagekoeffizienten abgeleiteten LSP und das erste quantisierte LSP durch ein bekanntes LSP-Quantisierungsverfahren quantisiert, um ein quantisiertes differentielles LSP abzuleiten. Es sei bemerkt, daß die Abtastfrequenzkonvertierung des quantisierten LSP beispielsweise durch die folgende Gleichung (16) verwirklicht werden kann. f1(i) = 0,5 × f(i) i = 0, ..., Np – 1 f1(i) = 0,0 i = Np, ..., Np' – 1 (16)
  • Weiterhin leitet die Schaltung 155 zum Quantisieren des linearen Vorhersagekoeffizienten ein zweites quantisiertes LSP durch Summieren des quantisierten differentiellen LSP und des ersten quantisierten LSP ab. Nach dem Konvertieren des zweiten quantisierten LSP in den quantisierten linearen Vorhersagekoeffizienten wird der quantisierte lineare Vorhersagekoeffizient an die Zielsignal-Erzeugungsschaltung 105, die Schaltung 127 zum Suchen im adaptiven Codebuch und die Mehrfachimpuls-Suchschaltung 128 ausgegeben, und es wird ein den quantisierten linearen Vorhersagekoeffizienten angebender Index an den Ausgangsanschluß 113 ausgegeben.
  • Als nächstes wird das Sprachdecodiersystem erörtert. Die zweite CELP-Decodierschaltung 25 decodiert das zweite reproduzierte Signal anhand der in der ersten CELP-Codierschaltung 14 codierten Indizes ILd, ILj, ILk und ILa und der in der zweiten CELP-Codierschaltung 24 codierten Indizes Id, Ij, Ik und Ia, um sie an die Schaltstufe 19 auszugeben.
  • 11 ist ein Blockdiagramm, in dem der Aufbau der CELP-Decodierschaltung in dem Sprachcodier- und -decodiersystem gemäß der dritten Ausführungsform der vorliegenden Erfindung dargestellt ist. Anhand 11 wird nachstehend ein Unterschied zwischen der zweiten CELP-Decodierschaltung 25 und der zweiten CELP-Decodierschaltung 17 (siehe 3) gemäß der ersten Ausführungsform der vorliegenden Erfindung erörtert. Bei der dritten Ausführungsform der vorliegenden Erfindung unterscheidet sich nur die Arbeitsweise der Schaltung 157 zum Codieren linearer Vorhersagekoeffizienten von derjenigen gemäß der vorstehenden ersten Ausführungsform. Anschließend konzentriert sich die Darlegung auf die Arbeits weise der Schaltung 157 zum Decodieren linearer Vorhersagekoeffizienten.
  • In der Schaltung 157 zum Decodieren linearer Vorhersagekoeffizienten wird das quantisierte LSP f(i), i = 0, ..., Np – 1 anhand des über den Eingangsanschluß 114 eingegebenen Index ILa decodiert, um das erste quantisierte LSP f1(i), i = 0, ..., Np' – 1 zu erhalten. In Zusammenhang damit wird das quantisierte differentielle LSP anhand des über den Eingangsanschluß 156 eingegebenen Index Ia decodiert, um das zweite quantisierte LSP durch Summieren des ersten quantisierten LSPs und des quantisierten differentiellen LSPs abzuleiten. Nach dem Konvertieren des zweiten quantisierten LSPs in den quantisierten linearen Vorhersagekoeffizienten wird der quantisierte lineare Vorhersagekoeffizient an die Reproduktionssignal-Erzeugungsschaltung 122 ausgegeben.
  • Es sei bemerkt, daß, wenngleich die dargestellte Ausführungsform anhand des Falls einer mehrstufigen Codierung der Tonhöhe, des Mehrfachimpulssignals und des linearen Vorhersagekoeffizienten dargelegt wurde, eine ähnliche Erörterung auch auf den Fall anwendbar ist, in dem eines oder zwei von der Tonhöhe, dem Mehrfachimpulssignal und dem linearen Vorhersagekoeffizienten mehrstufig codiert werden.
  • Wie vorstehend dargelegt wurde, kann gemäß der vorliegenden Erfindung die Codierwirksamkeit in der zweiten und nachfolgenden Hierarchien bei der hierarchischen CELP-Codierung verbessert werden.
  • Dies liegt daran, daß gemäß der vorliegenden Erfindung die mehrstufige Codierung für jeden Codierparameter ausgeführt wird, statt ein mehrstufiges Codieren an dem Signal vorzunehmen.
  • Wenngleich die vorliegende Erfindung anhand einer als Beispiel dienenden Ausführungsform erläutert und beschrieben wurde, sollten Fachleute verstehen, daß die vorstehenden und verschiedene andere Änderungen, Auslassungen und Hinzufügungen vorgenommen werden können, ohne vom Schutzumfang der vorliegenden Erfindung abzuweichen. Die vorliegende Erfindung sollte daher nicht als auf die vorstehend dargelegte spezifische Ausführungsform beschränkt, sondern als alle möglichen Ausführungsformen, die in dem von den anliegenden Ansprüchen eingeschlossenen Schutzumfang verwirklicht werden können, einschließend verstanden werden.

Claims (23)

  1. Sprachcodiersystem, das N – 1 Signale mit niedrigeren Abtastfrequenzen als diejenigen eines eingegebenen Sprachsignals erzeugt und das eingegebene Sprachsignal und die erzeugten N – 1 Signale hierarchisch codiert, mit: Codiereinrichtungen (15), die jeweils N Signalarten mit einer entsprechenden Abtastfrequenz auf der Grundlage einer Codierausgabe einer Codiereinrichtung niedrigerer Hierarchie codieren, wobei die der k-ten Hierarchie (k = 2, ..., N) zugeordnete Abtastfrequenz höher ist als diejenige für die (k – 1)-te Hierarchie, eine Multiplexiereinrichtung (7), die Tonhöhen, ein Mehrfachimpulssignal, eine Verstärkung und einen linearen Vorhersagekoeffizienten angebende Indizes in einer von jeder Codiereinrichtung (15) erhaltenen CELP-basierten Codierung multiplexiert, wobei jede Codiereinrichtung (15) eine Schaltung (107, 127, 147) zum Suchen in einem adaptiven Codebuch aufweist, die ein entsprechendes adaptives Codebuchsignal durch Codieren einer differentiellen Tonhöhe in Bezug auf bis zur (n – 1)-ten Hierarchie codierte und decodierte Tonhöhen in der n-ten Hierarchie (n = 2, ..., N) erzeugt.
  2. Sprachcodiersystem nach Anspruch 1, weiter aufweisend: eine Mehrfachimpuls-Erzeugungsschaltung (128), die ein erstes Mehrfachimpulssignal anhand n – 1 bis zur (n – 1)-ten Hierarchie codierter und decodierter Mehrfachimpulssignale erzeugt, eine Mehrfachimpuls-Suchschaltung (129), die eine Impulsposition des zweiten Mehrfachimpulssignals in der n-ten Hierarchie unter Impulspositionskandidaten codiert, wobei die Positionen der Impulse, die die ersten Mehrfachimpulssignale bilden, ausgeschlossen sind, und eine Verstärkungssuchschaltung (130), die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals codiert.
  3. Sprachcodiersystem nach Anspruch 1, wobei die Schaltung (147) zum Suchen im adaptiven Codebuch ein entsprechendes adaptives Codebuchsignal durch Codieren einer differentiellen Tonhöhe in bezug auf bis zur (n – 1)-ten Hierarchie codierte und decodierte Tonhöhen in der n-ten Hierarchie (n = 2, ..., N) erzeugt und n-stufige hörbarkeitsgewichtete Filter aufweist, wobei das System weiter aufweist: eine Mehrfachimpuls-Erzeugungsschaltung (148), die ein erstes Mehrfachimpulssignal anhand n – 1 bis zur (n – 1)-ten Hierarchie codierter und decodierter Mehrfachimpulssignale erzeugt, eine Mehrfachimpuls-Suchschaltung (149), die eine Impulsposition des zweiten Mehrfachimpulssignals in der n-ten Hierarchie unter Impulspositionskandidaten codiert, wobei die Positionen der Impulse, die die ersten Mehrfachimpulssignale bilden, ausgeschlossen sind, eine Verstärkungssuchschaltung (130), die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals codiert, eine Schaltung (142) zum Konvertieren linearer Vorhersagekoeffizienten, die bis zur (n – 1)-ten Hierarchie codierte und decodierte lineare Vorhersagekoeffizienten zu einem Koeffizienten bei einer Abtastfrequenz des Eingangssignals in der n-ten Hierarchie konvertiert, eine Linearvorhersage-Restdifferenzsignal-Erzeugungsschaltung (143), die ein Linearvorhersage-Restdifferenzsignal des Eingangssignals anhand der konvertierten n – 1 linearen Vorhersagekoeffizienten ableitet, eine Linearvorhersage-Analyseschaltung (144), die einen linearen Vorhersagekoeffizienten durch lineare Vorhersageanalyse des abgeleiteten Linearvorhersage-Restdifferenzsignals ableitet, eine Schaltung (145) zum Quantisieren linearer Vorhersagekoeffizienten, die einen neu abgeleiteten linearen Vorhersagekoeffizienten quantisiert, und eine Zielsignal-Erzeugungsschaltung (146), die n-stufige hörbarkeitsgewichtete Filter aufweist.
  4. Sprachcodiersystem nach Anspruch 1, wobei die Schaltung (147) zum Suchen im adaptiven Codebuch hörbarkeitsgewichtete Reproduktionsfilter der n-ten Stufe aufweist, wobei das System weiter aufweist: eine Schaltung (142) zum Konvertieren linearer Vorhersagekoeffizienten, die bis zur (n – 1)-ten Hierarchie codierte und decodierte lineare Vorhersagekoeffizienten in einen Koeffizienten bei einer Abtastfrequenz des Eingangssignals in der n-ten Hierarchie in der Codiereinrichtung der n-ten Hierarchie (n = 2, ..., N) konvertiert, eine Linearvorhersage-Restdifferenzsignal-Erzeugungsschaltung (143), die ein Linearvorhersage-Restdifferenzsignal des Eingangssignals anhand der konvertierten n – 1 linearen Vorhersagekoeffizienten ableitet, eine Linearvorhersage-Analyseschaltung (144), die einen linearen Vorhersagekoeffizienten durch lineare Vorhersageanalyse des abgeleiteten Linearvorhersage-Restdifferenzsignals ableitet, eine Schaltung (145) zum Quantisieren linearer Vorhersagekoeffizienten, die einen neu abgeleiteten linearen Vorhersagekoeffizienten quantisiert, und eine Zielsignal-Erzeugungsschaltung, die hörbarkeitsgewichtete Filter der n-ten Stufe aufweist, eine Mehrfachimpuls-Erzeugungsschaltung (148), eine Mehrfachimpuls-Suchschaltung (149) und eine Zielsignal-Erzeugungsschaltung (146) mit hörbarkeitsgewichteten Filtern der n-ten Stufe.
  5. Sprachcodiersystem nach Anspruch 1, weiter aufweisend: eine Mehrfachimpuls-Erzeugungsschaltung (128), die ein erstes Mehrfachimpulssignal anhand n – 1 bis zur (n – 1)-ten Hierarchie codierter und decodierter Mehrfachimpulssignale in der n-ten Hierarchie (n = 2, ..., N) der Codiereinrichtungen erzeugt, und eine Mehrfachimpuls-Suchschaltung (129), die eine Impulsposition des zweiten Mehrfachimpulssignals in der n-ten Hierarchie unter Impulspositionskandidaten codiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind.
  6. Sprachcodiersystem nach Anspruch 1, welches weiter aufweist: eine Mehrfachimpulsschaltung (128), die ein erstes Mehrfachimpulssignal anhand n – 1 bis zur (n – 1)-ten Hierarchie codierter und decodierter Mehrfachimpulssignale; eine Mehrfachimpuls-Suchschaltung (129), die eine Impulsposition des zweiten Mehrfachimpulssignals in der n-ten Hierarchie unter Impulspositionskandidaten codiert, wobei die Positionen der Impulse, die die ersten Mehrfachimpulssignale bilden, ausgeschlossen sind, eine Verstärkungssuchschaltung, die Verstärkungen des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals und des zweiten Mehrfachimpulssignals codiert, und eine Linearvorhersage-Quantisierungsschaltung (155) zum Codieren einer Differenz zwischen dem bis zur (n – 1)-ten Hierarchie codierten und decodierten linearen Vorhersagekoeffizienten und einem durch Analyse bei der n-ten Hierarchie erhaltenen linearen Vorhersagekoeffizienten.
  7. Sprachcodiersystem nach Anspruch 1, welches weiter aufweist: eine Linearvorhersage-Quantisierungsschaltung (104) zum Codieren einer Differenz zwischen dem bis zur (n – 1)-ten Hierarchie codierten und decodierten linearen Vorhersagekoeffizienten und einem durch Analyse beim Codieren der n-ten Hierarchie erhaltenen linearen Vorhersagekoeffizienten in der n-ten Hierarchie (n = 2, ..., N).
  8. Sprachcodierverfahren zur Verwendung mit dem Sprachcodiersystem nach einem der Ansprüche 1 bis 7 zum Erzeugen von N – 1 Signalen mit einer niedrigeren Abtastfrequenz als diejenige eines eingegebenen Sprachsignals und zum hierarchischen Codieren des eingegebenen Sprachsignals und der erzeugten N – 1 Signale mit den folgenden Schritten: Codieren jeder der N Signalarten mit einer entsprechenden Abtastfrequenz auf der Grundlage einer Codierausgabe der niedrigeren Hierarchie, wobei die der k-ten Hierarchie (k = 2, ..., N) zugeordnete Abtastfrequenz höher ist als diejenige für die (k – 1)-te Hierarchie, Multiplexieren von Tonhöhen, ein Mehrfachimpulssignal, eine Verstärkung und einen linearen Vorhersagekoeffizienten in einer durch Codieren von jeder der erwähnten N Signalarten erhaltenen CELP-basierten Codierung angebenden Indizes, Erzeugen eines entsprechenden adaptiven Codebuchsignals durch Codieren einer differentiellen Tonhöhe in bezug auf bis zur (n – 1)-ten Hierarchie codierte und decodierte Tonhöhen in der n-ten Hierarchie (n = 2, ..., N).
  9. Sprachdecodiersystem zum hierarchischen Ändern von Abtastfrequenzen eines reproduzierten Signals, abhängig von zu decodierenden Bitraten, aufweisend: Decodiereinrichtungen (17), die jeweils jede von N Signalarten mit einer entsprechenden Abtastfrequenz durch eine CELP-Decodierschaltung reproduzieren, wobei die der k-ten Hierarchie (k = 2, ..., N) zugeordnete Abtastfrequenz höher ist als diejenige für die (k – 1)-te Hierarchie, einen Demultiplexer (18), der die Decodiereinrichtung der n-ten Hierarchie (n = 1, ..., N) unter den Decodiereinrichtungen (17) abhängig von einem Steuersignal auswählt, das eine Decodier-Bitrate angibt, und Indizes, die Tonhöhen, ein Mehrfachimpulssignal, eine Verstärkung und einen linearen Vorhersagekoeffizienten bis zur n-ten Hierarchie angeben, aus einem Bitstrom extrahiert, und eine Schaltung (119, 134) zum Decodieren eines adaptiven Codebuchs, welche eine differentielle Tonhöhe anhand eines Index, der die Tonhöhe der n-ten Hierarchie angibt, in Bezug auf bis zur (n – 1)-ten Hierarchie decodierte Tonhöhen decodiert und ein adaptives Codevektorsignal in der ausgewählten Decodiereinrichtung der n-ten Hierarchie (n = 2, ..., N) erzeugt.
  10. Sprachdecodiersystem nach Anspruch 9, weiter aufweisend: eine Mehrfachimpuls-Erzeugungsschaltung (136), die ein erstes Mehrfachimpulssignal anhand Mehrfachimpulssignalen bis zur (n – 1)-ten Hierarchie und Verstärkung erzeugt, eine Mehrfachimpuls-Decodierschaltung (135), die ein zweites Mehrfachimpulssignal anhand eines das Mehrfachimpulssignal der n-ten Hierarchie angebenden Index auf der Grundlage von Impulspositionskandidaten decodiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, und eine Verstärkungsdecodierschaltung (137), die die Verstärkung anhand des die Verstärkung der n-ten Hierarchie angebenden Index decodiert und anhand des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals, des zweiten Mehrfachimpulssignals und der decodierten Verstärkung ein Erregungssignal erzeugt.
  11. Sprachdecodiersystem nach Anspruch 9, weiter aufweisend: eine Mehrfachimpuls-Erzeugungsschaltung (136), die ein erstes Mehrfachimpulssignal anhand Mehrfachimpulssignalen bis zur (n – 1)-ten Hierarchie und Verstärkung erzeugt, eine Mehrfachimpuls-Decodierschaltung (135), die ein zweites Mehrfachimpulssignal anhand eines das Mehrfachimpulssignal der n-ten Hierarchie angebenden Index auf der Grundlage von Impulspositionskandidaten decodiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, eine Verstärkungsdecodierschaltung (137), die die Verstärkung anhand des die Verstärkung der n-ten Hierarchie angebenden Index decodiert und anhand des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals, des zweiten Mehrfachimpulssignals und der decodierten Verstärkung ein Erregungssignal erzeugt, eine Schaltung (152) zum Konvertieren linearer Vorhersagekoeffizienten, die die bis zur (n – 1)-ten Hierarchie abgeleiteten linearen Vorhersagekoeffizienten in einen Koeffizienten bei der Abtastfrequenz des Eingangssignals in der n-ten Hierarchie konvertiert, und eine Reproduktionssignal-Erzeugungsschaltung (153) zum Erzeugen eines reproduzierten Signals durch Ansteuern von nstufigen Linearvorhersage-Synthesefiltern durch das Erregungssignal.
  12. Sprachdecodiersystem nach Anspruch 9, weiter aufweisend: eine Schaltung (118) zum Konvertieren linearer Vorhersagekoeffizienten, die die bis zur (n – 1)-ten Hierarchie abgeleiteten linearen Vorhersagekoeffizienten in einen Koeffizienten bei der Abtastfrequenz des Eingangssignals in der n-ten Hierarchie konvertiert, und eine Reproduktionssignal-Erzeugungsschaltung (122) zum Erzeugen eines reproduzierten Signals durch Ansteuern von nstufige Linearvorhersage-Synthesefiltern durch das Erregungssignal.
  13. Sprachdecodiersystem nach Anspruch 9, weiter aufweisend: eine Mehrfachimpuls-Erzeugungsschaltung (136), die ein erstes Mehrfachimpulssignal anhand eines Mehrfachimpulssignals bis zur (n – 1)-ten Hierarchie angebenden Index erzeugt, und eine Mehrfachimpuls-Decodierschaltung (135), die ein zweites Mehrfachimpulssignal anhand eines das Mehrfachimpulssignal der n-ten Hierarchie angebenden Index auf der Grundlage von Impulspositionskandidaten decodiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind.
  14. Sprachdecodiersystem nach Anspruch 9, weiter aufweisend: eine Mehrfachimpuls-Erzeugungsschaltung (136), die ein erstes Mehrfachimpulssignal anhand eines Mehrfachimpulssignals bis zur (n – 1)-ten Hierarchie angebenden Index und Verstärkung erzeugt, eine Mehrfachimpuls-Decodierschaltung (135), die ein zweites Mehrfachimpulssignal anhand eines das Mehrfachimpulssignal der n-ten Hierarchie angebenden Index auf der Grundlage von Impulspositionskandidaten decodiert, wobei die Positionen der Impulse, die das erste Mehrfachimpulssignal bilden, ausgeschlossen sind, eine Verstärkungsdecodierschaltung (137), die die Verstärkung anhand des die Verstärkung der n-ten Hierarchie angebenden Index decodiert und anhand des adaptiven Codevektorsignals, des ersten Mehrfachimpulssignals, des zweiten Mehrfachimpulssignals und der decodierten Verstärkung ein Erregungssignal erzeugt, und eine Schaltung (157) zum Decodieren linearer Vorhersagekoeffizienten, die einen linearen Vorhersagekoeffizienten anhand eines lineare Vorhersagekoeffizienten bis zur n-ten Hierarchie angebenden Index decodiert.
  15. Sprachdecodiersystem nach Anspruch 9, weiter aufweisend: eine Schaltung (118) zum Decodieren linearer Vorhersagekoeffizienten, die den linearen Vorhersagekoeffizienten anhand des den linearen Vorhersagekoeffizienten bis zur n-ten Hierarchie angebenden Index decodiert.
  16. Sprachdecodierverfahren zur Verwendung mit dem Sprachdecodiersystem nach einem der Ansprüche 9 bis 15 zum hierarchischen Ändern der Abtastfrequenz eines reproduzierten Signals, abhängig von den zu decodierenden Bitraten, das aufweist: Wiederherstellen jeder der N Signalarten mit einer entsprechenden Abtastfrequenz mittels einer CELP-Decodierung, wobei die der k-ten Hierarchie (k = 2, ..., N) zugeordneten Abtastfrequenz höher ist als diejenige für die (k – 1)-ten Hierarchie; Demultiplexen der n-ten Hierarchie (n = 1, ..., N) in Abhängigkeit von einem Kontrollsignal zur Anzeige einer Decodierbitrate und Extrahieren von Indizes zur Anzeige von Tonhöhen, einem Mehrfachimpulssignal, einer Verstärkung und eines linearen Vorhersagekoeffizienten bis zur n-ten Hierarchie aus einem Bitstrom; und Decodieren einer Differrenztonhöhe von einem Index zur Anzeige der Tonhöhe der n-ten Hierarchie bezüglich der bis zur (n – 1)-ten Hierarchie decodierten Tonhöhe und Erzeugen eines adaptiven Codevektorsignals der n-ten Hierarchie (n = 2, ..., N).
  17. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 1 und das Sprachdecodiersystem nach Anspruch 9.
  18. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 2 und das Sprachdecodiersystem nach Anspruch 10.
  19. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 3 und das Sprachdecodiersystem nach Anspruch 11.
  20. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 4 und das Sprachdecodiersystem nach Anspruch 12.
  21. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 5 und das Sprachdecodiersystem nach Anspruch 13.
  22. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 6 und das Sprachdecodiersystem nach Anspruch 14.
  23. Sprachcodier- und -decodiersystem, aufweisend: das Sprachcodiersystem nach Anspruch 7 und das Sprachdecodiersystem nach Anspruch 15.
DE69828725T 1997-07-11 1998-07-01 Sprachcodier- und -decodiersystem Expired - Lifetime DE69828725T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP09202475A JP3134817B2 (ja) 1997-07-11 1997-07-11 音声符号化復号装置
JP20247597 1997-07-11

Publications (2)

Publication Number Publication Date
DE69828725D1 DE69828725D1 (de) 2005-03-03
DE69828725T2 true DE69828725T2 (de) 2006-04-06

Family

ID=16458140

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69828725T Expired - Lifetime DE69828725T2 (de) 1997-07-11 1998-07-01 Sprachcodier- und -decodiersystem

Country Status (5)

Country Link
US (1) US6208957B1 (de)
EP (1) EP0890943B1 (de)
JP (1) JP3134817B2 (de)
CA (1) CA2242437C (de)
DE (1) DE69828725T2 (de)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000352999A (ja) * 1999-06-11 2000-12-19 Nec Corp 音声切替装置
US7095708B1 (en) 1999-06-23 2006-08-22 Cingular Wireless Ii, Llc Methods and apparatus for use in communicating voice and high speed data in a wireless communication system
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
EP1125282B1 (de) * 1999-08-27 2005-09-21 Philips Electronics N.V. Audiokodierung
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP4055203B2 (ja) * 2002-09-12 2008-03-05 ソニー株式会社 データ処理装置およびデータ処理方法、記録媒体、並びにプログラム
CN101615396B (zh) * 2003-04-30 2012-05-09 松下电器产业株式会社 语音编码设备、以及语音解码设备
KR100940531B1 (ko) * 2003-07-16 2010-02-10 삼성전자주식회사 광대역 음성 신호 압축 및 복원 장치와 그 방법
US20050112122A1 (en) * 2003-09-02 2005-05-26 Greiner Dale L. Generation of hematopoietic chimerism and induction of central tolerance
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
JP4733939B2 (ja) * 2004-01-08 2011-07-27 パナソニック株式会社 信号復号化装置及び信号復号化方法
KR20070009644A (ko) 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
JP4789430B2 (ja) * 2004-06-25 2011-10-12 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
JPWO2006025313A1 (ja) 2004-08-31 2008-05-08 松下電器産業株式会社 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
EP1785985B1 (de) 2004-09-06 2008-08-27 Matsushita Electric Industrial Co., Ltd. Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
WO2006028009A1 (ja) 2004-09-06 2006-03-16 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置および信号消失補償方法
US7848925B2 (en) 2004-09-17 2010-12-07 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
DE602005016130D1 (de) * 2004-09-30 2009-10-01 Panasonic Corp Einrichtung für skalierbare codierung, einrichtung für skalierbare decodierung und verfahren dafür
US20060167930A1 (en) * 2004-10-08 2006-07-27 George Witwer Self-organized concept search and data storage method
WO2006041055A1 (ja) * 2004-10-13 2006-04-20 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP5036317B2 (ja) * 2004-10-28 2012-09-26 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
EP1860649B8 (de) * 2005-02-24 2011-10-05 Panasonic Corporation Datenwiedergabevorrichtung
US8000967B2 (en) 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
WO2006096099A1 (en) * 2005-03-09 2006-09-14 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
JP5058152B2 (ja) * 2006-03-10 2012-10-24 パナソニック株式会社 符号化装置および符号化方法
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP5403949B2 (ja) * 2007-03-02 2014-01-29 パナソニック株式会社 符号化装置および符号化方法
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
EP3261090A1 (de) * 2007-12-21 2017-12-27 III Holdings 12, LLC Codierer, decodierer und codierungsverfahren
JP5921379B2 (ja) * 2012-08-10 2016-05-24 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テキスト処理方法、システム及びコンピュータ・プログラム。
CN103632680B (zh) * 2012-08-24 2016-08-10 华为技术有限公司 一种语音质量评估方法、网元及系统
EP2988300A1 (de) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Schalten von Abtastraten bei Audioverarbeitungsvorrichtungen
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3114197B2 (ja) 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
AU7960994A (en) * 1993-10-08 1995-05-04 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP3137176B2 (ja) 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method

Also Published As

Publication number Publication date
US6208957B1 (en) 2001-03-27
DE69828725D1 (de) 2005-03-03
EP0890943B1 (de) 2005-01-26
JPH1130997A (ja) 1999-02-02
JP3134817B2 (ja) 2001-02-13
CA2242437C (en) 2002-06-25
CA2242437A1 (en) 1999-01-11
EP0890943A3 (de) 1999-12-22
EP0890943A2 (de) 1999-01-13

Similar Documents

Publication Publication Date Title
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69029232T2 (de) System und Methode zur Sprachkodierung
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE69328450T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69530442T2 (de) Vorrichtung zur Sprachkodierung
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69900786T2 (de) Sprachkodierung
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69227401T2 (de) Verfahren zum Kodieren und Dekodieren von Sprachsignalen
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE69029120T2 (de) Stimmenkodierer
DE19647298C2 (de) Kodiersystem
DE69718234T2 (de) Sprachkodierer
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE602004004950T2 (de) Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
DE60133757T2 (de) Verfahren und vorrichtung zur kodierung von stimmloser sprache
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE69636209T2 (de) Vorrichtung zur Sprachkodierung
DE3853161T2 (de) Vektorquantisierungscodierer.
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
DE69426860T2 (de) Sprachcodierer und Verfahren zum Suchen von Codebüchern
DE69725945T2 (de) Sprachkodierer mit niedriger Bitrate
DE69329568T2 (de) Verfahren zur Sprachkodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition