DE68923771T2 - Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung. - Google Patents

Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.

Info

Publication number
DE68923771T2
DE68923771T2 DE68923771T DE68923771T DE68923771T2 DE 68923771 T2 DE68923771 T2 DE 68923771T2 DE 68923771 T DE68923771 T DE 68923771T DE 68923771 T DE68923771 T DE 68923771T DE 68923771 T2 DE68923771 T2 DE 68923771T2
Authority
DE
Germany
Prior art keywords
signals
sound source
primary
signal
excitation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE68923771T
Other languages
English (en)
Other versions
DE68923771D1 (de
Inventor
Kazunori Ozawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP63326805A external-priority patent/JPH02170199A/ja
Priority claimed from JP1001849A external-priority patent/JPH02181800A/ja
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Application granted granted Critical
Publication of DE68923771D1 publication Critical patent/DE68923771D1/de
Publication of DE68923771T2 publication Critical patent/DE68923771T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Description

  • Diese Erfindung betrifft ein Kommunikationssystem, welches eine Kodiervorrichtung zum Kodieren einer Folge von digitalen Eingangssprachsignalen in einen Satz von Anregungs- Mehrfachimpulsen enthält, und/oder eine Dekodiervorrichtung, die mit der Kodiervorrichtung kommunizieren kann.
  • Bekanntlich ist ein herkömmliches Kommunikationssystem des beschriebenen Typs für die Übertragung eines Sprachsignals mit einer niedrigen Bit-Übertragungsrate, wie z.B. 4,8 kb/s von einer Sendeseite zu einer Empfangsseite hilfreich. Die Sende- und Empfangsseite weisen eine Kodiervorrichtung und eine Dekodiervorrichtung auf, welche jeweils zum Kodieren bzw. Dekodieren der Sprachsignale in der Art betreibbar sind, welche nachstehend im Detail beschrieben werden wird. Es wurde eine große Vielfalt derartiger Systeme vorgeschlagen, um eine in der Dekodiervorrichtung reproduzierte Sprachqualität zu verbessern und eine Bit-Übertragungsrate zu senken.
  • Unter anderen war bisher ein Tonlageninterpolations- Mehrfachimpulssystem bekannt, welches in der JP-A-15000/1986 und in der JP-A-038500/1987, welche als erste bzw. zweite Bezugsquelle bezeichnet werden können, vorgeschlagen wurden. In diesem Tonlageninterpolations-Mehrfachimpulssystem wird die Kodiervorrichtung mit einer Folge digitaler Eingangssprachsignale bei jedem Rahmen, z.B. alle 20ms, versorgt und extrahiert einen Spektrumparameter und einen Tonlagenparameter, welche als erster bzw. zweiter Primärparameter bezeichnet werden. Der Spektrumparameter repräsentiert eine Spektrumhüllkurve eines von der Folge digitaler Eingangssprachsignale spezifizierten Sprachsignals, während der Tonlagenparameter eine Tonlage des Sprachsignals repräsentiert. Danach wird die Folge digitaler Eingangssprachsignale in einen stimmhaften Laut und in einen stimmlosen Laut, welche für stimnhafte und stimmlose Dauern anstehen, klassifiziert. Zusätzlich wird die Folge digitaler Eingangssprachsignale bei jedem Rahmen in mehrere Tonlagendauern unterteilt, welche jeweils als Unterrahmen bezeichnet werden können. Unter diesen Umständen läuft der Betrieb in der Kodiervorrichtung so ab, daß ein Satz von Anregungs-Mehrfachimpulsen berechnet wird, der ein von der Folge digitaler Eingangssprachsighale spezifiziertes Schallquellensignal repräsentiert.
  • Insbesondere wird das Schallquellensignal für die stimmhafte Dauer durch den Satz von Anregungs-Mehrfachimpulsen repräsentiert, welcher mit Bezug auf eine ausgewählte Dauer berechnet wird, welche als repräsentative Dauer bezeichnet werden kann. Aufgrund dieser Tatsache ist es verständlich, dab jeder Satz von Anregungs-Mehrfachimpulsen aus dazwischenliegenden Unterrahmen extrahiert wird. Nachfolgend wird eine Amplitude und Lage jedes Anregungs-Mehrfachimpulses des Satzes von der Sendeseite zur Empfangsseite zusammen mit den Spektrum- und Tonlagenparametern übertragen. Andererseits wird ein Schallquellensignal eines Einzelrähmens für die stimmlose Dauer durch eine kleine Anzahl von Anregungs-Mehrfachimpulsen und ein Rauschsignal dargestellt. Danach wird die Amplitude und Lage jedes Anregungs-Mehrfachimpulses für die stimmlose Dauer mit einen Verstärkungssignal und einen Index für das Rauschsignal übertragen. In jedem Falle werden die Amplituden und Lagen der Anregungs-Mehrfachimpulse, die Spektrum- und die Tonlagenparameter, und die Verstärkungswerte und Indizes der Rauschsignale als eine Folge von Ausgangssignalen von der Sendeseite an eine Empfangsseite, welche eine Dekodiervorrichtung aufweist, gesendet.
  • Auf der Empfangsseite wird die Dekodiervorrichtung mit der Ausgangssignalfolge als einer Empfangssignalfolge versorgt, welche, wie vorstehend erläutert, Information bezüglich aus Rahmen extrahierter Sätze von Anregungs-Mehrfachimpulsen enthält. Nun werde ein aus einer repräsentativen Dauer eines aktuellen Rahmens extrahierter aktueller Satz der Anregungs-Mehrfachimpulse und ein aus einer repräsentativen Dauer eines dem aktuellen Rahmen folgenden nächsten Rahmens extrahierter nächster Satz der Anregungs-Mehrfachimpulse betrachtet. In diesem Falle wird eine Interpolation für die stimmhafte Dauer unter Verwendung der Amplituden und Lagen der aktuellen und nächsten Sätze der Anregungs- Mehrfachimpulse ausgeführt, um Anregungs-Mehrfachimpulse in den restlichen Unterrahmen außer den mit den repräsentativen Dauern zu rekonstruieren, und um eine Folge von Schallquellensteuersignalen für jeden Rahmen zu erzeugen. Andererseits wird eine Folge von Schallquellensteuersignalen für jeden Rahmen für eine stimmlose Dauer unter Verwendung von Indizes und Verstärkungswerten der Anregungs-Mehrfachimpulse und der Rauschsignale reproduziert.
  • Danach werden die so reproduzierten Schallquellensteuersignale an ein unter Verwendung eines Spektrumparameters gebildetes Synthesefilter angelegt und in ein synthetisiertes Sprachsignal synthetisiert.
  • Mit dieser Struktur wird jeder Satz der Anregungs-Mehrfachimpulse intermittierend aus jedem Rahmen in der Kodiervorrichtung extrahiert und mittels eines Interpolationsverfahrens in der Dekodiervorrichtung in ein synthetisiertes Sprachsignal reproduziert. Dabei ist zu beachten, daß die intermittierende Extraktion der Anregungs-Mehrfachimpulse es schwierig macht, das Schallquellensteuersignal in der Dekodiervorrichtung während eines Übergangsabschnittes zu reproduzieren, bei welchen das Schallquellensignal in seiner Charakteristik verändert wird. Solch ein Übergangsbereich entsteht, wenn ein Vokal in einen weiteren Vokal bei einer Vokalkette in dem Sprachsignal übergeht und wenn ein stimmhafter Laut in einen weiteren stimmhaften Laut geändert wird. In einem Rahmen, der einen solchen Übergangsbereich enthält, unterscheiden sich die durch den Einsatz des Interpolationsverfahrens erzeugten Schallquellensteuersignale extrem von den tatsächlichen Schallquellensignalen, was eine Qualitätsverschlechterung des synthetisierten Sprachsignals ergibt.
  • Es sei hier angemerkt, daß der Spektrumparameter für eine Spektrumhüllkurve im allgemeinen in einer Kodiervorrichtung durch Analyse des digitalen Eingangssprachsignals mittels eines Linearprädiktionskodierverfahrens (LPC) berechnet wird und in einer Dekodiervorrichtung dafür verwendet wird, ein Synthesefilter zu formen. Auf diese Weise wird das Synthesefilter durch den mittels des Linearprädiktionskodierverfahrens abgeleiteten Spektrumparameter geformt und weist eine von der Spektrumhüllkurve bestimmte Filtercharakteristik auf. Es hat sich jedoch herausgestellt, daß, wenn weibliche Laute, insbesondere "i" und "u" mittels des Linearprädiktionskodierverfahrens analysiert werden, ein nachteiliger Einfluß in einer Grundwelle und in ihren Oberwellen einer Tonlagenfrequenz auftreten. Demzufolge weist das Synthesefilter eine Bandbreite auf, welche wesentlich schmaler als eine von einer Spektrumhüllkurve in der Praxis vorkommender Sprachignale bestimmte Praxisbandbreite ist. Insbesondere wird die Bandbreite des Synthesefilters in einem Frequenzband extrem schmal, welches einem ersten Formant-Frequenzband entspricht. Demzufolge tritt keine periodizität einer Tonlage in einem Schallquellensignal auf. Daher wird die Sprachqualität des synthetisierten Sprachsignals unvorteilhaft reduziert, wenn die Sprachlautesignale durch die Anregungs- Mehrfachimpulse repräsentiert werden, welche mittels des Interpolationsverfahrens unter Annahme der Periodizität der Schallquelle extrahiert werden.
  • Die US-A-4 945 567 offenbart eine das Mehrfachimpulsverfahren nutzende spezielle Kodiervorrichtung, in welcher eine Stimmhaft/Stimmlos-Entscheidung erzeugt wird; dieses ergibt eine unterschiedliche Anzahl von Impulsen bei den entsprechenden Abschnitten. Die EP-A-0360265 (Stand der Technik gemäß Art. 54(3)EPÜ) offenbart ein Kommunikationssystem zum Verbessern der Sprachqualität.
  • Es ist eine Aufgabe dieser Erfindung, ein Kommunikationssystem bereitzustellen, welches eine Sprachqualität verbessern kann, wenn digitale Eingangssprachsignale auf einer Sendeseite kodiert und auf einer Empfangsseite reproduziert werden.
  • Es ist eine weitere Aufgabe dieser Erfindung, einen Kodierer bereitzustellen, welcher auf der Sendeseite des Kommunikationssystems eingesetzt wird und welcher die digitalen Eingangssprachsiqnale mit einem relativ kleinem Berechnungsaufwand in eine Folge von Ausgangssignalen kodieren kann, um so die Sprachqualität zu verbessern.
  • Noch eine weitere Aufgabe dieser Erfindung besteht darin, eine Dekodiervorrichtung bereitzustellen, welche auf der Empfangsseite eingesetzt wird und welche ein synthetisiertes Sprachsignal mit einer hohen Sprachsignalqualität reproduzieren kann.
  • Diese Aufgaben werden durch die Merkmale der Patentansprüche gelöst.
  • Von den Zeichnungen stellen dar:
  • Fig. 1 ein Blockschaltbild einer Kodiervorrichtung gemäß einer ersten Ausführungsform dieser Erfindung;
  • Fig. 2 ein Blockschaltbild zur Verwendung bei der Beschreibung einer in Fig. 1 dargestellten Impulsberechnungseinrichtung;
  • Fig. 3 ein Zeitdiagramm für die Verwendung bei der Beschreibung der Betriebsweise der in Fig. 2 dargestellten Impulsberechnungseinrichtung;
  • Fig. 4 ein Blockschaltbild einer Dekodiervorrichtung, welche mit der in Fig. 1 dargestellten Kodiervorrichtung kommunizieren kann, um mit der Kodiervorrichtung zusammen ein Kommunikationssystem zu bilden; und
  • Fig. 5 ein Blockschaltbild einer Kodiervorrichtung gemäß einer zweiten Ausführungsform dieser Erfindung.
  • Nach Fig. 1 wird eine Kodiervorrichtung gemäß einer ersten Ausführungsform dieser Erfindung mit einer Folge von digitalen Eingangssprachsignalen X(n) versorgt, um einen Folge von Ausgangssignalen OUT zu erzeugen, wobei n Abtastzeitpunkte repräsentiert. Die Folge der digitalen Eingangssprachsignale X(n) ist in mehrere Rahmen unterteilbar und es wird angenommen, daß sie von einer externen Einrichtung, wie z.B. einem (nicht dargestellten) Analog/Digital-Wandler an die Kodiervorrichtung gesendet wird. Die digitalen Eingangssprachsignale X(n) tragen stimmhafte und stimmlose Laute, welche für jeweils eine stimmhafte und stimmlose Zeitdauer anstehen. Jeder Rahmen kann beispielsweise eine Intervallzeit von beispielsweise 20 Millisekunden aufweisen. Die digitalen Eingangssprachsignale X(n) werden mit jedem Rahmen an eine Parameterberechnungseinheit 11 geliefert. Die dargestellte Parameterberechnungseinheit 11 weist einen (nicht dargestellten) LPC-Analysator und eine (nicht dargestellte) Tonlagenparameter-Berechnungseinrichtung auf, wovon beide die digitalen Eingangssprachsignale parallel erhalten, um die Spektrumparameter ai, nämlich die LPC-Parameter, und die Tonlagenparameter in bekannter Weise zu berechnen.
  • Die Spektrumparameter ai repräsentieren insbesondere eine Spektrumhüllkurve der digitalen Eingangssprachsignale X(n) bei jedem Rahmen und können zusammengefaßt als ein Spektrumparameter bezeichnet werden. Der LPC-Analysator analysiert die digitalen Eingangssprachsignale mittels eines im Fachgebiet bekannten Linearprädiktionskodierverfahrens, um lediglich Spektrumparameter erster bis p-ter Ordnung zu berechnen. Die Berechnung der Spektrumparameter ist im Detail in der JP- A-51900/1985 beschrieben, welche als dritte Bezugsquelle bezeichnet werden kann. In jedem Falle werden die in dem LPC- Analysator berechneten Spektrumparameter an einen Parameter- Quantisierer 12 gesendet und in quantisierte Spektrumparameter quantisiert, wovon jeder aus einer vorgegebenen Anzahl von Bits besteht. Alternativ kann die Quantisierung mittels der anderen bekannten Verfahren, wie z.B. die Skalarquantisierung und Vektorquantisierung ausgeführt werden. Die quantisierten Spektrumparameter werden an einen Multiplexer 13 geliefert. Desweiteren werden die quantisierten Spektrumparameter durch einen inversen Quantisierer 14 konvertiert, welcher eine inverse Quantisierung bezogen auf die Quantisierung des Parameterquantisierers 12 in konvertierte Spektrumparameter ai' (i = 1 p) ausführt. Die konvertierten Spektrumparameter ai' werden an eine Impulsberechnungseinheit 15 geliefert. Die quantisierten Spektrumparameter und die konvertierten Spektrumparameter ai' stammen von den Spektrumparametern, die von dem LPC-Analysator berechnet werden, und werden in der Form elektrischer Signale erzeugt, welche zusammengefaßt als ein erstes Parametersignal bezeichnet werden können.
  • In der Parameterberechnungseinheit 11 berechnet die Tonlagenberechnungseinrichtung eine gemittelte Tonlagenperiode M und Tonlagenkoeffizienten b aus den digitalen Eingangssprachsignalen, um als die Tonlagenparameter die gemittelte Tonlagenperiode M und die Tonlagenkoeffizienten b durch ein Autokorrelationsverfahren zu erzeugen, welches ebenfalls in der dritten Bezugsquelle beschrieben ist und welches deshalb nachstehend nicht erläutert wird. Alternativ können die Tonlagenparameter mittels der anderen bekannten Verfahren, wie z.B. ein Cepstrum-Verfahren (Spektralanalyse), ein SIFT-Verfahren, ein modifiziertes Korrelationsverfahren, berechnet werden. In jedem Falle werden die gemittelte Tonlagenperiode M und die Tonlagenkoeffizienten b ebenfalls von dem Parameterquantisierer 12 in eine quantisierte Tonlagenperiode und in quantisierte Tonlagenkoeffizienten quantisiert, wovon jeder aus einer vorgegebenen Anzahl von Bits besteht. Die quantisierte Tonlagenperiode und die quantisierten Tonlagenkoeffizienten werden als elektrische Signale gesendet. Zusätzlich werden die quantisierte Tonlagenperiode und die quantisierten Tonlagenkoeffizienten ebenfalls von dem inversen Quantisierer 14 in eine konvertierte Tonlagenperiode M' und in die konvertierten Tonlagenkoeffizienten b' konvertiert, welche in der Form elektrischer Signale erzeugt werden. Die quantisierte Tonlagenperiode und die quantisierten Tonlagenkoeffizienten werden als ein zweites Parametersignal, welches die Tonlagenperiode und die Tonlagenkoeffizienten repräsentiert, an den Multiplexer 13 gesendet.
  • Eine Entscheidungsschaltung 16 trifft unter Verwendung der konvertierten Tonlagenkoeffizienten b' bei jedem Rahmen die Entscheidung, ob die digitalen Eingangssprachsignale X(n) in einen stimmhaften Laut oder stimmlosen Laut klassifiziert werden. Genauer gesagt, vergleicht die Entscheidungsschaltung 16 die konvertierten Tonlagenkoeffizienten b' in jedem Rahmen mit einem vorgegebenen Pegel und erzeugt mit jedem Rahmen ein bei DS dargestelltes Entscheidungssignal. Die Entscheidungsschaltung 16 erzeugt das für stimmhafte Lautinformation repräsentative Entscheidungssignal DS, wenn die konvertierten Tonlagenkoeffizienten b' höher als der vorgegebene Pegel sind. Anderenfalls erzeugt die Bewertungsschaltung 16 das für stimmlose Lautinformation repräsentative Entscheidungssignal DS. Das Entscheidungssignal DS wird an die Impulsberechnungseinheit 15 geliefert.
  • In dem dargestellten Beispiel wird die Impulsberechnungsschaltung 15 mit den digitalen Eingangssprachsignalen X(n) bei jedem Rahmen zusammen mit den konvertierten Spektrumparametern ai', der konvertierten Tonlagenperiode M', den konvertierten Tonlagenkoeffizienten b' und dem Beurteilungssignal DS versorgt, um selektiv einen ersten Satz primärer Schallquellensignale und einen zum ersten Satz primärer Schallquellensignale unterschiedlichen zweiten Satz sekundärer Schallquellensignale in einer später noch zu beschreibenden Weise zu erzeugen. Zu diesem Zweck weist die Impulsberechnungseinheit 15 einen auf die digitalen Eingangssprachsignale X(n) und eine Folge lokal synthetisierter Sprachsignale X'(n) reagierenden Subtrahierer 21 auf, um eine Folge von Fehlersignalen e(n) zu erzeugen, welche die Unterschiede zwischen dem digitalen Eingangs- und den lokal erzeugten Sprachsignalen X(n) und X'(n) repräsentieren. Die Fehlersignale e(n) werden an eine Wahrnehmungswichtungsschaltung 22 gesendet, welche auch mit den konvertierten Spektrumparametern ai' versorgt wird. In der Wahrnehmungswichtungsschaltung 22 werden die Fehlersignale e(n) anhand von Gewichten, welche von den konvertierten Spektrumparametern ai' bestimmt werden, gewichtet. Somit berechnet die Wahrnehmungswichtungsschaltung 22 eine Folge gewichteter Fehlersignale in einer bekannten Weise, um die gewichteten Fehlersignale Xw(n) an einen Kreuzkorrelator 23 zu liefern.
  • Andererseits werden die konvertierten Spektrumparameter ai' auch aus dem inversen Quantisierer 14 an eine Impulsantwort-Berechnungseinrichtung 24 geliefert. Versorgt mit den konvertierten Spektrumparametern ai', der konvertierten Tonlagenperiode M', den konvertierten Tonlagenkoeffizienten b' und dem Entscheidungssignal DS berechnet die Impulsantwort- Berechnungseinrichtung 24 eine primäre Impulsantwort hw(n) eines Filters mit einer von der nachstehenden Gleichung (1) definierten Übertragungsfunktion H(Z) unter Verwendung der konvertierten Spektrumparameter ai', der konvertierten Tonlagenperiode M' und der konvertierten Tonlagenkoeffizienten b', wenn das Entscheidungssignal DS die stimmhafte Lautinformation repräsentiert.
  • H(Z) = 1/{(1- b'Z-M')}{(1 - Σai'Z-i)}. (1)
  • Die Impulsantwort-Berechnungseinrichtung 24 berechnet auch eine sekundäre Impulsantwort hws(n) eines Spektrumhüllkurven- Synthesefilters, welche einer Wahrnehmungswichtung unterzogen wird und welche von den konvertierten Spektrumparametern ai' bestimmt wird, wenn das Entscheidungssignal die stimmlose Lautinformation repräsentiert. Die Berechnung der Impulsantwort-Berechnungseinrichtung 24 ist im Detail in der dritten Bezugsquelle beschrieben. Die so berechneten primären und sekundären Impulsantworten hws(n) und hw(n) werden sowohl an den Kreuzkorrelator 23 als auch an einen Autokorrelator 25 in der Form elektrischer Signale geliefert, welche als primäre bzw. sekundäre Impulsantwortsignale bezeichnet werden können.
  • Der Autokorrelator 25 berechnet eine primäre Autokorrelation oder Kovarianzfunktion oder Koeffizienten R&sub1;(m) mit Bezug auf die primäre Impulsantwort hw(n) nach einer in der dritten Bezugsquelle beschriebenen Art, wobei m eine Ganzzahl zwischen Eins und N, beide eingeschlossen, darstellt. In ähnlicher Weise berechnet der Autokorrelator 25 einen sekundären Autokorrelationskoeffizienten R&sub2;(m) in Übereinstimmung mit der sekundären Impulsantwort hws(n). Der primäre und der sekundäre Autokorrelationskoeffizient R&sub1;(m) und R&sub2;(m) werden an eine Impulsberechnungseinheit 26 in der Form elektrischer Signale geliefert, welche als primäre und sekundäre Autokorrelationsmerkmale bezeichnet werden können. Wenn der Kreuzkorrelator 23 die gewichteten Fehlersignale und die primäre Impulsantwort hw(n) erhält, berechnet der Kreuzkorrelator 23 die primäre Kreuzkorrelationsfunktion oder Koeffizienten Φ&sub1;(m) für einen vorgegebene Anzahl von N Abtastungen nach bekannter Art. Wenn der Kreuzkorrelator 23 die gewichteten Fehlersignale und die sekundäre Impulsantwort hws(n) erhält, berechnet der Kreuzkorrelator 23 die sekundäre Kreuzkorrelationsfunktion oder Koeffizienten Φ&sub2;(m). Die primären Kreuzkorrelationskoeffizienten Φ&sub1;(m) werden an die Impulsberechnungseinrichtung 26 in der Form eines elektrischen Signals zusammen mit den primären Autokorrelationskoeffizienten R&sub1;(m) und dem Entscheidungssignal DS, das die stimmhafte Lautinformation repräsentiert, angelegt, während die sekundären Kreuzkorrelationskoeffizienten Φ2(n) an die Impulsberechnungseinrichtung 26 in der Form eines elektrischen Signals zusammen mit den sekundären Autokorrelationskoeffizienten R&sub2;(m) und dem Entscheidungssignal DS, das die stimmlose Lautinformation repräsentiert, angelegt wird. Die elektrischen Signale der primären und sekundären Kreuzkorrelationskoeffizienten o&sub1;(m) und o können als primäre und sekundäre Kreuzkorrelationssignale bezeichnet werden. Der Autokorrelator 25 und der Kreuzkorrelator 23 können ähnlich wie die in der dritten Bezugsquelle beschriebenen sein und werden deshalb nicht weiter beschrieben.
  • Mit dem Empfang des die stimmhafte Lautinformation repräsentierenden Entscheidungssignals DS berechnet die Impulsberechnungseinrichtung 26 Lagen und Amplituden eines ersten Satzes von Anregungs-Mehrfachimpulsen mittels eines in der dritten Bezugsquelle beschriebenen Tonlagenprädiktions-Mehrfachimpulskodierverfahrens. Wenn die Impulsberechnungseinrichtung 26 das für die stimmlose Lautinformation repräsentative Entscheidungsignal DS empfängt, berechnet die Impulsberechnungseinrichtung 26 die Amplituden eines zweiten Satzes von Anregungs-Mehrfachimpulsen, wovon jeder an Intervallen einer vorgewählten Anzahl K von Abtastungen in einer Art angeordnet ist, welche nachstehend im Detail beschrieben wird.
  • Gemäß Fig. 2 und 3 zusätzlich zu Fig. 1 weist die Impulsberechnungseinrichtung 26 eine Rahmenunterteilungseinheit 261, eine Amplitudenberechnungseinheit 262, eine Anfangsphasenbewertungseinheit 263 und eine Lagenbewertungseinheit 264 zusätzlich zu einer in der dritten Bezugsquelle beschriebenen Tonlagenprädiktions-Mehrfachimpulsberechnungseinheit 265 auf. Die Tonlagenprädiktions-Mehrfachimpulsberechnungseinheit 265 berechnet die Lagen und die Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen beim Empfang des für die stimmhafte Lautinformation repräsentativen Beurteilungssignals DS. Die Tonlagenprädiktions-Mehrfachimpulsberechnungseinheit 265 berechnet einen ersten Satz primärer Schallquellensignale, der die Lagen und die Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen zusammen mit dem für die stimmhafte Lautinformation repräsentativen Beurteilungssignals DS repräsentiert.
  • Versorgt mit dem für die stimmlose Lautinformation repräsentativen Beurteilungssignals DS unterteilt die Rahmenunterteilungseinheit 261 einen Einzelrahmen in eine vorgegebene Anzahl von Unterrahmen oder Tonlagenperioden, wovon jede kürzer als jeder Rahmen der in Fig. 3(a) dargestellten digitalen Eingangssprachsignale X(n) und gleich einer vorgegebenen Dauer von beispielsweise 5 Millisekunden ist. Der dargestellte Rahmen ist in einen ersten bis vierten Unterrahmen sf1, sf2, sf3 und sf4 unterteilt. Die sekundären Kreuzkorrelationskoeffizienten Φ&sub2;(m) sind in Fig. 3(b) dargestellt. Die Lagenbewertungseinheit 264 legt eine i-te Lage mi der Anregungs-Mehrfachimpulse bei Intervallen der vorgewählten Anzahl von K Abtastungen des ersten Unterrahmens sf1 gemäß der nachstehenden Gleichung fest, die gegeben ist durch:
  • mi = L + (i -1)K,
  • wobei i eine Ganzzahl zwischen Eins und Q und L eine Anfangsphase einer Lage in dem Unterrahmen darstellt und durch 0 ≤ L ≤ K -1 festgelegt ist.
  • Die Amplitudenberechnungseinheit 262 berechnet eine i-te Amplitude gi eines an der i-ten Lage angeordneten i-ten Anregungs-Mehrfachimpulses gemäß einer Gleichung, die gegeben ist durch:
  • Die Anfangsphasenbewertungseinheit 263 wird mit einer von der Amplitudenberechnungseinheit 262 berechneten ersten bis Q-ten Amplitude versorgt und legt eine optimale Phase fest, welche die nachstehende Gleichung (3) maximiert, die gegeben ist durch:
  • Somit legt die Anfangsphasenbewertungseinheit 263 eine erste Anfangsphase L&sub1; bei dem ersten Unterrahmen sf1 fest. In der Praxis muß die Anfangsphasenbewertungseinheit 263 die Berechnung der Gleichung (3) M-mal ausführen, um die erste Anfangsphase L&sub1; festzulegen. Um den Berechnungsaufwand zu reduzieren, kann die Anfangsphasenbewertungseinheit 263 andere Berechnungsarten einsetzen. Die Amplitudenberechnungseinheit 262 berechnet beispielsweise die erste Amplitude g&sub1; durch Verwendung der Gleichung (2). Es ist anzumerken, daß die erste Amplitude g&sub1; in dem ersten Unterrahmen sf1 eine maximale Amplitude besitzt. Aufgrund dieser Tatsache berechnet die Anfangsphasenbewertungseinheit 263 die erste Anfangsphase L&sub1; unter Verwendung der ersten Lage m&sub1; der ersten Amplitude g&sub1; gemäß der nachstehenden Gleichung, welche gegeben ist durch:
  • L = MOD(m1 - 1/K).
  • In diesem Falle kann die Anfangsphasenbewertungseinheit 263 die vorstehend beschriebene Berechnung mit nur einem Mal bei dem Unterrahmen sf1 durchführen. Die erste Anfangsphase L&sub1; und die Amplituden der Anregungs-Mehrfachimpulse sind in Fig. 3(c) dargestellt. Die dargestellte Impulsberechnungseinrichtung 26 berechnet die Anregungs-Mehrfachimpulse von vier bei Intervallen der vorgewählten Anzahl K Abtastungen pro Einzelunterrahmen. Die Anfangsphasenbewertungseinheit 263 erzeugt eine erste Anfangsphase L&sub1; und eine erste bis vierte Amplitude der Anregungs-Mehrfachimpulse in der Form elektrischer Signale.
  • Die vorstehend beschriebene Operation wird für jeden Unterrahmen wiederholt. In Fig. 3(d) sind eine zweite Anfangsphase L&sub2; und eine erste bis vierte Amplitude für einen zweiten Unterrahmen sf2 zusätzlich zu der in Fig. 3(c) dargestellten ersten Anfangsphase und den vier Amplituden dargestellt. Die Impulsberechnungseinrichtung 26 erzeugt einen zweiten Satz sekundärer Schallquellensignale, die für die erste bis vierte Anfangsphase L&sub1; bis L&sub4; jedes ersten bis vierten Unterrahmens sf1 bis sf4 und die Amplituden des zweiten Satzes von Anregungs-Mehrfachimpulsen, nämlich die erste bis vierte Amplitude bei den ersten bis vierten Unterrahmen sf1 bis sf4, repräsentativ sind, zusammen mit dem für die stimmlose Lautinformation repräsentativen Beurteilungssignal. Somit berechnet die Inpulsberechnungseinrichtung 26 nicht die Lagen des zweiten Satzes von Anregungs- Mehrfachimpulsen, da die Lagen des zweiten Satzes von Anregungs-Mehrfachimpulsen an Intervallen der vorgewählten Anzahl K von Abtastungen bestimmt sind. Folglich erzeugt die Impulsberechnungseinrichtung 26 einen zweiten Satz von Anregungs-Mehrfachimpulsen, welche bezogen auf die in der dritten Bezugsquelle beschriebene herkömmliche Impulsberechnungseinrichtung zwei- bis dreimal von der Anzahl her gleich sind, unabhängig von dem Rahmen, der den stimmlosen Laut enthält. Wenn beispielsweise die Kodiervorrichtung bei einer Bitrate von 6000 Bit/Sekunde betrieben wird, kann die Impulsberechnungseinrichtung 26 den zweiten Satz von Anregungs-Mehrfachimpulsen zwanzigmal pro Einzelrahmen mit einem Zeitintervall von 20 Millisekunden auch dann erzeugen, wenn der Rahmen den stimmlosen Laut aufweist. Der Kreuzkorrelator 23, die Impulsantwort-Berechnungseinrichtung 24, der Autokorrelator 25 und die Impulsberechnungseinrichtung 26 können zusammen als Verarbeitungeinheit bezeichnet werden.
  • Bei Empfang des für die stimmhafte Lautinformation repräsentativen Beurteilungssignals quantisiert ein Quantisierer 27 den ersten Satz primärer Schallquellensignale in einen ersten Satz quantisierter primärer Schallquellensignale und liefert den ersten Satz quantisierter primärer Schallquellensignale an den Multiplexer 13. Danach konvertiert der Quantisierer 27 den ersten Satz quantisierter primärer Schallquellensignale in einen ersten Satz konvertierter primärer Schallquellensignale durch eine inverse Konversion bezogen auf die vorstehend beschriebene Quantisierung und liefert den ersten Satz konvertierter primärer Schallquellensignale an ein Tonlagensynthesefilter 28. Versorgt mit dem ersten Satz konvertierter primärer Schallquellensignale zusammen mit dem für die stimmhafte Lautinformation repräsentativen Beurteilungssignal DS und den für die Tonlagenperiode und die Tonlagenkoeffizienten repräsentativen zweiten Parametersignalen, reproduziert das Tonlagensynthesefilter 28 einen ersten Satz tonlagensynthetisierter primärer Schallquellensignale in Übereinstimmung mit den Tonlagenkoeffizienten und der Tonlagenperiode und liefert den ersten Satz tonlagensynthetisierter primärer Schallquellensignale an ein Synthesefilter 29. Das Synthesefilter 29 synthetisiert den ersten Satz tonlagensynthetisierter primärer Schallquellensignale unter Verwendung der konvertierten Spektrumparameter ai' und erzeugt einen ersten Satz synthetisierter primärer Schallquellensignale.
  • Andererseits quantisiert der Quantisierer 27 bei Empfang des für die stimmlose Lautinformation repräsentativen Beurteilungssignals DS den zweiten Satz sekundärer Schallquellensignale in einen zweiten Satz quantisierter sekundärer Schallquellensignale und liefert den zweiten Satz quantisierter sekundärer Schallquellensignale an den Multiplexer 13. Danach konvertiert der Quantisierer 27 den zweiten Satz quantisierter sekundärer Schallquellensignale in einen zweiten Satz konvertierter sekundärer Schallquellensignale und liefert den zweiten Satz konvertierter sekundärer Schallquellensignale an das Synthesefilter 29. Das Synthesefilter 29 synthetisiert den zweiten Satz konvertierter sekundärer Schallquellensignale unter Verwendung der konvertierten Spektrumparameter ai' und erzeugt einen zweiten Satz synthetisierter sekundärer Schallquellensignale. Der erste Satz primärer Schallquellensignale und der zweite Satz sekundärer Schallquellensignale werden zusammen als die lokal synthetisierten Sprachsignale X'(n) eines aktuellen Rahmens, wie zuvor beschrieben, bezeichnet. Die lokal synthetisierten Sprachsignale werden für das digitale Eingangssprachsignal eines dem aktuellen Rahmen folgenden nächsten Rahmens verwendet.
  • Der Multiplexer 13 multiplexiert die quantisierten Spektrumparameter, die quantisierte Tonlagenperiode, die quantisierten Tonlagenkoeffizienten, das Beurteilungssignal, den für die Lagen und Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen repräsentativen ersten Satz quantisierter primärer Schallquellensignale und den für die Amplituden des zweiten Satzes von Anregungs-Mehrfachimpulsen und die Anfangsphasen der entsprechenden Unterrahmen repräsentativen zweiten Satz quantisierter sekundärer Schallquellensignale in eine Folge multiplexierter Signale und erzeugt eine Multiplexsignalfolge als das Ausgangssignal OUT. Der Multiplexer 13 dient als eine Ausgangssignal-Erzeugungseinheit.
  • Gemäß Fig. 4 kann eine Dekodierungsvorrichtung mit der in Fig. 1 dargestellten Kodierungsvorrichtung kommunizieren und wird mit der in Fig. 1 dargestellten Ausgangssignalfolge OUT als Empfangssignalfolge RV versorgt. Die Empfangssignale RV werden an einen Demultiplexer 40 angelegt und in einen ersten Satz primärer Schallquellenkodes, einen zweiten Satz sekundärer Schallquellenkodes, Beurteilungskodes, Spektrumparameterkodes, Tonlagenperiodenkodes und Tonlagenkoeffizientenkodes demultiplexiert, welche alle von der in Fig. 1 dargestellten Kodierungseinrichtung übertragen werden. Der erste Satz primärer Schallquellenkodes und der zweite Satz sekundärer Schallquellenkodes sind bei PC bzw. SC dargestellt. Die Beurteilungskodes sind bei JC dargestellt. Die Spektrumparameterkodes, die Tonlagenperiodenkodes und die Tonlagenkoeffizientenkodes können zusammengenommen als Parameterkodes bezeichnet werden und sind zusammengenommen bei PM dargestellt. Der erste Satz primärer Schallquellenkodes PC enthält den ersten Satz primärer Schallquellensignale während der zweite Satz sekundärer Schallquellenkodes SC den zweiten Satz sekundärer Schallquellensignale enthält. Die Parameterkodes PM enthalten das erste und das zweite Parametersignal. Die Beurteilungskodes JC enthalten das Beurteilungssignal. Das erste Parametersignal trägt den Spektrumparameter, während das zweite Parametersignal die Tonlagenperiode und die Tonlagenkoeffizienten trägt. Das Beurteilungssignal trägt die stimmhafte Lautinformation und die stimmlose Lautinformation. Der erste Satz primärer Schallquellensignale trägt die Lagen und Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen, während der zweite Satz sekundärer Schallquellensignale die Amplituden des zweiten Satzes sekundärer Anregungs-Mehrfachimpulse und die Anfangsphasen der jeweiligen Unterrahmen trägt.
  • Versorgt mit dem ersten Satz primärer Schallquellenkodes PC und dem für die stimmhafte Lautinformation repräsentativen Beurteilungskodes, reproduziert ein Dekoder 41 dekodierte Lagen und Amplituden des von dem ersten Satz primärer Schallquellenkodes PC getragenen ersten Satzes von Anregungs- Mehrfachimpulsen und liefert die dekodierten Lagen und Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen an einen Impulsgenerator 42. Eine derartige Reproduktion des ersten Satzes von Anregungs-Mehrfachimpulsen wird während der Dauer des stimmhaften Lautes ausgeführt. Der Dekoder 41 reproduziert mit dem Empfang der für die stimmlose Lautinformation repräsentativen Beurteilungssignale dekodierte Amplituden des zweiten Satzes sekundärer Anregungs- Mehrfachimpulse und von dem zweiten Satz sekundärer Schallquellenkodes SC getragene dekodierte Anfangsphasen. Die dekodierten Amplituden des zweiten Satzes sekundärer Anregungs-Mehrfachimpulse und die dekodierten Anfangsphasen werden ebenfalls an den Impulsgenerator 42 geliefert.
  • Ein Parameterdekoder 43 reproduziert, versorgt mit dem Parameterkodes PM, dekodierte Spektrumparameter, eine dekodierte Tonlagenperiode und dekodierte Tonlagenkoeffizienten. Die dekodierte Tonlagenperiode und die dekodierten Tonlagenkoeffizienten werden an den Impulsgenerator 42 geliefert, während die dekodierten Spektrumparameter an ein Empfangssynthesefilter 44 geliefert werden. Der Parameterdekoder 43 kann ähnlich wie der in Fig. 1 dargestellte inverse Quantisierer 14 aufgebaut sein. Versorgt mit den dekodierten Lagen und Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen und den für die stimmhafte Lautinformation repräsentativen Beurteilungskodes JC erzeugt der Impulsgenerator 42 eine Reproduktion des ersten Satzes von Anregungs-Mehrfachimpulsen unter Bezugnahme auf die dekodierte Tonlagenperiode und die dekodierten Tonlagenkoeffizienten und liefert einen ersten Satz reproduzierter Anregungs-Mehrfachimpulse an das Empfangssynthesefilter 44 als einen ersten Satz von Schallquellensteuersignalen. Versorgt mit den dekodierten Amplituden des zweiten Satzes von Anregungs-Mehrfachimpulsen, den dekodierten Anfangsphasen und den für die stimmlose Lautinformation repräsentativen Beurteilungskodes JC, erzeugt der Impulsgenerator 42 eine Reproduktion des zweiten Satzes von Anregungs-Mehrfachimpulsen an Intervallen einer vorgewählten Anzahl K von Abtastungen unter Verwendung der dekodierten Anfangsphasen und der dekodierten Tonlagenperiode und liefert einen zweiten Satz reproduzierter Anregungs-Mehrfachimpulse als einen Satz von Schallquellensteuersignalen an das Empfangssynthesefilter 44. Das Empfangssynthesefilter 44 synthetisiert den ersten Satz von Schallquellensteuersignalen und den zweiten Satz von Schallquellensteuersignalen mit jedem Rahmen unter Verwendung der dekodierten Spektrumparameter in eine Folge synthetisierter Sprachsignale. Das Empfangssynthesefilter 44 ist dem in der dritten Bezugsquelle beschriebenen ähnlich.
  • Gemäß Fig. 5 ist eine Kodiervorrichtung gemäß einer zweiten Ausführungsform dieser Erfindung mit Ausnahme eines Kreuzkorrelators 23', einer Impulsantwort-Berechnungseinrichtung 24' und eines Autokorrelators 25' der in Fig. 1 dargestellten ähnlich. Die Kodiervorrichtung wird mit einer Folge digitaler Eingangssprachsignale X(n) versorgt, um eine Folge von Ausgangssignalen OUT zu erzeugen. Die Folge der digitalen Eingangssprachsignale X(n) ist in mehrere Rahmen unterteilbar und es wird angenommen, daß sie von einer externen Einrichtung, wie z.B. einem (nicht dargestellten) Analog/Digital-Wandler an die Kodiervorrichtung gesendet wird. Jeder Rahmen kann beispielsweise eine Intervallzeit von beispielsweise 20 Millisekunden aufweisen. Die digitalen Eingangssprachsignale X(n) werden mit jedem Rahmen an eine Parameterberechnungseinheit 11 geliefert. Die dargestellte Parameterberechnungseinheit 11 weist den (nicht dargestellten) LPC-Analysator und die (nicht dargestellte) Tonlagenparameter-Berechnungseinrichtung auf, wovon beide die digitalen Eingangssprachsignale X(n) parallel erhalten, um die Spektrumparameter ai, nämlich die LPC-Parameter, und die Tonlagenparameter in bekannter Weise zu berechnen.
  • Der LPC-Analysator analysiert die digitalen Eingangssprachsignale, um Spektrumparameter erster bis p-ter Ordnung zu berechnen. Die im LPC-Analysator berechneten Spektrumparameter werden an den Parameter-Quantisierer 12 gesendet und in quantisierte Spektrumparameter quantisiert, wovon jeder aus einer vorgegebenen Anzahl von Bits besteht. Die quantisierten Spektrumparameter werden an den Multiplexer 13 geliefert. Desweiteren werden die quantisierten Spektrumparameter durch einen inversen Quantisierer 14 konvertiert, welcher eine inverse Quantisierung bezogen auf die Quantisierung des Parameterquantisierers 12 in konvertierte Spektrumparameter ai' (i = 1 p) ausführt. Die konvertierten Spektrumparameter ai' werden an die Impulsberechnungseinheit 15 geliefert. Die quantisierten Spektrumparameter und die konvertierten Spektrumparameter ai' stammen von den Spektrumparametern, die von dem LPC-Analysator berechnet werden, und werden in der Form elektrischer Signale erzeugt, welche zusammengefaßt als erstes Parametersignal bezeichnet werden können.
  • In der Parameterberechnungseinheit 11 berechnet die Tonlagenberechnungseinrichtung die gemittelte Tonlagenperiode M und die Tonlagenkoeffizienten b aus den digitalen Eingangssprachsignalen X(n), um bei jedem Rahmen die gemittelte Tonlagenperiode M und die Tonlagenkoeffizienten b durch ein Autokorrelationsverfahren als die Tonlagenparameter zu erzeugen. Die gemittelte Tonlagenperiode M und die Tonlagenkoeffizienten b werden ebenfalls von dem Parameterquantisierer 12 in eine quantisierte Tonlagenperiode und in quantisierte Tonlagenkoeffizienten quantisiert, wovon jeder aus einer vorgewählten Anzahl von Bits besteht. Die quantisierte Tonlagenperiode und die quantisierten Tonlagenkoeffizienten werden als elektrische Signale gesendet. Zusätzlich werden die quantisierte Tonlagenperiode und die quantisierten Tonlagenkoeffizienten ebenfalls von dem inversen Quantisierer 14 in die konvertierte Tonlagenperiode M' und in die konvertierten Tonlagenkoeffizienten b' konvertiert, welche in der Form elektrischer Signale erzeugt werden. Die quantisierte Tonlagenperiode und die quantisierten Tonlagenkoeffizienten werden als ein zweites Parametersignal, welches die Tonlagenperiode und die Tonlagenkoeffizienten repräsentiert, an den Multiplexer 13 gesendet.
  • Die Entscheidungsschaltung 16 trifft unter Verwendung der konvertierten Tonlagenkoeffizienten b' bei jedem Rahmen die Entscheidung, ob die digitalen Eingangssprachsignale X(n) in den stimmhaften Laut oder den stimmlosen Laut klassifiziert werden. Genauer gesagt, vergleicht die Entscheidungsschaltung 16 die konvertierten Tonlagenkoeffizienten b' in jedem Rahmen mit einem vorgegebenen Pegel und erzeugt bei jeden Rahmen das Entscheidungssignal DS. Die Entscheidungsschaltung 16 erzeugt das für die stimmhafte Lautinformation repräsentative Entscheidungssignal DS, wenn die konvertierten Tonlagenkoeffizienten b' höher als der vorgegebene Pegel sind. Anderenfalls erzeugt die Bewertungsschaltung 16 das für stimmlose Lautinformation repräsentative Entscheidungssignal DS. Das Entscheidungssignal DS wird an die Impulsberechnungseinheit 15 geliefert.
  • In dem dargestellten Beispiel wird die Impulsberechnungsschaltung 15 mit den digitalen Eingangssprachsignalen X(n) bei jedem Rahmen zusammen mit den konvertierten Spektrumparametern ai', der konvertierten Tonlagenperiode M', den konvertierten Tonlagenkoeffizienten b' und dem Beurteilungssignal DS versorgt, um selektiv einen ersten Satz primärer Schallquellensignale und einen zum ersten Satz primärer Schallquellensignale unterschiedlichen zweiten Satz sekundärer Schallquellensignale zu erzeugen. Zu diesem Zweck weist die Impulsberechnungseinheit 15 den auf die digitalen Eingangssprachsignale X(n) und eine Folge lokal synthetisierter Sprachsignale X'(n) reagierenden Subtrahierer 21 auf, um die Fehlersignale e(n) zu erzeugen, welche die Unterschiede zwischen dem digitalen Eingangs- und dem lokal erzeugten Sprachsignalen X(n) und X'(n) repräsentieren. Die Fehlersignale e(n) werden an die Wahrnehmungswichtungsschaltung 22 gesendet, welche auch mit den konvertierten Spektrumparametern ai' versorgt wird. In der Wahrnehmungswichtungsschaltung 22 werden die Fehlersignale e(n) anhand von Gewichten, welche von den konvertierten Spektrumparametern ai' bestimmt werden, gewichtet. Somit berechnet die Wahrnehmungswichtungsschaltung 22 eine Folge gewichteter Fehlersignale in einer bekannten Weise, um die gewichteten Fehlersignale Xw(n) an den Kreuzkorrelator 23' zü liefern.
  • Andererseits werden die konvertierten Spektrumparameter ai' ebenfalls aus dem inversen Quantisierer 14 an die Impulsantwort-Berechnungseinrichtung 24' geliefert. Die Impulsantwort-Berechnungseinrichtung 24' berechnet eine Impulsantwort hw'(n) eines Filters mit einer von der nachstehenden Gleichung (1) definierten Übertragungsfunktion H'(Z) unter Verwendung der konvertierten Spektrumparameter ai', der konvertierten Tonlagenperiode M' und der konvertierten Tonlagenkoeffizienten b'.
  • H(z) = W(Z)/{(1 - b'Z-M')(1 - Σai'Z-i)}
  • wobei W(Z) eine Übertragungsfunktion der Wahrnehmungswichtungsschaltung 22 darstellt. Die so berechnete Impulsantwort hw'(n) wird sowohl an den Kreuzkorrelator 23' als auch an den Autokorrelator 25' in der Form eines elektrischen Signals geliefert, welches als Impulsantwortsignal bezeichnet werden kann.
  • Der Autokorrelator 25' berechnet Autokorrelationskoeffizienten R(m) unter Verwendung der Impulsantwort hw'(n) gemäß der folgenden Gleichung, die gegeben ist durch:
  • wobei m durch (0 ≤ m ≤ N-1) festgelegt ist. Die Autokorrelationskoeffizienten R(m) werden in der Form eines elektrischen Signals erzeugt, welches als Autokorrelationssignal bezeichnet werden kann.
  • Wenn der Kreuzkorrelator 23' mit den gewichteten Fehlersignalen Xw(n) und den Autokorrelationskoeffizienten R(m) versorgt wird, berechnet der Kreuzkorrelator 23' Kreuzkorrelationskoeffizienten Φ(m) für einen vorgegebene Anzahl von N Abtastungen gemäß der nachstehenden Gleichung, die gegeben ist durch:
  • Die Kreuzkorrelationskoeffizienten Φ(m) werden an die Impulsberechnungseinrichtung 26 in der Form eines elektrischen Signals geliefert, welches als Kreuzkorrelationssignal bezeichnet werden kann.
  • Mit dem Empfang des die stimmhafte Lautinformation repräsentierenden Entscheidungssignals DS berechnet die Impulsberechnungseinrichtung 26 Lagen und Amplituden eines ersten Satzes von Mehrfachimpulsen mittels eines Tonlagenprädiktions-Mehrfachimpulskodierverfahrens unter Verwendung der Kreuzkorrelationskoeffizienten Φ(m) und der Autokorrelationskoeffizienten R(m). Wenn die Impulsberechnungseinrichtung 26 das für die stimmlose Lautinformation repräsentative Signal empfängt, berechnet die Impulsberechnungseinrichtung 26 Amplituden eines zweiten Satzes von Anregungs- Mehrfachimpulsen, wovon jeder an Intervallen einer vorgewählten Anzahl K von Abtastungen in der in Verbindung mit den Fig. 2 und 3 beschriebenen Art angeordnet ist.
  • Die Impulsberechnungseinrichtung 26 berechnet einen ersten Satz von primären Schallquellensignalen, der die Lagen und die Amplituden des ersten Satzes von Anregungs- Mehrfachimpulsen zusammen mit dem für die stimmhafte Lautinformation repräsentativen Beurteilungssignal DS repräsentiert. Die Impulsberechnungseinrichtung 26 berechnet ebenfalls einen zweiten Satz von sekundären Schallquellensignalen, der die Anfangsphasen und die Amplituden eines zweiten Satzes von Anregungs-Mehrfachimpulsen der jeweiligen Unterrahmen zusammen mit dem für die stimmlose Lautinformation repräsentativen Beurteilungssignal DS repräsentiert
  • Mit dem Empfang des für die stimmhafte Lautinformation repräsentativen Beurteilungssignals quantisiert der Quantisierer 27 den ersten Satz primärer Schallquellensignale in einen ersten Satz quantisierter primärer Schallquellensignale, welche aus einer ersten vorgegebenen Anzahl von Bits bestehen, und liefert den ersten Satz quantisierter primärer Schallquellensignale an den Multiplexer 13. Danach konvertiert der Quantisierer 27 den ersten Satz quantisierter primärer Schallquellensignale in einen ersten Satz konvertierter primärer Schallquellensignale durch eine inverse Konversion bezogen auf die vorstehend beschriebene Quantisierung und liefert den ersten Satz konvertierter primärer Schallquellensignale an das Tonlagensynthesefilter 28. Versorgt mit dem ersten Satz konvertierter primärer Schallquellensignale zusammen mit den für die Tonlagenperiode und die Tonlagenkoeffizienten repräsentativen zweiten Parametersignalen, reproduziert das Tonlagensynthesefilter 28 einen ersten Satz tonlagensynthetisierter primärer Schallquellensignale in Übereinstimmung mit den Tonlagenkoeffizienten und der Tonlagenperiode und liefert den ersten Satz tonlagensynthetisierter primärer Schallquellensignale an das Synthesefilter 29. Das Synthesefilter 29 synthetisiert den ersten Satz tonlagensynthetisierter primärer Schallquellensignale unter Verwendung der konvertierten Spektrumparameter ai' und erzeugt einen ersten Satz synthetisierter primärer Schallquellensignale.
  • Andererseits quantisiert der Quantisierer 27 mit dem Empfang des für die stimmlose Lautinformation repräsentativen Beurteilungssignals DS den zweiten Satz sekundärer Schallquellensignale in einen zweiten Satz quantisierter sekundärer Schallquellensignale, welche aus der ersten vorgegebenen Anzahl von Bits bestehen, und liefert den zweiten Satz quantisierter sekundärer Schallquellensignale an den Multiplexer 13. Danach konvertiert der Quantisierer 27 den zweiten Satz quantisierter sekundärer Schallquellensignale in einen zweiten Satz konvertierter sekundärer Schallquellensignale und liefert den zweiten Satz konvertierter sekundärer Schallquellensignale an das Synthesefilter 29. Das Synthesefilter 29 synthetisiert den zweiten Satz konvertierter sekundärer Schallquellensignale unter Verwendung der konvertierten Spektrumparameter ai' und erzeugt einen zweiten Satz synthetisierter sekundärer Schallquellensignale. Der erste Satz primärer Schallquellensignale und der zweite Satz sekundärer Schallquellensignale werden zusammen als die lokal synthetisierten Sprachsignale X'(n) eines aktuellen Rahmens, wie zuvor beschrieben, bezeichnet. Die lokal synthetisierten Sprachsignale werden für das digitale Eingangssprachsignal eines dem aktuellen Rahmen folgenden nächsten Rahmens verwendet.
  • Der Multiplexer 13 multiplexiert die quantisierten Spektrumparameter, die quantisierte Tonlagenperiode, die quantisierten Tonlagenkoeffizienten, das Beurteilungssignal, den für die Lagen und Amplituden des ersten Satzes von Anregungs-Mehrfachimpulse repräsentativen ersten Satz quantisierter primärer Schallquellensignale und den für die Amplituden des zweiten Satzes von Anregungs-Mehrfachimpulsen und die Anfangsphasen der entsprechenden Unterrahmen repräsentativen zweiten Satz quantisierter sekundärer Schallquellensignale in eine Folge multiplexierter Signale und erzeugt eine Multiplexsignalfolge als das Ausgangssignal OUT.
  • Die Impulsberechnungseinheit 15 kann andere Arten zum Berechnen der Amplituden des zweiten Satzes von Anregungs- Mehrfachimpulsen verwenden, wenn das Beurteilungssignal DS die stimmlose Lautinformation repräsentiert. Die Impulsberechnungseinheit 15 führt beispielsweise zuerst eine Tonlagenprädiktion für die digitalen Eingangssprachsignale X(n) gemäß nachstehender Gleichung aus, welche gegeben ist durch:
  • e(n) = X(n) - b'X(n - M').
  • Als nächstes berechnet die Impulsantwort-Berechnungseinrichtung 24' eine Impulsantwort hs(n) eines Filters mit einer Übertragungsfunktion Hs(Z), die durch die nachstehende Gleichung unter Verwendung der konvertierten Spektrumparameter ai' gegeben ist.
  • Der Autokorrelator 25' berechnet Autokorrelationskoeffizienten R'(m) gemäß nachstehender Gleichung, welche gegeben ist durch:
  • Der Kreuzkorrelator 23' berechnet unter Verwendung der konvertierten Spektrumparameter ai' Kreuzkorrelationskoeffizienten Φ'(m) für die Fehlersignale e(n) gemäß nachstehender Gleichung, die gegeben ist durch:
  • Die Impulsberechnungseinrichtung 26 berechnet die Amplituden eines zweiten Satzes von Anregungs-Mehrfachimpulsen unter Verwendung der Autokorrelationskoeffizienten R'(m) und der Kreuzkorrelationskoeffizienten Φ'(m) in der in Verbindung mit Fig. 2 und 3 beschriebenen Weise.
  • Im Rahmen eines weiteren Beispiels weist die Impulsberechnungseinheit 15 ein inverses Filter auf, an welches die digitalen Eingangssprachsignale geliefert werden, und berechnet eine Folge von Prädiktionsfehlersignalen d(n) gemäß nachstehender Gleichung, die gegeben ist durch:
  • Als nächstes berechnet die Impulsberechnungseinrichtung 26 die Fehlersignale e(n) mittels eines Prädiktionsverfahrens für die Prädiktionsfehlersignale d(n) gemäß der nachstehenden Gleichung, die gegeben ist durch:
  • e(n) = d(n) - b'e(n - M'). (7)
  • Der Kreuzkorrelator 23' berechnet Kreuzkorrelationskoeffizienten Φ"(n) des Fehlersignals e(n) gemäß der vorstehend erwähnten Gleichung (5). Der Autokorrelator 25' berechnet Autokorrelationskoeffizienten R"(m) unter Verwendung der vorstehend erwähnten Gleichung (4). Die Impulsberechnungseinrichtung 26 berechnet die Amplituden des zweiten Satzes von Anregungs-Mehrfachimpulsen unter Verwendung der Autokorrelationskoeffizienten R"(m) und der Kreuzkorrelationskoeffizienten Φ"(m) in der in Verbindung mit den Fig. 2 und 3 beschriebenen Weise. In den Gleichungen (6) und (7) können die Tonlagenkoeffizienten b' und die Tonlagenperiode M' in jedem beliebigen Rahmen und Unterrahmen, der kürzer als der Rahmen ist berechnet werden.
  • Eine Dekodiervorrichtung, welche als Gegenpart zu der in Fig. 5 dargestellten Kodiervorrichtung betreibbar ist, kann die in Fig. 4 dargestellte Dekodiervorrichtung verwenden.
  • Während nun diese Erfindung insoweit in Verbindung mit ein paar ihrer Ausführungsform beschrieben wurde, wird es für den Fachmann auf diesem Gebiet ohne weiteres möglich sein, diese Erfindung auf verschiedene Arten in die Praxis umzusetzen. Beispielsweise können die Tonlagenkoeffizienten b gemäß der nachstehenden Gleichung berechnet werden, die gegeben ist durch:
  • wobei * eine Faltung darstellt, v(n) vorausgegangene durch das Tonlagensynthesefilter und das Synthesefilter reproduzierte Schallquellensignale und E eine Fehlerpotenz zwischen den digitalen Eingangssprachsignalen eines momentanen Unterrahmens und des vorhergehenden Unterrahmens darstellt. In diesem Falle sucht die Parameterberechnungseinrichtung eine Lage T, welche die vorstehend beschriebene Gleichung minimiert. Danach berechnet die Parameterberechnungseinrichtung die Tonlagenkoeffizienten b in Übereinstimmung mit der Lage T. Das Synthesefilter kann gewichtete synthetisierte Signale reproduzieren. Die Berechnung des ersten Satzes von Anregungs-Mehrfachimpulsen während der Dauer des stimmhaften Lautes kann auf andere Arten erfolgen. Beispielsweise berechnet die Impulsberechnungseinheit zuerst einen ersten Satz primärer Anregungs-Mehrfachimpulse mittels des Tonlagenprädiktionsmehrfachimpulsverfahrens und berechnet dann einen zweiten Satz sekundärer Anregungs-Mehrfachimpulse mittels eines herkömmlichen Mehrfachimpuls-Suchverfahrens ohne Tonlagenprädiktion in der in der JP-A-147253/1988 beschriebenen Art.

Claims (8)

1. Kodiervorrichtung, welche mit einer Folge digitaler Sprachsignale bei jedem Rahmen versorgt wird, um eine Folge von Ausgangssignalen zu erzeugen, wobei jeder Rahmen N Abtastungen pro Einzelrahmen enthält und N eine Ganzzahl darstellt, die digitalen Sprachsignale in einen stimmhaften Laut und in einen stimmlosen Laut klassifiziert werden, die Dekodiervorrichtung aufweist: eine auf die digitalen Eingangssprachsignale reagierende Parameterberechnungseinrichtung (11, 12, 14) zum Berechnen erster und zweiter Parameter, welche eine Spektrumhüllkurve und eine Tonlage der digitalen Sprachsignale in jedem Rahmen spezifizieren, um für die Spektrumhüllkurve bzw. die Tonlage repräsentative erste und zweite Parametersignale zu erzeugen, eine mit der Parameterberechnungseinrichtung verbundene Impulsberechnungseinrichtung (15) zum Berechnen eines Satzes für die digitalen Sprachsignale repräsentativer Berechnungsergebnissignale und eine Ausgangssignalerzeugungseinrichtung (13), um den Satz der Berechnungsergebnissignale als Ausgangssignalfolge zu erzeugen, mit
einer in Verbindung mit der Parameterberechnungseinrichtung (11, 12, 14) betreibbaren Beurteilungseinrichtung (16) zum Beurteilen, ob die digitalen Sprachsignale in den stimmhaften Laut oder den stimmlosen Laut bei jedem Rahmen klassifiziert werden, um ein für das Ergebnis der Beurteilung des digitalen Sprachsignals repräsentatives Beurteilungssignal zu erzeugen;
wobei die Impulsberechnungseinrichtung (15) aufweist:
eine mit den digitalen Sprachsignalen, dem ersten und dem zweiten Parametersignal und dem Beurteilungssignal versorgte Verarbeitungseinrichtung (23 bis 26; 23' bis 26') zum Verarbeiten der digitalen Sprachsignale in Übereinstimmung mit dem Beurteilungssignal, um selektiv einen ersten Satz primärer Schallquellensignale und einen zum ersten Satz primärer Schallquellensignale unterschiedlichen zweiten Satz sekundärer Schallquellensignale zu erzeugen, wobei der erste Satz primärer Schallquellensignale die Lagen und Amplituden eines bei jedem Rahmen berechneten ersten Satzes von Anregungs- Mehrfachimpulsen repräsentiert, der zweite Satz der sekundären Schallquellensignale die Amplituden eines zweiten Satzes von Anregungs-Mehrfachimpulsen repräsentiert, wovon jeder an Intervallen einer vorgewählten Anzahl von Abtastungen angeordnet ist; und
eine Einrichtung (27) zum Liefern einer Kombination des ersten und des zweiten Parametersignals, des Beurteilungssignals und des primären und sekundären Schallquellensignals an die Ausgangssignalerzeugungseinrichtung (13) als der Ausgangssignalfolge.
2. Kodiervorrichtung nach Anspruch 1, wobei die Verarbeitungseinrichtung (23 bis 26) den ersten Satz der primären Schallquellensignale erzeugt, wenn das Beurteilungssignal den stimmhaften Laut repräsentiert, und anderenfalls den zweiten Satz der sekundären Schallquellensignale erzeugt.
3. Kodiervorrichtung nach Anspruch 1 oder 2, wobei die Beurteilungseinrichtung (16) die Tonlage mit einem vorgegebenen Pegel vergleicht, um zu beurteilen, ob das Sprachsignal in den stimmhaften oder den stimmlosen Laut klassifiziert wird.
4. Kodiervorrichtung nach einem der Ansprüche 1 bis 3, wobei die Verarbeitungseinrichtung (23 bis 26) als Antwort auf das für den stimmlosen Laut repräsentative Beurteilungssignal unter Verwendung der ersten Parameter Amplituden mehrerer Anregungs-Mehrfachimpulse und eine Anfangsphase eines ersten Anregungs-Mehrfachimpulses berechnet, der an einem Anfang der mehreren Anregungs-Mehrfachimpulse in jedem Unterrahmen angeordnet ist, welche von der Unterteilung jedes Rahmens herrühren und wovon jeder kürzer als der Rahmen ist, und die Verarbeitungseinrichtung (23 bis 26) eine Folge der Anfangsphasen der Unterrahmen und eine Folge der mehreren Anregungs-Mehrfachimpulse der Unterrahmen als den zweiten Satz sekundärer Schallquellensignale erzeugt.
5. Kodiervorrichtung nach Anspruch 4, wobei die Verarbeitungseinrichtung aufweist:
eine auf das erste und das zweite Parametersignal und das Beurteilungssignal reagierende Impulsantwortberechnungseinrichtung (24) zum Berechnen einer primären Impulsantwort unter Verwendung des ersten und des zweiten Parameters, wenn das Beurteilungssignal den stimmhaften Laut repräsentiert, und zum Berechnen einer sekundären Impulsantwort unter Verwendung des ersten Parameters, wenn das Beurteilungssignal den stimmlosen Laut repräsentiert, um selektiv ein für die primäre Impulsantwort repräsentatives primäres Impulsantwortsignal und ein für die sekundäre Impulsantwort repräsentatives sekundäres Impulsantwortsignal zu erzeugen;
eine auf die digitalen Sprachsignale, das primäre und sekundäre Impulsantwortsignal und das Beurteilungssignal reagierende Kreuzkorrelationsberechnungseinrichtung (23) zum Berechnen primärer Kreuzkorrelationskoeffizienten unter Verwendung der primären Impulsantwort, wenn das Beurteilungssignal den stimmhaften Laut repräsentiert, und zum Berechnen sekundärer Kreuzkorrelationskoeffizienten unter Verwendung der sekundären Impulsantwort, wenn das Beurteilungssignal den stimmlosen Laut repräsentiert, um selektiv ein für die primären Kreuzkorrelationskoeffizienten repräsentatives primäres Kreuzkorrelationssignal und ein für die sekundären Kreuzkorrelationskoeffizienten repräsentatives sekundäres Kreuzkorrelationssignal zu erzeugen;
eine auf das primäre und sekundäre Impulsantwortsignal reagierende Autokorrelationsberechnungseinrichtung (25) zum Berechnen primärer Autokorrelationskoeffizienten unter Verwendung der primären Impulsantwort und zum Berechnen sekundärer Autokorrelationskoeffizienten unter Verwendung der sekundären Impulsantwort, um selektiv ein für die primären Autokorrelationskoeffizienten repräsentatives primäres Autokorrelationssignal und ein für die sekundären Autokorrelationskoeffizienten repräsentatives sekundäres Autokorrelationssignal zu erzeugen; und
eine auf das Beurteilungssignal, das primäre und das sekundäre Kreuzkorrelationssignal und das primäre und das sekundäre Autokorrelationssignal reagierende Impulsberechnungseinrichtung (26) zum Berechnen der Lagen und der Amplituden des ersten Satzes der Anregungs-Mehrfachimpulse unter Verwendung der primären Kreuzkorrelations- und Autokorrelationskoeffizienten bei jedem Rahmen, wenn das Beurteilungssignal den stimmhaften Laut repräsentiert, und zum Berechnen der Amplituden der mehreren Anregungs- Mehrfachimpulse und der Anfangsphasen des ersten Anregungs- Mehrfachimpulses unter Verwendung der sekundären Kreuzkorrelations- und Autokorrelationskoeffizienten bei jedem Unterrahmen, wenn das Beurteilungssignal den stimmlosen Laut repräsentiert, um selektiv die Lagen und Amplituden des ersten Satzes der Anregungs-Mehrfachimpulse als die primären Schallquellensignale und die Folge der Anfangsphasen der Unterrahmen und die Folge mehrerer Anregungs-Mehrfachimpulse der Unterrahmen als den zweiten Satz sekundärer Schallquellensignale zu erzeugen.
6. Kodiervorrichtung nach einem der Ansprüche 1 bis 3, wobei die Verarbeitungseinrichtung (23' bis 26') als Antwort auf das für den stimmlosen Laut repräsentative Beurteilungssignal unter Verwendung von Kreuzkorrelationskoeffizienten, die von den ersten Parametern und den zweiten Parametern spezifiziert werden, Amplituden mehrerer Anregungs-Mehrfachimpulse und eine Anfangsphase eines ersten Anregungs- Mehrfachimpulses berechnet, der an einem Anfang der mehreren Anregungs-Mehrfachimpulse in jedem Unterrahmen angeordnet ist, welche von der Unterteilung jedes Rahmens herrühren und wovon jeder kürzer als der Rahmen ist, und die Verarbeitungseinrichtung (23' bis 26') eine Folge der Anfangsphasen der Unterrahmen und eine Folge der Anregungs-Mehrfachimpulse der Unterrahmen als den zweiten Satz sekundärer Schallquellensignale erzeugt.
7. Kodiervorrichtung nach Anspruch 6, wobei die Verarbeitungseinrichtung aufweist:
eine auf das erste und das zweite Parametersignal reagierende Impulsantwortberechnungseinrichtung (24') zum Berechnen einer Impulsantwort unter Verwendung des ersten und des zweiten Parameters, um ein für die Impulsantwort repräsentatives Impulsantwortsignal zu erzeugen;
eine auf die digitalen Sprachsignale und das Impulsantwortsignal reagierende Kreuzkorrelationsberechnungseinrichtung (23') zum Berechnen von Kreuzkorrelationskoeffizienten unter Verwendung der Impulsantwort, um ein für die Kreuzkorrelationskoeffizienten repräsentatives Kreuzkorrelationssignal zu erzeugen;
eine auf das Impulsantwortsignal reagierende Autokorrelationsberechnungseinrichtung (25') zum Berechnen von Autokorrelationskoeffizienten unter Verwendung der Impulsantwort, um ein für die Autokorrelationskoeffizienten repräsentatives Autokorrelationssignal zu erzeugen; und
eine auf das Beurteilungssignal, die Kreuzkorrelationssignale und die Autokorrelationssignale reagierende Impulsberechnungseinrichtung (26') zum Berechnen der Lagen und der Amplituden des ersten Satzes der Anregungs-Mehrfachimpulse unter Verwendung der Kreuzkorrelations- und Autokorrelationskoeffizienten bei jedem Rahmen, wenn das Beurteilungssignal den stimmhaften Laut repräsentiert, und zum Berechnen der Amplituden der mehreren Anregungs-Mehrfachimpulse und der Anfangsphase des ersten Anregungs-Mehrfachimpulses unter Verwendung der Kreuzkorrelations- und Autokorrelationskoeffizienten in jedem Unterrahmen, wenn das Beurteilungssignal den stimmlosen Laut repräsentiert, um selektiv die Lagen und Amplituden des ersten Satzes der Anregungs-Mehrfachimpulse als die primären Schallquellensignale und die Folge der Anfangsphasen der Unterrahmen und die Folge der mehreren Anregungs-Mehrfachimpulse der Unterrahmen als den zweiten Satz sekundärer Schallquellensignale zu erzeugen.
8. Dekodiervorrichtung, welche mit der Kodiervorrichtung nach einem der Ansprüche 1 bis 7 kommunizieren kann, um eine Folge synthetisierter Sprachsignale zu erzeugen, wobei die Dekodiervorrichtung mit der Ausgangssignalfolge als einer Empfangssignalfolge versorgt wird, welche den ersten Satz der primären Schallquellensignale, den zweiten Satz der sekundären Schallquellensignale, das erste und das zweite Parametersignal und das Beurteilungssignal trägt, und die Dekodiervorrichtung aufweist:
eine mit der Empfangssignalfolge versorgte Demultiplexiereinrichtung (40) zum Demultiplexieren der Empfangssignalfolge RV in den ersten Satz primärer Schallquellensignale, den zweiten Satz sekundärer Schallquellensignale, das erste und das zweite Parametersignal und in die Beurteilungssignale als einem ersten Satz primärer Schallquellenkodes PC, einem zweiten Satz sekundärer Schallquellenkodes SC, einem ersten und zweiten Parameterkode PM bzw. Beurteilungskodes;
eine mit der Demultiplexiereinrichtung verbundene Dekodiereinrichtung (41) zum Dekodieren des ersten Satzes der primären Schallquellenkodes in einen ersten Satz dekodierter primärer Schallquellensignale mit den Lagen und Amplituden des ersten Satzes von Anregungs-Mehrfachimpulsen, wenn die Beurteilungssignale den stimmhaften Laut repräsentieren, und zum Dekodieren des zweiten Satzes der sekundären Schallquellenkodes in einen zweiten Satz dekodierter sekundärer Schallquellensignale mit den Amplituden des zweiten Satzes sekundärer Anregungs-Mehrfachimpulse und Anfangsphasen, wenn die Beurteilungssignale den stimmlosen Laut repräsentieren;
eine mit der Demultiplexiereinrichtung verbundene Parameterdekodiereinrichtung (43) zum Dekodieren dem ersten und dem zweiten Parameterkodes in einen ersten bzw. zweiten dekodierten Parameter;
eine mit der Demultiplexiereinrichtung, der Dekodiereinrichtung und mit der Parameterdekodiereinrichtung verbundene Impulserzeugungseinrichtung (42) zum Erzeugen eines ersten Satzes reproduzierter Anregungs-Mehrfachimpulse unter Verwendung der dekodierten zweiten Parameter, wenn das Beurteilungssignal den stimmhaften Laut repräsentiert, und zum Erzeugen eines zweiten Satzes reproduzierter Anregungs- Mehrfachimpulse an Intervallen einer vorgewählten Anzahl K von Abtastungen unter Verwendung der dekodierten zweiten Parameter, wenn das Beurteilungssignal den stimmlosen Laut repräsentiert; und
eine mit der Impulserzeugungseinrichtung und der Parameterdekodiereinrichtung verbundene Einrichtung (44) zum Synthetisieren des ersten Satzes und des zweiten Satzes der Schallquellensteuersignale in die synthetisierten Sprachsignale unter Verwendung der ersten dekodierten Parameter.
DE68923771T 1988-12-23 1989-12-22 Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung. Expired - Fee Related DE68923771T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP63326805A JPH02170199A (ja) 1988-12-23 1988-12-23 音声符号化復号化方式
JP1001849A JPH02181800A (ja) 1989-01-06 1989-01-06 音声符号化復号化方式

Publications (2)

Publication Number Publication Date
DE68923771D1 DE68923771D1 (de) 1995-09-14
DE68923771T2 true DE68923771T2 (de) 1995-12-14

Family

ID=26335140

Family Applications (1)

Application Number Title Priority Date Filing Date
DE68923771T Expired - Fee Related DE68923771T2 (de) 1988-12-23 1989-12-22 Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.

Country Status (4)

Country Link
US (1) US5091946A (de)
EP (1) EP0374941B1 (de)
CA (1) CA2006487C (de)
DE (1) DE68923771T2 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE69031749T2 (de) * 1989-06-14 1998-05-14 Nippon Electric Co Einrichtung und Verfahren zur Sprachkodierung mit Regular-Pulsanregung
CA2051304C (en) * 1990-09-18 1996-03-05 Tomohiko Taniguchi Speech coding and decoding system
FR2668288B1 (fr) * 1990-10-19 1993-01-15 Di Francesco Renaud Procede de transmission, a bas debit, par codage celp d'un signal de parole et systeme correspondant.
CA2084323C (en) * 1991-12-03 1996-12-03 Tetsu Taguchi Speech signal encoding system capable of transmitting a speech signal at a low bit rate
JPH05307399A (ja) * 1992-05-01 1993-11-19 Sony Corp 音声分析方式
JP2655046B2 (ja) * 1993-09-13 1997-09-17 日本電気株式会社 ベクトル量子化装置
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
JP3618217B2 (ja) * 1998-02-26 2005-02-09 パイオニア株式会社 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
US6304842B1 (en) * 1999-06-30 2001-10-16 Glenayre Electronics, Inc. Location and coding of unvoiced plosives in linear predictive coding of speech
US7630396B2 (en) * 2004-08-26 2009-12-08 Panasonic Corporation Multichannel signal coding equipment and multichannel signal decoding equipment
CN100466600C (zh) * 2005-03-08 2009-03-04 华为技术有限公司 下一代网络中实现接入配置模式资源预留的方法
JPWO2008007616A1 (ja) * 2006-07-13 2009-12-10 日本電気株式会社 無音声発声の入力警告装置と方法並びにプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683149B2 (ja) * 1984-04-04 1994-10-19 日本電気株式会社 音声帯域信号符号化・復号化装置
JPH0632032B2 (ja) * 1984-03-06 1994-04-27 日本電気株式会社 音声帯域信号符号化方法とその装置
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
JP2586043B2 (ja) * 1987-05-14 1997-02-26 日本電気株式会社 マルチパルス符号化装置

Also Published As

Publication number Publication date
CA2006487C (en) 1994-01-11
DE68923771D1 (de) 1995-09-14
EP0374941A2 (de) 1990-06-27
CA2006487A1 (en) 1990-06-23
US5091946A (en) 1992-02-25
EP0374941A3 (de) 1991-10-16
EP0374941B1 (de) 1995-08-09

Similar Documents

Publication Publication Date Title
DE68912692T2 (de) Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale.
DE69023402T2 (de) Verfahren zur Sprachkodierung und -dekodierung.
DE68923771T2 (de) Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69029120T2 (de) Stimmenkodierer
DE60011051T2 (de) Celp-transkodierung
DE3784942T2 (de) Duplex-datenuebertragung.
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE69331079T2 (de) CELP-Vocoder
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE69529356T2 (de) Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69521164T2 (de) System zum Kodieren und Dekodieren von Signalen
DE69900786T2 (de) Sprachkodierung
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE60126149T2 (de) Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen
DE69426860T2 (de) Sprachcodierer und Verfahren zum Suchen von Codebüchern
DE69329569T2 (de) Digitale Kodierung von Sprachsignalen
DE68922134T2 (de) Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude.
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
DE68917584T2 (de) Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung.
DE69524890T2 (de) Parametrische Sprachkodierung
DE69033510T3 (de) Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee