DE69737012T2 - Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür - Google Patents

Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür Download PDF

Info

Publication number
DE69737012T2
DE69737012T2 DE69737012T DE69737012T DE69737012T2 DE 69737012 T2 DE69737012 T2 DE 69737012T2 DE 69737012 T DE69737012 T DE 69737012T DE 69737012 T DE69737012 T DE 69737012T DE 69737012 T2 DE69737012 T2 DE 69737012T2
Authority
DE
Germany
Prior art keywords
pitch
pulse
sound source
search
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69737012T
Other languages
English (en)
Other versions
DE69737012D1 (de
Inventor
Hiroyuki Yokohama-shi EHARA
Toshiyuki Kawasaki-shi Morii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP03672697A external-priority patent/JP4063911B2/ja
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Application granted granted Critical
Publication of DE69737012D1 publication Critical patent/DE69737012D1/de
Publication of DE69737012T2 publication Critical patent/DE69737012T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf eine Sprachcodiervorrichtung vom CELP (code-angeregte lineare Vorhersage, Englisch: Code Excited Linear Prediction) Typ und eine Sprachdecodiervorrichtung vom CELP Typ in einem mobilen Kommunikationssystem und dergleichen, das ein Sprachsignal codiert und überträgt, und auf eine mobile Kommunikationsvorrichtung.
  • Die Sprachcodiervorrichtung vom CELP Typ unterteilt ein Sprachsignal in bestimmte Rahmenlängen, macht eine lineare Vorhersage der Sprache in jedem Rahmen und codiert einen Vorhersagerest (Englisch: Prediction Residue) (aktivierendes Signal), das von der linearen Vorhersage für jeden Datenrahmen herrührt, durch Verwendung eines adaptiven Codevektors und eines Rauschcodevektors, der aus bekannten Wellenformen aufgebaut ist. Für den adaptiven Codevektor bzw. den Rauschcodevektor werden, wie in 34 gezeigt, der adaptive Codevektor bzw. der Rauschcodevektor, die in einem adaptiven Codebuch 1 bzw. in einem Rauschcodebuch 2 gespeichert sind, in einigen Fällen verwendet so wie sie sind. In einem anderen Fall werden, wie in 35 gezeigt, der adaptive Codevektor aus dem adaptiven Codebuch 1 und der Rauschvektor aus dem Rauschcodebuch 2, welches mit einem Stufen- bzw. Tonhöhenzyklus (Englisch: Pitch Cycle) L des adaptiven Codebuchs 1 synchronisiert ist, verwendet. 35 zeigt einen Aufbau eines Erzeugungsbereichs für einen Rauschtonquellenvektor in der Sprachcodiervorrichtung vom CELP Typ, die in den Veröffentlichungsschriften der offen gelegten Patentanmeldungen Nr. Hei 5-19795 und Hei 5-19796 offenbart sind. In 35 wird der adaptive Codevektor aus dem adaptiven Codebuch 1 ausgewählt, während der Tonhöhenzyklus L ausgegeben bzw. emittiert wird. Der aus dem Rauschcodebuch 2 ausgewählte Rauschcodevektor wird durch eine Periodizitätseinheit 3 unter Benutzung des Tonhöhenzyklus L periodisch gemacht. Um den Rauschcodevektor periodisch zu machen, wird der Vektor durch den Tonhöhenzyklus von seinem Beginn an beschnitten und mehrere Male wiederholt zusammen verbunden, bis eine Teilrahmenlänge erreicht wird. Ein weiteres Beispiel einer bekannten adaptiven Sprachcodiervorrichtung vom CELP Typ ist in der Veröffentlichung EP-A-0514912 offenbart.
  • In der vorgenannten, herkömmlichen Sprachcodiervorrichtung vom CELP Typ, in der der Rauschcodevektor in Tonhöhenzyklen unterteilt wird, wird jedoch, nachdem eine Komponente des adaptiven Codevektors entfernt wird, eine verbleibende Komponente des Tonhöhenzyklus (Englisch: Residual Pitch Cycle Component) entfernt, indem der Rauschcodevektor bezüglich des Tonhöhenzyklus periodisch gemacht wird. Daher wird die in einer Tonhöhenwellenform bestehende Phaseninformation, d.h. die Information, die darstellt, wo ein Scheitelwert eines Tonhöhenimpulses existiert, nicht positiv verwendet. Folglich war die Verbesserung der Sprachqualität begrenzt.
  • Die vorliegende Erfindung ist entwickelt worden, um das herkömmliche Problem zu lösen, und eine Aufgabe derselben ist es, eine Sprachcodiervorrichtung bereitzustellen, die eine Sprachqualität weiter verbessern kann.
  • Um die vorgenannte Aufgabe zu lösen, wird in einer Tonhöhenwellenform existierende Phaseninformation zum Verbessern der Tonqualität verwendet, indem eine Amplitude eines Rauschcodevektors, der einer Position des Scheitel werts der Tonhöhe eines adaptiven Codevektors entspricht, betont bzw. verstärkt wird.
  • Entsprechend wird, wie in Patentanspruch 1 beansprucht, eine Vorrichtung zum Sprachcodieren oder -decodieren vom CELP (codeangeregte lineare Vorhersage, Englisch: Code Excited Linear Prediction) Typ bereitgestellt, die Vorrichtung umfassend einen Tonquellenerzeugungsbereich mit einen adaptiven Codebuch ausgebildet zum Übertragen eines adaptiven Codevektors und einem Rauschcodebuch ausgebildet zum Übertragen eines Rauschcodevektors.
  • Nach der Erfindung umfasst die Vorrichtung ferner einen Detektor für die Position des Scheitelwerts der Tonhöhe, ausgebildet zum Empfangen des adaptiven Codevektors und zum Bestimmen einer in dem adaptiven Codevektor bestehenden Position des Scheitelwerts der Tonhöhe; eine Erzeugungsvorrichtung bzw. einen Generator für ein Amplitude betonendes Fenster zum Erzeugen eines die Amplitude betonenden Fensters auf der Grundlage der Position des Scheitelwerts der Tonhöhe; und eine die Amplitude betonendes Fenstereinheit ausgebildet zum Multiplizieren des von dem Rauschcodebuch übertragenen Rauschcodevektors mit dem die Amplitude betonenden Fenster.
  • In vorteilhafter Weise wird der Rauschcodevektor von dem Rauschcodebuch direkt oder indirekt zu der die Amplitude betonenden Fenstereinheit übertragen.
  • Vorzugsweise umfasst die Vorrichtung ferner eine Periodizitätseenheit, die dazu ausgebildet ist, den Rauschcodevektor von dem Rauschcodebuch und einen Tonhöhenzyklus zu empfangen, um den Rauschcodevektor in Tonhöhenzyklen zu unterteilen und den in Tonhöhenzyklen unterteilten Rauschcodevektor zu der die Amplitude betonenden Fenstereinheit zu übertragen.
  • Weiter bevorzugt umfasst die Vorrichtung ferner einen Tonhöhenzyklus (L), der dem Detektor für die Position des Scheitelwerts der Tonhöhe zugeführt wird, so dass die Rauschtonquelle mit dem Tonhöhenzyklus (L) synchronisiert ist.
  • Wie ferner in Anspruch 44 beansprucht, umfasst ein Verfahren zum Sprachcodieren oder -decodieren nach dem CELP (codeangeregte lineare Vorhersage, Englisch: Code Excited Linear Prediction) Typ: Bereitstellen eines adaptiven Codevektors; Bestimmen einer in dem adaptiven Codevektors existierenden Position des Scheitelwerts der Tonhöhe; Erzeugen eines eine Amplitude betonenden Fensters auf der Grundlage der Position des Scheitelwerts der Tonhöhe; Bereitstellen eines Rauschcodevektors; und Multiplizieren des Rauschcodevektors mit dem die Amplitude betonenden Fenster.
  • Bevorzugte und vorteilhafte Ausführungsformen der Vorrichtung und des Verfahrens nach der Erfindung werden in den abhängigen Ansprüchen definiert.
  • Vorzugsweise wird eine Verschlechterung in der Tonqualität minimalisiert, indem der Rauschcodevektor benutzt wird, der nur auf die Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors begrenzt ist, selbst wenn nur eine kleine Anzahl von Bits für den Rauschcodevektor bereitgehalten werden.
  • Ferner wird nach der Erfindung der Suchbereich eingeengt, während die Verschlechterung in der Tonqualität minimalisiert wird, in dem die Position des Scheitelwerts der Tonhöhe und ein Tonhöhenzyklus des adaptiven Codevektors benutzt werden, um den Suchbereich für die Impulsposition zu begrenzen, selbst wenn es nur eine kleine Anzahl von Bits gibt, die für die Impulspositionen indikativ sind.
  • Vorzugsweise wird auch die Tonqualität verbessert in einem mit Sprache versehenen Teil eines Sprachsignals mit einem kurzen Tonhöhenzyklus, wenn die Position des Scheitelwerts der Tonhöhe und ein Tonhöhenzyklus des adaptiven Codevektors verwendet werden zum Begrenzen des Suchbereichs für die Impulsposition, insbesondere indem eine Suchgenauigkeit für die Impulsposition in einer oder zwei Tonhöhenwellenformen fein eingestellt wird.
  • Vorzugsweise wird auch die Tonqualität verbessert, indem die Anzahl der Impulstonquellenimpulse mit einem Wert des Tonhöhenzyklus variiert wird.
  • Vorzugsweise wird die Tonqualität verbessert, indem eine Impulsamplitude in der Nähe der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors und die anderen Teile bestimmt werden, bevor nach der Impulstonquelle gesucht wird.
  • Vorzugsweise kann die quantisierte Information einer ersten Stufe der Tonhöhenverstärkung als eine Modusinformation zum Umschalten eines Rauschcodebuchs verwendet werden, weil eine Tonhöhenverstärkung in mehreren Stufen quantisiert wird und eine erste Stufe der Informationsquantisierung ausgeführt wird unmittelbar nachdem ein a daptives Codebuch durchsucht wird. So wird die Effizienz der Codierung verbessert.
  • Vorzugsweise wird, indem quantisierte Tonhöhenzyklusinformation oder quantisierte Tonhöhenverstärkungsinformation in dem unmittelbar vorausgehenden Teilrahmen oder dem derzeitigen Teilrahmen benutzt werden, eine Steuerung ausgeführt, zum Umschalten der Suchpositionen der Impulstonquelle. Folglich wird die Sprachqualität verbessert.
  • Vorzugsweise wird auch eine Phasenkontinuität zwischen Teilrahmen rückwärts bestimmt. Nur auf solche Teilrahmen, deren Phase als kontinuierlich bestimmt worden ist, wird ein Phasenanpassungsprozess angewendet. Dabei wird der Phasenanpassungsprozess umgeschaltet, ohne die Menge der zu übertragenden Information zu vergrößern. So wird die Sprachqualität verbessert. Zusätzlich kann, wenn der Phasenanpassungsprozess nicht ausgeführt wird, indem ein festes (Anmerkung des Übersetzers: im Sinne von unveränderliches) Codebuch verwendet wird, ein Fehler in der Übertragungsleitung effektiv daran gehindert werden, sich auszubreiten.
  • Weiterhin bevorzugt wird, über einen Grad der Zentralisierung der Signalleistung auf die Nähe der Position des Scheitelwerts der Tonhöhe in dem adaptiven Codevektor bestimmt, ob der Phasenanpassungsvorgang anzuwenden ist oder nicht. Dabei wird der Phasenanpassungsvorgang umgeschaltet, ohne die Menge der zu übertragenden Information zu vergrößern. So wird die Sprachqualität verbessert. Zusätzlich kann, wenn der Phasenanpassungsprozess nicht ausgeführt wird, indem ein festes Codebuch verwendet wird, ein Fehler der Übertragungsleitung effektiv daran gehindert werden, sich auszubreiten.
  • Vorzugsweise werden in der Sprachcodiervorrichtung vom CELP Typ, in der Tonquellenimpulse in Positionen in Bezug auf die Position des Scheitelwerts der Tonhöhe gesucht werden, die Impulspositionen indiziert in der Reihenfolge vom Beginn des Teilrahmens. Dadurch wird der Einfluss des Fehlers der Übertragungsleitung, der in einigen Rahmen auftritt, daran gehindert, sich auf nachfolgende Datenrahmen, die keinen Übertragungsleitungsfehler aufweisen, daran gehindert, sich auszubreiten.
  • Vorzugsweise werden in der Sprachcodiervorrichtung vom CELP Typ, in der die Tonquellenimpulse an Positionen in Bezug auf die Position des Scheitelwerts der Tonhöhe gesucht werden, die Impulspositionen in der Reihenfolge vom Beginn des Teilrahmens indiziert. Zusätzlich werden verschiedene Impulse, die denselben Index aufweisen, in der Reihenfolge vom Beginn des Teilrahmens nummeriert. Dadurch wird der Einfluss des Fehlers der Übertragungsleitung, der in einigen Datenrahmen auftritt, daran gehindert, sich auf nachfolgende Datenrahmen, die keinen Übertragungsleitungsfehler aufweisen, auszubreiten.
  • Vorzugsweise werden in der Sprachcodiervorrichtung vom CELP Typ, in der Tonquellenimpulseimpositionen in Bezug auf die Position des Scheitelwerts der Tonhöhe gesucht werden, nicht alle Impulssuchpositionen durch die relativen Positionen dargestellt. Nur ein Teil in der Nähe des Scheitelwerts der Tonhöhe wird durch die relativen Positionen dargestellt, während der verbleibende Teil in vorbestimmten, festgesetzten Positionen eingestellt wird. Dabei wird der Einfluss von Fehlern der Übertragungsleitung, die in einigen Datenrahmen auftreten, daran gehin dert, sich auf die nachfolgenden Datenrahmen, die keine Übertragungsleitungsfehler aufweisen, auszubreiten.
  • Vorzugsweise wird, wenn die Position des Scheitelwerts der Tonhöhe erhalten wird, anstatt dass alle Objektsignale nach der Position des Scheitelwerts der Tonhöhe durchsucht werden, ein Mittel zum Suchen nach Signalen in der abgeschnittenen Länge des Tonhöhenzyklus für die Position des Scheitelwerts der Tonhöhe bereitgestellt. Dabei kann die vorderste Position des Scheitelwerts der Tonhöhe genauer extrahiert werden.
  • Weiter bevorzugt werden in einem Teil, in dem der Tonhöhenzyklus zwischen den Teilrahmen kontinuierlich ist, d.h. in einem Teil, von dem angenommen wird, dass er einen stationären mit Sprache versehenen Teil darstellt, die Position des Scheitelwerts der Tonhöhe in dem unmittelbar vorausgehenden Teilrahmen, der Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und der Tonhöhenzyklus in dem derzeitigen Teilrahmen verwendet, um die Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen vorherzusagen. Auf der Grundlage der vorhergesagten Position des Scheitelwerts der Tonhöhe wird ein Existenzbereich der Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen begrenzt. Dabei kann die Position des Scheitelwerts der Tonhöhe in einer solchen Art und Weise extrahiert werden, dass die Phase in dem mit Sprache versehenen stationären Teil daran gehindert wird, diskontinuierlich zu sein.
  • In besonderen Ausführungsformen kann eine Länge eines Teilrahmens etwa 10 Millisekunden oder mehr sein, eine relativ kleine Menge, d.h. etwa 15 Bit an Information kann pro Teilrahmen für die Rauschcodebuchinformation be reitgestellt sein, und die Impulstonquelle kann als das Rauschcodebuch eingesetzt werden. In diesem Fall wird mindestens ein Modus (insgesamt zwei oder mehrere Modi) bereitgestellt aus einem Modus, in dem die Anzahl der Impulse verringert wird, um ausreichend Impulspositionsinformation herzustellen, und ein Modus, in dem jede Impulspositionsinformation grob gemacht wird, jedoch die Anzahl der Impulse vergrößert wird. In dieser Konstitution wird die Qualität eines Sprachsignals in einem Bereich, in dem die Sprache ansteigt, verbessert. Auch wird durch Vergrößern der Anzahl der Impulse die Sprachqualität daran gehindert, schlechter zu werden, weil jede Impulspositionsinformation grob wird.
  • Bestimmte, nicht beschränkende Ausführungsformen der Erfindung werden in den beigefügten Zeichnungen veranschaulicht, für die gilt:
  • 1 ist ein Blockschaubild, das einen Aufbau eines Tonquellen-Erzeugungsbereichs in einer CELP Sprachcodiervorrichtung nach einer Ausführungsform der Erfindung zeigt.
  • 2 ist eine diagrammatische Darstellung, die die Beziehung zwischen einer Konfiguration des die Amplitude betonenden Fensters, einem adaptiven Codevektor und einer Position des Scheitelwerts der Tonhöhe in der ersten Ausführungsform der Erfindung zeigt.
  • 3 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer CELP Sprachcodiervorrichtung in einer Modifikation der Ausführungsform der Erfindung der 1 zeigt.
  • 4 ist ein Blockschaubild, das Bestandteile eines Tonquellenerzeugungsbereichs in einer CELP Sprachcodiervorrichtung in einer zweiten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 5 ist ein Blockschaubild, das Bestandteile eines Tonquellenerzeugungsbereichs in einer CELP Sprachcodiervorrichtung in einer dritten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 6(a) und 6(b) sind diagrammatische Darstellungen, die eine frühere bzw. vordere Hälfte der Anordnung eines auf die Nähe der Impulsposition begrenzten Vektors in der Ausführungsform der 5 zeigt.
  • 7(a) und 7(b) sind diagrammatische Darstellungen, die eine spätere bzw. hintere Hälfte einer Anordnung eines auf die Nähe der Impulsposition begrenzten Vektors in der Ausführungsform der 5 zeigt.
  • 8 ist ein Blockschaubild, das Bestandteile eines Tonquellenerzeugungsbereichs in einer CELP Sprachcodiervorrichtung in einer vierten, weiter entwickelten Ausführungsform der Erfindung zeigen.
  • 9(a) und 9(b) sind teilweise diagrammatische Darstellungen, die einen Impulstonquellen-Suchbereich in der Ausführungsform der 8 zeigt.
  • 10 ist der verbleibende Teil der diagrammatischen Darstellung, die den Impulstonquellensuchbereich in der Ausführungsform der 8 zeigt.
  • 11(a) ist ein Blockschaubild, das einen Aufbau einer Berechnungseinheit für die Suchposition in einer fünften, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 11(b) und 11(c) sind diagrammatische Darstellungen, die jeweils ein Beispiel eines Musters für die Impulssuchposition zeigen.
  • 12 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ nach einer sechsten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 13(a) bis 13(d) sind diagrammatische Darstellungen, die jeweils ein Beispiel von Impulssuchpositionen zeigen, die von einer Berechnungseinheit für die Suchposition in der Ausführungsform der 12 berechnet worden sind.
  • 14 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer siebten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 15 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Codiervorrichtung vom CELP Typ in einer achten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 16(a) und 16(b) sind Tabellen, die jeweils ein Beispiel eines Musters mit einer in der Ausführungsform der 15 verwendeten festen Suchposition zeigen.
  • 17 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer neunten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 18 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer zehnten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 19 ist eine diagrammatische Darstellung, die ein Prinzip einer Vorhersage in einer Vorhersagevorrichtung für die Position des Scheitelwerts der Tonhöhe nach der Ausführungsform der 19 zeigt.
  • 20 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer elften, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 21 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer zwölften, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 22 ist eine diagrammatische Darstellung, die ein Muster zeigt von einer Suchposition eines bestimmten Tonquellenimpulses, der von einer Berechnungseinheit für die Suchposition in der Ausführungsform der 21 übertragen wird, einen Index für jede Position in dem Fall, wo kein Indexaktualisierungsmittel bereitgestellt wird, und einen Index für jede Position in dem Fall, wo das Indexaktualisierungsmittel bereitgestellt wird.
  • 23 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer dreizehnten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 24(a) ist eine diagrammatische Darstellung, die ein Muster zeigt von einer Suchposition eines Tonquellenimpulses, der von einer Suchpositionsberechnungseinheit in der Ausführungsform der 23 übertragen wird, und eine einen Zusammenhang zwischen einer relativen Position und einer absoluten Position für jede Position.
  • 24(b) ist eine diagrammatische Darstellung, die eine Impulsnummer und einen Index, der bzw. die jedem Tonquellenimpuls zugewiesen werden, für den Fall zeigt, wo in der Ausführungsform der 23 kein Aktualisierungsmittel für die Impulsnummer und den Index bereitgestellt wird.
  • 24(c) ist eine diagrammatische Darstellung, die eine Impulsnummer und einen Index, die bzw. der jedem Tonquellenimpuls zugewiesen werden, zeigt in dem Fall, wo in der Ausführungsform der 23 das Aktualisierungsmittel für die Impulsnummer und den Index bereitgestellt wird.
  • 25 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer vierzehnten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 26(a) ist eine diagrammatische Darstellung, die ein Beispiel eines festen Musters für die Suchposition zur Verwendung in der Ausführungsform der 25 zeigt.
  • 26(b) und 26(c) sind diagrammatische Darstellungen, die jeweils ein Beispiel eines Suchpositionsmusters eines Tonquellenimpulses, der von einer Suchpositionsberechnungseinheit zur Verwendung in der Ausführungsform der 25 erzeugt worden ist, zeigen.
  • 26(d) ist eine diagrammatische Darstellung, die ein Beispiel des Suchpositionsmusters des Tonquellenimpulses zur Verwendung in einer Impulspositions-Sucheinheit nach der Ausführungsform der 25, zeigt.
  • 27 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer fünfzehnten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 28(a) und 28(b) sind diagrammatische Darstellungen, die jeweils ein Beispiel einer Wellenform eines adaptiven Codevektors, in dem ein zweiter Scheitelwert fälschlicherweise als ein Scheitelwert der Tonhöhe in einer Berechnungseinheit für den Tonhöhenscheitelwert angenommen wird.
  • 28(c) ist eine diagrammatische Darstellung eines Beispiels einer Wellenform eines adaptiven Codevektors, das ein Beispiel eines Bereichs zum Suchen einer Position des Scheitelwerts der Tonhöhe in einer Korrekturvorrichtung für die Position des Scheitelwerts der Tonhöhe zeigt.
  • 29 ist ein Blockschaubild, das Bestandteile eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ in einer sechzehnten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 30 ist ein Blockschaubild, das Bauteile eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrich tung vom CELP Typ in einer siebzehnten, weiter entwickelten Ausführungsform der Erfindung zeigt.
  • 31 ist ein Blockschaubild, das Bauteile einer weiter entwickelten Ausführungsform einer Sprachcodiervorrichtung vom CELP Typ nach der Erfindung zusammen mit einem herkömmlichen Tonquellenerzeugungsbereich zeigt.
  • 32 ist ein Blockschaubild, das Bauteile einer weiter entwickelten Ausführungsform einer Sprachdecodiervorrichtung vom CELP Typ nach der Erfindung zusammen mit dem herkömmlichen Tonquellenerzeugungsbereich zeigt.
  • 33 ist ein Blockschaubild, das eine bevorzugte Ausführungsform einer mobilen Kommunikationsvorrichtung, in der eine Sprachcodiervorrichtung vom CELP Typ nach der Erfindung verwendet wird, zeigt.
  • 34 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer herkömmlichen, allgemeinen Sprachcodiervorrichtung vom CELP Typ zeigt.
  • 35 ist ein Blockschaubild, das einen Aufbau eines Tonquellenerzeugungsbereichs in einer Sprachcodiervorrichtung vom CELP Typ, die einen periodischen Teil der Tonhöhe in einer herkömmlichen Rauschtonquelle aufweist, zeigt.
  • Zur Veranschaulichung der vorliegenden Erfindung werden einige Ausführungsformen des Tonquellenerzeugungsbereichs in der Sprachcodiervorrichtung im folgenden mit Verweis auf die 1 bis 10 beschrieben. Wie später beschrieben wird, werden diese Tonquellenerzeugungsbereiche mit den gleichen Konstitutionen in Sprachdecodiervorrichtungen nach der Erfindung eingesetzt.
  • 1 zeigt eine Ausführungsform der Erfindung und zeigt einen Tonquellenerzeugungsbereich in einer Sprachcodiervorrichtung, in der eine Amplitude eines Rauschcodevek tors entsprechend einer Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors betont wird. In 1 bezeichnet das Referenzzeichen 11 ein adaptives Codebuch, das einen adaptiven Codevektor zu einem Detektor 12 für die Position des Tonhöhenscheitelwerts überträgt; 12 bezeichnet eine Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, welche Berechnungseinheit den adaptiven Codevektor aus dem adaptiven Codebuch 11 empfängt und die Position des Tonhöhenscheitelwerts an einen Generator 13 für ein die Amplituden betonendes Fenster überträgt; 13 bezeichnet den Generator für das die Amplitude betonende Fenster, welcher Generator die Position des Scheitelwerts der Tonhöhe von der Berechnungseinheit 12 für die Position des Tonhöhenscheitelwerts empfängt und ein die Amplitude betonendes Fenster an eine die Amplitude betonende Fenstereinheit 16 überträgt; 14 bezeichnet ein Rauschcodebuch, das einen Rauschcodevektor speichert und eine Ausgabe an eine Periodizitätseinheit 15 überträgt; 15 bezeichnet die Periodizitätseinheit, die den Rauschcodevektor von dem Rauschcodebuch 14 und einen Tonhöhenzyklus L empfängt, den Rauschcodevektor in Tonhöhenzyklen unterteilt und eine Ausgabe an die Amplitude betonende Fenstereinheit 16 überträgt; und 16 bezeichnet die die Amplitude betonende Fenstereinheit, die das die Amplitude betonende Fenster von dem Generator 13 für das die Amplitude betonende Fenster und den Rauschcodevektor von der Periodizitätseinheit 15 empfängt, den Rauschcodevektor mit dem die Amplitude betonenden Fenster multipliziert und den endgültigen Rauschcodevektor ausgibt.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung vom CELP-Typ, die wie oben beschrieben aufgebaut ist, wird mit Verweis auf 1 beschrieben. Die Berechnungseinheit 12 für die Position des Scheitelwerts der Tonhöhe benutzt den empfangenen adaptiven Code vektor, um die in dem adaptiven Codevektor existierende Position des Scheitelwerts der Tonhöhe zu bestimmen. Die Position des Scheitelwerts der Tonhöhe kann durch Maximalisieren einer normalisierten Korrelation zwischen einer Impulskette, die hinsichtlich des Tonhöhenzyklus angeordnet ist, und dem adaptiven Codevektor bestimmt werden. Sie kann auch bestimmt werden durch Minimalisieren einer Differenz zwischen der Impulskette, die bezüglich des Tonhöhenzyklus angeordnet ist und die durch ein Synthesefilter hindurchgeleitet worden ist, und dem adaptiven Codevektor, der durch das Synthesefilter hindurchgeleitet worden ist.
  • Der Generator 13 für das Amplitude betonende Fenster erzeugt das die Amplitude betonende Fenster auf der Grundlage der Position des Scheitelwerts der Tonhöhe, die von der Berechnungseinheit 12 für die Position des Tonhöhenscheitelwerts bestimmt worden ist. Als das die Amplitude betonende Fenster können vielfältige Fenster benutzt werden, jedoch ist beispielsweise ein auf der Position des Scheitelwerts der Tonhöhe zentriertes, dreieckeckförmiges Fenster dahingehend effektiv, dass eine Fensterlänge leicht gesteuert werden kann.
  • 2 zeigt eine einen Zusammenhang zwischen einer Konfiguration des die Amplitude betonenden Fensters, die von dem Generator 13 für das die Amplituden betonende Fenster übertragen wird, und einer Konfiguration des adaptiven Codevektors. Eine in der Figur mit einer unterbrochenen Linie gezeigte Position bezeichnet die Position des Scheitelwerts der Tonhöhe, die von der Berechnungseinheit 12 für die Position des Tonhöhenscheitelwerts bestimmt worden ist.
  • Die periodische Einheit 15 unterteilt den von dem Rauschcodebuch 14 übertragenen Rauschcodevektor in Tonhöhenzyklen. Das Unterteilen in Tonhöhenzyklen bedeutet, dass der Rauschcodevektor in Bezug auf den Tonhöhenzyklus periodisch gemacht wird. Der in dem Rauschcodebuch gespeicherte Vektor wird durch den Tonhöhenzyklus L von seinem Beginn an zerschnitten. Dies wird mehrere Male wiederholt, bis eine Teilrahmenlänge erreicht wird, und die Vektoren werden zusammen verbunden. Jedoch wird das Unterteilen in Tonhöhenzyklen nur dann ausgeführt, wenn der Tonhöhenzyklus gleich wie oder weniger als die Länge des Teilrahmens ist.
  • Die Amplituden betonende Fenstereinheit 16 multipliziert den von der Periodizitätseinheit 15 übertragenen Rauschcodevektor mit dem von dem Generator 13 für das Amplituden betonende Fenster übertragenen, die Amplituden betonenden Fenster.
  • Auf diese Weise wird nach der obigen ersten Ausführungsform unter Verwendung der in einer Tonhöhenwellenform existierenden Phaseninformation die Tonqualität verbessert.
  • Zusätzlich kann der Tonquellenbereich der Sprachcodiervorrichtung vom CELP-Typ, der den Rauschcodevektor periodisch macht, mit Verweis auf 1 beschrieben werden, jedoch kann der Bereich als ein Tonquellenbereich einer allgemeinen Sprachcodiervorrichtung vom CELP-Typ betrieben werden, bei der der in dem Rauschcodebuch gespeicherte Rauschcodevektor so verwendet wird, wie er ist, wobei ein Beispiel davon in 3 gezeigt ist. In 3 bezeichnet das Referenzzeichen 21 ein adaptives Codebuch, 22 bezeichnet eine Berechnungseinheit für die Position des Tonhöhenscheitelwerts, 23 bezeichnet einen Generator für ein Amplituden betonendes Fenster, 24 bezeichnet ein Rauschcodebuch und 25 bezeichnet eine Amplituden betonende Fenstereinheit. Sie unterscheidet sich von dem Tonquellenerzeugungsbereich der 1 nur darin, dass die Rauschtonquelle bezüglich des Tonhöhenzyklus synchronisiert ist.
  • 4 zeigt eine zweite, weiter entwickelte Ausführungsform der Erfindung und für eine Sprachcodiervorrichtung vom CELP-Typ mit einem Aufbau, bei dem ein ansteigender Teil eines mit Sprache versehenen Teils eines verwendeten Sprachsignals eine Tonquelle ist, die durch Kombinieren einer Impulsketten-Tonquelle und einer Rauschtonquelle aufgebaut ist, und 4 zeigt einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung, in der eine Amplitude eines Rauschcodevektors einer Impulsposition einer Impulsketten-Tonquelle entspricht. In 4 bezeichnet das Referenzzeichen 31 eine Impulsketten-Tonquelle, die eine Ausgabe überträgt an einen Generator 32 für ein Amplitude betonendes Fenster und an einen Addierer 33, und die aus einer Impulskette aufgebaut ist, die in einem Intervall des auf Positionen des Tonhöhenscheitelwerts angeordneten Tonhöhenzyklus L bereitgestellt ist; 32 bezeichnet den Generator für das Amplitude betonende Fenster, der ein die Amplitude betonendes Fenster erzeugt zum Betonen einer Amplitude des Rauschcodevektors entsprechend der Impulsposition der Impulskette und der eine Ausgabe an einen Multiplizierer 35 überträgt; 33 bezeichnet den Addierer, der die Impulsketten-Tonquelle und den von dem Multiplizierer 35 übertragenen Rauschcodevektor nach der Faltung mit dem die Amplituden betonenden Fenster addiert und einen aktivierenden Vektor aussendet; 34 bezeichnet eine Rauschtonquelle, die durch den Rauschcodevektor dargestellt wird und die zu dem Mul tiplizierer 35 übertragen wird; und 35 bezeichnet den Multiplizierer, der den von der Rauschtonquelle 34 übertragenen Rauschtonquellenvektor mit dem von dem Generator 32 für das die Amplituden betonende Fenster übertragenen, die Amplitude betonenden Fenster multipliziert.
  • Der Betrieb des Tonquellenerzeugungsbereichs, der wie vorgenannt aufgebaut ist, wird mit Verweis auf 4 beschrieben. Die Impulsketten-Tonquelle 31 ist eine Impulskette, in der Impulspositionen und Intervalle durch den Tonhöhenzyklus L und eine anfängliche Phase P bestimmt sind. Der Tonhöhenzyklus L und die anfängliche Phase P werden außerhalb des Tonquellenerzeugungsbereichs separat berechnet. Zusätzlich können in der Impulsketten-Tonquelle die Impulse angeordnet werden, wenn jedoch ein zwischen Probenahme- bzw. Abtastpunkten bestehender Impuls dargestellt werden kann, kann eine bessere Leistungsfähigkeit erzielt werden. Ähnlich kann auch eine bessere Leistungsfähigkeit erhalten werden, wenn die anfängliche Phase (die Position des ersten Impulses) durch einen Bruchteil einer Genauigkeit, die einen Zwischenraum zwischen den Abtastpunkten anzeigen kann, dargestellt wird. Wenn es jedoch keine ausreichende Anzahl von Bits, die für diese Information bereitgestellt werden kann, vorhanden ist, dann kann selbst eine ganzzahlige Genauigkeit eine gute Leistungsfähigkeit bereitstellen. Die Positionsbestimmungssuche kann erleichtert werden.
  • Der Generator 32 für das die Amplitude betonende Fenster ist ein Fenster zum Betonen der Amplitude des Rauschtonquellenvektors in der Position, die der Impulsposition des Impulsketten-Tonquellenvektors entspricht, und ist ähnlich wie das die Amplitude betonenden Fenster, das in der ersten Ausführungsform beschrieben worden ist. Das auf der Impulsposition zentrierte, dreieckförmige Fenster und dergleichen können benutzt werden.
  • Der Addierer 33 addiert den Impulsketten-Tonquellenvektor 31 und den Rauschtonquellenvektor 34, der von dem Multiplizierer 35 mit dem die Amplitude betonenden Fenster multipliziert wurde, und emittiert einen aktivierenden Tonquellenvektor.
  • Ferner werden, wie in 4 gezeigt, bevor sie zu dem Addierer 33 übertragen werden, der Impulsketten-Tonquellenvektor und der Rauschtonquellenvektor jeweils mit einer geeigneten. Verstärkung multipliziert. In diesem Aufbau erzielt der Tonquellenerzeugungsbereich eine höhere Darstellungseigenschaft (Englisch: Representation Property). In diesem Fall muss die Verstärkungsinformation jedoch getrennt übertragen werden. Ebenso gilt, dass wenn die Verstärkungen des Impulsketten-Tonquellenvektors und des Rauschtonquellenvektors festgesetzt sind, dann müssen die Verstärkungen so eingestellt werden, dass der Impulsketten-Tonquellenvektor daran gehindert wird, in den Rauschtonquellenvektor eingebettet zu werden. Beispielsweise werden die Verstärkungen in einer solchen Weise eingestellt, dass eine Leistung des Impulsketten-Tonquellenvektors einer Leistung des Rauschtonquellenvektors gleicht.
  • Infolge dessen kann nach der obigen zweiten Ausführungsform die Tonqualität verbessert werden, indem die Amplitude des Rauschtonquellenvektors in Synchronisation mit dem Tonhöhenzyklus betont wird.
  • 5 zeigt eine dritte, weiter entwickelte Ausführungsform der Erfindung und eine Sprachcodiervorrichtung vom CELP-Typ, in der ein Tonquellenerzeugungsbereich der Sprachcodiervorrichtung einen Rauschcodevektor verwendet, der nur in der Nähe des Tonhöhenscheitelwerts eines adaptiven Codevektors begrenzt ist.
  • In 5 bezeichnet das Referenzzeichen 41 ein adaptives Codebuch, das einen adaptiven Codevektor ausgibt; 42 bezeichnet einen Phasensucher, der den von dem adaptiven Codebuch 41 übertragenen adaptiven Codevektor und den Tonhöhenzyklus L empfängt und die Position des Tonhöhenscheitelwerts (Phaseninformation) an einen Rauschcodevektor-Generator 44 überträgt; 43 bezeichnet ein Rauschcodebuch, das auf die Nähe der Position des Scheitelwerts der Tonhöhe begrenzt ist, das einen Rauschcodevektor mit einer begrenzten Vektorlänge nur in der Nähe eines Tonhöhenimpulses speichert und den. Rauschcodevektor in der Nähe der Position des Scheitelwerts der Tonhöhe an einen Rauschcodevektor-Generator 44 überträgt; 44 bezeichnet den Rauschcodevektor-Generator, der den von dem auf die Nähe der Position des Impulsscheitelwerts begrenzenden Rauschcodebuchs 43 übertragenen Rauschcodevektor und die Phaseninformation und den von dem Phasensucher 42 übertragenen Tonhöhenzyklus L empfängt, und den Rauschcodevektor an eine Periodizitätseinheit 45 überträgt; und 45 bezeichnet die Periodizitätseinheit, die den von dem Rauschcodevektor-Generator 44 übertragenen Rauschcodevektor und den Tonhöhenzyklus L empfängt und den endgültigen Rauschcodevektor aussendet.
  • Der Betrieb des Rauschquellenerzeugungsbereichs der Sprachcodiervorrichtung, die wie vorgehend beschrieben aufgebaut ist, wird mit Verweis auf 5 beschrieben. Der Phasensucher 42 verwendet den von dem adaptiven Codebuch 41 übertragenen, adaptiven Codevektor, um die Posi tion des in dem adaptiven Codevektor existierenden Scheitelwerts der Tonhöhe (die Phase) zu bestimmen. Die Position des Scheitelwerts der Tonhöhe kann bestimmt werden durch Maximalisieren der normalisierten Korrelation der in dem Tonhöhenzyklus und dem adaptiven Codevektor angeordneten Impulskette. Auch kann sie genauer erhalten werden durch Minimalisieren eines Fehlers zwischen der in dem Tonhöhenzyklus angeordneten Impulskette, die durch ein Synthesefilter hindurch geleitet worden ist, und dem adaptiven Codevektor, der durch das Synthesefilter hindurch geleitet worden ist.
  • Das auf die Nähe der Position des Tonhöhenscheitelwerts begrenzte Rauschcodebuch 43, speichert den Rauschcodevektor, der in der Nähe des Tonhöhenscheitelwerts des adaptiven Codevektors anzuwenden ist. Die Vektorlänge ist eine festgesetzte Länge unabhängig von dem Tonhöhenzyklus und einer Länge des Teilrahmens. Der Bereich der Nähe des Scheitelwerts der Tonhöhe kann vor und nach dem Scheitelwert der Tonhöhe gleiche Längen aufweisen. Wenn der Bereich hinter dem Scheitelwert der Tonhöhe länger ist als der vor dem Scheitelwert der Tonhöhe, wird eine Verschlechterung der Tonqualität minimalisiert. Wenn beispielsweise der Bereich der Nähe 5 Millisekunden lang ist, ist es besser, vor dem Scheitelwert der Tonhöhe eine Länge von 0,625 Millisekunden und nach dem Scheitelwert der Tonhöhe eine Länge von 4,375 Millisekunden zu wählen als die Längen vor und hinter dem Scheitelwert der Tonhöhe zu jeweils 2,5 Millisekunden zu wählen. Auch kann in dem Fall, wo die Vektorlänge etwa 5 Millisekunden beträgt, wenn die Länge des Teilrahmens 10 Millisekunden beträgt, im wesentlichen dieselbe Tonqualität realisiert werden, wie in dem Fall, wo die Vektorlänge 10 Millisekunden oder mehr ist.
  • Der Rauschcodevektor-Generator 44 stellt den Rauschcodevektor bereit, der von dem auf die Nähe der Position des Scheitelwerts der Tonhöhe begrenzten Rauschcodebuch 43 in der von dem Phasensucher 42 bestimmten Position des Scheitelwerts der Tonhöhe übertragen worden ist.
  • Die 6(a), 6(b), 7(a) und 7(b) veranschaulichen ein Verfahren, bei dem der von dem auf die Position des Scheitelwerts der Tonhöhe begrenzten Rauschcodebuch 43 übertragenen Rauschcodevektor bereitgestellt wird in Positionen, die den Tonhöhenimpulspositionen des Rauschcodevektor-Generators 44 entsprechen. Im Grunde genommen wird, wie in 6(a) gezeigt, der auf die Position des Scheitelwerts der Tonhöhe begrenzte Rauschcodevektor in der Nähe der Position des Scheitelwerts der Tonhöhe angeordnet. Bereiche (kreuzweise schraffierte Bereiche), die als in Tonhöhenzyklen unterteilte Bereiche in den 6(a) und 6(b) gezeigt werden, sind Objekte, die in der Periodizitätseinheit 45 in Tonhöhenzyklen zu unterteilen sind. In dem in 6(a) gezeigten Fall muss der Rauschcodevektor-Generator 44 die Unterteilung in Tonhöhenzyklen nicht ausführen. Jedoch wird in dem in 6(b) gezeigten Fall, weil ein Tonhöhenimpuls in der Nähe einer Teilrahmengrenze angeordnet ist, der frühere Bereich des von dem auf die Position des Scheitelwerts der Tonhöhe begrenzten Rauschcodebuchs 43 übertragene Rauschcodevektor in der Periodizitätseinheit 45 nicht periodisch gemacht werden (in der Periodizitätseinheit 45 wird der Vektor, der um die Länge des Tonhöhenzyklus aus der Teilrahmen-Grenze wiederholt in dem Tonhöhenzyklus angeordnet). Daher wird der Rauschcodevektor-Generator 44 so betrieben, dass er den Teil vorher in Tonhöhenzyklen unterteilt. Auch wenn der Tonhöhenimpuls unmittelbar vor der Teilrahmengrenze angeordnet ist und der Vektor zerschnitten wird, und um den Tonhöhenzyklus vom Beginn des Teilrahmens in Zyklen zu unterteilen, wird der letztere Halbbereich des auf die Nähe der Position des Scheitelwerts der Tonhöhe begrenzte Vektor nicht angemessen in Tonhöhenzyklen unterteilt. Daher wird, wie in 7(a) gezeigt, der Rauschvektor-Generator 44 so betrieben, dass er das Unterteilen in Tonhöhenzyklen auch in einer negativen Richtung entlang einer Zeitachse ausführt. In diesem Fall jedoch ist das Unterteilen in Zyklen nicht notwendig, wenn keine Tonhöhenimpulspositionen in der Länge des Tonhöhenzyklus vom Beginn des Teilrahmens existiert. Auf diese Weise kann, weil das Unterteilen in Tonhöhenzyklen ausgeführt wird, vor der Periodizitätseinheit 45, die Unterteilung in Tonhöhenzyklen, die effektiv alle Vektorbereiche des auf die Nähe der Scheitelwertposition begrenzten Vektorteile von der Periodizitätseinheit 45 ausgeführt werden. Weiterhin, wenn der Tonhöhenzyklus kürzer ist als die Vektorlänge, die in der Nähe der Position des Scheitelwerts der Tonhöhe begrenzt ist, wird der Vektor, der nur die Länge des Tonhöhenzyklus aufweist, von dem begrenzten Vektor zergeschnitten und in Tonhöhenzyklen unterteilt. In diesem Fall gibt es verschiedene Weisen des Zerschneidens, jedoch wird der Vektor in einer solchen Art und Weise ausgeschnitten, dass die Position des Tonhöhenimpulses in dem zerschnitten Vektor enthalten ist. Beispielsweise wird ein Tonhöhenzyklus des Vektors von einem Punkt, der einen Vierteltonhöhenzyklus vor der Position des Tonhöhenimpulses angeordnet ist, zerschnitten. So wird ein Startpunkt für das Zerschneiden unter Verwendung der Position des Tonhöhenimpulses und des Tonhöhenzyklus bestimmt.
  • 7(b) zeigt ein Beispiel des Verfahrens, bei dem der Rauschcodevektor zergeschnitten wird, wenn der Tonhöhen zyklus kürzer als die begrenzte Vektorlänge ist. In diesem Fall wird die Länge des Tonhöhenzyklus vom Beginn des auf die Nähe der Position des Scheitelwerts der Tonhöhe begrenzten Rauschcodevektors zerschnitten. Dann muss der zerschnittene Startpunkt nicht jedes Mal berechnet werden. Insbesondere ist, wie oben genannt, wenn ein Tonhöhenzyklus von dem Punkt ein Vierteltonhöhenzyklus vor der Position des Tonhöhenimpulses ausgehend zerschnitten wird, der Tonhöhenzyklus eine Variable. Daher muss der Vierteltonhöhenzyklus jedes Mal berechnet werden. Weil jedoch die Beginnposition des auf die Nähe der Position des Scheitelwerts der Tonhöhe begrenzten Rauschcodevektors ein festgesetzter Wert ist, wird die Berechnung überflüssig. Wenn der Vektor, der nur die Länge des Tonhöhenzyklus aufweist, vom Beginn des auf die Nähe der Position des Scheitelwerts der Tonhöhe begrenzten Rauschcodevektors zerschnitten wird, dann wird ein Bereich, der der Position des Tonhöhenimpulses entspricht, nicht eingeschlossen. Dann muss der Startpunkt des Zerschneidens in einer solchen Weise verändert werden, dass der Bereich, der der Position des Tonhöhenimpulses entspricht, eingeschlossen ist.
  • Die Periodizitätseinheit 45 unterteilt den von dem Rauschcodevektorgenerator 44 übertragenen Rauschcodevektor in Tonhöhenzyklen. Während der Unterteilung in Tonhöhenzyklen wird der Rauschcodevektor in Bezug auf den Tonhöhenzyklus periodisch gemacht. Nur der in dem Tonhöhenzyklus L enthaltene Rauschcodevektor wird vom Beginn zergeschnitten. Dies wird mehrere Male wiederholt, um die Vektoren zu verbinden, bis die Teilrahmenlänge erreicht wird. Jedoch wird die Unterteilung in Tonhöhenzyklen nur ausgeführt, wenn der Tonhöhenzyklus gleich wie oder weniger als die Länge des Teilrahmens ist. Auch wenn der Tonhöhenzyklus einen Bruchteil einer Genauigkeit aufweist, können Vektoren, deren Bruchteil des Genauigkeitspunkts durch Interpolationsmittel berechnet werden können, verbunden werden.
  • Wie oben genannt, kann die Verschlechterung in der Tonqualität nach der oben beschriebenen dritten Ausführungsform minimalisiert werden, indem der Rauschcodevektor nur in der Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors begrenzt ist, selbst wenn die Anzahl der für den Rauschcodevektor bereitgestellten Bits klein ist. In dem mit Sprache versehenen Bereich, in dem die verbleibende Leistung in der Nähe des Scheitelwerts der Tonhöhe konzentriert ist, kann die Tonqualität verbessert werden.
  • 8 zeigt eine vierte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung, die einen Suchbereich einer Impulsposition mittels eines Tonhöhenzyklusses und einer Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors bestimmt. In 8 bezeichnet das Referenzzeichen 51 ein adaptives Codebuch, das den letzten aktivierenden Tonquellenvektor speichert und einen adaptiven Codevektor an eine Berechnungseinheit 52 für die Position des Scheitelwerts der Tonhöhe und einen Multiplizierer 55 für die Tonhöhenverstärkung überträgt; 52 bezeichnet die Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, die den von dem adaptiven Codebuch 51 übertragenen adaptiven Codevektor und den Tonhöhenzyklus L empfängt, eine Position des Scheitelwerts der Tonhöhe berechnet und eine Ausgabe an die Berechnungseinheit 53 für den Suchbereich überträgt; 53 bezeichnet eine Berechnungseinheit für den Suchbereich, die die Position des Scheitelwerts der Tonhöhe und den Tonhö henzyklus L empfängt, die von der Berechnungseinheit 52 für die Position des Scheitelwerts der Tonhöhe übertragen worden sind, die einen Bereich berechnet, in dem eine Impulstonquelle gesucht wird und die eine Ausgabe an den Impulstonquellensucher 54 überträgt; 54 bezeichnet den Impulstonquellensuchvorrichtung, die den von der Berechnungseinheit 53 für den Suchbereich übertragenen Suchbereich und den Tonhöhenzyklus L empfängt, die Impulsquelle sucht und einen Impulstonquellenvektor an einen Multiplizierer für die Impulstonquellenverstärkung 56 überträgt; 55 bezeichnet den Multiplizierer, der den von dem adaptiven Codebuch übertragenen adaptiven Codevektor mit einer Tonhöhenverstärkung multipliziert und eine Ausgabe an einen Addierer 57 überträgt; 56 bezeichnet den Multiplizierer, der den von der Impulstonquellensuchvorrichtung übertragenen Impulstonquellenvektor mit einer Impulstonquellenverstärkung multipliziert und eine Ausgabe an den Addierer 57 überträgt; und 57 bezeichnet den Addierer, der eine Ausgabe von dem Multiplizierer 55 und eine Ausgabe von dem Multiplizierer 56 empfängt, die Ausgaben addiert, und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des wie vorgenannt aufgebauten Tonquellenerzeugungsbereichs wird mit Verweis auf 8 beschrieben. In 8 zerschneidet das adaptive Codebuch 51 den adaptiven Codevektor nur um die Länge des Teilrahmens aus von dem Punkt, in dem nur der vorher außerhalb des Tonquellenerzeugungsbereichs berechnete Tonhöhenzyklus L als in die Vergangenheit zurückreichend angenommen wird, und gibt den adaptiven Codevektor aus. Wenn der Tonhöhenzyklus L die Länge des Teilrahmens nicht erreicht, wird der zergeschnittene Vektor des Tonhöhenzyklus L wiederholt verbunden, bis die Länge des Teilrahmens erreicht wird und als der adaptive Codevektor übertragen.
  • Die Berechnungseinheit 52 für die Position des Scheitelwerts der Tonhöhe benutzt den von dem adaptiven Codebuch 51 übertragenen adaptiven Codevektor, um die Position des in dem adaptiven Codevektor existierenden Scheitelwerts der Tonhöhe, zu bestimmen. Die Position des Scheitelwerts der Tonhöhe wird bestimmt durch Maximalisieren der normalisierten Korrelation der in dem Tonhöhenzyklus angeordneten Impulskette und dem adaptiven Codevektor. Auch kann sie genauer erhalten werden durch Minimalisieren eines Fehlers zwischen der Impulskette, die in dem Tonhöhenzyklus, der durch das Synthesefilter hindurch geleitet worden ist, angeordnet ist, und dem adaptivem Codevektor, der durch das Synthesefilter hindurch geleitet worden ist.
  • Die Berechnungseinheit 53 für den Suchbereich berechnet den Bereich, in dem die Impulstonquelle gesucht wird unter Verwendung der empfangenen Position des Scheitelwerts der Tonhöhe und des Tonhöhenzyklusses L. Genauer gesagt berechnet sie einen für die Hörbarkeit wichtigen Bereich in einer Tonhöhenwellenform aus der Positionsinformation des Scheitelwerts der Tonhöhe und bestimmt den Bereich als den Suchbereich. Der von der Berechnungseinheit 53 für den Suchbereich bestimmte konkrete Suchbereich wird in den 9 und 10 gezeigt. 9(a) zeigt den Fall, wo ein Bereich mit 32 Abtastpunkten, beginnend von einer Position 5 Abtastpunkten vorher, von der Position des Scheitelwerts der Tonhöhe als der Suchbereich bestimmt worden ist. In dem mit Sprache versehenen Teil kann, wenn die in dem Tonhöhenzyklus bereitgestellte Impulskette als die Impulstonquelle benutzt wird, ein Impuls an derselben Position in dem zweiten Impulssuchbereich angehoben werden. Eine Tonquelle kann effizient dargestellt werden. 9(b) zeigt ein Beispiel eines Suchbereichs, der bestimmt worden ist, wenn der Tonhöhenzyklus länger ist als derjenige der 9(a). Wenn der Tonhöhenzyklus lang ist, wie in 9(a) gezeigt, dann wird die Nähe der Position des Scheitelwerts der Tonhöhe in einer konzentrierten Art und Weise abgesucht. Dann ist der Suchbereich relativ zu einer Tonhöhenwellenform eingeengt. Das Frequenzband, das dargestellt werden kann, ist eingeengt. Aus diesen und anderen Gründen wird in einigen Fällen die Darstellungseigenschaft (Englisch: Representation Property) der Frequenzbestandteile in einem bestimmten Band verschlechtert. In diesem Fall wird, wie in 9(b) gezeigt, anstatt dass der Suchbereich in Übereinstimmung mit dem Tonhöhenzyklus vergrößert wird, ein Bereich bereitgestellt, in dem nicht alle Abtastpunkte gesucht werden, sondern jeder andere Abtastpunkt oder jede zweite Abtastpunkt gesucht. Dann kann die Verschlechterung in der Darstellungseigenschaft der Frequenzkomponente in dem spezifischen Band vermieden werden, ohne die Anzahl der zu suchenden Positionen zu vergrößern.
  • Auch zeigt 10 ein Verfahren, in dem der Suchbereich für die Impulsposition begrenzt wird, und zwar dicht in der Nähe der Position des Scheitelwerts der Tonhöhe und grob in anderen Bereichen. Das Begrenzungsverfahren beruht auf statistischen Ergebnissen, nach denen Positionen, die hohe Wahrscheinlichkeiten dafür aufweisen, dass Impulse ansteigen, in der Nähe des Tonhöhenimpulses konzentriert sind. Wenn der Suchbereich für die Impulsposition nicht begrenzt wird, dann ist in den mit Sprache versehenen Teilen die Wahrscheinlichkeit, dass Impulse in der Nähe des Tonhöhenimpulses angestiegen sind, höher als die Wahrscheinlichkeit, dass die Impulse in den anderen Bereichen erhöht sind. Jedoch ist die Wahrscheinlichkeit, dass Impulse in den anderen Bereichen erhöht sind nicht auf einen Grad, der ignoriert werden kann, verringert. Das in 10 gezeigte Verfahren zur Begrenzung des Suchbereichs der Impulsposition ist ein Beispiel des in 9(b) gezeigten Verfahrens, in dem der Suchbereich auf der Grundlage einer Verteilung der Wahrscheinlichkeiten der ansteigenden Impulse begrenzt ist. Zusätzlich werden in 9(a), wenn der Tonhöhenzyklus kurz ist und sich der erste Impulssuchbereich dem zweiten Impulssuchbereich überlagert, Verfahren bereitgestellt zum Verhindern, dass der zweite Impulssuchbereich überlagert wird: ein Verfahren zum Vergrößern der Anzahl der Impulse anstatt des Einengens des ersten Impulssuchbereichs und ein Verfahren zum Bestimmen des Suchbereichs, der den zweiten Impulssuchbereich überlagert (dasselbe wie das Verfahren zur Bestimmung des Suchbereichs in 9(a)).
  • Die Impulspositionssuchvorrichtung 54 hebt eine Impulstonquelle in dem Suchbereich (Position), die von der Berechnungseinheit 53 für den Suchbereich bestimmt worden ist, an und sendet eine Position aus, in der eine synthetisierte Sprache bzw. ein synthetisiertes Sprachsignal am nächsten zu einem Eingabesprachsignal bzw. einer Eingabesprache ist. Insbesondere in einem mit Sprache versehenen stationären Bereich, in dem die Länge der Teilrahmen lange ausreichend ist, um mehrere Tonhöhenimpulse zu enthalten, wird eine in einem Tonhöhenzyklus-Intervall angeordnete Impulskette als die Impulstonquelle verwendet, und es wird in der Impulskette in dem Suchbereich eine erste Impulsposition bestimmt. Es gibt verschiedene Weisen zum Anheben der Impulse. Die vorbestimmte Anzahl der Impulse, beispielsweise 4 Impulse, werden in dem Suchbereich angehoben, beispielsweise auf beliebigen aus 32 Plätzen. In diesem Fall gibt es neben einem Verfahren zum Suchen aller Kombinationen (8 × 8 × 8 × 8 Arten) in einer solchen Weise, dass die 32 Plätze in 4 eingeteilt werden und ein Platz aus den 8 Plätzen bestimmt wird, in dem ein Impuls bereitgehalten wird, ein Verfahren zum Suchen aller Kombinationen zum Auswählen von 4 Plätzen aus den 32 Plätzen und andere Verfahren. Darüber hinaus können neben der Kombination von Impulsen mit einer Amplitude 1, einer Kombination von mehreren Impulsen, beispielsweise zwei oder ein Paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben werden.
  • Verstärkungen, die in den Multiplizierern 55 und 56 multipliziert werden, sind Werte, die für entsprechende Vektoren bestimmt worden sind, indem der adaptive Codevektor aus dem adaptiven Codebuch und der Impulstonquellenvektor aus dem Impulspositionssucher 54 verwendet werden und eine Sprache bzw. ein Sprachsignal. synthetisiert wird, um eine Differenz von der eingegebenen Sprache bzw. dem Eingabesprachsignal zu minimalisieren. Hier wird die Verstärkung, die mit dem adaptiven Codevektor multipliziert wird, als eine Tonhöhenverstärkung verwendet, während die mit dem Impulstonquellenvektor miultiplizierte Verstärkung als eine Impulstonquellenverstärkung benutzt wird. Dann multipliziert der Multiplizierer 55 den adaptiven Codevektor mit der Tonhöhenverstärkung und überträgt eine Ausgabe an den Addierer 57. Der Multiplizierer 56 multipliziert den Impulstonquellenvektor mit der Impulstonquellenverstärkung und überträgt eine Ausgabe an den Addierer 57.
  • Der Addierer 57 addiert den adaptiven Codevektor, der von dem Multiplizierer 55 übertragen worden ist, nachdem er mit der optimalen Verstärkung multipliziert worden ist, und den Impulstonquellenvektor, der von dem Multiplizie rer 56 übertragen worden ist, nachdem er mit der optimalen Verstärkung multipliziert worden ist, und sendet den aktivierenden Tonquellenvektor aus.
  • Wie vorgenannt, kann die Verschlechterung in der Tonqualität nach der obigen vierten Ausführungsform minimalisiert werden, selbst wenn eine kleine Anzahl von Bits für den Impuls bereitgestellt wird.
  • 11(a) zeigt eine fünfte, weiter entwickelte Ausführungsform der Erfindung und einen Positionsbestimmungsbereich für die Impulssuche in einem Tonquellenerzeugungsbereich, welcher die Positionen für die Impulssuche durch den Tonhöhenzyklus und die Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors bestimmt und zeigt die Berechnungseinheit 53 für den Suchbereich ausführlich in 8. In 11(a) bezeichnet das Referenzzeichen 61 eine Positionsmuster-Auswahleinheit für die Impulssuche, die den Tonhöhenzyklus L empfängt und ein Positionsmuster für die Impulssuche an eine Bestimmungseinheit 62 für die Position zur Impulssuche überträgt; und 62 bezeichnet eine Bestimmungseinheit für die Position zur Impulssuche, die jeweils die Positionen des Scheitelwerts der Tonhöhe von der Berechnungseinheit 52 für die Position des Scheitelwerts der Tonhöhe empfängt und einen Suchbereich (Impulssuchpositionen) an die Impulspositionssuchvorrichtung 54 überträgt.
  • Der Betrieb der Berechnungseinheit 53 für die Impulssuche in dem Tonquellenerzeugungsbereich wird mit Verweis auf die 11(a), 11(b) und 11(c) beschrieben. Die Positionsmuster-Auswahleinheit 61 für die Impulssuche weist vorher mehrere Typen von Positionsmustern für die Impulssuche auf (die Positionsmuster für die Impulssuche beste hen aus einer Zusammenfassung von Positionen von Abtastpunkten, an denen die Impulssuche ausgeführt wird, und stellt den Abtastpunkt an einer relativen Position dar, wobei die Position des Scheitelwerts der Tonhöhe 0 ist), verwendet den durch die Tonhöhenanalyse erhaltenen Tonhöhenzyklus L zum Bestimmen, welches Positionsmuster für die Impulssuche zu benutzen ist, und überträgt das Positionsmuster für die Impulssuche an die Positionsbestimmungseinheit 62 für die Impulssuche.
  • 11(b) oder 11(c) zeigen ein Beispiel des Positionsmusters für die Impulssuche, das die Positionsmusterauswahleinheit 61 für die Impulssuche bereits vorher besitzt bzw. kennt. In den Figuren bezeichnen Graduierungen Positionen von Abtastpunkten. Die mit Pfeilen markierten Abtastpunkte entsprechen den Impulssuchpositionen (nicht mit Pfeilen versehene Bereiche werden nicht durchsucht). Numerische Werte an den Graduierungen bezeichnen relative Positionen, die von dem adaptiven Codevektor erhalten werden, während die Position des Scheitelwerts der Tonhöhe 0 ist. Auch zeigen 11(b) oder 11(c) den Fall, wo ein Teilrahmen achtzig Abtastpunkte aufweist. 11(b) zeigt das Suchpositionsmuster, wenn der Tonhöhenzyklus L lang ist (beispielsweise 45 Abtastpunkte oder mehr), während 11(c) das Suchpositionsmuster zeigt, wenn der Tonhöhenzyklus L kurz ist (beispielsweise weniger als 44 Abtastpunkte). Wenn der Tonhöhenzyklus L kurz ist, wird der gesamte Teilrahmen nicht durchsucht. Durch Ausführen des Vorgangs des Unterteilens in Tonhöhenzyklen können Impulse in dem gesamten Teilrahmen angehoben werden. Das Unterteilen in Tonhöhenzyklen kann erleichtert werden durch Verwendung der folgenden Gleichung (1) (ITU-T Studiengruppe 15 – Beitrag 152, "G.729-Coding of Speech at 8 kbit/s using conjugate-structure algebraic code-excited linear-prediction (CS-ACELP)", Com. 15-152-E, Juli 1995). code(i) = code(i) + β × code(i – L) (1)
  • In der Gleichung (1) stellt code() den Impulstonquellenvektor dar und i stellt eine Abtastnummer dar (0 bis 79 im Beispiel der 11). Ebenfalls ist β ein Verstärkungswert, der eine Unterteilungsintensität andeutet, und er ist vergrößert, wenn eine Periodizität stark ist, und verringert, wenn die Periodizität schwach ist (gewöhnlich wird ein Wert von 0 bis 1,0 verwendet). In 11(c) wird die Impulssuche in einem Bereich von (–4) bis 48 Abtastpunkten (der Bereich von 53 Abtastpunkten) ausgeführt. Daher, wenn der Tonhöhenzyklus L aus 53 (oder 54) oder weniger besteht, kann das Suchbereichsmuster der 11(c) verwendet werden. Wenn jedoch der Tonhöhenzyklus L weniger als etwa 45 Abtastpunkten umfasst, können zwei Positionen des Scheitelwerts der Tonhöhe in dem Suchbereich enthalten sein. Dann können die Fälle bearbeitet werden, wobei eine Tonhöhenimpulswellenform von einem ersten Zyklus und eine Tonhöhenimpulswellenform von einem zweiten Zyklus variiert werden, oder der Fall, wo die erhaltene Position des Scheitelwerts der Tonhöhe aufgrund eines Irrtums als diejenige Position detektiert wird, die einen Zyklus vor der tatsächlichen Position des Scheitelwerts der Tonhöhe ist.
  • Die Positionsbestimmungseinheit 62 für die Impulssuche verwendet das von der Positionsmuster-Auswahleinheit für die Impulssuche übertragene Positionsmuster für die Impulssuche, um die Impulssuchpositionen in dem derzeitigen Teilrahmen zu bestimmen und überträgt eine Ausgabe an die Impulspositionssuchvorrichtugn 54. Das von der Positionsmuster-Auswahleinheit 62 für die Impulssuche übertragene Positionsmuster für die Impulssuche wird dargestellt durch die relative Position, wenn die Position des Scheitelwerts der Tonhöhe Null ist; daher kann es für die Impulssuche nicht so, wie es ist, verwendet werden. Aus diesem Grunde wird das Muster in eine absolute Position umgewandelt, bei der der Beginn des Teilrahmens Null ist, und an die Impulspositionssuchvorrichtung 54 übertragen.
  • 12 zeigt eine sechste, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich in einer Sprachcodiervorrichtung, die die Suchposition für Impulspositionen durch den Tonhöhenzyklus und die Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors bestimmt und die einen Aufbau zum Umschalten der Anzahl der Impulse zur Verwendung in einer Impulstonquelle aufweist. In 12 bezeichnet das Referenzzeichen 71 ein adaptives Codebuch, das den adaptiven Codevektor zu einer Berechnungseinheit 72 für die Position des Scheitelwerts der Tonhöhe und einem Multiplizierer 76 überträgt; 72 bezeichnet die Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder durch Durchsuchen des adaptiven Codebuchs erhalten worden ist, und den adaptiven Codevektor, der von dem adaptiven Codebuch übertragen worden ist, empfängt und die Position des Scheitelwerts der Tonhöhe an eine Berechnungseinheit 74 für die Suchposition überträgt; 73 bezeichnet eine Impulsnummer-Bestimmungseinheit, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchung des adaptiven Codebuchs erhalten worden ist und die Anzahl der Impulse an die Berechnungseinheit 74 für die Suchposition überträgt; 74 bezeichnet die Berechnungseinheit für die Suchposition, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchen des adaptiven Codebuchs erhalten worden ist, die Impulsnummer, die von der Impulsnummer-Bestimmungseinheit 73 über tragen worden ist und die Position des Scheitelwerts der Tonhöhe, die von der Berechnungseinheit 72 für die Position des Scheitelwerts der Tonhöhe übertragen worden ist, empfängt und die Positionen für die Impulssuche an die Impulspositionssuchvorrichtung 75 überträgt; 75 bezeichnet die Impulspositionssuchvorrichtung, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchen des adaptiven Codebuchs erhalten worden ist, und die Impulssuchpositionen, die von der Impulspositions-Berechnungseinheit 74 übertragen worden ist, empfängt, eine Kombination von Positionen zum Anheben von Impulsen, die in der Impulstonquelle verwendet werden, bestimmt und einen durch die Kombination bereitgestellten Impulstonquellenvektor an einen Multiplizierer 77 überträgt; 76 bezeichnet einen Multiplizierer, der den adaptiven Codevektor von dem adaptiven Codebuch empfängt, diesen mit einer Verstärkung für den adaptiven Codevektor multipliziert und eine Ausgabe an einen Addierer 78 überträgt; 77 bezeichnet den Multiplizierer, der den Impulstonquellenvektor von dem Impulspositionssucher empfängt, diesen mit einer Verstärkung für den Impulstonquellenvektor verstärkt und eine Ausgabe an den Addierer 78 überträgt; und 78 bezeichnet den Addierer, der die Vektoren von den Multiplizierern 76 und 77 empfängt, eine Vektoraddition durchführt und einen Tonquellenvektor aussendet.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung vom CELP Typ, die wie oben genannt aufgebaut ist, wird mit Verweis auf 12 beschrieben. Der adaptive Codevektor aus dem adaptiven Codebuch 71 wird an den Multiplizierer 76 übertragen, mit der Verstärkung für den adaptiven Codevektor multipliziert und an den Addierer 78 übertragen. Die Berechnungseinheit 72 für die Position des Scheitelwerts der Tonhöhe detektiert den Scheitelwert der Tonhöhe aus dem adaptiven Codevektor und überträgt seine Position an die Berechnungseinheit 74 für die Suchposition. Die Position des Scheitelwerts der Tonhöhe kann durch Maximalisieren eines inneren Produkts des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors und des adaptiven Codevektors detektiert (berechnet) werden. Auch kann die Position des Scheitelwerts der Tonhöhe durch Maximalisieren eines inneren Produkts des Vektors, der durch Faltung einer Impulsantwort eines Synthesefilters in einem in dem Tonhöhenzyklus L angeordneten Impulskettenvektor erhalten wird und eines Vektors, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird, genauer detektiert werden.
  • Die Bestimmungseinheit 73 für die Impulsanzahl bestimmt die Anzahl der Impulse zur Verwendung in der Impulstonquelle auf der Grundlage des Werts des Tonhöhenzyklus L und überträgt eine Ausgabe an die Berechnungseinheit 74 für die Suchposition. Die Beziehung zwischen der Impulsanzahl und dem Tonhöhenzyklus ist durch Statistik oder Lernen vorbestimmt. Wenn beispielsweise der Tonhöhenzyklus aus 45 Abtastpunkten oder weniger besteht, werden fünf Impulse bestimmt; wenn der Tonhöhenzyklus in einem Bereich, der 45 Abtastpunkte übersteigt und weniger als 80 Abtastpunkte ist, werden vier Impulse bestimmt; und wenn der Tonhöhenzyklus aus 80 Abtastpunkten oder mehr besteht, dann werden drei Impulse bestimmt. Auf diese Weise werden in Übereinstimmung mit den Bereichen der Werte der Tonhöhenzyklen entsprechende Anzahlen von Impulsen bestimmt. Wenn der Tonhöhenzyklus kurz ist, dann kann der Impulssuchbereich durch Verwendung des Vorgangs des Unterteilens in Tonhöhenzyklen auf einen oder zwei Tonhöhenzyklen begrenzt werden. Daher kann, anstatt dass die Positionsinformation verringert wird, die Anzahl der Impulse vergrößert werden. Auch unterscheiden sich hin sichtlich der Wellenform eine weibliche Sprache mit einem kurzen Tonhöhenzyklus und eine männliche Sprache mit einem langen Tonhöhenzyklus voneinander in ihren Wellenformeneigenschaften. Es existiert eine Anzahl von Impulsen, die für die jeweilige Stimme geeignet ist.
  • Im Allgemeinen, weil die männliche Stimme eine starke Impulseigenschaft aufweist, neigt die Impulsposition anstelle der Anzahl der Impulse dazu, richtig zu sein. Weil die weibliche Stimme eine schwache Impulseigenschaft aufweist, besteht eine Tendenz dazu, die Anzahl der Impulse zu vergrößern, so dass die Konzentration der Leistung besser vermieden worden wäre. Daher ist es effektiv, die Impulsanzahl zu verringern, wenn der Tonhöhenzyklus lang ist, und die Impulsanzahl auf einen gewissen Grad zu vergrößern, wenn der Tonhöhenzyklus kurz ist. Wenn ferner die Anzahl der Impulse durch Betrachten einer Veränderung in der Impulsanzahl zwischen kontinuierlichen Teilrahmen, einer Veränderung im Tonhöhenzyklus L und dergleichen bestimmt wird, dann wird die Diskontinuität zwischen den kontinuierlichen bzw. aufeinander folgenden Teilrahmen ausgeglichen und die Qualität des ansteigenden Bereichs des mit Sprache versehenen Bereichs kann verbessert werden. Insbesondere in den aufeinander folgenden Teilrahmen, wenn die aus dem Tonhöhenzyklus L bestimmte Anzahl der Impulse von fünf auf drei abnimmt, dann kann die Abnahme der Impulsanzahl eine Hysterese aufweisen. Fünf Impulse werden auf vier verringert, und nicht steil auf drei. Die Anzahl der Impulse wird so daran gehindert, sich zwischen den Teilrahmen in großem Maße zu verändern. Wenn andererseits der Tonhöhenzyklus L sich zwischen den aufeinander folgenden Teilrahmen stark unterscheidet, besteht eine große Wahrscheinlichkeit, dass der mit Sprache versehene Bereich ansteigend ist. Daher wird die Sprachqualität durch Verringern der Anzahl der Impulse und Verbessern der Genauigkeit der Impulsposition verbessert. Wenn sich der Tonhöhenzyklus L des vorhergehenden Teilrahmens stark von dem Tonhöhenzyklus L des derzeitigen Teilrahmens unterscheidet, dann wird die Anzahl der Impulse unabhängig von dem Wert des Tonhöhenzyklus L in dem derzeitigen Teilrahmen als drei bestimmt. Durch dieses oder andere Verfahren wird die Anzahl der Impulse bestimmt. Dann kann die Sprachqualität weiterverbessert werden. Zusätzlich gilt, dass die Fälle, wo diese Verfahren verwendet werden, leicht bei der Tonhöhenanalyse durch die Fehler bei doppelter Tonhöhe, Fehler in halber Tonhöhe und dergleichen beeinflusst werden. Daher ist die Verwendung eines Verfahrens zum Bestimmen der Anzahl der Impulse effektiver, um den Einfluss auszugleichen bzw. zu moderieren (beispielsweise Bestimmen der Kontinuität des Tonhöhenzyklus durch Betrachten der Wahrscheinlichkeit von halber Tonhöhe oder doppelter Tonhöhe oder dergleichen) oder die Genauigkeit bei der Tonhöhenanalyse so hoch wie möglich anzuheben.
  • Die Berechnungseinheit 74 für die Suchposition bestimmt auf der Grundlage der Position des Scheitelwerts der Tonhöhe und der Anzahl der Impulse die Position, in der die Impulssuche ausgeführt wird. Die Impulssuchpositionen werden in einer solchen Art und Weise verteilt, dass sie in der Nähe des Scheitelwerts der Tonhöhe dicht werden und in anderen Bereichen grober (dies ist wirksam, wenn Bits nicht ausreichend verteilt sind, um alle Abtastpunkte zu durchsuchen). Genauer gesagt werden in der Nähe der Position des Scheitelwerts der Tonhöhe alle Abtastpunkte der Impulspositionssuche unterworfen. In Bereichen abseits der Position des Scheitelwerts der Tonhöhe wird jedoch das Intervall der Impulspositionssuche verbreitert auf, beispielsweise jede zweite Abtastung oder jede dritte Abtastung (beispielsweise werden die Suchpositionen bestimmt, wie in den 11(b) und 11(c) gezeigt). Auch wenn eine große Anzahl von Impulsen besteht, wird die Anzahl der für einen Impuls bereitgestellten Bit verringert. Daher ist das Intervall von groben Bereichen breiter im Vergleich zu dem Fall, wo eine kleine Anzahl von Impulsen vorkommt (die Genauigkeit der Impulsposition wird grob). Darüber hinaus wird, wenn der Tonhöhenzyklus kurz ist, wie in der fünften Ausführungsform beschrieben, der Suchbereich nur auf einen Bereich beschränkt, der ein wenig länger ist als ein Tonhöhenzyklus des ersten Scheitelwerts der Tonhöhe in dem Teilrahmen. Dann kann die Sprachqualität verbessert werden.
  • Der Impulspositionssucher 75 bestimmt die optimale Kombination der Positionen, wo Impulse angehoben werden auf der Grundlage der Suchpositionen, die von der Berechnungseinheit 74 für die Suchpositionen bestimmt worden sind. In dem Impulssuchverfahren, wie das in "ITU-T STUDY GROUP 15 – CONTRIBUTION 152, "G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINAER-PREDICTION(CS-ACELP)" COM 15-152-E Juli 1995" beschrieben ist, wird beispielsweise, wenn die Anzahl der Impulse vier ist, eine Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die Gleichung (2) maximalisiert wird.
  • Figure 00400001
  • Hierin wird dn(i) (i = 0 bis 79: in dem Fall wo die Teilrahmenlänge 80 Abtastpunkte beziehungsweise Proben beträgt) erhalten durch Rückwärtsfiltern eines Zielvektors x'(i) von Impulstonquellenkomponenten mit der Impulsantwort des Synthesefilters, wobei rr(i,i) eine Autokorrelationsmatrix der Impulsantwort ist, wie in Gleichung (3) gezeigt. Auch wird der Bereich der Positionen, der durch i0, i1, i2 und i3 angenommen werden kann, von der Berechnungseinheit 74 für die Suchpositionen erhalten. Insbesondere in dem Fall, wo die Anzahl der Impulse vier ist, wird auf die 13(a) bis 13(d) verwiesen (in den Figuren können die mit Pfeilen versehenen Bereiche angenommen werden und zusätzliche numerische Werte auf Graduierungen stellen relative Werte dar, wenn die Position des Scheitelwerts der Tonhöhe 0 ist).
  • Figure 00410001
  • Wenn die Impulspositionssuchvorrichtung 75 eine Kombination der optimalen Impulspositionen bestimmt, dann wird der Impulstonquellenvektor, der durch die Kombination bereitgestellt wird, an den Multiplizierer 77 übertragen, mit der Verstärkung des Impulscodevektors multipliziert und zu dem Addierer 78 übertragen.
  • Der Addierer 78 addiert eine Komponente des adaptiven Codevektors und eine Komponente eines Impulstonquellenvektors und sendet einen aktivierenden Tonquellenvektor aus.
  • 14 zeigt eine siebente, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich in einer Sprachcodiervorrichtung vom CELP Typ, die einen Aufbau zum Bestimmen einer Impulsamplitude aufweist, bevor ein Impuls gesucht wird. In 14 bezeichnet das Referenzeichen 81 ein adaptives Codebuch, das aus dem Signalpuffer der vergangenen aktivierenden Tonquellensignale aufgebaut ist und einen adaptiven Codevektor an eine Berechnungseinheit 82 für die Position des Scheitelwerts der Tonhöhe und an einen Multiplizierer 88 überträgt; 82 bezeichnet die Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchen des adaptiven Codebuchs erhalten worden ist, und den adaptiven Codevektor, der vom dem adaptiven Codebuch 81 übertragen worden ist, empfängt und der eine Position des Scheitelwerts der Tonhöhe an eine Berechnungseinheit 84 für die Suchposition und eine Berechnungseinheit 87 für die Impulsamplitude überträgt; 83 bezeichnet eine Bestimmungseinheit für die Impulsanzahl, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchen des adaptiven Codebuchs erhalten worden ist, empfängt und die Anzahl der Impulse an die Berechnungseinheit 84 für die Suchposition überträgt, 84 bezeichnet die Berechnungseinheit für die Suchposition, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchen des adaptiven Codebuchs erhalten worden ist, die Anzahl der Impulse, die von der Impulsanzahlbestimmungseinheit 83 übertragen worden ist, und die Position des Scheitelwerts der Tonhöhe, die von der Berechnungseinheit 82 für die Position des Scheitelwerts der Tonhöhe übertragen worden ist, empfängt und die Impulssuchpositionen an eine Impulspositionssuchvorrichtung 85 überträgt, 85 bezeichnet die Impulspositionssuchvorrichtung, die den Tonhöhenzyklus L, der außerhalb mittels Tonhöhenanalyse oder Durchsuchen des adaptiven Codebuchs erhalten worden ist, die Impulssuchpositionen, die von der Berechnungseinheit 84 für die Suchposition übertragen worden sind, und die Impulsamplitude aus der Berechnungseinheit 87 der Impulsamplitude empfängt, eine Kombination von Positionen zum Anheben von Impulsen zur Verwendung in einer Impulstonquelle bestimmt, und die einen Impulstonquellenvektor, der durch die Kombination bereitgestellt wird, an einen Multiplizierer 89 überträgt; 86 bezeichnet einen Addierer, der den von dem Multiplizierer 88 übertragenen adaptiven Codevektor (nach Multiplizieren mit der Verstärkung) subtrahiert von einem Vorhersage-Restsignal, das vom einem linearen Vorhersagerfilter erhalten wird, der wiederum durch eine außerhalb stattfindende LPC Analyse oder LPC Quantisierungseinheit bestimmt ist, und der ein differenzielles Signal an die Berechnungseinheit 87 für die Impulsamplitude überträgt; 87 bezeichnet die Berechnungseinheit für die Impulsamplitude, die das differenzielle Signal von dem Addierer 86 empfängt und Impulsamplitudeninformation an die Impulspositionssuchvorrichtung 85 überträgt; 88 bezeichnet den Multiplizierer, der die Eingabe des adaptiven Codevektors aus dem adaptiven Codebuch 81 multipliziert mit einer Verstärkung für den adaptiven Codevektor und eine Ausgabe an die Addierer 90 und 86 überträgt; 89 bezeichnet den Multiplizierer, der einen Impulstonquellenvektor von der Impulspositionssuchvorrichtung 85 empfängt, diesen mit einer Verstärkung für den Impulstonquellenvektor multipliziert und eine Ausgabe an den Addierer 90 überträgt; und 90 bezeichnet den Addierer, der die Vektoren von den Multiplizierern 88 und 89 addiert und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung vom CELP Typ, die wie vorgenannt aufgebaut ist, wird mit Verweis auf 14 beschrieben. Der adaptive Codevektor aus dem adaptiven Codebuch 81 wird an den Multiplizierer 88 übertragen, mit der Verstärkung für den adaptiven Codevektor multipliziert und an die Addierer 90 und 86 übertragen.
  • Die Berechnungseinheit 82 für die Position des Scheitelwerts der Tonhöhe bestimmt den Scheitelwert der Tonhöhe aus dem adaptiven Codevektor und überträgt seine Position an die Berechnungseinheit 84 für die Suchposition und die Berechnungseinheit 87 für die Impulsamplitude. Die Position des Scheitelwerts der Tonhöhe kann durch Maximalisieren eines inneren Produkts des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors und dem adaptiven Codevektor detektiert (berechnet) werden. Auch kann die Position des Scheitelwerts der Tonhöhe durch Maximalisieren eines inneren Produkts des Vektors, der durch Faltung einer Impulsantwort eines Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektor erhalten wird und dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird, genauer bestimmt werden.
  • Die Bestimmungseinheit 83 für die Impulsanzahl bestimmt die Anzahl der Impulse zur Verwendung in der Impulstonquelle auf der Grundlage des Werts des Tonhöhenzyklus L und überträgt eine Ausgabe für die Suchposition an die Berechnungseinheit 84. Die Beziehung zwischen der Impulsanzahl und dem Tonhöhenzyklus ist durch Statistiken oder Lernen vorbestimmt. Wenn beispielsweise der Tonhöhenzyklus aus 45 Abtastungen oder weniger besteht, werden fünf Impulse bestimmt; wenn der Tonhöhenzyklus in einem Be reich ist, der 45 Abtastungen übersteigt und weniger als 80 Abtastungen ist, werden vier Impulse bestimmt; und wenn der Tonhöhenzyklus 80 Abtastungen oder mehr umfasst, dann werden drei Impulse bestimmt. Auf diese Weise werden in Übereinstimmung mit Bereichen der Tonhöhenzykluswerte entsprechende Anzahlen von Impulsen bestimmt. Wenn die Anzahl der Impulse weiterhin durch Betrachtung einer Veränderung in der Impulsanzahl zwischen aufeinander folgenden Teilrahmen, einer Veränderung in dem Tonhöhenzyklus L und dergleichen bestimmt wird, dann wird die Diskontinuität zwischen aufeinander folgenden Teilrahmen moderiert bzw. abgeschwächt und die Qualität des ansteigenden Bereichs des mit Sprache versehenen Teils kann verbessert werden. Genauer gesagt, wenn in den aufeinander folgenden Teilrahmen die aus dem Tonhöhenzyklus L bestimmte Anzahl der Impulse von fünf auf drei verringert wird, dann kann die Abnahme der Impulsanzahl eine Hysterese aufweisen, fünf Impulse werden auf vier verringert, und nicht steil auf drei. Die Anzahl der Impulse wird so daran gehindert, sich stark zwischen den Teilrahmen zu verändern. Wenn andererseits der Tonhöhenzyklus L sich stark zwischen den aufeinander folgenden Teilrahmen unterscheidet, dann besteht eine große Wahrscheinlichkeit, dass der mit Sprache versehene Bereich ansteigend ist. Daher kann die Sprachqualität durch Verringern der Anzahl der Impulse und Verbessern der Genauigkeit der Impulsposition verbessert werden. Wenn der Tonhöhenzyklus L des vorhergehenden Teilrahmens sich stark vom dem Tonhöhenzyklus L des derzeitigen Teilrahmens unterscheidet, dann wird die Anzahl der Impulse unabhängig von dem Wert des Tonhöhenzyklus L in dem derzeitigen Teilrahmen zu drei bestimmt. Durch dieses oder andere Verfahren wird die Anzahl der Impulse bestimmt. Dann kann die Sprachqualität weiter verbessert werden. Zusätzlich werden die Fälle, wo diese Verfahren eingesetzt werden, leicht bei der Tonhöhenanalyse durch Fehler mit doppelter Tonhöhe, Fehler mit halber Tonhöhe und dergleichen beeinflusst. Daher ist der Einsatz eines Verfahrens zum Bestimmen der Anzahl der Impulse effektiver, um den Einfluss auszugleichen beziehungsweise zu moderieren (beispielsweise Bestimmen der Kontinuität des Tonhöhenzyklus durch Betrachten der Möglichkeit von halber Tonhöhe oder doppelter Tonhöhe oder dergleichen), oder der Anstieg der Genauigkeit der Tonhöhenanalyse so hoch wie möglich, effektiver.
  • Die Berechnungseinheit 84 für die Suchposition bestimmt die Position, in der die Impulssuche ausgeführt wird auf der Grundlage der Position des Scheitelwerts der Tonhöhe und der Anzahl der Impulse. Die Impulssuchpositionen werden in einer solchen Weise verteilt, dass sie in der Nähe des Scheitelwerts der Tonhöhe dicht wird und in anderen Bereichen grob (dies ist wirksam, wenn Bits nicht ausreichend verteilt sind, um alle Abtastpunkte abzusuchen). Genauer gesagt werden in der Nähe der Position des Scheitelwerts der Tonhöhe alle Abtastpunkte der Impulspositionssuche unterworfen. In Bereichen außerhalb der Position des Scheitelwerts der Tonhöhe wird jedoch das Intervall der Impulspositionssuche verbreitert auf, beispielsweise jede zweite Probe oder jede dritte Probe (beispielsweise werden die Suchpositionen bestimmt, wie in den 11(b) und 11(c) gezeigt). Auch wenn eine große Anzahl von Impulsen vorhanden ist, wird die Anzahl der für einen Impuls bereitgestellten Bits verringert. Daher ist das Intervall der groben Bereiche breiter im Vergleich zu dem Fall, wo eine kleine Anzahl von Impulsen besteht (die Genauigkeit der Impulsposition wird grob). Zusätzlich wird, wenn der Tonhöhenzyklus kurz ist, wie in der fünften Ausführungsform beschrieben, der Suchbereich auf einen Bereich begrenzt, der ein wenig länger ist als ein Tonhöhenzyklus des ersten Scheitelwerts der Tonhöhe in dem Teilrahmen. Folglich kann die Sprachqualität verbessert werden.
  • Die Impulspositionssuchvorrichtung 85 bestimmt die optimale Kombination von Positionen, wo Impulse angehoben werden, auf der Grundlage der Suchpositionen, die von der Berechnungseinheit 84 für die Suchpositionen bestimmt worden sind, und der Impulsamplitudeninformation, die von der Berechnungseinheit 87 für die Impulsamplitude bestimmt worden ist, wie später beschrieben wird. In dem Impulssuchverfahren, wie das in "ITU-T STUDY GROUP 15 – CONTRIBUTION 152, "G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXITED LINEAR-PREDICTION(CS-ACELP)", COM 15-152-E Juli 1995" beschrieben ist, wird beispielsweise wenn die Anzahl der Impulse vier beträgt, eine Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass Gleichung (4) maximalisiert wird.
  • Figure 00470001
  • Hierin wird dn(i) (i = 0 bis 79, in dem Fall wo die Länge des Teilrahmens 80 Abtastpunkte beträgt) erhalten durch Faltung der Impulsantwort des Synthesefilters mit einem Zielvektor der Komponente der Impulstonquelle, während rr(i,i) eine Autokorrelationsmatrix der Impulsantwort ist, wie in Gleichung 3 gezeigt. Auch wird der Bereich der Positionen, der durch i0, i1, i2 und i3 angenommen werden kann, von der Berechnungseinheit 84 für die Suchpositionen erhalten. Genauer gesagt, in dem Fall, wo die Anzahl der Impulse 4 ist, siehe 13(a) bis 13(d) (in den Figuren können die mit Pfeilen versehenen Bereiche genommen werden und zusätzlich stellen die numerische Werte auf Graduierungen relative Werte dar, wenn die Position des Scheitelwerts der Tonhöhe Null beträgt). Auch sind a0, a1, a2 und a3 Impulsamplituden, die von der Berechnungseinheit 87 für Impulsamplituden erhalten worden sind.
  • Wenn die Impulspositionssuchvorrichtung 85 eine Kombination der optimalen Impulspositionen bestimmt, wird der durch die Kombination bereitgestellte Impulstonquellenvektor an den Multiplizierer 98 übertragen, mit der Verstärkung für den Impulscodevektor multipliziert und zu dem Addierer 90 übertragen.
  • Der Addierer 86 subtrahiert eine Komponente des adaptiven Codevektors (multipliziert mit der Verstärkung für den adaptiven Codevektor) von dem Restsignal aus der linearen Vorhersage (residualer Vorhersagevektor), der durch externe LPC Analyse erhalten worden ist, und überträgt das differentielle Signal zu der Berechnungseinheit 87 für die Impulsamplituden. Zusätzlich werden in dem Tonquellenbereich der Sprachcodiervorrichtung vom CELP Typ normalerweise die Verstärkung für den adaptiven Codevektor und die Verstärkung für den Rauschcodevektor (entsprechend dem Impulstonquellenvektor in der Erfindung) nach dem das Durchsuchen von sowohl dem adaptiven Codebuch als auch dem Rauschcodebuch (entsprechend der Pulspositions suche in der Erfindung) beendet ist, bestimmt. Daher kann der Vektor, der durch Multiplizieren des adaptiven Codevektors mit der Verstärkung des adaptiven Codevektors erhalten wird, nicht erhalten werden, bevor die Impulspositionssuche abgeschlossen ist. Aus diesem Grund wird die Komponente des adaptiven Codevektors, die zur Subtraktion durch den Addierer 86 verwendet wird, erhalten durch Multiplizieren des adaptiven Codevektors mit der Verstärkung für den adaptiven Codevektor (die nicht die endgültige optimale Verstärkung für den adaptiven Codevektor ist), die aus der Gleichung (5) erhalten wird, zum Zeitpunkt des Durchsuchens des adaptiven Codebuchs.
  • Figure 00490001
  • Hierin ist x(n) ein sogenannter Zielvektor, der erhalten wird durch Entfernen einer Antwort für Nulleingabe aus einem LPC Synthesefilter in dem derzeitigen Teilrahmen von einem Eingabesignal, auf das eine hörbare bzw. auditorische Wichtigkeit (Englisch: Auditory Importance) angewendet worden ist. Auch ist y(n) eine Komponente in einem synthetischen Sprachsignal, das durch den adaptiven Codevektor bereitgestellt ist, und das hier erhalten wird durch Faltung in dem adaptiven Codevektor einer Impulsantwort eines Filters, welches durch Verbinden in einer Kaskade des LPC Synthesefilters in dem derzeitigen Teilrahmen und einem Filter zum Anwenden der auditoruschen Wichtigkeit erhalten wird.
  • Die Berechnungseinheit 87 für die Impulsamplitude verwendet die Position des Scheitelwerts der Tonhöhe, die von der Berechnungseinheit 82 für die Position des Scheitelwerts der Tonhöhe erhalten worden ist, um das differentielle Signal aus dem Addierer 86 in die Nähe der Position des Scheitelwerts der Tonhöhe und die anderen Bereiche zu unterteilen, verwendet einen Mittelwert der Leistungen in den entsprechenden Bereichen oder einen Mittelwert der absoluten Werte der Signalamplitude an den entsprechenden, in den entsprechenden Teilen enthaltenen Abtastpunkten und überträgt jede Amplitude an die Impulspositionssuchvorrichtung 85 als die Impulsamplitude in der Nähe der Position des Scheitelwerts der Tonhöhe oder die Impulsamplitude der anderen Bereiche. In der Impulspositionssuchvorrichtung 85 wird die Gleichung (4) zum Ausführen der Impulspositionssuche ausgewertet, indem verschiedene Amplituden für den Impuls in der Nähe des Scheitelwerts der Tonhöhe und den Impuls in den anderen Bereichen verwendet werden. Der Impulstonquellenvektor, der dargestellt wird durch die Impulsposition, die in der Impulspositionssuche bestimmt worden ist, und die Impulsamplitude, die dem Impuls an der Position zugeordnet worden ist, wird von der Impulspositionssuchvorrichtung 85 übertragen.
  • Der Addierer 90 addiert die Komponente des adaptiven Codevektors und die Komponente des Impulstonquellenvektors, und überträgt den aktivierenden Tonquellenvektor.
  • 15 zeigt eine achte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich in einer Sprachcodiervorrichtung vom CELP Typ, die einen Aufbau aufweist zum Umschalten von für die Impulssuche verwendeten Suchpositionen, auf der Grundlage eines Ergebnisses der Bestimmung der Kontinuität eines Tonhöhenzyklus. In 15 bezeichnet das Referenzzeichen 91 ein adaptives Codebuch, das einen adaptiven Codevektor an eine Berechnungseinheit 92 für die Position des Scheitelwerts der Tonhöhe und an einen Multiplizierer 99 überträgt; 92 bezeichnet die Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, die den adaptiven Codevektor von dem adaptiven Codebuch 91 und den Tonhöhenzyklus L empfängt und eine Position des Scheitelwerts der Tonhöhe in dem adaptiven Codevektor an eine Berechnungseinheit 94 für die Suchposition überträgt; 93 bezeichnet eine Bestimmungseinheit für die Impulsanzahl, die den Tonhöhenzyklus L empfängt und die Anzahl der Impulse einer Impulstonquelle an die Berechnungseinheit 94 für die Suchposition überträgt; 94 bezeichnet die Berechnungseinheit für die Suchposition, die den Tonhöhenzyklus L, die Position des Scheitelwerts der Tonhöhe von der Berechnungseinheit 92 für die Position des Scheitelwerts der Tonhöhe und die Anzahl der Impulse von der Bestimmungseinheit 93 für die Impulsnummer empfängt und die die Positionen für die Impulssuche über einen Schalter 98 an eine Sucheinheit 97 für die Impulsposition überträgt; 95 bezeichnet eine Verzögerungseinheit, die den in den Teilrahmen enthaltenen Tonhöhenzyklus L empfängt, ihn um einen Teilrahmen verzögert und eine Ausgabe an eine Bestimmungseinheit 96 überträgt; 96 bezeichnet die Bestimmungseinheit, die den in dem derzeitigen Teilrahmen vorhandenen Tonhöhenzyklus L und den Tonhöhenzyklus in dem vorausgehenden, von der Verzögerungseinheit 95 übertragenen Teilrahmen empfängt und die das Bestimmungsergebnis der Kontinuität des Tonhöhenzyklus an den Schalter 98 überträgt; 97 bezeichnet die Sucheinheit für die Impulsposition, die die Positionen für die Impulssuche, die über den Schalter 98 von der Berechnungseinheit 94 für die Suchposition übertragen worden ist, oder feste Suchpositionen, die über den Schalter 98 übertragen worden sind, und den Tonhöhenzyklus L, der über den Schalter 98 übertragen worden ist, empfängt, die die Impulsposition unter Verwendung der empfangenen Suchpositionen und des Tonhöhenzyklus L sucht und die einen Impulstonquellenvektor an einen Multiplizierer 100 überträgt; und 98 bezeichnet Zwei-System-Schalter, die miteinander verbunden sind, um auf der Grundlage eines Bestimmungsergebnisses von der Bestimmungseinheit 96 umzuschalten, wobei ein Systemschalter eingesetzt wird zum Umschalten der Positionen für die Impulssuche zum Suchen von Positionen, die von der Berechnungseinheit 94 für die Suchpositionen errechnet worden sind, und auf vorbestimmte, feste Suchpositionen, während der andere Systemschalter für Ein/Aus verwendet wird, um zu bestimmen, ob der Tonhöhenzyklus L zu der Sucheinheit 97 für die Impulspositionen übertragen worden ist oder nicht. Referenzzeichen 99 bezeichnet den Multiplizierer, der die Eingabe des adaptiven Codevektors von dem adaptiven Codebuch 91 multipliziert mit einer Verstärkung für den adaptiven Codevektor und eine Ausgabe an einen Addierer 101 überträgt; 100 bezeichnet den Multiplizierer, der die Eingabe des Impulstonquellenvektors von der Sucheinheit 97 für die Impulsposition multipliziert mit einer Verstärkung für den Impulstonquellenvektor und eine Ausgabe zu dem Addierer 101 überträgt; und 101 bezeichnet den Addierer, der die Vektoren von den Multiplizierern 99 und 100 addiert und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodierungsvorrichtung vom CELP Typ, die wie oben genannt aufgebaut ist, wird mit Verweis auf 15 beschrieben. Das adaptive Codebuch 91 besteht aus dem Puffer für die letzte aktivierende Tonquelle, schneidet den relevanten Keil aus dem Puffer von der aktivierenden Tonquelle auf der Grundlage des Tonhöhenzyklus oder Tonhöhenfortsatz (Englisch: Pitch Lug), die durch externe Tonhöhenanalyse oder Suchmittel für das adaptive Codebuch erhalten worden sind, und überträgt den adaptiven Codevektor an die Berechnungseinheit 92 für die Position des Tonhöhenscheitelwerts und den Multiplizierer 99. Der adaptive Codevektor, der von dem adaptiven Codebuch 91 an den Multiplizierer 99 übertragen worden ist, wird mit der Verstärkung für den adaptiven Codevektor multipliziert und an den Addierer 101 übertragen.
  • Die Berechnungseinheit 92 für die Position des Tonhöhenscheitelwerts detektiert den Scheitelwert der Tonhöhe des adaptiven Codevektors und überträgt seine Position an die Berechnungseinheit 94 für die Suchposition. Die Position des Tonhöhenscheitelwerts kann detektiert (berechnet) werden, indem das innere Produkt des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors und des adaptiven Codevektors maximalisiert wird. Auch kann die Position des Tonhöhenscheitelwerts genauer detektiert werden, indem das innere Produkt des Vektors, der durch Faltung der Impulsantwort des Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektors erhalten wird, und dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird, maximalisiert wird.
  • Die Bestimmungseinheit 93 für die Impulsnummer bzw. Impulsanzahl bestimmt die Anzahl der zu verwendenden Impulse in der Impulstonquelle auf der Grundlage des Werts des Tonhöhenzyklus L und überträgt eine Ausgabe an die Berechnungseinheit 94 für die Suchposition. Die Beziehung zwischen der Anzahl der Impulse und dem Tonhöhenzyklus ist durch Lernen oder durch Statistiken vorbestimmt. Wenn beispielsweise der Tonhöhenzyklus aus 45 Abtastungen oder weniger besteht, werden fünf Impulse bestimmt; wenn der Tonhöhenzyklus in einem Bereich liegt, der 45 Abtastungen übersteigt und weniger als 80 Abtastungen ist, werden vier Impulse bestimmt; und wenn der Tonhöhenzyklus 80 Abtastungen oder mehr umfasst, werden drei Impulse bestimmt. Auf diese Weise werden in Übereinstimmung mit den Bereichen der Werte des Tonhöhenzyklus die entsprechenden Anzahlen der Impulse bestimmt.
  • Die Berechnungseinheit 94 für die Suchposition bestimmt die Position, an der die Impulssuche ausgeführt wird, auf der Grundlage der Position des Tonhöhenscheitelwerts und der Anzahl der Impulse. Die Impulssuchpositionen sind in einer solchen Art und Weise verteilt, dass sie werden in der Nähe des Scheitelwerts der Tonhöhe dicht und in anderen Bereichen grob (dies ist wirksam, wenn Bits nicht ausreichend verteilt bzw. vergeben worden sind, um alle Abtast- bzw. Probenpunkte zu durchsuchen). Insbesondere werden in der Nähe der Position des Scheitelwerts der Tonhöhe alle Abtastpunkte der Suche nach der Impulsposition unterworfen. In Bereichen abseits von der Position des Scheitelwerts der Tonhöhe wird jedoch das Intervall der Impulspositionssuche verbreitert auf beispielsweise jede zweite Probe oder jede dritte Probe (beispielsweise werden die Suchpositionen bestimmt, wie in den 11(b) und 11(c) gezeigt). Auch wenn es eine große Anzahl von Impulsen gibt, wird die Anzahl der einem Impuls anzuweisenden Bits verringert. Daher ist das Intervall der groben Bereiche breiter im Vergleich mit dem Fall, wo es eine kleine Anzahl von Impulsen gibt (die Genauigkeit in der Impulsposition wird grob). Wenn zusätzlich der Tonhöhenzyklus kurz ist, wie in der fünften Ausführungsform beschrieben, wird der Suchbereich nur auf einen Bereich beschränkt, der ein wenig länger ist als ein Tonhöhenzyk lus des ersten Scheitelwerts der Tonhöhe in dem Teilrahmen. Dann kann die Sprachqualität verbessert werden.
  • Die Sucheinheit 97 für die Impulsposition bestimmt die optimale Kombination der Positionen, wo Impulse angehoben werden können, auf der Grundlage der Suchpositionen, die von der Berechnungseinheit 94 für die Suchpositionen bestimmt werden, oder der vorbestimmten, festen Suchpositionen und dem Tonhöhenzyklus L. In dem Impulssuchverfahren, wie in "ITU-T STUDY GROUP 15 – CONTRIBUTION 152," G. 729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E, Juli 1995" beschrieben wird, wenn die Anzahl der Impulse vier beträgt, die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die Gleichung (2) maximalisiert wird.
  • Die Schalter 98 werden auf der Grundlage des Bestimmungsergebnisses der Bestimmungseinheit 96 geschaltet. Die Bestimmungseinheit 96 verwendet den Tonhöhenzyklus L in dem derzeitigen Teilrahmen und den Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen, der von der Verzögerungseinheit 95 übertragen worden ist, um zu bestimmen, ob der Tonhöhenzyklus kontinuierlich ist oder nicht. Wenn insbesondere eine Differenz des Werts des Tonhöhenzyklus in dem derzeitigen Teilrahmen von dem Wert des Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen ein vorbestimmter oder ein berechneter Schwellwert oder weniger ist, dann wird bestimmt, dass der Tonhöhenzyklus kontinuierlich ist. Wenn es bestimmt wird, dass der Tonhöhenzyklus kontinuierlich ist, dann wird der derzeitige Teilrahmen als ein mit Sprache versehener/mit Sprache versehener stationärer Bereich angesehen. Der Schalter 98 verbindet die Berechnungseinheit 94 für die Suchposition mit der Impulspositionssuchvorrichtung 97 und überträgt den Tonhöhenzyklus L an die Impulspositionssuchvorrichtung 97 (ein System des Schalters 98 wird auf die Berechnungseinheit 94 für die Suchposition umgeschaltet, während das andere System sich in einem EIN Zustand befindet, um den Tonhöhenzyklus L an die Impulspositionssuchvorrichtung 97 zu übertragen). Wenn es bestimmt wird, dass der Tonhöhenzyklus nicht kontinuierlich ist (die Differenz zwischen dem Tonhöhenzyklus in dem derzeitigen Teilrahmen und dem Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen übersteigt den Schwellwert), dann wird der derzeitige Teilrahmen als ein nicht mit Sprache versehener/nicht mit Sprache versehener stationärer Bereich angesehen (als ein nicht mit Sprache versehener Bereich/mit ansteigender Sprache versehener Bereich). Der Schalter 98 überträgt die vorbestimmten, festgesetzten Suchpositionen an die Impulssuchvorrichtung 97 und überträgt nicht den Tonhöhenzyklus L an die Impulspositionssuchvorrichtung (ein System des Schalters 98 wird umgeschaltet auf die festgesetzten Suchpositionen, während das andere System sich in einem AUS Zustand befindet, so dass der Tonhöhenzyklus L nicht an die Impulssuchvorrichtung 97 übertragen wird).
  • Wenn die Impulspositionssuchvorrichtung 97 die optimale Kombination der Impulspositionen bestimmt, dann wird der Impulstonquellenvektor, der durch die Kombination hergestellt worden ist, an den Multiplizierer 100 übertragen, mit der Verstärkung für den Impulscodevektor multipliziert und an den Addierer 101 übertragen. Der Addierer 101 addiert die Komponente des adaptiven Codevektors und die Komponente des Impulstonquellenvektors und überträgt den aktivierenden Tonquellenvektor.
  • Zusätzlich zeigt eine in 16 gezeigte Tabelle ein Beispiel von festgesetzten Suchpositionen in 15. In 16(b), in derselben Weise wie die in 13 gezeigten Suchpositionen, wenn acht Positionen für einen Impuls ausgewiesen werden, dann werden die Suchpositionen in einer solchen Weise bestimmt, dass die Suchpositionen gleichförmig in dem gesamten Teilrahmen verstreut sind (anstatt dass sie in der Nähe des Scheitelwerts der Tonhöhe dicht gemacht und in den anderen Bereichen grob bzw. weit voneinander beabstandet gemacht wird, wird die gesamte Dichte gleichförmig gemacht). Auch werden in 16(a) die Suchpositionen, die für jeweils zwei Impulse oder vier Impulse ausgewiesen werden, auf vier Positionen herabgesetzt, jedoch werden vier Arten von Suchpositionen bereitgestellt. Alle Abtastpunkte in dem Teilrahmen werden in einer der Suchpositionsgruppen eingeschlossen (dieselben Anzahlen von Bits zum Darstellen der Impulspositionen werden in den 16(a), 16(b) und 13 verwendet). Wie in 16(b) gezeigt, gibt es in diesem Fall keine Position, die überhaupt nicht durchsucht wird. Daher zeigt 16(a) normalerweise eine bessere Leistungsfähigkeit, selbst wenn dieselbe Anzahl von Bits verwendet wird.
  • Zusätzlich ist in dieser Ausführungsform der Tonquellenerzeugungsbereich der Sprachcodiervorrichtung vom Typ mit variabler Impulsanzahl, der die Bestimmungseinheit 93 für die Impulsanzahl aufweist, beschrieben worden. Selbst bei der Impulsanzahl vom festgesetzten Typ, die keine Bestimmungseinheit 93 für die Impulsanzahl aufweist, werden jedoch die Impulssuchpositionen effektiv umgeschaltet durch Verwenden der Kontinuität des Tonhöhenzyklus. Ebenso wird in dieser Ausführungsform die Kontinuität des Tonhöhenzyklus nur in dem Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und dem derzeitigen Teilrahmen bestimmt. Alternativ kann die Bestimmungsgenauigkeit durch Verwenden des Tonhöhenzyklus des vergangenen Teilrahmens verbessert werden.
  • 17 zeigt eine neunte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich in einer Sprachcodiervorrichtung vom CELP Typ, in der ein zweistufiger Quantisierungsaufbau zum Quantisieren einer Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors) bereitgestellt ist, in der ein Ziel der ersten Stufe eine Tonhöhenverstärkung, die unmittelbar nach dem Durchsuchen des adaptiven Codebuchs berechnet wird, ist und in der Suchpositionen zur Verwendung in der Impulssuche auf der Grundlage der in der ersten Stufe quantisierten Tonhöhenverstärkung umgeschaltet werden. In 17 bezeichnet das Referenzzeichen 111 ein adaptives Codebuch, das eine Ausgabe an die Berechnungseinheit 112 für die Position des Scheitelwerts der Tonhöhe an eine Berechnungseinheit 116 für die Tonhöhenverstärkung und einen Multiplizierer 123 überträgt; 112 bezeichnet die Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, die einen adaptiven Codevektor von dem adaptiven Codebuch 111 und den Tonhöhenzyklus L empfängt und eine Position des Tonhöhenscheitelwerts in dem adaptiven Codevektor an eine Berechnungseinheit 114 für die Suchposition überträgt; 113 bezeichnet eine Bestimmungseinheit für die Impulsanzahl, die den Tonhöhenzyklus L empfängt und die Anzahl der Impulse einer Impulstonquelle an die Berechnungseinheit 114 für die Suchposition überträgt; 114 bezeichnet die Berechnungseinheit für die Suchposition, die den Tonhöhenzyklus L, die Position des Scheitelwerts der Tonhöhe von der Berechnungseinheit 112 für die Position des Tonhöhenscheitelwerts und die Anzahl der Impulse von der Bestimmungseinheit 113 für die Impulsanzahl empfängt und die Impulssuchpositionen über einen Schalter 115 an die Impulspositionssucheinheit 119 überträgt; und 115 bezeichnet zwei Systemumschalter, die zusammen zum Umschalten auf der Grundlage des Bestimmungsergebnisses von einer Bestimmungseinheit 118 verbunden sind, wobei ein Systemschalter zum Umschalten der Impulssuchpositionen auf die Suchpositionen, die von der Berechnungseinheit 114 für die Suchpositionen berechnet worden sind, und auf vorbestimmte, festgesetzte Suchpositionen verwendet wird, während der andere Systemumschalter für Ein/Aus, zum Bestimmen, ob der Tonhöhenzyklus L an die Impulspositionssucheinheit 119 übertragen worden ist oder nicht, verwendet wird. Bezugszeichen 116 bezeichnet die Berechnungseinheit für die Tonhöhenverstärkung, die den adaptiven Codevektor von dem adaptiven Codebuch 111, einen Zielvektor in dem derzeitigen Rahmen und eine Impulsantwort empfängt, und die eine Tonhöhenverstärkung an eine Quantisierungseinheit 117 überträgt; 117 bezeichnet die Quantisierungseinheit, die die von der Berechnungseinheit 116 für die Tonhöhenverstärkung übertragene Tonhöhenverstärkung quantisiert und eine Ausgabe an die Bestimmungseinheit 118 und die Addierer 120 und 122 überträgt; 118 bezeichnet die Bestimmungseinheit, die die in der ersten Stufe quantisierte Tonhöhenverstärkung von der Quantisierungseinheit 117 empfängt und das Bestimmungsergebnis der Tonhöhenperiodizität an den Schalter 115 überträgt; 119 bezeichnet den Impulspositionssucher, der die Impulssuchpositionen, die über den Schalter 115 von der Berechnungseinheit 114 für die Impulspositionsuche oder von den festgesetzten Suchpositionen über den Schalter 115 übertragen worden ist, und den über den Schalter 115 übertragene Tonhöhenzyklus L, die die Impulsposition durch Verwenden der empfangenen Suchpositionen und des Tonhöhenzyklus L sucht und die einen Impulstonquellenvektor an einen Multiplizierer 124 überträgt; 120 bezeichnet den Addierer, der die in der ersten Stufe quantisierte Tonhöhenverstärkung von der Quantisierungseinheit 117 und eine differenziell quantisierte Tonhöhenverstärkung von einer differenziellen Quantisierungseinheit 121 addiert, und der das Additionsergebnis an den Multiplizierer 123 als die optimale, quantisierte Tonhöhenverstärkung (adaptive Codevektorverstärkung) überträgt; 121 bezeichnet die Quantisierungseinheit, die einen Differenzwert von dem Addierer 122 empfängt und den quantisierten Wert an den Addierer 120 überträgt; 122 bezeichnet den Addierer, der den adaptiven Codevektor, die optimale Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors), die außerhalb berechnet worden ist nachdem der Impulstonquellenvektor bestimmt worden ist, und die in der ersten Stufe quantisierte Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors) aus der Quantisierungseinheit 117 empfängt und deren Differenz an die differenzielle Quantisierungseinheit 121 überträgt; 123 bezeichnet den Multiplizierer, der die Eingabe des adaptiven Codevektors aus dem adaptiven Codebuch 111 mit der quantisierten Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors) aus dem Addierer 120 multipliziert, und der eine Ausgabe an einen Addierer 125 überträgt; 124 bezeichnet den Multiplizierer, der die Eingabe des Impulstonquellenvektors aus der Impulspositionssucheinheit 119 mit einer Verstärkung des Impulstonquellenvektors multipliziert, und der eine Ausgabe an den Addierer 125 überträgt; und 125 bezeichnet den Addierer, der die Vektoren von den Multiplizierern 123 und 124 addiert und einen aktivierenden Tonquellenvektor aussendet.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung, die wie oben genannt aufgebaut ist, wird mit Verweis auf 17 beschrieben. Das adaptive Codebuch 111 besteht aus dem Puffer für die vergangenen aktivierenden Tonquellen, schneidet die relevanten Bereiche aus dem Puffer der aktivierenden Tonquelle auf der Grundlage des Tonhöhenzyklus oder dem durch externe Tonhöhenanalyse oder Suchmittel des adaptiven Codebuchs erhaltenen Tonhöhenfortsatz (Englisch: Pitch Lug) aus, und überträgt den adaptiven Codevektor an die Berechnungseinheit 112 für die Position des Tonhöhenscheitelwerts, die Berechnungseinheit 116 für die Tonhöhenverstärkung und den Multiplizierer 123. Der von dem adaptiven Codebuch 111 an den Multiplizierer 123 übertragene adaptive Codevektor wird mit der quantisierten Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors) von dem Addierer 120 multipliziert und zu dem Addierer 125 übertragen.
  • Die Berechnungseinheit 112 für die Position des Tonhöhenscheitelwerts deteltiert den Scheitelwert der Tonhöhe des adaptiven Codevektors und überträgt seine Position an die Berechnungseinheit 114 für die Suchposition. Die Position des Scheitelwerts der Tonhöhe kann bestimmt (berechnet) werden, indem das innere Produkt des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors mit dem adaptiven Codevektor maximalisiert wird. Auch kann die Position des Scheitelwerts der Tonhöhe genauer bestimmt werden, indem das innere Produkt des Vektors maximalisiert wird, der durch Faltung der Impulsantwort des Synthesefilters in dem Tonhöhenzyklus L angeordneten Impulskettenvektor erhalten wird und dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird.
  • Die Bestimmungseinheit 113 für die Impulsanzahl bestimmt die Anzahl der Impulse zur Verwendung in der Impulstonquelle auf der Grundlage des Werts des Tonhöhenzyklus L und überträgt eine Ausgabe an die Berechnungseinheit 114 für die Suchposition. Die Beziehung zwischen der Impulsanzahl und dem Tonhöhenzyklus ist durch Lernen oder Statistiken vorbestimmt. Wenn beispielsweise der Tonhöhen zyklus aus 45 Abtastpunkten oder weniger besteht, werden fünf Impulse bestimmt; wenn der Tonhöhenzyklus ein Bereich ist, der 45 Abtastpunkte überschreitet und weniger als 80 Abtastpunkte ist, dann werden vier Impulse bestimmt; und wenn der Tonhöhenzyklus aus 80 Abtastpunkten oder mehr besteht, dann werden drei Impulse bestimmt. Auf diese Weise werden in Übereinstimmung mit dem Bereich der Werte des Tonhöhenzyklus entsprechende Impulsanzahlen bestimmt.
  • Die Berechnungseinheit 114 für die Suchposition bestimmt die Position, in der die Impulssuche auf der Grundlage der Position des Scheitelwerts der Tonhöhe und der Anzahl der Impulse ausgeführt wird. Die Impulssuchpositionen sind in einer solchen Art und Weise verteilt, dass sie in der Nähe des Tonhöhenscheitelwerts dicht werden und in anderen Bereichen grob bzw. weit voneinander entfernt (dies ist wirksam, wenn Bits nicht ausreichend verteilt worden sind, um alle Abtastpunkte abzusuchen). Insbesondere in der Nähe der Position des Tonhöhenscheitelwerts werden alle Abtastpunkte der Impulspositionssuche unterworfen. In Bereichen außerhalb der Position des Scheitelwerts der Tonhöhe wird jedoch das Intervall der Impulspositionssuche verbreitert auf, beispielsweise jeden zweiten Abtastpunkt oder jeden dritten Abtastpunkt (beispielsweise werden die Suchpositionen bestimmt, wie in den 11(b) und 11(c) gezeigt). Wenn es ferner eine große Anzahl von Impulsen gibt, wird die Anzahl der für einen Impuls ausgewiesen Bits verringert, daher ist das Intervall der groben Bereiche breiter im Vergleich mit dem Fall, wo es eine kleine Anzahl von Impulsen gibt (die Genauigkeit der Impulsposition wird grob bzw. rau). Zusätzlich, wenn der Tonhöhenzyklus kurz ist, wie in der fünften Ausführungsform beschrieben, dann wird der Suchbereich nur auf einen Suchbereich, der ein wenig länger als ein Tonhöhenzyklus ist, begrenzt ab dem ersten Scheitelwert der Tonhöhe in dem Teilrahmen. Dann kann die Sprachqualität verbessert werden.
  • Die Impulspositionssucheinheit 119 bestimmt die optimale Kombination der Positionen, wo Impulse angehoben werden auf der Grundlage der Suchpositionen, die von der Berechnungseinheit 114 für die Suchpositionen oder von den vorbestimmten, festgesetzten Suchpositionen und dem Tonhöhenzyklus L bestimmt worden sind. In dem Impulssuchverfahren, so wie das in "ITU-T STUDY GROUP 15 – CONTRIBUTION 152," G.729 – CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP)", COM 15-152-E Juli 1995" beschrieben worden ist, wenn beispielsweise die Anzahl der Impulse vier beträgt, dann wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die Gleichung (2) maximalisiert wird.
  • Die Schalter 115 werden auf der Grundlage des Bestimmungsergebnisses der Bestimmungseinheit 118 umgeschaltet. Die Bestimmungseinheit 118 benutzt die in der ersten Stufe quantisierte, von der Quantisierungseinheit 117 übertragene Tonhöhenverstärkung, um zu bestimmen, ob der derzeitige Teilrahmen ein Teilrahmen mit einer starken Tonhöhenperiodizität ist oder nicht. Insbesondere, wenn die in der ersten Stufe quantisierte Tonhöhenverstärkung in einem vorbestimmten oder berechneten Bereich ist, dann wird bestimmt, dass die Tonhöhenperiodizität stark ist. Wenn bestimmt wird, dass die Tonhöhenperiodizität stark ist, dann wird der derzeitige Teilrahmen als ein mit Sprache versehener/mit Sprache versehener stationärer Bereich betrachtet. Dann verbindet der Schalter 115 die Berechnungseinheit 114 für die Suchpositionen mit der Impulspositionssucheinheit 119 und überträgt den Tonhöhen zyklus L an die Impulspositionssucheinheit (ein System des Schalters 115 wird auf die Berechnungseinheit 114 für die Suchpositionen umgeschaltet, während das andere System sich in einem EIN Zustand befindet, um den Tonhöhenzyklus L an die Sucheinheit 119 für die Impulsposition zu übertragen). Wenn bestimmt wird, dass der Tonhöhenzyklus nicht kontinuierlich ist (die Differenz zwischen dem Tonhöhenzyklus in dem derzeitigen Teilrahmen und dem Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen übersteigt den Schwellenwert), dann wird der derzeitige Teilrahmen betrachtet als sei er ein mit Sprache versehener/mit Sprache versehener stationärer Bereich (als ein nicht mit Sprache versehener Bereich/mit ansteigender Sprache versehener Bereich). Der Umschalter 115 überträgt die vorbestimmten, festgesetzten Suchpositionen an die Impulssucheinheit 119 und überträgt den Tonhöhenzyklus L nicht an die Sucheinheit für die Impulspositionen (ein System des Umschalters 115 wird auf die festgesetzten Suchpositionen umgeschaltet, während das andere System sich in einem AUS Zustand befindet, so dass der Tonhöhenzyklus L nicht an die Sucheinheit 119 für die Impulspositionen übertragen wird.
  • Wenn die Sucheinheit 119 für die Impulsposition die optimale Kombination der Impulsposition bestimmt, dann wird der durch diese Kombination bereitgestellte Impulstonquellenvektor an den Multiplizierer 124 übertragen, mit der Verstärkung für den Impulscodevektor multipliziert und zu dem Addierer 125 übertragen.
  • Die Berechnungseinheit 116 für die Tonhöhenverstärkung verwendet eine Impulsantwort eines Filters, das erhalten wird, indem ein LPC-Quantisierungssynthesefilter in Kaskade verbunden wird mit dem derzeitigen Teilrahmen und einem Filter zum Anwenden bzw. Aufbringen der höhrbaren Wichtigkeit (Englisch: Auditory Importance), dem Zielvektor und dem adaptiven Codevektor, der von dem adaptiven Codebuch übertragen worden ist, um die Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors) mit der Gleichung (5) zu berechnen. Die berechnete Tonhöhenverstärkung wird durch die Quantisierungseinheit 117 quantisiert und zum Bestimmen der Intensität der Tonhöhenperiodizität an die Bestimmungseinheit 118, die Addierer 120 und 122 übertragen. Nachdem die Suche des Tonquellencodebuchs (die Suche des adaptiven Codebuchs und die Suche des Rauschcodebuchs (das Impulspositionssuchen in dieser Ausführungsform)) beendet ist, wird in dem Addierer 122 eine Differenz zwischen der berechneten, optimalen, quantisierten Tonhöhenverstärkung und der von der Quantisierungseinheit 117 übertragenen, (in der ersten Stufe) quantisierten Tonhöhenverstärkung berechnet, und zu der differenziellen Quantisierungseinheit 121 übertragen. Der Addierer 120 addiert den Differenzwert, der durch die differenzielle Quantisierungseinheit 121 quantisiert wird, an die von der Quantisierungseinheit 117 übertragene, in der ersten Stufe quantisierte Tonhöhenverstärkung, und überträgt die optimalisierte, quantisierte Tonhöhenverstärkung an den Multiplizierer 123.
  • Der Multiplizierer 123 multipliziert den von dem adaptiven Codebuch 111 übertragenen, adaptiven Codevektor, der worden ist, mit der optimalisierten, quantisierten Tonhöhenverstärkung, und überträgt eine Ausgabe an den Addierer 125.
  • Der Addierer 125 addiert eine Komponente des adaptiven Codevektors und eine Komponente des Impulstonquellenvektors und gibt den aktivierenden Tonquellenvektor aus.
  • In dieser Ausführungsform wird zusätzlich, die in der ersten Stufe quantisierte Tonhöhenverstärkung in dem derzeitigen Zeitrahmen verwendet als die Eingabe für die Bestimmungseinheit 118. Wenn jedoch eine allgemeine Verstärkungsquantisierung ausgeführt wird (wenn die in der Ausführungsform beschriebene mehrstufige Quantisierung nicht ausgeführt wird), dann kann die quantisierte Tonhöhenverstärkung (Verstärkung des adaptiven Codevektors) in dem unmittelbar vorausgehenden Teilrahmen als die Eingabe für die Bestimmungseinheit 118 benutzt werden. Ebenfalls ist in dieser Ausführungsform der Tonquellenerzeugungsbereich der Sprachcodiervorrichtung vom Typ mit variabler Pulsanzahl, mit der Bestimmungseinheit für die Impulsanzahl, beschrieben worden. Selbst beim dem bezüglich der Impulsanzahl festgesetzten Typ, der keine Bestimmungseinheit für die Impulsanzahl, werden jedoch die Impulssuchpositionen unter Verwendung des Werts der Tonhöhenverstärkung effektiv umgeschaltet, um die Intensität der Periodizität zu bestimmen.
  • 18 zeigt eine zehnte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung, die eine Phasenkontinuität einer Tonquellen-Signalwellenform zwischen kontinuierlichen Teilrahmen benutzt, um in einem Phasenanpassungsvorgang eines Rauschcodebuchs rückwärts umzuschalten. In 18 bezeichnet das Referenzzeichen 1801 ein adaptives Codebuch, das einen adaptiven Codevektor an eine Berechnungseinheit 1802 für die Position des Tonhöhenscheitelwerts und einen Multiplizierer 1810 überträgt; 1802 bezeichnet die Berechnungseinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 1801 und den Tonhöhenzyklus L empfängt, und eine Position des Tonhöhenscheitelwerts in dem adaptiven Codevektor an eine Verzögerungseinheit 1803, eine Bestimmungseinheit 1806 und eine Berechnungseinheit 1807 für die Suchposition überträgt; 1803 bezeichnet die Verzögerungseinheit, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 1802 der Position des Tonhöhenscheitelwerts empfängt, diese um einen Teilrahmen verzögert und eine Ausgabe an die Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts überträgt; 1804 bezeichnet eine Verzögerungseinheit, die den Tonhöhenzyklus L empfängt, diesen um einen Teilrahmen verzögert und eine Ausgabe an die Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts überträgt; 1805 bezeichnet die Vorhersageeinheit für die Position des Tonhöhenscheitelwerts, die die Position des Tonhöhenscheitelwerts in dem unmittelbar vorausgehenden Teilrahmen von der Verzögerungseinheit 1803, den Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen von der Verzögerungseinheit 1804 und den Tonhöhenzyklus L in dem derzeitigen Teilrahmen empfängt und eine vorhergesagte Position für den Tonhöhenscheitelwert an die Bestimmungseinheit 1806 überträgt; 1806 bezeichnet die Bestimmungseinheit, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 1802 für die Position des Tonhöhenscheitelwerts und die vorhergesagte Position des Tonhöhenscheitelwerts von der Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts empfängt, bestimmt, ob eine Phasenkontinuität zwischen dem unmittelbar vorhergehenden Teilrahmen und dem derzeitigen Teilrahmen besteht oder nicht, und ein Bestimmungsergebnis an einen Vektor von der Impulspositionssucheinheit 1809 durch eine quantisierte Impulstonquellevektorverstärkung überträgt und eine Ausgabe an den Addierer 1811 überträgt; und 1811 bezeichnet den Addierer, der die Vektoren von den Multiplizierern 1810 und 1812 empfängt, die entsprechenden empfangenen Vektoren addiert und einen aktivierenden Tonquellenvektor aussendet.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung, die wie vorgenannt aufgebaut ist, wird mit Verweis auf 18 beschrieben. Das adaptive Codebuch 1801 ist aufgebaut aus dem Puffer für die vergangenen aktivierenden Tonquellen, schneidet die relevanten Bereiche aus dem Puffer der aktivierenden Tonquelle aus auf der Grundlage des Tonhöhenzyklus oder des Tonhöhenansatzes, der extern durch Tonhöhenanalyse oder Suchmittel für das adaptive Codebuch erhalten worden ist, und überträgt den adaptiven Codevektor an die Berechnungseinheit 1802 für die Position des Tonhöhenscheitelwerts und den Multiplizierer 1810. Der von dem adaptiven Codebuch 1801 an den Multiplizierer 1810 übertragene adaptive Codevektor wird multipliziert mit der durch eine externe Verstärkungsquantisierungseinheit quantisierten Verstärkung für den quantisierten adaptiven Codevektor, und überträgt dies an den Addierer 1811.
  • Die Berechnungseinheit 1802 für die Position des Tonhöhenscheitelwerts bestimmt den Tonhöhenscheitelwert des adaptiven Codevektors und überträgt dessen Position an die Verzögerungseinheit 1803, die Bestimmungseinheit 1806 und die Berechnungseinheit 1807 für die Suchposition. Die Position des Scheitelwerts der Tonhöhe kann bestimmt (berechnet) werden durch Maximalisieren einer normalisierten Korrelationsfunktion des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors und des adaptiven Codevektors. Ebenfalls kann die Position des Tonhöhenscheitelwerts genauer detektiert werden, in dem die normalisierte Korrelationsfunktion des Vektors maximalisiert wird, der durch Faltung der Impulsantwort des Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektor erhalten wird und dem Vektor, der durch Falten der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird. Ferner kann durch Anwenden einer Nachbearbeitung, bei der eine Position mit einem maximalen Amplitudenwert in einer Tonhöhenzyklus-Wellenform, die die detektierte Position des Tonhöhenscheitelwerts enthält, als der Tonhöhenscheitelwert benutzt werden, verhindert werden, dass ein zweiter Scheitelwert in einer Tonhöhenzykluswellenform infolge eines Fehlers detektiert zu werden.
  • Die Verzögerungseinheit 1803 verzögert die für die Position des Tonhöhenzyklus berechnete Position des Tonhöhenzyklus von der Berechnungseinheit 1802 um einen Teilrahmen und überträgt eine Ausgabe an die Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts. Insbesondere wird die Position des Tonhöhenscheitelwerts in dem unmittelbar vorhergehenden Teilrahmen aus der Verzögerungseinheit 1803 an die Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts übertragen. Die Verzögerungseinheit 1804 verzögert den Tonhöhenzyklus L um einen Teilrahmen und überträgt eine Ausgabe an die Berechnungseinheit 1805 für die Position des Tonhöhenscheitelwerts. Insbesondere wird der Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen von der Verzögerungseinheit 1804 an die Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts übertragen.
  • Die Vorhersageeinheit 1805 für die Position des Tonhöhenscheitelwerts empfängt die Position des Tonhöhenscheitelwerts in dem unmittelbar vorhergehenden Teilrahmen aus der Verzögerungseinheit 1803, den Tonhöhenscheitelwert aus dem unmittelbar vorhergehenden Teilrahmen aus der Verzögerungseinheit 1804 und aus dem Tonhöhenzyklus L in dem derzeitigen Teilrahmen, sagt die Position des Tonhöhenscheitelwerts in dem derzeitigen Teilrahmen voraus und überträgt die vorhergesagte Position des Tonhöhenscheitelwerts an die Bestimmungseinheit 1806. Die vorhergesag ten Positionen für den Tonhöhenschwellenwert werden mit Gleichung (6) erhalten (es sei verwiesen auf 19). ϕ(N) = ϕ(N – 1) + n × T(N – 1) + T(N) – L, n = INT((L – ϕ(N – 1))/T(N – 1)) (6)
  • In der obigen Gleichung stellt ϕ(k) die erste Position des Tonhöhenscheitelwerts in dem k-ten Teilrahmen dar, während der Beginn des Teilrahmens Null ist, T(k) stellt den Tonhöhenzyklus eines Tonquellen(sprach)signals in dem k-ten Teilrahmen dar, und L stellt eine Teilrahmenlänge dar. Auch ist n ein ganzzahliger Wert, der darstellt, wie viele Tonhöhenzykluslängen zwischen der ersten Position des Tonhöhenscheitelwerts (ϕ(k)) in dem k-ten Teilrahmen und dem letzten des k-ten Teilrahmens (mit abgeschnittenen Dezimalstellen) (k = 0, 1, 2, ...) enthalten sind.
  • Die Bestimmungseinheit 1806 empfängt die Position des Scheitelwerts der Tonhöhe von der Berechnungseinheit 1802 für die Position des Tonhöhenscheitelwerts und die vorhergesagte Position des Tonhöhenscheitelwerts von der Vorhersagevorrichtung 1805 für die Position des Tonhöhenscheitelwerts. Wenn die Position des Scheitelwerts der Tonhöhe nicht stark von der vorhergesagten Position des Scheitelwerts der Tonhöhe abweicht, dann wird bestimmt, dass die Phase kontinuierlich ist. Wenn die Position des Scheitelwerts der Tonhöhe stark verschieden ist von der vorhergesagten Position des Scheitelwerts der Tonhöhe, dann wird bestimmt, dass die Phase nicht kontinuierlich ist. Dann wird das Bestimmungsergebnis an den Umschalter 1808 übertragen. Ferner, wenn die Position des Scheitelwerts der Tonhöhe mit der vorhergesagten Position des Scheitelwerts der Tonhöhe verglichen wird, dann kann die Position des Scheitelwerts der Tonhöhe oder die vorhergesagte Position des Scheitelwerts der Tonhöhe in der Nähe der Grenze des Teilrahmens bestehen. In diesem Fall wird, auch unter Berücksichtigung einer Möglichkeit, dass die Position einen Tonhöhenzyklus später mit der Position des Scheitelwerts der Tonhöhe korrespondiert, der Vergleich der Position des Scheitelwerts der Tonhöhe und der vorhergesagten Position des Scheitelwerts der Tonhöhe ausgeführt, um die Phasenkontinuität zu bestimmen.
  • Die Berechnungseinheit 1807 für die Suchposition bestimmt die Suchpositionen für den Tonquellenimpuls auf der Grundlage der Position des Scheitelwerts der Tonhöhe und überträgt die Suchpositionen über den Umschalter 1808 an die Suchvorrichtung 1809 für die Impulsposition. Die Suchpositionen werden, wie beispielsweise in der sechsten Ausführungsform oder der achten Ausführungsform beschrieben, in einer solchen Art und Weise bestimmt, dass die Suchpositionen in der Nähe des Scheitelwerts der Tonhöhe dicht und in den anderen Bereichen weit bzw. grob verteilt sind. Zusätzlich wird die Verwendung der Tonhöhenzyklus-Information zum Verändern der Anzahl der Tonquellenimpulse oder zum Begrenzen des Suchbereichs für die Tonquellenimpulse ebenfalls effektiv ausgeführt.
  • Der Umschalter 1808 schaltet um, ob die Tonquellen-Impulssuche vom phasenadaptiven Typ auf der Grundlage des Bestimmungsergebnisses der Bestimmungseinheit 1806 auszuführen ist oder ob die Tonquellen-Impulssuche unter Verwendung der festgesetzten Position (oder der allgemeinen Durchsuchung des Rauschcodebuchs) auszuführen ist. Wenn insbesondere das Bestimmungsergebnis der Bestimmungseinheit 1806 andeutet, dass "Phasenkontinuität besteht", dann wird die Berechnungseinheit 1807 für die Suchposition mit der Sucheinheit 1809 für die Impulsposition verbunden. Dann werden die von der Berechnungseinheit 1807 für die Suchpositionen berechneten Tonquellenimpuls- Suchpositionen an die Sucheinheit 1809 für die Impulsposition übertragen (insbesondere wird die Tonquellen-Impulssuche vom phasenadaptiven Typ ausgeführt). Wenn umgekehrt das Bestimmungsergebnis der Bestimmungseinheit 1806 andeutet, dass "keine Phasenkontinuität besteht", dann wird der Umschalter umgeschaltet, um die festgesetzten Suchpositionen an die Sucheinheit 1809 für die Impulssuche zu übertragen (wenn der Schalter auf die allgemeine Durchsuchung des Rauschcodebuchs umgeschaltet wird, dann wird eine Suchvorrichtung für das Rauschcodebuch bereitgestellt, die so aufgebaut ist, dass sie auf die Sucheinheit 1809 für die Impulsposition) umgeschaltet werden kann.
  • Die Sucheinheit 1809 für die Impulsposition bestimmt die optimale Kombination der Positionen, wo Pulse angehoben werden unter Verwendung der von der Berechnungseinheit 1807 für die Suchpositionen bestimmten Suchpositionen der Tonquellenimpulse oder der getrennt übertragenen, vorbestimmten, festgesetzten Suchpositionen und dem Tonhöhenzyklus L. In den Impulssuchverfahren, wie das in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" beschrieben ist, wenn beispielsweise die Anzahl der Impulse vier beträgt, dann wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird die Polarität von jedem Tonquellenimpuls zu dieser Zeit vorherbestimmt, bevor die Impulspositionssuche in einer solchen Weise ausgeführt wird, dass die Polarität gleich der Polarität in jeder Position des Zielvektors einer Rauschcodebuchkomponente wird, d.h., ein Signalvektor, der durch Subtrahieren eines Antwortsignals eines Synthesefilters für eine Nulleingabe von einer Eingabesprache mit darauf angewendeter auditorischer Wichtigkeit zum Aufbringen der auditorischen Wichtigkeit erhalten wird, und eines Signals einer Komponente des adaptiven Codebuchs. Auch wenn der Tonhöhenzyklus kürzer ist als die Länge des Teilrahmens, wie in der fünften Ausführungsform beschrieben, dann werden Tonquellenimpulse in eine Kette von Tonhöhenzyklus-Impulsen, und nicht Impulsen, umgewandelt unter Verwendung eines Tonhöhenzyklen herstellenden Filters. In dem vorgenannten Vorgang des Herstellens einer Tonhöhenzyklusunterteilung wird der Impulsantwortvektor des die auditorische Wichtigkeit aufbringenden Synthesefilters vorher durch die Unterteilung in Tonhöhenzyklen aufbringende Filter hindurchgeleitet. Dann werden in der gleichen Art und Weise wie in dem Fall, wo die Unterteilung in Tonhöhenzyklus nicht ausgeführt wird, die Tonquellenimpulse durch Maximalisieren der Gleichung (2) gesucht. In den auf diese Weise bestimmten, entsprechenden Impulspositionen der Tonquelle werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Anschließend kann unter Verwendung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklus unterteilenden Filters der Impulstonquellenvektor bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 1812 übertragen. Der von der Sucheinheit 1809 der Impulsposition an den Multiplizierer 1812 übertragene Impulstonquellenvektor wird multipliziert mit der quantisierten Verstärkung des Impulstonquellenvektors, die von der externen Verstärkungsquantisierungseinheit quantisiert worden ist, und zu dem Addierer 1811 übertragen.
  • Der Addierer 1811 führt eine Vektoraddition einer Komponente des adaptiven Codevektors von dem Multiplizierer 1810 und einer Komponente der Impulstonquellen von dem Multiplizierer 1812 aus, und gibt den aktivieren Tonquellenvektor aus.
  • Zusätzlich tritt in den von den mit Sprache versehenen, stationären, verschiedenen Bereichen leicht ein Zustand auf, bei dem die festgesetzten Suchpositionen in der Sprachcodiervorrichtung nach der Erfindung weiterhin ausgewählt werden können. Wenn sich daher der Einfluss eines Fehler in der Übertragungsleitung ausbreitet beziehungsweise fortpflanzt, dann kann der Effekt des Zurücksetzens erhalten werden. (In dem Fall, wo die Impulsposition in der relativen Position dargestellt ist, während die Position des Scheitelwerts der Tonhöhe Null ist, dann wird, wenn einmal ein Fehler der Übertragungsleitung auftritt, der Inhalt des adaptiven Codebuchs auf der Seite einer Codiervorrichtung stark verschieden von derjenigen auf der Seite eines Decodierers. Dann tritt in einigen Fällen, selbst wenn keine Übertragungsleitungsfehler in nachfolgenden Rahmen beziehungsweise Datenrahmen auftreten, ein Phänomen auf, bei dem die Position des Scheitelwerts der Tonhöhe in dem Kodierer weiterhin nicht mit dem in dem Dekodierer übereinstimmt. Der Einfluss des Fehlers wird so verlängert.
  • Auch für die Art und Weise zum Anheben der Impulse wird in dem Suchbereich die vorbestimmte Anzahl der Impulse, beispielsweise vier Impulse, angehoben, beispielsweise in jedem von 32 Plätzen. In diesem Fall wird, wie oben genannt, neben dem Verfahren zum Durchsuchen aller Kombinationen (8 × 8 × 8 × 8 Möglichkeiten) in einer solchen Weise, dass die 32 Plätze in vier unterteilt werden und ein Platz aus den acht Plätzen bestimmt wird, in dem ein Impuls angewiesen bzw. bereitgestellt wird, so bestehen ein Verfahren zum Durchsuchen aller Kombinationen zum Auswählen von vier Plätzen aus den 32 Plätzen und andere Ver fahren. Zusätzlich kann, neben der Kombination von Impulsen mit einer Amplitude 1, eine Kombination von mehreren Impulsen, beispielsweise zwei Impulse oder ein paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben werden.
  • 20 zeigt eine elfte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung vom CELP Type, die bestimmt, ob eine starke Impulseigenschaft in der Konfiguration eines adaptiven Codevektors besteht oder nicht, um umzuschalten, ob ein Phasenanpassungsvorgang ausgeführt wird oder nicht. In 20 bezeichnet das Referenzzeichen 2001 ein adaptives Codebuch, das einen adaptiven Codevektor an eine Berechnungseinheit 2002 für die Position des Tonhöhenscheitelwerts, eine Bestimmungseinheit 2003 für Impulseigenschaften und einen Multiplizierer 2007 überträgt; 2002 bezeichnet die Berechnungseinheit für die Position des Scheitelwerts der Tonhöhe, die den adaptiven Codevektor von dem adaptiven Codebuch 2001 und den Tonhöhenzyklus L empfängt und eine Position des Tonhöhenscheitelwerts in dem adaptiven Codevektor an die Bestimmungseinheit 2003 für die Impulseigenschaft und eine Berechnungseinheit 2004 für die Suchposition überträgt; 2003 bezeichnet die Bestimmungseinheit für die Impulseigenschaft, die den adaptiven Codevektor von dem adaptiven Codebuch 2001, die Position des Scheitelwerts der Tonhöhe von der Berechnungseinheit 2002 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L von extern empfängt, bestimmt, ob in dem adaptiven Codevektor eine gute Impulseigenschaft übersteht oder nicht, und ein Bestimmungsergebnis zu einem Umschalter 2005 überträgt; 2004 bezeichnet die Berechnungseinheit für die Suchposition, die den Tonhöhenzyklus L von extern und die Positi on des Tonhöhenscheitelwerts von der Berechnungseinheit 2002 für die Position des Tonhöhenscheitelwerts empfängt und Suchpositionen für die Tonquellenimpulse über den Schalter 2005 zu einer Suchvorrichtung 2006 für Impulspositionen überträgt; und 2005 bezeichnet den Umschalter, der auf der Grundlage des Bestimmungsergebnisses der Bestimmungseinheit 2003 für die Impulseigenschaft umgeschaltet wird und der zum Umschalten zwischen den von der Berechnungseinheit 2004 für die Suchpositionen übertragenen Suchpositionen und den vorbestimmten, festen Suchpositionen verwendet wird. Das Referenzzeichen 2006 bezeichnet die Sucheinheit für die Impulspositionen, die die von der Berechnungseinheit 2004 für die Suchpositionen berechneten Suchpositionen der Tonquellenimpulse von dem Umschalter 2005 oder die über den Schalter 2005 übertragenen, festgesetzten Suchpositionen, und den Tonhöhenzyklus L von extern empfängt, die die empfangenen Suchpositionen der Tonquellenimpulse und den Tonhöhenzyklus L benutzt, um die Position des Tonquellenimpulses zu suchen, und die einen Impulstonquellenvektor an einen Multiplizierer 2009 überträgt; 2007 bezeichnet den Multiplizierer, der die Eingabe eines adaptiven Codevektors aus dem adaptiven Codebuch 2001 multipliziert mit einer quantisierten Verstärkung für den adaptiven Codevektor und der eine Ausgabe an einen Addierer 2008 überträgt; 2009 bezeichnet den Multiplizierer, der die Eingabe des Impulstonquellenvektors von der Sucheinheit 2006 für die Impulsposition multipliziert mit einer quantisierten Verstärkung für den Impulstonquellenvektor und der eine Ausgabe an den Addierer 2008 überträgt; und 2008 bezeichnet den Addierer, der den Vektor von den Multiplizierern 2007 und 2009 empfängt, die entsprechenden empfangenen Vektoren addiert, und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung, die wie oben beschrieben aufgebaut ist, wird mit Verweis auf 20 beschrieben. Das adaptive Codebuch 2001 ist aus dem Puffer für vergangene aktivierende Tonquellen aufgebaut, schneidet die relevanten Bereiche aus dem Puffer der aktivierenden Tonquelle aus auf der Grundlage des Tonhöhenzyklus oder des Tonhöhenansatzes, der durch externe Tonhöhenanalyse oder Suchmittel für das adaptive Codebuch erhalten worden ist, und überträgt den adaptiven Codevektor an die Berechnungseinheit 2002 für die Position des Tonhöhenscheitelwerts, die Bestimmungseinheit 2003 für die Impulseigenschaft und den Multiplizierer 2007. Der von dem adaptiven Codebuch 2001 an den Multiplizierer 2007 übertragene, adaptive Codevektor wird multipliziert mit der quantisierten Verstärkung für den adaptiven Codevektor, die durch eine externe Verstärkungsquantisierungseinheit quantisiert worden ist, und zu dem Addierer 2008 übertragen.
  • Die Berechnungseinheit 2002 für die Position des Scheitelwerts der Tonhöhe detektiert den Scheitelwert der Tonhöhe aus dem adaptiven Codevektor und überträgt seine Position an die Impulsbestimmungseinheit 2003 und die Berechnungseinheit 2004 für die Suchposition. Die Position des Tonhöhenscheitelwerts kann detektiert (berechnet) werden durch Maximalisieren einer normalisierten Korrelationsfunktion des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors und des adaptiven Codevektors. Auch kann die Position des Scheitelwerts der Tonhöhe noch genauer detektiert werden durch Maximalisieren der normalisierten Korrelationsfunktion des Vektors, der durch Faltung der Impulsantwort des Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektors erhalten wird, mit dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird. Ferner kann durch Anwenden einer Nachverarbeitung, bei der eine Position mit einem maximalen Amplitudenwert in einer Wellenform des Tonhöhenzyklus, die die detektierte Position des Tonhöhenscheitelwerts enthält, als der Scheitelwert der Tonhöhe benutzt werden, verhindert werden, dass ein zweiter Scheitelwert in einer Wellenform des Tonhöhenzyklus fälschlicherweise detektiert wird.
  • Die Bestimmungseinheit 2003 für die Impulseigenschaft bestimmt, ob die Signalleistung des adaptiven Codevektors in der Nähe des von der Berechnungseinheit 2002 für die Position des Tonhöhenscheitelwerts berechneten Position des Scheitelwerts der Tonhöhe konzentriert ist oder nicht. Wenn die Signalleistung konzentriert ist, dann wird das Bestimmungsergebnis "Es gibt eine Impulseigenschaft" an den Schalter 2005 übertragen. Wenn die Konzentration der Signalleistung nicht gefunden wird, dann wird das Bestimmungsergebnis "Es gibt keine Impulseigenschaft" an den Schalter 2005 übertragen. Als ein Verfahren zum Erkennen, ob die Signalleistung konzentriert ist oder nicht, wird beispielsweise das folgende Verfahren eingesetzt. Zuerst wird der adaptive Codevektor, der eine Länge des Tonhöhenzyklus aufweist, in der die Position des Scheitelwerts der Tonhöhe enthalten ist, ausgeschnitten. Dann wird die Leistung des gesamten ausgeschnittenen Signals berechnet und als PW0 verwendet. Anschließend wird der adaptive Codevektor eine halbe bis zu einem Drittel der Länge der Tonhöhe in der Nähe der Position des Scheitelwerts der Tonhöhe ausgeschnitten. Dann wird die ausgeschnittene Signalleistung berechnet und als PW1 benutzt. Wenn ein Wert von PW1/PW0 ein vorherbestimmter Wert (beispielsweise etwa 0,5 bis 0,6) oder mehr ist, dann ist die Signalleistung in der Nähe des Scheitelwerts der Tonhöhe konzentriert. Daher kann bestimmt werden, dass die Impulseigenschaft hoch ist. Alternativ wird in einem anderen Bestimmungsverfahren der adaptive Codevektor durch den in einem Intervall des Tonhöhenzyklus, indem der erste Impuls in der Position des Scheitelwerts der Tonhöhe angehoben ist, angeordneten Impulskettenvektor angenähert. In diesem Fall wird ein Fehler beziehungsweise eine Abweichung zwischen dem Impulskettenvektor und dem adaptiven Codevektor verwendet. Ferner wird die Position des Scheitelwerts der Tonhöhe erhalten durch Maximalisieren der normalisierten Korrelationsfunktion des Vektors, der durch Faltung der Impulsantwort des Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektors erhalten wird, und dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird. In diesem Falle wird in dem Bestimmungsverfahren ein Fehler bzw. eine Abweichung benutzt zwischen dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektor erhalten wird, und dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird. Als ein Mittel zum Auswerten der Abweichung zwischen diesen Vektoren werden folgende benutzt: eine Vorhersageverstärkung, wie in Gleichung (7) gezeigt, die normalisierte Korrelationsfunktion, die in Gleichung (8) gezeigt ist, und dergleichen. In den Gleichungen (7) und (8), ist x(n) der adaptive Codevektor oder der Vektor der durch Faltung in dem adaptiven Codevektor mit der Impulsantwort des Synthesefilters erhalten wird, wohingegen y(n) der Impulskettenvektor ist oder der Vektor, der durch Faltung des Impulskettenvektors der Impulsantwort des Synthesefilters erhalten wird. In beiden Gleichungen gilt, dass wenn ein Wert beispielsweise 0,3 bis 0,4 oder mehr ist, eine Impulseigenschaft, die zu einem gewissen Grade stark ist, als in den adaptiven Codevektor bestehend angesehen wird.
  • Figure 00800001
  • Die Berechnungseinheit 2004 für die Suchposition bestimmt die Suchpositionen des Tonquellenimpulses auf der Grundlage der Position des Scheitelwerts der Tonhöhe und überträgt die Suchpositionen über den Umschalter 2005 an die Sucheinheit 2006 für die Impulsposition. Die Suchpositionen werden in einer solchen Art und Weise bestimmt, wie beispielweise in der sechsten Ausführungsform oder der achten Ausführungsform beschrieben,, dass die Suchpositionen in der Nähe des Scheitelwerts der Tonhöhe dicht und in den anderen Bereichen grob beziehungsweise weit voneinander entfernt verteilt sind. Zusätzlich wird, wie das in der sechsten Ausführungsform oder der achten Ausführungsform beschrieben ist, die Verwendung der Tonhöhenzyklus-Information zum Verändern der Anzahl der Tonquellenimpulse oder zum Begrenzen des Suchbereichs der Tonquellenimpulse effektiv ausgeführt.
  • Der Umschalter 2005 schaltet um, ob die Tonquellen-Impulssuche von phasenadaptiven Typ auf der Grundlage des Bestimmungsergebnisses der Bestimmungseinheit 2003 für die Impulseigenschaft ausgeführt wird oder ob die Tonquellenimpulssuche unter Verwendung der festgesetzten Position ausgeführt wird. Insbesondere wenn das Bestimmungsergebnis der Bestimmungseinheit 2003 für die Impulseigenschaft andeutet, dass "eine Impulseigenschaft besteht", dann wird die Berechnungseinheit 2004 für die Suchposition mit der Sucheinheit 2006 für die Impulsposition verbunden. Dann werden die Suchpositionen der Tonquellenimpulse, die von der Berechnungseinheit 2004 für die Suchposition berechnet worden sind, an die Sucheinheit 2006 für die Impulsposition übertragen (insbesondere wird die Tonquellenimpulssuche vom phasenadaptiven Typ ausgeführt). Wenn umgekehrt das Bestimmungsergebnis der Bestimmungseinheit 2003 der Impulseigenschaft andeutet, dass "keine Impulseigenschaft besteht", dann wird der Umschalter umgeschaltet, um die festgesetzten Suchpositionen an die Sucheinheit 2006 für die Impulsposition zu übertragen.
  • Die Sucheinheit 2006 für die Impulsposition bestimmt die optimale Kombination der Positionen, wo Impulse angehoben werden unter Verwendung der Tonquellenimpuls-Suchpositionen, die von der Berechnungseinheit 2004 für die Suchposition oder den vorbestimmten, festgesetzten Suchpositionen und den getrennt übertragenen Tonhöhenzyklus L bestimmt worden sind. In dem Impulssuchverfahren, wie das in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-code-Excited Linear-Prediction (CS-ACELP), März 1996", beschrieben ist, wenn beispielsweise die Anzahl der Impulse vier beträgt, wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird zu diesem Zeitpunkt die Polarität von jedem Tonquellenimpuls in einer solchen Art und Weise vorherbe stimmt, bevor die Impulspositionssuche ausgeführt wird, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einer Rauschcodebuch-Komponente, d.h. einem Signalvektor, der erhalten wird durch Subtrahieren eines Antwortsignals eines Synthesefilters für eine Nulleingabe von einer eingegebenen beziehungsweise Eingabe-Sprache mit darauf angewendeter bzw. aufgebrachter auditorischer Wichtigkeit, um die auditorische Wichtigkeit und ein Signal einer Komponente des adaptiven Codebuchs anzuwenden. Ferner, wenn der Tonhöhenzyklus kürzer ist als die Länge der Teilrahmen, wie das in der fünften Ausführungsform beschreiben ist, dann werden die Tonquellenimpulse unter Verwendung eines in Tonhöhenzyklen unterteilenden Filters in eine Kette von Impulsen des Tonhöhenzyklus umgewandelt, und nicht in Impulse. In dem vorgenannten Vorgang des Unterteilens in Tonhöhenzyklen wird der Impulsantwortvektor des die auditorische Wichtigkeit aufbringenden Synthesefilters vorher durch den in Tonhöhenzyklen unterteilenden Filter hindurch geleitet. Dann kann die Impulstonquelle durch Maximalisieren der Gleichung (2) in der gleichen Art und Weise gesucht werden, wie in dem Fall, wo die Unterteilung in Tonhöhenzyklen nicht ausgeführt wird. In den auf diese Weise bestimmten, entsprechenden Tonquellenimpulspositionen werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Anschließend kann der Impulstonquellenvektor durch Verwendung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 2009 übertragen. Der von der Impulspositions-Sucheinheit 2006 an den Multiplizierer 2009 übertragene Impulstonquellenvektor wird multipliziert mit der quantisierten Verstärkung für den Impulstonquellenvektor, die durch die externe Verstärkungsquantisierungseinheit quantisiert worden ist, und an den Addierer 2008 übertragen.
  • Der Addierer 2008 führt eine Vektoraddition von einer Komponente des adaptiven Codevektor aus dem Multiplizierer 2007 und einer Komponente des Impulstonquellenvektors aus dem Multiplizierer 2009 aus, und gibt den aktivierenden Tonquellenvektor aus.
  • Zusätzlich taucht in der Sprachcodiervorrichtung nach der Erfindung in den von dem mit Sprache versehenden stationären Bereich verschiedenen Bereichen leicht eine Bedingung auf, bei der die festgesetzten Suchpositionen weiterhin ausgewählt werden. Wenn sich daher der Einfluss eines Fehlers in der Übertragungsleitung fortpflanzt, kann der Effekt des Zurücksetzens erhalten werden. (In dem Fall, wo die Impulspositionen in der relativen Position dargestellt werden, während die Position des Scheitelwerts der Tonhöhe Null ist, unterscheidet sich der Inhalt des adaptiven Codebuchs auf der Seite eines Codierers stark von dem auf der Seite eines Decodierers, wenn einmal ein Fehler in der Übertragungsleitung auftaucht. Selbst wenn kein Übertragungsleitungsfehler in nachfolgenden Datenrahmen auftaucht, taucht dann in einigen Fällen ein Phänomen auf, bei dem die Position des Scheitelwerts der Tonhöhe in dem Codierer weiterhin nicht mit der des Decodierers übereinstimmt. Der Einfluss des Fehlers beziehungsweise der Abweichung wird so verlängert.
  • Auch wird für die Art und Weise zum Anheben der Impulse die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse, in dem Suchbereich angehoben, beispielsweise jeder von 32 Plätzen. In diesem Fall bestehen, wie oben genannt, neben dem Verfahren zum Suchen aller Kombinationen (8 × 8 × 8 × 8 Möglichkeiten) in einer solchen Weise, dass die 32 Plätze in vier unterteilt werden und ein Platz aus den acht Plätzen bestimmt wird, indem ein Impuls bereitgestellt wird, auch ein Verfahren zum Suchen aller Kombinationen zum Auswählen von vier Plätzen aus den 32 Plätzen und andere Verfahren. Zusätzlich können neben der Kombination von Impulsen mit einer Amplitude 1 auch eine Kombination von mehreren Impulsen, beispielsweise zwei Impulse oder einpaar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben werden.
  • 21 zeigt eine zwölfte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich auf einer Codiererseite einer Sprachcodiervorrichtung vom CELP Typ, die mit einem Indexaktualisierungsmittel zum Aktualisieren von Indizes von Impulssuchpositionen versehen ist, und die einen Suchbereich für Impulspositionen in Übereinstimmung mit einem Tonhöhenzyklus und einer Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors bestimmt. Insbesondere wird in der Sprachcodiervorrichtung vom CELP Typ, die eine Tonquellenimpulssuche in Positionen in Bezug auf die Position des Scheitelwerts der Tonhöhe, durch Indizieren von Impulspositionen in der Reihenfolge vom Anfang eines Teilrahmens ausführt, verhindert, dass sich der in einigen Datenrahmen auftretenden Einfluss eines Übertragungsleitungsfehlers, daran gehindert, sich in nachfolgende Datenrahmen ohne einen Übertragungsleitungsfehler ausbreitet. Ein derartiger Tonquellenerzeugungsbereich wird gezeigt.
  • In 21 bezeichnet das Referenzzeichen 2101 ein adaptives Codebuch, das den letzten bzw. vorhergehenden, aktivierenden Tonquellenvektor speichert, und überträgt einen ausgewählten adaptiven Codevektor an eine Berech nungseinheit 2102 für die Position des Tonhöhenscheitelwerts und einen Multiplizierer 2106 für die Tonhöhenverstärkung; 2102 bezeichnet die Berechnungseinheit für die Positionen des Scheitelwerts der Tonhöhe, die den adaptiven Codevektor aus dem adaptiven Codebuch 2101 und dem Tonhöhenzyklus L empfängt, eine Position des Scheitelwerts der Tonhöhe berechnet und eine Ausgabe an die Berechnungseinheit 2103 für die Suchposition überträgt; 2103 bezeichnet die Berechnungseinheit für die Suchposition, die die Position des Scheitelwerts der Tonhöhe von der Berechnungseinheit 2102 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L empfängt, einen Suchbereich der Impulstonquelle berechnet und eine Ausgabe an ein Indexaktualisierungsmittel 2104 überträgt; 2104 bezeichnet das Indexaktualisierungsmittel, das einen Index von jeder von der Berechnungseinheit 2103 für die Suchposition übertragenen Impulsposition der Tonquelle aktualisiert und eine Ausgabe an die Impulspositionssuchvorrichtung 2105 überträgt; 2105 bezeichnet eine Suchvorrichtung für die Impulsposition, die Suchpositionen (mit den für die Impulspositionen indikativen, aktualisierten Indizes) von dem Indexaktualisierungsmittel 2104 und den außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L empfängt, die Impulstonquelle sucht, einen Impulstonquellenvektor an einen Multiplizierer 2107 für die Impulstonquellenverstärkung überträgt und den für den Impulstonquellenvektor indikativen Index als eine codierte Ausgabe nach außerhalb des Tonquellenerzeugungsbereichs überträgt; 2106 bezeichnet den Multiplizierer, der den adaptiven Codevektor aus dem adaptiven Codebuch 2101 mit einer Verstärkung für den adaptiven Codevektor multipliziert und eine Ausgabe an einen Addierer 2108 überträgt; 2107 bezeichnet den Multiplizierer, der den Impulstonquellenvektor von der Suchvorrichtung 2105 für die Impulsposition multipliziert mit einer Verstärkung für den Impulstonquellenvektor und eine Ausgabe an den Addierer 2108 überträgt; und 2108 bezeichnet den Addierer, der die Ausgabe von dem Multiplizierer 2106 und die Ausgabe von dem Multiplizierer 2107 empfängt, eine Vektoraddition ausführt und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des wie vorgenannt aufgebauten Tonquellenerzeugungsbereichs wird mit Verweis auf die 21 und 22 beschrieben. In 21 schneidet das adaptive Codebuch 2101 den nur die Teilrahmenlänge aufweisenden, adaptiven Codevektor von einem Punkt der in Richtung auf die Vergangenheit rückwärts liegt, aus, und zwar nur um den vorher außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L, und sendet den adaptiven Codevektor aus. Wenn der Tonhöhenzyklus L weniger ist als die Länge des Teilrahmens, dann werden die jeweils den Tonhöhenzyklus L aufweisenden, ausgeschnittenen Vektoren wiederholt verbunden, bis die Länge des Teilrahmens erreicht wird. Dann wird der zusammenverbundene Vektor als der adaptive Codevektor ausgesendet.
  • Die Berechnungseinheit 2102 für die Position des Tonhöhenscheitelwerts verwendet den von dem adaptiven Codebuch 2101 übertragenen adaptiven Codevektor, um die in dem adaptiven Codevektor bestehenden Position des Scheitelwerts der Tonhöhe zu bestimmen. Die Position des Scheitelwerts der Tonhöhe kann durch Maximalisieren einer normalisierten Korrelation der in dem Tonhöhenzyklus und dem adaptiven Codevektor angeordneten Impulskette bestimmt werden. Auch kann die Position des Scheitelwerts der Tonhöhe genauer erhalten werden durch Minimalisieren eines Fehlers bzw. einer Abweichung zwischen der Impulskette, die in dem durch das Synthesefilter hindurch geleiteten Tonhöhenzyklus und dem durch das Synthesefilter hindurch geleiteten, adaptiven Codevektor angeordnet ist.
  • Die Berechnungseinheit 2103 für die Suchposition bestimmt die Suchpositionen für die Tonquellenimpulse auf der Grundlage der Position des Tonhöhenscheitelwerts und überträgt eine Ausgabe an das Indexaktualisierungsmittel 2104. Die Suchpositionen werden in einer solchen Art und Weise bestimmt, wie beispielsweise in der fünften Ausführungsform oder der sechsten Ausführungsform beschrieben, dass die Suchpositionen in der Nähe des Scheitelwerts der Tonhöhe dicht und in den anderen Bereichen grob bzw. weit voneinander entfernt verteilt sind. Zusätzlich wird, wie in der sechsten Ausführungsform oder der achten Ausführungsform beschrieben, die Tonhöhenzyklus-Information benutzt, um die Anzahl der Tonquellenimpulse zu verändern oder um den Suchbereich für die Impulstonquelle zu begrenzen. Dies wird ebenfalls effektiv angewendet. Konkrete Beispiele der von der Berechnungseinheit 2103 für die Suchpositionen bestimmten Suchpositionen werden in den 10, 11(b), 11(c) und 13 gezeigt. Beispielsweise sind in 10 die Suchpositionen in der Nähe der Position des Scheitelwerts der Tonhöhe dicht und in den anderen Bereichen grob bzw. weit voneinander entfernt verteilt. Das Verfahren zum Begrenzen des Suchbereichs für die Impulsposition wird konkret gezeigt. Das Begrenzungsverfahren beruht auf dem statistischen Ergebnis, das Positionen mit einer hohen Wahrscheinlichkeit des Anhebens von Impulsen in der Nähe des Tonhöhenimpulses konzentriert sind. Wenn der Suchbereich für die Impulspositionen nicht begrenzt ist, dann wird in dem mit Sprache versehenen Bereich eine Wahrscheinlichkeit, dass Impulse in der Nähe des Tonhöhenimpulses angehoben werden, höher als eine Wahrscheinlichkeit, dass Impulse in den anderen Bereichen angehoben werden. Zusätzlich berechnet die Berech nungseinheit für die Suchposition Suchpositionen der Tonquellenimpulse unter Verwendung von Positionen in Bezug auf die Position des Scheitelwerts der Tonhöhe. Zu diesem Zeitpunkt werden die Positionen in der Reihenfolge von der Position, die einen kleineren numerischen relativen Positionswert aufweist, indiziert, während die Position des Scheitelwerts der Tonhöhe Null ist (siehe 22). Zusätzlich zeigt 22 den Fall, bei dem die Anzahl der Impulse vier beträgt, was dem Fall in 13(a) entspricht.
  • Das Indexaktualisierungsmittel 2104 konvertiert die Suchpositionen für die Tonquellenimpulse (relative Positionen in 22), die in der Reihenfolge von der Position mit einem kleineren Wert in Bezug auf die Position des Scheitelwerts der Tonhöhe indiziert sind, in absolute Positionen, wobei der Beginn des Teilrahmens Null ist. Anschließend werden die Indizes in der Reihenfolge von einem kleineren absoluten Positionswert (absolute Positionen in 22) aktualisiert. Die absoluten Positionen werden an die Suchvorrichtung 2105 für die Impulsposition übertragen. Wenn daher die Codiererseite sich von der Decodiererseite hinsichtlich der berechneten Position des Scheitelwerts der Tonhöhe aufgrund des Übertragungsleitungsfehlers oder dergleichen unterscheidet, kann eine Abweichung der Impulspositionen minimalisiert werden.
  • Die Suchvorrichtung 2105 für die Impulspositionen verwendet die Suchpositionen der Tonquellenimpulse, die die Indizes aufweisen, die für die entsprechenden Suchpositionen, die von dem Indexaktualisierungsmittel 2104 aktualisiert worden sind, und den Tonhöhenzyklus L, der getrennt übertragen worden ist, indikativ sind, um die optimale Kombination der Positionen, wo die Tonquellenimpulse angehoben werden, zu bestimmen. In dem Impulssuchverfahren, wie das in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" offenbart ist, wenn beispielsweise die Anzahl der Impulse vier beträgt, wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird zu diesem Zeitpunkt die Polarität von jedem Tonquellenimpuls vorherbestimmt, bevor die Impulspositionssuche in einer solchen Art und Weise ausgeführt wird, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einer Komponente des Rauschcodebuchs, d.h. ein Signalvektor, der erhalten wird durch Subtrahieren eines Antwortsignals eines Synthesefilters mit Nulleingabe zum Anwenden der auditorischen Wichtigkeit und eines Signals einer Komponente des adaptiven Codebuchs von einem Eingabesprachsignal mit darauf angewendeter auditorischer Wichtigkeit. Dann kann die Menge der arithmetischen Operationen für die Suche stark verringert werden. Wenn der Tonhöhenzyklus kürzer als die Länge des Teilrahmens ist, wie in der fünften Ausführungsform beschrieben, werden die Tonquellenimpulse auch unter Verwendung eines in Tonhöhenzyklen unterteilenden Filters in eine Kette von Tonhöhenzyklusimpulsen umgewandelt, und nicht in Impulse. In dem vorgenannten Vorgang zum Unterteilen in Tonhöhenzyklen wird der Impulsantwortvektor des die auditorische Wichtigkeit aufbringenden Synthesefilters vorher durch den die Unterteilung in Tonhöhenzyklen ausführenden Filters hindurchgeleitet. Dann kann der Tonquellenimpuls durch Maximalisierung der Gleichung (2) in derselben Art und Weise gesucht werden, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird. In den auf diese Weise bestimmten, entsprechenden Tonquellenimpulspositionen werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellen impuls angehoben. Anschließend kann der Impulstonquellenvektor unter Verwendung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 2107 übertragen. Der von der Suchvorrichtung 2105 für die Impulsposition an den Multiplizierer 2107 übertragene Impulstonquellenvektor wird multipliziert mit der quantisierten Impulstonquellenvektorverstärkung, die durch die externe Verstärkungsquantisierungseinheit quantisiert worden ist, und an den Addierer 2108 übertragen. Zusätzlich werden in der Impulspositionssuchvorrichtung 2105 die Polarität von jedem Tonquellenimpuls, der für den Impulstonquellenvektor und die Index-Information indikativ ist, zusammen mit dem Impulstonquellenvektor getrennt nach außerhalb des Tonquellenerzeugungsbereichs übertragen. Die Polarität des Tonquellenimpulses und die Index-Information wird durch einen Codierer, eine Multiplexeinheit und dergleichen hindurchgeleitet, in eine Reihe von Daten, die einer Übertragungsleitung zugeführt werden, konvertiert und auf die Übertragungsleitung übertragen.
  • Der Addierer 2108 addiert eine Komponente des adaptiven Codevektors aus dem Multiplizierer 2106 und eine Komponente des Impulstonquellenvektors aus dem Multiplizierer 2107 und sendet den aktivierenden Tonquellenvektor aus.
  • Zusätzlich kann das Verfahren des Ausweisens bzw. Bereitstellens der Indizes auf der Grundlage dieser Ausführungsform auf alle Fälle angewendet werden, wo die Information über die Position der Tonquelle durch relative Werte dargestellt ist. Nur die Art und Weise des Ausweisens der Indizes unterscheidet sich. Daher kann die Ausbreitung von Übertragungsleitungsfehlern effektiv verhindert werden, ohne die Leistungsfähigkeit zu beeinflussen.
  • Weiterhin ist die Seite des Decodierers in derselben Art und Weise wie die Seite des Codierers mit Indexaktualisierungsmitteln versehen. Auch wird für die Möglichkeit des Anhebens von Impulsen die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse, in dem Suchbereich, beispielsweise jeder beliebige von 32 Plätzen, angehoben. In diesem Fall gibt es, wie oben genannt, neben dem Verfahren zum Suchen aller Kombinationen (8 × 8 × 8 × 8 Möglichkeiten) in einer solchen Art und Weise, dass die 32 Plätze in vier unterteilt werden und ein Platz aus den acht Plätzen bestimmt wird, in dem ein Impuls angewiesen wird, ein Verfahren des Suchens aller Kombinationen, um vier Plätze aus den 32 Plätzen auszuwählen, und andere Verfahren. Zusätzlich kann neben der Kombination von Impulsen mit einer Amplitude 1 eine Kombination von mehreren Impulsen, beispielsweise zwei oder ein paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben bzw. herausgegeben werden.
  • 23 zeigt eine dreizehnte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich auf einer Codiererseite einer Sprachcodiervorrichtung vom CELP Typ, die mit einer Impulsanzahl- und Indexaktualisierungsmittel zum Zuweisen von Indizes und Impulsnummern an Impulssuchpositionen ausgestattet ist und die einen Impulspositionssuchbereich in Übereinstimmung mit einem Tonhöhenzyklus und einer Scheitelwertposition der Tonhöhe eines adaptiven Codevektors bestimmt. Genauer gesagt sind in der Sprachcodiervorrichtung vom CELP Typ, die eine Tonquellenimpulssuche in Positionen in relativ zu der Position des Tonhöhenscheitelwerts ausführt, Impulspositionen in der Reihenfolge vom Beginn eines Teilrahmens indiziert, während Impulse, die dieselbe Index nummer, jedoch verschiedene Nummern aufweisen, Impulsnummern in der Reihenfolge vom Beginn des Teilrahmens zugewiesen bekommen. Insbesondere weist in dem Fall derselben Indexnummer eine kleinere Impulsnummer darauf hin, dass der relevante Impuls in Richtung zum Beginn des Teilrahmens angeordnet ist. Durch Bestimmen der entsprechenden Impulsnummer bzw. Impulsanzahl in dieser Weise wird verhindert, dass der Einfluss eines in einigen Datenrahmen auftretenden Übertragungsleitungsfehlers daran gehindert wird, sich ohne Übertragungsleitungsfehler in nachfolgende Datenrahmen auszubreiten. Ein solcher Tonquellenerzeugungsbereich wird gezeigt.
  • In 23 bezeichnet das Referenzzeichen 2301 ein adaptives Codebuch, das den vergangenen aktivierenden Tonquellenvektor speichert und einen ausgewählten adaptiven Codevektor an eine Berechnungseinheit 2302 für die Position des Tonhöhenscheitelwerts und eine Multipliziervorrichtung 2306 für die Tonhöhenverstärkung überträgt; 2302 bezeichnet die Berechnungseinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 2301 und den Tonhöhenzyklus L empfängt, eine Position des Scheitelwerts der Tonhöhe berechnet und eine Ausgabe an eine Berechnungseinheit 2303 für die Suchposition überträgt; 2303 bezeichnet die Berechnungseinheit für die Suchposition, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 2302 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L empfängt, einen Suchbereich für die Impulstonquelle berechnet und eine Ausgabe an ein Mittel 2304 zum Aktualisieren der Impulsanzahl und des Indexes überträgt; 2304 bezeichnet das Mittel zum Aktualisieren der Impulsnummer und des Index, welches jede Tonquellenimpulsnummer und einen Index von jeder von der Berechnungseinheit 2303 für die Suchposition übertragenen Impulspo sition der Tonquelle aktualisiert und eine Ausgabe an eine Impulspositions-Sucheinheit 2305 überträgt; 2305 bezeichnet eine Impulspositions-Sucheinheit, die Suchpositionen (mit den Impulsnummern und den Indizes, die für die Impulspositionen indikativ sind und die beide aktualisiert sind) von dem Aktualisierungsmittel 2304 für die Impulsnummer und den Index und den separat außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L empfängt, die Impulstonquelle sucht, einen Impulstonquellenvektor an eine Multipliziervorrichtung 2307 für die Tonquellenverstärkung überträgt und den Index, der für den Impulstonquellenvektor indikativ ist, als eine codierte Ausgabe nach außerhalb des Tonquellenerzeugungsbereichs überträgt; 2306 bezeichnet die Multipliziervorrichtung, die den adaptiven Codevektor aus dem adaptiven Codebuch 2301 mit einer Verstärkung für den adaptiven Codevektor verstärkt und eine Ausgabe an einen Addierer 2308 überträgt; 2307 bezeichnet die Multipliziervorrichtung, die den Impulstonquellenvektor aus der Sucheinheit 2305 für die Impulsposition mit der Verstärkung für den Impulstonquellenvektor multipliziert und eine Ausgabe an den Addierer 2308 überträgt; und 2308 bezeichnet den Addierer, der die Ausgabe von dem Multiplizierer 2306 und die Ausgabe von dem Multiplizierer 2307 empfängt, eine Vektoraddition ausführt und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des wie vorgenannt aufgebauten Tonquellenerzeugungsbereichs wird mit Verweis auf die 23 und 24 beschrieben. In 23 schneidet das adaptive Codebuch 2301 den nur die Teilrahmenlänge aufweisenden, adaptiven Codevektor aus, von einem Punkt, der nur durch den Tonhöhenzyklus L, der vorher außerhalb des Tonquellenerzeugungsbereichs berechnet worden ist, zurück in die Vergangenheit genommen wird und gibt den adaptiven Codevek tor aus. Wenn der Tonhöhenzyklus L weniger als die Länge des Teilrahmens ist, werden die ausgeschnittenen Vektoren, die jeweils den Tonhöhenzyklus L aufweisen, wiederholt zusammen verbunden, bis die Länge des Teilrahmens erreicht wird. Dann wird der zusammenverbundene Vektor als der adaptive Codevektor ausgegeben.
  • Die Berechnungseinheit 2302 für die Position des Tonhöhenscheitelwerts benutzt den von dem adaptiven Codebuch 2301 übertragenen adaptiven Codevektor, um die Position des Tonhöhenscheitelwerts, die in dem adaptiven Codevektor existiert, zu bestimmen. Die Position des Tonhöhenscheitelwerts kann durch Maximalisieren einer normalisierten Korrelation der Impulskette, die in dem Tonhöhenzyklus angeordnet ist, mit dem adaptiven Codevektor bestimmt werden. Auch kann die Position des Tonhöhenscheitelwerts genauer erhalten werden durch Minimalisieren eines Fehlers zwischen der Impulskette, die in dem Tonhöhenzyklus, der durch das Synthesefilter hindurchgelaufen ist, und dem adaptiven Codevektor, der durch das Synthesefilter hindurchgelaufen ist, minimalisiert wird.
  • Die Berechnungseinheit 2303 für die Suchposition bestimmt die Suchpositionen für die Tonquellenimpulse auf der Grundlage der Position des Tonhöhenscheitelwerts und überträgt eine Ausgabe an das Aktualisierungsmittel 2304 für die Impulsnummer und den Index. Die Suchpositionen werden in einer solchen Weise bestimmt, wie beispielsweise für die sechste Ausführungsform oder die achte Ausführungsform beschrieben,, dass die Suchpositionen dicht in der Nähe des Tonhöhenscheitelwerts verteilt sind und grober bzw. weiter in den anderen Bereichen. Zusätzlich wird, wie in der sechsten Ausführungsform oder der achten Ausführungsform beschrieben, die Tonhöhenzyklusinformation zum Verändern der Anzahl der Tonquellenimpulse oder zum Begrenzen des Suchbereichs der Tonquellenimpulse verwendet. Dies wird auch effektiv angewendet. Konkrete Beispiele der Suchpositionen, die von der Berechnungseinheit 2303 für die Suchposition bestimmt worden sind, werden in den 10, 11(b), 11(c) und 13 gezeigt. In 10 sind die Suchpositionen beispielsweise in der Nähe der Position des Tonhöhenscheitelwerts dicht verteilt und in den anderen Bereichen weiter bzw. grober beabstandet. Das Verfahren zum Begrenzen des Suchbereichs der Impulsposition wird konkret gezeigt. Das Begrenzungsverfahren beruht auf dem statistischen Ergebnis, dass Positionen mit einer hohen Wahrscheinlichkeit für ansteigende Impulse in der Nähe des Tonhöhenimpulses konzentriert sind. Wenn der Suchbereich für die Impulspositionen nicht begrenzt ist, dann ist in dem mit Stimmen versehenen Bereich eine Wahrscheinlichkeit, dass Impulse in der Nähe des Tonhöhenimpulses angehoben werden, höher als eine Wahrscheinlichkeit, dass Impulse in den anderen Bereichen angehoben werden. Zusätzlich berechnet die Berechnungseinheit für die Suchpositionen Suchpositionen für Tonquellenimpulse durch Verwenden von Positionen relativ zu der Position des Tonhöhenscheitelwerts. Dieses Mal werden den Positionen Impulsnummern vergeben und in der Reihenfolge von der Position, die einen kleineren numerischen Positionswert aufweist, indiziert, während die Position des Tonhöhenscheitelwerts Null ist (siehe 24(b)). Zusätzlich zeigt 24 den Fall, wo die Anzahl der Impulse vier ist, was dem Fall in 11(b) oder 13 entspricht. 24(a) zeigt die Suchpositionen für den Tonhöhenimpuls, die durch die Berechnungseinheit 2103 für die Suchpositionen bestimmt worden sind, wenn die Anzahl der Impulse vier ist. Ebenfalls sind in den relativen Positionen in 24(a) die entsprechenden Abtastpunkte durch numerische Werte von –4 bis +75 dargestellt, während die Position des Tonhöhenscheitelwerts Null ist. Die Punkte vor –4 sind durch positive numerische Werte dargestellt, indem die Punkte, die hinter der Grenze des Teilrahmens hinausragen, zurückgefaltet werden.
  • Das Aktualisierungsmittel 2304 für die Impulsnummer und den Index wandelt die Suchpositionen für den Tonquellenimpuls (24(b)), die in der Reihenfolge von der Position mit einem kleineren Wert relativ zu der Position des Tonhöhenscheitelwerts indiziert sind, um in absolute Positionen, wobei der Beginn des Suchrahmens Null ist. Anschließend werden die Impulsnummern und Indizes in einer Reihenfolge von einer kleineren absoluten Position ( 24(c)) aktualisiert. Die Positionen werden an die Sucheinheit 2305 für die Impulsposition übertragen. So kann, wenn sich die Codierseite von der Decodierseite in den berechneten Positionhöhen des Tonhöhenscheitelwerts unterscheidet aufgrund der Übertragungsleitungsfehler oder dergleichen, so eine Abweichung in den Impulspositionen minimalisiert werden.
  • Die Sucheinheit 2305 für die Impulspositionen benutzt die Suchposition der Tonquellenimpulse mit den Indizes, die für entsprechende, von dem Aktualisierungsmittel 2304 für die Impulsnummer und den Index aktualisierten Suchpositionen indikativ sind, und den getrennt übertragenen Tonhöhenzyklus L, zum Bestimmen der optimalen Kombination der Positionen, wo die Tonquellenimpulse angehoben werden. In dem Impulssuchverfahren, wie das in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" beschrieben ist, wird beispielsweise, wenn die Anzahl der Impulse vier ist, die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der zweiten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird die Polarität von jedem Tonquellenimpuls zu diesem Zeitpunkt vorbestimmt, bevor die Impulspositionssuche in einer solchen Weise ausgeführt wird, dass die Polarität gleich der Polarität in jeder Position des Zielvektors einer Komponente des Rauschcodebuchs wird, das heißt ein Signalvektor, der durch Subtrahieren eines Antwortsignals eines Synthesefilters für eine Nulleingabe zum Aufbringen der auditorischen Wichtigkeit und einem Signal einer Komponente des adaptiven Codebuchs von einer darauf aufgebrachten Eingabestimme mit auditorischer Wichtigkeit erhalten wird. Dann kann die Menge der arithmetischen Operation für die Suche stark verringert werden. Auch wenn der Tonhöhenzyklus kürzer ist als die Länge des Teilrahmens, wie in der fünften Ausführungsform beschrieben, dann können die Tonquellenimpulse in eine Kette von Tonhöhenzykluspulsen, nicht Impulsen, durch Anwenden eines in Tonhöhenzyklen unterteilenden Filters umgewandelt werden. In dem vorgenannten Vorgang zum Unterteilen in Tonhöhenzyklen wird der Impulsantwortvektor des auditorische Wichtigkeit verleihenden Synthesefilters vorher durch das in Tonhöhenzyklen unterteilende Filter hindurchgeleitet. Dann werden in derselben Weise, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird, durch Maximalisieren der Gleichung (2) die Tonquellenimpulse gesucht. In den auf diese Weise bestimmten, entsprechenden Tonquellen-Impulspositionen werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Danach kann der Impulstonquellenvektor bereitgestellt werden, indem der Tonhöhenzyklus L verwendet und das in Tonhöhenzyklen unterteilende Filter angewendet wird. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 2307 übertragen. Der von der Impulspositions-Sucheinheit 2305 an den Multiplizierer 2307 übertragene Impulstonquellenvektor wird mit der quantisierten Impulstonquellenvektorverstärkung, die durch die externe Verstärkungsquantisierungseinheit quantisiert worden ist, multipliziert und zu dem Addierer 2308 übertragen. Zusätzlich werden in der Impulspositions-Sucheinheit 2305 zusammen mit dem Impulstonquellenvektor, die Polarität von jedem Tonquellenimpuls, die für den Impulstonquellenvektor und die Indexinformation indikativ ist, getrennt nach außerhalb des Tonquellenerzeugungsbereichs übertragen. Die Polarität des Tonquellenimpulses und die Indexinformation werden durch einen Codierer, eine Multiplexeinheit und dergleichen hindurch geleitet in eine Reihe von an eine Übertragungsleitung zugeführten Daten umgewandelt und zu der Übertragungsleitung übertragen.
  • Der Addierer 2308 führt eine Vektoraddition einer Vektorkomponente des adaptiven Codebuchs von dem Multiplizierer 2306 und einer Vektorkomponente der Impulstonquelle von dem Multiplizierer 2307 aus und gibt den aktivierenden Tonquellenvektor aus.
  • Zusätzlich kann das Verfahren des Zuweisens der Indizes auf der Grundlage dieser Ausführungsform in allen Fällen angewendet werden, wo die Information über die Position der Tonquelle durch relative Werte dargestellt ist. Nur die Art und Weise des Zuweisens der Impulsnummern und Indizes unterscheidet sich. Daher kann die Ausbreitung eines Übertragungsleitungsfehlers effektiv verhindert werden, ohne die Leistungsfähigkeit zu beeinflussen. Auch kann die Ausbreitung des Einflusses des Übertragungsleitungsfehlers durch Umschalten und Betreiben der Impulstonquelle mit den festgesetzten Suchpositionen ebenfalls verhindert werden.
  • Ferner ist die Seite des Codierers versehen mit den vergleichbaren Aktualisierungsmitteln 2304 für die Impuls nummer und den Index. Auch werden in den Arten zum Anheben von Impulsen die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse, in dem Suchbereich angehoben, beispielsweise jeder von 32 Plätzen. In diesem Fall gibt es, wie vorher beschreiben, neben dem Verfahren des Durchsuchens aller Kombinationen (8 × 8 × 8 × 8 Arten) in einer solchen Weise, dass die 32 Plätze in vier unterteilt werden und ein Platz aus den acht Plätzen, in denen ein Impuls angeordnet ist, bestimmt wird, auch ein Verfahren zum Suchen aller Kombinationen zum Auswählen von vier Plätzen aus den 32 Plätzen sowie andere Verfahren. Zusätzlich können neben der Kombination von Impulsen mit einer Amplitude 1, eine Kombination von mehreren Impulsen, beispielsweise zwei oder ein Paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben bzw. ausgegeben werden.
  • 25 zeigt eine vierzehnte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung vom CELP-Typ, die Suchpositionen von Impulsen der Tonquelle benutzt, die zum Suchen von Impulsen sowohl aus festen Suchpositionen als auch aus Suchpositionen vom phasenadaptiven Typ aufgebaut ist.
  • In 25 bezeichnet das Referenzzeichen 2501 ein adaptives Codebuch, das den letzten aktivierenden Tonquellenvektor speichert und einen ausgewählten adaptiven Codevektor an eine Berechnungseinheit 2502 für die Position des Tonhöhenscheitelwerts und an einen Multiplizierer 2506 für die Tonhöhenverstärkung überträgt; 2502 bezeichnet die Berechnungseinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 2501 und den von außerhalb übertragenen Tonhöhenzyklus L empfängt, eine Position des Tonhöhenscheitelwerts berechnet und eine Ausgabe an die Berechnungseinheit 2503 für die Suchposition überträgt; 2503 bezeichnet die Berechnungseinheit für die Suchposition, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 2502 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L von außerhalb empfängt, Suchpositionen für die Impulstonquellen berechnet und eine Ausgabe an einen Addierer 2504 überträgt; 2504 bezeichnet den Addierer, der die von der Berechnungseinheit 2503 für die übertragenen Suchpositionen und durch relative Positionen dargestellte Suchpositionen mit der Position des Tonhöhenscheitelwerts, die Null ist, und Suchpositionen, die zum Suchen von festen Positionen benutzt werden, kombiniert (wobei keine Addition numerischer Werte ausgeführt wird, sondern eine Vereinigung von Mengen von zwei Typen von Suchpositionen erzeugt wird) und eine Ausgabe an die Impulspositionssucheinheit 2505 überträgt; 2505 bezeichnet die Sucheinheit für die Impulsposition, die die Suchpositionen von dem Addierer 2504 und den separat außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L empfängt, die Impulstonquelle sucht und einen Impulstonquellenvektor an einen Multiplizierer 2507 für die Impulstonquellenverstärkung überträgt; 2506 bezeichnet den Multiplizierer, der den adaptiven Codevektor von dem adaptiven Codebuch 2501 mit einer Verstärkung für den adaptiven Codevektor multipliziert und eine Ausgabe an einen Addierer 2508 überträgt; 2507 bezeichnet den Multiplizierer, der den Impulstonquellenvektor von der Impulspositionssucheinheit 2505 mit der Verstärkung des Impulstonquellenvektors multipliziert und eine Ausgabe an den Addierer 2508 überträgt; und 2508 bezeichnet den Addierer, der die Ausgabe von dem Multiplizierer 2506 und die Ausgabe von dem Multiplizierer 2507 empfängt, eine Vektoraddition ausführt und einen aktivierenden Tonquellenvektor aussendet.
  • Der Betrieb des Tonquellenerzeugungsbereichs, der wie vorgenannt aufgebaut ist, wird mit Verweis auf die 25 und 26 beschrieben. In 25 schneidet das adaptive Codebuch 2501 den adaptiven Codevektor, der nur die Länge des Teilrahmens aufweist von einem Punkt, der nur durch den vorher außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L zurück in die Vergangenheit genommen wird, und gibt den adaptiven Codevektor heraus. Wenn der Tonhöhenzyklus L weniger als die Länge des Teilrahmens ist, dann werden die ausgeschnitten Vektoren, die jeweils den Tonhöhenzyklus L aufweisen, wiederholt miteinander verbunden, bis die Länge des Teilrahmens erreicht ist. Dann wird der zusammengesetzte Vektor als der adaptive Codevektor ausgegeben.
  • Die Berechnungseinheit 2502 für die Position des Tonhöhenscheitelwerts benutzt den von dem adaptiven Codebuch 2501 übertragenen adaptiven Codevektor, um die Position des Tonhöhenscheitelwerts zu bestimmen, die in dem adaptiven Codevektor existiert. Die Position des Tonhöhenscheitelwerts kann durch Maximalisieren einer normalisierten Korrelation der in dem Tonhöhenzyklus angeordneten Impulskette und dem adaptiven Codevektor bestimmt werden. Auch kann die Position des Tonhöhenscheitelwerts durch Minimalisieren eines Fehlers (Maximalisieren der normalisierten Korrelationsfunktion) der Impulskette, die in dem durch das Synthesefilter hindurch gelaufenen Tonhöhenzyklus angeordnet ist, und dem durch das Synthesefilter hindurch gelaufenen adaptiven Codevektor genauer erhalten werden.
  • Die Berechnungseinheit 2503 für die Suchposition bestimmt die Suchposition für die Tonquellenimpulse auf der Grundlage der Position des Tonhöhenscheitelwerts und überträgt eine Ausgabe an den Addierer 2504. Die Suchpositionen werden in einer solchen Weise bestimmt, wie beispielsweise in 26 gezeigt, dass Punkte, die nicht mit den festen Suchpositionen in der Nähe des Tonhöhenscheitelwerts überlappen, ausgegeben werden. Zusätzlich wird, wie in der sechzehnten Ausführungsform oder der achten Ausführungsform beschrieben, die Information des Tonhöhenzyklus verwendet, um die Anzahl der Tonquellenimpulse zu verändern oder um den Suchbereich der Tonquellenimpulse zu begrenzen. Dies wird in derselben Weise ebenfalls angewendet. Konkrete Beispiele der Suchpositionen, die durch die Suchposition-Berechnungseinheit 2503 bestimmt werden, sind in den 26(b) und 26(c) gezeigt. In 26 sind beispielsweise die festen Suchpositionen auf ungerade Abtastpunkte gesetzt (26(a)). Diese zeigt, dass die Berechnungseinheit 2503 für die Suchpositionen die Suchpositionen auf gerade Abtastpunkte in der Nähe des Scheitelwerts der Tonhöhe setzt (26(b), 26(c)). 26(b) zeigt, dass die Position des Tonhöhenscheitelwerts auf dem geraden Abtastpunkt existiert (die Position des Tonhöhenscheitelwerts ist nicht in den festgesetzten Suchpositionen enthalten), und 26(c) zeigt, dass die Position des Tonhöhenscheitelwerts auf dem ungeraden Abtastpunkt existiert (die Position des Tonhöhenscheitelwerts ist in den festgesetzten Suchpositionen enthalten). Wie aus einem Vergleich der 26(b) und 26(c) gesehen werden kann, unterscheiden sich die Suchpositionen (die relativen Positionen, wenn die Position des Tonhöhenscheitelwerts 0 ist) ein wenig in Abhängigkeit davon, wo sich die Position des Tonhöhenscheitelwerts befindet.
  • Der Addierer 2504 erzeugt die Vereinigung der Mengen (26(b)) der Menge (26(b), 26(c)) der von der Berechnungseinheit 2503 für die Suchpositionen übertragenen Tonquellenimpuls-Suchpositionen und der Menge (26(a)) der vorbestimmten festgesetzten Suchpositionen, und überträgt eine Ausgabe an die Sucheinheit 2505 für die Impulsposition. Auf diese Weise werden die Suchpositionen für die Tonquellenimpulse in einer Weise beschränkt, dass sie in der Nähe der Position des Tonhöhenscheitelwerts dicht werden und in den anderen Bereichen grob bzw. weiter voneinander entfernt werden. Das Begrenzungsverfahren beruht auf dem statistischen Ergebnis, dass die Positionen mit einer hohen Wahrscheinlichkeit des Anhebens von Impulsen in der Nähe des Tonhöhenscheitelwerts konzentriert sind. Wenn der Suchbereich für die Impulspositionen nicht begrenzt wird, dann ist in dem mit Stimmen versehenen Bereich eine Wahrscheinlichkeit, dass die Impulse angehoben werden, in der Nähe des Tonhöhenscheitelwerts höher als eine Wahrscheinlichkeit, dass die Impulse in anderen Bereichen angehoben werden. Zusätzlich wird durch den Einfluss eines Übertragungsleitungsfehlers oder dergleichen die Position des Tonhöhenscheitelwerts auf der Seite des Decodierers falsch berechnet. In diesem Fall unterscheiden sich die Suchpositionen der Tonquellenimpulse, die von der Berechnungseinheit 2503 für die Suchpositionen berechnet worden sind, auf der Codiererseite und auf der Decodiererseite. Jedoch entspricht ein Teil der an die Sucheinheit 2505 für die Impulsposition übertragenen Suchpositionen der Tonquellenimpulse den festgesetzten Suchpositionen. Daher kann eine Wahrscheinlichkeit, dass sich die Codiererseite und die Decodiererseite voneinander hinsichtlich der Impulspositionen unterscheiden, verringert werden. Auch kann der Einfluss des Übertragungsleitungsfehlers moderiert werden.
  • Die Impulspositionssucheinheit 2505 benutzt die Suchpositionen für die von dem Addierer 2504 übertragenen Tonquellenimpulse, und den separat übertragenen Tonhöhenzyklus L, um die optimale Kombination der Positionen, wo die Tonquellenimpulse angehoben werden zu bestimmen. In dem Impulssuchverfahren, wie das in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" beschrieben ist, wenn beispielsweise die Anzahl der Impulse vier ist, dann wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird die Polarität von jedem Tonquellenimpuls zu diesem Zeitpunkt in einer solchen Weise vorher bestimmt, bevor die Impulspositionssuche ausgeführt wird,, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einer Komponente des Rauschcodebuchs, d.h. ein Signalvektor, der durch Subtrahieren eines Nulleingang-Antwortsignals eines Synthesefilters zum Aufbringen der auditorischen Wichtigkeit und eines Signals einer Komponente des adaptiven Codebuchs von einer Eingabestimme mit darauf aufgebrachter, auditorischer Wichtigkeit erhalten wird. Dann kann die Menge der arithmetischen Operationen für die Suche stark verringert werden. Auch wenn der Tonhöhenzyklus kürzer ist als die Länge des Teilrahmens, wie in der fünften Ausführungsform beschrieben, dann können die Tonquellenimpulse durch Anwenden eines in Tonhöhenzyklen unterteilenden Filters in eine Kette von Tonhöhenzyklenpulsen umgewandelt werden, und nicht in Impulse. In dem vorgenannten Vorgang des Unterteilens in Tonhöhenzyklen wird der Impulsantwortvektor des die auditorische Wichtigkeit anwendenden Synthesefilters vorher durch den in Tonhöhenzyklen unterteilenden Filter hindurchgeleitet. Dann kann der Tonquellenimpuls durch Maximalisieren der Gleichung (2) in derselben Weise gesucht werden, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird. In den auf diese Weise bestimmten entsprechenden Tonquellenimpulspositionen werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Anschließend kann der Impulstonquellenvektor durch Verwendung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 2507 übertragen. Der von der Impulspositionssucheinheit 2505 an den Multiplizierer 2507 übertragene Impulstonquellenvektor wird mit der quantisierten Impulstonquellenvektorverstärkung, die durch die externe Verstärkungsquantisierungseinheit quantisiert worden ist, multipliziert und an den Addierer 2508 übertragen. Zusätzlich werden die Polarität von jedem für den Impulstonquellenvektor indikativen Tonquellenimpuls und die Indexinformation getrennt nach außerhalb des Tonquellenerzeugungsbereichs übertragen, und zwar in der Impulspositionssucheinheit 2505 zusammen mit dem Impulstonquellenvektor, wie das in 25 nicht gezeichnet ist. Die Polarität des Tonquellenimpulses und die Indexinformation werden durch einen Codierer, eine Multiplexeinheit und dergleichen hindurchgeleitet, in eine Serie von Daten, die einer Übertragungsleitung zugeführt werden, umgewandelt und zu der Übertragungsleitung übertragen.
  • Der Addierer 2508 führt eine Vektoraddition von einer Komponente des adaptiven Codevektors aus dem Multiplizierer 2506 und einer Komponente des Impulstonquellenvektors aus dem Multiplizierer 2507 aus und gibt den aktivierenden Tonquellenvektor aus.
  • Auch kann durch Umschalten und Betreiben der Impulstonquelle mit den festgesetzten Suchpositionen die Ausbreitung des Einflusses des Übertragungsleitungsfehlers ebenfalls verhindert werden.
  • Was die Art und Weise des Anhebens der Impulse betrifft, wird ferner die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse, in dem Suchbereich angehoben, beispielsweise für jeden der 32 Plätze. In diesem Fall gibt es neben einem Verfahren zum Suchen aller Kombinationen zum Auswählen von vier Plätzen aus den 32 Plätzen und andere Verfahren, wie vorher beschriebent, neben dem Verfahren zum Suchen aller Kombinationen (8 × 8 × 8 × 8 Arten) in einer solchen Art, dass die 32 Plätze in vier unterteilt werden und ein Platz von den acht Plätzen bestimmt wird, in dem ein Impuls angeordnet ist, ein Verfahren zum Suchen aller Komponenten, um vier Plätze aus den 32 Plätzen auszuwählen sowie andere Verfahren. Zusätzlich können neben der Kombination von Impulsen mit einer Amplitude 1, einer Kombination von mehreren Impulsen, beispielsweise zwei oder einem Paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben werden.
  • 27 zeigt eine fünfzehnte, weiter entwickelte Ausführungsform der Erfindung und den Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung vom CELP-Typ, wie in der fünfzehnten Ausführungsform beschrieben, die mit einer Korrekturvorrichtung für die Position des Tonhöhenscheitelwerts versehen ist.
  • In 27 bezeichnet das Referenzzeichen 2701 ein adaptives Codebuch, das den vergangenen aktivierenden Tonquellenvektor speichert und einen ausgewählten adaptiven Codevektor an eine Berechnungseinheit 2702 für die Posi tion des Tonhöhenscheitelwerts, eine Korrektureinheit 2703 für die Position des Tonhöhenscheitelwerts und einen Multiplizierer 2706 für die Tonhöhenverstärkung überträgt; 2702 bezeichnet die Berechnungseinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 2701 und den von außerhalb übertragenen Tonhöhenzyklus L empfängt, eine Position des Tonhöhenscheitelwerts berechnet und eine Ausgabe an die Korrektureinheit 2703 für die Position des Tonhöhenscheitelwerts überträgt; 2703 bezeichnet die Korrektureinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 2701, die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L von extern empfängt, die Position des Tonhöhenscheitelwerts korrigiert und eine Ausgabe an die Berechnungseinheit 2704 für die Suchposition überträgt; 2704 bezeichnet die Berechnungseinheit für die Suchposition, die die Position des Tonhöhenscheitelwerts von der Korrektureinheit 2703 für die Position des Tonhöhenscheitelwerts und den getrennt übertragenen Tonhöhenzyklus L empfängt und Suchpositionen für die Tonquellenimpulse an eine Impulspositionssucheinheit 2705 überträgt; 2705 bezeichnet die Sucheinheit für Impulspositionen, die die Suchpositionen von der Berechnungseinheit 2704 für die Suchpositionen und der separat außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L empfängt, die Impulstonquelle sucht und einen Impulstonquellenvektor an einen Multiplizierer 2707 für die Impulstonquellenverstärkung überträgt; 2706 bezeichnet den Multiplizierer, der den adaptiven Codevektor aus dem adaptiven Codebuch 2701 mit einer Verstärkung für den adaptiven Codevektor multipliziert und eine Ausgabe an einen Addierer 2708 überträgt; 2707 bezeichnet den Multiplizierer, der den Impulstonquellenvektor von der Such einheit 2705 für die Impulsposition mit einer Verstärkung für den Impulstonquellenvektor multipliziert und eine Ausgabe an den Addierer 2708 überträgt; und 2708 bezeichnet den Addierer, der die Ausgabe von dem Multiplizierer 2706 und die Ausgabe von dem Multiplizierer 2707 empfängt, eine Vektoraddition ausführt und einen aktivierenden Tonquellenvektor aussendet.
  • Der Betrieb des wie vorgenannt aufgebauten Tonquellenerzeugungsbereichs wird mit Verweis auf die 27 und 28 beschrieben. In 27 schneidet das adaptive Codebuch 2701 den adaptiven Codevektor aus, der nur die Länge des Teilrahmens aufweist von einem Punkt, der zurück in die Vergangenheit nur um den vorher außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L genommen wird, und gibt den adaptiven Codevektor aus. Wenn der Tonhöhenzyklus L weniger ist als die Länge des Teilrahmens, dann werden die ausgeschnittenen Vektoren, die jeweils den Tonhöhenzyklus L aufweisen, wiederholt miteinander verbunden bis die Länge des Teilrahmens erreicht ist. Dann wird der verbundene Vektor als der adaptive Codevektor ausgesendet.
  • Die Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts benutzt den von dem adaptiven Codebuch 2701 übertragenen adaptiven Codevektor, um die Position des in dem adaptiven Codevektor bestehenden Tonhöhenscheitelwerts zu bestimmen. Die Position des Tonhöhenscheitelwerts kann durch Miximalisieren einer normalisierten Korrelation der in dem Tonhöhenzyklus vorhandenen Impulskette mit dem adaptiven Codevektor bestimmt werden. Auch kann die Position des Tonhöhenscheitelwerts genauer erhalten werden durch Minimalisieren eines Fehlers (Maximalisieren der normalisierten Korrelationsfunktion) der in dem durch das Synthesefilter hindurch geleiteten Ton höhenzyklus angeordneten Impulskette, und des durch das Synthesefilter hindurch geleiteten adaptiven Codevektors.
  • Die Korrektureinheit 2703 für die Position des Tonhöhenscheitelwerts schneidet aus dem von dem adaptiven Codebuch 2701 übertragenen adaptiven Codevektor einen Vektor aus, der eine Länge der Länge L eines Tonhöhenzyklus aufweist und die von der Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts berechneten Positionspunkt des Tonhöhenscheitelwerts enthält. Von der ausgeschnittenen Wellenform wird ein Punkt, der einen maximalen Amplitudenwert aufweist, herausgefunden und an die Berechnungseinheit 2704 für die Suchposition übertragen. Zusätzlich wird der Vorgang nur ausgeführt, wenn der Tonhöhenzyklus L kürzer ist als die Länge des Teilrahmens. Wenn der Tonhöhenzyklus L länger ist als die Länge des Teilrahmens, dann wird die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts an die Sucheinheit 2705 für die Impulsposition so übertragen, wie sie ist. Wenn eine Länge des Teilrahmens im wesentlichen der eines Tonhöhenzyklus entspricht, besteht eine Möglichkeit, dass die von der Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts übertragene Position des Tonhöhenscheitelwerts an einer Position ist, der eine zweite große Amplitude in einer Tonhöhenwellenform aufweist (28(a), 28(b): Es existiert nur ein Tonhöhenscheitelwert in einem Teilrahmen, jedoch in einem Teilrahmen gibt es zwei Punkte (einen zweiten Scheitelwert), der einen zweiten großen Amplitudenwert in einer Wellenform des Tonhöhenzyklus aufweist, daher wird der zweite Scheitelwert fehlerhaft als der Tonhöhenscheitelwert detektiert). Um das Problem zu lösen, überprüft die Korrektureinheit 2703 für die Position des Tonhöhenscheitelwerts, ob innerhalb einer Tonhöhenzykluslänge von der Position des von der Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts übertragenen Tonhöhenscheitelwerts ein Punkt existiert, der einen größeren Amplitudenwert aufweist. Wenn ein Punkt existiert, der den Amplitudenwert größer als den Amplitudenwert des Punkts in der Nähe der Position des von der Berechnungseinheit 2702 für die Position des Tonhöhenscheitelwerts übertragenen Tonhöhenscheitelwerts aufweist, dann wird der Punkt mit dem größeren Amplitudenwert als die Position des Tonhöhenscheitelwerts betrachtet. Beispielsweise in 28(c), wenn der zweite Scheitelwert von der Berechnungseinheit 2702 als die Position des Tonhöhenscheitelwerts übertragen wird, dann wird die Position, die eine maximale Amplitude in dem adaptiven Codevektor von einem Tonhöhenzyklus von dem zweiten Scheitelwert aufweist (ein mit fetten Linien gezeichneter Bereich in 28(c)) als der Scheitelwert der Tonhöhe angesehen.
  • Die Berechnungseinheit 2704 für die Suchposition bestimmt die Suchpositionen der Tonquellenimpulse auf der Grundlage der von der Berechnungseinheit 2703 für die Position des Tonhöhenscheitelwerts übertragene Position des Tonhöhenscheitelwerts und überträgt eine Ausgabe an die Sucheinheit 2705 für die Impulsposition. Um die Suchposition zu bestimmen, werden wie in der fünften, sechsten oder vierzehnten Ausführungsform die Suchpositionen für die Tonquellenimpulse in einer solchen Weise beschränkt, das sie in der Nähe der Position des Tonhöhenscheitelwerts dicht sind und in anderen Bereichen grob bzw. weiter voneinander beabstandet sind. Das Begrenzungsverfahren beruht auf dem statistischen Ergebnis, dass Positionen mit einer höheren Wahrscheinlichkeit des Anhebens von Impulsen in der Nähe des Scheitelwertimpulses konzentriert sind. Wenn der Suchbereich für die Impulsposition nicht begrenzt wird, dann ist in dem mit Sprache versehenen Be reich eine Wahrscheinlichkeit, dass die Impulse in der Nähe des Tonhöhenimpulses angehoben sind, höher als eine Wahrscheinlichkeit, dass die Pulse in anderen Bereichen angehoben sind.
  • Die Sucheinheit 2507 für die Impulsposition benutzt die von der Berechnungseinheit 2704 für die Suchposition übertragenen Suchpositionen für die Tonquellenimpulse und den separat übertragenen Tonhöhenzyklus L um die optimale Kombination von Positionen zu bestimmen, wo die Tonquellenimpulse angehoben werden. In dem Impulssuchverfahren, wie das in den "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" beschrieben ist, wenn beispielsweise die Anzahl der Impulse vier ist, werden die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird zu diesem Zeitpunkt die Polarität von jedem Tonquellenimpuls in einer solchen Weise vorherbestimmt, bevor die Impulspositionssuche ausgeführt wird, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einr Komponente des Rauschcodebuchs, das heißt ein Signalvektor, der durch Subtrahieren eines Nulleingabe-Antwortsignals eines Synthesefilters zum Aufbringen der auditorischen Wichtigkeit und eines Signals einer Komponente des adaptiven Codebuchs von einer Eingabestimme mit darauf aufgebrachter auditorischer Wichtigkeit erhalten wird. Dann kann die Menge der arithmetischen Operationen für die Suche stark verringert werden. Auch wenn der Tonhöhenzyklus kürzer als die Länge des Teilrahmens ist, wie in der fünfzehnten Ausführungsform beschrieben, dann können die Tonquellenimpulse durch Anwenden des in Tonhöhenzyklen unterteilenden Filters in eine Kette von Tonhöhenzyklenpulsen, nicht Impulsen, um gesetzt werden. In dem vorgenannten Prozess des Unterteilens in Tonhöhenzyklen wird der Impulsantwortvektor des die auditorische Wichtigkeit aufbringenden Synthesefilters vorher durch den in Tonhöhenzyklen unterteilenden Filter hindurchgeleitet. Dann wird in derselben Weise, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird, der Tonquellenimpuls durch Maximalisieren der Gleichung (2) gesucht. In den auf diese Weise bestimmten, entsprechenden Positionen der Tonquellenimpulse, werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Danach kann durch Verwendung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters der Impulstonquellen für den Vektor bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 2707 übertragen. Der von der Impulspositionssucheinheit 2705 an den Multiplizierer 2707 übertragene Impulstonquellenvektor wird mit der Verstärkung des quantisierten Impulstonquellenvektors, die durch die externe Verstärkungsquantisierungseinheit quantisiert worden ist, multipliziert und an den Addierer 2708 übertragen. Zusätzlich werden, wie das in 27 ausgelassen ist, in der Impulspositionssucheinheit 2705 des Codierers zusammen mit dem Impulstonquellenvektor die Polarität von jedem Tonquellenimpuls, die für den Impulstonquellenvektor und die Indexinformation indikativ ist, getrennt nach außerhalb des Tonquellenerzeugungsbereichs übertragen. Die Polarität des Tonquellenimpulses und die Indexinformation werden durch einen Codierer, eine Multiplexeinheit und dergleichen hindurchgeleitet, in eine Reihe von einer Übertragungsleitung zuzuführenden Daten umgewandelt und zu der Übertragungsleitung übertragen.
  • Der Addierer 2708 führt eine Vektoraddition aus von einer Komponente des adaptiven Codevektors aus dem Multiplizie rer 2706 und einer Komponente des Impulstonquellenvektors aus dem Multiplizierer 2707 und gibt den aktivierenden Tonquellenvektor aus.
  • Auch kann in dieser Ausführungsform, wie in der zwölften, dreizehnten oder vierzehnten Ausführungsform, der Einfluss des Übertragungsleitungsfehlers moderiert werden, wenn das Indexaktualisierungsmittel, das Aktualisierungsmittel für die Impulsanzahl und den Index, die festgesetzten Suchpositionen oder die phasenadaptiven Suchpositionen zur kombinierten Verwendung sind. Auch kann durch Umschalten und Betreiben der Impulstonquelle mit den festgesetzten Suchpositionen die Ausbreitung des Einflusses des Übertragungsleitungsfehlers ebenfalls verhindert werden.
  • Auch kann die Korrektureinheit für die Position des Tonhöhenscheitelwerts nach der Erfindung in der Sprachcodiervorrichtung nach einer beliebigen der dreizehnten bis elften Ausführungsformen angewendet werden.
  • Hinsichtlich der Weise zum Anheben von Impulsen wird ferner die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse, in dem Suchbereich, beispielsweise jeder von 32 Plätzen, angehoben. In diesem Fall gibt es ein Verfahren zum Suchen aller Kombinationen zum Auswählen von vier Plätzen aus den 32 Plätzen und andere Verfahren, neben dem Verfahren zum Suchen aller Kombinationen (8 × 8 × 8 × 8 Arten) in einer solchen Weise, dass die 32 Plätze in vier unterteilt werden und ein Platz aus den acht Plätzen bestimmt wird, in dem ein Impuls bereitgestellt ist. Zusätzlich kann neben der Kombination von Impulsen mit einer Amplitude 1, eine Kombination von mehreren Impulsen, beispielsweise zwei oder ein Paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplitu den oder eine andere Kombination von Impulsen angehoben werden.
  • 29 zeigt eine sechzehnte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung vom CELP Typ, die eine Phasenkontinuität einer Wellenform des Tonquellensignals zwischen kontinuierlichen Teilrahmen benutzt, um einen Existenzbereich einer Position des Tonhöhenscheitelwerts zu begrenzen, bevor die Position des Tonhöhenscheitelwerts berechnet wird. In 29 bezeichnet das Referenzzeichen 2901 ein adaptives Codebuch, das einen adaptiven Codevektor zu einer Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts und einen Multiplizierer 2908 überträgt; 2902 bezeichnet die Berechnungseinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 2901, den Tonhöhenzyklus L von außerhalb des Spracherzeugungsbereichs und einen Suchbereich für den Tonhöhenscheitelwert von einer Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts empfängt, die Position des Scheitelwerts der Tonhöhe in dem adaptiven Codevektor berechnet und eine Ausgabe an eine Verzögerungseinheit 2904 und eine Berechnungseinheit 2906 für die Suchposition überträgt; 2903 bezeichnet die Begrenzungseinheit für den Suchbereich des Tonhöhenscheitelwerts, die die Position des Tonhöhenscheitelwerts in dem unmittelbar vorher von der Verzögerungseinheit 2904 übertragenen Teilrahmen, einen Tonhöhenzyklus in dem unmittelbar vorher von einer Verzögerungseinheit 2905 übertragenen Teilrahmen und den Tonhöhenzyklus L in dem vorliegenden, von außerhalb des Tonquellenerzeugungsbereichs übertragenen Teilrahmens empfängt, die Position des Tonhöhenscheitelwerts in dem vorliegenden Teilrahmen vorhersagt, einen Suchbereich für die Position des Tonhöhenscheitelwerts auf der Grundlage der vorhergesagten Position des Tonhöhenscheitelwerts begrenzt und den Bereich an die Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts überträgt; 2904 bezeichnet die Verzögerungseinheit, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit für die Position des Tonhöhenscheitelwerts empfängt, die Eingabe um einen Teilrahmen verzögert und eine Ausgabe an die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts überträgt; 2905 bezeichnet die Verzögerungseinheit, die den Tonhöhenzyklus L von außerhalb des Tonerzeugungsbereichs empfängt, die Eingabe um einen Teilrahmen verzögert und eine Ausgabe an die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts überträgt; 2906 bezeichnet die Berechnungseinheit für die Suchposition, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L von außerhalb des Tonquellenerzeugungsbereichs empfängt, und Suchpositionen für die Impulstonquelle an eine Impulspositionssucheinheit 2907 überträgt; 2907 bezeichnet die Sucheinheit für die Impulsposition, die die Suchpositionen für den Tonquellenimpuls von der Berechnungseinheit 2906 für die Suchposition und den Tonhöhenzyklus L von außerhalb des Tonquellenerzeugungsbereichs empfängt, den empfangenen Suchbereich für den Tonquellenimpuls und den Tonhöhenzyklus L benutzt, um eine Tonquellenimpulsposition zu suchen, und einen Impulstonquellenvektor an einen Multiplizierer 2909 überträgt; 2908 bezeichnet den Multiplizierer, der den adaptiven Codevektor von dem adaptiven Codebuch empfängt, die Eingabe mit einer quantisierten Verstärkung für den adaptiven Codevektor multipliziert und eine Ausgabe an einen Addierer 2910 überträgt; 2909 bezeichnet den Multiplizierer, der den Impulstonquellenvektor von der Sucheinheit 2907 für die Impulsposition empfängt, die Eingabe mit einer quantisierten Ver stärkung für den Impulstonquellenvektor multipliziert und eine Ausgabe an den Addierer 2910 überträgt; und 2910 bezeichnet den Addierer, der Vektoren jeweils von den Multiplizierern 2908 und 2909 empfängt, eine Addition der empfangenen Vektoren ausführt und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des Tonquellenerzeugungsbereichs der Sprachcodiervorrichtung, die wie vorgenannt aufgebaut ist, wird mit Verweis auf 29 beschrieben. Das adaptive Codebuch 2901 besteht aus dem Puffer für die letzte aktivierende Tonquelle, nimmt den relevanten Bereich aus dem Puffer der aktivierenden Tonquelle heraus auf der Grundlage des Tonhöhenzyklus oder des Tonhöhenansatzes (Englisch: Pitch Lug), der durch externe Tonhöhenanalyse oder adaptive Codebuchsuchmittel erhalten worden ist, und überträgt den adaptiven Codevektor an die Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts und den Multiplizierer 2908. Der von dem adaptiven Codebuch 2901 an den Multiplizierer 2908 übertragene adaptive Codevektor wird mit der quantisierten Verstärkung des adaptiven Codevektors, die durch eine externe Verstärkungsquantisierungseinheit quantisiert worden ist, multipliziert und an den Addierer 2910 übertragen.
  • Die Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts detektiert den Tonhöhenscheitelwert von dem adaptiven Codevektor und überträgt seine Position an die Verzögerungseinheit 2904 und die Berechnungseinheit 2906 für die Suchposition. Die Position des Tonhöhenscheitelwerts kann durch Maximalisieren einer normalisierten Korrelationsfunktion des in dem Tonhöhenzyklus L angeordneten Impulskettenvektors und dem adaptiven Codevektor detektiert (berechnet) werden. Auch kann die Position des Tonhöhenscheitelwerts durch Maximalisieren der normalisierten Korrelationsfunktion des Vektors, der wird durch Faltung der Impulsantwort des Synthesefilters in dem in dem Tonhöhenzyklus L angeordneten Impulskettenvektor erhalten, und dem Vektor, der durch Faltung der Impulsantwort des Synthesefilters in dem adaptiven Codevektor erhalten wird, genauer detektiert werden. Weiterhin kann durch Anwenden einer Nachverarbeitung, bei der eine Position, die einen maximalen Amplitudenwert in einer Wellenform von einem Tonhöhenzyklus, der die detektierte Position des Tonhöhenscheitelwerts enthält, als der Tonhöhenscheitelwert benutzt werden, ein zweiter Scheitelwert in einer Wellenform eines Tonhöhenzyklus daran gehindert werden, irrtümlich detektiert zu werden.
  • Die Verzögerungseinheit 2904 verzögert die von der Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts berechnete Position des Tonhöhenscheitelwerts, um einen Teilrahmen und überträgt eine Ausgabe an die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts. Genauer gesagt wird von der Verzögerungseinheit 2904 die Position des Tonhöhenscheitelwerts in dem unmittelbar vorausgehenden Teilrahmen an die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenzyklus übertragen. Die Verzögerungseinheit 2905 verzögert den von außerhalb des Tonquellenerzeugungsbereichs übertragenen Tonhöhenzyklus L, um einen Teilrahmen und überträgt eine Ausgabe an die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts. Insbesondere wird von der Verzögerungseinheit 2905 der Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen an die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts übertragen.
  • Die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts vergleicht zuerst den Tonhöhenzyklus in dem von der Verzögerungseinheit 2905 übertragenen, unmittelbar vorausgehenden Teilrahmen und den Tonhöhenzyklus in dem derzeitigen Teilrahmen und bestimmt, ob der derzeitige Teilrahmen ein mit Sprache versehener (stationärer) Bereich ist oder nicht. Insbesondere wird, wenn der Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen eine kleine Differenz in Bezug auf den Tonhöhenzyklus in dem derzeitigen Teilrahmen aufweist (beispielsweise innerhalb ± 5 Proben), dann wird bestimmt, dass der derzeitige Teilrahmen der mit Sprache versehene (stationäre) Bereich ist. Zusätzlich kann durch Hinzufügen einer anderen Verzögerungseinheit und Benutzen des Tonhöhenzyklus von einigen Teilrahmen davor bestimmt werden, ob der derzeitige Teilrahmen ein mit Sprache versehener Bereich ist oder nicht. Wenn er als ein mit Sprache versehener (stationärer) Bereich bestimmt wird, empfängt die Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts die Position des Tonhöhenscheitelwerts in dem von der Verzögerungseinheit 2904 übertragenen, unmittelbar vorausgehenden Teilrahmen den Tonhöhenzyklus in dem von der Verzögerungseinheit 2905 übertragenen, unmittelbar vorausgehenden Teilrahmen und den Tonhöhenzyklus L in dem derzeitigen Teilrahmen, sagt die Position des Tonhöhenscheitelwerts in dem derzeitigen Teilrahmen voraus und setzt Bereiche vor und nach der vorhergesagten Position (beispielsweise 10 Abtastpunkte) als den Suchbereich für die Position des Tonhöhenscheitelwerts fest. Zusätzlich wird, wenn die vorhergesagte Position des Tonhöhenscheitelwerts in der Nähe des Beginns des Teilrahmens existiert, die Nähe von einem Tonhöhenzyklus davor zu dem Suchbereich hinzugefügt. Wenn die vorhergesagte Position des Tonhöhenscheitelwerts in der Nähe der Position von einem Tonhöhenzyklus vor dem Beginn des Teilrahmens ist, dann wird die Nähe des Beginns des Teilrahmens ebenfalls dem Suchbereich hinzugefügt. Wenn ferner bestimmt wird, dass der derzeitige Teilrahmen nicht der mit Sprache versehene (stationäre) Bereich ist, ohne den Suchbereich für den Tonhöhenscheitelwert einzugrenzen, wird der gesamte Teilrahmen als der Suchbereich für den Tonhöhenscheitelwert genutzt. Auf diese Weise wird der von der Begrenzungseinheit 2903 für den Suchbereich des Tonhöhenscheitelwerts erzielte Suchbereich für den Tonhöhenscheitelwert an die Berechnungseinheit 2902 für die Position des Tonhöhenscheitelwerts übertragen. Zusätzlich besteht zum Zeitpunkt des Beginnens des Sprachcodiervorgangs (erster Teilrahmen) der vergangene angegebene Tonhöhenzyklus L (in dem unmittelbar vorausgehenden Teilrahmen) nicht. Daher kann an die Verzögerungseinheit 2905 eine angemessene Konstante (beispielsweise der maximale oder minimale Wert des Tonhöhenscheitelwerts, Null oder ein anderer unwahrscheinlicher Tonhöhenzyklus) übertragen werden. Das gleiche gilt für die Verzögerungseinheit 2904. Ferner kann die vorhergesagte Position für den Tonhöhenscheitelwert mit der in der zehnten Ausführungsform gezeigten Gleichung (6) (siehe 19) erhalten werden.
  • Die Berechnungseinheit 2906 für die Suchposition bestimmt die Suchpositionen für den Tonquellenimpuls auf der Grundlage der Position des Tonhöhenscheitelwerts und überträgt eine Ausgabe an die Sucheinheit 2907 für die Impulsposition. Die Suchpositionen werden bestimmt, wie beispielsweise in der sechsten Ausführungsform oder der achten Ausführungsform gezeigt wird, in einer solchen Weise, dass die Suchpositionen in der Nähe des Scheitelwerts der Tonhöhe dicht verteilt sind und in den anderen Bereichen grob bzw. weiter beabstandet sind. Zusätzlich wird, wie in der sechsten Ausführungsform oder der achten Ausführungsform beschrieben, die Information über den Tonhöhenscheitelwert benutzt, um die Anzahl der Tonquellenimpulse zu verändern oder den Suchbereich für den Ton quellenimpuls zu begrenzen. Dies wird ebenfalls effektiv angewendet. Auch wenn die Suchpositionen bestimmt werden, wie in einer der zwölften bis vierzehnten Ausführungsform beschrieben, kann der Einfluss des Übertragungsleitungsfehlers moderiert werden.
  • Die Impulspositions-Sucheinheit 2907 benutzt die von der Berechnungseinheit 2906 für die Suchpositionen bestimmten Suchpositionen für die Tonquellenimpulse, oder die vorbestimmten, festgesetzten Suchpositionen und den separat übertragenen Tonhöhenzyklus L, um die optimale Kombination von Positionen zu bestimmen, wo die Tonquellenimpulse angehoben werden. In dem Impulssuchverfahren, wie das in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" beschrieben ist, wenn beispielsweise die Anzahl der Impulse vier ist, wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird die Polarität von jedem Tonquellenimpuls zu diesem Zeitpunkt vorherbestimmt, bevor die Impulspositionssuche in einer solchen Weise ausgeführt wird, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einer Komponente des Rauschcodebuchs, d.h. ein Signalvektor, der durch Subtrahieren eines Nulleingabe-Antwortsignals eines Synthesefilters zum Anwenden der auditorischen Wichtigkeit und eines Signals von einer Komponente des adaptiven Codebuchs von einer Eingabesprache mit darauf angewendeter auditorischer Wichtigkeit erhalten wird. Dann kann die Menge der arithmetischen Operationen für die Suche stark verringert werden. Auch wenn der Tonhöhenzyklus kürzer ist als die Länge des Teilrahmens, wie in der fünften Ausführungsform beschrieben, dann können die Tonquellenimpulse durch Anwenden eines in Tonhö henzyklen unterteilenden Filters in eine Kette von Tonhöhenscheitelwertimpulsen, nicht Impulsen, umgewandelt werden. In dem vorgenannten Vorgang des Unterteilens in Tonhöhenzyklen wird der Impulsantwortvektor des die auditorische Wichtigkeit aufbringenden Synthesefilters vorher durch den in Tonhöhenzyklen unterteilenden Filter hindurchgeleitet. Dann kann der Tonquellenimpuls in derselben Weise, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird, durch Maximalisieren der Gleichung (2) gesucht werden. In den entsprechenden, auf diese Weise bestimmten Positionen des Tonquellenimpulses werden die Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Anschließend kann der Impulstonquellenvektor unter Benutzung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird an den Multiplizierer 2909 übertragen. Der von der Impulspositionssucheinheit 2907 an den Multiplizierer 2909 übertragene Impulstonquellenvektor wird mit der durch die externe Verstärkungsquantisierungseinheit quantisierten, quantisierten Verstärkung für den Impulstonquellenvektor multipliziert und an den Addierer 2910 übertragen.
  • Der Addierer 2910 führt eine Vektoraddition einer Komponente des adaptiven Codevektors von dem Multiplizierer 2908 und einer Komponente des Impulstonquellenvektors von dem Multiplizierer 2909 aus und gibt den aktivierenden Tonquellenvektor aus.
  • Hinsichtlich die Weise zum Anheben der Impulse wird ferner die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse in dem Suchbereich angehoben, beispielsweise jedem von 32 Plätzen. In diesem Fall gibt es, wie vorgenannt, neben dem Verfahren zum Suchen aller Kombinationen (8 × 8 × 8 × 8 Arten) in einer solchen Weise, dass die 32 Plätze in vier unterteilt werden und ein Platz aus den acht Plätzen bestimmt wird, indem ein Puls bereitgestellt wird, ein Verfahren zum Suchen aller Kombinationen, zum Aussuchen von vier Plätzen aus den 32 Plätzen sowie andere Verfahren. Zusätzlich kann neben der Kombination von Impulsen mit einer Amplitude 1 eine Kombination von mehreren Impulsen, beispielsweise zwei oder einem Paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben werden.
  • 30 zeigt eine siebzehnte, weiter entwickelte Ausführungsform der Erfindung und einen Tonquellenerzeugungsbereich einer Sprachcodiervorrichtung vom CELP Typ, die versehen ist mit: einer Impulssuchvorrichtung, die festgesetzte Suchpositionen verwendet, die eine kleine Anzahl von Impulsen und jedem Impuls zugewiesene ausreichende Positionsinformation aufweist; einer Impulssuchvorrichtung, die Tonquellenimpuls-Suchpositionen mit einer großen Anzahl von Impulsen und nicht notwendigerweise jedem Impuls zugewiesener ausreichender Positionsinformation aufweist; und einer Auswahleinheit, die einen optimalen Impulstonquellenvektor aus den von diesen Suchvorrichtungen übertragenen Impulstonquellenvektor auswählt.
  • In 30 bezeichnet das Referenzzeichen 3001 ein adaptives Codebuch, das den letzten aktivierenden Tonquellenvektor speichert und einen ausgewählten adaptiven Codevektor an eine Berechnungseinheit 3002 für die Position des Tonhöhenscheitelwerts und einen Multiplizierer 3007 für die Tonhöhenverstärkung überträgt; 3002 bezeichnet die Berechnungseinheit für die Position des Tonhöhenscheitelwerts, die den adaptiven Codevektor von dem adaptiven Codebuch 3001 und den Tonhöhenzyklus L von außer halb empfängt, eine Position des Tonhöhenscheitelwerts berechnet und eine Ausgabe an eine Berechnungsvorrichtung 3003 für die Suchposition überträgt; 3003 bezeichnet die Berechnungseinheit für die Suchposition, die die Position des Tonhöhenscheitelwerts von der Berechnungseinheit 3002 für die Position des Tonhöhenscheitelwerts und den Tonhöhenzyklus L von außerhalb empfängt und die Suchpositionen für die Tonquellenimpulse an eine Suchvorrichtung 3004 für die Impulspositionen überträgt; 3004 bezeichnet die Suchvorrichtung für die Impulspositionen, die die von der Berechnungseinheit 3003 für die Suchpositionen übertragenen Suchpositionen und den separat außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L empfängt, eine Impulstonquelle sucht und einen Impulstonquellenvektor 1 an eine Auswahleinheit 3005 überträgt; 3005 bezeichnet die Auswahleinheit, die den Impulstonquellenvektor 1 von der Suchvorrichtung 3004 für die Impulsposition und einen Impulstonquellenvektor 2 von der Suchvorrichtung 3006 für die Impulsposition empfängt, einen optimalen Impulstonquellenvektor auswählt und eine Ausgabe an einen Multiplizierer 3008 überträgt; 3006 bezeichnet die Impulspositions-Suchvorrichtung, die vorbestimmte, festgesetzte Suchpositionen und den von außerhalb des Tonquellenerzeugungsbereichs übertragenen Tonhöhenzyklus L empfängt, die Impulstonquelle sucht und den Impulstonquellenvektor 2 an die Auswahleinheit 3005 überträgt; 3007 bezeichnet den Multiplizierer, der den adaptiven Codevektor von dem adaptiven Codebuch 3001 mit einer Verstärkung für den adaptiven Codevektor multipliziert und eine Ausgabe an einen Addierer 3009 überträgt; 3008 bezeichnet den Multiplizierer, der den Impulstonquellenvektor von der Auswahleinheit 3005 mit einer Verstärkung für den Impulstonquellenvektor multipliziert und eine Ausgabe an den Addierer 3009 überträgt; und 3009 bezeichnet den Addierer, der die Ausgabe von dem Multipli zierer 3007 und die Ausgabe von dem Multiplizierer 3008 empfängt, eine Vektoraddition ausführt und einen aktivierenden Tonquellenvektor ausgibt.
  • Der Betrieb des wie vorgenannt aufgebauten Tonquellenerzeugungsbereichs wird mit Verweis auf 30 beschrieben. In 30 schneidet das adaptive Codebuch 3001 den adaptiven Codevektor, der nur die Länge des Teilrahmens aufweist, von einem Punkt, der nur um den vorher außerhalb des Tonquellenerzeugungsbereichs berechneten Tonhöhenzyklus L zurück in die Vergangenheit zurückgenommen worden ist, und gibt den adaptiven Codevektor heraus. Wenn der Tonhöhenzyklus L weniger ist als die Länge des Teilrahmens, dann werden die ausgeschnittenen Vektoren, die jeweils den Tonhöhenzyklus L aufweisen, wiederholt zusammenverbunden, bis die Länge des Teilrahmens erreicht wird. Dann wird der zusammenverbundene Vektor als der adaptive Codevektors ausgegeben.
  • Die Berechnungseinheit 3002 für die Position des Tonhöhenscheitelwerts benutzt den von dem adaptiven Codebuch 3001 übertragenen adaptiven Codevektor, um die Position des Tonhöhenscheitelwerts zu bestimmen, die in dem adaptiven Codevektor existiert. Die Position des Tonhöhenscheitelwerts kann durch Maximalisieren einer normalisierten Korrelationsfunktion der in dem Tonhöhenzyklus angeordneten Impulskette und dem adaptiven Codevektor bestimmt werden. Auch kann sie durch Minimalisieren eines Fehlers (Maximalisieren der normalisierten Korrelationsfunktion) der in dem Tonhöhenzyklus angeordneten Impulskette, die durch ein Synthesefilter hindurch gelaufen ist, und dem adaptiven Codevektor, der durch das Synthesefilter hindurch gelaufen ist, genauer erhalten werden. Ferner können durch Bereitstellen der Korrekturvorrichtung für die Position des Tonhöhenscheitelwerts wie in der fünfzehnten Ausführungsform beschrieben, Fehler in der Berechnung der Position des Tonhöhenscheitelwerts verringert werden.
  • Die Berechnungseinheit 3003 für die Suchposition bestimmt die Suchpositionen für die Tonquellenimpulse auf der Grundlage der von der Berechnungseinheit 3002 für die Position des Tonhöhenscheitelwerts übertragenen Position des Tonhöhenscheitelwerts, und überträgt eine Ausgabe an die Suchvorrichtung 3004 für die Impulsposition. Zum Bestimmen der Suchpositionen wird, wie in der fünften, sechsten oder vierzehnten Ausführungsform, die Suchpositionen für die Tonquellenimpulse in einer solchen Weise begrenzt, dass sie in der Nähe der Position des Tonhöhenscheitelwerts dicht werden und in den anderen Bereichen weiter voneinander beabstandet. Das Begrenzungsverfahren beruht auf dem statistischen Ergebnis, dass Positionen mit einer hohen Wahrscheinlichkeit des Ansteigens von Impulsen in der Nähe des Tonhöhenimpulses konzentriert sind. Wenn der Suchbereich für die Impulsposition nicht begrenzt wird, dann ist in dem mit Sprache versehenen Bereich eine Wahrscheinlichkeit, dass Impulse in der Nähe des Tonhöhenimpulses angehoben sind, höher als eine Wahrscheinlichkeit, dass Impulse in den anderen Bereichen angehoben werden. Zusätzlich kann durch Verwendung des Verfahrens des Bestimmens der Suchpositionen der Tonquellenimpulse, wie in einer der zwölften bis fünfzehnten Ausführungsform beschrieben, der Einfluss der Übertragungsleitungsfehler verringert werden.
  • Die Suchvorrichtung 3004 für die Impulsposition benutzt die von der Berechnungseinheit 3003 für die Suchpositionen übertragenen Suchpositionen für die Tonquellenimpulse und den separat übertragenen Tonhöhenzyklus L, um die optimale Kombination der Positionen zu bestimmen, wo die Tonquellenimpulse angehoben werden. In dem Impulssuchverfahren, wie in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996", beschrieben, wenn beispielsweise die Anzahl der Impulse vier ist, wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Zusätzlich wird die Polarität von jedem Tonquellenimpuls zu diesem Zeitpunkt vorherbestimmt, bevor die Impulspositionssuche in einer solchen Weise ausgeführt wird, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einer Komponente des Rauschcodebuchs, d.h. ein Signal, das erhalten wird durch Subtrahieren eines Nulleingabe-Antwortsignals eines Synthesefilters zum Anwenden der auditorischen Wichtigkeit und eines Signals einer Komponente des adaptiven Codebuchs von einer Eingabestimme mit darauf angewendeter auditorischer Wichtigkeit. Dann kann die Menge der arithmetischen Operationen für die Suche stark verringert werden. Wenn ferner der Tonhöhenzyklus kürzer ist als die Länge des Teilrahmens, wie in der fünfzehnten Ausführungsform beschrieben, dann können durch Anwenden eines in Tonhöhenzyklen unterteilenden Filters die Tonquellenimpulse in eine Kette von Tonhöhenzyklenpulsen, nicht Impulsen, umgewandelt werden. In dem vorgenannten, in Tonhöhenzyklen unterteilenden Prozess wird der Impulsantwortvektor des die auditorische Wichtigkeit aufbringenden Synthesefilters vorher durch das in den Pulszyklen unterteilende Filter hindurch geleitet. Dann wird in derselben Weise, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird, der Tonquellenimpuls durch Maximalisieren der Gleichung (2) gesucht. In den entsprechenden, auf diese Weise bestimmten Tonquellenimpulspositionen werden Pulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Ton quellenimpuls angehoben. Anschließend kann der Impulstonquellenvektor durch Verwenden des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird als der Impulstonquellenvektor 1 an die Auswahleinheit 3005 übertragen. Zusätzlich weisen die von der Suchvorrichtung 3004 für die Impulspositionen verwendeten Tonquellenimpuls-Suchpositionen eine große Anzahl von Tonquellenimpulsen auf. Daher ist die jedem Tonquellenimpuls zugeordnete Positionsinformation nicht notwendigerweise ausreichend. Insbesondere weist der Modus des Verwendens der Suchvorrichtung 3004 für die Impulsposition eine große Anzahl von Impulsen auf, kann jedoch nicht notwendigerweise jede Impulsposition streng darstellen. Wenn ein Mangel von den jeweiligen Impulspositionsinformationen auftritt, wird auf diese Weise das Verfahren zum Bestimmen der Impulssuchpositionen effektiv eingesetzt, wie von der Berechnungseinheit 3003 für die Suchposition ausgeführt.
  • Die Suchvorrichtung 3006 für die Impulsposition benutzt die vorbestimmten, festgesetzten Suchpositionen und den separat von außerhalb des Tonquellenerzeugungsbereichs übertragenen Tonhöhenzyklus L, um die optimale Kombination von Position zu bestimmen, wo die Tonquellenimpulse angehoben werden. In dem Impulssuchverfahren, wie in "ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), März 1996" beschrieben, wenn beispielsweise die Anzahl der Impulse vier ist, wird die Kombination von i0 bis i3 in einer solchen Weise bestimmt, dass die in der sechsten Ausführungsform gezeigte Gleichung (2) maximalisiert wird. Bevor die Impulspositionssuche ausgeführt wird, ist ferner die Polarität von jedem Tonquellenimpuls zu diesem Zeitpunkt in einer sol chen Weise vorherbestimmt, dass die Polarität gleich wird wie die Polarität in jeder Position des Zielvektors einer Komponente des Rauschcodevektors, d.h. ein Signalvektor, der durch Subtrahieren eines Nulleingabe-Antwortsignals eines Synthesefilters zum Anwenden der auditorischen Wichtigkeit und ein Signal einer Komponente eines adaptiven Codebuchs von einer Eingabestimme mit darauf aufgebrachter auditorischer Wichtigkeit erhalten wird. Dann kann die Menge der arithmetischen Operationen für die Suche stark verringert werden. Auch wenn der Tonhöhenzyklus kürzer ist als die Länge des Teilrahmens, wie in der fünften Ausführungsform beschrieben, dann kann durch Anwenden des in Tonhöhenzyklen unterteilenden Filters die Tonquellenimpulse in eine Kette von Tonhöhenzyklenpulsen, nicht Impulsen, umgewandelt werden. In dem vorgenannten in Tonhöhenzyklen unterteilenden Prozess wird der Impulsantwortvektor des die auditorische Wichtigkeit anwendenden Synthesefilters vorher durch den in Tonhöhenzyklen unterteilenden Filter hindurch geleitet. Dann wird in derselben Weise, wie in dem Fall, wo das Unterteilen in Tonhöhenzyklen nicht ausgeführt wird, der Tonquellenimpuls durch Maximalisieren der Gleichung (2) gesucht. In den auf diese Weise bestimmten, entsprechenden Tonquellenimpulspositionen werden Impulse in Übereinstimmung mit jeder bestimmten Polarität von jedem Tonquellenimpuls angehoben. Anschließend kann der Impulstonquellenvektor unter Verwendung des Tonhöhenzyklus L und Anwenden des in Tonhöhenzyklen unterteilenden Filters bereitgestellt werden. Der bereitgestellte Impulstonquellenvektor wird als der Impulstonquellenvektor 2 an die Auswahleinheit 3005 übertragen. Hierbei muss in den an die Suchvorrichtung 3006 für die Impulspositionen übertragenen festen Suchpositionen die Anzahl von Tonquellenimpulse in einer solchen Weise verringert werden, dass ausreichend Positionsinformation für jeden Tonquellenimpuls bereitgestellt wird (insbesondere sind in dem Teilrahmen alle Punkte in dem festen Suchpositionsmuster enthalten). Wenn die Anzahl der Impulse verringert wird, während die Positionen mit darin angehobenen Impulsen genau dargestellt werden kann, dann kann die Qualität der synthetisierten Sprache in den Bereich mit ansteigender Sprache und dergleichen verbessert werden. Auch kann die Verschlechterung, die auftritt, wenn nur der Modus verwendet wird, in dem ein Mangel an Positionsinformation besteht, durch Bereitstellung des Modus, in dem die Positionsinformationen ausreichend ist, verhindert werden.
  • Ferner zeigt 30 zwei Typen der Impulspositionssuchvorrichtungen. Jedoch kann durch Vergrößern der Suchvorrichtungen auf drei Typen oder mehr das Umschalten in Übereinstimmung mit den Merkmalen der Eingangssignale ausgeführt werden. Auch werden anstelle der von der Berechnungseinheit 3003 für die Suchpositionen übertragenen Suchpositionen für die Tonquellenimpulse die vorbestimmten, festgesetzten Suchpositionen an die Suchvorrichtung 3004 für die Impulspositionen übertragen. Selbst in diesem Aufbau kann durch Verwendung des Modus, in dem die jedem Impuls zugewiesene Positionsinformation ausreichend ist und eine kleine Anzahl von Impulsen bereitgestellt wird, die Qualität der Sprache, die in dem Bereich mit ansteigender Stimme und dergleichen synthetisiert wird, effektiv verbessert werden. Auch kann die Verschlechterung der synthetisierten Sprachqualität verhindert werden, die auftritt, wenn nur der Modus benutzt wird, in dem ein Mangel an Positionsinformation vorliegt. Wenn jedoch die Suchvorrichtung 3004 für die Impulsposition die von der Berechnungseinheit 3003 für die Suchpositionen bestimmten Tonquellenimpulssuchpositionen benutzt, um die Impulspositionssuche auszuführen, dann kann in dem mit Sprache versehenen Bereich, der das Merkmal aufweist, dass die Tonquellenimpulse leicht in der Nähe des Tonhöhenscheitelwerts angehoben werden, der Modus mit einer großen Anzahl von Impulsen mit einer verbesserten Effizienz benutzt werden.
  • Die Auswahleinheit 3005 vergleicht den von der Impulspositionssuchvorrichtung 3004 übertragenen Impulstonquellenvektor 1 und den von der Impulspositionssuchvorrichtung 3006 übertragenen Impulstonquellenvektor 2 wählt den Vektor aus, der eine geringere Verzerrung in der synthetisierten Sprache aufweist, und überträgt den optimalen Impulstonquellenvektor an den Multiplizierer 3008. Der von der Auswahleinheit 3005 an den Multiplizierer 3008 übertragene Impulstonquellenvektor wird mit der quantisierten Verstärkung für den Impulstonquellenvektor, die durch die externe Verstärkungsquantisierungseinheit quantisiert worden ist, multipliziert und an den Addierer 3009 übertragen. Zusätzlich wird, wie das in 30 ausgelassen worden ist, in den Impulspositionssuchvorrichtungen 3004 und 3006 des Codierers, zusammen mit den Impulstonquellenvektoren 1 und 2, die Polarität von jedem Tonquellenimpuls, die für jeden Impulstonquellenvektor indikativ ist, und die Indexinformation separat an die Auswahleinheit 3005 übertragen. Ferner wird von der Auswahleinheit 3005 die Information darüber, welcher der Impulstonquellenvektoren 1 und 2 ausgewählt worden ist, und jede Impulspolarität und Index, der für den ausgewählten Impulstonquellenvektor indikativ ist, nach außerhalb des Tonquellenerzeugungsbereichs übertragen. Die Auswahlinformation und die Polarität des Tonquellenimpulses und die Indexinformation werden durch einen Codierer, eine Multiplexeinheit und dergleichen hindurch geleitet, in eine Reihe von einer Übertragungsleitung zuzuführenden Daten umgewandelt, und zu der Übertragungsleitung übertragen.
  • Der Addierer 3009 führt eine Vektoraddition einer Komponente des adaptiven Codevektors aus dem Multiplizierer 3007 und einer Komponente des Impulstonquellenvektors aus dem Multiplizierer 3008 aus und sendet den aktivierenden Tonquellenvektor aus.
  • Auch in dieser Ausführungsform, genauso wie in der zwölften, dreizehnten oder vierzehnten Ausführungsform, wenn das Indexaktualisierungsmittel, das Aktualisierungsmittel für die Impulsnummer und den Index, die festgesetzte Suchposition oder die phasenadaptive Suchposition in der früheren Stufe der Impulspositionssucheinheit 3004 zur kombinierten Benutzung ist, dann kann die Eigenschaft, dass der Einfluss des Übertragungsleitungsfehlers aufgrund der Benutzung der Berechnungseinheit 3003 für die Suchposition leicht ausgeübt wird, ausgeschaltet werden.
  • Hinsichtlich der Weise zum Anheben der Impulse kann ferner die vorbestimmte Anzahl von Impulsen, beispielsweise vier Impulse, in dem Suchbereich, beispielsweise jeder beliebige von 32 Plätzen, angehoben werden. In diesem Fall gibt es, wie vorgenannt, neben dem Verfahren des Suchens aller Kombinationen (8 × 8 × 8 × 8 Arten) in einer solchen Weise, dass die 32 Plätze in vier Plätze unterteilt werden und ein Platz aus den acht Plätzen bestimmt wird, in dem ein Puls bereitgestellt wird, ein Verfahren zum Suchen aller Kombinationen zum Auswählen von vier Plätzen aus den 32 Plätzen sowie andere Verfahren. Zusätzlich können neben der Kombination von Impulsen mit einer Amplitude 1 eine Kombination von mehreren Impulsen, beispielsweise zwei oder ein paar von Impulsen, eine Kombination von Impulsen mit verschiedenen Amplituden oder eine andere Kombination von Impulsen angehoben werden.
  • Ferner kann in dem Modus, in dem eine kleine Anzahl von Impulsen und ausreichend Impulspositionsinformation vorliegt, innerhalb eines Bereichs, in dem es keinen Mangel an Impulspositionsinformationen gibt, ein Teil der Impulsposition für den Index, der für den Rauschcodevektor indikativ ist, bereitgestellt werden. Dann kann die Leistungsfähigkeit in einem Bereich mit ansteigender Sprache, einem nicht mit Sprache versehenen, konsonanten Bereich und einem Rauscheingabesignal verbessert werden.
  • Ebenfalls kann die Tonquellenerzeugungsfunktion in der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung, die in der obigen ersten bis siebzehnten Ausführungsform beschrieben worden ist, auf einer magnetischen Platte, einer optischen magnetischen Platte, einer CD, DVD oder einer anderen optischen Scheibe, einer EC Karte, einem ROM, RAM oder einem anderen Aufnahmemedium oder einem Speichermedium. als ein Programm aufgezeichnet werden. Daher kann durch Lesen durch einen Computer der aufgenommenen Daten von dem Aufnahmemedium oder dem Speichermedium die Funktion der Sprachcodiervorrichtung realisiert werden.
  • Im obigen ist der Tonquellenerzeugungsbereich in der Sprachcodiervorrichtung und der Sprachdecodiervorrichtung beschrieben worden. Wenn der Tonquellenerzeugungsbereich in einer Sprachcodiervorrichtung vom CELP Typ und einer Sprachdecodiervorrichtung vom CELP Typ, die unten beschrieben wird, benutzt wird, dann erfüllt sie ihren Effekt.
  • 31 ist ein Blockdiagramm, das die Komponenten einer weiter entwickelten Ausführungsform einer Sprachcodiervorrichtung vom CELP Typ nach der Erfindung zeigt. In dem Blockdiagramm werden in einem Codebuch-Block, der mit ei ner gestrichelten Linie umrandet ist, und einem Tonquellenvektor-Block, der mit einer abwechselnd lang und kurz gestrichelten Linie umrandet ist, die Aufbauten der vorgenannten Ausführungsformen verwendet. Insbesondere wird, wie das beispielsweise in 1 oder 3 gezeigt ist, die Ausführungsform, die zum Bereitstellen des adaptiven Codevektors und des Rauschcodevektors aufgebaut ist, als der Codebuch-Block in 31 eingesetzt. Andererseits wird, wie beispielsweise in 8, 12, 14, 15, 17, 18, 20, 21, 23, 25, 27, 29 oder 30 gezeigt, die Ausführungsform, die zum Bereitstellen des aktivierenden Tonquellenvektors aufgebaut ist, als der Tonquellenvektor-Block in 31 benutzt. Zusätzlich zeigen in 31 der Tonquellenvektor-Block und der Codebuch-Block, die einen Teil des Tonquellenvektor-Blocks selbst bilden, einen herkömmlichen Aufbau.
  • In 31 wird ein Zeitseriencode als Ausgangsdatum eines adaptiven Codebuchs 3401 an einen Vektormultiplizierer 3004 übertragen und mit einem Verstärkungscode G0 multipliziert. Andererseits wird ein Zeitseriencode als Ausgangsdatum eines adaptiven Codebuchs 3002 an einen Vektormultiplizierer 3004 übertragen und mit einem Verstärkungscode G1 multipliziert. Die Ausgänge der Vektormultiplizierer 3403 und 3404 werden gegenseitig in einem Addierer 3405 addiert. Dessen Ergebnis wird über ein Synthesefilter 3407 an den Negativ-Eingang eines Addierers 3410 übertragen. Ein Eingabesprachsignal wird an den Analysator 3406 für lineare Vorhersage übertragen und ferner an einen Positiv-Eingang des Addierers 3410 übertragen. In dem Analysierer 3406 für lineare Vorhersage wird die Eingabesprache linear vorhergesagt und analysiert und ferner quantisiert. Dann wird ein Vorhersagekoeffizient L als ein Teil einer codierten Ausgabe übertragen und als ein Koeffizient des Synthesefilters 3407 gesetzt. Ausga bedaten des Addierers 3410 werden an eine Verzerrungsminimalisierungseinheit 3409 gegeben. Zum Minimalisieren der Verzerrung der in dem Synthesefilter 3407 synthetisierten Wellenform wird ein Signal zum Steuern eines Vektorausschneidens in den adaptiven Codebüchern 3401 und 3402 erzeugt. Um die Verzerrung zu minimalisieren, erzeugt insbesondere die Verzerrungsminimalisierungseinheit 3409 jeweils Steuersignale zum Steuern des adaptiven Codebuchs 3401, des adaptiven Codebuchs 3402 und einer Verstärkungsquantisierungseinheit 3408, und überträgt die Signale zu diesen Schaltkreisen.
  • Die Codes A, S, G und L, die in den später beschriebenen 31 und 32 für Daten indikativ sind, sind wie folgt:
    • A: Indexinformation (übertragen von der Codiervorrichtung an die Decodiervorrichtung), die für den adaptiven Codevektor, der schlussendlich von der Verzerrungsminimalisierungseinheit 3409 ausgewählt worden ist, indikativ sind;
    • S: Indexinformation (übertragen von der Codiervorrichtung an die Decodiervorrichtung), die für den Rauschcodevektor, der schlussendlich von der Verzerrungsminimalisierungseinheit 3409 ausgewählt worden ist, indikativ ist;
    • G: Quantisierungsinformation (übertragen von der Codiervorrichtung an die Decodiervorrichtung), die die Quantifisierungsverstärkung darstellt, die schlussendlich von der Verzerrungsminimalisierungseinheit 3409 bestimmt worden ist;
    • L: Information (übertragen von der Codiervorrichtung an die Decodiervorrichtung), die den linearen Vorhersagekoeffizient darstellt, der von dem Analysierer 3406 für die lineare Vorhersage quantisiert worden ist.
  • In den entsprechenden, vorgenannten Ausführungsformen ist die Realisierung der Sprachcodiervorrichtung nach der Erfindung beschrieben worden. In der Erfindung ist jedoch das Verfahren zum Bereitstellen des Tonquellenvektors mit dem Merkmal bereitgestellt. Das Merkmal kann der Sprachdecodiervorrichtung, so wie es ist, zugeführt bzw. aufgebracht werden. Daher können die vorgenannten entsprechenden Ausführungsformen in dem Tonquellenvektorerzeugungsbereich der Sprachdecodiervorrichtung vom CELP Typ so wie sie sind benutzt werden. Um diesen Zusammenhang klarzustellen, wird die Sprachdecodiervorrichtung vom CELP Typ nach der Erfindung im folgenden beschrieben.
  • 32 ist ein Blockdiagramm, das die Komponenten einer weiter entwickelten Ausführungsform der Sprachdecodiervorrichtung vom CELP nach der Erfindung zeigt. In dem Blockdiagramm werden in einem Codebuch-Block, der mit einer gestrichelten Linie umrandet ist, und einem Tonquellenvektor-Block, der mit einer abwechselnden lang- und kurzgestrichelten Linie umrandet ist, der vorgenannten Aufbau der Ausführungsformen benutzt. Insbesondere wird, wie in 1, 3 oder dergleichen gezeigt, die Ausführungsform, die zum Bereitstellen des adaptiven Codevektors und des Rauschcodevektors aufgebaut ist, in dem Codebuch-Block in 32 benutzt. Andererseits wird, wie in den 8, 12, 14, 15, 17, 18, 20, 21, 23, 25, 27, 29, 30 oder dergleichen gezeigt, die Ausführungsform, die zum Bereitstellen des aktivierenden Tonquellenvektors aufgebaut ist, als der Tonquellenvektorblock in 30 benutzt. Zusätzlich zeigen in 32 der Tonquellenvektorblock und der Codebuchblock, die ihrerseits selbst einen Teil davon ausbilden, einen herkömmlichen Aufbau.
  • In 32 wird ein Zeitseriencode als Ausgangsdatum eines adaptiven Codebuchs 3501 an einen Vektormultiplizie rer 3503 übertragen und mit einem Verstärkungscode G0 multipliziert. Andererseits wird ein Zeitseriencode als Ausgangsdatum eines adaptiven Codebuchs 3502 an einen Vektormultiplizierer 3504 übertragen und mit einem Verstärkungscode G1 multipliziert. Die Ausgänge der Vektormultiplizierer 3503 und 3504 werden gegeneinander in einem Addierer 3505 addiert. Dessen Ergebnis wird über ein Synthesefilter 3507 als eine decodierte Sprache übertragen. Ein Filterkoeffizient des Synthesefilters 3507 wird von einer Decodiereinrichtung 3506 für den linearen Vorhersagekoeffizient zum Decodieren einer linearen Vorhersagekoeffizienz bereitgestellt. Die Verstärkungscodes G1 und G0 werden von einem Verstärkungsdecodierer 3508 bereitgestellt.
  • Wie vorgenannt wird in der Sprachcodiervorrichtung vom CELP Typ und/oder der Sprachdecodiervorrichtung vom CELP Typ nach der Erfindung jeweils die Amplitude des Rauschcodevektors betont, die der Position des Tonhöhenscheitelwerts des adaptiven Codevektors zu dem Zeitpunkt des Codierens und/oder Decodierens einer Sprache entsprechen. Dann kann die Tonqualität durch Verwendung der in einer Tonhöhenwellenform existierenden Phaseninformation verbessert werden. Daher kann die Erfindung vorzugsweise, beispielsweise als ein digitales Signal in einer Sprachkommunikationsvorrichtung, die Funkkommunikation oder optische Funkkommunikation ausführt, eingesetzt werden.
  • 33 ist ein Blockdiagramm, das eine diagrammatische Darstellung eines Mobilfunk-Endgeräts darstellt, das eine Sprachcodiervorrichtung 3301 vom CELP Typ nach der vorliegenden Erfindung verwendet. Ein Ausgangssignal der Sprachcodiervorrichtung 3301 wird beispielsweise durch QPSK (Englisch: Quadrature Differential Phase Shift Keying) in einem Modulator 3302 digital moduliert. Zusätz lich wird das Signal in ein Signal formatiert, das für beispielsweise ein CDMA (Codeunterteilungsmehrfachzugang, Englisch: Code Division Multiple Access) Verfahren ausgebildet ist, ein TDMA (zeitunterteilter Mehrfachzugang, Englisch: Time Division Multiple Access) Verfahren und andere vorherbestimmte Zugangsverfahren, mittels eines Verstärkers 3303 verstärkt und von einer Antenne 3304 abgestrahlt. Ferner kann, wie nicht gezeigt wird, die Sprachdecodiervorrichtung der Erfindung in ähnlicher Weise in dem Mobilfunk-Endgerät eingesetzt werden.
  • Industrielle Anwendbarkeit
  • Nach der Erfindung wird das Amplituden verstärkende Fenster mit dem Rauschcodevektor multipliziert, wie das von den vorgenannten Ausführungsformen offensichtlich ist, um die Amplitude des Rauschcodevektors, der der Position des Tonhöhenscheitelwerts des adaptiven Codevektors entspricht, zu betonen. Daher kann die Tonqualität durch Verwenden der in einer Tonhöhenwellenform existierenden Phaseninformation verbessert werden.
  • Ebenfalls nach der Erfindung wird der Rauschcodevektor, der nur in der Nähe des Tonhöhenscheitelwerts des adaptiven Codevektors begrenzt ist, benutzt. Daher kann, selbst wenn für den Rauschcodevektor eine kleine Anzahl von Bits bereitgestellt ist, die Verschlechterung der Sprachqualität minimalisiert werden. Auch kann die Sprachqualität in dem mit Sprache versehenen Bereich verbessert werden, indem die Leistung in der Nähe des Tonhöhenscheitelwerts konzentriert ist.
  • Ferner wird nach der Erfindung der Suchbereich der Impulsposition auf der Grundlage der Position des Tonhöhenscheitelwerts und des Tonhöhenzyklus des adaptiven Code vektors bestimmt. Daher kann die Impulsposition in Übereinstimmung mit dem Tonhöhenzyklus in einer einzelnen Tonhöhenwellenform gesucht werden. Selbst wenn eine kleine Anzahl von Bits für die Impulsposition bereitgestellt ist, kann die Verschlechterung der Sprachqualität minimalisiert werden.
  • Ferner kann durch Begrenzen des Impulssuchbereichs auf die Länge; die ein wenig länger ist, als ein einziger Tonhöhenzyklus, das Tonquellensignal, das eine Tonhöhenperiodizität aufweist, effizient dargestellt werden. Auch sind zwei Tonhöhenscheitelwerte in dem Suchbereich enthalten, jedoch können der Fall, in dem ein erster Tonhöhenscheitelwert in seiner Konfiguration verschieden ist von einem zweiten Tonhöhenscheitelwert, oder der Fall, in dem die Position des ersten Tonhöhenscheitelwerts fälschlicherweise detektiert wird, behandelt werden.
  • Ebenfalls kann die Erfindung weiter entwickelt werden in einen Aufbau, bei dem die Anzahl der Impulse angepasst ist und in Übereinstimmung mit dem Tonhöhenzyklus eines eingegebenen Sprachsignals verändert wird. Daher kann die Sprachqualität verbessert werden, ohne dass neue Information zum Umschalten der Anzahl der Impulse erforderlich ist.
  • Vorzugsweise wird die Impulsamplitude in der Nähe des Tonhöhenscheitelwerts und in den anderen Bereich bestimmt, bevor die Impulsposition besucht wird. Daher kann die Konfiguration einer einzelnen Tonhöhenwellenform effizient dargestellt werden.
  • Ebenfalls bevorzugt kann die Impulstonquelle, die für jede der mit Sprache versehenen ansteigenden Bereiche/nicht mit Sprache versehenen Bereich und den mit Sprache verse henen stationären Bereich/den mit Sprache versehenen Bereich geeignet ist, durch Verwenden der Kontinuität des Tonhöhenzyklus zum Umschalten der Impulssuchpositionen gesucht werden. Daher kann die Sprachqualität verbessert werden.
  • Ebenfalls wird die Tonhöhenverstärkung in dem derzeitigen Teilrahmen (die Verstärkung des adaptiven Codevektors) in einer ersten Stufe quantisiert durch Benutzung einer Tonhöhenverstärkung, die unmittelbar nachdem der adaptive Codevektor gesucht wird, erhalten wird. Ein Unterschied bzw. eine Differenz zwischen der optimalen Tonhöhenverstärkung, die in dem letzten der Tonquellensuche erhalten worden ist, und der in der ersten Stufe quantisierten Tonhöhenverstärkung wird in einer zweiten Stufe konzipiert. Daher wird in der Sprachcodiervorrichtung vom CELP Typ, die einen Treiber-Tonquellenvektor aus der Summe des adaptiven Codebuchs und des festgesetzten Codebuchs (Rauschcodebuch) bereitstellt, die Information, die vor dem Durchsuchen des festgesetzten Codebuchs (Rauschcodebuch) erhalten wird, quantisiert und übertragen. Daher kann das Umschalten des festgesetzten Codebuchs (Rauschcodebuch) oder dergleichen ausgeführt werden, ohne eine unabhängige Modusinformation anzuwenden. Sprachinformation kann effizient codiert werden.
  • Vorzugsweise wird auf der Grundlage der Kontinuität des Tonhöhenzyklus, der in der Vergangenheit codiert worden ist, oder der Größe (oder der Kontinuität) der Tonhöhenverstärkung, die in der Vergangenheit codiert worden ist, die Tonhöhenperiodizität des Sprachsignals in dem derzeitigen Teilrahmen bestimmt. Dann wird die Impulstonquellensuchposition umgeschaltet. Daher kann die Impulstonquellensuche für jeden Bereich geeignet ausgeführt werden, ohne neue Information zum bestimmend des Bereichs mit einer hohen oder einer niedrigen Tonhöhenperiodizität anzuwenden. Daher kann die Sprachqualität mit derselben Menge an Information verbessert werden.
  • Vorzugsweise werden die Position des Tonhöhenscheitelwerts in dem unmittelbar vorausgehenden Teilrahmen, der Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und der Tonhöhenzyklus in dem derzeitigen Teilrahmen benutzt, um die Position des Tonhöhenscheitelwerts in dem derzeitigen Teilrahmen rückwärts vorherzusagen. Durch Benutzen der vorhergesagten Position des Tonhöhenscheitelwertes wird umgeschaltet, ob der Phasenanpassungsprozeß ausgeführt wird oder nicht. Daher kann der Phasenanpassungsprozeß umgeschaltet werden, ohne die Umschaltinformation erneut zu übertragen. Mit derselben Informationsmenge kann die Sprachqualität verbessert werden. Zusätzlich kann in dem Modus, in dem der Phasenanpassungsprozeß nicht ausgeführt wird, das festgesetzte Codebuch benutzt werden. Wenn die Bedingung, dass das festgesetzte Codebuch in dem nicht mit Sprache versehenen Bereich oder dergleichen weiterhin benutzt wird, dann kann die Ausbreitung eines Fehlers auf die phasenadaptive Tonquelle effektiv zurückgesetzt werden.
  • Vorzugsweise wird durch Benutzung der Konzentration der Signalleistung in der Nähe des Tonhöhenscheitelwerts des adaptiven Codevektors umgeschaltet, ob eine Phasenanpassung ausgeführt wird oder nicht. Daher kann der Phasenanpassungsprozeß umgeschaltet werden, ohne die Umschaltinformation erneut zu übertragen. Mit derselben Informationsmenge kann die Sprachqualität verbessert werden. Zusätzlich kann in dem Modus, in dem kein Phasenanpassungsprozeß ausgeführt wird, das festgesetzte Codebuch benutzt werden. Wenn die Bedingung, dass das festgesetzte Codebuch weiterhin in dem nicht mit Sprache versehenen Bereich oder dergleichen benutzt wird, dann kann die Ausbreitung eines Fehlers in die phasenadaptive Tonquelle effektiv zurückgesetzt werden.
  • In vorteilhafter Weise werden in der Sprachcodiervorrichtung vom CELP Typ, in der die Tonquellenimpulspositionen durch die relativen Positionen dargestellt werden, wobei die Position des Tonhöhenscheitelwerts Null ist, die Indizes, die für die entsprechenden Tonquellenimpulspositionen indikativ sind, in einer Reihenfolge vom Anfang des Teilrahmens angeordnet. Wenn die Position des Tonhöhenscheitelwerts aufgrund des Einflusses eines Übertragungsleitungsfehlers oder dergleichen fälschlich verstanden wird, kann dann eine Abweichung in der Position der Tonquellenimpulse minimalisiert werden.
  • In vorteilhafter Weise werden in der Sprachcodiervorrichtung vom CELP Typ, in der die Tonquellenimpulspositionen durch die relativen Positionen dargestellt werden, wobei die Position des Tonhöhenscheitelwerts Null ist, die Indizes, die für die entsprechenden Tonquellenimpulspositionen indikativ sind, in einer Reihenfolge von dem Beginn des Teilrahmens angeordnet. Zusätzlich werden verschiedene Pulse, die durch dieselbe Indexnummer dargestellt werden, in einer solchen Weise nummeriert, dass sie vom Beginn des Teilrahmens in einer Reihenfolge angeordnet sind. Daher kann, wenn die Position des Tonhöhenscheitelwerts aufgrund des Einflusses eines Übertragungsleitungsfehlers oder dergleichen falsch verstanden wird, eine Abweichung in den Positionen der Tonquellenimpulse minimalisiert werden.
  • Vorzugsweise wird in der Sprachcodiervorrichtung vom CELP Typ, in dem die Tonquellenimpulspositionen durch die relativen Positionen dargestellt werden, wobei die Position des Tonhöhenscheitelwerts Null ist, anstatt dass alle Tonquellenimpuls-Suchpositionen durch die relativen Positionen dargestellt werden, ein Teil davon durch die relativen Positionen dargestellt werden, während die verbleibenden Suchpositionen in den vorbestimmten festgesetzten Positionen angeordnet sind. Daher kann der Einfluss von Übertragungsleitungsfehlern daran gehindert werden, sich lange bzw. weit auszubreiten, selbst wenn die Position des Tonhöhenscheitelwerts aufgrund des Einflusses von Übertragungsleitungsfehlern oder dergleichen fehlerhaft verstanden wird, und zwar durch Verringern der Wahrscheinlichkeit, dass die Tonquellenimpulsposition abweichend ist.
  • Vorzugsweise wird die Scheitelwertposition in einer einzigen Tonhöhenwellenform als die Position des Tonhöhenscheitelwerts gesucht. Daher kann, selbst wenn die Länge des Teilrahmens nicht mit dem Tonhöhenzyklus übereinstimmt, verhindert werden, dass der zweite Scheitelwert fälschlicherweise als der Tonhöhenscheitelwert detektiert wird.
  • Vorzugsweise werden in dem kontinuierlichen, mit Sprache versehenen, stationären Bereich die Position des Tonhöhenscheitelwerts in dem unmittelbar vorausgehenden Teilrahmen, der Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und der Tonhöhenzyklus in dem derzeitigen Teilrahmen als die Information zum Begrenzen des Existenzbereichs der derzeitigen Position des Tonhöhenscheitelwerts benutzt. Innerhalb des Bereichs wird die Position des Tonhöhenscheitelwerts gesucht. In diesem Aufbau kann, selbst wenn durch Benutzung nur des derzeitigen Teilrahmensignals die Position des Tonhöhenscheitelwerts gesucht wird, verhindert wird, dass der zweite Scheitelwert in einer Tonhöhenwellenform fälschlicherweise als der Tonhöhenscheitelwert detektiert wird.
  • Vorzugsweise ist in der Sprachcodiervorrichtung vom CELP Typ, in der die Impulstonquelle auf das Rauschcodebuch angewendet wird, das Rauschcodebuch so aufgebaut, dass es sowohl den Modus mit einer kleinen Anzahl von Tonquellenimpulsen jedoch ausreichender Positionsinformation für jeden Tonquellenimpuls als auch den Modus mit einer groben Positionsinformation für jeden Tonquellenimpuls jedoch mit einer großen Anzahl von Tonquellenimpulsen aufweist. Daher kann sowohl die Verbesserung der Sprachqualität in dem mit Sprache versehenen, ansteigenden Bereich, als auch die effektive Benutzung des Modus mit einer großen Anzahl von Tonquellenimpulsen realisiert werden.
  • Vorzugsweise wird die Tonquelle durch die vorgenannten Aufbauten oder die Verfahren bereitgestellt. Daher kann nicht nur in der Sprachcodiervorrichtung vom CELP Typ, sondern auch in der Sprachdecodiervorrichtung vom CELP Typ der gleiche Effekt bereitgestellt werden. Ebenfalls kann die Sprachcodiervorrichtung vom CELP Typ und die Sprachdecodiervorrichtung vom CELP Typ nach der Erfindung in einer mobilen Kommunikationsvorrichtung oder einer anderen Kommunikationsvorrichtung, in der eine Sprache codiert und übertragen wird, oder die codierte und übertragene Sprache decodiert wird, um eine ursprüngliche Sprache zu reproduzieren, und auf eine Sprachaufnahmevorrichtung und dergleichen, breit eingesetzt werden.

Claims (83)

  1. Eine Vorrichtung vom Typ der CELP (codeangeregte, lineare Vorhersage, Englisch: Code Excited Linear Prediction) Sprachverschlüsselung und -entschlüsselung mit einem Tonquellenerzeugungsbereich, der umfasst: ein adaptives Codebuch (11, 21) ausgebildet zum Übertragen eines adaptiven Codevektors; ein Rausch-Codebuch (14, 24) ausgebildet zum Übertragen eines Rausch-Codevektors; dadurch gekennzeichnet, dass die Vorrichtung ferner umfasst einen Positionsdetektor (12, 22) für den Scheitelwert der Stufe bzw. Tonhöhe (Englisch: Pitch) ausgebildet zum Empfangen des adaptiven Codevektors und zum Bestimmen einer in den adaptiven Codevektor bestehenden Position des Scheitelwerts der Tonhöhe (Englisch: Pitch Peak Position); einen Generator (13, 23) zum Erzeugen eines die Amplitude betonenden bzw. verstärkenden Fensters, der Generator ausgebildet zum Erzeugen eines die Amplitude betonenden Fensters auf der Grundlage der Position des Scheitelwerts der Tonhöhe; und ein die Amplitude betonende Fenstereinheit (16, 25), ausgebildet zum Multiplizieren des von dem Rausch-Codebuch (14, 24) übertragenen Rausch-Codevektors mit dem die Amplitude betonenden Fenster.
  2. Die Vorrichtung nach Anspruch 1, wobei der Rausch-Codevektor von dem Rausch-Codebuch (14, 24) direkt oder indirekt zu der die Amplitude betonenden Fenstereinheit (16, 25) übertragen wird.
  3. Die Vorrichtung nach Anspruch 1 oder 2, ferner umfassend eine Periodizitätseinheit (15), die dazu ausgebildet ist, den Rausch-Codevektor von dem Rausch-Codebuch (14) und einen Tonhöhenzyklus (L) (Englisch: Pitch Cycle) zu empfangen, den Geräusch-Codevektor in Tonhöhenzyklen zu unterteilen (Englisch: To Pitch-Cycle) und den in Tonhöhen unterteilten Rausch-Codevektor zu der die Amplitude betonenden Fenstereinheit (16) zu übertragen.
  4. Die Vorrichtung nach Anspruch 1 oder 2, ferner umfassend einen Tonhöhenzyklus (L), der dem Positionsdetektor (22) für den Scheitelwert der Tonhöhe zugeführt wird, so dass die Rauschtonquelle in dem Tonhöhenzyklus (L) synchronisiert ist.
  5. Die Vorrichtung nach den Ansprüchen 3 oder 4, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, ein die Amplitude betonendes Fenster, das mit dem Tonhöhenzyklus (L) des adaptiven Codevektors synchronisiert ist, mit dem Rausch-Codevektor zu multiplizieren, um die Amplitude des Rausch-Codevektors, der der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors entspricht, zu betonen.
  6. Die Vorrichtung nach Anspruch 5, wobei in dem Tonquellenerzeugungsbereich ein auf der Position des Scheitelwerts der Tonhöhe zentriertes, dreieckförmiges Fenster des adaptiven Codevektors als das die Amplitude betonende Fenster benutzt wird.
  7. Die Vorrichtung nach einem der Ansprüche 1 bis 6, wobei der Rausch-Codevektor nur auf die Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors begrenzt ist.
  8. Die Vorrichtung nach einem der Ansprüche 1 bis 7, die eine Impulstonguelle als Rausch-Codebuch verwendet, und wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, einen Suchbereich für die Impulsposition aufgrund des Tonhöhenzyklus (L) und der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors zu bestimmen.
  9. Die Vorrichtung nach Anspruch 8, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, den Suchbereich für die Position des Impulses derart zu bestimmen, dass die Nähe der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors dicht wird (Anmerkung des Übersetzers: in dem Sinne, dass die Suchpositionen dort dicht beabstandet sind), während die anderen Positionen grob werden (Anmerkung des Übersetzers: in dem Sinne, dass die Positionen dort weit voneinander entfernt sind).
  10. Die Vorrichtung nach Anspruch 8 oder 9, wobei der Suchbereich für die Position des Impulses in Übereinstimmung mit dem Tonhöhenzyklus umgeschaltet wird.
  11. Die Vorrichtung nach Anspruch 10, wobei wenn in dem adaptiven Codevektor mehrere Scheitelwerte der Tonhöhen existieren, der Suchbereich für die Position des Impulses in einer solchen Weise beschränkt wird, dass mindestens zwei Positionen der Scheitelwerte der Tonhöhe in dem Suchbereich enthalten sind.
  12. Die Vorrichtung nach Anspruch 1, die so ausgebildet ist, dass ein Rausch-Codebuch mit den Ergebnissen der Analyse einer Spracheingabe umgeschaltet wird.
  13. Die Vorrichtung nach Anspruch 1, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, das Rausch-Codebuch unter Verwendung eines Übertragungsparameters, der extrahiert wird, bevor das Rausch-Codebuch durchsucht wird, umzuschalten.
  14. Die Vorrichtung nach einem der Ansprüche 8 bis 11, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, die Anzahl der Impulse in Übereinstimmung mit den Analyseergebnissen des Sprachsignals umzuschalten.
  15. Die Vorrichtung nach einem der Ansprüche 8 bis 11 und 14, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, die Anzahl der Impulse unter Verwendung eines Übertragungsparameters, der extrahiert wird, bevor das Rausch-Codebuch durchsucht wird, umzuschalten.
  16. Die Vorrichtung nach einem der Ansprüche 8 bis 11, 14 und 15, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, die Anzahl der Impulse in Übereinstimmung mit dem Tonhöhenzyklus umzuschalten.
  17. Die Vorrichtung nach Anspruch 16, wobei die Anzahl der Impulse in dem Fall, wo eine Variation im Tonhöhenzyklus zwischen kontinuierlichen bzw. aufeinander folgenden Teilrahmen klein ist, und in dem Fall, wo die Variation nicht klein ist, umgeschaltet wird.
  18. Die Vorrichtung nach einem der Ansprüche 8 bis 11 und 14 bis 17, wobei ein Rausch-Codevektor-Erzeugungsbereich, der eine Impulstonquelle als Rauschtonquelle benutzt, dazu ausgebildet ist, eine Impulsamplitude zu bestimmen, bevor die Impulsposition gesucht wird.
  19. Die Vorrichtung nach Anspruch 18, wobei der Rausch-Codevektor-Erzeugungsbereich, der die Impulstonquelle als die Rauschtonquelle benutzt, so ausgebildet ist, dass die Impulsamplitude in der Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors und in den anderen Bereichen verändert wird.
  20. Die Vorrichtung nach Anspruch 16, wobei die Anzahl der zu verwendenden Impulse in der Impulstonquelle auf der Grundlage des Tonhöhenzyklus (L) durch Statistiken oder Lernen bestimmt wird.
  21. Die Vorrichtung nach Anspruch 1, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, eine Tonhöhenverstärkung (Englisch: Pitch Gain) in mehreren Stufen zu quantisieren; wobei in der ersten Stufe ein Wert, der unmittelbar nachdem das adaptive Codebuch durchsucht worden ist erhalten wird, als ein Quantisierungsziel verwendet wird, während in der zweiten und den nachfolgenden Stufen eine Differenz zwischen der Tonhöhenverstärkung, die nachdem eine Tonquellendurchsuchung vervollständigt ist durch eine Durchsuchung einer geschlossenen Schleife bestimmt worden ist, und einem in der ersten Stufe quantisierten Werts als das Quantisierungsziel benutzt wird.
  22. Die Vorrichtung nach einem der Ansprüche 12 bis 15 und 18 bis 20, wobei der Tonquellenerzeugungsbereich dazu ausgebildet ist, eine Tonhöhenverstärkung in mehreren Stufen zu quantisieren, und wobei in der ersten Stufe ein Wert, der ist unmittelbar nachdem das adaptive Codebuch durchsucht worden ist erhalten worden, als ein Quantisierungsziel verwendet wird, während in der zweiten und nachfolgenden Stufen eine Differenz zwischen der Tonhöhenverstärkung, die nachdem eine Tonquellendurchsuchung vervollständigt ist durch eine Durchsuchung einer geschlossenen Schleife bestimmt worden ist, und einem in der ersten Stufe quantisierten Wert als das Quantisierungsziel verwendet wird, und einem quantisierten Wert der Tonhöhenverstärkung, der unmittelbar nachdem das adaptive Codebuch der Vorrichtung zum Sprachcodieren vom CELP Typ durchsucht worden ist erhalten worden ist, zum Umschalten des festen bzw. festgesetzten Codebuchs benutzt wird.
  23. Die Vorrichtung nach einem der Ansprüche 12 bis 15 und 18 bis 22, die dazu ausgebildet ist, das festgesetzte Codebuch auf der Grundlage einer Veränderung des Tonhöhenzyklus zwischen Teilrahmen umzuschalten.
  24. Die Vorrichtung nach einem der Ansprüche 12 bis 15 und 18 bis 20, die dazu ausgebildet ist, das festgesetzte Codebuch unter Verwendung der Tonhöhenverstärkung, die in dem unmittelbar vorausgehenden Teilrahmen quantisiert worden ist, umzuschalten.
  25. Die Vorrichtung nach einem der Ansprüche 12 bis 15 und 18 bis 20, die dazu ausgebildet ist, das festgesetzte Codebuch auf der Grundlage der Veränderung in dem Tonhöhenzyklus (L) zwischen den Teilrahmen und der quantisierten Tonhöhenverstärkung umzuschalten.
  26. Die Vorrichtung nach einem der Ansprüche 22 bis 25, die ein Impulstonquellen-Codebuch als das festgesetzte Codebuch verwendet.
  27. Die Vorrichtung nach Anspruch 1, die dazu ausgebildet ist, einen Sprachcodierprozess für jeden Teilrahmen, der eine vorbestimmte Zeitlänge aufweist, auszuführen, um zu bestimmen, ob eine Phase in dem vorliegenden Teilrahmen und eine Phase in dem unmittelbar vorausgehenden Teilrahmen kontinuierlich ist oder nicht und um eine Tonquelle auf der Grundlage der Kontinuität der Phase der Teilrahmen umzuschalten.
  28. Die Vorrichtung nach Anspruch 27, wobei eine Position des Scheitelwerts der Tonhöhe in dem unmittelbar vorausgehenden Teilrahmen, ein Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und ein Tonhöhenzyklus in dem derzeitigen Teilrahmen verwendet werden, um eine Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen vorherzusagen, und wobei durch Bestimmen ob die durch die Vorhersage erhaltene Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen nahe in Bezug auf die nur aus Daten in dem derzeitigen Teilrahmen erhaltenen Position des Scheitelwerts der Tonhöhe ist oder nicht, bestimmt wird, ob die Phase in dem unmittelbar vorausgehenden Teilrahmen und die Phase in dem derzeitigen Teilrahmen kontinuierlich sind oder nicht und in Übereinstimmung mit einem Bestimmungsergebnis ein Verfahren für den Codiervorgang der Tonquelle umgeschaltet wird.
  29. Die Vorrichtung nach Anspruch 27 oder 28, die dazu ausgebildet ist, einen Phasenanpassungsvorgang für das Rausch-Codebuch auszuführen, wenn bestimmt worden ist, dass die Phase in dem unmittelbar vorausgehenden Teilrahmen und die Phase in dem derzeitigen Teilrahmen kontinuierlich sind.
  30. Die Vorrichtung nach Anspruch 1, die dazu ausgebildet ist, einen Sprachcodiervorgang für jeden Teilrahmen mit einer vorbestimmten Zeitlänge auszuführen, und die dazu ausgebildet ist, ein Verfahren für einen Codiervorgang eines Tonquellensignals umzuschalten auf der Grundlage einer Konzentration des Grads der Signalleistung in der Nähe einer Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors in dem derzeitigen Teilrahmen.
  31. Die Vorrichtung nach Anspruch 30, die dazu ausgebildet ist, einen Phasenanpassungsvorgang für ein Rausch-Codebuch auszuführen, wenn der Prozentsatz bzw. der Anteil in dem gesamten Signal einer Länge des Tonhöhenzyklusses der Signalleistung in der Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors in dem derzeitigen Teilrahmen gleich oder größer als ein vorbestimmter Wert ist.
  32. Die Vorrichtung nach Anspruch 29 oder 31, wobei als der Phasenanpassungsvorgang eine Suche nach der Impulsposition in der Nähe des Scheitelwerts der Tonhöhe dicht bzw. fein und in den anderen Bereichen als die Nähe des Scheitelwerts der Tonhöhe grob ausgeführt wird und eine Impulstonquelle in einer Rauschtonquelle eingesetzt wird.
  33. Die Vorrichtung nach einem beliebigen der Ansprüche 8 bis 11, 14 bis 20, 26 und 32, die dazu angepasst ist, Indizes anzuordnen, die indikativ sind für die Impulspositionen in der Reihenfolge von der Oberseite bzw. vom Beginn des Teilrahmens (Englisch: Top Of The Sub-Frame.
  34. Die Vorrichtung nach Anspruch 33, die dazu angepasst ist, Impulse im Fahl derselben Indexnummer in der Reihenfolge vom Beginn des Teilrahmens zu nummerieren, und ferner jede Impulssuchposition derart zu bestimmen, dass die Nähe der Position des Scheitelwerts der Tonhöhe dicht wird und die von der Nähe des Scheitelwerts der Tonhöhe verschiedenen Bereiche grob werden.
  35. Die Vorrichtung nach einem der Ansprüche 8 bis 11, 14 bis 20, 26 und 32, die dazu angepasst ist, einen Teil der Impulssuchpositionen durch die Position des Scheitelwerts der Tonhöhe zu bestimmen, während die anderen Impulssuchpositionen als festgesetzte Positionen unabhängig von der Position des Scheitelwerts der Tonhöhe vorbestimmt sind.
  36. Die Vorrichtung nach einem der Ansprüche 1 bis 11, 14 bis 20, 22 bis 26 und 28 bis 35, die ferner ein Berechnungsmittel (1802) für die Position des Scheitelwerts der Tonhöhe umfasst, welches dazu ausgebildet ist, wenn die Position des Scheitelwerts der Tonhöhe einer Sprache bzw. Sprachsignal mit einer vorbestimmten Zeitlänge oder das Tonquellensignal erhalten worden ist, nur eine Länge des Tonhöhenzyklus von dem relevanten Signal auszuschneiden und in dem ausgeschnittenen Signal die Position des Scheitelwerts der Tonhöhe zu bestimmen.
  37. Die Vorrichtung nach Anspruch 36, die, wenn nur eine Länge des Tonhöhenzyklusses von dem relevanten Signal ausgeschnitten wird, dazu angepasst ist, zum Bestimmen der Position des Scheitelwerts der Tonhöhe zunächst das gesamte relevante Signal zu benutzen ohne eine Länge des Tonhöhenzyklusses auszuschneiden, die bestimmte Position des Scheitelwerts der Tonhöhe als einen Startpunkt für das Ausschneiden zu verwenden zum Ausschneiden einer Länge des Tonhöhenzyklus, und in dem ausgeschnitten Signal die Position des Scheitelwerts der Tonhöhe zu bestimmen.
  38. Die Vorrichtung nach einem der Ansprüche 1 bis 11, 14 bis 20, 22 bis 26 und 28 bis 35, die dazu ausgebildet ist, einen Sprachcodiervorgang für jeden Teilrahmen mit einer vorbestimmten Zeitlänge auszuführen, und die dazu ausgebildet ist, wenn die Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen berechnet wird und eine Differenz zwischen dem Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und dem Tonhöhenzyklus in dem derzeitigen Teilrahmen in einem vorbestimmten Bereich ist, die Position des Scheitelwerts der Tonhöhe in dem unmittelbar vorausgehenden Teilrahmen, den Tonhöhenzyklus in dem unmittelbar vorausgehenden Teilrahmen und den Tonhöhenzyklus in dem derzeitigen Teilrahmen zu benutzen, um die Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen vorherzusagen, und vor der Suche nach der Position des Scheitelwerts der Tonhöhe in dem Bereich durch Verwenden der durch die Vorhersage erhaltenen Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen einen Existenzbereich der Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen zu begrenzen.
  39. Die Vorrichtung nach Anspruch 1, die dazu ausgebildet ist, einen Sprachcodiergang für jeden Teilrahmen mit einer vorbestimmten Zeitlänge auszuführen; und eine Impulstonquelle als ein Rausch-Codebuch zu verwenden, wobei ferner mindestens zwei Modi des Rausch-Codebuchs bereitgestellt sind, wobei die Anzahl der Tonquellenimpulse durch Umschalten der Modi verändert werden kann, wobei mindestens ein Modus mit einer ausreichenden Anzahl von jeder Impulspositionsinformation und einer kleinen Anzahl von Impulsen versehen ist, während der andere Modus mit einer Unterdeckung bezüglich jeder Impulspositionsinformation, jedoch mit einer großen Anzahl von Impulsen versehen ist, und wobei die Modi durch Übertragen von Modusumschaltinformation umgeschaltet werden.
  40. Die Vorrichtung nach Anspruch 39, die, wenn der Tonhöhenzyklus (L) kurz ist, dazu ausgebildet ist, die Positionsinformation der Tonquellenimpulse zu verringern, während die Anzahl der Tonquellenimpulse durch Begrenzen eines Suchbereichs des Tonquellenimpulses auf einen schmalen Bereich in Übereinstimmung mit dem Tonhöhenzyklus (L) vergrößert wird.
  41. Die Vorrichtung nach Anspruch 39 oder 40, die dazu ausgebildet ist, den Suchbereich der Impulsposition derart zu bestimmen, dass in dem Modus, in dem eine Unterdeckung bezüglich jeder Impulspositionsinformation, jedoch eine große Anzahl der Impulse vorhanden ist, die Suchpositionen der Tonquellenimpulse in der Nähe der Position des Scheitelwerts der Tonhöhe dicht bzw. eng wird, während die Suchpositionen der Tonquellenimpulse in den anderen Bereichen grob bzw. weiter beabstandet wird.
  42. Die Vorrichtung nach einem der Ansprüche 39 bis 41, wobei der Tonquellenmodus, in dem eine geringe Anzahl der Impulse und eine ausreichende Menge der Positionsinformation vorhanden ist, dazu ausgebildet ist, einen Teil der Positionsinformation für einen Index anzuweisen, der für einen Rauschtonquellen-Codevektor indikativ ist.
  43. Ein Aufnahmemedium, das ein Programm aufzeichnet, das eine Funktion der Sprachcodier- oder Dekodiervorrichtung nach einem beliebigen der Ansprüche 1 bis 42 ausführt und das von einem Computer lesbar ist.
  44. Ein Verfahren zur Sprachcodierung oder -dekodierung nach dem CELP (codeangeregte lineare Vorhersage, Englisch: Code Excited Linear Prediction) Typ, umfassend: Bereitstellen eines adaptiven Codevektors; Bestimmen einer Position des Scheitelwerts der Tonhöhe bzw. Stufe (Englisch: Pitch Peak Position), die in dem adaptiven Codevektor existiert; Erzeugen eines die Amplitude betonenden Fensters auf der Grundlage der Position des Scheitelwerts der Tonhöhe; Bereitstellen eines Rausch-Codevektors; und Multiplizieren des Rauschcodevektors mit dem die Amplitude betonenden Fenster.
  45. Das Verfahren nach Anspruch 44, wobei das die Amplitude betonende bzw. verstärkende Fenster mit einem Tonhöhenzyklus des adaptiven Codevektors synchronisiert wird und mit dem Rausch-Codevektor multipliziert wird, um die Amplitude des der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors entsprechenden Rausch-Codevektors zu betonen bzw. zu verstärken.
  46. Das Verfahren nach Anspruch 45, wobei ein auf der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors zentriertes, dreieckförmiges Fenster als das die Amplitude betonende Fenster verwendet wird.
  47. Das Verfahren nach Anspruch 44, umfassend einen Schritt des Verwendens eines Rausch-Codevektors, der nur auf die Nähe des Scheitelwerts der Tonhöhe eines adaptiven Codevektors begrenzt ist.
  48. Das Verfahren nach Anspruch 44, das eine Impulstonquelle als ein Rausch-Codebuch verwendet; und wobei der Schritt des Betonens der Amplitude des Rausch-Codevektors umfasst: Bestimmen eines Suchbereichs für die Impulsposition durch einen Tonhöhenzyklus und eine Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors.
  49. Das Verfahren nach Anspruch 48, wobei der Tonquellenerzeugungsbereich den Suchbereich für die Impulsposition derart bestimmt, dass die Nähe der Position des Scheitelwerts der Tonhöhe des adaptiven Codevektors dicht (Anmerkung des Übersetzers: in dem Sinn, dass die Positionen dort dicht beabstandet sind) wird, während die anderen Bereiche grob (Anmerkung des Übersetzers: in dem Sinn, dass die Positionen dort weit voneinander entfernt beabstandet sind) werden.
  50. Das Verfahren nach Anspruch 48 oder 49, wobei der Suchbereich für die Impulsposition in Übereinstimmung mit dem Tonhöhenzyklus umgeschaltet wird.
  51. Das Verfahren nach Anspruch 50, wobei, wenn mehrere Scheitelwerte der Tonhöhe in dem adaptiven Codevektor existieren, der Suchbereich der Impulsposition derart eingeschränkt wird, dass in dem Suchbereich mindestens zwei Positionen des Scheitelwerts der Tonhöhe enthalten sind.
  52. Das Verfahren nach Anspruch 44, dazu ausgebildet ein Rausch-Codebuch in Übereinstimmung mit Analyseergebnissen einer Spracheeingabe umzuschalten.
  53. Das Verfahren nach Anspruch 44, wobei der Schritt des Betonens der Amplitude des Rausch-Codevektors umfasst: Umschalten eines Rausch-Codebuchs unter Verwendung eines Übertragungsparameters, der extrahiert wird, bevor das Rausch-Codebuch durchsucht wird.
  54. Das Verfahren nach einem der Ansprüche 48 bis 51, wobei der Schritt des Betonens der Amplitude des Rausch-Codevektors umfasst: Umschalten der Anzahl der Impulse in Übereinstimmung mit Analyseergebnissen eines Sprachsignals.
  55. Das Verfahren nach einem der Ansprüche 48 bis 51 und 54, in dem ein Tonquellenerzeugungsbereich bereitgestellt wird zum Umschalten der Anzahl der Impulse unter Verwendung eines Übertragungsparameters, der extrahiert wird, bevor das Rausch-Codebuch durchsucht wird.
  56. Das Verfahren nach einem der Ansprüche 48 bis 51, 54 und 55, wobei der Schritt des Betonens der Amplitude des Rausch-Codevektor ferner umfasst: Umschalten der Anzahl der Impulse in Übereinstimmung mit dem Tonhöhenzyklus.
  57. Das Verfahren nach Anspruch 56, wobei die Anzahl der Impulse in dem Fall umgeschaltet wird, wo eine Variation des Tonhöhenzyklus zwischen kontinuierlichen bzw. aufeinander folgenden Teilrahmen klein ist und in dem Fall, wo die Variation nicht klein ist.
  58. Das Verfahren nach einem der Ansprüche 48 bis 51 und 54 bis 57, ferner umfassend: vor dem Suchen der Impulsposition Verwenden einer Impulstonquelle als eine Rauschtonquelle zum Bestimmen einer Impulsamplitude.
  59. Das Verfahren nach Anspruch 58, ferner umfassend Verwenden der Impulstonquelle als die Rauschtonquelle zum Verändern der Impulsamplitude in der Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors und in den anderen Bereichen.
  60. Das Verfahren nach Anspruch 56, wobei die Anzahl der zu verwendenden Impulse in der Impulstonquelle auf der Grundlage des Tonhöhenzyklus durch Statistiken oder Lernen bestimmt wird.
  61. Das Verfahren nach Anspruch 44, wobei der Schritt des Betonens der Amplitude des Rausch-Codevektors umfasst: Quantisieren einer Tonhöhenverstärkung in mehreren Stufen und wobei in der ersten Stufe ein Wert, der unmittelbar nachdem ein adaptives Codebuch durchsucht worden ist erhalten wird, als ein Quantisierungsziel verwendet wird, wohingegen in der zweiten und in den nachfolgenden Stufen eine Differenz zwischen der Tonhöhenverstärkung, die nachdem eine Tonquellendurchsuchung vervollständigt ist durch eine Durchsuchung einer geschlossenen Schleife bestimmt wird, und einem in der ersten Stufe quantisierten Wert als das Quantisierungsziel verwendet wird.
  62. Das Verfahren nach einem der Ansprüche 52 bis 55 und 58 bis 59, ferner umfassend Quantisieren einer Tonhöhenverstärkung in mehreren Stufen, und wobei in einer ersten Stufe ein Wert, der unmittelbar nachdem das adaptive Codebuch durchsucht worden ist erhalten worden ist, als ein Quantisierungsziel verwendet wird, während in der zweiten und nachfolgenden Stufe eine Differenz zwischen der Tonhöhenverstärkung, die nachdem eine Tonquellensuche vervollständigt ist durch eine Durchsuchung einer geschlossenen Schleife bestimmt worden ist, und einem in der ersten Stufe quantisierten Wert als das Quantisierungsziel verwendet wird, und wobei ein Quantisierungsziel der Tonhöhenverstärkung, das unmittelbar nachdem das adaptive Codebuch der Vorrichtung zur Sprachcodierung von CELP Typus durchsucht worden ist erhalten worden ist, zum Umschalten des festgesetzten Codebuchs benutzt wird.
  63. Das Verfahren nach einem der Ansprüche 52 bis 55 und 58 bis 62, umfassend Umschalten des festgesetzten Codebuchs auf der Grundlage einer Veränderung in dem Tonhöhenzyklus zwischen Teilrahmen.
  64. Das Verfahren nach einem der Ansprüche 52 bis 55 und 58 bis 60, umfassend Umschalten des festgesetzten Codebuchs durch Verwendung der Tonhöhenverstärkung, die in den unmittelbar vorausgehenden Teilrahmen quantisiert ist.
  65. Das Verfahren nach einem der Ansprüche 52 bis 55 und 58 bis 60, umfassend Umschalten des festgesetzten Codebuchs auf der Grundlage der Veränderung in dem Tonhöhenzyklus zwischen den Teilrahmen und der quantisierten Tonhöhenverstärkung.
  66. Das Verfahren nach einem der Ansprüche 62 bis 65, ferner umfassend Verwendung eines Impulstonquellen-Codebuchs als das festgesetzte Codebuch.
  67. Das Verfahren nach Anspruch 44, wobei das Betonen der Amplitude eines Rausch-Codevektors für jeden Teilrahmen mit einer vorbestimmten Zeitlänge ausgeführt wird, umfassend Bestimmen ob eine Phase in dem derzeitigen Teilrahmen und eine Phase in dem unmittelbar vorausgehenden Teilrahmen kontinuierlich ist oder nicht und Umschalten einer Tonquelle in dem Fall, wo bestimmt wird, dass die Phasen kontinuierlich sind, und in dem Fall, wo bestimmt ist, dass die Phasen nicht kontinuierlich sind.
  68. Das Verfahren nach Anspruch 67, ferner umfassend Verwenden einer Position des Scheitelwerts der Tonhöhe in dem unmittelbar vorhergehenden Teilrahmen, eines Tonhöhenzyklusses in dem unmittelbar vorhergehenden Teilrahmen und eines Tonhöhenzyklusses in dem derzeitigen Teilrahmen zum Vorhersagen einer Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen, und wobei der Schritt des Bestimmens, ob die Phase in dem unmittelbar vorausgehenden Teilrahmen und die Phase in dem derzeitigen Teilrahmen kontinuierlich sind oder nicht umfasst: Bestimmen, ob die durch die Vorhersage erhaltene Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen in der Nähe der nur aus Daten in dem derzeitigen Teilrahmen erhaltenen Position des Scheitelwerts der Tonhöhe ist oder nicht, und in Übereinstimmung mit einem Bestimmungsergebnisses ferner umfasst: Umschalten eines Verfahrens für den Codiervorgang der Tonquelle.
  69. Das Verfahren nach Anspruch 67 oder 68, umfassend Ausführen eines Phasenanpassungsvorgangs für das Rausch-Codebuch, wenn bestimmt worden ist, dass die Phase in dem unmittelbar vorhergehenden Teilrahmen und die Phase in dem derzeitigen Teilrahmen kontinuierlich sind.
  70. Das Verfahren nach Anspruch 44, umfassend Ausführen eines Sprachcodiervorgangs für jeden Teilrahmen mit einer vorbestimmten Zeitlänge und Umschalten eines Verfahrens für den Codiervorgang eines Tonquellensignals auf der Grundlage eines Grads der Konzentration der Signalleistung in der Nähe der Position des Scheitelwerts der Tonhöhe eines adaptiven Codevektors in dem derzeitigen Teilrahmen.
  71. Das Verfahren nach Anspruch 69, umfassend Ausführen eines Phasenanpassungsvorgangs für ein Rausch-Codebuch, wenn der Prozentsatz bzw. Anteil am gesamten Signal einer Länge des Tonhöhenzyklus der Signalleistung in der Nähe des Scheitelwerts der Tonhöhe des adaptiven Codevektors in dem derzeitigen Teilrahmen gleich oder größer als ein vorbestimmter Wert ist.
  72. Das Verfahren nach Anspruch 69 oder 71, wobei der Phasenanpassungsvorgang umfasst: Ausführen einer Suche nach der Impulsposition dicht (Anmerkung des Übersetzers: in dem Sinn von dicht beieinander liegenden Positionen) in der Nähe des Scheitelwerts der Tonhöhe und in den von der Nähe des Scheitelwerts der Tonhöhe verschiedenen Bereichen grob (Anmerkung des Übersetzers: in dem Sinn von dicht beieinander liegenden Positionen) und Verwenden einer Impulstonquelle in einer Rauschtonquelle.
  73. Das Verfahren nach einem der Ansprüche 48 bis 51, 54 bis 60, 66 und 72, umfassend Arrangieren von Indizes, die für die Impulspositionen in der Reihenfolge von der Oberseite bzw. vom Beginn des Teilrahmens indikativ sind.
  74. Das Verfahren nach Anspruch 73, umfassend im Fall gleicher Indexnummern: Nummerieren von Impulsen in der Reihenfolge von der Oberseite bzw. vom Beginn des Teilrahmens, und ferner Bestimmen jeder Position einer Impulssuche derart, dass die Nähe der Position des Scheitelwerts der Tonhöhe dicht wird und die Bereiche verschieden von der Nähe des Scheitelwerts der Tonhöhe grob werden.
  75. Das Verfahren nach einem der Ansprüche 48 bis 51, 54 bis 60, 66 und 72, wobei ein Teil der Impulssuchpositionen durch die Position des Scheitelwerts der Tonhöhe bestimmt wird, während die anderen Impulssuchpositionen unabhängig von der Position des Scheitelwerts der Tonhöhe vorherbestimmte festgesetzte Positionen sind.
  76. Das Verfahren nach einem der Ansprüche 44 bis 51, 54 bis 57, 62 bis 66 und 68 bis 75, umfassend einen Schritt der Berechnung der Position des Scheitelwerts der Tonhöhe, indem, wenn die Position des Scheitelwerts der Tonhöhe einer Sprache bzw. eines Sprachsignals mit einer vorbestimmten Zeitlänge oder des Tonquellensignals erhalten wird, nur eine Länge des Tonhöhenzyklusses aus dem relevanten Signal ausgeschnitten wird und die Position des Scheitelwerts der Tonhöhe in dem ausgeschnittenen Signal bestimmt wird.
  77. Das Verfahren nach Anspruch 76, in dem der Schritt des Ausschneidens von nur einer Länge des Tonhöhenzyklus aus dem relevanten Signal umfasst: zunächst Verwenden des gesamten relevanten Signals ohne eine Länge des Tonhöhenzyklus auszuschneiden, um die Position des Scheitelwerts der Tonhöhe zu bestimmen, Verwenden der bestimmten Position des Scheitelwerts der Tonhöhe als einen Startpunkt für das Ausschneiden zum Ausschneiden einer Länge des Tonhöhenzyklus, und in dem ausgeschnittenen Signal Bestimmen der Position des Scheitelwerts der Tonhöhe.
  78. Das Verfahren nach einem der Ansprüche 44 bis 51, 54 bis 60, 62 bis 66 und 68 bis 75, umfassend Ausführen eines Sprachcodiervorgangs für jeden Teilrahmen mit einer vorbestimmten Zeitlänge, Verwenden der Position des Scheitelwerts der Tonhöhe in dem unmittelbar vorhergehenden Teilrahmen, des Tonhöhenzyklus in dem unmittelbar vorhergehenden Teilrahmen und des Tonhöhenzyklus in dem derzeitigen Teilrahmen zum Vorhersagen der Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen, wenn die Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen berechnet wird und eine Differenz zwischen dem Tonhöhenzyklus in dem unmittelbar vorhergehenden Teilrahmen und dem Tonhöhenzyklus in dem derzeitigen Teilrahmen in einem vorbestimmten Bereich ist, und vor dem Suchen der Position des Scheitelwerts der Tonhöhe Begrenzen eines Existenzbereichs der Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen in dem Bereich unter Verwendung der durch die Vorhersage erhaltenen Position des Scheitelwerts der Tonhöhe in dem derzeitigen Teilrahmen.
  79. Das Verfahren nach Anspruch 44, ferner umfassend Ausführen eines Sprachcodiervorgangs für jeden Teilrahmen mit einer vorbestimmten Zeitlänge, und wobei eine Impulstonquelle, von der mindestens zwei Modi bereitgestellt werden, als ein Rausch-Codebuch verwendet wird, wobei die Anzahl der Tonquellenimpulse durch Umschalten der Modi verändert werden kann, wobei mindestens ein Modus mit einer ausreichenden Anzahl von jeder Impulspositionsinformation und einer geringen Anzahl von Impulsen versehen ist, während der andere Modus mit einer Unterdeckung bezüglich jeder Impulspositionsinformation, jedoch mit einer großen Anzahl von Impulsen versehen ist, und bei der die Modi durch Übertragen von Modusumschaltinformation umgeschaltet werden.
  80. Das Verfahren nach Anspruch 79, wobei wenn der Tonhöhenzyklus kurz ist, die Positionsinformation der Tonquellenimpulse verringert wird, während die Anzahl der Tonquellenimpulse durch Begrenzen eines Suchbereichs der Tonquellenimpulse auf einen kleinen Bereich in Übereinstimmung mit dem Tonhöhenzyklus vergrößert wird.
  81. Das Verfahren nach Anspruch 79 oder 80, umfassend Bestimmen des Suchbereichs der Impulsposition in einer solchen Art und Weise, dass in dem Modus, in dem eine Unterzahl von jeder Impulspositionsinformation, jedoch eine große Anzahl von Impulsen vorhanden ist, die Suchpositionen der Tonquellenimpulse in der Nähe der Position des Scheitelwerts der Tonhöhe dicht wird, während die Suchpositionen der Tonquellenimpulse in den anderen Bereichen grob wird.
  82. Das Verfahren nach einem der Ansprüche 79 bis 81, umfassend Anweisen eines Teils der Positionsinformation für einen Index, der für einen Rauschtonquellen-Codevektor in dem Tonquellenmodus, in dem eine geringe Anzahl der Impulse und eine ausreichende Anzahl der Positionsinformation vorhanden ist, indikativ ist.
  83. Ein Aufnahmemedium, das darauf ein Programm aufgezeichnet hat, welches das Verfahren nach einem beliebigen der Ansprüche 44 bis 82 ausführt und das durch einen Computer lesbar ist.
DE69737012T 1996-08-02 1997-08-04 Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür Expired - Lifetime DE69737012T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP20443996 1996-08-02
JP20443996 1996-08-02
JP3672697 1997-02-20
JP03672697A JP4063911B2 (ja) 1996-02-21 1997-02-20 音声符号化装置
PCT/JP1997/002703 WO1998006091A1 (fr) 1996-08-02 1997-08-04 Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications

Publications (2)

Publication Number Publication Date
DE69737012D1 DE69737012D1 (de) 2007-01-11
DE69737012T2 true DE69737012T2 (de) 2007-06-06

Family

ID=26375818

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69737012T Expired - Lifetime DE69737012T2 (de) 1996-08-02 1997-08-04 Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür

Country Status (6)

Country Link
US (4) US6226604B1 (de)
EP (2) EP0858069B1 (de)
CN (1) CN1163870C (de)
AU (1) AU3708597A (de)
DE (1) DE69737012T2 (de)
WO (1) WO1998006091A1 (de)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2338630B (en) * 1998-06-20 2000-07-26 Motorola Ltd Speech decoder and method of operation
JP3180786B2 (ja) * 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP4008607B2 (ja) * 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
JP3594854B2 (ja) 1999-11-08 2004-12-02 三菱電機株式会社 音声符号化装置及び音声復号化装置
USRE43209E1 (en) 1999-11-08 2012-02-21 Mitsubishi Denki Kabushiki Kaisha Speech coding apparatus and speech decoding apparatus
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6480821B2 (en) * 2001-01-31 2002-11-12 Motorola, Inc. Methods and apparatus for reducing noise associated with an electrical speech signal
US6996522B2 (en) * 2001-03-13 2006-02-07 Industrial Technology Research Institute Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
US7206739B2 (en) * 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
JP3888097B2 (ja) * 2001-08-02 2007-02-28 松下電器産業株式会社 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
JP2004101588A (ja) * 2002-09-05 2004-04-02 Hitachi Kokusai Electric Inc 音声符号化方法及び音声符号化装置
FR2865310A1 (fr) * 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
US7240252B1 (en) * 2004-06-30 2007-07-03 Sprint Spectrum L.P. Pulse interference testing in a CDMA communication system
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
TWI279774B (en) * 2005-04-14 2007-04-21 Ind Tech Res Inst Adaptive pulse allocation mechanism for multi-pulse CELP coder
US8766995B2 (en) * 2006-04-26 2014-07-01 Qualcomm Incorporated Graphics system with configurable caches
US20070268289A1 (en) * 2006-05-16 2007-11-22 Chun Yu Graphics system with dynamic reposition of depth engine
US8884972B2 (en) * 2006-05-25 2014-11-11 Qualcomm Incorporated Graphics processor with arithmetic and elementary function units
US8869147B2 (en) * 2006-05-31 2014-10-21 Qualcomm Incorporated Multi-threaded processor with deferred thread output control
US8644643B2 (en) * 2006-06-14 2014-02-04 Qualcomm Incorporated Convolution filtering in a graphics processor
US8766996B2 (en) * 2006-06-21 2014-07-01 Qualcomm Incorporated Unified virtual addressed register file
US20080276359A1 (en) * 2007-05-09 2008-11-13 Morgan Terra J Drain clog remover
JP4882899B2 (ja) * 2007-07-25 2012-02-22 ソニー株式会社 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム
EP2224432B1 (de) * 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder und kodierungsverfahren
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
JP5269914B2 (ja) * 2009-01-22 2013-08-21 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
US9269366B2 (en) * 2009-08-03 2016-02-23 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
JPWO2011048810A1 (ja) * 2009-10-20 2013-03-07 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
WO2011065741A2 (ko) 2009-11-24 2011-06-03 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
US9082416B2 (en) 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8862465B2 (en) 2010-09-17 2014-10-14 Qualcomm Incorporated Determining pitch cycle energy and scaling an excitation signal
WO2013096875A2 (en) * 2011-12-21 2013-06-27 Huawei Technologies Co., Ltd. Adaptively encoding pitch lag for voiced speech
ES2757700T3 (es) 2011-12-21 2020-04-29 Huawei Tech Co Ltd Detección y codificación de altura tonal muy débil
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
AU2013327192B2 (en) 2012-10-05 2016-06-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus for encoding a speech signal employing ACELP in the autocorrelation domain
US9208775B2 (en) 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4924517A (en) * 1988-02-04 1990-05-08 Nec Corporation Encoder of a multi-pulse type capable of controlling the number of excitation pulses
DE68922134T2 (de) * 1988-05-20 1995-11-30 Nec Corp Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude.
JP2588963B2 (ja) * 1989-03-07 1997-03-12 日本電信電話株式会社 音声合成装置
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
JP2940005B2 (ja) * 1989-07-20 1999-08-25 日本電気株式会社 音声符号化装置
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5208862A (en) * 1990-02-22 1993-05-04 Nec Corporation Speech coder
JP2736157B2 (ja) * 1990-07-17 1998-04-02 シャープ株式会社 符号化装置
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JP2538450B2 (ja) * 1991-07-08 1996-09-25 日本電信電話株式会社 音声の励振信号符号化・復号化方法
JP3194481B2 (ja) 1991-10-22 2001-07-30 日本電信電話株式会社 音声符号化法
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
IT1264766B1 (it) * 1993-04-09 1996-10-04 Sip Codificatore della voce utilizzante tecniche di analisi con un'eccitazione a impulsi.
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
US5504834A (en) * 1993-05-28 1996-04-02 Motrola, Inc. Pitch epoch synchronous linear predictive coding vocoder and method
JP3199142B2 (ja) * 1993-09-22 2001-08-13 日本電信電話株式会社 音声の励振信号符号化方法および装置
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
JP3179291B2 (ja) * 1994-08-11 2001-06-25 日本電気株式会社 音声符号化装置
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
JP3292227B2 (ja) * 1994-12-28 2002-06-17 日本電信電話株式会社 符号励振線形予測音声符号化方法及びその復号化方法
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
WO1997027578A1 (en) * 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
EP0788091A3 (de) * 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
JPH1020891A (ja) * 1996-07-09 1998-01-23 Sony Corp 音声符号化方法及び装置
US6014622A (en) * 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法

Also Published As

Publication number Publication date
US6421638B2 (en) 2002-07-16
EP1553564A2 (de) 2005-07-13
CN1163870C (zh) 2004-08-25
US6687666B2 (en) 2004-02-03
WO1998006091A1 (fr) 1998-02-12
EP1553564A3 (de) 2005-10-19
US6549885B2 (en) 2003-04-15
AU3708597A (en) 1998-02-25
US20010001142A1 (en) 2001-05-10
US20010003812A1 (en) 2001-06-14
US6226604B1 (en) 2001-05-01
EP0858069A1 (de) 1998-08-12
EP0858069B1 (de) 2006-11-29
DE69737012D1 (de) 2007-01-11
CN1205097A (zh) 1999-01-13
EP0858069A4 (de) 2000-08-23
US20010001139A1 (en) 2001-05-10

Similar Documents

Publication Publication Date Title
DE69737012T2 (de) Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür
DE69932460T2 (de) Sprachkodierer/dekodierer
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE69634179T2 (de) Verfahren und Vorrichtung zur Sprachkodierung und -dekodierung
DE69910240T2 (de) Vorrichtung und verfahren zur wiederherstellung des hochfrequenzanteils eines überabgetasteten synthetisierten breitbandsignals
DE60219351T2 (de) Signaländerungsverfahren zur effizienten kodierung von sprachsignalen
DE69531642T2 (de) Synthese eines Anregungssignals bei Ausfall von Datenrahmen oder Verlust von Datenpaketen
EP1797552B1 (de) Verfahren und vorrichtung zur extraktion einer einem audiosignal zu grunde liegenden melodie
DE60012198T2 (de) Kodierung der hüllkurve des spektrums mittels variabler zeit/frequenz-auflösung
DE60126149T2 (de) Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69734837T2 (de) Sprachkodierer, sprachdekodierer, sprachkodierungsmethode und sprachdekodierungsmethode
DE60217522T2 (de) Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung
DE69628103T2 (de) Verfahren und Filter zur Hervorbebung von Formanten
DE60124274T2 (de) Codebuchstruktur und suchverfahren für die sprachkodierung
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
EP0076234B1 (de) Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
DE602004005784T2 (de) Verbesserte Anregung für Höherband-Kodierung in einem Codec basierend auf Frequenzbandtrennungs-Kodierungsverfahren
DE69636209T2 (de) Vorrichtung zur Sprachkodierung
DE69033510T3 (de) Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE2626793A1 (de) Verfahren zur bewertung stimmhafter und stimmloser zustaende eines sprachsignals

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PANASONIC CORP., KADOMA, OSAKA, JP