DE60225505T2 - Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern - Google Patents

Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern Download PDF

Info

Publication number
DE60225505T2
DE60225505T2 DE60225505T DE60225505T DE60225505T2 DE 60225505 T2 DE60225505 T2 DE 60225505T2 DE 60225505 T DE60225505 T DE 60225505T DE 60225505 T DE60225505 T DE 60225505T DE 60225505 T2 DE60225505 T2 DE 60225505T2
Authority
DE
Germany
Prior art keywords
input signal
short
component
time input
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60225505T
Other languages
English (en)
Other versions
DE60225505D1 (de
Inventor
Kimio Minato-ku Miseki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Application granted granted Critical
Publication of DE60225505D1 publication Critical patent/DE60225505D1/de
Publication of DE60225505T2 publication Critical patent/DE60225505T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf eine Prädiktionsparameteranalysevorrichtung oder ein Prädiktionsparameteranalyseverfahren, um Vorhersageparameter aus einem Eingangssignal zu erfassen.
  • Auf dem Gebiet der Audiocodierung werden LP Parameter (lineare Prädiktions- bzw. Vorhersageparameter) breitflächig als Spektrumparameter eingesetzt, die verwendet werden, um die Hülle eines Spektrum eines Signals bei der Sprachcodierung und Sprachsynthese auszudrücken. Eine bei Sprachcodierung durchgeführte LP Parameteranalyse wird als Beispiel der Vorhersageparameteranalyse beschrieben.
  • Die konventionelle Vorhersageparameteranalyse wird wie folgt durchgeführt.
  • Zuerst werden unnötige niederfrequente Komponenten, welche die Analyse von Vorhersageparametern beeinträchtigen, aus einem Eingangssignal durch Vorverarbeitung entfernt. Ein Hochfrequenzpassfilter realisiert diese Verarbeitung mit einer Grenzfrequenz von typischerweise etwa 50–100 Hz. Das Eingangssignal, aus dem die unnötigen Komponenten entfernt worden sind, wird mittels eines gegebenen Zeitfensters w(n) gefenstert, um ein Kurzzeiteingangssignal x(n) zu erzeugen, das für die Analyse zu verwenden ist. Das Zeitfenster wird Fensterfunktion oder Analysefenster genannt und ein Hamming-Fenster ist bekannt. Das Hybridfenster, das aus einem ersten Teil eines halben Hamming-Fensters und einem zweiten Teil eines Viertels einer Cosinus-Funktion besteht, wird jüngst eingesetzt. Das Hybridfenster wird bei 8 kbit/s Sprachcodierung G.729 einer ITU-T Empfehlung eingesetzt (Dokument 1 "Design and Description of CS-ACELP: A Toll quality 8 kb/s Speech Coder" IEEE Trans. On Speech and Audio Processing, R. Salami und Andere, S. 116–130, Band 6, Nr. 2, März 1998). Wie somit beschrieben, werden gemäß dem Zweck verschiedene Arten von Zeitfenstern verwendet.
  • Es werden Autokorrelationskoeffizienten Rxx(i) durch die folgende Gleichung (1) unter Verwendung des Kurzzeiteingangssignals x(n) berechnet.
    Figure 00020001
    wobei L die Länge des Zeitfensters anzeigt. Die Autokorrelationskoeffizienten werden einfacher als "Autokorrelation" oder "Autokorrelationsfunktion" bezeichnet, sie sind aber im Wesentlichen das Gleiche.
  • Es wird allgemein ausgeführt, um Vorhersageparameter unter Verwendung der Autokorrelationskoeffizienten zu erhalten, die durch die Gleichung (1) erhalten worden sind, oder der Autokorrelationskoeffizienten, die einer Modifikation durch Fenstern der früheren Autokorrelationskoeffizienten um ein festes Verzögerungsfenster unterworfen wurde. Die Modifikation der Autokorrelationskoeffizienten unter Verwendung des Verzögerungsfensters wird in Dokument 1 referenziert.
  • Ein als Levinson-Durbin-Algorithmus oder rekursive Lösungsmethode von Durbin bekanntes Verfahren kann in dem Fall verwendet werden, in dem die LP Parameter als Vorhersageparameter erhalten werden. Das Dokument (2) "Digital Speech Processing", Tokai Universitäts-Veröffentlichung, Meeting, Sadoaki Furui, S. 75, wird im Detail referenziert.
  • Wie so beschrieben, werden die Autokorrelationskoeffizienten des kurzen Zeiteingangssignals x(n), die durch Fenstern des Eingangssignals erhalten werden, aus denen die unnötigen niederfrequenten Komponenten entfernt sind, in der konventionellen Vorhersageparameteranalyse berechnet. Jedoch wird, wie in den Wellenformen von 1 gezeigt, das Kurzzeit-Eingangssignal, das aus dem Eingangssignal ((a) in 1) durch das Zeitfenster ausgeschnitten wird, mit einer unnötigen Komponente gemischt (Gleichstrom-Komponente, die durch eine gestrichelte Linie in (b) in 1 gezeigt ist). Solch eine unnötige Komponente steigt besonders im Falle einer Vorhersageanalyse, die das Kurzzeitfenster verwendet. Die unnötige Komponente beeinträchtigt die Analyse von Vorhersageparametern aufgrund der Tendenz, zu einem Niederfrequenzband abzuweichen, was zu inkorrekten Vorhersageparametern führt. Weiterhin variiert der Grad der Mischung einer solchen unnötigen Komponente abhängig von der Form und Phase des vom Fenster ausgeschnittenen Eingangssignals.
  • Aus den obigen Gründen beinhaltet die konventionelle Vorhersageparameteranalyse ein Problem, dass es schwierig ist, die Vorhersageparameter stabil zu erhalten. "ITU-T Empfehlung G.723.1, Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s" offenbart, dass ein Eingangssignal hochpassgefiltert wird, nach dem Rahmen, aber vor dem Analysefenstern.
  • Bei der konventionellen Vorhersageparameteranalyse wird eine unnötige Komponente (Gleichstromkomponente insbesondere) in das Kurzzeiteingangssignal eingemischt. Daher treten die unerwünschten Vorhersageparameter auf.
  • Es ist eine Aufgabe der Erfindung, eine Vorhersageparameteranalysevorrichtung und ein Vorhersageparameterverfahren bereitzustellen, die eine hohe Analyseeffizienz haben und welche die Mischung einer unnötigen Komponente auf einem Minimum halten können.
  • Gemäß der vorliegenden Erfindung, wird eine Vorhersageparameteranalysevorrichtung gemäß Anspruch 1 bereitgestellt.
  • Gemäß einem zweiten Aspekt der vorliegenden Erfindung wird ein tragbares Telefon gemäß Anspruch 4 bereitgestellt.
  • Gemäß einem dritten Aspekt der vorliegenden Erfindung wird ein Vorhersageparameteranalyseverfahren gemäß Anspruch 5 bereitgestellt.
  • Diese Zusammenfassung der Erfindung beschreibt nicht notwendigerweise alle Merkmale.
  • Die Erfindung kann vollständiger aus der nachfolgenden detaillierten Beschreibung verstanden werden, bei Gesamtschau mit den beigefügten Zeichnungen, in denen:
  • 1 Wellenformen zum Erläutern eines Prinzips der Vorhersageparameteranalyse zeigt;
  • 2 ein Blockdiagramm einer Vorhersageparameteranalysevorrichtung gemäß der ersten Ausführungsform der vorliegenden Erfindung zeigt;
  • 3 ein Flussdiagramm zum Erläutern eines Vorhersageparameteranalyseverfahrens zeigt, das durch die Vorhersageparameteranalysevorrichtung gemäß der ersten Ausführungsform ausgeführt wird;
  • 4 ein Blockdiagramm einer Vorhersageparameteranalysevorrichtung gemäß einem Beispiel zeigt;
  • 5 ein Flussdiagramm zum Erläutern eines Vorhersageparameteranalyseverfahrens zeigt, das durch die Vorhersageparameteranalysevorrichtung des Beispiels ausgeführt wird;
  • 6 ein Blockdiagramm einer Vorhersageparameteranalysevorrichtung gemäß der zweiten Ausführungsform der vorliegenden Erfindung zeigt;
  • 7 ein Flussdiagramm zum Erläutern des Vorhersageparameteranalyseverfahrens zeigt, das von der Vorhersageparameteranalysevorrichtung der zweiten Ausführungsform ausgeführt wird;
  • 8A und 8B Frequenzcharakteristika von Analysefiltern zeigen, die von einem konventionellem Verfahren und einem Verfahren der vorliegenden Erfindung bereitgestellt werden; und
  • 9 ein Blockdiagramm des tragbaren Telefons zeigt, welches die vorliegende Erfindung anwendet.
  • 1 zeigt eine Wellenform, um das Prinzip der Vorhersageparameteranalyse zu erläutern, basierend auf der ersten Ausführungsform der vorliegenden Erfindung.
  • Eine Wellenform (a) repräsentiert eine Wellenform eines Eingangssignals, das an einer Vorhersageparameteranalysevorrichtung eingegeben wird. Das Eingangssignal ist ein Signal, aus dem die unnötige niederfrequente Komponente, welche die Vorhersageparameteranalyse beeinträchtigt, aus einem tatsächlichen Eingangssignal in der Vorverarbeitung entfernt worden ist. Die Vorverarbeitung wird unter Verwendung eines Hochpassfilters mit einer Grenzfrequenz von typischerweise um die 50–100 Hz realisiert. Das Eingangssignal (durch (a) in 1 gezeigt), aus dem die unnötige Komponente entfernt wird, wird durch Fenstern in Einheiten einer gegebenen Länge (10 ms bis 20 ms) herausgeschnitten. Anders gesagt, wird das Eingangssignal durch ein Zeitfenster w(n) gefenstert, um als ein Kurzzeiteingangssignal x(n) herausgeschnitten zu werden (in 1 durch (b) gezeigt). In diesem Fall wird das Eingangssignal so gefenstert, dass ein schädlicher Effekt, der die Rahmen an beiden Enden des extrahierten Rahmens beeinträchtigt, verkleinert wird. Beispielsweise wird ein Hamming-Fenster oder ein Hybridfenster verwendet.
  • Es ist ein konventionelles Verfahren, die Autokorrelation direkt unter Verwendung des Kurzzeiteingangssignals x(n) zu berechnen. Jedoch ist das Kurzzeiteingangssignal x(n) mit der unnötigen Komponente gemischt (der in der Wellenform (b) in 1 enthaltenen Gleichstromkomponente). Wenn die Autokorrelation unter Verwendung des die Gleichstromkomponente enthaltenden Kurzzeiteingangssignals berechnet wird, wird die Gleichstromkomponente zu einem echten Spektrum addiert, was dazu führt, dass das Spektrum unerwünscht beeinträchtigt wird.
  • Die vorliegende Ausführungsform berechnet nicht direkt Autokorrelationskoeffizienten unter Verwendung des Kurzzeiteingangssignals, sondern detektiert, wieviel unnötige Komponente, z. B. Gleichstromkomponente, die beim Fenstern auftritt, in das Kurzzeiteingangssignal eingemischt ist und entfernt die detektierte Gleichstromkomponente. Als Verfahren zum Entfernen der unnötigen Komponente gibt es ein Verfahren zum Subtrahieren der Gleichstromkomponente von dem gesamten Kurzzeiteingangssignal, so dass die Gleichstromkomponente Null wird.
  • Das durch Entfernen der unnötigen Komponente aus dem Kurzzeiteingangssignal erhaltene Signal, wie oben beschrieben, ist ein modifiziertes Kurzzeiteingangssignal y(n) (in 1 durch (c) gezeigt). Zuletzt werden die Autokorrelationskoeffizienten unter Verwendung des modifizierten Kurzzeiteingangssignals y(n) berechnet und die Vorhersageparameter werden basierend auf den Autokorrelationskoeffizienten berechnet.
  • Gemäß der vorliegenden Ausführungsform können, da die Mischung der unnötigen Komponente in das Kurzzeiteingangssignal verhindert wird, die Vorhersageparameter hoher Genauigkeit erhalten werden. Eine Vorhersageparameteranalysevorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung wird unter Bezugnahme auf 2 beschrieben. In 2 wird ein Vorprozessor 10 mit einem Eingangssprachsignal in Einheiten eines Rahmens versorgt und unterwirft es einer Vorverarbeitung unter Verwendung eines Hochpassfilters mit einer Grenzfrequenz von beispielsweise um die 50–100 Hz. Wenn das vorverarbeitete Eingangssignal an eine Fenstervorrichtung 11 eingegeben wird, wird das Eingangssignal einem Zeitfenster w(n) (n = 0, 1, ..., L – 1) unterworfen, um ein Kurzzeiteingangssignal x(n) (n = 0, 1, ..., L – 1) zu erhalten, wo L die Länge des Zeitfensters anzeigt.
  • Eine Schätzvorrichtung 12 für die unnötige Komponente analysiert eine im Kurzzeiteingangssignal x(n) enthaltene unnötige Komponente und gibt ein Schätzsignal an einen unnötigen Komponentenentferner 13 aus. Eine Hauptkomponente der im Kurzzeiteingangssignal x(n) enthaltenen unnötigen Komponente ist eine Gleichstromkomponente. Ein Beispiel einer Evaluierung der Gleichstromkomponente kann wie folgt durchgeführt werden. dc = f(x(n)) (2)wobei dc ein Schätzsignal der Gleichstromkomponente anzeigt, f() eine Funktion des Kurzzeiteingangssignals x(n) anzeigt. Ein Beispiel von f() ist wie folgt:
    Figure 00070001
    wo [] einem Durchschnittswert des Kurzzeiteingangssignals x(n) entspricht. Es ist möglich, die Gleichstromkomponente unter Verwendung des Durchschnittswertes und eines Einstellparameters kdc abzuschätzen. Der Einstellparameter kdc wird auf einen Wert zwischen Null und um die 1 eingestellt.
  • Ein theoretischer Optimalwert ist kdc = 1 (so wird der Durchschnittswert zu einem Abschätzsignal der Gleichstromkomponente). Der unnötige Komponentenentferner 13 erzeugt ein Kurzzeiteingangssignal y(n), das durch Modifizieren des Kurzzeiteingangssignals x(n) basierend auf dem Schätzsignal aus der unnötigen Komponentenabschätzvorrichtung 12 erhalten wird. Dieses konkrete Verfahren beinhaltet einen Schritt des Entfernens des Schätzsignals der unnötigen Komponente aus beispielsweise dem Kurzzeiteingangssignal x(n) wie folgt. y(n) = x(n) – dc (4)n = 0, 1, ..., L – 1
  • Das Verfahren zum Entfernen der Gleichstromkomponente aus dem Kurzzeiteingangssignal x(n) wird hier beschrieben. Es ist jedoch möglich, eine unnötige Niederfrequenzkomponente durch Anlegen eines gegebenen Hochpassfilters (= Niederfrequenzblockfilter) an das Kurzzeiteingangssignal x(n) zu entfernen und es als modifiziertes Kurzzeiteingangssignal y(n) zu verwenden. In diesem Fall ist die Berechnung des Filterns notwendig, aber das Schätzsignal der unnötigen Komponente muss nicht verwendet werden. Somit ist in solch einem Fall die Abschätzvorrichtung 12 für die unnötige Komponente nicht notwendig.
  • Eine Autokorrelationsberechnungsvorrichtung 14 berechnet Autokorrelationskoeffizienten aus dem modifizierten Kurzzeiteingangssignal y(n) beispielsweise gemäß der nachfolgenden Gleichung.
  • Figure 00080001
  • Eine Vorhersageparameterberechnungsvorrichtung 15 berechnet Vorhersageparameter basierend auf den Autokorrelationskoeffizienten Ryy(i). Nachdem die Autokorrelationskoeffizienten wie oben beschrieben berechnet worden sind, werden die Vorhersageparameter durch ein Verfahren ähnlich dem konventionellen Verfahren berechnet. Anders ausgedrückt werden die Vorhersageparameter unter Verwendung von Autokorrelationskoeffizienten erzeugt, die durch Gleichung (5) erhalten werden, oder modifizierte Autokorrelationskoeffizienten, die durch Unterwerfen der Autokorrelationskoeffizienten einem fixen Verzugsfenster erhalten werden, um die Analyse zu stabilisieren. Die LP-Parameter als Vorhersageparameter werden durch das Lösen der nachfolgenden linearen Gleichung berechnet. Φα = φ (6)wobei Φ eine durch die Autokorrelationskoeffizienten Φi = Ryy(i) gebildete Autokorrelationsmatrix anzeigt (oder den modifizierten Autokorrelationskoeffizienten, die der fixen Modifikation unterworfen sind, indem die Autokorrelationskoeffizienten an das fixe Verzugsfenster angelegt werden). N zeigt die Anordnung der LPC-Parameter.
    Figure 00090001
    wobei T die Transposition der Matrix anzeigt.
  • Für das Verfahren zum Erhalten der LP-Parameter {α1} aus der Gleichung (6) sollte auf Dokument 2 Bezug genommen werden.
  • Das Obige ist ein Analysebeispiel für die Vorhersageparameter gemäß der derzeitigen Ausführungsform. Die Verarbeitung, die sich auf die erste Ausführungsform der vorliegenden Erfindung bezieht, wird in Verbindung mit einem Flussdiagramm von 3 erläutert.
  • Zuerst wird ein Eingangssprachsignal in Einheiten eines Rahmens eingegeben (S1). Es ist wünschenswert für das Eingangssignal, dass ein durch ein Hochfrequenzpassfilter vorab verarbeitetes Eingangssignal verwendet wird, dessen Grenzfrequenz bei beispielsweise um die 50–100 Hz liegt. Ein Kurzzeiteingangssignal x(n) wird erzeugt, indem das vorverarbeitete Eingangssignal einem Zeitfenster w(n) unterworfen wird (S2). Eine im Kurzzeiteingangssignal x(n) enthaltene unnötige Komponente wird eliminiert (S3). Ein modifiziertes Kurzzeiteingangssignal y(n) wird aus dem Kurzzeiteingangssignal x(n) erzeugt (S4).
  • Es werden Autokorrelationskoeffizienten basierend auf dem modifizierten Kurzzeiteingangssignal y(n) berechnet (S5). Vorhersageparameter werden aus den Autokorrelationskoeffizienten berechnet (S6) und als die Vorhersageparameter des Eingangssignals, die einem Rahmen entsprechen, ausgegeben. Der Vorhersageparameteranalyseprozess des Eingangssignals wird in Einheiten eines Rahmens eingegeben (im Falle eines Sprachsignals liegt eine repräsentative Rahmenlänge beim Abtasten mit 8 kHz innerhalb eines Bereichs von 10–20 ms), indem ein Verfahren der Schritte S1 bis S6 durchgeführt wird, ist abgeschlossen. Die seriellen Prozesse werden für jeden Rahmen durchgeführt, um den Prozess der Eingangssignaleingabe kontinuierlich durchzuführen (S7).
  • (Ein Beispiel)
  • In der ersten Ausführungsform wird die Gleichstromkomponente direkt aus dem Kurzzeiteingangssignal entfernt. In dem Beispiel wird die Beeinträchtigung aufgrund der Gleichstromkomponente in einem Niveau der Autokorrelation ausgeschlossen. 4 zeigt eine Vorhersageparameteranalysevorrichtung, die sich auf das Beispiel bezieht. Diesem zufolge vorbearbeitet der Vorprozessor 20 das Eingangssignal ähnlich wie bei der ersten Ausführungsform und gibt das vorverarbeitete Eingangssignal an einer Fenstervorrichtung 21 ein. Die Fenstervorrichtung 21 schneidet ein Kurzzeiteingangssignal aus, indem das vorverarbeitete Signal einer Fensterung unterworfen wird. Die unnötigen Komponentenabschätzvorrichtung 22 analysiert eine im Kurzzeiteingangssignal x(n) enthaltende unnötige Komponente, um ein Abschätzsignal zu erzeugen und gibt es an eine Autokorrelationsberechnungsvorrichtung 24 aus. Das Kurzzeiteingangssignal x(n) wird ebenfalls an die Autokorrelationsberechnungsvorrichtung 24 geschickt. Beispielsweise ist im an die Autokorrelationsberechnungsvorrichtung 24 eingegebenen Kurzzeiteingangssignal eine unnötige Komponente, z. B. eine Gleichstromkomponente, die auftritt, wenn das Signal einer Fensterung unterworfen wird, enthalten. Jedoch entfernt die Autokorrelationsberechnungsvorrichtung 24 diese unnötige Komponente in einem Niveau der Autokorrelation unter Verwendung des Abschätzsignals aus der unnötigen Komponentenabschätzvorrichtung 22. Daher gibt die Autokorrelationsberechnungsvorrichtung 24 Autokorrelationskoeffizienten Ryy(i) aus, die nicht durch die unnötige Komponente beeinträchtigt sind. Die Vorhersageparameterberechnungsvorrichtung 25 berechnet Vorhersageparameter basierend auf den Autokorrelationskoeffizienten Ryy(i).
  • 5 zeigt ein Flussdiagramm zum Erläutern eines Vorhersageparameteranalyseverfahrens des Beispiels. Gemäß diesem Beispiel wird ein Verfahren bereitgestellt, das Autokorrelationskoeffizienten bereitstellt, die zur Berechnung von Vorhersageparametern verwendet werden, ohne ein modifiziertes Kurzzeiteingangssignal y(n) zu erzeugen, im Hinblick auf die unnötige Komponente, die beim Unterwerfen des Eingangssignals im Zeitfenster auftritt.
  • Gemäß diesem Verfahren wird eine Eingangssprache in Einheiten eines Rahmens eingegeben (S11). Ein Kurzzeiteingangssignal x(n) wird durch Unterwerfen des vorverarbeiteten Eingangssignals einem Zeitfenster wie w(n) erhalten (S12). Dann wird eine im Kurzzeiteingangssignal x(n) enthaltende unnötige Komponente abgeschätzt (S13). Es werden Autokorrelationskoeffizienten durch die abgeschätzte unnötige Komponente und das Kurzzeiteingangssignal x(n) erhalten (S15). Es werden Vorhersageparameter aus den Autokorrelationskoeffizienten berechnet (S16) und als Vorhersageparameter des einem Rahmen entsprechenden Eingangssignals ausgegeben.
  • Der Vorhersageparameteranalyseprozess des in Einheiten eines Rahmens eingegebenen Eingangssignals (im Falle eines Sprachsignals liegt eine repräsentative Rahmenlänge bei der Abtastung mit 8 kHz innerhalb eines Bereichs von 10–20 ms), indem die obigen Schritte durchgeführt werden, ist abgeschlossen. Die seriellen Prozesse werden für jeden Rahmen durchgeführt, um den Prozess der Eingangssignaleingabe kontinuierlich durchzuführen (S17).
  • Wie somit beschrieben, wird jegliches Verfahren zum Erzeugen von Autokorrelationskoeffizienten präsentiert, das für das Berechnen von Vorhersageparametern im Hinblick auf die unnötige Komponente verwendet wird, die auftritt, wenn das Eingangssignal dem Zeitfenster unterworfen wird.
  • Als Vorhersageparameterextraktionsverfahren wird ein Verfahren zum Extrahieren linearer Vorhersageparameter erläutert, aber es ist nicht auf dieses Verfahren beschränkt. Anders ausgedrückt, falls die Vorhersageparameter durch Autokorrelationskoeffizienten erhalten werden können, ist das vorliegende Beispiel nicht darauf beschränkt, ob die Vorhersageparameter linear oder nicht-linear sind. Das Vorhersageparameteranalyseverfahren der vorliegenden Erfindung kann auf jegliches Analyseverfahren zur Vorhersage von Parametern (auf Vorhersageparametern basierenden Synthesefiltern) angewendet werden.
  • (Die zweite Ausführungsform)
  • 6 zeigt eine Vorhersageparameteranalysevorrichtung der zweiten Ausführungsform. Gemäß der zweiten Ausführungsform umfasst eine Vorhersageparameteranalysevorrichtung einen Kurzzeiteingangssignalgenerator 41, der aus einem Eingangssignal oder einem von einem Eingangssignal abgeleiteten Signal ein Kurzzeiteingangssignal erzeugt, eine Komponentenentfernvorrichtung 43, die Gleichstromkomponenten oder vorgegebene Frequenzbandkomponenten aus dem Kurzzeiteingangssignal entfernt, eine Autokorrelationsberechnungsvorrichtung 44, die Autokorrelationskoeffizienten basierend auf einem von der Komponentenentfernvorrichtung 43 bereitgestellten modifizierten Kurzzeiteingangssignal berechnet und eine Vorhersageparameterberechnungsvorrichtung 45, die Vorhersageparameter basierend auf den Autokorrelationskoeffizienten berechnet.
  • 7 zeigt ein Flussdiagramm zum Erläutern eines Vorhersageparameteranalyseverfahrens der zweiten Ausführungsform der vorliegenden Erfindung. Zuerst wird ein Eingangssignal an den Kurzzeiteingangssignalgenerator 41 der Vorhersageparameteranalysevorrichtung eingegeben (S21). Der Kurzzeiteingangssignalgenerator 41 erzeugt ein dem Eingangssignal entsprechendes Kurzzeiteingangssignal (S22). Wenn dieses Kurzzeiteingangssignal an der Komponentenentfernvorrichtung 43 eingegeben wird, werden Gleichstrom oder vorgegebene Frequenzkomponenten aus dem Kurzzeiteingangssignal entfernt (S23). Als Ergebnis wird ein modifiziertes Kurzzeiteingangssignal aus der Komponentenentfernvorrichtung 43 ausgegeben (S24). Wenn dieses modifizierte Kurzzeiteingangssignal an der Autokorrelationsberechnungseinrichtung 44 eingegeben wird, berechnet die Autokorrelationsberechnungsvorrichtung 44 Autokorrelationskoeffizienten basierend auf dem modifizierten Kurzzeiteingangssignal (S25). Wenn die Autokorrelationskoeffizienten an der Vorhersageparameterberechnungsvorrichtung 45 eingegeben werden, werden die Vorhersageparameter auf Basis der Autokorrelationskoeffizienten berechnet (S26). Danach wird der nächste Rahmen hinein genommen. Zu diesem Zeitpunkt, falls es keinen nächsten Rahmen gibt, wird der Prozess beendet. Falls der nächste Rahmen eingenommen wird, kehrt der Prozess zu Schritt S21 zurück.
  • Im Vorhersageparameteranalyseapparat der vorliegenden Ausführungsform, der oben beschrieben wurde, wird ein inverser Filter des Vorhersagefilters, basierend auf dem Vorhersageparametern (oder codierten Vorhersageparametern) ein Synthesefilter genannt und er kann die Hülle des Spektrums des für die Analyse verwendeten Eingangssignals bereitstellen. 8A zeigt eine Frequenzcharakteristik eines auf den durch konventionelle Vorhersageparameteranalyse bereitgestellten Vorhersageparametern basierenden Synthesefilters. 8B zeigt eine Frequenzcharakteristik eines auf durch das Verfahren der vorliegenden Ausführungsform bereitgestellten Vorhersageparametern basierenden Synthesefilters. Wie aus dem Vergleich zwischen 8A und 8B zu verstehen, erniedrigen sich die bei der Fensterung auftretenden Niederfrequenzkomponenten im durch das Verfahren der vorliegenden Ausführungsform bereitgestellten Synthesefilter im Vergleich zum konventionellen Verfahren. Daher kann durch Verwenden der durch das Verfahren der vorliegenden Ausführungsform bereitgestellten Vorhersageparameter die Sprachqualität der Sprachcodierung oder der Sprachsynthese verbessert werden.
  • 9 zeigt ein tragbares Endgerät, wie etwa ein tragbares Telefon, auf welches die oben beschriebene Vorhersageparameteranalysevorrichtung angewendet ist. Dieses tragbare Telefon umfasst eine Funkvorrichtung 31, eine Basisbandvorrichtung 32, eine Eingabe-Ausgabevorrichtung 33 und eine Stromversorgungsvorrichtung 34. Die Basisbandvorrichtung 32 ist mit einem LCD Controller 35 versehen, um eine Flüssigkristallanzeige (LCD) 37 der Eingabe-Ausgabevorrichtung 33 zu steuern, und einem Sprachcodec 36, der mit einem Lautsprecher 38 und einem Mikrofon 39 verbunden ist. Die Vorhersageparameteranalysevorrichtung gemäß der Ausführungsform der vorliegenden Erfindung wird auf eine LPC-Schaltung angewendet, die im Sprachcodec 36 enthalten ist, um die Sprachqualität zu verbessern.
  • Gemäß der vorliegenden, oben beschriebenen Erfindung können, da die unnötige Komponente, wie etwa eine bei der Fensterung der Eingangssignals auftretende Gleichstromkomponente, entfernt wird, die für das stationäre Eingangssignal stabilisierten Vorhersageparameter in der Vorhersageparameteranalyse erhalten werden. Dementsprechend kann die vorliegende Erfindung eine Signalverarbeitung zum Durchführen von Vorhersageanalyse wie etwa Sprachcodierung, Audiocodierung, Sprachsynthese und Spracherkennung einsetzen.

Claims (8)

  1. Vorhersageparameteranalysevorrichtung, umfassend: Fenstermittel (11) zum Unterwerfen eines Eingangsaudiosignals oder eines aus einem Eingangsaudiosignal abgeleiteten Signals einer Fensterung durch ein Vorhersageanalysefenster (w(n)), um ein Kurzzeiteingangssignal (x(n)) zu erzeugen, so dass ein schädlicher Effekt, der das Kurzzeiteingangssignal (x(n)) an beiden Enden beeinträchtigt, verringert wird; gekennzeichnet durch Komponentenentfernungsmittel (13) zum Entfernen einer unnötigen Komponente, die durch die Fensterung verursacht wird, aus dem kurzzeitigen Eingangssignal (x(n)), um ein modifiziertes Kurzzeiteingangssignal (y(n)) zu erzeugen; Autokorrelationskoeffizientenberechnungsmittel (14) zum Berechnen von Autokorrelationskoeffizienten (Ryy(i)), basierend auf dem modifizierten Kurzzeiteingangssignal (y(n)); und Vorhersageparameterberechnungsmittel (15) zum Berechnen von Vorhersageparametern basierend auf den Autokorrelationskoeffizienten (Ryy(i)).
  2. Vorhersageparameteranalysevorrichtung gemäß Anspruch 1, beinhaltend Mittel (12) zum Abschätzen einer im Kurzzeiteingangssignal enthaltenen unnötigen Komponente, um ein Abschätzsignal zu erhalten, das zum Entfernen der unnötigen Komponente aus dem Kurzzeiteingangssignal zu verwenden ist.
  3. Vorhersageparameteranalysevorrichtung gemäß Anspruch 1 oder 2, wobei die unnötige Komponente eine Gleichstromkomponente ist.
  4. Tragbares Telefon, gekennzeichnet dadurch, dass es umfasst einen Basisbandteil (32) einschließlich eines Sprachcodec (36), der eine Vorhersageparameteranalysevorrichtung gemäß einem der Ansprüche 1 bis 3 enthält, und einen Sprachausgabeteil einschließlich eines Lautsprechers (38), der dafür konfiguriert ist, ein vom Codec decodiertes Sprachsignal auszugeben.
  5. Vorhersageparameteranalyseverfahren, umfassend die folgenden Schritte: Unterwerfen eines Eingangsaudiosignals oder eines von einem Eingangsaudiosignal abgeleiteten Signals, einer Fensterung durch ein Vorhersageanalysefenster (w(n)), um ein Kurzzeiteingangssignal (x(n)) zu erzeugen, so dass ein schädlicher Effekt, der das Kurzzeiteingangssignal (x(n)) an beiden Enden beeinträchtigt, verringert wird, gekennzeichnet durch Entfernen einer unnötigen Komponente, die durch die Fensterung verursacht wird, aus dem Kurzzeiteingangssignal (x(n)), um ein modifiziertes Kurzzeiteingangssignal (y(n)) zu erzeugen; Erzeugen von Autokorrelationskoeffizienten (ryy(i)), basierend auf dem modifizierten Kurzzeiteingangssignal (y(n)); und Erzeugen von Vorhersageparametern, basierend auf den Autokorrelationskoeffizienten (Ryy(i)).
  6. Vorhersageparameteranalyseverfahren gemäß Anspruch 5, beinhaltend: einen Abschätzschritt zum Abschätzen einer im Kurzzeiteingangssignal enthaltenen unnötigen Komponente, einen Entfernungsschritt zum Entfernen der unnötigen Komponente aus dem Kurzzeiteingangssignal, basierend auf der abgeschätzten unnötigen Komponente.
  7. Vorhersageparameteranalyseverfahren gemäß Anspruch 5 oder 6, wobei die unnötige Komponente eine Gleichstromkomponente ist.
  8. Vorhersageparameteranalyseverfahren gemäß Anspruch 7, wobei der Entfernungsschritt die Gleichstromkomponente oder eine vorbestimmte Frequenzbandkomponente aus dem Kurzzeiteingangssignal entfernt.
DE60225505T 2001-05-18 2002-05-16 Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern Expired - Lifetime DE60225505T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001149564A JP3859462B2 (ja) 2001-05-18 2001-05-18 予測パラメータ分析装置および予測パラメータ分析方法
JP2001149564 2001-05-18

Publications (2)

Publication Number Publication Date
DE60225505D1 DE60225505D1 (de) 2008-04-24
DE60225505T2 true DE60225505T2 (de) 2009-04-02

Family

ID=18994711

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60225505T Expired - Lifetime DE60225505T2 (de) 2001-05-18 2002-05-16 Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern

Country Status (5)

Country Link
US (1) US6842731B2 (de)
EP (1) EP1260967B1 (de)
JP (1) JP3859462B2 (de)
CN (1) CN1258722C (de)
DE (1) DE60225505T2 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7783500B2 (en) * 2000-07-19 2010-08-24 Ijet International, Inc. Personnel risk management system and methods
DE10123366C1 (de) * 2001-05-14 2002-08-08 Fraunhofer Ges Forschung Vorrichtung zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen
US7852999B2 (en) * 2005-04-27 2010-12-14 Cisco Technology, Inc. Classifying signals at a conference bridge
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
EP2407963B1 (de) * 2009-03-11 2015-05-13 Huawei Technologies Co., Ltd. Verfahren, vorrichtung und system zur linearprädiktionsanalyse
US9025779B2 (en) 2011-08-08 2015-05-05 Cisco Technology, Inc. System and method for using endpoints to provide sound monitoring
US10386729B2 (en) * 2013-06-03 2019-08-20 Kla-Tencor Corporation Dynamic removal of correlation of highly correlated parameters for optical metrology
EP3648103B1 (de) * 2014-04-24 2021-10-20 Nippon Telegraph And Telephone Corporation Decodierungsverfahren, decodierungsvorrichtung, korrespondierendes programm und aufzeichnungsmedium

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
ES2225321T3 (es) * 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
JPH0563580A (ja) 1991-09-02 1993-03-12 Mitsubishi Electric Corp 音声信号処理方法
US5307405A (en) * 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
US5536902A (en) 1993-04-14 1996-07-16 Yamaha Corporation Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter
IN184794B (de) * 1993-09-14 2000-09-30 British Telecomm
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5835495A (en) * 1995-10-11 1998-11-10 Microsoft Corporation System and method for scaleable streamed audio transmission over a network
JPH1010230A (ja) 1996-06-26 1998-01-16 Mitsubishi Heavy Ind Ltd 距離計測装置
JPH10254473A (ja) 1997-03-14 1998-09-25 Matsushita Electric Ind Co Ltd 音声変換方法及び音声変換装置
JP4024427B2 (ja) 1999-05-24 2007-12-19 株式会社リコー 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
CN1258722C (zh) 2006-06-07
EP1260967A3 (de) 2004-04-14
CN1387131A (zh) 2002-12-25
JP2002341889A (ja) 2002-11-29
US20020184008A1 (en) 2002-12-05
EP1260967B1 (de) 2008-03-12
JP3859462B2 (ja) 2006-12-20
EP1260967A2 (de) 2002-11-27
DE60225505D1 (de) 2008-04-24
US6842731B2 (en) 2005-01-11

Similar Documents

Publication Publication Date Title
DE60013785T2 (de) VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION
DE69534285T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE602005004464T2 (de) Sprachverbesserung
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE69628103T2 (de) Verfahren und Filter zur Hervorbebung von Formanten
DE69913262T2 (de) Vorrichtung und verfahren zur anpassung der rauschschwelle zur sprachaktivitätsdetektion in einer nichtstationären geräuschumgebung
DE69630580T2 (de) Rauschunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine Mobilstation
DE69926851T2 (de) Verfahren und Vorrichtung zur Sprachaktivitätsdetektion
DE102005032724B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE69534942T2 (de) System zur sprecher-identifizierung und-überprüfung
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
EP1386307B2 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE60034026T2 (de) Sprachverbesserung mit durch sprachaktivität gesteuerte begrenzungen des gewinnfaktors
DE19948308C2 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE69830017T2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE60308336T2 (de) Verfahren und system zur messung der übertragungsqualität eines systems
DE602004010634T2 (de) Verfahren und system zur sprachqualitätsvorhersage eines audioübertragungssystems
DE60311891T2 (de) Audiocodierung
DE60225505T2 (de) Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern
EP1239455A2 (de) Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung
EP1458216B1 (de) Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen
EP0658874A1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
EP1453355B1 (de) Signalverarbeitung in einem Hörgerät
DE60110541T2 (de) Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz

Legal Events

Date Code Title Description
8364 No opposition during term of opposition