DE60109111T2 - Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen - Google Patents

Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen Download PDF

Info

Publication number
DE60109111T2
DE60109111T2 DE60109111T DE60109111T DE60109111T2 DE 60109111 T2 DE60109111 T2 DE 60109111T2 DE 60109111 T DE60109111 T DE 60109111T DE 60109111 T DE60109111 T DE 60109111T DE 60109111 T2 DE60109111 T2 DE 60109111T2
Authority
DE
Germany
Prior art keywords
signal
reproduction
speech
speech signal
excitation signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60109111T
Other languages
English (en)
Other versions
DE60109111D1 (de
Inventor
Kazunori Minato-ku Ozawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Application granted granted Critical
Publication of DE60109111D1 publication Critical patent/DE60109111D1/de
Publication of DE60109111T2 publication Critical patent/DE60109111T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Description

  • Diese Erfindung betrifft einen Sprachdekoder zum Dekodieren eines Sprachsignals und insbesondere einen Sprachdekoder, der ein Hintergrundrauschsignal mit einer hohen Qualität dekodieren kann, wobei das Hintergrundrauschsignal in einem Sprachsignal enthalten ist, das mit einer niedrigen Bitrate kodiert ist.
  • Als ein Verfahren zum Kodieren eines Sprachsignals mit einem hohen Wirkungsgrad ist auf dem Fachgebiet CELP (Code Excited Linear Predictive Coding = kodeangeregte lineare prädiktive Kodierung) bekannt und wird zum Beispiel in "Code-excited linear prediction: High quality speech at very low bit rates", M.Schroeder und B. Atal (Proc. ICASSP, S. 937 – 940, 1985, auf das hier im weiteren als Dokument 1 Bezug genommen wird), "Improved speech quality and efficient vector quantization in CELP", Kleijn et al. (Proc. ICASSP, S. 155 – 158, 1988, auf das hier im weiteren als Dokument 2 Bezug genommen wird) beschrieben.
  • In dem herkömmlichen Verfahren werden auf einer Sendeseite unter Verwendung einer linearen prädiktiven (LPC) Analyse für jeden Rahmen (z.B. 20 ms lang) Spektralparameter, die wesentliche spektrale Eigenschaften eines Sprachsignals darstellen, aus dem Sprachsignal extrahiert. Dann wird jeder Rahmen in Teilrahmen (z.B. 5 ms lang) unterteilt. Für jeden Teilrahmen werden auf der Grundlage eines vorhergehenden Anregungssignals Parameter (ein Verstärkungsparameter und ein Verzögerungsparameter, der einer Grundfrequenzperiode entspricht) aus einem adaptiven Kode-Lexikon extrahiert. Durch die Verwendung eines adaptiven Kode-Lexikons wird das Sprachsignal des Teilrahmens mit der Grundfrequenz vorausberechnet. Für ein durch die Gundfrequenz-Prädiktion erhaltenes Anregungssignal wird aus einem Anregungskode-Lexikon (Vektorquantisierungs-Kode-Lexikon) ein optimaler Anregungskodevektor, der vorbestimmte Arten von Rauschsignalen aufweist, ausgewählt, und eine optimale Verstärkung wird berechnet. Auf diese Weise wird ein Anregungssignal quantisiert.
  • Der Anregungskodevektor wird derart ausgewählt, daß eine Fehlerleistung zwischen einem durch das ausgewählte Rauschsignal synthetisierten Signal und dem weiter oben erwähnten Restsignal minimiert wird.
  • Ein Index, der die Art des ausgewählten Kodevektors darstellt, die Verstärkung, die Spektralparameter und die Parameter des adaptiven Kode-Lexikons werden von einer Multiplexereinheit kombiniert und gesendet.
  • Außerdem wurden als eine Methode zur Verringerung der Menge an Berechnungen, die erforderlich sind, um das Anregungskode-Lexikon zu durchsuchen, verschiedene Verfahren vorgeschlagen.
  • Zum Beispiel wird ein ACELP- (Algebraic Code Excited Linear Prediction = algebraische kodeangeregte lineare Prädiktion) Verfahren vorgeschlagen. Dieses Verfahren ist zum Beispiel in "16 kbps wideband speech coding technique based on algebraic CELP", C. Laflamme et al. (Proc. ICASSP, S. 13 – 16, 1991, auf das hier im weiteren als Dokument 3 Bezug genommen wird) beschrieben.
  • Gemäß dem in dem Dokument 3 beschriebenen Verfahren wird ein Anregungssignals durch mehrere Impulse ausgedrückt, und außerdem wird jede der Impulspositionen durch eine vorbestimmte Anzahl von Bits dargestellt und wird übertragen. Hier ist die Amplitude jedes Impulses auf +1,0 oder –1,0 beschränkt. Daher kann die Menge an Berechnungen, die erforderlich ist, um die Impulse zu suchen, beträchtlich verringert werden.
  • Gemäß den weiter oben erwähnten herkömmlichen Verfahren und Methoden besteht jedoch das Problem, daß bei einer Bitrate von 8 kBit/s oder mehr eine hervorragende Tonqualität erzielt wird, aber, insbesondere, wenn einer Sprache ein Hintergrundrauschen überlagert wird, wird die Tonqualität eines Hintergrundrauschanteils einer kodierten Sprache bei einer niedrigeren Bitrate verschlechtert. Dieses Problem tritt bezeichnenderweise zum Beispiel in dem Fall auf, in dem die Sprachkodierung in dem Zellulartelefon ausgeführt wird, und so weiter.
  • Gemäß den in dem Dokument 1 und dem Dokument 2 beschriebenen Kodierungsansätzen führt die Verringerung der Bitrate der Kodierungsergebnisse dazu, daß die Anzahl der in dem Anregungskode-Lexikon enthaltenen Bits abnimmt und dadurch dazu, daß die Reproduktionsgenauigkeit von Wellenformen verschlechtert wird. Die Verschlechterung der Wellenform-Reproduktionsgenauigkeit erscheint nicht auf hohen Wellenform-Korrelationssignalen, wie etwa Sprachsignalen, aber erscheint maßgeblich auf niedrigen Wellenform-Korrelationssignalen, wie etwa Hintergrundrauschsignalen.
  • In dem in dem Dokument 3 beschriebenen Kodierungsansatz wird ein Anregungssignal durch die Kombination von Impulsen dargestellt. Die Impulskombination ist zur Modellierung eines Sprachsignals geeignet, so daß eine hervorragende Tonqualität erhalten wird. Eine Tonqualität einer kodierten Sprache wird jedoch bei einer niedrigeren Bitrate erheblich verschlechtert, weil die Anzahl von Impulsen für einen einzigen Teilrahmen nicht genug ist, um das Anregungssignal mit hoher Genauigkeit darzustellen.
  • Der Grund ist wie folgt. Das Anregungssignal wird durch eine Kombination aus mehreren Impulsen ausgedrückt. Daher sind in einer Vokalperiode der Sprache die Impulse um einen Grundfrequenzimpuls konzentriert, was einen Anfangspunkt eines Grundtons ergibt. In diesem Fall kann das Sprachsignal effizient durch eine kleine Anzahl von Impulsen dargestellt werden. Andererseits müssen mit Bezug auf ein zufälliges Signal, wie etwa das Hintergrundrauschen, nicht konzentrierte Impulse erzeugt werden. In diesem Fall ist es schwierig, das Hintergrundrauschen mit einer kleinen Anzahl von Impulsen geeignet darzustellen. Wenn die Bitrate gesenkt wird und die Anzahl von Impulsen verringert wird, wird die Tonqualität für das Hintergrundrauschen daher drastisch verschlechtert.
  • Angesichts der weiter oben erwähnten Probleme, die in den herkömmlichem Methoden und Verfahren auftreten, ist es eine Aufgabe dieser Erfindung, die weiter oben erwähnten Probleme zu beseitigen und einen verbesserten Sprachdekoder zum Dekodieren eines Sprachsignals zur Verfügung zu stellen, wobei durch Kodieren mit den weiter oben erwähnten Methoden und Verfahren ein Hintergrundrauschsignal überlagert wird. Der verbesserte Sprachdekoder erfordert eine relativ kleine Menge an Berechnungen, kann aber das Sprachsignal, selbst wenn eine Bitrate niedrig ist, unter Vermeidung der Verschlechterung der Tonqualität dekodieren.
  • Um die weiter oben erwähnte Aufgabe zu lösen, stellt der erste Aspekt dieser Erfindung einen Sprachdekoder zum Dekodieren eines kodierten Sprachsignals in ein Reproduktionssprachsignal und zum Reproduzieren eines Sprachsignals unter Verwendung des Reproduktionssprachsignals mit den spezifischen Bedingungen des Reproduktionssprachsignals zur Verfügung.
  • Der Sprachdekoder gemäß dem ersten Aspekt der vorliegenden Erfindung umfaßt: eine Spektralparameter-Berechnungsschaltung, die auf das Reproduktionssprachsignal anspricht, um auf der Grundlage des Reproduktionssprachsignals Spektralparameter zu berechnen; eine Anregungssignal-Berechnungsschaltung, um auf der Grundlage des Reproduktionssprachsignals und der von der Spektralparameter-Berechnungsschaltung berechneten Spektralparameter ein Anregungssignal zu berechnen und einen Anregungssignalpegel zu erhalten; eine Glättungsschaltung, die auf die Spektralparameter und das Anregungssignal anspricht, um die Spektralparameter und/oder den Anregungssignalpegel zeitlich zu glätten, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer einer Glättung unterzogen wird; und eine Synthesefilterschaltung mit einem Synthesefilter, das mit den von der Glättungsschaltung ausgegebenen Spektralparametern aufgebaut ist, um das Anregungssignal unter Verwendung des Synthesefilters zu synthetisieren, um das Sprachsignal zu reproduzieren; wobei die Anregungssignal-Berechnungsschaltung, die Glättungsschaltung und die Synthese filterschaltung nur entsprechend vorbestimmten Bedingungen arbeiten.
  • In dem obigen Sprachdekoder kann die Anregungssignal-Berechnungsschaltung unter Verwendung der Spektralparameter eine inverse Filterung für das Reproduktionssprachsignal ausführen, um das Anregungssignal zu berechnen. Außerdem kann der obige Sprachdekoder eine Modusbeurteilungsschaltung zur Beurteilung eines Reproduktionssprachsignalmodus aufweisen, indem Merkmalgrößen aus dem Reproduktionssprachsignal extrahiert werden, wobei die vorbestimmten Bedingungen eine Modusbedingung aufweisen, daß der Reproduktionssprachsignalmodus von der Modusbeurteilungsschaltung und der Anregungssignal-Berechnungsschaltung als ein vorbestimmter Modus beurteilt wird. In diesem Fall arbeiten die Glättungsschaltung und die Synthesefilterschaltung nur in dem Fall, in dem die Modusbedingung erfüllt ist. Der vorbestimmte Modus ist hier zum Beispiel "Stille" oder "Ton ohne Sprache".
  • Der zweite Aspekt dieser Erfindung stellt einen anderen Sprachdekoder zum Dekodieren eines kodierten Sprachsignals in ein Reproduktionssprachsignal und zum Reproduzieren, eines Sprachsignals unter Verwendung des Reproduktionssprachsignals zur Verfügung.
  • Der Sprachdekoder gemäß dem zweiten Aspekt der vorliegenden Erfindung umfaßt: eine Spektralparameter-Berechnungsschaltung, die auf das Reproduktionssprachsignal anspricht, um auf der Grundlage des Reproduktionssprachsignals Spektralparameter zu berechnen; eine Anregungssignal-Berechnungsschaltung, um auf der Grundlage des Reproduktionssprachsignals und der von der Spektralparameter-Berechnungsschaltung berechneten Spektralparameter ein Anregungssignal zu berechnen und einen Anregungssignalpegel zu erhalten; eine Grundfrequenz-Prädiktionsschaltung, die entweder aus dem Reproduktionssprachsignal oder dem Anregungssignal eine Grundfrequenzperiode berechnet, unter Verwendung der Grundfrequenzperiode eine Grundfrequenz-Prädiktion ausführt, um ein Grundfrequenz-Prädiktionssignal zu erzeugen, und durch Subtrahieren des Grundfrequenz-Prädiktionssignals von dem Anregungssignal ein Restsignal berechnet; eine Verstärkungsberechnungsschaltung zum Berechnen einer Verstärkung von dem Grundfrequenz-Prädiktionssignal und/oder dem Restsignal, die beide von der Grundfrequenz-Prädiktionsschaltung ausgegeben werden; eine Glättungsschaltung, die auf die Spektralparameter und die Verstärkung anspricht, um die Spektralparameter und/oder die Verstärkung zeitlich zu glätten, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer einer Glättung unterzogen wird; und eine Synthesefilterschaltung mit einem Synthesefilter, das mit den von der Glättungsschaltung ausgegebenen Spektralparametern aufgebaut ist, um ein Anregungssignal auf der Grundlage der Verstärkung, des Grundfrequenz-Prädiktionssignals und des Restsignals als ein geeignetes Anregungssignal neu zu erzeugen, um dadurch unter Verwendung des Synthesefilters das geeignete Anregungssignal zu synthetisieren, um das Sprachsignal zu reproduzieren.
  • In dem Sprachdekoder gemäß dem zweiten Aspekt der vorliegenden Erfindung kann die Anregungssignal-Berechnungsschaltung unter Verwendung der Spektralparameter eine inverse Filterung für das Reproduktionssprachsignal ausführen, um das Anregungssignal zu berechnen.
  • Der dritte Aspekt dieser Erfindung stellt ein Verfahren zum Reproduzieren eines Sprachsignals zur Verfügung, das aufweist: einen ersten Schritt zum Dekodieren eines kodierten Sprachsignals, das von einem Sprachkodierer ausgegeben wird, um ein Reproduktionssprachsignal zu erzeugen; einen zweiten Schritt zum Berechnen von Spektralparametern auf der Grundlage des Reproduktionssprachsignals; einen dritten Schritt zum Berechnen eines Anregungssignals und zum Erhalten eines Anregungssignalpegels auf der Grundlage des Reproduktionssprachsignals und der Spektralparameter; einen vierten Schritt zum zeitlichen Glätten der Spektralparameter und/oder des Anregungssignalpegels, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer dem Glätten unterzogen wird; und einen fünften Schritt zum Synthetisieren des Anregungssignals unter Verwendung des mit den Spektralparametern aufgebauten Synthesefilters, um das Sprachsignal zu reproduzieren; wobei der zweite bis fünfte Schritt nur in einem Fall ausgeführt wird, in dem vorbestimmte Bedingungen erfüllt sind, während im anderen Fall, in dem vorbestimmte Bedingungen nicht erfüllt sind, das Reproduktionssprachsignal als das Sprachsignal gehandhabt wird.
  • In dem Reproduktionsverfahren gemäß dem dritten Aspekt der vorliegenden Erfindung kann der dritte Schritt so ausgeführt werden, daß das Reproduktionssprachsignal unter Verwendung der Spektralparameter einer inversen Filterung unterzogen wird, um dadurch das Anregungssignal zu berechnen. Außerdem kann das obige Reproduktionsverfahren einen sechsten Schritt zum Beurteilen eines Modus des Reproduktionssprachsignals aufweisen, indem Merkmalgrößen aus dem Reproduktionssprachsignal extrahiert werden, wobei die vorbestimmten Bedingungen eine Modusbedingung aufweisen, daß der Modus des Reproduktionssprachsignals als ein vorbestimmter Modus beurteilt wird. Hier ist der vorbestimmte Modus zum Beispiel "Stille" oder "Ton ohne Sprache".
  • Der vierte Aspekt dieser Erfindung stellt ein anderes Verfahren zum Reproduzieren eines Sprachsignals zur Verfügung, das aufweist: einen ersten Schritt zum Dekodieren eines kodierten Sprachsignals, das von einem Sprachkodierer ausgegeben wird, um ein Reproduktionssprachsignal zu erzeugen; einen zweiten Schritt zum Berechnen von Spektralparametern auf der Grundlage des Reproduktionssprachsignals; einen dritten Schritt zum Berechnen eines Anregungssignals und zum Erhalten eines Anregungssignalpegels auf der Grundlage des Reproduktionssprachsignals und der Spektralparameter; einen vierten Schritt zum Berechnen einer Grundfrequenzperiode aus dem Reproduktionssprachsignal oder dem Anregungssignal, zum Ausführen einer Grundfrequenz-Prädiktion unter Verwendung der Grundfrequenzperiode, um ein Grundfrequenz-Prädiktionssignal zu erzeugen, und zum Subtrahieren des Grundfrequenz-Prädiktionssignals von dem Anregungssignal, um ein Restsignal zu berechnen; einen fünften Schritt zum Berechnen einer Verstärkung des Grundfrequenz-Prädiktionssignals und/oder des Restsignals; einen sechsten Schritt zum zeitli chen Glätten der Spektralparameter und/oder der Verstärkung, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer dem Glätten unterzogen wird; und einen siebten Schritt zum Neuerzeugen eines Anregungssignals als ein geeignetes Anregungssignal auf der Grundlage der Verstärkung, des Grundfrequenz-Prädiktionssignals und des Restsignals und dann Synthetisieren des geeigneten Anregungssignals unter Verwendung des mit den Spektralparametern aufgebauten Synthesefilters, so daß das Sprachsignal reproduziert wird;
  • In dem Reproduktionsverfahren gemäß dem vierten Aspekt der vorliegenden Erfindung kann der dritte Schritt so ausgeführt werden, daß das Reproduktionssprachsignal unter Verwendung der Spektralparameter einer inversen Filterung unterzogen wird, um dadurch das Anregungssignal zu berechnen.
  • Es versteht sich, daß sowohl die vorangehende Beschreibung als auch die folgende detaillierte Beschreibung lediglich beispielhaft und erläuternd sind und für die Erfindung, wie beansprucht, nicht einschränkend sind.
  • Kurze Beschreibung der Zeichnung
  • Die beigefügten Zeichnungen, die in dieser Patentschrift enthalten sind und einen Teil von ihr bilden, stellen Ausführungsformen der vorliegenden Erfindung dar und dienen gemeinsam mit der Beschreibung dazu, die Prinzipien der vorliegenden Erfindung zu erklären. In den Zeichnungen ist.
  • 1 ein Blockschaltbild, das einen Sprachdekoder gemäß der ersten Ausführungsform dieser Erfindung schematisch zeigt;
  • 2 ein Blockschaltbild, das einen anderen Sprachdekoder gemäß der zweiten Ausführungsform dieser Erfindung schematisch zeigt; und
  • 3 ein Blockschaltbild, das einen anderen Sprachdekoder gemäß der dritten Ausführungsform dieser Erfindung schematisch zeigt.
  • Detaillierte Beschreibung der bevorzugten Ausführungsformen
  • Ein Sprachdekoder gemäß einer bevorzugten Ausführungsform weist eine Dekodierschaltung zum Dekodieren eines kodierten Sprachsignals in ein Reproduktionssprachsignal und eine Reproduktionsschaltung zum Reproduzieren eines Sprachsignals unter Verwendung des Reproduktionssprachsignals auf. Die Dekodierschaltung kann ein herkömmlicher Sprachdekoder gemäß einem in dem Dokument 1, 2 oder 3 offenbarten Verfahren sein. Die Reproduktionsschaltung ist auf einer Stufe neben der Dekodierschaltung angeordnet.
  • 1 ist ein Blockschaltbild einer Reproduktionsschaltung eines Sprachdekoders gemäß der ersten Ausführungsform.
  • Die dargestellte Reproduktionsschaltung weist eine Spektralparameter-Berechnungsschaltung 10, eine inverse Filterschaltung 20, eine Glättungsschaltung 30 und eine Synthesefilterschaltung 40 auf. Die inverse Filterschaltung 20 dient als eine Anregungssignal-Berechnungsschaltung.
  • Die Spektralparameter-Berechnungsschaltung 10 wird mit dem Reproduktionssprachsignal d(n) versorgt und berechnet dann auf der Grundlage einer linearen Prädiktionsanalyse unter Verwendung des Reproduktionssprachsignals d(n) Spektralparameter mit einem vorbestimmten Grad αi (i = 1, ..., P: z.B. P = 10). Die inverse Filterschaltung 20 führt unter Verwendung der Spektralparameter αi eine inverse Filterung für das Reproduktionssprachsignal d(n) aus. Die inverse Filterung führt zur Erzeugung eines Anregungssignals x(n). Die Glättungsschaltung 30 empfängt die Spektralparameter αi und das von der inversen Filterschaltung 20 berechnete Anregungssignal x(n) und glättet dann zeitlich die Spektralparameter αi und/oder den Effektivwert des Anregungssignals x(n), um die Spektralparameter αi und das Anregungssignal x(n) auszugeben, wobei mindestens einer einer Glättung unterzogen wird. Die Synthesefilterschaltung 40 hat ein Synthesefilter, das mit den von der Glättungsschaltung ausgegebenen Spektralparametern αi aufgebaut ist, und synthetisiert das Anregungssignal x(n) unter Verwendung des Synthesefilters, um das Sprachsignal zu reproduzieren.
  • Im Detail arbeitet der Sprachdekoder gemäß der ersten Ausführungsform wie folgt:
    Wenn sie mit dem Reproduktionssprachsignal d(n) versorgt wird, berechnet die Spektralparameter-Berechnungsschaltung 10 auf der Grundlage einer linearen Prädiktionsanalyse unter Verwendung des Reproduktionssprachsignals d(n) Spektralparameter αi mit einem vorbestimmten Grad. Für die Berechnung der Spektralparameter in der Spektralparameter-Berechnungsschaltung 10 kann die wohlbekannte LPC- (Linear Predictive Coding = lineare prädiktive Kodierung) Analyse, die Burg-Analyse und so weiter angewendet werden. In dieser Ausführungsform wird die Burg-Analyse angewendet. Für die Einzelheiten der Burg-Analyse wird auf die Beschreibung in "Signal Analysis and System Identification", Nakamizo (1998 veröffentlicht, Corona), Seite 82 – 87 (auf das hier im weiteren als Dokument 4 Bezug genommen wird) referenziert.
  • Die von der Spektralparameter-Berechnungsschaltung 10 berechneten Spektralparameter αi werden sowohl in die inverse Filterschaltung 20 als auch die Glättungsschaltung 30 geliefert.
  • In der inversen Filterschaltung 20 wird die inverse Filterung für das Reproduktionssprachsignal d(n) mit den von der Spektralparameter-Berechnungsschaltung 10 berechneten Spektralparametern αi gemäß der folgenden Gleichung (1) ausgeführt, so daß das Anregungssignal x(n) berechnet wird.
  • Figure 00100001
  • In der Glättungsschaltung 30 werden die Spektralparameter αi und/oder der Effektivwert des Anregungssignals x(n) zeitlich geglättet und dann werden beide an die Synthesefilterschaltung 40 ausgegeben.
  • Das Glätten des Effektivwerts (RMS) des Anregungssignals x(n) wird gemäß der folgenden Gleichung (2) ausgeführt. RMS(m) = λRMS(m – 1) – (1 – λ)RMS(m) (2)
  • Andererseits wird das Glätten der Spektralparameter αi gemäß der folgenden Gleichung (3) ausgeführt. LSP i(m) = λLSP i(m – 1) – (1 – λ)LSPi(m) (3)
  • In der vorliegenden Erfindung werden die Spektralparameter αi auf dem linearen spektralen Paar (LSP) geglättet und dann der inversen Umwandlung unterzogen, so daß sie die geglätteten Spektralparameter αi' sind. Für die Umwandlung und die inverse Umwandlung zwischen den Spektralparametern αi und den LSP-Parametern kann auf "Speech Data Compression by Linear Spectral Pair (LSP) Speech Analysis-Synthesis Technique", Sugamura et al. (Journal of the Electronic Communications Society of Japan, J64-A, S. 599 – 606, 1981, auf das hier im weiteren als Dokument 5 Bezug genommen wird) referenziert werden.
  • Dann wird in der Synthesefilterschaltung 40 ein Synthesefilter mit den von der Glättungsschaltung 30 ausgegebenen Spektralparametern αi aufgebaut, und das Anregungssignal x(n) wird unter Verwendung des Synthesefilters synthetisiert, so daß das Sprachsignal reproduziert wird.
  • 2 ist ein Blockschaltbild einer Reproduktionsschaltung eines Sprachdekoders gemäß der zweiten Ausführungsform der vorliegenden Erfindung.
  • Wie aus 1 und 2 ersichtlich, ist die zweite Ausführungsform eine Modifikation der ersten Ausführungsform, und beide sind, abgesehen von einer Modusbeurteilungsschaltung 30, ähnlich zueinander. Daher sind die gemeinsamen numerischen Bezüge auf die Bestandteile in dem Sprachdekoder der in 2 gezeigten zweiten Ausführungsform und die Bestandteile in dem Sprachdekoder 10 der in 1 gezeigten ersten Ausführungsform in dem Fall, in dem die jeweiligen Bestandteile in den Sprachdekodern auf ähnliche Weise funktionieren, gleich bezeichnet. Die inverse Filterschaltung 20, die Glättungsschaltung 30 und das Synthesefilter 40, die in 2 dargestellt sind, werden in dem von der Modusbeurteilungsschaltung 50 beurteilten Modus gesteuert und sind im Punkt der Steuerung anders als die der ersten Ausführungsform.
  • Wenn sie das Reproduktionssprachsignal d(n) empfängt, extrahiert die Modusbeurteilungsschaltung 50 gemäß der folgenden Gleichung (4) Merkmalgrößen aus dem Reproduktionssprachsignal d(n).
  • Figure 00120001
  • Dann vergleicht die Modusbeurteilungsschaltung 50 die extrahierten Merkmalgrößen mit vorbestimmten Schwellwerten, um dadurch einen Modus des Reproduktionssprachsignals d(n) zu beurteilen.
  • Die Beurteilung der Modusbeurteilungsschaltung 50, nämlich der beurteilte Modus, wird an die inverse Filterschaltung 20, die Glättungsschaltung 30 und das Synthesefilter 40 geliefert. In dieser Ausführungsform arbeiten die inverse Filterschaltung 20, die Glättungsschaltung 30 und die Synthesefilterschaltung 40 nur in dem Fall, in dem eine vorbestimmte Bedingung erfüllt ist. Wenn die vorbestimmte Bedingung erfüllt ist, funktionieren die inverse Filterschaltung 20, die Glättungsschaltung 30 und das Synthesefilter 40 auf die gleiche Weise wie in der ersten Ausführungsform. Wenn nicht, arbeiten die inverse Filterschaltung 20, die Glättungsschaltung 30 und das Synthesefilter 40 nicht, so daß das Reproduktionssprachsignal als das Sprachsignal ausgegeben wird.
  • In dieser Ausführungsform ist die vorbestimmte Bedingung, daß der beurteilte Modus des Reproduktionssprachsignals d(n) mit einem vorbestimmten Modus übereinstimmt. Der vorbestimmte Modus ist zum Beispiel „Stille" oder „Ton ohne Sprache". Wenn der beurteilte Modus des Reproduktionssprachsignals d(n) nicht mit einem vorbestimmten Modus übereinstimmt, funktionieren die inverse Filterschaltung 20, die Glättungsschaltung 30 und die Synthesefilterschaltung 40 in dieser Ausführungsform nicht.
  • 3 ist ein Blockschaltbild einer Reproduktionsschaltung eines Sprachdekoders gemäß der dritten Ausführungsform.
  • Wie aus 1 und 3 offensichtlich ist, ist die zweite Ausführungsform eine Modifikation der ersten Ausführungsform. Die Reproduktionsschaltung der vorliegenden Ausführungsform weist neben der Spektralparameter-Berechnungsschaltung 10, der inversen Filterschaltung 20, der Glättungsschaltung 30 und der Synthesefilterschaltung 40 eine Grundfrequenz-Prädiktionsschaltung 60 und eine Verstärkungsberechnungsschaltung 70 auf.
  • In dieser Ausführungsform arbeiten die Spektralparameter-Berechnungsschaltung 10 und die inverse Filterschaltung 20 auf die gleiche Weise wie in der ersten Ausführungsform.
  • Die Grundfrequenz-Prädiktionsschaltung 60 berechnet entweder aus dem Reproduktionssprachsignal d(n) oder dem Anregungssignal x(n) eine Grundfrequenzperiode T. Dann führt die Grundfrequenz-Prädiktionsschaltung 60 unter Verwendung der Grundfrequenzperiode T eine Grundfrequenz-Prädiktion aus, um dadurch ein Grundfrequenz-Prädiktionssignal p(n) zu erzeugen, und berechnet durch Subtrahieren des Grundfrequenz-Prädiktionssignals p(n) von dem Anregungssignal x(n) ein Restsignal e(n). Die Verstärkungsberechnungsschaltung 70 berechnet eine Verstärkung des Gundfrequenz-Prädiktionssignals p(n) und/oder des Restsignals e(n), die beide von der Grundfrequenz-Prädiktionsschaltung ausgegeben werden. Die Verstärkungsberechnungsschaltung 70 liefert die berechnete Verstärkung, das Grundfrequenz-Prädiktionssignal p(n) und das Restsignal e(n) an die Glättungsschaltung 30.
  • Die Glättungsschaltung 30 empfängt die Spektralparameter αi, die Verstärkung, das Grundfrequenz-Prädiktionssignal p(n) und das Restsignal e(n) und glättet die Spektralparameter αi und/oder die Verstärkung zeitlich. Die Glättungsschaltung 30 liefert die Spektralparameter αi, die Verstärkung, das Grundfrequenz-Prädiktionssignal p(n) und das Restsignal e(n) an die Synthesefilterschaltung 40, wobei die Spektralparameter αi und/oder die Verstärkung einer Glättung unterzogen werden.
  • Das Synthesefilter 40 hat ein mit den von der Glättungsschaltung ausgegebenen Spektralparametern αi aufgebautes Synthesefilter und erzeugt auf der Grundlage der Verstärkung, des Grundfrequenz-Prädiktionssignals p(n) und des Restsignals e(n) ein anderes Anregungssignal neu als ein geeignetes Anregungssignal. Das geeignete Anregungssignal wird unter Verwendung des Synthesefilters synthetisiert und wird als das Sprachsignal reproduziert.
  • Während die Erfindung in Verbindung mit den derzeit bekannten bevorzugten Ausführungsformen im Detail beschrieben wurde, sollte ohne weiteres verstanden werden, daß die Erfindung nicht auf derartige offenbarte Ausführungsformen beschränkt ist. Vielmehr kann die Erfindung verändert werden, so daß sie jede Anzahl von Variationen, Veränderungen, Substitutionen oder äquivalente Anordnungen einschließt, die vordem nicht beschrieben wurden, die aber dem Schutzbereich der Erfindung entsprechen. Entsprechend wird die Erfindung als durch die vorhergehende Beschreibung nicht eingeschränkt gesehen, sondern ist nur durch den Schutzbereich der beigefügten Ansprüche beschränkt.

Claims (14)

  1. Sprachdekoder zum Dekodieren eines kodierten Sprachsignals in ein Reproduktionssprachsignal und zum Reproduzieren eines Sprachsignals unter Verwendung des Reproduktionssprachsignals, der aufweist: eine Spektralparameter-Berechnungsschaltung (10), die auf das Reproduktionssprachsignal anspricht, um auf der Grundlage des Reproduktionssprachsignals Spektralparameter zu berechnen; eine Anregungssignal-Berechnungsschaltung (20), um auf der Grundlage des Reproduktionssprachsignals und der von der Spektralparameter-Berechnungsschaltung (10) berechneten Spektralparameter ein Anregungssignal zu berechnen und einen Anregungssignalpegel zu erhalten; eine Glättungsschaltung (30), die auf die Spektralparameter und das Anregungssignal anspricht, um die Spektralparameter und/oder den Anregungssignalpegel zeitlich zu glätten, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer einer Glättung unterzogen wird; und eine Synthesefilterschaltung (40) mit einem Synthesefilter, das mit den von der Glättungsschaltung ausgegebenen Spektralparametern aufgebaut ist, um das Anregungssignal unter Verwendung des Synthesefilters zu synthetisieren, um das Sprachsignal zu reproduzieren; wobei die Anregungssignal-Berechnungsschaltung, die Glättungsschaltung und die Synthesefilterschaltung nur entsprechend vorbestimmten Bedingungen arbeiten.
  2. Sprachdekoder nach Anspruch 1, wobei die Anregungssignal-Berechnungsschaltung unter Verwendung der Spektralparameter eine inverse Filterung für das Reproduktionssprachsignal ausführt, um das Anregungssignal zu berechnen.
  3. Sprachdekoder nach Anspruch 1, der ferner eine Modusbeurteilungsschaltung zur Beurteilung eines Reproduktionssprachsignalmodus aufweist, indem Merkmalgrößen aus dem Reproduktionssprachsignal extrahiert werden, wobei die vorbestimmten Bedingungen eine Modusbedingung aufweisen, daß der Reproduktionssprachsignalmodus von der Modusbeurteilungsschaltung als ein vorbestimmter Modus beurteilt wird, so daß die Glättungsschaltung und die Synthesefilterschaltung nur in dem Fall arbeiten, in dem die Modusbedingung erfüllt ist.
  4. Sprachdekoder nach Anspruch 3, wobei der vorbestimmte Modus Stille ist.
  5. Sprachdekoder nach Anspruch 3, wobei der vorbestimmte Modus „Ton ohne Sprache" ist.
  6. Sprachdekoder zum Dekodieren eines kodierten Sprachsignals in ein Reproduktionssprachsignal und zum Reproduzieren eines Sprachsignals unter Verwendung des Reproduktionssprachsignals, der aufweist: eine Spektralparameter-Berechnungsschaltung (10), die auf das Reproduktionssprachsignal anspricht, um auf der Grundlage des Reproduktionssprachsignals Spektralparameter zu berechnen; eine Anregungssignal-Berechnungsschaltung (20), um auf der Grundlage des Reproduktionssprachsignals und der von der Spektralparameter-Berechnungsschaltung berechneten Spektralparameter ein Anregungssignal zu berechnen und einen Anregungssignalpegel zu erhalten; eine Grundfrequenz-Prädiktionsschaltung (60), die entweder aus dem Reproduktionssprachsignal oder dem Anregungssignal eine Grundfrequenzperiode berechnet, unter Verwendung der Grundfrequenzperiode eine Grundfrequenz-Prädiktion ausführt, um ein Grundfrequenz-Prädiktionssignal zu erzeugen, und durch Subtrahieren des Grundfrequenz-Prädik tionssignals von dem Anregungssignal ein Restsignal berechnet; eine Verstärkungsberechnungsschaltung (70) zum Berechnen einer Verstärkung des Grundfrequenz-Prädiktionssignals und/oder des Restsignals, die beide von der Grundfrequenz-Prädiktionsschaltung ausgegeben werden; eine Glättungsschaltung (30), die auf die Spektralparameter und die Verstärkung anspricht um die Spektralparameter und/oder die Verstärkung zeitlich zu glätten, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer einer Glättung unterzogen wird; und eine Synthesefilterschaltung (40) mit einem Synthesefilter, das mit den von der Glättungsschaltung ausgegebenen Spektralparametern aufgebaut ist, um ein Anregungssignal auf der Grundlage der Verstärkung, des Grundfrequenz-Prädiktionssignals und des Restsignals als ein geeignetes Anregungssignal neu zu erzeugen, um dadurch unter Verwendung des Synthesefilters das geeignete Anregungssignal zu synthetisieren, um das Sprachsignal zu reproduzieren.
  7. Sprachdekoder nach Anspruch 6, wobei die Anregungssignal-Berechnungsschaltung unter Verwendung der Spektralparameter eine inverse Filterung für das Reproduktionssprachsignal ausführt, um das Anregungssignal zu berechnen.
  8. Verfahren zum Reproduzieren eines Sprachsignals, das aufweist: einen ersten Schritt zum Dekodieren eines kodierten Sprachsignals, das von einem Sprachkodierer ausgegeben wird, um ein Reproduktionssprachsignal zu erzeugen; einen zweiten Schritt zum Berechnen von Spektralparametern auf der Grundlage des Reproduktionssprachsignals; einen dritten Schritt zum Berechnen eines Anregungssignals und zum Erzielen eines Anregungssignalpegels auf der Grundlage des Reproduktionssprachsignals und der Spektralparameter; einen vierten Schritt zum zeitlichen Glätten der Spektralparameter und/oder des Anregungssignalpegels, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer dem Glätten unterzogen wird; und einen fünften Schritt zum Synthetisieren des Anregungssignals unter Verwendung des mit den von dem Glättungsschritt ausgegebenen Spektralparametern aufgebauten Synthesefilters, um das Sprachsignal zu reproduzieren; wobei der zweite bis fünfte Schritt nur in einem Fall ausgeführt wird, in dem vorbestimmte Bedingungen erfüllt sind, während im anderen Fall, in dem vorbestimmte Bedingungen nicht erfüllt sind, das Reproduktionssprachsignal als das Sprachsignal gehandhabt wird.
  9. Reproduktionsverfahren nach Anspruch 8, wobei der dritte Schritt so ausgeführt wird, daß das Reproduktionssprachsignal unter Verwendung der Spektralparameter einer inversen Filterung unterzogen wird, um dadurch das Anregungssignal zu berechnen.
  10. Reproduktionsverfahren nach Anspruch 8, das ferner einen sechsten Schritt zum Beurteilen eines Modus des Reproduktionssprachsignals aufweist, indem Merkmalgrößen aus dem Reproduktionssprachsignal extrahiert werden, wobei die vorbestimmten Bedingungen eine Modusbedingung aufweisen, daß der Modus des Reproduktionssprachsignals als ein vorbestimmter Modus beurteilt wird.
  11. Reproduktionsverfahren nach Anspruch 10, wobei der vorbestimmte Modus Stille ist.
  12. Reproduktionsverfahren nach Anspruch 10, wobei der vorbestimmte Modus „Ton ohne Sprache" ist.
  13. Verfahren zum Reproduzieren eines Sprachsignals, das aufweist: einen ersten Schritt zum Dekodieren eines kodierten Sprachsignals, das von einem Sprachkodierer ausgegeben wird, um ein Reproduktionssprachsignal zu erzeugen; einen zweiten Schritt zum Berechnen von Spektralparametern auf der Grundlage des Reproduktionssprachsignals; einen dritten Schritt zum Berechnen eines Anregungssignals und zum Erzielen eines Anregungssignalpegels auf der Grundlage des Reproduktionssprachsignals und der Spektralparameter; einen vierten Schritt zum Berechnen einer Grundfrequenzperiode aus dem Reproduktionssprachsignal oder dem Anregungssignal, zum Ausführen einer Grundfrequenz-Prädiktion unter Verwendung der Grundfrequenzperiode, um ein Grundfrequenz-Prädiktionssignal zu erzeugen, und zum Subtrahieren des Grundfrequenz-Prädiktionssignals von dem Anregungssignal, um ein Restsignal zu berechnen; einen fünften Schritt zum Berechnen einer Verstärkung des Grundfrequenz-Prädiktionssignals und/oder des Restsignals; einen sechsten Schritt zum zeitlichen Glätten der Spektralparameter und/oder der Verstärkung, um die Spektralparameter und das Anregungssignal auszugeben, wobei mindestens einer dem Glätten unterzogen wird; und einen siebten Schritt zum Neuerzeugen eines Anregungssignals als ein geeignetes Anregungssignal auf der Grundlage der Verstärkung, des Grundfrequenz-Prädiktionssignals und des Restsignals und dann Synthetisieren des geeigneten Anregungssignals unter Verwendung des mit den von dem Glättungsschritt ausgegebenen Spektralparametern aufgebauten Synthesefilters, so daß das Sprachsignal reproduziert wird.
  14. Reproduktionsverfahren nach Anspruch 13, wobei der dritte Schritt so ausgeführt wird, daß das Reproduktionssprachsignal unter Verwendung der Spektralparameter einer inversen Filterung unterzogen wird, um dadurch das Anregungssignal zu berechnen.
DE60109111T 2000-11-06 2001-11-06 Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen Expired - Lifetime DE60109111T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000337805 2000-11-06
JP2000337805A JP3558031B2 (ja) 2000-11-06 2000-11-06 音声復号化装置

Publications (2)

Publication Number Publication Date
DE60109111D1 DE60109111D1 (de) 2005-04-07
DE60109111T2 true DE60109111T2 (de) 2006-04-13

Family

ID=18813128

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60109111T Expired - Lifetime DE60109111T2 (de) 2000-11-06 2001-11-06 Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen

Country Status (5)

Country Link
US (1) US7024354B2 (de)
EP (1) EP1204092B1 (de)
JP (1) JP3558031B2 (de)
CN (1) CN1145144C (de)
DE (1) DE60109111T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7778826B2 (en) * 2005-01-13 2010-08-17 Intel Corporation Beamforming codebook generation system and associated methods
MX2007012187A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
TWI324336B (en) 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
US8457953B2 (en) 2007-03-05 2013-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for smoothing of stationary background noise
CN101266798B (zh) * 2007-03-12 2011-06-15 华为技术有限公司 一种在语音解码器中进行增益平滑的方法及装置
US7822833B2 (en) * 2008-04-30 2010-10-26 Honeywell International Inc. System for creating and validating configurations of offline field devices in a process control system
US8108200B2 (en) * 2008-05-20 2012-01-31 Honeywell International Inc. System and method for accessing and configuring field devices in a process control system using distributed control components
US8731895B2 (en) * 2008-05-20 2014-05-20 Honeywell International Inc. System and method for accessing and configuring field devices in a process control system
US7983892B2 (en) * 2008-05-20 2011-07-19 Honeywell International Inc. System and method for accessing and presenting health information for field devices in a process control system
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
US11714394B2 (en) * 2018-09-28 2023-08-01 Fisher-Rosemount Systems, Inc Bulk commissioning of field devices within a process plant

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01267700A (ja) 1988-04-20 1989-10-25 Nec Corp 音声処理装置
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JP2806308B2 (ja) * 1995-06-30 1998-09-30 日本電気株式会社 音声復号化装置
JPH0954600A (ja) 1995-08-14 1997-02-25 Toshiba Corp 音声符号化通信装置
JPH09244695A (ja) 1996-03-04 1997-09-19 Kobe Steel Ltd 音声符号化装置及び復号化装置
GB2312360B (en) 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
JP3270922B2 (ja) 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
JPH10171497A (ja) 1996-12-12 1998-06-26 Oki Electric Ind Co Ltd 背景雑音除去装置
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
EP1041539A4 (de) * 1997-12-08 2001-09-19 Mitsubishi Electric Corp Geräuschsignalverarbeitungsverfahren und geräuschsignalverarbeitungsvorrichtung
JPH11175083A (ja) 1997-12-16 1999-07-02 Mitsubishi Electric Corp 雑音らしさ算出方法および雑音らしさ算出装置
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6556966B1 (en) * 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
JP4295372B2 (ja) 1998-09-11 2009-07-15 パナソニック株式会社 音声符号化装置
JP3490324B2 (ja) 1999-02-15 2004-01-26 日本電信電話株式会社 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP3478209B2 (ja) * 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体

Also Published As

Publication number Publication date
US7024354B2 (en) 2006-04-04
CN1352451A (zh) 2002-06-05
US20020087308A1 (en) 2002-07-04
CN1145144C (zh) 2004-04-07
JP2002140099A (ja) 2002-05-17
JP3558031B2 (ja) 2004-08-25
DE60109111D1 (de) 2005-04-07
EP1204092A2 (de) 2002-05-08
EP1204092B1 (de) 2005-03-02
EP1204092A3 (de) 2003-11-19

Similar Documents

Publication Publication Date Title
DE602004007786T2 (de) Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
DE69926821T2 (de) Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE69837822T2 (de) Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE69816810T2 (de) Systeme und verfahren zur audio-kodierung
DE60225381T2 (de) Verfahren zur Kodierung von Sprach- und Musiksignalen
DE60011051T2 (de) Celp-transkodierung
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen
DE69910058T2 (de) Verbesserung der periodizität eines breitbandsignals
DE69628103T2 (de) Verfahren und Filter zur Hervorbebung von Formanten
DE69535723T2 (de) Verfahren und vorrichtung zur sprachkodierung mit reduzierter, variabler bitrate
DE60124274T2 (de) Codebuchstruktur und suchverfahren für die sprachkodierung
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE60012760T2 (de) Multimodaler sprachkodierer
DE60308567T2 (de) Dekodierungsgerät, Kodierungsgerät, Dekodierungsverfahren und Kodierungsverfahren
DE602004006211T2 (de) Verfahren zur Maskierung von Paketverlusten und/oder Rahmenausfall in einem Kommunikationssystem
DE60133757T2 (de) Verfahren und vorrichtung zur kodierung von stimmloser sprache
DE69832195T2 (de) Verfahren zur Grundfrequenzbestimmung unter Verwendung von Warnehmungsbasierter Analyse durch Synthese
EP1825461A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE60109111T2 (de) Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen
DE602005003358T2 (de) Audiokodierung
DE60309651T2 (de) Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens

Legal Events

Date Code Title Description
8364 No opposition during term of opposition