DE69821895T2 - Verfahren zur Sprachkodierung und -dekodierung - Google Patents

Verfahren zur Sprachkodierung und -dekodierung Download PDF

Info

Publication number
DE69821895T2
DE69821895T2 DE69821895T DE69821895T DE69821895T2 DE 69821895 T2 DE69821895 T2 DE 69821895T2 DE 69821895 T DE69821895 T DE 69821895T DE 69821895 T DE69821895 T DE 69821895T DE 69821895 T2 DE69821895 T2 DE 69821895T2
Authority
DE
Germany
Prior art keywords
lsf
parameters
lsf parameters
speech
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69821895T
Other languages
English (en)
Other versions
DE69821895D1 (de
Inventor
Kimio Minato-ku Miseki
Katsumi Minato-ku Tsuchiya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of DE69821895D1 publication Critical patent/DE69821895D1/de
Application granted granted Critical
Publication of DE69821895T2 publication Critical patent/DE69821895T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Description

  • Die vorliegende Erfindung bezieht sich auf ein effizientes Codierung/Decodierungssystem für Sprachsignale und genauer auf ein Verfahren zur Codierung/Decodierung von LSF-(Linienspektralfrequenz)Parametern, die eine Art von Sprachparameter sind und die spektrale Hülleninformation eines Eingangssprachsignals repräsentieren.
  • Die spektrale Hülle eines Eingangssprachsignals kann durch LPC-(lineare predictive coding – Stimmenkompressionstechnik) Koeffizienten repräsentiert werden, die durch das Durchführen einer LPC-Analyse des Eingangssprachsignals unter Verwendung der Autokorrelationskoeffizienten erlangt werden, die wiederum vom Eingangsprachsignal erworben werden. Für die Sprachkodierung werden die LPC-Koeffizienten in Linienspektralfrequenz (LSF) Parameter F(k) (k = 1, 2, ..., N) transformieret, die informationsäquivalent zu den LPC-Koeffizienten sind. Die Eingangssprachsignale sind Einsen auf der Frequenzachse. Wenn das Eingangssprachsignal z. B. mit 8 kHz abgetastet wird, sind die F(k) bekannt dafür, Werte im Bereich von 0 bis 4,000 Hz anzunehmen.
  • In einem herkömmlichen LSF-Encoder wird der Code der LSF-Parameter aus einem LSF-Parametercodebuch ausgewählt, so dass der Fehler minimiert wird, wogegen die LSF-Parameter F(k) durch Unterwerfung einer Autokorrelationsberechnung für das Eingangssprachsignal erlangt werden und die LSF-Berechnung als Zielsetzung verwendet wird und das gewichtete quadratische Fehlerabweichungskriterium als ein Indikator benutzt wird. Die Gewichtungen, die in der Gewichtungsberechnungssektion berechnet und im gewichteten Vektorquantisierer verwendet werden, werden für LSF-Parameter, deren Zwischendistanz auf der Frequenzachse klein ist, hoch gesetzt und niedrig, für LSF-Parameter mit großer Zwischendistanz. Dies ist beabsichtigt um Bedeutung auf die Frequenzen in der Nachbarschaft des Gipfels der spektralen Hülle zu legen. Der gewichtete Vektorquantisierer erzeugt quantisierte LSF-Parameter und entsprechende Codes.
  • Die codierten LSF-Parameter werden in LPC-Koeffizienten zurück transformiert, dabei codierte LPC-Koeffizienten erzeugend. Die codierten LPC-Koeffizienten werden als Parameter eines Synthesefilters verwendet, um die spektralen Hülleneigenschaften der Eingangssprache zu repräsentieren.
  • Wie man aus dem Vorhergehenden erkennen kann, wird in der herkömmlichen Technik die Wahrnehmungssensitivität in Bezug auf die verschiedenen Wahrnehmungsfrequenzen nicht im Codieren der LSF-Parameter reflektiert. Daher wird Verzerrung, es sei denn die Codierungsverzerrung der LSF-Paramerter wird auf ein genügend kleines Niveau reduziert, leicht bei Frequenzen wahrgenommen, die wahrnehmungssensitiv sind, was eine Verminderung der Sprachqualität nach sich zieht. Aus diesem Grund hat die herkömmliche Technik ein Problem, sodass die Codierungsbitrate der LSF-Parameter nicht sehr reduziert werden kann.
  • Eine andere herkömmliche Technik, ein Versuch die Wahrnehmungseigenschaften des menschlichen Ohres, das für niedrige Frequenzen sensitiv ist und für hohe Frequenzen relativ unsensitiv, zu reflektieren, d. h. die unterschiedlichen Wahrnehmungssensitivitäten relativ zu verschiedenen Wahrnehmungsfrequenzen im Codieren der LSF-Parameter wird in "The MEL LSF VECTOR QUANTIZATION SPEECH CODING METOD – Das MEL LSF Vektorquantisierungs-Sprachcodierungsverfahren" von SEKI et al beschrieben, TECHNICAL REPORT OF IEICE, SP 86-14, June, 1986 (Literatur 1). In dieser Literatur wird ein Vorschlag für ein Verfahren gemacht, das die LSF-Parameter (hier synonym für LSF-Parameter) unter Verwendung der Mel-Messung oder der Log-Messung quantisiert, von denen jede eine Art nicht linearer Frequenzmessung ist.
  • Ein weiteres Beispiel eines bekannten Sprachencoder, der psychoakustische Effekte reflektiert, wird ihn EP-A-0658876 veröffentlicht.
  • Jedoch werden die LSF-Parameter in der in Literatur 1 vorgeschlagenen Transformation in Log-Messung direkt in die Form log10 (F(k)) transformiert. Die momentanen Erfinder machten einen Versuch, die zehnter Ordnung LSF-Parameter, erhalten aus einem Sprachsignal, das mit 8 kHz abgetastet wurde, mit einer Anzahl von Bits in der Größenordnung von 20 Bits, zu codieren. Als Ergebnis wurde klar, dass die Verzerrung der LSF-Parameter im unteren Frequenzbereich nicht nennenswert ist, die Verzerrung der LSF-Parameter im Hochfrequenzbereich jedoch wegen der Quantisierung leicht empfunden wird und die Sprachqualität total mindert. Deshalb ist es schwer, bei reiner logarithmischen Transformation der LSF-Paramer, die Bitrate der LSF-Parameter zu reduzieren.
  • Wie oben beschrieben hat das herkömmliche LSF-Parametercodierungsverfahren Probleme darin, dass die Verzerrung, es sei denn die Codierungsverzerrung der LSF-Paramer wird auf ein entsprechend niedriges Niveau reduziert, leicht bei Frequenzen empfunden wird, die empfindungssensitiv sind, und dass die Codierungsbitrate dieser Parameter nicht sehr reduziert werden kann.
  • Es ist eine Aufgabe der vorliegenden Erfindung, wie in den anhängenden Ansprüchen beansprucht, ein Verfahren zur Sprachcodierung/decodierung bereitzustellen, das erlaubt, dass die Codierungsverzerrung nur schwer wahrnehmbar wird, sogar dann, wenn die Codierungsbitrate der LSF-Parameter bis zu einem bestimmten Grad reduziert ist.
  • Gemäß der vorliegenden Erfindung werden in einem Sprachcodierungsverfahren, das einen Prozess der Codierung von Sprachparametern enthält, die die spektrale Hülle eines Eingangssprachsignals unter Verwendung von LSF-Parametern repräsentieren, Autokorrelationskoeffizienten zunächst von dem Eingangssprachsignal erworben.
  • Danach wird eine Anzahl N von ersten LSF-Paramestern F(k) (k = 1. 2, ..., N) auf der Basis der Autokorrelationskoeffizienten erzielt.
  • Danach werden die LSF-Parameter einer Transformation unterzogen, die definiert ist durch
    f(k) = logC (1 + A × F(k)) (A, C = positiv konstant), wobei zweite LSF-Paramer f(k) erzielt werden.
  • Diese Transformation ist eine logarithmische Transformation mit Verschiebung. Um sie von einer reinen logarithmischen Transformation in herkömmlichen Techniken zu unterscheiden, wird sie hier als modifizierte logarithmische Transformation zitiert. In diesem Fall folgt daraus, dass die zweiten LSF-Parameter f(k), LSF-Parameter in der modifizierten logarithmischen Skala sind. Diese LSF-Parameter werden als modifizierte logarithmische LSF-Parameter zitiert. Die modifizierte logarithmische Transformation kann unter Verwendung einer Tabelle implementiert werden, die die modifizierte logarithmische Transformation simuliert.
  • Als nächstes werden die zweiten LSF-Parameter quantisiert, um dritte quantisierte LSF-Paramer fq(k) und erste Codes zu erhalten, die die dritten LSF-Parameter repräsentieren. Die zweiten LSF-Parameter werden auf der modifizierten logarithmischen Transformationsdomäne quantisiert. Die ersten Codes entsprechen den codierten Versionen der Sprachparameter, die die spektrale Hülle des Eingangssprachsignals repräsentieren.
  • Zuletzt werden die dritten LSF-Paramer einer umgekehrten Transformation unterzogen, die definiert ist durch Fg(k) = (Cfq(k) – 1)/A,dabei quantisierte vierte LSF-Parameter Fq(k) erzielend.
  • Bei der tatsächlichen Verwendung des vorher genannten Verfahrens der Codierung von Sprachparametern zur Sprachcodierung, wird Anregungssignalinformation, wie die Abstandsperiodeninformation, Störinformation und Verstärkungsinformation aus dem Eingangssprachsignal und den vierten LSF-Parametern erzielt. Zweite Codes, die die Anregungssignalinformation repräsentieren werden erzeugt und dann mit den ersten Codes zur Übertragung zur Decoderseite kombiniert.
  • In einem Sprachdecodierungsverfahren der vorliegenden Erfindung werden die Sprachparameter in den ersten Codes, um die Sprachparameter aus den ersten Codes, übertragen von der Encoderseite, zu decodieren, zunächst quantisiert um die dritten LSF-Paramer fq(k) zu decodieren.
  • Anschließend werden die so decodierten dritten LSF-Parameter einer umgekehrten Transformation unterzogen, die definiert ist durch Fq(k) = (Cfq(k) – 1)/A mit k = 1, w, ..., Ndabei die vierten LSF-Parameter Fq(k) erzielend.
  • Bei der tatsächlichen Verwendung des vorher genannten Verfahrens der Decodierung von Sprachparametern zur Decodierung codierter Sprache, wird die Anregungssignalinformation aus den zweiten Codes decodiert. Die decodierte Anregungssignalinformation und die in der obigen Weise erhaltenen LSF-Parameter werden dann dazu verwendet ein Ausgangssprachsignal zu reproduzieren.
  • Das Verfahren zur Sprachcodierung/decodierung der vorliegenden Erfindung schließt die Wahrnehmungseigenschaft des menschlichen Ohres mit ein, die für niedrige Frequenzen sensitiv ist, jedoch für hohe Frequenzen relativ unsensitiv. Sprache kann genau durch die Verwendung der Frequenzachse mit einer modifizierten logarithmischen Skala (die Frequenzauflösung ist im Niedrigfrequenzbereich hoch, jedoch niedrig im Hochfrequenzbereich) repräsentiert werden, die zur Wahrnehmungseigenschaft konform ist.
  • Das heißt, dass in der vorliegenden Erfindung die LSF-Parameter F(k), die Parameter auf der allgemeinen Frequenzachse sind, unter Verwendung der Konstante A und eines Verschiebungswertes 1 einer modifizierten logarithmischen Transformation unterzogen werden. Die resultierenden Parameter f(k) werden dann quantisiert, was erlaubt, dass Sprache während der Kontrolle der Rauscherzeugung in jedem Frequenzband codiert wird, um mit der Wahrnehmungseigenschaft des menschlichen Ohres konform zu sein. Es ist wünschenswert, dass die Konstante A auf den Wert festgesetzt wird, der den LSF-Parametern im Niedrigfrequenzbereich als Gewichtung gegeben wird, jedoch sollten die LSF-Parameter im Hochfrequenzbereich nicht zu leicht genommen werden. Um genau zu sein, die Konstante A wird vorzugsweise festgesetzt um im Bereich 0.5 < A < 0.96 zu liegen.
  • Gemäß dem anderen Sprachcodierungsverfahren der vorliegenden Erfindung werden Gewichtungen, die zur Quantisierung der zweiten LSF-Parameter verwendet werden, auf der Basis des Zwischenraums zwischen benachbarten zweiten LSF-Parametern erzielt (Zwischenraum auf der modifizierten logarithmischen Skalentransformationsdomäne). Die zweiten LSF-Parameter werden unter Verwendung dieser Gewichtungen auf der logarithmischen Skalentransformationsdomäne quantisiert, wobei sie die dritten LSF-Parameter und die ersten Codes erzeugen. Dies erlaubt, die LSF-Parameter in der Weise zu quantisieren, wie den Spitzenpositionen der spektralen Hülle auf der Frequenzachse, unterzogen einer modifizierten logarithmischen Transformation, Bedeutung zu widmen. Deshalb kann die Codierung der LSF-Parameter in dieser Weise implementiert werden, wie auch die subjektive Verzerrung schwieriger zu empfinden zu machen.
  • Daher kann, gemäß der vorliegenden Erfindung, ein Verfahren zur Sprachcodierung/decodierung implementiert werden, das es ermöglicht, dass die codierte Verzerrung sogar mit etwas Reduktion in der Codierungsrate der LSF-Parameter nur schwer nachempfunden wird.
  • Diese Zusammenfassung der Erfindung beschreibt nicht notwendiger Weise alle notwendigen Merkmale, so dass die Erfindung auch eine Unterkombination dieser beschriebenen Merkmale sein kann.
  • Diese Erfindung kann aus der folgenden detaillierten Beschreibung besser verstanden werden, wenn sie in Verbindung mit den beiliegenden Abbildungen benutzt wird, in denen:
  • 1 ein Blockdiagramm einer LSF-Codiereinheit in einem Sprachcodierungssystem gemäß einer ersten Ausführung der vorliegenden Erfindung ist;
  • 2 ein Blockdiagramm einer LSF-Decodiereinheit in dem Sprachcodierungssystem gemäß der ersten Ausführung der vorliegenden Erfindung ist;
  • 3 ein Flussdiagramm der LSF-Parametercodierungsprozedur in der ersten Ausführung der vorliegenden Erfindung ist;
  • 4 ein Flussdiagramm der LSF-Parametercodierungsprozedur in der ersten Ausführung ist;
  • 5 ein Blockdiagramm eines Sprachcodierungs/ decodierungssystem gemäß der ersten Ausführung der vorliegenden Erfindung ist;
  • 6 ein Blockdiagramm einer LSF-Codiereinheit in einem Sprachcodierungssystem gemäß der zweiten Ausführung der vorliegenden Erfindung ist; und
  • 7 ein Flussdiagramm der LSF-Parametercodierungsprozedur in der ersten Ausführung der vorliegenden Erfindung ist.
  • Sich jetzt auf die 1 beziehend, wird in Blockdiagrammform eine LSF-Codiereinheit gezeigt, die als eine Schlüsselkomponente des Sprachcodierungssystem gemäß der ersten Ausführung der vorliegenden Erfindung dient, und LSF-Parameter codiert, die die spektrale Hülle des Sprachsignals repräsentiert. Die Codiereinheit enthält einen Autokorrelationsabschnitt 11, einen LSF-Berechnungsabschnitt 12, einen modifizierten logarithmischen Transformationsabschnitt 13, einen Quantisierabschnitt 14 und eine modifizierte exponentielle Transformationseinheit 15.
  • Im folgenden wird jede Komponente im Detail beschrieben. Zuerst berechnet der Autokorrelationsabschnitt 11 einen Autokorrelationskoeffizienten für jeden Rahmen eines Eingangssprachsignals und liefert den resultierenden Autokorrelationskoeffizienten an den LSF-Berechnungsabschnitt 12. Der LSF-Berechnungsabschnitt berechnet LSF-Parameter F(k) (k = 1, 2, ..., N) aus dem Korrelationskoeffizienten im Einklang mit einem bekannten Verfahren (in einem Buch beschrieben, z. B., Sadaoki Furui "Digital speech processingdigitale Sprachverarbeitung-", Tokai University Press, pp. 60–64 und pp. 89–92). N ist die Reihenfolge der LSF-Parameter.
  • Der modifizierte logarithmische Transformationsabschnitt 13 transformiert die LSF-Parameter F(k) oder ihre korrespondierenden Frequenzen in LSF-Parameter f(k) auf der modifizierten logarithmischen Skala (die als modifizierte logarithmische LSF-Parameter zitiert werden) im Einklang mit dem folgenden Prozess der Transformation (zitiert als modifizierte logarithmische Transformation mit Verschiebung).
  • F(k) = log C (1 + A × F(k)) (k = 1, 2, ..., N) (1)wobei A und C jeweils positive konstant sind und C die Basis des Logarithmus ist.
  • Bei der Sprachcodierung mit niedrigen Bitraten, wenn die Abtastfrequenz 8 kHz ist, ist 10 ein typischer Wert von N. Der Wert der Konstante A, der zur Verwendung in der oben genannten modifizierten logarithmischen Transformation mit Verschiebung geeignet ist, liegt bei 0.5 < A < 0.96. Speziell, wenn der Wert von A nahe 0.96 gesetzt wird, kann die Codierung mit wenig Empfindungsverzerrung implementiert werden. Wenn A = 1 ist, ist der Prozess in der Nähe des herkömmlichen, in der Literatur 1 veröffentlichten, Verfahrens und daher ist Quantifizierungsverzerrung in dem Hochfrequenzbereich leicht als Resultat des Zufügens von übermäßiger Gewichtung zum Niedrigfrequenzbereich wahrzunehmen. Wenn A < 0.5, geht der Effekt des Zufügens von Wichtigkeit zum Niedrigfrequenzbereich beinahe verloren. In diesem Fall ist die Quantifizierungsverzerrung im Niedrigfrequenzbereich leicht wahrzunehmen.
  • Der Quantisierungsabschnitt 14 quantisiert die modifizierten logarithmischen LSF-Parameter f(k) aus dem modifizierten Transformationsabschnitt 13 und liefert quantisierte modifizierte logarithmische LSF-Parameter fq(k) und ihre Codes. Das in dem Quantsierungsabschnitt 14 verwendete Quantisierungsverfahren kann entweder eine skalare Quantisierung oder eine Vektorquantisierung sein. Zusätzlich könnte der Quantisierungsabschnitt skalare Quantisierung oder Vektorquantisierung mit Prädiktionscodierung kombinieren. Zur Berechnung der Quantisierungsverzerrung kann das herkömmlich verwendete Kriterium des mittleren quadratischen Fehlers oder der mittleren absoluten Differenz verwendet werden. Man nehme z. B. an, dass z. B. ein modifizierter logarithmischer LSF-Parameter in M Bits durch eine N dimensionale Vektorquantisierung quantisiert wird. Dann kann die Verzerrung unter Verwendung der mittleren quadratischen Fehlerverzerrung wie folgt definiert werden:
    Figure 00100001
    (i = 0, 1, ..., 2M – 1) wobei i M-Bit Codes sind, Quantisierungskandidaten für modifizierte logarithmische LSF-Parameter f(k) repräsentierend, und fq(k)(i) repräsentative Vektoren repräsentieren, die in einem Codebuch für jeden LSF-Parameter f(k) gespeichert sind. Die Codes i werden nach einem Code durchsucht, der einen repräsentativen Vektor repräsentiert, für den die Verzerrung ein Minimum ist und dieser Code wird als der Code I für einen LSF-Parameter f(k) ausgegeben. Der repräsentative Vektor, der dem Code I entspricht, wird von dem Quantisierungsabschnitt 14 als der quantisierte modifizierte logarithmische LSF-Parameter fq(k) ausgegeben.
  • Der modifizierte exponentielle Transformationsabschnitt 15 führt auf den quantisierten modifizierten logarithmischen LSF-Parametern fq(k) eine Transformation durch, die umgekehrt zu der Transformation im modifizierten logarithmischen Transformationsabschnitt 13 ist, dabei die quantisierten modifizierten logarithmischen LSF-Parameter fq(k) in LSF-Parameter F(k) auf der allgemeinen Skala transformierend. Im Falle der in Gleichung (1) definierten modifizierten logarithmischen Transformation ist es notwendig eine umgekehrte Transformation durchzuführen, die definiert ist durch Fq(k) = (Cfq(k) – 1)/A (k = 1, 2, ..., N) (3)
  • Es ist hier von Bedeutung die umgekehrte Transformation durchzuführen, so dass die skalierten Parameter zu den ursprünglichen zurückgespeichert werden. Es ist daher für die vorliegende Erfindung irrelevant wie die Transformation und die umgekehrte Transformation implementiert sind. Z. B. können die modifizierte logarithmische Transformation und die modifizierte exponentielle Transformation unter Verwendung von Tabellen implementiert werden.
  • Deshalb ist die Ausführung gekennzeichnet durch Transformation der LSF-Parameter auf der Frequenzachse in eine Frequenzskala, die enger bei der wahrnehmbaren Eigenschaft des menschlichen Ohres liegt, bei Verwendung der modifizierten logarithmischen Frequenzskala, die auf Gleichung (1) basiert, und ihrer anschließenden Quantisierung auf dieser Transformationsdomäne. Durch dieses Vorgehen wird der Grad der Degradation der LSF-Parameter im Niedrigfrequenzbereich sogar mit Schwächungen der LSF-Parameter wegen der Quantisierung sehr gering. Bei LSF-Parametern im Hochfrequenzbereich werden Codes so ausgewählt, dass die Degradation im Bereich, in dem Wahrnehmungsverzerrung schwer nachzuempfinden ist, relativ groß wird.
  • Gemäß der vorliegenden Erfindung wird subjektive Verzerrung deshalb durch die Repräsentation der spektralen Hülle der Sprache unter Verwendung quantisierter LSF-Parameter reduziert. Wenn die vorliegende Erfindung tatsächlich zur Sprachcodierung verwendet wird, kann sie Sprachqualität sogar unter derselben Codierungsbitrate verbessern.
  • 2 zeigt eine Anordnung einer LSF-Decodiereinheit, die das Schlüsselelement des Sprachdecodierungssystem der vorliegenden Ausführung ist. Die Decodiereinheit, die auf einen LSF-Parametercode reagiert, um den entsprechenden quantisierten LSF-Parameter zu erzeugen, enthält einen Entquantisierungsabschnitt 21 und einen modifizierten exponentiellen Transformationsabschnitt 22.
  • Der Entquantisierer 21 empfängt einen LSF-Parametercode von Encoderseite und gibt den entsprechenden quantisierten modifizierten logarithmischen LSF-Parameter fq(k) aus.
  • Der modifizierte exponentielle Transformationsabschnitt 22, der funktional mit dem modifizierten exponentiellen Transformationsabschnitt 15 identisch ist, transformiert den quantisierten modifizierten logarithmischen LSF-Parameter fq(k) in einen LSF-Parameter Fq(k) auf der allgemeinen Frequenzskala.
  • Als nächstes wird die Prozedur des Codierens der LSF-Parameter gemäß der vorliegenden Ausführung mit Bezug auf ein in 3 gezeigtes Flussdiagramm beschrieben.
  • Zunächst werden Autokorrelationskoeffizienten aus einem Eingangssprachsignal erzielt (Schritt S1).
  • Danach werden LSF-Parameter F(k) auf Basis der Autokorrelationskoeffizienten gebildet (Schritt S2).
  • Danach werden die LSF-Parameter F(k) in LSF-Parameter f(k) auf der modifizierten logarithmischen Skala unter der Verwendung der Gleichung (1) transformiert (Schritt S3).
  • Anschließend werden die LSF-Parameter f(k) im Schritt S4 auf der modifizierten logarithmischen Skalentransformationsdomäne quantisiert. Eine Suche durch M-Bit Codes i, Quantisierungskandidaten für die modifizierten logarithmischen LSF-Parameter repräsentierend, wird für einen Code I für einen LSF-Parameter durchgeführt, für den die Verzerrung auf der Transformationsdomäne minimiert ist. Der quantisierte LSF-Parameter fq(k) auf der quantisierten logarithmischen Skala, der diesem Code I entspricht, wird ausgegeben.
  • Als nächstes wird der quantisierte modifizierte logarithmische LSF-Parameter fq(k) einer modifizierten exponentiellen Transformation gemäß der Gleichung (3) unterzogen, die den quantisierten LSF-Parameter Fq(k) erzielt (Schritt S5).
  • Am Ende werden der LSF-Parametercode I, der im Schritt 4 gesucht wurde und der quantisierte LSF-Parameter Fq(k), der diesem Code entspricht, ausgegeben (schritt S6).
  • Die obige Abfolge des Prozesses wird in Einheiten von Rahmen des Eingangssprachsignals ausgeführt, bis im Schritt S7 entschieden wird, dass das Eingangssprachsignal aufhört (d. h. es ist kein Rahmen mehr übrig). Auf diese Weise kann spektrale Hülleninformation codiert werden.
  • Als nächstes wird die Prozedur der Decodierung der LSF-Parameter gemäß der vorliegenden Ausführung mit Bezug auf ein in 4 gezeigtes Flussdiagramm beschrieben.
  • Zuerst werden die LSF-Parameter Code I aus dem Encoder einer umgekehrten Quantisierung (Entquantisierung) unterzogen, so dass die modifizierten logarithmischen LSF-Parameter fq(k) erzeugt werden (Schritt S11). Die LSF-Parameter fq(k) werden im Einklang mit der obigen Gleichung (3) einer umgekehrten Transformation unterzogen, und die vierten LSF-Parameter, repräsentiert durch Fq(k), werden dann reproduziert (Schritt S12).
  • Als nächstes wird Bezug auf die 5 genommen, um eine Anordnung des gesamten Sprachcodierungs/decodierungssystems zu beschreiben, das ein Sprachsignal in der Form einer codierten spektralen Hülleninformation und codierten Anregungssignalinformation repräsentiert. Als ein solches System existiert ein Sprachcodierungs/decodierungsystem basierend auf CELP.
  • Die Codierungsseite wird zuerst beschrieben.
  • Ein spektraler Hülleninformationsencoder 31 analysiert ein Sprachsignal auf einer Rahmen um Rahmen Basis, um LSF-Parameter zu erhalten, und um sie zu codieren. In diesem Fall werden die LSF-Parameter, die spektrale Hülleninformation repräsentieren unter Verwendung des LSF-Parametercodierungsverfahrens der vorliegenden Erfindung codiert, wie in Verbindung mit 1 beschrieben.
  • Ein Anregungssignalencoder 32 erzielt Sprachsignalinformation einschließlich Abstandsperiodeninformation, Rauschinformation und Verstärkungsinformation verschieden von der Sprachspektralinformation mittels CELP als Beispiel.
  • Die codierten LSF-Parameter (spektrale Hülleninformation) aus dem spektralen Hülleninformationsencoder 31 und die codierte Anregungssignalinformation aus dem Anregungssignalencoder 32 werden zusammen in einem Multiplexer 3 multiplext und dann zur Decoderseite übertragen.
  • Als nächstes wird die Decodierungsseite beschrieben.
  • Ein Demultiplexer 34 demultiplext die multiplexte codierte Information aus der Codierungsseite in die codierten LSF-Parameter und die codierte Anregungsinformation. Ein spektraler Hülleninformationsdecoder 35 decodiert die codierten LSF-Parameter, um die LSF-Parameter zu reproduzieren, die der Reihenfolge nach in LPC-Koeffizienten transformiert werden. Die codierte Anregungsinformation wird in einem Anregungssignaldecoder 36 decodiert, so dass das Anregungssignal rekonstruiert wird.
  • Ein Synthesefilter 37, dessen Transfereigenschaft durch die LPC-Koeffizienten aus dem spektralen Hülleninformationsdecoder 35 festgelegt werden, empfängt als ein Eingangssignal das rekonstruierte Anregungssignal aus dem Anregungssignaldecoder 36. Im Synthesefilter wird die spektrale Hülleninformation dem Eingangsanregungssignal zugeteilt, was erlaubt, ein Rusgangssprachsignal zu rekonstruieren. En dieser Stelle ist es möglich, um subjektive Sprachqualität zu verbessern, ein solches Nachfiltern durchzuführen als ob es die Eigenschaften des Synthesefilters in seiner letzten Stufe verbessert.
  • 6 zeigt eine Anordnung eines LSF-Encoders, der eine Schlüsselkomponente eines Sprachcodierungssystems gemäß einer zweiten Ausführung der vorliegenden Erfindung ist. In dieser Abbildung werden dieselben Referenzziffern wie in 1 verwendet, um entsprechende Teile zu bezeichnen. In dieser Ausführung ist ein Gewichtungsberechnungsabschnitt 16 hinzugefügt, und der Quantisierer 14 in 1 ist durch einen gewichteten Vektorquantisierabschnitt 17 ersetzt. Die gewichtete Verzerrung kann wie folgt definiert werden:
  • Figure 00160001
  • In 6, bleiben die Prozesse in dem Autokorrelationsberechnungsabschnitt 11, dem LSF-Berechnungsabschnitt 12, dem modifizierten logarithmischen Transformationsabschnitt 13 und dem modifizierten exponentiellen Transformationsabschnitt 15 von denen in der ersten Ausführung im wesentlichen unverändert. D. h. der Autokorrelationsberechnungsabschnitt 11 berechnet Autokorrelationskoeffizienten für jeden Rahmen eines Eingangssprachsignals, und der LSF-Berechnungsabschnitt 12 berechnet LSF-Parameter F(k) (k = 1, 2, ..., N) unter Verwendung der Autokorrelationskoeffizienten. Der modifizierte logarithmische Transformationsabschnitt 13 transformiert die LSF-Parameter F(k) oder ihre entsprechenden Frequenzen in modifizierte logarithmische LSF-Parameter f(k), im Einklang mit der modifizierten logarithmischen Transformation mit Verschiebung, definiert in Gleichung (1).
  • Der Gewichtungsberechnungsabschnitt 16 berechnet Gewichtungen W(k), die in der Quantisierung der modifizierten logarithmischen LSF-Parameter f(k) in dem gewichteten Vektorquantisierabschnitt 17 verwendet werden. Die Gewichtungen W(k) hängen in der Größe von der Distanz zwischen f(k) und f(k – 1) oder f(k + 1) ab, oder den Distanzen zwischen f (k) und f(k – 1) und zwischen f (k) und f(k + 1). Je kleiner die Distanz, um so größer die Gewichtung W(k).
  • Die Festlegung der Gewichtungen W(k) auf diese Weise, erlaubt dem gewichteten Vektorquantisierabschnitt 17, die LSF-Parameter zu quantisieren, während er den LSF-Parametern eine höhere Gewichtung gibt, die näher beieinander auf der Frequenzachse unterworfen der modifizierten logarithmischen Transformation sind. D. h. die Codierung der LSF-Parameter ermöglicht, dass sie den Positionen der Spitzen der spektralen Hülle auf der Frequenzachse, unterzogen der modifizierten logarithmischen Transformation, Gewichtung gibt.
  • Als Resultat einer solchen Gewichtungsquantisierung wird die empfundene Verzerrung weiter reduziert. Der gewichtete Vektorquantisierabschnitt 17 führt unter Verwendung der Gewichtungen W(k) und der LSF-Parameter f(k) die Vektorquantisierung durch. An dieser Stelle werden von dem gewichteten Vektorquantisierabschnitt 17 ein Code für einen LSF-Parameter, der ein niedrige Verzerrung unter dem gewichteten Verzerrungskriterium ergibt und ein quantisierter modifizierter logarithmischer LSF-Parameter fq(k), der diesem Code entspricht, ausgegeben.
  • Der modifizierte exponentielle Transformationsabschnitt 15 führt auf den quantisierten modifizierten logarithmischen LSF-Parametern fq(k) eine Transformation durch, die die umgekehrte Transformation der in dem modifizierten logarithmischen Transformationsabschnitt 13 ist, um die LSF-Parameter Fq(k) auf der normalen Skala auszugeben.
  • Als nächstes wird auf ein Flussdiagramm der 7 Bezug genommen, um die Prozedur der Codierung der LSF-Parameter im Einklang mit der zweiten Ausführung zu beschreiben.
  • Der Prozess in den Schritten S31 bis S3 entspricht dem Prozess in den Schritte S1 bis S2 in 3 und daher wird seine Beschreibung weggelassen. Im Schritt 534, wird eine Gewichtung W(k) berechnet. Die resultierende Gewichtung W(k) hat einen Wert, der von der Distanz zwischen f(k) und f(k – 1) oder f(k + 1), oder den Distanzen zwischen f(k) und f(k – 1) und zwischen f(k) und f(k + 1) abhängt. Je kleiner die Distanz umso größer wird die Gewichtung.
  • Die LSF-Parameter f(k) werden unter Verwendung der berechneten Gewichtungen W(k) auf der modifizierten logarithmischen Transformationsdomäne quantisiert. Eine Suche durch M-Bit Codes i, repräsentierend Quantisierungskandidaten für die modifizierten logarithmischen LSF-Parameter wird für einen Code durchgeführt, der einen LSF-Parameter repräsentiert, für den die Verzerrung auf der Transformationsdomäne minimiert ist. Der quantisierte LSF-Parameter fq(k) auf der modifizierten logarithmischen Skala, der diesem Code entspricht, wird ausgegeben (Schritt S35).
  • Als nächstes wird der quantisierte modifizierte logarithmische LSF-Parameter fq(k) einer modifizierten exponentiellen Transformation unterzogen, die in Gleichung (3) definiert ist, dabei den gewöhnlich quantisierten LSF-Parameter Fq(k) erhaltend (Schritt S36).
  • Dann werden der LSF-Parametercode, der in Schritt S35 gesucht wurde, und der entsprechende quantisierte LSF-Parameter Fq(k) ausgegeben (Schritt S37).
  • Die obige Abfolge der Prozesse wird auf einer Rahmen um Rahmen Basis durchgeführt, bis im Schritt S38 entschieden wird, dass das Eingangssprachsignal zu Ende ist, dabei Codierung der spektralen Hülleninformation liefernd.
  • Die codierten LSF-Parameter, die Gewichtungen verwenden, werden im Decoder der 2 im Einklang mit einer ähnlichen Verarbeitung gemäß dem Flussdiagramm in 4 decodiert.
  • In der Erfindung ist der Wert der LSF-Parameter in der Einheit Hz (Hertz) im Übereinstimmung mit einer Frequenzachse definiert. Deshalb nimmt der LSF-Parameter mit Bezug auf das mit 8 kHz abgetastete Sprachsignal Werte im Bereich von 0 bis 4,000 Hz an. Mit anderen Worten, der LSF-Parameter nimmt Werte im Bereich von 0 bis (fs/2) mit Bezug auf die Abtastfrequenz fs an. Falls der LSF-Parameter in einer Einheit unterschiedlich zu Hz definiert ist, sollte eine Konstante A mit einem geeignetem Wert entsprechend der unterschiedlichen Einheit verwendet werden. Falls z. B. die Frequenz normalisiert ist und durch einen Normalisierungswert (2/fs) definiert ist, wird der LSF-Parameter durch Werte im Bereich von 0 bis 1 repräsentiert. In einem solchen Fall sollte ein Wert, erhalten durch Multiplikation der Konstanten A mit (fs/2) als Konstante A angewendet werden. In ähnlicher Weise sollte, wenn der LSF-Parameter durch Werte im Bereich von 0 bis μ(rad) repräsentiert wird, der Wert, erhalten durch die Multiplikation der Konstante A mit (fs/(2μ)) als Konstante A angewendet werden. In anderen Worten, die vorliegende Erfindung kann auf Sprachcodierung und Decodierung unabhängig von der Frequenzeinheit angewendet werden.
  • Wie soweit beschrieben, liefert die vorliegende Erfindung ein Sprachcodierungs/decodierungsverfahren, das es ermöglichen kann Codierungsverzerrung schwer wahrzunehmen, sogar mit etwas Reduzierung in der Codierungsbitrate des LSF-Parameters.

Claims (16)

  1. Ein Sprachcodierungsverfahren zur Codierung von Sprachparametern, die die spektrale Hülle eines Eingangssprachsignals repräsentieren, gekennzeichnet durch die Schritte: Erlangen eines Autokorrelationskoeffizienten vom Eingangssprachsignal; Erlangen von ersten LSF(Linienspektralfrequenz)Parametern, repräsentiert durch F(k) (k = 1, 2, ..., N; N ist die Reihenfolge der LSF-Parameter) auf der Basis des Autokorrelationskoeffizienten; Erlangen von zweiten LSF-Parametern f(k) durch Ausführung einer Transformation auf die ersten LSF-Parameter, die durch f(k) = logC (1 + A × F(k)) (A, C = positive Konstante, und C die Basis des Logarithmus) definiert sind; Quantisieren der zweiten LSF-Parameter, um dritte quantisierte LSF-Parameter fq(k) und erste Codes zu erhalten, die die dritten LSF-Parameter repräsentieren; und Erlangen vierter LSF-Parameter Fq(k) durch die Ausführung einer umgekehrten Transformation der dritten LSF-Parameter, die durch Fq(k) = (Cfq(k) – 1)/A definiert ist.
  2. Das Sprachcodierungsverfahren gemäß Anspruch 1, darin gekennzeichnet, dass die Konstante A im Bereich von 0,5 bis 0,96 liegt.
  3. Das Sprachcodierungsverfahren gemäß Anspruch 1, darin gekennzeichnet, dass die Konstante A in der Nachbarschaft von 0,9 liegt.
  4. Das Sprachcodierungsverfahren gemäß Anspruch 1, darin gekennzeichnet, dass in dem Schritt der Quantisierung die zweiten LSF-Parameter entweder einer Skalarquantisierung oder einer Vektorquantisierung unterliegen.
  5. Das Sprachcodierungsverfahren gemäß Anspruch 1, weiter gekennzeichnet durch einen Schritte zum Erlangen von Anregungssignalinformation aus dem Eingangssprachsignal und der vierten LSF-Parametern und zur Ausgabe eines zweiten Codes, der die Anregungssignalinformation repräsentiert.
  6. Ein Sprachcodierungsverfahren, gekennzeichnet durch die Schritte: Erlangen von Autokorrelationskoeffizienten für ein Eingangssprachsignal; Erlangen von ersten LSF-Parametern, repräsentiert durch F(k) (k = 1, 2, ..., N), auf der Basis der Autokorrelationskoeffizienten; Erlangen zweiter LSF-Parameter f(k) durch die Ausführung einer Transformation auf die ersten LSF-Parameter, die durch f(k) = logC (1 + A × F(k) (A, C = positive konstant, und C ist die Basis des Logarithmus) definiert sind; Erlangen von Gewichtungen für die zweiten LSF-Parameter auf Basis ihrer Distanz zu angrenzenden zweiten LSF-Parametern; Quantisieren der zweiten LSF-Parameter unter Verwendung der Gewichtungen, um dritte LSF-Parameter, repräsentiert durch fq(k) und erste Codes, die dritten LSF-Parameter repräsentierend, zu erhalten; und Erlangen vierter LSF-Parameter, repräsentiert durch Fq(k), durch die Ausführung einer umgekehrten Transformation, die durch Fq(k) = Cfq(k) – 1)/Adefiniert ist.
  7. Das Sprachcodierungsverfahren gemäß Anspruch 6, darin gekennzeichnet, dass die Konstante A in dem Bereich von 0,5 bis 0,96 liegt.
  8. Das Sprachcodierungsverfahren gemäß Anspruch 1, weiter gekennzeichnet durch einen Schritt zum Erlangen einer Anregungssignalinformation aus dem Eingangssprachsignal und dem vierten LSF-Parameter und zur Ausgabe eines zweiten Codes, der die Anregungssignalinformation repräsentiert.
  9. Das Sprachcodierungsverfahren gemäß Anspruch 7, darin gekennzeichnet, dass im Schritt der Quantisierung die zweiten LSF-Parameter entweder einer Skalarquantisierung oder einer Vektorquantisierung unterzogen werden.
  10. Ein Sprachdecodierungsverfahren, gekennzeichnet durch die Schritte: Dekodieren der dritten LSF-Parameter durch eine umgekehrte Quantisierung der dritte LSF-Parameter basierend auf den ersten Codes, erhalten durch das Sprachcodierungsverfahren, wie im Anspruch 1 definiert; und Erlangen der vierten LSF-Parameter, repräsentiert durch Fq(k), durch die Ausführung einer umgekehrten Transformation auf den decodierten dritten LSF-Parametern, definiert durch Fq(k) = (Cfq(k) – 1)/A
  11. Das Sprachdecodierungsverfahren gemäß Anspruch 10, darin gekennzeichnet, dass die Konstante A im Bereich von 0,5 bis 0,96 liegt.
  12. Ein Sprachdecodierungsverfahren, gekennzeichnet durch die Schritte: (a) Decodieren der dritten LSF-Parameter, repräsentiert durch fq(k), durch deren umgekehrte Quantisierung auf der Basis der ersten Codes, erhalten durch das Codierungsverfahren, wie in Anspruch 7 definiert; (b) Erhalten der vierten LSF-Parameter, repräsentiert durch Fq(k), durch das Ausführen einer umgekehrten Transformation auf den decodierten dritten LSF-Parametern, die definiert ist durch Fq(k) = (Cfq(k) – 1)/A.(c) Dekodieren der Anregungssignalinformation aus dem zweiten Code; und (d) Wiederherstellen eines Ausgangssprachsignals auf der Basis der vierten LSF-Parameter und der Anregungssignalinformation, decodiert im Schritt (C).
  13. Das Sprachdecodierungsverfahren gemäß Anspruch 12, darin gekennzeichnet, dass die Konstante A in dem Bereich von 0,5 bis 0,96 liegt.
  14. Ein Sprachcodierungsverfahren zur Codierung von Sprachparametern, die die spektrale Hülle eines Eingangssprachsignals repräsentieren, gekennzeichnet durch die Schritte: Erlangen von Autokorrelationskoeffizienten aus dem Eingangssprachsignal; Erlangen erster LSF-(Linienspektralfrequenz)Parameter auf der Basis der Autokorrelationskoeffizienten; Erlangen zweiter LSF-Parameter f(k) durch Ausführung einer modifizierten logarithmischen Transformation mit Versetzung auf den ersten LSF-Parametern; Quantisieren der zweiten LSF-Parameter, um dritte LSF-Parameter und erste Codes, die die dritten LSF-Parameter repräsentieren, zu erhalten; und Erlangen vierter LSF-Parameter durch Ausführung einer umgekehrten Transformation auf den dritten LSF-Parametern, die die Umkehrung der modifizierten logarithmischen Transformation ist.
  15. Das Sprachcodierungsverfahren gemäß Anspruch 14, darin gekennzeichnet, dass im Schritt der Quantisierung die zweiten LSF-Parameter entweder einer Skalarquantisierung oder einer Vektorquantisierung unterzogen werden.
  16. Das Sprachcodierungsverfahren gemäß Anspruch 14, gekennzeichnet durch einen Schritt zum Erlangen von Anregungssignalinformation aus dem Eingangssprachsignal und von vierten LSF-Parametern und zur Ausgabe eines zweiten Codes, der die Anregungssignalinformation repräsentiert.
DE69821895T 1997-12-24 1998-12-23 Verfahren zur Sprachkodierung und -dekodierung Expired - Lifetime DE69821895T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP35574997 1997-12-24
JP35574997A JP3357829B2 (ja) 1997-12-24 1997-12-24 音声符号化/復号化方法

Publications (2)

Publication Number Publication Date
DE69821895D1 DE69821895D1 (de) 2004-04-01
DE69821895T2 true DE69821895T2 (de) 2004-09-09

Family

ID=18445572

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69821895T Expired - Lifetime DE69821895T2 (de) 1997-12-24 1998-12-23 Verfahren zur Sprachkodierung und -dekodierung

Country Status (4)

Country Link
US (1) US6131083A (de)
EP (1) EP0926659B1 (de)
JP (1) JP3357829B2 (de)
DE (1) DE69821895T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171355B1 (en) 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
US6751587B2 (en) 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
KR100612889B1 (ko) 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
KR101660843B1 (ko) 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
EP2980801A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Schätzung des Rauschens in einem Audiosignal, Rauschschätzer, Audiocodierer, Audiodecodierer und System zur Übertragung von Audiosignalen
JPWO2018198454A1 (ja) * 2017-04-28 2019-06-27 ソニー株式会社 情報処理装置、および情報処理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651026A (en) * 1992-06-01 1997-07-22 Hughes Electronics Robust vector quantization of line spectral frequencies
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US5675701A (en) * 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
KR100322706B1 (ko) * 1995-09-25 2002-06-20 윤종용 선형예측부호화계수의부호화및복호화방법
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer

Also Published As

Publication number Publication date
JPH11184498A (ja) 1999-07-09
DE69821895D1 (de) 2004-04-01
US6131083A (en) 2000-10-10
EP0926659B1 (de) 2004-02-25
JP3357829B2 (ja) 2002-12-16
EP0926659A3 (de) 2000-05-10
EP0926659A2 (de) 1999-06-30

Similar Documents

Publication Publication Date Title
DE69915400T2 (de) Vorrichtung zur Kodierung und Dekodierung von Audiosignalen
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE60110679T3 (de) Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz
DE69837822T2 (de) Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen
EP2022043B1 (de) Informationssignalcodierung
DE69816810T2 (de) Systeme und verfahren zur audio-kodierung
DE60201766T2 (de) Verbesserung der Periodizität der CELP-Anregung für die Sprachkodierung und -dekodierung
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE60011051T2 (de) Celp-transkodierung
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69531642T2 (de) Synthese eines Anregungssignals bei Ausfall von Datenrahmen oder Verlust von Datenpaketen
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE69531464T2 (de) Kodiergerät
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE60126149T2 (de) Verfahren, einrichtung und programm zum codieren und decodieren eines akustischen parameters und verfahren, einrichtung und programm zum codieren und decodieren von klängen
DE602004003610T2 (de) Halbrätiger Vocoder
DE602004004950T2 (de) Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
DE60012760T2 (de) Multimodaler sprachkodierer
DE69821895T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE60128479T2 (de) Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer
EP3544003A1 (de) Vorrichtung und verfahren zum ermitteln eines schätzwerts
DE60015934T2 (de) Verfahren und vorrichtung zur vorverarbeitung von sprachsignalen zur kodierung mittels transformationssprachkodierer
DE69921066T2 (de) Verfahren und Vorrichtung zur Sprachkodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition