WO2002095732A1 - Verfahren zur schätzung eines spektralkoeffizienten - Google Patents

Verfahren zur schätzung eines spektralkoeffizienten Download PDF

Info

Publication number
WO2002095732A1
WO2002095732A1 PCT/DE2002/001506 DE0201506W WO02095732A1 WO 2002095732 A1 WO2002095732 A1 WO 2002095732A1 DE 0201506 W DE0201506 W DE 0201506W WO 02095732 A1 WO02095732 A1 WO 02095732A1
Authority
WO
WIPO (PCT)
Prior art keywords
spectral
coefficients
coefficient
spectral coefficient
spectral coefficients
Prior art date
Application number
PCT/DE2002/001506
Other languages
English (en)
French (fr)
Inventor
Tim Fingscheidt
Jesus Guitarte Perez
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2002095732A1 publication Critical patent/WO2002095732A1/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Definitions

  • the value of a first spectral coefficient from a set of a plurality of spectral coefficients which is assigned to an nth point in time is estimated by using previous values of this first spectral coefficient as well as values of at least one further spectral coefficient from this set of spectral coefficients , Accordingly, the invention is based on the idea of estimating a spectral coefficient by means of its history and values or also the history of further spectral coefficients.
  • this indicator can indicate whether a frame was received correctly.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Schätzung eines Spektralkoeffizienten, insbesondere von Filterkoeffizienten, wie sie bei der Codierung von Sprache anfallen. Der momentane Wert eines Spektralkoeffizienten wird nicht nur aus seiner Historie geschätzt, sondern auch aus den Werten weiterer Spektralkoeffizienten, die bei der Beschreibung des Filters anfallen.

Description

Beschreibung
Verfahren zur Schätzung von Spektralkoeffizienten
Die Erfindung betrifft ein Verfahren zur Schätzung von Spektralkoeffizienten, insbesondere unter Verwendung von bereits bekannten, zum selben Satz von Koeffizienten gehörenden Spektralkoeffizienten. Insbesondere findet das Verfahren Anwendung zur Schätzung von Filterkoeffizienten, die bei der Codierung von Spräche auftreten.
Systeme, in denen die Erfindung standardkompatibel genutzt werden kann, sind beispielsweise GSM, EDGE, GPRS, UMTS sowie Übertragungen über das Internet (Voice-over-IP) .
In digitalen Kommunikationssystemen wie dem Internet oder Mobilfunksystemen wie beispielsweise GSM oder UMTS werden Quellcodierverfahren, beispielsweise Sprach-, Audio-, Bildoder Videocodierverfahren eingesetzt, um die zu übertragende Bitrate zu senken. Die Quellcodierverfahren liefern üblicher- weise einen Bitstrom, der in Rahmen aufgeteilt ist. Im Falle der Sprachübertragung im GSM-System repräsentiert ein Rahmen sprachcodierter Bits 20 ms des Sprachsignals. Die Bits innerhalb eines Rahmens repräsentieren im allgemeinen einen bestimmten Satz an Parametern. Diese Parameter sind (neben an- deren) üblicherweise Koeffizienten eines Filters, mittels dem Sprache modelliert wird.
Ein Rahmen ist wiederum vielfach in Subrahmen aufgeteilt, so daß manche Parameter einmal pro Rahmen, andere einmal pro Subrahmen übertragen werden. Im Falle des US-TDMA Enhanced Fullrate (EFR) Sprachcodecs mit 7.4 kbps enthält ein 20 ms-Rahmen 148 bit . Ein Rahmen besteht hier aus vier Subrahmen. Die Parameter sind hier im einzelnen: - Die 10 Koeffizienten eines Filters, welches die spektrale Einhüllende des Sprachsignals im Bereich des aktuellen Rahmens repräsentiert, werden mit 26 Bit pro Rahmen quantisiert. - Mittels 4x7 bit werden vier Subrahmen eines AnregungsSignals für dieses Filter quantisiert.
- Mittels 2x8 bit und 2x5 bit werden vier Werte einer Sprachgrundfrequenz repräsentiert. - Mittels 4x7 bit werden vier Verstärkungsfaktorpaare pro Rahmen vektorquantisiert .
Die Bits innerhalb eines Rahmens repräsentieren also im allgemeinen einen bestimmten Satz an Parametern, welcher abhän- gig vom jeweilig verwendeten Quellcodierverfahren ist.
Es kann nun passieren, daß einzelne oder auch mehrere aufeinanderfolgende Rahmen verlorengehen oder von einer Netzkomponente als unbrauchbar gekennzeichnet werden. Diese Rahmen, sogenannte bad frames, können oder sollen dann nicht genutzt werden. Der Quelldecodierer, beispielsweise der Sprachdeco- dierer auf der Empfangsseite, muß Maßnahmen ergreifen, daß ein solcher Rahmenverlust nach Möglichkeit nicht hörbar beziehungsweise im Falle von Bild- oder Videoübertragungen nicht sichtbar wird.
Im allgemeinen liegt auf der Empfangsseite ein Indikator vor, der anzeigt, ob ein Rahmen fehlerfrei empfangen wurde, der sogenannte bad frame indicator (BFI) . BFI = 0 bedeutet im folgenden, daß man davon ausgeht, daß der empfangene Rahmen korrekt ist, während BFI = 1 auf einen Fehler hindeutet, beispielsweise daß kein Rahmen rechtzeitig empfangen wurde oder ein gestörter Rahmen empfangen wurde. Natürlich können Bitfehler, d. h. die Umkehrung einzelner Bits, innerhalb eines Rahmens, je nach Systemgegebenheiten auftreten. Diese sollen aber im weiteren entweder keine differenzierte Behandlung auf der Empfangsseite erfahren, oder der entsprechende Rahmen wird mit BFI = 1 gekennzeichnet.
Bisher wird im Falle BFI = 1 aus der Vergangenheit des schon decodierten Sprachsignals beispielsweise durch Korrelations- bildung der gegenwärtige Sprachsignalrahmen geschätzt. Alter- nativ sind Verfahren bekannt, die aus der Vergangenheit der Parameter, beispielsweise der Sprachcodecparameter, die Parameter des aktuellen Rahmens schätzen, und dann den Decodierer in ähnlicher Weise arbeiten lassen, als wären diese geschätz- ten Parameterwerte korrekt. Üblicherweise werden die einzelnen Parameter, beispielsweise die eingangs angegebenen Koeffizienten eines Filters im Fall BFI = 1 unabhängig voneinander geschätzt, d. h. der erste Koeffizient wird aus der Historie des erste Koeffizienten, der zweite Koeffizient wird aus der Historie des zweiten Koeffizienten, und so fort, geschätzt .
Im folgenden werden bekannte Verfahren zur Schätzung von Spektralkoeffizienten, insbesondere Filterkoeffizienten be- trachtet. Es ist eine Vielzahl von möglichen Darstellungen der Filterkoeffizienten bekannt, die unter anderem darauf zielen, eine effiziente Codierung beziehungsweise Quantisierung zu ermöglichen. Mögliche Darstellungsformen zur Quantisierung sind die Filterkoeffizienten selbst (in sogenannter direkter Form) , Autokorrelationskoeffizienten, Reflexionskoeffizienten oder sogenannte Log-area-Ratios . Derzeit oft verwendete Darstellungen sind beispielsweise die ISF (imittance spectral frequencies) , LSF (line spectral frequencies) beziehungsweise LSP (line spectral pairs) .
Das die spektrale Einhüllende des Sprachsignals repräsentierende Filter gibt man oftmals zu
N H(z) = 1/ A(z) mit A(z) = l - ∑a _j * z_j
an. Dabei sind a_j , =l, 2 , ... ,N die N Filterkoeffizienten in direkter Form. Es ist bekannt, daß diese Koeffizienten sich im Allgemeinen nicht zur Quantisierung eignen. Gewöhnlich wird die Quantisierung über die Quantisierung der Nullstel- len der zwei Polynome P ( z) = A (z) + z ( "N_1) * Ä fz" 1) Q ( z ) = Ä ( z ) - z (-N_1) * A ( z_1 )
vorgenommen.
Die N Nullstellen von P(z) und Q(z) liegen auf dem Einheitskreis in der z-Ebene als konjugiert komplexe Paare. Zusätzlich befindet sich bei z=+l und z=-l je eine Nullstelle. Je 2 oder auch drei solcher Nullstellen, die LSFs, bilden einen Formanten, das ist ein spektrales Maximum, des Sprachsignals nach. Ihr Winkel in der z-Ebene bezeichnet dabei die Frequenz .
Im Sprachdecoder können aus den übertragenen LSFs, den Nullstellen, durch Ausmultiplikation wieder die Polynome P(z) und Q(z) rekonstruiert werden. Die letztlich gesuchte Filterübertragungsfunktion A (z) ergibt sich dann zu
A (z) = 0.5 * [ P(z) + Q(z) ] .
Andere Umrechnungen ergeben beispielsweise die Darstellung als Autokorrelationskoeffizienten, Reflexionskoeffizienten oder Log-area-Ratios .
Die Problematik wird nun anhand von LSFs besprochen, wobei jedoch prinzipiell jede der Darstellungsformen LSF, LSP, ISF gemeint sein kann.
Sieht man bei einer Abtastrate von 8 kHz üblicherweise N = 10 Filterkoeffizienten vor, so sind 5 spektrale Maxima, sogenannte Formanten, modellierbar. Es ergeben sich in diesem Falle auch N = 10 LSFs.
Wenn nun für den aktuell zu decodierenden Rahmen zum Zeitpunkt t = n der Zusammenhang BFI (t=n) = 1 gilt, dann wird üblicherweise jeder LSF-Parameter W_i (t=n) , i=l , 2 , ... , 10 individuell aus zuvor decodierten LSFs W_i (n-l) , W i(n-2), usf. ermittelt. Im einfachsten Fall geschieht das durch Wiederholung. Alternativ kann man in aufeinanderfolgenden bad frames den LSF auch zu seinem Mittelwert hin ziehen. Dies geschieht durch die Rekursion
W_i(n) = a * W_i(n-1) + (1-a) * mean{W_i}, (1)
wobei die Mittelwerte jedes LSF-Parameters mean{W_i}, i=l,2, ... ,10 im vorhinein zu messen und im Decoder beispielsweise in einer ROM-Tabelle zu speichern sind. Der Faktor a wird dabei sinnvollerweise Werte nahe 1 annehmen, beispiels- weise a = 0.95 oder a = 0.9. W_i (n-1) stellt dabei den zuletzt decodierten LSF-Parameter dar. Eine erweiterte Version von Gleichung (1) geht davon aus, dass sich mean{W_i} aus einem statischen Anteil und einem dynamischen Anteil zusammensetzt, der mean{W_i} (n) geschrieben wird. Man kann dann schreiben:
W_i (n) = a * W_i(n-1) + (1-a) * mean{W_i} (n) , (2a)
mean{W_i} (n) = b * mean{W_i} + (1-b) * mean_dyn{W_i} (n) , (2b)
M mean_dyn{W_i} (n) = [1/M] * ∑W_i(n-k). (2c)
4=1
Der Koeffizient b kann sinnvoll beispielsweise zu b = 0.75 gewählt werden, die Mittelungstiefe für den dynamischen Anteil des "Mittelwertes" beträgt beispielsweise M = 3. Eine Variante hiervon sieht eine Aktualisierung des dynamischen Anteils des "Mittelwertes" mean{W_i} (n) nur vor, wenn BFI(n) = 0 gilt.
Die hier beschriebenen Formen der Parameterdecodierung sind üblich in vielen State-of-the-Art-Codierverfahren, unter anderem beispielsweise im AMR- und EFR-Sprachcodierer (adaptive multi-rate beziehungsweise enhanced full-rate) . Prinzipiell sind natürlich auch höhere Ordnungen der Prädiktion vorstellbar. Manchmal werden die genannten Vorschriften für den um den Mittelwert geminderten Parameterwert durchgeführt . Der Mittelwert wird zum Schluß als Addition einer Konstanten wieder hinzugefügt .
Die hier beschriebene Form der Parameterdecodierung weist insbesondere Nachteile auf, wenn mehrere Werte, das heisst Werte in verschiedenen Zeitintervallen des Parameters W__i nicht korrekt übertragen wurden, da natürlich die Schätzung umso ungenauer wird, je mehr Schätzwerte und weniger tatsächliche Meßwerte in die Schätzung mit einfließen.
Der hier beschriebenen Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren anzugeben, mittels dem eine gegenüber dem Stand der Technik verbesserte Schätzung der Spektralparameter ermöglicht wird.
Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.
Erfindungsgemäß wird der Wert eines ersten Spektralkoeffizienten aus einem Satz von mehreren Spektralkoeffizienten, der einem n-ten Zeitpunkt zugeordnet ist, geschätzt, in dem man dazu zeitlich vorhergehende Werte dieses ersten Spektral- koeffizienten sowie Werte von zumindest einem weiteren Spektralkoeffizienten aus diesem Satz von Spektralkoeffizienten heranzieht. Demnach beruht die Erfindung auf dem Gedanken, einen Spektralkoeffizienten mittels seiner Historie und Werten oder auch der Historie weiterer Spektralkoeffizienten zu schätzen.
Unter erstem Spektralkoeffizienten wird hier ein beliebiger Spektralkoeffizient i aus dem Satz der i = 1,2,...,N Spekt- ralkoeffizienten verstanden.
Unter Historie werden hier beispielsweise Werte verstanden, die zu Zeitpunkten < n gehören. Zum Testen dieser Schätzungs- methode erstellte Simulationen zeigten, daß je zwei benachbarte Spektralkoeffizienten, beispielsweise LSFs, stark kor- reliert zeitlich variieren. Daraus ergibt sich der Vorteil, daß der zeitliche Verlauf eines Spektralkoeffizienten mit beispielsweise dem Index i aus dem zeitlichen Verlauf eines Spektralkoeffizienten mit einem benachbarten Index geschätzt werden kann.
Unter benachbarten Spektralkoeffizienten können beispielsweise frequenzmäßig nebeneinanderliegende Spektralkoeffizienten verstanden werden. Wie eingangs dargelegt, wird beispielsweise der Signalinhalt eines Rahmens unter anderem durch einen Satz von 10 Koeffizienten eines Filters repräsentiert. Simulationen zeigten, daß für eine beispielhafte Anordnung je erster und zweiter, dritter und vierter, etc. Koeffizient zeitlich stark korreliert verlaufen.
Eine Weiterbildung der Erfindung sieht vor, daß die Spektral- koeffizienten, welche einem n-l-ten Zeitpunkt zugeordnet sind und aus einem Decodierverfahren beziehungsweise einem Schät- zungsverfahren hervorgegangen sind, gespeichert vorliegen. Dies kann die Anzahl der Rechenoperationen vermindern.
Eine andere Weiterbildung der Erfindung besteht darin, daß der Spektralkoeffizient i, der zu einem n-ten Zeitpunkt ge- hört, nur aus den Spektralkoeffizienten des n-l-ten Zeitpunktes bestimmt wird. Dadurch reduziert sich der Aufwand für die Mittelwertbildung.
In einer anderen Weiterbildung werden zur Bestimmung eines ersten Spektralkoeffizienten weitere Spektralkoeffizienten herangezogen und der erste Spektralkoeffizient durch gewich- tete Summation bestimmt. Verschiedene Spektralkoeffizienten sind in Abhängigkeit von unterschiedlichsten Ursachen mehr oder weniger stark miteinander korreliert. Mittels dieser Weiterbildung werden die jeweils füreinander relevanten
Spektralkoeffizienten zur Schätzung herangezogen. Durch die gewichtete Summation kann des Weiteren eine graduelle Abstu- fung der Wichtigkeit der Spektralkoeffizienten füreinander vorgenommen werden.
Eine Weiterbildung der Erfindung sieht vor, daß die Schätzung mittels eines Indikators oder Steuergröße gesteuert wird.
Dieser Indikator kann beispielsweise anzeigen, ob ein Rahmen korrekt empfangen wurde.
Die Weiterbildungen sind natürlich auch mit dem unabhängigen Anspruch 7 kombinierbar.
Im folgenden wird die Erfindung anhand einiger Ausführungs- beispiele, die in den Figuren gezeigt sind, näher erläutert. Es zeigen
Figur 1 den beispielhaften Verlauf der 10-LSF-Parameter pro Rahmen über einen Zeitraum von 20 Rahmen, und
Figur 2 die mittlere spektrale Verzerrung für verschiedene Extrapolationstechnike .
Je zwei LSFs tendieren dazu, einen Formanten, also ein spektrales Maximum, auszubilden. Diese Tendenz ist in Figur 1 sichtbar. Figur 1 zeigt die 10 LSF-Werte W_i(t) mit i=l, 2, .. , 10 von 20 zeitlich aufeinanderfolgenden Sprachrah- men. W_l(t) ist die zuunterst liegende Kurve, die darüber liegende W_2 (t) . Die oberste Kurve stelle W_10 (t) dar. Man sieht die hohe Korrelation je zweier benachbarter LSF-Werte im zeitlichen Verlauf, d.h. W_l(t) und W_2 (t) , die untersten beiden Kurven, verlaufen stark korreliert, W_3 (t) und W_4(t), die nächsten beiden Kurven darüber, verlaufen stark korreliert , und so weiter. Hieraus leitet sich nun ein neuartiges Extrapolationsverfahren zur Bestimmung von W_i (n) bei BFI (n) = 1 her. Es bestimmt nicht mehr den aktuellen W_i (n) als Funktion von { mean{W_i}, W_i (n-1) , W__i (n- 2),...}, also der Historie von W_i selbst, wie eingangs beschrieben, sondern W_i (n) = f [mean{W_i } , W_i (n- 1 ) , W_i (n- 2 ) , . . . , W_i+l (n- l ) , W_i+l (n- 2 ) , . . . ] , falls i=l , 3 , 5 , . . . ( 3a)
beziehungsweise
W_i(n) = f[mean{W_i}, W_i(n-1), W_i (n-2) , ... , W_i-l(n-l), W_i-l(n-2) , ...] , falls i=2, 4, 6, ... (3b)
Es werden also weitere W_k mit k ≠ i verwendet. Der Vorteil daraus ist offensichtlich: Hier werden Paare von LSFs gebildet, die als korreliert betrachtet werden, und eben diese Korrelation wird ausgenutzt, um verlorengegangene Parameterwerte zu schätzen. Dadurch können bei Verlust eines Pa- rameterwertes die Werte anderer Parameter zur Schätzung he- rangezogen werden und somit diese Verluste besser kompensiert werden .
Der wesentliche Schritt liegt in der gemeinsamen Betrachtung der Historie verschiedener Spektralparameter, beispielsweise LSFs, um einen bestimmten LSF i (i=l, 2 , .. ,N) zu schätzen.
Ein Ausführungsbeispiel kann beispielsweise folgende Rechenvorschrift zur Decodierung von W_i (n) , 1=1,2, ... sein:
Falls BFI (n) = 0 (das heißt der Rahmen n wurde korrekt empfangen) : Decodiere konventionell.
Falls BFI (n) = 1 (das heißt beim Empfang des Rahmens n trat ein Fehler auf) : Berechne:
W_i (n) = a_i,i * W_i(n-1) + a_i,i+l * W_i+l(n-l) für i=l,3,5,7,9, (4a)
und
W_i (n) = a_i,i-l * W_i-l(n-l) + a__i,i * W_i (n-1) für i=2,4,6,8,10. (4b) Die Koeffizienten a_j,k werden nach bekannten Methoden der Prädiktionskoeffizienten-Bestimmung im vorhinein ermittelt und im Decoder beispielsweise in einer ROM-Tabelle gespei- chert . Es ist auch vorstellbar, die Koeffizienten a_j , k nach bekannten Methoden, beispielsweise der geringsten quadratischen Abweichung (least mean Squares) , empfangsseitig zu a- daptieren.
Es ist anzumerken, dass der BFI, wie er hier benutzt wird, direkt den bad frame kennzeichnen kann, oder über Zwischenberechnungen beispielsweise mittels einer Zustandsmaschine ermittelt worden sein kann.
Weiterhin kann die Ordnung der Prädiktion natürlich erhöht werden, insbesondere eine Kombination der Verfahren wie in den Gleichungen (2) und (4) beziehungsweise (1) und (4) sind denkbar .
In Figur 2 sind die Ergebnisse einer Simulation einer Übertragung über einen GSM-Vollratenkanal zu sehen. Für verschiedene Extrapolationsmethoden ist die spektrale Verzerrung (Spectral Distortion, SD) der empfangsseitigen LSF des AMR- Sprachcodecs im Modus 10,2 kbps in Abhängigkeit von der Ka- nalqualität abgebildet, welche durch das C/I-Verhältnis (car- rier-to-interferer-ratio) ausgedrückt wird. Je höher die SD ist, umso schlechter ist die empfangsseitige Sprachqualität, je kleiner das C/I, desto schlechter ist die Kanalqualität, weil die Interferenzleistung relativ zur Signalleistung grö- ßer ist. Für Kurve 1 wurde eine konventionelle Methode zur Extrapolation verwendet, in Kurve 2 die neuartige Extrapolation, welche hier vorgestellt wird. Es ist deutlich zu sehen, daß Kurve 2 für alle C/l-Verhältnisse unter Kurve 1 liegt. Es ist damit offensichtlich, daß das Verfahren eine Verbesserung der empfangsseitigen Sprachqualität bewirkt. Neben den oben erläuterten Beispielen liegt eine Vielzahl weiterer Ausführungsvarianten im Rahmen der Erfindung, welche hier nicht weiter beschrieben werden. Sie lassen sich aber anhand der erläuterten Ausführungsbeispiele von einem Fachmann einfach in die Praxis umsetzen. Insbesondere liegt auch die Anwendung des hier vorgeschlagenen Verfahrens sowie seiner Weiterbildungen für Line Spectral Pairs (LSP) , sowie I- mittance Spectral Frequencies (ISF) oder Imittance Spectral Pairs (ISP) anstelle der LSF im Rahmen der Erfindung.

Claims

Patentansprüche
1. Verfahren zur empfangsseitigen Schätzung eines einem n-ten Zeitpunkt zugeordneten ersten Spektralkoeffizienten aus einem Satz von Spektralkoeffizienten d a d u r c h g e k e n n z e i c h n e t , daß der erste Spektralkoeffizient mittels seiner schon bekannten Historie und mittels zumindest eines weiteren Spektralkoeffizienten aus dem Satz von Spektralkoeffizienten bestimmt wird.
2. Verfahren nach Anspruch 1, bei dem die dem (n-l)-ten Zeitpunkt zugeordneten Spektralkoeffizienten, welche aus einem Decodierverfahren oder/und einem Schätzungsverfahren hervorgehen, gespeichert vorliegen.
3. Verfahren nach Anspruch 1 oder 2, bei dem der erste Spektralkoeffizient zum n-ten Zeitpunkt nur aus schon bekannten Spektralkoeffizienten des unmittelbar vorhergehenden (n-1)- ten Zeitpunktes bestimmt wird.
4. Verfahren nach einem der vorangegangenen Ansprüche, bei dem die Bestimmung des ersten Spektralkoeffizienten durch ge- wichtete Summation weiterer Spektralkoeffizienten bestimmt wird.
5. Verfahren nach einem der vorangegangenen Ansprüche, bei dem die Schätzung von einem Indikator, der insbesondere das Nicht-Vorliegen eines Wertes eines Spektralkoeffizienten anzeigt, gesteuert wird.
6. Verfahren nach Anspruch 5, bei dem jedem Zeitpunkt ein Rahmen zugeordnet ist, innerhalb dessen die Spektralkoeffizienten übertragen werden, bei dem der Indikator zumindest schlecht und gut empfangene Rahmen unterscheiden kann.
7. Verfahren zur empfangsseitigen Schätzung eines Spektralkoeffizienten - bei dem ein Satz von Spektralkoeffizienten empfangen wird, deren Werte einem n-ten Zeitpunkt zugeordnet sind,
- die Qualität des Empfangs von zumindest dem Wert eines ersten Spektralkoeffizienten schlecht ist und
- dieser Wert unter Einbeziehung von zeitlich vorhergehenden Werten des ersten Spektralkoeffizienten und von Werten zumindest eines weiteren Spektralkoeffizienten aus dem Satz von Spektralkoeffizienten approximiert wird.
PCT/DE2002/001506 2001-05-18 2002-04-24 Verfahren zur schätzung eines spektralkoeffizienten WO2002095732A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10124402.9 2001-05-18
DE2001124402 DE10124402A1 (de) 2001-05-18 2001-05-18 Verfahren zur Schätzung eines Spektralkoeffizienten

Publications (1)

Publication Number Publication Date
WO2002095732A1 true WO2002095732A1 (de) 2002-11-28

Family

ID=7685371

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2002/001506 WO2002095732A1 (de) 2001-05-18 2002-04-24 Verfahren zur schätzung eines spektralkoeffizienten

Country Status (2)

Country Link
DE (1) DE10124402A1 (de)
WO (1) WO2002095732A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7890319B2 (en) 2006-04-25 2011-02-15 Canon Kabushiki Kaisha Signal processing apparatus and method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014209518A1 (de) * 2014-05-20 2015-11-26 Sennheiser Electronic Gmbh & Co. Kg Drahtlos-Audioübertragungssystem und Verfahren zur drahtlosen Übertragung von Audiosignalen mit einer geringen Latenz

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0459358A2 (de) * 1990-05-28 1991-12-04 Nec Corporation Sprachdecoder
US5148486A (en) * 1988-03-30 1992-09-15 Kabushiki Kaisha Toshiba Voice decoding device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148486A (en) * 1988-03-30 1992-09-15 Kabushiki Kaisha Toshiba Voice decoding device
EP0459358A2 (de) * 1990-05-28 1991-12-04 Nec Corporation Sprachdecoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HUSAIN A ET AL: "Reconstruction of missing packets for CELP-based speech coders", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1995. ICASSP-95., 1995 INTERNATIONAL CONFERENCE ON DETROIT, MI, USA 9-12 MAY 1995, NEW YORK, NY, USA,IEEE, US, 9 May 1995 (1995-05-09), pages 245 - 248, XP010151418, ISBN: 0-7803-2431-5 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7890319B2 (en) 2006-04-25 2011-02-15 Canon Kabushiki Kaisha Signal processing apparatus and method thereof

Also Published As

Publication number Publication date
DE10124402A1 (de) 2002-11-28

Similar Documents

Publication Publication Date Title
DE69133458T2 (de) Verfahren zur Sprachquantisierung und Fehlerkorrektur
DE60209861T2 (de) Adaptive Postfilterung zur Sprachdekodierung
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE60117144T2 (de) Sprachübertragungssystem und verfahren zur behandlung verlorener datenrahmen
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE60125219T2 (de) Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder
DE60006271T2 (de) Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung
DE69535709T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate bei einem Vokoder mit variabler Rate
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE69932593T2 (de) Dekodierungsverfahren und system mit einem adaptiven postfilter
DE602004006211T2 (de) Verfahren zur Maskierung von Paketverlusten und/oder Rahmenausfall in einem Kommunikationssystem
EP0076234B1 (de) Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
DE60118631T2 (de) Verfahren zum ersetzen verfälschter audiodaten
WO2007073949A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
DE102008042579A1 (de) Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
WO2006114368A1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
EP3544003A1 (de) Vorrichtung und verfahren zum ermitteln eines schätzwerts
DE60016305T2 (de) Verfahren zum Betrieb eines Sprachkodierers
WO1999063523A1 (de) Verfahren und anordnung zur sprachcodierung
DE60109111T2 (de) Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen
EP1388146B1 (de) Verfahren zur codierung und zur übertragung von sprachsignalen
EP0658874B1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
DE60224100T2 (de) Erzeugung von lsf-vektoren
WO2002095732A1 (de) Verfahren zur schätzung eines spektralkoeffizienten
EP1390946B1 (de) Verfahren zur schätzung eines codecparameters

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase