EP1390946B1 - Verfahren zur schätzung eines codecparameters - Google Patents
Verfahren zur schätzung eines codecparameters Download PDFInfo
- Publication number
- EP1390946B1 EP1390946B1 EP02729881A EP02729881A EP1390946B1 EP 1390946 B1 EP1390946 B1 EP 1390946B1 EP 02729881 A EP02729881 A EP 02729881A EP 02729881 A EP02729881 A EP 02729881A EP 1390946 B1 EP1390946 B1 EP 1390946B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- parameter
- time point
- frame
- interpolation
- difference signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Definitions
- the invention relates to a method for estimating a Parameters occurring in the course of speech coding, in particular a filter coefficient, a gain factor, or a basic speech frequency.
- bits are within of a frame generally a certain set of parameters represent which one depends on the particular one used Source coding method is.
- the digitized signal within a frame was up the transmission side through the so-called source coding redundancy withdrawn. On the receiving side, this is due to the source decoding, such as speech decoding, largely reversed made.
- the source decoder for example the speech decoder, must take measures on the receiving side, that such a loss of frame is not audible if possible or in the case of image or video transmissions is not visible.
- bit errors that is, the reversal of individual bits, within one Framework depending on the system conditions.
- VoIP Voice over IP
- a mobile communication system such as GSM or UMTS
- Buffer memory required because packets received do not arrive in a fixed time grid, but with different ones Delay times arrive (delay jitter).
- Delay jitter Delay times arrive
- Such a buffer memory can possibly have several frames to include length, causing too frequent frame losses at cost an increased transmission delay can be prevented can.
- Speech codec parameters of the lost frames instead a conventional extrapolation advantageous because it Is generally more accurate.
- a buffer storage and therefore Parameter interpolation can also be used in streaming applications can be realized since they are usually not sensitive regarding the delay time, see e.g. EP-A-0,459,358th
- a spectral parameter V_i (t) of a speech frame is, for example, the filter coefficient of the time-dependent, digital filter, with the aid of which the vocal tract is modeled: Speech is encoded, for example, using the LPC principle (Linear Predictive Coding). Voiced sounds are generated in this case via a periodic sequence of pulses, unvoiced sounds, for example, by means of a random noise generator (random noise generator).
- Plosive sounds are simulated by changing the amplification, and the vocal tract is simulated using a time-varying digital filter.
- the coefficients of this varying digital filter are obtained with the help of linear prediction, that is to say a prediction of the following value on the basis of previous values.
- Differential or predictive coding is understood an encoding of a parameter at a time n at which also values of the parameter before n Times to be involved.
- a parameter in the sense of the following explanations can for example a gain factor, a basic speech frequency or be a spectral parameter.
- Usual forms of presentation spectral parameters are, for example, the filter coefficients itself (in so-called direct form), autocorrelation coefficients, Reflection coefficients or so-called Log-area ratios.
- a state-of-the-art presentation are for example the ISF (imittance spectral frequencies), LSF (line spectral frequencies) or LSP (line spectral pairs).
- ISF input spectral frequencies
- LSF line spectral frequencies
- LSP line spectral pairs
- vector quantization is often used for quantization. This is the joint quantization of several X_i (n) for certain values of i.
- Vector quantization can also mean the joint quantization of two or more different parameter types that occur in a speech coding method.
- parameter decoding is common in many coding methods currently used, under other, for example, in the AMR and EFR speech coder (adaptive multi-rate or enhanced full-rate). in principle are of course also higher orders of prediction imaginable.
- equations (1), (2) mentioned regulations for the reduced by the mean Parameter value carried out.
- the mean becomes Finally added as an addition of a constant.
- a predictive coding as exemplified above indicates an interpolative determination of the spectral coefficients missing frame disadvantages on:
- the present invention is therefore based on the object specify a method with which codec parameters are received let determine, even if the underlying Data in single or multiple successive time periods absence.
- the invention relates to a method for receiving-side estimation of a time-variable parameter at an nth point in time.
- the parameter was coded predictively on the transmission side and is determined interpolatively on the reception side depending on at least two variables.
- One interpolation interpolation point, the first variable forms an earlier value of the parameter that has already been decoded, and a second interpolation interpolation point, the second variable, is determined by extrapolative measures.
- the interpolative determination of the parameter can be carried out by means of known interpolation measures, for example by means of linear interpolation between the first and second variable.
- a weighted summation is also used for the interpolation.
- the advantage of this method is that it is interpolated to determine the parameter can, as soon as the second size is known.
- the invention further relates to a method for receiving Estimation of an assigned to an nth frame Codec parameter.
- the codec parameter is predictive on the transmission side encoded and is received at the receiving end as a function of at least two signals determined by interpolation.
- a The interpolation is supported by the previously decoded Parameters of the (n-1) th frame formed, another Support point is determined by the parameter of the mth frame with m > n formed, which is determined by extrapolative measures has been.
- This indicator size can e.g. B. the "bad frame” indicator BFI.
- Figure 1 is a simulation of a GSM full rate channel transmission with various C / I ratios (carrier-tointerferer ratio), which describe the channel quality, too see.
- C / I ratios carrier-tointerferer ratio
- Curve 1 shows an extrapolation as used in previous decoding methods is used.
- Curves 2 to 5 show the results for the above embodiment depend on of size K, which is the maximum allowed time delay indicates in frame.
Description
Ein Rahmen ist wiederum vielfach in Subrahmen aufgeteilt, so daß manche Parameter einmal pro Rahmen, andere einmal pro Subrahmen übertragen werden.
Im Falle des US-TDMA Enhanced Fullrate (EFR) Sprachcodecs mit 7.4 kbps enthält ein 20 ms-Rahmen 148 bit. Ein Rahmen besteht hier aus vier Subrahmen. Die Parameter sind hier im einzelnen:
- Die 10 Koeffizienten eines Filters, welches die spektrale Einhüllende des Sprachsignals im Bereich des aktuellen Rahmens repräsentiert, werden mit 26 Bit pro Rahmen quantisiert. Diese Koeffizienten werden auch Spektralkoeffizienten oder Spektralparameter genannt.
- Mittels 4x7 bit werden vier Subrahmen eines Anregungssignals für dieses Filter quantisiert.
- Mittels 2x8 bit und 2x5 bit werden vier Werte einer Sprachgrundfrequenz repräsentiert.
- Mittels 4x7 bit werden vier Verstärkungsfaktorpaare pro Rahmen vektorquantisiert.
Sprache wird beispielsweise mittels des LPC-Prinzips (Linear Predictive Coding) codiert. Stimmhafte Laute werden in diesem Falle über eine periodische Folge von Impulsen generiert, stimmlose Laute beispielsweise mittels eines Zufallsrauschens-Generators (Random Noise Generator). Plosivlaute werden mit Hilfe einer Veränderung der Verstärkung, und der Stimmtrakt mit Hilfe eines zeitlich variierenden digitalen Filters simuliert. Die Koeffizienten dieses variierenden digitalen Filters erhält man mit Hilfe der linearen Prädiktion, also einer Vorhersage des folgenden Wertes auf der Basis von vorhergehenden Werten.
Aus Gleichung (1) ist ersichtlich, daß eine derartige Codierung zu einer Datenkompression führt: Der Speicheraufwand für die Differenzwerte X_i, welche die Differenz von beinahe gleich großen Zahlen darstellen, ist geringer als für die Werte von V_i.
Die interpolative Ermittlung des Parameters kann mittels bekannter Interpolationsmaßnahmen, beispielsweise mittels linearer Interpolation zwischen erster und zweiter Größe erfolgen. Bei einer Ausführungsvariante wird zur Interpolation auch eine gewichtete Summation verwendet.
Im weiteren zeigt
- Figur 1
- die Simulationsergebnisse einer GSM-Vollratenkanal-Übertragung, wobei die Ergebnisse verschiedener Extrapolationsmethoden dargestellt sind.
- Der Spektralkoeffizient W_i(n-1) sei bereits decodiert,
- Y_i(n-1) liege entweder empfangen [BFI(n-1)=0] oder nach Gleichung (4) rekonstruiert vor [BFI(n-1)=1].
- Als Resultat des nachfolgend genannten rekursiven Algorithmus' liegen auch Y_i(n), ..., Y_i(n+K-1) vor.
- Der aktuelle Zeitpunkt sei t = n+K, zu diesem Zeitpunkt solle der Spektralkoeffizient W_i(n) bestimmt werden.
Das Vorgehen erfolgt nun in zwei Schritten:
- a) Operationen am Rahmen n+K:
- Falls BFI(n+K) = 0: Berechne W_i(n+K) nach Gleichung (3).
- Falls BFI(n+K) = 1: Berechne eine vorläufige extrapolierte Version W_i(n+K) mit einem beliebigen extrapolativen Verfahren.
Claims (4)
- Verfahren zur empfangsseitigen Schätzung des Wertes eines zeitlich variablen Parameters zu einem n-ten Zeitpunkt,bei dem der Parameter sendeseitig prädiktiv codiert ist und durch diese Codierung ein zum Zeitpunkt n gehörendes quantisiertes Differenzsignal zwischen dem Wert des Parameters zum n-ten Zeitpunkt und dem quantisierten Differenzsignal an dem (n-1)-ten Zeitpunkt gebildet wird, welches übertragen wird,bei dem empfangsseitig ein Indikator vorliegt, der anzeigt, ob für den n-ten Zeitpunkt ein korrekt empfangenes quantisiertes Differenzsignal vorliegt oder nicht,bei dem der Parameter empfangsseitig als Funktion von mindestens zwei Größen durch Interpolation ermittelt wird, falls das zugehörige Differenzsignal nicht korrekt empfangen vorliegt und dabeidie erste Größe eine erste Stützstelle darstellt, welche durch einen Wert des decodierten Parameters gebildet wird, der einem früheren als dem n-ten Zeitpunkt zugeordnet ist, undbei dem die zweite Größe eine weitere Stützstelle der Interpolation darstellt, welche durch einen weiteren Wert des Parameters zu einem m-ten Zeitpunkt, welcher nach dem n-ten Zeitpunkt liegt, gebildet wird und dieser weitere Wert des Parameters durch Extrapolation ermittelt wird.
- Verfahren nach Anspruch 1, bei dem zum n-ten Zeitpunkt gehörende Daten in einem n-ten Rahmen übertragen werden und es sich bei dem zeitlich variablen Parameter um einen Codecparameter handelt.
- Verfahren nach Anspruch 1 oder 2, bei dem das sendeseitige quantisierte Differenzsignal zum (n-1)-ten Zeitpunkt zur Bildung des quantisierten Differenzsignals zum n-ten Zeitpunkt mit einem Prädiktionskoeffizienten gewichtet wird.
- Verfahren nach einem der vorangegangenen Ansprüche, bei dem eine Interpolation durchgeführt wird, sobald die Daten zu nur einem korrekten Rahmen empfangen werden.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10124421A DE10124421C1 (de) | 2001-05-18 | 2001-05-18 | Verfahren zur Schätzung eines Codecparameters |
DE10124421 | 2001-05-18 | ||
PCT/DE2002/001546 WO2002095733A1 (de) | 2001-05-18 | 2002-04-26 | Verfahren zur schätzung eines codecparameters |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1390946A1 EP1390946A1 (de) | 2004-02-25 |
EP1390946B1 true EP1390946B1 (de) | 2004-10-06 |
Family
ID=7685380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP02729881A Expired - Fee Related EP1390946B1 (de) | 2001-05-18 | 2002-04-26 | Verfahren zur schätzung eines codecparameters |
Country Status (5)
Country | Link |
---|---|
US (1) | US20040138878A1 (de) |
EP (1) | EP1390946B1 (de) |
CN (1) | CN1244905C (de) |
DE (2) | DE10124421C1 (de) |
WO (1) | WO2002095733A1 (de) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0301272D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Adaptive voice enhancement for low bit rate audio coding |
CN101542593B (zh) * | 2007-03-12 | 2013-04-17 | 富士通株式会社 | 语音波形内插装置及方法 |
CN103219998B (zh) * | 2013-03-27 | 2016-01-20 | 哈尔滨工业大学 | 一种多通道压缩感知框架下的混合参数估计方法 |
US11582462B1 (en) | 2021-07-14 | 2023-02-14 | Meta Platforms, Inc. | Constraint-modified selection of video encoding configurations |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
US5550543A (en) * | 1994-10-14 | 1996-08-27 | Lucent Technologies Inc. | Frame erasure or packet loss compensation method |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US7117156B1 (en) * | 1999-04-19 | 2006-10-03 | At&T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
-
2001
- 2001-05-18 DE DE10124421A patent/DE10124421C1/de not_active Expired - Fee Related
-
2002
- 2002-04-26 EP EP02729881A patent/EP1390946B1/de not_active Expired - Fee Related
- 2002-04-26 US US10/478,080 patent/US20040138878A1/en not_active Abandoned
- 2002-04-26 CN CNB028101332A patent/CN1244905C/zh not_active Expired - Fee Related
- 2002-04-26 DE DE50201242T patent/DE50201242D1/de not_active Expired - Lifetime
- 2002-04-26 WO PCT/DE2002/001546 patent/WO2002095733A1/de active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
DE50201242D1 (de) | 2004-11-11 |
DE10124421C1 (de) | 2002-10-17 |
WO2002095733A1 (de) | 2002-11-28 |
CN1509468A (zh) | 2004-06-30 |
CN1244905C (zh) | 2006-03-08 |
EP1390946A1 (de) | 2004-02-25 |
US20040138878A1 (en) | 2004-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69915830T2 (de) | Verbesserte verfahren zur rückgewinnung verlorener datenrahmen für ein lpc-basiertes, parametrisches sprachkodierungsystem. | |
DE60125219T2 (de) | Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder | |
DE60121405T2 (de) | Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen | |
DE69727895T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
DE60117144T2 (de) | Sprachübertragungssystem und verfahren zur behandlung verlorener datenrahmen | |
DE60034484T2 (de) | Verfahren und vorrichtung in einem kommunikationssystem | |
DE60006271T2 (de) | Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung | |
DE60220485T2 (de) | Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform | |
DE69634645T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
AT405346B (de) | Verfahren zum herleiten der nachwirkperiode in einem sprachdecodierer bei diskontinuierlicher übertragung, sowie sprachcodierer und sender-empfänger | |
DE60117471T2 (de) | Breitband-signalübertragungssystem | |
DE60132217T2 (de) | Übertragungsfehler-verdeckung in einem audiosignal | |
DE69910058T2 (de) | Verbesserung der periodizität eines breitbandsignals | |
DE602004006211T2 (de) | Verfahren zur Maskierung von Paketverlusten und/oder Rahmenausfall in einem Kommunikationssystem | |
DE602004007786T2 (de) | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate | |
DE60316396T2 (de) | Interoperable Sprachkodierung | |
DE60121201T2 (de) | Verfahren und vorrichtung zur verschleierung von fehlerhaften rahmen während der sprachdekodierung | |
DE60118631T2 (de) | Verfahren zum ersetzen verfälschter audiodaten | |
EP1388147B1 (de) | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals | |
DE69911169T2 (de) | Verfahren zur dekodierung eines audiosignals mit korrektur von übertragungsfehlern | |
EP2245621B1 (de) | Verfahren und mittel zur enkodierung von hintergrundrauschinformationen | |
DE4237563A1 (de) | ||
EP2385521A1 (de) | Steganographie in digitalen Signal-Codierern | |
EP1953739A2 (de) | Verfahren und Vorrichtung zur Geräuschunterdrückung | |
DE60309651T2 (de) | Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20031028 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
RIN1 | Information on inventor provided before grant (corrected) |
Inventor name: GUITARTE PEREZ, JESUS Inventor name: FINGSCHEIDT, TIM |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): DE FR GB |
|
RBV | Designated contracting states (corrected) |
Designated state(s): DE FR GB |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) | ||
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: GERMAN |
|
REF | Corresponds to: |
Ref document number: 50201242 Country of ref document: DE Date of ref document: 20041111 Kind code of ref document: P |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FD4D |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
ET | Fr: translation filed | ||
26N | No opposition filed |
Effective date: 20050707 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20130620 Year of fee payment: 12 Ref country code: GB Payment date: 20130415 Year of fee payment: 12 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20130430 Year of fee payment: 12 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R119 Ref document number: 50201242 Country of ref document: DE |
|
GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 20140426 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: ST Effective date: 20141231 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R119 Ref document number: 50201242 Country of ref document: DE Effective date: 20141101 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20140426 Ref country code: DE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20141101 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20140430 |