EP1388146B1 - Verfahren zur codierung und zur übertragung von sprachsignalen - Google Patents
Verfahren zur codierung und zur übertragung von sprachsignalen Download PDFInfo
- Publication number
- EP1388146B1 EP1388146B1 EP02740316A EP02740316A EP1388146B1 EP 1388146 B1 EP1388146 B1 EP 1388146B1 EP 02740316 A EP02740316 A EP 02740316A EP 02740316 A EP02740316 A EP 02740316A EP 1388146 B1 EP1388146 B1 EP 1388146B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- amplification factor
- adaptive
- signal
- codebook
- fixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000003044 adaptive effect Effects 0.000 claims description 67
- 230000005284 excitation Effects 0.000 claims description 44
- 230000003321 amplification Effects 0.000 claims description 31
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 31
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 description 23
- 230000008901 benefit Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 2
- 241001136792 Alle Species 0.000 description 1
- 206010021703 Indifference Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Definitions
- the invention relates to a method for coding speech signals, in particular with the inclusion of a plurality of codebooks, via the entries of which the speech signal is approximated, and a method for the transmission of speech signals.
- voice coding methods are used to lower the bit rate to be transmitted.
- the speech coding methods usually provide a bit stream of speech coded bits divided into frames each representing, for example, 20 ms of the speech signal.
- the bits within a frame generally represent a particular set of parameters.
- a frame is subdivided into subframes so that some parameters are transmitted once per frame, others once per subframe.
- EFR Enhanced Full Rate
- the entries of a codebook are generally called codewords or codevectors.
- the adaptive codebook is called “adaptive” because the codevectors contained in it do not represent constants or are stored, but are adaptively determined for each subframe from the past of the total excitation signal of the LPC synthesis filter.
- the fixed codebook is "fixed” insofar as its codevectors are either permanently stored (noise excitation) or at least calculated using deterministic calculation rules (algebraic codebook) which are not dependent on the respective subframe are.
- the respective assigned gain factors are usually also referred to as “adaptive” or "fixed”. It should be noted that all 4 types of parameters, adaptive and fixed excitation signal, as well as adaptive and fixed gain, are of course to be determined in each subframe, and in this sense are all "adaptive in nature".
- first amplification factor should be used instead of "adaptive amplification factor” and the term second amplification factor should be used instead of "fixed amplification factor”.
- the excitation signal S ' should after LPC synthesis filtering as closely as possible to the occurring at that time speech section, the speech signal S reflected.
- the parameters g_1, g_2, S_a, S_f are thus selected so that the speech signal S can be represented as well as possible.
- the excitation signal S ' g_1 * S_a + g_2 * S_f thus approximates the speech signal after LPC synthesis filtering on the receiver side.
- Speech signals contain sequences of frames or subframes in which they can be modeled as stationary, ie without temporal development of their statistical properties. These are periodic sections that can represent vowels, for example. This periodicity flows into the entire excitation signal S 'via the contribution g_1 * S_a.
- the statistical properties of a frame or subframe with an onset can not be estimated from past frames or subframes.
- no long-term periodicity can be determined, that is to say the value of a basic speech frequency is completely meaningless and useless.
- the contribution made up of the adaptive gain factor and the adpative codebook entry, which in fact expresses long-term periodicity in the speech signal, is therefore more of a hindrance in onsets than useful for coding the speech signal segment.
- the contribution of an adaptive excitation signal to the total excitation signal in onsets can really harm: If there is no periodicity at all, ie no suitable adaptive excitation signal in the context of the adaptive codebook search, then the optimal adaptive amplification factor is zero.
- g_1 and g_2 are quantized as a pair of numbers (g_1, g_2) by means of another codebook for the gain factors.
- a parallel, interdependent quantization of the parameters is called vector quantization.
- the number pairs (g_1, g_2) are used as an entry in this codebook, through whose entirety, ie number pairs with index 0-127, all possible combinations of g_1 and g_2 occur in the best possible way. These are then conventionally available to a so-called vector quantization.
- an adaptive amplification factor g_1 0
- arbitrary values of the fixed amplification factor g_2 can occur, since with nonperiodic speech segments, as already explained, the adaptive component g_1 * S_a is substantially smaller than the fixed component, thus the excitation signal S 'for the LPC synthesis Filter is determined by the latter and the fixed proportion in this case can not be calculated from past values.
- GSM-EFR GSM Enhanced Full Rate Coder
- a further disadvantage here is that no additional bits are available in order to quantize the fixed excitation or the fixed amplification factor more accurately.
- the bits of the adaptive codebook that is the basic speech frequency, remain unused in the event that the adaptive gain has been set to zero.
- GSM-HR GSM half-rate coder
- a variable-rate multimodal speech coder with gain-matched analysis-by-synthesis discloses a speech coding method in which the input signal is classified into one of four coding modes. In "Unvoiced Mode” the adaptive codebook is not used for the excitation; the bit rate drops accordingly.
- the present invention is therefore based on the object of specifying a method for coding and for transmission, which works memory-saving, efficient and less susceptible to error, in particular complexity and coding-efficient runs and at the same time has a high signal quality after decoding.
- the value of the first amplification factor which is assigned to an adaptive codebook, is set.
- the speech signal is decomposed into individual time segments. These sections may represent, for example, frames or subframes.
- the signal classifier indicates whether there is a stationary or a non-stationary speech section, that is, whether it is a voice onset, for example.
- a value determined by the signal classifier can be assigned to the first amplification factor. For example, by appropriate indexing, this value of the first gain factor can be set such that this representation of the value requires fewer bits than a conventional representation.
- this value of the first gain factor can be set such that this representation of the value requires fewer bits than a conventional representation.
- this method proves to be advantageous if the first gain factor is set to zero.
- the quality of the speech-decoded signal is increased as, for example, as explained above, fewer quantization error signal components occur in the case of non-stationary speech sections.
- the second amplification factor is scalar quantized if the first amplification factor is fixed. For example, then the Resolution of the quantization of the second amplification factor can be increased.
- an extended value range may be permitted for the second gain factor, allowing a more detailed description of such a speech signal portion.
- the coder operates at a fixed data rate, that is, a fixed amount of data is provided for a section of a speech signal.
- a fixed data rate that is, a fixed amount of data is provided for a section of a speech signal.
- the invention relates to a method for transmitting speech signals, which are encoded according to one of claims 1 or 2. It is essential here that the first gain and / or the adaptive codebook entry is not transmitted.
- this method has advantages when the receiver, for example the decoder, is informed by information that this reduction has been made in the data volume to represent individual parameters.
- This information may, for example, occupy a portion of the amount of data not covered by the reduction, or in addition to the amount of data of the frame or subframe.
- FIG. 1 shows the schematic sequence of a speech coding according to the analysis-by-synthesis principle.
- the original speech signal 10 is compared with a synthesized speech signal 11.
- the synthesized speech signal 11 should be such that the deviation between the synthesized speech signal 11 and the original speech signal 10 is minimal. This deviation is optionally weighted spectrally. This is done via a weighting filter W (z).
- the synthesized speech signal is produced by means of an LPC synthesis filter H (z). This synthesis filter is excited via an excitation signal 12. The parameters of this excitation signal 12 (and possibly also the coefficients of the LPC synthesis filter) are ultimately transmitted and should therefore be encoded as efficiently as possible.
- the invention thus aims at the most efficient representation of the parameters which describe the excitation generator.
- FIG. 2 shows the excitation generator without a downstream LPC synthesis filter in detail.
- the excitation signal 12 is composed of an adaptive component, by means of which predominantly periodic speech segments are represented, and a fixed component, which serves to represent non-periodic segments. This has already been explained in detail at the beginning.
- the entries of the adaptive codebook 1 are defined by the preceding speech sections. This is done via a feedback loop 2.
- the first gain factor 3 is determined by the adaptation to the original speech signal 10.
- the fixed codebook 4 contains, as the name implies, entries which are not determined by a preceding period.
- Each entry in the codebook, the so-called codeword, an algebraic codevector, is a pulse sequence which has values not equal to 0 at only a few defined times. This entry or excitation sequence is selected by means of which the deviation of the synthesized signal 11 from the original speech signal 10 is minimized.
- the gain codebook 5 associated with the fixed codebook is set accordingly.
- each of these possible implementations is that a lower number of bits can be transmitted compared to the state-of-the-art.
- these bits can now be used to enhance the quantization of the fixed gain, and / or the quantization of the fixed stimulus, and / or the quantization of the LPC coefficients.
- any remaining codec parameter can potentially benefit from improved quantization.
- no new parameter is provided (ie no second fixed codebook), but instead the improved quantization of already existing parameters. This saves computational complexity, memory requirements, and enables the consideration of specific characteristics of subframes with onsets.
- memory-efficient coding can also be performed.
- a clever embedding of the additional freed bits is briefly outlined below.
- the zeroing of the adaptive excitation is signaled by a reserved word in the adaptive codebook.
- the fixed gain previously 7-bit common with the adaptive Amplification factor vector quantized, for example, quantized scalar scaled with 5 bits at approximately the same quantization error.
- the 5-bit quantized values of the fixed gain could result from a 25% subset of the 7-bit vector codebook, a subset that can be addressed with any 5 bits from the 7-bit.
- Such a realization of the 5-bit scalar quantizer saves additional memory.
- the freed-up 2 bits can now be used, for example, for more accurate quantization of the fixed excitation.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
- Die Erfindung betrifft ein Verfahren zur Codierung von Sprachsignalen, insbesondere unter der Einbeziehung mehrerer Codebücher, über deren Einträge das Sprachsignal approximiert wird, und ein Verfahren zur Übertragung von Sprachsignalen.
- In digitalen Sprachkommunikationssystemen wie dem Festnetz, dem Internet, oder einem digitalen Mobilnetz werden Sprachcodierverfahren eingesetzt, um die zu übertragende Bitrate zu senken. Die Sprachcodierverfahren liefern üblicherweise einen Bitstrom sprachcodierter Bits, der in Rahmen aufgeteilt ist, die jeweils beispielsweise 20 ms des Sprachsignals repräsentieren. Die Bits innerhalb eines Rahmens repräsentieren im allgemeinen einen bestimmten Satz an Parametern. Ein Rahmen wiederum ist vielfach in Subrahmen aufgeteilt, so dass manche Parameter einmal pro Rahmen, andere einmal pro Subrahmen übertragen werden. Als Beispiel sei der US-TDMA Enhanced Fullrate (EFR) Sprachcodec mit 7.4 kbps gegeben, das heißt 148 Bit pro 20 ms-Rahmen. Ein Rahmen besteht hier aus 4 Subrahmen.
- Im folgenden wird anhand dieses Sprachcodierverfahrens exemplarisch die Bedeutung der in sogenannten CELP-Codern (codeexcited linear prediction) auftretenden Parameter vorgestellt:
- 10 Koeffizienten eines sogenannten LPC-Synthese-Filters (linear predictive coding). Sie werden mit 26 Bit/Rahmen quantisiert. Das Filter repräsentiert die spektrale Einhüllende des Sprachsignals im Bereich des aktuellen Rahmens. Das Anregungssignal für dieses Filter setzt sich additiv aus einem mit einem sogenannten "adaptiven Verstärkungsfaktor" g_1 gewichteten sogenannten "adaptiven Anregungssignal" S_a und einem mit einem sogenannten "festen Verstärkungsfaktor" g_2 gewichteten sogenannten "festen Anregungssignal" S_f zusammen.
- Mittels 4x17 Bit werden vier Subrahmen des festen Anregungssignals quantisiert. Die feste Anregung S_f besteht aus einem Eintrag des sogenannten "festen Codebuchs", welcher mit dem festen Verstärkungsfaktor g_2 gewichtet ist. Die Einträge des festen Codebuchs bestehen je aus einer Pulssequenz, die nur zu wenigen Zeitpunkten von Null verschieden ist.
- Mittels 2x8 Bit und 2x5 Bit werden vier Werte einer Sprachgrundfrequenz repräsentiert. Das adaptive Anregungssignal in sogenannten Analyse-durch-Synthese CELP-Codierverfahren bestimmt sich aus dem Anregungssignal des LPC-Synthesefilters, verzögert um eine Periode der Sprachgrundfrequenz. Alle möglichen quantisierten Sprachgrundfrequenzen konstituieren das sogenannte "adaptive Codebuch", das die entsprechend verschobenen Anregungssignale enthält.
- Mittels 4x7 Bit werden vier Verstärkungsfaktorpaare pro Rahmen vektorquantisiert. Der "adaptive Verstärkungsfaktor" wird auf das adaptive Anregungssignal angewandt, der "feste Verstärkungsfaktor" wird auf das feste Anregungssignal angewandt. Das Gesamtanregungssignal des LPC-Synthese-Filters setzt sich dann, wie oben bereits erwähnt, additiv aus den gewichteten adaptiven und festen Anregungssignalen zusammen.
- Die Einträge eines Codebuches werden allgemein Codewörter oder Codevektoren genannt.
- Das adaptive Codebuch nennt sich "adaptiv", weil die in ihm enthaltenen Codevektoren keine Konstanten darstellen oder gar abgespeichert vorliegen, sondern sie werden für jeden Subrahmen adaptiv aus der Vergangenheit des Gesamtanregungssignals des LPC-Synthesefilters bestimmt. Das feste Codebuch ist insofern "fest", als seine Codevektoren entweder fest abgespeichert vorliegen (Rauschanregung) oder zumindest über determinierte Rechenvorschriften errechnet werden (algebraisches Codebuch), die nicht abhängig von dem jeweiligen Subrahmen sind. Die jeweils zugeordneten Verstärkungsfaktoren werden üblicherweise auch als "adaptiv" beziehungsweise "fest" bezeichnet. Es ist anzumerken, dass alle 4 Parametertypen, adaptives und festes Anregungssignal, sowie adaptiver und fester Verstärkungsfaktor, selbstverständlich in jedem Subrahmen zu bestimmen sind, und in diesem Sinne alle "adaptiver Natur" sind. Im weiteren soll jedoch an der zuvor eingeführten Terminologie - die auch in der Literatur üblich ist - festgehalten werden beziehungsweise anstelle von "adaptiver Verstärkungsfaktor" der Begriff "erster Verstärkungsfaktor" und anstelle von "fester Verstärkungsfaktor" der Begriff zweiter Verstärkungsfaktor verwendet werden.
- Das Anregungssignal S' soll nach einer LPC-Synthese-Filterung möglichst genau den zu dieser Zeit auftretenden Sprachabschnitt, das Sprachsignal S, widerspiegeln.
- Die Parameter g_1, g_2, S_a, S_f werden also so gewählt, dass damit das Sprachsignal S möglichst gut dargestellt werden kann.
- Das Anregungssignal S' = g_1 * S_a + g_2 * S_f approximiert somit nach LPC-Synthese-Filterungauf der Empfängerseite das Sprachsignal.
- Der Beitrag der einzelnen Summanden g_1 * S_a beziehungsweise g_2 * S_f zum gesamten Anregungssignal S' variiert in Abhängigkeit von den sprachlichen Besonderheiten des Sprachsignalabschnittes.
- Sprachsignale enthalten Folgen von Rahmen oder Subrahmen, in denen sie als stationär, also ohne zeitliche Entwicklung ihrer statistischen Eigenschaften modelliert werden können. Hierbei handelt es sich um periodische Abschnitte, die beispielsweise Vokale darstellen können. Diese Periodizität fließt über den Beitrag g_1 *S_a in das gesamte Anregungssignal S' ein.
- Es gibt jedoch auch zutiefst nicht-stationäre Sprachsignalabschnitte, wie beispielsweise sogenannte "Onsets" beziehungsweise "Sprach-Onsets". Hierbei handelt es sich etwa um Plosivlaute am Anfang eines Wortes. In diesem Fall stellt der Summand g_2 * S_f den dominanten Beitrag zum Anregungssignal S' dar.
- Die statistischen Eigenschaften eines Rahmens oder Subrahmens mit einem Onset lassen sich in der Regel nicht aus zurückliegenden Rahmen oder Subrahmen schätzen. Bei einem Onset ist insbesondere keine Langzeitperiodizität festzustellen, das heißt der Wert einer Sprachgrundfrequenz ist völlig aussage- und nutzlos. Der sich aus adaptivem Verstärkungsfaktor und Eintrag des adpativen Codebuchs zusammensetzende Beitrag, der ja eine Langzeitperiodizität im Sprachsignal zum Ausdruck bringt, ist demnach bei Onsets eher hinderlich als nützlich zur Codierung des Sprachsignalabschnittes. Der Beitrag eines adaptiven Anregungssignals zum Gesamtanregungssignal bei Onsets kann regelrecht schaden: Findet sich überhaupt keine Periodizität, das heißt kein geeignetes adaptives Anregungssignal im Rahmen der adaptiven Codebuchsuche, so ergibt sich der optimale adaptive Verstärkungsfaktor zu Null.
- Oftmals werden nun adaptiver und fester Verstärkungsfaktor g_1 und g_2 als Zahlenpaar (g_1,g_2) mittels eines weiteren Codebuches für die Verstärkungsfaktoren quantisiert. In diesem Fall einer parallelen, voneinander abhängigen Quantisierung der Parameter spricht man von Vektorquantisierung. Dieses Codebuch hat natürlich nur eine beschränkte Größe, typischerweise 7 Bits, wodurch sich also 27 =128 Einträge realisieren lassen, deren Indizes beispielsweise von 0 bis 127 laufen.
- Es werden an den Empfänger nur die Indizes übertragen, wodurch sich im Vergleich zur herkömmlichen Übertragung nach skalarer Quantisierung von g_1 und g_2 separat eine Datenkompression ergibt. Unter skalarer Quantisierung wird eine individuelle, voneinander unabhängige Quantisierung der Parameter verstanden. Die Anzahl der Einträge in diesem Codebuch ist wie oben bereits gesagt, begrenzt.
- Daher werden als Eintrag in dieses Codebuch diejenigen Zahlenpaare (g_1, g_2) verwendet, durch deren Gesamtheit, also Zahlenpaare mit Index 0-127, sich alle möglichen auftretenden Kombinationen von g_1 und g_2 bestmöglich darstellen lassen. Diese stehen dann herkömmlicherweise einer sogenannten Vektorquantisierung zur Verfügung. Bei einem adaptiven Verstärkungsfaktor g_1 = 0 können prinzipiell beliebige Werte des festen Verstärkungsfaktors g_2 auftreten, da bei nichtperiodischen Sprachabschnitten wie bereits dargelegt, eben der adaptive Anteil g_1 * S_a wesentlich kleiner ist als der feste Anteil, somit das Anregungssignal S' für das LPC-Synthese-Filter durch letzteren bestimmt wird und der feste Anteil in diesem Fall nicht aus in der Vergangenheit liegenden Werten berechnet werden kann.
- Um also auch in diesem Fall g_1 = 0 eine optimale Anpassung des Anregungssignales S' nach LPC-Synthesefilterung über eine Anpassung der Parameter g_1, g_2, S_1, S_2 an das ursprüngliche Sprachsignal S vornehmen zu können, müßten sehr viele Wertepaare
(g_1 = 0, g_2) in das Codebuch aufgenommen werden, was natürlich aus Speicherplatzgründen nicht möglich ist. - Insofern erhält man bei einer Anpassung der Parameter im Falle g_1 = 0 zumeist einen nicht gut passenden Wert für g_2. Das führt zu unerwünschten Signalanteilen im gesamten Anregungssignal S' nach der Quantisierung.
- Die meisten konventionell verwendeten Sprachcodierer lösen dieses Problem überhaupt nicht.
- Manche Sprachcodierer, so zum Beispiel der GSM Enhanced-Fullrate-Coder (GSM-EFR), führen eine Skalarquantisierung der Verstärkungsfaktoren durch. Das heißt in diesem Falle, dass der adaptive Verstärkungsfaktor mit 4 Bit pro Subrahmen und der feste Verstärkungsfaktor mit 5 Bit pro Subrahmen individuell und unabhängig voneinander quantisiert werden. Das hat den Vorteil, dass bei bestimmten nicht-stationären Sprachabschnitten, beispielsweise bei den Onsets, der adaptive Verstärkungsfaktor leicht zu Null quantisiert werden kann, und der feste Verstärkungsfaktor einen davon unabhängigen Wert nach Quantisierung annehmen kann. Es hat aber gegenüber der Vektorquantisierung den Nachteil geringerer Codiereffizienz: Im GSM-EFR-Coder benötigt man 4+5 = 9 Bit für die Verstärkungsfaktoren, bei einer Vektorquantisierung reichen 7 Bit aus.
- Ein weiterer Nachteil hier ist auch, dass keine zusätzlichen Bits zur Verfügung stehen, um die feste Anregung beziehungsweise den festen Verstärkungsfaktor entsprechend genauer zu quantisieren. Die Bits des adaptiven Codebuchs, das heißt der Sprachgrundfrequenz, bleiben im Falle, dass der adaptive Verstärkungsfaktor zu Null gewählt wurde, ungenutzt.
- Der GSM-Halfrate-Coder (GSM-HR) arbeitet demgegenüber in mehreren Modi. Ein Modus sieht vor, dass in bestimmten Subrahmen, beispielsweise solchen, die Onsets darstellen, das adaptive Codebuch durch ein zweites festes Codebuch ersetzt wird. Das löst zwar in gewisser Weise das Problem, erfordert aber eine relativ hohe Komplexität und auch Speicherbedarf für das zweite Codebuch. Auch steigt die Anfälligkeit gegenüber Bitfehlern bei der Übertragung, da modusabhängig ein völlig neuer Codecparameter genutzt wird. Überdies muss bei dem GSM-HR-Codec die Abschaltung des adaptiven Codebuchs explizit über Modusbits signalisiert werden. Der Artikel "A variable-rate multimodal speech coder with gain-matched analysis-by-synthesis" (Paksoy E et al, ICASSP 1997) offenbart ein Sprachkodierverfahren, bei dem das Eingangssignal in einen von vier Kodierungsmodi klassifiziert wird. Im "Unvoiced Mode" wird das adaptive Kodebuch nicht für die Anregung verwendet; die Bitrate sinkt entsprechend.
- Der vorliegenden Erfindung liegt also die Aufgabe zugrunde, ein Verfahren zur Codierung und zur Übertragung anzugeben, das speicherplatz-sparend, effizient und wenig fehleranfällig arbeitet, insbesondere komplexitäts- und codier-effizient abläuft und zugleich eine hohe Signalqualität nach der Decodierung aufweist.
- Diese Aufgabe wird durch den unabhängigen Anspruch 1 gelöst, Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.
- Erfindungsgemäß wird bei bestimmten Werten eines Signalklassifikators der Wert des ersten Verstärkungsfaktors, welcher einem adaptiven Codebuch zugeordnet ist, festgesetzt.
- Dadurch lässt sich eine Reduktion der Datenmenge erreichen, die zur Darstellung der Gesamtheit von erstem Verstärkungsfaktor und adaptiven Codebucheintrag benötigt wird.
- Das Sprachsignal wird in einzelne Zeitabschnitte zerlegt. Diese Abschnitte können beispielsweise Rahmen (Frames) oder Sub-Rahmen (Sub-Frames) darstellen.
- Der Signalklassifikator sagt beispielsweise aus, ob ein stationärer oder ein nicht-stationärer Sprachabschnitt vorliegt, also ob es sich etwa um einen Sprach-Onset handelt.
- Liegt nun ein derartiger Fall vor, so kann dem ersten Verstärkungsfaktor ein durch den Signalklassifikator festgelegter Wert zugeordnet werden. Beispielsweise durch entsprechende Indizierung kann dieser Wert des ersten Verstärkungsfaktors derart festgelegt werden, daß diese Darstellung des Wertes weniger Bits benötigt als eine herkömmliche Darstellung. Ebenso ist es natürlich alternativ, optional oder zusätzlich möglich, eine Kompression zu erzielen, indem, wenn der erste Verstärkungsfaktor festgelegt wird, die Darstellung des Eintrags des adaptiven Codebuchs komprimiert wird. Somit ergibt sich eine im Vergleich zum Stand der Technik codiereffiziente Darstellung zumindest eines Parameters, der im Zuge der Sprachcodierung auftritt.
- Insbesondere erweist sich dieses Verfahren als vorteilhaft, wenn der erste Verstärkungsfaktor auf Null festgesetzt wird. Dadurch wird die Qualität des sprach-decodierten Signals erhöht, da, wie eingangs dargelegt, beispielsweise weniger Quantisierungsfehlersignalanteile bei nicht-stationären Sprachabschnitten auftreten.
- Erfindungsgemäß ist der zweite Verstärkungsfaktor skalar quantisiert, falls der erste Verstärkungsfaktor festgesetzt ist. Beispielsweise kann dann die Auflösung der Quantisierung des zweiten Verstärkungsfaktors erhöht werden.
- Somit kann beispielsweise im Falle von Sprach-Onsets, die durch den festen Anteil der Anregung g_2 * S_f dargestellt werden, ein erweiterter Wertebereich für den zweiten Verstärkungsfaktor zugelassen werden, was eine genauere Beschreibung eines derartigen Sprachsignalabschnittes ermöglicht.
- Efindungsgemäß ist es vorgesehen, daß der Codierer mit einer festen Datenrate arbeitet, das heisst, für einen Abschnitt eines Sprachsignals ist eine feste Datenmenge vorgesehen. Die erzielte Reduktion der Datenmenge zur Darstellung des ersten Verstärkungsfaktors und alternativ oder optional des adaptiven Codebuch-Eintrages, kann dahingehend ausgenutzt werden, daß der nun nicht mit Daten belegte Anteil der Datenmenge zur Darstellung anderer Parameter verwendet wird, welche bei der Sprachcodierung auftreten.
- Desweiteren betrifft die Erfindung ein Verfahren zur Übertragung von Sprachsignalen, die gemäß einem der Ansprüche 1 oder 2 codiert sind. Wesentlich ist hierbei,
daß der erste Verstärkungsfaktor oder/und der adaptive Codebuch-Eintrag nicht übertragen wird. - Insbesondere weist dieses Verfahren Vorteile auf, wenn dem Empfänger, beispielsweise dem Decodierer, durch eine Information angezeigt wird, daß diese Reduktion in der Datenmenge zur Darstellung einzelner Parameter vorgenommen wurde.
- Diese Information kann beispielsweise einen Anteil des durch die Reduktion nicht mit Daten belegten Datenmenge belegen oder auch zusätzlich zu der Datenmenge des Rahmens oder SubRahmens gesendet werden.
- Im folgenden wird die Erfindung anhand einiger Ausführungsbeispiele erläutert, die teilweise durch Figuren erläutert werden.
- Es zeigen
- Figur 1
- einen Überblick über das Analyse-durch-Synthese-Prinzip in der Sprachcodierung,
- Figur 2
- die Verwendung von adaptivem und festem Codebuch mit den zughörigen Verstärkungsfaktoren.
- Figur 1 zeigt den schematischen Ablauf einer Sprachcodierung nach dem Analyse-durch-Synthese-Prinzip.
- Im wesentlichen wird das originäre Sprachsignal 10 mit einem synthetisierten Sprachsignal 11 verglichen. Das synthetisierte Sprachsignal 11 soll derart sein, daß die Abweichung zwischen dem synthetisierten Sprachsignal 11 und dem originären Sprachsignal 10 minimal ist. Diese Abweichung wird gegebenenfalls noch spektral gewichtet. Dies geschieht über ein Wichtungsfilter W(z). Das synthetisierte Sprachsignal wird mit Hilfe eines LPC-Synthesefilters H(z) hergestellt. Dieses Synthesefilter wird über ein Anregungssignal 12 angeregt. Die Parameter dieses Anregungssignales 12 (und gegebenenfalls auch die Koeffizienten des LPC-Synthesefilters) werden letztlich übertragen und sollten daher möglichst effizient codiert sein.
- Die Erfindung zielt also auf eine möglichst effiziente Darstellung der Parameter ab, welche den Anregungsgenerator beschreiben.
- In Figur 2 ist der Anregungsgenerator ohne nachgeschaltetem LPC-Synthese-Filter im Detail zu sehen.
- Das Anregungssignal 12 setzt sich zusammen aus einem adaptiven Anteil, mittels dem überwiegend periodische Sprachabschnitte dargestellt werden und einem festen Anteil, der zur Darstellung nichtperiodischer Abschnitte dient. Dies wurde im einzelnen bereits eingangs dargelegt. Zur Darstellung des adaptiven Anteils dient das adaptive Codebuch 1, dessen Einträge mit einem ersten Verstärkungsfaktor 3 gewichtet werden.
- Die Einträge des adaptiven Codebuchs 1 sind durch die vorhergehenden Sprachabschnitte festgelegt. Dies geschieht über eine Rückkoppelschleife 2. Der erste Verstärkungsfaktor 3 wird durch die Anpassung an das originäre Sprachsignal 10 bestimmt. Das feste Codebuch 4 enthält, wie der Name schon sagt, Einträge, welche nicht von einem vorhergehenden Zeitabschnitt bestimmt sind. Jeder Eintrag im Codebuch, das sogenannte Codewort, ein algebraischer Codevektor, ist eine Pulssequenz, die nur zu wenigen, definierten Zeitpunkten Werte ungleich 0 aufweist. Es wird dieser Eintrag oder Anregungssequenz gewählt, mittels der die Abweichung des synthetisierten Signals 11 zum originären Sprachsignal 10 minimiert wird. Der dem festen Codebuch zugeordnete Verstärkungsfaktor 5 wird dementsprechend festgelegt.
- Zunächst ist vorgesehen, dass für jeden Rahmen ein sogenannter Signalklassifikator berechnet wird. Dieser Signalklassifikator kann beispielsweise eine binäre Entscheidung liefern, ob das adaptive Codebuch genutzt werden soll oder nicht. Zu diesem Zweck kann es sich um einen Onset-Erkenner handeln. Es ist vorgesehen, dass in Abhängigkeit von dem Klassifikator der adaptive Verstärkungsfaktor zu Null gesetzt wird, das heißt die adaptive Anregung nicht in das Gesamtanregungssignal des LPC-Synthesefilters eingeht. Es ist darüber hinaus vorgesehen, dass zumindest ein Parameter nicht mehr übertragen wird. Hierfür gibt es mehrere sinnvolle Alternativen:
- Wird beispielsweise der Wert 0 für den adaptiven Verstärkungsfaktor übertragen, so muss der adaptive Codebucheintrag (das heißt die Sprachgrundfrequenz) nicht mehr übertragen werden, da er ja auf Empfangsseite eh mit einer Null multipliziert würde.
- Wird beispielsweise das Nullsetzen der adaptiven Anregung dem Decoder durch ein reserviertes Wort des adaptiven Codebuchs (das heißt der Sprachgrundfrequenz) signalisiert, so braucht der adaptive Verstärkungsfaktor nicht mehr übertragen zu werden. Im Falle einer Vektorquantisierung von adaptivem und festem Verstärkungsfaktor könnte der feste Verstärkungsfaktor beispielsweise skalar quantisiert werden.
- Wird der Klassifikator durch ein explizites Bit übertragen, so kann im Falle eines Onsets sogar auf die Übertragung von adaptivem Codebucheintrag (Sprachgrundfrequenz) und adaptivem Verstärkungsfaktor verzichtet werden.
- Vorteil jeder dieser möglichen Realisierungen ist, dass im Vergleich zur State-of-the-Art eine geringere Zahl an Bits übertragen werden kann. Bei Codierverfahren mit fester Bitrate können diese Bits nun genutzt werden, um die Quantisierung des festen Verstärkungsfaktors, und/oder die Quantisierung der festen Anregung, und/oder die Quantisierung der LPC-Koeffizienten zu verbessern. Im allgemeinen kann jeder verbleibende Codec-Parameter potentiell von einer verbesserten Quantisierung profitieren. Im Gegensatz zum GSM-HR-Coder ist kein neuer Parameter vorgesehen (das heißt kein zweites festes Codebuch), stattdessen aber die verbesserte Quantisierung bereits vorhandener Parameter. Dies spart Rechenkomplexität, Speicherbedarf, und ermöglicht die Berücksichtigung spezifischer Eigenarten von Subrahmen mit Onsets. Durch geschickte Einbettung der zusätzlich nutzbaren Bits in die Quantisierungstabellen anderer Codecparameter kann zudem speichereffizient codiert werden.
- Zusammenfassend lässt sich sagen, daß durch das Nullsetzen der adaptiven Anregung im Falle eines Onsets, und durch Nutzung freiwerdender Bits der adaptiven Anregung beziehungsweisedes adaptiven Verstärkungsfaktors eine verbesserte Quantisierung verbleibender Codec-Parameter erzielt werden kann.
- Eine geschickte Einbettung der zusätzlich freiwerdenden Bits soll im Folgenden kurz skizziert werden. Angenommen, das Nullsetzen der adaptiven Anregung wird durch ein reserviertes Wort im adaptiven Codebuch signalisiert. Dann kann der feste Verstärkungsfaktor, der zuvor mit 7 Bit gemeinsam mit dem adaptiven Verstärkungsfaktor vektor-quantisiert wurde, bei in etwa gleichem Quantisierungsfehler beispielsweise skalar mit 5 Bit quantisiert werden. Die mit 5 Bit quantisierten Werte des festen Verstärkungsfaktors könnten sich aus einer 25%-Untermenge des 7 Bit-Vektorcodebuchs ergeben, und zwar eine mit beliebigen 5 Bit aus den 7 Bit adressierbare Untermenge. Eine solche Realisierung des 5 Bit Skalarquantisierers spart zusätzlichen Speicher. Die freiwerdenden 2 Bit können nun beispielsweise zur genaueren Quantisierung der festen Anregung genutzt werden.
- Neben den hier aufgeführten Beispielen liegt eine Vielzahl weiterer Ausführungsvarianten im Rahmen der durch die Patentansprüche definierten Erfindung, die von einem Fachmann anhand der Ausführungen ohne großen Aufwand in die Praxis umgesetzt werden können.
Claims (4)
- Verfahren zur Codierung von Sprachsignalen,- bei dem das Sprachsignal (10) in Sprachsignalabschnitte zerlegt wird und mit einem mittels eines Anregungssignals (12) eines Synthesefilters synthetisierten Sprachsignal (11) verglichen wird,- bei dem sich das Anregungssignal (12) für das Synthesefilter zumindest mittels eines Eintrags eines festen Codebuchs (4) und eines dem festen Codebuch (4) zugeordneten zweiten Verstärkungsfaktors (5), und optional mittels eines Eintrags eines adaptiven Codebuchs (1) und einem dem adaptiven Codebuch (1) zugehörigen ersten Verstärkungsfaktor (3) zusammensetzen läßt,- bei dem der Sprachsignalabschnitt hinsichtlich sprachlicher Besonderheiten durch einen Signalklassifikator klassifiziert wird,- bei dem in Abhängigkeit vom Signalklassifikator der Wert des ersten Verstärkungsfaktors (3) festgesetzt wird, wodurch die zur Darstellung der Gesamtheit von adaptivem Codebucheintrag und erstem Verstärkungsfaktor (3) benötigte Datenmenge reduziert wird,- bei dem der zweite Verstärkungsfaktor (5) skalar quantisiert wird, dadurch gekennzeichnet, daß für einen Sprachsignalabsehnitt eine vorher festgelegte Datenmenge reserviert ist und aufgrund der Reduzierung der Datenmenge zur Darstellung der Gesamtheit von erstem Verstarkungsfaktor (3) und dem Eintrag des adaptiven Codebuchs (1) zumindest ein anderer Parameter, welcher bei der Sprachcodierung auftritt, einen größeren Teil der vorher festgelegten Datenmenge beansprucht.
- Verfahren nach Anspruch 1, bei dem der erste Verstärkungsfaktor auf Null festgesetzt wird.
- Verfahren zur Übertragung von Sprachsignalen, umfassend -Codierung nach einem der Ansprüche 1 oder 2, und -Übertragung, wobei der adaptive Codebucheintrag oder/und der erste Verstärkungsfaktor nicht übertragen wird.
- Verfahren nach Anspruch 3, bei dem einem Empfänger durch eine dafür reservierte Information angezeigt wird, daß der erste Verstärkungsfaktor auf einen dem Empfänger bekannten Wert gesetzt ist.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10124420 | 2001-05-18 | ||
DE10124420A DE10124420C1 (de) | 2001-05-18 | 2001-05-18 | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
PCT/DE2002/001598 WO2002095734A2 (de) | 2001-05-18 | 2002-05-02 | Verfahren zur steuerung des verstärkungsfaktors eines prädiktiven sprachkodieres |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1388146A2 EP1388146A2 (de) | 2004-02-11 |
EP1388146B1 true EP1388146B1 (de) | 2007-11-28 |
Family
ID=7685379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP02740316A Expired - Fee Related EP1388146B1 (de) | 2001-05-18 | 2002-05-02 | Verfahren zur codierung und zur übertragung von sprachsignalen |
Country Status (5)
Country | Link |
---|---|
US (1) | US20040148162A1 (de) |
EP (1) | EP1388146B1 (de) |
CN (1) | CN100508027C (de) |
DE (2) | DE10124420C1 (de) |
WO (1) | WO2002095734A2 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2486610C2 (ru) * | 2008-12-31 | 2013-06-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ кодирования сигнала и способ декодирования сигнала |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102005000828A1 (de) * | 2005-01-05 | 2006-07-13 | Siemens Ag | Verfahren zum Codieren eines analogen Signals |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
DK2102619T3 (en) * | 2006-10-24 | 2017-05-15 | Voiceage Corp | METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101286319B (zh) * | 2006-12-26 | 2013-05-01 | 华为技术有限公司 | 改进语音丢包修补质量的语音编码方法 |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
PL2951820T3 (pl) * | 2013-01-29 | 2017-06-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób wyboru jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania |
EP3058568B1 (de) | 2013-10-18 | 2021-01-13 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Konzept zur codierung eines audiosignals und zur decodierung eines audiosignals mit sprachbezogenen spektralformungsinformationen |
SG11201603041YA (en) | 2013-10-18 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2312360A (en) * | 1996-04-12 | 1997-10-22 | Olympus Optical Co | Voice Signal Coding Apparatus |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5657418A (en) * | 1991-09-05 | 1997-08-12 | Motorola, Inc. | Provision of speech coder gain information using multiple coding modes |
SE504397C2 (sv) * | 1995-05-03 | 1997-01-27 | Ericsson Telefon Ab L M | Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US6330531B1 (en) * | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Comb codebook structure |
US6192335B1 (en) * | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
WO2000060579A1 (en) * | 1999-04-05 | 2000-10-12 | Hughes Electronics Corporation | A frequency domain interpolative speech codec system |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US6510407B1 (en) * | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
-
2001
- 2001-05-18 DE DE10124420A patent/DE10124420C1/de not_active Expired - Fee Related
-
2002
- 2002-05-02 EP EP02740316A patent/EP1388146B1/de not_active Expired - Fee Related
- 2002-05-02 WO PCT/DE2002/001598 patent/WO2002095734A2/de active IP Right Grant
- 2002-05-02 DE DE50211294T patent/DE50211294D1/de not_active Expired - Lifetime
- 2002-05-02 CN CN02814429.5A patent/CN100508027C/zh not_active Expired - Fee Related
- 2002-05-02 US US10/478,142 patent/US20040148162A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2312360A (en) * | 1996-04-12 | 1997-10-22 | Olympus Optical Co | Voice Signal Coding Apparatus |
Non-Patent Citations (1)
Title |
---|
PAKSOY E.; MCCREE A.; VISWANATHAN V.: "A VARIABLE-RATE MULTIMODAL SPEECH CODER WITH GAIN-MATCHED ANALYSIS-SYNTHESIS", IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING.SPEECH PROCESSING. MUNICH, APR. 21 - 24, 1997, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 21 April 1997 (1997-04-21), pages 751 - 754, XP000822556 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2486610C2 (ru) * | 2008-12-31 | 2013-06-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ кодирования сигнала и способ декодирования сигнала |
US8712763B2 (en) | 2008-12-31 | 2014-04-29 | Huawei Technologies Co., Ltd | Method for encoding signal, and method for decoding signal |
Also Published As
Publication number | Publication date |
---|---|
WO2002095734A3 (de) | 2003-11-20 |
US20040148162A1 (en) | 2004-07-29 |
WO2002095734A2 (de) | 2002-11-28 |
DE50211294D1 (de) | 2008-01-10 |
EP1388146A2 (de) | 2004-02-11 |
CN1533564A (zh) | 2004-09-29 |
DE10124420C1 (de) | 2002-11-28 |
CN100508027C (zh) | 2009-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69926821T2 (de) | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen | |
DE60201766T2 (de) | Verbesserung der Periodizität der CELP-Anregung für die Sprachkodierung und -dekodierung | |
DE602004007786T2 (de) | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate | |
DE60006271T2 (de) | Celp sprachkodierung mit variabler bitrate mittels phonetischer klassifizierung | |
DE19604273C5 (de) | Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit | |
DE69837822T2 (de) | Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen | |
DE69836624T2 (de) | Audiokodierer und -dekodierer | |
DE69133458T2 (de) | Verfahren zur Sprachquantisierung und Fehlerkorrektur | |
DE602004006211T2 (de) | Verfahren zur Maskierung von Paketverlusten und/oder Rahmenausfall in einem Kommunikationssystem | |
EP1388146B1 (de) | Verfahren zur codierung und zur übertragung von sprachsignalen | |
DE69033510T3 (de) | Numerischer sprachcodierer mit verbesserter langzeitvorhersage durch subabtastauflösung | |
DE69820362T2 (de) | Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen | |
DE60309651T2 (de) | Verfahren zur Sprachkodierung mittels verallgemeinerter Analyse durch Synthese und Sprachkodierer zur Durchführung dieses Verfahrens | |
EP1080464B1 (de) | Verfahren und anordnung zur sprachcodierung | |
DE69827313T2 (de) | Verfahren zur Kodierung des Zufallskomponenten-Vektors in einem ACELP-Kodierer | |
DE60016305T2 (de) | Verfahren zum Betrieb eines Sprachkodierers | |
DE60109111T2 (de) | Sprachdekoder zum hochqualitativen Dekodieren von Signalen mit Hintergrundrauschen | |
DE69821895T2 (de) | Verfahren zur Sprachkodierung und -dekodierung | |
DE69630177T2 (de) | Sprachkodierer mit der Fähigkeit zur wesentlichen Vergrösserung der Codebuchgrösse ohne aber die Zahl der übertragenen Bits zu vergrössern | |
DE69922388T2 (de) | Linear-prädiktives Analyse-durch-Synthese-Kodierverfahren und Kodierer | |
DE4315313C2 (de) | Vektorcodierverfahren insbesondere für Sprachsignale | |
DE19641619C1 (de) | Verfahren zur Synthese eines Rahmens eines Sprachsignals | |
EP0697125B1 (de) | Verfahren zur vektorquantisierung, insbesondere von sprachsignalen | |
EP1119846B1 (de) | Verfahren zur codierung oder decodierung von sprachsignalabtastwerten sowie coder bzw. decoder | |
DE60021455T2 (de) | Multimodale Quantisierung des Prädiktionsfehlers in einem Sprachkodierer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20031112 |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
AX | Request for extension of the european patent |
Extension state: AL LT LV MK RO SI |
|
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): DE FR GB |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) |
Effective date: 20071128 |
|
REF | Corresponds to: |
Ref document number: 50211294 Country of ref document: DE Date of ref document: 20080110 Kind code of ref document: P |
|
ET | Fr: translation filed | ||
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20080829 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 15 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 16 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 17 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20190517 Year of fee payment: 18 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20190719 Year of fee payment: 18 Ref country code: GB Payment date: 20190509 Year of fee payment: 18 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R119 Ref document number: 50211294 Country of ref document: DE |
|
GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 20200502 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200502 Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20200531 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20201201 |