EP1145227B1 - Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal - Google Patents
Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal Download PDFInfo
- Publication number
- EP1145227B1 EP1145227B1 EP00926896A EP00926896A EP1145227B1 EP 1145227 B1 EP1145227 B1 EP 1145227B1 EP 00926896 A EP00926896 A EP 00926896A EP 00926896 A EP00926896 A EP 00926896A EP 1145227 B1 EP1145227 B1 EP 1145227B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- sub
- spectral
- spectral coefficients
- band
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000003595 spectral effect Effects 0.000 claims abstract description 216
- 230000002123 temporal effect Effects 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 8
- 230000001131 transforming effect Effects 0.000 claims abstract 18
- 230000002441 reversible effect Effects 0.000 claims description 14
- 238000006467 substitution reaction Methods 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 abstract description 11
- 230000009466 transformation Effects 0.000 description 42
- 238000001228 spectrum Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 238000000844 transformation Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 231100000567 intoxicating Toxicity 0.000 description 1
- 230000002673 intoxicating effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Definitions
- the present invention relates to coding or Decoding audio signals and in particular on obfuscation of errors ("Error Concealment”) in digital encoded audio signals.
- Muting method also known as "muting" becomes.
- a decoder detects that data is missing or incorrect the playback is switched off.
- the Missing data are thus replaced by a zero signal. This avoids that due to a transmission error too loud or unpleasant noises from a decoder become. This is due to psychoacoustic effects sudden drop and rise in signal energy when the decoder outputs error-free data again, but as felt uncomfortable.
- Spectral values in a block are incorrect, so can these spectral values based on the spectral values of a previous blocks or several previous blocks predicted, d. H. be predicted or estimated.
- the predicted spectral values correspond within certain limits the incorrect spectral values when the audio signal is relative is stationary, d. H. if the audio signal is not like that undergoes rapid changes in the signal envelope.
- a according to the MPEG-AAC standard ISO / IEC 13818-7 MPEG-2 Advanced Audio Coding
- spectral value Prediction will therefore be 1024 in parallel working predictors in the decoder needed to e.g. B. in In the event of a complete block failure ("frame loss") to be able to predict all spectral values.
- a disadvantage of this method is the relatively high computing effort, which is currently receiving real-time decoding of a Multimedia or audio data signal impossible.
- MDCT modified discrete cosine transformation
- DE 40 34 017 A1 relates to a method for recognition errors in the transmission of frequency-coded digital signals.
- the frequency coefficient previous and possibly future blocks an error function formed on the basis of which the occurrence of an error is determined. An incorrect frequency coefficient will no longer used for the evaluation of subsequent blocks.
- DE 197 35 675 A1 discloses a method for concealing errors in an audio data stream. For this, the spectral energy of a subset of intact audio data calculated. After creating a template for replacement data based on those calculated for the subset of the intact audio data spectral energy will be substitute data for faulty or non-existent audio data belonging to the subgroup correspond, generated based on the template.
- the object of the present invention is a precise and flexible error concealment for audio signals to create that implemented with limited computational effort can be.
- This task is accomplished by a method of disguising a Fault according to claim 1 and a device for Disguising an error according to claim 12 solved.
- Another object of the present invention is a robust and flexible decoding of audio signals to accomplish.
- This task is accomplished by a method for decoding a encoded audio signal according to claim 10 and by a Device for decoding an encoded audio signal according to Claim 13 solved.
- the present invention is based on the finding that that the disadvantages of the spectral-value prediction, which in the dependence on the transformation algorithm used and depending on the window shape and block length exist, can be avoided that for Error concealment a prediction is used, which in "Quasi" time range works.
- a set of spectral values preferably a long block or one Corresponds to the number of short blocks, divided into subbands.
- a subband of the current set of spectral coefficients can then undergo a backward transformation to obtain a time signal that corresponds to the spectral coefficient of the subband.
- For generation of estimates for a subsequent set of spectral coefficients is a prediction based on the Time signal of this subband performed.
- this prediction is in the quasi-time range takes place because the temporal signal on which Basis of which the prediction is made, only that Time signal of a subband of the encoded audio signal and not the time signal of the entire spectrum of the audio signal is.
- the time signal generated by prediction becomes one Subjected to forward transformation to estimated, i.e. H. predicted Spectral coefficients for the subband of the following Obtain set of spectral coefficients. Now it is found that in the following set of spectral coefficients one or more incorrect spectral coefficients , the incorrect spectral coefficients can be caused by the estimated, d. H. predicted, spectral coefficients be replaced.
- the inventive method for concealing Errors require less computing effort because of the Grouping of spectral coefficient predictions only for each subband and no longer for each spectral coefficient must be carried out.
- the invention provides Processes high flexibility because of the properties of the signals to be processed are taken into account can be.
- noise substitution according to the present invention works especially good for tonal signals.
- tonal signal components tend to be in the lower frequency range Range of the spectrum of an audio signal occur while the higher-frequency signal components tend to be non-stationary, d. H. are intoxicated.
- "Noisy signal components” are signal components in the sense of the present description that are not very stationary. These noisy signal components do not necessarily have to have noise in the classic Represent meaning, but only rapidly changing Useful signals.
- This feature of the present invention compares to a complete transformation of the whole Audio signal in the time domain and a prediction of the whole temporal audio signal from block to block below Using a so-called "long-term" predictor one represents significant advantage, since the advantages according to the invention the prediction in the time domain with the advantages of the spectral Decomposition can be combined.
- Spectral decomposition only allows properties of the audio signal that are dependent on the frequency. The Number of subbands that are used when dividing the set of Spectral coefficients are generated, can be selected as desired. If only two subbands are selected, the result is already the advantage of considering the tonality in the lower Frequency range of the audio signal.
- the method according to the invention is particularly suitable good for a combination with an error concealment technique, which is described in DE 197 35 675 A1, those for the substitution of noisy signal components suitable is. If tonal signal components of a missing Blocks obscured by the inventive method, and become noisy signal components through the just mentioned known methods that on an energy similarity between builds substituted data and intact data, combines, so completely failed blocks can almost be inaudibly obscured by a normal listener.
- Fig. 1 shows a block diagram of a decoder according to one preferred embodiment of the present invention.
- the decoder block diagram shown in Fig. 1 corresponds basically the MPEG-2 AAC decoder, as in Standard MPEG-2 AAC 13818-7 is set.
- the encoded audio signal first gets into a bitstream demultiplexer 100 to separate spectral data and side information.
- the Huffman encoded spectral coefficients are then in a Huffman decoder 200 is input to from the Huffman code words to obtain quantized spectral values.
- the quantized spectral values are then converted into an inverse Quantizer 300 fed in and then by scale factor band multiplied by corresponding scale factors.
- the encoder according to the invention can follow the inverse quantizer 300 several other functionalities have, such as B. a middle / side step, a predictor step, a TNS level etc. as specified in the standard.
- the present Invention comprises the decoder immediately before a synthesis filter bank 400 an error concealer 500, which works according to the invention and ensures that the Effects of transmission errors in the encoded audio signal, which is fed into the bitstream demultiplexer 100 will be alleviated or made completely inaudible can.
- the error concealer does 500 that transmission errors disguised become, d. H. that they are in a temporal audio signal on Synthesis filter bank output not or only weakly are audible.
- the error encryption facility 500 also includes a parallel branch, around the input spectral coefficients below Bypassing the reverse transformer 502, the Means for generating estimates 504 and the forward transform means 506 directly from the entrance to To direct output.
- This parallel branch includes one Time delay stage 510 to ensure that behind forward transformer 506 estimated spectral coefficients for a subsequent block at the same time with "real", possibly faulty Spectral coefficients for the following block on one Error selection facility 512 may be pending incorrect spectral coefficients in the real spectral coefficients for the following block by estimated spectral coefficients to be able to replace for the following block.
- This spectral value replacement is by a Switch symbol 512 shown in Fig. 2. It was on it indicated that the error replacement device 512 either spectral value or block or block can work. Depending on the requirement, the same can also work sub-band.
- the error replacement device 512 At the exit of the error replacement device 512 then lies the following set of spectral coefficients in which may have been originally incorrect Spectral coefficients through estimated spectral coefficients have been replaced, d. H. in which errors are obscured.
- the circuit shown in FIG. 2 is a device upstream for subdivision into subbands.
- the error replacement device 512 is a device to undo the division into subbands downstream, such that the filter bank 400 (Fig. 1) one "normal" set of spectral coefficients obtained without anything from the previous concealment of errors notice.
- the error concealment device 500 (FIG. 1) thus includes a plurality of those described with reference to FIG. 2 Circuits, one circuit for each Subband.
- the parallel circuits are on the input side connected by the partitioning device and on the output side through the undo facility Subdivision as detailed later.
- FIG. 7 includes a time axis 700, the extent of a long block 702 is shown is.
- a long block contains 2048 samples, from which 1024 spectral coefficients result if a 50% Window overlap is used as is known. Background information on the modified discrete cosine transformation used (MDCT) and the window overlap itself in the standard already cited.
- MDCT modified discrete cosine transformation used
- Fig. 7 are also eight short blocks 704 are drawn, each 256 Samples back to due to the 50% overlap 128 spectral coefficients.
- the overlap of the short Blocks as well as the overlap of the long block with one preceding long block or with a preceding one or a subsequent start or stop window located.
- the number of spectral coefficients of a long block equal to eight times the number of spectral coefficients of a short block. In other words, includes long block the same duration of the audio signal as eight short blocks.
- the backward transformation means 502 via block type line 508 such controlled to have eight consecutive backward transformations of the spectral coefficients in corresponding Sub-bands of short blocks and the the quasi-time signals obtained simply line up in series, around means 504 for generating estimated values to be supplied with a time signal of a certain length.
- the forward transformation device 506 again eight consecutive forward transformations perform, one after the other, with the values given by the means 504 for generating estimated values serially be issued.
- this "duty cycle" requires that in the case of short blocks, the same number of spectral coefficients is spent, as in the case of long Blocks.
- the spectral coefficients generated by the error concealer 500 spent in a "duty cycle" are in the sense of the present invention as Denoted set of estimated spectral coefficients.
- the number of spectral coefficients corresponds in a set the number of spectral coefficients in a long block and the number of spectral coefficients of eight short blocks. Of course can be any other relationship between long and short block, for example 2, 4 or 16. Usually the situation will be such that the number the spectral coefficients of a long block through the Number of spectral coefficients of a short block divisible is.
- Case would be the number of a set of spectral coefficients the smallest common multiple of correspond to long and short block, such that independence of the block type at the predictor level, d. H. in the Device 504 for generating estimated values has been reached becomes.
- Fig. 3 is discussed, which is a preferred one Further development of the error concealment device of Fig. 2.
- the error concealment device a noise generator 514 extended depending on a prediction gain signal 516 instead of with the forward transformation device 506 the error replacement device via a noise substitution switch 518 can be connected.
- the Noise Substitution Device 514 works according to that in DE 197 35 675 A1 described method to get noisy signal components in the Approach audio signal. Since it is noisy spectral components is no longer the phase of the spectral coefficients considered, but only the energy several spectral coefficients in a subgroup.
- the Noise generator 514 generates depending on the Energy in a subset of the most recent ones intact audio data a corresponding subset of Spectral coefficients, the energy in the subgroup the generated spectral coefficients of the energy of the corresponding Subset of the previous spectral coefficients corresponds to or is derived from the same.
- the phases of spectral coefficients generated in the noise replacement however set at random.
- Noise substitution switch 518 is provided by a prediction gain signal 516 controlled.
- the prediction gain relates on the ratio of the output signal of the Means 504 for generating estimates of the input signal. Is it found that the Output signal differs relatively little from the input signal, it can be assumed that the audio signal relatively stationary in this subband, i. H. tonal, is. In contrast, the output signal of the predictor differs very strongly from the input signal, so it can be assumed become that the signal is transient, d. H. atonal or intoxicating. In this case there is a noise replacement deliver better results than a prediction, because noisy Signals per se cannot be reliably predicted can.
- the noise substitution switch 518 can be controlled such that it is the forward transformation device 506 with the error replacement facility 512 connects when the prediction gain a certain one Threshold exceeds, or that the noise replacement device 514 connected to the error replacement device 512 if the prediction gain falls below this threshold, to optimize both substitution processes combine.
- a current set of spectral coefficients received (10). 4 is shown assumed for reasons of clarity that the current Set of spectral coefficients only intact Has spectral coefficients or already an error concealment method subjected to Fig. 2 or 3 has been.
- the current set of spectral coefficients will be processed on the one hand by the filter bank 400 (FIG. 1) and output to a loudspeaker, for example (12). on the other hand becomes the current set of spectral coefficients used a following set of spectral coefficients predict, d. H. to estimate or to predict.
- a division of the current Set of spectral coefficients performed in subbands (14).
- the subdivision takes place in subbands in such a way that only one subband per set is generated with a corresponding frequency range.
- the current set of spectral coefficients a plurality of successive ones complete spectra. Then in the crotch 14 corresponding subbands for each complete spectrum generated, d. H. several per set of spectral coefficients Sub-bands.
- the prediction 18 takes place in the quasi-time range, i. H. for each subband "time" signal to an estimated subband time signal to get for the following sentence.
- This esteemed Quasi-time signal then becomes one again Undergone forward transformation 20, the forward transformation for a long block again only once is executed or for short blocks N times, where N is the Relationship between the number of spectral coefficients long blocks to the number of spectral coefficients of a short block.
- step 20 there are estimated for each subband Spectral coefficients.
- step 22 the in the subdivision introduced in step 14 is reversed again made such that after step 22 a following sentence of spectral coefficients is present.
- step 24 the decoder does the following Set of spectral coefficients received.
- This sentence will error detection 26 to determine if one spectral coefficient, several spectral coefficients or even all spectral coefficients of the following set are incorrect are.
- the flow chart of Fig. 4 represents a snapshot, so to speak processing a set of spectral coefficients to a next set of spectral coefficients If the flowchart of FIG. 4 is implemented, for example, of course, only one Filter bank 400 (FIG. 1) used to complete steps 12 and 30 perform. Of course, only one will be the same only device for receiving the current set of Spectral coefficients or to receive the following Set of spectral coefficients may be required to obtain the Implement steps 10 and 24.
- Fig. 5 shows a more detailed representation of the general 2 using the example of an MPEG-2 AAC transform encoder, the fault concealment device according to the invention 500 has.
- the Error concealment device 500 (FIG. 1) 520 for dividing the blocks of spectral coefficients in preferably 32 subbands.
- each subband has 32 spectral coefficients.
- the subbands the short blocks cover the same frequency ranges, in the case of short blocks each subband has 4 Spectral coefficients.
- Every subband will then an inverse modified discrete cosine transform subjected.
- the IMDCT runs once and receives 32 input values.
- eight are consecutive IMDCTs performed, each with 4 of the spectral coefficients, such that there are again 32 quasi-time samples at the output result. These then become the predictor 504 supplied, which in turn estimated 32 quasi-time samples generated, which are transformed using the MDCT 506.
- a single MDCT with 32 temporal values performed while in the case of short Blocks eight consecutive MDCTS with each 4 samples can be executed.
- the subbands have different lengths, they are The regulations of the IMDCT and MDCT have been adapted accordingly. For one practical implementation offers a parallel Processing. Of course, there is also one serial processing of the subbands possible in succession, if appropriate storage capacities are provided.
- the output values of the MDCT 506 for each subband are shown in means 522 for undoing the subdivision, d. H. fed into an inverse subdivision device, um in the case of the preferred embodiment at the AAC-MDCT level an estimated set of spectral values issue.
- the LMSL predictor 504a is a time delay stage 504b upstream.
- Predictor 504 includes on the input side also a parallel-serial converter 504c and on the output side a serial-to-parallel converter 504d.
- the predictor 504 also has a prediction gain calculator 504e, which is the output signal of the predictor 504a compared to the input signal to determine whether a stationary signal or a transient signal has been processed.
- the prediction profit calculator 504e supplies the prediction gain signal on the output side 516, which is used to control the switch 518 (FIG. 3) is used to either predict spectral coefficients or spectral coefficients obtained by noise substitution to be used for concealing errors.
- the predictor 504 also includes two in its implementation as an LMSL predictor Switches 504f and 504g, which have two switch positions. The switch position "1" affects the case that spectral coefficients of the following block are correct while the switch position "2" relates to the case that spectral coefficients of the following sentence are incorrect.
- Fig. 6 shows the case where the spectral coefficients are faulty.
- the switch is held at 504g of the input signal is a reference signal with a value of 0 fed into the predictor.
- the output values of the parallel-serial converter fed into the LMSL predictor from below.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
Die vorliegende Erfindung bezieht sich auf das Codieren bzw. Decodieren von Audiosignalen und insbesondere auf die Verschleierung von Fehlern ("Error Concealment") in digital codierten Audiosignalen.The present invention relates to coding or Decoding audio signals and in particular on obfuscation of errors ("Error Concealment") in digital encoded audio signals.
Mit zunehmender Verbreitung moderner Audiocodierer und entsprechender Audiodecodierer, die nach einem der MPEG-Standards arbeiten, hat die Übertragung von codierten Audiosignalen über Funknetze oder über leitungsgebundene Netze, wie z. B. das Internet, bereits eine große Bedeutung erlangt. Bei der Übertragung von codierten Audiosignalen mittels digitalem Rundfunk aber auch beim Übertragen von Audiosignalen über leitungsgebundene Netze liegt ein nicht-idealer Übertragungskanal vor, der dazu führen kann, daß codierte Audiosignale während der Übertragung gestört werden. Daher stellt sich decodiererseitig die Aufgabe, wie mit Übertragungsfehlern umgegangen werden soll, bzw. wie Übertragungsfehler "verschleiert" werden sollen. Die Fehlerverschleierung dient dazu, Übertragungsfehler auf irgendeine Art und Weise zu manipulieren, um den subjektiven Höreindruck eines solchen fehlerbehafteten decodierten Audiosignales zu verbessern.With the increasing spread of modern audio encoders and corresponding Audio decoder that complies with one of the MPEG standards work, has the transmission of coded audio signals via radio networks or via wired networks, such as z. B. the Internet has already achieved great importance. When transmitting coded audio signals using digital broadcasting but also when transmitting audio signals A non-ideal one lies over wired networks Transmission channel before that can lead to coded Audio signals are disturbed during transmission. Therefore the task on the decoder side arises, as with transmission errors to be dealt with or how transmission errors should be "veiled". The error concealment is used to prevent transmission errors in any way and Way to manipulate the subjective auditory impression of a to improve such erroneous decoded audio signals.
Mehrere Fehlerverschleierungsverfahren sind bereits bekannt. Die einfachste Art der Fehlerverschleierung besteht in dem Verfahren der Stummschaltung, das auch als "Muting" bezeichnet wird. Erkennt ein Decodierer, daß Daten fehlen oder fehlerhaft sind, so schaltet derselbe die Wiedergabe ab. Die fehlenden Daten werden somit durch ein Null-Signal ersetzt. Damit wird vermieden, daß aufgrund eines Übertragungsfehlers zu laute bzw. unangenehme Geräusche eines Decodierers ausgegeben werden. Aufgrund psychoakustischer Effekte wird dieses plötzliche Abfallen und Ansteigen der Signalenergie, wenn der Decodierer wieder fehlerfreie Daten ausgibt, dennoch als unangenehm empfunden.Several error concealment methods are already known. The simplest way to conceal errors is by Muting method, also known as "muting" becomes. A decoder detects that data is missing or incorrect the playback is switched off. The Missing data are thus replaced by a zero signal. This avoids that due to a transmission error too loud or unpleasant noises from a decoder become. This is due to psychoacoustic effects sudden drop and rise in signal energy when the decoder outputs error-free data again, but as felt uncomfortable.
Ein anderes bekanntes Verfahren, das den plötzlichen Abfall und Wiederanstieg der Signalenergie vermeidet, ist das Verfahren der Datenwiederholung. Fällt beispielsweise ein Block oder mehrere Blöcke von Audiodaten aus, so wird ein Teil der zuletzt gesendeten Daten in einer Schleife wiederholt, bis wieder fehlerfreie, d. h. intakte Audiodaten vorliegen. Dieses Verfahren führt jedoch zu störenden Artefakten. Werden nur kurze Teile des Audiosignals wiederholt, so klingt das repetierte Signal unabhängig vom Orginalsignal maschinenartig mit einer Grundfrequenz bei der Wiederholfrequenz. Werden längere Teile wiederholt, entstehen bestimmte Echoeffekte, die ebenfalls als störend empfunden werden.Another well-known procedure that involves the sudden drop and avoids re-increase in signal energy is the procedure data repetition. For example, a block falls or more blocks of audio data, part of the last sent data repeated in a loop until error-free again, d. H. sound data is intact. This However, the process leads to disruptive artifacts. Become Repeats only short parts of the audio signal, that's what it sounds like repeated signal independent of the original signal with a fundamental frequency at the repetition frequency. Become longer parts repeated, certain echo effects arise, which are also perceived as disturbing.
Bei blockorientierten Transformationscodierern/-decodierern,
bei denen eine spektrale Darstellung eines zeitlichen Audiosignals
verwendet wird, würde ferner die Möglichkeit bestehen,
eine spektralwertweise Prädiktion im Falle von fehlerhaften
Audiodaten durchzuführen. Wird festgestellt, daß
Spektralwerte in einem Block fehlerhaft sind, so können
diese Spektralwerte basierend auf den Spektralwerten eines
vorausgehenden Blocks oder mehrerer vorausgehender Blöcke
prädiziert, d. h. vorhergesagt oder abgeschätzt werden. Die
prädizierten Spektralwerte entsprechen in gewissen Grenzen
den fehlerhaften Spektralwerten, wenn das Audiosignal relativ
stationär ist, d. h. wenn das Audiosignal keinen so
schnellen Änderungen der Signaleinhüllenden unterzogen ist.
Wenn beispielsweise ein nach dem MPEG-AAC-Standard (ISO/IEC
13818-7 MPEG-2 Advanced Audio Coding) arbeitendes Verfahren
betrachtet wird, so hat ein normaler Block von codierten
Audiodaten 1024 Spektralwerte. Beim Verfahren der spektralwertweisen
Prädiktion werden daher 1024 parallel
arbeitende Prädiktoren im Decodierer benötigt, um z. B. im
Falle eines vollständigen Blockausfalls ("Frame Loss")
sämtliche Spektralwerte prädizieren zu können.For block-oriented transformation encoders / decoders,
where a spectral representation of a temporal audio signal
would also be possible
a spectral-value prediction in the case of incorrect ones
Perform audio data. It is found that
Spectral values in a block are incorrect, so can
these spectral values based on the spectral values of a
previous blocks or several previous blocks
predicted, d. H. be predicted or estimated. The
predicted spectral values correspond within certain limits
the incorrect spectral values when the audio signal is relative
is stationary, d. H. if the audio signal is not like that
undergoes rapid changes in the signal envelope.
If, for example, a according to the MPEG-AAC standard (ISO / IEC
13818-7 MPEG-2 Advanced Audio Coding) working method
is considered to have a normal block of coded
Ein Nachteil dieses Verfahrens ist der relativ hohe Rechenaufwand, der derzeit eine Echtzeit Decodierung eines empfangenen Multimedia- oder Audiodatensignals unmöglich macht.A disadvantage of this method is the relatively high computing effort, which is currently receiving real-time decoding of a Multimedia or audio data signal impossible.
Ein weiterer wesentlicher Nachteil dieses Verfahrens wird durch den verwendeten Transformationsalgorithmus, die modifizierte diskrete Cosinustransformation (MDCT), bedingt. Es ist allgemein bekannt, daß der MDCT-Algorithmus kein ideales Fourier-Spektrum liefert, sondern ein "Spektrum", das sich von einem idealen Fourier- Spektrum unterscheidet. Untersuchungen haben gezeigt, daß z. B. eine Sinus-Zeitfunktion, die ein Fourier-Spektrum aufweist, das eine einzige Spektrallinie bei der Frequenz der Sinusfunktion hat, ein MDCT-"Spektrum" hat, das zwar bei der Frequenz der Sinusfunktion einen dominierenden Spektralkoeffizienten hat, das jedoch zusätzlich weitere Spektralkoeffizienten bei anderen Frequenzwerten aufweist. Außerdem ist die Höhe eines MDCT-"Spektrums" einer Sinusfunktion nicht von Block zu Block gleich, sondern dieselbe schwankt von Block zu Block. Eine weitere Tatsache ist, daß die MDCT-Transformation nicht streng energieerhaltend ist. So kann festgehalten werden, daß die MDCT-Transformation zwar zusammen mit einer inversen MDCT-Transformation exakt arbeitet, daß jedoch das MDCT-Spektrum wesentliche Unterschiede zu einem Fourier-Spektrum hat. Eine spektralwertweise Prädiktion von MDCT-Spektralkoeffizienten hat sich daher als unzureichend herausgestellt, wenn qualitativ hochwertige Anforderungen gestellt werden.Another major disadvantage of this method is through the transformation algorithm used, the modified discrete cosine transformation (MDCT), conditional. It it is well known that the MDCT algorithm is not an ideal one Fourier spectrum delivers, but rather a "spectrum" that extends different from an ideal Fourier spectrum. investigations have shown that z. B. a sine time function, which has a Fourier spectrum that has a single spectral line at the frequency of the sine function has an MDCT "spectrum" has that at the frequency of the sine function has a dominant spectral coefficient, however additional spectral coefficients at other frequency values having. In addition, the height of an MDCT "spectrum" a sine function not from block to block same, but the same varies from block to block. A another fact is that the MDCT transform is not is strictly energy-saving. So it can be stated that the MDCT transformation, together with an inverse MDCT transformation works exactly, however, the MDCT spectrum significant differences to a Fourier spectrum Has. A spectral-value prediction of MDCT spectral coefficients turned out to be insufficient when high quality demands are made.
Ein weiterer Nachteil der spektralwertweisen Prädiktion insbesondere in Verbindung mit modernen Audiocodierverfahren besteht darin, daß moderne Audiocodierverfahren unterschiedliche Fensterlängen bzw. Fensterformen verwenden. Um zu vermeiden, daß sich bei schnellen Änderungen des zu codierenden Audiosignals, d. h. bei Transienten oder Anschlägen, das durch die Quantisierung der MDCT-Spektralkoeffizienten eingeführte Quantisierungsrauschen über eine langen Block "verschmiert", d. h. daß sogenannte Vorechos auftreten, verwenden moderne Transformationscodierer bei transienten Audiosignalen, d. h. Audiosignalen mit Anschlägen, kurze Fenster, um die zeitliche Auflösung auf Kosten der Frequenzauflösung zu erhöhen. Dies führt aber dazu, daß bei einer spektralwertweisen Prädiktion ständig sowohl Fensterlänge als auch Fensterform (es existieren zudem Übergangsfenster, um eine Fensterung von kurzen zu langen Blöcken und umgekehrt einzuleiten) berücksichtigt werden müssen, was ebenfalls zu einer Verkomplizierung der spektralwertweisen Prädiktion beiträgt und die Recheneffizienz empfindlich beeinflussen würde.Another disadvantage of the spectral-value prediction in particular in connection with modern audio coding methods is that modern audio coding methods are different Use window lengths or window shapes. In order to avoid, that there are rapid changes in the code to be encoded Audio signal, d. H. in the case of transients or attacks, the introduced by the quantization of the MDCT spectral coefficients Quantization noise "smeared" over a long block, d. H. use so-called pre-echoes modern transformation encoders for transient audio signals, d. H. Audio signals with stops, short windows, about temporal resolution at the expense of frequency resolution to increase. However, this leads to the fact that with a spectral value Prediction constantly both window length as well Window shape (there are also transition windows to a Windowing from short to long blocks and vice versa) must be taken into account, which too a complication of the spectral-value prediction contributes and significantly affect computing efficiency would.
Die DE 40 34 017 A1 bezieht sich auf ein Verfahren zum Erkennen von Fehlern bei der Übertragung von frequenzcodierten digitalen Signalen. Hierbei wird aus Frequenzkoeffizienten zurückliegender sowie ggf. zukünftiger Blöcke eine Fehlerfunktion gebildet, anhand derer das Auftreten eines Fehlers ermittelt wird. Ein fehlerhafter Frequenzkoeffizient wird für die Bewertung nachfolgender Blöcke nicht mehr herangezogen.DE 40 34 017 A1 relates to a method for recognition errors in the transmission of frequency-coded digital signals. Here, the frequency coefficient previous and possibly future blocks an error function formed on the basis of which the occurrence of an error is determined. An incorrect frequency coefficient will no longer used for the evaluation of subsequent blocks.
Die DE 197 35 675 A1 offenbart ein Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom. Hierzu wird die spektrale Energie einer Untergruppe von intakten Audiodaten berechnet. Nach dem Bilden einer Vorlage für Ersatzdaten aufgrund der für die Untergruppe der intakten Audiodaten berechneten spektralen Energie werden Ersatzdaten für fehlerhafte oder nicht vorhandene Audiodaten, die der Untergruppe entsprechen, aufgrund der Vorlage erzeugt. DE 197 35 675 A1 discloses a method for concealing errors in an audio data stream. For this, the spectral energy of a subset of intact audio data calculated. After creating a template for replacement data based on those calculated for the subset of the intact audio data spectral energy will be substitute data for faulty or non-existent audio data belonging to the subgroup correspond, generated based on the template.
Das Dokument "Fehlerverschleierung bei spektral codierten Audiosignalen", Jürgen Herre, Dissertation der Universität Erlangen-Nürnberg, 1995, offenbart eine Prädiktionskonfiguration zur Fehlerverschleierung bei spektral codierten Audiosignalen. The document "Error Concealment in Spectrally Coded Audio signals ", Jürgen Herre, dissertation of the university Erlangen-Nuremberg, 1995, discloses a prediction configuration for concealing errors in spectrally coded Audio signals.
Die Aufgabe der vorliegenden Erfindung besteht darin, eine präzise und flexible Fehlerverschleierung für Audiosignale zu schaffen, die mit begrenztem Rechenaufwand implementiert werden kann.The object of the present invention is a precise and flexible error concealment for audio signals to create that implemented with limited computational effort can be.
Diese Aufgabe wird durch ein Verfahren zum Verschleiern eines
Fehlers nach Patentanspruch 1 und eine Vorrichtung zum
Verschleiern eines Fehlers nach Patentanspruch 12 gelöst.This task is accomplished by a method of disguising a
Fault according to
Eine weitere Aufgabe der vorliegenden Erfindung besteht darin, eine fehlerrobuste und flexible Decodierung von Audiosignalen zu schaffen.Another object of the present invention is a robust and flexible decoding of audio signals to accomplish.
Diese Aufgabe wird durch ein Verfahren zum Decodieren eines
codierten Audiosignals nach Patentanspruch 10 und durch eine
Vorrichtung zum Decodieren eines codierten Audiosignals nach
Patentanspruch 13 gelöst.This task is accomplished by a method for decoding a
encoded audio signal according to
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß die Nachteile der spektralwertweisen Prädiktion, die in der Abhängigkeit von dem verwendeten Transformätionsalgorithmus und in der Abhängigkeit von Fensterform und Blocklänge bestehen, dadurch vermieden werden können, daß zur Fehlerverschleierung eine Prädiktion eingesetzt wird, die im "Quasi"-Zeitbereich arbeitet. Hierzu wird ein Satz von Spektralwerten, der vorzugsweise einem langen Block bzw. einer Anzahl von kurzen Blöcken entspricht, in Subbänder unterteilt. Ein Subband des aktuellen Satzes von Spektralkoeffizienten kann daraufhin einer Rückwärts-Transformation unterzogen werden, um ein Zeitsignal zu erhalten, das den Spektralkoeffizienten des Subbandes entspricht. Zur Erzeugung von Schätzwerten für einen darauffolgenden Satz von Spektralkoeffizienten wird eine Prädiktion auf der Basis des Zeitsignals dieses Subbandes durchgeführt.The present invention is based on the finding that that the disadvantages of the spectral-value prediction, which in the dependence on the transformation algorithm used and depending on the window shape and block length exist, can be avoided that for Error concealment a prediction is used, which in "Quasi" time range works. For this, a set of spectral values, preferably a long block or one Corresponds to the number of short blocks, divided into subbands. A subband of the current set of spectral coefficients can then undergo a backward transformation to obtain a time signal that corresponds to the spectral coefficient of the subband. For generation of estimates for a subsequent set of spectral coefficients is a prediction based on the Time signal of this subband performed.
Es sei darauf hingewiesen, daß diese Prädiktion im Quasi-Zeitbereich stattfindet, da das zeitliche Signal, auf der Basis dessen die Prädiktion durchgeführt wird, lediglich das Zeitsignal eines Subbandes des codierten Audiosignals und nicht das Zeitsignal des gesamten Spektrums des Audiosignals ist. Das mittels Prädiktion erzeugte Zeitsignal wird einer Vorwärtstransformation unterzogen, um geschätzte, d. h. prädizierte Spektralkoeffizienten für das Subband des folgenden Satzes von Spektralkoeffizienten zu erhalten. Wird nun festgestellt, daß in dem folgenden Satz von Spektralkoeffizienten einer oder mehrere fehlerhafte Spektralkoeffizienten sind, so können die fehlerhaften Spektralkoeffizienten durch die geschätzten, d. h. prädizierten, Spektralkoeffizienten ersetzt werden.It should be noted that this prediction is in the quasi-time range takes place because the temporal signal on which Basis of which the prediction is made, only that Time signal of a subband of the encoded audio signal and not the time signal of the entire spectrum of the audio signal is. The time signal generated by prediction becomes one Subjected to forward transformation to estimated, i.e. H. predicted Spectral coefficients for the subband of the following Obtain set of spectral coefficients. Now it is found that in the following set of spectral coefficients one or more incorrect spectral coefficients , the incorrect spectral coefficients can be caused by the estimated, d. H. predicted, spectral coefficients be replaced.
Im Gegensatz zur reinen spektralwertweisen Prädiktion erfordert das erfindungsgemäße Verfahren zum Verschleiern von Fehlern einen geringeren Rechenaufwand, da aufgrund der Gruppierung von Spektralkoeffizienten Prädiktionen nur noch für jedes Subband und nicht mehr für jeden Spektralkoeffizienten durchgeführt werden müssen. Außerdem liefert das erfindungsgemäße Verfahren eine hohe Flexibilität, da die Eigenschaften der zu verarbeitenden Signale berücksichtigt werden können.In contrast to pure spectral value-based prediction required the inventive method for concealing Errors require less computing effort because of the Grouping of spectral coefficient predictions only for each subband and no longer for each spectral coefficient must be carried out. In addition, the invention provides Processes high flexibility because of the properties of the signals to be processed are taken into account can be.
Die Rauschsubstitution gemäß der vorliegenden Erfindung arbeitet besonders gut für tonale Signale. Es wurde jedoch herausgefunden, daß tonale Signalanteile eher im niederfrequenteren Bereich des Spektrums eines Audiosignals auftreten, während die höherfrequenten Signalanteile eher nichtstationär, d. h. rauschhaft, sind. "Rauschhafte Signalanteile" sind im Sinne der vorliegenden Beschreibung Signalanteile die wenig stationär sind. Diese rauschhaften Signalanteile müssen jedoch nicht unbedingt Rauschen im klassischen Sinn darstellen, sondern lediglich sich schnell verändernde Nutzsignale.The noise substitution according to the present invention works especially good for tonal signals. However, it was found that tonal signal components tend to be in the lower frequency range Range of the spectrum of an audio signal occur while the higher-frequency signal components tend to be non-stationary, d. H. are intoxicated. "Noisy signal components" are signal components in the sense of the present description that are not very stationary. These noisy signal components do not necessarily have to have noise in the classic Represent meaning, but only rapidly changing Useful signals.
Zur weiteren Reduzierung des Rechenaufwands ermöglicht es die vorliegende Erfindung daher, lediglich niederfrequentere Signalanteile einer Prädiktion zu unterziehen, während höherfrequentere Signalanteile überhaupt nicht verarbeitet werden. In anderen Worten ausgedrückt ist es möglich, nur das bzw. die unteren Subbänder einer Rückwärtstransformation, einer Prädiktion und einer Vorwärtstransformtion zu unterziehen.It enables to further reduce the computing effort the present invention, therefore, only low frequency To subject signal components to a prediction, while higher-frequency ones Signal components not processed at all become. In other words, it is possible only the lower subband or bands of a backward transformation, a prediction and a forward transformation undergo.
Diese Eigenschaft der vorliegenden Erfindung stellt im Vergleich zu einer vollständigen Transformation des gesamten Audiosignals in den Zeitbereich und einer Prädiktion des gesamten zeitlichen Audiosignals von Block zu Block unter Verwendung eines sogenannten "Long-Term"-Prädiktors einen wesentlichen Vorteil dar, da erfindungsgemäß die Vorteile der Prädiktion im Zeitbereich mit den Vorteilen der spektralen Zerlegung kombiniert werden. Nur die spektrale Zerlegung ermöglicht es, Eigenschaften des Audiosignals, die von der Frequenz abhängig sind, zu berücksichtigen. Die Anzahl der Subbänder, die beim Unterteilen des Satzes von Spektralkoeffizienten erzeugt wird, ist beliebig wählbar. Werden nur zwei Subbänder gewählt, so ergibt sich bereits der Vorteil der Berücksichtigung der Tonalität im unteren Frequenzbereich des Audiosignals. Werden dagegen sehr viele Subbänder gewählt, so wird der Prädiktor im Quasi-Zeitbereich eine relativ kurze Länge haben, derart, daß seine Verzögerung nicht allzu groß wird. Da die einzelnen Subbänder vorzugsweise parallel verarbeitet werden, wären bei einer Ausführung der vorliegenden Erfindung unter Verwendung eines festverdrahteten integrierten Schaltkreises viele parallele Prädiktorschaltungen notwendig.This feature of the present invention compares to a complete transformation of the whole Audio signal in the time domain and a prediction of the whole temporal audio signal from block to block below Using a so-called "long-term" predictor one represents significant advantage, since the advantages according to the invention the prediction in the time domain with the advantages of the spectral Decomposition can be combined. Spectral decomposition only allows properties of the audio signal that are dependent on the frequency. The Number of subbands that are used when dividing the set of Spectral coefficients are generated, can be selected as desired. If only two subbands are selected, the result is already the advantage of considering the tonality in the lower Frequency range of the audio signal. In contrast, there will be many Subbands selected, so the predictor is in the quasi-time range have a relatively short length such that its Delay doesn't get too big. Because the individual subbands preferably processed in parallel, would be at an embodiment of the present invention using of a hardwired integrated circuit many parallel predictor circuits necessary.
Wird die vorliegende Erfindung im Zusammenhang mit einem Transformationscodierer eingesetzt, der unterschiedliche Blocklängen verwendet, so ergibt sich der Vorteil, daß der Prädiktor selbst von Blocklänge ("Frame Length") und Fensterform ("Window Shape") unabhängig ist. Außerdem wird durch die Rücktransformation die Abhängigkeit von dem verwendeten Transformationsalgorithmus selbst, die oben bezüglich der MDCT ausgeführt worden ist, eliminiert. Weiterhin liefert das erfindungsgemäße Konzept zur Fehlerverschleierung geschätzte Spektralkoeffizienten, die aufgrund der Rückwärtstransformation, der Prädiktion im Zeitbereich und der Vorwärtstransformation phasenrichtig sind, d. h. es treten keine Phasensprünge im Zeitsignal aufgrund eines prädizierten Spektralkoeffizienten gegenüber einem Zeitsignal eines vorausgehenden intakten Satzes von Spektralkoeffizienten auf. Damit können tonale Signale derart gut für fehlerhafte oder fehlende Signalanteile substituiert werden, daß ein üblicher Hörer in den allermeisten Fällen nicht einmal merkt, daß ein Fehler aufgetreten ist.Will the present invention in connection with a Transformation encoder used, the different Block lengths used, there is the advantage that the Predictor itself of block length ("frame length") and window shape ("Window Shape") is independent. Besides, will through the back transformation the dependence on that used transformation algorithm itself, the above regarding the MDCT has been eliminated. Farther provides the concept for concealing errors estimated spectral coefficients due to the backward transformation, the prediction in the time domain and the forward transformation is in phase, i.e. H. it there are no phase jumps in the time signal due to a predicted spectral coefficients versus a time signal of a previous intact set of spectral coefficients on. This makes tonal signals so good substituted for incorrect or missing signal components become a common listener in the vast majority of cases doesn't even notice that an error has occurred.
Schließlich eignet sich das erfindungsgemäße Verfahren besonders gut für eine Kombination mit einer Fehlerverschleierungstechnik, die in der DE 197 35 675 A1 beschrieben ist, die für die Substitution von rauschhaften Signalanteilen geeignet ist. Werden tonale Signalanteile eines fehlenden Blocks durch das erfindungsgemäße Verfahren verschleiert, und werden rauschhafte Signalanteile durch das eben erwähnte bekannte Verfahren, daß auf einer Energieähnlichkeit zwischen substituierten Daten und intakten Daten aufbaut, kombiniert, so können vollständig ausgefallene Blöcke nahezu unhörbar für einen normalen Hörer verschleiert werden.Finally, the method according to the invention is particularly suitable good for a combination with an error concealment technique, which is described in DE 197 35 675 A1, those for the substitution of noisy signal components suitable is. If tonal signal components of a missing Blocks obscured by the inventive method, and become noisy signal components through the just mentioned known methods that on an energy similarity between builds substituted data and intact data, combines, so completely failed blocks can almost be inaudibly obscured by a normal listener.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
- Fig. 1
- einen Decodierer, der eine erfindungsgemäße Fehlerverschleierungseinrichtung aufweist;
- Fig. 2
- ein detaillierteres Blockschaltbild der Fehlerverschleierungseinrichtung von Fig. 1;
- Fig. 3
- ein detaillierteres Blockschaltbild der Fehlerverschleierungseinrichtung von Fig. 1, die zudem eine Rauschersetzung aufweist und basierend auf dem Prädiktionsgewinn arbeitet;
- Fig. 4
- ein Flußdiagramm für das erfindungsgemäße Verfahren zur Fehlerverschleierung;
- Fig. 5
- ein detailliertes Blockschaltbild eines bevorzugten Ausführungsbeispiels der Fehlerverschleierungseinrichtung für einen MPEG-2 AAC-Decodierer;
- Fig. 6
- ein detailliertes Blockschaltbild des Prädiktors von Fig. 5; und
- Fig. 7
- eine schematische Darstellung der Blockstruktur nach dem AAC-Standard.
- Fig. 1
- a decoder having an error concealment device according to the invention;
- Fig. 2
- a more detailed block diagram of the error concealment device of Fig. 1;
- Fig. 3
- a detailed block diagram of the error concealment device of Figure 1, which also has a noise replacement and works based on the prediction gain.
- Fig. 4
- a flow diagram for the inventive method for error concealment;
- Fig. 5
- a detailed block diagram of a preferred embodiment of the error concealer for an MPEG-2 AAC decoder;
- Fig. 6
- a detailed block diagram of the predictor of Fig. 5; and
- Fig. 7
- is a schematic representation of the block structure according to the AAC standard.
Fig. 1 zeigt ein Blockschaltbild eines Decodierers gemäß einem
bevorzugten Ausführungsbeispiel der vorliegenden Erfindung.
Das in Fig. 1 gezeigte Decodiererblockschaltbild entspricht
grundsätzlich dem MPEG-2 AAC-Decodierer, wie er im
Standard MPEG-2 AAC 13818-7 festgelegt ist. Das codierte Audiosignal
gelangt zunächst in einen Bitstrom-Demultiplexer
100, um Spektraldaten und Seiteninformationen zu trennen.
Die Huffman-codierten Spektralkoeffizienten werden dann in
einen Huffman-Decodierer 200 eingespeist, um aus den Huffman-Codewörtern
quantisierte Spektralwerte zu erhalten. Die
quantisierten Spektralwerte werden anschließend in einen inversen
Quantisierer 300 eingespeist und anschließend skalenfaktorbandweise
mit entsprechenden Skalenfaktoren multipliziert.
Der erfindungsgemäße Codierer kann im Anschluß an den
inversen Quantisierer 300 mehrere weitere Funktionalitäten
haben, wie z. B. eine Mitte/Seite-Stufe, eine Prädiktor-Stufe,
eine TNS-Stufe usw. wie es im Standard festgelegt ist.Fig. 1 shows a block diagram of a decoder according to one
preferred embodiment of the present invention.
The decoder block diagram shown in Fig. 1 corresponds
basically the MPEG-2 AAC decoder, as in
Standard MPEG-2 AAC 13818-7 is set. The encoded audio signal
first gets into a
Gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden
Erfindung umfaßt der Decodierer unmittelbar vor einer Synthese-Filterbank
400 eine Fehlerverschleierungseinrichtung
500, die erfindungsgemäß arbeitet und dafür sorgt, daß die
Auswirkungen von Übertragungsfehlern in dem codierten Audiosignal,
das in den Bitstrom-Demultiplexer 100 eingespeist
wird, gelindert bzw. vollständig unhörbar gemacht werden
können. Anders ausgedrückt bewirkt die Fehlerverschleierungseinrichtung
500, daß Übertragungsfehler verschleiert
werden, d. h. daß sie in einem zeitlichen Audiosignal am
Ausgang der Synthese-Filterbank nicht oder nur noch schwach
hörbar sind.According to a preferred embodiment of the present
Invention comprises the decoder immediately before a
Fig. 2 zeigt ein allgemeines Blockschaltbild der Fehlerverschleierungseinrichtung
500. Dieselbe umfaßt eine Rückwärtstransformationseinrichtung
502, eine Einrichtung 504 zur Erzeugung
von Schätzwerten sowie eine Einrichtung 506 zur Vorwärtstransformation.
Sowohl die Rückwärtstransformationseinrichtung
502 als auch die Vorwärtstransformationseinrichtung
506 sind abhängig von dem Blocktyp, der gerade vorliegt,
über eine Blocktypleitung 508 steuerbar. Die Fehlerverschlüsselungseinrichtung
500 umfaßt ferner einen Parallelzweig,
um die eingangsseitigen Spektralkoeffizienten unter
Umgehung der Rückwärtstransformationseinrichtung 502, der
Einrichtung zur Erzeugung von Schätzwerten 504 und der Vorwärtstransformationseinrichtung
506 direkt vom Eingang zum
Ausgang zu leiten. Dieser Parallelzweig umfaßt eine
Zeitverzögerungsstufe 510, um sicherzustellen, daß hinter
der Vorwärtstransformationseinrichtung 506 vorliegende
geschätzte Spektralkoeffizienten für einen folgenden Block
gleichzeitig mit "realen", unter Umständen fehlerhaften
Spektralkoeffizienten für den folgenden Block an einer
Fehler-Auswahl-Einrichtung 512 anliegen, um eventuell
fehlerhafte Spektralkoeffizienten in den realen Spektralkoeffizienten
für den folgenden Block durch geschätzte Spektralkoeffizienten
für den folgenden Block ersetzen zu können.
Diese spektralwertweise Ersetzung ist durch ein
Schaltersymbol 512 in Fig. 2 dargestellt. Es sei darauf
hingewiesen, daß die Fehler-Ersetzungs-Einrichtung 512
entweder spektralwertweise oder block- bzw. satzweise
arbeiten kann. Je nach Anforderung kann dieselbe auch
subbandweise arbeiten. Am Ausgang der Fehler-Ersetzungs-Einrichtung
512 liegt dann der folgende Satz von Spektralkoeffizienten
vor, in dem eventuell ursprünglich fehlerhafte
Spektralkoeffizienten durch geschätzte Spektralkoeffizienten
ersetzt worden sind, d. h. in dem Fehler verschleiert sind.2 shows a general block diagram of the
An dieser Stelle sei darauf hingewiesen, daß das Blockschaltbild,
das in Fig. 2 gezeigt ist, lediglich einen Teil
der Fehlerverschleierungseinrichtung 500 darstellt. Diese
Darstellung wurde jedoch aus Übersichtlichkeitsgründen gewählt.
Wie es in Fig. 5 anhand eines bevorzugten Ausführungsbeispiels
der vorliegenden Erfindung näher erläutert
werden wird, ist der in Fig. 2 gezeigten Schaltung eine Einrichtung
zur Unterteilung in Subbänder vorgeschaltet. Analog
dazu ist der Fehler-Ersetzungs-Einrichtung 512 eine Einrichtung
zum Rückgängigmachen der Unterteilung in Subbänder
nachgeschaltet, derart, daß die Filterbank 400 (Fig. 1) einen
"normalen" Satz von Spektralkoeffizienten erhält, ohne
von der vorausgegangenen Fehlerverschleierung irgendetwas zu
merken. Die Fehlerverschleierungseinrichtung 500 (Fig. 1)
umfaßt somit eine Mehrzahl von bezugnehmend auf Fig. 2 beschriebenen
Schaltungen, und zwar eine Schaltung für jedes
Subband. Die parallelen Schaltungen sind eingangsseitig
durch die Einrichtung zum Unterteilen verbunden und ausgangsseitig
durch die Einrichtung zum Rückgängigmachen der
Unterteilung, wie es später detailliert ausgeführt wird.At this point it should be noted that the block diagram,
that is shown in Fig. 2, only a part
of the
Es wurde bereits früher darauf hingewiesen, daß moderne
Transformationscodierer zur Erhöhung der zeitlichen Auflösung
im Falle von Transienten in einem zu codierenden Audiosignal
kurze Fenster verwenden. Dabei ist es gebräuchlich,
daß die Anzahl der zeitlichen Abtastwerte bzw. die Anzahl
der Spektralkoeffizienten in einem langen Fenster bzw.
Block ein ganzzahliges Vielfaches der Anzahl von zeitlichen
Abtastwerten bzw. Spektralkoeffizienten in einem kurzen Fenster
bzw. Block darstellt. Ein vorteilhafter Effekt der vorliegenden
Erfindung besteht darin, daß die Einrichtung 504
zur Erzeugung von Schätzwerten unabhängig von der verwendeten
Transformation, von der verwendeten Blocklänge bzw.
von dem verwendeten Fenstertyp arbeiten kann. Daher werden
sowohl die Rückwärtstransformationseinrichtung 502 als auch
die Vorwärtstransformationseinrichtung 506 Blocktyp-abhängig
gesteuert, um der Einrichtung 504 zur Erzeugung von Schätzwerten
immer dieselbe Anzahl von zeitlichen Abtastwerten zuzuführen
bzw. von derselben abzuführen.It was pointed out earlier that modern
Transformation encoder to increase the temporal resolution
in the case of transients in an audio signal to be encoded
use short windows. It is common
that the number of temporal samples or the number
the spectral coefficients in a long window or
Block an integer multiple of the number of temporal
Samples or spectral coefficients in a short window
or block. An advantageous effect of the present
Invention is that
Zur weiteren Veranschaulichung dieser Eigenschaft wird nachfolgend
auf Fig. 7 Bezug genommen, um die Situation für
MPEG-2 AAC darzustellen. Fig. 7 umfaßt eine Zeitachse 700,
bezüglich der die Ausdehnung eines langen Blocks 702 dargestellt
ist. Ein langer Block umfaßt 2048 Abtastwerte, woraus
sich 1024 Spektralkoeffizienten ergeben, wenn eine 50%-ige
Überlappung der Fenster eingesetzt wird, wie es bekannt ist.
Hintergründe zur verwendeten modifizierten diskreten Cosinus-Transformation
(MDCT) und der Fensterüberlappung finden
sich in dem bereits zitierten Standard. In Fig. 7 sind ferner
acht kurze Blöcke 704 eingezeichnet, von denen jeder 256
Abtastwerte aufweist, um wieder aufgrund der 50%-igen Überlappung
128 Spektralkoeffizienten zu ergeben. Aus Übersichtlichkeitsgründen
wurde in Fig. 7 die Überlappung der kurzen
Blöcke sowie die Überlappung des langen Blocks mit einem
vorausgehenden langen Block bzw. mit einem vorausgehenden
oder einem nachgeschalteten Start- bzw. Stoppfenster nicht
eingezeichnet. Auf jeden Fall ist aus Fig. 7 ersichtlich,
daß die Anzahl der Spektralkoeffizienten eines langen Blocks
gleich dem achtfachen der Anzahl der Spektralkoeffizienten
eines kurzen Blocks ist. Anders ausgedrückt umfaßt ein
langer Block dieselbe Zeitdauer des Audiosignals wie acht
kurze Blöcke.To further illustrate this property, see below
with reference to Fig. 7 to the situation for
MPEG-2 AAC. 7 includes a
Wie es in Fig. 2 gezigt ist, wird die Rückwärtstransformationseinrichtung
502 über die Blocktypleitung 508 derart
gesteuert, daß sie acht zeitlich aufeinanderfolgende Rückwärtstransformationen
der Spektralkoeffizienten in entsprechenden
Subbändern von kurzen Blöcken durchführt und die
gewonnenen Quasi-Zeitsignale einfach seriell aneinanderreiht,
um die Einrichtung 504 zur Erzeugung von Schätzwerten
mit einem Zeitsignal einer bestimmten Länge zu versorgen.
Analog dazu wird die Vorwärtstransformationseinrichtung 506
wieder acht aufeinanderfolgende Vorwärtstransformationen
durchführen, und zwar nacheinander mit den Werten, die von
der Einrichtung 504 zum Erzeugen von Schätzwerten seriell
ausgegeben werden. Somit bedingt dieser "Arbeitszyklus", daß
im Falle von kurzen Blöcken dieselbe Anzahl von Spektralkoeffizienten
ausgegeben wird, wie im Falle von langen
Blöcken. Die Spektralkoeffizienten, die durch die Fehlerverschleierungseinrichtung
500 in einem "Arbeitszyklus" ausgegeben
werden, werden im Sinne der vorliegenden Erfindung als
Satz von geschätzten Spektralkoeffizienten bezeichnet. Aus
Praktikabilitätsgründen entspricht die Anzahl der Spektralkoeffizienten
in einem Satz der Anzahl der Spektralkoeffizienten
in einem langen Block und der Anzahl der Spektralkoeffizienten
von acht kurzen Blöcken. Selbstverständlich
können beliebige andere Verhältnisse zwischen langem und
kurzem Block verwendet werden, beispielsweise 2, 4 oder 16.
Üblicherweise wird die Situation derart sein, daß die Anzahl
der Spektralkoeffizienten eines langen Blocks durch die
Anzahl der Spektralkoeffizienten eines kurzen Blocks teilbar
ist. Sollte dies jedoch aus irgendeinem Grunde nicht der
Fall sein, so würde die Anzahl eines Satzes von Spektralkoeffizienten
dem kleinsten gemeinsamen Vielfachen von
langem und kurzem Block entsprechen, derart, daß Unabhängigkeit
vom Blocktyp auf Prädiktorebene, d. h. bei der
Einrichtung 504 zur Erzeugung von Schätzwerten, erreicht
wird.As shown in Fig. 2, the backward transformation means
502 via
Im Nachfolgenden wird auf Fig. 3 eingegangen, die eine bevorzugte
Weiterbildung der Fehlerverschleierungseinrichtung
von Fig. 2 darstellt. Insbesondere ist die Fehlerverschleierungseinrichtung
um eine Rauschersetzungseinrichtung 514
erweitert, die abhängig von einem Prädiktionsgewinnsignal
516 statt mit der Vorwärtstransformationseinrichtung 506 mit
der Fehler-Ersetzungs-Einrichtung über einen Rauschersetzungsschalter
518 verbunden werden kann. Die Rauschersetzungseinrichtung
514 arbeitet nach dem in der DE 197 35 675
A1 beschriebenen Verfahren, um rauschhafte Signalanteile im
Audiosignal anzunähern. Da es sich um rauschhafte Spektralanteile
handelt, wird nicht mehr die Phase der Spektralkoeffizienten
berücksichtigt, sondern lediglich die Energie
mehrerer Spektralkoeffizienten in einer Untergruppe. Die
Rauschersetzungseinrichtung 514 erzeugt abhängig von der
Energie in einer Untergruppe der zuletzt vorhandenen
intakten Audiodaten eine entsprechende Untergruppe von
Spektralkoeffizienten, wobei die Energie in der Untergruppe
der erzeugten Spektralkoeffizienten der Energie der entsprechenden
Untergruppe der vorausgehenden Spektralkoeffizienten
entspricht bzw. aus derselben abgeleitet ist. Die Phasen der
bei der Rauschersetzung erzeugten Spektralkoeffizienten werden
jedoch zufällig festgelegt.In the following, Fig. 3 is discussed, which is a preferred one
Further development of the error concealment device
of Fig. 2. In particular, the error concealment device
a
Der Rauschersetzungsschalter 518 wird durch ein Prädiktionsgewinnsignal
516 gesteuert. Allgemein bezieht sich der Prädiktionsgewinn
auf das Verhältnis des Ausgangssignals der
Einrichtung 504 zur Erzeugung von Schätzwerten zum Eingangssignal.
Wird festgestellt, daß sich in einem Subband das
Ausgangssignal relativ wenig von dem Eingangssignal unterscheidet,
so kann davon ausgegangen werden, daß das Audiosignal
in diesem Subband relativ stationär, d. h. tonal,
ist. Unterscheidet sich dagegen das Ausgangssignal des Prädiktors
sehr stark vom Eingangssignal, so kann davon ausgegangen
werden, daß das Signal instationär ist, d. h. atonal
oder rauschhaft. In diesem Fall wird eine Rauschersetzung
bessere Ergebnisse liefern als eine Prädiktion, da rauschhafte
Signale per se nicht zuverlässig vorhergesagt werden
können. So könnte beispielsweise der Rauschersetzungschalter
518 derart gesteuert werden, daß er die Vorwärtstransformationseinrichtung
506 mit der Fehler-Ersetzungs-Einrichtung
512 verbindet, wenn der Prädiktionsgewinn eine bestimmte
Schwelle überschreitet, bzw. daß die Rauschersetzungseinrichtung
514 mit der Fehler-Ersetzung-Einrichtung 512 verbunden
wird, wenn der Prädiktionsgewinn diese Schwelle unterschreitet,
um beide Substitutionsverfahren optimal zu
kombinieren.
Im Nachfolgenden wird bezugnehmend auf Fig. 4 auf das Verfahren
der erfindungsgemäßen Rauschsubstitution näher eingegangen.
Zunächst wird ein aktueller Satz von Spektralkoeffizienten
empfangen (10). Bei der Darstellung von Fig. 4 wird
aus Übersichtlichkeitsgründen davon ausgegangen, daß der aktuelle
Satz von Spektralkoeffizienten ausschließlich intakte
Spektralkoeffizienten aufweist oder aber bereits einem Fehlerverschleierungsverfahren
nach Fig. 2 oder 3 unterzogen
worden ist. Der aktuelle Satz von Spektralkoeffizienten wird
einerseits von der Filterbank 400 (Fig. 1) verarbeitet und
beispielsweise an einen Lautsprecher ausgegeben (12). Andererseits
wird der aktuelle Satz von Spektralkoeffizienten
dazu verwendet, einen folgenden Satz von Spektralkoeffizienten
vorherzusagen, d. h. zu schätzen bzw. zu prädizieren.
Dazu wird erfindungsgemäß eine Unterteilung des aktuellen
Satzes von Spektralkoeffizienten in Subbänder durchgeführt
(14). Im Falle eines langen Blockes findet die Unterteilung
in Subbänder derart statt, daß pro Satz lediglich ein Subband
mit einem entsprechenden Frequenzbereich erzeugt wird.
Im Falle von kurzen Blöcken wird der aktuelle Satz von Spektralkoeffizienten
eine Mehrzahl von zeitlich aufeinanderfolgenden
kompletten Spektren umfassen. Dann werden im Schritt
14 für jedes vollständige Spektrum entsprechende Subbänder
erzeugt, d. h. pro Satz von Spektralkoeffizienten mehrere
Subbänder.In the following, referring to FIG. 4, the method
the noise substitution according to the invention was discussed in more detail.
First, a current set of spectral coefficients
received (10). 4 is shown
assumed for reasons of clarity that the current
Set of spectral coefficients only intact
Has spectral coefficients or already an error concealment method
subjected to Fig. 2 or 3
has been. The current set of spectral coefficients will be
processed on the one hand by the filter bank 400 (FIG. 1) and
output to a loudspeaker, for example (12). on the other hand
becomes the current set of spectral coefficients
used a following set of spectral coefficients
predict, d. H. to estimate or to predict.
For this purpose, according to the invention, a division of the current
Set of spectral coefficients performed in subbands
(14). In the case of a long block, the subdivision takes place
in subbands in such a way that only one subband per set
is generated with a corresponding frequency range.
In the case of short blocks, the current set of spectral coefficients
a plurality of successive ones
complete spectra. Then in the
Nach der Unterteilung in Subbänder wird eine Rücktransformation
je Subband durchgeführt (16). Im Falle von langen Blökken,
d. h. die Anzahl der Spektralkoeffizienten eines Blocks
entspricht der Anzahl der Spektralkoeffizienten eines Satzes,
wird eine einzige Rücktransformation pro Subband durchgeführt,
bevor zur Prädiktion 18 übergegangen wird. Im Falle
von kurzen Blöcken werden mehrere Rücktransformationen entsprechend
der Subbänder jedes "kurzen" Spektrums durchgeführt,
bevor dann für sämtliche Subbänder zusammen eine Prädiktion
18 durchgeführt wird.After subdivision into subbands there is a reverse transformation
per subband (16). In the case of long blocks
d. H. the number of spectral coefficients of a block
corresponds to the number of spectral coefficients in a set,
a single inverse transformation is carried out per subband,
before moving on to
Die Prädiktion 18 findet im Quasi-Zeitbereich statt, d. h.
für jedes Subband-"Zeit"-Signal, um ein geschätztes Subbandzeitsignal
für den folgenden Satz zu erhalten. Dieses geschätzte
Quasi-Zeitsignal wird anschließend wieder einer
Vorwärtstransformation 20 unterzogen, wobei die Vorwärtstransformation
für einen langen Block wieder nur einmal
ausgeführt wird bzw. für kurze Blöcke N-mal, wobei N das
Verhältnis zwischen der Anzahl von Spektralkoeffizienten eines
langen Blocks zu der Anzahl von Spektralkoeffizienten
eines kurzen Blocks ist. The
Nach dem Schritt 20 liegen für jedes Subband geschätzte
Spektralkoeffizienten vor. In einem Schritt 22 wird die in
dem Schritt 14 eingeführte Unterteilung wieder rückgängig
gemacht, derart, daß nach dem Schritt 22 ein folgender Satz
von Spektralkoeffizienten vorliegt.After
In einem Schritt 24 wird von dem Decodierer der folgende
Satz von Spektralkoeffizienten empfangen. Dieser Satz wird
einer Fehlerdetektion 26 unterzogen, um festzustellen, ob
ein Spektralkoeffizient, mehrere Spektralkoeffizienten oder
sogar alle Spektralkoeffizienten des folgenden Satzes fehlerhaft
sind. Die Fehlerdetektion findet auf für Fachleute
bekannte Art und Weise statt, wobei beispielsweise die CRC-Checksum
(CRC = Cyclic Redundancy Code) über einem Frame
überprüft wird. Wird festgestellt, daß eine Checksum, die
aufgrund der übertragenen Daten berechnet wird, zu einer mit
den Daten übertragenen Checksum unterschiedlich ist, können
die geschätzten Spektralkoeffizienten, die durch den Schritt
22 erzeugt worden sind, statt der Spektralkoeffizienten des
fehlerhaften Blocks eingesetzt werden. Die fehlerhaften
Spektralkoeffizienten werden damit gegen die geschätzten
Spektralkoeffizienten ausgetauscht (28). Schließlich werden
die fehlerverschleierten Spektralkoeffizienten des folgenden
Satzes verarbeitet, um die zeitlichen Abtastwerte ausgeben
zu können (30).In
Das Flußdiagramm von Fig. 4 stellt gewissermaßen eine Augenblicksaufnahme
der Verarbeitung von einem Satz von Spektralkoeffizienten
zu einem nächsten Satz von Spektralkoeffizienten
dar. Wird das Flußdiagramm von Fig. 4 implementiert,
so wird selbstverständlich beispielsweise nur eine einzige
Filterbank 400 (Fig. 1) verwendet, um die Schritte 12 und 30
durchzuführen. Genauso wird selbstverständlich nur eine
einzige Einrichtung zum Empfangen des aktuellen Satzes von
Spektralkoeffizienten bzw. zum Empfangen des folgenden
Satzes von Spektralkoeffizienten vonnöten sein, um die
Schritte 10 und 24 zu implementieren. Die zeitliche Synchronität
für die Schritte 10 und 24 wird bei einer Vorrichtung,
die das erfindungsgemäße Verfahren implementiert, durch die
Zeitverzögerungsstufe 510 im Parallelzweig (Fig. 2) sichergestellt.The flow chart of Fig. 4 represents a snapshot, so to speak
processing a set of spectral coefficients
to a next set of spectral coefficients
If the flowchart of FIG. 4 is implemented,
for example, of course, only one
Filter bank 400 (FIG. 1) used to complete
Fig. 5 zeigt eine detailliertere Darstellung des allgemeinen
Blockdiagramms von Fig. 2 am Beispiel eines MPEG-2 AAC-Transformationscodierers,
der die erfindungsgemäße Fehlerverschleierungseinrichtung
500 aufweist. Wie es bereits bezugnehmend
auf Fig. 2 dargestellt worden ist, umfaßt die
Fehlerverschleierungseinrichtung 500 (Fig. 1) eine Einrichtung
520 zum Unterteilen der Blöcke von Spektralkoeffizienten
in vorzugsweise 32 Subbänder. Im Falle von langen Blökken
hat jedes Subband 32 Spektralkoeffizienten. Da die Subbänder
der kurzen Blöcke die gleichen Frequenzbereiche überstreichen,
hat im Falle von kurzen Blöcken jedes Subband 4
Spektralkoeffizienten. Eine Aufteilung eines gesamten Spektrums
in gleichgroße Subbänder wird aus Gründen der Einfachheit
bevorzugt, wobei jedoch eine Unterteilung in ungleiche
Subbänder ebenfalls möglich wäre, beispielsweise angelehnt
an die psychoakustischen Frequenzgruppen. Jedes Subband wird
daraufhin einer inversen modifizierten diskreten Cosinus-Transformation
unterzogen. Im Falle von langen Blöcken
läuft die IMDCT einmal ab und empfängt 32 Eingangswerte. Im
Falle von kurzen Blöcken werden acht aufeinanderfolgende
IMDCTs ausgeführt, und zwar jeweils mit 4 der Spektralkoeffizienten,
derart, daß sich am Ausgang wieder 32 Quasi-Zeitabtastwerte
ergeben. Diese werden dann dem Prädiktor 504
zugeführt, der wiederum 32 geschätzte Quasi-Zeitabtastwerte
erzeugt, die mittels der MDCT 506 transformiert werden. Im
Falle von langen Blöcken wird eine einzige MDCT mit 32
zeitlichen Werten durchgeführt, während im Falle von kurzen
Blöcken acht zeitlich aufeinanderfolgende MDCTS mit jeweils
4 Abtastwerten ausgeführt werden. Obwohl in Fig. 5 nur ein
Zweig für das nullte Subband dargestellt ist, sei
festgehalten, daß für jedes Subband ein identischer Zweig
existiert, wenn die Subbänder alle die gleiche Länge haben.
Haben die Subbänder unterschiedliche Längen, so sind die
Ordnungen der IMDCT bzw. der MDCT daran angepaßt. Für eine
praktische Implementation bietet sich eine parallele
Verarbeitung an. Selbstverständlich ist jedoch auch eine
serielle Verarbeitung der Subbänder hintereinander möglich,
wenn entsprechende Speicherkapazitäten vorgesehen werden.
Die Ausgangswerte der MDCT 506 für jedes Subband werden in
eine Einrichtung 522 zum Rückgängigmachen der Unterteilung,
d. h. in eine inverse Unterteilungseinrichtung, eingespeist,
um im Falle des bevorzugten Ausführungsbeispiels auf AAC-MDCT-Ebene
einen geschätzten Satz von Spektralwerten
auszugeben.Fig. 5 shows a more detailed representation of the general
2 using the example of an MPEG-2 AAC transform encoder,
the fault concealment device according to the
Fig. 6 zeigt eine weitere detaillierte Darstellung des Prädiktors
504. Das Herzstück des Prädiktors 504 ist beim bevorzugten
Ausführungsbeispiel ein sogenannter LMSL-Prädiktor
504a, der eine Länge n = 32 hat. Details über den LMSL-Prädiktor
sind in dem Buch "Adaptive Signal Processing", Bernard
Widrow, Samuel Stearns, Prentice-Hall, 1995, S. 99 ff.,
zu finden. Dem LMSL-Prädiktor 504a ist eine Zeitverzögerungsstufe
504b vorgeschaltet. Der Prädiktor 504 umfaßt
eingangsseitig ferner einen Parallel-Seriell-Wandler 504c
und ausgangseitig einen Seriell-Parallel-Wandler 504d.
Derselbe hat ferner eine Prädiktionsgewinnberechnungseinrichtung
504e, die das Ausgangssignal des Prädiktors 504a
mit dem Eingangssignal vergleicht, um feststellen zu können,
ob ein stationäres Signal oder ein instationäres Signal
verarbeitet worden ist. Die Prädiktionsgewinnberechnungseinrichtung
504e liefert ausgangsseitig das Prädiktionsgewinnsignal
516, das zur Steuerung des Schalters 518 (Fig. 3)
verwendet wird, um entweder prädizierte Spektralkoeffizienten
oder durch Rauschersetzung gewonnene Spektralkoeffizienten
zur Fehlerverschleierung zu verwenden. Der Prädiktor 504
umfaßt ferner in seiner Implemention als LMSL-Prädiktor zwei
Schalter 504f und 504g, die zwei Schalterstellungen haben.
Die Schalterstellung "1" betrifft den Fall, daß Spektralkoeffizienten
des folgenden Blocks fehlerfrei sind, während
die Schalterstellung "2" den Fall betrifft, daß Spektralkoeffizienten
des folgenden Satzes fehlerhaft sind. In Fig.
6 ist der Fall gezeichnet, bei dem die Spektralkoeffizienten
fehlerhaft sind. In diesem Fall wird am Schalter 504g statt
des Eingangssignals ein Referenzsignal mit einem Wert von 0
in den Prädiktor eingespeist. Im Fall von fehlerfreien Spektralkoeffizienten
(Schalterstellung "1" des Schalters 504g)
werden dagegen die Ausgangswerte des Parallel-Seriell-Wandlers
von unten in den LMSL-Prädiktor eingespeist.6 shows a further detailed illustration of the
Im Falle der Anwendung des erfindungsgemäßen Fehlerverschleierungsverfahrens im Zusammenhang mit einem AAC-Codierer wird es bevorzugt, für sämtliche Vorwärts- bzw. Rückwärtstransformationen die entsprechenden Transformationsalgorithmen (MDCT bzw. IMDCT) zu verwenden. Für die Fehlerverschleierung ist es jedoch nicht notwendig, daß zur Rückwärts- bzw. zur Vorwärtstransformation dasselbe Transformationsverfahren eingesetzt wird, das bei der Codierung des Audiosignals verwendet wurde, um die Spektralkoeffizienten zu bilden.In the case of using the error concealment method according to the invention in connection with an AAC encoder it is preferred for all forward and backward transformations the corresponding transformation algorithms (MDCT or IMDCT) to use. For the concealment of errors however, it is not necessary to move backwards or the same transformation method for the forward transformation is used in the coding of the Audio signal was used to measure the spectral coefficient to build.
Aufgrund der Unterteilung des Spektrums in Subbänder und aufgrund der einzelnen Transformationen für jedes Subband werden für jedes Subband Frequenz-Zeitbereichs-Transformationen mit niedrigerer Ordnung als der Frequenzauflösung entsprechend verwendet. Somit werden spezielle Schätzwerte für tonale Signalanteile in der Zwischenebene mittels des Prädiktors erzeugt. Als Vorwärtstransformation/Synthese werden Zeit-Frequenzbereich-Transformationen niedrigerer Ordnung als der ursprünglichen Frequenzauflösung entsprechend verwendet, wobei die gleiche Ordnung gewählt wird wie bei der benutzten Frequenz-Zeitbereichs-Transformation. Somit liefert die erfindungsgemäße Fehlerverschleierung einerseits Flexibilität unter Ausnutzung von Vorkenntnissen spektraler Eigenschaften von Audiosignalen und andererseits eine Unabhängigkeit von dem im Codierer verwendeten Transformationsverfahren durch Erzeugung der Schätzwerte im Quasi-Zeitsignal, also nicht auf Spektralkoeffizientenebene. Wenn die Prädiktion im Quasi-Zeitbereich zur Ersetzung tonaler Signalanteile eingesetzt wird, und wenn die Rauschersetzung für rauschhafte Spektralanteile verwendet wird, so können Fehler für eine große Klasse von Audiosignalen selbst bei vollständigem Blockverlust derart verschleiert werden, daß nahezu keine hörbaren Störungen auftreten. Versuche haben gezeigt, daß bei nicht allzu kritischen Testsignalen normale Hörer, d. h. ungeschulte Testhörer, selbst bei vollständigem Blockverlust nur in einem von 10 Fällen Unregelmäßigkeiten im Audiosignal gehört haben.Due to the division of the spectrum into subbands and based on the individual transformations for each subband are frequency-time domain transformations for each subband with lower order than the frequency resolution used accordingly. Thus, special estimates for tonal signal components in the intermediate level using the Predictor generated. As a forward transformation / synthesis Lower order time-frequency domain transformations than the original frequency resolution used with the same order as for the frequency-time domain transformation used. Consequently provides the error concealment according to the invention on the one hand Flexibility using previous knowledge spectral Properties of audio signals and on the other hand independence of the transformation method used in the encoder by generating the estimates in the quasi-time signal, not at the spectral coefficient level. If the Prediction in the quasi-time domain to replace tonal signal components is used and if the noise replacement is used for noisy spectral components, so Errors for a large class of audio signals themselves complete block loss are obscured such that almost no audible interference occur. Have attempts demonstrated that normal test signals are not critical Listener, d. H. untrained test listeners, even with complete ones Block loss only in 1 out of 10 irregularities heard in the audio signal.
Claims (13)
- A method for concealing an error in an encoded audio signal, where the encoded audio signal has successive sets of spectral coefficients, where a set of spectral coefficients is a spectral representation for a set of audio sampled values, comprising the following steps:subdividing (14) a current set of spectral coefficients into at least two sub-bands with different frequency ranges, where one sub-band of the at least two sub-bands has at least two spectral coefficients;reverse transforming (16) the spectral coefficients of the one sub-band to obtain a temporal representation of the at least two spectral coefficients of the one sub-band;performing (18) a prediction using the temporal representation of the at least two spectral coefficients of the one sub-band to obtain an estimated temporal representation for a sub-band of a set following the current set, where the sub-band of the following set has the same frequency range as the sub-band of the current set;forward transforming (20) the estimated temporal representation to obtain at least two estimated spectral coefficients for the sub-band of the following set;determining (26) whether a spectral coefficient of the sub-band of the following set is erroneous; andas reaction to the step of determining, if there is an erroneous spectral coefficient, using (28) an estimated spectral coefficient instead of an erroneous spectral coefficient of the following set so as to conceal the erroneous spectral coefficient of the following set.
- A method according to claim 1, wherein the one sub-band that is processed in the step of reverse transforming (16) has low-frequency spectral coefficients and the other of the at least two sub-bands has higher-frequency spectral coefficients.
- A method according to claim 1 or 2, wherein the number of spectral coefficients in a set of spectral coefficients is equal to the number of spectral coefficients in a block (702) of the first length and is N times the number of spectral coefficients in a block (704) of the second length, and wherein N blocks (704) of the second length follow each other, where
the step of subdividing (14) is performed in such a way that the sub-bands of the blocks of the first length have the same frequency ranges as the sub-bands of the blocks of the second length, so that the number of spectral coefficients of a sub-band of the block of the first length is equal to N times the number of spectral coefficients of the corresponding sub-band of the block of the second length;
the step of reverse transforming (16) is performed in succession for each corresponding sub-band of the N blocks of the second length to obtain a temporal representation of the spectral coefficients of the corresponding sub-bands of the N blocks of the second length;
the step of performing (18) a prediction is effected with the temporal representation of all the corresponding sub-bands of the N blocks of the second length; and
the step of forward transforming (20) is performed successively for each corresponding sub-band of the N blocks of the second length. - A method according to one of the preceding claims, wherein a plurality of sub-bands is generated in the step of subdividing (14) such that all the sub-bands together form the spectral representation of the encoded audio signal in a set of spectral coefficients.
- A method according to one of the preceding claims, wherein the following step is performed after the step of determining (26) whether a spectral coefficient of a sub-band is erroneous:determining (504e) whether the spectral coefficient represents a tonal portion of the uncoded audio signal by comparing the spectral coefficient with the corresponding estimated spectral coefficient;if the spectral coefficient is found to be tonal, using the estimated spectral coefficient, and, if the spectral coefficient is found to be non-tonal, performing a noise substitution (514) for an erroneous spectral coefficient of the following set.
- A method according to one of the claims 3 to 5, wherein the spectral coefficients are MDCT coefficients, the length of a set corresponds to the length of a long block and has 1024 MDCT coefficients, while a set of spectral coefficients comprises eight short-length blocks, each with 128 MDCT coefficients, and wherein 32 sub-bands, each with 32 MDCT coefficients for a long block or each with 4 MDCT coefficients for a short block, are formed in the step of subdividing.
- A method according to one of the preceding claims, wherein an adaptive back-coupled predictor (504a), preferably an LMSL predictor, is used in the step of performing (18) the prediction.
- A method according to one of the preceding claims, wherein the transform algorithm which forms the basis of the encoded audio signal is the same transform algorithm that is used in the step of reverse transforming (16) and in the step of forward transforming (20).
- A method according to one of the preceding claims, wherein the transform algorithm which is used in the step of reverse transforming (16) is the exact inverse of the transform algorithm that is used in the step of forward transforming (20).
- A method for decoding an encoded audio signal which comprises successive sets of spectral coefficients, wherein a set of spectral coefficients is a spectral representation for a set of audio sampled values:receiving (10) a current set of spectral coefficients;subdividing (14) a current set of spectral coefficients into at least two sub-bands with different frequency ranges, where one sub-band of the at least two sub-bands has at least two spectral coefficients;reverse transforming (16) the spectral coefficients of the one sub-band to obtain a temporal representation of the at least two spectral coefficients of the one sub-band;performing (18) a prediction using the temporal representation of the at least two spectral coefficients of the one sub-band to obtain an estimated temporal representation for a sub-band of a set following the current set, where the sub-band of the following set has the same frequency range as the sub-band of the current set;forward transforming (20) the estimated temporal representation to obtain at least two estimated spectral coefficients for the sub-band of the following set;receiving (24) a following set of spectral coefficients and subdividing the following set into sub-bands which cover the same frequency range as the sub-bands of the current set;determining (26) whether a spectral coefficient of the sub-band of the following set is erroneous;as reaction to the step of determining, if there is an erroneous spectral coefficient, using (28) an estimated spectral coefficient instead of an erroneous spectral coefficient of the following set so as to conceal the erroneous spectral coefficient of the following set; andprocessing (30) the following set using the estimated spectral coefficient used in the step of using (28) to obtain the following set of audio sampled values.
- A method according to claim 10, wherein the spectral coefficients of the encoded audio signal are entropy-coded and quantized, which includes the following steps before the step of receiving (10) the current set or the following set:cancelling (200) the entropy coding to obtain quantized spectral coefficients;requantizing (300) the quantized spectral coefficients to obtain requantized spectral coefficients;and wherein the step of processing includes the following step:reverse transforming (400) the following set using a transform algorithm which is inverse to the transform algorithm used for transforming to obtain the spectral coefficients of the encoded audio signal.
- A device for concealing an error in an encoded audio signal, where the encoded audio signal has successive sets of spectral coefficients, where a set of spectral coefficients is a spectral representation for a set of audio sampled values, with the following features:a unit (520) for subdividing (14) a current set of spectral coefficients into at least two sub-bands with different frequency ranges, where one sub-band of the at least two sub-bands has at least two spectral coefficients;a unit (502) for reverse transforming (16) the spectral coefficients of the one sub-band to obtain a temporal representation of the at least two spectral coefficients of the one sub-band;a unit (504) for performing (18) a prediction using the temporal representation of the at least two spectral coefficients of the one sub-band to obtain an estimated temporal representation for a sub-band of a set following the current set, where the sub-band of the following set has the same frequency range as the sub-band of the current set;a unit (506) for forward transforming (20) the estimated temporal representation to obtain at least two estimated spectral coefficients for the sub-band of the following set;a unit for determining (26) whether a spectral coefficient of the sub-band of the following set is erroneous; anda unit (512) for using (28) an estimated spectral coefficient instead of an erroneous spectral coefficient of the following set so as to conceal the erroneous spectral coefficient of the following set.
- A device for decoding an encoded audio signal which comprises successive sets of spectral coefficients, where a set of spectral coefficients is a spectral representation for a set of audio sampled values, comprising:a unit (100) for receiving (10) a current set of spectral coefficients;a unit (520) for subdividing (14) a current set of spectral coefficients into at least two sub-bands with different frequency ranges, where one sub-band of the at least two sub-bands has at least two spectral coefficients;a unit (502) for reverse transforming (16) the spectral coefficients of the one sub-band to obtain a temporal representation of the at least two spectral coefficients of the one sub-band;a unit (504) for performing (18) a prediction using the temporal representation of the at least two spectral coefficients of the one sub-band to obtain an estimated temporal representation for a sub-band of a set following the current set, where the sub-band of the following set has the same frequency range as the sub-band of the current set;a unit (506) for forward transforming (20) the estimated temporal representation to obtain at least two estimated spectral coefficients for the sub-band of the following set;a unit (502, 510) for receiving (24) a following set of spectral coefficients and for subdividing the following set into sub-bands which cover the same frequency range as the sub-bands of the current set;a unit for determining (26) whether a spectral coefficient of the sub-band of the following set is erroneous;a unit (512) for using (28) an estimated spectral coefficient instead of an erroneous spectral coefficient of the following set so as to conceal the erroneous spectral coefficient of the following set; anda unit for processing (30) the following set using the estimated spectral coefficient to obtain the following set of audio sampled values.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19921122A DE19921122C1 (en) | 1999-05-07 | 1999-05-07 | Method and device for concealing an error in a coded audio signal and method and device for decoding a coded audio signal |
DE19921122 | 1999-05-07 | ||
PCT/EP2000/003294 WO2000068934A1 (en) | 1999-05-07 | 2000-04-12 | Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1145227A1 EP1145227A1 (en) | 2001-10-17 |
EP1145227B1 true EP1145227B1 (en) | 2002-07-24 |
Family
ID=7907325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP00926896A Expired - Lifetime EP1145227B1 (en) | 1999-05-07 | 2000-04-12 | Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal |
Country Status (6)
Country | Link |
---|---|
US (1) | US7003448B1 (en) |
EP (1) | EP1145227B1 (en) |
JP (1) | JP3623449B2 (en) |
AT (1) | ATE221244T1 (en) |
DE (2) | DE19921122C1 (en) |
WO (1) | WO2000068934A1 (en) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
DE19959038A1 (en) * | 1999-12-08 | 2001-06-28 | Bosch Gmbh Robert | Process for decoding digital audio data |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
US7428684B2 (en) | 2002-04-29 | 2008-09-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for concealing an error |
DE10219133B4 (en) * | 2002-04-29 | 2007-02-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for obscuring an error |
SE527669C2 (en) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Improved error masking in the frequency domain |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
WO2005086138A1 (en) * | 2004-03-05 | 2005-09-15 | Matsushita Electric Industrial Co., Ltd. | Error conceal device and error conceal method |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US8326606B2 (en) * | 2004-10-26 | 2012-12-04 | Panasonic Corporation | Sound encoding device and sound encoding method |
KR100668319B1 (en) * | 2004-12-07 | 2007-01-12 | 삼성전자주식회사 | Method and apparatus for transforming an audio signal and method and apparatus for encoding adaptive for an audio signal, method and apparatus for inverse-transforming an audio signal and method and apparatus for decoding adaptive for an audio signal |
KR100708123B1 (en) * | 2005-02-04 | 2007-04-16 | 삼성전자주식회사 | Method and apparatus for controlling audio volume automatically |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
JP2006276877A (en) * | 2006-05-22 | 2006-10-12 | Nec Corp | Decoding method for converted and encoded data and decoding device for converted and encoded data |
KR101291193B1 (en) | 2006-11-30 | 2013-07-31 | 삼성전자주식회사 | The Method For Frame Error Concealment |
EP2092790B1 (en) * | 2006-12-07 | 2010-07-07 | AKG Acoustics GmbH | Dropout concealment for a multi-channel arrangement |
US20090048828A1 (en) * | 2007-08-15 | 2009-02-19 | University Of Washington | Gap interpolation in acoustic signals using coherent demodulation |
US8126578B2 (en) * | 2007-09-26 | 2012-02-28 | University Of Washington | Clipped-waveform repair in acoustic signals using generalized linear prediction |
US9300469B2 (en) * | 2008-01-21 | 2016-03-29 | Nippon Telegraph And Telephone Corporation | Secure computing system, secure computing method, secure computing apparatus, and program therefor |
WO2010111841A1 (en) * | 2009-04-03 | 2010-10-07 | 华为技术有限公司 | Predicting method and apparatus for frequency domain pulse decoding and decoder |
JP2011257575A (en) * | 2010-06-09 | 2011-12-22 | Cri Middleware Co Ltd | Speech processing device, speech processing method, program and recording medium |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
EP2458585B1 (en) * | 2010-11-29 | 2013-07-17 | Nxp B.V. | Error concealment for sub-band coded audio signals |
SG185519A1 (en) | 2011-02-14 | 2012-12-28 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
TWI488177B (en) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
CA2827000C (en) * | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
ES2639646T3 (en) | 2011-02-14 | 2017-10-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of track pulse positions of an audio signal |
MX2013009304A (en) | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result. |
ES2529025T3 (en) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
JP5973582B2 (en) | 2011-10-21 | 2016-08-23 | サムスン エレクトロニクス カンパニー リミテッド | Frame error concealment method and apparatus, and audio decoding method and apparatus |
KR102037691B1 (en) | 2013-02-05 | 2019-10-29 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | Audio frame loss concealment |
KR101788484B1 (en) | 2013-06-21 | 2017-10-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | Audio decoding with reconstruction of corrupted or not received frames using tcx ltp |
PT3285255T (en) | 2013-10-31 | 2019-08-02 | Fraunhofer Ges Forschung | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
JP6306177B2 (en) | 2013-10-31 | 2018-04-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Audio decoder and decoded audio information providing method using error concealment to modify time domain excitation signal and providing decoded audio information |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
US10763885B2 (en) | 2018-11-06 | 2020-09-01 | Stmicroelectronics S.R.L. | Method of error concealment, and associated device |
US10784988B2 (en) | 2018-12-21 | 2020-09-22 | Microsoft Technology Licensing, Llc | Conditional forward error correction for network data |
US10803876B2 (en) * | 2018-12-21 | 2020-10-13 | Microsoft Technology Licensing, Llc | Combined forward and backward extrapolation of lost network data |
CN111711493B (en) * | 2020-06-16 | 2022-03-11 | 中国电子科技集团公司第三研究所 | Underwater communication equipment with encryption and decryption capabilities, transmitter and receiver |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5752225A (en) * | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
JPH03245370A (en) | 1990-02-22 | 1991-10-31 | Matsushita Electric Ind Co Ltd | Voice band dividing decoder |
US5455833A (en) * | 1990-10-25 | 1995-10-03 | Fraunhofer Gesellschaft Zur Forschung E.V. | Process for the detecting of errors in the transmission of frequency-coded digital signals |
JPH07123242B2 (en) | 1993-07-06 | 1995-12-25 | 日本電気株式会社 | Audio signal decoding device |
KR970011728B1 (en) * | 1994-12-21 | 1997-07-14 | 김광호 | Error chache apparatus of audio signal |
JPH08328599A (en) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpeg audio decoder |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
DE19735675C2 (en) * | 1997-04-23 | 2002-12-12 | Fraunhofer Ges Forschung | Method for concealing errors in an audio data stream |
AU4201100A (en) * | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system |
-
1999
- 1999-05-07 DE DE19921122A patent/DE19921122C1/en not_active Expired - Lifetime
-
2000
- 2000-04-12 DE DE50000306T patent/DE50000306D1/en not_active Expired - Lifetime
- 2000-04-12 EP EP00926896A patent/EP1145227B1/en not_active Expired - Lifetime
- 2000-04-12 AT AT00926896T patent/ATE221244T1/en active
- 2000-04-12 US US09/980,534 patent/US7003448B1/en not_active Expired - Lifetime
- 2000-04-12 WO PCT/EP2000/003294 patent/WO2000068934A1/en active IP Right Grant
- 2000-04-12 JP JP2000617440A patent/JP3623449B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1145227A1 (en) | 2001-10-17 |
JP3623449B2 (en) | 2005-02-23 |
ATE221244T1 (en) | 2002-08-15 |
DE19921122C1 (en) | 2001-01-25 |
US7003448B1 (en) | 2006-02-21 |
DE50000306D1 (en) | 2002-08-29 |
WO2000068934A1 (en) | 2000-11-16 |
JP2002544550A (en) | 2002-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1145227B1 (en) | Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal | |
EP0954909B1 (en) | Method for coding an audio signal | |
DE19747132C2 (en) | Methods and devices for encoding audio signals and methods and devices for decoding a bit stream | |
DE602004005197T2 (en) | DEVICE AND METHOD FOR CODING AN AUDIO SIGNAL AND DEVICE AND METHOD FOR DECODING A CODED AUDIO SIGNAL | |
EP1697930B1 (en) | Device and method for processing a multi-channel signal | |
DE69923555T2 (en) | METHOD AND DEVICE FOR ENTROPYING THE CODING OF QUANTIZED TRANSFORMATION COEFFICIENTS OF A SIGNAL | |
EP1230827B1 (en) | Method and device for processing a stereo audio signal | |
EP1953739B1 (en) | Method and device for reducing noise in a decoded signal | |
WO1999004505A1 (en) | Method for signalling a noise substitution during audio signal coding | |
EP0978172B1 (en) | Method for masking defects in a stream of audio data | |
DE102006051673A1 (en) | Apparatus and method for reworking spectral values and encoders and decoders for audio signals | |
EP1023777B1 (en) | Method and device for limiting a stream of audio data with a scaleable bit rate | |
DE102007029381A1 (en) | Digital signal e.g. audio signal, processing device, has decision section, which assumes forecast data before deletion as interpolation data, when absolute value is lower than resolution | |
DE102004009949A1 (en) | Device and method for determining an estimated value | |
DE19742201C1 (en) | Method of encoding time discrete audio signals, esp. for studio use | |
DE112008003153B4 (en) | Frequency band determination method for shaping quantization noise | |
DE10065363B4 (en) | Apparatus and method for decoding a coded data signal | |
DE3733786C2 (en) | ||
DE19735675A1 (en) | Method for concealing errors in an audio data stream | |
DE102005032079A1 (en) | Noise suppression process for decoded signal comprise first and second decoded signal portion and involves determining a first energy envelope generating curve, forming an identification number, deriving amplification factor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20010730 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
GRAG | Despatch of communication of intention to grant |
Free format text: ORIGINAL CODE: EPIDOS AGRA |
|
GRAG | Despatch of communication of intention to grant |
Free format text: ORIGINAL CODE: EPIDOS AGRA |
|
GRAH | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOS IGRA |
|
17Q | First examination report despatched |
Effective date: 20011228 |
|
GRAH | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOS IGRA |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AT CH DE FR GB LI NL |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
REF | Corresponds to: |
Ref document number: 221244 Country of ref document: AT Date of ref document: 20020815 Kind code of ref document: T |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: GERMAN |
|
REF | Corresponds to: |
Ref document number: 50000306 Country of ref document: DE Date of ref document: 20020829 |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) |
Effective date: 20020813 |
|
ET | Fr: translation filed | ||
LTIE | Lt: invalidation of european patent or patent extension |
Effective date: 20020724 |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FD4D Ref document number: 1145227E Country of ref document: IE |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20030425 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PFA Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWA Free format text: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWANDTEN FORSCHUNG E.V.#LEONRODSTRASSE 54#80636 MUENCHEN (DE) -TRANSFER TO- FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWANDTEN FORSCHUNG E.V.#HANSASTRASSE 27 C#80686 MUENCHEN (DE) |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 17 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 18 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 19 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: NL Payment date: 20190418 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20190418 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20190423 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: CH Payment date: 20190424 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20190424 Year of fee payment: 20 Ref country code: AT Payment date: 20190416 Year of fee payment: 20 |
|
REG | Reference to a national code |
Ref country code: DE Ref legal event code: R071 Ref document number: 50000306 Country of ref document: DE |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL Ref country code: NL Ref legal event code: MK Effective date: 20200411 |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: PE20 Expiry date: 20200411 |
|
REG | Reference to a national code |
Ref country code: AT Ref legal event code: MK07 Ref document number: 221244 Country of ref document: AT Kind code of ref document: T Effective date: 20200412 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION Effective date: 20200411 |