WO2001043320A2 - Verfahren zur dekodierung von digitalen audiodaten - Google Patents

Verfahren zur dekodierung von digitalen audiodaten Download PDF

Info

Publication number
WO2001043320A2
WO2001043320A2 PCT/DE2000/003896 DE0003896W WO0143320A2 WO 2001043320 A2 WO2001043320 A2 WO 2001043320A2 DE 0003896 W DE0003896 W DE 0003896W WO 0143320 A2 WO0143320 A2 WO 0143320A2
Authority
WO
WIPO (PCT)
Prior art keywords
audio data
reference values
digital audio
frame
frequency range
Prior art date
Application number
PCT/DE2000/003896
Other languages
English (en)
French (fr)
Other versions
WO2001043320A3 (de
Inventor
Claus Kupferschmidt
Torsten Mlasko
Marc Klein Middelink
Original Assignee
Robert Bosch Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch Gmbh filed Critical Robert Bosch Gmbh
Priority to DE50014248T priority Critical patent/DE50014248D1/de
Priority to JP2001543884A priority patent/JP2004500599A/ja
Priority to US10/149,317 priority patent/US7080006B1/en
Priority to EP00981165A priority patent/EP1238481B1/de
Publication of WO2001043320A2 publication Critical patent/WO2001043320A2/de
Publication of WO2001043320A3 publication Critical patent/WO2001043320A3/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/10Aspects of broadcast communication characterised by the type of broadcast system
    • H04H2201/20Aspects of broadcast communication characterised by the type of broadcast system digital audio broadcasting [DAB]

Definitions

  • the invention relates to a method for decoding digital audio data according to the type of the independent claim.
  • Samples are divided into time-separated groups of 12 samples each. A maximum of one scale factor is defined for each group. If two or all three scale factors of a frequency range are the same or at least with very similar values, then this is the case
  • Scale factors only transfer one scale factor. Within a DAB frame, in which the samples and their scale factors are transmitted, it is therefore signaled for which group or groups of samples for a frequency range a respective scale factor is to be used. These scale factors have the largest in a respective group or groups of samples
  • the patent claim has the advantage that an error is detected by means of a plausibility check in order to then initiate error correction or concealment processes.
  • the process is simple and uses the property of audio data that there are no large jumps in its temporal course. Therefore, advantageously, a comparison of temporally successive reference values, which depend on the audio data, leads to a meaningful result as to whether there is an error or not.
  • the method according to the invention is advantageously simple and can be implemented in any audio decoder.
  • the method according to the invention can be applied to further audio decoding methods (standards).
  • standards include MPEG-1, MPEG-2 and MPEG-4.
  • the standards may or may not have their own error calculation.
  • the measures listed in the dependent claims allow advantageous developments and improvements of the method specified in the independent claim.
  • a close correlation between the reference values which are scale factors for DAB, is advantageously used to determine whether an error is present.
  • Audio data entails that temporally adjacent data are closely correlated with one another. This is a property of language and music.
  • the feature is determined by means of a difference or averaging, as a result of which a meaningful, clear and simple decision is made as to whether there is an error or not.
  • the method according to the invention is therefore independent of a type of signal, because it can
  • Calculation method can be used, which is optimal for a particular signal.
  • Bit sequence preferably a flag, takes place, which enables a simple evaluation of this decision.
  • substitute values known as default in English
  • substitute values are entered as reference values and that these substitute values are then identified as such, so that the fault detection according to the invention is not carried out here because otherwise an error was mistakenly assumed.
  • suitable substitute values can be determined so that the error detection can be carried out for all frequency values.
  • Substitute values that lead to a feature that does not indicate an error that is to say an adaptive determination of the substitute values, are advantageously determined. This simplifies the procedure since the special case of the replacement value does not have to be intercepted.
  • FIG. 1 shows an MPEGl Layer II frame
  • Figure 2 is a block diagram of the inventive method.
  • these reference values represent the strongest signal values to which the other signal values in these frequency ranges are standardized. This reduces the maximum difference between the amplitudes of the audio signal values.
  • the signal values are then denormalized in the receiver by means of the reference values likewise transmitted.
  • DAB digital radio transmission method
  • the source coding in the transmitter removes an irrelevance from the digital raw data, for example voice data as PCM (pulse code modulation) data.
  • PCM pulse code modulation
  • redundancy is added again in a channel coding after the source coding. This redundancy is used on the receiver side, to perform error detection and correction during channel decoding.
  • source decoding which follows channel decoding, also has error detection and correction here. The error detection and, if necessary, correction during the source decoding is carried out on the data already decoded by the channel decoding. However, if many errors occur, this error detection and correction fails during source decoding and the audio quality is poor. Error correction in source decoding is also to be understood as error concealment.
  • a feature is therefore generated which is suitable for additional error protection in the source decoding in order to determine in a further stage whether an error has occurred.
  • the method according to the invention is thus based on the already existing methods. This applies to error detection and correction by
  • Reference values for source decoding If there are errors here, the reference values recognized as incorrect are replaced by previous reference values that have been saved. The reference values are thus monitored for errors using two methods.
  • the method according to the invention can also act as the sole error detection when decoding the digital audio data, because it is independent of other error detection methods and of the frame structure.
  • the MPEG-1 Layer II frame begins with a frame header 1, followed by a field 2 for frame error detection.
  • a checksum is used here, referred to in English as a cyclic redundancy check. If a defective frame has been identified on the basis of the checksum, then a suitable frame will replace the defective frame, for example the previous frame can be used for this, or the defective frame is muted. Alternatively, a prediction can also be made. A frame that is not corrected and thus incorrect is calculated from correctly received or corrected frames. Using suitable models, this can be estimated and thus predicted.
  • the checksum is designed in such a way that it cannot recognize all errors that may occur for reasons of transmission efficiency. In such a case, the checksum fails. In the case of a checksum, however, several superimposed errors can also correct each other, so that in such a case, no error is erroneously detected by means of the checksum.
  • test of a bit sum is characteristic of the checksum, with the content of the audio data being omitted, as is the case with the method according to the invention.
  • the audio signals are quantized.
  • a nonlinear quantization is carried out using a psychoacoustic quantization curve. Noises that are close in terms of frequency to a sound that stands out from the sound spectrum are no longer perceived by the ear. This is known as the listening threshold. This makes it possible to reduce the data rate by removing those noises that are below the listening threshold from the data.
  • the various frequency ranges are also quantized to different degrees, the fineness of the quantization being determined by the fact that the quantization noise is still below the listening limit.
  • This different quantization per frequency range means that different numbers of bits have to be allocated per frequency range. For example, the bit allocation varies between 3 and 16 bits per frequency range. A reference value selection is made in the next field 4.
  • the reference values themselves are then stored in field 5.
  • the actual audio data, which are denormalized with the reference values, are stored in field 6.
  • field 7 there is additional data that includes information accompanying the program and above all the checksum for the reference values of the following frame.
  • FIG. 2 shows a block diagram of the method according to the invention.
  • the audio data are available at an input 8.
  • an error detection of the reference values of the past frame is carried out.
  • a feature is extracted from the current frame in which the reference values of the past frame and the current frame are subtracted from one another. If the sum is above a predetermined threshold value, the difference is so great that there is no correlation between the two reference values, which actually cannot occur with audio data. Therefore, this case is recognized as an error.
  • averaging can also be used, for example to calculate a standard deviation. If the standard deviation is above a predefined threshold value, this is recognized as an error.
  • block 11 there is a decision maker who compares the difference between the successive reference values with the predetermined threshold value and makes a corresponding output, i.e. if there is an error, a bit is set to 1, if there is no error, this bit remains at 0. This bit is also called a flag.
  • the link 12 is designed such that the decision as to whether there is an error is determined by means of a logical OR link, i.e. Errors are signaled by a 1, no error by a 0, so that both, the error detection by means of a checksum and the feature analysis, must not indicate an error if no error is to be detected.
  • a substitute value a default
  • the difference between a default and another reference value can lead to an indication of an error.
  • This substitute value must be characteristic, whereby it usually does not occur in the audio data, so that in this case the formation of the difference is omitted and here only the error detection for the reference values is carried out by means of a checksum. This means that the flag for the error detection of the reference values remains at 0.
  • the substitute value can also be designed such that the feature formed with the substitute value is always below the threshold value for the error detection. This will align the replacement value with the reference values. In principle, the corresponding reference value can then simply be taken, so that a difference image is zero.
  • the decision is signaled as to whether there is an error or not. If there is an error, stored reference values from a past frame that was correctly transmitted are used instead of the incorrect reference value. If there is no error, all reference values from this frame are used.
  • This data includes gain factors that are necessary per frequency range for determining an optimal modulation range and that depend on the audio data.
  • other data can also be used for the method according to the invention. The only requirement is the close correlation with the audio data.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Circuits Of Receivers In General (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Es wird ein Verfahren zur Dekodierung von digitalen Audiodaten vorgeschlagen, das dazu dient, eine Fehlererkennung in Abhängigkeit von übertragenen Referenzwerten, vorzugsweise Skalenfaktoren, durchzuführen. Das erfindungsgemäße Verfahren umfaßt den Vergleich von Referenzwerten eines Frequenzbereichs mit vorhergehenden Referenzwerten des gleichen Frequenzbereichs, um ein Merkmal zu erzeugen, das mit einem Schwellwert verglichen wird, und das, wenn das Merkmal über dem vorgegebenen Schwellwert liegt, dies mittels einer Signalisierung angezeigt wird. In einer Weiterbildung der Erfindung ist vorgesehen, daß in Frequenzbereichen, in denen keine Audiodaten übertragen werden, ein Ersatzwert eingetragen wird, der dazu führt, daß für diesen Frequenzbereich kein Merkmal erzeugt wird.

Description

Verfahren zur Dekodierung von digitalen Audiodaten
Stand der Technik
Die Erfindung geht aus von einem Verfahren zur Dekodierung von digitalen Audiodaten nach der Gattung des unabhängigen Patentanspruchs .
Es ist bereits bekannt, daß bei DAB (Digital Audio Broadcasting) sendeseitig das gesamte Frequenzspektrum der zu übertragenden digitalen Audiosignale in Frequenzbereiche aufgeteilt wird. Diese Frequenzbereiche werden im englischen mit Subbands bezeichnet. Pro Frequenzbereich werden maximal drei Skalenfaktoren als Referenzwerte festgelegt. In jedem Frequenzbereich werden pro Kanal bei Stereoubertragungen 36 Abtastwerte zeitlich hintereinander erzeugt. Die 36
Abtastwerte werden in zeitlich voneinander getrennte Gruppen zu je 12 Abtastwerten aufgeteilt. Pro Gruppe wird maximal ein Skalenfaktor definiert. Sind zwei oder alle drei Skalenfaktoren eines Frequenzbereichs gleich oder zumindest mit sehr ahnlichen Werten, dann wird für diese
Skalenfaktoren nur ein Skalenfaktor übertragen. Innerhalb eines DAB-Rahmens, in dem die Abtastwerte und ihre Skalenfaktoren übertragen werden, wird daher signalisiert, für welche Gruppe oder Gruppen von Abtastwerten für einen Frequenzbereich ein jeweiliger Skalenfaktor zu verwenden ist. Diese Skalenfaktoren weisen in einer jeweiligen Gruppe oder Gruppen von Abtastwerten den größten
Signalleistungswert auf. Die übrigen Signalwerte in dieser Gruppe oder in diesen Gruppen werden auf diesen Skalenfaktor normiert. Im Empfanger werden dann Fehlererkennung und
-korrekturverfahren bei der Quellendekodierung durchgeführt, nachdem solche Verfahren bei einer vorhergehenden Kanaldekodierung durchgeführt wurden. Diese Fehlererkennung und -korreknurverfahren wahrend der Quellendekodierung betreffen sowohl den DAB-Rahmen als auch die Skalenfaktoren. Dann werden die digitalen Audiodaten mittels der Skalenfaktoren denormiert, und eine Dekodierung der Audiodaten findet statt.
Vorteile der Erfindung
Das erfindungsgemaße Verfahren zur Dekodierung von digitalen Audiodaten mit den Merkmalen des unabhängigen
Patentanspruchs hat demgegenüber den Vorteil, daß mittels einer Plausibilitatsuntersuchung ein Fehler erkannt wird, um dann Fehlerkorrektur- oder verschleierungsverfahren einzuleiten. Das Verfahren ist einfach und nutzt die Eigenschaft von Audiodaten, daß in ihrem zeitlichen Verlauf keine großen Sprunge auftreten. Daher fuhrt vorteilhafterweise eine Vergleichsbildung von zeitlich aufeinanderfolgenden Referenzwerten, die von den Audiodaten abhangen, zu einem aussagekraftigen Ergebnis, ob ein Fehler vorliegt oder nicht.
Das erfindungsgemaße Verfahren ist vorteilhafterweise einfach und kann in jedem Audiodekoder implementiert werden. Darüber hinaus ist das erfindungsgemaße Verfahren auf weitere Audiodekodierungsverfahren (Standards) anwendbar. Zu diesen Standards gehören MPEG-1, MPEG-2 und MPEG-4. Die Standards können eine eigene Fehlerberechung aufweisen oder nicht . Durch die in den abhangigen Ansprüchen aufgeführten Maßnahmen sind vorteilhafte Weiterbildungen und Verbesserungen des im unabhängigen Patentanspruch angegebenen Verfahrens möglich.
Darüber hinaus ist es von Vorteil, daß eine mehrstufige Fehlererkennung durchgeführt wird, denn zu den oben genannten Fehlererkennungs- und -korrekturvefahren, zum Beispiel bei DAB, wird ein weiteres Verfahren hinzugenommen, um weitere Fehler aufzuspüren.
Vorteilhafterweise wird bei dem erfindungsgemaßen Verfahren eine enge Korrelation zwischen den Referenzwerten, die bei DAB Skalenfaktoren sind, ausgenutzt, um festzustellen, ob ein Fehler vorliegt. Audiodaten bringen es mit sich, daß zeitlich benachbarte Daten miteinander in einer engen Korrelation stehen. Dies ist eine Eigenschaft der Sprache und Musik.
Besonders vorteilhaft ist, daß das Merkmal mittels einer Differenz- oder Mittelwertbildung ermittelt wird, wodurch eine aussagekraftige, überschaubare und einfache Entscheidung getroffen wird, ob ein Fehler vorliegt oder nicht. Außerdem ist damit das erfindungsgemaße Verfahren unabhängig von einer Signalart, denn es kann die
Berechnungsmethode verwendet werden, die für ein jeweiliges Signal optimal ist.
Darüber hinaus ist es von Vorteil, daß die Signalisierung der Entscheidung, ob ein Fehler vorliegt, mittels einer
Bitfolge, vorzugsweise eines Flags, erfolgt, wodurch eine einfache Auswertung dieser Entscheidung möglich ist.
Weiterhin ist es von Vorteil, daß durch eine Verknüpfung der Auswertung des Merkmals und der Fehlererkennung der Referenzwerte eine Gesamtaussage getroffen wird, wobei der Auswertung des Merkmals ein Übergewicht gegeben wird, da hier eine sachliche Beziehung zwischen zeitlich aufeinanderfolgenden Referenzwerten, nämlich eine enge Korrelation zwischen den Audiodaten, ausgenutzt wird.
Des weiteren ist es von Vorteil, daß neben den Referenzwerten, vorzugsweise den Skalenfaktoren, auch Rahmen, die zur Übertragung der digitalen Audiodaten genutzt werden, eine Fehlererkennung aufweisen. Dadurch wird m einfacher Weise ein doppelter Fehlerschutz realisiert.
Weiterhin ist es von Vorteil, daß wenn in einem Frequenzbereich keine Daten übertragen werden, sogenannte Ersatzwerte, im Englischen als Default bekannt, als Referenzwerte eingetragen werden und daß dann diese Ersatzwerte als solche identifiziert werden, so daß die erfindungsgemaße Fehlererkennung hier nicht durchgeführt wird, da ansonsten irrtümlicherweise ein Fehler angenommen werden wurde.
Darüber hinaus können geeignete Ersatzwerte bestimmt werden, so daß die Fehlererkennung für alle Frequenzwerte durchgeführt werden kann. Dabei werden vorteilhafterweise solche Ersatzwerte bestimmt, die zu einem Merkmal fuhren, das keinen Fehler indiziert, also eine adaptive Bestimmung der Ersatzwerte. Das vereinfacht das Verfahren, da der Sonderfall des Ersatzwerts nicht abgefangen werden muß.
Zeichnung
Ausfuhrungsbeispiele der Erfindung sind in der Zeichnung dargestellt und in der nachfolgenden Beschreibung naher erläutert. Es zeigen Figur 1 einen MPEGl Layer II Rahmen und Figur 2 ein Blockschaltbild des erfindungsgemaßen Verfahrens .
Beschreibung der Ausfuhrungsbeispiele
Bei den digitalen Ubertragungsverfahren, wie zum Beispiel DAB (Digital Audio Broadcasting) , werden sendeseitig sogenannte Skalenfaktoren verwendet, die hier im folgenden als Referenzwerte bezeichnet werden. Weiter unten wird jedoch gezeigt, daß auch andere charakteristische Daten, die von den Audiodaten abhangen, als Referenzwerte verwendet werden können.
Diese Referenzwerte repräsentieren in aufeinanderfolgenden Frequenzbereichen die stärksten Signalwerte, auf die die übrigen Signalwerte in diesen Frequenzbereichen normiert werden. Damit wird die maximale Differenz zwischen den Amplituden der Audiosignalwerte reduziert. Im Empfanger werden dann die Signalwerte mittels der ebenso übertragenen Referenzwerte denormiert.
Neben DAB, das insbesondere für den mobilen Empfang von Horfunkprogrammen und anderen Multimediadaten geeignet ist, gilt das hier Dargestellte auch für andere digitale Rundfunkubertragungsverfahren, wie DVB (Digital Video
Broadcasting) und DRM (Digital Radio Mondial) oder weitere Verfahren.
Bei digitalen Ubertragungsverfahren wie DAB werden durch die Quellenkodierung im Sender eine Irrelevanz aus den digitalen Rohdaten, z.B. Sprachdaten als PCM (Pulscodemodulation) - Daten, entnommen. Um die zu übertragenen Daten vor Ubertragungsfehlern zu schützen, wird nach der Quellenkodierung Redundanz in einer Kanalkodierung wieder hinzugefugt. Diese Redundanz wird empfangerseitig verwendet, um eine Fehlererkennung und -korrektur wahrend der Kanaldekodierung durchzufuhren. Darüber hinaus weist eine Quellendekodierung, die nach der Kanaldekodierung folgt, hier auch eine Fehlererkennung und -korrektur zusatzlich auf. Die Fehlererkennung und gegebenenfalls -korrektur wahrend der Quellendekodierung wird an den durch die Kanaldekodierung bereits dekodierten Daten durchgeführt. Treten jedoch viele Fehler auf, versagt diese Fehlererkennung und -korrektur wahrend der Quellendekodierung, und es kommt zu einer schlechten Audioqualitat . Unter Fehlerkorrektur ist bei der Quellendekodierung auch eine Fehlerverschleierung zu verstehen.
Bei digital kodierten Audiodaten kann ein nicht korrigierbarer Fehler zu einem deutlich bemerkbaren und damit hörbaren Fehler fuhren, der für einen Hörer weit unangenehmer ist, als es bei analogen, fehlerbehafteten Audiosignalen der Fall ist. Hier liegt nämlich ein gleitender Übergang von sehr guter Audioqualitat bis zur sehr schlechten Audioqualitat vor, wobei selbst bei schlechter Qualität immer noch ein Nutzsignal hörbar ist.
Dies ist bei digitalen Audiodaten eben nicht der Fall: Kann die Kanaldekodierung nicht mehr alle auftretenden Fehler empfangsseitig korrigieren, dann werden bei DAB zunächst die Abtastwerte betroffen, und es kommt zu einem gurgelnden Störgeräusch. Treten immer mehr Fehler auf, werden auch die Skalenfaktoren als Referenzwerte betroffen, so daß dann krachende Störgeräusche auftreten. Werden auch noch ganze Rahmen wiederholt fehlerhaft übertragen, tritt eine Stummschaltung ein. Daher ist hier auf eine sichere Fehlererkennung und - korrektur größten Wert zu legen, um ein hörbares Auftreten von Fehlern auf ein absolutes Minimum zu reduzieren.
Erfindungsgemaß wird daher ein Merkmal generiert, das für einen zusatzlichen Fehlerschutz bei der Quellendekodierung geeignet ist, um in einer weiteren Stufe festzustellen, ob ein Fehler vorliegt. Das erfindungsgemaße Verfahren setzt also hier auf die bereits vorhandenen Verfahren auf. Dies betrifft hier die Fehlererkennung und -korrektur von
Referenzwerten bei der Quellendekodierung. Liegen hier nun Fehler vor, werden die als fehlerhaft erkannten Referenzwerte durch vorhergehende Referenzwerte, die abgespeichert wurden, ersetzt. Die Referenzwerte werden damit durch zwei Verfahren auf Fehler hin überwacht.
Alternativ kann das erfindungsgemaße Verfahren auch als alleinige Fehlererkennung bei der Dekodierung der digitalen Audiodaten wirken, weil es von anderen Fehlererkennungsverfahren und von dem Rahmenaufbau unabhängig ist.
In Figur 1 ist ein MPEG-1-Layer-II-Rahmen dargestellt. Der MPEG-1-Layer-II-Rahmen beginnt mit einem Rahmenkopf 1, auf den ein Feld 2 für eine Rahmenfehlererkennung folgt. Dabei wird hier eine Prufsumme, im Englischen als Cyclic Redundancy Check bezeichnet, eingesetzt. Ist ein fehlerhafter Rahmen anhand der Prufsumme erkannt worden, dann wird ein geeigneter Rahmen den fehlerhaften Rahmen ersetzen, zum Beispiel kann der vorhergehende Rahmen dazu verwendet werden, oder es erfolgt eine Stummschaltung für den fehlerhaften Rahmen. Alternativ kann auch eine Pradiktion vorgenommen werden. Dabei wird aus korrekt empfangenen oder korrigierten Rahmen ein nicht zu korrigierender und damit fehlerhafter Rahmen berechnet. Mittels geeigneten Modellen kann dies abgeschätzt und damit vorhergesagt werden.
Die Prufsumme ist derart gestaltet, daß sie aus Ubertragungseffizienzgrunden nicht alle möglicherweise auftretenden Fehler erkennen kann. In einem solchem Fall versagt die Prufsumme. Bei einer Prufsumme können sich allerdings auch mehrere überlagernde Fehler gegenseitig korrigieren, so daß in einem solchen Fall irrtümlicherweise kein Fehler mittels der Prufsumme erkannt wird.
Charakteristisch für die Prufsumme ist der Test einer Bitsumme, wobei eine inhaltliche Betrachtung der Audiodaten, wie es beim erfindungsgemaßen Verfahren der Fall ist, unterbleibt.
Dann folgt ein Feld für eine Bitzuweisung 3. Bei DAB, wie auch bei anderen digitalen Ubertragungs- und
Aufzeichnungsverfahren, werden die Audiosignale quantisiert. Dabei wird eine nichtlineare Quantisierung durchgeführt, wobei eine psychoakustische Quantisierungskurve zugrunde gelegt wird. Es werden Geräusche, die sich in der Nahe in Bezug auf die Frequenz zu einem aus dem Klangspektrum herausragenden Ton befinden, durch das Ohr nicht mehr wahrgenommen. Dies bezeichnet man als die Mithorschwelle . Dadurch ist es möglich, die Datenrate zu reduzieren, indem solche Geräusche, die unter der Mithorschwelle liegen, aus den Daten entfernt werden. Es werden dabei auch die verschiedenen Frequenzbereiche unterschiedlich fein quantisiert, wobei die Feinheit der Quantisierung dadurch bestimmt ist, daß das Quantisierungsrauschen noch unterhalb der Mithorschwelle liegt. Aus dieser unterschiedlichen Quantisierung pro Frequenzbereich ergibt sich, daß unterschiedlich viele Bits pro Frequenzbereich zuzuweisen sind. Z.B. schwankt die Bitzuweisung pro Frequenzbereich zwischen 3 und 16 Bit. In dem nächsten Feld 4 wird eine Referenzwerteauswahl getroffen. Es kommt durchaus vor, daß zeitlich aufeinanderfolgende Referenzwerte für einen Frequenzbereich die gleiche oder zumindest sehr ahnliche Große haben, da die Leistung in etwa übereinstimmt. Daher ist es nicht notwendig, für den Frequenzbereich mehrere Referenzwerte zu übertragen, wenn ein Referenzwert mehrere zeitlich voneinander getrennte Gruppen von Abtastwerten repräsentiert. In diesem Feld 4 ist nun beschrieben, welche Referenzwerte für welche Gruppen von Abtastwerten zur Denormierung zu verwenden sind.
Im Feld 5 sind dann die Referenzwerte selbst abgespeichert. Im Feld 6 sind die eigentlichen Audiodaten, die mit den Referenzwerten denormiert werden, abgelegt. Im Feld 7 befinden sich Zusatzdaten, die programmbegleitende Informationen umfassen und vor allem die Prufsumme für die Referenzwerte des folgenden Rahmens.
In Figur 2 ist ein Blockschaltbild des erfindungsgemaßen Verfahrens dargestellt. An einem Eingang 8 liegen die Audiodaten vor. In Block 9 wird eine Fehlererkennung der Referenzwerte des vergangenen Rahmens durchgeführt. In Block 10 wird aus dem aktuellen Rahmen ein Merkmal extrahiert, in dem die Referenzwerte des vergangenen Rahmens und des aktuellen Rahmens voneinander abgezogen werden. Liegt die Summe über einem vorgegebenen Schwellwert, dann ist der Unterschied so groß, daß keine Korrelation zwischen den beiden Referenzwerten vorliegt, was bei Audiodaten eigentlich nicht vorkommen kann. Daher wird dieser Fall als Fehler erkannt.
Alternativ kann anstatt einer bloßen Differenzbildung auch eine Mittelwertbildung verwendet werden, um beispielsweise eine Standardabweichung zu berechnen. Liegt die Standardabweichung über einem vorgegebenen Schwellwert, wird dies als Fehler erkannt.
Im Block 11 ist ein Entscheider vorhanden, der die Differenz der aufeinanderfolgenden Referenzwerte mit dem vorgegebenen Schwellwert vergleicht und eine entsprechende Ausgabe macht, d.h. liegt ein Fehler vor, wird ein Bit auf 1 gesetzt, liegt kein Fehler vor, bleibt dieses Bit auf 0. Dieses Bit wird auch mit Flag bezeichnet.
Im Block 12 wird die Fehlererkennung vom Block 9 für die Referenzwerte und die Fehlererkennung mittels der Merkmalsanalyse vom Block 11 miteinander verknüpft, wobei das Verfahren so ausgebildet ist, daß vom Block 11 das
Ergebnis des vorhergehenden Rahmens verwendet wird, daher wird auch im Block 9 die Fehlererkennung für den Referenzwert des vergangenen Rahmens durchgeführt. Die Verknüpfung 12 ist so ausgebildet, daß mittels einer logischen Oderverknupfung die Entscheidung, ob ein Fehler vorliegt, festgestellt wird, d.h. Fehler werden hier durch eine 1 signalisiert, kein Fehler durch eine 0, so daß beide, die Fehlererkennung mittels Prufsumme und die Merkmalsanalyse, keinen Fehler anzeigen dürfen, wenn kein Fehler erkannt werden soll.
Sind Fehler erkannt worden, setzen nun Fehlerkorrektur- oder -verschleierungsverfahren ein. Dazu gehören Rahmenwiederholungen und eine Pradiktion.
In manchen Frequenzbereichen wird zum Teil keine Audioinformation übertragen. Statt dessen wird dann ein Ersatzwert, ein Default, eingetragen. Die Differenzbildung eines Defaults mit einem anderen Referenzwert kann zu einer Indikation eines Fehlers fuhren. Dieser Ersatzwert muß charakteristisch sein, wobei er üblicherweise bei den Audiodaten nicht vorkommt, so daß in diesem Falle die Differenzbildung unterbleibt und hier allein die Fehlererkennung für die Referenzwerte mittels Prufsumme durchgeführt wird. D.h. das Flag für die Fehlererkennung der Referenzwerte bleibt hier auf 0. Alternativ kann der Ersatzwert auch so ausgebildet sein, daß das mit dem Ersatzwert gebildete Merkmal immer unter dem Schwellwert für die Fehlererkennung liegt. Damit wird der Ersatzwert an die Referenzwerte angeglichen. Im Prinzip kann dann auch einfach der entsprechende Referenzwert genommen werden, so daß eine Differenzbild Null ergeben wird.
Im Block 13 wird die Entscheidung signalisiert, ob ein Fehler vorliegt oder nicht. Liegt ein Fehler vor, werden abgespeicherte Referenzwerte aus einem vergangenen Rahmen, der korrekt übertragen wurde, anstatt des fehlerhaften Referenzwerts genommen, liegt kein Fehler vor, werden alle Referenzwerte aus diesem Rahmen verwendet.
Neben den hier genannten Skalenfaktoren als Referenzwerte sind auch andere Daten dafür verwendbar. Zu diesen Daten gehören Gewinnfaktoren, die pro Frequenzbereich für die Ermittlung eines optimalen Aussteuerungsbereichs notwendig sind und die von den Audiodaten abhangen. Aber auch andere Daten können für das erfindungsgemaße Verfahren verwendet werden. Die einzige Voraussetzung ist die enge Korrelation mit den Audiodaten.

Claims

Ansprüche
1. Verfahren zur Dekodierung von digitalen Audiodaten, wobei die digitalen Audiodaten in Rahmen empfangen werden, wobei die digitalen Audiodaten dekodiert werden, dadurch gekennzeichnet, daß bei der Dekodierung aus den Rahmen Referenzwerte entnommen werden, die abhangig von den digitalen Audiodaten sind, um mittels der Referenzwerte ein Merkmal zu erzeugen, daß das Merkmal mit einem vorgegebenen Schwellwert verglichen wird und daß, wenn das Merkmal über dem vorgegebenen Schwellwert liegt, dies mittels einer Signalisierung angezeigt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die digitalen Audiodaten in aufeinanderfolgende Frequenzbereiche aufgeteilt werden, wobei die digitalen Audiodaten für einen jeweiligen Frequenzbereich mittels mindestens eines Referenzwertes, vorzugsweise eines Skalenfaktors, für den jeweiligen Frequenzbereich denormiert werden, und daß der mindestens eine Referenzwert für den jeweiligen Frequenzbereich mit vorhergehenden Referenzwerten für diesen jeweiligen Frequenzbereich verglichen wird, um das Merkmal zu erzeugen.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß das Merkmal mittels einer Differenzbildung oder einer Mittelwertbildung von dem Referenzwert mit mindestens einem vorhergehenden Referenzwert erzeugt wird.
4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß die Signalisierung mittels einer Bitfolge, vorzugsweise eines Flags, angezeigt wird.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Bitfolge mit einer Anzeige für die Fehlerkennung verglichen wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß für jeden Rahmen eine Fehlerkennung durchgeführt wird.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß der Rahmen einen Rahmenkopf (1) , ein Feld für die
Fehlererkennung des Rahmens (2) , ein Feld für eine Bitzuweisung (3) , ein Feld für eine Auswahl der Referenzwerte (4), ein Feld für die Referenzwerte (5), ein Feld für die digitalen Audiodaten (6) und ein Zusatzdatenfeld (7) aufweist.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß das Zusatzdatenfeld (7) Daten für die Fehlererkennung für die Referenzwerte aufweist.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß als Rahmen ein MPEG-1-Layer-II Rahmen verwendet wird.
10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß, wenn in einem Frequenzbereich ein Ersatzwert als Referenzwert eingetragen ist, der Ersatzwert keinem Vergleich mit einem vorhergehenden Referenzwert unterworfen wird.
11. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß der Ersatzwert so ausgebildet wird, daß der Vergleich mit einem vorhergehenden Referenzwert zu einem Merkmal fuhrt, das unter dem vorgegebenen Schwellwert fuhrt.
PCT/DE2000/003896 1999-12-08 2000-11-07 Verfahren zur dekodierung von digitalen audiodaten WO2001043320A2 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE50014248T DE50014248D1 (de) 1999-12-08 2000-11-07 Verfahren zur dekodierung von digitalen audiodaten
JP2001543884A JP2004500599A (ja) 1999-12-08 2000-11-07 ディジタルオーディオデータの復号方法
US10/149,317 US7080006B1 (en) 1999-12-08 2000-11-07 Method for decoding digital audio with error recognition
EP00981165A EP1238481B1 (de) 1999-12-08 2000-11-07 Verfahren zur dekodierung von digitalen audiodaten

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19959038.9 1999-12-08
DE19959038A DE19959038A1 (de) 1999-12-08 1999-12-08 Verfahren zur Dekodierung von digitalen Audiodaten

Publications (2)

Publication Number Publication Date
WO2001043320A2 true WO2001043320A2 (de) 2001-06-14
WO2001043320A3 WO2001043320A3 (de) 2002-02-14

Family

ID=7931774

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2000/003896 WO2001043320A2 (de) 1999-12-08 2000-11-07 Verfahren zur dekodierung von digitalen audiodaten

Country Status (5)

Country Link
US (1) US7080006B1 (de)
EP (1) EP1238481B1 (de)
JP (1) JP2004500599A (de)
DE (2) DE19959038A1 (de)
WO (1) WO2001043320A2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428684B2 (en) 2002-04-29 2008-09-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Device and method for concealing an error
US7580476B2 (en) * 2003-06-26 2009-08-25 Northrop Grumman Corporation Communication system and method for improving efficiency and linearity

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004522198A (ja) * 2001-05-08 2004-07-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化方法
DE10219133B4 (de) * 2002-04-29 2007-02-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verschleiern eines Fehlers
JP4539180B2 (ja) * 2004-06-07 2010-09-08 ソニー株式会社 音響復号装置及び音響復号方法
JP4698688B2 (ja) * 2007-02-27 2011-06-08 シャープ株式会社 送受信方法、送受信装置及びプログラム
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4831624A (en) * 1987-06-04 1989-05-16 Motorola, Inc. Error detection method for sub-band coding
DE4409960A1 (de) * 1994-03-23 1995-09-28 Inst Rundfunktechnik Gmbh Verfahren zur Verminderung der subjektiven Störempfindung bei störungsbehaftetem Empfang bei Verwendung von digital übertragenen Tonsignalen
US5706396A (en) * 1992-01-27 1998-01-06 Deutsche Thomson-Brandt Gmbh Error protection system for a sub-band coder suitable for use in an audio signal processor

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
US5617333A (en) * 1993-11-29 1997-04-01 Kokusai Electric Co., Ltd. Method and apparatus for transmission of image data
JP3046213B2 (ja) * 1995-02-02 2000-05-29 三菱電機株式会社 サブバンド・オーディオ信号合成装置
JP2757818B2 (ja) * 1995-04-20 1998-05-25 日本電気株式会社 補助データ処理回路
EP0976216B1 (de) * 1997-02-27 2002-11-27 Siemens Aktiengesellschaft Verfahren und anordnung zur rahmenfehlerdetektion zwecks fehlerverdeckung insbesondere bei gsm übertragungen
DE19735675C2 (de) * 1997-04-23 2002-12-12 Fraunhofer Ges Forschung Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom
US6208959B1 (en) * 1997-12-15 2001-03-27 Telefonaktibolaget Lm Ericsson (Publ) Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
US6208699B1 (en) * 1999-09-01 2001-03-27 Qualcomm Incorporated Method and apparatus for detecting zero rate frames in a communications system
US6728323B1 (en) * 2000-07-10 2004-04-27 Ericsson Inc. Baseband processors, mobile terminals, base stations and methods and systems for decoding a punctured coded received signal using estimates of punctured bits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4831624A (en) * 1987-06-04 1989-05-16 Motorola, Inc. Error detection method for sub-band coding
US5706396A (en) * 1992-01-27 1998-01-06 Deutsche Thomson-Brandt Gmbh Error protection system for a sub-band coder suitable for use in an audio signal processor
DE4409960A1 (de) * 1994-03-23 1995-09-28 Inst Rundfunktechnik Gmbh Verfahren zur Verminderung der subjektiven Störempfindung bei störungsbehaftetem Empfang bei Verwendung von digital übertragenen Tonsignalen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WIESE D: "OPTIMIZATION OF ERROR DETECTION AND CONCEALMENT FOR ISO/MPEG/AUDIO CODECS LAYER-I AND II" PREPRINTS OF PAPERS PRESENTED AT THE AES CONVENTION, XX, XX, Nr. 3388, 1992, Seiten 1-29, XP000996599 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428684B2 (en) 2002-04-29 2008-09-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Device and method for concealing an error
US7580476B2 (en) * 2003-06-26 2009-08-25 Northrop Grumman Corporation Communication system and method for improving efficiency and linearity
US8345796B2 (en) * 2003-06-26 2013-01-01 Northrop Grumman Systems Corporation Communication system and method for improving efficiency and linearity

Also Published As

Publication number Publication date
US7080006B1 (en) 2006-07-18
EP1238481B1 (de) 2007-04-11
WO2001043320A3 (de) 2002-02-14
JP2004500599A (ja) 2004-01-08
DE50014248D1 (de) 2007-05-24
EP1238481A2 (de) 2002-09-11
DE19959038A1 (de) 2001-06-28

Similar Documents

Publication Publication Date Title
EP0609300B1 (de) Verfahren zum übertragen oder speichern eines aus einer folge von informationsblöcken bestehenden digitalisierten, encodierten tonsignals über störbehaftete kanäle
DE4111131C2 (de) Verfahren zum Übertragen digitalisierter Tonsignale
DE19840835C2 (de) Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern
EP0659002B1 (de) Verfahren und Schaltungsanordnung zur Übertragung von Sprachsignalen
EP1241797A2 (de) Verfahren zur Steuerung eines mehrkanaligen Tonwiedergabesystems und mehrkanaliges Tonwiedergabesystem
DE69530665T2 (de) Verfahren und gerät zur sprachübertragung in einem mobilen kommunikationssystem
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE4013395A1 (de) Einrichtung zum codieren und entcodieren von sprache, mit einer wiedergabefunktion fuer hintergrundgeraeusche
EP1238481B1 (de) Verfahren zur dekodierung von digitalen audiodaten
EP0646300B1 (de) Verfahren für die fehlererkennung digitalisierter, datenreduzierter ton- und datensignale
EP1245024B1 (de) Verfahren zur fehlerverschleierung von digitalen audiodaten durch spektrale entzerrung
DE3645150C2 (en) Broadcasting digital stereophonic audio signals
DE4137609C2 (de) Kombiniertes Sprach- und Kanaldecodierverfahren
EP1113599A2 (de) Empfänger für analog und digital übertragene Rundfunkprogramme, der umschaltet auf den Empfang vom analogen Rundfunksignal das mit dem digitalen Rundfunksignal übereinstimmt, wenn das digitale Signal nicht mehr zur Verfügung steht
EP1271816B1 (de) Verfahren zum durchführen einer Frequenzsuche in einem Rundfunkempfänger
EP1303856A1 (de) Verfahren zur fehlerverschleierung von übertragungsfehlern in digitalen audiodaten
DE112009004337T5 (de) Signalempfang
EP1287630B1 (de) Verfahren zur korrektur von taktabweichungen bei audiodaten
DE19735675C2 (de) Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom
DE112017007504B4 (de) Audiodecodiervorrichtung für digitalen Rundfunk
WO1995032562A1 (de) Verfahren zur übertragung von digitalen audio-signalen und vorrichtung zur übertragung digitaler audio-signale
DE60112898T2 (de) RDS Dekoder
EP0609325A1 (de) Verfahren zum übertragen digitalisierter, stereofoner tonsignale über störbehaftete rundfunkkanäle.
DE19831259A1 (de) Rundfunkempfänger für ein Fahrzeug
EP1271790A2 (de) Funkempfänger

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
AK Designated states

Kind code of ref document: A3

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

WWE Wipo information: entry into national phase

Ref document number: 2000981165

Country of ref document: EP

ENP Entry into the national phase

Ref country code: JP

Ref document number: 2001 543884

Kind code of ref document: A

Format of ref document f/p: F

WWP Wipo information: published in national office

Ref document number: 2000981165

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10149317

Country of ref document: US

WWG Wipo information: grant in national office

Ref document number: 2000981165

Country of ref document: EP