WO2002103695A2 - Device and method for embedding a watermark in an audio signal - Google Patents
Device and method for embedding a watermark in an audio signal Download PDFInfo
- Publication number
- WO2002103695A2 WO2002103695A2 PCT/EP2002/005173 EP0205173W WO02103695A2 WO 2002103695 A2 WO2002103695 A2 WO 2002103695A2 EP 0205173 W EP0205173 W EP 0205173W WO 02103695 A2 WO02103695 A2 WO 02103695A2
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- watermark
- spectral
- signal
- audio signal
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Definitions
- the present invention relates to the field of audio coding and in particular to methods and devices for embedding a watermark in an audio signal.
- Modern audio coding methods process discrete-time audio samples to provide a bit stream that is compressed relative to the original audio signal.
- the stream of discrete-time audio samples is first windowed to generate successive blocks of windowed audio samples from the stream of audio samples. Further processing takes place in blocks.
- a block of audio samples generated by windowing is typically converted into a spectral representation by means of an analysis filter bank.
- the spectral representation comprises spectral values lying next to one another from frequency 0 to the maximum audio frequency, which can be, for example, 16 kHz.
- the audio spectral values are grouped and quantized in scale factor bands. The quantization takes place in such a way that the quantization noise introduced by the quantization is dimensioned such that it is masked by the audio signal.
- a psychoacoustic model which, on the basis of the audio signal, supplies an energy value for each scale factor band, which indicates the energy level up to which quantization noise is masked, ie it will not be audible in the decoded audio signal. If, on the other hand, the quantization noise introduced by the quantizer lies above the psychoacoustic masking threshold, the re-decoded audio signal will contain audible interference.
- the quantizer levels of the quantizer are dependent on the masking threshold calculated. When the quantization levels are calculated, the audio spectral values are quantized using these quantization levels to obtain quantized audio spectral values. For data efficiency reasons, the quantized audio spectral values of an entropy coding, such as B.
- Huffman coding to provide a bit stream with code words that represent the audio spectral values.
- page information is added to the stream of code words, which includes, among other things, the scale factors on the basis of which an audio decoder can determine the quantization levels that have been used in the encoder.
- the bit stream including side information is split up into code words on the one hand and side information on the other using a bit stream demultiplexer.
- the entropy coding is first undone. Then the entropy decoded, values quantized audio spectral values, an inverse quantization that is subjected to inversely quantized spectral values ⁇ to get. These are then converted from the frequency domain to the time domain using a synthesis filter bank. The decoded audio signal is present at the output of the synthesis filter bank.
- the psychoacoustic masking threshold of an audio signal section depends on the actual input audio signal. If the audio signal changes over time, the masking properties also change over time. For reasons of data efficiency, it is preferred to always introduce as much quantization noise into the audio signal as possible, ie the quantization noise should correspond as closely as possible to the psychoacoustic masking threshold. Audio signal sections with good masking properties can therefore be encoded with a relatively low bit cost, while on the other hand audio signal sections with relatively poor masking properties, such as. B. tonal audio signal sections, must be quantized very finely, which in turn means that a large number of bits must be used to encode these audio signal sections.
- bit savings bank function is usually used.
- the bit savings bank is filled when easy-to-encode audio sections are encoded such that bits that are not needed to encode these easy-to-encode sections are not simply "wasted” by more subtle than necessary quantization, but nevertheless a coarser quantization is used and the surplus bits are "inserted" into the bit savings bank.
- bit savings bank function thus acts as a buffer
- This method also has the advantage of high audio quality, since the quantization noise and the watermark noise can be matched to one another if the energy introduced into the audio signal by the watermark is below the psychoacoustic masking threshold lies.
- the method is also characterized by a high level of robustness, since the watermark cannot be removed from the re-decoded audio signal, for example by an illegal distributor of the audio signal, without impairing the audio quality.
- a disadvantage of the described method is the fact that the watermark may be quantized or weakened under certain circumstances by the quantization of the signal applied to the watermark. This is due to the fact that the energy of the watermark signal is sometimes in the range of the quantization interval. Furthermore, there is only limited control over the interference introduced by the watermark. B. can affect an audio quality loss.
- Another watermarking method is to embed the watermark during the compression of the audio signal. This concept is described in the specialist publication "Combined Compression / Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer and Jürgen Herre, 110th AES Convention, May 12-15, 2001, Amsterdam, Preprint 5344.
- First, an uncompressed audio signal is fed to a psychoacoustic model in order to determine the masking threshold.
- the audio signal is then transformed into the frequency domain.
- the spread, spectrally represented watermark signal is weighted based on the masking threshold in the frequency domain and added to the spectrum of the input audio signal.
- the parameters for the quantization are determined on the basis of the masking threshold, whereupon the watermarked signal is quantized and encoded.
- This method is also characterized by a low level of computational complexity, since certain operations, such as e.g. B. the calculation of the masking model and the conversion of the audio signal into a spectral representation only have to be carried out once.
- the method usually also provides one good audio quality, since quantization noise and watermark noise can be coordinated.
- a disadvantage of this method is also the fact that the watermark may be quantized or weakened under certain circumstances by the quantization of the signal applied to the watermark. This is again due to the fact that the energy of the watermark signal is sometimes in the range of the quantization interval. Furthermore, there is only limited control over the interference introduced by the watermark. B. can affect an audio quality loss.
- the spread watermark signal is also characterized by a large number of spectral lines. However, so that the watermark does not lead to audible interference in the decoded audio signal, the height of the watermark spectral lines is significantly less than the height of the audio signal spectral lines.
- the combined spectrum is only slightly changed compared to the original spectrum. The subsequent quantization of the combined spectrum will always remove the watermark without replacement if the quantization step size is greater than the height of the watermark spectral lines that are quantized with this quantizer step size. If too many watermark spectral lines are "quantized away" by the subsequent quantization, the watermark detector can no longer extract a clear watermark.
- the object of the present invention is to provide an improved concept for embedding a watermark in an audio signal which on the one hand provides good audio quality and on the other hand also ensures good watermark detectability.
- This object is achieved by a method for embedding a watermark in an audio signal according to claim 1 or by a device for embedding a watermark in an audio signal according to claim 16.
- the present invention is based on the finding that better watermark detectability is achieved if the fact that the audio signal including the watermark is subjected to quantization is taken into account in the watermark embedding.
- a watermark will only be detectable if a spectral line, which represents the watermark and audio signal, falls through the watermark into a different quantization level than if no watermark is embedded. Only in this case will a watermark detector, which only receives quantized information, be able to detect a watermark.
- the spectral representation of the watermark signal is therefore processed in such a way that it is ensured that the watermark signal processed by the processing step is designed in such a way that it will still be present after quantization.
- a predetermined watermark starting value is selected, which depends on the spectral representation of the watermark signal.
- the watermark must not lead to any or only a very slight interference in the audio signal.
- a disturbance introduced by the predetermined watermark start value into the spectral representation of the audio signal is determined, but in which the conditions after a quantization of the spectral representation of the audio signal can be used. On the one hand, this makes it possible to see whether some of the watermark remains after quantization.
- the watermark initial value error is greater than a predetermined Storungsschwelle
- the watermark initial value is changed until the system introduced by a modified watermark initial value in the spectral representation after quantization error less than or equal to the Restaurant ⁇ voted fault threshold is.
- the resulting changed watermark starting value is then combined with the audio signal in order to obtain the watermarked audio signal in which the watermark is embedded.
- An advantage of the present invention is that ratios that ultimately do not correspond to the initial ratios are no longer taken into account, namely the audio signal / watermark ratios before the quantization, but that the watermark z. B. iteratively changed until a desired watermark "interference energy" is found.
- the conditions after the quantizer are now taken into account, i. H. the ratios that are relevant for the audio signal decoder and for the watermark extractor.
- the watermark energy has usually been set in the prior art in such a way that the watermark energy is less than or equal to the psychoacoustic masking threshold, the unpredictability of what happens to the watermark signal during quantization still remains.
- the case could occur that the watermark is quantized away, which means that no watermark or only a very weak watermark could be extracted in the decoded signal.
- the case could also arise that, although the watermark What has been important is that it is below the masking threshold, yet noise has been introduced that was audible in the decoded signal.
- the method according to the invention has the advantage that for cases in which good detectability is particularly important, certain - tolerable - disturbances are deliberately introduced into the audio signal in favor of a higher watermark detectability, while in other cases in which the watermarks -Detectability does not have to be ensured at all times under all circumstances, compromises with regard to watermark detectability can be made in order to meet the highest audio quality requirements.
- the watermark signal is added to the audio signal prior to quantization to obtain a combined signal.
- the combined signal is then quantized and again inversely quantized and compared with the original audio signal. The comparison determines whether the interference introduced by the watermark is tolerable. If it is determined that the disturbance is not tolerable, the spectrum of the watermark signal is weighted iteratively using certain strategies in order then to carry out quantization and inverse quantization again until it is determined that the disturbance is now tolerable.
- the watermark spectrum obtained by this processing is then added to the original audio spectrum.
- the added or combined signal is then quantized, entropy-encoded and provided with side information to obtain an audio bit stream in which the watermark is present.
- the original audio signal is quantized.
- a quantized watermark is added to the audio signal to obtain the combined signal.
- the combined signal is then no longer quantized again, as in the first exemplary embodiment, but is directly entropy-coded.
- the "quantized" watermark signal added to the quantized audio signal is set in such a way that on the one hand the requirement for tolerable interference is met and on the other hand a desired watermark detectability is achieved.
- FIG. 1 shows a block diagram of an inventive device for embedding a watermark in an audio signal
- FIG. 2 shows a block diagram of a device according to the invention for introducing a watermark into an audio signal according to a first exemplary embodiment
- FIG. 3 shows an inventive device for embedding a watermark in an audio signal according to a second exemplary embodiment; and 4a to 4d a schematic explanation of the line selection algorithm in the second exemplary embodiment of the present invention.
- the device according to the invention shown in FIG. 1 comprises an audio input 10 and a watermark input 12. Both the audio signal at the audio input 10 and the watermark signal at the watermark input 12 are converted into a spectral representation by means of a device 14 or 16.
- the spectral representation of the audio signal comprises audio spectral values, while the spectral representation of the watermark signal has watermark spectral values.
- a device 18 for combining the audio spectral values are combined with changed watermark spectral values in order to obtain the combined audio signal in an output 20, in which the watermark is embedded.
- a device 22 for processing the spectral representation of the watermark signal is provided depending on a psychoacoustic masking threshold supplied via an input 24.
- the spectral representation of the watermark signal is processed depending on the psychoacoustic masking threshold obtained via the input 24 in order to obtain a processed watermark signal so that a disturbance introduced into the audio signal by the processed watermark signal is below a predetermined disturbance threshold which is different from that psychoacoustic masking threshold depends.
- the device 22 for processing the spectral representation of the watermark signal comprises a device 26 for selecting a predetermined watermark starting value, which depends on the spectral representation of the watermark signal.
- a disturbance introduced by the predetermined watermark start value into the spectral representation of the audio signal after quantization of the spectral representation of the audio signal is detected.
- quantization information is supplied by a device 30 for supplying quantization information.
- the device 30 provides quantization information which depends on the original audio signal, that is to say the audio signal without a watermark.
- a device 32 examines whether the ascertained disturbance is greater than the predetermined disturbance threshold. If not, i. H. if the disturbance is acceptable, the watermark start value is fed directly to the device 18 for combining. If this is the case, however. H. if the introduced interference is too great or different than desired, a device 34 for changing the watermark start value is activated until the interference introduced by a changed watermark start value in the spectral representation of the audio signal after quantization is less than or equal to the predetermined one Interference threshold is.
- the loop sketched in the processing device 22 may have to be iterated several times in order to at some point obtain a changed watermark starting value at the output of the device 32, which is used as a processed watermark signal and fed to the combining device 18 in order to to receive the audio signal at the output 20 in which the watermark is embedded.
- the combination is carried out by means of an addition 18 before the quantization.
- the device 28 for determining the initial value introduced into the audio signal by the block watermark weighting 26 is determined by first quantizing and inversely quantizing the combined signal in a quantizer / inverse quantizer device 28a.
- the disturbance introduced by the watermark is then calculated in a device 28b, for example by forming the difference and squaring the difference values, and then in the device 32 with the psy- choacoustic masking threshold 24 compared. If the disturbance is too great, the device 34, which is labeled "weight control" in FIG. 2, is actuated in order to supply changed weighting factors to the block 26, in order then to change the weighted spectrum of watermarks in the device 18 with the original audio signal in to combine spectral representation and to go through the iteration loop again.
- the watermark spectrum with a watermark spectrum weighted equally for all spectral lines as the initial watermark value.
- the weighting factor for each spectral line is therefore equal to a constant for all spectral lines, which is chosen such that the watermark energy lies above the masking threshold. Then the watermark energy is gradually reduced in order to then "iterate" the energy of the watermark below the masking threshold.
- the device 34 is designed to control the weighting factors in order to reduce all weighting factors, e.g. B. cut in half. If the disturbance is then still too large, all current weighting factors could be halved again in a next iteration step, etc. This can continue until the device 32 determines that the disturbance is now OK.
- the spectrally represented watermark signal is thus spectrally weighted with the current weighting factors provided by block 34 by means of a weighting filter bank, which can be contained in block 26, as has been explained with reference to FIG. 2.
- the resulting signal is added to the original audio signal.
- the combined signal at the output of device 18 is quantized and inversely quantized and results in the signal present at the output of device 28a which is fed into device 28b in the same way as the original audio signal.
- the device 28b now compares the original signal with the quantized and again inversely quantized signal and uses this to determine the quantization error signal which is supplied to the device 32.
- the weighting control in block 34 is activated in order to determine new, better weighting factors.
- the masking threshold determined by the masking model is available, which indicates how much interference in the signal is "allowed" at a certain point in the signal spectrum. If the weight control block 34 has determined optimal weighting factors with regard to the desired audio signal interference and the desired watermark detectability, ie watermark energy, the method terminates.
- the quantized spectral values of the combination signal last determined by block 28a are then passed on to the bitstream multiplexer as a result, in order to be formed there together with the side information into an audio bitstream. 3 is discussed below in order to illustrate a device for embedding a watermark in an audio signal according to a second exemplary embodiment of the present invention. In contrast to the first exemplary embodiment shown in FIG.
- this combination 18 in FIG. 3 takes place in the "quantization range", ie it becomes a quantized audio signal with a combined quantized watermark.
- This can be achieved either by using a quantizer 42 to calculate the quantizer stages by quantizing the original audio signal, or by extracting the quantizer stages from a coded audio signal.
- means 40a for calculating the quantized audio signal minus a predetermined number of n quantization levels and means 40b for calculating the quantized audio signal plus a predetermined number of n quantization levels are operated.
- a so-called “maximum” watermark is first calculated as a predetermined watermark starting value by means of a device 36. To calculate the predetermined maximum watermark, only the signs of the watermark spectrum are used. If the watermark spectrum has a positive sign, the corresponding spectral value of the original quantized audio signal is increased by n quantization levels, n being an integer greater than or is 1.
- the sign of a watermark spectral value is negative
- the corresponding quantized spectral value ie the spectral value of the audio signal at the same frequency as the spectral value of the watermark signal whose sign is currently being viewed
- n quantization levels are reduced by n quantization levels.
- a device 38 that implements a line selection algorithm is provided.
- the device 38 determines the interference introduced into the audio signal by the maximum watermark provided by the device 36. If the disturbance is greater than the predetermined disturbance threshold, the device 38 changes the "maximum" watermark by selecting individual lines until the disturbance introduced by the watermark is less than or equal to the predetermined disturbance threshold. If this condition is fulfilled, the watermark, which is already in quantized form, and the quantized original audio signal are fed to the adder 18 in order to obtain the quantized watermarked audio signal on the output side.
- 4a shows, by way of example, a quantized audio signal which, because of the clarity of the illustration, only shows three spectral values 50a-50c.
- an audio spectrum has e.g. B. 1024 spectral values.
- the number of non-zero quantized spectral values depends on how many audio spectral values have been quantized to zero. Of course, the quantized audio spectral values have different heights in the real case.
- 4b shows an audio spectrum with plus or minus n quantization levels (depending on the sign of the watermark spectral values).
- the spectral component of the watermark corresponding to the audio spectral value 50a of FIG. 4a has a negative sign for the example shown in FIG. 4b.
- the spectral component of the watermark, which corresponds to the audio spectral value 50b of FIG. 4a, has a positive sign in the example shown in FIG. 4b, while the third spectral component of the watermark again had a negative sign.
- the amount of the watermark spectral components is initially irrelevant, since it is assumed that watermark detection is already possible if the quantized audio spectral values 50a-50c are changed by the watermark.
- the maximum watermark which is determined by the device 36 from FIG. 3, is shown in FIG. 4c for the case shown in FIG. 4b. It has a spectrum that is characterized in that each quantized original audio spectral value is changed by a quantization level, either enlarged if the watermark has a positive sign, or decreased if the watermark had a negative sign.
- the amount of a watermark spectral line could be taken into account in such a way that not only is incremented or decremented by one quantization level, but that is incremented or decremented by several quantization levels if the amount of Watermark spectral line is correspondingly large.
- the function of the device 38 from FIG. 3 will now be described with reference to FIG. 4d.
- the facility 38 If the left quantized audio spectral component 50a is reduced by a quantization level, as is represented by the spectral component 50a ', the situation is such that the situation is such that the interference introduced by the watermark is too large, as is represented by the spectral component 50a', this becomes the spectral component not selected by the device 38, which is so noticeable in the changed watermark spectral values after the line selection that the changed watermark has a spectral line of 0 at this point.
- the quantized audio spectral values are now based on the watermark signal, ie using the sign of the watermark signal by z. B. plus or minus changed a quantization level.
- This procedure has advantages in that computing time can be saved since the quantization and inverse quantization (device 28a of FIG. 2) and the weighting of the watermark (device 26 of FIG. 2) can be omitted without replacement.
- the maximum watermark (FIG. 4c) is determined line by line on the basis of the audio spectra already precalculated, ie the original spectrum and the original spectrum minus n quantization levels or the original spectrum plus n quantization levels. This results as the difference between the original spectrum (FIG. 4a) and the audio spectrum changed by a number of n quantization levels (FIG. 4b), the difference having the same sign as the unweighted watermark.
- the line selection algorithm which is executed in the device 38, takes into account the amount of the unweighted watermark spectral lines, the masking threshold 24 and possibly a bit savings bank function 44 of the audio encoder.
- the lines of the maximum watermark in such a way that the watermark spreading band signal is embedded in a broadband manner, i. H. that as many lines of the quantized audio signal as possible are changed.
- the structure of the watermark should be changed as little as possible within a frequency band.
- bit savings bank function which can provide additional bits to later signal blocks, as has been carried out.
- the line selection strategy is preferably adapted to the fill level of the bit savings bank, so as to allow, for example, when the bit savings bank is filled, that even quantized audio spectral values of the original audio signal that have the value 0 are watermarked, which would normally not be permitted due to the bit requirement , This can noticeably improve watermark detection.
- the original values are also available after the transformation into the frequency range.
- the quantization of the original audio spectral values can also be seen as a kind of watermark embedding, since a certain disturbance of the audio spectrum results in both the quantization and the addition of a watermark signal. Due to its random nature, the disturbance introduced by the quantization should not be regarded as a watermark. However, if the introduced disturbance is correct with the watermark due to the quantization, the quantization noise supports the detectability of the watermark. The following cases result from this.
- the watermark is introduced with the correct sign.
- the device 38 of FIG. 3 is preferably arranged such that, due to the fact that the quantization is already in phase with the watermark spectral value for one certain frequency a disturbance has been introduced, arranged to dispense with the introduction of another watermark disturbance.
- a quantization level could be added to further improve the detectability.
- the psychoacoustic masking threshold is not calculated line by line, but by scale factor band. This means that energies of individual spectral lines are not considered, but the total energies z. B. 20 spectral lines in a scale factor band. However, in a scale factor band in which many watermark spectral lines are tolerable, a few lines in the sense of good audio quality can be dispensed with without the watermark detectability suffering significantly.
- This functionality can also be achieved in the exemplary embodiment shown in FIG. 2 in that the weighting control 34 of FIG.
- the concept according to the invention is such that a spectrally represented watermark signal is first generated. This is weighted using weighting factors. The weighted signal is added to the original audio signal, which is available in a spectral representation. Alternatively, a change in the lines of the original audio signal, which is available in a spectral representation, is carried out on the basis of the watermark signal. The disturbance introduced after the quantization is then determined, the disturbance being determined by quantizing, inverse quantizing and forming the difference from the original, or the disturbance being pre-calculated.
- new weighting factors are determined, using the masking threshold, using a line selection strategy, or using a line selection strategy in particular in such a way that the sign and amount of the spectral lines of the unweighted watermark are used, and that the sum of the watermark line and the original spectral line is such it is determined that this new spectral line falls within a different quantization interval than the original spectral line.
- the concept according to the invention is advantageous in that it can be used both for bitstream watermarking methods and for methods which carry out audio coding and watermark embedding in one step. Another advantage of the concept according to the invention is that full control over the introduced disturbance can be achieved. This makes it possible to specifically set the method in favor of optimal watermark detection or optimal audio quality.
- Another advantage of the concept according to the invention is full control over the frequency distribution of the watermark spreading band signal into the audio signal.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
Description
Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal Device and method for embedding a watermark in an audio signal
Beschreibungdescription
Die vorliegende Erfindung bezieht sich auf das Gebiet der Audiocodierung und insbesondere auf Verfahren und Vorrichtungen zum Einbetten eines Wasserzeichens in ein Audiosig- nal.The present invention relates to the field of audio coding and in particular to methods and devices for embedding a watermark in an audio signal.
Moderne Audiocodierverfahren verarbeiten zeitdiskrete Audio-Abtastwerte, um einen Bitstrom zu liefern, der gegenüber dem ursprünglichen Audiosignal komprimiert ist. Der Strom von zeitdiskreten Audio-Abtastwerten wird zunächst gefenstert, um aus dem Strom von Audio-Abtastwerten aufeinanderfolgende Blöcke von gefensterten Audio-Abtastwerten zu erzeugen. Die weitere Verarbeitung findet blockweise statt. Ein durch Fensterung erzeugter Block von Audio-Abtastwerten wird typischerweise mittels einer Analyse-Filterbank in eine spektrale Darstellung umgesetzt. Die spektrale Darstellung umfaßt frequenzmäßig nebeneinanderliegende Spektralwerte von der Frequenz 0 bis zur maximalen Audio-Frequenz, welche beispielsweise bei 16 kHz liegen kann. Die Audio- Spektralwerte werden in Skalenfaktorbändern gruppiert und quantisiert. Die Quantisierung findet derart statt, daß das durch die Quantisierung eingeführte Quantisierungsrauschen derart dimensioniert ist, daß es von dem Audiosignal maskiert wird. Hierzu wird ein psychoakustisches Modell einge- setzt, das auf der Basis des Audiosignals für jedes Skalen- faktorband einen Energiewert liefert, der angibt, bis zu welchem Energiepegel Quantisierungsrauschen maskiert wird, d. h. im wieder decodierten Audiosignal nicht hörbar sein wird. Liegt das durch den Quantisierer eingeführte Quanti- sierungsrauschen dagegen oberhalb der psychoakustischen Maskierungsschwelle, so wird das wieder decodierte Audiosignal hörbare Störungen enthalten. Die Quantisierungsstufen des Quantisierers werden abhängig von der Maskierungs- schwelle berechnet. Wenn die Quantisierungsstufen berechnet sind, werden die Audio-Spektralwerte anhand dieser Quantisierungsstufen quantisiert, um quantisierte Audio- Spektralwerte zu erhalten. Aus Dateneffizienzgründen werden die quantisierten Audiospektralwerte einer Entropie- Codierung, wie z. B. eine Huffman-Codierung, unterzogen, um einen Bitstrom mit Codeworten zu liefern, die die Audiospektralwerte darstellen. Mittels eines Bitstrom- Multiplexers werden dem Strom von Codeworten Seiteninforma- tionen hinzugefügt, welche unter anderem die Skalenfaktoren umfassen, auf deren Basis ein Audio-Decodierer die Quantisierungsstufen ermitteln kann, die im Codierer verwendet worden sind.Modern audio coding methods process discrete-time audio samples to provide a bit stream that is compressed relative to the original audio signal. The stream of discrete-time audio samples is first windowed to generate successive blocks of windowed audio samples from the stream of audio samples. Further processing takes place in blocks. A block of audio samples generated by windowing is typically converted into a spectral representation by means of an analysis filter bank. In terms of frequency, the spectral representation comprises spectral values lying next to one another from frequency 0 to the maximum audio frequency, which can be, for example, 16 kHz. The audio spectral values are grouped and quantized in scale factor bands. The quantization takes place in such a way that the quantization noise introduced by the quantization is dimensioned such that it is masked by the audio signal. For this purpose, a psychoacoustic model is used which, on the basis of the audio signal, supplies an energy value for each scale factor band, which indicates the energy level up to which quantization noise is masked, ie it will not be audible in the decoded audio signal. If, on the other hand, the quantization noise introduced by the quantizer lies above the psychoacoustic masking threshold, the re-decoded audio signal will contain audible interference. The quantizer levels of the quantizer are dependent on the masking threshold calculated. When the quantization levels are calculated, the audio spectral values are quantized using these quantization levels to obtain quantized audio spectral values. For data efficiency reasons, the quantized audio spectral values of an entropy coding, such as B. Huffman coding, to provide a bit stream with code words that represent the audio spectral values. Using a bitstream multiplexer, page information is added to the stream of code words, which includes, among other things, the scale factors on the basis of which an audio decoder can determine the quantization levels that have been used in the encoder.
Zur Audio-Decodierung wird der Bitstrom samt Seiteninformationen mittels eines Bitstrom-Demultiplexers in einerseits Codewörter und andererseits Seiteninformationen aufgesplit- tet. Zunächst wird die Entropie-Codierung rückgängig gemacht. Anschließend werden die Entropie-decodierten Werte, d. h. die quantisierten Audio-Spektralwerte, einer inversen Quantisierung unterzogen, um invers quantisierte Spektral¬ werte zu erhalten. Diese werden dann mittels einer Synthese-Filterbank vom Frequenzbereich in den Zeitbereich umgesetzt. Am Ausgang der Synthese-Filterbank liegt das wieder decodierte Audiosignal vor.For audio decoding, the bit stream including side information is split up into code words on the one hand and side information on the other using a bit stream demultiplexer. The entropy coding is first undone. Then the entropy decoded, values quantized audio spectral values, an inverse quantization that is subjected to inversely quantized spectral values ¬ to get. These are then converted from the frequency domain to the time domain using a synthesis filter bank. The decoded audio signal is present at the output of the synthesis filter bank.
Es sei darauf hingewiesen, daß es sich hierbei um ein verlustbehaftetes Codierverfahren handelt, da im Codierer eine Quantisierung vorgenommen worden ist. Das wieder decodierte Audiosignal entspricht nicht exakt dem ursprünglichen Audiosignal. Wenn die Codierung und Decodierung erfolgreich war, wird jedoch der subjektive Höreindruck des decodierten Audiosignals dem subjektiven Höreindruck des ursprünglichen Audiosignals entsprechen, da das durch den Quantisierer im Codierer eingeführte Quantisierungsrauschen wegmaskiert wird, d. h. es wird unterhalb der psychoakustischen Maskierungsschwelle "versteckt". Aus Dateneffizienzgründen wird es bevorzugt, möglichst große Quantisierungsschritte zu verwenden. Andererseits führen zu große Quantisierungsschritte zu einem zu großen Quantisierungsrauschen, das sich im wieder decodierten Signal als hörbare Störung äußern kann. Moderne Audiocodierverfahren versuchen einen optimalen Kompromiß zwischen diesen beiden Forderungen zu erreichen.It should be pointed out that this is a lossy coding method since quantization has been carried out in the encoder. The decoded audio signal does not exactly match the original audio signal. If the coding and decoding were successful, however, the subjective auditory impression of the decoded audio signal will correspond to the subjective auditory impression of the original audio signal, since the quantization noise introduced by the quantizer in the encoder is masked away, ie it is "hidden" below the psychoacoustic masking threshold. For data efficiency reasons, it is preferred to use the largest possible quantization steps. On the other hand, excessively large quantization steps lead to excessive quantization noise, which can manifest itself as an audible disturbance in the decoded signal. Modern audio coding methods try to achieve an optimal compromise between these two requirements.
Die psychoakustische Maskierungsschwelle eines Audiosignal- abschnitts hängt von dem tatsächlichen Eingangs-Audiosignal ab. Ändert sich das Audiosignal über der Zeit, so ändern sich auch die Maskierungseigenschaften über der Zeit. Aus Dateneffizienzgründen wird es bevorzugt, immer so viel Quantisierungsrauschen in das Audiosignal einzuführen, wie möglich ist, d. h. das Quantisierungsrauschen sollte möglichst gut der psychoakustischen Maskierungsschwelle entsprechen. Audiosignalabschnitte mit guten Maskierungseigenschaften können daher mit einem relativ geringen Bitaufwand codiert werden, während andererseits Audiosignalabschnitte mit relativ schlechten Maskierungseigenschaften, wie z. B. tonale Audiosignalabschnitte, sehr fein quantisiert werden müssen, was wiederum bedeutet, daß zur Codierung dieser Audiosignalabschnitte eine große Anzahl von Bits aufgewendet werden muß. Ein Codierer, der versucht, immer genau die Menge an Störung einzuführen, die durch die Maskierungsschwelle gegeben wird, wird daher ein Audiosignal mit konstanter Qualität erzeugen. Aufgrund des zeitlich variierenden Wesens des Eingangssignals führt dies jedoch am Ausgang des Codierers zu einer variablen Bitrate. Obgleich ein Co- dieren mit konstanter Qualität - und damit mit variabler Bitrate - aus Dateneffizienz-Gründen einerseits und Audio- qualitäts-Gründen andererseits attraktiv ist, ist dieses Konzept dahingehend nachteilig, daß es nur für Anwendungen geeignet, die eine variable Übertragungsrate unterstützen, wie z. B. die Speicherung von komprimierten Audiosignalen oder die Übertragung von komprimierten Audiosignalen über Paket-basierte Netze, wie z. B. das Internet. Viele Anwendungen fordern jedoch einen Audiocodierer mit einer konstanten Übertragungsrate. Aufgrund der zeitlich variierenden spektralen und zeitlichen Eigenschaften eines Audiosignals führt dies unweigerlich zu einer variablen Qualität. Insbesondere kann je nach Bitrate der Fall entstehen, in dem Abschnitte des Audiosignals, die relativ geringe Maskierungseigenschaften haben, nicht ausreichend fein quantisiert werden können, d. h. unter-codiert werden und im decodierten Signal unter Umständen hörbare Störungen enthalten, während andererseits leicht zu codierende Segmente, d. h. Audiosignalabschnitt mit guten Maskierungseigenschaften, genauer als nötig codiert werden müssen, d. h. über-codiert werden.The psychoacoustic masking threshold of an audio signal section depends on the actual input audio signal. If the audio signal changes over time, the masking properties also change over time. For reasons of data efficiency, it is preferred to always introduce as much quantization noise into the audio signal as possible, ie the quantization noise should correspond as closely as possible to the psychoacoustic masking threshold. Audio signal sections with good masking properties can therefore be encoded with a relatively low bit cost, while on the other hand audio signal sections with relatively poor masking properties, such as. B. tonal audio signal sections, must be quantized very finely, which in turn means that a large number of bits must be used to encode these audio signal sections. An encoder that tries to always introduce exactly the amount of interference given by the masking threshold will therefore produce a constant quality audio signal. However, due to the time-varying nature of the input signal, this leads to a variable bit rate at the output of the encoder. Although coding with constant quality - and thus with a variable bit rate - is attractive for data efficiency reasons on the one hand and audio quality reasons on the other hand, this concept is disadvantageous in that it is only suitable for applications which support a variable transmission rate, such as z. B. the storage of compressed audio signals or the transmission of compressed audio signals over packet-based networks, such as. B. the Internet. However, many applications require an audio encoder with a constant transmission rate. Due to the temporally varying spectral and temporal properties of an audio signal, this inevitably leads to variable quality. In particular, depending on the bit rate, the case may arise in which sections of the audio signal which have relatively low masking properties cannot be quantized sufficiently finely, ie are under-coded and may contain audible interference in the decoded signal, while on the other hand segments which are easy to code, ie audio signal section with good masking properties, must be encoded more precisely than necessary, ie over-encoded.
Um die Nachteile des Über-Codierens und Unter-Codierens zu überwinden, wird üblicherweise eine Bitsparkassenfunktion eingesetzt. Die Bitsparkasse wird gefüllt, wenn leicht zu codierende Audioabschnitte codiert werden, derart, daß Bits, die nicht benötigt werden, um diese leicht zu codie- renden Abschnitte zu codieren, nicht einfach durch eine feiner als nötige Quantisierung "verschwendet" werden, sondern daß dennoch eine gröbere Quantisierung verwendet wird und die überzähligen Bits in die Bitsparkasse "gesteckt" werden.In order to overcome the disadvantages of over-coding and under-coding, a bit savings bank function is usually used. The bit savings bank is filled when easy-to-encode audio sections are encoded such that bits that are not needed to encode these easy-to-encode sections are not simply "wasted" by more subtle than necessary quantization, but nevertheless a coarser quantization is used and the surplus bits are "inserted" into the bit savings bank.
Kommen dagegen Audioabschnitte vor, die schwer zu codieren sind, d. h. bei denen eine geringere Quantisiererschritt- weite eingesetzt werden muß als eigentlich durch die geforderte konstante mittlere Datenrate möglich ist, so wird zu diesem Zweck die Bitsparkasse "geleert", um trotz der ge¬ forderten Datenrate eine feinere Quantisierung als eigent¬ lich möglich einzusetzen, so daß im decodierten Audiosignal auch in diesen Abschnitten keine hörbare Störung enthalten ist. Die Bitsparkassenfunktion fungiert somit als Puffer,Come contrast, audio segments before that are difficult to encode, ie where lower Quantisiererschritt- must be wide used than is actually possible by the required constant average data rate, it is to this end, the bit reservoir "emptied" to calling despite the ge ¬ use data rate, a finer quantization than Eigent ¬ Lich possible, so that contained in the decoded audio signal in these sections no audible interference. The bit savings bank function thus acts as a buffer,
nach "außen" einen Audiocodierer mit konstanter Bitrate zu machen. Heutzutage entwickelt sich die Musikverteilung beispielsweise über das Internet zu einer zunehmend wichtigeren Technologie. Der meiste Musikinhalt ist komprimiert, um Speicherplatz zu sparen und die Übertragung über Übertra- gungskanäle mit begrenzter Bandbreite zu beschleunigen. Das Überwachen der Verwendung der in Übertragungsnetzen verteilten Musikstücke oder das Verfolgen von illegalen Kopien derselben wird jedoch zu einem immer größeren Problem. Während einerseits eine breite Verteilung von Audiostücken wünschenswert ist, müssen dennoch Urheberrechte respektiert werden. In diesem Zusammenhang stellt die "Wasserzeichentechnik" (Watermarking) einen nützlichen Mechanismus dar, um solche illegalen Kopien zu verfolgen, oder um Urheberrechts-Informationen oder allgemein das geistige Eigentum an den Stücken im Audiosignal unterzubringen.to make an audio encoder with constant bit rate to the "outside". Nowadays, music distribution via the Internet, for example, is becoming an increasingly important technology. Most of the music content is compressed in order to save storage space and to accelerate the transmission over transmission channels with limited bandwidth. However, monitoring the use of the music pieces distributed in transmission networks or tracking illegal copies thereof is becoming an increasing problem. While on the one hand a broad distribution of audio pieces is desirable, copyrights have to be respected. In this context, "watermarking" is a useful mechanism for tracking such illegal copies, or for incorporating copyright information, or general intellectual property, into the audio signal.
Das Einbringen von Wasserzeichen in nicht-komprimierte Multimediadaten, wie z. B. Bildern, Video, Audio usw. ist bekannt. Um Wasserzeichen in komprimiertes Material einzu- bringen, wird jedoch ein schnelles, Qualitäts-bewahrendes Wasserzeichenverfahren benötigt.The introduction of watermarks in non-compressed multimedia data, such as B. pictures, video, audio, etc. is known. In order to introduce watermarks into compressed material, however, a fast, quality-preserving watermarking process is required.
Die Fachveröffentlichung "Audio Watermarking of MPEG-2-AAC Bit Streams", Christian Neubauer, Jürgen Herre, 108. AES Convention, Paris 2000, Preprint 5101 lehrt zunächst, eine spektrale Darstellung eines Audiosignals zu erzeugen. Zu dieser wird dann ein gespreiztes und spektral transformiertes Wasserzeichensignal addiert. Aus dem Summensignal wird durch Quantisierung und Huffman-Codierung ein neuer Bit- ström erzeugt. Dieses sogenannte Bitstrom- Wasserzeichenverfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da keine volle Decodierung des mit einem Wasserzeichen zu versehenden Bitstroms erfolgen muß. Weiterhin hat dieses Verfahren den Vorteil der hohen Audio- qualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch aufeinander abgestimmt werden können, wenn die durch das Wasserzeichen in das Audiosignal eingeführte E- nergie unterhalb der psychoakustischen Maskierungsschwelle liegt. Das Verfahren zeichnet sich ferner durch eine hohe Robustheit aus, da das Wasserzeichen nicht aus dem wieder decodierten Audiosignal beispielsweise durch einen illegalen Verbreiter des Audiosignals entfernt werden kann, ohne die Audioqualität zu beeinträchtigen.The specialist publication "Audio Watermarking of MPEG-2-AAC Bit Streams", Christian Neubauer, Jürgen Herre, 108th AES Convention, Paris 2000, Preprint 5101 first teaches how to generate a spectral representation of an audio signal. A spread and spectrally transformed watermark signal is then added to this. A new bit stream is generated from the sum signal by quantization and Huffman coding. This so-called bit stream watermarking method is characterized by a low computational complexity, since the bit stream to be provided with a watermark does not have to be fully decoded. This method also has the advantage of high audio quality, since the quantization noise and the watermark noise can be matched to one another if the energy introduced into the audio signal by the watermark is below the psychoacoustic masking threshold lies. The method is also characterized by a high level of robustness, since the watermark cannot be removed from the re-decoded audio signal, for example by an illegal distributor of the audio signal, without impairing the audio quality.
Nachteilig an dem beschriebenen Verfahren ist jedoch die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.A disadvantage of the described method, however, is the fact that the watermark may be quantized or weakened under certain circumstances by the quantization of the signal applied to the watermark. This is due to the fact that the energy of the watermark signal is sometimes in the range of the quantization interval. Furthermore, there is only limited control over the interference introduced by the watermark. B. can affect an audio quality loss.
Ein weiteres Wasserzeichenverfahren ist die Einbettung des Wasserzeichens während der Komprimierung des Audiosignals. Dieses Konzept ist in der Fachveröffentlichung "Combined Compression/Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer und Jürgen Herre, 110. AES Convention, 12. bis 15 Mai 2001, Amsterdam, Preprint 5344, beschrieben. Zunächst wird ein unkomprimiertes Audiosignal einem psychoakustischen Modell zugeführt, um die Maskie- rungsschwelle zu bestimmen. Hierauf wird das Audiosignal in den Frequenzbereich transformiert. Das gespreizte, spektral repräsentierte Wasserzeichensignal wird anhand der Maskierungsschwelle im Frequenzbereich gewichtet und zum Spektrum des Eingangsaudiosignals addiert. Anhand der Maskierungs- schwelle werden die Parameter für die Quantisierung ermittelt, woraufhin das Wasserzeichen-beaufschlagte Signal quantisiert und codiert wird. Auch dieses Verfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da durch die Zusammenziehung von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z. B. die Berechnung des Maskierungsmodells und die Überführung des Audiosignals in eine spektrale Darstellung, nur einmal durchgeführt werden müssen. Das Verfahren liefert ferner üblicherweise eine gute Audioqualität, da Quantisierungsgeräusch und Wasserzeichengeräusch aufeinander abgestimmt werden können.Another watermarking method is to embed the watermark during the compression of the audio signal. This concept is described in the specialist publication "Combined Compression / Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer and Jürgen Herre, 110th AES Convention, May 12-15, 2001, Amsterdam, Preprint 5344. First, an uncompressed audio signal is fed to a psychoacoustic model in order to determine the masking threshold. The audio signal is then transformed into the frequency domain. The spread, spectrally represented watermark signal is weighted based on the masking threshold in the frequency domain and added to the spectrum of the input audio signal. The parameters for the quantization are determined on the basis of the masking threshold, whereupon the watermarked signal is quantized and encoded. This method is also characterized by a low level of computational complexity, since certain operations, such as e.g. B. the calculation of the masking model and the conversion of the audio signal into a spectral representation only have to be carried out once. The method usually also provides one good audio quality, since quantization noise and watermark noise can be coordinated.
Nachteilig an diesem Verfahren ist jedoch ebenfalls die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist wieder darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.However, a disadvantage of this method is also the fact that the watermark may be quantized or weakened under certain circumstances by the quantization of the signal applied to the watermark. This is again due to the fact that the energy of the watermark signal is sometimes in the range of the quantization interval. Furthermore, there is only limited control over the interference introduced by the watermark. B. can affect an audio quality loss.
Wenn die spektrale Darstellung des Audiosignals betrachtet wird, so ist eine Vielzahl von Audiospektralwerten zu sehen. Das gespreizte Wasserzeichensignal ist ebenfalls durch eine Vielzahl von Spektrallinien gekennzeichnet. Damit das Wasserzeichen jedoch nicht zu hörbaren Störungen im wieder decodierten Audiosignal führt, ist die Höhe der Wasserzei- chen-Spektrallinien wesentlich geringer als die Höhe der Audiosignal-Spektrallinien. Nach einer Addition des Wasserzeichen-Spektrums zum Audio-Spektrum ist das kombinierte Spektrum nur leicht gegenüber dem ursprünglichen Spektrum verändert. Die dann folgende Quantisierung des kombinierten Spektrums wird das Wasserzeichen immer dann ersatzlos entfernen, wenn die Quantisierungs-Schrittweite größer ist als die Höhe der Wasserzeichen-Spektrallinien, die mit dieser Quantisiererschrittweite quantisiert werden. Werden zu viele Wasserzeichen-Spektrallinien durch das darauffolgende Quantisieren "wegquantisiert", so kann der Wasserzeichendetektor kein eindeutiges Wasserzeichen mehr extrahieren.If the spectral representation of the audio signal is considered, a large number of audio spectral values can be seen. The spread watermark signal is also characterized by a large number of spectral lines. However, so that the watermark does not lead to audible interference in the decoded audio signal, the height of the watermark spectral lines is significantly less than the height of the audio signal spectral lines. After adding the watermark spectrum to the audio spectrum, the combined spectrum is only slightly changed compared to the original spectrum. The subsequent quantization of the combined spectrum will always remove the watermark without replacement if the quantization step size is greater than the height of the watermark spectral lines that are quantized with this quantizer step size. If too many watermark spectral lines are "quantized away" by the subsequent quantization, the watermark detector can no longer extract a clear watermark.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Einbetten eines Wasserzeichens in ein Audiosignal zu schaffen, das einerseits eine gute Audioqualität liefert, und das andererseits auch eine gute Wasserzeichen-Detektierbarkeit sicherstellt . Diese Aufgabe wird durch ein Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 1 oder durch eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 16 gelöst.The object of the present invention is to provide an improved concept for embedding a watermark in an audio signal which on the one hand provides good audio quality and on the other hand also ensures good watermark detectability. This object is achieved by a method for embedding a watermark in an audio signal according to claim 1 or by a device for embedding a watermark in an audio signal according to claim 16.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine bessere Wasserzeichendetektierbarkeit erreicht wird, wenn bei der Wasserzeicheneinbettung die Tatsache berücksichtigt wird, daß das Audiosignal samt Wasserzeichen einer Quantisierung unterzogen wird. Ein Wasserzeichen wird nur dann detektierbar sein, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, durch das Wasserzeichen in eine andere Quantisierungsstufe fällt als wenn kein Wasserzeichen eingebettet wird. Nur in diesem Fall wird ein Wasserzeichendetektor, der lediglich quantisierte Informationen erhält, ein Wasserzeichen detektieren können. In anderen Worten ausgedrückt bedeutet dies, daß dann, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, in dieselbe Quantisierungsstufe fällt wie die ent- sprechende Spektrallinie, die nur das Audiosignal darstellt, die Wasserzeicheneinbettung vergeblich war, da im quantisierten Signal kein Energieanteil, der von dem Wasserzeichen herrührt, zu sehen sein wird. Das Wasserzeichen ist wegquantisiert worden.The present invention is based on the finding that better watermark detectability is achieved if the fact that the audio signal including the watermark is subjected to quantization is taken into account in the watermark embedding. A watermark will only be detectable if a spectral line, which represents the watermark and audio signal, falls through the watermark into a different quantization level than if no watermark is embedded. Only in this case will a watermark detector, which only receives quantized information, be able to detect a watermark. In other words, this means that if a spectral line that represents the watermark and the audio signal falls into the same quantization level as the corresponding spectral line that only represents the audio signal, the watermark embedding was in vain, since there was no energy component in the quantized signal from the watermark will be seen. The watermark has been quantized away.
Erfindungsgemäß wird daher die spektrale Darstellung des Wasserzeichensignals derart verarbeitet, daß sichergestellt wird, daß das durch den Schritt des Verarbeitens verarbeitete Wasserzeichensignal so gestaltet ist, daß es auch nach einer Quantisierung noch vorhanden sein wird. Um dies zu erreichen wird ein vorbestimmter Wasserzeichen-Startwert gewählt, welcher von der spektralen Darstellung des Wasserzeichensignals abhängt. Natürlich darf das Wasserzeichen zu keiner oder nur zu einer sehr geringen Störung des Audio- Signals führen. Aus diesem Grund wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals eingeführte Störung ermittelt, bei der jedoch die Verhältnisse nach einer Quantisierung der spektralen Darstellung des Audiosignals zugrunde gelegt werden. Damit ist es einerseits möglich, zu sehen, ob nach der Quantisierung etwas vom Wasserzeichen verbleibt. Andererseits kann sichergestellt werden, daß die Störung des Wasserzeichens nach der Quantisierung so ist, wie sie sein soll. Falls die durch den Wasserzeichen-Startwert eingeführte Störung größer als eine vorbestimmte Storungsschwelle ist, wird der Wasserzeichen-Startwert so lange verändert, bis die durch einen veränderten Wasserzeichen- Startwert in die spektrale Darstellung nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbe¬ stimmten Störschwelle ist. Der dadurch erhaltene veränderte Wasserzeichen-Startwert wird dann mit dem Audiosignal kombiniert, um das Wasserzeichen-behaftete Audiosignal zu er- halten, in das das Wasserzeichen eingebettet ist.According to the invention, the spectral representation of the watermark signal is therefore processed in such a way that it is ensured that the watermark signal processed by the processing step is designed in such a way that it will still be present after quantization. In order to achieve this, a predetermined watermark starting value is selected, which depends on the spectral representation of the watermark signal. Of course, the watermark must not lead to any or only a very slight interference in the audio signal. For this reason, a disturbance introduced by the predetermined watermark start value into the spectral representation of the audio signal is determined, but in which the conditions after a quantization of the spectral representation of the audio signal can be used. On the one hand, this makes it possible to see whether some of the watermark remains after quantization. On the other hand, it can be ensured that the disturbance of the watermark after quantization is as it should be. If introduced by the watermark initial value error is greater than a predetermined Storungsschwelle, the watermark initial value is changed until the system introduced by a modified watermark initial value in the spectral representation after quantization error less than or equal to the vorbe ¬ voted fault threshold is. The resulting changed watermark starting value is then combined with the audio signal in order to obtain the watermarked audio signal in which the watermark is embedded.
Ein Vorteil der vorliegenden Erfindung liegt darin, daß nun nicht mehr Verhältnisse berücksichtigt werden, die letztendlich nicht den Ausgangsverhältnissen entsprechen, näm- lieh die Audiosignal/Wasserzeichen-Verhältnisse vor der Quantisierung, sondern daß das Wasserzeichen z. B. iterativ so lange verändert wird, bis eine gewünschte Wasserzeichen- "Störenergie" gefunden ist. Erfindungsgemäß werden nunmehr die Verhältnisse nach dem Quantisierer berücksichtigt, d. h. die Verhältnisse, die für den Audiosignal-Decodierer und für den Wasserzeichen-Extraktor maßgeblich sind.An advantage of the present invention is that ratios that ultimately do not correspond to the initial ratios are no longer taken into account, namely the audio signal / watermark ratios before the quantization, but that the watermark z. B. iteratively changed until a desired watermark "interference energy" is found. According to the invention, the conditions after the quantizer are now taken into account, i. H. the ratios that are relevant for the audio signal decoder and for the watermark extractor.
Obgleich im Stand der Technik üblicherweise die Wasserzeichenenergie derart eingestellt worden ist, daß die Wasser- Zeichenenergie kleiner oder gleich der psychoakustischen Maskierungsschwelle ist, blieb dennoch die Unwägbarkeit zurück, was mit dem Wasserzeichensignal während der Quantisierung geschieht. Wie es ausgeführt worden ist, konnte zum einen der Fall auftreten, daß das Wasserzeichen wegquanti- siert wird, was dazu führt, daß im decodierten Signal kein Wasserzeichen oder nur ein sehr schwaches Wasserzeichen extrahiert werden konnte. Andererseits konnte auch der Fall auftreten, daß durch das Wasserzeichen, obwohl es so ge- wichtet worden ist, daß es unterhalb der Maskierungsschwelle liegt, dennoch Störungen eingeführt worden sind, die im decodierten Signal hörbar waren.Although the watermark energy has usually been set in the prior art in such a way that the watermark energy is less than or equal to the psychoacoustic masking threshold, the unpredictability of what happens to the watermark signal during quantization still remains. As has been explained, on the one hand the case could occur that the watermark is quantized away, which means that no watermark or only a very weak watermark could be extracted in the decoded signal. On the other hand, the case could also arise that, although the watermark What has been important is that it is below the masking threshold, yet noise has been introduced that was audible in the decoded signal.
Erfindungsgemäß wird nunmehr aufgrund der Verarbeitung des Wasserzeichens auf der Basis der Verhältnisse nach der Quantisierung eine genaue Kontrolle erreicht. Diese Kontrolle hat den Vorteil, daß nicht nur einerseits sichergestellt werden kann, daß das Wasserzeichen zu keiner oder nur minimal hörbaren Störung führt, sondern daß gleichzeitig auch eine ausreichende Wasserzeichen-Detektierbarkeit sichergestellt wird. Andererseits liefert das erfindungsgemäße Verfahren den Vorteil, daß für Fälle, bei denen es besonders auf eine gute Detektierbarkeit ankommt, auch bewußt zugunsten einer höheren Wasserzeichen-Detektierbarkeit gewisse - tolerierbare - Störungen in das Audiosignal eingeführt werden, während in anderen Fällen, bei denen die Wasserzeichen-Detektierbarkeit nicht unter allen Umständen zu jedem Zeitpunkt sichergestellt werden muß, Kompromisse hin- sichtlich der Wasserzeichen-Detektierbarkeit eingegangen werden können, um höchste Audioqualitäts-Ansprüche zu erfüllen.According to the invention, a precise control is now achieved due to the processing of the watermark on the basis of the conditions after the quantization. This control has the advantage that not only can it be ensured on the one hand that the watermark leads to no or only minimally audible interference, but that at the same time sufficient watermark detectability is ensured. On the other hand, the method according to the invention has the advantage that for cases in which good detectability is particularly important, certain - tolerable - disturbances are deliberately introduced into the audio signal in favor of a higher watermark detectability, while in other cases in which the watermarks -Detectability does not have to be ensured at all times under all circumstances, compromises with regard to watermark detectability can be made in order to meet the highest audio quality requirements.
Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird das Wasserzeichensignal vor der Quantisierung dem Audiosignal hinzugefügt, um ein kombiniertes Signal zu erhalten. Das kombinierte Signal wird dann quanti- siert und wieder invers quantisiert und mit dem ursprünglichen Audiosignal verglichen. Aus dem Vergleich wird be- stimmt, ob die durch das Wasserzeichen eingeführte Störung tolerabel ist. Wird festgestellt, daß die Störung nicht to- lerabel ist, so wird das Spektrum des Wasserzeichensignals iterativ unter Verwendung bestimmter Strategien gewichtet, um dann wieder eine Quantisierung und inverse Quantisierung durchzuführen, bis festgestellt wird, daß die Störung nun tolerabel ist. Das durch diese Verarbeitung erhaltene Wasserzeichen-Spektrum wird dann dem ursprünglichen Audiospektrum hinzuaddiert. Das addierte bzw. kombinierte Signal wird dann quantisiert, Entropie-codiert und mit Seiteninformationen versehen, um einen Audiobitstrom zu erhalten, in dem das Wasserzeichen vorhanden ist.In the preferred embodiment of the present invention, the watermark signal is added to the audio signal prior to quantization to obtain a combined signal. The combined signal is then quantized and again inversely quantized and compared with the original audio signal. The comparison determines whether the interference introduced by the watermark is tolerable. If it is determined that the disturbance is not tolerable, the spectrum of the watermark signal is weighted iteratively using certain strategies in order then to carry out quantization and inverse quantization again until it is determined that the disturbance is now tolerable. The watermark spectrum obtained by this processing is then added to the original audio spectrum. The added or combined signal is then quantized, entropy-encoded and provided with side information to obtain an audio bit stream in which the watermark is present.
Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung wird das ursprüngliche Audiosignal quantisiert. Dem Audiosignal wird ein quantisiertes Wasserzeichen hinzuaddiert, um das kombinierte Signal zu erhalten. Das kombinierte Signal wird dann nicht mehr, wie beim ersten Ausfüh- rungsbeispiel, noch einmal quantisiert, sondern unmittelbar Entropie-codiert. Das dem quantisierten Audiosignal hinzugefügte "quantisierte" Wasserzeichensignal wird hierbei derart eingestellt, daß einerseits die Forderung nach tole- rabler Störung erfüllt ist und andererseits eine erwünschte Wasserzeichen-Detektierbarkeit erreicht wird.In another embodiment of the present invention, the original audio signal is quantized. A quantized watermark is added to the audio signal to obtain the combined signal. The combined signal is then no longer quantized again, as in the first exemplary embodiment, but is directly entropy-coded. The "quantized" watermark signal added to the quantized audio signal is set in such a way that on the one hand the requirement for tolerable interference is met and on the other hand a desired watermark detectability is achieved.
Unabhängig davon, ob das kombinierte Signal noch quantisiert wird, oder ob das kombinierte Signal bereits in quan- tisierter Form vorliegt, wird gemäß der vorliegenden Erfin- düng eine genaue Steuerung der durch das Wasserzeichen eingeführten Störung in das auf dem Signal erreicht.Regardless of whether the combined signal is still being quantized or whether the combined signal is already in quantized form, according to the present invention precise control of the interference introduced by the watermark is achieved in that on the signal.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:Preferred embodiments of the present invention are explained in detail below with reference to the accompanying drawings. Show it:
Fig. 1 ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal;1 shows a block diagram of an inventive device for embedding a watermark in an audio signal;
Fig. 2 ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbringen eines Wasserzeichens in ein Audiosignal gemäß einem ersten Ausführungsbeispiel;2 shows a block diagram of a device according to the invention for introducing a watermark into an audio signal according to a first exemplary embodiment;
Fig. 3 eine erfindungsgemäße Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel; und Fig. 4a bis 4d eine schematische Erläuterung des Liniense- lektions-Algorithmus beim zweiten Ausführungsbeispiel der vorliegenden Erfindung.3 shows an inventive device for embedding a watermark in an audio signal according to a second exemplary embodiment; and 4a to 4d a schematic explanation of the line selection algorithm in the second exemplary embodiment of the present invention.
Die in Fig. 1 gezeigte erfindungsgemäße Vorrichtung umfaßt einen Audioeingang 10 und einen Wasserzeicheneingang 12. Sowohl das Audiosignal an dem Audioeingang 10 als auch das Wasserzeichensignal an dem Wasserzeicheneingang 12 werden mittels einer Einrichtung 14 bzw. 16 in eine spektrale Darstellung überführt. Die spektrale Darstellung des Audiosignals umfaßt Audiospektralwerte, während die spektrale Darstellung des Wasserzeichensignals Wasserzeichenspektralwerte aufweist. In einer Einrichtung 18 zum Kombinieren werden die Audiospektralwerte mit veränderten Wasserzeichen- Spektralwerten kombiniert, um an einem Ausgang 20 das kombinierte Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist. Erfindungsgemäß ist hierzu eine Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Was- serzeichensignals abhängig von einer über einen Eingang 24 gelieferten psychoakustischen Maskierungsschwelle vorgesehen. Die spektrale Darstellung des Wasserzeichensignals wird abhängig von der über den Eingang 24 erhaltenen psychoakustischen Maskierungsschwelle verarbeitet, um ein ver- arbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingeführte Störung unter einer vorbestimmten Störungs- schwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt.The device according to the invention shown in FIG. 1 comprises an audio input 10 and a watermark input 12. Both the audio signal at the audio input 10 and the watermark signal at the watermark input 12 are converted into a spectral representation by means of a device 14 or 16. The spectral representation of the audio signal comprises audio spectral values, while the spectral representation of the watermark signal has watermark spectral values. In a device 18 for combining, the audio spectral values are combined with changed watermark spectral values in order to obtain the combined audio signal in an output 20, in which the watermark is embedded. According to the invention, a device 22 for processing the spectral representation of the watermark signal is provided depending on a psychoacoustic masking threshold supplied via an input 24. The spectral representation of the watermark signal is processed depending on the psychoacoustic masking threshold obtained via the input 24 in order to obtain a processed watermark signal so that a disturbance introduced into the audio signal by the processed watermark signal is below a predetermined disturbance threshold which is different from that psychoacoustic masking threshold depends.
Hierzu umfaßt die Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Wasserzeichensignals eine Einrichtung 26 zum Wählen eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt. In einer Einrichtung 28 wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführte Störung ermit- telt. Hierzu werden von einer Einrichtung 30 zum Liefern von Quantisierungsinformationen Quantisierungsinformationen zugeführt. Die Einrichtung 30 liefert Quantisierungsinformationen, die von dem ursprünglichen Audiosignal, also dem Audiosignal ohne Wasserzeichen, abhängen.For this purpose, the device 22 for processing the spectral representation of the watermark signal comprises a device 26 for selecting a predetermined watermark starting value, which depends on the spectral representation of the watermark signal. In a device 28, a disturbance introduced by the predetermined watermark start value into the spectral representation of the audio signal after quantization of the spectral representation of the audio signal is detected. telt. For this purpose, quantization information is supplied by a device 30 for supplying quantization information. The device 30 provides quantization information which depends on the original audio signal, that is to say the audio signal without a watermark.
In einer Einrichtung 32 wird untersucht, ob die ermittelte Störung größer als die vorbestimmte Störschwelle ist. Ist dies nicht der Fall, d. h. ist die Störung akzeptabel, so wird der Wasserzeichen-Startwert unmittelbar der Einrichtung 18 zum Kombinieren zugeführt. Ist dies dagegen der Fall, d. h. ist die eingeführte Störung zu groß, bzw. anders als gewünscht, so wird eine Einrichtung 34 zum Verändern des Wasserzeichen-Startwerts aktiviert, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Zu diesem Zweck muß die in der Einrichtung 22 zum Verarbeiten skizzierte Schleife möglicherweise mehrmals iterativ durchlaufen werden, um irgendwann am Ausgang der Einrichtung 32 einen veränderten Wasserzeichen-Startwert zu erhalten, der als verarbeitetes Wasserzeichensignal verwendet wird und der Einrichtung 18 zum Kombinieren zugeführt wird, um das Audiosignal am Ausgang 20 zu erhalten, in das das Wasserzeichen eingebettet ist.A device 32 examines whether the ascertained disturbance is greater than the predetermined disturbance threshold. If not, i. H. if the disturbance is acceptable, the watermark start value is fed directly to the device 18 for combining. If this is the case, however. H. if the introduced interference is too great or different than desired, a device 34 for changing the watermark start value is activated until the interference introduced by a changed watermark start value in the spectral representation of the audio signal after quantization is less than or equal to the predetermined one Interference threshold is. For this purpose, the loop sketched in the processing device 22 may have to be iterated several times in order to at some point obtain a changed watermark starting value at the output of the device 32, which is used as a processed watermark signal and fed to the combining device 18 in order to to receive the audio signal at the output 20 in which the watermark is embedded.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung, das in Fig. 2 gezeigt ist, wird das Kombinieren mittels einer Addition 18 vor dem Quantisieren durchge- führt. Die Einrichtung 28 zum Ermitteln der durch den Block Wasserzeichen-Gewichtung 26 festgelegten Startwert in das Audiosignal eingeführten Störung wird dadurch ermittelt, daß zunächst in einer Quantisierer/Inversquantisierer- Einrichtung 28a das kombinierte Signal quantisiert und in- vers quantisiert wird. In einer Einrichtung 28b wird dann beispielsweise durch Differenzbilden und Quadrieren der Differenzwerte die durch das Wasserzeichen eingeführte Störung berechnet und dann in der Einrichtung 32 mit der psy- choakustischen Maskierungsschwelle 24 verglichen. Ist die Störung zu groß, wird die Einrichtung 34, die in Fig. 2 mit "Gewichtungskontrolle" bezeichnet ist, angesteuert, um dem Block 26 veränderte Gewichtungsfaktoren zuzuführen, um dann das verändert gewichtete Wasserzeichen-Spektrum in der Einrichtung 18 mit dem ursprünglichen Audiosignal in spektraler Darstellung zu kombinieren und die Iterationsschleife von neuem zu durchlaufen.In a preferred exemplary embodiment of the present invention, which is shown in FIG. 2, the combination is carried out by means of an addition 18 before the quantization. The device 28 for determining the initial value introduced into the audio signal by the block watermark weighting 26 is determined by first quantizing and inversely quantizing the combined signal in a quantizer / inverse quantizer device 28a. The disturbance introduced by the watermark is then calculated in a device 28b, for example by forming the difference and squaring the difference values, and then in the device 32 with the psy- choacoustic masking threshold 24 compared. If the disturbance is too great, the device 34, which is labeled "weight control" in FIG. 2, is actuated in order to supply changed weighting factors to the block 26, in order then to change the weighted spectrum of watermarks in the device 18 with the original audio signal in to combine spectral representation and to go through the iteration loop again.
Bei dem in Fig. 2 dargestellten Ausführungsbeispiel wird es bevorzugt, als Wasserzeichen-Startwert das mit einem für alle Spektrallinien gleich gewichteten Wasserzeichen- Spektrum zu nehmen. Der Gewichtungsfaktor für jede Spektrallinie ist daher für alle Spektrallinien gleich einer Konstanten, die so gewählt ist, daß die Wasserzeichenenergie über der Maskierungsschwelle liegt. Dann wird die Wasserzeichenenergie schrittweise reduziert, um dann die Energie des Wasserzeichens unter die Maskierungsschwelle zu „i- terieren" .In the exemplary embodiment shown in FIG. 2, it is preferred to use the watermark spectrum with a watermark spectrum weighted equally for all spectral lines as the initial watermark value. The weighting factor for each spectral line is therefore equal to a constant for all spectral lines, which is chosen such that the watermark energy lies above the masking threshold. Then the watermark energy is gradually reduced in order to then "iterate" the energy of the watermark below the masking threshold.
Wenn also zunächst von der Einrichtung 32 festgestellt wird, daß die Störung zu groß wird, ist die Einrichtung 34 zur Kontrolle der Gewichtungsfaktoren ausgebildet, um alle Gewichtungsfaktoren zu verkleinern, z. B. zu halbieren. Wenn dann die Störung immer noch zu groß ist, könnten in einem nächsten Iterationsschritt alle aktuellen Gewichtungsfaktoren erneut halbiert werden usw. Dies kann fortgeführt werden, bis die Einrichtung 32 feststellt, daß die Störung nun in Ordnung ist.So if it is first determined by the device 32 that the disturbance is too large, the device 34 is designed to control the weighting factors in order to reduce all weighting factors, e.g. B. cut in half. If the disturbance is then still too large, all current weighting factors could be halved again in a next iteration step, etc. This can continue until the device 32 determines that the disturbance is now OK.
Nachdem die Kombination von Audiosignal und verarbeitetem Wasserzeichensignal im Spektralbereich, also nicht im Quantisierungsbereich, sondern vor der Quantisierung stattfindet, muß noch eine Quantisierung durchgeführt werden. Hier- zu empfiehlt es sich, den Quantisierer-Abschnitt der Einrichtung 28a zu verwenden, um die Ausgangswerte des Quanti- siererabschnitts als Audiosignal samt eingebettetem Wasserzeichen auszugeben. Mittels einer Analyse-Synthese-Iteration, wie sie in Fig. 2 gezeigt ist, wird somit die durch das Wasserzeichen nach der Quantisierung entstandene Störung bestimmt. Somit läßt sich einerseits sicherstellen, daß auch nach der Quantisierung Wasserzeichenenergie im Signal verbleibt. Andererseits kann die tatsächlich eingebrachte Störung ermittelt werden, was zur Erzielung einer hohen Audioqualität von Vorteil ist. Das spektral dargestellte Wasserzeichensignal wird so- mit, wie es anhand von Fig. 2 ausgeführt worden ist, mittels einer Gewichtungsfilterbank, die in dem Block 26 enthalten sein kann, spektral mit den von dem Block 34 zur Verfügung gestellten aktuellen Gewichtungsfaktoren gewich- tet . Das entstehende Signal wird zu dem ursprünglichen Au- diosignal addiert. Wie es ausgeführt worden ist, wird das kombinierte Signal am Ausgang der Einrichtung 18 quantisiert und invers quantisiert und ergibt das am Ausgang der Einrichtung 28a vorliegende Signal, das in die Einrichtung 28b genauso wie das ursprüngliche Audiosignal eingespeist wird. Die Einrichtung 28b vergleicht nunmehr das Originalsignal mit dem quantisierten und wieder invers quantisierten Signal und bestimmt daraus das Quantisierungs- Fehlersignal, das der Einrichtung 32 zugeführt wird. Anhand der Einrichtung 32 wird wiederum die Gewichtungskontrolle im Block 34 angesteuert, um neue bessere Gewichtungsfaktoren zu bestimmen. Hierzu steht die von dem Maskierungsmodellen ermittelte Maskierungsschwelle zur Verfügung, die angibt, wieviel Störung in das Signal an einer bestimmten Stelle im Signalspektrum "erlaubt" ist. Wenn der Block Ge- wichtungskontrolle 34 optimale Gewichtungsfaktoren hinsichtlich auf die gewünschte Audiosignalstörung und gewünschte Wasserzeichendetektierbarkeit, d. h. Wasserzeichenenergie, ermittelt hat, bricht das Verfahren ab. Die zuletzt von dem Block 28a ermittelten quantisierten Spekt- ralwerte des Kombinationssignals werden dann als Resultat zum Bitstrommultiplexer weitergegeben, um dort mit den Seiteninformationen zusammen zu einem Audio-Bitstrom geformt zu werden. Im nachfolgenden wird auf Fig. 3 eingegangen, um eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel der vorlie- genden Erfindung darzustellen. Im Gegensatz zu dem in Fig. 2 gezeigten ersten Ausführungsbeispiel, bei dem ein nicht- quantisiertes Audiosignal mit einem nicht-quantisierten Wasserzeichensignal kombiniert wird, findet diese Kombination 18 in Fig. 3 im "Quantisierungsbereich" statt, d. h. es wird ein quantisiertes Audiosignal mit einem quantisierten Wasserzeichen kombiniert. Dies kann dadurch erreicht werden, daß entweder mittels eines Quantisierers 42 durch Quantisieren des ursprünglichen Audiosignals die Quantisie- rerstufen berechnet werden, oder daß die Quantisierungsstu- fen aus einem codierten Audiosignal extrahiert werden. Ansprechend auf die durch die Einrichtung 42 bereitgestellten Quantisierungsstufen wird eine Einrichtung 40a zum Berechnen des quantisierten Audiosignals minus einer vorbestimmten Anzahl von n Quantisierungsstufen und eine Einrichtung 40b zum Berechnen des quantisierten Audiosignals plus eine vorbestimmte Anzahl von n Quantisierungsstufen betrieben.After the combination of audio signal and processed watermark signal takes place in the spectral range, that is, not in the quantization range, but before the quantization, a quantization must be carried out. For this purpose, it is advisable to use the quantizer section of the device 28a in order to output the output values of the quantizer section as an audio signal including the embedded watermark. The disturbance caused by the watermark after quantization is thus determined by means of an analysis-synthesis iteration, as shown in FIG. 2. On the one hand, this ensures that watermark energy remains in the signal even after quantization. On the other hand, the interference actually introduced can be determined, which is advantageous for achieving high audio quality. The spectrally represented watermark signal is thus spectrally weighted with the current weighting factors provided by block 34 by means of a weighting filter bank, which can be contained in block 26, as has been explained with reference to FIG. 2. The resulting signal is added to the original audio signal. As has been stated, the combined signal at the output of device 18 is quantized and inversely quantized and results in the signal present at the output of device 28a which is fed into device 28b in the same way as the original audio signal. The device 28b now compares the original signal with the quantized and again inversely quantized signal and uses this to determine the quantization error signal which is supplied to the device 32. On the basis of the device 32, the weighting control in block 34 is activated in order to determine new, better weighting factors. For this purpose, the masking threshold determined by the masking model is available, which indicates how much interference in the signal is "allowed" at a certain point in the signal spectrum. If the weight control block 34 has determined optimal weighting factors with regard to the desired audio signal interference and the desired watermark detectability, ie watermark energy, the method terminates. The quantized spectral values of the combination signal last determined by block 28a are then passed on to the bitstream multiplexer as a result, in order to be formed there together with the side information into an audio bitstream. 3 is discussed below in order to illustrate a device for embedding a watermark in an audio signal according to a second exemplary embodiment of the present invention. In contrast to the first exemplary embodiment shown in FIG. 2, in which an unquantized audio signal is combined with an unquantized watermark signal, this combination 18 in FIG. 3 takes place in the "quantization range", ie it becomes a quantized audio signal with a combined quantized watermark. This can be achieved either by using a quantizer 42 to calculate the quantizer stages by quantizing the original audio signal, or by extracting the quantizer stages from a coded audio signal. In response to the quantization levels provided by means 42, means 40a for calculating the quantized audio signal minus a predetermined number of n quantization levels and means 40b for calculating the quantized audio signal plus a predetermined number of n quantization levels are operated.
Im Gegensatz zu dem in Fig. 2 gezeigten Ausführungsbeispiel, bei dem für jedes kombinierte Audiosignal eine Quan- tisierungsberechnung und eine inverse Quantisierungsberechnung durch die Einrichtung 28a durchzuführen war, und zwar innerhalb der Iterationsschleife, findet dies bei dem in Fig. 3 gezeigten zweiten Ausführungsbeispiel a-priori statt, d. h. durch eine Vorberechnung außerhalb einer Ite- rationsschleife. Hierzu wird zunächst als vorbestimmter Wasserzeichen-Startwert mittels einer Einrichtung 36 ein sogenanntes "maximales" Wasserzeichen berechnet. Zur Berechnung des vorbestimmten maximalen Wasserzeichens werden zunächst nur die Vorzeichen des Wasserzeichen-Spektrums verwendet. Hat das Wasserzeichen-Spektrum ein positives Vorzeichen, so wird der entsprechende Spektralwert des ursprünglichen quantisierten Audiosignals um n Quantisierungsstufen vergrößert, wobei n eine Ganzzahl größer oder gleich 1 ist. Ist das Vorzeichen eines Wasserzeichen- Spektralwerts dagegen negativ, so wird der entsprechende quantisierte Spektralwert, d. h. der Spektralwert des Audiosignals bei derselben Frequenz wie der Spektralwert des Wasserzeichensignals, dessen Vorzeichen gerade betrachtet wird, um n Quantisierungsstufen verkleinert. Hieraus ergibt sich ein maximales Wasserzeichen, wobei der Ausdruck "maximal" dahingehend zu verstehen ist, daß das maximale Wasserzeichensignal auf jede Spektrallinie des ursprünglichen Au- diosignals nach der Quantisierung eine Auswirkung hat. Dieser Fall ist zwar hinsichtlich einer sehr guten Wasserzei- chendetektierbarkeit wünschenswert, dürfte jedoch erfahrungsgemäß zu viel Störung in das Audiosignal einführen. Um die Störung auf ein vertretbares Maß zurückzunehmen, wobei ein vertretbares Maß beispielsweise die psychoakustische Maskierungsschwelle sein kann, wird eine Einrichtung 38, die einen Linienselektionsalgorithmus implementiert, vorgesehen. Die Einrichtung 38 ermittelt die durch das von der Einrichtung 36 zur Verfügung gestellte maximale Wasserzei- chen eingeführte Störung in das Audiosignal. Falls die Störung größer als die vorbestimmte Storungsschwelle ist, wird durch die Einrichtung 38 das "maximale" Wasserzeichen durch Selektion von einzelnen Linien so lange verändert, bis die durch das Wasserzeichen eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Ist diese Bedingung erfüllt, wird das - bereits in quantisierter Form - vorliegende Wasserzeichen ebenso wie das quantisierte ursprüngliche Audiosignal dem Addierer 18 zugeführt, um aus- gangsseitig das quantisierte Wasserzeichen-behaftete Audio- signal zu erhalten.In contrast to the exemplary embodiment shown in FIG. 2, in which a quantization calculation and an inverse quantization calculation had to be carried out by the device 28a for each combined audio signal, specifically within the iteration loop, this occurs in the second exemplary embodiment a shown in FIG. 3 -priori instead, ie by precalculation outside an iteration loop. For this purpose, a so-called “maximum” watermark is first calculated as a predetermined watermark starting value by means of a device 36. To calculate the predetermined maximum watermark, only the signs of the watermark spectrum are used. If the watermark spectrum has a positive sign, the corresponding spectral value of the original quantized audio signal is increased by n quantization levels, n being an integer greater than or is 1. If, on the other hand, the sign of a watermark spectral value is negative, the corresponding quantized spectral value, ie the spectral value of the audio signal at the same frequency as the spectral value of the watermark signal whose sign is currently being viewed, is reduced by n quantization levels. This results in a maximum watermark, the expression "maximum" being understood to mean that the maximum watermark signal has an effect on each spectral line of the original audio signal after quantization. Although this case is desirable in terms of very good watermark detectability, experience has shown that it may introduce too much interference into the audio signal. In order to reduce the disturbance to an acceptable level, an acceptable level being, for example, the psychoacoustic masking threshold, a device 38 that implements a line selection algorithm is provided. The device 38 determines the interference introduced into the audio signal by the maximum watermark provided by the device 36. If the disturbance is greater than the predetermined disturbance threshold, the device 38 changes the "maximum" watermark by selecting individual lines until the disturbance introduced by the watermark is less than or equal to the predetermined disturbance threshold. If this condition is fulfilled, the watermark, which is already in quantized form, and the quantized original audio signal are fed to the adder 18 in order to obtain the quantized watermarked audio signal on the output side.
Im nachfolgenden wird anhand der Fig. 4a bis 4d auf die Funktion und Arbeitsweise der Einrichtung 36 und 38 eingegangen. Fig. 4a zeigt beispielshalber ein quantisiertes Au- diosignal, das aufgrund der Übersichtlichkeit der Darstellung lediglich drei Spektralwerte 50a-50c darstellt. Typischerweise hat ein Audiospektrum je nach gewählter Fensterlänge und Transformation z. B. 1024 Spektralwerte. Die An- zahl der von Null verschiedenen quantisierten Spektralwerte ist abhängig davon, wie viele Audiospektralwerte auf 0 quantisiert worden sind. Selbstverständlich haben die quantisierten Audiospektralwerte im realen Fall unterschiedli- ehe Höhen. Fig. 4b zeigt nun ein mit plus bzw. minus n Quantisierungsstufen (abhängig vom Vorzeichen der Wasserzeichen-Spektralwerte) beaufschlagtes Audiospektrum. Die dem Audiospektralwert 50a von Fig. 4a entsprechende Spektralkomponente des Wasserzeichens hat für das in Fig. 4b ge- zeigte Beispiel ein negatives Vorzeichen. Die Spektralkomponente des Wasserzeichens, die dem Audiospektralwert 50b von Fig. 4a entspricht, hat bei dem in Fig. 4b gezeigten Beispiel ein positives Vorzeichen, während die dritte Spektralkomponente des Wasserzeichens wiederum ein negati- ves Vorzeichen hatte. Der Betrag der Wasserzeichen- Spektralkomponenten spielt zunächst keine Rolle, da davon ausgegangen wird, daß eine Wasserzeichendetektion bereits dann möglich ist, wenn die quantisierten Audiospektralwerte 50a-50c durch das Wasserzeichen verändert werden. Das maxi- male Wasserzeichen, das durch die Einrichtung 36 von Fig. 3 bestimmt wird, ist für den in Fig. 4b gezeigten Fall in Fig. 4c dargestellt. Es hat ein Spektrum, das sich dadurch auszeichnet, daß jeder quantisierte ursprüngliche Audiospektralwert um eine Quantisierungsstufe verändert wird, und zwar entweder vergrößert, wenn das Wasserzeichen ein positives Vorzeichen hat, oder verkleinert, wenn das Wasserzeichen ein negatives Vorzeichen hatte.The function and mode of operation of the devices 36 and 38 will be discussed below with reference to FIGS. 4a to 4d. 4a shows, by way of example, a quantized audio signal which, because of the clarity of the illustration, only shows three spectral values 50a-50c. Typically, depending on the selected window length and transformation, an audio spectrum has e.g. B. 1024 spectral values. The The number of non-zero quantized spectral values depends on how many audio spectral values have been quantized to zero. Of course, the quantized audio spectral values have different heights in the real case. 4b shows an audio spectrum with plus or minus n quantization levels (depending on the sign of the watermark spectral values). The spectral component of the watermark corresponding to the audio spectral value 50a of FIG. 4a has a negative sign for the example shown in FIG. 4b. The spectral component of the watermark, which corresponds to the audio spectral value 50b of FIG. 4a, has a positive sign in the example shown in FIG. 4b, while the third spectral component of the watermark again had a negative sign. The amount of the watermark spectral components is initially irrelevant, since it is assumed that watermark detection is already possible if the quantized audio spectral values 50a-50c are changed by the watermark. The maximum watermark, which is determined by the device 36 from FIG. 3, is shown in FIG. 4c for the case shown in FIG. 4b. It has a spectrum that is characterized in that each quantized original audio spectral value is changed by a quantization level, either enlarged if the watermark has a positive sign, or decreased if the watermark had a negative sign.
Bei dem in Fig. 4b gezeigten Beispiel könnte der Betrag ei- ner Wasserzeichen-Spektrallinie dahingehend berücksichtigt werden, daß nicht nur um eine Quantisierungsstufe inkremen- tiert bzw. dekrementiert wird, sondern daß um mehrere Quantisierungsstufen inkrementiert bzw. dekrementiert wird, wenn der Betrag der Wasserzeichen-Spektrallinie entspre- chend groß ist.In the example shown in FIG. 4b, the amount of a watermark spectral line could be taken into account in such a way that not only is incremented or decremented by one quantization level, but that is incremented or decremented by several quantization levels if the amount of Watermark spectral line is correspondingly large.
Anhand von Fig. 4d wird nunmehr die Funktion der Einrichtung 38 von Fig. 3 beschrieben. Stellt die Einrichtung 38 fest, daß für die linke quantisierte Audiospektralkomponente die Situation so ist, daß die durch das Wasserzeichen eingeführte Störung zu groß ist, wenn die linke quantisierte Audiospektralkomponente 50a um eine Quantisierungsstufe verringert wird, wie es durch die Spektralkomponente 50a' dargestellt ist, so wird diese Spektralkomponente von der Einrichtung 38 nicht selektiert, was sich in den veränderten Wasserzeichen-Spektralwerten nach der Linienselektion so bemerkbar macht, daß das veränderte Wasserzeichen an dieser Stelle eine Spektrallinie von 0 hat. Bei der mittleren und der rechten Spektralkomponente des quantisierten Audiosignals wurde dagegen festgestellt, daß die durch die Spektrallinien 50b' und 50c' eingeführten Störungen in Ordnung waren, so daß an diesen Stellen so viel Wasserzeichen- energie zu den quantisierten Audiospektralwerten hinzugefügt werden kann, daß diese um eine Quantisierungsstufe erhöht (50b') bzw. um eine Quantisierungsstufe verringert (50c') werden können.The function of the device 38 from FIG. 3 will now be described with reference to FIG. 4d. Provides the facility 38 If the left quantized audio spectral component 50a is reduced by a quantization level, as is represented by the spectral component 50a ', the situation is such that the situation is such that the interference introduced by the watermark is too large, as is represented by the spectral component 50a', this becomes the spectral component not selected by the device 38, which is so noticeable in the changed watermark spectral values after the line selection that the changed watermark has a spectral line of 0 at this point. In the middle and right spectral components of the quantized audio signal, on the other hand, it was found that the interference introduced by spectral lines 50b 'and 50c' was in order, so that so much watermark energy can be added to the quantized audio spectral values at these points that these can be increased by a quantization level (50b ') or decreased by a quantization level (50c').
Aus dieser Betrachtung wird deutlich, daß durch Vorberechnung der Quantisierungsstufen durch die Einrichtungen 40a und 40b der Schritt der Quantisierung und inversen Quantisierung, d. h. die Einrichtung 28a von Fig. 2, entfallen kann, da die Größe der Störung durch Veränderung des Quan- tisierungs-Index a-priori vorberechnet werden kann. Ferner ist aus Fig. 3 zu sehen, daß auch die Einrichtung 26, d. h. die Gewichtung der Wasserzeichen-Spektrallinien, entfallen ist .From this consideration it becomes clear that by precalculating the quantization levels by means 40a and 40b, the step of quantization and inverse quantization, i. H. the device 28a of FIG. 2 can be omitted, since the size of the disturbance can be pre-calculated a priori by changing the quantization index. It can also be seen from Fig. 3 that the device 26, d. H. the weighting of the watermark spectral lines has been eliminated.
Die quantisierten Audio-Spektralwerte werden nunmehr anhand des Wasserzeichensignals, d. h. anhand des Vorzeichens des Wasserzeichensignals um z. B. plus oder minus eine Quantisierungsstufe verändert. Dieses Prozedere bringt Vorteile dahingehend, daß Rechenzeit eingespart werden kann, da die Quantisierung und inverse Quantisierung (Einrichtung 28a von Fig. 2) und die Gewichtung des Wasserzeichens (Einrichtung 26 von Fig. 2) ersatzlos entfallen können. Anhand der bereits vorberechneten Audiospektren, d. h. des Originalspektrums und des Originalspektrums minus n Quantisierungsstufen oder des Originalspektrums plus n Quantisierungsstufen wird linienweise das maximale Wasserzeichen (Fig. 4c) bestimmt. Dies ergibt sich als Differenz zwischen dem Originalspektrum (Fig. 4a) und dem um eine Anzahl von n Quantisierungsstufen veränderten Audiospektrum (Fig. 4b), wobei die Differenz das gleiche Vorzeichen wie das unge- wichtete Wasserzeichen hat.The quantized audio spectral values are now based on the watermark signal, ie using the sign of the watermark signal by z. B. plus or minus changed a quantization level. This procedure has advantages in that computing time can be saved since the quantization and inverse quantization (device 28a of FIG. 2) and the weighting of the watermark (device 26 of FIG. 2) can be omitted without replacement. The maximum watermark (FIG. 4c) is determined line by line on the basis of the audio spectra already precalculated, ie the original spectrum and the original spectrum minus n quantization levels or the original spectrum plus n quantization levels. This results as the difference between the original spectrum (FIG. 4a) and the audio spectrum changed by a number of n quantization levels (FIG. 4b), the difference having the same sign as the unweighted watermark.
Der Linienselektions-Algorithmus, der in der Einrichtung 38 ausgeführt wird, berücksichtigt den Betrag der ungewichte- ten Wasserzeichenspektrallinien, die Maskierungsschwelle 24 und gegebenenfalls eine Bitsparkassenfunktion 44 des Audio- codierers.The line selection algorithm, which is executed in the device 38, takes into account the amount of the unweighted watermark spectral lines, the masking threshold 24 and possibly a bit savings bank function 44 of the audio encoder.
Um sowohl eine gute Audioqualität als auch eine gute Was- serzeichendetektierbarkeit sicherzustellen, wird es bevorzugt, die Linien des maximalen Wasserzeichens so zu selek- tieren, daß das Wasserzeichen-Spreizbandsignal breitbandig eingebettet wird, d. h. daß möglichst viele Linien des quantisierten Audiosignals verändert werden. Weiterhin soll die Maskierungsschwelle oder, falls eine von der Maskierungsschwelle abweichende Schwelle verwendet wird, diese vorbestimmte Storungsschwelle nicht verletzt werden. Schließlich soll die Struktur des Wasserzeichens innerhalb eines Frequenzbandes möglichst wenig verändert werden.In order to ensure both good audio quality and good watermark detectability, it is preferred to select the lines of the maximum watermark in such a way that the watermark spreading band signal is embedded in a broadband manner, i. H. that as many lines of the quantized audio signal as possible are changed. Furthermore, the masking threshold or, if a threshold deviating from the masking threshold is used, this predetermined disturbance threshold should not be violated. Finally, the structure of the watermark should be changed as little as possible within a frequency band.
Alle anderen Linien des maximalen Wasserzeichens werden nicht berücksichtigt. Dies bedeutet, daß nach der Addition des Wasserzeichens die quantisierten Audiospektralwerte der selektierten Linien um plus bzw. minus n Quantisierungsstufen verändert werden, während die quantisierten Audiospektralwerte der nicht selektierten Wasserzeichen-Linien unver- ändert übernommen werden. Das quantisierte Wasserzeichen-behaftete Audiosignal am Ausgang 20 der in Fig. 3 gezeigten Vorrichtung muß nunmehr noch Entropie-codiert werden.All other lines of the maximum watermark are not taken into account. This means that after the addition of the watermark, the quantized audio spectral values of the selected lines are changed by plus or minus n quantization levels, while the quantized audio spectral values of the non-selected watermark lines are adopted unchanged. The quantized watermarked audio signal at the output 20 of the device shown in FIG. 3 now has to be entropy-coded.
Abhängig von dem verwendeten Audiocodierverfahren, in das das erfindungsgemäße Konzept integriert ist, existiert eine Bitsparkassenfunktion, die späteren Signalblöcken zusätzliche Bits zur Verfügung stellen kann, wie es ausgeführt worden ist. Die Linienselektionsstrategie ist vorzugsweise an den Füllstand der Bitsparkasse angepaßt, um so beispielsweise bei gefüllter Bitsparkasse zu erlauben, daß auch quantisierte Audiospektralwerte des ursprünglichen Audiosignals, die den Wert 0 haben, mit einem Wasserzeichen beaufschlagt werden, was normalerweise aufgrund des Bitbe- darfs nicht zulässig wäre. Damit kann die Wasserzeichende- tektion spürbar verbessert werden.Depending on the audio coding method used, in which the concept according to the invention is integrated, there is a bit savings bank function which can provide additional bits to later signal blocks, as has been carried out. The line selection strategy is preferably adapted to the fill level of the bit savings bank, so as to allow, for example, when the bit savings bank is filled, that even quantized audio spectral values of the original audio signal that have the value 0 are watermarked, which would normally not be permitted due to the bit requirement , This can noticeably improve watermark detection.
Bei der Anwendung der kombinierten Einbettung/Codierung stehen neben den bereits quantisierten Audiospektralwerten zusätzlich die Originalwerte nach der Transformation in den Frequenzbereich zur Verfügung. Die Quantisierung der originalen Audiospektralwerte kann ebenfalls als eine Art Wasserzeicheneinbettung angesehen werden, da sowohl bei der Quantisierung als auch bei der Addition eines Wasserzei- chensignals eine gewisse Störung des Audiospektrums resultiert. Die durch die Quantisierung eingebrachte Störung ist dabei aufgrund ihrer zufälligen Natur nicht als Wasserzeichen anzusehen. Wenn jedoch die eingebrachte Störung aufgrund der Quantisierung vorzeichenrichtig mit dem Wasser- zeichen ist, unterstützt das Quantisierungsrauschen die De- tektierbarkeit des Wasserzeichens. Hieraus ergeben sich folgende Fälle.When using the combined embedding / coding, in addition to the already quantized audio spectral values, the original values are also available after the transformation into the frequency range. The quantization of the original audio spectral values can also be seen as a kind of watermark embedding, since a certain disturbance of the audio spectrum results in both the quantization and the addition of a watermark signal. Due to its random nature, the disturbance introduced by the quantization should not be regarded as a watermark. However, if the introduced disturbance is correct with the watermark due to the quantization, the quantization noise supports the detectability of the watermark. The following cases result from this.
Durch die Quantisierung einer Audiospektrallinie wird das Wasserzeichen vorzeichenrichtig eingebracht. Hier ist die Einrichtung 38 von Fig. 3 vorzugsweise so angeordnet, daß sie aufgrund der Tatsache, daß bereits durch die Quantisierung phasenrichtig zum Wasserzeichen-Spektralwert für eine bestimmte Frequenz eine Störung eingebracht worden ist, angeordnet, um auf das Einbringen einer weiteren Wasserzeichen-Störung zu verzichten. Alternativ könnte noch eine Quantisierungsstufe hinzugefügt werden, um die Detektier- barkeit noch weiter zu verbessern.By quantizing an audio spectral line, the watermark is introduced with the correct sign. Here, the device 38 of FIG. 3 is preferably arranged such that, due to the fact that the quantization is already in phase with the watermark spectral value for one certain frequency a disturbance has been introduced, arranged to dispense with the introduction of another watermark disturbance. Alternatively, a quantization level could be added to further improve the detectability.
Wenn dagegen durch die Quantisierung einer Audiospektrallinie eine Störung eingebracht wird, die das entgegengesetzte Vorzeichen hat wie das Wasserzeichensignal, was dazu führt, daß das Wasserzeichen durch die gegenläufige Quantisierung gewissermaßen verschlechtert wird, ist aufgrund der Linienselektionsstrategien, die weiter oben ausgeführt worden sind, abzuwägen, ob für diese Linie die Robustheit des Wasserzeichens gewährleistet werden muß und somit der quanti- sierte Audiospektralwert verändert werden muß, um das Quantisierungsrauschen gewissermaßen wieder "rückgängig" zu machen, oder ob in Hinblick auf eine bessere Audioqualität das eingebettete Wasserzeichen an dieser Stelle, d. h. das Quantisierungsrauschen an dieser Stelle, ein "falsches" Vorzeichen besitzen soll.On the other hand, if an interference is introduced by the quantization of an audio spectral line, which has the opposite sign as the watermark signal, which leads to the watermark being worsened to a certain extent by the opposite quantization, the line selection strategies which have been explained above must be considered. whether the robustness of the watermark must be guaranteed for this line and thus the quantized audio spectral value must be changed in order to "reverse" the quantization noise to a certain extent, or whether the embedded watermark at this point, in view of a better audio quality. H. the quantization noise at this point is said to have a "wrong" sign.
Wie es bereits ausgeführt worden ist, findet bei modernen Codierverfahren die Berechnung der psychoakustischen Maskierungsschwelle nicht linienweise statt, sondern skalen- faktorbandweise. Dies bedeutet, daß nicht Energien einzelner Spektrallinien betrachtet werden, sondern die Gesamtenergien z. B. 20 Spektrallinien in einem Skalenfaktorband. Es kann jedoch in einem Skalenfaktorband, in dem viele Wasserzeichen-Spektrallinien tolerierbar sind, ohne weiteres auf ein paar Linien im Sinne einer guten Audioqualität verzichtet werden, ohne daß die Wasserzeichen-Detektierbarkeit signifikant leidet. Diese Funktionalität kann auch bei dem in Fig. 2 gezeigten Ausführungsbeispiel dadurch erreicht werden, daß die Gewichtungskontrolle 34 von Fig. 2 derart ausgestaltet ist, daß nicht über der Frequenz gleiche Gewichtungsfaktoren eingesetzt werden, sondern daß unterschiedliche Gewichtungsfaktoren für verschiedene Spektralwerte eingesetzt werden, und daß insbesondere auf Gewich- tungsfaktoren von 0 für einzelne Spektrallinien vorkommen. Als vorbestimmter Wasserzeichen-Startwert kann es bei dem in Fig. 2 gezeigten Ausführungsbeispiel auch von Vorteil sein, vor dem Beginn der Iteration die Wasserzeichen- Gewichtung so zu gestalten, daß sie von der psychoakustischen Maskierungsschwelle abgeleitet ist.As has already been explained, in modern coding methods the psychoacoustic masking threshold is not calculated line by line, but by scale factor band. This means that energies of individual spectral lines are not considered, but the total energies z. B. 20 spectral lines in a scale factor band. However, in a scale factor band in which many watermark spectral lines are tolerable, a few lines in the sense of good audio quality can be dispensed with without the watermark detectability suffering significantly. This functionality can also be achieved in the exemplary embodiment shown in FIG. 2 in that the weighting control 34 of FIG. 2 is designed such that the same weighting factors are not used over the frequency, but rather that different weighting factors are used for different spectral values, and that especially on weight factors of 0 occur for individual spectral lines. As a predetermined watermark starting value, it can also be advantageous in the exemplary embodiment shown in FIG. 2 to design the watermark weighting before the iteration begins so that it is derived from the psychoacoustic masking threshold.
Zusammenfassend stellt sich das erfindungsgemäße Konzept derart dar, daß zunächst ein spektral dargestelltes Wasser- zeichensignal erzeugt wird. Dies wird mittels Gewichtungsfaktoren gewichtet. Das gewichtete Signal wird zum Original-Audiosignal, das in spektraler Darstellung vorliegt, hinzuaddiert. Alternativ wird auf der Basis des Wasserzeichen-Signals eine Veränderung der Linien des Original- Audiosignals, das in spektraler Darstellung vorliegt, durchgeführt. Hierauf wird die nach der Quantisierung eingebrachte Störung bestimmt, wobei die Störung durch Quanti- sieren, invers Quantisieren und Differenzbildung zum Original ermittelt wird, oder wobei die Störung vorberechnet ist.In summary, the concept according to the invention is such that a spectrally represented watermark signal is first generated. This is weighted using weighting factors. The weighted signal is added to the original audio signal, which is available in a spectral representation. Alternatively, a change in the lines of the original audio signal, which is available in a spectral representation, is carried out on the basis of the watermark signal. The disturbance introduced after the quantization is then determined, the disturbance being determined by quantizing, inverse quantizing and forming the difference from the original, or the disturbance being pre-calculated.
Anschließend werden neue Gewichtungsfaktoren bestimmt, wobei die Maskierungsschwelle verwendet wird, wobei eine Linienselektionsstrategie angewendet wird, oder wobei eine Linienselektionsstrategie insbesondere derart angewendet wird, daß Vorzeichen und Betrag der Spektrallinien des un- gewichteten Wasserzeichens verwendet werden, und daß die Summe von Wasserzeichenlinie und Originalspektrallinie so bestimmt wird, daß diese neue Spektrallinie in ein anderes Quantisierungsintervall fällt als die ursprüngliche Spektrallinie.Then new weighting factors are determined, using the masking threshold, using a line selection strategy, or using a line selection strategy in particular in such a way that the sign and amount of the spectral lines of the unweighted watermark are used, and that the sum of the watermark line and the original spectral line is such it is determined that this new spectral line falls within a different quantization interval than the original spectral line.
Das erfindungsgemäße Konzept ist dahingehend vorteilhaft, daß es sowohl für Bitstrom-Wasserzeichen-Verfahren als auch Verfahren einsetzbar ist, die Audiocodierung und Wasserzeicheneinbettung in einem Schritt vornehmen. Ein weiterer Vorteil des erfindungsgemäßen Konzepts besteht darin, daß eine volle Kontrolle über die eingebrachte Störung erzielbar ist. Dadurch ist es möglich, das Verfahren gezielt zugunsten optimaler Wasserzeichendetektion oder op- timaler Audioqualität einzustellen.The concept according to the invention is advantageous in that it can be used both for bitstream watermarking methods and for methods which carry out audio coding and watermark embedding in one step. Another advantage of the concept according to the invention is that full control over the introduced disturbance can be achieved. This makes it possible to specifically set the method in favor of optimal watermark detection or optimal audio quality.
Ein weiterer Vorteil des erfindungsgemäßen Konzepts ist eine volle Kontrolle über die frequenzmäßige Verteilung des Wasserzeichen-Spreizbandsignals in das Audiosignal. Another advantage of the concept according to the invention is full control over the frequency distribution of the watermark spreading band signal into the audio signal.
Claims
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP02740586A EP1382038B1 (en) | 2001-06-18 | 2002-05-10 | Device and method for embedding a watermark in an audio signal |
| US10/481,860 US7346514B2 (en) | 2001-06-18 | 2002-05-10 | Device and method for embedding a watermark in an audio signal |
| DE50203511T DE50203511D1 (en) | 2001-06-18 | 2002-05-10 | DEVICE AND METHOD FOR EMBEDDING A WATERMARK INTO A AUDIO SIGNAL |
| AT02740586T ATE298921T1 (en) | 2001-06-18 | 2002-05-10 | APPARATUS AND METHOD FOR EMBEDING A WATERMARK IN AN AUDIO SIGNAL |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10129239A DE10129239C1 (en) | 2001-06-18 | 2001-06-18 | Audio signal water-marking method processes water-mark signal before embedding in audio signal so that it is not audibly perceived |
| DE10129239.2 | 2001-06-18 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| WO2002103695A2 true WO2002103695A2 (en) | 2002-12-27 |
| WO2002103695A3 WO2002103695A3 (en) | 2003-05-22 |
Family
ID=7688519
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/EP2002/005173 Ceased WO2002103695A2 (en) | 2001-06-18 | 2002-05-10 | Device and method for embedding a watermark in an audio signal |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US7346514B2 (en) |
| EP (1) | EP1382038B1 (en) |
| AT (1) | ATE298921T1 (en) |
| DE (2) | DE10129239C1 (en) |
| WO (1) | WO2002103695A2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160012826A1 (en) * | 2014-07-09 | 2016-01-14 | Stmicroelectronics Asia Pacific Pte Ltd | Method and system for digital watermarking |
Families Citing this family (62)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6738495B2 (en) * | 1995-05-08 | 2004-05-18 | Digimarc Corporation | Watermarking enhanced to withstand anticipated corruptions |
| US20030133592A1 (en) | 1996-05-07 | 2003-07-17 | Rhoads Geoffrey B. | Content objects with computer instructions steganographically encoded therein, and associated methods |
| US8306811B2 (en) * | 1996-08-30 | 2012-11-06 | Digimarc Corporation | Embedding data in audio and detecting embedded data in audio |
| US7602940B2 (en) | 1998-04-16 | 2009-10-13 | Digimarc Corporation | Steganographic data hiding using a device clock |
| US7644282B2 (en) | 1998-05-28 | 2010-01-05 | Verance Corporation | Pre-processed information embedding system |
| DE19947877C2 (en) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Method and device for introducing information into a data stream and method and device for encoding an audio signal |
| US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
| US7239981B2 (en) | 2002-07-26 | 2007-07-03 | Arbitron Inc. | Systems and methods for gathering audience measurement data |
| US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
| US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
| JP2006504986A (en) | 2002-10-15 | 2006-02-09 | ベランス・コーポレイション | Media monitoring, management and information system |
| US7352878B2 (en) * | 2003-04-15 | 2008-04-01 | Digimarc Corporation | Human perceptual model applied to rendering of watermarked signals |
| DE10321983A1 (en) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for embedding binary useful information in a carrier signal |
| JP2005084625A (en) * | 2003-09-11 | 2005-03-31 | Music Gate Inc | Electronic watermark composing method and program |
| US7616776B2 (en) * | 2005-04-26 | 2009-11-10 | Verance Corproation | Methods and apparatus for enhancing the robustness of watermark extraction from digital host content |
| US20060239501A1 (en) | 2005-04-26 | 2006-10-26 | Verance Corporation | Security enhancements of digital watermarks for multi-media content |
| US7369677B2 (en) | 2005-04-26 | 2008-05-06 | Verance Corporation | System reactions to the detection of embedded watermarks in a digital host content |
| US9055239B2 (en) * | 2003-10-08 | 2015-06-09 | Verance Corporation | Signal continuity assessment using embedded watermarks |
| DE102004009955B3 (en) * | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device for determining quantizer step length for quantizing signal with audio or video information uses longer second step length if second disturbance is smaller than first disturbance or noise threshold hold |
| DE102004021404B4 (en) | 2004-04-30 | 2007-05-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Watermark embedding |
| DE102004021403A1 (en) | 2004-04-30 | 2005-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Information signal processing by modification in the spectral / modulation spectral range representation |
| US8020004B2 (en) | 2005-07-01 | 2011-09-13 | Verance Corporation | Forensic marking using a common customization function |
| US8781967B2 (en) | 2005-07-07 | 2014-07-15 | Verance Corporation | Watermarking in an encrypted domain |
| US7809018B2 (en) * | 2005-12-16 | 2010-10-05 | Coding Technologies Ab | Apparatus for generating and interpreting a data stream with segments having specified entry points |
| EP1964352B1 (en) * | 2005-12-16 | 2017-05-03 | Dolby International AB | Apparatuses, methods and computer program for generating and interpreting a data stream with a series of segments having specified entry points |
| BRPI0621485B1 (en) | 2006-03-24 | 2020-01-14 | Dolby Int Ab | decoder and method to derive headphone down mix signal, decoder to derive space stereo down mix signal, receiver, reception method, audio player and audio reproduction method |
| US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
| US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
| DK2082527T3 (en) * | 2006-10-18 | 2015-07-20 | Destiny Software Productions Inc | Methods for watermarking media data |
| EP2210252B1 (en) | 2007-11-12 | 2017-05-24 | The Nielsen Company (US), LLC | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
| US8457951B2 (en) * | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
| US8259938B2 (en) | 2008-06-24 | 2012-09-04 | Verance Corporation | Efficient and secure forensic marking in compressed |
| US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
| US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
| EP2425563A1 (en) | 2009-05-01 | 2012-03-07 | The Nielsen Company (US), LLC | Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content |
| US9607131B2 (en) | 2010-09-16 | 2017-03-28 | Verance Corporation | Secure and efficient content screening in a networked environment |
| EP2544179A1 (en) * | 2011-07-08 | 2013-01-09 | Thomson Licensing | Method and apparatus for quantisation index modulation for watermarking an input signal |
| US8923548B2 (en) | 2011-11-03 | 2014-12-30 | Verance Corporation | Extraction of embedded watermarks from a host content using a plurality of tentative watermarks |
| US8615104B2 (en) | 2011-11-03 | 2013-12-24 | Verance Corporation | Watermark extraction based on tentative watermarks |
| US8533481B2 (en) | 2011-11-03 | 2013-09-10 | Verance Corporation | Extraction of embedded watermarks from a host content based on extrapolation techniques |
| US8682026B2 (en) | 2011-11-03 | 2014-03-25 | Verance Corporation | Efficient extraction of embedded watermarks in the presence of host content distortions |
| US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
| US9547753B2 (en) | 2011-12-13 | 2017-01-17 | Verance Corporation | Coordinated watermarking |
| US9323902B2 (en) | 2011-12-13 | 2016-04-26 | Verance Corporation | Conditional access using embedded watermarks |
| US9571606B2 (en) | 2012-08-31 | 2017-02-14 | Verance Corporation | Social media viewing system |
| US20140075469A1 (en) | 2012-09-13 | 2014-03-13 | Verance Corporation | Content distribution including advertisements |
| US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
| US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
| US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
| US9305559B2 (en) | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
| US9225310B1 (en) * | 2012-11-08 | 2015-12-29 | iZotope, Inc. | Audio limiter system and method |
| US9262794B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
| US9251549B2 (en) | 2013-07-23 | 2016-02-02 | Verance Corporation | Watermark extractor enhancements based on payload ranking |
| US20150039321A1 (en) | 2013-07-31 | 2015-02-05 | Arbitron Inc. | Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device |
| US9711152B2 (en) | 2013-07-31 | 2017-07-18 | The Nielsen Company (Us), Llc | Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio |
| US9208334B2 (en) | 2013-10-25 | 2015-12-08 | Verance Corporation | Content management using multiple abstraction layers |
| EP2881941A1 (en) * | 2013-12-09 | 2015-06-10 | Thomson Licensing | Method and apparatus for watermarking an audio signal |
| CN106170988A (en) | 2014-03-13 | 2016-11-30 | 凡瑞斯公司 | The interactive content using embedded code obtains |
| US10043527B1 (en) | 2015-07-17 | 2018-08-07 | Digimarc Corporation | Human auditory system modeling with masking energy adaptation |
| KR102021739B1 (en) * | 2018-06-04 | 2019-11-05 | 채령 | The product information data by quantum code and the quantum marking apparatus for prevention of forgery by x-y coordinate of hash function matrix and the product management system marked by quantum |
| CN113035213B (en) * | 2020-12-24 | 2022-07-22 | 中国电影科学技术研究所 | Digital audio watermark detection method and device |
| CN119207487B (en) * | 2024-09-12 | 2025-07-04 | 安徽艾德未来智能科技有限公司 | Audio recording and conversion method for Bluetooth headset |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5319735A (en) * | 1991-12-17 | 1994-06-07 | Bolt Beranek And Newman Inc. | Embedded signalling |
| PL183307B1 (en) * | 1994-03-31 | 2002-06-28 | Arbitron Co | Audio signal encoding system |
| US5822360A (en) * | 1995-09-06 | 1998-10-13 | Solana Technology Development Corporation | Method and apparatus for transporting auxiliary data in audio signals |
| EP0875107B1 (en) * | 1996-03-07 | 1999-09-01 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Coding process for inserting an inaudible data signal into an audio signal, decoding process, coder and decoder |
| US6061793A (en) * | 1996-08-30 | 2000-05-09 | Regents Of The University Of Minnesota | Method and apparatus for embedding data, including watermarks, in human perceptible sounds |
| JP4226687B2 (en) | 1998-05-01 | 2009-02-18 | ユナイテッド・モジュール・コーポレーション | Digital watermark embedding apparatus and audio encoding apparatus |
| JP2000209097A (en) | 1999-01-14 | 2000-07-28 | Sony Corp | Signal processing device and method, signal recording device, signal reproducing device, and recording medium |
| DE19906512C2 (en) * | 1999-02-17 | 2001-01-25 | Frank Kurth | Method for unnoticed transmission and / or storage of additional information within a signal, in particular an audio signal |
| DE19938095A1 (en) | 1999-08-12 | 2001-03-01 | Fraunhofer Ges Forschung | Method and device for introducing information into an audio signal and method and device for determining information introduced into an audio signal |
| DE19947877C2 (en) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Method and device for introducing information into a data stream and method and device for encoding an audio signal |
| JP3905473B2 (en) | 2000-06-08 | 2007-04-18 | マークエニー・インコーポレイテッド | Digital watermark embedding / extraction method for copyright protection and copy protection of digital audio content, and apparatus using the same |
| BRPI0113271B1 (en) * | 2000-08-16 | 2016-01-26 | Dolby Lab Licensing Corp | method for modifying the operation of the coding function and / or decoding function of a perceptual coding system according to supplementary information |
-
2001
- 2001-06-18 DE DE10129239A patent/DE10129239C1/en not_active Expired - Lifetime
-
2002
- 2002-05-10 US US10/481,860 patent/US7346514B2/en not_active Expired - Lifetime
- 2002-05-10 WO PCT/EP2002/005173 patent/WO2002103695A2/en not_active Ceased
- 2002-05-10 DE DE50203511T patent/DE50203511D1/en not_active Expired - Lifetime
- 2002-05-10 AT AT02740586T patent/ATE298921T1/en active
- 2002-05-10 EP EP02740586A patent/EP1382038B1/en not_active Expired - Lifetime
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160012826A1 (en) * | 2014-07-09 | 2016-01-14 | Stmicroelectronics Asia Pacific Pte Ltd | Method and system for digital watermarking |
| US9466304B2 (en) * | 2014-07-09 | 2016-10-11 | Stmicroelectronics International N.V. | Method and system for digital watermarking |
Also Published As
| Publication number | Publication date |
|---|---|
| DE10129239C1 (en) | 2002-10-31 |
| US20040184369A1 (en) | 2004-09-23 |
| ATE298921T1 (en) | 2005-07-15 |
| EP1382038B1 (en) | 2005-06-29 |
| EP1382038A2 (en) | 2004-01-21 |
| US7346514B2 (en) | 2008-03-18 |
| WO2002103695A3 (en) | 2003-05-22 |
| DE50203511D1 (en) | 2005-08-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1382038B1 (en) | Device and method for embedding a watermark in an audio signal | |
| DE602004005197T2 (en) | DEVICE AND METHOD FOR CODING AN AUDIO SIGNAL AND DEVICE AND METHOD FOR DECODING A CODED AUDIO SIGNAL | |
| DE60214027T2 (en) | CODING DEVICE AND DECODING DEVICE | |
| EP0954909B1 (en) | Method for coding an audio signal | |
| DE69901273T2 (en) | Methods for coding and quantizing audio signals | |
| DE60209888T2 (en) | CODING AN AUDIO SIGNAL | |
| DE60313332T2 (en) | AUDIOCODING WITH LOW BITRATE | |
| DE19921122C1 (en) | Method and device for concealing an error in a coded audio signal and method and device for decoding a coded audio signal | |
| DE19747132C2 (en) | Methods and devices for encoding audio signals and methods and devices for decoding a bit stream | |
| DE102004009954B4 (en) | Apparatus and method for processing a multi-channel signal | |
| EP0910928A1 (en) | Coding and decoding of audio signals by using intensity stereo and prediction processes | |
| WO1998003036A1 (en) | Process for coding and decoding stereophonic spectral values | |
| EP1212857B1 (en) | Method and device for introducing information into a data stream and a method for encoding an audio signal | |
| WO2000014886A1 (en) | Device and method for entropy encoding of information words and device and method for decoding entropy-encoded information words | |
| EP1687810B1 (en) | Device and method for determining a quantiser step size | |
| EP1338004A1 (en) | Method and device for the generation or decoding of a scalable data stream with provision for a bit-store, encoder and scalable encoder | |
| DE10200653A1 (en) | Scalable encoder and decoder for a scaled data stream | |
| EP1016319A1 (en) | Process and device for coding a time-discrete stereo signal | |
| DE602004009926T2 (en) | DEVICE AND METHOD FOR EMBEDDING A WATERMARK USING SUBBAND FILTERING | |
| DE19743662A1 (en) | Bit rate scalable audio data stream generation method | |
| EP1327243A1 (en) | Method and device for the generation of a scalable data stream and method and device for decoding a scalable data stream | |
| DE69823458T2 (en) | Multiband speech decoder | |
| EP1277346B1 (en) | Device and method for analysing a spectral representation of a decoded time-variable signal | |
| EP0905918A2 (en) | Method and apparatus for encoding audio signals | |
| DE602004006401T2 (en) | UPDATE A HIDDEN DATA CHANNEL |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| AK | Designated states |
Kind code of ref document: A2 Designated state(s): US |
|
| AL | Designated countries for regional patents |
Kind code of ref document: A2 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR |
|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
| WWE | Wipo information: entry into national phase |
Ref document number: 2002740586 Country of ref document: EP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 10481860 Country of ref document: US |
|
| WWP | Wipo information: published in national office |
Ref document number: 2002740586 Country of ref document: EP |
|
| WWG | Wipo information: grant in national office |
Ref document number: 2002740586 Country of ref document: EP |