EP1382038B1 - Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal - Google Patents

Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal Download PDF

Info

Publication number
EP1382038B1
EP1382038B1 EP02740586A EP02740586A EP1382038B1 EP 1382038 B1 EP1382038 B1 EP 1382038B1 EP 02740586 A EP02740586 A EP 02740586A EP 02740586 A EP02740586 A EP 02740586A EP 1382038 B1 EP1382038 B1 EP 1382038B1
Authority
EP
European Patent Office
Prior art keywords
watermark
audio signal
signal
spectral
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP02740586A
Other languages
English (en)
French (fr)
Other versions
EP1382038A2 (de
Inventor
Jürgen HERRE
Ralph Kulessa
Christian Neubauer
Frank Siebenhaar
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of EP1382038A2 publication Critical patent/EP1382038A2/de
Application granted granted Critical
Publication of EP1382038B1 publication Critical patent/EP1382038B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Definitions

  • the present invention relates to the field of Audio coding, and more particularly to methods and apparatus to embed a watermark in an audio signal.
  • Modern audio coding methods process discrete-time audio samples, to deliver a bitstream opposite the original audio signal is compressed.
  • Stream of discrete-time audio samples is initially fenestrated to successive from the stream of audio samples Blocks of windowed audio samples produce. Further processing takes place block by block.
  • a windowed block of audio samples is typically integrated into an analysis filter bank spectral representation implemented.
  • the spectral representation includes frequency adjacent spectral values from the frequency 0 to the maximum audio frequency, which may be 16 kHz, for example.
  • the audio spectral values are grouped into scale factor bands and quantized. The quantization takes place in such a way that the Quantization noise introduced by quantization is dimensioned such that it is masked by the audio signal becomes.
  • a psychoacoustic model is used, based on the audio signal for each scale factor band provides an energy value that indicates up to which energy level quantization noise is masked, d. H. be inaudible in the decoded audio signal becomes.
  • the quantization noise introduced by the quantizer on the other hand above the psychoacoustic Masking threshold, then becomes the re-decoded audio signal contain audible interference.
  • the quantization levels of the quantizer become dependent on the masking threshold calculated.
  • the audio spectral values are based on these quantization levels quantized to quantized audio spectral values to obtain.
  • the quantized audio spectral values of an entropy coding such as As a Huffman coding subjected to to provide a bit stream with codewords that represent the audio spectral values represent.
  • a bitstream multiplexer By means of a bitstream multiplexer become the stream of codewords page information added, which include the scale factors based on which an audio decoder the quantization levels which used in the encoder have been.
  • the bitstream including side information by means of a bit stream demultiplexer in one hand Codewords and on the other hand split side information.
  • the entropy encoding is undone.
  • the entropy-decoded values, d. H. the quantized audio spectral values, an inverse Quantization subjected to inverse quantized spectral values to obtain.
  • a synthesis filter bank implemented by the frequency range in the time domain. This is again at the output of the synthesis filter bank decoded audio signal.
  • the psychoacoustic masking threshold of an audio signal section depends on the actual input audio signal from. If the audio signal changes over time, change it also the masking properties over time. Out For data efficiency reasons, it is always preferred that much Introduce quantization noise into the audio signal, such as possible, d. H. The quantization noise should be as possible correspond well to the psychoacoustic masking threshold. Audio signal sections with good masking properties can therefore with a relatively small bit of effort On the other hand, audio signal sections with relatively poor masking properties, such. B. tonal audio signal sections, very finely quantized which in turn means that to encode these audio signal sections spent a large number of bits must become.
  • Bitsparkasse is filled, if easy to encoded audio sections, such that Bits that are not needed to encode these easily To code sections, not simply by one be "wasted” finer than necessary quantization, but that nevertheless a coarser quantization is used and the surplus bits in the Bitsparkasse "stuck" become.
  • bit savings bank function thus acts as a buffer, from an "internal" variable bit rate audio encoder to "outside” to an audio encoder with constant bit rate too do.
  • this method has the advantage of high audio quality, because the quantization noise and the watermark noise can be coordinated if the energy introduced by the watermark into the audio signal below the psychoacoustic masking threshold lies.
  • the method is further characterized by a high Robustness out since the watermark does not come out of it again decoded audio signal, for example, by an illegal Distributor of the audio signal can be removed without affect the audio quality.
  • a disadvantage of the described method is the Fact that charged by the quantization of the watermark Signals the watermark under circumstances is quantized or weakened. This is due to, that the energy of the watermark signal sometimes is within the range of the quantization interval. Farther there is limited control over the introduced by the watermark disturbance, which is z. B. in an audio quality loss.
  • Another watermarking method is the embedding of the Watermark during compression of the audio signal. This concept is described in the technical publication "Combined Compression / Watermarking for Audio Signals ", Frank Siebenhaar, Christian Neubauer and Jürgen Herre, 110th AES Convention, 12-15 May 2001, Amsterdam, Preprint 5344.
  • an uncompressed audio signal a psychoacoustic model supplied to the masking threshold to determine.
  • the audio signal in transformed the frequency range.
  • the spread, spectral represented watermark signal is based on the masking threshold weighted in the frequency domain and the spectrum of the input audio signal. Based on the masking threshold the parameters for the quantization are determined, whereupon the watermarked signal quantized and coded.
  • This method also draws characterized by a low computational complexity, since by the contraction of watermark embedding and Coding certain operations, such as For example, the calculation of the masking model and the transfer of the audio signal in a spectral representation, to be performed only once have to.
  • the method also usually provides a good audio quality, since quantization noise and watermark noise can be coordinated with each other.
  • the splayed watermark signal is also through characterized a plurality of spectral lines. So that Watermarks but not audible interference in again decoded audio signal is the height of the watermark spectral lines much lower than the height of the Audio signal spectral lines.
  • the combined Spectrum After adding the watermark spectrum to the audio spectrum is the combined Spectrum only slightly compared to the original spectrum changed. The following quantization of the combined Spectrum will always remove the watermark without replacement, if the quantization step size is greater than the height of the watermark spectral lines associated with this Quantizer step size are quantized. Become too many Watermark spectral lines through the following Quantize "quantized", so the watermark detector can no longer extract a unique watermark.
  • WO 97/33391 discloses a coding method for introduction a non-audible data signal into an audio signal.
  • the audio signal is first in the frequency domain transformed to from the same a masking threshold determine.
  • a data signal to be inserted in the audio signal is subjected to source coding and then with a pseudo-noise sequence multiplied by a frequency-spread To receive data signal.
  • This frequency-spread Data signal is then transmitted from the audio signal weighted psychoacoustic masking threshold, to obtain a frequency-spread data signal whose Energy below the psychoacoustic masking threshold
  • This signal is then transformed into the time domain and added to the original audio signal, to the data represented by the data signal in the Introduce audio signal.
  • the object of the present invention is a improved concept for embedding a watermark in to create an audio signal, on the one hand a good audio quality on the other hand also a good one Ensures watermark detectability.
  • This task is accomplished by a method for embedding a Watermark in an audio signal according to claim 1 or by a device for embedding a watermark solved in an audio signal according to claim 16.
  • the present invention is based on the knowledge that achieves better watermark detectability if the fact is taken into account in watermark embedding will that the audio signal including watermark subjected to quantization.
  • a watermark will be detectable only if a spectral line, the Watermark and audio signal represented by the watermark falls into a different quantization level than if no watermark is embedded. Only in this case becomes a watermark detector that merely quantizes Receives information, can detect a watermark.
  • the spectral representation of Watermark signal processed such that ensured is that processed by the step of processing Watermark signal is designed so that it also after a quantization will still be available.
  • a predetermined watermark start value which is selected from the spectral representation of the watermark signal depends.
  • the watermark is allowed too none or only a very small disturbance of the audio signal to lead.
  • one by the predetermined Watermark start value in the spectral representation of the audio signal detected at but the conditions after a quantization of spectral representation of the audio signal based become. This makes it possible, on the one hand, to see if the quantization of the watermark remains.
  • the watermark start value Fault greater than a predetermined fault threshold is, the watermark start value is changed so long, until due to a changed watermark start value in the spectral representation after quantization introduced disturbance less than or equal to the predetermined Fault threshold is.
  • the resulting changed Watermark start value is then combined with the audio signal, to get the watermarked audio signal, in which the watermark is embedded.
  • An advantage of the present invention is that now no more circumstances are taken into account, which ultimately do not correspond to the starting conditions, namely the audio signal / watermark ratios before the Quantization, but that the watermark z. Eg iteratively is changed until a desired watermark "disturbance energy" is found.
  • the ratios for the audio signal decoder and are relevant to the watermark extractor.
  • the watermark energy has been set so that the watermark energy less than or equal to the psychoacoustic Masking threshold, yet the uncertainty remained, what about the watermark signal during quantization happens.
  • a case occurs that quantizes the watermark which causes no signal in the decoded signal Watermarks or just a very weak watermark extracted could be.
  • the case could occur through the watermark, although it is so weighted it has been below the masking threshold Yet, disturbances have been introduced, which in the decoded signal were audible.
  • the invention is now due to the processing of the Watermark on the basis of the circumstances after the Quantization achieved a precise control.
  • This control has the advantage that not only on the one hand ensured can be that the watermark to none or only minimally audible disturbance leads, but that at the same time also a sufficient watermark detectability is ensured.
  • the invention provides Procedure has the advantage that for special cases Good detectability is important, too in favor of higher watermark detectability - tolerable - introduced interference in the audio signal while in other cases where the watermark detectability not in all circumstances too At any point in time, compromises must be made the watermark detectability to meet the highest audio quality standards.
  • Invention will provide the watermark signal prior to quantization the audio signal added to a combined signal to obtain.
  • the combined signal is then quantized and again inversely quantized and with the original Audio signal compared. From the comparison it is determined whether the fault introduced by the watermark is tolerable. If it is determined that the disturbance is not tolerable is, then the spectrum of the watermark signal weighted iteratively using certain strategies, then again a quantization and inverse quantization until it is determined that the fault is now is tolerable.
  • the watermark spectrum obtained by this processing then becomes the original audio spectrum added.
  • the added or combined signal is then quantized, entropy-coded and with side information provided to obtain an audio bitstream, in which the watermark is present.
  • the original audio signal is quantized.
  • the Audio signal is added to a quantized watermark, to get the combined signal.
  • the combined Signal is then no longer, as in the first embodiment, quantized once again, but immediately Entropy coded.
  • the added to the quantized audio signal "quantized" watermark signal is hereby set such that on the one hand the demand for tolerable Fault is satisfied and on the other hand a desirable Watermark detectability is achieved.
  • the device according to the invention shown in Fig. 1 comprises an audio input 10 and a watermark input 12. Both the audio signal on the audio input 10 and the Watermark signal at the watermark input 12 become by means of a device 14 or 16 in a spectral representation transferred.
  • the spectral representation of the audio signal includes audio spectral values, while the spectral representation of the watermark signal watermark spectral values having.
  • a device 18 for combining the audio spectral values with altered watermark spectral values combined to combined at an exit 20 the To get audio signal into which the watermark is embedded.
  • this is a device 22 for processing the spectral representation of the watermark signal depending on one via an input 24 provided psychoacoustic masking threshold.
  • the spectral representation of the watermark signal depends on the psychoacoustic received via the entrance 24 Masking threshold processed to a processed Watermark signal, so that a through the processed watermark signal into the audio signal introduced disturbance below a predetermined disturbance threshold is that of the psychoacoustic masking threshold depends.
  • the device 22 for processing the spectral Representation of the watermark signal a device 26 for selecting a predetermined watermark starting value, that of the spectral representation of the watermark signal depends.
  • a device 28 is one by the predetermined Watermark start value in the spectral representation of the audio signal after a quantization of the spectral Detection of the audio signal introduced detected interference.
  • a device 32 it is examined whether the determined Fault is greater than the predetermined fault threshold. is this is not the case, d. H. the fault is acceptable, so the watermark start value becomes immediately the device 18 supplied for combining. Is this, however, the Case, d. H. the introduced disturbance is too big or different as desired, means 34 for changing of the watermark start value is activated until the through a changed watermark start value in the spectral Presentation of the audio signal introduced after the quantization Fault less than or equal to the predetermined fault threshold is.
  • the in the device 22 must Repeated loop may be repeated several times for processing iteratively, at some point at the output of the Device 32 to a changed watermark start value received, which uses as a processed watermark signal is supplied to the device 18 for combining is to get the audio signal at the output 20, in the the watermark is embedded.
  • Invention shown in Fig. 2 will combine performed by means of an addition 18 before quantizing.
  • the means 28 for determining the through the block Watermark weighting 26 set start value in the Audio signal introduced interference is determined by that first in a quantizer / inverse quantizer device 28a quantizes the combined signal and inverse is quantized.
  • a device 28b is then for example, by subtracting and squaring the Difference values the disturbance introduced by the watermark calculated and then in the device 32 with the psychoacoustic Masking threshold 24 compared. Is the Disturbance too large, the device 34, which in Fig. 2 with "Weighting control" is called, driven to the Block 26 to supply changed weighting factors, then the changed weighted watermark spectrum in the device 18 with the original audio signal in spectral Combining presentation and the iteration loop to go through again.
  • a watermark start value that with a for all spectral lines equally weighted watermark spectrum to take.
  • the weighting factor for each spectral line is therefore equal to one for all spectral lines Constants, chosen so that the watermark energy above the masking threshold. Then the watermark energy gradually reduced, and then the energy of the watermark below the masking threshold.
  • the device 34 when first detected by the device 32 is that the disturbance is too large, the device 34 designed to control the weighting factors to all To reduce weighting factors, e.g. B. to halve. If then the disturbance is still too large, could in a next iteration step all current weighting factors halved again, etc. This can continue until device 32 determines that the Disturbance is fine now.
  • FIG. 2 By means of an analysis-synthesis iteration, as shown in FIG. 2 is shown, thus by the watermark after the quantization arising interference determined.
  • the spectrally displayed watermark signal is thus, as has been explained with reference to FIG. 2, by means of a weighting filter bank included in block 26 can be spectrally with that of the block 34 to Weighted current weighting factors provided.
  • the resulting signal becomes the original audio signal added.
  • the device 28b now compares the original signal with the quantized and inverse quantized again Signal and from this determines the quantization error signal, which is supplied to the device 32. Based the device 32 again becomes the weighting control in block 34, to get new better weighting factors to determine. This is indicated by the masking models determined masking threshold, the indicates how much interference in the signal at a certain Place in the signal spectrum is "allowed”. If the block weight control 34 optimal weighting factors regarding to the desired audio signal interference and desired Watermark detectability, d. H. Watermark energy has determined, the process aborts. The last quantized spectral values determined by block 28a of the combination signal will then be as a result passed to the bit stream multiplexer to there with the page information formed together into an audio bitstream to become.
  • Fig. 3 to a device to embed a watermark in an audio signal according to a second embodiment of the present Invention.
  • this combination 18 in Fig. 3 in the "quantization area" instead of, d. H. it is a quantized audio signal with a quantized Watermark combined. This can be achieved be that either by means of a quantizer 42 through Quantize the original audio signal the quantizer levels be calculated or that the quantization levels be extracted from a coded audio signal.
  • Quantization steps will be a means 40a for calculation of the quantized audio signal minus a predetermined one Number of n quantization levels and one device 40b for calculating the quantized audio signal plus one operated predetermined number of n quantization stages.
  • Fig. 3 shown a-priori second embodiment instead of, d. H. by a precalculation outside of an iteration loop.
  • a predetermined Watermark start value by means 36 calculated so-called "maximum" watermark.
  • maximum watermark For calculating of the predetermined maximum watermark initially only the sign of the watermark spectrum used. Has the watermark spectrum a positive one Sign, then the corresponding spectral value of the original quantized audio signal by n quantization levels magnified, where n is an integer greater than or equal to is equal to 1.
  • a device 38 which implements a line selection algorithm.
  • the device 38 determines the by the of the Facility 36 provided maximum watermarks introduced disturbance in the audio signal. If the fault greater than the predetermined disturbance threshold is through the device 38 through the "maximum" watermark Selection of individual lines changed until the interference introduced by the watermark is smaller or smaller is equal to the predetermined Störschwelle. Is this condition This will be done - already in quantized form - present watermarks as well as the quantized original Audio signal supplied to the adder 18 to the output side the quantized watermarked audio signal to obtain.
  • FIG. 4a shows by way of example a quantized audio signal
  • FIG. this due to the clarity of the presentation represents only three spectral values 50a-50c. typically, has an audio spectrum depending on the selected window length and transformation z. B. 1024 spectral values.
  • the number the non-zero quantized spectral values depends on how many audio spectral values are set to 0 have been quantized.
  • the quantized Audio spectral values in the real case different Heights.
  • Fig. 4b now shows a plus or minus n Quantization levels (depending on the sign of the watermark spectral values) applied audio spectrum.
  • the spectral component corresponding to the audio spectral value 50a of FIG. 4a of the watermark has for that shown in Fig. 4b Example a negative sign.
  • the spectral component of the watermark corresponding to the audio spectral value 50b of Fig. 4a has in the shown in Fig. 4b Example, a positive sign, while the third Spectral component of the watermark in turn a negative Had a sign.
  • the amount of watermark spectral components does not matter at first, because of it it is assumed that a watermark detection already then possible if the quantized audio spectral values 50a-50c can be changed by the watermark.
  • the maximum Watermark generated by means 36 of FIG. 3 is determined for the case shown in FIG Fig. 4c shown. It has a spectrum that is different denotes that each quantized original audio spectral value is changed by one quantization step, either enlarged if the watermark is on has positive sign, or reduced if the watermark had a negative sign.
  • the amount of a Watermark spectral line taken into account that is not just incremented by one quantization level or decremented, but that by several quantization levels is incremented or decremented, if the amount of the watermark spectral line is corresponding is great.
  • FIG. 4d 38 of FIG. 3 Represents the device 38 determined that for the left quantized audio spectral component the situation is such that the by the watermark introduced disturbance is too large when the left quantized Audio spectral component 50a by one quantization step is reduced, as indicated by the spectral component 50a ' is shown, then this spectral component of the Device 38 not selected, which changed in the Watermark spectral values after line selection makes so noticeable that the changed watermark this point has a spectral line of 0.
  • the quantized audio spectral values are now based on the watermark signal, d. H. based on the sign of the Watermark signal to z. B. plus or minus one quantization level changed.
  • This procedure brings advantages to the effect that computing time can be saved, since the Quantization and Inverse Quantization (Facility 28a of Fig. 2) and the weight of the watermark (device 26 of Fig. 2) can be omitted without replacement.
  • the line selection algorithm used in device 38 executed takes into account the amount of unweighted Watermark spectral lines, the masking threshold 24 and optionally a bit savings bank function 44 of the audio encoder.
  • the quantized watermarked audio signal at Output 20 of the device shown in Fig. 3 must now still be entropy-coded.
  • bit savings bank function the later signal blocks additional Bits can provide as it has been executed is.
  • the line selection strategy is preferably on adjusted the level of the bit savings, so for example to allow filled bit savings bank, too quantized audio spectral values of the original audio signal, which have the value 0, with a watermark applied which is usually due to the bit requirements would not be allowed. This can watermark detection be noticeably improved.
  • the quantization of the original Audio spectral values can also act as a kind of watermark embedding be regarded as both in the Quantization as well as adding a watermark signal a certain disturbance of the audio spectrum results.
  • the disturbance introduced by the quantization is not a watermark due to its random nature to watch. However, if the introduced fault due to the quantization with the correct watermark is the quantization noise supports the detectability of the watermark. This results the following cases.
  • the Watermark By the quantization of an audio spectral line is the Watermark inserted with the correct sign.
  • the Device 38 of Fig. 3 preferably arranged so that they due to the fact that already by the quantization in-phase to the watermark spectral value for a certain frequency a disturbance has been introduced, arranged um on bringing in another watermark error to renounce.
  • the inventive concept such that first a spectrally displayed watermark signal is produced. This is done by weighting factors weighted. The weighted signal becomes the original audio signal, which is present in spectral representation, added. Alternatively, based on the watermark signal a change in the lines of the original audio signal, which is present in spectral representation, carried out. This is followed by the introduced after quantization Disturbance, the disturbance being quantified by quantization, inverse Quantize and subtract from the original is determined, or where the disorder precalculated is.
  • new weighting factors are determined, where the masking threshold is used, with a line selection strategy is applied, or where a Line selection strategy in particular applied in such a way is that the sign and magnitude of the spectral lines of the unweighted Watermark can be used, and that the Sum of watermark line and original spectral line like this it is determined that this new spectral line into another Quantization interval falls as the original spectral line.
  • the inventive concept is advantageous in that that it is both for bitstream watermarking methods Method is used, the audio encoding and watermark embedding in one step.
  • Another advantage of the inventive concept exists in that a full control over the introduced disturbance is achievable. This makes it possible the procedure specifically for optimum watermark detection or optimal To adjust the audio quality.
  • Another advantage of the inventive concept is a full control over the frequency distribution of the Watermark spread band signal into the audio signal.

Description

Die vorliegende Erfindung bezieht sich auf das Gebiet der Audiocodierung und insbesondere auf Verfahren und Vorrichtungen zum Einbetten eines Wasserzeichens in ein Audiosignal.
Moderne Audiocodierverfahren verarbeiten zeitdiskrete Audio-Abtastwerte, um einen Bitstrom zu liefern, der gegenüber dem ursprünglichen Audiosignal komprimiert ist. Der Strom von zeitdiskreten Audio-Abtastwerten wird zunächst gefenstert, um aus dem Strom von Audio-Abtastwerten aufeinanderfolgende Blöcke von gefensterten Audio-Abtastwerten zu erzeugen. Die weitere Verarbeitung findet blockweise statt. Ein durch Fensterung erzeugter Block von Audio-Abtastwerten wird typischerweise mittels einer Analyse-Filterbank in eine spektrale Darstellung umgesetzt. Die spektrale Darstellung umfaßt frequenzmäßig nebeneinanderliegende Spektralwerte von der Frequenz 0 bis zur maximalen Audio-Frequenz, welche beispielsweise bei 16 kHz liegen kann. Die Audio-Spektralwerte werden in Skalenfaktorbändern gruppiert und quantisiert. Die Quantisierung findet derart statt, daß das durch die Quantisierung eingeführte Quantisierungsrauschen derart dimensioniert ist, daß es von dem Audiosignal maskiert wird. Hierzu wird ein psychoakustisches Modell eingesetzt, das auf der Basis des Audiosignals für jedes Skalenfaktorband einen Energiewert liefert, der angibt, bis zu welchem Energiepegel Quantisierungsrauschen maskiert wird, d. h. im wieder decodierten Audiosignal nicht hörbar sein wird. Liegt das durch den Quantisierer eingeführte Quantisierungsrauschen dagegen oberhalb der psychoakustischen Maskierungsschwelle, so wird das wieder decodierte Audiosignal hörbare Störungen enthalten. Die Quantisierungsstufen des Quantisierers werden abhängig von der Maskierungsschwelle berechnet. Wenn die Quantisierungsstufen berechnet sind, werden die Audio-Spektralwerte anhand dieser Quantisierungsstufen quantisiert, um quantisierte Audio-Spektralwerte zu erhalten. Aus Dateneffizienzgründen werden die quantisierten Audiospektralwerte einer Entropie-Codierung, wie z. B. eine Huffman-Codierung, unterzogen, um einen Bitstrom mit Codeworten zu liefern, die die Audio-spektralwerte darstellen. Mittels eines Bitstrom-Multiplexers werden dem Strom von Codeworten Seiteninformationen hinzugefügt, welche unter anderem die Skalenfaktoren umfassen, auf deren Basis ein Audio-Decodierer die Quantisierungsstufen ermitteln kann, die im Codierer verwendet worden sind.
Zur Audio-Decodierung wird der Bitstrom samt Seiteninformationen mittels eines Bitstrom-Demultiplexers in einerseits Codewörter und andererseits Seiteninformationen aufgesplittet. Zunächst wird die Entropie-Codierung rückgängig gemacht. Anschließend werden die Entropie-decodierten Werte, d. h. die quantisierten Audio-Spektralwerte, einer inversen Quantisierung unterzogen, um invers quantisierte Spektralwerte zu erhalten. Diese werden dann mittels einer Synthese-Filterbank vom Frequenzbereich in den Zeitbereich umgesetzt. Am Ausgang der Synthese-Filterbank liegt das wieder decodierte Audiosignal vor.
Es sei darauf hingewiesen, daß es sich hierbei um ein verlustbehaftetes Codierverfahren handelt, da im Codierer eine Quantisierung vorgenommen worden ist. Das wieder decodierte Audiosignal entspricht nicht exakt dem ursprünglichen Audiosignal. Wenn die Codierung und Decodierung erfolgreich war, wird jedoch der subjektive Höreindruck des decodierten Audiosignals dem subjektiven Höreindruck des ursprünglichen Audiosignals entsprechen, da das durch den Quantisierer im Codierer eingeführte Quantisierungsrauschen wegmaskiert wird, d. h. es wird unterhalb der psychoakustischen Maskierungsschwelle "versteckt".
Aus Dateneffizienzgründen wird es bevorzugt, möglichst große Quantisierungsschritte zu verwenden. Andererseits führen zu große Quantisierungsschritte zu einem zu großen Quantisierungsrauschen, das sich im wieder decodierten Signal als hörbare Störung äußern kann. Moderne Audiocodierverfahren versuchen einen optimalen Kompromiß zwischen diesen beiden Forderungen zu erreichen.
Die psychoakustische Maskierungsschwelle eines Audiosignalabschnitts hängt von dem tatsächlichen Eingangs-Audiosignal ab. Ändert sich das Audiosignal über der Zeit, so ändern sich auch die Maskierungseigenschaften über der Zeit. Aus Dateneffizienzgründen wird es bevorzugt, immer so viel Quantisierungsrauschen in das Audiosignal einzuführen, wie möglich ist, d. h. das Quantisierungsrauschen sollte möglichst gut der psychoakustischen Maskierungsschwelle entsprechen. Audiosignalabschnitte mit guten Maskierungseigenschaften können daher mit einem relativ geringen Bitaufwand codiert werden, während andererseits Audiosignalabschnitte mit relativ schlechten Maskierungseigenschaften, wie z. B. tonale Audiosignalabschnitte, sehr fein quantisiert werden müssen, was wiederum bedeutet, daß zur Codierung dieser Audiosignalabschnitte eine große Anzahl von Bits aufgewendet werden muß. Ein Codierer, der versucht, immer genau die Menge an Störung einzuführen, die durch die Maskierungsschwelle gegeben wird, wird daher ein Audiosignal mit konstanter Qualität erzeugen. Aufgrund des zeitlich variierenden Wesens des Eingangssignals führt dies jedoch am Ausgang des Codierers zu einer variablen Bitrate. Obgleich ein Codieren mit konstanter Qualität - und damit mit variabler Bitrate - aus Dateneffizienz-Gründen einerseits und Audioqualitäts-Gründen andererseits attraktiv ist, ist dieses Konzept dahingehend nachteilig, daß es nur für Anwendungen geeignet, die eine variable Übertragungsrate unterstützen, wie z. B. die Speicherung von komprimierten Audiosignalen oder die Übertragung von komprimierten Audiosignalen über Paket-basierte Netze, wie z. B. das Internet.
Viele Anwendungen fordern jedoch einen Audiocodierer mit einer konstanten Übertragungsrate. Aufgrund der zeitlich variierenden spektralen und zeitlichen Eigenschaften eines Audiosignals führt dies unweigerlich zu einer variablen Qualität. Insbesondere kann je nach Bitrate der Fall entstehen, in dem Abschnitte des Audiosignals, die relativ geringe Maskierungseigenschaften haben, nicht ausreichend fein quantisiert werden können, d. h. unter-codiert werden und im decodierten Signal unter Umständen hörbare Störungen enthalten, während andererseits leicht zu codierende Segmente, d. h. Audiosignalabschnitt mit guten Maskierungseigenschaften, genauer als nötig codiert werden müssen, d. h. über-codiert werden.
Um die Nachteile des Über-Codierens und Unter-Codierens zu überwinden, wird üblicherweise eine Bitsparkassenfunktion eingesetzt. Die Bitsparkasse wird gefüllt, wenn leicht zu codierende Audioabschnitte codiert werden, derart, daß Bits, die nicht benötigt werden, um diese leicht zu codierenden Abschnitte zu codieren, nicht einfach durch eine feiner als nötige Quantisierung "verschwendet" werden, sondern daß dennoch eine gröbere Quantisierung verwendet wird und die überzähligen Bits in die Bitsparkasse "gesteckt" werden.
Kommen dagegen Audioabschnitte vor, die schwer zu codieren sind, d. h. bei denen eine geringere Quantisiererschrittweite eingesetzt werden muß als eigentlich durch die geforderte konstante mittlere Datenrate möglich ist, so wird zu diesem Zweck die Bitsparkasse "geleert", um trotz der geforderten Datenrate eine feinere Quantisierung als eigentlich möglich einzusetzen, so daß im decodierten Audiosignal auch in diesen Abschnitten keine hörbare Störung enthalten ist. Die Bitsparkassenfunktion fungiert somit als Puffer, um aus einem "inneren" Audiocodierer mit variabler Bitrate nach "außen" einen Audiocodierer mit konstanter Bitrate zu machen.
Heutzutage entwickelt sich die Musikverteilung beispielsweise über das Internet zu einer zunehmend wichtigeren Technologie. Der meiste Musikinhalt ist komprimiert, um Speicherplatz zu sparen und die Übertragung über Übertragungskanäle mit begrenzter Bandbreite zu beschleunigen. Das Überwachen der Verwendung der in Übertragungsnetzen verteilten Musikstücke oder das Verfolgen von illegalen Kopien derselben wird jedoch zu einem immer größeren Problem. Während einerseits eine breite Verteilung von Audiostücken wünschenswert ist, müssen dennoch Urheberrechte respektiert werden. In diesem Zusammenhang stellt die "Wasserzeichentechnik" (Watermarking) einen nützlichen Mechanismus dar, um solche illegalen Kopien zu verfolgen, oder um Urheberrechts-Informationen oder allgemein das geistige Eigentum an den Stücken im Audiosignal unterzubringen.
Das Einbringen von Wasserzeichen in nicht-komprimierte Multimediadaten, wie z. B. Bildern, Video, Audio usw. ist bekannt. Um Wasserzeichen in komprimiertes Material einzubringen, wird jedoch ein schnelles, Qualitäts-bewahrendes Wasserzeichenverfahren benötigt.
Die Fachveröffentlichung "Audio Watermarking of MPEG-2-AAC Bit Streams", Christian Neubauer, Jürgen Herre, 108. AES Convention, Paris 2000, Preprint 5101 lehrt zunächst, eine spektrale Darstellung eines Audiosignals zu erzeugen. Zu dieser wird dann ein gespreiztes und spektral transformiertes Wasserzeichensignal addiert. Aus dem Summensignal wird durch Quantisierung und Huffman-Codierung ein neuer Bitstrom erzeugt. Dieses sogenannte Bitstrom-Wasserzeichenverfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da keine volle Decodierung des mit einem Wasserzeichen zu versehenden Bitstroms erfolgen muß. Weiterhin hat dieses Verfahren den Vorteil der hohen Audioqualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch aufeinander abgestimmt werden können, wenn die durch das Wasserzeichen in das Audiosignal eingeführte Energie unterhalb der psychoakustischen Maskierungsschwelle liegt. Das Verfahren zeichnet sich ferner durch eine hohe Robustheit aus, da das Wasserzeichen nicht aus dem wieder decodierten Audiosignal beispielsweise durch einen illegalen Verbreiter des Audiosignals entfernt werden kann, ohne die Audioqualität zu beeinträchtigen.
Nachteilig an dem beschriebenen Verfahren ist jedoch die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.
Ein weiteres Wasserzeichenverfahren ist die Einbettung des Wasserzeichens während der Komprimierung des Audiosignals. Dieses Konzept ist in der Fachveröffentlichung "Combined Compression/Watermarking for Audio Signals", Frank Siebenhaar, Christian Neubauer und Jürgen Herre, 110. AES Convention, 12. bis 15 Mai 2001, Amsterdam, Preprint 5344, beschrieben. Zunächst wird ein unkomprimiertes Audiosignal einem psychoakustischen Modell zugeführt, um die Maskierungsschwelle zu bestimmen. Hierauf wird das Audiosignal in den Frequenzbereich transformiert. Das gespreizte, spektral repräsentierte Wasserzeichensignal wird anhand der Maskierungsschwelle im Frequenzbereich gewichtet und zum Spektrum des Eingangsaudiosignals addiert. Anhand der Maskierungsschwelle werden die Parameter für die Quantisierung ermittelt, woraufhin das Wasserzeichen-beaufschlagte Signal quantisiert und codiert wird. Auch dieses Verfahren zeichnet sich durch eine niedrige Rechenkomplexität aus, da durch die Zusammenziehung von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z. B. die Berechnung des Maskierungsmodells und die Überführung des Audiosignals in eine spektrale Darstellung, nur einmal durchgeführt werden müssen. Das Verfahren liefert ferner üblicherweise eine gute Audioqualität, da Quantisierungsgeräusch und Wasserzeichengeräusch aufeinander abgestimmt werden können.
Nachteilig an diesem Verfahren ist jedoch ebenfalls die Tatsache, daß durch die Quantisierung des Wasserzeichenbeaufschlagten Signals das Wasserzeichen unter Umständen wegquantisiert oder geschwächt wird. Dies ist wieder darauf zurückzuführen, daß die Energie des Wasserzeichensignals mitunter im Bereich des Quantisierungsintervalls liegt. Weiterhin besteht nur eingeschränkt eine Kontrolle über die durch das Wasserzeichen eingebrachte Störung, was sich z. B. in einem Audioqualitätsverlust auswirken kann.
Wenn die spektrale Darstellung des Audiosignals betrachtet wird, so ist eine Vielzahl von Audiospektralwerten zu sehen. Das gespreizte Wasserzeichensignal ist ebenfalls durch eine Vielzahl von Spektrallinien gekennzeichnet. Damit das Wasserzeichen jedoch nicht zu hörbaren Störungen im wieder decodierten Audiosignal führt, ist die Höhe der Wasserzeichen-Spektrallinien wesentlich geringer als die Höhe der Audiosignal-Spektrallinien. Nach einer Addition des Wasserzeichen-Spektrums zum Audio-Spektrum ist das kombinierte Spektrum nur leicht gegenüber dem ursprünglichen Spektrum verändert. Die dann folgende Quantisierung des kombinierten Spektrums wird das Wasserzeichen immer dann ersatzlos entfernen, wenn die Quantisierungs-Schrittweite größer ist als die Höhe der Wasserzeichen-Spektrallinien, die mit dieser Quantisiererschrittweite quantisiert werden. Werden zu viele Wasserzeichen-Spektrallinien durch das darauffolgende Quantisieren "wegquantisiert", so kann der Wasserzeichendetektor kein eindeutiges Wasserzeichen mehr extrahieren.
Die WO 97/33391 offenbart ein Kodierverfahren zum Einbringen eines nicht-hörbaren Datensignals in ein Audiosignal. Hierbei wird das Audiosignal zunächst in den Frequenzbereich transformiert, um aus demselben eine Maskierungsschwelle zu ermitteln. Ein in das Audiosignal einzubringendes Datensignal wird einer Quellenkodierung unterzogen und dann mit einer Pseudo-Noise- Sequenz multipliziert, um ein Frequenz-gespreiztes Datensignal zu erhalten. Dieses Frequenz-gespreizte Datensignal wird dann mit der aus dem Audiosignal ermittelten psychoakustischen Maskierungsschwelle gewichtet, um ein Frequenz-gespreiztes Datensignal zu erhalten, dessen Energie unterhalb der psychoakustischen Maskierungsschwelle liegt.Dieses Signal wird dann in den Zeitbereich transformiert und zu dem ursprünglichen Audiosignal hinzu addiert, um die durch das Datensignal dargestellten Daten in das Audiosignal einzubringen.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein verbessertes Konzept zum Einbetten eines Wasserzeichens in ein Audiosignal zu schaffen, das einerseits eine gute Audioqualität liefert, und das andererseits auch eine gute Wasserzeichen-Detektierbarkeit sicherstellt.
Diese Aufgabe wird durch ein Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 1 oder durch eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß Anspruch 16 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß eine bessere Wasserzeichendetektierbarkeit erreicht wird, wenn bei der Wasserzeicheneinbettung die Tatsache berücksichtigt wird, daß das Audiosignal samt Wasserzeichen einer Quantisierung unterzogen wird. Ein Wasserzeichen wird nur dann detektierbar sein, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, durch das Wasserzeichen in eine andere Quantisierungsstufe fällt als wenn kein Wasserzeichen eingebettet wird. Nur in diesem Fall wird ein Wasserzeichendetektor, der lediglich quantisierte Informationen erhält, ein Wasserzeichen detektieren können. In anderen Worten ausgedrückt bedeutet dies, daß dann, wenn eine Spektrallinie, die Wasserzeichen und Audiosignal darstellt, in dieselbe Quantisierungsstufe fällt wie die entsprechende Spektrallinie, die nur das Audiosignal darstellt, die Wasserzeicheneinbettung vergeblich war, da im quantisierten Signal kein Energieanteil, der von dem Wasserzeichen herrührt, zu sehen sein wird. Das Wasserzeichen ist wegquantisiert worden.
Erfindungsgemäß wird daher die spektrale Darstellung des Wasserzeichensignals derart verarbeitet, daß sichergestellt wird, daß das durch den Schritt des Verarbeitens verarbeitete Wasserzeichensignal so gestaltet ist, daß es auch nach einer Quantisierung noch vorhanden sein wird. Um dies zu erreichen wird ein vorbestimmter Wasserzeichen-Startwert gewählt, welcher von der spektralen Darstellung des Wasserzeichensignals abhängt. Natürlich darf das Wasserzeichen zu keiner oder nur zu einer sehr geringen Störung des Audiosignals führen. Aus diesem Grund wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals eingeführte Störung ermittelt, bei der jedoch die Verhältnisse nach einer Quantisierung der spektralen Darstellung des Audiosignals zugrunde gelegt werden. Damit ist es einerseits möglich, zu sehen, ob nach der Quantisierung etwas vom Wasserzeichen verbleibt. Andererseits kann sichergestellt werden, daß die Störung des Wasserzeichens nach der Quantisierung so ist, wie sie sein soll. Falls die durch den Wasserzeichen-Startwert eingeführte Störung größer als eine vorbestimmte Störungsschwelle ist, wird der Wasserzeichen-Startwert so lange verändert, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Der dadurch erhaltene veränderte Wasserzeichen-Startwert wird dann mit dem Audiosignal kombiniert, um das Wasserzeichen-behaftete Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist.
Ein Vorteil der vorliegenden Erfindung liegt darin, daß nun nicht mehr Verhältnisse berücksichtigt werden, die letztendlich nicht den Ausgangsverhältnissen entsprechen, nämlich die Audiosignal/Wasserzeichen-Verhältnisse vor der Quantisierung, sondern daß das Wasserzeichen z. B. iterativ so lange verändert wird, bis eine gewünschte Wasserzeichen-"Störenergie" gefunden ist. Erfindungsgemäß werden nunmehr die Verhältnisse nach dem Quantisierer berücksichtigt, d. h. die Verhältnisse, die für den Audiosignal-Decodierer und für den Wasserzeichen-Extraktor maßgeblich sind.
Obgleich im Stand der Technik üblicherweise die Wasserzeichenenergie derart eingestellt worden ist, daß die Wasserzeichenenergie kleiner oder gleich der psychoakustischen Maskierungsschwelle ist, blieb dennoch die Unwägbarkeit zurück, was mit dem Wasserzeichensignal während der Quantisierung geschieht. Wie es ausgeführt worden ist, konnte zum einen der Fall auftreten, daß das Wasserzeichen wegquantisiert wird, was dazu führt, daß im decodierten Signal kein Wasserzeichen oder nur ein sehr schwaches Wasserzeichen extrahiert werden konnte. Andererseits konnte auch der Fall auftreten, daß durch das Wasserzeichen, obwohl es so gewichtet worden ist, daß es unterhalb der Maskierungsschwelle liegt, dennoch Störungen eingeführt worden sind, die im decodierten Signal hörbar waren.
Erfindungsgemäß wird nunmehr aufgrund der Verarbeitung des Wasserzeichens auf der Basis der Verhältnisse nach der Quantisierung eine genaue Kontrolle erreicht. Diese Kontrolle hat den Vorteil, daß nicht nur einerseits sichergestellt werden kann, daß das Wasserzeichen zu keiner oder nur minimal hörbaren Störung führt, sondern daß gleichzeitig auch eine ausreichende Wasserzeichen-Detektierbarkeit sichergestellt wird. Andererseits liefert das erfindungsgemäße Verfahren den Vorteil, daß für Fälle, bei denen es besonders auf eine gute Detektierbarkeit ankommt, auch bewußt zugunsten einer höheren Wasserzeichen-Detektierbarkeit gewisse - tolerierbare - Störungen in das Audiosignal eingeführt werden, während in anderen Fällen, bei denen die Wasserzeichen-Detektierbarkeit nicht unter allen Umständen zu jedem Zeitpunkt sichergestellt werden muß, Kompromisse hinsichtlich der Wasserzeichen-Detektierbarkeit eingegangen werden können, um höchste Audioqualitäts-Ansprüche zu erfüllen.
Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird das Wasserzeichensignal vor der Quantisierung dem Audiosignal hinzugefügt, um ein kombiniertes Signal zu erhalten. Das kombinierte Signal wird dann quantisiert und wieder invers quantisiert und mit dem ursprünglichen Audiosignal verglichen. Aus dem Vergleich wird bestimmt, ob die durch das Wasserzeichen eingeführte Störung tolerabel ist. Wird festgestellt, daß die Störung nicht tolerabel ist, so wird das Spektrum des Wasserzeichensignals iterativ unter Verwendung bestimmter Strategien gewichtet, um dann wieder eine Quantisierung und inverse Quantisierung durchzuführen, bis festgestellt wird, daß die Störung nun tolerabel ist. Das durch diese Verarbeitung erhaltene Wasserzeichen-Spektrum wird dann dem ursprünglichen Audiospektrum hinzuaddiert. Das addierte bzw. kombinierte Signal wird dann quantisiert, Entropie-codiert und mit Seiteninformationen versehen, um einen Audiobitstrom zu erhalten, in dem das Wasserzeichen vorhanden ist.
Bei einem anderen Ausführungsbeispiel der vorliegenden Erfindung wird das ursprüngliche Audiosignal quantisiert. Dem Audiosignal wird ein quantisiertes Wasserzeichen hinzuaddiert, um das kombinierte Signal zu erhalten. Das kombinierte Signal wird dann nicht mehr, wie beim ersten Ausführungsbeispiel, noch einmal quantisiert, sondern unmittelbar Entropie-codiert. Das dem quantisierten Audiosignal hinzugefügte "quantisierte" Wasserzeichensignal wird hierbei derart eingestellt, daß einerseits die Forderung nach tolerabler Störung erfüllt ist und andererseits eine erwünschte Wasserzeichen-Detektierbarkeit erreicht wird.
Unabhängig davon, ob das kombinierte Signal noch quantisiert wird, oder ob das kombinierte Signal bereits in quantisierter Form vorliegt, wird gemäß der vorliegenden Erfindung eine genaue Steuerung der durch das Wasserzeichen eingeführten Störung in das auf dem Signal erreicht.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
Fig. 1
ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal;
Fig. 2
ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Einbringen eines Wasserzeichens in ein Audiosignal gemäß einem ersten Ausführungsbeispiel;
Fig. 3
eine erfindungsgemäße Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel; und
Fig. 4a bis 4d
eine schematische Erläuterung des Linienselektions-Algorithmus beim zweiten Ausführungsbeispiel der vorliegenden Erfindung.
Die in Fig. 1 gezeigte erfindungsgemäße Vorrichtung umfaßt einen Audioeingang 10 und einen Wasserzeicheneingang 12. Sowohl das Audiosignal an dem Audioeingang 10 als auch das Wasserzeichensignal an dem Wasserzeicheneingang 12 werden mittels einer Einrichtung 14 bzw. 16 in eine spektrale Darstellung überführt. Die spektrale Darstellung des Audiosignals umfaßt Audiospektralwerte, während die spektrale Darstellung des Wasserzeichensignals Wasserzeichenspektralwerte aufweist. In einer Einrichtung 18 zum Kombinieren werden die Audiospektralwerte mit veränderten Wasserzeichen-Spektralwerten kombiniert, um an einem Ausgang 20 das kombinierte Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist. Erfindungsgemäß ist hierzu eine Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Wasserzeichensignals abhängig von einer über einen Eingang 24 gelieferten psychoakustischen Maskierungsschwelle vorgesehen. Die spektrale Darstellung des Wasserzeichensignals wird abhängig von der über den Eingang 24 erhaltenen psychoakustischen Maskierungsschwelle verarbeitet, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingeführte Störung unter einer vorbestimmten Störungsschwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt.
Hierzu umfaßt die Einrichtung 22 zum Verarbeiten der spektralen Darstellung des Wasserzeichensignals eine Einrichtung 26 zum Wählen eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt. In einer Einrichtung 28 wird eine durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführte Störung ermittelt. Hierzu werden von einer Einrichtung 30 zum Liefern von Quantisierungsinformationen Quantisierungsinformationen zugeführt. Die Einrichtung 30 liefert Quantisierungsinformationen, die von dem ursprünglichen Audiosignal, also dem Audiosignal ohne Wasserzeichen, abhängen.
In einer Einrichtung 32 wird untersucht, ob die ermittelte Störung größer als die vorbestimmte Störschwelle ist. Ist dies nicht der Fall, d. h. ist die Störung akzeptabel, so wird der Wasserzeichen-Startwert unmittelbar der Einrichtung 18 zum Kombinieren zugeführt. Ist dies dagegen der Fall, d. h. ist die eingeführte Störung zu groß, bzw. anders als gewünscht, so wird eine Einrichtung 34 zum Verändern des Wasserzeichen-Startwerts aktiviert, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Zu diesem Zweck muß die in der Einrichtung 22 zum Verarbeiten skizzierte Schleife möglicherweise mehrmals iterativ durchlaufen werden, um irgendwann am Ausgang der Einrichtung 32 einen veränderten Wasserzeichen-Startwert zu erhalten, der als verarbeitetes Wasserzeichensignal verwendet wird und der Einrichtung 18 zum Kombinieren zugeführt wird, um das Audiosignal am Ausgang 20 zu erhalten, in das das Wasserzeichen eingebettet ist.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung, das in Fig. 2 gezeigt ist, wird das Kombinieren mittels einer Addition 18 vor dem Quantisieren durchgeführt. Die Einrichtung 28 zum Ermitteln der durch den Block Wasserzeichen-Gewichtung 26 festgelegten Startwert in das Audiosignal eingeführten Störung wird dadurch ermittelt, daß zunächst in einer Quantisierer/Inversquantisierer-Einrichtung 28a das kombinierte Signal quantisiert und invers quantisiert wird. In einer Einrichtung 28b wird dann beispielsweise durch Differenzbilden und Quadrieren der Differenzwerte die durch das Wasserzeichen eingeführte Störung berechnet und dann in der Einrichtung 32 mit der psychoakustischen Maskierungsschwelle 24 verglichen. Ist die Störung zu groß, wird die Einrichtung 34, die in Fig. 2 mit "Gewichtungskontrolle" bezeichnet ist, angesteuert, um dem Block 26 veränderte Gewichtungsfaktoren zuzuführen, um dann das verändert gewichtete Wasserzeichen-Spektrum in der Einrichtung 18 mit dem ursprünglichen Audiosignal in spektraler Darstellung zu kombinieren und die Iterationsschleife von neuem zu durchlaufen.
Bei dem in Fig. 2 dargestellten Ausführungsbeispiel wird es bevorzugt, als Wasserzeichen-Startwert das mit einem für alle Spektrallinien gleich gewichteten Wasserzeichen-Spektrum zu nehmen. Der Gewichtungsfaktor für jede Spektrallinie ist daher für alle Spektrallinien gleich einer Konstanten, die so gewählt ist, daß die Wasserzeichenenergie über der Maskierungsschwelle liegt. Dann wird die Wasserzeichenenergie schrittweise reduziert, um dann die Energie des Wasserzeichens unter die Maskierungsschwelle zu "i-terieren".
Wenn also zunächst von der Einrichtung 32 festgestellt wird, daß die Störung zu groß wird, ist die Einrichtung 34 zur Kontrolle der Gewichtungsfaktoren ausgebildet, um alle Gewichtungsfaktoren zu verkleinern, z. B. zu halbieren. Wenn dann die Störung immer noch zu groß ist, könnten in einem nächsten Iterationsschritt alle aktuellen Gewichtungsfaktoren erneut halbiert werden usw. Dies kann fortgeführt werden, bis die Einrichtung 32 feststellt, daß die Störung nun in Ordnung ist.
Nachdem die Kombination von Audiosignal und verarbeitetem Wasserzeichensignal im Spektralbereich, also nicht im Quantisierungsbereich, sondern vor der Quantisierung stattfindet, muß noch eine Quantisierung durchgeführt werden. Hierzu empfiehlt es sich, den Quantisierer-Abschnitt der Einrichtung 28a zu verwenden, um die Ausgangswerte des Quantisiererabschnitts als Audiosignal samt eingebettetem Wasserzeichen auszugeben.
Mittels einer Analyse-Synthese-Iteration, wie sie in Fig. 2 gezeigt ist, wird somit die durch das Wasserzeichen nach der Quantisierung entstandene Störung bestimmt. Somit läßt sich einerseits sicherstellen, daß auch nach der Quantisierung Wasserzeichenenergie im Signal verbleibt. Andererseits kann die tatsächlich eingebrachte Störung ermittelt werden, was zur Erzielung einer hohen Audioqualität von Vorteil ist. Das spektral dargestellte Wasserzeichensignal wird somit, wie es anhand von Fig. 2 ausgeführt worden ist, mittels einer Gewichtungsfilterbank, die in dem Block 26 enthalten sein kann, spektral mit den von dem Block 34 zur Verfügung gestellten aktuellen Gewichtungsfaktoren gewichtet. Das entstehende Signal wird zu dem ursprünglichen Audiosignal addiert. Wie es ausgeführt worden ist, wird das kombinierte Signal am Ausgang der Einrichtung 18 quantisiert und invers quantisiert und ergibt das am Ausgang der Einrichtung 28a vorliegende Signal, das in die Einrichtung 28b genauso wie das ursprüngliche Audiosignal eingespeist wird. Die Einrichtung 28b vergleicht nunmehr das Originalsignal mit dem quantisierten und wieder invers quantisierten Signal und bestimmt daraus das Quantisierungs-Fehlersignal, das der Einrichtung 32 zugeführt wird. Anhand der Einrichtung 32 wird wiederum die Gewichtungskontrolle im Block 34 angesteuert, um neue bessere Gewichtungsfaktoren zu bestimmen. Hierzu steht die von dem Maskierungsmodellen ermittelte Maskierungsschwelle zur Verfügung, die angibt, wieviel Störung in das Signal an einer bestimmten Stelle im Signalspektrum "erlaubt" ist. Wenn der Block Gewichtungskontrolle 34 optimale Gewichtungsfaktoren hinsichtlich auf die gewünschte Audiosignalstörung und gewünschte Wasserzeichendetektierbarkeit, d. h. Wasserzeichenenergie, ermittelt hat, bricht das Verfahren ab. Die zuletzt von dem Block 28a ermittelten quantisierten Spektralwerte des Kombinationssignals werden dann als Resultat zum Bitstrommultiplexer weitergegeben, um dort mit den Seiteninformationen zusammen zu einem Audio-Bitstrom geformt zu werden.
Im nachfolgenden wird auf Fig. 3 eingegangen, um eine Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung darzustellen. Im Gegensatz zu dem in Fig. 2 gezeigten ersten Ausführungsbeispiel, bei dem ein nichtquantisiertes Audiosignal mit einem nicht-quantisierten Wasserzeichensignal kombiniert wird, findet diese Kombination 18 in Fig. 3 im "Quantisierungsbereich" statt, d. h. es wird ein quantisiertes Audiosignal mit einem quantisierten Wasserzeichen kombiniert. Dies kann dadurch erreicht werden, daß entweder mittels eines Quantisierers 42 durch Quantisieren des ursprünglichen Audiosignals die Quantisiererstufen berechnet werden, oder daß die Quantisierungsstufen aus einem codierten Audiosignal extrahiert werden. Ansprechend auf die durch die Einrichtung 42 bereitgestellten Quantisierungsstufen wird eine Einrichtung 40a zum Berechnen des quantisierten Audiosignals minus einer vorbestimmten Anzahl von n Quantisierungsstufen und eine Einrichtung 40b zum Berechnen des quantisierten Audiosignals plus eine vorbestimmte Anzahl von n Quantisierungsstufen betrieben.
Im Gegensatz zu dem in Fig. 2 gezeigten Ausführungsbeispiel, bei dem für jedes kombinierte Audiosignal eine Quantisierungsberechnung und eine inverse Quantisierungsberechnung durch die Einrichtung 28a durchzuführen war, und zwar innerhalb der Iterationsschleife, findet dies bei dem in Fig. 3 gezeigten zweiten Ausführungsbeispiel a-priori statt, d. h. durch eine Vorberechnung außerhalb einer Iterationsschleife. Hierzu wird zunächst als vorbestimmter Wasserzeichen-Startwert mittels einer Einrichtung 36 ein sogenanntes "maximales" Wasserzeichen berechnet. Zur Berechnung des vorbestimmten maximalen Wasserzeichens werden zunächst nur die Vorzeichen des Wasserzeichen-Spektrums verwendet. Hat das Wasserzeichen-Spektrum ein positives Vorzeichen, so wird der entsprechende Spektralwert des ursprünglichen quantisierten Audiosignals um n Quantisierungsstufen vergrößert, wobei n eine Ganzzahl größer oder gleich 1 ist. Ist das Vorzeichen eines Wasserzeichen-Spektralwerts dagegen negativ, so wird der entsprechende quantisierte Spektralwert, d. h. der Spektralwert des Audiosignals bei derselben Frequenz wie der Spektralwert des Wasserzeichensignals, dessen Vorzeichen gerade betrachtet wird, um n Quantisierungsstufen verkleinert. Hieraus ergibt sich ein maximales Wasserzeichen, wobei der Ausdruck "maximal" dahingehend zu verstehen ist, daß das maximale Wasserzeichensignal auf jede Spektrallinie des ursprünglichen Audiosignals nach der Quantisierung eine Auswirkung hat. Dieser Fall ist zwar hinsichtlich einer sehr guten Wasserzeichendetektierbarkeit wünschenswert, dürfte jedoch erfahrungsgemäß zu viel Störung in das Audiosignal einführen. Um die Störung auf ein vertretbares Maß zurückzunehmen, wobei ein vertretbares Maß beispielsweise die psychoakustische Maskierungsschwelle sein kann, wird eine Einrichtung 38, die einen Linienselektionsalgorithmus implementiert, vorgesehen. Die Einrichtung 38 ermittelt die durch das von der Einrichtung 36 zur Verfügung gestellte maximale Wasserzeichen eingeführte Störung in das Audiosignal. Falls die Störung größer als die vorbestimmte Störungsschwelle ist, wird durch die Einrichtung 38 das "maximale" Wasserzeichen durch Selektion von einzelnen Linien so lange verändert, bis die durch das Wasserzeichen eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist. Ist diese Bedingung erfüllt, wird das - bereits in quantisierter Form - vorliegende Wasserzeichen ebenso wie das quantisierte ursprüngliche Audiosignal dem Addierer 18 zugeführt, um ausgangsseitig das quantisierte Wasserzeichen-behaftete Audiosignal zu erhalten.
Im nachfolgenden wird anhand der Fig. 4a bis 4d auf die Funktion und Arbeitsweise der Einrichtung 36 und 38 eingegangen. Fig. 4a zeigt beispielshalber ein quantisiertes Audiosignal, das aufgrund der Übersichtlichkeit der Darstellung lediglich drei Spektralwerte 50a-50c darstellt. Typischerweise hat ein Audiospektrum je nach gewählter Fensterlänge und Transformation z. B. 1024 Spektralwerte. Die Anzahl der von Null verschiedenen quantisierten Spektralwerte ist abhängig davon, wie viele Audiospektralwerte auf 0 quantisiert worden sind. Selbstverständlich haben die quantisierten Audiospektralwerte im realen Fall unterschiedliche Höhen. Fig. 4b zeigt nun ein mit plus bzw. minus n Quantisierungsstufen (abhängig vom Vorzeichen der Wasserzeichen-Spektralwerte) beaufschlagtes Audiospektrum. Die dem Audiospektralwert 50a von Fig. 4a entsprechende Spektralkomponente des Wasserzeichens hat für das in Fig. 4b gezeigte Beispiel ein negatives Vorzeichen. Die Spektralkomponente des Wasserzeichens, die dem Audiospektralwert 50b von Fig. 4a entspricht, hat bei dem in Fig. 4b gezeigten Beispiel ein positives Vorzeichen, während die dritte Spektralkomponente des Wasserzeichens wiederum ein negatives Vorzeichen hatte. Der Betrag der Wasserzeichen-Spektralkomponenten spielt zunächst keine Rolle, da davon ausgegangen wird, daß eine Wasserzeichendetektion bereits dann möglich ist, wenn die quantisierten Audiospektralwerte 50a-50c durch das Wasserzeichen verändert werden. Das maximale Wasserzeichen, das durch die Einrichtung 36 von Fig. 3 bestimmt wird, ist für den in Fig. 4b gezeigten Fall in Fig. 4c dargestellt. Es hat ein Spektrum, das sich dadurch auszeichnet, daß jeder quantisierte ursprüngliche Audiospektralwert um eine Quantisierungsstufe verändert wird, und zwar entweder vergrößert, wenn das Wasserzeichen ein positives Vorzeichen hat, oder verkleinert, wenn das Wasserzeichen ein negatives Vorzeichen hatte.
Bei dem in Fig. 4b gezeigten Beispiel könnte der Betrag einer Wasserzeichen-Spektrallinie dahingehend berücksichtigt werden, daß nicht nur um eine Quantisierungsstufe inkrementiert bzw. dekrementiert wird, sondern daß um mehrere Quantisierungsstufen inkrementiert bzw. dekrementiert wird, wenn der Betrag der Wasserzeichen-Spektrallinie entsprechend groß ist.
Anhand von Fig. 4d wird nunmehr die Funktion der Einrichtung 38 von Fig. 3 beschrieben. Stellt die Einrichtung 38 fest, daß für die linke quantisierte Audiospektralkomponente die Situation so ist, daß die durch das Wasserzeichen eingeführte Störung zu groß ist, wenn die linke quantisierte Audiospektralkomponente 50a um eine Quantisierungsstufe verringert wird, wie es durch die Spektralkomponente 50a' dargestellt ist, so wird diese Spektralkomponente von der Einrichtung 38 nicht selektiert, was sich in den veränderten Wasserzeichen-Spektralwerten nach der Linienselektion so bemerkbar macht, daß das veränderte Wasserzeichen an dieser Stelle eine Spektrallinie von 0 hat. Bei der mittleren und der rechten Spektralkomponente des quantisierten Audiosignals wurde dagegen festgestellt, daß die durch die Spektrallinien 50b' und 50c' eingeführten Störungen in Ordnung waren, so daß an diesen Stellen so viel Wasserzeichenenergie zu den quantisierten Audiospektralwerten hinzugefügt werden kann, daß diese um eine Quantisierungsstufe erhöht (50b') bzw. um eine Quantisierungsstufe verringert (50c') werden können.
Aus dieser Betrachtung wird deutlich, daß durch Vorberechnung der Quantisierungsstufen durch die Einrichtungen 40a und 40b der Schritt der Quantisierung und inversen Quantisierung, d. h. die Einrichtung 28a von Fig. 2, entfallen kann, da die Größe der Störung durch Veränderung des Quantisierungs-Index a-priori vorberechnet werden kann. Ferner ist aus Fig. 3 zu sehen, daß auch die Einrichtung 26, d. h. die Gewichtung der Wasserzeichen-Spektrallinien, entfallen ist.
Die quantisierten Audio-Spektralwerte werden nunmehr anhand des Wasserzeichensignals, d. h. anhand des Vorzeichens des Wasserzeichensignals um z. B. plus oder minus eine Quantisierungsstufe verändert. Dieses Prozedere bringt Vorteile dahingehend, daß Rechenzeit eingespart werden kann, da die Quantisierung und inverse Quantisierung (Einrichtung 28a von Fig. 2) und die Gewichtung des Wasserzeichens (Einrichtung 26 von Fig. 2) ersatzlos entfallen können.
Anhand der bereits vorberechneten Audiospektren, d. h. des Originalspektrums und des Originalspektrums minus n Quantisierungsstufen oder des Original spektrums plus n Quantisierungsstufen wird linienweise das maximale Wasserzeichen (Fig. 4c) bestimmt. Dies ergibt sich als Differenz zwischen dem Originalspektrum (Fig. 4a) und dem um eine Anzahl von n Quantisierungsstufen veränderten Audiospektrum (Fig. 4b), wobei die Differenz das gleiche Vorzeichen wie das ungewichtete Wasserzeichen hat.
Der Linienselektions-Algorithmus, der in der Einrichtung 38 ausgeführt wird, berücksichtigt den Betrag der ungewichteten Wasserzeichenspektrallinien, die Maskierungsschwelle 24 und gegebenenfalls eine Bitsparkassenfunktion 44 des Audiocodierers.
Um sowohl eine gute Audioqualität als auch eine gute Wasserzeichendetektierbarkeit sicherzustellen, wird es bevorzugt, die Linien des maximalen Wasserzeichens so zu selektieren, daß das Wasserzeichen-Spreizbandsignal breitbandig eingebettet wird, d. h. daß möglichst viele Linien des quantisierten Audiosignals verändert werden. Weiterhin soll die Maskierungsschwelle oder, falls eine von der Maskierungsschwelle abweichende Schwelle verwendet wird, diese vorbestimmte Störungsschwelle nicht verletzt werden. Schließlich soll die Struktur des Wasserzeichens innerhalb eines Frequenzbandes möglichst wenig verändert werden.
Alle anderen Linien des maximalen Wasserzeichens werden nicht berücksichtigt. Dies bedeutet, daß nach der Addition des Wasserzeichens die quantisierten Audiospektralwerte der selektierten Linien um plus bzw. minus n Quantisierungsstufen verändert werden, während die quantisierten Audiospektralwerte der nicht selektierten Wasserzeichen-Linien unverändert übernommen werden.
Das quantisierte Wasserzeichen-behaftete Audiosignal am Ausgang 20 der in Fig. 3 gezeigten Vorrichtung muß nunmehr noch Entropie-codiert werden.
Abhängig von dem verwendeten Audiocodierverfahren, in das das erfindungsgemäße Konzept integriert ist, existiert eine Bitsparkassenfunktion, die späteren Signalblöcken zusätzliche Bits zur Verfügung stellen kann, wie es ausgeführt worden ist. Die Linienselektionsstrategie ist vorzugsweise an den Füllstand der Bitsparkasse angepaßt, um so beispielsweise bei gefüllter Bitsparkasse zu erlauben, daß auch quantisierte Audiospektralwerte des ursprünglichen Audiosignals, die den Wert 0 haben, mit einem Wasserzeichen beaufschlagt werden, was normalerweise aufgrund des Bitbedarfs nicht zulässig wäre. Damit kann die Wasserzeichendetektion spürbar verbessert werden.
Bei der Anwendung der kombinierten Einbettung/Codierung stehen neben den bereits quantisierten Audiospektralwerten zusätzlich die Originalwerte nach der Transformation in den Frequenzbereich zur Verfügung. Die Quantisierung der originalen Audiospektralwerte kann ebenfalls als eine Art Wasserzeicheneinbettung angesehen werden, da sowohl bei der Quantisierung als auch bei der Addition eines Wasserzeichensignals eine gewisse Störung des Audiospektrums resultiert. Die durch die Quantisierung eingebrachte Störung ist dabei aufgrund ihrer zufälligen Natur nicht als Wasserzeichen anzusehen. Wenn jedoch die eingebrachte Störung aufgrund der Quantisierung vorzeichenrichtig mit dem Wasserzeichen ist, unterstützt das Quantisierungsrauschen die Detektierbarkeit des Wasserzeichens. Hieraus ergeben sich folgende Fälle.
Durch die Quantisierung einer Audiospektrallinie wird das Wasserzeichen vorzeichenrichtig eingebracht. Hier ist die Einrichtung 38 von Fig. 3 vorzugsweise so angeordnet, daß sie aufgrund der Tatsache, daß bereits durch die Quantisierung phasenrichtig zum Wasserzeichen-Spektralwert für eine bestimmte Frequenz eine Störung eingebracht worden ist, angeordnet, um auf das Einbringen einer weiteren Wasserzeichen-Störung zu verzichten. Alternativ könnte noch eine Quantisierungsstufe hinzugefügt werden, um die Detektierbarkeit noch weiter zu verbessern.
Wenn dagegen durch die Quantisierung einer Audiospektrallinie eine Störung eingebracht wird, die das entgegengesetzte Vorzeichen hat wie das Wasserzeichensignal, was dazu führt, daß das Wasserzeichen durch die gegenläufige Quantisierung gewissermaßen verschlechtert wird, ist aufgrund der Linienselektionsstrategien, die weiter oben ausgeführt worden sind, abzuwägen, ob für diese Linie die Robustheit des Wasserzeichens gewährleistet werden muß und somit der quantisierte Audiospektralwert verändert werden muß, um das Quantisierungsrauschen gewissermaßen wieder "rückgängig" zu machen, oder ob in Hinblick auf eine bessere Audioqualität das eingebettete Wasserzeichen an dieser Stelle, d. h. das Quantisierungsrauschen an dieser Stelle, ein "falsches" Vorzeichen besitzen soll.
Wie es bereits ausgeführt worden ist, findet bei modernen Codierverfahren die Berechnung der psychoakustischen Maskierungsschwelle nicht linienweise statt, sondern skalenfaktorbandweise. Dies bedeutet, daß nicht Energien einzelner Spektrallinien betrachtet werden, sondern die Gesamtenergien z. B. 20 Spektrallinien in einem Skalenfaktorband. Es kann jedoch in einem Skalenfaktorband, in dem viele Wasserzeichen-Spektrallinien tolerierbar sind, ohne weiteres auf ein paar Linien im Sinne einer guten Audioqualität verzichtet werden, ohne daß die Wasserzeichen-Detektierbarkeit signifikant leidet. Diese Funktionalität kann auch bei dem in Fig. 2 gezeigten Ausführungsbeispiel dadurch erreicht werden, daß die Gewichtungskontrolle 34 von Fig. 2 derart ausgestaltet ist, daß nicht über der Frequenz gleiche Gewichtungsfaktoren eingesetzt werden, sondern daß unterschiedliche Gewichtungsfaktoren für verschiedene Spektralwerte eingesetzt werden, und daß insbesondere auf Gewichtungsfaktoren von 0 für einzelne Spektrallinien vorkommen. Als vorbestimmter Wasserzeichen-Startwert kann es bei dem in Fig. 2 gezeigten Ausführungsbeispiel auch von Vorteil sein, vor dem Beginn der Iteration die Wasserzeichen-Gewichtung so zu gestalten, daß sie von der psychoakustischen Maskierungsschwelle abgeleitet ist.
Zusammenfassend stellt sich das erfindungsgemäße Konzept derart dar, daß zunächst ein spektral dargestelltes Wasserzeichensignal erzeugt wird. Dies wird mittels Gewichtungsfaktoren gewichtet. Das gewichtete Signal wird zum Original-Audiosignal, das in spektraler Darstellung vorliegt, hinzuaddiert. Alternativ wird auf der Basis des Wasserzeichen-Signals eine Veränderung der Linien des Original-Audiosignals, das in spektraler Darstellung vorliegt, durchgeführt. Hierauf wird die nach der Quantisierung eingebrachte Störung bestimmt, wobei die Störung durch Quantisieren, invers Quantisieren und Differenzbildung zum Original ermittelt wird, oder wobei die Störung vorberechnet ist.
Anschließend werden neue Gewichtungsfaktoren bestimmt, wobei die Maskierungsschwelle verwendet wird, wobei eine Linienselektionsstrategie angewendet wird, oder wobei eine Linienselektionsstrategie insbesondere derart angewendet wird, daß Vorzeichen und Betrag der Spektrallinien des ungewichteten Wasserzeichens verwendet werden, und daß die Summe von Wasserzeichenlinie und Originalspektrallinie so bestimmt wird, daß diese neue Spektrallinie in ein anderes Quantisierungsintervall fällt als die ursprüngliche Spektrallinie.
Das erfindungsgemäße Konzept ist dahingehend vorteilhaft, daß es sowohl für Bitstrom-Wasserzeichen-Verfahren als auch Verfahren einsetzbar ist, die Audiocodierung und Wasserzeicheneinbettung in einem Schritt vornehmen.
Ein weiterer Vorteil des erfindungsgemäßen Konzepts besteht darin, daß eine volle Kontrolle über die eingebrachte Störung erzielbar ist. Dadurch ist es möglich, das Verfahren gezielt zugunsten optimaler Wasserzeichendetektion oder optimaler Audioqualität einzustellen.
Ein weiterer Vorteil des erfindungsgemäßen Konzepts ist eine volle Kontrolle über die frequenzmäßige Verteilung des Wasserzeichen-Spreizbandsignals in das Audiosignal.

Claims (16)

  1. Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal, mit folgenden Schritten:
    Bereitstellen (14) einer spektralen Darstellung des Audiosignals, wobei die spektrale Darstellung des Audiosignals eine Mehrzahl von Audio-Spektralwerten aufweist;
    Bereitstellen (16) einer spektralen Darstellung des Wasserzeichensignals, wobei die spektrale Darstellung des Wasserzeichensignals eine Mehrzahl von Wasserzeichen-Spektralwerten aufweist;
    Verarbeiten (22) der spektralen Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Audiosignals, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingefügte Störung unter einer vorbestimmten Störungsschwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt; und
    Kombinieren (18) des verarbeiteten Wasserzeichensignals und des Audiosignals, um ein Wasserzeichen-behaftetes Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist,
    wobei der Schritt des Verarbeitens (22) folgende Teilschritte aufweist:
    Wählen (26) eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt;
    Ermitteln (28) einer durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführten Störung; und
    falls die durch den Wasserzeichen-Spektralwert eingeführte Störung größer als die vorbestimmte Störungsschwelle ist (32), Verändern (34) des Wasserzeichen-Startwerts, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung des Audiosignals eingeführte Störung kleiner oder gleich der vorbestimmten Störungsschwelle ist, und Verwenden des veränderten Wasserzeichen-Startwerts als das verarbeitete Wasserzeichensignal.
  2. Verfahren nach Anspruch 1,
    bei dem im Teilschritt des Wählens 26 Wasserzeichen-Spektralwerte mit Start-Gewichtungsfaktoren gewichtet sind;
    bei dem im Schritt des Ermittelns (28) die mit den Start-Gewichtungsfaktoren gewichteten Wasserzeichen-Spektralwerte zu den Audiospektralwerten addiert werden, um Additions-Spektralwerte zu erhalten,
    bei dem die Additions-Spektralwerte quantisiert und anschließend invers quantisiert werden (28a), um invers quantisierte Additions-Spektralwerte zu erhalten;
    bei dem die invers quantisierten Additions-Spektralwerte mit den Audiospektralwerten verglichen werden (28b), um zu ermitteln, ob die in den Additions-Spektralwerten enthaltene Störung unter der vorbestimmten Störungsschwelle ist (32); und
    bei dem im Teilschritt des Veränderns (34) die Start-Gewichtungsfaktoren verändert werden.
  3. Verfahren nach Anspruch 2, bei dem die Start-Gewichtungsfaktoren für alle Wasserzeichenspektralwerte gleich sind und einen Betrag haben, der so gewählt ist, daß die Energie des Wasserzeichens oberhalb der psychoakustischen Maskierungsschwelle liegt.
  4. Verfahren nach Anspruch 2, bei dem die Start-Gewichtungsfaktoren durch Gewichten der Wasserzeichenspektralwerte mit der psychoakustischen Maskierungsschwelle erhalten werden, so daß die Energie der mit der psychoakustischen Maskierungsschwelle gewichteten Wasserzeichenspektralwerte an die psychoakustische Maskierungsschwelle angenähert ist und insbesondere kleiner oder gleich der psychoakustischen Maskierungsschwelle ist.
  5. Verfahren nach Anspruch 3 oder 4, bei dem die Start-Gewichtungsfaktoren im Teilschritt des Veränderns (34) pro einem Iterationsschritt verkleinert werden.
  6. Verfahren nach einem der Ansprüche 2 bis 5, bei dem der Schritt des Kombinierens (18) das Kombinieren der Spektralwerte des Audiosignals und der Spektralwerte des verarbeiteten Wasserzeichensignals und anschließend den Schritt des Quantisierens des Wasserzeichenbehafteten Audiosignals unter Verwendung von Quantisierungsstufen aufweist, die durch Quantisieren der Audiospektralwerte ohne Wasserzeichensignal unter Verwendung der psychoakustischen Maskierungsschwelle ermittelt wurden, um ein quantisiertes Wasserzeichen-behaftetes Audiosignal zu erhalten.
  7. Verfahren nach Anspruch 1,
    bei dem der Teilschritt des Wählens (26) eines Wasserzeichen-Startwerts folgende Unterschritte aufweist:
    Ermitteln (42) von Quantisierungsstufen für die Audiospektralwerte ohne das Wasserzeichensignal unter Verwendung der psychoakustischen Maskierungsschwelle (24);
    Quantisieren (42) der Audiospektralwerte unter Verwendung der ermittelten Quantisierungsstufen, um quantisierte Audiospektralwerte zu erhalten;
    Extrahieren von Vorzeichen der Wasserzeichen-Spektralwerte;
    Berechnen (36) von quantisierten Spektralwerten des Wasserzeichen-Startwerts, so daß ein quantisierter Spektralwert des Wasserzeichen-Startwerts gleich einer Anzahl von Quantisierungsstufen ist, falls das Vorzeichen des entsprechenden Spektralwerts des Wasserzeichensignals positiv ist, und daß ein quantisierter Spektralwert des Wasserzeichen-Startwerts gleich dem Negativen einer Anzahl von Quantisierungsstufen ist, falls das Vorzeichen des entsprechenden Spektralwerts des Wasserzeichensignals negativ ist; und
    bei dem der Schritt (34) des Veränderns den Schritt des Einstellens der Anzahl von Quantisierungsstufen und/oder den Schritt des Selektierens (38) von Spektrallinien des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert aufweist.
  8. Verfahren nach Anspruch 7, bei dem für quantisierte Spektralwerte des Audiosignals, die gleich 0 sind, keine Spektralwerte des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert selektiert werden.
  9. Verfahren nach Anspruch 7, bei dem eine Bitsparkassenfunktion (44) vorhanden ist, und bei dem abhängig von einer Füllung der Bitsparkasse für quantisierte Spektralwerte des Audiosignals, die gleich 0 sind, Spektralwerte des Wasserzeichen-Startwerts als veränderter Wasserzeichen-Startwert selektiert werden.
  10. Verfahren nach einem der Ansprüche 1 bis 9, bei dem der Schritt des Veränderns (34) so durchgeführt wird, daß eine möglichst große Anzahl von veränderten Wasserzeichen-Spektralwerten ungleich 0 ist.
  11. Verfahren nach einem der Ansprüche 1 bis 10,
    bei dem der Schritt des Veränderns (34) so durchgeführt wird, daß der Verlauf des veränderten Wasserzeichen-Startwerts über der Frequenz dem spektralen Verlauf des Wasserzeichen-Signals so weit als möglich entspricht.
  12. Verfahren nach einem der Ansprüche 7 bis 11,
    bei dem quantisierte Audiospektralwerte zu selektierten Wasserzeichen-Spektralwerten hinzuaddiert werden, um ein quantisiertes Wasserzeichen-behaftetes Audiosignal zu erhalten.
  13. Verfahren nach einem der vorhergehenden Ansprüche,
    bei dem der Teilschritt des Veränderns (34) abgebrochen wird, wenn die Störungsschwelle erreicht oder unterschritten ist, und wenn zugleich die Anzahl der veränderten Wasserzeichen-Spektralwerte über einer vorbestimmten Schwelle ist.
  14. Verfahren nach Anspruch 13, bei dem die vorbestimmte Energieschwelle dadurch definiert ist, daß eine vorbestimmte Anzahl von Audiospektralwerten eines Signals, das die Audiospektralwerte und die veränderten Wasserzeichen-Spektralwerte umfaßt, um zumindest eine Quantisierungsstufe gegenüber den quantisierten Spektralwerten des Audiosignals allein verändert sind.
  15. Verfahren nach einem der vorhergehenden Ansprüche,
    bei dem die psychoakustische Maskierungsschwelle (24) einen Wert pro einem Skalenfaktorband aufweist, und bei dem der Schritt des Verarbeitens (22) skalenfaktorbandweise durchgeführt wird.
  16. Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal, mit folgenden Merkmalen:
    einer Einrichtung zum Bereitstellen (14) einer spektralen Darstellung des Audiosignals, wobei die spektrale Darstellung des Audiosignals eine Mehrzahl von Audio-Spektralwerten aufweist;
    einer Einrichtung zum Bereitstellen (16) einer spektralen Darstellung des Wasserzeichensignals, wobei die spektrale Darstellung des Wasserzeichensignals eine Mehrzahl von Wasserzeichen-Spektralwerten aufweist;
    einer Einrichtung zum Verarbeiten (22) der spektralen Darstellung des Wasserzeichensignals abhängig von einer psychoakustischen Maskierungsschwelle (24) des Audiosignals, um ein verarbeitetes Wasserzeichensignal zu erhalten, so daß eine durch das verarbeitete Wasserzeichensignal in das Audiosignal eingefügte Störung unter einer vorbestimmten Störungsschwelle ist, die von der psychoakustischen Maskierungsschwelle abhängt; und
    einer Einrichtung zum Kombinieren (18) des verarbeiteten Wasserzeichensignals und des Audiosignals, um ein Wasserzeichen-behaftetes Audiosignal zu erhalten, in das das Wasserzeichen eingebettet ist,
    wobei die Einrichtung zum Verarbeiten (22) folgende Merkmale aufweist:
    eine Einrichtung zum Wählen (26) eines vorbestimmten Wasserzeichen-Startwerts, der von der spektralen Darstellung des Wasserzeichensignals abhängt;
    eine Einrichtung zum Ermitteln (28) einer durch den vorbestimmten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach einer Quantisierung der spektralen Darstellung des Audiosignals eingeführten Störung;
    eine Einrichtung (32) zum Feststellen, ob die durch den Wasserzeichen-Startwert eingeführte Störung größer als die vorbestimmte Störungsschwelle ist; und
    eine Einrichtung (34) zum Verändern der Wasserzeichen-Spektralwerte, bis die durch einen veränderten Wasserzeichen-Startwert in die spektrale Darstellung des Audiosignals nach der Quantisierung eingeführte Störung kleiner oder gleich der vorbestimmten Störschwelle ist, und zum Verwenden der veränderten Wasserzeichen-Spektralwerte als das verarbeitete Wasserzeichensignal.
EP02740586A 2001-06-18 2002-05-10 Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal Expired - Lifetime EP1382038B1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10129239 2001-06-18
DE10129239A DE10129239C1 (de) 2001-06-18 2001-06-18 Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
PCT/EP2002/005173 WO2002103695A2 (de) 2001-06-18 2002-05-10 Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal

Publications (2)

Publication Number Publication Date
EP1382038A2 EP1382038A2 (de) 2004-01-21
EP1382038B1 true EP1382038B1 (de) 2005-06-29

Family

ID=7688519

Family Applications (1)

Application Number Title Priority Date Filing Date
EP02740586A Expired - Lifetime EP1382038B1 (de) 2001-06-18 2002-05-10 Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal

Country Status (5)

Country Link
US (1) US7346514B2 (de)
EP (1) EP1382038B1 (de)
AT (1) ATE298921T1 (de)
DE (2) DE10129239C1 (de)
WO (1) WO2002103695A2 (de)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030133592A1 (en) 1996-05-07 2003-07-17 Rhoads Geoffrey B. Content objects with computer instructions steganographically encoded therein, and associated methods
US6738495B2 (en) * 1995-05-08 2004-05-18 Digimarc Corporation Watermarking enhanced to withstand anticipated corruptions
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
US7602940B2 (en) 1998-04-16 2009-10-13 Digimarc Corporation Steganographic data hiding using a device clock
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US7239981B2 (en) 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
EP2782337A3 (de) 2002-10-15 2014-11-26 Verance Corporation Media-Überwchung, Verwaltung und Informationssystem
US7352878B2 (en) * 2003-04-15 2008-04-01 Digimarc Corporation Human perceptual model applied to rendering of watermarked signals
DE10321983A1 (de) 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
JP2005084625A (ja) * 2003-09-11 2005-03-31 Music Gate Inc 電子透かし合成方法及びプログラム
US9055239B2 (en) * 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7369677B2 (en) 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US7616776B2 (en) * 2005-04-26 2009-11-10 Verance Corproation Methods and apparatus for enhancing the robustness of watermark extraction from digital host content
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
DE102004021404B4 (de) 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
DE102004021403A1 (de) 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
KR100969731B1 (ko) * 2005-12-16 2010-07-13 돌비 스웨덴 에이비 데이터의 중요도에 따라 변형된 데이터 스트림을 생성하는장치 및 그 데이터 스트림을 해석하는 장치
US7809018B2 (en) * 2005-12-16 2010-10-05 Coding Technologies Ab Apparatus for generating and interpreting a data stream with segments having specified entry points
ATE532350T1 (de) 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
US8010370B2 (en) * 2006-07-28 2011-08-30 Apple Inc. Bitrate control for perceptual coding
US8032371B2 (en) * 2006-07-28 2011-10-04 Apple Inc. Determining scale factor values in encoding audio data with AAC
EP2082527B1 (de) * 2006-10-18 2014-09-24 Destiny Software Productions Inc. Verfahren für wasserzeichen an medien-daten
EP2210252B1 (de) 2007-11-12 2017-05-24 The Nielsen Company (US), LLC Verfahren und vorrichtung für audiowasserzeichenmarkierung sowie erkennung und extraktion von wasserzeichen
US8457951B2 (en) * 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
US8359205B2 (en) * 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8666528B2 (en) 2009-05-01 2014-03-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
US8838977B2 (en) 2010-09-16 2014-09-16 Verance Corporation Watermark extraction and content screening in a networked environment
EP2544179A1 (de) * 2011-07-08 2013-01-09 Thomson Licensing Verfahren und Vorrichtung zur Quantisierindexmodulation zur Wasserzeichenmarkierung eines Eingangssignals
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9225310B1 (en) * 2012-11-08 2015-12-29 iZotope, Inc. Audio limiter system and method
US9262793B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
EP2881941A1 (de) * 2013-12-09 2015-06-10 Thomson Licensing Verfahren und Vorrichtung zur Wassermarkierung eines Audiosignals
WO2015138798A1 (en) 2014-03-13 2015-09-17 Verance Corporation Interactive content acquisition using embedded codes
CN105244033B (zh) * 2014-07-09 2019-07-16 意法半导体亚太私人有限公司 用于数字水印的系统和方法
US10043527B1 (en) 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
KR102021739B1 (ko) * 2018-06-04 2019-11-05 채령 양자암호키로 생성한 암호화 제품정보 데이터와 해시함수 2차 행렬 (x,y) 좌표 값으로 마킹하는 복제 위변조 방지 양자암호마킹기 및 양자암호마킹 물품관리 시스템
CN113035213B (zh) * 2020-12-24 2022-07-22 中国电影科学技术研究所 数字音频水印检测方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5319735A (en) * 1991-12-17 1994-06-07 Bolt Beranek And Newman Inc. Embedded signalling
AT410047B (de) * 1994-03-31 2003-01-27 Arbitron Co Vorrichtung und verfahren zum einfügen von kodes in audiosignale und zum dekodieren
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
EP0875107B1 (de) * 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
JP4226687B2 (ja) 1998-05-01 2009-02-18 ユナイテッド・モジュール・コーポレーション 電子透かし埋め込み装置及びオーディオ符号化装置
JP2000209097A (ja) 1999-01-14 2000-07-28 Sony Corp 信号処理装置とその方法、信号記録装置、信号再生装置および記録媒体
DE19906512C2 (de) * 1999-02-17 2001-01-25 Frank Kurth Verfahren zum unbemerkten Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals
DE19938095A1 (de) 1999-08-12 2001-03-01 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in ein Audiosignal und Verfahren und Vorrichtung zum Ermitteln von in einem Audiosignal eingebrachten Informationen
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
JP3905473B2 (ja) 2000-06-08 2007-04-18 マークエニー・インコーポレイテッド デジタルオーディオコンテンツ著作権の保護及びコピー防止のための電子透かしの埋込み/抽出方法、及びこれを用いた装置
EP1310099B1 (de) * 2000-08-16 2005-11-02 Dolby Laboratories Licensing Corporation Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information

Also Published As

Publication number Publication date
WO2002103695A3 (de) 2003-05-22
US7346514B2 (en) 2008-03-18
WO2002103695A2 (de) 2002-12-27
DE50203511D1 (de) 2005-08-04
US20040184369A1 (en) 2004-09-23
ATE298921T1 (de) 2005-07-15
DE10129239C1 (de) 2002-10-31
EP1382038A2 (de) 2004-01-21

Similar Documents

Publication Publication Date Title
EP1382038B1 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens in ein audiosignal
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
EP1687810B1 (de) Vorrichtung und verfahren zum ermitteln einer quantisierer-schrittweite
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE60313332T2 (de) Audiocodierung mit niedriger bitrate
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
EP1112621B1 (de) Vorrichtung und verfahren zum entropie-codieren von informationswörtern und vorrichtung und verfahren zum decodieren von entropie-codierten informationswörtern
DE102004009954B4 (de) Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
EP1212857B1 (de) Verfahren und vorrichtung zum einbringen von informationen in einen datenstrom sowie verfahren und vorrichtung zum codieren eines audiosignals
EP1464046B1 (de) Skalierbarer codierer und decodierer für einen skalierten datenstrom
EP3544003B1 (de) Vorrichtung und verfahren zum ermitteln eines schätzwerts
WO1998003036A1 (de) Verfahren zum codieren und decodieren von stereoaudiospektralwerten
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten
DE602004009926T2 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
DE69823458T2 (de) Mehrband-Sprachdecoder
EP1277346B1 (de) Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales
DE102004007191B3 (de) Audiocodierung
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE602004006401T2 (de) Aktualisieren eines verborgenen datenkanals
DE19906512C2 (de) Verfahren zum unbemerkten Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals
DE10065363B4 (de) Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals
DE69914345T2 (de) Tandemaudiokompression
EP1030290A2 (de) Verfahren zum unbemerkten übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20031118

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

RIN1 Information on inventor provided before grant (corrected)

Inventor name: SIEBENHAAR, FRANK

Inventor name: KULESSA, RALPH

Inventor name: HERRE, JUERGEN

Inventor name: NEUBAUER, CHRISTIAN

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20050629

Ref country code: IE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REF Corresponds to:

Ref document number: 50203511

Country of ref document: DE

Date of ref document: 20050804

Kind code of ref document: P

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: GERMAN

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050929

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050929

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20051010

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20050919

REG Reference to a national code

Ref country code: SE

Ref legal event code: TRGR

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20051207

REG Reference to a national code

Ref country code: IE

Ref legal event code: FD4D

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060531

26N No opposition filed

Effective date: 20060330

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060510

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20050629

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 15

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 16

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 17

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 20210519

Year of fee payment: 20

Ref country code: FR

Payment date: 20210521

Year of fee payment: 20

Ref country code: DE

Payment date: 20210525

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: BE

Payment date: 20210519

Year of fee payment: 20

Ref country code: AT

Payment date: 20210518

Year of fee payment: 20

Ref country code: SE

Payment date: 20210521

Year of fee payment: 20

Ref country code: CH

Payment date: 20210525

Year of fee payment: 20

Ref country code: GB

Payment date: 20210526

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 50203511

Country of ref document: DE

REG Reference to a national code

Ref country code: NL

Ref legal event code: MK

Effective date: 20220509

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: BE

Ref legal event code: MK

Effective date: 20220510

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20220509

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK07

Ref document number: 298921

Country of ref document: AT

Kind code of ref document: T

Effective date: 20220510

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20220509