DE60320546T2 - Kennzeichnung von zeitbereichen mit wasserzeichen bei multimediasignalen - Google Patents

Kennzeichnung von zeitbereichen mit wasserzeichen bei multimediasignalen Download PDF

Info

Publication number
DE60320546T2
DE60320546T2 DE60320546T DE60320546T DE60320546T2 DE 60320546 T2 DE60320546 T2 DE 60320546T2 DE 60320546 T DE60320546 T DE 60320546T DE 60320546 T DE60320546 T DE 60320546T DE 60320546 T2 DE60320546 T2 DE 60320546T2
Authority
DE
Germany
Prior art keywords
signal
watermark
sequence
values
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60320546T
Other languages
English (en)
Other versions
DE60320546D1 (de
Inventor
Aweke N. Lemma
Javier F. Aprea
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE60320546D1 publication Critical patent/DE60320546D1/de
Application granted granted Critical
Publication of DE60320546T2 publication Critical patent/DE60320546T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computer Security & Cryptography (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Television Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf eine Anordnung und ein Verfahren zum Codieren und Decodieren von Information in Multimediasignalen, wie Audio-, Video- oder Datensignalen.
  • Wasserzeichenmarkierung bei Multimediasignalen ist eine Technik zur Übertragung zusätzlicher Daten zusammen mit dem Multimediasignal. So können beispielsweise Wasserzeichenmarkierungstechniken angewandt werden um Copyright- und Copycontrol-Information in Audiosignale einzubetten.
  • Die Hauptanforderung eines Wasserzeichenmarkierungsschemas ist, dass dies nicht wahrnehmbar ist (d. h. im Falle eines Audiosignals soll es nicht hörbar sein), während es gegen Angriffe zum Entfernen des Wasserzeichens aus dem Signal beständig sein soll (so soll beispielsweise Entfernung des Wasserzeichens das Signal beschädigen). Es dürfte einleuchten, dass die Beständigkeit eines Wasserzeichens normalerweise ein Kompromiss der Qualität des Signals ist, in das das Wasserzeichen eingebettet ist. Wenn beispielsweise ein Wasserzeichen in ein Audiosignal stark eingebettet ist (und folglich schwer zu entfernen ist), ist es wahrscheinlich, dass die Qualität des Audiosignals reduziert wird.
  • Es wurden bereits viele Typen von Audio-Wasserzeichenmarkierungsschemen vorgeschlagen, mit je ihren eigenen Vorteilen und Nachteilen. So ist beispielsweise ein Typ eines Audio-Wasserzeichenmarkierungsschemas die Verwendung zeitlicher Korrelationstechniken zum Einbetten der gewünschten Daten (beispielsweise Copyright-Information) in das Audiosignal. Diese Technik ist im Endeffekt ein Echoversteckalgorithmus, wobei die Stärke des Echos durch Lösung einer quadratischen Gleichung ermittelt wird. Die quadratische Gleichung wird durch Autokorrelationswerte an zwei Stellen erzeugt: eine bei einer Verzögerung gleiche τ, und eine bei einer Verzögerung gleich 0. In einem derartigen Schema ist, wenn Echos des Audiosignals zu dem ursprünglichen Audiosignal hinzugefügt werden, das resultierende Signal im Wesentlichen eine amplituden- und eine phasenmodulierte Version des ursprünglichen Audiosignals. Beim Detektor wird das Wasserzeichen dadurch extrahiert, dass das Verhältnis der Autokorrelationsfunktion an den zwei Verzögerungsstellen ermittelt wird.
  • Diese Korrelationstechnik hat eine Anzahl Nachteile. So ist es beispielsweise nur dann möglich, das Wasserzeichen einzubetten, wenn die resultierende quadratische Gleichung echte Wurzeln hat, und dies folglich die Robustheit für eine bestimmte Audioqualität reduziert (die Fähigkeit des Wasserzeichens, Angriffe zu bestehen). Weiterhin ist die Leistung des Korrelationsalgorithmus von dem Wert der Verzögerung τ und der Charakteristiken des ursprünglichen Signals abhängig. Dies ist ein wesentlicher Nachteil.
  • Es sind auch Wasserzeichenmarkierungsschemen bekannt auf Basis der Amplitudenmodulation von DFT-Koeffizienten ("Discrete Fourier Transform"). Da derartige Schemen die Berechnung von DFTen beim Codierer sowie beim Decoder erfordern, neigt die resultierende Hardware zum Implementieren derartiger DFT Schemen dazu, relativ komplex zu sein, und folglich neigt das Schema dazu, langsam und kostspielig zu sein. Weiterhin können Wasserzeichen nicht auf befriedigende Art und Weise in Audiosegmente eingebettet werden, die dürftige Frequenzcharakteristiken haben, und folglich funktioniert das DFT Schema bei bestimmten Musikarten nicht einwandfrei.
  • WO 00/00969 beschreibt eine alternative Technik zum Einbetten oder Codieren von Hilfssignalen (wie Copyright Information) in einen Multimediagastgeber- oder Multimediaumhüllungssignal. Eine Replik des Umhüllungssignals oder eines Teils des Umhüllungssignals in einem bestimmten Bereich (Zeit, Frequenz oder Sprache), wird entsprechend einem Stego-Schlüssel erzeugt, der Modifikationswerte an den Parametern des Umhüllungssignals spezifiziert. Das Repliksignal wird danach durch ein Hilfssignal modifiziert, entsprechend der einzubettenden Information, und in das Umhüllungssignal zurück eingeführt um das Stego-Signal zu bilden.
  • Beim Decoder wird zum Extrahieren der ursprünglichen Hilfsdaten eine Replik des Stego-Signals auf dieselbe Art und weise erzeugt, wie die Replik des ursprünglichen Umhüllungssignals, und erfordert die Verwendung desselben Stego-Schlüssels. Die resultierende Replik wird danach mit dem empfangenen Stego-Signal korreliert, und zwar zum Extrahieren des Hilfssignals. Das Extrahieren des Hilfssignals ist auf diese Weise relativ komplex, und erfordert den Stego-Schlüssel beim Codierer (oder beim Einbetter) und beim Decoder (oder Detektor). Außerdem ist eine brutale Kraftsuche zum Synchronisieren mit dem Hilfssignal bei Detektor erforderlich.
  • Weiterhin ist die Leistung der Nutzlastextraktion davon abhängig, wie gut das Hilfssignal geschätzt werden kann. In einem System mit einer hohen erwarteten Fehlerrate der Nutzlastbits in dem Hilfssignal lässt sich dies nur schwer erreichen. Lösungen wür den zu sehr komplexen Fehlerkorrekturverfahren führen, oder die Informationskapazität wesentlich beschränken.
  • Der Artikel von Michiel van der Veen u. a.: "Robust, Multi-Functional and High-Quality audio Watermarking Technology", präsentiert bei der 110. AES Konvention vom 12. bis zum 15. Mai 2001, beschreibt eine Wasserzeichenmarkierungstechnologie unter Verwendung einer kreisförmig verschobenen Version einer Folge von Werten zu den betreffenden Werten an den entsprechenden Positionen der nicht verschobenen Folge.
  • Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung, wie in den Ansprüchen 1, 8, 9, 11, 12 beansprucht, ein Wasserzeichenmarkierungsschema zu schaffen, das im Wesentlichen wenigstens eines der bekannten Probleme Rist.
  • In einem ersten Aspekt schafft die vorliegende Erfindung ein Verfahren zum Erzeugen eines Wasserzeichensignals zum Einbetten in ein Multimediasignal, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst:
    • (a) das Erzeugen zweier Folgen von Werten, wobei die zweite Folge eine kreisförmig verschobene Version der ersten Folge ist;
    • (b) das Erzeugen eines Wasserzeichensignals durch Addierung der Werte der ersten Folge zu den betreffenden Werten an den entsprechenden Stellen der zweiten Folge.
  • Vorzugsweise wird jeder Wert der ersten und der zweiten Folge durch einen Impuls einer bevorzugten Breite Ts zum Bilden von Rechtecksignalen.
  • Vorzugsweise wird in dem Schritt (a) eine Fensterformfunktion angewandt um jedes Signal der Rechtecksignale in betreffende allmählich variierende Signale umzuwandeln, wobei die resultierenden allmählich variierenden Signale in dem Schritt (b) zum Bilden des Wasserzeichensignals addiert werden.
  • Vorzugsweise wird jede der genannten Folgen von Werten mit einer Fensterformfunktion mit einer Breite von wenigstens Ts gefaltet, und zwar zum Erzeugen zweier allmählich variierender Signale, wobei diese variierenden Signale in dem Schritt (b) zusammenaddiert werden, und zwar zum Bilden des Wasserzeichensignals.
  • Vorzugsweise hat die genannte Fensterformfunktion ein bandbegrenztes Frequenzverhalten und ein glattes zeitliches Verhalten.
  • Vorzugsweise hat die genannte Fensterformfunktion ein symmetrisches oder antisymmetrisches zeitliches Verhalten.
  • Vorzugsweise umfasst die Fensterformfunktion wenigstens eine erhöhte Kosinusfunktion oder eine Doppelphasenfunktion.
  • Vorzugsweise wird das Wasserzeichensignal durch die Addition der zwei allmählich variierenden Signale mit einer relativen Verzögerung von Tr erzeugt, wobei Tr < Ts.
  • Vorzugsweise wird Tr derart gewählt, dass maximale Amplitudenpunkte des ersten allmählich variierenden Signals mit Nulldurchgängen des zweiten allmählich variierenden Signals zusammenfallen, und umgekehrt.
  • Vorzugsweise hat das genannte Wasserzeichensignal eine Nutzlast, die in der Kombination der genannten zwei Folgen von Werten codiert ist.
  • In einem anderen Aspekt schafft die vorliegende Erfindung eine Anordnung, vorgesehen zum Erzeugen eines Wasserzeichensignals zum Einbetten in ein Multimediasignal, wobei diese Anordnung Folgendes umfasst:
    • (a) einen Folgengenerator, vorgesehen zum Verwenden einer ersten Folge von Werten zum Erzeugen einer zweiten Folge von Werten, wobei die zweite Folge eine kreisförmig verschobene Version der ersten Folge ist; und
    • (b) einen Signalgenerator, vorgesehen zum Erzeugen eines Wasserzeichensignals durch Addition der Werte der ersten Folge zu den betreffenden Werten an entsprechenden Stellen der zweiten Folge.
  • Vorzugsweise umfasst die Anordnung weiterhin einen Signalverbesserer, vorgesehen zum Umwandeln jeder Folge von Werten in ein allmählich variierendes Signal.
  • Vorzugsweise ist die Anordnung vorgesehen zum Erzeugen der genannten ersten Folge von Werten durch kreisförmige Verschiebung einer ersten Folge von Werten.
  • In einem weiteren Aspekt schafft die vorliegende Erfindung ein Verfahren zum Einbetten eines Wasserzeichens in ein Multimediasignal, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst:
    • (a) das Erzeugen eines Wasserzeichensignals entsprechend der Summe zweier Folgen von Werten, wobei die zweite Folge eine kreisförmig verschobene Version der ersten Folge von Werten ist;
    • (b) das Erzeugen eines Gastgebers, der das Multimediasignal als ein Produkt des Wasserzeichensignals und des Multimediasignals modifiziert;
    • (c) das Erzeugen eines mit einem Wasserzeichen versehenen Multimediasignals durch Ad dierung einer skalierten Version des den genannten Gastgeber modifizierenden Multimediasignals zu dem Multimediasignal.
  • Vorzugsweise wird die genannte skalierte Version des den Gastgeber modifizierenden Signals durch Steuerung des Skalierungsfaktors durch eine vorbestimmte Kostenfunktion erzeugt.
  • Vorzugsweise umfasst die genannte Kostenfunktion mehrere Skalierungsfaktoren, wobei jeder Skalierungsfaktor für ein oder mehrere Frequenzbänder der vielen Frequenzbänder in dem Multimediasignal einzeln definiert wird.
  • Vorzugsweise werden die genannten Frequenzbänder entsprechend einem Modell des menschlichen Hör- und/oder Sehsystems bestimmt.
  • Vorzugsweise wird in dem Schritt (b) das genannte den Gastgeber modifizierende Multimediasignal durch Multiplikation des genannten Wasserzeichensignals mit einem extrahierten Teil des Multimediasignals erzeugt.
  • Vorzugsweise wird der genannte extrahierte Teil des Multimediasignals durch Filterung wenigstens eines Teils des Multimediasignals gegenüber wenigstens der Frequenz, dem Raum oder der Zeit erhalten.
  • Das Verfahren umfasst weiterhin vorzugsweise die nachfolgenden Schritte:
    • (d) das Erzeugen eines zweiten Wasserzeichensignals gleich der Summe einer dritten und einer vierten Folge von Werten, wobei die vierte Folge eine kreisförmig verschobene Version der dritten Folge von Werten ist;
    • (e) das Extrahieren eines zweiten Teils des Multimediasignals, wobei der zweite Teil derart gefiltert wird, dass dieser den genannten ersten Teil nicht überlappt;
    • (f) das Erzeugen eines mit einem Wasserzeichen versehenen Multimediasignals durch Addierung des Produktes des zweiten Wasserzeichensignals und des zweiten extrahierten Teils des Multimediasignals zu dem mit einem Wasserzeichen versehenen Multimediasignal.
  • In einem anderen Aspekt schafft die vorliegende Erfindung eine Anordnung, vorgesehen zum Einbetten eines Wasserzeichensignals in ein Multimediasignal, wobei die Anordnung Folgendes umfasst:
    • (a) einen Wasserzeichengenerator zum Erzeugen eines Signals, gleich der Summe zweier Folgen von Werten, wobei die zweite Folge eine kreisförmig verschobene Version der ersten Folge von Werten ist;
    • (b) einen Ausgangssignalgenerator, vorgesehen zum Erzeugen eines mit einem Wasserzei chen versehenen Multimediasignals durch Addierung des Produktes des Wasserzeichensignals und des Multimediasignals zu dem Multimediasignal.
  • Vorzugsweise umfasst die Anordnung weiterhin einen Signalextrahierer, vorgesehen zum Extrahieren eines ersten Teils des Multimediasignals.
  • In einem weiteren Aspekt schafft die vorliegende Erfindung ein Multimediasignal mit einem Wasserzeichen, wobei das ursprüngliche Multimediasignal durch Modifikation der zeitlichen Umhüllenden des ursprünglichen Signals durch das Wasserzeichen mit einem Wasserzeichen versehen wird, wobei das Wasserzeichen die Summe einer ersten und einer zweiten Folge von Werten umfasst, wobei die zweite Folge eine kreisförmig verschobene Version der ersten Folge ist.
  • In einem anderen Aspekt schafft die vorliegende Erfindung ein Verfahren zum Detektieren eines in ein Multimediasignal eingebetteten Wasserzeichensignals, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst:
    • (a) das Empfangen eines Multimediasignals, das möglicherweise durch ein Wasserzeichensignal, das die zeitliche Umhüllende des Gastgebermultimediasignals modifiziert, mit einem Wasserzeichen versehen wird;
    • (b) das Extrahieren einer Schätzung des Wasserzeichens aus dem genannten empfangenen Signal; und
    • (c) das Korrelieren der Schätzung des Wasserzeichens mit einer Bezugsversion des Wasserzeichens um zu ermitteln, ob das empfangene Signal mit einem Wasserzeichen versehen war.
  • Vorzugsweise hat das Wasserzeichensignal eine Nutzlast, und das Verfahren umfasst weiterhin den Verfahrensschritt der Ermittlung der Netzlast des Wasserzeichens.
  • In einem weiteren Aspekt schafft die vorliegende Erfindung eine Wasserzeichendetektoranordnung, vorgesehen um zu detektieren, ob ein Wasserzeichensignal in ein Multimediasignal eingebettet ist, wobei der Wasserzeichendetektor Folgendes umfasst:
    • (a) einen Empfänger, vorgesehen zum Empfangen eines Multimediasignals, das möglicherweise durch ein Wasserzeichensignal, das die zeitliche Umhüllende des Gastgebermultimediasignals modifiziert, mit einem Wasserzeichen versehen ist;
    • (b) einen Extrahierer, vorgesehen zum Extrahieren einer Schätzung des Wasserzeichens aus dem genannten empfangenen Signal; und
    • (c) einen Korrelator, vorgesehen zum Korrelieren der Schätzung des Wasserzeichens mit einer Bezugsversion des Wasserzeichens um zu ermitteln, ob das empfangene Signal mit einem Wasserzeichen versehen war.
  • Vorzugsweise umfasst die Anordnung weiterhin einen Nutzlastdetektor, vorgesehen um zu ermitteln, ob eine Nutzlast in dem genannten Wasserzeichen vorhanden ist und um den Wert der genannten Nutzlast zu ermitteln.
  • Zum besseren Verständnis der vorliegenden Erfindung und zu zeigen, wie Ausführungsformen derselben effektuiert werden können, sei nachstehend beispielsweise auf die beiliegende Zeichnung verwiesen.
  • Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 eine schematische Darstellung einer Wasserzeicheneinbettungsanordnung nach einer Ausführungsform der vorliegenden Erfindung,
  • 2 ein Signalteilextraktionsfilter H, verwendet in einer bevorzugten Ausführungsform,
  • 3a und 3b die typische Amplitudenreaktion bzw. Phasenreaktion als eine Funktion der Frequenz des in 2 verwendeten Filters H,
  • 4 eine Darstellung der Nutzlasteinbettungs- und Wasserzeichenkonditionierungsstufe,
  • 5 eine schematische Darstellung der Einzelheiten der Wasserzeichenkonditionierungsanordnung Hc nach 4 mit Tabellen der assoziierten Signale in jeder Stufe,
  • 6a und 6b zwei bevorzugte alternative Fensterformfunktionen s(n) in Form einer gesteigerten Kosinusfunktion bzw. einer Doppelphasenfunktion,
  • 7a und 7b die Frequenzspektren für eine Wasserzeichenfolge, konditioniert mit einer gesteigerten Kosinusformfensterfunktion bzw. einer Doppelphasenformfensterfunktion,
  • 8 eine schematische Darstellung eines Wasserzeichendetektors nach einer Ausführungsform der vorliegenden Erfindung,
  • 9 eine schematische Darstellung des Whitening Filters Hw nach 8 zur Verwendung im Zusammenhang mit einer gesteigerten Kosinusformfensterfunktion,
  • 10 eine schematische Darstellung des Whitening Filters Hw nach 8 zur Verwendung im Zusammenhang mit einer Doppelphasenfensterformfunktion; und
  • 11 eine typische Form der Korrelationsfunktion, ausgeliefert von dem Korrelator des Wasserzeichendetektors aus 8.
  • 1 zeigt ein Blockschaltbild der Anordnung, erforderlich zum Durchführen der digitalen Signalverarbeitung zum Einbetten eines Mehrbit-Nutzlast-Wasserzeichens wc in ein Gastgebersignal x entsprechend einer bevorzugten Ausführungsform der vorliegenden Erfindung.
  • An einem Eingang 12 der Anordnung wird ein Gastgebersignal x geliefert. Das Gastgebersignal x wird über den Addierer 22 in der Richtung des Ausgangs 14 befördert. Eine Replik des Gastgebersignals x (Eingang 8) wird aber in der Richtung des Multiplizierers 18 abgespaltet, und zwar zum Tragen der Wasserzeicheninformation.
  • Das Wasserzeichensignal wc wird von der Nutzlasteinbettungs- und der Wasserzeichenkonditionierungsanordnung 6 erhalten und von der Wasserzeichenzufallsfolge ws (Eingang 4) abgeleitet, wobei dieser Eingang der Eingang zu der Nutzlasteinbettungs- und Wasserzeichenkonditionierungsanordnung ist. Der Multiplizierer 18 wird benutzt zum Berechnen des Produktes aus dem Wasserzeichensignal wc und dem Replikaudiosignal x. Das resultierende Produkt wcx wird danach über einen Verstärkungscontroller 24 dem Addierer 22 zugeführt. Der Verstärkungscontroller 24 wird zum verstärken oder Dampfen des Signals um einen Verstärkungsfaktor α verwendet.
  • Der Verstärkungsfaktor α steuert das Kompromiss zwischen der Hörbarkeit und der Robustheit des Wasserzeichens. Es kann eine Konstante sein, oder variabel in wenigstens Zeit, Frequenz oder Raum. Die Anordnung nach 1 zeigt, dass, wenn α variabel ist, dies automatisch über eine Signalanalyseneinheit 26 auf Basis der Eigenschaften des Gastgebersignals x angepasst werden kann. Vorzugsweise wird die Verstärkung α automatisch angepasst, und zwar zum Minimieren des Einflusses auf die Signalqualität entsprechend einer auf geeignete Weise gewählten Wahrnehmungskostenfunktion, wie eines psychoakustischen Modells des menschlichen Hörsystems. Ein derartiges Modell ist beispielsweise in der Veröffentlichung von E. Zwicker: "Audio Engineering and Psychoacoustics: Matching signals to the final receiver, the Human Auditory System", "Journal of the Audio Engineering Society", Heft 39, Seiten Heft 115-126, März 1991 beschrieben worden.
  • Nachstehend wird beispielsweise ein Audio-Wasserzeichen verwendet zum beschreiben dieser Ausführungsform der vorliegenden Erfindung.
  • Das resultierende Wasserzeichen-Audiosignal y wird dabei an dem Ausgang 14 der Einbettungsanordnung 10 durch Addierung einer auf geeignete Art und Weise skalierten Version des Produktes von wc und x zu dem Gastgebersignal erhalten: y[n] = x[n] + αwc[n]x[n] (1)
  • Vorzugsweise wird das Wasserzeichen wc derart gewählt, dass es, wenn mit x multipliziert, vorwiegend die Kurzzeitumhüllende von x modifiziert.
  • 2 zeigt eine bevorzugte Ausführungsform, wobei das Eingangssignal 8 zu dem Multiplizierer 18 in 1 unter Verwendung des Filters H in der Filtereinheit 15 durch Filterung der Replik des Gastgebersignals x erhalten wird. Wenn das Ausgangssignal des Filters durch xb bezeichnet wird, wird nach dieser bevorzugten Ausführungsform des mit einem Wasserzeichen versehene Signal durch Addierung einer auf geeignete Art und Weise skalierten Version des Produktes von xb und dem Wasserzeichen wc zu dem Gastgebersignal erzeugt.
  • Wenn nun vorausgesetzt wird, dass x b derart definiert wird, dass x b = x – xb ist und dass yb derart definiert wird, dass y = yb + x b ist, kann das mit einem Wasserzeichen versehene Signal y wie folgt geschrieben werden: y[n] = (1 + wc[n])xb[n] + x b[n] (2)und der umhüllende modulierte Teil yb des mit einem Wasserzeichen versehenen Signals y wird wie folgt gegeben: yb[n] = (1 + wc[n])xb[n] (3)
  • Vorzugsweise, wie in 3 dargestellt, ist das Filter H ein Bandpassfilter linearer Phase, gekennzeichnet durch die untere Grenzfrequenz fL und die obere Grenzfrequenz fH. Wie in 3b ersichtlich, hat das Filter H einen linearen Phasengang gegenüber der Frequenz f in dem Durchlassband (BW). Auf diese Weise sind, wenn H ein Bandpassfilter ist, xb und x b der Anteil innerhalb des Bandes, bzw. der Anteil außerhalb des Bandes des Gastgebersignals. Zur optimalen Leistung wird bevorzugt, dass die Signale xb und x b phasengleich sind. Dies wird durch eine geeignete Kompensation der durch das Filter H verursachten Phasenverzerrung erreicht.
  • In 4 sind die Einzelheiten der Nutzlasteinbettungs- und Wasserzeichenkonditionierungseinheit 6 dargestellt. In dieser Einheit wird das Wasserzeichensamensignal ws in ein Mehrbit-Wasserzeichensignal wc umgesetzt.
  • Erstens wird eine endliche Länge, vorzugsweise eine Null mittlere und einheitlich verteilte Zufallsfolge ws erzeugt, und zwar unter Verwendung eines Zufallszahlgenerators mit einem Anfangssamen S. Wie nachstehend noch einleuchten dürfte, wird bevorzugt, dass dieser Anfangssamen S der Einbettungsanordnung sowie dem Detektor bekannt ist, so dass eine Kopie des Wasserzeichensignals bei dem Detektor für Vergleichszwecke erzeugt werden kann. Dies führt zu der Folge mit der Länge Lw ws[k] ∊ [–1, 1], for k = 0, 1, 2, ..., Lw – 1 (4)
  • Danach wird die Folge ws kreisförmig verschoben, und zwar um den Betrag d1 und d2, und zwar unter Verwendung der Kreisverschiebungseinheiten 30, zum Erhalten der Zufallsfolgen wd1 bzw. wd2. Es dürfte einleuchten, dass diese zwei Folgen (wd1 und wd2 im Endeffekt eine erste Folge und eine zweite Folge sind, wobei die zweite Folge gegenüber der ersten kreisförmig verschoben wurde. Jede Folge wdi, wobei 1 = 1, 2 ist, wird daraufhin mit einem betreffenden Vorzeichenbit ri multipliziert, und zwar in der Multipliziereinheit 40, wobei ri = +1 oder –1 ist, wobei die betreffenden Werte r1 und r2 nach wie vor konstant sind, und nur ändern, wenn die Nutzlast des Wasserzeichens geändert wird. Jede Folge wird danach mit Hilfe der in 4 dargestellten Wasserzeichenkonditionierungsschaltung 20 in ein periodisches, langsam variierendes Schmalbandsignal wi mit der Länge LwTs umgesetzt. Zum Schluss werden die langsam ändernden Schmalbandsignale w1 und w2 mit einer relativen Verzögerung Tr (wobei Tr < Ts) addiert um das Mehrbit-Nutzlast-Wasserzeichensignal wc zu geben. Dies wird dadurch erreicht, dass zunächst das Signal w2 um den Betrag Tr verzögert wird, und zwar unter Verwendung der Verzögerungseinheit 45, und dass danach dieser Wert mit Hilfe der Addiereinheit 50 zu w1 addiert wird.
  • 5 zeigt detailliert die Wasserzeichenkonditionierungsanordnung 20, die in der Nutzlasteinbettungs- und Wasserzeichenkonditionierungsanordnung 6 verwendet wird. Die Wasserzeichenzufallsfolge ws wird der Konditionierungsanordnung 20 zugeführt.
  • Der Bequemlichkeit halber ist die Modifikation nur einer der Folgen Wdi in 5 dargestellt, es dürfte aber einleuchten, dass jede der Folgen auf gleiche Weise modifiziert wird, wobei die Ergebnisse zum Erhalten des Wasserzeichensignals wc addiert werden.
  • Wie in 5 dargestellt, wird jede Wasserzeichensignalfolge wdi[k], i = 1, 2 dem Eingang eines Abtastwertrepeaters 180 zugeführt. Die Tabelle 181 zeigt eine der möglichen Folgen wdi als eine Folge von Werten von Zufallszahlen zwischen +1 und –1, wobei die Folge die Länge Lw hat. Der Abtastwertrepeater wiederholt jeden Wert innerhalb der Wasserzeichenzufallsfolge Ts-mal, und zwar zum Erzeugen eines Rechteckimpulssignals. Ts wird als die Wasserzeichensymbolperiode bezeichnet und stellt den Bereich des Wasserzeichensymbols in dem Audiosignal dar. Die Tabelle 183 zeigt die Ergebnisse des in der Tabelle 181 dargestellten Signals, wenn dies einmal durch den Abtastwertrepeater 180 gegangen ist.
  • Eine Fensterformfunktion s[n], wie ein gesteigertes Kosinusfenster, wird danach angewandt um die von wd1 und wd2 hergeleiteten Rechtecksignale in langsam variierende Signale w1[n] bzw. w2[n] umzusetzen.
  • Die Tabelle 184 zeigt eine Graphik 184 eine typische gesteigerte Kosinusfensterformfunktion, die auch von der Periode Ts ist.
  • Die erzeugten Signale w1[n] and w2[n] werden danach mit einer relativen Verzögerung Tr (wobei Tr < Ts) addiert um das Mehrbit Nutzlast-Wasserzeichensignal wc[n] zu geben, d. h.: wc[n] = w1[n] + w2[n – Tr] (5)
  • Der Wert von Tr wird derart gewählt, dass die Nulldurchgänge von wi den maximalen Amplitudenstellen von w2 und umgekehrt entsprechen. Auf diese Weise ist für eine gesteigerte Kosinusfensterformfunktion Tr = Ts/2, und für eine Doppelphasenfensterformfunktion Tr = Ts/4. Für andere Fensterformfunktionen sind andere Werte von Tr möglich.
  • Wie durch die nachfolgende Beschreibung einleuchten durfte, wird während der Detektion das mit einem Wasserzeichen versehen Signal, das wc[n] trägt, zwei Korrelationsspitzen erzeugen, die durch pL voneinander getrennt sind (wie in 11 ersichtlich).
  • Der Wert pL ist ein Teil der Nutzlast, und wird wie folgt definiert:
    Figure 00110001
  • Nebst pL kann zusätzliche Information codiert werden, und zwar durch Änderung der relativen Vorzeichen der eingebetteten Wasserzeichen.
  • In dem Detektor wird dies als ein relatives Vorzeichen rsign zwischen den Korrelationsspitzen gesehen. Es ist ersichtlich, dass rsign vier mögliche Werte annehmen kann, und kann wie folgt definiert werden:
    Figure 00120001
    wobei ρ1 = sign(cL1) und ρ2 = sign(cL2) Schätzungen der Vorzeichenbits r1 (Eingang 80) und r2 (Eingang 90) nach 4 sind und wobei cL1 und cL2 die Werte der Korrelationsspitze entsprechend wd1 bzw. wd2 sind. Die gesamte Wasserzeichennutzlast pLw wird danach als eine Kombination von rsign und pL gegeben: pLw = ⟨rsign, pL⟩ (8)
  • Die maximale Information (Imax) in Anzahl Bits, die von einer Wasserzeichenfolge mit der Länge Lw getragen werden kann, wird auf diese Weise gegeben durch:
    Figure 00120002
  • In einem derartigen Schema ist die Nutzlast unempfindlich für relativen Offset zwischen dem Einbetter und dem Detektor und auch für etwaige Zeitskalierungsmodifikationen. Die Fensterformfunktion ist als einen der Hauptparameter identifiziert worden, der die Robustheit und die Hörbarkeit des vorhandenen Wasserzeichenmarkierungsschemas steuert. Wie in 6a und 6b dargestellt, werden an dieser Stelle zwei Beispiele möglicher Fensterformfunktionen beschrieben, und zwar eine gesteigerte Kosinusfunktion und eine Doppelphasenfunktion.
  • Es wird bevorzugt, statt einer gesteigerten Kosinusfensterfunktion eine Doppelphasenfensterfunktion zu verwenden, damit ein quasi DC-freies Wasserzeichensignal erhalten wird. Dies ist in den 7a und 7b dargestellt, welche die Frequenzspektren entsprechend einer Wasserzeichenfolge zeigen (in dem vorliegenden Fall eine Folge von wdi[k] = {1, 1, –1, 1, –1, –1,}) konditioniert mit einer gesteigerten Kosinus- bzw. einer Doppelphasenformfunktion. Wie ersichtlich hat das Frequenzspektrum für die gesteigerte Kosinusbedingten Wasserzeichenfolge ein Maximum bei der Frequenz f = 0, während das Frequenzspektrum für die Doppelphasengeformte Wasserzeichensequenz ein Minimum bei f = 0 hat, d. h. es hat einen sehr geringen DC Anteil.
  • Nützliche Information ist nur in dem Nicht-DC-Anteil des Wasserzeichens enthalten. Folglich wird für die gleiche hinzugefügte Wasserzeichenenergie, ein Wasserzeichen, konditioniert mit einem Doppelphasenfenster, mehr nützliche Information enthalten als ein Wasserzeichen, konditioniert durch das gesteigerte Kosinusfenster. Dadurch bietet das Doppelphasenfenster eine bessere Hörbarkeitsqualität für die gleiche Robustheit, oder umgekehrt, es ermöglicht eine bessere Robustheit für die gleiche Hörbarkeitsqualität.
  • Eine derartige Doppelphasenfunktion könnte auch als eine Fensterformfunktion für andere Wasserzeichenmarkierungsschemen verwendet werden. Mit anderen Worten eine Doppelphasenfunktion könnte angewandt werden zum reduzieren des DC Anteils von Signalen (wie einem Wasserzeichen), die in ein anderes Signal einverleibt werden sollen.
  • 8 zeigt ein Blockschaltbild eines Wasserzeichendetektors (200, 300, 400). Der Detektor besteht aus drei Hauptstufen: (a) der Wasserzeichensymbolextraktionsstufe (200), (b) der Puffer- und Interpolationsstufe (300), und (c) der Korrelations- und Entscheidungsstufe (400).
  • In der Symbolextraktionsstufe (200) wird das empfangene mit einem Wasserzeichen versehene Signal y'[n] zum Erzeugen vieler (Nb) Schätzungen der mit einem Wasserzeichen versehenen Folge verarbeitet, die in das Signal we[m] hinein gemultiplext werden. Diese Schätzungen der Wasserzeichenfolge sind erforderlich zum Lösen von Zeitversatz, den es zwischen dem Einbetter und dem Detektor geben kann, so dass der Wasserzeichendetektor zu der Wasserzeichenfolge synchronisieren kann, die in das Gastgebersignal eingefügt wurde.
  • In der Puffer- und Interpolationsstufe (300) werden diese Schätzungen in Nb einzelne Puffer hinein gemultiplext. Eine Interpolation wird danach auf jeden Puffer angewandt um etwaige Zeitskalierungsmodifikationen zu lösen, die aufgetreten sein können. So kann beispielsweise eine Trift in der Abtastfrequenz (Taktfrequenz) zu einer Dehnung oder Schrumpfung in dem Zeitdomänensignal führen (d. h. das Wasserzeichen kann gedehnt oder geschrumpft sein).
  • In der Korrelations- und Entscheidungsstufe (400 wird der Inhalt jedes Puffers mit dem Bezugswasserzeichen korreliert und die maximalen Korrelationsspitzen werden mit einer Schwelle verglichen um die Wahrscheinlichkeit zu ermitteln, dass das Wasserzeichen tatsächlich in das empfangene Signal y'[n] eingebettet ist.
  • Zum Maximieren der Genauigkeit der Wasserzeichendetektion wird der Wasserzeichendetektionsprozess typischerweise über eine Länge des empfangenen Signals y'[n] durchgeführt, die das Drei- oder Vierfache der Länge der Wasserzeichenfolge ist. Auf diese Art und Weise kann jedes zu detektierende Wasserzeichensymbol dadurch konstruiert werden, dass die Mittelwerte verschiedener Symbole genommen werden. Dieser Mitte lungsprozess wird als Glättung bezeichnet, und die Anzahl Male, dass die Mittelung durchgeführt wird, wird als Glättungsfaktor Sf bezeichnet. Auf diese Weise ist die Detektionsfensterlange LD die Länge des Audiosegmentes (in Anzahl Abtastwerte) über die ein Wasserzeichendetektionswahrheitswert berichtet wird. Folglich ist LD = sfLwTs, wobei Ts die Symbolperiode und Lw die Anzahl Symbole innerhalb der Wasserzeichenfolge ist. Typischerweise ist die Länge (Lb) jedes Puffers 320 innerhalb der Puffer- und Interpolationsstufe Lb = sfLw.
  • In der Wasserzeichensymbolextraktionsstufe 200 in 8 wird das eintreffende Wasserzeichensignal y'[n] dem Signalkonditionierungsfilter Hb (210) zugeführt. Dieses Filter 210 ist typischerweise ein Bandpassfilter und hat das gleiche Verhalten wie das entsprechende Filter H (15) auf 2. Das Ausgangssignal des Filters Hb ist y'b[n] und wenn Linearität innerhalb des Übertragungskanals vorausgesetzt wird, folgt aus den Gleichungen (2) und (3): y'b[n] ≈ yb[n] = (1 + αwc[n])xb[n] (10)
  • Es sei bemerkt, dass wenn in dem Einbetter kein Filter verwendet worden ist (d. h. wenn H = 1 ist), auf Hb in dem Detektor auch verzichtet werden kann, oder es kann dennoch vorgesehen sein um die Detektionsleistung zu verbessern. Wenn auf Hb verzichtet wird, wird yb in der Gleichung (10) durch y ersetzt. Der restliche Teil der Verarbeitung ist der gleiche.
  • Zur Vereinfachung wird vorausgesetzt, dass es zwischen dem Einbetter und dem Detektor eine einwandfreie Synchronisation gibt (d. h. keinen Versatz und keine Änderung in der Zeitskala), und dass das Audiosignal in Frames mit der Länge Ts aufgeteilt wird, und dass y'b,m[n] der n. Abtastwert des m. Frames des gefilterten Signals y'b[n] ist. Es sei bemerkt, dass wenn es zwischen dem Einbetter und dem Detektor keine einwandfreie Synchronisation gibt, jede beliebige Abweichung innerhalb der Puffer- und Interpolationsstufe 300 unter Anwendung dem Fachmann bekannter Techniken kompensiert werden kann, beispielsweise eine wiederholte Suche durch alle möglichen Skalen- und Versatzmodifikationen, bis die beste Lösung gefunden worden ist.
  • Die Energie E[m] entsprechend dem y'b,m[n] Frame ist:
    Figure 00140001
    wobei S[n] die gleiche Fensterformfunktion ist, die in der Wasserzeichenkonditionierungs schaltung nach 5 verwendet wurde. Es dürfte einem Fachmann einleuchten, dass die Gleichung (11) einen Empfänger mit einem übereinstimmenden Filter darstellt, und der optimale Empfänger ist, wenn die Symbolperiode einwandfrei synchronisiert ist. Nichtsdestoweniger dieser Tatsache setzen wird von nun an S[n] = 1, um die nachfolgenden Erläuterungen zu vereinfachen.
  • In Kombination mit der Gleichung (10) folgt nun:
    Figure 00150001
    wobei we[m] das m. extrahierte Wasserzeichensymbol ist und Nbfach gemultiplexte Schätzungen der eingebetteten Wasserzeichenfolgen enthält. Lösung von we[n] in der Gleichung (12) und Terme von α höherer Ordnung nicht beachtend, ergibt die nachfolgende Annäherung:
    Figure 00150002
  • In der Wasserzeichenextraktionsstufe 200 auf 8 wird das Ausgangssignal y'b[n] des Filters Hb als Eingangssignal einem Frameverteiler 220 zugeführt, der das Audiosignal in Frames mit der Länge Ts aufteilt, d. h. in y'b,m[n], wobei die Energieberechnungseinheit 230 dann zum Berechnen der Energie entsprechend jedem der Framesignale verwendet wird, wie in der Gleichung (11). Das Ausgangssignal dieser Energieberechnungseinheit 230 wird danach als Eingangssignal der Whitening Stufe Hw 240) zugeführt, welche die in der Gleichung (13) dargestellte Funktion durchführt um ein Ausgangssignal we[m].] zu schaffen. Alternative Implementierungen (240A, 240B) dieser Whitening Stufe sind in den 9 und 10 dargestellt.
  • Es dürfte einleuchten, dass der Nenner der Gleichung (13) einen Term enthält, der Kenntnisse über das (ursprüngliche) Gastgebersignal x erfordert. Da das Signal x für den Detektor nicht verfügbar ist, bedeutet dies, dass zum Berechnen von we[m] der Nenner der Gleichung (13) geschätzt werden muss.
  • Nachstehend ist beschrieben, wie eine derartige Schätzung für die zwei beschriebenen Fensterformfunktionen (die gesteigerte Kosinusfensterformfunktion und die Doppelphasenfensterfunktion) erreicht werden kann, es dürfte aber auch einleuchten, dass die Lehre auf andere Fensterformfunktionen erweitert werden könnte.
  • In Bezug auf die in 6a dargestellte gesteigerte Kosinusfensterformfunktion ist es verwirklicht worden, dass die durch das Wasserzeichen induzierte Audioumhüllende vorwiegend zu dem geräuschempfindlichen Teil der Energiefunktion E[m] beiträgt. Der langsam variierende Teil (d. h. die NF-Anteile) wird vorwiegend dem Beitrag der Umhüllenden des ursprünglichen Audiosignals x zugeschrieben. Auf diese Weise kann die Gleichung (13) wie folgt angenähert werden:
    Figure 00160001
    wobei "Tiefpass' (.)" eine Tiefpassfilterfunktion ist. Auf diese Weise dürfte es einleuchten, dass das Whitening Filter Hw für die gesteigerte Kosinusfensterform in der Funktion wie in 9 dargestellt, verwirklicht werden kann.
  • Wie ersichtlich umfasst ein derartiges Whitening Filter Hw (240A) einen Eingang 242A zum Empfangen des Signals E[m]. Ein Teil dieses Signals wird danach über das Tiefpassfilter 247A zum Erzeugen eines tiefpassgefilterten Energiesignals ELP[m] weiter geleitet, das an sich zusammen mit der Funktion E[m] als Eingangssignal der Rechenstufe 248A zugeführt wird. Die Rechenstufe 248A teilt danach E[m] durch ELP[m] zum Berechnen des extrahierten Wasserzeichensymbols we[m].
  • Wenn eine Doppelphasenfensterfunktion in der Wasserzeichenkonditionierungsstufe des Einbetters angewandt wird, sollte eine andere Annäherung benutzt werden um die Umhüllende des ursprünglichen Audios zu schätzen, und folglich we[m] zu berechnen.
  • Durch Untersuchung der in 6b dargestellten Doppelphasenfensterfunktion stellt es sich heraus, dass wenn die Umhüllende eines Audioframes mit einer derartigen Fensterfunktion moduliert wird, die erste und die zweite Hälfte des Frames in entgegengesetzten Richtungen skaliert werden. In dem Detektor wird diese Eigenschaft benutzt zum Schätzen der Umhüllungsenergie des Gastgebersignals x.
  • Folglich wird innerhalb des Detektors das Audioframe zunächst in zwei Hälften aufgeteilt. Die Energiefunktionen des ersten und des zweiten halben Frames werden folglich gegeben durch:
    Figure 00160002
    bzw.
  • Figure 00170001
  • Da die Umhüllende des ursprünglichen Audios in entgegengesetzten Richtungen innerhalb der zwei Subframes moduliert wird, kann die ursprüngliche Audioumhüllende als den Mittelwert von E1[m] und E2[m] angenähert werden.
  • Weiterhin kann der aktuelle Modulationswert als die Differenz zwischen diesen zwei Funktionen genommen werden. Auf diese Weise kann für die Doppelphasenfensterfunktion das Wasserzeichen we[m] wie folgt angenähert werden:
    Figure 00170002
  • Folglich kann das Whitening Filter Hw 240B für die Doppelphasenfensterformfunktion wie in 10 dargestellt, verwirklich werden. Die Eingänge 242B und 243B empfangen die Energiefunktion des ersten bzw. zweiten Halbframes E1[m] und E2[m]. Jede Energiefunktion wird danach halbiert und Addierern 245B und 246B zugeführt, die E1[m] – E2[m], bzw. E1[m] + E2[m] berechnen. Die beiden berechneten Funktionen werden danach der Recheneinheit 248B zugeführt, die den Wert aus dem Addierer 245B durch den Wert aus 246B teilt um entsprechend der Gleichung (17) das Wasserzeichen we[m] zu berechnen.
  • Dieses Ausgangssignal we[m] wird danach der Puffer- und Interpolationsstufe 300 zugeführt, wo das Signal durch den Demultiplexer 310 gedemultiplext, in den Puffern 320 mit der Länge Lb gepuffert wird um einen Mangel an Synchronismus zwischen dem Einbetter und dem Detektor zu lösen, und innerhalb der Interpolationseinheit 330 interpoliert wird um eine Zeitskalenmodifikation zwischen dem Einbetter und dem Detektor zu kompensieren. Eine derartige Kompensation kann bekannte Techniken benutzen und ist folglich in dieser Beschreibung nicht näher erläutert.
  • Wie in 8 dargestellt, werden die Ausgangssignale (wD1, wD2, ... wDNb) der Pufferstufe der Interpolationsstufe zugeführt und nach Interpolation werden die Ausgangssignale (wI1, wI2, ... wINb) dieser Stufe, die den jeweiligen Schätzungen des einwandfrei neu skalierten Signals entsprechen, der Korrelations- und Entscheidungsstufe zugeführt. Wenn man denkt, dass keine Zeitskalierungskompensation erforderlich ist, können die Werte (wD1, wD2, ... wDNb) unmittelbar der Korrelations- und Entscheidungsstufe 400 zugeführt werden, d. h. in der Anordnung kann auf die Interpolationsstufe 330 verzichtet werden.
  • Der Korrelator 410 berechnet die Korrelation jeder Schätzung wIj, j = 1, ..., Nb gegenüber der Bezugswasserzeichenfolge ws[k]. Jedes betreffende Korrelationsausgangssignal, das jeder Schätzung entspricht, wird danach der maximalen Detektionseinheit 420 zugeführt, die bestimmt, welche zwei Schätzungen die besten Übereinstimmungen mit den kreisförmig verschobenen Versionen wd1 und wd2 des Bezugswasserzeichens schafften. Die Korrelationswerte (die Spitzenamplituden und Positionen) für diese Schätzungsfolgen werden der Schwellendetektor- und Nutzlastextraktionseinheit 430 zugeführt.
  • Wenn auf die Interpolationsstufe verzichtet wird, berechnet auf alternative Weise die Korrelationsstufe 410 die Korrelation jeder Schätzung wDj, j = 1, ..., Nb mit der Bezugswasserzeichenfolge ws[k] und die Ergebnisse werden zu nachfolgenden Verarbeitung den Einheiten 420 und 430 zugeführt, wie in dem oben stehenden Abschnitt erläutert.
  • Die Schwellendetektor- und Nutzlastextraktionseinheit 430 kann zum Extrahieren der Nutzlast (beispielsweise Informationsinhalt) aus dem detektierten Wasserzeichensignal benutzt werden. Wenn die Einheit einmal die zwei Korrelationsspitzen cL1 und cL2, welche die Detektionsschwelle übersteigen, geschätzt hat, wird der Abstand pL zwischen den Spitzen (wie durch die Gleichung (6) definiert) gemessen. Danach werden die Vorzeichen ρ1 und ρ2 der Korrelationsspitzen ermittelt, und folglich rsign aus der Gleichung (7) berechnet. Die gesamte Wasserzeichennutzlast kann danach unter Verwendung der Gleichung (8) berechnet werden.
  • Aus 11 ist beispielsweise ersichtlich, dass pL der relative Abstand zwischen den zwei Spitzen ist. Die beiden Spitzen sind positiv, d. h. ρ1 = +1, und ρ2 = +1. Aus der Gleichung (7) ist rsign = 3. Folglich ist die Nutzlast pLw = <3, pL>.
  • Die Bezugswasserzeichenfolge ws, die innerhalb des Detektors verwendet wird, entspricht (einer möglicherweise kreisförmig verschobenen Version) der ursprünglichen Wasserzeichenfolge, angewandt auf das Gastgebersignal. Wenn beispielsweise das Wasserzeichensignal unter Verwendung eines Zufallszahlgenerators mit dem Samen S innerhalb des Einbetters berechnet wurde, kann auf gleiche Weise der Detektor unter Anwendung des gleichen Zufallszahlerzeugungsalgorithmus und des gleichen Anfangssamens zum Ermitteln des Wasserzeichensignals die gleiche Zufallszahlfolge berechnen. Auf alternative Weise könnte das Wasserzeichensignal, das ursprünglich in dem Einbetter angewandt wur de und von dem Detektor als Bezugswert verwendet wurde, einfach jede beliebige vorbestimmte Folge sein.
  • 11 zeigt eine typische Form einer Korrelationsfunktion als Ausgangssignal des Korrelators 410. Die horizontale Skala zeigt die Korrelationsverzögerung (in Termen der Folgebins). Die vertikale Skala auf der linken Seite (als Vertrauenspegel cL bezeichnet) stellt den Wert der gegenüber der Standardabweichung der (typischerweise normal verteilten) Korrelationsfunktion normalisierten Korrelationsspitze dar.
  • Wie ersichtlich ist die typische Korrelation gegenüber cL relativ flach und gegenüber cL = 0 zentriert. Die Funktion enthält aber zwei Spitzen, die durch pL getrennt sind (siehe Gleichung (6)) und sich aufwärts zu cL Werten erstrecken, die über der Detektionsschwelle sind, wenn es ein Wasserzeichen gibt. Wenn die Korrelationsspitzen negativ sind gilt Obenstehendes für die Absolutwerte.
  • Eine horizontale Linie (dargestellt in der Figur als cL = 8,7) stellt die Detektionsschwelle dar. Der Detektionsschwellenwert steuert die Falschalarmrate.
  • Es gibt zwei Arten von Falschalarm: die falsche positive Rate, definiert als die Wahrscheinlichkeit der Detektion eines Wasserzeichens in nicht mit einem Wasserzeichen versehenen Items, und die falsche negative rate, die als die Wahrscheinlichkeit der Nicht-Detektion eines Wasserzeichens in mit einem Wasserzeichen versehenen Items. Im Allgemeinen ist die Anforderung des falschen positiven Alarms stringenter als die des falschen negativen Alarms. Die Skala in 11 auf der rechten Seite zeigt die Wahrscheinlichkeit eines falschen positiven Alarms p. Wie in dem dargestellten Beispiel ersichtlich, ist die Wahrscheinlichkeit eines falschen positiven p = 10–12 gleichwertig mit der Schwelle cL = 8,7, während p = 10–83 gleichwertig mit cL = 20 ist.
  • Nach jedem Detektionsintervall bestimmt der Detektor, ob das ursprüngliche Wasserzeichen ggf. vorhanden ist und auf dieser Basis ein "Ja" oder ein "Nein" ausgibt. Gewünschtenfalls kann um zu verbessern, dass diese Entscheidung Fortschritte macht, eine Anzahl Detektionsfenster berücksichtigt werden. In einem derartigen Fall ist die falsche positive Wahrscheinlichkeit eine Kombination der einzelnen Wahrscheinlichkeiten für jedes betrachtete Detektionsfenster, und zwar abhängig von den gewünschten Kriterien. So könnte beispielsweise bestimmt werden, dass, wenn die Korrelationsfunktion zwei Spitzen über einer Schwelle von cL = 7 bei jedem von zwei aus drei Detektionsintervallen hat, das Wasserzeichen als anwesend betrachtet wird. Offensichtlich können derartige Detekti onskriterien geändert werden, und zwar abhängig von der gewünschten Verwendung des Wasserzeichensignals und zum Berücksichtigen von Faktoren, wie der ursprünglichen Qualität des Gastgebersignals und wie sehr das Signal während der normalen Übertragung beschädigt wird.
  • Es dürfte dem Fachmann einleuchten, dass mehrere Implementierungen, die an dieser Stelle nicht spezifische beschrieben worden sind, als im Rahmen der vorliegenden Erfindung liegend betrachtet werden sollen. Während beispielsweise nur die Funktionalität der Einbettungs- und Detektionsanordnung beschrieben worden ist, dürfte es einleuchten, dass die Anordnung als eine digitale Schaltungsanordnung, als eine analoge Schaltung, als ein Computerprogramm oder als eine Kombination davon verwirklicht werden könnte.
  • In gleicher Weise dürfte es einleuchten, dass, während die oben stehende Ausführungsform anhand eines Audiosignal beschrieben worden ist, die vorliegende Erfindung auch auf andere Signaltypen, beispielsweise Video- und Datensignale angewandt werden kann.
  • In der Beschreibung dürfte es einleuchten, dass das Wort "enthalten" andere Elemente oder Verfahrensschritte nicht ausschließt und dass "ein" eine Anzahl nicht ausschließt, und dass ein einziger Prozessor oder eine andere Einheit die Funktionen verschiedener in den Patentansprüchen genannter Mittel erfüllen kann.
  • Text in der Zeichnung
  • 1
    • Nutzlasteinbettungs- und -verbesserungsschaltung
  • 11
    • Normalisierte Korrelationsspitze
    • Wahrscheinlichkeit falscher positiver (p)
    • Verzögerung (in Abtastwerten)
  • 4
    • 30 kreisförmiger Verschieber
  • 6a
    • Gesteigerter Kosinus
  • 6b
    • Doppelphase
  • 7a
    • Gesteigerter Kosinus
    • Halbe Energie bei DC
  • 7b
    • Doppelphase
    • Keine Energie bei DC
  • 8
    • Wasserzeichensymbolextrahierstufe
    • Puffer- und Interpolationsstufe
    • Korrelations- und Entscheidungsstufe
    • Demultiplexer
    • Puffer
    • Interpolator
    • Korrelator
  • 9
    • Tiefpass

Claims (12)

  1. Verfahren zum Erzeugen eines Wasserzeichensignals (wc) zum Einbetten in ein Multimediasignal, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: (a) das Erzeugen zweier Folgen von Werten (wd1, wd2), wobei die zweite Folge (wd2) eine kreisförmig verschobene Version der ersten Folge (wd1) ist; und (b) das Erzeugen eines Wasserzeichensignals (wc) einer Symbolperiode Ts durch Addierung der Werte der ersten Folge (wd1) zu den betreffenden Werten an den entsprechenden Stellen der zweiten Folge (wd2), dadurch gekennzeichnet, dass (c) jede der genannten Wertfolgen (wd1, wd2) wird mit einer Fensterformfunktion s[n], die eine Breite wenigstens entsprechend der Symbolperiode Ts hat, gefaltet, und zwar zum Erzeugen zweier ruhig variierender Signale (w1[n], w2[n]), wobei diese ruhig variierenden Signale (w1[n], w2[n]) in dem Schritt (b) zusammen addiert werden zum Bilden des Wasserzeichensignals (wc).
  2. Verfahren nach Anspruch 1, wobei die genannte Fensterformfunktion s[n] ein bandbegrenztes Frequenzverhalten und ein ruhiges zeitliches Verhalten hat.
  3. Verfahren nach Anspruch 2, wobei die Fensterformfunktion s[n] ein symmetrisches oder antisymmetrisches zeitliches Verhalten hat.
  4. Verfahren nach Anspruch 1, wobei die genannte Fensterformfunktion s[n] wenigstens eine gesteigerte Kosinusfunktion und eine Doppelphasenfunktion hat.
  5. Verfahren nach Anspruch 1, wobei das Wasserzeichensignal (wc) durch Addition der zwei ruhig variierenden Signale (w1[n], w2[n]) mit einer relativen Verzögerung von Tr, wobei Tr < Ts ist, erzeugt wird.
  6. Verfahren nach Anspruch 5, wobei Tr derart gewählt wird, dass maximale Amplitudenstellen des ersten allmählich variierenden Signals (w1[n]) mit Nulldurchgängen des zweiten allmählich variierenden Signals (w2[n]) zusammenfallen, und umgekehrt.
  7. Verfahren nach Anspruch 1, wobei das genannte Wasserzeichensignal (wc) eine Nutzlast hat, die in der Kombination der genannten zwei Wertfolgen (wd1, wd2) codiert wird.
  8. Anordnung, vorgesehen zum Erzeugen eines Wasserzeichensignals (wc) zum Einbetten in ein Multimediasignal, wobei die Anordnung Folgendes umfasst: (a) einen Folgengenerator, vorgesehen zum Verwenden einer ersten Folge von Werten (wd1) zum Erzeugen einer zweiten Folge von Werten (wd2), wobei die zweite Folge (wd2) eine kreisförmig verschobene Version der ersten Folge (wd1) ist; (b) einen Signalgenerator, vorgesehen zum Erzeugen eines Wasserzeichensignals (wc) einer Symbolperiode Ts durch Addition der Werte der ersten Folge (wd1) zu den betreffenden Werten an den entsprechenden Stellen der zweiten Folge (wd2), und (c) Mittel zum Falten des Wasserzeichensignals (wc) mit einer Fensterformfunktion s[n], wobei die Anordnung weiterhin einen Signalverbesserer aufweist, um jede Folge von Werten (wd1, wd2) in ein allmählich variierendes Signal (w1[n], w2[n]) umzusetzen.
  9. Verfahren zum Detektieren eines Wasserzeichensignals (wc), eingebettet in ein Multimediasignal, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: (a) das Empfangen eines Multimediasignals, das möglicherweise mit einem Wasserzeichen (wc) versehen sein kann, das die zeitliche Umhüllende des Gastgebermultimediasignals modifiziert; (b) das Extrahieren einer Schätzung des Wasserzeichens aus dem empfangenen Signal; und (c) das Korrelieren der Schätzung des Wasserzeichens mit einer Bezugsversion des Wasserzeichens um zu ermitteln, ob das empfangene Signal mit einem Wasserzeichen versehen ist, wobei das Verfahren weiterhin den Verfahrensschritt der Anwendung einer Fensterformfunktion s[n] auf das empfangene Signal umfasst.
  10. Verfahren nach Anspruch 9, wobei das Wasserzeichensignal (wc) eine Nutzlast hat, und wobei das Verfahren weiterhin den Schritt der Ermittlung der Nutzlast (pLw) des Wasserzeichens umfasst, und zwar durch – Schätzung zweier Korrelationsspitzen (cL1, cL2) des Wasserzeichensignals (wc), die eine Detektionsschwelle übersteigen, – Ermittlung des Abstandes (pL) zwischen den Korrelationsspitzen, – Ermittlung der Vorzeichen (ρ1, ρ2) der Korrelationsspitzen, – Ermittlung des relativen Vorzeichens (rsign) der korrelierten Spitzen, und – Ermittlung der Nutzlast (pLw) des Wasserzeichens als eine Kombination des relativen Vorzeichens (rsign) und des Abstandes (pL).
  11. Computerprogramm mit Instruktionen, wodurch ein Computer imstande ist, wenigstens das Verfahren nach Anspruch 1 oder das Verfahren nach Anspruch 9 durchzuführen.
  12. Aufzeichnungsträger mit einem Computerprogramm nach Anspruch 11.
DE60320546T 2002-03-28 2003-02-26 Kennzeichnung von zeitbereichen mit wasserzeichen bei multimediasignalen Expired - Fee Related DE60320546T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02076205 2002-03-28
EP02076205 2002-03-28
PCT/IB2003/000785 WO2003083858A1 (en) 2002-03-28 2003-02-26 Time domain watermarking of multimedia signals

Publications (2)

Publication Number Publication Date
DE60320546D1 DE60320546D1 (de) 2008-06-05
DE60320546T2 true DE60320546T2 (de) 2008-11-13

Family

ID=28459517

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60320546T Expired - Fee Related DE60320546T2 (de) 2002-03-28 2003-02-26 Kennzeichnung von zeitbereichen mit wasserzeichen bei multimediasignalen

Country Status (9)

Country Link
US (1) US7546467B2 (de)
EP (1) EP1493154B1 (de)
JP (1) JP2005521908A (de)
KR (1) KR20040095323A (de)
CN (1) CN100505061C (de)
AT (1) ATE393446T1 (de)
AU (1) AU2003206084A1 (de)
DE (1) DE60320546T2 (de)
WO (1) WO2003083858A1 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003083859A2 (en) * 2002-03-28 2003-10-09 Koninklijke Philips Electronics N.V. Watermark time scale searching
US20050220322A1 (en) * 2004-01-13 2005-10-06 Interdigital Technology Corporation Watermarks/signatures for wireless communications
EP1932359A1 (de) * 2005-09-09 2008-06-18 Thomson Licensing Koeffizientenauswahl für video-wasserzeichen
US20090252370A1 (en) * 2005-09-09 2009-10-08 Justin Picard Video watermark detection
US8958408B1 (en) 2008-06-05 2015-02-17 The Boeing Company Coded aperture scanning
US8509205B2 (en) * 2008-06-05 2013-08-13 The Boeing Company Multicode aperture transmitter/receiver
JP5582508B2 (ja) * 2008-08-14 2014-09-03 エスケーテレコム株式会社 データ送信装置、データ受信装置、データ送信方法、及びデータ受信方法
US8588461B2 (en) * 2010-03-22 2013-11-19 Brigham Young University Robust watermarking for digital media
GB201206564D0 (en) * 2012-04-13 2012-05-30 Intrasonics Sarl Event engine synchronisation
US9269363B2 (en) 2012-11-02 2016-02-23 Dolby Laboratories Licensing Corporation Audio data hiding based on perceptual masking and detection based on code multiplexing
GB2511479A (en) * 2012-12-17 2014-09-10 Librae Ltd Interacting toys
JP6193395B2 (ja) * 2013-11-11 2017-09-06 株式会社東芝 電子透かし検出装置、方法及びプログラム
CN107864398B (zh) * 2017-11-08 2020-03-20 司马大大(北京)智能系统有限公司 音频与视频的合并方法及装置
CN108052499B (zh) * 2017-11-20 2021-06-11 北京百度网讯科技有限公司 基于人工智能的文本纠错方法、装置及计算机可读介质
CN108091328B (zh) * 2017-11-20 2021-04-16 北京百度网讯科技有限公司 基于人工智能的语音识别纠错方法、装置及可读介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2679689B1 (fr) * 1991-07-26 1994-02-25 Etat Francais Procede de synthese de sons.
US6427012B1 (en) 1997-05-19 2002-07-30 Verance Corporation Apparatus and method for embedding and extracting information in analog signals using replica modulation
US6209094B1 (en) * 1998-10-14 2001-03-27 Liquid Audio Inc. Robust watermark method and apparatus for digital signals
KR100375822B1 (ko) * 2000-12-18 2003-03-15 한국전자통신연구원 디지털 오디오의 워터마크 삽입/추출 장치 및 방법

Also Published As

Publication number Publication date
EP1493154B1 (de) 2008-04-23
US20050152549A1 (en) 2005-07-14
DE60320546D1 (de) 2008-06-05
JP2005521908A (ja) 2005-07-21
ATE393446T1 (de) 2008-05-15
EP1493154A1 (de) 2005-01-05
KR20040095323A (ko) 2004-11-12
WO2003083858A1 (en) 2003-10-09
CN1647186A (zh) 2005-07-27
US7546467B2 (en) 2009-06-09
CN100505061C (zh) 2009-06-24
AU2003206084A1 (en) 2003-10-13

Similar Documents

Publication Publication Date Title
DE60320546T2 (de) Kennzeichnung von zeitbereichen mit wasserzeichen bei multimediasignalen
DE60110086T2 (de) Stegotextkodierer und -dekodierer
DE69835521T2 (de) Vorrichtung und verfahren für die einbettung und wiedergewinnung von informationen in analogen signalen mit verwendung der verteilten signalmerkmale
DE60114638T2 (de) Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information
DE69938135T2 (de) Gerät und verfahren zum einbetten und extrahieren von informationen in analogsignalen mit hilfe von replikationsmodulation
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
EP1741039B1 (de) Informationssignalverarbeitung durch modifikation in der spektral-/modulationsspektralbereichsdarstellung
EP1864279B1 (de) Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
EP2266114B1 (de) Einbetter und detektor eines wasserzeichens mit zusatzinformation
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
EP1741215B1 (de) Wasserzeicheneinbettung
EP2372634B1 (de) Einbetter zum Einbetten eines Wasserzeichens in eine Informationsdarstellung, Detektor zum Detektieren eines Wasserzeichens in einer Informationsdarstellung, Verfahren und Computerprogramm
DE60107308T2 (de) Verfahren zur Erzeugung eines Wasserzeichens für Audiosignale
EP2240928B1 (de) Vorrichtung und verfahren zum berechnen eines fingerabdrucks eines audiosignals, vorrichtung und verfahren zum synchronisieren und vorrichtung und verfahren zum charakterisieren eines testaudiosignals
DE60308667T2 (de) Wasserzeichenzeitskalensuchen
EP1495445B1 (de) Verfahren und vorrichtung zum einbetten und extrahieren von wasserzeicheninformationen
DE69930143T2 (de) Extrahieren von zusatzdaten in einem informationssignal
WO2009100876A1 (de) Vorrichtung und verfahren zum synchronisieren von mehrkanalerweiterungsdaten mit einem audiosignal und zum verarbeiten des audiosignals
DE60024729T2 (de) System und verfahren zum effizienten antialiasing im zeitbereich (tdac)
DE60210668T2 (de) Quantisierungs-index-moduliertes (qim) einbetten eines digitalen wasserzeichens in ein multimedia-signal
DE602004009926T2 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
DE60222986T2 (de) Digitale Wasserzeicheneinbettung und - erkennung
DE69823557T2 (de) Schnelle frequenztransformationstechnik für transform audio koder

Legal Events

Date Code Title Description
8320 Willingness to grant licences declared (paragraph 23)
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee