DE60114638T2 - Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information - Google Patents

Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information Download PDF

Info

Publication number
DE60114638T2
DE60114638T2 DE60114638T DE60114638T DE60114638T2 DE 60114638 T2 DE60114638 T2 DE 60114638T2 DE 60114638 T DE60114638 T DE 60114638T DE 60114638 T DE60114638 T DE 60114638T DE 60114638 T2 DE60114638 T2 DE 60114638T2
Authority
DE
Germany
Prior art keywords
parameters
signal
parameter
perceptual
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60114638T
Other languages
English (en)
Other versions
DE60114638D1 (de
Inventor
Aubrey Matthew WATSON
Mead Michael TRUMAN
Decker Stephen VERNON
Graham Brett CROCKETT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of DE60114638D1 publication Critical patent/DE60114638D1/de
Application granted granted Critical
Publication of DE60114638T2 publication Critical patent/DE60114638T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0064Image watermarking for copy protection or copy management, e.g. CGMS, copy only once, one-time copy

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)

Description

  • TECHNISCHES GEBIET
  • Die Erfindung bezieht sich auf Steganographie im Zusammenhang mit Audio- oder Videosignalen. Insbesondere bezieht sich die Erfindung darauf, den Betrieb des Kodierers und/oder Dekodierers eines wahrnehmungsgebundenen Ton- oder Bildkodiersystems in Übereinstimmung mit Zusatzinformation abzuwandeln, so daß die Zusatzinformation in der Ausgabe des Dekodierers feststellbar sein kann. Derartige Zusatzinformation wird oft "Wasserzeichen" genannt. Das Einbringen von Wasserzeichen ist ein Aspekt der Steganographie.
  • EINSCHLÄGIGER STAND DER TECHNIK
  • Steganographie und Wasserzeicheneinbringung
  • Steganographie ist die Wissenschaft des Verbergens eines Signals innerhalb eines anderen Signals. Steganographische Algorithmen oder Verfahren können entweder robust oder "fragil" sein, das heißt, es kann entweder sehr schwer oder sehr leicht sein, das verdeckte Signal zu verfälschen. Bei der Betrachtung von Anwendungsfällen auf Tonsignale besteht eine sehr fragile steganographische Technik darin, das niedrigstwertige Bit eines PCM Kanals zu benutzen, um einen Datenstrom unabhängig vom Audioprogramminhalt zu führen, der in den oberen Bits geführt würde. Der im niedrigstwertigen Bit geführte, verdeckte Datenkanal verzerrt das Audioprogramm nicht signifikant, sondern wirkt eher als Tiefpegelzittersignal. Diese Technik ist insofern fragil, als das Datensignal durch einfache Tonsignalverarbeitung zerstört werden kann, beispielsweise Verstärkungsänderungen, Digital/Analog-Umsetzung und so weiter.
  • Das Einbringen von Wasserzeichen ist eine Art von Steganographie, bei der typischerweise die Signalverdeckungstechnik gegenüber Verfälschung sowohl durch normale Verarbeitung als auch durch bewußten Angriff robust sein soll. Als solche sind Wasserzeichen wertvoll für Anwendungen im Zusammenhang mit Sicherheit, beispielsweise Kopierschutz oder die Identifizierung von Inhaltseigentumsrechten. Bei solchen Anwendungen kann das Wasserzeichen beispielsweise den Kopiekontrollstatus, Urheberrechtangaben sowie Angaben enthalten, die sich darauf beziehen, wie das Hauptprogrammaterial freigegeben wurde. Selbst wenn das Hauptprogramm später gestohlen oder unrechtmäßig kopiert wird, bleibt im Idealfall das Wasserzeichen innerhalb des Programmaterials eingebettet und bietet eine Möglichkeit, das Eigentumsrecht nachzuweisen.
  • Ein oder mehr Wasserzeichen können an vielen Punkten längs eines Verteilerweges für "Inhalt" (z.B. Ton- oder Bilddarbietung) eingefügt werden. Dem Signal am Anfang dieses Weges hinzugefügte Information kann Urheberrechtangaben oder den Mastering-Ort enthalten, während am Ende der Signalkette hinzugefügte Information Angaben zur Wiedergabe enthalten kann, beispielsweise Datum/Zeitstempel und/oder laufende Maschinennummer. Um Inhalt auf seinen Ursprung zurückzuverfolgen, können an verschiedenen Orten längs des Verteilerweges Wasserzeichen eingebettet sein.
  • Eine wichtige Überlegung für das Einbringen von Wasserzeichen in Audio- und Videosignale besteht darin, daß das verdeckte Signal die Qualität des Signals, in dem es versteckt ist, nicht unnötig herabsetzen sollte. Im Idealfall sollte das Wasserzeichen vollständig transparent sein, das heißt, der Unterschied zwischen dem mit Wasserzeichen versehenen Signal und dem Ursprungssignal sollte (für einen menschlichen Betrachter/Hörer ohne Hilfsmittel) nichtwahrnehmbar sein. Natürlich muß der Unterschied auf irgendeine Weise feststellbar sein, denn sonst wäre das Wasserzeichensignal nicht wiederherstellbar. Aber Wasserzeichen können für gewisse Zwecke absichtlich sinnlich wahrnehmbar sein. So können zum Beispiel Bilder sichtbar mit Wasserzeichen versehen sein, um deren kommerzielle Verwendung zu verhindern. Darüber hinaus kann Papier mit Wasserzeichen versehen sein, um ein wahrnehmbares Gütesiegel zu vermitteln.
  • Die Ziele für das Einbringen von Wasserzeichen lassen sich wie folgt zusammenfassen:
    • • Modifizieren eines Primärsignals auf solche Weise, daß ein Sekundärsignal oder Zusatzinformation hinzugefügt wird, was ein modifiziertes Primärsignal ergibt,
    • • der Unterschied zwischen dem ursprünglichen und dem abgewandelten Primärsignal sollte feststellbar, aber nicht sinnlich wahrnehmbar sein, und
    • • es sollte schwierig sein, die Abwandlung zu beseitigen oder zu verdunkeln.
  • Perzeptuelles Kodieren
  • Perzeptuelles Kodieren ist die Wissenschaft, mit der sinnlich wahrnehmbare, irrelevante Bestandteile aus Signalen entfernt werden, um diese auf eine effizientere Ausdrucksform zu reduzieren. In manchen Fällen wird beispielsweise Perzeptuelles Kodieren angewandt, um die Übertragungsdatengeschwindigkeit von digitalen Audio- oder Videosignalen zu verringern, um eine im voraus festgelegte Einschränkung der Kanalkapazität einzuhalten. Perzeptuelles Kodieren von Ton- und Bildsignalen ist ein bewährter Wissenschaftszweig, mit dem Ton- und Bildsignale auf verhältnismäßig geringe Datenflußgeschwindigkeiten zur wirksamen Speicherung und Übertragung verringert werden können.
  • Viele perzeptuelle Kodierer arbeiten so, daß sie den Inhalt des ursprünglichen Signals analysieren und die perzeptuelle Relevanz jeder Signalkomponente kennzeichnen. Dann wird eine modifizierte Version des ursprünglichen Signals geschaffen, so daß diese modifizierte Version mit einer niedrigeren Datenflußgeschwindigkeit als das ursprüngliche Signal ausgedrückt werden kann. Im Idealfall ist die Differenz zwischen dem ursprünglichen und dem abgewandelten Signal nicht sinnlich wahrnehmbar. Rauschen, üblicherweise Quantisierungsrauschen, oder andere Verzerrungen werden kontrollierbar eingefügt, um die Datenflußgeschwindigkeit des Signals zu verringern. Dabei werden Eigenschaften der menschlichen Wahrnehmung berücksichtigt, um das Rauschen oder die sonstige Verzerrung so zu manipulieren, daß sie nicht sinnlich wahrnehmbar bleibt oder nur minimal wahrgenommen werden kann.
  • Perzeptuelle Kodierer arbeiten mit einem Maskiermodell, welches die menschliche Wahrnehmung mit einem gewissen Grad an Genauigkeit wiedergeben soll. Das Maskiermodell bietet eine perzeptuelle Maskierschwelle, welche für die sinnliche Wahrnehmung eine Grenze setzt. Die durchgezogene Linie in 1 zeigt den Schalldruckpegel, bei dem Schall, beispielsweise eine Sinuswelle oder ein schmales Rauschband gerade hörbar ist, mit anderen Worten, dies ist die Hörschwelle. Schall, dessen Pegel oberhalb der Kurve liegt, ist hörbar, Schallpegel unterhalb sind es nicht. Diese Schwelle, das ist klar, ist sehr abhängig von der Frequenz. Man kann einen viel sanfteren Ton bei, sagen wir, 4 kHz als bei 50 Hz oder 15 kHz hören. Bei 25 kHz ist die Schwelle außerhalb des Maßstabs – gleichgültig wie laut, hören kann man den Ton nicht.
  • Betrachten wir die mit der gestrichelten Linie in 1 gezeigte Schwelle mit dem Vorhandensein eines verhältnismäßig lauten Signals bei einer Frequenz von, sagen wir, einer 500 Hz Sinuswelle, die in der Figur als vertikaler Strich gezeigt ist. Diese Schwelle steigt in der unmittelbaren Umgebung von 500 Hz drastisch an, bei weiter entfernter Frequenz mäßig und überhaupt nicht in entfernten Teilen des hörbaren Bereichs.
  • Dieser Anstieg der Schwelle wird als Maskieren bezeichnet. Bei Vorhandensein des lauten 500 Hz Sinuswellensignals (des "Maskiersignals" oder "Maskierers") werden Signale unterhalb dieser Schwelle, die man als "Maskierschwelle" bezeichnen kann, von dem lauten Signal verdeckt oder maskiert. Weiter weg können andere Signale im Pegel geringfügig über die Schwelle ohne Signal ansteigen und doch noch unterhalb der neuen maskierten Schwelle bleiben und folglich unhörbar sein. Aber in entfernten Teilen des Spektrums, in dem die Schwelle ohne Signal unverändert bleibt, bleibt jegliches Rauschen, das ohne 500 Hz Maskierer hörbar war, ebenso hörbar mit ihm. Das Maskieren hängt also nicht vom alleinigen Vorhandensein von einem oder mehr Maskiersignalen ab, sondern davon, wo sie sich im Spektrum befinden. Einige Musikpassagen beispielsweise enthalten viele spektrale Komponenten, die über den hörbaren Frequenzbereich hinweg verteilt sind und ergeben deshalb eine Kurve einer maskierten Schwelle, die überall im Vergleich zu der Kurve der Schwelle ohne Signal angehoben ist. Andere Musikpassagen bestehen beispielsweise aus verhältnismäßig lauten Tönen eines Soloinstruments, wobei die spektralen Komponenten auf einen kleinen Teil des Tonspektrums beschränkt sind, was eine maskierte Kurve ergibt, die eher so aussieht, wie das Beispiel mit Sinuswellenmaskierer in 1.
  • Das Maskieren hat außerdem einen zeitlichen Aspekt, der von dem zeitlichen Verhältnis zwischen dem Maskierer/den Maskierern und dem maskierten Signal/den maskierten Signalen abhängt. Einige Maskiersignale bieten eine Maskierung im wesentlichen nur dann, wenn das Maskiersignal vorhan den ist ("gleichzeitige Maskierung"), andere Maskiersignale bieten eine Maskierung nicht nur während der Maskierer auftritt, sondern auch schon früher ("Rückwärtsmaskierung" oder "Vormaskierung") und später ("Vorwärtsmaskierung" oder "Nachmaskierung"). Ein "Übergang", ein plötzlicher, kurzer, signifikanter Anstieg des Signalpegels kann alle drei "Arten" der Maskierung zeigen, nämlich Rückwärtsmaskierung, gleichzeitige Maskierung und Vorwärtsmaskierung, während ein Signal im eingeschwungenen Zustand oder quasi eingeschwungenem Zustand nur gleichzeitige Maskierung haben mag.
  • Was immer im perzeptuellen Kodierverfahren an Rauschen und Verzerrung hinzugefügt wird, sollte unterhalb der Maskierschwelle bleiben, um wahrnehmbare Beeinträchtigungen zu vermeiden. Erreicht das im Kodierverfahren hinzugefügte Rauschen oder die Verzerrung die Maskierschwelle, ohne sie jedoch zu überschreiten, sagt man von dem Signal, es sei auf dem Pegel des "gerade bemerkbaren Unterschieds" kodiert. Die "Kodiermarge" eines Systems läßt sich bestimmen als Ausmaß, um das das hinzugefügte Rauschen oder die Verzerrung unterhalb der Maskierschwelle liegt, dann bedeutet eine Kodiermarge Null, daß das Signal auf dem Pegel des gerade bemerkbaren Unterschieds kodiert ist, während eine positive Kodiermarge bedeutet, daß das hinzugefügte Rauschen oder die Verzerrung nichtwahrnehmbar ist, wobei noch etwas Raum verbleibt, während eine negative Kodiermarge bedeutet, daß wahrnehmbare Beeinträchtigungen vorhanden sind.
  • Es sei noch darauf hingewiesen, daß unterschiedliche Aspekte des Signals (z.B. Bandbreite, zeitliche Auflösung, räumliche Genauigkeit usw.) auf unterschiedliche Genauigkeitsgrade kodiert werden können, was zu unterschiedlichen Kodiermargen für unterschiedliche Signaleigenschaften führt. Wenn ein Quellensignal so kodiert wird, daß die Kodiermarge für alle Eigenschaften des Signals nicht negativ ist, läßt sich sagen, daß es im Sinne der Wahrnehmung der Quelle gleichwertig ist.
  • Ein perzeptuelles Kodiersystem besteht aus einem Kodierer, der einem Dekodierer Bitzuordnungsinformation oder Wahrnehmungsmodellinformation zusammen mit kodierten Daten mitteilen kann. Es gibt drei hauptsächliche Arten perzeptueller Kodiersysteme: vorwärtsadaptiv, rückwärtsadaptiv und ein Hybridsystem aus den beiden. In einem vorwärtsadaptiven System sendet der Kodierer ausdrücklich Bitzuordnungsinformation an den Dekodierer. In einem rückwärtsadaptiven System werden keine Bitzuordnungs- oder Wahrnehmungsmodellinformationen an den Dekodierer gesandt. Der Dekodierer stellt die Bitzuordnung aus den kodierten Daten wieder her. Mit einem Hybridsystem ist es möglich, eine gewisse Bitzuordnungsinformation, beispielsweise eine weniger als volle Auflösung des Wahrnehmungsmodells mit den kodierten Daten einzuschließen, jedenfalls viel weniger als bei einem vollen vorwärtsadaptiven System. Eine mehr ins einzelne gehende Erörterung dieser drei Arten perzeptueller Kodiersysteme findet sich in "AC-3: Flexible Perceptual Coding for Audio Transmission and Storage," von Craig C. Todd et al. Preprint 3796, 96. Convention of the Audio Engineering Society, 26. Februar – 1. März 1994. Von den Dolby Laboratories entwickelte perzeptuelle Kodiersysteme, beispielsweise das Dolby Digital und Dolby E Kodiersystem, auf die weiter unten noch eingegangen wird, sind Beispiele hybrider vorwärts/rückwärtsadaptiver Systeme, während das MPEG-2 AAC Kodiersystem, auf das gleichfalls weiter unten eingegangen wird, ein Beispiel eines vorwärtsadaptiven Systems ist.
  • Die Ziele perzeptueller Kodierer lassen sich wie folgt zusammenfassen:
    • • Abwandlung eines primären Signals, das zu einem modifizierten Signal führt,
    • • der Unterschied zwischen dem ursprünglichen und dem abgewandelten Signal sollte nicht sinnlich wahrnehmbar sein, und
    • • Darstellung des modifizierten Signals sollte effizienter sein als Darstellung des ursprünglichen Signals.
  • Sicherheit
  • Das Einbringen eines Wasserzeichens als Sicherheitsmaßnahme ist nur so stark, wie die Fähigkeit des Wasserzeichens einen unmittelbaren Angriff zu überleben. Bei vielen gegenwärtig angewandten Techniken zum Einbringen von Wasserzeichen wird eine Abschirmung derselben vor einem erfolgreichen Angriff dadurch versucht, daß die Einzelheiten des Wasserzeichens geheim bleiben, und zwar unter der Annahme, daß Angreifer, wenn das Wasserzeichen nicht öffentlich bekannt ist, nicht wissen, wie sie das mit Wasserzeichen versehene Signal modifizieren können, um die Wasserzeichendaten unklar zu machen. Hierbei handelt es sich um ein Prinzip, welches als "Sicherheit durch Obskurität" bekannt ist. In der Technik der Verschlüsselung wird Sicherheit durch Obskurität insgesamt als ein unlogisches Prinzip abgetan. Wenn ein Algorithmus oder Prozeß seine Sicherheit vom Geheimnis ableitet, braucht nur ein einziger Mensch die Einzelheiten der Technik zu offenbaren, und die Sicherheit des ganzen Systems ist dahin.
  • Die Ziele der Sicherheit lassen sich wie folgt zusammenfassen:
    • • Den Inhalt auf solche Weise zu schützen, daß Diebstahl des Inhalts entweder unbrauchbar ist oder anschließenden Nachweis von Raub und Verfolgbarkeit bis zur Quelle des Raubs ermöglichen,
    • • robust sein gegen Angriffe, und
    • • sogar am schwächsten Glied im System hohe Sicherheit aufrechtzuerhalten.
  • OFFENBARUNG DER ERFINDUNG
  • Die vorliegende Erfindung betrifft ein Verfahren zum Modifizieren des Betriebs des Kodierers- und/oder Dekodierers eines perzeptuellen Kodiersystems in Abhängigkeit von Zusatzinformation, so daß die Zusatzinformation in der Ausgabe des Dekodierers feststellbar sein kann. Ein oder mehr Parameter im Kodierer und/oder Dekodierer werden in Abhängigkeit von der Zusatzinformation moduliert. WO 99 29114A (AT & TCORP) offenbart das Modifizieren der Kodiererfunktion eines perzeptuellen Kodiersystems in Übereinstimmung mit Zusatzinformation in Form von Wasserzeichendaten. Gleichfalls offenbart wird, die Modifizierung so durchzuführen, daß die Zusatzinformation in der Ausgabe der Dekodiererfunktion feststellbar sein kann, und eine Modulation in Abhängigkeit vom Vorhandensein von Wasserzeichendaten.
  • Gemäß der vorliegenden Erfindung wird Zusatzinformation, beispielsweise Wasserzeicheninforma tion durch Modulieren von einem oder mehr Parametern im Kodierer und/oder Dekodierer eines perzeptuellen Kodiersystems übermittelt, um eine feststellbare, aber vorzugsweise nichtwahrnehmbare Änderung in der Ausgabe des Dekodierers zu verursachen. Diese Information ist insofern ein "Zusatz", als sie zusätzlich zu der Primärinformation, beispielsweise Ton- oder Bildinformation gegeben wird, die das Kodiersystem führt. Typischerweise liegt solche Zusatzinformation in Form eines "Wasserzeichens" vor, obwohl das nicht so sein muß. Man kann sagen, daß mit der Modulation von einem oder mehr Parametern die Zusatz- oder Wasserzeicheninformation in das kodierte Signal (wenn Parameter im perzeptuellen Kodierer moduliert werden) und in das dekodierte Signal, wenn Parameter im perzeptuellen Kodierer und/oder perzeptuellen Dekodierer moduliert werden) "eingebettet" werden.
  • Auch wenn bei gewissen Verwirklichungen der Erfindung, wenn sie mindestens teilweise in einem Kodierer verwirklicht wird, Bitstromdaten, welche die primäre Information wiedergeben, indirekt modifiziert werden können, ist die Erfindung nicht darauf abgestellt, Bitstromdaten direkt zu modifizieren, welche primäre Information wiedergeben (und auch nicht das Modifizieren der primären Information, die nach dem Quantisieren im perzeptuellen Kodierer zu Bitstromdaten wird). Die Erfindung ist abgestellt auf das Erfassen der Zusatzinformation in der Ausgabe des perzeptuellen Dekodierers (gleichgültig ob diese Information als Ergebnis von Aktionen im Kodierer und/oder Dekodierer übermittelt wird) statt in dem nicht dekodierten Bitstrom.
  • Mit "Modulieren" ist gemeint, den Wert eines Parameters zwischen oder unter einem oder mehr Werten (Zuständen) zu ändern, wobei diese Werte einen "Vorgabewert" umfassen können, den der Parameter sonst gehabt hätte, wenn es nicht die Tätigkeit der vorliegenden Erfindung gäbe. Zum Beispiel kann der Parameterwert zwischen oder unter dem Vorgabewert und einem oder mehr weiteren Werten geändert werden (im Fall eines Parameters, der nur zwei mögliche Werte hat, wird ein solcher Parameter manchmal als "Kennzeichen" bezeichnet, und der Parameter kann zwischen diesen beiden Werten geändert werden) oder er kann zwischen oder unter einem oder mehr sonstigen Werten geändert werden, die den Vorgabewert nicht umfassen.
  • Mit "Modulieren in Abhängigkeit von" Zusatzinformation oder einem Wasserzeichensignal oder einer Folge ist gemeint, daß das Modulieren eines Parameters durch die Zusatzinformation oder das Wasserzeichensignal oder die Folge entweder direkt oder indirekt gesteuert wird, beispielsweise wenn die Steuerung durch eine Funktion von einem oder mehr weiteren Signalen modifiziert wird, wobei zu diesen Signalen beispielsweise ein Befehlssatz, wie eine deterministische Folge oder das an das Kodiersystem angelegte Eingabesignal gehören.
  • Mit "Parameter" ist eine Variable innerhalb eines perzeptuellen Kodiersystems gemeint, bei der es sich nicht um Bitstromdaten handelt, welche die primäre Information wiedergeben. Beispiele für Dolby Digital (AC-3), MPEG Audio- und MPEG-Videoparameter, die zum Modulieren in Übereinstimmung mit Aspekten der vorliegenden Erfindung geeignet sind, werden nachfolgend in den Tabellen der 6, 7 bzw. 8 gezeigt. Die Erfindung ist auch auf das Modulieren von einem oder mehr Parametern abgestellt, die nicht in veröffentlichten Normen für perzeptuelle Kodierer anerkannt sind, einschließlich noch nicht definierter Parameter.
  • Mit "primäre Information wiedergebende Bitstromdaten" sind Datenbits im kodierten Bitstrom gemeint, die der perzeptuelle Kodierer erzeugt hat, die aber noch nicht dekodiert sind, und die primäre Information, beispielsweise Ton- oder Bildinformation führen. Bitstromdaten, die primäre Information wiedergeben, umfassen beispielsweise im Fall eines Dolby Digital (AC-3) Systems Exponenten und Mantissen und im Fall eines MPEG-2 AAC Systems Skalierungsfaktoren und Huffmann kodierte Koeffizienten.
  • In komplexen perzeptuellen Kodiersystemen (z.B. Dolby Digital und Dolby E Audio, MPEG Audio, MPEG Video usw.) bietet eine große Anzahl unabhängiger Kodierparameter ein nennenswertes Ausmaß an Kodiertlexibilität. "Dolby", "Dolby Digital" und "Dolby E" sind Warenzeichen der Dolby Laboratories Licensing Corporation.
  • Einzelheiten zur Dolby Digital Kodierung finden sich in "Digital Audio Compression Standard (AC-3)", Advanced Television Systems Committee (ATSC), Dokument A/52, 20. Dezember 1995 (verfügbar im Internet unter www.atsc.org/Standards/A52/a_52.doc.). Siehe auch das Fehlerblatt vom 22. Juli 1999 (verfügbar im Internet unter www.dolby.com/tech/ATSC_err.pdf).
  • Einzelheiten zur Dolby E Kodierung finden sich in "Effizient Bit Allocation, Quantization, and Coding in an Audio Distribution System", AES, Preprint 5068, 107. AES Conference, August 1999 und "Professional Audio Coder Optimized for Use with Video", AES Preprint 5033, 107. AES Conference August 1999.
  • Einzelheiten zur MPEG-2 AAC Kodierung finden sich in der Veröffentlichung ISO/IEC 13818-7:1997(E) "Information technology – Generic coding of moving pictures und associated audio information-, Teil 7: Advanced Audio Coding (AAC)," International Standards Organization (April 1997); "MP3 und AAC Explained" von Karlheinz Brandenburg, AES 17. International Conference on High Quality Audio Coding, August 1999; und "ISO/IEC MPEG-2 Advanced Audio Coding" von Bosi, et.al., AES preprint 4382, 101. AES Convention, Oktober 1996.
  • Ein Überblick über verschiedene perzeptuelle Kodierer, einschließlich Dolby Kodierer, MPEG Kodierer und weitere findet sich in "Overview of MPEG Audio: Current and Future Standards for Low-Bit-Rate Audio Coding," von Karlheinz Brandenburg und Marina Bosi, J. Audio Eng. Soc., Bd. 45, Nr. 1/2, Januar/Februar 1997.
  • Spezifische Vorgabewerte für perzeptuelle Kodierparameter werden im allgemeinen vom Kodiersystem anhand der Eigenschaften des Eingabesignals gewählt. Es gibt aber gewöhnlich mehr als eine Möglichkeit, Kodierparameterwerte auszuwählen, welche dekodierte Signale hervorbringen, die keine wahrnehmbaren Unterschiede haben, und derartige Abweichungen in Kodierparameterwerten können zu dekodierten Signalen mit feststellbaren, jedoch nichtwahrnehmbaren Unterschieden führen. Es sei darauf hingewiesen, daß mit der Nichtwahrnehmbarkeit die menschliche Wahrnehmung gemeint ist, während die Feststellbarkeit auf den Fähigkeiten eines Detektors beruht, der nicht ein Mensch ist.
  • Ein Zusatzsignal- oder Wasserzeichendetektor stellt die innerhalb des wiederhergestellten (dekodierten) Signals eingebettete Information wieder her. Beispielsweise kann im Fall von Tonsignalen die Erfassung in manchen Fällen akustisch erfolgen, während eine elektronische Erfassung in anderen Fällen erforderlich sein mag. Eine elektronische Erfassung kann in der digitalen oder der analogen Domäne erfolgen. Die elektronische Erfassung in der digitalen Domäne kann in der Zeit- oder Frequenzdomäne der dekodierten Ausgabe liegen oder sie kann in der Frequenzdomäne innerhalb des Dekodierers vor der Frequenz/Zeit-Umsetzung erfolgen. Das Wasserzeichen nach der akustischen Verarbeitung zu extrahieren, wird als eine schwierigere Herausforderung betrachtet, weil Zimmergeräusch, Lautsprecher- und Mikrophoneigenschaften sowie das gesamte Volumen der Wiedergabe hinzukommen.
  • Mit vielen praktizierten perzeptuellen Kodiersystemen wird das Erfordernis nicht erfüllt, daß zusätzliches Rauschen unterhalb des Pegels des gerade bemerkbaren Unterschieds gehalten werden muß. Erfordernisse hinsichtlich der Wahrnehmbarkeit bei perzeptuellen Kodiersystemen werden oft weniger streng gehandhabt, um Bitratenzielen oder Komplexitätsgrenzen zu entsprechen. In diesen Fällen wird es, obwohl während des perzeptuellen Kodierens hinzu gekommenes Rauschen wahrnehmbar sein mag, wahrscheinlich abgesehen von Vorgabewerten andere Werte geben, auf die Kodierparameter moduliert werden können, die das bereits wahrnehmbare Rauschen nicht noch wahrnehmbarer machen. Auch wenn die Modulation eines Parameters im wesentlichen zu einer nichtwahrnehmbaren Änderung des erfaßten Rauschens führen mag, kann sie dennoch eine erfaßbare Änderung im dekodierten Signal zur Folge haben.
  • In Übereinstimmung mit Aspekten der vorliegenden Erfindung wird vorzugsweise ein Parameter oder mehr Parameter moduliert, so daß die Auswirkungen der Modulation dazu führen, daß das Rauschen und die Verzerrung, die durch perzeptuelles Kodieren hinzugefügt wurden, zwar in der Nähe, aber unterhalb des Pegels des gerade bemerkbaren Unterschieds im gesamten oder einem Teil des Frequenzspektrums liegen. (In diesem Sinn ist "Verzerrung" der Unterschied zwischen dem kodierten und dem ursprünglichen Signal und sie kann hörbare Artefakte hervorbringen oder auch nicht). Deshalb wäre es schwierig, die resultierenden Auswirkungen der Modulation von einem oder mehr Parametern zu entfernen oder unklar zu machen, ohne die Maskierschwelle zu überschreiten und eine wahrnehmbare Beeinträchtigung zu erzeugen. Wenn andererseits ein Angriff unterhalb der Maskierschwelle läge, besteht die Wahrscheinlichkeit, daß ein Teil der Auswirkungen der Parametermodulation bestehen bleibt.
  • Wie vorstehend schon gesagt, können Aspekte der vorliegenden Erfindung auch dann angewandt werden, wenn der Kodierer nicht das primäre Quellensignal kodiert, so daß Rauschen und Verzerrung unterhalb des Pegels des gerade bemerkbaren Unterschieds liegen. In diesem Fall wird das Quellensignal so kodiert, daß es in Bezug auf die Quelle beeinträchtigt wird, und die Parametermodulation führt Beeinträchtigungen im dekodierten Signal ein, die sich unter dem Gesichtspunkt der Erfassung zwar unterscheiden, aber hinsichtlich der Wahrnehmbarkeit vorzugsweise gleich sind. Wie im vorherigen Fall wäre es schwierig, die entstehenden Auswirkungen der Parametermodulation im dekodierten Signal zu beseitigen oder unklar zu machen, ohne daß die Beeinträchtigung verstärkt würde oder zusätzliche Beeinträchtigungen mit einem höheren Grad an Wahrnehmbarkeit eingeführt würden.
  • Der Ansatz der vorliegenden Erfindung unterscheidet sich grundsätzlich von Techniken, mit denen ein Wasserzeichen vor dem perzeptuellen Kodieren eingebracht wird. Bei jenen Techniken gibt es, auch wenn das Kodiersystem eine ausreichend große Kodiermarge zum Übermitteln eines Wasserzeichens enthalten mag, keine Garantie, daß das jeweils gewählte Verfahren zum Übermitteln des a priori Wasserzeichens mit dem Ort der Kodiermarge des perzeptuellen Kodiersystems zusammenfällt. Da solche Voraussysteme unabhängig funktionieren, kann es sein, daß sie gelegentlich eine schlechte Wechselwirkung haben und wahrnehmbare Beeinträchtigungen einführen oder eine Verwischung des Wasserzeichens verursachen.
  • Wie schon gesagt, wird mit perzeptuellen Kodierern die Datenflußgeschwindigkeit eines Eingabesignals reduziert, weil perzeptuell redundante Information herausgenommen wird. Ein Kodierer mit konstanter Datenflußgeschwindigkeit reduziert beispielsweise eine feste Rate eingegebener Informationen auf eine niedrigere feste Rate von Informationen. Ein Teil dieser Datenreduzierung erfordert eine Funktion, die manchmal als eine "Ratensteuerung" gekennzeichnet wird und sicherstellt, daß die Kodiererausgabe die endgültige feste Informationsgröße nicht überschreitet. Die Ratensteuerung reduziert Information, bis diese die endgültige kodierte Größe erreicht hat.
  • Bei manchen perzeptuellen Kodierern ist die Verzerrungsmessung mit der Ratensteuerung gepaart, um sicherzustellen, daß die richtige Information ausgeschieden wird. Bei einer Verzerrungsmessung wird das ursprüngliche Eingabesignal mit dem kodierten Signal verglichen (Ausgabe der Ratensteuerung). Das Maß der Verzerrung kann zum Steuern von Kodierparametern benutzt werden, um das Ergebnis des Ratensteuerungsprozesses zu ändern.
  • Der Aspekt der Verzerrungsratensteuerung der vorliegenden Erfindung soll das Problem lösen helfen, wie ein Wasserzeichen in einem perzeptuellen Kodierer unter Maximierung der Stärke und Minimierung der Wahrnehmbarkeit des eingebetteten Signals eingebettet werden kann. Bei einem Ausführungsbeispiel ermöglicht es die vorliegende Erfindung auch einem Benutzer, die Stärke oder Energie des eingebetteten Signals durch Einstellung eines Parameters in dem Prozeß zum Einbetten des Wasserzeichens zu wählen.
  • Zusätzlich zur Parametermodulation wird gemäß Aspekten der vorliegenden Erfindung ein Befehlssatz angewandt, beispielsweise eine deterministische Folge zum Ändern gewisser Aspekte der Parametermodulation und damit von Eigenschaften des resultierenden Wasserzeichens. Deterministische Folgen werden durch mathematische Prozesse erzeugt, die Folgen binärer Einsen und Nullen hervorbringen, welche bei gegebener bestimmender Gleichung (Generatorgleichung) und eines Ausgangszustands (Schlüssel) berechnet werden. Es wird eine Anzahl alternativer Aspekte der Erfindung vorgestellt, die mit deterministischen Sequenzen arbeiten. Mit diesen Techniken kann die Nichtwahrnehmbarkeit des Wasserzeichens und ebenso die Robustheit des Wasserzeichens verbessert werden, was ein interessantes und nützliches Ergebnis ist, denn bei vielen anderen Techniken, mit denen die Nichtwahrnehmbarkeit verbessert wird, besteht die Tendenz, daß die Robustheit leidet. Schließlich kann mit diesen Techniken die Sicherheit in dem Sinne verbessert werden, als es möglich ist, alle Aspekte des Wasserzeichensystems (mit Ausnahme des Schlüssels der deterministischen Folge) zu erkennen zu geben, ohne die Robustheit des Systems zu opfern.
  • Aspekte der deterministischen Folge der vorliegenden Erfindung können eine oder mehr der folgenden Tätigkeiten umfassen:
    • • Anwenden einer deterministischen Folge zum Modifizieren der Geschwindigkeit von Parametermoduiationsübergängen und infolge dessen der Übergangsgeschwindigkeit der. Wasserzeichensymbole (siehe nachstehende Tabelle 1),
    • • Anwenden einer deterministischen Folge zur Auswahl des/der Parameter zur Modulation (siehe nachstehende Tabelle 2, und
    • • Anwenden einer deterministischen Folge zum Modifizieren der Geschwindigkeit, mit der die Wahl der Parameter zur Modulation sich ändert (siehe nachstehende Tabelle 3).
  • Darüber hinaus umfassen alternative Aspekte der vorliegenden Erfindung Tätigkeiten der Anwendung von Charakteristiken des Quellensignals für die Steuerung der Parametermodulation und/oder Wahl der Parameter zur Modulation. Quellensignalabhängige Aspekte der vorliegenden Erfindung können eine oder mehr der folgenden Tätigkeiten umfassen:
    • • Anwenden von Charakteristiken des Quellensignals zur veränderlichen Modifizierung der Parametermodulationsgeschwindigkeit und infolgedessen der Übergangsgeschwindigkeit der Wasserzeichensymbole (siehe Teil a der nachstehenden Tabelle 4),
    • • Anwenden von Charakteristiken des Quellensignals zum veränderlichen Modifizieren der Geschwindigkeit, mit der die Wahl der Parameter zur Modulation sich ändert (siehe Teil b der nachstehenden Tabelle 4), und
    • • Anwenden von Charakteristiken des Quellensignals zum veränderlichen Modifizieren der Anzahl Parameter im verfügbaren Parametersatz zur Modulation (siehe nachstehende Tabelle 5).
  • Wie weiter unten noch erläutert wird, können im Zusammenhang mit Modulationsparametern sowohl eine deterministische Folge als auch Charakteristiken des Quellensignals gemäß alternativen Aspekten der vorliegenden Erfindung angewandt werden, siehe nachstehende Tabellen 6, 7 und 8.
  • Bei manchen Verwirklichungen der Erfindung ist es wahrscheinlich, daß für die Wasserzeichenerfassung in der Ausgabe des perzeptuellen Dekodierers Zugang zu der dem Kodieren aufgegebenen primären Information erforderlich ist. Bei manchen anderen Verwirklichungen der Erfindung kann die Wasserzeichenerfassung durchgeführt werden, ohne daß Zugang zur ursprünglichen primären Information besteht, allerdings auf Kosten einer größeren Komplexität bei der Erfassung.
  • Häufig ist es wünschenswert, ein einmaliges oder "serialisiertes" (z.B. laufende Nummer) Wasserzeichen an der Stelle anzubringen, wo Signale an eine Zuhörerschaft abgegeben werden. Gemäß Aspekten der vorliegenden Erfindung wird Zusatzinformation oder ein Wasserzeichen während des perzeptuellen Dekodierprozesses eingebettet. Ein oder mehr Parameter werden im Dekodierer vor der Rückquantisierung moduliert.
  • Die Nichtwahrnehmbarkeit kann aufrechterhalten werden, wenn das durch den Parametermodulationsprozeß im Dekodierer hinzugefügte Rauschen oder die Verzerrung eine perzeptuelle Schwelle nicht übersteigt. Um ein Wasserzeichen als Teil des Dekodierprozesses nichtwahrnehmbar einzubetten, wird eine perzeptuelle Schwelle angewandt. Viele perzeptuelle Kodierer übertragen perzeptuelle Modelle vom Kodierprozeß zum Dekodierprozeß in der einen oder anderen Form; aber andere Kodierer bieten nur Näherungen oder grobe Wiedergaben der perzeptuellen Schwelle. Die genaueste perzeptuelle Schwelle wird aus den nichtquantisierten Spektralkoeffizienten der Quelle abgeleitet, aber die Zunahme der Datenflußgeschwindigkeit ist signifikant, wenn solche Daten dem Dekodierer übermittelt werden. Als Alternative kann die für den Dekodierer in einem perzeptuellen Kodiersystem bereitgestellte perzeptuelle Schwelle ein Exponent einer Mantisse sein, wobei der Exponent den Informationsabtastwert wiedergibt, der die maximale Energie innerhalb eines kritischen Bandes hat (wie im Dolby Digital System). Um die Genauigkeit der perzeptuellen Schwelle im Dekodierer zu verbessern, können Exponenten vom Kodierer übertragen werden, die auf einem Durchschnitt abgetasteter Energie in einem Band statt auf der maximalen Energie im Band beruhen.
  • Obwohl das Modulieren von Parametern im Dekodierer der Parametermodulation im Kodierer in vieler Hinsicht ähnelt, besteht weniger Flexibilität. Zum Beispiel kann es für das Modulieren von einem oder mehr Parametern in einem Dekodiersystem erforderlich sein, Sorgfalt walten zu lassen, wenn die Bitzuordnungsinformation auf der Basis der Kodierparameter neu formuliert wird. Außerdem ist es schwieriger, die Auswirkungen der Parametermodulation im Dekodierer nichtwahrnehmbar zu machen. Ein Grund dafür besteht darin, daß mindestens im Fall eines idealen Kodierers der Kodierprozeß bereits Quantisierungsfehler bis zur Schwelle der Wahrnehmbarkeit hinzugefügt hat. Das ist allerdings nicht immer der Fall, weil es eine Kodiermarge, beispielsweise aufgrund von Unvollkommenheiten im perzeptuellen Modell, einer positiven Versetzung des Rauschabstands oder Signalbedingungen geben kann.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Es zeigt:
  • 1 eine idealisierte Kurve (durchgezogene Linie) des Schalldruckpegels, bei dem Schall gerade hörbar ist (Hörschwelle), wenn keine Maskiersignale vorhanden sind, und eine Kurve (gestrichelte Linie) der Hörschwelle bei Vorhandensein einer 500 Hz Sinuswelle;
  • 2 ein Funktionsblockschaltbild der Grundprinzipien der vorliegenden Erfindung, bei der Zusatzinformation einen oder mehr Parameter einer perzeptuellen Kodiererfunktion und/oder einer perzeptuellen Dekodiererfunktion in einem perzeptuellen Kodiersystem moduliert;
  • 3A ein Funktionsblockschaltbild eines Aspektes der vorliegenden Erfindung, der eine Detektorfunktion für Zusatzinformation umfaßt, welche die Ausgabe des Kodiersystems empfängt;
  • 3B ein Funktionsblockschaltbild eines Aspektes der vorliegenden Erfindung mit mehr Einzelheiten der Detektorfunktion, die eine Detektorfunktion für Zusatzinformation umfaßt, welche die Ausgabe des Kodiersystems empfängt;
  • 4 ein Funktionsblockschaltbild eines Aspektes der vorliegenden Erfindung, der eine Detektorfunktion für Zusatzinformation umfaßt, die sowohl die Ausgabe des Kodiersystems als auch die Eingabe in das Kodiersystem empfängt;
  • 5 ein Funktionsblockschaltbild eines Aspektes der vorliegenden Erfindung, bei dem die Detektorfunktion für Zusatzinformation nicht nur eine Vergleichsfunktion, sondern auch eine perzeptuelle Kodiererfunktion und eine perzeptuelle Dekodiererfunktion umfaßt, deren beider Parameter nicht moduliert werden;
  • 6 eine Tabelle geeigneter Parameter für die Modulation in gewissen perzeptuellen Audiosignalkodierern des hybriden vorwärts/rückwärtsadaptiven Typs;
  • 7 eine Tabelle geeigneter Parameter für die Modulation in gewissen perzeptuellen Audiosignalkodierern des vorwärtsadaptiven Typs;
  • 8 eine Tabelle geeigneter Parameter für die Modulation in gewissen perzeptuellen Videosignalkodierern;
  • 9 eine schematische Darstellung gewisser Parameter, die in gewissen perzeptuellen Audiosignalkodierern die Maskierkurve des menschlichen Ohrs spektral modellieren (Modellparameter spektraler Maskierung);
  • 10 eine schematische Darstellung der Modellparameter spektraler Maskierung, die in einer Klasse perzeptueller Audiosignalkodierer moduliert werden können;
  • 11A eine idealisierte Darstellung der Modulation des SNR-Versatzparameters (ein Maskierschwellenparameter) bei Vorhandensein eines Sinuswellensignals in gewissen perzeptuellen Audiosignalkodierern;
  • 11B eine idealisierte Darstellung der Auswirkung in der Ausgabe des perzeptuellen Dekodierers, wenn der SNR-Versatzparameter in der in 11A gezeigten Weise moduliert ist, und zwar für den Fall eines Kodiersystems mit Biteinschränkung;
  • 11C eine idealisierte Darstellung der Auswirkung in der Ausgabe des perzeptuellen Dekodierers, wenn der SNR-Versatzparameter in der in 11A gezeigten Weise moduliert ist, und zwar für den Fall eines Kodiersystems, das keine Biteinschränkung hat;
  • 11D die in den 11A–C und 12A–C verwendeten Legenden;
  • 12A eine idealisierte Darstellung der Modulation des Sofortverstärkungscode-Parameters (eines Maskierschwellenparameters) bei Vorhandensein eines Sinuswellensignals in gewissen perzeptuellen Audiosignalkodierern;
  • 12B eine idealisierte Darstellung der Auswirkung in der Ausgabe des perzeptuellen Dekodierers, wenn der Schnellverstärkungscode-Parameter in der in 12A gezeigten Weise moduliert ist, und zwar für den Fall eines Kodiersystems mit Biteinschränkung;
  • 12C eine idealisierte Darstellung der Auswirkung in der Ausgabe des perzeptuellen Dekodierers, wenn der Sofortverstärkungscode-Parameter in der in 12A gezeigten Weise moduliert ist, und zwar für den Fall eines Kodiersystems, das keine Biteinschränkung hat;
  • 13 eine idealisierte Darstellung der in gewissen perzeptuellen Audiokodierern beobachteten Auswirkungen der Modulation von anderen als Maskierparametern in gewissen perzeptuellen Audiosignalkodierern, nämlich das Kennzeichen "Kopplung im Gebrauch", das Kennzeichen "Neumatrizieren im Gebrauch" und den Kopplungsbeginnfrequenzcode;
  • 14 eine idealisierte Darstellung der in gewissen perzeptuellen Audiosignalkodierern beobachteten Auswirkungen der Modulation eines anderen als eines Maskierparameters, nämlich des Phasenkennzeichens;
  • 15 eine Serie idealisierter Signalverläufe, die Alias-Fensterformen der Zeitdomäne zum Einbetten von Zusatzinformation während des Kodierens zeigen;
  • 16 eine Serie idealisierter Signalverläufe, die Alias-Fensterformen der Zeitdomäne zum Einbetten von Zusatzinformation während des Dekodierens zeigen;
  • 17 eine idealisierte zeitliche Hüllkurvenreaktion, in der der Schalldruckpegel (SPL) über der Zeit eingetragen ist und die zeitlichen Maskierwirkungen eines Maskiersignals veranschaulicht sind;
  • 18 eine idealisierte Darstellung der Art von Modulationen, denen ein Signal unterzogen werden kann, so daß die Auswirkungen innerhalb einer zeitlichen Maskierhüllkurve eingeschränkt sind;
  • 19 eine Serie idealisierter Kurven von Amplituden über Frequenzen, in denen veranschaulicht wird, wie ein 2-Bit Symbol durch vier verschiedene Bandbreiten wiedergegeben werden kann;
  • 20 eine idealisierte Kurve von Frequenz über Zeit, die ein Beispiel eines Audiosignals zeigt, welches ein eingebettetes Signal enthält, wobei die Bandbreite des Signals benutzt wird, um unterschiedliche Symbole wiederzugeben;
  • 21 eine idealisierte Kurve einer Amplitude über einer Frequenz, welche das Hinzufügen von Rauschen in einer Gestalt entsprechend dem ungefähren Pegel der menschlichen Hörschwelle bei Vorhandensein eines Sinuswellensignals veranschaulicht;
  • 22 eine idealisierte Kurve von Energie über Frequenz, die drei verschiedene Energiepegel zeigt, welche zum Erfassen von vier unterschiedlichen Bandbreiten nötig sind, die ein 2-Bit Symbol erzeugen;
  • 23 eine idealisierte Kurve einer Amplitude über Energie, die mehrere Histogramme als Beispiel der Verteilung von "hoch"- und "tief'-Zuständen zeigen;
  • 2426 logische Flußpläne eines Prozesses zum Einbetten eines Wasserzeichens unter Verwendung einer Schwelle der Wahrnehmbarkeit;
  • 24 einen logischen Flußplan des inneren Iterationsschleifenteils des Prozesses zum Einbetten eines Wasserzeichens unter Verwendung einer Schwelle der Wahrnehmbarkeit;
  • 25 einen logischen Flußplan des äußeren Iterations-Schleifenteils des Prozesses zum Einbetten eines Wasserzeichens unter Verwendung einer Schwelle der Wahrnehmbarkeit, bei dem die Spektralkoeffizienten der äußeren Schleife verstärkt sind;
  • 26 einen logischen Flußplan der Modifikation des Prozesses gemäß 25 um das psychoakustische Modell oder eine perzeptuelle Schwelle so gut wie möglich zu erfüllen, während gleichfalls die Zusatzinformation oder ein Wasserzeichensignal eingebettet wird;
  • 27 eine Serie idealisierter Signalverläufe, die über ein Frequenzspektrum hinweg die perzeptuelle Schwelle, den Quantisierfehler und modifizierten Quantisierfehler zeigen und veranschaulichen, wie unter Anwendung eines Verzerrungsmeßprozesses ein Wasserzeichen eingebettet werden kann, und zwar für den Fall der Modulation eines Parameters, der Quantisierfehler innerhalb eines kritischen Bandes beeinflußt;
  • 28 eine Serie idealisierter Signalverläufe, die über ein Frequenzspektrum hinweg die perzeptuelle Schwelle, den Quantisierfehler und modifizierten Quantisierfehler zeigen und veranschaulichen, wie unter Anwendung eines Verzerrungsmeßprozesses ein Wasserzeichen eingebettet werden kann, und zwar für den Fall der Modulation eines Parameters, der den Rauschabstand-Versatz durch das ganze Frequenzspektrum beeinflußt;
  • 29 einen logischen Flußplan, der die Schritte eines Prozesses zum Einbetten eines Wasserzeichens während des Dekodierens in Übereinstimmung mit Aspekten der vorliegenden Erfindung veranschaulicht;
  • 30 ein Funktionsblockschaltbild, welches weitere Aspekte der Erfindung zeigt, bei denen die Steuerung der Modulation durch Zusatzinformation eines Wasserzeichens modifiziert wird durch eine Funktion von einem oder mehr weiteren Signalen oder Datenfolgen, einschließlich beispielsweise einer deterministischen Folge oder des an das Kodiersystem angelegten Eingabesignals.
  • BESTE ART UND WEISE ZUM AUSFÜHREN DER ERFINDUNG.
  • 2 ist ein Funktionsblockschaltbild, welches die Grundprinzipien der vorliegenden Erfindung veranschaulicht. Ein perzeptuelles Kodiersystem weist eine perzeptuelle Kodiererfunktion 2 und eine perzeptuelle Dekodiererfunktion 4 auf. Primäre Information, beispielsweise Ton- oder Bildinformation wird der perzeptuellen Kodiererfunktion 2 zugeführt. Die Kodiererfunktion 2 erzeugt einen digitalen Bitstrom, der von der perzeptuellen Dekodiererfunktion 4 empfangen wird. Ein oder mehr Parameter in der Kodiererfunktion und/oder der Dekodiererfunktion wird/werden in Abhängigkeit von Zusatzinformation moduliert (z.B. ein Wasserzeichensignal oder eine Folge). Da Zusatzinformation entweder der Kodiererfunktion oder der Dekodiererfunktion oder beiden zugeführt werden kann, sind gestrichelte Linien von der Zusatzinformation zur Kodiererfunktion bzw. zur Dekodiererfunktion eingetragen. Die Ausgabe der perzeptuellen Dekodiererfunktion ist primäre Information mit eingebetteter Zusatzinformation. Die Zusatzinformation kann in der Ausgabe der Dekodiererfunktion feststellbar sein.
  • Wenn Zusatzinformation sowohl der Kodiererfunktion 2 als auch der Dekodiererfunktion 4 zugeführt wird, ist es üblich, daß sich die dem einen zugeführte Information von der dem anderen zugeführten unterscheidet. Beispielsweise könnte die Zusatzinformation, die einen oder mehr Kodiererfunktionsparameter steuert, ein Wasserzeichen sein, welches den Eigentümer des Ton- oder Bildinhalts identifiziert, und die Zusatzinformation, die eine oder mehr Dekodiererfunktionsparameter steuert, könnte eine laufende Nummer sein, welche das Gerät identifiziert, welches den Ton- oder Bildinhalt einem oder mehr Verbrauchern präsentiert. Üblicherweise würde die Zusatzinformation der Kodiererfunktion und der Dekodiererfunktion zu unterschiedlichen Zeiten zugeführt.
  • Die 35 sind Funktionsblockschaltbilder, welche die Grundprinzipien eines Aspektes der vorliegenden Erfindung veranschaulichen, der eine Detektorfunktion zum Erfassen der Zusatzinformation in der Ausgabe der Dekodiererfunktion umfaßt. Die Erfassung kann in der digitalen Domäne oder der analogen Domäne (elektrisch oder akustisch) der Dekodiererfunktionsausgabe vorgenommen werden. Die Erfassung kann auch in der digitalen Domäne der Dekodiererfunktion nach dem Dekodieren, aber vor der Umsetzung von der Frequenzdomäne zur Zeitdomäne erfolgen.
  • 3A gleicht 2, außer daß sie eine Detektorfunktion 6 umfaßt, welche die Ausgabe der Dekodiererfunktion 4 empfängt, die die Zusatzinformation in der Ausgabe der Dekodiererfunktion erfaßt. Die Ausgabe der Detektorfunktion 6 ist die Zusatzinformation. 4 gleicht 3A, außer daß sie eine Detektorfunktion 8 umfaßt, die nicht nur die Ausgabe der Dekodiererfunktion 4, sondern auch die gleiche primäre Information empfängt, die der Kodiererfunktion zugeführt wurde. Die wesentliche Funktion der Detektorfunktion 8 ist das Vergleichen der ursprünglich eingegebenen Information, die der Kodiererfunktion zugeführt wurde, mit der Ausgabe der Dekodiererfunktion, um als ihre Ausgabe die Zusatzinformation bereitzustellen. 5 ist eine Abwandlung der in 4 gezeigten Anordnung. In 5 empfängt, ebenso wie in 4, eine Detektorfunktion 10 die Ausgabe der Dekodiererfunktion 4 und die der Kodiererfunktion 2 zugeführte primäre Information. Allerdings unterscheidet sich die Detektorfunktion 10 von der Detektorfunktion 8 und umfaßt nicht nur eine Vergleichsfunktion 12, sondern auch eine perzeptuelle Kodiererfunktion 14 und eine perzeptuelle Dekodiererfunktion 16. Die Kodiererfunktion 14 ist die gleiche wie die Kodiererfunktion 2, außer daß ihre Parameter nicht moduliert werden. Die Dekodiererfunktion 16 ist die gleiche wie die Dekodiererfunktion 4, außer daß ihre Parameter nicht moduliert werden. Die Aufgabe des Erfassens der Zusatzinformation in der Ausgabe des Dekodierers wird also mittels einer der folgenden Tätigkeiten erledigt:
    • – Beobachten des dekodierten Signals;
    • – Vergleichen des dekodierten Signals mit dem der Kodiererfunktion zugeführten Signal, und
    • – Vergleichen des dekodierten Signals mit dem dekodierten Signal von einem im wesentlichen identischen perzeptuellen Kodiersystem, in dem keine Parameter in der Kodiererfunktion oder Dekodiererfunktion in Abhängigkeit von Zusatzinformation moduliert werden.
  • Die in 3A gezeigte Erfassungsanordnung ist am besten geeignet zum Erfassen der Auswirkungen gewisser Arten von Parametermodulation, beispielsweise wenn ein Bandbreitenparameter moduliert wird (die Modulation von Bandbreitenparametern wird nachstehend näher beschrieben). Um die Auswirkungen der Modulation der meisten Parameter zu erfassen, muß die dem Kodierer zugeführte primäre Information mit primärer Information verglichen werden, in der Zusatzinformation eingebettet ist, die vom Dekodierer bereitgestellt wurde, wie bei den Anordnungen gemäß 4 und 5. Die in 5 gezeigte Anordnung macht es möglich, einen strengeren Vergleich durchzuführen, denn die einzigen Unterschiede zwischen den verglichenen Informationen sind diejenigen, die von den Modulationsparametern verursacht wurden. Bei der in 4 gezeigten Anordnung schließen die Unterschiede weitere Auswirkungen ein, die durch die Prozesse des perzeptuellen Kodierens und Dekodierens eingeführt sein können.
  • Da für die Erfassungsanordnung gemäß 3A Zugang zu der dem perzeptuellen Kodierer zugeführten primären Information nicht nötig ist, kann dies, je nach dem, welche Kodierer- oder Dekodiererparameter moduliert wurden, in Echtzeit oder nahezu Echtzeit erfolgen. Zum Beispiel kann die Modulation eines Bandbreitenparameters es ermöglichen, daß durch alleiniges Analysieren der Dekodiererausgabe in Echtzeit oder nahezu Echtzeit erfaßt wird. Insbesondere kann die Detektorfunktion 6 in der Anordnung gemäß 3A eine oder mehr Verzögerungsfunktionen umfassen, so daß die Ausgabe der Dekodiererfunktion 4 mit sich selbst verglichen werden kann. Wie beispielsweise 3B zeigt, kann die Detektorfunktion 6 eine Vergleichsfunktion 12' und eine oder mehr Verzögerungsfunktionen 7, 7' usw. umfassen, so daß die Tätigkeit der Beobachtung des dekodierten Signals den Vergleich des dekodierten Signals mit einer zeitlich verzögerten Version desselben einschließt. Energiezustände aus einem oder mehr vorhergehenden Blöcken werden einer Vergleichsfunktion unterworfen, die eine Schwelle anwendet, um das Symbol zu bestimmen, beispielsweise nach Art einer nachstehend beschriebenen Erfassung, der Bandbreitenmodulation. Die Blocklängen sind dem Detektor bekannt, und es muß eine Art von Synchronisation geschehen, um die erwartete Symbolrate mit der tatsächlichen Symbolrate auszurichten. Die Modulation anderer Parameter ermöglicht unter Umständen keine Erfassung in Echtzeit oder nahezu Echtzeit oder kann einen Vergleich zwischen der Dekodiererausgabe und dem Kodierereingabesignal erfordern, wie bei den in 4 und 5 gezeigten Anordnungen.
  • In Anordnungen, wie denen gemäß 4 und 5, in denen die Dekodiererausgabe mit der Kodierereingabe verglichen wird, ist es wichtig, die Eingabe- und Ausgabesignale zu synchronisieren. Je nach dem Parameter oder den Parametern, die zur Modulation gewählt werden, sowie der Datenflußgeschwindigkeit der Zusatzinformation kann es sich als nötig erweisen, einen hohen Grad an Synchronisation zwischen diesen Signalen herzustellen. Eine Möglichkeit, das zu tun, besteht darin, eine deterministische Folge, beispielsweise eine PRN Folge in das Primärsignal einzubetten, so daß die Folge auch in die Dekodiererausgabe eingebettet wird. Durch Vergleichen der Folge im Eingabe- und Ausgabesignal ist eine feinkörnige Synchronisation möglich.
  • Die Erfassung kann von Hand oder in manchen Fällen auch automatisch vorgenommen werden. Die Anwendung einer PRN Folge im Primärsignal kann die automatische Erfassung erleichtern. Wenn die Erfassung manuell geschieht, können visuelle Hilfen, beispielsweise eine Spektralanalyse verglichener Signale herangezogen werden.
  • Einige Beispiele der Kodierparameter, die moduliert werden können, um ein Wasserzeichen einzubetten, sind in verschiedenen Tabellen aufgeführt: Eine erste Tabelle in 6 (Dolby Audiokodiererparameter), eine zweite Tabelle in 7 (MPEG Audiokodiererparameter) und eine dritte Tabelle in 8 (MPEG Videokodiererparameter). Für jede Parameterkategorie (z.B. Maskiermodell und Bitzuordnung gibt die jeweilige Tabelle die Art des Parameters an (z.B. "SNR Versatz" [SNR = Rauschabstand]), den/die spezifischen Parameter (z.B. "csnroffst", fsnroffst" usw.), falls der/die Parameter für Modulation im Kodierer und/oder im Dekodierer empfindlich ist sind, und die resultierende Veränderung von Signalcharakteristiken des Wasserzeichens im dekodierten Signal, wenn der/die Parameter moduliert ist/sind. In der ersten Spalte der in 6 gezeigten Tabelle sind sechs Kategorien von Parametern angesprochen: Maskiermodell und Bitzuordnung, Kopplung zwischen oder unter Kanälen, Frequenzbandbreite, Zittersteuerung, Phasenbeziehung und Zeit/Frequenz-Transformationsfenster. Es sei darauf hingewiesen, daß in der ersten Tabelle eine Neumatrizierung nur durchgeführt werden kann während des Dekodierens, falls rematflg "0" ist (keine Neumatrizierung im Kodierer) und in der zweiten Tabelle M/S Kodierung nur während des Dekodierens durchgeführt werden kann, falls ms_used "0" ist (kein M/S Kodieren im Kodierer).
  • Wenn eine Art von Parameter einen oder mehr Parameter in einem Kodiersystem hat, sind anerkannte Abkürzungen für die jeweiligen Parameter in Klammern gezeigt. Beispielsweise umfaßt die "SNR Versatz" Art von Parameter vier Parameter in Dolby Digital: "csnroffst (grober SNR Versatz) und "fsnroffst" (Kanal fein SNR Versatz), cplfsnroffst" (Kopplungsfein SNR Versatz) und "Ifesfsnroffst" ((Niederfrequenzeffekte Kanal fein SNR Versatz). Diese und weitere Dolby Digital Kodierparameter sind in der oben genannten Veröffentlichung A/52 Dokument näher erläutert.
  • Während die meisten der aufgeführten Dolby Audiokodiererparameter für die Kodiersysteme Dolby Digital und Dolby E gleich sind und folglich in dem Dokument A/52 erläutert sind, gibt es einige, die für das Dolby E Kodiersystem einmalig sind (z.B. Rückwärtsverstärkungscode (Back gain und Rückwärtsabklingcode (backleak)). Weitere Auskünfte zu backgain und backleak werden nachstehend gegeben.
  • In der ersten Spalte der in 7 gezeigten Tabelle sind vier Parameterkategorien angesprochen: Maskiermodell und Bitzuordnung, Kopplung zwischen oder unter Kanälen, zeitliche Rauschformungsfilterkoeffizienten und Zeit/Frequenz-Transformationsfenster. Ebenso werden in der ersten Spalte der in 8 gezeigten Tabelle zwei Parameterkategorien angesprochen: Rahmentyp und Bewegungssteuerung. Weitere Auskünfte zu aufgeführten MPEG Audiokodierer- und Videokodiererparametern finden sich in der anfangs genannten Veröffentlichung ISO/IEC, in den MPEG-2 AAC Papieren und weiteren veröffentlichten MPEG Dokumenten. Aspekte der vorliegenden Erfindung sind nicht nur auf Dolby und MPEG perzeptuelle Kodiersysteme anwendbar, sondern auch auf andere perzeptuelle Kodiersysteme, bei denen Parameter im Kodierer und/oder Dekodierer moduliert werden können. Beispiele für sonstige perzeptuelle Kodierer sind in dem schon erwähnten Zeitschriftenartikel von Brandenburg und Bosi besprochen (J. Audio Eng. Soc., 1997),
  • Modulation perzeptueller Hörmodellparameter.
  • In perzeptuellen Audiokodiersystemen, wie Dolby Digital und Dolby E gibt es Parameter, die das perzeptuelle Hörmodell oder Maskiermodell darstellen und im Bitzuordnungsprozeß angewandt werden. Im einzelnen wird von gewissen Parametern die Maskierkurve des menschlichen Ohrs spektral modelliert: Eine abwärts maskierende Kurve, die gegenüber der Frequenz steif abfällt, eine aufwärts maskierende Kurve, die gegenüber der Frequenz stark abfällt, und eine aufwärts maskierende Kurve, die gegenüber der Frequenz allmählich abfällt. Diese sind in 9 schematisch gezeigt. Auch wenn das spektrale Maskieren eine Idee aus der Frequenzdomäne ist, wird in der Standardnomenklatur zu diesen Maskierparametern die Terminologie aus der Zeitdomäne verwendet (zum Beispiel "langsam" und "schnell").
  • In 9 sind die Kodierparameter Elemente, die dem spektralen Maskiermodell entsprechen, anhand ihres Pegels und ihrer Neigung (Verstärkung (gain) und Verlust (leak) gegenüber einem Maskiersignal wie folgt definiert;
    • – Abwärtsmaskierkurve: backgain/backleak
    • – Aufwärtsmaskierkurve: (schnell): fastgain/fastleak
    • – Aufwärtsmaskierkurve: (langsam): slowgain/slowleak.
  • Es sei darauf hingewiesen, daß backgain und backleak Parameter sind, die in der Dolby E Kodierung spezifiziert sind, aber keine in Dolby Digital Kodierung spezifizierte Parameter. In Dolby Digital sind, wie in dem schon genannten A/52 Dokument beschrieben, die "fastgain" Parameter die Sofortverstärkungscodes (fgaincod, cplfgaincod und Ifegaincod); die "fastleak" Parameter sind die Sofortverlustcodes (fdcycod und cplfleak); der "slowgain" Parameter ist der Langsamverstärkungscode (sgaincod); und die "slowleak" Parameter sind die Langsamverzögerungscodes (sdycod und clpsleak).
  • Jeder der vorstehend genannten Parameter eignet sich zur Modulation, um während des perzeptuellen Kodierens ein Wasserzeichen zu übermitteln. Durch Modulation irgendeines derselben wird das spektrale Maskiermodell geringfügig geändert und damit der Bitzuordnungsprozeß beeinflußt. Die Maskiermodellparameter sind also eng gekoppelt mit dem primären Eingabesignal, um das Wasserzeichen robust zu machen. 10 veranschaulicht die Parameter des spektralen Maskiermodells, die moduliert werden können.
  • Gewisse andere Parameter in den Kodiersystemen Dolby Digital und Dolby E steuern den Rauschabstand (SNR) insgesamt. In Dolby Digital sind diese Parameter die SNR Versatzparameter: csnroffst, fsnroffst, cplfsnroffst und Ifesfsnroffst. Die SNR Parameter existieren, um einen gewünschten Mindestpegel an Rauschspielraum zwischen dem Signal und dem Quantisierungsrauschen aufrechtzuerhalten. Anders als die spektralen Maskiermodellparameter, die in erster Linie nur einen Teil des Spektrums gegenüber einem Maskiersignal beeinflussen, wird von diesen Parametern das gesamte Spektrum gleichmäßig beeinflußt.
  • Noch weitere Parameter wirken als eine SNR Feineinstellung auf der Basis eines kritischen Bandes, genannt "banded SNR" oder Deltabitzuordnung: nämlich deltba und cpldeltba in Dolby Digital Kodierung.
  • Die 11A bis 11C und 12A bis 12C sind Darstellungen der Modulation einer Maskierschwelle des perzeptuellen Kodiersystems (Modulation des SNR Versatzes in 11A und Modulation des Sofortverstärkungscodes in 12A), der resultierenden Auswirkung der Modulation, wenn das Kodiersystem einer Biteinschränkung unterliegt (11B bzw. 12B) und der resultierenden Auswirkung der Modulation, wenn das Kodiersystem keiner Biteinschränkung unterliegt (11C bzw. 12C). 11D gibt die Legenden wieder, die in den 11A11C und 12A12C verwendet sind. Biteinschränkungen geschehen, wenn der Kodierer darauf beschränkt ist, kodierte Blöcke gleicher Länge zu erzeugen, was für viele Übertragungskanäle ein Erfordernis ist. Kann der Kodierer die Anzahl der Bits von Block zu Block variieren, gibt es keine wirksame Einschränkung für die Anzahl der zur Wiedergabe des Signals verwendeten Bits. Wie gezeigt (11B und 12B), paßt in einem Kodierer mit Biteinschränkung der Quantisierfehler des dekodierten Signals nicht genau zur Maskierschwelle bei allen Frequenzen. Das Beispiel zeigt, daß mehr als die notwendigen Bits existieren (der Spalt zwischen der Schwelle und dem dekodierten Signal), was zu einer positiven Marge zwischen der Maskierschwelle und dem ursprünglichen Quantisierfehler bei einigen Frequenzen führt. Ohne Biteinschränkungen kann der Kodierer den Quantisierfehler über das ganze Frequenzband genau an die Maskierschwelle anpassen. Für den Vorgabeparameterwert kann das beabsichtigte Wasserzeichensymbol ein Bitwert "0" sein. Für den modulierten Parameterwert kann das beabsichtigte Symbol ein Bitwert "1" sein, wie bei diesem Beispiel. Die 11A und 12A zeigten die Maskierschwelle vor und nach der Modulation. Die 11B, 11C, 12B und 12C zeigen das erhaltene dekodierte Signal. Die modulierte Maskierschwelle ist in den 11/12B und 11C/12C überlagert, um einen Vergleich mit dem modulierten, dekodierten Signalspektrum zu bieten. 11D zeigt die in den 11A11C und 12A–C verwendeten Legenden.
  • Modulation von nichtmaskierenden Parametern.
  • 13 und 14 sind Darstellungen der Signalcharakteristiken, die sich bei der Modulation von anderen als Maskierparametern in Dolby Kodierern ergeben. In jeder dieser Figuren ist die Signalcharakteristik mit Hilfe eines Vorgabeparameterwertes und eines modulierten Parameterwertes dargestellt. In 13 sind die Auswirkungen der Modulation von Kopplungsparametern gezeigt. Für jeden Block in der Zeit, der auf der horizontalen Achse eingetragen ist, sind zwei Kanäle dargestellt, die mit links und rechts bezeichnet sind. Wenn das Kennzeichen "Kopplung im Gebrauch" "0" ist, wird jeder Kanal unabhängig behandelt. Wenn das Kennzeichen "Kopplung im Gebrauch" "1" ist, werden die beiden Kanäle zu einem einzigen Kopplungskanal oberhalb einer gewissen Frequenz kombiniert, was die Bezeichnung cplbegf Parameter trägt. Außer dem Kopplung-im-Gebrauch-Kennzeichen kann auch die Kopplungsbeginnfrequenz moduliert werden, was gleichfalls in 13 gezeigt ist.
  • In 14 sind die Auswirkungen der Modulation des Phasenkennzeichens dargestellt. Ist das Phasenkennzeichen "0", so ist die Phase nicht modifiziert; aber wenn das Kennzeichen "1" ist, ist die Phase des Signals um 180 Grad versetzt.
  • Modulation von TDAC Fensterparametern.
  • Wie schon gesagt, verringern perzeptuelle Kodierer die Datenflußgeschwindigkeit eines Eingabesignals dadurch, daß sie perzeptuell redundante Informationen herausnehmen. Diese Systeme beginnen damit, daß sie das Eingabesignal in eine oder mehr Komponenten zerlegen und dann eine perzeptuelle Analyse anwenden, um festzustellen, wieviel Genauigkeit jeder dieser Bestandteile braucht, damit der Unterschied zwischen der Quelle und dem kodierten Material nach dem Dekodieren der quantisierten Bestandteile nicht wahrnehmbar ist (oder um ein akzeptables Niveau an Wahrnehmbarkeit zu erzielen). Ein Beispiel eines solchen Systems ist ein Transformationskodierer, der zeitliche Abtastwerte mit Hilfe einer time-domain aliasing cancellation (TDAC) Transformation in eine frequenzbasierte Darstellung umsetzt. Um eine perfekte Wiederherstellung zu gewährleisten, werden die Abtastwerte in der Zeitdomäne vor der Transformation mit Hilfe von überlappenden Fenstern verarbeitet. Nach der Transformation werden die Frequenzabtastwerte dann quantisiert und auf eine Weise kodiert, daß die Datenflußgeschwindigkeit geringer wird und sie nach dem Dekodieren perzeptuell nicht signifikant sind. Um die perfekte Wiederherstellung nach dem Umkehrtransformationsprozeß im Dekodieren beizubehalten, werden die Abtastwerte in der Zeitdomäne unter Anwendung von Parametern, die zu den im Kodierer benutzten passen, gefenstert, überlappt und summiert. Insgesamt werden die Fensterparameter für die Kodier- und Dekodierfenster so gewählt, daß bei ihrer Zufuhr während der Vorwärts- und Umkehr-TDAC-Transformationen die Verfälschung auf ein Minimum reduziert oder beseitigt wird. Einzelheiten zum Transformationskodieren mittels TDAC Transformationen finden sich in der Veröffentlichung "Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation" von Princen und Bradley, IEEE Trans. on Acoustics, Speech und Signal Processing, Bd. ASSP-34, Nr. 5, Oktober 1986, SS. 1153–1161 und in der Veröffentlichung "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation" von Princen et al. Proceedings: ICASSP 87 1987 Intl. Conf. on Acoustics, Speech, and Signal Processing, April 1987, Dallas, Texas, SS. 2161–2164.
  • Ein Wasserzeichen kann durch Modulation der Parameter eines bei der Herstellung oder Wiederherstellung des transformierten Signals verwendeten Zeitbereichsfenster eingebracht werden. Ein Übereinstimmungsmangel zwischen der Neigung oder dem Alpha (b), der beim Kodieren und Dekodieren verwendeten Fenster führt zum Beispiel zur Zeitbereichsverfälschung, wenn kritisch abgetastete Transformationen benutzt werden. Diese Verfälschung hat ein einmaliges Rauschen oder eine einmalige Verzerrung sowohl im Zeit- als auch im Frequenzbereich zur Folge. So kann der Fensterparameter entweder im Kodierer oder im Dekodierer so moduliert werden, daß ein Wasserzeichen übermittelt wird, welches in der Dekodiererausgabe feststellbar ist. Eine Verzerrung in diesem Sinne ist als Differenz zwischen dem kodierten und dem ursprünglichen Signal definiert und kann zu hörbaren Artefakten führen oder auch nicht. Bei einem bevorzugten Ausführungsbeispiel werden die Alpha (Neigungs-) Werte des Zeitbereichsfensters moduliert. Durch Einführen eines Rausch- oder Verzerrungssignals, welches nichtwahrnehmbar, aber dem Quellensignal verwandt und durch dasselbe verdeckt ist, wird es außerordentlich schwierig, das resultierende Wasserzeichen zu entfernen oder zu verwischen, ohne damit eine wahrnehmbare Beeinträchtigung zu erzeugen.
  • Ein weiterer Parameter des Zeitbereichsfensters, der geändert werden kann, um ein Wasserzeichen zu übermitteln, ist die Art des Fensters selbst. Zum Beispiel kann ein nach Kaiser-Bessel bestimmtes Fenster benutzt werden, um ein Wasserzeichenbit "0" einzubetten, während ein Hanning-Fenster benutzt werden kann, um ein Wasserzeichenbit "1" einzubetten. Die modulierte Fensteränderung kann im Kodierer oder im Dekodierer vorgenommen werden.
  • Um die Erfaßbarkeit zu verbessern und die Wahrnehmbarkeit auf ein Minimum einzuschränken, kann der Fensterparameter zusätzlich adaptiv in der Zeit in Abhängigkeit von Signalcharakteristiken moduliert werden. Zum Beispiel können Übergangssignale das Wasserzeichensignal unklar machen, so daß es vorteilhaft ist, diese Signale erkennen zu können und das Fenster zu modulieren, um die Position des Wasserzeichensignals neu zu lokalisieren, damit psychoakustische zeitliche Maskiereffekte ausgenutzt werden können. Ferner kann die Stärke der Modulation und folglich die Stärke des Wasserzeichensignals im dekodierten Signal in Abhängigkeit von den Charakteristiken des Quellensignals adaptiv modifiziert werden. Das Ausmaß des Übereinstimmungsmangels der Fensterparameter hat eine direkte Auswirkung auf die Stärke der hinzugefügten Verzerrung. Deshalb können die psychoakustischen Maskiereigenschaften des Eingabesignals analysiert und verwendet werden, um dem Wasserzeicheneinbettungsprozeß zu signalisieren, daß das Maß des Übereinstimmungsmangels für ein Wasserzeichensymbol abzuändern ist, damit dieses vom Signalinhalt maximal abgedeckt ist.
  • Die Vorwärts-TDAC-Transformationsgleichung direkter Form ist durch folgende Gleichung gegeben:
    Figure 00220001
    wobei
  • n
    = Abtastnummer
    k
    = Frequenz-bin-Nummer
    x(n)
    = eingegebene PCM Folge
    w(n)
    = Fensterfolge
    X(k)
    = ausgegebene Transformationskoeffizientenfolge
    N
    = Gesamtanzahl der Abtastwerte in der Transformation
    n0
    = Hälfte der Gesamtanzahl der Abtastwerte in der Transformation
  • Die TDAC Transformationsfensterfolgen mit Hilfe von Kaiser-Bessel definierten (KBD) Fenstern können durch folgende Gleichungen bestimmt werden
    Figure 00220002
    wobei WKB die Kaiser Bessel Kernfensterfunktion wie folgt ist:
    Figure 00220003
    und I0 die Besselfunktion 0ter Ordnung wie folgt ist:
  • Figure 00220004
  • 15 zeigt fünf überlappende Kodiererfenster der Länge 256. Das Wasserzeichen wird in der Kodierphase mittels eines α = 4 Wertes für Fenster Nummer 5 eingefügt. Es sei erwähnt, daß die Fenster 4 und 6 Hybridfenster sind, die eine Kombination aus α = 3 und α = 4 Fenster benutzen, um einen glatten Übergang zwischen der Serie aus α = 3 Fenstern und dem einzigen α = 4 Fenster zu schaffen. In der Figur sind für die Dekodiererfenster α = 3 Fenster für alle Transformationen verwirklicht. Durch diesen Übereinstimmungsmangel in den Fenstertypen werden im Zeitbereich Verfälschungsartefakte in das resultierende Ausgabesignal eingeführt. Das Ausmaß der Verfälschung im Zeitbereich, welches in die dekodierten Audiosignale eingeführt wird, nimmt mit zuneh mendem Unterschied zwischen dem α Wert des Kodierers (α = 4) und dem α Wert des Dekodierers (α = 3) zu und besteht nur in dem Abschnitt des Audiosignals, der vom Kodiererfenster Nummer 5 verarbeitet wurde. Für dieses Verfahren der α Änderung brauchen die Dekodierer nicht modifiziert zu werden, um Wasserzeichensignale zu übermitteln, und es ist nützlich, Wasserzeichen an der Verteilungsquelle des Signals einzubringen.
  • 16 zeigt noch einmal fünf überlappende Fenster der Länge 256. Aber bei diesem Beispiel wird der α Fensterwert während des Dekodierprozesses mit Umkehr-TDAC-Transformationsfenstern geändert. Wiederum kommt es zur Zeitbereichsverfälschung, was ein Wasserzeichensignal in das dekodierte Signal injiziert. Bei diesem Beispiel jedoch wird das eingebettete Signal am Dekodierer injiziert, so daß Wasserzeicheninformation für einen spezifischen Endverbraucher oder ein Gerät eingeführt werden kann. Diese α Modifikation erlaubt es dem Dekodierer, serialisierte Information in die Signaldaten einzubetten.
  • Beim Zuführen des Wasserzeichens kann es vorteilhaft sein, kürzere Transformationsfenster zu benutzen, denn mit ihnen wird die Dauer der verfälschenden Verzerrung verkürzt und sie werden insgesamt während Übergangsbedingungen angewandt (bei der Audiosignalkodierung). Die zeitlichen Maskiereigenschaften der Übergangssignale können ausgenutzt werden, um stärker vom "richtigen" Wert abweichende alpha Werte zu benutzen und dadurch ein robusteres Wasserzeichen zu schaffen.
  • TDAC Fenstermodulationsdetektor.
  • Durch Modifizieren des Alphawertes der TDAC Fenster wird in der Zeitdomäne ein verfälschendes Signal eingeführt, welches zu dem kodierten Signal in Beziehung steht. Diese Verfälschung läßt sich messen als Einführung von spektralem Rauschen oder Verzerrung der spektralen Komponenten des kodierten Signals.
  • Bei einem möglichen Verfahren zum Erfassen kann der Unterschied zwischen dem Quellenmaterial und den mit Wasserzeichen versehenen Daten nach Art der in 4 und 5 gezeigten Anordnungen verglichen werden. Mit diesem Verfahren würde das Differenzsignal für spektrale Verzerrung dort gesucht, wo das mittels Wasserzeichen modifizierte Fenster benutzt wurde. Wenn die spektrale Verzerrung oberhalb einer Schwelle läge, würde dies als ein '1'-Symbol für den mit Wasserzeichen versehenen Abschnitt der Daten angezeigt. Eine spektrale Verzerrung unterhalb der Schwelle würde als '0'-Symbol erfaßt.
  • Dieses Verfahren ist empfindlich gegenüber Breitbandrauschen, welches zum Maskieren des mit Wasserzeichen versehenen Signals eingeführt werden kann. Ein weiteres Erfassungsverfahren besteht im Verfolgen spektraler Spitzen des mit Wasserzeichen versehenen Signals und im Suchen nach der Amplitudenmodulation der Frequenzbins sowohl vor als auch nach der spektralen Spitze, die durch Zeitbereichsverfälschung beim Einbringen des Wasserzeichens eingeführt wurde. Ähnlich wie bei dem nachstehend beschriebenen allgemeinen spektralen Verzerrungsverfahren würden mit diesem Erfassungsverfahren die Frequenzbins, die prädominante spektrale Komponenten umgeben, mit einer Schwelle verglichen. Allerdings stünde diese Schwelle in Beziehung zur Stärke der Spektralkomponente des Quellensignals. Spektrale Seitenlappen unterhalb der Schwelle würden als ein '0'-Symbol interpretiert und spektrale Seitenlappen oberhalb würden als ein '1'-Symbol interpretiert.
  • Modulation von TNS Filterkoeffizienten
  • Zeitliche Rauschformung ist eine Kodiertechnik, die dazu beitragen kann, Vorecho-Artefakte beim perzeptuellen Audiosignalkodieren zu verhindern. Beschrieben ist sie in "Enhancing the Performance of Perceptual Audio Coders by Temporal Noise Shaping (TNS)" von Jürgen Herre und James Johnston, 101. AES (Audio Engineering Society) Convention Preprint 4384, 8–11. November 1996. Prädiktives Kodieren im Frequenzbereich wird angewandt, um das Quantisierungsrauschen im Zeitbereich zu formen. Die Voraussage kann dazu beitragen, zu steuern, wo das Quantisierungsrauschen im Zeitbereich plaziert wird. Bei der Audiosignalkodierung ist das Rauschen beschränkt auf innerhalb der Amplitudenhüllkurve des Zeitbereichs-Maskiersignals, um ein Vorecho zu vermeiden. Ein Vorecho ist ein Artefakt und tritt während Übergangsbedingungen auf, wenn die angewandte Frequenztransformation nicht genügend Zeitauflösung hat, um zu verhindern, daß Quantisierungsrauschen vor dem Übergang im Ausgabesignal auftritt.
  • Die zeitliche Rauschformung (TNS) ist zwar ein Merkmal des perzeptuellen Kodiersystems MPEG-2 AAC, es kann aber auch auf andere Systeme angewandt werden, beispielsweise Dolby Digital, was eine weitere Möglichkeit zur Modulation von Parametern in solchen anderen Systemen bietet.
  • Gemäß diesem Aspekt der vorliegenden Erfindung wird ein oder mehr TNS Filterparameter moduliert. Insbesondere kann die TNS Rauschformungsfilterordnung und die TNS Rauschformungsfiltergestalt moduliert werden, wie nachstehend erläutert.
  • Der TNS Prozeß beinhaltet folgende Schritte:
    • 1. Zerlegen des Signals in Spektralkoeffizienten mittels einer Zeit/Frequenz-Transformation;
    • 2. Anlegen eines genormten Linear-Prädiktors durch Schaffung einer gefensterten Autokorrelationsmatrix und mittels Rekursion; und
    • 3. Wenn die Voraussageverstärkung eine gewisse Schwelle übersteigt, wird ein Rauschformungsfilter auf die Spektralkoeffizienten angewandt.
  • Die Erfindung verläßt sich auf die Eigenschaften des während der TNS Verarbeitung angewandten Rauschformungsfilters. Der Spektralbereichsfilter kann so abgewandelt werden, daß das Rauschen in einer beliebigen Anzahl unterschiedlicher zeitlicher Reaktionen geformt wird. Durch Variieren gewisser Parameter dieser zeitlichen Hüllkurve mittels Spektralbereichsfilterung kann ein Wasserzeichen in das Signal eingebettet werden. Anders ausgedrückt, man moduliert den Rauschformungsfilter im Spektral- oder Frequenzbereich, wodurch das Quantisierungsrauschen im Zeitbereich geändert wird.
  • Eine exemplarische zeitliche Hüllkurvenreaktion ist in 17 gezeigt, in der der Schalldruckpegel (SPL) über der Zeit eingetragen ist.
  • Das zeitliche Maskiermodell ist dem in gewissen perzeptuellen Kodierern benutzten spektralen Maskiermodell ziemlich ähnlich. Insbesondere sind die Abwärts- und Aufwärtshüllkurven für das spektrale Maskieren analog zu den zeitlichen Rückwärts- und Vorwärtsmaskierhüllkurven. Um spezifischer diejenigen TNS Parameter zu identifizieren, die gemäß einem Aspekt der vorliegenden Erfindung moduliert werden können, ist es nützlich, einen Teil der Operation des zeitlichen Rauschformungsprozesses näher zu betrachten. Nach dem Zerlegen des Signals in spektrale Koeffizienten mittels einer Zeit/Frequenz-Transformation wird eine lineare prädiktive Kodier (LPC-) Berechnung an den Spektraldaten vorgenommen, um festzustellen, ob die Voraussageverstärkung eine gewisse Schwelle übersteigt und um eine Hüllkurve des Signals abzuleiten. Die Voraussagekoeffizienten werden dann für jeden TNS Filter für jeden Block wie folgt berechnet: h = Rxx – 1rxxwobei rxxT = {Rxx(i,j)}; Rxx(i,j) = AutoCorr(|i – j|); i,j = 1,2, ..., N rxx' = rxx·win (5)wobei Rxx die N-mal-N Autokorrelationsquadratmatrix ist, N die TNS Voraussageordnung ist und h die Vektor-optimierten Voraussagekoeffizienten ist. Diese Gleichungen beruhen auf dem allgemein bekannten Orthogonalitätsprinzip, welches besagt, daß der Mindestvoraussagefehler zu allen in der Voraussage benutzten Daten orthogonal ist.
  • Zum Initialisierungszeitpunkt wird ein Autokorrelationsmatrixfenster gemäß der folgenden Gleichung berechnet:
    Figure 00250001
    wobei
    Figure 00250002
    wobei FSAMP = Signalabtastgeschwindigkeit.
  • Die "timeResolution"-Variable ist von der Bitrate und der Anzahl der Kanäle abhängig, und die Transformationsblocklänge bestimmt die "transformResolution"-Variable.
  • Die optimale Ordnung des Rauschformungsfilters wird durch Entfernen von Reflexionskoeffizienten unterhalb einer bestimmten Schwelle vom Ende der Koeffizienzmatrix bestimmt. Ein Parameter, der moduliert werden kann, um ein Wasserzeichen zu übermitteln, ist die Rauschformungsfilterordnung. Zum Beispiel kann ein Wasserzeichenbit eines Vorzeichens durch die optimale Filterordnung wiedergegeben werden und ein Wasserzeichenbit des anderen Vorzeichens durch eine nicht optimale Filterordnung (entweder niedriger oder höher). Ein weiterer Parameter, der geändert werden kann, um ein Wasserzeichen zu übermitteln, ist die Gestalt des Rauschformungsfilters selbst. Zum Beispiel kann ein Wasserzeichenbit eines Vorzeichens dadurch angezeigt werden, daß die mittels LPC-Berechnung bestimmten optimalen Koeffizienten benutzt werden, während ein Wasserzeichenbit eines anderen Vorzeichens durch Modifizieren der Koeffizienten angezeigt werden kann und damit die Gestalt des Rauschformungsfilters.
  • Durch Modulation der TNS Parameter (Filterordnung oder Filterkoeffizienten) wird Rauschen in der zeitlichen Hüllkurve des Eingabesignals moduliert, so daß es im dekodierten Ausgabesignal erfaßt werden kann. 18 zeigt ein Beispiel der zeitlichen Maskierhüllkurve und die Veränderlichkeit, mit der der Quantisierfehler innerhalb dieser Hüllkurve moduliert werden kann. Mit jedem Zeitblock können die TNS Parameter so moduliert werden, daß sie ein Wasserzeichen übermitteln.
  • In die Praxis umsetzbare Ausführungsbeispiele der vorliegenden Erfindung können eine sehr robuste Lösung des Wasserzeichens bieten. Da das durch den TNS Prozeß hinzugefügte Rauschen eng gekoppelt ist mit der Hüllkurve des Quellensignals, ist es sehr schwer, das Wasserzeichen zu entfernen oder zu verwischen, ohne das ursprüngliche Signal in der Qualität zu verschlechtern.
  • Die Transparenz des in dieser Erfindung beschriebenen Wasserzeichens kann durch Anwenden eines adaptiven Verzerrungsprozesses der nachstehend beschriebenen Art gesteuert werden. In diesem Fall werden, sobald die zeitliche Hüllkurve des Signals mittels TNS modifiziert wurde, die Ergebnisse entweder mit einer zeitlichen oder einer spektralen Darstellung der zeitlichen Maskierschwelle iterativ verglichen. Wird die Schwelle überschritten, werden an den zeitlichen Maskierparametern Einstellungen vorgenommen und der Prozeß wiederholt, um das gewünschte Gleichgewicht zwischen Robustheit und Wahrnehmbarkeit des mit Wasserzeichen versehenen Signals sicherzustellen.
  • Die in 18 gezeigten zeitlichen Maskiercharakteristiken können auch auf Teilbänder des Signals angewandt werden. Das ermöglicht eine Schichtung von Wasserzeichen zusammen mit potentiell mehr Orten zum Einbetten des Wasserzeichens.
  • Modulation der Bandbreite.
  • Es ist bekannt, daß eine Verringerung der Bandbreite eines Audiosignals eine minimale Verschlechterung der subjektiven Qualität verursacht, solange sie sich oberhalb eines Mindestpegels von 16 kHz bewegt. Versuche haben außerdem eine minimale Qualitätsverschlechterung gezeigt, wenn die Bandbreite dynamisch geändert wird, vorausgesetzt sie bleibt oberhalb des Mindestpegels. Wenn die Bandbreite entsprechend einem Zusatz- oder Wasserzeichensignal im Kodieren oder Dekodierer moduliert wird, kann dieses Signal aus dem dekodierten Audiosignal abgeleitet werden. So kann zum Beispiel ein Einbitcode in einem Audiosignal eingebettet werden, wo eine Bandbreite von 16 kHz ein "0" Symbol und eine Bandbreite von 20 kHz ein "1" Symbol wiedergibt. Das läßt sich erweitern auf mehrfache Bandbreiten, die Mehrbitsymbole wiedergeben, so daß eine höhere Datenflußgeschwindigkeit des eingebetteten Signals geschaffen wird. 19 zeigt ein 2-Bit Symbol unter Benutzung von vier verschiedenen Bandbreiten. Diese Strategie läßt sich dort anwenden, wo unhörbare Wasserzeichen erforderlich sind, die nicht robust sein müssen. Die Unhörbarkeitskriterien können in der vorstehend beschriebenen Weise erzielt werden. Diese Strategie ist deshalb nicht robust, weil das Wasserzeichen ohne weiteres durch Tiefpaßfiltern des dekodierten Audiosignals entfernt werden kann.
  • 20 zeigt ein Beispiel eines Audiosignals, welches ein eingebettetes Signal unter Nutzung der Bandbreite des Signals für die Darstellung der verschiedenen Symbole enthält.
  • Bei der vorstehend beschriebenen Technik zur Einbringung des Wasserzeichens in die Bandbreite besteht die Schwierigkeit, daß es von dem Vorhandensein eines Signalinhalts oberhalb der Mindestbandbreite abhängt. Während eines großen Teils der Zeit gibt es keinen Signalinhalt oberhalb der Mindestbandbreite. Eine konstante Datenflußgeschwindigkeit des eingebetteten Signals kann ohne einen hochfrequenten Signalinhalt nicht erreicht werden. Wenn zum Beispiel der Audiosignalinhalt aus einer einzigen Sinuswelle bei 1 kHz besteht, wäre die einzige Möglichkeit, eingebettete Daten in dieses Signal zu übertragen, die Bandbreite auf unterhalb 1 kHz zu verringern. Das wäre deutlich hörbar und würde das ursprüngliche Signal zerstören.
  • Ein Verfahren, mit dem eine konstante Wasserzeicheneinbettungsgeschwindigkeit geboten werden kann, besteht darin, sicherzustellen, daß das Audiosignal hochfrequente Energie enthält. Eine Möglichkeit das zu erreichen besteht im Hinzufügen von Rauschen zu den oberen Frequenzen des Audiosignals auf solche Weise, daß ein Zuhörer es nicht wahrnimmt. Liegt das hinzugefügte Rauschen unterhalb oder auf der menschlichen Hörschwelle, so ist es nicht wahrnehmbar. Mit dem Hinzufügen dieses Rauschens kann das eingebettete Signal die Audiobandbreite als einen Zeichengabemechanismus nutzen, der eine konstante Datenflußgeschwindigkeit bietet. Es sei noch erwähnt, daß dieses Rauschen nur innerhalb des Zeichengabebandes hinzugefügt zu werden braucht. Das Zeichengabeband ist definiert als das Band zwischen der niedrigsten und der höchsten Frequenz, die zur Plazierung des Wasserzeichens herangezogen werden. Das Zeichengabeband kann in kleinere Abschnitte unterteilt werden, wenn mehr als zwei Bandbreiten zur Erzeugung des Wasserzeichens verwendet werden.
  • 21 zeigt das Hinzufügen des auf den angenäherten Pegel der Hörschwelle geformten Rauschens. Es wird einem Signal hinzugefügt, welches aus einer einzigen Sinuswelle besteht, und es wird nur im Zeichengabeband hinzugefügt. Das Hinzufügen von Rauschen in das Zeichengabeband braucht nicht durch die Hörschwelle begrenzt zu sein, wahrscheinlich ist es aber hörbar, wenn die Energie oberhalb läge. Eine weitere Dimension der Zeichengabe kann hinzugefügt werden, wenn man die Amplitude des Rauschens unterhalb der Hörschwelle anpaßt. Zum Beispiel können zusätzliche Daten verdeckt oder eingefügt werden, wenn die Energie in einem Bereich des Zeichengabebandes mehr als nur einen Energiezustand und einen Zustand ohne Energie enthielte, indem ein halber Energiezustand hinzugefügt würde. Durch diese Amplitudenzeichengabe würde die Datenflußgeschwindigkeit des eingebetteten Signals erhöht.
  • Das Signal ist erfaßbar, solange noch ein Signalinhalt unmittelbar unterhalb der oberen Bandbreite garantiert ist. Es ist wichtig, daß das hinzugefügte Signal innerhalb des Zeichengabebandes in jedem Kanal ähnlich ist. In vielen Fällen werden diese Signale elektrisch oder akustisch gemischt, und es ist wichtig, daß sie einander nicht aufheben. Wenn Mehrkanälen phasengleiche Sinuswellen hinzugefügt und zur Zeichengabe benutzt würden, würden sie sich, je nach dem Ort gegenseitig aufheben, wenn sie akustisch summiert würden. Eine bessere Lösung wäre die Anwendung unabhängigen, willkürlichen Rauschens, denn das hebt sich beim Mischen nicht auf.
  • Da im Zeichengabeband Signalinhalt auftreten kann und im Zeichengabeband geformtes Rauschen addiert wird, um eine konstante Einbettungsgeschwindigkeit zu garantieren, werden die beiden Signale summiert und erhöhen gelegentlich die Energie im Zeichengabeband. Diese Energieveränderlichkeit erschwert den Erfassungsprozeß. Bei einem bevorzugten Ausführungsbeispiel dieses Aspektes der Erfindung wird auf das Quellensignal ein Tiefpaßfilter vor dem Hinzufügen des geformten Rauschens angelegt, um jegliche Wechselwirkung des Quellensignals im Zeichengabeband auszuschalten.
  • Im Dolby Digital Algorithmus oder Kodierprozeß wird, selbst wenn der Inhalt in den oberen Frequenzbändern als nicht bedeutsam festgestellt wird, ein grobes Leistungsspektrum im Bitstrom übertragen, welches im Dekodierer zum Hinzufügen von willkürlichem Rauschen benutzt werden kann, welches entsprechend dem Leistungsspektrum geformt ist. Dies ist ein Merkmal des Dekodierers, welches eingeschaltet wird, wenn das Zitterkennzeichen im Bitstrom aktiviert ist. Das hinzugefügte Rauschen in Dekodierer stellt das Wasserzeichen im dekodierten Audiosignal selbst dann wieder her, wenn der Kodierer es als wahrnehmungsmäßig unbedeutsam beurteilt hat. Das Wasserzeichen kann entweder während des Kodier- oder des Dekodierprozesses eingefügt werden.
  • Ein Dolby Digital Audiokodierer kann Änderungen in der Bandbreite in Übereinstimmung mit einem von zwei Bandbreitenparametern generieren (die oben in der Tabelle der 21 aufgeführten Codes chbwcod und cplendf). Das schafft eine wirksame Möglichkeit zur Verwirklichung des Wasserzeichens. Aber die Modulation dieser Codes zum Erzeugen erfaßbarer Änderungen im dekodierten Signal bedeutet, daß die Datenflußgeschwindigkeit des eingebetteten Signals einigen Grenzen unterliegt.
    • 1. Alle Kanäle sollten die gleiche Bandbreite enthalten, so daß ein Abwärtsmischen des Signals die eingebetteten Daten nicht zerstört. Das begrenzt die Einbettungsdatenflußgeschwindigkeit auf das Äquivalent eines Monokanals.
    • 2. Für optimale Tonqualität sollte der Bandbreitencode nur einmal pro Rahmen gesetzt werden, was die Einbettungsdatenflußgeschwindigkeit auf die Symboltiefe und die kodierte Abtastfrequenz begrenzt. Wenn der Bandbreitencode mehr als einmal pro Rahmen geändert würde, würde das die Tonqualität insgesamt des kodierten Audiosignals mindern.
    • 3. Die Anzahl verfügbarer Symbole ist auf die Anzahl verfügbarer Bandbreitencodes oberhalb der Mindestbandbreite begrenzt.
  • Wenn zum Beispiel der Kodierer zwei unterschiedliche Bandbreitenzustände benutzt, um Daten mit 48 kHz einzubetten, ist die Einbettungsdatengeschwindigkeit etwa 31,25 bps. (31,25 Rahmen pro Sekunde, von denen jeder ein Bit Information enthält). Benutzt er vier Bandbreitenzustände bei 48 kHz, ist die Datenflußgeschwindigkeit 62,5 bps. Diese Zahlen werden von der Tatsache abgeleitet, daß jeder Dolby Digital Rahmen 1536 einmalige Audioabtastwerte enthält. Würde ein anderer Kodierer benutzt, der 2048 einmalige Audioabtastwerte pro Rahmen enthielte, wäre die Datenflußgeschwindigkeit etwa 23,5 bps für einen Einbitcode.
  • Der Dolby Digital Kodierer sendet eine Näherung der Leistungsspektraldichte im Kodiererbitstrom mit jedem Audiosignalrahmen. Der wird immer dann aktualisiert, wenn es im Audiosignalspektrum eine signifikante Änderung gibt. Die Leistungsspektraldichteinformationen werden als Exponenten gesendet, die in der Frequenz linear beabstandet sind. Im Dolby Digital Dekodierer wird jeglichem Teil des Spektrums, der keine quantisierte Information empfangen hat, weil die Signalinformation nicht für wichtig gehalten wurde, Zittern hinzugefügt. Das Zittern, bei dem es sich im wesentlichen um willkürliches Rauschen handelt, ist auf den Pegel des Exponenten skaliert. Hierdurch wird diesem Teil des Spektrums Signalenergie hinzugefügt. Wenn die Exponenten im Zeichengabeband auf weniger als die Hörschwelle oder gleich dieser geformt sind, garantiert das Zittern Signalenergie.
  • Die nachfolgenden Schritte umreißen das gegenwärtige Verfahren, mit dem sichergestellt wird, daß es Energie im Zeichengabeband innerhalb eines Dolby Digital kodierten Signals gibt.
    • 1. Willkürliches Rauschen wird oberhalb der Mindestzeichengabebandbreite hinzugefügt, es ist so geformt, daß es auf oder unterhalb der Hörschwelle liegt. Hierdurch wird die Mindestenergie veranlaßt, der Gestalt der Hörschwelle zu folgen.
    • 2. Die Exponenten, die nach dem Hinzufügen des Rauschens berechnet werden, halten diese Mindestenergiepegel fest.
    • 3. Der Dekodierer stellt die spektrale Energie aus den übertragenen Exponenten selbst dann wieder her, wenn keine Bits oberhalb der Mindestzeichengabebandbreite zugeordnet wurden, weil üblicherweise Zittern hinzugefügt wird. Das gewährleistet einen Signalinhalt für die eingebettete Zeichengabe.
  • Die beiden oben beschriebenen Techniken (Bandbreitenänderung und Zittern) können benutzt werden, um in einen Dolby Digital Kodierer oder Dekodierer ein Wasserzeichen von geringer Komplexität und fester Bitrate zu integrieren. Dieses System ist gegenüber "normaler Benutzung" der Kodier/Dekodierkette robust, die Abwärtsmischen, Steuerung des Dynamikbereichs, Normalisierung des Volumens, Dekodieren der Matrixumgebung usw. einschließt.
  • So kann ein Ausführungsbeispiel dieses Aspektes der vorliegenden Erfindung folgende Schritte umfassen:
    • 1. Einstellen der Bandbreite zum Einbetten eines verborgenen Datensignals.
    • 2. Anwenden eines Bandbreitencodes des Dolby Digital Kodier/Dekodiersystems zum Einstellen der Bandbreite für das Einbetten eines verborgenen Datensignals.
    • 3. Hinzufügen von Rauschen in das Zeichengabeband, um sicherzustellen, daß der Signalinhalt für das Einbetten von Daten mit konstanter Geschwindigkeit benutzt werden kann.
    • 4. Formung dieses hinzugefügten Rauschens auf solche Weise, daß es niedriger als die menschliche Hörschwelle ist oder dieser entspricht, um eine hörbare Wahrnehmung des hinzugefügten Rauschens zu vermeiden.
    • 5. Einstellen der Amplitude dieses hinzugefügten Rauschens, um eine weitere Zeichengabedimension hinzuzufügen, damit die Datenflußgeschwindigkeit des eingebetteten Signals erhöht wird.
    • 6. Integration des geformten Rauschens mit einem Dolby Digital Kodierer, um Signalinhalt innerhalb des Zeichengabebandes zu garantieren.
  • Der Wasserzeichendetektor interpretiert die innerhalb des wiedergegebenen Audiosignals eingebettete Information. Er kann vorzugsweise die Information sowohl elektrisch als auch akustisch extrahieren; aber diese Fähigkeit ist unter Umständen nicht für alle Anwendungsfälle erforderlich. Das Extrahieren des Wasserzeichens nach der akustischen Verarbeitung wird wegen hinzukommender Zimmergeräusche, Lautsprecher- und Mikrophoneigenschaften und der Gesamtlautstärke der Wiedergabe für eine schwierigere Herausforderung gehalten.
  • Ziel des Detektors ist es, festzustellen, ob es Energie innerhalb eines gegebenen Zeichengabebandes gibt, um die Bandbreite des Audiosignals zu finden. Das erfordert eine Frequenzzerlegung des Audiosignals, die mittels Fouriertransformation berechnet werden kann, eine Gruppe von Bandpaßfiltern, die das Zeichengabeband analysieren usw. Die Energie in jedem Zeichengabeband kann aus dieser Zerlegung des Signals erhalten werden. Ein Detektor kann diese Energieinformation zur Bestimmung des eingebetteten Signals benutzen.
  • Bei einem möglichen Erfassungsverfahren wird ein fester Schwellenvergleich in jedem Zeichengabeband angewendet, um das kodierte Symbol zu bestimmen. Diese Schwelle kann auf den Energiepegel unmittelbar oberhalb des Störpegels gesetzt werden. Alles oberhalb dieses Pegels würde dann so betrachtet, als ob es Signalpegel enthielte. 22 zeigt drei verschiedene Energiepegel, die zum Erfassen von vier unterschiedlichen Bandbreiten nötig sind, welche ein 2-Bit Symbol erzeugen. Jegliche Energie oberhalb der Erfassungsschwelle wird als "hoch" und alles darunter wird als "niedrig" betrachtet.
  • Diese feste Schwelle funktioniert nur gut in einem geschlossenen Umfeld, wo der Störpegel des Systems immer bekannt ist und die Spitzensignalpegel nie gedämpft sind. Wenn zum Beispiel irgendein weiteres Rauschen dem Störpegel oberhalb des Diagramms hinzugefügt würde, würde der dritte Energiepegel als "hoch" erachtet und ein unrichtiges Symbol interpretiert.
  • Es ist möglich, eine feste Schwelle dann zu verwenden, wenn die Energiepegel vor der Schwellenberechnung angeglichen oder normalisiert werden. Eine Technik, mit der dies erreichbar wäre, wendet auf das Zeichengabeband einen AGC Algorithmus oder Prozeß an, ehe die Energiepegel bestimmt werden. Diese Pegel werden dann mit dem AGC normalisiert, so daß die "niedrigen" und "hohen" Pegel konsistenter werden. In diesem Fall kann wegen der Normalisierung der Pegel eine feste Schwelle angelegt werden.
  • Eine adaptive Schwelle wird am besten für eine Umgebung gehalten, wo die Rauschpegel und Signalenergie sich ständig ändern. Ein mögliches Erfassungsverfahren, welches mit einer adaptiven Schwelle arbeitet, nutzt die vorherigen Energiezustände, um eine Schwelle für den gegenwärtigen Zustand zu berechnen. Dieser Detektor geht von der Annahme aus, daß in einer endlichen Zahl der vorherigen Zustände für ein gegebenes Energieband einige Energiepegel existieren sollten, die in einem "hohen" Zustand und einige, die in einem "niedrigen" Zustand sind. Die größten Energien können als hoch erachtet werden, während die kleinsten als "niedrig" erachtet werden. Diese "hohen" und "niedrigen" Zustände können als zwei verschiedene Gruppen berücksichtigt werden. 23 enthält verschiedene Histogramme als Beispiel der Verteilung von "hohen" und "niedrigen" Zuständen. Es kann eine Schwelle festgelegt werden, die irgendwo zwischen diesen beiden Gruppierungen liegt.
  • Geht man von der Annahme aus, daß die Anzahl der "hohen" Zustände der Anzahl der "niedrigen" Zustände im vorherigen endlichen Satz gleicht, gehört die größte Hälfte zur "hohen" Gruppe, während die kleinste Hälfte zur "niedrigen" Gruppe gehört. Wenn der durchschnittliche Energiepegel oder das Mittel für jede Gruppe gefunden worden ist, kann eine einfache Schwelle als Durchschnitt dieser beiden Mittel errechnet werden. Dies kann leicht komplizierter werden, wenn man unterschiedliche Verteilungen für die beiden Gruppen und Schwellen annimmt, bei denen mehr der Statistiken jeder Gruppe berücksichtigt werden, wie Mittel und Varianz.
  • Eine weitere Sache kann berücksichtigt werden, mit der die Trennung in "hohe" und "niedrige" Gruppen verbessert wird. Wenn beim Einbettungsprozeß mehr als zwei Bandbreiten eingeschlossen sind, sind die Energiepegel in den Zeichengabebändern abhängig. Wenn die höchste Bandbreite "an" ist, sollten alle Energiepegel in jedem Zeichengabeband als "hoch" erfaßt werden. Wenn die zweithöchste Bandbreite "an" ist, sollten alle Zeichengabebänder unterhalb dieser Bandbreite als "hoch" erfaßt werden. Das ändert die Verteilung der Energiepegel für jedes Zeichengabeband.
  • Angenommen zum Beispiel der Wasserzeichenkodierer generiere ein Zwei-Bitsymbol unter Verwendung von vier verschiedenen Bandbreiten. Dabei soll A, B, C und D die Bandbreiten darstellen, wobei A die niedrigste und D die höchste Bandbreite ist. Drei unterschiedliche Energiebänder sind zur Bestimmung dieser Bandbreiten nötig. Diese drei Energiebänder seien durch 1, 2 und 3 wiedergegeben, wobei es sich um die Energie zwischen den Bandbreiten A–B, B–C und C–D handelt. In der folgenden Tabelle ist für jedes der Energiebänder die Wahrscheinlichkeit aufgeführt, daß es sich in einem "hohen" Zustand befindet, wenn die Symbole gleichmäßig verteilt sind.
  • Figure 00320001
  • Wegen der Abhängigkeit jedes Energiebandes von der Bandbreite sind die Wahrscheinlichkeiten nicht gleich. Zum Beispiel ist die Wahrscheinlichkeit eines Signalinhalts im Energieband 1 die Summe der Wahrscheinlichkeiten, daß die B, C und D Symbole auftauchen. Jedes Symbol hat eine Wahrscheinlichkeit aufzutreten von ¼. Folglich ist die Wahrscheinlichkeit eines Signalinhalts im Energieband 1: ¾.
  • Wenn die vorhergehenden vierzig Zustände für die Berechnung der gegenwärtigen Schwelle für jedes Energieband herangezogen würden, würde von den höchsten dreißig Zuständen angenommen, daß sie Signalinhalt innerhalb des Energiebandes 1 wiedergeben. Die übrigen zehn Abtastwerte würden keinen Signalinhalt wiedergeben. Die gegenwärtige Schwelle für diesen Fall wird dadurch bestimmt, daß der Durchschnitt der Mittel zwischen diesen beiden Gruppen gefunden wird.
  • Wesentlich ist es für diesen Detektor, daß Kanalkodierung hinzugefügt wird, um zu gewährleisten, daß die Symbolverteilung im wesentlichen gleichmäßig ist. Wenn der Kodierer ein Symbol eingäbe, das gerade die höchste Bandbreite über eine längere Periode ist, hätte dieser Detektor Schwierigkeiten, die eingebetteten Daten zu dekodieren. Je näher die Symbolverteilung der angenommenen Wahrscheinlichkeit ist, um so genauer werden die eingebetteten Daten erfaßt.
  • Ein mögliches Kanalkodierverfahren besteht darin, zu gewährleisten, daß jedes Signal nur einmal über eine endliche Periode hinweg erscheint. Wenn zum Beispiel vier verschiedene Bandbreitencodes existieren, kann es sein, daß jedes Symbol einmal in einer Gruppe von vier Symbolen erscheinen muß. Das erzeugt 24 einmalige Symbole, die Gruppen aus vier Bandbreitencodes sind. 24 (vier faktoriell) ist die maximale Anzahl der Permutationen der vier Bandbreitencodes. Wenn A, B, C und D die vier Bandbreitencodes darstellen, würden die Symbole wie folgt aussehen: ABCD, BACD, ABDC, BADC, BCAD usw. Es sei erwähnt, daß dies die Einbettungsdatenflußgeschwindigkeit verringert.
  • Ein Wasserzeichendetektor gemäß diesem Aspekt der vorliegenden Erfindung kann also folgendes umfassen:
    • 1. Einen Detektor des eingebetteten Signals, der mit einer adaptiven Schwelle arbeitet, die durch Prüfen vorheriger Zustände errechnet wird. Die vorherigen Zustände sind anhand des Energiepegels in Gruppen unterteilt. Die Schwelle beruht auf Statistiken jeder Gruppe, die versuchen, die Gruppen so weit wie möglich zu trennen.
    • 2. Wenn mehrere Gruppen beteiligt sind, wird die Anzahl der Elemente in den Gruppen anhand von Abhängigkeiten von der Bandbreiteneinstellung eingestellt.
    • 3. Ein Kanalkodierer, der sicherstellt, daß die Verteilung der Symbole über eine endliche Zeit hinweg nahezu gleichmäßig ist. Das garantiert, daß der oben beschriebene Wasserzeichendetektor ordnungsgemäß funktioniert.
  • Steuern der Stärke der Parametermodulation.
  • Adaptive Verzerrungssteuerung.
  • Ein Ziel der vorliegenden Erfindung ist es, ein Wasserzeichen einzubetten, welches die größtmögliche Erfaßbarkeit und die geringstmögliche Wahrnehmbarkeit hat. Perzeptuelle Kodierer arbeiten mit einer Schwelle der Wahrnehmbarkeit, um festzustellen, wie die Redundanz eines Eingabesignals verringert werden kann. Diese gleiche Schwelle kann benutzt werden, um das Wasserzeichensignal derartig einzustellen, daß es zwar feststellbar ist, aber im wesentlichen nichtwahrnehmbar bleibt.
  • Wie schon gesagt, ist bei manchen perzeptuellen Kodierern eine Verzerrungsmessung mit der Ratensteuerung gepaart, um sicherzustellen, daß die richtige Information verworfen wird. Eine Verzerrungsmessung vergleicht das ursprüngliche Eingabesignal mit dem kodierten Signal (Ausgabe der Ratensteuerung). Das Verzerrungsmaß kann nützlich sein, einige der Kodierparameter zu steuern, um den Ausgang des Ratensteuerverfahrens zu ändern. Hierdurch kann ein verschachteltes Schleifengebilde geschaffen werden, welches nachfolgend beschrieben wird, in dem die äußere Schleife ein Verzerrungsmaß enthält und die innere Schleife die Ratensteuerung ist. Abwandlungen werden an den Kodierparametern iterativ durch Prüfen der Verzerrungsmeßung vorgenommen, bis einige Kriterien erfüllt sind. Das gleiche Prinzip kann auf Kodierer mit variabler Datenrate angewandt werden, wenn man die Ratenschleife herausnimmt.
  • Der Prozeß zum Einbetten eines Wasserzeichens mit Hilfe einer Schwelle der Wahrnehmbarkeit gemäß einem Aspekt der vorliegenden Erfindung ist in den 2426 gezeigt. Er ähnelt dem im MPEG-2 AAC perzeptuellen Kodierer bestimmten Prozeß, bei dem zwei verschachtelte Schleifen zum Bestimmen der optimalen Quantisierung benutzt werden. Die in 24 gezeigte innere Iterationsschleife modifiziert die Quantisierschrittgröße bis die Spektraldaten mit der Anzahl verfügbarer Bits (Ratensteuerung) kodiert werden können. Die in 25 gezeigte äußere Iterationsschleife verstärkt die Spektralkoeffizienten in sämtlichen Spektralbändern derartig, daß die Anforderungen des psychoakustischen Modells so gut wie möglich erfüllt werden (Verzerrungssteuerung). Der in 25 dargestellte Prozeß wird durch Modulation von einem oder mehr Kodierparametern (in 26 gezeigt) modifiziert, um dem psychoakustischen Modell oder der perzeptuellen Schwefle so gut wie möglich zu entsprechen, aber auch ein Wasserzeichensignal einzubetten. Alle der in den Tabellen gemäß 6, 7 und 8 aufgeführten Parameter können auf diese Weise moduliert werden, auch wenn einige Parameter schwerer als andere während des Bitzuordnungsverfahrens zu ändern sind.
  • Der Ratensteuerprozeß gemäß 24 bemüht sich um eine Darstellung des Signals mittels einer kleineren festgelegten Menge an Information. Das Eingabesignal wird entsprechend der perzeptuellen Schwelle (Schritt 20) quantisiert, und die als Ergebnis der Quantisierung verwendeten Bits werden gezählt (Schritt 22). Wenn die Anzahl der benutzten Bits die verfügbaren Bits nicht übersteigt, ist der Prozeß beendet (Schritt 24). Ansonsten wird der iterative Prozeß fortgesetzt, bis die Anzahl der verwendeten Bits so gut wie möglich mit der Anzahl verfügbarer Bits übereinstimmt. Das wird üblicherweise durch Einstellen der perzeptuellen Schwelle über Änderungen der Quantisierschrittgröße erreicht, bis genügend Information verworfen worden ist (Schritt 26).
  • Ein in 25 gezeigter Verzerrungsmeßprozeß kann dem Quantisierschrittgrößenprozeß hinzugefügt werden, damit sichergestellt ist, daß einige der Vereinfachungen des Ratensteuerkodierprozesses nicht zu Fehlern geführt haben, die leicht wahrgenommen werden. Das Verzerrungsmaß erlaubt eine Feinabstimmung von Kodierparametern, um solche Fehler auf ein Minimum einzuschränken. Im ersten Schritt des Verfahrens wird die Ratenschleife oder innere Schleife durchgeführt, um das Eingabesignal entsprechend einer Rateneinschränkung zu quantisieren (Schritt 28). Dann wird mittels Verzerrungsbewertung berechnet, wie viel Verzerrung besteht (Schritt 30), und es wird bestimmt, ob die Verzerrung im Verhältnis zu einer perzeptuellen Schwelte akzeptabel ist (Schritt 32). Ist die Verzerrung nicht akzeptabel, werden die Spektralkoeffizienten verstärkt (Schritt 34), und der Prozeß wiederholt. Ist die Verzerrung akzeptabel, wird das Ergebnis der Quantisierung auf das Eingabesignal angewandt (Schritt 36) und der Prozeß vollendet. "Verzerrung" in diesem Sinne ist der Unterschied zwischen dem kodierten und dem ursprünglichen Signal, und sie kann zu hörbaren Artefakten führen oder auch nicht.
  • Bei Aspekten der vorliegenden Erfindung wird ein in 26 gezeigter Prozeß hinsichtlich einer Verzerrungsmaßnahme angewandt, um das Ausmaß zu bestimmen, um das ein Kodierparameterwert, wenn er moduliert wird, von seinem Vorgabewert abweichen darf und doch noch innerhalb der Grenzen der perzeptuellen Schwelle bleibt. Das gibt die größtmögliche Wahrscheinlichkeit, daß das Wasserzeichen erfaßt wird, weil es, eingeschränkt durch die perzeptuelle Schwelle, so viel Verzerrung wie möglich verursacht, ohne daß die Verzerrung wahrnehmbar ist. Die Ratensteuerung (Schritt 28), Verzerrungssteuerung (Schritt 32) und Kodierparametereinstellung (Schritt 38) sind Schritte, die wiederholt werden, bis ein akzeptabler Kompromiß erreicht ist.
  • Bei gewissen Kodiersystemen, beispielsweise Dolby Digital wird ein Ratensteuerprozeß während des Kodierens angewandt, aber keine Verzerrungssteuerung. Damit solche Kodiersysteme diesen Aspekt der Erfindung nutzen können, wird deshalb eine Verzerrungsmaßnahme hinzugefügt. Andere Kodierer, beispielsweise MPEG-2 AAC haben bereits einen integrierten Verzerrungssteuerprozeß zum Zweck der Kodierung und können mit geringfügigen Abwandlungen benutzt werden, um auch ein Wasserzeichen gemäß diesem Aspekt der vorliegenden Erfindung anzubringen. Es sei noch darauf hingewiesen, daß bei Kodiersystemen mit variabler Rate die Ratenschleife nicht erforderlich ist, so daß sich eine optimale Lösung für das Parametermodulationsverfahren anbietet, während gleichzeitig die Komplexität verringert wird.
  • 27 veranschaulicht, wie ein Wasserzeichen gemäß der vorliegenden Erfindung unter Anwendung des Verzerrungsmeßverfahrens der gerade beschriebenen Art eingebettet werden kann. Das Ziel besteht vorzugsweise darin, die größtmögliche Robustheit zu erzielen, indem die Wirkung des modulierten Parameters, die als Änderung im Quantisierfehler im zweiten Durchlauf dargestellt ist, so nahe wie möglich an die perzeptuelle Schwelle gedrängt wird. Im ersten Durchlauf wird die perzeptuelle Schwelle berechnet. Im zweiten Durchlauf wird der Quantisierfehler gezeigt. Es sei erwähnt, daß es einen gewissen Spielraum gibt, um den Quantisierfehler nichtwahrnehmbar zu modifizieren. Im dritten Durchlauf ist der gewählte Wasserzeichenkodierparameter, bei diesem Beispiel der Parameter der Deltabitt-Zuordnung (d.h. Parameter deltba oder cpldeltba, die den Quantisierfehler innerhalb einer kritischen Bande beeinflussen) eingestellt worden, und das Ergebnis ist ein modifizierter Quantisierfehler. Der Quantisierfehler kann aber noch weiter modifiziert werden und trotzdem noch nichtwahrnehmbar bleiben. Es sei darauf hingewiesen, daß die Modulation des Kodierparameters über das gesamte Spektrum zu einem geringfügig anderen Quantisierfehler führt, weil die Anzahl verfügbarer Bits beeinflußt wird. Das veranschaulicht, daß eine Modulation von Kodierparameters und der resultierenden Quantisierauflösung in gewissen Bändern zu einem Fehler im gesamten Spektrum führt und nicht in der Bande, in der der Parameter moduliert wurde. Im vierten Durchlauf ist der Grad der Modulation des Kodierparameters unter Zuhilfenahme von Information aus dem dritten Durchlauf noch einmal eingestellt worden, und der resultierende Quantisierfehler liegt so nahe wie möglich an der perzeptuellen Schwelle. Obwohl bevorzugt wird, den Quantisierfehler so nahe wie möglich bis an die perzeptuelle Schwelle, aber unterhalb derselben zu bringen, wenn ein oder mehr, den Quantisierfehler beeinflussende Parameter moduliert werden, wird im Rahmen der Erfindung auch erwogen, die Modulation von einem oder mehr Parametern so vorzunehmen, daß der Quantisierfehler unterhalb der perzeptuellen Schwelle, aber nicht nahe derselben liegt, wie beispielsweise beim dritten Durchlauf in 27.
  • In 28 ist der Prozeß zum Einbetten des Wasserzeichens dargestellt, bei dem der gewählte Wasserzeichenkodierparameter der des Gesamt-SNR-Versatzes ist (d.h. die Parameter csnroffst, fsnroffst, cplfsnroffst oder Ifesfsnroffst). Es sei darauf hingewiesen, daß bei diesem Beispiel die Modulation des Gesamt-SNR-Versatzparameters eine exakte Übereinstimmung mit der perzeptuellen Schwelle zur Folge hat. Das liegt daran, daß diese Art von SNR-Versatzparameter über das gesamte Frequenzspektrum hinweg ein gleichmäßiger Versatz der perzeptuellen Schwelle ist. Dementsprechend ist für das Verfahren der Anpassung des Quantisierfehlers an die perzeptuelle Schwelle mit Hilfe des SNR-Versatzparameters nur ein Schritt nötig.
  • Gemäß einer weiteren Facette dieses Aspektes der vorliegenden Erfindung ist es einem Benutzer ermöglicht, den Versatz der perzeptuellen Schwelle zu steuern, welche die mögliche 'Verstärkung' oder Energie des Wasserzeichens steuert. Dies kann ein linearer Versatz der perzeptuellen Schwelle oder eine kompliziertere Funktion sein, die in spezifischen Bändern mehr Verzerrung erlaubt. Damit kann ein Benutzer die Leichtigkeit der Erfassung und die Hörbarkeit des endgültigen eingebetteten Signals steuern. Erreicht werden kann das durch Anheben der perzeptuellen Schwellenkurve um ein festes Ausmaß. Ferner kann der Benutzer durch Modifizieren der perzeptuellen Schwelle ein Wasserzeichen dort einbetten, wo die Wasserzeichenkodiermarge negativ ist.
  • In perzeptuellen Kodierern, wie den Dolby Digital, Dolby E und MPEG-2 AAC Kodierern wird der Quantisierprozeß bzw. die Bitzuordnung auf der Grundlage der Anzahl dem Kodierer zur Verfügung stehender Bits und dem Gesamtrauschabstand berechnet. Als nächstes wird die perzeptuelle Schwelle mit dem Quantisierfehler verglichen. Wenn die Verzerrung (Unterschied zwischen perzeptueller Schwelle und Quantisierfehler) die Erfordernisse der Vollendung nicht erfüllt, wird die gewählte Kodierparametermodulation anhand der Verzerrung abgewandelt und der Prozeß wiederholt, bis die Verzerrung annehmbar ist.
  • Bei einem bevorzugten Ausführungsbeispiel dieses Aspektes der Erfindung wird die Verzerrung aus Gruppen von Bänderkoeffizienten berechnet (d.h. nach kritischen Bändern gruppiert), welche die Basis der perzeptuellen Schwelle bilden. Es sei erwähnt, daß die perzeptuelle Schwelle auch auf dem Quantisierfehler individueller Spektralkoeffizienten beruhen kann, allerdings auf Kosten einer größeren Komplexität.
  • Sobald die Schwelle errichtet ist, beginnt der Verzerrungssteuerteil dieses Aspektes der Erfindung. Der der Prüfung unterzogene Kodierparameter wird in Übereinstimmung mit anschließenden Iterationen des Verzerrungsprozesses moduliert. Die Modulation des Kodierparameters beeinflußt die Ergebnisse der Bitzuordnung der Spektralbänder, die im Ratensteuerprozeß vorgenommen wurde. Die resultierende Schwelle der Bitzuordnung wird mit der ursprünglichen perzeptuellen Schwelle verglichen und der Kodierparameter iterativ so lange moduliert, bis die Vollendungserfordernisse erfüllt sind. Wenn die Erfordernisse zum Abschluß nicht erfüllt werden, wird die Maskierschwelle mit Hilfe des modulierten Parameters neu formuliert.
  • Bei einem bevorzugten Ausführungsbeispiel dieses Aspektes der Erfindung kann die Beendigung des adaptiven Verzerrungsprozesses geschehen, wenn die perzeptuelle Schwelle und die Maskierschwelle für irgendeine gegebene, interessierende Bande äquivalent sind und keine der Bänder der Maskierschwelle die perzeptuelle Schwelle übersteigen. Wenn die perzeptuelle und die Maskierschwelle niemals zusammenlaufen, kann eine weitere Abschlußlogik angewandt werden, sofern die Maskierschwelle die perzeptuelle Schwelle nicht überschreitet. Es existieren Abschlußerfordernisse, um die Komplexität nicht ausufern zu lassen.
  • Modulation von Dekodiererparametern.
  • 29 zeigt einen Aspekt der vorliegenden Erfindung, gemäß dem die Parameter eines perzeptuellen Audiosignaldekodierers moduliert werden. Bei diesem Beispiel wendet der Dekodierer eine hybride Bitzuordnung an (d.h. ein perzeptuelles Modell wird vom Kodierer dem Dekodierer übermittelt). Der empfangene, perzeptuelle kodierte Bitstrom 40 wird im Dekodierer in Kodierparameter 42 (das Bitzuordnungsmodell wiedergebend) und umformatierte Daten 44 (d.h. die quantisierten Daten) aufgeteilt. Bitzuordnung 46 und Umkehrquantisierung 48 werden durchgeführt. Im nächsten Schritt 50 wird eine Entscheidung getroffen (perzeptuelle Schwelle berechnet?). Wenn nicht bereits geschehen (d.h. beim ersten Durchlauf durch die Schleife), wird eine perzeptuelle Schwelle berechnet (Schritt 52), und zwar anhand des Signals vom kodierten Bitstrom. Wenn die perzeptuelle Schwelle existiert (d.h. nach dem ersten Durchlauf durch die Schleife), wird ein Vergleich im Schritt 54 zwischen dem umgekehrt quantisierten Signal und der Schwelle vorgenommen. Als nächstes erfolgt im Schritt 56 eine Entscheidung (akzeptable Verzerrung?). Ist die resultierende Verzerrung annehmbar (d.h. entspricht sie den im voraus festgelegten Abschlußerfordernissen), ist der Prozeß vollendet, und Spektralkoeffizienten werden an weitere Funktionen im Dekodierer ausgegeben. Ist die Verzerrung nicht akzeptabel, wird der modulierte Kodierparameter im Schritt 58 eingestellt und der Prozeß der Bitzuordnung, Umkehrquantisierung und des Vergleichs mit der perzeptuellen Schwelle wiederholt. Der Kodierparameter wird anfänglich auf der Grundlage der Eingabe 60 des Wasserzeichensymbols (d.h. Zusatzinformation) moduliert und anschließend auf der Grundlage des Vergleichs mit der perzeptuellen Schwelle eingestellt.
  • Ein ähnlicher Prozeß kann in einem perzeptuellen Audiosignaldekodierersystem angewandt werden, welches mit einer vorwärtsadaptiven Bitzuordnung arbeitet (d.h. ein perzeptuelles Modell wird im Kodierer erzeugt und ausdrücklich an den Dekodierer gesandt). Die Signaldaten werden unter Zuhilfenahme des übertragenen perzeptuellen Modells umformatiert. Dieses perzeptuelle Modell kann dann mittels eines Parameters modifiziert werden, um ein Wasserzeichen einzubetten. Die mit Wasserzeichen versehene Version des Audiosignals wird mit dem nicht markierten Signal verglichen. Wenn die Verzerrungsmessung das festgelegte, im voraus bestimmte Vollendungserfordernis bzw. Erfordernisse nicht erfüllt, wird das Signal mit Hilfe eines modifizierten Parametermodulationswertes neu formuliert.
  • Steuern der Parametermodulation in Abhängigkeit von einer Wasserzeichenfolge und/oder einer deterministischen Folge.
  • Weitere Aspekte der Erfindung sehen vor, die Modulation von einem oder mehr Parametern indirekt mit der Zusatzinformation oder einem Wasserzeichensignal oder einer Folge zu steuern. Die Steuerung der Modulation mittels des Wasserzeichens beispielsweise wird mittels einer Funktion von einem oder mehr weiteren Signalen oder Datensequenzen modifiziert, die zum Beispiel einen Satz Befehle umfassen, wie eine deterministische Folge und/oder das an das Kodiersystem angelegte Eingabesignal. Dieser Aspekt der Erfindung ist im Funktionsblockschaltbild der 30 dargestellt. Wie bei der grundlegenden Anordnung gemäß 2 wird primäre Information einer perzeptuellen Kodiererfunktion 2 zugeführt, die einen digitalen Bitstrom erzeugt, der von einer perzeptuellen Dekodiererfunktion 4 empfangen wird. Bei diesem Aspekt der Erfindung wird die Zusatzinformation einer Parametersteuerungsfunktion 62 zugeführt. Die Parametersteuerungsfunktion 62 empfängt auch die primäre Information oder eine oder mehr deterministische Folgen oder sowohl die primäre Information und eine oder mehr deterministische Folgen. Die Parametersteuerung 62 modifiziert die Art und Weise, in der sekundäre Information Parameter der Kodiererfunktion oder Dekodiererfunktion moduliert. Das geschieht durch Modifizieren von einem oder mehr Sätzen sekundärer Information jeweils mit entweder einer Funktion der primären Information und/oder einer Funktion von einer oder mehr deterministischen Folgen, wie als nächstes beschrieben wird. Da modifizierte Zusatzinformation von der Parametersteuerungs-Funktion entweder der Kodiererfunktion oder der Dekodiererfunktion oder beiden zugeführt werden kann, sind von der Zusatzinformation zur Kodierertunktion und zur Dekodiererfunktion jeweils gestrichelte Linien gezeigt. Wie bei der Anordnung gemäß 2 ist die Ausgabe der perzeptuellen Dekodiererfunktion primäre Information mit eingebetteter Zusatzinformation. Die Zusatzinformation kann in der Dekodiererfunktionsausgabe feststellbar sein.
  • Wenn mit modifizierter Zusatzinformation die Parametermodulation sowohl in der Kodiererfunktion 2 als auch in der Dekodiererfunktion 4 gesteuert wird, ist es üblich, daß sich die der einen zugeführte Information von der der anderen zugeführten unterscheidet. Zum Beispiel könnte die einen oder mehr Kodiererfunktionsparameter steuernde Zusatzinformation ein Wasserzeichen wiedergeben, das den Eigentümer des Ton- oder Bildinhalts identifiziert, und die den einen oder mehr Dekodiererfunktionsparameter steuernde Zusatzinformation könnte eine laufende Nummer sein, die das Gerät identifiziert, welches den Ton- oder Bildinhalt einem oder mehr Verbrauchern darstellt.
  • Wenn die Parametersteuerung 62 eine deterministische Folge anwendet, um die Art und Weise zu modifizieren, in der die Zusatzinformation einen oder mehr Parameter moduliert, ist es für die Erfassung der Zusatzinformation oder des Wasserzeichens in der Dekodiererfunktionsausgabe nötig, daß die Generatorgleichung und der Schlüssel der deterministischen Folge der Detektorfunktion bekannt sind. Die Generatorgleichung kann öffentlich bekannt sein, kann dem Detektor (aber nicht öffentlich) a priori bekannt sein, oder sie kann dem Detektor über einen sicheren Kanal mitgeteilt werden. Ähnlich kann der Schlüssel öffentlich bekannt sein, dem Detektor (aber nicht öffentlich) a priori bekannt sein oder dem Detektor über einen sicheren Kanal mitgeteilt werden. Wenn das System sicher sein soll, besteht die einzige Notwendigkeit darin, daß der Schlüssel nicht öffentlich offenbart wird.
  • Wenn die Parametersteuerung 62 des Eingabesignal benutzt, um die Art und Weise zu modifizieren, in der die Zusatzinformation einen oder mehr Parameter moduliert, ist es für die Erfassung der Zusatzinformation oder des Wasserzeichens in der Dekodiererfunktionsausgabe nötig, daß das Quellensignal oder mindestens gewisse Information über das Quellensignal (z.B. die Eigenschaften des Quellensignals, auf die zu reagieren die Parametersteuerung programmiert ist) der Detektorfunktion bekannt ist. Das kann dadurch geschehen, daß der Detektorfunktion das Quellensignal oder vorzugsweise die Eigenschaften des Quellensignals, auf die zu reagieren die Parametersteuerung programmiert ist, mitgeteilt werden. Wird das Quellensignal statt der relevanten Charakteristiken des Quellensignals mitgeteilt, kann es der Detektorfunktion möglich sein, die relevanten Charakteristiken auf der Basis einer Analyse des Quellensignals und der Dekodiererfunktionsausgabe selbständig abzuleiten. Dabei können aber Fehler auftreten, weil die Charakteristiken ursprünglich anhand des Quellensignals ohne Quantisierfehler festgelegt wurden.
  • Steuern der Parametermodulation in Abhängigkeit von einer deterministischen Folge.
  • Modifizieren der Frequenz von Wasserzeichensymbolübergängen.
  • Eine Variation dieses Aspektes der vorliegenden Erfindung sieht vor, mit einer deterministischen Folge die Frequenz der Übergänge des Parametermodulationszustands und folglich die Frequenz von Wasserzeichensymbolübergängen zu steuern. Insbesondere beinhaltet dies, die Dauer der Parametermodulationszustände und folglich die Dauer der Wasserzeichensymbolfrequenzen in Abhängigkeit von der deterministischen Folge zu ändern. Wenn Wasserzeichensymbolübergänge mit einer gleichbleibenden Rate eingebettet werden, können sich wiederholende Sequenzen im Wasserzeichensymbolmuster wahrnehmbar werden. Wenn man die Dauer der Parametermodulationszustände und folglich die Dauer des Symbols modifiziert, können Wiederholungseffekte auf ein Minimum eingeschränkt werden. Die folgende Tabelle 1 zeigt ein Beispiel, bei dem die Dauer des Parametermodulationszustands und folglich die Dauer des Wasserzeichensymbols von einer deterministischen Folge abhängig ist, was zu dem Muster führt, das als modifizierte Folge dargestellt ist. Bei diesem speziellen Beispiel wird die Wasserzeichenfolge wiederholt, wenn der Wert der deterministischen Folge (DS) "1" ist. Hat die DS einen Wert "0", wird das Wasserzeichensymbol nicht wiederholt. Es sei darauf hingewiesen, daß die Periode des Wasserzeichensymbolmusters entsprechend dem Auftreten des Wertes "1" in der deterministischen Folge zunimmt. Daher sollte eine endliche Folge benutzt werden, die angemessen zurücksetzt, so daß während der Erfassung eine Synchronisation möglich ist.
  • Figure 00390001
    Tabelle 1
  • Auswahl des Parameters zum Einbetten des Wasserzeichens.
  • In weiterer Variation dieses Aspektes der Erfindung wählt eine deterministische Folge den Parameter oder die Parameter aus, die zum Einbetten des Wasserzeichens benutzt werden. Insgesamt ist es möglich, zum Einbetten eines Wasserzeichens irgendeinen von mehreren Parametern zu verwenden. Zum Beispiel kann die Modulation eines Parameters zu einer Modifizierung spektraler Energie in einem bestimmten Frequenzbereich führen, und die Modulation eines anderen Parameters hat eine Verkleinerung der Bandbreite des dekodierten Signals zur Folge. Falls nur ein Parameter moduliert wird, ist das resultierende Wasserzeichen möglicherweise für jemand stärker wahrnehmbar, der eine ausgeprägte Empfindlichkeit gegenüber spektraler Energiemodulation hat. Wenn andererseits bei der angewandten Einbettechnik zwischen der Modulation eines Parameters und der Modulation eines anderen Parameters umgeschaltet wird, kann das resultierende Wasserzeichen weniger wahrnehmbar sein. Wenn die Anzahl der Einbettungsparameter für Wasserzeichen zunimmt, wird diese Wirkung deutlicher (die durch das Wasserzeichen eingeführte Beeinträchtigung wird rauschähnlicher).
  • Tabelle 2 veranschaulicht zwei Möglichkeiten, wie Kodierparameter zur Modulation ausgewählt werden können. Beim ersten Beispiel, welches in Teil "a" der Tabelle 2 gezeigt ist, nehmen die Parameter 1 und 2 den Wert der Wasserzeichenfolge (WS) in Abhängigkeit von der deterministischen Folge (DS) an. Zum Beispiel wird Parameter 1 zu einem Zustand moduliert, der den WS Wert wiedergibt, wenn der DS Wert "0" ist, ansonsten wird er auf einen Zustand moduliert, der einen "0" Wert wiedergibt (jeder der beiden Zustände kann, muß aber nicht der Vorgabewert des Parameters sein). Entsprechend wird Parameter 2 auf einen Zustand moduliert, der den WS Wert wiedergibt, wenn der DS Wert "1" ist, ansonsten wird er auf einen Zustand moduliert, der einen "0" Wert wiedergibt (jeder der beiden Zustände kann, muß aber nicht der Vorgabewert des Parameters sein). Bei diesem Beispiel sind die Folgen von beiden Parametern und von der DS nötig, um WS zu erfassen. Beim zweiten Beispiel, welches in Teil "b" der Tabelle 2 gezeigt ist, werden die Parameter 1 und 2 zu einem Zustand moduliert, der den Wert von WS wiedergibt, der nur von WS selbst abhängig ist. Parameter 1 zum Beispiel wird von seinem Vorgabezustand zu einem Zustand moduliert, der einen WS Wert "0" wiedergibt, und Parameter 2 wird von seinem Vorgabezustand zu einem Zustand moduliert, der einen WS Wert "1" wiedergibt. Auf diese Weise kann der eine oder andere Parameter unabhängig erfaßt werden, da beide WS übermitteln.
  • Figure 00400001
    Tabelle 2
  • Modifizieren der Frequenz, mit der die Wahl der zu modulierenden Parameter geändert wird.
  • Gemäß einer weiteren Variation dieses Aspektes der Erfindung kann sich die Wahl der zu modulierenden Parameter in Abhängigkeit von einer deterministischen Folge ändern. Dadurch kann die Wahrnehmbarkeit des Wasserzeichens weiter verringert werden, da durch das Ändern der Einbettungstechnik mit gleichbleibender Frequenz eingeführte periodische Auswirkungen ausgeschaltet werden. Dieses Ausführungsbeispiel ist in Tabelle 3 dargestellt. Bei diesem Beispiel wird Parameter 1 zu einem Zustand moduliert, der das Umgekehrte von WS wiedergibt (jeder der beiden Zustände kann, muß aber nicht der Vorgabewert des Parameters sein), und das Symbol wiederholt sich, wenn der DS Wert "1" ist, ansonsten wird es nicht wiederholt. Parameter 2 wird zu einem Zustand moduliert, der den Vorgabewert von WS wiedergibt (jeder der beiden Zustände kann, muß aber nicht der Vorgabewert des Parameters sein), und das Symbol wiederholt sich, wenn der DS Wert "1" ist, ansonsten wird es nicht wiederholt. Beide Parameter übermitteln das Wasserzeichen, wie im Beispiel gemäß Teil b in Tabelle 2.
  • Figure 00410001
    Tabelle 3
  • Steuern der Parametermodulation in Abhängigkeit von Charakteristiken des Quellensignals.
  • Modifizieren der Frequenz von Wasserzeichensymbolübergängen mittels Quellensignalanalyse.
  • Eine weitere Variation dieses Aspektes der Erfindung sieht vor, die Eigenschaften des Quellensignals zu analysieren und dann auf der Basis der Ergebnisse dieser Analyse die Frequenz der Parametermodulationsübergänge und damit die Frequenz der Wasserzeichensymbolübergänge adaptiv zu steuern. Dies beinhaltet insbesondere in Abhängigkeit von Charakteristiken des Quellensignals die Dauer der Parametermodulationszustände und folglich die Dauer der Wasserzeichensymbolzustände zu ändern. Ein rasches Ändern der Signalbedingungen kann zum Beispiel ein nützliches Maß an zeitlicher Maskierung hervorbringen, die dann benutzt werden kann, die Wahrnehmbarkeit eines Wasserzeichensymbolübergangs zu schwächen. Wenn sich die Amplitude des Zeitbereich-Quellensignals unter der Annahme, daß das Quellensignal zu einem digitalen Signalstrom mit Rahmen formatiert wurde, von Rahmen 1 zu Rahmen 2 über eine vorherbestimmte Schwelle ändert, kann es dem Wasserzeichensymbol erlaubt werden, sich von einem Wert im Rahmen 1 zu einem anderen Wert im Rahmen 2 zu ändern. Im Rahmen 3 kann es dem Symbol, wenn sich die Charakteristik des Quellensignals nicht über die Schwelle von dem/den vorherigen Rahmen unterscheidet, nicht erlaubt sein, die Werte zu ändern. Durch das Korrelieren der Wasserzeichensymbolübergänge mit Maskierereignissen oder sonstigen "änderungsfreundlichen" Bedingungen im zugrundeliegenden Quellensignal kann die Nichtwahrnehmbarkeit des Wasserzeichens verbessert werden.
  • In der Tabelle 4 stellt eine quellenbestimmte Folge (SDS) die Ausgabe eines Schwellenprozesses dar, beispielsweise eine Übergangserfassung. Für dieses Beispiel zeigt ein SDS Wert "0" an, daß keine Übergangsbedingung aufgetreten ist, und ein Wert "1" zeigt an, daß ein Übergang im Block vorhanden war. In Teil "a" der Tabelle 4 wird der WS Wert wiederholt (durch Wiederholung des gleichen Modulationszustands des Parameters), wenn SDS einen Wert "1" hat. Hat SDS einen Wert "0", wird das Wasserzeichensymbol nicht wiederholt. Bei diesem Beispiel wird angenommen, daß ein einziger Kodierparameter das Wasserzeichen übermittelt.
  • Modifizieren der Frequenz, mit der die Wahl der zu modulierenden Parameter sich ändert, unter Zuhilfenahme einer Quellensignalanalyse.
  • Bei einem weiteren Aspekt der Erfindung wird der gerade erklärte Aspekt so modifiziert, daß die Eigenschaften des Quellensignals benutzt werden, um die Frequenz zu ändern, mit der sich die Wahl von zu modulierenden Parametern ändert, im Gegensatz zur Frequenz der Parametermodulation. Wie bei dem gerade erläuterten Aspekt besteht der Vorteil darin, daß die Übergänge weniger wahrnehmbar sind, falls sie auftauchen, wenn das Quellensignal eine zeitliche Maskierung oder sonstige "änderungsfreundliche" Bedingungen bietet. Ein Beispiel dieses Ausführungsbeispiels ist in Teil "b" der Tabelle 4 gezeigt. Bei diesem Beispiel wird Parameter 1 zu einem Zustand moduliert, der die Umkehr von WS wiedergibt (jeder der beiden Zustände kann, muß aber nicht der Vorgabewert des Parameters sein), und das Symbol wiederholt sich, wenn der SDS Wert "1" ist, ansonsten wird es nicht wiederholt. Parameter 2 wird zu einem Zustand moduliert, der den Vorgabewert von WS wiedergibt (jeder der beiden Zustände kann, muß aber nicht der Vorgabewert des Parameters sein), und das Symbol wiederholt sich, wenn der SDS Wert "1" ist und wird ansonsten nicht wiederholt. Wie beim Beispiel in Teil b der Tabelle 2 übermitteln beide Parameter das Wasserzeichen. Dieser Ansatz ist ähnlich dem in Tabelle 3 gezeigten, unterscheidet sich aber nur darin, daß die Übergangsfrequenz hier durch SDS bestimmt ist.
  • Figure 00420001
    Tabelle 4
  • Auswahl des Parameters zum Einbetten des Wasserzeichens mittels Quellensignalanalyse.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird die Anzahl der Parameter im verfügbaren Parametersatz, die zur Modulation verfügbar sind, auf der Grundlage von Charakteristiken des Quellensignals modifiziert. Angenommen, ein bestimmtes Wasserzeichensystem könne ein Wasserzeichen dadurch einbetten, daß irgendwelche von mehreren unterschiedlichen Parametern moduliert werden (z.B. Parameter, die zu einem Spektralenergiestoß, zeitlichem Rauscheinschub, Bandbreitenreduzierung usw. führen). Je nach den aktuellen Charakteristiken des Quellensignals verursachen unter Umständen nicht alle diese Parameter nichtwahrnehmbare Änderungen im dekodierten Signal. Wenn zum Beispiel das Quellensignal stationär ist, kann der Einschub zeitlichen Rauschens stärker wahrnehmbar sein als ein Spektralenergiestoß in einem Frequenzbereich, der perzeptuell maskiert ist. Folglich kann es nützlich sein, den verfügbaren Parametersatz zu verkleinern, um diejenigen nicht zuzulassen, die für die aktuelle Signalcharakteristik stärker wahrnehmbar sind.
  • In Tabelle 5 zeigt ein Beispiel eine signalbestimmte Folge (SDS) auf der gleichen Basis wie der zuvor beschriebene Schwellenprozeß (Übergangserfassung). Ein SDS Wert "1" zeigt an, daß im Block eine Übergangsbedingung existiert, und ein SDS Wert "0" zeigt an, daß keine Übergangsbedingung besteht. In Tabelle 5 wird von Parametern 1 und 2 das Wasserzeichen nominell übermittelt, wenn keine Übergangsbedingung besteht (SDS = 0), wobei Parameter 1 einen Modulationszustand hat, der einen Wert "1" für WM Werte "0" wiedergibt und einen Modulationszustand hat, der ansonsten einen Wert "0" wiedergibt, und der Parameter 2 einen Modulationszustand hat, der für WM Werte "1" einen Wert "1" wiedergibt und ansonsten einen Modulationszustand hat, der einen Wert "0" wiedergibt. Wenn eine Übergangsbedingung vorliegt (SDS = 1), werden die Parameter 3 und 4 moduliert, Parameter, die optimal eine zeitliche Verzerrung verursachen, statt der Parameter 1 und 2, die eine spektrale Verzerrung verursachen. Nachdem die Anzahl der Parameter verringert wurde, kann dann eine deterministische Folge benutzt werden, um Parameter aus dem kleineren Satz auszuwählen, wobei der Vorteil des Umschaltens zwischen oder unter Parametern erhalten bleibt, während gleichzeitig unter Parametern adaptiv gewählt wird, die angesichts aktueller Quellensignalcharakteristiken vorzuziehen sind.
  • Figure 00430001
    Tabelle 5
  • Steuern der Parametermodulation in Abhängigkeit von einer deterministischen Folge und den Charakteristiken des Quellensignals.
  • Zusätzlich zum Steuern der Parametermodulation mittels nur einer deterministischen Folge oder nur mittels Eigenschaften des Eingabesignals wird mit der Erfindung auch erwogen, die Parametermodulation in Abhängigkeit sowohl von einer deterministischen Folge als auch den Eigenschaften des Eingabesignals zu steuern.
  • Es gibt viele Wege, die Anwendung einer deterministischen Folge und der Quellensignaleigenschaften zu kombinieren, um die Parametermodulation zu steuern. Das zu tun, kann die Nichtwahrnehmbarkeit und/oder Robustheit weiter verbessern. Bei einem derartigen Verfahren wählt eine deterministische Folge aus, welcher Teilsatz von Kodierparametern für verschiedene Zustände der Signalcharakteristiken verwendet wird. Im einzelnen werden unter Rückgriff auf das Beispiel der Tabelle 5 oben die beiden ersten Parameter zur Modulation gewählt, wenn ein Übergang nicht existiert (SDS = 0), und jene Parameter werden auf der Grundlage einer deterministischen Folge gewählt, DS. Tabelle 6 veranschaulicht dieses Verfahren.
  • Figure 00440001
    Tabelle 6
  • Bei einem weiteren Beispiel modifiziert die deterministische Folge die Frequenz der Übergänge der Wasserzeichenfolgen, die durch eine signalbestimmte Folge modifiziert sind. Tabelle 7 veranschaulicht dieses Verfahren. Die zweite Spalte veranschaulicht den ersten Schritt der Abänderung der Einbettechnik auf der Basis von SDS, und die dritte Spalte veranschaulicht den zweiten Schritt der weiteren Abänderung der Frequenz der Folgen auf der Basis von DS. Wie bei vorhergehenden Beispielen wird der Wert der Folge wiederholt, wenn SDS einen Wert von "1" hat. Wenn SDS einen Wert "0" hat, wird der Folgewert nicht wiederholt.
  • Figure 00450001
    Tabelle 7
  • Bei jedem der Beispiele, bei denen mehrere Kodierparameter die eingebettete Sequenz übermitteln, gibt es auch die Möglichkeit, Redundanz hinzuzufügen, indem die gleiche Wasserzeichenfolge auf mehrere Kodierparameter angewandt wird, um die Fehlerflexibilität auf Angriff oder Verarbeitung zu stärken. Um eine Erfassung mit weniger Komplexität zu erleichtern, können derartige Kodierparameter eingeschränkte Beziehungen oder eine vorherbestimmte Hierarchie haben, so daß der Detektor, falls ein Parameter Fehler hat, imstande ist, die Nachricht aus einem anderen Kodierparameter wiederherzustellen.
  • Darüber hinaus kann eine deterministische Folge benutzt werden, um gleichzeitig einen oder mehr weitere Kodierparameter zu modulieren, damit es einem Angreifer schwer gemacht wird, zu folgern, welcher Parameter das Wasserzeichen trägt. Bei einem in Tabelle 8 gezeigten Beispiel übermittelt Parameter 1 die Wasserzeichenfolge, und die deterministische Folge legt fest, welcher, der Parameter 2 oder Parameter 3, sich anhand der Wasserzeichenfolge ändern wird. In diesem Fall tragen die Parameter 2 und 3 das Wasserzeichen nicht, sie dienen lediglich als Lockvögel. Die Lockvogelparameter entsprechen bei diesem Beispiel der WS für den angemessenen Zustand von DS und sind ansonsten "0".
  • Figure 00450002
    Tabelle 8
  • Schlußfolgerung
  • Die vorliegende Erfindung und ihre verschiedenen Aspekte können als Softwarefunktionen verwirklicht werden, die in Prozessoren digitaler Signale, programmierten, digitalen Universalrechnern und/oder digitalen Spezialrechnern durchgeführt werden. Schnittstellen zwischen analogen und digitalen Signalströmen können in entsprechender Hardware und/oder als Funktionen in Software und/oder Firmware ausgeführt werden.

Claims (21)

  1. Verfahren zum Modifizieren der Operation der Kodiererfunktion und/oder der Dekodiererfunktion eines perzeptuellen Kodiersystems entsprechend Zusatzinformation, so daß die Zusatzinformation in der Ausgabe der Dekodiererfunktion feststellbar sein kann, aufweisend: Modulieren von einem oder mehr Parametern in der Kodierertunktion und/oder der Dekodiererfunktion in Abhängigkeit von dem Informationsinhalt der Zusatzinformation.
  2. Verfahren nach Anspruch 1, bei dem der perzeptuelle Kodierer ein Audiosignalkodierer des Typs ist, der eine hybride Vorwärts/Rückwärts-Bitzuordnung anwendet.
  3. Verfahren nach Anspruch 2, bei dem der oder die Parameter einen oder mehr Parameter einschließen, die in eine oder mehr der folgenden Kategorien fallen: Maskiermodell und Bitzuordnung, Kopplung zwischen oder unter Kanälen, Frequenzbandbreite, Zittersteuerung, Phasenbeziehung und Zeit/Frequenz-Transformationsfenster.
  4. Verfahren nach Anspruch 1, bei dem der perzeptuelle Kodierer ein Audiosignalkodierer des Typs ist, der eine Vorwärtsbitzuordnung anwendet.
  5. Verfahren nach Anspruch 4, bei dem der oder die Parameter einen oder mehr Parameter umfassen, die in eine oder mehr der folgenden Kategorien fallen: Maskiermodell und Bitzuordnung, Kopplung zwischen oder unter Kanälen, zeitliche Rauschformungsfilterkoeffizienten und Zeit/Frequenz-Transformationsfenster.
  6. Verfahren nach Anspruch 1, bei dem der perzeptuelle Kodierer ein Videosignalkodierer ist und bei dem der oder die Parameter einen oder mehr Parameter umfassen, die in eine oder mehr der folgenden Kategorien fallen: Rahmentyp und Bewegungssteuerung.
  7. Verfahren nach Anspruch 1, bei dem der oder die Parameter aus Parametern ausgewählt werden, die in dem dekodierten Ausgabesignal eines oder mehr der folgenden beeinflussen: Rauschabstand, Quantisierrauschen Zeitbeziehung zwischen oder unter Kanälen, Frequenzbandbreite, geformtes Rauschen, Phasenbeziehung zwischen oder unter Kanälen und Breitspektrum, zeitverfälschendes Rauschen.
  8. Verfahren nach Anspruch 1, bei dem der oder die Parameter dadurch moduliert werden, daß eine der folgenden Tätigkeiten durchgeführt wird: Ändern eines Parameters mit zwei Werten zwischen seinen zwei Werten, Ändern des Parameters zwischen oder unter seinem Vorgabewert und einem oder mehr weiteren Werten und Ändern des Parameters zwischen oder unter anderen Werten als seinem Vorgabewert.
  9. Verfahren nach Anspruch 1, bei dem der Grad der Modulation des oder der Parameter gesteuert wird.
  10. Verfahren nach Anspruch 9, bei dem der Grad der Modulation des oder der Parameter so gesteuert wird, daß die Wahrnehmbarkeit von Artefakten im dekodierten Ausgabesignal, die aus der Modulation des oder der Parameter resultieren, begrenzt wird.
  11. Verfahren nach Anspruch 1, bei dem die Modulation eines Parameters in Übereinstimmung mit der Zusatzinformation indirekt gesteuert wird, so daß eine oder mehr der folgenden Modulationseigenschaften: die Auswahl von einem oder mehr Parametern zur Modulation, die Frequenz der Parameterauswahl und die Frequenz der Parameterzustandsübergänge in Abhängigkeit von der Zusatzinformation und als Funktion von einem oder mehr weiteren Signalen oder Folgen bestimmt wird/werden.
  12. Verfahren nach Anspruch 11, bei dem das oder die weiteren Signale oder Folgen entweder einen Satz Befehle oder Eigenschaften des Eingabesignals in den Kodierer des Kodiersystems oder beides umfaßt/umfassen.
  13. Verfahren nach Anspruch 12, bei dem der Satz Befehle eine deterministische Folge umfaßt.
  14. Verfahren nach Anspruch 13, bei dem die deterministische Folge eine Pseudozufallszahlenfolge ist.
  15. Verfahren nach Anspruch 1, bei dem der oder die Parameter in der Kodiererfunktion moduliert werden.
  16. Verfahren nach Anspruch 1, bei dem der oder die Parameter in der Dekodiererfunktion moduliert werden.
  17. Verfahren nach Anspruch 1, bei dem der oder die Parameter in der Kodiererfunktion und in der Dekodiererfunktion moduliert werden.
  18. Verfahren zum Modifizieren der Operation des Kodierers und/oder Dekodierers eines perzeptuellen Kodiersystems in Übereinstimmung mit Zusatzinformation und zum Erfassen der Zusatzinformation in der Ausgabe des Dekodierers gemäß Anspruch 1, ferner aufweisend: Erfassen der Zusatzinformation in der Ausgabe der Dekodiererfunktion.
  19. Verfahren nach Anspruch 18, bei dem die Tätigkeit der Erfassung der Zusatzinformation in der Ausgabe der Dekodiererfunktion durch eine der folgenden Tätigkeiten erledigt wird: Beobachten des dekodierten Signals, Vergleichen des dekodierten Signals mit dem der Kodiererfunktion zugeführten Signal und Vergleichen des dekodierten Signals mit dem dekodierten Signal von einem im wesentlichen identischen perzeptuellen Kodiersystem, in welchem keine Parameter in der Kodiererfunktion oder Dekodiererfunktion in Abhängigkeit von Zusatzinformation moduliert sind.
  20. Verfahren nach Anspruch 19, bei dem die Tätigkeit des Beobachtens des dekodierten Signals aufweist, das dekodierte Signal mit einer zeitlich verzögerten Version seiner selbst zu vergleichen.
  21. Verfahren nach Anspruch 1, bei dem ein oder mehr perzeptuelle Kodierparameter in Abhängigkeit von der Zusatzinformation moduliert werden.
DE60114638T 2000-08-16 2001-08-15 Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information Expired - Lifetime DE60114638T2 (de)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US22604400P 2000-08-16 2000-08-16
US22615100P 2000-08-16 2000-08-16
US226044P 2000-08-16
US226151P 2000-08-16
US25596400P 2000-12-15 2000-12-15
US25600000P 2000-12-15 2000-12-15
US25615700P 2000-12-15 2000-12-15
US25607800P 2000-12-15 2000-12-15
US25596700P 2000-12-15 2000-12-15
US25596500P 2000-12-15 2000-12-15
US256078P 2000-12-15
US256157P 2000-12-15
US255964P 2000-12-15
US256000P 2000-12-15
US255965P 2000-12-15
US255967P 2000-12-15
PCT/US2001/025473 WO2002015587A2 (en) 2000-08-16 2001-08-15 Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information

Publications (2)

Publication Number Publication Date
DE60114638D1 DE60114638D1 (de) 2005-12-08
DE60114638T2 true DE60114638T2 (de) 2006-07-20

Family

ID=27575224

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60114638T Expired - Lifetime DE60114638T2 (de) 2000-08-16 2001-08-15 Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information

Country Status (12)

Country Link
US (1) US7395211B2 (de)
EP (1) EP1310099B1 (de)
JP (1) JP2004506947A (de)
KR (1) KR100898879B1 (de)
CN (1) CN100431355C (de)
AT (1) ATE308858T1 (de)
AU (2) AU8491001A (de)
BR (1) BRPI0113271B1 (de)
CA (1) CA2418722C (de)
DE (1) DE60114638T2 (de)
HK (1) HK1080243B (de)
WO (1) WO2002015587A2 (de)

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
DE10046575B4 (de) * 2000-09-20 2005-03-10 Siemens Ag Verfahren zur Frequenzakquisition, insbesondere zur Initialfrequenzakquisition, einer mobilen Kommunikationseinrichtung
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
JP2005502920A (ja) * 2001-09-05 2005-01-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Dsd信号のための堅牢なウォーターマーク
US20030131350A1 (en) 2002-01-08 2003-07-10 Peiffer John C. Method and apparatus for identifying a digital audio signal
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
EP1493155A1 (de) * 2002-03-28 2005-01-05 Koninklijke Philips Electronics N.V. Fensterformungsfunktionen zur wasserzeichenmarkierung von multimediasignalen
FR2840147B1 (fr) * 2002-05-24 2004-08-27 France Telecom Procedes de brouillage et de debrouillage de signal video, systeme, decodeur, serveur de diffusion, support de donnees pour la mise en oeuvre de ces procedes
GB2390502A (en) * 2002-07-04 2004-01-07 Sony Uk Ltd Watermarking material using a bandwidth adapted codeword
US7239981B2 (en) * 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
KR20050098893A (ko) * 2003-02-07 2005-10-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 신호 처리
US7167209B2 (en) * 2003-02-07 2007-01-23 Warner Bros. Entertainment, Inc. Methods for encoding data in an analog video signal such that it survives resolution conversion
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
US20060168448A1 (en) * 2003-06-19 2006-07-27 Minne Van Der Veen Raising detectability of additonal data in a media signal having few frequency components
KR20050026641A (ko) * 2003-09-09 2005-03-15 삼성전자주식회사 오디오 신호에 가라오케 정보를 삽입하기 위한 방법,삽입된 가라오케 정보의 재생 방법, 및 그 장치와 이를구현하기 위한 프로그램이 기록된 기록 매체
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
EP1914722B1 (de) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Mehrkanalige Audiodekodierung
JP4230953B2 (ja) * 2004-03-31 2009-02-25 株式会社ケンウッド ベースバンド信号生成装置、ベースバンド信号生成方法及びプログラム
TWI404419B (zh) * 2004-04-07 2013-08-01 Nielsen Media Res Inc 與壓縮過音頻/視頻資料一起使用之資料插入方法、系統、機器可讀取媒體及設備
US7451093B2 (en) * 2004-04-29 2008-11-11 Srs Labs, Inc. Systems and methods of remotely enabling sound enhancement techniques
DE102004021404B4 (de) * 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
DE102004021403A1 (de) 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
NZ552644A (en) 2004-07-02 2008-09-26 Nielsen Media Res Inc Methods and apparatus for mixing compressed digital bit streams
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
WO2006030340A2 (en) * 2004-09-17 2006-03-23 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
US7668715B1 (en) * 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
JP2006337851A (ja) * 2005-06-03 2006-12-14 Sony Corp 音声信号分離装置及び方法
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
JP4896455B2 (ja) * 2005-07-11 2012-03-14 株式会社エヌ・ティ・ティ・ドコモ データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
KR100695158B1 (ko) * 2005-08-03 2007-03-14 삼성전자주식회사 영상 부호화장치 및 방법과 그 복호화장치 및 방법
KR101277041B1 (ko) * 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
GB2431839B (en) * 2005-10-28 2010-05-19 Sony Uk Ltd Audio processing
US7949131B2 (en) * 2005-12-19 2011-05-24 Sigmatel, Inc. Digital security system
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
FR2898458B1 (fr) * 2006-03-10 2008-05-16 Medialive Procede pour la distribution securisee de sequences audiovisuelles, decodeur et systeme pour la mise en oeuvre de ce procede
ES2359799T3 (es) 2006-04-27 2011-05-27 Dolby Laboratories Licensing Corporation Control de ganancia de audio usando detección de eventos auditivos basada en la sonoridad específica.
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US7940833B2 (en) * 2006-06-21 2011-05-10 Telefonaktiebolaget Lm Ericsson (Publ) Transmitter with intelligent preconditioning of amplifier signal
JP5011849B2 (ja) * 2006-06-29 2012-08-29 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
WO2008045950A2 (en) 2006-10-11 2008-04-17 Nielsen Media Research, Inc. Methods and apparatus for embedding codes in compressed audio data streams
WO2008046203A1 (en) 2006-10-18 2008-04-24 Destiny Software Productions Inc. Methods for watermarking media data
US8229159B2 (en) * 2007-09-28 2012-07-24 Dolby Laboratories Licensing Corporation Multimedia coding and decoding with additional information capability
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
US20090285402A1 (en) * 2008-05-16 2009-11-19 Stuart Owen Goldman Service induced privacy with synchronized noise insertion
CN101588341B (zh) 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
US8515239B2 (en) * 2008-12-03 2013-08-20 D-Box Technologies Inc. Method and device for encoding vibro-kinetic data onto an LPCM audio stream over an HDMI link
ES2567129T3 (es) * 2009-01-28 2016-04-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de ordenador
US8626516B2 (en) * 2009-02-09 2014-01-07 Broadcom Corporation Method and system for dynamic range control in an audio processing system
CA2760677C (en) 2009-05-01 2018-07-24 David Henry Harkness Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
EP3352168B1 (de) * 2009-06-23 2020-09-16 VoiceAge Corporation Forward time domain aliasing mit anwendung in gewichteter oder originaler signaldomäne
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
EP2460158A4 (de) 2009-07-27 2013-09-04 Verfahren und vorrichtung zur verarbeitung eines tonsignals
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
CN101651837B (zh) * 2009-09-10 2011-03-02 北京航空航天大学 一种基于帧间预测误差直方图修改的可逆视频水印方法
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
EP3693963B1 (de) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultanes rauschenformen in zeit- und frequenzbereich für tdac-trasnformationen
US8638851B2 (en) * 2009-12-23 2014-01-28 Apple Inc. Joint bandwidth detection algorithm for real-time communication
EP2524374B1 (de) 2010-01-13 2018-10-31 Voiceage Corporation Audio-dekodierung mit vorwärts aliasing-unterdrückung im zeitbereich mittels linear-prädiktiver filterung
JP5472471B2 (ja) * 2010-08-27 2014-04-16 富士通株式会社 電子透かし埋め込み装置、電子透かし埋め込み方法及び電子透かし埋め込み用コンピュータプログラムならびに電子透かし検出装置
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
ES2628427T3 (es) 2011-02-02 2017-08-02 Nagravision S.A. Decodificador multimedia y método de decodificación que permite el rastreo del decodificador multimedia
BR112013020770A2 (pt) 2011-02-15 2019-08-27 Allergan Inc composições de creme farmacêutico de oximetazolina para tratamento de sintomas de rosácea
JP5752324B2 (ja) * 2011-07-07 2015-07-22 ニュアンス コミュニケーションズ, インコーポレイテッド 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
EP2549400A1 (de) * 2011-07-22 2013-01-23 Thomson Licensing Verfahren zum Schutz eines ungeschützten Klangeffektprogramms
US8762146B2 (en) * 2011-08-03 2014-06-24 Cisco Technology Inc. Audio watermarking
US9164724B2 (en) 2011-08-26 2015-10-20 Dts Llc Audio adjustment system
US8527264B2 (en) 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US8909517B2 (en) * 2012-08-03 2014-12-09 Palo Alto Research Center Incorporated Voice-coded in-band data for interactive calls
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9269363B2 (en) * 2012-11-02 2016-02-23 Dolby Laboratories Licensing Corporation Audio data hiding based on perceptual masking and detection based on code multiplexing
US9378748B2 (en) 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
US9317872B2 (en) 2013-02-06 2016-04-19 Muzak Llc Encoding and decoding an audio watermark using key sequences comprising of more than two frequency components
BR112015019543B1 (pt) 2013-02-20 2022-01-11 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho para codificar um sinal de áudio, descodificador para descodificar um sinal de áudio, método para codificar e método para descodificar um sinal de áudio
US9679053B2 (en) 2013-05-20 2017-06-13 The Nielsen Company (Us), Llc Detecting media watermarks in magnetic field data
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
EP2830064A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Decodierung und Codierung eines Audiosignals unter Verwendung adaptiver Spektralabschnittsauswahl
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
JP5761318B2 (ja) * 2013-11-29 2015-08-12 ヤマハ株式会社 識別情報重畳装置
US8768710B1 (en) 2013-12-05 2014-07-01 The Telos Alliance Enhancing a watermark signal extracted from an output signal of a watermarking encoder
US9824694B2 (en) 2013-12-05 2017-11-21 Tls Corp. Data carriage in encoded and pre-encoded audio bitstreams
US8768714B1 (en) 2013-12-05 2014-07-01 The Telos Alliance Monitoring detectability of a watermark message
US8768005B1 (en) * 2013-12-05 2014-07-01 The Telos Alliance Extracting a watermark signal from an output signal of a watermarking encoder
US8918326B1 (en) 2013-12-05 2014-12-23 The Telos Alliance Feedback and simulation regarding detectability of a watermark message
EP2930717A1 (de) * 2014-04-07 2015-10-14 Thomson Licensing Verfahren und Vorrichtung zur Bestimmung auf einer zweiten Bildschirmvorrichtung, ob die Darstellung von mit Wasserzeichen versehenem, über einen akustischen Pfad empfangenem Audioinhalt aus einer ersten Bildschirmvorrichtung gestoppt wurde
US9691408B2 (en) * 2014-12-16 2017-06-27 Psyx Research, Inc. System and method for dynamic equalization of audio data
US9130685B1 (en) 2015-04-14 2015-09-08 Tls Corp. Optimizing parameters in deployed systems operating in delayed feedback real world environments
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
KR102201604B1 (ko) * 2016-08-04 2021-01-12 후아웨이 테크놀러지 컴퍼니 리미티드 예측 파라미터들에서의 데이터 숨김을 위한 방법 및 장치
KR102389040B1 (ko) * 2018-02-23 2022-04-22 에빅사 가부시키가이샤 콘텐츠 재생 프로그램, 콘텐츠 재생 방법 및 콘텐츠 재생 시스템
US11763832B2 (en) * 2019-05-01 2023-09-19 Synaptics Incorporated Audio enhancement through supervised latent variable representation of target speech and noise
US11978461B1 (en) * 2021-08-26 2024-05-07 Alex Radzishevsky Transient audio watermarks resistant to reverberation effects
WO2023212753A1 (en) * 2022-05-02 2023-11-09 Mediatest Research Gmbh A method for embedding or decoding audio payload in audio content
CN115546652B (zh) * 2022-11-29 2023-04-07 城云科技(中国)有限公司 一种多时态目标检测模型及其构建方法、装置及应用

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4636088A (en) 1984-05-21 1987-01-13 Therma-Wave, Inc. Method and apparatus for evaluating surface conditions of a sample
EP0200301A1 (de) 1985-03-01 1986-11-05 Therma-Wave Inc. Verfahren und Vorrichtung zum Auswerten von Eigenschaften der Oberfläche und des Inneren eines Halbleiters
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
FR2660131B1 (fr) * 1990-03-23 1992-06-19 France Etat Dispositif de transmissions de donnees numeriques a au moins deux niveaux de protection, et dispositif de reception correspondant.
US5121204A (en) * 1990-10-29 1992-06-09 General Electric Company Apparatus for scrambling side panel information of a wide aspect ratio image signal
US5254843A (en) * 1991-08-07 1993-10-19 Hynes John E Securing magnetically encoded data using timing variations in encoded data
US5539812A (en) * 1992-07-29 1996-07-23 Kitchin; Dwight W. Method and apparatus for detecting an attempted three-way conference call on a remote telephone
DE4241068C2 (de) * 1992-12-05 2003-11-13 Thomson Brandt Gmbh Verfahren zum Übertragen, Speichern oder Decodieren eines digitalen Zusatzsignals in einem digitalen Tonsignal
US5748783A (en) * 1995-05-08 1998-05-05 Digimarc Corporation Method and apparatus for robust information coding
US6122403A (en) * 1995-07-27 2000-09-19 Digimarc Corporation Computer system linked by using information in data objects
US5748763A (en) * 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US5404377A (en) * 1994-04-08 1995-04-04 Moses; Donald W. Simultaneous transmission of data and audio signals by means of perceptual coding
US5774452A (en) * 1995-03-14 1998-06-30 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in audio signals
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US5680462A (en) * 1995-08-07 1997-10-21 Sandia Corporation Information encoder/decoder using chaotic systems
EP0766468B1 (de) * 1995-09-28 2006-05-03 Nec Corporation Verfahren und Vorrichtung zum Einfügen eines Spreizspektrumwasserzeichens in Multimediadaten
DE69622837T2 (de) 1995-10-04 2003-04-10 Koninkl Philips Electronics Nv Markierung eines digital kodierten video und/oder audio signals
KR100462915B1 (ko) * 1995-12-11 2005-08-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오및/또는오디오신호의마킹방법및장치,마킹된비디오신호검출방법및장치,비디오또는오디오신호및저장매체
US5956430A (en) * 1996-02-19 1999-09-21 Fuji Xerox Co., Ltd. Image information coding apparatus and method using code amount of a selected pixel block for changing coding parameter
US6035177A (en) 1996-02-26 2000-03-07 Donald W. Moses Simultaneous transmission of ancillary and audio signals by means of perceptual coding
EP0875107B1 (de) 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US5828416A (en) * 1996-03-29 1998-10-27 Matsushita Electric Corporation Of America System and method for interfacing a transport decoder to a elementary stream video decorder
US5812976A (en) * 1996-03-29 1998-09-22 Matsushita Electric Corporation Of America System and method for interfacing a transport decoder to a bitrate-constrained audio recorder
US6229924B1 (en) * 1996-05-16 2001-05-08 Digimarc Corporation Method and apparatus for watermarking video images
US5889868A (en) * 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US6078664A (en) 1996-12-20 2000-06-20 Moskowitz; Scott A. Z-transform implementation of digital watermarks
JP3982836B2 (ja) 1996-07-16 2007-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 情報信号に埋め込まれた透かし情報の検出方法
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US6031914A (en) * 1996-08-30 2000-02-29 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible images
US6069914A (en) 1996-09-19 2000-05-30 Nec Research Institute, Inc. Watermarking of image data using MPEG/JPEG coefficients
US5809139A (en) * 1996-09-13 1998-09-15 Vivo Software, Inc. Watermarking method and apparatus for compressed digital video
US5825892A (en) * 1996-10-28 1998-10-20 International Business Machines Corporation Protecting images with an image watermark
US5915027A (en) * 1996-11-05 1999-06-22 Nec Research Institute Digital watermarking
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
JP2000513167A (ja) 1997-01-13 2000-10-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ディジタルビデオ信号内に補足データを埋め込む方法及び装置
JP3412117B2 (ja) 1997-04-25 2003-06-03 日本電信電話株式会社 量子化の符号化パラメータを用いる電子すかし作成方法およびその読出し方法
US5940135A (en) * 1997-05-19 1999-08-17 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in analog signals
US5960081A (en) 1997-06-05 1999-09-28 Cray Research, Inc. Embedding a digital signature in a video sequence
JP3662398B2 (ja) * 1997-09-17 2005-06-22 パイオニア株式会社 電子透かし重畳装置及び電子透かし検出装置
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6037984A (en) * 1997-12-24 2000-03-14 Sarnoff Corporation Method and apparatus for embedding a watermark into a digital image or image sequence
US6064748A (en) * 1998-01-16 2000-05-16 Hewlett-Packard Company Method and apparatus for embedding and retrieving additional data in an encoded data stream
US6145081A (en) * 1998-02-02 2000-11-07 Verance Corporation Method and apparatus for preventing removal of embedded information in cover signals
US6064764A (en) 1998-03-30 2000-05-16 Seiko Epson Corporation Fragile watermarks for detecting tampering in images
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
JP3354880B2 (ja) * 1998-09-04 2002-12-09 日本電信電話株式会社 情報多重化方法、情報抽出方法および装置
US6219634B1 (en) 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6128736A (en) 1998-12-18 2000-10-03 Signafy, Inc. Method for inserting a watermark signal into data

Also Published As

Publication number Publication date
JP2004506947A (ja) 2004-03-04
WO2002015587A3 (en) 2003-03-13
US20040024588A1 (en) 2004-02-05
US7395211B2 (en) 2008-07-01
CA2418722A1 (en) 2002-02-21
ATE308858T1 (de) 2005-11-15
BRPI0113271B1 (pt) 2016-01-26
WO2002015587A2 (en) 2002-02-21
AU8491001A (en) 2002-02-25
KR20030064381A (ko) 2003-07-31
AU2001284910B2 (en) 2007-03-22
HK1080243A1 (en) 2006-04-21
EP1310099A2 (de) 2003-05-14
CA2418722C (en) 2012-02-07
HK1080243B (zh) 2009-05-15
KR100898879B1 (ko) 2009-05-25
BR0113271A (pt) 2003-09-23
CN100431355C (zh) 2008-11-05
CN1672418A (zh) 2005-09-21
DE60114638D1 (de) 2005-12-08
EP1310099B1 (de) 2005-11-02

Similar Documents

Publication Publication Date Title
DE60114638T2 (de) Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information
DE60213394T2 (de) Audiokodierung mit partieller enkryption
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE602004010885T2 (de) Audio-transkodierung
DE60031906T2 (de) Verfahren zum Einfügen eines Wasserzeichens und dazugehöriges Dekodierverfahren
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69434237T2 (de) Video mit versteckten in-Band digitalen Daten
DE69632340T2 (de) Transport von versteckten daten nach komprimierung
DE60107308T2 (de) Verfahren zur Erzeugung eines Wasserzeichens für Audiosignale
DE60015030T2 (de) Auf Block Umschaltung basierender Teilband-Audiokodierer
EP1741215B1 (de) Wasserzeicheneinbettung
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69938135T2 (de) Gerät und verfahren zum einbetten und extrahieren von informationen in analogsignalen mit hilfe von replikationsmodulation
DE60204039T2 (de) Vorrichtung zur kodierung und dekodierung von audiosignalen
DE69835521T2 (de) Vorrichtung und verfahren für die einbettung und wiedergewinnung von informationen in analogen signalen mit verwendung der verteilten signalmerkmale
AU2001284910A1 (en) Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
EP1212857B1 (de) Verfahren und vorrichtung zum einbringen von informationen in einen datenstrom sowie verfahren und vorrichtung zum codieren eines audiosignals
US7035700B2 (en) Method and apparatus for embedding data in audio signals
KR20050066722A (ko) 디지털 오디오 워터마크 삽입/검출 장치 및 방법
WO2007118533A1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
Hu et al. Effective blind speech watermarking via adaptive mean modulation and package synchronization in DWT domain
DE102007007627A1 (de) Steganographie in digitalen Signal-Codierern
DE60320546T2 (de) Kennzeichnung von zeitbereichen mit wasserzeichen bei multimediasignalen
EP1604527B1 (de) Vorrichtung und verfahren zum einbetten einer binären nutzinformation in ein trägersignal
DE60210668T2 (de) Quantisierungs-index-moduliertes (qim) einbetten eines digitalen wasserzeichens in ein multimedia-signal

Legal Events

Date Code Title Description
8364 No opposition during term of opposition