DE602004000884T2 - Digitales Audiowasserzeichen - Google Patents

Digitales Audiowasserzeichen Download PDF

Info

Publication number
DE602004000884T2
DE602004000884T2 DE602004000884T DE602004000884T DE602004000884T2 DE 602004000884 T2 DE602004000884 T2 DE 602004000884T2 DE 602004000884 T DE602004000884 T DE 602004000884T DE 602004000884 T DE602004000884 T DE 602004000884T DE 602004000884 T2 DE602004000884 T2 DE 602004000884T2
Authority
DE
Germany
Prior art keywords
data
components
digital audio
data components
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602004000884T
Other languages
English (en)
Other versions
DE602004000884D1 (de
Inventor
William Edmund Chipping Norton Kentish
Peter Damien St. Kilda Thorpe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Europe BV United Kingdom Branch
Original Assignee
Sony United Kingdom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony United Kingdom Ltd filed Critical Sony United Kingdom Ltd
Publication of DE602004000884D1 publication Critical patent/DE602004000884D1/de
Application granted granted Critical
Publication of DE602004000884T2 publication Critical patent/DE602004000884T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf eine digitale Audio-Verarbeitung.
  • Akustische Wasserzeichenbildungs-Verfahren werden benutzt, um ein Audiosignal durch Kombinieren desselben mit einem anderen (Wasserzeichen-)Signal zu Übertragungs- oder Speicherzwecken in einer Weise zu schützen, dass das ursprüngliche Signal hinreichend sicher zu identifizieren und/oder zu bewerten ist, es aber nicht in seiner mit Wasserzeichen versehenen Form kommerziell verwendbar ist. Um ihn lohnend zu machen, sollte der Wasserzeichenbildungs-Prozess sicher gegen unerlaubte Versuche sein, das Wasserzeichen zu entfernen.
  • Das Wasserzeichen-Signal kann derart ausgewählt sein, dass es zweckdienliche Information (wie Copyright-, Werbungs- oder andere Identifizierung-Daten) trägt. Es ist eine wünschenswerte Eigenschaft von Wasserzeichenbildungs-Systemen, dass das ursprüngliche Signal völlig aus dem mit Wasserzeichen versehenen Signal ohne Bezugnahme auf das ursprüngliche Quellmaterial wiederhergestellt werden kann, sofern das Vorsehen einer geeigneten Software und eines Enschlüsselungs-Schlüssels gegeben ist.
  • Die Druckschrift EP-A-1 189 372 (Matsushita) offenbart zahlreiche Techniken zum Schützen von Audiosignalen vor Missbrauch. Bei einer Technik wird das Audiosignal vor Verteilung an einen Benutzer komprimiert und verschlüsselt.
  • Der Benutzer benötigt einen Entschlüsselungs-Schlüssel, um auf das Audiosignal zugreifen zu können. Der Schlüssel kann von dem Benutzer erworben werden, um auf das Audio-signal Zugriff zu bekommen. Das Audiosignal kann nicht durch einen Benutzer abgetastet werden, bis er den Schlüssel erworben hat. Andere Techniken betten ein akustisches Wasserzeichen in ein Audiosignal ein, um es zu schützen. Bei einer Technik wird ein Audiosignal mit einem akustischen Wasserzeichen-Signal gemäß einer vorbestimmten Regel kombiniert. Das Wasserzeichen verschlechtert das Audiosignal. Die Kombination wird zur Übertragung an ein Abspielgerät komprimiert. Das Abspielgerät kann das verschlechterte Audiosignal dekomprimieren und wiedergeben, was es einem Benutzer gestattet, zu bestimmen, ob er wünscht, einen "Schlüssel" zu kaufen, der es ihm gestattet, das Wasserzeichen zu entfernen. Das Wasserzeichen wird durch Zufügen eines gleichen und entgegengesetzten akustischen Signals zu dem dekomprimierten, verschlechterten Audiosignal entfernt. Das Wasserzeichen kann irgendein Signal sein, welches das Audiosignal verschlechtert. Das Wasserzeichen kann Rauschen sein. Das Wasserzeichen kann eine Ansage sein, wie "Diese Musik ist zur Abtastwiedergabe bestimmt".
  • Mit einem frequenzkodierten (auch als "spektralkodiert" bezeichnet) Audiosignal, beispielsweise einem datenkomprimierten Signal, wie einem MP3- ("MPEG-1 Layer III"-)Signal, einem ATRACTM-Signal, einem PhillipsTMDCCTM-Signal oder einem DolbyTMAC-3TM-Signal, wird die Audio-Information als eine Reihe von Frequenzbändern dargestellt. Es werden sog. psychoakustische Techniken benutzt, um die Anzahl solcher Bänder, die kodiert werden müssen, um das Audiosignal darzustellen, zu verringern.
  • Die akustischen Wasserzeichenbildungs-Techniken, die zuvor beschrieben wurden, finden keine Anwendung auf frequenzkodierte Audiosignale. Um ein akustisches Wasserzeichen anzuwenden – oder es nachfolgend zu entfernen -, ist es notwendig, das frequenzkodierte Audiosignal wieder zu einer wiedergebbaren Form zurück zu dekodieren. Jedoch kann das Audiosignal jedesmal dann, wenn es in einem mit Verlust behafteten System kodiert und dekodiert wird, eine Verschlechterung erleiden.
  • Die vorliegende Erfindung ist in den Ansprüchen definiert.
  • Die Grundlage der gegenwärtigen Technik ist die Erkenntnis, dass wenn spektrale Information in einer frequenzkodierten Audiodatei selektiv entfernt oder verzerrt wird, ein Grad der ursprünglichen Verständlichkeit und/oder ein Zusammenhang der Datei beibehalten wird, wenn die dezimierte Datei nachfolgend dekodiert und abgespielt wird. Das Ausmaß, in dem die Qualität der ursprünglichen Datei bewahrt wird, hängt von der Anzahl von Frequenzbändern der entfernten Bänder im Zusammenhang des gesamten spektralen Inhalts der Datei ab. Wenn eine Anzahl von Frequenzkomponenten (oder "Information") nicht einfach von dem Original entfernt werden, sondern mit Daten für die gleiche Frequenzinformation, die einer willkürlich ausgewählten "Wasserzeichen"-Datei (auch frequenzkodiert) entnommen sind, ersetzt (oder vermischt) werden, wird Einiges der Verständlichkeit beider Dateien in dem dekodierten Ausgangssignal beibehalten.
  • Demgemäß kann eine akustische Wasserzeichenbildung durch Ersetzen (oder Kombinieren) einiger oder aller der spektralen Bänder einer Datei mit äquivalenten Bändern aus einem ähnlich kodierten Wasserzeichen-Signal erreicht werden. Dieses Verfahren kann ohne Zurück-Dekodieren jedes Signals zu Zeitbereichs- (Audioabtastungs-)Daten durchgeführt werden. Der ursprüngliche Zustand jedes modifizierten spektralen Bandes wird vorzugsweise verschlüsselt und kann in untergeordneten Datenabschnitten von frequenzkodierten Dateien (oder anderswo) für eine nachfolgende Wiedergewinnung gespeichert werden.
  • Im folgenden werden nur beispielhaft Ausführungsbeispiele der Erfindung unter Bezugnahme auf die vorliegenden Figuren beschrieben.
  • 1 zeigt eine schematische Darstellung eines Audio-Datenverarbeitungssystems.
  • 2 zeigt eine schematische Darstellung, die ein kommerzielle Benutzung von gegenwärtigen Ausführungsbeispielen veranschaulicht.
  • 3 veranschaulicht schematisch einen MP3-Rahmen.
  • 4a zeigt ein schematisches Flussdiagramm, das Schritte beim Anwenden eines Wasserzeichens auf eine Quelldatei veranschaulicht.
  • 4b zeigt ein schematisches Flussdiagramm, das Schritte beim Entfernen eines Wasserzeichens aus einer mit Wasserzeichen versehenen Datei veranschaulicht.
  • 5a bis 5c veranschaulichen schematisch die Anwendung eines Wasserzeichens auf eine Quelldatei.
  • 6a u. 6b veranschaulichen schematisch eine Bitratenänderung.
  • 7a bis 7c veranschaulichen schematisch die Ersetzung von Quelldatei-Frequenzinformation.
  • 8a bis 8c veranschaulichen schematisch die Ersetzung von Quelldatei-Frequenzinformation durch Wasserzeichen-Frequenzinformation mit höchster Priorität.
  • 9a bis 9c veranschaulichen schematisch die Erfassung eines Unterschieds zwischen Quelldatei- und Wasserzeichendatei-Frequenzinformation.
  • 10a u. 10b veranschaulichen schematisch ein Gerät zum Empfangen und Benutzen von mit Wasserzeichen versehenen Daten.
  • 11a u. 11b veranschaulichen schematisch das Austauschen von Quelldatei-Frequenzinformation.
  • Obwohl die Ausführungsbeispiele im folgenden im Zusammenhang mit einem MP3-System beschrieben werden, versteht es sich selbstverständlich, dass die Techniken (und die Erfindung) nicht auf MP3 beschränkt sind, sondern auf andere Arten von spektralkodierten (frequenzkodierten) Audiodateien oder fließende Daten, wie (obwohl nicht exklusiv) Dateien oder fließende Daten in dem ATRACTM-Format, dem PhillipsTMDCCTM-Format oder dem DolbyTMAC-3TM-Format anwendbar sind.
  • 1 zeigt eine schematische Darstellung eines Audio-Datenverarbeitungssystems, das auf einem Software-gesteuerten Allzweck-PC basiert, der eine Systemeinheit 10, eine Anzeigeeinrichtung 20 und eine Benutzereingabe-Einrichtung (verschiedene -Einrichtungen) 30, wie eine Tastatur, eine Maus usw. hat.
  • Die Systemeinheit 10 umfasst solche Komponenten, wie eine zentrale Verarbeitungseinheit (CPU) 40, einen Speicher mit wahlfreiem Zugriff (RAM) 50, ein Plattenlaufwerk 60 (für fest eingebaute und auswechselbare Platten, wie eine auswechselbare optische Platte 70) und eine Netzwerk-Schnittstellenkarte (NIC) 80, die eine Verbindung zu einer Netzwerk-Verbindung 90, wie eine Internet-Verbindung, herstellt. Das System kann mit einer Software von einem Speichermedium, wie die fest eingebaute Platte oder die auswechselbare Platte, oder über ein Übertragungsmedium, wie die Netzwerk-Verbindung, zugeführt wird, arbeiten, um einige oder alle der Datenverarbeitungs-Operationen, die nachfolgend beschrieben werden, auszuführen.
  • 2 zeigt eine schematische Darstellung, die eine kommerzielle Benutzung der Ausführungsbeispiele veranschaulicht, die im folgenden zu beschreiben sein werden. 2 zeigt zwei Datenverarbeitungs-Systeme 100, 110, die durch eine Internet-Verbindung 120 verbunden sind. Eines der Datenverarbeitungs-Systeme 100 ist als der "Eigentümer" einer MP3-komprimierten Audiodatei bezeichnet, und das andere 110 ist als ein potentieller Abnehmer der Datei bezeichnet.
  • In einem ersten Schritt 1 wünscht der Abnehmer ein Herunterladen oder eine Übertragung der Audiodatei. In einem zweiten Schritt 2 überträgt der Eigentümer die Datei in einer mit Wasserzeichen versehenen Form zu dem Abnehmer. Der Abnehmer hört (in einen Schritt 3) die mit Wasserzeichen versehene Datei ab. Die mit Wasserzeichen versehene Version überzeugt den Abnehmer davon, die Datei zu kaufen, so dass der Abnehmer in einem Schritt 4 einen Schlüssel von dem Eigentümer erbittet. Diese Bitte kann eine finanzielle Überweisung (wie eine Kreditkarten-Bezahlung) zugunsten des Eigentümers einschließen.
  • In einem Schritt 5 stellt der Eigentümer einen Schlüssel bereit, damit sog. Wiedergewinnungsdaten innerhalb der Audiodatei entschlüsselt werden können. Die Wiedergewinnungsdaten gestatten die Entfernung des Wasserzeichens und die Wiederherstellung der Datei in ihrer vollen Qualität (selbstverständlich kann bei einer komprimierten Datei, die aus einer ursprünglichen Version wiederhergestellt ist, deren "volle Qualität" eine geringfügige Verschlechterung erfahren haben, wenn auch zutrifft, dass die Verschlechterung nicht für jedermann oder von einem nichtprofessionellen Benutzer akustisch wahrnehmbar sein kann). Der Abnehmer entschlüsselt die Wiedergewinnungsdaten in einem Schritt 6, und in einem Schritt 7 hört er die nicht mit Wasserzeichen versehene Datei ab.
  • Es ist nicht notwendig, dass alle der zuvor genannten Schritte über das Netzwerk ausgeführt werden. Beispielsweise könnte der Abnehmer das mit Wasserzeichen versehene Material (Schitt 2) über z. B. eine freie CD gewinnen, die an der Vorderseite eines Magazins angebracht ist. Dies vermeidet die Notwendigkeit der zuvor genannten Schritte 1 und 2.
  • Datenkompression unter Benutzung des Frequenzkodierens
  • Eine Reihe von Kodiertechniken zur Audio-Datenkompression schließen ein Aufteilen eines Audiosignals in verschiedene Frequenzbänder (beispielsweise unter Benutzung von Mehrphasenfiltern), ein Transformieren der verschiedenen Bänder in Frequenzbereichsdaten (unter Benutzung von Fouriertransformationsähnlichen Verfahren) und dann ein Analysieren der Daten in dem Frequenzbereich ein, wobei der Prozess psycho-akustische Phänomene (wie Nachbarbandmaskierungs- und Rauschmaskierungs-Effekte) benutzen kann, um Signalkomponenten ohne eine große subjektive Verschlechterung des wiederhergestellten Audiosignals zu entfernen oder zu quantisieren.
  • Die Kompression wird durch eine bandspezifische Requantisierung der spektralen Daten auf der Grundlage der Ergebnisse der Analyse erreicht. Die Endstufe des Prozesses besteht darin, die spektralen Daten und damit verbundene Daten in einer Form zu packen, die durch einen Dekodierer entpackt werden kann. Der Requantisierungs-Prozess ist nicht umkehrbar, so dass das ursprüngliche Audiosignal nicht exakt aus dem komprimierten Format wiedergewonnen werden kann, und die Kompression wird als "mit Verlust behaftet" bezeichnet. Dekodierer für einen gegebenen Standard ent-packen die spektralen Daten aus dem kodierten Bitstrom und resynthetisieren effektiv (eine Version) der ursprünglichen Daten durch Zurückumwandeln der Spektralinformation in Zeitbereichs-Abtastproben.
  • Der zuvor genannten allgemeinen Prozedur folgt der "MPEG I & II Audio Coding Standard (Layer 3)", oftnmals als "MP3"-Standard bezeichnet. MP3-komprimierte Dateien sind aus ei ner Anzahl unabhängiger Rahmen aufgebaut, wobei jeder Rahmen aus 4 Abschnitten besteht: "Nachrichtenvorsatz", "Seiteninformation", "Hauptdaten" und "Untergeordnete Daten". Eine vollständige Definition des MP3-Formats ist in "ISO Standard 11172-3 MPEG-1 layer III gegeben.
  • Der obere Abschnitt von 3 veranschaulicht schematisch den zuvor beschriebenen Aufbau mit einem MP3-Rahmen 150, der einen Nachrichtenvorsatz (H), eine SeiteniInformation (S) (im folgenden "side_info" genannt), Hauptdaten (M) (im folgenden "main_data" genannt) und untergeordnete Daten (A) (im folgenden "ancillary_data" genannt) umfasst.
  • Der Rahmen "Nachrichtenvorsatz" enthält allgemeine Information bezüglich anderer Daten in dem Rahmen, wie die Bitrate, die Abtastrate der ursprünglichen Daten, den Kodierungsgrad, die Stereodaten-Organisation usw.. Obwohl alle Rahmen effektiv unabhängig sind, gibt es praktische Begrenzungen, die auf das Ausmaß gesetzt sind, auf das sich diese allgemeinen Daten von Rahmen zu Rahmen ändern können. Die gesamte Länge jedes Rahmens kann stets aus der Information hergeleitet werden, die in dem Rahmen "Nachrichtenvorsatz" gegeben ist. Der Abschnitt "side_Info" beschreibt die Organisation der Daten in dem folgenden Abschnitt "main_data" und stellt Band-Maßstabsfaktoren, Nachschlagtabellen-Indikatoren usw. zur Verfügung.
  • Der Abschnitt main_data" 160 ist schematisch in dem zweiten Teil von 3 gezeigt und umfasst big value-Bereiche (B) und einen Count_1-Bereich (C). Der Abschnitt "main_data" gibt die tatsächliche Audio-Spektralinformation an, die in eine einer Anzahl von mehreren möglichen verschiedenen Gruppierungen organisiert ist, die aus dem Nachrichtenvorsatz und Abschnitten "side-info" bestimmt ist. Grob gesprochen werden die Daten jedoch als die quantisierten Frequenzbandwerte in aufsteigender Frequenzordnung dargestellt. Einige von ihnen werden einfache 1-Bit-Felder (in einem Unterabschnitt "count_1-Daten") sein, die das Nichtvorhandensein von Daten in einzelnen Frequenzbändern und das Zeichen der Daten angeben, wenn sie vorliegen. Einige von ihnen werden unbedingt (in einem Unterabschnitt "zero_data") Null sein, da es keine Kodierungsinformation gibt, die für sie vorgesehen ist. Es gibt drei Unterteilungen des Abschnitts "main_data", die als Bereiche "bigvalue" bekannt sind. In diesen Bereichen werden Spektralwerte durch den Kodierer als Nachschlagewerte für Huffman-Tabellen gespeichert. Das Huffman-Kodieren dient nur zur weiteren Verringerung der Bitrate durch Darstellen häufiger benutzter Spektralwerte durch kürzere Kodes.
  • Der tatsächliche Spektralwert für irgendeine gegebene Frequenzreihe in den Bereichen "big value" wird durch drei verschieden Daten bestimmt:
    • • Den Huffman-Kode, der für diese Spektralreihe benutzt wird [in "main_data" herausgefunden]
    • • welche Huffman-Tabelle aus einem vorbestimmten Satz von Huffman-Tabellen benutzt wird [in "side_info" herausgefunden]
    • • welcher Skalenfaktor für diese Frequenzreihe benutzt wird [in "side_info" und "main_data" herausgefunden], (ein Skalenkoeffizient für jede Reihe wirksam)
  • Alle drei Daten können sich von Rahmen zu Rahmen ändern.
  • Der Bereich "ancillary_data" ist genau der unbenutzte Platz, der dem Bereich "main_data" folgt. Da es keine Standardisierung zwischen Kodierern bezüglich der Frage gibt, wieviele Daten in dem Audio-Rahmen gehalten werden, kann die Größe der Audio-Daten und folglich die Größe von "ancillary_data" beträchtlich von Rahmen zu Rahmen variieren. Die Größe des Abschnitts "ancillary_data" kann durch mehr oder weniger wirksames Packen der vorhergehende Abschnitte, durch mehr oder weniger strenge Quantisierung der Spektraldaten oder durch Erhöhen oder Verringern der Soll-Bitrate für die Datei variiert sein.
  • Wasserzeichenbildungs-Technik
  • Im folgenden wird ein Ausführungsbeispiel der vorliegenden Technik unter Bezugnahme auf die Wasserzeichenbildung in einer MP3-komprimierten Audiodatei beschrieben. Es ist jedoch ersichtlich, dass die Technik auf andere spektralkodierende Systeme mit geeigneten (Routinen-)Änderungen des Datenformats und der Organisation angewendet werden kann. Außerdem sei angenommen, obwohl die Technik durch nichts auf diese Situation beschränkt ist, dass die MP3-Datei – bei Nichtvorhandensein eines Wasserzeichens – von ausreichender Qualität ist (d. h. eine hinreichend geringe Verschlechterung erfahren hat, die sich aus dem Kompressions-Prozess ergeben hat), dass ein Benutzer an keiner Entfernung des Wasserzeichens interessiert wäre, um die Datei zu benutzen.
  • Zur Erleichterung der Beschreibung sei außerdem bei diesem Beispiel angenommen, dass die anfänglichen Formate der Wasserzeichen- und Quelldatei ähnlich sind (gleiche Abtastrate, MPEG-Version und -Lage, Stereo-Kodierung und Kurz/Langblock-Verwendung). Dies ist wiederum nicht eine Bedingung für die Prozedur.
  • Bei der gegenwärtigen Technik wird eine akustische Wasserzeichenbildung durch Ersetzen (oder Kombinieren) einiger oder aller der Spektralbänder einer Datei mit äquivalenten Bändern von einem ähnlich kodierten Wasserzeichen-Signal erreicht. Dieser Kunstgriff kann mit dem MP3-Kodier-Niveau (oder mit dem Nach-Huffman-Nachschlage-Niveau) durch Manipulation des kodierten Bitstroms, d. h. ohne Zurückdekodieren jedes Signals zu Zeitbereichs- (Audio-Abtast-)Daten angewendet werden. Der ursprüngliche Zustand jedes modifizierten Spektralbandes wird in den Abschnitten "ancilla ry_data" von MP3-Dateien zur nachfolgenden Wiedergewinnung verschlüsselt und gespeichert. Platz dafür kann Verlängern des Abschnitts "ancillary_data" oder unter Benutzung eine vorhandenen Platzes geschaffen werden. Es gibt daher keine Bedingung, die Audio-Daten völlig zu dekodieren und dann wiederzukodieren, und auf diese Weise kann eine weitere Verschlechterung des Audiosignals (durch einen Dekodier- und Wiedekodier-Prozess) vermieden werden.
  • In dieser Beschreibung wird die folgende Terminologie benutzt:
    • • Quelldatei = MP3-Datei, die Audio-Material enthält, auf das ein Wasserzeichen anzuwenden ist,
    • • Wasserzeichen-Datei = MP3-Datei, die ein akustisches Wasserzeichen-Signal enthält.
  • Es wird eine Taktik festgelegt, nach der Frequenzreihen zu ersetzeb sind. Es kann einfach sein, einen festgelegten Satz von Reihen zu benutzen oder die Reihen gemäß dem Inhalt der Quelldatei und Wasserzeichen-Dateien zu variieren. In einem ersten Beispiel wird ein einfach festgelegter Satz von Reihen mit alternativen Taktikverfahren ausgewählt, die im folgenden beschrieben werden.
  • Zu dieser Zeit kann abhängig davon, welche Taktik ausgewählt ist, die Größe des Platzes für "ancillary_data" bestimmt werden, die erforderlich ist, die Wiedergewinnungsdaten zu speichern. Wie zuvor erwähnt kann dieser einfach durch Erhöhen der Ausgangsbitrate der mit Wasserzeichen versehenen Daten verfügbar gemacht werden. In den meisten Situationen ist ein einfaches Erhöhen der Bitrate auf den nächsten höheren, zulässigen Wert (und Ausnutzen der Tatsache, dass die Menge von Wiedergewinnungsdaten, die bewahrt werden können, zu begrenzen ist) eine adequate Maßnahme. Für variable Bitraten-Kodierungsschemata ist es möglich, die Änderung der Bitrate feiner einzustellen.
  • MP3-Kodierer versuchen im allgemeinen, den freien Platz in jedem Rahmen zu minimieren, und ein guter oder idealer Kodierer wird keinen Platz in dem Bereich "ancillary_data" haben. Um festzustellen, ob es irgendeinen zweckdienlichen Platz gibt, der für Rahmen verfügbar ist, ist eine Analyse des Rahmen-Nachrichtenvorsatzes (der Rahmen-Nachrichtenvorsätze) erforderlich.
  • Der Wert des Datenplatzes, der in einem Rahmen benötigt sein kann, um die verschlüsselten Wiedergewinnungsdaten zuzulassen, ist flexibel, aber im allgemeinem werden im Minimum wenige Bytes pro Rahmen benötigt, um die Wiedergewinnungs-Nachrichtenvorsatz-Information gewinnen zu können. Die Datenkapazität, die benötigt wird, um Wiedergewinnungsdaten für die Spektralreihen gewinnen zu können, die modifiziert worden sind, ist von der Anzahl und der Art der modifizierten Reihen abhängig. In empirischen Versuchen zu den Techniken hat diese Kapazität typischerweise ungefähr 100 Bytes pro Rahmen betragen, wenn Wasserzeichenbildungs-Material mit einer anfänglichen Bitrate von 128 kbit/s vorlag, aber diese Zahl ist der Reihe nach durch eine Bitratenzunahme von 128 kbit/s auf 160 kbit/s bestimmt (d. h. in Reaktion darauf gesetzt) worden, was eine erhöhte Datenrahmengröße von ungefähr 100 Bytes ergibt (s. weiter unten eine Berechnung, die dieses veranschaulicht).
  • Es gibt eine Formel für die Anzahl von Nytes pro Datenrahmen "bpf", gemäß der die gesamte Bitrate "B" eine Variable ist. Die Audio-Abtastrate "SR" ist eine andere Variable. Diese Formel für "MPEG 1 layer 3" lautet: bpf = 144·B/SR
  • Die Bitrate in einer "normalen" (d. h. einer Nicht-VBR"Variablen Bitraten"-)MP3-Datei kann einen von nur wenigen zulässigen Werten haben. Beispielsweise sind diese zulässi gen Werte für "MPEG-1 layer 3": 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 oder 320 kbit/s).
  • Daher würde für eine Datei mit einer Audio-Abtastrate 44.1 kHz, wenn die Bitrate von 128 kbit/s auf 160 kbit/s erhöht wird, die zusätzliche Kapazität, die durch diese Maßnahme vorzusehen ist, 44·(160,000 – 128,000)/44100 = ungefähr 104.5 Bytes pro Rahmen sein.
  • Ein Bewegen hin zu einer höheren Bitrate wird als sehr zweckdienlich betrachtet, da es ohne ausführliche Analyse schwierig ist, zu garantieren, dass "ancillary_data" "main_ data" in irgendeinem gegebenen Audio-Rahmen hinzugefügt werden kann, während die Bitrate auf dem gleichen Wert gehalten wird. Dies ist der Fall, weil sich bei einem sog. "Bit-Reservoir" ein Audio-Rahmen nach Gutdünken des Kodierers über drei Datenrahmen erstrecken kann. Wenn der Audio-Rahmen (durch Hinzufügen eines untergeordneten Bereichs, durch Ändern der Werte von "main_data" oder auf irgendeine andere Weise) vergrößert wird, kann er mehrfache Anklopfeffekte haben, die es für spätere Rahmen unmöglich machen, in ihren verfügbaren Platz zu passen. Der grundlegende Prozess ist schematisch in dem Flussdiagramm gemäß 4a veranschaulicht.
  • In einem Schritt 200 wird das Wasserzeichen in einen Speicher eingelesen und (Rahmen für Rahmen oder in seiner Gesamtheit) zerlegt. Die Spektralinformation aus dem Wasserzeichen, die für die Wasserzeichenbildungstaktik erforderlich ist, wird gespeichert. In dieser Stufe ist es günstig, auf die relevante Huffman-Tabelle und andere damit verbundene Information (z. B. Skalenfaktor) zurückzuverweisen, so dass der tatsächliche Spektralwert verfügbar ist.
  • In einem Schritt 205 wird (werden) der anfängliche(n) Quellrahmen-Nachrichtenvorsatz (-Nachrichtenvorsätze) (und möglicherweise einige anfängliche Rahmen) ausgelesen, um das Rahmenformat, den Wiedergewinnungsdatenplatz, der ver fügbar ist, usw. festzustellen. Nun startet eine Prozess-Schleife (von einem Schritt 210 bis zu einem Schritt 240), die der Reihe nach auf jeden Quelldateirahmen angewendet wird.
  • In einem Schritt 210 werden der nächste Quelldateirahmen und der nächste Wasserzeichendateirahmen ausgelesen. In einem Schritt 215 werden die Spektralreihen, die zu modifizieren sind, in Übereinstimmung mit der gegenwärigen Taktik bestimmt, und die Spektralinformation für Frequenzreihen des Quelldateirahmens, der für die Taktik relevant ist, wird in einem Wiedergewinnungsbereich (z. B. einem Teil des RAM 50) aufbewahrt.
  • Der gegenwärtige Rahmen des Wasserzeichens wird dann in einem Schritt 220 auf den gegenwärtigen Quelldateirahmen angewendet. In dieser Weise wird, wenn dieser Schritt in der Schleifenanordnung wiederholt wird, ein erster Rahmen der Wasserzeichendatei auf einen ersten Rahmen der Quelldatei angewendet, usw.. Wenn das Wasserzeichen weniger Rahmen als die Quelldatei hat, wird die Sequenz von Wasserzeichenbildungsrahmen wiederholt.
  • Der ursprüngliche Wert für jede Spektralreihe, der durch die Taktik bestimmt ist, wird durch eines von zwei möglichen Verfahren modifiziert:
    • • Mit Bezugnahme auf den entsprechenden Rahmen in der Sequenz von dem Wasserzeichen wird der Wert durch den Wert der Reihe in dem Wasserzeichen ersetzt, möglicherweise mit einem Skalenfaktor k multipliziert oder andernfalls durch diesen modifiziert (der in einem verallgemeinerten Fall sowohl 1 oder 0 sein könnte, als für den auch die Möglichkeit gegeben sein könnte, dass k ein Wert anders als 1 oder 0 ist). Der Skalenfaktor kann variabel sein, in welchem Fall it kann be gespeichert mit the Wiedergewinnungsdaten, oder er könnte ein fester Wert sein, zumindest hinsichtlich einer speziellen Quelldatei, in welchem Fall er entweder ge nau einmal für diese Datei) einbezogen oder gespeichert werden könnte, oder
    • • der Wert wird mit dem relevanten Wert von dem Wasserzeichen kombiniert (beispielsweise ein 50:50 Mittelwertbildungs-Prozess).
  • Beide dieser Verfahren arbeiten hochst erfolgreich, wenn der Spektralwert, der benutzt wird, um den ursprünglichen zu ersetzen, aus der gleichen Huffman-Tabelle wie derjenigen, die für die ursprüngliche Reihe benutzt wird, hergeleitet werden kann. Wenn die Tabelle nicht den exakten Wert enthält, der bei der Ersetzung erforderlich ist, wird dann der Huffman-Kode benutzt, der auf den nächsten Wert zurückgeht. In beiden Fällen können im wesentlichen auch die Skalenfaktoren für jede Reihe in Erwägung gezogen werden, wenn der Ersetzungswert bestimmt wird.
  • In einem Schritt 225 werden die modifizierten Rahmendaten für jedem Rahmen, der modifizierte Nachrichtenvorsatz-Information enthält, gespeichert (beispielsweise in dem Plattenlaufwerk 60), wenn das Wasserzeichen einmal angewendet worden ist. Die Wiedergewinnungsdaten, die auf diesen Rahmen anwendbar sind, werden in einem Schritt 230 verschlüsselt und gespeichert.
  • Der Rahmen-Nachrichtenvorsatz kann in Schritt 225 derart modifiziert werden, dass die Bitrate auf das Ausmaß erhöht wird, dass Vorsorge für den zusätzlichen Platz getroffen wird, der erforderlich ist, um eine Wasserzeichenbildung auf den existierenden Audio-Rahmen anwenden zu können und die Wiedergewinnungsdaten (wie sie in Schritt 215 aufbewahrt sind) dem Bereich des Audio-Rahmens "main data" als "ancillary_data" hinzufügen zu können. Das erste, was einzuschreiben ist, sind organisatorische Daten, wie solche, die Auskunft darüber geben, welche Spektralbänder aufbewahrt sind, und mögliche UMID (SMPTE Universal Material Identifier) oder Metadaten-Information und dann die tat sächlich aufbewahrten Bänder. Ein zusätzliche Erwägung besteht darin, dass die Daten verschlüsselt sein müssen, um eine ungerechtfertigte Wiederherstellung der ursprünglichen Daten zu verhindern. Es wird eine herkömmliche, auf einem Schlüssel basierende Software-Verschlüsselungstechnik benutzt.
  • Der Prozess zum Ändern der Nachrichtenvorsatz-Daten zum Erhöhen der verfügbaren Datenkapazität zum Speicher der Wiedergewinnungsdaten ist schematisch in 6a u. 6b veranschaulicht. In 6a gibt der Nachrichtenvorsatz eine bestimmte Bitrate an, die der Reihe nach die Größe jedes Rahmens bestimmt. Gemäß 6b ist der Nachrichtenvorsatz in einen höheren zulässigen Wert (z. B. den nächst höheren zulässigen Wert) geändert worden. Dies ergibt eine größere Rahmengröße. Wenn sich die Größe des Nachrichtenvorsatzes und der Teile "side_info" u. "main-data" nicht erhöht hat, hat sich die Größe des Bereichs "ancillary_data" um den vollen Betrag der Änderung der Rahmengröße erhöht.
  • In einem Schritt 240 erfolgt eine Erfassung, ob alles der Quelldatei verarbeitet worden ist. Wenn das Ergebnis NEIN lautet, werden die Schritte 210 bis 240 wiederholt, wobei die Wasserzeichendatei soviele Male als notwendig wiederbenutzt wird, bis die gesamte Quelldatei verarbeitet worden ist. Dieser Prozess ist schematisch in 5a bis 5c veranschaulicht, in denen eine Wasserzeichen-Datei 310 kürzer als eine Quelldatei 300 dargestellt ist. Die Wasserzeichen-Datei 310 wird soviele Male wie notwendig wiederholt, un die Anwendung des Wasserzeichens auf die vollständige Quelldatei zu ermöglichen.
  • Wenn jedoch alles der Quelldatei verarbeitet worden ist, endet die Verarbeitung hinsichtlich dieser Datei gemäß dem Flussdiagramm in einem Schritt 250.
  • Die mit Wasserzeichen versehene Datei, welche die modifizierten Spektralreihendaten und die verschlüsselten Wiedergewinnungsdaten enthält, wird beispielsweise in dem Plattenlaufwerk 60 gespeichert und/oder über das Netzwerk 90 übertragen.
  • Bei dem zuvor beschriebenen Verfahren ist einzusehen, dass die Modifizierung auf einer Audio-Rahmengrundlage stattfinden kann. Der MP3-Standard gestattet es Audio-Rahmen, mehrere Datenrahmen zu überspannen.
  • 4b veranschaulicht schematisch Schritte bei der Entfernung eines Wasserzeichens von einer mit Wasserzeichen versehenen Datei.
  • In einem Schritt 255 wird ein Rahmen der mit Wasserzeichen versehenen Datei geladen (beispielsweise in den RAM gemäß 1). In einem Schritt 260 werden die Wiedergewinnungsdaten, die für diesen Rahmen relevant sind, unter Benutzung eines Schlüssels entschlüsselt, wie dies zuvor beschrieben wurde. In einem Schritt 265 werden die Wiedergewinnungsdaten auf diesen mit Wasserzeichen versehenen Dateirahmen angewendet, um den entsprechenden Quelldateirahmen wiederherzustellen, der einen Nachrichtenvorsatz und Audio-Daten enthält. Der Ausdruck "angewendet" bedeutet, dass ein Prozess benutzt wird, der wirksam dem Prozess entgegengesetzt ist, durch den das Wasserzeichen zuerst auf die Quelldatei angewendet wurde. Tatsächlichlich ist der Prozess potentiell dadurch viel einfacher als die Anwendung des Wasserzeichens, dass in der Wiedergewinnungsstufe keine Notwendigkeit besteht, eine Taktik festzulegen, eine Bandauswahl zu treffen usw.. Für jeden Rahmen gilt:
    • a. Entschlüsssele Wiedergewinnungs-Information (die erste gegebene Größe, von der ein Teil ein verschlüsseltes "Längen"-Feld sein kann)
    • b. Analysiere den Taktikteil der Wiedergewinnungsdaten, um zu erkennen, was an seinen richtigen Platz zurückzusetzen ist. Einiges desselben kann für alle Rahmen konstant sein und kann vielleicht nur in dem ersten Rahmen für das sog. "non-streaming washing" (z. B. die Taktik selbst) angegeben sein. Einiges kann sich von Rahmen zu Rahmen ändern, wie die tatsächliche Spektralinformation (was von der Taktik abhängig sein kann). "Streaming"-Wiedergewinnung bedeutet, dass die Wiedergewinnungsdaten vorzugsweise die Taktik für alle Rahmen enthalten.
    • c. Überschreibe oder korrigiere die geänderten Daten in dem Rahmen mit ihrem (ursprünglichen) Wert unter Benutzung der Wiedergewinnungsdaten.
    • d. Schreibe den neuen Rahmen-Nachrichtenvorsatz (erneutes Setzen der ursprünglichen Rahmenrate), "side_Info" und "main_data", aber nicht die Wiedergewinnungsdaten.
  • Der Wasserzeichenbildungs-Prozess, der zuvor beschrieben wurde, kann durch die Tatsache kompliziert sein, dass die Audio-Rahmenbildung nicht notwendigerweise in einem 1:1-Verhältnis mit dem Datenrahmen stehen muss, so dass eine Pufferspeicherung erforderlich sein kann, bevor ein Datenrahmen freigegeben werden kann.
  • Es sei angemerkt, dass (wie bei der Wasserzeichenbildungs-Prozedur) die Wiederherstellung des ursprünglichen Materials ausgeführt werden kann, ohne die Daten hinab zu den Zeitbereichsdaten (Audio-Abtastproben-)Niveau dekodiert zu haben.
  • Wenn in einem Schritt 270 weitere mit Wasserzeichen versehene Rahmen zu behandeln sind, kehrt die Verarbeitung zu Schritt 255 zurück. Andernfalls endet der Prozess in Schritt 275.
  • Varianten
  • Die allgemeine Prozedur, die zuvor beschrieben wurde, kann in mehreren Weisen modifiziert sein. Die folgende Be schreibung gibt eine Anzahl von Varianten an, die benutzt werden können, um die allgemeine Prozedur entweder einzeln oder in Kombination zu modifizieren.
  • 1. Verfahren zum Auswählen von Ersatz-Frequenzreihen
  • In der allgemeinen Prozedur benutzte das beschriebene Verfahren einen einfach festgelegten Satz von zu modifizierenden Frequenzreihen. Dieser Prozess ist schematisch in 7a bis 7c veranschaulicht. 7a veranschaulicht schematisch eine Gruppe von 16 Frequenzreihen von einem Rahmen einer Quelldatei. 7b veranschaulicht schematisch eine entsprechende Gruppe von 16 Reihen von einem entsprechenden Rahmen einer Wasserzeichendatei. Die Wasserzeichendateireihen sind schraffiert dargestellt. In 7c sind die zweite, die vierte, die achte, die zehnte, die vierzehnte und die sechzehnte Reihe (in der Darstellung von oben gezählt) der Quelldateidurch entsprechende Reihen der Wasserzeichendatei gemäß einer vorbestimmten (festgelegten) Ersetz-Taktik ersetzt worden.
  • Alternative Verfahren, die hinsichtlich der Eigenart des benutzten Materials empfindlich sind, können potentiell bessere (z. B. subjektiv verständlichere) Ergebnisse bieten. Im folgenden sind drei Beispiele (1.1 bis 1.3) angegeben:
    Beispiel 1.1: Die zu modifizierenden Spektralreihen werden durch Analyse des Wasserzeichens ausgewählt. Wenn das Wasserzeichen in Schritt 200 zerlegt ist, wird die Spektralinformation untersucht, und es wird eine Wichtungstabelle erstellt, gemäß der Frequenzreihen in jedem Rahmen dominant sind. Wenn alle der Wasserzeichenrahmen ausgelesen worden sind, wird der Satz Spektralreihen, der am häufigsten dominant (über die ganze Wasserzeichendatei gemittelt) ist, zur Wasserzeichenbildung in allen Rahmen benutzt, wobei der verfügbare Platz in dem Quelldateiraimen in Erwägung gezogen wird.
  • Beispiel 1.2: Die zu modifizierenden Quelldateireihen variieren von Rahmen zu Rahmen auf der Grundlage der dominanten Reihen in jedem Wasserzeichenrahmen. Für jeden Wasserzeichenrahmen wird eine Frequenzreihen-Tabelle erzeugt, die nach Größe geordnet ist. Wenn jeder Quelldateirahmen verarbeitet ist, werden die Frequenzreihenm, die modifiziert sind, als solche ausgewählt, welche die am meisten dominanten in dem gegenwärtigen Wasserzeichenrahmen sind. Dieser Prozess ist schematisch in 8a bis 8c veranschaulicht. Wie zuvor ausgeführt veranschaulicht 8a schematisch eine Gruppe von 16 Frequenzreihen eines Rahmens einer Quelldatei, und 8b veranschaulicht schematisch eine entsprechende Gruppe von 16 Reihen von einem entsprechenden Rahmen einer Wasserzeichendatei. Die am meisten signifikanten Reihen (in 8b die längste Reihen) des Wasserzeichenrahmens werden in die Quelldatei eingesetzt, um ein Ergebnis zu erzielen, das schematisch in 8c gezeigt ist. Es sei angemerkt, dass nur vier Reihen eingesetztworden sind. Dies ist deswegen der Fall, weil ein adaptiver Einsetzungsprozess, der unter Beispiel 1.4 zu beschreiben sein wird, das weiter unten beschrieben wird, zu veranschalichen ist.
  • Beispiel 1.3: Die zu modifizierenden Quelldateireihen basieren auf einer Kombination der Spektraldaten in der Wasserzeichen- und Quelldatei. Ein Beispiel ist, eine Gewichtung auf der Grundlage der Differenz zwischen den möglichen Reihen vor deren Versehen mit Wasserzeichen und nach deren Versehen mit Wasserzeichen zu berechnen und die Reihen auszuwählen, welche die höchste Bewertung erhalten (d. h. eine höhere Trennung gibt Anlass zu einer größeren Verschlechterung der Quelldatei durch das Wasserzeichen). Dies verringert die Möglichkeit, dass die Quelldatei-Huffman-Nachschlagetabelle sich nicht an den Wert des Wasserzeichens anpassen könnte. Dieser Prozess ist schematisch in 9a bis 9c veranschaulicht. 9a veranschaulicht schematisch eine Gruppe von 16 Reihen von einem Rahmen einer Quelldatei, und 9b veranschaulicht schematisch eine entsprechende Gruppe von 16 Reihen von einem entsprechenden Rahmen einer Wasserzeichendatei. 9c stellt schematisch den "Unterschied" (die Differenz in der Länge in dieser schematischen Darstellung) zwischen entsprechenden Reihen der zwei Rahmen dar. Abhängig davon, wieviele Reihen bei der gegenwärtigen Taktik angepasst werden können, werden n Reihen eingesetzt, die den größten Unterschied aufweisen.
  • Beispiel 1.4 Pseudo-Zufallsauswahl: Die Identität von Reihen, die zu Wichten sind, könnte alternativ dazu in Übereinstimmung mit einer Pseudo-Zufallsordnung hergeleitet sein, die durch einen Erzeugungswert erzeugt ist. Der Erzeugungswert könnte Teil der Wiedergewinnungsdaten für die ganze Datei sein oder könnte aus dem Enschlüsselungs-Schlussel herleitbar sein.
  • Alle der Techniken, die zuvor beschrieben wurden – die grundlegende Technik und die Varianten in den Beispielen 1.1 bis 1.4 – können auf Schemata angewendet werden, durch die eine Quelldateireihe durch eine Wasserzeichendateireihe ersetzt wird oder eine Quelldateireihe in Abhängigkeit von einer Wasserzeichendateireihe oder sogar einer Kombinationsstrategie geändert wird. Bei dem grundlegenden Schema mit einer festgelegten Taktik ist es nicht notwendig, Einzelheiten mit jedem Rahmen zu speichern, von dem Reihen geändert worden sind. Mit den mehr adaptiven Taktiken ist bei einem unkomplzierten Weg zum Erkennen, welche Reihen geändert worden sind, diese Information mit den Wiedergewinnungsdaten zu speichern. Tatsächlich sind, wenn die Wiedergewinnungsdaten – wenn sie entschlüsselt sind – die Reihen feststellen, für die Wiedergewinnungsinformation vorgesehen ist, dann solche Einzelheiten einbezogen.
  • Beispiel 1.5: Anpassung der Anzahl von Reihen, die geändert sind. Es ist nicht notwendig, dass eine vorbestimmte oder festgelegte Anzahl von Reihen geändert wird. Sogar eine Taktik für eine festgelegte Anzahl von Reihen (die grundlegende Anordnung, die zuvor beschrieben wurde) kann eine sich ändernde Anzahl von Reihen, die in jedem Rahmen zu ändern sind, gestatten, und die Taktiken können eine sich ändernde Anzahl von Reihen in Übereinstimmung mit einer Ordnung zur Bevorzugung (und möglicherweise abhängig von einer maximalen Anzahl von Änderungen gestattet) ändern. In Schritt 210 (4a) kann der Wert von Reserveplatz in dem Abschnitt "ancillary_data" erfasst werden. Eine Anzahl von Reihen wird zur Änderung ausgewählt, so dass die notwendigen Wiedergewinnungsdaten in den verfügbaren Platz in "ancillary_data" passen werden. Wenn der Platz in "ancillary_data" durch Änderung der gesamten Bitrate der Datei zu vergrößern ist, wird diese Vergrößerung in Erwägung gezogen.
  • Bei den zuvor beschriebenen Beispielen 1.2 u. 1.3 sind die zu modifizierenden Frequenzreihen wahrscheinlich von Rahmen zu Rahmen zu ändern. Wenn die Änderungsrate der ausgewählten Bänder zu groß ist, können sich akustische Seiteneffekte ergeben. Diese können durch Unterziehen der Ergebnisse der relevanten Wichtungsprozedur einer Tiefpassfilterung verringert werden – in anderen Worten durch Enschränken des Betrags der Änderung von Rahmen zu Rahmen, das für den Satz von zu modifizierenden Spektralreihen gestattet ist. Unerwünschte Seiteneffekte können auch auftreten, wenn die modifizierten Frequenzreihen eine zu hohe Audiofrequenz repräsentieren. Um dieses potentielle Problem zu mindern, kann die Audiofrequenz, die durch die modifizierten Frequenzreien repräsentiert ist, begrenzt werden.
  • Auf ähnliche Weise ist es, wenn die Wasserzeichen- und Quelldateifrequenzreihen innerhalb kurzer oder langer Blökke liegen, nicht richtig, sie direkt zu ersetzen. Entweder tritt ein weiteres Dekodieren und Wiederkodieren auf, oder der Ersatz könnte der selbe Kode wie in der ursprünglichen Quelldatei sein. In dieser Hinsicht sei angemerkt, dass MP3-Dateien Spektralinformation gemäß zwei verschiedener MDCT- (Modifiziert Discrete Cosine Transform-)Blocklängen zum Transformieren zwischen Zeit- und Frequenzbereichen speichern können. Ein sog. "langer Block" besteht aus 18 Abtastproben, und ein "kurzer Block" besteht aus 6 Abtastproben. Der Zweck des Vorsehens zweier Blockgrößen besteht darin, die Transformation für entweder die Zeitauflösung oder die Frequenzauflösung zu optimieren oder zumindest zu verbessern. Ein kurzer Block hat eine gute Zeitauflösung, aber eine dürftige Frequenzauflösung, und für einen langen Block ist dies umgekehrt. Da die MDCT-Transformation für die zwei Blockgrößen verschieden ist, kann ein Satz von Koeffizienten (d. h. Frequenzreihen) von einer Art von Block nicht direkt in einen Block verschiedener Art eingesetzt werden.
  • Außerdem können unerwünschte Ergebnisse auftreten, wenn sich der Stereo-Kodierungsmodus des Wasserzeichens von dem Stereo-Kodierungsmodus der Quelldatei unterscheidet. In solchen Fällen könnten einige weitere Dekodier- und Wiedekodierverarbeitungen des Wasserzeichens benutzt werden.
  • Bei allen Beispiels 1.1 bis 1.5 kann die Anzahl von Quelldateifrequenzreihen, die in dem Wasserzeichenbildungsprozess modifiziert sind, durch eine festgelegte Anzahl begrenzt sein (taktikbedingt, benutzerbedingt oder festkodiert) oder kann durch den verfügbaren Wiedergewinnungsplatz begrenzt sein oder beides. Welches Verfahren am besten geeignet ist (einschließlich des einfachen Verfahrens für festgelegte Reihen) wird von einer Anzahl von Faktoren abhängen, welche die verfügbare Verarbeitungsleistung, die Eigenart der Quelldatei und des Wasserzeichens und den Grad der Verschlechterung der Quelldatei (durch das Wasserzeichen, das erforderlich ist) enthalten.
  • 2. Änderung von Huffman-Tabellen und Skalenfaktoren
  • Die zuvor gegebenen Beschreibungen beziehen sich nur auf die Modifizierung (und Wiedergewinnungsspeicherung) der Spektralinformation "main_data". Es ist auch möglich, die ursprünglichen Daten nach anderen Gesichtspunkten zu modifizieren, wie nach den benutzen Huffman-Tabellen für die Spektraldaten speziell bestimmter Frequenzreihen. Dies würde gemacht, um sicherzustellen, dass exakte Kodes für die modifizierten Spektraldaten (und nicht angemessne Kodes, die ungefähre Nachschlagewerte angäben) verfügbar wären.
  • Auf ähnliche Weise können die Skalenfaktoren in den Abschnitten "side_info" und "main_data" geändert werden, um die Spektralniveaus der Wasserzeichen-Spektraldaten besser repräsentieren zu können. Dies könnte zweckdienlich sein, um (beispielsweise) einen potentiellen unerwünschten Effekt zu verringern, durch den das Niveau des Wasserzeichens in dem mit Wasserzeichen versehenen Material tendiert, dem Niveau in dem Quelldatei-Material zu folgen.
  • 3. Verfahren zum Bewahren von Wiedergewinnungsdaten
  • Wie zuvor beschrieben ist das bevorzugte Verfahren zum Verbergen von Wiedergewinnungsdaten, den Platz "ancillarydata" in jede Audio-Rahmen zu benutzen. Dies kann durch Benutzen des existierenden Platzes oder durch Erhöhen der Bitrate, um zusätzlichen Platz zu schaffen, erreicht werden. Dieses Verfahren hat den Vorteil, dass sich die gespeicherten Wiedergewinnungsdaten in dem Rahmen befinden, auf den Bezug genommen wird, und jeder Rahmen kann ohne Bezugnahme auf andere Rahmen wiederhergestellt werden. Es sind jedoch andere Mechanismen möglich:
    • • Das MP3-Format gestattet speziellen ID-Rahmen, Teil der Datei zu sein, und zwar gewöhnlich am Beginn oder am Ende der Datei. Dies könnte benutzt werden, Information bezüglich der Wasserzeichenbildungs-Operation zu speichern, die allen Rahmen gemeinsam ist, wie UMID- und Metacaten-Information, Wasserzeichenbildungs-Strategie, festgelegte Wasserzeichen-Masken usw..
    • • Die Wiedergewinnungsdaten können einfach der MP3-Datei in Blöcken von Daten (nicht notwendigerweise in dem MP3-Format) hinzugefügt werden.
  • 4. Benutzung von Frequenzreihen, nicht in den Bereichen großer Werte
  • 4.1 Benutzung des Bereichs "count 1" des Wasserzeichens: Die zuvor beschriebenen Verfahren beziehen sich allgemein auf die Spektraldaten in den Bereichen "big_value" des Abschnitts "main_data" als die Zieldaten für die Wasserzeichen-Modifizierung. Spektraldaten für die Wasserzeichen- und Quelldatei werden ebenfalls in dem Bereich "count_1" von deren jeweiligen Abschnitten "main_data" gespeichert. Daten aus diesem Bereich könnten auch für die Wasserzeichenbildung benutzt werden und könnten die Qualität der mit Wasserzeichen versehenen Datei in Fällen steigern, in denen das Wasserzeichen (beispielsweise) signifikante Spektralinformation in dem Bereich "count_1" hat.
  • 4.2 Wiederdefinieren der Grenzen des Bereichs der Quelldatei: Die Quelldatei kann befähigt sein, das Wasserzeichen leichter durch Vergrößern der Länge irgendeines (oder aller) Bereiche "big-value" der Quelldatei's oder Bereiche "count_1" der Quelldatei anzupassen. Beispielsweise kann das Wasserzeichen eine Frequenzreihe in dem Bereich "bigvalue" haben, die einer Frequenzreihe in dem Bereich "count_1" des Quelldateirahmens entspricht, oder das Wasserzeichen kann eine Frequenzreihe in dem Bereich "count_1" haben, die einer Frequenzreihe in dem Nullbereich des Quelldateirahmens entspricht. Dies Option würde weitere Wiedergewinnungs-Information erfordern, beispielsweise, um die Änderung der Bereichsgrenzen in Erwägung zu ziehen.
  • 5. Datei vs. "Streaming"
  • In den zuvor gegebenen Beschreibungen wurde allgemein angenommen, dass der Eingang und der Ausgang des Wasserzeichenbildungs-Systems MP3-Dateien sind. Erweiterungen oder Änderungen des Systems könnten gestatten, strömende Daten zu behandeln, beispielsweise in einer Situation beim Rundfunksenden (in denen es unwahrscheinlich ist, dass der Prozess Zugang entweder zu dem Beginn oder dem Ende des Datenstroms haben würde). Folglich sollten die Techniken, obwohl sich die zuvor genannten Beispiele auf "Dateien" beziehen, als im allgemeinen auf Audio-"Signale", die strömende Signale sein könnten, anwendbar betrachtet werden.
  • Dies würde sicherstellen, dass jeder Rahmen, der alle der Wiedergewinnungsdaten enthält, die notwendig sind, um sich selbst wiederherzustellen, einschließlich aller Reihen-Modifizierungs-Taktik-Information und einer Beschreibung oder Definition der Reihen, die zur Wasserzeichenbildung benutzt werden, und Verfahren zum Sicherstellen, dass der Enschlüsselungs-Schlussel für die Wiedergewinnungsdaten entweder der gleiche für alle Rahmen war oder aus Daten in jedem Rahmen berechnet werden könnte, (vielleicht unter Benutzung eines offentlichen Schlüssel-Verschlüsselungs-Systems für den Schlüssel selbst). Es würde außerdem die Veränderlichkeit der Datenrahmengröße infolge von "Polster"-Bits in Erwägung zu ziehen sein. Die Rahmengröße variiert, um eine konstante durchschnittliche Bitrate pro Rahmen aufrechtzuerhalten.
  • 6. Festgelegte Ton-Wasserzeichen
  • In den zuvor gegebenen Beschreibungen ist angenommen worden, dass das Wasserzeichen-Signal einer Wasserzeichendatei entnommen ist, die so oft wie notwendig wiederholt wird, um die Länge der Quelldatei anzupassen.
  • Alternativen zu diesem Schema gestatten, dass die Wasserzeichen-Spektraldaten direkt aus festgelegten Tönen, von Rauschquellengeneratoren oder anderen zyklischen oder sich wiederholenden Signalgeneratoren erzeugt werden, die willkürlich komplex sein könnten und in einer Weise gesteuert werden, dass sie sich an den Inhalt des Quelldatei-Signals anpassen, aber in einer Weise moduliert werden, dass eine unerlaubte Entfernung schwieriger ist.
  • Diese Herangehensweise könnte zweckdienlich sein, wenn (beispielsweise) eine automatische Beeinträchtigung der Quelldatei-Daten zu Archivierungszwecken erforderlich war, aber kein spezieller Wasserzeicheninhalt erforderlich war. Andere damit im Zusammenhang stehende Techniken sind im folgenden in Beispielen 7.1 u. 7.2 beschrieben.
  • 7. Verschachtelung von Spektralreihen
  • Anstatt der Benutzung von Spektralreihen aus einer Wasserzeichendatei zum Modifizieren oder Ersetzen von Reihen in der Quelldatei kann eine Verschachtelungs-Annäherung benutzt werden.
  • Bei dieser Annäherung, die sich nicht in Übereinstimmung mit der Erfindung befindet, werden Reihen der Quelldatei ohne Bezugnahme auf eine separate Wasserzeichendatei oder ein direkt erzeugtes Signal vertauscht, skaliert oder gelöscht. Daten, die erforderlich sind, den ursprünglichen Zustand der Quelldatei wiederzugewinnen, werden als Wiedergewinnungsdaten gespeichert. Die Reihen, die vertauscht, skaliert oder gelöscht sind, können sich von Rahmen zu Rahmen oder in anderen Intervallen ändern. Die Reihen, die durch irgendeine der Beispieltechniken 7.1 u. 7.2 behandelt werden, können durch irgendeine der Taktiken, die zuvor beschrieben wurden, ausgewählt werdem. Die Techniken gemäß den Beispielen 7.1 u. 7.2 könnten in Kombination angewendet werden.
  • Beispiel 7.1 Verschachtetung/Vertauschung: In einer Anordnung werden Gruppen von Reihen in der Quelldatei vertauscht. Die Wiedergewinnungsdaten, die für diese Anordnung relevant sind, müssen nur die Reihen erkennen und können folglich relativ klein sein. Die Vertauschung von Reihen könnte alternativ dazu in Übereinstimmung mit einer Pseudo-Zufallsordnung, dle durch einen Erzeugungswert erzeugt ist, ausgeführt werden. Bei diesem Beispiel könnte der Erzeugungswert die Wiedergewinnungsdaten für die ganze Datei und den Enschlüsselungs-Schlussel bilden. Die Verschachtetung/Vertauschung von Spektralreihen muss nicht begrenzt sein, um Platz innerhalb eines einzigen Rahmens zu schaffen. Sie könnte Platz zwischen Rahmen (z. B. über aufeinanderfolgende Rahmen hinweg) einnehmen.
  • Ein Beispiel für diese Technik ist schematisch in 11a u. 11b veranschaulicht. Wie zuvor veranschaulicht 11a schematisch eine Gruppe von 16 Frequenzreihen eines Rahmens einwe Quelldatei. 11b veranschaulicht schematisch eine entsprechende Gruppe von 16 Reihen von einem entsprechenden Rahmen der mit Wasserzeichen versehenen Datei. Die Reihen sind mit benachbarten Paaren vertauscht worden, so dass die erste und die zweite Reihe (von der Oberseite der Darstellung gezählt), die dritte und die vierte Reihe, die fünfte und die sechste Reihe (usw.) der Quelldatei vertauscht worden sind. Dies ist ein einfaches Beispiel für die Klarheit der Darstellung. Selbstverständlich könnte eine komplexere Vertauschungsstrategie angenommen sein, um es schwieriger zu machen, die Datei ohne den geeigneten Schlüssel wiederzugewinnen.
  • Beispiel 7.2 Löschung: In dieser Anordnung werden ausgewählte Spektralreihen der Quelldatei gelöscht. Die Wiedergewinnungsdaten, die für diese Anordnung relevant sind, müssen die gelöschten Reihen beschaffen.
  • 8. Vielfache Niveaus
  • Zwei oder mehr Niveaus oder Sätze von Wiedergewinnungsdaten können vorgesehen sein, auf die beispielsweise durch verschiedene jeweilige Schlüssel zugegriffen werden kann. Ein erstes Niveau kann gestatten, irgendeine Wasserzeichen-Mitteilung (z. B. eine gesprochene Mitteilung) zu entfernen, aber ein Restniveau von Rauschen (Verschlechterung) übrigzulassen, was das Material für einen professionellen Gebrauch oder eine High-Fidelity-Wiedergabe ungeeignet macht. Ein zweites Niveau kann gestatten, dieses Rauschen zu entfernen. Es könnte ins Auge gefasst werden, dass den Benutzer ein höherer Preis für den zweiten Niveau-Schlüssel berechnet wird, und/oder dass die Verfügbarkeit des zweiten Niveau-Schlüssels auf bestimmte Klassen von Benutzern, beispielsweise auf professionelle Benutzer, beschränkt werden kann.
  • 9. Teilweise Wiedergewinnung
  • Der Benutzer könnte eine besondere Gebühr zahlen, um die Wiedergewinnung einer bestimmten Zeitperiode (z. B. die 60 Sekunden zwischen Zeitkode 01:30:45:00 und 01:31:44:29) zu ermöglichen. Dies erfordert einen zusätzlichen Schritt zum Erfassen der Zeitperiode, für die der Benutzer bezahlt hat, und die Anwendung der Wiedergewinnungsdaten nur hinsichtlich dieser Periode.
  • Ein anderer Weg zum Modifizieren der zuvor genannten Prozeduren für ein teilweise Wiedergewinnung ist:
    • • Während der Wasserzeichenbildung sind die Wiedergewinnungsdaten einzelner Rahmen (oder Gruppen von Rahmen) mit einer voraussagbaren Sequenz verschiedener Schlüssel verschlüsselt,
    • • während einer Säuberung werden nur die Rahmen, die sich über den erforderlichen Abschnitt erstrecken, gesäubert (wiedergewonnen). Dies kann eingeschrieben werden: a. in eine separate Datei mit der ursprünglichen Bitrate b. als ein gesäuberter Abschnitt, der in die mit Wasserzeichen versehene Datei eingebettet ist, in welchem Fall alle Rahmen eine erhöhte Bitrate haben (wie ein Abschnitt der Datei, der im Gegensatz zur empfohlenen Praxis eine verschiedene Bitrate hat).
  • Anwendungen
  • 10a veranschaulicht schematisch eine Anordnung zum Empfangen und Benutzen von mit Wasserzeichen versehenen Dateien. Digitale Rundfunk-Datensignale werden über eine Antenne 400 (wie eine Digital-Audio-Rundfunkantenne oder eine Satellitenschüssel-Antenne) oder von einem Kabelanschluss (nicht gezeigt) empfangen und zu einer "Set-Top Box" (STB) 410 weitergeleitet. Der Ausdruck "Set-Top Box" ist ein allgemeiner Ausdruck, der sich auf einen Demodulator und/oder Dekodierer und/oder eine Entschlüsselungseinheit zum Behandeln von Rundfunk- oder Kabelsignalen bezieht. Der Ausdruck bedeutet nicht tatsächlich wörtlich, dass die STB auf dem Oberteil eines Fernsehgeräts oder eines anderen Geräts zu plazieren ist, noch dass das Gerät "set" ein Fernsehgerät sein muss.
  • Die STB hat eine Telefon- (Modem-)Verbindung 420 mit einem Inhalt-Provider (nicht gezeigt, aber analog zu "Eigentümer" 100 gemäß 2). Der Inhalt-Provider sendet mit Wasserzeichen versehene Audio-Dateien, die absichtlich durch die Anwendung eines akustischen Wasserzeichens verschlechtert sind, wie dies zuvor beschrieben wurde. Die STB dekodiert diese Signale zu einem "Basisband"- (Analog-)Format, das durch ein Fernsehgerät, ein Radio oder einen Verstärker 430 verstärkt und über einen Lautsprecher 440 ausgegeben werden kann.
  • Im Betrieb empfängt der Benutzer den mit Wasserzeichen versehenen Audio-Inhalt und hört ihn ab. Wenn sich der Benutzer dafür entscheidet, die nicht mit Wasserzeichen versehene Version zu erstehen, könnte er (beispielsweise) einen "Zahl"-Knopf 450 auf der STB 410 oder auf eine Taste einer Fernbedienung (nicht gezeigt) drücken. Wenn der Benutzer ein Kontoabbuchungsverfahren (Zahlungsverfahren) mit dem Inhalt-Provider eingerichtet hat, sendet die STB einfach eine Anforderung an den Inhalt-Provider über die Telefonverbindung 420 und empfängt der Reihe nach einen Enschlüsselungs-Schlussel 420, um zu ermöglichen, dass die Wiedergewinnungsdaten entschlüsselt und auf die mit Wasserzeichen versehene Datei angewendet werden, wie dies zuvor beschrieben wurde. Bei einem Nichtvorhandensein eines eingerichteten Zahlungsverfahrens könnte der Benutzer beispielsweise eine Kreditkarten-Nummer in die STB 410 eingeben (einschreiben oder anschlagen), die hinsichtlich dieser Transaktion an den Inhalt-Provider übertragen werden kann.
  • Abhängig von den Anordnungen, die durch den Inhalt-Provider vorgesehen sind, könnte der Benutzer das Recht zum Anhören des nicht mit Wasserzeichen versehenen Inhalts nur einmal oder soviele Male, wie es der Benutzer wünscht oder eine begrenzte Anzahl von Malen erwerben.
  • Eine zweite Anordnung ist in 10b gezeigt, bei der ein Empfänger 460 zumindest einen Demodulator, einen Dekodierer, eine Entschlüsselungseinrichtung und einen Audioverstärker umfasst, um zu gestatten, mit Wasserzeichen versehene Audio-Daten von der Antenne 400 (oder von einem Kabelanschluss) zu behandeln. Der Empfänger hat außerdem eine "Smart Card"-Leseeinrichtung 470, in die eine "Smart Card" 480 eingeführt werden kann. Gemeinsam mit anderen gegenwärtigen Rundfunkdiensten definiert die "Smart Card" einen Satz von Inhaltsdiensten, die der Benutzer zu empfangen berechtigt ist. Dies kann von einem Satz von Diensten abhängig sein, die durch eine Zahlungsvereinbarung abgedeckt sind, die zwischen dem Benutzer und entweder einem Inhalt-Provider oder einem Rundfunksender geschlossen ist.
  • Der Inhalt-Provider sendet einen mit Wasserzeichen versehenen Audio-Inhalt, wie dies zuvor beschrieben wurde. Dieser kann (in einer mit Wasserzeichen versehenen, d. h. verschlechterten Form) von irgendjemand mit einem geeigneten Empfänger empfangen und abgehört werden, um auf diese Weise Benutzer zu ermuntern, eine Zahlunsvereinbarung zu treffen, um das Material in einer nicht mit Wasserzeichen versehenen Form empfangen zu können. Solche Benutzer, die eine "Smart Card" haben, die eine Erlaubnis gewährt, den Inhalt abzuhören, können auch die Wiedergewinnungsdaten entschlüsseln und den Inhalt in nicht mit Wasserzeichen versehenen Form hören. Beispielsweise könnte der Enschlüsselungs-Schlussel auf der "Smart Card" gespeichert sein, um die Notwendigeit einer Telefonverbindung zu ersparen.
  • Die "Smart Card" und die Telefon-Zahlungsvereinbarungen sind selbstverständlich zwischen den Ausführungsbeispielen gemäß 10a und 10b austauschbar. Es kann auch eine Kombination der beiden Zahlungsarten benutzt werden, so dass der Benutzer eine "Smart Card" hat, die es ihm gestattet, einen grundlegenden Satz von Diensten mit dem Telefonanschluss abzuhören, der benutzt wird, um einen Schlüssel für andere (Leistungs-)Inhaltsdienste zu erhalten.
  • Sofern die Ausführungsbeispiele der Erfindung, die zuvor beschrieben wurden, zumindest zum Teil unter Benutzung einer Software-gesteuerten Datenverarbeitungseinrichtung ausgeführt sind, ist ersichtlich, dass ein Computer-Programm, das eine solche Software-Steuerung und ein Speicher- oder Übertragungsmedium vorsieht, durch das ein Computer-Programm gespeichert oder übertragen wird, als Ausführungsformen der vorliegenden Erfindung ins Auge gefasst sind.
  • Es sei auch angemerkt, dass einige der Anordnungen und Vertauschungen, die zuvor beschrieben wurden, zu einer wiedergewonnen Datei führen können, die nicht Bit für Bit identisch mit der ursprünglichen Datei vor der Wasserzeichenbildung ist. Es gibt jedoch äquivalente Wege innerhalb der MP3-Technik und anderer Kodiertechniken zum Darstellen von Tönen, so dass eine etwaige Datei, die nicht bitidentisch mit der Eingangsdatei ist, noch gleich klingen kann. Beispielsweise kann sich die Datenrahmenbildung unterscheiden, oder es kann sich die Größe des unbenutzten Platzes für "ancillary_data" unterscheiden. Solche Ergebnisse sind im Zusammenhang mit den Ausführungsbeispielen der Erfindung akzeptabel.

Claims (32)

  1. Verfahren zum Verarbeiten eines spektral kodierten digitalen Audiosignals (300), das Banddaten-Komponenten enthält, die in jeweiligen Frequenzbändern Audiobeiträge repräsentieren, welches Verfahren Schritte umfasst zum Ändern (215, 220) eines Teilsatzes, der eine oder mehrere der Banddaten-Komponenten enthält, in Reaktion auf ein spektral kodiertes digitales Audio-Wasserzeichensignal (310), um ein bandmäßig geändertes digitales Audiosignal zu erzeugen, wobei der Änderungsschritt ein Kombinieren einer oder mehrerer der Banddaten-Komponenten mit entsprechenden Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal oder ein Ersetzen einer oder mehrerer der Banddaten-Komponenten durch entsprechende Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal umfasst, das mit einem Normierungsfaktor multipliziert ist, und Erzeugen (230) von Wiedergewinnungsdaten, um zu gestatten, dass ursprüngliche Werte der geänderten Banddaten-Komponenten wiederhergestellt werden.
  2. Verfahren nach Anspruch 1, das einen Schritt zum Verschlüsseln der Wiedergewinnungsdaten umfasst.
  3. Verfahren nach Anspruch 1 oder 2, wobei die Wiedergewinnungsdaten den Teilsatz von Banddaten-Komponenten umfassen.
  4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Teilsatz von Banddaten-Komponenten ein vorbestimmter Teilsatz von Banddaten-Komponenten ist.
  5. Verfahren nach einem der Ansprüche 1 bis 3, bei dem die Wiedergewinnungsdaten definieren, welche Banddaten-Komponenten in dem Teilsatz von Banddaten-Komponenten vorhanden sind.
  6. Verfahren nach Anspruch 1 bis 3, das einen Schritt umfasst zum Erfassen, welche Banddaten-Komponenten des Wasserzeichensignals über zumindest einen Teil des Wasserzeichensignals am bedeutendsten sind, wobei diese bedeutendsten Banddaten-Komponenten den Teilsatz der Banddaten-Komponenten bilden.
  7. Verfahren nach Anspruch 6, bei dem der Erfassungsschritt ein Erfassen umfasst, welche Banddaten-Komponenten des Wasserzeichensignals über das vollständige Wasserzeichensignal am bedeutendsten sind.
  8. Verfahren nach Anspruch 6, bei dem das Wasserzeichensignal und ein digitales Audiosignal jeweils als aufeinanderfolgende Datenrahmen kodiert werden, die jeweilige Zeitperioden der Signale repräsentieren, wobei der Erfassungsschritt umfasst: Erfassen, welche Banddaten-Komponenten des Wasserzeichensignals über eine Gruppe eines oder mehrerer Rahmen des Wasserzeichensignals am bedeutendsten sind, wobei diese bedeutendsten Banddaten-Komponenten den Teilsatz von Banddaten-Komponenten bezüglich einer entsprechenden Gruppe eines oder mehrerer Rahmen des digitalen Audiosignals bilden.
  9. Verfahren nach Anspruch 5, das einen Schritt umfasst zum Erfassen, welche Banddaten-Komponenten des Wasserzeichensignals am bedeutendsten von entsprechenden Banddaten-Komponenten des Wasserzeichensignals über zumindest entsprechende Teile des Wasserzeichensignals und des digitalen Audiosignals abweichen, wobei diese am bedeutendsten ab weichenden Banddaten-Komponenten den Teilsatz der Banddaten-Komponenten bilden.
  10. Verfahren nach Anspruch 5, bei dem die Banddaten-Komponenten, die zu modifizieren sind, durch eine Pseudozufalls-Funktion definiert werden.
  11. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das digitale Audiosignal in einem Datenformat gespeichert wird, das zumindest aufweist: ein Format definierende Daten, die eine Datenmenge angeben, die vorliegt, um das digitale Audiosignal zu speichern, die Banddaten-Komponenten und null oder mehr Zusatz-Datenraum.
  12. Verfahren nach Anspruch 11, das einen Schritt zum Speichern der Wiedergewinnungsdaten in dem Zusatz-Datenraum umfasst.
  13. Verfahren nach Anspruch 11, das einen Schritt zum Ändern der das Format definierenden Daten umfasst, um eine größere Datenmenge anzugeben, um das digitale Audiosignal zu speichern, um dadurch die Größe des Zusatz-Datenraums zu erhöhen.
  14. Verfahren nach einem der Ansprüche 1 bis 11, das ein Hinzufügen der Wiedergewinnungsdaten zu dem bandmäßig geänderten digitalen Audiosignal umfasst.
  15. Verfahren nach einem der vorhergehenden Ansprüche, das einen Schritt zum Einstellen der Anzahl von Banddaten-Komponenten in dem Teilsatz in Übereinstimmung mit der Datenkapazität umfasst, die für die Wiedergewinnungsdaten verfügbar ist.
  16. Verfahren zum Verarbeiten eines spektral kodierten digitalen Audiosignals, das umfasst: Banddaten-Komponenten, die Audiobeiträge in jeweiligen Frequenzbändern repräsentieren, die in Reaktion auf ein spektral kodiertes digitales Audio-Wasserzeichensignal geändert sind, wobei die Änderung ein Kombinieren einer oder mehrerer der Banddaten-Komponenten mit entsprechenden Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal oder ein Ersetzen einer oder mehrerer der Banddaten-Komponenten durch entsprechende Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal umfasst, das mit einem Normierungsfaktor multipliziert ist, und Wiedergewinnungsdaten, die ursprüngliche Werte eines Teilsatzes der Banddaten-Komponenten repräsentieren, wobei das Verfahren einen Schritt zum Ändern des Teilsatzes der Banddaten-Komponenten in Übereinstimmung mit den Wiedergewinnungsdaten umfasst, um die ursprünglichen Banddaten-Komponenten wiederzugewinnen.
  17. Verfahren nach Anspruch 16, das einen Schritt zum Entschlüsseln der Wiedergewinnungsdaten umfasst.
  18. Verfahren zum Verteilen spektral kodierten Audio-Inhaltsmaterials, welches Verfahren Schritte umfasst zum Verarbeiten eines spektral kodierten Audio-Inhalts in Übereinstimmung mit dem Verfahren nach Anspruch 1, Verschlüsseln der Wiedergewinnungsdaten, Zuführen des bandmäßig geänderten digitalen Signals und der verschlüsselten Wiedergewinnungsdaten zu einem empfangenden Benutzer und Zuführen eines Entschlüsselungs-Schlüssels zu dem empfangenden Benutzer, um dem Benutzer zu gestatten, die Wiedergewinnungsdaten zu entschlüsseln.
  19. Verfahren nach Anspruch 18, bei dem der Zuführungsschritt nur dann stattfindet, wenn eine Bezahlung von dem empfangenden Benutzer empfangen ist.
  20. Verfahren zum Empfangen eines spektral kodierten Audio-Inhaltsmaterials, welches Verfahren Schritte umfasst zum Empfangen eines bandmäßig geänderten digitalen Signals und verschlüsselter Wiedergewinnungsdaten von einem Inhalts-Provider, wobei das bandmäßig geänderte digitale Signal und die Wiedergewinnungsdaten in Übereinstimmung mit dem Verfahren nach Anspruch 1 erzeugt worden sind, Empfangen eines Entschlüsselungs-Schlüssels, um eine Entschlüsselung der Wiedergewinnungsdaten zu gestatten, Entschlüsseln der Wiedergewinnungsdaten und Verarbeiten des bandmäßig geänderten digitalen Signals unter Benutzung der Wiedergewinnungsdaten in Übereinstimmung mit dem Verfahren nach Anspruch 16.
  21. Verfahren nach Anspruch 20, das einen Schritt zum Bereitstellen einer Bezahlung an den Inhalts-Provider umfasst.
  22. Computer-Software, die ein Programm-Kodemittel aufweist, das dazu bestimmt ist, alle der Schritte eines Verfahrens nach einem der vorhergehenden Ansprüche auszuführen, wenn eine Ausführung mittels eines Computers erfolgt.
  23. Medium, das Software nach Anspruch 22 enthält.
  24. Medium nach Anspruch 23, wobei das Medium ein Speichermedium ist.
  25. Medium nach Anspruch 23, wobei das Medium ein Übertragungsmedium ist.
  26. Vorrichtung zum Verarbeiten eines spektral kodierten digitalen Audiosignals, das Banddaten-Komponenten enthält, die Audiobeiträge in jeweiligen Frequenzbändern repräsentieren, welche Vorrichtung umfasst: Mittel zum Ändern eines Teilsatzes, der eine oder mehrere der Banddaten-Komponenten enthält, in Reaktion auf ein spektral kodiertes digitales Audio-Wasserzeichensignal, um ein bandmäßig geändertes digitales Audiosignal zu erzeugen, wobei der Änderungesschritt ein Kombinieren einer oder mehrerer der Banddaten-Komponenten mit entsprechenden Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal oder ein Ersetzen einer oder mehrerer der Banddaten-Komponenten durch entsprechende Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal umfasst, das mit einem Normierungsfaktor multipliziert ist, und Mittel zum Erzeugen von Wiedergewinnungsdaten, um zu gestatten, dass die ursprünglichen Werte der geänderten Banddaten-Komponenten wiederhergestellt werden.
  27. Vorrichtung nach Anspruch 26, die Mittel zum Verschlüsseln der Wiedergewinnungsdaten enthält.
  28. Vorrichtung zum Verarbeiten eines spektral kodierten digitalen Audiosignals, das enthält: Banddaten-Komponenten, die Audiobeiträge in jeweiligen Frequenzbändern repräsentieren, die in Reaktion auf ein spektral kodiertes digitales Audio-Wasserzeichensignal geändert sind, wobei die Änderung ein Kombinieren einer oder mehrerer der Banddaten-Komponenten mit entsprechenden Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal oder ein Ersetzen einer oder mehrerer der Banddaten-Komponenten durch entsprechende Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal umfasst, das mit einem Normierungsfaktor multipliziert ist, und Wiedergewinnungsdaten, die ursprüngliche Werte eines Teilsatzes der Banddaten-Komponenten repräsentieren, wobei die Vorrichtung Mittel zum Ändern des Teilsatzes der Banddaten-Komponenten in Übereinstimmung mit den Wiedergewinnungsdaten enthält, um die ursprünglichen Banddaten-Komponenten wiederzugewinnen.
  29. Vorrichtung nach Anspruch 28, die Mittel zum Entschlüsseln der Wiedergewinnungsdaten enthält.
  30. "Set-Top"-Box, die eine Vorrichtung nach Anspruch 28 oder 29 enthält.
  31. Audio-Empfänger, wobei der Empfänger eine Vorrichtung nach Anspruch 28 oder 29 enthält.
  32. Spektral kodierte Audiodaten, die aufweisen: ein Format definierende Daten, Banddaten-Komponenten, die in Reaktion auf ein spektral kodiertes digitales Audio-Wasserzeichensignal geändert sind, wobei die Änderung ein Kombinieren einer oder mehrerer der Banddaten-Komponenten mit entsprechenden Komponenten aus dem spektral kodierten digitalen Audio-Wassrzeichensignal oder ein Ersetzen einer oder mehrerer der Banddaten-Komponenten durch entsprechende Komponenten aus dem spektral kodierten digitalen Audio-Wasserzeichensignal umfasst, das mit einem Normierungsfaktor multipliziert ist, und verschlüsselte Wiedergewinnungsdaten, die Änderungen an den Banddaten-Komponenten definieren, um die ursprünglichen Banddaten-Komponenten wiederherzustellen.
DE602004000884T 2003-03-31 2004-03-08 Digitales Audiowasserzeichen Expired - Lifetime DE602004000884T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0307456 2003-03-31
GB0307456A GB2400285A (en) 2003-03-31 2003-03-31 Digital audio processing

Publications (2)

Publication Number Publication Date
DE602004000884D1 DE602004000884D1 (de) 2006-06-22
DE602004000884T2 true DE602004000884T2 (de) 2006-11-30

Family

ID=9955923

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004000884T Expired - Lifetime DE602004000884T2 (de) 2003-03-31 2004-03-08 Digitales Audiowasserzeichen

Country Status (6)

Country Link
US (1) US7702404B2 (de)
EP (1) EP1465157B1 (de)
JP (1) JP2004318126A (de)
CN (1) CN100384119C (de)
DE (1) DE602004000884T2 (de)
GB (1) GB2400285A (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005071522A (ja) * 2003-08-27 2005-03-17 Sony Corp コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法
JP2005084625A (ja) * 2003-09-11 2005-03-31 Music Gate Inc 電子透かし合成方法及びプログラム
US8046838B1 (en) * 2007-04-30 2011-10-25 Hewlett-Packard Development Company, L.P. Using a modulation transfer function of a device to create digital content for the device
DE102007023543A1 (de) * 2007-05-21 2009-01-22 Staroveska, Dagmar Verfahren zur Bereitstellung von Audio- und/oder Videodateien
GB2455526A (en) 2007-12-11 2009-06-17 Sony Corp Generating water marked copies of audio signals and detecting them using a shuffle data store
CN102314881B (zh) * 2011-09-09 2013-01-02 北京航空航天大学 一种用于提高mp3文件中水印嵌入容量的mp3水印方法
US8719946B2 (en) * 2012-03-05 2014-05-06 Song1, Llc System and method for securely retrieving and playing digital media
EP2972982A4 (de) * 2013-03-15 2016-11-23 Canva Pty Ltd System für den entwurf eines lagerbestandsbildes zur einmaligen verwendung
TW201608390A (zh) * 2014-08-18 2016-03-01 空間數碼系統公司 數字版權管理和再廣播的數碼加封
KR102651318B1 (ko) * 2022-10-28 2024-03-26 주식회사 뮤즈블라썸 트랜지언트 기반의 사이드체인 오디오 워터마크 코딩 시스템

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1151673C (zh) * 1998-04-21 2004-05-26 维兰斯公司 多媒体自适应加扰系统
JP3735521B2 (ja) * 1999-09-30 2006-01-18 株式会社東芝 埋め込み符号生成方法及び装置、埋め込み符号検出方法及び装置並びに電子透かし埋め込み装置
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
AU2067101A (en) * 1999-12-15 2001-06-25 Sun Microsystems, Inc. A method and apparatus for watermarking digital content
JP2002062888A (ja) * 2000-08-21 2002-02-28 Matsushita Electric Ind Co Ltd 電子音楽加工装置、電子音楽再生装置及び電子音楽配信システム
GB2378370B (en) * 2001-07-31 2005-01-26 Hewlett Packard Co Method of watermarking data

Also Published As

Publication number Publication date
GB2400285A (en) 2004-10-06
GB0307456D0 (en) 2003-05-07
EP1465157A1 (de) 2004-10-06
CN100384119C (zh) 2008-04-23
US7702404B2 (en) 2010-04-20
EP1465157B1 (de) 2006-05-17
DE602004000884D1 (de) 2006-06-22
JP2004318126A (ja) 2004-11-11
CN1534919A (zh) 2004-10-06
US20040260559A1 (en) 2004-12-23

Similar Documents

Publication Publication Date Title
DE60204039T2 (de) Vorrichtung zur kodierung und dekodierung von audiosignalen
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE60213394T2 (de) Audiokodierung mit partieller enkryption
DE69933929T2 (de) Bereitstellen von digitalen Audio- und Videoprodukten
DE69935811T2 (de) Frequenzbereichsaudiodekodierung mit Entropie-code Moduswechsel
DE60114638T2 (de) Modulation eines oder mehrerer parameter in einem wahrnehmungsgebundenen audio- oder video-kodiersystem in antwort auf zusätzliche information
DE10393776B4 (de) Verfahren und Systeme zur Kodierung von mehreren Nachrichten in Audiodaten und zur Detektion derselben
DE69925243T2 (de) Datenprozessor und datenspeichermedium
DE60110086T2 (de) Stegotextkodierer und -dekodierer
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE69534273T2 (de) Verfahren und vorrichtung zum signalkodieren, signalubertragungsverfahren und verfahren und vorrichtung zur signaldekodierung
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE60117471T2 (de) Breitband-signalübertragungssystem
EP1212857B1 (de) Verfahren und vorrichtung zum einbringen von informationen in einen datenstrom sowie verfahren und vorrichtung zum codieren eines audiosignals
EP1155526B1 (de) Vorrichtung und verfahren zum erzeugen eines verschlüsselten audio- und/oder videodatenstroms
EP1794564A1 (de) Vorrichtung und verfahren zum synchronisieren von zusatzdaten und basisdaten
WO2000049762A2 (de) Verfahren und vorrichtung zum erzeugen eines verschlüsselten nutzdatenstroms und verfahren und vorrichtung zum abspielen eines verschlüsselten nutzdatenstroms
EP1151561A2 (de) Verfahren und vorrichtung zum erzeugen eines datenstroms und verfahren und vorrichtung zum abspielen eines datenstroms
DE102004043521A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
DE602004000884T2 (de) Digitales Audiowasserzeichen
DE69837096T2 (de) Informationssignalverarbeitungsverfahren
DE602004009926T2 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
DE102007029381A1 (de) Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren
DE60210668T2 (de) Quantisierungs-index-moduliertes (qim) einbetten eines digitalen wasserzeichens in ein multimedia-signal

Legal Events

Date Code Title Description
8364 No opposition during term of opposition