-
Erfindungsgebiet
-
Die vorliegende Erfindung betrifft ein Verfahren zum Einbetten von Information in Audiosignale in Mehrträgersystemen.
-
Stand der Technik
-
Es existieren verschiedene Systeme zum Einbetten von Wasserzeichen in Audiosignale [Audio-Wasserzeichenmarkierung (Audio Watermarking)]. In einigen dieser Systeme werden mehrere Träger zum Erzeugen des Wasserzeichens verwendet. Eines dieser Systeme ist im US-Patentdokument Nr.
US6915002B2 offenbart. Dieses Dokument offenbart einen Wasserzeicheneinbetter, der das Wasserzeichen durch eine Codierung über mehr als zwei Kanäle erzeugt und das Wasserzeichen in das Hostsignal einbettet.
-
Ein anderes System, das Information in Audiosignale einbettet, ist im US-Patentdokument Nr.
US2004204943 definiert. In dem in diesem Dokument beschriebenen System wird ein Energiepegeldetektor bereitgestellt. Mit diesem Detektor wird die Energie eines Signals in einem vorgegebenen Zeitbereich gemessen, und es wird entschieden, ob eine Wasserzeichenmarkierung ausgeführt wird oder nicht. Wenn innerhalb des vorgegebenen Zeitbereichs extrem verschiedene Energiepegel erfasst werden, wird keine Wasserzeichenmarkierung ausgeführt, um eine hörbare Zeitdispersion zu vermeiden.
-
In herkömmlichen Anwendungen erschwert eine hohe Komplexität des Empfängers, der im System verwendet werden sollte, die Verwendung dieses Empfängers in Mobilgeräten (z. B. Mobiltelefonen) mit geringer Leistungsfähigkeit oder begrenztem Energieverbrauch.
-
Außerdem kann die Leistung des Empfängers aufgrund der Interferenz, die von dem im Sender verwendeten Audiosignal abhängig ist, gering sein (1 und 2).
-
Kurze Beschreibung der Erfindung
-
Es ist eine Aufgabe der vorliegenden Erfindung, ein Wasserzeicheneinbettungsverfahren bereitzustellen, das ein Audiosignal unter Verwendung von Mehrträgersignalen in Empfängern und Sendern markiert.
-
Es ist eine andere Aufgabe der vorliegenden Erfindung, ein Wasserzeicheneinbettungsverfahren bereitzustellen, bei dem das Audiosignal in der Zeit- und Frequenzdimension eingerahmt und ein Informationssignal in den markierten Bereich eingebettet wird.
-
Es ist eine weitere Aufgabe der vorliegenden Erfindung, ein Wasserzeicheneinbettungsverfahren bereitzustellen, bei dem ein Empfänger mit einer einfachen Struktur verwendet wird, der die Information vom Audiosignal unter Verwendung der Rahmen in der Zeit- und Frequenzdimension extrahiert.
-
Es ist eine andere Aufgabe der vorliegenden Erfindung, ein Wasserzeicheneinbettungsverfahren bereitzustellen, bei dem ein durch die im Empfänger auftretende Interferenz verursachter Leistungsverlust verhindert wird.
-
Ausführliche Beschreibung der Erfindung
-
Das Wasserzeicheneinbettungsverfahren, das die Aufgabe der vorliegenden Erfindung löst, ist in den beigefügten Figuren dargestellt; es zeigen:
-
1 eine schematische Ansicht eines herkömmlichen Senders (1') mit einem Codierer (K);
-
2 eine schematische Ansicht eines herkömmlichen Empfängers (2') mit einem Demodulator;
-
3 eine schematische Ansicht eines im erfindungsgemäßen Wasserzeicheneinbettungsverfahren verwendeten Senders;
-
4 eine schematische Ansicht eines im erfindungsgemäßen Wasserzeicheneinbettungsverfahren verwendeten Empfängers;
-
5 ein schematisches Blockdiagramm des Demodulators des im erfindungsgemäßen Wasserzeicheneinbettungsverfahren verwendeten Empfängers;
-
6 eine grafische Energieanalysedarstellung eines Beispiels einer Audiodatei, in die durch das erfindungsgemäße Wasserzeicheneinbettungsverfahren ein Wasserzeichen eingebettet wird; und
-
7 eine grafische Energieanalysedarstellung, die durch Rahmen die Positionen der Wasserzeichen darstellt, die durch das erfindungsgemäße Wasserzeicheneinbettungsverfahren in das Audiodateibeispiel von 6 eingebettet werden sollen.
-
Die in den Figuren dargestellten Komponenten sind durch Bezugszeichen bezeichnet, die die folgende Bedeutung haben:
-
Bezugszeichenliste
-
- 1
- Sender
- 11
- Energieanalyseblock
- 12
- Modulator
- 13
- Fehlerüberwachungscodierer (Error Control Coder)
- 14
- Kombinierer
- 15
- Informationsgenerator
- 2
- Empfänger
- 21
- Energiedetektor
- 22
- Frequenzanalyseblock
- 23
- Filter
- 24
- Demodulator
- 241
- Groberfassungs(Coarse Acquisition)einheit
- 242
- Matched-Filter
- 243
- Abtaster
- 244
- Schwellenwertbeurteilungseinheit
- 245
- Feinerfassungs(Fine Acquisition)einheit
- 246
- Entscheidungseinheit
- 247
- Entzerrer
- 248
- Interferenzunterdrücker
- 25
- Datenkombinierer
- 26
- Fehlerüberwachungsdecodierer (Error Control Decoder)
- 27
- Informationsinterpreter
- A
- Hostsignal
- B
- Informationssignal
- C
- Rekonstruiertes Informationssignal
- D
- Aktion
- H
- Schallquelle (Lautsprecher)
- M
- Empfängersensor
- (a)L
- Der durch jeden Träger transportierte Hostsignalabschnitt (es gibt eine Anzahl ”L” von Signalen ”a”, wobei ”L” eine natürliche Zahl ist, die größer oder gleich eins ist und die Anzahl der Träger bezeichnet)
- (b)L
- Der durch jeden Träger transportierte Informationssignalabschnitt (es gibt eine Anzahl ”L” von Signalen ”b”, wobei ”L” eine natürliche Zahl ist, die größer oder gleich eins ist und die Anzahl der Träger bezeichnet)
- (c)L
- Der rekonstruierte Informationssignalabschnitt in jedem Demodulator (es gibt eine Anzahl ”L” von Signalen ”c”, wobei ”L” eine natürliche Zahl ist, die größer oder gleich eins ist)
- (a + b)fl
- Der Signalabschnitt am Ausgang jedes Filters (es gibt eine Anzahl ”L” von Signalen ”(a + b)fL”, wobei ”L” eine natürliche Zahl ist, die größer oder gleich eins ist und die Anzahl von Filtern bezeichnet).
-
Im erfindungsgemäßen Verfahren werden ein Sender 1 und ein Empfänger 2 verwendet.
-
Der Sender 1 weist mindestens einen Energieanalyseblock 11, mindestens einen Modulator 12, mindestens einen Fehlerüberwachungscodierer 13, einen Kombinierer 14 und in Abhängigkeit von der Anwendung mindestens einen Informationsgenerator 15 auf, der Information erzeugt.
-
Der Empfänger 2 weist mindestens einen Energiedetektor 21, der den Anfang und das Ende des Signals erfasst, mindestens einen Frequenzanalyseblock 22, mindestens ein Filter 23, mindestens einen Demodulator 24, einen Datenkombinierer 25, einen Fehlerüberwachungsdecodierer 26 und in Abhängigkeit von der Anwendung mindestens einen Informationsinterpreter 27 auf, der die ankommende Information B rekonstruiert. Gemäß den im Interpreter 27 erzeugten Daten wird eine Aktion D ausgeführt. Die Aktion D wird in Abhängigkeit von den erzeugten Daten zum Benutzer weitergeleitet. Der Empfänger 2 ist dafür konfiguriert, in einem Mobilgerät, wie beispielsweise einem Mobiltelefon, verwendet zu werden. Beispielsweise werden, wenn die im Interpreter 27 erzeugten Daten einen Wert ”00” von zwei Bits anzeigen, Prepaid-Minuten zu einem GSM-Teilnehmer geladen, und diese Information wird dem Mobilgerät des betreffenden Teilnehmers durch eine Nachricht mitgeteilt. Gemäß einem anderen Beispiel wird, wenn die im Interpreter 27 erzeugten Daten einen Wert ”11” von zwei Bits anzeigen, eine Zusatz-Dienstleitung für den GSM-Teilnehmer bereitgestellt, und diese Information wird dem Mobilgerät des betreffenden Teilnehmers durch eine Nachricht mitgeteilt.
-
Der Demodulator 24 weist mindestens eine Groberfassungseinheit 241, mindestens ein Matched-Filter 242, mindestens einen Abtaster 243, mindestens eine Schwellenwertbeurteilungseinheit 244, mindestens eine Feinerfassungseinheit 245, mindestens eine Entscheidungseinheit 246, mindestens einen Entzerrer 247 und mindestens einen Interferenzunterdrücker 248 auf.
-
Der Energieanalyseblock 11 im Sender 1 bestimmt die Abschnitte hoher Energie in der Audiodatei, die das Hostsignal A darstellt, das für die Wasserzeichenmarkierung verwendet wird, und die Zeit-Frequenz-Rahmen, die verwendet werden können. Der Energieanalyseblock 11 bestimmt diese Rahmen gemäß Parametern, wie beispielsweise einem Fenster, einer Amplitude, einer Wellenform. Der Block 11 überträgt die entsprechende Parameterinformation der Rahmen, die er bestimmt hat, an den Modulator 12 für eine Wasserzeichenmarkierung.
-
Der Informationsgenerator 15 ist die Einheit, die die Information B erzeugt, d. h. Bitwerte, die mit dem Wasserzeichen in Beziehung stehen, das übertragen werden soll. Diese Einheit erzeugt in Abhängigkeit von der Anwendung verschiedene Information.
-
Der Fehlerüberwachungscodierer 13 reduziert den Einfluss von Fehlern, die in den Bits der Information B auftreten, in Abhängigkeit von den Auswirkungen des Kanals und dem aktuellen Rauschpegel.
-
Der Modulator 12 ist ein Mehrträgermodulator, der Merkmale der Audiodatei A verwendet, um das Wasserzeichen zu erzeugen, das in die Audiodatei A adaptiv eingebettet werden soll.
-
Der Kombinierer 14 platziert das durch den Modulator 12 erzeugte Mehrträger-Wasserzeichen in den Abschnitten hoher Energie des zu verwendenden Hostsignals A derart, dass das Wasserzeichen in der Zeit- und Frequenzdimension eingerahmt wird.
-
Das Wasserzeichensignal wird in der bevorzugten Ausführungsform der Erfindung im Modulator 12 unter Verwendung der folgenden Gleichung 1 erhalten: d[k] = Σ L / i=1Σnbi,nαiwi[k]cos(2πfik/Fs)pi(k – nTi) (1)
-
Die Variablen in Gleichung (1) sind nachstehend definiert:
- d[k]
- Wasserzeichensignal
- L
- Anzahl der verwendeten Träger
- bi,n
- Bit des Informationssignals B, das dem Träger i zugeordnet ist
- αi
- Amplitude des Trägers i
- wi[k]
- Fensterfunktion des Trägers i
- fi
- Trägerfrequenzwert des Trägers i
- Fs
- Abtastfrequenz (allgemein wird eine Frequenz von 22050 Hz verwendet)
- pi(k)
- durch den Träger i im Sender 1 verwendete Wellenform
- Ti
- Trägerwellenlänge des Träger i (Periode)
- n
- Symbolnummer
-
Nachdem das Wasserzeichensignal im Modulator 12 erzeugt wurde, wird das Wasserzeichensignal vom Modulator 12 an den Kombinierer 14 übertragen. Das Wasserzeichensignal d[k] wird im Kombinierer 14 in das Hostsignal s[k] eingebettet. Dann führt der Kombinierer 14 das Hostsignal s[k] und das Wasserzeichensignal d[k], die er kombiniert hat, dem Lautsprecher H zu, um es zu übertragen.
-
Das vom Lautsprecher H zu übertragende Signal H ist gemäß der folgenden Gleichung (2) gegeben: t[k] = s[k] + d[k] (2)
-
Die Variablen in Gleichung (2) sind nachstehend definiert:
- t[k]
- vom Lautsprecher H übertragenes Signal
- d[k]
- Wasserzeichensignal
- s[k]
- Hostsignal
-
Gemäß einem Anwendungsbeispiel der Erfindung wird Hühnergeräusch als Hostsignal A verwendet.
6 zeigt die Verteilung der Energiewerte der Hühnergeräusch-Audiodatei bezüglich der Zeit und Frequenz. In dieser Audiodatei sind in der Nähe von Geräuschkomponenten hoher Energie zwei Träger verborgen (
7). Parameter der verborgenen Daten (Information) sind in Tabelle 1 dargestellt. Tabelle 1: Zeit- und Frequenzpositionen beispielhafter Wasserzeichenparameter, die in das als Hostsignal A ausgewählte Hühnergeräusch (Figur 6) eingebettet sind.
Fc (Hertz) (Trägerfrequenz) | Zeitrahmen (Sekunden) |
950 | 2,494–2,766 |
1322 | 2,63–3,174 |
-
Energiepegel des durch den Empfängersensor M empfangenen, mit einem Wasserzeichen markierten Signals werden im Energiedetektor 21 im Empfänger 2 bestimmt. Außerdem könnten nach der Aufzeichnung des gesamten, mit einem Wasserzeichen markierten Signals geräuschlose Abschnitte an seinem Anfang und Ende auftreten. Diese geräuschlosen Abschnitte werden durch Prüfen der Energie des Signals im Energiedetektor 21 lokalisiert und von diesem aufgezeichneten, mit einem Wasserzeichen markierten Signal entfernt.
-
Obgleich sich das übertragene Informationssignal B in einem spezifischen Zeit-/Frequenzrahmen befindet, könnte aufgrund der Hardware im Empfänger 2 und im Sender 1 eine Abweichung in den empfangenen Frequenzwerten auftreten. Der Frequenzanalyseblock 22 ermöglicht es, diese Abweichungen zu erfassen und den korrekten Frequenzwert zu erhalten.
-
Das Filter 23 lässt die Signale (a + b)fl...fL durch, die gemäß den Frequenzwerten im Frequenzanalyseblock 22 korrekt sind, während er die anderen Signale nicht durchlässt.
-
Der Datenkombinierer 25 ist die Einheit, die eine Rekombination der Daten (C)l...L ermöglicht, die in mehrere Träger (Anzahl L) und Zeitrahmen geteilt sind.
-
Der Fehlerüberwachungsdecodierer 26 reduziert den Einfluss der in den Bits auftretenden Fehler in Abhängigkeit von den Auswirkungen des Kanals und dem aktuellen Rauschpegel.
-
Der Informationsinterpreter 27 ist die Einheit, die die vom Fehlerüberwachungsdecodierer 26 empfangenen Bitwerte interpretiert und das mit einem Wasserzeichen markierte Signal C rekonstruiert.
-
Die im Demodulator 24 angeordnete Groberfassungseinheit 241 ist die Einheit, die das Zeitfenster im Signal ungefähr bestimmt, das gemäß spezifischen Frequenzen gefiltert ist, und derart, dass es keine geräuschlosen Abschnitte enthalten wird.
-
Das in der Zeit- und Frequenzdimension eingerahmte Signal wird von der Groberfassungseinheit 24 zum Matched-Filter 242 übertragen.
-
Das Matched-Filter 242 wird verwendet, um die bi,n-Werte der Information B zu erhalten. Die Ausgangsdaten des Matched-Filters 242 werden dem Abtaster 243 zugeführt. In dieser Einheit werden die Daten in bestimmten Zeitintervallen, z. B. Ti oder kürzeren Zeitintervallen, abgetastet.
-
Die Schwellenwertbeurteilungseinheit 244 trifft adaptiv Entscheidungen bezüglich Werten von Parametern, wie beispielsweise eines Fensters, einer Amplitude, einer Wellenform, die für einen korrekten Betrieb des Empfängers 2 verwendet werden.
-
Die Feinerfassungseinheit 245 ist die Struktur, die die Zeitfenster im Signal, das keine geräuschlosen Abschnitte enthält und das gemäß spezifischen Frequenzen gefiltert ist, in Intervallen erfasst, die kürzer sind als Ti.
-
Die Entscheidungseinheit 246 trifft Entscheidungen bezüglich den Werten, die im System den vom Matched-Filter 242 übertragenen bi,n-Werte entsprechen, gemäß den durch den Abtaster 243 erzeugten Abtastwerten. Beispielsweise entscheidet in einem binären System, in dem die Werte +1, –1 übertragen werden, wenn das Matched-Filter 242 einen Wert von 0,8 erzeugt, die Entscheidungseinheit 246, welcher Wert stattdessen verwendet wird. Beispielsweise kann gemäß dem zu verwendenden System, weil 0,8 näher bei +1 liegt, die Einheit entscheiden, dass der Wert 1 übertragen wird. Wenn durch das Matched-Filter 242 ein Wert erzeugt wird, der näher bei –1 liegt, kann die Entscheidungseinheit entscheiden, dass der Wert 0 übertragen wird.
-
Der Entzerrer 247 ist die Einheit, die Störeffekte des Mehrwegekanals im geschätzten Informationssignal reduziert oder beseitigt.
-
Der Interferenzunterdrücker 248 ist die Einheit, die die Effekte des Signals A, das den Funkkommunikationskanal durchlaufen hat, vom empfangenen gefilterten (A + B)-Signal erzeugt und den Effekt vom durch den Empfängersensor M über die Luft empfangenen Signal subtrahiert, wodurch die Fehlerrate vermindert und die Systemleistung erhöht wird. Durch die Einheit 248 kann verhindert werden, dass im Audiosignal Effekte auftreten, wie Leistungsverlust und Echos, die während der Übertragung über die Luft verursacht werden, bis das Audiosignal vom Lautsprecher H am Mikrofon M ankommt.
-
Das durch den Empfängersensor M im Empfänger empfangene, mit einem Wasserzeichen markierte Signal wird zum Energiedetektor 21 übertragen.
-
In einer Ausführungsform der Erfindung wird das mit einem Wasserzeichen markierte Signal im Empfänger 2 gemäß der nachstehenden Gleichung (3) berechnet. r[k] = t[k]*h[k] + n[k] (3)
- r[k]
- Mit einem Wasserzeichen markiertes Signal, das durch einen Empfängersensor M, z. B. ein Mikrofon, empfangen und digital abgetastet wird.
- h[k]
- Kanalimpulsantwort
- *
- Faltungsoperator
- n[k]
- Additives weißes gaußsches Rauschen
-
Der r[k]-Wert kann unter Verwendung von Gleichung (2) folgendermaßen dargestellt werden: r[k] = d[k]*h[k] + s[k]*h[k] + n[k] = d[k]*h[k] + Interferenz + Rauschen (4)
-
Vorausgesetzt, dass die in Gleichung (4) angegebenen Terme Interferenz und Rauschen den Empfang des Signals nicht beeinträchtigen, können die mit Hilfe des Demodulators 24 übertragene Daten {bi,n} im Empfänger 2 erhalten werden.
-
Erfindungsgemäß kann auch eine andere Struktur als der Demodulator 24 verwendet werden. Der hierin dargestellte Demodulator 24 wird aufgrund der betrieblichen Einfachheit seiner Struktur (5) als ein Beispiel verwendet.
-
s[k]*h[k] ist als der Interferenzterm definiert. Nachdem im Entzerrer 247 eine Kanalschätzung ausgeführt worden ist, wird diese Schätzung h[k] an den Interferenzunterdrücker 248 übertragen. Wenn geplant ist, die Abtastwerte des Audiosignals zu verwenden, die in der Zeit- und Frequenzdimension eingerahmt sind, kann der Term s[k]*/[k] im Interferenzunterdrücker 247 erzeugt werden. Nachdem der Wert des Terms s[k]*h[k] erhalten wurde, wird durch die Verwendung des Wertes r[k] – s[k]*h[k] im Empfänger die Systemleistung erhöht.
-
Im im erfindungsgemäßen Verfahren verwendeten Sender 1 wird, obwohl der Energiepegel des eingebetteten Wasserzeichensignals höher ist als der Energiepegel des Hostsignals A (ursprüngliches Signal), im wahrgenommenen Geräusch keinerlei Störung verursacht.
-
Es kann eine breite Vielfalt von Ausführungsformen des erfindungsgemäßen Verfahrens entwickelt werden. Die Erfindung ist nicht auf die hierin beschriebenen Beispiele beschränkt, sondern ausschließlich durch die beigefügten Patentansprüche definiert.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- US 6915002 B2 [0002]
- US 2004204943 [0003]