-
Die
vorliegende Erfindung bezieht sich auf ein computer-implementiertes
Verfahren zum Erhalten von Metadaten für ein Multimediaobjekt durch
Zusammenpassung eines Objekt-Fingerabdrucks für das Multimediaobjekt mit
Eingaben, die in einer primären
Datei gespeichert sind, die Fingerabdrucke und betreffende assoziierte
Sätze mit
Multimedien enthält.
-
Die
vorliegende Erfindung bezieht sich weiterhin auf ein Computersystem,
vorgesehen zum Erhalten von Metadaten für ein Multimediaobjekt, mit Zusammenpassungsmitteln
zum Zusammenpassen eines Fingerabdrucks eines Objektes für das Multimediaobjekt
mit Eingaben, die in einer primären
Datei gespeichert sind.
-
Die
vorliegende Erfindung bezieht sieh weiterhin auf ein Computerprogrammprodukt.
-
Fingerabdrucke
von Menschen werden bereits seit Hunderten von Jahren verwendet
zum Identifizieren von Personen. Im Grunde kann ein Fingerabdruck
als eine kurze Zusammenfassung gesehen werden, die für jeden
Menschen einzigartig ist. Neulich ist im Bereich der Multimediaverarbeitung
ein wachsendes Interesse entstanden um Fingerabdrucke von Multimediaobjekten,
wie Liedern, Musik, Bildern oder Filmen zu berechnen. Um zwei Multimediaobjekte
gleichzeitig zu qualifizieren, stattdessen, dass die Multimediaobjekte
miteinander verglichen werden. Ein Fingerabdruck eines Multimediaobjektes ist
eine Darstellung der relevantesten Wahrnehmungsmerkmale des betreffenden
Objektes. Derartige Fingerabdrucke werden manchmal auch als "(robuste) Hashes" bezeichnet.
-
Bei
den meisten Systemen, bei denen die Fingerabdrucktechnologie angewandt
wird, werden die Fingerabdrucke einer Vielzahl von Multimediaobjekten
zusammen mit ihren assoziierten betreffenden Metadaten in einer
Datei gespeichert. Der Ausdruck "Metadaten" bezieht sich auf
Information wie den Titel, den Interpreten, die Gattung usw. für ein Multimediaobjekt.
Die Metadaten eines Multimediaobjektes werden durch Berechnung des
Fingerabdrucks und durch Durchführung
eines Nachschlags oder eine Abfrage in der Datei abgerufen, und
zwar unter Verwendung des berechneten Fingerabdrucks als Nachschlagschlüssel oder
als Abfrageparameter. Der Nachschlag kehrt danach zu den Metadaten
zurück, die
mit dem Fingerabdruck assoziiert sind.
-
Es
gibt viele Vorteile bei der Speicherung von Fingerabdrucken für Multimediaobjekte
in einer Datei statt des Multimedia-Contents selber. Um einige zu nennen:
- 1. Die Speicheranforderungen für die Datei
werden verringert.
- 2. Der Vergleich von Fingerabdrucken ist effizienter als der
Vergleich der Multimediaobjekten selber, da Fingerabdrucke im Wesentlichen
kürzer sind
als die Objekte.
- 3. Suche in einer Datei für
einen passenden Fingerabdruck ist effzienter als die Suche nach
einem kompletten Multimediaobjekt, da es sich nun um das Zusammenpassen
kürzerer
Items handelt.
- 4. Die Suche nach einem passenden Fingerabdruck ist wahrscheinlich
mehr erfolgreich, da geringfügige Änderungen
in einem Multimediaobjekt (wie Codierung in ein anderes Format oder
eine Änderung
der Bitrate) den Fingerabdruck nicht beeinträchtigen.
-
Ein
Beispiel eines Verfahrens zum Erzeugen eines Fingerabdrucks für ein Multimediaobjekt
ist in der internationalen Patentanmeldung WO 02/065782 (Aktenzeichen
der Anmelderin PHN010110), sowie in dem Artikel von Jaap Haitsma,
Ton Kalker und Job Oostveen: "Robust
Audio Hashing For Content Identification", "International
Workshop on Content-Based Multimedia Indexing", Brescia, September 2001 beschrieben
worden.
-
Dieses
Verfahren kann angewandt werden zum Anbieten eines Musikerkennungsdienstes.
Gesetzt den Fall, eine Person hört
ein Lied und möchte Metadaten
wissen, wie den Titel und den Interpreten des Liedes. Er nimmt sein
Handy und macht Kontakt mit dem Server. Unter Verwendung dieser
Verbindung benutzt der Benutzer danach das Mikrophon seines Handys
um das Lied aufzunehmen, so dass der Server auf der anderen Seite
es hören
kann. Der Server berechnet dann einen Fingerabdruck für das Lied
und führt
dann eine Dateiuntersuchung durch zum Erhalten der mit diesem Fingerabdruck
assoziierten Metadaten. Der Server sendet dann eine Nachricht mit
den Metadaten zu dem Handy des Benutzers, beispielsweise per SMS.
-
Die
Metadaten können
auch einer E-Mailadresse für
den Benutzer zugeführt
werden, oder sie können
dem Benutzer über
einen augenblicklichen Nachrichtendienst als eine Nachricht zugesendet werden.
Auf diese Art und weise kann umfangreichere Information geliefert
werden als von den etwaigen begrenzten Fähigkeiten des Handys möglich ist.
Das Handy könnte
dann beispielsweise eine SMS-Nachricht empfangen, die den Titel
und den Interpreten angibt, sowie eine Angabe, dass der E-Mailadresse des
Benutzers mehr Information zugesendet worden ist.
-
Damit
eine größere Anzahl
Multimediaobjekte erkannt werden können, muss die Datei mit Fingerabdrucken
und Metadaten sehr groß sein,
und zwar in der Größenordnung
von Hunderttausenden Eingaben. Dies macht die Verwaltung der Datei
sehr kompliziert. Oft muss bei derart großen Systemen die Fingerabdruckdatei über eine
beträchtliche
Anzahl Fingerabdruckserversysteme verteilt werden, damit es möglich ist,
alle Suchanträge
zu meistern und alle Fingerabdrucke zu speichern. Weiterhin soll
die Datei aktualisiert werden. Im Falle beispielsweise von Audio-Fingerabdrucken
sollen die Fingerabdrucke neu veröffentlichter Lieder hinzugefügt werden.
Die erforderlichen Server und die Aktualisierung machen das System
sehr aufwendig.
-
Außerdem kann
wegen der Vielzahl von Eingaben in die Datei die Abfragereaktionszeit
sehr lang werden.
-
WO01/62004
beschreibt ein Verfahren und ein System zum Identifzieren von Media-Content, präsentiert über eine
Media-Wiedergabeanordnung. Eine Kostprobe des Contents wird mit
einer Sammlung des abgetasteten Contents verglichen um sie zu Identifizieren
und um Information in Bezug auf die Kostprobe zu bestätigen.
-
Der
Artikel: "Content-based
identification of audio material using MPEG-7 low level description" von Allamanche u.a. "Proceedings second
annual international symposium on music information retrieval 2001", beschreibt die
Verwendung von Fingerabdrucken zum identifizieren unbekannter Audio-Werte
in dem Kontext von MPEG-7.
-
Der
Artikel: "Feature-based
indexing for media tracking" von
Hampapur u.a. "Proceedings
international conference on multimedia and expo 200", August 2000 beschreibt
das Zusammenpassen von Videosegmenten auf Basis eines Merkmalvergleichs.
-
US 5.918.223 analysiert
Audiodaten zum Klassifizieren und zum Einstufen von Ähnlichkeit
zwischen Audiodateien in einer Datei.
-
WO01/88900
beschreibt ein Verfahren zum Erzeugen von Audio-Fingerabdrucken, die zum Identifizieren
von Audio mit Hilfe einer Datei verwendet werden können.
-
EP-A
0 955 592 beschreibt ein Verfahren zum Abtragen einer Datei zum
Suchen von Metadaten unter Anwendung eines Merkmalvergleichsverfahrens.
-
Es
ist nun u.a. eine Aufgabe der vorliegenden Erfindung, ein Verfahren
dereingangs beschriebenen Art zu schaffen, wobei die mittlere Zeit
zum Erhalten der Metadaten verringert wird.
-
Diese
Aufgabe wird nach der vorliegenden Erfindung erfüllt durch ein Verfahren, gekennzeichnet durch
Berechnung eines Übertragungsfingerabdrucks
für einen
Teil eines weiteren Multimediaobjektes, das über einen Übertragungskanal übertragen wird,
durch Zusammenpassung des Übertragungsfingerabdrucks
mit den in der primären
Datei gespeicherten Fingerabdrucken, durch Hinzufügung einer Eingabe
mit wenigstens einem Fingerabdruck für das weitere Multimediaobjekt
in einer zweiten Datei bei einer erfolgreichen Zusammenpassung,
und durch Erhaltung der Metadaten durch Zusammenpassung des Fingerabdrucks
mit Eingaben, die in der zweiten Datei gespeichert sind und nur
mit der primären
Datei übereinstimmen,
wenn die genannte Zusammenpassung mit der sekundären Datei misslingt.
-
Wenn
auf diese Art und Weise gefüllt,
enthält die
sekundäre
Datei eine geringe Anzahl Eingaben, alle für Objekte, die über den
(die) überwachten
Kanal (Kanäle) übertragen
worden sind. Das Zusammenpassen mit der sekundären Datei wird auf diese Art
und weise schneller gehen als das Zusammenpassen mit der primären Datei.
Nur dann, wenn keine Übereinstimmung
in der sekundären
Datei gefunden wird, wird eine Zusammenpassung in der primären Datei
durchgeführt.
Weil erwartet wird, dass viele Anträge für Multimediaobjekte, die über die überwachten Übertragungskanäle übertragen
worden sind, eintreffen werden, folgt, dass unter Verwendung nur der
kleineren und schnelleren Datei viele Anträge beantwortet werden können. Auf
diese Weise wird im Schnitt die Zeit, erforderlich zum Zusammenpassen eines
Fingerabdrucks reduziert.
-
In
einer Ausführungsform
umfasst das Verfahren weiterhin das Empfangen wenigstens eines Teils
des Multimediaobjekts und das Berechnen des Fingerabdrucks über den
empfangen Teil. In vielen Fällen
wird das Verfahren nach der vorliegenden Erfindung durch eine entfernte
dritte Partie ausgelöst, die
ein Multimediaobjekt, das diese Partie hört, identifizieren möchte. Weil
das Verfahren Metadaten durch Zusammenpassen eines Fingerabdrucks
für das
Multimediaobjekt in einer Datei enthält, ist es notwendig, irgendwie
einen Fingerabdruck für
das Objekt zu erhalten.
-
Bei
dieser Ausführungsform
liefert der Benutzer einen Teil des Multimediaobjekts, so dass der Fingerabdruck über diesen
Teil berechnet werden kann. So könnte
bei spielsweise der Benutzer mehrere Sekunden Audio aufnehmen und
diese übertragen,
oder mehrere Sekunden Audio über
eine Telefonverbindung übertragen.
Eine Alternative wäre, dass
der Benutzer den Fingerabdruck selber zunächst berechnet und danach den
Fingerabdruck zu dem Server überträgt, bei
dem die Zusammenpassung durchgeführt
wird, aber diese Alternative erfordert einen komplexeren Kunden.
-
Bei
einer weiteren Ausführungsform
umfasst die Eingabe für
das weitere Multimediaobjekt den Übertragungsfingerabdruck. Während vier Übertragung
wird ein Multimediaobjekt immer etwas modifiziert. Dies bedeutet,
dass ein Übertragungsfingerabdruck
auch immer etwas anders sein wird als die Fingerabdrucke in der
primären
Datei, obschon nicht anders genug um eine Übereinstimmung zu vermeiden. Der
Objektfingerabdruck wird höchstwahrscheinlich über einen
Teil geringer Qualität
des Multimediaobjekts berechnet, beispielsweise aufgezeichnet über eine
Handy-Verbindung, nachdem das Objekt in einem Handy durch die Luft
von einer Funkübertragung mit
schlechter Empfangsqualität
empfangen worden ist. Es ist klar, dass dies viele extra Fehler
in die Aufzeichnung einführen
wird, und dass dies zu einem mehr abweichenden Objektfingerabdruck
führen wird.
Dies steigert die Gefahr, dass der Objektfingerabdruck zu viel von
den Fingerabdrucken in der primären
Datei abweicht um erfolgreich zusammenzupassen, und zwar wegen Fehler,
die einer Funkübertragung
anhaften und Fehler aus der Aufzeichnung geringer Qualität.
-
Bei
dieser Ausführungsform
wird der Objektfingerabdruck mit den Übertragungsfingerabdrucken verglichen,
statt mit den Fingerabdrucken, die in der primären Datei vorhanden sind. Dies
eliminiert wenigstens einige Zusammenpassungen, weil der Objektfingerabdruck
weniger von den Fingerabdrucken in der sekundären Datei abweicht als von
den Fingerabdrucken in der primären
Datei.
-
Bei
einer weiteren Ausführungsform
umfasst die Eingabe für
das weitere Multimediaobjekt einen Fingerabdruck für eine Eingabe
in die primäre
Datei, die mit dem Übertragungsfingerabdruck übereinstimmt.
Diese Ausführungsform
bietet den Vorteil, dass der Übertragungsfingerabdruck
nun nicht über das
ganze weitere Multimediaobjekt berechnet zu werden braucht. Nachdem
eine Übereinstimmung gefunden
worden ist, wird die Eingabe in die primäre Datei wenigstens teilweise
in die sekundäre
Datei kopiert, so dass Objektfingerabdrucke miteinander verglichen
werden können.
-
Bei
einer weiteren Ausführungsform
wird ein Übertragungsfingerabdruck
für mehrere
weitere Multimediaobjekte berechnet, die über betreffende Übertragungskanäle übertragen
worden sind. Durch Überwachung
von vielen Kanälen
wird die Chance, dass ein Kanal überwacht
wird, dem ein Benutzer auch zuhört,
größer. Nach
Hinzufügung
einer entsprechenden Eingabe in die sekundäre Datei kann ein Antrag für Metadaten
durch diesen Benutzer dann schneller beantwortet werden.
-
Bei
einer weiteren Ausführungsform
umfasst das Verfahren das Aufzeichnen wenigstens eines Teils der
erhaltenen Metadaten und eines Identifizierers für den Übertragungskanal in einer Übertragungsüberwachungsprotokolldatei.
Durch Abfragung der sekundären
Datei für
alle Eingaben, die mit einem bestimmten Übertragungskanal assoziiert
sind, kann eine Liste mit Übertragungen über diesen
Kanal erhalten werden. Diese Liste kann von einer Copyright-Verrechnungsstelle
benutzt werden um zu ermitteln, wie viel Tantiemen den betreffenden
Inhabern des Urheberrechtes zugehen sollen.
-
Derartige
Tantiemen basieren oft auf einer Schätzung der Anzahl Male, dass
ein bestimmtes Lied gesendet wird, und diese Liste schafft eine
genaue Schätzung
durch einen unparteiischen Dritten. Eine Sendeanstalt könne die
Anzahl Male, dass sie ein bestimmtes Lied sendet, unter- oder überschätzen, oder
es könnte
sein, dass sie nicht genügend Einzelheiten
geben möchte.
Selbstverständlich
kann diese Liste für
viele andere Zwecke nützlich
sein.
-
Bei
einer weiteren Ausführungsform
umfasst das Verfahren weiterhin das Entfernen einer vorhergehenden
Eingabe, die mit einem bestimmten Übertragungskanal assoziiert
ist, aus der sekundären
Datei, und zwar beim Hinzufügen
der Eingabe für
das weitere Multimediaobjekt, das mit diesem bestimmten Übertragungskanal
assoziiert ist, zu der sekundären
Datei. Auf diese Weise wird die sekundäre Datei nur mit Eingaben für Multimediaobjekte
gefüllt,
die über
wenigstens einen Übertragungskanal übertragen
worden sind. Auf diese Weise wird die sekundäre Datei möglichst klein gehalten.
-
Es
ist eine weitere Aufgabe der vorliegenden Erfindung, ein System
der eingangs beschriebenen Art zu schaffen, wobei die mittlere Zeit
zum Erhalten der Metadaten reduziert ist.
-
Diese
Aufgabe wird nach der vorliegenden Erfindung mit einem System erreicht,
das gekennzeichnet ist durch Übertragungsüberwachungsmittel zum
Aufzeichnen eines Teils eines weiteren Multimediaobjektes, das über einen Übertragungskanal übertragen
worden ist, und durch Fingerabdruckmittel zum Berechnen eines Übertragungefingerabdrucks für diesen
Teil, wobei die Zusammenpassungsmittel dazu vorgesehen sind, den Übertragungsfingerabdruck
mit Fingerabdrucken zu vergleichen, die in der primären Datei
gespeichert sind, das Hinzufügen
einer Eingabe mit wenigstens einem Fingerabdruck für das weitere
Multimediaobjekt in eine sekundäre
Datei, und zwar bei einer erfolgreichen Zusammenpassung, und das
Erhalten der Metadaten durch Vergleich des Fingerabdrucks mit Eingaben,
die in der sekundären
Datei gespeichert sind und nur durch einen vergleich mit der primären Datei,
wenn der genannte Vergleich mit der sekundären Date misslingt.
-
Bei
einer Ausführungsform
umfasst das System weiterhin Empfangsmittel zum Empfangen wenigstens
eines Teils des Multimediaobjektes, wobei die Fingerabdruckmittel
dazu vorgesehen sind, den Objektfingerabdruck über den empfangenen Teil zu berechnen.
-
Die
vorliegende Erfindung bezieht sich weiterhin auf ein Computerprogrammprodukt,
vorgesehen um dafür
zu sorgen, dass ein Prozessor das Verfahren nach der vorliegenden
Erfindung durchführt.
-
Ausführungsbeispiele
der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben.
Es zeigen:
-
1 eine
schematische Darstellung eines Systems, vorgesehen zum Identifizieren
von Multimediaobjekten,
-
2 eine
detaillierte schematische Darstellung des Servers und der Datei,
wie diese in diesem System verwendet werden,
-
3 eine
schematische Darstellung einer anderen Ausführungsform des Servers.
-
In
den Figuren bezeichnen dieselben Bezugszeichen entsprechende oder ähnliche
Elemente. Einige der in der Zeichnung angegebenen Elemente sind
typischerweise in Software implementiert und als solche stellen
sie Software-Entitäten
dar, wie Software-Module
oder Objekte.
-
1 zeigt
schematisch ein System, vorgesehen zum Identifizieren von Multimediaobjekten. Das
System umfasst eine Quelle 100, ein Handy 110, ein
Telefonnetzwerk 115, einen Server 120 und eine Datei 121.
Die Quelle 100 erbringt ein Multimediaobjekt 101.
Vorzugsweise umfasst das Multimediaobjekt 101 ein Audiosignal,
obschon es auch ein Videosignal sein kann. Der Term Multimediaobjekt,
wie er hier verwendet wird, bezieht sich auf Sachen, wie Musik,
Lieder, Filme, Fernsehprogramme, Bilder und dergleichen.
-
Bei
der Ausführungsform
nach 1 ist die Quelle ein Lautsprecher, obschon sie
selbstverständlich
jede Art von Signalquelle sein kann. So kann beispielsweise die
Quelle 100 eine Audioanlage, wie ein Rundfunkgerät, oder
eine Quelle von Videosignalen sein. Die Quelle 100 erhält meistens
das Multimediaobjekt 101, das sie macht, von einer anderen
Quelle. So würde
beispielsweise ein Rundfunkgerät
eine ausgestrahlte Sendung aus der Luft oder von einer Kabelverbindung
aufnehmen und daraus hörbare
Signale erzeugen/machen.
-
Ein
Benutzer hört
das Multimediaobjekt 101 und möchte mehr darüber wissen,
d.h. er möchte
Metadaten für
das Multimediaobjekt 101 haben. Der Ausdruck "Metadaten" bezieht sich auf
Information, wie den Titel, den Interpreten, die Gattung usw. für ein Multimediaobjekt.
In vielen Situationen werden diese Metadaten nicht zusammen mit
dem Multimediaobjekt 101 geliefert. So könnte beispielsweise
das Multimediaobjekt 101 Hintergrundmusik in einer Bar oder
in einem Einkaufzentrum sein, oder es könnte ein Teil einer Rindfunksendung
sein. Im Falle einer Rundfunksendung ist es oft schwer, die Metadaten, wie
diese von dem Moderator mitgeteilt werden, genau mitzubekommen,
insofern diese Metadaten überhaupt
gegeben werden.
-
Zum
Erhalten diese Metadaten nimmt der Benutzer dazu sein Handy 110,
und wählt
eine spezielle Nummer, die ihn mit einem Server 120 verbindet. Meistens
handelt es sich dabei um einen Vermittler, wie ein Telefonnetzwerk 115.
Wenn es eine Verbindung mit dem Server 120 gibt, hält der Benutzer
sein Handy 110 derart, dass es das Audiosignal 110 aufnimmt.
Das Signal 101 wird dann über die Telefonverbindung zu
dem Server 120 übertragen.
-
Der
Server 120 erzeugt dann einen Fingerabdruck für das empfangene
Signal 101. Es gibt verschiedene Techniken, die angewandt
werden können um
einen derartigen Multimediafingerabdruck zu berechnen.
-
Das
internationale Patent WO 02/065782 (Aktenzeichen der Anmelderin
PHNL010110) beschreibt ein Verfahren, das Multimediafingerabdrucke
für Multimediaobjekte,
wie beispielsweise Audioclips, erzeugt. Der Audioclip wird in aufeinander
folgende (vorzugsweise einander überlappende)
Zeitintervalle aufgeteilt. Für
jedes Zeitintervall wird das Frequenzspektrum in Bänder aufgeteilt.
Es wird eine starke Eigenschaft jedes Bandes (beispielsweise Energie)
berechnet und durch ein betreffendes Fingerabdruckbit dargestellt.
-
Ein
Multimediaobjekt wird auf diese Weise durch einen Fingerabdruck
mit einer Verkettung binärer
Werte dargestellt, einen für
jedes Zeitintervall. Zum Identifizieren des Multimediaobjektes wird
ein Fingerabdruck berechnet, wenn ein Teil mit einer bestimmten
Länge,
typischerweise etwa zwei Sekunden, empfangen worden ist. Dieser
kleine Fingerabdruck wird danach (beispielsweise unter Anwendung einer
Schiebefenstertechnik) mit dem Fingerabdruck für das komplette Multimediaobjekt
verglichen. Es sei bemerkt, dass ein Multimediaobjekt mehrere assoziierte
Fingerabdrucke haben kann.
-
Unter
Verwendung des berechneten Fingerabdrucks führt der Server 120 danach
eine Dateinachschlagvorgang in der Datei 121 durch, die
eine Anzahl vorher berechneter Fingerabdrucke und assoziierte Sätze mit
Metadaten enthält,
und zwar zum Erhalten der mit dem Fingerabdruck assoziierten Metadaten.
Die von dem Server 120 durchzuführenden Vorgänge werden
anhand der 2 nachstehend erläutert.
-
Der
Server 120 sendet danach eine Nachricht, wie eine SMS-Nachricht,
mit den Metadaten zu dem Handy 110 des Benutzers. Die Metadaten
können
auch per E-Mail an die Adresse des Benutzers gesendet werden, oder
als eine Nachricht an den Benutzer über einen augenblicklichen
Nachrichtendienst. Auf diese Art und Weise kann mehr Information
zugeführt
werden als von den etwaigen begrenzten Fähigkeiten des Handys 110 gemeistert
werden kann. Das Handy 110 können dann beispielsweise eine
SMS-Nachricht empfangen, die den Titel und den Interpreten angibt,
und eine Mitteilung, dass mehr Information an die E-Mailadresse
des Benutzers gesendet worden ist.
-
Selbstverständlich kann
das Handy 110 auf einfache Art und Weise durch andere Anordnungen, welche
die Übertragung
von Audio- und/oder Videodaten zu dem Server 120 ermöglichen,
ersetzt werden. So könnte
beispielsweise ein mit einem PV verbundenes Mikrophon verwendet
werden. Der Computer zeichnet dann Schall von dem Mikrophon auf und überträgt die Aufzeichnung
zu dem Server 120, beispielsweise übers Internet, als eine E-Mailnachricht
oder unter Verwendung von FTP, HTTP Datei-Upload oder eines ähnlichen
Mechanismus. Es könnte
auch eine tragbare Anordnung mit Aufzeichnungsmitteln verwendet
werden um eine derartige Aufzeichnung zu verwirklichen. Die tragbare
Anordnung kann dann über
eine Telefonleitung oder über ein
Netzwerk mit dem Server verbunden werden. Andere Übertragungskanäle, wie
Internet-Radio, ermöglichen
die direkte Aufzeichnung und Übertragung eines
Teils eines Multimediaobjektes, da das Objekt dann in digitaler
Form übertragen
wird.
-
2 zeigt
detailliert schematisch den Server 120 und die Datei 121.
Der Server umfasst in diesem Fall ein Eingangsmodul 201,
ein Fingerabdruckmodul 202, ein Dateiverwaltungssystem
(DBMS) Endmodul 203 und ein Reaktionsmodul 204.
-
Das
Eingangsmodul 201 wird aktiviert, wenn der Benutzer den
Server 120 kontaktiert zum Erhalten von Metadaten für ein bestimmtes
Multimediaobjekt. Das Modul wird vorzugsweise mit dem Telefonnetzwerk 115 verbunden,
so dass Benutzer den Server 120 einfach durch die Wahl
einer bestimmten Nummer mit dem Handy 110 kontaktieren
können.
-
Das
Eingangsmodul 201 empfängt
einen Audioclip 201 über
die Verbindung mit Hilfe des Handys 110 und liefert diesen
Audioclip an das Fingerabdruckmodul 202. Das Fingerabdruckmodul 202 berechnet
einen Fingerabdruck aus dem empfangenen Audioclip. Wie oben erwähnt, ist
ein Verfahren zum Berechnen eines Multimediatingerabdrucks in der
internationalen Patentanmeldung WO 02/065782 (Aktenzeichen der Anmel-derin PHNL010110)
beschrieben, obschon selbstverständlich
jedes beliebige Verfahren zum Berechnen eines Multimediafingerabdrucks
angewandt werden kann. Das Fingerabdruckmodul 202 liefert
danach den berechneten Fingerabdruck zu dem DBMS Modul 203.
-
Das
DBMS Modul 203 führt
eine Suche in der Datei 121 durch um einen Satz mit Metadaten
zu finden, die mit dem berechneten Fingerabdruck aus der Datei 121 assoziiert
ist. Wie in 2 dargestellt, umfasst die Datei 121 Fingerabdrucke
FP1, FP2, FP3, FP4 und FP5 und betreffende assoziierte Sätze mit
Metadaten MDS1, MDS2, MDS3, < DS4
bzw. MDS5. Die oben genannte internationale Patentanmeldung WO 02/065782
(Aktenzeigen der Anmelderin PHNL010110) beschreibt mehrere Strategien
zum Suchen von Fingerabdrucken, die für einen Audioclip in einer
Datei mit Fingerabdrucken für
komplette Multimediaobjekte berechnet wurden. Ein beschriebenes Verfahren
zum Suchen eines Fingerabdrucks in einer Datei benutzt Zuverlässigkeitsinformation
der extrahierten Fingerabdruckbits. Die Fingerabdruckbits werden
durch Berechnung von Merkmalen einer Informationssignals und dadurch,
dass eine bestimmte Schwelle für
die genannten Merkmale gelegt wird, ermittelt, und zwar zum Erhalten
der Fingerabdruckbits. Wenn ein Merkmal einen Wert hat, der sehr nahe
bei der Schwelle liegt, kann eine kleine Änderung in dem Signal zu einem
Fingerabdruckbit mit einem entgegengesetzten Wert führen. Der
absolute Wert der Differenz zwischen dem Merkmalwert und der Schwelle
wird benutzt zum Mar kieren jedes Fingerabdruckbits als zuverlässig oder
unzuverlässig. Die
Zuverlässigkeiten
werden danach zum Verbessern der augenblicklichen Suchprozedur benutzt.
-
Die
Datei 121 kann verschiedenartig organisiert sein um die
Abfragezeit und/oder die Datenorganisation zu optimieren. Das Ausgangssignal
des Fingerabdruckmoduls 202 soll berücksichtigt werden, wenn die
Tabellen in der Datei 121 entworfen werden. In der in 2 dargestellten
Ausführungsform umfasst
die Datei 121 eine einzige Tabelle mit Eingaben (Aufzeichnungen)
mit den betreffenden Fingerabdrucken und Sätzen mit Metadaten.
-
Eine
andere Art und Weise zum Verwirklichen der Datei 121 ist,
dass mehrere Tabelle aufgestellt werden. Eine erste Tabelle umfasst
eine Anzahl einzigartiger Identifizierer (primäre Schlüssel), die je mit betreffenden
Sätzen
mit Metadaten assoziiert sind. Derartige Tabellen können aus
mehreren Musikidentifikationsquellen erhalten werden. Die Kombination
von Interpret, Titel und Erscheinungsjahr könnten kombiniert werden zum
Bilden eines einzigartigen Identifizierers, obschon die nicht eine
Gewähr ist,
dass er einzigartig ist, so dass vorzugsweise ein wirklich völlig einzigartiger
Wert verwendet wird.
-
Danach
wird eine zweite Tabelle aufgestellt mit Eingaben, die für jedes
Multimediaobjekt seine Fingerabdrucke und seinen einzigartigen Identifizierer
aus der ersten Tabelle enthält.
Wenn mehrere Fingerabdrucke für
ein Multimediaobjekt möglich
sind, werden all diese Fingerabdrucke in der zweiten Tabelle gespeichert,
die alle mit dem einen einzigartigen Identifizierer für dieses
Multimediaobjekt assoziiert sind.
-
Das
DBMS Modul 203 vergleicht danach den von dem Fingerabdruckmodul 202 berechneten
Fingerabdruck mit den Fingerabdrucken in der zweiten Tabelle, erhält einen
Identifizierer und vergleicht den Identifizierer mit der ersten
Tabelle um die Metadaten zu erhalten. Wenn die Datei 211 eine
SQL Datei ist, könnten
die zwei Tabellen mit dem Identifizierer (in SQL Termen) "gekoppelt" sein.
-
Das
DBMS Modul 203 führt
die Ergebnisse der Abfrage dem Reaktionsmodul 204 zu, das
die Ergebnisse dem Benutzer zuführt,
beispielsweise als SMS Nachricht oder per E-Mail. Wenn das in dem Eingangsmodul 201 empfangene
Audiofragment von einem Handy gesendet wurde, kann die Telefonnummer über (aller
ID oder über
automatische Nummeridentifikation oder aber über ähnliche Mittel erhalten werden.
Das Eingangsmodul 201 liefert dann die anrufende Nummer
an das Reaktionsmodul 204, so dass eine SMS Nachricht zu
dieser Nummer gesendet werden kann.
-
Auf
alternative Weise könnte
das Eingangsmodul 201 ein anderes Mittel zum Identifizieren
des Benutzers empfangen, wie einen Benutzername oder eine E-Mailadresse, die
von dem Benutzer geliefert wird, wenn dieser den Server 210 kontaktiert. Registrierung
könnte
erforderlich sein um den Dienst zu benutzen und dann kann die Bestimmungsadresse
durch Überprüfung der
Einzelheiten der Registrierung des Benutzers erhalten werden, und
zwar beispielsweise auf Basis des von dem Benutzer gelieferten Benutzernamens.
-
Ein
wichtiger Aspekt der Beibehaltung der Date 121 ist, wie
eine ausreichende Anzahl Fingerabdrucke und assoziierter Sätze mit
Metadaten angesammelt werden kann um imstande zu sein, eine akzeptierbare
Anzahl Multimediaobjekte einwandfrei zu identifizieren.
-
Es
ist selbstverständlich
möglich,
eine Vielzahl Aufzeichnungsträger
wie CDs zu erwerben um Fingerabdruck direkt von den CDs zu berechnen. Dies
ist ein aufwendiger Vorgang, da Berechnung der Fingerabdrucke und
das Hinzufügen
der Metadaten zu der Datei 121 sich nur schwer automatisieren lässt. Weiterhin
kann es sein, dass man nicht immer an CD Qualität interessiert ist, sondern
auch in geringerer Qualität,
wenn dies besser zu der Applikation passt. Dies würde einen
zusätzlichen
Vorverarbeitungsschritt bedeuten, bevor Fingerabdrucke in die Datei 121 eingeführt werden
können.
Auch muss man die Metadaten für
alle Lieder, für
die Fingerabdrucke in der Datei 121 gespeichert sind, erhalten. Dies
ist eine noch größere Aufforderung
als das Erhalten der Fingerabdrucke selber.
-
Die
internationale Patentanmeldung WO 03/042867 (Aktenzeichen der Anmelderin PHNL010844)
beschreibt ein Verfahren zum Beibehalten einer Datei mit Fingerabdrucken
und assoziierten Sätzen
mit Metadaten. Multimediaobjekte und ein assoziierter Satz mit Metadaten
werden von Kunden in einem Netzwerk mit gemeinsamer Dateiverwendung
erhalten. Ein Fingerabdruck für
das Multimediaobjekt wird berechnet und zusammen mit dem Satz mit
Metadaten zu der Datei hinzugefügt.
Auf diese Art und Weise können
viele Sätze
mit Metadaten für
ein einziges Multimediaobjekt gesammelt werden. Unter Anwendung
von Techniken, wie Mehrheitsbeschluss, Entscheidungsbaumbeschneidung
oder Vergleichsprüfung
kann ein endgültiger
Satz mit Metadaten berechnet werden.
-
Auf
diese Art und Weise ist es nicht länger notwendig, hinaus zu gehen
und Content zu kaufen, beispielsweise auf CD, oder die Metadaten
für Content
zu suchen. Dadurch, dass Objekte und Metadaten durch die Datentausch-Kunden
in dem Netzwerk zur Verfügung
gestellt werden, können
Signaturen und Metadaten auf eine sehr effiziente Art und Weise gesammelt
werden. Diese Kunden stellen bereits die Objekte zusammen mit Metadaten
verfügbar,
so dass jeder sie herunterladen kann, so dass das Kaufen dieser
Objekte unnötig
wird. Dadurch, dass viele Sätze
mit Metadaten gesammelt werden und dadurch, dass eine Filter- oder
Wahltechnik angewandt wird, kann ein genauer Satz mit Metadaten
aus vielen möglicherweise
unzuverlässigen
Sätzen
konstruiert werden.
-
3 zeigt
schematisch eine andere Ausführungsform
des Servers 120. Nebst der Datei 121, die nachstehend
als primäre
Datei 121 bezeichnet wird, gibt es nun auch eine sekundäre Datei 122, ebenfalls
unter der Ansteuerung des DBMS Moduls 203. Die Organisation
der sekundären
Datei 122 ist vorzugsweise dieselbe wie bei der primären Datei 121.
Die sekundäre
Datei 122 kann auf einem anderen Speichermedium als die
primäre
Datei 121 gespeichert sein, obschon dies nicht unbedingt
notwendig ist.
-
Der
Server 120 ist in dieser Ausführungsform mit einem Übertragungsüberwachungsmodul 205 versehen,
das mit einem Empfänger 301 verbunden ist,
der zum Empfangen einer Übertragung
von einem Medium, wie einem Audio-Senderkanal (Rundfunk), einem
Video-Senderkanal, einem Streaming Internetübertragungskanal, oder einem
Multicast Internetübertragungskanal.
Unter Verwendung des Empfängers 301 zeichnet
das Übertragungsüberwachungsmodul 205 wenigstens
einen Teil eines Multimediaobjekts auf, das über ein Übertragungsmedium übertragen
wird. Das Modul 205 könnte
beispielsweise auf einen bestimmten Rundfunk- oder Fernsehsender
abgestimmt sein, oder mit einem bestimmten Internetgastgeber verbunden
sein, der Streaming Audio liefert.
-
Der
aufgezeichnete Teil wird danach dem Fingerabdruckmodul 202 zuge-führt, so dass ein Übertragungsfingerabdruck
für den
aufgezeichneten Teil berechnet wird. Der Übertragungsfingerabdruck wird
danach mit den Eingaben in der primären Datei 121 verglichen.
Wenn eine Übereinstimmung
gefunden wird, wird eine Eingabe in eine sekundäre Date 122 für die identifizierte Übertragung
geschaffen. Es gibt viele Möglichkeiten
dies zu verwirklichen.
-
Eine
Möglichkeit
zum Schaffen einer Eingabe in die sekundäre Datei 122 ist,
wenigstens einen Teil der passenden Eingabe in die sekundäre Datei 122 hinein
zu kopieren. So kann beispielsweise der Fingerabdruck und der einzigartige
Identifizierer einer übereinstimmenden
Eingabe in der zweiten Tabelle der primären Datei 121, wie
oben erwähnt,
in die sekundäre
Datei 122 hinein kopiert werden, wodurch es ermöglicht wird,
dass nötigenfalls
Metadaten aus der ersten Tabelle erhalten werden. Dadurch bleibt
die sekundäre
Datei 122 möglichst
klein, was den Nachteil hat, das nachfolgende Fingerabdrucke dennoch
mit den ursprünglichen
Fingerabdrucken verglichen werden.
-
Eine
andere Ausführungsform
ist möglich, wenn
der Übertragungsfingerabdruck
die Übertragung
im Wesentlichen als Ganzes darstellt. Der Übertragungsfingerabdruck befindet
sich dann in der Eingabe, die zu der sekundären Date 122 hinzugefügt werden
soll. Selbstverständlich
bedeutet dies, dass das Übertragungsüberwachungsmodul 205 (fast)
die ganze Übertragung
aufzeichnen und diese dem Fingerabdruckmodul 202 zuführen muss.
Der Objektfingerabdruck wird danach in der sekundären Datei 122 mit
dem Übertragungsfingerabdruck
vergleichen.
-
Vorzugsweise
wird eine vorhergehende Eingabe, die mit einem bestimmten Übertragungskanal assoziiert
ist, aus der sekundären
Datei 122 entfernt, und zwar beim Hinzufügen einer
Eingabe, die mit diesem bestimmten Übertragungskanal assoziiert
ist, in die sekundäre
Datei 122. Auf diese Weise wird die sekundäre Datei 122 nur
mit Eingaben für
Multimediaobjekte, die nun über
wenigstens einen Übertragungskanal übertragen
werden, gefüllt.
Dies kann dadurch verwirklicht werden, dass in der sekundären Datei
auch ein Identifizierer für
den Übertragungskanal
gespeichert wird, mit dem die Eingaben assoziiert sind, und dass
eine Eingabe mit demselben Identifizierer wie die Eingabe, die dupliziert
werden soll, entfernt wird.
-
In
der Ausführungsform
nach 3 werden drei Übertragungskanäle überwacht
und die zusammenpassenden Eingaben für FP1, FP2 und FP3 sind in
die sekundäre
Datei 122 dupliziert worden. Außerdem sind Übertragungskanalidentifizierer
TC1, TC2 und TC3 zu den Eingaben in der sekundären Datei 122 für die betreffenden Übertragungskanäle hinzugefügt worden.
-
Durch
eine derartige Sammlung von Eingaben in die sekundäre Datei 122 wird
eine Übersicht geschaffen
und beibehalten der Multimediaobjekte, die über den (die) Übertragungskanal(äle) übertragen
werden, der (die) durch das Übertragungsüberwachungsmodul 205 überwacht
wird (werden). Wenn außerdem
ein identifizierer für
die Übertragungskanäle und ggf.
eine Zeitmarkierung, wo die Eingabe dupliziert wurde, zusammen mit
den Eingaben gespeichert wird, wird es möglich, eine Übertragungs-Protokolldatei
für jeden überwachten
Kanal zu schaffen.
-
Durch
Befragung der sekundären
Datei 122 für
alle Eingaben mit einem bestimmten Übertragungskanal, kann eine
Liste mit Übertragungen über diesen
Kanal erhalten werden. Diese Liste kann von einer Urheberrecht-Verrechnungsstelle,
wie "American Society
of Composers, Authors and Publishers" (ASCAP) oder der niederländischen
BUMA/Stemra benutzt werden um zu ermitteln, wie viel Tantiemen bestimmten
Inhabern von Urheberrechten zugeteilt werden sollen. Derartige Tantiemen
basieren oft auf einer Schätzung
der Anzahl Male, dass ein bestimmtes Lied oder ein bestimmter Film
gesendet worden ist, und diese Liste schafft eine genaue Schätzung durch
einen unparteiischen Dritten. Ein Rundfunk- oder Fernsehsender könnte die
Anzahl Male, dass ein bestimmtes Lied ausgesendet wird, unter- oder überschätzen, oder
es kann sein, dass ein derartiger Sender nicht genügend Einzelheiten
mitteilen möchte.
-
Selbstverständlich kann
diese Liste für
mehrere Zwecke wertvoll sein. Wenn die überwachten Multimediaobjekte
Werbematerial enthalten, dann kann die Liste dazu verwendet werden,
zu beweisen (oder zu widerlegen), dass eine bestimmte Werbemitteilung
oder -nachricht zu einem bestimmten Zeitpunkt gesendet wurde. Auf
diese Weise kann ein Sender dem Werbungsbetreibenden zeigen, dass
er seinen vertraglichen Verpflichtungen nachgekommen ist.
-
Die
Vergleichsprozedur für
Multimediaobjekte, die durch das Eingabemodul 201 empfangen
worden sind, ist nun einigermaßen
geändert.
Der Fingerabdruck wird noch immer wie oben berechnet, aber dieser
Fingerabdruck wird durch das DBMS Modul 201 mit den Eingaben
verglichen, die in der sekundären
Datei 122 gespeichert wurden, bevor ein Vergleich mit der
primären
Datei 121 stattfand.
-
Selbstverständlich wird
es, wenn in der sekundären
Datei 122 eine Übereinstimmung
gefunden wird, nicht länger
notwendig sein, überhaupt
einen Vergleich mit der primären
Datei 121 durchzuführen, da
die sekundäre
Datei 122 nur Eingaben enthält, die aus der primären Datei 121 kopiert
wurden. Aber wenn keine Übereinstimmung
in der sekundären
Datei 122 gefunden wurde, könnte die (größere) primäre Datei 121 dennoch
eine passende Eingabe enthalten.
-
Der
Server 120 ist vorzugsweise mit einem Emhfänger 301 hoher
Qualität
versehen, so dass die aufgezeichneten Übertragungen ebenfalls von
hoher Qualität
sind. Dies macht einen Vergleich der Übertragungsfingerabdrucke mit
der primären
Datei 121 zuverlässiger.
Während
der Übertragung über ein Übertragungsmedium,
wie Rundfunk, wird ein Multimediaobjekt immer etwas modifiziert.
Dies bedeutet, dass der Übertragungsfingerabdruck
etwas anders sein wird als die Fingerabdrucke in der primären Datei 121,
obschon nicht anders genug um eine Übereinstimmung zu vermeiden.
-
Der
Objektfingerabdruck wird andererseits höchstwahrscheinlich auf Basis
einer Aufzeichnung einer niedrigen oder sehr niedrigen Qualität berechnet.
Wie oben erläutert,
könnte
das Handy 110 verwendet werden um eine Aufzeichnung eines
Multimediaobjekts zu dem Server 120 zu übertragen. Wegen der sehr geringen
Qualität
von Übertragungen mit
einem Handy wird dies viele zusätzliche
Fehler in die Aufzeichnung einführen
und folglich wird der Objektfingerabdruck einen größeren Abweichungsgrad haben
gegenüber
Fingerabdrucken in der primären Datei 121.
Dies verringert die Möglichkeiten
einer erfolgreichen Übereinstimmung
mit den Eingaben in der primären
Datei 121.
-
Wenn
der Übertragungsfingerabdruck
in der Eingabe drin ist, die zu der sekundären Datei hinzugefügt wurde,
wie oben erläutert,
dann stimmt der Objektfingerabdruck mit den Übertragungsfingerabdrucken überein,
statt mit den Fingerabdrucken, die sich in der primären Datei 121 befinden.
Dies eliminiert wenigstens einige der erfolglosen Zusammenpassungen,
weil der Objektfingerabdruck weniger von den Fingerabdrucken in
der sekundären
Datei abweicht als von den Fingerabdrucken in der primären Datei.
-
Ein über eine
Aufzeichnung geringer Qualität gerechneter
Fingerabdruck enthält
wahrscheinlich viele Fehler, wodurch die Möglichkeit einer erfolgreichen
und einwandfreien Übereinstimmung
in einer großen
Datei, wie der primären
Datei 121, reduziert wird. Wenn aber eine kleine Datei,
wie die sekundäre Datei 112 verwendet
wird, um den Fingerabdruck zu vergleichen, kann eine geringere Zuverlässigkeit
in der Übereinstimmung
erlaubt werden. Die Eingaben in der sekundären Datei 122 sind
wahrscheinlich nicht dieselben, so dass es, sogar wenn es eine Vielzahl
unzuverlässiger
Bits in dem Fingerabdruck gibt, wahrscheinlich höchstens eine Eingabe gibt,
die auf geeignete Weise passt.
-
Das
DBMS Modul 203 führt
die Ergebnisse der Abfrage zu dem Reaktionsmodul 204, das
sie verarbeitet, wie oben anhand der 2 erläutert wurde.
-
Es
sei bemerkt, dass die oben genannten Ausführungsformen die vorliegende
Erfindung erläutern,
statt begrenzen, und dass der Fachmann imstande sein wird, viele
alternative Ausführungsformen
im Rahmen der beiliegenden Patentansprüche zu schaffen.
-
So
kann beispielsweise der Fingerabdruck für das Multimediaobjekt 101 auf
alternative Weise von einem Fingerabdruckmodul in dem Handy 110 statt
von dem Finger abdruckmodul 202 in dem Server 120 berechnet
werden. Auf diese Weise braucht nur der Fingerabdruck selber zu
dem Server 120 übertragen
zu werden und auf das Fingerabdruckmodul 202 in dem Server
kann verzichtet werden. Da der Fingerabdruck meistens kleiner ist
als der Teil des Multimediaobjektes 101, aus dem er berechnet wurde,
ergibt dies eine wesentliche Bandbreitenreduktion. Die Konstruktion
und die Wirkungsweise eines Handys mit einem Fingerabdruckmodul
ist in der internationalen Patentameldung WO 02/17135 (Aktenzeichen
der Anmelderin PHNL000469) beschrieben worden.
-
Die
Datei 121 könnte über mehrere
physikalische Computersysteme verteilt werden, und zwar zum reduzieren
der Arbeitsbelastung jedes einzelnen Systems. Der Inhalt der Datei 121 könnte auch über eine
Anzahl Kunden in einem Datentauschnetzwerk verteilt werden, wie
in der internationalen Patentanmeldung WO 03/046760 (Aktenzeichen
der Anmelderin PHNL010874) erläutert.
-
Der
Inhalt der Datei 121 kann gratis oder nur bezahlenden Abonnenten
zur Verfügung
gestellt werden. Auf alternative Weise könnte ein Entgelt berechnet
werden für
jede durchgeführte
Abfrage in der Datei 121. Der Betrag an Metadaten, die
zu dem Kunden in Reaktion auf die Zufügung eines Fingerabdrucks zurückgesendet
werden, könnte
auch variiert werden: der freie Kundendienst sendet nur Interpret und
Titel zurück,
und der Dienst auf Basis bezahlender Abonnenten sendet beispielsweise
alle Metadaten zurück,
die in der Datei verfügbar
sind.
-
Die
sekundäre
Datei 122 kann in der Praxis als eine oder mehrere Tabellen
in der primären
Datei 121 verwirklich werden, obschon dies die Zugriffszeiten
auf die Datei länger
machen kann, da die Größe der Datei
(vorzugsweise in dem Arbeitsspeicher) nun zunimmt.
-
In
den Patentansprüchen
sollen eingeklammerte Bezugszeichen nicht als den Anspruch begrenzend
betrachtet werden. Das Wort "enthalten" schließt das Vorhandensein
von Elementen oder Verfahrensschritte anders als die in dem Anspruch
genannten nicht aus. Das Wort "ein" vor einem Element schließt das Vorhandensein
einer Anzahl derartiger Elemente nicht aus.
-
Die
vorliegende Erfindung kann mit Hilfe von Hardware mit vielen einzelnen
Elementen, und mit Hilfe eines auf geeignete Art und Weise programmierten
Computers implementiert werden. In dem Vorrichtungsanspruch, worin
viele Mittel mit einer Nummer versehen sind, können viele dieser Mittel von
ein und demselben Item aus Hard ware ausgebildet sein. Die Tatsache,
dass bestimmte Maßnahmen in
untereinander verschiedenen Unteransprüchen genannt werden bedeutet
nicht, dass eine Kombination dieser Maßnahmen nicht mit Vorteil angewandt werden
könnte.