EP1217603A1

EP1217603A1 - Verfahren zur Identifizierung von Musikstücken

Info

Publication number: EP1217603A1
Application number: EP01000660A
Authority: EP
Inventors: Volker Dr. Stahl
Original assignee: Philips Corporate Intellectual Property GmbH; Koninklijke Philips Electronics NV
Current assignee: Philips Intellectual Property and Standards GmbH; Koninklijke Philips NV
Priority date: 2000-11-27
Filing date: 2001-11-23
Publication date: 2002-06-26
Also published as: JP4340411B2; US20020088336A1; CN1220175C; KR20020041321A; JP2002196773A; KR20090015012A; KR100952186B1; DE10058811A1; CN1356689A

Abstract

Die Erfindung betrifft ein Verfahren zur Identifizierung von Musikstücken. Erfindungsgemäß wird vorgeschlagen, zumindest einen Abschnitts (MA) einer Melodie und/oder eines Textes des zu identifizierenden Musikstücks in eine Analyseeinrichtung (1) einzugeben, welche Übereinstimmungen des Melodie- und/oder Textabschnitts (MA) mit Musikstücken (MT) ermittelt, die der Analyseeinrichtung (1) bekannt sind. Die Analyseeinrichtung (1) wählt dann zumindest eines der bekannten Musikstücke (MT) anhand der ermittelten Übereinstimmungen aus und gibt die Identifizierungsdaten (ID), z B. Titel oder Interpret, des ausgewählten Musikstücks (MT) und/oder zumindest einen Teil des ausgewählten Musikstücks (MT) selbst aus. <IMAGE>

Description

Die Erfindung betrifft ein Verfahren zur Identifizierung von Musikstücken sowie eine Analyseeinrichtung zur Durchführung eines solchen Verfahrens.

Es kommt bei sehr vielen Menschen des öfteren vor, dass sie zum Beispiel in öffentlichen Räumen wie Diskotheken, Gastronomiebetrieben, Kaufhäusern usw. oder auch im Radio Musik hören und gern wüssten, wer der Interpret und/oder Komponist ist und wie der Titel heißt, um sich das Musikstück beispielsweise als CD oder als Musikfile über das Internet, zu beschaffen. Vielfach ist es so, dass die jeweilige Person sich später lediglich an bestimmte Fragmente des gewünschten Musikstücks, beispielsweise an bestimmte Abschnitte des Textes und/oder der Melodie, erinnert. Wenn die Person das Glück hat, in ein Fachgeschäft mit äußerst gut informiertem Personal zu kommen, so ist es u.U. möglich, diese Musikstückfragmente dem Personal vorzusingen oder vorzusummen bzw. Textteile vorzusprechen, worauf dann das jeweilige Personal das Musikstück identifizieren kann und der Person den Titel und Interpreten nennt. In vielen Fällen besteht diese Möglichkeit aber nicht, entweder, weil das Verkaufspersonal den Titel selbst nicht kennt bzw. sich nicht daran erinnert oder weil, wie beispielsweise bei einer Bestellung über das Internet, überhaupt kein direkt ansprechbares Verkaufspersonal zur Verfügung steht.

Es ist Aufgabe der vorliegenden Erfindung, zum einen ein Verfahren zur automatischen Identifizierung von Musikstücken und zum anderen eine geeignete Einrichtung zur Durchführung dieses Verfahrens zu schaffen. Diese Aufgabe wird durch die Patentansprüche 1 bzw. 13 gelöst.

Erfindungsgemäß wird zunächst zumindest ein Abschnitt einer Melodie und/oder eines Textes des zu identifizierenden Musikstücks, beispielsweise die ersten Takte oder ein Refrain, in eine Analyseeinrichtung eingegeben. In dieser Analyseeinrichtung werden dann verschiedene Übereinstimmungen des Melodie- und/oder Textabschnitts mit anderen Musikstücken oder Teilen davon, die der Analyseeinrichtung bekannt sind, festgestellt. Der Analyseeinrichtung sind in diesem Sinne alle Musikstücke bekannt, auf die die Analyseeinrichtung Zugriff hat und deren zugehörige Daten wie Titel, Interpret, Komponist etc. abfragbar sind. Diese Musikstücke können in einer oder in verschiedenen Datenbanken gespeichert sein. Zum Beispiel kann es sich um verschiedene Datenbanken der einzelnen Produktionsgesellschaften handeln, die von der Analyseeinrichtung über ein Netzwerk, beispielsweise das Internet, abgefragt werden können.

Die Ermittlung der Übereinstimmungen erfolgt durch einen Vergleich des Melodie- und/oder Textabschnitts mit den bekannten Musikstücken (bzw. den Teilen davon), zum Beispiel unter Verwendung eines oder mehrerer verschiedener Musterklassifikationsalgorithmen. Im einfachsten Fall handelt es sich um eine einfache Korrelation zwischen dem Melodie- und/oder Textabschnitt und den zur Verfügung stehenden bekannten Musikstücken. Dies ist zumindest dann möglich, wenn ein Originalabschnitt des zu identifizierenden Musikstücks eingegeben wird und somit von einer feststehenden Geschwindigkeit ausgegangen werden kann, die mit der Geschwindigkeit des "richtigen" Musikstücks, welches der Analyseeinrichtung bekannt ist, übereinstimmt.

Anhand der übermittelten Übereinstimmungen wird dann zumindest eines der bekannten Musikstücke ausgewählt, sofern überhaupt ein Musikstück gefunden wurde, welches ein definiertes Mindestmaß an Übereinstimmungen mit dem eingegebenen Melodie- und/oder Textabschnitt aufweist.

Anschließend werden Identifizierungsdaten wie beispielsweise der Titel, der Interpret, der Komponist oder sonstige Informationen hierzu ausgegeben. Alternativ oder zusätzlich erfolgt auch eine Ausgabe des ausgewählten Musikstücks selbst. Beispielsweise kann eine solche akustische Ausgabe zur Verifizierung des Musikstücks erfolgen. Ein Nutzer kann dann, wenn er das ausgegebene Musikstück hört, selbst noch einmal überprüfen, ob es sich um das gesuchte Stück handelt und dann erst die Identifizierungsdaten ausgeben lassen. Wenn keines der Musikstücke ausgewählt wurde, weil beispielsweise bei keinem der Musikstücke das definierte Mindestmaß an Übereinstimmung vorliegt, so wird entsprechend diese Information, beispielsweise der Text "Keine Identifizierung möglich", ausgegeben. Vorzugsweise wird nicht nur ein Musikstück ausgegeben, sondern es besteht die Möglichkeit, gleich eine Mehrzahl von Musikstücken und/oder deren Identifizierungsdaten auszugeben, für die die meisten Übereinstimmungen ermittelt wurden, bzw. diese Musikstücke und/oder deren Identifizierungsdaten zur Ausgabe anzubieten. Das heißt, es wird nicht nur der Titel mit den meisten Übereinstimmungen ausgegeben, sondern es werden die n (n = 1,2,3,...) ähnlichsten Titel ausgegeben, und der Benutzer kann diese Titel der Reihe nach zur Verifizierung anhören oder sich von allen n Titeln die Identifizierungsdaten ausgeben lassen.

Bei einem besonders bevorzugten Ausführungsbeispiel werden zur Ermittlung der Übereinstimmung bestimmte Merkmale des Melodie- und/oder Textabschnitts extrahiert. Aus diesen ermittelten Merkmalen wird dann ein den Melodie- und/oder Textabschnitt charakterisierender Merkmalssatz ermittelt. Ein solcher Merkmalssatz entspricht quasi einem "Fingerabdruck" des jeweiligen Musikstücks. Der charakterisierende Merkmalssatz wird dann mit Merkmalssätzen, die jeweils die der Analyseeinrichtung bekannten Musikstücke charakterisieren, verglichen. Dies hat den Vorteil, dass die zu verarbeitenden Datenmengen erheblich geringer sind, was das Verfahren insgesamt beschleunigt. Darüber hinaus braucht in diesem Fall die Datenbank nicht mehr die kompletten Musikstücke oder Teile der Musikstücke mit allen Informationen zu speichern, sondern es werden lediglich die charakterisierenden Merkmalssätze gespeichert, wodurch der benötigte Speicherplatz erheblich geringer wird.

Vorteilhafterweise wird ein eingegebener Melodie- und Textabschnitt zum einen einer Spracherkennung zugeführt. Gegebenenfalls kann auch der jeweilige Text extrahiert und separat der Spracherkennung zugeführt werden. In dieser Spracherkennung werden die erkannten Worte und/oder Sätze mit Texten der verschiedenen Musikstücke verglichen. Hierzu müssen selbstverständlich auch die Texte als ein Merkmal in den Datenbanken gespeichert sein. Zur Beschleunigung der Spracherkennung ist es sinnvoll, wenn zuvor die Sprache des eingegebenen Textabschnitts angegeben wird, so dass das Spracherkennungssystem nur auf die benötigten Bibliotheken für die jeweilige Sprache zurückgreifen muss und nicht unnötigerweise in Bibliotheken anderer Sprachen sucht.

Zum anderen kann der Melodie- und Textabschnitt einer Musikerkennung zugeführt werden, die beispielsweise die erkannten Rhythmen und/oder Tonabstände (Intervalle) mit den charakteristischen Rhythmen und/oder Intervallen der gespeicherten Musikstücke vergleicht und auf diese Weise ein von der Melodie her übereinstimmendes Stück findet.

Es ist beispielsweise auch möglich, Melodie und Text getrennt zu analysieren und dabei auf beiden Wegen separat ein bestimmtes Musikstück zu suchen. Anschließend wird dann verglichen, ob die über die Melodie gefundenen Musikstücke mit den über die Textsuche gefundenen Musikstücken übereinstimmen. Anderenfalls werden aus den auf den verschiedenen Wegen gefundenen Musikstücken wiederum ein oder mehrere der Musikstücke als Musikstücke mit den meisten Übereinstimmungen ausgewählt. Hierbei kann auch eine Gewichtung vorgenommen werden, in die eingeht, mit welcher Wahrscheinlichkeit ein auf einem bestimmten Weg gefundenes Musikstück das richtig ausgewählte Musikstück ist.

Ebenso ist es möglich, lediglich eine Melodie oder einen Melodieabschnitt ohne Text oder einen Text eines Musikstücks bzw. einen Textabschnitt ohne die zugehörige Melodie einzugeben.

Eine erfindungsgemäße Analyseeinrichtung zur Durchführung eines solchen Verfahrens muss zum einen Mittel zur Eingabe eines Abschnitts einer Melodie und/oder eines Textes des zu identifizierenden Musikstücks aufweisen. Es muss darüber hinaus einen Speicher mit einer Datenbank mit verschiedenen Musikstücken oder Teilen davon oder Mittel zum Zugriff auf zumindest einen derartigen Speicher - beispielsweise einen Internet-Anschluss zum Zugriff auf andere, im Internet angeordnete Speicher - aufweisen. Außerdem benötigt diese Analyseeinrichtung eine Vergleichereinrichtung zur Ermittlung der Übereinstimmungen des Melodie- und/oder Textabschnitts mit den verschiedenen Musikstücken bzw. den Teilen davon sowie eine Auswahleinrichtung zur Auswahl mindestens eines der Musikstücke anhand der ermittelten Übereinstimmungen. Schließlich benötigt die Analyseeinrichtung Mittel zur Ausgabe von Identifizierungsdaten des ausgewählten Musikstücks und/oder des ausgewählten Musikstücks selbst.

Eine solche Analyseeinrichtung zur Durchführung des Verfahrens kann als eigenständiges Gerät aufgebaut sein, welches als Mittel zur Eingabe des Melodie- und/oder Textabschnitts beispielsweise ein Mikrofon enthält, in das der Benutzer den ihm bekannten Textabschnitt hineinsprechen oder -singen kann oder eine entsprechende Melodie pfeifen oder summen kann. Ebenso kann vor dem Mikrofon selbstverständlich auch ein Musikstück abgespielt werden. Die Mittel zur Ausgabe umfassen in diesem Fall vorzugsweise eine akustische Ausgabeeinrichtung, beispielsweise einen Lautsprecher, mit dem das ausgewählte Musikstück bzw. mehrere ausgewählte Musikstücke ganz oder teilweise zur Verifikation ausgegeben werden. Über diese akustische Ausgabeeinrichtung können auch auf akustischem Wege die Identifizierungsdaten ausgegeben werden. Alternativ oder zusätzlich kann die Analyseeinrichtung aber auch eine optische Ausgabeeinrichtung, beispielsweise ein Display, aufweisen, auf dem die Identifizierungsdaten ausgegeben werden. Vorzugsweise weist die Analyseeinrichtung auch eine entsprechende Bedieneinrichtung zur Verifizierung von ausgegebenen Musikstücken, zur Auswahl von zur Ausgabe angebotenen Musikstücken oder zur Eingabe von hilfreichen Zusatzinformationen für die Identifizierung, beispielsweise die Sprache des Textes etc., auf. Ein solches autarkes Gerät kann beispielsweise in Mediengeschäften aufgestellt und dort zur Beratung der Kunden genutzt werden.

Bei einem besonders bevorzugten Ausführungsbeispiel weist die Analyseeinrichtung zur Eingabe des Melodie- und/oder Textabschnitts eine Schnittstelle zum Empfang entsprechender Daten von einem Endgerät auf. Ebenso werden die Mittel zur Ausgabe der Identifizierungsdaten und/oder des ausgewählten Musikstücks durch eine Schnittstelle zum Versenden entsprechender Daten an ein Endgerät realisiert. In diesem Fall kann sich die Analyseeinrichtung an einem beliebigen Ort befinden. Der Nutzer kann dann den Melodie- oder Textabschnitt in ein Kommunikationsendgerät eingeben und somit über ein Kommunikationsnetz an die Analyseeinrichtung übermitteln.

Vorteilhafterweise handelt es sich bei dem Kommunikationsendgerät, in das der Melodie- und/oder Textabschnitt eingegeben wird, um ein mobiles Kommunikationsendgerät, beispielsweise ein Mobilfunkgerät. Ein solches Mobilfunkgerät besitzt ohnehin ein Mikrofon sowie die nötigen Mittel, um die aufgenommenen akustischen Signale über ein Kommunikationsnetz, hier ein Mobilfunknetz, an beliebige andere Geräte zu versenden. Dieses Verfahren hat den Vorteil, dass der Nutzer sofort, wenn er ein Musikstück, beispielsweise in der Diskothek oder als Hintergrundmusik in einem Kaufhaus hört, mit seinem Mobilfunkgerät eine Verbindung zu der Analyseeinrichtung herstellen kann und über das Mobilfunkgerät der Analyseeinrichtung die aktuell laufende Musik "vorspielen" kann. Mit einem solchen Abschnitt der Originalmusik ist eine Identifizierung erheblich leichter als mit einem vom Benutzer selbst gesungenen oder gesprochenen Musik- und/oder Textabschnitt, der gegebenenfalls erheblich verfremdet sein kann.

Die Ausgabe der Identifizierungsdaten bzw. die akustische Ausgabe des ausgewählten Musikstücks oder eines Teils davon erfolgt gleichfalls über eine entsprechende Schnittstelle, über die dann die jeweiligen Daten an ein Endgerät des Nutzers versandt werden. Hierbei kann es sich um dasselbe Endgerät, beispielsweise das Mobilfunkgerät des Nutzers handeln, an dem der Melodie- und/oder Textabschnitt eingegeben wurde. Dies kann "online" oder "offline" geschehen. Die Ausgabe des ausgewählten Musikstücks bzw. der ausgewählten Musikstücke oder der Teile davon, beispielsweise zur Verifikation, erfolgt dann über den Lautsprecher des Endgeräts. Die Identifizierungsdaten wie Titel und Interpret sowie gegebenenfalls auch auswählbare Angebote zur Ausgabe können beispielsweise mittels SMS auf das Display des Endgeräts übertragen werden.

Die Auswahl eines angebotenen Musikstücks, aber auch sonstige Steuerbefehle oder zusätzliche Informationen für die Analyseeinrichtung können mit der üblichen Bedieneinrichtung, beispielsweise der Tastatur, des Endgeräts eingegeben werden.

Die Daten können aber auch über einen natürlichen Sprachdialog eingeben werden, was eine entsprechende Sprachschnittstelle, d.h. eine Spracherkennung und -ausgabe auf Seiten der Analyseeinrichtung erfordert.

Alternativ kann die Suche auch offline durchgeführt werden, d.h. der Nutzer oder die Analyseeinrichtung unterbricht nach Eingabe des Melodie- und/oder Textabschnitts und nach Eingabe übriger Befehle und Informationen die Verbindung zur Analyseeinrichtung. Nachdem die Analyseeinrichtung zu einem Ergebnis gekommen ist, sendet sie dieses beispielsweise per SMS oder durch einen Anruf über einen Sprachkanal an das Kommunikationsendgerät des Nutzers zurück.
Bei einem solchen Offline- Verfahren bietet es sich ebenfalls an, dass der Benutzer ein anderes Kommunikationsendgerät, beispielsweise seinen heimischen Computer bzw. eine eMail-Adresse, angibt, an die das Ergebnis versandt wird. Das Ergebnis kann dabei auch als HTML-Dokument oder in ähnlicher Form versendet werden. Die Angabe der Versandadresse, d.h. des Kommunikationsendgeräts, an welches die Ergebnisse versendet werden sollen, kann entweder durch entsprechende Befehle und Angaben vor bzw. nach Eingabe des Musik- und/oder Textabschnitts erfolgen. Es ist aber auch möglich, dass der jeweilige Nutzer sich zuvor bei einem Serviceanbieter, welcher die Analyseeinrichtung betreibt, explizit registriert und dass dort die notwendigen Daten hinterlegt werden.

Bei einem besonders bevorzugten Verfahren wird optional die Möglichkeit geboten, dass zusätzlich zu dem ausgewählten Musikstück bzw. den zugehörigen Identifizierungsdaten noch weitere Musikstücke bzw. deren Identifizierungsdaten ausgegeben oder zur Ausgabe angeboten werden, die zu dem jeweils ausgewählten Musikstück ähnlich sind. Das heißt, es werden als Zusatzinformationen zum Beispiel Musiktitel angegeben, die im Stil ähnlich sind wie der erkannte Musiktitel, um so dem Nutzer die Möglichkeit zu geben, seiner Geschmacksrichtung entsprechende weitere Titel kennen zu lernen, die er dann eventuell erwerben möchte.

Die Ähnlichkeit zwischen zwei verschiedenen Musikstücken kann dabei auf der Basis von psychoakustischen Abstandsmaßen, wie z.B. besonders starken oder schwachen Bässen, bestimmten Frequenzverläufen innerhalb der Melodie etc., ermittelt werden. Eine Alternative, die Ähnlichkeit von zwei Musikstücken zu bestimmen, besteht in der Nutzung einer Abstandsmatrix, die mit Hilfe von Hörexperimenten und/oder von Marktanalysen, beispielsweise einer Analyse des Kaufverhaltens, aufgestellt wurde.

Die Erfindung wird im Folgenden unter Bezugnahme auf die beigefügten Figuren anhand von Ausführungsbeispielen näher erläutert. Es zeigen:

Figur 1 eine schematische Darstellung des erfindungsgemäßen Verfahrens bei einer "Online-Suche" unter Verwendung eines Mobilfunkgeräts zur Ein- und Ausgabe der benötigten Daten,

Figur 2 eine schematische Darstellung des erfindungsgemäßen Verfahrens bei einer "Offline-Suche" unter Verwendung eines Mobilfunkgeräts zur Eingabe der benötigten Daten und eines PCs zur Ausgabe der Ergebnisdaten,

Figur 3 eine Darstellung einer Abstandsmatrix zur Bestimmung der Ähnlichkeit zwischen verschiedenen Musikstücken.

Bei dem in Figur 1 dargestellten Verfahren wird von einem Nutzer ein Mobilfunkgerät 2 genutzt, um mit der Analyseeinrichtung 1 in Verbindung zu treten. Hierzu wird ein Melodie- und/oder Textabschnitt MA eines aktuell von einer beliebigen, sich in der Nähe des Nutzers befindlichen Musikquelle 5 abgespielten Musikstücks von einem Mikrofon des Mobilfunkgeräts 2 erfasst. Über ein Mobilfunknetz wird der Melodie- und/oder Textabschnitt MA an die Analyseeinrichtung 1 übertragen, welche eine entsprechende Verbindung zum Mobilfunknetz bzw. zu einem Telefon-Festnetz aufweisen muss und dementsprechend über dieses Telefonnetz vom Nutzer angewählt werden kann.

Im Prinzip kann ein handelsübliche Mobilfunkgerät 2 verwendet werden, welches gegebenenfalls modifiziert ist, um eine bessere Übertragungsqualität zu erreichen. Die Steuerung der Analyseeinrichtung 1 über das Mobilfunkgerät 2 kann entweder über entsprechende Menüsteuerungen mittels der Tasten (nicht dargestellt) des Mobilfunkgeräts 2 durchgeführt werden. Es kann aber auch ein sprachgesteuertes Menü verwendet werden.

Aus dem erhaltenen Melodie- und/oder Textabschnitt MA werden von der Analyseeinrichtung 1 bestimmte Merkmale extrahiert. Aus diesen ermittelten Merkmalen wird dann ein den Melodie- und/oder Textabschnitt MA charakterisierender Merkmalssatz ermittelt. Die Analyseeinrichtung 1 steht in Verbindung mit einem Speicher 4 mit einer Datenbank, welche entsprechende Merkmalssätze MS enthält, die jeweils verschiedene Musikstücke charakterisieren. Diese Datenbank enthält außerdem die benötigten Identifizierungsdaten, beispielsweise den Titel und den Interpreten des jeweiligen zugehörigen Musikstücks. Zum Vergleich des charakterisierenden Merkmalssatzes des Melodie- und/oder Textabschnitts MA mit den in der Datenbank im Speicher 4 gespeicherten Merkmalssätzen MS werden jeweils von der Analyseeinrichtung 1 Korrelationskoeffizienten zwischen den zu vergleichenden Merkmalssätzen ermittelt. Die Höhe dieser Korrelationskoeffizienten repräsentiert die Übereinstimmungen zwischen den jeweiligen Merkmalssätzen. Das heißt, der Merkmalssatz MS der im Speicher 4 gespeicherten Merkmalssätze MS mit den höchsten Korrelationskoeffizienten gehört zu einem Musikstück, welches die meisten Übereinstimmungen mit dem Melodie- und/oder Textabschnitt MA aufweist, der in das Mobilfunkgerät 2 eingegeben wurde. Dieses Musikstück wird dann als das zugehörige identifizierte Musikstück ausgewählt und die zugehörigen Identifizierungsdaten ID werden von der Analyseeinrichtung 1 "online" an das Mobilfunkgerät 2 zurückgeliefert und dort beispielsweise auf dem Display ausgegeben.

Bei der dargestellten Vorgehensweise, bei der der Melodie- und/oder Textabschnitt MA direkt von einer Musikquelle 5 eingespielt wird, ist die Identifizierungsaufgabe insofern vereinfacht, als man im Gegensatz zu normalen Spracherkennungs- bzw. Mustererkennungsaufgaben hier davon ausgehen kann, dass Musikstücke immer mit fast derselben Geschwindigkeit abgespielt werden und somit zumindest ein festes gemeinsames Zeitraster zwischen dem zur Identifizierung eingegebenen Musik- und/oder Textabschnitt und dem jeweils richtigen, zur Auswahl stehenden Musikstück angenommen werden kann.

Figur 2 zeigt ein etwas anderes Verfahren, bei dem die Identifizierung "offline" durchgeführt wird.

Die Eingabe des zu identifizierenden Musikstücks bzw. eines Melodie- und/oder Textabschnitts MA dieses Musikstücks erfolgt auch hier über eine externe Musikquelle 5 in ein Mobilfunkgerät 2 des Benutzers und anschließende Versendung der Informationen an die Analyseeinrichtung 1. Auch die Art der Analyse durch vorherige Bestimmung eines den Melodie- und/oder Textabschnitt charakterisierenden Merkmalssatzes MS erfolgt wie im ersten Ausführungsbeispiel.

Anders als beim Ausführungsbeispiel gemäß Figur 1 wird hier jedoch das Ergebnis der Identifizierung nicht an das Mobilfunkgerät 2 des Nutzers zurückgesandt. Statt dessen wird dieses Ergebnis über das Internet per eMail oder als HTML-Seite an einen PC 3 des Benutzers bzw. an einen von ihm angegebenen PC oder eine eMail-Adresse gesendet. Neben den Identifizierungsdaten wird hier auch das jeweilige Musikstück MT selbst oder zumindest ein Abschnitt davon an den PC übertragen, so dass sich der Nutzer dieses Musikstück zur Verifikation anhören kann. Diese Musikstücke MT (bzw. die Abschnitte) sind gemeinsam mit den die Musikstücke charakterisierenden Merkmalssätzen im Speicher 4 gespeichert.

Zusätzlich können Bestellunterlagen für eine CD mit dem gesuchten Musikstück, Werbung sowie Zusatzinformationen versendet werden. Eine Zusatzinformation kann beispielsweise darin bestehen, dem Nutzer weitere Musiktitel anzubieten, die zu dem identifizierten Musiktitel ähnlich sind.

Die Ähnlichkeit wird hierbei über eine Abstandsmatrix AM ermittelt, wie sie in Figur 3 dargestellt ist. Die Elemente M dieser Abstandsmatrix AM sind hier Ähnlichkeitskoeffizienten, d.h. Werte, die ein Maß für die Ähnlichkeit zwischen zwei Musikstücken angeben. Selbstverständlich sind die Musikstücke zu sich selbst immer hundertprozentig ähnlich, so dass in den entsprechenden Feldern ein Wert von 1,0 eingetragen ist. Im vorliegenden Beispiel sind sich außerdem die Musikstücke mit dem Titel 1 und dem Titel 3 sowie mit dem Titel 5 besonders ähnlich. Dagegen ist ein Musikstück mit dem Titel 4 oder 6 zu dem Musikstück mit dem Titel 1 vollkommen unähnlich. Einem Nutzer, dessen Musikstück als Titel 1 identifiziert wurde, würden daher zusätzlich die Musikstücke Titel 3 und Titel 5 angeboten.

Eine solche Abstandsmatrix AM kann ebenfalls in dem Speicher 4 abgespeichert sein. Sie kann beispielsweise auf der Basis von subjektiven Hörexperimenten mit einer größeren Anzahl von Testhörern oder aufgrund der Analyse des Kaufverhaltens bestimmt werden.

Die Analyseeinrichtung 1 kann an beliebiger Stelle angeordnet sein. Sie muss lediglich die notwendigen Schnittstellen zur Verbindung mit üblichen Mobilfunkgeräten bzw. einen Internetanschluss aufweisen. Die Analyseeinrichtung 1 ist in den Figuren als ein zusammenhängendes Gerät dargestellt. Selbstverständlich können verschiedene Funktionen der Analyseeinrichtung1 auch auf verschiedene, entsprechend miteinander vernetzte Geräte verteilt werden. Die Funktionen der Analyseeinrichtung können großteils oder gegebenenfalls sogar vollständig auch in Form von Software auf geeigneten Rechnern bzw. Servern mit einer ausreichenden Rechen- und Speicherkapazität realisiert werden. Ebenso muss nicht ein einzelner zentraler Speicher 4 verwendet werden, in dem sich eine zusammenhängende Datenbank befindet, sondern es kann sich hierbei auch um eine Vielzahl von Speichern handeln, die an den verschiedensten Stellen positioniert sind und auf die die Analyseeinrichtung 1 beispielsweise über das Internet oder ein anderes Netzwerk zugreifen kann. Hier bietet es sich insbesondere an, dass verschiedene Musikproduktions- und/oder Vertriebsgesellschaften jeweils ihre Musikstücke in einer eigenen Datenbank hinterlegen und die Analyseeinrichtung auf diese verschiedensten Datenbanken Zugriff hat. Bei einer Reduzierung der charakterisierenden Informationen der verschiedenen Musikstücke auf Merkmalssätze sollte sinnvollerweise sichergestellt sein, dass die Merkmale jeweils mit dem gleichen Verfahren aus den Musikstücken extrahiert wurden und auf gleiche Weise Merkmalssätze zusammengestellt wurden, um auf diese Weise eine Kompatibilität zu erreichen.

Mit dem erfindungsgemäßen Verfahren ist es für einen Verbraucher auf einfache Weise möglich, die zum Erwerb der Wunschmusik benötigten Daten zu beschaffen und eine aktuell laufende Musik schnell zu identifizieren. Außerdem kann er mittels des Verfahrens über zusätzliche Musikstücke informiert werden, die ebenfalls seinem Musikgeschmack entsprechen. Für die Vertreiber von Musikstücken hat dieses Verfahren insoweit einen Vorteil, als den potentiellen Kunden genau diejenige Musik angeboten werden kann, die sie interessieren, und somit exakt die gewünschte Zielgruppe angesprochen wird.

Claims

Verfahren zur Identifizierung von Musikstücken mit folgenden Verfahrensschritten:

Eingabe zumindest eines Abschnitts (MA) einer Melodie und/oder eines Textes des zu identifizierenden Musikstücks in eine Analyseeinrichtung (1),

Ermittlung von Übereinstimmungen des Melodie- und/oder Textabschnitts (MA) mit der Analyseeinrichtung (1) bekannten Musikstücken (MT) oder Teilen davon,

Auswahl mindestens eines der bekannten Musikstücke (MT) anhand der ermittelten Übereinstimmungen, sofern ein definiertes Mindestmaß an Übereinstimmungen vorliegt,

Ausgabe von Identifizierungsdaten (ID) des ausgewählten Musikstücks (MT) und/oder Ausgabe zumindest eines Teils des ausgewählten Musikstücks (MT) selbst oder, sofern keines der Musikstücke (MT) ausgewählt wurde, Ausgabe einer entsprechenden Information.
Verfahren nach Anspruch 1,
dadurch gekennzeichnet, dass eine Mehrzahl von Musikstücken und/oder deren Identifizierungsdaten, für die die meisten Übereinstimmungen ermittelt wurden, ausgegeben werden und/oder zur Ausgabe angeboten werden.
Verfahren nach Anspruch 1 oder 2,
dadurch gekennzeichnet, dass zur Ermittlung der Übereinstimmungen bestimmte Merkmale des Melodie- und/oder Textabschnitts (MA) extrahiert werden, aus den ermittelten Merkmalen dann ein den Melodie- und/oder Textabschnitt (MA) charakterisierender Merkmalssatz ermittelt wird und dieser charakterisierende Merkmalssatz mit Merkmalssätzen (MS), die jeweils die bekannten Musikstücke (MT) charakterisieren, verglichen wird.
Verfahren nach Anspruch 3,
dadurch gekennzeichnet, dass zum Vergleich des charakterisierenden Merkmalssatzes des Melodie- und/oder Textabschnitts (MA) mit den in der Datenbank gespeicherten Merkmalssätzen (MS) jeweils Korrelationskoeffizienten zwischen den zu vergleichenden Merkmalssätzen ermittelt werden, deren Höhe die Übereinstimmungen zwischen den jeweiligen Merkmalssätzen repräsentieren.
Verfahren nach einem der Ansprüche 1 bis 4,
dadurch gekennzeichnet, dass der eingegebene Melodie- und/oder Textabschnitt oder ein von diesen extrahierter Text einer Spracherkennung zugeführt wird und in der Spracherkennung erkannte Worte und/oder Sätze mit Texten der verschiedenen Musikstücke verglichen werden.
Verfahren nach Anspruch 5,
dadurch gekennzeichnet, dass für die Spracherkennung die Sprache des eingegebenen Textabschnitts angegeben wird.
Verfahren nach einem der Ansprüche 1 bis 6,
dadurch gekennzeichnet, dass der Melodie- und/oder Textabschnitt (MA) von einem Nutzer in ein Kommunikationsendgerät (2) eingegeben wird und über ein Kommunikationsnetz an die Analyseeinrichtung (1) übermittelt wird und ein ausgewähltes Musikstück (MT) und/oder dessen Identifizierungsdaten (ID) an ein vom Nutzer bestimmtes Kommunikationsendgerät (2, 3) zur Ausgabe übermittelt wird.
Verfahren nach Anspruch 7,
dadurch gekennzeichnet, dass das Kommunikationsendgerät (2), in das der Melodie- und/oder Textabschnitt (MA) eingegeben wird, ein mobiles Kommunikationsendgerät (2) ist.
Verfahren nach Anspruch 7 oder 8,
dadurch gekennzeichnet, dass das ausgewählte Musikstück (MT) und/oder dessen Identifizierungsdaten (ID) zur Ausgabe an das Kommunikationsendgerät (2) zurückübermittelt wird, in das der Melodie- und/oder Textabschnitt (MA) eingegeben wird.
Verfahren nach einem der Ansprüche 1 bis 9,
dadurch gekennzeichnet, dass zusätzlich zu dem/den ausgewählten Musikstück/en und/oder den zugehörigen Identifizierungsdaten mindestens ein weiteres Musikstück und/oder dessen Identifizierungsdaten ausgegeben und/oder zur Ausgabe angeboten wird, das zu dem/den ausgewählten Musikstück/en ähnlich ist.
Verfahren nach Anspruch 10,
dadurch gekennzeichnet, dass die Ähnlichkeit zwischen zwei Musikstücken auf Basis von psychoakustischen Abstandsmaßen ermittelt wird
Verfahren nach Anspruch 10 oder 11,
dadurch gekennzeichnet, dass die Ähnlichkeit zwischen zwei Musikstücken auf Basis einer Abstandsmatrix (AM) ermittelt wird, die mit Hilfe von Hörexperimenten und/oder von Marktanalysen (Analyse des Kaufverhaltens) aufgestellt wurde.
Analyseeinrichtung (1) zur Durchführung eines Verfahrens gemäß einem der Ansprüche 1 bis 12, mit

Mitteln zur Eingabe zumindest eines Abschnitts (MA) einer Melodie und/oder eines Textes des zu identifizierenden Musikstücks,

einem Speicher (4) mit einer Datenbank mit verschiedenen Musikstücken oder Teilen davon, oder Mitteln zum Zugriff auf zumindest einen derartigen Speicher,

einer Vergleichereinrichtung zur Ermittlung von Übereinstimmungen des Melodie- und/oder Textabschnitts (MA) mit den verschiedenen Musikstücken (MT) oder den Teilen davon,

einer Auswahleinrichtung zur Auswahl mindestens eines der Musikstücke (MT) anhand der ermittelten Übereinstimmungen, sofern ein definiertes Mindestmaß an Übereinstimmungen vorliegt, und

Mitteln zur Ausgabe von Identifizierungsdaten (ID) des ausgewählten Musikstücks (MT) und/oder des ausgewählten Musikstücks (MT) selbst.
Analyseeinrichtung nach Anspruch 13,
dadurch gekennzeichnet, dass die Analyseeinrichtung Mittel zur Extraktion bestimmter Merkmale des Melodie- und/oder Textabschnitts (MA) und zur Ermittlung eines den Melodie- und/oder Textabschnitt (MA) charakterisierenden Merkmalssatzes aus den ermittelten Merkmalen aufweist und dass der Speicher (4) in einer Datenbank entsprechende Merkmalssätze (MS), die jeweils die Musikstücke (MT) charakterisieren, enthält.
Analyseeinrichtung nach Anspruch 13 oder 14,
dadurch gekennzeichnet, dass die Mittel zur Eingabe des Melodie- und/oder Textabschnitts ein Mikrofon umfassen und die Mittel zur Ausgabe der Identifizierungsdaten und/oder des ausgewählten Musikstücks einen akustische Ausgabeeinheit und/oder eine optische Ausgabeeinheit umfassen.
Analyseeinrichtung nach einem der Ansprüche 13 bis 15,
dadurch gekennzeichnet, dass die Mittel zur Eingabe des Melodie- und/oder Textabschnitts (MA) eine Schnittstelle zum Empfang entsprechender Daten von einem Endgerät (2) umfassen und die Mittel zur Ausgabe der Identifizierungsdaten (ID) und/oder des ausgewählten Musikstücks (MT) eine Schnittstelle zum Versenden entsprechender Daten an ein Endgerät (2, 3) umfassen.
Analyseeinrichtung nach einem der Ansprüche 13 bis 16,
gekennzeichnet durch Mittel zur Auswahl von weiteren Musikstücken, die zu dem ausgewählten Musikstück ähnlich sind.