DE10297802B4

DE10297802B4 - Verfahren, Speichermedium und System zum Suchen einer Sammlung von Medienobjekten

Info

Publication number: DE10297802B4
Application number: DE10297802T
Authority: DE
Inventors: Gregg D. Pacific Palisades Wilensky
Original assignee: Adobe Systems Inc
Current assignee: Adobe Inc
Priority date: 2002-09-30
Filing date: 2002-09-30
Publication date: 2011-05-19
Anticipated expiration: 2022-10-01
Also published as: US20170249338A1; US9684675B2; GB2407675A; US10915571B2; GB0503665D0; DE10297802T5; JP2006501565A; US20060074861A1; GB2407675B; WO2004031991A1; JP4523413B2

Abstract

Verfahren zum Suchen bzw. Durchsuchen einer Sammlung von Medienobjekten, umfassend:
ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, welches einer Mehrzahl von Referenz- bzw. Bezugsobjekten gemeinsam ist, um eine zusammengesetzte Bezugsinformation zu erzeugen, welche Kriterien für eine Suche repräsentiert; und
ein Vergleichen der zusammengesetzten Bezugsinformation mit Information, welche sich auf dasselbe Merkmal bezieht, für jeden entsprechenden einen aus einer Mehrzahl von Medienobjekten in einer Sammlung von Medienobjekten, um ein oder mehrere Medienobjekt(-objekte) zu identifizieren;
wobei eine nicht euklidische Funktion verwendet wird, um entweder die Information zu kombinieren, welche sich auf das Merkmal bezieht, oder um die zusammengesetzte Bezugsinformation mit Information zu vergleichen, welche sich auf dasselbe Merkmal bezieht.

Description

Hintergrund der Erfindung
Die vorliegende Erfindung bezieht sich auf ein Suchen bzw. Durchsuchen von Medienobjekten bzw. -gegenständen.
Elektronische Technologien zum Einfangen bzw. Erfassen, Speichern und Weiterleiten digitaler Objekte bzw. Gegenstände, wie beispielsweise Bildern, Audio- bzw. Ton- bzw. Klangdateien und Videos sind nun leicht verfügbar. Darüber hinaus hat die zunehmend allgemeine Verwendung dieser Technologien in großen Anzahlen von leicht erhältlichen Mediengegenständen resultiert. Leute stellen Bilder unter Verwendung von Digitalkameras, Zeichenprogrammen und Foto-Handhabungssoftware her. Sie erzeugen Videodateien mit tragbaren Videokameras und brennen CDs auf Heim-Unterhaltungsanlagen. Die resultierenden digitalen Objekte werden leicht kopiert und gespeichert und können sich leicht in einem Archiv ansammeln. Sie werden auch leicht im World Wide Web, oder Internet – beispielsweise durch Email oder auf einer Website – geteilt bzw. gemeinsam benutzt, wobei eher große Anzahlen von Medienobjekten bzw. -gegenständen vielen Leuten verfügbar macht.
Da die Anzahl und Zugänglichkeit von Mediengegenständen zunimmt bzw. ansteigt, kann es zunehmend schwierig werden, diese handzuhaben. Beispielsweise kann es, je größer ein Satz von Bildern wird, umso schwieriger sein, ein bestimmtes oder gewünschtes Bild zu finden. Eine Person kann beispielsweise versuchen, ein bestimmtes Bild durch Wiederaufrufen der bzw. Erinnern an die Zeit, zu der es erstellt wurde, oder des Verzeichnisses, wo es gespeichert wurde, zu finden. In ähnlicher Weise kann es, je größer der Zugriff bzw. Zugang zu Audio- und Videodateien ist, umso schwieriger sein, ein besonderes oder gewünschtes Lied oder einen Film zu finden. Eine Person kann beispielsweise versuchen, eine besondere Audio- oder Videoaufzeichnung durch Wiederaufrufen ihres Titels oder des Namens ihres Hauptdarstellers oder Schauspielers zu finden. Eine Verwendung derartiger Information über die Mediengegenstände zum Definieren der Suchabsicht kann problematisch sein, da es einer Person abverlangen kann, sich an Details über ein besonderes Objekt zu erinnern, um es zu finden.
Eine Person kann eine Sammlung von Mediengegenständen nach besonderen Merkmalen oder Aspekten durchsuchen, welche dem Gegenstand innewohnend bzw. inhärent sind – nicht nur damit assoziiert sind. Beispielsweise kann eine Person nach Bildern suchen, welche eine besondere Verteilung von Farben, Formen und Textur bzw. Beschaffenheit aufweisen, indem Parameters spezifiziert werden, welche diese Merkmale beschreiben. Eine Person kann versuchen, nach Bildern zu suchen, welche beispielsweise einen bestimmten Gegenstand oder eine Person beinhalten, indem ein Referenz- bzw. Bezugsbild zur Verfügung gestellt wird und nach Bildern gesucht wird, welche dazu ähnlich sind. Bestehende Bildsuchmaschinen vergleichen ein ausgewähltes Bezugsbild mit Bildern in einer Datenbank und reihen diese Bilder als mehr oder weniger ähnlich zur Referenz bzw. zum Bezug. Der Vorgang kann beispielsweise wiederholt werden, indem unterschiedliche Bezüge verwendet werden, um kleinere Subsätze der Datenbank zu durchsuchen.
Information über einen Mediengegenstand und Information von einem Bezugsobjekt bzw. -gegenstand stellen nützliche Basen bzw. Grundlagen zum Durchsuchen einer Datenbank zur Verfügung. Jedoch legen diese den Kriterien, die für eine Suche benützt werden können, Grenzen auf und charakterisieren nicht adäquat die Absicht des Suchenden.
Dokument US 5,579,471 A bezieht sich auf Suchanfragen in Bilddatenbanken, wobei Antworten sowohl visuelle Charakteristika von Bildern wie beispielsweise Farben, Textur, Form, Größe als auch verbale Tags, welche den Bilderen zugeordnet sind, umfassen.
Dokument US 6,366,296 B1 bezieht sich auf einem Medien-Browser, eine graphische Benutzeroberfläche und ein Verfahren zum browsen von Mediendateien, wobei ein Benutzer zumindest ein Merkmal in einer Mediendatei auswählt und ihm Informationen bezüglich der Existenz des ausgewählten Merkmals in der Mediendatei bereitgestellt werden.
Dokument US 6,192,150 B1 bezieht sich auf ein Verfahren und eine Vorrichtung, welche Text-Muster so aufeinander abbilden, daß die Muster invariant bezüglich ihrer Intensität, Skalierung und Ausrichtung bleiben.
Aufgabe der Erfindung ist es, Mehrdeutigkeiten beim Definieren einer Suchabsicht gegen eine Bildsuchmaschine zu reduzieren.
Diese Aufgabe ist entsprechend der Erfindung durch die Merkmale des Verfahrens gemäß Anspruch 1, des Speichermediums gemäß Anspruch 28 und des Systems gemäß Anspruch 29 gelöst. Bevorzugte Ausführungsformen der Erfindung sind Gegenstand der abhängigen Ansprüche.
Zusammenfassung der Erfindung
Die Erfindung stellt Techniken zum Spezifizieren von Suchkriterien durch Kombinieren von Bezugsmerkmalen zur Verfügung, um eine Mehrdeutigkeit beim Definieren einer Suchabsicht zu reduzieren. Im allgemeinen stellt die Erfindung in einem Aspekt Verfahren und Computerprogrammprodukte zur Verfügung, welche Techniken zum Kombinieren von Objekt- bzw. Gegenstandsinformation für eine Mehrzahl von Bezugsgegenständen bzw. -objekten implementieren, um zusammengesetzte Bezugsinformation zu erzeugen, welche Kriterien für eine Suche repräsentiert bzw. darstellt. Die zusammengesetzte Bezugsinformation wird mit Gegenstandsinformation für Mediengegenstände bzw. -objekte in einer Sammlung von Mediengegenständen verglichen, um einen oder mehrere Mediengegenstand(-gegenstände) in der Sammlung von Mediengegenständen zu identifizieren.
Vorteilhafterweise können Implementierungen der Verfahren und Computerprogrammprodukte eines oder mehrere der folgenden Merkmale beinhalten. Ein Mediengegenstand in der Sammlung von Mediengegenständen kann basierend auf dem Vergleich der Gegenstandsinformation und der zusammengesetzten Referenz- bzw. Bezugsinformation ausgewählt sein bzw. werden. Die Mehrzahl der Referenzobjekte bzw. Bezugsgegenstände kann durch eine Benutzer- bzw. Anwendereingabe spezifiziert sein. Die Mehrzahl von Bezugsgegenständen kann einen oder mehrere Gegenstand (Gegenstände) beinhalten, die einen Typ aufweisen, der ausgewählt wird aus: Audio bzw. Ton, Bild, Text, CD, Video. Gegenstandsinformation für unterschiedliche Typen bzw. Arten von Gegenständen kann kombiniert werden. Ein Kombinieren von Gegenstandsinformation kann ein Bestimmen des Schnitts bzw. Durchschnitts bzw. der Schnittmenge oder der Vereinigung der Gegenstandsinformation für die Bezugsgegenstände beinhalten.
Die Gegenstandsinformation kann Merkmale bzw. Eigenschaften der Bezugsgegenstände und der Mediengegenstände in der Sammlung von Medienobjekten charakterisieren. Die Merkmale können gewichtet sein bzw. werden, um eine relative Wichtigkeit der Merkmale zu spezifizieren. Ein Gewichten der Merkmale kann ein Aufnehmen bzw. Empfangen einer Benutzereingabe beinhalten, welche die relative Wichtigkeit der Merkmale anzeigt. Ein Merkmal kann durch die relative Frequenz eines Auftretens von jedem von verschiedenen bzw. mehreren Werten für das Merkmal repräsentiert sein bzw. werden. Der Satz von Merkmalen kann Farbinformation beinhalten, welche die relative Frequenz eines Auftretens von Farben in einem Gegenstand beschreibt. Ein Merkmal für eine erste Gegenstandsart kann zu einem Merkmal für einen zweiten Gegenstandstyp aufgezeichnet bzw. katalogisiert bzw. auf dieses abgebildet werden.
Die Techniken können ein Kombinieren von Gegenstandsinformation für einen zusätzlichen Bezugsgegenstand mit der zusammengesetzten Bezugsinformation beinhalten, um die zusammengesetzte Bezugsinformation zu revidieren bzw. zu überprüfen. Der zusätzliche Bezug kann ein Mediengegenstand sein, welcher durch ein Vergleichen der zusammengesetzten Bezugsinformation mit Gegenstandsinformation für Mediengegenstände identifiziert wird. Die revidierte zusammengesetzte Bezugsinformation kann mit Gegenstandsinformation für Mediengegenstände in der Sammlung von Mediengegenständen verglichen werden.
Ein Ähnlichkeitswert, welcher die Ähnlichkeit des Gegenstands mit der zusammengesetzten Bezugsinformation anzeigt, kann jedem der Mediengegenstände in der Sammlung von Mediengegenständen zugeordnet bzw. zugewiesen werden. Der Ähnlichkeitswert von jedem der Mediengegenstände in der Sammlung von Mediengegenständen kann geringer als ein oder gleich einem Ähnlichkeitswert sein, welcher für jeden Bezugsgegenstand berechnet ist bzw. wird. Die Mediengegenstände können entsprechend ihren Ähnlichkeitswerten gereiht werden und ein Mediengegenstand kann basierend auf seiner Reihung bzw. seinen Rang ausgewählt werden.
Die Gegenstandsinformation für jeden der Bezugs- und Mediengegenstände kann als ein Merkmalsvektor von Komponenten ausgedrückt sein bzw. werden, wobei jeder Merkmalsvektor eine oder mehrere Komponente(n) beinhaltet, welche ein Merkmal des entsprechenden Bezugs- oder Mediengegenstands repräsentiert (repräsentieren). Jeder Merkmalsvektor kann eine oder mehrere Komponente(n) beinhalten, welche Metadaten repräsentiert (repräsentieren), die mit dem entsprechenden Bezugs- oder Mediengegenstand assoziiert sind bzw. werden. Die Merkmalsvektoren der Mehrzahl von Bezugsgegenständen können kombiniert werden, um einen zusammengesetzten Bezugsvektor zu erzeugen bzw. herzustellen. Komponenten, die ein Merkmal eines Teils oder der Gesamtheit von jedem Bezugsgegenstand darstellen, können gemäß einer ersten Kombinationsfunktion kombiniert werden, und Komponenten, die Metadaten repräsentieren, welche mit einem Teil oder der Gesamtheit von jedem Bezugsgegenstand assoziiert sind, können gemäß einer zweiten Kombinationsfunktion kombiniert werden.
Ein Gewichtungsvektor, der die relative Wichtigkeit von einem oder mehreren Merkmal(en) spezifiziert bzw. bestimmt, kann beim Kombinieren der Merkmalsvektoren definiert und verwendet werden. Eine Min- oder Max-Funktion kann verwendet werden, um Merkmalsvektoren zu kombinieren. Der zusammengesetzte Bezugsvektor kann mit den Merkmalsvektoren von jedem der Mehrzahl von Mediengegenständen in der Sammlung von Mediengegenständen verglichen werden. Der zusammengesetzte Bezugsvektor kann mit den Merkmalsvektoren von jedem der Mediengegenstände unter Verwendung einer Min- oder Max-Funktion verglichen werden. Gegenstandsinformation für Bezugsgegenstände kann unter Verwendung einer Kombinationsfunktion kombiniert werden, und die zusammengesetzte Bezugsinformation kann mit Gegenstandsinformation für Mediengegenstände unter Verwendung einer Vergleichsfunktion verglichen werden, welche auf der Kombinationsfunktion basiert.
In einer Implementierung kann die Gegenstandsinformation Merkmale der Bezugsgegenstände und der Mediengegenstände in der Sammlung von Mediengegenständen charakterisieren und als ein Merkmalsvektor von Komponenten ausgedrückt sein bzw. werden; die Merkmalsvektoren der Mehrzahl von Bezugsgegenständen kann unter Verwendung einer Min- oder Max-Funktion kombiniert werden, um einen zusammengesetzten Bezugsvektor zu erzeugen, und der zusammengesetzte Bezugsvektor kann mit den Merkmalsvektoren von jedem Mediengegenstand in der Sammlung von Mediengegenständen unter Verwendung einer Min- oder Max-Funktion verglichen werden; und ein Ähnlichkeitswert, der die Ähnlichkeit des Merkmalsvektors des Mediengegenstands zu dem zusammengesetzten Bezugsvektor anzeigt, kann jedem Mediengegenstand in der Sammlung von Mediengegenständen zugeordnet bzw. zugewiesen werden, wo der Ähnlichkeitswert von jedem der Mediengegenstände in der Sammlung von Mediengegenständen kleiner als ein oder gleich einem Ähnlichkeitswert ist, welcher für jeden Bezugsgegenstand berechnet ist bzw. wird.
Im allgemeinen stellt die Erfindung in einem anderen Aspekt ein System zum Suchen bzw. Durchsuchen einer Sammlung von Mediengegenständen bzw. -objekten zur Verfügung. Das System beinhaltet Mittel zum Kombinieren von Objekt- bzw. Gegenstandsinformation für eine Mehrzahl von Referenzobjekten bzw. Bezugsgegenständen, um eine zusammengesetzte Bezugsinformation zu erzeugen, welche Kriterien für eine Suche repräsentiert, und Mittel zum Vergleichen der zusammengesetzten Bezugsinformation mit Gegenstandsinformation für Mediengegenstände in einer Sammlung von Mediengegenständen, um einen oder mehrere Mediengegenstand(-gegenstände) in der Sammlung von Mediengegenständen zu identifizieren.
Vorteilhafte Implementierungen des Systems zum Suchen bzw. Durchsuchen einer Sammlung von Mediengegenständen kann eines oder mehrere der folgenden Merkmale beinhalten. Das System kann Mittel zum Zuordnen eines Ähnlichkeitswerts, welcher die Ähnlichkeit des Gegenstands mit der zusammengesetzten Bezugsinformation anzeigt, zu jedem der Mediengegenstände in der Sammlung von Mediengegenständen beinhalten, wobei der Ähnlichkeitswert von jedem der Mediengegenstände in der Sammlung von Mediengegenständen kleiner als ein oder gleich einem Ähnlichkeitswert ist, welcher für jeden Bezugsgegenstand berechnet ist bzw. wird.
Die Gegenstandsinformation kann Merkmale der Bezugsgegenstände und der Mediengegenstände in der Sammlung von Mediengegenständen charakterisieren und kann als ein Merkmalsvektor von Komponenten ausgedrückt werden. Das System kann Mittel zum Kombinieren der Merkmalsvektoren der Mehrzahl von Bezugsgegenständen, um einen zusammengesetzten Bezugsvektor zu erzeugen, und Mittel zum Vergleichen des zusammengesetzten Bezugsvektors mit den Merkmalsvektoren von jedem der Mediengegenstände in der Sammlung von Mediengegenständen beinhalten.
Die Erfindung kann implementiert sein, um einen oder mehrere der folgenden Vorteile zu realisieren. Ein Anwender bzw. Benutzer kann Suchkriterien definieren, die die Suchabsicht des Anwenders beim Durchführen einer Suche eines Satzes von Mediengegenständen reflektieren. Ein Anwender kann Suchkriterien definieren, die die Suchabsicht des Anwenders reflektieren, selbst wenn die Absicht nicht durch einen Bezug oder durch Information definiert ist, welche mit Gegenständen assoziiert ist. Die Suchkriterien können durch Auswählen eines Satzes von Bezugsgegenständen definiert sein bzw. werden. Die Suchkriterien können automatisch definiert werden, wenn eine Auswahl von Bezugsgegenständen gegeben bzw. vorausgesetzt ist. Suchkriterien können als Gemeinsamkeiten oder der Schnitt bzw. Durchschnitt unter Gegenstände in einem Satz von Gegenständen definiert werden. Suchkriterien können als inklusive oder die Vereinigung von Merkmalen in einem Satz von Gegenständen definiert sein bzw. werden. Ein Anwender kann die Suchkriterien entsprechend der Suchabsicht des Anwenders verfeinern. Die Suchkriterien können neu definiert werden, indem ein Gegenstand zu einem Satz von Bezugsgegenständen hinzugefügt wird. Die Suchkriterien können entsprechend einer Kombination von Information für einen Satz von Bildern gewichtet werden. Ein Anwender bzw. Verwender kann unterschiedliche Typen bzw. Arten von Mediengegenständen verwenden, um die Suchkriterien zu definieren. Ein Anwender kann einen Typ eines Mediengegenstands unter Verwendung von Suchkriterien suchen, welche durch einen anderen Typ bzw. eine andere Art von Mediengegenstand definiert wurden.
Die Details von einer oder mehreren Implementierung(en) der Erfindung sind in den beigefügten Zeichnungen und der Beschreibung unten dargelegt. Andere Merkmale und Vorteile der Erfindung werden aus der Beschreibung, den Zeichnungen und den Ansprüchen verständlich werden.
Kurze Beschreibung der Zeichnungen
1 beschreibt ein Verfahren zum Suchen bzw. Durchsuchen unter Verwendung von mehrfachen bzw. Mehrfach-Bezugsgegenständen.
2 porträtiert die Verwendung eines Verfahrens zum Suchen unter Verwendung von mehrfachen Bezugsgegenständen durch einen Anwender bzw. Benutzer in einer Computerumgebung.
3 zeigt ein Verfahren zum Verwenden von mehrfachen Mediengegenständen, um zusammengesetzte Bezugsinformation zu erstellen bzw. zu erzeugen und Mediengegenstände zu suchen bzw. zu durchsuchen.
4 zeigt ein Verfahren zum Verwenden von Merkmalsvektoren von mehrfachen Mediengegenständen, um einen Bezugsvektor zu erzeugen und Mediengegenstände zu suchen.
5 zeigt einen Merkmalsvektor für einen Bildgegenstand und einen Merkmalsvektor für einen Audiogegenstand.
6 zeigt einen Merkmalsvektor für einen CD-Gegenstand und einen Merkmalsvektor für einen Videogegenstand.
7 zeigt die Anwendung der Min- und der Max-Funktion, um einen Satz von diskreten Komponenten von zwei Merkmalsvektoren zu kombinieren oder zu vergleichen.
8 zeigt die Anwendung der Min- und der Max-Funktion, um Komponenten von zwei Merkmalsvektoren zu kombinieren oder zu vergleichen, welche kontinuierliche bzw. stetige Funktionen annähern.
9 beschreibt ein Suchverfahren, welches Information für mehrfache Bezugsgegenstände kombiniert und mit ähnlicher Information für jeden von mehreren Mediengegenständen vergleicht.
Ähnliche Bezugszeichen in den verschiedenen Zeichnungen zeigen ähnliche Elemente an.
Detaillierte Beschreibung
Eine Sammlung von Mediengegenständen bzw. -objekten kann gesucht bzw. durchsucht werden, um einen besonderen Gegenstand oder Gegenstände in der Sammlung basierend auf Merkmalen eines Bezugsgegenstands bzw. -objekts zu identifizieren. Die Verwendung eines Bezugsgegenstands zum Suchen bzw. Durchsuchen einer Sammlung von Mediengegenständen ist, wenigstens teilweise, mehrdeutig, da die Merkmale von Interesse in dem Bezugsgegenstand häufig schlecht definiert sind oder unpassend im Hinblick auf ihre Wichtigkeit für die Suche gereiht sind. Beispielsweise ist es typischerweise unklar, welche Merkmale eines Bezugsgegenstands von Interesse sind. Selbst wenn Merkmale von Interesse spezifiziert sind, ist die relative Wichtigkeit von verschiedenen Aspekten der Merkmale, wie beispielsweise Farbe, Textur bzw. Beschaffenheit und Gestalt typischerweise undefiniert. Darüber hinaus beinhaltet der Bezug möglicherweise nicht Merkmale oder Aspekte, welche für einen Anwender bzw. Benutzer von Interesse sind.
Durch ein Verwenden von mehrfachen Bezügen zum Charakterisieren und Verfeinern von Suchkriterien kann die Mehrdeutigkeit, welche bei einem Verwenden eines Bezugsgegenstands, um die Suchkriterien zu definieren, inhärent ist, teilweise oder gänzlich gelöst werden. Mehrfache Bezugsgegenstände werden verwendet, um einen zusammengesetzten Bezug und, falls gewünscht, eine Gewichtung von Merkmalen zu erstellen bzw. zu erzeugen. Der zusammengesetzte Bezug und ein beliebiges Gewichten von Merkmalen sind definiert durch ein Evaluieren von Merkmalen der ausgewählten Bezugsgegenstände – beispielsweise durch ein Finden von Gemeinsamkeiten unter oder Unterschiedlichkeiten zwischen den ausgewählten Bezugsgegenständen. Der zusammengesetzte Bezug und/oder der Gewichtung kann weiter mit der Auswahl von zusätzlichen Bezugsgegenständen verfeinert werden. Auf diese Weise kann das Suchkriterium eingestellt werden, um besser eine Suchabsicht eines Anwenders auszudrücken oder zu reflektieren.
1 illustriert ein Verfahren zum Suchen einer Sammlung von Gegenständen basierend auf Merkmalen von mehrfachen Bezugsgegenständen. Zwei oder mehr Bezugsgegenstände sind bzw. werden ausgewählt (Schritt 2). Die Bezugsgegenstände können aus der Sammlung von Gegenständen ausgewählt werden, welche durchsucht werden sollen. Alternativ können die Bezugsgegenstände aus anderen Quellen ausgewählt werden, wie beispielsweise einer vordefinierten Sammlung von Bezugsgegenständen. Die Bezugsgegenstände können auch durch den Anwender zugeführt werden, wie beispielsweise durch ein Importieren eines erwünschten Bezugsgegenstands von einer externen Quelle, oder durch Erzeugen bzw. Erstellen des Bezugsgegenstands, z. B. unter Verwendung eines Zeichen- oder Malprogramms auf einem Computer. Die Bezugsgegenstände werden verwendet, um einen zusammengesetzten Bezug zu erzeugen (Schritt 4). Der zusammengesetzte Bezug kann beispielsweise Information über Merkmale beinhalten, welche den Bezugsgegenständen oder Merkmalen gemeinsam sind, welche in beliebigen der Bezugsgegenstände auftreten.
Eine Sammlung oder ein Satz von zu suchenden bzw. durchsuchenden Gegenständen ist bzw. wird identifiziert (Schritt 6). Beginnend mit einem ersten Gegenstand in der Sammlung (Schritt 8) wird der Gegenstand mit dem zusammengesetzten Bezug (Schritt 10) verglichen. Die Ergebnisse des Vergleichs, beispielsweise ein Maß einer Ähnlichkeit, werden typischerweise gesichert oder gespeichert (Schritt 11). Wenn es einen anderen Gegenstand (der JA-Zweig von Schritt 12) in der Sammlung von zu suchenden Gegenständen gibt, wird er mit dem zusammengesetzten Bezug verglichen (Schritte 14 und 10). Das Verfahren setzt fort, bis es keine Gegenstände (der NEIN-Zweig von Schritt 12) in der Sammlung von zu suchenden Gegenständen gibt.
Ein Gegenstand oder Gegenstände in der Sammlung von Gegenständen, welche definierte Suchkriterien wenigstens teilweise durch den zusammengesetzten Bezug erfüllen, kann (können) dann ausgewählt werden (Schritt 16), basierend beispielsweise auf der Ähnlichkeit oder Unähnlichkeit des Gegenstands oder der Gegenstände mit dem zusammengesetzten Bezug. Optional können einige oder alle der Gegenstände in der Sammlung gemäß ihrer Ähnlichkeit oder Unähnlichkeit zu dem zusammengesetzten Bezug gereiht werden. Der identifizierte Gegenstand oder die Gegenstände und die Reihung können einem Anwender repräsentiert bzw. dargestellt werden.
Wie in 2 gezeigt wird, sind die hierin beschriebenen Suchtechniken typischerweise in einer Computerumgebung implementiert. Beispielsweise verwendet ein Anwender bzw. Benutzer 50 einen Monitor 52, Lautsprecher oder eine andere Vorrichtung, um Information von einem Computer 54 zu empfangen. Der Computer kann beispielsweise ein Personal Computer oder ein Server in einem Netzwerk sein. Eine Sammlung 60 von Mediengegenständen wird im Speicher auf dem Computer 54, beispielsweise in einem Dateisystem oder einer Datenbank gehalten. Der Anwender 50 wählt zwei oder mehr Gegenstände 70, 72, 74 für eine Suche aus der Sammlung 60 aus. Die Gegenstände können von der Sammlung oder von einer anderen Quelle sein. Die Gegenstände können beispielsweise Bilder sein und der Anwender kann wünschen, ein Bild zu finden, welches bestimmte Merkmale mit den ausgewählten Bildern 70, 72, 74 teilt. Eine Zusammensetzung bzw. Zusammenstellung 76 der ausgewählten Gegenstände wird erstellt. Gegenstände in der Sammlung 60 werden dann mit der Zusammensetzung 76 verglichen und ein oder mehrere Bilder 80, 82 werden ausgewählt. Diese Bilder können beispielsweise die Gegenstände in der Sammlung sein, welche am ähnlichsten zu der Zusammensetzung sind. Die Bilder können dann dem Anwender 50 auf dem Computermonitor 52 angezeigt werden. Der Vorgang bzw. Prozeß kann wiederholt werden. Beispielsweise kann die Suche verfeinert werden, indem der zusammengesetzte bzw. -gestellte Bezug 76 oder einer der Anfangs-Bezugsgegenstände 70, 72, 74 und eines der Bilder 80, 82 verwendet werden, welche in der Suche identifiziert wurden.
Im allgemeinen ist der Zweck einer Suche unter Verwendung eines Bezugs, Gegenstände in einer Sammlung zu finden, welche irgendwie bzw. auf gewisse Weise zu dem Bezug ähnlich sind. Die Suche wird durch den Bezug bzw. die Referenz und eine Vergleichsfunktion spezifiziert, welche verwendet wird, um die Ähnlichkeit des Bezugs mit den gesuchten Gegenständen festzusetzen bzw. zu beurteilen. Der Bezug kann ein einzelner Gegenstand oder ein zusammengesetzter Bezug sein. Er beinhaltet wenigstens einige Merkmale oder Aspekte von Interesse, kann aber auch Merkmale beinhalten, welche nicht von Interesse sind. Die Vergleichsfunktion kann Gewichte spezifizieren, die die Balance von Merkmalen regeln bzw. steuern, welche beim Beurteilen der Ähnlichkeit betrachtet werden, und kann verwendet werden, um die Suche zu begrenzen oder zuzuschneiden. Beispielsweise kann die Vergleichsfunktion den Bereich bzw. Rahmen bzw. Umfang der Suche definieren, wie beispielsweise, ob sie global oder lokal ausgeführt werden soll, und kann Kriterien für eine Ähnlichkeit spezifizieren, wie beispielsweise den Bereich von Größen oder Ausrichtungen, welche als ähnlich betrachtet werden sollen. Bei der Suche wird die Ähnlichkeit der Gegenstände in der Sammlung zu dem Bezug gemäß der Vergleichsfunktion bestimmt. Die Gegenstände können als mehr oder weniger ähnlich zu dem Bezug gemäß ihren Ähnlichkeitswerten gereiht bzw. geordnet werden, so daß der Anwender beispielsweise den am meisten oder am wenigsten ähnlichen Gegenstand oder einen Satz von mehr oder weniger ähnlichen Gegenständen auswählen kann.
Eine Suche, die durch einen Bezug und eine Vergleichsfunktion definiert ist, kann dabei versagen, Gegenstände bereitzustellen, welche eine Suchabsicht eines Anwenders erfüllen, selbst wenn derartige Gegenstände in der Sammlung von gesuchten Gegenständen verfügbar sind. Die Suche kann fokussiert bzw. neu ausgerichtet oder verfeinert werden durch ein Kombinieren von Information für einen zusätzlichen Bezug mit dem vorhergehenden Bezug oder den vorhergehenden Bezügen. Diese Kombination erzeugt zusammengesetzte Bezugsinformation, wenn ein einzelner Bezug vorher verwendet wurde, und definiert zusammengesetzte Bezugsinformation neu, welche vorher verwendet war. Bezüge können beispielsweise kombiniert werden, um Merkmale von beliebigen davon zu beinhalten, oder um Merkmale zu spezifizieren, welche allen davon gemeinsam sind. Die Bezüge können auch verwendet werden, um ein Gewichten von Merkmalen zu definieren, und können verwendet werden, um eine neue Vergleichsfunktion zu definieren. Die zusammengesetzte Bezugsinformation, das Gewichten, wenn überhaupt, und die neue Vergleichsfunktion, wenn überhaupt, definieren neue Suchkriterien, die die Basis für eine neue Suche bilden.
Eine Sammlung von zu suchenden bzw. zu durchsuchenden Mediengegenständen kann Bildgegenstände oder -dateien beinhalten, wie auch Ton- bzw. Audiogegenstände oder -dateien, Textgegenstände oder -dateien, und Gegenstände oder Dateien, die Kombinationen von Medienarten beinhalten, wie beispielsweise Bild, Audio und Text. Typischerweise werden derartige Mediengegenstände digitale Daten beinhalten. Bildgegenstände können nach visuellen Merkmalen, wie beispielsweise besondere Gegenstände, Farbe, Textur bzw. Beschaffenheit und Gestalt gesucht werden. Audiogegenstände können nach Ton- bzw. Klangmerkmalen, wie beispielsweise besonderen Tönen bzw. Klängen oder Worten, Klangfarbe, Amplitude und Lautstärke gesucht werden. Ein Textgegenstand, wie beispielsweise ein elektronisches Buch, kann nach Sprachmerkmalen gesucht bzw. durchsucht werden, wie beispielsweise besonderen Worten oder Phrasen, Satzmustern oder grammatikalischen Strukturen.
Eine Kombination von Medien kann beispielsweise Audio-, Bild- und Textdaten beinhalten, und kann durchsucht werden beispielsweise nach Audio-, Bild- oder Textmerkmalen. Beispielsweise kann ein Video nach Merkmalen eines besonderen Bilds oder nach Merkmalen einer Stimme einer Person durchsucht werden. Das Video kann durchsucht werden, indem jeder Rahmen als ein getrenntes Bild behandelt wird und jeder Rahmen mit den gewünschten Bildmerkmalen verglichen wird. Auch kann beispielsweise ein Buch, welches sowohl Text und Bilder beinhaltet, nach Bildern durchsucht werden. Die Ähnlichkeit von jedem Bild in dem Buch zu den Bildmerkmalen kann bestimmt werden. Das Buch oder Video kann als mehr oder weniger ähnlich zu den Bildmerkmalen evaluiert werden, beispielsweise basierend auf einem oder mehreren Ähnlichkeitsmaßen der Bilder darin.
Medien von unterschiedlichen Arten können kombiniert werden, um Medien derselben oder unterschiedlichen Arten zu durchsuchen. Ein derartiges Mischen von Medien erfordert, daß die Mediengegenstände ähnliche oder analoge Merkmale aufweisen. Unterschiedliche Arten von Mediengegenständen können beispielsweise Merkmale aufweisen, welche nicht spezifisch für die Medienart sind, wie beispielsweise Muster, Variabilität bzw. Veränderlichkeit und Periodizität. Derartige Merkmale können kombiniert und verwendet werden, um Gegenstände ungeachtet von der Gegenstandsart zu durchsuchen. Merkmale von einem Typ bzw. Art können auch in Merkmale einer anderen Art übersetzt oder konvertiert bzw. umgewandelt werden.
Wie in 3 gezeigt wird, beinhaltet eine Sammlung oder ein Satz von Mediengegenständen 110 zwei oder mehr Mediengegenstände 111–114. Wenn es N Mediengegenstände M_a in dem Satz von Mediengegenständen gibt, dann {M_a} = {M₁, M₂, ... M_N). Ähnlich beinhaltet ein Satz von Bezugsgegenständen 120 einen oder mehrere Mediengegenstand(-gegenstände) 121–123. Wenn es Z Bezugsgegenstände, R_a, in dem Satz von Bezugsgegenständen gibt, haben wir {R_a} = {R₁, R₂, ... R_Z}. In diesem Fall sind Z Bezugsgegenstände kombiniert, um N Mediengegenstände zu suchen.
Information für jeden von zwei oder mehr Bezugsgegenständen 121–123 ist kombiniert, um eine zusammengesetzte Bezugsinformation, R_c 130 zu erzeugen. Die Information kann beispielsweise entsprechend einer Funktion von zwei Bezugsgegenständen, g(R_i, R_j) 132 kombiniert werden. Wenn es nur zwei Bezugsgegenstände, beispielsweise R_a und R_b 121–122, gibt, wird Information von jedem der zwei Bezugsgegenstände derart kombiniert, daß R_c = g(R_a, R_b). Wenn es mehr als zwei Bezugsgegenstände gibt, kann ihre Gegenstandsinformation in einer paarweisen Sequenz kombiniert werden. Beispielsweise kann Information für die Bezugsgegenstände R_a und R_b 121–122 kombiniert werden, um eine zusammengesetzte Bezugsinformation R_ab 25 derart zu erzeugen, daß R_ab = g(R_a, R_b). Die zusammengesetzte Bezugsinformation R_ab 125 kann dann mit Information über einen dritten Bezugsgegenstand, beispielsweise R_Z 123 kombiniert werden, um die zusammengesetzte Bezugsinformation R_c 130 derart zu erzeugen, daß R_c = g(R_ab, R_Z).
Information von einem zusätzlichen Gegenstand oder von anderen kombinierten Gegenständen kann zu bestehender zusammengesetzter Bezugsinformation hinzugefügt werden, um zu erlauben, daß Information für viele Bezugsgegenstände kombiniert wird. Mehr als eine Funktion kann verwendet werden, um Informationen von mehr als zwei Bezugsgegenständen 121–123 in dem Satz von Bezugsgegenständen 120 zu kombinieren. Gegenstandsinformation kann durch eine gewichtete Summe von Bezugsgegenstands-Information kombiniert werden. Wenn die Bezugsbilder nach Wichtigkeit gereiht sind, dann kann die Reihung als die Gewichte dienen. Gegenstands- bzw. Objektinformation für mehr als zwei Bezugsgegenstände kann direkt, beispielsweise durch Summieren, eher jedoch durch ein paarweises Anwenden der Funktion g, kombiniert werden.
Die zusammengesetzte Bezugsinformation 130 wird mit Information für jeden von zwei oder mehr Mediengegenständen 111–114 in der Sammlung oder dem Satz von Mediengegenständen 110 und der Verwendung einer Funktion G 134 verglichen. Die Funktion G bestimmt eine Ähnlichkeit, s 141–144, zwischen der zusammengesetzten Bezugsinformation und der Information für jeden Mediengegenstand. Die Ähnlichkeitswerte 141–144 können verwendet werden, um die assoziierten bzw. zugehörigen Mediengegenstände 111–114 als mehr oder weniger ähnlich zu der zusammengesetzten Information R_c 130 zu reihen, welche aus den Bezugsgegenständen 121–123 abgeleitet wurde.
Die Funktion G 134 kann Elemente beinhalten, welche ähnlich oder identisch zur Funktion g 132 sind, welche verwendet wird, um Information für zwei oder mehr Bezugsgegenstände zu kombinieren. Beispielsweise kann das Element g_s(M_i, R_c) der Funktion G ähnlich oder unähnlich zur Funktion g 132 sein. Auf diese Weise kann ein Anwender unabhängig die Kombination und Vergleichsfunktionen entsprechend der Suchabsicht des Anwenders maßschneidern. Beispielsweise kann ein Anwender Bezüge bzw. Referenzen kombinieren, um einen inklusiven Bezug zu erstellen, und dann nach Objekten suchen, welche genauer dem Bezug ähnlich sind. Auch kann beispielsweise ein Anwender eine Vergleichsfunktion auswählen, welche die Kombinationsfunktion vervollständigt bzw. ergänzt, beispielsweise durch Verwenden einer Vergleichsfunktion, welche auf der Kombinationsfunktion aufbaut.
Die Funktion G kann ein Gewichtungselement W_s 150 beinhalten. Das Gewichtungselement kann aus Information für einen oder mehrere der Bezugsgegenstände 121–123 abgeleitet werden, beispielsweise durch Kombinieren von Information über jeden von zwei oder mehr Bezugsgegenständen 121–123, entsprechend einer Funktion h(R_i, R_j) 152. Wenn es nur zwei Bezugsgegenstände gibt, beispielsweise R_a und R_b 121–122, wird Information für jeden der zwei Bezugsgegenstände derart kombiniert, daß W_S = h(R_a, R_b). Wenn es mehr als zwei Bezugsgegenstände gibt, kann ihre Gegenstandsinformation in einer paarweisen Sequenz, wie vorangehend beschrieben wurde, derart kombiniert werden, daß beispielsweise W_S = h(R_ab, R_Z), wo R_ab = h(R_a, R_b). Die Funktion h ist typischerweise identisch mit der Funktion g, in welchem Fall h(R_a, R_b) = g(R_a, R_b) und R_c = W_S.
Information, welche verwendet wird, um die Merkmale von Mediengegenständen zu charakterisieren, kann durch einen Satz von Parametern summiert bzw. zusammengefaßt werden. Beispielsweise kann Information, welche einen Mediengegenstand charakterisiert, als eine Serie von Werten in einem Vektor summiert werden, welcher als ein ”Merkmalsvektor” bezeichnet wird. Ein Merkmalsvektor beinhaltet vorzugsweise Information, welche durch ein Analysieren eines Teils oder der Gesamtheit eines Mediengegenstands mit einem oder mehreren besonderen analytischen Verfahren erzeugt oder abgeleitet ist. Ein Merkmalsvektor kann auch Information beinhalten, welche mit dem Gegenstand oder der Analyse des Gegenstands assoziiert ist. Eine derartige Information wird üblicherweise als Metadaten bezeichnet.
Ein Beispiel einer Suche, welche Merkmalsvektoren verwendet, um Information für mehrfache Bezüge zu kombinieren und einen Satz von Mediengegenständen zu suchen bzw. zu durchsuchen, wird in 4 gezeigt. Jeder Mediengegenstand 111–114 in einem Satz von Mediengegenständen 110 kann einen entsprechenden Merkmalsvektor V_M 211–214 aufweisen. Wenn es N Mediengegenstände M_a in einem Satz von Mediengegenständen gibt, haben wir {M_a} = {M₁, M₂, ... M_N} und N entsprechende Merkmalsvektoren V_M1, V_M2, ... V_MN. In ähnlicher Weise weist jeder Mediengegenstand 121–123 in einem Satz von Bezugsgegenständen 120 einen entsprechenden Merkmalsvektor V_R 221–223 auf. Wenn es X Bezugsgegenstände R_a in dem Satz von Bezugsgegenständen gibt, haben wir {R_a} = {R₁, R₂, ... R_X} und Z entsprechende Merkmalsvektoren V_R1, V_R2, ... V_RZ. Die Merkmalsvektoren für die Medien- und Bezugsgegenstände werden typischerweise dieselben oder ähnliche Komponenten aufweisen.
Die Merkmalsvektoren 221–223 entsprechend dem Satz 120 von Bezugsgegenständen 121–123 sind bzw. werden kombiniert, um einen zusammengesetzten Bezugsvektor 250 zu erzeugen. Die Merkmalsvektoren 221–223 können beispielsweise entsprechend einer Funktion von zwei Merkmalsvektoren f_c(V_i, V_j) 232 beispielsweise in einer paarweisen Art kombiniert sein, wie dies vorangehend für Information über Bezugsgegenstände beschrieben wurde.
Der zusammengesetzte Bezugsvektor 230 wird mit den Merkmalsvektoren 211–214 für jeden von zwei oder mehreren Mediengegenständen 111–114 in der Sammlung von Mediengegenständen 110 unter Verwendung einer Funktion, wie beispielsweise Tr[W_S·f_S(V_i, V_r)] 234, verglichen, wo Tr die Summe der Komponenten in dem Vektor [W_S·f_S(V_i, V_r)] anzeigt. Wenn es Z Komponenten c in jedem der Vektoren W_S, V_i und V_r gibt, dann Tr[W_Sf_s(V_i, V_r)] = Σ_(c=1..Z)[W_S[c]f_s(V_i[c], V_r[c])]. Beispielsweise, wenn [Werkstück·f_S(V_i, V_r)] = X und X weist Z Komponenten auf, dann Tr[W_S·f_S(V_i, V_r)] = TrX = X₁ + X₂ + X₃...X_Z. Betreffend die Funktion G 134, welche vorhergehend besprochen wurde, bestimmt die Funktion Tr[W_S·f_S(V_i, V_r)] 234 Ähnlichkeit s_i 141–144 zwischen dem zusammengesetzten Bezugsvektor und einem Merkmalsvektor für einen Mediengegenstand i 111–114. Die Ähnlichkeitswerte können verwendet werden, um die assoziierten bzw. zugeordneten Mediengegenstände 111–114 als mehr oder weniger ähnlich zu dem zusammengesetzten Bezugsvektor 230 zu reihen, welcher von den Merkmalsvektoren 221–223 der Bezugsgegenstände 121–123 abgeleitet wurde.
Die Funktion Tr[W_S·f_S(V_i, V_r)] 234 kann Elemente beinhalten, welche ähnlich oder identisch zu Elementen der Funktion W_c·f_c(V_i, V_j) 232 sind. Beispielsweise kann es sein, daß f_s(V_i, V_r) = f_c(V_i, V_j). Die Funktion T_r[W_S·f_s(V_i, V_r)] 234 kann auch ein Gewichtungselement W_S 250 beinhalten. Das Gewichtungselement kann von den Merkmalsvektoren 221–223 für einen oder mehrere der Bezugsgegenstände 121–123 abgeleitet sein bzw. werden. Ein Gewichtungselement kann beispielsweise gemäß einer Funktion von zwei Merkmalvektoren W_w·f_w(V_i, V_j) 252 abgeleitet sein, welche in einer paarweisen wiederholenden Weise angewendet werden, wie dies vorhergehend beschrieben wurde, um die Merkmalsvektoren für mehrfache Bezugsgegenstände zu kombinieren.
Die Funktion W_w·f_w(V_i, V_j) 252 kann Elemente beinhalten, welche ähnlich oder identisch zu Elementen der Funktionen W_c·f_c(V_i, V_j) 232 oder T_r[W_s·f_s(V_i, V_r)] 234 sind. Beispielsweise kann es sein, daß f_w(V_i, V_j) = f_c(V_i, V_j) oder f_w(V_i, V_j) = f_s(V_i, V_r). In ähnlicher Weise kann es sein, daß W_w = W_c oder W_s = W_c.
Die Merkmalsvektoren für Mediengegenstände, welche Bezugsmediengegenstände beinhalten, werden nun detaillierter besprochen werden. Ein Merkmalsvektor ist typischerweise ein eindimensionaler Vektor von Komponenten. Beispielsweise ist der Merkmalsvektor V eine Serie von W Komponenten, so daß V = {V₁, V₂, ... V_W}.
Wie in 5 gezeigt wird, kann ein Merkmalsvektor 300, 302; 350, 352 Sätze von Komponenten 310, 301–314; 321, 330–334 beinhalten. Die Komponenten eines Merkmalsvektors können in Sätzen und Subsätzen gemäß beispielsweise der Art von Information der Komponenten oder des Verfahrens gruppiert sein, durch welche die Komponenten erzeugt oder abgeleitet wurden. Beispielsweise die ersten 1000 Komponenten eines Merkmalsvektors können von einer Analyse des Mediengegenstands abgeleitet sein und die letzten 3 Komponenten des Merkmalsvektor können Information sein, welche mit dem Mediengegenstand assoziiert ist. In diesem Beispiel können die ersten 1000 Komponenten beispielsweise aus einem Bestimmen der Proportion des Bilds abgeleitet sein, das ist jede von 1000 Farben, und die letzten 3 Komponenten können beispielsweise das Datum und die Zeit sein, zu dem (der) der Gegenstand erzeugt wurde, und der Dateiname des Gegenstands.
Komponenten von einigen Sätzen können von dem Mediengegenstand abgeleitet werden. Beispielsweise kann ein Merkmalsvektor für einen Bildgegenstand Sätze von Komponenten beinhalten, welche Textur bzw. Beschaffenheit T 310, Farbe C 311 und Gestalt S 311 beschreiben, von denen jeder durch Analyse von einigen oder der Gesamtheit der Bilddaten abgeleitet wurde. Auch als Beispiel kann ein Merkmalsvektor 350, 352 für einen Audiogegenstand Sätze von Komponenten beinhalten, welche eine Fourier-Transformations-Information F 330 Elementarwellen-Dekompositions-Information W 331 und Fraktalmaße Fr 322 beschreiben, von welchen jede durch Analyse von einigen oder der Gesamtheit der Audiodaten abgeleitet wurde. Ein Merkmalsvektor kann Komponenten beinhalten, welche aus der Analyse von mehr als einer Art von Medien in dem Gegenstand abgeleitet wurden. Beispielsweise kann ein Merkmalsvektor für einen audio-visuellen Gegenstand fraktale Maße beinhalten, welche aus der Analyse von kombinierten Audio- und visuellen Teilen oder Aspekten des Gegenstands abgeleitet wurden.
Komponenten von anderen Sätzen können Information, welche mit dem Bild oder Audiogegenstand assoziiert ist, oder Metadaten beinhalten. Beispielsweise kann ein Satz D 313, 330 den Dateinamen und das Datum und die Zeit beinhalten, zu welcher der Bild- oder Audiogegenstand erzeugt kopiert oder gespeichert wurde, und der Satz M 314, 334 kann Information über die Analysen beinhalten, welche verwendet wurden, um die Komponenten in anderen Sätzen abzuleiten.
Die Anzahl von Komponenten in einem Merkmalsvektor 300, 350 ist die Summe der Anzahl von Komponenten in jedem Satz von Komponenten in dem Merkmalsvektor. Beispielsweise weist, wenn es J, K, L, 2 und D Komponenten in Sätzen T, C, S, A und M jeweils gibt, dann weist der Merkmalsvektor 300 J + K + L + 2 + D Komponenten auf. D. h., V_i = {T_i(i = 1...J), C_i(i = J + 1...J + K), S_i(i = J + K + 1...J + K + L), A_i(i = J + K + L + 1...J + K + L + 2), M_i(i = J + K + L + 3...J + K + L + 2 + D)}. In ähnlicher Weise weist, wenn es U, V, W, 2 und D Komponenten in Sätzen F, W, Fr, A und M jeweils gibt, dann der Merkmalsvektor 350 U + V + 2 + D + W Komponenten auf.
Verschiedene numerische und statistische Verfahren können verwendet werden, um die Komponenten in einem Satz in dem Merkmalsvektor eines Bildgegenstands abzuleiten oder zu erstellen bzw. zu erzeugen. Die Verfahren, welche verwendet werden, können von der Art von Daten in dem Gegenstand abhängen. Beispielsweise können Bildgegenstände Rastergraphiken und Rasterdaten oder Vektorgraphiken und Vektordaten enthalten. Vektordaten können verwendet werden, um Komponenten zu erzeugen, welche beispielsweise die Anzahl von Gegenständen und Takten bzw. Strichen in dem Bild oder die Anzahl von bestimmten Spezialeffekten in dem Bild beschreiben.
Im Gegensatz zu Vektordaten müssen Rasterdaten segmentiert oder auf andere Weise analysiert sein bzw. werden, um Gegenstände oder Gestalten bzw. Formen in einem Bild zu identifizieren. Formen können beispielsweise bestimmt werden, indem Bereiche bzw. Regionen von ungefähr gleichbleibender Farbe bestimmt werden. Rechtwinkelige bzw. rechteckige Gestalten bzw. Formen können unter Verwendung des Verfahrens gefunden werden, welches in US-Patent Nr. 6,298,157 beschrieben wurde, ”Auffinden und Ausrichten von eingebetteten Bildern”, welches hiermit durch Bezug in seiner Gesamtheit miteinbezogen bzw. aufgenommen ist. Ein Rasterbild kann beispielsweise, durch ein Aus- bzw. Flutfüllen von Bereichen ähnlicher Farbe und Beschaffenheit, segmentiert sein, wobei Strafen für ein Schneiden bzw. Kreuzen von Kanten bzw. Rändern auferlegt sind.
Komponenten in einem Gestalt- bzw. Formsatz S 312 eines Raster- oder Vektorbildgegenstands können erzeugt oder abgeleitet werden, indem Gestalten bzw. Formen in dem Bild gefunden oder definiert werden und dann Gestalt- bzw. Formcharakteristika bzw. -merkmale für jede Gestalt bzw. Form gemessen werden. Gestaltcharakteristika können beispielsweise Maße einer Symmetrie, Elliptizität oder Plattheit bzw. Gestrecktheit beinhalten. Formcharakteristika können beispielsweise als die fraktale Dimension des Umfangs oder einfacher, als eine Liste bzw. Auflistung von Punkten entlang der Kurve des Umfangs der Gestalt oder eine Auflistung von anliegenden Winkeln entlang des Umfangs definiert werden.
Komponenten in dem Farbsatz C 311 eines Bildgegenstands können erzeugt oder abgeleitet werden, indem das Bild entsprechend einem oder mehrerer Farbräume analysiert wird. Ein Farbraum stellt eine Datendarstellung für einen Bereich von Farben im Hinblick auf grundlegende Farbkomponenten (oder ”Färbemittel”) zur Verfügung. Die bestimmten Färbe- bzw. Farbmittel hängen von dem verwendeten Farbsystem ab. Beispielsweise werden in dem CMYK-Farbsystem Farben als Kombinationen von Werten für Cyan (C), Magenta (M), Gelb (Y) und Schlüssel (K) (im allgemeinen schwarz) repräsentiert bzw. dargestellt; in einem RGB-Farbsystem werden Farben als Kombinationen von Werten für Rt (R), Grün (G) and Blau (B) repräsentiert; und in dem HSB-Farbsystem werden Farben als Kombinationen von Werten für Farbton (H), Sättigung (S) und Helligkeit (B) repräsentiert.
Farbkomponenten können beispielsweise Maße für die mittlere und Standardabweichung von Farben in dem Bild beinhalten, oder eine Liste bzw. Auflistung der dominanten oder gebräuchlichsten Farben. Farbkomponenten können eine Frequenzverteilung von Farben oder die Entropie einer derartigen Verteilung beschreiben. Farbkomponenten können die Produkte von räumlichen Koordinaten mit Farbe beinhalten. Beispielsweise können Komponenten durch <r C> definiert sein, wo r der Vektor der räumlichen Abmessungen ist und C der Vektor der Farbdimensionen ist. <r C> ist definiert als 1/RΣ_r=1...R(r_iC_a(r)), wo R Orte r sind, und wo r_i eine der räumlichen Koordinaten bei r ist und C_a(r) eine der Farbdimensionen für die Farbe bei r ist. Derartige Produkte können höhere räumliche Frequenzen beinhalten, beispielsweise <r r C> = 1/RΣ_r=1...R(r_ir_jC_a(r)) oder <r r r C>. Komponenten können die mittlere und Standardabweichung für die Produkte von räumlichen Koordinaten mit Farbe beinhalten.
In einer Frequenzverteilung von Farben kann beispielsweise jede der Komponenten in dem Satz C 311, p(C_i), die Frequenz eines Auftretens in dem Bild von einer der K Farben repräsentieren. D. h., jede Komponente kann den teilweisen bzw. Bruchteilsbereich des durch eine Farbe C_i abgedeckten Bilds beschreiben. Beispielsweise kann ein Bild in fünf Farben derart aufgeteilt sein, daß ein Fünftel des Bilds eine Farbe ist, ein Zehntel eine andere Farbe ist, drei Zehntel eine dritte sind, drei Zehntel eine vierte Farbe sind, und ein Zehntel eine fünfte Farbe ist. Der Satz C für ein derartiges Bild ist {0,2, 0,1, 0,3, 0,3, 0,1}. Der Satz C kann als ein Frequenz-Plot 500 betrachtet werden, wie dies in 7 gezeigt wird.
Für Rasterdaten ist ein Bild aus Pixeln bzw. Bildpunkten hergestellt und jedes Pixel r ist von einer bestimmten Farbe C(r). Die Farbe wird typischerweise durch eine Serie von Bits (dem ”Farbwert”) repräsentiert, wobei bestimmte Bits den Betrag von jedem Farbmittel bzw. Farbstoff anzeigen, das (der) in der Farbe verwendet wird, wie dies vorhergehend diskutiert wurde. Der Wert p(C_i) kann als die Anzahl von Pixeln der Farbe i dividiert durch die Gesamtanzahl von Pixeln R berechnet werden. Das heißt: p(C_i) = 1/R Σ_r=1...RΔ(C_i, C(r)), wo
Δ(C_i, C(r)) = 1, wenn für C(r) gefunden wurde, daß es gleich wie die Farbe C_i ist, und
0, wenn C(r) nicht gefunden wurde, gleich zu sein wie die Farbe C_i.
In diesem Beispiel ist die Summe der p(C_i) über alle möglichen Farben in einem Bild eine Einheit: Σ_i=1...Kp(C_i) = 1.
Jedoch sind Funktionen, welche nicht die Eigenschaft eines Summierens zu einer Einheit aufweisen, möglich und können ebenfalls verwendet werden. Beispielsweise kann die Funktion p(C_i) = Σ_r=1...RΔ(C_i, C(r)), für welche Σ_i=1...Kp(C_i) = R verwendet werden. Auch kann zum Beispiel ein unvollständiger Satz von Eigenschaften verwendet werden. Beispielsweise kann ein Farbraum in K Farben aufgeteilt werden, jedoch kann Information für nur einige H von diesen Farben kann in dem Merkmalsvektor enthalten sein. D. h., wenn Σ_i=1...Kp(C_i) = 1, kann der Merkmalsvektor nur C_i beinhalten, wo i = 1...H und H < K, so daß Σ_i=1...Hp(C_i) < 1.
Für Vektordaten kann eine ähnliche Farbverteilungstabelle durch andere Mittel hergestellt werden. Beispielsweise kann ein Gitter bzw. Raster auf den Daten aufgezeichnet werden und jede Zelle in dem Gitter kann dann behandelt werden, wie ein Pixel behandelt werden würde, um die Farbverteilung zu berechnen. Auch kann beispielsweise das Bild in konstante Farbbereiche bzw. Regionen konstanter Farbe unterteilt oder abgeflacht werden, und Einträge können in der Farbverteilungstabelle im Verhältnis zur Größe der Bereiche bzw. Regionen der entsprechenden Farbe angeordnet werden. In noch einem anderen Beispiel kann eine Farbverteilung aus der Verteilung von Zeilen bzw. Linien und Füllfarben von individuellen Vektorgegenständen in dem Bildgegenstand hergestellt bzw. erzeugt werden.
Komponenten in einem Textursatz T 310 eines Raster- oder Vektorbildgegenstands können erzeugt oder abgeleitet werden, indem beispielsweise die statistischen Momente von Gabor-Filter-Werten für die Bilddaten berechnet werden. Eine derartige Analyse fängt Kanten- bzw. Eckeninformation in dem Bild ein. Texturkomponenten können fraktale Maße des Bilds sein. Texturkomponenten können auch Koeffizienten für eine Grundwellenzerlegung oder Fourier-Transformation der Bilddaten sein, oder die Mittelwerte und Standardabweichungen der Koeffizienten. Korrelationen zwischen Farbkomponenten an zwei oder mehreren Stellen können als Texturkomponenten verwendet werden.
Numerische und statistische Verfahren beinhaltend jene, welche verwendet wurden, um die Komponenten in einem Merkmalsvektor eines Bildgegenstands abzuleiten oder zu erzeugen, können verwendet werden, um die Komponenten in einem Merkmalsvektor 320 eines Audiogegenstands abzuleiten oder zu erstellen bzw. zu erzeugen. Merkmale können für die Audiospur insgesamt bzw. als Ganzes berechnet werden oder für jedes von zwei oder mehreren Segmenten der Spur. Die Komponenten von F 330 können beispielsweise von einer Fourier-Transformation bzw. -Transformierten der Audiodaten abgeleitet werden. Die Komponenten von W 331 können beispielsweise von einer Wavelet- bzw. Grundbildzerlegung der Audiodaten abgeleitet werden. Die Komponenten von Fr 332 können beispielsweise die fraktale Dimension der Daten sein, oder die Standardabweichung der fraktalen Dimension. Komponenten in dem Merkmalsvektor eines Audiogegenstands können eine Leistungsverteilung von Audiofrequenzen beinhalten, ähnlich zur Verteilung von Farbe, wie dies vorhergehend besprochen wurde.
Wie in 6 gezeigt wird, kann ein Merkmalsvektor 400, 401 für einen Mediengegenstand, welcher sowohl Bild- als auch Audioinformation beinhaltet, wie beispielsweise eine Compact Disk oder CD einen Satz von Bildkomponenten 403 und einen Satz von Audiokomponenten 404 ebenso wie Komponenten beinhalten, die den Gegenstand in seiner Gesamtheit beschreiben, wie dies vorhergehend beschrieben wurde. Die Bildkomponenten können Komponenten und Sätze von Komponenten 310–314 wie für einen Bildgegenstand beinhalten, wie dies vorhergehend diskutiert wurde, und die Audiokomponenten können Komponenten und Sätze von Komponenten 330–334 wie für einen Audiogegenstand beinhalten, wie dies vorhergehend diskutiert wurde.
Ein Merkmalsvektor 420, 422 für einen Videogegenstand kann mehrfache bzw. Mehrfachsätze von Bildkomponenten 423 und Audiokomponenten 424 beinhalten. Beispielsweise kann, der Merkmalsvektor einen Satz von Bildkomponenten für Schlüssel- bzw. Hauptrahmen in dem Video beinhalten. Es kann Komponenten geben, welche zeitweilige bzw. temporäre Beziehungen unter Bildern beschreiben, wie beispielsweise die Anzahl von Szenenwechseln und ihre Dauer. Ein Maß eines optischen Flusses kann verwendet werden, um den Betrag bzw. die Menge einer Bewegung in dem Video zu beschreiben; dieses Maß kann beispielsweise verwendet werden, um Überwachungsbänder mit Aktivität von jenen ohne Aktivität zu unterscheiden. Ein Merkmalsvektor für ein Video kann auch Komponenten 433 beinhalten, welche von einem Teil oder der Gesamtheit des Gegenstands abgeleitet wurden, wie dies vorhergehend diskutiert wurde, und Metadaten 434 für einen Teil oder die Gesamtheit des Gegenstands.
Ähnliche Verfahren können verwendet werden, um die Merkmalsvektorkomponenten von unterschiedlichen Arten von Mediengegenständen oder unterschiedlichen Segmenten von einem Kombinationsmediengegenstand abzuleiten oder zu erzeugen. Beispielsweise können eine Cepstral-Zerlegung, in welcher beispielsweise Fourier- oder Wavelet- bzw. Grundwellenfrequenz-Komponenten, welche über ein örtliches Zeitfenster genommen werden, als eine Funktion der Zeit (d. h., Anordnung in der Audiospur) graphisch dargestellt bzw. geplottet werden, verwendet werden, um ein zweidimensionales ”Bild” des Audiosignals zu erzeugen. Ein derartiger zweidimensionaler Audiogegenstand kann dann mit Komponenten wie für einen Bildgegenstand beschrieben werden. Beispielsweise kann ein Audiotexturmerkmal durch eine Grundwellenzerlegung des zweidimensionalen Audiogegenstands oder Segments hergestellt werden, während ein Bildtexturmerkmal durch eine Grundwellenzerlegung eines Bildgegenstands oder Segments hergestellt werden kann. Die zeitweiligen bzw. temporären Frequenzen des Audiogegenstands können dann auf den räumlichen Frequenzen des Bilds aufgezeichnet werden. Mit einer geeigneten Auswahl von Maßstäben können Merkmale, welche für Audio- und Bildgegenstände oder -segmente erstellt wurden, kombiniert und verglichen werden.
Ein Merkmalsvektor für einen Textgegenstand kann Komponenten beinhalten, welche den gesamten Text oder Teile davon, beispielsweise Kapitel oder Absätze bzw. Paragraphen charakterisieren. Die Komponenten können von statistischen Maßen von Teilen des Texts abgeleitet werden, wie beispielsweise das Zusammentreffen bzw. gleichzeitige Antreffen von Wahrscheinlichkeiten von semantischen Konzepten oder Worten, beispielsweise unter Verwendung von Bigrammen, Trigrammen, usw. Text kann auf einen semantischen Baum aufgezeichnet bzw. katalogisiert werden, welcher als das Merkmal verwendet wird.
Komponenten in dem Merkmalsvektor eines Textgegenstands können eine Verteilung von Frequenzen von Worten oder anderen Konstrukten beinhalten, analog bzw. ähnlich zur Verteilung von Farbe, wie dies vorhergehend besprochen bzw. diskutiert wurde. Verfahren bzw. Methoden, welche zu diesen ähnlich sind, und andere, welche vorangehend beschrieben wurden, können verwendet werden, um Komponenten für Merkmalsvektoren von anderen Arten von Medien abzuleiten oder zu erzeugen.
Die Funktionen 232, 234 zum Kombinieren und Vergleichen von Merkmalsvektoren werden nun in größerem Detail beschrieben werden. Diese Funktionen 232, 234 beinhalten typischerweise eine Funktion f von zwei Merkmalsvektoren, können aber eine Funktion von mehr als zwei Merkmalsvektoren beinhalten. Die Funktion f evaluiert typischerweise eine oder mehrere Komponente(n) der Merkmalsvektoren. Typischerweise findet die Funktion keinen euklidischen Abstand zwischen zwei oder mehreren Vektoren. Die Funktion repräsentiert eine Kombination der Merkmale, welche durch die Merkmalsvektoren beschrieben sind bzw. werden. Beispielsweise kann die Funktion den Schnitt oder die Vereinigung von Merkmalen annähern. Die Funktion kann andere, nicht euklidische Kombinationen von Merkmalen ebenfalls annähern. Zwei Beispiele einer derartigen Funktion werden nun in größerem Detail diskutiert werden.
Wie in 7 gezeigt wird, können die Komponenten von zwei Merkmalsvektoren 500, 510 kombiniert oder verglichen werden, beispielsweise durch Bestimmen von deren gemeinsamen Minimums, Min 520, oder gemeinsamen Maximums, Max 530. In diesem Beispiel werden die Komponenten in dem Satz C der Merkmalsvektoren V₁ 500 und V₂ 510 skaliert, um von 0 bis 1 zu reichen, wie dies vorhergehend diskutiert wurde. Für V₁ 500, C = {0,2, 0,1, 0,3, 0,3, 0,1), wobei dies anzeigt bzw. andeutet, daß ein Fünftel des ersten Bilds C₁ ist, ein Zehntel C₂ ist, drei Zehntel C₃ sind, drei Zehntel C₄ sind, und ein Zehntel C₅ ist. Die Summe der Komponenten ist 1,0, da alle Farben in dem ersten Bild tabellarisch angeordnet bzw. tabuliert wurden. Für V₂ 510, C = {0,2, 0,1, 0,3, 0,1, 0,3}, wobei dies anzeigt, daß ein Fünftel des zweiten Bilds C1 ist, ein Zehntel C2 ist, drei Zehntel C3 sind, ein Zehntel C4 ist und drei Zehntel C5 sind. Die Summe der Komponenten ist 1,0, da alle Farben in dem zweiten Bild tabellarisch angeordnet wurden.
Eine Min-Funktion bestimmt den Schnitt der Sätze oder Funktionen, welche durch zwei Vektoren definiert sind. Die Vektoren V₁ und V₂ werden kombiniert oder verglichen unter Verwendung einer ”Min” 520 Funktion durch ein Bestimmen des kleineren der Werte für die zwei Vektoren für jede Komponente. Beispielsweise ist der Wert von C₄ für V₁ 0,3 und der Wert von C₄ für V₂ ist 0,1. Der kleinere Wert 0,1 ist in dem resultierenden Kombinations- oder Vergleichsvektor V_N 521 dargestellt. In diesem Beispiel weist der Kombinations- oder Vergleichsvektor V_min = V_N, C = {0,2, 0,1, 0,3, 0,1, 0,1) auf. Für einen sehr großen Satz können die Komponenten von C eine stetige bzw. kontinuierliche Funktion 600, 610 annähern, wie in 8 gezeigt wird. Die Anwendung einer Min-Funktion 620 an zwei versetzten und ungefähr normalen Funktionen 600, 610 erzeugt eine mit einer Spitze versehene Kurve 621, welche den Bereich einer Überlappung der zwei Funktionen darstellt.
Eine Max-Funktion bestimmt die Vereinigung der Sätze oder Funktionen, welche durch zwei Vektoren definiert sind. Die Vektoren V₁ und V₂ werden kombiniert oder verglichen unter Verwendung einer ”Max” 530-Funktion durch Bestimmen des größeren der Werte für die zwei Vektoren für jede Komponente. Beispielsweise ist der Wert von C₅ für V₁ 0,1 und der Wert von C₅ für V₂ ist 0,1. Der größere Wert 0,3 ist in dem resultierenden Kombinations- oder Vergleichsvektor 531 repräsentiert. In diesem Beispiel weist der Kombinations- oder Vergleichsvektor V_max = V_X, C = {0,2, 0,1, 0,3, 0,3, 0,3} auf Für einen sehr großen Satz von Komponenten, welche eine stetige Funktion 600, 610 annähern, wie in 8 gezeigt wird, erzeugt die Anwendung einer Max-Funktion 630 an zwei versetzten und annähernd normalen Funktionen 600, 610 eine bimodale oder abgeflachte Kurve 631. Die bimodale oder abgeflachte Kurve repräsentiert den kombinierten Bereich unter den zwei Funktionen.
Die Min- oder Max-Funktion können an Merkmalsvektoren oder Sätze in Merkmalsvektoren angewendet werden, welche fortlaufend valuierte bzw. bewertete Komponenten aufweisen. D. h., die Verwendung von derartigen Funktionen erzeugt aussagekräftige Resultate, wenn die Stärke von jeder Komponente, an welche sie angewendet wird, monoton mit dem Wert der Komponente zunimmt oder abnimmt. Jede Wahrscheinlichkeits-Verteilung erfüllt dieses Kriterium, so daß die Anwendung der Min- oder Max-Funktion aussagekräftige Resultate erzeugt.
Andere Komponenten können dieses Kriterium erfüllen. Beispielsweise können Datum und Zeit, zu welchen ein Gegenstand erstellt wurde, in seinem Merkmalsvektor als eine einzelne zusätzliche bzw. Zusatzkomponente enthalten sein. Wenn der Wert der Komponente die Zeit von einer gewissen Ausgangszeit ist, dann erfüllt die Merkmalskomponente das Kriterium. Die Kombination von zwei derartigen Merkmalskomponenten mit der Min-Funktion wird die frühere Erzeugungszeit erzeugen bzw. bereitstellen, wohingegen die Kombination mit der Max-Funktion die spätere Erzeugungszeit erzeugt. Auch kann zum Beispiel die dominante Bildfarbe in einem Merkmalsvektor als ein einzelner Wert enthalten sein, beispielsweise die Summe der Rot-, Grün-, und Blaukomponente der Farbe. Das Minimum von zwei dominanten Farben von unterschiedlichen Intensitäten bzw. Stärken ist eine ähnliche Farbe mit reduzierter Intensität, welche das Kriterium erfüllt.
Die meisten fortlaufend bewerteten Komponenten können in eine Serie von Komponenten übersetzt werden, für welche eine Anwendung einer Funktion, wie beispielsweise Min oder Max, das Kriterium erfüllt. D. h., die meisten Merkmale können zu einer Verteilungsfunktion durch ein Einstufen bzw. Kategorisieren bzw. Binning aufgezeichnet werden. Beispielsweise kann die Erzeugungszeit eines Gegenstands als eine Serie von Behältern bzw. Bins ausgefüllt werden, wie beispielsweise einer für jeden Tag des Jahres p(Tag), und einer für jedes einer Anzahl von Jahren p(Jahr). Wenn der Gegenstand am Tag = 10 und Jahr = 20 erstellt wurde, dann p(10) = 1, p(20) = 1, und alle anderen Werte für p(Tag) und p(Jahr) sind null. In ähnlicher Weise und beispielsweise können die potentiellen Werte für ein Texturmaß t in Bins aufgeteilt werden. Wenn t von 0 bis 1 reicht, können die Bins bzw. Behälter beispielsweise definiert werden, wie folgt:

Bin Bereich der Werte von t

1 0,0 zu < 0,1

2 0,1 zu < 0,3

3 0,3 zu < 0,7

4 0,7 zu < 0,9

5 0,9 zu 1,0
Jeder Bin bzw. Behälter bzw. jede Kategorie ist eine Komponente des Merkmalsvektors T und kann den Wert von 1 oder 0 annehmen, so daß beispielsweise wenn t = 0,3, dann T = {0, 0, 1, 0, 0}. Diese Technik arbeitet für jedes Merkmal, dessen Wert einen finiten bzw. endlichen Bereich aufweist, oder für einen beliebigen Satz von Werten. Eine Komponente, deren Wert einen infiniten bzw. unendlichen oder sehr großen Bereich aufweist, kann in einen kleineren finite bzw. endlichen Bereich übersetzt werden. Beispielsweise kann die Anzahl von Worten in einem Dokument, n, von 0 bis Millionen reichen, kann aber als n' = log(n + 1) übersetzt werden, welches einen kleineren und begrenzten bzw. finiten Bereich aufweist.
Eine Min- oder Max-Funktion kann verwendet werden, um Merkmale von unterschiedlichen Arten von Gegenständen zu kombinieren oder zu vergleichen. Beispielsweise können Merkmale, welche nicht spezifisch für die Art von Medium sind, zu Gegenständen bzw. Objekten ohne Rücksicht auf ihre Gegenstands- bzw. Objektart kombiniert und verglichen werden, wie dies oben diskutiert wurde. Merkmale, welche für eine Art von Medium spezifisch sind, können in Merkmale einer anderen Art übersetzt oder umgewandelt werden und dann mit Gegenständen der letzteren Art kombiniert oder verglichen werden. Beispielsweise kann die Frequenzverteilung von Wellenlängen für einen Audiogegenstand zu einer Frequenzverteilung von Farben aufgezeichnet bzw. katalogisiert werden, indem Audiowellenlängen zu Farbwellenlängen aufgezeichnet werden. Eine Proportionalitäts-Konstante oder -Funktion kann verwendet werden, um die eine zur anderen umzuformen bzw. umzuwandeln, so daß beispielsweise die Verteilungen ähnliche Bereiche aufweisen, oder so daß die Verteilungen für besondere Audio- und Bilddaten ähnliche Formen bzw. Gestalten aufweisen. Wenn die Audio- und Farbwellenlängen-Verteilungen ähnliche Bin-Strukturen aufweisen, können sie auf eine aussagekräftige bzw. sinnvolle Art und Weise verglichen oder kombiniert werden.
Die Funktion, die verwendet wird, um die Ähnlichkeit zwischen den gesuchten Gegenständen und dem Bezug G[W_S, g_s(M_i, R_c)] 134 zu evaluieren, kann zugeschnitten bzw. maßgeschneidert werden, um die verwendete Funktion zu komplementieren bzw. zu ergänzen, um die Gegenstände zu kombinieren und den Bezug herzustellen, wie dies vorhergehend diskutiert wurde. Beispielsweise kann das Ähnlichkeitsmaß auf der Vergleichsfunktion basieren. Eine Funktion, wie beispielsweise Min(V₁, V₂) oder Max(V₁, V₂) definiert jeweils einen Kombinationsvektor, wie beispielsweise V_min oder V_max. Die Summe oder Spur Tr der Komponenten in einem Kombinations- oder Vergleichsvektor, wie beispielsweise V_min, kann eine Anzeige der Ähnlichkeit s zwischen den verglichenen bzw. in Beziehung gesetzten Vektoren V_i und V_j sein. Somit kann die Ähnlichkeit der Vektoren i und j definiert sein als die Spur einer Kombinationsfunktion, wie sie auf jene Vektoren angewendet wurde. Das heißt, s(V_i, V_j) = Trf(V_i, V_r) = TrV_min
Beispielsweise summieren sich die Komponenten der Vektoren V₁ 500 und V₂ 510 jeweils zur Einheit, jedoch summieren sich die Komponenten des Vektors V_N 521 zu 0,8, so daß s(V₁, V₂) = TrV_N = 0,8. Dieses Maß zeigt an, daß die Vektoren V₁ und V₂ zu 80% ähnlich sind.
Die Funktion f wird typischerweise ausgewählt, um einen Vektor zurückzugeben bzw. umzukehren, so daß die Summe seiner Komponenten zwischen 0 und 1 inklusive liegt, wo 0 keine Ähnlichkeit anzeigt und 1 eine vollständige Ähnlichkeit, d. h. Identität anzeigt. Im allgemeinen wird, wenn ein Satz von Komponenten in zwei Merkmalsvektoren standardisiert ist, so daß die Summe der Komponenten eine Eins bzw. Einheit ist, ein Vektor, welcher durch die Anwendung der Min-Funktion abgeleitet wurde, derartige Eigenschaften aufweisen. Wenn die Gegenstände identisch in den Attributen sind, welche durch den Satz von Komponenten in dem Merkmalsvektor charakterisiert sind, dann summieren sich die Komponenten von V_min zur Einheit. Beispielsweise Min(V₁, V₁) ist V₁, und die Summe der Komponenten in V₁ ist 1, was anzeigt, daß der Vektor V₁ vollständig ähnlich – d. h. identisch zu sich selbst ist. Wenn die zwei Gegenstände in keiner Weise ähnlich sind, welches durch den Satz von Komponenten in dem Merkmalsvektor charakterisiert ist, dann summieren sich die Komponenten von V_min zu Null. Somit erzeugt die Min-Funktion Vektoren, für welche die Summe der Komponenten von 0 bis 1 reicht, wenn sie an standardisierte Sätze von Komponenten angewendet wird, abhängig von der Ähnlichkeit der Gegenstände.
Wenn Merkmalsvektoren nicht standardisiert sind, um sich zu eins bzw. zur Einheit zu summieren, kann die Min-Funktion eingestellt sein bzw. werden, um Vektoren zu erzeugen, für welche die Summe der Komponenten von 0 bis 1 reicht, wie folgt: s(V_i, V_j) = Tr[Min(V_i, V_j)]/Min(TrV_i, TrV_j)
Diese besondere Form wird ausgewählt, um die folgende erwünschte Eigenschaft zu erzeugen: ein Bezugsvektor V_r, welcher durch Kombinieren von zwei Vektoren V₁ und V₂ erzeugt wird, wird als vollständig ähnlich zu jedem von V₁ und V₂ definiert. Wenn beispielsweise der zusammengesetzte Bezugsvektor V_r ist V_r = Min(V₁, V₂), dann ist seine Ähnlichkeit zu V₁ s(V_r, V₁) = Tr(Min(V_r, V₁)]/Min(TrV_r, TrV₁), was sich reduziert auf s(V_r, V₁) = Tr[Min(V₁, V₂)]/Tr[Min(V₁, V₂)] = 1.
In ähnlicher Weise ist die Ähnlichkeit zwischen dem zusammengesetzten Bezugsvektor V_r und V₂ eins bzw. Einheit, s(V_r, V₁) = Tr[Min(V₁, V₂)]/Tr[Min(V₁, V₂)] = 1.
Diese Einstellung erlaubt es einem beispielsweise, den Vektor V_N 521, wo C = {0,2, 0,1, 0,3, 0,1, 0,1} und TrV_N = 0,8, mit dem Vektor V₁ 500, wo C = {0,2, 0,1, 0,3, 0,3, 0,1} und TrV₁ = 1,0, zu vergleichen. In diesem Fall ist Min(V_N, V₁) = {0,2, 0,1, 0,3, 0,1, 0,1} und Tr[Min(V_N, V₁)] = 0,8. Nach Einstellung haben wir S(V₁, V₂) = 0,8/Min[0,8, 1,0] = 1, was anzeigt, daß der Kombinationsvektor V_N vollständig ähnlich zu dem Vektor V₁ ist. Im allgemeinen weist das Einstellungsmerkmal die nützliche Eigenschaft auf, daß ein Vektor, welcher durch Anwendung der Min-Funktion erzeugt wurde, nach Einstellung vollkommen ähnlich zu einem der zwei Vektoren ist, von welchen er abgeleitet wurde. Das heißt s(V_i, V_min) = s(V_j, V_min) = 1
Diese Identität hält auch, wenn die zwei Merkmalsvektoren V_i und V_j eher mit der Max-Funktion als mit der Min-Funktion kombiniert werden. Das heißt, s(V_i, V_max) = s(V_j, V_max) = 1
Diese wichtige Eigenschaft stellt sicher, daß Bezugsgegenstände, welche zum Definieren der Suchkriterien verwendet werden, als ähnlich zum Bezug identifiziert werden, wenn sie selbst oder sehr ähnliche Mediengegenstände in der Sammlung von Gegenständen auftreten, welche gesucht bzw. durchsucht werden. Das heißt, jeder Bezugs- bzw. Verweiswert, wenn er in der Sammlung von Gegenständen enthalten ist, welche durchsucht wird, wird als der am meisten ähnliche der Gegenstände zu dem zusammengesetzten Bezug gereiht.
Beim Vergleichen von zwei Merkmalsvektoren können verschiedene Merkmale oder Komponenten betont oder abgeschwächt werden, indem diese mehr oder weniger relativ zueinander gewichtet werden. Beispielsweise können die ersten drei der fünf Komponenten in dem Satz von Komponenten C von Interesse sein, während es die letzten zwei nicht sind. In diesem Fall können die Komponenten so gewichtet werden, daß nur die ersten drei von diesen betrachtet bzw. berücksichtigt werden. Diese besondere Gewichtung wird durch ein Multiplizieren der ersten drei Komponenten des Vektors mit 1 und der letzten zwei Komponenten mit 0 erreicht. Im allgemeinen kann der Kombinations- oder Vergleichsmerkmalsvektor mit einem Gewichtungsvektor W_S 50 multipliziert werden, um beispielsweise W_S·Min(V_i, V_j) oder äquivalent W_S·V_min zu ergeben.
Die Verwendung eines Gewichtungsvektors behält die Ähnlichkeitseigenschaften bei, welche vorher diskutiert wurden. Bei Verwendung eines Gewichtungsvektors kann die Ähnlichkeit von zwei Vektoren V_i und V_j, deren Komponenten normalisiert sind, so daß ihre gewichtete Summe Eins ist, definiert werden als: s(V_i, V_r) = TrW_S·f(V_i, V_r) = TrW_S·V_min
Allgemeiner und für nicht-standardisierte Sätze von Komponenten s(V_i, V_r) = Tr[W_SMin(V_i, V_r)]/Min(Tr[W_SV_i], Tr[W_SV_r]).
Diese Funktionen behalten die nützliche Eigenschaft bei, daß ein Vektor, welcher durch Anwendung der Min-Funktion erzeugt wurde, identisch ähnlich zu einem der zwei Vektoren ist, von welchen er abgeleitet wurde, wie dies vorher diskutiert wurde.
Der Gewichtungsvektor W_S 50, 250 kann von einer Information für einen oder mehrere der Bezugsgegenstände 121–123 abgeleitet sein bzw. werden, durch ein Kombinieren der Information über jeden von zwei oder mehreren Bezugsgegenständen, entsprechend einer Funktion h(R_i, R_j) 52, wie dies vorher diskutiert wurde. Wenn die Information als Merkmalsvektoren repräsentiert wird, kann der Gewichtungsvektor entsprechend einer Funktion h(R_i, R_j) = W_w·f_w(V_i, V_j) abgeleitet werden, wo beispielsweise f_w(V_i, V_j) = Min(V_i, V_j) oder f_w(V_i, V_j) = Max(V_i, V_j) und W_w beispielsweise gemäß den Interessen des Anwenders definiert ist.
Daten oder Parameter, welche nicht unter Verwendung einer Funktion, wie beispielsweise Min oder Max eingestuft oder aussagekräftig verglichen werden können, können in einem Merkmalsvektor beinhaltet sein, jedoch unterschiedlich zu Verteilungsdaten gehandhabt werden, wenn Merkmale kombiniert oder verglichen werden. Beispielsweise kann ein Merkmalsvektor V einen Verteilungssatz P = {p(x₁), p(x₂), p(x₃), ... p(x_M)} und andere Daten D = {y₁, y₂, y₃, ... y_N)} beinhalten, so daß V = {P, D}. Zwei Merkmalsvektoren V₁ und V₂ können unter Verwendung von zwei Funktionen kombiniert werden, eine, welche an P angewendet wird, und eine andere, welche an D angewendet wird. Beispielsweise können die Vektoren kombiniert werden durch Anwenden der Min-Funktion an die Sätze von Komponenten P₁ und P₂, während der Durchschnitt bzw. Mittelwert der Komponenten in D₁ und D₂ genommen wird: V_r = {Min(P₁, P₂), {D₁ + D₂)/2}.
Der resultierende Bezugsvektor V_r kann dann mit den Vektoren von anderen Medien unter Verwendung von zwei Funktionen verglichen werden. Beispielsweise S(V_i, V_r) = s(P_i, P_r) + K·abs(D_i + D_r), wo K eine Konstante ist, welche die Wichtigkeit der Parameter in D zu dem Ähnlichkeitsvergleich regelt bzw. steuert und s(P_i, P_r) das Ähnlichkeitsmaß ist, welches für Verteilungen Tr[WMin(P₁, P₂)]/Min(TrWP₁, TrWP₂) verwendet wird. Wenn x von 0 bis 1 reicht, ist K typischerweise eine Zahl zwischen 0 und 10; beispielsweise 1,0.
9 illustriert ein Verfahren zum Suchen bzw. Durchsuchen einer Sammlung von Mediengegenständen unter Verwendung einer kombinierten Information für jeden von zwei oder mehreren Bezugsgegenständen in einem Satz von Bezugsgegenständen. Ein Anwender wählt (Schritt 701) eine Mehrzahl von Bezugsgegenständen aus, um die Suchkriterien zu definieren. Typischerweise wünscht der Anwender, Mediengegenstände zu finden, welche ähnlich zu den ausgewählten Bezugsgegenständen sind. Die ausgewählten Bezugsgegenstände können besondere bzw. bestimmte Merkmale aufweisen oder können einen allgemeinen Aspekt aufweisen, welchen der Anwender in anderen Mediengegenständen finden möchte. Die ausgewählten Bezugsgegenstände können oder können nicht Merkmale oder Aspekte teilen, welche der Anwender in anderen Mediengegenständen finden möchte. Der Verwender bzw. Anwender wählt auch (Schritt 702) eine Sammlung von zu durchsuchenden Mediengegenständen aus. Der Anwender wünscht typischerweise Gegenstände in der ausgewählten Sammlung von Mediengegenständen zu finden, welche zu den ausgewählten Bezugsgegenständen ähnlich sind.
Das Verfahren erfordert Information (Schritt 704) über jeden Bezugsgegenstand und die zu suchenden bzw. durchzu-suchenden Mediengegenstände. Derartige Information kann vorberechnet und gespeichert werden, so daß sie für eine Suche verfügbar ist (der JA-Zweig von Schritt 704). Beispielsweise können die Komponenten für Merkmalsvektoren definiert sein bzw. werden und die Merkmalsvektoren für jeden Bezugsgegenstand und jeden der zu suchenden Mediengegenstände können abgeleitet werden, bevor eine Suche gestartet wird. Der Merkmalsvektor für jeden Gegenstand kann im Zusammenhang mit dem Gegenstand gespeichert sein bzw. werden.
Der Anwender kann Information für den Bezugsgegenstand oder die zu suchenden Mediengegenstände definieren und berechnen (Schritt 706), wenn eine derartige Information nicht verfügbar ist oder wenn der Anwender bevorzugt, die verfügbare Information nicht zu verwenden (der NEIN-Zweig von Schritt 704). Beispielsweise kann der Anwender spezifizieren, welche Sätze von Komponenten und welche Komponenten in den Merkmalsvektoren beinhaltet sein sollten. Die Merkmalsvektoren für die ausgewählten Bezugsgegenstände und Mediengegenstände können dann berechnet werden. Typischerweise wird die Information für jeden der Bezugsgegenstände und jeden der zu suchenden Mediengegenständen ähnlich definiert werden. Beispielsweise werden die Merkmalsvektoren der Bezugs- und der zu suchenden Mediengegenstände dieselben Serien von Komponenten aufweisen. Die Information für die Gegenstände kann unähnlich oder nicht überlappend sein, in welchem Fall die Information, welche bei der Suche verwendet wird, typischerweise auf Information begrenzt bzw. beschränkt ist, welche unter den Besuchsgegenständen und den zu suchenden Mediengegenständen geteilt wird.
Das Verfahren erfordert eine Kombinationsfunktion g(R_i, R_j) 32, beispielsweise W_c·f_c(V_i, V_j) 232 zum Kombinieren der ausgewählten Bezugsgegenstände (Schritt 708). Ein Teil oder die gesamte Kombinationsfunktion kann vordefiniert sein, so daß sie für eine Suche verfügbar ist (der JA-Zweig von Schritt 708). Der Anwender kann eine Kombinationsfunktion definieren (Schritt 710), wenn eine derartige Information nicht verfügbar ist oder wenn der Anwender bevorzugt, die verfügbare Information nicht zu verwenden (der NEIN-Zweig von Schritt 708). Beispielsweise kann die Funktion f_c(V_i, V_j) vordefiniert sein, während der Anwender den Gewichtungsvektor W_c beispielsweise entsprechend der relativen Wichtigkeit von Merkmalen für die Suche definiert. Der Anwender kann auch die Funktion f_c(V_i, V_j) entsprechend der Suchabsicht definieren. Beispielsweise erfüllt die Max-Funktion die Absicht eines Suchens nach dem kombinierten Satz von Merkmalen in den Bezugsgegenständen, während die Min-Funktion die Absicht eines Suchens nach jenen Merkmalen erfüllt, welche allen Bezugsgegenständen gemeinsam sind.
Das Verfahren erfordert auch eine Vergleichsfunktion G[W_S, g_s(M_i, R_c)] 34, beispielsweise Tr[W_s·f_s(V_j, V_r)] 234 (Schritt 712). Ein Teil oder die gesamte Kombinationsfunktion kann vordefiniert sein oder entsprechend vordefinierten Verfahren berechnet sein (der JA-Zweig von Schritt 712). Beispielsweise kann W_s ausgelassen oder vordefiniert sein, um ein einheitlicher Gewichtungsvektor zu sein, so daß keine Merkmale mehr oder weniger gewichtet werden als irgendwelche andere. W_s kann vordefiniert sein, um dasselbe zu sein wie die Gewichtungsfunktion W_c, welche verwendet wird, um Bezugsgegenstände zu vergleichen. Alternativ kann W_s entsprechend einer Funktion h(R_i, R_j) 52 berechnet sein bzw. werden, beispielsweise W_w·f_w(V_i, V_j) 252 und die Funktion h(R_i, R_j) kann vorher definiert sein. Beispielsweise kann sie definiert sein, um dieselbe zu sein wie die definierte Kombinationsfunktion g(R_i, R_j) 132 oder W_c·f_c(V_i, V_j) 232.
Der Anwender kann W_s definieren (Schritt 714), wenn es nicht vordefiniert ist oder wenn der Anwender bevorzugt, das vordefinierte W_s nicht zu verwenden. Beispielsweise kann der Anwender einen Gewichtungsvektor, beispielsweise durch Spezifizieren einer Art von Filterfunktion spezifizieren. Alternativ kann der Anwender eine Funktion f_w(V_i, V_j) und einen Vektor W_w definieren, wie dies vorhergehend für die Definition der Kombinationsfunktion diskutiert wurde.
Die Verwendung von unterschiedlichen Funktionen f(V_i, V_j), um den Gewichtsvektor zum Suchen, W_s, und den Kombinations-Bezugsvektor V_r abzuleiten, stattet den Anwender mit mehr Kontrolle über die Resultate der Suche aus, als wenn dieselbe Funktionen für beide Zwecke verwendet wird. Beispielsweise kann der Anwender Merkmale unter Verwendung der Max-Funktion f_c(V_i, V_j) = Max(V_i, V_j) kombinieren, so daß V_r = V_max. Dann kann beim Vergleichen des Bezugsvektors mit den Merkmalsvektoren der Mediengegenstände der Anwender die Merkmale entsprechend der Min-Funktion f_w(V_i, V_j) = Max(V_i, V_j) gewichten, so daß W_s = V_min. Auf diese Weise umschließt der Anwender alle Merkmale in den Bezugsgegenständen in der Suche, betont jedoch jene Merkmale, welche zwischen den Bezugsgegenständen geteilt werden, wenn die Suche durchgeführt wird.
Betreffend den Gewichtungsvektor W_S kann die Funktion f_s(V_i, V_r) vordefiniert oder automatisch wiederdefiniert sein (der JA-Zweig von Schritt 712), oder durch den Anwender erneut definiert sein (der NEIN-Zweig von Schritt 712). Die Funktion f_s(V_i, V_r) kann beispielsweise als Min(V_i, V_r) vordefiniert sein. Die Funktion f_s(V_i, V_r) kann automatisch neu definiert sein bzw. werden, um beispielsweise dieselbe zu sein wie die Funktion f_c(V_i, V_r), welche verwendet wird, um die Bezugsgegenstände zu kombinieren. Alternativ kann die Funktion f_s(V_i, V_r) erneut bzw. neu durch den Anwender entsprechend der Suchabsicht des Anwenders definiert sein, wie dies vorhergehend für die Definition der Kombinationsfunktion diskutiert wurde.
Die Information für die Bezugsgegenstände wird kombiniert (Schritt 716) entsprechend der definierten Kombinationsfunktion und Gewichtung, wenn überhaupt bzw. falls vorhanden, um eine zusammengesetzte Bezugsinformation R_c 30, beispielsweise V_r 230 zu erzeugen. Der Anwender kann dann auswählen, ob eine Suche (Schritt 718) der vorher ausgewählten Mediengegenstände unter Verwendung der zusammengesetzten Information durchgeführt wird. Wenn die Suche durchgeführt wird (der JA-Zweig von Schritt 718), wird die zusammengesetzte Bezugsinformation mit der Information für jeden der Mediengegenstände in der vorher ausgewählten Sammlung von Mediengegenständen unter Verwendung der vorher definierten Vergleichsfunktion verglichen (Schritt 720). Für jeden Vergleich kann ein Ähnlichkeitswert bestimmt werden. Die Ähnlichkeitswerte können dann verwendet werden, um Mediengegenstände zu identifizieren, welche mehr oder weniger ähnlich zu der zusammengesetzten Bezugsinformation sind.
Wenn keine Suche durchgeführt wird (der NEIN-Zweig von Schritt 718), oder nachdem die Suche abgeschlossen ist (Schritt 720), kann der Anwender auswählen, ob ein Bezugsgegenstand zu dem Satz von Bezugsgegenständen hinzugefügt wird (Schritt 722). Wenn nicht (der NEIN-Zweig von Schritt 722), endet der Vorgang. Jedoch kann der Anwender beispielsweise wünschen, die Suche einzustellen, um Merkmale oder Aspekte von zusätzlichen Gegenständen einzufügen bzw. aufzunehmen, wie beispielsweise Gegenstände, die in einer vorangegangenen Suche identifiziert wurden. Wenn dies der Anwender so wünscht (der JA-Zweig von Schritt 722), wählt der Anwender einen zusätzlichen Bezugsgegenstand (Schritt 724).
Wenn der neu ausgewählte Bezugsgegenstand nicht einer der Gegenstände in der vorher ausgewählten Sammlung von Mediengegenständen ist (der NEIN-Zweig von Schritt 726), kann es notwendig sein, die erforderliche Information zu berechnen (Schritt 704). Wenn dem so ist (der JA-Zweig von Schritt 704), erzeugt der Anwender vorzugsweise Information für den neu ausgewählten Bezugsgegenstand oder leitet sie ab, wie für die vorher ausgewählten Bezugsgegenstände. Wenn der neu ausgewählte Bezugsgegenstand aus der vorher ausgewählten Sammlung von Mediengegenständen stammt (der NEIN-Zweig von Schritt 726), wird die erforderliche Information bereits erzeugt oder abgeleitet sein.
Der Anwender kann als nächstes auswählen, ob die Kombinationsfunktion neu zu definieren ist (Schritt 708). Beispielsweise kann der Anwender einen anfänglichen bzw. ursprünglichen zusammengesetzten Vektor unter Verwendung der Min-Funktion erzeugt haben, kann aber wünschen, einen dritten Vektor unter Verwendung der Max-Funktion hinzuzufügen. Auf diese Weise kann der Anwender einzigartige Merkmale des neu ausgewählten Gegenstands in die bestehende bzw. existierende zusammengesetzte Information einbauen.
Der Anwender kann auch auswählen, ob die Vergleichsfunktion neu zu definieren ist (Schritt 712). Beispielsweise kann der Anwender die Funktion f_s neu definieren. Noch typischer kann der Anwender wünschen, den Gewichtungsvektor wieder bzw. neu zu definieren. Die Vergleichsfunktion kann sich ändern, da bzw. wenn mehrfache Mediengegenstände in dem Auswahlverfahren kombiniert sind. Beispielsweise wird sich die Vergleichsfunktion ändern, wenn sich der Gewichtungsvektor ändert. Der Gewichtungsvektor wird sich üblicherweise mit der Hinzufügung von Information von neu ausgewählten Bezugsgegenständen ändern, wenn er als eine Kombination der Bezugsvektoren definiert ist. In einer Implementierung ändert sich die Vergleichsfunktion nicht, da die Information für mehrfache Bezugsgegenstände kombiniert ist – nur die zusammengesetzte Bezugsinformation ändert sich. Wenn dies nicht der Fall ist, kann der Anwender auswählen, vorher existierende Gewichtungsvektoren aufrechtzuerhalten bzw. beizubehalten. Alternativ kann der Anwender wünschen, die einzigartigen Merkmale von einem neu ausgewählten Bezugsgegenstand durch ein Definieren eines neuen Gewichtungsvektors hervorzuheben bzw. zu betonen.
Die Information für den neu ausgewählten Bezugsgegenstand wird mit der existierenden zusammengesetzten Information kombiniert, um eine neue zusammengesetzte Information (Schritt 716) und neue Gewichtungsvektoren zu erzeugen, wenn dies notwendig und gewünscht ist. Das Verfahren setzt dann fort, wie dies vorher beschrieben wurde. Wenn eine neue Suche durchgeführt wird (der JA-Zweig von Schritt 718), werden die neu definierte zusammengesetzte Information, der neue Gewichtungsvektor, falls vorhanden, und die neu definierte Vergleichsfunktion, falls vorhanden, verwendet.
Die Erfindung kann in digitalen elektronischen Schaltkreisen oder in Computer-Hardware, Firmware, Software oder in Kombinationen davon implementiert sein bzw. werden. Eine Vorrichtung bzw. ein Gerät der Erfindung kann in einem Computerprogramm-Produkt implementiert sein bzw. werden, welches körperlich bzw. greifbar in einer maschinenlesbaren Speichervorrichtung zur Ausführung durch einen Programmierprozessor verkörpert ist; und Verfahrensschritte der Erfindung können durch einen programmierbaren Prozessor bzw. Rechner durchgeführt werden, welcher ein Programm von Instruktionen bzw. Befehlen ausführt, um Funktionen der Erfindung durch eine Betätigung an Eingabedaten und Erzeugen einer Ausgabe durchzuführen. Die Erfindung kann vorteilhafterweise in einem oder mehreren Computerprogramm(en) implementiert sein bzw. werden, welche(s) auf einem programmierbaren System ausführbar ist bzw. sind, welches wenigstens einen programmierbaren Prozessor beinhaltet, welcher gekoppelt ist, um Daten und Befehle von einem Datenspeichersystem, wenigstens einer Eingabevorrichtung, und wenigstens einer Ausgabevorrichtung zu empfangen und um Daten und Befehle an diese zu senden. Jedes Computerprogramm kann in einer höheren verfahrens-orientierten oder gegenstands- bzw. objekt-orientierten Programmiersprache implementiert sein, oder wenn gewünscht, in Assemblier- oder Maschinensprache; und in jedem Fall kann die Sprache eine kompilierte oder interpretierte Sprache sein. Geeignete Prozessoren beinhalten als Beispiel Mikroprozessoren sowohl für allgemeine wie auch für Spezialanwendungen. Im allgemeinen wird ein Prozessor Instruktionen bzw. Befehle und Daten von einem Nur-Lesespeicher und/oder einem Direktzugriffsspeicher empfangen. Die wesentlichen Komponenten eines Computers sind ein Prozessor zum Ausführen von Befehlen und ein Speicher. Im allgemeinen wird ein Computer eine oder mehrere Massenspeicher-Vorrichtung(en) zum Speichern von Datenbeständen beinhalten; derartige Vorrichtungen beinhalten magnetische Scheiben bzw. Platten, wie beispielsweise interne Festplatten und entfernbare Platten; magneto-optische Platten; und optische Platten. Speichervorrichtungen, welche geeignet sind, um Computerprogrammbefehle und Daten greifbar zu verkörpern, beinhalten alle Formen von nicht-flüchtigen Speichern, beinhaltend beispielsweise Halbleiterspeicher-Vorrichtungen, wie beispielsweise EPROM, EEPROM und Flash-Memory-Vorrichtungen; Magnetplatten, wie interne Festplatten und entfernbare Platten; magneto-optische Platten; und CD-ROM-Scheiben. Jede der Vorangegangenen kann ergänzt werden durch ASICs (anwendungsspezifische integrierte Schaltkreise) oder in diese eingebaut sein.
Um eine Interaktion bzw. Wechselwirkung mit einem Anwender zur Verfügung zu stellen, kann die Erfindung auf einem Computersystem implementiert werden, welches eine Anzeigevorrichtung, wie beispielsweise einen Monitor oder LCD-Schirm zum Anzeigen von Information für den Anwender und eine Tastatur und ein Zeigegerät aufweist, wie beispielsweise eine Maus oder einen Trackball, durch welchen der Anwender eine Eingabe zu dem Computersystem vornehmen bzw. zur Verfügung stellen kann. Das Computersystem kann programmiert sein, um eine graphische Anwenderschnittstelle zur Verfügung zu stellen, durch welche Computerprogramme mit Anwendern Wechselwirken.
Die Erfindung ist im Hinblick auf besondere Ausführungsformen beschrieben worden. Andere Ausführungsformen sind innerhalb des Gültigkeitsbereichs der folgenden Ansprüche. Beispielsweise können Schritte der Erfindung in einer unterschiedlichen Reihenfolge durchgeführt werden und erzielen noch immer wünschenswerte Ergebnisse. Merkmalsvektoren oder Information für mehrfache Bezugsgegenstände können in einem einzelnen Schritt kombiniert werden, anstelle in einer Serie von paarweisen Kombinationen. Information für Mediengegenstände kann als Modelle oder hochdimensionale Matrizen ausgedrückt werden. Nichteuklidische Funktionen verschieden von Min und Max können verwendet werden, um Merkmalsvektoren zu kombinieren oder zu vergleichen.

Claims

Verfahren zum Suchen bzw. Durchsuchen einer Sammlung von Medienobjekten, umfassend: ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, welches einer Mehrzahl von Referenz- bzw. Bezugsobjekten gemeinsam ist, um eine zusammengesetzte Bezugsinformation zu erzeugen, welche Kriterien für eine Suche repräsentiert; und ein Vergleichen der zusammengesetzten Bezugsinformation mit Information, welche sich auf dasselbe Merkmal bezieht, für jeden entsprechenden einen aus einer Mehrzahl von Medienobjekten in einer Sammlung von Medienobjekten, um ein oder mehrere Medienobjekt(-objekte) zu identifizieren; wobei eine nicht euklidische Funktion verwendet wird, um entweder die Information zu kombinieren, welche sich auf das Merkmal bezieht, oder um die zusammengesetzte Bezugsinformation mit Information zu vergleichen, welche sich auf dasselbe Merkmal bezieht.
Verfahren nach Anspruch 1, weiters umfassend: ein Empfangen einer Benutzereingabe, die die Mehrzahl von Bezugsobjekten spezifiziert.
Verfahren nach Anspruch 1, weiters umfassend: ein Auswählen von Medienobjekten in der Sammlung von Medienobjekten basierend auf dem Vergleich der Information, welche sich auf das Merkmal bezieht, für jedes Medienobjekt und die zusammengesetzte Bezugsinformation.
Verfahren nach Anspruch 1, wobei: die Mehrzahl von Bezugsobjekten ein oder mehrere Objekt (Objekte) beinhaltet, der (die) einen Typ aufweist (aufweisen), der ausgewählt wird aus: Audio, Bild, Text, CD oder Video.
Verfahren nach Anspruch 4, wobei: ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, welches einer Mehrzahl von Bezugsobjekten gemeinsam ist, ein Kombinieren von Information für unterschiedliche Typen von Objekten beinhaltet.
Verfahren nach Anspruch 1, wobei: ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, welches einer Mehrzahl von Bezugsobjekten gemeinsam ist, zum Erzeugen von zusammengesetzter Bezugsinformation ein Bestimmen des Schnitts der Information für die Bezugsobjekte beinhaltet.
Verfahren nach Anspruch 1, wobei: ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, welches einer Mehrzahl von Bezugsobjekten gemeinsam ist, zum Erzeugen von zusammengesetzter Bezugsinformation ein Bestimmen der Vereinigung der Information für die Bezugsobjekte beinhaltet.
Verfahren nach Anspruch 1, weiters umfassend: ein Kombinieren von Information, welche sich auf ein zweites Merkmal bezieht, welches der Mehrzahl von Bezugsobjekten gemeinsam ist, um zusätzliche zusammengesetzte Bezugsinformation zu erzeugen, welche Kriterien für die Suche repräsentiert; und ein Vergleichen der zusätzlichen zusammengesetzten Bezugsinformation mit Information, welche sich auf das zweite Merkmal bezieht, für jeden jeweiligen einen der Mehrzahl von Medienobjekten in der Sammlung von Medienobjekten, um ein oder mehrere Medienobjekt(-objekte) zu identifizieren.
Verfahren nach Anspruch 8, wobei: die Information, welche sich auf ein Merkmal bezieht, und die Information, welche sich auf ein zweites Merkmal bezieht, gewichtet wird, um eine relative Wichtigkeit der Merkmale zu spezifizieren.
Verfahren nach Anspruch 8, weiters umfassend: ein Empfangen einer Benutzereingabe, die die relative Wichtigkeit des Merkmals und des zweiten Merkmals anzeigt.
Verfahren nach Anspruch 8, wobei: das Merkmal und das zweite Merkmal jeweils durch eine relative Frequenz eines Auftretens eines Merkmalwerts repräsentiert werden.
Verfahren nach Anspruch 8, wobei: Information, welche sich auf das Merkmal bezieht, und Information, welche sich auf das zweite Merkmal bezieht, Farbinformation beinhaltet, welche die relative Frequenz eines Auftretens von Farben in einem Gegenstand beschreibt.
Verfahren nach Anspruch 8, wobei: Information, welche sich auf das Merkmal bezieht, auf Information abgebildet wird, welche sich auf das zweite Merkmal bezieht.
Verfahren nach Anspruch 1, weiters umfassend: ein Kombinieren von Information, welche sich auf das Merkmal bezieht, für ein zusätzliches Bezugsobjekt mit der zusammengesetzten Bezugsinformation, um die zusammengesetzte Bezugsinformation zu überprüfen.
Verfahren nach Anspruch 14, wobei: der zusätzliche Bezug ein Medienobjekt ist, welcher durch ein Vergleichen der zusammengesetzten Bezugsinformation mit Information, welche sich auf das Merkmal bezieht, für jeden entsprechenden einer Mehrzahl von Medienobjekten, identifiziert wird.
Verfahren nach Anspruch 14, weiters umfassend: ein Vergleichen der überprüften, zusammengesetzten Bezugsinformation mit Information für das Merkmal für jeden einer zweiten Mehrzahl von Medienobjekten in der Sammlung von Medienobjekten.
Verfahren nach Anspruch 1, wobei: ein Vergleichen der zusammengesetzten Bezugsinformation mit Information, welche sich auf dasselbe Merkmal bezieht, für jeden jeweiligen einen einer Mehrzahl von Medienobjekten in einer Sammlung von Medienobjekten ein Zuweisen eines Ähnlichkeitswerts zu jedem entsprechenden einen der Medienobjekte in der Sammlung von Medienobjekten beinhaltet, wobei jeder Ähnlichkeitswert die Ähnlichkeit der Information für den Medienobjekt und die zusammengesetzte Bezugsinformation anzeigt.
Verfahren nach Anspruch 17, wobei: jeder Ähnlichkeitswert von jedem der Medienobjekte in der Sammlung von Medienobjekten geringer als oder gleich wie ein Ähnlichkeitswert ist, welcher für jedes Bezugsobjekt berechnet wird.
Verfahren nach Anspruch 17, weiters umfassend: ein Reihen bzw. Ordnen der Medienobjekte entsprechend ihren Ähnlichkeitswerten; und ein Auswählen von einem oder mehreren Medienobjekt(-objekten) in der Sammlung von Medienobjekten basierend auf seinem Rang.
Verfahren nach Anspruch 8, wobei: für jedes Bezugs- und Medienobjekt die Information, welche sich auf das Merkmal bezieht, und die Information, welche sich auf das zweite Merkmal bezieht, als ein Merkmalsvektor von Komponenten ausgedrückt wird.
Verfahren nach Anspruch 20, wobei: ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, und ein Kombinieren von Information, welche sich auf ein zweites Merkmal bezieht, welches einer Mehrzahl von Bezugsobjekten gemeinsam ist, ein Kombinieren der Merkmalsvektoren der Mehrzahl von Bezugsobjekten beinhaltet, um einen zusammengesetzten Bezugsvektor zu erzeugen.
Verfahren nach Anspruch 21, wobei: jeder Merkmalsvektor eine oder mehrere Komponente(n) beinhaltet, welche Metadaten repräsentiert (repräsentieren), welche mit dem entsprechenden Bezugsoder Medieniobjekt assoziiert sind; und ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, und ein Kombinieren von Information, welche sich auf ein zweites Merkmal bezieht, welches einer Mehrzahl von Bezugsobjekten gemeinsam ist, ein Kombinieren von Komponenten, welche das Merkmal oder das zweite Merkmal repräsentieren, gemäß einer ersten Kombinationsfunktion und ein Kombinieren der einen oder der mehreren Komponente(n), welche Metadaten repräsentiert (repräsentieren), welche mit jedem Bezugsobjekt assoziiert werden, gemäß einer zweiten Kombinationsfunktion beinhaltet.
Verfahren nach Anspruch 21, weiters umfassend: ein Definieren eines Gewichtungsvektors für das Merkmal und das zweite Merkmal, wobei der Gewichtungsvektor eine relative Wichtigkeit für die entsprechenden Merkmale spezifiziert; wobei ein Kombinieren der Merkmalsvektoren ein Verwenden des Gewichtungsvektors beinhaltet, um eine relative Wichtigkeit der Merkmale zu spezifizieren.
Verfahren nach Anspruch 21, wobei: ein Kombinieren der Merkmalsvektoren ein Verwenden einer Min- oder Max-Funktion beinhaltet.
Verfahren nach Anspruch 21, wobei: ein Vergleichen der zusammengesetzten Bezugsinformation mit Information, welche sich auf dasselbe Merkmal bezieht, für entsprechenden einen einer Mehrzahl von Medienobjekten in einer Sammlung von Medienobjekten, ein Vergleichen des zusammengesetzten Bezugsvektors mit einem Merkmalsvektor von jedem der Mehrzahl von Medienobjekten in der Sammlung von Medienobjekten beinhaltet.
Verfahren nach Anspruch 25, wobei: ein Vergleichen des zusammengesetzten Bezugsvektors mit den Merkmalsvektoren von jedem einer Mehrzahl von Medienobjekten ein Verwenden einer Min- oder Max-Funktion beinhaltet.
Verfahren nach Anspruch 1, wobei: ein Kombinieren von Information, welche sich auf ein Merkmal bezieht, welches einer Mehrzahl von Bezugsobjekten gemeinsam ist, ein Verwenden einer Kombinationsfunktion beinhaltet; ein Vergleichen der zusammengesetzten Bezugsinformation mit Information, welche sich auf dasselbe Merkmal bezieht, für jeden jeweils einen einer Mehrzahl von Medienobjekten in einer Sammlung von Medienobjekten ein Verwenden einer Vergleichsfunktion beinhaltet, welche auf der Kombinationsfunktion basiert.
Speichermedium mit einem als Programmcode gespeicherten Computerprogramm mit Instruktionen für einen Prozessor, das bei Verwendung in einer Datenverarbeitungseinrichtung das Verfahren nach einem der vorangegangenen Patentansprüche ausführt.
System zum Suchen bzw. Durchsuchen einer Sammlung von Medienobjekten zur Durchführung eines Verfahrens nach einem der Patentansprüche 1 bis 27.