DE202009006918U1 - Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker - Google Patents
Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker Download PDFInfo
- Publication number
- DE202009006918U1 DE202009006918U1 DE202009006918U DE202009006918U DE202009006918U1 DE 202009006918 U1 DE202009006918 U1 DE 202009006918U1 DE 202009006918 U DE202009006918 U DE 202009006918U DE 202009006918 U DE202009006918 U DE 202009006918U DE 202009006918 U1 DE202009006918 U1 DE 202009006918U1
- Authority
- DE
- Germany
- Prior art keywords
- faces
- search
- search engine
- user
- engine according
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Eine Einrichtung zum Durchsuchen einer Mehrzahl von Internetseiten-,
Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern der durchsuchten Internetseiten, wobei die Gesichter den Bildern zugeordnet sind,
Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden,
Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Identifikationsmerkmale der Gesichter aus den Referenzprofilen und extrahierten Gesichtern genutzt werden,
eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind;
eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht;
eine Einrichtung zum Durchsuchen des Datenbestands und...
Description
- Technisches Gebiet
- Die vorliegende Erfindung betrifft eine Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker
- Hintergrund der Erfindung
- Suchmaschinen sind spezielle Rechner bzw. programmierte Rechenanlagen für die Suche nach Webseiten, die bestimmte von einem Benutzer eingegebene Suchkriterien erfüllen. Um Ihre Aufgabe zu erfüllen, lädt eine Suchmaschine die Seiten des Internet auf den Rechner der Suchmaschine, indiziert die geladenen Seiten hinsichtlich vom Benutzer eingegebener Suchkriterien zu filtern und dem Benutzer die dann die gefundenen Seiten, sogenannten Treffer oder Hints anzuzeigen.
- Für das herunterladen enthält eine Suchmaschine typischerweise einen sogenannten Crawler, der automatisch Internetadressen aufruft und die Inhalte der zugehörigen Webseiten für die weitere Verarbeitung (Indizierung) herunterlädt.
- Neben den Textinformation können Webseiten Bilder und Video enthalten. Bilder werden typischerweise von sogenannten Crawler heruntergeladen und gespeichert.
- Im Gegensatz zu den schon seit langem bekannten Datenbanken sind die Inhalte von Webseiten allerdings in der Regel unstrukturierte Informationen, der Bedeutungsinhalt der einzelnen Begriffe (Terme) einer Webseite ist nur schwer identifizierbar. Dies schränkt die Möglichkeiten der Indizierung und damit die Suchmöglichkeiten stark ein. De facto ist eine von einer Suchmaschine vorgenommene Webseiten-Indizierung daher immer eine Volltext-Indizierung. Das Bedeutet aus sämtlichen Begriffen, die auf der Webseite vorkommen (ausgenommen vordefinierter bedeutungsloser Stop-Wörter) wird ein Volltext-Index gebildet, auf den dann die Suchanfrage „gematcht" wird.
- Bilder werden bei der Indizierung nicht wie Text behandelt. Bilder werden typischerweise mit dem Volltext-Index der Webseiten in Beziehung gesetzt. Die Suchkriterien die des Benutzers werden typischerweise auch auf die Bilder angewendet. Darüber hinaus werden der Dateiname des Bildes und die gegebenenfalls vorhanden Metainformationen der Bilddatei in den Index der Suchmaschine aufgenommen.
- Bei der herkömmlichen Suchmaschinentechnologie gibt der Benutzer in ein Eingabeinterface Suchbegriffe ein, auf deren Basis dann eine Suchanfrage (Query) an einen Datenbestand (Index) der Suchmaschine geschickt wird. Ein Anwendung der Suchbegriffe auf den Datenbestand bzw. Index ergibt dann gegebenenfalls Übereinstimmungen (Matches bzw. Treffer) und die entsprechenden Webseiten bzw. Links werden dem Benutzer angezeigt. Werden die Suchbegriffe im Kontext einer Bildersuche in das Eingabeinterface eingegeben, werden die Suchbegriffe mit dem Datenbestand abgeglichen und bei Übereinstimmungen werden diese dem Benutzer in Form einer Bildervorschau und die Links zu den Webseiten in denen sich die Bilder befinden angezeigt.
- Das Problem der herkömmlichen Suchmaschine besteht darin, das es schwierig ist den Inhalt eines Bildes zu ermitteln. Spezielle Suchmaschinen sind zwar in der Lage, mittels geeigneter Algorithmen, zu ermitteln ob ein Bild ein Gesicht enthält, aber auch sie können diese Person nicht identifizieren (erkennen um welche Person z. B. Vor- und Zuname) indem sie der Person den richtigen Namen zuordnen.
- Es ist daher die Aufgabe der vorliegenden Erfindung, eine Suchmaschine bereitzustellen, die diejenigen Bilder mit den dazugehörigen Webseiten als Treffer liefert, für die eine gesuchte Person enthält.
- Zusammenfassung der Erfindung
- Gemäß einem Ausführungsbeispiel der Erfindung umfasst die Erfindung eine Suchmaschine zum Durchführen einer Suche nach Bildern in Internetseiten, für die ein vom Benutzer als Suchbegriff eingegebenen Personennamen erfüllt. Wobei die Suchmaschine aufweist:
Eine Einrichtung zum Durchsuchen einer Mehrzahl von Internetseiten,
Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern der durchsuchten Internetseiten, wobei die Gesichter den Bildern zugeordnet sind,
Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden,
Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Identifikationsmerkmale der Gesichter aus den Referenzprofilen und extrahierten Gesichtern genutzt werden,
Eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind,
Eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht,
Eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind. - Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
Eine Einrichtung zur Extraktion der Gesichter. Dabei werden Bildausschnitte aus den vom Webcrawler extrahierten Bildern extrahiert und zur weiteren Verarbeitung mit einem Bezug zur Bildquelle und der das Bild enthaltenen Internetseite gespeichert. - Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden. - Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
Eine Einrichtung zur Bildung eines Datenbestanden aus Referenzprofilen aus Personeninformationen, insbesondere Gesichtsbilder und Klassifikationsmerkmale wie Vorname, Nachname, Geburtsdatum usw. - Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
eine Einrichtung zur Verknüpfung der durchsuchten Internetseite, indem basierend auf den extrahierten Personeninformationen durch Abgleich mit einem Datenbestand aus existierenden Personeninformationsdaten zu einem extrahierte Bildes mittels eines Gesichtserkennungsalgorithmus ermittelt und der Internetseite zugewiesen wird. - Die Zuordnung von Personendaten zu den Webseiten basierend auf den extrahierten Personeninformationen ermöglicht es, die Suche exakt auf durch Personennamen definierte Suchbedingungen einzuschränken und entsprechende Treffer auszugeben.
- Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
- Eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht.
- Eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
- Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
eine Einrichtung zum Durchsuchen der einzelnen Internetseiten nach einer Mehrzahl von Begriffen, die geeignet sind, die Internetseiten hinsichtlich des angebotenen Inhalts zu klassifizieren, wobei im Falle eines Treffers – gegebenenfalls unter Anwendung weiterer Bedingungen – der Internetseite eine entsprechende Klassifikation zugewiesen wird. - Das Durchsuchen nach Klassifikationsbegriffen aus einem vordefinierten Bestand solcher Begriffe ermöglicht die Zuordnung solcher Klassifikationsbegriffe zu den einzelnen Webseiten. Dies kann dann beispielsweise zu einer weiteren Spezifizierung der Suchanfrage verwendet werden, etwa um nur diejenigen Webseiten als Treffer zu liefern, denen ein vom Benutzer eingegebener Klassifikationsbegriff zugeordnet wurde.
- Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
eine Einrichtung zum Indexieren der durchsuchten Seiten, denen Personeninformationen und gegebenenfalls weitere Klassifikationsinformationen zugewiesen wurden;
eine Einrichtung zum Matchen der Suchbegriffe mit dem Inhalt des gebildeten Index;
eine Ausgabe der erhaltenen Treffer, wobei die einer Internetseite zugewiesenen Personeninformationen durch Abgleich mit den als Suchbegriff eingegebenen Personennamen als Filterkriterium für die Ausgabe der Trefferliste dienen. - Die Indizierung des Datenbestandes aus Webseiten bzw. Internetadressen, denen Personeninformationen und eventuell noch weitere Informationen wie Personenbeziehungen und/oder Klassifikationsinformationen zugewiesen wurden, ermöglicht den Abgleich mit einer Suchanfrage, die unter anderem ein personenbezogenes Suchkriterium enthält, sowie die Ausgabe der entsprechenden Treffer an den Benutzer.
- Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
einen Datenbestand aus Internetadressen, die vom Crawler heruntergeladen und von der Extraktionseinrichtung durchsucht werden sollen, eine Einrichtung zur dynamischen Anpassung des Datenbestandes durch:
Hinzufügen neuer Links, die beim Durchsuchen der heruntergeladenen Seiten von der Extraktionseinrichtung ermittelt wurden; und/oder Verwerfen von Internetadressen, bei denen die Extraktionseinrichtung festgestellt hat, dass die vorgegebenen Kriterien für die Extraktion einer Bildinformation nicht erfüllt sind; sowie eine Einrichtung zum wiederholten herunterladen und Durchsuchen der Internetadressen des Datenbestandes. - Die dynamische Anpassung des Datenbestandes ermöglicht es, neue Inhalte in den zu durchforstenden Webseitenbestand aufzunehmen sowie nicht relevante Seiten aus diesem zu entfernen, falls diese Seiten einem vordefinierten Relevanzkriterium (z. B. Prominentenstatus nicht entsprechen.
- Gemäß einem Ausführungsbeispiel umfasst eine Suchmaschine: eine Einrichtung zum Ermitteln von anzuzeigenden Zusatzinformationen, die zusätzlich zu den auf eine Suchanfrage hin angezeigten Treffern angezeigt werden, wobei diese Einrichtung aufweist: eine Einrichtung zum Ermitteln des Themengebiets, zu dem Zusatzinformationen angezeigt werden sollen.
- Das Anzeigen von Zusatzinformationen kann für den Benutzer nützlich sein, wenn diese thematisch mit den Treffern in Zusammenhang steht. Auch für den Suchmaschinenbetreiber kann sie – z. B. zur Einblendung von thematisch passender Werbung – nützlich sein.
- Gemäß einem Ausführungsbeispiel sind die angezeigten Zusatzinformationen Werbe-Links und die Reihen folge der Anzeige der Werbe-Links darauf basiert, wir oft bereits auf einen Werbe-Link geclickt wurde. Dies ermöglicht dem Suchmaschinenbetreiber ein effizientes Schalten und Abrechnen von Werbung.
- Kurzbeschreibung der Zeichnungen
-
1 zeigt schematisch einen Aufbau einer Suchmaschine gemäß einem ersten Ausführungsbeispiel der Erfindung. -
2 zeigt ein Flussdiagramm, das den Betrieb einer Suchmaschine gemäß einem Ausführungsbeispiel der Erfindung illustriert. -
3 zeigt ein Flussdiagramm für eine Suchanfrage gemäß einen Ausführungsbeispiel der Erfindung. - Ausführliche Beschreibung der Erfindung
- Nachfolgend wird die vorliegende Erfindung anhand mehrerer Ausführungsbeispiele im Detail beschrieben.
-
1 zeigt schematisch eine Konfiguration gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung. - Eine Suchmaschine gemäß einem ersten Ausführungsbeispiel ist schematisch in
1 dargestellt. - Die Suchmaschine wird implementiert mittels eines Rechners
240 . Der Rechner240 verfügt über eine Verbindung110 zum Internet120 . Mittels einer Einrichtung zum Durchsuchen des Internet, eines sogenannter Web-Crawlers100 , ist der Rechner240 in der Lage, verschiedene Seiten des Internet systematisch herunterzuladen und auf ihre Inhalte zu durchsuchen. Der Web-Crawler100 speichert die Inhalte in einem Web-Crawler-Speicher130 . Eine Einrichtung zur Bildextraktion140 durchsucht die im Web-Crawler-Speicher130 gespeicherten Seiten, um zu ermitteln, ob sie Bilder enthalten. Die gefundenen Bilder werden von der Einrichtung zur Bildextraktion140 hinsichtlich verschiedener Qualitätskriterien und Regeln gefiltert. Als Qualitätskriterien können z. B. die Größe des Bildes, das Format des Bildes, die enthaltenen Metadaten und andere Eigenschaften der Bilder dienen. Die Regeln und Qualitätskriterien sind im Regelwerk150 gespeichert. - Bilder die nicht den Qualitätskriterien entsprechen werden von der Einrichtung zur Bildextraktion aus dem Web-Crawler-Speicher entfernt. Nachdem die Einrichtung zur Bildextraktion
140 die Qualitätskriterien auf alle in Web-Crawler-Speicher130 enthaltenen Bilder angewandt hat, werden die Bilder in den Bildspeicher160 übertragen. Anschließend informiert die Einrichtung zur Bildextraktion140 die Einrichtung zum Finden von Gesichtern170 das Bilder zur Erkennung im Bildspeicher160 liegen. Die Einrichtung zum Finden von Gesichtern170 führt, mittels eines Objekterkennungsalgorithmus, für jedes Bild eine Suche durch. Für die Suche der Gesichter in den Bildern nutzt die Einrichtung zum Finden von Gesichtern170 ein Regelwerk180 welches Regeln und Informationen für den Objekterkennungsalgorithmus und der Einrichtung zum Finden von Gesichtern, zum Finden von Gesichtern in Bilder enthält. - Die in den Bilder gefunden Gesichter werden in Form eines Bildausschnittes zusammen mit der Zuordnung zum Bild und der jeweiligen Internetseite im Gesichtsspeicher
190 gespeichert. - Die erkannten Gesichter werden an die Einrichtung zum Vergleichen von Gesichtern
200 übergeben. Die Einrichtung zum Vergleichen von Gesichtern200 erzeugt für jedes Gesicht eindeutige Identifikationsmerkmale. Anschließend werden die eindeutigen Identifikationsmerkmale von jedem (Gesicht mit den eindeutigen Identifikationsmerkmalen der im Profilspeicher220 gespeicherten Referenzprofilen verglichen. Bei einer ausreichenden Übereinstimmung wird die Bezeichnung des Referenzprofils zusammen mit den Informationen über die Website z. B. Url, Suchdatum, im Datenbestand230 abgelegt. Für die Erstellung der Identifikationsmerkmale nutzt die Einrichtung zum Vergleichen von Gesichtern einen Gesichtsvergleichsalgorithmus. Das Regelwerk555 stellt die notwendigen Regeln und Informationen für den Gesichtsvergleichsalgorithmus bereit. - Als Ergebnis der Anwendung des Extraktionsprozesses, der Gesichtsfindung und der Gesichtserkennung auf den im Web-Crawlen-Speicher
130 abgespeicherten Webseiten ergibt sich ein Datenbestand200 - Eine Eingabeschnittstelle
260 ermöglicht es dem Benutzer, einen oder mehrere Suchbegriffe einzugeben. Als Suchbegriff270 können dabei unter anderen dienen, eine Vornamen, ein Nachnamen oder eine E-Mailadresse sein. Es können auch zusätzliche Suchbegriffe280 verwendet werden, sofern sie von der Suchmaschinen unterstützt werden. - Die Suchanfrage wird dann von der Sucheinrichtung
240 verarbeitet, indem diejenigen Internetseiten im Datenbestand200 gesucht werden, für die die Suchbegriffe zutreffen. Die entsprechenden Internetseiten werden in Form einer Trefferliste290 mittels der Ausgabeschnittstelle250 ausgegeben und dem Benutzer angezeigt. - Nachfolgend wird die Erfindung etwas genauer im Detail gemäß einem weiteren Ausführungsbeispiel beschrieben.
- In einem Schritt
500 durchsucht der Web-Crawler510 mehrere Seiten des Internet. Die kann beispielsweise dadurch geschehen, dass dem Web-Crawler510 eine vordefinierte Anzahl von Internetseiten bereitgestellt wird, beispielsweise in Form einer Datenbasis505 , die dann vom Web-Crawler510 heruntergeladen und im Web-Crawler-Speicher515 abgespeichert wird. - Die im Web-Crawler-Speicher abgespeicherten Seiten werden dann mittels eines Extraktionsprozesses
520 analysiert und die enthaltenen Bilder extrahiert. Der Extraktionsprozess führt für jedes Bild eine Qualitätsprüfung gemäß dem Regelwerk525 durch. Dabei werden zuvor definierte Qualitätskriterien wie z. B. Größe, Farbraum und andere auf die Bilder angewandt. Bilder die nicht den Qualitätskriterien entsprechen werden aus dem Web-Crawler-Speicher515 entfernt. Bilder die den Qualitätskriterien entsprechen werden den jeweiligen Seiten und dem darin enthaltenen Text zugeordnet und im Datenbestand560 gespeichert. Zusätzlich werden die Bilder im Bildspeicher530 zusammen mit der Zuordnung zu den jeweiligen Internetseiten übertragen. - In einem weiteren Schritt werden die im Bildspeicher
530 abgespeichert Bilder von einer Einrichtung zum Finden von Gesichtern540 analysiert und mittels eines Regelwerkes535 auf enthaltenen Gesichter untersucht. Die in den Bilder gefunden Gesichter werden in Form eines Bildausschnittes zusammen mit der Zuordnung zum Bild und der jeweiligen Internetseite im Gesichtsspeicher545 gespeichert. Mittels einer Einrichtung zum Vergleichen von Gesichtern550 wird für jedes eindeutige Identifizierungsmerkmale erzeugt und den Gesichtern zugeordnet. Der Einrichtung zum Vergleichen von Gesichtern550 stehen in einem Profilspeicher560 bereits eine Anzahl von Referenzprofilen zur Verfügung. Die Referenzprofile stehen mindestens aus einem Gesicht, die dem Gesicht zugeordneten eindeutigen Identifikationsmerkmalen, sowie eine Menge an personenbezogenen Daten, wie zum Beispiel Vorname, Name, Geburtsdatum, Geburtsort und weitere. - Für jedes Gesicht um Gesichtsspeicher werden die eindeutigen Identifikationsmerkmale mit allen eindeutigen Identifikationsmerkmalen der Referenzprofile aus dem Profilspeicher
560 verglichen. Das Regelwerk555 stellt dazu die notwendigen Regeln und Informationen für den Gesichtsvergleichsalgorithmus bereit. - Bei einer ausreichenden Übereinstimmung der Identifikationsmerkmale wird das Gesicht mit Bezug zu dem ihm enthaltenen Bild, der Internetseite und dem Referenzprofil aus dem Profilspeicher im Datenbestand gespeichert.
- Gemäß einem weiteren Ausführungsbeispiel kann die Einrichtung zum Finden von Gesichtern
170 in Bilder auch andere Muster und Objekte in den extrahierten Bildern Finden. Dazu wird der Einrichtung zum Finden von Gesichtern170 ein Regelwerk180 bereitgestellt welches die benötigten Informationen zum Finden der im Regelwerk definierten Objekte enthält. Die gefunden Objekte werden dann um Objektspeicher545 gespeichert. - In einem weiteren Schritt kann die Einrichtung zum Vergleichen von Gesichtern
200 für die Objekte eindeutiges Identifikationsmerkmale erstellen. Für die Erstellung der Identifikationsmerkmale wird der Einrichtung zum Vergleichen von Objekten200 ein Regelwerk210 genutzt welches die Informationen zur Extraktion der Identifikationsmerkmale enthält. Die extrahierten Identifikationsmerkmale werden von der Einrichtung zum Vergleich von Objekten200 mit den Identifikationsmerkmalen der Objekte im Profilspeicher220 verglichen. Die Referenzprofile bestehen mindestens aus einem Bild, den zugehörigen Identifikationsmerkmalen sowie weitere Informationen wie Größe, Farbe, Form, Material usw. - Bei einer ausreichenden Übereinstimmung der Identifikationsmerkmale wird das Objekt mit Bezug zu dem ihm enthaltenen Bild, der Internetseite und dem Referenzprofil aus dem Profilspeicher
220 im Datenbestand230 gespeichert. - Als Ergebnis der Anwendung des Extraktionsprozesses und der Gesichtererkennung und Gesichtsvergleich auf die um Web-Crawler-Speicher abgespeicherten Internetseiten ergibt sich ein Datenbestand
230 aus Internetseiten, denen jeweils mehrere Bilder, Gesichter und Referenzprofile zugeordnet sind. Ein Beispiel eines Auszuges des Datenbestandes ist in den Tabelle 1 bis 5 nachfolgend dargestellt. - Tabelle 1 zeigt dabei die Zuordnung der URL der Webseite einer Beschreibung und dem Aufnahemdatum in den Index. Die Website wird durch eine eineindeutige WebsiteID eindeutig gekennzeichnet. Es ist darauf hinzuweisen, das die Tabelle 1 lediglich beispielhaft Aufnahmedatum und Beschreibung enthält. Die Tabelle kann zusätzlich weitere Spalten enthalten.
- Tabelle 2 zeigt die Zuordnung der Bilder zur Webseite. Jedes Bild ist durch eine BildID eineindeutig gekennzeichnet. Zusätzlich enthält die Tabelle den Bildnamen, die Url des Bildes sowie die Anzahl der im Bild enthaltenen Gesichter. Mittel des WebsiteID ist das Bild einer Website zugeordnet. Die WebsiteID assoziiert die in Tabelle 1 enthaltene Informationen. Es ist auch hier darauf hinzuweisen, das Tabelle 2 lediglich beispielhaft URL und die Anzahl enthaltener Gesichter enthält. Die Tabelle kann Zusätzliche Spalten enthalten.
- Tabelle 3 zeigt beispielhaft den Aufbau eines Referenzprofiles für eine Person. Jedes Profil ist dabei durch eine eineindeutige ProfilID gekennzeichnet. Darüber hinaus enthält jedes Profil den Vornamen, Nachnamen und E-Mailadresse der Person. Darüber hinaus werden die Identifikationsmerkmale (IDMerkmale) und der Speicherort des Gesichtsbilder der Person gespeichert. Es ist hier darauf hinzuweisen, das Tabelle 3 lediglich beispielhaft Vorname, Nachname, E-Mailadresse, IDMerkmale und Bildpfad enthält. Die Tabelle kann zusätzliche Spalten und Informationen enthalten.
- Tabelle 4 zeigt die Zuordnung der Bilder zu den enthaltenen Gesichtern, den identifizierten Personen und der Website. Die Website wird dazu durch seine eineindeutige WebsiteID repräsentiert. Jedes Bild wird durch seine eineindeutige BildID repräsentiert. Jedes Gesicht wird durch seinen eineindeutige GesichtsID repräsentiert. Jede identifizierte Person wird durch seine eineindeutige ProfilID repräsentiert.
- Eine Zeile repräsentiert dabei die Zuordnung einer Person zu einem Gesicht durch die ProfilID und GesichtsID. Des weiteren enthält die Zeile die Zuordnung des Gesichtes (GesichtsID) zum Bild (BildID), welches das Gesicht enthält. Außerdem ist mit der Zuordnung zur WebsiteID, das Bild (BildID), das Gesicht (GesichtID) und Profile (ProfilID), der Webseite zugeordnet. Es ist darauf hinzuweisen, das die Tabelle auch weitere Spalten enthalten kann.
- Tabelle 5 zeigt die Zuordnung einzelner Schlagwörter zu einer Website. Dabei wird jedes Wort durch eine eineindeutige WortID repräsentiert. Die Spalte Wort enthält das Schlagwort. Mit der Zuordnung zur WebsiteID ist das Schlagwort der Website zugeordnet. Es ist hier darauf hinzuweisen, das Tabelle 35 lediglich beispielhaft Wörter enthält. Die Tabelle kann zusätzliche Spalten und Informationen enthalten.
- Die Tabellen 1 bis 5 zeigen lediglich schematisch ein mögliches Beispiel für Darstellung der Datensätze wie sie sich aus dem Extraktionsprozess gemäß der vorstehenden Beschreibung ergeben könnten.
- Gemäß einem Ausführungsbeispiel kann der Datenbestand, der vom Crawler heruntergeladen und vom Extraktionsprozess analysiert wird, sich dynamisch verändern. Hierzu kann beispielsweise beim Extraktionsprozess neben der Suche Gesichtern auch eine Suche nach Links in der Webseite durchgeführt werden kann, ein Prozess, der im Extraktionsmechanismus in
2 nicht grafisch dargestellt ist. Wird ein derartiger Link, der auf eine weitere Webseite verweist, gefunden, so kann dieser Link dem Bestand an zu durchsuchenden Adressen hinzugefügt werden, so dass sich dieser Bestand dynamisch durch Aufnahme derartiger aufgefundener Links verändert. Auf ähnliche Weise können Bilder des Bestandes, in denen kein Gesicht gefunden werden konnte oder für die sonstige Kriterien, die für die Aufnahme in den Datenbestand erforderlich sind, nicht erfüllt waren, aus dem zu durchsuchenden Datenbestand entfernt werden. - Diese dynamische Veränderung des Datenbestands ermöglicht es, dass sich der resultierende Datenbestand dynamisch an Veränderungen im Internet anpasst. Hierzu ist noch anzumerken, dass zu diesem Zweck natürlich der gesamte Prozess der Extraktion wiederholt durchgeführt werden sollte. Auf der Grundlage des resultierenden und sich gegebenenfalls dynamisch veränderlichen Datenbestands
250 kann dann eine Suche basierend auf einer Suchanfrage eines Benutzers durchgeführt werden. Dies wird nachfolgend etwas genauer im Detail beschrieben. - Das Verarbeiten einer Suchanfrage
440 wird nun nachfolgend unter Bezugnahme auf3 beschrieben. Ausgehend vom Datenbestand400 , der das Ergebnis des crawlens, des Extraktionsprozesses, der Gesichtserkennung und dem Gesichtsvergleich ist, der unter Bezugnahme auf2 beschrieben wurde, wird dieser Datenbestand400 indexiert410 . Hierzu werden die auf der Seite vorhandenen Informationen (z. B. Meta Tags, Titel, Überschriften, reiner Text, das Verhältnis von Links zu Text), d. h. der Anzahl der Links auf einer URL im Vergleich zu den nicht verlinkten Wörtern, als auch die sie beschreibenden Informationen (z. B. Bezeichner innerhalb einer URL; Anzahl, Bezeichnung und Quellen der Links, die auf diese Seite verweisen) sowie extrahiert und können in einer oder mehreren separaten Indices gespeichert werden. Die Bilder und die zugeordneten Personen mit Bezug zu den Seiten werden ebenfalls in den Indices gespeichert. - Diese ein oder mehreren separaten Indices bilden dann den in
3 dargestellten lokalen Index420 . Der Index420 kann dabei auf herkömmliche Art und Weise auf der Grundlage der Webseiten des Datenbestandes gebildet sein. Das bedeutet, dass z. B. ein Volltextindex über die Seiten des Bestandes gebildet wird, wobei jedem Begriff, Personennamen und Bild des so gebildeten Index420 die entsprechende Website zugeordnet ist. Zusätzlich zu der Website-Adresse ist aber einem Begriff, der im Index enthalten ist, auch noch die Personeninformation zugeordnet, die zu dieser Website gehört und im Extraktionsprozess extrahiert wurde. Ein Ausschnitt eines so gebildeten Index420 kann dabei wie oben in den Tabellen1-5 dargestellt aussehen. - Gemäß einem Ausführungsbeispiel kann die Ausgabe mittels einer Ausgabeschnittstelle
450 durchgeführt werden, die dem Benutzer die Ergebnisse470 in vorzugsweise nach Relevanz460 geordneter Form anzeigt, beispielsweise in einer Reihenfolge, die Ergebnis eines sogenannten (Ranking-Prozesses) ist. Eine Möglichkeit zur Durchführung eines Ranking-Prozesses ist beispielsweise die Verwendung des sogenannten Page-Rank-Verfahrens, das imUS-Patent 6,285,999 beschrieben wird. Wird kein solches Ranking durchgeführt können auch die Ergebnisse470 in ungeordneter Form dem Benutzer präsentiert werden. Des weiteren ist eine Ausgabe aller Ergebnisse470 rein nach personenbezogenen Kriterien möglich, z. B. alle Personen im gleichen Alter. - ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- - US 6285999 [0062]
Claims (11)
- Suchmaschine zum Durchführen einer Suche nach Internetseiten, für die ein vom Benutzer als Suchbegriff eingegebenes personenbezogenes Kriterium erfüllt ist, wobei die Suchmaschine aufweist: Eine Einrichtung zum Durchsuchen einer Mehrzahl von Internetseiten-, Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern der durchsuchten Internetseiten, wobei die Gesichter den Bildern zugeordnet sind, Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden, Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Identifikationsmerkmale der Gesichter aus den Referenzprofilen und extrahierten Gesichtern genutzt werden, eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind; eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht; eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
- Suchmaschine nach einem der Anspruch 1, wobei die Suchmaschine aufweist: Eine Einrichtung zum Hinterlegen der extrahierten Gesichter, wobei die Einrichtung die Bilder in einem Speicher ablegt, der von weiteren Einrichtungen genutzt werden kann.
- Suchmaschine nach einem der Ansprüche 1 oder 2, wobei die Suchmaschine aufweist: Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern, wobei die Einrichtung aufweist eine Einrichtung zum Erstellen von Referenzprofilen aus den vom Benutzer vorher identifizierten Gesichtern. Wobei die Einrichtung aufweist eine Einrichtung zum Extrahieren von Identifikationsmerkmalen mittels geeigneter Algorithmen. Wobei die Einrichtung aufweist eine Einrichtung zum Speichern von Identifikationsmerkmalen mit Bezug zum Gesicht und den Kontaktinformationen.
- Suchmaschine nach einem der Ansprüche 1, 2 oder 3 welche ferner aufweist: Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Einrichtung aufweist eine Einrichtung zum Vergleichen der Identifikationsmerkmale der Gesichter und Bestimmung der Ähnlichkeit von Gesichtern.
- Suchmaschine nach einem der Ansprüche 1 bis 4, welche ferner aufweist: Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern, wobei die Einrichtung aufweist eine Einrichtung zum Finden von Gesichtern mit einem geeigneten Algorithmus. Wobei die Einrichtung aufweist eine Einrichtung zum Extrahieren der Gesichter aus der Bildquelle. Wobei die Einrichtung aufweist eine Einrichtung zum Speichern der Bildausschnitte mit den Gesichtern.
- Suchmaschine nach einem der Ansprüche 1 bis 5, welche ferner aufweist: Eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind.
- Suchmaschine nach einem der Ansprüche 1 bis 6, welche ferner aufweist: Eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht.
- Suchmaschine nach einem der Ansprüche 1 bis 7, welche ferner aufweist: Eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
- Suchmaschine nach einem der Ansprüche 1 bis 8, welche ferner aufweist: Eine Einrichtung zum Durchsuchen der einzelnen Internetseiten nach einer Mehrzahl von Begriffen, die geeignet sind, die Internetseiten hinsichtlich des angebotenen Inhalts zu klassifizieren, wobei im Falle eines Treffers gegebenenfalls unter Anwendung weiterer Bedingungen der Internetseite eine entsprechende Klassifikation zugewiesen wird.
- Suchmaschine nach einem der Ansprüche 1 bis 9, welche ferner aufweist: einen Datenbestand aus Internetadressen, die vom Crawler heruntergeladen und von der Extraktionseinrichtung durchsucht werden sollen, eine Einrichtung zur dynamischen Anpassung des Datenbestandes durch: Hinzufügen neuer Links, die beim Durchsuchen der heruntergeladenen Seiten von der Extraktionseinrichtung ermittelt wurden; und/oder Verwerfen von Internetadressen, bei denen die Extraktionseinrichtung festgestellt hat, dass die vorgegebenen Kriterien für die Extraktion eines Bildes nicht erfüllt sind; sowie eine Einrichtung zum wiederholten herunterladen und Durchsuchen der Internetadressen des Datenbestandes.
- Suchmaschine nach einem der Ansprüche 1 bis 10, welche ferner aufweist: die angezeigten Zusatzinformationen Werbe-Links sind und die Reihenfolge der Anzeige der Werbe-Links darauf basiert, wir oft bereits auf einen Werbe-Link geclickt wurde
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE202009006918U DE202009006918U1 (de) | 2009-05-13 | 2009-05-13 | Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE202009006918U DE202009006918U1 (de) | 2009-05-13 | 2009-05-13 | Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker |
Publications (1)
Publication Number | Publication Date |
---|---|
DE202009006918U1 true DE202009006918U1 (de) | 2009-07-23 |
Family
ID=40897195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE202009006918U Expired - Lifetime DE202009006918U1 (de) | 2009-05-13 | 2009-05-13 | Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE202009006918U1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111209425A (zh) * | 2020-01-06 | 2020-05-29 | 闻泰通讯股份有限公司 | 图像搜索方法、装置、电子设备及计算机可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
-
2009
- 2009-05-13 DE DE202009006918U patent/DE202009006918U1/de not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111209425A (zh) * | 2020-01-06 | 2020-05-29 | 闻泰通讯股份有限公司 | 图像搜索方法、装置、电子设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102007037646B4 (de) | Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken | |
DE60004687T2 (de) | Verfahren zur thematischen klassifikation von dokumenten, modul zur thematischen klassifikation und ein derartiges modul beinhaltende suchmaschine | |
DE69526168T2 (de) | Verfahren und Gerät zur Klassifikation von Dokumentinformationen | |
DE69718798T2 (de) | Echtzeitsuchmotor mit strukturierten zusammenfassungen | |
DE602004003361T2 (de) | System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen | |
DE69431351T2 (de) | Verfahren und gerät zum indexieren, suchen und anzeigen von daten | |
DE112020002600T5 (de) | Entdecken einer semantischen bedeutung von datenfeldern anhand von profildaten der datenfelder | |
DE69231113T2 (de) | Speicherverfahren für bibliographische Information über Daten aus einer endlichen Textquelle, und insbesondere Dokumentverbuchungen zur Verwendung in einem Suchsystem für Ganztextdokumente | |
WO2007042245A1 (de) | Suchmaschine für eine ortsbezogene suche | |
DE3911465A1 (de) | Verfahren zur konfiguration technischer systeme aus komponenten | |
DE102016003850A1 (de) | Empfehlen von Formularfragmenten | |
DE202013005812U1 (de) | System zum indexieren elektronischer Inhalte | |
DE102019108857A1 (de) | Automatisiertes maschinelles Lernen auf Basis gespeicherten Daten | |
DE202009006918U1 (de) | Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker | |
EP1285385B1 (de) | Verfahren zum auffinden von objekten | |
DE10261839A1 (de) | Verfahren und Einrichtung zur Durchführung einer elektronischen Recherche | |
EP1734469A2 (de) | Verfahren zur Auswahl von Datensätzen | |
DE102006043158A1 (de) | Verfahren zum Ermitteln von Elementen eines einer Suchanfrage zugeordneten Suchergebnisses in einer Reihenfolge und Suchmaschine | |
DE202022101222U1 (de) | Ein automatisch skalierbares System für optimierte Arbeitsempfehlungen | |
WO2021204849A1 (de) | Verfahren und computersystem zur bestimmung der relevanz eines textes | |
DE19842320A1 (de) | Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten | |
DE69132678T2 (de) | Ein textverwaltungssystem | |
DE202022106616U1 (de) | Ein System zur Darstellung und Einordnung von Formeln für die Suche nach mathematischen Informationen | |
DE102018104438A1 (de) | Computerimplementiertes Verfahren zum Beschaffen von Informationen | |
WO2011044864A1 (de) | Verfahren und system zum klassifizieren von objekten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R207 | Utility model specification |
Effective date: 20090827 |
|
R081 | Change of applicant/patentee |
Owner name: PIXRAY GMBH, DE Free format text: FORMER OWNER: STEFAN BAER, 14482 POTSDAM, DE Effective date: 20110926 Owner name: PIXRAY GMBH, DE Free format text: FORMER OWNER: BAER, STEFAN, M.SC., 14482 POTSDAM, DE Effective date: 20110926 |
|
R081 | Change of applicant/patentee |
Owner name: PIXRAY GMBH, DE Free format text: FORMER OWNER: HIT LABS GMBH, 14482 POTSDAM, DE Effective date: 20120326 |
|
R150 | Term of protection extended to 6 years |
Effective date: 20120605 |
|
R151 | Term of protection extended to 8 years | ||
R151 | Term of protection extended to 8 years |
Effective date: 20150609 |
|
R152 | Term of protection extended to 10 years | ||
R071 | Expiry of right |