DE202009006918U1 - Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker - Google Patents

Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker Download PDF

Info

Publication number
DE202009006918U1
DE202009006918U1 DE202009006918U DE202009006918U DE202009006918U1 DE 202009006918 U1 DE202009006918 U1 DE 202009006918U1 DE 202009006918 U DE202009006918 U DE 202009006918U DE 202009006918 U DE202009006918 U DE 202009006918U DE 202009006918 U1 DE202009006918 U1 DE 202009006918U1
Authority
DE
Germany
Prior art keywords
faces
search
search engine
user
engine according
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE202009006918U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PIXRAY GMBH, DE
Original Assignee
Bar Stefan Msc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bar Stefan Msc filed Critical Bar Stefan Msc
Priority to DE202009006918U priority Critical patent/DE202009006918U1/de
Publication of DE202009006918U1 publication Critical patent/DE202009006918U1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Suchmaschine zum Durchführen einer Suche nach Internetseiten, für die ein vom Benutzer als Suchbegriff eingegebenes personenbezogenes Kriterium erfüllt ist, wobei die Suchmaschine aufweist:
Eine Einrichtung zum Durchsuchen einer Mehrzahl von Internetseiten-,
Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern der durchsuchten Internetseiten, wobei die Gesichter den Bildern zugeordnet sind,
Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden,
Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Identifikationsmerkmale der Gesichter aus den Referenzprofilen und extrahierten Gesichtern genutzt werden,
eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind;
eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht;
eine Einrichtung zum Durchsuchen des Datenbestands und...

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft eine Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker
  • Hintergrund der Erfindung
  • Suchmaschinen sind spezielle Rechner bzw. programmierte Rechenanlagen für die Suche nach Webseiten, die bestimmte von einem Benutzer eingegebene Suchkriterien erfüllen. Um Ihre Aufgabe zu erfüllen, lädt eine Suchmaschine die Seiten des Internet auf den Rechner der Suchmaschine, indiziert die geladenen Seiten hinsichtlich vom Benutzer eingegebener Suchkriterien zu filtern und dem Benutzer die dann die gefundenen Seiten, sogenannten Treffer oder Hints anzuzeigen.
  • Für das herunterladen enthält eine Suchmaschine typischerweise einen sogenannten Crawler, der automatisch Internetadressen aufruft und die Inhalte der zugehörigen Webseiten für die weitere Verarbeitung (Indizierung) herunterlädt.
  • Neben den Textinformation können Webseiten Bilder und Video enthalten. Bilder werden typischerweise von sogenannten Crawler heruntergeladen und gespeichert.
  • Im Gegensatz zu den schon seit langem bekannten Datenbanken sind die Inhalte von Webseiten allerdings in der Regel unstrukturierte Informationen, der Bedeutungsinhalt der einzelnen Begriffe (Terme) einer Webseite ist nur schwer identifizierbar. Dies schränkt die Möglichkeiten der Indizierung und damit die Suchmöglichkeiten stark ein. De facto ist eine von einer Suchmaschine vorgenommene Webseiten-Indizierung daher immer eine Volltext-Indizierung. Das Bedeutet aus sämtlichen Begriffen, die auf der Webseite vorkommen (ausgenommen vordefinierter bedeutungsloser Stop-Wörter) wird ein Volltext-Index gebildet, auf den dann die Suchanfrage „gematcht" wird.
  • Bilder werden bei der Indizierung nicht wie Text behandelt. Bilder werden typischerweise mit dem Volltext-Index der Webseiten in Beziehung gesetzt. Die Suchkriterien die des Benutzers werden typischerweise auch auf die Bilder angewendet. Darüber hinaus werden der Dateiname des Bildes und die gegebenenfalls vorhanden Metainformationen der Bilddatei in den Index der Suchmaschine aufgenommen.
  • Bei der herkömmlichen Suchmaschinentechnologie gibt der Benutzer in ein Eingabeinterface Suchbegriffe ein, auf deren Basis dann eine Suchanfrage (Query) an einen Datenbestand (Index) der Suchmaschine geschickt wird. Ein Anwendung der Suchbegriffe auf den Datenbestand bzw. Index ergibt dann gegebenenfalls Übereinstimmungen (Matches bzw. Treffer) und die entsprechenden Webseiten bzw. Links werden dem Benutzer angezeigt. Werden die Suchbegriffe im Kontext einer Bildersuche in das Eingabeinterface eingegeben, werden die Suchbegriffe mit dem Datenbestand abgeglichen und bei Übereinstimmungen werden diese dem Benutzer in Form einer Bildervorschau und die Links zu den Webseiten in denen sich die Bilder befinden angezeigt.
  • Das Problem der herkömmlichen Suchmaschine besteht darin, das es schwierig ist den Inhalt eines Bildes zu ermitteln. Spezielle Suchmaschinen sind zwar in der Lage, mittels geeigneter Algorithmen, zu ermitteln ob ein Bild ein Gesicht enthält, aber auch sie können diese Person nicht identifizieren (erkennen um welche Person z. B. Vor- und Zuname) indem sie der Person den richtigen Namen zuordnen.
  • Es ist daher die Aufgabe der vorliegenden Erfindung, eine Suchmaschine bereitzustellen, die diejenigen Bilder mit den dazugehörigen Webseiten als Treffer liefert, für die eine gesuchte Person enthält.
  • Zusammenfassung der Erfindung
  • Gemäß einem Ausführungsbeispiel der Erfindung umfasst die Erfindung eine Suchmaschine zum Durchführen einer Suche nach Bildern in Internetseiten, für die ein vom Benutzer als Suchbegriff eingegebenen Personennamen erfüllt. Wobei die Suchmaschine aufweist:
    Eine Einrichtung zum Durchsuchen einer Mehrzahl von Internetseiten,
    Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern der durchsuchten Internetseiten, wobei die Gesichter den Bildern zugeordnet sind,
    Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden,
    Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Identifikationsmerkmale der Gesichter aus den Referenzprofilen und extrahierten Gesichtern genutzt werden,
    Eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind,
    Eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht,
    Eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    Eine Einrichtung zur Extraktion der Gesichter. Dabei werden Bildausschnitte aus den vom Webcrawler extrahierten Bildern extrahiert und zur weiteren Verarbeitung mit einem Bezug zur Bildquelle und der das Bild enthaltenen Internetseite gespeichert.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    Eine Einrichtung zur Bildung eines Datenbestanden aus Referenzprofilen aus Personeninformationen, insbesondere Gesichtsbilder und Klassifikationsmerkmale wie Vorname, Nachname, Geburtsdatum usw.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    eine Einrichtung zur Verknüpfung der durchsuchten Internetseite, indem basierend auf den extrahierten Personeninformationen durch Abgleich mit einem Datenbestand aus existierenden Personeninformationsdaten zu einem extrahierte Bildes mittels eines Gesichtserkennungsalgorithmus ermittelt und der Internetseite zugewiesen wird.
  • Die Zuordnung von Personendaten zu den Webseiten basierend auf den extrahierten Personeninformationen ermöglicht es, die Suche exakt auf durch Personennamen definierte Suchbedingungen einzuschränken und entsprechende Treffer auszugeben.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
  • Eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht.
  • Eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    eine Einrichtung zum Durchsuchen der einzelnen Internetseiten nach einer Mehrzahl von Begriffen, die geeignet sind, die Internetseiten hinsichtlich des angebotenen Inhalts zu klassifizieren, wobei im Falle eines Treffers – gegebenenfalls unter Anwendung weiterer Bedingungen – der Internetseite eine entsprechende Klassifikation zugewiesen wird.
  • Das Durchsuchen nach Klassifikationsbegriffen aus einem vordefinierten Bestand solcher Begriffe ermöglicht die Zuordnung solcher Klassifikationsbegriffe zu den einzelnen Webseiten. Dies kann dann beispielsweise zu einer weiteren Spezifizierung der Suchanfrage verwendet werden, etwa um nur diejenigen Webseiten als Treffer zu liefern, denen ein vom Benutzer eingegebener Klassifikationsbegriff zugeordnet wurde.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    eine Einrichtung zum Indexieren der durchsuchten Seiten, denen Personeninformationen und gegebenenfalls weitere Klassifikationsinformationen zugewiesen wurden;
    eine Einrichtung zum Matchen der Suchbegriffe mit dem Inhalt des gebildeten Index;
    eine Ausgabe der erhaltenen Treffer, wobei die einer Internetseite zugewiesenen Personeninformationen durch Abgleich mit den als Suchbegriff eingegebenen Personennamen als Filterkriterium für die Ausgabe der Trefferliste dienen.
  • Die Indizierung des Datenbestandes aus Webseiten bzw. Internetadressen, denen Personeninformationen und eventuell noch weitere Informationen wie Personenbeziehungen und/oder Klassifikationsinformationen zugewiesen wurden, ermöglicht den Abgleich mit einer Suchanfrage, die unter anderem ein personenbezogenes Suchkriterium enthält, sowie die Ausgabe der entsprechenden Treffer an den Benutzer.
  • Gemäß einem Ausführungsbeispiel umfasst die Suchmaschine ferner:
    einen Datenbestand aus Internetadressen, die vom Crawler heruntergeladen und von der Extraktionseinrichtung durchsucht werden sollen, eine Einrichtung zur dynamischen Anpassung des Datenbestandes durch:
    Hinzufügen neuer Links, die beim Durchsuchen der heruntergeladenen Seiten von der Extraktionseinrichtung ermittelt wurden; und/oder Verwerfen von Internetadressen, bei denen die Extraktionseinrichtung festgestellt hat, dass die vorgegebenen Kriterien für die Extraktion einer Bildinformation nicht erfüllt sind; sowie eine Einrichtung zum wiederholten herunterladen und Durchsuchen der Internetadressen des Datenbestandes.
  • Die dynamische Anpassung des Datenbestandes ermöglicht es, neue Inhalte in den zu durchforstenden Webseitenbestand aufzunehmen sowie nicht relevante Seiten aus diesem zu entfernen, falls diese Seiten einem vordefinierten Relevanzkriterium (z. B. Prominentenstatus nicht entsprechen.
  • Gemäß einem Ausführungsbeispiel umfasst eine Suchmaschine: eine Einrichtung zum Ermitteln von anzuzeigenden Zusatzinformationen, die zusätzlich zu den auf eine Suchanfrage hin angezeigten Treffern angezeigt werden, wobei diese Einrichtung aufweist: eine Einrichtung zum Ermitteln des Themengebiets, zu dem Zusatzinformationen angezeigt werden sollen.
  • Das Anzeigen von Zusatzinformationen kann für den Benutzer nützlich sein, wenn diese thematisch mit den Treffern in Zusammenhang steht. Auch für den Suchmaschinenbetreiber kann sie – z. B. zur Einblendung von thematisch passender Werbung – nützlich sein.
  • Gemäß einem Ausführungsbeispiel sind die angezeigten Zusatzinformationen Werbe-Links und die Reihen folge der Anzeige der Werbe-Links darauf basiert, wir oft bereits auf einen Werbe-Link geclickt wurde. Dies ermöglicht dem Suchmaschinenbetreiber ein effizientes Schalten und Abrechnen von Werbung.
  • Kurzbeschreibung der Zeichnungen
  • 1 zeigt schematisch einen Aufbau einer Suchmaschine gemäß einem ersten Ausführungsbeispiel der Erfindung.
  • 2 zeigt ein Flussdiagramm, das den Betrieb einer Suchmaschine gemäß einem Ausführungsbeispiel der Erfindung illustriert.
  • 3 zeigt ein Flussdiagramm für eine Suchanfrage gemäß einen Ausführungsbeispiel der Erfindung.
  • Ausführliche Beschreibung der Erfindung
  • Nachfolgend wird die vorliegende Erfindung anhand mehrerer Ausführungsbeispiele im Detail beschrieben.
  • 1 zeigt schematisch eine Konfiguration gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung.
  • Eine Suchmaschine gemäß einem ersten Ausführungsbeispiel ist schematisch in 1 dargestellt.
  • Die Suchmaschine wird implementiert mittels eines Rechners 240. Der Rechner 240 verfügt über eine Verbindung 110 zum Internet 120. Mittels einer Einrichtung zum Durchsuchen des Internet, eines sogenannter Web-Crawlers 100, ist der Rechner 240 in der Lage, verschiedene Seiten des Internet systematisch herunterzuladen und auf ihre Inhalte zu durchsuchen. Der Web-Crawler 100 speichert die Inhalte in einem Web-Crawler-Speicher 130. Eine Einrichtung zur Bildextraktion 140 durchsucht die im Web-Crawler-Speicher 130 gespeicherten Seiten, um zu ermitteln, ob sie Bilder enthalten. Die gefundenen Bilder werden von der Einrichtung zur Bildextraktion 140 hinsichtlich verschiedener Qualitätskriterien und Regeln gefiltert. Als Qualitätskriterien können z. B. die Größe des Bildes, das Format des Bildes, die enthaltenen Metadaten und andere Eigenschaften der Bilder dienen. Die Regeln und Qualitätskriterien sind im Regelwerk 150 gespeichert.
  • Bilder die nicht den Qualitätskriterien entsprechen werden von der Einrichtung zur Bildextraktion aus dem Web-Crawler-Speicher entfernt. Nachdem die Einrichtung zur Bildextraktion 140 die Qualitätskriterien auf alle in Web-Crawler-Speicher 130 enthaltenen Bilder angewandt hat, werden die Bilder in den Bildspeicher 160 übertragen. Anschließend informiert die Einrichtung zur Bildextraktion 140 die Einrichtung zum Finden von Gesichtern 170 das Bilder zur Erkennung im Bildspeicher 160 liegen. Die Einrichtung zum Finden von Gesichtern 170 führt, mittels eines Objekterkennungsalgorithmus, für jedes Bild eine Suche durch. Für die Suche der Gesichter in den Bildern nutzt die Einrichtung zum Finden von Gesichtern 170 ein Regelwerk 180 welches Regeln und Informationen für den Objekterkennungsalgorithmus und der Einrichtung zum Finden von Gesichtern, zum Finden von Gesichtern in Bilder enthält.
  • Die in den Bilder gefunden Gesichter werden in Form eines Bildausschnittes zusammen mit der Zuordnung zum Bild und der jeweiligen Internetseite im Gesichtsspeicher 190 gespeichert.
  • Die erkannten Gesichter werden an die Einrichtung zum Vergleichen von Gesichtern 200 übergeben. Die Einrichtung zum Vergleichen von Gesichtern 200 erzeugt für jedes Gesicht eindeutige Identifikationsmerkmale. Anschließend werden die eindeutigen Identifikationsmerkmale von jedem (Gesicht mit den eindeutigen Identifikationsmerkmalen der im Profilspeicher 220 gespeicherten Referenzprofilen verglichen. Bei einer ausreichenden Übereinstimmung wird die Bezeichnung des Referenzprofils zusammen mit den Informationen über die Website z. B. Url, Suchdatum, im Datenbestand 230 abgelegt. Für die Erstellung der Identifikationsmerkmale nutzt die Einrichtung zum Vergleichen von Gesichtern einen Gesichtsvergleichsalgorithmus. Das Regelwerk 555 stellt die notwendigen Regeln und Informationen für den Gesichtsvergleichsalgorithmus bereit.
  • Als Ergebnis der Anwendung des Extraktionsprozesses, der Gesichtsfindung und der Gesichtserkennung auf den im Web-Crawlen-Speicher 130 abgespeicherten Webseiten ergibt sich ein Datenbestand 200
  • Eine Eingabeschnittstelle 260 ermöglicht es dem Benutzer, einen oder mehrere Suchbegriffe einzugeben. Als Suchbegriff 270 können dabei unter anderen dienen, eine Vornamen, ein Nachnamen oder eine E-Mailadresse sein. Es können auch zusätzliche Suchbegriffe 280 verwendet werden, sofern sie von der Suchmaschinen unterstützt werden.
  • Die Suchanfrage wird dann von der Sucheinrichtung 240 verarbeitet, indem diejenigen Internetseiten im Datenbestand 200 gesucht werden, für die die Suchbegriffe zutreffen. Die entsprechenden Internetseiten werden in Form einer Trefferliste 290 mittels der Ausgabeschnittstelle 250 ausgegeben und dem Benutzer angezeigt.
  • Nachfolgend wird die Erfindung etwas genauer im Detail gemäß einem weiteren Ausführungsbeispiel beschrieben.
  • In einem Schritt 500 durchsucht der Web-Crawler 510 mehrere Seiten des Internet. Die kann beispielsweise dadurch geschehen, dass dem Web-Crawler 510 eine vordefinierte Anzahl von Internetseiten bereitgestellt wird, beispielsweise in Form einer Datenbasis 505, die dann vom Web-Crawler 510 heruntergeladen und im Web-Crawler-Speicher 515 abgespeichert wird.
  • Die im Web-Crawler-Speicher abgespeicherten Seiten werden dann mittels eines Extraktionsprozesses 520 analysiert und die enthaltenen Bilder extrahiert. Der Extraktionsprozess führt für jedes Bild eine Qualitätsprüfung gemäß dem Regelwerk 525 durch. Dabei werden zuvor definierte Qualitätskriterien wie z. B. Größe, Farbraum und andere auf die Bilder angewandt. Bilder die nicht den Qualitätskriterien entsprechen werden aus dem Web-Crawler-Speicher 515 entfernt. Bilder die den Qualitätskriterien entsprechen werden den jeweiligen Seiten und dem darin enthaltenen Text zugeordnet und im Datenbestand 560 gespeichert. Zusätzlich werden die Bilder im Bildspeicher 530 zusammen mit der Zuordnung zu den jeweiligen Internetseiten übertragen.
  • In einem weiteren Schritt werden die im Bildspeicher 530 abgespeichert Bilder von einer Einrichtung zum Finden von Gesichtern 540 analysiert und mittels eines Regelwerkes 535 auf enthaltenen Gesichter untersucht. Die in den Bilder gefunden Gesichter werden in Form eines Bildausschnittes zusammen mit der Zuordnung zum Bild und der jeweiligen Internetseite im Gesichtsspeicher 545 gespeichert. Mittels einer Einrichtung zum Vergleichen von Gesichtern 550 wird für jedes eindeutige Identifizierungsmerkmale erzeugt und den Gesichtern zugeordnet. Der Einrichtung zum Vergleichen von Gesichtern 550 stehen in einem Profilspeicher 560 bereits eine Anzahl von Referenzprofilen zur Verfügung. Die Referenzprofile stehen mindestens aus einem Gesicht, die dem Gesicht zugeordneten eindeutigen Identifikationsmerkmalen, sowie eine Menge an personenbezogenen Daten, wie zum Beispiel Vorname, Name, Geburtsdatum, Geburtsort und weitere.
  • Für jedes Gesicht um Gesichtsspeicher werden die eindeutigen Identifikationsmerkmale mit allen eindeutigen Identifikationsmerkmalen der Referenzprofile aus dem Profilspeicher 560 verglichen. Das Regelwerk 555 stellt dazu die notwendigen Regeln und Informationen für den Gesichtsvergleichsalgorithmus bereit.
  • Bei einer ausreichenden Übereinstimmung der Identifikationsmerkmale wird das Gesicht mit Bezug zu dem ihm enthaltenen Bild, der Internetseite und dem Referenzprofil aus dem Profilspeicher im Datenbestand gespeichert.
  • Gemäß einem weiteren Ausführungsbeispiel kann die Einrichtung zum Finden von Gesichtern 170 in Bilder auch andere Muster und Objekte in den extrahierten Bildern Finden. Dazu wird der Einrichtung zum Finden von Gesichtern 170 ein Regelwerk 180 bereitgestellt welches die benötigten Informationen zum Finden der im Regelwerk definierten Objekte enthält. Die gefunden Objekte werden dann um Objektspeicher 545 gespeichert.
  • In einem weiteren Schritt kann die Einrichtung zum Vergleichen von Gesichtern 200 für die Objekte eindeutiges Identifikationsmerkmale erstellen. Für die Erstellung der Identifikationsmerkmale wird der Einrichtung zum Vergleichen von Objekten 200 ein Regelwerk 210 genutzt welches die Informationen zur Extraktion der Identifikationsmerkmale enthält. Die extrahierten Identifikationsmerkmale werden von der Einrichtung zum Vergleich von Objekten 200 mit den Identifikationsmerkmalen der Objekte im Profilspeicher 220 verglichen. Die Referenzprofile bestehen mindestens aus einem Bild, den zugehörigen Identifikationsmerkmalen sowie weitere Informationen wie Größe, Farbe, Form, Material usw.
  • Bei einer ausreichenden Übereinstimmung der Identifikationsmerkmale wird das Objekt mit Bezug zu dem ihm enthaltenen Bild, der Internetseite und dem Referenzprofil aus dem Profilspeicher 220 im Datenbestand 230 gespeichert.
  • Als Ergebnis der Anwendung des Extraktionsprozesses und der Gesichtererkennung und Gesichtsvergleich auf die um Web-Crawler-Speicher abgespeicherten Internetseiten ergibt sich ein Datenbestand 230 aus Internetseiten, denen jeweils mehrere Bilder, Gesichter und Referenzprofile zugeordnet sind. Ein Beispiel eines Auszuges des Datenbestandes ist in den Tabelle 1 bis 5 nachfolgend dargestellt.
  • Figure 00060001
    Tabelle 1
  • Tabelle 1 zeigt dabei die Zuordnung der URL der Webseite einer Beschreibung und dem Aufnahemdatum in den Index. Die Website wird durch eine eineindeutige WebsiteID eindeutig gekennzeichnet. Es ist darauf hinzuweisen, das die Tabelle 1 lediglich beispielhaft Aufnahmedatum und Beschreibung enthält. Die Tabelle kann zusätzlich weitere Spalten enthalten.
  • Figure 00060002
    Tabelle 2
  • Tabelle 2 zeigt die Zuordnung der Bilder zur Webseite. Jedes Bild ist durch eine BildID eineindeutig gekennzeichnet. Zusätzlich enthält die Tabelle den Bildnamen, die Url des Bildes sowie die Anzahl der im Bild enthaltenen Gesichter. Mittel des WebsiteID ist das Bild einer Website zugeordnet. Die WebsiteID assoziiert die in Tabelle 1 enthaltene Informationen. Es ist auch hier darauf hinzuweisen, das Tabelle 2 lediglich beispielhaft URL und die Anzahl enthaltener Gesichter enthält. Die Tabelle kann Zusätzliche Spalten enthalten.
  • Figure 00070001
    Tabelle 3
  • Tabelle 3 zeigt beispielhaft den Aufbau eines Referenzprofiles für eine Person. Jedes Profil ist dabei durch eine eineindeutige ProfilID gekennzeichnet. Darüber hinaus enthält jedes Profil den Vornamen, Nachnamen und E-Mailadresse der Person. Darüber hinaus werden die Identifikationsmerkmale (IDMerkmale) und der Speicherort des Gesichtsbilder der Person gespeichert. Es ist hier darauf hinzuweisen, das Tabelle 3 lediglich beispielhaft Vorname, Nachname, E-Mailadresse, IDMerkmale und Bildpfad enthält. Die Tabelle kann zusätzliche Spalten und Informationen enthalten.
  • Figure 00070002
    Tabelle 4
  • Tabelle 4 zeigt die Zuordnung der Bilder zu den enthaltenen Gesichtern, den identifizierten Personen und der Website. Die Website wird dazu durch seine eineindeutige WebsiteID repräsentiert. Jedes Bild wird durch seine eineindeutige BildID repräsentiert. Jedes Gesicht wird durch seinen eineindeutige GesichtsID repräsentiert. Jede identifizierte Person wird durch seine eineindeutige ProfilID repräsentiert.
  • Eine Zeile repräsentiert dabei die Zuordnung einer Person zu einem Gesicht durch die ProfilID und GesichtsID. Des weiteren enthält die Zeile die Zuordnung des Gesichtes (GesichtsID) zum Bild (BildID), welches das Gesicht enthält. Außerdem ist mit der Zuordnung zur WebsiteID, das Bild (BildID), das Gesicht (GesichtID) und Profile (ProfilID), der Webseite zugeordnet. Es ist darauf hinzuweisen, das die Tabelle auch weitere Spalten enthalten kann.
  • Figure 00070003
    Tabelle 5
  • Tabelle 5 zeigt die Zuordnung einzelner Schlagwörter zu einer Website. Dabei wird jedes Wort durch eine eineindeutige WortID repräsentiert. Die Spalte Wort enthält das Schlagwort. Mit der Zuordnung zur WebsiteID ist das Schlagwort der Website zugeordnet. Es ist hier darauf hinzuweisen, das Tabelle 35 lediglich beispielhaft Wörter enthält. Die Tabelle kann zusätzliche Spalten und Informationen enthalten.
  • Die Tabellen 1 bis 5 zeigen lediglich schematisch ein mögliches Beispiel für Darstellung der Datensätze wie sie sich aus dem Extraktionsprozess gemäß der vorstehenden Beschreibung ergeben könnten.
  • Gemäß einem Ausführungsbeispiel kann der Datenbestand, der vom Crawler heruntergeladen und vom Extraktionsprozess analysiert wird, sich dynamisch verändern. Hierzu kann beispielsweise beim Extraktionsprozess neben der Suche Gesichtern auch eine Suche nach Links in der Webseite durchgeführt werden kann, ein Prozess, der im Extraktionsmechanismus in 2 nicht grafisch dargestellt ist. Wird ein derartiger Link, der auf eine weitere Webseite verweist, gefunden, so kann dieser Link dem Bestand an zu durchsuchenden Adressen hinzugefügt werden, so dass sich dieser Bestand dynamisch durch Aufnahme derartiger aufgefundener Links verändert. Auf ähnliche Weise können Bilder des Bestandes, in denen kein Gesicht gefunden werden konnte oder für die sonstige Kriterien, die für die Aufnahme in den Datenbestand erforderlich sind, nicht erfüllt waren, aus dem zu durchsuchenden Datenbestand entfernt werden.
  • Diese dynamische Veränderung des Datenbestands ermöglicht es, dass sich der resultierende Datenbestand dynamisch an Veränderungen im Internet anpasst. Hierzu ist noch anzumerken, dass zu diesem Zweck natürlich der gesamte Prozess der Extraktion wiederholt durchgeführt werden sollte. Auf der Grundlage des resultierenden und sich gegebenenfalls dynamisch veränderlichen Datenbestands 250 kann dann eine Suche basierend auf einer Suchanfrage eines Benutzers durchgeführt werden. Dies wird nachfolgend etwas genauer im Detail beschrieben.
  • Das Verarbeiten einer Suchanfrage 440 wird nun nachfolgend unter Bezugnahme auf 3 beschrieben. Ausgehend vom Datenbestand 400, der das Ergebnis des crawlens, des Extraktionsprozesses, der Gesichtserkennung und dem Gesichtsvergleich ist, der unter Bezugnahme auf 2 beschrieben wurde, wird dieser Datenbestand 400 indexiert 410. Hierzu werden die auf der Seite vorhandenen Informationen (z. B. Meta Tags, Titel, Überschriften, reiner Text, das Verhältnis von Links zu Text), d. h. der Anzahl der Links auf einer URL im Vergleich zu den nicht verlinkten Wörtern, als auch die sie beschreibenden Informationen (z. B. Bezeichner innerhalb einer URL; Anzahl, Bezeichnung und Quellen der Links, die auf diese Seite verweisen) sowie extrahiert und können in einer oder mehreren separaten Indices gespeichert werden. Die Bilder und die zugeordneten Personen mit Bezug zu den Seiten werden ebenfalls in den Indices gespeichert.
  • Diese ein oder mehreren separaten Indices bilden dann den in 3 dargestellten lokalen Index 420. Der Index 420 kann dabei auf herkömmliche Art und Weise auf der Grundlage der Webseiten des Datenbestandes gebildet sein. Das bedeutet, dass z. B. ein Volltextindex über die Seiten des Bestandes gebildet wird, wobei jedem Begriff, Personennamen und Bild des so gebildeten Index 420 die entsprechende Website zugeordnet ist. Zusätzlich zu der Website-Adresse ist aber einem Begriff, der im Index enthalten ist, auch noch die Personeninformation zugeordnet, die zu dieser Website gehört und im Extraktionsprozess extrahiert wurde. Ein Ausschnitt eines so gebildeten Index 420 kann dabei wie oben in den Tabellen 1-5 dargestellt aussehen.
  • Gemäß einem Ausführungsbeispiel kann die Ausgabe mittels einer Ausgabeschnittstelle 450 durchgeführt werden, die dem Benutzer die Ergebnisse 470 in vorzugsweise nach Relevanz 460 geordneter Form anzeigt, beispielsweise in einer Reihenfolge, die Ergebnis eines sogenannten (Ranking-Prozesses) ist. Eine Möglichkeit zur Durchführung eines Ranking-Prozesses ist beispielsweise die Verwendung des sogenannten Page-Rank-Verfahrens, das im US-Patent 6,285,999 beschrieben wird. Wird kein solches Ranking durchgeführt können auch die Ergebnisse 470 in ungeordneter Form dem Benutzer präsentiert werden. Des weiteren ist eine Ausgabe aller Ergebnisse 470 rein nach personenbezogenen Kriterien möglich, z. B. alle Personen im gleichen Alter.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - US 6285999 [0062]

Claims (11)

  1. Suchmaschine zum Durchführen einer Suche nach Internetseiten, für die ein vom Benutzer als Suchbegriff eingegebenes personenbezogenes Kriterium erfüllt ist, wobei die Suchmaschine aufweist: Eine Einrichtung zum Durchsuchen einer Mehrzahl von Internetseiten-, Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern der durchsuchten Internetseiten, wobei die Gesichter den Bildern zugeordnet sind, Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern der Bilder der durchsuchten Internetseiten, wobei die extrahierten Gesichter verwendet werden, Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Identifikationsmerkmale der Gesichter aus den Referenzprofilen und extrahierten Gesichtern genutzt werden, eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind; eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht; eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
  2. Suchmaschine nach einem der Anspruch 1, wobei die Suchmaschine aufweist: Eine Einrichtung zum Hinterlegen der extrahierten Gesichter, wobei die Einrichtung die Bilder in einem Speicher ablegt, der von weiteren Einrichtungen genutzt werden kann.
  3. Suchmaschine nach einem der Ansprüche 1 oder 2, wobei die Suchmaschine aufweist: Eine Einrichtung zum Extrahieren von Identifikationsmerkmalen aus Gesichtern, wobei die Einrichtung aufweist eine Einrichtung zum Erstellen von Referenzprofilen aus den vom Benutzer vorher identifizierten Gesichtern. Wobei die Einrichtung aufweist eine Einrichtung zum Extrahieren von Identifikationsmerkmalen mittels geeigneter Algorithmen. Wobei die Einrichtung aufweist eine Einrichtung zum Speichern von Identifikationsmerkmalen mit Bezug zum Gesicht und den Kontaktinformationen.
  4. Suchmaschine nach einem der Ansprüche 1, 2 oder 3 welche ferner aufweist: Eine Einrichtung zum Vergleichen der Gesichter mit Referenzprofilen, wobei die Einrichtung aufweist eine Einrichtung zum Vergleichen der Identifikationsmerkmale der Gesichter und Bestimmung der Ähnlichkeit von Gesichtern.
  5. Suchmaschine nach einem der Ansprüche 1 bis 4, welche ferner aufweist: Eine Einrichtung zum Extrahieren von Gesichtern aus Bildern, wobei die Einrichtung aufweist eine Einrichtung zum Finden von Gesichtern mit einem geeigneten Algorithmus. Wobei die Einrichtung aufweist eine Einrichtung zum Extrahieren der Gesichter aus der Bildquelle. Wobei die Einrichtung aufweist eine Einrichtung zum Speichern der Bildausschnitte mit den Gesichtern.
  6. Suchmaschine nach einem der Ansprüche 1 bis 5, welche ferner aufweist: Eine Einrichtung zum Bilden eines Datenbestandes, bei dem einer Vielzahl von durchsuchten Internetseiten jeweils aus diesen Internetseiten Gesichter und personenbezogene Daten zugeordnet sind.
  7. Suchmaschine nach einem der Ansprüche 1 bis 6, welche ferner aufweist: Eine Eingabeschnittstelle zur Eingabe einer Suchanfrage durch den Benutzer, wobei die Eingabeschnittstelle dem Benutzer die Eingabe eines personenbezogenes Kriteriums zusätzlich zu weiteren Suchbegriffen ermöglicht.
  8. Suchmaschine nach einem der Ansprüche 1 bis 7, welche ferner aufweist: Eine Einrichtung zum Durchsuchen des Datenbestands und Ausgabe derjenigen Internetseiten, für die dem personenbezogenen Kriterium und die weiteren Suchbegriffe erfüllt sind.
  9. Suchmaschine nach einem der Ansprüche 1 bis 8, welche ferner aufweist: Eine Einrichtung zum Durchsuchen der einzelnen Internetseiten nach einer Mehrzahl von Begriffen, die geeignet sind, die Internetseiten hinsichtlich des angebotenen Inhalts zu klassifizieren, wobei im Falle eines Treffers gegebenenfalls unter Anwendung weiterer Bedingungen der Internetseite eine entsprechende Klassifikation zugewiesen wird.
  10. Suchmaschine nach einem der Ansprüche 1 bis 9, welche ferner aufweist: einen Datenbestand aus Internetadressen, die vom Crawler heruntergeladen und von der Extraktionseinrichtung durchsucht werden sollen, eine Einrichtung zur dynamischen Anpassung des Datenbestandes durch: Hinzufügen neuer Links, die beim Durchsuchen der heruntergeladenen Seiten von der Extraktionseinrichtung ermittelt wurden; und/oder Verwerfen von Internetadressen, bei denen die Extraktionseinrichtung festgestellt hat, dass die vorgegebenen Kriterien für die Extraktion eines Bildes nicht erfüllt sind; sowie eine Einrichtung zum wiederholten herunterladen und Durchsuchen der Internetadressen des Datenbestandes.
  11. Suchmaschine nach einem der Ansprüche 1 bis 10, welche ferner aufweist: die angezeigten Zusatzinformationen Werbe-Links sind und die Reihenfolge der Anzeige der Werbe-Links darauf basiert, wir oft bereits auf einen Werbe-Link geclickt wurde
DE202009006918U 2009-05-13 2009-05-13 Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker Expired - Lifetime DE202009006918U1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE202009006918U DE202009006918U1 (de) 2009-05-13 2009-05-13 Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE202009006918U DE202009006918U1 (de) 2009-05-13 2009-05-13 Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker

Publications (1)

Publication Number Publication Date
DE202009006918U1 true DE202009006918U1 (de) 2009-07-23

Family

ID=40897195

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202009006918U Expired - Lifetime DE202009006918U1 (de) 2009-05-13 2009-05-13 Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker

Country Status (1)

Country Link
DE (1) DE202009006918U1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209425A (zh) * 2020-01-06 2020-05-29 闻泰通讯股份有限公司 图像搜索方法、装置、电子设备及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209425A (zh) * 2020-01-06 2020-05-29 闻泰通讯股份有限公司 图像搜索方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
DE102007037646B4 (de) Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken
DE60004687T2 (de) Verfahren zur thematischen klassifikation von dokumenten, modul zur thematischen klassifikation und ein derartiges modul beinhaltende suchmaschine
DE69526168T2 (de) Verfahren und Gerät zur Klassifikation von Dokumentinformationen
DE69718798T2 (de) Echtzeitsuchmotor mit strukturierten zusammenfassungen
DE602004003361T2 (de) System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen
DE69431351T2 (de) Verfahren und gerät zum indexieren, suchen und anzeigen von daten
DE112020002600T5 (de) Entdecken einer semantischen bedeutung von datenfeldern anhand von profildaten der datenfelder
DE69231113T2 (de) Speicherverfahren für bibliographische Information über Daten aus einer endlichen Textquelle, und insbesondere Dokumentverbuchungen zur Verwendung in einem Suchsystem für Ganztextdokumente
WO2007042245A1 (de) Suchmaschine für eine ortsbezogene suche
DE3911465A1 (de) Verfahren zur konfiguration technischer systeme aus komponenten
DE102016003850A1 (de) Empfehlen von Formularfragmenten
DE202013005812U1 (de) System zum indexieren elektronischer Inhalte
DE102019108857A1 (de) Automatisiertes maschinelles Lernen auf Basis gespeicherten Daten
DE202009006918U1 (de) Suchmaschine mit Personenidentifikation in Bildern anhand gesichtsbiometrischer Charakteristiker
EP1285385B1 (de) Verfahren zum auffinden von objekten
DE10261839A1 (de) Verfahren und Einrichtung zur Durchführung einer elektronischen Recherche
EP1734469A2 (de) Verfahren zur Auswahl von Datensätzen
DE102006043158A1 (de) Verfahren zum Ermitteln von Elementen eines einer Suchanfrage zugeordneten Suchergebnisses in einer Reihenfolge und Suchmaschine
DE202022101222U1 (de) Ein automatisch skalierbares System für optimierte Arbeitsempfehlungen
WO2021204849A1 (de) Verfahren und computersystem zur bestimmung der relevanz eines textes
DE19842320A1 (de) Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten
DE69132678T2 (de) Ein textverwaltungssystem
DE202022106616U1 (de) Ein System zur Darstellung und Einordnung von Formeln für die Suche nach mathematischen Informationen
DE102018104438A1 (de) Computerimplementiertes Verfahren zum Beschaffen von Informationen
WO2011044864A1 (de) Verfahren und system zum klassifizieren von objekten

Legal Events

Date Code Title Description
R207 Utility model specification

Effective date: 20090827

R081 Change of applicant/patentee

Owner name: PIXRAY GMBH, DE

Free format text: FORMER OWNER: STEFAN BAER, 14482 POTSDAM, DE

Effective date: 20110926

Owner name: PIXRAY GMBH, DE

Free format text: FORMER OWNER: BAER, STEFAN, M.SC., 14482 POTSDAM, DE

Effective date: 20110926

R081 Change of applicant/patentee

Owner name: PIXRAY GMBH, DE

Free format text: FORMER OWNER: HIT LABS GMBH, 14482 POTSDAM, DE

Effective date: 20120326

R150 Term of protection extended to 6 years

Effective date: 20120605

R151 Term of protection extended to 8 years
R151 Term of protection extended to 8 years

Effective date: 20150609

R152 Term of protection extended to 10 years
R071 Expiry of right