DE19708265A1 - Blättern in einer Bilddatenbank und Abfrage der Bilddaten, indem eine Strukturanalyse verwendet wird - Google Patents
Blättern in einer Bilddatenbank und Abfrage der Bilddaten, indem eine Strukturanalyse verwendet wirdInfo
- Publication number
- DE19708265A1 DE19708265A1 DE19708265A DE19708265A DE19708265A1 DE 19708265 A1 DE19708265 A1 DE 19708265A1 DE 19708265 A DE19708265 A DE 19708265A DE 19708265 A DE19708265 A DE 19708265A DE 19708265 A1 DE19708265 A1 DE 19708265A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- document
- search
- software
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Description
Die vorliegende Erfindung betrifft ein Verfahren und einen Apparat zum Durch
stöbern einer Bilddatenbank bzw. zum Blättern in einer Bilddatenbank und genauer
ein Verfahren und einen Apparat zum Durchstöbern einer Bilddatenbank bzw. zum
Blättern in einer Bilddatenbank, und zwar basierend auf einer bekannten Struktur bzw.
bekannten Textur eines gewünschten Dokuments.
Mit der weiten Verbreitung preisgünstiger Permanent-Elektronikspeichervorrichtungen
und von Scannern zum elektronischen Erfassen von Dokumentbildern bzw.
Vorlagenbildern, wird die Erzeugung und Speicherung von großen Dokumentbild-
Datenbanken möglich. Mögliche Verwendungen für derartige Bilddatenbanken stellen
elektronische Bibliotheken, medizinische Dokumente, Verwaltungsaufzeichnungen,
Nachrichtenclips, Pläne, Verwaltungsformulare, Handbücher, usw. dar. Im
allgemeinen ist es nun weniger teuer, ein Dokument abzutasten und es auf einem
elektronischen Speichermedium zu speichern, als das Dokument physikalisch zu
speichern.
Bei derartigen großen Dokument-Bilddatenbanken ergibt sich jedoch das Problem,
gewünschte Dokumente aus der Datenbank zu identifizieren und wiederzugewinnen.
Eine bekannte Technik zum Abfragen einer Vorlagendatenbank besteht darin, nach
einem Textstring bzw. nach einer Textzeichenkette oder einer Kombination von
Textstrings bzw. Textzeichenketten zu suchen, die wahrscheinlich in einem
gewünschten Dokument gefunden werden. Was das abgetastete Dokumente angeht,
beruht diese Technik auf einer genauen optischen Zeichenerkennung (OCR bzw.
"optical character recognition"), die nicht immer machbar sein kann. Ebenso ist es
häufig schwierig, einen Textstring oder Strings zu erzeugen, die sowohl in einem
gewünschten Dokument gefunden werden als auch im ausreichenden Maße das
gewünschte Dokument von anderen unterscheiden.
Häufig weiß der Benutzer etwas darüber, wie ein gewünschtes Dokument aussieht. Es
wäre von Vorteil, diese Information beim Abfragen einer Dokument-Bilddatenbank
zu nutzen.
Die vorliegende Erfindung stellt ein Verfahren und einen Apparat zum Abfragen einer
Dokument-Bilddatenbank dar, und zwar basierend auf einer Struktur bzw. einem
inneren Aufbau und analytisch unterscheidbare Muster in den Dokument-Bildern der
Datenbank. Gemäß der Erfindung kann eine Dokument-Bilddatenbank nach
Dokumenten mit einer bestimmten Struktur bzw. einem bestimmten inneren Aufbau
auf eine Vielfalt von Weisen durchstöbert bzw. durchsucht werden. Zum Beispiel
kann ein Benutzer ein Beispiel-Dokumentbild eingeben, das ein zu dem gewünschten
Dokument ähnliches Erscheinungsbild aufweist. Alternativ kann der Benutzer eine
einfache Schnittstelle verwenden, um ein synthetisches bzw. künstliches Dokument
zu definieren, und zwar basierend auf der Auswahl weniger Kategorien. Das
synthetische Dokument würde dann als ein Beispiel für eine Suche dienen. Oder der
Bediener kann eine graphische Schnittstelle verwenden, um genauer ein Beispiel für
eine Suche festzulegen. Somit stellt die Kenntnis des Benutzers über das allgemeine
Erscheinungsbild des gewünschten Dokuments oder der Dokumente (und ins
besondere deren Umwandlung in physikalische Werte bzw. elektrische Signale, die
von der Datenbank bzw. einem Computer verarbeitbar sind,) die Grundlage für die
Suche dar.
Wenn einmal der Benutzer die Suche gestartet hat, wird ein Dokumentbild oder
werden mehrere Dokumentbilder ausgewählt, und zwar basierend auf der Ähnlichkeit
ihrer Struktur oder ihres inneren Aufbaus mit dem Beispiel. Diese Bilder können in
einer Piktogrammgestalt bzw. in einer Ikongestalt auf einem Papier dargestellt oder
gedruckt werden. Der Benutzer kann ein weiteres Durchblättern bzw. Durchstöbern
auslösen, indem ein dargestelltes Dokument als ein Suchschlüssel für eine neue Suche
ausgewählt wird. Bei einer Ausführungsform werden Dokumentbilder in der
Datenbank zusammen gruppiert bzw. geclustert und wenn eine Abfrage durchgeführt
wird, werden Darstellungen für die Gruppen bzw. Cluster dargestellt, die Bilder
beinhalten, die bezüglich ihrer Struktur dem Suchschlüssel ähneln.
Bei einer Ausführungsform werden Seiten mit einem ähnlichen Erscheinungsbild
identifiziert, wenn der Benutzer die Anzeige mehrerer Seiten eines Dokuments
verlangt. Bezüglich der Seiten, die dahingehend identifiziert wurden, daß sie ein
ähnliches Erscheinungsbild aufweisen, werden Bilder der Seiten einander überlagert
und leicht versetzt dargestellt.
In Übereinstimmung mit einem Aspekt der Erfindung liegt die Grundlage für
Dokument-Bildsuchvorgänge in einer Analyse der Struktur bzw. des inneren Aufbaus
eines Bildes. Ein Merkmalsvektor wird für jedes Bild extrahiert. Eine Ähnlichkeit
zwischen Bildern wird auf einer Abstandsmetrik gegründet, wie sie für die Merkmals
vektoren paßt bzw. gilt. Bei der bevorzugten Ausführungsform weist der Merkmals
vektor 80 Elemente auf und gründet auf vier unterschiedlichen Arten und Weisen der
Bildverarbeitung. Die ersten 20 Elemente basieren auf einem Histogramm von
verbundenen Komponentengrößen bzw. Verbindungskomponenten-Größen
("connected component sizes"), und zwar durchgehend für das Bild. Verbundene
Komponenten ("connected components") werden im folgenden auch Verbindungs
komponenten genannt. Die zweiten 20 Elemente werden aus einer Übersicht bzw.
Vermessung von Interessenpunkten bzw. Punkten von Interesse über das ganze
Dokument bzw. durchgehend bezüglich des Dokuments erhalten. Die dritten 20
Elemente werden von einem vertikalen Projektionshistogramm verbundener
Bestandteile bzw. Komponenten erhalten. Der letzte Satz von 20 Elementen wird
erhalten, indem das Dokument in 20 Zellen aufgeteilt wird und die verbundenen
Bestandteile bzw. Komponenten in jeder Zelle aufsummiert werden.
Bei einer Ausführungsform werden Suchverfahren, basierend auf einer Kombination
von Bildstruktur und Text verwendet, um eine Bilddatenbank abzufragen, und zwar
dort, wo eine optische Zeichenerkennung (OCR) mit den Bildern der Datenbank
durchgeführt wurde. Durch die Kombination der beiden Datentypen kann Text
verwendet werden, um nach den OCR-Daten, die dem Bild zugeordnet sind, zu
suchen, und die Strukturdaten können für eine Suche, basierend auf dem allgemeinen
Erscheinungsbild des Bildes verwendet werden.
Die vorliegende Anmeldung basiert auf der prioritätsbegründenden US-Patent
anmeldung S.N.08/609,641, angemeldet am 1. März 1996, deren Offenbarung
hiermit mit aufgenommen wird.
Ein weiteres Verständnis der Natur und der Vorteile der Erfindungen hierin kann
realisiert werden, indem auf die verbleibenden Abschnitte der Beschreibung und der
beigefügten Zeichnungen bezuggenommen wird. Dabei können Merkmale ver
schiedener Ausführungsformen untereinander kombiniert werden.
Fig. 1 zeigt ein Computersystem, das zur Realisierung der vorliegenden
Erfindung geeignet ist.
Fig. 2 zeigt ein Flußdiagramm auf obersten Niveau, das dem Betrieb des
Dokument-Bilddatenbank-Abfragesystems der vorliegenden Erfindung
beschreibt.
Fig. 3 zeigt einen Benutzer-Schnittstellen-Bildschirm zum Entwickeln eines
synthetischen Dokumentenbildes, basierend auf Kategorieselektionen
als ein Beispiel, um eine Suche in Übereinstimmung mit einer
Ausführungsform der vorliegenden Erfindung zu starten.
Fig. 4 zeigt einen Benutzer-Schnittstellen-Bildschirm, bei dem ein Benutzer
graphische Werkzeuge verwenden kann, um ein Beispiel-Dokumenten
bild zu entwickeln, um eine Suche in Übereinstimmung mit einer
Ausführungsform der vorliegenden Erfindung zu starten.
Fig. 5 zeigt, wie Suchergebnisse für eine Bilddatenbank mit Clustern bzw.
Gruppen in Übereinstimmung mit einer Ausführungsform der vorlie
genden Erfindung gezeigt werden können.
Fig. 6 zeigt, wie Bilder mehrerer Seiten eines Berichts in Übereinstimmung
mit einer Ausführungsform der vorliegenden Erfindung gezeigt werden
können.
Fig. 7A zeigt die Elemente eines Merkmalvektors, der aus einem Dokumentbild
in Übereinstimmung mit einer Ausführungsform der vorliegenden
Erfindung extrahiert wird.
Fig. 7B zeigt ein verbundenes Komponenten-Größen-Histogramm, wie es
innerhalb eines Merkmalvektors in Übereinstimmung mit einer
Ausführungsform der vorliegenden Erfindung eingebracht werden
würde.
Fig. 7C zeigt, wie Interessen-Operator-Information, wie sie innerhalb eines
Merkmalvektors in Übereinstimmung mit einer Ausführungsform der
vorliegenden Erfindung eingebaut bzw. eingebunden werden würde,
arbeitet, um Unterscheidungen zwischen Dokumenten mit unter
schiedlichen Font-Größen durchzuführen.
Fig. 7D zeigt ein Vertikalprojektions-Verbindungskomponentenhistogramm,
wie es innerhalb eines Merkmalvektors in Übereinstimmung mit einer
Ausführungsform der vorliegenden Erfindung eingebracht bzw.
eingebunden werden würde.
Fig. 7E zeigt, wie die Verteilung von verbundenen Komponenten bzw.
Verbindungskomponenten unter Gitterzellen, wie sie innerhalb eines
Merkmalvektors in Übereinstimmung mit einer Ausführungsform der
vorliegenden Erfindung inkorporiert werden würden, arbeitet, um
unter Dokumenten mit unterschiedlichen Anordnungen von Komponen
ten zu unterscheiden.
Fig. 8 zeigt ein repräsentatives Beispiel-Dokumentenbild, das zur Suche in
Übereinstimmung mit der vorliegenden Erfindung verwendet wird, und
Suchergebnisse.
Fig. 1 zeigt ein Basis-Untersystem eines Computersystems, das zur Verwendung mit
der vorliegenden Erfindung geeignet ist. In Fig. 1 beinhaltet das Computersystem
10 einen Bus 12, der Haupt-Untersysteme, wie zum Beispiel eine zentrale Ver
arbeitungseinheit bzw. einen Hauptprozessor 14, einen Systemspeicher 16, eine
Eingabe/Ausgabe- (I/O bzw. "input/output") Steuereinrichtung 18, eine externe
Vorrichtung, wie zum Beispiel einen Drucker 20 über einen Parallelport 22, einen
Anzeigebildschirm 24 über einen Anzeigeadapter 26, einen seriellen Port 28, eine
Tastatur 30, ein Festplattenlaufwerk 32 und ein Diskettenlaufwerk 33, das arbeitet,
um eine Diskette 33A aufzunehmen, verbindet. Viele andere Vorrichtungen können
angeschlossen werden, wie zum Beispiel eine Abtastvorrichtung 34, das über eine
externe Schnittstelle 36 angeschlossen ist, eine Maus 38, die über ein serielles Port
28 angeschlossen ist, und einen Berührungsbildschirm bzw. Touchscreen 40, der
direkt angeschlossen ist. Viele andere Vorrichtungen und Untersysteme (nicht gezeigt)
können auf eine ähnliche Art und Weise angeschlossen werden. Ebenso ist es nicht
für alle in der Fig. 1 gezeigten Vorrichtungen erforderlich, daß sie vorhanden sind,
um die vorliegende Erfindung in die Praxis umzusetzen, wie im folgenden diskutiert
wird. Die Vorrichtungen und Untersysteme können miteinander auf eine Art und
Weise verbunden werden, die von jener verschieden ist, die in Fig. 1 gezeigt ist. Der
Betrieb eines Computersystems, wie zum Beispiel jener, der in Fig. 1 gezeigt ist, ist
in der Fachwelt gut bekannt und wird in der vorliegenden Anmeldung nicht detailliert
diskutiert. Ein Quellkode, um die vorliegende Erfindung zu realisieren, kann
betriebsmäßig in einem Systemspeicher 16 abgelegt oder auf einem Speichermedium,
wie zum Beispiel einer Festplatte oder einer Diskette 33A gespeichert werden. Eine
Bilddatenbank kann ebenso auf einer Festplatte 32 gespeichert werden.
Ein Anzeigebildschirm 24 ähnelt jenem, der bei Standardcomputern, wie zum Beispiel
Personalcomputern oder Workstations verwendet wird, die einen
Kathodenstrahlröhren(CRT)-Bildschirm oder einen Monitor verwenden. Verschiedene
Formen von Bediener-Eingabevorrichtungen können zusammen mit der vorliegenden
Erfindung verwendet werden. Zum Beispiel eine Maus-Eingabevorrichtung, die es
einem Benutzer erlaubt, einen Zeiger, der auf einem Anzeigebildschirm dargestellt
wird, in Übereinstimmung mit den Handbewegungen eines Benutzers zu bewegen,
stellt eine Standard-Benutzereingabevorrichtung dar. Eine Maus beinhaltet üblicher
weise eine oder mehrere Tasten auf seiner Oberfläche, so daß der Benutzer auf ein
Objekt auf dem Bildschirm zeigen kann, indem die Maus bewegt wird und das Objekt
ausgewählt wird, oder indem auf andere Weise das Objekt aktiviert wird, indem eine
oder mehrere Tasten auf der Maus gedrückt werden. Alternativ erlaubt ein Berüh
rungsbildschirm bzw. ein Touchscreen einen Benutzer, auf Objekte auf dem
Bildschirm zu zeigen, um ein Objekt auszuwählen, und um das ausgewählte Objekt
zu bewegen, indem auf eine zweite Position auf dem Bildschirm gezeigt wird.
Verschiedene Tasten und Steuerungen können auf dem Bildschirm gezeigt werden, um
sie zu aktivieren, indem die Maus oder der Touchscreen verwendet wird. Bei einem
Festplattenlaufwerk 32 kann es sich um ein Festplattenlaufwerk oder um ein optisches
Laufwerk oder um irgendein Medium handeln, das zum Speichern einer Datenbank
von Dokumentenbildern geeignet ist.
Die vorliegende Erfindung stellt ein Dokument-Bilddatenbank-Suchsystem bereit, das
auf der Verwendung von Beispieldokumenten bzw. als Beispiel dienenden Dokumente
als Schlüssel für die Suche basiert. Durch Wechselwirkung mit dem System der
vorliegenden Erfindung auf eine einer Anzahl von Weisen entwickelt der Benutzer ein
Beispielbild. Vorzugsweise findet das System, basierend auf einer Struktur des
Beispielbildes eine oder mehrere Übereinstimmungen und zeigt sie als Suchergebnisse
an. Der Benutzer kann dann ein übereinstimmendes Bild als einen Schlüssel für eine
weitere Suche in der Datenbank auswählen.
Fig. 2 zeigt ein Flußdiagramm auf oberstem Niveau, das dem Betrieb des Dokument-
Bilddatenbank-Abfragesystems der vorliegenden Erfindung beschreibt. Im Schritt 202
wird ein Beispielbild entwickelt. Zum Beispiel kann der Benutzer ein bekanntes
Beispielbild aus einem Diskettenlaufwerk 32 wiederfinden. Oder der Benutzer kann
ein Bild einscannen, indem eine Abtastvorrichtung 34 verwendet wird. Andere
Techniken zum Entwickeln eines Beispielbildes werden unter Bezugnahme auf Fig.
3 und 4 beschrieben.
Das Beispielbild, das im Schritt 202 entwickelt wird, dient als Grundlage für die
Suche. Die Suche beruht auf einem Vergleich von Bildmerkmalen, wie sie über
Bereiche des Dokuments gewonnen bzw. berechnet werden. Die Wirkung liegt darin,
daß Dokumentbilder gefunden werden, die ein zu dem Dokumentbild ähnliches
allgemeines Erscheinungsbild aufweisen. Dementsprechend wird dem Schritt 204 eine
Bildmerkmalsinformation über das Beispiel-Dokumentbild erhalten. Vorzugsweise
nimmt diese Bildmerkmalsinformation die Gestalt eines Bildmerkmalvektors ein,
dessen Zusammensetzung unter Bezugnahme auf die Fig. 7A-7E diskutiert wird.
Die Datenbasis beinhaltet vorzugsweise auf ähnliche Weise erhaltene Bildmerkmals
informationen für die Datenbankbilder. Im Schritt 206 wird die Bildmerkmals
information, die aus dem Beispiel-Dokumentenbild erhalten wird, als ein Schlüssel für
eine Suche in der Datenbank verwendet. Bei der bevorzugten Ausführungsform, bei
der die Bildmerkmalsinformation ein Merkmalsvektor ist, wird vorzugsweise eine
euklidische Abstandsmetrik verwendet, um Dokumentenbilder zu finden, die dem
Beispiel ähnlich sind. Alternativ kann ein Mahalanobis-Abstand, ein Hausdorff-
Abstand oder ein gewichtetes Übereinstimmungsschema verwendet werden, um
ähnliche Dokumentenbilder zu finden. Bei einer Ausführungsform nutzt das
Suchverfahren den Vorteil einer Gruppierung bzw. einer Clusterbildung in der
Bilddatenbank, um Clusterknoten zu finden, die Punkte darstellen, die in der Nähe des
Beispielbildes in dem Bildmerkmal-Vektorraum liegen.
Im Schritt 208 werden ähnliche Dokumentbilder dargestellt. Bei einer Ausführungs
form werden die drei Bilder in der Datenbank, die am ähnlichsten sind, dargestellt.
Alternativ werden Piktogramme bzw. Ikons dargestellt, die Cluster bzw. Gruppen
darstellen, die Bilder mit ähnlichen Charakteristiken enthalten.
Im Schritt 210 kann der Benutzer eines der dargestellten Dokumentbilder oder
Clusterpiktogramme als einen Schlüssel für die weitere Suche wählen. Das System
nutzt dann das ausgewählte Bild oder das Clusterpiktogramm als ein neues Beispiel-
Dokumentenbild und kehrt zum Schritt 206 zurück.
Bei einer Ausführungsform beinhaltet die Bilddatenbank Dokumentenbilder in
verschlüsselter Form. Die Merkmalsinformation, die verwendet wird, um zu suchen,
ist jedoch unverschlüsselt. Wenn gewünschte Dokumentenbilder identifiziert sind,
werden sie für die Anzeige entschlüsselt. Gemäß dem Stand der Technik werden
verschlüsselte Dokumentendatenbanken durchsucht, indem unverschlüsselte
Schlüsselwort-Information verwendet wird. Der Lösungsansatz, der durch die
vorliegende Erfindung bereitgestellt wird, ist dahingehend vorteilhaft, daß die
unverschlüsselte Bildmerkmalsinformation nicht leicht verständlich ist und immer noch
eine Sicherheitsmaßnahme bereitstellt. Im Gegensatz dazu können die Schlüsselwörter,
die gemäß dem Stand der Technik unverschlüsselt geblieben sind, leicht verstanden
werden, wodurch die Sicherheit gefährdet ist.
Bei einer verwandten Ausführungsform beinhaltet die Bilddatenbank Dokumentenbilder
in einer komprimierten Form, während die Merkmalsinformation, die für die Suche
verwendet wird, nicht komprimiert ist. Wenn gewünschte Dokumentenbilder
identifiziert werden, werden sie zur Anzeige dekomprimiert.
Fig. 3 zeigt einen Benutzerschnittstellenbildschirm 300 zum Entwickeln eines
synthetischen Dokumentbildes, basierend auf Kategorieselektionen als ein Beispiel,
um eine Suche in Übereinstimmung mit einer Ausführungsform der vorliegenden
Erfindung zu starten. Ein Benutzerschnittstellenbildschirm 300 kann auf einem
Touchscreen 40 realisiert werden, wobei der Benutzer Selektionen vornimmt, indem
die Auswahl von Kategorien spezifiziert wird, indem die vielfältigen angezeigten Tasten
bzw. Schaltflächen berührt werden. Alternativ kann eine Maus oder eine andere
vergleichbare Eingabevorrichtung verwendet werden, um die verschiedenen Kategorien
auszuwählen.
Eine erste Spalte 302 von Schaltflächen, die den Titel "Struktur" bzw. "Textur" trägt,
ermöglicht es dem Benutzer einen Dokumententyp auszuwählen. Es werden
Schaltflächen bzw. Tasten für "Zeitung" 304, "Geschäftsbrief" 306, "Journal/Magazin"
308, "Katalog/Broschüre" 310 und "Handgeschriebenes" 312 bereitgestellt. Der
Benutzer wählt den Dokumententyp bezüglich der Dokumente die er/sie sucht.
Eine zweite Spalte 314 von Schaltflächen bzw. Tasten, die den Titel "Layout" trägt,
erlaubt es dem Bediener, die Anzahl von Spalten von Text auszuwählen, die in den
Dokumenten gefunden werden, nach denen er/sie sucht. Schaltflächen werden für eine
Spalte 316, für zwei Spalten 318 und für drei Spalten 320 bereitgestellt.
Eine dritte Spalte 322 von Schaltflächen bzw. Tasten, die den Titel "graphische
Gestaltung" trägt, erlaubt es dem Benutzer die relative Anordnung eines Dokumenten
titels, von Text und eines graphischen Bildes auszuwählen, wie sie in einem
gewünschten Suchergebnis gefunden werden würde. Jede Schaltfläche zeigt eine
mögliche Anordnung. Eine Schaltfläche 324 zeigt einen Titel 326, der sich oberhalb
eines graphischen Bildes 328 und eines Textes 330 befindet. Eine Schaltfläche 338 zeigt
einen Titel 340 oberhalb eines graphischen Bildes 342. Eine Schaltfläche 344 zeigt ein
graphisches Bild 346 in der Nähe des Textes 348.
Indem eine Auswahl aus jeder der drei Spalten getroffen wird, kann der Benutzer
schnell das allgemeine Erscheinungsbild des gewünschten Dokuments oder der
gewünschten Dokumente übermitteln. Nachdem der Benutzer seine bzw. ihre
Selektionen gemacht hat, startet die Aktivierung einer "Finde"-Schaltfläche 350 eine
Suche, die auf einer Bildmerkmalinformation basiert, die den Selektionen des Benutzers
entspricht. Diese Selektionen des Benutzers können als derartige verstanden werden,
die ein Beispiel-Dokumentenbild spezifizieren, das als ein Schlüssel für die Suche in
derselben Art und Weise dient, wie dies ein abgetastetes Bild tun würde. Natürlich
sind die verschiedenen Kategorien und die Auswahl, die in Fig. 4 gezeigt ist, nur
beispielhaft.
Fig. 4 zeigt eine vereinfachte Darstellung eines Benutzerschnittstellenbildschirms 400,
bei dem ein Benutzer graphische Werkzeuge verwenden kann, um ein Beispiel-
Dokumentbild zu entwickeln, um eine Suche in Übereinstimmung mit einer
Ausführungsform der vorliegenden Erfindung zu starten. Ein Benutzerschnittstellenbild
schirm 400 bietet mehr Flexibilität bei der Spezifizierung eines Beispielbildes, als das
System, das unter Bezugnahme auf Fig. 3 beschrieben ist.
Der Benutzer folgt einer Prozedur entlang der Rute, die er bei typischen computerunter
stützten Zeichenpaketen folgen würde. Der Benutzer wählt einen Dokument
komponententyp, wie zum Beispiel eine Kopfreile, Autor, Titel, Hauptkörper, Fußnote,
Bild etc., indem eine Palette 402 verwendet wird. Eine Palette 404 wird verwendet,
um eine Fontgröße bzw. eine Schriftzeichensatzgröße für Textkomponenten zu
spezifizieren und um zwischen Strichzeichnungs- und Halbtonbildern für Bild
komponenten zu unterscheiden. Die Auswahl einer Dokumentkomponente kann die
Verwendung einer Maus 38, um einen Zeiger über den relevanten Palettenabschnitt
zu positionieren, das Niederdrücken einer Taste auf der Maus 38, das Positionieren
des Zeigers bei einem gewünschten Punkt innerhalb eines Dokumentenbildes 406 und
das erneute Niederdrücken der Taste beinhalten. Die Größe und Position der
Dokumentenkomponente kann dann justiert werden, indem Techniken, die für
computerunterstützte Zeichenpakete typisch sind, verwendet werden.
Zahlreiche Variationen sind möglich bei dieser Benutzerschnittstelle. Um dem Benutzer
eine Rückwirkung bzw. eine Systemreaktion bereitzustellen, kann das System einen
aktuellen Text oder Grafikbilder in den bezeichneten Positionen innerhalb des
Dokumentenbildes 406 darstellen. Ebenso kann der Benutzer die Dokumentenstruktur
mit größerer Genauigkeit spezifizieren, indem die Fontgröße oder der Typenstil der
Textbereiche des Dokumentenbildes spezifiziert wird.
Nach einer Reihe von Interaktionen bzw. Wechselwirkungen mit dem Benutzerschnitt
stellenbildschirm 400, ergibt sich ein Bild, wie zum Beispiel ein Dokumentenbild 406
und dieses Bild ist für eine Verwendung als ein Beispielbild für eine Suche verfügbar.
Eine symbolische Darstellung 408 zeigt die Ergebnisse einer Suche, die auf einem
Beispielbild 406 basiert.
In Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung wird eine
Textabfrage mit einer Struktursuche kombiniert. Eine Textabfrage würde durch die
Entwicklung eines Beispielbildes mittels irgendeiner Technik, die eine der oben
beschriebenen beinhaltet, formuliert werden. Eine Textabfrage würde eine oder mehrere
Text-Zeichenketten bzw. Text-Strings beinhalten, die bei einem gewünschten Dokument
gefunden werden würden. Die Suchergebnisse würden auf Bilder beschränkt werden,
die die Kriterien von sowohl der Textabfrage als auch der Textsuche erfüllen. Diese
besondere Abfragetechnik ist natürlich auf Bilddatenbanken beschrankt, für die OCR-
Ergebnisse verfügbar sind. Als erstes würden Dokumente mit Bilder wiedergefunden
werden, die das gewünschte Muster an Text-Strings beinhalten. Die wiedergewonnenen
Bilder werden dann nach Bildern durchsucht, die eine Struktur aufweisen, die der
spezifizierten ähnlich ist.
Alternativ wird eine Bildstruktur verwendet, um die Ergebnisse zu organisieren, die
durch eine Textabfrage wiedergegeben werden. Als erstes werden Dokumentenbilder,
die das gewünschte Muster an Text-Strings beinhalten, wiedergewonnen. Cluster bzw.
Gruppen von Dokumenten mit ähnlichen Strukturen werden dann zusammen gruppiert.
Diese Gruppen von Dokumenten werden dem Benutzer angezeigt, indem zum Beispiel
eine Overlay-Technik verwendet wird, die früher beschrieben wurde. Diese Technik
stellt einen einfachen Weg bereit, um zwischen Dokumenten von unterschiedlichen
Quellen Unterscheidungen zu treffen. Man betrachtet zum Beispiel eine Datenbank,
die Bilder von Zeichnungen und Artikeln wissenschaftlicher Journale beinhaltet. Eine
Textabfrage kann Dokumente von beiden Typen von Quellen wiedergeben. Jedoch kann
der Benutzer nur in den Ergebnissen von einer von ihnen interessiert sein. Die
Bildstruktur-Clusterbildung stellt ein Verfahren für einen Benutzer bereit, um schnell
Zeitungsartikel von Artikeln wissenschaftlicher Journale zu unterscheiden.
Fig. 5 zeigt, wie Suchergebnisse für eine geclusterte Bilddatenbank bzw. eine
gruppierte Bilddatenbank in Übereinstimmung mit einer Ausführungsform der
vorliegenden Erfindung dargestellt werden kann. Eine Bilddatenbank mit Clustern ist
eine, wo Bilder in einer hierarchischen Struktur gemäß ihrer Position in dem Raum
zusammen gruppiert werden, der durch den Bildmerkmalsvektor festgelegt ist. Die
Datenbasis wird in eine oder mehrere Gruppen aufgeteilt. Jede Gruppe kann wiederum
aus einer oder mehreren Untergruppen bestehen. Eine Beschreibung der Clusterbildung
kann in Duda & Hart, "Pattern Classification & Scene Analysis" (John Wiley & Sons
1973), deren Inhalt hiermit durch Bezugnahme aufgenommen wird.
Falls es ein einziges Hierarchieniveau gibt, werden bei einer Abfrage alle Bilder in
dem Cluster, die dem Beispieldokument am nächsten sind, in dem Bildmerkmals-
Vektorraum zurückgegeben. Fig. 5 zeigt die Ergebnisse einer Durchblätterungssuche,
die in dem Kontext bzw. im Zusammenhang einer Vielfach-Niveau-Hierarchie von
Clustern dargestellt sind. Das Niveau 500 zeigt Piktogramme, die Clusterknoten
darstellen. Der Benutzer steigt in der Hierarchie weiter ab, indem eines der
Piktogramme als ein Schlüssel für die weitere Suche ausgewählt wird. Schließlich kann
der Benutzer ein Blatt-Cluster ("leaf cluster") erreichen, d. h. eine Gruppe von
tatsächlichen Bildern im Gegensatz zu Cluster-Knoten. Diese Bilder werden dann
dargestellt.
Ein Weg der Realisierung der auf Cluster basierenden Suche ist es, die Clusterstruktur
jedesmal neu zu berechnen, wenn eine Abfrage vorgelegt bzw. gefordert wird. Eine
andere Art und Weise der Realisierung der auf Cluster basierenden Suche ist es, die
Clusterstruktur vor der Suche zu berechnen, indem vorzugsweise Strukturinformation
verwendet wird. Der zuvor beschriebene Suchprozeß gleicht dann im wesentlichen der
Navigation durch einen Baum.
Fig. 6 zeigt eine verbesserte Anzeige für Dokumente mit mehreren Seiten in
Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung. Häufig stellt
ein gewünschtes Dokumentbild eine Seite einer Bilddatenbank dar. Zum Beispiel sind
in der gutbekannten Berkeley-Bilddatenbank Reports bzw. Berichte von 50 Seiten
üblich. Viele Seiten dieser Reports sind nur Text und neigen dazu, ähnliche
Strukturmerkmale aufzuzeigen, was ein Wiederfinden schwierig macht. Die Seiten,
die die interessantesten Merkmale für den Benutzer für das Durchblättern bzw.
Durchstöbern bereitstellen, sind die Titelseite, die Seite mit der Inhaltsangabe,
Diagramme, Figuren etc. Diese stellen ebenso die Seiten dar, die die besten Merkmale
bereitstellen, von denen aus weitere Abfragen der Datenbank vorgenommen werden
können.
Vorzugsweise erscheint ein Dokument mit mehreren Seiten zu Beginn als ein einziges
Bild, wenn ein Suchergebnis dargestellt wird. Jedoch kann der Benutzer bewirken, daß
das gesamte Dokument erscheint, indem dieses Bild ausgewählt wird. Eine Anzeige
602 zeigt die Suchergebnisse einschließlich der mehreren Seiten 606 desselben Reports,
die ein ähnliches Erscheinungsbild aufweisen. Man kann erkennen, daß für Reports
mit Hunderten von Seiten die Anzeige bald mit sich wiederholenden Bildern überhäuft
ist. Eine verbesserte Darstellung 604 zeigt mehrere Seiten 606 desselben Reports, wobei
dessen Bilder mit einem leichten Versatz von Seite zu Seite überlagert sind. Eine
verbesserte Anzeige 604 zeigt eine erheblich geringere Überhäufung.
Um die verbesserte Darstellung zu erreichen, wenn ein Report mit mehreren Seiten
dargestellt werden soll, werden Seiten mit einem im wesentlichen gleichen Er
scheinungsbild identifiziert, indem ihre Seitenmerkmalsinformation verglichen wird.
Die Bilder dieser Seiten werden dann dargestellt, wobei ihre Bilder mit einem Offset
von Seite zu Seite überlagert werden.
Fig. 7A zeigt die Elemente eines Merkmalvektors 700, die von einem Dokumentbild
in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung extrahiert
werden. Vorzugsweise beinhaltet ein Merkmalsvektor 700 80 Elemente, die vier
Gruppen von 20 Elementen beinhalten. Eine erste Gruppe von 702 von 20 Elementen
stellt ein Histogramm von verbundenen Komponentengrößen dar und wird weiter unter
Bezugnahme auf Fig. 7B diskutiert. Eine zweite Gruppe 704 von 20 Elementen stellt
eine Verteilung von Interessepunkten durchgehend über die Zellen des Dokumentbildes
dar und wird weiter unter Bezugnahme auf Fig. 7C diskutiert. Eine dritte Gruppe 706
von 20 Elementen stellt ein Vertikalprojektions-Histogramm einer Verbindungs
komponentendichte dar und wird weiter unter Bezugnahme auf Fig. 7D diskutiert.
Eine vierte Gruppe 708 von 20 Elementen stellt eine Verteilung von Verbindungs
komponenten bzw. verbundenen Komponenten durchgehend über Zellen des Dokuments
dar und wird weiter unter Bezugnahme auf Fig. 7E diskutiert.
Fig. 7B zeigt ein Verbindungskomponenten-Größenhistogramm 710, wie es in einem
Merkmalsvektor 702 in Übereinstimmung mit einer Ausführungsform der vorliegenden
Erfindung inkorporiert werden würde. Das Histogramm 710 basiert auf einer
Verbindungskomponenten-Größeninformation, die von dem Bild erhalten wird. Eine
einzige Verbindungskomponente stellt einen Satz von benachbarten schwarzen Pixeln
in einem Bild dar. Um die Größe einer Verbindungskomponente zu bestimmen, findet
die bevorzugte Ausführungsform das Gebiet der rechteckigen Box minimaler Größe,
das sie umschließt. Alle anderen Arten der Bestimmung einer Verbindungs
komponentengröße gehören ebenfalls zum Umfang der vorliegenden Erfindung. Zum
Beispiel kann die diagonale Abmessung der umfassenden bzw. einschließenden
rechteckigen Box die Verbindungskomponentengröße sein. Schließlich könnte noch,
wenn dies zusätzlich erwünscht wird, mit dem Bild eine Filterung durchgeführt werden,
bevor eine Verbindungskomponentengröße bestimmt wird.
Horizontale und vertikale Achsen 712 und 714 des Histogramms werden vorzugsweise
zu einer logarithmischen Skale normalisiert. Weiter könnte man zusätzlich noch eine
Gewichtung mit dem Histogrammbins vornehmen. Ein Plot 716 zeigt das Histogramm
für eine symbolische Seite bzw. repräsentative Seite eines Magazins. Ein Plot 718 zeigt
das Histogramm für eine symbolische bzw. repräsentative Seite eines technischen
Journals. Wie man sehen kann, ist die Information von diesem Histogramm nützlich,
um zwischen verschiedenen Typen von Dokumenten zu unterscheiden.
Die zweite Gruppe 704 von 20 Merkmalvektorelementen basiert auf einer Interessen
punktinformation. Interessenpunkte sind Pixel innerhalb eines Bildes, die innerhalb
von Gebieten liegen, die unterschiedliche bzw. zu unterscheidende Merkmale
aufweisen. Jeder Interessenpunkt weist einen identifizierten bzw. erkannten
Interessenpegel auf. In der Fachwelt ist ebenso bekannt, daß Interessenpunkte ("interest
points") und ihre zugeordneten Interessenpegel ("interest levels") gefunden werden,
indem sogenannte Interessenoperatoren auf die Pixel eines Bildes angewendet werden.
Die bevorzugte Ausführungsform sieht einen Vorteil aus einem modifizierten Moravec-
Operator, der dem ähnelt, der in der US-Patentanmeldung mit der Seriennummer
08/527,286 "SIMULTANEOUS REGISTRATION OF MULTIPLE IMAGE
FRAGMENTS" beschrieben ist, die auf den Anmelder dieser Anmeldung überschrieben
ist und deren Inhalt hiermit durch Bezugnahme mit aufgenommen wird.
Für jeden Pixel wird der modifizierte Moravec-Varianzoperator an jedem der sechs
Radien von dem Pixel aus bestimmt. Für einen gegebenen Pixel und einen Radius stellt
der Interessenpegelwert bzw. Interessenniveauwerte die Varianz der Pixelwerte der
vier Pixel dar, die sich um einen gegebenen Radius weg, oberhalb, unterhalb, links
und rechts von dem gegebenen Pixel befinden. Typischerweise sind Dokumentenbilder
binär und die Pixelwerte sind entweder Null oder stellen einen Skalenendwert bzw.
einen Höchstwert dar. Die Interessenpegelwerte werden in drei Bins sortiert, in einen
Niedriginteressenwert, einen mittleren Interessenwert und in einen Hochinteressenwert.
Andere Interessenoperatoren können ebenso verwendet werden. Einen Überblick über
Interessenoperatoren wird in Yan "Interest Operators and Fast Implementation"
International Archives of Photogrammetry and Remote Sensing, Band 27-H, Japan,
Seiten 491-500, 1988, gefunden, deren Inhalt hiermit unter Bezugnahme uneinge
schränkt mit aufgenommen wird.
Jede Kombination aus Radius und Interessenpegelbin wird einem Element in einer
zweiten Gruppe 704 zugewiesen. Der Wert des Elements stellt eine normalisierte
Darstellung der Anzahl von Pixel mit dem Interessenpegelwert und Radius, der dem
Element zugeordnet ist, dar. Da es sechs Radien gibt und drei Interessenpegel-
Wertebins, macht dies 18 von 20 Elementen in der zweiten Gruppe 704 aus.
Die zwei verbleibenden Elemente der zweiten Gruppe 704 stellen spezielle Werte dar.
Ein Element beinhaltet einen Wert, der dem Verhältnis der Anzahl von schwarzen Pixel
in dem Bild zu der gesamten Anzahl von Pixel entspricht. Ein anderes Element hält
einen Wert, der einer gesamten Anzahl von Schwarz-zu-Weiß-Übergängen entspricht,
die bei einer horizontalen Abtastung durch das Bild entdeckt werden.
Fig. 7C stellt die Nützlichkeit einer Interessenpunktinformation für die Unterscheidung
von Dokumentenbildern dar. Fig. 7C zeigt einen Buchstaben "t" 720, wobei die
Interessenpegel bei verschiedenen Teilen des Buchstabens vorhanden sind. Ein Pixel
722 an einer Ecke weist einen hohen Interessenpegel auf. Ein Pixel 724 im Inneren
weist einen niedrigen Interessenpegel auf. Ein Pixel 726 entlang einer Kante weist einen
mittleren Interessenpegel auf.
Fig. 7D zeigt ein Vertikalprojektion-Verbindungskomponentenhistogramm 728, wie
es innerhalb eines Merkmalvektors in Übereinstimmung mit einer Ausführungsform
der vorliegenden Erfindung inkorporiert werden würde. Um die dritte Gruppe 706 des
Merkmalvektors zu erhalten, wird das Bild in 20 Vertikalstreifen aufgeteilt. Jedes
Element der dritten Gruppe entspricht einer Population bzw. einer Gesamtheit von
Verbindungskomponenten mit einer Größe oberhalb einer mimalen Schwelle in einem
bestimmten Vertikalstreifen. Bei einer bevorzugten Ausführungsform stellt dieses
Minimum eine Höhe und eine Breite dar, die beide größer als ein Pixel sind. Diese
dritte Gruppe 706 ist besonders bei der Unterscheidung zwischen Dokumenten nützlich,
die eine unterschiedliche Anzahl von Spalten im Text aufweisen. Ein erstes Dokument
730 mit einer einzigen Textspalte ergibt die Projektions-Histogrammdarstellung 732.
Ein zweites Dokument 734 mit zwei Textspalten ergibt ein Projektionshistogramm 736.
Wie man sehen kann, weist das Projektionshistogramm 732 einen Peak auf, der der
einzigen Spalte entspricht, wohingegen das Projektionshistogramm 736 zwei Peaks
aufweist, die den zwei Spalten entsprechen.
Fig. 7E zeigt, wie die Verteilung von Verbindungskomponenten zwischen Gitterzellen,
wie sie innerhalb eines Merkmalsvektors in Übereinstimmung mit seiner Ausführungs
form der Erfindung inkorporiert werden würden, arbeitet, um eine Unterscheidung
zwischen Dokumenten mit unterschiedlichen Anordnungen von Komponenten zu
treffen. Die vierte Gruppe 708 von Elementen wird erhalten, indem das Bild in ein
5×4-Feld 738 von Zellen aufgeteilt wird und indem die Population bzw. Gesamtheit
von Verbindungskomponenten oberhalb einer Schwellengröße in jeder Zelle gefunden
wird. Bei der bevorzugten Ausführungsform stellt diese Komponentengröße eine Höhe
und eine Breite dar, die größer als ein Pixel ist. Die Population von Verbindungs
komponenten bzw. verbundenen Komponenten einer jeden Zelle wird dann in Bezug
auf eine Gesamtanzahl von Verbindungskomponenten für das Bild als Ganzes
normalisiert. Diese vierte Gruppe 708 ist besonders bei der Unterscheidung zwischen
Dokumenten, wie zum Beispiel Dokumente 740 und 742 nützlich, die unterschiedliche
Anordnungen von Dokumentkomponenten bzw. Dokumenten-Komponenten aufweisen.
Die Extraktion von Bildmerkmals-Information aus Beispiel-Dokumentenbildern, die
durch Kategorieselektion entwickelt wurden, wie unter Bezugnahme auf Fig. 3
beschrieben wurde, oder die durch eine graphische Benutzerschnittstelle entwickelt
wurden, wie unter Bezugnahme auf Fig. 4 beschrieben wurde, folgt einem
modifizierten Verfahren bzw. einer modifizierten Prozedur. Bei dem Kategorieselek
tionsschema von Fig. 3 gibt es eine beschränkte Anzahl von möglichen Beispiels-
Dokumentenbildern. Ein Verfahren besteht darin, für jede Kombination von
Kategorieselektionen ein entsprechendes aktuelles Dokumenten-Bild mit den gewählten
Charakteristiken bereitzustellen. Dieses Bild kann dann als die Basis für eine
Bildmerkmalsextraktion dienen, wie sie oben unter Bezugnahme auf die Fig. 7A-
7E beschrieben wurde.
Für Beispielbilder, die entwickelt wurden, indem die Techniken verwendet werden,
die unter Bezugnahme auf Fig. 4 diskutiert wurden, besteht ein Verfahren darin, ein
aktuelles Dokumenten-Bild zu konstruieren, indem Beispielbildmaterial bzw.
Abtastbildmaterial kombiniert wird, das jeder ausgewählten Komponente entspricht.
Bezüglich Textkomponenten wird tatsächlicher Text mit aufgenommen. Bezüglich
Graphiken wird ein Abtastgraphikbild bzw. ein Beispielgraphikbild mit aufgenommen
bzw. mit eingeschlossen. Das so konstruierte aktuelle Dokumentenbild dient als
Grundlage für eine Bildmerkmalsextraktion.
Fig. 8 zeigt ein repräsentatives Beispiel-Dokumentenbild 802, das als ein Beispiel
für eine Suche in Übereinstimmung mit der vorliegenden Erfindung verwendet wird,
und Suchergebnisse. In dem ein Beispielbild 802 als der Schlüssel für eine Suche
verwendet wird, werden Bilder 804 und 806 und 808 von einer Datenbank von 971
Bildern einschließlich Journalen, Briefen, Magazinen, Broschüren bzw. Katalogen,
Zeitungen, Katalogen und handgeschriebenen Text. Das Beispielbild 802 stellt einen
Geschäftsbrief dar und alle Suchergebnisse sind ebenfalls Geschäftsbriefe. Wie man
sehen kann, stellt das Suchsystem der Erfindung Bilder bereit, die vom Anblick her
dem Beispielbild ähneln.
Gemäß der Erfindung können zum Beispiel die Techniken der vorliegenden Erfindung
ebenso auf Grauskalenbilder angewendet werden, obwohl die obige Beschreibung auf
binäre Bilder bezugnimmt. Interessenpunkt-Techniken sind in der Fachwelt für
Grauskalenbilder gut bekannt. Verbindungskomponenten-Information kann von einem
Grauskalenbild erhalten werden, indem zuerst eine Schwellenfunktion auf die
Grauskalenwerte angewendet wird und dann benachbarte Gruppen von Pixeln mit
Werten oberhalb der gewählten Schwelle gefunden werden.
Die Suchtechniken, die oben beschrieben wurden, können ebenso auf Farbbilder mit
passenden Änderungen des Bildmerkmalsvektors angewendet werden. Zum Beispiel
kann der Bildvektor derartig ausgedehnt werden, daß er Elemente enthält, die den
Median-CMYK-Werten über verschiedene bzw. vielfältige Zellen des Bildes
entsprechen.
Ebenso kann für eine verbesserte Genauigkeit beim Vergleich eines visuellen
Erscheinungsbildes von Bildern ein Merkmalsvektor mit einer viel größeren Anzahl
von Elementen verwendet werden. Zum Beispiel kann das Dokumentenbild in 20 Zellen
aufgeteilt werden. Ein 60-Elementvektor, der den ersten drei Gruppen des Merkmal-
Elementvektors 700 entspricht, kann dann für jede Zelle berechnet werden. Die
Ansammlung aller dieser 60-Elementvektoren würde einen 1.200-Element-Merkmals
vektor darstellen, der als Basis zum Durchsuchen und Durchblättern einer Bilddaten
bank dienen kann.
Erfindungsgemäß kann z. B. das offenbarte Verfahren auch über größere Entfernungen
durchgeführt werden. So kann nach dem Schritt des Erhaltens der Bildmerkmals
information (siehe z. B. Anspruch 1), diese Information an die Datenbank übermittelt
werden, die sich z. B. an eine entfernt gelegenen bzw. an einem anderen Ort, als den
Beispielbilderzeugungsort bzw. Bildmerkmalsinformationserzeugungsort befindet. Die
Datenbank sendet dann Suchergebnisse zur Weiterverarbeitung zurück. Aus diese Art
und Weise müssen nicht sämtliche zu einem Thema gehörigen Dokumente von der
Datenbank zur Durchsicht übermittelt werden, da eine gezielte Vorauswahl getroffen
wurde. Dadurch wird die Datenübertragungszeit entscheidend verkürzt und der
Speicherbedarf am Abfragegerät bzw. am Abfrageende des Geräts sinkt.
Weiter kann z. B. durch die Bereitstellung von den einzelnen Datenbank-Bilddokumenten
zugeordneten Merkmalsvektoren, die Suche erheblich beschleunigt werden, wobei die
einzelnen Merkmalsvektoren z. B. als eine Art komprimierte, wenn auch verlustbehafte
te Darstellung der Bilddokumente aufgefaßt werden können. So kann z. B. die
Übermittlung von Merkmalsvektoren in Kombination mit Datenbanken an einem oder
an beiden Enden des Übermittlungsweges als Kompressions-/Dekompressionsverfahren
zur Übermittlung von Bildern aufgefaßt werden.
Die Erfindung läßt sich beispielsweise wie folgt zusammenfassen:
Verfahren und Apparat zum Abfragen einer Dokument-Bilddatenbank, basierend auf einer Struktur, d. h. auf analytisch unterscheidbaren Mustern in den Dokument-Bildern der Datenbank. Gemäß der Erfindung kann eine Dokumentbilddatenbank für Dokumente mit einer bestimmten Struktur auf eine Vielfalt von Weisen durchblättert werden. Zum Beispiel kann ein Benutzer ein Beispiel-Dokumentbild mit einem Erscheinungsbild, das dem gewünschten Dokument ähnelt, eingeben. Alternativ kann der Benutzer eine einfache Schnittstelle verwenden, um ein synthetisches Dokument bzw. künstliches Dokument, basierend auf einer Auswahl weniger Kategorien festzulegen. Das synthetische Dokument würde dann als ein Beispiel für eine Suche dienen. Oder der Benutzer kann eine graphische Schnittstelle verwenden, um genauer ein Beispiel für eine Suche festzulegen. Somit liefert die Kenntnis des Benutzers von dem allgemeinen Erscheinungsbild des gewünschten Dokuments oder der Dokumente die Basis für die Suche.
Verfahren und Apparat zum Abfragen einer Dokument-Bilddatenbank, basierend auf einer Struktur, d. h. auf analytisch unterscheidbaren Mustern in den Dokument-Bildern der Datenbank. Gemäß der Erfindung kann eine Dokumentbilddatenbank für Dokumente mit einer bestimmten Struktur auf eine Vielfalt von Weisen durchblättert werden. Zum Beispiel kann ein Benutzer ein Beispiel-Dokumentbild mit einem Erscheinungsbild, das dem gewünschten Dokument ähnelt, eingeben. Alternativ kann der Benutzer eine einfache Schnittstelle verwenden, um ein synthetisches Dokument bzw. künstliches Dokument, basierend auf einer Auswahl weniger Kategorien festzulegen. Das synthetische Dokument würde dann als ein Beispiel für eine Suche dienen. Oder der Benutzer kann eine graphische Schnittstelle verwenden, um genauer ein Beispiel für eine Suche festzulegen. Somit liefert die Kenntnis des Benutzers von dem allgemeinen Erscheinungsbild des gewünschten Dokuments oder der Dokumente die Basis für die Suche.
Claims (29)
1. Verfahren zum Durchsuchen einer Dokument-Bilddatenbank, das die folgenden
Schritte aufweist:
ein Beispiel-Dokumentbild wird entwickelt;
eine Bildmerkmalsinformation über das Beispiel-Dokumentbild wird erhalten; die Dokument-Bilddatenbank wird durchsucht, indem die Bildmerkmals information verwendet wird;
Suchergebnisse des Suchschrittes werden angezeigt; und
eine Benutzereingabe wird angenommen bzw. angezeigt, die ein gegebenes Suchergebnis als einen Schlüssel für eine weitere Suche auswählt.
ein Beispiel-Dokumentbild wird entwickelt;
eine Bildmerkmalsinformation über das Beispiel-Dokumentbild wird erhalten; die Dokument-Bilddatenbank wird durchsucht, indem die Bildmerkmals information verwendet wird;
Suchergebnisse des Suchschrittes werden angezeigt; und
eine Benutzereingabe wird angenommen bzw. angezeigt, die ein gegebenes Suchergebnis als einen Schlüssel für eine weitere Suche auswählt.
2. Verfahren nach Anspruch 1, bei welchem der Entwicklungsschritt ein Einscannen
des Beispiel-Dokumentbildes umfaßt.
3. Verfahren nach Anspruch 1, bei welchem der Entwicklungsschritt die Annahme
einer Benutzereingabe umfaßt, die Charakteristiken des Beispiel-Dokumentbildes
spezifiziert.
4. Verfahren nach Anspruch 1, bei welchem der Entwicklungsschritt den Schritt
umfaßt, wonach ein graphisches System betrieben wird, bei dem ein Benutzer
Komponenten des Beispiel-Dokumentbildes spezifiziert und anordnet.
5. Verfahren nach Anspruch 1, bei welchem die Bildmerkmalinformation eine
Information über Interessenpunkte in dem Beispiel-Dokumentbild umfaßt.
6. Verfahren nach Anspruch 1, bei welchem die Bildmerkmalinformation eine
Information über verbundene Komponenten in dem Beispiel-Dokumentbild umfaßt.
7. Verfahren nach Anspruch 1, bei welchem die Bildmerkmalinformation Information
über eine Verteilung von verbundenen Komponenten bzw. Verbindungskomponenten
in dem Beispiel-Dokumentbild umfaßt.
8. Verfahren nach Anspruch 1, bei welchem der Schritt des Erhaltens den Schritt
aufweist, wonach ein Bildmerkmalvektor für das Beispiel-Dokumentbild bestimmt
wird.
9. Verfahren nach Anspruch 8, bei welchem der Suchschritt den Schritt aufweist,
wonach der Bildmerkmalvektor für das Beispiel-Dokumentbild mit den Bildmerkmal
vektoren von Dokumenten-Bildern in der Datenbank verglichen werden.
10. Verfahren nach Anspruch 9, das weiter den Schritt aufweist, wonach eine
Benutzereingabe angenommen wird, die einen Suchtextstring spezifiziert und wobei
der Suchschritt weiter den Schritt aufweist, wonach der Suchtextstring mit OCR-Daten
verglichen wird, die den Dokumenten-Bildern in der Datenbank zugeordnet sind.
11. Verfahren nach Anspruch 1, bei welchem der Schritt des Anzeigens das Anzeigen
von einen oder mehreren Dokument-Bildern umfaßt, die strukturell dem Beispiel-
Dokumentbild ähneln.
12. Verfahren nach Anspruch 1, bei welchem der Schritt des Anzeigens weiter das
Anzeigen von Piktogrammen bzw. Ikons als ein Suchergebnis umfaßt, die Cluster oder
Gruppen von Bildern darstellen, die dem Beispiel-Dokumentbild ähneln.
13. Verfahren nach Anspruch 1, bei welchem die Dokument-Bilddatenbank
Dokumenten-Bilder in verschlüsselter Form und Bildmerkmalinformation für die
verschlüsselten Dokumenten-Bilder aufweist.
14. Verfahren nach Anspruch 13, bei welchem das Suchen das Suchen der Bildmerk
malinformation aufweist, die in der Dokument-Bilddatenbank gespeichert ist und bei
welchem das Anzeigen ein Entschlüsseln von Suchergebnissen des Suchschrittes
umfaßt.
15. Verfahren nach Anspruch 1, bei welchem die Dokument-Bilddatenbank
Dokument-Bilder in komprimierter Form und Bildmerkmalinformation für die
komprimierten Dokumenten-Bilder aufweist.
16. Verfahren nach Anspruch 15, bei welchem das Suchen das Suchen der Bildmerk
malinformation aufweist, die in der Dokument-Bilddatenbank gespeichert ist und bei
welchem das Anzeigen ein Dekomprimieren von Suchergebnissen des Suchschrittes
umfaßt.
17. Verfahren zum Extrahieren eines Merkmalvektors aus einem elektronisch
gespeicherten Bild, das die folgenden Schritte aufweist:
die Größe von Verbindungskomponenten bzw. verbundenen Komponenten wird über das ganze Bild gemessen;
Interessenpegel von Pixeln werden über das ganze Bild identifiziert;
die verbundenen Komponente bzw. Verbindungskomponenten und ihre Größen werden über das ganze Bild identifiziert;
ein Histogramm von verbundenen Komponentengrößen bzw. Verbindungs komponentengrößen werden als eine erste Gruppe von Elementen des Merkmalvektors gespeichert; und
ein Histogramm von Interessenpegeln von Pixeln wird als eine zweite Gruppe von Elementen des Merkmalvektors gespeichert.
die Größe von Verbindungskomponenten bzw. verbundenen Komponenten wird über das ganze Bild gemessen;
Interessenpegel von Pixeln werden über das ganze Bild identifiziert;
die verbundenen Komponente bzw. Verbindungskomponenten und ihre Größen werden über das ganze Bild identifiziert;
ein Histogramm von verbundenen Komponentengrößen bzw. Verbindungs komponentengrößen werden als eine erste Gruppe von Elementen des Merkmalvektors gespeichert; und
ein Histogramm von Interessenpegeln von Pixeln wird als eine zweite Gruppe von Elementen des Merkmalvektors gespeichert.
18. Verfahren nach Anspruch 17, das weiter folgendes aufweist:
ein Histogramm einer verbundenen Komponentenpopulation bzw. einer
Verbindungskomponentenpopulation in Vertikalabschnitten des Bildes wird als eine
dritte Gruppe von Elementen des Merkmalvektors gespeichert.
19. Verfahren nach Anspruch 17, das weiter folgendes aufweist:
die Anzahl von verbundenen Komponenten bzw. Verbindungskomponenten werden in einer Vielzahl bzw. Anzahl von Regionen bzw. Bereichen des Bildes als eine vierte Gruppe von Elementen des Merkmalvektors gespeichert.
die Anzahl von verbundenen Komponenten bzw. Verbindungskomponenten werden in einer Vielzahl bzw. Anzahl von Regionen bzw. Bereichen des Bildes als eine vierte Gruppe von Elementen des Merkmalvektors gespeichert.
20. Verfahren zum Suchen nach einem Dokument in einer Dokument-Bilddatenbank,
das die folgenden Schritte aufweist:
eine Benutzereingabe wird angenommen, die eine Kategorie des Dokuments spezifiziert;
eine Benutzereingabe wird angenommen, die eine Anzahl von Textspalten des Dokuments spezifiziert;
eine Benutzereingabe wird angenommen, die eine Organisation bzw. Aufbau des Dokuments spezifiziert;
ein künstliches Dokument bzw. synthetisches Dokument der Kategorie wird entwickelt, das die Anzahl von Spalten und die Organisation bzw. der Aufbau aufweist; und
die Dokument-Bilddatenbank wird nach Dokumenten durchsucht, die dem synthetischen bzw. künstlichen Dokument ähneln.
eine Benutzereingabe wird angenommen, die eine Kategorie des Dokuments spezifiziert;
eine Benutzereingabe wird angenommen, die eine Anzahl von Textspalten des Dokuments spezifiziert;
eine Benutzereingabe wird angenommen, die eine Organisation bzw. Aufbau des Dokuments spezifiziert;
ein künstliches Dokument bzw. synthetisches Dokument der Kategorie wird entwickelt, das die Anzahl von Spalten und die Organisation bzw. der Aufbau aufweist; und
die Dokument-Bilddatenbank wird nach Dokumenten durchsucht, die dem synthetischen bzw. künstlichen Dokument ähneln.
21. Verfahren nach Anspruch 20, bei welchem der Suchschritt weiter folgendes
aufweist:
es wird nach Dokumenten gesucht, die eine Struktur aufweisen, die dem synthetischen Dokument bzw. künstlichen Dokument ähnelt.
es wird nach Dokumenten gesucht, die eine Struktur aufweisen, die dem synthetischen Dokument bzw. künstlichen Dokument ähnelt.
22. Dokumentenbild-Durchstöberungssystem, das folgendes aufweist:
eine elektronische Speichereinheit, die eine Dokument-Bilddatenbank speichert;
eine Anzeige, die Dokumenten-Bilder anzeigt;
eine Prozessoreinheit bzw. Verarbeitungseinheit, die mit der elektronischen Speichervorrichtung und der Anzeige gekoppelt ist bzw. verbunden ist, wobei die Verarbeitungseinheit funktionsfähig ist, um:
ein Beispiel-Dokumentenbild zu entwickeln;
eine Bildmerkmalsinformation über das Beispiel-Dokumentenbild zu erhalten; und
die Dokumenten-Bilddatenbank nach Dokument-Bildern zu durchsuchen, die dem Beispiel-Dokumentbild ähneln, wobei die Bildmerkmalinformation verwendet wird.
eine elektronische Speichereinheit, die eine Dokument-Bilddatenbank speichert;
eine Anzeige, die Dokumenten-Bilder anzeigt;
eine Prozessoreinheit bzw. Verarbeitungseinheit, die mit der elektronischen Speichervorrichtung und der Anzeige gekoppelt ist bzw. verbunden ist, wobei die Verarbeitungseinheit funktionsfähig ist, um:
ein Beispiel-Dokumentenbild zu entwickeln;
eine Bildmerkmalsinformation über das Beispiel-Dokumentenbild zu erhalten; und
die Dokumenten-Bilddatenbank nach Dokument-Bildern zu durchsuchen, die dem Beispiel-Dokumentbild ähneln, wobei die Bildmerkmalinformation verwendet wird.
23. Software auf einem Speichermedium, die folgendes aufweist:
Software zum Entwickeln eines Beispiel-Dokumentbildes;
Software zum Erhalten von Bildmerkmalinformation über das Beispiel- Dokumentbild;
Software zum Durchsuchen der Dokument-Bilddatenbank, indem die Bildmerkmalinformation verwendet wird;
Software zum Anzeigen von Suchergebnissen der Suchsoftware; und
Software zum Annehmen einer Benutzereingabe, die ein angezeigtes Suchergebnis als einen Schlüssel für eine weitere Suche auswählt.
Software zum Entwickeln eines Beispiel-Dokumentbildes;
Software zum Erhalten von Bildmerkmalinformation über das Beispiel- Dokumentbild;
Software zum Durchsuchen der Dokument-Bilddatenbank, indem die Bildmerkmalinformation verwendet wird;
Software zum Anzeigen von Suchergebnissen der Suchsoftware; und
Software zum Annehmen einer Benutzereingabe, die ein angezeigtes Suchergebnis als einen Schlüssel für eine weitere Suche auswählt.
24. Software nach Anspruch 23, bei welcher die Entwicklungssoftware eine Software
zum Annehmen einer Benutzereingabe aufweist, die Charakteristiken des Beispiel-
Dokumentbildes spezifiziert.
25. Software nach Anspruch 23, bei welchem die Entwicklungssoftware weiter die
Software zum Arbeiten eines graphischen Systems umfaßt, wobei ein Benutzer
Komponenten des Beispiel-Dokumentbildes spezifiziert und anordnet.
26. Software nach Anspruch 23, bei welchem die Software zum Erhalten eine
Software zum Extrahieren eines Bildmerkmalvektors für das Beispiel-Dokumentbild
umfaßt.
27. Software nach Anspruch 26, bei welchem die Suchsoftware weiter Software zum
Vergleichen des Bildmerkmalvektors für das Beispiel-Dokumentbild mit den
Bildmerkmalvektoren von Dokument-Bildern in der Datenbank aufweist.
28. Software nach Anspruch 27, die weiter Software zum Annehmen einer Benutzer
eingabe aufweist, die einen Suchtextstring spezifiziert und wobei die Suchsoftware
weiter eine Software zum Vergleichen des Suchtextstrings mit OCR-Daten aufweist,
die den Dokumentbildern in der Datenbank zugeordnet sind.
29. Verfahren zum Anzeigen von Bildern von Dokumenten mit mehreren Seiten, das
folgende Schritte aufweist:
Bildmerkmalinformation von Bildern von Seiten von Dokumenten wird verglichen;
Seiten mit einem ähnlichen Erscheinungsbild werden basierend auf der Bildmerkmalinformation identifiziert; und Seiten mit einem ähnlichen Erscheinungsbild werden übereinander mit einem Versatz zwischen ihnen überlagert angezeigt.
Bildmerkmalinformation von Bildern von Seiten von Dokumenten wird verglichen;
Seiten mit einem ähnlichen Erscheinungsbild werden basierend auf der Bildmerkmalinformation identifiziert; und Seiten mit einem ähnlichen Erscheinungsbild werden übereinander mit einem Versatz zwischen ihnen überlagert angezeigt.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/609,641 | 1996-03-01 | ||
US08/609,641 US5933823A (en) | 1996-03-01 | 1996-03-01 | Image database browsing and query using texture analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19708265A1 true DE19708265A1 (de) | 1997-09-04 |
DE19708265B4 DE19708265B4 (de) | 2006-05-11 |
Family
ID=24441670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19708265A Expired - Fee Related DE19708265B4 (de) | 1996-03-01 | 1997-02-28 | Verfahren zum Durchsuchen einer Dokument-Bilddatenbank und Dokumentbild-Durchstöberungssystem sowie Verfahren zum Extrahieren eines Merkmalsvektors aus einem elektronisch gespeicherten Bild |
Country Status (4)
Country | Link |
---|---|
US (1) | US5933823A (de) |
JP (1) | JPH09237282A (de) |
CN (1) | CN1146817C (de) |
DE (1) | DE19708265B4 (de) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000049526A1 (en) * | 1999-02-16 | 2000-08-24 | Hewlett-Packard Company | Similarity searching by combination of different data-types |
DE19983528B3 (de) * | 1998-09-09 | 2005-02-03 | Intel Corporation, Santa Clara | Multi-Linearisierungs-Datenstruktur zum Bild-Browsing |
EP1752895A1 (de) * | 2005-08-09 | 2007-02-14 | Canon Kabushiki Kaisha | Bildverarbeitungsvorrichtung zum Wiederauffinden von Bildern und zugehöriges Steuerungsverfahren |
WO2011029834A1 (de) * | 2009-09-09 | 2011-03-17 | Sureinstinct Gmbh | Verfahren zum anzeigen von ein objekt betreffende informationen |
Families Citing this family (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5963916A (en) * | 1990-09-13 | 1999-10-05 | Intouch Group, Inc. | Network apparatus and method for preview of music products and compilation of market data |
US6850252B1 (en) | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US6418424B1 (en) | 1991-12-23 | 2002-07-09 | Steven M. Hoffberg | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US6400996B1 (en) | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
AU718608B2 (en) | 1996-03-15 | 2000-04-20 | Gizmoz Israel (2002) Ltd. | Programmable computer graphic objects |
US7437351B2 (en) * | 1997-01-10 | 2008-10-14 | Google Inc. | Method for searching media |
GB2380300B (en) * | 1997-09-21 | 2003-09-10 | Microsoft Corp | A data filtering system and method |
US5995978A (en) * | 1997-09-24 | 1999-11-30 | Ricoh Company, Ltd. | Navigation system for document image database |
US6613100B2 (en) * | 1997-11-26 | 2003-09-02 | Intel Corporation | Method and apparatus for displaying miniaturized graphical representations of documents for alternative viewing selection |
US6260044B1 (en) * | 1998-02-04 | 2001-07-10 | Nugenesis Technologies Corporation | Information storage and retrieval system for storing and retrieving the visual form of information from an application in a database |
US6285995B1 (en) | 1998-06-22 | 2001-09-04 | U.S. Philips Corporation | Image retrieval system using a query image |
US6490579B1 (en) * | 1998-07-16 | 2002-12-03 | Perot Systems Corporation | Search engine system and method utilizing context of heterogeneous information resources |
US6665837B1 (en) * | 1998-08-10 | 2003-12-16 | Overture Services, Inc. | Method for identifying related pages in a hyperlinked database |
US6446099B1 (en) | 1998-09-30 | 2002-09-03 | Ricoh Co., Ltd. | Document matching using structural information |
US6363381B1 (en) * | 1998-11-03 | 2002-03-26 | Ricoh Co., Ltd. | Compressed document matching |
JP2000215317A (ja) * | 1998-11-16 | 2000-08-04 | Sony Corp | 画像処理方法及び画像処理装置 |
US6263104B1 (en) * | 1998-12-31 | 2001-07-17 | Mcgrew Stephen P. | Method and apparatus for reading and verifying holograms |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
JP4173246B2 (ja) * | 1999-04-28 | 2008-10-29 | 株式会社リコー | 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体 |
US7058817B1 (en) | 1999-07-02 | 2006-06-06 | The Chase Manhattan Bank | System and method for single sign on process for websites with multiple applications and services |
AU6503800A (en) * | 1999-07-30 | 2001-02-19 | Pixlogic Llc | Perceptual similarity image retrieval |
US6563959B1 (en) | 1999-07-30 | 2003-05-13 | Pixlogic Llc | Perceptual similarity image retrieval method |
US6505168B1 (en) | 1999-08-16 | 2003-01-07 | First Usa Bank, Na | System and method for gathering and standardizing customer purchase information for target marketing |
US6859802B1 (en) | 1999-09-13 | 2005-02-22 | Microsoft Corporation | Image retrieval based on relevance feedback |
AU3438401A (en) | 1999-11-04 | 2001-05-14 | Jp Morgan Chase Bank | System and method for automated financial project management |
US10275780B1 (en) | 1999-11-24 | 2019-04-30 | Jpmorgan Chase Bank, N.A. | Method and apparatus for sending a rebate via electronic mail over the internet |
US8571975B1 (en) | 1999-11-24 | 2013-10-29 | Jpmorgan Chase Bank, N.A. | System and method for sending money via E-mail over the internet |
US7082436B1 (en) | 2000-01-05 | 2006-07-25 | Nugenesis Technologies Corporation | Storing and retrieving the visual form of data |
US6867789B1 (en) | 2000-02-15 | 2005-03-15 | Bank One, Delaware, National Association | System and method for generating graphical user interfaces |
US6829615B2 (en) | 2000-02-25 | 2004-12-07 | International Business Machines Corporation | Object type relationship graphical user interface |
US6785421B1 (en) | 2000-05-22 | 2004-08-31 | Eastman Kodak Company | Analyzing images to determine if one or more sets of materials correspond to the analyzed images |
US7426530B1 (en) | 2000-06-12 | 2008-09-16 | Jpmorgan Chase Bank, N.A. | System and method for providing customers with seamless entry to a remote server |
JP2002007413A (ja) * | 2000-06-20 | 2002-01-11 | Fujitsu Ltd | 画像検索装置 |
US10185936B2 (en) | 2000-06-22 | 2019-01-22 | Jpmorgan Chase Bank, N.A. | Method and system for processing internet payments |
US7831508B1 (en) | 2000-06-23 | 2010-11-09 | Jpmorgan Chase Bank, N.A. | System and method for implementing a consolidated application process |
EP1170674A3 (de) * | 2000-07-07 | 2002-04-17 | LION Bioscience AG | Verfahren und Gerät um elektronische Daten zu bestellen |
US7747866B1 (en) | 2000-08-24 | 2010-06-29 | Jpmorgan Chase Bank, N.A. | System and method providing improved error detection related to transmission of data over a communication link |
US6963666B2 (en) * | 2000-09-12 | 2005-11-08 | Pentax Corporation | Matching device |
US8335855B2 (en) | 2001-09-19 | 2012-12-18 | Jpmorgan Chase Bank, N.A. | System and method for portal infrastructure tracking |
US7899243B2 (en) | 2000-11-06 | 2011-03-01 | Evryx Technologies, Inc. | Image capture and identification system and process |
US8218873B2 (en) * | 2000-11-06 | 2012-07-10 | Nant Holdings Ip, Llc | Object information derived from object images |
US8224078B2 (en) * | 2000-11-06 | 2012-07-17 | Nant Holdings Ip, Llc | Image capture and identification system and process |
US7565008B2 (en) | 2000-11-06 | 2009-07-21 | Evryx Technologies, Inc. | Data capture and identification system and process |
US9310892B2 (en) | 2000-11-06 | 2016-04-12 | Nant Holdings Ip, Llc | Object information derived from object images |
US7680324B2 (en) | 2000-11-06 | 2010-03-16 | Evryx Technologies, Inc. | Use of image-derived information as search criteria for internet and other search engines |
US7016532B2 (en) * | 2000-11-06 | 2006-03-21 | Evryx Technologies | Image capture and identification system and process |
US6978419B1 (en) * | 2000-11-15 | 2005-12-20 | Justsystem Corporation | Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments |
US6958821B1 (en) | 2000-11-21 | 2005-10-25 | Eastman Kodak Company | Analyzing images to determine third party product materials corresponding to the analyzed images |
US8805739B2 (en) | 2001-01-30 | 2014-08-12 | Jpmorgan Chase Bank, National Association | System and method for electronic bill pay and presentment |
KR100375831B1 (ko) * | 2001-03-14 | 2003-03-15 | 한국전자통신연구원 | 영상의 질감도를 기반으로 한 영상 db 브라우징 및 소팅방법 |
US6681060B2 (en) * | 2001-03-23 | 2004-01-20 | Intel Corporation | Image retrieval using distance measure |
US8849716B1 (en) | 2001-04-20 | 2014-09-30 | Jpmorgan Chase Bank, N.A. | System and method for preventing identity theft or misuse by restricting access |
US20020178140A1 (en) * | 2001-05-25 | 2002-11-28 | Woodmansee Donald Ernest | Method for characterizing and storing data analyses in an analysis database |
AU2002312381A1 (en) | 2001-06-07 | 2002-12-16 | First Usa Bank, N.A. | System and method for rapid updating of credit information |
CA2451616A1 (en) | 2001-06-25 | 2003-01-03 | Vincent Sethi | Electronic vouchers and a system and method for issuing the same |
US7899825B2 (en) * | 2001-06-27 | 2011-03-01 | SAP America, Inc. | Method and apparatus for duplicate detection |
US7266839B2 (en) | 2001-07-12 | 2007-09-04 | J P Morgan Chase Bank | System and method for providing discriminated content to network users |
US7103576B2 (en) | 2001-09-21 | 2006-09-05 | First Usa Bank, Na | System for providing cardless payment |
AUPR824301A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw001) |
CA2919269A1 (en) | 2001-11-01 | 2003-05-08 | Jpmorgan Chase Bank, N.A. | System and method for establishing or modifying an account with user selectable terms |
US7987501B2 (en) | 2001-12-04 | 2011-07-26 | Jpmorgan Chase Bank, N.A. | System and method for single session sign-on |
AUPS020302A0 (en) | 2002-01-31 | 2002-02-21 | Silverbrook Research Pty. Ltd. | Methods and systems (npw007) |
US7941533B2 (en) | 2002-02-19 | 2011-05-10 | Jpmorgan Chase Bank, N.A. | System and method for single sign-on session management without central server |
US9684676B1 (en) | 2002-03-29 | 2017-06-20 | Google Inc. | Method for searching media |
USRE45952E1 (en) * | 2002-03-29 | 2016-03-29 | Google Inc. | Method for searching media |
US7289685B1 (en) * | 2002-04-04 | 2007-10-30 | Ricoh Co., Ltd. | Paper based method for collecting digital data |
GB2389927A (en) * | 2002-06-20 | 2003-12-24 | Peter Foot | Method for searching a data source by building an abstract composite image |
US7536433B2 (en) * | 2002-09-25 | 2009-05-19 | Jpmorgan Chase Bank, N.A. | System and method for customizing a portal environment |
US7058660B2 (en) | 2002-10-02 | 2006-06-06 | Bank One Corporation | System and method for network-based project management |
US8301493B2 (en) | 2002-11-05 | 2012-10-30 | Jpmorgan Chase Bank, N.A. | System and method for providing incentives to consumers to share information |
US7506244B1 (en) * | 2003-02-07 | 2009-03-17 | Cisco Technology, Inc. | Model-driven software publishing system and method |
US7391917B2 (en) * | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
US20050036692A1 (en) * | 2003-05-26 | 2005-02-17 | Takayuki Iida | Method and device for determining time-of-photograph of individual image, and image retrieving method and computer program for the method |
US8306907B2 (en) | 2003-05-30 | 2012-11-06 | Jpmorgan Chase Bank N.A. | System and method for offering risk-based interest rates in a credit instrument |
US8723964B2 (en) * | 2003-09-12 | 2014-05-13 | Sony Corporation | Method and device for communication using an optical sensor |
JP4607443B2 (ja) * | 2003-10-08 | 2011-01-05 | 株式会社リコー | 文書表示装置および文書表示方法 |
US8190893B2 (en) | 2003-10-27 | 2012-05-29 | Jp Morgan Chase Bank | Portable security transaction protocol |
US7912291B2 (en) * | 2003-11-10 | 2011-03-22 | Ricoh Co., Ltd | Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain |
JP3862694B2 (ja) * | 2003-11-20 | 2006-12-27 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
US20050149258A1 (en) * | 2004-01-07 | 2005-07-07 | Ullas Gargi | Assisting navigation of digital content using a tangible medium |
US7742997B1 (en) | 2004-04-23 | 2010-06-22 | Jpmorgan Chase Bank, N.A. | System and method for management and delivery of content and rules |
JP4510535B2 (ja) * | 2004-06-24 | 2010-07-28 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP4152927B2 (ja) * | 2004-08-02 | 2008-09-17 | シャープ株式会社 | 画像処理装置、画像形成装置、処理原稿検索方法、処理原稿検索プログラム、記録媒体 |
US8825682B2 (en) * | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US8965145B2 (en) | 2006-07-31 | 2015-02-24 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8838591B2 (en) * | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8156115B1 (en) | 2007-07-11 | 2012-04-10 | Ricoh Co. Ltd. | Document-based networking with mixed media reality |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
JP4213112B2 (ja) * | 2004-11-09 | 2009-01-21 | シャープ株式会社 | 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体 |
US8566705B2 (en) * | 2004-12-21 | 2013-10-22 | Ricoh Co., Ltd. | Dynamic document icons |
US7386545B2 (en) | 2005-03-31 | 2008-06-10 | International Business Machines Corporation | System and method for disambiguating entities in a web page search |
US8185877B1 (en) | 2005-06-22 | 2012-05-22 | Jpmorgan Chase Bank, N.A. | System and method for testing applications |
US8583926B1 (en) | 2005-09-19 | 2013-11-12 | Jpmorgan Chase Bank, N.A. | System and method for anti-phishing authentication |
JP4918776B2 (ja) * | 2005-10-24 | 2012-04-18 | 富士通株式会社 | 電子文書比較プログラム、電子文書比較装置および電子文書比較方法 |
US8683314B2 (en) * | 2006-01-13 | 2014-03-25 | Ricoh Co., Ltd. | Tree pruning of icon trees via subtree selection using tree functionals |
US7672976B2 (en) * | 2006-05-03 | 2010-03-02 | Ut-Battelle, Llc | Method for the reduction of image content redundancy in large image databases |
US7917514B2 (en) * | 2006-06-28 | 2011-03-29 | Microsoft Corporation | Visual and multi-dimensional search |
US8793490B1 (en) | 2006-07-14 | 2014-07-29 | Jpmorgan Chase Bank, N.A. | Systems and methods for multifactor authentication |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
WO2008034001A1 (en) * | 2006-09-15 | 2008-03-20 | Nielsen Media Research, Inc. | Methods and apparatus to identify images in print advertisements |
US7849037B2 (en) * | 2006-10-09 | 2010-12-07 | Brooks Roger K | Method for using the fundamental homotopy group in assessing the similarity of sets of data |
JP4809198B2 (ja) * | 2006-11-29 | 2011-11-09 | 株式会社リコー | 画像処理機器,記事画像選択方法,プログラム,および記録媒体 |
JP2008146603A (ja) * | 2006-12-13 | 2008-06-26 | Canon Inc | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
US7849039B2 (en) * | 2006-12-29 | 2010-12-07 | Brooks Roger K | Method for using one-dimensional dynamics in assessing the similarity of sets of data using kinetic energy |
US7849038B2 (en) * | 2006-12-31 | 2010-12-07 | Brooks Roger K | Method for using the second homotopy group in assessing the similarity of sets of data |
JP2008242543A (ja) * | 2007-03-26 | 2008-10-09 | Canon Inc | 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム |
CN101669119B (zh) * | 2007-04-27 | 2012-08-08 | 日本电气株式会社 | 内容处理装置和内容处理方法 |
US8473735B1 (en) | 2007-05-17 | 2013-06-25 | Jpmorgan Chase | Systems and methods for managing digital certificates |
US20090037440A1 (en) * | 2007-07-30 | 2009-02-05 | Stefan Will | Streaming Hierarchical Clustering |
US8572087B1 (en) * | 2007-10-17 | 2013-10-29 | Google Inc. | Content identification |
US8321682B1 (en) | 2008-01-24 | 2012-11-27 | Jpmorgan Chase Bank, N.A. | System and method for generating and managing administrator passwords |
CN101551859B (zh) * | 2008-03-31 | 2012-01-04 | 夏普株式会社 | 图像辨别装置及图像检索装置 |
US8249343B2 (en) * | 2008-10-15 | 2012-08-21 | Xerox Corporation | Representing documents with runlength histograms |
US9608826B2 (en) | 2009-06-29 | 2017-03-28 | Jpmorgan Chase Bank, N.A. | System and method for partner key management |
JP5665125B2 (ja) * | 2011-04-07 | 2015-02-04 | 株式会社日立製作所 | 画像処理方法、及び、画像処理システム |
US9792017B1 (en) | 2011-07-12 | 2017-10-17 | Domo, Inc. | Automatic creation of drill paths |
US9202297B1 (en) | 2011-07-12 | 2015-12-01 | Domo, Inc. | Dynamic expansion of data visualizations |
US10001898B1 (en) | 2011-07-12 | 2018-06-19 | Domo, Inc. | Automated provisioning of relational information for a summary data visualization |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
JP5863400B2 (ja) * | 2011-11-07 | 2016-02-16 | 株式会社日立国際電気 | 類似画像検索システム |
US9419957B1 (en) | 2013-03-15 | 2016-08-16 | Jpmorgan Chase Bank, N.A. | Confidence-based authentication |
US20140372419A1 (en) * | 2013-06-13 | 2014-12-18 | Microsoft Corporation | Tile-centric user interface for query-based representative content of search result documents |
US10148726B1 (en) | 2014-01-24 | 2018-12-04 | Jpmorgan Chase Bank, N.A. | Initiating operating system commands based on browser cookies |
JP6058042B2 (ja) | 2015-01-26 | 2017-01-11 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
US10467768B2 (en) * | 2017-04-07 | 2019-11-05 | Intel Corporation | Optical flow estimation using 4-dimensional cost volume processing |
JP6934402B2 (ja) * | 2017-11-14 | 2021-09-15 | 株式会社日立国際電気 | 編集システム |
US10546054B1 (en) * | 2018-02-28 | 2020-01-28 | Intuit Inc. | System and method for synthetic form image generation |
US11393233B2 (en) * | 2020-06-02 | 2022-07-19 | Google Llc | System for information extraction from form-like documents |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4568983A (en) * | 1983-12-07 | 1986-02-04 | The Mead Corporation | Image data compression/decompression |
JPS60134357A (ja) * | 1983-12-21 | 1985-07-17 | Hitachi Ltd | 画像フアイル登録・検索方式 |
US4888690A (en) * | 1985-01-11 | 1989-12-19 | Wang Laboratories, Inc. | Interactive error handling means in database management |
US4885704A (en) * | 1987-01-12 | 1989-12-05 | Kabushiki Kaisha Toshiba | Electronic document filing apparatus with icon selection |
US4939671A (en) * | 1987-09-08 | 1990-07-03 | Auto-Trol Technology Corporation | Method and system for line drawing with next matrix feature |
JPH01144171A (ja) * | 1987-11-30 | 1989-06-06 | Toshiba Corp | 電子ファイリング装置 |
JPH01144165A (ja) * | 1987-11-30 | 1989-06-06 | Toshiba Corp | 電子ファイリング装置 |
JPH021057A (ja) * | 1988-01-20 | 1990-01-05 | Ricoh Co Ltd | 文書検索装置 |
US5088052A (en) * | 1988-07-15 | 1992-02-11 | Digital Equipment Corporation | System for graphically representing and manipulating data stored in databases |
US5133052A (en) * | 1988-08-04 | 1992-07-21 | Xerox Corporation | Interactive graphical search and replace utility for computer-resident synthetic graphic image editors |
US5287275A (en) * | 1988-08-20 | 1994-02-15 | Fujitsu Limited | Image recognition apparatus and method for recognizing a pattern within an image |
US5404514A (en) * | 1989-12-26 | 1995-04-04 | Kageneck; Karl-Erbo G. | Method of indexing and retrieval of electronically-stored documents |
US5142619A (en) * | 1990-02-21 | 1992-08-25 | International Business Machines Corporation | Method and apparatus for visually comparing files in a data processing system |
US5351138A (en) * | 1990-04-24 | 1994-09-27 | Ricoh Company, Ltd. | Image area discriminating device |
JP2876258B2 (ja) * | 1991-01-23 | 1999-03-31 | 株式会社リコー | デジタル電子スチルカメラ |
JPH0512345A (ja) * | 1991-06-28 | 1993-01-22 | Toshiba Corp | 画像記憶装置 |
US5189709A (en) * | 1991-08-26 | 1993-02-23 | The United States Of America As Represented By The United States National Aeronautics And Space Administration | Dynamic pattern matcher using incomplete data |
JPH0562011A (ja) * | 1991-09-03 | 1993-03-12 | Konica Corp | 画像処理装置 |
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
US5412807A (en) * | 1992-08-20 | 1995-05-02 | Microsoft Corporation | System and method for text searching using an n-ary search tree |
US5423033A (en) * | 1992-09-30 | 1995-06-06 | Intuit, Inc. | Report generation system and method |
JP3234064B2 (ja) * | 1993-09-02 | 2001-12-04 | キヤノン株式会社 | 画像検索方法並びにその装置 |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
-
1996
- 1996-03-01 US US08/609,641 patent/US5933823A/en not_active Expired - Lifetime
-
1997
- 1997-02-06 JP JP9023429A patent/JPH09237282A/ja active Pending
- 1997-02-28 CN CNB971029571A patent/CN1146817C/zh not_active Expired - Fee Related
- 1997-02-28 DE DE19708265A patent/DE19708265B4/de not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19983528B3 (de) * | 1998-09-09 | 2005-02-03 | Intel Corporation, Santa Clara | Multi-Linearisierungs-Datenstruktur zum Bild-Browsing |
US7016553B2 (en) | 1998-09-09 | 2006-03-21 | Intel Corporation | Linearized data structure ordering images based on their attributes |
WO2000049526A1 (en) * | 1999-02-16 | 2000-08-24 | Hewlett-Packard Company | Similarity searching by combination of different data-types |
EP1752895A1 (de) * | 2005-08-09 | 2007-02-14 | Canon Kabushiki Kaisha | Bildverarbeitungsvorrichtung zum Wiederauffinden von Bildern und zugehöriges Steuerungsverfahren |
US7746507B2 (en) | 2005-08-09 | 2010-06-29 | Canon Kabushiki Kaisha | Image processing apparatus for image retrieval and control method therefor |
WO2011029834A1 (de) * | 2009-09-09 | 2011-03-17 | Sureinstinct Gmbh | Verfahren zum anzeigen von ein objekt betreffende informationen |
Also Published As
Publication number | Publication date |
---|---|
US5933823A (en) | 1999-08-03 |
JPH09237282A (ja) | 1997-09-09 |
DE19708265B4 (de) | 2006-05-11 |
CN1146817C (zh) | 2004-04-21 |
CN1170168A (zh) | 1998-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19708265A1 (de) | Blättern in einer Bilddatenbank und Abfrage der Bilddaten, indem eine Strukturanalyse verwendet wird | |
DE69731418T2 (de) | Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen | |
DE10308014B4 (de) | System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt | |
US6563959B1 (en) | Perceptual similarity image retrieval method | |
Kovalev et al. | Color co-occurrence descriptors for querying-by-example | |
Story et al. | The RightPages image-based electronic library for alerting and browsing | |
DE69631457T2 (de) | Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung | |
DE69434620T2 (de) | Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten | |
DE69724755T2 (de) | Auffinden von Titeln und Photos in abgetasteten Dokumentbildern | |
DE69434434T2 (de) | Verfahren und gerät um text- und bilddaten zu synchronisieren, anzeigen und manipulieren | |
DE60116442T2 (de) | System zur Zuordnung von Schlüsselwörtern zu Dokumenten | |
DE60129652T2 (de) | Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung | |
JP2816241B2 (ja) | 画像情報検索装置 | |
DE3901485C2 (de) | Verfahren und Vorrichtung zur Durchführung des Verfahrens zur Wiedergewinnung von Dokumenten | |
DE19751570A1 (de) | Dokumentmanagementsystem, Verfahren zum Betreiben eines solchen Systems und Digitalkopierer | |
DE19843445A1 (de) | Navigationssystem für eine Dokumentbilder-Datenbank | |
US7545980B2 (en) | Method of and apparatus for classifying an image | |
DE19983528B3 (de) | Multi-Linearisierungs-Datenstruktur zum Bild-Browsing | |
CN102576372A (zh) | 基于内容的图像搜索 | |
DE19705757A1 (de) | Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems | |
DE69732213T2 (de) | Informationseingabeverfahren, -platte und -gerät | |
DE69816200T2 (de) | Bildverarbeitungsgerät zur Anzeige eines Katalogs von verschiedenen Datenarten auf verschiedene Weise | |
DE19817583B4 (de) | Verfahren und System zur Datenverarbeitung für dreidimensionale Objekte | |
DE60008201T2 (de) | Übersetzung von Daten mit elektronischen Bildern | |
Li | An implementation of ocr system based on skeleton matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20140902 |