DE19708265A1 - Blättern in einer Bilddatenbank und Abfrage der Bilddaten, indem eine Strukturanalyse verwendet wird - Google Patents

Blättern in einer Bilddatenbank und Abfrage der Bilddaten, indem eine Strukturanalyse verwendet wird

Info

Publication number
DE19708265A1
DE19708265A1 DE19708265A DE19708265A DE19708265A1 DE 19708265 A1 DE19708265 A1 DE 19708265A1 DE 19708265 A DE19708265 A DE 19708265A DE 19708265 A DE19708265 A DE 19708265A DE 19708265 A1 DE19708265 A1 DE 19708265A1
Authority
DE
Germany
Prior art keywords
image
document
search
software
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19708265A
Other languages
English (en)
Other versions
DE19708265B4 (de
Inventor
John Cullen
Jonathan Hull
Peter Hart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE19708265A1 publication Critical patent/DE19708265A1/de
Application granted granted Critical
Publication of DE19708265B4 publication Critical patent/DE19708265B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Description

Die vorliegende Erfindung betrifft ein Verfahren und einen Apparat zum Durch­ stöbern einer Bilddatenbank bzw. zum Blättern in einer Bilddatenbank und genauer ein Verfahren und einen Apparat zum Durchstöbern einer Bilddatenbank bzw. zum Blättern in einer Bilddatenbank, und zwar basierend auf einer bekannten Struktur bzw. bekannten Textur eines gewünschten Dokuments.
Mit der weiten Verbreitung preisgünstiger Permanent-Elektronikspeichervorrichtungen und von Scannern zum elektronischen Erfassen von Dokumentbildern bzw. Vorlagenbildern, wird die Erzeugung und Speicherung von großen Dokumentbild- Datenbanken möglich. Mögliche Verwendungen für derartige Bilddatenbanken stellen elektronische Bibliotheken, medizinische Dokumente, Verwaltungsaufzeichnungen, Nachrichtenclips, Pläne, Verwaltungsformulare, Handbücher, usw. dar. Im allgemeinen ist es nun weniger teuer, ein Dokument abzutasten und es auf einem elektronischen Speichermedium zu speichern, als das Dokument physikalisch zu speichern.
Bei derartigen großen Dokument-Bilddatenbanken ergibt sich jedoch das Problem, gewünschte Dokumente aus der Datenbank zu identifizieren und wiederzugewinnen. Eine bekannte Technik zum Abfragen einer Vorlagendatenbank besteht darin, nach einem Textstring bzw. nach einer Textzeichenkette oder einer Kombination von Textstrings bzw. Textzeichenketten zu suchen, die wahrscheinlich in einem gewünschten Dokument gefunden werden. Was das abgetastete Dokumente angeht, beruht diese Technik auf einer genauen optischen Zeichenerkennung (OCR bzw. "optical character recognition"), die nicht immer machbar sein kann. Ebenso ist es häufig schwierig, einen Textstring oder Strings zu erzeugen, die sowohl in einem gewünschten Dokument gefunden werden als auch im ausreichenden Maße das gewünschte Dokument von anderen unterscheiden.
Häufig weiß der Benutzer etwas darüber, wie ein gewünschtes Dokument aussieht. Es wäre von Vorteil, diese Information beim Abfragen einer Dokument-Bilddatenbank zu nutzen.
Die vorliegende Erfindung stellt ein Verfahren und einen Apparat zum Abfragen einer Dokument-Bilddatenbank dar, und zwar basierend auf einer Struktur bzw. einem inneren Aufbau und analytisch unterscheidbare Muster in den Dokument-Bildern der Datenbank. Gemäß der Erfindung kann eine Dokument-Bilddatenbank nach Dokumenten mit einer bestimmten Struktur bzw. einem bestimmten inneren Aufbau auf eine Vielfalt von Weisen durchstöbert bzw. durchsucht werden. Zum Beispiel kann ein Benutzer ein Beispiel-Dokumentbild eingeben, das ein zu dem gewünschten Dokument ähnliches Erscheinungsbild aufweist. Alternativ kann der Benutzer eine einfache Schnittstelle verwenden, um ein synthetisches bzw. künstliches Dokument zu definieren, und zwar basierend auf der Auswahl weniger Kategorien. Das synthetische Dokument würde dann als ein Beispiel für eine Suche dienen. Oder der Bediener kann eine graphische Schnittstelle verwenden, um genauer ein Beispiel für eine Suche festzulegen. Somit stellt die Kenntnis des Benutzers über das allgemeine Erscheinungsbild des gewünschten Dokuments oder der Dokumente (und ins­ besondere deren Umwandlung in physikalische Werte bzw. elektrische Signale, die von der Datenbank bzw. einem Computer verarbeitbar sind,) die Grundlage für die Suche dar.
Wenn einmal der Benutzer die Suche gestartet hat, wird ein Dokumentbild oder werden mehrere Dokumentbilder ausgewählt, und zwar basierend auf der Ähnlichkeit ihrer Struktur oder ihres inneren Aufbaus mit dem Beispiel. Diese Bilder können in einer Piktogrammgestalt bzw. in einer Ikongestalt auf einem Papier dargestellt oder gedruckt werden. Der Benutzer kann ein weiteres Durchblättern bzw. Durchstöbern auslösen, indem ein dargestelltes Dokument als ein Suchschlüssel für eine neue Suche ausgewählt wird. Bei einer Ausführungsform werden Dokumentbilder in der Datenbank zusammen gruppiert bzw. geclustert und wenn eine Abfrage durchgeführt wird, werden Darstellungen für die Gruppen bzw. Cluster dargestellt, die Bilder beinhalten, die bezüglich ihrer Struktur dem Suchschlüssel ähneln.
Bei einer Ausführungsform werden Seiten mit einem ähnlichen Erscheinungsbild identifiziert, wenn der Benutzer die Anzeige mehrerer Seiten eines Dokuments verlangt. Bezüglich der Seiten, die dahingehend identifiziert wurden, daß sie ein ähnliches Erscheinungsbild aufweisen, werden Bilder der Seiten einander überlagert und leicht versetzt dargestellt.
In Übereinstimmung mit einem Aspekt der Erfindung liegt die Grundlage für Dokument-Bildsuchvorgänge in einer Analyse der Struktur bzw. des inneren Aufbaus eines Bildes. Ein Merkmalsvektor wird für jedes Bild extrahiert. Eine Ähnlichkeit zwischen Bildern wird auf einer Abstandsmetrik gegründet, wie sie für die Merkmals­ vektoren paßt bzw. gilt. Bei der bevorzugten Ausführungsform weist der Merkmals­ vektor 80 Elemente auf und gründet auf vier unterschiedlichen Arten und Weisen der Bildverarbeitung. Die ersten 20 Elemente basieren auf einem Histogramm von verbundenen Komponentengrößen bzw. Verbindungskomponenten-Größen ("connected component sizes"), und zwar durchgehend für das Bild. Verbundene Komponenten ("connected components") werden im folgenden auch Verbindungs­ komponenten genannt. Die zweiten 20 Elemente werden aus einer Übersicht bzw. Vermessung von Interessenpunkten bzw. Punkten von Interesse über das ganze Dokument bzw. durchgehend bezüglich des Dokuments erhalten. Die dritten 20 Elemente werden von einem vertikalen Projektionshistogramm verbundener Bestandteile bzw. Komponenten erhalten. Der letzte Satz von 20 Elementen wird erhalten, indem das Dokument in 20 Zellen aufgeteilt wird und die verbundenen Bestandteile bzw. Komponenten in jeder Zelle aufsummiert werden.
Bei einer Ausführungsform werden Suchverfahren, basierend auf einer Kombination von Bildstruktur und Text verwendet, um eine Bilddatenbank abzufragen, und zwar dort, wo eine optische Zeichenerkennung (OCR) mit den Bildern der Datenbank durchgeführt wurde. Durch die Kombination der beiden Datentypen kann Text verwendet werden, um nach den OCR-Daten, die dem Bild zugeordnet sind, zu suchen, und die Strukturdaten können für eine Suche, basierend auf dem allgemeinen Erscheinungsbild des Bildes verwendet werden.
Die vorliegende Anmeldung basiert auf der prioritätsbegründenden US-Patent­ anmeldung S.N.08/609,641, angemeldet am 1. März 1996, deren Offenbarung hiermit mit aufgenommen wird.
Ein weiteres Verständnis der Natur und der Vorteile der Erfindungen hierin kann realisiert werden, indem auf die verbleibenden Abschnitte der Beschreibung und der beigefügten Zeichnungen bezuggenommen wird. Dabei können Merkmale ver­ schiedener Ausführungsformen untereinander kombiniert werden.
Fig. 1 zeigt ein Computersystem, das zur Realisierung der vorliegenden Erfindung geeignet ist.
Fig. 2 zeigt ein Flußdiagramm auf obersten Niveau, das dem Betrieb des Dokument-Bilddatenbank-Abfragesystems der vorliegenden Erfindung beschreibt.
Fig. 3 zeigt einen Benutzer-Schnittstellen-Bildschirm zum Entwickeln eines synthetischen Dokumentenbildes, basierend auf Kategorieselektionen als ein Beispiel, um eine Suche in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung zu starten.
Fig. 4 zeigt einen Benutzer-Schnittstellen-Bildschirm, bei dem ein Benutzer graphische Werkzeuge verwenden kann, um ein Beispiel-Dokumenten­ bild zu entwickeln, um eine Suche in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung zu starten.
Fig. 5 zeigt, wie Suchergebnisse für eine Bilddatenbank mit Clustern bzw. Gruppen in Übereinstimmung mit einer Ausführungsform der vorlie­ genden Erfindung gezeigt werden können.
Fig. 6 zeigt, wie Bilder mehrerer Seiten eines Berichts in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung gezeigt werden können.
Fig. 7A zeigt die Elemente eines Merkmalvektors, der aus einem Dokumentbild in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung extrahiert wird.
Fig. 7B zeigt ein verbundenes Komponenten-Größen-Histogramm, wie es innerhalb eines Merkmalvektors in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung eingebracht werden würde.
Fig. 7C zeigt, wie Interessen-Operator-Information, wie sie innerhalb eines Merkmalvektors in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung eingebaut bzw. eingebunden werden würde, arbeitet, um Unterscheidungen zwischen Dokumenten mit unter­ schiedlichen Font-Größen durchzuführen.
Fig. 7D zeigt ein Vertikalprojektions-Verbindungskomponentenhistogramm, wie es innerhalb eines Merkmalvektors in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung eingebracht bzw. eingebunden werden würde.
Fig. 7E zeigt, wie die Verteilung von verbundenen Komponenten bzw. Verbindungskomponenten unter Gitterzellen, wie sie innerhalb eines Merkmalvektors in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung inkorporiert werden würden, arbeitet, um unter Dokumenten mit unterschiedlichen Anordnungen von Komponen­ ten zu unterscheiden.
Fig. 8 zeigt ein repräsentatives Beispiel-Dokumentenbild, das zur Suche in Übereinstimmung mit der vorliegenden Erfindung verwendet wird, und Suchergebnisse.
System, das zur Implementation der vorliegenden Erfindung geeignet ist
Fig. 1 zeigt ein Basis-Untersystem eines Computersystems, das zur Verwendung mit der vorliegenden Erfindung geeignet ist. In Fig. 1 beinhaltet das Computersystem 10 einen Bus 12, der Haupt-Untersysteme, wie zum Beispiel eine zentrale Ver­ arbeitungseinheit bzw. einen Hauptprozessor 14, einen Systemspeicher 16, eine Eingabe/Ausgabe- (I/O bzw. "input/output") Steuereinrichtung 18, eine externe Vorrichtung, wie zum Beispiel einen Drucker 20 über einen Parallelport 22, einen Anzeigebildschirm 24 über einen Anzeigeadapter 26, einen seriellen Port 28, eine Tastatur 30, ein Festplattenlaufwerk 32 und ein Diskettenlaufwerk 33, das arbeitet, um eine Diskette 33A aufzunehmen, verbindet. Viele andere Vorrichtungen können angeschlossen werden, wie zum Beispiel eine Abtastvorrichtung 34, das über eine externe Schnittstelle 36 angeschlossen ist, eine Maus 38, die über ein serielles Port 28 angeschlossen ist, und einen Berührungsbildschirm bzw. Touchscreen 40, der direkt angeschlossen ist. Viele andere Vorrichtungen und Untersysteme (nicht gezeigt) können auf eine ähnliche Art und Weise angeschlossen werden. Ebenso ist es nicht für alle in der Fig. 1 gezeigten Vorrichtungen erforderlich, daß sie vorhanden sind, um die vorliegende Erfindung in die Praxis umzusetzen, wie im folgenden diskutiert wird. Die Vorrichtungen und Untersysteme können miteinander auf eine Art und Weise verbunden werden, die von jener verschieden ist, die in Fig. 1 gezeigt ist. Der Betrieb eines Computersystems, wie zum Beispiel jener, der in Fig. 1 gezeigt ist, ist in der Fachwelt gut bekannt und wird in der vorliegenden Anmeldung nicht detailliert diskutiert. Ein Quellkode, um die vorliegende Erfindung zu realisieren, kann betriebsmäßig in einem Systemspeicher 16 abgelegt oder auf einem Speichermedium, wie zum Beispiel einer Festplatte oder einer Diskette 33A gespeichert werden. Eine Bilddatenbank kann ebenso auf einer Festplatte 32 gespeichert werden.
Ein Anzeigebildschirm 24 ähnelt jenem, der bei Standardcomputern, wie zum Beispiel Personalcomputern oder Workstations verwendet wird, die einen Kathodenstrahlröhren(CRT)-Bildschirm oder einen Monitor verwenden. Verschiedene Formen von Bediener-Eingabevorrichtungen können zusammen mit der vorliegenden Erfindung verwendet werden. Zum Beispiel eine Maus-Eingabevorrichtung, die es einem Benutzer erlaubt, einen Zeiger, der auf einem Anzeigebildschirm dargestellt wird, in Übereinstimmung mit den Handbewegungen eines Benutzers zu bewegen, stellt eine Standard-Benutzereingabevorrichtung dar. Eine Maus beinhaltet üblicher­ weise eine oder mehrere Tasten auf seiner Oberfläche, so daß der Benutzer auf ein Objekt auf dem Bildschirm zeigen kann, indem die Maus bewegt wird und das Objekt ausgewählt wird, oder indem auf andere Weise das Objekt aktiviert wird, indem eine oder mehrere Tasten auf der Maus gedrückt werden. Alternativ erlaubt ein Berüh­ rungsbildschirm bzw. ein Touchscreen einen Benutzer, auf Objekte auf dem Bildschirm zu zeigen, um ein Objekt auszuwählen, und um das ausgewählte Objekt zu bewegen, indem auf eine zweite Position auf dem Bildschirm gezeigt wird. Verschiedene Tasten und Steuerungen können auf dem Bildschirm gezeigt werden, um sie zu aktivieren, indem die Maus oder der Touchscreen verwendet wird. Bei einem Festplattenlaufwerk 32 kann es sich um ein Festplattenlaufwerk oder um ein optisches Laufwerk oder um irgendein Medium handeln, das zum Speichern einer Datenbank von Dokumentenbildern geeignet ist.
Überblick über das Suchverfahren
Die vorliegende Erfindung stellt ein Dokument-Bilddatenbank-Suchsystem bereit, das auf der Verwendung von Beispieldokumenten bzw. als Beispiel dienenden Dokumente als Schlüssel für die Suche basiert. Durch Wechselwirkung mit dem System der vorliegenden Erfindung auf eine einer Anzahl von Weisen entwickelt der Benutzer ein Beispielbild. Vorzugsweise findet das System, basierend auf einer Struktur des Beispielbildes eine oder mehrere Übereinstimmungen und zeigt sie als Suchergebnisse an. Der Benutzer kann dann ein übereinstimmendes Bild als einen Schlüssel für eine weitere Suche in der Datenbank auswählen.
Fig. 2 zeigt ein Flußdiagramm auf oberstem Niveau, das dem Betrieb des Dokument- Bilddatenbank-Abfragesystems der vorliegenden Erfindung beschreibt. Im Schritt 202 wird ein Beispielbild entwickelt. Zum Beispiel kann der Benutzer ein bekanntes Beispielbild aus einem Diskettenlaufwerk 32 wiederfinden. Oder der Benutzer kann ein Bild einscannen, indem eine Abtastvorrichtung 34 verwendet wird. Andere Techniken zum Entwickeln eines Beispielbildes werden unter Bezugnahme auf Fig. 3 und 4 beschrieben.
Das Beispielbild, das im Schritt 202 entwickelt wird, dient als Grundlage für die Suche. Die Suche beruht auf einem Vergleich von Bildmerkmalen, wie sie über Bereiche des Dokuments gewonnen bzw. berechnet werden. Die Wirkung liegt darin, daß Dokumentbilder gefunden werden, die ein zu dem Dokumentbild ähnliches allgemeines Erscheinungsbild aufweisen. Dementsprechend wird dem Schritt 204 eine Bildmerkmalsinformation über das Beispiel-Dokumentbild erhalten. Vorzugsweise nimmt diese Bildmerkmalsinformation die Gestalt eines Bildmerkmalvektors ein, dessen Zusammensetzung unter Bezugnahme auf die Fig. 7A-7E diskutiert wird.
Die Datenbasis beinhaltet vorzugsweise auf ähnliche Weise erhaltene Bildmerkmals­ informationen für die Datenbankbilder. Im Schritt 206 wird die Bildmerkmals­ information, die aus dem Beispiel-Dokumentenbild erhalten wird, als ein Schlüssel für eine Suche in der Datenbank verwendet. Bei der bevorzugten Ausführungsform, bei der die Bildmerkmalsinformation ein Merkmalsvektor ist, wird vorzugsweise eine euklidische Abstandsmetrik verwendet, um Dokumentenbilder zu finden, die dem Beispiel ähnlich sind. Alternativ kann ein Mahalanobis-Abstand, ein Hausdorff- Abstand oder ein gewichtetes Übereinstimmungsschema verwendet werden, um ähnliche Dokumentenbilder zu finden. Bei einer Ausführungsform nutzt das Suchverfahren den Vorteil einer Gruppierung bzw. einer Clusterbildung in der Bilddatenbank, um Clusterknoten zu finden, die Punkte darstellen, die in der Nähe des Beispielbildes in dem Bildmerkmal-Vektorraum liegen.
Im Schritt 208 werden ähnliche Dokumentbilder dargestellt. Bei einer Ausführungs­ form werden die drei Bilder in der Datenbank, die am ähnlichsten sind, dargestellt. Alternativ werden Piktogramme bzw. Ikons dargestellt, die Cluster bzw. Gruppen darstellen, die Bilder mit ähnlichen Charakteristiken enthalten.
Im Schritt 210 kann der Benutzer eines der dargestellten Dokumentbilder oder Clusterpiktogramme als einen Schlüssel für die weitere Suche wählen. Das System nutzt dann das ausgewählte Bild oder das Clusterpiktogramm als ein neues Beispiel- Dokumentenbild und kehrt zum Schritt 206 zurück.
Bei einer Ausführungsform beinhaltet die Bilddatenbank Dokumentenbilder in verschlüsselter Form. Die Merkmalsinformation, die verwendet wird, um zu suchen, ist jedoch unverschlüsselt. Wenn gewünschte Dokumentenbilder identifiziert sind, werden sie für die Anzeige entschlüsselt. Gemäß dem Stand der Technik werden verschlüsselte Dokumentendatenbanken durchsucht, indem unverschlüsselte Schlüsselwort-Information verwendet wird. Der Lösungsansatz, der durch die vorliegende Erfindung bereitgestellt wird, ist dahingehend vorteilhaft, daß die unverschlüsselte Bildmerkmalsinformation nicht leicht verständlich ist und immer noch eine Sicherheitsmaßnahme bereitstellt. Im Gegensatz dazu können die Schlüsselwörter, die gemäß dem Stand der Technik unverschlüsselt geblieben sind, leicht verstanden werden, wodurch die Sicherheit gefährdet ist.
Bei einer verwandten Ausführungsform beinhaltet die Bilddatenbank Dokumentenbilder in einer komprimierten Form, während die Merkmalsinformation, die für die Suche verwendet wird, nicht komprimiert ist. Wenn gewünschte Dokumentenbilder identifiziert werden, werden sie zur Anzeige dekomprimiert.
Benutzerschnittstellen zum Entwickeln eines Beispielbildes
Fig. 3 zeigt einen Benutzerschnittstellenbildschirm 300 zum Entwickeln eines synthetischen Dokumentbildes, basierend auf Kategorieselektionen als ein Beispiel, um eine Suche in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung zu starten. Ein Benutzerschnittstellenbildschirm 300 kann auf einem Touchscreen 40 realisiert werden, wobei der Benutzer Selektionen vornimmt, indem die Auswahl von Kategorien spezifiziert wird, indem die vielfältigen angezeigten Tasten bzw. Schaltflächen berührt werden. Alternativ kann eine Maus oder eine andere vergleichbare Eingabevorrichtung verwendet werden, um die verschiedenen Kategorien auszuwählen.
Eine erste Spalte 302 von Schaltflächen, die den Titel "Struktur" bzw. "Textur" trägt, ermöglicht es dem Benutzer einen Dokumententyp auszuwählen. Es werden Schaltflächen bzw. Tasten für "Zeitung" 304, "Geschäftsbrief" 306, "Journal/Magazin" 308, "Katalog/Broschüre" 310 und "Handgeschriebenes" 312 bereitgestellt. Der Benutzer wählt den Dokumententyp bezüglich der Dokumente die er/sie sucht.
Eine zweite Spalte 314 von Schaltflächen bzw. Tasten, die den Titel "Layout" trägt, erlaubt es dem Bediener, die Anzahl von Spalten von Text auszuwählen, die in den Dokumenten gefunden werden, nach denen er/sie sucht. Schaltflächen werden für eine Spalte 316, für zwei Spalten 318 und für drei Spalten 320 bereitgestellt.
Eine dritte Spalte 322 von Schaltflächen bzw. Tasten, die den Titel "graphische Gestaltung" trägt, erlaubt es dem Benutzer die relative Anordnung eines Dokumenten­ titels, von Text und eines graphischen Bildes auszuwählen, wie sie in einem gewünschten Suchergebnis gefunden werden würde. Jede Schaltfläche zeigt eine mögliche Anordnung. Eine Schaltfläche 324 zeigt einen Titel 326, der sich oberhalb eines graphischen Bildes 328 und eines Textes 330 befindet. Eine Schaltfläche 338 zeigt einen Titel 340 oberhalb eines graphischen Bildes 342. Eine Schaltfläche 344 zeigt ein graphisches Bild 346 in der Nähe des Textes 348.
Indem eine Auswahl aus jeder der drei Spalten getroffen wird, kann der Benutzer schnell das allgemeine Erscheinungsbild des gewünschten Dokuments oder der gewünschten Dokumente übermitteln. Nachdem der Benutzer seine bzw. ihre Selektionen gemacht hat, startet die Aktivierung einer "Finde"-Schaltfläche 350 eine Suche, die auf einer Bildmerkmalinformation basiert, die den Selektionen des Benutzers entspricht. Diese Selektionen des Benutzers können als derartige verstanden werden, die ein Beispiel-Dokumentenbild spezifizieren, das als ein Schlüssel für die Suche in derselben Art und Weise dient, wie dies ein abgetastetes Bild tun würde. Natürlich sind die verschiedenen Kategorien und die Auswahl, die in Fig. 4 gezeigt ist, nur beispielhaft.
Fig. 4 zeigt eine vereinfachte Darstellung eines Benutzerschnittstellenbildschirms 400, bei dem ein Benutzer graphische Werkzeuge verwenden kann, um ein Beispiel- Dokumentbild zu entwickeln, um eine Suche in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung zu starten. Ein Benutzerschnittstellenbild­ schirm 400 bietet mehr Flexibilität bei der Spezifizierung eines Beispielbildes, als das System, das unter Bezugnahme auf Fig. 3 beschrieben ist.
Der Benutzer folgt einer Prozedur entlang der Rute, die er bei typischen computerunter­ stützten Zeichenpaketen folgen würde. Der Benutzer wählt einen Dokument­ komponententyp, wie zum Beispiel eine Kopfreile, Autor, Titel, Hauptkörper, Fußnote, Bild etc., indem eine Palette 402 verwendet wird. Eine Palette 404 wird verwendet, um eine Fontgröße bzw. eine Schriftzeichensatzgröße für Textkomponenten zu spezifizieren und um zwischen Strichzeichnungs- und Halbtonbildern für Bild­ komponenten zu unterscheiden. Die Auswahl einer Dokumentkomponente kann die Verwendung einer Maus 38, um einen Zeiger über den relevanten Palettenabschnitt zu positionieren, das Niederdrücken einer Taste auf der Maus 38, das Positionieren des Zeigers bei einem gewünschten Punkt innerhalb eines Dokumentenbildes 406 und das erneute Niederdrücken der Taste beinhalten. Die Größe und Position der Dokumentenkomponente kann dann justiert werden, indem Techniken, die für computerunterstützte Zeichenpakete typisch sind, verwendet werden.
Zahlreiche Variationen sind möglich bei dieser Benutzerschnittstelle. Um dem Benutzer eine Rückwirkung bzw. eine Systemreaktion bereitzustellen, kann das System einen aktuellen Text oder Grafikbilder in den bezeichneten Positionen innerhalb des Dokumentenbildes 406 darstellen. Ebenso kann der Benutzer die Dokumentenstruktur mit größerer Genauigkeit spezifizieren, indem die Fontgröße oder der Typenstil der Textbereiche des Dokumentenbildes spezifiziert wird.
Nach einer Reihe von Interaktionen bzw. Wechselwirkungen mit dem Benutzerschnitt­ stellenbildschirm 400, ergibt sich ein Bild, wie zum Beispiel ein Dokumentenbild 406 und dieses Bild ist für eine Verwendung als ein Beispielbild für eine Suche verfügbar. Eine symbolische Darstellung 408 zeigt die Ergebnisse einer Suche, die auf einem Beispielbild 406 basiert.
In Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung wird eine Textabfrage mit einer Struktursuche kombiniert. Eine Textabfrage würde durch die Entwicklung eines Beispielbildes mittels irgendeiner Technik, die eine der oben beschriebenen beinhaltet, formuliert werden. Eine Textabfrage würde eine oder mehrere Text-Zeichenketten bzw. Text-Strings beinhalten, die bei einem gewünschten Dokument gefunden werden würden. Die Suchergebnisse würden auf Bilder beschränkt werden, die die Kriterien von sowohl der Textabfrage als auch der Textsuche erfüllen. Diese besondere Abfragetechnik ist natürlich auf Bilddatenbanken beschrankt, für die OCR- Ergebnisse verfügbar sind. Als erstes würden Dokumente mit Bilder wiedergefunden werden, die das gewünschte Muster an Text-Strings beinhalten. Die wiedergewonnenen Bilder werden dann nach Bildern durchsucht, die eine Struktur aufweisen, die der spezifizierten ähnlich ist.
Alternativ wird eine Bildstruktur verwendet, um die Ergebnisse zu organisieren, die durch eine Textabfrage wiedergegeben werden. Als erstes werden Dokumentenbilder, die das gewünschte Muster an Text-Strings beinhalten, wiedergewonnen. Cluster bzw. Gruppen von Dokumenten mit ähnlichen Strukturen werden dann zusammen gruppiert. Diese Gruppen von Dokumenten werden dem Benutzer angezeigt, indem zum Beispiel eine Overlay-Technik verwendet wird, die früher beschrieben wurde. Diese Technik stellt einen einfachen Weg bereit, um zwischen Dokumenten von unterschiedlichen Quellen Unterscheidungen zu treffen. Man betrachtet zum Beispiel eine Datenbank, die Bilder von Zeichnungen und Artikeln wissenschaftlicher Journale beinhaltet. Eine Textabfrage kann Dokumente von beiden Typen von Quellen wiedergeben. Jedoch kann der Benutzer nur in den Ergebnissen von einer von ihnen interessiert sein. Die Bildstruktur-Clusterbildung stellt ein Verfahren für einen Benutzer bereit, um schnell Zeitungsartikel von Artikeln wissenschaftlicher Journale zu unterscheiden.
Suchergebnisanzeige
Fig. 5 zeigt, wie Suchergebnisse für eine geclusterte Bilddatenbank bzw. eine gruppierte Bilddatenbank in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung dargestellt werden kann. Eine Bilddatenbank mit Clustern ist eine, wo Bilder in einer hierarchischen Struktur gemäß ihrer Position in dem Raum zusammen gruppiert werden, der durch den Bildmerkmalsvektor festgelegt ist. Die Datenbasis wird in eine oder mehrere Gruppen aufgeteilt. Jede Gruppe kann wiederum aus einer oder mehreren Untergruppen bestehen. Eine Beschreibung der Clusterbildung kann in Duda & Hart, "Pattern Classification & Scene Analysis" (John Wiley & Sons 1973), deren Inhalt hiermit durch Bezugnahme aufgenommen wird.
Falls es ein einziges Hierarchieniveau gibt, werden bei einer Abfrage alle Bilder in dem Cluster, die dem Beispieldokument am nächsten sind, in dem Bildmerkmals- Vektorraum zurückgegeben. Fig. 5 zeigt die Ergebnisse einer Durchblätterungssuche, die in dem Kontext bzw. im Zusammenhang einer Vielfach-Niveau-Hierarchie von Clustern dargestellt sind. Das Niveau 500 zeigt Piktogramme, die Clusterknoten darstellen. Der Benutzer steigt in der Hierarchie weiter ab, indem eines der Piktogramme als ein Schlüssel für die weitere Suche ausgewählt wird. Schließlich kann der Benutzer ein Blatt-Cluster ("leaf cluster") erreichen, d. h. eine Gruppe von tatsächlichen Bildern im Gegensatz zu Cluster-Knoten. Diese Bilder werden dann dargestellt.
Ein Weg der Realisierung der auf Cluster basierenden Suche ist es, die Clusterstruktur jedesmal neu zu berechnen, wenn eine Abfrage vorgelegt bzw. gefordert wird. Eine andere Art und Weise der Realisierung der auf Cluster basierenden Suche ist es, die Clusterstruktur vor der Suche zu berechnen, indem vorzugsweise Strukturinformation verwendet wird. Der zuvor beschriebene Suchprozeß gleicht dann im wesentlichen der Navigation durch einen Baum.
Fig. 6 zeigt eine verbesserte Anzeige für Dokumente mit mehreren Seiten in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung. Häufig stellt ein gewünschtes Dokumentbild eine Seite einer Bilddatenbank dar. Zum Beispiel sind in der gutbekannten Berkeley-Bilddatenbank Reports bzw. Berichte von 50 Seiten üblich. Viele Seiten dieser Reports sind nur Text und neigen dazu, ähnliche Strukturmerkmale aufzuzeigen, was ein Wiederfinden schwierig macht. Die Seiten, die die interessantesten Merkmale für den Benutzer für das Durchblättern bzw. Durchstöbern bereitstellen, sind die Titelseite, die Seite mit der Inhaltsangabe, Diagramme, Figuren etc. Diese stellen ebenso die Seiten dar, die die besten Merkmale bereitstellen, von denen aus weitere Abfragen der Datenbank vorgenommen werden können.
Vorzugsweise erscheint ein Dokument mit mehreren Seiten zu Beginn als ein einziges Bild, wenn ein Suchergebnis dargestellt wird. Jedoch kann der Benutzer bewirken, daß das gesamte Dokument erscheint, indem dieses Bild ausgewählt wird. Eine Anzeige 602 zeigt die Suchergebnisse einschließlich der mehreren Seiten 606 desselben Reports, die ein ähnliches Erscheinungsbild aufweisen. Man kann erkennen, daß für Reports mit Hunderten von Seiten die Anzeige bald mit sich wiederholenden Bildern überhäuft ist. Eine verbesserte Darstellung 604 zeigt mehrere Seiten 606 desselben Reports, wobei dessen Bilder mit einem leichten Versatz von Seite zu Seite überlagert sind. Eine verbesserte Anzeige 604 zeigt eine erheblich geringere Überhäufung.
Um die verbesserte Darstellung zu erreichen, wenn ein Report mit mehreren Seiten dargestellt werden soll, werden Seiten mit einem im wesentlichen gleichen Er­ scheinungsbild identifiziert, indem ihre Seitenmerkmalsinformation verglichen wird.
Die Bilder dieser Seiten werden dann dargestellt, wobei ihre Bilder mit einem Offset von Seite zu Seite überlagert werden.
Merkmalsvektorextraktion
Fig. 7A zeigt die Elemente eines Merkmalvektors 700, die von einem Dokumentbild in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung extrahiert werden. Vorzugsweise beinhaltet ein Merkmalsvektor 700 80 Elemente, die vier Gruppen von 20 Elementen beinhalten. Eine erste Gruppe von 702 von 20 Elementen stellt ein Histogramm von verbundenen Komponentengrößen dar und wird weiter unter Bezugnahme auf Fig. 7B diskutiert. Eine zweite Gruppe 704 von 20 Elementen stellt eine Verteilung von Interessepunkten durchgehend über die Zellen des Dokumentbildes dar und wird weiter unter Bezugnahme auf Fig. 7C diskutiert. Eine dritte Gruppe 706 von 20 Elementen stellt ein Vertikalprojektions-Histogramm einer Verbindungs­ komponentendichte dar und wird weiter unter Bezugnahme auf Fig. 7D diskutiert. Eine vierte Gruppe 708 von 20 Elementen stellt eine Verteilung von Verbindungs­ komponenten bzw. verbundenen Komponenten durchgehend über Zellen des Dokuments dar und wird weiter unter Bezugnahme auf Fig. 7E diskutiert.
Fig. 7B zeigt ein Verbindungskomponenten-Größenhistogramm 710, wie es in einem Merkmalsvektor 702 in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung inkorporiert werden würde. Das Histogramm 710 basiert auf einer Verbindungskomponenten-Größeninformation, die von dem Bild erhalten wird. Eine einzige Verbindungskomponente stellt einen Satz von benachbarten schwarzen Pixeln in einem Bild dar. Um die Größe einer Verbindungskomponente zu bestimmen, findet die bevorzugte Ausführungsform das Gebiet der rechteckigen Box minimaler Größe, das sie umschließt. Alle anderen Arten der Bestimmung einer Verbindungs­ komponentengröße gehören ebenfalls zum Umfang der vorliegenden Erfindung. Zum Beispiel kann die diagonale Abmessung der umfassenden bzw. einschließenden rechteckigen Box die Verbindungskomponentengröße sein. Schließlich könnte noch, wenn dies zusätzlich erwünscht wird, mit dem Bild eine Filterung durchgeführt werden, bevor eine Verbindungskomponentengröße bestimmt wird.
Horizontale und vertikale Achsen 712 und 714 des Histogramms werden vorzugsweise zu einer logarithmischen Skale normalisiert. Weiter könnte man zusätzlich noch eine Gewichtung mit dem Histogrammbins vornehmen. Ein Plot 716 zeigt das Histogramm für eine symbolische Seite bzw. repräsentative Seite eines Magazins. Ein Plot 718 zeigt das Histogramm für eine symbolische bzw. repräsentative Seite eines technischen Journals. Wie man sehen kann, ist die Information von diesem Histogramm nützlich, um zwischen verschiedenen Typen von Dokumenten zu unterscheiden.
Die zweite Gruppe 704 von 20 Merkmalvektorelementen basiert auf einer Interessen­ punktinformation. Interessenpunkte sind Pixel innerhalb eines Bildes, die innerhalb von Gebieten liegen, die unterschiedliche bzw. zu unterscheidende Merkmale aufweisen. Jeder Interessenpunkt weist einen identifizierten bzw. erkannten Interessenpegel auf. In der Fachwelt ist ebenso bekannt, daß Interessenpunkte ("interest points") und ihre zugeordneten Interessenpegel ("interest levels") gefunden werden, indem sogenannte Interessenoperatoren auf die Pixel eines Bildes angewendet werden. Die bevorzugte Ausführungsform sieht einen Vorteil aus einem modifizierten Moravec- Operator, der dem ähnelt, der in der US-Patentanmeldung mit der Seriennummer 08/527,286 "SIMULTANEOUS REGISTRATION OF MULTIPLE IMAGE FRAGMENTS" beschrieben ist, die auf den Anmelder dieser Anmeldung überschrieben ist und deren Inhalt hiermit durch Bezugnahme mit aufgenommen wird.
Für jeden Pixel wird der modifizierte Moravec-Varianzoperator an jedem der sechs Radien von dem Pixel aus bestimmt. Für einen gegebenen Pixel und einen Radius stellt der Interessenpegelwert bzw. Interessenniveauwerte die Varianz der Pixelwerte der vier Pixel dar, die sich um einen gegebenen Radius weg, oberhalb, unterhalb, links und rechts von dem gegebenen Pixel befinden. Typischerweise sind Dokumentenbilder binär und die Pixelwerte sind entweder Null oder stellen einen Skalenendwert bzw. einen Höchstwert dar. Die Interessenpegelwerte werden in drei Bins sortiert, in einen Niedriginteressenwert, einen mittleren Interessenwert und in einen Hochinteressenwert. Andere Interessenoperatoren können ebenso verwendet werden. Einen Überblick über Interessenoperatoren wird in Yan "Interest Operators and Fast Implementation" International Archives of Photogrammetry and Remote Sensing, Band 27-H, Japan, Seiten 491-500, 1988, gefunden, deren Inhalt hiermit unter Bezugnahme uneinge­ schränkt mit aufgenommen wird.
Jede Kombination aus Radius und Interessenpegelbin wird einem Element in einer zweiten Gruppe 704 zugewiesen. Der Wert des Elements stellt eine normalisierte Darstellung der Anzahl von Pixel mit dem Interessenpegelwert und Radius, der dem Element zugeordnet ist, dar. Da es sechs Radien gibt und drei Interessenpegel- Wertebins, macht dies 18 von 20 Elementen in der zweiten Gruppe 704 aus.
Die zwei verbleibenden Elemente der zweiten Gruppe 704 stellen spezielle Werte dar. Ein Element beinhaltet einen Wert, der dem Verhältnis der Anzahl von schwarzen Pixel in dem Bild zu der gesamten Anzahl von Pixel entspricht. Ein anderes Element hält einen Wert, der einer gesamten Anzahl von Schwarz-zu-Weiß-Übergängen entspricht, die bei einer horizontalen Abtastung durch das Bild entdeckt werden.
Fig. 7C stellt die Nützlichkeit einer Interessenpunktinformation für die Unterscheidung von Dokumentenbildern dar. Fig. 7C zeigt einen Buchstaben "t" 720, wobei die Interessenpegel bei verschiedenen Teilen des Buchstabens vorhanden sind. Ein Pixel 722 an einer Ecke weist einen hohen Interessenpegel auf. Ein Pixel 724 im Inneren weist einen niedrigen Interessenpegel auf. Ein Pixel 726 entlang einer Kante weist einen mittleren Interessenpegel auf.
Fig. 7D zeigt ein Vertikalprojektion-Verbindungskomponentenhistogramm 728, wie es innerhalb eines Merkmalvektors in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung inkorporiert werden würde. Um die dritte Gruppe 706 des Merkmalvektors zu erhalten, wird das Bild in 20 Vertikalstreifen aufgeteilt. Jedes Element der dritten Gruppe entspricht einer Population bzw. einer Gesamtheit von Verbindungskomponenten mit einer Größe oberhalb einer mimalen Schwelle in einem bestimmten Vertikalstreifen. Bei einer bevorzugten Ausführungsform stellt dieses Minimum eine Höhe und eine Breite dar, die beide größer als ein Pixel sind. Diese dritte Gruppe 706 ist besonders bei der Unterscheidung zwischen Dokumenten nützlich, die eine unterschiedliche Anzahl von Spalten im Text aufweisen. Ein erstes Dokument 730 mit einer einzigen Textspalte ergibt die Projektions-Histogrammdarstellung 732. Ein zweites Dokument 734 mit zwei Textspalten ergibt ein Projektionshistogramm 736. Wie man sehen kann, weist das Projektionshistogramm 732 einen Peak auf, der der einzigen Spalte entspricht, wohingegen das Projektionshistogramm 736 zwei Peaks aufweist, die den zwei Spalten entsprechen.
Fig. 7E zeigt, wie die Verteilung von Verbindungskomponenten zwischen Gitterzellen, wie sie innerhalb eines Merkmalsvektors in Übereinstimmung mit seiner Ausführungs­ form der Erfindung inkorporiert werden würden, arbeitet, um eine Unterscheidung zwischen Dokumenten mit unterschiedlichen Anordnungen von Komponenten zu treffen. Die vierte Gruppe 708 von Elementen wird erhalten, indem das Bild in ein 5×4-Feld 738 von Zellen aufgeteilt wird und indem die Population bzw. Gesamtheit von Verbindungskomponenten oberhalb einer Schwellengröße in jeder Zelle gefunden wird. Bei der bevorzugten Ausführungsform stellt diese Komponentengröße eine Höhe und eine Breite dar, die größer als ein Pixel ist. Die Population von Verbindungs­ komponenten bzw. verbundenen Komponenten einer jeden Zelle wird dann in Bezug auf eine Gesamtanzahl von Verbindungskomponenten für das Bild als Ganzes normalisiert. Diese vierte Gruppe 708 ist besonders bei der Unterscheidung zwischen Dokumenten, wie zum Beispiel Dokumente 740 und 742 nützlich, die unterschiedliche Anordnungen von Dokumentkomponenten bzw. Dokumenten-Komponenten aufweisen.
Die Extraktion von Bildmerkmals-Information aus Beispiel-Dokumentenbildern, die durch Kategorieselektion entwickelt wurden, wie unter Bezugnahme auf Fig. 3 beschrieben wurde, oder die durch eine graphische Benutzerschnittstelle entwickelt wurden, wie unter Bezugnahme auf Fig. 4 beschrieben wurde, folgt einem modifizierten Verfahren bzw. einer modifizierten Prozedur. Bei dem Kategorieselek­ tionsschema von Fig. 3 gibt es eine beschränkte Anzahl von möglichen Beispiels- Dokumentenbildern. Ein Verfahren besteht darin, für jede Kombination von Kategorieselektionen ein entsprechendes aktuelles Dokumenten-Bild mit den gewählten Charakteristiken bereitzustellen. Dieses Bild kann dann als die Basis für eine Bildmerkmalsextraktion dienen, wie sie oben unter Bezugnahme auf die Fig. 7A- 7E beschrieben wurde.
Für Beispielbilder, die entwickelt wurden, indem die Techniken verwendet werden, die unter Bezugnahme auf Fig. 4 diskutiert wurden, besteht ein Verfahren darin, ein aktuelles Dokumenten-Bild zu konstruieren, indem Beispielbildmaterial bzw. Abtastbildmaterial kombiniert wird, das jeder ausgewählten Komponente entspricht. Bezüglich Textkomponenten wird tatsächlicher Text mit aufgenommen. Bezüglich Graphiken wird ein Abtastgraphikbild bzw. ein Beispielgraphikbild mit aufgenommen bzw. mit eingeschlossen. Das so konstruierte aktuelle Dokumentenbild dient als Grundlage für eine Bildmerkmalsextraktion.
Suchergebnisse
Fig. 8 zeigt ein repräsentatives Beispiel-Dokumentenbild 802, das als ein Beispiel für eine Suche in Übereinstimmung mit der vorliegenden Erfindung verwendet wird, und Suchergebnisse. In dem ein Beispielbild 802 als der Schlüssel für eine Suche verwendet wird, werden Bilder 804 und 806 und 808 von einer Datenbank von 971 Bildern einschließlich Journalen, Briefen, Magazinen, Broschüren bzw. Katalogen, Zeitungen, Katalogen und handgeschriebenen Text. Das Beispielbild 802 stellt einen Geschäftsbrief dar und alle Suchergebnisse sind ebenfalls Geschäftsbriefe. Wie man sehen kann, stellt das Suchsystem der Erfindung Bilder bereit, die vom Anblick her dem Beispielbild ähneln.
Gemäß der Erfindung können zum Beispiel die Techniken der vorliegenden Erfindung ebenso auf Grauskalenbilder angewendet werden, obwohl die obige Beschreibung auf binäre Bilder bezugnimmt. Interessenpunkt-Techniken sind in der Fachwelt für Grauskalenbilder gut bekannt. Verbindungskomponenten-Information kann von einem Grauskalenbild erhalten werden, indem zuerst eine Schwellenfunktion auf die Grauskalenwerte angewendet wird und dann benachbarte Gruppen von Pixeln mit Werten oberhalb der gewählten Schwelle gefunden werden.
Die Suchtechniken, die oben beschrieben wurden, können ebenso auf Farbbilder mit passenden Änderungen des Bildmerkmalsvektors angewendet werden. Zum Beispiel kann der Bildvektor derartig ausgedehnt werden, daß er Elemente enthält, die den Median-CMYK-Werten über verschiedene bzw. vielfältige Zellen des Bildes entsprechen.
Ebenso kann für eine verbesserte Genauigkeit beim Vergleich eines visuellen Erscheinungsbildes von Bildern ein Merkmalsvektor mit einer viel größeren Anzahl von Elementen verwendet werden. Zum Beispiel kann das Dokumentenbild in 20 Zellen aufgeteilt werden. Ein 60-Elementvektor, der den ersten drei Gruppen des Merkmal- Elementvektors 700 entspricht, kann dann für jede Zelle berechnet werden. Die Ansammlung aller dieser 60-Elementvektoren würde einen 1.200-Element-Merkmals­ vektor darstellen, der als Basis zum Durchsuchen und Durchblättern einer Bilddaten­ bank dienen kann.
Erfindungsgemäß kann z. B. das offenbarte Verfahren auch über größere Entfernungen durchgeführt werden. So kann nach dem Schritt des Erhaltens der Bildmerkmals­ information (siehe z. B. Anspruch 1), diese Information an die Datenbank übermittelt werden, die sich z. B. an eine entfernt gelegenen bzw. an einem anderen Ort, als den Beispielbilderzeugungsort bzw. Bildmerkmalsinformationserzeugungsort befindet. Die Datenbank sendet dann Suchergebnisse zur Weiterverarbeitung zurück. Aus diese Art und Weise müssen nicht sämtliche zu einem Thema gehörigen Dokumente von der Datenbank zur Durchsicht übermittelt werden, da eine gezielte Vorauswahl getroffen wurde. Dadurch wird die Datenübertragungszeit entscheidend verkürzt und der Speicherbedarf am Abfragegerät bzw. am Abfrageende des Geräts sinkt.
Weiter kann z. B. durch die Bereitstellung von den einzelnen Datenbank-Bilddokumenten zugeordneten Merkmalsvektoren, die Suche erheblich beschleunigt werden, wobei die einzelnen Merkmalsvektoren z. B. als eine Art komprimierte, wenn auch verlustbehafte­ te Darstellung der Bilddokumente aufgefaßt werden können. So kann z. B. die Übermittlung von Merkmalsvektoren in Kombination mit Datenbanken an einem oder an beiden Enden des Übermittlungsweges als Kompressions-/Dekompressionsverfahren zur Übermittlung von Bildern aufgefaßt werden.
Die Erfindung läßt sich beispielsweise wie folgt zusammenfassen:
Verfahren und Apparat zum Abfragen einer Dokument-Bilddatenbank, basierend auf einer Struktur, d. h. auf analytisch unterscheidbaren Mustern in den Dokument-Bildern der Datenbank. Gemäß der Erfindung kann eine Dokumentbilddatenbank für Dokumente mit einer bestimmten Struktur auf eine Vielfalt von Weisen durchblättert werden. Zum Beispiel kann ein Benutzer ein Beispiel-Dokumentbild mit einem Erscheinungsbild, das dem gewünschten Dokument ähnelt, eingeben. Alternativ kann der Benutzer eine einfache Schnittstelle verwenden, um ein synthetisches Dokument bzw. künstliches Dokument, basierend auf einer Auswahl weniger Kategorien festzulegen. Das synthetische Dokument würde dann als ein Beispiel für eine Suche dienen. Oder der Benutzer kann eine graphische Schnittstelle verwenden, um genauer ein Beispiel für eine Suche festzulegen. Somit liefert die Kenntnis des Benutzers von dem allgemeinen Erscheinungsbild des gewünschten Dokuments oder der Dokumente die Basis für die Suche.

Claims (29)

1. Verfahren zum Durchsuchen einer Dokument-Bilddatenbank, das die folgenden Schritte aufweist:
ein Beispiel-Dokumentbild wird entwickelt;
eine Bildmerkmalsinformation über das Beispiel-Dokumentbild wird erhalten; die Dokument-Bilddatenbank wird durchsucht, indem die Bildmerkmals­ information verwendet wird;
Suchergebnisse des Suchschrittes werden angezeigt; und
eine Benutzereingabe wird angenommen bzw. angezeigt, die ein gegebenes Suchergebnis als einen Schlüssel für eine weitere Suche auswählt.
2. Verfahren nach Anspruch 1, bei welchem der Entwicklungsschritt ein Einscannen des Beispiel-Dokumentbildes umfaßt.
3. Verfahren nach Anspruch 1, bei welchem der Entwicklungsschritt die Annahme einer Benutzereingabe umfaßt, die Charakteristiken des Beispiel-Dokumentbildes spezifiziert.
4. Verfahren nach Anspruch 1, bei welchem der Entwicklungsschritt den Schritt umfaßt, wonach ein graphisches System betrieben wird, bei dem ein Benutzer Komponenten des Beispiel-Dokumentbildes spezifiziert und anordnet.
5. Verfahren nach Anspruch 1, bei welchem die Bildmerkmalinformation eine Information über Interessenpunkte in dem Beispiel-Dokumentbild umfaßt.
6. Verfahren nach Anspruch 1, bei welchem die Bildmerkmalinformation eine Information über verbundene Komponenten in dem Beispiel-Dokumentbild umfaßt.
7. Verfahren nach Anspruch 1, bei welchem die Bildmerkmalinformation Information über eine Verteilung von verbundenen Komponenten bzw. Verbindungskomponenten in dem Beispiel-Dokumentbild umfaßt.
8. Verfahren nach Anspruch 1, bei welchem der Schritt des Erhaltens den Schritt aufweist, wonach ein Bildmerkmalvektor für das Beispiel-Dokumentbild bestimmt wird.
9. Verfahren nach Anspruch 8, bei welchem der Suchschritt den Schritt aufweist, wonach der Bildmerkmalvektor für das Beispiel-Dokumentbild mit den Bildmerkmal­ vektoren von Dokumenten-Bildern in der Datenbank verglichen werden.
10. Verfahren nach Anspruch 9, das weiter den Schritt aufweist, wonach eine Benutzereingabe angenommen wird, die einen Suchtextstring spezifiziert und wobei der Suchschritt weiter den Schritt aufweist, wonach der Suchtextstring mit OCR-Daten verglichen wird, die den Dokumenten-Bildern in der Datenbank zugeordnet sind.
11. Verfahren nach Anspruch 1, bei welchem der Schritt des Anzeigens das Anzeigen von einen oder mehreren Dokument-Bildern umfaßt, die strukturell dem Beispiel- Dokumentbild ähneln.
12. Verfahren nach Anspruch 1, bei welchem der Schritt des Anzeigens weiter das Anzeigen von Piktogrammen bzw. Ikons als ein Suchergebnis umfaßt, die Cluster oder Gruppen von Bildern darstellen, die dem Beispiel-Dokumentbild ähneln.
13. Verfahren nach Anspruch 1, bei welchem die Dokument-Bilddatenbank Dokumenten-Bilder in verschlüsselter Form und Bildmerkmalinformation für die verschlüsselten Dokumenten-Bilder aufweist.
14. Verfahren nach Anspruch 13, bei welchem das Suchen das Suchen der Bildmerk­ malinformation aufweist, die in der Dokument-Bilddatenbank gespeichert ist und bei welchem das Anzeigen ein Entschlüsseln von Suchergebnissen des Suchschrittes umfaßt.
15. Verfahren nach Anspruch 1, bei welchem die Dokument-Bilddatenbank Dokument-Bilder in komprimierter Form und Bildmerkmalinformation für die komprimierten Dokumenten-Bilder aufweist.
16. Verfahren nach Anspruch 15, bei welchem das Suchen das Suchen der Bildmerk­ malinformation aufweist, die in der Dokument-Bilddatenbank gespeichert ist und bei welchem das Anzeigen ein Dekomprimieren von Suchergebnissen des Suchschrittes umfaßt.
17. Verfahren zum Extrahieren eines Merkmalvektors aus einem elektronisch gespeicherten Bild, das die folgenden Schritte aufweist:
die Größe von Verbindungskomponenten bzw. verbundenen Komponenten wird über das ganze Bild gemessen;
Interessenpegel von Pixeln werden über das ganze Bild identifiziert;
die verbundenen Komponente bzw. Verbindungskomponenten und ihre Größen werden über das ganze Bild identifiziert;
ein Histogramm von verbundenen Komponentengrößen bzw. Verbindungs­ komponentengrößen werden als eine erste Gruppe von Elementen des Merkmalvektors gespeichert; und
ein Histogramm von Interessenpegeln von Pixeln wird als eine zweite Gruppe von Elementen des Merkmalvektors gespeichert.
18. Verfahren nach Anspruch 17, das weiter folgendes aufweist: ein Histogramm einer verbundenen Komponentenpopulation bzw. einer Verbindungskomponentenpopulation in Vertikalabschnitten des Bildes wird als eine dritte Gruppe von Elementen des Merkmalvektors gespeichert.
19. Verfahren nach Anspruch 17, das weiter folgendes aufweist:
die Anzahl von verbundenen Komponenten bzw. Verbindungskomponenten werden in einer Vielzahl bzw. Anzahl von Regionen bzw. Bereichen des Bildes als eine vierte Gruppe von Elementen des Merkmalvektors gespeichert.
20. Verfahren zum Suchen nach einem Dokument in einer Dokument-Bilddatenbank, das die folgenden Schritte aufweist:
eine Benutzereingabe wird angenommen, die eine Kategorie des Dokuments spezifiziert;
eine Benutzereingabe wird angenommen, die eine Anzahl von Textspalten des Dokuments spezifiziert;
eine Benutzereingabe wird angenommen, die eine Organisation bzw. Aufbau des Dokuments spezifiziert;
ein künstliches Dokument bzw. synthetisches Dokument der Kategorie wird entwickelt, das die Anzahl von Spalten und die Organisation bzw. der Aufbau aufweist; und
die Dokument-Bilddatenbank wird nach Dokumenten durchsucht, die dem synthetischen bzw. künstlichen Dokument ähneln.
21. Verfahren nach Anspruch 20, bei welchem der Suchschritt weiter folgendes aufweist:
es wird nach Dokumenten gesucht, die eine Struktur aufweisen, die dem synthetischen Dokument bzw. künstlichen Dokument ähnelt.
22. Dokumentenbild-Durchstöberungssystem, das folgendes aufweist:
eine elektronische Speichereinheit, die eine Dokument-Bilddatenbank speichert;
eine Anzeige, die Dokumenten-Bilder anzeigt;
eine Prozessoreinheit bzw. Verarbeitungseinheit, die mit der elektronischen Speichervorrichtung und der Anzeige gekoppelt ist bzw. verbunden ist, wobei die Verarbeitungseinheit funktionsfähig ist, um:
ein Beispiel-Dokumentenbild zu entwickeln;
eine Bildmerkmalsinformation über das Beispiel-Dokumentenbild zu erhalten; und
die Dokumenten-Bilddatenbank nach Dokument-Bildern zu durchsuchen, die dem Beispiel-Dokumentbild ähneln, wobei die Bildmerkmalinformation verwendet wird.
23. Software auf einem Speichermedium, die folgendes aufweist:
Software zum Entwickeln eines Beispiel-Dokumentbildes;
Software zum Erhalten von Bildmerkmalinformation über das Beispiel- Dokumentbild;
Software zum Durchsuchen der Dokument-Bilddatenbank, indem die Bildmerkmalinformation verwendet wird;
Software zum Anzeigen von Suchergebnissen der Suchsoftware; und
Software zum Annehmen einer Benutzereingabe, die ein angezeigtes Suchergebnis als einen Schlüssel für eine weitere Suche auswählt.
24. Software nach Anspruch 23, bei welcher die Entwicklungssoftware eine Software zum Annehmen einer Benutzereingabe aufweist, die Charakteristiken des Beispiel- Dokumentbildes spezifiziert.
25. Software nach Anspruch 23, bei welchem die Entwicklungssoftware weiter die Software zum Arbeiten eines graphischen Systems umfaßt, wobei ein Benutzer Komponenten des Beispiel-Dokumentbildes spezifiziert und anordnet.
26. Software nach Anspruch 23, bei welchem die Software zum Erhalten eine Software zum Extrahieren eines Bildmerkmalvektors für das Beispiel-Dokumentbild umfaßt.
27. Software nach Anspruch 26, bei welchem die Suchsoftware weiter Software zum Vergleichen des Bildmerkmalvektors für das Beispiel-Dokumentbild mit den Bildmerkmalvektoren von Dokument-Bildern in der Datenbank aufweist.
28. Software nach Anspruch 27, die weiter Software zum Annehmen einer Benutzer­ eingabe aufweist, die einen Suchtextstring spezifiziert und wobei die Suchsoftware weiter eine Software zum Vergleichen des Suchtextstrings mit OCR-Daten aufweist, die den Dokumentbildern in der Datenbank zugeordnet sind.
29. Verfahren zum Anzeigen von Bildern von Dokumenten mit mehreren Seiten, das folgende Schritte aufweist:
Bildmerkmalinformation von Bildern von Seiten von Dokumenten wird verglichen;
Seiten mit einem ähnlichen Erscheinungsbild werden basierend auf der Bildmerkmalinformation identifiziert; und Seiten mit einem ähnlichen Erscheinungsbild werden übereinander mit einem Versatz zwischen ihnen überlagert angezeigt.
DE19708265A 1996-03-01 1997-02-28 Verfahren zum Durchsuchen einer Dokument-Bilddatenbank und Dokumentbild-Durchstöberungssystem sowie Verfahren zum Extrahieren eines Merkmalsvektors aus einem elektronisch gespeicherten Bild Expired - Fee Related DE19708265B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/609,641 1996-03-01
US08/609,641 US5933823A (en) 1996-03-01 1996-03-01 Image database browsing and query using texture analysis

Publications (2)

Publication Number Publication Date
DE19708265A1 true DE19708265A1 (de) 1997-09-04
DE19708265B4 DE19708265B4 (de) 2006-05-11

Family

ID=24441670

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19708265A Expired - Fee Related DE19708265B4 (de) 1996-03-01 1997-02-28 Verfahren zum Durchsuchen einer Dokument-Bilddatenbank und Dokumentbild-Durchstöberungssystem sowie Verfahren zum Extrahieren eines Merkmalsvektors aus einem elektronisch gespeicherten Bild

Country Status (4)

Country Link
US (1) US5933823A (de)
JP (1) JPH09237282A (de)
CN (1) CN1146817C (de)
DE (1) DE19708265B4 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000049526A1 (en) * 1999-02-16 2000-08-24 Hewlett-Packard Company Similarity searching by combination of different data-types
DE19983528B3 (de) * 1998-09-09 2005-02-03 Intel Corporation, Santa Clara Multi-Linearisierungs-Datenstruktur zum Bild-Browsing
EP1752895A1 (de) * 2005-08-09 2007-02-14 Canon Kabushiki Kaisha Bildverarbeitungsvorrichtung zum Wiederauffinden von Bildern und zugehöriges Steuerungsverfahren
WO2011029834A1 (de) * 2009-09-09 2011-03-17 Sureinstinct Gmbh Verfahren zum anzeigen von ein objekt betreffende informationen

Families Citing this family (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963916A (en) * 1990-09-13 1999-10-05 Intouch Group, Inc. Network apparatus and method for preview of music products and compilation of market data
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
AU718608B2 (en) 1996-03-15 2000-04-20 Gizmoz Israel (2002) Ltd. Programmable computer graphic objects
US7437351B2 (en) * 1997-01-10 2008-10-14 Google Inc. Method for searching media
GB2380300B (en) * 1997-09-21 2003-09-10 Microsoft Corp A data filtering system and method
US5995978A (en) * 1997-09-24 1999-11-30 Ricoh Company, Ltd. Navigation system for document image database
US6613100B2 (en) * 1997-11-26 2003-09-02 Intel Corporation Method and apparatus for displaying miniaturized graphical representations of documents for alternative viewing selection
US6260044B1 (en) * 1998-02-04 2001-07-10 Nugenesis Technologies Corporation Information storage and retrieval system for storing and retrieving the visual form of information from an application in a database
US6285995B1 (en) 1998-06-22 2001-09-04 U.S. Philips Corporation Image retrieval system using a query image
US6490579B1 (en) * 1998-07-16 2002-12-03 Perot Systems Corporation Search engine system and method utilizing context of heterogeneous information resources
US6665837B1 (en) * 1998-08-10 2003-12-16 Overture Services, Inc. Method for identifying related pages in a hyperlinked database
US6446099B1 (en) 1998-09-30 2002-09-03 Ricoh Co., Ltd. Document matching using structural information
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
JP2000215317A (ja) * 1998-11-16 2000-08-04 Sony Corp 画像処理方法及び画像処理装置
US6263104B1 (en) * 1998-12-31 2001-07-17 Mcgrew Stephen P. Method and apparatus for reading and verifying holograms
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
JP4173246B2 (ja) * 1999-04-28 2008-10-29 株式会社リコー 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体
US7058817B1 (en) 1999-07-02 2006-06-06 The Chase Manhattan Bank System and method for single sign on process for websites with multiple applications and services
AU6503800A (en) * 1999-07-30 2001-02-19 Pixlogic Llc Perceptual similarity image retrieval
US6563959B1 (en) 1999-07-30 2003-05-13 Pixlogic Llc Perceptual similarity image retrieval method
US6505168B1 (en) 1999-08-16 2003-01-07 First Usa Bank, Na System and method for gathering and standardizing customer purchase information for target marketing
US6859802B1 (en) 1999-09-13 2005-02-22 Microsoft Corporation Image retrieval based on relevance feedback
AU3438401A (en) 1999-11-04 2001-05-14 Jp Morgan Chase Bank System and method for automated financial project management
US10275780B1 (en) 1999-11-24 2019-04-30 Jpmorgan Chase Bank, N.A. Method and apparatus for sending a rebate via electronic mail over the internet
US8571975B1 (en) 1999-11-24 2013-10-29 Jpmorgan Chase Bank, N.A. System and method for sending money via E-mail over the internet
US7082436B1 (en) 2000-01-05 2006-07-25 Nugenesis Technologies Corporation Storing and retrieving the visual form of data
US6867789B1 (en) 2000-02-15 2005-03-15 Bank One, Delaware, National Association System and method for generating graphical user interfaces
US6829615B2 (en) 2000-02-25 2004-12-07 International Business Machines Corporation Object type relationship graphical user interface
US6785421B1 (en) 2000-05-22 2004-08-31 Eastman Kodak Company Analyzing images to determine if one or more sets of materials correspond to the analyzed images
US7426530B1 (en) 2000-06-12 2008-09-16 Jpmorgan Chase Bank, N.A. System and method for providing customers with seamless entry to a remote server
JP2002007413A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd 画像検索装置
US10185936B2 (en) 2000-06-22 2019-01-22 Jpmorgan Chase Bank, N.A. Method and system for processing internet payments
US7831508B1 (en) 2000-06-23 2010-11-09 Jpmorgan Chase Bank, N.A. System and method for implementing a consolidated application process
EP1170674A3 (de) * 2000-07-07 2002-04-17 LION Bioscience AG Verfahren und Gerät um elektronische Daten zu bestellen
US7747866B1 (en) 2000-08-24 2010-06-29 Jpmorgan Chase Bank, N.A. System and method providing improved error detection related to transmission of data over a communication link
US6963666B2 (en) * 2000-09-12 2005-11-08 Pentax Corporation Matching device
US8335855B2 (en) 2001-09-19 2012-12-18 Jpmorgan Chase Bank, N.A. System and method for portal infrastructure tracking
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US8218873B2 (en) * 2000-11-06 2012-07-10 Nant Holdings Ip, Llc Object information derived from object images
US8224078B2 (en) * 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US7016532B2 (en) * 2000-11-06 2006-03-21 Evryx Technologies Image capture and identification system and process
US6978419B1 (en) * 2000-11-15 2005-12-20 Justsystem Corporation Method and apparatus for efficient identification of duplicate and near-duplicate documents and text spans using high-discriminability text fragments
US6958821B1 (en) 2000-11-21 2005-10-25 Eastman Kodak Company Analyzing images to determine third party product materials corresponding to the analyzed images
US8805739B2 (en) 2001-01-30 2014-08-12 Jpmorgan Chase Bank, National Association System and method for electronic bill pay and presentment
KR100375831B1 (ko) * 2001-03-14 2003-03-15 한국전자통신연구원 영상의 질감도를 기반으로 한 영상 db 브라우징 및 소팅방법
US6681060B2 (en) * 2001-03-23 2004-01-20 Intel Corporation Image retrieval using distance measure
US8849716B1 (en) 2001-04-20 2014-09-30 Jpmorgan Chase Bank, N.A. System and method for preventing identity theft or misuse by restricting access
US20020178140A1 (en) * 2001-05-25 2002-11-28 Woodmansee Donald Ernest Method for characterizing and storing data analyses in an analysis database
AU2002312381A1 (en) 2001-06-07 2002-12-16 First Usa Bank, N.A. System and method for rapid updating of credit information
CA2451616A1 (en) 2001-06-25 2003-01-03 Vincent Sethi Electronic vouchers and a system and method for issuing the same
US7899825B2 (en) * 2001-06-27 2011-03-01 SAP America, Inc. Method and apparatus for duplicate detection
US7266839B2 (en) 2001-07-12 2007-09-04 J P Morgan Chase Bank System and method for providing discriminated content to network users
US7103576B2 (en) 2001-09-21 2006-09-05 First Usa Bank, Na System for providing cardless payment
AUPR824301A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw001)
CA2919269A1 (en) 2001-11-01 2003-05-08 Jpmorgan Chase Bank, N.A. System and method for establishing or modifying an account with user selectable terms
US7987501B2 (en) 2001-12-04 2011-07-26 Jpmorgan Chase Bank, N.A. System and method for single session sign-on
AUPS020302A0 (en) 2002-01-31 2002-02-21 Silverbrook Research Pty. Ltd. Methods and systems (npw007)
US7941533B2 (en) 2002-02-19 2011-05-10 Jpmorgan Chase Bank, N.A. System and method for single sign-on session management without central server
US9684676B1 (en) 2002-03-29 2017-06-20 Google Inc. Method for searching media
USRE45952E1 (en) * 2002-03-29 2016-03-29 Google Inc. Method for searching media
US7289685B1 (en) * 2002-04-04 2007-10-30 Ricoh Co., Ltd. Paper based method for collecting digital data
GB2389927A (en) * 2002-06-20 2003-12-24 Peter Foot Method for searching a data source by building an abstract composite image
US7536433B2 (en) * 2002-09-25 2009-05-19 Jpmorgan Chase Bank, N.A. System and method for customizing a portal environment
US7058660B2 (en) 2002-10-02 2006-06-06 Bank One Corporation System and method for network-based project management
US8301493B2 (en) 2002-11-05 2012-10-30 Jpmorgan Chase Bank, N.A. System and method for providing incentives to consumers to share information
US7506244B1 (en) * 2003-02-07 2009-03-17 Cisco Technology, Inc. Model-driven software publishing system and method
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
US20050036692A1 (en) * 2003-05-26 2005-02-17 Takayuki Iida Method and device for determining time-of-photograph of individual image, and image retrieving method and computer program for the method
US8306907B2 (en) 2003-05-30 2012-11-06 Jpmorgan Chase Bank N.A. System and method for offering risk-based interest rates in a credit instrument
US8723964B2 (en) * 2003-09-12 2014-05-13 Sony Corporation Method and device for communication using an optical sensor
JP4607443B2 (ja) * 2003-10-08 2011-01-05 株式会社リコー 文書表示装置および文書表示方法
US8190893B2 (en) 2003-10-27 2012-05-29 Jp Morgan Chase Bank Portable security transaction protocol
US7912291B2 (en) * 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
JP3862694B2 (ja) * 2003-11-20 2006-12-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US20050149258A1 (en) * 2004-01-07 2005-07-07 Ullas Gargi Assisting navigation of digital content using a tangible medium
US7742997B1 (en) 2004-04-23 2010-06-22 Jpmorgan Chase Bank, N.A. System and method for management and delivery of content and rules
JP4510535B2 (ja) * 2004-06-24 2010-07-28 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4152927B2 (ja) * 2004-08-02 2008-09-17 シャープ株式会社 画像処理装置、画像形成装置、処理原稿検索方法、処理原稿検索プログラム、記録媒体
US8825682B2 (en) * 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8965145B2 (en) 2006-07-31 2015-02-24 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8838591B2 (en) * 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8156115B1 (en) 2007-07-11 2012-04-10 Ricoh Co. Ltd. Document-based networking with mixed media reality
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US7812986B2 (en) 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
JP4213112B2 (ja) * 2004-11-09 2009-01-21 シャープ株式会社 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体
US8566705B2 (en) * 2004-12-21 2013-10-22 Ricoh Co., Ltd. Dynamic document icons
US7386545B2 (en) 2005-03-31 2008-06-10 International Business Machines Corporation System and method for disambiguating entities in a web page search
US8185877B1 (en) 2005-06-22 2012-05-22 Jpmorgan Chase Bank, N.A. System and method for testing applications
US8583926B1 (en) 2005-09-19 2013-11-12 Jpmorgan Chase Bank, N.A. System and method for anti-phishing authentication
JP4918776B2 (ja) * 2005-10-24 2012-04-18 富士通株式会社 電子文書比較プログラム、電子文書比較装置および電子文書比較方法
US8683314B2 (en) * 2006-01-13 2014-03-25 Ricoh Co., Ltd. Tree pruning of icon trees via subtree selection using tree functionals
US7672976B2 (en) * 2006-05-03 2010-03-02 Ut-Battelle, Llc Method for the reduction of image content redundancy in large image databases
US7917514B2 (en) * 2006-06-28 2011-03-29 Microsoft Corporation Visual and multi-dimensional search
US8793490B1 (en) 2006-07-14 2014-07-29 Jpmorgan Chase Bank, N.A. Systems and methods for multifactor authentication
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
WO2008034001A1 (en) * 2006-09-15 2008-03-20 Nielsen Media Research, Inc. Methods and apparatus to identify images in print advertisements
US7849037B2 (en) * 2006-10-09 2010-12-07 Brooks Roger K Method for using the fundamental homotopy group in assessing the similarity of sets of data
JP4809198B2 (ja) * 2006-11-29 2011-11-09 株式会社リコー 画像処理機器,記事画像選択方法,プログラム,および記録媒体
JP2008146603A (ja) * 2006-12-13 2008-06-26 Canon Inc 文書検索装置、文書検索方法、プログラム及び記憶媒体
US7849039B2 (en) * 2006-12-29 2010-12-07 Brooks Roger K Method for using one-dimensional dynamics in assessing the similarity of sets of data using kinetic energy
US7849038B2 (en) * 2006-12-31 2010-12-07 Brooks Roger K Method for using the second homotopy group in assessing the similarity of sets of data
JP2008242543A (ja) * 2007-03-26 2008-10-09 Canon Inc 画像検索装置、画像検索装置の画像検索方法、及び画像検索装置の制御プログラム
CN101669119B (zh) * 2007-04-27 2012-08-08 日本电气株式会社 内容处理装置和内容处理方法
US8473735B1 (en) 2007-05-17 2013-06-25 Jpmorgan Chase Systems and methods for managing digital certificates
US20090037440A1 (en) * 2007-07-30 2009-02-05 Stefan Will Streaming Hierarchical Clustering
US8572087B1 (en) * 2007-10-17 2013-10-29 Google Inc. Content identification
US8321682B1 (en) 2008-01-24 2012-11-27 Jpmorgan Chase Bank, N.A. System and method for generating and managing administrator passwords
CN101551859B (zh) * 2008-03-31 2012-01-04 夏普株式会社 图像辨别装置及图像检索装置
US8249343B2 (en) * 2008-10-15 2012-08-21 Xerox Corporation Representing documents with runlength histograms
US9608826B2 (en) 2009-06-29 2017-03-28 Jpmorgan Chase Bank, N.A. System and method for partner key management
JP5665125B2 (ja) * 2011-04-07 2015-02-04 株式会社日立製作所 画像処理方法、及び、画像処理システム
US9792017B1 (en) 2011-07-12 2017-10-17 Domo, Inc. Automatic creation of drill paths
US9202297B1 (en) 2011-07-12 2015-12-01 Domo, Inc. Dynamic expansion of data visualizations
US10001898B1 (en) 2011-07-12 2018-06-19 Domo, Inc. Automated provisioning of relational information for a summary data visualization
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
JP5863400B2 (ja) * 2011-11-07 2016-02-16 株式会社日立国際電気 類似画像検索システム
US9419957B1 (en) 2013-03-15 2016-08-16 Jpmorgan Chase Bank, N.A. Confidence-based authentication
US20140372419A1 (en) * 2013-06-13 2014-12-18 Microsoft Corporation Tile-centric user interface for query-based representative content of search result documents
US10148726B1 (en) 2014-01-24 2018-12-04 Jpmorgan Chase Bank, N.A. Initiating operating system commands based on browser cookies
JP6058042B2 (ja) 2015-01-26 2017-01-11 京セラドキュメントソリューションズ株式会社 画像処理装置
US10467768B2 (en) * 2017-04-07 2019-11-05 Intel Corporation Optical flow estimation using 4-dimensional cost volume processing
JP6934402B2 (ja) * 2017-11-14 2021-09-15 株式会社日立国際電気 編集システム
US10546054B1 (en) * 2018-02-28 2020-01-28 Intuit Inc. System and method for synthetic form image generation
US11393233B2 (en) * 2020-06-02 2022-07-19 Google Llc System for information extraction from form-like documents

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4568983A (en) * 1983-12-07 1986-02-04 The Mead Corporation Image data compression/decompression
JPS60134357A (ja) * 1983-12-21 1985-07-17 Hitachi Ltd 画像フアイル登録・検索方式
US4888690A (en) * 1985-01-11 1989-12-19 Wang Laboratories, Inc. Interactive error handling means in database management
US4885704A (en) * 1987-01-12 1989-12-05 Kabushiki Kaisha Toshiba Electronic document filing apparatus with icon selection
US4939671A (en) * 1987-09-08 1990-07-03 Auto-Trol Technology Corporation Method and system for line drawing with next matrix feature
JPH01144171A (ja) * 1987-11-30 1989-06-06 Toshiba Corp 電子ファイリング装置
JPH01144165A (ja) * 1987-11-30 1989-06-06 Toshiba Corp 電子ファイリング装置
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
US5088052A (en) * 1988-07-15 1992-02-11 Digital Equipment Corporation System for graphically representing and manipulating data stored in databases
US5133052A (en) * 1988-08-04 1992-07-21 Xerox Corporation Interactive graphical search and replace utility for computer-resident synthetic graphic image editors
US5287275A (en) * 1988-08-20 1994-02-15 Fujitsu Limited Image recognition apparatus and method for recognizing a pattern within an image
US5404514A (en) * 1989-12-26 1995-04-04 Kageneck; Karl-Erbo G. Method of indexing and retrieval of electronically-stored documents
US5142619A (en) * 1990-02-21 1992-08-25 International Business Machines Corporation Method and apparatus for visually comparing files in a data processing system
US5351138A (en) * 1990-04-24 1994-09-27 Ricoh Company, Ltd. Image area discriminating device
JP2876258B2 (ja) * 1991-01-23 1999-03-31 株式会社リコー デジタル電子スチルカメラ
JPH0512345A (ja) * 1991-06-28 1993-01-22 Toshiba Corp 画像記憶装置
US5189709A (en) * 1991-08-26 1993-02-23 The United States Of America As Represented By The United States National Aeronautics And Space Administration Dynamic pattern matcher using incomplete data
JPH0562011A (ja) * 1991-09-03 1993-03-12 Konica Corp 画像処理装置
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5412807A (en) * 1992-08-20 1995-05-02 Microsoft Corporation System and method for text searching using an n-ary search tree
US5423033A (en) * 1992-09-30 1995-06-06 Intuit, Inc. Report generation system and method
JP3234064B2 (ja) * 1993-09-02 2001-12-04 キヤノン株式会社 画像検索方法並びにその装置
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19983528B3 (de) * 1998-09-09 2005-02-03 Intel Corporation, Santa Clara Multi-Linearisierungs-Datenstruktur zum Bild-Browsing
US7016553B2 (en) 1998-09-09 2006-03-21 Intel Corporation Linearized data structure ordering images based on their attributes
WO2000049526A1 (en) * 1999-02-16 2000-08-24 Hewlett-Packard Company Similarity searching by combination of different data-types
EP1752895A1 (de) * 2005-08-09 2007-02-14 Canon Kabushiki Kaisha Bildverarbeitungsvorrichtung zum Wiederauffinden von Bildern und zugehöriges Steuerungsverfahren
US7746507B2 (en) 2005-08-09 2010-06-29 Canon Kabushiki Kaisha Image processing apparatus for image retrieval and control method therefor
WO2011029834A1 (de) * 2009-09-09 2011-03-17 Sureinstinct Gmbh Verfahren zum anzeigen von ein objekt betreffende informationen

Also Published As

Publication number Publication date
US5933823A (en) 1999-08-03
JPH09237282A (ja) 1997-09-09
DE19708265B4 (de) 2006-05-11
CN1146817C (zh) 2004-04-21
CN1170168A (zh) 1998-01-14

Similar Documents

Publication Publication Date Title
DE19708265A1 (de) Blättern in einer Bilddatenbank und Abfrage der Bilddaten, indem eine Strukturanalyse verwendet wird
DE69731418T2 (de) Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen
DE10308014B4 (de) System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt
US6563959B1 (en) Perceptual similarity image retrieval method
Kovalev et al. Color co-occurrence descriptors for querying-by-example
Story et al. The RightPages image-based electronic library for alerting and browsing
DE69631457T2 (de) Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung
DE69434620T2 (de) Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten
DE69724755T2 (de) Auffinden von Titeln und Photos in abgetasteten Dokumentbildern
DE69434434T2 (de) Verfahren und gerät um text- und bilddaten zu synchronisieren, anzeigen und manipulieren
DE60116442T2 (de) System zur Zuordnung von Schlüsselwörtern zu Dokumenten
DE60129652T2 (de) Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung
JP2816241B2 (ja) 画像情報検索装置
DE3901485C2 (de) Verfahren und Vorrichtung zur Durchführung des Verfahrens zur Wiedergewinnung von Dokumenten
DE19751570A1 (de) Dokumentmanagementsystem, Verfahren zum Betreiben eines solchen Systems und Digitalkopierer
DE19843445A1 (de) Navigationssystem für eine Dokumentbilder-Datenbank
US7545980B2 (en) Method of and apparatus for classifying an image
DE19983528B3 (de) Multi-Linearisierungs-Datenstruktur zum Bild-Browsing
CN102576372A (zh) 基于内容的图像搜索
DE19705757A1 (de) Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems
DE69732213T2 (de) Informationseingabeverfahren, -platte und -gerät
DE69816200T2 (de) Bildverarbeitungsgerät zur Anzeige eines Katalogs von verschiedenen Datenarten auf verschiedene Weise
DE19817583B4 (de) Verfahren und System zur Datenverarbeitung für dreidimensionale Objekte
DE60008201T2 (de) Übersetzung von Daten mit elektronischen Bildern
Li An implementation of ocr system based on skeleton matching

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20140902