-
Hintergrund der Erfindung
-
Die
vorliegende Erfindung ist bei einer elektronischen Einrichtung,
wie einer OCR-Einrichtung (optische Zeichenleseeinrichtung), einem
Kopierer, einem Faksimilegerät
oder einem Prozessor zum Implementieren einer elektronischen Datenbank
anwendbar, und bezieht sich insbesondere auf eine Bildverarbeitungsvorrichtung
und ein Verfahren zum Extrahieren eines bestimmten gewünschten
Bereichs aus einem Dokumentbild.
-
Zwei
Verfahren zum Extrahieren eines gewünschten Bereichs aus einem
Dokumentbild sind verfügbar.
Das erste Verfahren arbeitet derart, dass immer dann, wenn der Bediener
einen gewünschten Bereich
extrahieren möchte,
der Bediener diesen Bereich in einem eingegebenen Bild jedes Mal
bestimmt. Dieses Verfahren umfasst ein Lesen des Dokumentbildes
unter Verwendung einer Abtasteinrichtung, Anzeigen des abgetasteten
Bildes auf einem Anzeigemonitor und eine Bestimmung des gewünschten
Bereichs unter Verwendung einer Maus oder dergleichen durch den
Bediener.
-
Das
zweite Verfahren umfasst ein Erzeugen einer Vorlage, für die Größe und Positions-Informationen,
die rechteckige Bereiche darstellen, zuvor entschieden wurden, Anwenden
der durch die Vorlage entschiedenen rechteckigen Bereiche direkt
bei einem eingegebenen Bild und darauffolgendes Extrahieren dieser
Bereiche aus dem eingegebenen Bild. In diesem Fall werden rechteckige
Bereiche, deren Positionen und Größen durch die Vorlage entschieden
wurden, aus einem abgetasteten Dokumentbild extrahiert, und der
Bediener muss nicht länger
die mühsame
Aufgabe durchführen,
Extraktionsbereiche einen nach dem anderen zu bestimmen.
-
Das
erste Verfahren ist dahingehend von Nachteil, dass der Bediener
den gewünschten
Bereich jedes Mal bestimmen muss. Dieses Verfahren ist daher für die Verarbeitung
einer großen
Anzahl an Dokumenten nicht geeignet. Das zweite Verfahren, das die
Vorlage verwendet, ist dahingehend von Nachteil, dass dann, wenn
eine Ungleichheit in Position oder Größe zwischen einem auf dem eingegebenen
Bild zu extrahierenden Bereich und dem durch die Vorlage entschiedenen
rechteckigen Bereich besteht, der zu extrahierende Bereich beim
Extraktionsvorgang eventuell weggelassen wird.
-
Die
EP-A-0442054 beschreibt
eine Bildverarbeitungsvorrichtung, die eine Vielzahl von Dokumentvorlagen
und eine Tabelle speichert, die für eine Vorlagenauswahl beruhend
auf einer Erkennung eines kennzeichnenden Indiz verwendet wird,
das mit einem zu verarbeitenden Dokument verbunden ist.
-
Die
Erfindung wurde in Anbetracht der vorstehenden Probleme entworfen,
und eine Aufgabe besteht in der Bereitstellung einer Bildverarbeitungsvorrichtung
und eines Verfahrens, wodurch eine Extraktion eines gewünschten
Bereichs aus einem Dokumentbild auf zuverlässige Art und Weise möglich ist.
-
Eine
weitere Aufgabe der Erfindung besteht in der Ermöglichung einer schnellen und
zuverlässigen
Extraktion eines gewünschten
Bereichs aus einer großen
Anzahl von Dokumentbildern.
-
Eine
weitere Aufgabe der Erfindung besteht in der Ausgestaltung einer
Bildverarbeitungsvorrichtung und eines Verfahrens, wodurch eine
zuverlässige
Extraktion eines gewünschten
Bereichs aus einem eingegebenen Dokumentbild unter Verwendung einer
Vorlage ermöglicht
wird.
-
Ausgestaltungen
der Erfindung sind in den beigefügten
unabhängigen
Patentansprüchen
dargelegt.
-
Weitere
Merkmale und Vorteile der Erfindung werden aus der folgenden Beschreibung
in Verbindung mit den beiliegenden Zeichnungen ersichtlich, in denen
gleiche Bezugszeichen gleiche oder ähnliche Abschnitte in den Figuren
bezeichnen.
-
Kurzbeschreibung der Zeichnungen
-
Die
beiliegenden Zeichnungen, die in die Beschreibung aufgenommen sind
und einen Teil davon bilden, veranschaulichen Ausführungsbeispiele
der Erfindung, und dienen zusammen mit der Beschreibung zur Erläuterung
der Prinzipien der Erfindung.
-
1 zeigt
ein Blockschaltbild des Aufbaus einer Bildverarbeitungsvorrichtung
gemäß einem ersten
Ausführungsbeispiel
der Erfindung,
-
2 zeigt
ein Ablaufdiagramm zur Beschreibung des Ablaufs einer Vorlagenspeicherverarbeitung
gemäß dem ersten
Ausführungsbeispiel,
-
3 zeigt
ein Ablaufdiagramm zur Beschreibung des Ablaufs einer Bereichsextraktionsverarbeitung
gemäß dem ersten
Ausführungsbeispiel,
-
4 zeigt
eine Darstellung eines Beispiels eines eingelesenen Dokuments (Dokument
A) zur Erzeugung von Vorlagendaten,
-
5 zeigt
eine Darstellung eines Beispiels der Anzeige auf einem Bildschirm
zum Einstellen von Bereichen in der Vorlagenspeicherverarbeitung
gemäß dem ersten
Ausführungsbeispiel,
-
die 6A, 6B zeigen
Darstellungen zur Beschreibung der Datenstruktur von Vorlagendaten,
die durch Bestimmen von Bereichen und Einstellen von Attributen
erzeugt werden,
-
7 zeigt
eine Darstellung zur Beschreibung des Registrierzustands von Vorlagendaten,
-
8 zeigt
eine Darstellung der Art und Weise, wie eine „Dokument A-Vorlage" in den Vorlagendaten
registriert ist,
-
9 zeigt
eine Darstellung eines Dokuments B, das ein Beispiel eines zu verarbeitenden Dokuments
darstellt,
-
10 zeigt
eine Darstellung eines Beispiels von Ergebnissen, die durch Ausführen einer Bereichspartitionierverarbeitung
hinsichtlich des Dokuments B in 9 erhalten
werden,
-
11 zeigt
eine Darstellung zur Beschreibung der Art und Weise, wie eine Vorlage
und die Blöcke
eines Dokuments verglichen werden,
-
12 zeigt
ein Ablaufdiagramm des Ablaufs einer Vorlagenspeicherverarbeitung
gemäß einem
zweiten Ausführungsbeispiel
der Erfindung,
-
13 zeigt
eine Darstellung eines Beispiels von Ergebnissen einer Bereichspartitionierverarbeitung
in diesem Fall,
-
14 zeigt
ein Ablaufdiagramm des Ablaufs einer Vorlagenspeicherverarbeitung
gemäß einem
dritten Ausführungsbeispiel
der Erfindung,
-
15 zeigt
eine Darstellung eines Zustands, in dem ein Block 3 und ein Block
5 in der Vorlagenspeicherverarbeitung gemäß dem dritten Ausführungsbeispiel
ausgewählt
wurden,
-
16 zeigt
eine Darstellung der Datenstruktur der Dokument A-Vorlage bei dem
dritten Ausführungsbeispiel,
-
17 zeigt
eine Darstellung zur Beschreibung von Ergebnissen des Vergleichs
von Blöcken
in einem Fall, wenn ein gewünschter
Bereich aus dem Dokument B unter Verwendung der Dokument A-Vorlage
von 16 extrahiert wird,
-
18 zeigt
ein Ablaufdiagramm des Ablaufs einer Vorlagenspeicherverarbeitung
gemäß einem
vierten Ausführungsbeispiel
der Erfindung, und
-
19 zeigt
ein Ablaufdiagramm zur Beschreibung des Ablaufs einer Bereichsextraktionsverarbeitung
gemäß einem
fünften
Ausführungsbeispiel
der Erfindung.
-
Beschreibung der bevorzugten
Ausführungsbeispiele
-
Nachstehend
werden bevorzugte Ausführungsbeispiele
der Erfindung ausführlich
in Verbindung mit den beiliegenden Zeichnungen beschrieben.
-
[Erstes Ausführungsbeispiel]
-
1 zeigt
ein Blockschaltbild des Aufbaus einer Bildverarbeitungsvorrichtung
gemäß einem ersten
Ausführungsbeispiel
der Erfindung. Die Vorrichtung umfasst eine Abtasteinrichtung 101 zum
Bestrahlen eines Dokuments mit einem Bild, Lesen des reflektierten
Lichts und Wandeln des reflektierten Lichts in ein elektrisches
Signal, eine Abtasteinrichtungsschnittstelle 102 zum Wandeln
des durch die Abtasteinrichtung 101 erhaltenen elektrischen
Signals in ein binäres
digitales Signal und Senden dieses Signals zu anderen Komponenten,
eine Zeigeeinrichtung 103 (da bei diesem Ausführungsbeispiel eine
Maus verwendet wird, wird diese Einrichtung nachstehend als Maus
bezeichnet) zum Eingeben gewünschter
Koordinaten im Fenster einer Anzeige, eine Schnittstellenschaltung 104 zum
Empfangen eines Signals von der Maus 103 und Senden des
Signals zu anderen Komponenten, eine CPU 105 zum Ausführen der
gesamten Steuerung der Vorrichtung und Verarbeitung, wie eine Bereichspartitionierung, ein
ROM 106, das Programme, die durch die CPU 105 ausgeführt werden,
für verschiedene
Steueroperationen und verschiedene Verarbeitungen, sowie Fontdaten
speichert, ein RAM 107, das als Arbeitsbereich zum Expandieren
eines Dokumentbildes und für
eine Bereichspartitionierverarbeitung verwendet wird, eine Anzeigeeinrichtung 108 zum
Anzeigen eingegebener Bilder und dergleichen, wobei ein angezeigtes
Bild in einem VRAM-Bereich
gespeichert wird, der durch einen vorgeschriebenen Adressbereich
im RAM 107 erzeugt wird, eine externe Speichereinrichtung 110 wie
eine Festplatte, in der Daten und dergleichen gespeichert sind,
und eine Schnittstelle 111 für die externe Speichereinrichtung 110. Diese
Komponenten sind durch einen Bus 112 miteinander verbunden.
-
Der
Verarbeitungsablauf gemäß dem ersten Ausführungsbeispiel
wird nachstehend in Verbindung mit dem Ablaufdiagrammen der 2 und 3 beschrieben. 2 zeigt
ein Ablaufdiagramm zur Beschreibung des Ablaufs einer Verarbeitung
zur Sicherung beziehungsweise Speicherung einer Vorlage gemäß dem ersten
Ausführungsbeispiel,
und 3 zeigt ein Ablaufdiagramm zur Beschreibung des
Ablaufs einer Verarbeitung zum Extrahieren eines Bereichs gemäß dem ersten
Ausführungsbeispiel.
-
Zuerst
wird die Verarbeitung zur Speicherung einer Vorlage, die bei der
Bereichsextraktion verwendet wird, unter Bezugnahme auf 2 beschrieben.
Ein Dokument A der in 4 gezeigten Art mit einem Format,
das gespeichert werden soll, wird gelesen und in Schritt S201 durch
eine Abtasteinrichtung 101 in binäre Bilddaten gewandelt. Dann werden
in Schritt S201 kleine Bereiche (die nachstehend einfach als „Bereiche" oder „Blöcke" bezeichnet werden)
mit Attributen wie „Text", „Tabelle" und „Figur" auf dem erhaltenen
eingegebenen Bild eingestellt.
-
Gemäß diesem
Ausführungsbeispiel
wird das Dokument A in 4 durch die Abtasteinrichtung gelesen,
und das gelesene Bild wird auf der Anzeigeeinrichtung 108 angezeigt. 5 zeigt
eine Darstellung der Anzeige eines Bildschirms zum Einstellen von
Bereichen bei der Vorlagenspeicherverarbeitung gemäß dem ersten
Ausführungsbeispiel.
Ein Attributmenü 51 wird
zusammen mit dem Bild des Dokuments A auf der Anzeigeeinrichtung 108 angezeigt. Der
Bediener verwendet die Maus 103 zum Auswählen eines
gewünschten
Attributs aus dem Attributmenü 51 und
zur Bestimmung von Rahmen, die rechteckige Bereiche angeben. Durch
die so verursachte Anzeige der Rahmen ausgewählter Attribute an gewünschten
Positionen, werden Attribute hinsichtlich jedes rechteckigen Bereichs
eingestellt. Wird ein gewünschtes
Attribut aus dem Attributmenü 51 ausgewählt, wird
die Farbe des Rands des durch Bedienen der Maus 103 angezeigten
rechteckigen Rahmens auf eine Farbe eingestellt, die mit dem ausgewählten Attribut
verbunden ist. In 5 ist die Randfarbe eines rechteckigen
Rahmens 501 schwarz, was angibt, dass das Attribut dieses
Bereichs „Text" ist. Die Randfarbe
eines rechteckigen Rahmens 502 ist rot, was angibt, dass
das Attribut dieses Bereichs „Tabelle" ist. Die Randfarbe
eines rechteckigen Rahmens 504 ist gelb, was angibt, dass
das Attribut dieses Bereichs „Figur" ist.
-
Die 6A und 6B zeigen
Darstellungen zur Beschreibung der Datenstruktur von Vorlagendaten,
die durch ein Bestimmen von Bereichen und Einstellen von Attributen
erzeugt werden. Bereichsdaten sind bereichsweise (blockweise) auf
die in 6A gezeigte Art und Weise gespeichert.
Die Bereichsdaten werden durch Registrieren von Startpunktkoordinaten
X, Y, einer Breite und einer Höhe des
Bereichs (das heißt,
Positionsinformationen, die den rechteckigen Rahmen angeben, der
durch Bedienen der Maus angezeigt wird) erhalten, und enthalten
ein „Attribut-Feld", in dem eine Identifizierungsnummer,
die dem für
den vorstehend angeführten
rechteckigen Rahmen eingestellten Attribut entspricht, eingestellt
ist. Jedes Attribut und seine Identifizierungsnummer sind in 6B gezeigt.
Die X-Y-Koordinaten des Startpunkts stellen die obere linke Ecke
des bestimmten Bereichs dar.
-
Als
nächstes
wird in Schritt S203 die Zusammensetzung von Bereichsdaten jedes
Blocks, der auf die vorstehend beschriebene Art und Weise eingestellt
ist, registriert und als Vorlage gespeichert. Beispielsweise zeigt 7 ein
Beispiel, in dem eine Vorlage erneut unter dem Titel „Dokument
A-Vorlage" als vierte
einer Gruppe bereits vorhandener Vorlagen registriert wird.
-
8 zeigt
eine Darstellung der Art uns Weise, wie eine „Dokument A-Vorlage" in den Vorlagendaten
registriert ist. Da die durch die rechteckigen Rahmen 501 bis 505 angegebenen
Bereiche im Bild des Dokuments A auf die in 5 gezeigte
Art und Weise eingestellt wurden, sind fünf Blöcke in der Dokument A-Vorlage
registriert. Welcher rechteckige Rahmen welchem Block der Blöcke 1 bis
5 entspricht, kann beispielsweise entsprechend der Reihenfolge entschieden
werden, in der die rechteckigen Rahmen in Schritt S202 bestimmt
wurden.
-
Nachstehend
wird die Verarbeitung zur Extraktion gewünschter Bereiche aus einem
neu gelesenen Bild unter Verwendung einer auf die vorstehend beschriebene
Art und Weise registrierten Vorlage unter Bezugnahme auf das Ablaufdiagramm
in 3 beschrieben.
-
Zuerst
wird eine zur Extraktion gewünschter Bereiche
erforderliche Vorlage in Schritt S301 ausgewählt. Bei diesem Ausführungsbeispiel
werden die Vorlagennamen der registrierten Vorlagen wie in 7 gezeigt
auf der Anzeigeeinrichtung 108 angezeigt, und dem Bediener
wird die Auswahl der gewünschten
Vorlage unter Verwendung der Maus 103 ermöglicht.
Dann wird ein Dokument in Schritt S302 zur Verarbeitung durch die
Abtasteinrichtung 101 gelesen und in binäre Bilddaten
gewandelt, so dass die nachstehend beschriebene Bereichspartitionierverarbeitung
ausgeführt
werden kann. Dieses Beispiel wird unter der Annahme beschrieben,
dass die wie in 5 gezeigt eingestellte „Dokument
A-Vorlage" ausgewählt wurde,
und dass ein in 9 gezeigtes Dokument B als zu
verarbeitendes Dokument gelesen wird.
-
Diesem
folgt Schritt S303, in dem das erhaltene eingegebene Bild einer
dem Fachmann bekannten Bereichspartitionierverarbeitung unterzogen
wird, Blöcke
extrahiert werden und das Attribut jedes Blocks bewertet wird. 10 zeigt
eine Darstellung eines Beispiels von Ergebnissen, die durch Ausführen der
Bereichspartitionierverarbeitung hinsichtlich des Dokuments B erhalten
werden. Jeder Block der Blöcke
A bis E wird als extrahierte Bereichsinformationen gespeichert,
wobei die Datenstruktur der gespeicherten Blöcke die gleiche wie die der
in den 6A, 6B gezeigten
Bereichsinformationen ist. Das heißt, die Position, Größe und das
Attribut jedes extrahierten Blocks darstellenden Informationen sind
gespeichert.
-
Als
nächstes
werden in Schritt S304 Bereichsdaten von Blöcken, die aus dem Dokument
B extrahiert wurden, mit den Bereichsdaten von Blöcken verglichen,
die in einer ausgewählten
Vorlage gespeichert wurden (der Dokument A-Vorlage). Diesem folgt in Schritt S305
eine Extraktion eines Blocks, dessen Bereich zumindest teilweise
den Bereich eines Blocks in der Vorlage überlappt und dasselbe Attribut
wie der Bereich hat, den er überlappt. Wird
ein derartiger Block in Schritt S305 extrahiert, wird von diesem
Block angenommen, dass er ein mit dem gewünschten Block identischer Block
ist, und das in dem Bereich dieses Blocks enthaltene Bild wird in
Schritt S306 ausgegeben.
-
11 zeigt
eine Darstellung zur Beschreibung der Art und Weise, wie eine Vorlage
und die Blöcke
eines Dokuments verglichen werden. Blöcke, die als Dokument A-Vorlage
aufgezeichnet wurden, sind durch gestrichelte Linien in 11 angegeben, und
Blöcke,
die aus dem Bild des Dokuments B extrahiert wurden, sind mit durchbrochenen
Linien angegeben. Obwohl Blöcke
A und B, die aus dem Dokument B extrahiert wurden, etwas aus den
Blockpositionen der Dokument A-Vorlage verschoben sind, weisen die
Blöcke
A und B Abschnitte auf, die die Blockpositionen der Vorlage überlappen.
Das Attribut von beiden dieser Bereiche ist „Text". Die Blöcke A und B werden deshalb
in Schritt S305 extrahiert. Das Endergebnis ist, dass die Bereichdaten
aller in 10 erhaltenen Blöcke A bis
E des Dokuments B ausgegeben werden.
-
Somit
kann gemäß dem ersten
Ausführungsbeispiel
wie vorstehend beschrieben selbst dann, wenn die Position und Größe eines
in einer Vorlage eingestellten Bereichs sich etwas von der Position und
Größe eines
aus einem Dokumentbild zu extrahierenden Bereichs, das tatsächlich gelesen
wurde, etwas unterscheiden, ein gewünschter Bereich aus dem Dokumentbild
zuverlässig
extrahiert werden.
-
Im
vorstehend beschriebenen Schritt S305 überlappt ein extrahierter Block
zumindest teilweise einen in der Vorlage eingestellten Bereich und
hat das gleiche Attribut wie dieser Bereich. Allerdings kann unter
Berücksichtigung
des Grads der Überlappung
zwischen den zwei Blöcken
entschieden werden, ob ein Block zu extrahieren ist oder nicht.
Es kann beispielsweise eine Anordnung geben, bei der ein auszuwählender
Block einen Block in der Vorlage mit 70% oder darüber überlappen
muss, und das gleiche Attribut haben muss. Des Weiteren kann eine Anordnung
angewendet werden, bei der dieses Verhältnis für jeden Block der Vorlage eingestellt
werden kann.
-
[Zweites Ausführungsbeispiel]
-
Bei
dem vorstehend beschriebenen ersten Ausführungsbeispiel wird die Einstellung
von in einer Vorlage gespeicherten Bereichen manuell unter Verwendung
der Maus 103 durchgeführt.
Allerdings kann eine Bereichseinstellverarbeitung zum Speichern
einer Vorlage unter Verwendung einer Bereichspartitionierverarbeitung
der in Schritt S303 ausgeführten
Art automatisiert werden.
-
Der
Ablauf einer derartigen Verarbeitung wird nachstehend unter Bezugnahme
auf das Ablaufdiagramm in 12 beschrieben. 12 zeigt
ein Ablaufdiagramm des Ablaufs einer Vorlagenspeicherverarbeitung
gemäß dem zweiten
Ausführungsbeispiel
der Erfindung.
-
Das
Dokument A (siehe 4) mit dem Format, das gespeichert
werden soll, wird in Schritt S1204 durch die Abtasteinrichtung eingelesen
und in binäre
Bilddaten gewandelt, die für
eine nachstehend beschriebene Bereichspartitionierverarbeitung dienen.
Das erhaltene eingegebene Bild wird dann einer Bereichspartitionierverarbeitung
in Schritt S1202 zum Extrahieren verschiedener Bereiche (Blöcke), wie
einem Textbereich, Figurbereich, Tabellenbereich und Titelbereich
unterzogen. Die in Schritt S1202 angewendete Bereichspartitionierverarbeitung
kann ein dem Fachmann bekanntes Verfahren anwenden. Das Ergebnis
dieser Bereichspartitionierverarbeitung ist in 13 gezeigt.
Jeder Block wird so extrahiert, und Identifizierungsnummern, die
den verschiednen Attributen entsprechen, sowie die Positionsinformationen
werden als Bereichspartitionierdaten blockweise erhalten. Die Struktur
der Bereichsdaten hinsichtlich dieses Dokuments kann in diesem Fall
die gleiche wie die in 6 gezeigte
sein. Die Bereichsdaten jedes extrahierten Blocks werden dann registriert
und als „Dokument
A-Vorlage" auf die in 8 gezeigte
Art und Weise gespeichert.
-
Die
Verarbeitung zum Extrahieren von Bereichen aus dem Bild eines eingegebenen
Dokuments unter Verwendung der wie vorstehend beschrieben registrierten
Vorlage entspricht der in Verbindung mit dem Ablaufdiagramm in 3 beschriebenen.
-
Somit
muss bei der vorstehend beschriebenen Anordnung ein Dokument, damit
es als Vorlage dient, nur durch die Abtasteinrichtung 101 zur
automatischen Erzeugung der Vorlage gelesen werden. Dies steigert
die Funktionsfähigkeit.
-
[Drittes Ausführungsbeispiel]
-
Beim
zweiten Ausführungsbeispiel
werden alle durch die Bereichspartitionierverarbeitung extrahierten
Bereiche in der Vorlagenspeicherverarbeitung als Vorlage gespeichert.
Allerdings kann es eine Anordnung geben, bei der lediglich ein gewünschter Bereich
unter den extrahierten Bereichen ausgewählt und als Vorlage gespeichert
wird. Beim dritten Ausführungsbeispiel
werden bestimmte Blöcke
unter in der Bereichspartitionierverarbeitung extrahierten Blöcken durch
die Maus 3 bestimmt, und lediglich die Bereichspartitionierdaten
dieser Blöcke
werden als Vorlage gespeichert.
-
14 zeigt
ein Ablaufdiagramm des Ablaufs einer Verarbeitung zur Speicherung
einer Vorlage gemäß dem dritten
Ausführungsbeispiel.
Der Ablauf der Verarbeitung des vierten Ausführungsbeispiels wird nachstehend
unter Bezugnahme auf das Ablaufdiagramm in 14 beschrieben.
-
Das
Dokument A (siehe 4) mit dem Format, das gespeichert
werden soll, wird in Schritt S1401 durch die Abtasteinrichtung 101 eingelesen und
in binäre
Bilddaten gewandelt. Das erhaltene eingegebene Bild wird dann in
Schritt S402 einer Bereichspartitionierverarbeitung unterzogen,
um verschiedene Bereiche (Blöcke)
wie einen Textbereich, Figurbereich, Tabellenbereich und Titelbereich
zu extrahieren. Das Ergebnis dieser Extraktion ist das in Verbindung
mit dem zweiten Ausführungsbeispiel (13)
zuvor beschriebene. Beispielsweise kann die in Schritt S303 in 3 angegebene
Bereichspartitionierverarbeitung in Schritt S1402 als Bereichspartitionierverarbeitung
verwendet werden.
-
Diesem
folgt S1403, in dem bestimmte Blöcke
aus den extrahierten Blöcken
unter Verwendung der Maus 103 ausgewählt werden. 15 zeigt
eine Darstellung eines Zustands, in dem ein Block 3 und ein Block
5 ausgewählt
wurden. Im Fall des in 15 gezeigten Beispiels sind
die ausgewählten
Blöcke schraffiert
gezeigt, um sie von anderen Blöcken
zu unterscheiden.
-
Als
nächstes
werden in Schritt S1404 lediglich die Bereichspartitionierdaten
(Attribute und Positionsinformationen, usw.) der in Schritt S1403
ausgewählten
Blöcke
als Vorlage gespeichert. In diesem Beispiel werden lediglich die
Bereichspartitionierdaten der Blöcke
3 und 5 als die Dokument A-Vorlage auf die in 16 gezeigte
Art und Weise gespeichert.
-
Nachstehend
wird ein Fall beschrieben, in dem das in 9 gezeigte
Dokument B unter Verwendung der auf die vorstehend beschriebene
Art und Weise gespeicherten Dokument A-Vorlage verarbeitet wird. 17 zeigt
eine Darstellung zur Beschreibung von Ergebnissen des Vergleichs
der Vorlage und jedes Blocks eines Dokuments in einem Fall, in dem
gewünschte
Bereiche aus dem Dokument B unter Verwendung der Vorlage extrahiert
werden, die allein aus den in 15 ausgewählten Blöcken zusammen
gesetzt ist. Wird die Bereichsextraktionsverarbeitung von 3 bei
diesem Beispiel ausgeführt,
werden lediglich die Bereichspartitionierdaten der Blöcke C und
E ausgegeben. Die Blöcke
C und E unter den Blöcken
(die durch durchbrochene Linien angegeben sind) des Dokuments B
werden als Bereiche beurteilt, die zumindest teilweise die Blöcke (die
durch gestrichelte Linien angegeben sind) überlappen, die in der Vorlage
aufgezeichnet sind, und die die gleichen Attribute wie die Vorlagenblöcke haben.
-
Somit
können
bei dem dritten Ausführungsbeispiel
wie vorstehen beschrieben gewünschte
Bereiche aus automatisch extrahierten Bereichsdaten ausgewählt und
die ausgewählten
Bereiche als Vorlage gespeichert werden.
-
[Viertes Ausführungsbeispiel]
-
Beim
dritten Ausführungsbeispiel
werden als Vorlagen zu speichernde Bereiche durch den Bediener bestimmt.
Allerdings ist ersichtlich, dass Bereiche, die nicht als Vorlage
zu speichern sind, durch den Bediener bestimmt werden können. Beim
vierten Ausführungsbeispiel
wird ein gewünschter
Bereich unter Blöcken,
die durch die Bereichspartitionierverarbeitung extrahiert wurden,
durch eine Maus oder dergleichen bestimmt, und Bereichsdaten von
Blöcken,
die vom bestimmten Block verschieden sind, werden als Vorlage gespeichert.
-
18 zeigt
ein Ablaufdiagramm zur Beschreibung des Ablaufs einer Verarbeitung
zur Speicherung einer Vorlage gemäß dem vierten Ausführungsbeispiel.
Das Dokument A (siehe 4) mit dem Format, das gespeichert
werden soll, wird in Schritt S1801 durch die Abtasteinrichtung 101 eingelesen
und in binäre
Bilddaten gewandelt. Das erhaltene eingegebene Bild wird dann in
Schritt S1802 der Bereichspartitionierverarbeitung zum Extrahieren verschiedener
Bereiche (Blöcke)
wie eines Textbereichs, Figurbereichs, Tabellenbereichs und Titelbereichs
unterzogen. Dieser Extraktionsvorgang liefert Ergebnisse, die bereits
vorstehend in Verbindung mit dem zweiten Ausführungsbeispiel beschrieben
wurden (13).
-
Als
nächstes
werden in Schritt S1803 gewünschte
Blöcke
aus den extrahierten Blöcken
unter Verwendung der Maus 103 ausgewählt. Beispielsweise sind in
der vorstehend beschriebenen 15 die
Blöcke
3 und 5 derart dargestellt, als ob sie sich im ausgewählten Zustand
befinden würden.
Wie in 15 gezeigt, sind die ausgewählten Blöcke durch Schraffierung
angegeben, um sie von anderen Blöcken
zu unterscheiden. Während
diese ausgewählten
Blöcke
beim dritten Ausführungsbeispiel
als Vorlage registriert wurden, werden die Bereichsdaten dieser
ausgewählten
Blöcke
bei dem vierten Ausführungsbeispiel
gelöscht.
Obwohl das innere eines rechteckigen Bereichs eines ausgewählten und
gelöschten
Blocks in der vorstehenden Beschreibung schraffiert ist, ist das
Verfahren zur Darstellung eines ausgewählten Bereichs nicht auf dieses
Hilfsmittel beschränkt.
Beispielsweise kann eine Anordnung angewendet werden, bei der der
Rahmenrand, der das Rechteck des Blocks angibt, zusammen mit dem
Löschen
der Bereichsdaten gelöscht
wird.
-
Dann
werden in Schritt S1804 lediglich die Bereichspartitionierdaten
(Attribute und Positionsinformationen, usw.) der in Schritt S1803
ausgewählten
Blöcke
als Vorlage gespeichert. Bei diesem Beispiel werden lediglich die
Bereichspartitionierdaten der Blöcke
1, 2 und 4 als Dokument A-Vorlage als Ergebnis der in 15 gezeigten
Auswahl gespeichert.
-
Die
Extraktion von Bereichen aus einem eingegebenen Dokumentbild unter
Verwendung einer so erhaltenen Vorlage wurde bereits unter Bezugnahme
auf das Ablaufdiagramm in 3 im ersten Ausführungsbeispiel
beschrieben.
-
[Fünftes
Ausführungsbeispiel]
-
Bei
jedem der vorstehend beschriebenen Ausführungsbeispiele werden zu verarbeitende
Dokumente in der Abtasteinrichtung 101 platziert und eines
nach dem anderen gelesen. Allerdings ist auch eine automatische
Extraktion anhand der Vorlage durch die Abtasteinrichtung 101 unter
Verwendung einer ADF (Automatischen Dokumentzuführeinrichtung) möglich, wenn
eine große
Anzahl von Dokumenten eingegeben wurde. 19 zeigt
ein Ablaufdiagramm zur Beschreibung des Ablaufs einer Bereichsextraktionsverarbeitung
gemäß einem
fünften Ausführungsbeispiel
der Erfindung. Nachstehend wird der Ablauf der Verarbeitung unter
Bezugnahme auf das in 19 gezeigte Ablaufdiagramm beschrieben.
Die Verarbeitung in den Schritten S1901, S1903 bis S1907 ist die
Gleiche wie die in den Schritten S301 bis S306 im ersten Ausführungsbeispiel.
-
Das
Verfahren der Vorlagenregistrierung kann das Verfahren gemäß einem
beliebigen Ausführungsbeispiel
der vorstehend beschriebenen Ausführungsbeispiel 1 bis 4 anwenden.
-
Eine
zur Extraktion gewünschter
Bereiche zu verwendende gewünschte
Vorlage wird in Schritt S1901 ausgewählt. Dann wird in Schritt S1902
bestimmt, ob ein Dokument einzugeben ist, das heißt, ob ein
Dokument in der ADF liegt. Ist die Entscheidung „JA", geht die Steuerung zu Schritt S1903 über, wo
das Dokument durch die Abtasteinrichtung gelesen und in binäre Bilddaten
durch die Abtasteinrichtung 101 gewandelt wird. Ist die
Entscheidung in Schritt S1902 allerdings „NEIN", ist die Verarbeitung beendet.
-
Als
nächstes
wird das erhaltene eingegebene Bild in Schritt S1904 der Bereichspartitionierverarbeitung
zum Extrahieren von Blöcken
unterzogen. Wurde beispielsweise das in 9 gezeigte
Dokument B in Schritt S1903 gelesen, werden die Ergebnisse der in 10 gezeigten
Art durch die in Schritt S1904 ausgeführte Bereichspartitionierverarbeitung erhalten.
-
Als
nächstes
werden in Schritt S1905 Bereichsdaten von Blöcken, die durch die Bereichspartitionierverarbeitung
in Schritt S1904 extrahiert wurden, mit Bereichsdaten von Blöcken verglichen,
die in der in Schritt S1901 ausgewählten Vorlage gespeicherte
wurden. Diesem folgt Schritt S1906, das heißt die Extraktion eines Blocks,
dessen Bereich zumindest teilweise den Bereich eines Blocks in der
Vorlage überlappt
und das gleiche Attribut wie der Bereich hat, den er überlappt.
Hier wird der extrahierte Block als Block verstanden, der mit dem
in der Vorlage definierten gewünschten
Block identisch ist, und die Bereichspartitionierdaten dieses Blocks
werden ausgegeben (Schritt S1907).
-
Wurde
beispielsweise die beruhend auf dem in 5 gezeigten
Dokument A erhaltenen Dokument A-Vorlage ausgewählt und das in 9 gezeigte
Dokument B durch die Abtasteinrichtung 101 eingelesen und
verarbeitet, überlappen
die Bereiche wie in 11 gezeigt. (Blöcke, die
als die Dokument A-Vorlage aufgezeichnet wurden, sind mit gestrichelten
Linien gezeigt, und Blöcke,
die aus dem Bild des Dokuments B extrahiert wurden, sind mit durchbrochenen
Linien gezeigt.) Da die Attribute der Blöcke, deren Bereiche einander überlappen,
gleich sind (siehe 5 und 10), werden
die Daten der Bereiche aller Blöcke
im Dokument B in 10 ausgegeben. Die Steuerung
kehrt dann zu Schritt S1902 zurück
und die Verarbeitung wird fortgesetzt.
-
Somit
können
mit jedem der vorstehend beschriebenen Ausführungsbeispiele die folgenden Vorteile
erhalten werden, wenn gewünschte
Bereiche aus einem Dokumentbild durch eine Vorlage extrahiert werden:
(1) der Bedienereingriff wird verringert, (2) die Genauigkeit der
gewünschten
Bereichsextraktion wird verbessert, (3) große Mengen an Dokumenten können automatisch
verarbeitet werden, (4) die Funktionsfähigkeit wird gesteigert, und
(5) die Gesamtverarbeitungszeit wird verkürzt.
-
Obwohl
bei den vorstehenden Ausführungsbeispielen
die Blockbereiche als rechteckige Bereiche eingestellt werden, können die
Bereiche eine beliebige Form haben, wie eine Kreisform oder elliptische
Form, solange sie geschlossene Bereiche sind.
-
Die
vorliegende Erfindung kann bei einem System aus einer Vielzahl von
Einrichtungen (beispielsweise einem Hostcomputer, einer Schnittstelle, einer
Leseeinrichtung, einem Drucker, usw.) oder bei einer Vorrichtung
aus einer einzelnen Einrichtung (beispielsweise bei einem Kopierer
oder einem Faxgerät,
usw.) angewendet werden.
-
Natürlich ist
die Erfindung auch in einem Fall anwendbar, in dem die Aufgabe der
Erfindung durch Zuführen
eines Speichermediums, das die Programmcodes der Software zur Durchführung der Funktionen
der vorstehenden Ausführungsbeispiele speichert,
zu einem System oder einer Vorrichtung, Lesen der Programmcodes
mittels eines Computers (beispielsweise einer CPU oder MPU) des
Systems oder der Vorrichtung aus dem Speichermedium und dann Ausführen der
Programmcodes erreicht wird.
-
In
diesem Fall implementieren die aus dem Speichermedium gelesenen
Programmcodes die Funktionen der Ausführungsbeispiele und das Speichermedium,
das die Programmcodes speichert, bildet die Erfindung.
-
Ferner
kann das Speichermedium, wie eine Diskette, Festplatte, optische
Platte, magnetooptische Platte, CD-ROM, CDR, Magnetband, nicht flüchtige Speicherkarte
oder ein ROM zur Bereitstellung der Programmcodes verwendet werden.
-
Neben
dem Fall, in dem die vorstehend beschriebenen Funktionen der Ausführungsbeispiele durch
Ausführen
der durch einen Computer gelesenen Programmcodes implementiert werden,
deckt die Erfindung natürlich
auch einen Fall ab, in dem ein Betriebssystem oder dergleichen,
das auf dem Computer läuft,
einen Teil oder den gesamten Prozess entsprechend der Bestimmung
von Programmcodes durchführt
und die Funktionen gemäß den Ausführungsbeispielen
implementiert.
-
Natürlich deckt
die Erfindung auch einen Fall ab, in dem nach dem Schreiben der
aus dem Speichermedium gelesenen Programmcodes in eine in den Computer
eingefügte
Funktionserweiterungskarte oder in einen in einer Funktionserweiterungseinheit
bereitgestellten Speicher, die mit dem Computer verbunden ist, eine
CPU oder dergleichen, die in der Funktionserweiterungskarte oder
Funktionserweiterungseinheit enthalten ist, einen Teil oder den
gesamten Prozess entsprechend der Bestimmung der Programmcodes durchführt und
die Funktion des vorstehend beschriebenen Ausführungsbeispiels implementiert.
-
Gemäß den vorstehend
beschriebenen Ausführungsbeispielen
ist es somit möglich,
gewünschte Bereiche
aus einem eingegebenen Dokumentbild unter Verwendung einer Vorlage
zuverlässig
zu extrahieren.