-
Die
vorliegende Erfindung ist allgemein auf eine Dokumentenanalyse bezogen,
und dieselbe ist insbesondere auf ein Dokumentenanalysesystem und
ein Verfahren zum Analysieren von Dokumenten bezogen, um die Analyse
eines abgetasteten Dokuments oder einer anderen digitalen Darstellung
eines Dokuments flexibel zu steuern.
-
Immer
mehr Dokumente werden unter Verwendung von Textverarbeitungseinrichtungen
und dergleichen erzeugt und auf Speichervorrichtungen, wie z.B.
Festplatten, Disketten, CDs (CD = Compact Disc) oder anderen Massenspeichermedien,
gespeichert. Trotzdem werden Papier und andere entsprechende Medien
zukünftig
weiterhin noch lange verwendet werden. Folglich wird weiterhin ein
Bedarf danach bestehen, den Gegenstand, der auf solchen Medien dargestellt
ist, abzutasten, so daß diese
Informationen auf einem Computer oder einem anderen entsprechenden
Gerät bearbeitet
werden können.
-
Das
Abtasten von Papierdokumenten, um den Inhalt auf denselben in einer
digitalen Umgebung verfügbar
zu machen, kann jedoch zeitaufwendig und kostspielig sein. Insbesondere
besteht ein Problem darin, daß die
Verarbeitung von verschiedenen Bereichen der abgetasteten Dokumente
sehr lange dauern kann, wobei der Anwender auf eine Analyse des
gesamten Dokuments warten muß.
Für einen Anwender
kann es häufig
erwünscht
sein, lediglich auf einen Teil des Textes, auf eine Graphik oder
auf einen Bereich mit anderen Datentypen des abgetasteten Dokuments
und nicht auf das gesamte Dokument zuzugreifen. Beispielsweise kann
es erwünscht sein,
spezifische Textabsätze
aus einem Dokument zu erhalten. Anwender müssen gegenwärtig jedoch häufig gezwungenermaßen warten,
während
eine Abtastumwandlertechnologie ein gesamtes Doku ment analysiert,
um die spezifischen Datentypen der verschiedenen Bereiche zu bestimmen,
die dann letztendlich Verarbeitungspipelines, wie z.B. OCR-Pipelines
(OCR = optical character recognition = optische Zeichenerkennung),
usw. zugeführt
werden.
-
In
S.N. SRIHARI "High-Performance
Reading Machines",
Proc. of the IEEE, Bd. 80, Nr. 7, Juli 1992, Seiten 1120-1132, sind
Lesemaschinen bekannt, bei denen ein gesamtes Dokument mit einer ersten
festen Auflösung,
beispielsweise 300 ppi, abgetastet wird. Die Abtastwerte des abgetasteten
Dokuments werden reduziert (Down-Sampling auf beispielsweise 100
PPI), wobei auf der Grundlage der reduzierten Abtastwerte eine Layout-Analyse
durchgeführt
wird, um das Dokument in Text-, Grafik- und andere Regionen zu segmentieren.
Basierend auf der Segmentierung wird dann eine Text- bzw. Bilderkennung
der segmentierten Bereiche mit der hohen Abtastauflösung durchgeführt.
-
Aus
der
EP 0629078 A1 ist
eine Vorrichtung zum Verarbeiten und Reproduzieren von Bildinformationen
bekannt, bei der ein Dokument unter Verwendung einer Segmentierungseinrichtung
in Layoutelemente segmentiert wird. Einrichtungen sind vorgesehen,
um die verschiedenen Layoutelemente unterschiedlichen Verarbeitungen,
um das Erscheinungsbild des Dokuments zu verändern, zu unterziehen.
-
Die
Aufgabe der vorliegenden Erfindung besteht darin, ein flexibles
Konzept zur selektiven Analyse von Dokumenten zu schaffen, das eine
Dokumentenanalyse mit reduziertem Zeitaufwand ermöglicht.
-
Diese
Aufgabe wird durch eine Vorrichtung zum Steuern einer Dokumentenbereichanalyse
gemäß Anspruch
1 und durch ein Verfahren zum Steuern einer Dokumentenbereichanalyse
gemäß Anspruch
8 gelöst.
-
Die
vorliegende Erfindung schafft ein Dokumentenanalysesystem und ein
Verfahren zum Analysieren von Dokumenten. Bei einem Ausführungsbeispiel
umfaßt
das Dokumentenanalysesystem eine Softwareimplementierung auf einer
Prozessorschaltung, obwohl auch ebenso dedizierte Logikschaltungen
verwendet werden können.
Das Dokumentenanalysesystem umfaßt eine Zwischenanalyseeinrichtung,
die konfiguriert ist, um eine Zwischendokumentenanalyse durchzuführen, um
eine Anzahl von Zwischenbereichen auf einem Dokument bei einer PPI-Anfangseinstellung
(PPI = pixels-per-inch = Pixel-Pro-Zoll; 1 Zoll = 2,54 cm) zu identifizieren.
Das Dokumentensystem umfaßt
ferner eine Vollanalyseeinrichtung, die konfiguriert ist, um eine
vollständige Analyse
bezüglich
zumindest eines der Zwischenbereiche bei einer zweiten höheren PPI-Einstellung durchzuführen, um
dadurch zumindest einen vollständigen
Bereich aus demselben zu erzeugen. Die vorliegende Erfindung liefert
dem Anwender eine signifikante Flexibilität mit einer Anzahl von Optionen bezüglich der
Analyse der Bereiche mit interessierenden Informationen in einem
Dokument und bezüglich
der Begrenzung der Analyse auf solche bevorzugten Bereiche.
-
Die
vorliegende Erfindung kann ferner dahingehend betrachtet werden,
daß dieselbe
ein Verfahren zum Steuern einer Dokumentenbereichsanalyse liefert.
In dieser Hinsicht kann das Verfahren allgemein durch die folgenden
Schritte zusammengefaßt werden:
Durchführen
einer Zwischendokumentenanalyse, um eine Anzahl von Zwischenbereichen
auf einem Dokument bei einer PPI-Anfangseinstellung zu identifizieren;
und Durchführen
einer vollständigen Analyse
bezüglich
zumindest eines der Zwischenbereiche mit einer zweiten, höheren PPI-Einstellung, wodurch
zumindest ein vollständiger
Bereich aus denselben erzeugt wird.
-
Die
vorliegende Erfindung weist zahlreiche Vorteile auf, von denen einige
im folgenden lediglich als Beispiele dargestellt sind. Insbesondere
versieht die vorliegende Erfindung den Anwender mit einer schnellen
Anzeige der verschiedenen Bereiche von Informationen auf einem Dokument
und ermöglicht, daß der Anwender
eine weitere Analyse dieser Bereiche steuern und den Typ der darin
enthaltenen Informationen identifiziern kann, bevor die Bereiche
in einer geeigneten Verarbeitungspipeline verarbeitet werden, die
Algorithmen für
eine optische Zeichenerkennung usw. verwenden kann. Die vorliegende
Erfindung weist einen einfachen Entwurf auf, ist benutzerfreundlich,
robust, zuverlässig
und leistungsstark im Betrieb und kann für eine kommerzielle Massenproduktion
einfach implementiert werden.
-
Weitere
Vorteile der vorliegenden Erfindung werden einem Fachmann bei der
Durchsicht der folgenden Zeichnungen und der detaillierten Beschreibung
offensichtlich werden.
-
Die
Komponenten in den Zeichnungen sind nicht notwendigerweise maßstäblich dargestellt,
wobei stattdessen die klare Darstellung der Prinzipien der vorliegenden
Erfindung betont wird. Außerdem bezeichnen
gleiche Bezugszeichen in den Figuren entsprechende Teile in allen
unterschiedlichen Ansich ten.
-
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf
die beiliegenden Zeichnungen näher
erläutert.
Es zeigen:
-
1 ein
Blockdiagramm eines Dokumentenanalysesystems gemäß einem Ausführungsbeispiel
der vorliegenden Erfindung;
-
2 eine
Zeichnung einer ersten Schnittstellenoberfläche, die auf einem Anzeigebildschirm des
Dokumentenanalysesystems von 1 gezeigt ist;
-
3 eine
Zeichnung einer zweiten Schnittstellenoberfläche, die auf dem Anzeigebildschirm des
Dokumentenanalysesystems von 1 gezeigt ist;
-
4 ein
Blockdiagramm einer Dokumentenanalyselogik, die in dem Dokumentenanalysesystem
von 1 gespeichert und von demselben ausgeführt wird;
-
5 ein
Blockdiagramm einer Zwischenanalyseteilroutine der Dokumentenanalyselogik
von 4;
-
6 ein
Blockdiagramm einer Teilroutine für eine manuelle Auswahl der
Dokumentenanalyselogik von 4; und
-
7 ein
Blockdiagramm einer Teilroutine für eine vollständige Bereichsanalyse
der Dokumentenanalyselogik von 4.
-
Bezugnehmend
auf 1 ist ein Blockdiagramm eines Dokumentenanalysesystems 100 gemäß einem
Ausführungsbeispiel
der vorliegenden Erfindung gezeigt. Das Dokumentenanalysesystem 100 umfaßt ein Computersystem 103,
das einen Prozessor 106 und einen flüchtigen/nicht-flüchtigen Speicher 113 ("Speicher 113") aufweist,
die beide mit einer lokalen Schnittstelle 116 gekoppelt
sind. Das Computersystem 103 weist ferner eine Videoschnittstelle 119,
eine Anzahl von Eingabeschnittstellen 123, ein Modem 126,
eine Anzahl von Ausgabeschnittstellen 129 und eine mobile
Datenspeicherungsvorrichtung 133 auf, die auch alle mit
der lokalen Schnittstelle 116 gekoppelt sind. Der Speicher 113 kann
beispielsweise einen Speicher mit wahlfreiem Zugriff (RAM; RAM =
random access memory), einen Nur-Lese-Speicher (ROM; ROM = read
only memory), eine Festplatte und andere entsprechende Vorrichtungen
oder eine beliebige Kombination dieser Vorrichtungen aufweisen.
Es ist zu beachten, daß sich
der Ausdruck flüchtig
auf Speichervorrichtungen bezieht, die die gespeicherten Daten bei
einem Stromausfall im allgemeinen verlieren, wobei sich der Ausdruck
nicht-flüchtig
auf Speichervorrichtungen bezieht, die bei einem Stromausfall keine
Daten verlieren.
-
Das
Dokumentenanalysesystem 100 umfaßt ferner eine Anzeigevorrichtung 136,
die über
die Videoschnittstelle 119 mit der lokalen Schnittstelle 116 gekoppelt
ist. Das Dokumentenanalysesystem 100 umfaßt ferner
mehrere Eingabevorrichtungen, nämlich
eine Tastatur 139, eine Maus 143, ein Mikrophon 146 und
einen Scanner 149, die alle über die verschiedenen Eingabeschnittstellen 123 mit
der lokalen Schnittstelle 116 gekoppelt sind. Zusätzlich ist
das Modem 126 mit einem externen Netzwerk 153 gekoppelt,
wodurch ermöglicht
wird, daß das
Computersystem über
das externe Netzwerk 153 Daten versenden und empfangen
kann. Das externe Netzwerk 153 kann beispielsweise das
Internet, ein lokales Netzwerk (LAN; LAN = local area network),
ein weiträumiges
Netzwerk (WAN; WAN = wide area network) oder ein anderes entsprechendes
Netzwerk sein.
-
Das
Dokumentenanalysesystem 100 kann ferner Audiolautsprecher 156,
einen Drucker 159 oder andere Ausgabevorrichtungen aufweisen,
die über
die Ausgabeschnittstellen 129 mit der lokalen Schnittstelle 116 gekoppelt
sind. Die mobile Datenspeichervorrichtung 133 kann eine
von mehreren solcher Vor richtungen sein, die eine Datenspeicherung auf
einer mobilen Plattform, wie z.B. einem Diskettenlaufwerk, einem
CD-Laufwerk, einem mobilen Festplattenlaufwerk, einem mobilen Festspeicher oder
einer anderen entsprechenden Datenspeichervorrichtung, ermöglichen.
-
Das
Dokumentenanalysesystem 100 umfaßt ferner eine Dokumentenanalyselogik 170,
die im allgemeinen zusammen mit den Daten 176 in dem Speicher 113 gespeichert
ist. Bei einem Ausführungsbeispiel
der vorliegenden Erfindung weist der Speicher 113 eine
Kombination aus einem RAM-Speicher, einem ROM-Speicher und einer Festplatte
auf, obwohl andere Kombinationen verwendet werden können. Bei
diesem Ausführungsbeispiel
ist die Dokumentenanalyselogik 170 eine Software, die auf
der Festplatte gespeichert ist, wobei auch die Daten 176 auf
der Festplatte gespeichert sind. Wenn sich das Dokumentenanalysesystem 100 im
Betrieb befindet, werden relevante Teile der Dokumentenanalyselogik 170 in
den RAM-Speicher geladen und von dem Prozessor 106 ausgeführt. Während des
Betriebs des Dokumentenanalysesystems 100 kann die Dokumentenanalyselogik 170 auf
relevante Teile der Daten 176, die auf der Festplatte gespeichert
sind, zugreifen und dieselben für
unterschiedliche Zwecke in den RAM-Speicher laden. Die Daten 176 können beispielsweise
eine Bitmap-Abbildung eines abgetasteten Dokuments, das aus dem Scanner 149 empfangen
wird, aufweisen. Auf die Daten 176 kann ferner über den
mobilen Datenspeicher 133 oder das externe Netzwerk 153 zugegriffen
werden.
-
Die
Anzeigevorrichtung 136 wird verwendet, um eine beliebige
aus einer Anzahl von Schnittstellenanzeigen 181 anzuzeigen,
die von dem Anwender betrachtet werden. Der Anwender ist über die
Eingabevorrichtungen, wie z.B. die Tastatur 139, die Maus 143 oder
das Mikrophon 146, "schnittstellenmäßig" mit dem Computersystem 103 verbunden.
Der Anwender empfängt
eine Audioausgabe aus den Audiolautsprechern 156, und das
Computersystem 103 kann verschiedene erstellte Dokumente
auf dem Drucker 159 ausdrucken.
-
Es
ist zu beachten, daß,
obwohl die obige Implementierung der vorliegenden Erfindung hinsichtlich
einer Prozessoreinheit und Software erörtert wird, es offensichtlich
sein sollte, daß andere
Ausführungsbeispiele
der vorliegenden Erfindung eine dedizierte Logikschaltung, die die
Funktionalität
der Dokumentenanalyselogik 170 erfüllt, oder eine Kombinationsschaltung
umfassen, die eine Prozessorschaltung mit einer Software und spezifischen
dedizierten Schaltungen aufweist. Es wird offensichtlich, daß alle diese
Permutationen von verschiedenen Implementierungen hierin aufgenommen
sind.
-
Im
folgenden wenden wir uns 2 zu. Dort ist eine erste Schnittstellenanzeige 181a gezeigt,
die auf der Anzeigevorrichtung 136 erscheint. Die erste Schnittstellenanzeige 181a weist
quer über
die Oberseite mehrere Knöpfe
auf, einschließlich
eines "Wiederhole"-Knopfes 203,
eines Automatische-Analyse-Knopfes 206, eines Prioritäts-Menü-Knopfes 209, eines
Stopp/Lösche-Knopfes 213 und
eines Verarbeite-Bereiche-Knopfes 216. Die erste Schnittstellenanzeige 181a weist
ferner eine Anzeigeeinrichtung 219 für eine PPI-Zwischeneinstellung 219 (PPI
= pixels-per-inch = Pixel-Pro-Zoll; 1 Zoll = 2,54 cm) auf, die einen
PPI-Pulldown-Knopf 223 aufweist. Es ist zu beachten, daß diese
Knöpfe
gedrückt
oder aktiviert werden können,
indem mit der Maus 143 ein Zeiger an die Position des Knopfes
gebracht und dann eine geeignete Taste auf der Maus 143 gedrückt wird.
Die Verwendung der Maus 143 auf diese Art und Weise wird
als "Anklicken" eines bestimmten
Knopfes bezeichnet. Ferner kann auch ein Sprachbefehl, der von dem
Mikrophon 146 empfangen und durch eine geeignete Spracherkennungssoftware
interpretiert wird, verwendet werden, um die Knöpfe zu aktivieren oder um die
Funktionen, die den Knöpfen
zugeordnet sind, auf eine andere weise auszuführen. Die erste Schnittstellenanzeige 181a weist
ferner einen Dokumentenanzeigebereich 226 auf, in dem ein
digitales Dokument 229 angezeigt wird. In dem digitalen
Dokument 229 befinden sich mehrere Zwischenbereiche 233,
die von 1 bis 6 numeriert sind. Die Zwischenbereiche 233 werden
basierend auf einer Datendatei erzeugt, die eine digitale Darstellung
eines Hardcopy-Dokuments aufweist, das von dem Scanner 149 abgetastet
wurde. Das digitale Dokument kann in der Form einer Bitmap-Abbildung
oder in einem anderen entsprechenden Format vorliegen.
-
Gemäß der vorliegenden
Erfindung wird das digitale Dokument 229 durch Abtasten
eines Hardcopy-Dokuments durch den Scanner 149 erzeugt.
Daraufhin wird bezüglich
des digitalen Dokuments 229 eine Zwischenanalyse durchgeführt, um
die einzelnen Typen von Informationen auf dem Dokument bei einem
Zwischen-PPI-Wert zu identifizieren. Die Bedeutung des Pixel-Pro-Zoll-Werts
der Analyse des digitalen Dokuments rechtfertigt eine weitere Erklärung.
-
Das
digitale Dokument 229 besteht eigentlich aus zahlreichen
Pixeln, die über
der Vorderseite des Dokuments in Zeilen angeordnet sind, wie es
beispielsweise bei einer Bitmap-Abbildung usw. der Fall ist. Die
Pixel werden beispielsweise durch die Tätigkeit des Scanners 149 erzeugt.
Beim Analysieren des digitalen Dokuments 229 werden die
Pixelzeilen mit einer spezifizierten Auflösung einer spezifizierten Anzahl
von Pixel-Pro-Zoll genau untersucht wird, um die Grenzen von Textbereichen
oder Bereichen mit anderen Datentypen zu bestimmen. Das heißt sozusagen,
daß nicht
alle der Pixel untersucht werden, sondern lediglich eine spezifizierte
Anzahl der Pixel pro Zoll (1 Zoll = 2,54 cm) untersucht werden.
Die Pixel, die pro Zoll untersucht werden, können schnell und einfach aus
einem Quellendokument mit einem höheren PPI-Wert abgebildet werden.
Gemäß der vorliegenden
Erfindung ist der Zwischen-PPI-Wert im allgemeinen niedriger als
der PPI-Wert, der notwendig ist, um die genaue Art der Informationen
auf dem digitalen Dokument 229 exakt zu bestimmen. Folglich
wird basierend auf der Zwischenanalyse eine Abschätzung der
genauen Art der Informationen auf dem digitalen Dokument 229 erhalten.
Ein wesentlicher Vorteil der Zwischenanalyse besteht darin, daß dieselbe
im Vergleich zu einer vollständigen
und genauen Analyse des digitalen Dokuments 229 schnell ist.
-
Beim
Durchführen
der Zwischenanalyse gibt es mehrere Dokumentenanalysealgorithmen,
die verwendet werden können,
die Manhattan-Seitenformate und Nicht-Manhattan-Seitenformate aufweisen. Der
verwendete Algorithmus sollte als Merkmal eine Segmentierung aufweisen,
die ausreichend grob ist, um sicherzustellen, daß Informationen eines Datentyps,
der in einem einzelnen Bereich enthalten ist, nicht in zwei Bereiche
aufgeteilt wird. Ein bevorzugter Algorithmus wird als "Projektionsschnitt"- oder "Blocksegmentierungs"-Algorithmus bezeichnet,
der aufeinanderfolgende vertikale und horizontale Schnitte durch
das Dokument verwendet. Weitere Algorithmen umfassen einen "Verbundene-Komponente/Unschärfe"-Algorithmus, der
in dem Artikel von Wong u.a., "Document
Analysis System",
J. Res. Development, Bd. 6, S. 642 – 656, Nov. 1982, beschrieben
ist, der hierin durch Bezugnahme aufgenommen ist, als auch einen "Schwelle-Unschärfe-und-Verbundene-Komponente"-Algorithmus. Eine
weitere Erklärung
solcher Algorithmen ist bei Pavlidis u.a., "Page Segmentation and Classification", CVGIP: Graphical Models
and Image Processing, Bd. 54, Nr. 6, Nov. 1992, S. 484 – 496, zu
finden, und ist hierin durch Bezugnahme aufgenommen.
-
Die
Zwischenanalyse untersucht das digitale Dokument 229 und
erhält
die Abschätzung
der Art der Informationen auf dem digitalen Dokument 229 durch
Erfassen der Zwischenbereiche 233. Im allgemeinen weist
die Fläche
jedes Zwischenbereichs 223 basierend auf der Zwischenanalyse
vorherrschende Charakteristika auf, die anzeigen, daß der Inhalt
des Zwischenbereichs 233 einen einzigen Typ aufweist, der
im allgemeinen als Text, Photos, Liniengraphik oder als ein anderer
Bereichsdatentyp klassifiziert wird. Aufgrund der Tatsache, daß die Zwischenanalyse
bei dem relativ niedrigen Zwischen-PPI-Wert durchgeführt wird, der beispielsweise
etwa gleich 30 PPI sein kann, ist es möglich, daß ein einzelner Zwischenbereich 233 tatsächlich einen
oder mehrere konkrete Bereiche mit einem unterschiedlichen Bereichsdatentyp
enthal ten kann. Dies tritt auf, da der relativ niedrige PPI-Wert
der Zwischenanalyse nicht zwischen Bereichen unterscheidet, die
aufgrund einer Unschärfe,
einer Projektionsprofilstörung,
einer Überlappung
von verbundenen Komponenten usw. letztendlich bei dem niedrigeren
PPI-Wert ein ähnliches
Aussehen aufweisen.
-
Sobald
das digitale Dokument 229 erzeugt und die Zwischenbereiche 233 identifiziert
worden sind, werden die Zwischenbereiche 233 auf eine Art und
Weise angezeigt, um anzugeben, daß dieselben tatsächlich Zwischenbereiche 233 sind.
Die Zwischenbereiche 233 können beispielsweise eine vorbestimmte
Grenze aufweisen, wie z.B. eine gestrichelte Linie oder einen anderen
Linientyp. Die Zwischenbereiche 233 können in einer unterschiedlichen
Farbe oder als ein spezifisches Piktogramm (Icon) erscheinen. Angesichts
der vorhergehenden Beschreibung sollte es offensichtlich sein, daß die Zwischenbereiche 233 ein
Aussehen aus einer Vielzahl von Ausgestaltungen aufweisen können, die
lediglich durch die Fähigkeiten
der Anzeigevorrichtung 138 und der Treibersoftware beschränkt sind.
Alle diese Permutationen des Aussehens der Zwischenbereiche 233 sind
hierin aufgenommen.
-
Der
Anwender kann einen beliebigen der Zwischenbereiche 233 hervorheben,
um diese Bereiche auf irgendeine Art und Weise weiter zu bearbeiten,
indem (beispielsweise durch einmaliges Anklicken mit der Maus) der
gewünschte
Zwischenbereich 229 ausgewählt wird. Sobald ein Zwischenbereich hervorgehoben
ist, kann der Anwender den Bereich ändern, indem die Grenzen bewegt
werden, oder der Anwender kann den hervorgehobenen Zwischenbereich 233 vollständig löschen.
-
Die
vorliegende Erfindung erleichtert die weitere oder vollständige Analyse
der Zwischenbereiche 233, um den konkreten Bereich oder die konkreten Bereiche,
die darin enthalten sind, zu ermitteln. Sobald ein bestimmter Zwischenbereich 233 der
vollständigen
Analyse unterzogen wurde, werden der Inhalt des konkreten Bereichs
oder der konkreten Bereiche, der darin enthalten ist, für eine weitere
Bearbeitung durch den Anwender angezeigt. Auf diese Art und Weise
werden die Zwischenbereiche 233, die nicht der vollständigen Analyse
unterzogen wurden, von den konkreten Bereichen unterschieden, die
sich aus der vollständigen
Analyse eines früheren
Zwischenbereichs 233 ergeben. Es ist zu beachten, daß die vollständige Analyse
bei einem höheren
PPI-Wert als die Zwischenanalyse, wie z.B. bei 75-100 PPI oder höher, durchgeführt wird.
-
Sobald
die Zwischenanalyse durchgeführt
ist und die Zwischenbereiche 233 auf dem digitalen Dokument 229 identifiziert
sind, sieht sich der Anwender weiteren Optionen gegenüber, um
das digitale Dokument 229 zu analysieren. Insbesondere
für den
Fall, daß der
Anwender findet, daß den
Zwischenbereichen 233 eine ausreichende Detaillierung fehlt,
wie z.B. für
den Fall einer wiederholten Verwendung mit einem ähnlichen
Dokumenttyp, kann der Anwender einen neuen Zwischen-PPI-Wert in
die Zwischen-PPI-Anzeigeeinrichtung 219 eingeben oder der
PPI-Pulldown-Knopf 223 kann gedrückt werden, um eine Liste von
möglichen
Zwischen-PPI-Werten herunterzuziehen, aus denen der Anwender eine Auswahl
treffen kann, indem der geeignete Zwischen-PPI-Wert mit der Maus 143 angeklickt
wird. Daraufhin kann der Anwender auf den Wiederhole-Knopf 203 klicken,
der ein Wiederhole-Flag, das in dem Speicher 113 gespeichert
ist, auf eine logische "1" setzt, wobei das
Dokumentenanalysesystem 100 die Zwischenanalyse bei dem
neu eingegebenen Zwischen-PPI-Wert noch einmal durchführt.
-
Der
Anwender kann auch auf den Automatische-Analyse-Knopf 206 klicken,
wobei dann das Dokumentenanalysesystem 100 eine vollständige Analyse
jedes der Zwischenbereiche 233 gemäß einer vorbestimmten Prioritäts-Nummer
beginnt, die jedem der Zwischenbereiche 233 zugeordnet
ist. Falls der Anwender wünscht,
die vollständige
Analyse bezüglich
eines ausgewählten
Zwischenbereichs 233 oder einer ausgewählten Anzahl der Zwischenbereiche 233 durchzuführen, kann
der Anwender ein fach einen "Doppel-Klick" auf die spezifische(n)
Zwischenbereich(e) 233 vornehmen. Der Prioritäts-Schlange-Knopf 209 bewirkt,
daß eine
zweite Schnittstellenanzeige (nicht gezeigt) auf der Anzeigevorrichtung 136 erscheint,
um die Bereiche zu bearbeiten, die in einer Zwischenbereichsanalyseschlange
enthalten sind, wie es im folgenden erörtert wird.
-
Der
Anwender kann den Stopp/Lösche-Knopf 213 anklicken,
der bewirkt, daß die
Analyse eines beliebigen ausgewählten
Bereichs beendet wird, und der Automatische-Analyse-Knopf 206 wird
betätigt,
falls derselbe gedrückt
wird. Schließlich ist
der "Verarbeite-Bereiche"-Knopf 216 vorgesehen, der,
wenn derselbe aktiviert wird, ermöglicht, daß der Benutzer diejenigen Bereiche,
die einer vollständigen Analyse
unterzogen wurden, zu einer geeigneten Verarbeitungspipeline schicken
kann, wie z.B. einem OCR-Algorithmus (OCR = optical character recognition
= optische Zeichenerkennung), einem Photoeditor, einer Textverarbeitungseinrichtung,
einem Publisher, einer Dokumentenerzeugungseinrichtung, einem Formularpaket,
einer Web-Seiten-Erstellungseinrichtung, Datenbanken, Faxgeräten, Kopiergeräten, Druckern
oder anderen entsprechenden Pipelines.
-
Bezugnehmend
auf 3 ist eine zweite Schnittstellenanzeige 181b gemäß einem
weiteren Ausführungsbeispiel
der vorliegenden Erfindung gezeigt. Die zweite Schnittstellenanzeige 181b umfaßt eine
Zwischenbereichsprioritätsschlange 301 und eine
Liste 303 für
nicht-ausgewählte
Zwischenbereiche. Die zweite Schnittstellenanzeige 181b umfaßt ferner
einen Hinzufüge-Knopf 306,
einen Entferne-Knopf 309, einen Bewege-Nach-Oben-Knopf 313 und einen
Bewege-Nach-Unten-Knopf 316. Nachdem die Zwischenanalyse
durchgeführt
ist, werden die identifizierten Zwischenbereiche in der Liste 303 für die nicht-ausgewählten Zwischenbereiche
aufgelistet. Diese aufgelisteten Zwischenbereiche 233 werden
dann ausgewählt,
um auf eine beliebige Weise in der Zwischenbereichsanalyseschlange 301 plaziert
zu werden.
-
Ein
Bereich kann beispielsweise ausgewählt werden, indem dieser Zwischenbereich 233,
der auf der Schnittstelle sichtbar ist, doppelt angeklickt wird, wenn
die erste Schnittstellenanzeige 181a (2) betrachtet
wird. Ferner können
alle Bereiche ausgewählt
werden, indem der Automatische-Analyse-Knopf 206 (2)
angeklickt wird. Schließlich kann
ein Zwischenbereich 233 hervorgehoben werden, indem dieser
Bereich in der Liste 303 für nicht-ausgewählte Zwischenbereiche
angeklickt und daraufhin der Hinzufüge-Knopf 306 angeklickt
wird. Entsprechend kann ein Zwischenbereich 233 in der Zwischenbereichsanalyseschlange 301 aus
derselben entfernt werden, indem der spezielle Zwischenbereich 233 hervorgehoben
und dann der Entferne-Knopf 309 angeklickt wird.
-
Es
ist zu beachten, daß die
Zwischenbereiche 233 gemäß einer vorbestimmten Priorität in der Zwischenbereichsanalyseschlange 301 aufgelistet sind,
wobei die höchste
Priorität
dem obersten aufgelisteten Zwischenbereich 233 zugeordnet
ist. Die höchste
Priorität
wird basierend auf der Reihenfolge, mit der die Zwischenbereiche 233 ausgewählt werden,
zugewiesen. Zusätzlich
kann die Priorität
der Zwischenbereiche 233 neu angeordnet werden, indem der
entsprechende Bereich hervorgehoben und der Bewege-Nach-Oben- und
Bewege-Nach-Unten-Knopf 313 und 316 geeignet gedrückt wird.
Das Endergebnis besteht darin, daß der hervorgehobene Bereich
folglich in der Zwischenbereichsanalyseschlange 301 nach
oben oder nach unten weitergeschoben wird. Alternativ bewirkt ein
einzelnes Anklicken des Zwischenbereichs (im Gegensatz zu einem Doppelklick)
in der ersten Schnittstellenanzeige 181a, daß sich dieser
Bereich nach oben in der Schlange 301 bewegt. Gemäß der vorliegenden
Erfindung wird jeder Zwischenbereich 233, der in der Zwischenbereichsanalyseschlange 301 plaziert
ist und die höchste
Priorität
aufweist, der vollständigen Analyse
unterzogen, um die genaue Art der Informationen, die in den fraglichen
Zwischenbereichen 233 enthalten sind, zu identifizieren.
-
Bezugnehmend
auf 4 ist ein Flußdiagramm
der Dokumenten analyselogik 170 (1) gemäß einem
Ausführungsbeispiel
der vorliegenden Erfindung gezeigt. Die Dokumentenanalyselogik 170 beginnt
mit Block 403, bei dem ein spezifisches digitales Dokument 229 für die Zwischenanalyse
identifiziert wird. Dies wird beispielsweise durchgeführt, indem
ein Dokument aus einer Eingabeliste (pick list) gewählt wird,
oder ein abgetastetes Dokument kann automatisch ausgewählt werden.
Falls ein digitales Dokument 229 vorliegt, springt die
Dokumentenanalyselogik 170 zu Block 406 weiter.
Falls dies nicht der Fall ist, springt die Dokumentenanalyselogik 170 zurück zu Block 406,
bei dem dieselbe schließlich bleibt,
bis ein Dokument identifiziert wird. Bei Block 406 wird
eine Zwischenanalyseteilroutine ausgeführt, wie es im folgenden erörtert wird.
-
Bei
Block 409 bestimmt die Dokumentenanalyselogik 170,
ob der Automatische-Analyse-Knopf 206 (2)
gedrückt
ist. Falls der Automatische-Analyse-Knopf 206 nicht gedrückt ist,
springt die Betriebslogik zu Block 413. Falls derselbe
gedrückt
ist, springt die Dokumentenanalyselogik 170 weiter zu Block 416.
Bei Block 413 wird eine Teilroutine für eine manuelle Auswahl ausgeführt, wie
es erörtert
wird. Bei Block 416 plaziert die Dokumentenanalyselogik 170 alle
nichtausgewählten
Zwischenbereiche 233 mit einem Flag (Merker) für einen
vollständigen
Bereich, das gleich einer logischen "0" ist,
in der Zwischenbereichsanalyseschlange 301. Die "nicht-ausgewählten" Zwischenbereiche
sind diejenigen, die nicht in der Zwischenbereichsanalyseschlange 301 plaziert
worden sind. Daraufhin springt die Dokumentenanalyselogik 170 weiter
zu Block 419.
-
Bei
Block 413 wird eine Teilroutine für eine manuelle Auswahl ausgeführt, die
die Operation des Dokumentenanalysesystems 100 steuert,
wenn der Automatische-Analyse-Knopf 206 (2)
nicht gedrückt
ist. Daraufhin springt die Dokumentenanalyselogik 170 zu
Block 419 weiter, bei dem eine Teilroutine 419 für eine vollständige Bereichsanalyse
ausgeführt
wird. Sobald die Teilroutine 419 für eine vollständige Be reichsanalyse
ausgeführt
ist, springt die Dokumentenanalyselogik 170 zu Block 423,
bei dem das Wiederhole-Flag untersucht wird. Falls das Wiederhole-Flag
gleich einer logischen "1" ist, springt die Dokumentenanalyselogik 170 zurück zu Block 406, bei
dem die Zwischenanalyseteilroutine noch einmal ausgeführt wird.
Falls das Wiederhole-Flag gleich einer logischen "0" ist, springt die Dokumentenanalyselogik
zu Block 426 weiter, bei dem bestimmt wird, ob die Dokumentenanalyselogik 170 abgeschlossen
ist. Dies tritt beispielsweise auf, wenn alle Flags für einen vollständigen Bereich
auf eine logische "1" eingestellt sind
oder wenn der Anwender bewirkt, daß die Logik endet, indem der
Verarbeite-Bereich-Knopf 216 (2)
gedrückt
wird, wodurch bewirkt wird, daß diejenigen
Bereiche mit einem Flag für
einen vollständigen
Bereich, das auf eine logische "1" eingestellt ist, geeigneten
Verarbeitungspipelines, wie z.B. OCR-Algorithmen usw., zugeführt werden.
Ferner kann der Anwender eine Abbruch-Option (Cancel-Option) auswählen, die
in der ersten Schnittstellenanzeige 181a aufgenommen ist,
um die Logik 170 zu beenden. Falls die Dokumentenanalyselogik 170 bei
Block 426 noch nicht beendet ist, springt die Logik 170 zurück zu Block 409.
Falls die Logik 170 beendet ist, endet die Dokumentenanalyselogik 170.
-
Im
folgenden wenden wir uns 5 zu. Dort ist ein Flußdiagramm
der Zwischenanalyseteilroutine 406 gezeigt. Die Zwischenanalyseteilroutine 406 beginnt
mit Block 433, bei dem die Zwischenanalyse bezüglich eines
identifizierten digitalen Dokuments 229 (2)
bei dem Zwischen-PPI-Wert durchgeführt wird. Es ist zu beachten,
daß das
dargestellte digitale Dokument 229 unter Verwendung des
Scanners 149 (1) in das Dokumentenanalysesystem 110 eingescannt
oder aus dem externen Netzwerk 153 (1) oder
dem mobilen Datenspeicher 133 (1) usw.,
in den Speicher 113 geladen worden sein kann.
-
Daraufhin
springt die Teilroutine zu Block 436, bei dem die erste
Schnittstellenanzeige 181a (2) auf der
Anzeige vorrichtung 136 (1) dargestellt
wird, die das digitale Dokument 229 und die Zwischenbereiche 233 zeigt,
die durch die Zwischenanalyse von Block 433 identifiziert
sind. Die Zwischenbereiche 233 werden mit einem Zwischen-Zeichen,
wie vorher erörtert,
angezeigt, um zwischen denjenigen Bereichen zu unterscheiden, die
der vollständigen
Analyse unterzogen wurden, und denjenigen, die der vollständigen Analyse
nicht unterzogen wurden. Daraufhin wird bei Block 439 eine
Anzahl von Flags für
einen vollständigen
Bereich auf eine logische "0" eingestellt, wobei
jedes Flag einem der Zwischenbereiche 233 zugeordnet ist.
Die Flags für vollständige Bereiche
können
beispielsweise eine Anzahl von vordefinierten Bits in dem Speicher 113 oder
einer anderen Speicherposition sein, auf die von dem Prozessor 106 (1)
zugegriffen werden kann.
-
Die
Logik der Zwischenanalyseteilroutine kann in Verbindung mit der
geeigneten Hardware des Dokumentenanalysesystems als eine Zwischenanalyseeinrichtung
betrachtet werden, die die Zwischenbereiche 233 basierend
auf dem digitalen Dokument 229 erzeugt.
-
Bezugnehmend
auf 6 ist ein Flußdiagramm
einer Teilroutine 413 für
eine manuelle Auswahl gezeigt. Beginnend mit Block 453 kann
der Anwender einen oder mehrere der Zwischenbereiche 233,
die auf der ersten Schnittstellenanzeige 181a angezeigt
werden, verändern
oder löschen.
Der Anwender kann beispielsweise einen bestimmten Zwischenbereich 233 anklicken,
um denselben hervorzuheben und die Position der Grenzen auf eine
bekannte Abmessung gemäß bekannten
Charakteristika des speziellen Zwischenbereichs 233 einstellen, indem
die Grenzen mit der Maus 143 (1) manipuliert
bzw. bearbeitet werden. Folglich sind die Ränder und Ecken der Zwischenbereiche 233 im
allgemeinen aktiv, interaktiv, einstellbar oder verstellbar. Der
Anwender kann ferner einen Zwischenbereich löschen, indem der spezielle
Zwischenbereich angeklickt wird, um denselben hervorzuheben, und
der Lösche-Knopf
gedrückt
wird, usw. Falls eine Änderung
oder eine Löschung
eines bestimmten Zwischenbereichs 233 bei Block 453 erfaßt wird,
springt die Teilroutine zu Block 456, bei dem das Flag
für einen
vollständigen
Bereich des geänderten/gelöschten Zwischenbereichs 233 auf
eine logische "1" eingestellt wird,
das anzeigt, daß der
geänderte/gelöschte Zwischenbereich 233 nicht
einer vollständigen
Analyse unterzogen werden muß.
Falls keine Änderung
oder Löschung
eines Zwischenbereichs bei Block 453 auftritt, oder falls
ein Flag für
einen vollständigen
Bereich bei Block 456 auf eine logische "1" eingestellt worden ist, springt die
Teilroutine zu Block 459 weiter.
-
Bei
Block 459 bestimmt die Teilroutine, ob der Wiederhole-Knopf 203 (2)
gedrückt
worden ist. Falls der Wiederhole-Knopf 203 gedrückt worden ist,
springt die Teilroutine zu Block 463 weiter, bei dem ein
Wiederhole-Flag auf eine logische "1" eingestellt
wird. Das Wiederhole-Flag kann beispielsweise ein vordefiniertes
Bit in dem Speicher 113 oder einer anderen geeigneten Speicherposition
sein. Falls der Wiederhole-Knopf 203 nicht gedrückt worden
ist, wie es in Block 459 bestimmt wird, oder falls das
Wiederhole-Flag bei Block 463 auf eine logische "1" eingestellt worden ist, springt die
Teilroutine zu Block 466 weiter.
-
Bei
Block 466 bestimmt die Teilroutine, ob der Anwender einen
bestimmten Zwischenbereich 233 zu der Zwischenbereichsanalyseschlange 301 (3)
hinzugefügt
hat, indem entweder der Bereich doppelt angeklickt wurde, während die
erste Schnittstellenanzeige 181a (2) betrachtet
wurde, oder indem der Hinzufüge-Knopf 306 angeklickt
wurde, um einen speziellen hervorgehobenen Bereich 233 hinzuzufügen, während die
zweite Schnittstellenanzeige 181b betrachtet wurde. Falls
das Hinzufügen eines
Zwischenbereichs 233 zu der Zwischenbereichsanalyseschlange 301 erfaßt worden
ist, springt die Teilroutine zu Block 469 weiter. Falls
dies nicht der Fall ist, endet die Teilroutine und springt zu dem Flußdiagramm
von 4 zurück.
Bei Block 469 wird der ausgewählte Zwischenbereich 233 in
der Zwischenbereichsanalyseschlange plaziert, falls das entsprechende
Flag für
einen vollständigen
Bereich eine logische "0" ist. Daraufhin endet
die Teilroutine und springt zu dem Flußdiagramm von 4 zurück.
-
Bezugnehmend
nun auf 7 ist ein Flußdiagramm
der Teilroutine 419 für
eine vollständige
Bereichsanalyse gezeigt. Beginnend mit Block 503 bestimmt
die Teilroutine, ob ein Zwischenbereich 233 (2)
in der Zwischenbereichsanalyseschlange 301 (3)
plaziert worden ist. Falls einer oder mehrere der Zwischenbereiche 233 in
der Schlange 301 plaziert worden ist, springt die Teilroutine 419 zu Block 506 weiter.
Falls dies nicht der Fall ist, endet die Teilroutine 419 und
springt zu dem Flußdiagramm von 4 zurück. Es ist
zu beachten, daß die
Bereichsanalyseteilroutine 419 im allgemeinen so lange wartet,
bis zumindest ein Zwischenbereich 233 in der Schlange 301 plaziert
worden ist, bevor eine weitere Funktion durchgeführt wird.
-
Bei
Block 506 führt
die Teilroutine 419 eine vollständige Analyse des Bereichs
mit der höchsten Priorität in der
Schlange 301 durch. Die höchste Priorität wird im
allgemeinen auf der Basis bestimmt, daß der Bereich als erstes analysiert
wird, der als erstes ausgewählt
wurde. Während
die vollständige Analyse
bezüglich
des Bereichs mit der höchsten
Priorität
in der Schlange 301 durchgeführt wird, springt die Teilroutine 419 dann
zu Block 509 weiter und untersucht die Schlange 301,
um zu erkennen, ob sich die höchste
Priorität
verändert
hat, während
dieselbe eine vollständige
Analyse durchgeführt
hat. Falls dies der Fall ist, springt die Teilroutine 419 zu
Block 513, wobei die vollständige Analyse bei dem Bereich
mit vormals höchster
Priorität
angehalten wird und die Ergebnisse als die noch nicht vollständige Analyse
in dem Speicher 113 (1) gespeichert
werden, wobei die Analyse fortgesetzt wird, wenn dieser Zwischenbereich
wieder einmal der Bereich mit der höchsten Priorität ist. Daraufhin
springt die Teilroutine 419 zurück zu Block 506, bei
dem der neue Bereich mit der höchsten
Priorität
einer vollständigen Analyse
unterzogen wird. Es ist zu beachten, daß die Logik von Block 506 als
eine vollständige
Analyseeinrichtung betrachtet werden kann, die eine vollständige Analyse
der Zwischenbereiche 233 liefert, die zu derselben zugeführt werden.
-
Falls
die Priorität
bei Block 509 nicht geändert
wurde, springt die Teilroutine 419 zu Block 516, bei
dem bestimmt wird, ob einer der Zwischenbereiche 233 in
der Schlange 301 geändert
oder gelöscht worden
ist, oder ob ein Zwischenbereich 233 die vollständige Analyse
beendet hat. Falls dies nicht der Fall ist, springt die Teilroutine
zu Block 519 weiter, und falls dies der Fall ist, springt
die Teilroutine 419 zu Block 523 weiter. Bei Block 523 wird
das Flag für einen
vollständigen
Bereich des geänderten/gelöschten/vollständigen Zwischenbereichs 233 auf
eine logische "1" eingestellt, die
anzeigt, daß der
Bereich keiner vollständigen
Analyse unterzogen werden muß.
Daraufhin springt die Teilroutine 419 zu Block 526,
bei dem der spezielle geänderte/gelöschte/vollständige Zwischenbereich 233 aus
der Schlange 301 entfernt wird, wobei die Teilroutine 419 ohne
den geänderten/gelöschten/vollständigen Zwischenbereich 233 wiederholt
wird.
-
Beim
Erreichen des Blocks 519 bestimmt die Teilroutine 419,
ob ein bestimmter Bereich aus der Schlange 301 durch Drücken des
Entferne-Knopfs 309 in der zweiten Schnittstellenanzeige 181b entfernt
worden ist. Falls dies der Fall ist, springt die Teilroutine 419 zu
Block 524, bei dem der Automatische-Analyse-Knopf 206 aktiviert
wird, falls derselbe gedrückt
wird. Daraufhin springt die Teilroutine 419 zu Block 526 zurück, um den
gewünschten
Zwischenbereich 233 aus der Schlange 301 zu entfernen.
Falls kein Bereich bei Block 519 entfernt worden ist, springt
die Teilroutine 419 zu Block 529, bei dem bestimmt
wird, ob ein Zwischenbereich 233 zu der Schlange 301 hinzugefügt worden
ist, indem entweder ein gewünschter
Zwischenbereich 233 auf der ersten Schnittstellenanzeige 181a (2)
doppelt angeklickt wurde, indem der Automatische-Analyse-Knopf 206 (2)
angeklickt wurde, oder indem der Hinzufüge-Knopf 306 in der
zweiten Schnittstellenanzeige 181b (3) angeklickt
wurde. Falls dies der Fall ist, springt die Teilroutine 419 zu
Block 533, bei dem der gewünschte Zwischenbereich 233 zu
der Schlange 301 hinzugefügt wird, falls das entsprechende
Flag für
einen vollständigen
Bereich auf eine logische "0" eingestellt ist.
Für den
Fall, wenn der Automatische-Analyse-Knopf 203 gedrückt worden
ist, können
mehrere Bereiche gleichzeitig zu der Schlange hinzugefügt werden,
mit Ausnahme derjenigen Bereiche, deren Flag für einen vollständigen Bereich auf
eine logische "1" eingestellt ist.
Falls kein Zwischenbereich 233 bei Block 529 zu
der Schlange 301 hinzugefügt werden soll oder falls der/die
geeignete(n) Zwischenbereich(e) 233 bei Block 533 zu
der Schlange 301 hinzugefügt worden sind, springt die Teilroutine 419 zu
Block 536 weiter.
-
Bei
Block 536 bestimmt die Teilroutine, ob der Wiederhole-Knopf 203 oder
der Stopp/Lösche-Knopf 213 gedrückt worden
ist. Falls dies der Fall ist, springt die Teilroutine 419 zu
Block 539 weiter, bei dem die Analyse des Zwischenbereichs 233 mit
der höchsten
Priorität
in der Schlange 301 endet, alle Zwischenbereiche 233 aus
der Schlange 301 entfernt werden, der Automatische-Analyse-Knopf 206 aktiviert
wird, wenn derselbe gedrückt
wird, und das Wiederhole-Flag auf eine logische "1" eingestellt wird,
wenn der Wiederhole-Knopf 203 gedrückt worden ist. Daraufhin endet
die Teilroutine 419 und springt zu dem Flußdiagramm
von 4 zurück. Falls
weder der wiederhole-Knopf 203 noch der Stopp/Lösche-Knopf 213 bei
Block 536 gedrückt
worden ist, springt die Teilroutine 419 zu Block 503 zurück.
-
Gemäß der Teilroutine 419 werden
folglich die Zwischenbereiche 233, die in der Schlange 301 plaziert
sind, kontinuierlich verarbeitet, es sei denn, der Anwender stoppt
die Verarbeitung durch eine bestimmte Aktion, wobei das Dokumentenanalysesystem 100 geeignet
reagiert, um eine flexible Plattform für eine Dokumentenanalyse zu
liefern.
-
Die
vorliegende Erfindung liefert dem Benutzer mehrere unterschiedliche
Vorteile beim Analysieren von Dokumenten. Beispielsweise versieht
die vorliegende Erfindung einen Anwender über die Zwischenanalyse mit
einem schnellen Zugriff auf den Inhalt eines Dokuments, wobei der
Anwender ausgehend von dieser Zwischenanalyse die Analyse weiter führen kann,
damit dieselbe auf eine wirksame Art und Weise durchgeführt wird.
Falls beispielsweise der Anwender lediglich an einem spezifischen
Datentyp des Bereichs interessiert ist, wie z.B. Text, kann der
Anwender dann mit der Kenntnis, wie das Dokument tatsächlich aussieht,
Zwischenbereiche löschen,
die ansonsten zu Graphik- oder Photoverarbeitungsanwendungen geführt worden
wären.
Dies würde
die Zeitdauer einsparen, die das Dokumentenanalysesystem beim Durchführen einer
vollständigen Analyse
bezüglich
der unerwünschten
Graphik ansonsten aufgewendet hätte.
Folglich spart die vorliegende Erfindung Zeit und Aufwand, die bei
der Analyse von Dokumenten aufgewendet werden müssen.
-
Zusätzlich zeigen
die Flußdiagramme
von 4-7 die Architektur, Funktionalität und Funktionsweise
einer möglichen
Implementierung der Dokumentenanalyselogik 170 (1).
In dieser Hinsicht stellt jeder Block ein Modul, ein Segment oder einen
Teil eines Codes dar, der eine oder mehrere ausführbare Anweisungen zum Implementieren
der spezifischen logischen Funktion(en) aufweist. Es sollte beachtet
werden, daß bei
einigen alternativen Implementierungen die Funktionen, die in den
Blöcken
dargestellt sind, in einer anderen als in der in 4-7 dargestellten
Reihenfolge auftreten können.
Beispielsweise können
zwei Blöcke,
die in 4-7 aufeinanderfolgend gezeigt
sind, tatsächlich
im wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können manchmal
in der umgekehrten Reihenfolge ausgeführt werden, wobei dies im folgenden
weiter klargestellt werden wird.
-
Die
Dokumentenanalyselogik 170, die vorzugsweise eine geordnete
Auflistung von ausführbaren
Anweisungen zur Implementierung von Logikfunktionen aufweist, kann
in einem beliebi gen computerlesbaren Medium für eine Verwendung durch oder
in Verbindung mit einem Anweisungsausführungssystem, einer entsprechenden
Vorrichtung oder einem entsprechenden Gerät ausgeführt sein, wie z.B. einem computerbasierten
System, einem prozessorenthaltenden System oder einem anderen System,
das die Anweisungen aus dem Anweisungsausführungssystem, der Vorrichtung
oder dem Gerät abrufen
und die Anweisungen ausführen
kann. In dem Zusammenhang dieses Dokuments kann ein "computerlesbares
Medium" eine beliebige
Einrichtung sein, die das Programm für eine Verwendung durch oder
in Verbindung mit dem Anweisungsausführungssystem, der Vorrichtung
oder dem Gerät enthalten,
speichern, kommunizieren, verbreiten oder transportieren kann. Das
computerlesbare Medium kann beispielsweise ein elektronisches, magnetisches,
optisches, elektromagnetisches, Infrarot- oder Halbleitersystem,
eine entsprechende Vorrichtung, ein entsprechendes Gerät oder ein
entsprechendes Verbreitungsmedium sein, wobei dasselbe jedoch nicht
darauf begrenzt ist. Spezifischere Beispiele (eine nicht erschöpfende Liste)
der computerlesbaren Medien würden
folgendes umfassen: eine elektrische Verbindung (elektronisch) mit
einem oder mehreren Drähten,
eine tragbare Computerdiskette (magnetisch), einen Speicher mit
wahlfreiem Zugriff (RAM; magnetisch), einen Nur-Lese-Speicher (ROM; magnetisch),
einen löschbaren,
programmierbaren Nur-Lese-Speicher (EPROM oder Flash-Speicher; magnetisch),
eine optische Faser (optisch) und eine tragbare CDROM (optisch).
Es ist zu beachten, daß das
computerlesbare Medium sogar Papier oder ein anderes geeignetes
Medium sein könnte,
auf dem das Programm gedruckt ist, wenn das Programm beispielsweise über eine
optische Abtastung des Papiers oder des anderen Mediums elektronisch
erfaßt, daraufhin
kompiliert, interpretiert oder ansonsten auf eine geeignete Art
und Weise, wenn nötig,
verarbeitet und dann in einem Computerspeicher gespeichert werden
kann.