DE69421574T2 - Verfahren zum Definieren mehrerer Formulardefinitionsdatensätze - Google Patents

Verfahren zum Definieren mehrerer Formulardefinitionsdatensätze

Info

Publication number
DE69421574T2
DE69421574T2 DE69421574T DE69421574T DE69421574T2 DE 69421574 T2 DE69421574 T2 DE 69421574T2 DE 69421574 T DE69421574 T DE 69421574T DE 69421574 T DE69421574 T DE 69421574T DE 69421574 T2 DE69421574 T2 DE 69421574T2
Authority
DE
Germany
Prior art keywords
field
record
processor
character recognition
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69421574T
Other languages
English (en)
Other versions
DE69421574D1 (de
Inventor
Douglas W. Billings
Mark E. Burger
Louis M. Pindell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE69421574D1 publication Critical patent/DE69421574D1/de
Application granted granted Critical
Publication of DE69421574T2 publication Critical patent/DE69421574T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

    Verfahren zum Definieren mehrerer Formulardefinitionsdatensätze Der Erfindung zugrundeliegender allgemeiner Stand der Technik 1. Bereich der Technik
  • Die beschriebene Erfindung betrifft allgemein die Datenverarbeitung und insbesondere die Zeichenerkennung von Dokumentenformularen.
  • 2. Verwandte Patentschriften und Patentanmeldungen
  • Diese Patentanmeldung bezieht sich auf die ebenfalls anhängigen Europäischen Patentanmeldungen 93104766.6, die als Europäische Patentanmeldung EP 0565911-A veröffentlicht wurde, 93104767.4, die als Europäische Patentanmeldung EP 0565912-A veröffentlicht wurde 94105292.0 und die US-Patentschrift US 5140650-A.
  • 3. Stand der Technik
  • In digitalisierten Bildern enthaltene Daten können zu mehreren Zwecken und auf viele verschiedene Arten entnommen werden. Die Entnahme von Informationen aus Formularen setzt voraus, dass man die Arten und die Positionen der Daten kennt (Informationen über die "Felder" des Formulars hat). Derzeit haben die meisten formularverarbeitenden Anwendungen ihr eigenes Verfahren zur "Definition" von Formularen, und jedes Verfahren ist mit den anderen inkompatibel. In großen Bildsystemen, die mehrere unterschiedliche formularverarbeitende Anwendungen benutzen, muss jedes Formular für jede Anwendung getrennt definiert werden, was Zeit kostet und zu Uneinheitlichkeiten bei den Formulardefinitionen führt. Das hier vorgestellte Verfahren erzeugt Formulardefinitionen, die dann für fast jede formularverarbeitende Anwendung verwendet werden können.
  • Die US-Patentschrift 5 119 437 beschreibt einen tabellarischen Dokumentenlesedienst zur Erkennung von Zeichen auf einem tabellarischen Dokument. Es werden hier keine diversen OCR-Programme und keine Umwandlungsmittel zur Änderung von Datenformaten verwendet, und Felddefinitionen erhält man nur unter Verwendung eines ausgefüllten Formulars.
  • Die Europäische Patentanmeldung EP 0 463 471 beschreibt ein Bildverarbeitungssystem für dokumentarische Daten, das jedoch keine Möglichkeit zur Erzeugung und Verarbeitung einer Vielzahl von Formulardefinitionsdaten bietet.
  • Aufgaben der Erfindung
  • Es ist deshalb eine Aufgabe der Erfindung, eine Vielzahl von Formulardefinitions-Datensätzen zu erstellen, um zu ermöglichen, dass ein bestimmtes Dokumentenformular von einer entsprechenden Vielzahl von Zeichenerkennungsprogrammen gelesen werden kann.
  • Es ist eine weitere Aufgabe der Erfindung, eine Vielzahl von Formulardefinitions-Datensätzen in einer einzigen Arbeitssitzung zur Verwendung durch eine entsprechende Vielzahl von Zeichenerkennungsprogrammen zu erstellen.
  • Es ist eine weitere Aufgabe der Erfindung, eine Vielzahl von Formulardefinitions-Datensätzen auf verbesserte Weise zu erstellen, um zu ermöglichen, dass ein bestimmtes Dokumentenformular von einer entsprechenden Vielzahl von Zeichenerkennungsprogrammen gelesen werden kann.
  • Es ist eine weitere Aufgabe der Erfindung, die Änderung von Formulardefinitions-Datensätzen auf verbesserte Weise zu ermöglichen.
  • Zusammenfassung der Erfindung
  • Diese Aufgaben werden von der Erfindung, die in den Ansprüchen 1 und 2 näher bezeichnet ist, gelöst; Ausführungsformen der Erfindung sind in den abhängigen Ansprüchen beschrieben. Die Erfindung ist ein Verfahren, das dazu dient, in einer einzigen Arbeitssitzung eine Vielzahl von Formulardefinitions-Datensätzen für ein bestimmtes Hauptformular zu definieren und es einer entsprechenden Vielzahl von Zeichenerkennungsprogrammen zu ermöglichen, Markierungen und Zeichen zu lesen, mit denen ausgefüllte Exemplare des Formulars beschriftet werden.
  • Die Erfindung wird in einem Datenverarbeitungssystem ausgeführt, das einen ersten Prozessor enthält, der mit einem zweiten Prozessor verbunden ist. Der erste Prozessor enthält einen Dokumentenscanner, um ein Bild eines ursprünglichen Dokumentenformulars zu empfangen, das eine Vielzahl von Feldern hat, um das Formular mit Zeichen zu beschriften. Der zweite Prozessor enthält eine Vielzahl von Zeichenerkennungsprogrammen, wobei jedes Zeichenerkennungsprogramm einen entsprechenden Formulardefinitions-Datensatz verwendet, der aus einer Vielzahl von Felddefinitions-Datensätzen, einem für jedes der Vielzahl der Felder auf dem ursprünglichen Dokumentenformular, zusammengesetzt ist.
  • Ein erstes der Vielzahl der Zeichenerkennungsprogramme verwendet ein erstes Format für Formulardefinitions-Datensätze, und ein zweites der Vielzahl der Zeichenerkennungsprogramme verwendet ein zweites Format für Formulardefinitions-Datensätze.
  • Das Verfahren, das dazu dient, der Vielzahl der Zeichenerkennungsprogramme das Erkennen von Zeichen zu ermöglichen, mit denen eine ausgefüllte Version des Dokumentenformulars beschriftet ist, enthält den Schritt des Speicherns eines ersten Datenumwandlungsmittels in dem ersten Prozessor, um einen Feldattribut-Datensatz in das erste Format für einen Formulardefinitions-Datensatz umzuwandeln. Das Verfahren fährt fort, indem es ein zweites Datenumwandlungsmittel in dem ersten Prozessor speichert, um einen Feldattribut-Datensatz in das zweite Format für einen Formulardefinitions-Datensatz umzuwandeln. Das Verfahren fährt fort, indem es ein Bild des ursprünglichen Dokumentenformulars in den ersten Prozessor einscannt.
  • Das Verfahren fährt fort, indem es eine Vielzahl von Feldattribut-Datensätzen, einen für jedes der Vielzahl der Felder auf dem Formular, in dem ersten Prozessor definiert. Der Definitionsschritt enthält den Schritt des Empfangens eines Signals von einer Zeigereinheit, das eine Position eines ersten der Vielzahl der Felder auf dem Bild des ursprünglichen Dokumentenformulars anzeigt. Der Definitionsschritt fährt fort, indem er das Signal von der Zeigereinheit in Feldpositionsinformationen für das erste Feld umwandelt und sie in einem ersten Feldattribut-Datensatz speichert. Der Definitionsschritt fährt fort, indem er Attributinformationen für das erste Feld empfängt und sie in dem ersten Feldattribut-Datensatz speichert, wobei die Attributinformationen erwartete Datentypinformationen und erwartete Datenformatinformationen enthalten.
  • Dann fährt das Verfahren fort, indem es in dem ersten Prozessor eine erste Auswahl für das erste Zeichenerkennungsprogramm empfängt und auf das erste Datenumwandlungsmittel zugreift, um den ersten Feldattribut-Datensatz in einen ersten Formulardefinitions-Datensatz umzuwandeln, der das erste Format aufweist. Das Verfahren fährt fort, indem es in dem ersten Prozessor eine zweite Auswahl für das zweite Zeichenerkennungsprogramm empfängt und auf das zweite Datenumwandlungsmittel zugreift, um den ersten Feldattribut-Datensatz in einen zweiten Formulardefinitions-Datensatz umzuwandeln, der das zweite Format aufweist. Das Verfahren fährt fort, indem es den ersten und den zweiten Formulardefinitions-Datensatz an den zweiten Prozessor überträgt.
  • Wenn eine ausgefüllte Version des Dokuments der Zeichenerkennung unterzogen werden muss, fährt das Verfahren fort, indem es in dem zweiten Prozessor ein Bild einer ausgefüllten Version des Dokumentenformulars empfängt. Das Verfahren fährt fort, indem es die Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem zweiten Prozessor mit dem ersten der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des ersten Formulardefinitions-Datensatzes durchführt. Das Verfahren fährt fort, indem es die Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem zweiten Prozessor mit dem zweiten der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des zweiten Formulardefinitions-Datensatzes durchführt.
  • Das Verfahren schließt ab, indem es eine erste Zeichendarstellung von dem zweiten Prozessor unter Verwendung des ersten Zeichenerkennungsprogramms und eine zweite Zeichendarstellung von dem zweiten Prozessor unter Verwendung des zweiten Zeichenerkennungsprogramms ausgibt.
  • Bei einem weiteren Merkmal der Erfindung ist das erste Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in den ersten Formulardefinitions-Datensatz umzuwandeln, eine erste Rechnerprogramm-Unterroutine, die in dem ersten Prozessor gespeichert wird, und das zweite Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in den zweiten Formulardefinitions-Datensatz umzuwandeln, ist eine zweite Rechnerprogramm-Unterroutine, die in dem ersten Prozessor gespeichert wird.
  • Bei einem weiteren Merkmal der Erfindung ist das erste Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in den ersten Formulardefinitions-Datensatz umzuwandeln, eine erste Datenzuordnungstabelle, die in dem ersten Prozessor gespeichert wird, und das zweite Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in den zweiten Formulardefinitions-Datensatz umzuwandeln, ist eine zweite Datenzuordnungstabelle, die in dem ersten Prozessor gespeichert wird.
  • Ein weiteres Merkmal der Erfindung zeigt ein Editierfenster und ein Feldattributfenster auf einer Anzeigeeinheit in dem Prozessor an. Das Feldattributfenster stellt eine alphanumerische Anzeige von Feldattributen bereit, die Feldpositionskoordinaten einschließen. Das Editierfenster zeigt das Bild des Dokuments an und stellt eine grafische Darstellung eines Auswahlbereichs bereit, der als Antwort auf das Signal von der Zeigereinheit neben dem angezeigten Bild des Dokuments angeordnet und an einer Stelle im Editierfenster positioniert wird. Das Feldattributfenster zeigt eine alphanumerische Darstellung von Koordinaten der Position des Auswahlbereichs an. Das Merkmal speichert die Feldattribute, die im Feldattributfenster angezeigt werden, selektiv als der Feldattribut-Datensatz.
  • Bei einem weiteren Merkmal der Erfindung enthalten die Attribute des Weiteren den Feldnamen, die Feldbreite, die Feldhöhe, die maximale Zeichenzahl, die Segmentierung, die Ausrichtung, den Schwellenwert, die Kontextprüfung, den erforderlichen Status, den erforderlichen Wert, den Datentyp und die Schriftart.
  • Ein weiteres Merkmal der Erfindung speichert ein drittes Datenumwandlungsmittel in dem ersten Prozessor, um einen Feldattribut-Datensatz in eine geänderte Version des ersten Formats für einen Formulardefinitions-Datensatz umzuwandeln. Das dritte Datenumwandlungsmittel ersetzt das erste Datenumwandlungsmittel. Das Merkmal greift auf das dritte Datenumwandlungsmittel zu, um den ersten Feldattribut-Datensatz in einen ersten Formulardefinitions-Datensatz umzuwandeln, der die geänderte Version des ersten Formats aufweist.
  • Bei einem weiteren Merkmal der Erfindung ist das dritte Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in die geänderte Version des ersten Formulardefinitions-Datensatzes umzuwandeln, eine dritte Rechnerprogramm-Unterroutine, die in dem ersten Prozessor gespeichert wird.
  • Bei einem weiteren Merkmal der Erfindung enthält das erste Datenumwandlungsmittel des Weiteren ein Mittel, das dazu dient, den ersten Formulardefinitions-Datensatz in den Feldattribut- Datensatz zurückzuwandeln. Das Merkmal gibt den ersten Formulardefinitions-Datensatz ein, greift auf das erste Datenumwandlungsmittel zu, wandelt den ersten Formulardefinitions- Datensatz in den Feldattribut-Datensatz zurück, zeigt das Editierfenster und das Feldattributfenster auf der Anzeigeeinheit in dem ersten Prozessor an und zeigt eine alphanumerischen Anzeige von Feldattributen für den zurückgewandelten Feldattribut-Datensatz im Feldattributfenster an.
  • Ein weiteres Merkmal der Erfindung zeigt eine grafische Darstellung eines Auswahlbereichs im Editierfenster an, der als Antwort auf die Feldattribute für den zurückgewandelten Feldattribut-Datensatz an einer Stelle im Editierfenster positioniert wird.
  • Ein weiteres Merkmal der Erfindung führt einen Zeilensuchprozess in dem ersten Prozessor durch, um umschlossene Kästchen aufzufinden, die Felder in dem Bild des Dokuments darstellen, das im Editierfenster angezeigt wird. Das Merkmal stellt die Koordinaten der umschlossenen Kästchen fest, zeigt eine alphanumerische Anzeige der Koordinaten von mindestens einem der umschlossenen Kästchen im Feldattributfenster als Feldattribute an, die Feldpositionskoordinaten einschließen, und speichert selektiv die Feldattribute, die im Feldattributfenster angezeigt werden, als der Feldattribut-Datensatz.
  • Die sich ergebende Erfindung definiert in einer einzigen Arbeitssitzung eine Vielzahl von Formulardefinitions-Datensätzen für ein bestimmtes Hauptformular, um einer entsprechenden Vielzahl von Zeichenerkennungsprogrammen das Lesen von Markie rungen und Zeichen zu ermöglichen, mit denen ausgefüllte Exemplaren des Formulars beschriftet werden.
  • Beschreibung der Figuren
  • Diese und andere Aufgaben, Merkmale und Vorteile der Erfindung lassen sich mit Bezug auf die beiliegenden Figuren besser verstehen.
  • Fig. 1A ist ein Übersichtsdiagramm der Erfindung.
  • Fig. 1B und Fig. 1C sind Flussdiagramme des erfindungsgemäßen Gesamtverfahrens.
  • Fig. 1D ist ein Flussdiagramm der Einzelheiten des Schritts 522 von Fig. 1B.
  • Fig. 1E ist ein Flussdiagramm des Zurückwandlungsverfahrens.
  • Fig. 1F ist ein Flussdiagramm eines alternativen Verfahrens zur Durchführung des Schritts 522 von Fig. 1B, wobei ein Zeilensuchprozess verwendet wird.
  • Fig. 1G ist ein Flussdiagramm der Einzelheiten des Schritts 530 von Fig. 1C.
  • Fig. 1H ist ein Flussdiagramm der Einzelheiten des Schritts 532 von Fig. 1C.
  • Fig. 1I ist ein Flussdiagramm der Einzelheiten des Zurückwandlungsverfahrens von Fig. 1E.
  • Fig. 1J ist ein Flussdiagramm der Einzelheiten der Herstellung einer Verbindung zu einer benutzerdefinierten Unterroutine, um das Format eines Formulardefinitions-Datensatzes von Fig. 1H zu ändern.
  • Fig. 2 zeigt den Aufbau der Anzeige 200 für die in den Fig. 4 bis 8 und den Fig. 10 bis 12 gezeigten Beispiele.
  • Fig. 3 zeigt ein Beispiel für das Bitmap-Bild des zu definierenden Formulars.
  • Fig. 4 zeigt eine beispielhafte, erfindungsgemäße Erscheinungsform des Bildschirms 118 und des Inhalts des Anzeigepuffers 200 mit dem Editierfenster 109 und dem Feldattributfenster 111.
  • Fig. 5 zeigt ein Beispiel für das Aktionsfenstermenü "Editieren" 204 im Editierfenster 109.
  • Fig. 6 zeigt ein Beispiel für den Inhalt des Aktionsfenstermenüs "Anzeigen" 206 im Editierfenster 109.
  • Fig. 7 zeigt eine neu skalierte Ansicht des Bildes von Fig. 6 und den rechteckigen Bereich 230, der vom Benutzer mit der Maus festgelegt wurde, um die Position eines für das Dokumentenformular zu definierenden Feldes anzugeben.
  • Fig. 8 zeigt ein Beispiel für den Inhalt des Aktionsfenstermenüs "Erzeugen" 214.
  • Fig. 9 zeigt ein beispielhaftes Format für den Felddefinitions-Datensatz.
  • Fig. 10 zeigt ein Beispiel für den Inhalt des Aktionsfenstermenüs "Laden" 212.
  • Fig. 11 zeigt ein Beispiel für nicht in Überdeckung befindliche Felder, die aus einem bestehenden Formulardefinitions-Datensatz erzeugt wurden.
  • Fig. 12 zeigt ein Beispiel für die Überdeckungskorrektur der in Fig. 11 gezeigten Felder.
  • Erörterung der bevorzugten Ausführungsform
  • Fig. 1A ist ein Übersichtsdiagramm des Datenverarbeitungssystems, in dem die Erfindung Anwendung findet. Das System enthält einen Definitionsprozessor 100, der über das lokale Netz (LAN) 145 mit dem Erkennungsprozessor 150 verbunden ist. Der Definitionsprozessor 100 enthält einen Speicher 102, der mittels des Busses 115 mit der CPU 110, dem Scanner 112, dem Plattenlaufwerk 114 und dem LAN-Adapter 116 verbunden ist. Der Bus 115 lässt sich auch mit der Tastatur und dem Bildschirm 118 und einer Maus-Zeigereinheit 120 verbinden. Der Speicher 102 des Definitionsprozessors 100 enthält ein Formulardefinitions-Dienstprogramm 104, dessen Flussdiagramm in den Schritten 500 bis 534 in den Fig. 1B und 1C gezeigt ist, und einen Feldattribut-Datensatz 105.
  • Erfindungsgemäß ist im Speicher 102 ein Datensatz-Umwandlungsprogramm oder eine Datensatz-Umwandlungsliste 106 enthalten, das/die den Feldattribut-Datensatz 105 in den Formulardefini tions-Datensatz 190 umwandelt. Ebenso wandelt ein zweites Datensatz-Umwandlungsprogramm oder eine zweite Datensatz-Umwandlungsliste 106' den Feldattribut-Datensatz 105 in den Formulardefinitions-Datensatz 190' um. Darüber hinaus wandelt das dritte Datensatz-Umwandlungsprogramm oder die Datensatz-Umwandlungsliste 106 " den Feldattribut-Datensatz 105 in einen Formulardefinitions-Datensatz 190" um. Der Speicher 102 enthält auch einen Anzeigepuffer 200, in dem ein Editierbereich 109 und ein Feldattributbereich 111 zusammengesetzt und gespeichert werden können. Der Speicher 102 enthält auch ein Dokumentenbild-Bearbeitungsprogramm 117 und ein Betriebssystem 119. Die im Speicher 102 abgelegten Programme sind Folgen von ausführbaren Befehlen, die bei ihrer Ausführung in der CPU 110 die vorgesehenen, von den Programmen auszuführenden Funktionen ausführen.
  • Der Erkennungsprozessor 150 von Fig. 1A enthält den Speicher 152 und den Bus 175, der den LAN-Adapter 176, das Plattenlaufwerk 174, den Scanner 172, die CPU 170, die Tastatur und den Bildschirm 178 sowie die Maus-Zeigereinheit 180 verbindet. Der Speicher 152 des Erkennungsprozessors 150 enthält eine Kopie des Formulardefinitions-Datensatzes 190, der vom Definitionsprozessor 100 über das LAN 145 an ihn übertragen wurde. Ebenso enthält der Speicher 152 des Erkennungsprozessors 150 auch eine Kopie des Formulardefinitions-Datensatzes 190' und des Formulardefinitions-Datensatzes 190", die beide vom Definitionsprozessor 100 über das LAN 145 übertragen wurden. Im Speicher 152 ist auch ein erstes Erkennungsprogramm 162 enthalten, das vom Formulardefinitions-Datensatz 190 Gebrauch macht, um das Dokumentenformular zu lesen, wie in den Schritten 538 und 542 von Fig. 1C gezeigt ist. Im Speicher 152 ist ferner ein zweites Zeichenerkennungsprogramm 162' enthalten, das den zweiten Formulardefinitions-Datensatz 190' verwendet, um dasselbe Dokumentenformular zu lesen, wie in den Schritten 540 und 544 von Fig. 1C gezeigt ist. Darüber hinaus ist im Speicher 152 ein drittes Zeichenerkennungsprogramm 162" enthalten, das den dritten Formulardefinitions-Datensatz 190" verwendet, um dasselbe Dokumentenformular zu lesen. Im Speicher 152 sind auch das Dokumentenbild-Bearbeitungsprogramm 117 und das Betriebssystem 119 enthalten. Das im Speicher 152 abgelegte Rechnerprogramm besteht aus Folgen von ausführbaren Befehlen, die bei ihrer Ausführung in der CPU 170 die vorgesehenen, von den Programmen auszuführenden Funktionen ausführen. Der LAN-Adapter 116 des Definitionsprozessors 100 verbindet das LAN 145 mit dem LAN-Adapter 176 des Erkennungsprozessors 150. Die Zeichenerkennungsprogramme 162, 162' und 162" können in getrennten Prozessoren ausgeführt werden, die an das LAN 145 angeschlossen sind. In einer alternativen Ausführungsform können die beiden Prozessoren 100 und 150 zu einem Prozessor zusammengefasst werden.
  • Der Anzeigepuffer 200 des Speichers 102 ist in der in Fig. 2 gezeigten Weise angeordnet. Die Flussdiagramme der Fig. 1B bis 1J sind als Rechnerprogramme ausgeführt, bei denen es sich um Folgen von ausführbaren Befehlen handelt, die im Speicher 102 des Definitionsprozessors 100 abgelegt werden.
  • Die Fig. 1B und 1C sind Flussdiagramme des erfindungsgemäßen Gesamtverfahrens, die als ein auf den Prozessoren 100 und 150 lauffähiges Rechnerprogramm 104 ausgeführt werden können.
  • Fig. 1B führt die folgenden Schritte durch.
  • Schritt 500: Starten des Verfahrens, um der Vielzahl der Zeichenerkennungsprogramme das Erkennen von Zeichen zu ermöglichen, mit denen eine ausgefüllte Version des Dokumentenformulars beschriftet ist.
  • Schritt 510: Speichern eines ersten Datenumwandlungsmittels in dem ersten Prozessor 100, um einen Feldattribut-Datensatz in das erste Format für einen Formulardefinitions-Datensatz umzuwandeln.
  • Schritt 512: Speichern eines zweiten Datenumwandlungsmittels in dem ersten Prozessor 100, um einen Feldattribut-Datensatz in das zweite Format für einen Formulardefinitions-Datensatz umzuwandeln.
  • Schritt 514: Einscannen eines Bildes des ursprünglichen Dokumentenformulars in den ersten Prozessor mit dem Scanner 112.
  • Schritt 516: Definieren einer Vielzahl von Feldattribut-Datensätzen 105, einem für jedes der Vielzahl der Felder auf dem Formular, in dem ersten Prozessor 100.
  • Schritt 518: Der Definitionsschritt schließt die Schritte 520 bis 526 ein:
  • Schritt 520: Empfangen eines Zeigereinheit-Signals von der Maus 120, das eine Position eines ersten der Vielzahl der Felder auf dem Bild des ursprünglichen Dokumentenformulars anzeigt.
  • Schritt 522: Umwandeln des Signals von der Zeigereinheit in Feldpositionsinformationen für das erste Feld und Speichern der Informationen in einem ersten Feldattribut-Datensatz 105 (Fig. 1D oder Fig. 1F).
  • Schritt 524: Empfangen von Attributinformationen für das erste Feld von der Tastatur 118 und Speichern der Informationen in dem ersten Feldattribut-Datensatz 105 und
  • Schritt 526: Aufnehmen von erwarteten Datentypinformationen und erwarteten Datenformatinformationen in die Attributinformationen.
  • Der Schritt 526 schaltet zum Schritt 528 von Fig. 1C.
  • Fig. 1C führt die folgenden Schritte durch.
  • Schritt 528: Das Verfahren enthält des Weiteren die folgenden Schritte:
  • Schritt 530: Empfangen einer ersten Auswahl vom Benutzer für das erste Zeichenerkennungsprogramm 162 in dem ersten Prozessor 100 und Zugreifen auf das erste Datenumwandlungsmittel 106, um den ersten Feldattribut-Datensatz 105 in einen ersten Formulardefinitions-Datensatz 190 umzuwandeln, der das erste Format aufweist (Fig. 1G). Das Umwandlungsmittel 106 kann das in Fig. 1G gezeigte Datenumwandlungsprogramm sein.
  • Schritt 532: Empfangen einer zweiten Auswahl vom Benutzer für das zweite Zeichenerkennungsprogramm 162' in dem ersten Prozessor und Zugreifen auf das zweite Datenumwandlungsmittel 106', um den ersten Feldattribut-Datensatz 105 in einen zweiten Formulardefinitions-Datensatz 190' umzuwandeln, der das zweite Format aufweist (Fig. 1H). Das zweite Umwandlungsmittel 106' kann das in Fig. 1H gezeigte Datenumwandlungsprogramm sein.
  • Schritt 534: Übertragen des ersten Formulardefinitions-Datensatzes 190 und des zweiten Formulardefinitions- Datensatzes 190' an den zweiten Prozessor 150.
  • Schritt 536: Empfangen eines Bildes einer ausgefüllten Version des Dokumentenformulars vom Scanner 172 in dem zweiten Prozessor 150.
  • Schritt 538: Durchführen der Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem zweiten Prozessor 150 mit dem ersten (162) der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des ersten Formulardefinitions-Datensatzes 190 und
  • Schritt 540: Durchführen der Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem zweiten Prozessor 150 mit dem zweiten (162') der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des zweiten Formulardefinitions-Datensatzes 190'.
  • Schritt 542: Ausgeben einer ersten Zeichendarstellung von dem zweiten Prozessor 150 unter Verwendung des ersten Zeichenerkennungsprogramms 162 und
  • Schritt 544: Ausgeben einer zweiten Zeichendarstellung von dem zweiten Prozessor 150 unter Verwendung des zweiten Zeichenerkennungsprogramms 162'.
  • Fig. 1D ist ein Flussdiagramm der Einzelheiten des Schritts 522 von Fig. 1B, das als ein auf dem Prozessor 100 lauffähiges Rechnerprogramm 104 ausgeführt werden kann. Fig. 1D führt die folgenden Schritte durch.
  • Schritt 522: Umwandeln des Signals von der Zeigereinheit 120 in Feldpositionsinformationen für das erste Feld und Speichern der Informationen in einem ersten Feldattribut-Datensatz (von Fig. 1B).
  • Schritt 550: Anzeigen eines Editierfensters 109 und eines Feldattributfensters 111 auf einer Anzeigeeinheit 200 in dem ersten Prozessor 100 von Fig. 2.
  • Schritt 552: Bereitstellen einer alphanumerischen Anzeige von Feldattributen 222 im Feldattributfenster 111 von Fig. 2, welche die Feldpositionskoordinaten 221, 223, 225 und 227 einschließen.
  • Schritt 554: Anzeigen des Bilds des Dokuments im Editierfenster 109 und Bereitstellen einer grafischen Darstellung eines Auswahlbereichs 230 von Fig. 7, der als Antwort auf das vom Benutzer eingegebene Signal der Zeigereinheit 120 neben dem angezeig ten Bild des Dokuments angeordnet und an einer Stelle im Editierfenster 109 positioniert wird.
  • Schritt 556: Anzeigen einer alphanumerischen Darstellung von Koordinaten 221, 223, 225 und 227 der Position des Auswahlbereichs 230 im Feldattributfenster 111.
  • Schritt 558: Selektives Speichern der Feldattribute 221, 223, 225 und 227, die im dem Feldattributfenster 111 angezeigt werden, als der Feldattribut-Datensatz 105.
  • Fig. 1E ist ein Flussdiagramm des Zurückwandlungsverfahrens, das als Teil des auf dem Prozessor 100 lauffähigen Rechnerprogramms 104 oder 106 ausgeführt werden kann. Fig. 1E führt die folgenden Schritte durch.
  • Schritt 570: Starten des Zurückwandlungsverfahrens im Prozessor 100.
  • Schritt 571: Eingeben des ersten Formulardefinitions-Datensatzes 190.
  • Schritt 572: Zugreifen auf das erste Datenumwandlungsmittel 106.
  • Schritt 574: Zurückwandeln des ersten Formulardefinitions-Datensatzes 190 in den Feldattribut-Datensatz 105 (Fig. 1I). Diese Zurückwandlung kann von dem in Fig. 1I gezeigten Programm durchgeführt werden.
  • Schritt 576: Anzeigen des Editierfensters 109 und des Feldattributfensters 111 auf der Anzeigeeinheit in dem ersten Prozessor 100.
  • Schritt 578: Anzeigen einer alphanumerischen Anzeige von Feldattributen 222 für den zurückgewandelten Feldattribut-Datensatz 105 im Feldattributfenster 111.
  • Schritt 580: Anzeigen einer grafischen Darstellung eines Auswahlbereichs 230 im Editierfenster 109, der als Antwort auf die Feldattribute 221, 223, 225 und 227 für den zurückgewandelten Feldattribut-Datensatz 105 an einer Stelle im Editierfenster 109 positioniert wird.
  • Fig. 1F ist ein Flussdiagramm eines alternativen Verfahrens zur Durchführung des Schritts 522 von Fig. 1B unter Verwendung eines Zeilensuchprozesses, der in der vorstehend in Bezug genommenen Patentschrift von Casey u. a. beschrieben ist, das als ein auf dem Prozessor 100 lauffähiges Rechnerprogramm 104 ausgeführt werden kann. Fig. 1F führt die folgenden Schritte durch.
  • Schritt 522: Umwandeln des Signals von der Zeigereinheit 120 in Feldpositionsinformationen für das erste Feld und Speichern der Informationen in einem ersten Feldattribut-Datensatz 105 (von Fig. 1B).
  • Schritt 590: Durchführen eines Zeilensuchprozesses in dem ersten Prozessor 100, um einzelbitweise gespeicherte Bilder von horizontalen und vertikalen Linien aufzufinden, die Kästchen umschließen, welche Felder in dem einzelbitweise gespeicherten Bild des Dokuments darstellen, das im Editierfenster 109 angezeigt wird.
  • Schritt 592: Feststellen der Koordinaten der umschlossenen Kästchen als Schnittpunkte der im Schritt 590 gefundenen horizontalen und vertikalen Linien.
  • Schritt 594: Anzeigen einer alphanumerischen Anzeige der Koordinaten von mindestens einem der umschlossenen Kästchen im Feldattributfenster 111 als Feldattribute, die Feldpositionskoordinaten einschließen.
  • Schritt 596: selektives Speichern der Feldattribute, die im Feldattributfenster angezeigt werden, als der Feldattribut-Datensatz 105.
  • Schritt 598: Anzeigen einer grafischen Darstellung 230 von mindestens einem der umschlossenen Kästchen im Editierfenster 109 an einer Stelle, die von den Feldpositionskoordinaten des Schritts 592 festgelegt wird.
  • Fig. 1G ist ein Flussdiagramm der Einzelheiten des Schritts 530 von Fig. 1C, des Datenumwandlungsmittels 106, das als ein auf dem Prozessor 100 lauffähiges Rechnerprogramm 106 ausgeführt werden kann. Fig. 1G führt die folgenden Schritte durch.
  • Schritt 530: Empfangen einer ersten Auswahl für das erste Zeichenerkennungsprogramm 162 in dem ersten Pro zessor 100 und Zugreifen auf das erste Datenumwandlungsmittel 106, um den ersten Feldattribut- Datensatz 105 in einen ersten Formulardefinitions-Datensatz 190 umzuwandeln, der das erste Format aufweist (von Fig. 1C).
  • Schritt 600: Das Zeichenerkennungsprogramm-A 162 wurde ausgewählt.
  • Schritt 602: Eine Verzweigung zur Unterroutine-A 106 des Rechnerprogramms vornehmen, um den Feldattribut- Datensatz 105 in den Formulardefinitions-Datensatz 190 mit dem Format-A umzuwandeln.
  • Schritt 604: Mit dem ersten Feld des Formulars beginnen
  • Schritt 606: Zugreifen auf den Feldattribut-Datensatz 105 für das Feld
  • Schritt 608: Abrufen der Werte vom Feldattribut-Datensatz für
  • Feldposition
  • Feldnamen
  • Feldbreite
  • Feldhöhe
  • maximale Zeichenzahl
  • Segmentierung
  • Ausrichtung
  • Schwellenwert
  • Kontextprüfung
  • erforderlichen Status
  • erforderlichen Wert
  • Datentyp
  • Schriftart
  • Schritt 610: Umwandeln der Feldposition in die Feldposition des Format-A
  • Umwandeln des Feldnamens in den Feldnamen des Format-A
  • Umwandeln der Feldbreite in die Feldbreite des Format-A
  • Umwandeln der Feldhöhe in die Feldhöhe des Format-A
  • Umwandeln der maximalen in die maximale Zeichenzahl Zeichenzahl des Format-A
  • Umwandeln der Segmentierung in die Segmentierung des Format-A
  • Umwandeln der Ausrichtung in die Ausrichtung des Format-A
  • Umwandeln des Schwellenwerts in den Schwellenwert des Format-A
  • Umwandeln der Kontextprüfung in die Kontextprüfung des Format-A
  • Umwandeln des erforderlichen Status in den erforderlichen Status des Format-A
  • Umwandeln des erforderlichen Werts in den erforderlichen Wert des For mat-A
  • Umwandeln des Datentyps in den Datentyp des Format-A
  • Umwandeln der Schriftart in die Schriftart des Format-A
  • Schritt 612: Speichern des Felddefinitions-Datensatzes mit dem Format-A für dieses Feld
  • Schritt 614: Weitere Felder? Wenn JA, springe zum Schritt 606, andernfalls zum Schritt 616.
  • Schritt 616: Ausgeben aller Felddefinitions-Datensätze mit dem Format-A als Formulardefinitions-Datensatz 190 mit dem Format-A für das Zeichenerkennungsprogramm-A 162.
  • Fig. 1H ist ein Flussdiagramm der Einzelheiten des Schritts 532 von Fig. 1C, des Datenumwandlungsmittels 106', das als ein auf dem Prozessor 100 lauffähiges Rechnerprogramm 106' ausgeführt werden kann. Fig. 1H führt die folgenden Schritte durch.
  • Schritt 532: Empfangen einer zweiten Auswahl für das zweite Zeichenerkennungsprogramm 162' in dem ersten Prozessor 100 und Zugreifen auf das zweite Datenumwandlungsmittel 106', um den ersten Feldat tribut-Datensatz 105 in einen zweiten Formulardefinitions-Datensatz 190' umzuwandeln, der das zweite Format aufweist (von Fig. 1C).
  • Schritt 700: Das Zeichenerkennungsprogramm-B 162' wurde ausgewählt.
  • Schritt 702: Eine Verzweigung zur Unterroutine-B 106' des Rechnerprogramms vornehmen, um den Feldattribut- Datensatz 105 in den Formulardefinitions-Datensatz 190' mit dem Format-B umzuwandeln.
  • Schritt 704: Mit dem ersten Feld des Formulars beginnen
  • Schritt 706: Zugreifen auf den Feldattribut-Datensatz 105 für das Feld
  • Schritt 708: Abrufen der Werte vom Feldattribut-Datensatz für
  • Feldposition
  • Feldnamen
  • Feldbreite
  • Feldhöhe
  • Datentyp
  • Schriftart
  • Schritt 710: Umwandeln der Feldposition in die Feldposition des Format-B
  • Umwandeln des Feldnamens in den Feldnamen des Format-B
  • Umwandeln der Feldbreite in die Feldbreite des Format-B
  • Umwandeln der Feldhöhe in die Feldhöhe des Format-B
  • Umwandeln des Datentyps in den Datentyp des Format-B
  • Umwandeln der Schriftart in die Schriftart des Format-B
  • Schritt 711: Herstellen einer Verbindung zur Unterroutine-B" (Fig. 1J) für alle benutzerdefinierten Änderungen am Format-B
  • Schritt 712: Speichern des Felddefinitions-Datensatzes mit dem Format-B für dieses Feld
  • Schritt 714: Weitere Felder? Wenn JA, springe zum Schritt 706, andernfalls zum Schritt 716.
  • Schritt 716: Ausgeben aller Felddefinitions-Datensätze mit dem Format-B als Formulardefinitions-Datensatz 190' mit dem Format-B für das Zeichenerkennungsprogramm-B 162'.
  • Fig. 11 ist ein Flussdiagramm der Einzelheiten des Zurückwandlungsverfahrens von Fig. 1E, das als Teil des auf dem Prozessor 100 lauffähigen Rechnerprogramms 106 ausgeführt werden kann. Fig. 11 führt die folgenden Schritte durch.
  • Schritt 574: Zurückwandeln des ersten Formulardefinitions- Datensatzes 190' in den Feldattribut-Datensatz 105 (von Fig. 1E).
  • Schritt 800: Auswählen des Formulardefinitions-Datensatzes 190' mit dem Format-B, um den in den ersten Prozessor 100 eingegebenen Formulardefinitions- Datensatz in die entsprechende Vielzahl der Feldattribut-Datensätze 105 zurückzuwandeln.
  • Schritt 802: Eine Verzweigung zur Unterroutine-B' 106' des Rechnerprogramms vornehmen, um den Formulardefinitions-Datensatz 190' mit dem Format-B in die Vielzahl der Feldattribut-Datensätze 105 zurückzuwandeln.
  • Schritt 804: Mit dem ersten Feld des Formulardefinitions-Datensatzes 190' beginnen.
  • Schritt 806: Zugreifen auf den Felddefinitions-Datensatz mit dem Format-B für das Feld.
  • Schritt 808: Abrufen der Werte vom Felddefinitions-Datensatz mit dem Format-B für
  • Feldposition des Format-B
  • Feldnamen des Format-B
  • Feldbreite des Format-B
  • Feldhöhe des Format-B
  • Datentyp des Format-B
  • Schriftart des Format-B
  • Schritt 810: Umwandeln der Feldposition des Format-B in die Feldposition
  • Umwandeln des Feldnamens des Format-B in den Feldnamen
  • Umwandeln der Feldbreite des Format-B in die Feldbreite
  • Umwandeln der Feldhöhe des Format-B in die Feldhöhe
  • Umwandeln des Datentyps des Format-B in den Datentyp
  • Umwandeln der Schriftart des Format-B in die Schriftart
  • Schritt 812: Speichern des Feldattribut-Datensatzes 105 für dieses Feld.
  • Schritt 814: Weitere Felder? Wenn JA, springe zum Schritt 806, andernfalls zum Schritt 576.
  • Schritt 576: Anzeigen des Editierfensters 109 und des Feldattributfensters 111 auf der Anzeigeeinheit 200 in dem ersten Prozessor 100.
  • Schritt 578: Anzeigen einer alphanumerischen Anzeige von Feldattributen 222 für den zurückgewandelten Feldattribut-Datensatz 105 im Feldattributfenster 111.
  • Schritt 580: Anzeigen einer grafischen Darstellung eines Auswahlbereichs 230 im Editierfenster 109, der als Antwort auf die Feldattribute für den zurückgewandelten Feldattribut-Datensatz 105 an einer Stelle im Editierfenster positioniert wird.
  • Fig. 1J ist ein Flussdiagramm der Einzelheiten der Herstellung einer Verbindung zu einer benutzerdefinierten Unterroutine, um das Format eines Formulardefinitions-Datensatzes von Fig. 1H zu ändern, das als ein auf dem Prozessor 100 lauffähiges Rechnerprogramm 104 ausgeführt oder vom Benutzer hinzugefügt werden kann, um den Formulardefinitions-Datensatz benutzerspezifisch anzupassen. Fig. 1J führt die folgenden Schritte durch.
  • Schritt 711: Herstellen einer Verbindung zur Unterroutine-B" für alle benutzerdefinierten Änderungen am Format-B (von Fig. 1H).
  • Schritt 900: Starten der Unterroutine-B" für benutzerdefinierte Änderungen am Format-B, die wahlweise entweder zum Schritt 902, zum Schritt 904 oder zum Schritt 906 schaltet.
  • Schritt 902: Beispiel 1: Keine Änderungen ZURÜCK
  • Schritt 904: Beispiel 2: "Schriftart in die Schriftart des Format-B umwandeln" in "Schriftart in die Schriftart Times Roman umwandeln" ändern ZURÜCK
  • Schritt 906: Beispiel 3: "Ausrichtung in die Ausrichtung des Format-B umwandeln" hinzufügen ZURÜCK
  • Fig. 2 zeigt den Aufbau der Anzeige 200 für die in den Fig. 4 bis 8 und den Fig. 10 bis 12 gezeigten Beispiele.
  • Fig. 3 zeigt das Bitmap-Bild des zu definierenden Formulars, des Formulars IRS 1040 für das Jahr 1988, das vom Scanner 112 abgescannt wurde. Diese Bitmap wurde vielleicht erstellt, indem ein Vordruck eines Formulars IRS 1040 für das Jahr 1988 abgescannt wurde.
  • Fig. 4 zeigt die Erscheinungsform des Bildschirms 118 und des Inhalts des Anzeigepuffers 200 mit dem Editierfenster 109 und dem Feldattributfenster 111 gemäß der Erfindung. Sie zeigt das im Bildbereich des Bildschirms angezeigte Formular IRS 1040 für das Jahr 1988 von Fig. 3. Die Bitmap wurde durch Auswahl des Menüpunkts "Bild laden" aus dem Aktionsfenstermenü "Datei" 203 geladen. Rechts befindet sich der Bereich "Feldattribute" 111 der Anzeige 200, der die Standardwerte für ein Feld enthält, da noch keine Felder definiert worden sind.
  • Fig. 5 zeigt das Aktionsfenstermenü "Editieren" 204 im Editierfenster 109. Die aktuellen Auswahlmöglichkeiten für das Aktionsfenstermenü "Editieren" sind:
  • - Rückgängig machen - die zuletzt durchgeführte Aktion rückgängig machen
  • - Feld definieren - mit der Definition von neuen Feldern in dem Bild beginnen
  • - Feld kopieren - ein bestehendes Feld kopieren
  • - Feld versetzen - ein bestehendes Feld versetzen
  • - Feld editieren - die Attribute eines bestehenden Feldes editieren
  • - Feld löschen - ein bestehendes Feld löschen
  • - Felder vertikal - alle Felder um einen gleichbleibenverschieben den Betrag verschieben
  • - Felder horizontal - alle Felder um einen gleichbleibenverschieben den Betrag verschieben
  • Um mit der Definition von Feldern zu beginnen, wählt der Bediener oder der Systemadministrator "Feld definieren" aus.
  • Fig. 6 zeigt den Inhalt des Aktionsfenstermenüs "Anzeigen" 206 im Editierfenster 109, das es dem Bediener ermöglicht, das Bild auf verschiedene Größen zu skalieren. Die Standardskalierung beträgt 33% (diese kann vom Bediener geändert werden) In diesem Szenario wählt der Bediener den Menüpunkt "Maßstab 50%" aus, der das Bild maßstäblich auf 50% vergrößert, und mit den Schiebeleisten, die den Bildbereich umgeben, rollt er zum oberen rechten Teil des Bildes. Das Ergebnis dieser Aktionen ist in Fig. 7 dargestellt, die den Bediener beim Abschluss der Definition des ersten Feldes in dem Bild zeigt, das dem Bereich "Ihre Sozialversicherungsnummer" im Bild von Fig. 3 entspricht. Der Bediener hat die Maus 120 zur Definition eines rechteckigen Kästchens 230 unter den Wörtern "Ihre Sozialversicherungsnummer" in dem Bild im Editierfenster 109 verwendet. Dies zeigt den Bereich des Bildes an, der erwartungsgemäß die Sozialversichungsnummer des Steuerzahlers enthalten soll. Die Erfindung hat die Koordinaten des rechteckigen Bereichs 230 automatisch in die Kästchen "x0" 221, "y0" 223, "Breite" 225 und "Höhe" 227 im Bereich 111 "Feldattribute" der Anzeige geladen. Das Kästchen 230 beginnt an der Pixelposition (1940, 338) und hat eine Breite von 432 Pixeln und eine Höhe von 52 Pixeln. Der Bediener hat dann in die Kästchen 222 "Feldattribute" rechts vom Bild wie folgt Daten eingegeben:
  • - Der Bediener hat das Feld in 219 "Ihre SVN" benannt.
  • - Der Bediener hat die maximale Zeichenzahl für dieses Feld in 229 auf 11 festgelegt (9 Ziffern sowie 2 Leerzeichen für die Sozialversicherungsnummer).
  • - Der Bediener hat in 231 angegeben, dass die Segmentierung für die Zeichen in dem Feld ohne Vorgabe ist, d. h., in dem Feld gibt es keine Kästchen, in die der Steuerzahler jedes Zeichen eingeben muss.
  • - Der Bediener hat in 233 die Ausrichtung des Feldes mit Bezug auf das Feld des Formulars auf 0 Grad festgelegt.
  • - Der Bediener hat den Schwellenwert der Zeichen im Feld 235 auf 0,99 festgelegt. Dieser Wert könnte von einer OCR/ICR- Anwendung dazu verwendet werden, den Erkennungsschwellenwert der Zeichen in diesem Feld zu setzen. Es ist wichtig, dass alle möglichen Zeichen markiert werden, deren sich die OCR/ICR-Anwendung vielleicht nicht sicher ist, so dass der Schwellenwert hoch gesetzt wird. Der Wert 0,99 kann zur Zurückweisung von Zeichen dienen, von denen man nicht mit 99-prozentiger Sicherheit sagen kann, dass sie richtig sind. Dies zwingt einen Bediener typischerweise dazu, das/die betreffende(n) Zeichen manuell einzugeben. Würde der Schwellenwert niedrig gesetzt werden, wäre die Wahrscheinlichkeit größer, dass die OCR/ICR-Anwendung möglicherweise einen Substitutionsfehler macht (beispielsweise eine "1" durch eine "7" ersetzt), was dazu führen würde, dass die Sozialversicherungsnummer des Steuerzahlers falsch erfasst würde.
  • - Der Bediener hat in 237 eine aktive Kontextprüfung für dieses Feld festgelegt. Die Kontextprüfung der OCR/ICR- Anwendung kann gegebenenfalls auf Feldebene durchgeführt werden, um die Erkennungsgenauigkeit zu verbessern. Bei einer Sozialversicherungsnummer zum Beispiel bewirkt die Kontextprüfung, dass die OCR/ICR-Anwendung 3 Ziffern, ein Leerzeichen, 2 Ziffern, ein Leerzeichen und 4 weitere Ziffern auszugeben versucht.
  • - Der Bediener hat in 239 angegeben, dass dieses Feld Daten enthalten muss. Bei einem auszufüllenden Formular IRS 1040 beispielsweise muss der Steuerzahler seine Sozialversicherungsnummer eingeben.
  • - Der Bediener hat in 241 des Weiteren den Inhalt der Daten, die in dieses Feld eingegeben werden müssen, angegeben. In den Klammern ist die Syntax einer gültigen Sozialversicherungsnummer enthalten: 3 Ziffern, ein Leerzeichen, 2 Zif fern, ein Leerzeichen und 4 weitere Ziffern. Falls die in diesem Feld erfassten Daten nicht dieses Format aufweisen, weist die Anwendung des Bedieners das ganze Formular gegebenenfalls zurück und veranlasst den Bediener, seinen Inhalt zu prüfen. Statt einer gültigen Syntax könnte der Bediener in 241 einen konstanten Wert eingeben, der vorhanden sein muss, wie zum Beispiel "1988", wenn das Feld als das das Gültigkeitsjahr des Formulars IRS 1040 ausweisende Feld festgelegt worden ist, das in Fig. 3 oberhalb des Adressteils des Formulars gezeigt ist.
  • - Zum Ende 245 springend, hat der Bediener die Schriftart für dieses Feld mit "Handschriftlich in Blockbuchstaben" festgelegt.
  • - Über dem Bild ist ein Dialogfenster 250 gezeigt, das erscheint, wenn der Bediener versucht hat, den Datentyp 243 für dieses Feld festzulegen. Für dieses Attribut (sowie für einige der anderen Attribute) gibt es eine festgelegte Gruppe von gültigen Werten. Um den Bediener dazu zu zwingen, einen gültigen Wert zu verwenden, zeigt die Erfindung immer ein Dialogfenster an, wenn der Bediener versucht, Daten für diese Attribute einzugeben oder zu ändern. Der im Feldattribut-Kästchen gezeigte Datentyp ist "Numerisch", der Standardwert. Hier ändert der Bediener gerade den Datentyp und hat "Konto" ausgewählt, das ein besonderer Datentyp für Kontenfelder ist. Die Anwendung des Bedieners kann den Datentyp "Konto" verwenden, um den gültigen Zeichensatz für Daten in diesem Feld anzugeben, der die Ziffern 0 bis 9 und außerdem Leerzeichen enthalten kann. Der Bediener wählt die Schaltfläche "OK" aus, um den Datentyp in "Konto" zu ändern.
  • Der Bediener wiederholt diesen Vorgang für alle Felder, die auf dem Formular definiert werden müssen. Um Zeit zu sparen, erhält die Erfindung die Attribute des zuvor definierten Feldes aufrecht, so dass der Bediener nur diejenigen Attribute ändern muss, die von dem vorherigen Feld abweichen. Die Erfindung gibt in 221 und 223 automatisch die Feldkoordinaten für jedes Feld ein. Die Erfindung kann in 219 auf Wunsch auch jedem Feld einen Standardnamen zuweisen.
  • Fig. 8 zeigt den Inhalt des Aktionsfenstermenüs "Erzeugen" 214. Der Inhalt dieses Menüs wird durch den später in diesem Schriftstück beschriebenen Prozess vom Bediener festgelegt. In diesem Szenario erzeugt der Bediener eine Datei "Project1 .fld", indem er den Menüpunkt "Datei Project1 .fld erzeugen" auswählt. Die Erfindung ruft dann die Unterroutine auf (die vom Bediener angegeben wird), um die Feldattribute in dem gewünschten Format zu formatieren. Fig. 9 zeigt den Inhalt der Datei "Project1 .fld", die auf diese Weise für das zuvor definierte Feld für die Sozialversicherungsnummer erzeugt wurde. Der Bediener hat angegeben, dass das Format der Datei "Project1 .fld" wie folgt sein soll:
  • Die erste Zeile der Datei enthält die Anzahl der definierten Felder, "1".
  • - Die folgenden Zeilen enthalten die Felddefinitionsdaten in folgendem Format:
  • - Name x0 y0 Breite Höhe Datentyp max Zeichen min Zeichen
  • Man beachte, dass der Datentyp anders ausgedrückt wird, ihm werden die Buchstaben "FPM ," vorangestellt, und er wird in Großbuchstaben geschrieben. Dies ist deshalb so, weil diese Datei die formularverarbeitende Hauptdatei für Project1 ist. Man beachte auch, dass die Unterroutine des Bedieners einen Standardwert von 1 schreibt, da die Ausführungsform der Erfindung, die das in Fig. 9 gezeigte Format erzeugt hat, dem Bediener derzeit nicht ermöglicht, die Mindestzahl von Zeichen in einem Feld zu definieren. Das Format dieser Ausgabedatei wird vom Bediener über eine von ihm geschriebene Unterroutine vollständig angegeben. Der Bediener kann auf Wunsch wahlweise alle Felder, ein Feld, eine gewisse Anzahl von Feldern oder dasselbe Feld n-mal ausgeben. Dies wird später ausführlicher beschrieben.
  • An dieser Stelle speichert der Bediener vielleicht den Inhalt der Felder in einer Datei. Dies geschieht durch Auswahl des Aktionsfenster-Menüpunktes "Speichern unter" aus dem Aktionsfenstermenü "Datei" 203, das in Fig. 4 dargestellt ist. Alle Feldattribute von allen Feldern werden in dieser Datei gespeichert.
  • Fig. 10 zeigt den Inhalt des Aktionsfenstermenüs "Laden" 212, das ebenfalls vom Bediener erstellt wird. Die Erfindung ermöglicht dem Bediener nicht nur die Erstellung von Ausgabedateien in einem bestimmten Format, sondern auch das Lesen von Dateien in einem bestimmten Format. Der Inhalt dieser Dateien wird in die Feldattribute 222 geladen und angezeigt. Die Erfindung ermöglicht dem Bediener, alle Editierfunktionen an den Feldern im Fenster 109 durchzuführen und den Inhalt der Felder dann entweder a) im internen Format der Erfindung, b) in dem Format, das eingelesen wurde, oder c) in einem beliebigen anderen Format zu speichern, das im Aktionsfenstermenü "Erzeugen" 214 zur Verfügung steht.
  • Das Szenario wechselt nun zu einem späteren Zeitpunkt, zu dem der Bediener die Position der Felder, die zuvor für ein Feld definiert wurden, prüft. Dies kommt eventuell vor, wenn die OCR/ICR-Ergebnisse ungünstiger sind als erwartet und möglicherweise anzeigen, dass die Felder nicht richtig positioniert sind. Der Bediener lädt zu diesem Zweck ein betreffendes Bild, bei dem es sich um ein Bild handeln kann, in dem der Formularhintergrund elektronisch entfernt wurde, so dass auf dem Formular nur die Daten übrig sind, die vom Benutzer eingegeben wurden. Die Anzeige 200 kann nun wie die in Fig. 11 aussehen. Hier werden die im Editierfenster 109 gezeigten Felder, die zuvor für das Formular definiert wurden, von ihren richtigen Positionen vertikal verschoben. Man beachte, dass die Koordinate "y0" 223 für das Feld "1040 1 L H1 V2" (die erste Zeile des Adresskästchens) den Wert "290" hat. Wie man sieht, werden alle Felder im Editierfenster 109 um denselben Betrag verschoben. Um das Problem schnell zu beseitigen, wählt der Bediener aus dem Aktionsfenstermenü "Editieren" 204 den Menüpunkt "Felder vertikal verschieben" aus. Dies bewirkt, dass ein Dialogfenster erscheint (wie in Fig. 11 gezeigt ist) und den Bediener auffordert, den Betrag der vertikalen Verschiebung mit der Maus 120 anzugeben. Der Bediener kann dann auf das Bild klicken, die Maus um die gewünschte vertikale Verschiebung bewegen und die Maus dann loslassen. Die Erfindung verschiebt dann alle Felder auf dem Bild um diesen Betrag.
  • Fig. 12 zeigt die neue Position der Felder mit Bezug auf das Bild im Editierfenster 109. Wie man sieht, sind die Felder nun richtig zu den Daten auf dem Bild ausgerichtet. Man beachte, dass die Koordinate "y0" 223 für dasselbe Feld jetzt den Wert 306 hat, was anzeigt, dass der Bediener das Feld um 16 Pixel nach unten verschoben hat. Alle anderen Attribute des Feldes bleiben gleich, wie in 222 zu sehen ist. An dieser Stelle kann der Bediener die Feldattribute speichern und/oder neue Felddefinitionsdateien erzeugen.
  • Die Tabellen 1, 2, 3 und 4 zeigen Felddefinitions-Musterdateien für die abgeschlossene Formulardefinition des Bildes. Tabelle 1 zeigt die Datei "Project1 .fld" in dem zuvor beschriebenen Format. Man beachte, dass das vierte Feld von oben die Feldattribute des zuvor beschriebenen Feldes "1040 1 L H1 V2" enthält, wobei die Koordinate y0 den Wert 306 hat. Tabelle 2 zeigt eine Felddefinitions-Musterdatei für das Dateiformat "CharReco1 .zlf", die zur Verarbeitung dieses Bildes mit einem Produkt eines beliebigen Produktlieferanten verwendet werden kann. Tabelle 3 zeigt eine Felddefinitions-Musterdatei für das Dateiformat "FormReco1 box", die zur Verarbeitung des Bildes mit der ersten Formularerkennungssoftware von IBM verwendet werden kann. Tabelle 4 zeigt eine Felddefinitions-Musterdatei für das Dateiformat "CharReco2 .flf", die zur Verarbeitung des Bildes mit der zweiten Zeichenerkennungssoftware von IBM verwendet werden kann.
  • Man beachte, dass bei diesen vier verschiedenen Ausführungen der Erkennungssoftware nur eine kleine Gruppe von Feldattributen notwendig ist, um ein Bild zu verarbeiten. Die Erfindung enthält all diese Attribute. In manchen Anwendungen können Standardwerte vorgesehen werden. In diesem letzten Fall hat sich der Bediener entschlossen, für die Mindestzahl von Zeichen einen Standardwert auszugeben. Sollte sich herausstellen, dass dieses Feldattribut von einer genügenden Zahl von Produk ten benötigt wird, kann die Erfindung auch erweitert werden, damit sie dieses Attribut einschließt.
  • Man beachte auch, dass die Erfindung die Angabe von Informationen über ein bestimmtes Formular ermöglicht. Zu diesen Informationen kann die Breite und die Höhe des Formulars, die Farbe der Tinte auf dem Formular, der Name und das Gültigkeitsjahr des Formulars usw. gehören.
  • Weitere Verbesserungen an der Erfindung schließen die folgenden ein:
  • - eine Option, die erzwingt, dass die vom Benutzer definierten rechteckigen Kästchen an einem Raster ausgerichtet werden
  • - eine Option, die es dem Bediener ermöglicht, die Feldattribute von allen Feldern sofort anzuzeigen und Daten einzugeben oder globale Änderungen vorzunehmen
  • - eine Option, mit der das Bild um 0, 90, 180 und 270 Grad gedreht werden kann
  • - eine Option, die es dem Bediener ermöglicht, die zulässigen Auswahlmöglichkeiten für ein Feld zu ändern (mit der er beispielsweise einen zusätzlichen Datentyp hinzufügen kann)
  • - eine Option, die es dem Bediener ermöglicht, ein neues Feldattribut hinzuzufügen
  • Die Fähigkeit der Erfindung, dem Bediener das Hinzufügen von Felddefinitions-Dateiformaten zu ermöglichen, wird nun beschrieben. Die Erfindung enthält zwei Teile: eine kompilierte Bibliothek, die den Code für die Fenstertechnik, den Editier-, den Bildbearbeitungs- und den Feldattributcode enthält, und eine "Einfügestelle" oder einen "Ausgang", die beziehungsweise der es dem Bediener ermöglicht, einen bestimmten, benutzerspezifischen Code beizufügen. Diese Einfügestelle ist im Schritt 711 von Fig. 1H gezeigt, die eine Verbindung zur Unterroutine B" von Fig. 1J herstellt, welche den vom Benutzer definierten angepassten Code enthält. Geeignete Aktionsfenster-Menüpunkte für die Aktionsfenstermenüs "Laden" und "Erzeugen" können auch zur Verfügung gestellt werden. Der Bediener hat die Möglichkeit, Code hinzuzufügen, der den Menüpunkt erstellt und die Unterroutine angibt, die aufgerufen werden muss, wenn dieser Menüpunkt ausgewählt wird. Die Unterroutine, die aufgerufen werden muss, ist diejenige, welche die Daten in dem gewünschten neuen Format formatiert. Um beispielsweise eine Datei "Project1 .fld" zu laden,
  • - fügt der Bediener eine Codezeile hinzu, um ein Dateiauswahlfenster für die Dateien "*.fld" (alle Dateien mit der Dateinamenerweiterung ".fld") zu öffnen. Dieses Fenster ruft dann die Unterroutine "load Project1()" auf.
  • Um beispielsweise eine benutzerspezifisch angepasste Datei "Project1 .fld" zu erzeugen, muss der Bediener zuerst eine Unterroutine schreiben, die das Dateiformat "Project1 .fld" aus dem zur Verfügung gestellten Feld und den zur Verfügung gestellten Formularattributen erstellt. Der Bediener fügt dann zum Aktionsfenstermenü "Erzeugen" einen Menüpunkt hinzu und gibt an, dass die neue Unterroutine aufgerufen werden soll, wenn dieser Menüpunkt ausgewählt wird. Der Prozess der Hinzufügung von neuen Dateiformaten wird abgeschlossen, indem die Bibiliothek der Erfindung mit dem Code für die Fenstertechnik, dem Editier-, Bildbearbeitungs- und Feldattributcode erneut mit dem Lade- und Erzeugungscode des Bedieners verknüpft wird.
  • Die sich hieraus ergebende Erfindung stellt eine Vielzahl von Formulardefinitions-Datensätzen bereit, um zu ermöglichen, dass ein bestimmtes Dokumentenformular von einer entsprechenden Vielzahl von Zeichenerkennungsprogrammen gelesen werden kann. Die Erfindung ermöglicht einem Benutzer, in einer einzigen Arbeitssitzung auf eine benutzerfreundliche Weise eine Vielzahl von Formulardefinitions-Datensätzen zu erstellen.
  • Obgleich eine bestimmte Ausführungsform der Erfindung beschrieben wurde, versteht es sich für den Fachmann von selbst, dass an dieser bestimmten Ausführungsform Änderungen vorgenommen werden können, ohne vom Umfang der Erfindung abzuweichen. Tabelle 1 (Teil 1 von 2) Tabelle 1 (Teil 2 von 2) Tabelle 2 (Teil 1 von 2) Tabelle 2 (Teil 2 von 2) Tabelle 3 (Teil 1 von 2) Tabelle 3 (Teil 2 von 2) Tabelle 4 (Teil 1 von 2) Tabelle 4 (Teil 2 von 2)

Claims (11)

1. In einem Datenverarbeitungssystem, das ein Prozessormittel enthält, um ein Bild eines ursprünglichen Dokumentenformulars zu empfangen, wobei das Dokumentenformular eine Vielzahl von Feldern hat, um das Formular mit Zeichen zu beschriften, wobei das Prozessormittel eine Vielzahl von Zeichenerkennungsprogrammen enthält, wobei jedes Zeichenerkennungsprogramm einen entsprechenden Formulardefinitions-Datensatz verwendet, der aus einer Vielzahl von Felddefinitions-Datensätzen, einem für jedes der Vielzahl der Felder auf dem ursprünglichen Dokumentenformular, besteht, wobei ein erstes der Vielzahl der Zeichenerkennungsprogramme ein erstes Format für Formulardefinitions- Datensätze und ein zweites der Vielzahl der Zeichenerkennungsprogramme ein zweites Format für Formulardefinitions- Datensätze verwendet, ein Verfahren, das dazu dient, der Vielzahl der Zeichenerkennungsprogramme das Erkennen von Zeichen zu ermöglichen, mit denen eine ausgefüllte Version des Dokumentenformulars beschriftet wird, wobei das Verfahren die folgenden Schritte umfasst:
Speichern eines ersten Datenumwandlungsmittels in dem Prozessormittel, um einen Feldattribut-Datensatz in das erste Format für einen Formulardefinitions-Datensatz umzuwandeln;
Speichern eines zweiten Datenumwandlungsmittels in dem Prozessormittel, um einen Feldattribut-Datensatz in das zweite Format für einen Formulardefinitions-Datensatz umzuwandeln;
Eingeben eines Bildes des ursprünglichen Dokumentenformulars in das Prozessormittel;
Definieren einer Vielzahl von Feldattribut-Datensätzen, einem für jedes der Vielzahl der Felder auf dem Formular, in dem Prozessormittel;
Empfangen eines Signals in dem Definitionsschritt, das eine Position eines ersten der Vielzahl der Felder auf dem Bild des ursprünglichen Dokumentenformulars anzeigt;
in dem Definitionsschritt Umwandeln des Signals in Feldpositionsinformationen für das erste Feld und Speichern der Informationen in einem ersten Feldattribut-Datensatz;
in dem Prozessormittel Empfangen einer ersten Auswahl für das erste Zeichenerkennungsprogramm und Zugreifen auf das erste Datenumwandlungsmittel, um den ersten Feldattribut- Datensatz in einen ersten Formulardefinitions-Datensatz umzuwandeln, der das erste Format aufweist;
in dem Prozessormittel Empfangen einer zweiten Auswahl für das zweite Zeichenerkennungsprogramm und Zugreifen auf das zweite Datenumwandlungsmittel, um den ersten Feldattribut- Datensatz in einen zweiten Formulardefinitions-Datensatz umzuwandeln, der das zweite Format aufweist;
in dem Prozessormittel Empfangen eines Bildes einer ausgefüllten Version des Dokumentenformulars;
Durchführen der Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem Prozessormittel mit dem ersten der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des ersten Formulardefinitions-Datensatzes und
Durchführen der Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem Prozessormittel mit dem zweiten der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des zweiten Formulardefinitions-Datensatzes;
Ausgeben einer ersten Zeichendarstellung von dem Prozessormittel unter Verwendung des ersten Zeichenerkennungsprogramms; und
Ausgeben einer zweiten Zeichendarstellung von dem Prozessormittel unter Verwendung des zweiten Zeichenerkennungsprogramms.
2. In einem Datenverarbeitungssystem, das einen ersten Prozessor enthält, der mit einem zweiten Prozessor verbunden ist, wobei der erste Prozessor einen Dokumentenscanner enthält, um ein Bild eines ursprünglichen Dokumentenformulars zu empfangen, das eine Vielzahl von Feldern hat, um das Formular mit Zeichen zu beschriften,
wobei der zweite Prozessor eine Vielzahl von Zeichenerkennungsprogrammen enthält, wobei jedes Zeichenerkennungsprogramm einen entsprechenden Formulardefinitions-Datensatz verwendet, der aus einer Vielzahl von Felddefinitions- Datensätzen, einem für jedes der Vielzahl der Felder auf dem ursprünglichen Dokumentenformular, zusammengesetzt ist,
wobei ein erstes der Vielzahl der Zeichenerkennungsprogramme ein erstes Format für Formulardefinitions-Datensätze verwendet und
ein zweites der Vielzahl der Zeichenerkennungsprogramme ein zweites Format für Formulardefinitions-Datensätze verwendet,
ein Verfahren, das dazu dient, der Vielzahl der Zeichenerkennungsprogramme das Erkennen von Zeichen zu ermöglichen, mit denen eine ausgefüllte Version des Dokumentenformulars beschriftet wird, wobei das Verfahren die folgenden Schritte umfasst:
Speichern eines ersten Datenumwandlungsmittels in dem ersten Prozessor, um einen Feldattribut-Datensatz in das erste Format für einen Formulardefinitions-Datensatz umzuwandeln;
Speichern eines zweiten Datenumwandlungsmittels in dem ersten Prozessor, um einen Feldattribut-Datensatz in das zweite Format für einen Formulardefinitions-Datensatz umzuwandeln;
Einscannen eines Bildes des ursprünglichen Dokumentenformulars in den ersten Prozessor;
Definieren einer Vielzahl von Feldattribut-Datensätzen, einem für jedes der Vielzahl der Felder auf dem Formular, in dem ersten Prozessor;
wobei der Definitionsschritt Folgendes umfasst:
Empfangen eines Zeigereinheit-Signals, das eine Position eines ersten der Vielzahl der Felder auf dem Bild des ursprünglichen Dokumentenformulars anzeigt;
Umwandeln des Zeigereinheit-Signals in Feldpositionsinformationen für das erste Feld und Speichern der Informationen in einem ersten Feldattribut-Datensatz;
Empfangen von Attributinformationen für das erste Feld und Speichern der Informationen in dem ersten Feldattribut- Datensatz; und
wobei die Attributinformationen erwartete Datentypinformationen und erwartete Datenformatinformationen enthalten;
wobei das Verfahren des Weiteren die folgenden Schritte umfasst:
in dem ersten Prozessor Empfangen einer ersten Auswahl für das erste Zeichenerkennungsprogramm und Zugreifen auf das erste Datenumwandlungsmittel, um den ersten Feldattribut- Datensatz in einen ersten Formulardefinitions-Datensatz umzuwandeln, der das erste Format aufweist;
in dem ersten Prozessor Empfangen einer zweiten Auswahl für das zweite Zeichenerkennungsprogramm und Zugreifen auf das zweite Datenumwandlungsmittel, um den ersten Feldattribut-Datensatz in einen zweiten Formulardefinitions- Datensatz umzuwandeln, der das zweite Format aufweist;
Übertragen des ersten und des zweiten Formulardefinitions- Datensatzes an den zweiten Prozessor;
in dem zweiten Prozessor Empfangen eines Bildes einer ausgefüllten Version des Dokumentenformulars;
Durchführen der Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem zweiten Prozessor mit dem ersten der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des ersten Formulardefinitions-Datensatzes und
Durchführen der Zeichenerkennung auf der ausgefüllten Version des Dokuments in dem zweiten Prozessor mit dem zweiten der Vielzahl der Zeichenerkennungsprogramme unter Verwendung des zweiten Formulardefinitions-Datensatzes;
Ausgeben einer ersten Zeichendarstellung von dem zweiten Prozessor unter Verwendung des ersten Zeichenerkennungsprogramms; und
Ausgeben einer zweiten Zeichendarstellung von dem zweiten Prozessor unter Verwendung des zweiten Zeichenerkennungsprogramms.
3. Verfahren nach Anspruch 1 oder 2, das des Weiteren Folgendes umfasst:
das erste Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in den ersten Formulardefinitions- Datensatz umzuwandeln, ist eine erste Datenzuordnungstabelle und/oder eine erste Rechnerprogramm-Unterroutine, die in dem Prozessormittel gespeichert wird, und
das zweite Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in den zweiten Formulardefinitions- Datensatz umzuwandeln, ist eine zweite Datenzuordnungstabelle und/oder eine zweite Rechnerprogramm-Unterroutine, die in dem Prozessormittel gespeichert wird.
4. Verfahren nach einem der vorstehenden Ansprüche, wobei der Definitionsschritt des Weiteren Folgendes umfasst:
Anzeigen eines Editierfensters und eines Feldattributfensters auf einer Anzeigeeinheit in dem Prozessormittel;
wobei das Feldattributfenster eine alphanumerische Anzeige von Feldattributen bereitstellt, die Feldpositionskoordinaten einschließen;
wobei das Editierfenster das Bild des Dokuments anzeigt und eine grafische Darstellung eines Auswahlbereichs bereitstellt, der als Antwort auf das Signal neben dem angezeigten Bild des Dokuments angeordnet und an einer Stelle in dem Editierfenster positioniert wird;
wobei das Feldattributfenster eine alphanumerische Darstellung von Koordinaten der Position des Auswahlbereichs anzeigt;
selektives Speichern der Feldattribute, die in dem Feldattributfenster angezeigt werden, als der Feldattribut- Datensatz.
5. Verfahren nach einem der vorstehenden Ansprüche, wobei der Definitionsschritt des Weiteren Folgendes umfasst: die Attribute enthalten des Weiteren den Feldnamen, die Feldbreite, die Feldhöhe, die maximale Zeichenzahl, die Segmentierung, die Ausrichtung, den Schwellenwert, die Kontextprüfung, den erforderlichen Status, den erforderlichen Wert, den Datentyp und die Schriftart.
6. Verfahren nach einem der vorstehenden Ansprüche, das des Weiteren Folgendes umfasst:
Speichern eines dritten Datenumwandlungsmittels in dem Prozessormittel, um einen Feldattribut-Datensatz in eine geänderte Version des ersten Formats für einen Formulardefinitions-Datensatz umzuwandeln;
wobei das dritte Datenumwandlungsmittel das erste Datenumwandlungsmittel ersetzt;
Zugreifen auf das dritte Datenumwandlungsmittel, um den ersten Feldattribut-Datensatz in einen ersten Formulardefinitions-Datensatz umzuwandeln, der die geänderte Version des ersten Formats aufweist.
7. Verfahren nach Anspruch 6, das des Weiteren Folgendes umfasst: das dritte Datenumwandlungsmittel, das dazu dient, den Feldattribut-Datensatz in die geänderte Version des ersten Formulardefinitions-Datensatzes umzuwandeln, ist eine dritte Rechnerprogramm-Unterroutine, die in dem Prozessormittel gespeichert wird.
8. Verfahren nach einem der vorstehenden Ansprüche, das des Weiteren Folgendes umfasst:
das erste Datenumwandlungsmittel enthält des Weiteren ein Mittel, das dazu dient, den ersten Formulardefinitions- Datensatz in den Feldattribut-Datensatz zurückzuwandeln;
Eingeben des ersten Formulardefinitions-Datensatzes;
Zugreifen auf das erste Datenumwandlungsmittel;
Zurückwandeln des ersten Formulardefinitions-Datensatzes in den Feldattribut-Datensatz;
Anzeigen des Editierfensters und des Feldattributfensters auf der Anzeigeeinheit in dem Prozessormittel;
Anzeigen einer alphanumerischen Anzeige von Feldattributen für den zurückgewandelten Feldattribut-Datensatz in dem Feldattributfenster.
9. Verfahren nach Anspruch 8, das des Weiteren Folgendes umfasst: als Antwort auf die Feldattribute für den zurückgewandelten Feldattribut-Datensatz Anzeigen einer grafischen Darstellung eines Auswahlbereichs in dem Editierfenster, der an einer Stelle in dem Editierfenster positioniert ist.
10. Verfahren nach einem der vorstehenden Ansprüche, das des Weiteren Folgendes umfasst:
das erste Datenumwandlungsmittel enthält des Weiteren ein Mittel, das dazu dient, den ersten Formulardefinitions- Datensatz in den Feldattribut-Datensatz zurückzuwandeln;
Eingeben des ersten Formulardefinitions-Datensatzes;
Zugreifen auf das erste Datenumwandlungsmittel;
Zurückwandeln des ersten Formulardefinitions-Datensatzes in den Feldattribut-Datensatz;
Anzeigen des Editierfensters und des Feldattributfensters auf der Anzeigeeinheit in dem Prozessormittel;
Anzeigen einer alphanumerischen Anzeige von Feldattributen für den zurückgewandelten Feldattribut-Datensatz in dem Feldattributfenster;
als Antwort auf die Feldattribute für den zurückgewandelten Feldattribut-Datensatz Anzeigen einer grafischen Darstellung eines Auswahlbereichs in dem Editierfenster, der an einer Stelle in dem Editierfenster positioniert ist.
11. Verfahren nach einem der vorstehenden Ansprüche, wobei der Definitionsschritt des Weiteren Folgendes umfasst:
Durchführen eines Zeilensuchprozesses in dem Prozessormittel, um umschlossene Kästchen aufzufinden, die Felder in dem Bild des Dokuments darstellen, das in dem Editierfenster angezeigt wird;
Feststellen der Koordinaten der umschlossenen Kästchen;
Anzeigen einer alphanumerischen Anzeige der Koordinaten von mindestens einem der umschlossenen Kästchen in dem Feldattributfenster als Feldattribute, die Feldpositionskoordinaten einschließen;
selektives Speichern der Feldattribute, die in dem Feldattributfenster angezeigt werden, als der Feldattribut- Datensatz.
DE69421574T 1993-08-02 1994-07-21 Verfahren zum Definieren mehrerer Formulardefinitionsdatensätze Expired - Lifetime DE69421574T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10084693A 1993-08-02 1993-08-02

Publications (2)

Publication Number Publication Date
DE69421574D1 DE69421574D1 (de) 1999-12-16
DE69421574T2 true DE69421574T2 (de) 2000-02-17

Family

ID=22281848

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69421574T Expired - Lifetime DE69421574T2 (de) 1993-08-02 1994-07-21 Verfahren zum Definieren mehrerer Formulardefinitionsdatensätze

Country Status (3)

Country Link
EP (1) EP0637811B1 (de)
JP (1) JP2641391B2 (de)
DE (1) DE69421574T2 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2830106B1 (fr) * 2001-07-13 2004-04-23 Alban Giroux Dispositif et procede de reconnaissance de structure de document

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
US5134669A (en) * 1990-06-13 1992-07-28 National Computer Systems Image processing system for documentary data

Also Published As

Publication number Publication date
DE69421574D1 (de) 1999-12-16
EP0637811A3 (de) 1996-04-10
JPH0757050A (ja) 1995-03-03
JP2641391B2 (ja) 1997-08-13
EP0637811B1 (de) 1999-11-10
EP0637811A2 (de) 1995-02-08

Similar Documents

Publication Publication Date Title
DE60219048T2 (de) Sektionsextrahierungswerkzeug für pdf-dokumente
DE3586273T2 (de) Implizite erzeugung einer superblockstruktur in einem vieldaten-edierungsgeraet.
DE3586274T2 (de) Vieldaten-edierungsgeraet mit gebrauch von attributstroemen fuer textobjekte.
DE3411939C2 (de)
DE3586272T2 (de) Integriertes vieldaten-edierungsgeraet.
DE69525243T2 (de) System zum binden von dokumentteilen und editoren in einer mensch-maschinen-schnittstelle
DE69903919T2 (de) System zum speichern der visuellen form von information aus einer anwendung in eine datenbank und zum wiederauffinden
DE69610882T2 (de) Blockselektionsystem, bei dem überlappende Blöcke aufgespaltet werden
DE69425607T2 (de) Selektive Einrichtung und Verfahren zur Dokumentenwiederauffindung.
DE69511786T2 (de) Zeichenerkennungsgerät und Verfahren zur Steuerung desselben
DE3714172C2 (de)
DE68927216T2 (de) System zur verwaltung von hierarchischen informationen in einem digitalen datenverarbeitungssystem
DE4216893C2 (de) Dateneingabeverfahren
DE10105941A1 (de) System und Verfahren zum automatischen Zuweisen eines Dateinamens zu einem gescannten Dokument
DE69327948T2 (de) Bereich-layout in einer Sicht auf einem grafischen Anzeigeschirm
DE10162156B4 (de) Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Verfahren
DE69317443T2 (de) Dateienumsetzungssystem
DE69133362T2 (de) Dokumentenverarbeitungs-verfahren und -gerät, entsprechende Program und Speichereinheit
EP1902407B1 (de) System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung
EP1669852B1 (de) Verfahren und Computerprogramm zum Umwandeln eines Eingangs-Dokumentendatenstroms mit einem oder mehreren Dokumenten in eine strukturierte Datendatei
DE68915847T2 (de) Tastatur-Umbelegung.
DE2818974A1 (de) Datenstation fuer datenverarbeitungsanlagen
EP1353276A2 (de) Drucken mit variablen Daten unter Verwendung einer dynamischen Ausschiessvorlage
DE69721887T2 (de) Koordinatenleser, Zustandsumwandlungsverfahren, Interfacegerät und zugehöriges Koordinaten-Lesesystem
DE69421326T2 (de) Verfahren und Gerät zum Steuern der Darstellungen von Objekten auf einer Benutzerschnittstelle eines Datenverarbeitungssystems

Legal Events

Date Code Title Description
8364 No opposition during term of opposition