DE69118970T2

DE69118970T2 - Bildverarbeitungssystem für dokumentarische Daten

Info

Publication number: DE69118970T2
Application number: DE69118970T
Authority: DE
Inventors: Gary J Gustafson; Kenneth M Keogh; John V Mcmillin
Original assignee: National Computer Systems Inc
Current assignee: National Computer Systems Inc
Priority date: 1990-06-13
Filing date: 1991-06-12
Publication date: 1996-11-28
Anticipated expiration: 2011-06-13
Also published as: KR920001359A; US5134669A; CA2044400A1; CA2044400C; JP3291302B2; EP0463471A3; EP0463471A2; DE69118970D1; JPH06149970A; EP0463471B1

Description

VERWANDTE ANMELDUNG

Diese Anmeldung ist mit einer anhängigen europäischen Patentanmeldung Nr. 91 109 601.4 (EP-A-0 461 622, offengelegt am 18. Dezember 1991) verwandt.

TECHNISCHES GEBIET

Die vorliegende Erfindung betrifft allgemein Vorrichtungen zum Abtasten optischer Markierungen, Vorrichtungen zur Zeichenerkennung sowie Vorrichtungen zum Abtasten sichtbarer Bilder. Genauer gesagt betrifft die vorliegende Erfindung ein Bildverarbeitungssystem, das dazu geeignet ist, abgetastete Bilder mit verschiedenen intelligenten Symbolerkennungs(ISR)-Einrichtungen unter Einschluß eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR- Lesers, eines Lesers für handgeschriebene numerische Daten und/oder eines Lesers für von Hand in Druckschrift geschriebene alphanumerische Daten zu erfassen und zu verarbeiten und ASCII- oder gleichwertige auf Zeichen beruhende alphanumerische Daten zu erzeugen (im folgenden als ISR-System für handgeschriebene Druckzeichen bezeichnet), und das weiterhin dazu geeignet ist, Pixelbilder zu erhalten und diese vielfältigen Formen von Daten und Bildern zu integrieren. Die vorliegende Erfindung ist demnach ein Informationsverarbeitungssystem, das auf Dokumenten aufgezeichnete Daten unter Verwendung von automatischen Symbolerkennungseinrichtungen sowie von Vorrichtungen zur Bearbeitung und zur Zusammenführung von Pixelbildern gewinnt.

TECHNISCHER HINTERGRUND

Vorrichtungen zum Abtasten optischer Markierungen (nachfolgend als optische Markierungslese- oder OMR-Systeme bezeichnet) sind im Stand der Technik wohlbekannt. Es gibt eine große Vielfalt von Anwendungen, bei denen OMR-Systeme und abtastbare Vordrucke bei umfangreichen Sammlungen einzelner, auf Dokumenten aufgezeichneter Informationsbestandteile verwendet werden (beispielsweise die Ergebnisse standardisierter Tests, Volkszählungsinformationen, Untersuchungen von Vorlieben usw.). OMR-Systeme lesen im allgemeinen unter Verwendung von Markierungen, die einen im nahen Infrarotbereich (NIR) absorbierenden Farbstoff enthalten (beispielsweise unter Verwendung eines Bleistifts oder eines anderen Graphit oder eine andere Form von Kohlenstoff enthaltenden Schreibwerkzeugs vorgenommene Markierungen) in bestimmten vorgewählten Feldern des Vordrucks aufgezeichnete Daten. Diese Daten sind in der Hinsicht lagekodiert, daß ihre Bedeutung, abhängig davon, wo die Daten auf dem zu ihrer Aufzeichnung verwendeten Formatvordruck eingetragen sind, ausgewertet wird. Dies wird als Abtasten im NIR-Modus bezeichnet. Ein wesentlicher Vorteil des Abtastens im NIR-Modus (oder eines anderen auf einer begrenzten spektralen Empfindlichkeit beruhenden Abtastens) liegt darin, daß es die Trennung der durch Antworten markierten veränderlichen Daten von den auf demselben Dokument enthaltenen Standard-Hintergrunddruckinformationen ermöglicht.
Wenngleich sie eine neuere Entwicklung sind, sind Vorrichtungen zum Abtasten sichtbarer Bilder (im folgenden als Abtastvorrichtungen im VIS-Modus oder VIS-Systeme bezeichnet) im Stand der Technik ebenfalls wohlbekannt. Die meisten Anwendungen für gegenwärtige VIS-Systeme haben sich aus dem Wunsch heraus entwickelt, traditionelle Mikrofilm-Bilderfassungssysteme zu ersetzen. Folglich konzentrieren sich gegenwärtige VIS-Systeme auf die Erfassung des gesamten abgetasteten Bildes eines Dokumentes gebenüber den von gegenwärtigen OMR-Systemen durchgeführten Tätigkeiten der Erfassung, der Auflösung dunkler Markierungen und der Verarbeitung einzelner, in vorbestimmten Feldern aufgezeichneter Informationsbestandteile.
Eine der Einschränkungen gegenwärtiger OMR-Systeme, die sich auf vorbestimmte Felder konzentrieren, liegt darin, daß sie die Umgebung der vorbestimmten Felder eines abtastbaren Vordrucks nicht abtasten oder wiedergeben können. Folglich ist die Abrufung und die Betrachtung oder die Druckwiedergabe der gespeicherten oder archivierten unbearbeiteten Einzelinformationen aus einem von einem OMR-System abgetasteten Vordruck von begrenztem Wert, da es keine Möglichkeit gibt, diese Informationen auszuwerten, ohne auf den Vordruck, eine Transparentauflage oder gar, wie im Fall standardisierter Tests, auf eine zum Vordruck gehörige Broschüre zurückzugreifen.
VIS-Systeme können andererseits den gesamten Inhalt eines abtastbaren Vordrucks (Standard-Hintergrunddruckinformationen und alle veränderlichen Daten) als digitalisiertes Pixelbild wiedergeben, jedoch kann eine zugeordnete OMR-Verarbeitungslogik die in einem Pixelbild im VIS-Nodus des Vordrucks enthaltenen veränderlichen Einzelinformationen nicht ohne weiteres auswerten oder analysieren. Wenngleich viele feste und variable digitalisierte Daten durch VIS-Bilder erfaßt werden können, muß die Bedeutung der variablen Daten noch gewonnen werden, und es sind möglicherweise nicht alle im VIS-Modus erfaßten Daten von Interesse. Wenn beispielsweise ein Blatt Papier mit einer Größe von 8-1/2" x 11" bei einer vertikalen und horizontalen Auflösung von 120 Punkten pro Zoll (DPI) und bei einem acht Bit umfassenden Grauwertbereich abgetastet wird, können aus dieser einzigen Seite 1,3 Megabyte an abgetasteten Informationen auf der Bitebene erzeugt werden. Es ist offensichtlich, daß ein sehr großes Maß an Rechenleistung erforderlich sein kann, um bedeutsame Informationen auf der Bitebene oder gar örtlich begrenzte Pixelabschnitte (oft als in Betracht kommende Gebiete oder in Betracht kommende Bereiche (AOIs) bezeichnet) von einem mit einem VIS-System abgetasteten Vordruck zu gewinnen und zu analysieren. Weiterhin sind die Speicheranforderungen zur Speicherung aller dieser Informationen in einer Situation, in der hunderte oder tausende von Dokumenten zur Erfassung eines vollständigen Pixelbildes als Nebenprodukt der Erfassung der veränderlichen Daten verarbeitet werden, so groß, daß sie bei den meisten Anwendungen zu teuer sind.
Ein Verfahren, das zur Verringerung des Umfangs der zu speichernden Daten verwendet wurde, wenn Text und/oder Zahlen enthaltende Texte VIS-abgetastet werden, liegt in der Verwendung von Symbolerkennungssystemen (gewöhnlich computergestützt) zur Konvertierung des sichtbaren, aus Text und/oder Zahlen bestehenden Bildes in kompaktere, auf Zeichen beruhende alphanumerische Daten. Diese letzteren erfordern erheblich weniger Speicherplatz und bieten den weiteren Vorteil, daß sie als Eingabedatei für ein Textverarbeitungsprogramm, ein Textsuchprogramm oder verschiedene andere Programme zur Bearbeitung von aus Text und/oder numerischen Daten bestehenden Dateien verwendet werden können.
Die Art, in der Informationen auf einem Dokument aufgezeichnet oder kodiert sind, bestimmt im heutigen Stand der Technik im hohen Maße die Geschwindigkeit und die Genauigkeit, mit denen computergestützte Systeme die Informationen gewinnen und in die digitale Form übertragen können. Im gegenwärtigen Stand der Technik gibt es keine sehr wirksame Möglichkeit, einen handschriftlich erstellten Text in die digitale Form zu übertragen. Von Hand in Druckschrift abgefaßte Informationen können mit gewissem Erfolg ausgewertet und in die digitale Form übertragen werden, insbesondere, wenn der Symbolerkennungsprozessor in der Art eines neuronales Netzwerkes sehr anpassungsfähig ist. Diese Aufgabe ist am leichtesten, wenn die betroffenen Informationen numerischer Art sind, weil in diesem Fall die Gesamtheit der zu erkennenden Zeichen stark reduziert ist. Andere Formen der Informations kodierung ermöglichen eine einfachere Symbolerkennung und - umwandlung in digitale Daten. Die Erkennung von Strichcodes ist heutzutage eine ausgereifte Technik, die in der Herstellung, dem Vertrieb und dem Verkauf zur Erkennung von Produkten weitverbreitet ist. Die optische Zeichenerkennung gewisser gedruckter Schriftzeichen ist ebenfalls so weit fortgeschritten, daß eine schnelle und genaue Übersetzung gedruckter Informationen in digital gespeicherte alphanumerische Daten möglich ist. Das vorausgehend erwähnte OMR-Abtasten ist eine weitere hochentwickelte Technik, die die schnelle Ubersetzung lagekodierter Daten aus einer Dokumentenform in eine auf Zeichen beruhende alphanumerische Form ermöglicht.
Mit allen diesen gegebenen Möglichkeiten, können Personen, die Informationen gewinnen möchten, indem sie diese auf Dokumente aufzeichnen lassen, nun ein Dokument entwerfen, in dem eine oder mehrere der vorausgehend erwähnten Datendar stellungsformen vereinigt sind. In dem Maße, in dem das Dokument mehrere unterschiedliche Datendarstellungsformen aufweist, ergeben sich andere Schwierigkeiten, die die Frage betreffen, wie das Dokument unter Verwendung automatischer Einrichtungen schnell in auf Zeichen beruhende Daten übertragen werden kann. Darüber hinaus werden in dem Maße, in dem in einem Dokument zugelassen wird, daß gewisse Daten von Hand durch druckschriftliche Markierungen oder Schriftzeichen aufgezeichnet werden, manche aufgezeichneten Informationen hinsichtlich der durch die zur Auswertung der Informationen verwendeten automatischen Symbolerkennungseinrichtung festgelegten Kriterien mehrdeutig sein (beispielsweise schwache OMR- Markierungen, grobe Schmutzflecken oder Radierstellen, schlecht wiedergegebener Druck von OCR-Schriftzeichen sowie wenig sorgfältige, von Hand vorgenommene druckschriftliche Eintragungen), und andere aufgezeichnete Informationen überschreiten entweder die Möglichkeiten der verfügbaren Symbolerkennungstechnologie (beispielsweise handschriftlich vorgenommene Eintragungen) oder sind nur in ihrer vollen, unbearbeiteten sichtbaren Form von Bedeutung (beispielsweise eine Unterschrift oder eine Skizze).
Es werden ein System und ein Verfahren zum Abtasten eines Dokuments benötigt, mit denen in vielfältiger Weise kodierte Informationen so verarbeitet werden können, daß die gewünschten Informationen, wenn möglich, in auf Zeichen beruhender alphanumerischer Form gewonnen werden können, während die Möglichkeit erhalten bleibt, alle oder einen Teil der Informationen in der sichtbaren Form eines "elektronischen Bildes" für die Untersuchung durch einen menschlichen Bediener zu erhalten.

ZUSAMMENFASSUNG DER ERFINDUNG

Die vorliegende Erfindung ist ein Bildverarbeitungssystern, das dazu geeignet ist, von einer Vorrichtung zum Abtasten im NIR-Modus und einer Vorrichtung zum Abtasten sichtbarer Bilder erfaßte abgetastete Bilder zu verwalten und verschiedene Symbolerkennungseinrichtungen zur Gewinnung von auf Dokumenten aufgezeichneten, in einer Anzahl unterschiedlicher Formen kodierten Informationen zu verwenden, und die Informationen in auf Zeichen beruhende alphanumerische Daten umzuwandeln oder sie als digitales Bild zu speichern.
Es ist eine Aufgabe der vorliegenden Erfindung, ein Bildverarbeitungssystem zu schaffen, das dazu geeignet ist, von einer Vorrichtung zum Abtasten optischer Markierungen (NIR-Modus) und von einer Vorrichtung zum Abtasten sichtbarer Bilder (VIS-Modus) erfaßte abgetastete Bilder zu verwalten.
Es ist eine weitere Aufgabe der vorliegenden Erfindung, ein Bildverarbeitungssystem zu schaffen, das dazu geeignet ist, abgetastete Bilder von vorbestimmten in Betracht kommenden Bereichen auf abgetasteten Dokumenten zu gewinnen und eine Anzahl von Symbolerkennungseinrichtungen zur Ubersetzung der abgetasteten Informationen von Bildern im Pixelformat in alphanumerische Daten in auf Zeichen beruhender Form zu verwenden, um einem digitalen Informationsverarbeitungssystem einen integrierten Ausgabe-Datensatz zu liefern.
Es ist eine weitere Aufgabe der vorliegenden Erfindung, eine Einrichtung zur Erfassung von Informationen aus einem mit Antworten markierten Dokument zu schaffen, bei der der erforderliche Computerspeicherplatz zur Speicherung aller wichtigen Informationen auf dem Dokument gegenüber einem nichtkomprimierten, vollständigen, Pixel für Pixel gegebenen Bild des Dokumentes erheblich verringert ist.
Noch eine weitere Aufgabe der vorliegenden Erfindung ist die Schaffung eines wirksamen Systems zur Gewinnung von Informationen aus Dokumentenvordrucken, die in einer Anzahl von Kodierschemata kodierte Antwortinformationen enthalten.
Diese und andere Aufgaben der vorliegenden Erfindung werden bei Bezugnahme auf die Zeichnung, die detaillierte Beschreibung der bevorzugten Ausführungsform und die beigefügten Ansprüche deutlich.

BESCHREIBUNG DER ZEICHNUNG

Fig. 1 ist ein Blockdiagramm der Gesamtfunktionsweise des Bildverarbeitungssystems der vorliegenden Erfindung.
Fig. 2 ist eine schematische Bilddarstellung der in ein Netzwerk integrierten vorliegenden Erfindung.
Fig. 3 ist eine Draufsicht auf einen Muster-Dokumentenvordruck, der mittels der vorliegenden Erfindung wirksam verarbeitet werden kann und der die allen Ausfertigungen des Dokumentenvordrucks gemeinsamen gedruckten Informationen sowie bestimmte zusätzliche auf dem Vordruck ausgedruckte Informationen für die automatische Verarbeitung enthält.
Fig. 4 ist eine Draufsicht auf einen Muster-Dokumentenvordruck aus Fig. 3, der mit Antworten versehen ist, die die Informationen darstellen, die mit der vorliegenden Erfindung gewonnen werden sollen.
Figuren 5a und 5b sind Flußdiagramme, die das Verfahren der vorliegenden Erfindung zur Verarbeitung eines mit Antworten versehenen Dokumentenvordrucks aus Fig. 4 zeigen.
Fig. 6 ist eine Darstellung einer gemäß der vorliegenden Erfindung erzeugten Bildschirmanzeige nach dem Abtasten des mit Antworten versehenen Dokuments aus Fig. 4 und dem Verarbeiten der festgelegten in Betracht kommenden Bereiche mit den in der vorliegenden Erfindung verfügbaren automatischen Symbolerkennungseinrichtungen.
Fig. 7 ist eine Darstellung einer Bildschirmanzeige, wie der in Fig. 6 gezeigten, nach dem redaktionellen Eingriff einer Redaktionsperson zur Gewinnung von Informationen aus dem mit Antworten versehenen Dokument aus Fig. 4.

BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN

Fig. 1 ist ein Blockdiagramm der Funktionsweise der verschiedenen Elemente der vorliegenden Erfindung. Der größte Teil der Funktionen der Erfindung wird in einem Server 100 ausgeführt, der ein Datenverarbeitungssystem ist, das aus einem UNIX-Server mit mehreren Gigabyte an Plattenspeicher oder einem anderen gleichschnellen Sekundärspeicher besteht. Im Server 100 befindet sich eine ein Scanner-Steuermodul 30 enthaltende Softwareausstattung, die die Arbeit von bis zu drei optischen Scannern 20 steuert und die über Datenübertragungskanäle 22 Daten von diesen empfängt. Weiterhin befindet sich im Server 100 ein Modul 40 zur Erzeugung von Anwendungen, das die Entwicklung einer großen Anzahl dokumentenspezifischer Abtast- und Verarbeitungsaufgaben des im folgenden beschriebenen Typs ermöglicht.
Ein Systemverwaltungsmodul so ist über einen Kanal 42 mit einem Modul 40 zur Erzeugung von Anwendungen verbunden.
Eine aus einem Datenübertragungskanal 12 und einer Bedieneranzeige (in Fig. 1 nicht gezeigt) bestehende Bedienerschnittstelle 12 ermöglicht es einem Bediener 10, den Server 100 zu überwachen und in den gewöhnlichen, in einem komplexen Datenverarbeitungssystem auftretenden Steuersituationen einzugreifen. Ein Kanal 52 verbindet das Systemverwaltungsmodul 50 mit anderen Servern (s. Fig. 2). Ein Kanal 56 verbindet das Systemverwaltungsmodul 50 mit dem Dateiverwaltungssystem 60. Das Dateiverwaltungssystem 60 ist mit einer Anzahl von Dateien verknüpft, deren Funktionen nachfolgend eingehender be schrieben werden, nämlich über einen Kanal 62 mit einer Rohbild-Datenbankdatei 162, über einen Kanal 64 mit der Übersetzungsdatenbank 164, über einen Kanal 66 mit einer Auftragswarteschlangendatei 166, über einen Kanal 68 mit einer Prüfungsdatenbank 168 und über einen Kanal 70 mit einer Anwendungsdatenbank 170.
Ein Kanal 58 verbindet das Systemverwaltungsmodul 50 mit dem Arbeitsablauf-Steuermodul 80. Das Arbeitsablauf-Steuermodul 80 steuert den Arbeitsfluß zu einem ISR-System 110 für handgeschriebene Druckzeichen, das eine von mehreren in der vorliegenden Erfindung verwendeten Symbolerkennungseinrichtungen ist. Diese spezielle automatische Symbolerkennungseinrichtung ist beim gegenwärtigen Stand der Technik so komplex, daß sie vorzugsweise in der Form eines externen Hardware- Software-Bauteils verwirklicht ist. Die anderen in der bevorzugten Ausführungsform der vorliegenden Erfindung verwendeten Symbolerkennungseinrichtungen umfassen einen Strichcodeleser, einen optischen Markierungsleser und einen Schriftzeichen- OCR-Leser. Diese können in der auf dem Server 100 befindlichen Software verwirklicht sein. Andernfalls kann der OMR-Leser für standardgemäße optische Markierungsdaten in einen Scanner 20 eingebaut sein, und die externen Vorrichtungen eines Strichcodelesers 112, eines Schriftzeichen-OCR-Lesers 114 und eines speziellen (nicht standardgemäßen) OMR-Lesers 116 können, wie in Fig. 1 gezeigt ist, über Kanäle 87, 88 bzw. 89 mit dem Arbeitsablauf-Steuermodul 80 verbunden sein. Wenngleich das ISR-System 110 für handgeschriebene Druckzeichen in dem bevorzugten Ausführungsbeispiel abhängig von den Anforderungen an das System und von Kostenfragen alle alphanumerischen Zeichen lesen kann, kann ein etwas weniger hoch entwickelter Leser lediglich handgeschriebener numerischer Daten oder lediglich von Hand in Druckschrift abgefaßter alphabetischer Daten verwendet werden. Weiterhin sind eine oder mehrere Aufbereitungsarbeitsplätze 90 über Kanäle 82 mit dem Arbeitsablauf-Steuermodul 80 verbunden. Ein Kanal 84 verbindet das Arbeitsablauf-Steuermodul 80 mit dem Dateiverwaltungssystem 60, so daß das Arbeitsablauf-Steuermodul 80 auf Informationen zugreifen kann, die vom Scanner-Steuermodul 30 erhalten wurden, sowie auf Informationen, die in den verschiedenen mit dem Dateiverwaltungssystem 60 verbundenen Dateien gespeichert sind, und diese zu einem ISR-System 110 für handgeschriebene Druckzeichen, einem Strichcodeleser 112, einem Schriftzeichen-OCR-Leser 114 und einem speziellen OMR-Leser 116 oder zu einem Aufbereitungsarbeitsplatz 90 übertragen kann.
Eine Hauptdatei 120, die über einen Kanal 124 mit dem Systemverwaltungsmodul 50 und über einen Kanal 126 mit dem Arbeitsablauf-Steuermodul 80 verbunden ist, wird zur Zusammensetzung von Ausgabedatensätzen verwendet, die über den Hauptdatenübertragungskanal 122 zu einem Hauptsystem (nicht eingezeichnet) übertragen werden. Die Ausgabe-Datensätze bilden ein wesentliches Endergebnis der vorliegenden Erfindung. Wie später in näheren Einzelheiten beschrieben wird, bestehen die Ausgabe-Datensätze aus Informationen im auf Zeichen beruhenden alphanumerischen Format oder im Pixelbildformat, die der Server 100 aus den durch den Scanner 20 abgetasteten Dokumenten gewinnt. Die vom Scanner 20 erzeugten Pixelbilder von Dokumenten werden gemäß der vorliegenden Erfindung so verarbeitet, daß die meisten Pixeldaten automatisch oder halbautomatisch zur Umwandlung der Pixelbilder der Dokumente in verwendbare, auf Zeichen beruhende alphanumerische Datensätze umgewandelt werden, während einige Pixeldaten in der Bildform verbleiben.
Die vorliegende Erfindung ist zur Gewinnung von Daten aus Dokumenten geeignet, die in einer großen Anzahl optisch abtastbarer Formate kodierte Informationen enthalten. Hierbei kann es sich um Daten jeglicher Art handeln. Die am besten geeigneten Situationen für die Verwendung der Erfindung sind Datenerfassungssituationen, in denen ein großer Datenumfang gesammelt und verarbeitet werden muß und in denen ein Dokumentenvordruck verwendet werden kann, um die Erfassung von Informationen zu lenken. Typischerweise werden Informationen einer antwortenden Person erfaßt, die den Dokumentenvordruck oder eine zugehörige Broschüre liest und Antwortkennzeichnungen verschiedener Art auf dem Dokumentenvordruck markiert oder diese auf den Dokumentenvordruck schreibt. Allen antwortenden Personen wird im wesentlichen das gleiche Dokument gegeben, wenngleich die einzelnen, den jeweiligen antwortenden Personen ausgehändigten Vordrucke unterschiedliche Informationen enthalten können, die dazu verwendet werden, die jeweilige antwortende Person oder möglicherweise einen Teil der antwortenden Personen oder irgendeinen bei einer antwortenden Person einzigartigen Umstand zu identifizieren.
Fig. 2 zeigt eine schematische Bilddarstellung der in einem Hochgeschwindigkeitsnetzwerk (z. B. Ethernet) verwendeten vorliegenden Erfindung. In Fig. 2 ist der Server 100 ebenso wie in Fig. 1 mit drei Scannern verbunden. Ein Server Bedienpult 102 und ein Überwachungs-Anschlußgerät 104 sind ebenfalls mit dem Server 100 verbunden. Mehrere Aufbereitungsarbeitsplätze 90 sind mit dem Server 100 verbunden. Eine Brücke 51 verbindet den Server 100 mit einem Datenübertragungs-Server 130, der wiederum über einen Kanal 122 mit einem Hauptcomputer verbunden ist, sowie mit einem Modem 132, das dazu verwendet werden kann, zur Unterstützung beim Auftreten von Fehlern einen wählbaren Zugang zum System zu bieten.
Die Leitung 52 verbindet den Server 130 mit einer weiteren Brücke 251, die zu einem weiteren Server 200 führt. Der Server 200 gleicht im wesentlichen dem Server 100, und die Vorrichtungen in seinem Netzwerk sind mit denselben Bezugszahlen versehen, wie die entsprechenden Vorrichtungen für den Server 100, jedoch mit einer vorangestellten "2". Die mit dem Server 200 verbundenen Aufbereitungsarbeitsplätze 290 ent sprechen daher den mit dem Server 100 verbundenen Aufbereitungsarbeitsplätzen 90. Die Leitung 52 führt auch zu einem weiteren Server 300, wobei die Bezugszahlen wiederum die Entsprechung gleicher Vorrichtungen des Netzwerks für den Server 100 zeigen, abgesehen davon, daß eine vorangestellte "3" verwendet wird. Mit der zum Server 300 führenden Leitung 52 ist weiterhin eine löschbare Bildplatten-Speichervorrichtung 142 vom "Jukebox"-Typ mit einem eigenen Server 140 verbunden, die für die Verwendung als Massenspeicher zur Archivierung oder für andere Zwecke vorgesehen ist.
Fig. 3 ist eine Draufsicht eines für die effiziente Verarbeitung gemäß der vorliegende Erfindung entwickelten Dokumentenvordrucks 400. Der Vordruck 400 enthält das allen Ausfertigungen des Dokumentenvordrucks gemeinsame Druckmaterial sowie gewisse zusätzliche für die automatische Verarbeitung auf dem Vordruck ausgedruckte Informationen. Der Dokumentenvordruck 400 aus Fig. 3 zeigt die verschiedenen Möglichkeiten der vorliegenden Erfindung. Er stellt ein typisches Dokument dar, das dazu verwendet werden könnte, Informationen von einer Anzahl vieler antwortender Personen, in diesem Fall Abonnenten oder möglichen Abonnenten einer erdachten, "PC News" genannten Zeitschrift zu gewinnen. Jeder Abonnent erhält den gleichen Dokumentenvordruck 400, abgesehen davon, daß der Vordruck, den jeder Abonnent erhält, gewisse in der oberen linken Ecke (der mit 410 bezeichnete, von einer unterbrochenen Linie umgebene Bereich) ausgedruckte Informationen enthält, die den Abonnenten kennzeichnen (Name, Firma, Adresse usw.).
Der Dokumentenvordruck 400 aus Fig. 3 weist einige der Merkmale eines typischen, ausschließlich für das OMR-Abtasten entwickelten Antwort-Dokumentenvordrucks auf. Das heißt, er weist die übliche entlang des rechten Randes verlaufende Markierungsspalte 402 auf, die als Taktspur dient, sowie einen entlang des unteren Randes verlaufenden Kontrastkalibrierungsstrich 404. Alle auf dem Vordruck 400 sichtbaren Druckinformationen sind mit Ausnahme des Kontrastkalibrierungs strichs 404, der Taktspur 402 und der in dem mit 410 bezeichneten Bereich enthaltenen Druckinformation mit einer Tintenfarbe gedruckt, die für eine lesende Person leicht sichtbar ist, die jedoch keinen Kohlenstoff oder ein anderes Material enthält, das Licht des nahen Infrarotbereichs absorbiert oder das in einem Scanner im NIR-Modus erkennbar ist. Die Druckertinte für den Kontrastkalibrierungsstrich 404, die Taktspur 402 und die Druckinformation innerhalb des mit 410 bezeichneten Bereichs enthält Graphit oder ein anderes Material, das sie Licht des nahen Infrarotbereich absorbieren läßt. (Zur Korrektur einer Schräglage sowie für andere Ausrichtungszwecke verwendete Triangulationsmarkierungen, die in näheren Einzelheiten in der vorausgehend erwähnten verwandten Anmeldung beschrieben sind, würden auch mit MIR-Licht absorbierender Tinte gedruckt werden). Wenn der Vordruck 400, wie er in Fig. 3 erscheint, in einem MIR-Modus abgetastet wird, erscheint dieser daher im sich ergebenden Pixelbild, abgesehen von der Taktspur 402, dem Kontrastkalibrierungsstrich 404 und der Druckinformation im Bereich 410 als unbedruckt. Wenn der Vordruck 400, wie er in Fig. 3 erscheint, andererseits mit einem im VIS-Modus arbeitenden Scanner abgetastet wird, erscheinen alle in Fig. 3 auftretenden Druckinformationen in dem sich aus dem VIS-Abtasten ergebenden Pixelbild (mit Ausnahme der Bezugszahlen und der zur Kennzeichnung von zu den Bezugszahlen gehörigen Bereichen verwendeten unterbrochenen Linien, die Artefakte einer Patentzeichnung sind).
Es ist ersichtlich, daß der Vordruck 400 erste Kennzeichnungen (alle Druckinformationen mit Ausnahme der Taktspur 402, des Kontrastkalibrierungsstrichs 404 und der Druckinformation im Bereich 410) enthält, die in einem Abtastmodus unter Verwendung von Licht eines ersten Spektralbereichs, in diesem Fall des Bereichs des sichtbaren Lichtes erkennbar sind, jedoch nicht in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs, also in einem zweiten Abtastmodus unter Verwendung von Licht des nahen Infrarotbereichs. Der Vordruck 400 enthält weiterhin zweite Kennzeichnungen (die Taktspur 402, den Kontrastkalibrierungsstrich 404 und die Druckinformation im Bereich 410), die entweder im ersten oder im zweiten Abtastmodus erkennbar sind. Wie später in näheren Einzelheiten erklärt wird, ist es diese Fähigkeit, die auf der Oberfläche eines Vordrucks enthaltenen Informationen, abhängig von den Tintentypen sowie der spektralen Empfindlichkeit der verwendeten Scanner, in zwei Klassen einzuteilen, aus der sich viele Vorteile dieser Erfindung ergeben.
In Fig. 4 ist der gleiche Vordruck wie in Fig. 3 dargestellt, abgesehen davon, daß der Vordruck 400 in Fig. 4 die von der antwortenden Person in den Vordruck eingetragenen Markierungen, schriftlichen Eintragungen und anderen Informationen zeigt. Wie man sieht, hat die antwortende Person Markierungen in einer Anzahl von Antwortblasen vorgenommen, handschriftliche Antworten in bestimmte Bereiche für Antworten in nicht festgelegter Form geschrieben, verschiedene Buchstaben und Zahlen in bestimmte Antwortbereiche eingetragen und einen Strichcode-Aufkleber in einem Bereich angebracht. Der Empfänger dieses mit Antworten versehenen Vordrucks 400 möchte die in den Antworten enthaltenen Informationen mittels einer automatischen Einrichtung gewinnen, wobei die Möglichkeit für eine Person gegeben sein sollte, die Ergebnisse der automatischen Verarbeitung durch die verschiedenen vorausgehend erwähnten intelligenten Symbolerkennungseinrichtungen zu überprüfen und einzugreifen, wenn die automatische Verarbeitung nicht in der Lage ist, die gesuchten Informationen zu erhalten, und daher keine auf Zeichen beruhenden, die zu dekodierenden Informationen wiedergebenden alphanumerischen Daten liefern kann.
Der erste Schritt bei der Verwendung der vorliegenden Erfindung zur Gewinnung von Informationen aus einem Antwort- Dokumentenvordruck, wie dem in Fig. 3 gezeigten, liegt in der Festlegung der erforderlichen anwendungsspezifischen Verarbeitung. Anwendungen sind so festgelegt, daß sie sich auf ein oder mehrere abtastbare Dokumente konzentrieren, die hinsichtlich einer logischen Gruppierung eine einzige Eingabeeinheit für das Abtastsystem bilden. Der Vordruck 400 stellt eine Einheit dar, die aus einer einzigen Seite besteht. Eine von einer antwortenden Person auszufüllende Testbroschüre mit mehreren Seiten oder ein Bestellvordruck mit mehreren Seiten ist eine mehrere Seiten umfassende Einheit. Die Anwendungsfestlegung enthält die Spezifizierung maschinenlesbarer Dokumenterkennungssymbole und Eintragungserfordernisse sowie Vorschriften für die Abfolge des Dokuments. Diese ermöglichen es, daß ein Scanner 20 erkennt, ob ihm Dokumente vorliegen, die zu den für die Anwendung festgelegten Abtastverfahren passen, und den Abschluß einer einzelnen Abtasteinheit zu erkennen. Die Anwendung legt auch sogenannte in Betracht kommende Bereiche (AOIs) fest. Ein in Betracht kommender Bereich kann irgendein Bereich auf der Oberfläche des Vordrucks 400 sein. (Während in manchen Anwendungen die vordere und die hintere Oberfläche eines Dokumentenvordrucks verwendet werden, wird in der folgenden Diskussion des Vordrucks 400 zur Klarheit der Beschreibung der vorliegenden Erfindung angenommen, daß dessen erste und zweite Kennzeichnungen nur auf eine Oberfläche gedruckt sind, nämlich die in den Figuren 3 und 4 gezeigte Oberfläche).
In der Anwendungsfestlegung sind auch die in Betracht kommenden Objekte innerhalb der Anwendung festgelegt ("Objekte") . Objekte sind typischerweise logisch gruppierten Ausgabedaten zugeordnet. Beispielsweise sind der Name, die Adresse, die Frage Nr. 2 und die Sozialversicherungsnummer jeweils Objekte auf einem Dokument, die einen Satz sinnvoller Daten darstellen. Ein einziges Objekt kann zu mehreren AOIs auf dem Dokument führen. Um beispielsweise das Adressenobjekt auf dem Vordruck 400 zu zerlegen, muß das System die die Umschlagadresse, die Stadt, den Bundesstaat und die Postleitzahl enthaltenden Bereiche auf dem Vordruck 400 auswerten, die aus Wirksamkeits- oder Zeichnungsgründen alle eigene AOIs haben können. Objekte können daher als Zusammensetzungen von AOIs auf dem Dokument mit für jedes AOI festgelegten Verarbeitungseinrichtungen festgelegt sein und einen oder mehrere Ausgabeteile aufweisen. Die Ausgabe kann hinsichtlich der Form und der Gliederung für jedes Objekt festgelegt sein. Die Ausgabe für ein Namensobjekt kann aus vier Feldern, nämlich dem Vornamen als ASCII-Feld, dem Nachnamen als ASCII-Feld, dem Anfangsbuchstaben des zweiten Vornamens als Zeichen- ASCII-Feld sowie dem Bild der Unterschrift selbst bestehen. Diese Felder sind hinsichtlich der Größe und der Reihenfolge festgelegt, so daß für die weitere Verarbeitung eine übereinstimmend verwendbare Gliederung für einen Ausgabe-Datensatz gebildet wird.
Alle Vorschriften und anderen Informationen, die an der Festlegung einer Anwendung beteiligt sind, werden in der Anwendungsdatenbank 170 und/oder der Übersetzungsdatenbank 164 und/oder der Prüfungsdatenbank 168 gespeichert.
Fig. 3 zeigt eine Anzahl von durch unterbrochene Linien in Fig. 3 festgelegten AOIs. (Diese unterbrochenen Linien könnten auf dem Vordruck 400 unter Verwendung von Tinte ausgedruckt sein, die nur im ersten Abtastmodus erkennbar ist, sie sind jedoch für die antwortenden Personen ohne Bedeutung und treten normalerweise auf dem Vordruck 400 nicht auf). Ein AOI 410 legt den Bereich fest, in dem einige für den Abonnenten/die antwortende Person spezifische Informationen in einer Schrift ausgedruckt sind, die von einem Schriftzeichen-OCR- Leser "gelesen" oder dekodiert werden kann. Ein AOI 420 enthält zwei Ja-Mein-Fragen, die jeweils mit zwei entsprechenden von der antwortenden Person zu markierenden OMR-Antwortbereichen oder "Blasen" versehen sind. Die AOIs 430 und 440 enthalten jeweils mehrere OMR-Antwortblasen, die einer Anzahl von Auswahlen entsprechen, die die antwortende Person durchführen kann. Dem AOI 430 und dem AOI 440 ist ein Bereich 435 bzw. 445 zugeordnet, der die Eintragung von Informationen in nicht festgelegter Form durch die antwortende Person ermöglicht. In der letzten OMR-Antwortblase in jedem der AOIs 430 und 440 wird der Benutzer aufgefordert, darauf hinzuweisen, daß in den zusammen mit den AOIs 435 und 445 auftretenden Zeilen ein Eintrag in nicht festgelegter Form beigefügt ist. Ein AOI 450 ist ein gitterförmiger Antwortbereich, der an den Schnittpunkten des Gitters OMR-Antwortblasen aufweist. Im AOI 460 wird die antwortende Person aufgefordert, jeweils einen Druckbuchstaben oder eine Zahl in einzelne freie Plätze gleicher Größe einzutragen. Durch diese anleitende Form des Antwortfeldes wird es für das ISR-System 110 für handgeschriebene Druckzeichen sehr viel einfacher, die Markierungen zu "lesen" oder zu dekodieren. Ein AOI 470 ist für eine Unterschrift vorgesehen, die normalerweise von einer automatischen Symbolerkennungseinrichtung nicht verarbeitet wird. Statt dessen wird eine Unterschrift einfach als Pixelbild abgespeichert. Ein AOI 480 ist dem AOI 460 abgesehen davon ähnlich, daß in den vorbestimmten Plätzen lediglich Zahlen von Hand eingetragen werden. Ein AOI 490 ist dem AOI 450 sehr ähnlich und weist wiederum Antwortblasen in einem Gittermuster auf, von denen jede einzelne oder mehrere markiert sein können. Der AOI 500 ist ein nicht begrenzter Antwortbereich in nicht festgelegter Form, in dem handschriftliche, von heutigen ISR- Systemen für handgeschriebene Druckzeichen nicht lesbare Ant worten zu erwarten sind. Dementsprechend kann das Auftreten jeglicher handgeschriebener Bemerkungen in diesem AOI, wie beim AOI 480 für die Unterschrift, das Abspeichern eines Pixelbildes des gesamten beschriebenen Bereichs nach sich ziehen. Ein AOI 510 ist ein Bereich, der für das Einfügen eines vorgedruckten Strichcodes von einem Aufkleber oder einer anderen Quelle vorgesehen ist. Dieser AOI 510 wird von einem Strichcode-Leser verarbeitet. Ein AOI 520 enthält eine Mischung von OMR-Blasen und für handgeschriebene Zahlen vorbestimmte Bereiche, die die gleichen Informationen enthalten, wenn sie richtig ausgefüllt sind.
Die Figuren 5a und 5b enthalten Flußdiagramme, in denen der Gesamtablauf für die Verarbeitung entsprechend der vorliegenden Erfindung beschrieben ist. Die durch die Flußdiagramme ausgeführten verschiedenen logischen Schritte und Arb eitsabläufe werden vom Server 100 unter Verwendung der Scanner 20, der Aufbereitungsarbeitsplätze 90 und der ISR-Einrichtungen 110, 112, 114 und 116 ausgeführt. Die Scanner 20 tasten im VIS-Modus ab, wenn sie die Informationen auf einem unmarkierten Vordruck 400 erfassen oder im MIR-Modus, wenn sie die Markierungen auf einem mit Markierungen versehenen Vordruck 400 erfassen. In der bevorzugten Ausführungsform kann jeder der Scanner in beiden Modi abtasten und unter der Steuerung des Scanner-Steuermoduls 30 von einem Modus in den anderen wechseln. In weniger hochentwickelten Systemen wäre es gleichermaßen annehmbar, wenn ein Scanner 20 ausschließlich für das Abtasten im VIS-Modus vorgesehen wäre und andere ausschließlich für das Abtasten im MIR-Modus vorgesehen wären. Es ist lediglich erforderlich, daß die Steuerlogik ein Signal empfängt, das den aktuellen Abtastmodus anzeigt.
Wenn ein Dokument abgetastet wird, überträgt der Scanner 20 ein vollständiges, nicht komprimiertes, unbearbeitetes Pixelbild in einen geeigneten Zwischenspeicher, üblicherweise einen "Bildscanner", der Teil des Scanners 20 ist. Das Pixelbild im Bildscanner wird vorzugsweise unter Verwendung von einer der unter den Namen "Runlength", "Huffman" oder "LZW" bekannten verlustlosen Komprimierungstechniken komprimiert. Wenn es sich um eine VIS-Abtastung eines unmarkierten Dokumentenvordrucks handelt (der dennoch einige für die spezielle Ausfertigung des Dokumentenvordrucks kennzeichnende Daten, wie die Informationen zur Erkennung der antwortenden Person im AOI 410 enthalten kann), so wird das komprimierte Pixelbild nicht mit einer automatischen Symbolerkennungseinrichtung verarbeitet. Die Pixeldatei wird dementsprechend für die spätere Verwendung in einer Zusammenfügungsoperation unter Einschluß veränderlicher Daten aus einer NIR-Abtastung, bei der das Pixelbild der VIS-Abtastung typischerweise als Hintergrund verwendet wird, abgespeichert. Falls es sich um eine MIR-Abtastung handelt, überträgt der Scanner 20 wiederum ein vollständiges, nicht komprimiertes, unbearbeitetes Pixelbild in einen geeigneten Zwischenspeicher in der Art eines Bildscanners, und das gespeicherte Bild wird vorzugsweise komprimiert, bevor es in einer permanenten Datei abgespeichert wird.
Da die MIR-Abtastung nur Markierungen oder Druckinformationen berücksichtigt, die Licht im nahen Infrarotbereich absorbieren, wird ein großer Teil dessen, was auf dem Vordruck 400 erscheint, im sich ergebenden Pixelbild nicht berücksichtigt. Die Tinte für die typischen, auf dem Vordruck erscheinenden vorgedruckten Informationen ist demnach bei der MIR- Abtastung unsichtbar, und mit dieser Tinte bedruckte Bereiche erscheinen als weiße, eine begrenzte Menge an dunkleren Antwortmarkierungen umgebende Stellen. Da die Menge solcher weißer Stellen im Vergleich zu den dunkleren Antwortmarkierungen bei den meisten Anwendungen sehr groß ist, kann eine beträchtliche Komprimierung erreicht werden. Eine weitere Komprimierung ist möglich, wenn die einzigen Bereiche des Pixelbildes der MIR-Abtastung gewisse festgelegte AOIs sind, wenn diese AOIs weniger als nahezu die gesamte Oberfläche des Dokumentes ausmachen, oder wenn für jedes eine Inhaltsprüfung vorgenommen wird, bevor es für die Speicherung zugelassen wird, um festzustellen, ob überhaupt irgendwelche Markierungen vorhanden sind. Die spezielle verwendete Inhaltsprüfung hängt vom Typ der verwendeten Informationskodierung ab. Beispielsweise würde bei OMR-Daten nur dann das Vorhandensein eines Inhalts festgestellt werden, wenn einige OMR-Blasen innerhalb des AOI einen beträchtlichen Grauwertinhalt aufwiesen. Für Strichcode-Daten müßte ein sinnvolles Strichcode-Muster gegeben sein. Damit festgestellt würde, daß ein AOI von Hand eingetragene druckschriftliche Markierungen enthält, müßte eine sinnvolle Gesamtgrauwertdichte überschritten sein. Bei manchen Anwendungen, wie beispielsweise einem Besteilvordruck mit einer umfangreichen Liste auswählbarer Produkte könnte jedes Produkt als einzelner AOI festgelegt sein, es würden jedoch nur die AOIs für die spätere Verarbeitung abgespeichert werden, die tatsächlich Bestellinformationen enthielten.
Unabhängig davon, ob alle festgelegten AOIs oder nur festgelegte AOIs, die tatsächlich Markierungen enthalten, abgespeichert werden, wird eine Warteschlange der AOIs für die weitere Verarbeitung gebildet. Wie vorausgehend erwähnt wurde, wird jedem AOI bei der Festlegung der Typ der automatischen Symbolverarbeitungseinrichtung zugeordnet, die zur Dekodierung der im AOI markierten Antwortinformationen verwendet werden sollte, falls dem AOI überhaupt eine automatische Symbolverarbeitungseinrichtung zugeordnet werden sollte. Wenn jeder AOI zur Verarbeitung aus der Warteschlange entfemt wird, wird das dem AOI entsprechende Pixelbild zur automatischen Symbolverarbeitungseinrichtung übertragen, die für diesen AOI festgelegt ist. Falls ein AOI in der Warteschlange nicht für die automatische Symbolverarbeitung geeignet ist, wird er einfach für die spätere Anzeige gespeichert. Für jeden AOI, der zu einer automatischen Symbolverarbeitungseinrichtung übertragen wird, wird eine Kette auf Zeichen beruhender alphanumerischer Daten erzeugt. In der bevorzugten Ausführungsform überträgt die automatische Symbolverarbeitungseinrichtung weiterhin einen Statuscode einer beliebigen Art (beispielsweise ein Bearbeitungs-Hinweiszeichen) zurück, der anzeigt, ob sie das Pixelbild, zu dessen Verarbeitung sie angewiesen wurde, erfolgreich verarbeiten konnte. Wenn bei der Verarbeitung eine Schwierigkeit auftritt (wenn ein OMR- Leser eine helle OMR-Markierung antrifft, die zu einem als mehrdeutig eingestuften Grauwert führt, oder wenn das ISR-System für handgeschriebene Druckzeichen einen Druckbuchstaben nicht erkennen kann, der zu sehr von der Norm abweicht), so wird ein redaktioneller Eingriff durch eine Person wünschenswert sein, und es ist wahrscheinlich, daß die von der automatischen Symbolerkennungseinrichtung erzeugten Ergebnisse alphanumerischer, auf Zeichen beruhender Daten eine Korrektur oder eine Vervollständigung erfordern. Unabhängig davon, ob das Bearbeitungs-Hinweiszeichen gesetzt wurde oder nicht, werden die Ergebnisse der Verarbeitung eines jeden AOIs durch die zugewiesene automatische Symbolverarbeitungseinrichtung für die Anzeige dem Pixelbild des AOIs zugeordnet, wie nachfolgend erörtert wird.
Zusammenfassend erfaßt der Scanner 20 das gesamte Bild der vorderen und der hinteren Oberfläche des Vordrucks beim Abtasten eines Dokumentes als unkomprimierte Daten mit 8 Bit pro Pixel. Die AOIs auf dem Vordruck werden hinsichtlich ihres Inhalts untersucht und entsprechend der dem Vordruck zugeordneten Anwendungsfestlegung ausgewertet. Die AOIs können zu diesem Zeitpunkt vom Scanner 20 als OMR-Antwortblasen, als von Hand geschriebene Antworten enthaltende Bereiche oder als Bildausschnitte ausgewertet werden. In einer Ausführungsform, in der der Scanner 20 hochentwickelt und mit einer großen Verarbeitungsleistung ausgestattet ist, wertet der Scanner 20 AOIs auch unter Verwendung seiner eigenen Schriftzeichen-OCR- und Strichcode-Leseeinrichtungen sowie anderer Symbolverarbeitungseinrichtungen aus. Wenn der Scanner 20 die sinnvollen Daten eines Vordrucks erkannt und zerlegt hat, überträgt er diese Daten zum Scanner-Steuermodul 30. Diese Daten können aus Zeichen im ASCII-Code, komprimierten oder unkomprimierten Bildern oder einer Darstellung eines unbearbeiteten OMR-Gitters bestehen.
Das Arbeitsablauf-Steuermodul 80 beruht auf dem Gedanken, daß durch den Abtastvorgang Objekte erzeugt werden, die von einer ISR-Einrichtung verarbeitet werden sollen und daß der Ausgabe-Datensatz für einen Anwendungsfall (beispielsweise eine mit Antworten markierte Ausfertigung des Vordrucks 400) nach der erfolgreichen Auswertung aller diesem Fall zugeordneter Objekte erzeugt werden soll. Die Steuerung des Arbeitsablaufes ist ein zweistufiger Vorgang. In der ersten Stufe werden die Einrichtungen des Systems verwaltet, um die Verarbeitungseinrichtungen des Systems, wie die CPU, den Plattenspeicher usw. zu überwachen. In der bevorzugten Ausführungsform beginnt die erste Stufe und steuert die Verarbeitungsvorgänge der zweiten Stufe, in der die Objekte für eine einzelne Einheit der Anwendung gesammelt und ausgewertet werden. Der Verarbeitungsvorgang der zweiten Stufe ist, falls dies möglich ist, für das Zerlegen der Objekte oder das Übertragen der Objekte zu geeigneten ISR-Einrichtungen, also dem Schriftzeichen-OCR-Leser 114, dem Strichcode-Leser 112 oder einem Aufbereitungsarbeitsplatz 90 für die optische Überprüfung durch eine Person, verantwortlich. Der Inhalt der Anzeige für die optische Überprüfung durch eine Person wird durch Daten zur Festlegung der Anzeige festgelegt, die Teil der Anwendungsfestlegung sind.
Wenn die automatischen Symbolerkennungseinrichtungen alle von einem im MIR-Modus abgetasteten Dokument gewonnenen AOIs aus einer Warteschlange von AOIs verarbeitet haben, können die Ergebnisse direkt zu einem die wesentlichen, aus dem abgetasteten Dokument gewonnenen Informationen enthaltenden Ausgabedatensatz für die Übertragung zu einem Hauptcomputer (nicht gezeigt) zusammengestellt werden. Dieser Datensatz, der eine Übersetzung der Markierungen auf dem mit Antworten markierten Vordruck in Zeichenketten alphanumerischer Daten darstellt und auch Bilder enthalten kann, ist dazu geeignet, von irgendwelchen, für die Annahme und die weitere Verarbeitung der Informationen erdachten Hauptanwendungsprogrammen verarbeitet zu werden. Bei den meisten Anwendungen ist es sehr wichtig, daß die Ausgabe-Datensätze getreue Übersetzungen der mit Antworten markierten Vordrucke sind. Dementsprechend ermöglicht es die vorliegende Erfindung, die als Ergebnis der Verarbeitung einiger oder aller AOIs auf einem Dokument erhaltenen Informationen für jeglichen erforderlichen redaktionellen Eingriff auf einem Aufbereitungsarbeitsplatz 90 anzuzeigen.
In den Figuren 5b und 6 sind die Arbeitsabläufe zum Zusammenstellen einer Bildschirmanzeige 600 für einen Aufbereitungsarbeitsplatz 90 und der Entwurf einer solchen Anzeige gezeigt. Das Bild des Aufbereitungsbildschirms in Fig. 6 ist das Ergebnis der Verarbeitung der AOIs aus Fig. 4 sowie des Anzeigens ausgewählter AOIs. Jeder dargestellte AOI weist eine zugeordnete Stelle oder ein zugeordnetes Tabulatorsymbol 610, 620, 630 und 640 auf, die oder das der Bediener ansteuern kann, wenn er einen speziellen AOI bearbeiten möchte. Mit jedem Tabulatorsymbol ist ein Bild dargestellt, das aus der VIS-Abtastung erhaltene erste Kennzeichnungen sowie aus der NIR-Abtastung erhaltene zweite Kennzeichnungen enthält. Diese wurden zur Bildung eines einzigen Bildes in der nachfolgend beschriebenen Weise zusammengefügt. Der AOI 410 ist unter der Annahme, daß er von der antwortenden Person nicht bearbeitet wurde und unter der Annahme, daß die Schriftzeichen-OCR-Übersetzung in auf Zeichen beruhende Daten sehr zuverlässig ist, nicht auf dem Aufbereitungsbildschirm 600 dargestellt.
(Weiterhin können zur weiteren Erhöhung der Genauigkeit, Prüfziffern zum Schriftzeichen-OCR-Text hinzugefügt werden.)
Dementsprechend wird die alphanumerische Übersetzung dieser Informationen direkt in den Ausgabe-Datensatz für dieses Dokument übertragen. Der AOI 420 wird auf dem Aufbereitungsbildschirm 600 dargestellt (Tabulatorsymbol 610), da der OMR Leser die Markierung beim zweiten "Nein" wegen des geringen Dunkelwerts innerhalb der Antwortblase als mehrdeutig ansah. Der Server 100 stellt direkt oberhalb des Bildes des AOI 420 die Buchstaben "J N?" dar, die die Dekodiertätigkeit des OMR- Lesers anzeigen sowie deren Ergebnis, daß die Markierung mehrdeutig ist und einen redaktionellen Eingriff erfordern könnte.
Der AOI 435 ist ebenfalls auf dem Aufbereitungsbildschirm 600 dargestellt (Tabulatorsymbol 620). Dessen Darstellung wird durch das Lesen einer Markierung durch den OMR-Le ser in der letzten Anwortblase im AOI 430 ausgelöst, die die Auswahl "andere (bitte erläutern)" bezeichnet. Im Bild des AOI 435 ist folglich der durch die antwortende Person vorgenommene handschriftliche Eintrag des Wortes "Verlagswesen" gezeigt, der durch keine automatische Symbolverarbeitungseinrichtung übersetzt werden konnte. Um dem Bediener die Übersetzung des handschriftlichen Eintrags zu ermöglichen und diesen in den Ausgabe-Datensatz aufzunehmen, erzeugt der Server eine Leerzeile 622 als Teil des Aufbereitungsbildschirms 600 und fordert dabei den Bediener auf, das Wort "Verlagswesen" einzugeben.
Beim Tabulatorsymbol 630 auf dem Aufbereitungsbildschirm 600 ist der AOI 460 dargestellt. Neben dem Bild des AOI 460 ist eine durch den Server 100 erzeugte Mehrzeilen-Anzeige 632 angeordnet, die die vom ISR-System für handgeschriebene Druckzeichen entwickelten alphanumerischen Daten enthält, zu dem das Pixelbild des AOI 460 zur Übersetzung in auf Zeichen beruhende Daten übertragen wurde. Es ist ersichtlich, daß die Anzeige 632 drei Leerzeilen (die erste, die zweite und die vierte) enthält, in die die antwortende Person keine Daten eingetragen hat, und daß die alphanumerische Übersetzung der dritten, fünften und sechsten Zeile versucht wurde. Aus dieser Anzeige sollte der Bediener schließen können, daß in der dritten Zeile ein Übersetzungsfehler aufgetreten ist, in der wahrscheinlich wegen des wenig sorgfältig gebildeten "D"s das druckschriftliche "DEM" als "OEN" übersetzt wurde. Weiterhin wird der Bediener feststellen, daß die letzte Ziffer der Postleitzahl als "?" übersetzt wurde, was den Bediener veranlaßt, die wenig sorgfältig druckschriftlich von Hand eingetragene "5" zu lesen. Der Bediener kann den Text daraufhin auf der Anzeige 632 bearbeiten und die erforderlichen Verbesserungen ausführen. Die Leerzeilen können abhängig von der Festlegung der Anwendung in unterschiedlicher Weise gehandhabt werden. Der Bediener könnte aufgefordert werden, eine Darstellung des AOIs 410 anzufordern, um das, was dort erscheint, in die Leerzeilen zu übertragen. Statt dessen könnte der Bediener das System einfach anweisen, die sich aus dem Lesen des AOIs 410 durch den Schriftzeichen-OCR-Leser ergebende übersetzte alphanumerische Zeichenkette unter der Annahme in die Leerzeilen in der Anzeige 632 einzutragen, daß die meisten antwortenden Personen die Zeilen unausgefüllt lassen, in die Informationen eingetragen werden sollen, die bereits richtig in den AOI 410 eingetragen wurden.
Beim Tabulatorsymbol 640 auf dem Aufbereitungsbildschirm 600 ist der AOI 520 dargestellt, der durch den OMR-Leser nicht erfolgreich verarbeitet werden konnte. (Da der Antwortbereich ein richtig ausgefülltes OMR-Gitter enthält, wurde der Bereich oberhalb des OMR-Gitters für die druckschriftliche Eintragung derselben, im OMR-Gitter zu kodierenden Zahlen nicht als Pixelbild für die Verarbeitung durch das ISR-System für handgeschriebene Druckzeichen übertragen.) Es ist für den Bediener leicht ersichtlich, daß die beiden letzten Ziffern durch den OMR-Leser nicht dekodiert werden konnten, da die Antwortblasen für die "0" und die "5" in der vorletzten Spalte des Gitters markiert wurden. Wiederum wird der Bediener durch die vom Server erzeugte Zeichenkette "10665??" aufgefordert, die von Hand eingetragenen Zahlen zu lesen und die beiden letzten Ziffern unter der Annahme einzugeben, daß die von Hand eingetragenen Zahlen richtig sind, wenngleich sie sich von den in die Antwortblasen des Gitters eingetragenen Markierungen unterscheiden.
Wenngleich in Fig. 6 mehrere AOIs in der Form zusammengeführter Bilder gezeigt sind, die Informationen aus den Abtastvorgängen im VIS-Modus und im MIR-Modus enthalten, ist dies nicht immer notwendig. Die zusammengeführten Bilder machen die dargestellten Daten erkennbar, wenngleich es andere Verfahren gibt. Wenn der Server 100 durch die Anwendung veranlaßt wird, Hinweiszeichen für die Bildschirmanzeige 600 zu entwickeln, könnten diese dazu verwendet werden, der die Anzeige betrachtenden Person bei der Erkennung des dargestellten AOIs zu helfen, falls die dargestellten Informationen nicht unmittelbar verständlich sein sollten.
Wenngleich die Verwendung eines Abtastens im MIR-Modus ein besonders wirksames Verfahren zur Trennung der auf einem Vordruck aufgezeichneten veränderlichen Daten von den Hintergrund-Druckinformationen darstellt, kann diese Trennung durch andere Verfahren geschehen. Wenn es wünschenswert sein sollte, lediglich ein VIS-Abtasten zu verwenden, könnten die AOIs durch ihren Ort festgelegt werden und unter Verwendung einer Hintergrundschablone zur Verringerung der Auswirkungen jeglicher Hintergrund-Druckinformationen ausgewertet werden. Dieses Verfahren könnte zur Trennung des in einem AOI enthalte nen Pixelbildes veränderlicher Daten von den Hintergrund- Druckinformationen verwendet werden, die Teil desselben Pixelbildes wären. Bei diesem System wäre es gewöhnlich weiterhin wünschenswert, eine "leere", unmarkierte Ausfertigung des Vordrucks abzutasten, um ein sauberes Hintergrundbild für jegliche durch Überlagern des Hintergrundes mit den in einem AOI erfaßten veränderlichen Daten zusammengeführte Bilder bereitzustellen.
In Fig. 7 ist der Aufbereitungsbildschirm 600 nach allen redaktionellen Eingriffen dargestellt. Die Berichtigungen und Hinzufügungen ermöglichen es, daß der Ausgabedatensatz des Dokumentes vervollständigt und für die Speicherung in der Hauptdatei 120 für die spätere Übertragung zu einem Hauptcomputer (nicht dargestellt) über den Kanal 122 fertiggemacht wird. Auf dem Hauptrechner kann ein Abonnementsauftrag gedruckt und verarbeitet werden, ein Brief gedruckt werden, in dem der antwortenden Person für seine/ihre Antwort gedankt wird und in dem er/sie benachrichtigt wird, daß er/sie für ein Abonnement in Frage kommt oder es können irgendwelche anderen Arbeitsvorgänge durchgeführt werden.
Eine weitere Anwendung, bei der die vorliegende Erfindung sehr nützlich wäre, ist die Verarbeitung von Bestellvordrucken oder -broschüren. Bei dieser Anwendung wird der von einem Kunden oder einem mit einem oder mehreren Kunden arbeitenden Vertreter der Firma ausgefüllte Bestellvordruck zur Erkennung der bestellten Produkte sowie deren Anzahl, der be stellenden Partei, der Lieferadressen, der Einzelheiten der Bezahlung usw. abgetastet. Bei einer solchen Anwendung könnte die Zusammenstellung des Ausgabe-Datensatzes auch die Prüfung der durch Verarbeiten verschiedener AOIs durch automatische Symbolverarbeitungseinrichtungen gewonnenen Informationen einschließen. Wenn ein Kunde beispielsweise eine Kundennummer bereitstellte, die zur Gewährung eines Kredites führen würde, könnte die Nummer zu Prüfungszwecken mit einer Reihe gültiger Kundennummern aus der Prüfungsdatenbank 168 verglichen werden, die auch Informationen hinsichtlich des Namens des Kun den oder Adresseninformationen enthalten kann, die für zusätzliche vergleichende Prüfungen verwendet werden könnten. Bei einer solchen Anwendung könnte ebenfalls ausgiebiger Gebrauch von der Übersetzungsdatenbank 164 gemacht werden. Wenn die OMR-Einträge beispielsweise zu einer Produktnummer führ ten, könnte diese Produktnummer in einen Produktnamen oder eine Produktbeschreibung übersetzt werden, die anstelle der Produktnummer oder zusammen mit dieser einem Ausgabe-Datensatz hinzugefügt werden könnte.

Claims

1. Verfahren zur Gewinnung von Information aus einem Dokument, das erste Kennzeichnungen, die in einem ersten Abtastmodus unter Verwendung von Licht eines ersten Spektralbereichs aber nicht in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs erkennbar sind, und zweite Kennzeichnungen, die entweder in dem ersten oder in dem zweiten Abtastmodus erkennbar sind und eine Information darstellen, die in einer oder mehreren mittels automatischer Symbolerkennungseinrichtungen dekodierbaren Formen kodiert ist, trägt, mit folgenden Schritten:

(a) Festlegen eines oder mehrerer in Betracht kommender Bereiche auf dem Dokument, in denen die zweiten Kennzeichnungen auftreten können, wobei die Festlegung eine Information über die Kodierform der zweiten Kennzeichnungen beinhaltet,

(b) Abtasten des Dokuments in dem zweiten Modus unter Verwendung eines Scanners, der ein Pixel-Bild der erkannten Kennzeichnungen erzeugt,

(c) Speichern der in Schritt (b) erhaltenen Pixel-Daten in einer Speichereinrichtung,

(d) Auswählen eines in Betracht kommenden Bereichs aus den für das Dokument festgelegten Bereichen und Verarbeiten des Pixel-Bilds des in Betracht kommenden Bereichs mittels einer automatischen Symbolerkennungseinrichtung, die für die für die zweiten Kennzeichnungen in dem ausgewählten in Betracht kommenden Bereich festgelegte Kodierform geeignet ist, und

(e) Erzeugen einer oder mehrerer Ausgabe-Datensätze mit Symbolinformation, die die durch die Verarbeitung in Schritt (d) erzeugten zweiten Kennzeichnungen darstellt.

2. Verfahren nach Anspruch 1, wobei der Auswahl- und Verarbeitungsschritt für das Pixel-Bild eines in Betracht kommenden Bereichs einen Schritt zur Bestimmung, ob der in Betracht kommende Bereich irgendeine der zweiten Kennzeichnungen enthält und zur Verarbeitung des Pixel-Bilds des in Betracht kommenden Bereichs lediglich dann, wenn dieser die zweiten Kennzeichnungen enthält, aufweist.

3. Verfahren nach Anspruch 2 mit einem Schritt zur Übertragung eines Pixel-Bilds jedes in Betracht kommenden Bereichs, der zweite Kennzeichnungen enthält, an eine Sichtanzeige zum redaktionellen Eingreifen.

4. Verfahren nach Anspruch 1, wobei der Schritt zur Auswahl und zur Verarbeitung eines in Betracht kommenden Bereichs eine Verarbeitung mittels eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR-Lesers, eines Lesers für handschriftliche numerische Daten oder eines Lesers für handschriftliche alphanumerische Daten als automatische Symbolerkennungseinrichtung beinhaltet.

5. Verfahren nach Anspruch 1 mit folgenden weiteren Schritten:

(f) Abtasten einer Ausfertigung des Dokuments, die lediglich die ersten Kennzeichnungen aufweist, unter Verwendung eines Scanners, der ein Pixel-Bild der erkannten ersten Kennzeichnungen erzeugt, in dem ersten Modus, und

(g) Speichern der in Schritt (f) erhaltenen Pixel-Daten in einer Speichereinrichtung.

6. Verfahren nach Anspruch 5 mit einem Schritt zur Übertragung eines Pixel-Bilds mindestens eines in Betracht kommenden Bereichs mit den zweiten Kennzeichnungen an eine Sichtanzeige zum redaktionellen Eingriff.

7. Verfahren nach Anspruch 6, wobei für den an die Sichtanzeige zu übertragenden mindestens einen in Betracht kommenden Bereich Pixel für Pixel eine Zusammenführung der Pixel-Bilder der Schritte (b) und (f) durchgeführt wird, um ein einziges zusammengeführtes Pixel-Bild mit sowohl den ersten als auch den zweiten Kennzeichnungen innerhalb des genannten mindestens einen in Betracht kommenden Bereichs zu erzeugen.

8. Verfahren nach Anspruch 7 mit folgenden weiteren Schritten:

(h) Bestimmen, ob die automatische Symbolerkennungseinrichtung, die jeden in Betracht kommenden Bereich verarbeitet, erfolgreich eine die zweiten Kennzeichnungen darstellende Symbolinformation erzeugt hat, und

(i) Übertragen eines einzigen zusammengeführten Pixel- Bilds für jeden in Betracht kommenden Bereich, für den die automatische Symbolerkennungsvorrichtung nicht in der Lage war, eine die zweiten Kennzeichnungen darstellende Symbolinformation zu erzeugen, an die Sichtanzeige.

9. Verfahren nach Anspruch 7 mit folgenden Schritten:

Komprimieren des in Schritt (b) erzeugten Pixel-Bilds vor der Durchführung von Schritt (c), um den Umfang an Pixel- Daten zur Darstellung von Bereichen des Dokuments, die keine in dem zweiten Modus erkennbaren Kennzeichnungen tragen, zu verringern, und

Entkomprimieren der in Schritt (c) gespeicherten Pixel- Daten vor der Durchführung der Zusammenführung Pixel für Pixel, um das Pixel-Bild von Schritt (b) zu erhalten.

10. Vorrichtung zur Gewinnung von Information aus einem Dokument, das erste Kennzeichnungen, die in einem ersten Abtastmodus unter Verwendung von Licht in einem ersten Spektralbereich erkennbar, in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs jedoch nicht erkennbar sind, und zweite Kennzeichnungen, die entweder in dem ersten Abtastmodus oder dem zweiten Abtastmodus erkennbar sind und in einer oder mehreren mittels automatischer Symbolerkennungseinrichtungen dekodierbaren Formen kodierte Information darstellen, trägt, wobei die Vorrichtung aufweist:

(a) eine Einrichtung zur Festlegung eines oder mehrerer in Betracht kommender Bereiche auf dem Dokument, in denen die zweiten Kennzeichnungen auftreten können, wobei die Festlegung eine Information über die Kodierform der zweiten Kennzeichnungen beinhaltet

(b) eine Einrichtung zur Abtastung des Dokuments in dem zweiten Modus unter Verwendung eines Scanners, der ein erstes Pixel-Bild der erkannten Kennzeichnungen erzeugt,

(c) eine Einrichtung zur Speicherung der Pixel-Daten des ersten Pixel-Bilds in einer Speichereinrichtung,

(d) eine Einrichtung zur Auswahl eines in Betracht kommenden Bereichs aus den für das Dokument festgelegten Bereichen und zur Verarbeitung des ersten Pixel-Bilds des in Betracht kommenden Bereichs mit einer automatischen Symbolerkennungseinrichtung, die für die Kodierform geeignet ist, die für die zweiten Kennzeichnungen in dem ausgewählten in Betracht kommenden Bereich festgelegt ist und

(e) eine Einrichtung zur Erzeugung einer oder mehrerer Ausgabe-Datensätze mit Symbolinformation, die die in der unter (d) genannten Verarbeitungseinrichtung erzeugten zweiten Kennzeichnungen darstellt.

11. Vorrichtung nach Anspruch 10 mit einer Einrichtung zur Komprimierung des ersten Pixel-Bilds, um den Umfang von Pixel-Daten zur Darstellung von Bereichen des Dokuments, die keine in dem zweiten Modus erkennbaren Kennzeichnungen tragen, zu verringern.

12. Vorrichtung nach Anspruch 10, wobei die Einrichtung zur Auswahl und zur Verarbeitung des Pixel-Bilds eines in Betracht kommenden Bereichs eine Einrichtung zur Bestimmung, ob der in Betracht kommende Bereich irgendeine der zweiten Kennzeichnungen enthält, und eine Einrichtung zur Verarbeitung des Pixel-Bilds des in Betracht kommenden Bereichs lediglich dann, wenn es zweite Kennzeichnungen enthält, aufweist.

13. Vorrichtung nach Anspruch 12 mit einer Einrichtung zur Übermittlung eines Pixel-Bilds jedes in Betracht kommenden Bereichs, der zweite Kennzeichnungen beinhaltet, an eine Sichtanzeige zum redaktionellen Eingriff.

14. Vorrichtung nach Anspruch 10, wobei die Einrichtung zur Auswahl und zur Verarbeitung eines in Betracht kommenden Bereichs eine Einrichtung zur Verarbeitung mittels eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR-Lesers, eines Lesers handschriftlicher numerischer Daten oder eines Lesers handschriftlicher alphanumerischer Daten als automatische Symbolerkennungseinrichtung beinhaltet.

15. Vorrichtung nach Anspruch 10, aufweisend:

eine Einrichtung, um in dem ersten Modus unter Verwendung eines Scanners, der ein zweites Pixel-Bild der erkannten ersten Kennzeichnungen erzeugt, eine Kopie des Dokuments, die lediglich die ersten Kennzeichnungen enthält, abzutasten, und eine Einrichtung zur Speicherung der Pixel-Daten des zweiten Pixel-Bilds in einer Computerspeichereinrichtung.

16. Vorrichtung nach Anspruch 11 und 15, mit einer Einrichtung zur Dekomprimierung der gespeicherten Pixel-Daten, um das erste Pixel-Bild zu erhalten, und einer Einrichtung zur Zusammenführung des ersten und des zweiten Pixel-Bilds Pixel für Pixel, um ein einziges zusammengeführtes Pixel-Bild mit sowohl den ersten als auch den zweiten Kennzeichnungen innerhalb mindestens eines in Betracht kommenden Bereichs zu erzeugen.

17. Verfahren nach Anspruch 1, wobei die ersten Kennzeichnungen vorgedruckte Hintergrund-Kennzeichnungen und die zweiten Kennzeichnungen aufgrund der ersten, vorgedruckten Kennzeichnungen vorgesehene variable Kennzeichnungen darstellen und wobei der Schritt zum Abtasten des Dokuments in dem zweiten Modus durch ein Abtasten des Dokuments unter Bildung eines Pixel-Bilds sowohl der vorgedruckten als auch der variablen Kennzeichnungen ersetzt ist und der Schritt zur Verarbeitung des Pixel-Bilds eines in Betracht kommenden Bereichs eine Hintergrund-Schablone zur Trennung des Pixel-Bilds der variablen Kennzeichnungen von den Hintergrund-Kennzeichnungen verwendet.