DE69118970T2 - Bildverarbeitungssystem für dokumentarische Daten - Google Patents

Bildverarbeitungssystem für dokumentarische Daten

Info

Publication number
DE69118970T2
DE69118970T2 DE69118970T DE69118970T DE69118970T2 DE 69118970 T2 DE69118970 T2 DE 69118970T2 DE 69118970 T DE69118970 T DE 69118970T DE 69118970 T DE69118970 T DE 69118970T DE 69118970 T2 DE69118970 T2 DE 69118970T2
Authority
DE
Germany
Prior art keywords
markings
pixel
pixel image
document
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69118970T
Other languages
English (en)
Other versions
DE69118970D1 (de
Inventor
Gary J Gustafson
Kenneth M Keogh
John V Mcmillin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Systems Inc
Original Assignee
National Computer Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Systems Inc filed Critical National Computer Systems Inc
Publication of DE69118970D1 publication Critical patent/DE69118970D1/de
Application granted granted Critical
Publication of DE69118970T2 publication Critical patent/DE69118970T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/06Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers
    • G09B7/066Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers with answer indicating cards, blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/12Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using a selected wavelength, e.g. to sense red marks and ignore blue marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Electromagnetism (AREA)
  • Toxicology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Storing Facsimile Image Data (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Description

    VERWANDTE ANMELDUNG
  • Diese Anmeldung ist mit einer anhängigen europäischen Patentanmeldung Nr. 91 109 601.4 (EP-A-0 461 622, offengelegt am 18. Dezember 1991) verwandt.
  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft allgemein Vorrichtungen zum Abtasten optischer Markierungen, Vorrichtungen zur Zeichenerkennung sowie Vorrichtungen zum Abtasten sichtbarer Bilder. Genauer gesagt betrifft die vorliegende Erfindung ein Bildverarbeitungssystem, das dazu geeignet ist, abgetastete Bilder mit verschiedenen intelligenten Symbolerkennungs(ISR)-Einrichtungen unter Einschluß eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR- Lesers, eines Lesers für handgeschriebene numerische Daten und/oder eines Lesers für von Hand in Druckschrift geschriebene alphanumerische Daten zu erfassen und zu verarbeiten und ASCII- oder gleichwertige auf Zeichen beruhende alphanumerische Daten zu erzeugen (im folgenden als ISR-System für handgeschriebene Druckzeichen bezeichnet), und das weiterhin dazu geeignet ist, Pixelbilder zu erhalten und diese vielfältigen Formen von Daten und Bildern zu integrieren. Die vorliegende Erfindung ist demnach ein Informationsverarbeitungssystem, das auf Dokumenten aufgezeichnete Daten unter Verwendung von automatischen Symbolerkennungseinrichtungen sowie von Vorrichtungen zur Bearbeitung und zur Zusammenführung von Pixelbildern gewinnt.
  • TECHNISCHER HINTERGRUND
  • Vorrichtungen zum Abtasten optischer Markierungen (nachfolgend als optische Markierungslese- oder OMR-Systeme bezeichnet) sind im Stand der Technik wohlbekannt. Es gibt eine große Vielfalt von Anwendungen, bei denen OMR-Systeme und abtastbare Vordrucke bei umfangreichen Sammlungen einzelner, auf Dokumenten aufgezeichneter Informationsbestandteile verwendet werden (beispielsweise die Ergebnisse standardisierter Tests, Volkszählungsinformationen, Untersuchungen von Vorlieben usw.). OMR-Systeme lesen im allgemeinen unter Verwendung von Markierungen, die einen im nahen Infrarotbereich (NIR) absorbierenden Farbstoff enthalten (beispielsweise unter Verwendung eines Bleistifts oder eines anderen Graphit oder eine andere Form von Kohlenstoff enthaltenden Schreibwerkzeugs vorgenommene Markierungen) in bestimmten vorgewählten Feldern des Vordrucks aufgezeichnete Daten. Diese Daten sind in der Hinsicht lagekodiert, daß ihre Bedeutung, abhängig davon, wo die Daten auf dem zu ihrer Aufzeichnung verwendeten Formatvordruck eingetragen sind, ausgewertet wird. Dies wird als Abtasten im NIR-Modus bezeichnet. Ein wesentlicher Vorteil des Abtastens im NIR-Modus (oder eines anderen auf einer begrenzten spektralen Empfindlichkeit beruhenden Abtastens) liegt darin, daß es die Trennung der durch Antworten markierten veränderlichen Daten von den auf demselben Dokument enthaltenen Standard-Hintergrunddruckinformationen ermöglicht.
  • Wenngleich sie eine neuere Entwicklung sind, sind Vorrichtungen zum Abtasten sichtbarer Bilder (im folgenden als Abtastvorrichtungen im VIS-Modus oder VIS-Systeme bezeichnet) im Stand der Technik ebenfalls wohlbekannt. Die meisten Anwendungen für gegenwärtige VIS-Systeme haben sich aus dem Wunsch heraus entwickelt, traditionelle Mikrofilm-Bilderfassungssysteme zu ersetzen. Folglich konzentrieren sich gegenwärtige VIS-Systeme auf die Erfassung des gesamten abgetasteten Bildes eines Dokumentes gebenüber den von gegenwärtigen OMR-Systemen durchgeführten Tätigkeiten der Erfassung, der Auflösung dunkler Markierungen und der Verarbeitung einzelner, in vorbestimmten Feldern aufgezeichneter Informationsbestandteile.
  • Eine der Einschränkungen gegenwärtiger OMR-Systeme, die sich auf vorbestimmte Felder konzentrieren, liegt darin, daß sie die Umgebung der vorbestimmten Felder eines abtastbaren Vordrucks nicht abtasten oder wiedergeben können. Folglich ist die Abrufung und die Betrachtung oder die Druckwiedergabe der gespeicherten oder archivierten unbearbeiteten Einzelinformationen aus einem von einem OMR-System abgetasteten Vordruck von begrenztem Wert, da es keine Möglichkeit gibt, diese Informationen auszuwerten, ohne auf den Vordruck, eine Transparentauflage oder gar, wie im Fall standardisierter Tests, auf eine zum Vordruck gehörige Broschüre zurückzugreifen.
  • VIS-Systeme können andererseits den gesamten Inhalt eines abtastbaren Vordrucks (Standard-Hintergrunddruckinformationen und alle veränderlichen Daten) als digitalisiertes Pixelbild wiedergeben, jedoch kann eine zugeordnete OMR-Verarbeitungslogik die in einem Pixelbild im VIS-Nodus des Vordrucks enthaltenen veränderlichen Einzelinformationen nicht ohne weiteres auswerten oder analysieren. Wenngleich viele feste und variable digitalisierte Daten durch VIS-Bilder erfaßt werden können, muß die Bedeutung der variablen Daten noch gewonnen werden, und es sind möglicherweise nicht alle im VIS-Modus erfaßten Daten von Interesse. Wenn beispielsweise ein Blatt Papier mit einer Größe von 8-1/2" x 11" bei einer vertikalen und horizontalen Auflösung von 120 Punkten pro Zoll (DPI) und bei einem acht Bit umfassenden Grauwertbereich abgetastet wird, können aus dieser einzigen Seite 1,3 Megabyte an abgetasteten Informationen auf der Bitebene erzeugt werden. Es ist offensichtlich, daß ein sehr großes Maß an Rechenleistung erforderlich sein kann, um bedeutsame Informationen auf der Bitebene oder gar örtlich begrenzte Pixelabschnitte (oft als in Betracht kommende Gebiete oder in Betracht kommende Bereiche (AOIs) bezeichnet) von einem mit einem VIS-System abgetasteten Vordruck zu gewinnen und zu analysieren. Weiterhin sind die Speicheranforderungen zur Speicherung aller dieser Informationen in einer Situation, in der hunderte oder tausende von Dokumenten zur Erfassung eines vollständigen Pixelbildes als Nebenprodukt der Erfassung der veränderlichen Daten verarbeitet werden, so groß, daß sie bei den meisten Anwendungen zu teuer sind.
  • Ein Verfahren, das zur Verringerung des Umfangs der zu speichernden Daten verwendet wurde, wenn Text und/oder Zahlen enthaltende Texte VIS-abgetastet werden, liegt in der Verwendung von Symbolerkennungssystemen (gewöhnlich computergestützt) zur Konvertierung des sichtbaren, aus Text und/oder Zahlen bestehenden Bildes in kompaktere, auf Zeichen beruhende alphanumerische Daten. Diese letzteren erfordern erheblich weniger Speicherplatz und bieten den weiteren Vorteil, daß sie als Eingabedatei für ein Textverarbeitungsprogramm, ein Textsuchprogramm oder verschiedene andere Programme zur Bearbeitung von aus Text und/oder numerischen Daten bestehenden Dateien verwendet werden können.
  • Die Art, in der Informationen auf einem Dokument aufgezeichnet oder kodiert sind, bestimmt im heutigen Stand der Technik im hohen Maße die Geschwindigkeit und die Genauigkeit, mit denen computergestützte Systeme die Informationen gewinnen und in die digitale Form übertragen können. Im gegenwärtigen Stand der Technik gibt es keine sehr wirksame Möglichkeit, einen handschriftlich erstellten Text in die digitale Form zu übertragen. Von Hand in Druckschrift abgefaßte Informationen können mit gewissem Erfolg ausgewertet und in die digitale Form übertragen werden, insbesondere, wenn der Symbolerkennungsprozessor in der Art eines neuronales Netzwerkes sehr anpassungsfähig ist. Diese Aufgabe ist am leichtesten, wenn die betroffenen Informationen numerischer Art sind, weil in diesem Fall die Gesamtheit der zu erkennenden Zeichen stark reduziert ist. Andere Formen der Informations kodierung ermöglichen eine einfachere Symbolerkennung und - umwandlung in digitale Daten. Die Erkennung von Strichcodes ist heutzutage eine ausgereifte Technik, die in der Herstellung, dem Vertrieb und dem Verkauf zur Erkennung von Produkten weitverbreitet ist. Die optische Zeichenerkennung gewisser gedruckter Schriftzeichen ist ebenfalls so weit fortgeschritten, daß eine schnelle und genaue Übersetzung gedruckter Informationen in digital gespeicherte alphanumerische Daten möglich ist. Das vorausgehend erwähnte OMR-Abtasten ist eine weitere hochentwickelte Technik, die die schnelle Ubersetzung lagekodierter Daten aus einer Dokumentenform in eine auf Zeichen beruhende alphanumerische Form ermöglicht.
  • Mit allen diesen gegebenen Möglichkeiten, können Personen, die Informationen gewinnen möchten, indem sie diese auf Dokumente aufzeichnen lassen, nun ein Dokument entwerfen, in dem eine oder mehrere der vorausgehend erwähnten Datendar stellungsformen vereinigt sind. In dem Maße, in dem das Dokument mehrere unterschiedliche Datendarstellungsformen aufweist, ergeben sich andere Schwierigkeiten, die die Frage betreffen, wie das Dokument unter Verwendung automatischer Einrichtungen schnell in auf Zeichen beruhende Daten übertragen werden kann. Darüber hinaus werden in dem Maße, in dem in einem Dokument zugelassen wird, daß gewisse Daten von Hand durch druckschriftliche Markierungen oder Schriftzeichen aufgezeichnet werden, manche aufgezeichneten Informationen hinsichtlich der durch die zur Auswertung der Informationen verwendeten automatischen Symbolerkennungseinrichtung festgelegten Kriterien mehrdeutig sein (beispielsweise schwache OMR- Markierungen, grobe Schmutzflecken oder Radierstellen, schlecht wiedergegebener Druck von OCR-Schriftzeichen sowie wenig sorgfältige, von Hand vorgenommene druckschriftliche Eintragungen), und andere aufgezeichnete Informationen überschreiten entweder die Möglichkeiten der verfügbaren Symbolerkennungstechnologie (beispielsweise handschriftlich vorgenommene Eintragungen) oder sind nur in ihrer vollen, unbearbeiteten sichtbaren Form von Bedeutung (beispielsweise eine Unterschrift oder eine Skizze).
  • Es werden ein System und ein Verfahren zum Abtasten eines Dokuments benötigt, mit denen in vielfältiger Weise kodierte Informationen so verarbeitet werden können, daß die gewünschten Informationen, wenn möglich, in auf Zeichen beruhender alphanumerischer Form gewonnen werden können, während die Möglichkeit erhalten bleibt, alle oder einen Teil der Informationen in der sichtbaren Form eines "elektronischen Bildes" für die Untersuchung durch einen menschlichen Bediener zu erhalten.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung ist ein Bildverarbeitungssystern, das dazu geeignet ist, von einer Vorrichtung zum Abtasten im NIR-Modus und einer Vorrichtung zum Abtasten sichtbarer Bilder erfaßte abgetastete Bilder zu verwalten und verschiedene Symbolerkennungseinrichtungen zur Gewinnung von auf Dokumenten aufgezeichneten, in einer Anzahl unterschiedlicher Formen kodierten Informationen zu verwenden, und die Informationen in auf Zeichen beruhende alphanumerische Daten umzuwandeln oder sie als digitales Bild zu speichern.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein Bildverarbeitungssystem zu schaffen, das dazu geeignet ist, von einer Vorrichtung zum Abtasten optischer Markierungen (NIR-Modus) und von einer Vorrichtung zum Abtasten sichtbarer Bilder (VIS-Modus) erfaßte abgetastete Bilder zu verwalten.
  • Es ist eine weitere Aufgabe der vorliegenden Erfindung, ein Bildverarbeitungssystem zu schaffen, das dazu geeignet ist, abgetastete Bilder von vorbestimmten in Betracht kommenden Bereichen auf abgetasteten Dokumenten zu gewinnen und eine Anzahl von Symbolerkennungseinrichtungen zur Ubersetzung der abgetasteten Informationen von Bildern im Pixelformat in alphanumerische Daten in auf Zeichen beruhender Form zu verwenden, um einem digitalen Informationsverarbeitungssystem einen integrierten Ausgabe-Datensatz zu liefern.
  • Es ist eine weitere Aufgabe der vorliegenden Erfindung, eine Einrichtung zur Erfassung von Informationen aus einem mit Antworten markierten Dokument zu schaffen, bei der der erforderliche Computerspeicherplatz zur Speicherung aller wichtigen Informationen auf dem Dokument gegenüber einem nichtkomprimierten, vollständigen, Pixel für Pixel gegebenen Bild des Dokumentes erheblich verringert ist.
  • Noch eine weitere Aufgabe der vorliegenden Erfindung ist die Schaffung eines wirksamen Systems zur Gewinnung von Informationen aus Dokumentenvordrucken, die in einer Anzahl von Kodierschemata kodierte Antwortinformationen enthalten.
  • Diese und andere Aufgaben der vorliegenden Erfindung werden bei Bezugnahme auf die Zeichnung, die detaillierte Beschreibung der bevorzugten Ausführungsform und die beigefügten Ansprüche deutlich.
  • BESCHREIBUNG DER ZEICHNUNG
  • Fig. 1 ist ein Blockdiagramm der Gesamtfunktionsweise des Bildverarbeitungssystems der vorliegenden Erfindung.
  • Fig. 2 ist eine schematische Bilddarstellung der in ein Netzwerk integrierten vorliegenden Erfindung.
  • Fig. 3 ist eine Draufsicht auf einen Muster-Dokumentenvordruck, der mittels der vorliegenden Erfindung wirksam verarbeitet werden kann und der die allen Ausfertigungen des Dokumentenvordrucks gemeinsamen gedruckten Informationen sowie bestimmte zusätzliche auf dem Vordruck ausgedruckte Informationen für die automatische Verarbeitung enthält.
  • Fig. 4 ist eine Draufsicht auf einen Muster-Dokumentenvordruck aus Fig. 3, der mit Antworten versehen ist, die die Informationen darstellen, die mit der vorliegenden Erfindung gewonnen werden sollen.
  • Figuren 5a und 5b sind Flußdiagramme, die das Verfahren der vorliegenden Erfindung zur Verarbeitung eines mit Antworten versehenen Dokumentenvordrucks aus Fig. 4 zeigen.
  • Fig. 6 ist eine Darstellung einer gemäß der vorliegenden Erfindung erzeugten Bildschirmanzeige nach dem Abtasten des mit Antworten versehenen Dokuments aus Fig. 4 und dem Verarbeiten der festgelegten in Betracht kommenden Bereiche mit den in der vorliegenden Erfindung verfügbaren automatischen Symbolerkennungseinrichtungen.
  • Fig. 7 ist eine Darstellung einer Bildschirmanzeige, wie der in Fig. 6 gezeigten, nach dem redaktionellen Eingriff einer Redaktionsperson zur Gewinnung von Informationen aus dem mit Antworten versehenen Dokument aus Fig. 4.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Fig. 1 ist ein Blockdiagramm der Funktionsweise der verschiedenen Elemente der vorliegenden Erfindung. Der größte Teil der Funktionen der Erfindung wird in einem Server 100 ausgeführt, der ein Datenverarbeitungssystem ist, das aus einem UNIX-Server mit mehreren Gigabyte an Plattenspeicher oder einem anderen gleichschnellen Sekundärspeicher besteht. Im Server 100 befindet sich eine ein Scanner-Steuermodul 30 enthaltende Softwareausstattung, die die Arbeit von bis zu drei optischen Scannern 20 steuert und die über Datenübertragungskanäle 22 Daten von diesen empfängt. Weiterhin befindet sich im Server 100 ein Modul 40 zur Erzeugung von Anwendungen, das die Entwicklung einer großen Anzahl dokumentenspezifischer Abtast- und Verarbeitungsaufgaben des im folgenden beschriebenen Typs ermöglicht.
  • Ein Systemverwaltungsmodul so ist über einen Kanal 42 mit einem Modul 40 zur Erzeugung von Anwendungen verbunden.
  • Eine aus einem Datenübertragungskanal 12 und einer Bedieneranzeige (in Fig. 1 nicht gezeigt) bestehende Bedienerschnittstelle 12 ermöglicht es einem Bediener 10, den Server 100 zu überwachen und in den gewöhnlichen, in einem komplexen Datenverarbeitungssystem auftretenden Steuersituationen einzugreifen. Ein Kanal 52 verbindet das Systemverwaltungsmodul 50 mit anderen Servern (s. Fig. 2). Ein Kanal 56 verbindet das Systemverwaltungsmodul 50 mit dem Dateiverwaltungssystem 60. Das Dateiverwaltungssystem 60 ist mit einer Anzahl von Dateien verknüpft, deren Funktionen nachfolgend eingehender be schrieben werden, nämlich über einen Kanal 62 mit einer Rohbild-Datenbankdatei 162, über einen Kanal 64 mit der Übersetzungsdatenbank 164, über einen Kanal 66 mit einer Auftragswarteschlangendatei 166, über einen Kanal 68 mit einer Prüfungsdatenbank 168 und über einen Kanal 70 mit einer Anwendungsdatenbank 170.
  • Ein Kanal 58 verbindet das Systemverwaltungsmodul 50 mit dem Arbeitsablauf-Steuermodul 80. Das Arbeitsablauf-Steuermodul 80 steuert den Arbeitsfluß zu einem ISR-System 110 für handgeschriebene Druckzeichen, das eine von mehreren in der vorliegenden Erfindung verwendeten Symbolerkennungseinrichtungen ist. Diese spezielle automatische Symbolerkennungseinrichtung ist beim gegenwärtigen Stand der Technik so komplex, daß sie vorzugsweise in der Form eines externen Hardware- Software-Bauteils verwirklicht ist. Die anderen in der bevorzugten Ausführungsform der vorliegenden Erfindung verwendeten Symbolerkennungseinrichtungen umfassen einen Strichcodeleser, einen optischen Markierungsleser und einen Schriftzeichen- OCR-Leser. Diese können in der auf dem Server 100 befindlichen Software verwirklicht sein. Andernfalls kann der OMR-Leser für standardgemäße optische Markierungsdaten in einen Scanner 20 eingebaut sein, und die externen Vorrichtungen eines Strichcodelesers 112, eines Schriftzeichen-OCR-Lesers 114 und eines speziellen (nicht standardgemäßen) OMR-Lesers 116 können, wie in Fig. 1 gezeigt ist, über Kanäle 87, 88 bzw. 89 mit dem Arbeitsablauf-Steuermodul 80 verbunden sein. Wenngleich das ISR-System 110 für handgeschriebene Druckzeichen in dem bevorzugten Ausführungsbeispiel abhängig von den Anforderungen an das System und von Kostenfragen alle alphanumerischen Zeichen lesen kann, kann ein etwas weniger hoch entwickelter Leser lediglich handgeschriebener numerischer Daten oder lediglich von Hand in Druckschrift abgefaßter alphabetischer Daten verwendet werden. Weiterhin sind eine oder mehrere Aufbereitungsarbeitsplätze 90 über Kanäle 82 mit dem Arbeitsablauf-Steuermodul 80 verbunden. Ein Kanal 84 verbindet das Arbeitsablauf-Steuermodul 80 mit dem Dateiverwaltungssystem 60, so daß das Arbeitsablauf-Steuermodul 80 auf Informationen zugreifen kann, die vom Scanner-Steuermodul 30 erhalten wurden, sowie auf Informationen, die in den verschiedenen mit dem Dateiverwaltungssystem 60 verbundenen Dateien gespeichert sind, und diese zu einem ISR-System 110 für handgeschriebene Druckzeichen, einem Strichcodeleser 112, einem Schriftzeichen-OCR-Leser 114 und einem speziellen OMR-Leser 116 oder zu einem Aufbereitungsarbeitsplatz 90 übertragen kann.
  • Eine Hauptdatei 120, die über einen Kanal 124 mit dem Systemverwaltungsmodul 50 und über einen Kanal 126 mit dem Arbeitsablauf-Steuermodul 80 verbunden ist, wird zur Zusammensetzung von Ausgabedatensätzen verwendet, die über den Hauptdatenübertragungskanal 122 zu einem Hauptsystem (nicht eingezeichnet) übertragen werden. Die Ausgabe-Datensätze bilden ein wesentliches Endergebnis der vorliegenden Erfindung. Wie später in näheren Einzelheiten beschrieben wird, bestehen die Ausgabe-Datensätze aus Informationen im auf Zeichen beruhenden alphanumerischen Format oder im Pixelbildformat, die der Server 100 aus den durch den Scanner 20 abgetasteten Dokumenten gewinnt. Die vom Scanner 20 erzeugten Pixelbilder von Dokumenten werden gemäß der vorliegenden Erfindung so verarbeitet, daß die meisten Pixeldaten automatisch oder halbautomatisch zur Umwandlung der Pixelbilder der Dokumente in verwendbare, auf Zeichen beruhende alphanumerische Datensätze umgewandelt werden, während einige Pixeldaten in der Bildform verbleiben.
  • Die vorliegende Erfindung ist zur Gewinnung von Daten aus Dokumenten geeignet, die in einer großen Anzahl optisch abtastbarer Formate kodierte Informationen enthalten. Hierbei kann es sich um Daten jeglicher Art handeln. Die am besten geeigneten Situationen für die Verwendung der Erfindung sind Datenerfassungssituationen, in denen ein großer Datenumfang gesammelt und verarbeitet werden muß und in denen ein Dokumentenvordruck verwendet werden kann, um die Erfassung von Informationen zu lenken. Typischerweise werden Informationen einer antwortenden Person erfaßt, die den Dokumentenvordruck oder eine zugehörige Broschüre liest und Antwortkennzeichnungen verschiedener Art auf dem Dokumentenvordruck markiert oder diese auf den Dokumentenvordruck schreibt. Allen antwortenden Personen wird im wesentlichen das gleiche Dokument gegeben, wenngleich die einzelnen, den jeweiligen antwortenden Personen ausgehändigten Vordrucke unterschiedliche Informationen enthalten können, die dazu verwendet werden, die jeweilige antwortende Person oder möglicherweise einen Teil der antwortenden Personen oder irgendeinen bei einer antwortenden Person einzigartigen Umstand zu identifizieren.
  • Fig. 2 zeigt eine schematische Bilddarstellung der in einem Hochgeschwindigkeitsnetzwerk (z. B. Ethernet) verwendeten vorliegenden Erfindung. In Fig. 2 ist der Server 100 ebenso wie in Fig. 1 mit drei Scannern verbunden. Ein Server Bedienpult 102 und ein Überwachungs-Anschlußgerät 104 sind ebenfalls mit dem Server 100 verbunden. Mehrere Aufbereitungsarbeitsplätze 90 sind mit dem Server 100 verbunden. Eine Brücke 51 verbindet den Server 100 mit einem Datenübertragungs-Server 130, der wiederum über einen Kanal 122 mit einem Hauptcomputer verbunden ist, sowie mit einem Modem 132, das dazu verwendet werden kann, zur Unterstützung beim Auftreten von Fehlern einen wählbaren Zugang zum System zu bieten.
  • Die Leitung 52 verbindet den Server 130 mit einer weiteren Brücke 251, die zu einem weiteren Server 200 führt. Der Server 200 gleicht im wesentlichen dem Server 100, und die Vorrichtungen in seinem Netzwerk sind mit denselben Bezugszahlen versehen, wie die entsprechenden Vorrichtungen für den Server 100, jedoch mit einer vorangestellten "2". Die mit dem Server 200 verbundenen Aufbereitungsarbeitsplätze 290 ent sprechen daher den mit dem Server 100 verbundenen Aufbereitungsarbeitsplätzen 90. Die Leitung 52 führt auch zu einem weiteren Server 300, wobei die Bezugszahlen wiederum die Entsprechung gleicher Vorrichtungen des Netzwerks für den Server 100 zeigen, abgesehen davon, daß eine vorangestellte "3" verwendet wird. Mit der zum Server 300 führenden Leitung 52 ist weiterhin eine löschbare Bildplatten-Speichervorrichtung 142 vom "Jukebox"-Typ mit einem eigenen Server 140 verbunden, die für die Verwendung als Massenspeicher zur Archivierung oder für andere Zwecke vorgesehen ist.
  • Fig. 3 ist eine Draufsicht eines für die effiziente Verarbeitung gemäß der vorliegende Erfindung entwickelten Dokumentenvordrucks 400. Der Vordruck 400 enthält das allen Ausfertigungen des Dokumentenvordrucks gemeinsame Druckmaterial sowie gewisse zusätzliche für die automatische Verarbeitung auf dem Vordruck ausgedruckte Informationen. Der Dokumentenvordruck 400 aus Fig. 3 zeigt die verschiedenen Möglichkeiten der vorliegenden Erfindung. Er stellt ein typisches Dokument dar, das dazu verwendet werden könnte, Informationen von einer Anzahl vieler antwortender Personen, in diesem Fall Abonnenten oder möglichen Abonnenten einer erdachten, "PC News" genannten Zeitschrift zu gewinnen. Jeder Abonnent erhält den gleichen Dokumentenvordruck 400, abgesehen davon, daß der Vordruck, den jeder Abonnent erhält, gewisse in der oberen linken Ecke (der mit 410 bezeichnete, von einer unterbrochenen Linie umgebene Bereich) ausgedruckte Informationen enthält, die den Abonnenten kennzeichnen (Name, Firma, Adresse usw.).
  • Der Dokumentenvordruck 400 aus Fig. 3 weist einige der Merkmale eines typischen, ausschließlich für das OMR-Abtasten entwickelten Antwort-Dokumentenvordrucks auf. Das heißt, er weist die übliche entlang des rechten Randes verlaufende Markierungsspalte 402 auf, die als Taktspur dient, sowie einen entlang des unteren Randes verlaufenden Kontrastkalibrierungsstrich 404. Alle auf dem Vordruck 400 sichtbaren Druckinformationen sind mit Ausnahme des Kontrastkalibrierungs strichs 404, der Taktspur 402 und der in dem mit 410 bezeichneten Bereich enthaltenen Druckinformation mit einer Tintenfarbe gedruckt, die für eine lesende Person leicht sichtbar ist, die jedoch keinen Kohlenstoff oder ein anderes Material enthält, das Licht des nahen Infrarotbereichs absorbiert oder das in einem Scanner im NIR-Modus erkennbar ist. Die Druckertinte für den Kontrastkalibrierungsstrich 404, die Taktspur 402 und die Druckinformation innerhalb des mit 410 bezeichneten Bereichs enthält Graphit oder ein anderes Material, das sie Licht des nahen Infrarotbereich absorbieren läßt. (Zur Korrektur einer Schräglage sowie für andere Ausrichtungszwecke verwendete Triangulationsmarkierungen, die in näheren Einzelheiten in der vorausgehend erwähnten verwandten Anmeldung beschrieben sind, würden auch mit MIR-Licht absorbierender Tinte gedruckt werden). Wenn der Vordruck 400, wie er in Fig. 3 erscheint, in einem MIR-Modus abgetastet wird, erscheint dieser daher im sich ergebenden Pixelbild, abgesehen von der Taktspur 402, dem Kontrastkalibrierungsstrich 404 und der Druckinformation im Bereich 410 als unbedruckt. Wenn der Vordruck 400, wie er in Fig. 3 erscheint, andererseits mit einem im VIS-Modus arbeitenden Scanner abgetastet wird, erscheinen alle in Fig. 3 auftretenden Druckinformationen in dem sich aus dem VIS-Abtasten ergebenden Pixelbild (mit Ausnahme der Bezugszahlen und der zur Kennzeichnung von zu den Bezugszahlen gehörigen Bereichen verwendeten unterbrochenen Linien, die Artefakte einer Patentzeichnung sind).
  • Es ist ersichtlich, daß der Vordruck 400 erste Kennzeichnungen (alle Druckinformationen mit Ausnahme der Taktspur 402, des Kontrastkalibrierungsstrichs 404 und der Druckinformation im Bereich 410) enthält, die in einem Abtastmodus unter Verwendung von Licht eines ersten Spektralbereichs, in diesem Fall des Bereichs des sichtbaren Lichtes erkennbar sind, jedoch nicht in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs, also in einem zweiten Abtastmodus unter Verwendung von Licht des nahen Infrarotbereichs. Der Vordruck 400 enthält weiterhin zweite Kennzeichnungen (die Taktspur 402, den Kontrastkalibrierungsstrich 404 und die Druckinformation im Bereich 410), die entweder im ersten oder im zweiten Abtastmodus erkennbar sind. Wie später in näheren Einzelheiten erklärt wird, ist es diese Fähigkeit, die auf der Oberfläche eines Vordrucks enthaltenen Informationen, abhängig von den Tintentypen sowie der spektralen Empfindlichkeit der verwendeten Scanner, in zwei Klassen einzuteilen, aus der sich viele Vorteile dieser Erfindung ergeben.
  • In Fig. 4 ist der gleiche Vordruck wie in Fig. 3 dargestellt, abgesehen davon, daß der Vordruck 400 in Fig. 4 die von der antwortenden Person in den Vordruck eingetragenen Markierungen, schriftlichen Eintragungen und anderen Informationen zeigt. Wie man sieht, hat die antwortende Person Markierungen in einer Anzahl von Antwortblasen vorgenommen, handschriftliche Antworten in bestimmte Bereiche für Antworten in nicht festgelegter Form geschrieben, verschiedene Buchstaben und Zahlen in bestimmte Antwortbereiche eingetragen und einen Strichcode-Aufkleber in einem Bereich angebracht. Der Empfänger dieses mit Antworten versehenen Vordrucks 400 möchte die in den Antworten enthaltenen Informationen mittels einer automatischen Einrichtung gewinnen, wobei die Möglichkeit für eine Person gegeben sein sollte, die Ergebnisse der automatischen Verarbeitung durch die verschiedenen vorausgehend erwähnten intelligenten Symbolerkennungseinrichtungen zu überprüfen und einzugreifen, wenn die automatische Verarbeitung nicht in der Lage ist, die gesuchten Informationen zu erhalten, und daher keine auf Zeichen beruhenden, die zu dekodierenden Informationen wiedergebenden alphanumerischen Daten liefern kann.
  • Der erste Schritt bei der Verwendung der vorliegenden Erfindung zur Gewinnung von Informationen aus einem Antwort- Dokumentenvordruck, wie dem in Fig. 3 gezeigten, liegt in der Festlegung der erforderlichen anwendungsspezifischen Verarbeitung. Anwendungen sind so festgelegt, daß sie sich auf ein oder mehrere abtastbare Dokumente konzentrieren, die hinsichtlich einer logischen Gruppierung eine einzige Eingabeeinheit für das Abtastsystem bilden. Der Vordruck 400 stellt eine Einheit dar, die aus einer einzigen Seite besteht. Eine von einer antwortenden Person auszufüllende Testbroschüre mit mehreren Seiten oder ein Bestellvordruck mit mehreren Seiten ist eine mehrere Seiten umfassende Einheit. Die Anwendungsfestlegung enthält die Spezifizierung maschinenlesbarer Dokumenterkennungssymbole und Eintragungserfordernisse sowie Vorschriften für die Abfolge des Dokuments. Diese ermöglichen es, daß ein Scanner 20 erkennt, ob ihm Dokumente vorliegen, die zu den für die Anwendung festgelegten Abtastverfahren passen, und den Abschluß einer einzelnen Abtasteinheit zu erkennen. Die Anwendung legt auch sogenannte in Betracht kommende Bereiche (AOIs) fest. Ein in Betracht kommender Bereich kann irgendein Bereich auf der Oberfläche des Vordrucks 400 sein. (Während in manchen Anwendungen die vordere und die hintere Oberfläche eines Dokumentenvordrucks verwendet werden, wird in der folgenden Diskussion des Vordrucks 400 zur Klarheit der Beschreibung der vorliegenden Erfindung angenommen, daß dessen erste und zweite Kennzeichnungen nur auf eine Oberfläche gedruckt sind, nämlich die in den Figuren 3 und 4 gezeigte Oberfläche).
  • In der Anwendungsfestlegung sind auch die in Betracht kommenden Objekte innerhalb der Anwendung festgelegt ("Objekte") . Objekte sind typischerweise logisch gruppierten Ausgabedaten zugeordnet. Beispielsweise sind der Name, die Adresse, die Frage Nr. 2 und die Sozialversicherungsnummer jeweils Objekte auf einem Dokument, die einen Satz sinnvoller Daten darstellen. Ein einziges Objekt kann zu mehreren AOIs auf dem Dokument führen. Um beispielsweise das Adressenobjekt auf dem Vordruck 400 zu zerlegen, muß das System die die Umschlagadresse, die Stadt, den Bundesstaat und die Postleitzahl enthaltenden Bereiche auf dem Vordruck 400 auswerten, die aus Wirksamkeits- oder Zeichnungsgründen alle eigene AOIs haben können. Objekte können daher als Zusammensetzungen von AOIs auf dem Dokument mit für jedes AOI festgelegten Verarbeitungseinrichtungen festgelegt sein und einen oder mehrere Ausgabeteile aufweisen. Die Ausgabe kann hinsichtlich der Form und der Gliederung für jedes Objekt festgelegt sein. Die Ausgabe für ein Namensobjekt kann aus vier Feldern, nämlich dem Vornamen als ASCII-Feld, dem Nachnamen als ASCII-Feld, dem Anfangsbuchstaben des zweiten Vornamens als Zeichen- ASCII-Feld sowie dem Bild der Unterschrift selbst bestehen. Diese Felder sind hinsichtlich der Größe und der Reihenfolge festgelegt, so daß für die weitere Verarbeitung eine übereinstimmend verwendbare Gliederung für einen Ausgabe-Datensatz gebildet wird.
  • Alle Vorschriften und anderen Informationen, die an der Festlegung einer Anwendung beteiligt sind, werden in der Anwendungsdatenbank 170 und/oder der Übersetzungsdatenbank 164 und/oder der Prüfungsdatenbank 168 gespeichert.
  • Fig. 3 zeigt eine Anzahl von durch unterbrochene Linien in Fig. 3 festgelegten AOIs. (Diese unterbrochenen Linien könnten auf dem Vordruck 400 unter Verwendung von Tinte ausgedruckt sein, die nur im ersten Abtastmodus erkennbar ist, sie sind jedoch für die antwortenden Personen ohne Bedeutung und treten normalerweise auf dem Vordruck 400 nicht auf). Ein AOI 410 legt den Bereich fest, in dem einige für den Abonnenten/die antwortende Person spezifische Informationen in einer Schrift ausgedruckt sind, die von einem Schriftzeichen-OCR- Leser "gelesen" oder dekodiert werden kann. Ein AOI 420 enthält zwei Ja-Mein-Fragen, die jeweils mit zwei entsprechenden von der antwortenden Person zu markierenden OMR-Antwortbereichen oder "Blasen" versehen sind. Die AOIs 430 und 440 enthalten jeweils mehrere OMR-Antwortblasen, die einer Anzahl von Auswahlen entsprechen, die die antwortende Person durchführen kann. Dem AOI 430 und dem AOI 440 ist ein Bereich 435 bzw. 445 zugeordnet, der die Eintragung von Informationen in nicht festgelegter Form durch die antwortende Person ermöglicht. In der letzten OMR-Antwortblase in jedem der AOIs 430 und 440 wird der Benutzer aufgefordert, darauf hinzuweisen, daß in den zusammen mit den AOIs 435 und 445 auftretenden Zeilen ein Eintrag in nicht festgelegter Form beigefügt ist. Ein AOI 450 ist ein gitterförmiger Antwortbereich, der an den Schnittpunkten des Gitters OMR-Antwortblasen aufweist. Im AOI 460 wird die antwortende Person aufgefordert, jeweils einen Druckbuchstaben oder eine Zahl in einzelne freie Plätze gleicher Größe einzutragen. Durch diese anleitende Form des Antwortfeldes wird es für das ISR-System 110 für handgeschriebene Druckzeichen sehr viel einfacher, die Markierungen zu "lesen" oder zu dekodieren. Ein AOI 470 ist für eine Unterschrift vorgesehen, die normalerweise von einer automatischen Symbolerkennungseinrichtung nicht verarbeitet wird. Statt dessen wird eine Unterschrift einfach als Pixelbild abgespeichert. Ein AOI 480 ist dem AOI 460 abgesehen davon ähnlich, daß in den vorbestimmten Plätzen lediglich Zahlen von Hand eingetragen werden. Ein AOI 490 ist dem AOI 450 sehr ähnlich und weist wiederum Antwortblasen in einem Gittermuster auf, von denen jede einzelne oder mehrere markiert sein können. Der AOI 500 ist ein nicht begrenzter Antwortbereich in nicht festgelegter Form, in dem handschriftliche, von heutigen ISR- Systemen für handgeschriebene Druckzeichen nicht lesbare Ant worten zu erwarten sind. Dementsprechend kann das Auftreten jeglicher handgeschriebener Bemerkungen in diesem AOI, wie beim AOI 480 für die Unterschrift, das Abspeichern eines Pixelbildes des gesamten beschriebenen Bereichs nach sich ziehen. Ein AOI 510 ist ein Bereich, der für das Einfügen eines vorgedruckten Strichcodes von einem Aufkleber oder einer anderen Quelle vorgesehen ist. Dieser AOI 510 wird von einem Strichcode-Leser verarbeitet. Ein AOI 520 enthält eine Mischung von OMR-Blasen und für handgeschriebene Zahlen vorbestimmte Bereiche, die die gleichen Informationen enthalten, wenn sie richtig ausgefüllt sind.
  • Die Figuren 5a und 5b enthalten Flußdiagramme, in denen der Gesamtablauf für die Verarbeitung entsprechend der vorliegenden Erfindung beschrieben ist. Die durch die Flußdiagramme ausgeführten verschiedenen logischen Schritte und Arb eitsabläufe werden vom Server 100 unter Verwendung der Scanner 20, der Aufbereitungsarbeitsplätze 90 und der ISR-Einrichtungen 110, 112, 114 und 116 ausgeführt. Die Scanner 20 tasten im VIS-Modus ab, wenn sie die Informationen auf einem unmarkierten Vordruck 400 erfassen oder im MIR-Modus, wenn sie die Markierungen auf einem mit Markierungen versehenen Vordruck 400 erfassen. In der bevorzugten Ausführungsform kann jeder der Scanner in beiden Modi abtasten und unter der Steuerung des Scanner-Steuermoduls 30 von einem Modus in den anderen wechseln. In weniger hochentwickelten Systemen wäre es gleichermaßen annehmbar, wenn ein Scanner 20 ausschließlich für das Abtasten im VIS-Modus vorgesehen wäre und andere ausschließlich für das Abtasten im MIR-Modus vorgesehen wären. Es ist lediglich erforderlich, daß die Steuerlogik ein Signal empfängt, das den aktuellen Abtastmodus anzeigt.
  • Wenn ein Dokument abgetastet wird, überträgt der Scanner 20 ein vollständiges, nicht komprimiertes, unbearbeitetes Pixelbild in einen geeigneten Zwischenspeicher, üblicherweise einen "Bildscanner", der Teil des Scanners 20 ist. Das Pixelbild im Bildscanner wird vorzugsweise unter Verwendung von einer der unter den Namen "Runlength", "Huffman" oder "LZW" bekannten verlustlosen Komprimierungstechniken komprimiert. Wenn es sich um eine VIS-Abtastung eines unmarkierten Dokumentenvordrucks handelt (der dennoch einige für die spezielle Ausfertigung des Dokumentenvordrucks kennzeichnende Daten, wie die Informationen zur Erkennung der antwortenden Person im AOI 410 enthalten kann), so wird das komprimierte Pixelbild nicht mit einer automatischen Symbolerkennungseinrichtung verarbeitet. Die Pixeldatei wird dementsprechend für die spätere Verwendung in einer Zusammenfügungsoperation unter Einschluß veränderlicher Daten aus einer NIR-Abtastung, bei der das Pixelbild der VIS-Abtastung typischerweise als Hintergrund verwendet wird, abgespeichert. Falls es sich um eine MIR-Abtastung handelt, überträgt der Scanner 20 wiederum ein vollständiges, nicht komprimiertes, unbearbeitetes Pixelbild in einen geeigneten Zwischenspeicher in der Art eines Bildscanners, und das gespeicherte Bild wird vorzugsweise komprimiert, bevor es in einer permanenten Datei abgespeichert wird.
  • Da die MIR-Abtastung nur Markierungen oder Druckinformationen berücksichtigt, die Licht im nahen Infrarotbereich absorbieren, wird ein großer Teil dessen, was auf dem Vordruck 400 erscheint, im sich ergebenden Pixelbild nicht berücksichtigt. Die Tinte für die typischen, auf dem Vordruck erscheinenden vorgedruckten Informationen ist demnach bei der MIR- Abtastung unsichtbar, und mit dieser Tinte bedruckte Bereiche erscheinen als weiße, eine begrenzte Menge an dunkleren Antwortmarkierungen umgebende Stellen. Da die Menge solcher weißer Stellen im Vergleich zu den dunkleren Antwortmarkierungen bei den meisten Anwendungen sehr groß ist, kann eine beträchtliche Komprimierung erreicht werden. Eine weitere Komprimierung ist möglich, wenn die einzigen Bereiche des Pixelbildes der MIR-Abtastung gewisse festgelegte AOIs sind, wenn diese AOIs weniger als nahezu die gesamte Oberfläche des Dokumentes ausmachen, oder wenn für jedes eine Inhaltsprüfung vorgenommen wird, bevor es für die Speicherung zugelassen wird, um festzustellen, ob überhaupt irgendwelche Markierungen vorhanden sind. Die spezielle verwendete Inhaltsprüfung hängt vom Typ der verwendeten Informationskodierung ab. Beispielsweise würde bei OMR-Daten nur dann das Vorhandensein eines Inhalts festgestellt werden, wenn einige OMR-Blasen innerhalb des AOI einen beträchtlichen Grauwertinhalt aufwiesen. Für Strichcode-Daten müßte ein sinnvolles Strichcode-Muster gegeben sein. Damit festgestellt würde, daß ein AOI von Hand eingetragene druckschriftliche Markierungen enthält, müßte eine sinnvolle Gesamtgrauwertdichte überschritten sein. Bei manchen Anwendungen, wie beispielsweise einem Besteilvordruck mit einer umfangreichen Liste auswählbarer Produkte könnte jedes Produkt als einzelner AOI festgelegt sein, es würden jedoch nur die AOIs für die spätere Verarbeitung abgespeichert werden, die tatsächlich Bestellinformationen enthielten.
  • Unabhängig davon, ob alle festgelegten AOIs oder nur festgelegte AOIs, die tatsächlich Markierungen enthalten, abgespeichert werden, wird eine Warteschlange der AOIs für die weitere Verarbeitung gebildet. Wie vorausgehend erwähnt wurde, wird jedem AOI bei der Festlegung der Typ der automatischen Symbolverarbeitungseinrichtung zugeordnet, die zur Dekodierung der im AOI markierten Antwortinformationen verwendet werden sollte, falls dem AOI überhaupt eine automatische Symbolverarbeitungseinrichtung zugeordnet werden sollte. Wenn jeder AOI zur Verarbeitung aus der Warteschlange entfemt wird, wird das dem AOI entsprechende Pixelbild zur automatischen Symbolverarbeitungseinrichtung übertragen, die für diesen AOI festgelegt ist. Falls ein AOI in der Warteschlange nicht für die automatische Symbolverarbeitung geeignet ist, wird er einfach für die spätere Anzeige gespeichert. Für jeden AOI, der zu einer automatischen Symbolverarbeitungseinrichtung übertragen wird, wird eine Kette auf Zeichen beruhender alphanumerischer Daten erzeugt. In der bevorzugten Ausführungsform überträgt die automatische Symbolverarbeitungseinrichtung weiterhin einen Statuscode einer beliebigen Art (beispielsweise ein Bearbeitungs-Hinweiszeichen) zurück, der anzeigt, ob sie das Pixelbild, zu dessen Verarbeitung sie angewiesen wurde, erfolgreich verarbeiten konnte. Wenn bei der Verarbeitung eine Schwierigkeit auftritt (wenn ein OMR- Leser eine helle OMR-Markierung antrifft, die zu einem als mehrdeutig eingestuften Grauwert führt, oder wenn das ISR-System für handgeschriebene Druckzeichen einen Druckbuchstaben nicht erkennen kann, der zu sehr von der Norm abweicht), so wird ein redaktioneller Eingriff durch eine Person wünschenswert sein, und es ist wahrscheinlich, daß die von der automatischen Symbolerkennungseinrichtung erzeugten Ergebnisse alphanumerischer, auf Zeichen beruhender Daten eine Korrektur oder eine Vervollständigung erfordern. Unabhängig davon, ob das Bearbeitungs-Hinweiszeichen gesetzt wurde oder nicht, werden die Ergebnisse der Verarbeitung eines jeden AOIs durch die zugewiesene automatische Symbolverarbeitungseinrichtung für die Anzeige dem Pixelbild des AOIs zugeordnet, wie nachfolgend erörtert wird.
  • Zusammenfassend erfaßt der Scanner 20 das gesamte Bild der vorderen und der hinteren Oberfläche des Vordrucks beim Abtasten eines Dokumentes als unkomprimierte Daten mit 8 Bit pro Pixel. Die AOIs auf dem Vordruck werden hinsichtlich ihres Inhalts untersucht und entsprechend der dem Vordruck zugeordneten Anwendungsfestlegung ausgewertet. Die AOIs können zu diesem Zeitpunkt vom Scanner 20 als OMR-Antwortblasen, als von Hand geschriebene Antworten enthaltende Bereiche oder als Bildausschnitte ausgewertet werden. In einer Ausführungsform, in der der Scanner 20 hochentwickelt und mit einer großen Verarbeitungsleistung ausgestattet ist, wertet der Scanner 20 AOIs auch unter Verwendung seiner eigenen Schriftzeichen-OCR- und Strichcode-Leseeinrichtungen sowie anderer Symbolverarbeitungseinrichtungen aus. Wenn der Scanner 20 die sinnvollen Daten eines Vordrucks erkannt und zerlegt hat, überträgt er diese Daten zum Scanner-Steuermodul 30. Diese Daten können aus Zeichen im ASCII-Code, komprimierten oder unkomprimierten Bildern oder einer Darstellung eines unbearbeiteten OMR-Gitters bestehen.
  • Das Arbeitsablauf-Steuermodul 80 beruht auf dem Gedanken, daß durch den Abtastvorgang Objekte erzeugt werden, die von einer ISR-Einrichtung verarbeitet werden sollen und daß der Ausgabe-Datensatz für einen Anwendungsfall (beispielsweise eine mit Antworten markierte Ausfertigung des Vordrucks 400) nach der erfolgreichen Auswertung aller diesem Fall zugeordneter Objekte erzeugt werden soll. Die Steuerung des Arbeitsablaufes ist ein zweistufiger Vorgang. In der ersten Stufe werden die Einrichtungen des Systems verwaltet, um die Verarbeitungseinrichtungen des Systems, wie die CPU, den Plattenspeicher usw. zu überwachen. In der bevorzugten Ausführungsform beginnt die erste Stufe und steuert die Verarbeitungsvorgänge der zweiten Stufe, in der die Objekte für eine einzelne Einheit der Anwendung gesammelt und ausgewertet werden. Der Verarbeitungsvorgang der zweiten Stufe ist, falls dies möglich ist, für das Zerlegen der Objekte oder das Übertragen der Objekte zu geeigneten ISR-Einrichtungen, also dem Schriftzeichen-OCR-Leser 114, dem Strichcode-Leser 112 oder einem Aufbereitungsarbeitsplatz 90 für die optische Überprüfung durch eine Person, verantwortlich. Der Inhalt der Anzeige für die optische Überprüfung durch eine Person wird durch Daten zur Festlegung der Anzeige festgelegt, die Teil der Anwendungsfestlegung sind.
  • Wenn die automatischen Symbolerkennungseinrichtungen alle von einem im MIR-Modus abgetasteten Dokument gewonnenen AOIs aus einer Warteschlange von AOIs verarbeitet haben, können die Ergebnisse direkt zu einem die wesentlichen, aus dem abgetasteten Dokument gewonnenen Informationen enthaltenden Ausgabedatensatz für die Übertragung zu einem Hauptcomputer (nicht gezeigt) zusammengestellt werden. Dieser Datensatz, der eine Übersetzung der Markierungen auf dem mit Antworten markierten Vordruck in Zeichenketten alphanumerischer Daten darstellt und auch Bilder enthalten kann, ist dazu geeignet, von irgendwelchen, für die Annahme und die weitere Verarbeitung der Informationen erdachten Hauptanwendungsprogrammen verarbeitet zu werden. Bei den meisten Anwendungen ist es sehr wichtig, daß die Ausgabe-Datensätze getreue Übersetzungen der mit Antworten markierten Vordrucke sind. Dementsprechend ermöglicht es die vorliegende Erfindung, die als Ergebnis der Verarbeitung einiger oder aller AOIs auf einem Dokument erhaltenen Informationen für jeglichen erforderlichen redaktionellen Eingriff auf einem Aufbereitungsarbeitsplatz 90 anzuzeigen.
  • In den Figuren 5b und 6 sind die Arbeitsabläufe zum Zusammenstellen einer Bildschirmanzeige 600 für einen Aufbereitungsarbeitsplatz 90 und der Entwurf einer solchen Anzeige gezeigt. Das Bild des Aufbereitungsbildschirms in Fig. 6 ist das Ergebnis der Verarbeitung der AOIs aus Fig. 4 sowie des Anzeigens ausgewählter AOIs. Jeder dargestellte AOI weist eine zugeordnete Stelle oder ein zugeordnetes Tabulatorsymbol 610, 620, 630 und 640 auf, die oder das der Bediener ansteuern kann, wenn er einen speziellen AOI bearbeiten möchte. Mit jedem Tabulatorsymbol ist ein Bild dargestellt, das aus der VIS-Abtastung erhaltene erste Kennzeichnungen sowie aus der NIR-Abtastung erhaltene zweite Kennzeichnungen enthält. Diese wurden zur Bildung eines einzigen Bildes in der nachfolgend beschriebenen Weise zusammengefügt. Der AOI 410 ist unter der Annahme, daß er von der antwortenden Person nicht bearbeitet wurde und unter der Annahme, daß die Schriftzeichen-OCR-Übersetzung in auf Zeichen beruhende Daten sehr zuverlässig ist, nicht auf dem Aufbereitungsbildschirm 600 dargestellt.
  • (Weiterhin können zur weiteren Erhöhung der Genauigkeit, Prüfziffern zum Schriftzeichen-OCR-Text hinzugefügt werden.)
  • Dementsprechend wird die alphanumerische Übersetzung dieser Informationen direkt in den Ausgabe-Datensatz für dieses Dokument übertragen. Der AOI 420 wird auf dem Aufbereitungsbildschirm 600 dargestellt (Tabulatorsymbol 610), da der OMR Leser die Markierung beim zweiten "Nein" wegen des geringen Dunkelwerts innerhalb der Antwortblase als mehrdeutig ansah. Der Server 100 stellt direkt oberhalb des Bildes des AOI 420 die Buchstaben "J N?" dar, die die Dekodiertätigkeit des OMR- Lesers anzeigen sowie deren Ergebnis, daß die Markierung mehrdeutig ist und einen redaktionellen Eingriff erfordern könnte.
  • Der AOI 435 ist ebenfalls auf dem Aufbereitungsbildschirm 600 dargestellt (Tabulatorsymbol 620). Dessen Darstellung wird durch das Lesen einer Markierung durch den OMR-Le ser in der letzten Anwortblase im AOI 430 ausgelöst, die die Auswahl "andere (bitte erläutern)" bezeichnet. Im Bild des AOI 435 ist folglich der durch die antwortende Person vorgenommene handschriftliche Eintrag des Wortes "Verlagswesen" gezeigt, der durch keine automatische Symbolverarbeitungseinrichtung übersetzt werden konnte. Um dem Bediener die Übersetzung des handschriftlichen Eintrags zu ermöglichen und diesen in den Ausgabe-Datensatz aufzunehmen, erzeugt der Server eine Leerzeile 622 als Teil des Aufbereitungsbildschirms 600 und fordert dabei den Bediener auf, das Wort "Verlagswesen" einzugeben.
  • Beim Tabulatorsymbol 630 auf dem Aufbereitungsbildschirm 600 ist der AOI 460 dargestellt. Neben dem Bild des AOI 460 ist eine durch den Server 100 erzeugte Mehrzeilen-Anzeige 632 angeordnet, die die vom ISR-System für handgeschriebene Druckzeichen entwickelten alphanumerischen Daten enthält, zu dem das Pixelbild des AOI 460 zur Übersetzung in auf Zeichen beruhende Daten übertragen wurde. Es ist ersichtlich, daß die Anzeige 632 drei Leerzeilen (die erste, die zweite und die vierte) enthält, in die die antwortende Person keine Daten eingetragen hat, und daß die alphanumerische Übersetzung der dritten, fünften und sechsten Zeile versucht wurde. Aus dieser Anzeige sollte der Bediener schließen können, daß in der dritten Zeile ein Übersetzungsfehler aufgetreten ist, in der wahrscheinlich wegen des wenig sorgfältig gebildeten "D"s das druckschriftliche "DEM" als "OEN" übersetzt wurde. Weiterhin wird der Bediener feststellen, daß die letzte Ziffer der Postleitzahl als "?" übersetzt wurde, was den Bediener veranlaßt, die wenig sorgfältig druckschriftlich von Hand eingetragene "5" zu lesen. Der Bediener kann den Text daraufhin auf der Anzeige 632 bearbeiten und die erforderlichen Verbesserungen ausführen. Die Leerzeilen können abhängig von der Festlegung der Anwendung in unterschiedlicher Weise gehandhabt werden. Der Bediener könnte aufgefordert werden, eine Darstellung des AOIs 410 anzufordern, um das, was dort erscheint, in die Leerzeilen zu übertragen. Statt dessen könnte der Bediener das System einfach anweisen, die sich aus dem Lesen des AOIs 410 durch den Schriftzeichen-OCR-Leser ergebende übersetzte alphanumerische Zeichenkette unter der Annahme in die Leerzeilen in der Anzeige 632 einzutragen, daß die meisten antwortenden Personen die Zeilen unausgefüllt lassen, in die Informationen eingetragen werden sollen, die bereits richtig in den AOI 410 eingetragen wurden.
  • Beim Tabulatorsymbol 640 auf dem Aufbereitungsbildschirm 600 ist der AOI 520 dargestellt, der durch den OMR-Leser nicht erfolgreich verarbeitet werden konnte. (Da der Antwortbereich ein richtig ausgefülltes OMR-Gitter enthält, wurde der Bereich oberhalb des OMR-Gitters für die druckschriftliche Eintragung derselben, im OMR-Gitter zu kodierenden Zahlen nicht als Pixelbild für die Verarbeitung durch das ISR-System für handgeschriebene Druckzeichen übertragen.) Es ist für den Bediener leicht ersichtlich, daß die beiden letzten Ziffern durch den OMR-Leser nicht dekodiert werden konnten, da die Antwortblasen für die "0" und die "5" in der vorletzten Spalte des Gitters markiert wurden. Wiederum wird der Bediener durch die vom Server erzeugte Zeichenkette "10665??" aufgefordert, die von Hand eingetragenen Zahlen zu lesen und die beiden letzten Ziffern unter der Annahme einzugeben, daß die von Hand eingetragenen Zahlen richtig sind, wenngleich sie sich von den in die Antwortblasen des Gitters eingetragenen Markierungen unterscheiden.
  • Wenngleich in Fig. 6 mehrere AOIs in der Form zusammengeführter Bilder gezeigt sind, die Informationen aus den Abtastvorgängen im VIS-Modus und im MIR-Modus enthalten, ist dies nicht immer notwendig. Die zusammengeführten Bilder machen die dargestellten Daten erkennbar, wenngleich es andere Verfahren gibt. Wenn der Server 100 durch die Anwendung veranlaßt wird, Hinweiszeichen für die Bildschirmanzeige 600 zu entwickeln, könnten diese dazu verwendet werden, der die Anzeige betrachtenden Person bei der Erkennung des dargestellten AOIs zu helfen, falls die dargestellten Informationen nicht unmittelbar verständlich sein sollten.
  • Wenngleich die Verwendung eines Abtastens im MIR-Modus ein besonders wirksames Verfahren zur Trennung der auf einem Vordruck aufgezeichneten veränderlichen Daten von den Hintergrund-Druckinformationen darstellt, kann diese Trennung durch andere Verfahren geschehen. Wenn es wünschenswert sein sollte, lediglich ein VIS-Abtasten zu verwenden, könnten die AOIs durch ihren Ort festgelegt werden und unter Verwendung einer Hintergrundschablone zur Verringerung der Auswirkungen jeglicher Hintergrund-Druckinformationen ausgewertet werden. Dieses Verfahren könnte zur Trennung des in einem AOI enthalte nen Pixelbildes veränderlicher Daten von den Hintergrund- Druckinformationen verwendet werden, die Teil desselben Pixelbildes wären. Bei diesem System wäre es gewöhnlich weiterhin wünschenswert, eine "leere", unmarkierte Ausfertigung des Vordrucks abzutasten, um ein sauberes Hintergrundbild für jegliche durch Überlagern des Hintergrundes mit den in einem AOI erfaßten veränderlichen Daten zusammengeführte Bilder bereitzustellen.
  • In Fig. 7 ist der Aufbereitungsbildschirm 600 nach allen redaktionellen Eingriffen dargestellt. Die Berichtigungen und Hinzufügungen ermöglichen es, daß der Ausgabedatensatz des Dokumentes vervollständigt und für die Speicherung in der Hauptdatei 120 für die spätere Übertragung zu einem Hauptcomputer (nicht dargestellt) über den Kanal 122 fertiggemacht wird. Auf dem Hauptrechner kann ein Abonnementsauftrag gedruckt und verarbeitet werden, ein Brief gedruckt werden, in dem der antwortenden Person für seine/ihre Antwort gedankt wird und in dem er/sie benachrichtigt wird, daß er/sie für ein Abonnement in Frage kommt oder es können irgendwelche anderen Arbeitsvorgänge durchgeführt werden.
  • Eine weitere Anwendung, bei der die vorliegende Erfindung sehr nützlich wäre, ist die Verarbeitung von Bestellvordrucken oder -broschüren. Bei dieser Anwendung wird der von einem Kunden oder einem mit einem oder mehreren Kunden arbeitenden Vertreter der Firma ausgefüllte Bestellvordruck zur Erkennung der bestellten Produkte sowie deren Anzahl, der be stellenden Partei, der Lieferadressen, der Einzelheiten der Bezahlung usw. abgetastet. Bei einer solchen Anwendung könnte die Zusammenstellung des Ausgabe-Datensatzes auch die Prüfung der durch Verarbeiten verschiedener AOIs durch automatische Symbolverarbeitungseinrichtungen gewonnenen Informationen einschließen. Wenn ein Kunde beispielsweise eine Kundennummer bereitstellte, die zur Gewährung eines Kredites führen würde, könnte die Nummer zu Prüfungszwecken mit einer Reihe gültiger Kundennummern aus der Prüfungsdatenbank 168 verglichen werden, die auch Informationen hinsichtlich des Namens des Kun den oder Adresseninformationen enthalten kann, die für zusätzliche vergleichende Prüfungen verwendet werden könnten. Bei einer solchen Anwendung könnte ebenfalls ausgiebiger Gebrauch von der Übersetzungsdatenbank 164 gemacht werden. Wenn die OMR-Einträge beispielsweise zu einer Produktnummer führ ten, könnte diese Produktnummer in einen Produktnamen oder eine Produktbeschreibung übersetzt werden, die anstelle der Produktnummer oder zusammen mit dieser einem Ausgabe-Datensatz hinzugefügt werden könnte.

Claims (17)

1. Verfahren zur Gewinnung von Information aus einem Dokument, das erste Kennzeichnungen, die in einem ersten Abtastmodus unter Verwendung von Licht eines ersten Spektralbereichs aber nicht in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs erkennbar sind, und zweite Kennzeichnungen, die entweder in dem ersten oder in dem zweiten Abtastmodus erkennbar sind und eine Information darstellen, die in einer oder mehreren mittels automatischer Symbolerkennungseinrichtungen dekodierbaren Formen kodiert ist, trägt, mit folgenden Schritten:
(a) Festlegen eines oder mehrerer in Betracht kommender Bereiche auf dem Dokument, in denen die zweiten Kennzeichnungen auftreten können, wobei die Festlegung eine Information über die Kodierform der zweiten Kennzeichnungen beinhaltet,
(b) Abtasten des Dokuments in dem zweiten Modus unter Verwendung eines Scanners, der ein Pixel-Bild der erkannten Kennzeichnungen erzeugt,
(c) Speichern der in Schritt (b) erhaltenen Pixel-Daten in einer Speichereinrichtung,
(d) Auswählen eines in Betracht kommenden Bereichs aus den für das Dokument festgelegten Bereichen und Verarbeiten des Pixel-Bilds des in Betracht kommenden Bereichs mittels einer automatischen Symbolerkennungseinrichtung, die für die für die zweiten Kennzeichnungen in dem ausgewählten in Betracht kommenden Bereich festgelegte Kodierform geeignet ist, und
(e) Erzeugen einer oder mehrerer Ausgabe-Datensätze mit Symbolinformation, die die durch die Verarbeitung in Schritt (d) erzeugten zweiten Kennzeichnungen darstellt.
2. Verfahren nach Anspruch 1, wobei der Auswahl- und Verarbeitungsschritt für das Pixel-Bild eines in Betracht kommenden Bereichs einen Schritt zur Bestimmung, ob der in Betracht kommende Bereich irgendeine der zweiten Kennzeichnungen enthält und zur Verarbeitung des Pixel-Bilds des in Betracht kommenden Bereichs lediglich dann, wenn dieser die zweiten Kennzeichnungen enthält, aufweist.
3. Verfahren nach Anspruch 2 mit einem Schritt zur Übertragung eines Pixel-Bilds jedes in Betracht kommenden Bereichs, der zweite Kennzeichnungen enthält, an eine Sichtanzeige zum redaktionellen Eingreifen.
4. Verfahren nach Anspruch 1, wobei der Schritt zur Auswahl und zur Verarbeitung eines in Betracht kommenden Bereichs eine Verarbeitung mittels eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR-Lesers, eines Lesers für handschriftliche numerische Daten oder eines Lesers für handschriftliche alphanumerische Daten als automatische Symbolerkennungseinrichtung beinhaltet.
5. Verfahren nach Anspruch 1 mit folgenden weiteren Schritten:
(f) Abtasten einer Ausfertigung des Dokuments, die lediglich die ersten Kennzeichnungen aufweist, unter Verwendung eines Scanners, der ein Pixel-Bild der erkannten ersten Kennzeichnungen erzeugt, in dem ersten Modus, und
(g) Speichern der in Schritt (f) erhaltenen Pixel-Daten in einer Speichereinrichtung.
6. Verfahren nach Anspruch 5 mit einem Schritt zur Übertragung eines Pixel-Bilds mindestens eines in Betracht kommenden Bereichs mit den zweiten Kennzeichnungen an eine Sichtanzeige zum redaktionellen Eingriff.
7. Verfahren nach Anspruch 6, wobei für den an die Sichtanzeige zu übertragenden mindestens einen in Betracht kommenden Bereich Pixel für Pixel eine Zusammenführung der Pixel-Bilder der Schritte (b) und (f) durchgeführt wird, um ein einziges zusammengeführtes Pixel-Bild mit sowohl den ersten als auch den zweiten Kennzeichnungen innerhalb des genannten mindestens einen in Betracht kommenden Bereichs zu erzeugen.
8. Verfahren nach Anspruch 7 mit folgenden weiteren Schritten:
(h) Bestimmen, ob die automatische Symbolerkennungseinrichtung, die jeden in Betracht kommenden Bereich verarbeitet, erfolgreich eine die zweiten Kennzeichnungen darstellende Symbolinformation erzeugt hat, und
(i) Übertragen eines einzigen zusammengeführten Pixel- Bilds für jeden in Betracht kommenden Bereich, für den die automatische Symbolerkennungsvorrichtung nicht in der Lage war, eine die zweiten Kennzeichnungen darstellende Symbolinformation zu erzeugen, an die Sichtanzeige.
9. Verfahren nach Anspruch 7 mit folgenden Schritten:
Komprimieren des in Schritt (b) erzeugten Pixel-Bilds vor der Durchführung von Schritt (c), um den Umfang an Pixel- Daten zur Darstellung von Bereichen des Dokuments, die keine in dem zweiten Modus erkennbaren Kennzeichnungen tragen, zu verringern, und
Entkomprimieren der in Schritt (c) gespeicherten Pixel- Daten vor der Durchführung der Zusammenführung Pixel für Pixel, um das Pixel-Bild von Schritt (b) zu erhalten.
10. Vorrichtung zur Gewinnung von Information aus einem Dokument, das erste Kennzeichnungen, die in einem ersten Abtastmodus unter Verwendung von Licht in einem ersten Spektralbereich erkennbar, in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs jedoch nicht erkennbar sind, und zweite Kennzeichnungen, die entweder in dem ersten Abtastmodus oder dem zweiten Abtastmodus erkennbar sind und in einer oder mehreren mittels automatischer Symbolerkennungseinrichtungen dekodierbaren Formen kodierte Information darstellen, trägt, wobei die Vorrichtung aufweist:
(a) eine Einrichtung zur Festlegung eines oder mehrerer in Betracht kommender Bereiche auf dem Dokument, in denen die zweiten Kennzeichnungen auftreten können, wobei die Festlegung eine Information über die Kodierform der zweiten Kennzeichnungen beinhaltet
(b) eine Einrichtung zur Abtastung des Dokuments in dem zweiten Modus unter Verwendung eines Scanners, der ein erstes Pixel-Bild der erkannten Kennzeichnungen erzeugt,
(c) eine Einrichtung zur Speicherung der Pixel-Daten des ersten Pixel-Bilds in einer Speichereinrichtung,
(d) eine Einrichtung zur Auswahl eines in Betracht kommenden Bereichs aus den für das Dokument festgelegten Bereichen und zur Verarbeitung des ersten Pixel-Bilds des in Betracht kommenden Bereichs mit einer automatischen Symbolerkennungseinrichtung, die für die Kodierform geeignet ist, die für die zweiten Kennzeichnungen in dem ausgewählten in Betracht kommenden Bereich festgelegt ist und
(e) eine Einrichtung zur Erzeugung einer oder mehrerer Ausgabe-Datensätze mit Symbolinformation, die die in der unter (d) genannten Verarbeitungseinrichtung erzeugten zweiten Kennzeichnungen darstellt.
11. Vorrichtung nach Anspruch 10 mit einer Einrichtung zur Komprimierung des ersten Pixel-Bilds, um den Umfang von Pixel-Daten zur Darstellung von Bereichen des Dokuments, die keine in dem zweiten Modus erkennbaren Kennzeichnungen tragen, zu verringern.
12. Vorrichtung nach Anspruch 10, wobei die Einrichtung zur Auswahl und zur Verarbeitung des Pixel-Bilds eines in Betracht kommenden Bereichs eine Einrichtung zur Bestimmung, ob der in Betracht kommende Bereich irgendeine der zweiten Kennzeichnungen enthält, und eine Einrichtung zur Verarbeitung des Pixel-Bilds des in Betracht kommenden Bereichs lediglich dann, wenn es zweite Kennzeichnungen enthält, aufweist.
13. Vorrichtung nach Anspruch 12 mit einer Einrichtung zur Übermittlung eines Pixel-Bilds jedes in Betracht kommenden Bereichs, der zweite Kennzeichnungen beinhaltet, an eine Sichtanzeige zum redaktionellen Eingriff.
14. Vorrichtung nach Anspruch 10, wobei die Einrichtung zur Auswahl und zur Verarbeitung eines in Betracht kommenden Bereichs eine Einrichtung zur Verarbeitung mittels eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR-Lesers, eines Lesers handschriftlicher numerischer Daten oder eines Lesers handschriftlicher alphanumerischer Daten als automatische Symbolerkennungseinrichtung beinhaltet.
15. Vorrichtung nach Anspruch 10, aufweisend:
eine Einrichtung, um in dem ersten Modus unter Verwendung eines Scanners, der ein zweites Pixel-Bild der erkannten ersten Kennzeichnungen erzeugt, eine Kopie des Dokuments, die lediglich die ersten Kennzeichnungen enthält, abzutasten, und eine Einrichtung zur Speicherung der Pixel-Daten des zweiten Pixel-Bilds in einer Computerspeichereinrichtung.
16. Vorrichtung nach Anspruch 11 und 15, mit einer Einrichtung zur Dekomprimierung der gespeicherten Pixel-Daten, um das erste Pixel-Bild zu erhalten, und einer Einrichtung zur Zusammenführung des ersten und des zweiten Pixel-Bilds Pixel für Pixel, um ein einziges zusammengeführtes Pixel-Bild mit sowohl den ersten als auch den zweiten Kennzeichnungen innerhalb mindestens eines in Betracht kommenden Bereichs zu erzeugen.
17. Verfahren nach Anspruch 1, wobei die ersten Kennzeichnungen vorgedruckte Hintergrund-Kennzeichnungen und die zweiten Kennzeichnungen aufgrund der ersten, vorgedruckten Kennzeichnungen vorgesehene variable Kennzeichnungen darstellen und wobei der Schritt zum Abtasten des Dokuments in dem zweiten Modus durch ein Abtasten des Dokuments unter Bildung eines Pixel-Bilds sowohl der vorgedruckten als auch der variablen Kennzeichnungen ersetzt ist und der Schritt zur Verarbeitung des Pixel-Bilds eines in Betracht kommenden Bereichs eine Hintergrund-Schablone zur Trennung des Pixel-Bilds der variablen Kennzeichnungen von den Hintergrund-Kennzeichnungen verwendet.
DE69118970T 1990-06-13 1991-06-12 Bildverarbeitungssystem für dokumentarische Daten Expired - Fee Related DE69118970T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/537,293 US5134669A (en) 1990-06-13 1990-06-13 Image processing system for documentary data

Publications (2)

Publication Number Publication Date
DE69118970D1 DE69118970D1 (de) 1996-05-30
DE69118970T2 true DE69118970T2 (de) 1996-11-28

Family

ID=24142046

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69118970T Expired - Fee Related DE69118970T2 (de) 1990-06-13 1991-06-12 Bildverarbeitungssystem für dokumentarische Daten

Country Status (6)

Country Link
US (1) US5134669A (de)
EP (1) EP0463471B1 (de)
JP (1) JP3291302B2 (de)
KR (1) KR920001359A (de)
CA (1) CA2044400C (de)
DE (1) DE69118970T2 (de)

Families Citing this family (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0381817A (ja) * 1989-08-25 1991-04-08 Hitachi Ltd 手書入力情報処理装置およびこの手書入力情報処理装置を用いた手書入力情報システム
JP3001065B2 (ja) * 1991-03-19 2000-01-17 テイ・エイ・エス通商株式会社 プログラムの作成方法
US5991440A (en) * 1991-06-21 1999-11-23 Canon Kabushiki Kaisha Method and apparatus for recognizing input handwritten characters associated with title information
US5452379A (en) * 1991-09-13 1995-09-19 Meadowbrook Industries, Ltd. Image capture and storage techniques in association with optical mark reading
US5229589A (en) * 1991-11-21 1993-07-20 Optimum Solutions Corp., Inc. Questionnaire scanning system employing expandable answer mark areas for efficient scanning and mark detection
US5428210A (en) * 1992-01-10 1995-06-27 National Bancard Corporation Data card terminal with embossed character reader and signature capture
US5774882A (en) * 1992-03-12 1998-06-30 Keen; Regina D. Credit approval system
US5465167A (en) * 1992-03-20 1995-11-07 Xerox Corporation Using an image from a form in automatic creation of a form or sheet
US5282052A (en) * 1992-03-20 1994-01-25 Xerox Corporation Techniques for automatic form creation by combining partial operations
US5418865A (en) * 1992-03-20 1995-05-23 Xerox Corporation Mark sensing on a form
US5251273A (en) * 1992-04-15 1993-10-05 International Business Machines Corporation Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
US5987149A (en) * 1992-07-08 1999-11-16 Uniscore Incorporated Method for scoring and control of scoring open-ended assessments using scorers in diverse locations
US5672060A (en) * 1992-07-08 1997-09-30 Meadowbrook Industries, Ltd. Apparatus and method for scoring nonobjective assessment materials through the application and use of captured images
US5437554A (en) 1993-02-05 1995-08-01 National Computer Systems, Inc. System for providing performance feedback to test resolvers
US5321611A (en) * 1993-02-05 1994-06-14 National Computer Systems, Inc. Multiple test scoring system
US5433615A (en) * 1993-02-05 1995-07-18 National Computer Systems, Inc. Categorized test item reporting system
WO1994027251A1 (en) * 1993-05-18 1994-11-24 Massachusetts Institute Of Technology Automated reading system and method
JP2641391B2 (ja) * 1993-08-02 1997-08-13 インターナショナル・ビジネス・マシーンズ・コーポレイション 文字認識方法
US5659639A (en) * 1993-11-24 1997-08-19 Xerox Corporation Analyzing an image showing editing marks to obtain category of editing operation
DE69432114T2 (de) * 1993-11-24 2003-10-30 Canon Kk System zum Identifizieren und Verarbeiten von Formularen
CA2134255C (en) * 1993-12-09 1999-07-13 Hans Peter Graf Dropped-form document image compression
US5504319A (en) * 1994-02-09 1996-04-02 Symbol Technologies, Inc. Method and system for bar code acquisition
US5666490A (en) * 1994-05-16 1997-09-09 Gillings; Dennis Computer network system and method for managing documents
JPH087033A (ja) * 1994-06-16 1996-01-12 Canon Inc 情報処理方法及び装置
US6072871A (en) * 1994-10-05 2000-06-06 Leon H. Charney Method and system for identifying the source of documents generated by software and documents generated thereby
US5568550A (en) * 1994-10-05 1996-10-22 Shmuel Ur Method and system for identifying documents generated by an unauthorized software copy
US5729665A (en) 1995-01-18 1998-03-17 Varis Corporation Method of utilizing variable data fields with a page description language
US6243172B1 (en) * 1995-01-18 2001-06-05 Varis Corporation Method and system for merging variable text and images into bitmaps defined by a page description language
US5610995A (en) * 1995-06-06 1997-03-11 United Parcel Service Of America, Inc. Method and apparatus for compressing images containing optical symbols
US6952801B2 (en) 1995-06-07 2005-10-04 R.R. Donnelley Book assembly process and apparatus for variable imaging system
US5673334A (en) * 1995-11-30 1997-09-30 Cognex Corporation Method and apparatus for inspection of characteristics on non-rigid packages
US5936225A (en) * 1996-04-02 1999-08-10 Strategic Quantitative Solutions, Inc. Method and apparatus for tabulating data from a plurality of response forms
FR2756952B1 (fr) * 1996-12-06 1999-06-25 Itesoft Systeme de reconnaissance de caracteres manuscrits
US6487568B1 (en) 1997-07-18 2002-11-26 Tesseron, Ltd. Method and system for flowing data to an arbitrary path defined by a page description language
US7302438B1 (en) 1997-07-18 2007-11-27 Tesseron Ltd. Method and system for flowing data to an arbitrary path defined by a page description language
US6209010B1 (en) 1997-07-18 2001-03-27 Varis Corporation Computer implemented method for wrapping data to an arbitrary path defined by a page description language
US6311040B1 (en) * 1997-07-31 2001-10-30 The Psychological Corporation System and method for scoring test answer sheets having open-ended questions
US6173154B1 (en) 1997-07-31 2001-01-09 The Psychological Corporation System and method for imaging test answer sheets having open-ended questions
US6561428B2 (en) 1997-10-17 2003-05-13 Hand Held Products, Inc. Imaging device having indicia-controlled image parsing mode
JP3722966B2 (ja) * 1997-11-13 2005-11-30 株式会社リコー 縮小画像作成装置
US6269341B1 (en) 1998-07-01 2001-07-31 Day-Timers, Inc. Method and system for printing individualized calendars
US6325420B1 (en) 1998-08-17 2001-12-04 Inspectron Corporation Method for embedding non-intrusive encoded data in printed matter and system for reading same
US6178308B1 (en) * 1998-10-16 2001-01-23 Xerox Corporation Paper based intermedium for providing interactive educational services
US7315979B1 (en) 1998-11-09 2008-01-01 Tesseron Ltd. Method and system for dynamic flowing data to an arbitrary path defined by a page description language
US7068832B1 (en) 1999-05-11 2006-06-27 The Chase Manhattan Bank Lockbox imaging system
US6248996B1 (en) * 1999-07-12 2001-06-19 Hewlett-Packard Company Single-scan transmission of documents to multiple heterogeneous receivers
US7278094B1 (en) 2000-05-03 2007-10-02 R. R. Donnelley & Sons Co. Variable text processing for an electronic press
FR2801997A1 (fr) * 1999-12-02 2001-06-08 Itesoft Technologie adaptative d'analyse automatique de document
AU2001264956A1 (en) * 2000-08-11 2002-02-25 Ctb/Mcgraw-Hill Llc Enhanced data capture from imaged documents
US20020044687A1 (en) * 2000-10-16 2002-04-18 Emailcard Feedback Systems, Inc. Customer feedback system
US6961482B2 (en) * 2001-03-05 2005-11-01 Ncs Pearson, Inc. System for archiving electronic images of test question responses
US6751351B2 (en) 2001-03-05 2004-06-15 Nsc Pearson, Inc. Test question response verification system
US6810232B2 (en) 2001-03-05 2004-10-26 Ncs Pearson, Inc. Test processing workflow tracking system
US6675133B2 (en) 2001-03-05 2004-01-06 Ncs Pearsons, Inc. Pre-data-collection applications test processing system
US6898317B2 (en) * 2001-05-07 2005-05-24 Hewlett-Packard Development Company, L.P. Method and system for fit-to-form scanning with a scanning device
US7111787B2 (en) 2001-05-15 2006-09-26 Hand Held Products, Inc. Multimode image capturing and decoding optical reader
US6942151B2 (en) 2001-05-15 2005-09-13 Welch Allyn Data Collection, Inc. Optical reader having decoding and image capturing functionality
US6834807B2 (en) 2001-07-13 2004-12-28 Hand Held Products, Inc. Optical reader having a color imager
US20040083229A1 (en) * 2001-09-04 2004-04-29 Porter Robert Austin Apparatus and method for automatically grading and inputting grades to electronic gradebooks
US7635087B1 (en) 2001-10-01 2009-12-22 Avante International Technology, Inc. Method for processing a machine readable ballot and ballot therefor
US7828215B2 (en) * 2001-10-01 2010-11-09 Avante International Technology, Inc. Reader for an optically readable ballot
US7077313B2 (en) * 2001-10-01 2006-07-18 Avante International Technology, Inc. Electronic voting method for optically scanned ballot
GB2381637B (en) * 2001-10-31 2005-04-27 James Au-Yeung Apparatus and method for determining selection data from pre-printed forms
US7171022B2 (en) * 2001-12-05 2007-01-30 Lockheed Martin Corporation Common method for communicating area information
US7070115B2 (en) * 2002-01-23 2006-07-04 Debiase Salvatore E Ballot form and method for making and using same
US20040064472A1 (en) * 2002-09-27 2004-04-01 Oetringer Eugen H. Method and system for information management
US7145093B2 (en) * 2002-12-24 2006-12-05 Siemens Energy & Automation, Inc. Method and system for image processing
US6993818B2 (en) * 2003-03-17 2006-02-07 Memx, Inc. Multi-fixture assembly of cutting tools
US7637430B2 (en) 2003-05-12 2009-12-29 Hand Held Products, Inc. Picture taking optical reader
US7555145B2 (en) * 2003-06-03 2009-06-30 Gravic, Inc. Multi-level optical mark reading that uses an unambiguous symbology of marks to fill into response bubbles
US7542160B2 (en) * 2003-08-29 2009-06-02 Hewlett-Packard Development Company, L.P. Rendering with substituted validation input
US7298902B2 (en) * 2004-01-20 2007-11-20 Educational Testing Service Method and system for performing image mark recognition
US7298901B2 (en) * 2004-04-07 2007-11-20 Scantron Corporation Scannable form and system
US8155578B2 (en) * 2004-05-14 2012-04-10 Educational Testing Service Method and system for generating and processing an assessment examination
US7293712B2 (en) 2004-10-05 2007-11-13 Hand Held Products, Inc. System and method to automatically discriminate between a signature and a dataform
US9208480B2 (en) 2004-11-05 2015-12-08 Rdm Corporation Mobile deposit system for digital image and transaction management
US7606421B2 (en) * 2004-12-08 2009-10-20 Ctb/Mcgraw-Hill Llc Data extraction from temporal image data
US7791756B2 (en) * 2005-05-03 2010-09-07 Lexmark International, Inc. Methods for identifying marks using a digital master document and scanned image enhancement
US20060252023A1 (en) * 2005-05-03 2006-11-09 Lexmark International, Inc. Methods for automatically identifying user selected answers on a test sheet
CA2587874A1 (en) * 2006-05-05 2007-11-05 Rdm Corporation Method and system for thin client based image and transaction management
US7711191B2 (en) * 2006-12-21 2010-05-04 Michael John Kosek Electronic transaction processing server with automated transaction evaluation
US20080227075A1 (en) 2007-03-15 2008-09-18 Ctb/Mcgraw-Hill, Llc Method and system for redundant data capture from scanned documents
US20090015875A1 (en) * 2007-06-20 2009-01-15 Ctb/Mcgraw-Hill Companies, Inc. Image manipulation of digitized images of documents
US8144988B2 (en) * 2007-09-06 2012-03-27 Ricoh Company, Ltd. Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
US8194982B2 (en) * 2007-09-18 2012-06-05 Ricoh Company, Ltd. Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
US11157977B1 (en) 2007-10-26 2021-10-26 Zazzle Inc. Sales system using apparel modeling system and method
US8526766B2 (en) 2007-10-31 2013-09-03 Ctb/Mcgraw-Hill Llc Use of composite bitmapped images in conjunction with display of captured data
US8066184B2 (en) * 2008-04-30 2011-11-29 Avante International Technology, Inc. Optically readable marking sheet and reading apparatus and method therefor
US10719862B2 (en) 2008-07-29 2020-07-21 Zazzle Inc. System and method for intake of manufacturing patterns and applying them to the automated production of interactive, customizable product
US20100047757A1 (en) * 2008-08-22 2010-02-25 Mccurry Douglas System and method for using interim-assessment data for instructional decision-making
US9087355B2 (en) * 2008-08-22 2015-07-21 Zazzle Inc. Product customization system and method
US8261985B2 (en) * 2009-04-07 2012-09-11 Avante Corporation Limited Manual recount process using digitally imaged ballots
JP5712487B2 (ja) * 2009-09-04 2015-05-07 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US8261986B2 (en) * 2009-10-21 2012-09-11 Kevin Kwong-Tai Chung System and method for decoding an optically readable markable sheet and markable sheet therefor
US8503785B2 (en) * 2010-01-15 2013-08-06 Gravic, Inc. Dynamic response bubble attribute compensation
US9292565B2 (en) 2010-06-30 2016-03-22 International Business Machines Corporation Template-based recognition of food product information
US8396765B2 (en) * 2010-10-15 2013-03-12 Thomas E. Santarlas System and method for the automated distribution, management and service of court-related documents
US8412004B2 (en) 2010-10-15 2013-04-02 Gravic, Inc. Dynamic response form symbology processing
US8657200B2 (en) 2011-06-20 2014-02-25 Metrologic Instruments, Inc. Indicia reading terminal with color frame processing
US10969743B2 (en) 2011-12-29 2021-04-06 Zazzle Inc. System and method for the efficient recording of large aperture wave fronts of visible and near visible light
EP2797032A3 (de) * 2013-04-22 2017-04-12 ESSILOR INTERNATIONAL (Compagnie Générale d'Optique) Verfahren und System mit zwei parallelen optischen Zeichenerkennungsprozessen
US9239693B2 (en) 2014-05-15 2016-01-19 Xerox Corporation Automatically printing only pages containing blank signature lines
US10176411B2 (en) * 2016-05-26 2019-01-08 Scantron Corporation Single-pass imaging and optical mark recognition scanning
US10783323B1 (en) * 2019-03-14 2020-09-22 Michael Garnet Hawkes Analysis system

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3284929A (en) * 1964-05-19 1966-11-15 Automata Corp Test grading machine
US3444517A (en) * 1965-03-09 1969-05-13 Control Data Corp Optical reading machine and specially prepared documents therefor
USRE29104E (en) * 1971-08-18 1977-01-04 Cognitronics Corporation Method of scanning documents to read characters thereon without interference from visible marks on the document which are not to be read by the scanner
US4021777A (en) * 1975-03-06 1977-05-03 Cognitronics Corporation Character reading techniques
US4205780A (en) * 1977-03-21 1980-06-03 Teknekron, Inc. Document processing system and method
EP0013276B1 (de) * 1979-01-02 1983-05-11 Westinghouse Electric Corporation Optisches Markierungs-Lesesystem
JPS57150062A (en) * 1981-03-12 1982-09-16 Fuji Xerox Co Ltd Processing of papers
US4408344A (en) * 1981-04-09 1983-10-04 Recognition Equipment Incorporated OCR and Bar code reader using multi port matrix array
JPS59128666A (ja) * 1983-01-14 1984-07-24 Fuji Xerox Co Ltd 伝票,書類等の発行装置
JPS59205678A (ja) * 1983-05-09 1984-11-21 Sharp Corp 用紙情報入力装置
CH661365A5 (de) * 1983-11-03 1987-07-15 Landis & Gyr Ag Anordnung zur darstellung und abtastung des inhalts von zahlenrollen-zaehlwerken.
US4654877A (en) * 1984-08-28 1987-03-31 Elscint Ltd. Data compression system
US4972273A (en) * 1984-10-15 1990-11-20 Burkhardt Norman S High speed, high resolution image processing system
US4627819A (en) * 1985-01-23 1986-12-09 Price/Stern/Sloan Publishers, Inc. Teaching or amusement apparatus
JPH0797391B2 (ja) * 1986-09-06 1995-10-18 シャープ株式会社 金銭出納機
US4760246A (en) * 1987-04-20 1988-07-26 Cognitronics Corporation Mark-reading apparatus for use with answer sheets
US4877948A (en) * 1987-06-25 1989-10-31 Krueger Loren L Combination bar code and mark-sense reader
JPS6458161A (en) * 1987-08-28 1989-03-06 Toshiba Corp Facsimile equipment
US4855580A (en) * 1987-11-20 1989-08-08 Recognition Equipment Incorporated Data merge document processing method
US5001330A (en) * 1988-03-02 1991-03-19 National Computer Systems, Inc. Optically scanned document with fail-safe marking
US4873426A (en) * 1988-08-03 1989-10-10 Image Business Systems Corporation Technique for reading bar codes
US4889367A (en) * 1988-10-07 1989-12-26 Frito-Lay, Inc. Multi-readable information system
US5054096A (en) * 1988-10-24 1991-10-01 Empire Blue Cross/Blue Shield Method and apparatus for converting documents into electronic data for transaction processing
US5003613A (en) * 1988-12-21 1991-03-26 Recognition Equipment Incorporated Document processing system and method
US4914709A (en) * 1989-06-02 1990-04-03 Eastman Kodak Company Method for identifying unrecognizable characters in optical character recognition machines
US5010580A (en) * 1989-08-25 1991-04-23 Hewlett-Packard Company Method and apparatus for extracting information from forms

Also Published As

Publication number Publication date
KR920001359A (ko) 1992-01-30
US5134669A (en) 1992-07-28
CA2044400A1 (en) 1991-12-14
CA2044400C (en) 2001-11-27
JP3291302B2 (ja) 2002-06-10
EP0463471A3 (en) 1993-04-21
EP0463471A2 (de) 1992-01-02
DE69118970D1 (de) 1996-05-30
JPH06149970A (ja) 1994-05-31
EP0463471B1 (de) 1996-04-24

Similar Documents

Publication Publication Date Title
DE69118970T2 (de) Bildverarbeitungssystem für dokumentarische Daten
EP0144361B1 (de) Vorrichtung und verfahren zum handhaben und wiederauffinden von belegen und daten
DE68927990T2 (de) Bildverarbeitungssystem
DE69123083T2 (de) Dokumentverarbeitung
DE69302003T2 (de) Dateneingabeanlage
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE3486224T2 (de) Verfahren zum Speichern und Wiederauffinden von digitalen Informationen.
DE69727320T2 (de) Aufnahmeverfahren und gerät
DE69830383T2 (de) Kodierverfahren
DE69032120T2 (de) Bildinformationsaufzeichnungsgerät
DE69029251T2 (de) System zur Ueberprüfung von Dokumenten, zur Verwendung mit einem Lese- und Uebersetzungssystem
EP0424803B1 (de) Verfahren zur mindestens teilweisen Umsetzung von Bilddaten in Text mit Vorbereitung für nachfolgende Speicherung oder Weiterverarbeitung
DE19530829C2 (de) Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Information
DE19960555A1 (de) Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes
US20080235263A1 (en) Automating Creation of Digital Test Materials
DE2931257A1 (de) Markierungs-lesevorrichtung
DE60123730T2 (de) Gerät und Verfahren zur Bestimmung des Formats von Dokumenten
DE60005706T2 (de) Anpassungfähige technologie zur automatischen dokumentenanalyse
EP0107083A2 (de) Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät
DE19708280C2 (de) Lesevorrichtung für vollständige Anschriften
EP1202212B1 (de) Verfahren zur Erfassung des vollständigen Datensatzes mit Schriftzeichen versehener Formulare
EP0731955B1 (de) Verfahren und vorrichtung zum automatischen erfassen und erkennen von aufgezeichneter information
DE60036181T2 (de) Lesegerät und Datenverarbeitungssystem
DE4000671A1 (de) Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer
DE69030446T2 (de) Abtastbares formular mit einer kontrollmarkenspalte mit kodierten datenmarken

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee