DE69118970T2 - Bildverarbeitungssystem für dokumentarische Daten - Google Patents
Bildverarbeitungssystem für dokumentarische DatenInfo
- Publication number
- DE69118970T2 DE69118970T2 DE69118970T DE69118970T DE69118970T2 DE 69118970 T2 DE69118970 T2 DE 69118970T2 DE 69118970 T DE69118970 T DE 69118970T DE 69118970 T DE69118970 T DE 69118970T DE 69118970 T2 DE69118970 T2 DE 69118970T2
- Authority
- DE
- Germany
- Prior art keywords
- markings
- pixel
- pixel image
- document
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 70
- 238000000034 method Methods 0.000 claims description 25
- 238000003860 storage Methods 0.000 claims description 14
- 230000003287 optical effect Effects 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 8
- 230000000007 visual effect Effects 0.000 claims 2
- 230000004044 response Effects 0.000 description 24
- 238000013519 translation Methods 0.000 description 12
- 230000014616 translation Effects 0.000 description 12
- 238000012015 optical character recognition Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 9
- 238000007639 printing Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 229910002804 graphite Inorganic materials 0.000 description 2
- 239000010439 graphite Substances 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 238000001545 Page's trend test Methods 0.000 description 1
- 241000519995 Stachys sylvatica Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/06—Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers
- G09B7/066—Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers with answer indicating cards, blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K17/00—Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/12—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using a selected wavelength, e.g. to sense red marks and ignore blue marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/143—Sensing or illuminating at different wavelengths
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Electromagnetism (AREA)
- Toxicology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Character Discrimination (AREA)
- Processing Or Creating Images (AREA)
- Storing Facsimile Image Data (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
Description
- Diese Anmeldung ist mit einer anhängigen europäischen Patentanmeldung Nr. 91 109 601.4 (EP-A-0 461 622, offengelegt am 18. Dezember 1991) verwandt.
- Die vorliegende Erfindung betrifft allgemein Vorrichtungen zum Abtasten optischer Markierungen, Vorrichtungen zur Zeichenerkennung sowie Vorrichtungen zum Abtasten sichtbarer Bilder. Genauer gesagt betrifft die vorliegende Erfindung ein Bildverarbeitungssystem, das dazu geeignet ist, abgetastete Bilder mit verschiedenen intelligenten Symbolerkennungs(ISR)-Einrichtungen unter Einschluß eines Strichcodelesers, eines optischen Markierungslesers, eines Schriftzeichen-OCR- Lesers, eines Lesers für handgeschriebene numerische Daten und/oder eines Lesers für von Hand in Druckschrift geschriebene alphanumerische Daten zu erfassen und zu verarbeiten und ASCII- oder gleichwertige auf Zeichen beruhende alphanumerische Daten zu erzeugen (im folgenden als ISR-System für handgeschriebene Druckzeichen bezeichnet), und das weiterhin dazu geeignet ist, Pixelbilder zu erhalten und diese vielfältigen Formen von Daten und Bildern zu integrieren. Die vorliegende Erfindung ist demnach ein Informationsverarbeitungssystem, das auf Dokumenten aufgezeichnete Daten unter Verwendung von automatischen Symbolerkennungseinrichtungen sowie von Vorrichtungen zur Bearbeitung und zur Zusammenführung von Pixelbildern gewinnt.
- Vorrichtungen zum Abtasten optischer Markierungen (nachfolgend als optische Markierungslese- oder OMR-Systeme bezeichnet) sind im Stand der Technik wohlbekannt. Es gibt eine große Vielfalt von Anwendungen, bei denen OMR-Systeme und abtastbare Vordrucke bei umfangreichen Sammlungen einzelner, auf Dokumenten aufgezeichneter Informationsbestandteile verwendet werden (beispielsweise die Ergebnisse standardisierter Tests, Volkszählungsinformationen, Untersuchungen von Vorlieben usw.). OMR-Systeme lesen im allgemeinen unter Verwendung von Markierungen, die einen im nahen Infrarotbereich (NIR) absorbierenden Farbstoff enthalten (beispielsweise unter Verwendung eines Bleistifts oder eines anderen Graphit oder eine andere Form von Kohlenstoff enthaltenden Schreibwerkzeugs vorgenommene Markierungen) in bestimmten vorgewählten Feldern des Vordrucks aufgezeichnete Daten. Diese Daten sind in der Hinsicht lagekodiert, daß ihre Bedeutung, abhängig davon, wo die Daten auf dem zu ihrer Aufzeichnung verwendeten Formatvordruck eingetragen sind, ausgewertet wird. Dies wird als Abtasten im NIR-Modus bezeichnet. Ein wesentlicher Vorteil des Abtastens im NIR-Modus (oder eines anderen auf einer begrenzten spektralen Empfindlichkeit beruhenden Abtastens) liegt darin, daß es die Trennung der durch Antworten markierten veränderlichen Daten von den auf demselben Dokument enthaltenen Standard-Hintergrunddruckinformationen ermöglicht.
- Wenngleich sie eine neuere Entwicklung sind, sind Vorrichtungen zum Abtasten sichtbarer Bilder (im folgenden als Abtastvorrichtungen im VIS-Modus oder VIS-Systeme bezeichnet) im Stand der Technik ebenfalls wohlbekannt. Die meisten Anwendungen für gegenwärtige VIS-Systeme haben sich aus dem Wunsch heraus entwickelt, traditionelle Mikrofilm-Bilderfassungssysteme zu ersetzen. Folglich konzentrieren sich gegenwärtige VIS-Systeme auf die Erfassung des gesamten abgetasteten Bildes eines Dokumentes gebenüber den von gegenwärtigen OMR-Systemen durchgeführten Tätigkeiten der Erfassung, der Auflösung dunkler Markierungen und der Verarbeitung einzelner, in vorbestimmten Feldern aufgezeichneter Informationsbestandteile.
- Eine der Einschränkungen gegenwärtiger OMR-Systeme, die sich auf vorbestimmte Felder konzentrieren, liegt darin, daß sie die Umgebung der vorbestimmten Felder eines abtastbaren Vordrucks nicht abtasten oder wiedergeben können. Folglich ist die Abrufung und die Betrachtung oder die Druckwiedergabe der gespeicherten oder archivierten unbearbeiteten Einzelinformationen aus einem von einem OMR-System abgetasteten Vordruck von begrenztem Wert, da es keine Möglichkeit gibt, diese Informationen auszuwerten, ohne auf den Vordruck, eine Transparentauflage oder gar, wie im Fall standardisierter Tests, auf eine zum Vordruck gehörige Broschüre zurückzugreifen.
- VIS-Systeme können andererseits den gesamten Inhalt eines abtastbaren Vordrucks (Standard-Hintergrunddruckinformationen und alle veränderlichen Daten) als digitalisiertes Pixelbild wiedergeben, jedoch kann eine zugeordnete OMR-Verarbeitungslogik die in einem Pixelbild im VIS-Nodus des Vordrucks enthaltenen veränderlichen Einzelinformationen nicht ohne weiteres auswerten oder analysieren. Wenngleich viele feste und variable digitalisierte Daten durch VIS-Bilder erfaßt werden können, muß die Bedeutung der variablen Daten noch gewonnen werden, und es sind möglicherweise nicht alle im VIS-Modus erfaßten Daten von Interesse. Wenn beispielsweise ein Blatt Papier mit einer Größe von 8-1/2" x 11" bei einer vertikalen und horizontalen Auflösung von 120 Punkten pro Zoll (DPI) und bei einem acht Bit umfassenden Grauwertbereich abgetastet wird, können aus dieser einzigen Seite 1,3 Megabyte an abgetasteten Informationen auf der Bitebene erzeugt werden. Es ist offensichtlich, daß ein sehr großes Maß an Rechenleistung erforderlich sein kann, um bedeutsame Informationen auf der Bitebene oder gar örtlich begrenzte Pixelabschnitte (oft als in Betracht kommende Gebiete oder in Betracht kommende Bereiche (AOIs) bezeichnet) von einem mit einem VIS-System abgetasteten Vordruck zu gewinnen und zu analysieren. Weiterhin sind die Speicheranforderungen zur Speicherung aller dieser Informationen in einer Situation, in der hunderte oder tausende von Dokumenten zur Erfassung eines vollständigen Pixelbildes als Nebenprodukt der Erfassung der veränderlichen Daten verarbeitet werden, so groß, daß sie bei den meisten Anwendungen zu teuer sind.
- Ein Verfahren, das zur Verringerung des Umfangs der zu speichernden Daten verwendet wurde, wenn Text und/oder Zahlen enthaltende Texte VIS-abgetastet werden, liegt in der Verwendung von Symbolerkennungssystemen (gewöhnlich computergestützt) zur Konvertierung des sichtbaren, aus Text und/oder Zahlen bestehenden Bildes in kompaktere, auf Zeichen beruhende alphanumerische Daten. Diese letzteren erfordern erheblich weniger Speicherplatz und bieten den weiteren Vorteil, daß sie als Eingabedatei für ein Textverarbeitungsprogramm, ein Textsuchprogramm oder verschiedene andere Programme zur Bearbeitung von aus Text und/oder numerischen Daten bestehenden Dateien verwendet werden können.
- Die Art, in der Informationen auf einem Dokument aufgezeichnet oder kodiert sind, bestimmt im heutigen Stand der Technik im hohen Maße die Geschwindigkeit und die Genauigkeit, mit denen computergestützte Systeme die Informationen gewinnen und in die digitale Form übertragen können. Im gegenwärtigen Stand der Technik gibt es keine sehr wirksame Möglichkeit, einen handschriftlich erstellten Text in die digitale Form zu übertragen. Von Hand in Druckschrift abgefaßte Informationen können mit gewissem Erfolg ausgewertet und in die digitale Form übertragen werden, insbesondere, wenn der Symbolerkennungsprozessor in der Art eines neuronales Netzwerkes sehr anpassungsfähig ist. Diese Aufgabe ist am leichtesten, wenn die betroffenen Informationen numerischer Art sind, weil in diesem Fall die Gesamtheit der zu erkennenden Zeichen stark reduziert ist. Andere Formen der Informations kodierung ermöglichen eine einfachere Symbolerkennung und - umwandlung in digitale Daten. Die Erkennung von Strichcodes ist heutzutage eine ausgereifte Technik, die in der Herstellung, dem Vertrieb und dem Verkauf zur Erkennung von Produkten weitverbreitet ist. Die optische Zeichenerkennung gewisser gedruckter Schriftzeichen ist ebenfalls so weit fortgeschritten, daß eine schnelle und genaue Übersetzung gedruckter Informationen in digital gespeicherte alphanumerische Daten möglich ist. Das vorausgehend erwähnte OMR-Abtasten ist eine weitere hochentwickelte Technik, die die schnelle Ubersetzung lagekodierter Daten aus einer Dokumentenform in eine auf Zeichen beruhende alphanumerische Form ermöglicht.
- Mit allen diesen gegebenen Möglichkeiten, können Personen, die Informationen gewinnen möchten, indem sie diese auf Dokumente aufzeichnen lassen, nun ein Dokument entwerfen, in dem eine oder mehrere der vorausgehend erwähnten Datendar stellungsformen vereinigt sind. In dem Maße, in dem das Dokument mehrere unterschiedliche Datendarstellungsformen aufweist, ergeben sich andere Schwierigkeiten, die die Frage betreffen, wie das Dokument unter Verwendung automatischer Einrichtungen schnell in auf Zeichen beruhende Daten übertragen werden kann. Darüber hinaus werden in dem Maße, in dem in einem Dokument zugelassen wird, daß gewisse Daten von Hand durch druckschriftliche Markierungen oder Schriftzeichen aufgezeichnet werden, manche aufgezeichneten Informationen hinsichtlich der durch die zur Auswertung der Informationen verwendeten automatischen Symbolerkennungseinrichtung festgelegten Kriterien mehrdeutig sein (beispielsweise schwache OMR- Markierungen, grobe Schmutzflecken oder Radierstellen, schlecht wiedergegebener Druck von OCR-Schriftzeichen sowie wenig sorgfältige, von Hand vorgenommene druckschriftliche Eintragungen), und andere aufgezeichnete Informationen überschreiten entweder die Möglichkeiten der verfügbaren Symbolerkennungstechnologie (beispielsweise handschriftlich vorgenommene Eintragungen) oder sind nur in ihrer vollen, unbearbeiteten sichtbaren Form von Bedeutung (beispielsweise eine Unterschrift oder eine Skizze).
- Es werden ein System und ein Verfahren zum Abtasten eines Dokuments benötigt, mit denen in vielfältiger Weise kodierte Informationen so verarbeitet werden können, daß die gewünschten Informationen, wenn möglich, in auf Zeichen beruhender alphanumerischer Form gewonnen werden können, während die Möglichkeit erhalten bleibt, alle oder einen Teil der Informationen in der sichtbaren Form eines "elektronischen Bildes" für die Untersuchung durch einen menschlichen Bediener zu erhalten.
- Die vorliegende Erfindung ist ein Bildverarbeitungssystern, das dazu geeignet ist, von einer Vorrichtung zum Abtasten im NIR-Modus und einer Vorrichtung zum Abtasten sichtbarer Bilder erfaßte abgetastete Bilder zu verwalten und verschiedene Symbolerkennungseinrichtungen zur Gewinnung von auf Dokumenten aufgezeichneten, in einer Anzahl unterschiedlicher Formen kodierten Informationen zu verwenden, und die Informationen in auf Zeichen beruhende alphanumerische Daten umzuwandeln oder sie als digitales Bild zu speichern.
- Es ist eine Aufgabe der vorliegenden Erfindung, ein Bildverarbeitungssystem zu schaffen, das dazu geeignet ist, von einer Vorrichtung zum Abtasten optischer Markierungen (NIR-Modus) und von einer Vorrichtung zum Abtasten sichtbarer Bilder (VIS-Modus) erfaßte abgetastete Bilder zu verwalten.
- Es ist eine weitere Aufgabe der vorliegenden Erfindung, ein Bildverarbeitungssystem zu schaffen, das dazu geeignet ist, abgetastete Bilder von vorbestimmten in Betracht kommenden Bereichen auf abgetasteten Dokumenten zu gewinnen und eine Anzahl von Symbolerkennungseinrichtungen zur Ubersetzung der abgetasteten Informationen von Bildern im Pixelformat in alphanumerische Daten in auf Zeichen beruhender Form zu verwenden, um einem digitalen Informationsverarbeitungssystem einen integrierten Ausgabe-Datensatz zu liefern.
- Es ist eine weitere Aufgabe der vorliegenden Erfindung, eine Einrichtung zur Erfassung von Informationen aus einem mit Antworten markierten Dokument zu schaffen, bei der der erforderliche Computerspeicherplatz zur Speicherung aller wichtigen Informationen auf dem Dokument gegenüber einem nichtkomprimierten, vollständigen, Pixel für Pixel gegebenen Bild des Dokumentes erheblich verringert ist.
- Noch eine weitere Aufgabe der vorliegenden Erfindung ist die Schaffung eines wirksamen Systems zur Gewinnung von Informationen aus Dokumentenvordrucken, die in einer Anzahl von Kodierschemata kodierte Antwortinformationen enthalten.
- Diese und andere Aufgaben der vorliegenden Erfindung werden bei Bezugnahme auf die Zeichnung, die detaillierte Beschreibung der bevorzugten Ausführungsform und die beigefügten Ansprüche deutlich.
- Fig. 1 ist ein Blockdiagramm der Gesamtfunktionsweise des Bildverarbeitungssystems der vorliegenden Erfindung.
- Fig. 2 ist eine schematische Bilddarstellung der in ein Netzwerk integrierten vorliegenden Erfindung.
- Fig. 3 ist eine Draufsicht auf einen Muster-Dokumentenvordruck, der mittels der vorliegenden Erfindung wirksam verarbeitet werden kann und der die allen Ausfertigungen des Dokumentenvordrucks gemeinsamen gedruckten Informationen sowie bestimmte zusätzliche auf dem Vordruck ausgedruckte Informationen für die automatische Verarbeitung enthält.
- Fig. 4 ist eine Draufsicht auf einen Muster-Dokumentenvordruck aus Fig. 3, der mit Antworten versehen ist, die die Informationen darstellen, die mit der vorliegenden Erfindung gewonnen werden sollen.
- Figuren 5a und 5b sind Flußdiagramme, die das Verfahren der vorliegenden Erfindung zur Verarbeitung eines mit Antworten versehenen Dokumentenvordrucks aus Fig. 4 zeigen.
- Fig. 6 ist eine Darstellung einer gemäß der vorliegenden Erfindung erzeugten Bildschirmanzeige nach dem Abtasten des mit Antworten versehenen Dokuments aus Fig. 4 und dem Verarbeiten der festgelegten in Betracht kommenden Bereiche mit den in der vorliegenden Erfindung verfügbaren automatischen Symbolerkennungseinrichtungen.
- Fig. 7 ist eine Darstellung einer Bildschirmanzeige, wie der in Fig. 6 gezeigten, nach dem redaktionellen Eingriff einer Redaktionsperson zur Gewinnung von Informationen aus dem mit Antworten versehenen Dokument aus Fig. 4.
- Fig. 1 ist ein Blockdiagramm der Funktionsweise der verschiedenen Elemente der vorliegenden Erfindung. Der größte Teil der Funktionen der Erfindung wird in einem Server 100 ausgeführt, der ein Datenverarbeitungssystem ist, das aus einem UNIX-Server mit mehreren Gigabyte an Plattenspeicher oder einem anderen gleichschnellen Sekundärspeicher besteht. Im Server 100 befindet sich eine ein Scanner-Steuermodul 30 enthaltende Softwareausstattung, die die Arbeit von bis zu drei optischen Scannern 20 steuert und die über Datenübertragungskanäle 22 Daten von diesen empfängt. Weiterhin befindet sich im Server 100 ein Modul 40 zur Erzeugung von Anwendungen, das die Entwicklung einer großen Anzahl dokumentenspezifischer Abtast- und Verarbeitungsaufgaben des im folgenden beschriebenen Typs ermöglicht.
- Ein Systemverwaltungsmodul so ist über einen Kanal 42 mit einem Modul 40 zur Erzeugung von Anwendungen verbunden.
- Eine aus einem Datenübertragungskanal 12 und einer Bedieneranzeige (in Fig. 1 nicht gezeigt) bestehende Bedienerschnittstelle 12 ermöglicht es einem Bediener 10, den Server 100 zu überwachen und in den gewöhnlichen, in einem komplexen Datenverarbeitungssystem auftretenden Steuersituationen einzugreifen. Ein Kanal 52 verbindet das Systemverwaltungsmodul 50 mit anderen Servern (s. Fig. 2). Ein Kanal 56 verbindet das Systemverwaltungsmodul 50 mit dem Dateiverwaltungssystem 60. Das Dateiverwaltungssystem 60 ist mit einer Anzahl von Dateien verknüpft, deren Funktionen nachfolgend eingehender be schrieben werden, nämlich über einen Kanal 62 mit einer Rohbild-Datenbankdatei 162, über einen Kanal 64 mit der Übersetzungsdatenbank 164, über einen Kanal 66 mit einer Auftragswarteschlangendatei 166, über einen Kanal 68 mit einer Prüfungsdatenbank 168 und über einen Kanal 70 mit einer Anwendungsdatenbank 170.
- Ein Kanal 58 verbindet das Systemverwaltungsmodul 50 mit dem Arbeitsablauf-Steuermodul 80. Das Arbeitsablauf-Steuermodul 80 steuert den Arbeitsfluß zu einem ISR-System 110 für handgeschriebene Druckzeichen, das eine von mehreren in der vorliegenden Erfindung verwendeten Symbolerkennungseinrichtungen ist. Diese spezielle automatische Symbolerkennungseinrichtung ist beim gegenwärtigen Stand der Technik so komplex, daß sie vorzugsweise in der Form eines externen Hardware- Software-Bauteils verwirklicht ist. Die anderen in der bevorzugten Ausführungsform der vorliegenden Erfindung verwendeten Symbolerkennungseinrichtungen umfassen einen Strichcodeleser, einen optischen Markierungsleser und einen Schriftzeichen- OCR-Leser. Diese können in der auf dem Server 100 befindlichen Software verwirklicht sein. Andernfalls kann der OMR-Leser für standardgemäße optische Markierungsdaten in einen Scanner 20 eingebaut sein, und die externen Vorrichtungen eines Strichcodelesers 112, eines Schriftzeichen-OCR-Lesers 114 und eines speziellen (nicht standardgemäßen) OMR-Lesers 116 können, wie in Fig. 1 gezeigt ist, über Kanäle 87, 88 bzw. 89 mit dem Arbeitsablauf-Steuermodul 80 verbunden sein. Wenngleich das ISR-System 110 für handgeschriebene Druckzeichen in dem bevorzugten Ausführungsbeispiel abhängig von den Anforderungen an das System und von Kostenfragen alle alphanumerischen Zeichen lesen kann, kann ein etwas weniger hoch entwickelter Leser lediglich handgeschriebener numerischer Daten oder lediglich von Hand in Druckschrift abgefaßter alphabetischer Daten verwendet werden. Weiterhin sind eine oder mehrere Aufbereitungsarbeitsplätze 90 über Kanäle 82 mit dem Arbeitsablauf-Steuermodul 80 verbunden. Ein Kanal 84 verbindet das Arbeitsablauf-Steuermodul 80 mit dem Dateiverwaltungssystem 60, so daß das Arbeitsablauf-Steuermodul 80 auf Informationen zugreifen kann, die vom Scanner-Steuermodul 30 erhalten wurden, sowie auf Informationen, die in den verschiedenen mit dem Dateiverwaltungssystem 60 verbundenen Dateien gespeichert sind, und diese zu einem ISR-System 110 für handgeschriebene Druckzeichen, einem Strichcodeleser 112, einem Schriftzeichen-OCR-Leser 114 und einem speziellen OMR-Leser 116 oder zu einem Aufbereitungsarbeitsplatz 90 übertragen kann.
- Eine Hauptdatei 120, die über einen Kanal 124 mit dem Systemverwaltungsmodul 50 und über einen Kanal 126 mit dem Arbeitsablauf-Steuermodul 80 verbunden ist, wird zur Zusammensetzung von Ausgabedatensätzen verwendet, die über den Hauptdatenübertragungskanal 122 zu einem Hauptsystem (nicht eingezeichnet) übertragen werden. Die Ausgabe-Datensätze bilden ein wesentliches Endergebnis der vorliegenden Erfindung. Wie später in näheren Einzelheiten beschrieben wird, bestehen die Ausgabe-Datensätze aus Informationen im auf Zeichen beruhenden alphanumerischen Format oder im Pixelbildformat, die der Server 100 aus den durch den Scanner 20 abgetasteten Dokumenten gewinnt. Die vom Scanner 20 erzeugten Pixelbilder von Dokumenten werden gemäß der vorliegenden Erfindung so verarbeitet, daß die meisten Pixeldaten automatisch oder halbautomatisch zur Umwandlung der Pixelbilder der Dokumente in verwendbare, auf Zeichen beruhende alphanumerische Datensätze umgewandelt werden, während einige Pixeldaten in der Bildform verbleiben.
- Die vorliegende Erfindung ist zur Gewinnung von Daten aus Dokumenten geeignet, die in einer großen Anzahl optisch abtastbarer Formate kodierte Informationen enthalten. Hierbei kann es sich um Daten jeglicher Art handeln. Die am besten geeigneten Situationen für die Verwendung der Erfindung sind Datenerfassungssituationen, in denen ein großer Datenumfang gesammelt und verarbeitet werden muß und in denen ein Dokumentenvordruck verwendet werden kann, um die Erfassung von Informationen zu lenken. Typischerweise werden Informationen einer antwortenden Person erfaßt, die den Dokumentenvordruck oder eine zugehörige Broschüre liest und Antwortkennzeichnungen verschiedener Art auf dem Dokumentenvordruck markiert oder diese auf den Dokumentenvordruck schreibt. Allen antwortenden Personen wird im wesentlichen das gleiche Dokument gegeben, wenngleich die einzelnen, den jeweiligen antwortenden Personen ausgehändigten Vordrucke unterschiedliche Informationen enthalten können, die dazu verwendet werden, die jeweilige antwortende Person oder möglicherweise einen Teil der antwortenden Personen oder irgendeinen bei einer antwortenden Person einzigartigen Umstand zu identifizieren.
- Fig. 2 zeigt eine schematische Bilddarstellung der in einem Hochgeschwindigkeitsnetzwerk (z. B. Ethernet) verwendeten vorliegenden Erfindung. In Fig. 2 ist der Server 100 ebenso wie in Fig. 1 mit drei Scannern verbunden. Ein Server Bedienpult 102 und ein Überwachungs-Anschlußgerät 104 sind ebenfalls mit dem Server 100 verbunden. Mehrere Aufbereitungsarbeitsplätze 90 sind mit dem Server 100 verbunden. Eine Brücke 51 verbindet den Server 100 mit einem Datenübertragungs-Server 130, der wiederum über einen Kanal 122 mit einem Hauptcomputer verbunden ist, sowie mit einem Modem 132, das dazu verwendet werden kann, zur Unterstützung beim Auftreten von Fehlern einen wählbaren Zugang zum System zu bieten.
- Die Leitung 52 verbindet den Server 130 mit einer weiteren Brücke 251, die zu einem weiteren Server 200 führt. Der Server 200 gleicht im wesentlichen dem Server 100, und die Vorrichtungen in seinem Netzwerk sind mit denselben Bezugszahlen versehen, wie die entsprechenden Vorrichtungen für den Server 100, jedoch mit einer vorangestellten "2". Die mit dem Server 200 verbundenen Aufbereitungsarbeitsplätze 290 ent sprechen daher den mit dem Server 100 verbundenen Aufbereitungsarbeitsplätzen 90. Die Leitung 52 führt auch zu einem weiteren Server 300, wobei die Bezugszahlen wiederum die Entsprechung gleicher Vorrichtungen des Netzwerks für den Server 100 zeigen, abgesehen davon, daß eine vorangestellte "3" verwendet wird. Mit der zum Server 300 führenden Leitung 52 ist weiterhin eine löschbare Bildplatten-Speichervorrichtung 142 vom "Jukebox"-Typ mit einem eigenen Server 140 verbunden, die für die Verwendung als Massenspeicher zur Archivierung oder für andere Zwecke vorgesehen ist.
- Fig. 3 ist eine Draufsicht eines für die effiziente Verarbeitung gemäß der vorliegende Erfindung entwickelten Dokumentenvordrucks 400. Der Vordruck 400 enthält das allen Ausfertigungen des Dokumentenvordrucks gemeinsame Druckmaterial sowie gewisse zusätzliche für die automatische Verarbeitung auf dem Vordruck ausgedruckte Informationen. Der Dokumentenvordruck 400 aus Fig. 3 zeigt die verschiedenen Möglichkeiten der vorliegenden Erfindung. Er stellt ein typisches Dokument dar, das dazu verwendet werden könnte, Informationen von einer Anzahl vieler antwortender Personen, in diesem Fall Abonnenten oder möglichen Abonnenten einer erdachten, "PC News" genannten Zeitschrift zu gewinnen. Jeder Abonnent erhält den gleichen Dokumentenvordruck 400, abgesehen davon, daß der Vordruck, den jeder Abonnent erhält, gewisse in der oberen linken Ecke (der mit 410 bezeichnete, von einer unterbrochenen Linie umgebene Bereich) ausgedruckte Informationen enthält, die den Abonnenten kennzeichnen (Name, Firma, Adresse usw.).
- Der Dokumentenvordruck 400 aus Fig. 3 weist einige der Merkmale eines typischen, ausschließlich für das OMR-Abtasten entwickelten Antwort-Dokumentenvordrucks auf. Das heißt, er weist die übliche entlang des rechten Randes verlaufende Markierungsspalte 402 auf, die als Taktspur dient, sowie einen entlang des unteren Randes verlaufenden Kontrastkalibrierungsstrich 404. Alle auf dem Vordruck 400 sichtbaren Druckinformationen sind mit Ausnahme des Kontrastkalibrierungs strichs 404, der Taktspur 402 und der in dem mit 410 bezeichneten Bereich enthaltenen Druckinformation mit einer Tintenfarbe gedruckt, die für eine lesende Person leicht sichtbar ist, die jedoch keinen Kohlenstoff oder ein anderes Material enthält, das Licht des nahen Infrarotbereichs absorbiert oder das in einem Scanner im NIR-Modus erkennbar ist. Die Druckertinte für den Kontrastkalibrierungsstrich 404, die Taktspur 402 und die Druckinformation innerhalb des mit 410 bezeichneten Bereichs enthält Graphit oder ein anderes Material, das sie Licht des nahen Infrarotbereich absorbieren läßt. (Zur Korrektur einer Schräglage sowie für andere Ausrichtungszwecke verwendete Triangulationsmarkierungen, die in näheren Einzelheiten in der vorausgehend erwähnten verwandten Anmeldung beschrieben sind, würden auch mit MIR-Licht absorbierender Tinte gedruckt werden). Wenn der Vordruck 400, wie er in Fig. 3 erscheint, in einem MIR-Modus abgetastet wird, erscheint dieser daher im sich ergebenden Pixelbild, abgesehen von der Taktspur 402, dem Kontrastkalibrierungsstrich 404 und der Druckinformation im Bereich 410 als unbedruckt. Wenn der Vordruck 400, wie er in Fig. 3 erscheint, andererseits mit einem im VIS-Modus arbeitenden Scanner abgetastet wird, erscheinen alle in Fig. 3 auftretenden Druckinformationen in dem sich aus dem VIS-Abtasten ergebenden Pixelbild (mit Ausnahme der Bezugszahlen und der zur Kennzeichnung von zu den Bezugszahlen gehörigen Bereichen verwendeten unterbrochenen Linien, die Artefakte einer Patentzeichnung sind).
- Es ist ersichtlich, daß der Vordruck 400 erste Kennzeichnungen (alle Druckinformationen mit Ausnahme der Taktspur 402, des Kontrastkalibrierungsstrichs 404 und der Druckinformation im Bereich 410) enthält, die in einem Abtastmodus unter Verwendung von Licht eines ersten Spektralbereichs, in diesem Fall des Bereichs des sichtbaren Lichtes erkennbar sind, jedoch nicht in einem zweiten Abtastmodus unter Verwendung von Licht außerhalb des ersten Spektralbereichs, also in einem zweiten Abtastmodus unter Verwendung von Licht des nahen Infrarotbereichs. Der Vordruck 400 enthält weiterhin zweite Kennzeichnungen (die Taktspur 402, den Kontrastkalibrierungsstrich 404 und die Druckinformation im Bereich 410), die entweder im ersten oder im zweiten Abtastmodus erkennbar sind. Wie später in näheren Einzelheiten erklärt wird, ist es diese Fähigkeit, die auf der Oberfläche eines Vordrucks enthaltenen Informationen, abhängig von den Tintentypen sowie der spektralen Empfindlichkeit der verwendeten Scanner, in zwei Klassen einzuteilen, aus der sich viele Vorteile dieser Erfindung ergeben.
- In Fig. 4 ist der gleiche Vordruck wie in Fig. 3 dargestellt, abgesehen davon, daß der Vordruck 400 in Fig. 4 die von der antwortenden Person in den Vordruck eingetragenen Markierungen, schriftlichen Eintragungen und anderen Informationen zeigt. Wie man sieht, hat die antwortende Person Markierungen in einer Anzahl von Antwortblasen vorgenommen, handschriftliche Antworten in bestimmte Bereiche für Antworten in nicht festgelegter Form geschrieben, verschiedene Buchstaben und Zahlen in bestimmte Antwortbereiche eingetragen und einen Strichcode-Aufkleber in einem Bereich angebracht. Der Empfänger dieses mit Antworten versehenen Vordrucks 400 möchte die in den Antworten enthaltenen Informationen mittels einer automatischen Einrichtung gewinnen, wobei die Möglichkeit für eine Person gegeben sein sollte, die Ergebnisse der automatischen Verarbeitung durch die verschiedenen vorausgehend erwähnten intelligenten Symbolerkennungseinrichtungen zu überprüfen und einzugreifen, wenn die automatische Verarbeitung nicht in der Lage ist, die gesuchten Informationen zu erhalten, und daher keine auf Zeichen beruhenden, die zu dekodierenden Informationen wiedergebenden alphanumerischen Daten liefern kann.
- Der erste Schritt bei der Verwendung der vorliegenden Erfindung zur Gewinnung von Informationen aus einem Antwort- Dokumentenvordruck, wie dem in Fig. 3 gezeigten, liegt in der Festlegung der erforderlichen anwendungsspezifischen Verarbeitung. Anwendungen sind so festgelegt, daß sie sich auf ein oder mehrere abtastbare Dokumente konzentrieren, die hinsichtlich einer logischen Gruppierung eine einzige Eingabeeinheit für das Abtastsystem bilden. Der Vordruck 400 stellt eine Einheit dar, die aus einer einzigen Seite besteht. Eine von einer antwortenden Person auszufüllende Testbroschüre mit mehreren Seiten oder ein Bestellvordruck mit mehreren Seiten ist eine mehrere Seiten umfassende Einheit. Die Anwendungsfestlegung enthält die Spezifizierung maschinenlesbarer Dokumenterkennungssymbole und Eintragungserfordernisse sowie Vorschriften für die Abfolge des Dokuments. Diese ermöglichen es, daß ein Scanner 20 erkennt, ob ihm Dokumente vorliegen, die zu den für die Anwendung festgelegten Abtastverfahren passen, und den Abschluß einer einzelnen Abtasteinheit zu erkennen. Die Anwendung legt auch sogenannte in Betracht kommende Bereiche (AOIs) fest. Ein in Betracht kommender Bereich kann irgendein Bereich auf der Oberfläche des Vordrucks 400 sein. (Während in manchen Anwendungen die vordere und die hintere Oberfläche eines Dokumentenvordrucks verwendet werden, wird in der folgenden Diskussion des Vordrucks 400 zur Klarheit der Beschreibung der vorliegenden Erfindung angenommen, daß dessen erste und zweite Kennzeichnungen nur auf eine Oberfläche gedruckt sind, nämlich die in den Figuren 3 und 4 gezeigte Oberfläche).
- In der Anwendungsfestlegung sind auch die in Betracht kommenden Objekte innerhalb der Anwendung festgelegt ("Objekte") . Objekte sind typischerweise logisch gruppierten Ausgabedaten zugeordnet. Beispielsweise sind der Name, die Adresse, die Frage Nr. 2 und die Sozialversicherungsnummer jeweils Objekte auf einem Dokument, die einen Satz sinnvoller Daten darstellen. Ein einziges Objekt kann zu mehreren AOIs auf dem Dokument führen. Um beispielsweise das Adressenobjekt auf dem Vordruck 400 zu zerlegen, muß das System die die Umschlagadresse, die Stadt, den Bundesstaat und die Postleitzahl enthaltenden Bereiche auf dem Vordruck 400 auswerten, die aus Wirksamkeits- oder Zeichnungsgründen alle eigene AOIs haben können. Objekte können daher als Zusammensetzungen von AOIs auf dem Dokument mit für jedes AOI festgelegten Verarbeitungseinrichtungen festgelegt sein und einen oder mehrere Ausgabeteile aufweisen. Die Ausgabe kann hinsichtlich der Form und der Gliederung für jedes Objekt festgelegt sein. Die Ausgabe für ein Namensobjekt kann aus vier Feldern, nämlich dem Vornamen als ASCII-Feld, dem Nachnamen als ASCII-Feld, dem Anfangsbuchstaben des zweiten Vornamens als Zeichen- ASCII-Feld sowie dem Bild der Unterschrift selbst bestehen. Diese Felder sind hinsichtlich der Größe und der Reihenfolge festgelegt, so daß für die weitere Verarbeitung eine übereinstimmend verwendbare Gliederung für einen Ausgabe-Datensatz gebildet wird.
- Alle Vorschriften und anderen Informationen, die an der Festlegung einer Anwendung beteiligt sind, werden in der Anwendungsdatenbank 170 und/oder der Übersetzungsdatenbank 164 und/oder der Prüfungsdatenbank 168 gespeichert.
- Fig. 3 zeigt eine Anzahl von durch unterbrochene Linien in Fig. 3 festgelegten AOIs. (Diese unterbrochenen Linien könnten auf dem Vordruck 400 unter Verwendung von Tinte ausgedruckt sein, die nur im ersten Abtastmodus erkennbar ist, sie sind jedoch für die antwortenden Personen ohne Bedeutung und treten normalerweise auf dem Vordruck 400 nicht auf). Ein AOI 410 legt den Bereich fest, in dem einige für den Abonnenten/die antwortende Person spezifische Informationen in einer Schrift ausgedruckt sind, die von einem Schriftzeichen-OCR- Leser "gelesen" oder dekodiert werden kann. Ein AOI 420 enthält zwei Ja-Mein-Fragen, die jeweils mit zwei entsprechenden von der antwortenden Person zu markierenden OMR-Antwortbereichen oder "Blasen" versehen sind. Die AOIs 430 und 440 enthalten jeweils mehrere OMR-Antwortblasen, die einer Anzahl von Auswahlen entsprechen, die die antwortende Person durchführen kann. Dem AOI 430 und dem AOI 440 ist ein Bereich 435 bzw. 445 zugeordnet, der die Eintragung von Informationen in nicht festgelegter Form durch die antwortende Person ermöglicht. In der letzten OMR-Antwortblase in jedem der AOIs 430 und 440 wird der Benutzer aufgefordert, darauf hinzuweisen, daß in den zusammen mit den AOIs 435 und 445 auftretenden Zeilen ein Eintrag in nicht festgelegter Form beigefügt ist. Ein AOI 450 ist ein gitterförmiger Antwortbereich, der an den Schnittpunkten des Gitters OMR-Antwortblasen aufweist. Im AOI 460 wird die antwortende Person aufgefordert, jeweils einen Druckbuchstaben oder eine Zahl in einzelne freie Plätze gleicher Größe einzutragen. Durch diese anleitende Form des Antwortfeldes wird es für das ISR-System 110 für handgeschriebene Druckzeichen sehr viel einfacher, die Markierungen zu "lesen" oder zu dekodieren. Ein AOI 470 ist für eine Unterschrift vorgesehen, die normalerweise von einer automatischen Symbolerkennungseinrichtung nicht verarbeitet wird. Statt dessen wird eine Unterschrift einfach als Pixelbild abgespeichert. Ein AOI 480 ist dem AOI 460 abgesehen davon ähnlich, daß in den vorbestimmten Plätzen lediglich Zahlen von Hand eingetragen werden. Ein AOI 490 ist dem AOI 450 sehr ähnlich und weist wiederum Antwortblasen in einem Gittermuster auf, von denen jede einzelne oder mehrere markiert sein können. Der AOI 500 ist ein nicht begrenzter Antwortbereich in nicht festgelegter Form, in dem handschriftliche, von heutigen ISR- Systemen für handgeschriebene Druckzeichen nicht lesbare Ant worten zu erwarten sind. Dementsprechend kann das Auftreten jeglicher handgeschriebener Bemerkungen in diesem AOI, wie beim AOI 480 für die Unterschrift, das Abspeichern eines Pixelbildes des gesamten beschriebenen Bereichs nach sich ziehen. Ein AOI 510 ist ein Bereich, der für das Einfügen eines vorgedruckten Strichcodes von einem Aufkleber oder einer anderen Quelle vorgesehen ist. Dieser AOI 510 wird von einem Strichcode-Leser verarbeitet. Ein AOI 520 enthält eine Mischung von OMR-Blasen und für handgeschriebene Zahlen vorbestimmte Bereiche, die die gleichen Informationen enthalten, wenn sie richtig ausgefüllt sind.
- Die Figuren 5a und 5b enthalten Flußdiagramme, in denen der Gesamtablauf für die Verarbeitung entsprechend der vorliegenden Erfindung beschrieben ist. Die durch die Flußdiagramme ausgeführten verschiedenen logischen Schritte und Arb eitsabläufe werden vom Server 100 unter Verwendung der Scanner 20, der Aufbereitungsarbeitsplätze 90 und der ISR-Einrichtungen 110, 112, 114 und 116 ausgeführt. Die Scanner 20 tasten im VIS-Modus ab, wenn sie die Informationen auf einem unmarkierten Vordruck 400 erfassen oder im MIR-Modus, wenn sie die Markierungen auf einem mit Markierungen versehenen Vordruck 400 erfassen. In der bevorzugten Ausführungsform kann jeder der Scanner in beiden Modi abtasten und unter der Steuerung des Scanner-Steuermoduls 30 von einem Modus in den anderen wechseln. In weniger hochentwickelten Systemen wäre es gleichermaßen annehmbar, wenn ein Scanner 20 ausschließlich für das Abtasten im VIS-Modus vorgesehen wäre und andere ausschließlich für das Abtasten im MIR-Modus vorgesehen wären. Es ist lediglich erforderlich, daß die Steuerlogik ein Signal empfängt, das den aktuellen Abtastmodus anzeigt.
- Wenn ein Dokument abgetastet wird, überträgt der Scanner 20 ein vollständiges, nicht komprimiertes, unbearbeitetes Pixelbild in einen geeigneten Zwischenspeicher, üblicherweise einen "Bildscanner", der Teil des Scanners 20 ist. Das Pixelbild im Bildscanner wird vorzugsweise unter Verwendung von einer der unter den Namen "Runlength", "Huffman" oder "LZW" bekannten verlustlosen Komprimierungstechniken komprimiert. Wenn es sich um eine VIS-Abtastung eines unmarkierten Dokumentenvordrucks handelt (der dennoch einige für die spezielle Ausfertigung des Dokumentenvordrucks kennzeichnende Daten, wie die Informationen zur Erkennung der antwortenden Person im AOI 410 enthalten kann), so wird das komprimierte Pixelbild nicht mit einer automatischen Symbolerkennungseinrichtung verarbeitet. Die Pixeldatei wird dementsprechend für die spätere Verwendung in einer Zusammenfügungsoperation unter Einschluß veränderlicher Daten aus einer NIR-Abtastung, bei der das Pixelbild der VIS-Abtastung typischerweise als Hintergrund verwendet wird, abgespeichert. Falls es sich um eine MIR-Abtastung handelt, überträgt der Scanner 20 wiederum ein vollständiges, nicht komprimiertes, unbearbeitetes Pixelbild in einen geeigneten Zwischenspeicher in der Art eines Bildscanners, und das gespeicherte Bild wird vorzugsweise komprimiert, bevor es in einer permanenten Datei abgespeichert wird.
- Da die MIR-Abtastung nur Markierungen oder Druckinformationen berücksichtigt, die Licht im nahen Infrarotbereich absorbieren, wird ein großer Teil dessen, was auf dem Vordruck 400 erscheint, im sich ergebenden Pixelbild nicht berücksichtigt. Die Tinte für die typischen, auf dem Vordruck erscheinenden vorgedruckten Informationen ist demnach bei der MIR- Abtastung unsichtbar, und mit dieser Tinte bedruckte Bereiche erscheinen als weiße, eine begrenzte Menge an dunkleren Antwortmarkierungen umgebende Stellen. Da die Menge solcher weißer Stellen im Vergleich zu den dunkleren Antwortmarkierungen bei den meisten Anwendungen sehr groß ist, kann eine beträchtliche Komprimierung erreicht werden. Eine weitere Komprimierung ist möglich, wenn die einzigen Bereiche des Pixelbildes der MIR-Abtastung gewisse festgelegte AOIs sind, wenn diese AOIs weniger als nahezu die gesamte Oberfläche des Dokumentes ausmachen, oder wenn für jedes eine Inhaltsprüfung vorgenommen wird, bevor es für die Speicherung zugelassen wird, um festzustellen, ob überhaupt irgendwelche Markierungen vorhanden sind. Die spezielle verwendete Inhaltsprüfung hängt vom Typ der verwendeten Informationskodierung ab. Beispielsweise würde bei OMR-Daten nur dann das Vorhandensein eines Inhalts festgestellt werden, wenn einige OMR-Blasen innerhalb des AOI einen beträchtlichen Grauwertinhalt aufwiesen. Für Strichcode-Daten müßte ein sinnvolles Strichcode-Muster gegeben sein. Damit festgestellt würde, daß ein AOI von Hand eingetragene druckschriftliche Markierungen enthält, müßte eine sinnvolle Gesamtgrauwertdichte überschritten sein. Bei manchen Anwendungen, wie beispielsweise einem Besteilvordruck mit einer umfangreichen Liste auswählbarer Produkte könnte jedes Produkt als einzelner AOI festgelegt sein, es würden jedoch nur die AOIs für die spätere Verarbeitung abgespeichert werden, die tatsächlich Bestellinformationen enthielten.
- Unabhängig davon, ob alle festgelegten AOIs oder nur festgelegte AOIs, die tatsächlich Markierungen enthalten, abgespeichert werden, wird eine Warteschlange der AOIs für die weitere Verarbeitung gebildet. Wie vorausgehend erwähnt wurde, wird jedem AOI bei der Festlegung der Typ der automatischen Symbolverarbeitungseinrichtung zugeordnet, die zur Dekodierung der im AOI markierten Antwortinformationen verwendet werden sollte, falls dem AOI überhaupt eine automatische Symbolverarbeitungseinrichtung zugeordnet werden sollte. Wenn jeder AOI zur Verarbeitung aus der Warteschlange entfemt wird, wird das dem AOI entsprechende Pixelbild zur automatischen Symbolverarbeitungseinrichtung übertragen, die für diesen AOI festgelegt ist. Falls ein AOI in der Warteschlange nicht für die automatische Symbolverarbeitung geeignet ist, wird er einfach für die spätere Anzeige gespeichert. Für jeden AOI, der zu einer automatischen Symbolverarbeitungseinrichtung übertragen wird, wird eine Kette auf Zeichen beruhender alphanumerischer Daten erzeugt. In der bevorzugten Ausführungsform überträgt die automatische Symbolverarbeitungseinrichtung weiterhin einen Statuscode einer beliebigen Art (beispielsweise ein Bearbeitungs-Hinweiszeichen) zurück, der anzeigt, ob sie das Pixelbild, zu dessen Verarbeitung sie angewiesen wurde, erfolgreich verarbeiten konnte. Wenn bei der Verarbeitung eine Schwierigkeit auftritt (wenn ein OMR- Leser eine helle OMR-Markierung antrifft, die zu einem als mehrdeutig eingestuften Grauwert führt, oder wenn das ISR-System für handgeschriebene Druckzeichen einen Druckbuchstaben nicht erkennen kann, der zu sehr von der Norm abweicht), so wird ein redaktioneller Eingriff durch eine Person wünschenswert sein, und es ist wahrscheinlich, daß die von der automatischen Symbolerkennungseinrichtung erzeugten Ergebnisse alphanumerischer, auf Zeichen beruhender Daten eine Korrektur oder eine Vervollständigung erfordern. Unabhängig davon, ob das Bearbeitungs-Hinweiszeichen gesetzt wurde oder nicht, werden die Ergebnisse der Verarbeitung eines jeden AOIs durch die zugewiesene automatische Symbolverarbeitungseinrichtung für die Anzeige dem Pixelbild des AOIs zugeordnet, wie nachfolgend erörtert wird.
- Zusammenfassend erfaßt der Scanner 20 das gesamte Bild der vorderen und der hinteren Oberfläche des Vordrucks beim Abtasten eines Dokumentes als unkomprimierte Daten mit 8 Bit pro Pixel. Die AOIs auf dem Vordruck werden hinsichtlich ihres Inhalts untersucht und entsprechend der dem Vordruck zugeordneten Anwendungsfestlegung ausgewertet. Die AOIs können zu diesem Zeitpunkt vom Scanner 20 als OMR-Antwortblasen, als von Hand geschriebene Antworten enthaltende Bereiche oder als Bildausschnitte ausgewertet werden. In einer Ausführungsform, in der der Scanner 20 hochentwickelt und mit einer großen Verarbeitungsleistung ausgestattet ist, wertet der Scanner 20 AOIs auch unter Verwendung seiner eigenen Schriftzeichen-OCR- und Strichcode-Leseeinrichtungen sowie anderer Symbolverarbeitungseinrichtungen aus. Wenn der Scanner 20 die sinnvollen Daten eines Vordrucks erkannt und zerlegt hat, überträgt er diese Daten zum Scanner-Steuermodul 30. Diese Daten können aus Zeichen im ASCII-Code, komprimierten oder unkomprimierten Bildern oder einer Darstellung eines unbearbeiteten OMR-Gitters bestehen.
- Das Arbeitsablauf-Steuermodul 80 beruht auf dem Gedanken, daß durch den Abtastvorgang Objekte erzeugt werden, die von einer ISR-Einrichtung verarbeitet werden sollen und daß der Ausgabe-Datensatz für einen Anwendungsfall (beispielsweise eine mit Antworten markierte Ausfertigung des Vordrucks 400) nach der erfolgreichen Auswertung aller diesem Fall zugeordneter Objekte erzeugt werden soll. Die Steuerung des Arbeitsablaufes ist ein zweistufiger Vorgang. In der ersten Stufe werden die Einrichtungen des Systems verwaltet, um die Verarbeitungseinrichtungen des Systems, wie die CPU, den Plattenspeicher usw. zu überwachen. In der bevorzugten Ausführungsform beginnt die erste Stufe und steuert die Verarbeitungsvorgänge der zweiten Stufe, in der die Objekte für eine einzelne Einheit der Anwendung gesammelt und ausgewertet werden. Der Verarbeitungsvorgang der zweiten Stufe ist, falls dies möglich ist, für das Zerlegen der Objekte oder das Übertragen der Objekte zu geeigneten ISR-Einrichtungen, also dem Schriftzeichen-OCR-Leser 114, dem Strichcode-Leser 112 oder einem Aufbereitungsarbeitsplatz 90 für die optische Überprüfung durch eine Person, verantwortlich. Der Inhalt der Anzeige für die optische Überprüfung durch eine Person wird durch Daten zur Festlegung der Anzeige festgelegt, die Teil der Anwendungsfestlegung sind.
- Wenn die automatischen Symbolerkennungseinrichtungen alle von einem im MIR-Modus abgetasteten Dokument gewonnenen AOIs aus einer Warteschlange von AOIs verarbeitet haben, können die Ergebnisse direkt zu einem die wesentlichen, aus dem abgetasteten Dokument gewonnenen Informationen enthaltenden Ausgabedatensatz für die Übertragung zu einem Hauptcomputer (nicht gezeigt) zusammengestellt werden. Dieser Datensatz, der eine Übersetzung der Markierungen auf dem mit Antworten markierten Vordruck in Zeichenketten alphanumerischer Daten darstellt und auch Bilder enthalten kann, ist dazu geeignet, von irgendwelchen, für die Annahme und die weitere Verarbeitung der Informationen erdachten Hauptanwendungsprogrammen verarbeitet zu werden. Bei den meisten Anwendungen ist es sehr wichtig, daß die Ausgabe-Datensätze getreue Übersetzungen der mit Antworten markierten Vordrucke sind. Dementsprechend ermöglicht es die vorliegende Erfindung, die als Ergebnis der Verarbeitung einiger oder aller AOIs auf einem Dokument erhaltenen Informationen für jeglichen erforderlichen redaktionellen Eingriff auf einem Aufbereitungsarbeitsplatz 90 anzuzeigen.
- In den Figuren 5b und 6 sind die Arbeitsabläufe zum Zusammenstellen einer Bildschirmanzeige 600 für einen Aufbereitungsarbeitsplatz 90 und der Entwurf einer solchen Anzeige gezeigt. Das Bild des Aufbereitungsbildschirms in Fig. 6 ist das Ergebnis der Verarbeitung der AOIs aus Fig. 4 sowie des Anzeigens ausgewählter AOIs. Jeder dargestellte AOI weist eine zugeordnete Stelle oder ein zugeordnetes Tabulatorsymbol 610, 620, 630 und 640 auf, die oder das der Bediener ansteuern kann, wenn er einen speziellen AOI bearbeiten möchte. Mit jedem Tabulatorsymbol ist ein Bild dargestellt, das aus der VIS-Abtastung erhaltene erste Kennzeichnungen sowie aus der NIR-Abtastung erhaltene zweite Kennzeichnungen enthält. Diese wurden zur Bildung eines einzigen Bildes in der nachfolgend beschriebenen Weise zusammengefügt. Der AOI 410 ist unter der Annahme, daß er von der antwortenden Person nicht bearbeitet wurde und unter der Annahme, daß die Schriftzeichen-OCR-Übersetzung in auf Zeichen beruhende Daten sehr zuverlässig ist, nicht auf dem Aufbereitungsbildschirm 600 dargestellt.
- (Weiterhin können zur weiteren Erhöhung der Genauigkeit, Prüfziffern zum Schriftzeichen-OCR-Text hinzugefügt werden.)
- Dementsprechend wird die alphanumerische Übersetzung dieser Informationen direkt in den Ausgabe-Datensatz für dieses Dokument übertragen. Der AOI 420 wird auf dem Aufbereitungsbildschirm 600 dargestellt (Tabulatorsymbol 610), da der OMR Leser die Markierung beim zweiten "Nein" wegen des geringen Dunkelwerts innerhalb der Antwortblase als mehrdeutig ansah. Der Server 100 stellt direkt oberhalb des Bildes des AOI 420 die Buchstaben "J N?" dar, die die Dekodiertätigkeit des OMR- Lesers anzeigen sowie deren Ergebnis, daß die Markierung mehrdeutig ist und einen redaktionellen Eingriff erfordern könnte.
- Der AOI 435 ist ebenfalls auf dem Aufbereitungsbildschirm 600 dargestellt (Tabulatorsymbol 620). Dessen Darstellung wird durch das Lesen einer Markierung durch den OMR-Le ser in der letzten Anwortblase im AOI 430 ausgelöst, die die Auswahl "andere (bitte erläutern)" bezeichnet. Im Bild des AOI 435 ist folglich der durch die antwortende Person vorgenommene handschriftliche Eintrag des Wortes "Verlagswesen" gezeigt, der durch keine automatische Symbolverarbeitungseinrichtung übersetzt werden konnte. Um dem Bediener die Übersetzung des handschriftlichen Eintrags zu ermöglichen und diesen in den Ausgabe-Datensatz aufzunehmen, erzeugt der Server eine Leerzeile 622 als Teil des Aufbereitungsbildschirms 600 und fordert dabei den Bediener auf, das Wort "Verlagswesen" einzugeben.
- Beim Tabulatorsymbol 630 auf dem Aufbereitungsbildschirm 600 ist der AOI 460 dargestellt. Neben dem Bild des AOI 460 ist eine durch den Server 100 erzeugte Mehrzeilen-Anzeige 632 angeordnet, die die vom ISR-System für handgeschriebene Druckzeichen entwickelten alphanumerischen Daten enthält, zu dem das Pixelbild des AOI 460 zur Übersetzung in auf Zeichen beruhende Daten übertragen wurde. Es ist ersichtlich, daß die Anzeige 632 drei Leerzeilen (die erste, die zweite und die vierte) enthält, in die die antwortende Person keine Daten eingetragen hat, und daß die alphanumerische Übersetzung der dritten, fünften und sechsten Zeile versucht wurde. Aus dieser Anzeige sollte der Bediener schließen können, daß in der dritten Zeile ein Übersetzungsfehler aufgetreten ist, in der wahrscheinlich wegen des wenig sorgfältig gebildeten "D"s das druckschriftliche "DEM" als "OEN" übersetzt wurde. Weiterhin wird der Bediener feststellen, daß die letzte Ziffer der Postleitzahl als "?" übersetzt wurde, was den Bediener veranlaßt, die wenig sorgfältig druckschriftlich von Hand eingetragene "5" zu lesen. Der Bediener kann den Text daraufhin auf der Anzeige 632 bearbeiten und die erforderlichen Verbesserungen ausführen. Die Leerzeilen können abhängig von der Festlegung der Anwendung in unterschiedlicher Weise gehandhabt werden. Der Bediener könnte aufgefordert werden, eine Darstellung des AOIs 410 anzufordern, um das, was dort erscheint, in die Leerzeilen zu übertragen. Statt dessen könnte der Bediener das System einfach anweisen, die sich aus dem Lesen des AOIs 410 durch den Schriftzeichen-OCR-Leser ergebende übersetzte alphanumerische Zeichenkette unter der Annahme in die Leerzeilen in der Anzeige 632 einzutragen, daß die meisten antwortenden Personen die Zeilen unausgefüllt lassen, in die Informationen eingetragen werden sollen, die bereits richtig in den AOI 410 eingetragen wurden.
- Beim Tabulatorsymbol 640 auf dem Aufbereitungsbildschirm 600 ist der AOI 520 dargestellt, der durch den OMR-Leser nicht erfolgreich verarbeitet werden konnte. (Da der Antwortbereich ein richtig ausgefülltes OMR-Gitter enthält, wurde der Bereich oberhalb des OMR-Gitters für die druckschriftliche Eintragung derselben, im OMR-Gitter zu kodierenden Zahlen nicht als Pixelbild für die Verarbeitung durch das ISR-System für handgeschriebene Druckzeichen übertragen.) Es ist für den Bediener leicht ersichtlich, daß die beiden letzten Ziffern durch den OMR-Leser nicht dekodiert werden konnten, da die Antwortblasen für die "0" und die "5" in der vorletzten Spalte des Gitters markiert wurden. Wiederum wird der Bediener durch die vom Server erzeugte Zeichenkette "10665??" aufgefordert, die von Hand eingetragenen Zahlen zu lesen und die beiden letzten Ziffern unter der Annahme einzugeben, daß die von Hand eingetragenen Zahlen richtig sind, wenngleich sie sich von den in die Antwortblasen des Gitters eingetragenen Markierungen unterscheiden.
- Wenngleich in Fig. 6 mehrere AOIs in der Form zusammengeführter Bilder gezeigt sind, die Informationen aus den Abtastvorgängen im VIS-Modus und im MIR-Modus enthalten, ist dies nicht immer notwendig. Die zusammengeführten Bilder machen die dargestellten Daten erkennbar, wenngleich es andere Verfahren gibt. Wenn der Server 100 durch die Anwendung veranlaßt wird, Hinweiszeichen für die Bildschirmanzeige 600 zu entwickeln, könnten diese dazu verwendet werden, der die Anzeige betrachtenden Person bei der Erkennung des dargestellten AOIs zu helfen, falls die dargestellten Informationen nicht unmittelbar verständlich sein sollten.
- Wenngleich die Verwendung eines Abtastens im MIR-Modus ein besonders wirksames Verfahren zur Trennung der auf einem Vordruck aufgezeichneten veränderlichen Daten von den Hintergrund-Druckinformationen darstellt, kann diese Trennung durch andere Verfahren geschehen. Wenn es wünschenswert sein sollte, lediglich ein VIS-Abtasten zu verwenden, könnten die AOIs durch ihren Ort festgelegt werden und unter Verwendung einer Hintergrundschablone zur Verringerung der Auswirkungen jeglicher Hintergrund-Druckinformationen ausgewertet werden. Dieses Verfahren könnte zur Trennung des in einem AOI enthalte nen Pixelbildes veränderlicher Daten von den Hintergrund- Druckinformationen verwendet werden, die Teil desselben Pixelbildes wären. Bei diesem System wäre es gewöhnlich weiterhin wünschenswert, eine "leere", unmarkierte Ausfertigung des Vordrucks abzutasten, um ein sauberes Hintergrundbild für jegliche durch Überlagern des Hintergrundes mit den in einem AOI erfaßten veränderlichen Daten zusammengeführte Bilder bereitzustellen.
- In Fig. 7 ist der Aufbereitungsbildschirm 600 nach allen redaktionellen Eingriffen dargestellt. Die Berichtigungen und Hinzufügungen ermöglichen es, daß der Ausgabedatensatz des Dokumentes vervollständigt und für die Speicherung in der Hauptdatei 120 für die spätere Übertragung zu einem Hauptcomputer (nicht dargestellt) über den Kanal 122 fertiggemacht wird. Auf dem Hauptrechner kann ein Abonnementsauftrag gedruckt und verarbeitet werden, ein Brief gedruckt werden, in dem der antwortenden Person für seine/ihre Antwort gedankt wird und in dem er/sie benachrichtigt wird, daß er/sie für ein Abonnement in Frage kommt oder es können irgendwelche anderen Arbeitsvorgänge durchgeführt werden.
- Eine weitere Anwendung, bei der die vorliegende Erfindung sehr nützlich wäre, ist die Verarbeitung von Bestellvordrucken oder -broschüren. Bei dieser Anwendung wird der von einem Kunden oder einem mit einem oder mehreren Kunden arbeitenden Vertreter der Firma ausgefüllte Bestellvordruck zur Erkennung der bestellten Produkte sowie deren Anzahl, der be stellenden Partei, der Lieferadressen, der Einzelheiten der Bezahlung usw. abgetastet. Bei einer solchen Anwendung könnte die Zusammenstellung des Ausgabe-Datensatzes auch die Prüfung der durch Verarbeiten verschiedener AOIs durch automatische Symbolverarbeitungseinrichtungen gewonnenen Informationen einschließen. Wenn ein Kunde beispielsweise eine Kundennummer bereitstellte, die zur Gewährung eines Kredites führen würde, könnte die Nummer zu Prüfungszwecken mit einer Reihe gültiger Kundennummern aus der Prüfungsdatenbank 168 verglichen werden, die auch Informationen hinsichtlich des Namens des Kun den oder Adresseninformationen enthalten kann, die für zusätzliche vergleichende Prüfungen verwendet werden könnten. Bei einer solchen Anwendung könnte ebenfalls ausgiebiger Gebrauch von der Übersetzungsdatenbank 164 gemacht werden. Wenn die OMR-Einträge beispielsweise zu einer Produktnummer führ ten, könnte diese Produktnummer in einen Produktnamen oder eine Produktbeschreibung übersetzt werden, die anstelle der Produktnummer oder zusammen mit dieser einem Ausgabe-Datensatz hinzugefügt werden könnte.
Claims (17)
1. Verfahren zur Gewinnung von Information aus einem
Dokument, das erste Kennzeichnungen, die in einem ersten
Abtastmodus unter Verwendung von Licht eines ersten
Spektralbereichs aber nicht in einem zweiten Abtastmodus unter
Verwendung von Licht außerhalb des ersten Spektralbereichs
erkennbar sind, und zweite Kennzeichnungen, die entweder in dem
ersten oder in dem zweiten Abtastmodus erkennbar sind und eine
Information darstellen, die in einer oder mehreren mittels
automatischer Symbolerkennungseinrichtungen dekodierbaren
Formen kodiert ist, trägt, mit folgenden Schritten:
(a) Festlegen eines oder mehrerer in Betracht kommender
Bereiche auf dem Dokument, in denen die zweiten
Kennzeichnungen auftreten können, wobei die Festlegung eine Information
über die Kodierform der zweiten Kennzeichnungen beinhaltet,
(b) Abtasten des Dokuments in dem zweiten Modus unter
Verwendung eines Scanners, der ein Pixel-Bild der erkannten
Kennzeichnungen erzeugt,
(c) Speichern der in Schritt (b) erhaltenen Pixel-Daten
in einer Speichereinrichtung,
(d) Auswählen eines in Betracht kommenden Bereichs aus
den für das Dokument festgelegten Bereichen und Verarbeiten
des Pixel-Bilds des in Betracht kommenden Bereichs mittels
einer automatischen Symbolerkennungseinrichtung, die für die
für die zweiten Kennzeichnungen in dem ausgewählten in
Betracht kommenden Bereich festgelegte Kodierform geeignet ist,
und
(e) Erzeugen einer oder mehrerer Ausgabe-Datensätze mit
Symbolinformation, die die durch die Verarbeitung in Schritt
(d) erzeugten zweiten Kennzeichnungen darstellt.
2. Verfahren nach Anspruch 1, wobei der Auswahl- und
Verarbeitungsschritt für das Pixel-Bild eines in Betracht
kommenden Bereichs einen Schritt zur Bestimmung, ob der in Betracht
kommende Bereich irgendeine der zweiten Kennzeichnungen
enthält
und zur Verarbeitung des Pixel-Bilds des in Betracht
kommenden Bereichs lediglich dann, wenn dieser die zweiten
Kennzeichnungen enthält, aufweist.
3. Verfahren nach Anspruch 2 mit einem Schritt zur
Übertragung eines Pixel-Bilds jedes in Betracht kommenden Bereichs,
der zweite Kennzeichnungen enthält, an eine Sichtanzeige zum
redaktionellen Eingreifen.
4. Verfahren nach Anspruch 1, wobei der Schritt zur Auswahl
und zur Verarbeitung eines in Betracht kommenden Bereichs
eine Verarbeitung mittels eines Strichcodelesers, eines
optischen Markierungslesers, eines Schriftzeichen-OCR-Lesers,
eines Lesers für handschriftliche numerische Daten oder eines
Lesers für handschriftliche alphanumerische Daten als
automatische Symbolerkennungseinrichtung beinhaltet.
5. Verfahren nach Anspruch 1 mit folgenden weiteren
Schritten:
(f) Abtasten einer Ausfertigung des Dokuments, die
lediglich die ersten Kennzeichnungen aufweist, unter Verwendung
eines Scanners, der ein Pixel-Bild der erkannten ersten
Kennzeichnungen erzeugt, in dem ersten Modus, und
(g) Speichern der in Schritt (f) erhaltenen Pixel-Daten
in einer Speichereinrichtung.
6. Verfahren nach Anspruch 5 mit einem Schritt zur
Übertragung eines Pixel-Bilds mindestens eines in Betracht kommenden
Bereichs mit den zweiten Kennzeichnungen an eine Sichtanzeige
zum redaktionellen Eingriff.
7. Verfahren nach Anspruch 6, wobei für den an die
Sichtanzeige zu übertragenden mindestens einen in Betracht kommenden
Bereich Pixel für Pixel eine Zusammenführung der Pixel-Bilder
der Schritte (b) und (f) durchgeführt wird, um ein einziges
zusammengeführtes Pixel-Bild mit sowohl den ersten als auch
den zweiten Kennzeichnungen innerhalb des genannten
mindestens einen in Betracht kommenden Bereichs zu erzeugen.
8. Verfahren nach Anspruch 7 mit folgenden weiteren
Schritten:
(h) Bestimmen, ob die automatische
Symbolerkennungseinrichtung, die jeden in Betracht kommenden Bereich
verarbeitet, erfolgreich eine die zweiten Kennzeichnungen
darstellende Symbolinformation erzeugt hat, und
(i) Übertragen eines einzigen zusammengeführten Pixel-
Bilds für jeden in Betracht kommenden Bereich, für den die
automatische Symbolerkennungsvorrichtung nicht in der Lage
war, eine die zweiten Kennzeichnungen darstellende
Symbolinformation zu erzeugen, an die Sichtanzeige.
9. Verfahren nach Anspruch 7 mit folgenden Schritten:
Komprimieren des in Schritt (b) erzeugten Pixel-Bilds
vor der Durchführung von Schritt (c), um den Umfang an Pixel-
Daten zur Darstellung von Bereichen des Dokuments, die keine
in dem zweiten Modus erkennbaren Kennzeichnungen tragen, zu
verringern, und
Entkomprimieren der in Schritt (c) gespeicherten Pixel-
Daten vor der Durchführung der Zusammenführung Pixel für
Pixel, um das Pixel-Bild von Schritt (b) zu erhalten.
10. Vorrichtung zur Gewinnung von Information aus einem
Dokument, das erste Kennzeichnungen, die in einem ersten
Abtastmodus unter Verwendung von Licht in einem ersten
Spektralbereich erkennbar, in einem zweiten Abtastmodus unter
Verwendung von Licht außerhalb des ersten Spektralbereichs
jedoch nicht erkennbar sind, und zweite Kennzeichnungen, die
entweder in dem ersten Abtastmodus oder dem zweiten
Abtastmodus erkennbar sind und in einer oder mehreren mittels
automatischer Symbolerkennungseinrichtungen dekodierbaren Formen
kodierte Information darstellen, trägt, wobei die Vorrichtung
aufweist:
(a) eine Einrichtung zur Festlegung eines oder mehrerer
in Betracht kommender Bereiche auf dem Dokument, in denen die
zweiten Kennzeichnungen auftreten können, wobei die
Festlegung eine Information über die Kodierform der zweiten
Kennzeichnungen beinhaltet
(b) eine Einrichtung zur Abtastung des Dokuments in dem
zweiten Modus unter Verwendung eines Scanners, der ein erstes
Pixel-Bild der erkannten Kennzeichnungen erzeugt,
(c) eine Einrichtung zur Speicherung der Pixel-Daten des
ersten Pixel-Bilds in einer Speichereinrichtung,
(d) eine Einrichtung zur Auswahl eines in Betracht
kommenden Bereichs aus den für das Dokument festgelegten
Bereichen und zur Verarbeitung des ersten Pixel-Bilds des in
Betracht kommenden Bereichs mit einer automatischen
Symbolerkennungseinrichtung, die für die Kodierform geeignet ist, die
für die zweiten Kennzeichnungen in dem ausgewählten in
Betracht kommenden Bereich festgelegt ist und
(e) eine Einrichtung zur Erzeugung einer oder mehrerer
Ausgabe-Datensätze mit Symbolinformation, die die in der
unter (d) genannten Verarbeitungseinrichtung erzeugten zweiten
Kennzeichnungen darstellt.
11. Vorrichtung nach Anspruch 10 mit einer Einrichtung zur
Komprimierung des ersten Pixel-Bilds, um den Umfang von
Pixel-Daten zur Darstellung von Bereichen des Dokuments, die
keine in dem zweiten Modus erkennbaren Kennzeichnungen
tragen, zu verringern.
12. Vorrichtung nach Anspruch 10, wobei die Einrichtung zur
Auswahl und zur Verarbeitung des Pixel-Bilds eines in
Betracht kommenden Bereichs eine Einrichtung zur Bestimmung, ob
der in Betracht kommende Bereich irgendeine der zweiten
Kennzeichnungen enthält, und eine Einrichtung zur Verarbeitung
des Pixel-Bilds des in Betracht kommenden Bereichs lediglich
dann, wenn es zweite Kennzeichnungen enthält, aufweist.
13. Vorrichtung nach Anspruch 12 mit einer Einrichtung zur
Übermittlung eines Pixel-Bilds jedes in Betracht kommenden
Bereichs, der zweite Kennzeichnungen beinhaltet, an eine
Sichtanzeige zum redaktionellen Eingriff.
14. Vorrichtung nach Anspruch 10, wobei die Einrichtung zur
Auswahl und zur Verarbeitung eines in Betracht kommenden
Bereichs eine Einrichtung zur Verarbeitung mittels eines
Strichcodelesers, eines optischen Markierungslesers, eines
Schriftzeichen-OCR-Lesers, eines Lesers handschriftlicher
numerischer Daten oder eines Lesers handschriftlicher
alphanumerischer Daten als automatische Symbolerkennungseinrichtung
beinhaltet.
15. Vorrichtung nach Anspruch 10, aufweisend:
eine Einrichtung, um in dem ersten Modus unter
Verwendung eines Scanners, der ein zweites Pixel-Bild der erkannten
ersten Kennzeichnungen erzeugt, eine Kopie des Dokuments, die
lediglich die ersten Kennzeichnungen enthält, abzutasten, und
eine Einrichtung zur Speicherung der Pixel-Daten des
zweiten Pixel-Bilds in einer Computerspeichereinrichtung.
16. Vorrichtung nach Anspruch 11 und 15, mit einer
Einrichtung zur Dekomprimierung der gespeicherten Pixel-Daten, um
das erste Pixel-Bild zu erhalten, und einer Einrichtung zur
Zusammenführung des ersten und des zweiten Pixel-Bilds Pixel
für Pixel, um ein einziges zusammengeführtes Pixel-Bild mit
sowohl den ersten als auch den zweiten Kennzeichnungen
innerhalb mindestens eines in Betracht kommenden Bereichs zu
erzeugen.
17. Verfahren nach Anspruch 1, wobei die ersten
Kennzeichnungen vorgedruckte Hintergrund-Kennzeichnungen und die
zweiten Kennzeichnungen aufgrund der ersten, vorgedruckten
Kennzeichnungen vorgesehene variable Kennzeichnungen darstellen
und wobei der Schritt zum Abtasten des Dokuments in dem
zweiten
Modus durch ein Abtasten des Dokuments unter Bildung
eines Pixel-Bilds sowohl der vorgedruckten als auch der
variablen Kennzeichnungen ersetzt ist und der Schritt zur
Verarbeitung des Pixel-Bilds eines in Betracht kommenden Bereichs
eine Hintergrund-Schablone zur Trennung des Pixel-Bilds der
variablen Kennzeichnungen von den Hintergrund-Kennzeichnungen
verwendet.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/537,293 US5134669A (en) | 1990-06-13 | 1990-06-13 | Image processing system for documentary data |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69118970D1 DE69118970D1 (de) | 1996-05-30 |
DE69118970T2 true DE69118970T2 (de) | 1996-11-28 |
Family
ID=24142046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69118970T Expired - Fee Related DE69118970T2 (de) | 1990-06-13 | 1991-06-12 | Bildverarbeitungssystem für dokumentarische Daten |
Country Status (6)
Country | Link |
---|---|
US (1) | US5134669A (de) |
EP (1) | EP0463471B1 (de) |
JP (1) | JP3291302B2 (de) |
KR (1) | KR920001359A (de) |
CA (1) | CA2044400C (de) |
DE (1) | DE69118970T2 (de) |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0381817A (ja) * | 1989-08-25 | 1991-04-08 | Hitachi Ltd | 手書入力情報処理装置およびこの手書入力情報処理装置を用いた手書入力情報システム |
JP3001065B2 (ja) * | 1991-03-19 | 2000-01-17 | テイ・エイ・エス通商株式会社 | プログラムの作成方法 |
US5991440A (en) * | 1991-06-21 | 1999-11-23 | Canon Kabushiki Kaisha | Method and apparatus for recognizing input handwritten characters associated with title information |
US5452379A (en) * | 1991-09-13 | 1995-09-19 | Meadowbrook Industries, Ltd. | Image capture and storage techniques in association with optical mark reading |
US5229589A (en) * | 1991-11-21 | 1993-07-20 | Optimum Solutions Corp., Inc. | Questionnaire scanning system employing expandable answer mark areas for efficient scanning and mark detection |
US5428210A (en) * | 1992-01-10 | 1995-06-27 | National Bancard Corporation | Data card terminal with embossed character reader and signature capture |
US5774882A (en) * | 1992-03-12 | 1998-06-30 | Keen; Regina D. | Credit approval system |
US5465167A (en) * | 1992-03-20 | 1995-11-07 | Xerox Corporation | Using an image from a form in automatic creation of a form or sheet |
US5282052A (en) * | 1992-03-20 | 1994-01-25 | Xerox Corporation | Techniques for automatic form creation by combining partial operations |
US5418865A (en) * | 1992-03-20 | 1995-05-23 | Xerox Corporation | Mark sensing on a form |
US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
US5987149A (en) * | 1992-07-08 | 1999-11-16 | Uniscore Incorporated | Method for scoring and control of scoring open-ended assessments using scorers in diverse locations |
US5672060A (en) * | 1992-07-08 | 1997-09-30 | Meadowbrook Industries, Ltd. | Apparatus and method for scoring nonobjective assessment materials through the application and use of captured images |
US5437554A (en) | 1993-02-05 | 1995-08-01 | National Computer Systems, Inc. | System for providing performance feedback to test resolvers |
US5321611A (en) * | 1993-02-05 | 1994-06-14 | National Computer Systems, Inc. | Multiple test scoring system |
US5433615A (en) * | 1993-02-05 | 1995-07-18 | National Computer Systems, Inc. | Categorized test item reporting system |
WO1994027251A1 (en) * | 1993-05-18 | 1994-11-24 | Massachusetts Institute Of Technology | Automated reading system and method |
JP2641391B2 (ja) * | 1993-08-02 | 1997-08-13 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 文字認識方法 |
US5659639A (en) * | 1993-11-24 | 1997-08-19 | Xerox Corporation | Analyzing an image showing editing marks to obtain category of editing operation |
DE69432114T2 (de) * | 1993-11-24 | 2003-10-30 | Canon Kk | System zum Identifizieren und Verarbeiten von Formularen |
CA2134255C (en) * | 1993-12-09 | 1999-07-13 | Hans Peter Graf | Dropped-form document image compression |
US5504319A (en) * | 1994-02-09 | 1996-04-02 | Symbol Technologies, Inc. | Method and system for bar code acquisition |
US5666490A (en) * | 1994-05-16 | 1997-09-09 | Gillings; Dennis | Computer network system and method for managing documents |
JPH087033A (ja) * | 1994-06-16 | 1996-01-12 | Canon Inc | 情報処理方法及び装置 |
US6072871A (en) * | 1994-10-05 | 2000-06-06 | Leon H. Charney | Method and system for identifying the source of documents generated by software and documents generated thereby |
US5568550A (en) * | 1994-10-05 | 1996-10-22 | Shmuel Ur | Method and system for identifying documents generated by an unauthorized software copy |
US5729665A (en) | 1995-01-18 | 1998-03-17 | Varis Corporation | Method of utilizing variable data fields with a page description language |
US6243172B1 (en) * | 1995-01-18 | 2001-06-05 | Varis Corporation | Method and system for merging variable text and images into bitmaps defined by a page description language |
US5610995A (en) * | 1995-06-06 | 1997-03-11 | United Parcel Service Of America, Inc. | Method and apparatus for compressing images containing optical symbols |
US6952801B2 (en) | 1995-06-07 | 2005-10-04 | R.R. Donnelley | Book assembly process and apparatus for variable imaging system |
US5673334A (en) * | 1995-11-30 | 1997-09-30 | Cognex Corporation | Method and apparatus for inspection of characteristics on non-rigid packages |
US5936225A (en) * | 1996-04-02 | 1999-08-10 | Strategic Quantitative Solutions, Inc. | Method and apparatus for tabulating data from a plurality of response forms |
FR2756952B1 (fr) * | 1996-12-06 | 1999-06-25 | Itesoft | Systeme de reconnaissance de caracteres manuscrits |
US6487568B1 (en) | 1997-07-18 | 2002-11-26 | Tesseron, Ltd. | Method and system for flowing data to an arbitrary path defined by a page description language |
US7302438B1 (en) | 1997-07-18 | 2007-11-27 | Tesseron Ltd. | Method and system for flowing data to an arbitrary path defined by a page description language |
US6209010B1 (en) | 1997-07-18 | 2001-03-27 | Varis Corporation | Computer implemented method for wrapping data to an arbitrary path defined by a page description language |
US6311040B1 (en) * | 1997-07-31 | 2001-10-30 | The Psychological Corporation | System and method for scoring test answer sheets having open-ended questions |
US6173154B1 (en) | 1997-07-31 | 2001-01-09 | The Psychological Corporation | System and method for imaging test answer sheets having open-ended questions |
US6561428B2 (en) | 1997-10-17 | 2003-05-13 | Hand Held Products, Inc. | Imaging device having indicia-controlled image parsing mode |
JP3722966B2 (ja) * | 1997-11-13 | 2005-11-30 | 株式会社リコー | 縮小画像作成装置 |
US6269341B1 (en) | 1998-07-01 | 2001-07-31 | Day-Timers, Inc. | Method and system for printing individualized calendars |
US6325420B1 (en) | 1998-08-17 | 2001-12-04 | Inspectron Corporation | Method for embedding non-intrusive encoded data in printed matter and system for reading same |
US6178308B1 (en) * | 1998-10-16 | 2001-01-23 | Xerox Corporation | Paper based intermedium for providing interactive educational services |
US7315979B1 (en) | 1998-11-09 | 2008-01-01 | Tesseron Ltd. | Method and system for dynamic flowing data to an arbitrary path defined by a page description language |
US7068832B1 (en) | 1999-05-11 | 2006-06-27 | The Chase Manhattan Bank | Lockbox imaging system |
US6248996B1 (en) * | 1999-07-12 | 2001-06-19 | Hewlett-Packard Company | Single-scan transmission of documents to multiple heterogeneous receivers |
US7278094B1 (en) | 2000-05-03 | 2007-10-02 | R. R. Donnelley & Sons Co. | Variable text processing for an electronic press |
FR2801997A1 (fr) * | 1999-12-02 | 2001-06-08 | Itesoft | Technologie adaptative d'analyse automatique de document |
AU2001264956A1 (en) * | 2000-08-11 | 2002-02-25 | Ctb/Mcgraw-Hill Llc | Enhanced data capture from imaged documents |
US20020044687A1 (en) * | 2000-10-16 | 2002-04-18 | Emailcard Feedback Systems, Inc. | Customer feedback system |
US6961482B2 (en) * | 2001-03-05 | 2005-11-01 | Ncs Pearson, Inc. | System for archiving electronic images of test question responses |
US6751351B2 (en) | 2001-03-05 | 2004-06-15 | Nsc Pearson, Inc. | Test question response verification system |
US6810232B2 (en) | 2001-03-05 | 2004-10-26 | Ncs Pearson, Inc. | Test processing workflow tracking system |
US6675133B2 (en) | 2001-03-05 | 2004-01-06 | Ncs Pearsons, Inc. | Pre-data-collection applications test processing system |
US6898317B2 (en) * | 2001-05-07 | 2005-05-24 | Hewlett-Packard Development Company, L.P. | Method and system for fit-to-form scanning with a scanning device |
US7111787B2 (en) | 2001-05-15 | 2006-09-26 | Hand Held Products, Inc. | Multimode image capturing and decoding optical reader |
US6942151B2 (en) | 2001-05-15 | 2005-09-13 | Welch Allyn Data Collection, Inc. | Optical reader having decoding and image capturing functionality |
US6834807B2 (en) | 2001-07-13 | 2004-12-28 | Hand Held Products, Inc. | Optical reader having a color imager |
US20040083229A1 (en) * | 2001-09-04 | 2004-04-29 | Porter Robert Austin | Apparatus and method for automatically grading and inputting grades to electronic gradebooks |
US7635087B1 (en) | 2001-10-01 | 2009-12-22 | Avante International Technology, Inc. | Method for processing a machine readable ballot and ballot therefor |
US7828215B2 (en) * | 2001-10-01 | 2010-11-09 | Avante International Technology, Inc. | Reader for an optically readable ballot |
US7077313B2 (en) * | 2001-10-01 | 2006-07-18 | Avante International Technology, Inc. | Electronic voting method for optically scanned ballot |
GB2381637B (en) * | 2001-10-31 | 2005-04-27 | James Au-Yeung | Apparatus and method for determining selection data from pre-printed forms |
US7171022B2 (en) * | 2001-12-05 | 2007-01-30 | Lockheed Martin Corporation | Common method for communicating area information |
US7070115B2 (en) * | 2002-01-23 | 2006-07-04 | Debiase Salvatore E | Ballot form and method for making and using same |
US20040064472A1 (en) * | 2002-09-27 | 2004-04-01 | Oetringer Eugen H. | Method and system for information management |
US7145093B2 (en) * | 2002-12-24 | 2006-12-05 | Siemens Energy & Automation, Inc. | Method and system for image processing |
US6993818B2 (en) * | 2003-03-17 | 2006-02-07 | Memx, Inc. | Multi-fixture assembly of cutting tools |
US7637430B2 (en) | 2003-05-12 | 2009-12-29 | Hand Held Products, Inc. | Picture taking optical reader |
US7555145B2 (en) * | 2003-06-03 | 2009-06-30 | Gravic, Inc. | Multi-level optical mark reading that uses an unambiguous symbology of marks to fill into response bubbles |
US7542160B2 (en) * | 2003-08-29 | 2009-06-02 | Hewlett-Packard Development Company, L.P. | Rendering with substituted validation input |
US7298902B2 (en) * | 2004-01-20 | 2007-11-20 | Educational Testing Service | Method and system for performing image mark recognition |
US7298901B2 (en) * | 2004-04-07 | 2007-11-20 | Scantron Corporation | Scannable form and system |
US8155578B2 (en) * | 2004-05-14 | 2012-04-10 | Educational Testing Service | Method and system for generating and processing an assessment examination |
US7293712B2 (en) | 2004-10-05 | 2007-11-13 | Hand Held Products, Inc. | System and method to automatically discriminate between a signature and a dataform |
US9208480B2 (en) | 2004-11-05 | 2015-12-08 | Rdm Corporation | Mobile deposit system for digital image and transaction management |
US7606421B2 (en) * | 2004-12-08 | 2009-10-20 | Ctb/Mcgraw-Hill Llc | Data extraction from temporal image data |
US7791756B2 (en) * | 2005-05-03 | 2010-09-07 | Lexmark International, Inc. | Methods for identifying marks using a digital master document and scanned image enhancement |
US20060252023A1 (en) * | 2005-05-03 | 2006-11-09 | Lexmark International, Inc. | Methods for automatically identifying user selected answers on a test sheet |
CA2587874A1 (en) * | 2006-05-05 | 2007-11-05 | Rdm Corporation | Method and system for thin client based image and transaction management |
US7711191B2 (en) * | 2006-12-21 | 2010-05-04 | Michael John Kosek | Electronic transaction processing server with automated transaction evaluation |
US20080227075A1 (en) | 2007-03-15 | 2008-09-18 | Ctb/Mcgraw-Hill, Llc | Method and system for redundant data capture from scanned documents |
US20090015875A1 (en) * | 2007-06-20 | 2009-01-15 | Ctb/Mcgraw-Hill Companies, Inc. | Image manipulation of digitized images of documents |
US8144988B2 (en) * | 2007-09-06 | 2012-03-27 | Ricoh Company, Ltd. | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program |
US8194982B2 (en) * | 2007-09-18 | 2012-06-05 | Ricoh Company, Ltd. | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program |
US11157977B1 (en) | 2007-10-26 | 2021-10-26 | Zazzle Inc. | Sales system using apparel modeling system and method |
US8526766B2 (en) | 2007-10-31 | 2013-09-03 | Ctb/Mcgraw-Hill Llc | Use of composite bitmapped images in conjunction with display of captured data |
US8066184B2 (en) * | 2008-04-30 | 2011-11-29 | Avante International Technology, Inc. | Optically readable marking sheet and reading apparatus and method therefor |
US10719862B2 (en) | 2008-07-29 | 2020-07-21 | Zazzle Inc. | System and method for intake of manufacturing patterns and applying them to the automated production of interactive, customizable product |
US20100047757A1 (en) * | 2008-08-22 | 2010-02-25 | Mccurry Douglas | System and method for using interim-assessment data for instructional decision-making |
US9087355B2 (en) * | 2008-08-22 | 2015-07-21 | Zazzle Inc. | Product customization system and method |
US8261985B2 (en) * | 2009-04-07 | 2012-09-11 | Avante Corporation Limited | Manual recount process using digitally imaged ballots |
JP5712487B2 (ja) * | 2009-09-04 | 2015-05-07 | 株式会社リコー | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
US8261986B2 (en) * | 2009-10-21 | 2012-09-11 | Kevin Kwong-Tai Chung | System and method for decoding an optically readable markable sheet and markable sheet therefor |
US8503785B2 (en) * | 2010-01-15 | 2013-08-06 | Gravic, Inc. | Dynamic response bubble attribute compensation |
US9292565B2 (en) | 2010-06-30 | 2016-03-22 | International Business Machines Corporation | Template-based recognition of food product information |
US8396765B2 (en) * | 2010-10-15 | 2013-03-12 | Thomas E. Santarlas | System and method for the automated distribution, management and service of court-related documents |
US8412004B2 (en) | 2010-10-15 | 2013-04-02 | Gravic, Inc. | Dynamic response form symbology processing |
US8657200B2 (en) | 2011-06-20 | 2014-02-25 | Metrologic Instruments, Inc. | Indicia reading terminal with color frame processing |
US10969743B2 (en) | 2011-12-29 | 2021-04-06 | Zazzle Inc. | System and method for the efficient recording of large aperture wave fronts of visible and near visible light |
EP2797032A3 (de) * | 2013-04-22 | 2017-04-12 | ESSILOR INTERNATIONAL (Compagnie Générale d'Optique) | Verfahren und System mit zwei parallelen optischen Zeichenerkennungsprozessen |
US9239693B2 (en) | 2014-05-15 | 2016-01-19 | Xerox Corporation | Automatically printing only pages containing blank signature lines |
US10176411B2 (en) * | 2016-05-26 | 2019-01-08 | Scantron Corporation | Single-pass imaging and optical mark recognition scanning |
US10783323B1 (en) * | 2019-03-14 | 2020-09-22 | Michael Garnet Hawkes | Analysis system |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3284929A (en) * | 1964-05-19 | 1966-11-15 | Automata Corp | Test grading machine |
US3444517A (en) * | 1965-03-09 | 1969-05-13 | Control Data Corp | Optical reading machine and specially prepared documents therefor |
USRE29104E (en) * | 1971-08-18 | 1977-01-04 | Cognitronics Corporation | Method of scanning documents to read characters thereon without interference from visible marks on the document which are not to be read by the scanner |
US4021777A (en) * | 1975-03-06 | 1977-05-03 | Cognitronics Corporation | Character reading techniques |
US4205780A (en) * | 1977-03-21 | 1980-06-03 | Teknekron, Inc. | Document processing system and method |
EP0013276B1 (de) * | 1979-01-02 | 1983-05-11 | Westinghouse Electric Corporation | Optisches Markierungs-Lesesystem |
JPS57150062A (en) * | 1981-03-12 | 1982-09-16 | Fuji Xerox Co Ltd | Processing of papers |
US4408344A (en) * | 1981-04-09 | 1983-10-04 | Recognition Equipment Incorporated | OCR and Bar code reader using multi port matrix array |
JPS59128666A (ja) * | 1983-01-14 | 1984-07-24 | Fuji Xerox Co Ltd | 伝票,書類等の発行装置 |
JPS59205678A (ja) * | 1983-05-09 | 1984-11-21 | Sharp Corp | 用紙情報入力装置 |
CH661365A5 (de) * | 1983-11-03 | 1987-07-15 | Landis & Gyr Ag | Anordnung zur darstellung und abtastung des inhalts von zahlenrollen-zaehlwerken. |
US4654877A (en) * | 1984-08-28 | 1987-03-31 | Elscint Ltd. | Data compression system |
US4972273A (en) * | 1984-10-15 | 1990-11-20 | Burkhardt Norman S | High speed, high resolution image processing system |
US4627819A (en) * | 1985-01-23 | 1986-12-09 | Price/Stern/Sloan Publishers, Inc. | Teaching or amusement apparatus |
JPH0797391B2 (ja) * | 1986-09-06 | 1995-10-18 | シャープ株式会社 | 金銭出納機 |
US4760246A (en) * | 1987-04-20 | 1988-07-26 | Cognitronics Corporation | Mark-reading apparatus for use with answer sheets |
US4877948A (en) * | 1987-06-25 | 1989-10-31 | Krueger Loren L | Combination bar code and mark-sense reader |
JPS6458161A (en) * | 1987-08-28 | 1989-03-06 | Toshiba Corp | Facsimile equipment |
US4855580A (en) * | 1987-11-20 | 1989-08-08 | Recognition Equipment Incorporated | Data merge document processing method |
US5001330A (en) * | 1988-03-02 | 1991-03-19 | National Computer Systems, Inc. | Optically scanned document with fail-safe marking |
US4873426A (en) * | 1988-08-03 | 1989-10-10 | Image Business Systems Corporation | Technique for reading bar codes |
US4889367A (en) * | 1988-10-07 | 1989-12-26 | Frito-Lay, Inc. | Multi-readable information system |
US5054096A (en) * | 1988-10-24 | 1991-10-01 | Empire Blue Cross/Blue Shield | Method and apparatus for converting documents into electronic data for transaction processing |
US5003613A (en) * | 1988-12-21 | 1991-03-26 | Recognition Equipment Incorporated | Document processing system and method |
US4914709A (en) * | 1989-06-02 | 1990-04-03 | Eastman Kodak Company | Method for identifying unrecognizable characters in optical character recognition machines |
US5010580A (en) * | 1989-08-25 | 1991-04-23 | Hewlett-Packard Company | Method and apparatus for extracting information from forms |
-
1990
- 1990-06-13 US US07/537,293 patent/US5134669A/en not_active Expired - Lifetime
-
1991
- 1991-06-12 DE DE69118970T patent/DE69118970T2/de not_active Expired - Fee Related
- 1991-06-12 CA CA002044400A patent/CA2044400C/en not_active Expired - Lifetime
- 1991-06-12 KR KR1019910009834A patent/KR920001359A/ko not_active Application Discontinuation
- 1991-06-12 EP EP91109600A patent/EP0463471B1/de not_active Expired - Lifetime
- 1991-06-13 JP JP19266591A patent/JP3291302B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR920001359A (ko) | 1992-01-30 |
US5134669A (en) | 1992-07-28 |
CA2044400A1 (en) | 1991-12-14 |
CA2044400C (en) | 2001-11-27 |
JP3291302B2 (ja) | 2002-06-10 |
EP0463471A3 (en) | 1993-04-21 |
EP0463471A2 (de) | 1992-01-02 |
DE69118970D1 (de) | 1996-05-30 |
JPH06149970A (ja) | 1994-05-31 |
EP0463471B1 (de) | 1996-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69118970T2 (de) | Bildverarbeitungssystem für dokumentarische Daten | |
EP0144361B1 (de) | Vorrichtung und verfahren zum handhaben und wiederauffinden von belegen und daten | |
DE68927990T2 (de) | Bildverarbeitungssystem | |
DE69123083T2 (de) | Dokumentverarbeitung | |
DE69302003T2 (de) | Dateneingabeanlage | |
EP1665132B1 (de) | Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten | |
DE3486224T2 (de) | Verfahren zum Speichern und Wiederauffinden von digitalen Informationen. | |
DE69727320T2 (de) | Aufnahmeverfahren und gerät | |
DE69830383T2 (de) | Kodierverfahren | |
DE69032120T2 (de) | Bildinformationsaufzeichnungsgerät | |
DE69029251T2 (de) | System zur Ueberprüfung von Dokumenten, zur Verwendung mit einem Lese- und Uebersetzungssystem | |
EP0424803B1 (de) | Verfahren zur mindestens teilweisen Umsetzung von Bilddaten in Text mit Vorbereitung für nachfolgende Speicherung oder Weiterverarbeitung | |
DE19530829C2 (de) | Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Information | |
DE19960555A1 (de) | Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes | |
US20080235263A1 (en) | Automating Creation of Digital Test Materials | |
DE2931257A1 (de) | Markierungs-lesevorrichtung | |
DE60123730T2 (de) | Gerät und Verfahren zur Bestimmung des Formats von Dokumenten | |
DE60005706T2 (de) | Anpassungfähige technologie zur automatischen dokumentenanalyse | |
EP0107083A2 (de) | Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät | |
DE19708280C2 (de) | Lesevorrichtung für vollständige Anschriften | |
EP1202212B1 (de) | Verfahren zur Erfassung des vollständigen Datensatzes mit Schriftzeichen versehener Formulare | |
EP0731955B1 (de) | Verfahren und vorrichtung zum automatischen erfassen und erkennen von aufgezeichneter information | |
DE60036181T2 (de) | Lesegerät und Datenverarbeitungssystem | |
DE4000671A1 (de) | Verfahren und vorrichtung zur verwendung von mikrofilm fuer die dateneingabe in einen computer | |
DE69030446T2 (de) | Abtastbares formular mit einer kontrollmarkenspalte mit kodierten datenmarken |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |