DE4202579C2 - System zur Bearbeitung von Dokumenten - Google Patents

System zur Bearbeitung von Dokumenten

Info

Publication number
DE4202579C2
DE4202579C2 DE4202579A DE4202579A DE4202579C2 DE 4202579 C2 DE4202579 C2 DE 4202579C2 DE 4202579 A DE4202579 A DE 4202579A DE 4202579 A DE4202579 A DE 4202579A DE 4202579 C2 DE4202579 C2 DE 4202579C2
Authority
DE
Germany
Prior art keywords
color
document
markings
characters
colors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE4202579A
Other languages
English (en)
Other versions
DE4202579A1 (de
Inventor
Kenneth T Lovelady
Medford D Sanner
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Recognition International Inc
Original Assignee
BANC TEC Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BANC TEC Inc filed Critical BANC TEC Inc
Publication of DE4202579A1 publication Critical patent/DE4202579A1/de
Application granted granted Critical
Publication of DE4202579C2 publication Critical patent/DE4202579C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/62Retouching, i.e. modification of isolated colours only or in isolated picture areas only

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

Die Erfindung bezieht sich auf Dokumentenverarbeitungssysteme für die Verarbeitung von Dokumenten und insbesondere auf ein elektronisches Farbfilter für ein optisches Zeichenerken­ nungssystem, bei welchem Markierungen zum Lokalisieren von Zei­ chen das Lesen der Zeichen nicht beeinträchtigen.
Viele Dokumente tragen informationelle Markierungen und vorge­ druckte Markierungen zum Lokalisieren von Zeichen, die für das Auge sichtbar sind, welche demjenigen, der das Dokument vorberei­ tet, bei der Komplettierung der in dem Dokument erforderlichen Informationen Unterstützung geben. Viele vorgedruckte Formulare nutzen diese vorgedruckten Markierungen zum Lokalisieren von Zeichen zur Beschränkung von Zeichen auf spezielle Plätze und Größen, um einen Leser der Zeichen bei der Identifizierung der Zeichen zu unterstützen, die dem Dokument hinzugefügt worden sind, doch ist nicht beabsichtigt, daß die Zeichen vom optischen Zeichenleser gelesen werden.
Verschiedene handelsüblich erhältliche optische Zeichenerken­ nungseinrichtungen funktionieren gilt beim Identifizieren von Zeichen, welche deutlich von nicht dazugehörigen Linien, Punkten, gedrucktem Material und anderen sichtbaren Dingen getrennt sind, die auf dem Dokument vorgedruckt sind und von denen nicht beab­ sichtigt ist, daß sie von der optischen Zeichenerkennungseinrich­ tung gelesen werden. Solche optischen Zeichenerkennungs- (OCR-) Einrichtungen bekommen keine großen Schwierigkeiten beim Identi­ fizieren eines einzelnen Zeichens oder einer Zeichenzeile auf einer ansonsten leeren Fläche. In ähnlicher Weise gibt es für optische Zeichenerkennungseinrichtungen wenig Schwierigkeiten beim Identifizieren aller Zeichen auf einer ganzen Seite, voraus­ gesetzt, es gibt keinerlei nicht dazugehörige Markierungen auf der Seite und die Zeichen sind ordnungsgemäß eingetragen. Bei manchen Dokumenten ist es jedoch wesentlich, daß Zeichen auf Formulare gedruckt werden, welche in einer solchen Art und Weise vorgedruckt sind, daß solche Schreibbereiche durch sichtbare Linien oder andere Markierungen getrennt sind. Solche Linien sind für das Trennen der Daten in einer ordnungsgemäßen Art und Weise notwendig. Viele staatliche Formulare, wie beispielsweise solche für die Einkommenssteuer, die Volkszählung, die Sozialversiche­ rung und andere haben Kästchen, innerhalb welche die Informatio­ nen zu drucken sind. Es ist festgestellt worden, daß ein maschi­ nelles Identifizieren von per Hand eingetragenen Zeichen unter­ stützt wird, wenn sichtbare Begrenzungsmarkierungen auf dem Dokument vorgedruckt sind, um denjenigen zu unterstützen, der das Dokument ausfüllt. Die Erwünschtheit der vorgedruckten Markierungen für das Lokalisieren von Zeichen kann gegenüber den Problemen abgewogen werden, welche bei den optischen Zeichener­ kennungseinrichtungen bei Dokumenten bestehen, die solche Mar­ kierungen enthalten. Die OCR-Einrichtungen müssen sich auf das Licht-Reflexionsvermögen vom Zeichenhintergrund und die Absorp­ tion von den Zeichen selbst verlassen, um zwischen echten Zei­ chen zu unterscheiden, welche durch die OCR-Einrichtung zu identifizieren sind und anderen sichtbaren Zeichen, die an das Zeichen angrenzen, die Zeichen berühren oder diese passieren oder die Zeichen umgeben, welche nicht zu identifizieren sind.
Dokumentenverarbeitungssysteme sind vorgeschlagen worden, die es der OCR-Einrichtung gestatten, zwischen den vorgedruckten Markie­ rungen für das Lokalisieren von Zeichen und den tatsächlich zu lesenden Zeichen zu unterscheiden. Ein solches System wird in dem US-Patent Nr. 3,444,517 beschrieben, das auf J. Rabinow am 13. Mai 1969 ausgestellt ist und den Titel trägt "Optische Lesema­ schine und speziell dafür aufbereitete Dokumente". Diese optische Lesemaschine benutzt vorgedruckte Dokumente, bei welchen die Markierungen zum Lokalisieren von Zeichen aus fluoreszierendem Material gedruckt sind. Das Dokument wird einer Erregungsbestrah­ lung während des Lesezyklus' unterworfen, dergestalt, daß die Zeichen sehr wenig von den Strahlungen reflektieren, jedoch die Markierungen in einer solchen Art und Weise erregt werden, daß sie Energie aussenden, gegenüber welcher eine Scanner-Fotozelle empfindlich ist. Obwohl diese Markierungen unter gewöhnlichem Licht sichtbar zu sein scheinen, senden diese, wenn sie angeregt sind, in Zusammenarbeit mit ihrer Strahlungsquelle Energie in einer solchen Art und Weise aus, daß die Scanner-Fotozelle solche Ausgangssignale liefert, als ob die Markierungen nicht existie­ ren würden oder die Markierungen heller als der Untergrund oder die zu lesenden Zeichen sind. Deshalb wird der gesamte Schwarz- Weiß-Bereich für die Einrichtung, welche die Zeichen untersucht, nicht beeinflußt.
Viele Dokumente sind in einer Vielzahl von Farben vorgedruckt, wobei sowohl der Untergrund, als auch die Markierungen zum Lokalisieren von Zeichen in verschiedenen Druckfarben gedruckt sein können. Um die vorgedruckten Farbzeichenmarkierungen zu beseitigen, welche farbig gedruckt sind, werden bis jetzt verschiedene optische Filter und Linsen benutzt, um zu verhüten, daß diese vorgedruckten Informationen von dem Dokument erfaßt werden, welches der optischen Zeichenerkennungseinrichtung angeboten wird, so daß die optische Zeichenerkennungseinrichtung gegenüber diesen bunten Druckfarben "blind" ist. Es werden farbempfindliche Fotozellen bei der Zeichenerkennungseinrichtung benutzt, um die vorgedruckten Zeichenlokalisierungspixel-Infor­ mationen herauszufiltern und nur die echten Zeichenpixelinforma­ tionen der optischen Zeichenerkennungseinrichtung anzubieten. Solche Systeme erfordern optische Mehrfachfilter, welche je nach dem Farbton der verwendeten Druckfarbe, die auf dem vorgedruckten Formular benutzt wird, ausgetauscht werden müssen.
Ein weiteres System, das vorgeschlagen worden ist, um eine Inter­ ferenz vorgedruckter Markierungen zum Lokalisieren von Zeichen mit den echten Zeichen, die auf einem Dokument zu lesen sind, zu verhüten, ist im US-Patent Nr. RE. 29,104 beschrieben, das auf David H. Shepard am 4. Januar 1977 ausgestellt ist und den Titel trägt "Verfahren zum Abtasten von Dokumenten, um Zeichen darauf ohne Interferenz mit sichtbaren Markierungen auf dem Dokument zu lesen, welche von dem Scanner nicht gelesen werden sollen". Dieses System nutzt eine Laser-Scannereinheit, die zum Abtasten eines Dokuments angepaßt ist. Die Farbe der Markierungen auf den Dokumenten muß zur Wellenlänge des Lasers so passen, daß das Licht, welches von den Markierungen reflektiert wird, dieselbe Intensität wie das Licht hat, das von dem Untergrund des Doku­ ments reflektiert wird. Die vorgedruckten Markierungen für das Lokalisieren von Zeichen werden "blindgemacht" und interferieren nicht mit dem Lesen der Zeichen. Da nun die Farbe der vorge­ druckten Markierungen für das Lokalisieren von Zeichen zur Wellenlänge des Lasers passend gewählt werden muß, hat ein solches System nicht die Fähigkeit, es leicht an verschiedenfar­ bige vorgedruckte Markierungen auf zahlreichen Dokumenten und auch nicht an verschiedenfarbige vorgedruckte Markierungen zum Lokalisieren von Zeichen auf demselben Dokument anzupassen, das zu verarbeiten ist und von einer optischen Zeichenerkennungsein­ richtung gelesen wird.
Dreidimensionale Farberkennungs- und Modifikationssysteme werden bis jetzt bei einer Vielzahl von Anwendungen benutzt. Diese An­ wendungen schließen ein: die Druckindustrie für die Farbkorrektur vor dem Druck; bei der maschinellen Bildaufnahmeanwendung, um zwischen Objekten zu unterscheiden; und bei der generellen Farb­ bildverarbeitung, wie beispielsweise LANDSAT oder der medizini­ schen Bildgewinnung, zur Unterscheidung bedeutsamer Merkmale. Generell benutzen diese Systeme RGB-(rot-grün-blau-) Bildscanner und -kameras und konvertieren den RGB-Raum in einen Intensi­ täts/Orthogonal-Farbtonraum (wie beispielsweise Y, I, Q oder L, a, b) und/oder einen Farbton-, Sättigungs-Intensitätsraum für den Erkennungsprozeß. Alle drei Farbräume/Maßstäbe sind dreidimensio­ nal.
Obwohl dreidimensionale Farberkennungs/Modifikations-Systeme existieren, sind diese Systeme für die Verarbeitung von Bildern für Zwecke der optischen Zeichenerkennung nicht angemessen, und deshalb funktionieren solche Systeme nicht gut für ein Farbfil­ ter. Bei einem Abtastsystem mit einer endlichen Pixelgröße und konventionellem Leistungsverhaltender Optik können bei Farbü­ bergängen abzählbare Pixel-Farbwerte geschaffen werden. Die Farbwerte entwickeln sich entlang eines Vektors zwischen den beiden Farben, wobei sie durch den Farbraum anderer gültiger reiner (nicht an der Ecke liegender) Farben hindurchgehen. Beste­ hende Farbverarbeitungsverfahren können die gültige Druckfarbe "ausblenden", lassen aber die Übergangswerte zurück, welche für das menschliche Auge nicht hinderlich sein mögen, welche aber den optischen Zeichenerkennungsprozeß von Zeichenlokalisieren und -erkennen stören. Zusätzlich sollte, wenn die "blinde" Druckfarbe ausgeblendet wird, sie auf die Farbe des regionalen Untergrundes geändert werden, welche eine feste Farbe sein kann oder auch nicht. Der Untergrund kann durch Verschmutzung, verschiedene Papier-Kennwerte und Druckfarbenänderung infolge des Druckpro­ zesses beeinflußt sein. Folglich funktionieren bestehende drei­ dimensionale Farberkennungs- und -modifikationssysteme nicht gegenüber vollkommen "blinden" unerwünschten farbigen Markierun­ gen, welche die Zeichenerkennung stören.
Es ist folglich die Notwendigkeit für ein Dokumentenverarbei­ tungssystem für das Verarbeiten von Dokumenten entstanden, welche Markierungen für die Zeichenlokalisierung haben, welche für das Auge sichtbar sind, welche aber einer optischen Zeichenerken­ nungseinrichtung gegenüber "blind" sind. Solch ein Dokumentenver­ arbeitungssystem muß in der Lage sein, Dokumente zu verarbeiten, die zahlreiche Farben haben, ohne, daß optische Filter mechanisch gewechselt werden und auch verschiedenfarbige "blinde" Druckfar­ ben auf demselben Dokument zu eliminieren. Ein solches Dokumen­ tenverarbeitungssystem erfordert weiterhin die Fähigkeit, mit speziell aufbereiteten Formularen, Dokumenten oder anderen Ober­ flächen zu arbeiten, auf welchen durch eine Zeichenerkennungsein­ richtung zu lesende Zeichen in einer solchen Art und Weise gebil­ det werden, daß die Markierungen, die keine echten Zeichen sind, unterscheidbar durch die optische Zeichenerkennurgseinrichtung gegenüber der Untergrundemission der Oberfläche gemacht werden.
Es ist weiterhin die Notwendigkeit für ein Dokumentenverarbei­ tungssystem entstanden, um die Interferenz zwischen einer Viel­ zahl von Farben, die in einem Übergangsbereich zwischen Farben erzeugt worden sind und gültigen Farben des schreibenden Instru­ ments, welches dieselben dreidimensionalen Farbkoordinaten haben können, zu minimieren. Zusätzlich ist eine Notwendigkeit für ein Dokumentenverarbeitungssystem entstanden, welches die Fähigkeit hat, Farben, die beibehalten und nicht ausgeblendet werden sol­ len, festzulegen. Weiterhin ist eine Notwendigkeit für ein Doku­ mentenverarbeitungssystem für die Wahl von Mehrfach-Blindfarben und Mehrfach-Vorratsfarben entstanden, welche individuell gewählt oder in verschiedenen Kombinationen, welche auf demselben Doku­ ment erscheinen, benutzt werden können.
Die EP 0 375 090 offenbart ein System zur Bearbeitung von Dokumenten, auf denen Daten gedruckt sind, die für das Auge sichtbare Markierungen und maschinenlesbare Zeichen umfas­ sen, wobei diese Markierungen, die lediglich als Orientie­ rungshilfe dienen sollen, vollständig ausgeblendet werden müssen, damit sie bei der eigentlichen Zeichenerkennung nicht zu Fehlern und Störungen führen. An den Farbübergängen dieser Markierung können jedoch zahlreiche verschiedene Pixel-Farbwerte entstehen liegen häufig auch in solchen Farbräumen, die gültige Farbwerte umfassen, die von dem System gelesen werden sollen. Folglich können die Ränder dieser Markierung nicht oder nur unzureichend ausgeblendet werden und bleiben folglich bei der Bildverarbeitung und der Zeichenerkennung für das System sichtbar und führen zu einer nicht tolerierbaren Fehlerquote.
Es ist daher Aufgabe der vorliegenden Erfindung, ein System zur Bearbeitung von Dokumenten vorzusehen, das in der Lage ist, Markierungen einschließlich der Farbwerten der Ränder dieser Markierungen zuverlässig auszublenden, um die obigen Nachteile zu überwinden.
Erfindungsgemäß wird diese Aufgabe durch die kennzeichnenden Merkmale von Anspruch 1 bzw. von Anspruch 2 gelöst.
In Übereinstimmung mit der vorliegenden Erfindung wird für ein Dokumentenverarbeitungssystem für das Verarbeiten von Dokumenten gesorgt, auf welche Daten gedruckt sind, Markierungen, die für das Auge sichtbar sind, welche aber nicht von dem System gelesen werden und Zeichen, welche durch das System zu lesen sind, eingeschlossen. Das System beinhaltet eine Konstruktion für das Abtasten eines Dokuments für das Erfassen des Farbbilds des Dokuments, das jeweils verarbeitet wird und wodurch eine Viel­ zahl von farbigen Bildelementen erzeugt wird. Es wird für eine Schaltung für das Identifizieren von Farben gesorgt, die inner­ halb der Kernfläche und dem Rand der Markierungen eingeschlossen sind. Die Farben der Bildelemente der Kernfläche und des Rands der Markierungen werden in die Farbe des Untergrundes des Doku­ ments konvertiert und dadurch ein gefiltertes Abbild des Doku­ ments erzeugt. Es wird für eine optische Zeichenerkennungsein­ heit für das Empfangen des gefilterten Abbilds des Dokuments gesorgt, welches nur Zeicheninformationen repräsentiert und für das Identifizieren der Zeichen, die auf dem Dokument von dem gefilterten Abbild erscheinen, dergestalt, daß die Markierungen und der Untergrund, die ein Zeichen umgeben, nicht durch die optische Zeichenerkennungseinheit unterscheidbar sind.
In Übereinstimmung mit einem weiteren Aspekt der vorliegenden Erfindung wird für ein Dokumentenverarbeitungssystem für das Verarbeiten von Dokumenten gesorgt, auf welche Daten gedruckt sind, Markierungen, die für das Auge sichtbar sind, welche aber nicht von dem System gelesen werden und Zeichen, welche durch das System zu lesen sind, eingeschlossen. Das System beinhaltet eine Konstruktion für das Abtasten eines Dokuments für das Erfassen des Farbbilds des jeweils in Verarbeitung befindlichen Dokuments und zur Erzeugung einer Vielzahl farbiger Bildelemente. Es wird für eine Schaltung für das Identifizieren der Farbe von Zeichen, die auf dem Dokument erscheinen, gesorgt. Alle Farben von Markierungen, die auf dem Dokument erscheinen, werden in die Farbe des Untergrunds des Dokuments umgewandelt, ausgenommen die Farbe der Zeichen, die auf dem Dokument erscheinen, so daß dadurch ein gefiltertes Abbild des Dokuments erzeugt wird. Es wird für eine optische Zeichenerkennungseinheit für den Empfang des gefilterten Abbilds der Daten, die nur Informationen von Zeichen, die auf dem Dokument aus dem gefilterten Abbild repräsentieren, gesorgt, derart, daß die Markierung und der Untergrund, die ein Zeichen umgeben, nicht durch die optische Zeichenerkennungseinheit unterscheidbar sind.
Zum Zweck des Verständnisses der vorliegenden Erfindung und der weiteren Vorteile derselben wird jetzt auf die folgende Beschrei­ bung der bevorzugten Ausführungsformen Bezug genommen. Die dazu­ gehörigen Zeichnungen zeigen in
Fig. 1 ein Blockschaltbild des vorliegenden Dokumentenverarbei­ tungssystems;
Fig. 2 eine Darstellung eines Dokuments, das durch das vorliegen­ de Dokumentenverarbeitungssystem verarbeitet wird;
Fig. 3 eine Darstellung der Daten aus dem Dokument, das in Fig. 2 gezeigt wird, welches der optischen Zeichenerkennungseinheit des vorliegenden Dokumentenverarbeitungssystems angeboten wird;
Fig. 4 ein detailliertes Blockschaltbild des Farbprozessorblocks von Fig. 1;
Fig. 5 ein schematisches Logikschaubild, das die Farberkennungs- und Kantenlogik- und die Blindsetz/Beibehaltungslogik-Blöcke von Fig. 4 veranschaulicht;
Fig. 6 ein detailliertes Blockschaltbild eines optischen Zeichen­ erkennungssystems, das die vorliegende Erfindung nutzt;
Fig. 7 eine sphärische dreidimensionale Farb-Grundgesamtheit, die um die Grauachse herum symmetrisch ist;
Fig. 8 eine sphärische dreidimensionale Farb-Grundgesamtheit, welche die Kern- und Randhaufengruppen im dreidimensionalen Farbraum zeigt;
Fig. 9 ein Blockschaltbild eines von Farbe auf schwarzweiß konvertierenden Systems in Übereinstimmung mit der vorliegenden Erfindung; und
Fig. 10 ein Blockschaltbild eines Form-Farb-Detektors gemäß der vorliegenden Erfindung.
Unter Verweis auf Fig. 1 wird das vorliegende Dokumentenverarbei­ tungssystem generell durch die Zahl 10 gekennzeichnet. Das Doku­ mentenverarbeitungssystem 10 wird für die Verarbeitung von Doku­ menten einer Vielzahl von Typen genutzt, bei welchen vorgedruckte Informationen und Markierungen zum Lokalisieren von Zeichen, die für das Auge sichtbar sind, erscheinen. Diese Markierungen unterstützen denjenigen, der ein Dokument aufbereitet, beim Identifizieren der Informationen und der örtlichen Anordnung von Daten und beim Plazieren und Bilden von Zeichen, die dem Doku­ ment hinzuzufügen sind. Die Markierungen können Linien, Kästen, Punkte und andere Leiteinrichtungen einschließen, von denen nicht beabsichtigt ist, daß sie durch die optische Zeichenerken­ nungseinrichtung gelesen werden, die das Dokument verarbeitet. Diese Markierungen werden typischerweise in "blinder" Druckfar­ be, reflektierenden Druckfarben oder verblassenden Farben ge­ druckt, und obwohl sie für das Auge sichtbar sind, brauchen sie für die Zeichenerkennungseinrichtung nicht unsichtbar zu sein. Diese Markierungen können in irgendeiner beliebigen Druckfarbe vorgedruckt sein, und das vorliegende System 10 kann mit Doku­ menten genutzt werden, die verschiedene Druckfarben haben, welche auf demselben Dokument erscheinen.
Bei den meisten optischen Zeichenerkennungseinrichtungen ist es erforderlich, daß Zeichen identifiziert werden, die auf eine optisch kontrastierende Oberfläche gedruckt sind. Die übliche Forderung ist, daß die Zeichen dunkel sind und der Untergrund hell ist, so daß das Verhältnis schwarzweiß so groß wie möglich ist. Unter gewöhnlicher Beleuchtung sind die Zeichen so lichtab­ sorbierend wie möglich, während der Untergrund so lichtreflektie­ rend wie möglich ist. Ein schwacher oder verblichener OCR-Druck kann ein Druck-Kontrastverhältnis, das so niedrig wie die Blind- Druckfarbe ist oder ein Reflexionsvermögen, das so hoch wie die Blind-Druckfarbe ist, haben, und deshalb kann der Schwellenwert des OCR-Drucks nicht ohne Interferenz erreicht werden, wenn die Blind-Druckfarbe nicht entfernt wird. Schwierigkeiten erfährt man auch bei diesen optischen Zeichenerkennungseinrichtungen, wie schon vorher angegeben, wegen des Erfordernisses, daß es auf derselben Oberfläche fremdartiges Druckmaterial wie die zu iden­ tifizierenden Zeichen geben kann. Bei der hierin verwendeten Form sind Markierungen für das Auge sichtbar, und diese können in der Form von Linien, Kästen, die ein Zeichen umgeben, auf dem Doku­ ment geschriebenen Instruktionen und anderen vorgedruckten oder nicht vorgedruckten Markierungen sein, welche die Funktion der optischen Zeichenerkennungseinrichtung nachteilig beeinflussen. Diese Markierungen werden in Verbindung mit Fig. 2 diskutiert.
Das vorliegende Dokumentenverarbeitungssystem 10 nutzt eine Farb- Scanner/Kamera 12 für das Erfassen des Abbilds des zu verarbei­ tenden Dokuments in Farbe. Die Farb-Scanner/Kamera 12 nutzt einen Dreifarb-Bildscanner, welcher das Dokument punktweise abtastet und Bildelement-(Pixel-)Videosignale erzeugt, welche an ein Signal-Vorbehandlungsgerät 14 angelegt werden. Die Farb- Scanner/Kamera 12 kann beispielsweise ein Modell TCD 116 Farbfeld beinhalten, welche von Toshiba Corporation Amerika hergestellt und verkauft wird, welche 400 Farbpunkte pro Zoll mit einem roten, grünen und blauen (RGB) Ausgangskanal erzeugt.
Der Ausgang aus Farb-Scanner/Kamera 12 wird verstärkt, auf GS wieder hochgefahren, und die Mehrfachgänge von Farb-Scanner/Ka­ mera 12 werden abgeglichen, um Randstellen zwischen Segmenten zu vermeiden, wobei ein Signal-Vorbehandlungsgerät 14 benutzt wird. Eine Verstärkungskorrektur wird durch das Signal-Vorbehandlungs­ gerät 14 bei jedem Pixel angebracht, um jede Zelle auf dieselbe Empfindlichkeit zu normalisieren, derart, daß die Farbkanäle R, G, B alle auf "1" normalisiert sind, wenn eine weiße geeichte Fläche gesehen wird, wodurch der Effekt einer weißen Beleuch­ tungsquelle "gleicher Energie" beibehalten wird.
Der R, G, B-Ausgang von Signal-Vorbehandlungsgerät 14 wird gleichzeitig an drei Verarbeitungskanäle des Dokumentenverarbei­ tungssystems 10 angelegt. Die drei Kanäle beinhalten einen Farb­ bildkanal 16; einen Monochrom-Bildkanal 18 und einen optischen Zeichenerkennungs-(OCR-)Kanal 20. Jeder Kanal 16, 18, 20 funk­ tioniert unabhängig von den anderen, und einer der beiden oder beide Kanäle 16 und 18 können mit dem Dokumentenverarbeitungssy­ stem 10 verwendet werden.
Der Ausgang von Signal-Vorbehandlungsgerät 14 wird an eine Farbspeichereinheit 30 innerhalb Kanal 16 des Dokumentenverarbei­ tungssystems 10 angelegt. Der Ausgang aus der Farbspeichereinheit 30 wird an einen Farbild-Bildschirm 32 angelegt, welcher bei­ spielsweise ein Bild von 1024 × 1024 Pixeln bei 24 Bits pro Pixel liefern kann. Das von dem Farbbildschirm 32 ausgegebene Bild repräsentiert das farbige Abbild des Dokumente, das von Farb- Scanner/Kamera 12 erfaßt worden ist und kann benutzt werden, um einen Betreiber des Dokumentenverarbeitungssystems 10 zu unter­ stützen, Zeichen zu identifizieren, welche von der optischen Zeichenerkennungseinheit der vorliegenden Erfindung nicht er­ kannt werden konnten.
Der Ausgang von Signal-Vorbehandlungsgerät 14 wird auch einer Farbprozessor-Bildeinheit 36 innerhalb von Kanal 18 des Dokumen­ tenverarbeitungssystems 10 zugeführt. Das Farbprozessorbild 36 funktioniert so, daß die R, G, B-Kanäle von Farb-Scanner/Kamera 12 in ein monochromes Signal umgewandelt werden, welches das Abbild des Dokuments, das durch die Farb-Scanner/Kamera 12 erfaßt worden ist, entsprechend seiner Helligkeit repräsentiert. Die Anteile jedes der Farbsignale von der Farb-Scanner/Kamera 12, welche benutzt werden, um die Helligkeitssignale zu bilden, liegen in den folgenden Proportionen: 59% des Grünsignals, 30% des Rotsignals und 11% des Blausignals. Ein System für das Bilden der Helligkeitssignale wird in einer Veröffentlichung mit dem Titel "Übungshandbuch" für das Farbfernsehen" (Color TV Training Manual) beschrieben, das von Howard W. Sams and. Co., IMC., the Boobs-Merril Co., Inc., Indianopolis, Indiana, 4th Printing, 1973, Seiten 34-37 veröffentlicht ist, wobei diese Beschreibung in dieser Patentschrift durch Verweis mit einge­ schlossen ist. Der Ausgang der Farbprozessor-Bildeinheit 36 wird an eine monochromatische Bildspeichereinheit 38 angelegt, deren Ausgang an einen monochromatischen Bildschirm 40 angelegt wird. Der Bildschirm 40 gibt für den Betreiber des Dokumentenverarbei­ tungssystems 10 das Abbild durch die Farb-Scanner/Kamera 12 als Schwarz-Weiß oder monochromatisches Graustufen-Bild aus. Das monochromatische Abbild des Dokuments, das durch den monochroma­ tischen Bildschirm 40 ausgegeben wird, kann in einer Art und Weise, die ähnlich der Ausgabe ist, die von dem Farbbildschirm 32 geliefert wird, von dem Betreiber des vorliegenden Dokumentenver­ arbeitungssystems 10 genutzt werden.
Der Ausgang von Signal-Vorbehandlungsgerät 14 wird auch dem Kanal 20 des vorliegenden Dokumentenverarbeitungssytems 10 und speziel­ ler einer Farbprozessoreinheit 44 zugeführt, welche unter Verweis auf Fig. 4 weiter diskutiert wird. Die Prozessoreinheit 44 emp­ fängt auch ein Eingangssignal, das vom System-Mikrorechner (Fig. 6) oder durch einen Bedienungsmann geliefert wird, das die Kenn­ werte der Blind-Druckfarbe und spezieller den Farbton der Blind- Druckfarbe angibt. Die Farbprozessoreinheit 44 funktioniert, um elektronisch die vorgedruckten Markierungen von den Daten zu filtern, die durch die Farb-Scanner/Kamera 12 für die Übergabe an die OCR-Einheit 48 zur Zeichenerkennung erfaßt worden sind. Der Ausgang von Farbprozessoreinheit 44 kann direkt an die OCR- Einheit 48 angelegt oder in einer Speichereinheit 46 für ein späteres Anlegen an die OCR-Einheit 48 gespeichert werden. Die Farbprozessoreinheit 44 kann beispielsweise das dreidimensi­ onale Farberkennungs- und Modifikationssystem umfassen, das in US-Patent Nr. 4.488.245 beschrieben ist, das für G. B. Dalke u. a. am 11. Dezember 1984 ausgestellt worden ist und welches den Titel trägt: "Verfahren und Mittel für die Farberkennung und -modifika­ tion". Die Spezifikation und die Zeichnungen des Patentes '245 werden hierin durch Verweis mit aufgenommen.
Die Farbprozessoreinheit 44 funktioniert als elektronisches Fil­ ter, um einen Prozentsatz der Komplementärfarbe der Markierungen von dem Farbkanal (RGB) zu subtrahieren, der am besten zu dem Farbton der Markierungen paßt. Das Ergebnis ist, daß die Hinter­ grundintensität als dieselbe Intensität wie die Markierungen "gesehen" wird, derart, daß die Markierungen blind für die opti­ sche Zeichenerkennungseinheit 48 werden. Bei dieser Ausführungs­ form kann die Farbprozessoreinheit 44 beispielsweise eine Ver­ weistabelle für das Erzeugen des Komplementär-Farbtons auf der Grundlage einer Eingabe der Kennwerte der Blind-Druckfarbe bein­ halten. Der Farbton der Blind-Druckfarbe kann durch ein Arbeiten der Systemsoftware in Abhängigkeit von dem speziellen Formular oder Dokument, das jeweils verarbeitet wird, durch einen Eingabe­ schalter durch das Bedienungspersonal oder eine Bediener-Menüwahl oder so erfolgen, wie es in dem Patent '245 beschrieben ist.
Die Farbprozessoreinheit 44 kann auch so funktionieren, daß ein Prozentsatz der Komplementärfarbe von dem Blind-Druckfarbenkanal oder der entsprechenden Ebene abgezogen wird. Der abzuziehende Betrag ist die Differenz zwischen: 1) dem Blind-Druckfarbenwert in dem Blind-Druckfarbenkanal, der das Abbild der vorgedruckten Markierungen umfaßt und 2) der weißen oder Untergrundfarbe in dem Blind-Druckfarbenkanal, der die Fläche repräsentiert, die ein zu erkennendes Zeichen umgibt. Da es nun keine Blind-Druckfarben­ energie in der Komplementärfarbe gibt, wird nichts von dem Blind-Druckfarbenkanal subtrahiert, während Blind-Druckfarbenpi­ xel verarbeitet werden. Wenn die Reflexion jedoch von dem Unter­ grund um ein Zeichen herum ist, dann ist ein Komplementausgang maximal, und die Subtraktion reduziert den Wert der Pixel des weißen Untergrunds bis hinunter auf den Wert der Reflexion oder Energie der Blind-Druckfarbe, was zu einem Kontrast Null führt. Wenn ein Pixel schwarz ist oder eine Farbe, die nicht Blind- Druckfarbe, hat, also ein zu erkennendes Zeichen repräsentiert, dann wird der je nach der Intensität und dem Ton der Farbe geringfügig erhöht. Der Farbprozessor 44 führt die folgenden arithmetischen Operationen für die Farben rot, grün, blau und Blinddruckfarbe aus, die benutzt werden, um die vorgedruckten Markierungen zum Lokalisieren von Zeichen zu drucken:
worin bedeuten: R das ausgeblendete Ergebnis (Ausgang aus Farbprozessoreinheit 44)
BIH der Farbton der Blind-Druckfarbe
CH das Komplement des Farbtons der Blind- Druckfarbe
% ist 1 - Reflexionswert der Blind-Druckfarbe in dem Farbtonkanal; und
ist der Maßstabsänderungsfaktor.
Die resultierende Pixelamplitude oder -helligkeit wird unter Verwendung des Faktors auf 100% im Maßstab
zurückgeändert.
Das Komplement der Blind-Druckfarbe für grün ist Magenta (Fuchsin), welches rot plus blau dividiert durch 2 ist; für rot ist es Zyan, welches blau plus grün dividiert durch 2 ist; und für blau ist es gelb, welches rot plus grün dividiert durch 2 ist. Die vorgedruckten Markierungen könnten Magenta, Zyan oder gelb sein, in welchem Fall die Komplementwerte rot, blau bezie­ hungsweise grün sind, Im allgemeinen ist die beste zu verwenden­ de Komplementärfarbe die des Kanals oder der Kombination von Kanälen, welche die geringste Menge an Blind-Druckfarbenenergie haben.
Der Ausgang von Farbprozessoreinheit 44 wird an eine optische Zeichenerkennungseinheit 48 angelegt. Dieser Ausgang repräsen­ tiert nur Pixel, die den Dateninhalt von zu erkennenden Zeichen und den Untergrund, der solche Zeichen umgibt, repräsentieren, wobei die Markierungen durch die Funktion einer Farbprozessorein­ heit 44 beseitigt worden sind. Die OCR-Einheit 48 kann zum Bei­ spiel ein System umfassen, das im US-Patent Nr. 3,761,876, be­ schrieben ist, welches an L. Flaherty u. a. am 25. September 1973 erteilt wurde und den Titel trägt "Erkennungseinheit für ein optisches Zeichenlesesystem", dessen Beschreibung und Zeichnungen hierin mittels Verweis mit eingeschlossen sind.
Indem wir jetzt gleichzeitig auf Fig. 1 und 2 verweisen, so wird ein Dokument 52 (Fig. 2) veranschaulicht, welches für Dokumente repräsentativ ist, die durch das vorliegende Dokumentenverarbei­ tungssystem 10 verarbeitet werden. Dokument 52 beinhaltet vorge­ druckte Markierungen zum Lokalisieren von Zeichen und auch ge­ schriebene Instruktionen, welche die Funktion der OCR-Einheit 48 während der Zeichenerkennung stören. Dokument 52 beinhaltet vorgedruckte Markierungen zum Lokalisieren von Zeichen in der Form von Kästen 54, welche durch die Person verwendet werden, die das Dokument 52 ausfüllt, um die Zeichen zu lokalisieren und zu bilden, die den Namen "SMITH MARY" ausmachen. Ebenfalls auf dem Dokument 52 angegeben ist eine vorgeschriebene Fläche für die Anschrift für die Person, die das Dokument ausfüllt, die ein Feld 56 für die Straße, Feld 58 für die Stadt und Feld 60 für den Gliedstaat umfaßt. Die vorgedruckten Markierungen schließen die Wörter "Street" (Straße), "City" (Stadt) und "State" (Gliedstaat)zusätzlich zu den gestrichelten Linien ein, die die Felder 56, 58 und 60 trennen. Weiterhin ist auf dem Dokument 52 ein Bereich für das Ausfüllen des Datums vorhanden, welches die Felder 62, 64 und 66 einschließt, die den Tag, den Monat und das Jahr repräsentieren. Instruktionelle Informationen werden innerhalb jedes Feldes gedruckt, welche "DAY" (Tag), "MO." (Monat), "YR" (Jahr) repräsentieren. Schließlich erfordert ein Teil von Dokument 52 die Eintragung der Postleitzahl der Person und beinhaltet Kästchen 68 für das Lokalisieren der Ziffern der Postleitzahl.
Fig. 3 veranschaulicht die Daten von Dokument 52 nachdem das Dokument durch die Farbprozessoreinheit 44 verarbeitet worden ist. Die Markierungen sind "eliminiert" worden und werden nicht der OCR-Einheit 48 angeboten. Alle Linien, die Kästchen umge­ benden Zeichen und geschriebenen Instruktionen auf Dokument 52, welche die Funktion der OCR-Einheit 48 nachteilig beeinflussen, sind elektronisch farbgefiltert worden und werden der OCR-Einheit 48 nicht angeboten. Die Bildschirme 32 und 40 des Dokumentenver­ arbeitungssystems 10 zeigen dem Bediener von System 10 das Abbild von Dokument 52 in Farbe beziehungsweise monochromatisch, wie in Fig. 2 dargestellt.
Die in einem Dokument auftretenden Markierungen beinhalten einen "Kern"-Bereich oder das Innere der Markierung. Die Farbe des Kernbereichs ist die Grundfarbe der Blind-Druckfarbe. Die Begrenzung, die den Kernbereich der Markierung umgibt, ist der "Rand". Der Rand beinhaltet Übergangsfarben, die mit der Farbe des Kerns in Beziehung stehen. Ein einfaches Ausblenden der Kernfarbe könnte jedoch die Markierung nicht vollkommen aus­ blenden, da der Rand, welcher zusätzliche Farben haben kann, zurückbleiben könnte. Deshalb arbeitet die vorliegende Erfindung so, daß eine Anhäufung von Farben ausgeblendet wird, die die Farbe des Kerns und die Übergangsfarben des Randes repräsentie­ ren, um Markierungen vollkommen auszublenden. Da es nun möglich ist, daß ein Rand einer Markierung auch dieselben Farben hat, die in einem Zeichen vorhanden sind, erkennt das vorliegende System auch die Kanten von Markierungen um zu gewährleisten, daß nur die identifizierte Farbe, die in Markierungen vorhanden ist, ausge­ blendet wird, so daß kein Ausblenden von Teilen von Zeichen stattfindet.
Wir verweisen jetzt auf Fig. 4. Damit wird ein stärker detailliertes Blockschaltbild von Block 44, Farbprozessor, von Fig. 1 in Übereinstimmung mit der vorliegenden Erfindung be­ schrieben. Der Ausgang aus dem Signal-Vorbehandlungsgerät 14, der ein vorverarbeitetes digitalisiertes Farbbild von Farb- Scanner/Kamera 12 repräsentiert, wird an den Farb-Grau-Wandler 36 (Farbprozessor-Bildblock 36, Fig. 1) und an die Farberkenn- und Randlogikschaltung 100 angelegt. Der Farb-Grau-Wandler 36 funktioniert so, wie weiter vorn bezogen auf Fig. 1 beschrieben. Das Helligkeitssignal ist eine monochromatische, annähernd fotografische Darstellung des Bildes, welches eine Wiedergabe ist, die für das menschliche Auge angenehm ist. Folglich werden die Elemente, die das menschliche Auge als konstrastierend sieht, von dem Korrelationsanalysator 102, welcher das Hellig­ keitssignal (I) empfängt, auch als konstrastierend gesehen. Sollte die Übertragungsfunktion von Wandler 36 nicht ausreichend Kontrast für spezielle Farbkombinationen liefern, dann können die Koeffizienten der Übertragungsfunktion, die in den Wandler 36 über das Signal der Übertragungskennwerte eingegeben werden, so geändert werden, daß sich der gewünschte Effekt ergibt. Der Wandler 36 beinhaltet einen Verweistabellenspeicher. Der Eingang in den Wandler 36 kann zum Beispiel ein Farbsignal von fünfzehn Bit umfassen, welches in einen digitalen Wert von vier Hit umgewandelt wird, das an den Korrelationsanalysator 102 über den Multiplexer 103 angelegt wird.
Der Korrelationsanalysator 102 funktioniert so, daß er beispiels­ weise 14 Abtastungen eines Graubildes puffert, um den Mittelwert der Zellen, die das jeweilige Pixel bis zu einer Matrix von 14 mal 14 umgeben, zu berechnen und legt den Schwellenwert des in der Mitte liegenden Pixels auf der Grundlage eines Vergleichs mit dem durchschnittlichen Zellenwert in dem Bereich fest. Der Korre­ lationsanalysator 102 kann einen solchen Korrelationsanalysator einschließen, wie er in den US-Patenten Nr. 4,162,481 und 3,761,876 beschrieben ist, deren Beschreibungen und Zeichnungen mittels Verweis mit aufgenommen sind. Der Korrelationsanalysator 102 funktioniert auch, um Ränder hervorzuheben, und deshalb funktioniert der Korrelationsanalysator 102 auch als Randdetek­ tor, der für OCR-Zeichen "abgestimmt" ist. Die Korrelationspara­ meter werden in den Korrelationsanalysator 102 eingegeben, um die Matrixgröße für den Mittelwertsbereich und die Schwellwertemp­ findlichkeit zu bestimmen. Der Ausgang von Korrelationsanalysa­ tor 102 ist ein durch Schwellwert bestimmtes Schwarz-Weiß-Bild, welches an die Ausblend/Beibehalt-Logikschaltung 102 sowohl als Bild- als auch als Randinformation angelegt wird.
Das vorverarbeitete RGB-Signal von dem Signal-Vorbehandlungs­ gerät 14 wird auch an die Farberkennungs- und Rand-Logikschaltung 100 angelegt, welche auch das Schwarz-Weiß-Bildsignal, das von dem Korrelationsanalysator 102 erzeugt wird, ein Farbwahlsignal und ein Signal für die Kennwerte der Blind-Druckfarbe empfängt. Die Farberkennungs- und Randlogikschaltung 100 erzeugt auch das stark-weiße und das stark-schwarze Signal, welche an die Schal­ tung 104 angelegt werden. Das stark-weiße und das stark-schwarze Signal werden nur dann erzeugt, wenn ein gültiger Rand vorhanden ist, wie dies durch die Schaltung 100 bestimmt wird, welche das Signal EDGE (Rand) erzeugt (Fig. 5), um dadurch zu verhüten, daß eine gültige, reine Farbe (kein Rand) modifiziert wird. Diese Operation wird weiter in Verbindung mit Fig. 8 beschrieben. Der Ausgang von Schaltung 104 generiert das gefilterte OCR-Bild, welches an die OCR-Einheit 48 angelegt wird (Fig. 1).
Der Ausgang von Signal-Vorbehandlungsgerät 14 wird auch an einen Farbprozessor 110 angelegt, welcher so arbeitet, daß er eine Farbsubtraktionsfunktion durchführt, wie sie vorstehend bezogen auf den Farbprozessor 44 beschrieben worden ist (Fig. 1).
Entweder der Ausgang von Wandler 36 oder der Ausgang von Prozessor 110 kann an den Korrelationsanalysator 102 angelegt werden.
Jetzt wird unter Verweis auf Fig. 5 die Schaltung 100 beschrie­ ben. Das RGB-Videosignal wird anfänglich an eine Verzögerungs­ schaltung 120 angelegt, dergestalt, daß das RGB-Videosignal bezogen auf das korrelierte Videosignal vom Korrelationsanalysa­ tor 102 so verzögert wird, daß die Randinformation für das Pixel gerade vor und gerade hinter dem Rand zur Verfügung steht. Der Ausgang von Verzögerungsschaltung 120 wird an eine Blindfarben- Verweistabelle 122 und eine Beibehaltfarben-Verweistabelle 124 angelegt, wo jedes Pixel geprüft wird, um festzustellen, ob ein Pixel eine Blindkern- (B-CORE) oder Blindrand-(B-EDGE)-Farbe bei Verweistabelle 122 oder eine Beibehaltkern- (K-CORE) oder Beibe­ haltrand- (K-EDGE)-Farbe bei Verweistabelle 124 ist. Wie in Fig. 5 veranschaulicht, hat jede Verweistabelle 122 und 124 bestimmte Ausgangsleitungen. Die aktiven Farben werden gewählt/nicht ge­ wählt, und die Farbanhäufungen werden von dem Anwendungsprogramm aus über eine Mikroprozessor-Sammelleitung (Fig. 6) in die Ver­ weistabellen 122 und 124 geladen.
Der Ausgang aus den Verweistabellen 122 und 124 wird an eine Kombinationslogik angelegt. Die BLIND-Randpixelanhäufungen werden in einem Gatter 130 zusammen in einer OR-Logik verknüpft. Der Ausgang von Gatter 130 wird mit der Randfunktion in einem Gatter 132 verknüpft. Der Ausgang von Gatter 132 wird mit den Kern- Anhäufungen in einer OR-Logik verknüpft, um in einem Gatter 134 ausgeblendet zu werden, dessen Ausgang das stark-weiße Signal erzeugt, welches an die Blind/Beibehalt-Logik 104 angelegt wird (Fig. 4). Die KEEP-Anhäufungen, die durch Verweistabelle 124 erzeugt werden, werden in ähnlicher Weise miteinander verknüpft. Die KEEP-Randanhäufungen werden in einem Gatter 136 in einer OR-Logik verknüpft. Der Ausgang von Gatter 136 wird mit der Randfunktion in einem Gatter 138 verknüpft. Der Ausgang von Gatter 138 wird in einer OR-Logik mit den KEEP-Kernanhäufungen in einem Gatter 140 verknüpft, um den stark-schwarzen Signalausgang zu erzeugen, der an die Blind/Beibehalt-Logik 104 angelegt wird (Fig. 4).
Das Signal EDGE ist "wahr" für das Pixel vor einem Übergang und für das Pixel hinter einem Übergang. Das Eingangssignal vom Korrelationsanalysator 102 (Fig. 4) wird an einen Übergangs- Erkennungs-Verzögerungs-Flip-Flop 142, ein Übergangserkennungs­ gatter 144 und einen Inverter 146 angelegt. Der Ausgang von Inverter 146 wird an ein Gatter 148 angelegt, welches auch den Ausgang von Flip-Flop 142 empfängt. Die Gatter 144 und 148 erken­ nen Übergänge hoch auf niedrig, beziehungsweise niedrig auf hoch, wenn der Eingang in Flip-Flop 142 verschieden von dem Ausgang von Flip-Flop 142 ist, ein Pixel später. Der Ausgang von Gatter 148 und der Ausgang von Gatter 144 werden in einem OR-Gatter 150 verknüpft. Der Ausgang von Gatter 150 wird an einen Flip-Flop 152 angelegt, dessen Eingang und Ausgang in einem OR-Gatter 154 verknüpft werden, um die EDGE-Funktion zu erzeugen. Die EDGE- Funktion ist ein zwei Pixel breiter Impuls, der um den Übergang zentriert ist. Das Randsignal wird an die Gatter 132 und 138 angelegt, um Farb-Randanhäufungen für den Blind-/Beibehaltprozeß freizugeben.
Die Blind-/Beibehalt-Logikschaltung 104 (Fig. 4) empfängt das Schwarz/Weiß-Videosignal von dem Korrelationsanalysator 102 und das stark-weiße Signal von Gatter 134 und das stark-schwarze Signal von Gatter 140. Das Schwarz/Weiß-Videosignal vom Korrela­ tionsanalysator 102 passiert durch ein exklusives OR-Gatter 160 zur OCR-Einheit 48 (Fig. 1) entweder unverändert oder invertiert, je nach dem Status des FLIP-Eingangssignals zu Gatter 160. Das Schwarz/Weiß-Videosignal von Korrelationsanalysator 102 wird an ein AND-Gatter 162 und über einen Inverter 164 an ein AND-Gatter 166 angelegt. Das AND-Gatter 162 empfängt auch das stark-schwarze Signal von Gatter 140. Das AND-Gatter 166 empfängt auch das stark-weiße Signal von Gatter 134. Der Ausgang der AND-Gatter 162 und 166 wird an ein OR-Gatter angelegt. Das stark-schwarze Signal und das stark-weiße Signal werden an ein AND-Gatter 170 angelegt. Der Ausgang von AND-Gatter 170 wird über einen Inverter 172 an ein AND-Gatter 174 angelegt. Das AND-Gatter 174 empfängt auch den Ausgang von Gatter 168, um das Flip-Signal zu erzeugen, welches an Gatter 160 angelegt wird. Das Flip-Signal wird entweder durch das stark-schwarze Signal, verknüpft mit dem Schwarz/Weiß-Video­ signal bei Gatter 162 oder das stark-weiße Signal, kombiniert mit der Inversion des Schwarz/Weiß-Videosignals bei Gatter 166, erzeugt. Der Ausgang von Gatter 168 wird dann gesperrt, wenn stark-schwarz und stark-weiß beide wahr sind, was es dem Schwarz/Weiß-Videosignal gestattet, durch das Gatter 160 ungeän­ dert hindurchzugehen. Um zusammenzufassen, wenn eine BLIND-Farbe erkannt wird (Kernfarbe oder gültige Randfarbe), dann wird das. Videosignal auf weiß gedrückt oder ausgeblendet, und wenn eine KEEPER-Farbe erkannt wird, dann wird das Signal auf schwarz gedrückt. Die Blind/Beibehalt-Logik 104 führt die folgenden Logikoperationen durch:
weißes Videosignal und stark-schwarz resultiert darin, daß der Ausgang nach schwarz kippt;
schwarzes Videosignal und stark-weiß resultiert darin, daß der Ausgang nach weiß kippt;
gleichzeitig stark-weiß und stark-schwarz resultiert in keiner Änderung bei dem Schwarz/Weiß-Videosignal; und
kein stark-weiß oder stark-schwarz resultiert in keiner Änderung bei dem Ausgang des Schwarz/Weiß-Videosignals.
Verweisen wir jetzt auf Fig. 6. Dort wird das vorliegende Dokumentenverarbeitungssystem weiter diskutiert. System 10 bein­ haltet einen Mikrorechner 200 und eine dazugehörige Eingabe- Tastatur 202. Mit dem Mikrorechner 200 verbunden ist eine Sammel­ leitung 204, wie beispielsweise IBM-Mutterleiterplatte PC-AT, welche für die Steuerung, die Diagnostik und mathematischen Rechnungen für System 10 sorgt. Bildschirmausgabe 32 und optische Zeichenerkennungseinheit 48 sind ebenfalls an die Sammelleitung 204 angeschlossen. Während die optische Zeichenerkennungseinheit 48 so gezeigt ist, daß sie mit der Sammelleitung 204 verbunden ist, kann die optische Zeichenerkennungseinheit 48 auch entfernt davon liegen. Ebenfalls mit der Sammelleitung verbunden ist eine Schnittstelle 206, welche mit einem Wirtsrechner oder einem Rechnernetz verbunden sein kann.
Die Farb-Scanner/Kamera 12 wird durch eine Scannersteuerung 210 gesteuert. Das serielle Farb-, RGB-Videosignal wird direkt von Farb-Scanner/Kamera 12 an das Signal-Vorbehandlungsgerät 14 ange­ legt, welches für die individuelle Zellenempfindlichkeitskorrek­ tur und die Auflösungskonversion sorgt.
Der Ausgang aus dem Signal-Vorbehandlungsgerät 14 wird an den Korrelationsanalysator 102, die Farberkennungseinheit 100, die Blind/Beibehalt-Logikschaltung 104 und den Bildspeicher 46 ange­ legt. Die Größe des Bildspeichers 46 ist ausreichend, um ein Schwarz/Weiß-Bild eines Dokuments von 8,5 × 14 Zoll zu speichern, während der Inhalt von Bildspeicher 46 zu der optischen Zeichen­ erkennungseinheit 48 übertragen wird. Alternativ kann der Spei­ cher eine Fläche von 2 Zoll × 2 Zoll eines RGB-Farbbilds zum Zweck der Kolorimetrie beinhalten.
Das Dokumentenverarbeitungssystem 10 kann sowohl direkt gekoppelt als auch mitindirekter Kopplung arbeiten (im on-line- oder off­ line-Betrieb). Funktionen beim indirekt gekoppelten Betrieb beinhalten Eichung und Kolorimetrie. Während der Eichfunktion unterstützt der Mikrorechner 200 bei der Berechnung der einzelnen Zellkorrekturwerte und lädt diese Werte wieder in das Signal- Vorbehandlungsgerät 14. Ein "weißes" Eichdokument wird vor der Farb-Scanner/Kamera 12 vorbeigeführt abgetastet, und jede Zelle R, G und B wird auf 100% des vollen Wertes normalisiert. Diese Normalisierung korrigiert Zellempfindlichkeitsschwankungen, Be­ leuchtungsunebenheiten und Linsenwirkungsgrad. Zusätzlich norma­ lisiert diese Korrektur die Gesamt-"Beleuchtung" von System 10 auf gleiche Energie weiß. Die Beleuchtungsnormalisierung ist infolge von fluoreszierenden Beleuchtungsquellen, welche die Tendenz haben, Farbe und Brillianz zu ändern, wenn sie altern, besonders bedeutsam.
Die Kolorimetriefunktion gehört zum Abtasten der beizubehaltenden oder auszublendenden Farben und zum Erzeugen der repräsentativen Anhäufungen und zum Laden dieser Anhäufungen in Verweistabellen 122 und 124 (Fig. 5). Wenn die Kolorimetrie durchgeführt wird, dann wird das vorverarbeitete RGB-Videosignal vom Signal- Vorbehandlungsgerät 14 direkt in den Bildspeicher 46 übergeben. Wie schon weiter vorn angegeben, kann der Bildspeicher 46 unge­ fähr eine Quadratfläche von 2 Zoll mal 2 Zoll eines vollen Farb­ bildes speichern. Die X, Y-Koordinaten eines zutreffenden Farbmu­ sters müssen eingegeben werden, bevor ein Dokument durch die Farb-Scanner/Kamera 12 abgetastet wird. Es kann mehr als ein Dokument bei einem Versuch, den vollen Bereich der Farbschwankun­ gen zu erfassen, die von einem einzelnen Formattyp erwartet werden können, abgetastet werden.
Die Stichproben werden analysiert, und das Zentrum der Kernan­ häufung wird im dreidimensionalen Raum berechnet. Eine dreidimen­ sionale Farbskala auf der Grundlage von Fernseh-YIQ wird modifi­ ziert, um Symmetrie um die zentralen Achsen schwarz/grau/weiß zu erhalten. Die Formel für die symmetrische Farbskala ist:
Ym = 0,58G + 0,21R + 0,21B (1)
Im = R - Ym (2)
Qm = B - Ym (3)
Jetzt wird unter Verweis auf Fig. 7 eine Darstellung einer drei­ dimensionalen Farb-Grundgesamtheit 230 veranschaulicht. Die Farb- Grundgesamtheit 230 ist um die Grauachse symmetrisch. Der Vorteil der symmetrischen Farbskala ist, daß alle Farbtöne dieselbe Sättigungsskala haben, so daß folglich der Radius eines Grauzy­ linders 232 für jeden Farbton konstant sein kann. Die spektrale Reaktion von Ym ist noch annähernd photop. Die Formeln, die für Farbton ("H") und Sättigung ("S") verwendet werden, sind wie folgt:
H = tan (Im/Qm) (4)
S = Quadratwurzel aus (Im 2 + Qm 2) (5)
Unter Verweis auf Fig. 8 ist die Kernanhäufung 240 um den berechneten Mittelpunktswert 242 auf der Grundlage gemessener Auslenkungen bei Y, I, Q, H und S für die Farbstichproben, gekop­ pelt mit bekannten statistischen Gestalten, aufgebaut. Diese Berechnung verhütet, daß "wilde" Rauschwerte mit eingeschlossen werden und auch, daß die "Löcher" ausgefüllt werden, die dadurch geblieben sind, daß nicht jeder mögliche Wert in der Farbstich­ probe repräsentiert ist. Jede Dimension Y, I, Q, H und S der Kernanhäufung wird unabhängig expandiert, um es zu ermöglichen, daß zusätzliche Toleranzen von nicht gesehenen Formen von dem vorliegenden System 10 verarbeitet werden. Die prozentuale Expan­ sion hängt davon ab, wie dicht beieinander konkurrierende Farben sind und davon, wie kritisch es ist, eine Farbe bei einer gegebe­ nen Anwendung vollkommen auszublenden.
Bevor die Randwert-Anhäufungen geschaffen werden, werden Stich­ proben bekannter Farben, zu denen die Kernanhäufungen Übergänge bilden, abgetastet und analysiert. Normalerweise wären die Über­ gänge zu einem weißen Untergrund 244 oder zu einem dunklen Schreibinstrument 246. Eine "Tunnel"-Anhäufung wird zwischen der Kernanhäufung der Blind-Druckfarbe und der Untergrund-Anhäufung gebaut. Tunnel werden zu jeder der anderen analysierten Farben gebaut. Die Tunnel-Anhäufung ist eine, die mit der Randfunktion qualifiziert wird. Der Tunnel wird konzentrisch mit einem Vektor gebaut, der zwischen zwei Anhäufungs-Zentren verläuft und bis an den Umfang der beiden expandierten Kernanhäufungen stößt. Alle Werte in dem Tunnelraum werden in die EDGE-(Rand)-Anhäufung mit aufgenommen. Der Tunnel ist zylindrisch im Y, I, Q-Raum (recht­ winklige Koordination), aber nicht im H, S, Y-Raum (Polarkoordi­ naten). Berechnungen werden in Y, I, Q durchgeführt und dann in H, S, Y konvertiert.
Die Farbwerte in den Anhäufungen werden nach R, G, H konvertiert und wie folgt in Verweistabellen 122 und 124 (Fig. 5) geladen:
R = I + Ym (6)
G = (I + Q) - Ym (7)
B = Q + Y (8)
Dieser Prozeß wird für jede auszublendende oder beizubehaltende Farbe durchgeführt. Ein Konkurrieren oder Überlappen von Anhäufungen zwischen auszublendenden und beizubehaltenden Farben wird nachgeprüft und durch den Betreiber von System 10 aufgelöst, bevor die Verweistabellen 122 und 124 geladen werden.
Die X- und Y-Koordinaten der verschiedenen Farbfelder werden bestimmt und dann in das Anwendungsprogramm mit den Felddaten für die optische Zeichenerkennung eingegeben. Korrelationsanalysa­ tor-Schwellwertkurven, die während des Prozesses der optischen Zeichenerkennung benutzt werden, werden ebenfalls bestimmt und in das Anwendungsprogramm eingegeben.
Fig. 8 veranschaulicht auch eine Anhäufung 250, die durch ein hellblaues Schreibinstrument geschaffen worden ist. Ein Anteil 250 dieser Anhäufung liegt innerhalb des Tunnels 248 und wird durch die Funktion von Schaltung 100 nicht ausgeblendet, da dieser Anteil eine gültige, reine Farbe (kein Rand) repräsen­ tiert.
Für Betrieb mit direkter Koppelung (on-line) wird ein Stapel Formulare in ein Zuführmagazin geladen, diese werden dann einzeln zugeführt und abgetastet. Das Videosignal wird so verarbeitet, wie weiter vorn unter Verweis auf Fig. 6 beschrieben, wobei die Farberkennungsschaltungen Blindfarben des Formulars ent­ fernen, während sie die Farben des Schreibinstruments erhalten. Das resultierende Bild wird der optischen Zeichenerkennungsein­ heit 48 zwecks Konvertierung in den ASCII-Code zugesandt. Zusätz­ lich führt der Mikrorechner 200 die Nachführung auf dem Dokument durch und steuert Farb-Freigabe/Sperrung je nach der vertikalen Position auf dem jeweils verarbeiteten Dokument.
Zusammengefaßt, die vorliegende Erfindung kombiniert eine drei­ dimensionale Farberkennungstechnik mit einer adaptiven Korrelati­ onsanalysator/Schwellwerteinrichtung, die für Zeichenabbilder optimiert ist. Der Korrelationsanalysator trennt den Vordergrund (Zeichen plus Form) vom Untergrund (Papier). Der Korrelationsana­ lysator drückt den Untergrund auf weiß, und alles mit einem Kontrast von 25% oder mehr bezogen auf den Untergrund wird auf schwarz gedrückt. Unter Verknüpfung dieser beiden Vorgänge wird die Korrelation durchgeführt, dann werden, bevor die Farbinfor­ mation ausgesondert wird, Pixelwerte geprüft, um zu bestimmen, ob sie für ein Ausblenden kennzeichnend sind. Wenn der Pixelwert so kennzeichnend ist, dann wird das korrelierte Pixel auf weiß gedrückt.
Die vorliegende Erfindung minimiert weiterhin die Interferenz zwischen einer Vielzahl von Farben, die in dem Übergang zwischen Farben erzeugt werden und gültige Farben des Schreibinstruments, welche dieselben dreidimensionalen Farbkoordinaten haben könnten. Die dreidimensionale Teilraum-Anhäufung innerhalb einer drei­ dimensionalen Farb-Grundgesamtheit, die die auszublendende Farbe repräsentiert, wird in mehrere Anhäufungen getrennt. Diese Anhäu­ fungen beinhalten den Kern, eine Anhäufung, die für die Grundfar­ be der Blind-Druckfarbe repräsentativ ist, so expandiert, daß erwartete Schwankungen infolge von Drucktoleranzen berücksichtigt werden und eine oder mehrere Anhäufungen, die die Übergangsfarb­ werte für die auszublendende Druckfarbe repräsentieren. Eine dieser Anhäufungen enthält die Werte von Rändern von der Blind- Druckfarbe zur Farbe des Untergrundes. Eine andere Anhäufung kann eine Gesamterweiterung der Kernanhäufung enthalten, welche Rand­ werte zu irgendeiner anderen Farbe in der Farb-Grundgesamtheit repräsentiert. Andere spezialisierte Anhäufungen können geschaf­ fen werden, wenn bekannt ist, daß die Blind-Druckfarbe Übergänge zu einer bekannten Farbe schafft, wie beispielsweise ein schwarz schreibendes Instrument. Diese spezialisierten Anhäufungen enthalten alle Randwerte zwischen der Blind-Druckfarbe und einem schwarzen Schreibstift.
Wenn festgestellt wird, daß ein laufendes Pixel sich in der Kernanhäufung befindet, dann wird es automatisch ausgeblendet. Wenn das laufende Pixel innerhalb eine der Randanhäufungen fällt, dann wird der Bedienungsmann für die Randerkennung konsultiert, und wenn, entweder vor oder hinter dem Pixel kein Rand vorhanden ist, dann wird das Pixel als gültiges Schreibinstrument angesehen und wird ein nicht ausgeblendeter Teil 248 von Anhäufung 250 (Fig. 8). Ränder des Schreibinstruments werden geopfert, sofern nicht die Farbe des Instruments als beizubehaltende Farbe definiert ist.
Eine weitere Funktion der vorliegenden Erfindung ist, die Mög­ lichkeit zu liefern, Farben zu bestimmen, welche beibehalten werden sollen. Dieselben Kern- und Rand-Anhäufungstechniken, die für das Erkennen von Blind-Druckfarbe verwendet werden, werden auch für eine beizubehaltende "KEEPER"-Farbe angewendet. Wenn jedoch, wie weiter vorn diskutiert, festgestellt wird, daß die Farbe sich innerhalb einer der beizubehaltenden Anhäufungen befindet, dann wird der korrelierte Ausgang auf schwarz ge­ drückt.
Eine beizubehaltende Anhäufung, die normalerweise eingeschlossen wird, ist der Grauzylinder (Fig. 7). Dieser Grauzylinder wird als generelle Schreibinstrument-Anhäufungen verwendet, um die schwar­ zen Druckfarben oder Bleistiftmarken festzuhalten, die üblicher­ weise für die optische Zeichenerkennung verwendet werden. Als Alternative besteht eine entgegengesetzte Verwendung für beizube­ haltende Farben in der Ausblendung von Formularen, die mit schwarzer Farbe gedruckt sind. Bei diesem Szenarium wird ein Farb-Schreibinstrument, vorzugsweise eines mit hoher Sättigung, verwendet, um das Formular auszufüllen. Die Farbe mit hoher Sättigung wird festgehalten, und alle anderen Markierungen auf dem Formular werden ausgeblendet. Es kann auch eine Mehrzahl von beizubehaltenden Farben mit hoher Sättigung verwendet werden. Alternativ kann auch, wenn die schwarze Druckfarbe auf dem Formu­ lar gut definiert ist, diese ausgeblendet werden, während alle anderen Farben beibehalten werden.
Die vorliegende Erfindung sorgt weiterhin für eine Mehrzahl von Blindfarben und beizubehaltenden Farben, welche individuelle oder in verschiedenen Kombinationen in Übereinstimmung mit Programm- Wahlparametern gewählt werden können. Ein einzelnes Formular kann zum Beispiel drei Blindfarben haben, die drei verschiedene Informationsfelder repräsentieren. Solange die drei Blind-Druck­ farben nicht mit gültigen Farben des Schreibinstruments interfe­ rieren, können diese Druckfarben für das gesamte Formblatt alle aktiv sein. Wenn es eine Überdeckung mit einem Schreibinstrument in einem speziellen Informationsfeld gibt, dann kann diese Über­ deckung dadurch gelöst werden, daß man die Blind-Druckfarben, eine auf einmal, gemäß dem X- und Y-Ort für das Feld jener Farbe aktiviert.
Das vorliegende System gestattet die Verarbeitung von unter­ einander gemischten Formen verschiedener Farben. Solange die Blind-Druckfarben nicht mit gültigen Schreibinstrumenten inter­ ferieren, können alle Farben gleichzeitig aktiv sein. Wenn es jedoch eine Interferenz gibt, dann kann die interferierende Farbanhäufung automatisch aktiviert oder entaktiviert werden. Eine automatische Farbanhäufung-Aktivierung etreicht man durch Abtasten eines Farbbereiches an einer vorher festgelegten X, Y- Koordinate auf dem Dokument, bevor man irgendwelche Markierungen auf dem Dokumentenformblatt ausblendet. Wenn es keinen zutref­ fenden Bereich zum Abtasten auf dem Formblatt gibt, dann wird ein Formular so bestimmt, daß es einen Bereich der Blind-Druckfarbe oben auf dem Formular hat, so daß jene Formularfarbe vor irgend­ welchen OCR-Feldern bestimmt werden kann. Wenn das Dokument in irgendeiner beliebigen Orientierung eingeführt wird, dann muß eine Druckfarbenprobe an einem Rand sein, der zu Anfang abgeta­ stet wird. Die Probengröße muß ausreichend groß sein, um bei Vorhandensein von Schwankungen infolge von Schwankungen beim mechanischen Scanner lokalisiert zu werden.
Eine alternative Herangehensweise der vorliegenden Erfindung für die Umwandlung von Farb- in Schwarz/Weiß-Daten wird in dem Block­ schaubild von Fig. 9 veranschaulicht. Diese Konvertierung findet in Echtzeit statt. Die RGB-Farbkomponenten vom Signal-Vorbehand­ lungsgerät 14 (Fig. 1) werden an einen Mehrzeilenpuffer 260 abgelegt. Der Puffer 260 wird kontinuierlich aktualisiert, um beispielsweise zwei oder mehr vorherige Abtastzeilen eines Bildes von dem jeweils zu verarbeitenden Dokument zu speichern. Der RGB- Ausgang von Puffer 260 speist einen Helligkeitswandler 262. Der Helligkeitswandler 262 funktioniert so, daß er die Farbdaten in Grauskalenpegel entsprechend entweder beispielsweise der fotoopi­ schen Helligkeitskonversion (0,3R + 0,11B + 0,59G) oder der Breitband-Helligkeitskonversion (R + B + G) dividiert durch 3 ändert.
Die RGB-Signale treiben auch einen selektiven Farbdetektor 264. Der Detektor 264 funktioniert so, daß ein Ausgang immer dann erzeugt wird, wenn ein Eingangspixel zu der Farbe paßt, welche vorher über das Farbwahl-Steuersignal vom Mikrorechner 200 (Fig. 6) definiert worden ist. Die Funktion von Farbdetektor 264 wird unter Verwendung von Verweistabellen implementiert und nutzt RGB-Eingaben anstelle von Helligkeits- oder Farbwertkoordinaten. Der Ausgang von Detektor 264 ist ein binärer Wert, der nur anzeigt, wenn eine Farbe identifiziert worden ist.
Der Ausgang von Detektor 264 wird an einen Wähler 266 angelegt. Der Wähler 266 empfängt auch den Grauausgang von Wandler 262 und ein festes weißes Pegelsignal, welches den Papieruntergrund des Dokuments oder den tatsächlichen Untergrund für ein laufendes Histogramm repräsentiert. Der feste weiße Pegel kann ein maxima­ ler theoretischer weißer Pegel oder ein geringerer Grauskalenpe­ gel sein. Wenn das weiße Wahlsignal wahr ist, dann bewirkt der Wähler 266, daß der weiße Pegel ausgegeben wird, anderenfalls wird der Graupegel des Bildelements vom Wandler 262 ausgegeben. Der Ausgang von Wähler 266 wird an einen Wandler 268 grau zu schwarzweiß angelegt, welcher das Schwarz/Weiß-Signal erzeugt, das an die Blind/Beibehalt-Logik 104 und die Farberkennung 100 (Fig. 4) angelegt wird.
Der Detektor 264 empfängt Farbwahl-Steuersignale vom Mikrorechner 200 (Fig. 6), welche entweder entlang der Steuerdaten von einem automatischen Form-Farb-Wähler verlaufen, der anschließend unter Bezugnahme auf Fig. 10 beschrieben wird oder welche von der Tastatur 202 (Fig. 6) aus erzeugt werden. Von Detektor 264 zu wählende Farben können durch die Wahl von Optionen gewählt wer­ den, die durch die Software von System 10 geboten werden. Des­ gleichen können Farbparameter direkt über die Tastatur 202 einge­ geben werden.
Jetzt unter Verweis auf Fig. 10 wird ein Blockschaubild eines Systems gezeigt, um zu bestimmen, ob ein Dokument/Formular, das verarbeitet wird, in Farbe gedruckt ist und um die Farb­ kennwerte für die Verwendung beim Ausblenden dieser Farbe zu erfassen. Das RGB-Videosignal vom Signal-Vorverarbeitungsgerät 14 (Fig. 1) wird an einen RGB-HSI-Wandler 280 angelegt. Die Sätti­ gungskomponente des HSI-Koordinatensystems ist ein Maß für die Intensität der Farbe. Alle Schwarz/Weiß- oder Grauskalenbilder haben einen Sättigungswert nahe bei Null. Die Sättigungskomponen­ te wird an einen Minimalsättigungswert-Detektor 282 angelegt, welcher so funktioniert, daß er den Betrag und die Ausgaben eines logischen Pegels für jedes Bildelement überwacht, wenn ein Mini­ malwert überschritten worden ist. Der Minimalwert könnte zum Beispiel 10% des maximalen Sättigungspegels sein. Der Ausgang von Detektor 282 wird an einen N-Pixel-Folgelängendetektor 284 angelegt. Der Detektor 284 mißt die Anzahl erkannter Farbbilde­ lemente in einer kontinuierlichen Folge, wenn die Farbe durch eine Zeile auf dem Formular oder durch zu erkennende Zeichen erzeugt wird. Für eine Abtast-Auflösung von 300 Punkte pro Zoll wäre der Pixel-Zählwert typischerweise 100, was eine Zeilenlänge von 1/3 Zoll repräsentiert.
Der Ausgang von Detektor 284 wird an einen N-Pixel-Verzögerungs­ puffer 286 angelegt. Der Puffer 286 empfängt das HSI-Videosignal und funktioniert als Schieberegister. Die Länge von Puffer 286 ist dieselbe, wie die Anzahl der Folgebildelemente, die durch den Detektor 284 gefordert wird. Wenn ein "Einfrier"-Ausgang durch den Detektor 284 produziert wird, dann werden die Bildelemente, die das Ergebnis erzeugt haben, in Puffer 286 gespeichert. Das "Einfrier"-Signal erhält die Bildelementdaten, die in Puffer 286 gespeichert sind. Der Ausgang von Puffer 186 wird an die Histo­ programmberechnungsschaltung 288 angelegt, welche so funktio­ niert, daß die Bildelementfarben analysiert werden, die in Puffer 286 gespeichert sind, um die erfaßte typische Farbe zu bestimmen. Der "Farb"-Ausgang von Schaltkreis 288 treibt einen Anhäufungsge­ nerator 290, welcher einen Bereich an Farbbildelementwerten erzeugt, der die Farbe des Dokumentenformulars einschließt. Der Ausgang von Generator 2, Formularfarbwerte, ist einer der Eingän­ ge in Mikrorechner 200, welcher einen Eingang nach Detektor 264 liefert (Fig. 9). Detektor 284, Puffer 286, Schaltkreis 288 und Generator 190 empfangen alle ein Rückstellsignal am Anfang jedes neuen verarbeiteten Dokumentenformulars, um zu gestatten, daß die Farbe jedes Formulars unabhängig bestimmt wird. Auf diese Weise können miteinander gemischte Formulare unterschiedlicher Farben in Übereinstimmung mit der vorliegenden Erfindung ausgeblendet werden.
Man kann deshalb sehen, daß das vorliegende System ein Farbbildverarbeitungssystem für das elektronische Farbfiltern von Dokumenten und die Entfernung von Blindfarben oder anderer Störungen bei den Dokumenten beinhaltet. Eine Mehrzahl von Farben wird entweder der für ein Ausblenden oder für ein Beibehalten festgelegt. Es werden Anhäufungen von Farben derart bestimmt, daß alle störenden Markierungen einschließlich der Ränder der­ selben je nach Wunsch ausgeblendet oder beibehalten werden. Wohingegen die vorliegende Erfindung bezogen auf die speziellen Ausführungsformen derselben beschrieben worden ist, ist es selbstverständlich, daß verschiedene Änderungen und Modifikatio­ nen für jemanden naheliegen, der mit der Technik vertraut ist.

Claims (2)

1. System (10) zur Bearbeitung von Dokumenten (52), auf denen Daten aufgedruckt sind, einschließlich Markierungen (54), die einen inneren Kernbereich haben, der durch einen Rand begrenzt ist, wobei die Markierungen einen Farbton haben und für das Auge sichtbar sind, aber nicht durch das System (10) zu lesen sind, und wobei die Daten Zeichen (56, 58, 60) ein­ schließen, welche durch das System (10) zu lesen sind, mit:
Mitteln (12) zum Abtasten eines Dokuments und zum Erzeugen einer Vielzahl farbiger Bildelemente;
gekennzeichnet durch:
Mittel (100) zum Identifizieren von Farben, die innerhalb des Kernbereiches und des Randes der Markierungen enthalten sind;
Mittel (104) zum Konvertieren der Farben der Bildelemente des Kernbereiches und des Randes der Markierungen in eine Farbe des Untergrundes des Dokuments, um dadurch ein gefil­ tertes Abbild des Dokuments zu erzeugen, indem ein Prozent­ satz des Farbtons, der zu dem Farbton der Markierungen kom­ plementär ist, vom Farbton der Markierungen subtrahiert (44) wird; und
optische Zeichenerkennungsmittel (48) zum Empfangen des gefilterten Abbildes des Dokuments, das nur Zeicheninfor­ mationen repräsentiert, und zum Identifizieren der Zeichen, die auf dem Dokument von dem gefilterten Abbild erscheinen, so daß die Markierungen und der Untergrund, die ein Zeichen umgeben, durch die optischen Zeichenerkennungsmittel (48) nicht unterscheidbar sind.
2. System (10) zur Bearbeitung von Dokumenten (52), auf denen Daten, einschließlich farbige Markierungen (54), die einen Farbton haben und für das Auge sichtbar sind, aber nicht durch das System (10) zu lesen sind, und Zeichen (56, 58, 60) aufgedruckt sind, die eine Farbe haben und durch das System (10) zu lesen sind, mit:
Mitteln (12) zum Abtasten eines Dokuments und zum Erzeugen einer Vielzahl farbiger Bildelemente;
gekennzeichnet durch:
Mittel (44) zum Identifizieren der Farbe der Zeichen, die auf dem Dokument erscheinen;
Mittel (44, 104) zum Konvertieren aller Farben von Markie­ rungen, die auf dem Dokument erscheinen, in eine Farbe des Untergrundes des Dokuments, mit Ausnahme der identifizierten Farbe von Zeichen, die auf dem Dokument erscheinen, indem ein Prozentsatz des Farbtones, der komplementär zu dem Farb­ ton der Markierungen ist, von dem Farbton der Markierungen subtrahiert wird, wodurch ein gefiltertes Abbild des Doku­ ments erzeugt wird; und
optische Zeichenerkennungsmittel (48) zum Empfangen des gefilterten Abbildes des Dokuments, das nur Zeicheninfor­ mationen repräsentiert, und zum Identifizieren von Zeichen, die auf dem Dokument von dem gefilterten Abbild erscheinen, so daß die Markierungen und der Untergrund, die ein Zeichen umgeben, durch die optischen Zeichenerkennungsmittel (48) nicht unterscheidbar sind.
DE4202579A 1991-02-06 1992-01-30 System zur Bearbeitung von Dokumenten Expired - Fee Related DE4202579C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/651,581 US5335292A (en) 1988-12-21 1991-02-06 Document processing system and method

Publications (2)

Publication Number Publication Date
DE4202579A1 DE4202579A1 (de) 1992-08-13
DE4202579C2 true DE4202579C2 (de) 2001-03-08

Family

ID=24613417

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4202579A Expired - Fee Related DE4202579C2 (de) 1991-02-06 1992-01-30 System zur Bearbeitung von Dokumenten

Country Status (3)

Country Link
US (1) US5335292A (de)
JP (1) JPH05120480A (de)
DE (1) DE4202579C2 (de)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5905810A (en) 1990-02-05 1999-05-18 Cummins-Allison Corp. Automatic currency processing system
US5459797A (en) * 1991-03-30 1995-10-17 Kabushiki Kaisha Toshiba Character reading system
JP3258122B2 (ja) * 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
US6621922B2 (en) * 1993-07-30 2003-09-16 Canon Kabushiki Kaisha Image processing system and electronic apparatuses
US5530907A (en) * 1993-08-23 1996-06-25 Tcsi Corporation Modular networked image processing system and method therefor
US5592683A (en) * 1994-03-18 1997-01-07 Ibm Corporation System for selectively processing nested print commands and buffered post-print commands thereafter and resending selected portion of data stream upon error detection
US6363164B1 (en) 1996-05-13 2002-03-26 Cummins-Allison Corp. Automated document processing system using full image scanning
US6748101B1 (en) 1995-05-02 2004-06-08 Cummins-Allison Corp. Automatic currency processing system
US5982918A (en) 1995-05-02 1999-11-09 Cummins-Allison, Corp. Automatic funds processing system
JP2879800B2 (ja) * 1995-05-09 1999-04-05 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 電子走査ピクチャの背景除去方法
JP3018949B2 (ja) * 1995-08-10 2000-03-13 日本電気株式会社 文字読取装置およびその方法
US6661910B2 (en) 1997-04-14 2003-12-09 Cummins-Allison Corp. Network for transporting and processing images in real time
US8443958B2 (en) 1996-05-13 2013-05-21 Cummins-Allison Corp. Apparatus, system and method for coin exchange
US7903863B2 (en) 2001-09-27 2011-03-08 Cummins-Allison Corp. Currency bill tracking system
US7187795B2 (en) 2001-09-27 2007-03-06 Cummins-Allison Corp. Document processing system using full image scanning
US20050276458A1 (en) 2004-05-25 2005-12-15 Cummins-Allison Corp. Automated document processing system and method using image scanning
US8162125B1 (en) 1996-05-29 2012-04-24 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US6021883A (en) * 1996-11-25 2000-02-08 Cummins Allison, Corp. Funds processing system
US8478020B1 (en) 1996-11-27 2013-07-02 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US6018687A (en) * 1997-02-07 2000-01-25 Quad/Tech, Inc. Method and apparatus for printing cutoff control using prepress data
US6021220A (en) * 1997-02-11 2000-02-01 Silicon Biology, Inc. System and method for pattern recognition
US6039645A (en) 1997-06-24 2000-03-21 Cummins-Allison Corp. Software loading system for a coin sorter
US5940623A (en) 1997-08-01 1999-08-17 Cummins-Allison Corp. Software loading system for a coin wrapper
US6125200A (en) * 1997-12-16 2000-09-26 Adobe Systems Incorporated Removing non-text information from a color image
US6035058A (en) * 1998-02-10 2000-03-07 Eastman Kodak Company Automatic color dropout using luminance-chrominance space processing
US6212304B1 (en) * 1998-07-06 2001-04-03 Intel Corp. Method and apparatus for imaging processing
US6646761B1 (en) * 1998-08-12 2003-11-11 Texas Instruments Incorporated Efficient under color removal
DE19845996C2 (de) * 1998-10-06 2002-03-07 Cgk Comp Ges Konstanz Mbh Verfahren zum Bearbeiten von Bilddaten unter Auswertung eines Mustervordrucks
US6377703B1 (en) 1998-11-10 2002-04-23 Seiko Epson Corporation Apparatus and method for determining an area encompassing an image for scanning the image
US6637576B1 (en) 1999-04-28 2003-10-28 Cummins-Allison Corp. Currency processing machine with multiple internal coin receptacles
WO2000065546A1 (en) 1999-04-28 2000-11-02 Cummins-Allison Corp. Currency processing machine with multiple coin receptacles
MC2491A1 (fr) * 1999-06-21 1999-11-22 Stringa Luigi Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères
FR2803157B1 (fr) * 1999-12-22 2002-12-13 Sagem Procede d'analyse par scanner et appareil a scanner a determination automatique de la zone a analyser
US8701857B2 (en) 2000-02-11 2014-04-22 Cummins-Allison Corp. System and method for processing currency bills and tickets
US6778296B1 (en) 2000-03-27 2004-08-17 Destiny Technology Corporation Color imaging processing method with boundary detection and enhancement
US6750986B1 (en) 2000-03-27 2004-06-15 Destiny Technology Corporation Color image processing method with thin-line detection and enhancement
TW563345B (en) * 2001-03-15 2003-11-21 Canon Kk Image processing for correcting defects of read image
US6757426B2 (en) 2001-03-21 2004-06-29 Eastman Kodak Company System and method for image processing by automatic color dropout
US7647275B2 (en) 2001-07-05 2010-01-12 Cummins-Allison Corp. Automated payment system and method
US8428332B1 (en) 2001-09-27 2013-04-23 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8437530B1 (en) 2001-09-27 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8944234B1 (en) 2001-09-27 2015-02-03 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8433123B1 (en) 2001-09-27 2013-04-30 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8437529B1 (en) 2001-09-27 2013-05-07 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US6896118B2 (en) 2002-01-10 2005-05-24 Cummins-Allison Corp. Coin redemption system
US7747624B2 (en) * 2002-05-10 2010-06-29 Oracle International Corporation Data summarization
US7865371B2 (en) * 2002-05-10 2011-01-04 Shen Michael Y Management of information flow and workflow in medical imaging services
US8171567B1 (en) 2002-09-04 2012-05-01 Tracer Detection Technology Corp. Authentication method and system
US8627939B1 (en) 2002-09-25 2014-01-14 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
DE10311700A1 (de) * 2003-03-17 2004-10-07 Océ Document Technologies GmbH Verfahren und Einrichtung zum Verarbeiten der Farbinformation einer mit Störzeichen und Nutzzeichen versehenen Vorlage
US7536048B2 (en) * 2004-01-15 2009-05-19 Xerox Corporation Method and apparatus for automatically determining image foreground color
JP4603807B2 (ja) * 2004-03-10 2010-12-22 富士通株式会社 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
US7302094B2 (en) * 2004-08-27 2007-11-27 Autodesk, Inc. Transparency and/or color processing
US7946406B2 (en) 2005-11-12 2011-05-24 Cummins-Allison Corp. Coin processing device having a moveable coin receptacle station
US7980378B2 (en) 2006-03-23 2011-07-19 Cummins-Allison Corporation Systems, apparatus, and methods for currency processing control and redemption
US7929749B1 (en) 2006-09-25 2011-04-19 Cummins-Allison Corp. System and method for saving statistical data of currency bills in a currency processing device
EP1914978A3 (de) * 2006-10-19 2009-08-19 Murata Machinery Ltd. Bildverarbeitungsgerät und Bildverarbeitungsverfahren
US7853074B2 (en) * 2007-02-26 2010-12-14 Eastman Kodak Company Multi-color dropout for scanned document
CA2677714C (en) 2007-03-09 2014-12-23 Cummins-Allison Corp. Document imaging and processing system
US8417017B1 (en) 2007-03-09 2013-04-09 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8538123B1 (en) 2007-03-09 2013-09-17 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8401268B1 (en) 2007-03-09 2013-03-19 Cummins-Allison Corp. Optical imaging sensor for a document processing device
JP4305540B2 (ja) * 2007-03-22 2009-07-29 村田機械株式会社 画像処理装置
JP4470958B2 (ja) * 2007-05-01 2010-06-02 村田機械株式会社 画像処理装置
US8391583B1 (en) 2009-04-15 2013-03-05 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8929640B1 (en) 2009-04-15 2015-01-06 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8478019B1 (en) 2009-04-15 2013-07-02 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
US8804201B1 (en) 2012-04-04 2014-08-12 Banctec, Inc. System and method for characterizing a scanned image artifact and modifying a scanned image based thereon
US9141876B1 (en) 2013-02-22 2015-09-22 Cummins-Allison Corp. Apparatus and system for processing currency bills and financial documents and method for using the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3444517A (en) * 1965-03-09 1969-05-13 Control Data Corp Optical reading machine and specially prepared documents therefor
USRE29104E (en) * 1971-08-18 1977-01-04 Cognitronics Corporation Method of scanning documents to read characters thereon without interference from visible marks on the document which are not to be read by the scanner
DE3809025A1 (de) * 1987-03-20 1988-10-27 Fuji Xerox Co Ltd Bereichserkennungseinrichtung
EP0300046A1 (de) * 1987-01-27 1989-01-25 Konica Corporation Vorrichtung zur Verarbeitung von Halbton-Farbbildsignalen
EP0375090A2 (de) * 1988-12-21 1990-06-27 Recognition International Inc. System zur Dokumentenverarbeitung

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4488245A (en) * 1982-04-06 1984-12-11 Loge/Interpretation Systems Inc. Method and means for color detection and modification
US4547897A (en) * 1983-02-01 1985-10-15 Honeywell Inc. Image processing for part inspection
JP2677283B2 (ja) * 1984-06-14 1997-11-17 キヤノン株式会社 カラー画像処理装置
JPS6444675A (en) * 1987-08-13 1989-02-17 Toshiba Corp Picture processor
US5010580A (en) * 1989-08-25 1991-04-23 Hewlett-Packard Company Method and apparatus for extracting information from forms
US5014329A (en) * 1990-07-24 1991-05-07 Eastman Kodak Company Automatic detection and selection of a drop-out color using zone calibration in conjunction with optical character recognition of preprinted forms

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3444517A (en) * 1965-03-09 1969-05-13 Control Data Corp Optical reading machine and specially prepared documents therefor
USRE29104E (en) * 1971-08-18 1977-01-04 Cognitronics Corporation Method of scanning documents to read characters thereon without interference from visible marks on the document which are not to be read by the scanner
EP0300046A1 (de) * 1987-01-27 1989-01-25 Konica Corporation Vorrichtung zur Verarbeitung von Halbton-Farbbildsignalen
DE3809025A1 (de) * 1987-03-20 1988-10-27 Fuji Xerox Co Ltd Bereichserkennungseinrichtung
EP0375090A2 (de) * 1988-12-21 1990-06-27 Recognition International Inc. System zur Dokumentenverarbeitung

Also Published As

Publication number Publication date
JPH05120480A (ja) 1993-05-18
DE4202579A1 (de) 1992-08-13
US5335292A (en) 1994-08-02

Similar Documents

Publication Publication Date Title
DE4202579C2 (de) System zur Bearbeitung von Dokumenten
DE69727320T2 (de) Aufnahmeverfahren und gerät
CN101622631B (zh) 扫描文件的多色彩舍去
DE60023601T2 (de) Digitales Abbildungsverfahren und Vorrichtung zur Detektion von Dokumentsicherheitsmerkmalen
DE60036661T2 (de) Bildverarbeitungsvorrichtung und Bildeingabevorrichtung, die mit einer Datensy ntheseeinheit ausgestattet sind.
DE60118240T2 (de) Methode zur bildanalyse
DE60303202T2 (de) System und verfahren zum identifizieren und extrahieren von zeichenketten aus erfassten bilddaten
EP0692089B1 (de) Produktionsnahe farbkontrolle mit bildgebenden sensoren
US5003613A (en) Document processing system and method
DE19602129C2 (de) Verfahren zum Erzeugen eines Farbdokuments
DE19514618C2 (de) Farbkorrekturvorrichtung und -verfahren sowie Farbbildverarbeitungssystem mit einer solchen Vorrichtung
DE4012608A1 (de) Verfahren und vorrichtung zur bestimmung von passerdifferenzen an druckbildstellen eines mehrfarbenoffsetdruckes
DE60032413T2 (de) Automatisches Erkennen von Zeichen auf einem strukturierten Hintergrund durch Kombination der Hintergrundmodelle mit den Zeichen
EP0402868B1 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE2853511C2 (de) Verfahren und Vorrichtung zur Herstellung von Farbauszügen insbesondere für den Textildruck
DE2154902C2 (de) Verfahren und Vorrichtung zum Zusammenstellen einer farbigen Druckseite
DE10027737A1 (de) Digitaler Bildverarbeitungsapparat
DE102004012029B4 (de) Bilderfassungsvorrichtung, System mit derselben und Verfahren zum doppelseitigen Abtasten eines Objekts
DE4419395C2 (de) Verfahren und Einrichtung zur Analyse und Verarbeitung von Farbbildern
Perroud et al. Text extraction from color documents-clustering approaches in three and four dimensions
DE69835739T2 (de) Bestimmung der Lage und Orientierung einer Vielzahl von Objekten mittels einer intelligenten Bildeingangsplatte
EP0950310A1 (de) Verfahren zur bestimmung der geometriedaten von abtastvorlagen
DE2928740A1 (de) Verfahren zur aufnahme von optischer information
DE19700352A1 (de) Verfahren zur Bestimmung der Geometriedaten des relevanten Bildausschnitts
EP1223743B1 (de) Verfahren zur rasteradaptiven Kopierretusche

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: RECOGNITION INTERNATIONAL INC., IRVING, TEX., US

8127 New person/name/address of the applicant

Owner name: BANC TEC, INC.,, DALLAS, TEX., US

8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee