DE3887665T2 - Verfahren und Gerät für Zeichenerkennungssysteme. - Google Patents
Verfahren und Gerät für Zeichenerkennungssysteme.Info
- Publication number
- DE3887665T2 DE3887665T2 DE3887665T DE3887665T DE3887665T2 DE 3887665 T2 DE3887665 T2 DE 3887665T2 DE 3887665 T DE3887665 T DE 3887665T DE 3887665 T DE3887665 T DE 3887665T DE 3887665 T2 DE3887665 T2 DE 3887665T2
- Authority
- DE
- Germany
- Prior art keywords
- character
- logic
- rejection
- probability
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 4
- 230000007423 decrease Effects 0.000 claims description 2
- 230000032258 transport Effects 0.000 claims 5
- 238000012545 processing Methods 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 2
- 229920000298 Cellophane Polymers 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007728 cost analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/809—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Character Discrimination (AREA)
Description
- Diese Erfindung befaßt sich mit dem Gebiet der Zeichenerkennung und läßt sich insbesondere auf Magnetschrifterkennungssysteme (MICR-Systeme) zum Lesen von Schriftstücken anwenden, die mit Zeichen aus Magnettinte gedruckt sind.
- Bei der Bearbeitung von Schriftstücken, die mit Zeichen zur Magnetschrifterkennung (MICR) kodiert sind, hat man erkannt, daß es zur Erhöhung der Bearbeitungseffizienz wünschenswert ist, die Ablehnungsrate, d. h. die Häufigkeit, mit der der Lesekopf und die zugehörige Erkennungslogik ein Zeichen nicht mehr als gültigen Teil eines Zeichensatzes erkennen können, so weit wie möglich zu senken. Die Bearbeitung abgelehnter Zeichen erfordert manuelles Eingreifen, was die Betriebseffizienz verringert und die Kosten für die Bearbeitung des Schriftstücks erhöht. Um die Ablehnungsrate zu senken, wurde vorgeschlagen, Doppel-Lesesysteme zu verwenden, die üblicherweise zwei verschiedene Lesekopf typen mit unterschiedlichen Eigenschaften und Fähigkeiten bezüglich des Lesens von Zeichen einsetzen, so daß, falls der erste Kopf ein Zeichen nicht erkennen kann, die Erkennung des Zeichens durch einen zweiten Kopf zu einem erfolgreichen Lesen dieses Schriftstücks führen und somit die Ablehnungsrate senken würde. Ein solches Doppelkopf-Erkennungssystem wurde bisher einmal in der US-Patentschrift 3 938 089 vom 10. Februar 1976 offenbart.
- Ein Faktor, der von früheren Zeichenerkennungssystemen nicht berücksichtigt wurde, sind die beträchtlichen ökonomischen Folgen von abgelehnten und irrtümlich ersetzten Zeichen. Während die manuelle Bearbeitung von "abgelehnten Zeichen" die Effizienz senkt und die Kosten erhöht, ist es bei weitem kostspieliger, nicht entdeckte "irrtümlich ersetzte Zeichen" (d. h. die Erkennungslogik liest ein Zeichen nicht richtig und das richtige Zeichen wird durch ein falsches Zeichen ersetzt) zu korrigieren. Beispielsweise werden bei der Bearbeitung von Schecks die Schriftstücke, die mit nicht erkannten, irrtümlich ersetzten Zeichen das System durchlaufen, möglicherweise erst viel später entdeckt, zum Beispiel, nachdem der Scheck zu einer anderen Bank geschickt oder falsch auf ein Kundenkonto verbucht wurde. Zu diesem späteren Zeitpunkt ist eine Korrektur des Fehlers weitaus teurer. Es kann 50 bis 100 mal so teuer sein, ein irrtümlich ersetztes Zeichen von Hand zu korrigieren, als ein abgelehntes Zeichen zu korrigieren. Allerdings tritt das irrtümliche Ersetzen von Zeichen wesentlich seltener als Ablehnungen von Zeichen auf. Die vorliegende Erfindung beruht auf einer Betrachtung der ökonomischen Auswirkungen von irrtümlich ersetzten Zeichen und abgelehnten Zeichen, um eine größere Gesamteffizienz des Betriebs des Lesesystems für Schriftstücke zu gewähren. Wie aus der folgenden Erläuterung offensichtlich wird, verwendet die vorliegende Erfindung darüber hinaus einen neuartigen und etwas ungewöhnlichen Lösungsansatz, um diese Verbesserung der Gesamteffizienz zu erreichen.
- Die vorliegende Erfindung verwendet anspruchsgemäß ein Verfahren zur Auswahl zwischen den Ausgaben verschiedener Zeichenerkennungssysteme, um die Quote, mit der Zeichen erkannt werden, zu erhöhen, ohne dabei die Anzahl unerkannter Fehler (irrtümlich ersetzte Zeichen) wesentlich zu erhöhen. Falls das erste System ein Zeichen nicht erkennen kann, entscheidet ein Zufallsgenerator, ob die Ausgabe des zweiten Erkennungssystem verwendet wird oder ob statt dessen das Zeichen abgelehnt wird.
- Beispielsweise besitzt ein Magnetzeichen-Lesekopf mit mehreren Spalten, der durch Wechselstrom magnetisierte Zeichen liest, beim Lesen qualitativ hochwertig gedruckter Magnetzeichen eine sehr hohe Erkennungsquote, wobei das Wechselstromsystem jedoch manchmal das Zeichen nicht erkennen kann und anstelle des nicht erkannten Zeichens ein Ablehnungszeichen erzeugt. Falls die gleichen Zeichen durch ein Gleichstromfeld magnetisiert und von einem Ein-Spalt-Lesekopf gelesen werden, werden möglicherweise einige der abgelehnten Zeichen erkannt, wodurch vermieden wird, das Zeichen von Hand zu identifizieren. Das Gleichstromsystem kann zum Beispiel mit einem Zellophanstreifen oder dergleichen bedeckte Zeichen besser lesen. Falls das Wechselstromsystem ein Zeichen nicht erkennen kann und das Gleichstromsystem das Zeichen erkennt, besteht jedoch die Gefahr, daß sich das Gleichstromsystem in Wirklichkeit irrt und daß die Entscheidung für die Ausgabe des Gleichstromsystems zu einem nicht entdeckten Fehler durch ein irrtümlich ersetztes Zeichen führt. Die vorliegende Erfindung berücksichtigt die Möglichkeit, daß die Entscheidung für die Ausgabe des Gleichstromsystems anstelle eines vom Wechselstromsystem erzeugten Ablehnungszeichens zu einer Anzahl von nicht entdeckten Fehlern durch irrtümlich ersetzte Zeichen führt. Es kann 50 bis 100 mal so teuer sein, einen Fehler durch ein irrtümlich ersetztes Zeichen zu beheben, als für das abgelehnte Zeichen das richtige Zeichen zu finden. Somit kann es teurer sein, diese nicht entdeckten Fehler durch irrtümlich ersetzte Zeichen zu korrigieren, als selbst eine größere Anzahl vom Wechselstromsystem allein erzeugter, abgelehnter Zeichen zu berichtigen. Wenn das Wechselstromsystem bei guter Druckqualität der Zeichen ein Zeichen ablehnt, ist es wahrscheinlicher, daß eine nicht abgelehnte Ausgabe des Gleichstromsystems richtig ist. Bei schlechter Druckqualität andererseits sinkt die Wahrscheinlichkeit, daß die Gleichstromausgabe richtig ist, und da es sehr teuer ist, nicht entdeckte Fehler durch irrtümlich ersetzte Zeichen zu beheben, wäre in diesem Fall die Verwendung der Gleichstromausgabe sehr teuer. Das Verfahren der vorliegenden Erfindung wird diesen Faktoren dadurch gerecht, indem es ausschließlich die Ausgabe des Gleichstromsystems mit einer Wahrscheinlichkeit p verwendet, die von der Druckqualität und den Kosten für die Behebung von nicht entdeckten Fehlern durch irrtümliche ersetzte Zeichen abhängt. Die Wahrscheinlichkeit p kann im voraus festgelegt oder dynamisch aus der Ablehnungsquote eines oder beider Erkennungssysteme ermittelt werden. Die Verwendung einer Wahrscheinlichkeit relativiert sowohl die guten Ergebnisse, die man erhielte, wenn die Ausgabe des Gleichstromsystems bei gleichzeitiger Ablehnung durch das Wechselstromsystem tatsächlich richtig wäre, als auch die katastrophalen Ergebnisse, die sich ergeben, wenn eine größere Anzahl vom Wechselstromsystem abgelehnter Zeichen durch falsche Zeichen ersetzt werden.
- Entsprechend dem unabhängigen Anspruch 1 für das Gerät und seinen breitgefächerten Gesichtspunkten, besteht die Dokumenten- Lesemaschine der vorliegenden Erfindung aus
- einem ersten Zeichenlesesystem zum Lesen von Zeichen auf Schriftstücken;
- einem zweiten Zeichenlesesystem, das ebenfalls zum Lesen der Zeichen auf den Schriftstücken dient;
- einer ersten Zeichenerkennungslogik zur Erkennung von durch das erste System gelesenen Zeichen und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die erste Logik in regelmäßigen Abständen einen ersten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
- einer zweiten Zeichenerkennungslogik zur Erkennung von durch das zweite System gelesenen Zeichen und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die zweite Logik in regelmäßigen Abständen einen zweiten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
- gekennzeichnet durch
- eine Entscheidungslogik zur Auswahl einer der folgenden Möglichkeiten: ein Zeichen, das durch die erste Logik erkannt wurde, ein Ablehnungszeichen oder ein Zeichen, das durch die zweite Logik als das Zeichen erkannt wurde, das einem Zeichen auf dem Schriftstück am genauesten entspricht; und wobei die Entscheidungslogik eine Vorrichtung enthält, mit der im wesentlichen zufällig die von der zweiten Logik erzeugten Zeichen mit einer Wahrscheinlichkeit p ausgewählt werden, wenn die erste Logik das Ablehnungszeichen erzeugt, wobei p eine Wahrscheinlichkeit mit einem Wertebereich zwischen 0 und 1 ist; und
- eine Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit p.
- Nachdem einige der Möglichkeiten und Vorteile der Erfindung aufgeführt wurden, werden andere mit Fortschreiten der Beschreibung in Verbindung mit den begleitenden Zeichnungen offensichtlich, von denen
- Fig. 1 eine schematische Darstellung der Abfolge logischer Operationen in einem erfindungsgemäßen System zur Bearbeitung von Schecks ist;
- Fig. 2 ein Schaubild ist, das die Beziehung zwischen den Kosten fehlerhafter Lesevorgänge und den Gesamtkosten, ausgedrückt als Zahl der Ablehnungen, veranschaulicht;
- Fig. 3 ein Schaubild ist, das die Auswirkung von Änderungen der Ablehnungsquote auf die Gesamtkosten, ausgedrückt als Zahl der Ablehnungen, ist.
- Die der vorliegenden Erfindung zugrundeliegende Theorie und deren praktischer wirtschaftlicher Wert wird aus der folgenden, näheren Beschreibung vollständiger verständlich, die erstens eine Erläuterung der Entwicklung der Vergleichskostenanalyse und Vergleichskostengleichung und zweitens ein Beispiel für die Anwendung dieser Prinzipien auf tatsächliche Daten aus einem Vorgang zur Bearbeitung von Schriftstücken enthält.
- Die in der vorliegenden Erfindung beteiligten logischen Operationen werden in Fig. 1 veranschaulicht. Die zu bearbeitenden Schriftstücke, bezeichnet als D, werden zuerst von einem ersten Zeichenlesesystem, bezeichnet als 10, und dessen zugehöriger Zeichenerkennungslogik, bezeichnet als 11, bearbeitet. Ein Wechselstromlesesystem wird aufgrund seiner unter den meisten Umständen größeren Gesamtgenauigkeit als erstes Lesesystem bevorzugt. Schriftstücke, deren Magnetzeichen erfolgreich erkannt wurden, werden durch den Pfeil 20 dargestellt und als "gute Schriftstücke" bezeichnet, während Schriftstücke, die aufgrund vom ersten Lesesystem nicht erkannter Zeichen abgelehnte Zeichen enthalten, durch den Pfeil 22 dargestellt und als "Ablehnungen" bezeichnet werden. Die vom ersten Lesesystem ausgehenden Ablehnungen werden von einer Entscheidungslogik 30 bearbeitet, die darüber entscheidet, ob das Schriftstück durch ein zweites Lesesystem 40 bearbeitet wird oder ob das Schriftstück als Ablehnung eingestuft wird, wie es Pfeil 31 anzeigt, und in einen Behälter 33 für abgelehnte Schriftstücke geleitet wird. Diese als Ablehnung eingestuften und im Behälter 33 für abgelehnte Schriftstücke abgelegten Schriftstücke machen für die Erkennung der gedruckten Zeichen eine Bearbeitung von Hand erforderlich.
- Jene Schriftstücke, die mit der Nummer 32 bezeichnet sind und die für die Bearbeitung durch das zweite Lesesystem akzeptiert wurden, werden dann vom zweiten Lesesystem 40 und dessen zugehöriger Erkennungslogik 41 gelesen. Wenn die Zeichen des Schriftstücks erfolgreich erkannt werden, wird es als "gutes Schriftstück" eingestuft und zum Behälter 18 für gute Schriftstücke weitergeleitet, was durch den Pfeil 42 angedeutet wird. Jene Schriftstücke, die das zweite Lesesystem 40 nicht erfolgreich erkennt, werden als Ablehnung eingestuft und in den Behälter 33 für abgelehnte Schriftstücke weitergeleitet, wie dies Pfeil 43 anzeigt, damit sie dort von Hand bearbeitet werden.
- Während des Betriebs der Entscheidungslogik 30 wird die Entscheidung, ob das Schriftstück sofort als Ablehnung eingestuft wird oder ob es für die weitere Bearbeitung durch ein zweites Lesesystem 40 akzeptiert wird, im wesentlichen durch die zufällige Entscheidung eines Zufallsgenerators bestimmt. Der Wahrscheinlichkeitsparameter p steht für die Wahrscheinlichkeit, mit der ein Schriftstück akzeptiert wird, wobei p eine Zahl zwischen 0 und 1 ist. Bei einer Wahrscheinlichkeit von 0 werden keine Schriftstücke über den Pfeil 32 für die Bearbeitung durch das zweite Lesesystem 40 akzeptiert, und alle durch die Entscheidungslogik 30 bearbeiteten Schriftstücke 22 würden als Ablehnungen 31 eingestuft werden. Bei einer Wahrscheinlichkeit von eins würden andererseits alle Schriftstücke 22 über den Pfeil 32 durch das zweite Lesesystem 40 bearbeitet werden, und kein Schriftstück würde als Ablehnung bei Pfeil 31 eingestuft werden.
- Dabei wird in Kauf genommen, daß sich unter denen Schriftstücken, die über Pfeil 20 das Magazin 18 für gute Schriftstücke erreichen, nicht nur richtig identifizierte Schriftstücke befinden, sondern daß darunter auch eine gewisse Anzahl von Schriftstücken mit nicht entdeckten Fehlern durch irrtümliche Ersetzung ist, die vom ersten Lesesystem herrühren. In ähnlicher Weise werden jene mit 42 bezeichneten Schriftstücke, die vom zweiten Lesesystem erfolgreich gelesen wurden, nicht nur gute Schriftstücke enthalten, sondern auch eine gewisse Anzahl von Schriftstücken mit nicht entdeckten Fehlern durch irrtümliche Ersetzung, die vom zweiten Lesesystem herrühren. Da das zweite Lesesystem nur Schriftstücke schlechter Qualität liest, die das erste Lesesystem 10 nicht lesen konnte, besteht eine höhere Wahrscheinlichkeit dafür, daß nicht entdeckte Fehler durch irrtümliche Ersetzung vom zweiten Lesesystem 40 herrühren als vom ersten Lesesystem.
- Eine Gleichung für die Gesamtkosten, ausgedrückt als Zahl der Ablehnungen, kann folgendermaßen abgeleitet werden, wobei D die Gesamtzahl der Schriftstücke ist;
- RRx die Ablehnungsquote des Lesesystem x ist;
- SRx die Ersetzungsquote des Lesesystem x ist;
- Rx die Gesamtzahl der Ablehnungen des Systems x ist;
- Sx die Gesamtzahl der Ersetzungen des Systems x ist; und
- p die Wahrscheinlichkeit dafür ist, daß ein Schriftstück akzeptiert wird.
- Die Anzahl der Ablehnungen durch das System 1 (R&sub1;), die die Entscheidungslogik 30 erreichen, kann durch die Beziehung
- R&sub1; = D · RR&sub1;
- wiedergegeben werden. Die Gesamtzahl der Ablehnungen Rt kann durch die Summe der vom zweiten Lesesystem 40 erzeugten Ablehnungen (Pfeil 43) und der von der Entscheidungslogik als Ablehnung eingestuften Schriftstücke (Pfeil 31) ermittelt werden. Dies kann wie folgt wiedergegeben werden:
- Rt = p (R&sub1; · RR&sub2;) + (1-p) R&sub1;
- Die Gesamtzahl der Ersetzungen St kann folgendermaßen definiert werden:
- S&sub1; = D · SR&sub1;
- St = S&sub1; + p (R&sub1; · SR&sub2;)
- Wenn man das Kostenverhältnis falscher Lesevorgänge kennt, können dann die Gesamtkosten der falschen Lesevorgänge ermittelt werden. Das Kostenverhältnis F falscher Lesevorgänge gibt das Verhältnis zwischen den Kosten einer irrtümlichen Ersetzung und den Kosten einer Ablehnung wieder. Damit können die Gesamtkosten (ausgedrückt als Zahl der Ablehnungen) wie folgt definiert werden:
- Kosten = Rt + F · St
- Fig. 2 zeigt grafisch die Anwendung dieser Gleichung auf die Grenzfälle mit p gleich 0 und p gleich 1 sowie einen Fall dazwischen, wo p gleich 0,5 ist. In diesem Beispiel wurden folgende Konstanten verwendet: D = 1 000 000; RR&sub1; = 0,01; SR&sub1; = 0,000005; RR&sub2; = 0,25 und SR&sub2; = 0,01. Dieser Kurve läßt sich entnehmen, daß die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 1 auftreten, wenn das Kostenverhältnis F falscher Lesevorgänge von 0 auf 75 steigt. Oberhalb eines Kostenverhältnisses falscher Lesevorgänge von 75 ergeben sich die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 0.
- Das folgende Beispiel veranschaulicht die wirtschaftlichen Auswirkungen der Anwendung der Prinzipien aus vorliegender Erfindung auf eine spezielle Situation. Die nachfolgende Tabelle l zeigt die Verteilung der Ablehnungsquoten und Ersetzungsquoten, die sich aus einem tatsächlich durchgeführten Testlauf für eine Million Schriftstücken ergaben. Im Bereich der aufgetretenen Ablehnungsquoten stellt die Zahl der Schriftstücke im wesentlichen eine Normalverteilungskurve dar. Tabelle 1
- Die Kosten, ausgedrückt als Zahl der Ablehnungen, wurde mit Hilfe der oben abgeleiteten Gleichung über den Wertebereich der aufgetretenen Ablehnungsquoten berechnet, wobei für Beispielzwecke ein Kostenverhältnis (F) falscher Lesevorgänge von 50 verwendet wurde. Fig. 3 ist ein Schaubild der Daten aus Tabelle 1, das die Beziehung der Kosten, ausgedrückt als Zahl der Ablehnungen, zur Ablehnungsquote (RR&sub1;) des ersten Lesesystems bei Wahrscheinlichkeiten von P = 0, 0,5 und 1 zeigt. Es ist zu erkennen, daß sich die drei Kurven bei einer Ablehnungsquote von etwa 0,013 schneiden. Wenn sich die Ablehnungsrate unterhalb dieses Werts befindet, erhält man die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 1, d. h. wenn alle Ablehnungen des Systems 1 akzeptiert werden. Bei einer Ablehnungsquote über ungefähr 0,013 erhält man die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 0, d. h. wenn das zweite Lesesystem keines der vom System 1 abgelehnten Schriftstücke liest und alle als Ablehnungen einstuft. Offensichtlich ändert sich die in Fig. 3 gezeigte spezielle Beziehung, wenn sich das Kostenverhältnis F falscher Lesevorgänge und die spezielle Ablehnungsquote bei gegebenen Bedingungen ändert. Beispielsweise kann sich die Ablehnungsquote in Abhängigkeit von Faktoren wie der geographischen Herkunft der Schriftstücke, dem speziellen Industriezweig, aus dem die Schriftstücke stammen, der speziellen Art des bearbeiteten Schriftstücks (z. B. Travellerschecks, privat ausgestellte Schecks, geschäftlich ausgestellte Schecks usw.) und sogar in Abhängigkeit von Änderungen der Jahreszeit oder des Wetters ändern. Daher kann die optimale Wahrscheinlichkeit p für ein gegebenes System stark schwanken.
- In einem vergleichsweise einfachen und unkomplizierten Anwendungsbeispiel für die vorliegende Erfindung kann die Wahrscheinlichkeit p von Hand festgelegt und korrigiert werden, wenn eine Änderung der Bedingungen dies erfordert. Bei einer ausgeklügelteren Anwendung der vorliegende Erfindung wird die Ablehnungsquote überwacht, und der Wert der Wahrscheinlichkeit p wird in Abhängigkeit von den Änderungen der aufgetretenen Ablehnungsquote angepaßt. Bezugnehmend auf die Zeichnung in Fig. 3 kann es daher zum Beispiel wünschenswert sein, die Wahrscheinlichkeit anfangs gleich 1 zu setzen und diesen Wert so lange beizubehalten, bis die Ablehnungsquote des Systems einen ersten, vorgegebenen Wert überschreitet. Unter besonderer Berücksichtigung der Fig. 3 könnte man für diesen vorgegebenen Wert zum Beispiel eine Ablehnungsquote von 0,012 wählen. Wenn dann die Ablehnungsquote weiter steigt, würde der Wert für die Wahrscheinlichkeit p so lange erniedrigt werden, bis die Ablehnungsquote einen zweiten, vorgegebenen Wert erreicht (z. B. 0,014 in unserem Beispiel aus Fig. 3), an dem die Wahrscheinlichkeit dann auf 0 gesetzt werden würde. Der für die Wahrscheinlichkeit p gesetzte Wert kann auch von anderen Variablen oder Faktoren abhängig gemacht werden, zum Beispiel von der Ablehnungsquote des zweiten Lesesystems.
Claims (10)
1. Dokumenten-Lesegerät mit
einem ersten Zeichenlesesystem zum Lesen von Zeichen auf
einem Schriftstück;
einem zweiten Zeichenlesesystem, das ebenfalls zum Lesen der
Zeichen auf den Schriftstücken dient;
einer ersten Zeichenerkennungslogik zur Erkennung von durch
das erste System gelesenen Zeichen und zur Erzeugung eines
Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden
kann, wobei die erste Logik in regelmäßigen Abständen einen
ersten, nicht erkannten Fehler durch irrtümliches Erkennen
eines Zeichens anstelle der Erzeugung eines
Ablehnungszeichens erzeugt;
einer zweiten Zeichenerkennungslogik zur Erkennung von durch
das zweite System gelesenen Zeichen und zur Erzeugung eines
Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden
kann, wobei die zweite Logik in regelmäßigen Abständen einen
zweiten, nicht erkannten Fehler durch irrtümliches Erkennen
eines Zeichens anstelle der Erzeugung eines
Ablehnungszeichens erzeugt;
gekennzeichnet durch
eine Entscheidungslogik zur Auswahl einer der folgenden
Möglichkeiten: ein Zeichen, das durch die erste Logik
erkannt wurde, ein Ablehnungszeichen oder ein Zeichen, das
durch die zweite Logik als das Zeichen erkannt wurde, das
einem Zeichen auf dem Schriftstück am genauesten entspricht;
und wobei die Entscheidungslogik eine Vorrichtung enthält,
mit der im wesentlichen zufällig die von der zweiten Logik
erzeugten Zeichen mit einer Wahrscheinlichkeit p ausgewählt
werden, wenn die erste Logik das Ablehnungszeichen erzeugt,
wobei p eine Wahrscheinlichkeit mit einem Wertebereich
zwischen 0 und 1 ist; und
eine Vorrichtung zur Festsetzung des Werts der
Wahrscheinlichkeit p.
2. Dokumenten-Lesegerät nach Anspruch 1, wobei die Vorrichtung
zur Festsetzung des Werts der Wahrscheinlichkeit eine
Vorrichtung zur manuellen Eingabe eines Werts für die
Wahrscheinlichkeit p enthält.
3. Dokumenten-Lesegerät nach Anspruch 1, wobei die Vorrichtung
zur Festsetzung des Werts der Wahrscheinlichkeit eine
Regeleinheit enthält, die auf eine Veränderung der
Ablehnungsquote der ersten oder zweiten Erkennungslogik reagiert, um
den Wert der Wahrscheinlichkeit p zu ändern.
4. Dokumenten-Lesegerät nach Anspruch 1, wobei die Vorrichtung
zur Festsetzung des Werts der Wahrscheinlichkeit eine
Regeleinheit enthält, die während des Lesens der Zeichen in den
Schriftstücken die Quote überwacht, mit der
Ablehnungszeichen vom ersten System erzeugt werden, und die die
Wahrscheinlichkeit p in Abhängigkeit von einem vorgegebenen
Anstieg der Quote erniedrigt.
5. Dokumenten-Lesegerät nach Anspruch 4, wobei die Regeleinheit
die Wahrscheinlichkeit p anfangs auf eins setzt und die
Wahrscheinlichkeit p erst dann erniedrigt, wenn die Quote
einen ersten, vorgegebenen Wert überschritten hat.
6. Dokumenten-Lesegerät nach Anspruch 5, wobei die Regeleinheit
die Wahrscheinlichkeit p auf Null setzt, wenn die Quote
einen zweiten, vorgegebenen Wert überschritten hat.
7. Dokumenten-Lesegerät, bestehend aus
einer Dokumenten-Transportvorrichtung, die eine Vielzahl von
Schriftstücken, die mit Magnetschrift kodiert sind, von
einem Dokumenten-Magazin zu einem Dokumenten-Ablagefach
befördert,
einem ersten Zeichenlesesystem, das einen Wechselstrom-
Magnetschrift-Lesekopf enthält, der neben der
Transportvorrichtung angebracht ist und die Magnetschrift auf den
Schriftstücken liest, die durch die Transportvorrichtung
befördert werden,
einem zweiten Zeichenlesesystem, das einen Gleichstrom-
Magnetschrift-Lesekopf enthält, der neben der
Transportvorrichtung zwischen dem ersten System und dem Ablagefach
angebracht ist und ebenfalls die Magnetschrift auf den
Schriftstücken liest,
einer ersten Zeichenerkennungslogik zur Erkennung von durch
das erste System gelesener Magnetschrift und zur Erzeugung
eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt
werden kann, wobei die erste Logik in regelmäßigen Abständen
einen ersten, nicht erkannten Fehler durch irrtümliches
Erkennen eines Zeichens anstelle der Erzeugung eines
Ablehnungszeichens erzeugt;
einer zweiten Zeichenerkennungslogik zur Erkennung von durch
das zweite System gelesener Magnetschrift und zur Erzeugung
eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt
werden kann, wobei die zweite Logik in regelmäßigen
Abständen einen zweiten, nicht erkannten Fehler durch irrtümliches
Erkennen eines Zeichens anstelle der Erzeugung eines
Ablehnungszeichens erzeugt;
gekennzeichnet durch
eine Entscheidungslogik zur Auswahl einer der folgenden
Möglichkeiten: ein Zeichen, das durch die erste Logik
erkannt wurde, ein Ablehnungszeichen oder ein Zeichen, das
durch die zweite Logik als das Zeichen erkannt wurde, das
einem Zeichen auf dem Schriftstück am genauesten entspricht;
und wobei die Entscheidungslogik eine Vorrichtung enthält,
mit der im wesentlichen zufällig die von der zweiten Logik
erzeugten Zeichen mit einer Wahrscheinlichkeit p ausgewählt
werden, wenn die erste Logik das Ablehnungszeichen erzeugt,
wobei p eine Wahrscheinlichkeit mit einem Wertebereich
zwischen 0 und 1 ist; und
eine Vorrichtung zur Festsetzung des Werts der
Wahrscheinlichkeit p.
8. Dokumenten-Lesegerät nach Anspruch 7, wobei die Vorrichtung
zur Festsetzung des Wertes für die Wahrscheinlichkeit eine
Regeleinheit enthält, die auf eine Veränderung der
Ablehnungsquote der ersten oder zweiten Erkennungslogik reagiert,
um den Wert der Wahrscheinlichkeit p zu ändern.
9. Verfahren zum Lesen von Zeichen auf Schriftstücken, in dem
die Zeichen von einem ersten und zweiten Lesesystem gelesen
werden, zu denen jeweils ein erstes und zweites
Erkennungssystem gehört, die entweder ein Zeichen erkennen oder ein
Ablehnungszeichen erzeugen, wenn ein Zeichen nicht erkannt
werden kann, und in denen in regelmäßigen Abständen ein
nicht erkannter Fehler durch irrtümliches Erkennen eines
Zeichens anstelle der Erzeugung eines Ablehnungszeichens
erzeugt wird, dadurch gekennzeichnet, daß sie das Zeichen,
das dem Zeichen auf dem Schriftstück am genauesten
entspricht, im wesentlichen zufällig auswählen, wobei dieses
Zeichen durch das zweite Erkennungssystem erzeugt wird, wenn
das erste Erkennungssystem ein Ablehnungszeichen erzeugt.
10. Anwendung nach Anspruch 9 mit einer Stufe zur Veränderung
der Wahrscheinlichkeit dafür, daß als Reaktion auf eine
Veränderung der Ablehnungsquote des ersten Erkennungssystem
zufällig das vom zweiten Erkennungssystem erzeugte Zeichen
gewählt wird.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/134,729 US4876735A (en) | 1987-12-18 | 1987-12-18 | Method and apparatus for character recognition systems |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3887665D1 DE3887665D1 (de) | 1994-03-17 |
DE3887665T2 true DE3887665T2 (de) | 1994-08-18 |
Family
ID=22464719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE3887665T Expired - Fee Related DE3887665T2 (de) | 1987-12-18 | 1988-11-22 | Verfahren und Gerät für Zeichenerkennungssysteme. |
Country Status (4)
Country | Link |
---|---|
US (1) | US4876735A (de) |
EP (1) | EP0320663B1 (de) |
JP (1) | JPH07120383B2 (de) |
DE (1) | DE3887665T2 (de) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265174A (en) * | 1989-03-03 | 1993-11-23 | Canon Kabushiki Kaisha | Pattern recognition apparatus |
US5257323A (en) * | 1991-05-29 | 1993-10-26 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
US6179484B1 (en) | 1991-07-18 | 2001-01-30 | International Business Machines Corp. | Two-pass document image processing method and system |
US5875261A (en) * | 1991-12-20 | 1999-02-23 | International Business Machines Corporation | Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing |
TW222337B (de) * | 1992-09-02 | 1994-04-11 | Motorola Inc | |
US5455872A (en) * | 1993-04-26 | 1995-10-03 | International Business Machines Corporation | System and method for enhanced character recogngition accuracy by adaptive probability weighting |
US5519786A (en) * | 1994-08-09 | 1996-05-21 | Trw Inc. | Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems |
US5805747A (en) * | 1994-10-04 | 1998-09-08 | Science Applications International Corporation | Apparatus and method for OCR character and confidence determination using multiple OCR devices |
US6181837B1 (en) * | 1994-11-18 | 2001-01-30 | The Chase Manhattan Bank, N.A. | Electronic check image storage and retrieval system |
US6091952A (en) * | 1996-08-30 | 2000-07-18 | Nortel Networks Corporation | Distributed subscriber data management in wireless networks from a central perspective |
US5881172A (en) * | 1996-12-09 | 1999-03-09 | Mitek Systems, Inc. | Hierarchical character recognition system |
US6243504B1 (en) * | 1998-08-19 | 2001-06-05 | International Business Machines Corporation | Integrated magnetic ink character recognition system and method therefor |
DE10034629A1 (de) * | 1999-08-11 | 2001-03-22 | Ibm | Verfahren und System zum Verzahnen von OCR und ABL zur automatischen Postsortierung |
US6654487B1 (en) * | 2000-03-03 | 2003-11-25 | Charles H. Downs, Jr. | Character recognition, including method and system for processing checks with invalidated MICR lines |
US7120302B1 (en) | 2000-07-31 | 2006-10-10 | Raf Technology, Inc. | Method for improving the accuracy of character recognition processes |
US7295694B2 (en) * | 2002-02-22 | 2007-11-13 | International Business Machines Corporation | MICR-based optical character recognition system and method |
US7379978B2 (en) * | 2002-07-19 | 2008-05-27 | Fiserv Incorporated | Electronic item management and archival system and method of operating the same |
US20050144189A1 (en) * | 2002-07-19 | 2005-06-30 | Keay Edwards | Electronic item management and archival system and method of operating the same |
US20050094861A1 (en) * | 2003-10-31 | 2005-05-05 | International Business Machines Corporation | Positional synchronization in a multivoting character recognition environment |
US7480403B2 (en) * | 2004-11-16 | 2009-01-20 | International Business Machines Corporation | Apparatus, system, and method for fraud detection using multiple scan technologies |
US20070133859A1 (en) * | 2005-10-28 | 2007-06-14 | Imaging Business Machines, Llc | Methods and systems for reading magnetic ink character recognition information |
US8023718B1 (en) * | 2007-01-16 | 2011-09-20 | Burroughs Payment Systems, Inc. | Method and system for linking front and rear images in a document reader/imager |
US8023717B1 (en) * | 2007-01-16 | 2011-09-20 | Burroughs Payment Systems, Inc. | Method and system for processing backwards documents in a document reader/imager |
US8055104B2 (en) * | 2007-03-02 | 2011-11-08 | Adi, Llc | Process performance evaluation for Enterprise data systems |
WO2010032335A1 (ja) * | 2008-09-22 | 2010-03-25 | グローリー株式会社 | 紙葉類管理装置、紙葉類管理方法及び紙葉類管理プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US31692A (en) * | 1861-03-12 | Improvement in mowing-machines | ||
US3641495A (en) * | 1966-08-31 | 1972-02-08 | Nippon Electric Co | Character recognition system having a rejected character recognition capability |
US3496543A (en) * | 1967-01-27 | 1970-02-17 | Singer General Precision | On-line read/copy data processing system accepting printed and graphic material |
US3764978A (en) * | 1972-05-02 | 1973-10-09 | Optical Recognition Systems | Combined magnetic optical character reader |
USRE31692E (en) | 1972-05-02 | 1984-10-02 | Optical Recognition Systems, Inc. | Combined magnetic optical character reader |
US4032887A (en) * | 1973-06-28 | 1977-06-28 | International Business Machines Corporation | Pattern-recognition systems having selectively alterable reject/substitution characteristics |
US3876981A (en) * | 1973-08-28 | 1975-04-08 | Optical Recognition Systems | Method and system for combining magnetically and optically derived signals to recognize characters |
US3938089A (en) * | 1974-02-25 | 1976-02-10 | Burroughs Corporation | Double read system for character recognition systems |
-
1987
- 1987-12-18 US US07/134,729 patent/US4876735A/en not_active Expired - Fee Related
-
1988
- 1988-11-17 JP JP63289033A patent/JPH07120383B2/ja not_active Expired - Lifetime
- 1988-11-22 EP EP88119405A patent/EP0320663B1/de not_active Expired - Lifetime
- 1988-11-22 DE DE3887665T patent/DE3887665T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH07120383B2 (ja) | 1995-12-20 |
DE3887665D1 (de) | 1994-03-17 |
EP0320663B1 (de) | 1994-02-02 |
EP0320663A3 (de) | 1991-10-23 |
EP0320663A2 (de) | 1989-06-21 |
US4876735A (en) | 1989-10-24 |
JPH01171081A (ja) | 1989-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3887665T2 (de) | Verfahren und Gerät für Zeichenerkennungssysteme. | |
DE2541204C3 (de) | Einrichtung zur Fehlerkorrektur | |
DE3851867T2 (de) | Zeichenerkennungsgerät. | |
DE69022784T2 (de) | Verfahren und Systeme zur Unterschriftprüfung mit Optimierung statischer Parameter. | |
DE69515461T2 (de) | Simplifiziertes strichkodedekodierverfahren | |
DE69521040T2 (de) | Verfahren und vorrichtung zum dekodieren von balkencodebildern mittels informationen aus vorhergehenden abtastzeilen | |
DE2523112C2 (de) | Vorrichtung zum Bearbeitung von Daten tragenden Schriftstücken | |
DE69619147T2 (de) | Streifenkodekodierungssystem mit Vierzustandskoden | |
DE3322663A1 (de) | Verfahren zur blatterkennung | |
DE3486241T2 (de) | Gerät und Verfahren zur Zeichenabstandsbestimmung für optische Zeichenerkennungssysteme. | |
EP0067244A2 (de) | Verfahren zum automatischen Erkennen von Weissblöcken sowie Text-, Graphik- und/oder Graubildbereichen auf Druckvorlagen | |
DE69926280T2 (de) | Verfahren zur Erkennung von Adressen und Briefverarbeitungsvorrichtung | |
DE69331518T2 (de) | Neuronales Netz zum Vergleich von Merkmalen von Bildmustern | |
DE3322443A1 (de) | Mustererkennungsvorrichtung | |
DE69029417T2 (de) | Erkennungssystem für Zeichen mit magnetischer Tinte | |
DE2435889A1 (de) | Verfahren und einrichtung zum unterscheiden von zeichengruppen | |
WO2000010113A1 (de) | Verfahren und vorrichtung zum bearbeiten von an den absender zurückzuschickenden sendungen | |
EP1918104A2 (de) | Verfahren zum Prüfen eines Aufdrucks und Aufdruckprüfvorrichtung | |
DE4407998C2 (de) | Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg | |
WO2008071784A1 (de) | Verfahren und vorrichtung zur steuerung des transports von gegenständen sowie anordnung zum transport mehrerer gegenstände | |
DE69928320T2 (de) | Verfahren und Vorrichtung zur Erkennung eines Musters auf einem präsentierten Gegenstand | |
WO2002023492A2 (de) | Verfahren zur klassifizierung von dokumenten | |
WO2003079273A2 (de) | Verfahren und vorrichtung zum lesen der adressen von sendungen | |
DE2026033C3 (de) | Rasterverfahren zur Klassifizierung von Schriftzeichen | |
EP0707279B1 (de) | Mustererkennungsverfahren mit Kalibrierung der Lernfähigkeit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |