DE3406694C2 - - Google Patents

Info

Publication number
DE3406694C2
DE3406694C2 DE3406694A DE3406694A DE3406694C2 DE 3406694 C2 DE3406694 C2 DE 3406694C2 DE 3406694 A DE3406694 A DE 3406694A DE 3406694 A DE3406694 A DE 3406694A DE 3406694 C2 DE3406694 C2 DE 3406694C2
Authority
DE
Germany
Prior art keywords
character
characters
read
values
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE3406694A
Other languages
English (en)
Other versions
DE3406694A1 (de
Inventor
Werner Dipl.-Ing. 8901 Leitershofen De Gleich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KLEINDIENST DATENTECHNIK GMBH, 8900 AUGSBURG, DE
Original Assignee
Kleindienst GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kleindienst GmbH and Co KG filed Critical Kleindienst GmbH and Co KG
Priority to DE19843406694 priority Critical patent/DE3406694A1/de
Publication of DE3406694A1 publication Critical patent/DE3406694A1/de
Application granted granted Critical
Publication of DE3406694C2 publication Critical patent/DE3406694C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors

Description

Die Erfindung betrifft ein Verfahren zum maschinellen Lesen nach dem Oberbegriff des Patentanspruches 1 und eine Vorrichtung zur Durchführung des Verfahrens nach dem Oberbegriff des Patentanspruches 2.
Das Verfahren dient zum Auffinden und Erkennen von Zeichen einer Schrift auf Belegen oder dgl. mit einem Lesegerät, das für jedes von einem Sensor bei Bewegung längs einer Lesezeile abgetasteten Zeichen eine für dieses Zeichen charakteristische Funktion der Zeit bzw. des Ortes auf der Lesezeile, also eine zeitliche Folge von Funktionswerten, z. B. von Ordinatenwerten oder von unterschiedlichen Amplitudenabständen oder Impulsbreiten, als Ausgangssignal liefert. Bei diesem Verfahren werden die gelesenen, also abgetasteten Zeichen in einem Speicher in Form einer für das Zeichen charakteristischen Kurve bzw. Funktion gespeichert, wobei die aufeinanderfolgenden Adressen des Speichers, in denen die Funktionswerte enthalten sind, der Abszissenachse (Zeit oder Ort auf der Lesezeile) entsprechen. Zur Erkennung des gelesenen Zeichens wird bei diesem Verfahren aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen Funktionswerten des Zeichens eine für dieses Zeichen charakteristische Merkmalkombination gebildet, und diese aus den gemessenen Istwerten des gelesenen Zeichens gebildete Merkmalskombination wird dann nacheinander jeweils mit jeder von entsprechenden, äquivalenten Kombinationen von zuvor festgelegten, in einem weiteren Speicher bereitgehalten und für jedes Zeichen der zu lesenden Schrift bzw. Schriftart charakteristischen Sollwerten der Merkmale verglichen, und dann wird festgestellt, mit welcher der Sollwert-Merkmalskombinationen eines der Schriftzeichen die Istwertmerkmalskombination des gelesenen Zeichens am besten übereinstimmt.
Solche Verfahren und Vorrichtungen zum maschinellen Lesen von auf Belegen und dgl. aufgebrachten Zeichen durch Abtasten und Klassifizieren entsprechend den vorgegebenen Mustern- oder Prüfzeichen der fraglichen Schrift, sind bereits bekannt. So wird beispielsweise in der DE-OS 23 61 899 auf ein System zum Auffinden und Erkennen von Zeichen auf Belegen hingewiesen, bei dem die Zeichen bzw. Daten zunächst abgetastet werden, zwischengespeichert werden und dann über ein Zeichenerkennungssystem klassifiziert und ausgewertet werden, wodurch die gelesenen Zeichen bzw. Daten tatsächlich erkannt werden.
Bei einer Einrichtung gemäß der DE-OS 30 13 833 wird ein auf einem Gegenstand aufgebrachtes Muster schrittweise an einer Prüfeinrichtung vorbeibewegt, wobei jeweils Informationen über Teilmuster, die dem zu prüfenden Muster entsprechen, gewonnen werden, die dann in einem weiteren Arbeitsschritt mit weiteren Informationen, die ein vorbestimmtes Standardmuster darstellen, verglichen werden, um den Parameter zu ermitteln, der das Ausmaß der Fehlerhaftigkeit der betreffenden Teilmuster anzeigt. In einem dritten Arbeitsschritt werden die während des zweiten Arbeitsschrittes gewonnen Parameter mit einem vorher eingestellten Schwellenwert zur Beurteilung der Richtigkeit des zu prüfenden Musters verglichen.
Bei einer ähnlich arbeitenden Musterlagen- Erkennungsvorrichtung wird das Bild eines Musters auf einem Chip mit einer Fernsehkamera aufgenommen und gespeichert. Es werden einzelne Musterbereiche, die kleiner als das zu untersuchende Muster sind, jeweils als Musterdaten aus dem Speicher ausgelesen und die jeweils ausgelesenen Musterbereichsdaten mit entsprechenden Bezugsmusterdaten eines Bezugsmusters verglichen, wobei die jeweiligen Koinzidenzgrade zwischen dem Musterbereich und dem Bezugsmuster berechnet werden. Nach der Bestimmung der Koinzidenzgrade für das gesamte Muster wird nach Maßgabe der Speicheradresse die Lage oder Position des Musterbereiches mit dem höchsten dieser Koinzidenzgrade bestimmt.
Derartige Verfahren und Vorrichtungen haben jedoch den Nachteil, daß durch den Einfluß von Störungen und Ungenauigkeiten die Klassifikation, d. h. die Erkennung des gelesenen Zeichens durch Vergleich seiner Merkmale mit denen der Muster- oder Prüfzeichen, erschwert und äußerst unsicher ist, so daß die Leseeinrichtung oft kein oder ein falsches Zeichen ausgibt. Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung anzugeben, bei dem die Lesesicherheit erhöht wird und eine bessere Erkennbarkeit der Übereinstimmung und Identifizierung des gelesenen Zeichens mit einem der Zeichen aus der Gesamtheit der Zeichen der zu lesenden Schrift erreicht wird.
Diese Aufgabe wird gelöst durch das Verfahren nach dem Patentanspruch 1 bzw. die Vorrichtung nach dem Patentanspruch 2. Das heißt, daß bei dem eingangs erwähnten Verfahren nach dem ersten, aus der Bildung und dem Vergleich einer aus Istwerten gewonnenen Merkmalskombination, d. h. kennzeichnenden Größe des gelesenen Zeichens mit den Sollwert-Merkmalskombinationen bestehenden Klassifizierungsschritt mindestens noch ein weitererer Klassifizierungsschritt durchgeführt wird, wobei vor jedem Klassifizierungsschritt die Lage des beispielsweise aus k Adressen bestehenden Adressenrasters innerhalb des für ein gelesenes Zeichen vorgesehenen, beispielsweise aus m Adressen bestehenden Adressenraumes um eine oder mehrere Adressen in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden Klassifizierungsschritten verbesserte Übereinstimmung erreicht wird.
Es wird also das Adressenraster jeweils so verschoben, daß sich bei einer der vorgespeicherten Sollwert- Merkmalskombinationen gegenüber der Istwert- Merkmalskombination des abgetasteten Zeichens ein Minimum der Abweichung und damit ein Maximum der Übereinstimmung ergibt. So wird beispielsweise nach dem ersten Klassifizierungsschritt das Adressenraster um eine Adresse nach oben oder unten, d. h. in oder gegen die Leserichtung verschoben und eine erneute Klassifizierung vorgenommen. Ergibt sich dann immer noch keine oder gar eine schlechtere Übereinstimmung bei dem Prüfzeichen, so wird für den dann folgenden Klassifizierungsschritt das Adressenraster gegenüber der ursprünglichen Lage um eine Adresse nach unten oder oben auf der Abszissenachse, d. h. gegen oder in die Leserichtung verschoben. Ist dagegen bei dem zweiten Klassifizierungsschritt die Übereinstimmung für eines der gespeicherten Musterzeichen bzw. dessen Merkmalskombination besser als beim ersten geworden, so wird das Adressenraster für den dritten Klassifizierungsschritt noch um eine weitere Adresse in der gleichen Richtung verschoben, wobei sich dann (falls nicht schon beim zweiten Klassifizierungsschritt das Optimum erreicht worden ist) eine noch bessere Übereinstimmung ergibt. Man hat es also beim erfindungsgemäßen Verfahren mit einer Art Regelvorgang zu tun. Die Verschiebung des Adressenrasters entspricht der Verschiebung des Stellglieds, die Abweichung des abgetasteten Zeichens von einem der Muster oder Prüfzeichen bzw. von dem diesem Muster zugeordneten Merkmal oder Merkmalskombination entspricht der Regelabweichung, die nach Möglichkeit sehr klein, im besten Fall Null werden soll.
Es ist zunächst denkbar, den Beginn eines Zeichens anzunehmen, wenn die gemessenen Funktionswerte gegenüber dem Rausch- und Störpegel eine gewisse Höhe erreicht haben und dann in einem gewissen, vorgewählten Abszissenabstand von diesem angenommenen Zeichenanfang die erste Adresse des Adressenrasters für den ersten Klassifizierungsschritt auszuwählen und herauszugreifen. Im Rahmen der Erfindung hat sich jedoch gezeigt, daß sich noch eine eindeutigere Festlegung des Zeichenanfangs erreichen läßt, wenn die Lage der ersten Adresse des Rasters in Abhängigkeit vom Anstieg der abgetasteten Funktionswerte gewählt wird, wenn man also von der Steilheit der Änderungsgeschwindigkeit der Zeichenkurve ausgeht. Es wird also ständig der Anstieg an jeder Stelle der fortlaufend aufgezeichneten bzw. in aufeinanderfolgenden Adressen des Speichers aufgenommene Kurve, die vom Signalausgang des Lesegeräts geliefert wird, überwacht. Erreicht oder überschreitet der Anstieg an einer bestimmten Stelle bzw. Adresse einen bestimmten Wert, so wird in einem bestimmten Abstand unterhalb dieses Abszissenwertes bzw. Adresse der Anfang des erfaßten Zeichens festgelegt. In einem vorgewählten Abstand hiervon in Richtung aufsteigender Abszissenwerte bzw. Adressen wird dann die erste Adresse des Adressenrasters für den ersten Klassifizierungsschritt festgelegt. Durch das erfindungsgemäße Verfahren ergibt sich so die Möglichkeit einer "Zentrierung", d. h. Festlegung der Lage des Zeichens im Adressenraum; denn durch die Lage der ersten Adresse des Rasters nach Erreichen des Maximums der Übereinstimmung beim letzten Klassifizierungsschritt ist dann auch der Zeichenanfang gegeben. Da auch die Breite des Zeichens, d. h. die Zahl der für die gesamte, für alle Zeichen gleiche Breite (Abszissenabstand) vom Anfang eines Zeichens bis zum Anfang des folgenden Zeichens oder Zwischenraumes erforderlichen Adressen bekannt ist, ist dann auch die Lage des Zeichens im Adressenraum und, solange keine Störung auftritt, auch die der folgenden Zeichen bekannt. Es muß lediglich im Speicher, in dem die Kurve des Ausgangssignales aufgezeichnet wird, eine genügend große Anzahl von Adressen bzw. Speicherplätzen vorhanden sein, so daß, während die vorbeschriebenen Verfahrensschritte an einem Zeichen vorgenommen werden, inzwischen das oder die folgenden Zeichen und Zwischenräume in ihrem Kurvenverlauf aufgeschrieben werden können. Erst durch diese Festlegung eines eindeutigen Bezugspunktes für die Lage der ersten Adresse wird eine eindeutige und zuverlässige Zeichenerkennung gewährleistet.
Eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens geht zunächst aus von einem Lesegerät mit einem Sensor zum Erfassen von auf einem Beleg aufgebrachten Schriftzeichen, das zur Erzeugung eines dem gelesenen, von dem Sensor abgetasteten Zeichen entsprechenden Signals ausgebildet ist. Der Sensor spricht hierbei auf die Merkmale der Schriftzeichen an, die optischer oder magnetischer Natur sein können. Im letzten Fall handelt es sich um Schriftzeichen aus einer magnetische oder magnetisierbare Partikel aufweisenden Druckfarbe. Das Lesegerät erzeugt bei solchen magnetischen Schriftzeichen in bekannter Weise während der Bewegung des Sensors längs der Lese- oder Druckzeile den Verlauf der Änderung des magnetischen Felds der magnetischen Zeichenteile oder - bei entsprechender Beschaffenheit der Anlage - des Feldes selbst, so daß sich die Zeichenkurve, wie bei den nachstehend beschriebenen Beispielen in diesem Fall nur zwischen Null und positiven Werten bewegt.
Zur Durchführung des erfindungsgemäßen Verfahrens ist die erfindungsgemäße Einrichtung gekennzeichnet durch eine Datenverarbeitungsanlage, die einen Speicherbereich zum Aufnehmen von mindestens zwei aufeinanderfolgenden, vollständigen Zeichensignalen maximaler Breite einschließlich Pausen, einen zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten für jedes zu verwendende Schriftzeichen mindestens einer der zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerwerk mit seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegerätes gelieferten Signale, zum Selektieren, d. h. zum Auswählen der Funktionswerte des gespeicherten Signals der einzelnen Zeichen aus dem ersten Speicherbereich gemäß dem vorgegebenen Adressenraster und zum Berechnen von sich aus den Signalwerten dieser Zeichen ergebenden Merkmalswerten sowie zum Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich und zur Ausgabe der als übereinstimmend erkannten Zeichen.
Die erfindungsgemäße Durchführung der vorstehend beschriebenen Klassifizierungsschritte und des ihnen zugrunde liegenden Erkennungsalgorithmus zur Festlegung der Zeichenübereinstimmung kann in wesentlich kürzerer Zeit durchgeführt werden, als das Lesen und Aufzeichnen bzw. Speichern der Zeichensignale im ersten Speicherbereich. Im einfachsten Ausführungsfall der Erfindung kann daher bereits ein Speicherumfang für zwei Zeichen in den meisten Fällen einigermaßen ausreichen, so daß, während jeweils ein Zeichen geschrieben wird, die Klassifizierung des anderen erfolgt, und dieses bzw. seine Speicherplätze anschließend sofort nach Beendigung der Aufzeichnung des gerade geschriebenen Zeichens gelöscht und weiterbeschrieben werden können. In Weiterbildung der Erfindung erweist es sich jedoch für Fälle einer stark gestörten Aufzeichnung, bei der sehr viele Klassifizierungsversuche bzw. -schritte unternommen werden müssen, als vorteilhaft, wenn der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.
Mit der erfindungsgemäßen Vorrichtung lassen sich so Lesegeschwindigkeiten bis zu 2,5 m/sec erreichen. Im Rahmen der Erfindung ist auch das Lesen beliebig vieler Schriften möglich, wenn der zweite Speicherbereich zur Aufnahme der Zeichen mehrerer verschiedener Schriftarten ausgebildet ist bzw. jeweils mit den Schriftzeichen verschiedener Schriften bei Bedarf beladen werden kann. Natürlich muß dann bei Verwendung einer anderen Schriftart das Programm des Rechen- und Steuerwerkes auch zur Bildung der dem Zeichen dieser anderen Schriftart zugeordneten Merkmalswerte ausgestaltet sein.
Die Erfindung ist in der Zeichnung beispielsweise und schematisch dargestellt. Es zeigen:
Fig. 1: ein Beispiel einer Schriftart,
Fig. 2: die den einzelnen Zeichen in Fig. 1 entsprechenden Kurven- bzw. Funktionsverkäufe,
Fig. 3: ein Beispiel für die Ermittlung eines den Beginn eines Zeichens signalisierenden Kurvenanstiegs,
Fig. 4: ein Beispiel eines Kurvenverlaufs für das Zeichen 0,
Fig. 5: ein Klassifizierungsbeispiel durch Vergleich der gemessenen mit den Soll-Merkmalskombinationen,
Fig. 6: einen Kurvenverlauf von mehreren, unmittelbar aufeinanderfolgenden Zeichen,
Fig. 7: ein Ablaufdiagramm und
Fig. 8: ein Blockschema einer Rechenanlage.
Die Erfindung wird im folgenden am Beispiel einer Schrift bestehend aus 14 Zeichen, den Ziffern 0 bis 9 und drei Sonderzeichen, dargestellt. Für jedes Zeichen in Fig. 1 ist in Leserichtung (x-Achse) die gleiche Breite vorgesehen. Beim Abtasten des magnetischen Felds der Zeichen durch den Sensor des Lesegeräts ergeben sich die für jedes Zeichen kennzeichnenden, unterschiedlichen Kurvenzüge (berechneter bzw. theoretischer Soll-Verlauf) gem. Fig. 2, aus denen das jeweilige Zeichen erkennbar ist. Bei dem Beispiel 4 ist die Breite bzw. Länge eines jeden Zeichens vom Zeichenanfang bis zum Zeichenende (Anfang des folgenden Zeichens) durch neun Striche bzw. acht Abschnitte gleicher Breite unterteilt. Die Funktionswerte dieses ungestörten Sollwertverlaufs (Sollkurve) an diesen neun sind bereits charakteristisch und repräsentativ für jedes Zeichen. Für die Darstellung des gesamten Kurvenverlaufs eines Zeichens sind für das hier beschriebene Beispiel jeweils 8 · 7 = 56 Speicheradressen im Speicher vorgesehen. Die Adressen entsprechen den Werten auf der Abszissenachse, d. h. in Leserichtung, und enthalten die diesen Abszissenwerten zugeordneten Funktionswerte.
Bei der Abtastung einer Lesezeile durch den Sensor ist zunächst festzustellen, ob und wo ein Anstieg der ständig gemessenen (Funktions-)werte des Abtastsignals erfolgt, der über den Störpegel hinausgeht und kein Störsignal sondern den Beginn eines Zeichens darstellt. Dies kann, wie bereits erwähnt, in an sich bekannter Weise durch ständige Messung des jeweiligen Kurvenzugs und Bildung den entsprechenden Differentialquotienten erreicht werden. In Fig. 3 ist eine einfache Näherungsmethode zur Feststellung eines Zeichenanstiegs dargestellt. Gemäß dieser Methode ergibt sich bei der Untersuchung des gemessenen und gespeicherten Kurvenverlaufs ein vorläufiger Zeichenanfang bei einer Stelle bzw. Adresse x mit dem Funktionswert y dann, wenn die in den nachfolgenden Adressen x + 1, x + 2 und x + 4 gespeicherten entsprechenden Funktionswerte y 1, y 2 und y 4 die Bedingungen
(y 1 <y + 1) + (y 2y + 2) + (y 4y + 5)
erfüllen. Ist eine solche Stelle bzw. Adresse x mit diesen Bedingungen als vorläufiger Zeichenanfang ermittelt worden, so wird das im folgenden anhand der Fig. 4 erläuterte Meßverfahren durchgeführt.
Fig. 4 zeigt einen durch Störungen veränderten Kurvenverlauf, der von dem Zeichen 0 herrührt. Ist ein vorläufiger Zeichenanfang durch Messung des Anstiegs festgestellt worden, so kann dann das Zeichen durch Abtasten des Kurvenverlaufs und Feststellung der Funktionswerte in den dann folgenden, für eine Zeichenbreite vorgesehenen m Adressen (hier m = 56) identifiziert werden. Wenn beispielsweise bei Aufzeichnung und Speichern des abgetasteten Signals in den Adressen des ersten Speicherbereiches bei völlig ungestörtem, idealem Sollwertverlauf der Zeichenkurve der berechnete Zeichenanfang ZA an der durch die gestrichelte Linie 0 in Fig. 4 markierten Stelle läge, die z. B. einer bestimmten Adresse n + 0 im Speicher entspräche, so wären in den dann folgenden 56 Adressen die Funktionswerte y aufgrund des Sollwertverlaufs bereits festgelegt, insbesondere die Werte an den weiteren Linien bzw. Stellen 1, 2, . . . 8 in Fig. 4, die dann den Adressen n + 7, n + 14 usw. bis n + 56 entsprächen.
Im allgemeinen ist die Zeichenlage und das Zeichen selbst unbekannt. Es wird daher zunächst, wenn beim Abtasten der Lesezeile und Speichern des empfangenen Signals in aufeinanderfolgenden Adressen ein einen Zeichenanfang signalisierender Anstieg (vgl. oben) erkannt und so ein vorläufiger Zeichenanfang ZA (x 0/y 0) festgelegt ist in einem Abstand (hier z. B. 7 Adressen weiter) davon ein Raster von mehreren, insgesamt k weiteren Adressen (hier k = 8) ausgewählt, die ebenfalls voneinander gleichen Abstand (hier jeweils 7 Adressen) aufweisen. Die entsprechenden, zugehörigen Funktionswerte y 1, y 2, . . . y 8 werden dem Speicher entnommen. Aufgrund des bekannten Sollverlaufs der einzelnen, vorgesehenen Zeichen (Fig. 1 und 2) lassen sich in bekannter Weise sog. Merkmalsvektoren aus den Funktionswerten y 0 - y 8 für die einzelnen Zeichen bilden. Diese Merkmalsvektoren ergeben sich als bestimmte Größenbedingungen zwischen den verschiedenen Funktionswerten. Sie sind für bestimmte Zeichen erfüllt, d. h. haben den Wert 1, oder nicht erfüllt, das heißt haben dann den Wert 0, je nachdem welches Zeichen der betreffenden Schriftart bzw. welcher Kurvenzug gemäß Fig. 2 in dem aufgrund der Messung gespeicherten und abgetasteten Kurvenzug enthalten ist. Die Anzahl der Merkmalsvektoren, die man aufgrund der vorgegebenen Kurvenverläufe bilden kann, hängt ab von der Qualität bzw. Genauigkeit, mit der die Kurvenverläufe repräsentiert und gekennzeichnet werden sollen. In der beigefügten Liste am Schluß der Beschreibung ist ein Beispiel für eine besonders zweckmäßige Auswahl von Merkmalsvektoren MV M (hier M = 1, 2, . . . 24) für die hier verwendete Schriftart gemäß Fig. 1 und 2 angegeben.
Aus diesen Merkmalsvektoren lassen sich für jedes Zeichen charakteristische Kombinationen, am einfachsten jeweils in Form einer Summe K N bilden (hier N = 1, 2 . . . 14). In der erwähnten Liste ist daher auch ein Beispiel für eine vorteilhafte Bildung dieser Merkmalskombinationen für die Zeichen der hier behandelten Schriftart, sog. Zeichenklassen, angegeben. Die Werte K N ergeben sich also als Summe aus den verschiedenen Merkmalsvektoren, wobei
ist.
Durch entsprechende Auswahl und Kombination von für die einzelnen Zeichen charakteristischen Funktionswerten y 0, . . . x k für die Bildung von Merkmalsvektoren und durch deren Auswahl und Kombination kann unschwer erreicht werden, daß beim Vorliegen eines bestimmten Zeichens immer nur eine Merkmalskombination K N sich ihrem Sollwert nähert.
Die gemessenen bzw. errechneten Istwerte K 0ist , K 1ist , . . . K 14ist werden verglichen mit den gespeicherten Sollwerten K 0soll , K 1soll , . . . K 14soll . Dies geschieht am einfachsten durch Verhältnisbildung. Fig. 5 zeigt daher den Verlauf der Größe
die man als Wahrscheinlichkeit der Erkennungssicherheit bezeichnen kann. Hierbei bildet der punktierte Kurvenverlauf in Fig. 5 das Ergebnis eines Klassifizierungsschrittes bzw. Vergleichsversuches beispielsweise mit einer Adressenraster in einer ersten, vorläufigen Lage mit den Adressen x 1, x 2, . . . x k in Fig. 4. Wird alsdann gemäß der Erfindung ein weiterer Versuch bzw. Klassifizierungsschritt unternommen mit einem um eine Einheit bzw. Adresse nach rechts verschobenen Adressenraster mit den Adressen x 1′, x 2′, . . . x k′ , so ergibt sich aus den dann gemessenen Funktionswerten y , y 2′, . . . y 8′, und nach Bildung der Merkmalsvektoren MV M und der für die Zeichen charakteristischen Werte K N der gestrichelte Verlauf in Fig. 5. Dieser zweite Versuch läßt bereits eine größere Übereinstimmung bzw. Übereinstimmungswahrscheinlichkeit für das Zeichen 0 erkennen. Ein weiterer erfindungsgemäßer Klassifizierungsschritt mit einem nochmals um eine weitere Adresse in Fig. 4 verschobenen Adressenraster, das dann also bei der Adresse x 1″ beginnt, so erhält man nach nochmaliger Durchführung des gleichen Klassifizierungsverfahrens den mit einer durchgehenden Linie dargestellten Kurvenzug in Fig. 5, d. h. die Wahrscheinlichkeit 1 dafür, daß das gemessene und in seinem Verlauf mehrmals abgetastete Zeichen das Zeichen 0 ist. Durch solche erfindungsgemäße Wiederholung der Klassifizierung eines gemessenen Zeichenverlaufs bis zu einer größtmöglichen Übereinstimmung erreicht man nicht nur eine hohe Erkennungssicherheit für das gelesene Zeichen. Durch die Lage des Adressenrasters beim letzten Klassifizierungsschritt mit der erreichten größtmöglichen Übereinstimmung ist auch der genaue Zeichenanfang ZA des gelesenen und gemessenen Zeichens festgelegt. Da für jedes Zeichen gleiche Breite auf der Lesezeile und damit auch die gleiche Adressenanzahl im Speicher vorgesehen ist, ist mit der Erkennung des ersten Zeichens und seines Zeichenanfangs ZA auch der jeweilige Zeichenanfang für die dann folgenden Zeichen festgelegt, solange keine Störungen auftreten. Die Anfänge der nachfolgenden Zeichen lassen sich vorher bestimmen, wenn ein Zeichenanfang ermittelt worden ist. Fig. 6 zeigt ein Beispiel für drei aufeinanderfolgende Zeichen 0, 1 und 2.
Es ist leicht einzusehen, daß derartige Zeichen bzw. die ihnen entsprechenden Kurvenzüge nicht nur durch die vorbeschriebene Abtastung der Funktionswerte und Bildung von Merkmalsvektoren erkannt und klassifiziert werden können, sondern beispielsweise auch durch Messung der Impulsbreite oder/und ihrer Lage längs der Abszissen- bzw. Adressenachse, da diese Größen, wie man leicht aus den Bildern in Fig. 2 ersehen kann, ebenfalls für jedes Zeichen charakteristische Merkmalskombinationen darstellen. Die Impulsbreite läßt sich leicht durch Bildung bzw. Messung des ersten und zweiten Differentialquotienten feststellen. Das erfindungsgemäße Verfahren ist daher mit allen bekannten Zeichenerkennungssystemen bzw. Klassifizierungsmethoden durchführbar.
Fig. 7 zeigt noch einmal den Ablauf des erfindungsgemäßen Verfahrens anhand des beschriebenen Beispiels. Nach dem Aufzeichnen und Speichern der Kurve des gelesenen Zeichens werden die Funktionswerte y in den einzelnen Speicheradressen fortlaufend dahingehend überprüft, ob ein Zeichenanfang ZA vorliegt oder nicht. Wenn ja, werden aus den Funktionswerten y 1, . . . y k eines ersten Adressenrasters x₁ . . . x k die Merkmalsvektoren MV M und daraus mit Hilfe der Merkmalskombinationen K N die Erkennungswahrscheinlichkeit W N gebildet. Alsdann wird der gleiche Vorgang, wie bereits beschrieben, mit einem etwas geänderten Adressenraster wiederholt und geprüft, ob die Erkennungswahrscheinlichkeit W N eines bestimmten Zeichens sich dem Wert 1 genügend weit angenähert hat. Ist die Annäherung bzw. Übereinstimmung groß genug, wird das erkannte Zeichen ausgegeben.
Fig. 8 zeigt eine Anordnung zur Durchführung des Verfahrens. Das vom Lesegerät 1 aufgenommene Signal des gelesenen Zeichens wird in einem Speicher 2 einer Datenverarbeitungsanlage abgelegt. Durch das Rechen- und Steuerwerk 3 werden dann die Funktionswerte der gemessenen und gespeicherten Kurve mit in einem Speicher 4 vorhandenen, den einzelnen Zeichen der Schriftart entsprechenden Sollwertmerkmalen verglichen und klassifiziert. Das dann aufgrund des erfindungsgemäßen Verfahrens erkannte Zeichen wird hierauf über die Ausgabeeinheit 5 ausgegeben. Das Programm für die Tätigkeit des Rechen- und Steuerwerks 3 ist im Speicher 6 abgelegt.
  • Stückliste 1 Lesegerät
    2 Speicher
    3 Rechen- und Steuerwerk
    4 Speicher
    5 Ausgabeeinheit
    6 Speicher
MV 1 = y 7 + y 5 < y 4 + y 3
MV 2 = y 7 < y 5
MV 3 = y 6 < y 4
MV 4 = y 5 < y 3
MV 5 = y 6 < y 3
MV 6 = y 6 + y 3 < y 5 + y 1
MV 7 = y 5 + y 5 < y 6 + y 1
MV 8 = y 5 + y 4 < y 3 + y 0
MV 9 = y 7 + y 6 + y 2 < y 4 + y 3 + y 8
MV 10 = y 5 + y 8 < y 4 + y 2
MV 11 = y 7 + y 8 < y 4 + y 3
MV 12 = y 1 < y 6
MV 13 = y 1 < y 2
MV 14 = y 5 + y 1 < y 4 + y 2
MV 15 = y 4 + y 1 < y 3 + y 2
MV 16 = y 1 + y 0 < y 8 + y 8
MV 17 = y 3 < y 2
MV 18 = y 4 < y 1
MV 19 = y 2 < y 7
MV 20 = y 7 + y 2 < y 6 + y 5
MV 21 = y 5 + y 0 < y 4 + y 8
MV 22 = y 2 + y 1 < y 4 + y 0
MV 23 = y 4 + y 1 < y 5 + y 6
MV 24 = y 1 + y 3 < y 5 + y 6

Claims (4)

1. Verfahren zum maschinellen Lesen von Schriftzeichen mit einem Lesegerät, das für jedes von einem Sensor abgetastete Zeichen eine für dieses Zeichen charakteristische Folge von Funktionswerten als Ausgangssignal liefert, wobei die gelesenen Zeichen gespeichert werden und aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen Funktionswerten eines gelesenen Zeichens eine für dieses Zeichen charakteristische Merkmalskombination gebildet und dann mit jeder von entsprechenden Merkmalskombinationen von zuvor festgelegten, für jedes Zeichen der zu lesenden Schrift bzw. Schriftart charakteristischen Sollwerten der Merkmale verglichen wird, und festgestellt wird, mit welcher der Sollwert-Merkmalskombinationen eines der Schriftzeichen die Istwert-Merkmalskombination des gelesenen Zeichens am besten übereinstimmt, dadurch gekennzeichnet, daß nach diesem ersten, durch Bildung und Vergleich einer aus Istwerten gewonnenen Merkmalskombination des gelesenen Zeichens mit den Sollwert-Merkmalskombinationen erfolgenden Klassifizierungsschritt mindestens noch ein weiterer Klassifizierungsschritt durchgeführt wird, wobei vor jedem Klassifizierungsschritt die Lage des Adressenrasters innerhalb des für ein zu lesendes Zeichen vogesehenen Adressenraums um eine oder mehrere Adressen in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden Klassifizierungsschritten verbesserte Übereinstimmung erreicht wird, wobei die Lage der ersten Adresse des Adressenrasters in Abhängigkeit vom Anstieg der abgetasteten Funktionswerte gewählt wird.
2. Vorrichtung zur Durchführung des Verfahrens nach Anspruch 1 mit einem einen Sensor zum Erfassen von Schriftzeichen aufweisenden Lesegerät, das zur Erzeugung eines dem gelesenen Zeichen entsprechenden Signals ausgebildet ist, gekennzeichnet durch eine Datenverarbeitungsanlage, die einen Speicherbereich zum Aufnehmen von mindestens zwei aufeinanderfolgenden vollständigen Zeichensignalen maximaler Breite einschließlich Pausen, einen zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten für jedes zu verwendende Schriftzeichen der zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerwerk mit seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegeräts gelieferten Signale, zum Selektieren der einzelnen Zeichen aus dem ersten Speicherbereich und zum Berechnen von sich aus den Signalwerten dieser Zeichen ergebenden Merkmalswerten, sowie zum Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich und zur Ausgabe der als übereinstimmend erkannten Zeichen.
3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, daß der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.
4. Vorrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der zweite Speicher zur Aufnahme der Zeichen mehrerer verschiedener Schriften oder Schriftarten ausgebildet ist.
DE19843406694 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen Granted DE3406694A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19843406694 DE3406694A1 (de) 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19843406694 DE3406694A1 (de) 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Publications (2)

Publication Number Publication Date
DE3406694A1 DE3406694A1 (de) 1985-09-05
DE3406694C2 true DE3406694C2 (de) 1988-04-07

Family

ID=6228699

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19843406694 Granted DE3406694A1 (de) 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Country Status (1)

Country Link
DE (1) DE3406694A1 (de)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3818445A (en) * 1972-12-18 1974-06-18 Ibm Character data search system
DE3013833C2 (de) * 1979-04-13 1986-07-03 Hitachi, Ltd., Tokio/Tokyo Vorrichtung zur Prüfung eines auf einem Gegenstand befindlichen Musters auf Fehler
JPS58201185A (ja) * 1982-05-19 1983-11-22 Toshiba Corp 位置検出装置

Also Published As

Publication number Publication date
DE3406694A1 (de) 1985-09-05

Similar Documents

Publication Publication Date Title
EP0040796B1 (de) Verfahren zum automatischen Klassifizieren von Bild- und Text- oder Graphikbereichen auf Druckvorlagen
EP0409310B1 (de) Verfahren sowie Anordnung zum Bestimmen von Kanten in Bildern
DE2831582C2 (de) Verfahren zur Identifizierung einer Person und Vorrichtung zur Durchführung des Verfahrens
DE3515159C2 (de)
DE3738304A1 (de) Vorrichtung zum pruefen von banknoten
DE3633743A1 (de) Zeichenerkennungssystem
DE2417282B2 (de) Vorrichtung zum Lesen von Fingerabdrücken
DE2844156A1 (de) Verfahren zum verifizieren eines sprechers
DE3904129A1 (de) Einrichtung zum ueberpruefen von dokumenten
WO1982001778A1 (en) Method and device for the marking and/or identification of a data medium
DE3322443A1 (de) Mustererkennungsvorrichtung
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE3026055C2 (de) Schaltungsanordnung zur maschinellen Zeichererkennung
DE3622222A1 (de) Zeichenerkennung in zweidimensionalen signalen
EP0104369A2 (de) Einrichtung und Verfahren zum optischen Erkennen von Flächenmustern an Objekten
DE3406694C2 (de)
EP0753231B1 (de) Verfahren und vorrichtung zum binarisieren von pixel-daten
DE2905606C2 (de) Verfahren und Einrichtung zum Identifizieren von Dokumenten
DE19724711B4 (de) Verfahren und Vorrichtung zum Erkennen und Lesen eines an einem Objekt vorgesehenen Strichcodes
DE19612465C2 (de) Automatisches Optimieren von Objekt-Erkennungssystemen
DE2112919C3 (de) Anordnung zum Erkennen von Zeichen
DE3822671C2 (de)
DE3238300A1 (de) Verfahren und vorrichtung zur muster- oder zeichenerkennung
DE10326032B4 (de) Verfahren zum Selbsttest eines Bildverarbeitungssystems
DE102021202878A1 (de) Verfahren zur Reichweitenbestimmung für einen LiDAR-Sensor

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: KLEINDIENST DATENTECHNIK GMBH, 8900 AUGSBURG, DE