DE3406694C2

DE3406694C2 -

Info

Publication number: DE3406694C2
Application number: DE3406694A
Authority: DE
Inventors: Werner Dipl.-Ing. 8901 Leitershofen De Gleich
Original assignee: Kleindienst GmbH and Co KG
Current assignee: KLEINDIENST DATENTECHNIK GMBH, 8900 AUGSBURG, DE
Priority date: 1984-02-24
Filing date: 1984-02-24
Publication date: 1988-04-07
Also published as: DE3406694A1

Description

Die Erfindung betrifft ein Verfahren zum maschinellen Lesen nach dem Oberbegriff des Patentanspruches 1 und eine Vorrichtung zur Durchführung des Verfahrens nach dem Oberbegriff des Patentanspruches 2.

Das Verfahren dient zum Auffinden und Erkennen von Zeichen einer Schrift auf Belegen oder dgl. mit einem Lesegerät, das für jedes von einem Sensor bei Bewegung längs einer Lesezeile abgetasteten Zeichen eine für dieses Zeichen charakteristische Funktion der Zeit bzw. des Ortes auf der Lesezeile, also eine zeitliche Folge von Funktionswerten, z. B. von Ordinatenwerten oder von unterschiedlichen Amplitudenabständen oder Impulsbreiten, als Ausgangssignal liefert. Bei diesem Verfahren werden die gelesenen, also abgetasteten Zeichen in einem Speicher in Form einer für das Zeichen charakteristischen Kurve bzw. Funktion gespeichert, wobei die aufeinanderfolgenden Adressen des Speichers, in denen die Funktionswerte enthalten sind, der Abszissenachse (Zeit oder Ort auf der Lesezeile) entsprechen. Zur Erkennung des gelesenen Zeichens wird bei diesem Verfahren aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen Funktionswerten des Zeichens eine für dieses Zeichen charakteristische Merkmalkombination gebildet, und diese aus den gemessenen Istwerten des gelesenen Zeichens gebildete Merkmalskombination wird dann nacheinander jeweils mit jeder von entsprechenden, äquivalenten Kombinationen von zuvor festgelegten, in einem weiteren Speicher bereitgehalten und für jedes Zeichen der zu lesenden Schrift bzw. Schriftart charakteristischen Sollwerten der Merkmale verglichen, und dann wird festgestellt, mit welcher der Sollwert-Merkmalskombinationen eines der Schriftzeichen die Istwertmerkmalskombination des gelesenen Zeichens am besten übereinstimmt.

Solche Verfahren und Vorrichtungen zum maschinellen Lesen von auf Belegen und dgl. aufgebrachten Zeichen durch Abtasten und Klassifizieren entsprechend den vorgegebenen Mustern- oder Prüfzeichen der fraglichen Schrift, sind bereits bekannt. So wird beispielsweise in der DE-OS 23 61 899 auf ein System zum Auffinden und Erkennen von Zeichen auf Belegen hingewiesen, bei dem die Zeichen bzw. Daten zunächst abgetastet werden, zwischengespeichert werden und dann über ein Zeichenerkennungssystem klassifiziert und ausgewertet werden, wodurch die gelesenen Zeichen bzw. Daten tatsächlich erkannt werden.

Bei einer Einrichtung gemäß der DE-OS 30 13 833 wird ein auf einem Gegenstand aufgebrachtes Muster schrittweise an einer Prüfeinrichtung vorbeibewegt, wobei jeweils Informationen über Teilmuster, die dem zu prüfenden Muster entsprechen, gewonnen werden, die dann in einem weiteren Arbeitsschritt mit weiteren Informationen, die ein vorbestimmtes Standardmuster darstellen, verglichen werden, um den Parameter zu ermitteln, der das Ausmaß der Fehlerhaftigkeit der betreffenden Teilmuster anzeigt. In einem dritten Arbeitsschritt werden die während des zweiten Arbeitsschrittes gewonnen Parameter mit einem vorher eingestellten Schwellenwert zur Beurteilung der Richtigkeit des zu prüfenden Musters verglichen.

Bei einer ähnlich arbeitenden Musterlagen- Erkennungsvorrichtung wird das Bild eines Musters auf einem Chip mit einer Fernsehkamera aufgenommen und gespeichert. Es werden einzelne Musterbereiche, die kleiner als das zu untersuchende Muster sind, jeweils als Musterdaten aus dem Speicher ausgelesen und die jeweils ausgelesenen Musterbereichsdaten mit entsprechenden Bezugsmusterdaten eines Bezugsmusters verglichen, wobei die jeweiligen Koinzidenzgrade zwischen dem Musterbereich und dem Bezugsmuster berechnet werden. Nach der Bestimmung der Koinzidenzgrade für das gesamte Muster wird nach Maßgabe der Speicheradresse die Lage oder Position des Musterbereiches mit dem höchsten dieser Koinzidenzgrade bestimmt.

Derartige Verfahren und Vorrichtungen haben jedoch den Nachteil, daß durch den Einfluß von Störungen und Ungenauigkeiten die Klassifikation, d. h. die Erkennung des gelesenen Zeichens durch Vergleich seiner Merkmale mit denen der Muster- oder Prüfzeichen, erschwert und äußerst unsicher ist, so daß die Leseeinrichtung oft kein oder ein falsches Zeichen ausgibt. Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung anzugeben, bei dem die Lesesicherheit erhöht wird und eine bessere Erkennbarkeit der Übereinstimmung und Identifizierung des gelesenen Zeichens mit einem der Zeichen aus der Gesamtheit der Zeichen der zu lesenden Schrift erreicht wird.

Diese Aufgabe wird gelöst durch das Verfahren nach dem Patentanspruch 1 bzw. die Vorrichtung nach dem Patentanspruch 2. Das heißt, daß bei dem eingangs erwähnten Verfahren nach dem ersten, aus der Bildung und dem Vergleich einer aus Istwerten gewonnenen Merkmalskombination, d. h. kennzeichnenden Größe des gelesenen Zeichens mit den Sollwert-Merkmalskombinationen bestehenden Klassifizierungsschritt mindestens noch ein weitererer Klassifizierungsschritt durchgeführt wird, wobei vor jedem Klassifizierungsschritt die Lage des beispielsweise aus k Adressen bestehenden Adressenrasters innerhalb des für ein gelesenes Zeichen vorgesehenen, beispielsweise aus m Adressen bestehenden Adressenraumes um eine oder mehrere Adressen in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden Klassifizierungsschritten verbesserte Übereinstimmung erreicht wird.

Es wird also das Adressenraster jeweils so verschoben, daß sich bei einer der vorgespeicherten Sollwert- Merkmalskombinationen gegenüber der Istwert- Merkmalskombination des abgetasteten Zeichens ein Minimum der Abweichung und damit ein Maximum der Übereinstimmung ergibt. So wird beispielsweise nach dem ersten Klassifizierungsschritt das Adressenraster um eine Adresse nach oben oder unten, d. h. in oder gegen die Leserichtung verschoben und eine erneute Klassifizierung vorgenommen. Ergibt sich dann immer noch keine oder gar eine schlechtere Übereinstimmung bei dem Prüfzeichen, so wird für den dann folgenden Klassifizierungsschritt das Adressenraster gegenüber der ursprünglichen Lage um eine Adresse nach unten oder oben auf der Abszissenachse, d. h. gegen oder in die Leserichtung verschoben. Ist dagegen bei dem zweiten Klassifizierungsschritt die Übereinstimmung für eines der gespeicherten Musterzeichen bzw. dessen Merkmalskombination besser als beim ersten geworden, so wird das Adressenraster für den dritten Klassifizierungsschritt noch um eine weitere Adresse in der gleichen Richtung verschoben, wobei sich dann (falls nicht schon beim zweiten Klassifizierungsschritt das Optimum erreicht worden ist) eine noch bessere Übereinstimmung ergibt. Man hat es also beim erfindungsgemäßen Verfahren mit einer Art Regelvorgang zu tun. Die Verschiebung des Adressenrasters entspricht der Verschiebung des Stellglieds, die Abweichung des abgetasteten Zeichens von einem der Muster oder Prüfzeichen bzw. von dem diesem Muster zugeordneten Merkmal oder Merkmalskombination entspricht der Regelabweichung, die nach Möglichkeit sehr klein, im besten Fall Null werden soll.

Es ist zunächst denkbar, den Beginn eines Zeichens anzunehmen, wenn die gemessenen Funktionswerte gegenüber dem Rausch- und Störpegel eine gewisse Höhe erreicht haben und dann in einem gewissen, vorgewählten Abszissenabstand von diesem angenommenen Zeichenanfang die erste Adresse des Adressenrasters für den ersten Klassifizierungsschritt auszuwählen und herauszugreifen. Im Rahmen der Erfindung hat sich jedoch gezeigt, daß sich noch eine eindeutigere Festlegung des Zeichenanfangs erreichen läßt, wenn die Lage der ersten Adresse des Rasters in Abhängigkeit vom Anstieg der abgetasteten Funktionswerte gewählt wird, wenn man also von der Steilheit der Änderungsgeschwindigkeit der Zeichenkurve ausgeht. Es wird also ständig der Anstieg an jeder Stelle der fortlaufend aufgezeichneten bzw. in aufeinanderfolgenden Adressen des Speichers aufgenommene Kurve, die vom Signalausgang des Lesegeräts geliefert wird, überwacht. Erreicht oder überschreitet der Anstieg an einer bestimmten Stelle bzw. Adresse einen bestimmten Wert, so wird in einem bestimmten Abstand unterhalb dieses Abszissenwertes bzw. Adresse der Anfang des erfaßten Zeichens festgelegt. In einem vorgewählten Abstand hiervon in Richtung aufsteigender Abszissenwerte bzw. Adressen wird dann die erste Adresse des Adressenrasters für den ersten Klassifizierungsschritt festgelegt. Durch das erfindungsgemäße Verfahren ergibt sich so die Möglichkeit einer "Zentrierung", d. h. Festlegung der Lage des Zeichens im Adressenraum; denn durch die Lage der ersten Adresse des Rasters nach Erreichen des Maximums der Übereinstimmung beim letzten Klassifizierungsschritt ist dann auch der Zeichenanfang gegeben. Da auch die Breite des Zeichens, d. h. die Zahl der für die gesamte, für alle Zeichen gleiche Breite (Abszissenabstand) vom Anfang eines Zeichens bis zum Anfang des folgenden Zeichens oder Zwischenraumes erforderlichen Adressen bekannt ist, ist dann auch die Lage des Zeichens im Adressenraum und, solange keine Störung auftritt, auch die der folgenden Zeichen bekannt. Es muß lediglich im Speicher, in dem die Kurve des Ausgangssignales aufgezeichnet wird, eine genügend große Anzahl von Adressen bzw. Speicherplätzen vorhanden sein, so daß, während die vorbeschriebenen Verfahrensschritte an einem Zeichen vorgenommen werden, inzwischen das oder die folgenden Zeichen und Zwischenräume in ihrem Kurvenverlauf aufgeschrieben werden können. Erst durch diese Festlegung eines eindeutigen Bezugspunktes für die Lage der ersten Adresse wird eine eindeutige und zuverlässige Zeichenerkennung gewährleistet.

Eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens geht zunächst aus von einem Lesegerät mit einem Sensor zum Erfassen von auf einem Beleg aufgebrachten Schriftzeichen, das zur Erzeugung eines dem gelesenen, von dem Sensor abgetasteten Zeichen entsprechenden Signals ausgebildet ist. Der Sensor spricht hierbei auf die Merkmale der Schriftzeichen an, die optischer oder magnetischer Natur sein können. Im letzten Fall handelt es sich um Schriftzeichen aus einer magnetische oder magnetisierbare Partikel aufweisenden Druckfarbe. Das Lesegerät erzeugt bei solchen magnetischen Schriftzeichen in bekannter Weise während der Bewegung des Sensors längs der Lese- oder Druckzeile den Verlauf der Änderung des magnetischen Felds der magnetischen Zeichenteile oder - bei entsprechender Beschaffenheit der Anlage - des Feldes selbst, so daß sich die Zeichenkurve, wie bei den nachstehend beschriebenen Beispielen in diesem Fall nur zwischen Null und positiven Werten bewegt.

Zur Durchführung des erfindungsgemäßen Verfahrens ist die erfindungsgemäße Einrichtung gekennzeichnet durch eine Datenverarbeitungsanlage, die einen Speicherbereich zum Aufnehmen von mindestens zwei aufeinanderfolgenden, vollständigen Zeichensignalen maximaler Breite einschließlich Pausen, einen zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten für jedes zu verwendende Schriftzeichen mindestens einer der zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerwerk mit seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegerätes gelieferten Signale, zum Selektieren, d. h. zum Auswählen der Funktionswerte des gespeicherten Signals der einzelnen Zeichen aus dem ersten Speicherbereich gemäß dem vorgegebenen Adressenraster und zum Berechnen von sich aus den Signalwerten dieser Zeichen ergebenden Merkmalswerten sowie zum Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich und zur Ausgabe der als übereinstimmend erkannten Zeichen.

Die erfindungsgemäße Durchführung der vorstehend beschriebenen Klassifizierungsschritte und des ihnen zugrunde liegenden Erkennungsalgorithmus zur Festlegung der Zeichenübereinstimmung kann in wesentlich kürzerer Zeit durchgeführt werden, als das Lesen und Aufzeichnen bzw. Speichern der Zeichensignale im ersten Speicherbereich. Im einfachsten Ausführungsfall der Erfindung kann daher bereits ein Speicherumfang für zwei Zeichen in den meisten Fällen einigermaßen ausreichen, so daß, während jeweils ein Zeichen geschrieben wird, die Klassifizierung des anderen erfolgt, und dieses bzw. seine Speicherplätze anschließend sofort nach Beendigung der Aufzeichnung des gerade geschriebenen Zeichens gelöscht und weiterbeschrieben werden können. In Weiterbildung der Erfindung erweist es sich jedoch für Fälle einer stark gestörten Aufzeichnung, bei der sehr viele Klassifizierungsversuche bzw. -schritte unternommen werden müssen, als vorteilhaft, wenn der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.

Mit der erfindungsgemäßen Vorrichtung lassen sich so Lesegeschwindigkeiten bis zu 2,5 m/sec erreichen. Im Rahmen der Erfindung ist auch das Lesen beliebig vieler Schriften möglich, wenn der zweite Speicherbereich zur Aufnahme der Zeichen mehrerer verschiedener Schriftarten ausgebildet ist bzw. jeweils mit den Schriftzeichen verschiedener Schriften bei Bedarf beladen werden kann. Natürlich muß dann bei Verwendung einer anderen Schriftart das Programm des Rechen- und Steuerwerkes auch zur Bildung der dem Zeichen dieser anderen Schriftart zugeordneten Merkmalswerte ausgestaltet sein.

Die Erfindung ist in der Zeichnung beispielsweise und schematisch dargestellt. Es zeigen:

Fig. 1: ein Beispiel einer Schriftart,

Fig. 2: die den einzelnen Zeichen in Fig. 1 entsprechenden Kurven- bzw. Funktionsverkäufe,

Fig. 3: ein Beispiel für die Ermittlung eines den Beginn eines Zeichens signalisierenden Kurvenanstiegs,

Fig. 4: ein Beispiel eines Kurvenverlaufs für das Zeichen 0,

Fig. 5: ein Klassifizierungsbeispiel durch Vergleich der gemessenen mit den Soll-Merkmalskombinationen,

Fig. 6: einen Kurvenverlauf von mehreren, unmittelbar aufeinanderfolgenden Zeichen,

Fig. 7: ein Ablaufdiagramm und

Fig. 8: ein Blockschema einer Rechenanlage.

Die Erfindung wird im folgenden am Beispiel einer Schrift bestehend aus 14 Zeichen, den Ziffern 0 bis 9 und drei Sonderzeichen, dargestellt. Für jedes Zeichen in Fig. 1 ist in Leserichtung (x-Achse) die gleiche Breite vorgesehen. Beim Abtasten des magnetischen Felds der Zeichen durch den Sensor des Lesegeräts ergeben sich die für jedes Zeichen kennzeichnenden, unterschiedlichen Kurvenzüge (berechneter bzw. theoretischer Soll-Verlauf) gem. Fig. 2, aus denen das jeweilige Zeichen erkennbar ist. Bei dem Beispiel 4 ist die Breite bzw. Länge eines jeden Zeichens vom Zeichenanfang bis zum Zeichenende (Anfang des folgenden Zeichens) durch neun Striche bzw. acht Abschnitte gleicher Breite unterteilt. Die Funktionswerte dieses ungestörten Sollwertverlaufs (Sollkurve) an diesen neun sind bereits charakteristisch und repräsentativ für jedes Zeichen. Für die Darstellung des gesamten Kurvenverlaufs eines Zeichens sind für das hier beschriebene Beispiel jeweils 8 · 7 = 56 Speicheradressen im Speicher vorgesehen. Die Adressen entsprechen den Werten auf der Abszissenachse, d. h. in Leserichtung, und enthalten die diesen Abszissenwerten zugeordneten Funktionswerte.

Bei der Abtastung einer Lesezeile durch den Sensor ist zunächst festzustellen, ob und wo ein Anstieg der ständig gemessenen (Funktions-)werte des Abtastsignals erfolgt, der über den Störpegel hinausgeht und kein Störsignal sondern den Beginn eines Zeichens darstellt. Dies kann, wie bereits erwähnt, in an sich bekannter Weise durch ständige Messung des jeweiligen Kurvenzugs und Bildung den entsprechenden Differentialquotienten erreicht werden. In Fig. 3 ist eine einfache Näherungsmethode zur Feststellung eines Zeichenanstiegs dargestellt. Gemäß dieser Methode ergibt sich bei der Untersuchung des gemessenen und gespeicherten Kurvenverlaufs ein vorläufiger Zeichenanfang bei einer Stelle bzw. Adresse x mit dem Funktionswert y dann, wenn die in den nachfolgenden Adressen x + 1, x + 2 und x + 4 gespeicherten entsprechenden Funktionswerte y ₁, y ₂ und y ₄ die Bedingungen

(y ₁ <y + 1) + (y ₂ ≧ y + 2) + (y ₄ ≧ y + 5)

erfüllen. Ist eine solche Stelle bzw. Adresse x mit diesen Bedingungen als vorläufiger Zeichenanfang ermittelt worden, so wird das im folgenden anhand der Fig. 4 erläuterte Meßverfahren durchgeführt.

Fig. 4 zeigt einen durch Störungen veränderten Kurvenverlauf, der von dem Zeichen 0 herrührt. Ist ein vorläufiger Zeichenanfang durch Messung des Anstiegs festgestellt worden, so kann dann das Zeichen durch Abtasten des Kurvenverlaufs und Feststellung der Funktionswerte in den dann folgenden, für eine Zeichenbreite vorgesehenen m Adressen (hier m = 56) identifiziert werden. Wenn beispielsweise bei Aufzeichnung und Speichern des abgetasteten Signals in den Adressen des ersten Speicherbereiches bei völlig ungestörtem, idealem Sollwertverlauf der Zeichenkurve der berechnete Zeichenanfang ZA an der durch die gestrichelte Linie 0 in Fig. 4 markierten Stelle läge, die z. B. einer bestimmten Adresse n + 0 im Speicher entspräche, so wären in den dann folgenden 56 Adressen die Funktionswerte y aufgrund des Sollwertverlaufs bereits festgelegt, insbesondere die Werte an den weiteren Linien bzw. Stellen 1, 2, . . . 8 in Fig. 4, die dann den Adressen n + 7, n + 14 usw. bis n + 56 entsprächen.

Im allgemeinen ist die Zeichenlage und das Zeichen selbst unbekannt. Es wird daher zunächst, wenn beim Abtasten der Lesezeile und Speichern des empfangenen Signals in aufeinanderfolgenden Adressen ein einen Zeichenanfang signalisierender Anstieg (vgl. oben) erkannt und so ein vorläufiger Zeichenanfang ZA (x ₀/y ₀) festgelegt ist in einem Abstand (hier z. B. 7 Adressen weiter) davon ein Raster von mehreren, insgesamt k weiteren Adressen (hier k = 8) ausgewählt, die ebenfalls voneinander gleichen Abstand (hier jeweils 7 Adressen) aufweisen. Die entsprechenden, zugehörigen Funktionswerte y ₁, y ₂, . . . y ₈ werden dem Speicher entnommen. Aufgrund des bekannten Sollverlaufs der einzelnen, vorgesehenen Zeichen (Fig. 1 und 2) lassen sich in bekannter Weise sog. Merkmalsvektoren aus den Funktionswerten y ₀ - y ₈ für die einzelnen Zeichen bilden. Diese Merkmalsvektoren ergeben sich als bestimmte Größenbedingungen zwischen den verschiedenen Funktionswerten. Sie sind für bestimmte Zeichen erfüllt, d. h. haben den Wert 1, oder nicht erfüllt, das heißt haben dann den Wert 0, je nachdem welches Zeichen der betreffenden Schriftart bzw. welcher Kurvenzug gemäß Fig. 2 in dem aufgrund der Messung gespeicherten und abgetasteten Kurvenzug enthalten ist. Die Anzahl der Merkmalsvektoren, die man aufgrund der vorgegebenen Kurvenverläufe bilden kann, hängt ab von der Qualität bzw. Genauigkeit, mit der die Kurvenverläufe repräsentiert und gekennzeichnet werden sollen. In der beigefügten Liste am Schluß der Beschreibung ist ein Beispiel für eine besonders zweckmäßige Auswahl von Merkmalsvektoren MV _M (hier M = 1, 2, . . . 24) für die hier verwendete Schriftart gemäß Fig. 1 und 2 angegeben.

Aus diesen Merkmalsvektoren lassen sich für jedes Zeichen charakteristische Kombinationen, am einfachsten jeweils in Form einer Summe K _N bilden (hier N = 1, 2 . . . 14). In der erwähnten Liste ist daher auch ein Beispiel für eine vorteilhafte Bildung dieser Merkmalskombinationen für die Zeichen der hier behandelten Schriftart, sog. Zeichenklassen, angegeben. Die Werte K _N ergeben sich also als Summe aus den verschiedenen Merkmalsvektoren, wobei

ist.

Durch entsprechende Auswahl und Kombination von für die einzelnen Zeichen charakteristischen Funktionswerten y ₀, . . . x _k für die Bildung von Merkmalsvektoren und durch deren Auswahl und Kombination kann unschwer erreicht werden, daß beim Vorliegen eines bestimmten Zeichens immer nur eine Merkmalskombination K _N sich ihrem Sollwert nähert.

Die gemessenen bzw. errechneten Istwerte K _0ist , K _1ist , . . . K _14ist werden verglichen mit den gespeicherten Sollwerten K _0soll , K _1soll , . . . K _14soll . Dies geschieht am einfachsten durch Verhältnisbildung. Fig. 5 zeigt daher den Verlauf der Größe

die man als Wahrscheinlichkeit der Erkennungssicherheit bezeichnen kann. Hierbei bildet der punktierte Kurvenverlauf in Fig. 5 das Ergebnis eines Klassifizierungsschrittes bzw. Vergleichsversuches beispielsweise mit einer Adressenraster in einer ersten, vorläufigen Lage mit den Adressen x ₁, x ₂, . . . x _k in Fig. 4. Wird alsdann gemäß der Erfindung ein weiterer Versuch bzw. Klassifizierungsschritt unternommen mit einem um eine Einheit bzw. Adresse nach rechts verschobenen Adressenraster mit den Adressen x _1′, x _2′, . . . x _k′, so ergibt sich aus den dann gemessenen Funktionswerten y _′, y _2′, . . . y _8′, und nach Bildung der Merkmalsvektoren MV _M und der für die Zeichen charakteristischen Werte K _N der gestrichelte Verlauf in Fig. 5. Dieser zweite Versuch läßt bereits eine größere Übereinstimmung bzw. Übereinstimmungswahrscheinlichkeit für das Zeichen 0 erkennen. Ein weiterer erfindungsgemäßer Klassifizierungsschritt mit einem nochmals um eine weitere Adresse in Fig. 4 verschobenen Adressenraster, das dann also bei der Adresse x _1″ beginnt, so erhält man nach nochmaliger Durchführung des gleichen Klassifizierungsverfahrens den mit einer durchgehenden Linie dargestellten Kurvenzug in Fig. 5, d. h. die Wahrscheinlichkeit 1 dafür, daß das gemessene und in seinem Verlauf mehrmals abgetastete Zeichen das Zeichen 0 ist. Durch solche erfindungsgemäße Wiederholung der Klassifizierung eines gemessenen Zeichenverlaufs bis zu einer größtmöglichen Übereinstimmung erreicht man nicht nur eine hohe Erkennungssicherheit für das gelesene Zeichen. Durch die Lage des Adressenrasters beim letzten Klassifizierungsschritt mit der erreichten größtmöglichen Übereinstimmung ist auch der genaue Zeichenanfang ZA des gelesenen und gemessenen Zeichens festgelegt. Da für jedes Zeichen gleiche Breite auf der Lesezeile und damit auch die gleiche Adressenanzahl im Speicher vorgesehen ist, ist mit der Erkennung des ersten Zeichens und seines Zeichenanfangs ZA auch der jeweilige Zeichenanfang für die dann folgenden Zeichen festgelegt, solange keine Störungen auftreten. Die Anfänge der nachfolgenden Zeichen lassen sich vorher bestimmen, wenn ein Zeichenanfang ermittelt worden ist. Fig. 6 zeigt ein Beispiel für drei aufeinanderfolgende Zeichen 0, 1 und 2.

Es ist leicht einzusehen, daß derartige Zeichen bzw. die ihnen entsprechenden Kurvenzüge nicht nur durch die vorbeschriebene Abtastung der Funktionswerte und Bildung von Merkmalsvektoren erkannt und klassifiziert werden können, sondern beispielsweise auch durch Messung der Impulsbreite oder/und ihrer Lage längs der Abszissen- bzw. Adressenachse, da diese Größen, wie man leicht aus den Bildern in Fig. 2 ersehen kann, ebenfalls für jedes Zeichen charakteristische Merkmalskombinationen darstellen. Die Impulsbreite läßt sich leicht durch Bildung bzw. Messung des ersten und zweiten Differentialquotienten feststellen. Das erfindungsgemäße Verfahren ist daher mit allen bekannten Zeichenerkennungssystemen bzw. Klassifizierungsmethoden durchführbar.

Fig. 7 zeigt noch einmal den Ablauf des erfindungsgemäßen Verfahrens anhand des beschriebenen Beispiels. Nach dem Aufzeichnen und Speichern der Kurve des gelesenen Zeichens werden die Funktionswerte y in den einzelnen Speicheradressen fortlaufend dahingehend überprüft, ob ein Zeichenanfang ZA vorliegt oder nicht. Wenn ja, werden aus den Funktionswerten y ₁, . . . y _k eines ersten Adressenrasters x₁ . . . x _k die Merkmalsvektoren MV _M und daraus mit Hilfe der Merkmalskombinationen K _N die Erkennungswahrscheinlichkeit W _N gebildet. Alsdann wird der gleiche Vorgang, wie bereits beschrieben, mit einem etwas geänderten Adressenraster wiederholt und geprüft, ob die Erkennungswahrscheinlichkeit W _N eines bestimmten Zeichens sich dem Wert 1 genügend weit angenähert hat. Ist die Annäherung bzw. Übereinstimmung groß genug, wird das erkannte Zeichen ausgegeben.

Fig. 8 zeigt eine Anordnung zur Durchführung des Verfahrens. Das vom Lesegerät 1 aufgenommene Signal des gelesenen Zeichens wird in einem Speicher 2 einer Datenverarbeitungsanlage abgelegt. Durch das Rechen- und Steuerwerk 3 werden dann die Funktionswerte der gemessenen und gespeicherten Kurve mit in einem Speicher 4 vorhandenen, den einzelnen Zeichen der Schriftart entsprechenden Sollwertmerkmalen verglichen und klassifiziert. Das dann aufgrund des erfindungsgemäßen Verfahrens erkannte Zeichen wird hierauf über die Ausgabeeinheit 5 ausgegeben. Das Programm für die Tätigkeit des Rechen- und Steuerwerks 3 ist im Speicher 6 abgelegt.

Stückliste 1 Lesegerät
2 Speicher
3 Rechen- und Steuerwerk
4 Speicher
5 Ausgabeeinheit
6 Speicher

MV ₁ = y ₇ + y ₅ < y ₄ + y ₃

MV ₂ = y ₇ < y ₅

MV ₃ = y ₆ < y ₄

MV ₄ = y ₅ < y ₃

MV ₅ = y ₆ < y ₃

MV ₆ = y ₆ + y ₃ < y ₅ + y ₁

MV ₇ = y ₅ + y ₅ < y ₆ + y ₁

MV ₈ = y ₅ + y ₄ < y ₃ + y ₀

MV ₉ = y ₇ + y ₆ + y ₂ < y ₄ + y ₃ + y ₈

MV ₁₀ = y ₅ + y ₈ < y ₄ + y ₂

MV ₁₁ = y ₇ + y ₈ < y ₄ + y ₃

MV ₁₂ = y ₁ < y ₆

MV ₁₃ = y ₁ < y ₂

MV ₁₄ = y ₅ + y ₁ < y ₄ + y ₂

MV ₁₅ = y ₄ + y ₁ < y ₃ + y ₂

MV ₁₆ = y ₁ + y ₀ < y ₈ + y ₈

MV ₁₇ = y ₃ < y ₂

MV ₁₈ = y ₄ < y ₁

MV ₁₉ = y ₂ < y ₇

MV ₂₀ = y ₇ + y ₂ < y ₆ + y ₅

MV ₂₁ = y ₅ + y ₀ < y ₄ + y ₈

MV ₂₂ = y ₂ + y ₁ < y ₄ + y ₀

MV ₂₃ = y ₄ + y ₁ < y ₅ + y ₆

MV ₂₄ = y ₁ + y ₃ < y ₅ + y ₆

Claims

1. Verfahren zum maschinellen Lesen von Schriftzeichen mit einem Lesegerät, das für jedes von einem Sensor abgetastete Zeichen eine für dieses Zeichen charakteristische Folge von Funktionswerten als Ausgangssignal liefert, wobei die gelesenen Zeichen gespeichert werden und aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen Funktionswerten eines gelesenen Zeichens eine für dieses Zeichen charakteristische Merkmalskombination gebildet und dann mit jeder von entsprechenden Merkmalskombinationen von zuvor festgelegten, für jedes Zeichen der zu lesenden Schrift bzw. Schriftart charakteristischen Sollwerten der Merkmale verglichen wird, und festgestellt wird, mit welcher der Sollwert-Merkmalskombinationen eines der Schriftzeichen die Istwert-Merkmalskombination des gelesenen Zeichens am besten übereinstimmt, dadurch gekennzeichnet, daß nach diesem ersten, durch Bildung und Vergleich einer aus Istwerten gewonnenen Merkmalskombination des gelesenen Zeichens mit den Sollwert-Merkmalskombinationen erfolgenden Klassifizierungsschritt mindestens noch ein weiterer Klassifizierungsschritt durchgeführt wird, wobei vor jedem Klassifizierungsschritt die Lage des Adressenrasters innerhalb des für ein zu lesendes Zeichen vogesehenen Adressenraums um eine oder mehrere Adressen in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden Klassifizierungsschritten verbesserte Übereinstimmung erreicht wird, wobei die Lage der ersten Adresse des Adressenrasters in Abhängigkeit vom Anstieg der abgetasteten Funktionswerte gewählt wird.

2. Vorrichtung zur Durchführung des Verfahrens nach Anspruch 1 mit einem einen Sensor zum Erfassen von Schriftzeichen aufweisenden Lesegerät, das zur Erzeugung eines dem gelesenen Zeichen entsprechenden Signals ausgebildet ist, gekennzeichnet durch eine Datenverarbeitungsanlage, die einen Speicherbereich zum Aufnehmen von mindestens zwei aufeinanderfolgenden vollständigen Zeichensignalen maximaler Breite einschließlich Pausen, einen zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten für jedes zu verwendende Schriftzeichen der zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerwerk mit seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegeräts gelieferten Signale, zum Selektieren der einzelnen Zeichen aus dem ersten Speicherbereich und zum Berechnen von sich aus den Signalwerten dieser Zeichen ergebenden Merkmalswerten, sowie zum Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich und zur Ausgabe der als übereinstimmend erkannten Zeichen.

3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, daß der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.

4. Vorrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der zweite Speicher zur Aufnahme der Zeichen mehrerer verschiedener Schriften oder Schriftarten ausgebildet ist.