-
-
Verfahren und Vorrichtuna zum maschinellen Lesen von Schriftzeichen
-
Die Erfindung betrifft e4h' Verfahren und Vorrichtungen zum maschinellen
Lesen, d.h. zum Auffinden und Erkennen von Zeichen einer Schrift auf Belegen oder
dgl. mit einem Lesegerät, das für jedes von einem Sensor bei Bewegung längs einer
Lesezeile abgetasteten Zeichen eine für dieses Zeichen charakteristische Funktion
der Zeit bzw. des Ortes auf der Lesezeile, also eine zeitliche Folge von Funktionswerten,
z.B. von Ordinatenwerten oder von unterschiedlichen Amplitudenabständen oder Impulsbreiten,
als Ausgangssignal liefert. Bei diesem Verfahren werden die gelesenen, also abgetasteten
Zeichen in einem Speicher in Form einer für das Zeichen charakteristischen Kurve
bzw. Funktion gespeichert, wobei die aufeinanderfolgenden Adressen des Speichers,
in denen die Funktionswerte enthalten sind, der Abszissenachse (Zeit oder Ort auf
der Lesezeile) entsprechen. Zur Erkennung des gelesenen Zeichens wird bei diesem
Verfahren aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen
Funktionswerten des Zeichens eine für dieses Zeichen charakteristiscl1e Merkmalskombination
gebildet, und diese aus den gemessenen Istwerten des gelesenen Zeichens gebildete
Merkmalskombination wird dann nacheinander jeweils mit jeder von entsprechenden,
äquivalenten Kombinationen von zuvor festgelegten, in einem weiteren Speicher bereitgehaltenen
und für jedes Zeichen der zu lesenden Schrift bzw.
-
Schriftart charakteristischen Sollwerten der Merkmale verglichen,
und dann wird festgestellt, mit welcher der Sollwert-Merkmalskombinationen eincs
der jchriftzeichen die Istwcrtmerkmalskombination des gelesenen Zeichens am besten
übereinstintnt.
-
Solche Verfahren und Vorrichtungen zum maschinellen Lesen von auf
Belegen und dgl. aufgebrachten Zeichen durch Abtasten und Klassifizieren entsprechend
den vorgegebenen Muster- oder Prüfzeichen der fraglichen Schrift, sind bereits bekannt.
So wird beispielsweise in der DE-OS 23 61 899 auf ein System zum Auffinden und Erkennen
von Zeichen auf Belegen hingewiesen, bei dem die Zeichen bzw. Daten zunächst abgetastet
werden, zwischen gespeichert werden und dann über ein Zeichenerkennungssystem klassifiziert
und ausgewertet werden, wodurch die gelesenen Zeichen bzw. Daten tatsächlich erkannt
werden.
-
Derartige Verfahren und Vorrichtungen haben jedoch den Nachteil, daß
durch den Einfluß von Störungen und Ungenauigkeiten die Klassifikation, d.h. die
Erkennung des gelesenen Zeichens durch Vergleich seiner Merkmale mit denen der Muster-
oder Prüfzeichen, erschwert und äußerst unsicher ist, so daß die Leseeinrichtung
oft kein oder ein falsches Zeichen ausgibt. Der Erfindung liegt daher die Aufgabe
zugrunde, ein Verfahren anzugeben, bei dem die Lesesicherheit erhöht wird und eine
bessere Erkennbarkeit der Übereinstimmung und Identifizierung des gelesenen Zeichens
mit einem der Zeichen aus der Gesamtheit der Zeichen der zu lesenden Schrift erreicht
wird. Weiterhin soll mit dem Verfahren das Lesen verschiedener Schriften mit verschiedenen
Schriftzeichen ermöglicht werden.
-
Ferner besteht die Aufgabe der Erfindung auch darin, eine Einrichtung
bzw. Anlage anzugeben, mit der das erfindungsgemäße Verfahren durchführbar ist.
-
Die erfindungsgemäße Lösung dieser Aufgabe besteht darin, daß bei
dem eingangs erwähnten Verfahren nach dem ersten, aus der Bildung und dem Vergleich
einer aus Istwerten yewonnenen Merkmalskombination, d.h. kennzeichnenden Größe des
gelesenen Zeichens mit den
Sollwert-Merkmalskombinotionen bestehenden
Klassifizierungsschritt mindestens noch ein weiterer Klassifizierungsschritt durchgeführt
wird, wobei vor jedem Klossifizierungsschritt die Lage des beispielsweise aus k
Adressen bestehenden Adressenrasters innerhalb des für ein gelesenes Zeichen vorgesehenen,
beispielsweise aus m Adressen bestehenden Adressenraumes uni eine oder mehrere Adressen
in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden
Klassifizierungsschritten verbesserte Übereinstimmung erreicht wird.
-
Cemäß der Erfindung wird also das Adressenraster jeweils so verschoben,
daß sich bei einer der vorgespeicherten Sollwert-Merkmalskombinationen gegenüber
der Istwert-Merkmalskombination des abgetasteten Zeichens ein Minimum der Abweichung
und damit ein Maximum der Übereinstimmwng ergibt. So wird beispielsweise nach dem
ersten Klassifizierungsschritt das Adressenraster um eine Adresse nach oben oder
unten, d.h. in oder gegen die Leserichtung verschoben und eine erneute Klassifizierung
vorgenommen. Ergibt sich dann imner noch keine oder gar eine schlechtere Ubereinstimmung
bei dem Prüfzeichen, so wird für den dann folgenden Klassifizierungsschritt das
Adressenraster gegenüber der ursprünglichen Lage um eine Adresse nach unten oder
oben auf der Abszissenachse, d.h. gegen oder in die Leserichtung verschoben. Ist
dagegen bei dem zweiten Klassifizierungsschritt die Übereinstimmung für eines der
gespeicherten Musterzeichen bzw. dessen Merkmalskombination besser als beirn ersten
geworden, so wird das Adressenraster für den dritten Klassifizierungsschritt noch
um eine weitere Adresse in der gleichen wichtung verschoben, wobei sich dann (falls
nicht schon beim zweiten Klassifizierungsschritt das Optimum erreicht worden ist)
eine noch bessere Ubereinstirnniung ergibt. Man hat es also beim erfindungsgemäßen
Verfahren mit einer Art Regelvorgang
zu tun. Die Verschi@bung des
Adressenr@sters entsprichl der Verschiebung des SteLlglieds, die Abweichung des
abgetasteten Zeichens von einem der Muster oder Prüfzeichen bzw. von dem diesen
Muster zugeordneten Merkmal oder Merkmalskombination entspricht der Regelabweichung,
die nach tiöalichkeit sehr klein, im besten Fall tRull werden soll.
-
Es ist zunächst möglich und naheliegend, den Beginn eines Zeichens
anzunehmen, wenn die gemessenen Funktionswerte gegenüber dem Rausch - und Störpegel
eine gewisse Höhe erreicht haben und dann in einem gewissen, vorgewählten Abszissenabstand
von diesem angenommenen Zeichenanfang die erste Adresse des Adresserirasters für
den ersten Klassifizierungsschritt auszuwählen und herauszugreifen. Im Rahmen der
Erfindung hat sich jedoch gezeigt, daß sich noch eine eindeutigere Festlegung des
Zeichenanfangs erreichen läßt, wenn die Lage der @rsten Adresse des Rasters in Abhüngigkeit
vom Anstieg der abgetasteten Funktionswerte gewählt wird, wenn man also von der
Steilheit, der Änderungsgeschwindigkeit der Zeichenkurve, ausgeht. Es wird also
ständig der Anstieg an jeder Stelle der fortlaufend aufgezeichneten bzw. in aufeinanderfolgenden
Adressen des Speichers aufgenomjene Kurve, die vom Signalausgang des Lesegerät geliefert
wird, überwacht. Erreicht oder überschreitet der Anstieg an einer bestinulltcll
Stelle Lzw. Adresse einen bestimmten Wert, so wird in einem bestimmten Abstand unterhalb
dieses Abszissenwertes bzw. Adresse der Anfang des erfaßten Zeichens festgelegt.
In einem vorgewähiten Abstand hiervon in Richtung aufsteigender Abszissenwerte bzw.
Adressen wird dann die erste Adresse des Adressenrasters für den ersten Klassifizierungsschritt
festgelegt. Durch das erfindungsgemöße Verfuhren ergibt sich so die tiöglichkeit
einer "Zentrierung", d.h. Festleguny der Lage des Zeichens im Adressenraum; denn
durch die Lage der ersten Adresse des
Rasters nach Erreichen des
Maximums der Übereinstimmung beim letzten Klassifizierungsschritt ist dann auch
der Zeichenanfang gegeben. Da auch die Breite des Zeichens, d.h. die Zahl der für
die gesamte, für alle Zeichen gleiche Breite (Abszissenabstand) vom Anfang eines
Zeichens bis zum Anfang des folgenden Zeichens oder Zwischenraumes erforderlichen
Adressen bekannt ist, ist dann auch die Lage des Zeichens im Adressenraum und, solange
keine Störung auftritt auch die der folgenden Zeichen bekannt. Es muß lediglich
im Speicher, in dem die Kurve des Aufgangssignals auf-)gezeichnet wird, eine genügend
große Anzahl von Adressen bzw.
-
Speicherplätzen vorhanden sein, so daß, während die vorbeschriebenen
Verfahrensschritte an einem Zeichen vorgenommen werden, inzwischen das oder die
folgenden Zeichen und Zwischenraurne in ihrem Kurvenverlauf aufgeschrieben werden
könnten.
-
Eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens
geht zunächst aus von einet Lesegerät mit einem Sensor zum Erfassen von auf einem
Beleg aufgebrachten Schriftzeichen, das zur Erzeugung eines dem gelesenen, von dem
Sensor abgetosteten Zeichen entsprechenden Signals ausgebildet ist. Der Sensor spricht
hierbei auf die Merkmale der Schriftzeichen an, die optischer oder magnetischer
Natur sein können. Im letzten Fall handelt es sich um Schriftzeichen aus einer magnetische
oder magnetisierbare Partikel aufweisenden Druckfurbc. £>a Lesegerät erzeugt
bei solchen nagnetischen Schriftzeichen in bekannter Weise während der Bewegung
des Sensors l@ngs der Lese- oder Druckzeile den Verlauf der Änderung des magnetischen
Felds der magnetischen Zeichenteile oder - bei entsprechender Beschaffenheit der
Anlage - des Feldes selbst, so daß sich die Zeichenkurve, wie bei den nachstehend
beschriebenen Beispielen in diesem Fall nur zwischen Null und positiven Werten bewegt.
-
Zur Durchführung des erfindungsgemäßen Verfahrens ist die erfindungsgemäße
Einrichtung gekennzeichnet durch eine Datenverarbeitungsanlage, die einen Speicherbereich
zum Aufnehmen von mindestens zwei aufeinanderfolgenden, vollständigen Zeichensignalen
maximaler Breite einschl. Pausen, einen zweiten Speicherbereich, in dem Kombinationen
von Merkmalswerten für jedes zu verwendende Schriftzeichen mindestens einer der
zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk
mit einem weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerkerk mit
seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegerätes
gelieferten Signale, zum Selektieren, d.h. zum Auswählen der Funktionswerte des
gespeicherten Signals der einzelnen Zeichen aus dem ersten Speicherbereich gernäß
dem vorgegebenen Adressenraster und zum Berechnen von sich aus den Signalwerten
dieser Zeichen ergebenden Merkmalswerten sowie zum Vergleich derselben mit denjenigen
aus dem zweiten Speicherbereich und zur Ausgabe der als übereinstimmend erkannten
Zeichen.
-
Die erfindungsgernäße Durchführung der vorstehend beschriebenen Klassifizierungsschritte
und des ihnen zugrunde liegenden Erkennungsalgorithmus zur Feststellung der Zeichenübereinstimmung
kann in wesentlich kürzerer Zeit durchgeführt werden, als das Lesen und Aufzeichnen
bzw. Speichern der Zeichensignale im ersten Speicherbereich. Im einfachsten Ausführungsfull
der Erfindung kann daher bereits ein Speicherumfang für zwei Zeichen in den meisten
Fällen einigermaßen ausreichen, so daß, während jeweils ein Zeichen geschrieben
wird, die Klassifizierung des anderen erfolgt, und dieses bzw. seine Speicherpldtze
anschließend sofort nach Beendigung der Aufzeichnung des gerade geschriebenen /eichens
gelöscht und weiterbeschrieben werden können. In Weiterbildung der Erfindung erweist
es sich jedoch für Fälle einer stark gestörten Aufzeichnung, bei der sehr viele
IXlassifizierungsversuche bzw. - schritte unternommen
werden müssen,
als vorteilhaft, wenn der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile
von Zeichen ausgebildet ist.
-
Mit der erfindungsgemäßen Vorrichtung lassen sich so Lesegeschwindigkeiten
bis zu 2,5 m/sec. erreichen. Im Rahmen der Erfindung ist auch das Lesen beliebig
vieler Schriften möylich, wenn der zweite Speicherbereich zur Aufnahme der Zeichen
mehrerer verschiedener Schriftarten ausgebildet ist bzw. jeweils mit den Schriftzeichen
verschiedener Schriften bei Bedarf beladen werden kann. Natürlich anguß dann bei
Verwendung einer anderen Schriftart das Programm des Rechen- und Steuerwerkes auch
zur Bildung der dem Zeichen dieser anderen Schriftart zugeordneten Merkmalswerte
ausgestaltet sein.
-
Die Erfindung ist in der @oichnung beisvielsweise und schematisch
3dargestellt. Es zeigen: Fig. 1: ein Beispiel einer Schriftart, Fig. 2: die den
einzelnen Zeichen in Fig. 1 entsprechenden Kurven -bzw. Funktionsverlaufe, )Fig.
3: ein Beispiel für die Ermittlung eines den Beginn eines Zeichens signalisierenden
Kurvenanstiegs, Fig. 4: ein Beispiel eines Kurvenverlaufs für das Zeichen 0, Fig.
5: ein Klassifizierungsbeispiel durch Vergleich der gemessenen mit den Soll-Merkmalskombinationen,
Fig. 6: einen Kurvenverlauf von mehreren, unmittelbar aufeinanderfolgenden Zeichen,
Fig. 7: ein Ablaufdiagramm und Fig. 8: ein Blockscherna einer Rechenanlage.
-
Die Erfindung wird im folgenden am Beispiel einer Schrift bestehend
aus 14 Zeichen, den Ziffern 0 bis 9 und drei Sonderzeichen, dargestellt. Für jedes
Zeichen in Fig. 1 ist in Leserichtung (x-Achse)
die gleiche Breite
vorgesehen. Beim Abtasten des magnetischen Felds der Zeichen durch den Sensor des
Lesegeröts ergeben sich die für jedes Zeichen kennzeichnenden, unterschiedlichen
Kurvenzüge (berecnneter bzw. theoretischer Joll-Vcrlauf) yem. Fig. 2, aus denen
das jweilige Zeichen erkennbar ist. Bei den Beispiel 4 ist die Breite bzw. Lange
eines jeden Zeichens vom Zeichenanfang bis zum Zeichenende (Anfang des folgenden
Zeichens ) durch neun Striche bzw. acht Abschnitte gleicher Breite unterteilt. Die
Funktionswerte dieses ungestörten Sollwertverlaufs (Sollkurve) an diesen neun sind
bereits charakteristisch und repräsentativ für jedes Zeichen. Für die Darstellung
des gesamten Kurvenverlaufs eines Zeichens sind für das hier beschriebene Beispiel
jeweils 8 . 7 = 56 Speichcradressen im Speicher vorgesehen. Die Adressen entsprechen
den Werten auf der Abszissenachse, d.h. in Leserichtung,und enthalten die diesen
Abszissenwerten zugeordneten Funktionswerte.
-
Bei der Abtastung einer Lesezeile durch den Sensor ist zunächst festzustellen,
ob und wo ein Anstieg der ständig gemessenen (Funktions-)werte des Abtastsignals
erfolgt, der über den Störpegel hinausgeht und kein Störsignal sondern den Beginn
eines Zeichens darstellt. Dies kann, wie bereits erwähnt, in an sich bekannter Weise
durch ständige Messung des jeweiligen Kurvenzugs und Bildung des entsprechenden
Differenti@lquotienten erreicht werden. In Fig. 3 ist eine einfache Näherungsmethode
zur Feststellung eines Zeichenanstiegs dargestellt. Gemäß dieser Methode ergibt
sich bei der Untersuchung des gemessenen und gespeicherten Kurvenverlaufs ein vorläufiger
Zeichenanfang bei einer Stelle bzw. Adresse x mit dem Funktionswert y dann, wenn
die in den nachfolgenden Adressen x + 1, x + 2 und x + 4 gespeicherten entsprechenden
Funktionswerte y1' Y2 und y4 die Bedingungen (y1 >y + 1) + (Y2 zy+ 2) + (y4 #
y + 5)
erfüllen. Ist eine solche Stelle bzw. Adresse x mit diesen
Bedingungen als vorläufiger Zeichenanfang ermittelt worden, so wird das im folgenden
anhand der Figur 4 erläuterte Meßverfahren durchgeführt.
-
Figur 4 zeigt einen durch St(jrungen veränderten Kurvenverlauf, der
von dem Zeichen 0 herrührt. Ist ein vorläufiger Zeichenanfang durch Messung des
Anstiegs festgestellt worden, so kann dann das Zeichen durch Abtasten des Kurvenverlaufs
und Feststellung der Funktionswerte in den dann folgenden, für eine Zeichenbreite
vorgesehenen m Adressen (hier m = 56) identifiziert werden. Wenn beispielsweise
bei Aufzeichnung und Speichern des abgetasteten Signals in den Adressen des ersten
Spcicherbereiches bei völlig ungestörtem, idealem Sollwertverlauf der Zeichenkurve
der berechnete Zeichenanfang ZA an der durch die gestrichelte Linie O in Figur 4
markierten Stelle läge, die z.B. einer bestimmten Adresse n + O im Speicher entsprächc,
so wären in den dann folgenden 56 Adressen die Funktionswerte y aufgrund des Sollwetverlaufs
bereits festgelegt, insbesondere die Werte an den weiteren Linien bzw. Stellen
1,2,
... 8 in Figur 4, die dann den Adressen n + 7, n + 14 usw.
-
@is n + 56 entsprächen.
-
im allgemeinen ist die Zeichenlage und das Zeichen selbst unbekannt.
-
s wird daher zunächst, wenn beim Abtasten der Lesezeile und Speichern
des empfangenen Signals in aufeinanderfolgenden Adressen ein einen Zeichenanfang
signulisierender Anstieg (vgl. oben) erkannt und so ein vorläufiger Ecichenanfang
ZA (xO/ y0) festgelegt ist in einem Abstand (hier z.B. 7 Adressen weiter) davon
ein Raster von mehreren, insgesamt k weiteren Adressen (hier k = 8) ausgewählt,
Sie ebenfalls voneinander gleichen Abstand (hier jeweils 7 Adressen) aufweisen.
Die entsprechenden, zugehören Funktionswerte Y1 y2, y8 werden dem Speicher entnommen.
Aufgrund des bekannten Sollver-
laufs der einzelnen, vorgegebenen
Zeichen (Fig. 1 und 2) lassen sich in bekannter Weise sog. Merkmalsvektoren aus
den Funktionswerten yO - Y8 für die einzelnen Zeichen bilden. Diese Merkmalsvektoren
ergeben sich als bestimmte Größenbedingungen zwischen den verschiedenen Funktionswerten.
Sie sind für bestimmte Zeichen erfüllt, d.h. haben den Wert 1, oder nicht erfüllt,
das heißt haben dann den Wert 0, je nachdem welches Zeichen der betreffenden Schriftart
bzw. welcher Kurvenzug gemäß Fig. 2 in dem aufgrund der Messung gespeicherten und
abgetasteten Kurvenzug enthalten ist. Die Anzahl der Merkmalsvektoren, die man aufgrund
der vorgegebenen Kurvenverläufe bilden kann, hängt ab von der Qualität bzw. Genauigkeit,
mit der die Kurvenverläufe repräsentiert und gekennzeichnet werden sollen. In der
beigefügten Liste am Schluß der Beschreibung ist ein Beispiel für eine besonders
zweckmäßige Auswahl von Merkmalsvektoren MVM (hier M = 1, 2, ... 24) für die hier
verwendete Schriftart gemäß Fig. 1 und 2 angegeben.
-
Aus diesen Merkmalsvektoren lassen sich für jedes Zeichen charakteristische
Kombinationen, am einfachsten jeweils in Form einer Sumne kr bilden (hier N = 1,
2 ... 14). In der erwähnten Liste ist daher auch ein Beispiel für eine vorteilhafte
Bildung dieser Merkmalskombinationen für die Zeichen der hier behandelten Schriftart,
sog. Zeichenklassen, angegeben. Die Werte j ergeben sich also als Summe aus den
verschiedenen Merkmalsvektoren, wobei MVM = 1 und MV = O ist.
-
M Durch entsprechende Auswahl und Kombination von für die einzelnen
Zeichen charakteristischen Funktionswerten y0' YOI yk für die Bildung von Merkmalsvektoren
und durch deren Auswahl und Kombination kann unschwer erreicht werden, daß beim
Vorliegen eines bestimmten
Zeichens immer nur eine Merkmalskombination
KN sich ihrem Sollwert nähert.
-
Die gemessenen bzw. errechneten Istwertc K0 ist' K1 ist' ... K14 ist
werden verglichen mit den gespeicherten Sollwerten K0 soll' K1 soll, K14 soll Dies
geschieht am einfachsten durch Verhältnisbildung.
-
Fig. 5 zeigt daher den Verlavf der Größe WN = KN ist , die man KN
soll als Wahrscheinlichkeit der Erkennungssicherheit bezeichnen kann.
-
Hierbei bildet der punktierte kurvenverlauf in Fig. 5 das Ergebnis
eines Klassifizierungsschrittes bzw. Veryleichsversuches beispielsweise mit einer
Adressenraster in einer ersten, vorläufigen Lage mit den Adressen x1, x2, ... xk
in Fig. 4. Wird alsdann gemäß der Erfindung ein weiterer Versuch bzw. Klassifizierungsschritt
unternommen mit einem um eine Einheit bzw. Adresse nach rechts verschobenen Adressenraster
mit den Adressen x1, , x2, , ... xkl , so ergibt sich aus den dann gemessenen Funktionswerten
Y1. , y21 , ... , y8' und nach Bildung der Merkmalsvektoren MVM und der für die
Zeichen charakteristischen Werte Kr der gestrichelte Verlauf in Figur 5.
-
Dieser zweite Versuch läßt bereits eine größere Übereinstimmung bzw.
Übereinstimmungswahrscheinlichkeit für das Zeichen 0 erkennen.
-
Ein weiterer erfindungsgemäßer Klassifizierungsschritt mit einem nochmals
um eine weitere Adresse in Fig. 4 verschobenen Adressenraster, das dann also bei
der Adresse x1'' beginnt, so erhält man nach nochmaliger Durchführung des gleichen
Klassifizierungsverfahrens den mit einer durchgehenden Linie dargestellten Kurvenzug
in Fig. 5, d.h. die Wahrscheinlichkeit 1 dafür, daß das gen1essene und in seinem
Verlauf mehrmals abgetastete Zeichen das Zeichen 0 ist. Durch solche erfindungsgemäße
Wiederholung der Klassifizierung eines gemessenen Zeichenverlaufs bis zu einer größtmöglichen
Über-
einstimmung erreicht unten nicht nur eine llohc Erkennungssicherheit
für das gelesene Zeichen. Durch die Lage des Adressenrasters beim letzten Klassifizierungsschritt
mit der erreichten größtmöglichen Übereinstimmung ist auch der genaue Zeichenanfang
ZA des gelesenen und gemessenen Zeichens fes-tgelegt. Da für jedes Zeichen gleiche
Breite auf der Lesezeile uI0 damit auch die gleiche Adressenanzahl im Speicher vorgesehen
ist, ist mit der Erkennung des ersten Zeichens und seines Zeichenanfangs ZA auch
der jeweilige Zeichenanfang für die dann folgenden Zeichen festgelegt, solange keine
Störungen auftreten. Die Anfänge der nachfolgenden Zeichen lassen sich vorher bestimmen,
wenn ein Zeichenanfang ermittelt worden ist. Figur 6 zeigt ein Beispiel für drei
aufeinanderfolgende Zeichen 0, 1 und 2.
-
Es ist leicht einzusehen, daß derartige Zeichen bzw. die ihnen entsprechenden
Kurvenzüge nicht nur durch die vorbeschriebene Abtastung der Funktionswerte und
Bildung von Merkmalsvektoren erkannt und klassifiziert werden können, sondern beispielsweise
auch durch Messung der Impulsbreite oder/und ihrer Lage längs der Abszissen- bzw.
Adressenachse, da diese Größen, wie man leicht aus den Bildern in Figur 2 ersehen
kann, ebenfalls für jedes Zeichen charakteristische Flerkmalskombinationen darstellen.
Uie Impulsbreite läßt sich leicht durch Bildung bzw. Messung des ersten und zweiten
Differentialquotienten feststellen. Das erfindungsgemäße Verfahren ist daher mit
allen bekannten Zeichenerkennungssystemen bzw. Klassifizierungsmethoden durchführbar.
-
Figur 7 zeigt noch einmal den Ablauf des erfindungsgemaßen Verfahrens
anhand des beschriebenen Beispiels. Nach dem Aufzeichnen und Speichern der Kurve
des gelesenen Zeichens werden die Funktionswerte y in den einzelnen Speicheradressen
fortlaufend dahingehend
überprüft, ob ein Zeichenanfang ZA vorliegt
oder nicht. Wenn ja, werden aus den Funktionswerten Y1 ... Yk eines ersten Adressenrasters
xl ... xk die Nerkmalsvektoren MVM und daraus mit Hilfe der Merkmalskombinationen
KN die Erkennungswahrscheinlichkeit WN gebildet. Alsdann wird der gleiche Vorgang,
wie breits beschrieben, mit einem etwas geänderten Adressenraster wiederholt und
geprüft, ob die Erkennungswahrscheinlichkeit WN eines bestimmten Zeichens sich dem
Wert 1 genügend weit angenähert hat.
-
Ist die Annäherung bzw. Übereinstimmung groß genug, wird das erkannte
Zeichen ausgegeben.
-
Figur 8 zeigt eine Anordnung zur Durchführung des Verfahrens.
-
Das vom Lesegerät 1 aufgenommene Signal des gelesenen Zeichens wird
in einem Speicher 2 einer Datenverarbeitungsanlage abgelegt.
-
Durch das Rechen- und Steuerwerk 3 werden dann die Funktionswerte
der gemessenen und gespeicherten Kurve mit in einem Speicher 4 vorhandenen, den
einzelnen Zeichen der Schriftart entsprechenden Sollwertmerkmalen verglichen und
klassifiziert. Das dann aufgrund des erfindungsgemäßen Verfahrens erkanntc Zeichen
wird hierauf über die Ausgabeeinheit 5 ausgegeben. Das Programm für die Tätigkeit
des Rechen- und Steuerwerks 3 ist im Speicher 6 abgelegt.
-
S t ü c k l i s t e 1 Lesegerät 2 Speicher 3 Rechen- und Steuerwerk
4 Speicher 5 Ausgabeeinheit 6 Speicher
LISTE DER MERKMALSVEKTOREN
MV1 = Y7 + y5 > y4 + y3 MV13 = y1 > y2 MV2 = y7 > y5 MV14 = y5 + y1 >
y4 + y2 MV3 = y6 > y4 MV15 = y4 + y1 > y3 + y2 MV4 = y5 > y3 MV16 = y1
+ y0 > y8 + y8 MV5 = y6 > y3 MV17 = y3 > y2 MV6 = y6 + y3 > y5 + y1
MV18 = y4 > y1 MV@ = y5 + y5 > y6 + y1 MV19 = y2 > y7 MV8 = y5 + y4 >
y3 + y0 MV20 = y7 + y2 > y6 + y5 MV9 = y@ + y6 + y2 > y4 + y3 MV21 = y5 +
y0 > y4 + y8 MV10 = y5 + y8 > y4 + y2 MV22 = y2 + y1 > y4 + y0 MV11 = y7
+ y8 > y4 + y3 MV23 = y4 + y1 > y5 + y6 MV12 = y1 > y6 MV24 = y1 + y3 >
y5 + y6
LISTE DER MERKMAI SKOMBINATIONEN K0 = MV1 + MV2 + MV12
+ MV13 + MV14 + MV15 + MV6 + MV7 + MV18 + MV19 K1 = MV6 + MV16 + MV17 + MV20 + MV1
+ MV3 + MV4 + MV5 + MV8 + MV9 + MV10 + MV11 + MV14 + MV15 + MV21 K2 = MV8 + MV12
+ MV13 + MV15 + MV16 + MV19 + MV20 + MV1 + MV3 + MV4 + MV5 + MV6 + MV9 + MV10 +
MV11 + MV14 K3 + MV8 + MV9 + MV12 + MV1@ + MV19 + MV20 + MV2 + MV3 + MV5 + MV6 +
MV10 + MV11 + MV13 + MV14 + MV15 + MV17 K4 + MV1 + MV3 + MV4 + MV9 +MV10 + MV14
+ MV16 + MV21 + MV22 + MV2 + MV17 + MV18 K5 = MV4 + MV@ + MV8 + MV12 + MV13 + MV14
+ MV15 + MV16 + MV19 + MV2 + MV3 + MV5 + MV6 + MV@ + MV11 + MV18 K6 = MV3 + MV3
+ MV13 + MV1@ + MV1@ + MV1 + MV2 + MV@ K@ = MV13 + MV14 + MV16 + MV1@ + MV1 + MV2
+ MV3 + MV4 + MV5 + MV5 + MV15 K8 = MV3 + MV5 + MV8 + MV9 + MV16 + MV1@ + MV@ +
MV10 + MV11 + MV12 + MV14 + MV15 + MV1@ + MV23 + MV24 K9 = MV3 + MV5 + MV9 + MV12
+ MV14 + MV19 + MV2 + MV7 + MV10 + MV17
KONUS = MV1 + MV7 + MV9
+ MV10 + MV12 + MV14 + MV5 + MV6 + MV15 KTRANSIT = MV2 + MV3 + MV6 + MV9 + MV24
+ MV4 + MV@ + MV8 + MV10 + MV15 + MV18 KPASH = MV2 + MV13 + MV15 + MV1@ + MV22 +
MV23 + MV1 + MV4 + MV19 KA@@UNT = MV2 + MV3 + MV8 + MV9 + MV15 + MV3 + MV10 + MV14
+ MV1@