DE3406694C2 - - Google Patents
Info
- Publication number
- DE3406694C2 DE3406694C2 DE3406694A DE3406694A DE3406694C2 DE 3406694 C2 DE3406694 C2 DE 3406694C2 DE 3406694 A DE3406694 A DE 3406694A DE 3406694 A DE3406694 A DE 3406694A DE 3406694 C2 DE3406694 C2 DE 3406694C2
- Authority
- DE
- Germany
- Prior art keywords
- character
- characters
- read
- values
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V10/7515—Shifting the patterns to accommodate for positional errors
Description
Die Erfindung betrifft ein Verfahren zum maschinellen Lesen
nach dem Oberbegriff des Patentanspruches 1 und eine
Vorrichtung zur Durchführung des Verfahrens nach dem
Oberbegriff des Patentanspruches 2.
Das Verfahren dient zum
Auffinden und Erkennen von Zeichen einer Schrift auf
Belegen oder dgl. mit einem Lesegerät, das für jedes von
einem Sensor bei Bewegung längs einer Lesezeile
abgetasteten Zeichen eine für dieses Zeichen
charakteristische Funktion der Zeit bzw. des Ortes auf der
Lesezeile, also eine zeitliche Folge von Funktionswerten,
z. B. von Ordinatenwerten oder von unterschiedlichen
Amplitudenabständen oder Impulsbreiten, als Ausgangssignal
liefert. Bei diesem Verfahren werden die gelesenen, also
abgetasteten Zeichen in einem Speicher in Form einer für
das Zeichen charakteristischen Kurve bzw. Funktion
gespeichert, wobei die aufeinanderfolgenden Adressen des
Speichers, in denen die Funktionswerte enthalten sind, der
Abszissenachse (Zeit oder Ort auf der Lesezeile)
entsprechen. Zur Erkennung des gelesenen Zeichens wird bei
diesem Verfahren aus einer Anzahl von in einem Raster von
Speicheradressen enthaltenen Funktionswerten des Zeichens
eine für dieses Zeichen charakteristische
Merkmalkombination gebildet, und diese aus den gemessenen
Istwerten des gelesenen Zeichens gebildete
Merkmalskombination wird dann nacheinander jeweils mit
jeder von entsprechenden, äquivalenten Kombinationen von
zuvor festgelegten, in einem weiteren Speicher
bereitgehalten und für jedes Zeichen der zu lesenden
Schrift bzw. Schriftart charakteristischen Sollwerten der
Merkmale verglichen, und dann wird festgestellt, mit
welcher der Sollwert-Merkmalskombinationen eines der
Schriftzeichen die Istwertmerkmalskombination des gelesenen
Zeichens am besten übereinstimmt.
Solche Verfahren und Vorrichtungen zum maschinellen Lesen
von auf Belegen und dgl. aufgebrachten Zeichen durch
Abtasten und Klassifizieren entsprechend den vorgegebenen
Mustern- oder Prüfzeichen der fraglichen Schrift, sind
bereits bekannt. So wird beispielsweise in der DE-OS 23 61 899
auf ein System zum Auffinden und Erkennen von Zeichen
auf Belegen hingewiesen, bei dem die Zeichen bzw. Daten
zunächst abgetastet werden, zwischengespeichert werden und
dann über ein Zeichenerkennungssystem klassifiziert und
ausgewertet werden, wodurch die gelesenen Zeichen bzw.
Daten tatsächlich erkannt werden.
Bei einer Einrichtung gemäß der DE-OS 30 13 833 wird ein
auf einem Gegenstand aufgebrachtes Muster schrittweise an
einer Prüfeinrichtung vorbeibewegt, wobei jeweils
Informationen über Teilmuster, die dem zu prüfenden Muster
entsprechen, gewonnen werden, die dann in einem weiteren
Arbeitsschritt mit weiteren Informationen, die ein
vorbestimmtes Standardmuster darstellen, verglichen werden,
um den Parameter zu ermitteln, der das Ausmaß der
Fehlerhaftigkeit der betreffenden Teilmuster anzeigt. In
einem dritten Arbeitsschritt werden die während des zweiten
Arbeitsschrittes gewonnen Parameter mit einem vorher
eingestellten Schwellenwert zur Beurteilung der Richtigkeit
des zu prüfenden Musters verglichen.
Bei einer ähnlich arbeitenden Musterlagen-
Erkennungsvorrichtung wird das Bild eines Musters auf einem
Chip mit einer Fernsehkamera aufgenommen und gespeichert.
Es werden einzelne Musterbereiche, die kleiner als das zu
untersuchende Muster sind, jeweils als Musterdaten aus dem
Speicher ausgelesen und die jeweils ausgelesenen
Musterbereichsdaten mit entsprechenden Bezugsmusterdaten
eines Bezugsmusters verglichen, wobei die jeweiligen
Koinzidenzgrade zwischen dem Musterbereich und dem
Bezugsmuster berechnet werden. Nach der Bestimmung der
Koinzidenzgrade für das gesamte Muster wird nach Maßgabe
der Speicheradresse die Lage oder Position des
Musterbereiches mit dem höchsten dieser Koinzidenzgrade
bestimmt.
Derartige Verfahren und Vorrichtungen haben jedoch den
Nachteil, daß durch den Einfluß von Störungen und
Ungenauigkeiten die Klassifikation, d. h. die Erkennung des
gelesenen Zeichens durch Vergleich seiner Merkmale mit
denen der Muster- oder Prüfzeichen, erschwert und äußerst
unsicher ist, so daß die Leseeinrichtung oft kein oder ein
falsches Zeichen ausgibt. Der Erfindung liegt daher die
Aufgabe zugrunde, ein Verfahren und eine Vorrichtung
anzugeben, bei dem die Lesesicherheit erhöht wird und eine
bessere Erkennbarkeit der Übereinstimmung und
Identifizierung des gelesenen Zeichens mit einem der
Zeichen aus der Gesamtheit der Zeichen der zu lesenden
Schrift erreicht wird.
Diese Aufgabe wird gelöst durch das Verfahren nach dem
Patentanspruch 1 bzw. die Vorrichtung nach dem
Patentanspruch 2. Das heißt, daß bei dem eingangs erwähnten
Verfahren nach dem ersten, aus der Bildung und dem
Vergleich einer aus Istwerten gewonnenen
Merkmalskombination, d. h. kennzeichnenden Größe des
gelesenen Zeichens mit den Sollwert-Merkmalskombinationen
bestehenden Klassifizierungsschritt mindestens noch ein
weitererer Klassifizierungsschritt durchgeführt wird, wobei
vor jedem Klassifizierungsschritt die Lage des
beispielsweise aus k Adressen bestehenden Adressenrasters
innerhalb des für ein gelesenes Zeichen vorgesehenen,
beispielsweise aus m Adressen bestehenden Adressenraumes um
eine oder mehrere Adressen in oder gegen die Leserichtung
so verschoben wird, daß eine gegenüber den vorhergehenden
Klassifizierungsschritten verbesserte Übereinstimmung
erreicht wird.
Es wird also das Adressenraster jeweils so verschoben, daß
sich bei einer der vorgespeicherten Sollwert-
Merkmalskombinationen gegenüber der Istwert-
Merkmalskombination des abgetasteten Zeichens ein Minimum
der Abweichung und damit ein Maximum der Übereinstimmung
ergibt. So wird beispielsweise nach dem ersten
Klassifizierungsschritt das Adressenraster um eine Adresse
nach oben oder unten, d. h. in oder gegen die Leserichtung
verschoben und eine erneute Klassifizierung vorgenommen.
Ergibt sich dann immer noch keine oder gar eine schlechtere
Übereinstimmung bei dem Prüfzeichen, so wird für den dann
folgenden Klassifizierungsschritt das Adressenraster
gegenüber der ursprünglichen Lage um eine Adresse nach
unten oder oben auf der Abszissenachse, d. h. gegen oder in
die Leserichtung verschoben. Ist dagegen bei dem zweiten
Klassifizierungsschritt die Übereinstimmung für eines der
gespeicherten Musterzeichen bzw. dessen Merkmalskombination
besser als beim ersten geworden, so wird das Adressenraster
für den dritten Klassifizierungsschritt noch um eine
weitere Adresse in der gleichen Richtung verschoben, wobei
sich dann (falls nicht schon beim zweiten
Klassifizierungsschritt das Optimum erreicht worden ist)
eine noch bessere Übereinstimmung ergibt. Man hat es also
beim erfindungsgemäßen Verfahren mit einer Art Regelvorgang
zu tun. Die Verschiebung des Adressenrasters entspricht der
Verschiebung des Stellglieds, die Abweichung des
abgetasteten Zeichens von einem der Muster oder Prüfzeichen
bzw. von dem diesem Muster zugeordneten Merkmal oder
Merkmalskombination entspricht der Regelabweichung, die
nach Möglichkeit sehr klein, im besten Fall Null werden
soll.
Es ist zunächst denkbar, den Beginn eines Zeichens
anzunehmen, wenn die gemessenen Funktionswerte gegenüber
dem Rausch- und Störpegel eine gewisse Höhe erreicht haben
und dann in einem gewissen, vorgewählten Abszissenabstand
von diesem angenommenen Zeichenanfang die erste Adresse des
Adressenrasters für den ersten Klassifizierungsschritt
auszuwählen und herauszugreifen. Im Rahmen der Erfindung
hat sich jedoch gezeigt, daß sich noch eine eindeutigere
Festlegung des Zeichenanfangs erreichen läßt, wenn die Lage
der ersten Adresse des Rasters in Abhängigkeit vom Anstieg
der abgetasteten Funktionswerte gewählt wird, wenn man also
von der Steilheit der Änderungsgeschwindigkeit der
Zeichenkurve ausgeht. Es wird also ständig der Anstieg an
jeder Stelle der fortlaufend aufgezeichneten bzw. in
aufeinanderfolgenden Adressen des Speichers aufgenommene
Kurve, die vom Signalausgang des Lesegeräts geliefert wird,
überwacht. Erreicht oder überschreitet der Anstieg an einer
bestimmten Stelle bzw. Adresse einen bestimmten Wert, so
wird in einem bestimmten Abstand unterhalb dieses
Abszissenwertes bzw. Adresse der Anfang des erfaßten
Zeichens festgelegt. In einem vorgewählten Abstand hiervon
in Richtung aufsteigender Abszissenwerte bzw. Adressen wird
dann die erste Adresse des Adressenrasters für den ersten
Klassifizierungsschritt festgelegt. Durch das
erfindungsgemäße Verfahren ergibt sich so die Möglichkeit
einer "Zentrierung", d. h. Festlegung der Lage des Zeichens
im Adressenraum; denn durch die Lage der ersten Adresse des
Rasters nach Erreichen des Maximums der Übereinstimmung
beim letzten Klassifizierungsschritt ist dann auch der
Zeichenanfang gegeben. Da auch die Breite des Zeichens,
d. h. die Zahl der für die gesamte, für alle Zeichen gleiche
Breite (Abszissenabstand) vom Anfang eines Zeichens bis zum
Anfang des folgenden Zeichens oder Zwischenraumes
erforderlichen Adressen bekannt ist, ist dann auch die Lage
des Zeichens im Adressenraum und, solange keine Störung
auftritt, auch die der folgenden Zeichen bekannt. Es muß
lediglich im Speicher, in dem die Kurve des
Ausgangssignales aufgezeichnet wird, eine genügend große
Anzahl von Adressen bzw. Speicherplätzen vorhanden sein, so
daß, während die vorbeschriebenen Verfahrensschritte an
einem Zeichen vorgenommen werden, inzwischen das oder die
folgenden Zeichen und Zwischenräume in ihrem Kurvenverlauf
aufgeschrieben werden können. Erst durch diese Festlegung
eines eindeutigen Bezugspunktes für die Lage der ersten
Adresse wird eine eindeutige und zuverlässige
Zeichenerkennung gewährleistet.
Eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens
geht zunächst aus von einem Lesegerät mit einem Sensor zum Erfassen
von auf einem Beleg aufgebrachten Schriftzeichen, das zur
Erzeugung eines dem gelesenen, von dem Sensor abgetasteten Zeichen
entsprechenden Signals ausgebildet ist. Der Sensor spricht hierbei
auf die Merkmale der Schriftzeichen an, die optischer oder magnetischer
Natur sein können. Im letzten Fall handelt es sich um Schriftzeichen
aus einer magnetische oder magnetisierbare Partikel
aufweisenden Druckfarbe. Das Lesegerät erzeugt bei solchen magnetischen
Schriftzeichen in bekannter Weise während der Bewegung des
Sensors längs der Lese- oder Druckzeile den Verlauf der Änderung
des magnetischen Felds der magnetischen Zeichenteile oder - bei
entsprechender Beschaffenheit der Anlage - des Feldes selbst, so
daß sich die Zeichenkurve, wie bei den nachstehend beschriebenen
Beispielen in diesem Fall nur zwischen Null und positiven Werten
bewegt.
Zur Durchführung des erfindungsgemäßen Verfahrens ist die
erfindungsgemäße Einrichtung gekennzeichnet durch eine Datenverarbeitungsanlage,
die einen Speicherbereich zum Aufnehmen von mindestens
zwei aufeinanderfolgenden, vollständigen Zeichensignalen
maximaler Breite einschließlich Pausen, einen zweiten Speicherbereich,
in dem Kombinationen von Merkmalswerten für jedes zu verwendende
Schriftzeichen mindestens einer der zu lesenden Schrift als
Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem
weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerwerk
mit seinem Programm ausgebildet ist zum Aufnehmen der von
dem Ausgang des Lesegerätes gelieferten Signale, zum Selektieren,
d. h. zum Auswählen der Funktionswerte des gespeicherten Signals
der einzelnen Zeichen aus dem ersten Speicherbereich gemäß dem
vorgegebenen Adressenraster und zum Berechnen von sich aus den
Signalwerten dieser Zeichen ergebenden Merkmalswerten sowie zum
Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich
und zur Ausgabe der als übereinstimmend erkannten Zeichen.
Die erfindungsgemäße Durchführung der vorstehend beschriebenen
Klassifizierungsschritte und des ihnen zugrunde liegenden
Erkennungsalgorithmus zur Festlegung der Zeichenübereinstimmung kann
in wesentlich kürzerer Zeit durchgeführt werden, als das Lesen und
Aufzeichnen bzw. Speichern der Zeichensignale im ersten Speicherbereich.
Im einfachsten Ausführungsfall der Erfindung kann daher
bereits ein Speicherumfang für zwei Zeichen in den meisten Fällen
einigermaßen ausreichen, so daß, während jeweils ein Zeichen
geschrieben wird, die Klassifizierung des anderen erfolgt, und dieses
bzw. seine Speicherplätze anschließend sofort nach Beendigung der
Aufzeichnung des gerade geschriebenen Zeichens gelöscht und weiterbeschrieben
werden können. In Weiterbildung der Erfindung erweist
es sich jedoch für Fälle einer stark gestörten Aufzeichnung, bei
der sehr viele Klassifizierungsversuche bzw. -schritte unternommen
werden müssen, als vorteilhaft, wenn der erste Speicherbereich
zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.
Mit der erfindungsgemäßen Vorrichtung lassen sich so Lesegeschwindigkeiten
bis zu 2,5 m/sec erreichen. Im Rahmen der Erfindung ist
auch das Lesen beliebig vieler Schriften möglich, wenn der zweite
Speicherbereich zur Aufnahme der Zeichen mehrerer verschiedener
Schriftarten ausgebildet ist bzw. jeweils mit den Schriftzeichen
verschiedener Schriften bei Bedarf beladen werden kann. Natürlich
muß dann bei Verwendung einer anderen Schriftart das Programm des
Rechen- und Steuerwerkes auch zur Bildung der dem Zeichen dieser anderen
Schriftart zugeordneten Merkmalswerte ausgestaltet sein.
Die Erfindung ist in der Zeichnung beispielsweise und schematisch
dargestellt. Es zeigen:
Fig. 1: ein Beispiel einer Schriftart,
Fig. 2: die den einzelnen Zeichen in Fig. 1 entsprechenden Kurven-
bzw. Funktionsverkäufe,
Fig. 3: ein Beispiel für die Ermittlung eines den Beginn eines
Zeichens signalisierenden Kurvenanstiegs,
Fig. 4: ein Beispiel eines Kurvenverlaufs für das Zeichen 0,
Fig. 5: ein Klassifizierungsbeispiel durch Vergleich der gemessenen
mit den Soll-Merkmalskombinationen,
Fig. 6: einen Kurvenverlauf von mehreren, unmittelbar aufeinanderfolgenden
Zeichen,
Fig. 7: ein Ablaufdiagramm und
Fig. 8: ein Blockschema einer Rechenanlage.
Die Erfindung wird im folgenden am Beispiel einer Schrift bestehend
aus 14 Zeichen, den Ziffern 0 bis 9 und drei Sonderzeichen, dargestellt.
Für jedes Zeichen in Fig. 1 ist in Leserichtung (x-Achse)
die gleiche Breite vorgesehen. Beim Abtasten des magnetischen
Felds der Zeichen durch den Sensor des Lesegeräts ergeben sich
die für jedes Zeichen kennzeichnenden, unterschiedlichen Kurvenzüge
(berechneter bzw. theoretischer Soll-Verlauf) gem. Fig. 2,
aus denen das jeweilige Zeichen erkennbar ist. Bei dem Beispiel 4
ist die Breite bzw. Länge eines jeden Zeichens vom Zeichenanfang
bis zum Zeichenende (Anfang des folgenden Zeichens) durch neun
Striche bzw. acht Abschnitte gleicher Breite unterteilt. Die
Funktionswerte dieses ungestörten Sollwertverlaufs (Sollkurve)
an diesen neun sind bereits charakteristisch und repräsentativ
für jedes Zeichen. Für die Darstellung des gesamten Kurvenverlaufs
eines Zeichens sind für das hier beschriebene Beispiel jeweils
8 · 7 = 56 Speicheradressen im Speicher vorgesehen. Die
Adressen entsprechen den Werten auf der Abszissenachse, d. h. in
Leserichtung, und enthalten die diesen Abszissenwerten zugeordneten
Funktionswerte.
Bei der Abtastung einer Lesezeile durch den Sensor ist zunächst
festzustellen, ob und wo ein Anstieg der ständig gemessenen (Funktions-)werte
des Abtastsignals erfolgt, der über den Störpegel
hinausgeht und kein Störsignal sondern den Beginn eines Zeichens
darstellt. Dies kann, wie bereits erwähnt, in an sich bekannter
Weise durch ständige Messung des jeweiligen Kurvenzugs und Bildung
den entsprechenden Differentialquotienten erreicht werden. In
Fig. 3 ist eine einfache Näherungsmethode zur Feststellung eines
Zeichenanstiegs dargestellt. Gemäß dieser Methode ergibt sich bei
der Untersuchung des gemessenen und gespeicherten Kurvenverlaufs
ein vorläufiger Zeichenanfang bei einer Stelle bzw. Adresse x mit
dem Funktionswert y dann, wenn die in den nachfolgenden Adressen
x + 1, x + 2 und x + 4 gespeicherten entsprechenden Funktionswerte
y 1, y 2 und y 4 die Bedingungen
(y 1 <y + 1) + (y 2 ≧ y + 2) + (y 4 ≧ y + 5)
erfüllen. Ist eine solche Stelle bzw. Adresse x mit diesen Bedingungen
als vorläufiger Zeichenanfang ermittelt worden, so wird
das im folgenden anhand der Fig. 4 erläuterte Meßverfahren durchgeführt.
Fig. 4 zeigt einen durch Störungen veränderten Kurvenverlauf, der
von dem Zeichen 0 herrührt. Ist ein vorläufiger Zeichenanfang durch
Messung des Anstiegs festgestellt worden, so kann dann das Zeichen
durch Abtasten des Kurvenverlaufs und Feststellung der Funktionswerte
in den dann folgenden, für eine Zeichenbreite vorgesehenen
m Adressen (hier m = 56) identifiziert werden. Wenn beispielsweise
bei Aufzeichnung und Speichern des abgetasteten Signals in
den Adressen des ersten Speicherbereiches bei völlig ungestörtem,
idealem Sollwertverlauf der Zeichenkurve der berechnete Zeichenanfang
ZA an der durch die gestrichelte Linie 0 in Fig. 4 markierten
Stelle läge, die z. B. einer bestimmten Adresse n + 0 im
Speicher entspräche, so wären in den dann folgenden 56 Adressen
die Funktionswerte y aufgrund des Sollwertverlaufs bereits festgelegt,
insbesondere die Werte an den weiteren Linien bzw. Stellen 1,
2, . . . 8 in Fig. 4, die dann den Adressen n + 7, n + 14 usw.
bis n + 56 entsprächen.
Im allgemeinen ist die Zeichenlage und das Zeichen selbst unbekannt.
Es wird daher zunächst, wenn beim Abtasten der Lesezeile und Speichern
des empfangenen Signals in aufeinanderfolgenden Adressen ein
einen Zeichenanfang signalisierender Anstieg (vgl. oben) erkannt
und so ein vorläufiger Zeichenanfang ZA (x 0/y 0) festgelegt ist
in einem Abstand (hier z. B. 7 Adressen weiter) davon ein Raster von
mehreren, insgesamt k weiteren Adressen (hier k = 8) ausgewählt,
die ebenfalls voneinander gleichen Abstand (hier jeweils 7 Adressen)
aufweisen. Die entsprechenden, zugehörigen Funktionswerte y 1, y 2, . . .
y 8 werden dem Speicher entnommen. Aufgrund des bekannten Sollverlaufs
der einzelnen, vorgesehenen Zeichen (Fig. 1 und 2) lassen
sich in bekannter Weise sog. Merkmalsvektoren aus den Funktionswerten
y 0 - y 8 für die einzelnen Zeichen bilden. Diese Merkmalsvektoren
ergeben sich als bestimmte Größenbedingungen zwischen
den verschiedenen Funktionswerten. Sie sind für bestimmte Zeichen
erfüllt, d. h. haben den Wert 1, oder nicht erfüllt, das heißt
haben dann den Wert 0, je nachdem welches Zeichen der betreffenden
Schriftart bzw. welcher Kurvenzug gemäß Fig. 2 in dem aufgrund
der Messung gespeicherten und abgetasteten Kurvenzug enthalten
ist. Die Anzahl der Merkmalsvektoren, die man aufgrund der
vorgegebenen Kurvenverläufe bilden kann, hängt ab von der Qualität
bzw. Genauigkeit, mit der die Kurvenverläufe repräsentiert
und gekennzeichnet werden sollen. In der beigefügten Liste am
Schluß der Beschreibung ist ein Beispiel für eine besonders zweckmäßige
Auswahl von Merkmalsvektoren MV M (hier M = 1, 2, . . . 24)
für die hier verwendete Schriftart gemäß Fig. 1 und 2 angegeben.
Aus diesen Merkmalsvektoren lassen sich für jedes Zeichen charakteristische
Kombinationen, am einfachsten jeweils in Form einer
Summe K N bilden (hier N = 1, 2 . . . 14). In der erwähnten Liste ist
daher auch ein Beispiel für eine vorteilhafte Bildung dieser Merkmalskombinationen
für die Zeichen der hier behandelten Schriftart,
sog. Zeichenklassen, angegeben. Die Werte K N ergeben sich also als
Summe aus den verschiedenen Merkmalsvektoren, wobei
ist.
Durch entsprechende Auswahl und Kombination von für die einzelnen
Zeichen charakteristischen Funktionswerten y 0, . . . x k für die Bildung
von Merkmalsvektoren und durch deren Auswahl und Kombination
kann unschwer erreicht werden, daß beim Vorliegen eines bestimmten
Zeichens immer nur eine Merkmalskombination K N sich ihrem Sollwert
nähert.
Die gemessenen bzw. errechneten Istwerte K 0ist , K 1ist , . . . K 14ist
werden verglichen mit den gespeicherten Sollwerten K 0soll , K 1soll , . . .
K 14soll . Dies geschieht am einfachsten durch Verhältnisbildung.
Fig. 5 zeigt daher den Verlauf der Größe
die man
als Wahrscheinlichkeit der Erkennungssicherheit bezeichnen kann.
Hierbei bildet der punktierte Kurvenverlauf in Fig. 5 das Ergebnis
eines Klassifizierungsschrittes bzw. Vergleichsversuches beispielsweise
mit einer Adressenraster in einer ersten, vorläufigen Lage
mit den Adressen x 1, x 2, . . . x k in Fig. 4. Wird alsdann gemäß der
Erfindung ein weiterer Versuch bzw. Klassifizierungsschritt unternommen
mit einem um eine Einheit bzw. Adresse nach rechts verschobenen
Adressenraster mit den Adressen x 1′, x 2′, . . . x k′ , so
ergibt sich aus den dann gemessenen Funktionswerten y ′, y 2′, . . . y 8′,
und nach Bildung der Merkmalsvektoren MV M und der für die Zeichen
charakteristischen Werte K N der gestrichelte Verlauf in Fig. 5.
Dieser zweite Versuch läßt bereits eine größere Übereinstimmung
bzw. Übereinstimmungswahrscheinlichkeit für das Zeichen 0 erkennen.
Ein weiterer erfindungsgemäßer Klassifizierungsschritt mit einem
nochmals um eine weitere Adresse in Fig. 4 verschobenen Adressenraster,
das dann also bei der Adresse x 1″ beginnt, so erhält man
nach nochmaliger Durchführung des gleichen Klassifizierungsverfahrens
den mit einer durchgehenden Linie dargestellten Kurvenzug
in Fig. 5, d. h. die Wahrscheinlichkeit 1 dafür, daß das gemessene
und in seinem Verlauf mehrmals abgetastete Zeichen das Zeichen 0
ist. Durch solche erfindungsgemäße Wiederholung der Klassifizierung
eines gemessenen Zeichenverlaufs bis zu einer größtmöglichen Übereinstimmung
erreicht man nicht nur eine hohe Erkennungssicherheit
für das gelesene Zeichen. Durch die Lage des Adressenrasters beim
letzten Klassifizierungsschritt mit der erreichten größtmöglichen
Übereinstimmung ist auch der genaue Zeichenanfang ZA des gelesenen
und gemessenen Zeichens festgelegt. Da für jedes Zeichen
gleiche Breite auf der Lesezeile und damit auch die gleiche Adressenanzahl
im Speicher vorgesehen ist, ist mit der Erkennung des
ersten Zeichens und seines Zeichenanfangs ZA auch der jeweilige
Zeichenanfang für die dann folgenden Zeichen festgelegt, solange
keine Störungen auftreten. Die Anfänge der nachfolgenden Zeichen
lassen sich vorher bestimmen, wenn ein Zeichenanfang ermittelt
worden ist. Fig. 6 zeigt ein Beispiel für drei aufeinanderfolgende
Zeichen 0, 1 und 2.
Es ist leicht einzusehen, daß derartige Zeichen bzw. die ihnen
entsprechenden Kurvenzüge nicht nur durch die vorbeschriebene
Abtastung der Funktionswerte und Bildung von Merkmalsvektoren
erkannt und klassifiziert werden können, sondern beispielsweise
auch durch Messung der Impulsbreite oder/und ihrer Lage längs
der Abszissen- bzw. Adressenachse, da diese Größen, wie man leicht
aus den Bildern in Fig. 2 ersehen kann, ebenfalls für jedes Zeichen
charakteristische Merkmalskombinationen darstellen. Die Impulsbreite
läßt sich leicht durch Bildung bzw. Messung des ersten
und zweiten Differentialquotienten feststellen. Das erfindungsgemäße
Verfahren ist daher mit allen bekannten Zeichenerkennungssystemen
bzw. Klassifizierungsmethoden durchführbar.
Fig. 7 zeigt noch einmal den Ablauf des erfindungsgemäßen
Verfahrens anhand des beschriebenen Beispiels. Nach dem Aufzeichnen
und Speichern der Kurve des gelesenen Zeichens werden die Funktionswerte
y in den einzelnen Speicheradressen fortlaufend dahingehend
überprüft, ob ein Zeichenanfang ZA vorliegt oder nicht. Wenn ja,
werden aus den Funktionswerten y 1, . . . y k eines ersten Adressenrasters
x₁ . . . x k die Merkmalsvektoren
MV M und daraus mit Hilfe
der Merkmalskombinationen K N die Erkennungswahrscheinlichkeit
W N gebildet. Alsdann wird der gleiche Vorgang, wie bereits beschrieben,
mit einem etwas geänderten Adressenraster wiederholt
und geprüft, ob die Erkennungswahrscheinlichkeit W N eines
bestimmten Zeichens sich dem Wert 1 genügend weit angenähert hat.
Ist die Annäherung bzw. Übereinstimmung groß genug, wird das
erkannte Zeichen ausgegeben.
Fig. 8 zeigt eine Anordnung zur Durchführung des Verfahrens.
Das vom Lesegerät 1 aufgenommene Signal des gelesenen Zeichens
wird in einem Speicher 2 einer Datenverarbeitungsanlage abgelegt.
Durch das Rechen- und Steuerwerk 3 werden dann die Funktionswerte
der gemessenen und gespeicherten Kurve mit in einem Speicher 4
vorhandenen, den einzelnen Zeichen der Schriftart entsprechenden
Sollwertmerkmalen verglichen und klassifiziert. Das dann aufgrund
des erfindungsgemäßen Verfahrens erkannte Zeichen wird hierauf
über die Ausgabeeinheit 5 ausgegeben. Das Programm für die Tätigkeit
des Rechen- und Steuerwerks 3 ist im Speicher 6 abgelegt.
- Stückliste
1 Lesegerät
2 Speicher
3 Rechen- und Steuerwerk
4 Speicher
5 Ausgabeeinheit
6 Speicher
MV 1
= y 7 + y 5 < y 4 + y 3
MV 2
= y 7 < y 5
MV 3
= y 6 < y 4
MV 4
= y 5 < y 3
MV 5
= y 6 < y 3
MV 6
= y 6 + y 3 < y 5 + y 1
MV 7
= y 5 + y 5 < y 6 + y 1
MV 8
= y 5 + y 4 < y 3 + y 0
MV 9
= y 7 + y 6 + y 2 < y 4 + y 3 + y 8
MV 10
= y 5 + y 8 < y 4 + y 2
MV 11
= y 7 + y 8 < y 4 + y 3
MV 12
= y 1 < y 6
MV 13
= y 1 < y 2
MV 14
= y 5 + y 1 < y 4 + y 2
MV 15
= y 4 + y 1 < y 3 + y 2
MV 16
= y 1 + y 0 < y 8 + y 8
MV 17
= y 3 < y 2
MV 18
= y 4 < y 1
MV 19
= y 2 < y 7
MV 20
= y 7 + y 2 < y 6 + y 5
MV 21
= y 5 + y 0 < y 4 + y 8
MV 22
= y 2 + y 1 < y 4 + y 0
MV 23
= y 4 + y 1 < y 5 + y 6
MV 24
= y 1 + y 3 < y 5 + y 6
Claims (4)
1. Verfahren zum maschinellen Lesen von Schriftzeichen mit
einem Lesegerät, das für jedes von einem Sensor abgetastete
Zeichen eine für dieses Zeichen charakteristische Folge von
Funktionswerten als Ausgangssignal liefert, wobei die
gelesenen Zeichen gespeichert werden und aus einer Anzahl von
in einem Raster von Speicheradressen enthaltenen Funktionswerten
eines gelesenen Zeichens eine für dieses Zeichen
charakteristische Merkmalskombination gebildet und dann
mit jeder von entsprechenden Merkmalskombinationen von
zuvor festgelegten, für jedes Zeichen der zu lesenden Schrift
bzw. Schriftart charakteristischen Sollwerten der Merkmale
verglichen wird, und festgestellt wird, mit welcher der
Sollwert-Merkmalskombinationen eines der Schriftzeichen die
Istwert-Merkmalskombination des gelesenen Zeichens am besten
übereinstimmt, dadurch gekennzeichnet, daß
nach diesem ersten, durch Bildung und Vergleich einer aus
Istwerten gewonnenen Merkmalskombination des gelesenen
Zeichens mit den Sollwert-Merkmalskombinationen erfolgenden
Klassifizierungsschritt mindestens noch ein weiterer
Klassifizierungsschritt durchgeführt wird, wobei vor jedem
Klassifizierungsschritt die Lage des Adressenrasters innerhalb
des für ein zu lesendes Zeichen vogesehenen Adressenraums
um eine oder mehrere Adressen in oder gegen die
Leserichtung so verschoben wird, daß eine gegenüber den
vorhergehenden Klassifizierungsschritten verbesserte Übereinstimmung
erreicht wird, wobei die Lage der ersten Adresse
des Adressenrasters in Abhängigkeit vom Anstieg der
abgetasteten Funktionswerte gewählt wird.
2. Vorrichtung zur Durchführung des Verfahrens nach Anspruch 1
mit einem einen Sensor zum Erfassen von Schriftzeichen aufweisenden
Lesegerät, das zur Erzeugung eines dem gelesenen Zeichen entsprechenden
Signals ausgebildet ist, gekennzeichnet
durch eine Datenverarbeitungsanlage, die einen Speicherbereich
zum Aufnehmen von mindestens zwei aufeinanderfolgenden vollständigen
Zeichensignalen maximaler Breite einschließlich Pausen, einen
zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten
für jedes zu verwendende Schriftzeichen der zu lesenden Schrift
als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk
mit einem weiteren Programmspeicher aufweist, wobei das Rechen-
und Steuerwerk mit seinem Programm ausgebildet ist zum Aufnehmen
der von dem Ausgang des Lesegeräts gelieferten Signale, zum Selektieren
der einzelnen Zeichen aus dem ersten Speicherbereich und
zum Berechnen von sich aus den Signalwerten dieser Zeichen
ergebenden Merkmalswerten, sowie zum Vergleich derselben mit denjenigen
aus dem zweiten Speicherbereich und zur Ausgabe der als
übereinstimmend erkannten Zeichen.
3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet,
daß der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile
von Zeichen ausgebildet ist.
4. Vorrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet,
daß der zweite Speicher zur Aufnahme der Zeichen mehrerer
verschiedener Schriften oder Schriftarten ausgebildet ist.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19843406694 DE3406694A1 (de) | 1984-02-24 | 1984-02-24 | Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19843406694 DE3406694A1 (de) | 1984-02-24 | 1984-02-24 | Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3406694A1 DE3406694A1 (de) | 1985-09-05 |
DE3406694C2 true DE3406694C2 (de) | 1988-04-07 |
Family
ID=6228699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19843406694 Granted DE3406694A1 (de) | 1984-02-24 | 1984-02-24 | Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE3406694A1 (de) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3818445A (en) * | 1972-12-18 | 1974-06-18 | Ibm | Character data search system |
DE3013833C2 (de) * | 1979-04-13 | 1986-07-03 | Hitachi, Ltd., Tokio/Tokyo | Vorrichtung zur Prüfung eines auf einem Gegenstand befindlichen Musters auf Fehler |
JPS58201185A (ja) * | 1982-05-19 | 1983-11-22 | Toshiba Corp | 位置検出装置 |
-
1984
- 1984-02-24 DE DE19843406694 patent/DE3406694A1/de active Granted
Also Published As
Publication number | Publication date |
---|---|
DE3406694A1 (de) | 1985-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0040796B1 (de) | Verfahren zum automatischen Klassifizieren von Bild- und Text- oder Graphikbereichen auf Druckvorlagen | |
EP0409310B1 (de) | Verfahren sowie Anordnung zum Bestimmen von Kanten in Bildern | |
DE2831582C2 (de) | Verfahren zur Identifizierung einer Person und Vorrichtung zur Durchführung des Verfahrens | |
DE3515159C2 (de) | ||
DE3738304A1 (de) | Vorrichtung zum pruefen von banknoten | |
DE3633743A1 (de) | Zeichenerkennungssystem | |
DE2417282B2 (de) | Vorrichtung zum Lesen von Fingerabdrücken | |
DE2844156A1 (de) | Verfahren zum verifizieren eines sprechers | |
DE3904129A1 (de) | Einrichtung zum ueberpruefen von dokumenten | |
WO1982001778A1 (en) | Method and device for the marking and/or identification of a data medium | |
DE3322443A1 (de) | Mustererkennungsvorrichtung | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE3026055C2 (de) | Schaltungsanordnung zur maschinellen Zeichererkennung | |
DE3622222A1 (de) | Zeichenerkennung in zweidimensionalen signalen | |
EP0104369A2 (de) | Einrichtung und Verfahren zum optischen Erkennen von Flächenmustern an Objekten | |
DE3406694C2 (de) | ||
EP0753231B1 (de) | Verfahren und vorrichtung zum binarisieren von pixel-daten | |
DE2905606C2 (de) | Verfahren und Einrichtung zum Identifizieren von Dokumenten | |
DE19724711B4 (de) | Verfahren und Vorrichtung zum Erkennen und Lesen eines an einem Objekt vorgesehenen Strichcodes | |
DE19612465C2 (de) | Automatisches Optimieren von Objekt-Erkennungssystemen | |
DE2112919C3 (de) | Anordnung zum Erkennen von Zeichen | |
DE3822671C2 (de) | ||
DE3238300A1 (de) | Verfahren und vorrichtung zur muster- oder zeichenerkennung | |
DE10326032B4 (de) | Verfahren zum Selbsttest eines Bildverarbeitungssystems | |
DE102021202878A1 (de) | Verfahren zur Reichweitenbestimmung für einen LiDAR-Sensor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: KLEINDIENST DATENTECHNIK GMBH, 8900 AUGSBURG, DE |