DE3406694A1 - Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen - Google Patents

Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Info

Publication number
DE3406694A1
DE3406694A1 DE19843406694 DE3406694A DE3406694A1 DE 3406694 A1 DE3406694 A1 DE 3406694A1 DE 19843406694 DE19843406694 DE 19843406694 DE 3406694 A DE3406694 A DE 3406694A DE 3406694 A1 DE3406694 A1 DE 3406694A1
Authority
DE
Germany
Prior art keywords
character
characters
values
read
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19843406694
Other languages
English (en)
Other versions
DE3406694C2 (de
Inventor
Werner Dipl.-Ing. 8901 Leitershofen Gleich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kleindienst Datentechnik 8900 Augsburg De GmbH
Original Assignee
Kleindienst 8900 Augsburg GmbH
Kleindienst GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kleindienst 8900 Augsburg GmbH, Kleindienst GmbH and Co KG filed Critical Kleindienst 8900 Augsburg GmbH
Priority to DE19843406694 priority Critical patent/DE3406694A1/de
Publication of DE3406694A1 publication Critical patent/DE3406694A1/de
Application granted granted Critical
Publication of DE3406694C2 publication Critical patent/DE3406694C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

  • Verfahren und Vorrichtuna zum maschinellen Lesen von Schriftzeichen
  • Die Erfindung betrifft e4h' Verfahren und Vorrichtungen zum maschinellen Lesen, d.h. zum Auffinden und Erkennen von Zeichen einer Schrift auf Belegen oder dgl. mit einem Lesegerät, das für jedes von einem Sensor bei Bewegung längs einer Lesezeile abgetasteten Zeichen eine für dieses Zeichen charakteristische Funktion der Zeit bzw. des Ortes auf der Lesezeile, also eine zeitliche Folge von Funktionswerten, z.B. von Ordinatenwerten oder von unterschiedlichen Amplitudenabständen oder Impulsbreiten, als Ausgangssignal liefert. Bei diesem Verfahren werden die gelesenen, also abgetasteten Zeichen in einem Speicher in Form einer für das Zeichen charakteristischen Kurve bzw. Funktion gespeichert, wobei die aufeinanderfolgenden Adressen des Speichers, in denen die Funktionswerte enthalten sind, der Abszissenachse (Zeit oder Ort auf der Lesezeile) entsprechen. Zur Erkennung des gelesenen Zeichens wird bei diesem Verfahren aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen Funktionswerten des Zeichens eine für dieses Zeichen charakteristiscl1e Merkmalskombination gebildet, und diese aus den gemessenen Istwerten des gelesenen Zeichens gebildete Merkmalskombination wird dann nacheinander jeweils mit jeder von entsprechenden, äquivalenten Kombinationen von zuvor festgelegten, in einem weiteren Speicher bereitgehaltenen und für jedes Zeichen der zu lesenden Schrift bzw.
  • Schriftart charakteristischen Sollwerten der Merkmale verglichen, und dann wird festgestellt, mit welcher der Sollwert-Merkmalskombinationen eincs der jchriftzeichen die Istwcrtmerkmalskombination des gelesenen Zeichens am besten übereinstintnt.
  • Solche Verfahren und Vorrichtungen zum maschinellen Lesen von auf Belegen und dgl. aufgebrachten Zeichen durch Abtasten und Klassifizieren entsprechend den vorgegebenen Muster- oder Prüfzeichen der fraglichen Schrift, sind bereits bekannt. So wird beispielsweise in der DE-OS 23 61 899 auf ein System zum Auffinden und Erkennen von Zeichen auf Belegen hingewiesen, bei dem die Zeichen bzw. Daten zunächst abgetastet werden, zwischen gespeichert werden und dann über ein Zeichenerkennungssystem klassifiziert und ausgewertet werden, wodurch die gelesenen Zeichen bzw. Daten tatsächlich erkannt werden.
  • Derartige Verfahren und Vorrichtungen haben jedoch den Nachteil, daß durch den Einfluß von Störungen und Ungenauigkeiten die Klassifikation, d.h. die Erkennung des gelesenen Zeichens durch Vergleich seiner Merkmale mit denen der Muster- oder Prüfzeichen, erschwert und äußerst unsicher ist, so daß die Leseeinrichtung oft kein oder ein falsches Zeichen ausgibt. Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren anzugeben, bei dem die Lesesicherheit erhöht wird und eine bessere Erkennbarkeit der Übereinstimmung und Identifizierung des gelesenen Zeichens mit einem der Zeichen aus der Gesamtheit der Zeichen der zu lesenden Schrift erreicht wird. Weiterhin soll mit dem Verfahren das Lesen verschiedener Schriften mit verschiedenen Schriftzeichen ermöglicht werden.
  • Ferner besteht die Aufgabe der Erfindung auch darin, eine Einrichtung bzw. Anlage anzugeben, mit der das erfindungsgemäße Verfahren durchführbar ist.
  • Die erfindungsgemäße Lösung dieser Aufgabe besteht darin, daß bei dem eingangs erwähnten Verfahren nach dem ersten, aus der Bildung und dem Vergleich einer aus Istwerten yewonnenen Merkmalskombination, d.h. kennzeichnenden Größe des gelesenen Zeichens mit den Sollwert-Merkmalskombinotionen bestehenden Klassifizierungsschritt mindestens noch ein weiterer Klassifizierungsschritt durchgeführt wird, wobei vor jedem Klossifizierungsschritt die Lage des beispielsweise aus k Adressen bestehenden Adressenrasters innerhalb des für ein gelesenes Zeichen vorgesehenen, beispielsweise aus m Adressen bestehenden Adressenraumes uni eine oder mehrere Adressen in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden Klassifizierungsschritten verbesserte Übereinstimmung erreicht wird.
  • Cemäß der Erfindung wird also das Adressenraster jeweils so verschoben, daß sich bei einer der vorgespeicherten Sollwert-Merkmalskombinationen gegenüber der Istwert-Merkmalskombination des abgetasteten Zeichens ein Minimum der Abweichung und damit ein Maximum der Übereinstimmwng ergibt. So wird beispielsweise nach dem ersten Klassifizierungsschritt das Adressenraster um eine Adresse nach oben oder unten, d.h. in oder gegen die Leserichtung verschoben und eine erneute Klassifizierung vorgenommen. Ergibt sich dann imner noch keine oder gar eine schlechtere Ubereinstimmung bei dem Prüfzeichen, so wird für den dann folgenden Klassifizierungsschritt das Adressenraster gegenüber der ursprünglichen Lage um eine Adresse nach unten oder oben auf der Abszissenachse, d.h. gegen oder in die Leserichtung verschoben. Ist dagegen bei dem zweiten Klassifizierungsschritt die Übereinstimmung für eines der gespeicherten Musterzeichen bzw. dessen Merkmalskombination besser als beirn ersten geworden, so wird das Adressenraster für den dritten Klassifizierungsschritt noch um eine weitere Adresse in der gleichen wichtung verschoben, wobei sich dann (falls nicht schon beim zweiten Klassifizierungsschritt das Optimum erreicht worden ist) eine noch bessere Ubereinstirnniung ergibt. Man hat es also beim erfindungsgemäßen Verfahren mit einer Art Regelvorgang zu tun. Die Verschi@bung des Adressenr@sters entsprichl der Verschiebung des SteLlglieds, die Abweichung des abgetasteten Zeichens von einem der Muster oder Prüfzeichen bzw. von dem diesen Muster zugeordneten Merkmal oder Merkmalskombination entspricht der Regelabweichung, die nach tiöalichkeit sehr klein, im besten Fall tRull werden soll.
  • Es ist zunächst möglich und naheliegend, den Beginn eines Zeichens anzunehmen, wenn die gemessenen Funktionswerte gegenüber dem Rausch - und Störpegel eine gewisse Höhe erreicht haben und dann in einem gewissen, vorgewählten Abszissenabstand von diesem angenommenen Zeichenanfang die erste Adresse des Adresserirasters für den ersten Klassifizierungsschritt auszuwählen und herauszugreifen. Im Rahmen der Erfindung hat sich jedoch gezeigt, daß sich noch eine eindeutigere Festlegung des Zeichenanfangs erreichen läßt, wenn die Lage der @rsten Adresse des Rasters in Abhüngigkeit vom Anstieg der abgetasteten Funktionswerte gewählt wird, wenn man also von der Steilheit, der Änderungsgeschwindigkeit der Zeichenkurve, ausgeht. Es wird also ständig der Anstieg an jeder Stelle der fortlaufend aufgezeichneten bzw. in aufeinanderfolgenden Adressen des Speichers aufgenomjene Kurve, die vom Signalausgang des Lesegerät geliefert wird, überwacht. Erreicht oder überschreitet der Anstieg an einer bestinulltcll Stelle Lzw. Adresse einen bestimmten Wert, so wird in einem bestimmten Abstand unterhalb dieses Abszissenwertes bzw. Adresse der Anfang des erfaßten Zeichens festgelegt. In einem vorgewähiten Abstand hiervon in Richtung aufsteigender Abszissenwerte bzw. Adressen wird dann die erste Adresse des Adressenrasters für den ersten Klassifizierungsschritt festgelegt. Durch das erfindungsgemöße Verfuhren ergibt sich so die tiöglichkeit einer "Zentrierung", d.h. Festleguny der Lage des Zeichens im Adressenraum; denn durch die Lage der ersten Adresse des Rasters nach Erreichen des Maximums der Übereinstimmung beim letzten Klassifizierungsschritt ist dann auch der Zeichenanfang gegeben. Da auch die Breite des Zeichens, d.h. die Zahl der für die gesamte, für alle Zeichen gleiche Breite (Abszissenabstand) vom Anfang eines Zeichens bis zum Anfang des folgenden Zeichens oder Zwischenraumes erforderlichen Adressen bekannt ist, ist dann auch die Lage des Zeichens im Adressenraum und, solange keine Störung auftritt auch die der folgenden Zeichen bekannt. Es muß lediglich im Speicher, in dem die Kurve des Aufgangssignals auf-)gezeichnet wird, eine genügend große Anzahl von Adressen bzw.
  • Speicherplätzen vorhanden sein, so daß, während die vorbeschriebenen Verfahrensschritte an einem Zeichen vorgenommen werden, inzwischen das oder die folgenden Zeichen und Zwischenraurne in ihrem Kurvenverlauf aufgeschrieben werden könnten.
  • Eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens geht zunächst aus von einet Lesegerät mit einem Sensor zum Erfassen von auf einem Beleg aufgebrachten Schriftzeichen, das zur Erzeugung eines dem gelesenen, von dem Sensor abgetosteten Zeichen entsprechenden Signals ausgebildet ist. Der Sensor spricht hierbei auf die Merkmale der Schriftzeichen an, die optischer oder magnetischer Natur sein können. Im letzten Fall handelt es sich um Schriftzeichen aus einer magnetische oder magnetisierbare Partikel aufweisenden Druckfurbc. £>a Lesegerät erzeugt bei solchen nagnetischen Schriftzeichen in bekannter Weise während der Bewegung des Sensors l@ngs der Lese- oder Druckzeile den Verlauf der Änderung des magnetischen Felds der magnetischen Zeichenteile oder - bei entsprechender Beschaffenheit der Anlage - des Feldes selbst, so daß sich die Zeichenkurve, wie bei den nachstehend beschriebenen Beispielen in diesem Fall nur zwischen Null und positiven Werten bewegt.
  • Zur Durchführung des erfindungsgemäßen Verfahrens ist die erfindungsgemäße Einrichtung gekennzeichnet durch eine Datenverarbeitungsanlage, die einen Speicherbereich zum Aufnehmen von mindestens zwei aufeinanderfolgenden, vollständigen Zeichensignalen maximaler Breite einschl. Pausen, einen zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten für jedes zu verwendende Schriftzeichen mindestens einer der zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem weiteren Programmspeicher aufweist, wobei das Rechen- und Steuerkerk mit seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegerätes gelieferten Signale, zum Selektieren, d.h. zum Auswählen der Funktionswerte des gespeicherten Signals der einzelnen Zeichen aus dem ersten Speicherbereich gernäß dem vorgegebenen Adressenraster und zum Berechnen von sich aus den Signalwerten dieser Zeichen ergebenden Merkmalswerten sowie zum Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich und zur Ausgabe der als übereinstimmend erkannten Zeichen.
  • Die erfindungsgernäße Durchführung der vorstehend beschriebenen Klassifizierungsschritte und des ihnen zugrunde liegenden Erkennungsalgorithmus zur Feststellung der Zeichenübereinstimmung kann in wesentlich kürzerer Zeit durchgeführt werden, als das Lesen und Aufzeichnen bzw. Speichern der Zeichensignale im ersten Speicherbereich. Im einfachsten Ausführungsfull der Erfindung kann daher bereits ein Speicherumfang für zwei Zeichen in den meisten Fällen einigermaßen ausreichen, so daß, während jeweils ein Zeichen geschrieben wird, die Klassifizierung des anderen erfolgt, und dieses bzw. seine Speicherpldtze anschließend sofort nach Beendigung der Aufzeichnung des gerade geschriebenen /eichens gelöscht und weiterbeschrieben werden können. In Weiterbildung der Erfindung erweist es sich jedoch für Fälle einer stark gestörten Aufzeichnung, bei der sehr viele IXlassifizierungsversuche bzw. - schritte unternommen werden müssen, als vorteilhaft, wenn der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.
  • Mit der erfindungsgemäßen Vorrichtung lassen sich so Lesegeschwindigkeiten bis zu 2,5 m/sec. erreichen. Im Rahmen der Erfindung ist auch das Lesen beliebig vieler Schriften möylich, wenn der zweite Speicherbereich zur Aufnahme der Zeichen mehrerer verschiedener Schriftarten ausgebildet ist bzw. jeweils mit den Schriftzeichen verschiedener Schriften bei Bedarf beladen werden kann. Natürlich anguß dann bei Verwendung einer anderen Schriftart das Programm des Rechen- und Steuerwerkes auch zur Bildung der dem Zeichen dieser anderen Schriftart zugeordneten Merkmalswerte ausgestaltet sein.
  • Die Erfindung ist in der @oichnung beisvielsweise und schematisch 3dargestellt. Es zeigen: Fig. 1: ein Beispiel einer Schriftart, Fig. 2: die den einzelnen Zeichen in Fig. 1 entsprechenden Kurven -bzw. Funktionsverlaufe, )Fig. 3: ein Beispiel für die Ermittlung eines den Beginn eines Zeichens signalisierenden Kurvenanstiegs, Fig. 4: ein Beispiel eines Kurvenverlaufs für das Zeichen 0, Fig. 5: ein Klassifizierungsbeispiel durch Vergleich der gemessenen mit den Soll-Merkmalskombinationen, Fig. 6: einen Kurvenverlauf von mehreren, unmittelbar aufeinanderfolgenden Zeichen, Fig. 7: ein Ablaufdiagramm und Fig. 8: ein Blockscherna einer Rechenanlage.
  • Die Erfindung wird im folgenden am Beispiel einer Schrift bestehend aus 14 Zeichen, den Ziffern 0 bis 9 und drei Sonderzeichen, dargestellt. Für jedes Zeichen in Fig. 1 ist in Leserichtung (x-Achse) die gleiche Breite vorgesehen. Beim Abtasten des magnetischen Felds der Zeichen durch den Sensor des Lesegeröts ergeben sich die für jedes Zeichen kennzeichnenden, unterschiedlichen Kurvenzüge (berecnneter bzw. theoretischer Joll-Vcrlauf) yem. Fig. 2, aus denen das jweilige Zeichen erkennbar ist. Bei den Beispiel 4 ist die Breite bzw. Lange eines jeden Zeichens vom Zeichenanfang bis zum Zeichenende (Anfang des folgenden Zeichens ) durch neun Striche bzw. acht Abschnitte gleicher Breite unterteilt. Die Funktionswerte dieses ungestörten Sollwertverlaufs (Sollkurve) an diesen neun sind bereits charakteristisch und repräsentativ für jedes Zeichen. Für die Darstellung des gesamten Kurvenverlaufs eines Zeichens sind für das hier beschriebene Beispiel jeweils 8 . 7 = 56 Speichcradressen im Speicher vorgesehen. Die Adressen entsprechen den Werten auf der Abszissenachse, d.h. in Leserichtung,und enthalten die diesen Abszissenwerten zugeordneten Funktionswerte.
  • Bei der Abtastung einer Lesezeile durch den Sensor ist zunächst festzustellen, ob und wo ein Anstieg der ständig gemessenen (Funktions-)werte des Abtastsignals erfolgt, der über den Störpegel hinausgeht und kein Störsignal sondern den Beginn eines Zeichens darstellt. Dies kann, wie bereits erwähnt, in an sich bekannter Weise durch ständige Messung des jeweiligen Kurvenzugs und Bildung des entsprechenden Differenti@lquotienten erreicht werden. In Fig. 3 ist eine einfache Näherungsmethode zur Feststellung eines Zeichenanstiegs dargestellt. Gemäß dieser Methode ergibt sich bei der Untersuchung des gemessenen und gespeicherten Kurvenverlaufs ein vorläufiger Zeichenanfang bei einer Stelle bzw. Adresse x mit dem Funktionswert y dann, wenn die in den nachfolgenden Adressen x + 1, x + 2 und x + 4 gespeicherten entsprechenden Funktionswerte y1' Y2 und y4 die Bedingungen (y1 >y + 1) + (Y2 zy+ 2) + (y4 # y + 5) erfüllen. Ist eine solche Stelle bzw. Adresse x mit diesen Bedingungen als vorläufiger Zeichenanfang ermittelt worden, so wird das im folgenden anhand der Figur 4 erläuterte Meßverfahren durchgeführt.
  • Figur 4 zeigt einen durch St(jrungen veränderten Kurvenverlauf, der von dem Zeichen 0 herrührt. Ist ein vorläufiger Zeichenanfang durch Messung des Anstiegs festgestellt worden, so kann dann das Zeichen durch Abtasten des Kurvenverlaufs und Feststellung der Funktionswerte in den dann folgenden, für eine Zeichenbreite vorgesehenen m Adressen (hier m = 56) identifiziert werden. Wenn beispielsweise bei Aufzeichnung und Speichern des abgetasteten Signals in den Adressen des ersten Spcicherbereiches bei völlig ungestörtem, idealem Sollwertverlauf der Zeichenkurve der berechnete Zeichenanfang ZA an der durch die gestrichelte Linie O in Figur 4 markierten Stelle läge, die z.B. einer bestimmten Adresse n + O im Speicher entsprächc, so wären in den dann folgenden 56 Adressen die Funktionswerte y aufgrund des Sollwetverlaufs bereits festgelegt, insbesondere die Werte an den weiteren Linien bzw. Stellen 1,2, ... 8 in Figur 4, die dann den Adressen n + 7, n + 14 usw.
  • @is n + 56 entsprächen.
  • im allgemeinen ist die Zeichenlage und das Zeichen selbst unbekannt.
  • s wird daher zunächst, wenn beim Abtasten der Lesezeile und Speichern des empfangenen Signals in aufeinanderfolgenden Adressen ein einen Zeichenanfang signulisierender Anstieg (vgl. oben) erkannt und so ein vorläufiger Ecichenanfang ZA (xO/ y0) festgelegt ist in einem Abstand (hier z.B. 7 Adressen weiter) davon ein Raster von mehreren, insgesamt k weiteren Adressen (hier k = 8) ausgewählt, Sie ebenfalls voneinander gleichen Abstand (hier jeweils 7 Adressen) aufweisen. Die entsprechenden, zugehören Funktionswerte Y1 y2, y8 werden dem Speicher entnommen. Aufgrund des bekannten Sollver- laufs der einzelnen, vorgegebenen Zeichen (Fig. 1 und 2) lassen sich in bekannter Weise sog. Merkmalsvektoren aus den Funktionswerten yO - Y8 für die einzelnen Zeichen bilden. Diese Merkmalsvektoren ergeben sich als bestimmte Größenbedingungen zwischen den verschiedenen Funktionswerten. Sie sind für bestimmte Zeichen erfüllt, d.h. haben den Wert 1, oder nicht erfüllt, das heißt haben dann den Wert 0, je nachdem welches Zeichen der betreffenden Schriftart bzw. welcher Kurvenzug gemäß Fig. 2 in dem aufgrund der Messung gespeicherten und abgetasteten Kurvenzug enthalten ist. Die Anzahl der Merkmalsvektoren, die man aufgrund der vorgegebenen Kurvenverläufe bilden kann, hängt ab von der Qualität bzw. Genauigkeit, mit der die Kurvenverläufe repräsentiert und gekennzeichnet werden sollen. In der beigefügten Liste am Schluß der Beschreibung ist ein Beispiel für eine besonders zweckmäßige Auswahl von Merkmalsvektoren MVM (hier M = 1, 2, ... 24) für die hier verwendete Schriftart gemäß Fig. 1 und 2 angegeben.
  • Aus diesen Merkmalsvektoren lassen sich für jedes Zeichen charakteristische Kombinationen, am einfachsten jeweils in Form einer Sumne kr bilden (hier N = 1, 2 ... 14). In der erwähnten Liste ist daher auch ein Beispiel für eine vorteilhafte Bildung dieser Merkmalskombinationen für die Zeichen der hier behandelten Schriftart, sog. Zeichenklassen, angegeben. Die Werte j ergeben sich also als Summe aus den verschiedenen Merkmalsvektoren, wobei MVM = 1 und MV = O ist.
  • M Durch entsprechende Auswahl und Kombination von für die einzelnen Zeichen charakteristischen Funktionswerten y0' YOI yk für die Bildung von Merkmalsvektoren und durch deren Auswahl und Kombination kann unschwer erreicht werden, daß beim Vorliegen eines bestimmten Zeichens immer nur eine Merkmalskombination KN sich ihrem Sollwert nähert.
  • Die gemessenen bzw. errechneten Istwertc K0 ist' K1 ist' ... K14 ist werden verglichen mit den gespeicherten Sollwerten K0 soll' K1 soll, K14 soll Dies geschieht am einfachsten durch Verhältnisbildung.
  • Fig. 5 zeigt daher den Verlavf der Größe WN = KN ist , die man KN soll als Wahrscheinlichkeit der Erkennungssicherheit bezeichnen kann.
  • Hierbei bildet der punktierte kurvenverlauf in Fig. 5 das Ergebnis eines Klassifizierungsschrittes bzw. Veryleichsversuches beispielsweise mit einer Adressenraster in einer ersten, vorläufigen Lage mit den Adressen x1, x2, ... xk in Fig. 4. Wird alsdann gemäß der Erfindung ein weiterer Versuch bzw. Klassifizierungsschritt unternommen mit einem um eine Einheit bzw. Adresse nach rechts verschobenen Adressenraster mit den Adressen x1, , x2, , ... xkl , so ergibt sich aus den dann gemessenen Funktionswerten Y1. , y21 , ... , y8' und nach Bildung der Merkmalsvektoren MVM und der für die Zeichen charakteristischen Werte Kr der gestrichelte Verlauf in Figur 5.
  • Dieser zweite Versuch läßt bereits eine größere Übereinstimmung bzw. Übereinstimmungswahrscheinlichkeit für das Zeichen 0 erkennen.
  • Ein weiterer erfindungsgemäßer Klassifizierungsschritt mit einem nochmals um eine weitere Adresse in Fig. 4 verschobenen Adressenraster, das dann also bei der Adresse x1'' beginnt, so erhält man nach nochmaliger Durchführung des gleichen Klassifizierungsverfahrens den mit einer durchgehenden Linie dargestellten Kurvenzug in Fig. 5, d.h. die Wahrscheinlichkeit 1 dafür, daß das gen1essene und in seinem Verlauf mehrmals abgetastete Zeichen das Zeichen 0 ist. Durch solche erfindungsgemäße Wiederholung der Klassifizierung eines gemessenen Zeichenverlaufs bis zu einer größtmöglichen Über- einstimmung erreicht unten nicht nur eine llohc Erkennungssicherheit für das gelesene Zeichen. Durch die Lage des Adressenrasters beim letzten Klassifizierungsschritt mit der erreichten größtmöglichen Übereinstimmung ist auch der genaue Zeichenanfang ZA des gelesenen und gemessenen Zeichens fes-tgelegt. Da für jedes Zeichen gleiche Breite auf der Lesezeile uI0 damit auch die gleiche Adressenanzahl im Speicher vorgesehen ist, ist mit der Erkennung des ersten Zeichens und seines Zeichenanfangs ZA auch der jeweilige Zeichenanfang für die dann folgenden Zeichen festgelegt, solange keine Störungen auftreten. Die Anfänge der nachfolgenden Zeichen lassen sich vorher bestimmen, wenn ein Zeichenanfang ermittelt worden ist. Figur 6 zeigt ein Beispiel für drei aufeinanderfolgende Zeichen 0, 1 und 2.
  • Es ist leicht einzusehen, daß derartige Zeichen bzw. die ihnen entsprechenden Kurvenzüge nicht nur durch die vorbeschriebene Abtastung der Funktionswerte und Bildung von Merkmalsvektoren erkannt und klassifiziert werden können, sondern beispielsweise auch durch Messung der Impulsbreite oder/und ihrer Lage längs der Abszissen- bzw. Adressenachse, da diese Größen, wie man leicht aus den Bildern in Figur 2 ersehen kann, ebenfalls für jedes Zeichen charakteristische Flerkmalskombinationen darstellen. Uie Impulsbreite läßt sich leicht durch Bildung bzw. Messung des ersten und zweiten Differentialquotienten feststellen. Das erfindungsgemäße Verfahren ist daher mit allen bekannten Zeichenerkennungssystemen bzw. Klassifizierungsmethoden durchführbar.
  • Figur 7 zeigt noch einmal den Ablauf des erfindungsgemaßen Verfahrens anhand des beschriebenen Beispiels. Nach dem Aufzeichnen und Speichern der Kurve des gelesenen Zeichens werden die Funktionswerte y in den einzelnen Speicheradressen fortlaufend dahingehend überprüft, ob ein Zeichenanfang ZA vorliegt oder nicht. Wenn ja, werden aus den Funktionswerten Y1 ... Yk eines ersten Adressenrasters xl ... xk die Nerkmalsvektoren MVM und daraus mit Hilfe der Merkmalskombinationen KN die Erkennungswahrscheinlichkeit WN gebildet. Alsdann wird der gleiche Vorgang, wie breits beschrieben, mit einem etwas geänderten Adressenraster wiederholt und geprüft, ob die Erkennungswahrscheinlichkeit WN eines bestimmten Zeichens sich dem Wert 1 genügend weit angenähert hat.
  • Ist die Annäherung bzw. Übereinstimmung groß genug, wird das erkannte Zeichen ausgegeben.
  • Figur 8 zeigt eine Anordnung zur Durchführung des Verfahrens.
  • Das vom Lesegerät 1 aufgenommene Signal des gelesenen Zeichens wird in einem Speicher 2 einer Datenverarbeitungsanlage abgelegt.
  • Durch das Rechen- und Steuerwerk 3 werden dann die Funktionswerte der gemessenen und gespeicherten Kurve mit in einem Speicher 4 vorhandenen, den einzelnen Zeichen der Schriftart entsprechenden Sollwertmerkmalen verglichen und klassifiziert. Das dann aufgrund des erfindungsgemäßen Verfahrens erkanntc Zeichen wird hierauf über die Ausgabeeinheit 5 ausgegeben. Das Programm für die Tätigkeit des Rechen- und Steuerwerks 3 ist im Speicher 6 abgelegt.
  • S t ü c k l i s t e 1 Lesegerät 2 Speicher 3 Rechen- und Steuerwerk 4 Speicher 5 Ausgabeeinheit 6 Speicher LISTE DER MERKMALSVEKTOREN MV1 = Y7 + y5 > y4 + y3 MV13 = y1 > y2 MV2 = y7 > y5 MV14 = y5 + y1 > y4 + y2 MV3 = y6 > y4 MV15 = y4 + y1 > y3 + y2 MV4 = y5 > y3 MV16 = y1 + y0 > y8 + y8 MV5 = y6 > y3 MV17 = y3 > y2 MV6 = y6 + y3 > y5 + y1 MV18 = y4 > y1 MV@ = y5 + y5 > y6 + y1 MV19 = y2 > y7 MV8 = y5 + y4 > y3 + y0 MV20 = y7 + y2 > y6 + y5 MV9 = y@ + y6 + y2 > y4 + y3 MV21 = y5 + y0 > y4 + y8 MV10 = y5 + y8 > y4 + y2 MV22 = y2 + y1 > y4 + y0 MV11 = y7 + y8 > y4 + y3 MV23 = y4 + y1 > y5 + y6 MV12 = y1 > y6 MV24 = y1 + y3 > y5 + y6 LISTE DER MERKMAI SKOMBINATIONEN K0 = MV1 + MV2 + MV12 + MV13 + MV14 + MV15 + MV6 + MV7 + MV18 + MV19 K1 = MV6 + MV16 + MV17 + MV20 + MV1 + MV3 + MV4 + MV5 + MV8 + MV9 + MV10 + MV11 + MV14 + MV15 + MV21 K2 = MV8 + MV12 + MV13 + MV15 + MV16 + MV19 + MV20 + MV1 + MV3 + MV4 + MV5 + MV6 + MV9 + MV10 + MV11 + MV14 K3 + MV8 + MV9 + MV12 + MV1@ + MV19 + MV20 + MV2 + MV3 + MV5 + MV6 + MV10 + MV11 + MV13 + MV14 + MV15 + MV17 K4 + MV1 + MV3 + MV4 + MV9 +MV10 + MV14 + MV16 + MV21 + MV22 + MV2 + MV17 + MV18 K5 = MV4 + MV@ + MV8 + MV12 + MV13 + MV14 + MV15 + MV16 + MV19 + MV2 + MV3 + MV5 + MV6 + MV@ + MV11 + MV18 K6 = MV3 + MV3 + MV13 + MV1@ + MV1@ + MV1 + MV2 + MV@ K@ = MV13 + MV14 + MV16 + MV1@ + MV1 + MV2 + MV3 + MV4 + MV5 + MV5 + MV15 K8 = MV3 + MV5 + MV8 + MV9 + MV16 + MV1@ + MV@ + MV10 + MV11 + MV12 + MV14 + MV15 + MV1@ + MV23 + MV24 K9 = MV3 + MV5 + MV9 + MV12 + MV14 + MV19 + MV2 + MV7 + MV10 + MV17 KONUS = MV1 + MV7 + MV9 + MV10 + MV12 + MV14 + MV5 + MV6 + MV15 KTRANSIT = MV2 + MV3 + MV6 + MV9 + MV24 + MV4 + MV@ + MV8 + MV10 + MV15 + MV18 KPASH = MV2 + MV13 + MV15 + MV1@ + MV22 + MV23 + MV1 + MV4 + MV19 KA@@UNT = MV2 + MV3 + MV8 + MV9 + MV15 + MV3 + MV10 + MV14 + MV1@

Claims (5)

  1. Patentans~prüche Qi Verfahren zum maschinellen Lesen von Schriftzeichen mit einem Lesegerät, das für jedes von einem Sensor abgetastete Zeichen eine für dieses Zeichen charakteristische Folge von Funktions- werten als Ausgangssignal liefert, wobei die gelesenen Zeichen gespeichert werden und aus einer Anzahl von in einem Raster von Speicheradressen enthaltenen Funktionswerten eines gelesenen Zeichens eine für dieses Zeichen charakteristische Merkmalakombination gebildet und dann mit jeder von entsprechenden Merkmalskombinotionen von zuvor festgelegten, für jedes Zeichen der zu lesenden Schrift bzw. Schriftart charakteristischen Sollwerten der Merkmale verglichen wird, und festgestellt wird, mit welcher der Sollwert-Merkmalskombinationen eines der Schriftzeichen die Istwert-Merkmalskombination des gelesenen Zeichens am besten übereånstimmt, dadurch g e k e n n z e i c h n e t, daß nach diesem ersten, durch Bildung und Vergleich einer aus Istwerten gewonnenen Merkmalskombination des gelesenen Zeichens mit den Sollwert-Merkmalskombinationen erfolgenden Klassifizierungsschritt mindestens noch ein weiterg Klassifizierungsschritt durchgeführt wird, wobei vor jedem Klassifizierungsschritt die Lage des Adressenrasters innerhalb des für ein zu lesendes Zeichen vorgesehenen Adressenraums um eine oder mehrere Adressen in oder gegen die Leserichtung so verschoben wird, daß eine gegenüber den vorhergehenden Klassifizierungsschritten verbesserte Ubereinstimmung erreicht wird.
  2. 2) Verfahren nach Anspruch 1, dadurch g e k e n n z e i c h n e t, daß die Lage der ersten Adresse des Adressenrasters in Abhängigkeit vom Anstieg der abgetasteten Funktionswerte gewählt wird.
  3. 3) Vorrichtung zur Durchführung des Verfahrens nach Anspruch 1 oder 2 mit einem einen Sensor zum Erfassen von Schriftzeichen aufweisenden Lesegerät, das zur Erzeugung eines dem gelesenen Zeichen entsprechenden Signals ausgebildet ist, g e k e n n z e i c h n e t durch eine Datenverarbeitungsanlage, die einen Speicherbereich zum Aufnehmen von mindestens zwei aufeinanderfolgenden vollstundigen Zeichensignalen maximaler Breite einschl. Pausen, einen zweiten Speicherbereich, in dem Kombinationen von Merkmalswerten fUr jedes zu verwendende Schriftzeichen der zu lesenden Schrift als Sollwerte gespeichert sind, sowie ein Rechen- und Steuerwerk mit einem weiteren Programmspeicher aufweist, wobei das Rechen-und Steuerwerk mit seinem Programm ausgebildet ist zum Aufnehmen der von dem Ausgang des Lesegeräts gelieferten Signale, zum Selektieren der einzelnen Zeichen aus dem ersten Speicherbereich und zum Berechnen von sich aus den Signalwerten dieser Zeichen ergebenden Merkmalswerten, sowie zum Vergleich derselben mit denjenigen aus dem zweiten Speicherbereich und zur Ausgabe der als über einstimmend erkannten Zeichen.
  4. 4) Vorrichtung nach Anspruch 3, dadurch g e k e n n z e i c h n e t, daß der erste Speicherbereich zur Aufnahme einer ganzen Lesezeile von Zeichen ausgebildet ist.
  5. 5)Vorrichtung nach Anspruch 3 oder 4, dadurch g e k e n n z e i c h -n e t, daß der zweite Speicher zur Aufnahme der Zeichen mehrerer verschiedener Schriften oder Schriftarten ausgebildet ist.
DE19843406694 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen Granted DE3406694A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19843406694 DE3406694A1 (de) 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19843406694 DE3406694A1 (de) 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Publications (2)

Publication Number Publication Date
DE3406694A1 true DE3406694A1 (de) 1985-09-05
DE3406694C2 DE3406694C2 (de) 1988-04-07

Family

ID=6228699

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19843406694 Granted DE3406694A1 (de) 1984-02-24 1984-02-24 Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen

Country Status (1)

Country Link
DE (1) DE3406694A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2361899A1 (de) * 1972-12-18 1974-06-20 Ibm System zum auffinden und erkennen von zeichen auf belegen
DE3013833A1 (de) * 1979-04-13 1980-10-16 Hitachi Ltd Verfahren und vorrichtung zum pruefen von schriftzeichen o.dgl.
DE3318303A1 (de) * 1982-05-19 1983-11-24 Tokyo Shibaura Denki K.K., Kawasaki, Kanagawa Musterlagen-erkennungsvorrichtung

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2361899A1 (de) * 1972-12-18 1974-06-20 Ibm System zum auffinden und erkennen von zeichen auf belegen
DE3013833A1 (de) * 1979-04-13 1980-10-16 Hitachi Ltd Verfahren und vorrichtung zum pruefen von schriftzeichen o.dgl.
DE3318303A1 (de) * 1982-05-19 1983-11-24 Tokyo Shibaura Denki K.K., Kawasaki, Kanagawa Musterlagen-erkennungsvorrichtung

Also Published As

Publication number Publication date
DE3406694C2 (de) 1988-04-07

Similar Documents

Publication Publication Date Title
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE2844156C2 (de)
DE1104239B (de) Verfahren und Einrichtung zum Erkennen von Zeichen
DE2147896C3 (de) Gerät zum Erkennen normaler Schriftzeichen
DE4133590A1 (de) Verfahren zur klassifikation von signalen
DE2633513C2 (de) Zeichenerkennungsvorrichtung
DE3515159A1 (de) Bildverarbeitungseinrichtung
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE3904129A1 (de) Einrichtung zum ueberpruefen von dokumenten
DE19511472C1 (de) Verfahren zur dynamischen Verifikation eines Schriftzuges anhand eines Referenzschriftzuges
EP2082357B1 (de) Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild
DE2410306C3 (de) Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen
DE2435889B2 (de) Verfahren und einrichtung zur unterscheidung von zeichengruppen
DE102018115158A1 (de) NC-Programm-Umwandlungseinrichtung
EP0104369B1 (de) Einrichtung und Verfahren zum optischen Erkennen von Flächenmustern an Objekten
DE3026055C2 (de) Schaltungsanordnung zur maschinellen Zeichererkennung
DE4407998C2 (de) Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
DE10339743A1 (de) Verfahren zum Vergleich eines als Bildstreifensequenz vorliegenden Testfingerabdrucks mit einem gespeicherten Referenzfingerabdruck und zur Durchführung des Verfahrens geeignete Vorrichtung
EP0753231B1 (de) Verfahren und vorrichtung zum binarisieren von pixel-daten
DE3414455C2 (de) Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht
DE3406694A1 (de) Verfahren und vorrichtung zum maschinellen lesen von schriftzeichen
DE2112919C3 (de) Anordnung zum Erkennen von Zeichen
DE19612465C2 (de) Automatisches Optimieren von Objekt-Erkennungssystemen
DE3822671C2 (de)
DE3238300A1 (de) Verfahren und vorrichtung zur muster- oder zeichenerkennung

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: KLEINDIENST DATENTECHNIK GMBH, 8900 AUGSBURG, DE