<Desc/Clms Page number 1>
Verfahren zur automatischen Zeichenerkennung durch
Auswerten zeichencharakteristischer Wellenformen
Ein bekanntes Verfahren zur automatischen Erkennung lesbarer Zeichen arbeitet mit einem Spalt, der die Zeichen überstreicht, und macht die hiebei stattfindenden Änderungen des unter dem Spalt lie- genden Zeichenabschnitts über einen Wandler wirksam. Bei vormagnetisierten Zeichen z. B. ist der Wandler ein Magnetkopf, und der Spalt ist der Magnetkopfspalt. Wenn er ein Zeichen überstreicht, so werden in dem Kopf Spannungen induziert, die eine von der Form des Zeichens abhängige Wellenform bilden.
Man führt diese einer Verzögerungsleitung zu, die die zeitliche Verteilung der Wellenform in eine räumliche Verteilung umsetzt, und greift, wenn die Wellenform in der Verzögerungsleitung eine bestimmte Referenzlage hat, von Anzapfpunkten der Verzögerungsstrecke die an diesen Stellen durch die Wellenform erzeugten diskreten Spannungen ab. An die Anzapfungen sind parallel und in einer Anzahl, die der Zahl der zu erkennenden Zeichen entspricht, Korrelationsnetzwerke angeschlossen, die eine Diskriminierung der verschiedenen Wellenformen an Hand der aus diesen angebotenen diskreten Spannungen ermöglichen.
Bei einem bekannten Verfahren sind z. B. die Korrelationsnetzwerke so ausgelegt, dass das dem gerade abgetasteten Zeichen zugeordnete Netzwerk eine grössere Ausgangsspannung liefert als alle andern Netzwerke.
Für die Durchführung eines solchen Verfahrens ist es bekannt, den Zeichen, insbesondere Ziffern, besondere Formen zu geben, bei denen die senkrechten Zeichenflächenränder auf den Senkrechten eines unterlegten gleichmässigen Rasters liegen. Den Abszissen dieser Senkrechten sind die äquidistanten Anzapfpunkte der Verzögerungsleitung zugeordnet. Durch die besondere Formgebung der Zeichen wird erreicht, dass Wellenformen entstehen, die sich für die einzelnen Zeichen möglichst weitgehend unterscheiden, und ihre positiven und negativen Spitzen in der Referenzlage an solchen Stellen haben, wo sich Anzapfpunkte befinden.
Die beim Einlaufen des ersten Zeichenrandes unter den Spalt entstehende erste Spannungsspitze wird benutzt zur Feststellung des Zeitpunktes der Referenzlage, an dem dann die Spannungen sämtlicher Anzapfpunkte in die Vergleichsnetzwerke eingegeben werden. Man ist dabei bei den bekannten Verfahren davon ausgegangen, sämtliche Spannungsspitzen für die Diskriminierung zu benutzen und die Korrelationsnetzwerke den zugeordneten Wellenformen möglichst genau anzupassen.
Grundlage der Erfindung ist demgegenüber die Erkenntnis, dass die Auswertung von Spannungen, die bei allen oder auch nur bei einigen Wellenformen an korrespondierenden Stellen einander ähnlich sind, nicht nur keinen Beitrag zur Unterscheidbarkeit samtlicher Zeichen oder einzelner Zeichen gegeneinander liefert, sondern die Unterscheidbarkeit sogar verschlechtert. Bei dem Verfahren nach der Erfindung ist daher vorgesehen, dass solche diskreten Spannungen, die für alle oder einige Wellenformen an korrespondierenden Stellen polaritätsgleich und einander grössenähnlich sind, durch die Wahl der Anzapfpunkte für den Vergleich eliminiert oder durch abweichende Festlegung mindestens eines ihnen zugeordneten Referenzgliedes in ihrer Wirkung als Vergleichskomponente verändert sind.
Zum Verständnis der Erfindung mehr im einzelnen diene die nachfolgende nähere Beschreibung in Verbindung mit den Zeichnungen und einigen Tabellen.
In den Feldern der Fig. 1 sind Zeichen (Ziffern und einige Symbolmarken) dargestellt, wie sie für
<Desc/Clms Page number 2>
magnetische Ablesung ausgebildet worden sind. Die in der erwähnten Art mit ihren Flächenrändern nach einem unterlegten Raster orientierten Zeichen stehen in der linken oberen Ecke jedes Feldes, das Feld selbst zeigt in einem Rasternetz mit äquidistanten Senkrechten, die Anzapfpunkten einer Verzögerungsstrecke entsprechen, die zugehörige Wellenform in der Referenzlage.
Fasst man den Spannungswert Vj an der j-ten Anzapfung der Verzögerungsleitung als Koordinate im n-dimensionalen Zeichenraum (bei insgesamt n Anzapfungen) auf, so lässt sich die in Referenzposition
EMI2.1
: 7fJvektoren#i hergeleitet, die alle die gleiche Länge C haben :
EMI2.2
Entsprechend den Wij werden die Widerstände der Korrelationsnetzwerke dimensioniert, und die automatische Zeichenerkennung geschieht ausgedrückt in der hier gewählten Darstellungsweise, so, dass das skalare Produkt des unbekannten Vektors # mit jedem der Referenzvektorenmgebildet wird :
EMI2.3
Das unbekannte Zeichen 7 (J wird mit dem Zeichen identifiziert, mit dessen Referenzvektor es das grösste Skalarprodukt liefert.
Mit andern Worten : P wird mit dem Zeichen identifiziert, mit dessen Referenzvektor es den kleinsten Winkel bildet :
EMI2.4
An Hand dieser anschaulich-geometrischen Darstellung des Problems der automatischen Zeichenerkennung ergibt sich unmittelbar, dass die Sicherheit bei der Zeichenerkennung umso grösser ist, je grösser der Winkel zwischen je zwei Referenzvektoren ist. Der Kosinus dieses Winkels zwischen zwei Referenzvektoren ergibt sich in einfacher Weise zu :
EMI2.5
Die Grösse Kik wird gelegentlich auch als Korrelationskoeffizient bezeichnet.
Die einzelnen Korrelationsnetzwerke können in der Art ausgeführt werden, wie in Fig. 2 dargestellt.
Danach besteht jedes Netzwerk aus zwei analogen Summierverstärkern I und II, deren Teilwiderstände Rij (j = 0,..., n-1) in dem dem i-ten Zeichen zugeordneten Netzwerk durch die Komponenten des entsprechenden Idealvektors in der folgenden Weise festgelegt werden :
EMI2.6
<Desc/Clms Page number 3>
Für negative Spannungswerte Zij ergeben sich negative Widerstandswerte Rij. Das bedeutet, dass diese Widerstände im zweiten Summierverstärker II in Fig. 2 angeordnet werden (Sammelleitung B), während die positiven Widerstandswerte im ersten Summierverstärker I enthalten sind (Sammelleitung A).
Für die Ausgangsspannung Ui ergibt sich, wenn der Vektor p vorliegt :
EMI3.1
Die Ausgangsspannung des Korrelationsnetzwerks stimmt also-bis auf das Vorzeichen - mit dem
EMI3.2
spannung, das sogenannte Autokorrelationssignal, die grösser ist als jede der Ausgangsspannungen, die dasselbe Zeichen in jedem Fremdkanal (Kreuzkorrelationssignale) liefert.
Für die oben eingeführten Korrelationskoeffizienten Kik soll noch die folgende anschauliche Deutung gegeben werden : Bezeichnet man das Autokorrelationssignal, das das i-te Zeichen im i-ten Zeichenkanal hervorruft, mit Uii, und ein Kreuzkorrelationssignal, das das i-te Zeichen im k-ten Kanal liefert, mit Uik, so ergibt sich die Beziehung :
EMI3.3
Da die Zeichenerkennung durch Aussuchen der grössten Zeichenkanalausgangsspannung geschieht, sind die Kik unmittelbar ein Mass für die Sicherheit, mit der die einzelnen Zeichen voneinander unterschieden werden können.
Tabelle 1 enthält in willkürlichen Einheiten die Komponenten Zij der Idealvektoren für den in Fig. 1 dargestellten Zeichensatz. Aus diesen Grössen werden die in Tabelle 2 enthaltenen Werte Wij/C bestimmt, mit deren Hilfe die Widerstände Rij der Korrelationsnetzwerke berechnet werden können. In den Tabellen bezieht sich der Buchstabe N auf ein Netzwerk, das Wellenformen zugeordnet ist, die sich durch magnetische Verschmutzungen ergeben könnten.
EMI3.4
lesungen auftreten können, obwohl die stilisierten Zeichen dieses Zeichensatzes schon im Hinblick auf grösstmögliche Sicherheit bei der Zeichenerkennung entworfen worden sind.
Das Prinzip der Erfindung soll nun mit Hilfe der Vektorvorstellung geometrisch veranschaulicht werden. Gegeben seien zwei Vektoren im (n - 1) - dimensionalen Zeichenraum, die etwa gleich lang sein sollen. Werden diese Vektoren nun in den n-dimensionalen Zeichenraum durch Addition etwa gleich langer Vektoren in Richtung der n-ten Koordinatenachse erweitert, so verkleinert sich im allgemeinen der Winkel zwischen beiden Vektoren.
Umgekehrt : Werden zwei n-dimensionale Vektoren dadurch auf den (n - 1) - dimensionalen Zeichenraum beschränkt, dass man eine Koordinatenachse, in deren Richtung beide Vektoren etwa gleich grosse Komponenten aufweisen, ausser acht lässt, so wird der Winkel zwischen den Vektoren im (n - 1) - dimensionalen Raum im allgemeinen grösser sein als im n-dimensionalen, d. h. die Sicherheit bei der Zeichenerkennung wäre im niederdimensionalen Raum grösser als im höherdimen - sionalen Raum. Aus Tabelle 1 geht nun hervor, dass die Komponenten der Idealvektoren an der nullten Anzapfung der Verzögerungsleitung alle positiv und nur etwa um den Faktor 2 voneinander verschieden sind. Es ist daher vorgesehen, dass bei der Konstruktion der Korrelationsnetzwerke auf diese Werte ganz verzichtet wird, siehe Tabelle 4.
Die zugehörige Korrelationstabelle 5 liefert tatsächlich eine wesentliche Verbesserung der Korrelationskoeffizienten gegenüber Tabelle 3 : in Tabelle 3 treten Korrelationskoeffizienten 0, 50 : 58 - mal. > 0, 60 : 34-mal und > 0, 70 : 4 - mal auf ; die entsprechenden Zahlen
EMI3.5
der Tabelle 5 sind kleiner als die entsprechenden Koeffizienten der Tabelle 3, mit einer einzigen Ausnahme ; K69 = K96 nimmt von 0, 69 auf 0,71 zu. Sieht man von diesem Wert ab, so kann man eine deut-
<Desc/Clms Page number 4>
liche Verbesserung der Erkennungssicherheit feststellen.
Wird aus bestimmten Gründen Wert darauf gelegt, dass kein Kik > 0,70 auftritt, so lässt sich durch erneute Anwendung des beschriebenen Verfahrens eine weitere Korrelationstabelle aufstellen. Die starke Korrelation zwischen den Ziffern 6 und 9 beruht, wie Tabelle 1 zeigt, darauf, dass die Komponentenvektoren an der sechsten Anzapfung gleichgerichtet und recht gross (9 und 5) sind. Verzichtet man zusätzlich auf diese sechste Anzapfung, wie es in Tabelle 6 angegeben ist, so ergibt sich die neue Korrelationstabelle 7. In dieser Tabelle sind die störend grossen Korrelationskoeffizienten K69 = K96 wesentlich verkleinert, allerdings auf Kosten anderer Koeffizienten, die gegenüber Tabelle 5 und auch gegenüber Tabelle 3 grösser geworden sind.
In Tabelle 7 treten Korrelationskoeffizienten > 0, 50 : 30 - mal, > 0, 60 : 12-mal und > 0, 70 gar nicht mehr auf. Ein Vorteil der Tabelle 7 liegt unter anderem darin, dass nur noch eine einzige Korrelationszahl > 0, 50 zwischen Ziffern auftritt, u. zw. K57 = K75 = 0,54, eine Verwechslung von Ziffern ist also so gut wie ausgeschlossen. Ebenso ist eine Verwechslung von Sonderzeichen unwahrscheinlich geworden.
Um die in Tabelle 5 störend starke Korrelation zwischen den Ziffern 6 und 9 zu verkleinern, bedarf es aber nicht-wie in Tabelle 6 durchgeführt-des generellen Verzichts auf die sechste Anzapfung. Eine Verbesserung kann vielmehr auch durch eine geeignete Abänderung der in Tabelle 4 angegebenen Wider-
EMI4.1
EMI4.2
EMI4.3
Tabelle 9 nicht mehr symmetrisch, da durch die beschriebene Abänderung der Netzwerke die Richtung der Idealvektoren der Ziffern 6 und 9 nicht mehr mit der Richtung der zugeordneten Referenzvektoren übereinstimmt.
InTabelle 10 sind die Daten des Korrelationsnetzwerks nach Fig. 2 für die Zahl "9" wiedergegeben, u. zw. in Zeile 1 das zur Tabelle 2 gehörende Netzwerk. In Zeile 2,3 und 4 sind die entsprechend den Tabellen 4,6 und 8 abgeänderten Netzwerkgrössen dargestellt.