AT229916B - Verfahren zur automatischen Zeichenerkennung durch Auswerten zeichencharakteristischer Wellenformen - Google Patents

Verfahren zur automatischen Zeichenerkennung durch Auswerten zeichencharakteristischer Wellenformen

Info

Publication number
AT229916B
AT229916B AT489962A AT489962A AT229916B AT 229916 B AT229916 B AT 229916B AT 489962 A AT489962 A AT 489962A AT 489962 A AT489962 A AT 489962A AT 229916 B AT229916 B AT 229916B
Authority
AT
Austria
Prior art keywords
character
correlation
waveforms
vectors
character recognition
Prior art date
Application number
AT489962A
Other languages
English (en)
Original Assignee
Telefunken Patent
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefunken Patent filed Critical Telefunken Patent
Application granted granted Critical
Publication of AT229916B publication Critical patent/AT229916B/de

Links

Landscapes

  • Character Discrimination (AREA)

Description


   <Desc/Clms Page number 1> 
 



  Verfahren zur automatischen Zeichenerkennung durch
Auswerten zeichencharakteristischer Wellenformen 
Ein bekanntes Verfahren zur automatischen Erkennung lesbarer Zeichen arbeitet mit einem Spalt, der die Zeichen überstreicht, und macht die hiebei stattfindenden Änderungen des unter dem Spalt lie-   genden Zeichenabschnitts über einen Wandler wirksam.   Bei vormagnetisierten Zeichen   z. B.   ist der Wandler ein Magnetkopf, und der Spalt ist der Magnetkopfspalt. Wenn er ein Zeichen überstreicht, so werden in dem Kopf Spannungen induziert, die eine von der Form des Zeichens abhängige Wellenform bilden. 



  Man führt diese einer Verzögerungsleitung zu, die die zeitliche Verteilung der Wellenform in eine räumliche Verteilung umsetzt, und greift, wenn die Wellenform in der Verzögerungsleitung eine bestimmte Referenzlage hat, von Anzapfpunkten der Verzögerungsstrecke die an diesen Stellen durch die Wellenform erzeugten diskreten Spannungen ab. An die Anzapfungen sind parallel und in einer Anzahl, die der Zahl der zu erkennenden Zeichen entspricht, Korrelationsnetzwerke angeschlossen, die eine Diskriminierung der verschiedenen Wellenformen an Hand der aus diesen angebotenen diskreten Spannungen ermöglichen. 



  Bei einem bekannten Verfahren sind z. B. die Korrelationsnetzwerke so ausgelegt, dass das dem gerade abgetasteten Zeichen zugeordnete Netzwerk eine grössere Ausgangsspannung liefert als alle andern Netzwerke. 



   Für die Durchführung eines solchen Verfahrens ist es bekannt, den Zeichen, insbesondere Ziffern, besondere Formen zu geben, bei denen die senkrechten   Zeichenflächenränder   auf den Senkrechten eines unterlegten gleichmässigen Rasters liegen. Den Abszissen dieser Senkrechten sind die äquidistanten Anzapfpunkte der   Verzögerungsleitung zugeordnet.   Durch die besondere Formgebung der Zeichen wird erreicht, dass Wellenformen entstehen, die sich für die einzelnen Zeichen möglichst weitgehend unterscheiden, und ihre positiven und negativen Spitzen in der Referenzlage an solchen Stellen haben, wo sich Anzapfpunkte befinden.

   Die beim Einlaufen des ersten Zeichenrandes unter den Spalt entstehende erste Spannungsspitze wird benutzt zur Feststellung des Zeitpunktes der Referenzlage, an dem dann die Spannungen sämtlicher Anzapfpunkte in die Vergleichsnetzwerke eingegeben werden. Man ist dabei bei den bekannten Verfahren davon ausgegangen, sämtliche Spannungsspitzen für die Diskriminierung zu benutzen und die Korrelationsnetzwerke den zugeordneten Wellenformen möglichst genau anzupassen. 



   Grundlage der Erfindung ist demgegenüber die Erkenntnis, dass die Auswertung von Spannungen, die bei allen oder auch nur bei einigen Wellenformen an korrespondierenden Stellen einander ähnlich sind, nicht nur keinen Beitrag zur Unterscheidbarkeit samtlicher Zeichen oder einzelner Zeichen gegeneinander liefert, sondern die Unterscheidbarkeit sogar verschlechtert. Bei dem Verfahren nach der Erfindung ist daher vorgesehen, dass solche diskreten Spannungen, die für alle oder einige Wellenformen an korrespondierenden Stellen polaritätsgleich und einander grössenähnlich sind, durch die Wahl der Anzapfpunkte für den Vergleich eliminiert oder durch abweichende Festlegung mindestens eines ihnen zugeordneten Referenzgliedes in ihrer Wirkung als Vergleichskomponente verändert sind. 



   Zum Verständnis der Erfindung mehr im einzelnen diene die nachfolgende nähere Beschreibung in Verbindung mit den Zeichnungen und einigen Tabellen. 



   In den Feldern der Fig. 1 sind Zeichen (Ziffern und einige Symbolmarken) dargestellt, wie sie für 

 <Desc/Clms Page number 2> 

 magnetische Ablesung ausgebildet worden sind. Die in der erwähnten Art mit ihren Flächenrändern nach einem unterlegten Raster orientierten Zeichen stehen in der linken oberen Ecke jedes Feldes, das Feld selbst zeigt in einem Rasternetz mit äquidistanten Senkrechten, die Anzapfpunkten einer Verzögerungsstrecke entsprechen, die zugehörige Wellenform in der Referenzlage. 



   Fasst man den Spannungswert Vj an der j-ten Anzapfung der Verzögerungsleitung als Koordinate im n-dimensionalen Zeichenraum (bei insgesamt n Anzapfungen) auf, so lässt sich die in Referenzposition 
 EMI2.1 
    : 7fJvektoren#i   hergeleitet, die alle die gleiche Länge C haben : 
 EMI2.2 
 
Entsprechend den Wij werden   die Widerstände   der Korrelationsnetzwerke dimensioniert, und die automatische Zeichenerkennung geschieht ausgedrückt in der hier gewählten Darstellungsweise, so, dass das skalare Produkt des unbekannten Vektors   #   mit jedem der   Referenzvektorenmgebildet   wird : 
 EMI2.3 
 
Das unbekannte   Zeichen 7 (J   wird mit dem Zeichen identifiziert, mit dessen Referenzvektor es das grösste   Skalarprodukt   liefert.

   Mit andern Worten   : P   wird mit dem Zeichen identifiziert, mit dessen Referenzvektor es den kleinsten Winkel bildet : 
 EMI2.4 
 
An Hand dieser anschaulich-geometrischen Darstellung des Problems der automatischen Zeichenerkennung ergibt sich unmittelbar, dass die Sicherheit bei der Zeichenerkennung umso grösser ist, je grösser der Winkel zwischen je zwei Referenzvektoren ist. Der Kosinus dieses Winkels zwischen zwei Referenzvektoren ergibt sich in einfacher Weise   zu :   
 EMI2.5 
 
Die Grösse Kik wird gelegentlich auch als Korrelationskoeffizient bezeichnet. 



   Die einzelnen Korrelationsnetzwerke können in der Art ausgeführt werden, wie in Fig. 2 dargestellt. 



  Danach besteht jedes Netzwerk aus zwei analogen Summierverstärkern I und II, deren Teilwiderstände Rij (j =   0,..., n-1)   in dem dem i-ten Zeichen zugeordneten Netzwerk durch die Komponenten des entsprechenden Idealvektors in der folgenden Weise festgelegt werden : 
 EMI2.6 
 

 <Desc/Clms Page number 3> 

 
Für negative   Spannungswerte Zij   ergeben sich negative Widerstandswerte Rij. Das bedeutet, dass diese Widerstände im zweiten Summierverstärker II in Fig. 2 angeordnet werden (Sammelleitung B), während die positiven Widerstandswerte im ersten Summierverstärker I enthalten sind (Sammelleitung A).

   Für die Ausgangsspannung Ui ergibt sich, wenn der Vektor   p   vorliegt : 
 EMI3.1 
 Die Ausgangsspannung des Korrelationsnetzwerks stimmt also-bis auf das Vorzeichen - mit dem 
 EMI3.2 
 spannung, das sogenannte Autokorrelationssignal, die grösser ist als jede der Ausgangsspannungen, die dasselbe Zeichen in jedem Fremdkanal (Kreuzkorrelationssignale) liefert. 



   Für die oben eingeführten Korrelationskoeffizienten Kik soll noch die folgende anschauliche Deutung gegeben werden : Bezeichnet man das Autokorrelationssignal, das das i-te Zeichen im i-ten Zeichenkanal hervorruft, mit Uii, und ein Kreuzkorrelationssignal, das das i-te Zeichen im k-ten Kanal liefert, mit Uik, so ergibt sich die Beziehung : 
 EMI3.3 
 
Da die Zeichenerkennung durch Aussuchen der grössten Zeichenkanalausgangsspannung geschieht, sind die Kik unmittelbar ein Mass für die Sicherheit, mit der die einzelnen Zeichen voneinander unterschieden werden können. 



    Tabelle 1 enthält in willkürlichen Einheiten die Komponenten Zij der Idealvektoren für den in Fig. 1 dargestellten Zeichensatz. Aus diesen Grössen werden die in Tabelle 2 enthaltenen Werte Wij/C bestimmt,   mit deren Hilfe die Widerstände   Rij   der Korrelationsnetzwerke berechnet werden können. In den Tabellen bezieht sich der Buchstabe N auf ein Netzwerk, das Wellenformen zugeordnet ist, die sich durch magnetische Verschmutzungen ergeben könnten. 
 EMI3.4 
 lesungen auftreten können, obwohl die stilisierten Zeichen dieses Zeichensatzes schon im Hinblick auf grösstmögliche Sicherheit bei der Zeichenerkennung entworfen worden sind. 



   Das Prinzip der Erfindung soll nun mit Hilfe der Vektorvorstellung geometrisch veranschaulicht werden. Gegeben seien zwei Vektoren im (n - 1) - dimensionalen Zeichenraum, die etwa gleich lang sein sollen. Werden diese Vektoren nun in den n-dimensionalen Zeichenraum durch Addition etwa gleich langer Vektoren in Richtung der n-ten Koordinatenachse erweitert, so verkleinert sich im allgemeinen der Winkel zwischen beiden Vektoren.

   Umgekehrt : Werden zwei n-dimensionale Vektoren dadurch auf den (n - 1) - dimensionalen Zeichenraum beschränkt, dass man eine Koordinatenachse, in deren Richtung beide Vektoren etwa gleich grosse Komponenten aufweisen, ausser acht lässt, so wird der Winkel zwischen den Vektoren im (n - 1) - dimensionalen Raum im allgemeinen grösser sein als im n-dimensionalen,   d. h.   die Sicherheit bei der Zeichenerkennung wäre im niederdimensionalen Raum grösser als im   höherdimen -   sionalen Raum. Aus Tabelle 1 geht nun hervor, dass die Komponenten der Idealvektoren an der nullten Anzapfung der Verzögerungsleitung alle positiv und nur etwa um den Faktor 2 voneinander verschieden sind. Es ist daher vorgesehen, dass bei der Konstruktion der Korrelationsnetzwerke auf diese Werte ganz verzichtet wird, siehe Tabelle 4.

   Die zugehörige Korrelationstabelle 5 liefert tatsächlich eine wesentliche Verbesserung der Korrelationskoeffizienten gegenüber Tabelle 3 : in Tabelle 3 treten Korrelationskoeffizienten 0, 50 : 58 - mal. >   0,   60 : 34-mal und > 0,   70 : 4 - mal auf ;   die entsprechenden Zahlen 
 EMI3.5 
 der Tabelle 5 sind kleiner als die entsprechenden Koeffizienten der Tabelle 3, mit einer einzigen Ausnahme ; K69 = K96   nimmt von 0, 69   auf 0,71 zu. Sieht man von diesem Wert ab, so kann man eine deut- 

 <Desc/Clms Page number 4> 

 liche Verbesserung der Erkennungssicherheit feststellen. 



   Wird aus bestimmten Gründen Wert darauf gelegt, dass kein   Kik >    0,70 auftritt, so lässt sich durch erneute Anwendung des beschriebenen Verfahrens eine weitere Korrelationstabelle aufstellen. Die starke Korrelation zwischen den Ziffern 6 und 9 beruht, wie Tabelle 1 zeigt, darauf, dass die Komponentenvektoren an der sechsten Anzapfung gleichgerichtet und recht gross (9 und 5) sind. Verzichtet man zusätzlich auf diese sechste Anzapfung, wie es in Tabelle 6 angegeben ist, so ergibt sich die neue Korrelationstabelle 7. In dieser Tabelle sind die störend grossen Korrelationskoeffizienten K69 = K96 wesentlich verkleinert, allerdings auf Kosten anderer Koeffizienten, die gegenüber Tabelle 5 und auch gegenüber Tabelle 3   grösser geworden sind.

   In   Tabelle   7 treten Korrelationskoeffizienten > 0, 50 : 30 - mal,   > 0, 60 : 12-mal und > 0, 70 gar nicht mehr auf. Ein Vorteil der Tabelle 7 liegt unter anderem darin, dass nur noch eine einzige Korrelationszahl > 0, 50 zwischen Ziffern auftritt, u. zw. K57 = K75 = 0,54, eine Verwechslung von Ziffern ist also so gut wie ausgeschlossen. Ebenso ist eine Verwechslung von Sonderzeichen unwahrscheinlich geworden. 



   Um die in Tabelle 5 störend starke Korrelation zwischen den Ziffern 6 und 9 zu verkleinern, bedarf es aber nicht-wie in Tabelle 6   durchgeführt-des   generellen Verzichts auf die sechste Anzapfung. Eine Verbesserung kann vielmehr auch durch eine geeignete Abänderung der in Tabelle 4 angegebenen Wider- 
 EMI4.1 
 
 EMI4.2 
 
 EMI4.3 
 Tabelle 9 nicht mehr symmetrisch, da durch die beschriebene Abänderung der Netzwerke die Richtung der Idealvektoren der Ziffern 6 und 9 nicht mehr mit der Richtung der zugeordneten Referenzvektoren übereinstimmt. 



   InTabelle 10 sind die Daten des Korrelationsnetzwerks nach Fig. 2 für die Zahl "9" wiedergegeben, u. zw. in Zeile 1 das zur Tabelle 2 gehörende Netzwerk. In Zeile 2,3 und 4 sind die entsprechend den Tabellen 4,6 und 8 abgeänderten Netzwerkgrössen dargestellt.

Claims (1)

  1. PATENTANSPRUCH : Verfahren zur automatischen Zeichenerkennung durch vergleichendes Auswerten diskreter Spannungen an Anzapfpunkten einer Verzögerungsstrecke, der zeichencharakteristische Wellenformen zugeführt werden, dadurch gekennzeichnet, dass solche diskreten Spannungen, die für alle oder einige Wellenformen ankorrespondierenden Stellen polaritätsgleich und einander grössenähnlich sind, durch die Wahl der Anzapfpunkte für den Vergleich eliminiert oder durch abweichende Festlegung mindestens eines ihnen zugeordneten Referenzgliedes (Widerstand Rij) in ihrer Wirkung als Vergleichskomponente verändert sind.
AT489962A 1961-07-28 1962-06-18 Verfahren zur automatischen Zeichenerkennung durch Auswerten zeichencharakteristischer Wellenformen AT229916B (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE229916X 1961-07-28

Publications (1)

Publication Number Publication Date
AT229916B true AT229916B (de) 1963-10-25

Family

ID=5868072

Family Applications (1)

Application Number Title Priority Date Filing Date
AT489962A AT229916B (de) 1961-07-28 1962-06-18 Verfahren zur automatischen Zeichenerkennung durch Auswerten zeichencharakteristischer Wellenformen

Country Status (1)

Country Link
AT (1) AT229916B (de)

Similar Documents

Publication Publication Date Title
DE3326583C2 (de)
DE2939457A1 (de) Verfahren zur hervorhebung eines bildbereiches innerhalb eines bildes, das auf einem bildschirm dargestellt wird
DE1240687B (de) Schaltung zum maschinellen Erkennen von Schriftzeichen
DE1259387B (de) Speichermatrix
DE2938991C2 (de)
AT229916B (de) Verfahren zur automatischen Zeichenerkennung durch Auswerten zeichencharakteristischer Wellenformen
DE1180177B (de) Geraet zum Erkennen von Schriftzeichen durch einen fuer das abgetastete Schriftzeichen charakteristischen elektrischen Signalwellenzug
DE1294074B (de) Zeichenerkennungsvorrichtung mit spaltenweiser Abtastung
DE1499394B2 (de) Anordnung zum messen der groesse von zeichen
DE1234428B (de) Schaltungsanordnung zum Erkennen einer beliebigen Signalform aus einer Gruppe elektrischer Signalformen
DE3132933C2 (de) Verfahren zur Bestimmung der Wicklungsströme in magnetischen Eigenschutz (MES)-Anlagen
DE2262112C2 (de) Einrichtung zur Prozeßsteuerung
WO2008080185A2 (de) Verfahren zum ähnlichkeitsvergleich von zwei gegenständen
DE69715921T2 (de) Anlage zur erkennung handgeschriebener zeichen
CH617026A5 (de)
DE10246253A1 (de) Verfahren zum Erzeugen einer Farbübereinstimmung zwischen einem Zielobjekt und einem Quelleobjekt
DE2725927C2 (de)
DE932702C (de) Schriftzeichen zur selbsttaetigen Steuerung von Kartensortiermaschinen, Verrechnungsmaschinen, Typendruckvorrichtungen u. dgl.
DE218215C (de)
DE1523222C (de) Beschleunigungsmesser
DE932803C (de) UEbertrager mit Kammerwicklung
DE601653C (de) Anordnung zur Regelung der Lautstaerke mehrerer unabhaengig voneinander parallel arbetender Sprechmaschinen
DE1839852U (de) Farbtonfaecher.
DE2207743C3 (de) Schaltungsanordnung zur automatischen Erkennung von unbekannten Mustern
DE2320931C3 (de) Elektro-graphischer Wandler