Das Verfahren betrifft die Extraktion von Merkmalen aus Zeichen, insbesondere aus gedruckten, maschinengeschriebenen oder handgeschriebenen Zeichen, die nicht zusammenhängen, sondern voneinander getrennt sind.
Es sind Verfahren zum maschinellen Lesen von Schriftzeichen bekannt.
Eine der bekannten, häufig angewandten und methodisch einfachsten Gruppen von Verfahren besteht darin, dass das zu erkennende, gerasterte (in Bildpunkte zerlegte) Zeichen mit einer Bibliothek von abgespeicherten Zeichen Schablonen verglichen wird. Für hangeschriebene Zeichen verunmöglicht jedoch die grosse Anzahl der Schablonen den Bau eines entsprechenden Gerätes (1016 Schablonen wären z. B. erforderlich bei Berücksichtigung aller möglichen Zeichen-Variationen, -Verschiebungen, -Rotationen und -Dilatationen in einem noch relativ groben 20 x 20 Punkte Raster).
Um die Anzahl der möglichen Zeichen-Konfigurationen zu reduzieren, werden in anderen Verfahren zuerst durch ver schiedenste Zeichentests (z. B. Vorhandensein oder Nichtvorhandensein von Ecken, Kreuzungen, Rundungen, Verbundenheit usw.) Merkmale erzeugt, welche dann für die eigentliche Zeichenerkennung benützt werden.
Die bisherigen Verfahren zur Extraktion von Zeichenmerkmalen lassen sich in zwei Hauptgruppen einteilen:
Entweder bildet das Zeichenerkennungsgerät in einem zeitlich ausgedehnten Lernprozess Zeichenmerkmale, von denen dann der Erfinder (sei es direkt oder durch eine von ihm wirksam erachtete Strategie) diejenigen auswählt, die ihm als wesentlich erscheinen; oder der Erfinder des Gerätes definiert von vornherein die seines Erachtens nach besten Zeichenmerkmale, was meistens zu einem starren, wenig flexiblen System führt, oder einen zu grossen technischen Aufwand zur Folge hat.
In beiden Fällen hängt der Prozess der Merkmalsextraktion wesentlich von Vermutungen ab, und es fehlen eindeutige Vorschriften.
Der vorliegenden Erfindung liegt die Aufgabe zu Grunde, die Zuverlässigkeit der Erkennung von Schriftzeichen vom Schriftbild und von der Schriftgrösse weitgehend unabhängig zu machen, also eine grössere Flexibilität zu er- reichen. Gleichfalls soll der für die Zeichenerkennung nötige Aufwand gegenüber den bekannten Verfahren und Einrichtungen der genannten Art wesentlich verringert werden.
Zudem hat die vorliegende Erfindung gegenüber den bekannten Verfahren und Einrichtungen die sehr bedeutende Eigenschaft, dass die Merkmale vollkommen selbständig aus den Zeichen extrahiert werden können, d. h. das Verfahren ist fähig, mit der Zeit zu lernen, beliebige, vorgelegte Schriftzeichen, ohne Hilfe von aussen, zu identifizieren.
Ein Ausführungsbeispiel der Erfindung ist anhand der Figuren 1 bis 6 nachfolgend beschrieben.
Das vorliegende Zeichen, aus dem Merkmale extrahiert werden sollen, sei eine handgeschriebene Ziffer 3 :
In Fig. 1 ist die durch Quantisierung des ursprünglichen Zeichens erhaltene Matrix abgebildet. Eingekreiste Elemente entsprechen schwarzen Punkten, nichteingekreiste, weissen Punkten des Zeichens.
Fig. 2 zeigt eine Abbildung der Matrix aus Fig. 1, in eine Matrix mit 1- und 0-Elementen.
Fig. 3 zeigt die kleinste Untermatrix, in der das Zeichen ganz enthalten ist
Fig. 4 zeigt eine Matrix, deren Zeilen die Kolonnen der Matrix in Fig. 3 sind.
Fig. 5A und 5B zeigen jeweils drei Untermatrizen mit zum Teil gleichen Elementen; die Untermatrizen entstehen durch horizontale Verschiebung eines Fensters über die Zeichen-Matrizen in den Figuren 3 und 4.
Fig. 6A und Fig. 6B zeigen kleinere Untermatrizen, die zwecks einer detaillierten Anlayse des Zeichens durch Verschiebung eines schmäleren Fensters über die Zeichen-Matrizen in den Figuren 3 und 4 gebildet wurden.
Für die gemäss den Figuren 5A und 5B erhaltenen Untermatrizen werden die Hell-Dunkel-Verhältnisse wie folgt gebildet:
Anzahl der Elemente mit dem Wert 1 geteilt durch Anzahl der Elemente mit dem Wert 0
Für Fig. 5A ergeben sich so die drei Verhältnisse: 10 =0,5882; 12=0,8; 17 15 =0,5882; und für Fig. 5B: =0,5217; 287 =0,2963; ftO=0,4 23 27 25
Diese Hell-Dunkel-Verhältnisse stellen sechs Zeichenmerkmale dar.
Durch multiplikative Verknüpfung der Hell-Dunkel Verhältnisse der Untermatrizen in den Figuren 5A und 5B kann für jede der Matrizen in den Figuren 3 und 4 ein für die ganze Zeichen-Matrix repräsentatives Merkmal gewonnen werden: 0,5882 x 0,8 x 0,6875 = 0,3235 für Fig. 3 und 0,5217 x 0,2963 x 0,4 = 0,0618 für Fig. 4
Das Verhältnis der beiden letzten Produkte und die Multiplikation dieses Verhältnisses mit dem Absolutwert der Differenz der beiden Produkte liefern schliesslich für die ursprüngliche Zeichen-Matrix in Fig. 3 weitere charakteristische Merkmale des Zeichens: Verhältnis der Produkte: 0,3235 =5,232
0,0618 Multiplikation mit der absoluten Differenz: 1(0,3235 - 0,0618)1 x 5,232 = 1,3692
Geringe Veränderungen von Zeichenmerkmalen können als Hinweis auf die grössere Wichtigkeit und Bedeutung dieser Merkmale interpretiert werden.
Zusätzliche Zeichenmerkmale können daher durch multiplikative Verknüpfung derjenigen Schwarz-Weiss-Verhältnisse der Untermatrizen in den Figuren 5A und 5B gewonnen werden, deren Werte einander am nächsten liegen.
Für Fig. 5A sind dies die Verhältnisse: 0,5882 und 0,6875 Produkt: 0,5882 x 0,6875 = 0,4044
Für Fig. 5B sind die einander am nächsten liegenden Schwarz-Weiss-Verhältnisse: 0,2963 und 0,4
Produkt: 0,2963 x 0,4 = 0,1185
Analog zu obigem Vorgehen ergeben sich hieraus als weitere Zeichenmerkmale: Verhältnis der Produkte: 0,4044 =3,4122
0,1185
Multiplikation des letzten Wertes mit der absoluten Differenz der beiden Produkte: 1(0,4044 - 0,1185) 1 x 3,4122 = 0,9755
Eine noch genauere Analyse des Zeichens kann durch Bildung kleinerer Untermatrizen erreicht werden, indem ein noch engeres Fenster über die Zeichen-Matrizen in den Figu ren 3 und 4 verschoben wird (Fig. 6A und Fig. 6B).
Aus den Hell-Dunkel-Verhältnissen und deren diversen Verknüpfungen ergeben sich dann zusätzliche Zeichenmerkmale.
Hell-Dunkel-Verhältnisse für die Untermatrizen in Fig.
6A:
5 8 9 6 13 = 0,3846; 10 =0,8; 9 = 1; 12 = 0,5 und für Fig. 6B: =15 =0,25; 2 =0,25; 37 =0,4286; 37 =0,4286; 6 8 8 7 7 2 =025 2 =025 =06667.
8 8 6
Differenzfolge der Heli-Dunkel-Verhältnisse für Fig. 6A: Dlt = 0,8 - 0,3846 = 0,4154; D12 = 1 - 0,8 = 0,2; Dt3 = 0,5 - 1 = - 0,5
Normierung auf den Differenzenwert mit kleinstem Absolutbetrag l D12 l = 0,2: D11 -20769 D12 -1 D13 |D12| |D12| =1; |D12| =-2,5
Folge der Differenzen zwischen den Hell-Dunkel-Verhält nissen der einzelnen Untermatrizen in Fig. 6B:
D2, = 0,25 - 1,5 = - 1,25; D22 = 0,25 - 0,25 = 0;
D23 = 0,4286 - 0,25 = 0,1786;
D24 = 0,4286 - 0,286 = 0; D25 = 0,25 - 0,4286 = - 0,1786; D26 = 0,25 - 0,25 = 0:
D2, = 0,6667 - 0,25 = 0,4167.
Normierung der Werte dieser Folge auf den Wert mit kleinstem Absolutbetrag (ausser 0) |D23| = |D25| = 0,1786:
D21 =-7;0; D23 =-1;0 D25 =-1;0;
0,1786 ' ' 0,1786 ' ' 0,1786 -2,3333
0,1786
Wie man aus dem Ausführungsbeispiel ersehen kann, bestehen für das beschriebene Verfahren zur Merknialsextrak- tion keine wesentlichen Einschränkungen: es ist weder fest gebunden an die Feinheit der Rasterung der Zeiehen-Matrix (Ob 10 x 10 -, 20 x 20 - oder 30 x 40 - Punkte-Matrix) und die Anzahl Kolonnen der gebildeten Untermatrizen, noch an die Grösse, die Orientierung oder die Form des Zeichens.
Diese Eigenschaften gewährleisten die eingangs erwähnte grosse Flexibilität des Verfahrens.
Ausserdem wird durch die gleichzeitige Verarbeitung ganzer Zeichenteile in Form von Untermatrizen der Aufwand wesentlich verringert, im Gegensatz zu anderen Verfahren zur Merkmalsextraktion, wo das quantisierte Zeichen Punkt für Punkt untersucht werden muss.
The method relates to the extraction of features from characters, in particular from printed, machine-written or hand-written characters that are not connected but are separated from one another.
Methods for machine reading of characters are known.
One of the known, frequently used and methodologically simplest groups of methods consists in comparing the rasterized character (broken down into pixels) to be recognized with a library of stored character templates. For handwritten characters, however, the large number of stencils makes it impossible to build a corresponding device (1016 stencils would be required, for example, if all possible character variations, shifts, rotations and dilation are taken into account in a relatively coarse 20 x 20 point grid ).
In order to reduce the number of possible character configurations, features are first generated in other methods through various character tests (e.g. the presence or absence of corners, intersections, curves, connectedness, etc.), which are then used for the actual character recognition .
The previous methods for the extraction of character features can be divided into two main groups:
Either the character recognition device forms character features in a learning process that is extended over time, from which the inventor then selects (either directly or through a strategy he considers to be effective) those that appear to him to be essential; or the inventor of the device defines from the start what he considers to be the best character features, which usually leads to a rigid, not very flexible system, or to excessive technical effort.
In both cases the process of feature extraction depends largely on guesswork and there are no clear rules.
The present invention is based on the object of making the reliability of the recognition of characters largely independent of the typeface and the font size, that is to say to achieve greater flexibility. At the same time, the effort required for character recognition should be significantly reduced compared to the known methods and devices of the type mentioned.
In addition, the present invention has the very important property over the known methods and devices that the features can be extracted completely independently from the characters, i.e. H. the method is capable of learning over time to identify any given characters without outside help.
An exemplary embodiment of the invention is described below with reference to FIGS. 1 to 6.
The present character from which features are to be extracted is a handwritten number 3:
The matrix obtained by quantizing the original character is shown in FIG. Circled elements correspond to black points, not circled, white points of the character.
FIG. 2 shows a mapping of the matrix from FIG. 1 into a matrix with 1 and 0 elements.
Fig. 3 shows the smallest sub-matrix in which the character is completely contained
FIG. 4 shows a matrix whose rows are the columns of the matrix in FIG.
5A and 5B each show three sub-matrices with partly identical elements; the sub-matrices are created by horizontally shifting a window over the character matrices in FIGS. 3 and 4.
6A and 6B show smaller sub-matrices which were formed for the purpose of a detailed analysis of the character by shifting a narrower window over the character matrices in FIGS. 3 and 4.
For the sub-matrices obtained in accordance with FIGS. 5A and 5B, the light-dark ratios are formed as follows:
Number of elements with the value 1 divided by the number of elements with the value 0
The following three ratios result for FIG. 5A: 10 = 0.5882; 12 = 0.8; 17 15 = 0.5882; and for Figure 5B: = 0.5217; 287 = 0.2963; ftO = 0.4 23 27 25
These light-dark relationships represent six character features.
By multiplying the light-dark ratios of the sub-matrices in FIGS. 5A and 5B, a characteristic representative of the entire character matrix can be obtained for each of the matrices in FIGS. 3 and 4: 0.5882 x 0.8 x 0.6875 = 0.3235 for Fig. 3 and 0.5217 x 0.2963 x 0.4 = 0.0618 for Fig. 4
The ratio of the last two products and the multiplication of this ratio by the absolute value of the difference between the two products finally provide further characteristic features of the character for the original character matrix in FIG. 3: ratio of the products: 0.3235 = 5.232
0.0618 multiplication with the absolute difference: 1 (0.3235 - 0.0618) 1 x 5.232 = 1.3692
Small changes in character features can be interpreted as an indication of the greater importance and significance of these features.
Additional character features can therefore be obtained by multiplying those black-and-white ratios of the sub-matrices in FIGS. 5A and 5B whose values are closest to one another.
For Fig. 5A these are the ratios: 0.5882 and 0.6875 Product: 0.5882 x 0.6875 = 0.4044
For Fig. 5B, the closest black and white ratios are: 0.2963 and 0.4
Product: 0.2963 x 0.4 = 0.1185
Analogous to the above procedure, this results in additional character features: Ratio of products: 0.4044 = 3.4122
0.1185
Multiplication of the last value by the absolute difference between the two products: 1 (0.4044 - 0.1185) 1 x 3.4122 = 0.9755
An even more precise analysis of the character can be achieved by forming smaller sub-matrices by moving an even narrower window over the character matrices in FIGS. 3 and 4 (FIGS. 6A and 6B).
Additional character features then result from the light-dark relationships and their various links.
Light-dark ratios for the sub-matrices in Fig.
6A:
5 8 9 6 13 = 0.3846; 10 = 0.8; 9 = 1; 12 = 0.5 and for Figure 6B: = 15 = 0.25; 2 = 0.25; 37 = 0.4286; 37 = 0.4286; 6 8 8 7 7 2 = 025 2 = 025 = 06667.
8 8 6
Difference sequence of the heli-dark ratios for FIG. 6A: Dlt = 0.8-0.3846 = 0.4154; D12 = 1-0.8 = 0.2; Dt3 = 0.5 - 1 = - 0.5
Normalization to the difference value with the smallest absolute amount l D12 l = 0.2: D11 -20769 D12 -1 D13 | D12 | | D12 | = 1; | D12 | = -2.5
Result of the differences between the light-dark ratios of the individual sub-matrices in Fig. 6B:
D2 = 0.25-1.5 = -1.25; D22 = 0.25-0.25 = 0;
D23 = 0.4286-0.25 = 0.1786;
D24 = 0.4286-0.286 = 0; D25 = 0.25-0.4286 = -0.1786; D26 = 0.25 - 0.25 = 0:
D2, = 0.6667-0.25 = 0.4167.
Normalization of the values of this sequence to the value with the smallest absolute amount (except 0) | D23 | = | D25 | = 0.1786:
D21 = -7,0; D23 = -1; 0 D25 = -1; 0;
0.1786 "0.1786" 0.1786 -2.3333
0.1786
As can be seen from the exemplary embodiment, there are no major restrictions for the described method for feature extraction: it is not bound to the fineness of the grid of the drawing matrix (whether 10 x 10, 20 x 20 or 30 x 40 - Dot matrix) and the number of columns of the sub-matrices formed, as well as the size, orientation or shape of the character.
These properties ensure the great flexibility of the process mentioned at the beginning.
In addition, the simultaneous processing of entire character parts in the form of sub-matrices significantly reduces the effort, in contrast to other methods for feature extraction, where the quantized character has to be examined point by point.