-
Anordnung zur Ermittlung der Klassenzugehörigkeit von Zeichen Ii
Die Erfindung betrifft eine Anordnung zur Ermittlung der Klassenzugehörigkeit (Bedeutung)
in Ja und nein bedeutende Bildelemente aufgelöster Zeichen mit Hilfe zu errechnender
Schätzwerte unter Berücksichtigung in einem Adaptionsprozeß berechneter Zeichenmerkmale
sowie deren Gewichte -(Koeffizienten).
-
Zwischen der Topologie eines Zeichens und dessen Bedeutung 1 besteht
ein mathematisch interpretierbarer Zusammenhang (Elektronische Rechenanlagen 11
(1969) Heft 1* Seite 21-28).
-
Ein bei der Abtastung eines Zeichens erhaltenes quantisiertes Zeichenbild
läßt sich gemäß obiger Literaturstelle durch einen Merkmalsvektor V beschreiben.
Jede Komponente vi dieses Vektors repräsentiert ein Bildelement (Zeichenmerkmal),
wobei vi nur den Wert O (= nein) oder 1 (# jal annehmen kann.
-
Die Ermittlung der Klassenzugehörigkeit stellt mathematisch gesehen
eine Transformation dieses Vektors V in einen Vektor
D dar, wobei
D die Aussage über die Klassenzugehörigkeit von V@enthält und als Schätzvektor bezeichnet
wird. Für den Vektor D gilt die Darstellung D " (d1, d2, d3, .. dF...DK).
-
Hierin ist jede Komponente dv (Schätzwert) einer Zeichenklasse F von
insgesamt K Zeichenklassen zugeordnet.
-
Mathematisch läßt sich eine Schätzfunktion dF (V) für jede Zeichenklasse
F durch einen Potenzreihenansatz approximieren: dF = aOF + a1F v1...+ aiF vi ...
+ 2nF # vn + a(n+1)F v1.v2 ... + amF vi#vj + ... (1) + Terme höheren Grades.
-
Mit Einführung eines Eigenschaftsvektors X (Fig.3), dessen Komponenten
Zeichenmerkmale vi und Produkte vi . v sind, ist die Nichtlinearität der Schätzfunktion
dF (V) vollständig in die Funktion X (V) verlegbar. DieSchätzfunktion dF (V) kann
jetzt auch in der Form dF (X) geschrieben werden.
-
dF = AF # X (V) Werden die Koeffizientenvektoren AF aller Zeichenklassen
zu einer Koeffizientenmatrix A zusammengefaßt (Fig.4), so erhält man für den Schätzvektor,
D folgende Funktion: D = A . X (V). (2) Die Komponenten dieser Koeffizientenmatrix
A werden nach einem festgelegten Verfahren aus einer Stichprobe von Zeichen, deren
Bedeutung bekannt ist, in einem gesonderten Adaption.
-
prozeß berechnet. Eine Anordnung zur Berechnung des Vektors D mit
allen infrage kommenden Gliedern ist sehr aufwendig und nicht sehr sinnvoll. Daher
sieht auch das bekannte Vert fahren fiir die Berechnung der Schätzwerte dF vor,
eine Anzahl von Gliedern der Gleichung wegzulassen.
-
In dem später gezeigten Beispiel einer Anordnung zur Ermittlung des
Schätzvektors in Rasterelemente aufgelöster Zeichen werden nur 512 Glieder benutzt
und die kleinsten Koeffizienten weggelassen, weil sie die Schätzwerte nicht mehr
wesentlich verbessern können. Damit erhält die Gleichung dF (X) die Form
Eine Normierung der Koeffizienten a iF auf den Zahlenbereich von -1 bis +1 bringt
einen Normierungsfaktor BF in die-Be- { ziehung dF (X):
= BF (CF + SUF) (3) Die Erfindung bezieht sich auf eine Anordnung zur Durchführung
einer Schätzwertberechnung entsprechend der Gleichung (3) mit Hilfe digitaler elektronischer
Schaltmittel.
-
Die Erfindung ist dadurch gekennzeichnet, daß zur Aufnahme eines in
Bildelemente (vi, vj) aufgelösten Zeichens mindestens ein Speicher mit wahlfreiem
Zugriff vorgesehen ist, dem zum seriellen Auslesen der Bildelemente (vi, t) ein
Merkmal-Adressenspeicher mit im Adaptionsprozeß berechneten Adressen zugeordnet
ist, daß eine an den Speicher angeschlossene Verknüpfungsschaltung die Bildelemente
vi, tJ m Merkmalsverknüpfungen Xk verknüpft, daß der Ausgang der Verknüpfungsschaltung
an ein mit einem weiteren1 mit in Adaptionsprozeß berechneten und als Binärwerte
gespeicherten merkmals-und klassenspezifischen Koeffizienten aiF geladenen Speicher
verbundenes Summierwerk angeschlossen ist, in den die Produkte aiF @ # xk zu klassenspezifischen
Summen SUF aufaddiert werden, daß ein an das Summierwerk angeschlossener Einbit-Volladdierer
im Adaptionsprozeß berechnete klassenspezifische Summanden CF eines den Einbit-Volladdierer
zugeordneten weiteren Speichers seriell zu den Summen SUF F addiert und daß ein
aus einem weiteren Speicher mit klassenspezifischen Faktoren Bp versorgtes Multiplizierwerk
an den Ausgang des Einbit-Volladdierers angeschlossen ist, an dessen Ausgang als
Ergebnis einer Multiplikation der vorher erhaltenen Summen mit den Faktoren BF Schätzwerte
dF ausgegeben werden.
-
Ein weiteres Kennzeichen der Erfindung ist, daß das Summierwerk eine
der Anzahl der zu erkennenden Zeichenklassen entsprechende
Anzahl
von-parallel arbeitenden Teil-Summierwerken enthält und ein Pufferregister zur teilparallelen
Übernahme der Summenwerte SUF F aus einem Addierwerk-Ergebnisregister sowie zur
seriellen Überführung der Summenwerte Sud in den 3 Einbit-Volladdierer zwischen
das Summierwerk und den Einbit-Volladdierer geschaltet ist.
-
In besonderen Fällen kann vorgesehen sein, daß zwei Speicher mit wahlfreiem
Zugriff vorhanden. sind, in die dasaufgelöste Zeichen gleichzeitig einschreibbar
ist, daß an diese Speicher zwei Adressenspeicher angeschlossen sind, die Bildelemente
und Bildelemente-Paare der Speicher seriell aufrufen und auf getrennten Leitungen
der Verknüpfungsschaltung zuführen.
-
Außerdem ist es ein Kennzeichen der Erfindung, daß bei der Klassifizierung
verschiedener Schriftarten für jede' Schriftart eine eigene Speichergruppe, bestehend
aus weiteren Speichern entsprechend den Speichern 109 13, 15, für die Klassifikatordaten
(Adressen, Koeffizienten, Summanden, Faktoren) vorgesehen ist und daß jeweils eine
der Speichergruppen auswählbar und einschaltbar ist5 Anhand der Figuren 1 bis 4
wird diese Anordnung im folgenden näher beschrieben.
-
Figur 1 zeigt eine Anordnung zur Schätzwertberechnung und Figur 2
ein Summierwerk dieser Anordnung.
-
Figur 3 und 4 zeigen ein Beispiel eines Eigenschaftsvektors und eines
Koeffizientenvaktors.
-
In Fig.l ist 1 ein aus einem Schieberegister bestehender Bildspeicher
und 2 ein Adressenspeicher einer nicht näher dargestellten Zeichenerkennungsmaschine.
3 zeigt einen Einspeicher-Adressenzähler. Der Adressenspeicher 2 ist mit anhand
von Stichproben in einem Adaptionsprozea berechneten Verknüpfungsanweisungen zu
gleichen Teilen 21, 22 (doppelt) geladen.
-
Mit 4'imd 5 sind Speicher mit wahlfreiem Zugriff bezeichnest. Beide
Speicher 4, 5 sind gemeinsam an den Bildspeicher t angeschlossen und außerdem über
je ein Adressenregi ster 6 und 7 über Multiplexer 61 und 71 mit dem Adressenregister
2 und dem Einspeicher-Adressenzähler 3 verbunden.
-
Beide Speicher 4 und 5 haben außerdem je eine Verbindung zu@ einer
konjunktiven Verknüpfungsschaltung 8. An diese Verknüpfungsschaltung 8 ist ein,
Summierwerk 9 angeschlossen, das eine der Anzahl der vorhandenen Zeichenklassen
entsprechenden Zahl von Einzelsummierwerken in sich vereinigt (Fig.2), welche aus
beispielsweise 16 6-stelligen Multiplexern 90, ebensoviel 6-stelligen Eingangsregistern
91, 12-stelligen Binäraddierern 92 und 12-stelligen Ergebnisregistern 93 bestehen.
-
10 ist ein an das Summierwerk 9 angeschlossener Koeffizientenspeicher,
der mit anhand von Stichproben im Adaption prozeß berechneten merkmals- und klassenspezifischen
Koeffizienten geladen ist. Im weiteren ist 11 ein zwischen das Summierwerk 9 und.einen
Einbit-Volladdierer 12 geschaltetes Pufferregister. An den Einbit-Volladdierer 12,
der mit- einem Summandenspeicher 13 verbunden ist, schließt sich ein mit eine Faktorspeicher
15 verbundenes Multiplizierwerk 14 an.
-
Die in Klammern gesetzten Ziffern an den Leitungen der Figuren 1 und
4 geben die Anzahl der Adern an, aus denen die betreffende Verbindung besteht. Masseleitungen
sind nicht dargestellt.
-
Ist nun ein Zeichen abgetastet worden und in den Bildspeicher 1 eingeschrieben
und von einem nicht dargestellten Zentrierwerk die zentrierte Lage gemeldet worden,
so gibt der Adressenzähler ein 16 Takte umfassendes Einschreibsignal mit der Taktfrequenz
des Bildspeichers 1 an die Speicher 4 u.5. Der Adressenzähler liefert die Adressen
von 0 bis 15 und gibt diese gleichzeitig an die Adressenregister 6, 7.
-
Mit diesen 16 Takten des.Adressenzählers 3 werden die Merkmalsdaten
aus dem Bildspeicher 1 in die beiden Speicher 4 und 5 gleichzeitig übernommen. Nach
diesem Einspeicherzyklus werden die Verknüpfungsanweisungen des Adressenspeichers
2 an die Adrgssenregister 6, 7 geschaltet. Da beide Speicher 4, 5 wahlfreien Zugriff
haben, ist jede Speicherstelle adressierbar.
-
Mit je acht Adressenbits der Adressenregister 6, 7 werden die Speicher'4
und 5 adressiert,.so daß an den Ausgang des einen Speichers (vi) durchgeschaltet
wird das in der Ver-(v.) knüpfungsschaltung 8 mit einem Bit?vom Ausgang des anderen
Speichers zu einer Merkmalsverknüpfung xk verknüpft wird.
-
Die Merkmalsverknüpfungen Xk. werden dem Summierwerk 9 zugeführt,
um hier in einer der Anzahl der zu erkennenden Zeichenklassen entsprechenden Zahl
von parallel arbeitenden Summierwerken (z.B. 16) eine' @ Akkumulation der Koeffi-.
-
zienten aiF des Koeffizientenspeichers 10 zu steuern. Am Ausgang des
Summierwerkes 9 erscheinen die Summenwerte SUF.
-
Um das Summierwerk für die Berechnung eines nachfolgenden wieder Zeichenmusters/bereitzustellen,
werden die Summenwerte aus dem Akkumulatorregister@teilparallel in ein Pufferregister
11 übergeben.
-
Anschließend werden im Adaptionsprozeß berechnete und im Speicher
13 gespeicherte Summanden F in einem 1-Bit-Yolladdierer 12 zu den SUF-Werten addiert.
-
Schließlich werden die erhaltenen Summenwerte (SUF + CF) noch in einem
Multiplizierwerk 14 mit gleichfalls im Adaptionsprozeß berechneten, im Speicher
15 gespeicherten Faktoren BF multipliziert. Diese Multiplikation wird nach einem
an sich bekannten Verfahren der wiederholten, stellenverschobenen Addition des einen
Faktors, gesteuert durch den
anderen Faktor, durchgeführt. Die
dF-Werte für die einzelnen Zeichenklassen F werden nacheinander in nur einem Multiplizierwerk
14 berechnet.
-
In dön Figuren 1 und 2 sind an den Multiplexern 6i und 71 sowie am
Summierwerk 9, dem Einbitvolladdierer 12 und dem Multiplizierwerk 14 offene, mit
den Buchstaben a und b bezeichnete Eingänge dargestellt. An all diese Eingänge lassen
sich andere Adressenspeicher 2 bzw. Koeffizientenspeicher 10, Summandenspeicher
13 und Faktorenspeicher 15 anschließen1 die mit anderen Zeichenarten angehörenden
spezifischen Werten geladen sein können.
-
Durch Anlegen eines Umschaltsignales U an die oben genannten Multiplexer
61, 71 und 90 sowie an den Einbitvolladdierer 12 und das Multiplizierwerk i4 ist
es möglich, mit der beschriebenen Anordnung auch die Klassenzugehörigkeit von Zeichen
eines zweiten oder weiterer Fonds zu ermitteln, wenn es sich um die Ermittlung der
Klassenzugehörigkeit von Schriftzeichen handelt. Solch ein Umschaltsignal U kann
durch einen Handumsc'halter oder auch durch eine auf der Lesezeile eines Zeichenträgers
angebrachte Markierung, zu deren Erkennung die Erkennungseinrichtung ausgerüstet
sein muß, erzeugt werden.
-
Am Ausgang des Multiplizierwerkes 14 werden die Schätzwerte dF erhalten,
deren Größen in einem nicht dargestellten Diskriminator
ausgewertet
werden und eine eindeutige Aussage über die Klassenzugehörigkeit des im Speicher
1 eingeschriebenen Zeichens liefern.