DE2262873A1

DE2262873A1 - Anordnung zur ermittlung der klassenzugehoerigkeit von zeichen

Info

Publication number: DE2262873A1
Application number: DE2262873A
Authority: DE
Inventors: Wilfried Kochert; Werner Dipl Ing Wiedemeyer
Original assignee: Licentia Patent Verwaltungs GmbH
Current assignee: Licentia Patent Verwaltungs GmbH
Priority date: 1972-12-22
Filing date: 1972-12-22
Publication date: 1974-07-11
Also published as: DE2262873B2

Description

Anordnung zur Ermittlung der Klassenzugehörigkeit von Zeichen Ii Die Erfindung betrifft eine Anordnung zur Ermittlung der Klassenzugehörigkeit (Bedeutung) in Ja und nein bedeutende Bildelemente aufgelöster Zeichen mit Hilfe zu errechnender Schätzwerte unter Berücksichtigung in einem Adaptionsprozeß berechneter Zeichenmerkmale sowie deren Gewichte -(Koeffizienten).
Zwischen der Topologie eines Zeichens und dessen Bedeutung 1 besteht ein mathematisch interpretierbarer Zusammenhang (Elektronische Rechenanlagen 11 (1969) Heft 1* Seite 21-28).
Ein bei der Abtastung eines Zeichens erhaltenes quantisiertes Zeichenbild läßt sich gemäß obiger Literaturstelle durch einen Merkmalsvektor V beschreiben. Jede Komponente vi dieses Vektors repräsentiert ein Bildelement (Zeichenmerkmal), wobei vi nur den Wert O (= nein) oder 1 (# jal annehmen kann.
Die Ermittlung der Klassenzugehörigkeit stellt mathematisch gesehen eine Transformation dieses Vektors V in einen Vektor D dar, wobei D die Aussage über die Klassenzugehörigkeit von V@enthält und als Schätzvektor bezeichnet wird. Für den Vektor D gilt die Darstellung D " (d1, d2, d3, .. dF...DK).
Hierin ist jede Komponente dv (Schätzwert) einer Zeichenklasse F von insgesamt K Zeichenklassen zugeordnet.
Mathematisch läßt sich eine Schätzfunktion dF (V) für jede Zeichenklasse F durch einen Potenzreihenansatz approximieren: dF = aOF + a1F v1...+ aiF vi ... + 2nF # vn + a(n+1)F v1.v2 ... + amF vi#vj + ... (1) + Terme höheren Grades.
Mit Einführung eines Eigenschaftsvektors X (Fig.3), dessen Komponenten Zeichenmerkmale vi und Produkte vi . v sind, ist die Nichtlinearität der Schätzfunktion dF (V) vollständig in die Funktion X (V) verlegbar. DieSchätzfunktion dF (V) kann jetzt auch in der Form dF (X) geschrieben werden.
dF = AF # X (V) Werden die Koeffizientenvektoren AF aller Zeichenklassen zu einer Koeffizientenmatrix A zusammengefaßt (Fig.4), so erhält man für den Schätzvektor, D folgende Funktion: D = A . X (V). (2) Die Komponenten dieser Koeffizientenmatrix A werden nach einem festgelegten Verfahren aus einer Stichprobe von Zeichen, deren Bedeutung bekannt ist, in einem gesonderten Adaption.
prozeß berechnet. Eine Anordnung zur Berechnung des Vektors D mit allen infrage kommenden Gliedern ist sehr aufwendig und nicht sehr sinnvoll. Daher sieht auch das bekannte Vert fahren fiir die Berechnung der Schätzwerte dF vor, eine Anzahl von Gliedern der Gleichung wegzulassen.
In dem später gezeigten Beispiel einer Anordnung zur Ermittlung des Schätzvektors in Rasterelemente aufgelöster Zeichen werden nur 512 Glieder benutzt und die kleinsten Koeffizienten weggelassen, weil sie die Schätzwerte nicht mehr wesentlich verbessern können. Damit erhält die Gleichung dF (X) die Form Eine Normierung der Koeffizienten a iF auf den Zahlenbereich von -1 bis +1 bringt einen Normierungsfaktor BF in die-Be- { ziehung dF (X): = BF (CF + SUF) (3) Die Erfindung bezieht sich auf eine Anordnung zur Durchführung einer Schätzwertberechnung entsprechend der Gleichung (3) mit Hilfe digitaler elektronischer Schaltmittel.
Die Erfindung ist dadurch gekennzeichnet, daß zur Aufnahme eines in Bildelemente (vi, vj) aufgelösten Zeichens mindestens ein Speicher mit wahlfreiem Zugriff vorgesehen ist, dem zum seriellen Auslesen der Bildelemente (vi, t) ein Merkmal-Adressenspeicher mit im Adaptionsprozeß berechneten Adressen zugeordnet ist, daß eine an den Speicher angeschlossene Verknüpfungsschaltung die Bildelemente vi, tJ m Merkmalsverknüpfungen Xk verknüpft, daß der Ausgang der Verknüpfungsschaltung an ein mit einem weiteren1 mit in Adaptionsprozeß berechneten und als Binärwerte gespeicherten merkmals-und klassenspezifischen Koeffizienten aiF geladenen Speicher verbundenes Summierwerk angeschlossen ist, in den die Produkte aiF @ # xk zu klassenspezifischen Summen SUF aufaddiert werden, daß ein an das Summierwerk angeschlossener Einbit-Volladdierer im Adaptionsprozeß berechnete klassenspezifische Summanden CF eines den Einbit-Volladdierer zugeordneten weiteren Speichers seriell zu den Summen SUF F addiert und daß ein aus einem weiteren Speicher mit klassenspezifischen Faktoren Bp versorgtes Multiplizierwerk an den Ausgang des Einbit-Volladdierers angeschlossen ist, an dessen Ausgang als Ergebnis einer Multiplikation der vorher erhaltenen Summen mit den Faktoren BF Schätzwerte dF ausgegeben werden.
Ein weiteres Kennzeichen der Erfindung ist, daß das Summierwerk eine der Anzahl der zu erkennenden Zeichenklassen entsprechende Anzahl von-parallel arbeitenden Teil-Summierwerken enthält und ein Pufferregister zur teilparallelen Übernahme der Summenwerte SUF F aus einem Addierwerk-Ergebnisregister sowie zur seriellen Überführung der Summenwerte Sud in den 3 Einbit-Volladdierer zwischen das Summierwerk und den Einbit-Volladdierer geschaltet ist.
In besonderen Fällen kann vorgesehen sein, daß zwei Speicher mit wahlfreiem Zugriff vorhanden. sind, in die dasaufgelöste Zeichen gleichzeitig einschreibbar ist, daß an diese Speicher zwei Adressenspeicher angeschlossen sind, die Bildelemente und Bildelemente-Paare der Speicher seriell aufrufen und auf getrennten Leitungen der Verknüpfungsschaltung zuführen.
Außerdem ist es ein Kennzeichen der Erfindung, daß bei der Klassifizierung verschiedener Schriftarten für jede' Schriftart eine eigene Speichergruppe, bestehend aus weiteren Speichern entsprechend den Speichern 109 13, 15, für die Klassifikatordaten (Adressen, Koeffizienten, Summanden, Faktoren) vorgesehen ist und daß jeweils eine der Speichergruppen auswählbar und einschaltbar ist5 Anhand der Figuren 1 bis 4 wird diese Anordnung im folgenden näher beschrieben.
Figur 1 zeigt eine Anordnung zur Schätzwertberechnung und Figur 2 ein Summierwerk dieser Anordnung.
Figur 3 und 4 zeigen ein Beispiel eines Eigenschaftsvektors und eines Koeffizientenvaktors.
In Fig.l ist 1 ein aus einem Schieberegister bestehender Bildspeicher und 2 ein Adressenspeicher einer nicht näher dargestellten Zeichenerkennungsmaschine. 3 zeigt einen Einspeicher-Adressenzähler. Der Adressenspeicher 2 ist mit anhand von Stichproben in einem Adaptionsprozea berechneten Verknüpfungsanweisungen zu gleichen Teilen 21, 22 (doppelt) geladen.
Mit 4'imd 5 sind Speicher mit wahlfreiem Zugriff bezeichnest. Beide Speicher 4, 5 sind gemeinsam an den Bildspeicher t angeschlossen und außerdem über je ein Adressenregi ster 6 und 7 über Multiplexer 61 und 71 mit dem Adressenregister 2 und dem Einspeicher-Adressenzähler 3 verbunden.
Beide Speicher 4 und 5 haben außerdem je eine Verbindung zu@ einer konjunktiven Verknüpfungsschaltung 8. An diese Verknüpfungsschaltung 8 ist ein, Summierwerk 9 angeschlossen, das eine der Anzahl der vorhandenen Zeichenklassen entsprechenden Zahl von Einzelsummierwerken in sich vereinigt (Fig.2), welche aus beispielsweise 16 6-stelligen Multiplexern 90, ebensoviel 6-stelligen Eingangsregistern 91, 12-stelligen Binäraddierern 92 und 12-stelligen Ergebnisregistern 93 bestehen.
10 ist ein an das Summierwerk 9 angeschlossener Koeffizientenspeicher, der mit anhand von Stichproben im Adaption prozeß berechneten merkmals- und klassenspezifischen Koeffizienten geladen ist. Im weiteren ist 11 ein zwischen das Summierwerk 9 und.einen Einbit-Volladdierer 12 geschaltetes Pufferregister. An den Einbit-Volladdierer 12, der mit- einem Summandenspeicher 13 verbunden ist, schließt sich ein mit eine Faktorspeicher 15 verbundenes Multiplizierwerk 14 an.
Die in Klammern gesetzten Ziffern an den Leitungen der Figuren 1 und 4 geben die Anzahl der Adern an, aus denen die betreffende Verbindung besteht. Masseleitungen sind nicht dargestellt.
Ist nun ein Zeichen abgetastet worden und in den Bildspeicher 1 eingeschrieben und von einem nicht dargestellten Zentrierwerk die zentrierte Lage gemeldet worden, so gibt der Adressenzähler ein 16 Takte umfassendes Einschreibsignal mit der Taktfrequenz des Bildspeichers 1 an die Speicher 4 u.5. Der Adressenzähler liefert die Adressen von 0 bis 15 und gibt diese gleichzeitig an die Adressenregister 6, 7.
Mit diesen 16 Takten des.Adressenzählers 3 werden die Merkmalsdaten aus dem Bildspeicher 1 in die beiden Speicher 4 und 5 gleichzeitig übernommen. Nach diesem Einspeicherzyklus werden die Verknüpfungsanweisungen des Adressenspeichers 2 an die Adrgssenregister 6, 7 geschaltet. Da beide Speicher 4, 5 wahlfreien Zugriff haben, ist jede Speicherstelle adressierbar.
Mit je acht Adressenbits der Adressenregister 6, 7 werden die Speicher'4 und 5 adressiert,.so daß an den Ausgang des einen Speichers (vi) durchgeschaltet wird das in der Ver-(v.) knüpfungsschaltung 8 mit einem Bit?vom Ausgang des anderen Speichers zu einer Merkmalsverknüpfung xk verknüpft wird.
Die Merkmalsverknüpfungen Xk. werden dem Summierwerk 9 zugeführt, um hier in einer der Anzahl der zu erkennenden Zeichenklassen entsprechenden Zahl von parallel arbeitenden Summierwerken (z.B. 16) eine' @ Akkumulation der Koeffi-.
zienten aiF des Koeffizientenspeichers 10 zu steuern. Am Ausgang des Summierwerkes 9 erscheinen die Summenwerte SUF.
Um das Summierwerk für die Berechnung eines nachfolgenden wieder Zeichenmusters/bereitzustellen, werden die Summenwerte aus dem Akkumulatorregister@teilparallel in ein Pufferregister 11 übergeben.
Anschließend werden im Adaptionsprozeß berechnete und im Speicher 13 gespeicherte Summanden F in einem 1-Bit-Yolladdierer 12 zu den SUF-Werten addiert.
Schließlich werden die erhaltenen Summenwerte (SUF + CF) noch in einem Multiplizierwerk 14 mit gleichfalls im Adaptionsprozeß berechneten, im Speicher 15 gespeicherten Faktoren BF multipliziert. Diese Multiplikation wird nach einem an sich bekannten Verfahren der wiederholten, stellenverschobenen Addition des einen Faktors, gesteuert durch den anderen Faktor, durchgeführt. Die dF-Werte für die einzelnen Zeichenklassen F werden nacheinander in nur einem Multiplizierwerk 14 berechnet.
In dön Figuren 1 und 2 sind an den Multiplexern 6i und 71 sowie am Summierwerk 9, dem Einbitvolladdierer 12 und dem Multiplizierwerk 14 offene, mit den Buchstaben a und b bezeichnete Eingänge dargestellt. An all diese Eingänge lassen sich andere Adressenspeicher 2 bzw. Koeffizientenspeicher 10, Summandenspeicher 13 und Faktorenspeicher 15 anschließen1 die mit anderen Zeichenarten angehörenden spezifischen Werten geladen sein können.
Durch Anlegen eines Umschaltsignales U an die oben genannten Multiplexer 61, 71 und 90 sowie an den Einbitvolladdierer 12 und das Multiplizierwerk i4 ist es möglich, mit der beschriebenen Anordnung auch die Klassenzugehörigkeit von Zeichen eines zweiten oder weiterer Fonds zu ermitteln, wenn es sich um die Ermittlung der Klassenzugehörigkeit von Schriftzeichen handelt. Solch ein Umschaltsignal U kann durch einen Handumsc'halter oder auch durch eine auf der Lesezeile eines Zeichenträgers angebrachte Markierung, zu deren Erkennung die Erkennungseinrichtung ausgerüstet sein muß, erzeugt werden.
Am Ausgang des Multiplizierwerkes 14 werden die Schätzwerte dF erhalten, deren Größen in einem nicht dargestellten Diskriminator ausgewertet werden und eine eindeutige Aussage über die Klassenzugehörigkeit des im Speicher 1 eingeschriebenen Zeichens liefern.

Claims

Patentansprüche

1. Anordnung zur Ermittlung der Klassenzugehörigkeit (Bedeutung) in schwarze und weiße Bildelemente aufgelöster Zeichen durch die Berechnung von die Klassenzugehörigkeit kennzeichnenden Schätzwerten unter Verwendung in einem Adaptionsprozeß anhand von Zeichenstichproben berechneter Klassifikatordaten, dadurch gekennzeichnet, daß zur Aufnahme eines in Bildelemente (vi, vj) aufgelösten Zeichens mindestens ein Speicher (4) mit wahlfreiem Zugriff vorgesehen ist, dem zum seriellen Auslesen der Bildelemente (vi, v ) ein j Merkmal-Adressenspeicher (21) mit im Adaptionsprozeß berechneten Adressen zugeordnet ist, daß eine an den Speicher angeschlossene Verknüpfungsschaltung (8) die Bildelemente vi, v. zu Merkmalsverknüpfungen verknüpft, daß der Ausgang J der Verknüpfungsschaltung (8) an ein mit einem weiteren, mit im Adaptionsprozeß berechneten und als Binärwerte gespeicherten merkmals- und klassenspezifischen Koeffizienten aiF geladenen Speicher (10) verbundenes Summierwerk (9) angeschlossen ist, in dem die Produkte a iF zu klassenspezifischen Summen SUF aufaddiert werden1 daß ein an das Summierwerk angeschlossener Einbit-Volladdierer (12) im Adaptionsprozeß berechnete klassenspezifische Summanden CF eines dem Einbit-Volladdierer zugeordneten weitren Speichers (13) seriell zu den Summen SUF addiert und daß ein aus einem werteren Speicher (15) mit klassenspezifischen Faktoren BF versorgtes Multiplizierwerk (14) an den Ausgang des Einbit-Volladdierers (12) angeschlossen ist, an dessen Ausgang als Ergebnis einer Mulptiplikation der vorher erhaltenen Summen mit den Faktoren F Schätzwerte dF ausgegeben werden.

2. Anordnung nach Anspruch 1, dadurch gekennzeichnet, daß das ,Summierwerk (9) eine der Anzahl der zu erkennenden Zeichenklassen entsprechende Anzahl von parallel arbeitenden Teil-Summierwerken (90) bis (9K) enthäl-t und ein-«Pufferregister (ist) zur teilparallelen Übernahme der Summenwerte SUF aus einem -Addierwerk-Ergebnisregister (93) sowie zur seriellen Überführung der Summenwerte SUF in den Einbit-Volladdierer (12) zwischen das Summierwerk (9) und den Einbit-Volladdierer (12) geschaltet ist.

3. Anordnung nach Anspruch 1, dadurch gekennzeichnet, daß zwei Speicher (4, 5) mit wahlfreiem Zugriff vorgesehen sind, in die das aufgelöste Zeichen gleichzeitig einschreibbar ist, daß an diese Speicher(4, 5) zwei Adressenspeicher (2, 21) angeschlossen sind, die Bildelemente und Bildelemente-Paare der Speicher (4, 5) seriell aufrufen und auf getrennten Leitungen der Verknüpfungsschaltung (8) zuführen.

4. Anordnung nach Anspruch 1, 2 und 3, dadurch gekennzeichnet, daß bei der Klassifizierung verschiedener Schriftarten für jede Schriftart eine eigene Speichergruppe, bestehend aus weiteren Speichern (iOa, 13a, 15a) entsprechend den Speichern 10, 13, 1,, für die Klassifikatordaten (Adressen, Koeffizienten, Summanden, Faktoren) vorgesehen ist und daß jeweils eine der Speichergruppen auswählbar und einschaltbar ist.