-
Verfahren und Erkennungssystem für Zeichen im Schriftverband Die Erfindung
betrifft ein Verfahren und ein Erkennungssystem für Schriftzeichen mehrerer Schriftarten,
die infolge von Berührungen mit den @achbarzeichen nicht in jedem Falle voneinander
separierbar und damit zentrierbar sind.
-
Um auf der Grundlage herkömmlicher Erkennungsverfahren relativ billiger
Lesegeräte liefern zu können, wurden die sogenannten OCR-Schriften eingeführt. Diese
besitzen neben dez: relativ guten visuellen LEsbarkeit folgende Eigenschaften, die
die maschinelle Erkennung wesentlich vereinfachen: - Die Zeichen sind grundsätzlich
einfach strukturiert.
-
- An eine der ähnlichen Klassen werden Merkmale vor£esehen, die eine
sichere Unterscheidung ermöglichen.
-
- Die Zeichen sind so schmal, daß unter keinen Umständen Berührungen
mit den Nachbarzeichen auftreten können.
-
Unabhängig von diesen Standardisierungsbestrebungen wurde laufend
nach leistungsfähigeren Erkennungsverfahren gesucht. Neben den zahlreichen Maskenverfahren,
auf die hier nicht weiter eingegangen werden muß, entstanden dabie vor allem Formelemente-Verfahren
(FEV). Das theoretisch Modell für eine Einrichtung nach einem i'EV ist ein Mehrschichtsystem,
mit dem ein Klassifikator mit beliebigen Nichtlinearitäten realisiert werden kann.
-
Diese Nichtlinearitäten sind Voraussetzung zur Lösung schwieriger
Erkennungsaufgaben. Die Extraktion von 3-Formelementen in einer ersten Systemstufe
und ihre Kombination zu Klassenprototypen in einer zweiten Systemstufe ( dem eigentlichen
Klassifikator, wenn die Formelemente als Merkmale betrachtet werden) sichert aus
folgenden Gründen ein besonders günstiges Verhältnis von techischem Aufwand zu Leistung:
- Ein Formelement entspricht einem Zeichenteil, das auch der Mensch, der sich die
Schriftzeichen geschaffen hat, als unterschiedliches Merkmal benutzt.
-
- Es ist möglich, die Formelemente als Grundbausteine verschiedener
Klassen und verschiedener Schriftarten in unterschiedlichen Positionen im Zeichen
zu benutzen, do h. es ist möglich, mit einem relativ kleinen Satz von Formelementen
ein großes Spektrum von Erkennungsaufgaben zu lösen.
-
- Die flächenmäßige Begrenzung der Foimelemente verschafft die Möglichkeit,
Zeichenteile, die zur Unterscheidung von Klassen besonders wichtig sind, unabhängig
von den anderen Teilen zu beschreiben. Normalerweise wird von einer binär quantisierten
Rasterdarstellung der Zeichen ausgegangen, d. h. die lokale Begrenzung der Formelemente
impliziert hier eine Verrinnerung der Zahl der Eingangsvariablen für die Merkmaldetektoren,
was wiederum die Möglichkeit verschafft, extrem leistungsfähige Detektoren zu konstruieren.
-
- Das Mehrschriftproblem kann mit geringem Aufwand gelöst werden,
wenn sich die Zeichen einer Klasse in den verschiedenen Schriftarten nicht inihrer
Gesamtheit, sondern nur in Teilen unterscheiden.
-
Derartige Verfahren lassen sich mittels ausgefeilter Konstruktionsalgorithmen
zu hohen Leistungen hochzüchten, so daß die ersten beiden erwähnten Vorteile von
OCR-Schriften an Bedeutung verlieren. Dagegen sind die meisten Verfahren immer noch
auf eine deutlich meßbare Bücke zwischen benachbarten Zeichen angewiesen. Es existieren
jedoch auch Verfahren, die sich berührende Zeichen verarbeiten können Diese arbeiten
im eigentlichen Erkennungsschritt wie die erwähnten, doh. sie benutzen zentrierte
Zeichen. Die Abtrennung der Zeichen aus dem Schriftverband geschieht durch besonderte
Detektoren, die den Formelemente-Detektoren stark ähneln und der Erkennungseinrichtung
vorgeschaltet sind. Nach ihrer Entscheidung werden die Zeichengrenzen definiert,
das Zeichen wird dementsprechend aus dem Schriftverband abgetrennt und als Einzelzeichen
der Erkennungseinrichtung zugeführt. Es ist nun eine Tatsache, daß schlecht zentrierte
Zeichen mit Verfahren, die auf eine Zentrierung angewiesen sind, unzureichend erkannt
werden. Die Genauigkeit der Zentrierung hängt jedoch von der zuverlässigen Arbeitsweise
der Segmentierungsdetektoren ab. Während bei der Erkennung des zentrierten Zeichens
das Vorhandensein von neist mehr als fUnf Formelementen gefordert wird, verläßt
man sich bei einer derartigen Segmentierung auf ein oder zwei Detektoren. Die Folge
dieser Vorgehensweise ist, daß die Erkennungssicherheit bei sich beruhrenden Zeichen
nicht die extrem hohen Werte erreicht, die an getrennten Einzelzeichen erreichbar
sind.
-
Zweck der Erfindung ist es, ein Verfahren und ein Erkennungssystem
zu schaffen, die auch an miteinander verbundenen Zeichen die Fehler- und Rückweisungsraten
erreichen, die sonst nur bei getrennten Einzelzeichen erreicht werden, die für Mehrschrifterkennung
mit und ohne Umschaltung der Schriftart geeignet sind und die unempfindlich gegenüber
Störungen, z. B. Schwa'rzungsänderungen, Unterbrechungen der Linien, Höhenversatz
der Zeichen, gewisse Verdrehungen der Zeichen, Blecken auf dem Papier usw. sind.
-
Der Erfindung liegt die Aufgabe zugrunde, ein aufwandsoptimales Verfahren
und ein lilehrschriSt Brkelmungssystem auf der Grundlage des Formelemente-Gedankens
zu entwickeln, das den Schriftverband einer Zeile ohne störungsanfällige vorherige
Segmentierung klassifiziert und das dabei Unterscheidungsfunktionen und Nummern
der ähnlichsten Klasse in jeder möglichen Position der Erkennungsschablone über
der Zeile abgibt, so daß daraus durch eine nachfolgende, dem Stand der Technik entsprechende
Segmentierun.gseinrichtung die richtige Zeichenfolge in der Zeile mit großer Sicherheit
ermittelt werden kann.
-
Erfindungsgemäß wird die Aufgabe durch ein Verfahren gelöst, bei dem
eine den Zeichenabmessungen entsprechende Erkennungsschablone, in der die entsprechenden
Formelemente-Detektoren justiert sind, in kleinen diskreten Schritten über den Schriftverband
einer Zeile geführt wird. Die Informationsübernahme aus der Schriftzeile erfolgt
durch eine spaltenweise gerasterte optisch-elektronische Abtastung, wobei die Grauwert
binär quantisiert werden. Die vertikale Grobposition der Schablone über
der
Zeile wird festgelegt durch vorherige Anwendung eines Standardverfahrens zur Bestimmung
der Grundlinie der Schriftzeile0 Da diese Messung einen vertikalen Versatz von Einzel
zeichen nicht berücksichtigen kann, ist zusätzlich eine vertikale Verschiebung der
Erkennungsschablone einschließlich der darin justierten Sounelemerte erforderlich,
wobei der Segmentierungseinrichtung nur das Maximum der Unterscheidungsfunktionen,
das in mindestens zwei Vertikalverschiebungen innerhalb einer festen Horizontalposition
erreicht wurde, zugeführt wird. Um mit dem Verfahren eine hohe Leistung bei mehreren
Schriftarten und den eingangs erwähnten Störungen zu erreichen, muß das Erkennungssystem
hochgradig nichtlinear sein. Diese Nichtlinearität wird hier problembezogen durch
Verwendung von Formelementen als Merkmale erreicht, deren Extraktionsstufe die vorletzte
Stufe im Mehrstufensystem darstellte Erfindungsgemäß kann ein und derselben Formelemente-Typ
bei der Zerlegung der Schriftzeichen in unterschiedlichen Positionen benutzt werden.
Es zeigt sich, daß zum Erzielt der notwendigen Leistungen die Formelemente-Detektoren
eine relativ komplizierte logisch-arithsetische Funktion innerhalb eines Gebietes
von etwa 100 bis 200 Rasterpunkten realisieren müssen. Der dazu notwendige Aufwand
verbietet es, solch komplizierte Detektoren in allen benötigten Portionen vorzusehen.
Das erfundene Verfahren des vollständigen Durchlaufs der Eingangsinformation und
der daraus transformierten Information verbunden mit der Klassifikation in mehreren
Positionen verlangt jedoch, daß dem Klassifikator Merkmale angeboten werden, die
außer dem richtigen Typ auch die richtige Position in der Erkennungsschablone besitzen.
Die extrahierten Merkmale müssen also, wenn sie nicht in jeder Schablonenposition
neu extrahiert werden sollen, ebenso
wie die Primärmerkmale in Schieberegistern
unter der Erkennungsschablone hinweg geschoben werden. Die Extraktion aller Formelemente
in einer einzigen Bezugssposition bzw. in einigen wenigen Positionen und ihre Speicherung
bis zu dem Zeitpunkt (auf Grund der kontinuierlich durchlaufenden Information werden
räumliche Beziehungen zwischen Formelementen in zeitliche transformiert) an dem
sie benötigt werden, bietet nun weiterhin den aufwandsreduzierenden Vorteil, daß
die Formelemente in gewisse Grundbausteine, die sogenannten Linienelemente zerlegt
werden können. Diese Linienelemente müssen nur einmal extrahiert werden und können
dairn in mehreren Formelemente-Detektoren verwendet werden, d.h. der technische
Aufwand reduziert sich wesentlicht Als Linienelemente existieren schwarze und weiße
Linienstücke verschiedener Länge und Grundri chtung, die bei linienförmigen Objekten
universell verwendbar sind.
-
Bei dieser Vorgehensweise sinkt der technische Aufwand für die Bormelemente-DeteXtoren
insgesamt wesentlich unter den für die zugehörigen Formelemente-Speicher, obwohl
diese aus folgendem Grunde wesentlich verkürzt werden könnens Im Interesse der erstrebten
Varianz des Verfahrens ist es nicht sinnvoll, die Bezugspunkte der Formelemente
innerhalb der Erkennungsschablone auf einem Rasterpunkt genau zu fixieren. Es werden
deshalb Punktgruppen von zwei Punkten Breite und fünf Punkten Höhe zu einer Formelemente-Position
disjunktiv zusammengefaßt, wobei auch die Nachbarpunkte der Punktgruppe berücksichtigt
werden. Auf diese Weise werden die Pormelemente-Speicher um den Faktor 10 verkürzt.
Die Folge davon ist, daß natürlich die Erkennungsschablone auch nicht mehr im Einerschritt
über den Schriftverband geschoben werden muß, sondern daß horizontal eine Schrittweite
von zwei und vertikal eine Schrittweite von fünf
Punkten notwendig
ist.
-
Weiterhin ist es unrentabel, alle Formelemente, auch die die in der
linken oberen Ecke des Zeichens benötigt werden, sofort beim Belaufen der Information
in der rechten unteren Ecke der Erkennungsschablone zu messen. Es erweist sich als
optimale Lösung, erst in der Position aller benotigten zu messen, die am weitesten
rechts liegt, und es nur für den Fall zu speichern, daß es weiter links von dieser
noch einmal benötigt wird. In vertikaler Richtung wird ebenfalls kein vollständiges
Speicherregister benötigt. Der zur Verfügung stehende Takt der Zeilengrundlinien
erlaubt es, die entsprechenden Formelemente-Detektoren nur in den in Frage kommenden
Relativpositionen durchzusteuern und entsprechend die Information in den Formelemente-Speichern
nur zu diesen Zeitpunkten weiterzuschieben. Die vertikale Ausdehnung der Speicherregister
muß also nur so groß sein wie die Summe aus zulässigem Vertikal versatz von Zeichen
in der Zeile und Ungenauigkeit der GrundlinienmessungO Das Netzwerk zur Extraktion
der Formelemente ist somit über die ganze Breite des unteren Teils der Erkennungsschablone
ausgedehnt, was bedeutet, daß ein gleicher Linienelement-Typ in relativ vielen Positionen
benötigt wird. (Bedingung für diese AnordnunG ist, daß die Information von unten
nach oben und von rechts nach links unten der Erkennungsschablone hinwegläuft.)
Zur optimalen technischen Lösung dieses Problems wird deshalb eine Kombination von
mehreren Linienelemente-Detektoren in verschiedenen Positionen und andererseits
von Lini enel ement e-Sp eichern, wenn diese Positionen dicht beieinanderliegen,
benutzt.
-
Die dritte Systemstufe realisiert einen linearen Klassifikator mit
der Besonderheit, daß nicht jeder Klassenschaltung der gleiche Merkmalvektor zugeführt
wird, sondern daß jede Klasse einen klassentypischen Merkmalvektor besitzt. Bei
der simultanen Klassifikation mehrerer Schriftarten besteht die liöglichkeit, für
jede Schriftart jeder Klasse eine gesonderte Klassenschaltung vorzusehen, wenn nur
wenige Formelemente unterschiedlich sind, können aber auch nur diese vor der gemeinsamen
Schaltung desjunktiv verknüpft werden. Wenn die Möglichkeit besteht, die zu lesende
Schriftart vorher zu bestimmen, kann die Erkennungssicherheit des Systems erhöht
werden indem nicht in Trage kommende Klassenschaltungen abgeschaltet werden.
-
Die Werte der Unterscheidungsfunktionen werden einer Extremwertschaltung
zugeführt, die das Maximum und die zugehörige Klasse über alle Klassen und alle
Vertikalverschiebungen bestimmt und diese Werte an die nachgeschaltete Segmentierunrseinrichtung
übergibt.
-
Das erfundene Verfahren und das Erkennungssystem besitzen gegenüber
herkömmlichen Formel ement e-Verfahren und deren Einrichtungen den Vorteil, daß
es in Zusammenschaltung mit einer dem technischen Stand entsprechenden Segmenti
erungs einrichtung unzentrierte Zeichen mit hoher Erkennungssicherheit verarbeiten
kann. Die Segmentierung muß nicht vor der Erkennung durch störanfällige Bückendetektoren
geschehen, sondern sie kann nach der Erkennung auf der Grundlage der ermittelten
Erkennungswerte in jeder Horizontalverschiebung erfolgen. Mit dem aufwandsoptimalem
Erkennungssystem können also in Verbindung mit
einer geeigneten
Segmentierungseinrichtung sich berührende Zeichen mit der gleichen Sicherheit klassifiziert
werden wie getrennte Binzelzeichen.
-
Die Erfindung soll nachstehend an einem Ausführungsbeispiel näher
erläutert werden. In den zugehörigen Zeichnungen zeigen: Fig. 1: Einrichtung zur
Erkennung von Schriftzeichen gemäß der Erfindung Fig. 2: Formelement "linke obere
Ecke" Fig. 3: Lagebezeichnungen der Formelemente, die einen Repräsentanten der Klasse
nun bilden Fig. 4: Zusammenschaltung von Linienelement-Detektor; Linienelement-Speicher;
Formelement-Detektor Fig. 5: Zeichenfeld und reduziertes Zeichenfeld Fig. 6: Schaltung
zur Horizontal- und Vertikaltransformation der Formelemente Fig. 7: Modifikation
der horizontalen Reduktionstufe
Wie aus BaigO 1 zu erkennen ist,
weist das ein Eigangsschieberegister 10 einen gestrichelt gezeichneten Schieberegisterausschnitt
11 auf. Die gesamte binär quantisierte Helligkeitsinformation des Repräsentanten
läuft kontinuierlich unter dem Schieberegisterausschnitt 11 durch.
-
Jedem Rasterpunkt RP des Zeichenfeldes wird der Helligkeitswert xji#{0,1}
mit i = 1,2, ..., N und j = zugeordnet, je nachdem ob das Zeichen an dieser Stelle
weiß (Helligkeitswert "0") oder schwarz (Helligkeitswert t'1") ist.
-
Die aus den Helligkeitswerten des angebotenen binär quantisierten
Zeichens abgeleiteten binären elektrischen Signale werden seriell einem mit der
Takt folge T1 getriggerten Eingangschieberegister 10 zugeführt, des die technische
Nachbildung des Zeichenfeldes darstellt. Jedem Rasterpunkt RP des Zeichenfeldes
entspricht eine gleichliegende Speicherstelle des Eingangsschieberegisters 10.
-
An den Schieberegisterausschnitt 11 sind logische Netzwerke zur Extraktion
der Menge der Linienelemente LE, sog. lIinienelement-Detektoren 21 bis 25 angeschaltet.
-
Aus Teilmengen der Linienelemente-Menge werden Formelemenete FE gebildet.
Die Linienelemente LE, die ein Formelement FE bilden, stehen in einer festen Lagebeziehung
zueinander.
-
In Fig. 2 wird als Beispiel das Formelement PE "linke obere Ecke"
dargestellt. Es setzt sich aus dem waagerechten LEb und den sekrechten LEa, LEc;
schwarzen LEa, LEb und weiBen LEc Linienelementen LE zusammen, deren Bezugspunkte
BP, wie aus Fig. 2 ersichtlich, die Lage dieser Linienelemente BE im Formelement
FE fixieren.
-
Innerhalb eines Zeichens wird ein Linienelement LE i.a.
-
an verschiedenen Positionen, verschiedene Linienelemente LE; werden
innerhalb eines Zeichens i. a. in unterschiedlich vielen Positionen gemessen.
-
Je nach Kompliziertheit der Erkennungsaufgabe werden 20 bis 35 verschiedene
Linienelemente LE definiert. Jedes Linienelement ISE wird innerhalb eines Zeichens
in allen Spalten, in denen es gemessen wird, gebildet.
-
Wird z. B. ein Linienelement LE innerhalb eines Zeichens in fünf Spalten
gemessen, dann wird für jede der fünf Spalten ein Linienelement-Detektor 21 zur
Extraktion dieses Linienelementes LE vorgesehen.
-
Tritt ein Linienelement BE innerhalb einer Rasterspalte in mehr als
einer Position auf, dann wird es in der von der Unterkante des Zeichenfeldes ZF
ausgerechneten untersten benötigten Positionen der Spalte gebildet und für die übrigen
benötigten Vertikalpositionen dieser Spalte in einem Linienelement-Speicher 31 bis
35 gespeichert.
-
Mit der untersten Spaltenposition, in der ein Linienelement LE innerhalb
einer Spalte über der Menge der Formelmente FE gemessen wird, liegt somit der Speicherbereich
des Schieberregisterausschnittes 11 fest, an den der dem Linienelement LE entsprechende
Linienelement-Detektor 21 bis 25 anzuschaiten ist. Wie aus Fig. 1 ersichtlich, ist
jedem Linienelement-Detektor 21 bis 25 ein Linienelement-Speicher 31 bis 35 nachgeschaltet,
dessen Taktfolgefrequenz wie beim Eingangsschieberegister 10 f1 = 1 beträgt.
-
T1 In Fig. 3 wird das Formelement FEx aus den zwei Linienelementen
LEa und LEb zusammengesetzt. Die Linienelemente LEa und LEb werden in den Positionen
P1LEa und P1LEb gebildet, d. h. ihre Linienelement-Detektoren 21; 23 sind an die
entsprechenden Speicherbereiche des Schieberegisterausschnittes 11 anzuschalten.
-
Werden die Linienelemente LE a bzw, LEb in weiteren Vertikalpositionen
der gleichen Horizontalposition benötigt, dann erfolgt ihre Speicherung in den Linienelement-Speichern
31. bzw. 33.
-
Die Bildung der Formelemente FE erfolgt in kombinatorischen binären
Netzwerken, den Formelement-Detektoren, die in Fig. 1 mit 41 bis 45 gekennzeichnet
sind. Die Singangssignale eines Formelement-Detektors 41 bis 45 werden aus den zugeordneten
Linienelement-Detektoren 21 bis 25 bzw. den diesen nachgeschalteten Linienelement-Speichern
31 bis 35 abgefragt, Für das in Fig. 3 dargestellte Formelement FEx zeigt Fig. 4
die Zusammenschaltung von Linienelement-Detektor 21, Linienelement-Speicher 31 und
Linienelement-Detektor 23, Linienelement-Speicher 33 mit dem Formelement-Detektor
41, in dem die Verknüpfung der Linienelemente LEa und LEb zum Formelement FEX erfolgt.
-
Das Formelement SEx kann also erstmalig gebildet werden, wenn das
Linienelement LEa in der Position P1LEa und das Linienelement LEb in der Position
P1LEb zur Verfügung stehen. Die diesen Positionen zugeordneten und mit dem Formelement-Detektor
41 verschalteten Speicherstellen sind in Fig. 4 mit P1 gekennzeichnet. Dabei wird
angenommen, daß das Formelement FEx in keiner weiter rechts liegenden Horizontalposition
benötigt wird.
-
Auf die Menge der zu erkennenden Zeichen wird eine bestimmte Menge
von Formelementen FE definiert. Weiterhin wird jede Zeichenklasse nur durch eine
echte Teilmenge von gleichen und/oder verschiedenen Formelementen FE in verschiedenen
Positionen beschrieben. Diese Beschreibung wird als Prototyp bezeichnet. Ein Formelement
FE kann in mehreren Prototypen auftreten.
-
Innerhalb eines Prototyps stehen die Pormelemente BE in einer festen
Lagebeziehung zueinander.
-
Wie oben erwähnt, wird jedes Pormelement FE in der am weitesten rechts
liegenden Horizontalposition seines Auftretens, bezogen auf die Menge alle Zeichen,
extrahiert. In Fig. 3 wird das Formelement PBx in der Position P1 FEx gemessen.
Tatsächlich wird das Formelement FEx innerhalb des Zeichens "H" in den Positionen
P2 PBx benötigt. Dabei wird das Formelement FEx in der Position P1 FEx gebildet
und in einem Speicherregister 512 (Taktfolge T1, s. Fig. 6) gespeichert. Mit Hilfe
dieses Speicherregisters 512 erfolgt die Vertikalverschiebung des Formelementes
FEx in die Position P2 FEx (und evtl.
-
weiterer Vertikalpositionen dieser Horizontalposition).
-
Eine weitere horizontale Verschiebung innerhalb des Speicherregisters
512 transformiert das Pormelement RZx von der Position P2 FEx in die Position P3
FEx.
-
Die Abfrage der PE-Information aus dem Speicherregister 512 muß wieder
so erfolgen, daß bei der Zusammensetzung der Zeichen aus den extrahierten Pormelementen
FE die richtige Lagebeziehung der Formelemente FE innerhalb des Zeichens erhalten
bleibt.
-
Für das Verfahren gemäß der Erfindung ist es nicht notwendig, die
Lage der Formelemente FE auf den Rasterpunkt genau zu positionieren. Vielmehr genügt
es, die Positionen in horizontaler Richtung auf 2 Rasterpunkte und in vertikaler
Richtung auf 5 Rasterpunkte genau anzugeben.
-
Daraus folgt, daß das Zeichenfeld ZF mit 50 Zeilen und 24 Spalten
auf ein reduziertes Zeichenfeld ZFR mit 10 Zeilen und 12 Spalten abgebildet wird.
Alle weiteren Betrachtungen zur Erfindung beziehen sich, soweit nichts anderes vereinbart
wird, auf das reduzierte Zeichenfeld ZFR.
-
Fig. 5.1. zeigt einen Ausschnitt des ursprünglichen Zeichenfeldes
ZF, Fig. 5.2. zeigt das reduzierte Zeichenfeld ZFR. Der stark umrandete Zeichenfeldbereich
aus Fig. 5.1. wird gemäß obiger Darlegung auf den Rasterpunkt RPR in Fig. 5.2. abgebildet.
-
Fig. 6 zeigt die Schaltung, mit der u. a. die Zusammenfassung der
Information der Rasterpunkte RP des Zeichenfeldes ZF in vertikaler und horizontaler
Richtung zum Rasterpunkt RPR des reduzierten Zeichenfeldes ZFR erfolgt.
-
Dazu werden in eine eertikalen Reduktionsstufe 511, in der ein Speicherregister
512, eine ODER-Schaltung 513 und eine UND-Schaltung 514 hintereinander geschaltet
sind, eine Taktleitung 71 mit dem Speicherregister 512 und eine Taktleitung 72 mit
der UND-Schaltung 514 verbunden sind, zunächst die Informationen von fünf aufeinanderfolgenden
Rasterpunkten in vertikaler Richtung einer Spalteeinschließlich die der beiden (wahlweise
auch mehr) benachbarten Rasterpunkte Serien-parallel gewandelt und disjunktiv verknüpft.
Mit dem Speicherflipflop 518 in der horizontalen Reduktionsstufe 515 erfolgt dann
neben der Speicherung der PE-Information die Zusammenfassung der Spalteninformation
in horizontaler Richtung.
-
Am Beispiel des in Fig. 3 dargestellten Repräsentanten des Zeichens
H soll die Transformation des Formelementes FEx aus der Position P1FEx, in der das
Pormelement FEx extrahiert wird, in die Position P2FEX, und P3FEx, in denen das
Pormelement FEx zur Bildung der Klasse, der der Repräsentant II angehört, benötigt
wird, erläutert werden.
-
Analoge Betrachtungen gelten für alle anderen Formelemente FEx in
beliebigen Positionen.
-
Gemäß der Erfindung zeigt Fig. 6 in der Horizontalen Reduktionsstufe
515 ein Register 516, das als Umlaufregister arbeitet, und all das die Taktleitung
72 angeschlossen ist, synchron mit der Abtastung der Rasterpunkte RPRj,1 (j = 1,2...,
12 vlg. Fig. 5.2) läuft im Register 516 am Eingang 517 die Information "L" ein und
wird mit dem Takt T2 = 5 . T1 durch das Register 516 geschoben. Dieses Register
516 kann als technische Nachbildung einer Rasterspalte des reduzierten Zeichenfeldes
ZFR aufgefaßt werden, d.h. die Zahl seiner Speicherstellen entspricht der Anzahl
der Rasterpunkte einer Spalte des Zeichenfeldes ZER. Das Register 516 wird genau
an den Stellen angezapft, die die Vertikalpositionen Z8-präsentieren, in denen die
Formelemente FE im Zeichen vorkommen.
-
Gemäß Fig. 3 wird das Formelement FEx in der Vertikalposition P2 FEx
benötigt, also ist das Register 516 gemäß Fig. 6 in der 6. Registerstelle anzuzapfen.
Kommt es zur Koinzidenz der Formelement-Information Ph mit der umlaufenden Information
"L" im Register 516, so wird die Formelement-Information REg in den Speicherflipflop
518 übernommen, der der vertikalen Reduktionsstufe 511 und dem Register 516 nachgeschaltet
ist.
-
Vom Speicherflipflop 518, der, wie oben bereits ausgeführt, die disjunktive
Verknüpfung der Informationen zweier Spalten realisiert, wird die Formelement-Information
FEx mit dem Takt T3 = 100 . T1 in das nachgeschaltete Speicherregister 519 übernommen.
Dort kann sie an der mit P2 FEx bezeichneten Registerstelle für die Klassenbildung
abgefragt werden.
-
Da wie aus Fig. 3 ersichtlich, das Formelement FEx auch noch in der
Position P3 FEx benötigt wird, wobei die Positionen P2 FEx und P3 FEx in der gleichen
Zeile liegen, erfolgt seine Speicherung im Speicherregister und wird an der mit
P3 FEx bezeichneten Registerstellte für die Klassenbildung abgefragt.
-
Würde das Formelement FEx, gezählt über alle Klassen, in weiteren
Vetikalpositionen gebraucht werden, müßten für das Formelement FE@ weitere Speicherflipflop
518 und Speicherregister 519 vorgesehen werden. Alle Speicherregister 519 liegen
an einer Taktleitung 73 mit dem Takt 23 = 100 . T1 (vgl. Fig1), Bei der Erkennung
realer Zeichen im Schriftverband kann es vorkommen, daß Zeichen gegeneinander in
der Höhe versetzt sind. Das führt dazu, daß die Ist-Vertikalpositionen der Formelemente
des versetzten Zeichens gegenüber den Soll-Positionen nach oben und unten verschoben
sind.
-
Um dieses Vertikalversatz auszugleichen, werden nicht nur die Soll-Positionen
der Formelemente abgefragt, sondern auch die jeweils nächsten beiden Nachbarpositionen.
-
Fig. 7 illustriert diesen Tatbestand an dem in Fig. 6 dargestellten
Beispiel. Für das Formelement SEx sind jetzt fünf Speicherflipflop 518 und fünf
Speicherregister 519 vorzusehen, deren jedes eine der fünf genannten Vertikalpositionen
realisiert, wobei die Position der mittleren Zeile des Registers 516 der Sollposition
zuzuordnen ist. Wie aus Fig. 7 ersichtlich, stehen die den fünf Vertikalpositionen
zuzuordnenden Informationen parallel, d. h. gleichzeitig an den fünf Registerzeilen
des Speicherregisters 519 zur Verfügung. Für die weitere Verarbeitung wandelt ein
Parallel-Serien-Wandler 520 der den Speicherregistern 519 nachgeschaltet ist und
mit einer Taktleitung 74 verbunden ist in Fig. 7 die fünf parallel bereitstehenden
Formelement-Informationen FE in eine x serielle Informationsfolge mit der Pulsfolgefrequenz
4 = 1 = 1 = f1 um. Diese Informationsfolge wird T4 20T1 20 einer Klassifizierungsschaltung
6o zugeführt (s. Fig. 1).
-
In einer bekannten Klassifizierschaltung 60 (z.B analoge und digitale
Klassifizierschaltung) werden aus den Formelementen FE Prototypen der Klassen gebildet.
Jeder Prototyp bildet eine Kombination der Elemente der Formelementemenge, Die zu
erkennenden realen Zeichen werden mit diesen Prototypen verglichen, Als Ergebnis
dieses Vergleichs entsteht ein Erkennungswert E, dessen Größe ein Iiiaß für die
Übereinstimmung zwischen Prototyp und realem Zeichen ist. Liegen alle Erkennungswerte
unterhalb einer bestimmten Schwelle oder sind zwei oder mehr Erkennungswerte gleich,
dann kann das angebotene Zeichen keiner Klasse eindeutig zugeordnet werden. Eine
Rückweisungsschaltung 67 liefert dann ein Rückweisungssignal R.
-
Liefert die Klassifiziersohaltung 60 einen Erkennungswert, der aus
der Menge aller Erkennungswerte (über alle Klassen) eindeutig als maximaler Erkennungswert
Emax einer Extremwertschaltung 66 separiert werden konnte, dann erscheint an ihrem
Ausgang neben diesen Erkennungswert Emax eine der Klasse zuzuordnende in einer A/D-Wandlerstufe
erzeugte Binärkombination (Klassenwort).
-
Erkennungswort und Klassenwort werden einer nachfolgenden Segmentierungseinrichtung
zugeführt.
-
Sämtliche in der Einrichtung gemäß der Erfindung benötigten Takte
werden von einer Takteinheit 70 über die Taktleitungen 71, 72, 73, 74 (siehe Fig.
1) bereitgestellt.