DE2822458C2 - Einrichtung zum Erkennen von Schriftzeichen - Google Patents
Einrichtung zum Erkennen von SchriftzeichenInfo
- Publication number
- DE2822458C2 DE2822458C2 DE2822458A DE2822458A DE2822458C2 DE 2822458 C2 DE2822458 C2 DE 2822458C2 DE 2822458 A DE2822458 A DE 2822458A DE 2822458 A DE2822458 A DE 2822458A DE 2822458 C2 DE2822458 C2 DE 2822458C2
- Authority
- DE
- Germany
- Prior art keywords
- character
- line
- memory
- bits
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18076—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
Die Erfindung betrifft eine Einrichtung zum Erkennen von Schriftzeichen anhand von vorbestimmten
Formenelementen.
Eine solche Einrichtung ist zum Beispiel aus der DE-AS 19 49 428 bekannt. Ein Zeichen wird zunächst
ganz gelesen und kodiert, In einem ersten Klassifizierungsschritt zum Erkennen des Zeichens werden
einfache Grundstrukturen untersucht. Aus zusammenhängenden Elementarmerkmalen werden Merkmale
gebildet und zwischengespeichert, deren mögliche Bedeutungen ermittelt und in einem Bewertungsspeicher gespeichert werden. Dadurch erfolgt eine
Auslese möglicher Zeichen. Anhand dieser Auslese wird von neuem kodifiziert und nun nach feineren
Strukturmerkmalen klassifiziert. Dadurch wird der Bereich möglicher Zeichen weiter eingeengt. Bei einem
Ausführungsbeispiel werden jeweils drei Kodienings- und Klassifiziecungsprozesse durchgeführt.
Eine derartige Einrichtung benötigt einen sehr großen
Speicher, da zunächst die gesainte Bildinformation gelesen und gespeichert wird. Dadurch wird die Einrichtung
groß, teuer, und sie arbeitet aur langsam. Diese Nachteile werden um so gravierendei, je mehr
Zeilen zum Aufnehmen der untersuchten Bildelemente verwendet werden.
Aus der DE-OS 26 33 513 ist eine weitere Einrichtung
zum Erkennen von Schriftzeichen bekannt, die demgegenüber bereits verbessert ist. Stimmen nämlich
die Inhalte aufeinanderfolgender Zeilen überein, so eliminiert eine Kompressionslqgik-Schaltungseinheit
diese Redundanzen, die durch Überlappung der Teilzonen oder die Wiederholungen desselben Zustandes
bedingt sind, so daß schließlich das Erkennen des gelesenen Zeichens aus der gespeicherten Bildinformation
in der Re0Cl nicht aus der Gesamtzahl der ^lesenen
Bildelemente, sondern aus einer verringerten Anzahl erfolgt.
Liegt jedoch ein kompliziertes Zeichen oder eine verschnörkelte Handschrift vor. so werden nur für
wenige Zeilen die Bildinhalte übereinstimmen, so daß sich kaum eine Verringerung der gelesenen Bildinformation
erzielen läßt. Auch in diesem Fall ist daher ein Speicher für die gelesenen Bildelemente vorzusehen.
dessen Kapazität ausreicht, die Information für praktisch alle möglichen Bildelemente zu speichern. Es
wird also weiterhin ein großer Speicher benötigt, jedoch wird der Erkennungsvorgang in der Regel
schneller ablaufen, da in der Regel eine Verringerung der auszuwertenden Bildelemente durch die Kompressionslogik-Schaltungseinheit
erfolgt.
Aus der DE-AS 15 49 930 ist eine gattungsgemäße Einrichtung bekannt, von der die vorliegende Erfindung
ausgeht. Ein ein S<"hrifti.:ichen aufweisendes
Bildfeld wird zeilenweise abgetastet. Das Abtastungsergebnis wird digitalisiert in einer Bildmatrix gespeichert
und zonenweise auf das Vorliegen vorbestimmter zweizeiliger Formenelemente untersucht. Abhängig
von den Änderungen solcher zweizeiliger Formenelemente in benachbarten Zonen werden zusätzlich
Übergangsanweisungen erzeugt. Schließlich liegt für jede Zone eine Information über die enthaltenen Formenelemente
und, anhand der Übergangsanweisungen, eine Information über deren zonenweisen Zusammenhang
vor. Mit einer Merkmal-Extraktionsschaltung wird schließlich die bei der zonenweisen
Untersuchung ermittelte Folge von Formenelementen mit Hilfe eines als Nachschlagetabelle dienenden
Speichers ausgewertet. Hier sind also nicht mehr so viele Speicherplätze erforderlich, wie Bildelemente
vorhanden sind, sondern nur noch eine den zweizeiligen Zonen entsprechende Anzahl von Speicherplätzen,
in denen die_ Information über die Formenelemente und die Übergangsanweisung zu speichern
ist.
Der Erfindung liegt die Aufgabe zugrunde, eine Einrichtung der in der DE-AS 15 49 930 genannten
Art so auszubilden, daß sich der erforderliche Speicherbedarf weiter verringern läßt und sich die Auswertzeit
bis zum Erkennen eines Schriftzeichens weiter verringern läßt.
Die erfindungsgemüDe Lösung dieser Aufgabe ist
im Hauptanspruch kurz zusammengefaßt wiedergege-
ben. Die erfindungsgemäße Einrichtung zeichnet sich dadurch aus, daß verschiedene Merkmalsdetektoren
vorliegen, die für das Erkennen ganz bestimmter Zeichenmerkmale zuständig sind, z. B. für die Anzahl geschlossener
Schleifen oder die Form der oberen, rechten, unteren oder Unken Kante eines Zeichens. Anhand
zweizeiliger Fonnenelernente und anhand von Übergangsanweisungen wird Zone für Zone der Inhalt
in jedem dieser Speicher verändert, so daß in jedem der Speicher nach Abschluß der zeilenweisen Abtastung
gespeichert ist, ob die zu überwachenden Formenelemente vorliegen oder nicht Wird zum Beispiel
eine „8" gelesen, so stelli der Merlanalsdetektor, der für die Feststellung geschlossener Schleifen zuständig
ist, fest, daß zwei geschlossene Schleifen vorliegen. Nach Abschluß der Abtastung gibt also jeder Merkmalsdetektor
ein Signal ab, das angibt, ob eine bestimmte, von ihm zu überwachende Form vorliegt
und gegebenenfalls wie oft die zu überwachende Form aufgetreten ist.
Bei einer erfindungsgemäßen Einrichtung werden also im Vergleich zum Stand der Technik nur sehr wenige
Daten gespeichert. Für einfache Zeichen reicht die Verwendung von fünf Merkmalsdetektoren aus,
wie sie in Anspruch 2 angegeben sind. Für kompliziertere Zeichen reicht es aus, sieben Merkmalsdetektoren
der in Patentanspruch 3 gekennzeichneten Art zu verwenden.
Die Erfindung und vorteilhafte Einzelheiten werden nachfolgend unter Bezug auf die Zeichnung in
beispielsweisen Ausführungsformen näher erläutert. Es zeigt
F i g. 1 ein Zuordnungsdiagramm zur Erläuterung, wie ein Zeichenmuster in Schlitzsegmente gemäß der
Erfindung aufgegliedert wird;
F i g. 2 bis 9 Diagramme zur Definition und Verdeutlichung der zu extrahierenden und zu erkennenden
Merkmale eines Zeichenmusters;
Fig. 10 das symbolische Blockdiagramm für das Grundschema eines OCR-Geräts gemäß der Erfindung;
Fig. 11 erläutert Übergangsbefehle und Übergangsbedingungen;
Fig. 12 verdeutlicht das Auslesen eines Zeichenmusters
gemäß einer bevorzugten Ausfuhrungsform der Erfindung;
Fig. 13 veranschaulicht eine bestimmte Bedingung
bei dem Zeichenerkennungsbeispiel der Fig. 12;
Fig. 14(A) bis 14(C) veideutlichen die Beziehung
zwischen den von den Merkmalabtastsystemen und einem bestimmten Zeichenmuster abgeleiteten Übergangsbefehlen;
Fig. 15 bis 19 verdeutlichen die Übergangsbedingungen
für die Inhalte des Merkmalabtastsystems, ausgelöst durch die Übergangsbefehle, wobei F i g. 15
ein Übergangsschaubild für die zu erfassende Anzahl von geschlossenen Schleifen in einem zu erkennenden
Zeichenmuster, Fig. 16 ein Übergangsschaubild hinsichtlich
des unteren Kantenbereichs eines Zeichenmusters, Fig. 17ein Übergangsschaubild hinsichtlich
des oberen Kantenbereichs eines ZeichenmusterSi Fig. 18 ein Übergangsschaubild hinsichtlich der Anzahl
von Löchern oder Unterbrechungen am linken Kantenbereich eines Zeichenmusters und Fig. 19 das
Übergangsschaubild hinsichtlich der Anzahl von Löehern oder Unterbrechungen am rechten Kant.enbereich
eines Zeichenmusters verdeutlichen;
Fie. 20 das Blockschaltbild einer bevorzugten Ausführungsform eines optischen Lesegeräts gemäß
der Erfindung;
Fig. 21 das detailliertere Blockschaltbild eines wesentlichen Teils der Gerätsausführung nach
F ig. 20;
Fig. 22 ein Blockschaltbild zur Verdeutlichung einer
Speicheraufteilung;
Fig. 23 und 24 Schaltungen eines Koordinatendetektors;
Fig. 25 das detaillierte Schaltbild eines Code-Umsetzers
bei der Ausführung nachFig. 21;
Fig. 26(A) und 26(B) die Zuordnung zwischen Codes, die Merkmalen eines Zeichenmusters entsprechen
und den Übergangsbefehlen;
Fig. 27 Signal verlaufe in den Schaltungen nach
Fig. 20 bis Fig. 25;
Fig. 28 das Schaltbild für ein Beispiel einer Tabellenbezugsschaltung;
F i g. 29 ein Beispiel einer Nachschlagetabelle mit verschiedenen Zeichen und den diesen jeweils zugeordneten
Merkmalen;
Fig. 30 und 31 Code-Tabellen für die jeweiligen Merkmale;
Fig. 32 bis 35 Erläuterungsschaubilder zur Erläuterung,
wie kleinere individuell bedingte Abweichungen eines Zeichenmusters gemäß der Erfindung erkennbar
sind;
Fig. 36 das Blockschaltbild einer anderen bevorzugten
Ausführungsform der Erfindung;
F i g. 37 bis 40 einige Beispiele für Merkmale eines Zeichenmusters und den jeweiligen Ausgangscode;
F i g. 41 das Beispiel einer Tabellenbezugsschaltung und eines Merkmaldetektors gemäß einer anderen bevorzugten
Ausführungsform;
F i g. 42 das Beispiel einer Nachschlagtabclle nach einer anderen bevorzugten Durchführungsform;
F i g. 43 erläutert formale Unterscheidungsmerkmale bei der Erkennung der Ziffern „9" und „6";
Fig. 44 verdeutlicht ein Beispiel, wie sich dl· Bedingungen
bei der Erkennung von beispielsweise handgeschriebenen Zeichnungen ändern können;
F i 6.45 ein Beispiel für einen Prozessor zur Entdeckung
von seitlichen Segmenten und
Fig. 46(A) bis 46(D) Diagramme zur Erläuterung der Arbeitsweise der Schaltung nach F i g. 45.
Bevor auf das Gesamtsystem in Einzelneren eingegangen
wird, erschunt es als zweckmäßig, das Prinzip der Erfindung zu erläutern, und zwar am Beispiel der
Erkennung einer etwa handgeschriebenen Ziffer „2".
Ein gedrucktes oder auf einer Vorlage geschriebenes Zeichenmuster läßt sich mittels eines optischen
Systems in bekannter Weise abtasten und über eine photof 'cktrische Schaltung in elektrische Signale umsetzen.
Diese Signale werden dann nach vorhergehender Formung und Verarbeitung beispielsweise zur
Verminderung von Rauschanteilen in einem Systemspeicher gespeichert. Ein Speicherbereich eines solchen
Speichersys'.ems ist in Fig. 1 mit Q bezeichnet; er ist in der Lage, die Information eines vollständigen
ZeiGhenberekhs zu speiehern, Im vorliegenden Beispiel kann der Speicherbereich für einen voller· Zeichenbereich
24 Bit in der Breite und 32 &it in Längsrichtung umfassen. Jede der32 Horizontalzeilen ergibt
also eine Informationslänge oder Kapazität von 24 Bit, woraus sich die Kapazität des vollständigen Zeichenbereichs
leicht ableiten läßt.
Das Muster „2" werde beispielsweise in Horizontal-
richtung unterteilt und die jeweiligen Schlitzsegmente des Musters werden für die zugeordnete Speicherzeile
gespeichert. Alle Merkmale eines zu erkennenden Zeichenmusters werden gruppiert und wie nachfolgend
erläutert definiert oder sortiert:
Erste Gruppe:
I. Feststellung der Anzahl der geschlossenen Schleifen;
II. Feststellung der Form des unteren Kantenbereichs;
ΙΠ. Feststellung der Form des oberen Kantenbereichs
und
IV. Feststellung der Verbindung mit einer Seitenlinie.
Zweite Gruppe:
V. Feststellung der Anzahl von Löchern oder Aushöhlungen im linken Kantenbereich;
VI. Feststellung der Anzahl von Löchern oder Aushöhlungen im rechten Kantenbereich und
VII. Feststellung von »Buckeln« oder anschwellenden Abschnitten im rechten Kantenbereich.
Der Ausdruck »Seitenlinie« oder »seitliche Linie« bezeichnet jenen Abschnitt eines Zeichens, der in Horizontalrichtung
mindestens einige Bit lang ist, und entsprechend werden auch nur »Buckel« berücksichtigt,
die mehr als einige Bit hoch sind.
Die Beschreibung der einzelnen Erkennungsstufen:
I. Die Anzahl der geschlossenen Schleifen:
Bei dieser ersten Bestimmung wird zunächst die Anzahl von kreisringförmigen Schleifen festgestellt,
beispielsweise bei einer Ziffer »8«. Soweit das zu erkennende Muster eine Ziffer oder ein Buchstabe ist,
läßt sich die Anzahl der Schleifen wie nachfolgend unter Bezug auf F i g. 2 klassifizieren:
(0): keine Schleife;
(0): keine Schleife;
(1): Anzahl der Schleifen ist 1 und der durch die Schleife umgrenzte Raum ist mindestens 1 Bit
oder mehr breit bzw. hoch;
(2): die Anzahl der Schleifen beträgt 2. Es liegt im gegebenen Beispiel eine »Taille« mit einer Breite
von 7 Bit oder weniger vor und der Raum oder Abstand im Inneren der jeweiligen Schleifen beträgt
1 Bit oder mehr. Dazu alternativ kann auch der Fall vorliegen, daß keine »Taille« vorhanden
ist. während der obere Raum im Inneren der Schleife 1 Bit oder mehr im unteren Bereich
2 Bit oder mehr breit ist.
Hinsichtlich ^er Bewertung der so überprüften Schleifen sei bemerkt, daß hier zunächst nur solche berücksichtigt werden, die nach einer vorhergehenden Verarbeitung einen Innenraum von einem oder mehr Bit aufweisen. Für den Fall, daß zwei Schleifen ohne dazwischenliegende Taille festgestellt werden (vgl. das Beispiel der F i g. 3), lassen sich Zeichen wie die Ziffer »8« sicher dadurch erkennen, daß hinsichtlich der oberen Schleife die Einschränkung auf eine Größe von 2 oder mehr Bit festgelegt wird. Jene Zeichen, die den obigen Bedingungen nicht genügen, jene mit beispielsweise 3 Schleifen oder jene Zeichen die keine Verbindung zwischen ihren beiden Hauptteilen aufweisen, lassen sich in andere Kategorien einsortieren.
Hinsichtlich ^er Bewertung der so überprüften Schleifen sei bemerkt, daß hier zunächst nur solche berücksichtigt werden, die nach einer vorhergehenden Verarbeitung einen Innenraum von einem oder mehr Bit aufweisen. Für den Fall, daß zwei Schleifen ohne dazwischenliegende Taille festgestellt werden (vgl. das Beispiel der F i g. 3), lassen sich Zeichen wie die Ziffer »8« sicher dadurch erkennen, daß hinsichtlich der oberen Schleife die Einschränkung auf eine Größe von 2 oder mehr Bit festgelegt wird. Jene Zeichen, die den obigen Bedingungen nicht genügen, jene mit beispielsweise 3 Schleifen oder jene Zeichen die keine Verbindung zwischen ihren beiden Hauptteilen aufweisen, lassen sich in andere Kategorien einsortieren.
II. Form des unteren Kantenabschnitts:
Dieser Bereich läßt sich klassifizieren durch Länge und Anzahl von Linien, welche vom unteren Kantenbereich
ausgehen, (vgl. F i g. 4):
(0): kein Buckel am unteren Kantenbereich.
(1): die Länge des Buckels überschreitet einen gegebenen Wert, und
(1): die Länge des Buckels überschreitet einen gegebenen Wert, und
(2): es gibt zwei oder mehr Buckel.
Die Länge von Zeilen mit abgeschnittenem Spitzenabschnitt läßt sich nach vorstehender Maßnahme bewerten, weil alle Teilchenmustcr mit gleicher Länge zwei Zugehöngkeitsmöglichkeiten haben, nämlich Unterklasse (0) oder (1), oder Unterklasse (2). Zei-Ki chenmuster mit zwei Buckeln von mehr als 6 Bit Länge sollten in Unterklasse (2) eingeordnet werden.
Die Länge von Zeilen mit abgeschnittenem Spitzenabschnitt läßt sich nach vorstehender Maßnahme bewerten, weil alle Teilchenmustcr mit gleicher Länge zwei Zugehöngkeitsmöglichkeiten haben, nämlich Unterklasse (0) oder (1), oder Unterklasse (2). Zei-Ki chenmuster mit zwei Buckeln von mehr als 6 Bit Länge sollten in Unterklasse (2) eingeordnet werden.
III. Form des oberen Kantenbereichs:
Die Sortierung dieser Kategorie ist abhängig von der Länge und Anzahl von Linien, die vom oberen
Kantenbereich ausgehen, und von der Gestalt der obersten Horizontallinie, siehe Fig 5:
(0): kein Buckel, und die horizontale Länge beträgt
beispielsweise 8 Bit oder weniger;
:o (1): es gibt einen orientierten Bxickel. der eine gegebene Höhe von beispielsweise 2 Bit oder weniger unterschreitet, und die horizontale Linie ist kurzer als 8 Bit;
:o (1): es gibt einen orientierten Bxickel. der eine gegebene Höhe von beispielsweise 2 Bit oder weniger unterschreitet, und die horizontale Linie ist kurzer als 8 Bit;
(2): es gibt einen oberen gcricnteUn Buckel, dessen
Höhe größer als ein gegebener Wert von beispielsweise 3 Bit oder mehr ist, und die Horizontallinie
ist beispielsweise kürzer als 8 Bit;
(3): es gibt zwei Buckel am oberen Kantenbereich und die Horizontallänge ist beispielsweise kürzer als 8 Bit;
(3): es gibt zwei Buckel am oberen Kantenbereich und die Horizontallänge ist beispielsweise kürzer als 8 Bit;
(4): es gibt keinen gerichteten oberen Buckel, während die Horizontallinie beispielsweise langer
als 8 Bit ist; außerdem befindet sich am linken Rand ein hängender Abschnitt;
(5): es gibt keinen gerichteten Buckel aber einen
(5): es gibt keinen gerichteten Buckel aber einen
hängenden Abschnitt am rechten Rand.
Der benutzte Ausdruck »Linieniängc« in der oberen Aufzählung versteht sich ausschließlich als Spitzen- und Fußabschnitt. Wenn beispielsweise ein Zeichenmuster einer in Unterklasse (2) gehörige Form und eine in Unterklasse (4) gehörige Horizontallinie über der erstgenannten Form besitzt, dann wird der oberen Kontur in Unterklasse (4) Priorität gegeben. Nur in dem Falle, wo zwei Buckel länger als 4 Bit sind, von denen einer länger als die in Unterklasse (2) gehörige Kontur ist, wird der unteren Kontur Priorität gegeben, nämlich der Unterklasse (3).
Der benutzte Ausdruck »Linieniängc« in der oberen Aufzählung versteht sich ausschließlich als Spitzen- und Fußabschnitt. Wenn beispielsweise ein Zeichenmuster einer in Unterklasse (2) gehörige Form und eine in Unterklasse (4) gehörige Horizontallinie über der erstgenannten Form besitzt, dann wird der oberen Kontur in Unterklasse (4) Priorität gegeben. Nur in dem Falle, wo zwei Buckel länger als 4 Bit sind, von denen einer länger als die in Unterklasse (2) gehörige Kontur ist, wird der unteren Kontur Priorität gegeben, nämlich der Unterklasse (3).
IV. Verbindung mit Seitenlinie:
Diese Möglichkeit wird nachstehend klassifiziert nach der Anzahl η von Seitenlinien und ob die '"streffende
Seitenlinie nach links oder rechts verbunden ist, wie in Fig. 9:
(0): η = 0, keine Verbindung;
(1): η = 1, keine Verbindung;
(1): η = 1, keine Verbindung;
(2): η = I und eine Verbindung am linken Kantenbereich.
Bei der Bewertung einer geschlossenen Schleife sollten die oberen und unteren kreisbogenförmigen Bereiche
wie eine Seitenlinie betrachtet werden, wobei es ohne Bedeutung ist, ob noch außerdem eine andere
Seitenlinie unterhalb der am weitesten unten liegenden angeschlossen ist.
V. Anzahl der Aushöhlungen am linken Kantenbereich:
Dies bezieht sich in Verbindung mit Fig. 6 auf im
linken Kantenbereich vorhandene Aushöhlungen, die mindestens 2 Bit tief und von einer mehr als 45° betragenden
Neigung umgeben sind. Belanglos ist, ob die
Innenseite der Aushöhlung stufenförmig ausgebildet ist.
VI. Anzahl von Aushöhlungen am rechten Kantenbereich
Dies bezieht sich in Verbindung mit F i g. 7 auf Aushöhlungen am rechten Kantenbereich, die mindestens
2 Bit tief und zwischen mehr als 45" betragende Neigungen eingefügt sind, Innenkonturen dieser
Hohlräß.ne sind ohne Bedeutung.
VII. Buckel am rechten Kantenbereich: Gemäß Fig. 8 gibt es folgende Unterscheidungsmöglichkeiten:
(0): kein Buckel;
(1): ein einfacher Buckel oder beliebig viele andere, nicht unter die letzte Unterklasse (2) fallende
Buckel; und
(2): über einem Buckel befindet sich eine mindestens 2 Bit tiefe Aushöhlung, die keine Neigung nach
links oben aufweist.
Nachstehend wird das erfindungsgemäße System der Zeichenerkennung beschrieben:
Fig. 10 enthält Systeme Ax bis A1 zur Extraktion
der vorstehend definierten Merkmale I bis VII, deren Internzustand X sich bei Empfang einer von außen
eingegebenen Übergangsanweisung Γ ändert. Mit anderen Worten: die Extraktionssysteme A1 bis A1 befinden
sich zunächst in einem Zustand X° und verändern sich dann von X1 ~' nach X1 (wobei t = 1,2,3...
32 sein kann) bis zum internen Zustand X12.
Wie vorstehend erwähnt, wird ein zur Erkennung anstehendes Zeichenmuster in eine Matrix von 24 Bit
χ 32 Bit eingeteilt. Von den Zeilen D1, D1, Dy.. Dn
hat jede eine Breite von 24 Bit in Horizontalrichtung (vgl. Q„. Qh, Qc... in Fig. 1 beispielsweise), und zwei
benachbarte Zeilen D' und D'~', die repräsentativ
sind für einzelne Konturen und Relativpositionen zwischen ihnen, werden zur Bildung einer Übergangsanweisung P ausgewertet. Beispielsweise entsteht die
Übergangsanweisung /l0 durch Auswertung der benachbarten
Zeilen D9 und D10, welche Gestalt und
Relation zwischen den Zeichenabschnitten L1 und L1
(Fig. 12a) ausweisen. Man beachte, daß gemäß einem wesentlichen Merkmal der vorliegenden Erfindung
nur zwei benachbarte Zeilen D' und D' ~' ausgewertet
werden, wenn die Übergangsanweisung Γ erzeugt wird.
Es gibt eine Unterscheidung zwischen einer ersten und zweiten Merkmalsgruppe bei einem Entwicklungsweg
von Γ aus D' und D' ~'.
Bei der ersten Merkmalsgruppe wird die Informa- so tion D' für Zeile / gemäß Fig. 13 nach A, B und C
klassifiziert, entsprechend der Anzahl η und der Länge
/ des auf dieser Zeile erscheinenden Abschnitts eines Schriftzeichens: A, wenn η = 1 und / relativ kurz
ist; B, wenn η = 1 und / relativ lang; und C, wenn « = 2 ist. Ferner läßt sich die äußere Information P
definieren nach der vorstehend erläuterten Klassifizierung von A, B und C sowie nich in Fi g. 14(A) aufgelisteten
Symbolen V, I, D,... P, welche im wesentlichen davon abhängen, ob die Zeichenabschnitte auf
den Zeilen t und / — 1 mit dem linken oder dem rechten
Kantenabschnitt verbunden sind. In Fig. 14(A) ist die obere Hälfte jedes der Symbole V, I, D... mit
dem Zeichenabschnitt der Zeile D' und die untere Hälfte mit dem Zeichenabschnitt auf Zeile D'~l belegt.
Bei dem Beispie! von Fig. 12 ist P = LH, bezogen
auf die Zeilen D9 und D10, und 7' = PR bezüglich
der Zeilen D19 und D20.
Die zweite Merkmalsgruppe /' richtet sich nur nach der Relation der rechten oder linken Position zwischen
D'und D'"1. Fig. 14(B)zeigt die Definition der
Übergangsanweisungen P in bezug auf die Merkmalsgruppe V, während Fig. 14(C) die Definition der
Übergangsanweisungen /' bezüglich der Merkmalsgruppen VI und VII wiedergibt. Gemäß Fig. 14(C)
sind die Übergangsanweisungen P »R« wie bei Merkmalsgruppe
V für das oben benutzte Beispiel in Fig. 12(a).
Nach Eingabe der Übergangsanweisungen /' in die Merkmalsextraktionssysteme A1-A1 ändern sich deren
interne Zustände gemäß diesen Anweisungen P im Rahmen von Übergangsprozessen, die in den Fig. 15
bis 19 dargestellt sind. D.-c eingekreisten Zeichen oder Symbole betreffen jeweils den internen Zustand X,
der aufgrund der Übergangsanweisung /' in Richtung auf einen Endzustand fortschreitet. Diese Übergänge
ereignen sich niemals in einem oberen oder unteren freien Bereich, wo ein Zeichenabschnittsmuster
steht.
Nachstehend wird der Übergang des Internzustands am Beispiel des Schriftzeichens »2« in Fig. 12
beschrieben: Die Übergangsanweisung für die Zeilen D7 und D8, nämlich das Symbol /* ist »H«, und dementsprechend
ändert das Zeichenerkennungssystem A! gemäß der Anzahl von Schleifen seinen Internzustand
von y0 nach yx, siehe Fig. 15. Das Zeichenerkennungssystem
A1 für die Form der unteren Kantenbereiche
ändert seinen Zustand gemäß Fig. 16 von y0
nach vH, und in ähnlicher Weise ändert das Detektorsystem
A1 seinen Zustand von y0 nach v, (siehe
Fig. 17), während die Detektorsysteme A5 und A6 im
Zustand y0 verharren.
Nach Vollzug der neunten Zeilenabtastung sind die Übergangsanweisungen f bei »LH« angekommen,
entsprechend den Symbolen der Zeichensegmente in den achten und neunten Zeilen. Das Zeichenerkennungssystem
A1 bleibt im Zustand yx, der Inhalt von
A 2 verbleibt bciyE.
Bei der Abtastung der neunten Zeile wird gemäß Fig. 14(C) »L« festgestellt, und das Zeichendetektorsystem
A6 geht in den Zustand V1 über. Das Zeichen
von Fig. 14(C) kommt nach der zehnten Zeile D10 zu
»L« bei unverändertem Zustand yx. Das Zeichen von
Fig. 14 (C) nach der elften Zeile D1I ist »R«, während
das Symbol in Fig. 14(A) auf der elften Zeile Dn als »V« ausgewertet wird, so daß das Detektorsystem A3
nach V1 in Fig. 17 übergeht. Detektorsystem Aq verbleibt
bei j,, während gegebenenfalls das Merkmalsdetektorsystem
A6 beiyE gemäß Fig. 19 ankommt.
Ebenso verändern die Detektorsysteme A1 bis A1
ihre Zustände sequentiell. Sobald die höchste oder Abtastung der zwanzigsten Zeile beendet ist, werden
gegebenenfalls die Detektorsysteme Ax bis A 7 in Zustände
versetzt, welche den Formen von Fig. 29(a)
entsprechen, worin A, sich iny, von Fig. 15, A2 inyE
von Fig. 16, A 3 inyE von Fig. 17 usw. befindet.
Ein in F i g. 20 enthaltener Rechner 8 speichert eine in Fig. 29 dargestellte Kennzeichentabelle in codierter
Form. Die Merkmalsdetektorsysteme Ax bis A1
senden zu dem Rechner 8 codierte Informationen ».« entsprechend der Anzahl von Schleifen, codierte Informationen
»u« entsprechend der Form des unteren Kantenabschnitts, codierte Informationen »-1« entsprechend
der Form des oberen Kanienabschnitts,» Jd «
entsprechend der Form des linken Kantenabschnitts, und codierte Informationen »c{« entsprechend dem
rechten Kantenabschnitt. Unter Vergleich dieser codierten Informationen mit der im Rechner 8 gespeicherten
Kennzeichentabelle gibt der Rechner 8 die Entscheidung aus, das fragliche Schriftzeichen ist die
Ziffer »2« in Form von Ausgangssignalen für diese Ziffer »2«.
F i g. 20 enthält ein grundsätzliches Blockschaltbild für ein OCR- bzw. optisches Lesegerät gemäß der vorliegenden
Erfindung. Eine aus einer Lichtquelle und einem optischen System bestehende Lesestation 1 beleuchtet
einen Zeichenmuster enthaltenden Beleg 2, und das von dem Beleg 2 reflektierte Licht wird von
einer photoelektrischen Schaltung 3 in elektrische Signale umgewandelt, welche über einen Analog-Digitalkonverter
4 in eine Abschnittaufbereitungsschaltung 5 eingegeben werden. Diese Schaltung 5 zerteilt
Daten von einer Zeichenlänge in Form einer Matrix von 24 Bit Breite und 32 Bit Höhe, die dann in einen
Speicher 100 eingegeben werden. Die so zerteilten Daten werden einer Vor-Verarbeitungsschaltung 6 zugeführt,
mittels der isolierte Einzelbits entfernt und Abstände in Horizontal- und Vertikalrichtung mit dem
Einzelbit nach Maßgabe der vorliegenden Erfindung ausgefüllt werden. Auf diese Weise werden Störspannungen
unterdrückt.
Eine nachgeschaltete Merkmalextraktionsschaltung 7 dient der Gewinnung der eingangs erläuterten
Merkmalsgruppen I bis VII aus den vorverarbeiteten Daten, und diese extrahierten Daten werden codiert.
Der Rechner 8 entscheidet dann, ob eine Übereinstimmung besteht zwischen den codierten Merkmalen
und der in einem Speicher 9 enthaltenen Kennzeichentabelle. Das Ergebnis dieser Entscheidung wird
in einer Ausgabeeinheit 10 erstellt.
Einzelheiten der Merkmalsextraktionsschaltung 7 zeigt Fig. 21, die einen mit dem von Fig. 20 identischen
Musterspeicher 100, einen Koordinatendetektor 200 zur Feststellung des Kantenabschnitts des
Zeichenmusterabschnitts, eine Gruppe von Funktionseinheiten 300 zum Auslesen der Information auf
den Zeilen D' und D' ~' (wiederholt, nur zwei Zeilen), ein Codeumsetzer 400 "im Codieren der Ausgänge
der Funktionseinheiten 300 und zur Erzeugung der Übergangsanweisungen Γ und eine Gruppe von Referenzschaltungen
500 zum Verändern der internen Zustände auf Veranlassung der Übergangsanweisungen
Γ gehören.
Gemäß F i g. 22 besteht der Musterspeicher 100 aus einer Serie von dreiunddreißig 24-Bit-Schieberegistern
S0, S1, S2. ■ ■ S32 zum Abspeichern je einer Zeicheninformationszeile.
Das heißt, der Musterspeicher 100 speichert die Musterinformation einer Matrix von 24
Bit χ 32 Bit im ganzen. In Fi g. 21 ist der Abspeichervorgang für die Ziffer»2« als Beispiel zugrunde gelegt.
Das unterste Schieberegister S0 in Fig. 22 dient Hilfszwecken,
beispielsweise dem Speichern von Leerinformation.
Die Information D' der Zeile t des Zeichenmusters aus der Abschnittaufbereitungsschaltung 5 wird in
das Schieberegister S1 für die Teile t (/ = 1, 2, 3,...)
im Speicher 100 eingegeben, wo die Information aufgrund eines Taktsignals in den Schieberegistern nach
rechts wandert. Nach Eingang des vierundzwanzigsten Taktsignals wird die Information D' in dem speziellen
Schieberegister S1 in das eine Stufe darunter sitzende
Schieberegister S (t — 1) übertragen, und in
diesem Moment wird die Information £>' der ersten Zeile in das Schieberegister S1 des Koordinatendetektors
200 und dann zum Schieberegister 5,, üb·;: tragen.
Die Leermusterir'ormation Z?0 wird vom Schieheiegister
S0 übernommen. 1st das vierundzw.'ivigste Taktsignal
zum rweuen Mal eingegangen, gelangt die In-
formation D' in das Schieberegister S (t — 2) und die
Information D2 für die zweitletzte Zeile wird dem Schieberegister S1 entnommen, während die Information
D1 bezüglich der untersten Zeile aus dem Schieberegister S1) zum Koordinatendetektor 200 übertra-
gen wird. Sobald der Speicher 100 vicrundzwanzig
Taktimpulse zum dritten Mal empfangen hat, wird die Information des Ein-Zeichen-Bereichs aus dem
Speicher 100 entnommen.
Der Ausgang von Schieberegister 5,, nämlich die
Ausgangsinformation D' auf der Zeile ι geht in den ersten Koordinatendetektor 210 und der Ausgang von
S0 oder die Information D'"1 von Zeile {t — 1) zum
zweiten Koordinatendetektor 220. Der in Fig. 23 separat dargestellte erste Koordinatendetektor 210 be-
steht aus einem Flip-Flop 2Ü, einem Zähler 212 und
einem Paar Verriegelungsschaltungen 213 und 214. Ein mit T bezeichnetes Signal personifiziert ein Bündel
von vierundzwanzig Taktsignalen, siehe F i g. 27. Unmittelbar vor dem Taktsignal T wird ein Signal S
erzeugt, und Flip-Flop 211 und Zähler 212 werden durch ein umgekehrtes Signa! S zurückgesetzt.
Bei dieser Anordnung zählt der Zähler 212 nach dem Rücksetzen von Zähler 212 und Flip-Flop 211
die mit T bezeichnete Anzahl von Taktsignalen. Der Zählwert von Zähler 212 zeigt die Bit-Positionen
sämtlicher Zeilen-Schieberegister S0 bis S32, d. h. die
Koordinatenpositionen, als Referenz vom linken Rand her betrachtet. Die Zeicheninformation D' auf
Zeile/ wird dem Flip-Flop 211 und der Verriegelungsschaltung 214 eingegeben und das Flip-Flop
211 durch ein Signal gesetzt, welches dem linken Randabschnitt des Zeichenmusters zugeordnet ist.
Dieses Setzsignal für Flip-Flop 211 geht zu einem Verriegelungseingang der Verriegelungsschaltung
214. Auf diese Weise wird der Zählwert des Zählers
212 bzw. der Koordinatenwen XL' der linken Randposition des Zeichenmusters fest in der Ven iegelungsschaltung
213 gespeichert. Wenn anschließend an das Ende des Zeichenmusters der Zeile / die Leerinformation
kommt, bleibt Flip-Flop 211 wie es ist, und die Augenblickskoordinaten werden fest in der Verriegelungsschaltung
214 gespeichert. Wenn jedoch der Zeichenabschnitt auf der gleichen Zeile verschwindet und
dann Leerinformation folgt, werden die Koordinaten
so in der Verriegelungsschaltung 214 weitergezählt. Das bedeutet, daß die Verriegelungsschaltung 214 bei den
Koordinaten XR' des äußersten rechten Randabschnitts des Zeichenmusters verbleibt.
Andererseits wird der Ausgang des Schieberegisters S0 einem zweiten Koordinatendetektor 220 (Fig. 24) eingegeben, welcher dem ersten Koordinatendetektor 210 gleicht und ein Flip-Flop 221, einen Zähler 222 und ein Paar Verriegelungsschaltungen 223, 224 aufweist. Die Koordinatenposition XL'~X des linken
Andererseits wird der Ausgang des Schieberegisters S0 einem zweiten Koordinatendetektor 220 (Fig. 24) eingegeben, welcher dem ersten Koordinatendetektor 210 gleicht und ein Flip-Flop 221, einen Zähler 222 und ein Paar Verriegelungsschaltungen 223, 224 aufweist. Die Koordinatenposition XL'~X des linken
Randabschnitts der Zeicheninformation X)'"1 von
Zeile (/ — 1) und die Koordinatenposition XR'~X
vom rechten Randabschnitt sind beziehbar aus den Verriegelungsschaltungen 223 bzw. 224.
Die Daten D', D>~\ XL', XL'~X und XR'-1 sind erhältlich
aus dem Speicher 100, und die ersten und zweiten Koordinatendetektoren 210 und 220 sind
aufgeteilt unter die Funktionseinheiten 310a, 3106, 320a, 320A, 330, 340, 350, 360, 370 und 380, siehe
Fig. 2) und 25.
Die Funktionseinheit 310a, ist ein auf die Zeicheninformation D' der Zeile t reagierender Zähler, welcher
entscheidet, aus wie vielen Abschnitten diese Zeivheninformation besteht. Ein Signal 5 (Fig. 27) setzt
Zähler 310a zurück, und dieser setzt während eines Zeitraumes vom Leerabschnitt der auf Zeile / markierten
Zeichenabschnitte den Zählvorgang fort. Er erzeugt die Anzahl n' von auf der η-ten Zeile vorhandenen
markierten Abschnitte. Die Funktionseinheit HOb ist der vorstehenden Funktionseinheit 310a ähnlich
und erzeugt die Anzahl /V~' von auf Zeile (n - 1) vorhandenen markierten Abschnitten.
' Die Funktionseinheit 320a führt mit Hilfe einer Differentialschaltung 321 an der rechten Kantenposition XR' und der linken Kantenposition XU eine Subtraktion durch, berechnet die Länge des (markierten) Zeichenabschnitts auf der Zeile /, und ein Komparator 322 vergleicht die resultierende volle Länge des Zeichcnabschniils mit einem gegebenen Wert (beispielsweise 8 Bit) und erzeugt den Ausgang »1«, wenn letzterer kleiner als ersterer ist.
' Die Funktionseinheit 320a führt mit Hilfe einer Differentialschaltung 321 an der rechten Kantenposition XR' und der linken Kantenposition XU eine Subtraktion durch, berechnet die Länge des (markierten) Zeichenabschnitts auf der Zeile /, und ein Komparator 322 vergleicht die resultierende volle Länge des Zeichcnabschniils mit einem gegebenen Wert (beispielsweise 8 Bit) und erzeugt den Ausgang »1«, wenn letzterer kleiner als ersterer ist.
Die Funktionseinheit 3206 erzeugt den Ausgang »1«. wenn die volle Länge des Zeichenabschnitts auf
Zeile (/ - 1) größer ist, während die linken und rechten Kantenabschnitte XL' ~' und XR''' betrachtet werden.
Die Funktionseinheit 330 besteht aus einem Zähler 332, welcher die Anzahl von markierten Zeichenpositionen
in dem Falle zählt, daß die Information D'
auf Zeile / und die Information D'~] auf Zeile (/ — 1)
durch ein ODER-Gatter 331 kombiniert werden. Das Zählerergebnis ist mit C bezeichnet.
Die Funktionseinheit 340 ist eine Operationsschaltung 341, welche als Eingänge die linken und rechten
Kantenpositionen XL' und XR' aufnimmt und die mit einem mittels eines Komparator 362 erstellten
Wertes verglichen. Dieser Komparator 362 gibt den Ausgang EL = »1« ab, wenn beide linken Kantenabschnitte
mehr als einen vorgegebenen Wert (beispielsweise 2 Bit) voneinander entfernt bleiben. Wenn
nicht, lautet der Ausgang EL = »0«.
Die Funktionseinheit 370 erzeugt einen Binär-Codewert SR, der Aussagen zu den rechten Kanfenabschnitten
der Zeichenabschnitte der Zeilen t bzw. (t - 1) zuläßt. Dieser Wert SR kann folgende Werte
annehmen:
Operation
XR1 + XL'
ausführt, um die Mittelkoordinaten der Zeichenabschnitte der Zeile / zu berechnen.
Während das Ergebnis einem Komparator 342 zugeführt wird, führt eine Operationsschaltung 343 den
Y Dt - 1 ι YTJ - I
Rechenvorgang ^ , das sind die Mittelkoordinaten
der Zeichenabschnitte auf der Zeile (/ - 1). Dies Ergebnis geht in den Komparator
342, und dieser gibt ein Ausgangssignal
RIL = »1« ab, wenn
2 2
ist, nämlich wenn die Mittelkoordinaten der Zeichenabschnitte der Zeile / rechts von denjenigen der Zeile
(f - 1) liegen. Wenn nicht, gibt der Komparator 342 den Ausgang R/L = 0 ab.
Die Funktionseinheit 350 erzeugt einen Binär-Codewert SL, welcher aussagt, welcher sich auf dem
rechten und welcher sich auf dem linken Randabschnitt des Zeichenabschnitts der Zeile t oder der Zeile
(/ — 1) befindet. SL kann folgende Werte annehmen:
{00 (wenn XL' = AT'"1)
10 (wenn XL' < XL'^)
11 (wenn AX' > XL'"1).
10 (wenn XL' < XL'^)
11 (wenn AX' > XL'"1).
Die Funktionseinheit 360 spricht an auf die linken Kantenpositionen XL' und AT'-' der Zeilen t und
(/ — 1), während eine Operationsschaltung 361 die Absolutwerte des Unterschieds zwischen diesen beiden
Eingängen errechnet. Das Rechenergebnis wird SR =
00 (wenn AT?' = AT?1"1)
10 (wenn AT?' < AT?-1) U (wenn XR'
> XR'-*).
Ähnlich wie Funktionseinheit 360 erzeugt Funk tionseinheit 380 ein Signal ER = »1«, wenn beide
rechten Kantenabschnitte mehr als um einen gegebe-ηεη
Wert voneinander entfernt sind, ist der Abstand
kleiner als der gegebene Wert, ist das Signal ER = »0«.
Die Ergebniswerte N', JV'-1, L', L'~\ C. R/L, SL.
EL, SR und ER der Funktionsgeneratoren 310 bis 380 werden dem Codeumsetzer 400 zugeführt, der als
PLA (Programmable Logic 4rray) mit 13-Bit-Eingang
und 7-Bit-Ausgang ausgeführt ist. Dieser Umsetzer wandelt die Eingänge in die Übergangsanweisungen
T von 4 Bit gemäß der in F i g. 6 dargestellten
Übersicht um. Die restlichen drei Bit-Ausgänge bilden Steuersignale F0, F1 und F2.
In Fig. 26 wird das 2-Bit-Signal N' dargestellt
durch /V/ und /V0', und die obere Hälfte der Musterkolonne
zeigt das Zeichenmuster der Zeile t, während
die untere Hälfte dasjenige der Zeile (/ — 1) enthält.
In der Kolonne für die Übergangsanweisungen Γ sind die zugeordneten Ausgangscodes von 4 Bit und Symbole
dargestellt. In der Eingangskolonne zeigt ein freier Raum an, daß ein Bit entweder »0« oder »1«
lauten kann.
Nachstehend werden die Beziehungen zwischen den vorstehend beschriebenen Funktionen am Beispiel der
dritten und zweiten Zeile des Musters »2«, siehe Fig. 22, beschrieben. Dabei ist die Information D3
auf der dritten Zeile (Information im Schieberegister S3) die folgende:
Summe der Anzahl von Zeichenabschnitten der dritten Zeile /V3 =10
Summe der Anzahl von Zeichenabschnitten der zweiten Zeile /V3 =01
Die Anzahl der Zeichenabschnitte, wenn aus den zweiten und dritten
Zeilen zusammengesetzt C =10
Vergleich zwischen den Mittelabschnitten der Zeichenabschnitte auf
den Zeilen / und (r - 1) RjL = 1.
Demgemäß lauten die Übergangsanweisungen Γ eo 1100 (das Symbol ist PL) eemäß der Übersicht in
Fig. 26.
Zeigt die Information D' eine Leerstelle, wird /V = 00 mit 9 Signal F0 erzeugt. Falls die Information
D' drei separate Abschnitte aufweist, dann ist N1 = 11
mit der Erzeugung eines Signals F1. Falls das Eingangssignal
nicht unter die erwähnte Übersichtstabelle fallt, wird ein Signal F2 erzeugt Mit Hilfe dieses
Signals F2 stellt der Rechner 8 fest, daß das fragliche
Zeichenmuster unlesbar ist, es wird zurückgewiesen und der Leseprozeß angehalten.
Das Signal F0 wird an den oberen und unteren
Leerabschnitten erzeugt, wo keine markierten Zeichenabschnitte vorhanden sind. Wird das Signal F0
am unteren Leer&tachnitt erzeugt, wird eine Tabellenreferenzschaltung
500 so lange nicht aktiviert, bis dieses Signal F0 verschwindet. Angenommen, daß dieser
Nicht-Zeichen-Abschnitt dem Ende des Zeichenabschnitts folgt und dann das Signal F0 erzeugt wird,
wird die Tabellenfrequenzprozedur unterbrochen und die internen Zustände der TabellenreferenzschaltungSOO
bleiben wie sie sind. Wenn zusätzlich der Zeichenabschnitt in zwei Teile aufgetrennt ist, und
das Signal F0 bei einer solchen Unterbrechungsperiode auftritt, unterbricht der Rechner 8 sofort seinen
Erkennungsprozeß und weist das betreffende Zeichenmuster zurück.
Das Signal F1 entsteht in der Nachbarschaft der
Mitte von Zeichen wie »9« und »6« (siehe F i g. 43). Dieses Signal F, wird gewöhnlich erzeugt, wenn der
Zeichenabschnitt eine natürliche Horizontallinie oder eine etwas modifizierte Ausführung davon ist. Es ist
erwünscht, solche Zeichenabschnitte, wo das Signal F, erzeugt wird, so in Vertikalrichtung zu verschieben,
daß eine horizontale Linie entsteht. Dies läßt sich mit Hilfe einer in Fig. 45 dargestellten Schaltung verwirklichen.
Unterhalb von Schieberegister S0 befindet sich ein zusätzliches Schieberegister S0', welches den
Ausgang D1'' erzeugt Ist das Signal F, niedrig, ist ein
UND-Glied g, geschlossen und der Ausgang eines ODER-Glieds g2 gleich D*"', wie der Ausgang von
S0 ■ S0' erhält diese Ausgänge. Ist dagegen das Signal
F, hoch, dann ist das UND-Glied offen und der Ausgang des ODER-Glieds g2 ist Ergebnis der ODER-Verknüpfung
von &-' V D1'1, und dies wird dem zusätzlichen
Schieberegister S0 eingegeben.
«Angenommen, das Signal F, wird erzeugt, weil D'
drei separate Zeichenabschnitte hat. Zu diesem Zeitpunkt ist die Schaltung aufnahmefähig für das nächste
Taktsignal, siehe Fig. 46. Zu Beginn der Abtastung ist der Ausgang von Schieberegister S1 gleich
Ω1'' und der Ausgang des ODER-Glieds g2 gleich D'
VD-1VD'- 2, weil das UND-Glied g, offen ist. Diese
Ausgänge werden dann S0 zugeführt, das Resultat zeigt Fig. 46(B).
Angenommen, Z)*"1 hat drei separate Abschnitte
D(I1 + 1), D(I, + 2)....D(I2 - 1), (I2
> I1) unter gleichzeitiger Erzeugung des Signals F1, wobei D'2
nicht die Erzeugung des Signals F1 veranlaßt, dann
wird die ODER-Logikoperation in einer Sequenz durchgeführt, welche mit D11 beginnt. Wenn D'2
kommt, ist der Ausgang des ODER-Glieds g, gleich
£>'-' VD(I, + I) V...VD(I2 + 1). Der Erfolg ist, daß
diese drei Abschnitte sequentiell mit der darunterliegenden Zeile zusammengefaßt werden. Zwischenzeitlich
wird die Tabellenreferenzschaltung nicht aktiviert, so daß diese drei Abschnitte des Musters zum
Zwecke der erleichterten Analyse in Vertikalrichtung verschoben werden. In diesem Abschnitt ist Z)'~' immer
ersetzt durch den Ausgang des ODER-Glieds g2 (wobei aus der Übersichtstabelle hervorgeht, daß F,
nur von D1 abhängig ist).
Gleichzeitig wird die Anzahl von Signal F, gezählt und, sobald es öfter als siebenmal gezählt wurde, unterbricht
der Rechner 8 den Erkennungsprozeß unmittelbar und erklärt, daß das untersuchte Zeichenmuster
ein zurückweisendes ist.
Die Tabellenreferenzschaltung 500 besteht aus mehreren Unterschaltungen 510, 520, 530 und 540,
bezogen auf die erste Merkmalsgruppe und mehreren Unterschaltungen 550, 560 und 570 unter Bezugnähme
auf die zweite Merkmalsgruppe. Die Schaltungen 510, 520, 530, 540 erhalten über den Codeumsetzer
400 die Übergangsanweisungen Γ von 4 Bit umgewandelt. 550 besteht aus 3 Bit der zusammengefaßten
Ausgänge der Funktionseinheiten 350 und
ίο -360 oder den kombinierten Signalen SL und IL vom
Unken Kantenabschnitt des Zeichenmusters, während die Schaltungen 560 und 570 3 Bit der kombinierten
Signale SR und ER, bezogen auf den rechten Kantenabschnitt
des Zeichenmusters, sind.
Jede der in Fig. 28 dargestellten Tabellenreferenzschaltungen besteht aus je emem Festspeicher
(ROM) 501 von 4 χ 256 Bit, einer Verriegelungsschaltung 502, einem Puffer 503 und einem UND-Glied
504. Der Festspeicher 501 enthält Programme
entsprechend den Obergangsdarstellungen der Fig. 15 bis 19. Die oberen Adressen A4 bis A1 der
Eingänge des Festspeichers 501 sind X1''' auf der
(i - 1 )tcn Zeile, während die unteren Adresse« A0 bis
A) die Information I' erhalten, welche zur Men Zeile
gehört, und der Ausgang wird in X1 verwandelt. Bei
Anlegen des Taktsignals TR erhält und verriegelt die Verrisgelungsschaltung 502 den Ausgang X1 des Festspeichers
501. Die oberen Adressen des Festspeichers zeigen X1, und der interne Zustand ändert sich von
X-' nachr.
Innerhalb der Tabellenreferenzschaltung wird die Verriegelungsschaltung 502 erstmals mit Erhalt des
Signals FS mit X3 = 0000 verriegelt. Nach Abtastung von D1 werden die diesem Wert entsprechenden Obergangsanweisungen
in den Festspeicher 501 eingegeben. Dessen obere 4 Bit werden mit dem Ausgang der
Verriegelungsschaltung 502 oder X" abgegeben. Der Ausgang des Festspeichers 501 gemäß den empfangenen
Übergangs- bzw. Übertragungsanweisungen T1.
Schließlich werden die Übertragungsanweisungen P auf der Zeile in den Festspeicher 501 eingegeben,
und dessen Ausgang ist X1, welcher wiederum der Verriegelungsschaltung 502 nach Empfang des Taktsignals
TR zugeführt wird. Jedesmal bei Empfang der
Übertragungsanweisung P wird der Ausgang des Festspeichers 501 übertragen. Schließlich wird X*1 erreicht,
und dieser Ausgang wird dem Speicher 8 von F i g. 2 über den Puffer 503 zugeleitet.
Wenn im Betrieb das Signal F0 oder F1 beispielsweise auf D10 erzeugt wird, schließt das UND-Glied 504. so daß kein Taktsignal TR zur Verriegelungsschaltung 502 gelangen kann. Damit werden X9 = A"0 und die Übertragungsanweisungen /l0 überspielt.
Wenn im Betrieb das Signal F0 oder F1 beispielsweise auf D10 erzeugt wird, schließt das UND-Glied 504. so daß kein Taktsignal TR zur Verriegelungsschaltung 502 gelangen kann. Damit werden X9 = A"0 und die Übertragungsanweisungen /l0 überspielt.
Der Rechner 8 speichert die Kennzeichentabelle füi
das in F i g. 29 dargestellte Beispiel zum Vergleich mil den entsprechenden Merkmalsgruppen I bis VII de:
zu identifizierenden Zeichenmusters. Die für die abschließenden übertragungszustände A"J der entspre
chenden Tabellenreferenzschaltungen 510...530 re präsentativen Codes werden zum Zwecke der Zei
chenidentifizierung mit der Kennzeichentabelle ver glichen. Stimmen die Daten der entsprechendei
Tabellenreferenzschaltungen beispielsweise mi Fig. 29a überein, dann entscheidet der Rechner 8
daß das fragliche Zeichenmuster die Ziffer »2« ist.
Zwar sind die entsprechenden Merkmale in Forn der in Fig. 29 dargestellten Konturen gespeichert
aber tatsächlich ist die Kennzeichentabelle in Form ihrer zugeordneten Code-Kennung innerhalb des
Rechners 8 gespeichert, vgl. Fig. 30 und 31. Stimmen
die Ausgangscodes der entsprechenden Tabellenreferenzschaltungen 510...570 mit den im Rechner 8 gespeicherten
Codes überein, wird das entsprechende Zeichen erkannt und ausgegeben.
Ein weiteres bevorzugtes Ausführungsbeispiel der Erfindung zeichnet sich dadurch aus, daß alle Zeichenmuster
charakterisiert sind durch die Anzahl von Schleifen, die Anzahl von Seitenlinien, die Anzahl
von Einbuchtungen und Vorsprüngen am oberen Rand, am unteren Rand, am linken Randabschnitt,
am rechten Randabschnitt, und durch die Anzahl von Buckeln am linken und rechten Randabschnitt. Mit
dem Ausdruck »Einbuchtung« sind hier Vertiefungen im Zeichenmuster gemeint, deren Tiefe eine gegebene
Bit-Anzahl übersteigt. In ähnlicher Weise haben Vorsprünge eine gewisse Höhe von mehr als einer Anzahl
Bit auf beiden Seiten und ihre Breite ist geringer als eine gewisse Anzahl Bit. Auch Buckel erstrecken sich
über eine Länge von mehreren Bit.
Die Anzahl der Schleifen, der Seitenlinien, der Vorsprünge
und dergleichen wird in gleicher Weise wie beim vorstehenden Ausführungsbeispiel abgetastet.
Gemäß F i g. 32 bis 35 zählt man die Anzahl der Einbuchtungen in der Weise, daß ein Abstand von einer
Referenzlinie zu dem Zeichenabschnitt von Zeile zu Zeile abgestastet und Änderungen von diesen Abständen
festgestellt werden. Die gleiche Methode ist anwendbar auf Vorsprünge und Buckel.
Bei der Feststellung von Einbuchtungen und dergleichen im Zeichenmuster wird dieses zuerst in Horizontalrichtung
abgestastet, um Positionsdaten in Horizontalrichtung zu erhalten, und dann erfolgt eine
Abtastung in Vertikalrichtung, wobei man vertikale Richtungsdaten erhält.
Eine in Fig. 36 dargestellte Schaltung analysiert pro Zeile oder Kolonne das bei der vorstehend geschilderten
Methode gewonnene Zeichenmuster unter Verwendung eines Speichers 600 von 24 Bit χ 32 Bit,
wie beim ersten Ausführungsbeispiel.
Eine AdreßsteuerschaltungoOl steuert sauber die
Adressen des Speichers 600. Bei der ersten Abtastung wird der Speicher 600 Zeile für Zeile abgetastet, beginnend
beim untersten Randabschnitt des Zeichenmusters, um Zeichendaten in Horizontalrichtung abzugeben.
Bei der zweiten Abtastung des Zeichenmusters erfolgt dies Kolonne für Kolonne, beginnend
beim linken Randabschnitt, um Zeichendaten der Vertikalrichtung abzugeben.
Ein Zähler 602 nimmt die Zeicheninformation vom Speicher 600 auf und wird nach jeder Zeile zurückgesetzt,
to daß die Anzahl -V der markierten Zeichenabschnitte
auf Zeile / gezählt werden.
Ein Puffer 603 speichert die 1-Zeilen-Information oder 1-Kolonnen-Information des Speichers 600 und
sendet die Information der C - l)ten Zeile oder der (; - 1 )ten Kolonne ab. während der Speicher 600 die
Information der Zeile / oder Kolonne / abgibt. Die Ausgänge von Speicher 600 und von Puffer 603 werden
über ein ODER-Glied 604 ir. einen Zähler 605
eingegeben, welcher den Zählwert C der Zeichenabschnitte der /-ten und der (/ - l)ten Zeilen errechnet.
Ein erster Koordinatenspcicher 606 behält die beiden Randabschnitte der Zeichenabschnitte der /-ten
Zeile oder /-ten Kolonne (die Links- und Rechts-Koordinate XL' und XR' für die Zeileninformation
und die oberen und unteren Koordinaten YV und YD' für die Kolonneninfonnation). Ein zweiter Koordatenspeicher
607 behält die beiden Randkoordinaten XL'-\ XR'-\ YW-* und YD''1 der Zeichenabschnitte der (/ — l)ten Zeile oder der (/ — l)ten Kolonne.
Diese Koordinatenspeicher 606 und 607 sind in Konstruktion und Betrieb dem Koordinatendetektor
200 von Fig. 25 ähnlich, sie enthalten ein Flip-Flop 607, einen Zähler 609 und ein Paar Verriegelungen
610 und 611.
Die Koordinatenspeicher 606 und 607 erstellen die Koordinateninformation des Zeichenabschnitts in
t5 Zeilenrichtung, während der Speicher 600 bei der ersten
Abtastung ist und die Koordinateninformation der Kolonnenrichtung bei der zweiten Abtastung erstellt.
612 unterscheidet nach den Ausgängen AU der Verriegelungen 610 und 611, ob die Länge des Zeichenabschnitts 7 Bit oder mehr beträgt. Das Ergebnis wird ausgegeben durch einen Binärwert:
612 unterscheidet nach den Ausgängen AU der Verriegelungen 610 und 611, ob die Länge des Zeichenabschnitts 7 Bit oder mehr beträgt. Das Ergebnis wird ausgegeben durch einen Binärwert:
1 (wenn L' ä
2 (wenn L' <
)
7)
Eine Operationsschaltung 613 errechnet einen Differenzwert
DXL zwischen dem linken Randabschnitt des Zeichenabschnitts auf der Zeile / und dem Gegenstück
auf der Zeile (/ — 1) und erzeugt in Fi g. 41 dargestellte Bit-Codes DX1 entsprechend der Korrelation
zwischen den linken Randabschnitten der Zeilen / und (/ — 1). Eine Operationsschaltung 614 errechnet einen
Differenzwert zwischen der linken Randposition und der rechten Randposition des Zeichenabschnitts
auf der Zeile (/ — 1). Dies ähnelt der Operationsschaltungen. Einzelheiten von DXR sind aus
F i g. 38 zu entnehmen.
Die Operationsschaltungen 613 und 614 sind abhängig von den Ausgängen der Koordinatenspeicher
Die Operationsschaltungen 613 und 614 sind abhängig von den Ausgängen der Koordinatenspeicher
606 und 607, und sie erzeugen Codes D YD und D YU als Repräsentativwerte für die oberen und unteren
Koordinaten von F i g. 39 und 40.
Diese Operationsergebnisse werden Tabellenreferenzschaltungen
703 bis 714 zugeführt, von denen jede, wie Fig.41 zeigt, aus einem Festspeicher
(ROM) 701 und einer Verriegelungsschaltung 702 besteht. Diese Schaltungen reproduzieren die jeweiligen
Merkmale wie Anzahl der oberen und unteren
so Einbuchtungen und dergleichen. Die·^ Merkmale
oder Kennzeichen werden codiert und dem Rechner 8 zugeführt. Dieser snthält die in Fig. 42 dargestellten
Kennzeichentabel'e und vergleicht diese Kennzeichencodes mit der Tabelle, um die Zeichenerkennung
durchzuführen.
Bei allen zuvor besprochenen Ausführungsbeispielen werden die erste und die zweite Abtastung in enger
Beziehung zueinander durchgeführt. Es sei erwähnt, daß die Symbole V, I. D usw. der Musterinformation
«ο nicht notwendigerweise auf die Fig. 14(A) bis 14(C) begrenzt sind.
Selbstverständlich beschränkt sich die Erfindung nicht auf die beschriebenen und dargestellten Ausführungsbeispiele,
vielmehr sind im Rahmen der Er(In-
M dung, abgesteckt durch die Patentansprüche, zahlreiche
Abwandlungen möglich.
Hierzu 24 Blatt Zeichnungen
Claims (3)
1. Einrichtung zum Erkennen von Schriftzeichen, bei der ein ein Schriftzeichen aufweisendes
Bildfeld nach zeilenweiser Abtastung digitalisiert in einer Bildmatrix gespeichert und zonenweise
auf das Vorliegen vorbestimmter zweizeiliger Formenelemente untersucht wird, mit einer Merkmalextraktionsschaltung
(T), in der eine bei der zonenweisen Untersuchung ermittelte Folge von Formenelementen
mit Hilfe eines als Nachschlagetabelle dienenden Speichers ausgewertet wird und durch die für jede Abtastzeile (D') den jeweiligen
Formenelementen (V, I, D, LH, RH usw.) zugeordnete Übergangsanweisungen (T) erzeugt werden,
dadurch gekennzeichnet, daß die Übergangsanweisungen (F) den Eingängen mehrerer,
verschiedenen Zeichenmerkmalen (I bis VII) zugeordsuen Merkmalsdetektoren (510, 520,
530, 540, 550, 560,570) zugeführt werden, die jeweils
eine an sich bekannte Schaltung aus einem mit seinem Ausgang an jeweils einen Zwischenspeicher
(502) angeschlossenen Festwertspeicher (501), dessen erste Adresseneingänge (AA bis
AT) mit dem aus der vorherigen Abtastzeile (D''') gewonnenen Inhalt des Zwischenspeichers (502)
und dessen zweite Adresseneingänge (AO bis A3) mit der jeweiligen Übergangsanweisung (Γ) beaufschlagt
sind aufweisen, und daß nach Auswertung der ge-'%mten Bildmatrix die Inhalte der Zwischenspeicher
(502) der Merkmalsdetektoren (510 bis 570) die Eingangsgrößen für die Nachschlagetabelle
(9) zur Bestirr-muni» des abgetasteten
Schriftzeichens darstellen.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß fünf Merkmalsdetektoren für
fünf Merkmale, und zwar für die Anzahl geschlossener Zeichenmusterschleifen, sowie die Formen
von Unterkante, Oberkante sowie rechter und linker Seitenkante vorliegen.
3. Einrichtung nach Anspruch 1, dadurch fekennzeichnet,
daß sieben Merkmalsdetektoren für sieben Merkmale, und zwar für die Anzahl der geschlossenen
Zeichenmusterschleifen, die Form der unteren bzw. der oberen Kante, die Verbindung
mit einer Seitenlinie, die Anzahl von Löchern oder Aushöhlungen in der linken bzw. der rechten
Kante und für die Feststellung von Randvorsprüngen in der rechten Kante vorliegen.
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP52059589A JPS5811662B2 (ja) | 1977-05-23 | 1977-05-23 | 文字図形認識方式 |
JP52060117A JPS5816218B2 (ja) | 1977-05-24 | 1977-05-24 | 文字図形認識方式における水平線分検出法 |
JP52060115A JPS5811663B2 (ja) | 1977-05-24 | 1977-05-24 | 文字図形認識方式 |
JP6011677A JPS53145425A (en) | 1977-05-24 | 1977-05-24 | Error preventing system for character recognizing device |
JP6143377A JPS53145527A (en) | 1977-05-25 | 1977-05-25 | Vertical line detecting method for character pattern recognition system |
JP6143477A JPS53145528A (en) | 1977-05-25 | 1977-05-25 | Character pattern recognition system |
JP52061435A JPS607316B2 (ja) | 1977-05-25 | 1977-05-25 | 文字図形認識方式における突起部分の検出法 |
JP7597477A JPS5410640A (en) | 1977-06-24 | 1977-06-24 | Character recognition system |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2822458A1 DE2822458A1 (de) | 1979-01-25 |
DE2822458C2 true DE2822458C2 (de) | 1983-11-03 |
Family
ID=27572509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2822458A Expired DE2822458C2 (de) | 1977-05-23 | 1978-05-23 | Einrichtung zum Erkennen von Schriftzeichen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE2822458C2 (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3804450A1 (de) * | 1987-02-20 | 1988-09-01 | Hitachi Ltd | Verfahren zur konturabtastung und anordnung dafuer |
DE4229479A1 (de) * | 1991-09-04 | 1993-03-11 | Ricoh Kk | Verfahren zum darstellen eines bildes in einem erkennungssystem |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4177448A (en) * | 1978-06-26 | 1979-12-04 | International Business Machines Corporation | Character recognition system and method multi-bit curve vector processing |
US4404542A (en) * | 1980-12-05 | 1983-09-13 | Rca Corporation | Digital sequence detector |
DE3236336A1 (de) * | 1982-09-30 | 1984-04-05 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung |
FR2662835B1 (fr) * | 1990-05-29 | 1992-08-21 | Dupont Francois | Appareil de detection de formes dans une image en temps reel. |
CA2057412C (en) * | 1990-12-12 | 1996-01-30 | Eberhard Kuehl | Character recognition system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1180290A (en) * | 1966-10-31 | 1970-02-04 | Tokyo Shibaura Electric Co | Apparatus for Recognising a Pattern |
BE756866A (fr) * | 1969-09-30 | 1971-03-30 | Siemens Ag | Procede pour l'identification automatique de caracteres alphanumerique |
JPS5215235A (en) * | 1975-07-26 | 1977-02-04 | Fujitsu Ltd | Character recognition unit |
-
1978
- 1978-05-23 DE DE2822458A patent/DE2822458C2/de not_active Expired
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3804450A1 (de) * | 1987-02-20 | 1988-09-01 | Hitachi Ltd | Verfahren zur konturabtastung und anordnung dafuer |
DE4229479A1 (de) * | 1991-09-04 | 1993-03-11 | Ricoh Kk | Verfahren zum darstellen eines bildes in einem erkennungssystem |
Also Published As
Publication number | Publication date |
---|---|
DE2822458A1 (de) | 1979-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE2431451C3 (de) | Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens | |
DE2801536C2 (de) | Zeichenformkodiervorrichtung | |
DE2264090C3 (de) | Datenverdichtung | |
DE2432129A1 (de) | Verfahren und vorrichtung zum erkennen von schriftzeichen, namentlich von ziffern | |
DE2557553A1 (de) | Verfahren und anordnung zur bilddatenverdichtung und -reexpansion | |
DE1095026B (de) | Verfahren zur Identifizierung von Informationen | |
DE2540101C2 (de) | Verfahren zum automatischen Erkennen von Zeichen mittels eines optischen Zeichenlesers | |
DE10025332A1 (de) | Verfahren zum Lesen eines zweidimensionalen Barcodes | |
DE3315108A1 (de) | Musterdiskriminator | |
DE2740483A1 (de) | Merkmal-detektor | |
DE2220693C3 (de) | Verfahren und Einrichtung zum Trennen von in einem Abtastbildbereich vorhandenen, miteinander nicht verbundenen Teilbildern | |
DE3322443A1 (de) | Mustererkennungsvorrichtung | |
DE2147896A1 (de) | Einrichtung zur erfassung graphischer symbole und mit dieser einrichtung arbeitendes abtastgeraet | |
DE2728889B2 (de) | Verfahren und Vorrichtung zum Übertragen eines Zweipegel-Faksimilesignals | |
DE2829808A1 (de) | Verfahren und vorrichtung zum lesen von zeichen | |
DE2822458C2 (de) | Einrichtung zum Erkennen von Schriftzeichen | |
DE3524505A1 (de) | Bilderkennungsvorrichtung | |
DE2749222A1 (de) | Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen | |
DE2103480A1 (de) | Dateneingabevorrichtung fur Daten verarbeitungsanlagen | |
DE2159307A1 (de) | Verfahren und schaltung zur durchfuehrung dieses verfahrens zur zentrierung eines in die auswerteinrichtung einer zeichenerkennungsmaschine eingegebenen zeichens | |
DE102018128696A1 (de) | Programmvergleichsvorrichtung und Programmvergleichsverfahren | |
DE2119555A1 (de) | Gerät zum Erkennen graphischer Symbole | |
DE2453086C3 (de) | Anordnung zum Erkennen gedruckter chinesischer Schriftzeichen | |
DE2718569A1 (de) | Verfahren und anordnung zum erkennen gedruckter zeichen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OAP | Request for examination filed | ||
OD | Request for examination | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8328 | Change in the person/name/address of the agent |
Free format text: PATENTANWAELTE MUELLER & HOFFMANN, 81667 MUENCHEN |
|
8339 | Ceased/non-payment of the annual fee |