DE2822458C2 - Einrichtung zum Erkennen von Schriftzeichen - Google Patents

Einrichtung zum Erkennen von Schriftzeichen

Info

Publication number
DE2822458C2
DE2822458C2 DE2822458A DE2822458A DE2822458C2 DE 2822458 C2 DE2822458 C2 DE 2822458C2 DE 2822458 A DE2822458 A DE 2822458A DE 2822458 A DE2822458 A DE 2822458A DE 2822458 C2 DE2822458 C2 DE 2822458C2
Authority
DE
Germany
Prior art keywords
character
line
memory
bits
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE2822458A
Other languages
English (en)
Other versions
DE2822458A1 (de
Inventor
Fusao Yamatokoriyama Nara Makino
Toshiaki Nara Morita
Toshiki Tenri Nara Nishioka
Hironari Kobe Hyogo Takatori
Syoichi Nara Yasuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP52059589A external-priority patent/JPS5811662B2/ja
Priority claimed from JP6011677A external-priority patent/JPS53145425A/ja
Priority claimed from JP52060115A external-priority patent/JPS5811663B2/ja
Priority claimed from JP52060117A external-priority patent/JPS5816218B2/ja
Priority claimed from JP6143477A external-priority patent/JPS53145528A/ja
Priority claimed from JP6143377A external-priority patent/JPS53145527A/ja
Priority claimed from JP52061435A external-priority patent/JPS607316B2/ja
Priority claimed from JP7597477A external-priority patent/JPS5410640A/ja
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of DE2822458A1 publication Critical patent/DE2822458A1/de
Publication of DE2822458C2 publication Critical patent/DE2822458C2/de
Application granted granted Critical
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

Die Erfindung betrifft eine Einrichtung zum Erkennen von Schriftzeichen anhand von vorbestimmten Formenelementen.
Eine solche Einrichtung ist zum Beispiel aus der DE-AS 19 49 428 bekannt. Ein Zeichen wird zunächst ganz gelesen und kodiert, In einem ersten Klassifizierungsschritt zum Erkennen des Zeichens werden einfache Grundstrukturen untersucht. Aus zusammenhängenden Elementarmerkmalen werden Merkmale gebildet und zwischengespeichert, deren mögliche Bedeutungen ermittelt und in einem Bewertungsspeicher gespeichert werden. Dadurch erfolgt eine Auslese möglicher Zeichen. Anhand dieser Auslese wird von neuem kodifiziert und nun nach feineren Strukturmerkmalen klassifiziert. Dadurch wird der Bereich möglicher Zeichen weiter eingeengt. Bei einem Ausführungsbeispiel werden jeweils drei Kodienings- und Klassifiziecungsprozesse durchgeführt.
Eine derartige Einrichtung benötigt einen sehr großen Speicher, da zunächst die gesainte Bildinformation gelesen und gespeichert wird. Dadurch wird die Einrichtung groß, teuer, und sie arbeitet aur langsam. Diese Nachteile werden um so gravierendei, je mehr Zeilen zum Aufnehmen der untersuchten Bildelemente verwendet werden.
Aus der DE-OS 26 33 513 ist eine weitere Einrichtung zum Erkennen von Schriftzeichen bekannt, die demgegenüber bereits verbessert ist. Stimmen nämlich die Inhalte aufeinanderfolgender Zeilen überein, so eliminiert eine Kompressionslqgik-Schaltungseinheit diese Redundanzen, die durch Überlappung der Teilzonen oder die Wiederholungen desselben Zustandes bedingt sind, so daß schließlich das Erkennen des gelesenen Zeichens aus der gespeicherten Bildinformation in der Re0Cl nicht aus der Gesamtzahl der ^lesenen Bildelemente, sondern aus einer verringerten Anzahl erfolgt.
Liegt jedoch ein kompliziertes Zeichen oder eine verschnörkelte Handschrift vor. so werden nur für wenige Zeilen die Bildinhalte übereinstimmen, so daß sich kaum eine Verringerung der gelesenen Bildinformation erzielen läßt. Auch in diesem Fall ist daher ein Speicher für die gelesenen Bildelemente vorzusehen.
dessen Kapazität ausreicht, die Information für praktisch alle möglichen Bildelemente zu speichern. Es wird also weiterhin ein großer Speicher benötigt, jedoch wird der Erkennungsvorgang in der Regel schneller ablaufen, da in der Regel eine Verringerung der auszuwertenden Bildelemente durch die Kompressionslogik-Schaltungseinheit erfolgt.
Aus der DE-AS 15 49 930 ist eine gattungsgemäße Einrichtung bekannt, von der die vorliegende Erfindung ausgeht. Ein ein S<"hrifti.:ichen aufweisendes Bildfeld wird zeilenweise abgetastet. Das Abtastungsergebnis wird digitalisiert in einer Bildmatrix gespeichert und zonenweise auf das Vorliegen vorbestimmter zweizeiliger Formenelemente untersucht. Abhängig von den Änderungen solcher zweizeiliger Formenelemente in benachbarten Zonen werden zusätzlich Übergangsanweisungen erzeugt. Schließlich liegt für jede Zone eine Information über die enthaltenen Formenelemente und, anhand der Übergangsanweisungen, eine Information über deren zonenweisen Zusammenhang vor. Mit einer Merkmal-Extraktionsschaltung wird schließlich die bei der zonenweisen Untersuchung ermittelte Folge von Formenelementen mit Hilfe eines als Nachschlagetabelle dienenden Speichers ausgewertet. Hier sind also nicht mehr so viele Speicherplätze erforderlich, wie Bildelemente vorhanden sind, sondern nur noch eine den zweizeiligen Zonen entsprechende Anzahl von Speicherplätzen, in denen die_ Information über die Formenelemente und die Übergangsanweisung zu speichern ist.
Der Erfindung liegt die Aufgabe zugrunde, eine Einrichtung der in der DE-AS 15 49 930 genannten Art so auszubilden, daß sich der erforderliche Speicherbedarf weiter verringern läßt und sich die Auswertzeit bis zum Erkennen eines Schriftzeichens weiter verringern läßt.
Die erfindungsgemüDe Lösung dieser Aufgabe ist im Hauptanspruch kurz zusammengefaßt wiedergege-
ben. Die erfindungsgemäße Einrichtung zeichnet sich dadurch aus, daß verschiedene Merkmalsdetektoren vorliegen, die für das Erkennen ganz bestimmter Zeichenmerkmale zuständig sind, z. B. für die Anzahl geschlossener Schleifen oder die Form der oberen, rechten, unteren oder Unken Kante eines Zeichens. Anhand zweizeiliger Fonnenelernente und anhand von Übergangsanweisungen wird Zone für Zone der Inhalt in jedem dieser Speicher verändert, so daß in jedem der Speicher nach Abschluß der zeilenweisen Abtastung gespeichert ist, ob die zu überwachenden Formenelemente vorliegen oder nicht Wird zum Beispiel eine „8" gelesen, so stelli der Merlanalsdetektor, der für die Feststellung geschlossener Schleifen zuständig ist, fest, daß zwei geschlossene Schleifen vorliegen. Nach Abschluß der Abtastung gibt also jeder Merkmalsdetektor ein Signal ab, das angibt, ob eine bestimmte, von ihm zu überwachende Form vorliegt und gegebenenfalls wie oft die zu überwachende Form aufgetreten ist.
Bei einer erfindungsgemäßen Einrichtung werden also im Vergleich zum Stand der Technik nur sehr wenige Daten gespeichert. Für einfache Zeichen reicht die Verwendung von fünf Merkmalsdetektoren aus, wie sie in Anspruch 2 angegeben sind. Für kompliziertere Zeichen reicht es aus, sieben Merkmalsdetektoren der in Patentanspruch 3 gekennzeichneten Art zu verwenden.
Die Erfindung und vorteilhafte Einzelheiten werden nachfolgend unter Bezug auf die Zeichnung in beispielsweisen Ausführungsformen näher erläutert. Es zeigt
F i g. 1 ein Zuordnungsdiagramm zur Erläuterung, wie ein Zeichenmuster in Schlitzsegmente gemäß der Erfindung aufgegliedert wird;
F i g. 2 bis 9 Diagramme zur Definition und Verdeutlichung der zu extrahierenden und zu erkennenden Merkmale eines Zeichenmusters;
Fig. 10 das symbolische Blockdiagramm für das Grundschema eines OCR-Geräts gemäß der Erfindung;
Fig. 11 erläutert Übergangsbefehle und Übergangsbedingungen;
Fig. 12 verdeutlicht das Auslesen eines Zeichenmusters gemäß einer bevorzugten Ausfuhrungsform der Erfindung;
Fig. 13 veranschaulicht eine bestimmte Bedingung bei dem Zeichenerkennungsbeispiel der Fig. 12;
Fig. 14(A) bis 14(C) veideutlichen die Beziehung zwischen den von den Merkmalabtastsystemen und einem bestimmten Zeichenmuster abgeleiteten Übergangsbefehlen;
Fig. 15 bis 19 verdeutlichen die Übergangsbedingungen für die Inhalte des Merkmalabtastsystems, ausgelöst durch die Übergangsbefehle, wobei F i g. 15 ein Übergangsschaubild für die zu erfassende Anzahl von geschlossenen Schleifen in einem zu erkennenden Zeichenmuster, Fig. 16 ein Übergangsschaubild hinsichtlich des unteren Kantenbereichs eines Zeichenmusters, Fig. 17ein Übergangsschaubild hinsichtlich des oberen Kantenbereichs eines ZeichenmusterSi Fig. 18 ein Übergangsschaubild hinsichtlich der Anzahl von Löchern oder Unterbrechungen am linken Kantenbereich eines Zeichenmusters und Fig. 19 das Übergangsschaubild hinsichtlich der Anzahl von Löehern oder Unterbrechungen am rechten Kant.enbereich eines Zeichenmusters verdeutlichen;
Fie. 20 das Blockschaltbild einer bevorzugten Ausführungsform eines optischen Lesegeräts gemäß der Erfindung;
Fig. 21 das detailliertere Blockschaltbild eines wesentlichen Teils der Gerätsausführung nach F ig. 20;
Fig. 22 ein Blockschaltbild zur Verdeutlichung einer Speicheraufteilung;
Fig. 23 und 24 Schaltungen eines Koordinatendetektors;
Fig. 25 das detaillierte Schaltbild eines Code-Umsetzers bei der Ausführung nachFig. 21;
Fig. 26(A) und 26(B) die Zuordnung zwischen Codes, die Merkmalen eines Zeichenmusters entsprechen und den Übergangsbefehlen;
Fig. 27 Signal verlaufe in den Schaltungen nach Fig. 20 bis Fig. 25;
Fig. 28 das Schaltbild für ein Beispiel einer Tabellenbezugsschaltung;
F i g. 29 ein Beispiel einer Nachschlagetabelle mit verschiedenen Zeichen und den diesen jeweils zugeordneten Merkmalen;
Fig. 30 und 31 Code-Tabellen für die jeweiligen Merkmale;
Fig. 32 bis 35 Erläuterungsschaubilder zur Erläuterung, wie kleinere individuell bedingte Abweichungen eines Zeichenmusters gemäß der Erfindung erkennbar sind;
Fig. 36 das Blockschaltbild einer anderen bevorzugten Ausführungsform der Erfindung;
F i g. 37 bis 40 einige Beispiele für Merkmale eines Zeichenmusters und den jeweiligen Ausgangscode;
F i g. 41 das Beispiel einer Tabellenbezugsschaltung und eines Merkmaldetektors gemäß einer anderen bevorzugten Ausführungsform;
F i g. 42 das Beispiel einer Nachschlagtabclle nach einer anderen bevorzugten Durchführungsform;
F i g. 43 erläutert formale Unterscheidungsmerkmale bei der Erkennung der Ziffern „9" und „6";
Fig. 44 verdeutlicht ein Beispiel, wie sich dl· Bedingungen bei der Erkennung von beispielsweise handgeschriebenen Zeichnungen ändern können;
F i 6.45 ein Beispiel für einen Prozessor zur Entdeckung von seitlichen Segmenten und
Fig. 46(A) bis 46(D) Diagramme zur Erläuterung der Arbeitsweise der Schaltung nach F i g. 45.
Bevor auf das Gesamtsystem in Einzelneren eingegangen wird, erschunt es als zweckmäßig, das Prinzip der Erfindung zu erläutern, und zwar am Beispiel der Erkennung einer etwa handgeschriebenen Ziffer „2".
Ein gedrucktes oder auf einer Vorlage geschriebenes Zeichenmuster läßt sich mittels eines optischen Systems in bekannter Weise abtasten und über eine photof 'cktrische Schaltung in elektrische Signale umsetzen. Diese Signale werden dann nach vorhergehender Formung und Verarbeitung beispielsweise zur Verminderung von Rauschanteilen in einem Systemspeicher gespeichert. Ein Speicherbereich eines solchen Speichersys'.ems ist in Fig. 1 mit Q bezeichnet; er ist in der Lage, die Information eines vollständigen ZeiGhenberekhs zu speiehern, Im vorliegenden Beispiel kann der Speicherbereich für einen voller· Zeichenbereich 24 Bit in der Breite und 32 &it in Längsrichtung umfassen. Jede der32 Horizontalzeilen ergibt also eine Informationslänge oder Kapazität von 24 Bit, woraus sich die Kapazität des vollständigen Zeichenbereichs leicht ableiten läßt.
Das Muster „2" werde beispielsweise in Horizontal-
richtung unterteilt und die jeweiligen Schlitzsegmente des Musters werden für die zugeordnete Speicherzeile gespeichert. Alle Merkmale eines zu erkennenden Zeichenmusters werden gruppiert und wie nachfolgend erläutert definiert oder sortiert:
Erste Gruppe:
I. Feststellung der Anzahl der geschlossenen Schleifen;
II. Feststellung der Form des unteren Kantenbereichs;
ΙΠ. Feststellung der Form des oberen Kantenbereichs und
IV. Feststellung der Verbindung mit einer Seitenlinie.
Zweite Gruppe:
V. Feststellung der Anzahl von Löchern oder Aushöhlungen im linken Kantenbereich;
VI. Feststellung der Anzahl von Löchern oder Aushöhlungen im rechten Kantenbereich und
VII. Feststellung von »Buckeln« oder anschwellenden Abschnitten im rechten Kantenbereich.
Der Ausdruck »Seitenlinie« oder »seitliche Linie« bezeichnet jenen Abschnitt eines Zeichens, der in Horizontalrichtung mindestens einige Bit lang ist, und entsprechend werden auch nur »Buckel« berücksichtigt, die mehr als einige Bit hoch sind.
Die Beschreibung der einzelnen Erkennungsstufen:
I. Die Anzahl der geschlossenen Schleifen:
Bei dieser ersten Bestimmung wird zunächst die Anzahl von kreisringförmigen Schleifen festgestellt, beispielsweise bei einer Ziffer »8«. Soweit das zu erkennende Muster eine Ziffer oder ein Buchstabe ist, läßt sich die Anzahl der Schleifen wie nachfolgend unter Bezug auf F i g. 2 klassifizieren:
(0): keine Schleife;
(1): Anzahl der Schleifen ist 1 und der durch die Schleife umgrenzte Raum ist mindestens 1 Bit oder mehr breit bzw. hoch;
(2): die Anzahl der Schleifen beträgt 2. Es liegt im gegebenen Beispiel eine »Taille« mit einer Breite von 7 Bit oder weniger vor und der Raum oder Abstand im Inneren der jeweiligen Schleifen beträgt 1 Bit oder mehr. Dazu alternativ kann auch der Fall vorliegen, daß keine »Taille« vorhanden ist. während der obere Raum im Inneren der Schleife 1 Bit oder mehr im unteren Bereich 2 Bit oder mehr breit ist.
Hinsichtlich ^er Bewertung der so überprüften Schleifen sei bemerkt, daß hier zunächst nur solche berücksichtigt werden, die nach einer vorhergehenden Verarbeitung einen Innenraum von einem oder mehr Bit aufweisen. Für den Fall, daß zwei Schleifen ohne dazwischenliegende Taille festgestellt werden (vgl. das Beispiel der F i g. 3), lassen sich Zeichen wie die Ziffer »8« sicher dadurch erkennen, daß hinsichtlich der oberen Schleife die Einschränkung auf eine Größe von 2 oder mehr Bit festgelegt wird. Jene Zeichen, die den obigen Bedingungen nicht genügen, jene mit beispielsweise 3 Schleifen oder jene Zeichen die keine Verbindung zwischen ihren beiden Hauptteilen aufweisen, lassen sich in andere Kategorien einsortieren.
II. Form des unteren Kantenabschnitts:
Dieser Bereich läßt sich klassifizieren durch Länge und Anzahl von Linien, welche vom unteren Kantenbereich ausgehen, (vgl. F i g. 4):
(0): kein Buckel am unteren Kantenbereich.
(1): die Länge des Buckels überschreitet einen gegebenen Wert, und
(2): es gibt zwei oder mehr Buckel.
Die Länge von Zeilen mit abgeschnittenem Spitzenabschnitt läßt sich nach vorstehender Maßnahme bewerten, weil alle Teilchenmustcr mit gleicher Länge zwei Zugehöngkeitsmöglichkeiten haben, nämlich Unterklasse (0) oder (1), oder Unterklasse (2). Zei-Ki chenmuster mit zwei Buckeln von mehr als 6 Bit Länge sollten in Unterklasse (2) eingeordnet werden.
III. Form des oberen Kantenbereichs:
Die Sortierung dieser Kategorie ist abhängig von der Länge und Anzahl von Linien, die vom oberen Kantenbereich ausgehen, und von der Gestalt der obersten Horizontallinie, siehe Fig 5:
(0): kein Buckel, und die horizontale Länge beträgt
beispielsweise 8 Bit oder weniger;
:o (1): es gibt einen orientierten Bxickel. der eine gegebene Höhe von beispielsweise 2 Bit oder weniger unterschreitet, und die horizontale Linie ist kurzer als 8 Bit;
(2): es gibt einen oberen gcricnteUn Buckel, dessen Höhe größer als ein gegebener Wert von beispielsweise 3 Bit oder mehr ist, und die Horizontallinie ist beispielsweise kürzer als 8 Bit;
(3): es gibt zwei Buckel am oberen Kantenbereich und die Horizontallänge ist beispielsweise kürzer als 8 Bit;
(4): es gibt keinen gerichteten oberen Buckel, während die Horizontallinie beispielsweise langer als 8 Bit ist; außerdem befindet sich am linken Rand ein hängender Abschnitt;
(5): es gibt keinen gerichteten Buckel aber einen
hängenden Abschnitt am rechten Rand.
Der benutzte Ausdruck »Linieniängc« in der oberen Aufzählung versteht sich ausschließlich als Spitzen- und Fußabschnitt. Wenn beispielsweise ein Zeichenmuster einer in Unterklasse (2) gehörige Form und eine in Unterklasse (4) gehörige Horizontallinie über der erstgenannten Form besitzt, dann wird der oberen Kontur in Unterklasse (4) Priorität gegeben. Nur in dem Falle, wo zwei Buckel länger als 4 Bit sind, von denen einer länger als die in Unterklasse (2) gehörige Kontur ist, wird der unteren Kontur Priorität gegeben, nämlich der Unterklasse (3).
IV. Verbindung mit Seitenlinie:
Diese Möglichkeit wird nachstehend klassifiziert nach der Anzahl η von Seitenlinien und ob die '"streffende Seitenlinie nach links oder rechts verbunden ist, wie in Fig. 9:
(0): η = 0, keine Verbindung;
(1): η = 1, keine Verbindung;
(2): η = I und eine Verbindung am linken Kantenbereich.
Bei der Bewertung einer geschlossenen Schleife sollten die oberen und unteren kreisbogenförmigen Bereiche wie eine Seitenlinie betrachtet werden, wobei es ohne Bedeutung ist, ob noch außerdem eine andere Seitenlinie unterhalb der am weitesten unten liegenden angeschlossen ist.
V. Anzahl der Aushöhlungen am linken Kantenbereich:
Dies bezieht sich in Verbindung mit Fig. 6 auf im linken Kantenbereich vorhandene Aushöhlungen, die mindestens 2 Bit tief und von einer mehr als 45° betragenden Neigung umgeben sind. Belanglos ist, ob die
Innenseite der Aushöhlung stufenförmig ausgebildet ist.
VI. Anzahl von Aushöhlungen am rechten Kantenbereich
Dies bezieht sich in Verbindung mit F i g. 7 auf Aushöhlungen am rechten Kantenbereich, die mindestens 2 Bit tief und zwischen mehr als 45" betragende Neigungen eingefügt sind, Innenkonturen dieser Hohlräß.ne sind ohne Bedeutung.
VII. Buckel am rechten Kantenbereich: Gemäß Fig. 8 gibt es folgende Unterscheidungsmöglichkeiten:
(0): kein Buckel;
(1): ein einfacher Buckel oder beliebig viele andere, nicht unter die letzte Unterklasse (2) fallende Buckel; und
(2): über einem Buckel befindet sich eine mindestens 2 Bit tiefe Aushöhlung, die keine Neigung nach links oben aufweist.
Nachstehend wird das erfindungsgemäße System der Zeichenerkennung beschrieben:
Fig. 10 enthält Systeme Ax bis A1 zur Extraktion der vorstehend definierten Merkmale I bis VII, deren Internzustand X sich bei Empfang einer von außen eingegebenen Übergangsanweisung Γ ändert. Mit anderen Worten: die Extraktionssysteme A1 bis A1 befinden sich zunächst in einem Zustand und verändern sich dann von X1 ~' nach X1 (wobei t = 1,2,3... 32 sein kann) bis zum internen Zustand X12.
Wie vorstehend erwähnt, wird ein zur Erkennung anstehendes Zeichenmuster in eine Matrix von 24 Bit χ 32 Bit eingeteilt. Von den Zeilen D1, D1, Dy.. Dn hat jede eine Breite von 24 Bit in Horizontalrichtung (vgl. Q„. Qh, Qc... in Fig. 1 beispielsweise), und zwei benachbarte Zeilen D' und D'~', die repräsentativ sind für einzelne Konturen und Relativpositionen zwischen ihnen, werden zur Bildung einer Übergangsanweisung P ausgewertet. Beispielsweise entsteht die Übergangsanweisung /l0 durch Auswertung der benachbarten Zeilen D9 und D10, welche Gestalt und Relation zwischen den Zeichenabschnitten L1 und L1 (Fig. 12a) ausweisen. Man beachte, daß gemäß einem wesentlichen Merkmal der vorliegenden Erfindung nur zwei benachbarte Zeilen D' und D' ~' ausgewertet werden, wenn die Übergangsanweisung Γ erzeugt wird.
Es gibt eine Unterscheidung zwischen einer ersten und zweiten Merkmalsgruppe bei einem Entwicklungsweg von Γ aus D' und D' ~'.
Bei der ersten Merkmalsgruppe wird die Informa- so tion D' für Zeile / gemäß Fig. 13 nach A, B und C klassifiziert, entsprechend der Anzahl η und der Länge / des auf dieser Zeile erscheinenden Abschnitts eines Schriftzeichens: A, wenn η = 1 und / relativ kurz ist; B, wenn η = 1 und / relativ lang; und C, wenn « = 2 ist. Ferner läßt sich die äußere Information P definieren nach der vorstehend erläuterten Klassifizierung von A, B und C sowie nich in Fi g. 14(A) aufgelisteten Symbolen V, I, D,... P, welche im wesentlichen davon abhängen, ob die Zeichenabschnitte auf den Zeilen t und / — 1 mit dem linken oder dem rechten Kantenabschnitt verbunden sind. In Fig. 14(A) ist die obere Hälfte jedes der Symbole V, I, D... mit dem Zeichenabschnitt der Zeile D' und die untere Hälfte mit dem Zeichenabschnitt auf Zeile D'~l belegt. Bei dem Beispie! von Fig. 12 ist P = LH, bezogen auf die Zeilen D9 und D10, und 7' = PR bezüglich der Zeilen D19 und D20.
Die zweite Merkmalsgruppe /' richtet sich nur nach der Relation der rechten oder linken Position zwischen D'und D'"1. Fig. 14(B)zeigt die Definition der Übergangsanweisungen P in bezug auf die Merkmalsgruppe V, während Fig. 14(C) die Definition der Übergangsanweisungen /' bezüglich der Merkmalsgruppen VI und VII wiedergibt. Gemäß Fig. 14(C) sind die Übergangsanweisungen P »R« wie bei Merkmalsgruppe V für das oben benutzte Beispiel in Fig. 12(a).
Nach Eingabe der Übergangsanweisungen /' in die Merkmalsextraktionssysteme A1-A1 ändern sich deren interne Zustände gemäß diesen Anweisungen P im Rahmen von Übergangsprozessen, die in den Fig. 15 bis 19 dargestellt sind. D.-c eingekreisten Zeichen oder Symbole betreffen jeweils den internen Zustand X, der aufgrund der Übergangsanweisung /' in Richtung auf einen Endzustand fortschreitet. Diese Übergänge ereignen sich niemals in einem oberen oder unteren freien Bereich, wo ein Zeichenabschnittsmuster steht.
Nachstehend wird der Übergang des Internzustands am Beispiel des Schriftzeichens »2« in Fig. 12 beschrieben: Die Übergangsanweisung für die Zeilen D7 und D8, nämlich das Symbol /* ist »H«, und dementsprechend ändert das Zeichenerkennungssystem A! gemäß der Anzahl von Schleifen seinen Internzustand von y0 nach yx, siehe Fig. 15. Das Zeichenerkennungssystem A1 für die Form der unteren Kantenbereiche ändert seinen Zustand gemäß Fig. 16 von y0 nach vH, und in ähnlicher Weise ändert das Detektorsystem A1 seinen Zustand von y0 nach v, (siehe Fig. 17), während die Detektorsysteme A5 und A6 im Zustand y0 verharren.
Nach Vollzug der neunten Zeilenabtastung sind die Übergangsanweisungen f bei »LH« angekommen, entsprechend den Symbolen der Zeichensegmente in den achten und neunten Zeilen. Das Zeichenerkennungssystem A1 bleibt im Zustand yx, der Inhalt von A 2 verbleibt bciyE.
Bei der Abtastung der neunten Zeile wird gemäß Fig. 14(C) »L« festgestellt, und das Zeichendetektorsystem A6 geht in den Zustand V1 über. Das Zeichen von Fig. 14(C) kommt nach der zehnten Zeile D10 zu »L« bei unverändertem Zustand yx. Das Zeichen von Fig. 14 (C) nach der elften Zeile D1I ist »R«, während das Symbol in Fig. 14(A) auf der elften Zeile Dn als »V« ausgewertet wird, so daß das Detektorsystem A3 nach V1 in Fig. 17 übergeht. Detektorsystem Aq verbleibt bei j,, während gegebenenfalls das Merkmalsdetektorsystem A6 beiyE gemäß Fig. 19 ankommt.
Ebenso verändern die Detektorsysteme A1 bis A1 ihre Zustände sequentiell. Sobald die höchste oder Abtastung der zwanzigsten Zeile beendet ist, werden gegebenenfalls die Detektorsysteme Ax bis A 7 in Zustände versetzt, welche den Formen von Fig. 29(a) entsprechen, worin A, sich iny, von Fig. 15, A2 inyE von Fig. 16, A 3 inyE von Fig. 17 usw. befindet.
Ein in F i g. 20 enthaltener Rechner 8 speichert eine in Fig. 29 dargestellte Kennzeichentabelle in codierter Form. Die Merkmalsdetektorsysteme Ax bis A1 senden zu dem Rechner 8 codierte Informationen ».« entsprechend der Anzahl von Schleifen, codierte Informationen »u« entsprechend der Form des unteren Kantenabschnitts, codierte Informationen »-1« entsprechend der Form des oberen Kanienabschnitts,» Jd « entsprechend der Form des linken Kantenabschnitts, und codierte Informationen »c{« entsprechend dem
rechten Kantenabschnitt. Unter Vergleich dieser codierten Informationen mit der im Rechner 8 gespeicherten Kennzeichentabelle gibt der Rechner 8 die Entscheidung aus, das fragliche Schriftzeichen ist die Ziffer »2« in Form von Ausgangssignalen für diese Ziffer »2«.
F i g. 20 enthält ein grundsätzliches Blockschaltbild für ein OCR- bzw. optisches Lesegerät gemäß der vorliegenden Erfindung. Eine aus einer Lichtquelle und einem optischen System bestehende Lesestation 1 beleuchtet einen Zeichenmuster enthaltenden Beleg 2, und das von dem Beleg 2 reflektierte Licht wird von einer photoelektrischen Schaltung 3 in elektrische Signale umgewandelt, welche über einen Analog-Digitalkonverter 4 in eine Abschnittaufbereitungsschaltung 5 eingegeben werden. Diese Schaltung 5 zerteilt Daten von einer Zeichenlänge in Form einer Matrix von 24 Bit Breite und 32 Bit Höhe, die dann in einen Speicher 100 eingegeben werden. Die so zerteilten Daten werden einer Vor-Verarbeitungsschaltung 6 zugeführt, mittels der isolierte Einzelbits entfernt und Abstände in Horizontal- und Vertikalrichtung mit dem Einzelbit nach Maßgabe der vorliegenden Erfindung ausgefüllt werden. Auf diese Weise werden Störspannungen unterdrückt.
Eine nachgeschaltete Merkmalextraktionsschaltung 7 dient der Gewinnung der eingangs erläuterten Merkmalsgruppen I bis VII aus den vorverarbeiteten Daten, und diese extrahierten Daten werden codiert. Der Rechner 8 entscheidet dann, ob eine Übereinstimmung besteht zwischen den codierten Merkmalen und der in einem Speicher 9 enthaltenen Kennzeichentabelle. Das Ergebnis dieser Entscheidung wird in einer Ausgabeeinheit 10 erstellt.
Einzelheiten der Merkmalsextraktionsschaltung 7 zeigt Fig. 21, die einen mit dem von Fig. 20 identischen Musterspeicher 100, einen Koordinatendetektor 200 zur Feststellung des Kantenabschnitts des Zeichenmusterabschnitts, eine Gruppe von Funktionseinheiten 300 zum Auslesen der Information auf den Zeilen D' und D' ~' (wiederholt, nur zwei Zeilen), ein Codeumsetzer 400 "im Codieren der Ausgänge der Funktionseinheiten 300 und zur Erzeugung der Übergangsanweisungen Γ und eine Gruppe von Referenzschaltungen 500 zum Verändern der internen Zustände auf Veranlassung der Übergangsanweisungen Γ gehören.
Gemäß F i g. 22 besteht der Musterspeicher 100 aus einer Serie von dreiunddreißig 24-Bit-Schieberegistern S0, S1, S2. ■ ■ S32 zum Abspeichern je einer Zeicheninformationszeile. Das heißt, der Musterspeicher 100 speichert die Musterinformation einer Matrix von 24 Bit χ 32 Bit im ganzen. In Fi g. 21 ist der Abspeichervorgang für die Ziffer»2« als Beispiel zugrunde gelegt. Das unterste Schieberegister S0 in Fig. 22 dient Hilfszwecken, beispielsweise dem Speichern von Leerinformation.
Die Information D' der Zeile t des Zeichenmusters aus der Abschnittaufbereitungsschaltung 5 wird in das Schieberegister S1 für die Teile t (/ = 1, 2, 3,...) im Speicher 100 eingegeben, wo die Information aufgrund eines Taktsignals in den Schieberegistern nach rechts wandert. Nach Eingang des vierundzwanzigsten Taktsignals wird die Information D' in dem speziellen Schieberegister S1 in das eine Stufe darunter sitzende Schieberegister S (t — 1) übertragen, und in diesem Moment wird die Information £>' der ersten Zeile in das Schieberegister S1 des Koordinatendetektors 200 und dann zum Schieberegister 5,, üb·;: tragen. Die Leermusterir'ormation Z?0 wird vom Schieheiegister S0 übernommen. 1st das vierundzw.'ivigste Taktsignal zum rweuen Mal eingegangen, gelangt die In-
formation D' in das Schieberegister S (t — 2) und die Information D2 für die zweitletzte Zeile wird dem Schieberegister S1 entnommen, während die Information D1 bezüglich der untersten Zeile aus dem Schieberegister S1) zum Koordinatendetektor 200 übertra-
gen wird. Sobald der Speicher 100 vicrundzwanzig
Taktimpulse zum dritten Mal empfangen hat, wird die Information des Ein-Zeichen-Bereichs aus dem Speicher 100 entnommen.
Der Ausgang von Schieberegister 5,, nämlich die Ausgangsinformation D' auf der Zeile ι geht in den ersten Koordinatendetektor 210 und der Ausgang von S0 oder die Information D'"1 von Zeile {t — 1) zum zweiten Koordinatendetektor 220. Der in Fig. 23 separat dargestellte erste Koordinatendetektor 210 be-
steht aus einem Flip-Flop 2Ü, einem Zähler 212 und einem Paar Verriegelungsschaltungen 213 und 214. Ein mit T bezeichnetes Signal personifiziert ein Bündel von vierundzwanzig Taktsignalen, siehe F i g. 27. Unmittelbar vor dem Taktsignal T wird ein Signal S erzeugt, und Flip-Flop 211 und Zähler 212 werden durch ein umgekehrtes Signa! S zurückgesetzt.
Bei dieser Anordnung zählt der Zähler 212 nach dem Rücksetzen von Zähler 212 und Flip-Flop 211 die mit T bezeichnete Anzahl von Taktsignalen. Der Zählwert von Zähler 212 zeigt die Bit-Positionen sämtlicher Zeilen-Schieberegister S0 bis S32, d. h. die Koordinatenpositionen, als Referenz vom linken Rand her betrachtet. Die Zeicheninformation D' auf Zeile/ wird dem Flip-Flop 211 und der Verriegelungsschaltung 214 eingegeben und das Flip-Flop
211 durch ein Signal gesetzt, welches dem linken Randabschnitt des Zeichenmusters zugeordnet ist. Dieses Setzsignal für Flip-Flop 211 geht zu einem Verriegelungseingang der Verriegelungsschaltung
214. Auf diese Weise wird der Zählwert des Zählers
212 bzw. der Koordinatenwen XL' der linken Randposition des Zeichenmusters fest in der Ven iegelungsschaltung 213 gespeichert. Wenn anschließend an das Ende des Zeichenmusters der Zeile / die Leerinformation kommt, bleibt Flip-Flop 211 wie es ist, und die Augenblickskoordinaten werden fest in der Verriegelungsschaltung 214 gespeichert. Wenn jedoch der Zeichenabschnitt auf der gleichen Zeile verschwindet und dann Leerinformation folgt, werden die Koordinaten
so in der Verriegelungsschaltung 214 weitergezählt. Das bedeutet, daß die Verriegelungsschaltung 214 bei den Koordinaten XR' des äußersten rechten Randabschnitts des Zeichenmusters verbleibt.
Andererseits wird der Ausgang des Schieberegisters S0 einem zweiten Koordinatendetektor 220 (Fig. 24) eingegeben, welcher dem ersten Koordinatendetektor 210 gleicht und ein Flip-Flop 221, einen Zähler 222 und ein Paar Verriegelungsschaltungen 223, 224 aufweist. Die Koordinatenposition XL'~X des linken
Randabschnitts der Zeicheninformation X)'"1 von Zeile (/ — 1) und die Koordinatenposition XR'~X vom rechten Randabschnitt sind beziehbar aus den Verriegelungsschaltungen 223 bzw. 224.
Die Daten D', D>~\ XL', XL'~X und XR'-1 sind erhältlich aus dem Speicher 100, und die ersten und zweiten Koordinatendetektoren 210 und 220 sind aufgeteilt unter die Funktionseinheiten 310a, 3106, 320a, 320A, 330, 340, 350, 360, 370 und 380, siehe
Fig. 2) und 25.
Die Funktionseinheit 310a, ist ein auf die Zeicheninformation D' der Zeile t reagierender Zähler, welcher entscheidet, aus wie vielen Abschnitten diese Zeivheninformation besteht. Ein Signal 5 (Fig. 27) setzt Zähler 310a zurück, und dieser setzt während eines Zeitraumes vom Leerabschnitt der auf Zeile / markierten Zeichenabschnitte den Zählvorgang fort. Er erzeugt die Anzahl n' von auf der η-ten Zeile vorhandenen markierten Abschnitte. Die Funktionseinheit HOb ist der vorstehenden Funktionseinheit 310a ähnlich und erzeugt die Anzahl /V~' von auf Zeile (n - 1) vorhandenen markierten Abschnitten.
' Die Funktionseinheit 320a führt mit Hilfe einer Differentialschaltung 321 an der rechten Kantenposition XR' und der linken Kantenposition XU eine Subtraktion durch, berechnet die Länge des (markierten) Zeichenabschnitts auf der Zeile /, und ein Komparator 322 vergleicht die resultierende volle Länge des Zeichcnabschniils mit einem gegebenen Wert (beispielsweise 8 Bit) und erzeugt den Ausgang »1«, wenn letzterer kleiner als ersterer ist.
Die Funktionseinheit 3206 erzeugt den Ausgang »1«. wenn die volle Länge des Zeichenabschnitts auf Zeile (/ - 1) größer ist, während die linken und rechten Kantenabschnitte XL' ~' und XR''' betrachtet werden.
Die Funktionseinheit 330 besteht aus einem Zähler 332, welcher die Anzahl von markierten Zeichenpositionen in dem Falle zählt, daß die Information D' auf Zeile / und die Information D'~] auf Zeile (/ — 1) durch ein ODER-Gatter 331 kombiniert werden. Das Zählerergebnis ist mit C bezeichnet.
Die Funktionseinheit 340 ist eine Operationsschaltung 341, welche als Eingänge die linken und rechten Kantenpositionen XL' und XR' aufnimmt und die mit einem mittels eines Komparator 362 erstellten Wertes verglichen. Dieser Komparator 362 gibt den Ausgang EL = »1« ab, wenn beide linken Kantenabschnitte mehr als einen vorgegebenen Wert (beispielsweise 2 Bit) voneinander entfernt bleiben. Wenn nicht, lautet der Ausgang EL = »0«.
Die Funktionseinheit 370 erzeugt einen Binär-Codewert SR, der Aussagen zu den rechten Kanfenabschnitten der Zeichenabschnitte der Zeilen t bzw. (t - 1) zuläßt. Dieser Wert SR kann folgende Werte annehmen:
Operation
XR1 + XL'
ausführt, um die Mittelkoordinaten der Zeichenabschnitte der Zeile / zu berechnen. Während das Ergebnis einem Komparator 342 zugeführt wird, führt eine Operationsschaltung 343 den
Y Dt - 1 ι YTJ - I
Rechenvorgang ^ , das sind die Mittelkoordinaten der Zeichenabschnitte auf der Zeile (/ - 1). Dies Ergebnis geht in den Komparator 342, und dieser gibt ein Ausgangssignal
RIL = »1« ab, wenn
2 2
ist, nämlich wenn die Mittelkoordinaten der Zeichenabschnitte der Zeile / rechts von denjenigen der Zeile (f - 1) liegen. Wenn nicht, gibt der Komparator 342 den Ausgang R/L = 0 ab.
Die Funktionseinheit 350 erzeugt einen Binär-Codewert SL, welcher aussagt, welcher sich auf dem rechten und welcher sich auf dem linken Randabschnitt des Zeichenabschnitts der Zeile t oder der Zeile (/ — 1) befindet. SL kann folgende Werte annehmen:
{00 (wenn XL' = AT'"1)
10 (wenn XL' < XL'^)
11 (wenn AX' > XL'"1).
Die Funktionseinheit 360 spricht an auf die linken Kantenpositionen XL' und AT'-' der Zeilen t und (/ — 1), während eine Operationsschaltung 361 die Absolutwerte des Unterschieds zwischen diesen beiden Eingängen errechnet. Das Rechenergebnis wird SR =
00 (wenn AT?' = AT?1"1) 10 (wenn AT?' < AT?-1) U (wenn XR' > XR'-*).
Ähnlich wie Funktionseinheit 360 erzeugt Funk tionseinheit 380 ein Signal ER = »1«, wenn beide rechten Kantenabschnitte mehr als um einen gegebe-ηεη Wert voneinander entfernt sind, ist der Abstand kleiner als der gegebene Wert, ist das Signal ER = »0«.
Die Ergebniswerte N', JV'-1, L', L'~\ C. R/L, SL. EL, SR und ER der Funktionsgeneratoren 310 bis 380 werden dem Codeumsetzer 400 zugeführt, der als PLA (Programmable Logic 4rray) mit 13-Bit-Eingang und 7-Bit-Ausgang ausgeführt ist. Dieser Umsetzer wandelt die Eingänge in die Übergangsanweisungen T von 4 Bit gemäß der in F i g. 6 dargestellten
Übersicht um. Die restlichen drei Bit-Ausgänge bilden Steuersignale F0, F1 und F2.
In Fig. 26 wird das 2-Bit-Signal N' dargestellt durch /V/ und /V0', und die obere Hälfte der Musterkolonne zeigt das Zeichenmuster der Zeile t, während
die untere Hälfte dasjenige der Zeile (/ — 1) enthält. In der Kolonne für die Übergangsanweisungen Γ sind die zugeordneten Ausgangscodes von 4 Bit und Symbole dargestellt. In der Eingangskolonne zeigt ein freier Raum an, daß ein Bit entweder »0« oder »1« lauten kann.
Nachstehend werden die Beziehungen zwischen den vorstehend beschriebenen Funktionen am Beispiel der dritten und zweiten Zeile des Musters »2«, siehe Fig. 22, beschrieben. Dabei ist die Information D3 auf der dritten Zeile (Information im Schieberegister S3) die folgende:
Summe der Anzahl von Zeichenabschnitten der dritten Zeile /V3 =10
Summe der Anzahl von Zeichenabschnitten der zweiten Zeile /V3 =01
Die Anzahl der Zeichenabschnitte, wenn aus den zweiten und dritten Zeilen zusammengesetzt C =10
Vergleich zwischen den Mittelabschnitten der Zeichenabschnitte auf den Zeilen / und (r - 1) RjL = 1.
Demgemäß lauten die Übergangsanweisungen Γ eo 1100 (das Symbol ist PL) eemäß der Übersicht in Fig. 26.
Zeigt die Information D' eine Leerstelle, wird /V = 00 mit 9 Signal F0 erzeugt. Falls die Information D' drei separate Abschnitte aufweist, dann ist N1 = 11 mit der Erzeugung eines Signals F1. Falls das Eingangssignal nicht unter die erwähnte Übersichtstabelle fallt, wird ein Signal F2 erzeugt Mit Hilfe dieses Signals F2 stellt der Rechner 8 fest, daß das fragliche
Zeichenmuster unlesbar ist, es wird zurückgewiesen und der Leseprozeß angehalten.
Das Signal F0 wird an den oberen und unteren Leerabschnitten erzeugt, wo keine markierten Zeichenabschnitte vorhanden sind. Wird das Signal F0 am unteren Leer&tachnitt erzeugt, wird eine Tabellenreferenzschaltung 500 so lange nicht aktiviert, bis dieses Signal F0 verschwindet. Angenommen, daß dieser Nicht-Zeichen-Abschnitt dem Ende des Zeichenabschnitts folgt und dann das Signal F0 erzeugt wird, wird die Tabellenfrequenzprozedur unterbrochen und die internen Zustände der TabellenreferenzschaltungSOO bleiben wie sie sind. Wenn zusätzlich der Zeichenabschnitt in zwei Teile aufgetrennt ist, und das Signal F0 bei einer solchen Unterbrechungsperiode auftritt, unterbricht der Rechner 8 sofort seinen Erkennungsprozeß und weist das betreffende Zeichenmuster zurück.
Das Signal F1 entsteht in der Nachbarschaft der Mitte von Zeichen wie »9« und »6« (siehe F i g. 43). Dieses Signal F, wird gewöhnlich erzeugt, wenn der Zeichenabschnitt eine natürliche Horizontallinie oder eine etwas modifizierte Ausführung davon ist. Es ist erwünscht, solche Zeichenabschnitte, wo das Signal F, erzeugt wird, so in Vertikalrichtung zu verschieben, daß eine horizontale Linie entsteht. Dies läßt sich mit Hilfe einer in Fig. 45 dargestellten Schaltung verwirklichen. Unterhalb von Schieberegister S0 befindet sich ein zusätzliches Schieberegister S0', welches den Ausgang D1'' erzeugt Ist das Signal F, niedrig, ist ein UND-Glied g, geschlossen und der Ausgang eines ODER-Glieds g2 gleich D*"', wie der Ausgang von S0 ■ S0' erhält diese Ausgänge. Ist dagegen das Signal F, hoch, dann ist das UND-Glied offen und der Ausgang des ODER-Glieds g2 ist Ergebnis der ODER-Verknüpfung von &-' V D1'1, und dies wird dem zusätzlichen Schieberegister S0 eingegeben.
«Angenommen, das Signal F, wird erzeugt, weil D' drei separate Zeichenabschnitte hat. Zu diesem Zeitpunkt ist die Schaltung aufnahmefähig für das nächste Taktsignal, siehe Fig. 46. Zu Beginn der Abtastung ist der Ausgang von Schieberegister S1 gleich Ω1'' und der Ausgang des ODER-Glieds g2 gleich D' VD-1VD'- 2, weil das UND-Glied g, offen ist. Diese Ausgänge werden dann S0 zugeführt, das Resultat zeigt Fig. 46(B).
Angenommen, Z)*"1 hat drei separate Abschnitte D(I1 + 1), D(I, + 2)....D(I2 - 1), (I2 > I1) unter gleichzeitiger Erzeugung des Signals F1, wobei D'2 nicht die Erzeugung des Signals F1 veranlaßt, dann wird die ODER-Logikoperation in einer Sequenz durchgeführt, welche mit D11 beginnt. Wenn D'2 kommt, ist der Ausgang des ODER-Glieds g, gleich £>'-' VD(I, + I) V...VD(I2 + 1). Der Erfolg ist, daß diese drei Abschnitte sequentiell mit der darunterliegenden Zeile zusammengefaßt werden. Zwischenzeitlich wird die Tabellenreferenzschaltung nicht aktiviert, so daß diese drei Abschnitte des Musters zum Zwecke der erleichterten Analyse in Vertikalrichtung verschoben werden. In diesem Abschnitt ist Z)'~' immer ersetzt durch den Ausgang des ODER-Glieds g2 (wobei aus der Übersichtstabelle hervorgeht, daß F, nur von D1 abhängig ist).
Gleichzeitig wird die Anzahl von Signal F, gezählt und, sobald es öfter als siebenmal gezählt wurde, unterbricht der Rechner 8 den Erkennungsprozeß unmittelbar und erklärt, daß das untersuchte Zeichenmuster ein zurückweisendes ist.
Die Tabellenreferenzschaltung 500 besteht aus mehreren Unterschaltungen 510, 520, 530 und 540, bezogen auf die erste Merkmalsgruppe und mehreren Unterschaltungen 550, 560 und 570 unter Bezugnähme auf die zweite Merkmalsgruppe. Die Schaltungen 510, 520, 530, 540 erhalten über den Codeumsetzer 400 die Übergangsanweisungen Γ von 4 Bit umgewandelt. 550 besteht aus 3 Bit der zusammengefaßten Ausgänge der Funktionseinheiten 350 und
ίο -360 oder den kombinierten Signalen SL und IL vom Unken Kantenabschnitt des Zeichenmusters, während die Schaltungen 560 und 570 3 Bit der kombinierten Signale SR und ER, bezogen auf den rechten Kantenabschnitt des Zeichenmusters, sind.
Jede der in Fig. 28 dargestellten Tabellenreferenzschaltungen besteht aus je emem Festspeicher (ROM) 501 von 4 χ 256 Bit, einer Verriegelungsschaltung 502, einem Puffer 503 und einem UND-Glied 504. Der Festspeicher 501 enthält Programme
entsprechend den Obergangsdarstellungen der Fig. 15 bis 19. Die oberen Adressen A4 bis A1 der Eingänge des Festspeichers 501 sind X1''' auf der (i - 1 )tcn Zeile, während die unteren Adresse« A0 bis A) die Information I' erhalten, welche zur Men Zeile gehört, und der Ausgang wird in X1 verwandelt. Bei Anlegen des Taktsignals TR erhält und verriegelt die Verrisgelungsschaltung 502 den Ausgang X1 des Festspeichers 501. Die oberen Adressen des Festspeichers zeigen X1, und der interne Zustand ändert sich von X-' nachr.
Innerhalb der Tabellenreferenzschaltung wird die Verriegelungsschaltung 502 erstmals mit Erhalt des Signals FS mit X3 = 0000 verriegelt. Nach Abtastung von D1 werden die diesem Wert entsprechenden Obergangsanweisungen in den Festspeicher 501 eingegeben. Dessen obere 4 Bit werden mit dem Ausgang der Verriegelungsschaltung 502 oder X" abgegeben. Der Ausgang des Festspeichers 501 gemäß den empfangenen Übergangs- bzw. Übertragungsanweisungen T1.
Schließlich werden die Übertragungsanweisungen P auf der Zeile in den Festspeicher 501 eingegeben, und dessen Ausgang ist X1, welcher wiederum der Verriegelungsschaltung 502 nach Empfang des Taktsignals TR zugeführt wird. Jedesmal bei Empfang der
Übertragungsanweisung P wird der Ausgang des Festspeichers 501 übertragen. Schließlich wird X*1 erreicht, und dieser Ausgang wird dem Speicher 8 von F i g. 2 über den Puffer 503 zugeleitet.
Wenn im Betrieb das Signal F0 oder F1 beispielsweise auf D10 erzeugt wird, schließt das UND-Glied 504. so daß kein Taktsignal TR zur Verriegelungsschaltung 502 gelangen kann. Damit werden X9 = A"0 und die Übertragungsanweisungen /l0 überspielt.
Der Rechner 8 speichert die Kennzeichentabelle füi das in F i g. 29 dargestellte Beispiel zum Vergleich mil den entsprechenden Merkmalsgruppen I bis VII de: zu identifizierenden Zeichenmusters. Die für die abschließenden übertragungszustände A"J der entspre chenden Tabellenreferenzschaltungen 510...530 re präsentativen Codes werden zum Zwecke der Zei chenidentifizierung mit der Kennzeichentabelle ver glichen. Stimmen die Daten der entsprechendei Tabellenreferenzschaltungen beispielsweise mi Fig. 29a überein, dann entscheidet der Rechner 8 daß das fragliche Zeichenmuster die Ziffer »2« ist.
Zwar sind die entsprechenden Merkmale in Forn der in Fig. 29 dargestellten Konturen gespeichert
aber tatsächlich ist die Kennzeichentabelle in Form ihrer zugeordneten Code-Kennung innerhalb des Rechners 8 gespeichert, vgl. Fig. 30 und 31. Stimmen die Ausgangscodes der entsprechenden Tabellenreferenzschaltungen 510...570 mit den im Rechner 8 gespeicherten Codes überein, wird das entsprechende Zeichen erkannt und ausgegeben.
Ein weiteres bevorzugtes Ausführungsbeispiel der Erfindung zeichnet sich dadurch aus, daß alle Zeichenmuster charakterisiert sind durch die Anzahl von Schleifen, die Anzahl von Seitenlinien, die Anzahl von Einbuchtungen und Vorsprüngen am oberen Rand, am unteren Rand, am linken Randabschnitt, am rechten Randabschnitt, und durch die Anzahl von Buckeln am linken und rechten Randabschnitt. Mit dem Ausdruck »Einbuchtung« sind hier Vertiefungen im Zeichenmuster gemeint, deren Tiefe eine gegebene Bit-Anzahl übersteigt. In ähnlicher Weise haben Vorsprünge eine gewisse Höhe von mehr als einer Anzahl Bit auf beiden Seiten und ihre Breite ist geringer als eine gewisse Anzahl Bit. Auch Buckel erstrecken sich über eine Länge von mehreren Bit.
Die Anzahl der Schleifen, der Seitenlinien, der Vorsprünge und dergleichen wird in gleicher Weise wie beim vorstehenden Ausführungsbeispiel abgetastet. Gemäß F i g. 32 bis 35 zählt man die Anzahl der Einbuchtungen in der Weise, daß ein Abstand von einer Referenzlinie zu dem Zeichenabschnitt von Zeile zu Zeile abgestastet und Änderungen von diesen Abständen festgestellt werden. Die gleiche Methode ist anwendbar auf Vorsprünge und Buckel.
Bei der Feststellung von Einbuchtungen und dergleichen im Zeichenmuster wird dieses zuerst in Horizontalrichtung abgestastet, um Positionsdaten in Horizontalrichtung zu erhalten, und dann erfolgt eine Abtastung in Vertikalrichtung, wobei man vertikale Richtungsdaten erhält.
Eine in Fig. 36 dargestellte Schaltung analysiert pro Zeile oder Kolonne das bei der vorstehend geschilderten Methode gewonnene Zeichenmuster unter Verwendung eines Speichers 600 von 24 Bit χ 32 Bit, wie beim ersten Ausführungsbeispiel.
Eine AdreßsteuerschaltungoOl steuert sauber die Adressen des Speichers 600. Bei der ersten Abtastung wird der Speicher 600 Zeile für Zeile abgetastet, beginnend beim untersten Randabschnitt des Zeichenmusters, um Zeichendaten in Horizontalrichtung abzugeben. Bei der zweiten Abtastung des Zeichenmusters erfolgt dies Kolonne für Kolonne, beginnend beim linken Randabschnitt, um Zeichendaten der Vertikalrichtung abzugeben.
Ein Zähler 602 nimmt die Zeicheninformation vom Speicher 600 auf und wird nach jeder Zeile zurückgesetzt, to daß die Anzahl -V der markierten Zeichenabschnitte auf Zeile / gezählt werden.
Ein Puffer 603 speichert die 1-Zeilen-Information oder 1-Kolonnen-Information des Speichers 600 und sendet die Information der C - l)ten Zeile oder der (; - 1 )ten Kolonne ab. während der Speicher 600 die Information der Zeile / oder Kolonne / abgibt. Die Ausgänge von Speicher 600 und von Puffer 603 werden über ein ODER-Glied 604 ir. einen Zähler 605 eingegeben, welcher den Zählwert C der Zeichenabschnitte der /-ten und der (/ - l)ten Zeilen errechnet.
Ein erster Koordinatenspcicher 606 behält die beiden Randabschnitte der Zeichenabschnitte der /-ten Zeile oder /-ten Kolonne (die Links- und Rechts-Koordinate XL' und XR' für die Zeileninformation und die oberen und unteren Koordinaten YV und YD' für die Kolonneninfonnation). Ein zweiter Koordatenspeicher 607 behält die beiden Randkoordinaten XL'-\ XR'-\ YW-* und YD''1 der Zeichenabschnitte der (/ — l)ten Zeile oder der (/ — l)ten Kolonne. Diese Koordinatenspeicher 606 und 607 sind in Konstruktion und Betrieb dem Koordinatendetektor 200 von Fig. 25 ähnlich, sie enthalten ein Flip-Flop 607, einen Zähler 609 und ein Paar Verriegelungen 610 und 611.
Die Koordinatenspeicher 606 und 607 erstellen die Koordinateninformation des Zeichenabschnitts in
t5 Zeilenrichtung, während der Speicher 600 bei der ersten Abtastung ist und die Koordinateninformation der Kolonnenrichtung bei der zweiten Abtastung erstellt.
612 unterscheidet nach den Ausgängen AU der Verriegelungen 610 und 611, ob die Länge des Zeichenabschnitts 7 Bit oder mehr beträgt. Das Ergebnis wird ausgegeben durch einen Binärwert:
1 (wenn L' ä
2 (wenn L' <
) 7)
Eine Operationsschaltung 613 errechnet einen Differenzwert DXL zwischen dem linken Randabschnitt des Zeichenabschnitts auf der Zeile / und dem Gegenstück auf der Zeile (/ — 1) und erzeugt in Fi g. 41 dargestellte Bit-Codes DX1 entsprechend der Korrelation zwischen den linken Randabschnitten der Zeilen / und (/ — 1). Eine Operationsschaltung 614 errechnet einen Differenzwert zwischen der linken Randposition und der rechten Randposition des Zeichenabschnitts auf der Zeile (/ — 1). Dies ähnelt der Operationsschaltungen. Einzelheiten von DXR sind aus F i g. 38 zu entnehmen.
Die Operationsschaltungen 613 und 614 sind abhängig von den Ausgängen der Koordinatenspeicher
606 und 607, und sie erzeugen Codes D YD und D YU als Repräsentativwerte für die oberen und unteren Koordinaten von F i g. 39 und 40.
Diese Operationsergebnisse werden Tabellenreferenzschaltungen 703 bis 714 zugeführt, von denen jede, wie Fig.41 zeigt, aus einem Festspeicher (ROM) 701 und einer Verriegelungsschaltung 702 besteht. Diese Schaltungen reproduzieren die jeweiligen Merkmale wie Anzahl der oberen und unteren
so Einbuchtungen und dergleichen. Die·^ Merkmale oder Kennzeichen werden codiert und dem Rechner 8 zugeführt. Dieser snthält die in Fig. 42 dargestellten Kennzeichentabel'e und vergleicht diese Kennzeichencodes mit der Tabelle, um die Zeichenerkennung durchzuführen.
Bei allen zuvor besprochenen Ausführungsbeispielen werden die erste und die zweite Abtastung in enger Beziehung zueinander durchgeführt. Es sei erwähnt, daß die Symbole V, I. D usw. der Musterinformation
«ο nicht notwendigerweise auf die Fig. 14(A) bis 14(C) begrenzt sind.
Selbstverständlich beschränkt sich die Erfindung nicht auf die beschriebenen und dargestellten Ausführungsbeispiele, vielmehr sind im Rahmen der Er(In-
M dung, abgesteckt durch die Patentansprüche, zahlreiche Abwandlungen möglich.
Hierzu 24 Blatt Zeichnungen

Claims (3)

Patentansprüche:
1. Einrichtung zum Erkennen von Schriftzeichen, bei der ein ein Schriftzeichen aufweisendes Bildfeld nach zeilenweiser Abtastung digitalisiert in einer Bildmatrix gespeichert und zonenweise auf das Vorliegen vorbestimmter zweizeiliger Formenelemente untersucht wird, mit einer Merkmalextraktionsschaltung (T), in der eine bei der zonenweisen Untersuchung ermittelte Folge von Formenelementen mit Hilfe eines als Nachschlagetabelle dienenden Speichers ausgewertet wird und durch die für jede Abtastzeile (D') den jeweiligen Formenelementen (V, I, D, LH, RH usw.) zugeordnete Übergangsanweisungen (T) erzeugt werden, dadurch gekennzeichnet, daß die Übergangsanweisungen (F) den Eingängen mehrerer, verschiedenen Zeichenmerkmalen (I bis VII) zugeordsuen Merkmalsdetektoren (510, 520, 530, 540, 550, 560,570) zugeführt werden, die jeweils eine an sich bekannte Schaltung aus einem mit seinem Ausgang an jeweils einen Zwischenspeicher (502) angeschlossenen Festwertspeicher (501), dessen erste Adresseneingänge (AA bis AT) mit dem aus der vorherigen Abtastzeile (D''') gewonnenen Inhalt des Zwischenspeichers (502) und dessen zweite Adresseneingänge (AO bis A3) mit der jeweiligen Übergangsanweisung (Γ) beaufschlagt sind aufweisen, und daß nach Auswertung der ge-'%mten Bildmatrix die Inhalte der Zwischenspeicher (502) der Merkmalsdetektoren (510 bis 570) die Eingangsgrößen für die Nachschlagetabelle (9) zur Bestirr-muni» des abgetasteten Schriftzeichens darstellen.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß fünf Merkmalsdetektoren für fünf Merkmale, und zwar für die Anzahl geschlossener Zeichenmusterschleifen, sowie die Formen von Unterkante, Oberkante sowie rechter und linker Seitenkante vorliegen.
3. Einrichtung nach Anspruch 1, dadurch fekennzeichnet, daß sieben Merkmalsdetektoren für sieben Merkmale, und zwar für die Anzahl der geschlossenen Zeichenmusterschleifen, die Form der unteren bzw. der oberen Kante, die Verbindung mit einer Seitenlinie, die Anzahl von Löchern oder Aushöhlungen in der linken bzw. der rechten Kante und für die Feststellung von Randvorsprüngen in der rechten Kante vorliegen.
DE2822458A 1977-05-23 1978-05-23 Einrichtung zum Erkennen von Schriftzeichen Expired DE2822458C2 (de)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP52059589A JPS5811662B2 (ja) 1977-05-23 1977-05-23 文字図形認識方式
JP52060117A JPS5816218B2 (ja) 1977-05-24 1977-05-24 文字図形認識方式における水平線分検出法
JP52060115A JPS5811663B2 (ja) 1977-05-24 1977-05-24 文字図形認識方式
JP6011677A JPS53145425A (en) 1977-05-24 1977-05-24 Error preventing system for character recognizing device
JP6143377A JPS53145527A (en) 1977-05-25 1977-05-25 Vertical line detecting method for character pattern recognition system
JP6143477A JPS53145528A (en) 1977-05-25 1977-05-25 Character pattern recognition system
JP52061435A JPS607316B2 (ja) 1977-05-25 1977-05-25 文字図形認識方式における突起部分の検出法
JP7597477A JPS5410640A (en) 1977-06-24 1977-06-24 Character recognition system

Publications (2)

Publication Number Publication Date
DE2822458A1 DE2822458A1 (de) 1979-01-25
DE2822458C2 true DE2822458C2 (de) 1983-11-03

Family

ID=27572509

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2822458A Expired DE2822458C2 (de) 1977-05-23 1978-05-23 Einrichtung zum Erkennen von Schriftzeichen

Country Status (1)

Country Link
DE (1) DE2822458C2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3804450A1 (de) * 1987-02-20 1988-09-01 Hitachi Ltd Verfahren zur konturabtastung und anordnung dafuer
DE4229479A1 (de) * 1991-09-04 1993-03-11 Ricoh Kk Verfahren zum darstellen eines bildes in einem erkennungssystem

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4177448A (en) * 1978-06-26 1979-12-04 International Business Machines Corporation Character recognition system and method multi-bit curve vector processing
US4404542A (en) * 1980-12-05 1983-09-13 Rca Corporation Digital sequence detector
DE3236336A1 (de) * 1982-09-30 1984-04-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung
FR2662835B1 (fr) * 1990-05-29 1992-08-21 Dupont Francois Appareil de detection de formes dans une image en temps reel.
CA2057412C (en) * 1990-12-12 1996-01-30 Eberhard Kuehl Character recognition system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1180290A (en) * 1966-10-31 1970-02-04 Tokyo Shibaura Electric Co Apparatus for Recognising a Pattern
BE756866A (fr) * 1969-09-30 1971-03-30 Siemens Ag Procede pour l'identification automatique de caracteres alphanumerique
JPS5215235A (en) * 1975-07-26 1977-02-04 Fujitsu Ltd Character recognition unit

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3804450A1 (de) * 1987-02-20 1988-09-01 Hitachi Ltd Verfahren zur konturabtastung und anordnung dafuer
DE4229479A1 (de) * 1991-09-04 1993-03-11 Ricoh Kk Verfahren zum darstellen eines bildes in einem erkennungssystem

Also Published As

Publication number Publication date
DE2822458A1 (de) 1979-01-25

Similar Documents

Publication Publication Date Title
DE1549930C3 (de) Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen
DE2431451C3 (de) Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE2264090C3 (de) Datenverdichtung
DE2432129A1 (de) Verfahren und vorrichtung zum erkennen von schriftzeichen, namentlich von ziffern
DE2557553A1 (de) Verfahren und anordnung zur bilddatenverdichtung und -reexpansion
DE1095026B (de) Verfahren zur Identifizierung von Informationen
DE2540101C2 (de) Verfahren zum automatischen Erkennen von Zeichen mittels eines optischen Zeichenlesers
DE10025332A1 (de) Verfahren zum Lesen eines zweidimensionalen Barcodes
DE3315108A1 (de) Musterdiskriminator
DE2740483A1 (de) Merkmal-detektor
DE2220693C3 (de) Verfahren und Einrichtung zum Trennen von in einem Abtastbildbereich vorhandenen, miteinander nicht verbundenen Teilbildern
DE3322443A1 (de) Mustererkennungsvorrichtung
DE2147896A1 (de) Einrichtung zur erfassung graphischer symbole und mit dieser einrichtung arbeitendes abtastgeraet
DE2728889B2 (de) Verfahren und Vorrichtung zum Übertragen eines Zweipegel-Faksimilesignals
DE2829808A1 (de) Verfahren und vorrichtung zum lesen von zeichen
DE2822458C2 (de) Einrichtung zum Erkennen von Schriftzeichen
DE3524505A1 (de) Bilderkennungsvorrichtung
DE2749222A1 (de) Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen
DE2103480A1 (de) Dateneingabevorrichtung fur Daten verarbeitungsanlagen
DE2159307A1 (de) Verfahren und schaltung zur durchfuehrung dieses verfahrens zur zentrierung eines in die auswerteinrichtung einer zeichenerkennungsmaschine eingegebenen zeichens
DE102018128696A1 (de) Programmvergleichsvorrichtung und Programmvergleichsverfahren
DE2119555A1 (de) Gerät zum Erkennen graphischer Symbole
DE2453086C3 (de) Anordnung zum Erkennen gedruckter chinesischer Schriftzeichen
DE2718569A1 (de) Verfahren und anordnung zum erkennen gedruckter zeichen

Legal Events

Date Code Title Description
OAP Request for examination filed
OD Request for examination
D2 Grant after examination
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Free format text: PATENTANWAELTE MUELLER & HOFFMANN, 81667 MUENCHEN

8339 Ceased/non-payment of the annual fee