DE3716787A1 - Zeichenerkennungsverfahren - Google Patents

Zeichenerkennungsverfahren

Info

Publication number
DE3716787A1
DE3716787A1 DE19873716787 DE3716787A DE3716787A1 DE 3716787 A1 DE3716787 A1 DE 3716787A1 DE 19873716787 DE19873716787 DE 19873716787 DE 3716787 A DE3716787 A DE 3716787A DE 3716787 A1 DE3716787 A1 DE 3716787A1
Authority
DE
Germany
Prior art keywords
character
pixels
codes
character image
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19873716787
Other languages
English (en)
Other versions
DE3716787C2 (de
Inventor
Gen Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP61114042A external-priority patent/JPS62269286A/ja
Priority claimed from JP61249159A external-priority patent/JPS63103392A/ja
Priority claimed from JP61251537A external-priority patent/JPH0795335B2/ja
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE3716787A1 publication Critical patent/DE3716787A1/de
Application granted granted Critical
Publication of DE3716787C2 publication Critical patent/DE3716787C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

Die vorliegende Erfindung bezieht sich auf ein Zeichenerkennungsverfahren und speziell auf ein Verfahren zur Erkennung eines Zeichens durch veränderliche Unterteilung eines Zeichenbereiches, in welchem ein zu erkennendes Zeichen angeordnet ist. Die vorliegende Erfindung bezieht sich weiterhin auf ein Verfahren zur Unterteilung eines Zeichenbereiches zur Verwendung bei der Zeichenerkennung.
Bei der maschinellen Erkennung von handgeschriebenen, maschinengeschriebenen oder gedruckten Zeichen wird das zu erkennende Zeichen zunächst von einem Abtaster optisch gelesen, d. h. abgetastet, um ein binäres Abbild des Zeichens zu definieren, und anschließend wird ein Zeichenbereich, der darin das so definierte binäre Abbild enthält, in eine Mehrzahl von Unterbereichen unterteilt, woran sich das Extrahieren von Merkmalen für jeden der Unterbereiche anschließt. Bei der bekannten Zeichenerkennungstechnologie wurde die Bereichsunterteilung unter Verwendung fester Unterteilungspunkte ausgeführt, wie in der JP-OS 56-110 191 beschrieben, oder durch variable Bestimmung von Unterteilungspunkten, wobei ein Schwerpunkt der Konturverteilung des zu erkennenden Zeichens verwendet wird, wie in "Oki Electric Research and Development", Dezember 1983, 121, Band 50, Nr. 3. Seite 77 bis 82, beschrieben. Bei dem erstgenannten Verfahren hat sich jedoch gezeigt, daß die festen Unter-Unterteilungspunkte häufig ungeeignet sind, da in einem zu erkennenden Zeichen Verformungen vorhanden sind, so daß Zeichenmerkmale nicht richtig extrahiert werden konnten, wodurch die Zeichenerkennungsfähigkeit herabgesetzt wurde. Das Verfahren mit solchen Festpunkten für die Unterteilung ist daher nicht geeignet, Verformungen in den zu erkennenden Zeichen Rechnung zu tragen. Das zweitgenannte Verfahren, das den Schwerpunkt eines Zeichens verwendet, ist auf Zeichenverformungen weniger empfindlich. Der für die Unterteilungen eines Zeichenbereiches erforderliche Berechnungsaufwand ist jedoch enorm, da dieses Verfahren den Schwerpunkt der Konturverteilung des Zeichens verwendet, so daß dieses Verfahren im allgemeinen sehr langsam abläuft.
Um die oben beschriebenen Probleme zu überwinden, ist bereits ein Zeichenerkennungsverfahren vorgeschlagen worden, das in der japanischen Patentanmeldung 59-217 716 seinen Niederschlag gefunden hat und die meisten der oben beschriebenen Nachteile beseitigt. Dennoch bleiben noch immer Forderungen zu erfüllen, die sich aus der Unterscheidung einander ähnlicher Zeichen und der Erkennung verformter Zeichen oder gedruckter oder handgeschriebener Zeichen geringe Qualität ergeben.
Der Erfindung liegt daher die Aufgabe zugrunde, die Nachteile des oben beschriebenen Standes der Technik zu überwinden und ein verbessertes Zeichenerkennungsverfahren anzugeben, das in der Lage ist, auch schlecht dargestellte, insbesondere verformte Zeichen zu erkennen.
Diese Aufgabe wird durch die im Anspruch 1 angegebene Erfindung gelöst. Weitere, dasselbe Lösungsprinzip verfolgende Lösungen sind Gegenstand der Ansprüche 12, 27, 43 und 47. Vorteilhafte Ausgestaltungen derselben sind Gegenstand der jeweils abhängigen Ansprüche.
Gemäß einem Aspekt der Erfindung wird ein zu erkennendes Zeichen zunächst optisch gelesen, um ein binäres Zeichenabbild zu erzeugen, das anschließend einer Zeilenverbreiterung unterzogen wird, um die das Zeichen bildenden Zeilen zu verbreitern. Anschließend werden mehrere Richtungs- oder Bündelungskodes der Kontur des Zeichenbildes selektiv zugeordnet und das Zeichenbild mit den zugeordneten Richtungskodes wird abgetastet, um diese Richtungs- oder Bündelungskodes zu berechnen. Basierend auf den berechneten Ergebnissen werden dann Unterteilungsstellen bestimmt, und das Zeichenabbild wird unter Verwendung dieser Unterteilungsstellen unterteilt. Dann wird ein Merkmal, wie beispielsweise ein Histogramm für jeden der Richtungskodes, aus jedem der unterteilten Bereiche extrahiert. Sodann werden die extrahierten Merkmale mit den für bekannte Zeichen in einer Bibliothek gespeicherten Merkmalen verglichen, um automatisch die Identität des zu erkennenden Zeichens zu ermitteln.
In Übereinstimmung mit einem anderen Aspekt der vorliegenden Erfindung ist ein Zeichenerkennungsverfahren vorgesehen, gemäß welchem mehrere Richtungskodes selektiv der Kontur eines binären Zeichenabbildes entsprechend einem zu erkennenden Zeichen zugeordnet werden, und sodann werden die Gesamtzahl der zugeordneten Richtungskodes und die auf X- und Y-Achsen projizierten Histogramme erhalten. Sodann wird auf der Grundlage dieser erhaltenen Gesamtzahl und der projizierten Histogramme das binäre Zeichenabbild in mehrere Maschenbereiche in X- und Y-Richtung unterteilt, wobei jeder Maschenbereich die zugeordneten Richtungskodes im wesentlichen gleichmäßig enthält. Sodann wird ein weiteres Histogramm in bezug auf die Richtungskodes für jeden der Maschenbereiche erhalten. Das so erhaltene Histogramm wird dann mit jenen verglichen, die in einer Bibliothek für bekannte Zeichen gespeichert sind, um die Identität des zu erhaltenden Zeichens zu bestimmen.
In Übereinstimmung mit einem weiteren Aspekt der vorliegenden Erfindung ist ein Verfahren zur Optimierung der Unterteilungsstellen eines Zeichenabbildes vorgesehen, wobei bei der Zeichenerkennung ein zu erkennendes Zeichen zunächst optisch durch einen Bildabtaster gelesen wird, um das Zeichen in ein binäres Abbild umzuformen, das dann in mehrere Maschenbereiche oder Unterbereiche unterteilt wird, um Merkmale aus jedem der Unterbereiche zu extrahieren. Eine erfolgreiche Extraktion solcher Merkmale hängt von einer geeigneten Bestimmung der Unterteilungsstellen ab. In Üereinstimmung mit diesem Aspekt der vorliegenden Erfindung ist ein Verfahren zur Unterteilung eines Zeichenbereiches vorgesehen, bei dem ein vorbestimmtes Merkmal einem binären Zeichenabbild zugeordnet wird, und die Gesamtzahl von Pixeln (Bildpunkten), die das zugeordnete Merkmal enthalten, und auf X- und Y-Achsen projizierte Histogramme werden erhalten, auf deren Grundlage das binäre Zeichenabbild in eine Mehrzahl von Maschenbereiche im X- und Y-Richtung unterteilt wird, wobei jeder Maschenbereich die Pixels mit dem zugeordneten Merkmal im wesentlichen gleichmäßig enthält.
Ein Vorteil der vorliegenden Erfindung besteht darin, daß das Zeichenerkennungsverfahren eine hohe Betriebsgeschwindigkeit hat, eine hohe Genauigkeit und Erkennungsrate liefert und einen einfachen Aufbau der Vorrichtung zur Durchführung ermöglicht.
Ein weiterer Vorteil der Erfindung besteht darin, daß Zeichen automatisch erkannt werden können, auch wenn diese deformiert sind oder schwach geschrieben oder gedruckt sind.
Vorteilhaft an der Erfindung ist weiterhin, daß ein Bereich, in welchem ein Zeichen angeordnet ist, in eine Mehrzahl von Unterbereichen optimal unterteilt werden kann.
Weitere Ziele, Vorteile und neue Merkmale der vorliegenden Erfindung werden anschließend unter Bezugnahme auf die Zeichnungen näher erläutert. Es zeigt
Fig. 1 ein Flußdiagramm des Verfahrensablauf zur automatischen Erkennung eines Eingabezeichens in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung;
Fig. 2 ein Blockdiagramm, das schematisch den Gesamtaufbau eines optischen Zeichenerkennungssystems zur Ausführung der Schritte in Fig. 1 zeigt;
Fig. 3 eine Darstellung, die ein Beispiel eines binären Zeichenabbildes in Form einer Punktmatrix zeigt, die durch optische Abtastung des Buchstabens "B" erhalten wird;
Fig. 4 eine Darstellung, die das Ergebnis zeigt, wenn eine Zeilenverbreiterung auf das binäre Zeichenabbild nach Fig. 3 angewendet worden ist;
Fig. 5 eine Darstellung des Ergebnisses, wenn mehrere vorbestimmte Richtungskodes selektiv der Kontur des verbreiterten binären Zeichenkodes nach Fig. 4 zugeordnet worden sind. Weiterhin zeigt Fig. 5 das Ergebnis der Unterteilungen des Abbildes;
Fig. 6 eine schematische Darstellung, die die Korrespondenz zwischen mehreren Richtungskodes, die selektiv den weißen Umrißpixeln eines binären Zeichenabbildes zuzuordnen sind, und Pixelmustern zeigt;
Fig. 7 ein Flußdiagramm des Ablaufs der Schritte in einem Verfahren von Zeichenunterteilungen, das zur Anwendung auf das Zeichenerkennungsverfahren nach Fig. 1 geeignet ist;
Fig. 8 ein Flußdiagramm, das die Schrittablauffolge eines Zeichenerkennungsvorganges in Übereinstimmung mit einer anderen Ausführungsform der vorliegenden Erfindung zeigt;
Fig. 9 ein Blockdiagramm, das den Aufbau eines optischen Zeichenerkennungssystems zur Ausführung des Verfahrens nach Fig. 8 zeigt;
Fig. 10 eine schematische Darstellung, daß die Korrespondenzen zwischen mehreren Richtungskodes, die selektiv in weißen Umrißpixeln eines binären Zeichenabbildes zuzuordnen sind, und Pixelmustern zeigt;
Fig. 11 eine Darstellung, die ein binäres Zeichenabbild für ein handgeschriebenes japanisches Katakana-Zeichen "a" nach der Vorverarbeitung zeigt;
Fig. 12 eine Darstellung, die die Ergebnisse zeigt, wenn ein Satz von Richtungskodes für schwarze Umrißpixel selektiv den Umriß-Schwarzpixeln des binären Zeichenabbildes nach Fig. 11 zugeordnet worden ist;
Fig. 13 eine Darstellung, die das Ergebnis zeigt, wenn ein Satz Richtungskodes für weiße Umrißpixel selektiv den Umriß-Weißpixeln des binären Zeichenabbildes nach Fig. 11 zugeordnet worden ist;
Fig. 14 eine Darstellung, die ein Beispiel von X- und Y- Histogrammen für ein binäres Zeichenabbild zeigt, dessen Umriß ein Satz von Richtungskodes selektiv zugeordnet worden ist;
Fig. 15 ein Flußdiagramm, das die Schrittablauffolge in einem Zeichenunterteilungsverfahren zeigt, das vorteilhafterweise auf das Zeichenerkennungsverfahren nach Fig. 8 angewendet werden kann;
Fig. 16 eine Darstellung, das die Ergebnisse einer Zeichenunterteilung zeigt, die mit dem Verfahren nach Fig. 15 ausgeführt worden ist;
Fig. 17 ein Flußdiagramm, das die Schrittablauffolge eines anderen Zeichenunterteilungsverfahrens zeigt, das ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren nach Fig. 8 angewendet werden kann.
Fig. 18 eine Darstellung der Ergebnisse einer Zeichenunterteilung, die nach dem Verfahren nach Fig. 17 ausgeführt wird;
Fig. 19 ein Flußdiagramm, das die Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens zeigt, das ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren nach Fig. 8 anwendbar ist;
Fig. 20 eine Darstellung des Ergebnisses einer Zeichenunterteilung, die nach dem Verfahren nach Fig. 19 abläuft;
Fig. 21 ein Schema, wie die Fig. 21a und 21b zusammenzusetzen sind;
Fig. 21a und 21b zusammen ein Flußdiagramm, das die Schrittablauffolge eines Zeichenunterteilungsverfahrens zeigt, das in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung gestaltet ist und vorteilhafterweise auf ein Zeichenerkennungsverfahren anwendbar ist;
Fig. 22 eine Darstellung einer Mehrzahl von Richtungskodes, die grundsätzlich den Richtungskodes nach Fig. 6 entsprechen;
Fig. 23 eine Darstellung eines Beispiels eines Histogrammes für die Merkmalspixel eines binären Zeichenabbildes;
Fig. 24a und 24b Darstellungen der Ergebnisse von Zeichenunterteilungen, wenn diese durch das Verfahren nach den Fig. 21a und 21b ausgeführt werden;
Fig. 25 eine schematische Darstellung, wie die Fig. 25a und 25b zusammenzusetzen sind;
Fig. 25a und 25b zusammen ein Flußdiagramm, das die Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens zeigt, das gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung gestaltet ist und ebenfalls vorteilhaft auf ein Zeichenerkennungsverfahren angewendet werden kann;
Fig. 26a und 26b Darstellungen der Ergebnisse einer Zeichenunterteilung, die nach den Verfahren nach den Fig. 21a und 21b bzw. 25a und 25b ausgeführt worden sind;
Fig. 27 eine schematische Darstellung, wie die Fig. 27a und 27b zusammenzusetzen sind;
Fig. 27a und 27b zusammen ein Flußdiagramm hinsichtlich der Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens, das in Übereinstimmung mit einem weiteren Ausführungsbeispiel der vorliegenden Erfindung aufgebaut ist und ebenfalls vorteilhaft bei einem Zeichenerkennungsverfahren angewandt werden kann;
Fig. 28a und 28b die Ergebnisse von Zeichenunterteilungen, die nach den Verfahren nach den Fig. 25a und 25b bzw. 27a und 27b ausgeführt worden sind;
Fig. 29 ein Blockschaltbild, das den Aufbau eines Zeichenunterteilungssystems zeigt, das in der Lage ist, die Zeichenunterteilungsverfahren nach den Fig. 21a und 21b bzw. 25a und 25b bzw. 27a und 27b auszuführen, und
Fig. 30a und 30b Darstellungen der Ergebnisse einer Unterteilung eines japanischen Katakana-Zeichens "wu", die unter Verwendung fester Unterteilungsstellen ausgeführt worden sind.
Fig. 1 zeigt im Flußdiagramm ein Zeichenerkennungsverfahren, das in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung gestaltet ist. Fig. 2 zeigt andererseits in Blockform einen optischen Zeichenleser (OCR) oder optisches Zeichenerkennungssystem zur Ausführung des Zeichenerkennungsverfahrens nach Fig. 1. Im ersten Schritt wird ein handgeschriebenes oder gedrucktes Eingabezeichen, das zu erkennen ist, d. h. ein unbekanntes Zeichen, optisch von einem Zeichenabtaster 11 gelesen, so daß das unbekannte Zeichen in ein binäres Zeichenabbild umgewandelt wird, in welchem ein Zeichenteil durch eines von zwei Binärdaten, d. h. von "1ern" dargestellt wird, und der übrige Hintergrundbereich durch das andere der zwei Binärdaten, d. h. von "0en" dargestellt wird. Es sei hervorgehoben, daß eine Originalvorlage typischerweise eine Anzahl Zeichen enthält, die von dem Abtaster 11 Zeile für Zeile abgetastet werden. Man erhält daher üblicherweise eine Serie von binären Zeichenabbildern, die dann einer Zeichenextraktionseinheit 12 zugeführt werden, wo die Serien von binären Zeichenabbildern voneinander getrennt werden.
Ein so von den anderen Abbildern getrenntes Zeichenabbild wird dann einer Verbreiterungseinheit 13 zugeführt, wo ein Zeilenverbreiterungsvorgang an dem einzelnen binären Zeichenabbild ausgeführt wird (Schritt 1 in Fig. 1).
Das Zeilenverbreiterungsverfahren ist in einer Form ein Verfahren, bei welchem die zwei weißen Pixel zu den linken und rechten Seiten eines schwarzen Pixels im binären Zeichenabbild in schwarze Pixel umgewandelt werden, um dadurch die Zeile zu verbreitern, die das binäre Zeichenabbild bildet.
Fig. 3 zeigt ein binäres Zeichenabbild des lateinischen Großbuchstabens "B" in Form einer 5 × 7-Punktmatrix, wenn es optisch mit einer Auflösung von 12 Zeilen pro Millimeter gelesen wird. Es sei hervorgehoben, daß in Fig. 3 das Symbol "$" einem schwarzen Pixel entspricht. Wenn das oben beschriebene Zeilenverbreiterungsverfahren auf dieses binäre Zeichenabbild angewendet wird, dann erhält man das Zeilenverbreiterte binäre Zeichenabbild, das in Fig. 4 dargestellt ist. Wie man sogleich erkennt, werden die Zwischenräume zwischen Punkten durch Punkte ausgefüllt, so daß das Zeilen-verbreiterte binäre Zeichenabbild weniger durch eine Verschiebung in der Punktposition und durch Streuung im Punkt-zu-Punkt-Abstand beinträchtigt wird. Die späteren Schritte der Zeichenunterteilung und der Merkmalsextraktion können daher bei einem solchen Zeilen-verbreiterten binären Zeichenabbild stabiler ausgeführt werden. Wenn die Auflösung des Abtasters 11 höher ist, beispielsweise 16 Zeilen/mm beträgt, dann kann die Wirkung des oben beschriebenen Zeilenverbreiterungsschemas wegen des wachsenden Punkt-zu-Punkt-Abstandes eines binären Zeichenabbildes nicht ausreichend sein. In diesem Falle kann man das Zeilenverbreiterungsschema so ausgestalten, daß nicht nur die linken und rechten weißen Pixel eines schwarzen Pixels, sondern auch die oberen und unteren weißen Pixel benachbart des schwarzen Pixels jeweils in schwarze Pixel umgeändert werden. In diesem Falle werden daher vier benachbarte weiße Pixel, d. h. die linken und rechten, oberen und unteren Pixel jeweils in schwarze Pixel geändert, während es beim vorangehend erläuterten Beispiel nur zwei Pixel waren, die verändert wurden.
Das Zeilen-verbreiterte binäre Zeichenabbild wird dann einer Richtungskode-Zuordnungseinheit 14 zugeführt, wo mehrere vorbestimmte Richtungskodes, die in Fig. 6 dargestellt sind, selektiv den weißen Pixeln, die der Kontur des binären Zeichenabbildes benachbart sind, zugeordnet (Schritt 2). Wie Fig. 6 zeigt, gibt es neun unterschiedliche Richtungskodes "0" bis "8", die jeweils einem bestimmten Muster einer Pixelanordnung zugeordnet sind. Das zugehörige Pixelanordnungsmuster besteht aus fünf Pixeln, die ein mittleres Pixel als das interessierende Pixel, ein Paar Pixel zur rechten und linken Seite des mittleren Pixels und ein Paar obere und untere Pixel oberhalb und unterhalb des mittleren Pixels aufweisen. Jedes Pixel wird daher durch ein kleines Quadrat dargestellt. Ein schraffiertes Quadrat stellt ein schwarzes Pixel dar, und ein unschraffiertes Quadrat stellt ein weißes Pixel dar. Es sei auch angemerkt, daß es acht mögliche Muster für Richtungskodes "0" gibt, während jeder der anderen Richtungskodes "1" bis "8" eine ganz bestimmte einzigartige Pixelanordnung aufweist.
Die Zuordnung eines Richtungskodes zu jedem der weißen Pixel, die der Kontur eines binären Zeichenabbildes benachbart sind, wird in folgender Weise ausgeführt. Das Zeilenverbreiterte binäre Zeichenabbild wird abgetastet, wobei jedes der weißen Pixel, die die Kontur des Zeilen-verbreiterten binären Zeichenabbildes begrenzen, zusammen mit den oberen und unteren, sowie rechten und linken benachbarten Pixeln mit jedem der Muster verglichen wird, die in Fig. 6 dargestellt sind. Wenn somit ein Pixelmuster, das die gleiche Anordnung von schwarzen und weißen Pixeln aufweist, ermittelt worden ist, dann wird der zugehörige Richtungskodes dem fraglichen weißen Pixel zugeordnet. Nach Abschluß der Zuordnung von Richtungskodes zu den weißen Pixeln benachbart der Kontor des Zeilen-verbreiterten binären Zeichenabbildes nach Fig. 5 erhält man ein Zeichen, dessen Kontur durch die Richtungskodes definiert ist.
In dem oben beschriebenen Beispiel ist ein Satz Richtungskodes selektiv den weißen Pixeln zugeordnet worden, die der Kontur des Zeilen-verbreiterten binären Zeichenabbildes benachbart sind. Andererseits sei doch festgehalten, daß ein anderer Satz von Richtungskodes, wie er in Fig. 10 dargestellt ist, ebenfalls verwendet werden könnte, in welchem Falle die selektive Zuordnung der Richtungskodes nach Fig. 10 an den schwarzen Pixeln ausgeführt wird, die die Kontur des Zeilen-verbreiterten binären Zeichenabbildes definieren.
Das Zeichenabbild mit den zugeordneten Kodes wird dann einer Merkmalextraktionseinheit 15 zugeführt, wo das vorgenannte, die zugeordneten Kodes enthaltende Zeichenabbild abgetastet wird, um die Richtungskodes zu zählen, und es werden auf der Grundlage des gezählten Wertes Unterteilungsstellen bestimmt, wodurch die Höhe und die Breite des Zeichenabbildes in vier Sektionen unterteilt wird, so daß man Unterbereiche mit 4 × 4 Maschen erhält (Schritt 3). Das Verfahren der variablen Unterteilung eines Zeichenabbildes oder Bereiches in Abhängigkeit von dem gezählten Wert der Richtungskodes wird im Detail später erläutert. Das die zugeordneten Kodes enthaltende Zeichenabbild wird dann nochmals abgetastet und die individuellen Richtungskodes werden für jeden der unterteilten Bereiche oder Unterbereiche gezählt, und ein Histogramm in bezug auf die Richtungskodes wird für jeden der Unterbereiche erzeugt (Schritt 4). Diese Histogramminformation wird dann einer Identifizierungseinheit 16 als ein Merkmal eines eingegebenen oder unbekannten zu erkennenden Zeichens zugeführt. Die Identifizierungseinheit 16 ist weiterhin mit einer Bibliothek 17 verbunden, um von dieser Information aufzunehmen. In der Bibliothek 17 sind ähnliche Histogramme für eine Anzahl bekannter Zeichen gespeichert. Bei Empfang einer Histogramminformation für ein unbekanntes eingegebenes Zeichen vergleicht die Identifizierungseinheit 16 daher diese Information mit jedem der in der Bibliothek gespeicherten Histogrammdaten, um herauszufinden, welche derselben am besten mit der Histogramminformation des unbekannten Zeichens übereinstimmen, um dadurch das unbekannte, eingegebene Zeichen als dasjenige der gespeicherten Zeichen zu identifizieren oder zu erkennen, das die am besten übereinstimmenden Histogrammdaten aufweist.
Bei diesem Identifizierungsschritt wird eine Distanz zwischen den Histogrammdaten des unbekannten Zeichens und der Histogrammdaten eines der in der Bibliothek 17 gespeicherten Zeichen berechnet (Schritt 5). Solch eine Distanz kann eine einfache Euklid'sche Distanz sein. Das heißt durch Anzeige eines Histogramms eines Richtungskodes k für einen Unterbereich (i, j) eines eingegebenen Zeichens durch Hkÿ und eines Histogramms eines Richtungskodes k für einen Unterbereich (i, j) eines in der Bibliothek 17 gespeicherten bekannten Zeichens durch Dkÿ läßt sich dann eine Distanz d zwischen diesen zwei Histogrammen durch folgende Gleichung berechnen:
Sodann wird das bekannte Zeichen, das in der Bibliothek 17 gespeichert ist und das die kleinste berechnete Distanz gemäß der obigen Gleichung aufweist, nun ausgewählt und als ein Ausgang abgegeben (Schritt 6).
Es wird das Zeichenunterteilungsverfahren im Schritt im Detail unter Bezugnahme auf Fig. 7 erläutert. Es sei hervorgehoben, daß das Flußdiagramm in Fig. 7 eine Folge von Schritten zu Bestimmung von Unterteilungsstellen längs der X-Achse angibt. Die Unterteilungsstellen längs der Y-Achse können jedoch ebenfalls durch einen vergleichbaren Vorgang bestimmt werden. Es sei fernerhin hervorgehoben, daß das Zeichenunterteilungsverfahren, das nachfolgend erläutert wird, an der Merkmalsextraktionseinheit 15 ausgeführt wird. Die Funktion der Merkmalsextraktionseinheit 15 wird typischerweise durch eine Kombination aus Hardware aus beispielsweise einem Mikroprozessor und einem Speicher und einem Softwareprogramm ausgeführt. Es besteht kein Zweifel daran, daß der Fachmann eine solche Kombination zur Ausführung des vorliegenden Zeichenunterteilungsverfahrens ohne Schwierigkeit aufbauen kann. Es sei fernerhin angemerkt, daß solche Elemente, wie beispielsweise ein Zähler und ein Register, die in der nachfolgenden Beschreibung erwähnt werden, einem internen Register eines Mikroprozessors oder einem Register eines Speichers entsprechen können, und daß der Bestimmungsschritt durch einen Mikroprozessor ausgeführt werden kann.
An erster Stelle wird eine Beschreibung der Unterteilungen in der X-Richtung gegeben. Das die zugeordneten Kodes aufweisende Zeichenabbild, das in einem Speicher gespeichert ist, wird abgetastet und die Gesamtzahl PE der zugeordneten Richtungskodes, d. h. die Anzahl von Pixeln, die die Kontur einer Zeichenzeile definieren, wird gezählt (Schritt 21 in Fig. 7). Sodann wird der Anfangswert von "1" in einen Zähler n eingegeben, wobei die Anzahl der Unterteilungen in der X-Richtung (im vorliegenden Beispiel 4) in einen Zähler N eingegeben wird, wobei der Umfang der Überlappung von Unterbereichen in ein Register T eingegeben wird und ein Richtungskodezähler Px und X-Adressenzähler gelöscht werden (Schritt 22). Nach Abschluß dieses vorbereitenden Schrittes wird das die zugeordneten Kodes aufweisende Zeichenabbild in Y-Richtung als der Hauptabtastrichtung und in X-Richtung als einer Hilfsabtastrichtung senkrecht zur Y-Richtung abgetastet, während welchen Abtastungen die Richtungskodes gezählt werden, um die Unterteilungsstellen in X-Richtung nacheinander zu bestimmen.
Diesbezüglich sei folgendes im einzelnen erläutert. Der X-Adresszähler zur Bezeichnung einer Abtastzeile wird im Schritt 24 um 1 erhöht und dann, während die durch den Zählwert des X-Zählers bestimmte Zeile in Y-Richtung abgetastet wird, wird der Zählwert eines Richtungskodeszähler Px immer dann erhöht, wenn ein Richtungskode ermittelt worden ist (Schritt 25). Nach Abschluß der Abtastung einer Zeile wird ermittelt, ob der Zählwert des Richtungskodezählers Px, d. h. ob die Anzahl der Richtungskodes zwischen der Anfangszeile entsprechend X = 1 und der laufenden, durch den X-Adresszähler bezeichneten Zeile gleich oder größer als (PE/N) Xn ist, oder nicht (Schritt 26). Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf zu Schritt 24 zurück, um die nächste Zeile abzutasten und erneut die Richtungskodes zu zählen, wenn solche ermittelt werden. Wenn andererseits das Ergebnis im Schritt 26 positiv ist, dann wird die Zeile, die durch die laufende Zählung im X-Adreßzähler angegeben wird, als ein Endpunkt oder als eine Stelle einer n-ten Unterteilung in X-Richtung bestimmt (d. h. eine rechtsliegende Stelle einer Unterteilung). Außerdem wird die Zeile, die durch einen Wert angegeben wird, den man durch Abziehen des Wertes eines Registers T vom laufenden Zählwert im X-Adresszähler erhält, als ein Startpunkt oder Startstelle des nächsten Unterbereiches bestimmt (d. h. linke Stelle einer Unterteilung). Sodann wird der Zählerstand des Zählers n um 1 erhöht (Schritt 28), und anschließend geht der Ablauf zum Schritt 23 zurück, um einen gleichartigen Verfahrensablauf zu wiederholen.
Auf diese Weise wird die Zeilenposition (X-Adresse), an der die Zahl Px der Richtungskodes den Wert von PE/4 erreicht hat, als ein Endpunkt für den ersten Unterbereich definiert, und eine Zeile, die um T Zeilen von dieser Position liegt, wird als ein Startpunkt für den zweiten Unterbereich definiert. Wenn die Anzahl Px der Richtungskodes den Wert PE/2 erreicht hat, dann wird ihre Zeilenposition als ein Endpunkt des zweiten Unterbereiches definiert, und die um T Zeilen vor dieser Zeile liegende Zeile wird als ein Startpunkt für den dritten Unterbereich definiert. Wenn die Zählung Px der Richtungskodes den Wert PEX 3/4 erreicht hat, dann wird darüber hinaus diese Zeilenposition als ein Endpunkt des dritten Unterbereiches definiert, und die Zeilenposition, die um T Zeilen vor dieser Zeile liegt, wird als ein Startpunkt für den vierten Unterbereich definiert. Es sei festgehalten, daß der Startpunkt des ersten Unterbereiches der linken Seite eines Zeichenrahmens entspricht, und der Endpunkt des vierten Unterbereiches der rechten Seite des Zeichenrahmens entspricht. Bei Bestimmung des Endpunktes des dritten Unterbereiches und des Startpunktes des vierten Unterbereiches wird das Bestimmungsergebnis beim Schritt 23 negativ, so daß die Schritte zur Bestimmung der Unterteilungsstellen in X-Richtung beendet werden.
Sodann wird die Bestimmung der Unterteilungsstellen in Y-Richtung in gleicher Weise ausgeführt. Da die Gesamtzahl PE der Richtungskodes jedoch schon bestimmt worden ist, wird dieser Schritt nicht wiederholt. In diesem Falle wird der Abtastbetrieb zur Bestimmung der Unterteilungsstellen mit der X-Richtung als Hauptabtastrichtung und der Y-Richtung als der Unterabtastrichtung ausgeführt. Der Startpunkt des ersten Unterbereiches in Y-Richtung entspricht der Oberseite des Zeichenrahmens, und der Endpunkt des vierten Unterbereiches in Y-Richtung entspricht der Unterseite des Zeichenrahmens. Auf diese Weise wird unter Verwendung der so bestimmten Unterteilungsstellen (d. h. der End- und Startpunkte) in X- und Y-Richtung das Kode-zugeordnete Zeichen oder ein durch den Rahmen des Kode-zugeordneten Zeichens definierter Bereich in ein 4 × 4-Netz von Unterbereichen unterteilt. Ein solcher Netz von 4 × 4-Unterbereichen ist in Fig. 4 mit dünnen Linien eingezeichnet. Es sei auch angemerkt, daß in diesem Falle der Bereichsüberlappungsumfang T auf null eingestellt ist.
Wie oben beschrieben, werden die Unterteilungsstellen gemäß der vorliegenden Erfindung Stelle für Stelle in Abhängigkeit von der Stellenverteilung der Richtungskodes bestimmt, so daß die Zeichenunterteilung an Stellen ausgeführt werden kann, die für das Ausmaß von Verformungen eines Buchstabens geeignet sind, was zur Verbesserung der Erkennungsrate beiträgt. Ein solches Verfahren, die Unterteilungsstellen eines Zeichens variabel zu gestalten, kann die Probleme beseitigen, die den bekannten Verfahren eigen waren, die mit festen Unterteilungsstellen arbeiteten, wobei dennoch bei der Erfindung kein komplizierter Rechenvorgang erforderlich ist. Das oben beschriebene Zeichenunterteilungsverfahren nach der vorliegenden Erfindung ist im Vergleich zu den bekannten Verfahren schnell und einfach. Wenn jedoch, wie oben beschrieben, ein binäres Zeichenabbild eines Punktmatrixzeichens niedriger Qualität, wie in Fig. 3 gezeigt, verarbeitet wird, ohne einen Zeilenverbreiterungsschritt auszuführen, dann könnte sich aufgrund der Punktverschiebung und Schwankung des Punkt-zu-Punkt-Abstandes ein Problem ergeben. In Übereinstimmung mit der vorliegenden Erfindung wird daher ein Zeilenverbreiterungsschritt an einem binären Zeichenabbild ausgeführt, bevor die Richtungskodes zugeordnet werden. Das Verfahren nach der vorliegenden Erfindung wird daher durch eine geringe Qualität eines binären Zeichenabbildes, wie beispielsweise durch eine Verschiebung der Punktposition und durch eine Schwankung des Punkt-zu-Punkt-Abstandes nicht nachteilig beeinflußt. Als Folge davon kann man gemäß diesem Aspekt der vorliegenden Erfindung selbst für Punktmatrixzeichen relativ geringer Qualtiät, wie beispielsweise bei Zeichen, die von einer 5 × 7-Punktmatrix angegeben werden, eine ausreichend hohe Erkennungsrate erzielen.
Es sei weiterhin angemerkt, daß der Zeilenverbreiterungsvorgang relativ einfach abläuft und in einer sehr kurzen Zeitdauer ausgeführt werden kann, so daß keine Wahrscheinlichkeit besteht, daß die Zeichenerkennungszeitdauer merklich verlängert wird. Es ist ferner festzuhalten, daß der Zeilenverbreiterungsvorgang auch jede andere Form annehmen kann, als oben beschrieben. Außerdem ist das Verfahren der Zeichenunterteilung, das auf diesen Aspekt der vorliegenden Erfindung anwendbar ist, nicht nur auf das beschriebene beschränkt, sondern es kann jedes andere Zeichenunterteilungsverfahren Anwendung finden, wie beispielsweise jenes, das in der japanischen Patentanmeldung 59-21027760 beschrieben ist.
Es sei nun ein weiterer Aspekt der vorliegenden Erfindung unter Bezugnahme auf die Fig. 8 bis 20 erläutert. Fig. 8 zeigt ein Flußdiagramm, das die Schrittablauffolge eines Zeichenerkennungsverfahrens zeigt, das in Übereinstimmung mit einer Ausführungsform dieses Aspektes der Erfindung aufgebaut ist, und Fig. 9 zeigt in Blockform den Aufbau eines optischen Zeichenlesers (OCR) oder eines optischen Zeichenerkennungssystems, das zur Ausführung des Zeichenerkennungsverfahrens nach Fig. 8 eingerichtet ist.
Bezugnehmend auf Fig. 9 werden geschriebene oder gedruckte Zeichen, beispielsweise Buchstaben oder Symbole, als Original optisch von einem Abtaster 31 gelesen, und die optisch gelesene Zeicheninformation wird dann in eine binäre Zeicheninformation von einer Vorverarbeitungseinheit 32 umgewandelt, die auch die binäre Zeicheninformation in einzelne Zeichendaten trennt, die Daten normiert und dann glättet. Es ergibt sich daher ein einzelnes binäres Zeichenabbild, das normiert und geglättet worden ist, und dieses wird einer Merkmalsextraktionseinheit 31 zugeführt, wo mehrere vorbestimmte Richtungskodes der Kontur eines solchen binären Zeichenabbildes selektiv zugeordnet werden. Wie zuvor beschrieben, gibt es zwei Sätze solcher Richtungskodes, ein Satz für die Anwendung auf weiße Pixel, wie in Fig. 6 gezeigt, und der andere Satz zur Anwendung auf schwarze Pixel, wie in Fig. 10 gezeigt. Es sei weiterhin angemerkt, daß in dem Falle, in welchem ein Satz Richtungskodes zur Anwendung auf schwarze Pixel verwendet wird, solche Richtungskodes jeweils einem von zwei Pixeln in Zeilenbreitenrichtung zugeordnet werden, wenn eine Zeichenzeile eine Zeilenbreite von 2 oder mehr aufweist. Wenn andererseits die Zeilenbreite gleich 1 ist, dann ist nur ein Pixel zur Definition einer Zeichenzeile vorhanden, so daß nur ein Richtungskode zugeordnet wird, so daß die Anzahl zugeordneter Richtungskodes die Hälfte derjenigen ist, die sich ergeben würde, wenn die Zeilenbreite gleich 2 oder mehr wäre. Was dies angibt, ist die Tatsache, daß die Merkmalsdaten instabil würden, wenn ein Satz von Richtungskodes für schwarze Pixel auf eine schmale Zeile angewendet würde, deren Zeilenbreite gleich 1 ist. Ein solches Problem erwächst andererseits nicht, wenn von einem Satz Richtungskodes für weiße Pixel im Falle einer solchen schmalen Zeile Gebrauch gemacht wird. Wenn andererseits ein Zeilen-zu-Zeilen-Abstand relativ klein ist, dann kann ein solcher Abstand durch Anwendung eines Richtungskodes für weiße Pixel verschwinden. In diesem Falle erwächst jedoch ein solches Problem nicht, wenn man von einem Satz Richtungskodes für schwarze Pixel Gebrauch macht. Dementsprechend sollte der passende Satz aus den Richtungskodes in Abhängigkeit von Anwendungsfall ausgewählt werden.
Fig. 11 zeigt ein binäres Zeichenabbild eines japanischen Katakana-Zeichens "a", das wie der englische Vokal "a" ausgesprochen wird. Dieses Zeichen wird von der Vorverarbeitungseinheit 32 der Merkmalsextraktionseinheit 33 zugeführt. Wenn ein Satz Richtungskodes für schwarze Pixel den schwarzen Pixeln zugeordnet wird, die die Kontur des binären Zeichenabbildes in Fig. 11 definieren, dann erhält man ein Kodezugeordnetes Zeichenabbild, das in Fig. 12 dargestellt ist. Wenn andererseits ein Satz Richtungskodes für weiße Pixel den weißen Pixeln zugeordnet wird, die die Kontur des binären Zeichenabbildes nach Fig. 11 definieren, dann erhält man ein Kode-zugeordnetes Zeichenabbild, das in Fig. 13 dargestellt ist.
Wie später erläutert, wird gleichzeitig mit der Zuordnung der Richtungskodes die Gesamtzahl der Pixel, denen Richtungskodes zugeordnet worden sind, und ein auf eine X-Achse und/oder eine Y-Achse projiziertes Histogramm erhalten und gespeichert. Es ist wahr, daß das Zählen einer solchen Gesamtzahl Pixel und das Bilden einer solchen Histogrammtafel oder -tafeln unabhängig auch im Anschluß an die Richtungskodezuordnung ausgeführt werden kann. Die gleichzeitige Ausführung ist jedoch vorzuziehen, weil man einige Vorteile dadurch erhält, wie beispielsweise einer Verminderung der Verarbeitungszeit beispielsweise aufgrund einer Verminderung der Anzahl von Abtastoperationen eines Zeichenbildes.
Anschließend wird in der Merkmalsextrahierungseinheit 33 das Kode-zugeordnete Zeichenbild in eine Mehrzahl von N × N Netzunterbereiche in X- und Y-Richtung unterteilt. Wie später im Detail erläutert wird, werden die Unterteilungsstellen längs der X- und Y-Achsen derart bestimmt, daß jeder dieser M × M Netzunterbereiche im wesentlichen die gleiche Anzahl von Pixeln aufweist, denen Richtungskodes zugeordnet worden sind. Mit einem solchen Aufbau können Unterteilungen eines Zeichenabbildes in weitgehender Anpassung an das Ausmaß von Deformationen oder Abweichungen eines Zeichenabbildes von der Standardgestalt ausgeführt werden. Eine solche variable Zeichenunterteilung ist gegenüber den bekannten Unterteilungsverfahren, die feste Unterteilungsstellen verwenden, weit vorteilhafter.
Als nächstes wird in der Merkmalsextrahierungseinheit 33 für jeden (i, j) der in Form eines Netzes unterteilten Unterbereiche ein Histogramm Hkÿ als Funktion der Richtungskodes erzeugt. Hier gibt der Suffix k einen der Richtungskodes 1 bis 8 an.
In der Identifikationseinheit 34 wird unter Verwendung des Histogramms als Funktion der Richtungskodes, die aus der Merkmalsextrahierungseinheit 33 aus dem unbekannten eingegebenen Zeichen extrahiert worden ist, und unter Verwendung der vergleichbaren Histogramme, die in der Bibliothek für bekannte, registrierte Zeichen gespeichert sind, eine Distanz zwischen dem unbekannten eingegebenen Zeichen und jedem der registrierten Zeichen berechnet. Sodann wird das registrierte Zeichen, das die kürzeste berechnete Distanz aufweist, ausgewählt und als ein Zeichen entsprechend dem unbekannten eingegebenen Zeichen ausgegeben. Zu diesem Zweck kann von einer einfachen Euklid'schen Distanz Gebrauch gemacht werden, in welchem Falle eine Distanz dl eines Zeichens l zwischen einem Histogramm Dkÿl des eingegebenen Zeichens und einem Histogramm Hkÿ des eingegebenen Zeichens durch die folgende Gleichung ausgedrückt werden kann:
Es werden nun spezifische Beispiele dieses Aspektes der vorliegenden Erfindung erläutert.
Beispiel 1
Ein binäre Eingabezeichenabbild wird einem Vorverarbeitungsschritt unterworfen und dann einem Richtungskodezuordnungsschritt (Merkmalsanbringungsschritt) in Übereinstimmung mit einem vorbestimmten Algorithmus. Gleichzeitig wird die Gesamtzahl PE der Pixel (Merkmals-angebrachte Pixel), denen Richtungskodes zugeordnet worden sind, gezählt, und ein auf die X-Achse projiziertes Histogramm HXi und ein auf die Y-Achse projiziertes Histogramm HYj der Kode-zugeordneten Pixel werden erhalten. Ein spezielles Beispiel eines solchen Histogrammpaares ist in Fig. 14 dargestellt. In dieser Figur ist ein Kode-zugeordnetes Zeichenabbild 40, das aus einem Buchstaben "c" gebildet ist, dargestellt, und eine Serie von Zahlen, die an der Oberseite angeordnet sind, zeigen das unterste Bit der X-Adresse, eine Serie von Zahlen an der linken Seite zeigen die Y-Adresse, und der Rest der Zahlen geben die Richtungskodes an, die der Kontur des eingegebenen Zeichens "c" zugeordnet worden sind. Es sei angemerkt, daß in diesem Beispiel und auch in den letztgenannten Beispielen die horizontale Richtung als die X-Achse angenommen wird und die vertikale Richtung als die Y-Achse angenommen wird. Diese Relation kann jedoch, sofern gewünscht, umgekehrt werden.
In Fig. 14 sind ein Histogramm HXi der Anzahl der Richtungskodes des Kode-zugeordneten Zeichenabbildes 40, das auf die X-Achse projiziert ist, und ein Histogramm HYj der Anzahl der Richtungskodes des Abbildes 40 auf der Y-Achse in Form von Tabellen 41 bzw. 42 gespeichert. Anschließend wird das Zeichenabbild 40 in N Sektionen in X-Richtung und in M-Sektionen in Y-Richtungen unterteilt, wodurch sich eine Anzahl von unterteilten Unterbereichen in einer M × N-Netzform ergibt.
Fig. 15 zeigt ein Flußdiagramm eines Verfahrens zur Bestimmung der Unterteilungsstellen in X-Richtung, und dieses Verfahren wird nachfolgend im Detail erläutert. Nach der Initialisierung von Zählen n und i und des Registers P (Schritt 50 von Fig. 15), wird der Zähler i erhöht (Schritt 54), und dann wird der Wert entsprechend dieses Wertes i aus dem Histogramm HXi ausgelesen und dem Wert des Registers P hinzuaddiert, wodurch der Wert des Registers P rückgestellt wird (Schritt 56). Anschließend wird geprüft, ob der Wert P des Registers P den Wert von (PE/N) Xn überschritten hat (Schritt 58). Wenn das Ergebnis negativ ist, dann geht der Ablauf zurück zum Schritt 54, um einen gleichen Ablauf zu wiederholen. Im wesentlichen wird in Übereinstimmung mit diesen Schritten bei der Erhöhung der X-Adresse um 1 das Zeichen rastermäßig abgetastet, um die Anzahl p von Pixeln zu zählen, denen Richtungskodes zugeordnet worden sind, und um die Zählung mit einem vorbestimmten Wert von (PE/N) Xn zu vergleichen. Die Wiederholung einer solchen Rasterabtastung und weiterhin einer Rasterabtastung zur Bestimmung der Gesamtanzahl PE ist jedoch redundant und daher nicht sehr effizient. Unter diesen Umständen wird in Übereinstimmung mit diesem Beispiel bei der Zuordnung der Richtungskodes zu der Kontur eines Zeichenabbildes, was eine rasterhafte Abtastung verlangt, die Gesamtzahl PE gleichzeitig mit dem projizierten Histogrammen HXi und HYj erhalten, und diese Daten werden dazu verwendet, eine unnötige Wiederholung einer Rasterabtastung zu vermeiden.
Wenn nun die Bedingung, daß P gleich oder größer als (PE/N) Xn erreicht worden ist, dann wird der laufende Zählwert des Zählers e als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die man durch Abziehen eines vorbestimmten Bereichsüberlappungsbetrages T von dieser X-Adresse erhält, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 60). Es sei hervorgehoben, daß der Startpunkt des ersten Unterbereiches in X-Richtung mit der linken Seite (X = 0) des Zeichenabbildes oder Rahmens zusammenfällt und der Endpunkt des letzten und N-ten Unterbereiches in X-Richtung mit der rechten Seite des Zeichenabbildes oder Rahmens zusammenfällt.
Im Anschluß an den Schritt 60 wird der Zähler n erhöht (Schritt 62), und der Ablauf geht auf Schritte über, die die nächste Unterteilungsstelle bestimmen. Dieses Verfahren wird beendet, wenn die Bedingung n = N im Schritt 52 erreicht worden ist.
Die Unterteilungsstellen in Y-Richtung können in gleicher Weise erhalten werden. Das heißt, in diesem Falle wird an Stelle eines Zählers i ein Zähler j entsprechend der Y-Adresse verwendet, und es wird auf ein projiziertes Histogramm HYj entsprechend der Y-Achse Bezug genommen. Außerdem sei angemerkt, daß der Startpunkt für den ersten Unterbereich in Y-Richtung der Oberseite des Zeichenabbildes oder Rahmens und der Endpunkt für den M-ten Unterbereich in Y-Richtung der Unterseite des Zeichenabbildes oder Rahmens entspricht. Auf diese Weise sind die Unterteilungsstellen in X- und Y-Richtung ermittelt worden, so daß das Zeichenabbild in N × M-Netzunterbereiche in X- und Y-Richtung unterteilt ist.
Fig. 16 zeigt ein Beispiel einer netzartigen Unterteilung eines handgeschriebenen japanischen Katakana-Zeichens "nu", wobei der Bereichsüberlappungsbetrag auf 1 eingestellt ist. Japanische Katakana-Zeichen "nu" und "su" sind ähnlich in der Gestalt wie die lateinischen Buchstaben "E" und "F", der einzige Unterschied zwischen "nu" und "su" liegt in der Tatsache, daß "nu" einen zusätzlichen Strich aufweist, der von links oben nach rechts unten verläuft, wie in Fig. 16 dargestellt. Um die Unterscheidung zwischen "nu" und "su" zu treffen, ist es wichtig, daß dieses Merkmal, d. h. die Anwesenheit eines zusätzlichen Striches, der von links oben nach rechts unten verläuft, durch Unterbereiche in geeigneter Weise wiedergespiegelt wird, die in Form von Netzmaschen abgeteilt sind. Das vorliegende Beispiel erfüllt dieses Erfordernis und ist daher in der Lage, "nu" von "su" und anderen ähnlichen Zeichen klar zu unterscheiden.
Beispiel 2
Bei diesem Beispiel wird gleichzeitig mit der Richtungskodezuordnung die Gesamtzahl PE von Pixeln, denen Richtungskodes zugeordnet worden sind, und ein Histogramm HYj von Pixeln, denen Richtungskodes zugeordnet worden sind, das auf die Y-Achse projiziert ist, erhalten. Sodann wird in einer Weise ähnlich dem oben beschriebenen Beispiel 1 das Zeichenabbild in M Sektionen in Y-Richtung unterteilt. Sodann wird während der Rasterabtastung eines jeden der in Y-abgestellten Bereiche dieser Bereich auch in N Sektionen in X-Richtung unterteilt. Fig. 17 ist ein Flußdiagramm, das den Ablauf zur weiteren Unterteilung einer der in Y-Richtung abgeteilten M Sektionen in N Sektionen in X-Richtung zeigt.
Diesbezüglich sei zur weiteren Erläuterung auf Fig. 17 Bezug genommen. Nach Initialisierung der Zähler n und i und des Registers P (Schritt 70) wird der Zähler i erhöht (Schritt 74), und das Zeichenabbild wird in Y-Richtung auf die X-Adresse entsprechend dem inkrementierten i-Raster abgetastet, wodurch die Anzahl von Pixeln, denen Richtungskodes zugeordnet worden sind, in dieser Zeile gezählt wird, und ihr Wert Pi wird dem Register P hinzuaddiert (Schritt 78). Sodann wird geprüft, ob der Wert P des Registers P einen vorbestimmten Wert von (PE/NXM) Xn überschritten hat (Schritt 80). Wenn das Ergebnis negativ ist, dann geht der Ablauf zum Schritt 74 zurück und wiederholt sich auf gleiche Weise. Wenn andererseits P als gleich oder größer als (PE/NXM) Xn ermittelt worden ist, dann wird der laufende Zählwert des Zählers i als eine X-Adresse eines Endpunktes für den n-ten Unterbereich in X-Richtung gespeichert, und eine weitere Adresse erhält man, indem man eine vorbestimmte Bereichsüberlappungsbreite T von jener X-Adresse abzieht. Diese weitere X-Adresse wird als X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 82). Es sei angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes oder Rahmens entspricht und der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes oder Rahmens entspricht. Nach dem Schritt 82 wird der Zähler n erhöht (Schritt 84), und es werden als nächstes Schritte zur Bestimmung der nächsten Unterteilungsstelle ausgeführt. Dieser Vorgang wird beendet, sobald die Bedingung n = N im Schritt 72 erreicht worden ist.
Auf diese Weise erhält man die Unterteilungsstellen in X- und Y-Richtung, und das Zeichenabbild oder der Rahmen wird in mehrere Unterbereiche in Form eines M × N-Maschennetzes in den X- und Y-Richtungen unterteilt. Ein Beispiel solcher Unterteilungen eines japanischen Katakana-Zeichens "nu" ist in Fig. 18 dargestellt. Es ist anzumerken, daß in Fig. 18 nur Unterteilungen in X-Richtung für die abgeteilten Zwischenbereiche in Y-Richtung angegeben sind. Es sei auch angemerkt, daß die Bedingung T = 0 in Fig. 18 angenommen wird.
In dem oben beschriebenen Beispiel 2 werden die Unterteilungen in Y-Richtung durch das im Beispiel 1 beschriebene Schema ausgeführt. Sie kann jedoch auch derart ausgeführt werden, daß nach der Ausführung der Unterteilungen in X-Richtung Unterteilungen in X-Richtung für jede der Unterteilungen in Y-Richtung ausgeführt werden können.
Beispiel 3
Wenn die Pixels, denen die Richtungskodes zugeordnet worden sind, in einem Bereichsüberlappungsabschnitt konzentriert sind, dann wird eine vergrößerte Streuung in der Pixelanzahl innerhalb Unterbereichen in jeder der X- und Y-Richtungen erzeugt. Wenn in diesem Falle die Unterteilungsstellen unter Verwendung von PE/NXM) als Bezug wie beim oben beschriebenen Beispiel 2 bestimmt werden, dann würde eine Situation eintreten, in denen die Unterteilungen ungeeignet sind. Dieses Beispiel 3 ist daher darauf gerichtet, einen solchen Nachteil zu vermeiden.
In Übereinstimmung mit diesem Beispiel 3 werden gleichzeitig mit der Zuordnung der Richtungskodes die Gesamtzahl PE der Pixels, denen Richtungskodes zugeordnet worden sind, gezählt und ein Histogramm HYj der mit Kodes versehenen Pixel, projiziert auf die Y-Adresse, erhalten, und anschließend wird das Zeichenabbild in M-Sektionen in Y-Richtung in einer Weise ähnlich der im obigen Beispiel 1 beschriebenen unterteilt. Während dieser Unterteilungen in Y-Richtung wird Bezug genommen auf das Histogramm HYj, und die Anzahl Pm der mit Kodes versehen Pixel in jeder der Unterteilungen wird erhalten. Während der Rasterabtastung einer jeden der Unterteilungen in Y-Richtung wird jede der Unterteilungen weiter in N Unterteilungen in X-Richtung geteilt. Fig. 19 zeigt ein Flußdiagramm, das ein Verfahren zum Teilen einer der Unterteilungen, geteilt in Y-Richtung, in N Unterteilungen in X-Richtung darstellt.
Wie man aus Fig. 19 erkennt, wird nach Initialisierung der Zähler n und i und des Registers P (Schritt 90) der Zähler i erhöht (Schritt 94), und das Zeichenabbild wird in Y-Richtung für die X-Adresse rastermäßig abgetastet, die jenem Zählwert i entspricht, wodurch die Anzahl der mit Kodes versehenen Pixel in jener Zeile gezählt wird, und ihr Zählwert Pi wird dem Register P hinzuaddiert (Schritt 98). Dann wird der Wert P des Registers P geprüft, um zu ermitteln, ob er einen vorbestimmten Wert (PmN) Xn überschritten hat, oder nicht (Schritt 100). Wenn das Ergebnis negativ ist, dann geht der Ablauf zum Schritt 94 zurück, um die genannten Schritte in gleicher Weise zu wiederholen. Wenn andererseits die Bedingung erfüllt ist, daß P gleich oder größer als (Pm/N) Xn ist, dann wird der laufende Zählwert des Zählers i als eine X-Adresse eines Enpunktes für den n-ten Unterbereich in X-Richtung gespeichert und darüber hinaus wird eine weitere X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite T von jener X-Adresse erhält, als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 102). Es sei angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes entspricht, und daß der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht. Im Anschluß an den Schritt 102 wird der Zähler n erhöht (Schritt 104) und der Ablauf geht auf Schritte über, mit denen der nächste Unterteilungspunkt bestimmt wird. Dieses Verfahren wird beim Erreichen der Bedingung n = N beendet.
Unter Verwendung der so erhaltenen Unterteilungspunkte in X-Richtung werden auch die in Y-Richtung unterteilten Sektionen in N Sektionen in X-Richtung unterteilt, so daß das Zeichenabbild in ein Netz von N × M Unterbereiche unterteilt wird. Fig. 20 zeigt ein Beispiel, das man durch Unterteilung des Kode-zugeordneten Zeichenabbildes eines handgeschriebenen japanischen Katakanazeichens "nu" in ein Netz aus Unterbereichen mit T = 1 erhalten hat. Es sei angemerkt, daß die Unterteilungen in X-Richtungen nur für die mittleren unterteilten Sektionen in Y-Richtung angegeben sind.
Beispiel 4
Die gleichen Verfahrensschritte wie jene, die beim Beispiel 1 verwendet worden sind, werden hier angewandt mit der Ausnahme, daß ein Satz von Richtungskodes für schwarze Pixel für jene schwarzen Pixel verwendet wird, die die Kontur eines binären Zeichenabbildes definieren.
Beispiel 5
Die gleichen Verfahrensschritte wie jene, die im Beispiel 2 verwendet worden sind, werden hier angewendet mit der Ausnahme, daß ein Satz von Richtungskodes für schwarze Pixel für jene schwarzen Pixel angewendet wird, die die Kontur eines binären Zeichenabbildes angeben.
Beispiel 6
Dieselben Verfahrensschritte wie jene, die im Beispiel 3 verwendet wurden, werden hier angewandt mit der Ausnahme, daß ein Satz Richtungskodes für schwarze Pixel für jene schwarze Pixel Anwendung findet, die die Kontur eines binären Zeichenabbildes definieren.
Es ist anzumerken, daß jeder der oben beschriebenen Verfahrensschritte mit diesem Aspekt der vorliegenden Erfindung sehr einfach entweder durch Software oder durch Hardware oder durch eine Kombination beider ausgeführt werden können, und dies sollte für einen Fachmann auszuführen sein.
Es wird nun ein weiterer Aspekt der vorliegenden Erfindung unter spezielle Bezugnahme auf die Fig. 21 bis 30 beschrieben. Dieser Aspekt der vorliegenden Erfindung ist speziell auf ein Zeichenunterteilungsschema gerichtet, das zur Verwendung bei der Merkmalsextrahierung in einem Zeichenerkennungsverfahren und -system insbesondere nach der Erfindung geeignet ist. Wie bereits ausgeführt, ist es wichtig, daß ein Zeichenabbild in Abhängigkeit vom Zustand desselben optimal unterteilt wird, damit ein gewünschtes Merkmal ohne Fehler extrahiert wird. Fig. 30a zeigt ein Zeichenabbild aus Kodezuordnungen, das man erhalten hat, indem ein Satz Richtungskodes nach Fig. 22 der Kontur eines binären Zeichenabbildes für ein japanisches Katakana-Zeichen "wu" zugeordnet hat. Fig. 30b ist hingegen ein ähnliches Zeichenabbild aus Kodezuordnungen für dasselbe japanische Katakana-Zeichen "wu" bei geringer Änderung der Gestalt. Es sei zunächst der Fall betrachtet, in welchem beide Zeichenabbilder nach den Fig. 30a und 30b in ein 3 × 3-Netz unter Verwendung fester Unterteilungsstellen unterteilt werden und ein Histogramm als Funktion von Richtungskodes für jede der Unterteilungen gebildet wird, um einen Merkmalsvektor zu erzeugen.
Unter den japanischen Katakana-Zeichen gibt es die Zeichen "wu" und "nu", die in der Gestalt ähnlich sind, wobei "wu" von "nu" sich nur dadurch unterscheidet, daß ein sich vertikal erstreckender oberer mittlerer Strich vorhanden ist. Um "wu" von "nu" richtig zu unterscheiden, ist es daher wichtig, daß die Information, die sich auf diesen oben mittleren Strich bezieht, durch Zeichenunterteilungen in geeigneter Weise extrahiert und in einem Merkmalsvektor in geeigneter Weise wiedergespiegelt wird. Betrachtet man den oberen linken Unterbereich in jedem der Zeichenabbilder nach den Fig. 30a und 30b genauer, dann sieht man, daß die Information, die sich auf den oberen mittleren Strich bezieht, in dem Zeichenabbild in Fig. 30a verlorengegangen ist, während diese Information in dem Zeichenabbild nach Fig. 30b vorhanden ist. Wenn die Unterteilungspunkte an festen Stellen angeordnet sind, dann kann auf diese Weise die Situation eintreten; in der eine Merkmalsextraktion, die das wesentliche Merkmal eines Zeichens verläßlich wiederspiegelt, nicht ausgeführt werden kann. Dieser dritte Aspekt der Erfindung ist speziell auf die Beseitigung dieses Problems gerichtet und auf die Angabe eines Verfahrens zur optimalen Bestimmung von Unterteilungspunkten eines Zeichenabbildes, die es ermöglichen, die Merkmalsextraktion stabil jederzeit auszuführen.
Die Fig. 21a und 21b zeigen zusammen ein Flußdiagramm der Schrittablauffolge eines Unterteilungsverfahrens für einen Zeichenbereich (Rahmen) gemäß einer Ausführungsform dieses Aspektes der vorliegenden Erfindung. Wie zuvor angegeben, sei festgehalten, daß dieses Zeichenunterteilungsverfahren speziell vortteilhaft ist, wenn es auf ein Zeichenerkennungsverfahren angewendet wird.
Wie die Fig. 21a und 21b zeigen, wird im Schritt 110 ein Zeichenabbild, das typischerweise durch Abtastung eines gedruckten oder handgeschriebenen Zeichens erhalten wird, verarbeitet, um ihm ein vorbestimmtes Merkmal zuzuordnen. Durch diesen Merkmalszuordnungsschritt werden mehrere Richtungskodes, wie in Fig. 22 gezeigt, selektiv den weißen Pixeln zugeordnet, die die Kontur des Zeichenabbildes begrenzen. Wie zuvor erläutert, kann ein anderer Satz Richtungskodes dazu verwendet werden, selektiv den schwarzen Pixeln zugeordnet zu werden, die die Kontur des Zeichenabbildes definieren. Ein solcher Merkmalszuordnungsschritt wird typischerweise durch Prüfung eines Pixelmusters ausgeführt, das durch ein interessierendes Pixel, zwei zur rechten und linken Seite gelegene Pixel und zwei oberhalb und unterhalb des interessierenden Pixels gelegene Pixel definiert wird, während die Rasterabtastung des Zeichenabbildes stattfindet. Simultan dazu werden die Gesamtzahl PE der Kode-zugeordneten Pixel (Merkmalspixel) und auf die X- und Y-Achsen projizierten Histogramme HXi und HYj erhalten und in Tabellen gespeichert. Ein Beispiel solcher Tabellen ist in Fig. 23 dargestellt.
In Fig. 23 ist ein Zeichenabbild 140 gezeigt, den bereits mehrere vorbestimmte Richtungskodes selektiv zugeordnet worden sind. Eine Serie von Zahlen am Kopf von Fig. 23 gibt das niedrigste Bit einer X-Adresse an, und eine Serie von Zahlen am linken Rand von Fig. 23 gibt die Y-Adresse an. Ein projiziertes Histogramm HXi der Merkmalspixel des Zeichenabbildes 140 auf der X-Achse und ein vergleichbares projiziertes Histogramm HYj auf der Y-Achse sind in Tabellen 142 bzw. 144 gespeichert. Das Zählen der Gesamtzahl solcher Merkmalspixel und die Bildung solcher Histogrammtabellen kann nach Abschluß des Merkmalszuordnungsschrittes ausgeführt werden. Vorzugsweise wird dies jedoch gleichzeitig mit dem Merkmalszuordnungsschritt ausgeführt, weil dadurch eine Verringerung der Anzahl der Abtastungen des Zeichenabbildes möglich wird, was die Verarbeitungszeitdauer verkürzt.
Anschließend wird das Zeichenabbild in N Sektionen in X-Richtung unterteilt (Schritt 112 bis 124) und in M Sektionen in Y-Richtung unterteilt (Schritte 126 bis 128), wodurch das Zeichenabbild in ein Netz N × M Unterbereiche unterteilt wird, von denen jeder soweit wie möglich gleichmäßig Merkmalspixel enthält. Hierdurch kann die Unterteilung eines Zeichenabbildes optimal in Abhängigkeit vom Grad der Verformung des Zeichenabbildes gegenüber der Standardform ausgeführt werden.
Dieses Zeichenunterteilungsverfahren wird nachfolgend im Detail näher erläutert. Nach Initialisierung der Zähler n und i und des Registers P (Schritt 112) wird der Zähler i erhöht (Schritt 116), und der Wert des Histogramms HXi entsprechend diesem Wert i wird aus der Tabelle ausgelesen und dem laufenden Wert des Registers P hinzuaddiert, wodurch der Wert des Registers P rückgesetzt wird (Schritt 118). Anschließend wird geprüft, ob der Wert des Registers P einen vorbestimmten Wert von (PE/N) Xm überschritten hat, oder nicht (Schritt 120). Wenn das Ergebnis negativ ist, dann geht der Ablauf zurück zum Schritt 114, um die genannten Schritte zu wiederholen. Tatsächlich wird bei dieser Routine während der Erhöhung der X-Adresse um 1 das Zeichenabbild rastermäßig abgetastet, um die Anzahl von P von Merkmalspixeln zu zählen, und dieses Zählergebnis wird mit (PE/N) Xn verglichen. Die Wiederholung einer solchen rastermäßigen Abtastung und darüber hinaus der rastermäßigen Abtastung zur Zählung der Gesamtzahl PE ist jedoch nicht effizient. Unter diesen Umständen werden in Übereinstimmung mit der vorliegenden Erfindung während des Merkmalszuordnungsschrittes, der die rastermäßige Abtastung notwendig macht, Histogramme HXi und HXj und die Gesamtzahl PE gleichzeitig erhalten, und diese Daten in geeigneter Weise in der Routine verwendet, um dadurch die Notwendigkeit einer wiederholten Rasterabtastung zu vermeiden und dadurch die Effizienz des Verfahrens zu steigern.
Wenn die Bedingung, daß P gleich oder größer als (PE/N) Xn erhalten worden ist, dann wird der laufende Zählwert des Zählers e als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite T von jener X-Adresse erhält, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 122). Es sei festgehalten, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite X = 0) des Zeichenabbildes entspricht, und daß der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Anschließend an den Schritt 122 wird der Zähler n erhöht (Schritt 124), und die Verarbeitung zur Ermittlung des nächsten Unterteilungspunktes wird ausgeführt. Diese Verarbeitung wird beendet, sobald die Bedingung n = N im Schritt 112 erreicht worden ist. Die Verfahrensschritte 126 bis 138 für die Unterteilungen in Y-Richtung sind ähnlich den Schritten 112 bis 124, die oben beschrieben wurden. An Stelle eines Zählers i, der der X-Adresse zugeordnet ist, wird jedoch von einem Zähler j Gebrauch gemacht, der der Y-Adresse zugeordnet ist (Schritte 126, 130, 136). Außerdem wird an Stelle eines Histogramms HXi auf ein Histogramm HYj Bezug genommen (Schritt 132), und die Anzahl von Unterteilungen im Schritt 134 wird auf M eingestellt. Wenn das Ergebnis der Ermittlung beim Schritt 134 positiv ist, dann geht der Verfahrensablauf zum Schritt 136 über, wo der laufende Zählwert j des Zählers j als Y-Adresse eines Endpunktes des n-ten Unterbereiches in Y-Richtung eingestellt wird, und ein Wert, der durch Subtraktion einer Bereichsüberlappungsbreite T von jener Y-Adresse erhalten wird, wird als Y-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in Y-Richtung bestimmt. Es sei angemerkt, daß der Startpunkt des ersten Unterbereiches in Y-Richtung mit der Oberseite des Zeichenabbildes übereinstimmt und der Endpunkt des M-ten Unterbereiches in Y-Richtung der Unterseite des Zeichenbildes entspricht. Da die Unterteilungspunkte in X- und Y-Richtung auf diese Weise bestimmt worden sind, wird das Zeichenabbild dann in ein Netz von N × M Unterbereiche in X- und Y-Richtung auf der Grundlage dieser Unterteilungspunkte unterteilt.
In Übereinstimmung mit der vorliegenden Ausführungsform werden die Zeichenabbilder, die in Fig. 30a und 30b dargestellt sind, so unterteilt, wie in den Fig. 24a bzw. 24b dargestellt ist. Es ist angemerkt, daß die Bedingungen M 3 und T = 0 angenommen worden sind. Eine schnelle Prüfung des oberen linken Unterbereiches in Fig. 24a zeigt die Anwesenheit einer Information über den oberen mittleren Strich des Zeichens "wu" an, was jedoch nicht der Fall ist, wenn die Verarbeitung unter Verwendung des bekannten Schemas mit festen Unterteilungspunkten erfolgt. Das gleiche gilt für den Fall, der in Fig. 24b dargestellt ist.
Unter Bezugnahme auf die Fig. 25a und 25b wird nun eine weitere Ausführungsform dieses Aspektes der vorliegenden Erfindung beschrieben. Schritt 150 dieser Ausführungsform entspricht dem Schritt 110 der vorangehend beschriebenen Ausführungsform. Im Schritt 150 erhält man jedoch, soweit Histogramme betroffen sind, nur HYj und nicht HXi. Der Verfahrensablauf geht dann zum Schritt 152 über, wo das Zeichenabbild in M Sektionen in Y-Richtung unterteilt wird, und dieser Schritt entspricht einer Folge von Schritten 126 bis 138 der vorangehend erläuterten Ausführungsform. Die Schritte 154 bis 168 werden zur Unterteilung des Zeichenabbildes in N Sektionen in X-Richtung ausgeführt. Jeder dieser Schritte wird nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i des Registers P (Schritt 154) wird der Zähler i erhöht (Schritt 156), und das Zeichenabbild wird in Y-Richtung für die X-Adresse entsprechend dem Zählwert i rastermäßig abgetastet, wodurch die Anzahl der Pixel in jeder Zeile gezählt wird (Schritt 160), denen Kodes zugeordnet sind, und dieser Wert Pi wird im Register P gespeichert (Schritt 162). Sodann wird geprüft, ob der Wert P des Registers P einen vorbestimmten Wert von (PE/(NXM) Xn) überschritten hat (Schritt 164). Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf zurück zum Schritt 158, um die genannten Schritte zu wiederholen. Wenn andererseits die Bedingung, daß P gleich oder größer als (PE/(NMX) Xn) erhalten worden ist, dann wird der laufende Zählwert i als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die man durch Abziehen eines Bereichsüberlappungsbetrages T von jener X-Adresse erhalten hat, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 166). Es sei ebenfalls angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes entspricht und der Endpunkt des letzten und daher M-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Im Anschluß an den Schritt 166 wird der Zähler n erhöht (Schritt 168), und das Verfahren geht auf Schritte über, mit denen der nächste Unterteilungspunkt bestimmt wird. Dieses Verfahren wird beendet, wenn die Bedingung n = N beim Schritt 156 erreicht worden ist. Auf diese Weise werden Unterteilungspunkte in X- und Y-Richtung bestimmt, so daß das Zeichenabbild in ein Netz aus N × m Unterbereiche in X- und Y-Richtung unterteilt ist.
Wie zuvor ausgeführt worden ist, sind die japanischen Katakana-Zeichen "nu" und "su" in der Gestalt einander ähnlich, wobei sich "nu" durch einen zusätzlichen Strich auszeichnet, der von links oben nach rechts unten in der Mitte verläuft. Um diese zwei Zeichen voneinander zu unterscheiden, spielt dieser zusätzliche Strich eine Schlüsselrolle. Wenn das Zeichen "nu" durch das Verfahren nach den Fig. 21a und 21b unterteilt wird, dann ergibt sich das in Fig. 26a dargestellte Unterteilungsergebnis. Eine Prüfung des linken Zwischenunterbereiches (1, 2) im Zeichenabbild von Fig. 26a zeigt die Tatsache, daß die Information bezüglich der geneigten Lage des zusätzlichen Striches in diesem Unterbereich nicht vorhanden ist. Andererseits zeigt Fig. 26b das Ergebnis, wenn dasselbe Zeichen "nu" einer Unterteilung nach dem vorliegenden Verfahren unterzogen worden ist, das in den Fig. 25a und 25b dargestellt ist. Es ist anzumerken, daß in Fig. 26b nur die Unterteilungen in X-Richtung für den mittleren Unterbereich in Y-Richtung dargestellt sind und die Bedingung T = 0 angenommen worden ist. Ein schneller Blick auf den linken Zwischen-Unterbereich (1, 2) genügt, um zu verstehen, daß der Unberbereich (1, 2) Information enthält, die in ausreichender Weise die Anwesenheit des geneigten zusätzlichen Striches angibt. Auf diese Weise kann die vorliegende Erfindung die Nachteile in der unter Bezugnahme auf die Fig. 21a und 21b beschriebenen Ausführungsform überwinden.
In der obigen Beschreibung sind Unterteilungen in Y-Richtung nach dem Verfahren entsprechend der vorangehenden Ausführungsform ausgeführt worden. Es sei jedoch angemerkt, daß nach den Unterteilungen in X-Richtung die Unterteilungen in Y-Richtung mit einem Verfahren ausgeführt werden können, das ähnlich dem in den Fig. 25a und 25b dargestellten Verfahren ist, um jede der Unterteilungen in X-Richtung auszuführen.
In der soeben beschriebenen Ausführungsform nach den Fig. 25a und 25b ergibt sich eine größere Streuung in der Anzahl von Pixeln zwischen den unterteilten Unterbereichen in den X- und Y-Richtungen im Falle, daß Merkmalspixel (d. h. Pixel, denen Kodes zugeordnet sind) in einem Bereichsüberlappungsabschnitt konzentriert sind, wenn Unterteilungspunkte unter Verwendung von PE/(NXM) als Bezug bestimmt werden. Die Fig. 27a und 27b zeigen eine weitere Ausführungsform dieses Aspektes der vorliegenden Erfindung, die in der Lage ist, dieses Problem zu überwinden. In dem Flußdiagramm nach den Fig. 27a und 27b entspricht der Schritt 170 dem Schritt 110 in den Fig. 21a und 21b. Der Verfahrensablauf geht dann zum Schritt 172 über, in welchem ein Zeichenabbild in Y-Richtung unterteilt wird. Dies entspricht einer Folge von Schritten 126 bis 138 in der in den Fig. 21a und 21b gezeigten Ausführungsform. Im Schritt 172 wird jedoch gleichzeitig mit den Unterteilungen in Y-Richtung auf das Histogramm HYj Bezug genommen und die Anzahl Pm der Merkmalspixel in jedem der Unterbereiche in Y-Richtung wird ermittelt. Der Verfahrensablauf geht dann zu einer Folge von Schritten 174 bis 188 über, die der Bestimmung von Unterteilungen in X-Richtung dienen. Diese Schritte 174 bis 188 werden nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i und des Registers P (Schritt 174) wird der Zähler i erhöht (Schrit 178) und dann wird für die X-Adresse entsprechend diesem Zählwert i das Zeichenabbild rastermäßig in Y-Richtung abgetastet, wodurch die Anzahl von Pixeln in dieser Zeile gezählt wird (Schritt 180), denen Kodes zugeordnet sind, und dieser Wert Pi wird dem laufenden Zählwert des Registers P hinzuaddiert (Schritt 182). Sodann wird geprüft, ob der Wert P des Registers P einen vorbestimmten Wert von (Pm/N) Xn im Schritt 184 überschritten hat, oder nicht. Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf zurück zum Schritt 178, um die gleichen Schritte zu wiederholen. Ist andererseits die Bedingung, daß P gleich oder größer als (Pm/N) Xn ist, erreicht worden ist, dann wird der laufende Zählwert des Zählers i als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die durch Abziehen einer Bereichsüberlappungsgröße T von jener X-Adresse ermittelt worden ist, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 186). Wie zuvor, sei auch hier angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes entspricht, während der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Nach dem Schritt 186 geht der Verfahrensablauf zum Schritt 188 über, wo der Zähler n erhöht wird, so daß zu einer weiteren Folge von Schritten zur Bestimmung des nächsten Unterteilungspunktes übergegangen wird. Dieser Verfahrensablauf wird beendet, sobald die Bedingung n = N im Schritt 176 erreicht worden ist. Auf diese Weise werden Unterteilungsstellen in X-Richtung für jede der in Y-Richtung unterteilten Sektionen bestimmt, so daß das Zeichenabbild als Ganzes in ein Netz von N × M Unterbereiche unterteilt wird.
Fig. 28a zeigt das Ergebnis, wenn das Zeichen "nu" in Übereinstimmung mit dem unter Bezugnahme auf die Fig. 25a und 25b beschriebenen Verfahren und unter der Annahme T = 1 unterteilt wird. Andererseits zeigt Fig. 28b das Ergebnis, wenn dasselbe Zeichen "nu" in Übereinstimmung mit der vorliegenden Erfindung unterteilt wird, wie sie soeben unter Bezugnahme auf die Fig. 27a bund 27b beschrieben worden ist, wieder mit der Annahme, daß T = 1. In beiden Fällen werden Unterteilungen zunächst in Y-Richtung ausgeführt, und sodann werden Unterteilungen in X-Richtung ausgeführt. Es sei auch angemerkt, daß Unterteilungen in X-Richtung nur in den mittleren Sektionen solcher in Y-Richtung unterteilten dargestellt sind. Ein Vergleich zwischen den zwei Ergebnissen, die in den Fig. 28a und 28b dargestellt sind, läßt schließen, daß der linke untere Zwischenunterbereich (1, 2) des Zeichenabbildes in Fig. 28b Information enthält, die die geneigte Gestalt des zusätzlichen Striches in der Mitte des Zeichens besser wiederspiegelt. Auf diese Weise ergibt sich selbst bei einer Anhäufung von Merkmalspixeln an einer Unterteilungsstelle die Möglichkeit, Unterteilungen in geeigneter Weise und optimal in Übereinstimmung mit der vorliegenden Erfindung jederzeit auszuführen.
Fig. 29 zeigt in Blockform ein System, das zur Ausführung eines jeden der oben beschriebenen Zeichenunterteilungsverfahren geeignet ist. Wie dargestellt, enthält das System einen Abbildspeicher 190 zur Speicherung eines zu verarbeitenden Zeichenabbildes mit Merkmalszuordnungen. In dem System ist weiterhin eine zentrale Prozessoreinheit (CPU) 192 und ein Hauptspeicher 194 angegeben, der ein Programm für jedes der obigen Verfahren und Tabellen für die beschriebenen Histogramme speichert, sowie die oben beschriebenen Zähler enthält. Die CPU 192 hat Zugang zum Bildspeicher 190, einer Abtastschaltung 191 und auch zum Hauptspeicher 194 über einen Bus 195, und umgekehrt. Im Betrieb führt die CPU 192, während sie Zugang zum Bildspeicher 190 hat, den Merkmalszuordnungsbetrieb sowie das Zählen der Gesamtzahl der Merkmalspixel und die Erzeugung von Histogrammen sämtlich zur gleichen Zeit aus. Das verarbeitete Zeichenabbild, dem Merkmale zugeordnet worden sind, wird in dem Bildspeicher 190 gespeichert, hingegen werden die Daten über die Gesamtzahl von Merkmalspixeln und die Histogramme im Hauptspeicher 194 gespeichert. Während der nachfolgenden Verarbeitung zur Bestimmung der Unterteilungsstellen führt die CPU 192 dann eine vorbestimmte Routine aus, bei der sie auf die Gesamtzahl der Merkmalspixel und auf die Histogrammtabellen Bezug nimmt, die in dem Hauptspeicher 194 gespeichert sind, sowie, soweit notwendig, auf das Zeichenabbild mit den Merkmalszuordnungen, das im Bildspeicher 190 gespeichert ist, und sodann wird das Ergebnis der so bestimmten Unterteilungsstellen in einem speziellen Speicherbereich des Hauptspeichers 194 gespeichert. Das System nach Fig. 29 ist daher als Teil eines Zeichenerkennungssystems in hohem Maße vorteilhaft.
Die obige Beschreibung ist anhand von verschiedenen Ausführungsformen der Erfindung gegeben worden, von denen ggf. abgewichen werden kann, ohne den Grundgedanken der Erfindung zu verlassen. Beispielsweise ist von Richtungskodes als einem Zeichenabbild zuzuordnenden Merkmalen Gebrauch gemacht worden. Es können jedoch auch andere spezifische Arten von Merkmalen verwendet werden.

Claims (51)

1. Zeichenerkennungsverfahren, enthaltend die folgenden Schritte:
optisches Lesen eines eingegebenen, zu erkennenden Zeichens zur Bildung eines binären Zeichenbildes, enthaltend wenigstens eine Zeichenzeile, die aus schwarzen Pixeln (Bildpunkten) besteht;
Verbreitern der Zeichenzeile in Übereinstimmung mit einer vorbestimmten Weise;
Zuordnen einer Mehrzahl erster Merkmale, die voneinander verschieden sind, zu jedem solcher Pixel, die eine Kontur des binären Zeichenabbildes definieren. In Abhängigkeit vom örtlichen Muster der Anordnung aus schwarzen und weißen Pixeln längs der Kontur;
Zählen der ersten Merkmale, die dem Zeichenabbild zugeordnet worden sind;
Unterteilen des Zeichenabbildes in eine Mehrzahl von Netzunterbereichen auf der Grundlage der Zählung der genannten zugeordneten ersten Merkmale;
Extrahieren eines zweiten Merkmals aus jedem der genannten Unterbereiche, um eine Sammlung von extrahierten zweiten Merkmalen zu definieren; und
Identifizieren des eingegebenen Zeichens durch einen Vergleich der genannten Sammlung extrahierter zweiter Merkmale mit jeder aus einer Mehrzahl von gespeicherten Sammlungen zweiter Merkmale für bekannte Zeichen und Auswählen jenes der bekannten Zeichen, das einen höchsten Grad von Ähnlichkeit aufweist.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Verbreiterungsschritt enthält: Ändern eines Paares weißer Pixel auf der linken und der rechten Seite eines jeden der schwarzen Pixel der Zeichenzeile in schwarze Pixel.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß der Verbreiterungsschritt auch enthält: Verändern eines Paares weißer Pixel über und unter jedem der schwarzen Pixel der Zeichenzeile in schwarze Pixel.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß mehrere der ersten Merkmale eine vorbestimmte Anzahl von Richtungskodes enthält, von denen jedes einer speziellen Musteranordnung von schwarzen und weißen Pixeln zugeordnet ist.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die spezielle Musteranordnung ein mittleres Pixel, ein Paar linker und rechter Pixel benachbart dem mittleren Pixel und ein Paar oberer und unterer Pixel benachbart dem mittleren Pixel aufweist, wodurch das mittlere Pixel als ein interessierendes Pixel dient, wenn der Zuordnungsschritt ausgeführt wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß das mittlere Pixel ein schwarzes Pixel ist.
7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß das mittlere Pixel ein weißes Pixel ist.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die die Kontur definierenden Pixel schwarze Pixel sind.
9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die die Kontur definierenden Pixel weiße Pixel sind.
10. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das zweite Merkmal ein Histogramm der ersten Merkmale in jedem der Unterbereiche ist.
11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Grad der Ähnlichkeit zwischen dem eingegebenen Zeichen und jedem der bekannten Zeichen durch Berechnung einer Distanz zwischen den zweiten Merkmalen des eingegebenen Zeichens und den zweiten Merkmalen eines jeden der bekannten Zeichen bestimmt wird.
12. Zeichenerkennungsverfahren, enthaltend die folgenden Schritte:
Erzeugen eines binären Zeichenabbildes eines bekannten, zu identifizierenden Zeichens;
Zuordnen mehrer Richtungskodes zu Pixeln, die eine Kontur des binären Zeichenabbildes definieren, selektiv entsprechend einer vorbestimmten Regel, um ein Zeichenabbild mit Kodezuordnungen zu definieren;
Zählen einer Gesamtzahl von Pixeln, denen Kodes zugeordnet sind;
Bilden eines Paares erster und zweiter projizierter Histogramme der Anzahl von Pixeln mit zugeordneten Kodes, wobei das erste projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine erste vorbestimmte Achse gebildet wird und das zweite projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine zweite vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit Kodezuordnungen in mehrere Unterbereiche auf der Grundlage der Gesamtzahl der Pixel mit zugeordneten Kodes und des Paares erster und zweiter Histogramme derart, daß jeder der Unterbereiche eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist;
Bestimmen eines Histogramms der genannten Kodes für jeden der genannten Unterbereiche zur Bildung einer Sammlung aus Histogrammen der Kodes für das eingegebene Zeichen; und
Identifizieren des eingegebenen Zeichens durch Vergleichen der Sammlung von Kodehistogrammen mit jedem aus einer Vielzahl von gespeicherten Sammlungen aus Histogrammen der Kodes für bekannte Zeichen und Auswählen eines der bekannten Zeichen, das den höchsten Grad von Ähnlichkeit aufweist.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß das binäre Zeichenabbild durch optische Abtastung des unbekannten Zeichens erzeugt wird.
14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die Zuordnungs- und Zählschritte gleichzeitig ausgeführt werden.
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, daß die Zuordnungs- und Zählschritte durch Abtastung des binären Zeichenabbildes ausgeführt werden.
16. Verfahren nach Anspruch 14, dadurch gekennzeichnet, daß die Zuordnungs- und Zählschritte gleichzeitig mit der Erzeugung des binären Zeichenabbildes ausgeführt werden.
17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß das binäre Zeichenabbild durch optisches Abtasten des unbekannten Zeichens erzeugt wird.
18. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß jeder der Richtungskodes einem speziellen Anordnungsmuster aus schwarzen und weißen Pixeln zugeordnet ist.
19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, daß die spezielle Musteranordnung ein mittleres Pixel, ein Paar linker und rechter Pixel benachbart dem mittleren Pixel und ein Paar oberer und unterer Pixel benachbart dem mittleren Pixel aufweist, wodurch das mittlere Pixel als ein interessierendes Pixel dient, wenn der Zuordnungsschritt ausgeführt wird.
20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß das mittlere Pixel ein schwarzes Pixel ist.
21. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß das mittlere Pixel ein weißes Pixel ist.
22. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die die Kontur definierenden Pixel schwarze Pixel sind.
23. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die die Kontur definierenden Pixel weiße Pixel sind.
24. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß der Grad der Ähnlichkeit zwischen dem eingegebenen Zeichen und jedem der bekannten Zeichen durch Berechnung einer Distanz zwischen der Sammlung aus Histogrammen der genannten Kodes des eingegebenen Zeichens und der Sammlung von Histogrammen von Kodes eines jeden der bekannten Zeichen bestimmt wird.
25. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die ersten und zweiten vorbestimmten Richtungen sich senkrecht zueinander erstrecken.
26. Verfahren nach Anspruch 25, dadurch gekennzeichnet, daß die erste Richtung eine horizontale Richtung und die zweite Richtung eine vertikale Richtung ist.
27. Zeichenerkennungsverfahren, enthaltend die folgenden Schritte:
Erzeugen eines binären Zeichenabbildes eines unbekannten, zu identifizierenden Zeichens;
Zuordnen einer Mehrzahl von Richtungskodes zu Pixeln, die eine Kontur des binären Zeichenabbildes definieren, selektiv entsprechend einer vorbestimmten Regel, um ein Zeichenabbild mit zugeordneten Kodes zu definieren;
Zählen einer Gesamtzahl von Pixeln, denen Kodes zugeordnet sind;
Bilden eines ersten projizierten Histogramms aus Pixeln, denen Kodes zugeordnet sind, wobei das erste projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine erste vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit zugeordneten Kodes in eine Mehrzahl erster Sektionen in der ersten vorbestimmten Achse auf der Grundlage der Gesamtzahl von Pixeln, denen Kodes zugeordnet sind, und des ersten projizierten Histogramms derart, daß jede der ersten Sektionen eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist;
Unterteilen einer jeden der ersten Sektionen in eine Mehrzahl von zweiten Sektionen derart, daß jede der zweiten Sektionen eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist, um dadurch das Zeichenabbild mit zugeordneten Kodes in eine Mehrzahl von Unterbereichen in Form eines Netzes zu unterteilen;
Bestimmen eines Histogramms der genannten Kodes für jeden der Unterbereiche zur Bildung einer Sammlung aus Histogrammen der genannten Kodes für das eingegebene Zeichen; und
Identifizieren des eingegebenen Zeichens durch Vergleichen der Sammlung aus Histogrammen der genannten Kodes mit jeder aus einer Mehrzahl gespeicherter Sammlungen von Histogrammen der genannten Kodes für bekannte Zeichen und Auswählen eines der bekannten Zeichen, das einen höchsten Grad von Ähnlichkeit aufweist.
28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß eine Anzahl von Pixeln, denen Kodes zugeordnet sind, in jeder der ersten Richtungen gezählt wird, bevor jede der ersten Sektionen unterteilt wird.
29. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß das binäre Abbild durch optisches Abtasten des unbekannten Zeichens erzeugt wird.
30. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß die Kodezuordnung und das Zählen der Gesamtzahl von Pixeln, die zugeordnete Kodes aufweisen, gleichzeitig ausgeführt wird.
31. Verfahren nach Anspruch 30, dadurch gekennzeichnet, daß das Zuordnen der Kodes und das Zählen der Gesamtzahl der Pixel, denen Kodes zugeordnet sind, durch Abtastung des binären Zeichenabbildes ausgeführt werden.
32. Verfahren nach Anspruch 30, dadurch gekennzeichnet, daß das Zuordnen der Kodes und das Zählen der Pixel simultan mit der Erstellung des binären Zeichenabbildes ausgeführt werden.
33. Verfahren nach Anspruch 32, dadurch gekennzeichnet, daß das binäre Zeichenabbild durch optisches Abtasten des unbekannten Zeichens erzeugt wird.
34. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß jeder der Richtungskodes einer speziellen Musteranordnung aus weißen und schwarzen Pixeln zugeordnet ist.
35. Verfahren nach Anspruch 34, dadurch gekennzeichnet, daß die spezielle Musteranordnung ein mittleres Pixel, ein Paar linker und rechter Pixel benachbart dem mittleren Pixel und ein Paar obere und untere Pixel benachbart dem mittleren Pixel aufweist, wodurch das mittlere Pixel als ein interessierendes Pixel dient, wenn der Zuordnungsschritt ausgeführt wird.
36. Verfahren nach Anspruch 35, dadurch gekennzeichnet, daß das mittlere Pixel ein schwarzes Pixel ist.
37. Verfahren nach Anspruch 35, dadurch gekennzeichnet, daß das mittlere Pixel ein weißes Pixel ist.
38. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß die die Kontur definierenden Pixel schwarze Pixel sind.
39. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß die die Kontur definierenden Pixel weiße Pixel sind.
40. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß das Ausmaß an Ähnlichkeit zwischen dem eingegebenen Zeichen und jeden der bekannten Zeichen durch Berechnung einer Distanz zwischen der Sammlung von Histogrammen der Kodes des eingegebenen Zeichens und der Sammlung von Histogrammen der Kodes von jedem der bekannten Zeichen bestimmt wird.
41. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß die ersten und zweiten vorbestimmten Richtungen sich senkrecht zueinander erstrecken.
42. Verfahren nach Anspruch 41, dadurch gekennzeichnet, daß die erste Richtung eine horizontale Richtung und die zweite Richtung eine vertikale Richtung ist.
43. Zeichenerkennungsverfahren, enthaltend die folgenden Schritte:
Erzeugen eines binären Zeichenabbildes eines eingegebenen Zeichens;
Zuordnen einer Mehrzahl vorbestimmter Merkmale zu dem binären Zeichenabbild selektiv in Übereinstimmung mit einer vorbestimmten Regel, um dadurch ein Zeichenabbild mit zugeordneten Merkmalen zu definieren;
Zählen einer Gesamtzahl von zugeordneten Merkmalen;
Bilden eines Paares erster und zweiter projizierter Histogramme der zugeordneten Merkmale, wobei das erste projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine erste vorbestimmte Achse gebildet wird und das zweite projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine zweite vorbestimmte Achse gebildet wird; und
Unterteilen des Zeichenabbildes mit zugeordneten Merkmalen in eine Mehrzahl von Unterbereichen auf der Grundlage der genannten Gesamtzahl zugeordneter Merkmale und des Paares erster und zweiter projizierter Histogramme derart, daß jeder der Unterbreiche an den genannten zugeordneten Merkmalen im wesentlichen in gleicher Zahl teilhat.
44. Verfahren nach Anspruch 43, dadurch gekennzeichnet, daß die Zuordnungs- und Zählschritte gleichzeitig ausgeführt werden.
45. Verfahren nach Anspruch 44, dadurch gekennzeichnet, daß die Erzeugung des binären Zeichenabbildes gleichzeitig mit den Zuordnungs- und Zählschritten ausgeführt wird.
46. Verfahren nach Anspruch 43, dadurch gekennzeichnet, daß die Erzeugung des binären Abbildes durch optisches Abtasten des angegebenen Zeichens ausgeführt wird.
47. Zeichenunterteilungsverfahren enthaltend die folgenden Schritte:
Erzeugen eines binären Zeichenabbildes eines eingegebenen Zeichens;
Zuordnen mehrerer vorbestimmter Merkmale zu dem binären Zeichenabbild selektiv in Übereinstimung mit einer vorbestimmten Regel, um dadurch ein Zeichenabbild mit zugeordneten Merkmalen zu definieren;
Zählen einer Gesamtzahl zugeordneter Merkmale;
Bilden eines ersten projizierten Histogramms der zugeordneten Merkmale, wobei das erste projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine erste vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit zugeordneten Merkmalen in eine Mehrzahl erster Sektionen in der ersten vorbestimmten Achse auf der Grundlage der genannten Gesamtzahl und des ersten projizierten Histogramms derart, daß jede der ersten Sanktionen an den zugeordneten Merkmalen in im wesentlichen gleicher Zahl teilhat; und
Unterteilen einer jeden der ersten Sektionen in eine Mehrzahl zweiter Sektionen derart, daß jede der zweiten Sektionen eine im wesentlichen gleiche Zahl der zugeordneten Merkmale aufweist, um dadurch das Zeichenbild mit zugeordneten Merkmalen in eine Mehrzahl von Unterbereichen in Form eines Netzes zu unterteilen.
48. Verfahren nach Anspruch 47, dadurch gekennzeichnet, daß die Zuordnungs- und Zählschritte gleichzeitig ausgeführt werden.
49. Verfahren nach Anspruch 48, dadurch gekennzeichnet, daß die Erzeugung des binären Zeichenabbildes gleichzeitig mit dem Zuordnungs- und Zählschritten ausgeführt wird.
50. Verfahren nach Anspruch 47, dadurch gekennzeichnet, daß die Erzeugung des binären Zeichenabbildes durch optisches Abtasten des eingegebenen Zeichens ausgeführt wird.
51. Verfahren nach Anspruch 47, dadurch gekennzeichnet, daß eine Anzahl von zugeordneten Merkmalen in jeder der ersten Sektionen gezählt wird, bevor jede der ersten Sektionen unterteilt wird.
DE19873716787 1986-05-19 1987-05-19 Zeichenerkennungsverfahren Granted DE3716787A1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP61114042A JPS62269286A (ja) 1986-05-19 1986-05-19 文字認識方式
JP61249159A JPS63103392A (ja) 1986-10-20 1986-10-20 文字認識方式
JP61251537A JPH0795335B2 (ja) 1986-10-22 1986-10-22 領域分割方法

Publications (2)

Publication Number Publication Date
DE3716787A1 true DE3716787A1 (de) 1987-11-26
DE3716787C2 DE3716787C2 (de) 1990-09-06

Family

ID=27312638

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19873716787 Granted DE3716787A1 (de) 1986-05-19 1987-05-19 Zeichenerkennungsverfahren

Country Status (3)

Country Link
US (1) US4903312A (de)
DE (1) DE3716787A1 (de)
GB (1) GB2190778B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3923914A1 (de) * 1988-07-20 1990-02-15 Ricoh Kk Verfahren zum extrahieren eines zeichenmerkmals
WO1991017518A1 (en) * 1990-05-07 1991-11-14 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504822A (en) * 1986-09-19 1996-04-02 Holt; Arthur W. Character recognition system
US4905295A (en) * 1986-11-13 1990-02-27 Ricoh Company, Ltd. Code sequence matching method and apparatus
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JPH07120385B2 (ja) * 1987-07-24 1995-12-20 シャープ株式会社 光学的読取り方法
US5046115A (en) * 1987-10-26 1991-09-03 Kabushiki Kaishakomatsu Seisakusho Method of processing image data on crack
US5031225A (en) * 1987-12-09 1991-07-09 Ricoh Company, Ltd. Character recognition method for recognizing character in an arbitrary rotation position
US5247587A (en) * 1988-07-15 1993-09-21 Honda Giken Kogyo Kabushiki Kaisha Peak data extracting device and a rotary motion recurrence formula computing device
US5195147A (en) * 1989-05-02 1993-03-16 Ricoh Company, Ltd. Image forming apparatus
JP2542947B2 (ja) * 1990-05-09 1996-10-09 大日本スクリーン製造株式会社 画像処理装置
US5020121A (en) * 1990-08-16 1991-05-28 Hewlett-Packard Company Neighborhood block prediction bit compression
US5121440A (en) * 1990-08-30 1992-06-09 Monolithic Resources Corporation Analog video character recognition system
US5428692A (en) * 1991-11-18 1995-06-27 Kuehl; Eberhard Character recognition system
US5307424A (en) * 1990-12-12 1994-04-26 Eberhard Kuehl Character recognition system
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5515455A (en) * 1992-09-02 1996-05-07 The Research Foundation Of State University Of New York At Buffalo System for recognizing handwritten words of cursive script
JP3106021B2 (ja) * 1992-11-30 2000-11-06 キヤノン株式会社 パターンデータの圧縮方法及び装置と出力方法及び装置
JPH06203165A (ja) * 1993-01-07 1994-07-22 Canon Inc 画像情報処理方法及び装置
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters
JPH06348800A (ja) * 1993-06-02 1994-12-22 Canon Inc 画像処理方法及び装置
US5444793A (en) * 1993-06-15 1995-08-22 Ncr Corporation Method for detecting machine printed monetary amounts in binary images
JPH07129720A (ja) * 1993-11-04 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置
JPH08194780A (ja) * 1994-11-18 1996-07-30 Ricoh Co Ltd 特徴抽出方法
US5802207A (en) * 1995-06-30 1998-09-01 Industrial Technology Research Institute System and process for constructing optimized prototypes for pattern recognition using competitive classification learning
JP4305971B2 (ja) * 1998-06-30 2009-07-29 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US7221810B2 (en) * 2000-11-13 2007-05-22 Anoto Group Ab Method and device for recording of information
JP4161659B2 (ja) * 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
JP4047090B2 (ja) * 2002-07-31 2008-02-13 キヤノン株式会社 画像処理方法及び画像処理装置
US7190834B2 (en) * 2003-07-22 2007-03-13 Cognex Technology And Investment Corporation Methods for finding and characterizing a deformed pattern in an image
US7388990B2 (en) * 2003-09-22 2008-06-17 Matrox Electronics Systems, Ltd. Local mass distribution partitioning for object recognition
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US7525034B2 (en) * 2004-12-17 2009-04-28 Nease Joseph L Method and apparatus for image interpretation into sound
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8749839B2 (en) * 2005-03-24 2014-06-10 Kofax, Inc. Systems and methods of processing scanned data
JP2009070226A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd マッチング装置
TWI374658B (en) * 2007-09-29 2012-10-11 Htc Corp Image process method
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
EP2973226A4 (de) 2013-03-13 2016-06-29 Kofax Inc Klassifizierung von objekten auf mit mobilvorrichtungen aufgenommenen digitalbildern
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
JP2016518790A (ja) 2013-05-03 2016-06-23 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法
WO2015073920A1 (en) 2013-11-15 2015-05-21 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10163004B2 (en) 2017-03-30 2018-12-25 Konica Minolta Laboratory U.S.A., Inc. Inferring stroke information from an image
US10579893B2 (en) 2017-02-28 2020-03-03 Konica Minolta Laboratory U.S.A., Inc. Inferring stroke information from an image
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3755780A (en) * 1971-06-28 1973-08-28 Pattern Analysis & Recognition Method for recognizing characters
US3803553A (en) * 1972-06-14 1974-04-09 Hitachi Ltd Character recognition apparatus
US4254400A (en) * 1978-12-13 1981-03-03 Hitachi, Ltd. Image data processor
DE2801536C2 (de) * 1977-01-14 1983-05-05 NCR Canada Ltd. - NCR Canada LTEE, Toronto, Ontario Zeichenformkodiervorrichtung

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5418632A (en) * 1977-07-12 1979-02-10 Nippon Telegr & Teleph Corp <Ntt> Character identification system
US4162482A (en) * 1977-12-07 1979-07-24 Burroughs Corporation Pre-processing and feature extraction system for character recognition
US4229768A (en) * 1978-03-30 1980-10-21 Canon Kabushiki Kaisha Information processing apparatus
JPS596421B2 (ja) * 1978-08-28 1984-02-10 肇産業株式会社 パタ−ン情報処理方法
US4300122A (en) * 1979-04-02 1981-11-10 Sperry Corporation Apparatus for processing digital data representative of a two-dimensional image
US4688088A (en) * 1984-04-20 1987-08-18 Canon Kabushiki Kaisha Position detecting device and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3755780A (en) * 1971-06-28 1973-08-28 Pattern Analysis & Recognition Method for recognizing characters
US3803553A (en) * 1972-06-14 1974-04-09 Hitachi Ltd Character recognition apparatus
DE2801536C2 (de) * 1977-01-14 1983-05-05 NCR Canada Ltd. - NCR Canada LTEE, Toronto, Ontario Zeichenformkodiervorrichtung
US4254400A (en) * 1978-12-13 1981-03-03 Hitachi, Ltd. Image data processor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3923914A1 (de) * 1988-07-20 1990-02-15 Ricoh Kk Verfahren zum extrahieren eines zeichenmerkmals
WO1991017518A1 (en) * 1990-05-07 1991-11-14 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition

Also Published As

Publication number Publication date
GB8711738D0 (en) 1987-06-24
GB2190778B (en) 1990-04-25
GB2190778A (en) 1987-11-25
US4903312A (en) 1990-02-20
DE3716787C2 (de) 1990-09-06

Similar Documents

Publication Publication Date Title
DE3716787C2 (de)
DE3633743C2 (de)
DE3806223C2 (de) Verfahren zur Erzeugung von Zeichenmustern
DE69723220T2 (de) Gerät und Verfahren zur Extrahierung von Tabellengeraden innerhalb normaler Dokumentbilder
DE60129872T2 (de) Verfahren zur Extrahierung von Titeln aus numerischen Bildern
DE60120810T2 (de) Verfahren zur Dokumenterkennung und -indexierung
DE69721941T2 (de) Gerät und Verfahren zum Extrahieren von Mustern
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE60204005T2 (de) Verfahren und einrichtung zur erkennung eines handschriftlichen musters
DE3425449A1 (de) Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung
DE4427992C2 (de) Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments
DE3440377A1 (de) Verfahren zum verkleinern eines zeichenschriftsatzes
DE3342947A1 (de) Verfahren zur behandlung der daten eines binaeren grafischen musters und system dafuer
DE3722444A1 (de) Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten
EP0402868B1 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE3815869C2 (de)
EP2082357B1 (de) Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE19531392C1 (de) Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
WO2005119580A1 (de) Verfahren und einrichtung zur strukturanalyse eines dokuments
DE4119091A1 (de) Verfahren und einrichtung zum erkennen von zeichen
DE60217748T2 (de) Verfahren und Gerät zur Anzeige eines Bildraumes
DE2623861B2 (de) Verfahren zum maschinellen Lesen von Schriftzeichen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee