DE3716787A1 - Zeichenerkennungsverfahren - Google Patents
ZeichenerkennungsverfahrenInfo
- Publication number
- DE3716787A1 DE3716787A1 DE19873716787 DE3716787A DE3716787A1 DE 3716787 A1 DE3716787 A1 DE 3716787A1 DE 19873716787 DE19873716787 DE 19873716787 DE 3716787 A DE3716787 A DE 3716787A DE 3716787 A1 DE3716787 A1 DE 3716787A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- pixels
- codes
- character image
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
Die vorliegende Erfindung bezieht sich auf ein Zeichenerkennungsverfahren
und speziell auf ein Verfahren zur Erkennung eines Zeichens durch veränderliche Unterteilung
eines Zeichenbereiches, in welchem ein zu erkennendes Zeichen
angeordnet ist. Die vorliegende Erfindung bezieht sich
weiterhin auf ein Verfahren zur Unterteilung eines Zeichenbereiches
zur Verwendung bei der Zeichenerkennung.
Bei der maschinellen Erkennung von handgeschriebenen,
maschinengeschriebenen oder gedruckten Zeichen wird das zu
erkennende Zeichen zunächst von einem Abtaster optisch
gelesen, d. h. abgetastet, um ein binäres Abbild des Zeichens
zu definieren, und anschließend wird ein Zeichenbereich, der
darin das so definierte binäre Abbild enthält, in eine
Mehrzahl von Unterbereichen unterteilt, woran sich das Extrahieren
von Merkmalen für jeden der Unterbereiche anschließt.
Bei der bekannten Zeichenerkennungstechnologie
wurde die Bereichsunterteilung unter Verwendung fester
Unterteilungspunkte ausgeführt, wie in der JP-OS 56-110 191
beschrieben, oder durch variable Bestimmung von Unterteilungspunkten,
wobei ein Schwerpunkt der Konturverteilung
des zu erkennenden Zeichens verwendet wird, wie in "Oki
Electric Research and Development", Dezember 1983, 121,
Band 50, Nr. 3. Seite 77 bis 82, beschrieben. Bei dem erstgenannten
Verfahren hat sich jedoch gezeigt, daß die festen
Unter-Unterteilungspunkte häufig ungeeignet sind, da in
einem zu erkennenden Zeichen Verformungen vorhanden sind,
so daß Zeichenmerkmale nicht richtig extrahiert werden
konnten, wodurch die Zeichenerkennungsfähigkeit herabgesetzt
wurde. Das Verfahren mit solchen Festpunkten für die Unterteilung
ist daher nicht geeignet, Verformungen in den zu
erkennenden Zeichen Rechnung zu tragen. Das zweitgenannte
Verfahren, das den Schwerpunkt eines Zeichens verwendet,
ist auf Zeichenverformungen weniger empfindlich. Der für
die Unterteilungen eines Zeichenbereiches erforderliche Berechnungsaufwand
ist jedoch enorm, da dieses Verfahren den
Schwerpunkt der Konturverteilung des Zeichens verwendet,
so daß dieses Verfahren im allgemeinen sehr langsam abläuft.
Um die oben beschriebenen Probleme zu überwinden, ist bereits
ein Zeichenerkennungsverfahren vorgeschlagen worden, das in
der japanischen Patentanmeldung 59-217 716 seinen Niederschlag
gefunden hat und die meisten der oben beschriebenen
Nachteile beseitigt. Dennoch bleiben noch immer Forderungen
zu erfüllen, die sich aus der Unterscheidung einander ähnlicher
Zeichen und der Erkennung verformter Zeichen oder gedruckter
oder handgeschriebener Zeichen geringe Qualität
ergeben.
Der Erfindung liegt daher die Aufgabe zugrunde, die Nachteile
des oben beschriebenen Standes der Technik zu überwinden
und ein verbessertes Zeichenerkennungsverfahren
anzugeben, das in der Lage ist, auch schlecht dargestellte,
insbesondere verformte Zeichen zu erkennen.
Diese Aufgabe wird durch die im Anspruch 1 angegebene Erfindung
gelöst. Weitere, dasselbe Lösungsprinzip verfolgende
Lösungen sind Gegenstand der Ansprüche 12, 27, 43 und 47.
Vorteilhafte Ausgestaltungen derselben sind Gegenstand der
jeweils abhängigen Ansprüche.
Gemäß einem Aspekt der Erfindung wird ein zu erkennendes
Zeichen zunächst optisch gelesen, um ein binäres Zeichenabbild
zu erzeugen, das anschließend einer Zeilenverbreiterung
unterzogen wird, um die das Zeichen bildenden Zeilen
zu verbreitern. Anschließend werden mehrere Richtungs- oder
Bündelungskodes der Kontur des Zeichenbildes selektiv zugeordnet
und das Zeichenbild mit den zugeordneten Richtungskodes
wird abgetastet, um diese Richtungs- oder Bündelungskodes
zu berechnen. Basierend auf den berechneten Ergebnissen
werden dann Unterteilungsstellen bestimmt, und
das Zeichenabbild wird unter Verwendung dieser Unterteilungsstellen
unterteilt. Dann wird ein Merkmal, wie beispielsweise
ein Histogramm für jeden der Richtungskodes, aus jedem der
unterteilten Bereiche extrahiert. Sodann werden die extrahierten
Merkmale mit den für bekannte Zeichen in einer
Bibliothek gespeicherten Merkmalen verglichen, um automatisch
die Identität des zu erkennenden Zeichens zu ermitteln.
In Übereinstimmung mit einem anderen Aspekt der vorliegenden
Erfindung ist ein Zeichenerkennungsverfahren vorgesehen,
gemäß welchem mehrere Richtungskodes selektiv der Kontur
eines binären Zeichenabbildes entsprechend einem zu erkennenden
Zeichen zugeordnet werden, und sodann werden die Gesamtzahl
der zugeordneten Richtungskodes und die auf X- und
Y-Achsen projizierten Histogramme erhalten. Sodann
wird auf der Grundlage dieser erhaltenen Gesamtzahl und der projizierten
Histogramme das binäre Zeichenabbild in mehrere
Maschenbereiche in X- und Y-Richtung unterteilt, wobei
jeder Maschenbereich die zugeordneten Richtungskodes im
wesentlichen gleichmäßig enthält. Sodann wird ein weiteres
Histogramm in bezug auf die Richtungskodes für jeden der
Maschenbereiche erhalten. Das so erhaltene Histogramm wird
dann mit jenen verglichen, die in einer Bibliothek für
bekannte Zeichen gespeichert sind, um die Identität des zu
erhaltenden Zeichens zu bestimmen.
In Übereinstimmung mit einem weiteren Aspekt der vorliegenden
Erfindung ist ein Verfahren zur Optimierung der Unterteilungsstellen
eines Zeichenabbildes vorgesehen, wobei bei
der Zeichenerkennung ein zu erkennendes Zeichen zunächst
optisch durch einen Bildabtaster gelesen wird, um das Zeichen
in ein binäres Abbild umzuformen, das dann in mehrere
Maschenbereiche oder Unterbereiche unterteilt wird, um
Merkmale aus jedem der Unterbereiche zu extrahieren. Eine
erfolgreiche Extraktion solcher Merkmale hängt von einer geeigneten
Bestimmung der Unterteilungsstellen ab. In Üereinstimmung
mit diesem Aspekt der vorliegenden Erfindung
ist ein Verfahren zur Unterteilung eines Zeichenbereiches
vorgesehen, bei dem ein vorbestimmtes Merkmal einem binären
Zeichenabbild zugeordnet wird, und die Gesamtzahl von Pixeln
(Bildpunkten), die das zugeordnete Merkmal enthalten, und
auf X- und Y-Achsen projizierte Histogramme werden erhalten,
auf deren Grundlage das binäre Zeichenabbild in eine Mehrzahl
von Maschenbereiche im X- und Y-Richtung unterteilt
wird, wobei jeder Maschenbereich die Pixels mit dem zugeordneten
Merkmal im wesentlichen gleichmäßig enthält.
Ein Vorteil der vorliegenden Erfindung besteht darin, daß
das Zeichenerkennungsverfahren eine hohe Betriebsgeschwindigkeit
hat, eine hohe Genauigkeit und Erkennungsrate liefert
und einen einfachen Aufbau der Vorrichtung zur Durchführung
ermöglicht.
Ein weiterer Vorteil der Erfindung besteht darin, daß Zeichen
automatisch erkannt werden können, auch wenn diese deformiert
sind oder schwach geschrieben oder gedruckt sind.
Vorteilhaft an der Erfindung ist weiterhin, daß ein Bereich,
in welchem ein Zeichen angeordnet ist, in eine Mehrzahl von
Unterbereichen optimal unterteilt werden kann.
Weitere Ziele, Vorteile und neue Merkmale der vorliegenden
Erfindung werden anschließend unter Bezugnahme auf die
Zeichnungen näher erläutert. Es zeigt
Fig. 1 ein Flußdiagramm des Verfahrensablauf zur automatischen
Erkennung eines Eingabezeichens in Übereinstimmung
mit einer Ausführungsform der vorliegenden
Erfindung;
Fig. 2 ein Blockdiagramm, das schematisch den Gesamtaufbau
eines optischen Zeichenerkennungssystems zur Ausführung
der Schritte in Fig. 1 zeigt;
Fig. 3 eine Darstellung, die ein Beispiel eines binären
Zeichenabbildes in Form einer Punktmatrix zeigt,
die durch optische Abtastung des Buchstabens "B"
erhalten wird;
Fig. 4 eine Darstellung, die das Ergebnis zeigt, wenn eine
Zeilenverbreiterung auf das binäre Zeichenabbild
nach Fig. 3 angewendet worden ist;
Fig. 5 eine Darstellung des Ergebnisses, wenn mehrere
vorbestimmte Richtungskodes selektiv der Kontur des
verbreiterten binären Zeichenkodes nach Fig. 4 zugeordnet
worden sind. Weiterhin zeigt Fig. 5 das Ergebnis
der Unterteilungen des Abbildes;
Fig. 6 eine schematische Darstellung, die die Korrespondenz
zwischen mehreren Richtungskodes, die selektiv den
weißen Umrißpixeln eines binären Zeichenabbildes
zuzuordnen sind, und Pixelmustern zeigt;
Fig. 7 ein Flußdiagramm des Ablaufs der Schritte in einem
Verfahren von Zeichenunterteilungen, das zur Anwendung
auf das Zeichenerkennungsverfahren nach Fig. 1
geeignet ist;
Fig. 8 ein Flußdiagramm, das die Schrittablauffolge eines
Zeichenerkennungsvorganges in Übereinstimmung mit
einer anderen Ausführungsform der vorliegenden Erfindung
zeigt;
Fig. 9 ein Blockdiagramm, das den Aufbau eines optischen
Zeichenerkennungssystems zur Ausführung des Verfahrens
nach Fig. 8 zeigt;
Fig. 10 eine schematische Darstellung, daß die Korrespondenzen
zwischen mehreren Richtungskodes, die selektiv
in weißen Umrißpixeln eines binären Zeichenabbildes
zuzuordnen sind, und Pixelmustern zeigt;
Fig. 11 eine Darstellung, die ein binäres Zeichenabbild für
ein handgeschriebenes japanisches Katakana-Zeichen
"a" nach der Vorverarbeitung zeigt;
Fig. 12 eine Darstellung, die die Ergebnisse zeigt, wenn
ein Satz von Richtungskodes für schwarze Umrißpixel
selektiv den Umriß-Schwarzpixeln des binären Zeichenabbildes
nach Fig. 11 zugeordnet worden ist;
Fig. 13 eine Darstellung, die das Ergebnis zeigt, wenn ein
Satz Richtungskodes für weiße Umrißpixel selektiv
den Umriß-Weißpixeln des binären Zeichenabbildes
nach Fig. 11 zugeordnet worden ist;
Fig. 14 eine Darstellung, die ein Beispiel von X- und Y-
Histogrammen für ein binäres Zeichenabbild zeigt,
dessen Umriß ein Satz von Richtungskodes selektiv
zugeordnet worden ist;
Fig. 15 ein Flußdiagramm, das die Schrittablauffolge in
einem Zeichenunterteilungsverfahren zeigt, das
vorteilhafterweise auf das Zeichenerkennungsverfahren
nach Fig. 8 angewendet werden kann;
Fig. 16 eine Darstellung, das die Ergebnisse einer Zeichenunterteilung
zeigt, die mit dem Verfahren nach
Fig. 15 ausgeführt worden ist;
Fig. 17 ein Flußdiagramm, das die Schrittablauffolge eines
anderen Zeichenunterteilungsverfahrens zeigt, das
ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren
nach Fig. 8 angewendet werden
kann.
Fig. 18 eine Darstellung der Ergebnisse einer Zeichenunterteilung,
die nach dem Verfahren nach Fig. 17 ausgeführt
wird;
Fig. 19 ein Flußdiagramm, das die Schrittablauffolge eines
weiteren Zeichenunterteilungsverfahrens zeigt, das
ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren
nach Fig. 8 anwendbar ist;
Fig. 20 eine Darstellung des Ergebnisses einer Zeichenunterteilung,
die nach dem Verfahren nach Fig. 19
abläuft;
Fig. 21 ein Schema, wie die Fig. 21a und 21b zusammenzusetzen
sind;
Fig. 21a und 21b zusammen ein Flußdiagramm, das die
Schrittablauffolge eines Zeichenunterteilungsverfahrens
zeigt, das in Übereinstimmung mit einer Ausführungsform
der vorliegenden Erfindung gestaltet
ist und vorteilhafterweise auf ein Zeichenerkennungsverfahren
anwendbar ist;
Fig. 22 eine Darstellung einer Mehrzahl von Richtungskodes,
die grundsätzlich den Richtungskodes nach Fig. 6
entsprechen;
Fig. 23 eine Darstellung eines Beispiels eines Histogrammes
für die Merkmalspixel eines binären Zeichenabbildes;
Fig. 24a und 24b Darstellungen der Ergebnisse von Zeichenunterteilungen,
wenn diese durch das Verfahren nach
den Fig. 21a und 21b ausgeführt werden;
Fig. 25 eine schematische Darstellung, wie die Fig. 25a
und 25b zusammenzusetzen sind;
Fig. 25a und 25b zusammen ein Flußdiagramm, das die Schrittablauffolge
eines weiteren Zeichenunterteilungsverfahrens
zeigt, das gemäß einem weiteren Ausführungsbeispiel
der vorliegenden Erfindung gestaltet ist
und ebenfalls vorteilhaft auf ein Zeichenerkennungsverfahren
angewendet werden kann;
Fig. 26a und 26b Darstellungen der Ergebnisse einer Zeichenunterteilung,
die nach den Verfahren nach den
Fig. 21a und 21b bzw. 25a und 25b ausgeführt
worden sind;
Fig. 27 eine schematische Darstellung, wie die Fig. 27a
und 27b zusammenzusetzen sind;
Fig. 27a und 27b zusammen ein Flußdiagramm hinsichtlich der
Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens,
das in Übereinstimmung mit einem
weiteren Ausführungsbeispiel der vorliegenden Erfindung
aufgebaut ist und ebenfalls vorteilhaft bei
einem Zeichenerkennungsverfahren angewandt werden
kann;
Fig. 28a und 28b die Ergebnisse von Zeichenunterteilungen,
die nach den Verfahren nach den Fig. 25a
und 25b bzw. 27a und 27b ausgeführt worden sind;
Fig. 29 ein Blockschaltbild, das den Aufbau eines Zeichenunterteilungssystems
zeigt, das in der Lage ist,
die Zeichenunterteilungsverfahren nach den Fig.
21a und 21b bzw. 25a und 25b bzw. 27a und 27b auszuführen, und
Fig. 30a und 30b Darstellungen der Ergebnisse einer
Unterteilung eines japanischen Katakana-Zeichens
"wu", die unter Verwendung fester Unterteilungsstellen
ausgeführt worden sind.
Fig. 1 zeigt im Flußdiagramm ein Zeichenerkennungsverfahren,
das in Übereinstimmung mit einer Ausführungsform der vorliegenden
Erfindung gestaltet ist. Fig. 2 zeigt andererseits
in Blockform einen optischen Zeichenleser (OCR) oder optisches
Zeichenerkennungssystem zur Ausführung des Zeichenerkennungsverfahrens
nach Fig. 1. Im ersten Schritt wird ein handgeschriebenes
oder gedrucktes Eingabezeichen, das zu erkennen
ist, d. h. ein unbekanntes Zeichen, optisch von einem
Zeichenabtaster 11 gelesen, so daß das unbekannte Zeichen in
ein binäres Zeichenabbild umgewandelt wird, in welchem ein
Zeichenteil durch eines von zwei Binärdaten, d. h. von "1ern"
dargestellt wird, und der übrige Hintergrundbereich durch
das andere der zwei Binärdaten, d. h. von "0en" dargestellt
wird. Es sei hervorgehoben, daß eine Originalvorlage typischerweise
eine Anzahl Zeichen enthält, die von dem Abtaster
11 Zeile für Zeile abgetastet werden. Man erhält daher üblicherweise
eine Serie von binären Zeichenabbildern, die
dann einer Zeichenextraktionseinheit 12 zugeführt werden,
wo die Serien von binären Zeichenabbildern voneinander getrennt
werden.
Ein so von den anderen Abbildern getrenntes Zeichenabbild
wird dann einer Verbreiterungseinheit 13 zugeführt, wo ein
Zeilenverbreiterungsvorgang an dem einzelnen binären Zeichenabbild
ausgeführt wird (Schritt 1 in Fig. 1).
Das Zeilenverbreiterungsverfahren ist in einer Form ein Verfahren,
bei welchem die zwei weißen Pixel zu den linken und
rechten Seiten eines schwarzen Pixels im binären Zeichenabbild
in schwarze Pixel umgewandelt werden, um dadurch die
Zeile zu verbreitern, die das binäre Zeichenabbild bildet.
Fig. 3 zeigt ein binäres Zeichenabbild des lateinischen
Großbuchstabens "B" in Form einer 5 × 7-Punktmatrix, wenn
es optisch mit einer Auflösung von 12 Zeilen pro Millimeter
gelesen wird. Es sei hervorgehoben, daß in Fig. 3 das Symbol
"$" einem schwarzen Pixel entspricht. Wenn das oben beschriebene
Zeilenverbreiterungsverfahren auf dieses binäre
Zeichenabbild angewendet wird, dann erhält man das Zeilenverbreiterte
binäre Zeichenabbild, das in Fig. 4 dargestellt
ist. Wie man sogleich erkennt, werden die Zwischenräume zwischen
Punkten durch Punkte ausgefüllt, so daß das Zeilen-verbreiterte
binäre Zeichenabbild weniger durch eine Verschiebung
in der Punktposition und durch Streuung im Punkt-zu-Punkt-Abstand
beinträchtigt wird. Die späteren Schritte
der Zeichenunterteilung und der Merkmalsextraktion können
daher bei einem solchen Zeilen-verbreiterten binären Zeichenabbild
stabiler ausgeführt werden. Wenn die Auflösung des
Abtasters 11 höher ist, beispielsweise 16 Zeilen/mm beträgt,
dann kann die Wirkung des oben beschriebenen Zeilenverbreiterungsschemas
wegen des wachsenden Punkt-zu-Punkt-Abstandes
eines binären Zeichenabbildes nicht ausreichend
sein. In diesem Falle kann man das Zeilenverbreiterungsschema
so ausgestalten, daß nicht nur die linken und rechten
weißen Pixel eines schwarzen Pixels, sondern auch die oberen
und unteren weißen Pixel benachbart des schwarzen Pixels
jeweils in schwarze Pixel umgeändert werden. In diesem
Falle werden daher vier benachbarte weiße Pixel, d. h. die
linken und rechten, oberen und unteren Pixel jeweils in
schwarze Pixel geändert, während es beim vorangehend erläuterten
Beispiel nur zwei Pixel waren, die verändert
wurden.
Das Zeilen-verbreiterte binäre Zeichenabbild wird dann
einer Richtungskode-Zuordnungseinheit 14 zugeführt, wo
mehrere vorbestimmte Richtungskodes, die in Fig. 6 dargestellt
sind, selektiv den weißen Pixeln, die der Kontur des
binären Zeichenabbildes benachbart sind, zugeordnet (Schritt
2). Wie Fig. 6 zeigt, gibt es neun unterschiedliche Richtungskodes
"0" bis "8", die jeweils einem bestimmten Muster
einer Pixelanordnung zugeordnet sind. Das zugehörige Pixelanordnungsmuster
besteht aus fünf Pixeln, die ein mittleres
Pixel als das interessierende Pixel, ein Paar Pixel zur rechten
und linken Seite des mittleren Pixels und ein Paar obere
und untere Pixel oberhalb und unterhalb des mittleren Pixels
aufweisen. Jedes Pixel wird daher durch ein kleines Quadrat
dargestellt. Ein schraffiertes Quadrat stellt ein schwarzes
Pixel dar, und ein unschraffiertes Quadrat stellt ein weißes
Pixel dar. Es sei auch angemerkt, daß es acht mögliche
Muster für Richtungskodes "0" gibt, während jeder der anderen
Richtungskodes "1" bis "8" eine ganz bestimmte einzigartige
Pixelanordnung aufweist.
Die Zuordnung eines Richtungskodes zu jedem der weißen
Pixel, die der Kontur eines binären Zeichenabbildes benachbart
sind, wird in folgender Weise ausgeführt. Das Zeilenverbreiterte
binäre Zeichenabbild wird abgetastet, wobei
jedes der weißen Pixel, die die Kontur des Zeilen-verbreiterten
binären Zeichenabbildes begrenzen, zusammen mit den
oberen und unteren, sowie rechten und linken benachbarten
Pixeln mit jedem der Muster verglichen wird, die in Fig. 6
dargestellt sind. Wenn somit ein Pixelmuster, das die gleiche
Anordnung von schwarzen und weißen Pixeln aufweist,
ermittelt worden ist, dann wird der zugehörige Richtungskodes
dem fraglichen weißen Pixel zugeordnet. Nach Abschluß
der Zuordnung von Richtungskodes zu den weißen Pixeln benachbart
der Kontor des Zeilen-verbreiterten binären Zeichenabbildes
nach Fig. 5 erhält man ein Zeichen, dessen Kontur
durch die Richtungskodes definiert ist.
In dem oben beschriebenen Beispiel ist ein Satz Richtungskodes
selektiv den weißen Pixeln zugeordnet worden, die der
Kontur des Zeilen-verbreiterten binären Zeichenabbildes benachbart
sind. Andererseits sei doch festgehalten, daß ein
anderer Satz von Richtungskodes, wie er in Fig. 10 dargestellt
ist, ebenfalls verwendet werden könnte, in welchem
Falle die selektive Zuordnung der Richtungskodes nach Fig. 10
an den schwarzen Pixeln ausgeführt wird, die die Kontur des
Zeilen-verbreiterten binären Zeichenabbildes definieren.
Das Zeichenabbild mit den zugeordneten Kodes wird dann
einer Merkmalextraktionseinheit 15 zugeführt, wo das vorgenannte,
die zugeordneten Kodes enthaltende Zeichenabbild
abgetastet wird, um die Richtungskodes zu zählen, und es
werden auf der Grundlage des gezählten Wertes Unterteilungsstellen
bestimmt, wodurch die Höhe und die Breite des Zeichenabbildes
in vier Sektionen unterteilt wird, so daß man
Unterbereiche mit 4 × 4 Maschen erhält (Schritt 3). Das Verfahren
der variablen Unterteilung eines Zeichenabbildes oder
Bereiches in Abhängigkeit von dem gezählten Wert der Richtungskodes
wird im Detail später erläutert. Das die zugeordneten
Kodes enthaltende Zeichenabbild wird dann nochmals
abgetastet und die individuellen Richtungskodes werden für
jeden der unterteilten Bereiche oder Unterbereiche gezählt,
und ein Histogramm in bezug auf die Richtungskodes wird für
jeden der Unterbereiche erzeugt (Schritt 4). Diese Histogramminformation
wird dann einer Identifizierungseinheit 16
als ein Merkmal eines eingegebenen oder unbekannten zu erkennenden
Zeichens zugeführt. Die Identifizierungseinheit
16 ist weiterhin mit einer Bibliothek 17 verbunden, um von
dieser Information aufzunehmen. In der Bibliothek 17 sind
ähnliche Histogramme für eine Anzahl bekannter Zeichen gespeichert.
Bei Empfang einer Histogramminformation für ein
unbekanntes eingegebenes Zeichen vergleicht die Identifizierungseinheit
16 daher diese Information mit jedem der in
der Bibliothek gespeicherten Histogrammdaten, um herauszufinden,
welche derselben am besten mit der Histogramminformation
des unbekannten Zeichens übereinstimmen, um dadurch
das unbekannte, eingegebene Zeichen als dasjenige der gespeicherten
Zeichen zu identifizieren oder zu erkennen, das
die am besten übereinstimmenden Histogrammdaten aufweist.
Bei diesem Identifizierungsschritt wird eine Distanz zwischen
den Histogrammdaten des unbekannten Zeichens und der Histogrammdaten
eines der in der Bibliothek 17 gespeicherten
Zeichen berechnet (Schritt 5). Solch eine Distanz kann
eine einfache Euklid'sche Distanz sein. Das heißt durch Anzeige
eines Histogramms eines Richtungskodes k für einen Unterbereich
(i, j) eines eingegebenen Zeichens durch Hkÿ und
eines Histogramms eines Richtungskodes k für einen Unterbereich
(i, j) eines in der Bibliothek 17 gespeicherten bekannten
Zeichens durch Dkÿ läßt sich dann eine Distanz d
zwischen diesen zwei Histogrammen durch folgende Gleichung
berechnen:
Sodann wird das bekannte Zeichen, das in der Bibliothek 17
gespeichert ist und das die kleinste berechnete Distanz
gemäß der obigen Gleichung aufweist, nun ausgewählt und als
ein Ausgang abgegeben (Schritt 6).
Es wird das Zeichenunterteilungsverfahren im Schritt im
Detail unter Bezugnahme auf Fig. 7 erläutert. Es sei hervorgehoben,
daß das Flußdiagramm in Fig. 7 eine Folge von
Schritten zu Bestimmung von Unterteilungsstellen längs der
X-Achse angibt. Die Unterteilungsstellen längs der Y-Achse
können jedoch ebenfalls durch einen vergleichbaren Vorgang
bestimmt werden. Es sei fernerhin hervorgehoben, daß das
Zeichenunterteilungsverfahren, das nachfolgend erläutert
wird, an der Merkmalsextraktionseinheit 15 ausgeführt wird.
Die Funktion der Merkmalsextraktionseinheit 15 wird typischerweise
durch eine Kombination aus Hardware aus beispielsweise
einem Mikroprozessor und einem Speicher und einem
Softwareprogramm ausgeführt. Es besteht kein Zweifel daran,
daß der Fachmann eine solche Kombination zur Ausführung des
vorliegenden Zeichenunterteilungsverfahrens ohne Schwierigkeit
aufbauen kann. Es sei fernerhin angemerkt, daß solche
Elemente, wie beispielsweise ein Zähler und ein Register,
die in der nachfolgenden Beschreibung erwähnt werden, einem
internen Register eines Mikroprozessors oder einem Register
eines Speichers entsprechen können, und daß der Bestimmungsschritt
durch einen Mikroprozessor ausgeführt werden kann.
An erster Stelle wird eine Beschreibung der Unterteilungen
in der X-Richtung gegeben. Das die zugeordneten Kodes aufweisende
Zeichenabbild, das in einem Speicher gespeichert
ist, wird abgetastet und die Gesamtzahl PE der zugeordneten
Richtungskodes, d. h. die Anzahl von Pixeln, die die Kontur
einer Zeichenzeile definieren, wird gezählt (Schritt 21 in
Fig. 7). Sodann wird der Anfangswert von "1" in einen Zähler
n eingegeben, wobei die Anzahl der Unterteilungen in der
X-Richtung (im vorliegenden Beispiel 4) in einen Zähler N
eingegeben wird, wobei der Umfang der Überlappung von Unterbereichen
in ein Register T eingegeben wird und ein Richtungskodezähler
Px und X-Adressenzähler gelöscht werden
(Schritt 22). Nach Abschluß dieses vorbereitenden Schrittes
wird das die zugeordneten Kodes aufweisende Zeichenabbild
in Y-Richtung als der Hauptabtastrichtung und in X-Richtung
als einer Hilfsabtastrichtung senkrecht zur Y-Richtung abgetastet,
während welchen Abtastungen die Richtungskodes gezählt
werden, um die Unterteilungsstellen in X-Richtung
nacheinander zu bestimmen.
Diesbezüglich sei folgendes im einzelnen erläutert. Der X-Adresszähler
zur Bezeichnung einer Abtastzeile wird im Schritt
24 um 1 erhöht und dann, während die durch den Zählwert des
X-Zählers bestimmte Zeile in Y-Richtung abgetastet wird,
wird der Zählwert eines Richtungskodeszähler Px immer dann
erhöht, wenn ein Richtungskode ermittelt worden ist (Schritt
25). Nach Abschluß der Abtastung einer Zeile wird ermittelt,
ob der Zählwert des Richtungskodezählers Px, d. h. ob die
Anzahl der Richtungskodes zwischen der Anfangszeile entsprechend
X = 1 und der laufenden, durch den X-Adresszähler bezeichneten
Zeile gleich oder größer als (PE/N) Xn ist, oder
nicht (Schritt 26). Wenn das Ergebnis negativ ist, dann
geht der Verfahrensablauf zu Schritt 24 zurück, um die
nächste Zeile abzutasten und erneut die Richtungskodes zu
zählen, wenn solche ermittelt werden. Wenn andererseits das
Ergebnis im Schritt 26 positiv ist, dann wird die Zeile,
die durch die laufende Zählung im X-Adreßzähler angegeben
wird, als ein Endpunkt oder als eine Stelle einer n-ten
Unterteilung in X-Richtung bestimmt (d. h. eine rechtsliegende
Stelle einer Unterteilung). Außerdem wird die Zeile,
die durch einen Wert angegeben wird, den man durch Abziehen
des Wertes eines Registers T vom laufenden Zählwert im
X-Adresszähler erhält, als ein Startpunkt oder Startstelle
des nächsten Unterbereiches bestimmt (d. h. linke Stelle
einer Unterteilung). Sodann wird der Zählerstand des Zählers
n um 1 erhöht (Schritt 28), und anschließend geht der Ablauf
zum Schritt 23 zurück, um einen gleichartigen Verfahrensablauf
zu wiederholen.
Auf diese Weise wird die Zeilenposition (X-Adresse), an der
die Zahl Px der Richtungskodes den Wert von PE/4 erreicht
hat, als ein Endpunkt für den ersten Unterbereich definiert,
und eine Zeile, die um T Zeilen von dieser Position liegt, wird
als ein Startpunkt für den zweiten Unterbereich definiert.
Wenn die Anzahl Px der Richtungskodes den Wert PE/2 erreicht
hat, dann wird ihre Zeilenposition als ein Endpunkt des
zweiten Unterbereiches definiert, und die um T Zeilen vor
dieser Zeile liegende Zeile wird als ein Startpunkt für den
dritten Unterbereich definiert. Wenn die Zählung Px der
Richtungskodes den Wert PEX 3/4 erreicht hat, dann wird
darüber hinaus diese Zeilenposition als ein Endpunkt des
dritten Unterbereiches definiert, und die Zeilenposition,
die um T Zeilen vor dieser Zeile liegt, wird als ein Startpunkt
für den vierten Unterbereich definiert. Es sei festgehalten,
daß der Startpunkt des ersten Unterbereiches der
linken Seite eines Zeichenrahmens entspricht, und der Endpunkt
des vierten Unterbereiches der rechten Seite des Zeichenrahmens
entspricht. Bei Bestimmung des Endpunktes des
dritten Unterbereiches und des Startpunktes des vierten
Unterbereiches wird das Bestimmungsergebnis beim Schritt 23
negativ, so daß die Schritte zur Bestimmung der Unterteilungsstellen
in X-Richtung beendet werden.
Sodann wird die Bestimmung der Unterteilungsstellen in
Y-Richtung in gleicher Weise ausgeführt. Da die Gesamtzahl
PE der Richtungskodes jedoch schon bestimmt worden ist,
wird dieser Schritt nicht wiederholt. In diesem Falle wird
der Abtastbetrieb zur Bestimmung der Unterteilungsstellen
mit der X-Richtung als Hauptabtastrichtung und der Y-Richtung
als der Unterabtastrichtung ausgeführt. Der Startpunkt
des ersten Unterbereiches in Y-Richtung entspricht der Oberseite
des Zeichenrahmens, und der Endpunkt des vierten
Unterbereiches in Y-Richtung entspricht der Unterseite des
Zeichenrahmens. Auf diese Weise wird unter Verwendung der
so bestimmten Unterteilungsstellen (d. h. der End- und Startpunkte)
in X- und Y-Richtung das Kode-zugeordnete Zeichen
oder ein durch den Rahmen des Kode-zugeordneten Zeichens
definierter Bereich in ein 4 × 4-Netz von Unterbereichen
unterteilt. Ein solcher Netz von 4 × 4-Unterbereichen ist
in Fig. 4 mit dünnen Linien eingezeichnet. Es sei auch angemerkt,
daß in diesem Falle der Bereichsüberlappungsumfang T
auf null eingestellt ist.
Wie oben beschrieben, werden die Unterteilungsstellen gemäß
der vorliegenden Erfindung Stelle für Stelle in Abhängigkeit
von der Stellenverteilung der Richtungskodes bestimmt,
so daß die Zeichenunterteilung an Stellen ausgeführt werden
kann, die für das Ausmaß von Verformungen eines Buchstabens
geeignet sind, was zur Verbesserung der Erkennungsrate
beiträgt. Ein solches Verfahren, die Unterteilungsstellen
eines Zeichens variabel zu gestalten, kann die Probleme beseitigen,
die den bekannten Verfahren eigen waren, die mit
festen Unterteilungsstellen arbeiteten, wobei dennoch bei
der Erfindung kein komplizierter Rechenvorgang erforderlich
ist. Das oben beschriebene Zeichenunterteilungsverfahren
nach der vorliegenden Erfindung ist im Vergleich zu den
bekannten Verfahren schnell und einfach. Wenn jedoch, wie
oben beschrieben, ein binäres Zeichenabbild eines Punktmatrixzeichens
niedriger Qualität, wie in Fig. 3 gezeigt,
verarbeitet wird, ohne einen Zeilenverbreiterungsschritt
auszuführen, dann könnte sich aufgrund der Punktverschiebung
und Schwankung des Punkt-zu-Punkt-Abstandes ein Problem
ergeben. In Übereinstimmung mit der vorliegenden Erfindung
wird daher ein Zeilenverbreiterungsschritt an einem binären
Zeichenabbild ausgeführt, bevor die Richtungskodes zugeordnet
werden. Das Verfahren nach der vorliegenden Erfindung
wird daher durch eine geringe Qualität eines binären Zeichenabbildes,
wie beispielsweise durch eine Verschiebung der
Punktposition und durch eine Schwankung des Punkt-zu-Punkt-Abstandes
nicht nachteilig beeinflußt. Als Folge davon kann
man gemäß diesem Aspekt der vorliegenden Erfindung selbst
für Punktmatrixzeichen relativ geringer Qualtiät, wie beispielsweise
bei Zeichen, die von einer 5 × 7-Punktmatrix
angegeben werden, eine ausreichend hohe Erkennungsrate
erzielen.
Es sei weiterhin angemerkt, daß der Zeilenverbreiterungsvorgang
relativ einfach abläuft und in einer sehr kurzen Zeitdauer
ausgeführt werden kann, so daß keine Wahrscheinlichkeit
besteht, daß die Zeichenerkennungszeitdauer merklich verlängert
wird. Es ist ferner festzuhalten, daß der Zeilenverbreiterungsvorgang
auch jede andere Form annehmen kann, als
oben beschrieben. Außerdem ist das Verfahren der Zeichenunterteilung,
das auf diesen Aspekt der vorliegenden Erfindung
anwendbar ist, nicht nur auf das beschriebene beschränkt,
sondern es kann jedes andere Zeichenunterteilungsverfahren
Anwendung finden, wie beispielsweise jenes, das in der
japanischen Patentanmeldung 59-21027760 beschrieben ist.
Es sei nun ein weiterer Aspekt der vorliegenden Erfindung
unter Bezugnahme auf die Fig. 8 bis 20 erläutert. Fig. 8
zeigt ein Flußdiagramm, das die Schrittablauffolge eines
Zeichenerkennungsverfahrens zeigt, das in Übereinstimmung
mit einer Ausführungsform dieses Aspektes der Erfindung aufgebaut
ist, und Fig. 9 zeigt in Blockform den Aufbau eines
optischen Zeichenlesers (OCR) oder eines optischen Zeichenerkennungssystems,
das zur Ausführung des Zeichenerkennungsverfahrens
nach Fig. 8 eingerichtet ist.
Bezugnehmend auf Fig. 9 werden geschriebene oder gedruckte
Zeichen, beispielsweise Buchstaben oder Symbole, als
Original optisch von einem Abtaster 31 gelesen, und die
optisch gelesene Zeicheninformation wird dann in eine binäre
Zeicheninformation von einer Vorverarbeitungseinheit 32
umgewandelt, die auch die binäre Zeicheninformation in
einzelne Zeichendaten trennt, die Daten normiert und dann
glättet. Es ergibt sich daher ein einzelnes binäres Zeichenabbild,
das normiert und geglättet worden ist, und dieses
wird einer Merkmalsextraktionseinheit 31 zugeführt, wo
mehrere vorbestimmte Richtungskodes der Kontur eines solchen
binären Zeichenabbildes selektiv zugeordnet werden. Wie
zuvor beschrieben, gibt es zwei Sätze solcher Richtungskodes,
ein Satz für die Anwendung auf weiße Pixel, wie in
Fig. 6 gezeigt, und der andere Satz zur Anwendung auf
schwarze Pixel, wie in Fig. 10 gezeigt. Es sei weiterhin angemerkt,
daß in dem Falle, in welchem ein Satz Richtungskodes
zur Anwendung auf schwarze Pixel verwendet wird,
solche Richtungskodes jeweils einem von zwei Pixeln in
Zeilenbreitenrichtung zugeordnet werden, wenn eine Zeichenzeile
eine Zeilenbreite von 2 oder mehr aufweist. Wenn
andererseits die Zeilenbreite gleich 1 ist, dann ist nur
ein Pixel zur Definition einer Zeichenzeile vorhanden,
so daß nur ein Richtungskode zugeordnet wird, so daß die
Anzahl zugeordneter Richtungskodes die Hälfte derjenigen
ist, die sich ergeben würde, wenn die Zeilenbreite gleich 2
oder mehr wäre. Was dies angibt, ist die Tatsache, daß die
Merkmalsdaten instabil würden, wenn ein Satz von Richtungskodes
für schwarze Pixel auf eine schmale Zeile angewendet
würde, deren Zeilenbreite gleich 1 ist. Ein solches Problem
erwächst andererseits nicht, wenn von einem Satz Richtungskodes
für weiße Pixel im Falle einer solchen schmalen Zeile
Gebrauch gemacht wird. Wenn andererseits ein Zeilen-zu-Zeilen-Abstand
relativ klein ist, dann kann ein solcher Abstand
durch Anwendung eines Richtungskodes für weiße Pixel
verschwinden. In diesem Falle erwächst jedoch ein solches
Problem nicht, wenn man von einem Satz Richtungskodes für
schwarze Pixel Gebrauch macht. Dementsprechend sollte der
passende Satz aus den Richtungskodes in Abhängigkeit von Anwendungsfall
ausgewählt werden.
Fig. 11 zeigt ein binäres Zeichenabbild eines japanischen
Katakana-Zeichens "a", das wie der englische Vokal "a" ausgesprochen
wird. Dieses Zeichen wird von der Vorverarbeitungseinheit
32 der Merkmalsextraktionseinheit 33 zugeführt.
Wenn ein Satz Richtungskodes für schwarze Pixel den schwarzen
Pixeln zugeordnet wird, die die Kontur des binären Zeichenabbildes
in Fig. 11 definieren, dann erhält man ein Kodezugeordnetes
Zeichenabbild, das in Fig. 12 dargestellt ist.
Wenn andererseits ein Satz Richtungskodes für weiße Pixel
den weißen Pixeln zugeordnet wird, die die Kontur des binären
Zeichenabbildes nach Fig. 11 definieren, dann erhält
man ein Kode-zugeordnetes Zeichenabbild, das in Fig. 13
dargestellt ist.
Wie später erläutert, wird gleichzeitig mit der Zuordnung
der Richtungskodes die Gesamtzahl der Pixel, denen Richtungskodes
zugeordnet worden sind, und ein auf eine X-Achse
und/oder eine Y-Achse projiziertes Histogramm erhalten und
gespeichert. Es ist wahr, daß das Zählen einer solchen Gesamtzahl
Pixel und das Bilden einer solchen Histogrammtafel
oder -tafeln unabhängig auch im Anschluß an die Richtungskodezuordnung
ausgeführt werden kann. Die gleichzeitige
Ausführung ist jedoch vorzuziehen, weil man einige Vorteile
dadurch erhält, wie beispielsweise einer Verminderung der
Verarbeitungszeit beispielsweise aufgrund einer Verminderung
der Anzahl von Abtastoperationen eines Zeichenbildes.
Anschließend wird in der Merkmalsextrahierungseinheit 33
das Kode-zugeordnete Zeichenbild in eine Mehrzahl von
N × N Netzunterbereiche in X- und Y-Richtung unterteilt. Wie
später im Detail erläutert wird, werden die Unterteilungsstellen
längs der X- und Y-Achsen derart bestimmt, daß
jeder dieser M × M Netzunterbereiche im wesentlichen die
gleiche Anzahl von Pixeln aufweist, denen Richtungskodes
zugeordnet worden sind. Mit einem solchen Aufbau können
Unterteilungen eines Zeichenabbildes in weitgehender Anpassung
an das Ausmaß von Deformationen oder Abweichungen
eines Zeichenabbildes von der Standardgestalt ausgeführt
werden. Eine solche variable Zeichenunterteilung ist gegenüber
den bekannten Unterteilungsverfahren, die feste Unterteilungsstellen
verwenden, weit vorteilhafter.
Als nächstes wird in der Merkmalsextrahierungseinheit 33
für jeden (i, j) der in Form eines Netzes unterteilten Unterbereiche
ein Histogramm Hkÿ als Funktion der Richtungskodes
erzeugt. Hier gibt der Suffix k einen der Richtungskodes 1
bis 8 an.
In der Identifikationseinheit 34 wird unter Verwendung des
Histogramms als Funktion der Richtungskodes, die aus der
Merkmalsextrahierungseinheit 33 aus dem unbekannten eingegebenen
Zeichen extrahiert worden ist, und unter Verwendung
der vergleichbaren Histogramme, die in der Bibliothek für
bekannte, registrierte Zeichen gespeichert sind, eine
Distanz zwischen dem unbekannten eingegebenen Zeichen und
jedem der registrierten Zeichen berechnet. Sodann wird das
registrierte Zeichen, das die kürzeste berechnete Distanz
aufweist, ausgewählt und als ein Zeichen entsprechend dem
unbekannten eingegebenen Zeichen ausgegeben. Zu diesem
Zweck kann von einer einfachen Euklid'schen Distanz Gebrauch
gemacht werden, in welchem Falle eine Distanz dl eines
Zeichens l zwischen einem Histogramm Dkÿl des eingegebenen
Zeichens und einem Histogramm Hkÿ des eingegebenen Zeichens
durch die folgende Gleichung ausgedrückt werden kann:
Es werden nun spezifische Beispiele dieses Aspektes der vorliegenden
Erfindung erläutert.
Ein binäre Eingabezeichenabbild wird einem Vorverarbeitungsschritt
unterworfen und dann einem Richtungskodezuordnungsschritt
(Merkmalsanbringungsschritt) in Übereinstimmung mit
einem vorbestimmten Algorithmus. Gleichzeitig wird die
Gesamtzahl PE der Pixel (Merkmals-angebrachte Pixel), denen
Richtungskodes zugeordnet worden sind, gezählt, und ein auf
die X-Achse projiziertes Histogramm HXi und ein auf die
Y-Achse projiziertes Histogramm HYj der Kode-zugeordneten
Pixel werden erhalten. Ein spezielles Beispiel eines solchen
Histogrammpaares ist in Fig. 14 dargestellt. In dieser Figur
ist ein Kode-zugeordnetes Zeichenabbild 40, das aus einem
Buchstaben "c" gebildet ist, dargestellt, und eine Serie
von Zahlen, die an der Oberseite angeordnet sind, zeigen
das unterste Bit der X-Adresse, eine Serie von Zahlen an
der linken Seite zeigen die Y-Adresse, und der Rest der
Zahlen geben die Richtungskodes an, die der Kontur des
eingegebenen Zeichens "c" zugeordnet worden sind. Es sei
angemerkt, daß in diesem Beispiel und auch in den letztgenannten
Beispielen die horizontale Richtung als die X-Achse
angenommen wird und die vertikale Richtung als die Y-Achse
angenommen wird. Diese Relation kann jedoch, sofern gewünscht,
umgekehrt werden.
In Fig. 14 sind ein Histogramm HXi der Anzahl der Richtungskodes
des Kode-zugeordneten Zeichenabbildes 40, das auf die
X-Achse projiziert ist, und ein Histogramm HYj der Anzahl
der Richtungskodes des Abbildes 40 auf der Y-Achse in Form
von Tabellen 41 bzw. 42 gespeichert. Anschließend wird das
Zeichenabbild 40 in N Sektionen in X-Richtung und in M-Sektionen
in Y-Richtungen unterteilt, wodurch sich eine Anzahl
von unterteilten Unterbereichen in einer M × N-Netzform
ergibt.
Fig. 15 zeigt ein Flußdiagramm eines Verfahrens zur Bestimmung
der Unterteilungsstellen in X-Richtung, und dieses Verfahren
wird nachfolgend im Detail erläutert. Nach der Initialisierung
von Zählen n und i und des Registers P (Schritt
50 von Fig. 15), wird der Zähler i erhöht (Schritt 54), und
dann wird der Wert entsprechend dieses Wertes i aus dem
Histogramm HXi ausgelesen und dem Wert des Registers P hinzuaddiert,
wodurch der Wert des Registers P rückgestellt
wird (Schritt 56). Anschließend wird geprüft, ob der Wert P
des Registers P den Wert von (PE/N) Xn überschritten hat
(Schritt 58). Wenn das Ergebnis negativ ist, dann geht der
Ablauf zurück zum Schritt 54, um einen gleichen Ablauf zu
wiederholen. Im wesentlichen wird in Übereinstimmung mit
diesen Schritten bei der Erhöhung der X-Adresse um 1 das
Zeichen rastermäßig abgetastet, um die Anzahl p von Pixeln
zu zählen, denen Richtungskodes zugeordnet worden sind, und
um die Zählung mit einem vorbestimmten Wert von (PE/N) Xn
zu vergleichen. Die Wiederholung einer solchen Rasterabtastung
und weiterhin einer Rasterabtastung zur Bestimmung
der Gesamtanzahl PE ist jedoch redundant und daher nicht
sehr effizient. Unter diesen Umständen wird in Übereinstimmung
mit diesem Beispiel bei der Zuordnung der Richtungskodes
zu der Kontur eines Zeichenabbildes, was eine rasterhafte
Abtastung verlangt, die Gesamtzahl PE gleichzeitig
mit dem projizierten Histogrammen HXi und HYj erhalten, und
diese Daten werden dazu verwendet, eine unnötige Wiederholung
einer Rasterabtastung zu vermeiden.
Wenn nun die Bedingung, daß P gleich oder größer als (PE/N)
Xn erreicht worden ist, dann wird der laufende Zählwert des
Zählers e als eine X-Adresse eines Endpunktes des n-ten
Unterbereiches in X-Richtung gespeichert, und eine weitere
X-Adresse, die man durch Abziehen eines vorbestimmten Bereichsüberlappungsbetrages
T von dieser X-Adresse erhält,
wird als eine X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 60). Es
sei hervorgehoben, daß der Startpunkt des ersten Unterbereiches
in X-Richtung mit der linken Seite (X = 0) des Zeichenabbildes
oder Rahmens zusammenfällt und der Endpunkt
des letzten und N-ten Unterbereiches in X-Richtung mit der
rechten Seite des Zeichenabbildes oder Rahmens zusammenfällt.
Im Anschluß an den Schritt 60 wird der Zähler n erhöht
(Schritt 62), und der Ablauf geht auf Schritte über, die
die nächste Unterteilungsstelle bestimmen. Dieses Verfahren
wird beendet, wenn die Bedingung n = N im Schritt 52 erreicht
worden ist.
Die Unterteilungsstellen in Y-Richtung können in gleicher
Weise erhalten werden. Das heißt, in diesem Falle wird an Stelle
eines Zählers i ein Zähler j entsprechend der Y-Adresse verwendet,
und es wird auf ein projiziertes Histogramm HYj entsprechend
der Y-Achse Bezug genommen. Außerdem sei angemerkt,
daß der Startpunkt für den ersten Unterbereich in Y-Richtung
der Oberseite des Zeichenabbildes oder Rahmens und der Endpunkt
für den M-ten Unterbereich in Y-Richtung der Unterseite
des Zeichenabbildes oder Rahmens entspricht. Auf
diese Weise sind die Unterteilungsstellen in X- und Y-Richtung
ermittelt worden, so daß das Zeichenabbild in N × M-Netzunterbereiche
in X- und Y-Richtung unterteilt ist.
Fig. 16 zeigt ein Beispiel einer netzartigen Unterteilung
eines handgeschriebenen japanischen Katakana-Zeichens "nu",
wobei der Bereichsüberlappungsbetrag auf 1 eingestellt ist.
Japanische Katakana-Zeichen "nu" und "su" sind ähnlich in
der Gestalt wie die lateinischen Buchstaben "E" und "F",
der einzige Unterschied zwischen "nu" und "su" liegt in der
Tatsache, daß "nu" einen zusätzlichen Strich aufweist, der
von links oben nach rechts unten verläuft, wie in Fig. 16
dargestellt. Um die Unterscheidung zwischen "nu" und "su"
zu treffen, ist es wichtig, daß dieses Merkmal, d. h. die Anwesenheit
eines zusätzlichen Striches, der von links oben
nach rechts unten verläuft, durch Unterbereiche in geeigneter
Weise wiedergespiegelt wird, die in Form von Netzmaschen
abgeteilt sind. Das vorliegende Beispiel erfüllt
dieses Erfordernis und ist daher in der Lage, "nu" von "su"
und anderen ähnlichen Zeichen klar zu unterscheiden.
Bei diesem Beispiel wird gleichzeitig mit der Richtungskodezuordnung
die Gesamtzahl PE von Pixeln, denen Richtungskodes
zugeordnet worden sind, und ein Histogramm HYj von
Pixeln, denen Richtungskodes zugeordnet worden sind, das
auf die Y-Achse projiziert ist, erhalten. Sodann wird in
einer Weise ähnlich dem oben beschriebenen Beispiel 1 das
Zeichenabbild in M Sektionen in Y-Richtung unterteilt. Sodann
wird während der Rasterabtastung eines jeden der in
Y-abgestellten Bereiche dieser Bereich auch in N Sektionen
in X-Richtung unterteilt. Fig. 17 ist ein Flußdiagramm, das
den Ablauf zur weiteren Unterteilung einer der in Y-Richtung
abgeteilten M Sektionen in N Sektionen in X-Richtung zeigt.
Diesbezüglich sei zur weiteren Erläuterung auf Fig. 17
Bezug genommen. Nach Initialisierung der Zähler n und i und
des Registers P (Schritt 70) wird der Zähler i erhöht (Schritt
74), und das Zeichenabbild wird in Y-Richtung auf die X-Adresse
entsprechend dem inkrementierten i-Raster abgetastet, wodurch
die Anzahl von Pixeln, denen Richtungskodes zugeordnet
worden sind, in dieser Zeile gezählt wird, und ihr Wert Pi
wird dem Register P hinzuaddiert (Schritt 78). Sodann wird
geprüft, ob der Wert P des Registers P einen vorbestimmten
Wert von (PE/NXM) Xn überschritten hat (Schritt 80). Wenn
das Ergebnis negativ ist, dann geht der Ablauf zum Schritt
74 zurück und wiederholt sich auf gleiche Weise. Wenn andererseits
P als gleich oder größer als (PE/NXM) Xn ermittelt
worden ist, dann wird der laufende Zählwert des Zählers i
als eine X-Adresse eines Endpunktes für den n-ten Unterbereich
in X-Richtung gespeichert, und eine weitere Adresse
erhält man, indem man eine vorbestimmte Bereichsüberlappungsbreite
T von jener X-Adresse abzieht. Diese weitere
X-Adresse wird als X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 82). Es
sei angemerkt, daß der Startpunkt des ersten Unterbereiches
in X-Richtung der linken Seite (X = 0) des Zeichenabbildes
oder Rahmens entspricht und der Endpunkt des letzten und
daher N-ten Unterbereiches in X-Richtung der rechten Seite
des Zeichenabbildes oder Rahmens entspricht. Nach dem Schritt
82 wird der Zähler n erhöht (Schritt 84), und es werden als
nächstes Schritte zur Bestimmung der nächsten Unterteilungsstelle
ausgeführt. Dieser Vorgang wird beendet, sobald die
Bedingung n = N im Schritt 72 erreicht worden ist.
Auf diese Weise erhält man die Unterteilungsstellen in X-
und Y-Richtung, und das Zeichenabbild oder der Rahmen wird
in mehrere Unterbereiche in Form eines M × N-Maschennetzes
in den X- und Y-Richtungen unterteilt. Ein Beispiel solcher
Unterteilungen eines japanischen Katakana-Zeichens "nu" ist
in Fig. 18 dargestellt. Es ist anzumerken, daß in Fig. 18
nur Unterteilungen in X-Richtung für die abgeteilten Zwischenbereiche
in Y-Richtung angegeben sind. Es sei auch angemerkt,
daß die Bedingung T = 0 in Fig. 18 angenommen
wird.
In dem oben beschriebenen Beispiel 2 werden die Unterteilungen
in Y-Richtung durch das im Beispiel 1 beschriebene
Schema ausgeführt. Sie kann jedoch auch derart ausgeführt
werden, daß nach der Ausführung der Unterteilungen in X-Richtung
Unterteilungen in X-Richtung für jede der Unterteilungen
in Y-Richtung ausgeführt werden können.
Wenn die Pixels, denen die Richtungskodes zugeordnet worden
sind, in einem Bereichsüberlappungsabschnitt konzentriert
sind, dann wird eine vergrößerte Streuung in der Pixelanzahl
innerhalb Unterbereichen in jeder der X- und Y-Richtungen
erzeugt. Wenn in diesem Falle die Unterteilungsstellen
unter Verwendung von PE/NXM) als Bezug wie beim oben beschriebenen
Beispiel 2 bestimmt werden, dann würde eine
Situation eintreten, in denen die Unterteilungen ungeeignet
sind. Dieses Beispiel 3 ist daher darauf gerichtet, einen
solchen Nachteil zu vermeiden.
In Übereinstimmung mit diesem Beispiel 3 werden gleichzeitig
mit der Zuordnung der Richtungskodes die Gesamtzahl PE der
Pixels, denen Richtungskodes zugeordnet worden sind, gezählt
und ein Histogramm HYj der mit Kodes versehenen Pixel,
projiziert auf die Y-Adresse, erhalten, und anschließend
wird das Zeichenabbild in M-Sektionen in Y-Richtung in einer
Weise ähnlich der im obigen Beispiel 1 beschriebenen unterteilt.
Während dieser Unterteilungen in Y-Richtung wird
Bezug genommen auf das Histogramm HYj, und die Anzahl Pm
der mit Kodes versehen Pixel in jeder der Unterteilungen
wird erhalten. Während der Rasterabtastung einer jeden der
Unterteilungen in Y-Richtung wird jede der Unterteilungen
weiter in N Unterteilungen in X-Richtung geteilt. Fig. 19
zeigt ein Flußdiagramm, das ein Verfahren zum Teilen einer
der Unterteilungen, geteilt in Y-Richtung, in N Unterteilungen
in X-Richtung darstellt.
Wie man aus Fig. 19 erkennt, wird nach Initialisierung der
Zähler n und i und des Registers P (Schritt 90) der Zähler
i erhöht (Schritt 94), und das Zeichenabbild wird in Y-Richtung
für die X-Adresse rastermäßig abgetastet, die jenem
Zählwert i entspricht, wodurch die Anzahl der mit Kodes versehenen
Pixel in jener Zeile gezählt wird, und ihr Zählwert
Pi wird dem Register P hinzuaddiert (Schritt 98). Dann wird
der Wert P des Registers P geprüft, um zu ermitteln, ob er einen
vorbestimmten Wert (PmN) Xn überschritten hat, oder nicht
(Schritt 100). Wenn das Ergebnis negativ ist, dann geht der
Ablauf zum Schritt 94 zurück, um die genannten Schritte in
gleicher Weise zu wiederholen. Wenn andererseits die Bedingung
erfüllt ist, daß P gleich oder größer als (Pm/N) Xn
ist, dann wird der laufende Zählwert des Zählers i als eine
X-Adresse eines Enpunktes für den n-ten Unterbereich in
X-Richtung gespeichert und darüber hinaus wird eine weitere
X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite
T von jener X-Adresse erhält, als eine X-Adresse
eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung
gespeichert (Schritt 102). Es sei angemerkt, daß der
Startpunkt des ersten Unterbereiches in X-Richtung der
linken Seite (X = 0) des Zeichenabbildes entspricht, und
daß der Endpunkt des letzten und daher N-ten Unterbereiches
in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Im Anschluß an den Schritt 102 wird der Zähler n
erhöht (Schritt 104) und der Ablauf geht auf Schritte über,
mit denen der nächste Unterteilungspunkt bestimmt wird.
Dieses Verfahren wird beim Erreichen der Bedingung n = N
beendet.
Unter Verwendung der so erhaltenen Unterteilungspunkte in
X-Richtung werden auch die in Y-Richtung unterteilten
Sektionen in N Sektionen in X-Richtung unterteilt, so daß
das Zeichenabbild in ein Netz von N × M Unterbereiche unterteilt
wird. Fig. 20 zeigt ein Beispiel, das man durch Unterteilung
des Kode-zugeordneten Zeichenabbildes eines handgeschriebenen
japanischen Katakanazeichens "nu" in ein Netz
aus Unterbereichen mit T = 1 erhalten hat. Es sei angemerkt,
daß die Unterteilungen in X-Richtungen nur für die mittleren
unterteilten Sektionen in Y-Richtung angegeben sind.
Die gleichen Verfahrensschritte wie jene, die beim Beispiel
1 verwendet worden sind, werden hier angewandt mit der Ausnahme,
daß ein Satz von Richtungskodes für schwarze Pixel
für jene schwarzen Pixel verwendet wird, die die Kontur
eines binären Zeichenabbildes definieren.
Die gleichen Verfahrensschritte wie jene, die im Beispiel 2
verwendet worden sind, werden hier angewendet mit der Ausnahme,
daß ein Satz von Richtungskodes für schwarze Pixel
für jene schwarzen Pixel angewendet wird, die die Kontur
eines binären Zeichenabbildes angeben.
Dieselben Verfahrensschritte wie jene, die im Beispiel 3
verwendet wurden, werden hier angewandt mit der Ausnahme,
daß ein Satz Richtungskodes für schwarze Pixel für jene
schwarze Pixel Anwendung findet, die die Kontur eines binären
Zeichenabbildes definieren.
Es ist anzumerken, daß jeder der oben beschriebenen Verfahrensschritte
mit diesem Aspekt der vorliegenden Erfindung sehr
einfach entweder durch Software oder durch Hardware oder
durch eine Kombination beider ausgeführt werden können, und
dies sollte für einen Fachmann auszuführen sein.
Es wird nun ein weiterer Aspekt der vorliegenden Erfindung
unter spezielle Bezugnahme auf die Fig. 21 bis 30 beschrieben.
Dieser Aspekt der vorliegenden Erfindung ist
speziell auf ein Zeichenunterteilungsschema gerichtet, das
zur Verwendung bei der Merkmalsextrahierung in einem Zeichenerkennungsverfahren
und -system insbesondere nach der Erfindung
geeignet ist. Wie bereits ausgeführt, ist es wichtig,
daß ein Zeichenabbild in Abhängigkeit vom Zustand desselben
optimal unterteilt wird, damit ein gewünschtes Merkmal ohne
Fehler extrahiert wird. Fig. 30a zeigt ein Zeichenabbild
aus Kodezuordnungen, das man erhalten hat, indem ein Satz
Richtungskodes nach Fig. 22 der Kontur eines binären Zeichenabbildes
für ein japanisches Katakana-Zeichen "wu" zugeordnet
hat. Fig. 30b ist hingegen ein ähnliches Zeichenabbild
aus Kodezuordnungen für dasselbe japanische Katakana-Zeichen
"wu" bei geringer Änderung der Gestalt. Es sei zunächst der
Fall betrachtet, in welchem beide Zeichenabbilder nach den
Fig. 30a und 30b in ein 3 × 3-Netz unter Verwendung
fester Unterteilungsstellen unterteilt werden und ein Histogramm
als Funktion von Richtungskodes für jede der Unterteilungen
gebildet wird, um einen Merkmalsvektor zu erzeugen.
Unter den japanischen Katakana-Zeichen gibt es die Zeichen
"wu" und "nu", die in der Gestalt ähnlich sind, wobei "wu"
von "nu" sich nur dadurch unterscheidet, daß ein sich vertikal
erstreckender oberer mittlerer Strich vorhanden ist. Um
"wu" von "nu" richtig zu unterscheiden, ist es daher wichtig,
daß die Information, die sich auf diesen oben mittleren
Strich bezieht, durch Zeichenunterteilungen in geeigneter
Weise extrahiert und in einem Merkmalsvektor in geeigneter
Weise wiedergespiegelt wird. Betrachtet man den oberen
linken Unterbereich in jedem der Zeichenabbilder nach den
Fig. 30a und 30b genauer, dann sieht man, daß die Information,
die sich auf den oberen mittleren Strich bezieht,
in dem Zeichenabbild in Fig. 30a verlorengegangen ist,
während diese Information in dem Zeichenabbild nach Fig.
30b vorhanden ist. Wenn die Unterteilungspunkte an festen
Stellen angeordnet sind, dann kann auf diese Weise die Situation
eintreten; in der eine Merkmalsextraktion, die das
wesentliche Merkmal eines Zeichens verläßlich wiederspiegelt,
nicht ausgeführt werden kann. Dieser dritte Aspekt der Erfindung
ist speziell auf die Beseitigung dieses Problems gerichtet
und auf die Angabe eines Verfahrens zur optimalen
Bestimmung von Unterteilungspunkten eines Zeichenabbildes,
die es ermöglichen, die Merkmalsextraktion stabil jederzeit
auszuführen.
Die Fig. 21a und 21b zeigen zusammen ein Flußdiagramm
der Schrittablauffolge eines Unterteilungsverfahrens für
einen Zeichenbereich (Rahmen) gemäß einer Ausführungsform
dieses Aspektes der vorliegenden Erfindung. Wie zuvor angegeben,
sei festgehalten, daß dieses Zeichenunterteilungsverfahren
speziell vortteilhaft ist, wenn es auf ein Zeichenerkennungsverfahren
angewendet wird.
Wie die Fig. 21a und 21b zeigen, wird im Schritt 110 ein
Zeichenabbild, das typischerweise durch Abtastung eines gedruckten
oder handgeschriebenen Zeichens erhalten wird,
verarbeitet, um ihm ein vorbestimmtes Merkmal zuzuordnen.
Durch diesen Merkmalszuordnungsschritt werden mehrere Richtungskodes,
wie in Fig. 22 gezeigt, selektiv den weißen
Pixeln zugeordnet, die die Kontur des Zeichenabbildes begrenzen.
Wie zuvor erläutert, kann ein anderer Satz Richtungskodes
dazu verwendet werden, selektiv den schwarzen
Pixeln zugeordnet zu werden, die die Kontur des Zeichenabbildes
definieren. Ein solcher Merkmalszuordnungsschritt
wird typischerweise durch Prüfung eines Pixelmusters ausgeführt,
das durch ein interessierendes Pixel, zwei zur rechten
und linken Seite gelegene Pixel und zwei oberhalb und
unterhalb des interessierenden Pixels gelegene Pixel definiert
wird, während die Rasterabtastung des Zeichenabbildes
stattfindet. Simultan dazu werden die Gesamtzahl PE der
Kode-zugeordneten Pixel (Merkmalspixel) und auf die X- und
Y-Achsen projizierten Histogramme HXi und HYj erhalten und
in Tabellen gespeichert. Ein Beispiel solcher Tabellen ist
in Fig. 23 dargestellt.
In Fig. 23 ist ein Zeichenabbild 140 gezeigt, den bereits
mehrere vorbestimmte Richtungskodes selektiv zugeordnet
worden sind. Eine Serie von Zahlen am Kopf von Fig. 23 gibt
das niedrigste Bit einer X-Adresse an, und eine Serie von
Zahlen am linken Rand von Fig. 23 gibt die Y-Adresse an.
Ein projiziertes Histogramm HXi der Merkmalspixel des Zeichenabbildes
140 auf der X-Achse und ein vergleichbares
projiziertes Histogramm HYj auf der Y-Achse sind in Tabellen
142 bzw. 144 gespeichert. Das Zählen der Gesamtzahl solcher
Merkmalspixel und die Bildung solcher Histogrammtabellen
kann nach Abschluß des Merkmalszuordnungsschrittes ausgeführt
werden. Vorzugsweise wird dies jedoch gleichzeitig
mit dem Merkmalszuordnungsschritt ausgeführt, weil dadurch
eine Verringerung der Anzahl der Abtastungen des Zeichenabbildes
möglich wird, was die Verarbeitungszeitdauer verkürzt.
Anschließend wird das Zeichenabbild in N Sektionen in X-Richtung
unterteilt (Schritt 112 bis 124) und in M Sektionen
in Y-Richtung unterteilt (Schritte 126 bis 128), wodurch
das Zeichenabbild in ein Netz N × M Unterbereiche unterteilt
wird, von denen jeder soweit wie möglich gleichmäßig Merkmalspixel
enthält. Hierdurch kann die Unterteilung eines
Zeichenabbildes optimal in Abhängigkeit vom Grad der Verformung
des Zeichenabbildes gegenüber der Standardform
ausgeführt werden.
Dieses Zeichenunterteilungsverfahren wird nachfolgend im
Detail näher erläutert. Nach Initialisierung der Zähler n
und i und des Registers P (Schritt 112) wird der Zähler i
erhöht (Schritt 116), und der Wert des Histogramms HXi entsprechend
diesem Wert i wird aus der Tabelle ausgelesen und
dem laufenden Wert des Registers P hinzuaddiert, wodurch
der Wert des Registers P rückgesetzt wird (Schritt 118). Anschließend
wird geprüft, ob der Wert des Registers P einen
vorbestimmten Wert von (PE/N) Xm überschritten hat, oder
nicht (Schritt 120). Wenn das Ergebnis negativ ist, dann
geht der Ablauf zurück zum Schritt 114, um die genannten
Schritte zu wiederholen. Tatsächlich wird bei dieser Routine
während der Erhöhung der X-Adresse um 1 das Zeichenabbild
rastermäßig abgetastet, um die Anzahl von P von Merkmalspixeln
zu zählen, und dieses Zählergebnis wird mit (PE/N) Xn
verglichen. Die Wiederholung einer solchen rastermäßigen Abtastung
und darüber hinaus der rastermäßigen Abtastung zur
Zählung der Gesamtzahl PE ist jedoch nicht effizient. Unter
diesen Umständen werden in Übereinstimmung mit der vorliegenden
Erfindung während des Merkmalszuordnungsschrittes,
der die rastermäßige Abtastung notwendig macht, Histogramme
HXi und HXj und die Gesamtzahl PE gleichzeitig erhalten,
und diese Daten in geeigneter Weise in der Routine verwendet,
um dadurch die Notwendigkeit einer wiederholten Rasterabtastung
zu vermeiden und dadurch die Effizienz des Verfahrens
zu steigern.
Wenn die Bedingung, daß P gleich oder größer als (PE/N) Xn
erhalten worden ist, dann wird der laufende Zählwert des
Zählers e als eine X-Adresse eines Endpunktes des n-ten
Unterbereiches in X-Richtung gespeichert, und eine weitere
X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite
T von jener X-Adresse erhält, wird als eine X-Adresse
eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung
gespeichert (Schritt 122). Es sei festgehalten, daß
der Startpunkt des ersten Unterbereiches in X-Richtung der
linken Seite X = 0) des Zeichenabbildes entspricht, und
daß der Endpunkt des letzten und daher N-ten Unterbereiches
in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Anschließend an den Schritt 122 wird der Zähler n erhöht
(Schritt 124), und die Verarbeitung zur Ermittlung des
nächsten Unterteilungspunktes wird ausgeführt. Diese Verarbeitung
wird beendet, sobald die Bedingung n = N im Schritt
112 erreicht worden ist. Die Verfahrensschritte 126 bis 138
für die Unterteilungen in Y-Richtung sind ähnlich den
Schritten 112 bis 124, die oben beschrieben wurden. An
Stelle eines Zählers i, der der X-Adresse zugeordnet ist,
wird jedoch von einem Zähler j Gebrauch gemacht, der der
Y-Adresse zugeordnet ist (Schritte 126, 130, 136). Außerdem
wird an Stelle eines Histogramms HXi auf ein Histogramm HYj
Bezug genommen (Schritt 132), und die Anzahl von Unterteilungen
im Schritt 134 wird auf M eingestellt. Wenn das Ergebnis
der Ermittlung beim Schritt 134 positiv ist, dann
geht der Verfahrensablauf zum Schritt 136 über, wo der laufende
Zählwert j des Zählers j als Y-Adresse eines Endpunktes
des n-ten Unterbereiches in Y-Richtung eingestellt
wird, und ein Wert, der durch Subtraktion einer Bereichsüberlappungsbreite
T von jener Y-Adresse erhalten wird,
wird als Y-Adresse eines Startpunktes des (n +1)-ten Unterbereiches
in Y-Richtung bestimmt. Es sei angemerkt, daß der
Startpunkt des ersten Unterbereiches in Y-Richtung mit der
Oberseite des Zeichenabbildes übereinstimmt und der Endpunkt
des M-ten Unterbereiches in Y-Richtung der Unterseite
des Zeichenbildes entspricht. Da die Unterteilungspunkte
in X- und Y-Richtung auf diese Weise bestimmt worden sind,
wird das Zeichenabbild dann in ein Netz von N × M Unterbereiche
in X- und Y-Richtung auf der Grundlage dieser Unterteilungspunkte
unterteilt.
In Übereinstimmung mit der vorliegenden Ausführungsform
werden die Zeichenabbilder, die in Fig. 30a und 30b
dargestellt sind, so unterteilt, wie in den Fig. 24a
bzw. 24b dargestellt ist. Es ist angemerkt, daß die Bedingungen
M 3 und T = 0 angenommen worden sind. Eine schnelle
Prüfung des oberen linken Unterbereiches in Fig. 24a zeigt
die Anwesenheit einer Information über den oberen mittleren
Strich des Zeichens "wu" an, was jedoch nicht der Fall ist,
wenn die Verarbeitung unter Verwendung des bekannten Schemas
mit festen Unterteilungspunkten erfolgt. Das gleiche gilt
für den Fall, der in Fig. 24b dargestellt ist.
Unter Bezugnahme auf die Fig. 25a und 25b wird nun eine
weitere Ausführungsform dieses Aspektes der vorliegenden Erfindung
beschrieben. Schritt 150 dieser Ausführungsform entspricht
dem Schritt 110 der vorangehend beschriebenen Ausführungsform.
Im Schritt 150 erhält man jedoch, soweit
Histogramme betroffen sind, nur HYj und nicht HXi. Der Verfahrensablauf
geht dann zum Schritt 152 über, wo das Zeichenabbild
in M Sektionen in Y-Richtung unterteilt wird, und
dieser Schritt entspricht einer Folge von Schritten 126 bis
138 der vorangehend erläuterten Ausführungsform. Die Schritte
154 bis 168 werden zur Unterteilung des Zeichenabbildes in
N Sektionen in X-Richtung ausgeführt. Jeder dieser Schritte
wird nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i des Registers P
(Schritt 154) wird der Zähler i erhöht (Schritt 156), und
das Zeichenabbild wird in Y-Richtung für die X-Adresse entsprechend
dem Zählwert i rastermäßig abgetastet, wodurch
die Anzahl der Pixel in jeder Zeile gezählt wird (Schritt
160), denen Kodes zugeordnet sind, und dieser Wert Pi wird
im Register P gespeichert (Schritt 162). Sodann wird geprüft,
ob der Wert P des Registers P einen vorbestimmten
Wert von (PE/(NXM) Xn) überschritten hat (Schritt 164).
Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf
zurück zum Schritt 158, um die genannten Schritte zu wiederholen.
Wenn andererseits die Bedingung, daß P gleich
oder größer als (PE/(NMX) Xn) erhalten worden ist, dann
wird der laufende Zählwert i als eine X-Adresse eines Endpunktes
des n-ten Unterbereiches in X-Richtung gespeichert,
und eine weitere X-Adresse, die man durch Abziehen eines Bereichsüberlappungsbetrages T von jener X-Adresse erhalten
hat, wird als eine X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 166). Es
sei ebenfalls angemerkt, daß der Startpunkt des ersten
Unterbereiches in X-Richtung der linken Seite (X = 0) des
Zeichenabbildes entspricht und der Endpunkt des letzten und
daher M-ten Unterbereiches in X-Richtung der rechten Seite
des Zeichenabbildes entspricht.
Im Anschluß an den Schritt 166 wird der Zähler n erhöht
(Schritt 168), und das Verfahren geht auf Schritte über,
mit denen der nächste Unterteilungspunkt bestimmt wird.
Dieses Verfahren wird beendet, wenn die Bedingung n = N
beim Schritt 156 erreicht worden ist. Auf diese Weise werden
Unterteilungspunkte in X- und Y-Richtung bestimmt, so daß
das Zeichenabbild in ein Netz aus N × m Unterbereiche in X-
und Y-Richtung unterteilt ist.
Wie zuvor ausgeführt worden ist, sind die japanischen Katakana-Zeichen
"nu" und "su" in der Gestalt einander ähnlich,
wobei sich "nu" durch einen zusätzlichen Strich auszeichnet,
der von links oben nach rechts unten in der Mitte verläuft.
Um diese zwei Zeichen voneinander zu unterscheiden, spielt
dieser zusätzliche Strich eine Schlüsselrolle. Wenn das
Zeichen "nu" durch das Verfahren nach den Fig. 21a und
21b unterteilt wird, dann ergibt sich das in Fig. 26a dargestellte
Unterteilungsergebnis. Eine Prüfung des linken Zwischenunterbereiches
(1, 2) im Zeichenabbild von Fig. 26a
zeigt die Tatsache, daß die Information bezüglich der geneigten
Lage des zusätzlichen Striches in diesem Unterbereich
nicht vorhanden ist. Andererseits zeigt Fig. 26b das
Ergebnis, wenn dasselbe Zeichen "nu" einer Unterteilung
nach dem vorliegenden Verfahren unterzogen worden ist, das
in den Fig. 25a und 25b dargestellt ist. Es ist anzumerken,
daß in Fig. 26b nur die Unterteilungen in X-Richtung für
den mittleren Unterbereich in Y-Richtung dargestellt sind
und die Bedingung T = 0 angenommen worden ist. Ein schneller
Blick auf den linken Zwischen-Unterbereich (1, 2) genügt, um
zu verstehen, daß der Unberbereich (1, 2) Information enthält,
die in ausreichender Weise die Anwesenheit des geneigten zusätzlichen
Striches angibt. Auf diese Weise kann die vorliegende
Erfindung die Nachteile in der unter Bezugnahme
auf die Fig. 21a und 21b beschriebenen Ausführungsform
überwinden.
In der obigen Beschreibung sind Unterteilungen in Y-Richtung
nach dem Verfahren entsprechend der vorangehenden Ausführungsform
ausgeführt worden. Es sei jedoch angemerkt, daß
nach den Unterteilungen in X-Richtung die Unterteilungen in
Y-Richtung mit einem Verfahren ausgeführt werden können,
das ähnlich dem in den Fig. 25a und 25b dargestellten
Verfahren ist, um jede der Unterteilungen in X-Richtung
auszuführen.
In der soeben beschriebenen Ausführungsform nach den Fig.
25a und 25b ergibt sich eine größere Streuung in der Anzahl
von Pixeln zwischen den unterteilten Unterbereichen in den
X- und Y-Richtungen im Falle, daß Merkmalspixel (d. h. Pixel,
denen Kodes zugeordnet sind) in einem Bereichsüberlappungsabschnitt
konzentriert sind, wenn Unterteilungspunkte unter
Verwendung von PE/(NXM) als Bezug bestimmt werden. Die Fig.
27a und 27b zeigen eine weitere Ausführungsform dieses
Aspektes der vorliegenden Erfindung, die in der Lage ist,
dieses Problem zu überwinden. In dem Flußdiagramm nach den
Fig. 27a und 27b entspricht der Schritt 170 dem Schritt
110 in den Fig. 21a und 21b. Der Verfahrensablauf geht
dann zum Schritt 172 über, in welchem ein Zeichenabbild in
Y-Richtung unterteilt wird. Dies entspricht einer Folge von
Schritten 126 bis 138 in der in den Fig. 21a und 21b gezeigten
Ausführungsform. Im Schritt 172 wird jedoch gleichzeitig
mit den Unterteilungen in Y-Richtung auf das Histogramm
HYj Bezug genommen und die Anzahl Pm der Merkmalspixel
in jedem der Unterbereiche in Y-Richtung wird ermittelt.
Der Verfahrensablauf geht dann zu einer Folge von
Schritten 174 bis 188 über, die der Bestimmung von Unterteilungen
in X-Richtung dienen. Diese Schritte 174 bis 188
werden nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i und des Registers P
(Schritt 174) wird der Zähler i erhöht (Schrit 178) und
dann wird für die X-Adresse entsprechend diesem Zählwert i
das Zeichenabbild rastermäßig in Y-Richtung abgetastet,
wodurch die Anzahl von Pixeln in dieser Zeile gezählt wird
(Schritt 180), denen Kodes zugeordnet sind, und dieser
Wert Pi wird dem laufenden Zählwert des Registers P hinzuaddiert
(Schritt 182). Sodann wird geprüft, ob der Wert P
des Registers P einen vorbestimmten Wert von (Pm/N) Xn im
Schritt 184 überschritten hat, oder nicht. Wenn das Ergebnis
negativ ist, dann geht der Verfahrensablauf zurück zum
Schritt 178, um die gleichen Schritte zu wiederholen. Ist
andererseits die Bedingung, daß P gleich oder größer als
(Pm/N) Xn ist, erreicht worden ist, dann wird der laufende
Zählwert des Zählers i als eine X-Adresse eines Endpunktes
des n-ten Unterbereiches in X-Richtung gespeichert, und
eine weitere X-Adresse, die durch Abziehen einer Bereichsüberlappungsgröße
T von jener X-Adresse ermittelt worden
ist, wird als eine X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 186).
Wie zuvor, sei auch hier angemerkt, daß der Startpunkt des
ersten Unterbereiches in X-Richtung der linken Seite (X = 0)
des Zeichenabbildes entspricht, während der Endpunkt des
letzten und daher N-ten Unterbereiches in X-Richtung der
rechten Seite des Zeichenabbildes entspricht.
Nach dem Schritt 186 geht der Verfahrensablauf zum Schritt
188 über, wo der Zähler n erhöht wird, so daß zu einer weiteren
Folge von Schritten zur Bestimmung des nächsten Unterteilungspunktes
übergegangen wird. Dieser Verfahrensablauf
wird beendet, sobald die Bedingung n = N im Schritt 176
erreicht worden ist. Auf diese Weise werden Unterteilungsstellen
in X-Richtung für jede der in Y-Richtung unterteilten
Sektionen bestimmt, so daß das Zeichenabbild als Ganzes
in ein Netz von N × M Unterbereiche unterteilt wird.
Fig. 28a zeigt das Ergebnis, wenn das Zeichen "nu" in Übereinstimmung
mit dem unter Bezugnahme auf die Fig. 25a
und 25b beschriebenen Verfahren und unter der Annahme T = 1
unterteilt wird. Andererseits zeigt Fig. 28b das Ergebnis,
wenn dasselbe Zeichen "nu" in Übereinstimmung mit der vorliegenden
Erfindung unterteilt wird, wie sie soeben unter
Bezugnahme auf die Fig. 27a bund 27b beschrieben worden
ist, wieder mit der Annahme, daß T = 1. In beiden Fällen
werden Unterteilungen zunächst in Y-Richtung ausgeführt,
und sodann werden Unterteilungen in X-Richtung ausgeführt.
Es sei auch angemerkt, daß Unterteilungen in X-Richtung nur
in den mittleren Sektionen solcher in Y-Richtung unterteilten
dargestellt sind. Ein Vergleich zwischen den zwei
Ergebnissen, die in den Fig. 28a und 28b dargestellt
sind, läßt schließen, daß der linke untere Zwischenunterbereich
(1, 2) des Zeichenabbildes in Fig. 28b Information enthält,
die die geneigte Gestalt des zusätzlichen Striches in
der Mitte des Zeichens besser wiederspiegelt. Auf diese
Weise ergibt sich selbst bei einer Anhäufung von Merkmalspixeln
an einer Unterteilungsstelle die Möglichkeit, Unterteilungen
in geeigneter Weise und optimal in Übereinstimmung
mit der vorliegenden Erfindung jederzeit auszuführen.
Fig. 29 zeigt in Blockform ein System, das zur Ausführung
eines jeden der oben beschriebenen Zeichenunterteilungsverfahren
geeignet ist. Wie dargestellt, enthält das System
einen Abbildspeicher 190 zur Speicherung eines zu verarbeitenden
Zeichenabbildes mit Merkmalszuordnungen. In dem
System ist weiterhin eine zentrale Prozessoreinheit (CPU)
192 und ein Hauptspeicher 194 angegeben, der ein Programm
für jedes der obigen Verfahren und Tabellen für die beschriebenen
Histogramme speichert, sowie die oben beschriebenen
Zähler enthält. Die CPU 192 hat Zugang zum Bildspeicher 190,
einer Abtastschaltung 191 und auch zum Hauptspeicher 194
über einen Bus 195, und umgekehrt. Im Betrieb führt die CPU
192, während sie Zugang zum Bildspeicher 190 hat, den Merkmalszuordnungsbetrieb
sowie das Zählen der Gesamtzahl der
Merkmalspixel und die Erzeugung von Histogrammen sämtlich
zur gleichen Zeit aus. Das verarbeitete Zeichenabbild, dem
Merkmale zugeordnet worden sind, wird in dem Bildspeicher
190 gespeichert, hingegen werden die Daten über die Gesamtzahl
von Merkmalspixeln und die Histogramme im Hauptspeicher
194 gespeichert. Während der nachfolgenden Verarbeitung
zur Bestimmung der Unterteilungsstellen führt die CPU 192
dann eine vorbestimmte Routine aus, bei der sie auf die Gesamtzahl
der Merkmalspixel und auf die Histogrammtabellen
Bezug nimmt, die in dem Hauptspeicher 194 gespeichert sind,
sowie, soweit notwendig, auf das Zeichenabbild mit den
Merkmalszuordnungen, das im Bildspeicher 190 gespeichert
ist, und sodann wird das Ergebnis der so bestimmten Unterteilungsstellen
in einem speziellen Speicherbereich des
Hauptspeichers 194 gespeichert. Das System nach Fig. 29 ist
daher als Teil eines Zeichenerkennungssystems in hohem Maße
vorteilhaft.
Die obige Beschreibung ist anhand von verschiedenen Ausführungsformen
der Erfindung gegeben worden, von denen ggf. abgewichen
werden kann, ohne den Grundgedanken der Erfindung
zu verlassen. Beispielsweise ist von Richtungskodes als
einem Zeichenabbild zuzuordnenden Merkmalen Gebrauch gemacht
worden. Es können jedoch auch andere spezifische Arten von
Merkmalen verwendet werden.
Claims (51)
1. Zeichenerkennungsverfahren, enthaltend die folgenden
Schritte:
optisches Lesen eines eingegebenen, zu erkennenden Zeichens zur Bildung eines binären Zeichenbildes, enthaltend wenigstens eine Zeichenzeile, die aus schwarzen Pixeln (Bildpunkten) besteht;
Verbreitern der Zeichenzeile in Übereinstimmung mit einer vorbestimmten Weise;
Zuordnen einer Mehrzahl erster Merkmale, die voneinander verschieden sind, zu jedem solcher Pixel, die eine Kontur des binären Zeichenabbildes definieren. In Abhängigkeit vom örtlichen Muster der Anordnung aus schwarzen und weißen Pixeln längs der Kontur;
Zählen der ersten Merkmale, die dem Zeichenabbild zugeordnet worden sind;
Unterteilen des Zeichenabbildes in eine Mehrzahl von Netzunterbereichen auf der Grundlage der Zählung der genannten zugeordneten ersten Merkmale;
Extrahieren eines zweiten Merkmals aus jedem der genannten Unterbereiche, um eine Sammlung von extrahierten zweiten Merkmalen zu definieren; und
Identifizieren des eingegebenen Zeichens durch einen Vergleich der genannten Sammlung extrahierter zweiter Merkmale mit jeder aus einer Mehrzahl von gespeicherten Sammlungen zweiter Merkmale für bekannte Zeichen und Auswählen jenes der bekannten Zeichen, das einen höchsten Grad von Ähnlichkeit aufweist.
optisches Lesen eines eingegebenen, zu erkennenden Zeichens zur Bildung eines binären Zeichenbildes, enthaltend wenigstens eine Zeichenzeile, die aus schwarzen Pixeln (Bildpunkten) besteht;
Verbreitern der Zeichenzeile in Übereinstimmung mit einer vorbestimmten Weise;
Zuordnen einer Mehrzahl erster Merkmale, die voneinander verschieden sind, zu jedem solcher Pixel, die eine Kontur des binären Zeichenabbildes definieren. In Abhängigkeit vom örtlichen Muster der Anordnung aus schwarzen und weißen Pixeln längs der Kontur;
Zählen der ersten Merkmale, die dem Zeichenabbild zugeordnet worden sind;
Unterteilen des Zeichenabbildes in eine Mehrzahl von Netzunterbereichen auf der Grundlage der Zählung der genannten zugeordneten ersten Merkmale;
Extrahieren eines zweiten Merkmals aus jedem der genannten Unterbereiche, um eine Sammlung von extrahierten zweiten Merkmalen zu definieren; und
Identifizieren des eingegebenen Zeichens durch einen Vergleich der genannten Sammlung extrahierter zweiter Merkmale mit jeder aus einer Mehrzahl von gespeicherten Sammlungen zweiter Merkmale für bekannte Zeichen und Auswählen jenes der bekannten Zeichen, das einen höchsten Grad von Ähnlichkeit aufweist.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
der Verbreiterungsschritt enthält: Ändern eines Paares
weißer Pixel auf der linken und der rechten Seite eines
jeden der schwarzen Pixel der Zeichenzeile in schwarze
Pixel.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß
der Verbreiterungsschritt auch enthält: Verändern eines
Paares weißer Pixel über und unter jedem der schwarzen
Pixel der Zeichenzeile in schwarze Pixel.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
mehrere der ersten Merkmale eine vorbestimmte Anzahl von
Richtungskodes enthält, von denen jedes einer speziellen
Musteranordnung von schwarzen und weißen Pixeln zugeordnet
ist.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß
die spezielle Musteranordnung ein mittleres Pixel, ein Paar
linker und rechter Pixel benachbart dem mittleren Pixel und
ein Paar oberer und unterer Pixel benachbart dem mittleren
Pixel aufweist, wodurch das mittlere Pixel als ein interessierendes
Pixel dient, wenn der Zuordnungsschritt ausgeführt
wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß
das mittlere Pixel ein schwarzes Pixel ist.
7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß
das mittlere Pixel ein weißes Pixel ist.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die die Kontur definierenden Pixel schwarze Pixel sind.
9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die die Kontur definierenden Pixel weiße Pixel sind.
10. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
das zweite Merkmal ein Histogramm der ersten Merkmale in
jedem der Unterbereiche ist.
11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
der Grad der Ähnlichkeit zwischen dem eingegebenen Zeichen
und jedem der bekannten Zeichen durch Berechnung einer
Distanz zwischen den zweiten Merkmalen des eingegebenen
Zeichens und den zweiten Merkmalen eines jeden der bekannten
Zeichen bestimmt wird.
12. Zeichenerkennungsverfahren, enthaltend die folgenden
Schritte:
Erzeugen eines binären Zeichenabbildes eines bekannten, zu identifizierenden Zeichens;
Zuordnen mehrer Richtungskodes zu Pixeln, die eine Kontur des binären Zeichenabbildes definieren, selektiv entsprechend einer vorbestimmten Regel, um ein Zeichenabbild mit Kodezuordnungen zu definieren;
Zählen einer Gesamtzahl von Pixeln, denen Kodes zugeordnet sind;
Bilden eines Paares erster und zweiter projizierter Histogramme der Anzahl von Pixeln mit zugeordneten Kodes, wobei das erste projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine erste vorbestimmte Achse gebildet wird und das zweite projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine zweite vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit Kodezuordnungen in mehrere Unterbereiche auf der Grundlage der Gesamtzahl der Pixel mit zugeordneten Kodes und des Paares erster und zweiter Histogramme derart, daß jeder der Unterbereiche eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist;
Bestimmen eines Histogramms der genannten Kodes für jeden der genannten Unterbereiche zur Bildung einer Sammlung aus Histogrammen der Kodes für das eingegebene Zeichen; und
Identifizieren des eingegebenen Zeichens durch Vergleichen der Sammlung von Kodehistogrammen mit jedem aus einer Vielzahl von gespeicherten Sammlungen aus Histogrammen der Kodes für bekannte Zeichen und Auswählen eines der bekannten Zeichen, das den höchsten Grad von Ähnlichkeit aufweist.
Erzeugen eines binären Zeichenabbildes eines bekannten, zu identifizierenden Zeichens;
Zuordnen mehrer Richtungskodes zu Pixeln, die eine Kontur des binären Zeichenabbildes definieren, selektiv entsprechend einer vorbestimmten Regel, um ein Zeichenabbild mit Kodezuordnungen zu definieren;
Zählen einer Gesamtzahl von Pixeln, denen Kodes zugeordnet sind;
Bilden eines Paares erster und zweiter projizierter Histogramme der Anzahl von Pixeln mit zugeordneten Kodes, wobei das erste projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine erste vorbestimmte Achse gebildet wird und das zweite projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine zweite vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit Kodezuordnungen in mehrere Unterbereiche auf der Grundlage der Gesamtzahl der Pixel mit zugeordneten Kodes und des Paares erster und zweiter Histogramme derart, daß jeder der Unterbereiche eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist;
Bestimmen eines Histogramms der genannten Kodes für jeden der genannten Unterbereiche zur Bildung einer Sammlung aus Histogrammen der Kodes für das eingegebene Zeichen; und
Identifizieren des eingegebenen Zeichens durch Vergleichen der Sammlung von Kodehistogrammen mit jedem aus einer Vielzahl von gespeicherten Sammlungen aus Histogrammen der Kodes für bekannte Zeichen und Auswählen eines der bekannten Zeichen, das den höchsten Grad von Ähnlichkeit aufweist.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
das binäre Zeichenabbild durch optische Abtastung des unbekannten
Zeichens erzeugt wird.
14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
die Zuordnungs- und Zählschritte gleichzeitig ausgeführt
werden.
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, daß
die Zuordnungs- und Zählschritte durch Abtastung des binären
Zeichenabbildes ausgeführt werden.
16. Verfahren nach Anspruch 14, dadurch gekennzeichnet, daß
die Zuordnungs- und Zählschritte gleichzeitig mit der Erzeugung
des binären Zeichenabbildes ausgeführt werden.
17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß
das binäre Zeichenabbild durch optisches Abtasten des unbekannten
Zeichens erzeugt wird.
18. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
jeder der Richtungskodes einem speziellen Anordnungsmuster
aus schwarzen und weißen Pixeln zugeordnet ist.
19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, daß
die spezielle Musteranordnung ein mittleres Pixel, ein Paar
linker und rechter Pixel benachbart dem mittleren Pixel und
ein Paar oberer und unterer Pixel benachbart dem mittleren
Pixel aufweist, wodurch das mittlere Pixel als ein interessierendes
Pixel dient, wenn der Zuordnungsschritt ausgeführt
wird.
20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß
das mittlere Pixel ein schwarzes Pixel ist.
21. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß
das mittlere Pixel ein weißes Pixel ist.
22. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
die die Kontur definierenden Pixel schwarze Pixel sind.
23. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
die die Kontur definierenden Pixel weiße Pixel sind.
24. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
der Grad der Ähnlichkeit zwischen dem eingegebenen Zeichen
und jedem der bekannten Zeichen durch Berechnung einer
Distanz zwischen der Sammlung aus Histogrammen der genannten
Kodes des eingegebenen Zeichens und der Sammlung von Histogrammen
von Kodes eines jeden der bekannten Zeichen bestimmt
wird.
25. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß
die ersten und zweiten vorbestimmten Richtungen sich senkrecht
zueinander erstrecken.
26. Verfahren nach Anspruch 25, dadurch gekennzeichnet, daß
die erste Richtung eine horizontale Richtung und die zweite
Richtung eine vertikale Richtung ist.
27. Zeichenerkennungsverfahren, enthaltend die folgenden
Schritte:
Erzeugen eines binären Zeichenabbildes eines unbekannten, zu identifizierenden Zeichens;
Zuordnen einer Mehrzahl von Richtungskodes zu Pixeln, die eine Kontur des binären Zeichenabbildes definieren, selektiv entsprechend einer vorbestimmten Regel, um ein Zeichenabbild mit zugeordneten Kodes zu definieren;
Zählen einer Gesamtzahl von Pixeln, denen Kodes zugeordnet sind;
Bilden eines ersten projizierten Histogramms aus Pixeln, denen Kodes zugeordnet sind, wobei das erste projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine erste vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit zugeordneten Kodes in eine Mehrzahl erster Sektionen in der ersten vorbestimmten Achse auf der Grundlage der Gesamtzahl von Pixeln, denen Kodes zugeordnet sind, und des ersten projizierten Histogramms derart, daß jede der ersten Sektionen eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist;
Unterteilen einer jeden der ersten Sektionen in eine Mehrzahl von zweiten Sektionen derart, daß jede der zweiten Sektionen eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist, um dadurch das Zeichenabbild mit zugeordneten Kodes in eine Mehrzahl von Unterbereichen in Form eines Netzes zu unterteilen;
Bestimmen eines Histogramms der genannten Kodes für jeden der Unterbereiche zur Bildung einer Sammlung aus Histogrammen der genannten Kodes für das eingegebene Zeichen; und
Identifizieren des eingegebenen Zeichens durch Vergleichen der Sammlung aus Histogrammen der genannten Kodes mit jeder aus einer Mehrzahl gespeicherter Sammlungen von Histogrammen der genannten Kodes für bekannte Zeichen und Auswählen eines der bekannten Zeichen, das einen höchsten Grad von Ähnlichkeit aufweist.
Erzeugen eines binären Zeichenabbildes eines unbekannten, zu identifizierenden Zeichens;
Zuordnen einer Mehrzahl von Richtungskodes zu Pixeln, die eine Kontur des binären Zeichenabbildes definieren, selektiv entsprechend einer vorbestimmten Regel, um ein Zeichenabbild mit zugeordneten Kodes zu definieren;
Zählen einer Gesamtzahl von Pixeln, denen Kodes zugeordnet sind;
Bilden eines ersten projizierten Histogramms aus Pixeln, denen Kodes zugeordnet sind, wobei das erste projizierte Histogramm durch Projektion der Pixel mit zugeordneten Kodes auf eine erste vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit zugeordneten Kodes in eine Mehrzahl erster Sektionen in der ersten vorbestimmten Achse auf der Grundlage der Gesamtzahl von Pixeln, denen Kodes zugeordnet sind, und des ersten projizierten Histogramms derart, daß jede der ersten Sektionen eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist;
Unterteilen einer jeden der ersten Sektionen in eine Mehrzahl von zweiten Sektionen derart, daß jede der zweiten Sektionen eine im wesentlichen gleiche Anzahl von Pixeln mit zugeordneten Kodes aufweist, um dadurch das Zeichenabbild mit zugeordneten Kodes in eine Mehrzahl von Unterbereichen in Form eines Netzes zu unterteilen;
Bestimmen eines Histogramms der genannten Kodes für jeden der Unterbereiche zur Bildung einer Sammlung aus Histogrammen der genannten Kodes für das eingegebene Zeichen; und
Identifizieren des eingegebenen Zeichens durch Vergleichen der Sammlung aus Histogrammen der genannten Kodes mit jeder aus einer Mehrzahl gespeicherter Sammlungen von Histogrammen der genannten Kodes für bekannte Zeichen und Auswählen eines der bekannten Zeichen, das einen höchsten Grad von Ähnlichkeit aufweist.
28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
eine Anzahl von Pixeln, denen Kodes zugeordnet sind, in
jeder der ersten Richtungen gezählt wird, bevor jede der
ersten Sektionen unterteilt wird.
29. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
das binäre Abbild durch optisches Abtasten des unbekannten
Zeichens erzeugt wird.
30. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
die Kodezuordnung und das Zählen der Gesamtzahl von Pixeln,
die zugeordnete Kodes aufweisen, gleichzeitig ausgeführt
wird.
31. Verfahren nach Anspruch 30, dadurch gekennzeichnet, daß
das Zuordnen der Kodes und das Zählen der Gesamtzahl der
Pixel, denen Kodes zugeordnet sind, durch Abtastung des
binären Zeichenabbildes ausgeführt werden.
32. Verfahren nach Anspruch 30, dadurch gekennzeichnet, daß
das Zuordnen der Kodes und das Zählen der Pixel simultan
mit der Erstellung des binären Zeichenabbildes ausgeführt
werden.
33. Verfahren nach Anspruch 32, dadurch gekennzeichnet, daß
das binäre Zeichenabbild durch optisches Abtasten des unbekannten
Zeichens erzeugt wird.
34. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
jeder der Richtungskodes einer speziellen Musteranordnung
aus weißen und schwarzen Pixeln zugeordnet ist.
35. Verfahren nach Anspruch 34, dadurch gekennzeichnet, daß
die spezielle Musteranordnung ein mittleres Pixel, ein Paar
linker und rechter Pixel benachbart dem mittleren Pixel und
ein Paar obere und untere Pixel benachbart dem mittleren
Pixel aufweist, wodurch das mittlere Pixel als ein interessierendes
Pixel dient, wenn der Zuordnungsschritt ausgeführt
wird.
36. Verfahren nach Anspruch 35, dadurch gekennzeichnet, daß
das mittlere Pixel ein schwarzes Pixel ist.
37. Verfahren nach Anspruch 35, dadurch gekennzeichnet, daß
das mittlere Pixel ein weißes Pixel ist.
38. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
die die Kontur definierenden Pixel schwarze Pixel sind.
39. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
die die Kontur definierenden Pixel weiße Pixel sind.
40. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
das Ausmaß an Ähnlichkeit zwischen dem eingegebenen Zeichen
und jeden der bekannten Zeichen durch Berechnung einer
Distanz zwischen der Sammlung von Histogrammen der Kodes
des eingegebenen Zeichens und der Sammlung von Histogrammen
der Kodes von jedem der bekannten Zeichen bestimmt wird.
41. Verfahren nach Anspruch 27, dadurch gekennzeichnet, daß
die ersten und zweiten vorbestimmten Richtungen sich senkrecht
zueinander erstrecken.
42. Verfahren nach Anspruch 41, dadurch gekennzeichnet, daß
die erste Richtung eine horizontale Richtung und die zweite
Richtung eine vertikale Richtung ist.
43. Zeichenerkennungsverfahren, enthaltend die folgenden
Schritte:
Erzeugen eines binären Zeichenabbildes eines eingegebenen Zeichens;
Zuordnen einer Mehrzahl vorbestimmter Merkmale zu dem binären Zeichenabbild selektiv in Übereinstimmung mit einer vorbestimmten Regel, um dadurch ein Zeichenabbild mit zugeordneten Merkmalen zu definieren;
Zählen einer Gesamtzahl von zugeordneten Merkmalen;
Bilden eines Paares erster und zweiter projizierter Histogramme der zugeordneten Merkmale, wobei das erste projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine erste vorbestimmte Achse gebildet wird und das zweite projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine zweite vorbestimmte Achse gebildet wird; und
Unterteilen des Zeichenabbildes mit zugeordneten Merkmalen in eine Mehrzahl von Unterbereichen auf der Grundlage der genannten Gesamtzahl zugeordneter Merkmale und des Paares erster und zweiter projizierter Histogramme derart, daß jeder der Unterbreiche an den genannten zugeordneten Merkmalen im wesentlichen in gleicher Zahl teilhat.
Erzeugen eines binären Zeichenabbildes eines eingegebenen Zeichens;
Zuordnen einer Mehrzahl vorbestimmter Merkmale zu dem binären Zeichenabbild selektiv in Übereinstimmung mit einer vorbestimmten Regel, um dadurch ein Zeichenabbild mit zugeordneten Merkmalen zu definieren;
Zählen einer Gesamtzahl von zugeordneten Merkmalen;
Bilden eines Paares erster und zweiter projizierter Histogramme der zugeordneten Merkmale, wobei das erste projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine erste vorbestimmte Achse gebildet wird und das zweite projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine zweite vorbestimmte Achse gebildet wird; und
Unterteilen des Zeichenabbildes mit zugeordneten Merkmalen in eine Mehrzahl von Unterbereichen auf der Grundlage der genannten Gesamtzahl zugeordneter Merkmale und des Paares erster und zweiter projizierter Histogramme derart, daß jeder der Unterbreiche an den genannten zugeordneten Merkmalen im wesentlichen in gleicher Zahl teilhat.
44. Verfahren nach Anspruch 43, dadurch gekennzeichnet, daß
die Zuordnungs- und Zählschritte gleichzeitig ausgeführt
werden.
45. Verfahren nach Anspruch 44, dadurch gekennzeichnet, daß
die Erzeugung des binären Zeichenabbildes gleichzeitig mit
den Zuordnungs- und Zählschritten ausgeführt wird.
46. Verfahren nach Anspruch 43, dadurch gekennzeichnet, daß
die Erzeugung des binären Abbildes durch optisches Abtasten
des angegebenen Zeichens ausgeführt wird.
47. Zeichenunterteilungsverfahren enthaltend die folgenden
Schritte:
Erzeugen eines binären Zeichenabbildes eines eingegebenen Zeichens;
Zuordnen mehrerer vorbestimmter Merkmale zu dem binären Zeichenabbild selektiv in Übereinstimung mit einer vorbestimmten Regel, um dadurch ein Zeichenabbild mit zugeordneten Merkmalen zu definieren;
Zählen einer Gesamtzahl zugeordneter Merkmale;
Bilden eines ersten projizierten Histogramms der zugeordneten Merkmale, wobei das erste projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine erste vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit zugeordneten Merkmalen in eine Mehrzahl erster Sektionen in der ersten vorbestimmten Achse auf der Grundlage der genannten Gesamtzahl und des ersten projizierten Histogramms derart, daß jede der ersten Sanktionen an den zugeordneten Merkmalen in im wesentlichen gleicher Zahl teilhat; und
Unterteilen einer jeden der ersten Sektionen in eine Mehrzahl zweiter Sektionen derart, daß jede der zweiten Sektionen eine im wesentlichen gleiche Zahl der zugeordneten Merkmale aufweist, um dadurch das Zeichenbild mit zugeordneten Merkmalen in eine Mehrzahl von Unterbereichen in Form eines Netzes zu unterteilen.
Erzeugen eines binären Zeichenabbildes eines eingegebenen Zeichens;
Zuordnen mehrerer vorbestimmter Merkmale zu dem binären Zeichenabbild selektiv in Übereinstimung mit einer vorbestimmten Regel, um dadurch ein Zeichenabbild mit zugeordneten Merkmalen zu definieren;
Zählen einer Gesamtzahl zugeordneter Merkmale;
Bilden eines ersten projizierten Histogramms der zugeordneten Merkmale, wobei das erste projizierte Histogramm durch Projektion der zugeordneten Merkmale auf eine erste vorbestimmte Achse gebildet wird;
Unterteilen des Zeichenabbildes mit zugeordneten Merkmalen in eine Mehrzahl erster Sektionen in der ersten vorbestimmten Achse auf der Grundlage der genannten Gesamtzahl und des ersten projizierten Histogramms derart, daß jede der ersten Sanktionen an den zugeordneten Merkmalen in im wesentlichen gleicher Zahl teilhat; und
Unterteilen einer jeden der ersten Sektionen in eine Mehrzahl zweiter Sektionen derart, daß jede der zweiten Sektionen eine im wesentlichen gleiche Zahl der zugeordneten Merkmale aufweist, um dadurch das Zeichenbild mit zugeordneten Merkmalen in eine Mehrzahl von Unterbereichen in Form eines Netzes zu unterteilen.
48. Verfahren nach Anspruch 47, dadurch gekennzeichnet, daß
die Zuordnungs- und Zählschritte gleichzeitig ausgeführt
werden.
49. Verfahren nach Anspruch 48, dadurch gekennzeichnet, daß
die Erzeugung des binären Zeichenabbildes gleichzeitig mit
dem Zuordnungs- und Zählschritten ausgeführt wird.
50. Verfahren nach Anspruch 47, dadurch gekennzeichnet, daß
die Erzeugung des binären Zeichenabbildes durch optisches
Abtasten des eingegebenen Zeichens ausgeführt wird.
51. Verfahren nach Anspruch 47, dadurch gekennzeichnet, daß
eine Anzahl von zugeordneten Merkmalen in jeder der ersten
Sektionen gezählt wird, bevor jede der ersten Sektionen
unterteilt wird.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61114042A JPS62269286A (ja) | 1986-05-19 | 1986-05-19 | 文字認識方式 |
JP61249159A JPS63103392A (ja) | 1986-10-20 | 1986-10-20 | 文字認識方式 |
JP61251537A JPH0795335B2 (ja) | 1986-10-22 | 1986-10-22 | 領域分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3716787A1 true DE3716787A1 (de) | 1987-11-26 |
DE3716787C2 DE3716787C2 (de) | 1990-09-06 |
Family
ID=27312638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19873716787 Granted DE3716787A1 (de) | 1986-05-19 | 1987-05-19 | Zeichenerkennungsverfahren |
Country Status (3)
Country | Link |
---|---|
US (1) | US4903312A (de) |
DE (1) | DE3716787A1 (de) |
GB (1) | GB2190778B (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3923914A1 (de) * | 1988-07-20 | 1990-02-15 | Ricoh Kk | Verfahren zum extrahieren eines zeichenmerkmals |
WO1991017518A1 (en) * | 1990-05-07 | 1991-11-14 | Eastman Kodak Company | Rotationally impervious feature extraction for optical character recognition |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5504822A (en) * | 1986-09-19 | 1996-04-02 | Holt; Arthur W. | Character recognition system |
US4905295A (en) * | 1986-11-13 | 1990-02-27 | Ricoh Company, Ltd. | Code sequence matching method and apparatus |
DE3815869A1 (de) * | 1987-05-08 | 1988-11-17 | Ricoh Kk | Verfahren zum extrahieren von merkmalsmengen eines zeichens |
US4959870A (en) * | 1987-05-26 | 1990-09-25 | Ricoh Company, Ltd. | Character recognition apparatus having means for compressing feature data |
JPH07120385B2 (ja) * | 1987-07-24 | 1995-12-20 | シャープ株式会社 | 光学的読取り方法 |
US5046115A (en) * | 1987-10-26 | 1991-09-03 | Kabushiki Kaishakomatsu Seisakusho | Method of processing image data on crack |
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
US5247587A (en) * | 1988-07-15 | 1993-09-21 | Honda Giken Kogyo Kabushiki Kaisha | Peak data extracting device and a rotary motion recurrence formula computing device |
US5195147A (en) * | 1989-05-02 | 1993-03-16 | Ricoh Company, Ltd. | Image forming apparatus |
JP2542947B2 (ja) * | 1990-05-09 | 1996-10-09 | 大日本スクリーン製造株式会社 | 画像処理装置 |
US5020121A (en) * | 1990-08-16 | 1991-05-28 | Hewlett-Packard Company | Neighborhood block prediction bit compression |
US5121440A (en) * | 1990-08-30 | 1992-06-09 | Monolithic Resources Corporation | Analog video character recognition system |
US5428692A (en) * | 1991-11-18 | 1995-06-27 | Kuehl; Eberhard | Character recognition system |
US5307424A (en) * | 1990-12-12 | 1994-04-26 | Eberhard Kuehl | Character recognition system |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
US5515455A (en) * | 1992-09-02 | 1996-05-07 | The Research Foundation Of State University Of New York At Buffalo | System for recognizing handwritten words of cursive script |
JP3106021B2 (ja) * | 1992-11-30 | 2000-11-06 | キヤノン株式会社 | パターンデータの圧縮方法及び装置と出力方法及び装置 |
JPH06203165A (ja) * | 1993-01-07 | 1994-07-22 | Canon Inc | 画像情報処理方法及び装置 |
US5491758A (en) * | 1993-01-27 | 1996-02-13 | International Business Machines Corporation | Automatic handwriting recognition using both static and dynamic parameters |
JPH06348800A (ja) * | 1993-06-02 | 1994-12-22 | Canon Inc | 画像処理方法及び装置 |
US5444793A (en) * | 1993-06-15 | 1995-08-22 | Ncr Corporation | Method for detecting machine printed monetary amounts in binary images |
JPH07129720A (ja) * | 1993-11-04 | 1995-05-19 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP3027321B2 (ja) * | 1994-09-27 | 2000-04-04 | 財団法人工業技術研究院 | 拘束のない手書き英数字のオンライン認識の方法及び装置 |
JPH08194780A (ja) * | 1994-11-18 | 1996-07-30 | Ricoh Co Ltd | 特徴抽出方法 |
US5802207A (en) * | 1995-06-30 | 1998-09-01 | Industrial Technology Research Institute | System and process for constructing optimized prototypes for pattern recognition using competitive classification learning |
JP4305971B2 (ja) * | 1998-06-30 | 2009-07-29 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US7221810B2 (en) * | 2000-11-13 | 2007-05-22 | Anoto Group Ab | Method and device for recording of information |
JP4161659B2 (ja) * | 2002-02-27 | 2008-10-08 | 日本電気株式会社 | 画像認識システム及びその認識方法並びにプログラム |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
JP4047090B2 (ja) * | 2002-07-31 | 2008-02-13 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
US7190834B2 (en) * | 2003-07-22 | 2007-03-13 | Cognex Technology And Investment Corporation | Methods for finding and characterizing a deformed pattern in an image |
US7388990B2 (en) * | 2003-09-22 | 2008-06-17 | Matrox Electronics Systems, Ltd. | Local mass distribution partitioning for object recognition |
US7707039B2 (en) * | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
US8620083B2 (en) * | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US7525034B2 (en) * | 2004-12-17 | 2009-04-28 | Nease Joseph L | Method and apparatus for image interpretation into sound |
US9137417B2 (en) | 2005-03-24 | 2015-09-15 | Kofax, Inc. | Systems and methods for processing video data |
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
US8749839B2 (en) * | 2005-03-24 | 2014-06-10 | Kofax, Inc. | Systems and methods of processing scanned data |
JP2009070226A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | マッチング装置 |
TWI374658B (en) * | 2007-09-29 | 2012-10-11 | Htc Corp | Image process method |
US9349046B2 (en) | 2009-02-10 | 2016-05-24 | Kofax, Inc. | Smart optical input/output (I/O) extension for context-dependent workflows |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US8774516B2 (en) | 2009-02-10 | 2014-07-08 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8958605B2 (en) | 2009-02-10 | 2015-02-17 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9058580B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9483794B2 (en) | 2012-01-12 | 2016-11-01 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US8989515B2 (en) | 2012-01-12 | 2015-03-24 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9058515B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
EP2973226A4 (de) | 2013-03-13 | 2016-06-29 | Kofax Inc | Klassifizierung von objekten auf mit mobilvorrichtungen aufgenommenen digitalbildern |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
JP2016518790A (ja) | 2013-05-03 | 2016-06-23 | コファックス, インコーポレイテッド | モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法 |
WO2015073920A1 (en) | 2013-11-15 | 2015-05-21 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US10163004B2 (en) | 2017-03-30 | 2018-12-25 | Konica Minolta Laboratory U.S.A., Inc. | Inferring stroke information from an image |
US10579893B2 (en) | 2017-02-28 | 2020-03-03 | Konica Minolta Laboratory U.S.A., Inc. | Inferring stroke information from an image |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
US3803553A (en) * | 1972-06-14 | 1974-04-09 | Hitachi Ltd | Character recognition apparatus |
US4254400A (en) * | 1978-12-13 | 1981-03-03 | Hitachi, Ltd. | Image data processor |
DE2801536C2 (de) * | 1977-01-14 | 1983-05-05 | NCR Canada Ltd. - NCR Canada LTEE, Toronto, Ontario | Zeichenformkodiervorrichtung |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5418632A (en) * | 1977-07-12 | 1979-02-10 | Nippon Telegr & Teleph Corp <Ntt> | Character identification system |
US4162482A (en) * | 1977-12-07 | 1979-07-24 | Burroughs Corporation | Pre-processing and feature extraction system for character recognition |
US4229768A (en) * | 1978-03-30 | 1980-10-21 | Canon Kabushiki Kaisha | Information processing apparatus |
JPS596421B2 (ja) * | 1978-08-28 | 1984-02-10 | 肇産業株式会社 | パタ−ン情報処理方法 |
US4300122A (en) * | 1979-04-02 | 1981-11-10 | Sperry Corporation | Apparatus for processing digital data representative of a two-dimensional image |
US4688088A (en) * | 1984-04-20 | 1987-08-18 | Canon Kabushiki Kaisha | Position detecting device and method |
-
1987
- 1987-05-19 DE DE19873716787 patent/DE3716787A1/de active Granted
- 1987-05-19 GB GB8711738A patent/GB2190778B/en not_active Expired - Fee Related
-
1988
- 1988-09-06 US US07/241,825 patent/US4903312A/en not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
US3803553A (en) * | 1972-06-14 | 1974-04-09 | Hitachi Ltd | Character recognition apparatus |
DE2801536C2 (de) * | 1977-01-14 | 1983-05-05 | NCR Canada Ltd. - NCR Canada LTEE, Toronto, Ontario | Zeichenformkodiervorrichtung |
US4254400A (en) * | 1978-12-13 | 1981-03-03 | Hitachi, Ltd. | Image data processor |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3923914A1 (de) * | 1988-07-20 | 1990-02-15 | Ricoh Kk | Verfahren zum extrahieren eines zeichenmerkmals |
WO1991017518A1 (en) * | 1990-05-07 | 1991-11-14 | Eastman Kodak Company | Rotationally impervious feature extraction for optical character recognition |
Also Published As
Publication number | Publication date |
---|---|
GB8711738D0 (en) | 1987-06-24 |
GB2190778B (en) | 1990-04-25 |
GB2190778A (en) | 1987-11-25 |
US4903312A (en) | 1990-02-20 |
DE3716787C2 (de) | 1990-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3716787C2 (de) | ||
DE3633743C2 (de) | ||
DE3806223C2 (de) | Verfahren zur Erzeugung von Zeichenmustern | |
DE69723220T2 (de) | Gerät und Verfahren zur Extrahierung von Tabellengeraden innerhalb normaler Dokumentbilder | |
DE60129872T2 (de) | Verfahren zur Extrahierung von Titeln aus numerischen Bildern | |
DE60120810T2 (de) | Verfahren zur Dokumenterkennung und -indexierung | |
DE69721941T2 (de) | Gerät und Verfahren zum Extrahieren von Mustern | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE60204005T2 (de) | Verfahren und einrichtung zur erkennung eines handschriftlichen musters | |
DE3425449A1 (de) | Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung | |
DE4427992C2 (de) | Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments | |
DE3440377A1 (de) | Verfahren zum verkleinern eines zeichenschriftsatzes | |
DE3342947A1 (de) | Verfahren zur behandlung der daten eines binaeren grafischen musters und system dafuer | |
DE3722444A1 (de) | Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten | |
EP0402868B1 (de) | Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen | |
DE3815869C2 (de) | ||
EP2082357B1 (de) | Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE19531392C1 (de) | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen | |
WO2005119580A1 (de) | Verfahren und einrichtung zur strukturanalyse eines dokuments | |
DE4119091A1 (de) | Verfahren und einrichtung zum erkennen von zeichen | |
DE60217748T2 (de) | Verfahren und Gerät zur Anzeige eines Bildraumes | |
DE2623861B2 (de) | Verfahren zum maschinellen Lesen von Schriftzeichen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |