DE3716787C2 - - Google Patents
Info
- Publication number
- DE3716787C2 DE3716787C2 DE3716787A DE3716787A DE3716787C2 DE 3716787 C2 DE3716787 C2 DE 3716787C2 DE 3716787 A DE3716787 A DE 3716787A DE 3716787 A DE3716787 A DE 3716787A DE 3716787 C2 DE3716787 C2 DE 3716787C2
- Authority
- DE
- Germany
- Prior art keywords
- character
- pixels
- codes
- subdivision
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
Die Erfindung betrifft ein Zeichenerkennungsverfahren nach
dem Oberbegriff des Anspruches 1.
Ein derartiges Zeichenerkennungsverfahren ist aus der US-PS
42 54 400 bekannt. Gemäß diesem bekannten Zeichenerkennungs
verfahren wird von einem zu erkennenden Zeichen ein binäres
Zeichenabbild hergestellt, in dem das binäre Zeichen in eine
Vielzahl von Regionen unterteilt wird. Diese Unterteilung des
binären Zeichenabbilds in Unterbereiche basiert auf der Er
kenntnis, daß es schwierig ist, direkt die gesamten Daten zu
speichern und zu vergleichen, da die zu verarbeitende Daten
menge enorm hoch ist. Bei diesem bekannten Verfahren werden
ferner die Daten jedes Unterbereiches mit Daten verglichen,
die zu einem früheren Zeitpunkt durch einen ähnlichen Prozeß
extrahiert und abgespeichert wurden. Die für Vergleichszwecke
verwendeten Daten werden in Form einer Vielzahl von Signal
paaren von Bildelementen gewonnen und werden mit abgespei
cherten Daten verglichen, um dadurch eine Zeichenerkennung
durchzuführen.
Aus der DE 28 01 536 C2 ist eine Zeichenformkodierungsvor
richtung mit einem Abtaster zum Abtasten von auf einem
Hintergrundmedium angeordneten Mustern und mit einer Digi
talisierungseinrichtung bekannt, welche aus den abgetaste
ten Signalen Digitalsignale erzeugt, welche den Musterele
mentbereichen und Hintergrundelementbereichen entsprechen.
Eine sogenannte Verdünnungseinrichtung verarbeitet die Di
gitalsignale, die in Bildspeichern abgespeichert werden.
Diese Bildsignale entsprechen einem Grenzlinienmuster,
welches weniger Musterelementbereiche aufweist als das
durch die genannten Digitalsignale wiedergegebene Muster.
Der Bildspeicher speichert somit verdünnte Musterdaten,
die das genannte Grenzlinienmuster darstellen, wobei eine
Verarbeitungseinheit die verdünnten Musterdaten verarbei
tet. Es werden Vektordarstellungen aus Liniensegmenten ge
bildet, die die aufeinanderfolgenden Grenzlinien-Datenele
mente der verdünnten Musterdaten, die in dem Bildspeicher
gespeichert sind, verbinden, wobei die Vektordarstellungen
in Binärform kodiert sind und eine erste Folge von Binär
zahlen bilden. Das wesentliche dieser bekannten Vorrich
tung besteht darin, daß die Verarbeitungseinrichtung Hö
hen- und Breitenspeicher besitzt, die eine Darstellung der
Höhe und Breite der Grenzlinienmuster speichert, sowie
einen Zeichenbit-Speicher zum Speichern des Produkts aus
Höhe und Breite als zweite Folge von Binärzahlen und daß
ferner ein Vergleicher vorgesehen ist, in dem die Anzahl
der Binärziffern in der ersten und zweiten Folge von Bi
närzahlen verglichen und die Folge von Binärzahlen mit der
kleineren Zahl von Binärziffern angezeigt wird. Bei diesem
bekannten System werden somit für eine Zeichenkodierung
lediglich Grenzlinienmusterdaten abgespeichert, wodurch
sehr viel Speicherkapazität eingespart werden kann.
Aus der US-PS 37 55 780 ist ein Verfahren zur Erkennung
eines digitalisierten Zeichens bekannt, wobei die Gestalt
eines Zeichens durch die Zahl, die Position und die Ge
stalt von abwechselnden Konturkrümmungen, insbesondere
Konvexkrümmungen wiedergegeben wird, wenn das Zeichen von
zwei Seiten betrachtet wird. Die Artengruppe eines Zei
chens wird dabei durch die Anzahl und die Positionen der
konvexen Krümmungen bestimmt, wobei insgesamt neun Arten
gruppen in dem System Verwendung finden. Jeder Artengruppe
wird ein getrennter linearer logischer Diskriminationstest
zugeordnet, und zwar für jedes Paar der Zeichen, welche
die Artengruppe gemeinsam haben. In Abhängigkeit von der
Artengruppe des zu erkennenden Zeichens werden die zuge
ordneten paarweisen Diskriminantentests durchgeführt und
die Zeichenklasse, welche eine bestimmte Anzahl dieser
Tests überdauert hat, wird dann schließlich als die Klasse
des Zeichens identifiziert, die zu erkennen war.
Bei der praktischen Realisierung dieses bekannten Verfah
rens wird auch ein Histogramm gebildet, und zwar ein lin
kes Histogramm und ein rechtes Histogramm, wobei das Hi
stogramm dadurch definiert ist, daß Adressen gesammelt
werden, bei denen ein erster schwarzer Bildpunkt in jeder
der Abtastzellen auftritt.
Aus der US-PS 38 03 553 ist ein Zeichenerkennungsgerät be
kannt, bei welchem Projektionsmuster mit einer Anzahl von
genormten Projektionsmustern verglichen werden und wobei
die Projektionsmuster dadurch erhalten werden, indem eine
Dichteverteilung eines gedruckten Zeichens auf zwei sich
orthogonal schneidenden Achsen projiziert wird. Die ge
normten Projektionsmuster werden mit Hilfe eines ähnlichen
Verfahrens gebildet und werden getrennt aufgezeichnet bzw.
gespeichert.
Bei der maschinellen Erkennung von handgeschriebenen, ma
schinengeschriebenen oder gedruckten Zeichen wird das zu
erkennende Zeichen zunächst von einem Abtaster optisch ge
lesen, d. h. abgetastet, um ein binäres Abbild des Zeichens
zu definieren, und anschließend wird ein Zeichenbereich,
der darin das so definierte binäre Abbild enthält, in eine
Mehrzahl von Unterbereichen unterteilt, woran sich das
Extrahieren von Merkmalen für jeden der Unterbereiche an
schließt. Bei der bekannten Zeichenerkennungstechnologie
wurde die Bereichsunterteilung unter Verwendung fester Un
terteilungspunkte ausgeführt, wie in der JP-OS 56-1 10 191
beschrieben, oder durch variable Bestimmung von Unterteil
lungspunkten, wobei ein Schwerpunkt der Konturverteilung
des zu erkennenden Zeichens verwendet wird, wie in "Oki
Electric Research and Development", Dezember 1983, 121,
Band 50, Nr. 3, Seiten 77 bis 82, beschrieben. Bei dem
erstgenannten Verfahren hat sich jedoch gezeigt, daß die
festen Unterteilungspunkte häufig ungeeignet sind, da in
einem zu erkennenden Zeichen Verformungen vorhanden sind,
so daß Zeichenmerkmale nicht richtig extrahiert werden
konnten, wodurch die Zeichenerkennungsfähigkeit herab
gesetzt wurde. Das Verfahren mit solchen Festpunkten für die
Unterteilung ist daher nicht geeignet, Verformungen in den
zu erkennenden Zeichen Rechnung zu tragen. Das zweit
genannte Verfahren, das den Schwerpunkt eines Zeichens ver
wendet, ist auf Zeichenverformungen weniger empfindlich.
Der für die Unterteilungen eines Zeichenbereiches erfor
derliche Berechnungsaufwand ist jedoch enorm, da dieses
Verfahren den Schwerpunkt der Konturverteilung des Zei
chens verwendet, so daß dieses Verfahren im allgemeinen
sehr langsam abläuft.
Um die oben beschriebenen Probleme zu überwinden, ist be
reits ein Zeichenerkennungsverfahren vorgeschlagen worden,
das in der japanischen Patentanmeldung 59-2 17 716 seinen
Niederschlag gefunden hat und die meisten der oben be
schriebenen Nachteile beseitigt. Dennoch bleiben noch im
mer Forderungen zu erfüllen, die sich aus der Unterschei
dung einander ähnlicher Zeichen und der Erkennung verform
ter Zeichen oder gedruckter oder handgeschriebener Zeichen
geringer Qualität ergeben.
Der Erfindung liegt daher die Aufgabe zugrunde, die Nach
teile des oben beschriebenen Standes der Technik zu über
winden und ein verbessertes Zeichenerkennungsverfahren
anzugeben, das in der Lage ist, auch schlecht dargestellte,
insbesondere handgeschriebene verformte Zeichen mit größe
rer Sicherheit zu erkennen.
Diese Aufgabe wird durch die im Kennzeichnungsteil des An
spruches 1 aufgeführten Merkmale gelöst.
Besonders vorteilhafte Ausgestaltungen und Weiterbildungen
der Erfindung ergeben sich aus den Unteransprüchen 2 bis 11.
Im folgenden wird die Erfindung anhand von Ausführungsbei
spielen unter Hinweis auf die Zeichnung näher erläutert.
Es zeigt:
Fig. 1 ein Flußdiagramm des Verfahrensablauf zur automatischen
Erkennung eines Eingabezeichens in Übereinstimmung
mit einer Ausführungsform mit Merkmalen nach der vorliegenden
Erfindung;
Fig. 2 ein Blockdiagramm, das schematisch den Gesamtaufbau
eines optischen Zeichenerkennungssystems zur Ausführung
der Schritte in Fig. 1 zeigt;
Fig. 3 eine Darstellung, die ein Beispiel eines binären
Zeichenabbildes in Form einer Punktmatrix zeigt,
die durch optische Abtastung des Buchstabens "B"
erhalten wird;
Fig. 4 eine Darstellung, die das Ergebnis zeigt, wenn eine
Zeilenverbreiterung auf das binäre Zeichenabbild
nach Fig. 3 angewendet worden ist;
Fig. 5 eine Darstellung des Ergebnisses, wenn mehrere
vorbestimmte Richtungskodes selektiv der Kontur des
verbreiterten binären Zeichenkodes nach Fig. 4 zugeordnet
worden sind. Weiterhin zeigt Fig. 5 das Ergebnis
der Unterteilungen des Abbildes;
Fig. 6 eine schematische Darstellung, die die Korrespondenz
zwischen mehreren Richtungskodes, die selektiv den
weißen Umrißpixeln eines binären Zeichenabbildes
zuzuordnen sind, und Pixelmustern zeigt;
Fig. 7 ein Flußdiagramm des Ablaufs der Schritte in einem
Verfahren zur Zeichenunterteilung, das zur Anwendung
auf das Zeichenerkennungsverfahren nach Fig. 1
geeignet ist;
Fig. 8 ein Flußdiagramm, das die Schrittablauffolge eines
Zeichenerkennungsvorganges in Übereinstimmung mit
einer anderen Ausführungsform mit Merkmalen nach der vorliegenden
Erfindung zeigt;
Fig. 9 ein Blockdiagramm, das den Aufbau eines optischen
Zeichenerkennungssystems zur Ausführung des Verfahrens
nach Fig. 8 zeigt;
Fig. 10 eine schematische Darstellung, daß die Korrespondenzen
zwischen mehreren Richtungskodes, die selektiv
weißen Umrißpixeln eines binären Zeichenabbildes
zuzuordnen sind, und Pixelmustern zeigt;
Fig. 11 eine Darstellung, die ein binäres Zeichenabbild für
ein handgeschriebenes japanisches Katakana-Zeichen
"a" nach der Vorverarbeitung zeigt;
Fig. 12 eine Darstellung, die die Ergebnisse zeigt, wenn
ein Satz von Richtungskodes für schwarze Umrißpixel
selektiv den Umriß-Schwarzpixeln des binären Zeichenabbildes
nach Fig. 11 zugeordnet worden ist;
Fig. 13 eine Darstellung, die das Ergebnis zeigt, wenn ein
Satz Richtungskodes für weiße Umrißpixel selektiv
den Umriß-Weißpixeln des binären Zeichenabbildes
nach Fig. 11 zugeordnet worden ist;
Fig. 14 eine Darstellung, die ein Beispiel von X- und Y-
Histogrammen für ein binäres Zeichenabbild zeigt,
dessen Umriß ein Satz von Richtungskodes selektiv
zugeordnet worden ist;
Fig. 15 ein Flußdiagramm, das die Schrittablauffolge in
einem Zeichenunterteilungsverfahren zeigt, das
vorteilhafterweise auf das Zeichenerkennungsverfahren
nach Fig. 8 angewendet werden kann;
Fig. 16 eine Darstellung, die die Ergebnisse einer Zeichenunterteilung
zeigt, die mit dem Verfahren nach
Fig. 15 ausgeführt worden ist;
Fig. 17 ein Flußdiagramm, das die Schrittablauffolge eines
anderen Zeichenunterteilungsverfahrens zeigt, das
ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren
nach Fig. 8 angewendet werden
kann;
Fig. 18 eine Darstellung der Ergebnisse einer Zeichenunterteilung,
die nach dem Verfahren nach Fig. 17 ausgeführt
wird;
Fig. 19 ein Flußdiagramm, das die Schrittablauffolge eines
weiteren Zeichenunterteilungsverfahrens zeigt, das
ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren
nach Fig. 8 anwendbar ist;
Fig. 20 eine Darstellung des Ergebnisses einer Zeichenunterteilung,
die nach dem Verfahren nach Fig. 19 abläuft;
Fig. 21 ein Schema, wie die Fig. 21a und 21b zusammenzusetzen
sind;
Fig. 21a und 21b zusammen ein Flußdiagramm, das die
Schrittablauffolge eines Zeichenunterteilungsverfahrens
zeigt, das in Übereinstimmung mit einer Ausführungsform
mit Merkmalen nach der vorliegenden Erfindung gestaltet
ist und vorteilhafterweise auf ein Zeichenerkennungsverfahren
anwendbar ist;
Fig. 22 eine Darstellung einer Mehrzahl von Richtungskodes,
die grundsätzlich den Richtungskodes nach Fig. 6
entsprechen;
Fig. 23 eine Darstellung eines Beispiels eines Histogrammes
für die Merkmalspixel eines binären Zeichenabbildes;
Fig. 24a und 24b Darstellungen der Ergebnisse von Zeichenunterteilungen,
wenn diese durch das Verfahren nach
den Fig. 21a und 21b ausgeführt werden;
Fig. 25 eine schematische Darstellung, wie die Fig. 25a
und 25b zusammenzusetzen sind;
Fig. 25a und 25b zusammen ein Flußdiagramm, das die Schrittablauffolge
eines weiteren Zeichenunterteilungsverfahrens
zeigt, das gemäß einem weiteren Ausführungsbeispiel
mit Merkmalen nach der vorliegenden Erfindung gestaltet ist
und ebenfalls vorteilhaft auf ein Zeichenerkennungsverfahren
angewendet werden kann;
Fig. 26a und 26b Darstellungen der Ergebnisse einer Zeichenunterteilung,
die nach den Verfahren nach den
Fig. 21a und 21b bzw. 25a und 25b ausgeführt
worden sind;
Fig. 27 eine schematische Darstellung, wie die Fig. 27a
und 27b zusammenzusetzen sind;
Fig. 27a und 27b zusammen ein Flußdiagramm hinsichtlich der
Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens,
das in Übereinstimmung mit einem
weiteren Ausführungsbeispiel mit Merkmalen nach der vorliegenden
Erfindung aufgebaut ist und ebenfalls vorteilhaft bei
einem Zeichenerkennungsverfahren angewandt werden
kann;
Fig. 28a und 28b die Ergebnisse von Zeichenunterteilungen,
die nach den Verfahren nach den Fig. 25a
und 25b bzw. 27a und 27b ausgeführt worden sind;
Fig. 29 ein Blockschaltbild, das den Aufbau eines Zeichenunterteilungssystems
zeigt, das in der Lage ist,
die Zeichenunterteilungsverfahren nach den Fig.
21a und 21b bzw. 25a und 25b bzw. 27a und 27b auszuführen, und
Fig. 30a und 30b Darstellungen der Ergebnisse einer
Unterteilung eines japanischen Katakana-Zeichens
"wu", die unter Verwendung fester Unterteilungsstellen
ausgeführt worden sind.
Fig. 1 zeigt im Flußdiagramm ein Zeichenerkennungsverfahren,
das in Übereinstimmung mit einer Ausführungsform mit Merkmalen nach der
vorliegenden Erfindung gestaltet ist. Fig. 2 zeigt andererseits
in Blockform einen optischen Zeichenleser (OCR) oder optisches
Zeichenerkennungssystem zur Ausführung des Zeichenerkennungsverfahrens
nach Fig. 1. Im ersten Schritt wird ein handgeschriebenes
oder gedrucktes Eingabezeichen, das zu erkennen
ist, d. h. ein unbekanntes Zeichen, optisch von einem
Zeichenabtaster 11 gelesen, wobei das unbekannte Zeichen in
ein binäres Zeichenabbild umgewandelt wird, in welchem ein
Zeichenteil durch eines von zwei Binärdaten, d. h. von "1ern"
dargestellt wird, und der übrige Hintergrundbereich durch
das andere der zwei Binärdaten, d. h. von "0en" dargestellt
wird. Es sei hervorgehoben, daß eine Originalvorlage typischerweise
eine Anzahl Zeichen enthält, die von dem Abtaster
11 Zeile für Zeile abgetastet werden. Man erhält daher üblicherweise
eine Serie von binären Zeichenabbildern, die
dann einer Zeichenextraktionseinheit 12 zugeführt werden,
wo die Serien von binären Zeichenabbildern voneinander getrennt
werden.
Ein so von den anderen Abbildern getrenntes Zeichenabbild
wird dann einer Verbreiterungseinheit 13 zugeführt, wo ein
Zeilenverbreiterungsvorgang an dem einzelnen binären Zeichenabbild
ausgeführt wird (Schritt 1 in Fig. 1).
Das Zeilenverbreiterungsverfahren ist in einer Form ein Verfahren,
bei welchem die zwei weißen Pixel zu den linken und
rechten Seiten eines schwarzen Pixels im binären Zeichenabbild
in schwarze Pixel umgewandelt werden, um dadurch die
Zeile zu verbreitern, die das binäre Zeichenabbild bildet.
Fig. 3 zeigt ein binäres Zeichenabbild des lateinischen
Großbuchstabens "B" in Form einer 5 × 7-Punktmatrix, wenn
es optisch mit einer Auflösung von 12 Zeilen pro Millimeter
gelesen wird. Es sei hervorgehoben, daß in Fig. 3 das Symbol
"$" einem schwarzen Pixel entspricht. Wenn das oben beschriebene
Zeilenverbreiterungsverfahren auf dieses binäre
Zeichenabbild angewendet wird, dann erhält man das Zeilen-verbreiterte
binäre Zeichenabbild, das in Fig. 4 dargestellt
ist. Wie man sogleich erkennt, werden die Zwischenräume zwischen
Punkten durch Punkte ausgefüllt, so daß das Zeilen-verbreiterte
binäre Zeichenabbild weniger durch eine Verschiebung
in der Punktposition und durch Streuung im Punkt-zu-
Punkt-Abstand beinträchtigt wird. Die späteren Schritte
der Zeichenunterteilung und der Merkmalsextraktion können
daher bei einem solchen Zeilen-verbreiterten binären Zeichenabbild
stabiler ausgeführt werden. Wenn die Auflösung des
Abtasters 11 höher ist, beispielsweise 16 Zeilen/mm beträgt,
dann kann die Wirkung des oben beschriebenen Zeilenverbreiterungsschemas
wegen des wachsenden Punkt-zu-Punkt-Abstandes
eines binären Zeichenabbildes nicht ausreichend
sein. In diesem Falle kann man das Zeilenverbreiterungsschema
so ausgestalten, daß nicht nur die linken und rechten
weißen Pixel eines schwarzen Pixels, sondern auch die oberen
und unteren weißen Pixel benachbart des schwarzen Pixels
jeweils in schwarze Pixel umgeändert werden. In diesem
Falle werden daher vier benachbarte weiße Pixel, d. h. die
linken und rechten, oberen und unteren Pixel jeweils in
schwarze Pixel geändert, während es beim vorangehend erläuterten
Beispiel nur zwei Pixel waren, die verändert
wurden.
Das Zeilen-verbreiterte binäre Zeichenabbild wird dann
einer Richtungskode-Zuordnungseinheit 14 zugeführt, wo
mehrere vorbestimmte Richtungskodes, die in Fig. 6 dargestellt
sind, selektiv den weißen Pixeln, die der Kontur des
binären Zeichenabbildes benachbart sind, zugeordnet werden (Schritt
2). Wie Fig. 6 zeigt, gibt es neun unterschiedliche Richtungskodes
"0" bis "8", die jeweils einem bestimmten Muster
einer Pixelanordnung zugeordnet sind. Das zugehörige Pixelanordnungsmuster
besteht aus fünf Pixeln, die ein mittleres
Pixel als das interessierende Pixel, ein Paar Pixel zur rechten
und linken Seite des mittleren Pixels und ein Paar obere
und untere Pixel oberhalb und unterhalb des mittleren Pixels
aufweisen. Jedes Pixel wird daher durch ein kleines Quadrat
dargestellt. Ein schraffiertes Quadrat stellt ein schwarzes
Pixel dar, und ein unschraffiertes Quadrat stellt ein weißes
Pixel dar. Es sei auch angemerkt, daß es acht mögliche
Muster für Richtungskodes "0" gibt, während jeder der anderen
Richtungskodes "1" bis "8" eine ganz bestimmte einzigartige
Pixelanordnung aufweist.
Die Zuordnung eines Richtungskodes zu jedem der weißen
Pixel, die der Kontur eines binären Zeichenabbildes benachbart
sind, wird in folgender Weise ausgeführt. Das Zeilen-verbreiterte
binäre Zeichenabbild wird abgetastet, wobei
jedes der weißen Pixel, die die Kontur des Zeilen-verbreiterten
binären Zeichenabbildes begrenzen, zusammen mit den
oberen und unteren, sowie rechten und linken benachbarten
Pixeln mit jedem der Muster verglichen wird, die in Fig. 6
dargestellt sind. Wenn somit ein Pixelmuster, das die gleiche
Anordnung von schwarzen und weißen Pixeln aufweist,
ermittelt worden ist, dann wird der zugehörige Richtungskode
dem fraglichen weißen Pixel zugeordnet. Nach Abschluß
der Zuordnung von Richtungskodes zu den weißen Pixeln benachbart
der Kontor des Zeilen-verbreiterten binären Zeichenabbildes
nach Fig. 5 erhält man ein Zeichen, dessen Kontur
durch die Richtungskodes definiert ist.
In dem oben beschriebenen Beispiel ist ein Satz Richtungskodes
selektiv den weißen Pixeln zugeordnet worden, die der
Kontur des Zeilen-verbreiterten binären Zeichenabbildes benachbart
sind. Andererseits sei noch festgehalten, daß ein
anderer Satz von Richtungskodes, wie er in Fig. 10 dargestellt
ist, ebenfalls verwendet werden könnte, in welchem
Falle die selektive Zuordnung der Richtungskodes nach Fig. 10
an den schwarzen Pixeln ausgeführt wird, die die Kontur des
Zeilen-verbreiterten binären Zeichenabbildes definieren.
Das Zeichenabbild mit den zugeordneten Kodes wird dann
einer Merkmalextraktionseinheit 15 zugeführt, wo das vorgenannte,
die zugeordneten Kodes enthaltende Zeichenabbild
abgetastet wird, um die Richtungskodes zu zählen, und es
werden auf der Grundlage des gezählten Wertes Unterteilungsstellen
bestimmt, wodurch die Höhe und die Breite des Zeichenabbildes
in vier Sektionen unterteilt wird, so daß man
Unterbereiche mit 4 × 4 Maschen erhält (Schritt 3). Das Verfahren
der variablen Unterteilung eines Zeichenabbildes oder
Bereiches in Abhängigkeit von dem gezählten Wert der Richtungskodes
wird im Detail später erläutert. Das die zugeordneten
Kodes enthaltende Zeichenabbild wird dann nochmals
abgetastet und die individuellen Richtungskodes werden für
jeden der unterteilten Bereiche oder Unterbereiche gezählt,
und ein Histogramm in bezug auf die Richtungskodes wird für
jeden der Unterbereiche erzeugt (Schritt 4). Diese Histogramminformation
wird dann einer Identifizierungseinheit 16
als ein Merkmal eines eingegebenen oder unbekannten zu erkennenden
Zeichens zugeführt. Die Identifizierungseinheit
16 ist weiterhin mit einer Bibliothek 17 verbunden, um von
dieser Informationen aufzunehmen. In der Bibliothek 17 sind
ähnliche Histogramme für eine Anzahl bekannter Zeichen gespeichert.
Bei Empfang einer Histogramminformation für ein
unbekanntes eingegebenes Zeichen vergleicht die Identifizierungseinheit
16 daher diese Information mit jedem der in
der Bibliothek gespeicherten Histogrammdaten, um herauszufinden,
welche derselben am besten mit der Histogramminformation
des unbekannten Zeichens übereinstimmen, um dadurch
das unbekannte, eingegebene Zeichen als dasjenige der gespeicherten
Zeichen zu identifizieren oder zu erkennen, das
die am besten übereinstimmenden Histogrammdaten aufweist.
Bei diesem Identifizierungsschritt wird eine Distanz zwischen
den Histogrammdaten des unbekannten Zeichens und der Histogrammdaten
eines der in der Bibliothek 17 gespeicherten
Zeichen berechnet (Schritt 5). Solch eine Distanz kann
eine einfache Euklid'sche Distanz sein. Das heißt durch Anzeige
eines Histogramms eines Richtungskodes k für einen Unterbereich
(i, j) eines eingegebenen Zeichens durch Hkÿ und
eines Histogramms eines Richtungskodes k für einen Unterbereich
(i, j) eines in der Bibliothek 17 gespeicherten bekannten
Zeichens durch Dkÿ läßt sich dann eine Distanz d
zwischen diesen zwei Histogrammen durch folgende Gleichung
berechnen:
Sodann wird das bekannte Zeichen, das in der Bibliothek 17
gespeichert ist und das die kleinste berechnete Distanz
gemäß der obigen Gleichung aufweist, nun ausgewählt und als
ein Ausgang abgegeben (Schritt 6).
Es wird das Zeichenunterteilungsverfahren im Schritt im
Detail unter Bezugnahme auf Fig. 7 erläutert. Es sei hervorgehoben,
daß das Flußdiagramm in Fig. 7 eine Folge von
Schritten zu Bestimmung von Unterteilungsstellen längs der
X-Achse angibt. Die Unterteilungsstellen längs der Y-Achse
können jedoch ebenfalls durch einen vergleichbaren Vorgang
bestimmt werden. Es sei fernerhin hervorgehoben, daß das
Zeichenunterteilungsverfahren, das nachfolgend erläutert
wird, an der Merkmalsextraktionseinheit 15 ausgeführt wird.
Die Funktion der Merkmalsextraktionseinheit 15 wird typischerweise
durch eine Kombination aus Hardware aus beispielsweise
einem Mikroprozessor und einem Speicher und einem
Softwareprogramm ausgeführt. Es besteht kein Zweifel daran,
daß der Fachmann eine solche Kombination zur Ausführung des
vorliegenden Zeichenunterteilungsverfahrens ohne Schwierigkeit
aufbauen kann. Es sei fernerhin angemerkt, daß solche
Elemente, wie beispielsweise ein Zähler und ein Register,
die in der nachfolgenden Beschreibung erwähnt werden, einem
internen Register eines Mikroprozessors oder einem Register
eines Speichers entsprechen können, und daß der Bestimmungsschritt
durch einen Mikroprozessor ausgeführt werden kann.
An erster Stelle wird eine Beschreibung der Unterteilungen
in der X-Richtung gegeben. Das die zugeordneten Kodes aufweisende
Zeichenabbild, das in einem Speicher gespeichert
ist, wird abgetastet und die Gesamtzahl PE der zugeordneten
Richtungskodes, d. h. die Anzahl von Pixeln, die die Kontur
einer Zeichenzeile definieren, wird gezählt (Schritt 21 in
Fig. 7). Sodann wird der Anfangswert von "1" in einen Zähler
n eingegeben, wobei die Anzahl der Unterteilungen in der
X-Richtung (im vorliegenden Beispiel 4) in einen Zähler N
eingegeben wird, wobei der Umfang der Überlappung von Unterbereichen
in ein Register T eingegeben wird und ein Richtungskodezähler
Px und X-Adressenzähler gelöscht werden
(Schritt 22). Nach Abschluß dieses vorbereitenden Schrittes
wird das die zugeordneten Kodes aufweisende Zeichenabbild
in Y-Richtung als der Hauptabtastrichtung und in X-Richtung
als einer Hilfsabtastrichtung senkrecht zur Y-Richtung abgetastet,
während welchen Abtastungen die Richtungskodes gezählt
werden, um die Unterteilungsstellen in X-Richtung
nacheinander zu bestimmen.
Diesbezüglich sei folgendes im einzelnen erläutert. Der X-Adresszähler
zur Bezeichnung einer Abtastzeile wird im Schritt
24 um 1 erhöht und dann, während die durch den Zählwert des
X-Zählers bestimmte Zeile in Y-Richtung abgetastet wird,
wird der Zählwert eines Richtungskodeszählers Px immer dann
erhöht, wenn ein Richtungskode ermittelt worden ist (Schritt
25). Nach Abschluß der Abtastung einer Zeile wird ermittelt,
ob der Zählwert des Richtungskodezählers Px, d. h. ob die
Anzahl der Richtungskodes zwischen der Anfangszeile entsprechend
X = 1 und der laufenden, durch den X-Adresszähler bezeichneten
Zeile gleich oder größer als (PE/N) Xn ist, oder
nicht (Schritt 26). Wenn das Ergebnis negativ ist, dann
geht der Verfahrensablauf zu Schritt 24 zurück, um die
nächste Zeile abzutasten und erneut die Richtungskodes zu
zählen, wenn solche ermittelt werden. Wenn andererseits das
Ergebnis im Schritt 26 positiv ist, dann wird die Zeile,
die durch die laufende Zählung im X-Adreßzähler angegeben
wird, als ein Endpunkt oder als eine Stelle einer n-ten
Unterteilung in X-Richtung bestimmt (d. h. eine rechtsliegende
Stelle einer Unterteilung). Außerdem wird die Zeile,
die durch einen Wert angegeben wird, den man durch Abziehen
des Wertes eines Registers T vom laufenden Zählwert im
X-Adresszähler erhält, als ein Startpunkt oder Startstelle
des nächsten Unterbereiches bestimmt (d. h. linke Stelle
einer Unterteilung). Sodann wird der Zählerstand des Zählers
n um 1 erhöht (Schritt 28), und anschließend geht der Ablauf
zum Schritt 23 zurück, um einen gleichartigen Verfahrensablauf
zu wiederholen.
Auf diese Weise wird die Zeilenposition (X-Adresse), an der
die Zahl Px der Richtungskodes den Wert von PE/4 erreicht
hat, als ein Endpunkt für den ersten Unterbereich definiert,
und eine Zeile, die um T Zeilen von dieser Position liegt, wird
als ein Startpunkt für den zweiten Unterbereich definiert.
Wenn die Anzahl Px der Richtungskodes den Wert PE/2 erreicht
hat, dann wird ihre Zeilenposition als ein Endpunkt des
zweiten Unterbereiches definiert, und die um T Zeilen vor
dieser Zeile liegende Zeile wird als ein Startpunkt für den
dritten Unterbereich definiert. Wenn die Zählung Px der
Richtungskodes den Wert PEX 3/4 erreicht hat, dann wird
darüber hinaus diese Zeilenposition als ein Endpunkt des
dritten Unterbereiches definiert, und die Zeilenposition,
die um T Zeilen vor dieser Zeile liegt, wird als ein Startpunkt
für den vierten Unterbereich definiert. Es sei festgehalten,
daß der Startpunkt des ersten Unterbereiches der
linken Seite eines Zeichenrahmens entspricht, und der Endpunkt
des vierten Unterbereiches der rechten Seite des Zeichenrahmens
entspricht. Bei Bestimmung des Endpunktes des
dritten Unterbereiches und des Startpunktes des vierten
Unterbereiches wird das Bestimmungsergebnis beim Schritt 23
negativ, so daß die Schritte zur Bestimmung der Unterteilungsstellen
in X-Richtung beendet werden.
Sodann wird die Bestimmung der Unterteilungsstellen in
Y-Richtung in gleicher Weise ausgeführt. Da die Gesamtzahl
PE der Richtungskodes jedoch schon bestimmt worden ist,
wird dieser Schritt nicht wiederholt. In diesem Falle wird
der Abtastbetrieb zur Bestimmung der Unterteilungsstellen
mit der X-Richtung als Hauptabtastrichtung und der Y-Richtung
als der Unterabtastrichtung ausgeführt. Der Startpunkt
des ersten Unterbereiches in Y-Richtung entspricht der Oberseite
des Zeichenrahmens, und der Endpunkt des vierten
Unterbereiches in Y-Richtung entspricht der Unterseite des
Zeichenrahmens. Auf diese Weise wird unter Verwendung der
so bestimmten Unterteilungsstellen (d. h. der End- und Startpunkte)
in X- und Y-Richtung das Kode-zugeordnete Zeichen
oder ein durch den Rahmen des Kode-zugeordneten Zeichens
definierter Bereich in ein 4 × 4-Netz von Unterbereichen
unterteilt. Ein solcher Netz von 4 × 4-Unterbereichen ist
in Fig. 5 mit dünnen Linien eingezeichnet. Es sei auch angemerkt,
daß in diesem Falle der Bereichsüberlappungsumfang T
auf Null eingestellt ist.
Wie oben beschrieben, werden die Unterteilungsstellen
Stelle für Stelle in Abhängigkeit
von der Stellenverteilung der Richtungskodes bestimmt,
so daß die Zeichenunterteilung an Stellen ausgeführt werden
kann, die für das Ausmaß von Verformungen eines Buchstabens
geeignet sind, was zur Verbesserung der Erkennungsrate
beiträgt. Ein solches Verfahren, die Unterteilungsstellen
eines Zeichens variabel zu gestalten, kann die Probleme beseitigen,
die den bekannten Verfahren eigen waren, die mit
festen Unterteilungsstellen arbeiteten, wobei dennoch bei
der Erfindung kein komplizierter Rechenvorgang erforderlich
ist. Das oben beschriebene Zeichenunterteilungsverfahren
nach der vorliegenden Erfindung ist im Vergleich zu den
bekannten Verfahren schnell und einfach. Wenn jedoch, wie
oben beschrieben, ein binäres Zeichenabbild eines Punktmatrixzeichens
niedriger Qualität, wie in Fig. 3 gezeigt,
verarbeitet wird, ohne einen Zeilenverbreiterungsschritt
auszuführen, dann könnte sich aufgrund der Punktverschiebung
und Schwankung des Punkt-zu-Punkt-Abstandes ein Problem
ergeben. Es wird daher zunächst
ein Zeilenverbreiterungsschritt an einem binären
Zeichenabbild ausgeführt, bevor die Richtungskodes zugeordnet
werden. Das Verfahren nach der vorliegenden Erfindung
wird daher durch eine geringe Qualität eines binären Zeichenabbildes,
wie beispielsweise durch eine Verschiebung der
Punktposition und durch eine Schwankung des Punkt-zu-Punkt-Abstandes
nicht nachteilig beeinflußt. Als Folge davon kann
man gemäß diesem Aspekt der vorliegenden Erfindung selbst
für Punktmatrixzeichen relativ geringer Qualtiät, wie beispielsweise
bei Zeichen, die von einer 5 × 7-Punktmatrix
angegeben werden, eine ausreichend hohe Erkennungsrate
erzielen.
Es sei weiterhin angemerkt, daß der Zeilenverbreiterungsvorgang
relativ einfach abläuft und in einer sehr kurzen Zeitdauer
ausgeführt werden kann, so daß keine Wahrscheinlichkeit
besteht, daß die Zeichenerkennungszeitdauer merklich verlängert
wird. Es ist ferner festzuhalten, daß der Zeilenverbreiterungsvorgang
auch jede andere Form annehmen kann, als
oben beschrieben.
Es sei nun ein weiterer Aspekt der vorliegenden Erfindung
unter Bezugnahme auf die Fig. 8 bis 20 erläutert. Fig. 8
zeigt ein Flußdiagramm, das die Schrittablauffolge eines
Zeichenerkennungsverfahrens zeigt, das in Übereinstimmung
mit einer Ausführungsform dieses Aspektes der Erfindung aufgebaut
ist, und Fig. 9 zeigt in Blockform den Aufbau eines
optischen Zeichenlesers (OCR) oder eines optischen Zeichenerkennungssystems,
das zur Ausführung des Zeichenerkennungsverfahrens
nach Fig. 8 eingerichtet ist.
Bezugnehmend auf Fig. 9 werden geschriebene oder gedruckte
Zeichen, beispielsweise Buchstaben oder Symbole, als
Original optisch von einem Abtaster 31 gelesen, und die
optisch gelesene Zeicheninformation wird dann in eine binäre
Zeicheninformation von einer Vorverarbeitungseinheit 32
umgewandelt, die auch die binäre Zeicheninformation in
einzelne Zeichendaten trennt, die Daten normiert und dann
glättet. Es ergibt sich daher ein einzelnes binäres Zeichenabbild,
das normiert und geglättet worden ist, und dieses
wird einer Merkmalsextraktionseinheit 31 zugeführt, wo
mehrere vorbestimmte Richtungskodes der Kontur eines solchen
binären Zeichenabbildes selektiv zugeordnet werden. Wie
zuvor beschrieben, gibt es zwei Sätze solcher Richtungskodes,
ein Satz für die Anwendung auf weiße Pixel, wie in
Fig. 6 gezeigt, und der andere Satz zur Anwendung auf
schwarze Pixel, wie in Fig. 10 gezeigt. Es sei weiterhin angemerkt,
daß in dem Falle, in welchem ein Satz Richtungskodes
zur Anwendung auf schwarze Pixel verwendet wird,
solche Richtungskodes jeweils einem von zwei Pixeln in
Zeilenbreitenrichtung zugeordnet werden, wenn eine Zeichenzeile
eine Zeilenbreite von 2 oder mehr aufweist. Wenn
andererseits die Zeilenbreite gleich 1 ist, dann ist nur
ein Pixel zur Definition einer Zeichenzeile vorhanden,
so daß nur ein Richtungskode zugeordnet wird, so daß die
Anzahl zugeordneter Richtungskodes die Hälfte derjenigen
ist, die sich ergeben würde, wenn die Zeilenbreite gleich 2
oder mehr wäre. Was dies angibt, ist die Tatsache, daß die
Merkmalsdaten instabil würden, wenn ein Satz von Richtungskodes
für schwarze Pixel auf eine schmale Zeile angewendet
würde, deren Zeilenbreite gleich 1 ist. Ein solches Problem
erwächst andererseits nicht, wenn von einem Satz Richtungskodes
für weiße Pixel im Falle einer solchen schmalen Zeile
Gebrauch gemacht wird. Wenn andererseits ein Zeilen-zu-Zeilen-Abstand
relativ klein ist, dann kann ein solcher Abstand
durch Anwendung eines Richtungskodes für weiße Pixel
verschwinden. In diesem Falle erwächst jedoch ein solches
Problem nicht, wenn man von einem Satz Richtungskodes für
schwarze Pixel Gebrauch macht. Dementsprechend sollte der
passende Satz aus den Richtungskodes in Abhängigkeit von Anwendungsfall
ausgewählt werden.
Fig. 11 zeigt ein binäres Zeichenabbild eines japanischen
Katakana-Zeichens "a", das wie der englische Vokal "a" ausgesprochen
wird. Dieses Zeichen wird von der Vorverarbeitungseinheit
32 der Merkmalsextraktionseinheit 33 zugeführt.
Wenn ein Satz Richtungskodes für schwarze Pixel den schwarzen
Pixeln zugeordnet wird, die die Kontur des binären Zeichenabbildes
in Fig. 11 definieren, dann erhält man ein Kodezugeordnetes
Zeichenabbild, das in Fig. 12 dargestellt ist.
Wenn andererseits ein Satz Richtungskodes für weiße Pixel
den weißen Pixeln zugeordnet wird, die die Kontur des binären
Zeichenabbildes nach Fig. 11 definieren, dann erhält
man ein Kode-zugeordnetes Zeichenabbild, das in Fig. 13
dargestellt ist.
Wie später erläutert, wird gleichzeitig mit der Zuordnung
der Richtungskodes die Gesamtzahl der Pixel, denen Richtungskodes
zugeordnet worden sind, und ein auf eine X-Achse
und/oder eine Y-Achse projiziertes Histogramm erhalten und
gespeichert. Es ist wahr, daß das Zählen einer solchen Gesamtzahl
Pixel und das Bilden einer solchen Histogrammtafel
oder -tafeln unabhängig auch im Anschluß an die Richtungskodezuordnung
ausgeführt werden kann. Die gleichzeitige
Ausführung ist jedoch vorzuziehen, weil man einige Vorteile
dadurch erhält, wie beispielsweise einer Verminderung der
Verarbeitungszeit beispielsweise aufgrund einer Verminderung
der Anzahl von Abtastoperationen eines Zeichenbildes.
Anschließend wird in der Merkmalsextrahierungseinheit 33
das Kode-zugeordnete Zeichenbild in eine Mehrzahl von
N × N Netzunterbereiche in X- und Y-Richtung unterteilt. Wie
später im Detail erläutert wird, werden die Unterteilungsstellen
längs der X- und Y-Achsen derart bestimmt, daß
jeder dieser M × M Netzunterbereiche im wesentlichen die
gleiche Anzahl von Pixeln aufweist, denen Richtungskodes
zugeordnet worden sind. Mit einem solchen Aufbau können
Unterteilungen eines Zeichenabbildes in weitgehender Anpassung
an das Ausmaß von Deformationen oder Abweichungen
eines Zeichenabbildes von der Standardgestalt ausgeführt
werden. Eine solche variable Zeichenunterteilung ist gegenüber
den bekannten Unterteilungsverfahren, die feste Unterteilungsstellen
verwenden, weit vorteilhafter.
Als nächstes wird in der Merkmalsextrahierungseinheit 33
für jeden (i, j) der in Form eines Netzes unterteilten Unterbereiche
ein Histogramm Hkÿ als Funktion der Richtungskodes
erzeugt. Hier gibt der Suffix k einen der Richtungskodes 1
bis 8 an.
In der Identifikationseinheit 34 wird unter Verwendung des
Histogramms als Funktion der Richtungskodes, die aus der
Merkmalsextrahierungseinheit 33 aus dem unbekannten eingegebenen
Zeichen extrahiert worden ist, und unter Verwendung
der vergleichbaren Histogramme, die in der Bibliothek für
bekannte, registrierte Zeichen gespeichert sind, eine
Distanz zwischen dem unbekannten eingegebenen Zeichen und
jedem der registrierten Zeichen berechnet. Sodann wird das
registrierte Zeichen, das die kürzeste berechnete Distanz
aufweist, ausgewählt und als ein Zeichen entsprechend dem
unbekannten eingegebenen Zeichen ausgegeben. Zu diesem
Zweck kann von einer einfachen Euklid'schen Distanz Gebrauch
gemacht werden, in welchem Falle eine Distanz dl eines
Zeichens l zwischen einem Histogramm Dkÿl des eingegebenen
Zeichens und einem Histogramm Hkÿ des eingegebenen Zeichens
durch die folgende Gleichung ausgedrückt werden kann:
Es werden nun spezifische Beispiele dieses Aspektes der vorliegenden
Erfindung erläutert.
Ein binäres Eingabezeichenabbild wird einem Vorverarbeitungs
schritt unterworfen und dann einem Richtungskodezuordnungs
schritt in Übereinstimmung mit
einem vorbestimmten Algorithmus. Gleichzeitig wird die
Gesamtzahl PE der Pixel, denen
Richtungskodes zugeordnet worden sind, gezählt, und ein auf
die X-Achse projiziertes Histogramm HXi und ein auf die
Y-Achse projiziertes Histogramm HYj der Kode-zugeordneten
Pixel werden erhalten. Ein spezielles Beispiel eines solchen
Histogrammpaares ist in Fig. 14 dargestellt. In dieser Figur
ist ein Kode-zugeordnetes Zeichenabbild 40, das aus einem
Buchstaben "c" gebildet ist, dargestellt, und eine Serie
von Zahlen, die an der Oberseite angeordnet sind, zeigen
das unterste Bit der X-Adresse, eine Serie von Zahlen an
der linken Seite zeigen die Y-Adresse, und der Rest der
Zahlen geben die Richtungskodes an, die der Kontur des
eingegebenen Zeichens "c" zugeordnet worden sind. Es sei
angemerkt, daß in diesem Beispiel und auch in den letztgenannten
Beispielen die horizontale Richtung als die X-Achse
angenommen wird und die vertikale Richtung als die Y-Achse
angenommen wird. Diese Relation kann jedoch, sofern gewünscht,
umgekehrt werden.
In Fig. 14 sind ein Histogramm HXi der Anzahl der Richtungskodes
des Kode-zugeordneten Zeichenabbildes 40, das auf die
X-Achse projiziert ist, und ein Histogramm HYj der Anzahl
der Richtungskodes des Abbildes 40 auf der Y-Achse in Form
von Tabellen 41 bzw. 42 gespeichert. Anschließend wird das
Zeichenabbild 40 in N Sektionen in X-Richtung und in M-Sektionen
in Y-Richtungen unterteilt, wodurch sich eine Anzahl
von unterteilten Unterbereichen in einer M × N-Netzform
ergibt.
Fig. 15 zeigt ein Flußdiagramm eines Verfahrens zur Bestimmung
der Unterteilungsstellen in X-Richtung, und dieses Verfahren
wird nachfolgend im Detail erläutert. Nach der Initialisierung
von Zählern n und i und des Registers P (Schritt
50 von Fig. 15), wird der Zähler i erhöht (Schritt 54), und
dann wird der Wert entsprechend dieses Zählwertes des Zählers i aus dem
Histogramm HXi ausgelesen und dem Wert des Registers P hinzuaddiert,
wodurch der Wert des Registers P rückgestellt
wird (Schritt 56). Anschließend wird geprüft, ob der Wert P
des Registers P den Wert von (PE/N) Xn überschritten hat
(Schritt 58). Wenn das Ergebnis negativ ist, dann geht der
Ablauf zurück zum Schritt 54, um einen gleichen Ablauf zu
wiederholen. Im wesentlichen wird in Übereinstimmung mit
diesen Schritten bei der Erhöhung der X-Adresse um 1 das
Zeichen rastermäßig abgetastet, um die Anzahl p von Pixeln
zu zählen, denen Richtungskodes zugeordnet worden sind, und
um die Zählung mit einem vorbestimmten Wert von (PE/N) Xn
zu vergleichen. Die Wiederholung einer solchen Rasterabtastung
und weiterhin einer Rasterabtastung zur Bestimmung
der Gesamtanzahl PE ist jedoch redundant und daher nicht
sehr effizient. Unter diesen Umständen wird in Übereinstimmung
mit diesem Beispiel bei der Zuordnung der Richtungskodes
zu der Kontur eines Zeichenabbildes, was eine rasterhafte
Abtastung verlangt, die Gesamtzahl PE gleichzeitig
mit dem projizierten Histogrammen HXi und HYj erhalten, und
diese Daten werden dazu verwendet, eine unnötige Wiederholung
einer Rasterabtastung zu vermeiden.
Wenn nun die Bedingung, daß P gleich oder größer als (PE/N)
Xn erreicht worden ist, dann wird der laufende Zählwert des
Zählers e als eine X-Adresse eines Endpunktes des n-ten
Unterbereiches in X-Richtung gespeichert, und eine weitere
X-Adresse, die man durch Abziehen eines vorbestimmten Bereichsüberlappungsbetrages
T von dieser X-Adresse erhält,
wird als eine X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 60). Es
sei hervorgehoben, daß der Startpunkt des ersten Unterbereiches
in X-Richtung mit der linken Seite (X = 0) des Zeichenabbildes
oder Rahmens zusammenfällt und der Endpunkt
des letzten und N-ten Unterbereiches in X-Richtung mit der
rechten Seite des Zeichenabbildes oder Rahmens zusammenfällt.
Im Anschluß an den Schritt 60 wird der Zähler n erhöht
(Schritt 62), und der Ablauf geht auf Schritte über, die
die nächste Unterteilungsstelle bestimmen. Dieses Verfahren
wird beendet, wenn die Bedingung n = N im Schritt 52 erreicht
worden ist.
Die Unterteilungsstellen in Y-Richtung können in gleicher
Weise erhalten werden. Das heißt, in diesem Falle wird an Stelle
eines Zählers i ein Zähler j entsprechend der Y-Adresse verwendet,
und es wird auf ein projiziertes Histogramm HYj entsprechend
der Y-Achse Bezug genommen. Außerdem sei angemerkt,
daß der Startpunkt für den ersten Unterbereich in Y-Richtung
der Oberseite des Zeichenabbildes oder Rahmens und der Endpunkt
für den M-ten Unterbereich in Y-Richtung der Unterseite
des Zeichenabbildes oder Rahmens entspricht. Auf
diese Weise sind die Unterteilungsstellen in X- und Y-Richtung
ermittelt worden, so daß das Zeichenabbild in N×M-
Unterbereiche in X- und Y-Richtung unterteilt ist.
Fig. 16 zeigt ein Beispiel einer netzartigen Unterteilung
eines handgeschriebenen japanischen Katakana-Zeichens "nu",
wobei der Bereichsüberlappungsbetrag auf 1 eingestellt ist.
Japanische Katakana-Zeichen "nu" und "su" sind ähnlich in
der Gestalt wie die lateinischen Buchstaben "E" und "F",
der einzige Unterschied zwischen "nu" und "su" liegt in der
Tatsache, daß "nu" einen zusätzlichen Strich aufweist, der
von links oben nach rechts unten verläuft, wie in Fig. 16
dargestellt. Um die Unterscheidung zwischen "nu" und "su"
zu treffen, ist es wichtig, daß dieses Merkmal, d. h. die Anwesenheit
eines zusätzlichen Striches, der von links oben
nach rechts unten verläuft, durch Unterbereiche in geeigneter
Weise widergespiegelt wird, die in Form von Netzmaschen
abgeteilt sind. Das vorliegende Beispiel erfüllt
dieses Erfordernis und ist daher in der Lage, "nu" von "su"
und anderen ähnlichen Zeichen klar zu unterscheiden.
Bei diesem Beispiel wird gleichzeitig mit der Richtungskodezuordnung
die Gesamtzahl PE von Pixeln, denen Richtungskodes
zugeordnet worden sind, und ein Histogramm HYj von
Pixeln, denen Richtungskodes zugeordnet worden sind, das
auf die Y-Achse projiziert ist, erhalten. Sodann wird in
einer Weise ähnlich dem oben beschriebenen Beispiel 1 das
Zeichenabbild in M Sektionen in Y-Richtung unterteilt. Sodann
wird während der Rasterabtastung eines jeden der in
Y-abgestellten Bereiche dieser Bereich auch in N Sektionen
in X-Richtung unterteilt. Fig. 17 ist ein Flußdiagramm, das
den Ablauf zur weiteren Unterteilung einer der in Y-Richtung
abgeteilten M Sektionen in N Sektionen in X-Richtung zeigt.
Diesbezüglich sei zur weiteren Erläuterung auf Fig. 17
Bezug genommen. Nach Initialisierung der Zähler n und i und
des Registers P (Schritt 70) wird der Zähler i erhöht (Schritt
74), und das Zeichenabbild wird in Y-Richtung auf die X-Adresse
entsprechend dem inkrementierten i-Raster abgetastet, wodurch
die Anzahl von Pixeln, denen Richtungskodes zugeordnet
worden sind, in dieser Zeile gezählt wird, und ihr Wert Pi
wird dem Register P hinzuaddiert (Schritt 78). Sodann wird
geprüft, ob der Wert P des Registers P einen vorbestimmten
Wert von (PE/NXM) Xn überschritten hat (Schritt 80). Wenn
das Ergebnis negativ ist, dann geht der Ablauf zum Schritt
74 zurück und wiederholt sich auf gleiche Weise. Wenn andererseits
P als gleich oder größer als (PE/NXM) Xn ermittelt
worden ist, dann wird der laufende Zählwert des Zählers i
als eine X-Adresse eines Endpunktes für den n-ten Unterbereich
in X-Richtung gespeichert, und eine weitere Adresse
erhält man, indem man eine vorbestimmte Bereichsüberlappungsbreite
T von jener X-Adresse abzieht. Diese weitere
X-Adresse wird als X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 82). Es
sei angemerkt, daß der Startpunkt des ersten Unterbereiches
in X-Richtung der linken Seite (X = 0) des Zeichenabbildes
oder Rahmens entspricht und der Endpunkt des letzten und
daher N-ten Unterbereiches in X-Richtung der rechten Seite
des Zeichenabbildes oder Rahmens entspricht. Nach dem Schritt
82 wird der Zähler n erhöht (Schritt 84), und es werden als
nächstes Schritte zur Bestimmung der nächsten Unterteilungsstelle
ausgeführt. Dieser Vorgang wird beendet, sobald die
Bedingung n = N im Schritt 72 erreicht worden ist.
Auf diese Weise erhält man die Unterteilungsstellen in X-
und Y-Richtung, und das Zeichenabbild oder der Rahmen wird
in mehrere Unterbereiche in Form eines M × N-Maschennetzes
in den X- und Y-Richtungen unterteilt. Ein Beispiel solcher
Unterteilungen eines japanischen Katakana-Zeichens "nu" ist
in Fig. 18 dargestellt. Es ist anzumerken, daß in Fig. 18
nur Unterteilungen in X-Richtung für die abgeteilten Zwischenbereiche
in Y-Richtung angegeben sind. Es sei auch angemerkt,
daß die Bedingung T = 0 in Fig. 18 angenommen
wird.
In dem oben beschriebenen Beispiel 2 werden die Unterteilungen
in Y-Richtung durch das im Beispiel 1 beschriebene
Schema ausgeführt. Sie kann jedoch auch derart ausgeführt
werden, daß nach der Ausführung der Unterteilungen in X-Richtung
Unterteilungen in X-Richtung für jede der Unterteilungen
in Y-Richtung ausgeführt werden können.
Wenn die Pixels, denen die Richtungskodes zugeordnet worden
sind, in einem Bereichsüberlappungsabschnitt konzentriert
sind, dann wird eine vergrößerte Streuung in der Pixelanzahl
innerhalb Unterbereichen in jeder der X- und Y-Richtungen
erzeugt. Wenn in diesem Falle die Unterteilungsstellen
unter Verwendung von PE/(NXM) als Bezug wie beim oben beschriebenen
Beispiel 2 bestimmt werden, dann würde eine
Situation eintreten, in denen die Unterteilungen ungeeignet
sind. Dieses Beispiel 3 ist daher darauf gerichtet, einen
solchen Nachteil zu vermeiden.
In Übereinstimmung mit diesem Beispiel 3 werden gleichzeitig
mit der Zuordnung der Richtungskodes die Gesamtzahl PE der
Pixels, denen Richtungskodes zugeordnet worden sind, gezählt
und ein Histogramm HYj der mit Kodes versehenen Pixel,
projiziert auf die Y-Adresse, erhalten, und anschließend
wird das Zeichenabbild in M-Sektionen in Y-Richtung in einer
Weise ähnlich der im obigen Beispiel 1 beschriebenen unterteilt.
Während dieser Unterteilungen in Y-Richtung wird
Bezug genommen auf das Histogramm HYj, und die Anzahl Pm
der mit Kodes versehen Pixel in jeder der Unterteilungen
wird erhalten. Während der Rasterabtastung einer jeden der
Unterteilungen in Y-Richtung wird jede der Unterteilungen
weiter in N Unterteilungen in X-Richtung geteilt. Fig. 19
zeigt ein Flußdiagramm, das ein Verfahren zum Teilen einer
der Unterteilungen, geteilt in Y-Richtung, in N Unterteilungen
in X-Richtung darstellt.
Wie man aus Fig. 19 erkennt, wird nach Initialisierung der
Zähler n und i und des Registers P (Schritt 90) der Zähler
i erhöht (Schritt 94), und das Zeichenabbild wird in Y-Richtung
für die X-Adresse rastermäßig abgetastet, die jenem
Zählwert i entspricht, wodurch die Anzahl der mit Kodes versehenen
Pixel in jener Zeile gezählt wird, und ihr Zählwert
Pi wird dem Register P hinzuaddiert (Schritt 98). Dann wird
der Wert P des Registers P geprüft, um zu ermitteln, ob er einen
vorbestimmten Wert (PmN) Xn überschritten hat, oder nicht
(Schritt 100). Wenn das Ergebnis negativ ist, dann geht der
Ablauf zum Schritt 94 zurück, um die genannten Schritte in
gleicher Weise zu wiederholen. Wenn andererseits die Bedingung
erfüllt ist, daß P gleich oder größer als (Pm/N) Xn
ist, dann wird der laufende Zählwert des Zählers i als eine
X-Adresse eines Endpunktes für den n-ten Unterbereich in
X-Richtung gespeichert, und darüber hinaus wird eine weitere
X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite
T von jener X-Adresse erhält, als eine X-Adresse
eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung
gespeichert (Schritt 102). Es sei angemerkt, daß der
Startpunkt des ersten Unterbereiches in X-Richtung der
linken Seite (X = 0) des Zeichenabbildes entspricht, und
daß der Endpunkt des letzten und daher N-ten Unterbereiches
in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Im Anschluß an den Schritt 102 wird der Zähler n
erhöht (Schritt 104) und der Ablauf geht auf Schritte über,
mit denen der nächste Unterteilungspunkt bestimmt wird.
Dieses Verfahren wird beim Erreichen der Bedingung n = N
beendet.
Unter Verwendung der so erhaltenen Unterteilungspunkte in
X-Richtung werden auch die in Y-Richtung unterteilten
Sektionen in N Sektionen in X-Richtung unterteilt, so daß
das Zeichenabbild in ein Netz von N×M Unterbereiche unterteilt
wird. Fig. 20 zeigt ein Beispiel, das man durch Unterteilung
des Kode-zugeordneten Zeichenabbildes eines handgeschriebenen
japanischen Katakanazeichens "nu" in ein Netz
aus Unterbereichen mit T = 1 erhalten hat. Es sei angemerkt,
daß die Unterteilungen in X-Richtungen nur für die mittleren
unterteilten Sektionen in Y-Richtung angegeben sind.
Die gleichen Verfahrensschritte wie jene, die beim Beispiel
1 verwendet worden sind, werden hier angewandt mit der Ausnahme,
daß ein Satz von Richtungskodes für schwarze Pixel
für jene schwarzen Pixel verwendet wird, die die Kontur
eines binären Zeichenabbildes definieren.
Die gleichen Verfahrensschritte wie jene, die im Beispiel 2
verwendet worden sind, werden hier angewendet mit der Ausnahme,
daß ein Satz von Richtungskodes für schwarze Pixel
für jene schwarzen Pixel angewendet wird, die die Kontur
eines binären Zeichenabbildes angeben.
Dieselben Verfahrensschritte wie jene, die im Beispiel 3
verwendet wurden, werden hier angewandt mit der Ausnahme,
daß ein Satz Richtungskodes für schwarze Pixel für jene
schwarze Pixel Anwendung findet, die die Kontur eines binären
Zeichenabbildes definieren.
Es ist anzumerken, daß jeder der oben beschriebenen Verfahrensschritte
mit diesem Aspekt der vorliegenden Erfindung sehr
einfach entweder durch Software oder durch Hardware oder
durch eine Kombination beider ausgeführt werden können, und
dies sollte für einen Fachmann auszuführen sein.
Es wird nun ein weiterer Aspekt der vorliegenden Erfindung
unter spezielle Bezugnahme auf die Fig. 21 bis 30 beschrieben.
Dieser Aspekt der vorliegenden Erfindung ist
speziell auf ein Zeichenunterteilungsschema gerichtet, das
zur Verwendung bei der Merkmalsextrahierung in einem Zeichenerkennungsverfahren
und -system insbesondere nach der Erfindung
geeignet ist. Wie bereits ausgeführt, ist es wichtig,
daß ein Zeichenabbild in Abhängigkeit vom Zustand desselben
optimal unterteilt wird, damit ein gewünschtes Merkmal ohne
Fehler extrahiert wird. Fig. 30a zeigt ein Zeichenabbild
aus Kodezuordnungen, das man erhalten hat, indem ein Satz
Richtungskodes nach Fig. 22 der Kontur eines binären Zeichenabbildes
für ein japanisches Katakana-Zeichen "wu" zugeordnet
hat. Fig. 30b ist hingegen ein ähnliches Zeichenabbild
aus Kodezuordnungen für dasselbe japanische Katakana-Zeichen
"wu" bei geringer Änderung der Gestalt. Es sei zunächst der
Fall betrachtet, in welchem beide Zeichenabbilder nach den
Fig. 30a und 30b in ein 3×3-Netz unter Verwendung
fester Unterteilungsstellen unterteilt werden und ein Histogramm
als Funktion von Richtungskodes für jede der Unterteilungen
gebildet wird, um einen Merkmalsvektor zu erzeugen.
Unter den japanischen Katakana-Zeichen gibt es die Zeichen
"wu" und "nu", die in der Gestalt ähnlich sind, wobei "wu"
von "nu" sich nur dadurch unterscheidet, daß ein sich vertikal
erstreckender oberer mittlerer Strich vorhanden ist. Um
"wu" von "nu" richtig zu unterscheiden, ist es daher wichtig,
daß die Information, die sich auf diesen oben mittleren
Strich bezieht, durch Zeichenunterteilungen in geeigneter
Weise extrahiert und in einem Merkmalsvektor in geeigneter
Weise widergespiegelt wird. Betrachtet man den oberen
linken Unterbereich in jedem der Zeichenabbilder nach den
Fig. 30a und 30b genauer, dann sieht man, daß die Information,
die sich auf den oberen mittleren Strich bezieht,
in dem Zeichenabbild in Fig. 30a verlorengegangen ist,
während diese Information in dem Zeichenabbild nach Fig.
30b vorhanden ist. Wenn die Unterteilungspunkte an festen
Stellen angeordnet sind, dann kann auf diese Weise die Situation
eintreten; in der eine Merkmalsextraktion, die das
wesentliche Merkmal eines Zeichens verläßlich widerspiegelt,
nicht ausgeführt werden kann. Dieser dritte Aspekt der Erfindung
ist speziell auf die Beseitigung dieses Problems gerichtet
und auf die Angabe eines Verfahrens zur optimalen
Bestimmung von Unterteilungspunkten eines Zeichenabbildes,
die es ermöglichen, die Merkmalsextraktion stabil jederzeit
auszuführen.
Die Fig. 21a und 21b zeigen zusammen ein Flußdiagramm
der Schrittablauffolge eines Unterteilungsverfahrens für
einen Zeichenbereich (Rahmen) gemäß einer Ausführungsform
dieses Aspektes der vorliegenden Erfindung. Wie zuvor angegeben,
sei festgehalten, daß dieses Zeichenunterteilungsverfahren
speziell vortteilhaft ist, wenn es auf ein Zeichenerkennungsverfahren
angewendet wird.
Wie die Fig. 21a und 21b zeigen, wird im Schritt 110 ein
Zeichenabbild, das typischerweise durch Abtastung eines gedruckten
oder handgeschriebenen Zeichens erhalten wird,
verarbeitet, um ihm ein vorbestimmtes Merkmal zuzuordnen.
Durch diesen Merkmalszuordnungsschritt werden mehrere Richtungskodes,
wie in Fig. 22 gezeigt, selektiv den weißen
Pixeln zugeordnet, die die Kontur des Zeichenabbildes begrenzen.
Wie zuvor erläutert, kann ein anderer Satz Richtungskodes
dazu verwendet werden, selektiv den schwarzen
Pixeln zugeordnet zu werden, die die Kontur des Zeichenabbildes
definieren. Ein solcher Merkmalszuordnungsschritt
wird typischerweise durch Prüfung eines Pixelmusters ausgeführt,
das durch ein interessierendes Pixel, zwei zur rechten
und linken Seite gelegene Pixel und zwei oberhalb und
unterhalb des interessierenden Pixels gelegene Pixel definiert
wird, während die Rasterabtastung des Zeichenabbildes
stattfindet. Simultan dazu werden die Gesamtzahl PE der
Kode-zugeordneten Pixel (Merkmalspixel) und auf die X- und
Y-Achsen projizierten Histogramme HXi und HYj erhalten und
in Tabellen gespeichert. Ein Beispiel solcher Tabellen ist
in Fig. 23 dargestellt.
In Fig. 23 ist ein Zeichenabbild 140 gezeigt, den bereits
mehrere vorbestimmte Richtungskodes selektiv zugeordnet
worden sind. Eine Serie von Zahlen am Kopf von Fig. 23 gibt
das niedrigste Bit einer X-Adresse an, und eine Serie von
Zahlen am linken Rand von Fig. 23 gibt die Y-Adresse an.
Ein Histogramm HXi der Merkmalspixel des Zeichenabbildes
140 auf der X-Achse und ein vergleichbares
Histogramm HYj auf der Y-Achse sind in Tabellen
142 bzw. 144 gespeichert. Das Zählen der Gesamtzahl solcher
Merkmalspixel und die Bildung solcher Histogrammtabellen
kann nach Abschluß des Merkmalszuordnungsschrittes ausgeführt
werden. Vorzugsweise wird dies jedoch gleichzeitig
mit dem Merkmalszuordnungsschritt ausgeführt, weil dadurch
eine Verringerung der Anzahl der Abtastungen des Zeichenabbildes
möglich wird, was die Verarbeitungszeitdauer verkürzt.
Anschließend wird das Zeichenabbild in N Sektionen in X-Richtung
unterteilt (Schritt 112 bis 124) und in M Sektionen
in Y-Richtung unterteilt (Schritte 126 bis 128), wodurch
das Zeichenabbild in ein Netz N × M Unterbereiche unterteilt
wird, von denen jeder soweit wie möglich gleichmäßig Merkmalspixel
enthält. Hierdurch kann die Unterteilung eines
Zeichenabbildes optimal in Abhängigkeit vom Grad der Verformung
des Zeichenabbildes gegenüber der Standardform
ausgeführt werden.
Dieses Zeichenunterteilungsverfahren wird nachfolgend im
Detail näher erläutert. Nach Initialisierung der Zähler n
und i und des Registers P (Schritt 112) wird der Zähler i
erhöht (Schritt 116), und der Wert des Histogramms HXi entsprechend
diesem Wert i wird aus der Tabelle ausgelesen und
dem laufenden Wert des Registers P hinzuaddiert, wodurch
der Wert des Registers P rückgesetzt wird (Schritt 118). Anschließend
wird geprüft, ob der Wert des Registers P einen
vorbestimmten Wert von (PE/N) Xm überschritten hat, oder
nicht (Schritt 120). Wenn das Ergebnis negativ ist, dann
geht der Ablauf zurück zum Schritt 114, um die genannten
Schritte zu wiederholen. Tatsächlich wird bei dieser Routine
während der Erhöhung der X-Adresse um 1 das Zeichenabbild
rastermäßig abgetastet, um die Anzahl von P von Merkmalspixeln
zu zählen, und dieses Zählergebnis wird mit (PE/N) Xn
verglichen. Die Wiederholung einer solchen rastermäßigen Abtastung
und darüber hinaus der rastermäßigen Abtastung zur
Zählung der Gesamtzahl PE ist jedoch nicht effizient. Unter
diesen Umständen werden während des Merkmalszuordnungsschrittes,
der die rastermäßige Abtastung notwendig macht, Histogramme
HXi und HXj und die Gesamtzahl PE gleichzeitig erhalten,
und diese Daten in geeigneter Weise in der Routine verwendet,
um dadurch die Notwendigkeit einer wiederholten Rasterabtastung
zu vermeiden und dadurch die Effizienz des Verfahrens
zu steigern.
Wenn die Bedingung, daß P gleich oder größer als (PE/N) Xn
erhalten worden ist, dann wird der laufende Zählwert des
Zählers e als eine X-Adresse eines Endpunktes des n-ten
Unterbereiches in X-Richtung gespeichert, und eine weitere
X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite
T von jener X-Adresse erhält, wird als eine X-Adresse
eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung
gespeichert (Schritt 122). Es sei festgehalten, daß
der Startpunkt des ersten Unterbereiches in X-Richtung der
linken Seite X=0) des Zeichenabbildes entspricht, und
daß der Endpunkt des letzten und daher N-ten Unterbereiches
in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Anschließend an den Schritt 122 wird der Zähler n erhöht
(Schritt 124), und die Verarbeitung zur Ermittlung des
nächsten Unterteilungspunktes wird ausgeführt. Diese Verarbeitung
wird beendet, sobald die Bedingung n = N im Schritt
112 erreicht worden ist. Die Verfahrensschritte 126 bis 138
für die Unterteilungen in Y-Richtung sind ähnlich den
Schritten 112 bis 124, die oben beschrieben wurden. An
Stelle eines Zählers i, der der X-Adresse zugeordnet ist,
wird jedoch von einem Zähler j Gebrauch gemacht, der der
Y-Adresse zugeordnet ist (Schritte 126, 130, 136). Außerdem
wird an Stelle eines Histogramms HXi auf ein Histogramm HYj
Bezug genommen (Schritt 132), und die Anzahl von Unterteilungen
im Schritt 134 wird auf M eingestellt. Wenn das Ergebnis
der Ermittlung beim Schritt 134 positiv ist, dann
geht der Verfahrensablauf zum Schritt 136 über, wo der laufende
Zählwert j des Zählers j als Y-Adresse eines Endpunktes
des n-ten Unterbereiches in Y-Richtung eingestellt
wird, und ein Wert, der durch Subtraktion einer Bereichsüberlappungsbreite
T von jener Y-Adresse erhalten wird,
wird als Y-Adresse eines Startpunktes des (n+1)-ten Unterbereiches
in Y-Richtung bestimmt. Es sei angemerkt, daß der
Startpunkt des ersten Unterbereiches in Y-Richtung mit der
Oberseite des Zeichenabbildes übereinstimmt und der Endpunkt
des M-ten Unterbereiches in Y-Richtung der Unterseite
des Zeichenbildes entspricht. Da die Unterteilungspunkte
in X- und Y-Richtung auf diese Weise bestimmt worden sind,
wird das Zeichenabbild dann in ein Netz von N × M Unterbereiche
in X- und Y-Richtung auf der Grundlage dieser Unterteilungspunkte
unterteilt.
In Übereinstimmung mit der vorliegenden Ausführungsform
werden die Zeichenabbilder, die in Fig. 30a und 30b
dargestellt sind, so unterteilt, wie in den Fig. 24a
bzw. 24b dargestellt ist. Es ist angemerkt, daß die Bedingungen
M 3 und T = 0 angenommen worden sind. Eine schnelle
Prüfung des oberen linken Unterbereiches in Fig. 24a zeigt
die Anwesenheit einer Information über den oberen mittleren
Strich des Zeichens "wu" an, was jedoch nicht der Fall ist,
wenn die Verarbeitung unter Verwendung des bekannten Schemas
mit festen Unterteilungspunkten erfolgt. Das gleiche gilt
für den Fall, der in Fig. 24b dargestellt ist.
Unter Bezugnahme auf die Fig. 25a und 25b wird nun eine
weitere Ausführungsform mit Merkmalen nach der vorliegenden Erfindung
beschrieben. Schritt 150 dieser Ausführungsform entspricht
dem Schritt 110 der vorangehend beschriebenen Ausführungsform.
Im Schritt 150 erhält man jedoch, soweit
Histogramme betroffen sind, nur HYj und nicht HXi. Der Verfahrensablauf
geht dann zum Schritt 152 über, wo das Zeichenabbild
in M Sektionen in Y-Richtung unterteilt wird, und
dieser Schritt entspricht einer Folge von Schritten 126 bis
138 der vorangehend erläuterten Ausführungsform. Die Schritte
154 bis 168 werden zur Unterteilung des Zeichenabbildes in
N Sektionen in X-Richtung ausgeführt. Jeder dieser Schritte
wird nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i des Registers P
(Schritt 154) wird der Zähler i erhöht (Schritt 156), und
das Zeichenabbild wird in Y-Richtung für die X-Adresse entsprechend
dem Zählwert i rastermäßig abgetastet, wodurch
die Anzahl der Pixel in jeder Zeile gezählt wird (Schritt
160), denen Kodes zugeordnet sind, und dieser Wert Pi wird
im Register P gespeichert (Schritt 162). Sodann wird geprüft,
ob der Wert P des Registers P einen vorbestimmten
Wert von (PE/(NXM) Xn) überschritten hat (Schritt 164).
Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf
zurück zum Schritt 158, um die genannten Schritte zu wiederholen.
Wenn andererseits die Bedingung, daß P gleich
oder größer als (PE/(NMX) Xn) erhalten worden ist, dann
wird der laufende Zählwert i als eine X-Adresse eines Endpunktes
des n-ten Unterbereiches in X-Richtung gespeichert,
und eine weitere X-Adresse, die man durch Abziehen eines Bereichsüberlappungsbetrages T
von jener X-Adresse erhalten
hat, wird als eine X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 166). Es
sei ebenfalls angemerkt, daß der Startpunkt des ersten
Unterbereiches in X-Richtung der linken Seite (X = 0) des
Zeichenabbildes entspricht und der Endpunkt des letzten und
daher M-ten Unterbereiches in X-Richtung der rechten Seite
des Zeichenabbildes entspricht.
Im Anschluß an den Schritt 166 wird der Zählwert des Zählers n erhöht
(Schritt 168), und das Verfahren geht auf Schritte über,
mit denen der nächste Unterteilungspunkt bestimmt wird.
Dieses Verfahren wird beendet, wenn die Bedingung n = N
beim Schritt 156 erreicht worden ist. Auf diese Weise werden
Unterteilungspunkte in X- und Y-Richtung bestimmt, so daß
das Zeichenabbild in ein Netz aus N × m Unterbereiche in X-
und Y-Richtung unterteilt ist.
Wie zuvor ausgeführt worden ist, sind die japanischen Katakana-Zeichen
"nu" und "su" in der Gestalt einander ähnlich,
wobei sich "nu" durch einen zusätzlichen Strich auszeichnet,
der von links oben nach rechts unten in der Mitte verläuft.
Um diese zwei Zeichen voneinander zu unterscheiden, spielt
dieser zusätzliche Strich eine Schlüsselrolle. Wenn das
Zeichen "nu" durch das Verfahren nach den Fig. 21a und
21b unterteilt wird, dann ergibt sich das in Fig. 26a dargestellte
Unterteilungsergebnis. Eine Prüfung des linken Zwischenunterbereiches
(1, 2) im Zeichenabbild von Fig. 26a
zeigt die Tatsache, daß die Information bezüglich der geneigten
Lage des zusätzlichen Striches in diesem Unterbereich
nicht vorhanden ist. Andererseits zeigt Fig. 26b das
Ergebnis, wenn dasselbe Zeichen "nu" einer Unterteilung
nach dem vorliegenden Verfahren unterzogen worden ist, das
in den Fig. 25a und 25b dargestellt ist. Es ist anzumerken,
daß in Fig. 26b nur die Unterteilungen in X-Richtung für
den mittleren Unterbereich in Y-Richtung dargestellt sind
und die Bedingung T = 0 angenommen worden ist. Ein schneller
Blick auf den linken Zwischen-Unterbereich (1, 2) genügt, um
zu verstehen, daß der Unberbereich (1, 2) Informationen enthält,
die in ausreichender Weise die Anwesenheit des geneigten
zusätzlichen Striches angeben. Auf diese Weise kann die vorliegende
Erfindung die Nachteile in der unter Bezugnahme
auf die Fig. 21a und 21b beschriebenen Ausführungsform
überwinden.
In der obigen Beschreibung sind Unterteilungen in Y-Richtung
nach dem Verfahren entsprechend der vorangehenden Ausführungsform
ausgeführt worden. Es sei jedoch angemerkt, daß
nach den Unterteilungen in X-Richtung die Unterteilungen in
Y-Richtung mit einem Verfahren ausgeführt werden können,
das ähnlich dem in den Fig. 25a und 25b dargestellten
Verfahren ist, um jede der Unterteilungen in X-Richtung
auszuführen.
In der soeben beschriebenen Ausführungsform nach den Fig.
25a und 25b ergibt sich eine größere Streuung in der Anzahl
von Pixeln zwischen den unterteilten Unterbereichen in den
X- und Y-Richtungen im Falle, daß Merkmalspixel (d. h. Pixel,
denen Kodes zugeordnet sind) in einem Bereichsüberlappungsabschnitt
konzentriert sind, wenn Unterteilungspunkte unter
Verwendung von PE/(NXM) als Bezug bestimmt werden. Die Fig.
27a und 27b zeigen eine weitere Ausführungsform mit Merkmalen
nach der vorliegenden Erfindung, die in der Lage ist,
dieses Problem zu überwinden. In dem Flußdiagramm nach den
Fig. 27a und 27b entspricht der Schritt 170 dem Schritt
110 in den Fig. 21a und 21b. Der Verfahrensablauf geht
dann zum Schritt 172 über, in welchem ein Zeichenabbild in
Y-Richtung unterteilt wird. Dies entspricht einer Folge von
Schritten 126 bis 138 in der in den Fig. 21a und 21b gezeigten
Ausführungsform. Im Schritt 172 wird jedoch gleichzeitig
mit den Unterteilungen in Y-Richtung auf das Histogramm
HYj Bezug genommen und die Anzahl Pm der Merkmalspixel
in jedem der Unterbereiche in Y-Richtung wird ermittelt.
Der Verfahrensablauf geht dann zu einer Folge von
Schritten 174 bis 188 über, die der Bestimmung von Unterteilungen
in X-Richtung dienen. Diese Schritte 174 bis 188
werden nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i und des Registers P
(Schritt 174) wird der Zählwert des Zählers i erhöht (Schrit 178) und
dann wird für die X-Adresse entsprechend diesem Zählwert des Zählers i
das Zeichenabbild rastermäßig in Y-Richtung abgetastet,
wodurch die Anzahl von Pixeln in dieser Zeile gezählt wird
(Schritt 180), denen Kodes zugeordnet sind, und dieser
Wert Pi wird dem laufenden Zählwert des Registers P hinzuaddiert
(Schritt 182). Sodann wird geprüft, ob der Wert P
des Registers P einen vorbestimmten Wert von (Pm/N) Xn im
Schritt 184 überschritten hat, oder nicht. Wenn das Ergebnis
negativ ist, dann geht der Verfahrensablauf zurück zum
Schritt 178, um die gleichen Schritte zu wiederholen. Ist
andererseits die Bedingung, daß P gleich oder größer als
(Pm/N) Xn ist, erreicht worden, dann wird der laufende
Zählwert des Zählers i als eine X-Adresse eines Endpunktes
des n-ten Unterbereiches in X-Richtung gespeichert, und
eine weitere X-Adresse, die durch Abziehen einer Bereichsüberlappungsgröße
T von jener X-Adresse ermittelt worden
ist, wird als eine X-Adresse eines Startpunktes des (n +1)-ten
Unterbereiches in X-Richtung gespeichert (Schritt 186).
Wie zuvor, sei auch hier angemerkt, daß der Startpunkt des
ersten Unterbereiches in X-Richtung der linken Seite (X = 0)
des Zeichenabbildes entspricht, während der Endpunkt des
letzten und daher N-ten Unterbereiches in X-Richtung der
rechten Seite des Zeichenabbildes entspricht.
Nach dem Schritt 186 geht der Verfahrensablauf zum Schritt
188 über, wo der Zählwert des Zählers n erhöht wird, so daß zu einer
weiteren Folge von Schritten zur Bestimmung des nächsten Unter
teilungspunktes übergegangen wird. Dieser Verfahrensablauf
wird beendet, sobald die Bedingung n = N im Schritt 176
erreicht worden ist. Auf diese Weise werden Unterteilungsstellen
in X-Richtung für jede der in Y-Richtung unterteilten
Sektionen bestimmt, so daß das Zeichenabbild als Ganzes
in ein Netz von N × M Unterbereiche unterteilt wird.
Fig. 28a zeigt das Ergebnis, wenn das Zeichen "nu" in Übereinstimmung
mit dem unter Bezugnahme auf die Fig. 25a
und 25b beschriebenen Verfahren und unter der Annahme T = 1
unterteilt wird. Andererseits zeigt Fig. 28b das Ergebnis,
wenn dasselbe Zeichen "nu" in Übereinstimmung mit der vorliegenden
Erfindung unterteilt wird, wie sie soeben unter
Bezugnahme auf die Fig. 27a bund 27b beschrieben worden
ist, wieder mit der Annahme, daß T = 1. In beiden Fällen
werden Unterteilungen zunächst in Y-Richtung ausgeführt,
und sodann werden Unterteilungen in X-Richtung ausgeführt.
Es sei auch angemerkt, daß Unterteilungen in X-Richtung nur
in den mittleren Sektionen solcher in Y-Richtung unterteilten
dargestellt sind. Ein Vergleich zwischen den zwei
Ergebnissen, die in den Fig. 28a und 28b dargestellt
sind, läßt schließen, daß der linke untere Zwischenunterbereich
(1, 2) des Zeichenabbildes in Fig. 28b Informationen enthält,
die die geneigte Gestalt des zusätzlichen Striches in
der Mitte des Zeichens besser widerspiegelt. Auf diese
Weise ergibt sich selbst bei einer Anhäufung von Merkmalspixeln
an einer Unterteilungsstelle die Möglichkeit, Unterteilungen
in geeigneter Weise und optimal in Übereinstimmung
mit der vorliegenden Erfindung jederzeit auszuführen.
Fig. 29 zeigt in Blockform ein System, das zur Ausführung
eines jeden der oben beschriebenen Zeichenunterteilungsverfahren
geeignet ist. Wie dargestellt, enthält das System
einen Abbildspeicher 190 zur Speicherung eines zu verarbeitenden
Zeichenabbildes mit Merkmalszuordnungen. In dem
System ist weiterhin eine zentrale Prozessoreinheit (CPU)
192 und ein Hauptspeicher 194 angegeben, der ein Programm
für jedes der obigen Verfahren und Tabellen für die beschriebenen
Histogramme speichert, sowie die oben beschriebenen
Zähler enthält. Die CPU 192 hat Zugang zum Bildspeicher 190,
einer Abtastschaltung 191 und auch zum Hauptspeicher 194
über einen Bus 195, und umgekehrt. Im Betrieb führt die CPU
192, während sie Zugang zum Bildspeicher 190 hat, den Merkmalszuordnungsbetrieb
sowie das Zählen der Gesamtzahl der
Merkmalspixel und die Erzeugung von Histogrammen sämtlich
zur gleichen Zeit aus. Das verarbeitete Zeichenabbild, dem
Merkmale zugeordnet worden sind, wird in dem Bildspeicher
190 gespeichert, hingegen werden die Daten über die Gesamtzahl
von Merkmalspixeln und die Histogramme im Hauptspeicher
194 gespeichert. Während der nachfolgenden Verarbeitung
zur Bestimmung der Unterteilungsstellen führt die CPU 192
dann eine vorbestimmte Routine aus, bei der sie auf die Gesamtzahl
der Merkmalspixel und auf die Histogrammtabellen
Bezug nimmt, die in dem Hauptspeicher 194 gespeichert sind,
sowie, soweit notwendig, auf das Zeichenabbild mit den
Merkmalszuordnungen, das im Bildspeicher 190 gespeichert
ist, und sodann wird das Ergebnis der so bestimmten Unterteilungsstellen
in einem speziellen Speicherbereich des
Hauptspeichers 194 gespeichert. Das System nach Fig. 29 ist
daher als Teil eines Zeichenerkennungssystems in hohem Maße
vorteilhaft.
Die obige Beschreibung ist anhand von verschiedenen Ausführungsformen
der Erfindung gegeben worden, von denen ggf. abgewichen
werden kann, ohne den Grundgedanken der Erfindung
zu verlassen. Beispielsweise ist von Richtungskodes als
einem Zeichenabbild zuzuordnenden Merkmalen Gebrauch gemacht
worden. Es können jedoch auch andere spezifische Arten von
Merkmalen verwendet werden.
Claims (11)
1. Zeichenerkennungsverfahren, wonach ein zu erkennendes
Zeichen optisch abgetastet wird und in ein binäres Zeichen
abbild umgewandelt wird, den die Kontur des Zeichens festlegen
den Bildpunkten Richtungskodes zugeordnet werden, ein das
Zeichen enthaltender Flächenbereich in kleinere Unterbereiche
aufgeteilt wird und aus den in den einzelnen Unterbereichen
vorhandenen Richtungskodes Histogramme gebildet werden, die
mit vorher abgespeicherten Histogrammen verglichen werden,
dadurch gekennzeichnet, daß
- a) nach der Zuordnung von Richtungskodes die Gesamtzahl der Richtungskodes gezählt wird,
- b) daran anschließend ein erstes Histogramm durch Projektion der zugeordneten Richtungskodes auf eine erste vorbestimmte Achse gebildet wird und ein zweites Histogramm durch Projektion der zugeordneten Richtungskodes auf eine zweite vorbestimmte Achse gebildet wird und
- c) auf der Grundlage des Zählergebnisses und unter Verwendung der zwei Histogramme Unterteilungsstellen innerhalb des Flächenbereiches zur Festlegung der Lage und der Größe der kleinen Unterbereiche derart bestimmt werden, daß jeder der genannten kleinen Unterbereiche im wesentlichen die gleiche Zahl an Richtungskodes aufweist.
2. Verfahren nach Anspruch 1, dadurch gekenn
zeichnet, daß vor der Zuordnung der Richtungs
kodes das Zeichenabbild in X- und/oder Y-Richtung verbrei
tert wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch ge
kennzeichnet, daß die Positionen der Unter
teilungen in Y-Richtung aus Y-Adressen (Y=i) bestehen, die
dem kumulativen Wert des Histogramms (HYi) entsprechen,
welches einem ganzzahligen Vielfachen der Anzahl von Unter
teilungs-Bezugsbildpunkten (PE/N) entspricht, das heißt
(PE/N)X 1, (PE/N)X 2, . . ., (PE/N)×(N-1), wobei PE die
Gesamtzahl der Merkmalsbildpunkte ist und N die Zahl der
Unterteilungen ist.
4. Verfahren nach Anspruch 1 oder 2, dadurch ge
kennzeichnet, daß die Aufteilung in eine
Vielzahl von Unterbereichen derart durchgeführt wird, daß,
während der Zuordnung der Richtungskodes, die kumulative
Zahl der Merkmalsbildpunkte, denen die Richtungskodes zu
geordnet wurden, in Histogramm (HYi) in Y-Richtung und
ein Histogramm (HXi) in X-Richtung bestimmt werden und die
Zahl der Unterteilungs-Bezugsbildpunkte, die bestimmt ist
durch die Gesamtzahl der Richtungskodes, und eine vor
bestimmte Anzahl von Unterteilungen mit dem genannten Histo
gramm (HYi) und dem Histogramm (HXi) verglichen wird, um
dadurch die Positionen der Unterteilungen des binären Zeichen
abbildes in Y- und X-Richtung zu bestimmen.
5. Verfahren nach Anspruch 4, dadurch gekenn
zeichnet, daß die Gesamtzahl der Merkmalsbild
punkte bezeichnet wird (durch PE), ferner die Anzahl der
Unterteilungen in der Y-Richtung bezeichnet wird (durch N)
und die Anzahl der Unterteilungen in der X-Richtung be
zeichnet wird (M), wobei die Position der Unterteilung in
der Y-Richtung aus einer Y-Adresse (Y=i) besteht, die dem
kumulativen Wert des Histogramms (HYi) entsprechend einem
ganzzahligen Vielfachen der Anzahl von Unterteilungs-
Bezugsbildpunkten PE/N) entspricht, das heißt (PE/N)X 1,
(PE/N)X 2, . . ., (PE/N)×(N-1), wobei die Position der
Unterteilung in der X-Richtung aus einer X-Adresse (X=i)
besteht, die einem ganzzahligen Vielfachen der Zahl der
Unterteilungs-Bezugsbildpunkte entspricht (PE/M), das
heißt (PE/M)X 1, (PE/M)X 2, . . ., (PE/M)×(M-1).
6. Verfahren nach Anspruch 1 oder 2, dadurch ge
kennzeichnet, daß die Unterteilung in eine
Vielzahl von Unterbereichen derart durchgeführt wird, daß
während der Zuordnung der Richtungskodes die kumulative
Zahl der Merkmalsbildpunkte, denen die Richtungskodes zu
geordnet wurden, vorgesehen wird und ein Histogramm (HYi)
in der Y-Richtung erzeugt wird, ferner die Anzahl der
Unterteilungs-Bezugsbildpunkte in der Y-Richtung, die durch
die Gesamtzahl der Merkmalsbildpunkte bzw. Richtungskodes
bestimmt ist, und eine vorbestimmte Anzahl von Untertei
lungen in der Y-Richtung mit den Werten des Histogramms
(HYi) verglichen wird, daß dann eine Aufteilung in der
Y-Richtung auf der Grundlage der so erhaltenen Positionen
der Unterteilung in der Y-Richtung in dem binären Zeichen
abbild durchgeführt wird, dann die Merkmalsbildpunkte ge
zählt werden, während jede der Unterbereiche entsprechend
der Unterteilung in der Y-Richtung in der Y-Richtung ab
getastet wird, der so gezählte Wert mit der Gesamtzahl der
Merkmalsbildpunkte verglichen wird und mit der Anzahl der
Unterteilungs-Bezugsbildpunkte in der X-Richtung, die
bestimmt ist durch die Gesamtzahl der Merkmals-Bildpunkte,
und einer vorbestimmten Anzahl von Unterteilungen in der
X-Richtung verglichen wird, und dann eine Aufteilung in
der X-Richtung auf der Grundlage der so bestimmten Posi
tion der Unterteilungen in der X-Richtung in dem der
Unterbereiche, die in der Y-Richtung aufgeteilt sind, durch
geführt wird.
7. Verfahren nach Anspruch 1 oder 2, dadurch ge
kennzeichnet, daß die Zahl der Unterteilungs-
Bezugsbildpunkte in der Y-Richtung gleich ist (PE/N)
und daß die Zahl der Unterteilungs-Bezugsbildpunkte in der
X-Richtung gleich ist (PE/(NXM)).
8. Verfahren nach Anspruch 1 oder 2, dadurch ge
kennzeichnet, daß die Unterteilung in eine
Vielzahl von Unterbereichen dadurch ausgeführt wird, daß
während der Zuordnung der Richtungskodes die kumulative
Anzahl von Merkmals-Bildpunkten gebildet wird, denen Rich
tungskodes zugeordnet werden und daß ein Histogramm (HYi)
in der X-Richtung gebildet wird, die Anzahl der Untertei
lungs-Bezugsbildpunkte in der Y-Richtung, die bestimmt ist
durch die Gesamtzahl der Merkmalsbildpunkte, und eine vor
bestimmte Anzahl von Unterteilungen in der Y-Richtung mit
den Werten des Histogramms (HYi) verglichen wird, daß dann
eine Unterteilung in der Y-Richtung auf der Grundlage der
so bestimmten Position der Unterteilungspunkte in der
Y-Richtung des binären Zeichenabbilds vorgenommen wird,
die Merkmalsbildpunkte während einer Abtastung in der
Y-Richtung jedes der Unterbereiche, die in der Y-Richtung
unterteilt sind, gezählt werden, der so erhaltene Zählwert
mit der Anzahl der Unterteilungs-Bezugsbildpunkte in der
X-Richtung, die bestimmt ist durch die Gesamtzahl der
Merkmalspunkte in jedem der Unterbereiche in der Y-Rich
tung, und einer vorbestimmten Anzahl von Unterabteilungen
in der X-Richtung verglichen wird und dann eine Untertei
lung in der X-Richtung auf der Grundlage der so ermittel
ten Position der Unterteilung in der X-Richtung vorgenom
men wird.
9. Verfahren nach Anspruch 8, dadurch gekenn
zeichnet, daß die Anzahl der Unterteilungs-
Bezugsbildpunkte in der Y-Richtung gleich ist (PE/N) und daß
die Anzahl der Unterteilungs-Bezugsbildpunkte in der
X-Richtung entweder einen der Werte von (PE′1/M),
(PE′2/M), . . ., (PE′N/M) für jeden der Unterbereiche ent
sprechend der Aufteilung in der Y-Richtung ist, deren Gesamt
zahl von Merkmalsbildpunkten jeweils ist PE′1, PE′2,
. . ., PE′N.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch
gekennzeichnet, daß die Unterteilung in
eine Vielzahl von Unterbereichen derart durchgeführt wird,
daß zwei benachbarte Unterbereiche einen sich überlappen
den Abschnitt aufweisen.
11. Verfahren nach einem der Ansprüche 1 bis 10, dadurch
gekennzeichnet, daß das binäre Zeichenabbild
dadurch erzeugt wird, indem zuerst schwarze Bildpunkte
in einem provisorischen binären Zeichenabbild aufgefun
den werden, welches durch photoelektrische Umwandlung der
optischen Abtastsignale des zu erkennenden Zeichens erhal
ten wird und in dem dann wenigstens einige der Weißbild
punkte, die den schwarzen Bildpunkten benachbart sind, in
schwarze Bildpunkte umgewandelt werden, um dadurch die
Zeichenzeile des provisorischen binären Zeichenabbilds zu
verbreitern.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61114042A JPS62269286A (ja) | 1986-05-19 | 1986-05-19 | 文字認識方式 |
JP61249159A JPS63103392A (ja) | 1986-10-20 | 1986-10-20 | 文字認識方式 |
JP61251537A JPH0795335B2 (ja) | 1986-10-22 | 1986-10-22 | 領域分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3716787A1 DE3716787A1 (de) | 1987-11-26 |
DE3716787C2 true DE3716787C2 (de) | 1990-09-06 |
Family
ID=27312638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19873716787 Granted DE3716787A1 (de) | 1986-05-19 | 1987-05-19 | Zeichenerkennungsverfahren |
Country Status (3)
Country | Link |
---|---|
US (1) | US4903312A (de) |
DE (1) | DE3716787A1 (de) |
GB (1) | GB2190778B (de) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5504822A (en) * | 1986-09-19 | 1996-04-02 | Holt; Arthur W. | Character recognition system |
US4905295A (en) * | 1986-11-13 | 1990-02-27 | Ricoh Company, Ltd. | Code sequence matching method and apparatus |
DE3815869A1 (de) * | 1987-05-08 | 1988-11-17 | Ricoh Kk | Verfahren zum extrahieren von merkmalsmengen eines zeichens |
US4959870A (en) * | 1987-05-26 | 1990-09-25 | Ricoh Company, Ltd. | Character recognition apparatus having means for compressing feature data |
JPH07120385B2 (ja) * | 1987-07-24 | 1995-12-20 | シャープ株式会社 | 光学的読取り方法 |
US5046115A (en) * | 1987-10-26 | 1991-09-03 | Kabushiki Kaishakomatsu Seisakusho | Method of processing image data on crack |
US5031225A (en) * | 1987-12-09 | 1991-07-09 | Ricoh Company, Ltd. | Character recognition method for recognizing character in an arbitrary rotation position |
US5247587A (en) * | 1988-07-15 | 1993-09-21 | Honda Giken Kogyo Kabushiki Kaisha | Peak data extracting device and a rotary motion recurrence formula computing device |
JPH0229886A (ja) * | 1988-07-20 | 1990-01-31 | Ricoh Co Ltd | 特徴量抽出方法 |
US5195147A (en) * | 1989-05-02 | 1993-03-16 | Ricoh Company, Ltd. | Image forming apparatus |
US5054094A (en) * | 1990-05-07 | 1991-10-01 | Eastman Kodak Company | Rotationally impervious feature extraction for optical character recognition |
JP2542947B2 (ja) * | 1990-05-09 | 1996-10-09 | 大日本スクリーン製造株式会社 | 画像処理装置 |
US5020121A (en) * | 1990-08-16 | 1991-05-28 | Hewlett-Packard Company | Neighborhood block prediction bit compression |
US5121440A (en) * | 1990-08-30 | 1992-06-09 | Monolithic Resources Corporation | Analog video character recognition system |
US5428692A (en) * | 1991-11-18 | 1995-06-27 | Kuehl; Eberhard | Character recognition system |
US5307424A (en) * | 1990-12-12 | 1994-04-26 | Eberhard Kuehl | Character recognition system |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
US5515455A (en) * | 1992-09-02 | 1996-05-07 | The Research Foundation Of State University Of New York At Buffalo | System for recognizing handwritten words of cursive script |
JP3106021B2 (ja) * | 1992-11-30 | 2000-11-06 | キヤノン株式会社 | パターンデータの圧縮方法及び装置と出力方法及び装置 |
JPH06203165A (ja) * | 1993-01-07 | 1994-07-22 | Canon Inc | 画像情報処理方法及び装置 |
US5491758A (en) * | 1993-01-27 | 1996-02-13 | International Business Machines Corporation | Automatic handwriting recognition using both static and dynamic parameters |
JPH06348800A (ja) * | 1993-06-02 | 1994-12-22 | Canon Inc | 画像処理方法及び装置 |
US5444793A (en) * | 1993-06-15 | 1995-08-22 | Ncr Corporation | Method for detecting machine printed monetary amounts in binary images |
JPH07129720A (ja) * | 1993-11-04 | 1995-05-19 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP3027321B2 (ja) * | 1994-09-27 | 2000-04-04 | 財団法人工業技術研究院 | 拘束のない手書き英数字のオンライン認識の方法及び装置 |
JPH08194780A (ja) * | 1994-11-18 | 1996-07-30 | Ricoh Co Ltd | 特徴抽出方法 |
US5802207A (en) * | 1995-06-30 | 1998-09-01 | Industrial Technology Research Institute | System and process for constructing optimized prototypes for pattern recognition using competitive classification learning |
JP4305971B2 (ja) * | 1998-06-30 | 2009-07-29 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US7221810B2 (en) * | 2000-11-13 | 2007-05-22 | Anoto Group Ab | Method and device for recording of information |
JP4161659B2 (ja) * | 2002-02-27 | 2008-10-08 | 日本電気株式会社 | 画像認識システム及びその認識方法並びにプログラム |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
JP4047090B2 (ja) * | 2002-07-31 | 2008-02-13 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
US7190834B2 (en) * | 2003-07-22 | 2007-03-13 | Cognex Technology And Investment Corporation | Methods for finding and characterizing a deformed pattern in an image |
US7388990B2 (en) * | 2003-09-22 | 2008-06-17 | Matrox Electronics Systems, Ltd. | Local mass distribution partitioning for object recognition |
US7707039B2 (en) * | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
US8620083B2 (en) * | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US7525034B2 (en) * | 2004-12-17 | 2009-04-28 | Nease Joseph L | Method and apparatus for image interpretation into sound |
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
US8749839B2 (en) | 2005-03-24 | 2014-06-10 | Kofax, Inc. | Systems and methods of processing scanned data |
US9137417B2 (en) | 2005-03-24 | 2015-09-15 | Kofax, Inc. | Systems and methods for processing video data |
JP2009070226A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | マッチング装置 |
TWI374658B (en) * | 2007-09-29 | 2012-10-11 | Htc Corp | Image process method |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9349046B2 (en) | 2009-02-10 | 2016-05-24 | Kofax, Inc. | Smart optical input/output (I/O) extension for context-dependent workflows |
US8958605B2 (en) | 2009-02-10 | 2015-02-17 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8774516B2 (en) | 2009-02-10 | 2014-07-08 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9058515B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9165188B2 (en) | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9483794B2 (en) | 2012-01-12 | 2016-11-01 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9058580B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
JP2016517587A (ja) | 2013-03-13 | 2016-06-16 | コファックス, インコーポレイテッド | モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類 |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
DE202014011407U1 (de) | 2013-05-03 | 2020-04-20 | Kofax, Inc. | Systeme zum Erkennen und Klassifizieren von Objekten in durch Mobilgeräte aufgenommenen Videos |
JP2016538783A (ja) | 2013-11-15 | 2016-12-08 | コファックス, インコーポレイテッド | モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法 |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US10163004B2 (en) | 2017-03-30 | 2018-12-25 | Konica Minolta Laboratory U.S.A., Inc. | Inferring stroke information from an image |
US10579893B2 (en) | 2017-02-28 | 2020-03-03 | Konica Minolta Laboratory U.S.A., Inc. | Inferring stroke information from an image |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3755780A (en) * | 1971-06-28 | 1973-08-28 | Pattern Analysis & Recognition | Method for recognizing characters |
US3803553A (en) * | 1972-06-14 | 1974-04-09 | Hitachi Ltd | Character recognition apparatus |
US4087788A (en) * | 1977-01-14 | 1978-05-02 | Ncr Canada Ltd - Ncr Canada Ltee | Data compression system |
JPS5418632A (en) * | 1977-07-12 | 1979-02-10 | Nippon Telegr & Teleph Corp <Ntt> | Character identification system |
US4162482A (en) * | 1977-12-07 | 1979-07-24 | Burroughs Corporation | Pre-processing and feature extraction system for character recognition |
US4229768A (en) * | 1978-03-30 | 1980-10-21 | Canon Kabushiki Kaisha | Information processing apparatus |
JPS596421B2 (ja) * | 1978-08-28 | 1984-02-10 | 肇産業株式会社 | パタ−ン情報処理方法 |
JPS5579590A (en) * | 1978-12-13 | 1980-06-16 | Hitachi Ltd | Video data processor |
US4300122A (en) * | 1979-04-02 | 1981-11-10 | Sperry Corporation | Apparatus for processing digital data representative of a two-dimensional image |
US4688088A (en) * | 1984-04-20 | 1987-08-18 | Canon Kabushiki Kaisha | Position detecting device and method |
-
1987
- 1987-05-19 GB GB8711738A patent/GB2190778B/en not_active Expired - Fee Related
- 1987-05-19 DE DE19873716787 patent/DE3716787A1/de active Granted
-
1988
- 1988-09-06 US US07/241,825 patent/US4903312A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE3716787A1 (de) | 1987-11-26 |
GB2190778B (en) | 1990-04-25 |
GB8711738D0 (en) | 1987-06-24 |
GB2190778A (en) | 1987-11-25 |
US4903312A (en) | 1990-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3716787C2 (de) | ||
DE3633743C2 (de) | ||
DE3485953T2 (de) | Verfahren und anlage zur on-line-erkennung handgeschriebener muster. | |
DE3689416T2 (de) | Mustermerkmalextraktion. | |
DE68915950T2 (de) | Verfahren zum Trennen von Zeichen. | |
DE69721941T2 (de) | Gerät und Verfahren zum Extrahieren von Mustern | |
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE3806223C2 (de) | Verfahren zur Erzeugung von Zeichenmustern | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
DE19960555B4 (de) | Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE4005492C2 (de) | Bildcodierverfahren | |
DE3425449A1 (de) | Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung | |
DE19814075A1 (de) | Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern | |
DE60204005T2 (de) | Verfahren und einrichtung zur erkennung eines handschriftlichen musters | |
DE3326725A1 (de) | Verfahren zur datenkomprimierung fuer zweidimensionale zeichenbilder | |
DE4427992C2 (de) | Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments | |
DE3322443C2 (de) | ||
EP0402868B1 (de) | Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen | |
DE3342947A1 (de) | Verfahren zur behandlung der daten eines binaeren grafischen musters und system dafuer | |
DE3815869C2 (de) | ||
DE2829808A1 (de) | Verfahren und vorrichtung zum lesen von zeichen | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE19531392C1 (de) | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen | |
DE112021000371T5 (de) | Digitale bildbearbeitung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |