-
Die Erfindung betrifft ein Gerät zur Erkennung
handgeschriebener Zeichen.
-
Geräte zur Erkennung handgeschriebener Zeichen vom On-
Line-Typ führen generell die zwei folgenden Schritte aus:
-
Abfragen verschiedener Charakteristiken (Strichdaten)
von Strichen eines von Hand auf ein Tablett geschriebenen
Zeichens und
-
Vergleichen der abgefragten bzw. extrahierten
Strichdaten mit den Charakteristiken (Auswertungskodes) von in einem
Zeichenerkennungsverzeichnis gespeicherten Zeichen und
Ausgeben eines Zeichenkodes eines Zeichens, er mit dem in dem
Verzeichnis gespeicherten Auswertungskode hinreichend identisch
ist.
-
Bei Ausführung der Verarbeitung im zweiten Schritt wird
ein japanisches Kanji-Zeichen in Teilstrukturen,
beispielsweise ein linksseitiges und/oder rechtsseitiges Radikal oder
dergl. zerlegt, und das Zeichenerkennungsverzeichnis wird auf
der Basis dieser Teilstrukturen gebildet. Diese Art
Verzeichnis ist im folgenden mit "Teilstrukturverzeichnis"
bezeichnet. Wenn das Zeichenerkennungsverzeichnis so gebildet wird,
daß die Teile, deren Vergleich und Auswertung gemeinsam sind,
das Teilstrukturverzeichnis enthalten, kann die
Speicherkapazität des Zeichenerkennungsverzeichnisses reduziert werden.
-
Die Schreibreihenfolge von Kanji-Zeichen, d.h. die
Reihenfolge, in welcher die Striche geschrieben werden, ist
nicht immer die gleiche und Schreiber verwenden oft
verschiedene Schreibreihenfolgen.
-
Demgemäß muß ein Gerät zur Erkennung handgeschriebener
Zeichen zahlreiche verschiedene Schreibreihenfolgen von
Schreibern behandeln können, so daß mehrere
Schreibreihenfolgen im Teilstrukturverzeichnis enthalten sein müssen.
-
Es wird jedoch häufig beobachtet, daß es selbst dann,
wenn mehrere Schreibreihenfolgen in dem
Teilstrukturverzeichnis enthalten sind, Fälle gibt, bei welchen eine
Richtungsrelation zweier Teilstrukturen des Zeichens nicht ausgewertet
bzw. entwickelt werden können. Dies hat zur Folge, dab die
Erkennungsgeschwindigkeit des Eingangszeichens herabgesetzt und
eine Interferenz bzw. Störung zwischen Zeichen erhöht wird,
wodurch das Erkennungsverhältnis des Zeichens reduziert wird.
-
Aus PROCEEDINGS TENCON '87, IEEE REGION 10 CONFERENCE,
Vol. 1, 25.-28. August 1987, SEOUL, KOREA, Seiten 91-95, Y-T
JUANG: "On Line Recognition of Handwritten Chinese
Characters: A Syntactic-Semantic Approach" geht eine auf der
Trennung des Zeichens in Radikale basierende Lösung hervor.
Radikale werden durch Addieren von Strichen, bis sich ein
Strich zu weit außerhalb einer rechteckigen Umgebung der
vorhergehenden Striche befindet, eingeführt. Individuelle
Radikale werden unter Verwendung einer Übergangstabelle erkannt.
Eine Beseitigung einer Mehrdeutig zwischen Zeichen mit den
gleichen Radikalen wird durch eine semantische Prüfung
ausgeführt.
-
Gemäß der vorliegenden Erfindung ist ein Gerät zur
Erkennung handgeschriebener Zeichen bereitgestellt, die besteht
aus:
-
einer Eingabeeinrichtung zur Erzeugung handgeschriebener
Strichdaten,
-
einer Einrichtung zum Ableiten und Speichern von mit einem
handgeschriebenen Zeichen korrespondierenden Charakteristiken
der handgeschriebenen Strichdaten,
-
einer Einrichtung zum Speichern jeweiliger
Rechteckteilumrißdaten für die handgeschriebenen Strichdaten, die beim
Hinzufügen sukzessiver Striche jeweils mit dem Rechteckmriß des
Zeichens korrespondieren,
-
einer Einrichtung zum Speichern jeweiliger verbleibender
Teilrechteckumrißdaten für die handgeschriebenen Strichdaten,
die beim Beseitigen sukzessiver Striche in der
Schreibreihenfolge jeweils mit dem Rechteckumriß des Zeichens
korrespondieren,
-
einer Zeichenverzeichniseinrichtung zum Speichern von
Auswertungsungsdaten, welche Charakteristiken von Zeichenstrichen
anzeigen, und und von Richtungsbeziehungsdaten, welche
Richtungsbeziehungen von Teilrechteckumrißdaten von Zeichen
anzeigen, und
-
einer Zeichenerkennungseinrichtung, die auf die
Strichcharakteristikdaten, die Rechteckumrißdaten und die verbleibenden
Rechteckumrißdaten anspricht, wobei die
Zeichenerkennungseinrichtung a) eine Teilstrukturdetektoreinrichtung zum
Detektieren von Teilstrukturen in den mit den
Teilrechteckumrißdaten korrespondierenden Zeichen durch Vergleich der
Strichcharakteristikdaten mit den in der Zeichenverzeichniseinrichtung
gespeicherten Auswertungsdaten und b) eine Einrichtung zum
Detektieren von Zeichen der handgeschriebenen Strichdaten
durch Vergleich von Richtungsbeziehungen der
Rechteckumrißdaten für die erkannten Teilstrukturen mit den in der
Zeichenverzeichniseinrichtung gespeicherten Rechteckumrißdaten
aufweist.
-
So kann eine Ausführungsform eines Geräts zur Erkennung
handgeschriebener Zeichen eine Eingangsschaltung zur
Erzeugung handgeschriebener Strichdaten, eine Schaltung zum
Ableiten und Speichern von Charakteristiken handgeschriebener
Strichdaten, einen Speicher zum Speichern von
Rechteckumrißdaten der handgeschriebenen Strichdaten, einen
Zeichenverzeichnisspeicher zum Speichern der Charakteristiken von
Zeichenstrichen und Richtungsbeziehungen von
Rechteckteilumrißdaten von Zeichen und eine Zeichenerkennungsschaltung zum
Bestimmen von Zeichen der handgeschriebenen Strichdaten durch
Vergleich der Charakteristiken und Richtungsbeziehungen von
Rechteckteilumrißdaten der handgeschriebenen Strichdaten mit
den im Zeichenverzeichnisspeicher gespeicherten aufweisen.
-
Die Erfindung wird nun beispielhaft unter Bezugnahme auf
die beigefügten Zeichnungen beschrieben, in denen durchgängig
gleiche Teile mit gleichen Bezugszeichen bezeichnet sind und
in denen:
-
Figur 1 ein Blockschaltbild einer Ausführungsform eines
Geräts zur Erkennung handgeschriebener Zeichen gemäß der
vorliegenden Erfindung ist,
-
Figur 2 eine zur Erklärung von Rechteckumrißdaten des
eingegebenen Zeichens verwendete schematische Darstellung
ist,
-
Figur 3 eine zur Erklärung von Rechteckumrißdaten und
Strichdaten des eingegebenen Zeichens verwendete schematische
Darstellung ist,
-
Figuren 4A und 4B zur Erklärung einer Richtungsbeziehung
zweier Teilstrukturen verwendete jeweilige schematische
Darstellungen sind, und
-
Figur 5 (bestehend aus den Figuren 5A und 5B) ein
Flußdiagramm zur Erklärung des Betriebs der Ausführungsform ist.
-
Nach Figur 1 erzeugt beim Schreiben eines Zeichens auf
ein Tablett 11 das Tablett 11 Ausgabedaten. Die Ausgabedaten
aus dem Tablett 11 werden einer Vorverarbeitungsschaltung 12
zugeführt, in welcher die Daten eine Vorverarbeitung
erfahren, beispielsweise eine Entfernung von Rauschkomponenten,
eine Polygonlinienapproximation oder dergl. Die derart
vorverarbeiteten Daten werden einem Eingabepuffer 13 zugeführt
und darin gespeichert. Eine
Strichcharakteristik-Abfrageschaltung 14 frägt für jeden Strich des eingegebenen Zeichens
eine Strichcharakteristik aus den in dem Eingabepuffer 13
gespeicherten Daten ab und gibt diese als Strichdaten aus. Die
Strichdaten werden in einem Strichcharakteristikpuffer 15
gespeichert, und in einem Rechteckumrißdatenpuffer 16 werden
Rechteckumrißdaten GK und NK gespeichert.
-
Es sei nun ein Rechteck QR angenommen, welches eine
beispielsweise in Figur 2 gezeigte Teilstruktur umschreibt. Auch
sind, wie in der Figur 2 gezeigt, Punkte 1 bis 8 Eckpunkte
des Rechtecks QR und Mittelpunkte der jeweiligen Seiten
dieses Rechtecks. Dann definieren die Rechteckumrißdaten GK und
NK Koordinatendaten der Punkte 1 bis 8 auf dem Tablett 11.
-
Wie beispielsweise links in der Figur 3 dargestellt
(eine feine durchgezogene Linie stellt das Rechteck QR,
welches die Teilstruktur umschreibt, und eine gestrichelte Linie
ein Rechteck, welches ein Zeichen umschreibt, dar) werden die
Positionsdaten (Punkte) 1 bis 8 von den Rechtecken QR durch
Berechnung jedesmal erhalten, wenn, wie im Fall der Daten GK
auf der linken Seite der Figur 3 gezeigt (obgleich alle diese
Daten #1 bis #8 in der Figur nicht dargestellt sind) , die
Strichdaten addiert werden.
-
Der Rechteckumrißdatenpuffer 16 speichert in einem
ersten Bereich Rechteckumrißdaten GK eines ersten Strich der
Strichdaten, in einem zweiten Bereich Rechteckumrißdaten GK
eines ersten und zweiten Strichs und in einem dritten Bereich
Rechteckumrißdaten GK eines ersten bis dritten Strichs usw..
Infolgedessen speichert der Rechteckumrißdatenpuffer 16 in n
Bereichen Rechteckumrißdaten GK des ersten bis n-ten Strichs.
-
Wie außerdem rechts in der Figur 3 gezeigt werden die
Daten NK von Rechtecken QR jedesmal erhalten, Wenn wie auf
der rechten Seite der Figur 3 gezeigt Strichdaten entfernt
werden. D.h. der Rechteckumrißdatenpuffer 16 speichert in
einem ersten Bereich die verbleibenden Rechteckumrißdaten NK,
von denen der erste Strich der Strichdaten entfernt ist, in
einem zweiten Bereich die verbleibenden Rechteckumrißdaten
NK, von denen der erste und zweite Strich der Strichdaten
entfernt sind, und in einem dritten Bereich die verbleibenden
Rechteckumrißdaten NK, von denen der erste bis dritte
Strichder Strichdaten entfernt sind, usw.. Infolgedessen speichert
der Rechteckumrißdatenpuffer 16 in n Bereichen die
verbleibenden Rechteckumrißdaten NK, von denen der erste bis n-te
Strich entfernt sind.
-
Auf diese Weise werden in Bezug auf ein auf das Tablett
11 geschriebenes Zeichen die Strichdaten jedes Strichs
erzeugt und sequentiell in dem Strichcharakteristikpuffer 19
gespeichert. Ebenso werden seine Rechteckumrißdaten GK und NK
im Rechteckumrißdatenpuffer 16 gespeichert.
-
Wie in Figur 1 gezeigt vergleicht nach dem Speichern der
Daten eines Zeichens in den Puffern 15 und 16 eine
Erkennungsschaltung 17 die im Puffer 15 gespeicherten Strichdaten
durch Verwendung von in einem Erkennungsverzeichnis 18
gespeicherten Auswertungskodes.
-
Es werden Verschiedene Auswertungskodes und
Auswertungsverfahren werden bereitgestellt und im Erkennungsverzeichnis
18 gespeichert, und die Entwicklung bzw. Auswertung der
Strichdaten wird entsprechend diesen Auswertungskodes und
Auswertungsverfahren ausgeführt. Die im Verzeichnis
gespeicherten Auswertungskodes enthalten wenigstens
Strichinformation wie Länge, Richtung, Position, Krümmung usw..
-
Es wird nun der Inhalt des die Rechteckumrißdaten
betreffenden Erkennungsverzeichnisses 18 beschrieben. Bei
beispielhafter Betrachtung der japanischen Kanji-Zeichen [ ]
und [ ] sei darauf hingewiesen, daß [ ] in einem
Teilstrukturverzeichnis von [ ] und einem Teilstrukturverzeichnis
von [ ] beschrieben ist, und daß [ ] in einem
Teilstrukturverzeichnis von [ ] und einem Teilstrukturzeichnis von [ ]
beschrieben ist. Die Schreibreihenfolgen der Teilstrukturen
[ ] und [ ] sind nicht beschränkt.
-
Obgleich die Teilstrukturen [ ] und [ ] nicht ohne
Schwierigkeit voneinander unterschieden werden können, sei
darauf hingewiesen, daß, wie in Figur 4A gezeigt, das
japanische Zeichen [ ] durch die Kombination aus der Teilstruktur
[ ] und der Teilstruktur [ ] , die sich in der erstgenannten
Teilstruktur [ ] in der Richtung nach rechts unten befindet,
gebildet ist, und daß, wie in der Figur 4B gezeigt, das
japanische Zeichen [ ] durch die Kombination aus der Teilstruktur
[ ] und der Teilstruktur [ ] , die sich unter der
erstgenannten Teilstruktur [ ] befindet, gebildet ist. Demgemäß ist
es durch Prüfen der Richtung nach oben links der Teilstruktur
[ ] vom unten rechts liegenden Punkt der Teilstruktur [ ]
oder [ ] möglich, die japanischen Zeichen [ ] und [ ]
voneinander zu unterscheiden.
-
Deshalb ist im Erkennungsverzeichnis 18 außerdem ein
Kode gespeichert, durch welchen eine Richtung zwischen einem
gewissen Punkt #m der Punkte #1 bis #8 einer gewissen
Teilstruktur und einem gewissen Punkt #n der Punkte #1 bis #8 der
nächsten Teilstruktur ausgezeichnet ist.
-
Beispielsweise werden im Fall der Figuren 4A und 4B die
Teilstriche von [ ] und [ ] geprüft. Im Fall der Figuren 4A
und 4B wird die Richtungsbeziehung zwischen den Daten #4 von
[ ] und den Daten #4 von [ ] geprüft. Für das in Figur 4A
gezeigte Zeichen [ ] sind die Daten #4 von NK, nämlich [ ] ,
unten rechts der Daten #4 von GK, nämlich [ ], angeordnet.
-
Andererseits sind für das in Figur 4B gezeigte Zeichen
[ ] die Daten #4 von NK, nämlich [ ], unten links der Daten
#4 von GK, nämlich [ ] , angeordnet. Infolgedessen ist,
obgleich die zwei Zeichen [ ] und [ ] ähnliche Teilstrukturen
aufweisen, die Schwierigkeit der Erkennung durch Bestimmung
der Richtungsbeziehung zwischen den korrespondierenden
Rechteckdaten GK und NK gemindert.
-
Wenn eine gewisse Richtung zwischen zwei Punkten durch
Verwendung der Rechteckumrißdaten unter Abtastung des
Erkennungsverzeichnisses 18 geprüft wird, werden die
Rechteckumrißdaten GK und NK aus dem Rechteckumrißdatenpuffer 16
ausgelesen, um die Richtung zwischen den in dem
Erkennungsverzeichnis 18 bezeichneten Punkten #m und #n zu prüfen. In
diesem Fall ist der Punkt #m in den Rechteckumrißdaten GK aus
dem Rechteckumrißpuffer 16 der schon geprüfte Punkt auf dem
Rechteckumriß (der Teilstruktur), während der Punkt #n der
noch nicht geprüfte Punkt auf dem Rechteckumriß ist. Die
Richtung zwischen diesen Punkten #m und #n wird geprüft.
-
Wenn die Rechteckumrißdaten und die Richtungsdaten
geprüft und Erkennungsergebnisse erhalten werden, werden die
Erkennungsdaten von der Erkennungsschaltung 17 erzeugt und in
einem Ausgabepuffer 19 sichergestellt.
-
Die Figur 5 zeigt ein Beispiel einer
Verarbeitungsroutine, der beispielsweise ein Mikroprozessor (nicht gezeigt)
folgt, welcher einige der in Figur 1 gezeigten Elemente
bildet, in denen Zeichen durch Verwendung der obengenannten
Rechteckumrißdaten gemäß dem Softwareprogramm erkannt werden.
-
Nach Figur 5 beginnt beim Starten der Eingabe eines
Zeichens in das Tablett 11 die Routine mit dem Schritt 21. Beim
Schritt 22 werden eingegebene Einzelstrichdaten
vorverarbeitet und die Charakteristik des Einzelstrichs von den
Einzelstrichdaten
als Strichdaten abgefragt und im
Strichcharakteristikpuffer 15 gespeichert.
-
Beim nächsten Schritt 23 werden Rechteckumrißdaten GK
von den auf diese Weise abgefragten Strichdaten erhalten, und
die Rechteckumrißdaten GK werden im Rechteckumrißdatenpuffer
16 bei dem mit ihnen korrespondierenden Bereich gespeichert.
Beim Schritt 24 wird bestimmt, ob die Eingabe des Zeichens in
das Tablett 11 geendet, beispielsweise das Schreiben auf das
Tablett eine vorbestimmte Zeit lang aufgehört hat oder nicht.
Wenn beim Entscheidungsschritt 24 NEIN ausgegeben wird, kehrt
die Routine zum Schritt 22 zurück.
-
Auf diese Weise werden beim Schreiben eines Zeichens auf
das Tablett 11 Strichdaten für jeden Strich im
Strichcharakteristikpuffer 15 gespeichert. Wie beispielsweise links in
der Figur 3 gezeigt werden im Rechteckumrißdatenpuffer 16 in
jedem Bereich bei jedem Strich Rechteckumrißdaten GK
gespeichert.
-
Wenn die Eingabe von Zeichendaten eines einzelnen
Zeichens in das Tablett 11 beendet ist, was beim
Entscheidungsschritt 24 durch ein JA dargestellt wird, geht die Routine
vom Schritt 24 zum Schritt 25. Beim Schritt 25 werden durch
Verwendung der im Strichcharakteristikdatenpuffer 15
gespeicherten Strichdaten die verbleibenden Rechteckumrißdaten NK
für jeden Strich im Rechteckumrißdatenpuffer 16 an ihren
jeweiligen Bereichen sequentiell gespeichert, so, wie es
beispielsweise in Figur 3 rechts gezeigt ist.
-
Die Routine geht zum nächsten Entscheidungsschritt 31,
und beim Entscheidungsschritt 31 wird bestimmt, ob das
Erkennungsverzeichnis 18 die Auswertung einer Teilstruktur
bezeichnet oder nicht. Wenn beim Entscheidungsschritt 31 JA
ausgegeben wird, geht die Routine vom Schritt 31 zum Schritt
32. Beim Schritt 32 wird die Teilstruktur durch das
Teilstrukturverzeichnis ausgewertet und beim nächsten
Entscheidungsschritt 33 wird bestimmt, ob das Auswertungsergebnis der
Teilstruktur beim Schritt 32 zufriedenstellend ist oder
nicht. Wenn beim Schritt 33 JA ausgegeben wird, geht die
Routine vom Schritt 33 zum Schritt 34. Beim Schritt 34 werden
Rechteckumrißdaten GK der erfolgreichen Teilstruktur im
Puffer 16 gespeichert.
-
Die Routine geht zum nächsten Entscheidungsschritt 35.
Beim Entscheidungsschritt 35 wird bestimmt, ob die nächste
Teilstruktur ausgewertet wird oder nicht. Wenn die Antwort
beim Schritt 35 JA ist, kehrt die Routine vom Schritt 35 zum
Schritt 31 zurück und die Schritte 31, 32, 33 und 34 werden
wiederholt.
-
Wenn andererseits beim Schritt 35 NEIN ausgegeben wird,
geht die Routine vom Schritt 35 zum Schritt 36. Beim Schritt
36 wird das Ergebnis der Abtastung des
Erkennungsverzeichnisses 18, d.h., der Zeichenkode des Erkennungsergebnisses, im
Ausgabepuffer 19 gespeichert. Beim nächsten
Entscheidungsschritt 37 wird bestimmt, ob die Abtastung des
Erkennungsverzeichnisses 18 beendet ist. Wenn beim Schritt 37 NEIN
ausgegeben wird, kehrt die Routine vom Schritt 37 zum Schritt 31
zurück und es werden die Schritte 31 bis 37 wiederholt. Wenn
festgestellt wird, daß die Abtastung des
Erkennungsverzeichnisses 18 beendet ist, was beim Schritt 37 durch JA
wiedergegeben wird, wird die Routine mit dem Schritt 38 beendet.
Infolgedessen wird das Zeichen des Erkennungsergebnisses auf
einem Anzeigegerät (nicht gezeigt) angezeigt.
-
Wenn das Auswertungsergebnis nicht befriedigend ist, was
beim Entscheidungsschritt 33 durch NEIN dargestellt wird,
geht die Routine vom Schritt 33 zum Schritt 37.
-
Wenn die Teilstruktur nicht ausgewertet wird, was beim
Entscheidungsschritt 31 durch ein NEIN dargestellt wird, geht
die Routine vom Schritt 31 zum nächsten Entscheidungsschritt
41. Beim Entscheidungsschritt 41 wird bestimmt, ob die
Richtungsdaten zwischen zwei Teilstrukturen ausgewertet werden
oder nicht. Wenn beim Schritt 41 JA ausgegeben wird, geht die
Routine vom Schritt 41 zum Schritt 42. Beim Schritt 42 wird
die Richtungsbeziehung zwischen den beim Schritt 34
gespeicherten Rechteckumrißdaten GK der im Rechteckumrißdatenpuffer
16 gespeicherten Rechteckumrißdaten GK und NK und den das
Paar mit den erstgenannten Daten bildenden Rechteckumrißdaten
NK bestimmt. Beim nächsten Entscheidungsschritt 43 wird
bestimmt,
ob das Ergebnis beim Schritt 42 zufriedenstellend ist
oder nicht. Wenn beim Schritt 43 JA ausgegeben wird, geht die
Routine vom Schritt 43 zum Schritt 35. Wenn andererseits das
Ergebnis nicht zufriedenstellend ist, geht die Routine vom
Schritt 43 zum Schritt 37.
-
Wenn beim Entscheidungsschritt 41 des weiteren
festgestellt wird, daß die Auswertung nicht die Richtungsbeziehung
zwischen zwei Teilstrukturen ist, geht die Routine vom
Schritt 41 zum Schritt 51. Beim Schritt 51 wird die
Auswertung durch ein anderes Verfahren ausgeführt und bei diesem
nächsten Entscheidungsschritt 52 wird das Auswertungsergebnis
geprüft. Solche anderen Verfahren beziehen sich auf bekannte
Zeichenerkennungsverfahren, die keine Teilstrukturerkennung
und nicht die Erkennung von Richtungsbeziehungen zwischen den
Daten m und n benötigen.
-
Wenn das Auswertungsergebnis zufriedenstellend ist, was
beim Schritt 52 durch JA wiedergegeben wird, geht die Routine
vom Schritt 52 zum Schritt 35. Wenn dagegen beim Schritt 52
NEIN ausgegeben wird, geht die Routine vom Schritt 52 zum
Schritt 37.
-
Wie oben beschrieben können handgeschriebene Zeichen
erkannt werden. Insbesondere werden die auf diese Weise
ausgewertete Teilstruktur und die noch nicht ausgewertete
Teilstruktur erhalten und es wird die Richtungsbeziehung zwischen
diesen zwei Teilstrukturen ausgewertet, um das eingegebene
handgeschriebene Zeichen zu erkennen, so daß die
Teilstrukturen stabil ausgewertet werden können und die
Erkennungsgeschwindigkeit erhöht werden kann, auch wenn die
Strichreihenfolgen innerhalb der Teilstrukturen nicht gleich sind. Auch
kann eine Interferenz oder Störung zwischen Zeichen reduziert
und deshalb das Erkennungsverhältnis erhöht werden.