WO1999016013A1

WO1999016013A1 - Dispositif de reconnaissance de caracteres

Info

Publication number: WO1999016013A1
Application number: PCT/JP1998/004255
Authority: WO
Inventors: Toshimi Yokota; Soshino Kuzunuki; Masaki Miura; Keiko Gunji; Koyo Katsura
Original assignee: Hitachi, Ltd.
Priority date: 1997-09-22
Filing date: 1998-09-22
Publication date: 1999-04-01
Also published as: US6718060B1; CN1279796A; JPH1196301A; KR20010024208A; TW402711B

Description

明細書文字認識装置技術分野

本発明は手書き文字をオンラインで認識する手書き文字認識装置に関する。背景技術

特開平 2— 5 6 6 8 9号公報に、くずし字や続け書きされた文字を認識する技術が記載されている。詳しくは、文字を構成する座標点列から一方向の直線を抽出する。抽出した直線についてソートを行い、長い直線をサブストローク S 1として抽出する。次にこの抽出した以外の部分をサブストローク S 2とする。そして、この S l， S 2の位置や、形状に基づいて辞書に該当するものがあるか判定を行って認識を行う。

上記従来技術では、文字パターンが構成される座標列で構成されるストロークの形状や配置に基づいて認識を行っている。し力、しな力ら、全ての座標列に基づいて認識を行うために次のような問題がある。

一般に続け書きや、くずし字を認識できないのは、入力された文字パターンと、辞書に格納された文字ノ、"ターンとが異なるためである。続け書きをした場合には、余計な入力が入力されたり、辞書に格納されている文字パターンと形が全く異なつたものとなったりする。従って、続け書きされた文字を認識するためには入力された文字パターンのうち、どの部分が認識に必要な部分であり、どの部分が認識に不要な部分であるかを分ける必要があり、全ての座標に基づいて認識を行つても続け書きされた文字を、好適に認識することができない。

本発明の目的は、かかる問題を解決し、ラフに書いたために、続け書きで、し力、も筆順もでたらめで、変形を含む文字であっても認識でき、しかも認識処理の負荷が小さい文字認識装置を提供することにある。

発明の開示

上記目的を達成するため本発明は、手書き文字を入力し、座標点列を出力する入力部と、複数の文字コードと、各々の文字コードに対応する文字パターンとを格納する辞書と、入力部から出力される座標列から、この文字を構成する複数の要素に分解する要素分解部と、辞書に格納されたそれぞれの文字夕一ンについて、辞書に格納された文字パターンの要素と入力された文字パターンの要素について対応する距離値を求め、対応しない要素に基づいて求めた距離値を修正するマッチング部と、距離値の小さい文字パターンを表示部に表示する処理部とを有することを特徴とする。

図面の簡単な説明

図 1は本システムの構成を示した図である。図 2は従来例の文字認識の概要を示した図である。図 3は本発明の文字認識の概要を示した図である。図 4は本システムの処理の全体を示した図である。図 5は図 4の楔形近似の処理を示した図である。図 6 Aおよび 6 Bは図 5の縦横要素分解の処理を示した図である。図 7 A— 7 Cは図 4の入力辞書とのマッチングの処理を示した図である。図 8 Aおよび 8 Bは図 7 A— 7 Cの特徴要素の A N Dをとる距離値の算出の処理を示した図である。図 9は詳細識別の処理を示した図である。図 1 O Aおよび 1 0 Bは画不足チェック処理を示した図である。図 1 1はリンクチェック処理を示した図である。図 1 2は筆方向チヱック処理を示した図である。図 1 3 A— 1 3 Cは処理の概要を説明するための図である。図 1 4は処理の概要を説明するための図である。図 1 5 A— 1 5 Fは処理の概要を説明するための図である。

発明を実施するための最良の形態

以下、図面に従って本発明のオンライン手書き文字入力装置を説明する。

図 1に、本発明のオンライン手書き文字入力装置を示す。液晶タブレツト 1 1 0は、入力部と表示部とから構成され、ユーザーがこの上に手書きで入力すると、これを検出し、時系列の座標点列としてペンマネージャ 1 2 0にわたす。ペンマネージャ 1 2 0は、液晶タブレット 1 1 0より時系列の座標点列を受け取り、ァプリケーション 1 3 0の定義する液晶タブレツ卜 1 1 0上の領域属性にしたがつて、もし、座標点列が文字認識すべき領域属性にあれば、前処理部 1 4 0に、この座標点列をわたす。アプリケーション 1 3 0はアプリケーションプログラムを実行し、液晶タブレツト 1 1 0上の領域をいくつかに分割して領域属性を定めるもので、例えば、画面の一部を、文字入力領域と定める。前処理部 1 4 0は、ぺンマネージャ 1 2 0より時系列の座標点列を受け取り、筆速が早かった部分はまばら/遅かった部分は密になっている座標点列をリサンプル処理して座標点列の密度を一定にし、さらに、位置とサイズを正規化する。このように、位置及びサィズが正規化され、密度が一定になった座標点列は楔形近似部 5に入力される。楔形近似部 1 5 0は、要素分解部】 5 1，要素並替部 1 5 2から構成されている。

要素分解部 1 5 1は、前処理部 1 4 0で密度が一定になった座標点列から、パターンマッチングを行うための線分を生成する。生成された線分は、要素並替部 1 5 2にわたされ、ここでは筆順でたらめで書いた文字でも、その位置によって辞書と対応を付けられるようにするために上または下方向の線分要素をその位置によって、上から順に並べ、右または左方向の線分要素を左から順に並べたり、線分要素の長さの順に並べる。そして、その位置順結果を、保持すると共に、線分要素列と線分位置順結果をマッチング部 1 7 0にわたす。

マッチング部 1 7 0は、楔形近似部 1 5 0から送られる線分要素列，線分位置順結果に基づいて辞書とのマッチングを行い、液晶タブレツト 1 1 0から手書き入力された文字パターンに近い文字を辞書から出力し、液晶タブレット 1 1 0の表示部に表示するものである。尚、辞書 1 6 0には、文字パターンの座標点列を、前処理部 1 4 0および楔形近似部 1 5 0にかけて得られる線分要素列を、文字コ一ドと対応付けて保持している。

マッチング部 1 7 0は、マッチング管理部 1 7 1 , 入力された文字パターンの線分要素列と、辞書に格納されている文字、。ターンとの距離値を求める A N D処理部 1 7 2と、辞書のみに存在する線分要素を抽出し、距離値を修正する辞書距離値修正部 1 7 3 , 入力パターンのみに存在する線分要素を抽出し、距離値を修正する入力距離値修正部 1 7 4， A N D処理部1 7 2，辞書距離値修正部 1 7 3 , 入力距離値修正部 1 7 4から得られた距離値に基づいて認識結果を抽出し、液晶タブレット 1 1 0の表示部に出力する認識結果出力部 1 Ί 5からなる。

マッチング管理部 1 7 1は、辞書 1 6 0から 1つずつ辞書に格納されている文字パターンを読み出して、以下、 A N D処理部1 7 2，辞書距離値修正部 1 7 3，入力距離値修正部 1 7 4により入力の文字パターンとの距離値を算出する。まず、楔形近似部 1 5 0と辞書 1 6 0から入力の文字パターンと辞書の文字パターンの線分要素列を受けて、 A N D処理部1 7 2，辞書距離値修正部 1 7 3 , 入力距離値修正部 1 7 4にわたし入力の文字パターンと辞書の文字パターンとの距離値を修正しながら算出し、最後に辞書パターンの I Dまたは文字コードと、その距離値を認、識結果出力部 1 7 5にわたす^

A N D処理部1 7 2は、縦の線分要素または横の線分要素と別々に、辞書バターンの線分要素列と入力パターンの線分要素列を比較したときに、位置（要素並替部 1 7 1の並べ替え後の 1頃位）力近い辞書の文字パターンの線分要素と入力の文字パターンの線分要素とを対応させ、（1 ) 入力の文字パターンに対応する線分要素が辞書の文字パターンにある、（2 ) 入力の文字パターンに対応する線分要素が辞書の文字パターンにない、（3 ) 辞書の文字パターンに対応する線分要素が入力の文字パターンにない場合の 3種類に分類して、これらの間でそれぞれ距離値を求めて、この総和を最終的な距離値とする。（2 ) と（3 ) については、辞書距離値修正部 1 7 3 , 入力距離値修正部 1 7 4により、後で詳細に距離値を求めるため、ここでは、一定値の距離値としておく。処理の結果としての、線分要素の対応付けと、線分要素間の距離値をマッチング管理部 1 7 1を介して辞書距離値修正部 1 7 3にわたす。ここで、距離値が大きくなり過ぎたら、その辞書パターンについての処理は打ち切って、この旨をマッチング管理部 1 7 1にわたしてもよい。辞書距離値修正部 1 7 3は、入力された文字パターンの変形を考慮することにある。変形や続け書きが高じて省略力生じたとき、辞書の文字パターンには線分要素とされていても入力の文字パターンには対応する線分要素がない場合がある。そのため、 AN D処理部 1 7 2の結果、辞書の文字パターンの線分要素で対応する入力パターンの線分要素がないものについて、（1 ) まず、入力の文字パターンの線分以外の線分要素に対応するものがあるか探索し、あれば、これとの距離値を得る。（2 ) なければ、辞書の文字パターンのその線分要素の大きさに応じた距離値とする。そして、 A N D処理部 1 7 2で一定値を与えていた距離値をこれに置き換える。大きさに応じた距離値とするのは、大きい線分要素は省略されにくいが、小さい線分要素は省略され易いからである。そして、 A N D処理部 1 7 2で一定値を与えていた距離値をこれに置き換える。処理の結果としての、線分要素の対応付けと、線分要素間の距離値をマッチング管理部 1 7 1を介して入力距離値修正部 1 7 4にわたす。

入力距離値修正部 1 Ί 4も、入力文字の続け書きを考慮することにある。続け書き力《生じたとき、その部分に相当する線分要素で、入力の文字パターンには線分要素とされていても、辞書の文字ァ、°ターンには線分要素がない。そこで、入力の文字パターンを筆順の線分要素列で見たとき、辞書の文字パターンと対応付けできなかった線分要素の前後に、辞書の文字パターンと対応付けできている線分要素があれば、その辞書の文字パターンの線分要素を連結する位置に、入力の文字パターンのその線分要素があるのであれば、その線分要素は続け書きの部分と解釈できる。続け書きと解釈できれば、小さい距離値を与え、できなければ、大きい距離値を与える。そして、 A N D処理部 1 7 2で一定値を与えていた距離値をこれに置き換える。処理の結果としての、線分要素の対応付けと、線分要素間の距離値をマッチング管理部 1 7 1にわたす。

認識結果出力部 1 7 5は、マッチング管理部 1 7 1力、ら、辞書の文字パターンの I Dまたは文字コードと、その距離値を得ると、距離値の小さいものを選び出し、距離値の順に並べ認識結果とする。そして、その認識結果をいつたん詳細識別部 1 8 0にわたし再度返ってきた認識結果を得ると、それをペンマネージャ 2 出力" 5な。

詳細識別部 1 8 0は、要素分解部 1 5 1によって線分要素に分けた線分要素列では消えてしまう文字の特徴で認識結果の順位を入れ換えることにある。詳細識別部 8は、認識結果出力部 1 7 5力、ら、認識結果として、距離値の小さい辞書パターンの I Dまたは文字コードと、その距離値を得ると、各辞書パターンの詳細な特徴について入力パターンを調べ、必要あれば認識結果順位を入れ換えて、結果を認識結果出力部 1 Ί 5にわたす。

以下、本実施例の動作手順を示す。

図 4は、本発明のオンライン手書き文字入力装置全体の処理フ口一を示したものである。

処理 4 0 1で液晶タブレット 1 1 0，ペンマネージャ 1 2 0，アプリケーション 1 3 0によりユーザーが手書き入力した文字パターンを時系列の座標点列として取り込む。処理 4 0 2， 4 0 3では、前処理部 1 4 0により、筆速が早かった部分はまばら Z遅かった部分は密になつている座標点列をサンプリング処理して座標点列密度を一定にする。さらに、位置とサイズを正規化する。位置とサイズの正規化は、例えば、入力された文字パターンの座標点列から文字パターンの重心を求め、この重心と原点とを重ねようにパターンを平行移動して位置を正規化し、重心（二原点）から各座標点までの距離の平均値が一定値になるように拡大または縮小してサイズを正規化する。

次に処理 4 0 4で楔形近似部 1 5 0により楔形近似処理を行う。

楔形近似処理については、図 5に示すように入力パターンを縦横の線分要素に分解する縦横要素分解処理 5 0 1を行い、縦横の線分要素に分解された線分を並び替える要素並替処理 5 0 3を行う。

図 6 Aに縦横要素分解処理 5 0 1の処理フ口一を示す。

処理 6 0 1で、入力された文字パターンから X軸， y軸方向の局部的な M I N ノ MA X値を取る点および始終点を抽出しながら線分を決定する。つまり、図 1 5 Aに示すようにユーザ一によつて入力された始点 aから座標点列に沿つて移動すると、点 bで y軸が最小となる。次に点 bを始点として座標点列に従って移動すると点 cで y軸が最大となる（図 1 5 B) 。このようにして X軸， y軸方向の局部的な M I N/MA X値を求めると図 1 5 Cのようになる。

しかしながら、 X軸， y軸方向の局部的な M I NZMA X値をとつて求めた点を結ぶと図 1 5 Dに示すように、明らかにユーザーが入力した文字パターンとは異なる。そこで、この図 1 5 Cに示した文字パターンをユーザ一が入力した文字パターンに近づける処理を処理 6 0 2〜処理 6 0 4にて行う。

処理 6 0 2〜6 0 5では、求めた点で構成される線分毎に、線分と元のスト口一クを構成する座標点列との長さの比が予め定めたしきい値 aより小さければ、線分による近似が不十分であると判断し、元のストロークの中点を近似点として捕間する。図 1 5 Eでは、線分 1が元のストローク 2との長さの比が予め定めたしきい値よりも小さいために近似点 dが補間されたところを示している。このようにして補間したものが図 1 5 Fである。

最後に処理 6 0 6で処理 6 0 1〜6 0 5で得られた点間をつないで線分列を求める。

尚、近似点を補間する処理としては、図 6 Bに示すように線分要素と元のストロークで囲む面積を求め、この面積が予め定めたしき、値よりも大きいときに近似点を補完するようにしてもよい。

このようにして求められた線分列ほ、図 5の処理 5 0 2で並べ替えが行われ、図 4の処理 4 0 5で入力と辞書とのマッチングを行う。

この入力と辞書とのマッチング処理 5 0 5の詳細を図 7 Aに示す。

ここでは、線分列と全ての辞書パターンとの距離値を求める。処理 7 0 1では、線分列と辞書パターンと一致する要素の距離値を求める。たとえば、図 7 Aの入力楔形で示した文字パターンと、辞書楔形で示した文字パターンであれば、図 7

Bの太線部分が、 2つのパターンの一致する A N D部分であり、この部分の距離値を算出する。

この特徴要素の A N Dをとる距離値を算出する処理 7 0 1を詳細に示したものが図 8 Aおよび 8 Bである。

処理 8 0 1で dist— cpl， dist— i— sng， dist— d— sng を初期化する。ここで、 dist— cpl は入力パターンの線分の要素と辞書パターンの要素とで対応付けできたものについての距離値を保持する変数である。図 7 Bの例で言えば、太線で示した部分の距離値である。 di st— i— sng は辞書パターンの要素と対応付けできなかった入力パターンの要素についての距離値を保持する変数である。図 7 Bの例で言えば入力パターンの細い線で示した部分である。 dist— d— sng は入力パターンの要素と対応付けできなかった辞書パターンの要素についての距離値を保持する変数である。

次に処理 8 0 2〜 8 0 4で cpl — i ( i ) を— 1で初期化する。 cpl ― i ( i ) は、入力パターンの線分の要素 iと対応付けできた辞書パターンの要素番号 jを保持する変数である。そして、要素の筆方向別に →†—の 4方向に分類する。この分類は後の処理 8 1 0で入力パターンの要素 iと対応付けする辞書パターンの要素 jを探す際に、同じ分類の中から探すことで高速に探すことができるためである。尚、分類はしなくても良い。

次に、処理 8 0 5で、分類された要素毎に線分の長さでソートしておく。このソートは処理 810で入力パターンの要素 iと対応付けする辞書パターンの要素 jを探す際に、ここでソ一トした順に探すことで高速に探すことができるためである。尚、ソートはしなくてもよい。

次に処理 806〜808で、辞書パターンについて、処理 802〜804と同様に、 cpl— d (j)を— 1で初期化し、要素の筆方向別に →†—の 4方向に分類する。

次に、処置 810〜814でマッチングを行う。まず処理 810で、入力バターンの要素 iと対応付ける辞書パターン要素 jを探すために、入力パターンの要素 iと同じ筆方向に分類されている辞書パターンの要素 jでかつ cpl— d (j) =ー1、すなわちまだどの入力要素とも対応付けされていない要素の中で最も距離値が小さいものを探す。距離値はたとえば、入力パターン要素 iが始点

(X i s， y i s) , 終点（x i e， y i e) ，辞書パターン要素 jが始点 (x j s， y j s) , 終点（x j e， y j e) で表される線分であるとき、次式のように算出する。

距離値（ i， j) =

= *( I x i s— x j s I + I y i s— y j s l + l x i e— x j e l

+ l y i e— y j e | ) +

b*( | ( x i e— x i s ) 一 (x j e— x j s ) I + I ( y i e— y i s ) - ( y j e - y j s ) I

ここで上式の第 1項は入力の文字パターンの線分 iの位置と辞書の文字バタ一ンの線分 jの位置についての差を求めるためであり、筆順情報を用いずに認識する場合は必ず必要である。使わないと図 13A—13 Cに示すような入力パターン「三」を識別することができない。

処理 81 1では、処理 810で得た距離値（i， j ) をしきい値と比較して、 (i， j ) の対応付けが正しいかどうかを判定する。これは図 14に示すように手ぶれ等から入力されたノィズ部分の要素同士が対応付けられて大きな距離値となって誤認識してしまうことを防ぐ効果がある。処理 81 1で対応付けが正しいとされた場合は、処理 812で cpl— i( i) と cpl— d (j) を互いの要素番号 jと iに設定し、 dist— cpl に距離値（i， j) を加算する。また、処理 81 3で対応付けが正しくないとされた場合は処理 8 1 4で dist— i— sng に入力パターン要素 iが対応付けできなかったことに相当する距離値として要素 iの長さを加算する。長さ以外に定数を用いても、長さをパラメータとする関数を用いてもよい。

長さをパラメータとする関数を用いれば、図 1 4のようなノイズ要素の場合の距離値を抑えることができ、文字の大き、部分を占める線分の対応付けできなかた場合には大き L、距離値を与えることができるため効果的である。

次に処理 8 1 5 8 1 7で、辞書パターンの全ての線分 j = 0 Jについて、 cpl— d ( j ) を調べて— 1、すなわち入力の文字パターンの線分と対応付けできない線分について処理 8 1 4と同様に処理 8 1 7で距離値を di st— d— sng に加算する。

このようにして、入力の文字ターンと辞書の文字、"ターンとの対応する特徴についての距離値を算出する。

次に、図 7 Aの処理 7 0 2で辞書のみ線分の探索を行い、距離値を算出し直す。図 7 Cの例では辞書の文字パターンの線分で入力の文字パターンの線分と対応つかず残っているものはないが、あれば次に説明する処理 7 0 3の場合と同様に処理する。

処理 7 0 3で入力のみ特徴要素の探索を行い、距離値を算出し直す。たとえば、図 7 Cの入力の文字パターンと辞書の文字パターンであれば、図中の太線部分で示す入力パターンの特徴要素の太線で示す部分 1 2 1 4等が、辞書パターンの要素と対応つかず残っている。 1 2は、辞書パターンの要素と対応が付いている 1 1と 1 3の間に入力されており、 1 1と 1 3と対応が付いている辞書パターンの要素を続け書きした部分と解釈できるため、そう解釈できない場合の 1 2に関する距離値より小さい値を与えるようにすると、続け書き文字も認識しやすくなる。

このようにして、入力パターンと辞書パターンとの間で求めた距離値に基づいて図 4の処理 4 0 6の詳細識別を行う。

つまり、処理 4 0 4で文字を上下左右の縦棒と横棒に分類しているために力一ブと角との違いなどパターンの曲がり具合にっ、ての特徴は消えてしまう。そこで、この処理 406によって、辞書 1 60とは別の詳細識別辞書を用意しておき、楔形近似によって同形状に近似される文字が認識結果に含まれている場合は、この詳細識別辞書により各辞書の文字パターンの詳細な特徴について入力の文字パタ一ンを調べ、必要あれば認識結果順位を入れ換える処理を行う。

この詳細識別処理 406の処理フ π—を図 9に示す。

入力と辞書とのマッチング処理 405によって得た距離値の小さい順に上位 N 位までの辞書の文字パターンについてこの詳細識別を行う。まず、処理 90 1〜 905で距離値の小さい順に上位 N位までの辞書の文字パターンについて画不足チェック 90 1，リンクチェック 902，筆方向チェック 903，角 /"カーブのチェック 904を ί亍ぅ。

図 1 0 Αおよび 1 0 Bは画不足チヱック 90 1の処理フローを示したものである。この処理は、図 1 OAに示す「ぐ」の濁点のように小さい要素であっても不足した場合に大きなペナルティを距離値に加算することである。まず、処理 1 0 0 1で距離値 distを 0で初期化する。また、処理 1 002でリンク情報 link

[ ] [ ] を一 1で初期化する。

そして処理 1 003〜 1 008で全ての要素の折れ線の組み合わせについて 1 003〜1 007で端点どうしが一致している、すなわち、リンクしている線分について、そのリンク情報を 1 004または 1 006によって link [ ] [ ] に設定する。 link [i] [0] には線分 iの始点に終点が接している線分の番号を、また、 link [i] [1] には要素 iの終点に始点が接している線分の番号を設定する。すると、同じ画数として入力された要素は、 link [i] [1] を参照して一つながりにたどることができ、画の始点は link [i] [0] =ー 1の値を取る。

そこで、処理 1 0 1 0〜 1 0 1 3により、 link [ i ] [0] =- 1の値の線分を探し、画頭（k) にその線分番号を設定する。そして、処理 1 0 1 5〜1 02 0により、画（k) に含まれる線分全てが対応付けられていない場合は、画 (k) の総長をペナルティとして距離値に足し込む。処理 1 0 1 7では濁点が非常に小さく入力される場合を考慮して、しきい値より小さい場合は、画（k) の総長ではなくしきい値をペナルティとして距離値に足し込む。処理 1 0 1 5では、線分番号 i =画頭（k ) から l ink [ i ] [ 1 ] を参照することで画に含まれる全ての線分をたどりながら cpl — i ( i ) または cpl — d ( j ) が— 1かどうかで画（k ) に含まれる線分全てが対応付けられていないかを調べる。処理 1 0 1 6 も同様に l ink [ i ] [ 1 ] を参照して一つながりにたどりながら全ての線分の長さを足し込んで画の総長を求める。一ここでは、そのリンク情報を調べて l ink [ ] [ ] に設定しているが、図 5の処理 5 0 3での要素並べ替え前に、画に含まれる線分番号を l ink [ ] [ ] に設定してもよい。この場合は辞書パターンについても l ink [ ] [ ] 情報を保持しておくと辞書容量力く増えてしまうので、入力パターンは要素並べ替え前に l ink [ ] [ ] 情報を設定しておき、辞書パターンだけ図 1 0の処理 1 0 0 6または 1 0 0 8によって l ink [ ] [ ] に設定しても良い。

図 1 1は図 9のリンクチエツク処理 9 0 2の処理フローを示したものである。この処理は、図 1 1に示す「レ」やこれに似たパターンのように要素のリンク状況が違う場合に相当するペナルティを距離値に加算することである。 a ) のように辞書の文字バタ一ン入力の文字パターンの、一方では接続して 1つの画をなしている力もう一方では 2つの画にわかれ、しかも違う要素と接続している場合には最大のペナルティを与える。違う要素と接続していない場合には、 1つの画の方は続け書きしたと考えられるので小さめのペナルティにするとよい。 b ) のように辞書の文字パターン Z入力の文字パターンの、一方では接続している力もう一方では違う要素を挟んで接続している場合にもペナルティを与える。この時、挟んでいる違う要素の長さが一定値以下のときは一定値、それ以上の時は要素の長さに応じたペナルティを与えると良い。 c ) のように同じ接続の場合はべナルティを与えない。

本発明は、筆順がでたらめでも認識できる文字認識技術であるが、筆順しか違わない全く同じパターンを識別する場合には、このリンク状況チヱックの処理で、筆順情報が一致しているかどうかを辞書、。ターンと入力パターンについて調べれば良い。

図 1 2は図 9の筆方向チヱック処理 9 0 3の処理フローを示したものである。この処理は、筆方向が逆に入力された場合でも文字を認識することである。まず、処理 1 2 0 1で全ての要素の筆方向を→ に揃える。全ての要素が縦棒 Z横棒ならば ΐはに、は→に変換し、変換情報を記憶しておく。斜め方向の要素があれば、縦棒 Ζ横棒の何れかに分類して同様に変換する。そして、処理 1 2 0 2で図 7 Αに説明した入力と辞書とのマツチングを行う。全ての辞書ノ、"ターンと行つてもよいし、候補の上位の辞書バタニンとのみ行ってもよい。そして、処理 1 2 0 3〜1 2 0 6で、筆方向が不一致のもの、すなわち、元の筆方向とは違う要素について、ペナルティを与える。

尚、処理 9 0 3の前に、これを実施するかどうかを（1 ) 入力パターンの要素の筆方向に†， —が多いか？（ 2 ) 候補順位が上位の距離値が大きく正解候補でないのでないか？の 2点を調べて、そうである場合だけ実施すれば、処理時間を節約できる。

このようにして候補に上がった辞書パターンについて画不足チヱック処理，リンクチヱック処理，筆方向チェック処理，画ダカ一ブのチヱック処理を行つた後に、処理 9 0 6で距離値の小さい順に候補順位を見直しする。

このように図 4の詳細識別処理 4 0 6によって処理された結果に基づいて認識結果として距離値が小さいものから認識結果として出力する（処理 4 0 7 ) 。産業上の利用可能性

以上説明したように本発明によれば、ラフに書いたために、続け書きで、しかも筆順もでたらめで、変形を含む文字であっても認識でき、しかも認識処理の負荷が小さい文字認識装置を提供できる。

Claims

請求の範囲

1. 手書き文字を入力し、座標点列を出力する入力部と、

複数の文字コ一ドと、各々の文字コ一ドに対応する文字パターンとを格納する辞書と、

上記入力部から出力される座標列から、この文字を構成する複数の要素に分解する要素分解部と、上記辞書に格納されたそれぞれの文字パターンについて、辞書に格納された文字パターンの要素と上記入力された文字パターンの要素について対応する距離値を求め、対応しない要素に基づいて上記求めた距離値を修正するマッチング部と、距離値の小さい文字パターンを表示部に表示する処理部とを有することを特徴とする文字認識装置。

2. 請求項 1において、

上記要素分解部は、上記座標点列から複数の線分を生成し、上記マッチング部では、上記生成された線分が長い順に上記辞書に格納された文字パタ―ンの線分との距離値を求めることを特徴とする文字認識装置。

3. 請求項 1において、

上記要素分解部は、上記座標点列を順に追跡し、 X軸， Y軸の少なくとも一方が最大又は最小の値を端点とする線分に分解することを特徴とする文字認識装置。

4. 請求項 3において、

上記要素分解部は、上記 X軸， Y軸の少なくとも一方が最大又は最小の値を端点とする線分と上記座標点列を結んで構成したストロークの長さを比較し、この比較結果に基づいて上記線分の中点を端点とする 2つの線分に分解することを特徴とする文字認識装置。

5. 請求項 1において、

上記マッチング部は、上記文字パターンを構成する線分と、上記辞書に格納された文字パターンを構成する線分とを方向別に分類し、この分類された線分ごとに距離値を求めることを特徴とする文字認識装置。

6. 請求項 1において、

上記マッチング部は、上記入力された文字パターンの要素と上記辞書に格納された文字パターンの要素の対応を得た後、入力パターンあるいは辞書パターンの要素からなる画に、含むどの要素にも対応する要素がない場合、含むどれかの要素に対応する要素がある場合とくらベて、距離値を大きく与えることを特徴とする文字認識装置。

7. 請求項 1において、

上記マツチング部は、上記入力された文字パターンあるいは上記辞書に格納された文字パターンの要素間の接続情報を保持し、上記入力された文字パターンの要素と上記辞書に格納された文字パターンの要素の対応を得た後、要素間の接続情報を比較して、不一致の場合は、距離値を大きく与えることを特徴とする文字認識装置。

8. 請求項 1において、

上記マッチング部は、上記入力された文字ターンあるいは上記辞書に格納された文字タ一ンの要素を一定方向に変換した後、上記入力された文字、。ターンの要素と上記辞書に格納された文字パターンの要素のマッチングを行うことを特徴とする文字認識装置。

9. 請求項 8において、

上記マッチング部は、上記入力された文字、。ターンあるいは上記辞書に格納された文字タ一ンの要素を一定方向に変換する前に上記入力された文字、°ターンあるいは上記辞書に格納された文字、°タ一ンの要素の本来の筆方向を保持し、上記入力されたパターンの要素と上記辞書に格納された文字タ一ンの要素のチングを行って対応付けした後、要素の本来の筆方向を比較して、不一致の場合は、一致の場合より距離値を大きく与えることを特徴とする文字認識装置。

1 0. 請求項 1において、

上記マッチング部は、上記入力された文字、°ターンあるいは上記辞書に格納された文字パターンの要素について最も距離値が小さい上記辞書に格納された文字パターンあるいは上記入力された文字、'ターンの要素との対応は、前記距離値が一定値より大きい場合は、対応なしとすることを特徴とする文字認識装置。