JPH09114926A

JPH09114926A - オンライン文字認識における入力文字大分類方法および装置

Info

Publication number: JPH09114926A
Application number: JP7265882A
Authority: JP
Inventors: Yukimitsu Fujimori; 幸光藤森
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1995-10-13
Filing date: 1995-10-13
Publication date: 1997-05-02

Abstract

(57)【要約】【課題】入力文字のストローク数及び入力文字の座標
データ列から抽出した特徴点から算出した特徴量にを相
補的に用いて大分類を行うことにより、入力文字の画数
や筆順を制限しないオンライン文字認識における入力文
字大分類方法および装置を提供する。【解決手段】座標データ列発生処理１１により得られ
たペンのオン・オフ情報を含んだ入力文字の座標データ
列から、まずストローク数計数処理１２によりストロー
ク数を算出する。次に、正規化処理１３により入力文字
の座標データ列を正規化し、特徴点抽出処理１４におい
て特徴点を抽出する。その後、特徴量算出処理１５によ
り特徴点から得られた特徴量を算出し、大分類処理１６
において、得られたストローク数及び特徴量と、大分類
辞書１７に記されたストローク数及び特徴量を比較する
ことにより、認識候補文字を選出し、入力文字大分類を
行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、楷書だけでなく、
続け字や誤まった筆順で書かれた文字をも認識するオン
ライン文字認識における入力文字大分類方法および装置
に関する。

【０００２】

【従来の技術】文字大分類処理は、文字認識を行う前
に、入力文字パタンのある特徴をもとに辞書から認識候
補文字をある範囲に絞って選出し、入力文字パタンと認
識候補文字のみの辞書パタンとを照合させることで照合
回数を削減し、文字認識を高速に行う処理である。

【０００３】たとえば、走り書きすることによって続け
字となってしまった文字に対応する入力文字大分類とし
ては、特公平４−５２３１（以下、第１の従来技術とい
う）に記載されるように、辞書中の各文字毎に変動が予
想されるストローク数範囲をあらかじめ辞書中に記して
おき、辞書中に記されたストローク数範囲が入力ストロ
ーク数を含む文字のみを認識候補文字とする方法があ
る。ここで、ストローク数とは、ペンオン（ペンが入力
面に接した状態）からペンオフ（ペンが入力面から離れ
た状態）までの筆記部分の数であり、一般には文字の画
数に相当するものである。

【０００４】すなわち、この第１の従来技術は、たとえ
ば、「い」という文字は楷書で書けば、ストローク数は
「２」であるが、続け字で書けばストローク数は「１」
となり、この「い」という文字のストローク数範囲は
「１」〜「２」ということになる。このような、各文字
のストローク数範囲を辞書中に記しておき、入力文字の
ストローク数がたとえば「２」であったら、この「２」
を含むストローク数範囲を有する文字を総て認識候補も
字として取り出すものである。

【０００５】また、この第１の従来技術とは別に、特開
平２−７５０８９（以下、第２の従来技術という）に記
載されるように、オペレータの筆順に沿って取り出され
る入力文字の座標値を基に特徴点を検出し、その特徴点
毎にセグメントに分割し、そのセグメント長の平均値を
求め、この入力文字のセグメント長の平均値と、予め算
出された標準パターンのセグメント長（標準的な筆順で
書かれた場合のセグメント長）の平均値とを比較するこ
とにより、候補文字を選出する方法などがある。これら
により、オンライン文字認識装置は認識速度を向上させ
ていた。

【０００６】

【発明が解決しようとする課題】前述の第１の従来技術
は、入力文字のストローク数が予め設定された範囲内に
収まる程度の続け字であれば、その入力文字に対応した
認識候補文字を取り出すことができるが、走り書きの度
合いが大きく、設定したストローク数範囲外の書き方を
した続け字は、ストローク数が予め設定された範囲から
外れるため、大分類の段階でその入力文字に対する認識
候補文字を取り出すことができなくなり、正確な認識が
できなくなってしまう。たとえば、「寿」という文字の
場合、楷書で書いたときのストローク数は「７」である
が、極端な例として一筆書き的に書くことも可能であ
り、一筆書き的に書いた場合のストローク数は「１」で
ある。

【０００７】しかし、「寿」を一筆書き的に書いた場合
のストローク数「１」は、「寿」に対する設定ストロー
ク数からは外れた値であり、大分類の段階でその入力文
字に対する認識候補文字を取り出すことができなくな
る。これを補うためにストローク数範囲を広く設定すれ
ば、認識候補文字が増え、大分類の効率が低下してしま
うという問題があった。

【０００８】また、前述の第２の従来技術は、特開平２
−７５０８９のようなセグメント長を用いる方法では、
大分類辞書に登録された標準的な筆順以外の筆順で書か
れた文字には対応できないという問題があった。つま
り、同じ文字でも筆順を変えて書いた場合、特徴点の位
置や特徴点数が異なってくることもあり、セグメント長
の平均値も筆順が異なることにより違った値となる場合
がある。したがって、この第２の従来技術の方法では、
筆順の違いに対応できない問題がある。

【０００９】本発明は、以上述べた問題点を改善し、ス
トローク数等では有効な大分類が行えなかった走り書き
等による続け字も大分類可能とし、さらに、セグメント
長による大分類では分類できなかった大分類辞書に記載
された以外の筆順で書かれた文字をも大分類可能とする
オンライン文字認識における入力文字大分類方法および
装置を提供することを目的としている。

【００１０】

【課題を解決するための手段】上記課題をを解決するた
めに、本発明のオンライン文字認識における入力文字分
類方法は、手書き文字を入力する文字入力手段によりサ
ンプリングされた入力文字のペンオン・オフ情報を含ん
だ座標データ列に基づいて入力文字を大分類し、入力文
字に対する認識候補文字を文字認識部に出力する入力文
字大分類方法において、前記座標データ列から特徴点及
びストローク数を抽出し、前記特徴点から特徴量を抽出
し、前記特徴量及びストローク数により文字を大分類す
ることを特徴とする。このように、ストローク数と特徴
点から算出した特徴量を相補的に用いて大分類を行うの
で、走り書きを含む続け字や、標準的な筆順でない筆順
で書かれた文字に対しても有効な大分類が行える。

【００１１】そして、前記特徴点が入力文字の座標デー
タ列に対し折れ線近似を行った折れ線の端点であること
を特徴としている。このように、入力文字の座標データ
列に対し折れ線近似を行った折れ線の端点を特徴点とす
るので、単純な処理で特徴点抽出が行え、高速な大分類
が行える。

【００１２】さらに、前記特徴点が、文字認識を行う文
字認識処理に使用される特徴点であることを特徴として
いる。したがって、特徴点抽出を行うための正規化処理
や特徴点抽出処理を文字認識処理と共用できるため、処
理が単純になり処理時間を短縮することができる。

【００１３】また、前記特徴量が特徴点の数であること
を特徴としている。このように、特徴量を特徴点数とし
たので、単純な処理で特徴量の算出が行え、高速な大分
類が行える。

【００１４】また、前記特徴量は隣接する特徴点を結ん
で得られる直線の長さの総和としてもよい。これによ
り、特徴点数を特徴量とした方法では分類できない文字
に対しても有効な分類が行える。

【００１５】そして、前記入力文字のストローク数が予
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の前記特徴量が予め設定した各カテ
ゴリの特徴量の最小値以上であるカテゴリを認識候補と
することを特徴としている。このように、ストローク数
の最大値及び特徴量の最小値を入力文字のストローク数
及び特徴量と比較するようにしたので、２回の比較でし
かも狭い範囲の認識候補文字を抽出することができる。

【００１６】また、本発明のオンライン文字認識におけ
る入力文字大分類装置は、手書き文字を入力する文字入
力手段によりサンプリングされた入力文字のペンオン・
オフ情報を含んだ座標データ列に基づいて入力文字を大
分類し、入力文字に対する認識候補文字を文字認識部に
出力する入力文字大分類装置において、前記座標データ
列からストローク数を検出するストローク数計数手段
と、前記座標データ列から特徴点を抽出する特徴点抽出
手段と、前記特徴点から特徴量を抽出する特徴量抽出手
段と、前記ストローク数と前記特徴量に応じて文字を分
類する大分類手段とを少なくとも具備したことを特徴と
する。このように、ストローク数と特徴点から算出した
特徴量を相補的に用いて大分類を行うので、走り書きを
含む続け字や、標準的な筆順でない筆順で書かれた文字
に対しても有効な大分類が行える。

【００１７】そして、前記特徴点抽出手段は、入力文字
の座標データ列に対し折れ線近似を行った折れ線の端点
を特徴点として出力することを特徴としている。このよ
うに、特徴点抽出手段が入力文字の座標データ列に対し
折れ線近似を行った折れ線の端点を出力する手段である
ので、簡単な構成で特徴点抽出回路を構成でき、小規模
で高速な大分類装置が実現できる。

【００１８】そして、特徴点抽出を行うために前記入力
文字サイズの正規化を行う正規化手段を設けた場合、こ
の正規化手段または前記特徴点抽出手段の少なくとも一
方を、文字認識手段と共用することを特徴としている。
したがって、特徴点抽出を行うための正規化手段や特徴
点抽出手段を文字認識手段と共用できるため、装置の小
型化及び高速化が実現できる。

【００１９】また、前記特徴量抽出手段は、特徴点の数
を計数して出力する手段であることを特徴としている。
これにより、簡単な構成で特徴点抽出手段を構成でき、
小規模で高速な大分類装置が実現できる。

【００２０】また、前記特徴量抽出手段は、隣接する各
特徴点間を結んで得られる直線の長さの総和を算出して
出力する手段であってもよい。これによれば、特徴点数
を特徴量として算出して出力する特徴量抽出手段による
分類装置に比べ、分類効率をより高いものとすることが
できる。

【００２１】また、前記分類手段は、予め各カテゴリの
ストローク数の最大値と特徴量の最小値で構成した大分
類辞書を記憶する大分類辞書記憶手段を具備し、前記大
分類辞書記憶手段の大分類辞書に記憶された記憶内容
と、入力文字のストロ−ク数及び特徴量とを比較し、前
記入力文字のストローク数が予め設定した各カテゴリの
ストローク数の最大値以下であり、かつ、入力文字の前
記特徴量が予め設定した各カテゴリの特徴量の最小値以
上であるカテゴリを認識候補とすることをを特徴として
いる。このように、ストローク数の最大値及び特徴量の
最小値を入力文字のストローク数及び特徴量と比較する
ようにしたので、２回の比較でしかも狭い範囲の認識候
補文字を抽出することができ、小規模で高速な大分類装
置を実現することができる。

【００２２】

【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。

【００２３】（第１の実施の形態）本発明のオンライン
文字認識における入力文字大分類方法は、入力文字のペ
ンオン・オフ情報を含んだ座標データ列から特徴点及び
ストローク数を抽出したのち、前記特徴点から特徴量を
抽出し、その特徴量及びストローク数により入力文字を
分類するものである。この第１の実施の形態では、前記
特徴量は文字の特徴点（入力文字の座標データ列に対し
折れ線近似を行った折れ線の端点）の数であり、以下、
図面を参照しながら説明する。

【００２４】まず、図１により本発明の処理の流れを概
略的に説明する。図１において、文字入力手段１０は、
従来からよく知られているタブレット等の文字入力手段
であり、この文字入力手段１０により入力された手書き
文字（ここでは、続け字の「い」という文字が入力され
た場合について説明する）は座標データ列成生処理１１
によって座標データ列に変換されて出力される。この処
理により、ノイズ等の不要信号が除去され、図２（ａ）
に示すように、ストローク始点ｐ０および終点ｐｎのそ
れぞれの情報を含み、入力文字「い」の外接矩形２０の
左下を原点ｏとした座標データ列が生成される。次に、
ストローク数計数処理１２において、ストローク始終点
情報より、座標データ列中のストローク始点数を計数
し、ストローク数を計数する。

【００２５】次に正規化処理１３において入力文字サイ
ズの正規化を行い、その後、特徴点抽出処理１４におい
て、折れ線近似を行い、折れ線の端点を特徴点として抽
出し、特徴量算出処理１５において特徴点数を計数す
る。

【００２６】なお、前記特徴点抽出処理１４における折
れ線近似は各ストローク毎に行い、それぞれの折れ線の
端点を特徴点として抽出している。この特徴点抽出処理
１４で得られた特徴点は文字認識処理１８においても用
いており、認識処理の効率化を図っている。換言すれ
ば、文字認識処理を行うための特徴点して折れ線の端点
を抽出することが一般に行われるため、この文字認識を
行うために抽出した特徴点を大分類処理にも用いること
ができるということである。

【００２７】一方、大分類辞書１７には、各文字に対応
してあらかじめ算出された標準パターンのストローク数
および特徴量である特徴点数が格納されており、大分類
処理１６において、ストローク数計数処理１２で得られ
たストローク数および特徴量算出処理１５で得られた特
徴点数と、大分類辞書１７に格納された各文字に対する
標準パターンのストローク数および特徴点数と比較し、
認識候補となる幾つかの文字の選出を行う。その後、文
字認識処理１８において、文字辞書１９に格納された文
字認識用データの内、大分類処理１６により選出された
幾つかの認識候補文字の文字認識用データと、特徴点抽
出処理１４により得られたデータとを比較して文字認識
を行う。

【００２８】以上は本発明の概略説明であり、以下に各
処理の内容を順を追って詳細に説明する。

【００２９】ａ）座標データ列生成処理１１。

【００３０】座標データ列生成処理１１は、文字入力手
段１０からの信号を得て、１文字入力開始から終了まで
の各ストローク毎に、ストローク始点ｐ０と終点ｐｎの
情報と座標データ列を生成する。その例を図２（ａ）に
示す。この図２に示す文字は、「い」という文字を走り
書きして続け字となった例を示している。

【００３１】ｂ）ストローク数計数処理１２。

【００３２】ストローク数計数処理１２では、座標デー
タ列生成処理１１で得られた座標データ列中のストロー
ク始点の数を計数する。図２（ａ）の例ではストローク
始点数は「１」であるので、ストローク数は「１」であ
ると計数される。

【００３３】ｃ）正規化処理１３正規化処理１３の内容を図２を用いて詳細に説明する。
図２（ａ）において、２１で表す点は座標データ列発生
処理１１により得られたｎ個の座標データ列、（Ｐx(i),Ｐy(i)）｛ただし１≦ｉ≦ｎである｝における或る座標点Ｐ（ｉ）｛ただし１≦ｉ≦ｎである｝を図示したものである。これより縦方向及び横方向にお
ける最大点を算出する。この場合、外接矩形２０のＸ軸
方向およびＹ軸方向の最大点を求めることになるから、
図２（ａ）においてＸmax及びＹmaxが最大点となる。こ
れを基に、正規化すべき最大座標であるＸnorm、Ｙnorm
（本実施例ではＸnorm＝Ｙnorm＝１６０に設定）との
比、Ｘratio＝Ｘnorm／Ｘmax Ｙratio＝Ｙnorm／Ｙmax を求める。正規化後の座標データ列（Ｎx(i)、Ｎy(i)）
｛１≦ｉ≦ｎ｝は、Ｎx(i) ＝Ｐix × Ｘratio Ｎy(i) ＝Ｐiy × Ｙratio により求める。図２（ｂ）は、図２（ａ）に示す座標デ
ータ列に対してこの正規化を行った結果を示した図であ
る。この例では、Ｘratio＝０．５１、Ｙratio＝０．４
２であった。

【００３４】ｄ）特徴点抽出処理１４特徴点抽出処理１４の内容を図３を用いて詳細に説明す
る。座標点Ｐ１〜Ｐ８は、Ｐ１を始点、Ｐ８を終点とす
る或る１ストロークの正規化された座標データ列である
とする。この１ストロークの始点Ｐ１と終点Ｐ８を結ぶ
直線３０を作成し、正規化された座標データ列中におけ
る各座標点Ｐ１〜Ｐ８から直線３０までの距離を判定
し、最遠点の座標点を求める。図３（ａ）ではＰ４が最
遠点となり、その距離をｈとする。このとき、直線３０
の長さをｍとすれば、ｈ／ｍが予め定めた所定の値より
も大きいか否かを判断し、ｈ／ｍが予め定めた所定の値
よりも大きいときは、直線３０を、最遠点Ｐ４を端点と
した直線３０１（その長さをｍ１とする）と直線３０２
（その長さをｍ２とする）に分割する。この様子を図３
（ｂ）に示す。この処理を直線の分割が起こらなくなる
まで繰り返し行い、得られた端点を特徴点とする。図２
（ｂ）に示す正規化された座標データ列に対し特徴点抽
出処理を行った例を図４に示す。この例では、Ｔ１〜Ｔ
６が図４により説明したような折れ線近似を行って得ら
れた端点であり、Ｔ１〜Ｔ６の６点の特徴点が抽出され
たことになる。

【００３５】ｅ）特徴量算出処理１５特徴量算出処理１５では、前記特徴点抽出処理１４によ
って得られた特徴点を計数する。図４の例では特徴点数
（端点数）は６点となる。

【００３６】ｆ）大分類辞書１７大分類辞書１７には文字コードと各文字の標準パターン
のストローク数及び特徴量である特徴点数を図５で示す
ように格納しておく。すなわち、図５に示すように、各
文字や記号に付された文字コードに対応して画数（スト
ローク数）と特徴点数（端点数）が各文字毎に格納され
ている。

【００３７】ｇ）大分類処理１６大分類処理１６では、入力文字のストローク数が予め設
定した各カテゴリのストローク数の最大値以下であり、
かつ、入力文字の特徴量が予め設定した各カテゴリの特
徴量の最小値以上であるカテゴリを認識候補とする。つ
まり、前記各カテゴリのストローク数の最大値というの
は、たとえば、「い」という文字を例に取ると、この
「い」は楷書で書けばストローク数は「２」となり、図
２で示すような続け字の場合はストローク数は「１」と
なる。したがって、「い」という文字はストローク数
「２」以上で書くことは通常は行われない。これによ
り、「い」という文字に関しては、ストローク数の最大
値は「２」ということになる。前記図５の画数（ストロ
ーク数）は各文字に対するストローク数の最大値が格納
されている。

【００３８】また、特徴量（ここでは特徴点数）の最小
値というのは、同様に、「い」という文字を例に取る
と、この「い」は楷書で書けば特徴点数（端点数）は
「５」であり、続け字の場合は特徴点数は図４で示した
ように、「６」となって、特徴点数は「５」より小さく
なることは通常はない。したがって、「い」という文字
に関しては、特徴点数の最小値は「５」ということにな
る。前記図５の特徴点数は各文字に対する特徴点数の最
小値が格納されている。

【００３９】なお、前記「入力文字のストローク数が予
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の特徴量が予め設定した各カテゴリ
の特徴量の最小値以上であるカテゴリを認識候補とす
る」というのを、この実施の形態に対応した表現で表す
と、ストローク計数処理１２で得られたストローク数が
大分類辞書１７に記されたストローク数以下で、かつ、
特徴量算出処理１５で得られた特徴点数が大分類辞書１
７に記された特徴点数以上の文字コードを認識候補とす
るという表現で表すことができる。そして、大分類処理
１６により得られた認識候補文字の文字コードは文字認
識処理１８に送られる。

【００４０】ｈ）文字辞書１９文字辞書１９には、文字認識処理１８で行うサブストロ
ークマッチングのための、標準パタンのサブストローク
パタンが格納されている。

【００４１】ｉ）文字認識処理１８文字認識処理１８では、特徴点抽出処理１４で得られた
折れ線端点である特徴点データ列とストローク始終点情
報とから、サブストロークを抽出し、文字辞書１９に格
納されたサブストロークパタンのうち、大分類処理１６
で得られた認識候補文字に該当するサブストロークパタ
ンとのみマッチングを行い、最も類似度が高いものを認
識結果として出力する。

【００４２】以上のような手順で処理が行われる。この
ように本発明では、入力文字のストローク数と入力文字
の座標データ列から得た特徴量（特徴点数）を相補的に
用いて大分類を行うので、走り書きのような続け字や標
準とは異なった筆順で書かれた文字でも有効な大分類が
行える。たとえば、前記したように、「い」という文字
を走り書きして入力した場合、ストローク数は「１」、
特徴点数は「６」が出力される。大分類処理１６ではこ
れらの出力を受けて、前記したように、ストローク計数
処理１２で得られたストローク数が大分類辞書１７に記
されたストローク数以下で、かつ、特徴量算出処理１５
で得られた特徴点数が大分類辞書１７に記された特徴点
数以上の文字コードを文字認識処理１８に送る処理を行
う。

【００４３】すなわち、この例では、得られたストロー
ク数は「１」であり、得られた特徴点は「６」であるの
で、ストローク計数処理１２で得られたストローク数が
大分類辞書１７に記されたストローク数以下で、かつ、
特徴量算出処理１５で得られた特徴点数が大分類辞書１
７に記された特徴点数以上の文字コード（言い換えれ
ば、大分類辞書１７に書かれたストローク数が、得られ
たストローク数よりも大きく、かつ、大分類辞書１７に
書かれた特徴点数が、得られた特徴点数よりも小さい文
字コード）は、図５を例にとれば、文字コード「０ｘ８
２ａ２（い）」がその条件に該当する。なお、この図５
に記載されている範囲では、前記した条件に該当する文
字コードは「０ｘ８２ａ２（い）」だけであるが、実際
には、その条件を満たす文字コードが幾つか取り出され
ることになる。

【００４４】このようにして、大分類処理１６において
取り出された幾つかの文字コードは文字認識処理１８に
送られ、文字辞書１９を参照して入力文字に対する文字
認識処理がなされる。この場合は、入力文字は「い」で
あるとの認識が行われる。

【００４５】以上は本発明の処理方法について説明した
が、本発明を実現するための装置の構成例を図６により
説明する。

【００４６】本発明のオンライン文字認識における入力
文字大分類装置は、大きく分けると、文字入力手段５
１、文字認識部５０１及び大分類部５０２より構成され
る。文字入力手段５１はタブレットとペンを用いた座標
入力手段であって、前記図１で示した座標データ列生成
処理１１を行う回路であり、ある１つの文字を入力する
際の入力から終了までのペンオンの回数を計数して出力
するストローク数計数手段５０を含んで構成されてい
る。そして、この文字入力手段５１は、図１におけるス
トローク計数処理１２までを行う。

【００４７】また、文字認識部５０１は、正規化手段５
２、特徴点抽出手段５３、詳細認識手段５４および文字
辞書記憶手段５５から構成される。前記正規化手段５２
は図１における正規化処理１３を行う手段である。特徴
点抽出手段５３は、図１における特徴点抽出処理１４を
行う手段である。詳細認識手段５４は、図１における文
字認識処理１８を行う手段である。文字辞書記憶手段５
５は、図１における文字辞書１９の構成を持つ記憶手段
である。

【００４８】また、大分類部５０２は、特徴量算出手段
５６、大分類辞書記憶手段５７、大分類手段５８により
構成される。前記特徴量算出手段５６は図１における特
徴量算出処理１４を行う手段であり、大分類辞書記憶手
段５７は図１における大分類辞書１７の構成を持つ記憶
手段であり、大分類手段５８は図１における大分類処理
１６を行う手段である。

【００４９】このような構成における大分類装置におけ
る各手段の動作は、図１により説明した通りであるの
で、ここではこの動作についての説明は省略する。

【００５０】以上のように第１の実施の形態によれば、
入力文字のストローク数と入力文字の座標データ列から
得た特徴点から抽出した特徴量（特徴点数）を相補的に
用いて大分類を行うので、走り書きのような続け字や標
準とは異なった筆順で書かれた文字でも有効な大分類が
行える。

【００５１】また、座標データ列を折れ線近似して得ら
れた折れ線の端点を特徴点として用い、この特徴点を特
徴量としたので、認識候補を取り出すための大分類処理
をきわめて単純なものとすることができ、かつ、高速な
処理が実現できる。これらの点をハードウエア構成の面
から見ると、特徴点抽出手段が簡単な構成で実現でき、
装置規模を小さくすることができる。さらに、前記特徴
点は文字認識処理に用いる特徴点を用いることができる
ので、大分類処理のためだけに特徴点抽出を行う必要が
なく、高速な文字認識処理が行え、また、これをハード
ウエア構成の面から見ると、正規化手段５２、特徴点抽
出手段５３を文字認識部と共用して用いることができる
ので、装置規模を小さくすることができ、小型で高速な
大分類装置が実現できる。

【００５２】（第２の実施の形態）以上説明した第１の
実施の形態では、特徴量として特徴点（入力文字の座標
データ列に対して折れ線近似を行った折れ線の端点）の
数を用い、この特徴量とストローク数とをもとに大分類
した例を説明したが、この第２の実施の形態では、特徴
量として前記特徴点を結んで得られる直線の長さの総和
を用いて大分類を行うものである。以下、この特徴量と
ストローク数とをもとに大分類する例について前記第１
の実施の形態の説明で用いた図１を参照しながら説明す
る。

【００５３】この第２の実施の形態の処理は、特徴点抽
出処理１４までは前記第１の実施の形態と同じである
が、特徴量算出処理１４、大分類処理１６の処理および
大分類辞書１７に格納されている内容が少し異なる。以
下、これらについて説明する。

【００５４】ａ）特徴量算出処理１５特徴量算出回路１５では、特徴点抽出回路１４で算出さ
れた特徴点（入力文字の座標データ列に対して折れ線近
似を行った折れ線の端点）を直線で結び、それぞれの直
線の長さの総和を算出して出力する。ｂ）大分類辞書１７大分類辞書１７には、それぞれの文字に対する文字コー
ド、ストローク数と、前記直線の長さの総和が最小にな
る筆順で書かれたときの特徴点間を結んだ直線の長さの
総和が特徴量として、図７に示すように記憶されてい
る。すなわち、図７に示すように、各文字や記号に付さ
れた文字コードに対応して画数（ストローク数）と、特
徴量として、隣接する特徴点を結んだ直線の長さの総和
が各文字毎に格納されている。

【００５５】ｃ）大分類処理１６大分類処理１６は、入力文字のストローク数が予め設定
した各カテゴリのストローク数の最大値以下であり、か
つ、入力文字の特徴量（この第２の実施の形態において
は特徴点を結んで得られる直線の長さの総和）が予め設
定した各カテゴリの特徴量（特徴点を結んで得られる直
線の長さの総和）の最小値以上であるカテゴリを認識候
補とする。

【００５６】つまり、前記各カテゴリのストローク数の
最大値というのは、たとえば、「い」という文字を例に
取ると、この「い」は楷書で書けばストローク数は
「２」となり、続け字の場合はストローク数は「１」と
なって、ストローク数「２」以上で書くことは通常は行
われない。したがって、「い」という文字に関しては、
ストローク数の最大値は「２」ということになる。これ
により、前記図７に示されるストローク数は図５と同
様、各文字のストローク数の最大値が格納されている。
また、特徴量の最小値というのは、同様に、「い」と
いう文字を例に取ると、この「い」は楷書で書けば特徴
点を結んで得られる直線の長さの総和は「５１６」であ
り、続け字の場合は特徴点を結んで得られる直線の長さ
の総和は「７７０」程度となって、長さの総和は「５１
６」より小さくなることは通常はない。したがって、
「い」という文字に関しては、特徴点を結んで得られる
直線の長さの総和の最小値は「５１６」ということにな
る。したがって、前記図７に示す特徴量（特徴点を結ん
で得られる直線の長さの総和）は、各文字毎に、長さが
最小になる筆順で書かれた場合の長さの総和の値が記載
される。

【００５７】なお、前記「入力文字のストローク数が予
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の特徴量が予め設定した各カテゴリ
の特徴量の最小値以上であるカテゴリを認識候補とす
る」というのを、この第２の実施の形態に対応した表現
で表すと、ストローク計数処理１２で得られたストロー
ク数が大分類辞書１７に記されたストローク数以下で、
かつ、特徴量算出処理１５で得られた特徴点を結んで得
られる直線の長さの総和が大分類辞書１７に記された特
徴量（特徴点を結んで得られる直線の長さの総和）以上
の文字コードを認識候補とするという表現で表すことが
できる。そして、この大分類処理１６により得られた認
識候補文字の文字コードは文字認識処理１８に送られ
る。

【００５８】このように、第２の実施の形態において
も、第１の実施の形態同様、ストローク数情報と入力文
字の座標データ列から得た特徴点から抽出した特徴量を
相補的に用いて大分類を行うので、走り書きのような続
け字や標準とは異なった筆順で書かれた文字に対しても
有効な大分類が行える。たとえば、前記したように、
「い」という文字を走り書きして入力した場合、ストロ
ーク数は「１」、特徴点を結ぶ直線の長さの総和は「７
７０」が出力される。大分類処理１６ではこれらの出力
を受けて、前記したように、ストローク計数処理１２で
得られたストローク数が大分類辞書１７に記されたスト
ローク数以下で、かつ、特徴量算出処理１５で得られた
特徴量が大分類辞書１７に記された特徴量以上の文字コ
ードを文字認識処理１８に送る処理を行う。

【００５９】すなわち、この例では、得られたストロー
ク数は「１」であり、得られた特徴量（長さの総和）は
「７７０」であるので、ストローク計数処理１２で得ら
れたストローク数が大分類辞書１７に記されたストロー
ク数以下で、かつ、特徴量算出処理１５で得られた特徴
量が大分類辞書１７に記された特徴量以上の文字コード
（言い換えれば、大分類辞書１７に書かれたストローク
数が、得られたストローク数よりも大きく、かつ、大分
類辞書１７に書かれた特徴量が、得られた特徴量よりも
小さい文字コード）は、図７を例にとれば、文字コード
「０ｘ８２ａ２（い）」がその条件に該当する。なお、
この図５に記載されている範囲では、前記した条件に該
当する文字コードは「０ｘ８２ａ２（い）」だけである
が、実際には、その条件を満たす文字コードが幾つか取
り出されることになる。

【００６０】このようにして、大分類処理１６において
取り出された幾つかの文字コードは文字認識処理１８に
送られ、文字辞書１９を参照して入力文字に対する文字
認識処理がなされる。この場合は、入力文字は「い」で
あるとの認識が行われる。

【００６１】この第２の実施の形態における処理を行う
ための具体的なハードウエア構成例は第１の実施の形態
にて説明した図５において実現できるが、大分類部５０
２を構成する特徴量算出手段５６、大分類手段５８の動
作や大分類辞書記憶手段５７の記憶内容が第１の実施の
形態とは少し異なったものとなる。

【００６２】以下、この大分類部５０２について説明す
る。

【００６３】特徴量算出手段５６は、第２の実施の形態
における特徴量算出処理を行うもので、特徴点抽出手段
５３で算出された特徴点を直線で結び、直線の長さの総
和を算出して特徴量として出力する。

【００６４】また、大分類辞書記憶手段５７は、第２の
実施の形態における大分類辞書１７の構成を持つ記憶手
段であり、文字コード、ストローク数と、直線の長さの
総和が最小になる筆順で書かれたときの特徴点間を結ん
だ直線の長さの総和が特徴量として、前記した図７に示
すように記憶されている。

【００６５】大分類手段５８は、第２の実施の形態にお
ける大分類処理を行うもので、入力文字のストローク数
が予め設定した各カテゴリのストローク数の最大値以下
であり、かつ、入力文字の特徴量（この第２の実施の形
態においては特徴点を結んで得られる直線の長さの総
和）が予め設定した各カテゴリの特徴量（特徴点を結ん
で得られる直線の長さの総和）の最小値以上であるカテ
ゴリを認識候補とする。

【００６６】このように構成された入力文字大分類装置
の第２の実施の形態における動作は、前述した通りであ
るのでその説明は省略する。

【００６７】以上説明したように、第２の実施の形態に
よれば、第１の実施の形態と同様、ストローク数情報と
入力文字の座標データ列から得た特徴点から抽出した特
徴量（第２の実施の形態においては特徴点を結んだ直線
の長さの総和）を相補的に用いて大分類を行うので、走
り書きのような続け字や標準とは異なった筆順で書かれ
た文字に対しても有効な大分類が行える。

【００６８】また、この第２の実施の形態によれば、第
１の実施の形態同様、座標データ列を折れ線近似して得
られた折れ線の端点を特徴点として用い、この特徴点を
特徴量としたので、認識候補を取り出すための大分類処
理をきわめて単純なものとすることができ、かつ、高速
な処理が実現できる。これらの点をハードウエア構成の
面から見ると、特徴点抽出手段が簡単な構成で実現で
き、装置規模を小さくすることができる。さらに、前記
特徴点は文字認識処理に用いる特徴点を用いることがで
きるので、大分類処理のためだけに特徴点抽出を行う必
要がなく、高速な文字認識処理が行え、また、これをハ
ードウエア構成の面から見ると、正規化手段５２、特徴
点抽出手段５３を文字認識部と共用して用いることがで
きるので、装置規模を小さくすることができ、小型で高
速な大分類装置が実現できる。

【００６９】さらに、この第２の実施の形態の大きな特
徴として、特徴点間を結ぶ直線の長さの総和を特徴量と
して比較して大分類するので、第１の実施の形態で説明
した特徴点数を特徴量として大分類するのに比べ、
「三」と「日」など、特徴点数が同じ文字であっても、
分類の効率をより高いものとすることができる。つま
り、「三」と「日」は特徴点の数は共に３であり、第１
の実施の形態では、仮に入力文字が「三」であった場
合、その入力文字に対する認識候補として「三」も
「日」も１つの分類として取り出される可能性が大きく
なるが、第２の実施の形態では、特徴量を特徴点を結ぶ
直線の長さの総和としているので、「三」と「日」では
その長さの総和は大きく異なり、仮に入力文字が「三」
であった場合、その入力文字に対する認識候補として
「三」も「日」も１つの分類として取り出される可能性
は小さいものなり、分類効率をより高いものとすること
ができるのである。

【００７０】なお、以上説明した本発明の処理を行うた
めのプログラムは、フロッピィディスクなどの記憶媒体
に記憶させておくことができ、その処理プログラムが記
憶された記憶媒体をも本発明に含むものである。

【００７１】

【発明の効果】以上説明したように、本発明のオンライ
ン文字認識における入力文字大分類方法および装置は、
ストローク数と特徴点から抽出される特徴量を相補的に
用いるものであり、分類すべき文字の理論上可能なスト
ローク数範囲と特徴量範囲を全て包含して大分類を行う
ので、ストローク数及び筆順による制限が無く、走り書
きを含む続け字や、標準的な筆順以外の筆順で書かれた
文字の認識においても正しくかつ有効な大分類を行うこ
とが可能となる。

【図面の簡単な説明】

【図１】本発明による入力文字大分類方法の処理手順を
説明するブロック図。

【図２】本発明において座標データ列生成処理より生成
された座標データ列および正規化した座標データ列の一
例を示す図。

【図３】本発明における折れ線近似による特徴点抽出方
法を説明する図

【図４】本発明における折れ線近似処理による特徴点抽
出の一具体例を示す図。

【図５】第１の実施の形態における大分類辞書の内容の
一部を示す図。

【図６】本発明による入力文字大分類装置の構成例を示
すブロック図。

【図７】第２の実施の形態における大分類辞書の内容の
一部を示す図。

【符号の説明】

１０・・・文字入力手段１１・・・座標データ列生成処理１２・・・ストローク数計数処理１３・・・正規化処理１４・・・特徴点抽出処理１５・・・特徴量算出処理１６・・・大分類処理１７・・・大分類辞書１８・・・文字認識処理１９・・・文字辞書２０・・・外接矩形２１・・・手書き文字座標データ列３０・・・端点を結んで得られる直線５０・・・ストローク計数手段５１・・・文字入力手段５２・・・正規化手段５３・・・特徴点抽出手段５４・・・詳細認識手段５５・・・文字辞書記憶手段５６・・・特徴量算出手段５７・・・大分類辞書記憶手段５８・・・大分類手段５０１・・・文字認識部５０２・・・大分類部

Claims

【特許請求の範囲】

【請求項１】手書き文字を入力する文字入力手段によ
りサンプリングされた入力文字のペンオン・オフ情報を
含んだ座標データ列に基づいて入力文字を大分類し、入
力文字に対する認識候補文字を文字認識部に出力するオ
ンライン文字認識における入力文字大分類方法におい
て、前記座標データ列から特徴点及びストローク数を抽出
し、前記特徴点から特徴量を抽出し、前記特徴量及びス
トローク数により入力文字を大分類することを特徴とす
るオンライン文字認識における入力文字大分類方法。
【請求項２】前記特徴点が入力文字の座標データ列に
対し折れ線近似を行った折れ線の端点であることを特徴
とした請求項１に記載の文字認識における入力文字大分
類方法。
【請求項３】前記特徴点が、文字認識処理に使用され
る特徴点であることを特徴とした請求項１に記載のオン
ライン文字認識における入力文字大分類方法。
【請求項４】前記特徴量が特徴点の数であることを特
徴とした請求項１に記載のオンライン文字認識における
入力文字大分類方法。
【請求項５】前記特徴量が隣接する特徴点を結んで得
られる直線の長さの総和であることを特徴とした請求項
１に記載のオンライン文字認識における入力文字大分類
方法。
【請求項６】前記入力文字のストローク数が予め設定
した各カテゴリのストローク数の最大値以下であり、か
つ、入力文字の前記特徴量が予め設定した各カテゴリの
特徴量の最小値以上であるカテゴリを認識候補とするこ
とを特徴とした請求項１に記載のオンライン文字認識に
おける入力文字大分類方法。
【請求項７】手書き文字を入力する文字入力手段によ
りサンプリングされた入力文字のペンオン・オフ情報を
含んだ座標データ列に基づいて入力文字を大分類し、入
力文字に対する認識候補文字を文字認識部に出力するオ
ンライン文字認識における入力文字大分類装置におい
て、前記座標データ列からストローク数を検出するストロー
ク数計数手段と、前記座標データ列から特徴点を抽出する特徴点抽出手段
と、前記特徴点から特徴量を抽出する特徴量抽出手段と、前記ストローク数と前記特徴量に応じて文字を分類する
大分類手段と、を少なくとも具備したことを特徴とする
オンライン文字認識における入力文字大分類装置。
【請求項８】前記特徴点抽出手段は、入力文字の座標
データ列に対し折れ線近似を行った折れ線の端点を特徴
点として出力することを特徴とした請求項７に記載のオ
ンライン文字認識における入力文字大分類装置。
【請求項９】特徴点抽出を行うために前記入力文字サ
イズの正規化を行う正規化手段を設けた場合、この正規
化手段または前記特徴点抽出手段の少なくとも一方を、
文字認識手段と共用することを特徴とした請求項７に記
載のオンライン文字認識における入力文字大分類装置。
【請求項１０】前記特徴量抽出手段は、特徴点の数を
計数して出力する手段であることを特徴とした請求項７
に記載のオンライン文字認識における入力文字大分類装
置。
【請求項１１】前記特徴量抽出手段は、隣接する各特
徴点間を結んで得られる直線の長さの総和を算出して出
力する手段であることを特徴とした請求項７に記載のオ
ンライン文字認識における入力文字大分類方法の大分類
装置。
【請求項１２】前記大分類手段は、予め各カテゴリの
ストローク数の最大値と特徴量の最小値で構成した大分
類辞書を記憶する大分類辞書記憶手段を具備し、前記大
分類辞書記憶手段の大分類辞書に記憶された記憶内容
と、入力文字のストロ−ク数及び特徴量とを比較し、前
記入力文字のストローク数が予め設定した各カテゴリの
ストローク数の最大値以下であり、かつ、入力文字の前
記特徴量が予め設定した各カテゴリの特徴量の最小値以
上であるカテゴリを認識候補とすることをを特徴とした
請求項７に記載のオンライン文字認識における入力文字
大分類装置。