JPH09114926A - オンライン文字認識における入力文字大分類方法および装置 - Google Patents
オンライン文字認識における入力文字大分類方法および装置Info
- Publication number
- JPH09114926A JPH09114926A JP7265882A JP26588295A JPH09114926A JP H09114926 A JPH09114926 A JP H09114926A JP 7265882 A JP7265882 A JP 7265882A JP 26588295 A JP26588295 A JP 26588295A JP H09114926 A JPH09114926 A JP H09114926A
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature
- input
- input character
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 入力文字のストローク数及び入力文字の座標
データ列から抽出した特徴点から算出した特徴量にを相
補的に用いて大分類を行うことにより、入力文字の画数
や筆順を制限しないオンライン文字認識における入力文
字大分類方法および装置を提供する。 【解決手段】 座標データ列発生処理11により得られ
たペンのオン・オフ情報を含んだ入力文字の座標データ
列から、まずストローク数計数処理12によりストロー
ク数を算出する。次に、正規化処理13により入力文字
の座標データ列を正規化し、特徴点抽出処理14におい
て特徴点を抽出する。その後、特徴量算出処理15によ
り特徴点から得られた特徴量を算出し、大分類処理16
において、得られたストローク数及び特徴量と、大分類
辞書17に記されたストローク数及び特徴量を比較する
ことにより、認識候補文字を選出し、入力文字大分類を
行う。
データ列から抽出した特徴点から算出した特徴量にを相
補的に用いて大分類を行うことにより、入力文字の画数
や筆順を制限しないオンライン文字認識における入力文
字大分類方法および装置を提供する。 【解決手段】 座標データ列発生処理11により得られ
たペンのオン・オフ情報を含んだ入力文字の座標データ
列から、まずストローク数計数処理12によりストロー
ク数を算出する。次に、正規化処理13により入力文字
の座標データ列を正規化し、特徴点抽出処理14におい
て特徴点を抽出する。その後、特徴量算出処理15によ
り特徴点から得られた特徴量を算出し、大分類処理16
において、得られたストローク数及び特徴量と、大分類
辞書17に記されたストローク数及び特徴量を比較する
ことにより、認識候補文字を選出し、入力文字大分類を
行う。
Description
【0001】
【発明の属する技術分野】本発明は、楷書だけでなく、
続け字や誤まった筆順で書かれた文字をも認識するオン
ライン文字認識における入力文字大分類方法および装置
に関する。
続け字や誤まった筆順で書かれた文字をも認識するオン
ライン文字認識における入力文字大分類方法および装置
に関する。
【0002】
【従来の技術】文字大分類処理は、文字認識を行う前
に、入力文字パタンのある特徴をもとに辞書から認識候
補文字をある範囲に絞って選出し、入力文字パタンと認
識候補文字のみの辞書パタンとを照合させることで照合
回数を削減し、文字認識を高速に行う処理である。
に、入力文字パタンのある特徴をもとに辞書から認識候
補文字をある範囲に絞って選出し、入力文字パタンと認
識候補文字のみの辞書パタンとを照合させることで照合
回数を削減し、文字認識を高速に行う処理である。
【0003】たとえば、走り書きすることによって続け
字となってしまった文字に対応する入力文字大分類とし
ては、特公平4−5231(以下、第1の従来技術とい
う)に記載されるように、辞書中の各文字毎に変動が予
想されるストローク数範囲をあらかじめ辞書中に記して
おき、辞書中に記されたストローク数範囲が入力ストロ
ーク数を含む文字のみを認識候補文字とする方法があ
る。ここで、ストローク数とは、ペンオン(ペンが入力
面に接した状態)からペンオフ(ペンが入力面から離れ
た状態)までの筆記部分の数であり、一般には文字の画
数に相当するものである。
字となってしまった文字に対応する入力文字大分類とし
ては、特公平4−5231(以下、第1の従来技術とい
う)に記載されるように、辞書中の各文字毎に変動が予
想されるストローク数範囲をあらかじめ辞書中に記して
おき、辞書中に記されたストローク数範囲が入力ストロ
ーク数を含む文字のみを認識候補文字とする方法があ
る。ここで、ストローク数とは、ペンオン(ペンが入力
面に接した状態)からペンオフ(ペンが入力面から離れ
た状態)までの筆記部分の数であり、一般には文字の画
数に相当するものである。
【0004】すなわち、この第1の従来技術は、たとえ
ば、「い」という文字は楷書で書けば、ストローク数は
「2」であるが、続け字で書けばストローク数は「1」
となり、この「い」という文字のストローク数範囲は
「1」〜「2」ということになる。このような、各文字
のストローク数範囲を辞書中に記しておき、入力文字の
ストローク数がたとえば「2」であったら、この「2」
を含むストローク数範囲を有する文字を総て認識候補も
字として取り出すものである。
ば、「い」という文字は楷書で書けば、ストローク数は
「2」であるが、続け字で書けばストローク数は「1」
となり、この「い」という文字のストローク数範囲は
「1」〜「2」ということになる。このような、各文字
のストローク数範囲を辞書中に記しておき、入力文字の
ストローク数がたとえば「2」であったら、この「2」
を含むストローク数範囲を有する文字を総て認識候補も
字として取り出すものである。
【0005】また、この第1の従来技術とは別に、特開
平2−75089(以下、第2の従来技術という)に記
載されるように、オペレータの筆順に沿って取り出され
る入力文字の座標値を基に特徴点を検出し、その特徴点
毎にセグメントに分割し、そのセグメント長の平均値を
求め、この入力文字のセグメント長の平均値と、予め算
出された標準パターンのセグメント長(標準的な筆順で
書かれた場合のセグメント長)の平均値とを比較するこ
とにより、候補文字を選出する方法などがある。これら
により、オンライン文字認識装置は認識速度を向上させ
ていた。
平2−75089(以下、第2の従来技術という)に記
載されるように、オペレータの筆順に沿って取り出され
る入力文字の座標値を基に特徴点を検出し、その特徴点
毎にセグメントに分割し、そのセグメント長の平均値を
求め、この入力文字のセグメント長の平均値と、予め算
出された標準パターンのセグメント長(標準的な筆順で
書かれた場合のセグメント長)の平均値とを比較するこ
とにより、候補文字を選出する方法などがある。これら
により、オンライン文字認識装置は認識速度を向上させ
ていた。
【0006】
【発明が解決しようとする課題】前述の第1の従来技術
は、入力文字のストローク数が予め設定された範囲内に
収まる程度の続け字であれば、その入力文字に対応した
認識候補文字を取り出すことができるが、走り書きの度
合いが大きく、設定したストローク数範囲外の書き方を
した続け字は、ストローク数が予め設定された範囲から
外れるため、大分類の段階でその入力文字に対する認識
候補文字を取り出すことができなくなり、正確な認識が
できなくなってしまう。たとえば、「寿」という文字の
場合、楷書で書いたときのストローク数は「7」である
が、極端な例として一筆書き的に書くことも可能であ
り、一筆書き的に書いた場合のストローク数は「1」で
ある。
は、入力文字のストローク数が予め設定された範囲内に
収まる程度の続け字であれば、その入力文字に対応した
認識候補文字を取り出すことができるが、走り書きの度
合いが大きく、設定したストローク数範囲外の書き方を
した続け字は、ストローク数が予め設定された範囲から
外れるため、大分類の段階でその入力文字に対する認識
候補文字を取り出すことができなくなり、正確な認識が
できなくなってしまう。たとえば、「寿」という文字の
場合、楷書で書いたときのストローク数は「7」である
が、極端な例として一筆書き的に書くことも可能であ
り、一筆書き的に書いた場合のストローク数は「1」で
ある。
【0007】しかし、「寿」を一筆書き的に書いた場合
のストローク数「1」は、「寿」に対する設定ストロー
ク数からは外れた値であり、大分類の段階でその入力文
字に対する認識候補文字を取り出すことができなくな
る。これを補うためにストローク数範囲を広く設定すれ
ば、認識候補文字が増え、大分類の効率が低下してしま
うという問題があった。
のストローク数「1」は、「寿」に対する設定ストロー
ク数からは外れた値であり、大分類の段階でその入力文
字に対する認識候補文字を取り出すことができなくな
る。これを補うためにストローク数範囲を広く設定すれ
ば、認識候補文字が増え、大分類の効率が低下してしま
うという問題があった。
【0008】また、前述の第2の従来技術は、特開平2
−75089のようなセグメント長を用いる方法では、
大分類辞書に登録された標準的な筆順以外の筆順で書か
れた文字には対応できないという問題があった。つま
り、同じ文字でも筆順を変えて書いた場合、特徴点の位
置や特徴点数が異なってくることもあり、セグメント長
の平均値も筆順が異なることにより違った値となる場合
がある。したがって、この第2の従来技術の方法では、
筆順の違いに対応できない問題がある。
−75089のようなセグメント長を用いる方法では、
大分類辞書に登録された標準的な筆順以外の筆順で書か
れた文字には対応できないという問題があった。つま
り、同じ文字でも筆順を変えて書いた場合、特徴点の位
置や特徴点数が異なってくることもあり、セグメント長
の平均値も筆順が異なることにより違った値となる場合
がある。したがって、この第2の従来技術の方法では、
筆順の違いに対応できない問題がある。
【0009】本発明は、以上述べた問題点を改善し、ス
トローク数等では有効な大分類が行えなかった走り書き
等による続け字も大分類可能とし、さらに、セグメント
長による大分類では分類できなかった大分類辞書に記載
された以外の筆順で書かれた文字をも大分類可能とする
オンライン文字認識における入力文字大分類方法および
装置を提供することを目的としている。
トローク数等では有効な大分類が行えなかった走り書き
等による続け字も大分類可能とし、さらに、セグメント
長による大分類では分類できなかった大分類辞書に記載
された以外の筆順で書かれた文字をも大分類可能とする
オンライン文字認識における入力文字大分類方法および
装置を提供することを目的としている。
【0010】
【課題を解決するための手段】上記課題をを解決するた
めに、本発明のオンライン文字認識における入力文字分
類方法は、手書き文字を入力する文字入力手段によりサ
ンプリングされた入力文字のペンオン・オフ情報を含ん
だ座標データ列に基づいて入力文字を大分類し、入力文
字に対する認識候補文字を文字認識部に出力する入力文
字大分類方法において、前記座標データ列から特徴点及
びストローク数を抽出し、前記特徴点から特徴量を抽出
し、前記特徴量及びストローク数により文字を大分類す
ることを特徴とする。このように、ストローク数と特徴
点から算出した特徴量を相補的に用いて大分類を行うの
で、走り書きを含む続け字や、標準的な筆順でない筆順
で書かれた文字に対しても有効な大分類が行える。
めに、本発明のオンライン文字認識における入力文字分
類方法は、手書き文字を入力する文字入力手段によりサ
ンプリングされた入力文字のペンオン・オフ情報を含ん
だ座標データ列に基づいて入力文字を大分類し、入力文
字に対する認識候補文字を文字認識部に出力する入力文
字大分類方法において、前記座標データ列から特徴点及
びストローク数を抽出し、前記特徴点から特徴量を抽出
し、前記特徴量及びストローク数により文字を大分類す
ることを特徴とする。このように、ストローク数と特徴
点から算出した特徴量を相補的に用いて大分類を行うの
で、走り書きを含む続け字や、標準的な筆順でない筆順
で書かれた文字に対しても有効な大分類が行える。
【0011】そして、前記特徴点が入力文字の座標デー
タ列に対し折れ線近似を行った折れ線の端点であること
を特徴としている。このように、入力文字の座標データ
列に対し折れ線近似を行った折れ線の端点を特徴点とす
るので、単純な処理で特徴点抽出が行え、高速な大分類
が行える。
タ列に対し折れ線近似を行った折れ線の端点であること
を特徴としている。このように、入力文字の座標データ
列に対し折れ線近似を行った折れ線の端点を特徴点とす
るので、単純な処理で特徴点抽出が行え、高速な大分類
が行える。
【0012】さらに、前記特徴点が、文字認識を行う文
字認識処理に使用される特徴点であることを特徴として
いる。したがって、特徴点抽出を行うための正規化処理
や特徴点抽出処理を文字認識処理と共用できるため、処
理が単純になり処理時間を短縮することができる。
字認識処理に使用される特徴点であることを特徴として
いる。したがって、特徴点抽出を行うための正規化処理
や特徴点抽出処理を文字認識処理と共用できるため、処
理が単純になり処理時間を短縮することができる。
【0013】また、前記特徴量が特徴点の数であること
を特徴としている。このように、特徴量を特徴点数とし
たので、単純な処理で特徴量の算出が行え、高速な大分
類が行える。
を特徴としている。このように、特徴量を特徴点数とし
たので、単純な処理で特徴量の算出が行え、高速な大分
類が行える。
【0014】また、前記特徴量は隣接する特徴点を結ん
で得られる直線の長さの総和としてもよい。これによ
り、特徴点数を特徴量とした方法では分類できない文字
に対しても有効な分類が行える。
で得られる直線の長さの総和としてもよい。これによ
り、特徴点数を特徴量とした方法では分類できない文字
に対しても有効な分類が行える。
【0015】そして、前記入力文字のストローク数が予
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の前記特徴量が予め設定した各カテ
ゴリの特徴量の最小値以上であるカテゴリを認識候補と
することを特徴としている。このように、ストローク数
の最大値及び特徴量の最小値を入力文字のストローク数
及び特徴量と比較するようにしたので、2回の比較でし
かも狭い範囲の認識候補文字を抽出することができる。
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の前記特徴量が予め設定した各カテ
ゴリの特徴量の最小値以上であるカテゴリを認識候補と
することを特徴としている。このように、ストローク数
の最大値及び特徴量の最小値を入力文字のストローク数
及び特徴量と比較するようにしたので、2回の比較でし
かも狭い範囲の認識候補文字を抽出することができる。
【0016】また、本発明のオンライン文字認識におけ
る入力文字大分類装置は、手書き文字を入力する文字入
力手段によりサンプリングされた入力文字のペンオン・
オフ情報を含んだ座標データ列に基づいて入力文字を大
分類し、入力文字に対する認識候補文字を文字認識部に
出力する入力文字大分類装置において、前記座標データ
列からストローク数を検出するストローク数計数手段
と、前記座標データ列から特徴点を抽出する特徴点抽出
手段と、前記特徴点から特徴量を抽出する特徴量抽出手
段と、前記ストローク数と前記特徴量に応じて文字を分
類する大分類手段とを少なくとも具備したことを特徴と
する。このように、ストローク数と特徴点から算出した
特徴量を相補的に用いて大分類を行うので、走り書きを
含む続け字や、標準的な筆順でない筆順で書かれた文字
に対しても有効な大分類が行える。
る入力文字大分類装置は、手書き文字を入力する文字入
力手段によりサンプリングされた入力文字のペンオン・
オフ情報を含んだ座標データ列に基づいて入力文字を大
分類し、入力文字に対する認識候補文字を文字認識部に
出力する入力文字大分類装置において、前記座標データ
列からストローク数を検出するストローク数計数手段
と、前記座標データ列から特徴点を抽出する特徴点抽出
手段と、前記特徴点から特徴量を抽出する特徴量抽出手
段と、前記ストローク数と前記特徴量に応じて文字を分
類する大分類手段とを少なくとも具備したことを特徴と
する。このように、ストローク数と特徴点から算出した
特徴量を相補的に用いて大分類を行うので、走り書きを
含む続け字や、標準的な筆順でない筆順で書かれた文字
に対しても有効な大分類が行える。
【0017】そして、前記特徴点抽出手段は、入力文字
の座標データ列に対し折れ線近似を行った折れ線の端点
を特徴点として出力することを特徴としている。このよ
うに、特徴点抽出手段が入力文字の座標データ列に対し
折れ線近似を行った折れ線の端点を出力する手段である
ので、簡単な構成で特徴点抽出回路を構成でき、小規模
で高速な大分類装置が実現できる。
の座標データ列に対し折れ線近似を行った折れ線の端点
を特徴点として出力することを特徴としている。このよ
うに、特徴点抽出手段が入力文字の座標データ列に対し
折れ線近似を行った折れ線の端点を出力する手段である
ので、簡単な構成で特徴点抽出回路を構成でき、小規模
で高速な大分類装置が実現できる。
【0018】そして、特徴点抽出を行うために前記入力
文字サイズの正規化を行う正規化手段を設けた場合、こ
の正規化手段または前記特徴点抽出手段の少なくとも一
方を、文字認識手段と共用することを特徴としている。
したがって、特徴点抽出を行うための正規化手段や特徴
点抽出手段を文字認識手段と共用できるため、装置の小
型化及び高速化が実現できる。
文字サイズの正規化を行う正規化手段を設けた場合、こ
の正規化手段または前記特徴点抽出手段の少なくとも一
方を、文字認識手段と共用することを特徴としている。
したがって、特徴点抽出を行うための正規化手段や特徴
点抽出手段を文字認識手段と共用できるため、装置の小
型化及び高速化が実現できる。
【0019】また、前記特徴量抽出手段は、特徴点の数
を計数して出力する手段であることを特徴としている。
これにより、簡単な構成で特徴点抽出手段を構成でき、
小規模で高速な大分類装置が実現できる。
を計数して出力する手段であることを特徴としている。
これにより、簡単な構成で特徴点抽出手段を構成でき、
小規模で高速な大分類装置が実現できる。
【0020】また、前記特徴量抽出手段は、隣接する各
特徴点間を結んで得られる直線の長さの総和を算出して
出力する手段であってもよい。これによれば、特徴点数
を特徴量として算出して出力する特徴量抽出手段による
分類装置に比べ、分類効率をより高いものとすることが
できる。
特徴点間を結んで得られる直線の長さの総和を算出して
出力する手段であってもよい。これによれば、特徴点数
を特徴量として算出して出力する特徴量抽出手段による
分類装置に比べ、分類効率をより高いものとすることが
できる。
【0021】また、前記分類手段は、予め各カテゴリの
ストローク数の最大値と特徴量の最小値で構成した大分
類辞書を記憶する大分類辞書記憶手段を具備し、前記大
分類辞書記憶手段の大分類辞書に記憶された記憶内容
と、入力文字のストロ−ク数及び特徴量とを比較し、前
記入力文字のストローク数が予め設定した各カテゴリの
ストローク数の最大値以下であり、かつ、入力文字の前
記特徴量が予め設定した各カテゴリの特徴量の最小値以
上であるカテゴリを認識候補とすることをを特徴として
いる。このように、ストローク数の最大値及び特徴量の
最小値を入力文字のストローク数及び特徴量と比較する
ようにしたので、2回の比較でしかも狭い範囲の認識候
補文字を抽出することができ、小規模で高速な大分類装
置を実現することができる。
ストローク数の最大値と特徴量の最小値で構成した大分
類辞書を記憶する大分類辞書記憶手段を具備し、前記大
分類辞書記憶手段の大分類辞書に記憶された記憶内容
と、入力文字のストロ−ク数及び特徴量とを比較し、前
記入力文字のストローク数が予め設定した各カテゴリの
ストローク数の最大値以下であり、かつ、入力文字の前
記特徴量が予め設定した各カテゴリの特徴量の最小値以
上であるカテゴリを認識候補とすることをを特徴として
いる。このように、ストローク数の最大値及び特徴量の
最小値を入力文字のストローク数及び特徴量と比較する
ようにしたので、2回の比較でしかも狭い範囲の認識候
補文字を抽出することができ、小規模で高速な大分類装
置を実現することができる。
【0022】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。
に基づいて説明する。
【0023】(第1の実施の形態)本発明のオンライン
文字認識における入力文字大分類方法は、入力文字のペ
ンオン・オフ情報を含んだ座標データ列から特徴点及び
ストローク数を抽出したのち、前記特徴点から特徴量を
抽出し、その特徴量及びストローク数により入力文字を
分類するものである。この第1の実施の形態では、前記
特徴量は文字の特徴点(入力文字の座標データ列に対し
折れ線近似を行った折れ線の端点)の数であり、以下、
図面を参照しながら説明する。
文字認識における入力文字大分類方法は、入力文字のペ
ンオン・オフ情報を含んだ座標データ列から特徴点及び
ストローク数を抽出したのち、前記特徴点から特徴量を
抽出し、その特徴量及びストローク数により入力文字を
分類するものである。この第1の実施の形態では、前記
特徴量は文字の特徴点(入力文字の座標データ列に対し
折れ線近似を行った折れ線の端点)の数であり、以下、
図面を参照しながら説明する。
【0024】まず、図1により本発明の処理の流れを概
略的に説明する。図1において、文字入力手段10は、
従来からよく知られているタブレット等の文字入力手段
であり、この文字入力手段10により入力された手書き
文字(ここでは、続け字の「い」という文字が入力され
た場合について説明する)は座標データ列成生処理11
によって座標データ列に変換されて出力される。この処
理により、ノイズ等の不要信号が除去され、図2(a)
に示すように、ストローク始点p0および終点pnのそ
れぞれの情報を含み、入力文字「い」の外接矩形20の
左下を原点oとした座標データ列が生成される。次に、
ストローク数計数処理12において、ストローク始終点
情報より、座標データ列中のストローク始点数を計数
し、ストローク数を計数する。
略的に説明する。図1において、文字入力手段10は、
従来からよく知られているタブレット等の文字入力手段
であり、この文字入力手段10により入力された手書き
文字(ここでは、続け字の「い」という文字が入力され
た場合について説明する)は座標データ列成生処理11
によって座標データ列に変換されて出力される。この処
理により、ノイズ等の不要信号が除去され、図2(a)
に示すように、ストローク始点p0および終点pnのそ
れぞれの情報を含み、入力文字「い」の外接矩形20の
左下を原点oとした座標データ列が生成される。次に、
ストローク数計数処理12において、ストローク始終点
情報より、座標データ列中のストローク始点数を計数
し、ストローク数を計数する。
【0025】次に正規化処理13において入力文字サイ
ズの正規化を行い、その後、特徴点抽出処理14におい
て、折れ線近似を行い、折れ線の端点を特徴点として抽
出し、特徴量算出処理15において特徴点数を計数す
る。
ズの正規化を行い、その後、特徴点抽出処理14におい
て、折れ線近似を行い、折れ線の端点を特徴点として抽
出し、特徴量算出処理15において特徴点数を計数す
る。
【0026】なお、前記特徴点抽出処理14における折
れ線近似は各ストローク毎に行い、それぞれの折れ線の
端点を特徴点として抽出している。この特徴点抽出処理
14で得られた特徴点は文字認識処理18においても用
いており、認識処理の効率化を図っている。換言すれ
ば、文字認識処理を行うための特徴点して折れ線の端点
を抽出することが一般に行われるため、この文字認識を
行うために抽出した特徴点を大分類処理にも用いること
ができるということである。
れ線近似は各ストローク毎に行い、それぞれの折れ線の
端点を特徴点として抽出している。この特徴点抽出処理
14で得られた特徴点は文字認識処理18においても用
いており、認識処理の効率化を図っている。換言すれ
ば、文字認識処理を行うための特徴点して折れ線の端点
を抽出することが一般に行われるため、この文字認識を
行うために抽出した特徴点を大分類処理にも用いること
ができるということである。
【0027】一方、大分類辞書17には、各文字に対応
してあらかじめ算出された標準パターンのストローク数
および特徴量である特徴点数が格納されており、大分類
処理16において、ストローク数計数処理12で得られ
たストローク数および特徴量算出処理15で得られた特
徴点数と、大分類辞書17に格納された各文字に対する
標準パターンのストローク数および特徴点数と比較し、
認識候補となる幾つかの文字の選出を行う。その後、文
字認識処理18において、文字辞書19に格納された文
字認識用データの内、大分類処理16により選出された
幾つかの認識候補文字の文字認識用データと、特徴点抽
出処理14により得られたデータとを比較して文字認識
を行う。
してあらかじめ算出された標準パターンのストローク数
および特徴量である特徴点数が格納されており、大分類
処理16において、ストローク数計数処理12で得られ
たストローク数および特徴量算出処理15で得られた特
徴点数と、大分類辞書17に格納された各文字に対する
標準パターンのストローク数および特徴点数と比較し、
認識候補となる幾つかの文字の選出を行う。その後、文
字認識処理18において、文字辞書19に格納された文
字認識用データの内、大分類処理16により選出された
幾つかの認識候補文字の文字認識用データと、特徴点抽
出処理14により得られたデータとを比較して文字認識
を行う。
【0028】以上は本発明の概略説明であり、以下に各
処理の内容を順を追って詳細に説明する。
処理の内容を順を追って詳細に説明する。
【0029】a)座標データ列生成処理11。
【0030】座標データ列生成処理11は、文字入力手
段10からの信号を得て、1文字入力開始から終了まで
の各ストローク毎に、ストローク始点p0と終点pnの
情報と座標データ列を生成する。その例を図2(a)に
示す。この図2に示す文字は、「い」という文字を走り
書きして続け字となった例を示している。
段10からの信号を得て、1文字入力開始から終了まで
の各ストローク毎に、ストローク始点p0と終点pnの
情報と座標データ列を生成する。その例を図2(a)に
示す。この図2に示す文字は、「い」という文字を走り
書きして続け字となった例を示している。
【0031】b)ストローク数計数処理12。
【0032】ストローク数計数処理12では、座標デー
タ列生成処理11で得られた座標データ列中のストロー
ク始点の数を計数する。図2(a)の例ではストローク
始点数は「1」であるので、ストローク数は「1」であ
ると計数される。
タ列生成処理11で得られた座標データ列中のストロー
ク始点の数を計数する。図2(a)の例ではストローク
始点数は「1」であるので、ストローク数は「1」であ
ると計数される。
【0033】c)正規化処理13 正規化処理13の内容を図2を用いて詳細に説明する。
図2(a)において、21で表す点は座標データ列発生
処理11により得られたn個の座標データ列、 (Px(i),Py(i)){ただし1≦i≦nである} における或る座標点 P(i){ただし1≦i≦nである} を図示したものである。これより縦方向及び横方向にお
ける最大点を算出する。この場合、外接矩形20のX軸
方向およびY軸方向の最大点を求めることになるから、
図2(a)においてXmax及びYmaxが最大点となる。こ
れを基に、正規化すべき最大座標であるXnorm、Ynorm
(本実施例ではXnorm=Ynorm=160に設定)との
比、 Xratio=Xnorm/Xmax Yratio=Ynorm/Ymax を求める。正規化後の座標データ列(Nx(i)、Ny(i))
{1≦i≦n}は、 Nx(i) = Pix × Xratio Ny(i) = Piy × Yratio により求める。図2(b)は、図2(a)に示す座標デ
ータ列に対してこの正規化を行った結果を示した図であ
る。この例では、Xratio=0.51、Yratio=0.4
2であった。
図2(a)において、21で表す点は座標データ列発生
処理11により得られたn個の座標データ列、 (Px(i),Py(i)){ただし1≦i≦nである} における或る座標点 P(i){ただし1≦i≦nである} を図示したものである。これより縦方向及び横方向にお
ける最大点を算出する。この場合、外接矩形20のX軸
方向およびY軸方向の最大点を求めることになるから、
図2(a)においてXmax及びYmaxが最大点となる。こ
れを基に、正規化すべき最大座標であるXnorm、Ynorm
(本実施例ではXnorm=Ynorm=160に設定)との
比、 Xratio=Xnorm/Xmax Yratio=Ynorm/Ymax を求める。正規化後の座標データ列(Nx(i)、Ny(i))
{1≦i≦n}は、 Nx(i) = Pix × Xratio Ny(i) = Piy × Yratio により求める。図2(b)は、図2(a)に示す座標デ
ータ列に対してこの正規化を行った結果を示した図であ
る。この例では、Xratio=0.51、Yratio=0.4
2であった。
【0034】d)特徴点抽出処理14 特徴点抽出処理14の内容を図3を用いて詳細に説明す
る。座標点P1〜P8は、P1を始点、P8を終点とす
る或る1ストロークの正規化された座標データ列である
とする。この1ストロークの始点P1と終点P8を結ぶ
直線30を作成し、正規化された座標データ列中におけ
る各座標点P1〜P8から直線30までの距離を判定
し、最遠点の座標点を求める。図3(a)ではP4が最
遠点となり、その距離をhとする。このとき、直線30
の長さをmとすれば、h/mが予め定めた所定の値より
も大きいか否かを判断し、h/mが予め定めた所定の値
よりも大きいときは、直線30を、最遠点P4を端点と
した直線301(その長さをm1とする)と直線302
(その長さをm2とする)に分割する。この様子を図3
(b)に示す。この処理を直線の分割が起こらなくなる
まで繰り返し行い、得られた端点を特徴点とする。図2
(b)に示す正規化された座標データ列に対し特徴点抽
出処理を行った例を図4に示す。この例では、T1〜T
6が図4により説明したような折れ線近似を行って得ら
れた端点であり、T1〜T6の6点の特徴点が抽出され
たことになる。
る。座標点P1〜P8は、P1を始点、P8を終点とす
る或る1ストロークの正規化された座標データ列である
とする。この1ストロークの始点P1と終点P8を結ぶ
直線30を作成し、正規化された座標データ列中におけ
る各座標点P1〜P8から直線30までの距離を判定
し、最遠点の座標点を求める。図3(a)ではP4が最
遠点となり、その距離をhとする。このとき、直線30
の長さをmとすれば、h/mが予め定めた所定の値より
も大きいか否かを判断し、h/mが予め定めた所定の値
よりも大きいときは、直線30を、最遠点P4を端点と
した直線301(その長さをm1とする)と直線302
(その長さをm2とする)に分割する。この様子を図3
(b)に示す。この処理を直線の分割が起こらなくなる
まで繰り返し行い、得られた端点を特徴点とする。図2
(b)に示す正規化された座標データ列に対し特徴点抽
出処理を行った例を図4に示す。この例では、T1〜T
6が図4により説明したような折れ線近似を行って得ら
れた端点であり、T1〜T6の6点の特徴点が抽出され
たことになる。
【0035】e)特徴量算出処理15 特徴量算出処理15では、前記特徴点抽出処理14によ
って得られた特徴点を計数する。図4の例では特徴点数
(端点数)は6点となる。
って得られた特徴点を計数する。図4の例では特徴点数
(端点数)は6点となる。
【0036】f)大分類辞書17 大分類辞書17には文字コードと各文字の標準パターン
のストローク数及び特徴量である特徴点数を図5で示す
ように格納しておく。すなわち、図5に示すように、各
文字や記号に付された文字コードに対応して画数(スト
ローク数)と特徴点数(端点数)が各文字毎に格納され
ている。
のストローク数及び特徴量である特徴点数を図5で示す
ように格納しておく。すなわち、図5に示すように、各
文字や記号に付された文字コードに対応して画数(スト
ローク数)と特徴点数(端点数)が各文字毎に格納され
ている。
【0037】g)大分類処理16 大分類処理16では、入力文字のストローク数が予め設
定した各カテゴリのストローク数の最大値以下であり、
かつ、入力文字の特徴量が予め設定した各カテゴリの特
徴量の最小値以上であるカテゴリを認識候補とする。つ
まり、前記各カテゴリのストローク数の最大値というの
は、たとえば、「い」という文字を例に取ると、この
「い」は楷書で書けばストローク数は「2」となり、図
2で示すような続け字の場合はストローク数は「1」と
なる。したがって、「い」という文字はストローク数
「2」以上で書くことは通常は行われない。これによ
り、「い」という文字に関しては、ストローク数の最大
値は「2」ということになる。前記図5の画数(ストロ
ーク数)は各文字に対するストローク数の最大値が格納
されている。
定した各カテゴリのストローク数の最大値以下であり、
かつ、入力文字の特徴量が予め設定した各カテゴリの特
徴量の最小値以上であるカテゴリを認識候補とする。つ
まり、前記各カテゴリのストローク数の最大値というの
は、たとえば、「い」という文字を例に取ると、この
「い」は楷書で書けばストローク数は「2」となり、図
2で示すような続け字の場合はストローク数は「1」と
なる。したがって、「い」という文字はストローク数
「2」以上で書くことは通常は行われない。これによ
り、「い」という文字に関しては、ストローク数の最大
値は「2」ということになる。前記図5の画数(ストロ
ーク数)は各文字に対するストローク数の最大値が格納
されている。
【0038】また、特徴量(ここでは特徴点数)の最小
値というのは、同様に、「い」という文字を例に取る
と、この「い」は楷書で書けば特徴点数(端点数)は
「5」であり、続け字の場合は特徴点数は図4で示した
ように、「6」となって、特徴点数は「5」より小さく
なることは通常はない。したがって、「い」という文字
に関しては、特徴点数の最小値は「5」ということにな
る。前記図5の特徴点数は各文字に対する特徴点数の最
小値が格納されている。
値というのは、同様に、「い」という文字を例に取る
と、この「い」は楷書で書けば特徴点数(端点数)は
「5」であり、続け字の場合は特徴点数は図4で示した
ように、「6」となって、特徴点数は「5」より小さく
なることは通常はない。したがって、「い」という文字
に関しては、特徴点数の最小値は「5」ということにな
る。前記図5の特徴点数は各文字に対する特徴点数の最
小値が格納されている。
【0039】なお、前記「入力文字のストローク数が予
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の特徴量が予め設定した各カテゴリ
の特徴量の最小値以上であるカテゴリを認識候補とす
る」というのを、この実施の形態に対応した表現で表す
と、ストローク計数処理12で得られたストローク数が
大分類辞書17に記されたストローク数以下で、かつ、
特徴量算出処理15で得られた特徴点数が大分類辞書1
7に記された特徴点数以上の文字コードを認識候補とす
るという表現で表すことができる。そして、大分類処理
16により得られた認識候補文字の文字コードは文字認
識処理18に送られる。
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の特徴量が予め設定した各カテゴリ
の特徴量の最小値以上であるカテゴリを認識候補とす
る」というのを、この実施の形態に対応した表現で表す
と、ストローク計数処理12で得られたストローク数が
大分類辞書17に記されたストローク数以下で、かつ、
特徴量算出処理15で得られた特徴点数が大分類辞書1
7に記された特徴点数以上の文字コードを認識候補とす
るという表現で表すことができる。そして、大分類処理
16により得られた認識候補文字の文字コードは文字認
識処理18に送られる。
【0040】h)文字辞書19 文字辞書19には、文字認識処理18で行うサブストロ
ークマッチングのための、標準パタンのサブストローク
パタンが格納されている。
ークマッチングのための、標準パタンのサブストローク
パタンが格納されている。
【0041】i)文字認識処理18 文字認識処理18では、特徴点抽出処理14で得られた
折れ線端点である特徴点データ列とストローク始終点情
報とから、サブストロークを抽出し、文字辞書19に格
納されたサブストロークパタンのうち、大分類処理16
で得られた認識候補文字に該当するサブストロークパタ
ンとのみマッチングを行い、最も類似度が高いものを認
識結果として出力する。
折れ線端点である特徴点データ列とストローク始終点情
報とから、サブストロークを抽出し、文字辞書19に格
納されたサブストロークパタンのうち、大分類処理16
で得られた認識候補文字に該当するサブストロークパタ
ンとのみマッチングを行い、最も類似度が高いものを認
識結果として出力する。
【0042】以上のような手順で処理が行われる。この
ように本発明では、入力文字のストローク数と入力文字
の座標データ列から得た特徴量(特徴点数)を相補的に
用いて大分類を行うので、走り書きのような続け字や標
準とは異なった筆順で書かれた文字でも有効な大分類が
行える。たとえば、前記したように、「い」という文字
を走り書きして入力した場合、ストローク数は「1」、
特徴点数は「6」が出力される。大分類処理16ではこ
れらの出力を受けて、前記したように、ストローク計数
処理12で得られたストローク数が大分類辞書17に記
されたストローク数以下で、かつ、特徴量算出処理15
で得られた特徴点数が大分類辞書17に記された特徴点
数以上の文字コードを文字認識処理18に送る処理を行
う。
ように本発明では、入力文字のストローク数と入力文字
の座標データ列から得た特徴量(特徴点数)を相補的に
用いて大分類を行うので、走り書きのような続け字や標
準とは異なった筆順で書かれた文字でも有効な大分類が
行える。たとえば、前記したように、「い」という文字
を走り書きして入力した場合、ストローク数は「1」、
特徴点数は「6」が出力される。大分類処理16ではこ
れらの出力を受けて、前記したように、ストローク計数
処理12で得られたストローク数が大分類辞書17に記
されたストローク数以下で、かつ、特徴量算出処理15
で得られた特徴点数が大分類辞書17に記された特徴点
数以上の文字コードを文字認識処理18に送る処理を行
う。
【0043】すなわち、この例では、得られたストロー
ク数は「1」であり、得られた特徴点は「6」であるの
で、ストローク計数処理12で得られたストローク数が
大分類辞書17に記されたストローク数以下で、かつ、
特徴量算出処理15で得られた特徴点数が大分類辞書1
7に記された特徴点数以上の文字コード(言い換えれ
ば、大分類辞書17に書かれたストローク数が、得られ
たストローク数よりも大きく、かつ、大分類辞書17に
書かれた特徴点数が、得られた特徴点数よりも小さい文
字コード)は、図5を例にとれば、文字コード「0x8
2a2(い)」がその条件に該当する。なお、この図5
に記載されている範囲では、前記した条件に該当する文
字コードは「0x82a2(い)」だけであるが、実際
には、その条件を満たす文字コードが幾つか取り出され
ることになる。
ク数は「1」であり、得られた特徴点は「6」であるの
で、ストローク計数処理12で得られたストローク数が
大分類辞書17に記されたストローク数以下で、かつ、
特徴量算出処理15で得られた特徴点数が大分類辞書1
7に記された特徴点数以上の文字コード(言い換えれ
ば、大分類辞書17に書かれたストローク数が、得られ
たストローク数よりも大きく、かつ、大分類辞書17に
書かれた特徴点数が、得られた特徴点数よりも小さい文
字コード)は、図5を例にとれば、文字コード「0x8
2a2(い)」がその条件に該当する。なお、この図5
に記載されている範囲では、前記した条件に該当する文
字コードは「0x82a2(い)」だけであるが、実際
には、その条件を満たす文字コードが幾つか取り出され
ることになる。
【0044】このようにして、大分類処理16において
取り出された幾つかの文字コードは文字認識処理18に
送られ、文字辞書19を参照して入力文字に対する文字
認識処理がなされる。この場合は、入力文字は「い」で
あるとの認識が行われる。
取り出された幾つかの文字コードは文字認識処理18に
送られ、文字辞書19を参照して入力文字に対する文字
認識処理がなされる。この場合は、入力文字は「い」で
あるとの認識が行われる。
【0045】以上は本発明の処理方法について説明した
が、本発明を実現するための装置の構成例を図6により
説明する。
が、本発明を実現するための装置の構成例を図6により
説明する。
【0046】本発明のオンライン文字認識における入力
文字大分類装置は、大きく分けると、文字入力手段5
1、文字認識部501及び大分類部502より構成され
る。文字入力手段51はタブレットとペンを用いた座標
入力手段であって、前記図1で示した座標データ列生成
処理11を行う回路であり、ある1つの文字を入力する
際の入力から終了までのペンオンの回数を計数して出力
するストローク数計数手段50を含んで構成されてい
る。そして、この文字入力手段51は、図1におけるス
トローク計数処理12までを行う。
文字大分類装置は、大きく分けると、文字入力手段5
1、文字認識部501及び大分類部502より構成され
る。文字入力手段51はタブレットとペンを用いた座標
入力手段であって、前記図1で示した座標データ列生成
処理11を行う回路であり、ある1つの文字を入力する
際の入力から終了までのペンオンの回数を計数して出力
するストローク数計数手段50を含んで構成されてい
る。そして、この文字入力手段51は、図1におけるス
トローク計数処理12までを行う。
【0047】また、文字認識部501は、正規化手段5
2、特徴点抽出手段53、詳細認識手段54および文字
辞書記憶手段55から構成される。前記正規化手段52
は図1における正規化処理13を行う手段である。特徴
点抽出手段53は、図1における特徴点抽出処理14を
行う手段である。詳細認識手段54は、図1における文
字認識処理18を行う手段である。文字辞書記憶手段5
5は、図1における文字辞書19の構成を持つ記憶手段
である。
2、特徴点抽出手段53、詳細認識手段54および文字
辞書記憶手段55から構成される。前記正規化手段52
は図1における正規化処理13を行う手段である。特徴
点抽出手段53は、図1における特徴点抽出処理14を
行う手段である。詳細認識手段54は、図1における文
字認識処理18を行う手段である。文字辞書記憶手段5
5は、図1における文字辞書19の構成を持つ記憶手段
である。
【0048】また、大分類部502は、特徴量算出手段
56、大分類辞書記憶手段57、大分類手段58により
構成される。前記特徴量算出手段56は図1における特
徴量算出処理14を行う手段であり、大分類辞書記憶手
段57は図1における大分類辞書17の構成を持つ記憶
手段であり、大分類手段58は図1における大分類処理
16を行う手段である。
56、大分類辞書記憶手段57、大分類手段58により
構成される。前記特徴量算出手段56は図1における特
徴量算出処理14を行う手段であり、大分類辞書記憶手
段57は図1における大分類辞書17の構成を持つ記憶
手段であり、大分類手段58は図1における大分類処理
16を行う手段である。
【0049】このような構成における大分類装置におけ
る各手段の動作は、図1により説明した通りであるの
で、ここではこの動作についての説明は省略する。
る各手段の動作は、図1により説明した通りであるの
で、ここではこの動作についての説明は省略する。
【0050】以上のように第1の実施の形態によれば、
入力文字のストローク数と入力文字の座標データ列から
得た特徴点から抽出した特徴量(特徴点数)を相補的に
用いて大分類を行うので、走り書きのような続け字や標
準とは異なった筆順で書かれた文字でも有効な大分類が
行える。
入力文字のストローク数と入力文字の座標データ列から
得た特徴点から抽出した特徴量(特徴点数)を相補的に
用いて大分類を行うので、走り書きのような続け字や標
準とは異なった筆順で書かれた文字でも有効な大分類が
行える。
【0051】また、座標データ列を折れ線近似して得ら
れた折れ線の端点を特徴点として用い、この特徴点を特
徴量としたので、認識候補を取り出すための大分類処理
をきわめて単純なものとすることができ、かつ、高速な
処理が実現できる。これらの点をハードウエア構成の面
から見ると、特徴点抽出手段が簡単な構成で実現でき、
装置規模を小さくすることができる。さらに、前記特徴
点は文字認識処理に用いる特徴点を用いることができる
ので、大分類処理のためだけに特徴点抽出を行う必要が
なく、高速な文字認識処理が行え、また、これをハード
ウエア構成の面から見ると、正規化手段52、特徴点抽
出手段53を文字認識部と共用して用いることができる
ので、装置規模を小さくすることができ、小型で高速な
大分類装置が実現できる。
れた折れ線の端点を特徴点として用い、この特徴点を特
徴量としたので、認識候補を取り出すための大分類処理
をきわめて単純なものとすることができ、かつ、高速な
処理が実現できる。これらの点をハードウエア構成の面
から見ると、特徴点抽出手段が簡単な構成で実現でき、
装置規模を小さくすることができる。さらに、前記特徴
点は文字認識処理に用いる特徴点を用いることができる
ので、大分類処理のためだけに特徴点抽出を行う必要が
なく、高速な文字認識処理が行え、また、これをハード
ウエア構成の面から見ると、正規化手段52、特徴点抽
出手段53を文字認識部と共用して用いることができる
ので、装置規模を小さくすることができ、小型で高速な
大分類装置が実現できる。
【0052】(第2の実施の形態)以上説明した第1の
実施の形態では、特徴量として特徴点(入力文字の座標
データ列に対して折れ線近似を行った折れ線の端点)の
数を用い、この特徴量とストローク数とをもとに大分類
した例を説明したが、この第2の実施の形態では、特徴
量として前記特徴点を結んで得られる直線の長さの総和
を用いて大分類を行うものである。以下、この特徴量と
ストローク数とをもとに大分類する例について前記第1
の実施の形態の説明で用いた図1を参照しながら説明す
る。
実施の形態では、特徴量として特徴点(入力文字の座標
データ列に対して折れ線近似を行った折れ線の端点)の
数を用い、この特徴量とストローク数とをもとに大分類
した例を説明したが、この第2の実施の形態では、特徴
量として前記特徴点を結んで得られる直線の長さの総和
を用いて大分類を行うものである。以下、この特徴量と
ストローク数とをもとに大分類する例について前記第1
の実施の形態の説明で用いた図1を参照しながら説明す
る。
【0053】この第2の実施の形態の処理は、特徴点抽
出処理14までは前記第1の実施の形態と同じである
が、特徴量算出処理14、大分類処理16の処理および
大分類辞書17に格納されている内容が少し異なる。以
下、これらについて説明する。
出処理14までは前記第1の実施の形態と同じである
が、特徴量算出処理14、大分類処理16の処理および
大分類辞書17に格納されている内容が少し異なる。以
下、これらについて説明する。
【0054】a)特徴量算出処理15 特徴量算出回路15では、特徴点抽出回路14で算出さ
れた特徴点(入力文字の座標データ列に対して折れ線近
似を行った折れ線の端点)を直線で結び、それぞれの直
線の長さの総和を算出して出力する。 b)大分類辞書17 大分類辞書17には、それぞれの文字に対する文字コー
ド、ストローク数と、前記直線の長さの総和が最小にな
る筆順で書かれたときの特徴点間を結んだ直線の長さの
総和が特徴量として、図7に示すように記憶されてい
る。すなわち、図7に示すように、各文字や記号に付さ
れた文字コードに対応して画数(ストローク数)と、特
徴量として、隣接する特徴点を結んだ直線の長さの総和
が各文字毎に格納されている。
れた特徴点(入力文字の座標データ列に対して折れ線近
似を行った折れ線の端点)を直線で結び、それぞれの直
線の長さの総和を算出して出力する。 b)大分類辞書17 大分類辞書17には、それぞれの文字に対する文字コー
ド、ストローク数と、前記直線の長さの総和が最小にな
る筆順で書かれたときの特徴点間を結んだ直線の長さの
総和が特徴量として、図7に示すように記憶されてい
る。すなわち、図7に示すように、各文字や記号に付さ
れた文字コードに対応して画数(ストローク数)と、特
徴量として、隣接する特徴点を結んだ直線の長さの総和
が各文字毎に格納されている。
【0055】c)大分類処理16 大分類処理16は、入力文字のストローク数が予め設定
した各カテゴリのストローク数の最大値以下であり、か
つ、入力文字の特徴量(この第2の実施の形態において
は特徴点を結んで得られる直線の長さの総和)が予め設
定した各カテゴリの特徴量(特徴点を結んで得られる直
線の長さの総和)の最小値以上であるカテゴリを認識候
補とする。
した各カテゴリのストローク数の最大値以下であり、か
つ、入力文字の特徴量(この第2の実施の形態において
は特徴点を結んで得られる直線の長さの総和)が予め設
定した各カテゴリの特徴量(特徴点を結んで得られる直
線の長さの総和)の最小値以上であるカテゴリを認識候
補とする。
【0056】つまり、前記各カテゴリのストローク数の
最大値というのは、たとえば、「い」という文字を例に
取ると、この「い」は楷書で書けばストローク数は
「2」となり、続け字の場合はストローク数は「1」と
なって、ストローク数「2」以上で書くことは通常は行
われない。したがって、「い」という文字に関しては、
ストローク数の最大値は「2」ということになる。これ
により、前記図7に示されるストローク数は図5と同
様、各文字のストローク数の最大値が格納されている。
また、特徴量の最小値というのは、同様に、「い」と
いう文字を例に取ると、この「い」は楷書で書けば特徴
点を結んで得られる直線の長さの総和は「516」であ
り、続け字の場合は特徴点を結んで得られる直線の長さ
の総和は「770」程度となって、長さの総和は「51
6」より小さくなることは通常はない。したがって、
「い」という文字に関しては、特徴点を結んで得られる
直線の長さの総和の最小値は「516」ということにな
る。したがって、前記図7に示す特徴量(特徴点を結ん
で得られる直線の長さの総和)は、各文字毎に、長さが
最小になる筆順で書かれた場合の長さの総和の値が記載
される。
最大値というのは、たとえば、「い」という文字を例に
取ると、この「い」は楷書で書けばストローク数は
「2」となり、続け字の場合はストローク数は「1」と
なって、ストローク数「2」以上で書くことは通常は行
われない。したがって、「い」という文字に関しては、
ストローク数の最大値は「2」ということになる。これ
により、前記図7に示されるストローク数は図5と同
様、各文字のストローク数の最大値が格納されている。
また、特徴量の最小値というのは、同様に、「い」と
いう文字を例に取ると、この「い」は楷書で書けば特徴
点を結んで得られる直線の長さの総和は「516」であ
り、続け字の場合は特徴点を結んで得られる直線の長さ
の総和は「770」程度となって、長さの総和は「51
6」より小さくなることは通常はない。したがって、
「い」という文字に関しては、特徴点を結んで得られる
直線の長さの総和の最小値は「516」ということにな
る。したがって、前記図7に示す特徴量(特徴点を結ん
で得られる直線の長さの総和)は、各文字毎に、長さが
最小になる筆順で書かれた場合の長さの総和の値が記載
される。
【0057】なお、前記「入力文字のストローク数が予
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の特徴量が予め設定した各カテゴリ
の特徴量の最小値以上であるカテゴリを認識候補とす
る」というのを、この第2の実施の形態に対応した表現
で表すと、ストローク計数処理12で得られたストロー
ク数が大分類辞書17に記されたストローク数以下で、
かつ、特徴量算出処理15で得られた特徴点を結んで得
られる直線の長さの総和が大分類辞書17に記された特
徴量(特徴点を結んで得られる直線の長さの総和)以上
の文字コードを認識候補とするという表現で表すことが
できる。そして、この大分類処理16により得られた認
識候補文字の文字コードは文字認識処理18に送られ
る。
め設定した各カテゴリのストローク数の最大値以下であ
り、かつ、入力文字の特徴量が予め設定した各カテゴリ
の特徴量の最小値以上であるカテゴリを認識候補とす
る」というのを、この第2の実施の形態に対応した表現
で表すと、ストローク計数処理12で得られたストロー
ク数が大分類辞書17に記されたストローク数以下で、
かつ、特徴量算出処理15で得られた特徴点を結んで得
られる直線の長さの総和が大分類辞書17に記された特
徴量(特徴点を結んで得られる直線の長さの総和)以上
の文字コードを認識候補とするという表現で表すことが
できる。そして、この大分類処理16により得られた認
識候補文字の文字コードは文字認識処理18に送られ
る。
【0058】このように、第2の実施の形態において
も、第1の実施の形態同様、ストローク数情報と入力文
字の座標データ列から得た特徴点から抽出した特徴量を
相補的に用いて大分類を行うので、走り書きのような続
け字や標準とは異なった筆順で書かれた文字に対しても
有効な大分類が行える。たとえば、前記したように、
「い」という文字を走り書きして入力した場合、ストロ
ーク数は「1」、特徴点を結ぶ直線の長さの総和は「7
70」が出力される。大分類処理16ではこれらの出力
を受けて、前記したように、ストローク計数処理12で
得られたストローク数が大分類辞書17に記されたスト
ローク数以下で、かつ、特徴量算出処理15で得られた
特徴量が大分類辞書17に記された特徴量以上の文字コ
ードを文字認識処理18に送る処理を行う。
も、第1の実施の形態同様、ストローク数情報と入力文
字の座標データ列から得た特徴点から抽出した特徴量を
相補的に用いて大分類を行うので、走り書きのような続
け字や標準とは異なった筆順で書かれた文字に対しても
有効な大分類が行える。たとえば、前記したように、
「い」という文字を走り書きして入力した場合、ストロ
ーク数は「1」、特徴点を結ぶ直線の長さの総和は「7
70」が出力される。大分類処理16ではこれらの出力
を受けて、前記したように、ストローク計数処理12で
得られたストローク数が大分類辞書17に記されたスト
ローク数以下で、かつ、特徴量算出処理15で得られた
特徴量が大分類辞書17に記された特徴量以上の文字コ
ードを文字認識処理18に送る処理を行う。
【0059】すなわち、この例では、得られたストロー
ク数は「1」であり、得られた特徴量(長さの総和)は
「770」であるので、ストローク計数処理12で得ら
れたストローク数が大分類辞書17に記されたストロー
ク数以下で、かつ、特徴量算出処理15で得られた特徴
量が大分類辞書17に記された特徴量以上の文字コード
(言い換えれば、大分類辞書17に書かれたストローク
数が、得られたストローク数よりも大きく、かつ、大分
類辞書17に書かれた特徴量が、得られた特徴量よりも
小さい文字コード)は、図7を例にとれば、文字コード
「0x82a2(い)」がその条件に該当する。なお、
この図5に記載されている範囲では、前記した条件に該
当する文字コードは「0x82a2(い)」だけである
が、実際には、その条件を満たす文字コードが幾つか取
り出されることになる。
ク数は「1」であり、得られた特徴量(長さの総和)は
「770」であるので、ストローク計数処理12で得ら
れたストローク数が大分類辞書17に記されたストロー
ク数以下で、かつ、特徴量算出処理15で得られた特徴
量が大分類辞書17に記された特徴量以上の文字コード
(言い換えれば、大分類辞書17に書かれたストローク
数が、得られたストローク数よりも大きく、かつ、大分
類辞書17に書かれた特徴量が、得られた特徴量よりも
小さい文字コード)は、図7を例にとれば、文字コード
「0x82a2(い)」がその条件に該当する。なお、
この図5に記載されている範囲では、前記した条件に該
当する文字コードは「0x82a2(い)」だけである
が、実際には、その条件を満たす文字コードが幾つか取
り出されることになる。
【0060】このようにして、大分類処理16において
取り出された幾つかの文字コードは文字認識処理18に
送られ、文字辞書19を参照して入力文字に対する文字
認識処理がなされる。この場合は、入力文字は「い」で
あるとの認識が行われる。
取り出された幾つかの文字コードは文字認識処理18に
送られ、文字辞書19を参照して入力文字に対する文字
認識処理がなされる。この場合は、入力文字は「い」で
あるとの認識が行われる。
【0061】この第2の実施の形態における処理を行う
ための具体的なハードウエア構成例は第1の実施の形態
にて説明した図5において実現できるが、大分類部50
2を構成する特徴量算出手段56、大分類手段58の動
作や大分類辞書記憶手段57の記憶内容が第1の実施の
形態とは少し異なったものとなる。
ための具体的なハードウエア構成例は第1の実施の形態
にて説明した図5において実現できるが、大分類部50
2を構成する特徴量算出手段56、大分類手段58の動
作や大分類辞書記憶手段57の記憶内容が第1の実施の
形態とは少し異なったものとなる。
【0062】以下、この大分類部502について説明す
る。
る。
【0063】特徴量算出手段56は、第2の実施の形態
における特徴量算出処理を行うもので、特徴点抽出手段
53で算出された特徴点を直線で結び、直線の長さの総
和を算出して特徴量として出力する。
における特徴量算出処理を行うもので、特徴点抽出手段
53で算出された特徴点を直線で結び、直線の長さの総
和を算出して特徴量として出力する。
【0064】また、大分類辞書記憶手段57は、第2の
実施の形態における大分類辞書17の構成を持つ記憶手
段であり、文字コード、ストローク数と、直線の長さの
総和が最小になる筆順で書かれたときの特徴点間を結ん
だ直線の長さの総和が特徴量として、前記した図7に示
すように記憶されている。
実施の形態における大分類辞書17の構成を持つ記憶手
段であり、文字コード、ストローク数と、直線の長さの
総和が最小になる筆順で書かれたときの特徴点間を結ん
だ直線の長さの総和が特徴量として、前記した図7に示
すように記憶されている。
【0065】大分類手段58は、第2の実施の形態にお
ける大分類処理を行うもので、入力文字のストローク数
が予め設定した各カテゴリのストローク数の最大値以下
であり、かつ、入力文字の特徴量(この第2の実施の形
態においては特徴点を結んで得られる直線の長さの総
和)が予め設定した各カテゴリの特徴量(特徴点を結ん
で得られる直線の長さの総和)の最小値以上であるカテ
ゴリを認識候補とする。
ける大分類処理を行うもので、入力文字のストローク数
が予め設定した各カテゴリのストローク数の最大値以下
であり、かつ、入力文字の特徴量(この第2の実施の形
態においては特徴点を結んで得られる直線の長さの総
和)が予め設定した各カテゴリの特徴量(特徴点を結ん
で得られる直線の長さの総和)の最小値以上であるカテ
ゴリを認識候補とする。
【0066】このように構成された入力文字大分類装置
の第2の実施の形態における動作は、前述した通りであ
るのでその説明は省略する。
の第2の実施の形態における動作は、前述した通りであ
るのでその説明は省略する。
【0067】以上説明したように、第2の実施の形態に
よれば、第1の実施の形態と同様、ストローク数情報と
入力文字の座標データ列から得た特徴点から抽出した特
徴量(第2の実施の形態においては特徴点を結んだ直線
の長さの総和)を相補的に用いて大分類を行うので、走
り書きのような続け字や標準とは異なった筆順で書かれ
た文字に対しても有効な大分類が行える。
よれば、第1の実施の形態と同様、ストローク数情報と
入力文字の座標データ列から得た特徴点から抽出した特
徴量(第2の実施の形態においては特徴点を結んだ直線
の長さの総和)を相補的に用いて大分類を行うので、走
り書きのような続け字や標準とは異なった筆順で書かれ
た文字に対しても有効な大分類が行える。
【0068】また、この第2の実施の形態によれば、第
1の実施の形態同様、座標データ列を折れ線近似して得
られた折れ線の端点を特徴点として用い、この特徴点を
特徴量としたので、認識候補を取り出すための大分類処
理をきわめて単純なものとすることができ、かつ、高速
な処理が実現できる。これらの点をハードウエア構成の
面から見ると、特徴点抽出手段が簡単な構成で実現で
き、装置規模を小さくすることができる。さらに、前記
特徴点は文字認識処理に用いる特徴点を用いることがで
きるので、大分類処理のためだけに特徴点抽出を行う必
要がなく、高速な文字認識処理が行え、また、これをハ
ードウエア構成の面から見ると、正規化手段52、特徴
点抽出手段53を文字認識部と共用して用いることがで
きるので、装置規模を小さくすることができ、小型で高
速な大分類装置が実現できる。
1の実施の形態同様、座標データ列を折れ線近似して得
られた折れ線の端点を特徴点として用い、この特徴点を
特徴量としたので、認識候補を取り出すための大分類処
理をきわめて単純なものとすることができ、かつ、高速
な処理が実現できる。これらの点をハードウエア構成の
面から見ると、特徴点抽出手段が簡単な構成で実現で
き、装置規模を小さくすることができる。さらに、前記
特徴点は文字認識処理に用いる特徴点を用いることがで
きるので、大分類処理のためだけに特徴点抽出を行う必
要がなく、高速な文字認識処理が行え、また、これをハ
ードウエア構成の面から見ると、正規化手段52、特徴
点抽出手段53を文字認識部と共用して用いることがで
きるので、装置規模を小さくすることができ、小型で高
速な大分類装置が実現できる。
【0069】さらに、この第2の実施の形態の大きな特
徴として、特徴点間を結ぶ直線の長さの総和を特徴量と
して比較して大分類するので、第1の実施の形態で説明
した特徴点数を特徴量として大分類するのに比べ、
「三」と「日」など、特徴点数が同じ文字であっても、
分類の効率をより高いものとすることができる。つま
り、「三」と「日」は特徴点の数は共に3であり、第1
の実施の形態では、仮に入力文字が「三」であった場
合、その入力文字に対する認識候補として「三」も
「日」も1つの分類として取り出される可能性が大きく
なるが、第2の実施の形態では、特徴量を特徴点を結ぶ
直線の長さの総和としているので、「三」と「日」では
その長さの総和は大きく異なり、仮に入力文字が「三」
であった場合、その入力文字に対する認識候補として
「三」も「日」も1つの分類として取り出される可能性
は小さいものなり、分類効率をより高いものとすること
ができるのである。
徴として、特徴点間を結ぶ直線の長さの総和を特徴量と
して比較して大分類するので、第1の実施の形態で説明
した特徴点数を特徴量として大分類するのに比べ、
「三」と「日」など、特徴点数が同じ文字であっても、
分類の効率をより高いものとすることができる。つま
り、「三」と「日」は特徴点の数は共に3であり、第1
の実施の形態では、仮に入力文字が「三」であった場
合、その入力文字に対する認識候補として「三」も
「日」も1つの分類として取り出される可能性が大きく
なるが、第2の実施の形態では、特徴量を特徴点を結ぶ
直線の長さの総和としているので、「三」と「日」では
その長さの総和は大きく異なり、仮に入力文字が「三」
であった場合、その入力文字に対する認識候補として
「三」も「日」も1つの分類として取り出される可能性
は小さいものなり、分類効率をより高いものとすること
ができるのである。
【0070】なお、以上説明した本発明の処理を行うた
めのプログラムは、フロッピィディスクなどの記憶媒体
に記憶させておくことができ、その処理プログラムが記
憶された記憶媒体をも本発明に含むものである。
めのプログラムは、フロッピィディスクなどの記憶媒体
に記憶させておくことができ、その処理プログラムが記
憶された記憶媒体をも本発明に含むものである。
【0071】
【発明の効果】以上説明したように、本発明のオンライ
ン文字認識における入力文字大分類方法および装置は、
ストローク数と特徴点から抽出される特徴量を相補的に
用いるものであり、分類すべき文字の理論上可能なスト
ローク数範囲と特徴量範囲を全て包含して大分類を行う
ので、ストローク数及び筆順による制限が無く、走り書
きを含む続け字や、標準的な筆順以外の筆順で書かれた
文字の認識においても正しくかつ有効な大分類を行うこ
とが可能となる。
ン文字認識における入力文字大分類方法および装置は、
ストローク数と特徴点から抽出される特徴量を相補的に
用いるものであり、分類すべき文字の理論上可能なスト
ローク数範囲と特徴量範囲を全て包含して大分類を行う
ので、ストローク数及び筆順による制限が無く、走り書
きを含む続け字や、標準的な筆順以外の筆順で書かれた
文字の認識においても正しくかつ有効な大分類を行うこ
とが可能となる。
【図1】本発明による入力文字大分類方法の処理手順を
説明するブロック図。
説明するブロック図。
【図2】本発明において座標データ列生成処理より生成
された座標データ列および正規化した座標データ列の一
例を示す図。
された座標データ列および正規化した座標データ列の一
例を示す図。
【図3】本発明における折れ線近似による特徴点抽出方
法を説明する図
法を説明する図
【図4】本発明における折れ線近似処理による特徴点抽
出の一具体例を示す図。
出の一具体例を示す図。
【図5】第1の実施の形態における大分類辞書の内容の
一部を示す図。
一部を示す図。
【図6】本発明による入力文字大分類装置の構成例を示
すブロック図。
すブロック図。
【図7】第2の実施の形態における大分類辞書の内容の
一部を示す図。
一部を示す図。
10・ ・・文字入力手段 11・・・座標データ列生成処理 12・・・ストローク数計数処理 13・・・正規化処理 14・・・特徴点抽出処理 15・・・特徴量算出処理 16・・・大分類処理 17・・・大分類辞書 18・・・文字認識処理 19・・・文字辞書 20・・・外接矩形 21・・・手書き文字座標データ列 30・・・端点を結んで得られる直線 50・・・ストローク計数手段 51・・・文字入力手段 52・・・正規化手段 53・・・特徴点抽出手段 54・・・詳細認識手段 55・・・文字辞書記憶手段 56・・・特徴量算出手段 57・・・大分類辞書記憶手段 58・・・大分類手段 501・・・文字認識部 502・・・大分類部
Claims (12)
- 【請求項1】 手書き文字を入力する文字入力手段によ
りサンプリングされた入力文字のペンオン・オフ情報を
含んだ座標データ列に基づいて入力文字を大分類し、入
力文字に対する認識候補文字を文字認識部に出力するオ
ンライン文字認識における入力文字大分類方法におい
て、 前記座標データ列から特徴点及びストローク数を抽出
し、前記特徴点から特徴量を抽出し、前記特徴量及びス
トローク数により入力文字を大分類することを特徴とす
るオンライン文字認識における入力文字大分類方法。 - 【請求項2】 前記特徴点が入力文字の座標データ列に
対し折れ線近似を行った折れ線の端点であることを特徴
とした請求項1に記載の文字認識における入力文字大分
類方法。 - 【請求項3】 前記特徴点が、文字認識処理に使用され
る特徴点であることを特徴とした請求項1に記載のオン
ライン文字認識における入力文字大分類方法。 - 【請求項4】 前記特徴量が特徴点の数であることを特
徴とした請求項1に記載のオンライン文字認識における
入力文字大分類方法。 - 【請求項5】 前記特徴量が隣接する特徴点を結んで得
られる直線の長さの総和であることを特徴とした請求項
1に記載のオンライン文字認識における入力文字大分類
方法。 - 【請求項6】 前記入力文字のストローク数が予め設定
した各カテゴリのストローク数の最大値以下であり、か
つ、入力文字の前記特徴量が予め設定した各カテゴリの
特徴量の最小値以上であるカテゴリを認識候補とするこ
とを特徴とした請求項1に記載のオンライン文字認識に
おける入力文字大分類方法。 - 【請求項7】 手書き文字を入力する文字入力手段によ
りサンプリングされた入力文字のペンオン・オフ情報を
含んだ座標データ列に基づいて入力文字を大分類し、入
力文字に対する認識候補文字を文字認識部に出力するオ
ンライン文字認識における入力文字大分類装置におい
て、 前記座標データ列からストローク数を検出するストロー
ク数計数手段と、 前記座標データ列から特徴点を抽出する特徴点抽出手段
と、 前記特徴点から特徴量を抽出する特徴量抽出手段と、 前記ストローク数と前記特徴量に応じて文字を分類する
大分類手段と、を少なくとも具備したことを特徴とする
オンライン文字認識における入力文字大分類装置。 - 【請求項8】 前記特徴点抽出手段は、入力文字の座標
データ列に対し折れ線近似を行った折れ線の端点を特徴
点として出力することを特徴とした請求項7に記載のオ
ンライン文字認識における入力文字大分類装置。 - 【請求項9】 特徴点抽出を行うために前記入力文字サ
イズの正規化を行う正規化手段を設けた場合、この正規
化手段または前記特徴点抽出手段の少なくとも一方を、
文字認識手段と共用することを特徴とした請求項7に記
載のオンライン文字認識における入力文字大分類装置。 - 【請求項10】 前記特徴量抽出手段は、特徴点の数を
計数して出力する手段であることを特徴とした請求項7
に記載のオンライン文字認識における入力文字大分類装
置。 - 【請求項11】 前記特徴量抽出手段は、隣接する各特
徴点間を結んで得られる直線の長さの総和を算出して出
力する手段であることを特徴とした請求項7に記載のオ
ンライン文字認識における入力文字大分類方法の大分類
装置。 - 【請求項12】 前記大分類手段は、予め各カテゴリの
ストローク数の最大値と特徴量の最小値で構成した大分
類辞書を記憶する大分類辞書記憶手段を具備し、前記大
分類辞書記憶手段の大分類辞書に記憶された記憶内容
と、入力文字のストロ−ク数及び特徴量とを比較し、前
記入力文字のストローク数が予め設定した各カテゴリの
ストローク数の最大値以下であり、かつ、入力文字の前
記特徴量が予め設定した各カテゴリの特徴量の最小値以
上であるカテゴリを認識候補とすることをを特徴とした
請求項7に記載のオンライン文字認識における入力文字
大分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7265882A JPH09114926A (ja) | 1995-10-13 | 1995-10-13 | オンライン文字認識における入力文字大分類方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7265882A JPH09114926A (ja) | 1995-10-13 | 1995-10-13 | オンライン文字認識における入力文字大分類方法および装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09114926A true JPH09114926A (ja) | 1997-05-02 |
Family
ID=17423416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7265882A Pending JPH09114926A (ja) | 1995-10-13 | 1995-10-13 | オンライン文字認識における入力文字大分類方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09114926A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0927949A3 (en) * | 1997-12-29 | 2002-01-09 | SAMSUNG ELECTRONICS Co. Ltd. | Character-recognition system for a mobile radio communication terminal and method thereof |
US6618504B1 (en) | 1996-11-15 | 2003-09-09 | Toho Business Management Center | Business management system |
JP2012027778A (ja) * | 2010-07-26 | 2012-02-09 | Casio Comput Co Ltd | 文字認識装置及びプログラム |
US8538156B2 (en) | 2010-07-26 | 2013-09-17 | Casio Computer Co., Ltd. | Character recognition device and recording medium |
-
1995
- 1995-10-13 JP JP7265882A patent/JPH09114926A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6618504B1 (en) | 1996-11-15 | 2003-09-09 | Toho Business Management Center | Business management system |
EP0927949A3 (en) * | 1997-12-29 | 2002-01-09 | SAMSUNG ELECTRONICS Co. Ltd. | Character-recognition system for a mobile radio communication terminal and method thereof |
US6738514B1 (en) | 1997-12-29 | 2004-05-18 | Samsung Electronics Co., Ltd. | Character-recognition system for a mobile radio communication terminal and method thereof |
JP2012027778A (ja) * | 2010-07-26 | 2012-02-09 | Casio Comput Co Ltd | 文字認識装置及びプログラム |
US8538156B2 (en) | 2010-07-26 | 2013-09-17 | Casio Computer Co., Ltd. | Character recognition device and recording medium |
US8571321B2 (en) | 2010-07-26 | 2013-10-29 | Casio Computer Co., Ltd. | Character recognition device and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100297482B1 (ko) | 수기입력의문자인식방법및장치 | |
US7336827B2 (en) | System, process and software arrangement for recognizing handwritten characters | |
Priya et al. | Online and offline character recognition: A survey | |
US7298903B2 (en) | Method and system for separating text and drawings in digital ink | |
TWI435276B (zh) | 用以辨識手寫符號之方法及設備 | |
EP0114250B1 (en) | Confusion grouping of strokes in pattern recognition method and system | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
US5787197A (en) | Post-processing error correction scheme using a dictionary for on-line handwriting recognition | |
WO1995034048A1 (en) | Method and apparatus for automated text recognition | |
JP2005242579A (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
Kim et al. | Bankcheck recognition using cross validation between legal and courtesy amounts | |
JPH09319829A (ja) | オンライン文字認識装置 | |
US5659633A (en) | Character recognition method utilizing compass directions and torsion points as features | |
Singh et al. | Online handwritten Gurmukhi words recognition: An inclusive study | |
JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
Lay et al. | On-line Chinese character recognition with effective candidate radical and candidate character selections | |
JP2003115028A (ja) | 帳票識別辞書自動生成方法及び帳票処理システム | |
Senior et al. | O-line cursive handwriting recognition using recurrent neural networks | |
JP3360030B2 (ja) | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
JP3015137B2 (ja) | 手書文字認識装置 | |
JP3281530B2 (ja) | 文字認識装置 | |
JPH10247221A (ja) | オンライン文字認識装置 | |
Cabral et al. | Intelligent character recognition |