JP3125432B2 - 手書き文字認識装置 - Google Patents

手書き文字認識装置

Info

Publication number
JP3125432B2
JP3125432B2 JP04106902A JP10690292A JP3125432B2 JP 3125432 B2 JP3125432 B2 JP 3125432B2 JP 04106902 A JP04106902 A JP 04106902A JP 10690292 A JP10690292 A JP 10690292A JP 3125432 B2 JP3125432 B2 JP 3125432B2
Authority
JP
Japan
Prior art keywords
pattern
distance
standard
cumulative distance
uncertain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04106902A
Other languages
English (en)
Other versions
JPH05303666A (ja
Inventor
正樹 保科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP04106902A priority Critical patent/JP3125432B2/ja
Publication of JPH05303666A publication Critical patent/JPH05303666A/ja
Application granted granted Critical
Publication of JP3125432B2 publication Critical patent/JP3125432B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は手書き文字を動的計画法
を用いて認識させる手書き文字認識装置に関する。
【0002】
【従来の技術】従来から文字認識装置において、入力文
字パターンを認識するための手法として比較的簡単で有
効な方法であるパターンマッチング法が用いられてい
た。このパターンマッチング法では、入力文字パターン
と予め登録された複数の標準文字パターンとの間の累積
距離(相違度)を求め、最も累積距離の小さい標準パタ
ーンの属するカテゴリを認識結果とする方法である。文
字認識装置の一般的なパターンマッチング方法として
は、動的計画法が用いられてきた。動的計画法では手書
きによりストローク単位に入力した文字を、ある定めら
れたデータ列に変換し、その変換されたデータ列と予め
登録されている複数の標準パターン文字のデータ列とを
比較する。そしてそのうち最も累積距離(相違度)の小
さいパターンを認識結果として出力していた。詳しい内
容については例として、文一総合出版社から出版されて
いる「パターン認識と学習のアルゴリズム(P91〜P
108)」を参照されたい。
【0003】動的計画法の計算には以下の漸化式を用い
る。
【0004】 g(i,j) = d(i,j) + min{g(i-1,j),g(i,j-1),g(i-1,j-1)} (1) g(i,0) = d(0,0) + d(1,0) + ・・・+ d(imax,0) (2) g(0,j) = d(0,0) + d(0,1) + ・・・+ d(0,jmax) (3) ここで、入力パターンAと標準パターンBをベクトルの
部分列で表わす。
【0005】 A = a0,a1,a2,a3,・・・ai,・・・,aimax (4) B = b0,b1,b2,b3,・・・bj,・・・,bjmax (5) aiは入力パターンAを構成するi番目の部分ベクトルで
あり、同様にbjは標準パターンBを構成するj番目の部
分ベクトルである。(1)式のg(i,j)は、図4(a)に示
すように、iを横軸、jを縦軸にとった場合の各格子点に
おける入力パターンAと標準パターンBとのパターンマ
ッチングの演算結果を意味している。d(i,j)はaiとbjと
の距離‖ai-bj‖である。g(i,j)は(1)式からわかるよう
に、g(i-1,j)とg(i,j-1)とg(i-1,j-1)の中で最小値を求
めた値とd(i,j)との関係から成り立っており、距離d(i,
j)の累積距離を表わしている。(2)(3)式は、(1)式の初
期値を求める式である。これら漸化式から最小値を求め
ることは、図4(b)における3方向から逐次計算をす
ることを意味している。また、図4(b)のはg(i-1,
j)、はg(i-1,j-1)、はg(i,j-1)の漸化式に相当す
る。これらの最小値を選択して(1)式のg(i,j)を
求め、パターンの最終ベクトルにたどり着くまでの経路
をグラフに表わすことができる。例として図4(a)に
g(i,j)のパターンマッチングの最小累積距離となる経路
を示す。この経路は、パターンマッチングする入力パタ
ーンAと標準パターンBの部分ベクトル列の内容により
変化する。
【0006】次に、図面を用いて従来の文字認識装置を
説明する。図3はその原理を示すブロック図である。タ
ブレット等から書き込まれた手書き文字のイメージデー
タがストローク単位で手書き文字入力部10に入力され
る。入力した手書き文字のストロークは、データ列変換
部20においてストロークの特徴を抽出し、ある定めら
れたベクトル列データに変換される。そしてこのベクト
ル列はパターン距離演算部70に送られ、動的計画法を
用いて標準パターン文字辞書40との間で累積距離が求
められる。その結果標準パターン文字辞書40の中で最
も累積距離の小さい標準パターン文字を、認識結果とし
た。パターン距離演算部70では、上記(1)の漸化式が
用いられ、累積距離が計算される。
【0007】
【発明が解決しようとする課題】ところで、従来の文字
認識装置には以下の問題点がある。タブレット等で書き
込まれた手書き文字のイメージデータの中には、ノイズ
成分が含まれている場合が多く、イメージデータの書き
始めの部分に乗ることが多い。このノイズの発生原因と
しては、タブレット等のハードウエアの性能に依存する
ことが多い。また、手書き文字は書き込む人各々によっ
て異なり癖がある。そのため、ノイズ以外にハネ、おさ
えや同一文字でも書き込む人により大小様々な文字の部
分的な変形が発生する。そしてそれらは特に手書き文字
の書き始めや書き終わりの部分に発生しやすい。その結
果、データ列変換部20においてノイズ成分やハネ、お
さえや大小様々な文字の部分的な変形が手書き文字のス
トロークの特徴点として抽出され、ベクトル列として変
換されていた。また、標準パターン文字辞書40には、
手書き文字は楷書で書き込まれることを前提とした標準
的なパターンが予め登録されていた。そしてパターン距
離演算部70では、ノイズ成分やハネ、おさえや大小様
々な文字の部分変形の部分ベクトルを含んだ部分ベクト
ル列と、それらを含まない標準的なパターンを予め登録
してある標準パターン文字辞書40との間で累積距離演
算を行なっていた。そのため楷書で書き込まれた入力パ
ターンの部分ベクトル列の累積距離よりも部分変形した
入力パターンの部分ベクトルが加えられただけ累積距離
が大きくなり、手書き文字入力者の意図しない別の標準
パターン文字との累積距離が最小となってしまった。そ
の結果、誤認識の割合が増加してしまったと言う問題を
含んでいた。また、この誤認識を減らすために標準パタ
ーン文字辞書40内に部分的に変形した標準パターン文
字を新たに追加登録する方法で対処することができる。
しかし、パターン距離演算部70では標準パターン文字
辞書40内の全ての標準パターン文字との間の累積距離
を計算するため、標準パターン文字を登録すればするほ
ど計算時間が長くなってしまう。その結果文字認識速度
が遅くなり装置全体の使い勝手が低下してしまうこと
と、標準パターン文字辞書40のメモリ容量が増加して
ハードウエアのコストを増加させてしまうと言う問題を
含んでいた。
【0008】
【課題を解決するための手段】上記課題を解決するため
に、第1の手書き文字認識装置は、手書き文字のイメー
ジデータをストローク単位に入力する手書き文字入力部
と、前記手書き文字入力部に入力した前記ストロークの
特徴をある定められたデータ列に変換するデータ列変換
部と、ある定められたデータ列を標準パターンとして複
数登録してある標準パターン文字辞書と、前記データ列
変換部で変換された前記データ列と複数の前記標準パタ
ーンとを演算処理によりマッチングをとるパターンマッ
チング部とを有し、前記パターンマッチング部は前記デ
ータ列と複数の前記標準パターンとの距離を動的計画法
を用いて演算し累積距離を求める累積距離演算手段と、
前記データ列変換部で変換された前記データ列と前記標
準パターン文字辞書のパターンとから始点近傍パターン
に存在してもしなくてもよいパターンである不確定パタ
ーン領域を検出する始点不確定パターン領域検出手段
と、前記累積距離を累積せず固定とする距離固定手段と
を有し、前記始点不確定パターン領域検出手段で不確定
パターン領域であることが検出されると、前記不確定パ
ターン領域の前記累積距離を前記距離固定手段を用いて
固定とし、前記不確定パターン領域の周辺から前記累積
距離演算手段を用いて前記累積距離を求めることを特徴
とする。また、第2の発明の手書き文字認識装置は、手
書き文字のイメージデータをストローク単位に入力する
手書き文字入力部と、前記手書き文字入力部に入力した
前記ストロークの特徴をある定められたデータ列に変換
するデータ列変換部と、ある定められたデータ列を標準
パターンとして複数登録してある標準パターン文字辞書
と、前記データ列変換部で変換された前記データ列と複
数の前記標準パターンとを演算処理によりマッチングを
とるパターンマッチング部とを有し、前記パターンマッ
チング部は前記データ列と複数の前記標準パターンとの
距離を動的計画法を用いて演算し累積距離を求める累積
距離演算手段と、前記データ列変換部で変換された前記
データ列と前記標準パターン文字辞書のパターンとから
終点近傍パターンに存在してもしなくてもよいパターン
である不確定パターン領域を検出する終点不確定パター
ン領域検出手段と、前記距離の前記累積距離への寄与を
減少させる減衰手段とを有し、前記終点不確定パターン
領域検出手段で不確定パターン領域であることが検出さ
れると、前記減衰手段を用いて前記累積距離を求めるこ
とを特徴とする。
【0009】また、第1および第2の手書き文字認識装
置は、手書き文字のストロークの特徴をある定められた
データ列に変換したデータ列と複数の標準パターンとの
距離を動的計画法を用いて演算し、前記データ列の始点
不確定パターン領域では距離固定手段を用いて累積距離
を0とし、終点不確定パターン領域では減衰手段を用い
て前記距離を0とすることを特徴とする。
【0010】
【作用】第1の発明の手書き文字認識装置によれば、入
力部に手書き文字のイメージがストローク単位に入力さ
れる。入力されたストロークデータはデータ列変換部で
ある定められたデータ列に変換される。その後ある定め
られたデータ列に変換された入力ストロークのデータ列
と全ての標準パターンとの間で、累積距離演算手段を用
いて累積距離を求める。その際、始点不確定パターン領
域検出手段で不確定パターン領域が検出されると、不確
定パターン領域の累積距離を、距離固定手段で累積せず
固定する。そして、全ての標準パターン文字の中で累積
距離が最小となる標準パターン文字を認識文字とする。
【0011】第2の発明の手書き文字認識装置によれ
ば、入力部に手書き文字のイメージがストローク単位に
入力される。入力されたストロークデータはデータ列変
換部である定められたデータ列に変換される。その後あ
る定められたデータ列に変換された入力ストロークのデ
ータ列と全ての標準パターンとの間で、累積距離演算手
段を用いて累積距離を求める。その際、終点不確定パタ
ーン領域検出手段で不確定パターン領域が検出される
と、不確定パターン領域の入力ストロークデータ列と標
準パターンとの距離の累積距離への寄与を減衰手段で減
少させる。そして、全ての標準パターン文字の中で累積
距離の最小となる標準パターン文字を認識文字とする。
【0012】また、第1および第2の手書き文字認識装
置は、始点不確定パターン領域検出手段または終点不確
定パターン領域検出手段により不確定パターン領域が検
出されると、始点不確定パターン領域内では距離固定手
段により累積距離を0とし、終点不確定パターン領域内
では減衰手段により距離を0として累積距離を求める。
【0013】
【実施例】以下、第1の発明の手書き文字認識装置およ
び第2の発明の手書き文字認識装置の実施例について添
付図面を参照して説明する。
【0014】本実施例では不確定パターン領域として、
標準パターンを構成する部分ベクトル列のbit6また
はbit7がセットされた部分ベクトルと、入力パター
ンの最初または最後の部分ベクトルとの間で距離を求め
る場合の領域とする。また不確定パターン領域での距離
は0とした。
【0015】図1は、第1および第2の発明の手書き文
字認識装置の実施例の構成を示すブロック図である。同
図より、手書き文字認識装置には、手書き文字を書き込
むためのタブレット11およびぺン12、タブレット1
1から送られてくる手書き文字のイメージをストローク
単位に取り込み、取り込んだストロークを部分ベクトル
列に変換し認識結果を出力するまでを制御するプログラ
ムが組み込まれた読み出し専用の認識プログラムメモリ
100、認識プログラムメモリ100にはタブレット1
1から時系列的に順次入力される手書き文字の座標デー
タをストローク単位にサンプリングする処理や、サンプ
リングしたストロークの位置及び大きさを縮小したり拡
大して正規化する処理等を行なう前処理21、前処理2
1で得られたストロークデータは、ストロークの始点、
終点、そしてストロークの屈曲している点等を演算処理
により算出し取り出し、取り出した点をストロークの特
徴点とするストローク特徴点抽出22、ストローク特徴
点抽出22で取り出された特徴点を図5(a)に示す1
6方向ベクトルで直線近似化するベクトル化23、後述
する標準パターン文字辞書40に予め登録してある全て
の標準パターンとベクトル化23で16方向ベクトル列
化されたストロークの特徴点との間で累積距離を求める
累積距離演算手段31と、標準パターン文字辞書40に
予め登録してある標準パターンの部分ベクトル中に存在
してもしなくてもよい不確定パターンがあり、かつ入力
した16方向ベクトル列の最初または最後の部分ベクト
ルでの距離計算であるのかを検出する始点不確定パター
ン領域検出手段32および終点不確定パターン領域検出
手段33と、始点不確定パターン領域検出手段32で不
確定パターン領域が検出されると、不確定パターン領域
での距離を累積せずに固定する距離固定手段34と、終
点不確定パターン領域検出手段33で不確定パターン領
域が検出されると、不確定パターン領域内の距離の累積
距離への寄与を減少させる減衰手段35とからなるプロ
グラムである。そしてこれらの手段を用いて全ての標準
パターンとの間の累積距離を求め、累積距離の最小とな
った標準パターン文字辞書40内の標準パターンを認識
結果とする。バッファメモリ80は、タブレット11で
取り込んだ手書き文字の座標データや、認識プログラム
メモリ100等で一時的にデータを記憶させておくとき
のためのメモリである。標準パターン文字辞書40は、
複数の標準パターン文字のシフトJISコードと、その
パターンを構成する16方向部分ベクトル列で構成さ
れ、読みだし専用メモリ内に納められている。CPU9
0は、文字認識装置全体を制御する。ディスプレイ50
は、手書き文字のイメージデータや書き込むための複数
の情報を表示したり、認識プログラムメモリ100で認
識された認識文字等を表示する。なお、ディスプレイ5
0とタブレット11は、一体化された構造になってい
る。
【0016】次に第1および第2の実施例の処理の流れ
について、図2の(a)(b)を用いて説明する。
【0017】まず、図2の(a)の概念図を用いて、第
1の実施例の処理の流れを説明する。手書き文字入力部
10に入力された手書き文字のイメージデータが座標デ
ータとしてデータ列変換部20に送られ、座標データの
サンプリング、特徴抽出、16方向部分ベクトル列化等
の処理が行なわれる。そしてデータ列変換部20で部分
ベクトル列化された手書き文字のイメージデータがパタ
ーンマッチング部30に送られる。パターンマッチング
部30では、入力した16方向部分ベクトル列と全ての
標準パターン文字辞書40内の標準パターンとの間の累
積距離を累積距離演算手段31で計算する。ここで始点
不確定パターン領域検出手段32において、標準パター
ン文字辞書40内の標準パターンの部分ベクトル列中
に、存在してもしなくてもよい不確定パターンがあり、
かつ入力した部分ベクトル列の最初の部分ベクトルとの
間の距離計算であることが検出されると、距離固定手段
34から距離を0とする指令が出される。そしてその距
離の値0を累積距離とする。このようにして全ての標準
パターン文字辞書40内の標準パターンとの累積距離を
求める。そして一番累積距離の小さい標準パターンのシ
フトJISコードが手書き文字のイメージデータの認識
結果となり、そのシフトJISコードが文字に変換され
ディスプレイ50に表示される。
【0018】次に、図2の(b)の概念図を用いて、第
2の実施例の処理の流れを説明する。手書き文字入力部
10に入力された手書き文字のイメージデータが座標デ
ータとしてデータ列変換部20に送られ、座標データの
サンプリング、特徴抽出、16方向部分ベクトル列化等
の処理が行なわれる。そしてデータ列変換部20で部分
ベクトル列化された手書き文字のイメージデータがパタ
ーンマッチング部30に送られる。パターンマッチング
部30では、入力した16方向部分ベクトル列と標準パ
ターン文字辞書40内の標準パターンとの間の累積距離
を累積距離演算手段31で計算する。ここで終点不確定
パターン領域検出手段33において、標準パターン文字
辞書40内の標準パターンの部分ベクトル列中に、存在
してもしなくてもよい不確定パターンがあり、かつ入力
した部分ベクトル列の最後の部分ベクトルとの間の距離
計算であることが検出されると、減衰手段35から距離
を0とする指令が出される。そしてその距離の値0を累
積距離とする。このようにして全ての標準パターン文字
辞書40内の標準パターンとの累積距離を求める。そし
て一番累積距離の小さい標準パターンのシフトJISコ
ードが手書き文字のイメージデータの認識結果となり、
そのシフトJISコードが文字に変換されされディスプ
レイ50に表示される。
【0019】次に、各処理ごとの動作について図8およ
び図9の全体の処理の流れと対応させながら説明する。
図8および図9は認識プログラムメモリ100内の処理
の流れを示したフロチャートである。この処理は装置に
電源が投入されると処理がスタートし、電源が切られる
までこの処理を続ける。まず、手書き文字入力部10で
は、手書き文字のイメージデータをぺン12を用いてタ
ブレット11に書き込むと、書き込まれた手書き文字の
イメージデータの軌跡が、タブレット11上の座標デー
タに変換される。この座標データには、タブレット11
に書き込まれた手書き文字イメージデータの他に、ぺン
12がタブレット11に接したこと(以下ペンダウンと
呼ぶ)および離れたこと(以下ペンアップと呼ぶ)を示
す監視データが含まれている。そしてイメージデータと
監視データは、お互いに区別することができるデータの
構成になっている。
【0020】データ列変換部20では、タブレット11
の座標データを前処理21でサンプリングし(ステップ
111)、サンプリングした座標データからペンダウン
したのかを判断する(ステップ112)。ペンダウンで
ない場合にはステップ111に戻りたタブレット11の
座標データを再びサンプリングする。ペンダウンした場
合には、ペンアップするまでタブレット11に書き込ま
れた手書き文字の座標データをサンプリングする(ステ
ップ112、113)。ステップ111とステップ11
3でサンプリングされた座標データはバッファメモリ8
0に転送され、後の処理で再び読み込まれ使用される。
ペンアップになるとストローク数がカウントアップさ
れ、サンプリングした座標データと対応させた状態でバ
ッファメモリ80に転送される(ステップ115)。そ
の後タブレット11に再び手書き文字が書き込まれるの
かを判断するためにディレイタイマーが働き、ここで設
定された時間を経過してもタブレット11に書き込みが
無い場合は、手書き文字の入力が終了したと判断する
(ステップ116、117、118、120)。ディレ
イ時間を経過する前にペンダウンが確認されると、ディ
レイタイマーをストップさせ(ステップ119)、再び
タブレット11の座標データのサンプリングを開始する
(ステップ111に戻る)。ディレイ時間を経過してペ
ンダウンでないことが確認されると、タブレット11に
書き込まれた手書き文字の大きさを一定にするために、
サンプリングしてバッファメモリ80に記憶させておい
た座標データを正規化する(ステップ121)。正規化
された座標データは、ストローク特徴点抽出22におい
て、ストロークごとにデータ列の中から特徴点となる始
終点や屈曲点を演算処理により抽出される(ステップ1
22、図6)。そして抽出した特徴点をベクトル化23
において、16方向のベクトル(図5(a))で直線近
似する(ステップ123)。ストロークの特徴点および
16方向でベクトル化された部分ベクトル列は、バッフ
ァメモリ80に転送され記憶されている。
【0021】次にパターンマッチング部30では、バッ
ファメモリ80に記憶されている16方向部分ベクトル
列と標準パターン文字辞書40との間で、動的計画法を
用いて距離を計算する。パターンマッチング部30は、
距離を計算し累積距離を求める累積距離演算手段31
と、標準パターンの中に存在してもしなくてもよい不確
定パターンがあるのかを確認し、かつ入力した16方向
部分ベクトル列の最初または最後の部分ベクトルに対し
て距離を計算するのかを確認する始点不確定パターン領
域検出手段32および終点不確定パターン領域検出手段
33と、始点不確定パターン領域検出手段32で不確定
パターン領域を検出すると、不確定パターン領域内の距
離を0として累積距離を求める距離固定手段34と、終
点不確定パターン領域検出手段33で不確定パターン領
域を検出すると、不確定パターン領域内の距離を0とし
て累積距離を求める減衰手段35とによって構成されて
いる(ステップ124)。これらパターンマッチング部
30の処理の流れについて図10〜図12のフロチャー
トを用いて説明する。累積距離演算手段31では前述の
漸化式(1)を用いて計算する。まず累積距離演算手段3
1では、入力パターンAと標準パターンBの累積距離g
(i,j)の初期値として、g(0,0)を求める(ステップ13
0、131)。次に、g(1,0)から入力パターンAの最終
部分ベクトル(aimax)までの標準パターンBの部分ベ
クトルb0との累積距離を求める(ステップ132、13
3、134、135)。同様に、g(0,1)から標準パター
ンBの最終部分ベクトル(bjmax)までの入力パターン
Aの部分ベクトルa0との累積距離を求める(ステップ1
36、137、138、139)。そして、g(1,1)から
入力パターンAの最終部分ベクトル(aimax)および標
準パターンBの最終部分ベクトル(bjmax)までの各々
の部分ベクトルの格子点における累積距離を求める(ス
テップ140、141、142、143、144、14
5)。
【0022】また、各々の格子点における累積距離を求
めるときに始点不確定パターン領域検出手段32、終点
不確定パターン領域検出手段33、距離固定手段34お
よび減衰手段35を用いており、その処理内容を図12
のフロチャートに示す。これは、図10および図11の
フロチャートにおいてサブルーチン化されている「距離
計算」(ステップ131、133、137、141)に
相当する。図12では、始点不確定パターン領域検出手
段32および終点不確定パターン領域検出手段33がス
テップ146および148に相当し、距離固定手段34
および減衰手段35がステップ149および151に相
当し、累積距離演算手段31がステップ147、152
に相当する。ステップ150は累積距離の初期値である
g(0,0)を演算するときの判断に用いる。まず、標準パタ
ーンBの部分ベクトルのbit6またはbit7がセッ
トされているのかを確認する。セットされている場合に
は入力パターンAの部分ベクトルがa0またはaimaxとの
間での距離計算を実行しようとしているのかを確認する
(ステップ146、148)。bit6は標準パターン
Bの部分ベクトルが終点不確定パターン領域を示すビッ
トで、bit7は始点不確定パターン領域を示すビット
で、入力パターンAの部分ベクトル列中に存在してもし
なくてもよい不確定なパターンであることを表わしてい
る。bit6またはbit7が標準パターンBの部分ベ
クトルにセットされていて、かつ入力パターンAの部分
ベクトルがa0またはaimaxで距離を計算する場合は、距
離d(i,j)の値をを0にセットする(ステップ149)。
そして更にその距離d(i,j)を累積距離g(i,j)としてセッ
トする(ステップ151)。bit6またはbit7が
セットされていない場合、またはセットされていても入
力パターンAの部分ベクトルがa0またはaimax以外で
は、距離d(i,j)に‖ai-bj‖をセットする(ステップ1
47)。そして累積距離の初期値g(0,0)を求める計算で
あるのかを確認する(ステップ150)。初期値g(0,0)
を求める場合はステップ151に進み、それ以外はステ
ップ152に進み累積距離を計算する。このようにして
求められた累積距離g(i,j)の最短距離を示す経路の例を
図13に示す。横軸は入力パターンA、縦軸は標準パタ
ーンBで、標準パターンBの部分ベクトルb0、b1および
bjmax-1、bjmaxは不確定パターンとして登録されてい
る。図13で太線で囲った領域は、始点不確定パターン
領域検出手段32および終点不確定パターン領域検出手
段33でそれぞれ始点領域または終点領域で不確定パタ
ーンであることが検出され、距離固定手段34または減
衰手段35により距離d(i,j)の値を0として累積距離を
求めた領域である。すなわちこの太線で囲った領域内で
は累積距離が0となる。従って、入力パターンAの部分
ベクトルa0またはaimaxが如何なるベクトルであっても
標準パターンBの部分ベクトルb0,b1またはbjmax-1,bjm
axと一致していることとなる。その結果、太線で囲った
不確定パターン領域内における標準パターンBの部分ベ
クトルb0,b1またはbjmax-1,bjmaxが入力パターンAの最
初または最後の部分ベクトルに存在してもしなくても、
距離d(i,j)は0で固定される。よって、入力パターンA
と標準パターンBとの累積距離演算を開始する際におい
て、始点不確定パターン領域の周辺である(a0,b2),(a1,
b0),(a1,b1),(a1,b2)の何れかの格子点から累積距離演
算を開始しても、始点不確定パターン領域内のg(0,0)か
ら計算を開始した場合と等価になる。また、終点不確定
パターン領域内では距離が全て0となり累積距離も0と
なる。従って累積距離演算を終了させる際において、終
点不確定パターン領域の周辺である(aimax,bjmax-2),(a
imax-1,bjmax-2),(aimax-1,bjmax-1),(aimax-1,bjmax)
の何れかの格子点で終了しても、累積距離演算の最終で
あるg(imax,jmax)で終了した場合と等価になる。
【0023】では、図6の手書き文字入力部10に入力
したサンプルを用い、パターンマッチング部30につい
て説明する。図6は手書き文字「て、h、b」を入力
し、データ列変換部20で16方向部分ベクトル列に変
換されるまでを示した図である。パターンマッチング部
30に部分ベクトル列が引き渡されるときには、16方
向の部分ベクトル列(16進表示)の数値で引き渡され
る。各々のデータが16方向化された1本の部分ベクト
ルを表わしている。また、図6の(a)は手書き文字の
始点と終点にハネやおさえの含まれたサンプルの一例で
ある。また、図6の(b)(c)は「h」を筆記体とブ
ロック体で書き込んだ手書き文字、(d)は「b」をブ
ロック体で書き込んだ手書き文字のサンプルの一例であ
る。図7の(c)は標準パターン文字辞書40を構成す
る辞書の一部を示した図で、標準パターン文字のシフト
JISコード(16進表示)と16方向ベクトル列で表
現された部分ベクトル列(16進表示)からなる。ここ
で、例として図6の(b)(c)の「h」をパターンマ
ッチング部30で累積距離を計算することとする。標準
パターン文字辞書40の「h」には、図6(c)のブロ
ック体で書かれた「h」の形をした文字のみが標準パタ
ーンとして登録されているものとして累積距離を計算し
てみる。その結果、筆記体「h」は始点付近と終点付近
の部分ベクトル列の中に、ブロック体「h」には存在し
ない部分ベクトルがあるため、その存在しない部分ベク
トルの距離だけ筆記体「h」の累積距離が大きくなる。
従って、同じ小文字の「h」ではあるが累積距離が異な
る。よって、ブロック体の「h」は標準パターン文字の
「h」との累積距離が0となり最小となるが、筆記体
「h」は「h」以外の標準パターン文字との累積距離が
最小となる可能性が高くなる。しかし、図6(b)
(c)の「h」文字の形に着目すると、文字全体として
は形は異なるが、図6(b)の筆記体文字の書き始めの
部分と書き終わりの部分を取り去るとブロック体で書か
れた図6(c)と類似した形となる。図7(a)にその
過程を示す。筆記体で書かれた手書き文字「h」は、図
7(a)の点線で示す部分を削除することで、ブロック
体で書かれた手書き文字「h」と類似した形にすること
ができる。このことから筆記体で書かれた「h」は、ブ
ロック体で書かれた「h」の形を基本として、始点付近
と終点付近の形が部分的に変形した文字として扱うこと
ができる。よって図6の(b)(c)の文字は、図7
(a)の書き始めの点線部分の部分ベクトルを始点不確
定パターンとし、書き終わりの点線部分の部分ベクトル
を終点不確定パターンとして標準パターン文字辞書40
に登録することで、始点不確定パターン領域検出手段3
2または終点不確定パターン領域検出手段33により不
確定パターン領域として検出することが可能となる。そ
して、標準パターンとの距離は始点不確定パターン領域
では距離固定手段34で0となり、終点不確定パターン
領域では減衰手段35で0となるため、図7(a)の点
線部分の入力パターンは存在してもしなくても筆記体お
よびブロック体「h」の累積距離は同じになる。従っ
て、図6(b)(c)の文字は不確定パターンを登録し
た標準パターン文字「h」を介することで、1つの同じ
標準パターン文字を最小累積距離として計算することが
できる。図7(c)に不確定パターンを登録した標準パ
ターン文字辞書40の構成を示す。「h」では、16方
向部分ベクトル列の中で「81、81、81、87、8
8(16進データ)」が始点不確定パターンとして登録
したパターンで、「41、42(16進データ)」が終
点不確定パターンとして登録したパターンである。
「て」においては「87(16進データ)」と「44
(16進データ)」とがそれぞれ始点不確定パターンと
終点不確定パターンである。また、図14(a)に図6
(b)の筆記体で書かれた「h」と、不確定パターンを
登録した標準パターンである図7(c)の「h」との累
積距離である漸化式(1)のg(i,j)の演算結果の経路を示
す。図14(b)も同様に、図6(c)と図7(c)の
「h」とのg(i,j)の演算結果の経路を示した図である。
図14(a)と(b)において、太線で囲った領域は始
点または終点不確定パターン領域を示す。始点不確定パ
ターン領域では、距離固定手段34により各格子点の距
離d(i,j)が0となるため、累積距離g(i,j)は0で固定さ
れる。また、終点不確定パターン領域では減衰手段35
により入力パターンと標準パターンの部分ベクトル間の
距離d(i,j)が如何なる値であっても距離d(i,j)は0とな
る。その結果、図14(b)の終点不確定パターン領域
内の距離のように、実際に求められた標準パターンと入
力パターンの部分ベクトル間の距離より小さい距離とな
る。最終的な累積距離g(i,j)は、図14(a)では入力
パターン「2」と標準パターン「42」とのg(i,j)であ
り、図14(b)では入力パターン「b」と標準パター
ン「42」との累積距離g(i,j)を求めることである。そ
してそれら累積距離を求めると0となる。従って、図7
(c)の「h」の標準パターンを登録することで、図6
(b)(c)の筆記体およびブロック体「h」は同じ文
字としてマッチングすることができる。
【0024】次に、入力パターンにブロック体の「h」
と類似した形の図6(d)のブロック体「b」を入力
し、不確定パターンを登録した標準パターンに図7
(c)「h」との間の累積距離を求めてみる。図15が
漸化式(1)のg(i,j)の演算結果の経路を示した図であ
る。パターンマッチング部30の累積距離演算手段31
において、始点不確定パターン領域と終点不確定パター
ン領域の距離d(i,j)は距離固定手段34または減衰手段
35により0となる。しかし、入力パターン「b」の中
の最後から2番目の部分ベクトル「9」が標準パターン
の中に存在しないため、入力パターン「9」と標準パタ
ーン「41」との累積距離g(i,j)の演算結果は「8」と
なる。その結果、最終的な累積距離g(i,j)の演算結果で
ある入力パターン「8」と標準パターン42」との累積
距離は「2」となる。従って、不確定パターンを登録し
た「h」の標準パターンと入力パターン「b」との間で
累積距離を求めると、図7(b)のブロック体「b」の
文字における点線部分が不確定パターンとして登録した
パターンと異なる。よって、前述のように不確定パター
ンとして登録した筆記体の「h」を入力したときよりも
累積距離が大きくなる。従って、「h」と「b」のよう
に形の類似している文字に対しては同じ累積距離になら
ず、「h」と「b」を区別することができる。
【0025】次に、ハネとおさえを含んだ文字例である
図6(a)の「て」についてパターンマッチング部30
で累積距離を求めてみる。ハネやおさえは入力パターン
の最初の部分ベクトルまたは最後の部分ベクトルに含ま
れることが多い。ハネやおさえが含まれた部分ベクトル
列で累積距離を計算すると、ハネやおさえの部分ベクト
ルだけ累積距離が増加してしまう。そこで、標準パター
ンの最初の部分ベクトルおよび最後の部分ベクトルを不
確定パターンとして登録しておくことで、ハネやおさえ
の部分ベクトルを削除することができる。これは、パタ
ーンマッチング部30では入力パターンの最初または最
後の部分ベクトルは不確定パターン領域では、距離固定
手段34または減衰手段35により距離が0となるから
である。従って、ハネやおさえに影響されない標準パタ
ーンとの間の累積距離を求めることができる。
【0026】このようにしてパターンマッチング部30
では、標準パターン文字辞書40に予め登録してある全
ての標準パターンとの間で累積距離を求め、その結果を
バッファメモリ80に転送する。
【0027】その後バッファメモリ80に記憶させてあ
った累積距離値の中から、最小となる累積距離を示した
標準パターン文字辞書40内の標準パターンのシフトJ
ISコードを文字に変換する(ステップ125)。そし
て、変換した文字を認識結果としてディスプレイ50上
に表示する(ステップ126)。
【0028】なお、図12ステップ149、151の距
離固定手段34が実行される条件として、標準パターン
の部分ベクトルのbit6またはbit7がセットされ
ていて、かつ入力パターンAの部分ベクトルの範囲をa0
またはaimaxの時の距離d(i,j)を求める場合に限定した
が(ステップ148)、入力パターンAの部分ベクトル
の範囲を1つに限定することなく複数の部分ベクトルに
まで範囲を拡大することができ、入力パターンAの部分
ベクトルの範囲を可変することができる。
【0029】また、本実施例では不確定パターン領域が
検出されると距離固定手段34で距離d(i,j)を0とした
が(図12のステップ149)、入力パターンAと標準
パターンBとの部分ベクトル間の距離‖ai-bj‖を用い
てもよい。
【0030】また、上記のように距離d(i,j)に部分ベク
トル間の距離‖ai-bj‖の値を用いる場合、終点不確定
パターン領域内では減衰手段35において、距離‖ai-b
j‖の値に0より大きく1より小さい範囲での定数を掛
け合わせ、距離‖ai-bj‖を減少させた値を用いてもよ
い。
【0031】また、データ列変換部20においてストロ
ークの特徴点を16方向でベクトル化したが、図5
(b)に示す8方向ベクトルを用いてもよい。
【0032】
【発明の効果】以上のように本発明によれば、手書き文
字の部分的に変形した文字の大小に関わらず、変形して
いない文字として扱うことができ、精度の高い認識を行
なうことができる。また、標準パターンに部分変形して
いない文字の他に部分変形している文字までを登録する
必要が無く、1または数個の標準パターンで累積距離演
算をすることができることで累積距離演算時間が短くな
り、スピーディーで快適な認識環境が実現でき、更に標
準パターンのメモリサイズをコンパクトな容量にするこ
とができる。
【図面の簡単な説明】
【図1】 本発明の手書き文字認識装置の構成を示すブ
ロック図。
【図2】 本発明の手書き文字の処理の流れを示す概略
図。
【図3】 従来の手書き文字認識装置の処理の流れを示
す概略図。
【図4】 動的計画法によるパターンマッチングの原理
を説明するための図。
【図5】 手書き文字をベクトル列化するための方向
図。
【図6】 手書き文字入力部とデータ列変換部の処理結
果を示す図。
【図7】 部分変形した手書き文字と不確定パターンを
登録した標準パターン文字辞書内の構成を説明する図。
【図8】 認識プログラムメモリの処理の流れを示すフ
ロチャート。
【図9】 認識プログラムメモリの処理の流れを示すフ
ロチャート(図8のつづき)。
【図10】 パターンマッチング部の処理の流れを示す
フロチャート。
【図11】 パターンマッチング部の処理の流れを示す
フロチャート(図10のつづき)。
【図12】 始点不確定パターン領域検出手段、終点不
確定パターン領域検出手段、距離固定手段および減衰手
段の処理の流れを示すフロチャート。
【図13】 パターンマッチング部の動的計画法による
パターンマッチングを説明するための図。
【図14】 部分変形した文字と部分変形していない文
字の累積距離演算経路を説明するための図。
【図15】 類似文字の累積距離演算経路を説明するた
めの図。
【符号の説明】
10 手書き文字入力部 20 データ列変換部 30 パターンマッチング部 31 累積距離演算手段 32 始点不確定パターン領域検出手段 33 終点不確定パターン領域検出手段 34 距離固定手段 35 減衰手段 40 標準パターン文字辞書
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き文字のイメージデータをストロー
    ク単位に入力する手書き文字入力部と、前記手書き文字
    入力部に入力した前記ストロークの特徴をある定められ
    たデータ列に変換するデータ列変換部と、ある定められ
    たデータ列を標準パターンとして複数登録してある標準
    パターン文字辞書と、前記データ列変換部で変換された
    前記データ列と複数の前記標準パターンとを演算処理に
    よりマッチングをとるパターンマッチング部とを有し、
    前記パターンマッチング部は前記データ列と複数の前記
    標準パターンとの距離を動的計画法を用いて演算し累積
    距離を求める累積距離演算手段と、前記データ列変換部
    で変換された前記データ列と前記標準パターン文字辞書
    のパターンとから始点近傍パターンに存在してもしなく
    てもよいパターンである不確定パターン領域を検出する
    始点不確定パターン領域検出手段と、前記累積距離を累
    積せず固定とする距離固定手段とを有し、前記始点不確
    定パターン領域検出手段で不確定パターン領域であるこ
    とが検出されると、前記不確定パターン領域の前記累積
    距離を前記距離固定手段を用いて固定とし、前記不確定
    パターン領域の周辺から前記累積距離演算手段を用いて
    前記累積距離を求めることを特徴とする手書き文字認識
    装置。
  2. 【請求項2】 手書き文字のイメージデータをストロー
    ク単位に入力する手書き文字入力部と、前記手書き文字
    入力部に入力した前記ストロークの特徴をある定められ
    たデータ列に変換するデータ列変換部と、ある定められ
    たデータ列を標準パターンとして複数登録してある標準
    パターン文字辞書と、前記データ列変換部で変換された
    前記データ列と複数の前記標準パターンとを演算処理に
    よりマッチングをとるパターンマッチング部とを有し、
    前記パターンマッチング部は前記データ列と複数の前記
    標準パターンとの距離を動的計画法を用いて演算し累積
    距離を求める累積距離演算手段と、前記データ列変換部
    で変換された前記データ列と前記標準パターン文字辞書
    のパターンとから終点近傍パターンに存在してもしなく
    てもよいパターンである不確定パターン領域を検出する
    終点不確定パターン領域検出手段と、前記距離の前記累
    積距離への寄与を減少させる減衰手段とを有し、前記終
    点不確定パターン領域検出手段で不確定パターン領域で
    あることが検出されると、前記減衰手段を用いて前記累
    積距離を求めることを特徴とする手書き文字認識装置。
  3. 【請求項3】 手書き文字のストロークの特徴をある定
    められたデータ列に変換したデータ列と複数の標準パタ
    ーンとの距離を動的計画法を用いて演算し、前記データ
    列の始点不確定パターン領域では距離固定手段を用いて
    累積距離を0とし、終点不確定パターン領域では減衰手
    段を用いて前記距離を0とすることを特徴とする、請求
    項1および請求項2記載の手書き文字認識装置。
JP04106902A 1992-04-24 1992-04-24 手書き文字認識装置 Expired - Fee Related JP3125432B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04106902A JP3125432B2 (ja) 1992-04-24 1992-04-24 手書き文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04106902A JP3125432B2 (ja) 1992-04-24 1992-04-24 手書き文字認識装置

Publications (2)

Publication Number Publication Date
JPH05303666A JPH05303666A (ja) 1993-11-16
JP3125432B2 true JP3125432B2 (ja) 2001-01-15

Family

ID=14445392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04106902A Expired - Fee Related JP3125432B2 (ja) 1992-04-24 1992-04-24 手書き文字認識装置

Country Status (1)

Country Link
JP (1) JP3125432B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024764A (ja) * 2000-07-05 2002-01-25 Fujitsu Ltd 手書き文字平均パターン生成装置及び方法
CN116048372A (zh) * 2023-03-06 2023-05-02 上海合见工业软件集团有限公司 一种用于eda软件的笔触命令系统

Also Published As

Publication number Publication date
JPH05303666A (ja) 1993-11-16

Similar Documents

Publication Publication Date Title
US5742705A (en) Method and apparatus for character recognition of handwritten input
US6556712B1 (en) Methods and apparatus for handwriting recognition
US8180160B2 (en) Method for character recognition
JP3176023B2 (ja) 手書き入力照合方法および装置
US7068843B2 (en) Method for extracting and matching gesture features of image
WO1997044758A9 (en) Methods and apparatuses for handwriting recognition
JPH05324903A (ja) パターン認識装置
JPH10214267A (ja) 手書き文字記号処理装置および手書き文字記号処理装置の制御プログラムを記録した媒体
JP3125432B2 (ja) 手書き文字認識装置
JPH1153104A (ja) ペン型入力装置及びペン型入力装置のパターン認識方法
JP3192468B2 (ja) オンライン手書き文字認識装置及び認識方法
KR0126800B1 (ko) 한글필기체 온라인 문자인식 장치 및 방법
JP2762472B2 (ja) 文字認識方法および文字認識装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
AU764561B2 (en) Method and apparatuses for handwriting recognition
JP2671985B2 (ja) 情報認識方法
JP2990716B2 (ja) 文字認識方法及び文字認識装置
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JPH0443316B2 (ja)
JP2851865B2 (ja) 文字認識装置
JPH10247221A (ja) オンライン文字認識装置
JP3411949B2 (ja) 筆順及び続け字登録方法
JP3760040B2 (ja) 文字認識方法、文字認識装置及び情報記録媒体
JPH09147052A (ja) オンライン手書き文字認識方法及びオンライン手書き文字認識のための文字記述方法
JPH05135208A (ja) オンライン文字認識方法およびオンライン文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071102

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081102

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees