JP3366443B2 - 文字認識方法および装置 - Google Patents
文字認識方法および装置Info
- Publication number
- JP3366443B2 JP3366443B2 JP15525894A JP15525894A JP3366443B2 JP 3366443 B2 JP3366443 B2 JP 3366443B2 JP 15525894 A JP15525894 A JP 15525894A JP 15525894 A JP15525894 A JP 15525894A JP 3366443 B2 JP3366443 B2 JP 3366443B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- input
- feature
- recognition
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】本発明は、文字認識方法および装
置に関し、特に、オンライン手書き文字認識方法および
装置に関する。
置に関し、特に、オンライン手書き文字認識方法および
装置に関する。
【0002】
【従来の技術】従来、ペンの入力ストロークに基づいて
手書き文字の認識を行うオンライン文字認識方法におい
ては、入力文字の特徴量と予め登録されている文字の特
徴量との類似性を基にして文字認識を行うようになされ
ていた。
手書き文字の認識を行うオンライン文字認識方法におい
ては、入力文字の特徴量と予め登録されている文字の特
徴量との類似性を基にして文字認識を行うようになされ
ていた。
【0003】この場合、入力文字の特徴量を得るための
方法としては、文字入力面にペンが接触している間に検
出される断片的なペン先の位置座標データを用いて、 ・ストローク方向と相対的な位置とを特徴量とする方法 ・ストロークの位置座標の特徴点を近似する方法 ・ストロークの時間的な位置の変化をフーリエ変換など
によって解析する方法などが代表的な方法であった。
方法としては、文字入力面にペンが接触している間に検
出される断片的なペン先の位置座標データを用いて、 ・ストローク方向と相対的な位置とを特徴量とする方法 ・ストロークの位置座標の特徴点を近似する方法 ・ストロークの時間的な位置の変化をフーリエ変換など
によって解析する方法などが代表的な方法であった。
【0004】そして、以上のような方法により得られる
特徴量と、予め作成しておいた所定の文字辞書(種々の
文字コードとその特徴量との組を格納する辞書)との間
で逐次的に特徴量のマッチングを行い、最も類似性が高
い文字を認識結果として得るようにしていた。
特徴量と、予め作成しておいた所定の文字辞書(種々の
文字コードとその特徴量との組を格納する辞書)との間
で逐次的に特徴量のマッチングを行い、最も類似性が高
い文字を認識結果として得るようにしていた。
【0005】
【発明が解決しようとする課題】ペンを用いて文字を入
力する場合、本来正しい順序で入力されるべき文字の筆
順が誤って入力されることが考えられる。このような場
合に、上述のような方法を単純に適用したのでは文字を
正確に認識できないことがあった。
力する場合、本来正しい順序で入力されるべき文字の筆
順が誤って入力されることが考えられる。このような場
合に、上述のような方法を単純に適用したのでは文字を
正確に認識できないことがあった。
【0006】ところが、上記従来例においては、このよ
うな場合に対応するために、よく誤る可能性のある筆順
を予め予測して辞書化しておくといった程度の対策しか
講ずることができず、あまり効果を上げることができな
かった。
うな場合に対応するために、よく誤る可能性のある筆順
を予め予測して辞書化しておくといった程度の対策しか
講ずることができず、あまり効果を上げることができな
かった。
【0007】また、続け字に対しては、各文字のストロ
ーク間を直線的に補間することによって各ストロークを
結合させて別のストロークパターンを生成し、このスト
ロークパターンを構成要素とする文字を、続け字に相当
する文字として予め辞書に登録するという対策がなされ
ていた。
ーク間を直線的に補間することによって各ストロークを
結合させて別のストロークパターンを生成し、このスト
ロークパターンを構成要素とする文字を、続け字に相当
する文字として予め辞書に登録するという対策がなされ
ていた。
【0008】以上のような対策を採る場合には、文字辞
書のデータ量が増大してしまうという問題があった。さ
らに、この増大した文字辞書との間で逐次的なマッチン
グを行うと、文字認識のための処理時間も増大してしま
うという問題もあった。
書のデータ量が増大してしまうという問題があった。さ
らに、この増大した文字辞書との間で逐次的なマッチン
グを行うと、文字認識のための処理時間も増大してしま
うという問題もあった。
【0009】本発明は、このような問題を解決するため
に成されたものであり、文字の認識率を高くすることが
できるようにするとともに、その認識処理を高速に行う
ことができるようにすることを目的としている。
に成されたものであり、文字の認識率を高くすることが
できるようにするとともに、その認識処理を高速に行う
ことができるようにすることを目的としている。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の文字認識方法は、種々の手書き文字の筆
跡を時間とともに連続的に変化するX,Y座標の第1の情
報として入力し、該第1の情報を正規化した後、複数の
部分特徴量を抽出して第1の集合として予め登録してお
き、認識対象文字の筆跡を時間とともに連続的に変化す
るX,Y座標の第2の情報として入力し、この入力した第
2の情報を正規化した後、複数の部分特徴量を抽出して
第2の集合を作成し、前記予め登録しておいた第1の集
合と第2の集合とを用いてマッチングをとることにより
文字を認識するようにしている。
めに、本発明の文字認識方法は、種々の手書き文字の筆
跡を時間とともに連続的に変化するX,Y座標の第1の情
報として入力し、該第1の情報を正規化した後、複数の
部分特徴量を抽出して第1の集合として予め登録してお
き、認識対象文字の筆跡を時間とともに連続的に変化す
るX,Y座標の第2の情報として入力し、この入力した第
2の情報を正規化した後、複数の部分特徴量を抽出して
第2の集合を作成し、前記予め登録しておいた第1の集
合と第2の集合とを用いてマッチングをとることにより
文字を認識するようにしている。
【0011】また、本発明の文字認識装置は、種々の手
書き文字の筆跡を時間とともに連続的に変化するX,Y座
標の情報として入力する入力手段と、該入力された情報
を正規化した後、複数の部分特徴量を抽出して集合を作
成する部分特徴量抽出手段と、該抽出された複数の部分
特徴量を集合として登録しておく登録手段と、前記入力
手段から入力された認識対象文字について正規化した
後、前記部分特徴量抽出手段で複数の部分特徴量を抽出
して集合を作成して前記登録手段に登録しておいた集合
と比較する認識手段とを具備する。
書き文字の筆跡を時間とともに連続的に変化するX,Y座
標の情報として入力する入力手段と、該入力された情報
を正規化した後、複数の部分特徴量を抽出して集合を作
成する部分特徴量抽出手段と、該抽出された複数の部分
特徴量を集合として登録しておく登録手段と、前記入力
手段から入力された認識対象文字について正規化した
後、前記部分特徴量抽出手段で複数の部分特徴量を抽出
して集合を作成して前記登録手段に登録しておいた集合
と比較する認識手段とを具備する。
【0012】
【作用】上記のように構成した本発明によれば、認識対
象文字の筆記の開始から終了までのペン先の動きが連続
的な時間変化の座標情報として入力され、この連続的な
座標情報に基づいて抽出された複数の部分特徴量の集合
を用いてマッチングが行われることとなるので、従来の
ように断片的な座標情報に基づいてマッチングを行う場
合に比べて、文字認識の誤りが少なくなる。
象文字の筆記の開始から終了までのペン先の動きが連続
的な時間変化の座標情報として入力され、この連続的な
座標情報に基づいて抽出された複数の部分特徴量の集合
を用いてマッチングが行われることとなるので、従来の
ように断片的な座標情報に基づいてマッチングを行う場
合に比べて、文字認識の誤りが少なくなる。
【0013】また、上記連続的な時間変化の座標情報か
らハッシュ値を求め、このハッシュ値を用いてマッチン
グを行うようにした場合には、種々ある文字の中から幾
つかの認識文字の候補が選び出され、この認識候補を用
いたマッチング処理により最も類似度が高いものが最終
的な認識文字として得られるようになるので、文字認識
率の低下がさらに抑制される。また、マッチング処理の
対象が減るので、その処理時間も短縮される。
らハッシュ値を求め、このハッシュ値を用いてマッチン
グを行うようにした場合には、種々ある文字の中から幾
つかの認識文字の候補が選び出され、この認識候補を用
いたマッチング処理により最も類似度が高いものが最終
的な認識文字として得られるようになるので、文字認識
率の低下がさらに抑制される。また、マッチング処理の
対象が減るので、その処理時間も短縮される。
【0014】
【実施例】以下に、本発明の好適な実施例を図面を参照
して詳細に説明する。図1は、本実施例の概略機能構成
を示す機能ブロック図である。
して詳細に説明する。図1は、本実施例の概略機能構成
を示す機能ブロック図である。
【0015】図1において、1はストローク入力部であ
り、手書き文字の一文字を入力する間、つまりペンが文
字入力面に初めて接触してから、最後にペンが文字入力
面から離されるまでの間に、所定の時間間隔でサンプリ
ングされた座標データの系列X(t),Y(t) を生成する。そ
して、この座標データの系列X(t),Y(t) を文字ストロー
クデータとしてストローク正規化部2へ送る。
り、手書き文字の一文字を入力する間、つまりペンが文
字入力面に初めて接触してから、最後にペンが文字入力
面から離されるまでの間に、所定の時間間隔でサンプリ
ングされた座標データの系列X(t),Y(t) を生成する。そ
して、この座標データの系列X(t),Y(t) を文字ストロー
クデータとしてストローク正規化部2へ送る。
【0016】図2(a)は、文字「あ」と思われる文字
が入力された場合の入力領域内での文字ストロークを示
し、図2(b)は、上記入力された文字ストロークを、
そのx 座標およびy 座標をそれぞれ縦軸とし、時間軸を
横軸としてグラフ化したものを示している。
が入力された場合の入力領域内での文字ストロークを示
し、図2(b)は、上記入力された文字ストロークを、
そのx 座標およびy 座標をそれぞれ縦軸とし、時間軸を
横軸としてグラフ化したものを示している。
【0017】次に、ストローク正規化部2では、入力さ
れた文字ストロークの座標系列X(t),Y(t) を、入力文字
の全体を囲む最小矩形の左下隅の x,y座標が[0,0] 、右
上隅の x,y座標が[255,255] となるように、それぞれの
座標の大きさを正規化する。さらに、時間方向について
も筆記の開始時刻が0 、終了時刻が511 となるように正
規化する。これにより、例えば、図2(b)に示した X
座標についてのグラフは、正規化後には、図3に示すよ
うなグラフになる。このようにして正規化された座標系
列は、特徴ベクトル化部3へ送られる。
れた文字ストロークの座標系列X(t),Y(t) を、入力文字
の全体を囲む最小矩形の左下隅の x,y座標が[0,0] 、右
上隅の x,y座標が[255,255] となるように、それぞれの
座標の大きさを正規化する。さらに、時間方向について
も筆記の開始時刻が0 、終了時刻が511 となるように正
規化する。これにより、例えば、図2(b)に示した X
座標についてのグラフは、正規化後には、図3に示すよ
うなグラフになる。このようにして正規化された座標系
列は、特徴ベクトル化部3へ送られる。
【0018】特徴ベクトル化部3では、上記正規化され
た各座標系列x(t),y(t) について時間近傍の部分特徴量
である特徴量ベクトルを計算することにより、特徴量ベ
クトル系列を求める。この特徴ベクトルは、図4に示す
ように、時間区間を限定したいわゆる時間窓内で所定の
計算により得られる特徴量として定義する。
た各座標系列x(t),y(t) について時間近傍の部分特徴量
である特徴量ベクトルを計算することにより、特徴量ベ
クトル系列を求める。この特徴ベクトルは、図4に示す
ように、時間区間を限定したいわゆる時間窓内で所定の
計算により得られる特徴量として定義する。
【0019】すなわち、時間近傍での特徴ベクトルは、
時間的に局在した関数との内積をとることにより計算す
る。時間的に局在した関数の例としては、 1.窓付きフーリエ変換、特徴軸は周波数 2.ウェーブレット変換、特徴軸は基本関数のスケール 3.一般の直交関数系、特徴軸は基本多項式の展開係数
(例えば、ルジャンドル多項式など) などが挙げられるが、任意の関数群を設定することも可
能である。
時間的に局在した関数との内積をとることにより計算す
る。時間的に局在した関数の例としては、 1.窓付きフーリエ変換、特徴軸は周波数 2.ウェーブレット変換、特徴軸は基本関数のスケール 3.一般の直交関数系、特徴軸は基本多項式の展開係数
(例えば、ルジャンドル多項式など) などが挙げられるが、任意の関数群を設定することも可
能である。
【0020】ここで、上記ストローク正規化部2から送
られてくる座標系列を離散時間関数f(t) (t=0,1,,,,)
で表す。すなわち、関数f(t)は、座標系列x(t),y(t) の
何れかを示す。また、時刻0 の回りに局在した関数を g
(w,t) とする。ただし、w は特徴を定義するパラメータ
である。このとき、時刻T の近傍の特徴量は、内積
られてくる座標系列を離散時間関数f(t) (t=0,1,,,,)
で表す。すなわち、関数f(t)は、座標系列x(t),y(t) の
何れかを示す。また、時刻0 の回りに局在した関数を g
(w,t) とする。ただし、w は特徴を定義するパラメータ
である。このとき、時刻T の近傍の特徴量は、内積
【0021】
【数1】
【0022】で定義される。ただし、2*a は時刻T を中
心とする窓の区間の大きさを表す。すなわち、窓は区間
[T-a,T+a] で定義される。
心とする窓の区間の大きさを表す。すなわち、窓は区間
[T-a,T+a] で定義される。
【0023】上記関数 g(w,t) は、例えば、
g(w,t) = 0.5*exp(-i*w*t){1+cos(π*t/a) } |t|
≦ a (iは虚数単位) g(w,t) = 0 |t|≧ a ( 窓付きのフーリエ変換 ) あるいは、 g(w,t) = exp( -t^2/w ^2+i*5*t/w )/√w |t|≦
a (iは虚数単位) g(w,t) = 0 |t|≧ a ( ガボール関数を基本関数とするウェーブレット変換 ) などを用いることができる。
≦ a (iは虚数単位) g(w,t) = 0 |t|≧ a ( 窓付きのフーリエ変換 ) あるいは、 g(w,t) = exp( -t^2/w ^2+i*5*t/w )/√w |t|≦
a (iは虚数単位) g(w,t) = 0 |t|≧ a ( ガボール関数を基本関数とするウェーブレット変換 ) などを用いることができる。
【0024】また、関数g() が虚数関数である場合に
は、内積I(T,w)の絶対値を特徴量とする。以上のよう
に、T-w 座標系の二次元平面上に特徴量が計算される。
なお、以上の計算は、関数 g(w,t) の各値を予め整数化
して数値テーブルに格納しておくことにより整数演算の
みで高速に実行することが可能である。
は、内積I(T,w)の絶対値を特徴量とする。以上のよう
に、T-w 座標系の二次元平面上に特徴量が計算される。
なお、以上の計算は、関数 g(w,t) の各値を予め整数化
して数値テーブルに格納しておくことにより整数演算の
みで高速に実行することが可能である。
【0025】次に、上述のようにして計算されたT-w 座
標系の二次元平面上の特徴量を軸方向T,w で量子化する
ことにより特徴ベクトル系列に変換する。この量子化に
おいては、まず、各軸方向T,w で区間を設定する。例え
ば、 T 軸方向で[a*i,a*(i+1)] (i=0,1,,,)、 w 軸方向で[b*j,b*(j+1)] (j=0,1,,,) の区間を設定する。
標系の二次元平面上の特徴量を軸方向T,w で量子化する
ことにより特徴ベクトル系列に変換する。この量子化に
おいては、まず、各軸方向T,w で区間を設定する。例え
ば、 T 軸方向で[a*i,a*(i+1)] (i=0,1,,,)、 w 軸方向で[b*j,b*(j+1)] (j=0,1,,,) の区間を設定する。
【0026】次いで、この設定区間内で量子化値 D[i,
j] を所定の演算により決定する。この演算としては、
例えば、 1.区間ごとにある規則に従って代表点( 例えば中点 )を
選び、その代表点での特徴量をそのままその区間の特徴
量とする。 2.区間内での平均値を計算する。 などが考えられる。このようにして、特徴量平面は特徴
ベクトル系列に変換される。そして、この特徴ベクトル
系列は、次段のハッシュ化部4に送られる。
j] を所定の演算により決定する。この演算としては、
例えば、 1.区間ごとにある規則に従って代表点( 例えば中点 )を
選び、その代表点での特徴量をそのままその区間の特徴
量とする。 2.区間内での平均値を計算する。 などが考えられる。このようにして、特徴量平面は特徴
ベクトル系列に変換される。そして、この特徴ベクトル
系列は、次段のハッシュ化部4に送られる。
【0027】なお、w 軸方向で離散的な値をとる関数群
を用いることにより、w 軸方向の量子化を省略すること
が可能である。例えば、関数群としてルジャンドル多項
式を用いた場合には、関数 g(w,t) 中のw は多項式の次
数として設定可能である。
を用いることにより、w 軸方向の量子化を省略すること
が可能である。例えば、関数群としてルジャンドル多項
式を用いた場合には、関数 g(w,t) 中のw は多項式の次
数として設定可能である。
【0028】すなわち、w=0,1,2,3,4,5 とし、窓区間長
を32、p=t/16とすれば、 g(0,p) = 1 g(1,p) = p g(2,p) = (3p2-1)/2 g(3,p) = (5p3-3p)/2 g(4,p) = (35p4-30p2+3)/8 g(5,p) = (63p5-70p3+15p)/8 が関数群となり、図5に示すように、これらの関数群と
上記ストローク正規化部2から送られてくる座標系列x
(t),y(t) との内積値が特徴ベクトルの成分値となる。
したがって、この場合は6次元の特徴ベクトルとなる。
を32、p=t/16とすれば、 g(0,p) = 1 g(1,p) = p g(2,p) = (3p2-1)/2 g(3,p) = (5p3-3p)/2 g(4,p) = (35p4-30p2+3)/8 g(5,p) = (63p5-70p3+15p)/8 が関数群となり、図5に示すように、これらの関数群と
上記ストローク正規化部2から送られてくる座標系列x
(t),y(t) との内積値が特徴ベクトルの成分値となる。
したがって、この場合は6次元の特徴ベクトルとなる。
【0029】次に、ハッシュ化部4では、上記特徴ベク
トル化部3で計算された特徴ベクトルをハッシュ化す
る。すなわち、各特徴ベクトルに整数値を対応づける。
簡単な方法としては、特徴ベクトルの成分を量子化した
後、異なるベクトルの出現順に整数値を割り当てる方法
があるが、その際には、特徴ベクトルデータベース5を
設定する必要がある。図6は、以上のようにして得られ
た特徴ベクトルとハッシュ値との対応関係の一部を例示
したものである。
トル化部3で計算された特徴ベクトルをハッシュ化す
る。すなわち、各特徴ベクトルに整数値を対応づける。
簡単な方法としては、特徴ベクトルの成分を量子化した
後、異なるベクトルの出現順に整数値を割り当てる方法
があるが、その際には、特徴ベクトルデータベース5を
設定する必要がある。図6は、以上のようにして得られ
た特徴ベクトルとハッシュ値との対応関係の一部を例示
したものである。
【0030】また、ベクトル近傍(特徴ベクトル同士の
近傍あるいは、成分での近傍)から更にハッシュ値を再
定義することも可能である。すなわち、i 番目の特徴量
ベクトルのj 番目の要素をV[i,j]とするとき、例えば、
この近傍での特徴量y[i,j]は、 y[i,j] = h(V[i,j],V[i,j+1],V[i+1,j],V[i+1,j+1]) (h()は定義されたハッシュ関数)で求められる。その際
には、特徴ベクトルデータベース5を必要としない関数
h() を設定することが可能である。
近傍あるいは、成分での近傍)から更にハッシュ値を再
定義することも可能である。すなわち、i 番目の特徴量
ベクトルのj 番目の要素をV[i,j]とするとき、例えば、
この近傍での特徴量y[i,j]は、 y[i,j] = h(V[i,j],V[i,j+1],V[i+1,j],V[i+1,j+1]) (h()は定義されたハッシュ関数)で求められる。その際
には、特徴ベクトルデータベース5を必要としない関数
h() を設定することが可能である。
【0031】こうして量子化された値は、特徴量ベクト
ルのハッシュ値とされる。そして、これらのハッシュ値
の集合が重み集計部6に送られる。重み集計部6では、
上記ハッシュ化部4で計算されたハッシュ値の集合の各
ハッシュ値に対応する文字重みリストを文字重みデータ
ベース7から読み出す。この重みリストは、例えば、図
7に示すようなものであるが、この詳細については後述
する。
ルのハッシュ値とされる。そして、これらのハッシュ値
の集合が重み集計部6に送られる。重み集計部6では、
上記ハッシュ化部4で計算されたハッシュ値の集合の各
ハッシュ値に対応する文字重みリストを文字重みデータ
ベース7から読み出す。この重みリストは、例えば、図
7に示すようなものであるが、この詳細については後述
する。
【0032】重み集計部6は、上記読み出した重みリス
トの各文字コードの重みを、図8に示すような集計テー
ブルの当該総和値に加算する。この図8では、文字コー
ド「あ」の重み総和が高い値を示している。また、「あ
1 」「あ2 」の文字コードは、同じ文字種であるが大き
く異なる筆跡であったので、予め別の文字種として登録
してあった場合を示している。
トの各文字コードの重みを、図8に示すような集計テー
ブルの当該総和値に加算する。この図8では、文字コー
ド「あ」の重み総和が高い値を示している。また、「あ
1 」「あ2 」の文字コードは、同じ文字種であるが大き
く異なる筆跡であったので、予め別の文字種として登録
してあった場合を示している。
【0033】次に、全てのハッシュ値に対して重みの加
算が終了した時点で、集計テーブル情報は認識候補選択
部8に送られる。認識候補選択部8では、上記重み集計
部6で生成された集計テーブルに基づいて、その重み総
和が予め設定された閾値を越える文字コードを選択し、
これを認識候補としてマッチング部9へ送る。
算が終了した時点で、集計テーブル情報は認識候補選択
部8に送られる。認識候補選択部8では、上記重み集計
部6で生成された集計テーブルに基づいて、その重み総
和が予め設定された閾値を越える文字コードを選択し、
これを認識候補としてマッチング部9へ送る。
【0034】なお、閾値を設定せずに、例えば重み総和
が上位10個の文字コードを認識候補とする方法なども
可能である。また、選択された認識候補が全て同じ文字
コードである場合には、当該文字コードを認識結果と
し、マッチング部9での処理を省略することも可能であ
る。
が上位10個の文字コードを認識候補とする方法なども
可能である。また、選択された認識候補が全て同じ文字
コードである場合には、当該文字コードを認識結果と
し、マッチング部9での処理を省略することも可能であ
る。
【0035】マッチング部9では、上記認識候補選択部
8から送られてくる認識文字候補の特徴ベクトル系列
を、各文字についての特徴ベクトル系列が予め登録され
ている文字特徴ベクトルデータベース10の中から読み
出す。そして、この読み出した特徴ベクトル系列と、上
記特徴ベクトル化部3で得られた認識対象文字の特徴ベ
クトル系列とを比較することにより、最も類似度が高い
文字を最終的な認識結果とする。特徴ベクトル系列の比
較には、DPマッチング等が用いられる。以上のように
して、文字の入力ストロークに対する認識結果の文字コ
ードを得ることができ、出力部9で上記認識結果の文字
を表示する。
8から送られてくる認識文字候補の特徴ベクトル系列
を、各文字についての特徴ベクトル系列が予め登録され
ている文字特徴ベクトルデータベース10の中から読み
出す。そして、この読み出した特徴ベクトル系列と、上
記特徴ベクトル化部3で得られた認識対象文字の特徴ベ
クトル系列とを比較することにより、最も類似度が高い
文字を最終的な認識結果とする。特徴ベクトル系列の比
較には、DPマッチング等が用いられる。以上のように
して、文字の入力ストロークに対する認識結果の文字コ
ードを得ることができ、出力部9で上記認識結果の文字
を表示する。
【0036】次に、文字辞書の構成についてさらに説明
する。重み辞書には各ハッシュ値に対応する重みリスト
が付与されている。重みリストには、図7に示したよう
に、各文字コードと、当該文字コードの文字についてハ
ッシュ値が計算された特徴ベクトルの重み、すなわち特
徴ベクトルの相対的な重要度を示す値とが格納されてい
る。
する。重み辞書には各ハッシュ値に対応する重みリスト
が付与されている。重みリストには、図7に示したよう
に、各文字コードと、当該文字コードの文字についてハ
ッシュ値が計算された特徴ベクトルの重み、すなわち特
徴ベクトルの相対的な重要度を示す値とが格納されてい
る。
【0037】例えば、平仮名における濁点部付近の特徴
ベクトル等には、高い値が設定される。また、この重み
は、リストの長さに反比例するような値をリストに含ま
れる文字に一律に設定することも可能である。例えば、
図7において、ハッシュ値3で示される特徴ベクトルの
重みは、文字「る」および「ろ」では1、文字「わ」で
は2に設定されている。
ベクトル等には、高い値が設定される。また、この重み
は、リストの長さに反比例するような値をリストに含ま
れる文字に一律に設定することも可能である。例えば、
図7において、ハッシュ値3で示される特徴ベクトルの
重みは、文字「る」および「ろ」では1、文字「わ」で
は2に設定されている。
【0038】なお、図7に示した各重みリストの最後に
は、文字コードと重みとの組の終了を示す、いわゆるマ
ークが格納されている。各リストは可変長であるが、上
記重み集計部6でリストの重みが順次読み出される際
に、上記マークの読み込みがリストからの重み情報の読
み込の終了条件となる。
は、文字コードと重みとの組の終了を示す、いわゆるマ
ークが格納されている。各リストは可変長であるが、上
記重み集計部6でリストの重みが順次読み出される際
に、上記マークの読み込みがリストからの重み情報の読
み込の終了条件となる。
【0039】以上の如く、本実施例では、入力ストロー
クの局所的な座標変動の特徴ベクトルから計算されるハ
ッシュ値を用いて認識候補文字を絞り込むようにしてい
るので、使用者ごとに異なる筆順などの影響を最小限度
に押えることができ、文字認識率の低下を抑えることが
できる。
クの局所的な座標変動の特徴ベクトルから計算されるハ
ッシュ値を用いて認識候補文字を絞り込むようにしてい
るので、使用者ごとに異なる筆順などの影響を最小限度
に押えることができ、文字認識率の低下を抑えることが
できる。
【0040】また、重み辞書から読み出される重みリス
トは、認識対象文字の特徴ベクトルから計算されたハッ
シュ値に対応するリストのみである。また、文字辞書か
ら読み出される特徴ベクトル系列も、認識候補文字の特
徴ベクトル系列のみであって実際にDPマッチングを行
う文字が十分に絞られているので、高速な文字認識を行
うことが可能となる。
トは、認識対象文字の特徴ベクトルから計算されたハッ
シュ値に対応するリストのみである。また、文字辞書か
ら読み出される特徴ベクトル系列も、認識候補文字の特
徴ベクトル系列のみであって実際にDPマッチングを行
う文字が十分に絞られているので、高速な文字認識を行
うことが可能となる。
【0041】なお、本実施例による文字認識方法および
装置は、複数の機器から構成されるシステムに適用して
も1つの機器から成る装置に適用しても良い。また、本
実施例は、上記システムあるいは装置に対して本実施例
により規定される処理を実行するプログラムを供給する
ことによって実現するようにしても良いことは言うまで
もない。
装置は、複数の機器から構成されるシステムに適用して
も1つの機器から成る装置に適用しても良い。また、本
実施例は、上記システムあるいは装置に対して本実施例
により規定される処理を実行するプログラムを供給する
ことによって実現するようにしても良いことは言うまで
もない。
【0042】
【発明の効果】以上説明してきたように、本発明の文字
認識方法および装置によれば、筆記者に要求される正し
い画数(文字の一画一画が正しく分離されていなければ
ならないこと、および楷書であること)や、正しい筆順
(辞書に登録した正しい文字と同じ筆順でなければなら
ないこと)といった条件を緩和して、より高い認識率で
文字を認識することができる。
認識方法および装置によれば、筆記者に要求される正し
い画数(文字の一画一画が正しく分離されていなければ
ならないこと、および楷書であること)や、正しい筆順
(辞書に登録した正しい文字と同じ筆順でなければなら
ないこと)といった条件を緩和して、より高い認識率で
文字を認識することができる。
【0043】また、多数の文字種において、認識対象文
字の特徴ベクトルから計算されるハッシュ値を用いて高
速に認識候補を絞り込むようにしたので、文字認識を高
速に行うことが可能となる。さらに、文字辞書の作成に
統計的な処理を行わないので、文字辞書への追加処理を
容易に行うことができる。すなわち、筆記者によるカス
タマイズが容易となり、結果的に更に高い文字認識率を
得ることが可能となる。
字の特徴ベクトルから計算されるハッシュ値を用いて高
速に認識候補を絞り込むようにしたので、文字認識を高
速に行うことが可能となる。さらに、文字辞書の作成に
統計的な処理を行わないので、文字辞書への追加処理を
容易に行うことができる。すなわち、筆記者によるカス
タマイズが容易となり、結果的に更に高い文字認識率を
得ることが可能となる。
【図1】本発明の一実施例の構成を示す機能ブロック図
である。
である。
【図2】手書き文字の入力例およびその座標時系列のグ
ラフを示す図である。
ラフを示す図である。
【図3】正規化された座標時系列のグラフを示す図であ
る。
る。
【図4】特徴ベクトル化部による特徴ベクトル系列生成
の例を示す図である。
の例を示す図である。
【図5】特徴ベクトル化部による特徴ベクトル系列生成
の他の例を示す図である。
の他の例を示す図である。
【図6】特徴ベクトルとハッシュ値との関係を示す図で
ある。
ある。
【図7】文字重みデータベース内の重みリストの格納例
を示す図である。
を示す図である。
【図8】集計テーブルの一例を示す図である。
1 ストローク入力部
2 ストローク正規化部
3 特徴ベクトル化部
4 ハッシュ化部
5 特徴ベクトルデータベース
6 重み集計部
7 文字重みデータベース
8 認識候補選択部
9 マッチング部
10 文字特徴ベクトルデータベース
11 出力部
Claims (6)
- 【請求項1】 種々の手書き文字の筆跡を時間とともに
連続的に変化するX,Y座標の第1の情報として入力し、 該第1の情報を正規化した後、複数の部分特徴量を抽出
して第1の集合として予め登録しておき、 認識対象文字の筆跡を時間とともに連続的に変化するX,
Y座標の第2の情報として入力し、この入力した第2の
情報を正規化した後、複数の部分特徴量を抽出して第2
の集合を作成し、 前記予め登録しておいた第1の集合と第2の集合とを用
いてマッチングをとることにより文字を認識するように
したことを特徴とする文字認識方法。 - 【請求項2】 予め種々の手書き文字の筆跡をX,Y座標
の連続的な時間変化として入力してある波形について正
規化を行い、該正規化した波形から部分特徴量を抽出
し、さらにこの抽出した部分特徴量をハッシュ化してハ
ッシュ値の集合として保存しておき、 認識対象文字の筆跡をX,Y座標の連続的な時間変化の波
形として入力し、この入力した時間変化の波形に対して
正規化を行い、該正規化した波形から部分特徴量を抽出
し、さらにこの抽出した部分特徴量をハッシュ化してハ
ッシュ値の集合とし、これにより得られる認識対象文字
のハッシュ値の集合と、前記予め保存しておいたハッシ
ュ値の集合とを比較してマッチングをとることにより文
字を認識するようにしたことを特徴とする文字認識方
法。 - 【請求項3】 前記予め保存してある種々の文字に対す
るハッシュ値が前記入力した認識対象文字に対するハッ
シュ値と合致する数の多い順に認識文字を出力すること
を特徴とする請求項2記載の文字認識方法。 - 【請求項4】 前記ハッシュ値の比較の際に、前記ハッ
シュ値に対して重み付けを行って比較するようにしたこ
とを特徴とする請求項2または3記載の文字認識方法。 - 【請求項5】 種々の手書き文字の筆跡を時間とともに
連続的に変化するX,Y座標の情報として入力する入力手
段と、 該入力された情報を正規化した後、複数の部分特徴量を
抽出して集合を作成する部分特徴量抽出手段と、 該抽出された複数の部分特徴量を集合として登録してお
く登録手段と、 前記入力手段から入力された認識対象文字について正規
化した後、前記部分特徴量抽出手段で複数の部分特徴量
を抽出して集合を作成して前記登録手段に登録しておい
た集合と比較する認識手段とを備えたことを特徴とする
文字認識装置。 - 【請求項6】 認識対象文字の筆記開始から筆記終了ま
での間のペン先の位置を文字入力面へ垂直射影した二次
元座標系列として文字ストロークを入力する入力手段
と、 前記入力手段により入力された文字ストロークである二
次元座標系列を正規化する正規化手段と、 前記正規化手段により正規化された二次元座標時系列か
ら、部分的な特徴ベクトルの集合である特徴ベクトル系
列を計算する特徴ベクトル計算手段と、 前記特徴ベクトル計算手段で計算された各特徴ベクトル
からハッシュ値を計算するハッシュ化手段と、 前記ハッシュ化手段により計算された各ハッシュ値の計
算元である特徴ベクトルを有する文字の文字コードとそ
の重みとの組を、当該ハッシュ値に付与されたリストに
登録してなる文字重みデータベースを記憶する重み記憶
手段と、 前記入力手段により入力された認識対象文字について前
記ハッシュ化手段により計算された各ハッシュ値に基づ
いて、前記文字重みデータベースから各文字の重み情報
を読み出して重みの総和を計算する重み集計手段と、 前記特徴ベクトル計算手段により計算された種々の文字
についての特徴ベクトル系列を登録してなる文字特徴ベ
クトルデータベースを記憶する特徴ベクトル記憶手段
と、 前記重み集計手段で計算された各文字の重みの総和が上
位である文字の特徴ベクトル系列を前記文字特徴ベクト
ルデータベースから読み出し、この読み出した特徴ベク
トル系列と前記認識対象文字の特徴ベクトル系列とでマ
ッチング処理を行うマッチング手段とを備えることを特
徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15525894A JP3366443B2 (ja) | 1994-06-14 | 1994-06-14 | 文字認識方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15525894A JP3366443B2 (ja) | 1994-06-14 | 1994-06-14 | 文字認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07334622A JPH07334622A (ja) | 1995-12-22 |
JP3366443B2 true JP3366443B2 (ja) | 2003-01-14 |
Family
ID=15601989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15525894A Expired - Fee Related JP3366443B2 (ja) | 1994-06-14 | 1994-06-14 | 文字認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3366443B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002952106A0 (en) * | 2002-10-15 | 2002-10-31 | Silverbrook Research Pty Ltd | Methods and systems (npw008) |
JP4541811B2 (ja) * | 2004-09-13 | 2010-09-08 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
JP6465414B6 (ja) * | 2014-10-30 | 2019-04-03 | Dynabook株式会社 | 電子機器、方法及びプログラム |
JP7262039B2 (ja) * | 2018-09-18 | 2023-04-21 | 株式会社MetaMoJi | 署名認証装置および合致性判断装置 |
-
1994
- 1994-06-14 JP JP15525894A patent/JP3366443B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH07334622A (ja) | 1995-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3176023B2 (ja) | 手書き入力照合方法および装置 | |
AU737039B2 (en) | Methods and apparatuses for handwriting recognition | |
US6275611B1 (en) | Handwriting recognition device, method and alphabet, with strokes grouped into stroke sub-structures | |
US5396566A (en) | Estimation of baseline, line spacing and character height for handwriting recognition | |
KR19990022352A (ko) | 필기 입력의 문자 인식 방법 및 장치 | |
Herold et al. | The 1¢ recognizer: a fast, accurate, and easy-to-implement handwritten gesture recognition technique | |
CN1021937C (zh) | 数据识别设备 | |
JP3761937B2 (ja) | パターン認識方法及び装置及びコンピュータ制御装置 | |
US5920647A (en) | Method and apparatus for recognition of hand-printed characters represented as an electronic ink stream using a box filtering technique | |
JP3366443B2 (ja) | 文字認識方法および装置 | |
IL100198A (en) | Character recognition method | |
CN111310548B (zh) | 一种在线手写笔迹中笔画类型的识别方法 | |
Mokhtarian et al. | Indexing an image database by shape content using curvature scale space | |
Paulik et al. | A time varying vector autoregressive model for signature verification | |
JPH05225396A (ja) | 手書き文字認識装置 | |
JP2671984B2 (ja) | 情報認識装置 | |
CN116959000B (zh) | 笔迹识别方法、装置、计算机设备及存储介质 | |
KR100204618B1 (ko) | 문자 또는 도형의 인식 방법 및 시스템 | |
JPH03144788A (ja) | パタン正規化装置 | |
KR19980079762A (ko) | 온라인 문자 인식 장치 | |
JPH0632084B2 (ja) | ファジー推論による手書き文字認識方法 | |
JPH0916720A (ja) | 文字認識方法及び装置 | |
JP3115369B2 (ja) | 局所的字形変動を考慮したオンライン走り書き文字認識装置 | |
JP3760040B2 (ja) | 文字認識方法、文字認識装置及び情報記録媒体 | |
JP2851865B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020924 |
|
LAPS | Cancellation because of no payment of annual fees |