JP2005141329A - 手書き文字認識装置、及び手書き文字認識方法 - Google Patents

手書き文字認識装置、及び手書き文字認識方法 Download PDF

Info

Publication number
JP2005141329A
JP2005141329A JP2003374831A JP2003374831A JP2005141329A JP 2005141329 A JP2005141329 A JP 2005141329A JP 2003374831 A JP2003374831 A JP 2003374831A JP 2003374831 A JP2003374831 A JP 2003374831A JP 2005141329 A JP2005141329 A JP 2005141329A
Authority
JP
Japan
Prior art keywords
character
stroke
candidate
input
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003374831A
Other languages
English (en)
Inventor
Yojiro Touchi
洋次郎 登内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003374831A priority Critical patent/JP2005141329A/ja
Publication of JP2005141329A publication Critical patent/JP2005141329A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】 1文字単位の認識方式でのスコア計算方法に関係なく、異なる切り出し位置の候補文字列を正しく比較することができる手書き文字列認識装置を提供することを目的とする。
【解決手段】 入力ストローク列を複数の基本セグメントの列に分割する基本セグメント分割部2と、この基本セグメントを組み合わせて候補文字を順次生成する候補文字生成部3と、この基本セグメントごとに重み付け値を算出する重み計算部4と、候補文字を標準文字群との照合によって認識した文字名称と相異度を検出する候補文字認識部5と、組み合わせた前記基本セグメントの重み付け値の和を候補文字重み付け値として計算する候補文字重み計算部6と、入力ストローク列に対し相異度と候補文字重みつけ値との積の総和を最小とする文字名称の系列を割り当てる最適文字列選出部7を有する手書き文字認識装置。
【選択図】 図1

Description

本発明は、座標入力用タブレット等の座標入力装置を介したコンピュータや携帯情報端末、ワードプロセッサ等の情報処理装置の入力手段として用いられ、入力画面上に自由書式で筆記された文字列に対して、文字ごとに区分けして(以降セグメンテーションという)を自動的に行い、同時に各文字の認識を行うオンライン手書き文字列認識装置に関するものである。
従来から、入力画面上に自由書式で筆記された文字列に対して、文字認識を行うオンライン手書き文字列認識装置がある。筆記したストロークを取り入れ、このストロークを複数の基本セグメントに分割し、この基本セグメントを組み合わせた候補文字で1文字単位の文字認識を行い、その認識結果のスコアをそのまま候補文字の相違度として、その合計を候補文字列の評価値として用いている。(例えば、特許文献1を参照。)
例えば、筆記された文字列が「認」なのか「言忍」なのかを判定したい場合があるとすると、この場合それぞれの1文字の相違度の和を計算し比較を行う。このような1文字認識の相違度は、文字ごとに標準文字パタンを用意し、候補文字と各標準文字パタンとの距離を相違度としている。(例えば、特許文献2参照。)
このように、例えば「言」と「忍」のスコアの和は、「認」のスコアの2倍相当になり、「言忍」と「認」を比較すると、1文字認識方式の計算方法によっては、所望の文字認識結果が望めないのことがあった。
特公平4−10671号公報(第1図) 特開平9−269974号公報([0023]、図1)
上記のように従来の手書き文字認識では、1文字毎の認識結果のスコアをそのまま候補文字の相違度として、その合計を候補文字列の評価値として用いている。ところが、この1文字単位の文字認識における相違度の算出方法によっては、所望の認識結果を得ることができないという問題があった。
本発明は上記事情に考慮してなされたもので、1文字単位の認識方式でのスコア計算方法に関係なく、異なる切り出し位置の候補文字列を正しく比較することができる手書き文字列認識装置を提供することを目的とする。
本発明の手書き文字認識装置は、 タブレットからストローク列として入力した手書き文字列を文字毎に区分けし、各文字を認識する手書き文字列認識装置において、入力ストローク列を複数の基本セグメントの列に分割する基本セグメント分割手段と、前記基本セグメントごとに重み付け値を算出する重み計算手段と、前記基本セグメントを組み合わせて候補文字を順次生成する候補文字生成手段と、組み合わせた前記基本セグメントの重み付け値の和を候補文字重み付け値として計算する候補文字重み計算手段と、前記候補文字を標準文字群との照合によって認識した文字名称と相異度を検出する候補文字認識手段と、入力ストローク列に対し相異度と候補文字重みつけ値との積の総和を最小とする文字名称の系列を割り当てる最適文字列選出手段とを有することを特徴とする。
更に、候補文字認識手段は、入力した手書き文字列の全ての候補文字に対して標準文字群との照合によって認識した文字名称と相異度を検出することを特徴とする。
更に、前記重み計算手段は、前記基本セグメントを囲む外接四角形の面積から算出されることを特徴とする。
また、本発明の手書き文字認識方法は、タブレットからストローク列として入力した手書き文字列を文字毎に区分けし、各文字を認識する手書き文字列認識方法において、入力ストローク列を複数の基本セグメントの列に分割するステップと、前記基本セグメントごとに重み付け値を算出するステップと、前記基本セグメントを組み合わせて候補文字を順次生成するステップと、組み合わせた前記基本セグメントの重み付け値の和を候補文字重み付け値として計算するステップと、前記候補文字を標準文字群との照合によって認識した文字名称と相異度を検出するステップと、入力ストローク列に対し相異度と候補文字重みつけ値との積の総和を最小とする文字名称の系列を割り当てるステップとを有することを特徴とする。
更に、前記検出するステップは、入力した手書き文字列の全ての候補文字に対して標準文字群との照合によって認識した文字名称と相異度を検出することを特徴とする。
更に、前記重み付け値を算出するステップは、前記基本セグメントを囲む外接四角形の面積から算出されることを特徴とする。
相違度と候補文字重み付け値の積の総和を用いることで、基本セグメントを組み合せた候補文字と、基本セグメントからなる候補文字とを同じ尺度で比較することができるため、異なる切り出し位置の候補文字列を正しく認識することができる。この結果、1文字単位の認識方式でのスコア計算方法に関係なく、正しく認識することができる。
本発明の実施の形態について図面を用いて説明する。ここでは、手書き文字列として横書きの文字列を実施例として説明をしているが、本発明はこれに限るものではなく他の形式の手書き文字列でもよい。
以下、本発明の一実施例について図面を参照して説明する。図1は、本発明の一実施例の構成を示す。座標入力部1はデータタブレットから構成されるものであり、手書き入力した筆跡情報として各ストローク毎にペンを下ろしてから上げるまでの筆跡を取り入れる。基本セグメント分割部2は、座標入力部1から入力されたN本の入力ストロークを複数の基本セグメントに分割する。基本セグメント分割部2は、まず入力ストロークの縦方向(Y座標)の最大値と最小値を検出し、最大値と最小値の差の計算により文字列の縦方向の幅(Hとする)すなわち文字の高さを求める。次に使用列を横方向に分割する。
ある値K(1<K<N−1)に対し、第1ストロークから第KストロークまでのX座標の最大値X1、及び第K+1ストロークから第NストロークまでのX座標の最小値X2を検出して、(X2−X1)>H・T(Tは分割パラメータ)の条件を満足する場合に限り、第Kストロークと第K+1ストロークとの間で入力ストローク列を分割する。この操作をKが1からN−1まで順次変化させて、すべての分割位置を決定する。
分割パラメータTは適宜決定する。例えば、T=0とすれば、文字列の各ストロークをX軸に投影した場合に影が重ならない全ての箇所で分割することになり、T=−0.1とすれば、この影の重なりが0.1Hより少ない全ての箇所で分割することになる。分割された各ストロークの組を基本セグメントとする。
候補文字生成部3は、基本セグメント分割部2から入力された基本セグメントを組み合せ、これが以下の条件を、全て満たす場合にのみ候補文字とする。候補文字となるための条件として、
(1)候補文字は引き続く基本セグメントから構成される
(2)候補文字の横幅は文字列の縦方向の幅Hに比較しα・H以下(αは適宜設定する定数)である
(3)候補文字を囲む長方形の長辺はβ・H以上(βは適宜設定する定数)である。
等を利用することができる。生成された候補文字は、候補文字認識部5に入力される。
一方、重み計算装部4は、基本セグメント分割装置2から入力される基本セグメントに対応する筆跡情報から基本セグメントの重み付けを計算する。例えば、図2のように6個の基本セグメントに分割された場合、それぞれの基本セグメントを囲む外接四角形の面積S1からS6を重み付け値として計算する。もちろん、他の計算式を用いることも可能である。
候補文字認識部5は、候補文字生成部3から入力された候補文字と標準文字群との間で逐次相異度を算出し、候補文字認識結果として標準文字の名称とその相異度とを検出する。
更に、候補文字生成部3により生成された全ての候補文字について、認識された標準文字の名所とその相異度を検出する。
この候補文字認識部5の詳細について、図3を用いて説明する。図3に示す候補文字認識部は、ストローク対応部11、標準文字パターン記憶部12、ストローク間距離計算部13、パターン間距離計算部14、及びパターン間距離比較部15から構成される。
標準文字パターン記憶部12は、種々の文字の予め定められた筆跡に関する標準パターンを登録しておく認識辞書を構成する。ここでは、各文字についてそれぞれ1種の画数の標準パターンが用意されている実施例について説明する。この標準文字パターン記憶部12には、各標準文字パターンのストローク上全ての特徴点Pi の情報が予め記憶されているものとする。
ストローク対応部11は、候補文字生成部3により入力された候補文字(手書き入力文字)のパターン(ストロークの情報からなる筆跡パターン)と標準パターン記憶部12に登録されている各標準パターンとの間で、順序関係を保ったまま前後するストロークをつなぐことにより、多対多のストローク対応付けを行う。
ストローク間距離計算部13は、ストローク対応部11により対応付けされたストローク同士の距離を計算する。パターン間距離計算部14は、ストローク間距離計算部13により計算された距離の和をパターン間距離として各パターン(標準パターン)別に求める。
パターン間距離比較部15は、パターン間距離計算部14により各標準パターン別に求められたパターン間距離を比較して、そのうちの最小のものを求め、その最小のパターン間距離の標準パターンの文字を認識結果として決定する。
次に、図3の構成の動作を説明する。まず、ストローク対応部11は、候補文字生成部3で生成された候補文字が入力されると、候補文字と標準文字パターン記憶部12に予め登録されている種々の文字の筆跡に関する標準パターンとの対応付けを行う。そのため本実施形態では、ストローク対応部11に、図4に示すようにストローク接続部111を設け、ストロークの順序関係は変えないものとして、時間的に前後するストロークを当該ストローク接続部111にてつなぐことによって、多対多の過不足ない対応をとるようにしている。
例えば、文字「口」の標準パターンと入力文字が図14(a)と図14(b)に示したように、それぞれ3画と2画で書かれているものとする。この例で、標準パターンと入力文字との間で順序関係を変えずに過不足なくストロークの対応関係をとるためには、画数の多い側の標準パターンを画数の少ない側の入力文字と同じ画数(2画)に変形すればよい。具体的には、図14(a)の標準パターンの第1画乃至第3画のストロークA1〜A3のうち、図5(a)に示すように第1画(A1)と第2画(A2)をつなぐか(A1+A2)、図5(b)に示すように第2画(A2)と第3画(A3)をつなげば(A2+A3)よい。但し、2つのストロークをつなぐとは、その間の部分(一方のストロークの終点と他方のストロークの始点の間の部分、即ちペンがオフの部分)の端点同士を図5の例のように直線で補間し、ペンオンの部分と同等に扱うことを意味する。
つまり、図14の例における標準パターンと入力文字のストローク対応としては、1) A1+A2とB1,A3とB2、2) A1とB1,A2+A3とB2の2通りである。
例えば、上記1)のような場合、ストローク対応部11では、図6のように各ストロークが比較され、対応付けが決定される。さて、標準パターンと入力文字の間のストローク比較には、例えば対応するストロークの端点同士(始点同士、終点同士)の距離を用いることが可能である。そのため本実施形態では、ストローク対応部11に、図4に示したように端点間距離計算部112を設け、対応するストロークの端点同士の距離を計算するようにしている。
具体的には、標準文字パターン記憶部12に、標準パターンの各ストロークの端点座標を予め保持しておき、入力文字の端点との距離を端点間距離計算部112にて計算する。
ここで、図14(a),(b)の例における標準パターンの各ストロークA1,A2,A3と入力文字の各ストロークB1,B2の始点及び終点を、
A1s ,PA1e ,PA2s ,PA2e ,PA3s ,PA3e (標準パターン)
B1s ,PB1e ,PB2s ,PB2e (入力文字)
とする。
すると、上記1)の場合には、PA1s とPB1s 、PA2e とPB1e 、PA3s とPB2s 、そしてPA3eとPB2e が、それぞれ対応し、上記2)の場合には、PA1sとPB1s、PA1eとPB1e 、PA2s とPB2s 、そしてPA3eとPB2eが、それぞれ対応する。
このとき、1),2)それぞれの場合の、全体の端点間距離の和S ,Sは、次のようになる。
={d(PA1s ,PB1s )+d(PA2e ,PB1e
+d(PA3s ,PB2s )+(PA3e ,PB2e )}…(1)
={d(PA1s ,PB1s )+d(PA1e ,PB1e
+d(PA2s ,PB2s )+(PA3e ,PB2e )}…(2)
ここで、2点Pi =(xi ,yi )とPj =(xj ,yj )の距離d(Pi ,Pj )には、例えばユークリッド距離を用いて、次のように算出すればよい。
d(Pi ,Pj )={(xi −xj )2 +(yi −yj )2 }1/2 …(3)
ストローク対応部11では、このようにして端点間距離計算部112により算出された、上記1)、2) それぞれの場合の、全体の端点間距離の和をストローク対応付けの評価値として用いる。そのため本実施形態では、ストローク対応部11に、図4に示したように対応決定部113を設け、1つの標準パターンと入力文字のストローク対応の全ての組み合わせについて、端点間距離計算部112で算出された評価値から、いずれのストローク対応の組(ストローク間)が最も類似している否かを判断して、1つのストローク対応組を決定するようにしている。ここでは、評価値(端点間距離の和)が最も小さいストローク対応組が、ストローク間類似度が最も高いものとして選択される。
図4の構成のストローク対応部11では、以上の処理が、標準パターン記憶部12に登録されている全ての標準パターンについて行われ、各標準パターンと入力文字とのストローク対応がそれぞれ決定される。
なお、ストローク間類似度を、対応するストローク間の端点同士の距離ではなくて、ストローク長をもとに求めて、ストローク対応を決定するようにしても構わない。この場合、ストローク対応部11を、図4ではなくて、図7のように構成すればよい。この図7のストローク対応部11の特徴は、端点間距離計算部112に代えて、ストローク長計算部114、及びストローク長差分計算部115が設けられている点である。
まず、ストローク長とは、1ストロークを構成する座標点列の隣接する点同士の距離d(pi-1 ,pi )の和である。従って、1ストロークの始点から終点までの点列がp1 ,p2 ,p3 ,…,pn-1 ,pn とすれば、ストローク長Lは
L=d(p1 ,p2 )+d(p2 ,p3 )+…+d(pn-1 ,pn )…(4)
となる。
ストローク長計算部114は、上記(4)式に従って、1つの標準パターンと入力文字の各ストロークのストローク長を算出する。この際、ストローク長計算部114は、ストロークの終点から次のストロークの始点への直線部分(図14中で破線の矢印で示されている部分で、裏ストロークと称する)の長さ(距離)を裏ストローク長として算出する。
ここで、上記図14の例における、文字「口」の3画の標準パターンの各ストロークA1,A2,A3のストローク長をLA1,LA2,LA3、ストロークA1(の終点)からストロークA2(の始点)への裏ストロークのストローク長をLA1A2、ストロークA2からストロークA3への裏ストロークのストローク長をLA2A3とする。また、文字「口」の2画の入力文字の各ストロークB1,B2のストローク長をLB1,LB2,ストロークB1からストロークB2への裏ストロークのストローク長をLB1B2とする。これらの(裏ストローク長を含む)各ストローク長は、ストローク長計算部114により算出される。
この場合、例えば標準パターンの第1画(ストロークA1)と第2画(ストロークA2)をつないだもの(A1+A2)と、入力文字の第1画(ストロークB1)とのストローク間類似度(の評価値)は、そのストローク長の差の絶対値
|(LA1+LA1A2+LA2)−LB1| …(5)
で表すことができる。この計算値は、ストローク長差分計算部135により算出される。
ストローク長差分計算部115は、上記1)、2) の場合であれば、それぞれの場合の全体のストローク間類似度(評価値)S、Sとして次のような値を算出する。
=|(LA1+LA1A2+LA2)−LB1| +|LA2A3−LB1B2|+|LA3−LB2|…(6)
=|LA1−LB1|+|LA1A2−LB1B2| +|(LA2+LA2A3+LA3)−LB2| …(7)
一般的には、ストローク長差分計算部115は、ストローク接続部111によるストローク接続がなされた、1つの標準パターンと入力文字のストローク対応の各組み合わせ毎に、それぞれ対応するストローク(接続後のストローク及び裏ストロークを含む)のストローク長の差の絶対値を算出して、その和を求め、全体のストローク間類似度(評価値)Si とする。
対応決定部113は、以上のようにしてストローク長をもとに求められた、1つの標準パターンと入力文字のストローク対応の各組み合わせ毎のストローク間類似度(評価値)から、前記した対応ストロークの端点間の距離をもとにストローク間類似度(評価値)が求められた場合と同様にして、いずれの組み合わせのストローク対応(ストローク間)が最も類似している否かを判断して、1つのストローク対応を決定する。
図7の構成のストローク対応部11では、以上の処理が、標準文字パターン記憶部12に登録されている全ての標準パターンについて行われ、各標準パターンと入力文字とのストローク対応がそれぞれ決定される。
このように、(図7中のストローク長計算部114及びストローク長差分計算部115により)ストローク長をもとにストローク間類似度(評価値)を決定する方式では、前記した(図4中の端点間距離計算部112により)対応ストロークの端点間の距離(ユークリッド距離)をもとにストローク間類似度(評価値)を決定する方式と異なって、2次元の計算が必要なく、1次元の計算だけで行えるため、計算量が少なくて済み、計算時間が短縮できる。
また、計算量は多くなるものの、上記式(6)、(7)のようにストローク長の差の絶対値の和を評価値とする代わりに、ストローク長の差の2乗値の和を評価値とすることも可能である。
その他、ストローク間の類似度の評価値を求めるのに、前記した(標準パターンと入力文字の間の)対応ストロークの端点同士の位置的な類似度や、対応ストロークの長さ(ストローク長)の(差を用いた)類似度以外に、対応ストロークの特徴点同士の位置的な類似度や、対応ストロークの形状、例えば屈曲点の曲率の差の絶対値または差の2乗値を用いた類似度を適用することも可能である。また、このような類似度を、そのまま或いは重みを付けて前記した類似度に加えて、全体の評価値としても構わない。更に、評価式全体を計算して一度に全ての対応を決定することも可能であるし、これらの評価式をもとに動的評価法(DPマッチング法)を用いて、ストローク対応を順次求めていくようにすることで、同一の計算が繰り返されるのを防止することも可能である。
さて、ストローク対応部11により、各標準パターンと入力文字とのストローク対応が決定されると、対応付けされたストローク(からなるパターン間)の類似度を各標準パターン別に正確に求めるために、ストローク間距離計算部13にてストローク間距離が求められる。
このストローク間距離計算部13によるストローク間距離算出処理について説明する。まずストローク間距離計算部13は、図8に示すように、対応点決定部131と、特徴点対応点間距離計算部132と、距離総和計算部133とから構成される。
対応点決定部131は、標準文字パターン記憶部12に予め登録されている標準パターンのストローク上の特徴点Pi (i=1〜n)に対応する入力文字(入力パターン)のストローク上の点を対応点Pi ^として求める。
ここで対応点決定部131による特徴点Pの対応点P^の求め方について、図9を参照して説明する。まず、標準文字パターン記憶部12には、各標準パターンについて、その標準パターンを構成する各ストロークの始点及び終点座標の他に、そのストローク上の全ての特徴点の情報が登録されている。この特徴点は例えば屈曲点であり、その特徴点の情報は、座標の他に、その特徴点でのストローク長に対する内分比(a:b)を含む。この内分比は、予め計算により求められ、特徴点座標と共に標準文字パターン記憶部12に登録されている。
対応点決定部131は、標準パターンのストローク上の特徴点Pの内分比(a:b)をもとに、図9に示すように、当該特徴点Pの内分比a:bと(ほぼ)同じ内分比a′:b′を持つ、入力文字の対応するストローク上での点P′の座標を求め、それを特徴点Pの対応点P^の座標とする。
このように図8中の対応点決定部131は、特徴点Pに対応する入力文字上での同じ内分比を持つ点P′を、そのまま対応点P^としているが、この対応点決定部131を図10のように構成して、そのP′の近傍から対応点P^を選択するようにしてもよい。この図10の構成における対応点決定部131による対応点決定を、図11を参照して説明する。
ここでは、対応点決定部131を、仮対応点決定部131a、近傍点特徴量抽出部131b、及び特徴量比較部131cを用いて構成している。仮対応点決定部131aは、標準パターンのストローク上の特徴点Pの内分比(a:b)をもとに、図11に示すように、当該特徴点Pの内分比a:bと(ほぼ)同じ内分比a′:b′を持つ、入力文字の対応するストローク上での点P′の座標を求め、それを特徴点Pの仮の対応点とする。
近傍点特徴量抽出部131bは、仮対応点決定部131aにより求められた仮対応点P′の上記入力文字の対応ストローク上での近傍内の全ての点Pi ^について、何らかの特徴量(例えば、その点での接線の傾き)を抽出する。ここで、仮対応点P′の近傍内の点Pi ^とは、Pi ^とP′との間の距離dst(Pi ^,P′)が所定値αの範囲内となる点をいう。
特徴量比較部131cは、近傍点特徴量抽出部131bにより抽出された、点P′の近傍内の全ての点Pi ^の特徴量と、特徴点Pの特徴量とを比較し、その比較の結果、特徴量が特徴点Pに最も類似している点Pi ^を当該特徴点Pの対応点P^として決定する。
このように、特徴量を考慮して対応点P^を決定することで、特徴点Pと同じ内分比の点P′を、そのまま対応点P^とする場合に比べて、より精度の高い対応点決定が可能となる。
ところで、特徴点Pの内分比は、標準パターンを対象に複数のストロークをつないで1つのストロークとした場合には変化する。このような場合には、新たな内分比を再計算する必要がある。
例えば、図12のように、Pが本来ストロークSl(ストローク長L1 (=a+b))をa:bで内分した点であり、そのストロークS1と(ストローク長L2 の)ストロークS2を(ストローク長L12の裏ストロークを介して)つないで新しいストロークとした場合には、特徴点Pの新たな内分比a′:b′は、a′:b′=a:(b+L12+L2 )
となる。なお、1ストローク上の特徴点の数は1つとは限らない。
さて、ストローク間距離計算部13内の特徴点対応点間距離計算部132は、標準文字パターン記憶部12に登録されている全ての標準パターンについて、その標準パターンの各ストローク毎に、当該ストローク上の各特徴点Pi と対応点決定部131により求められた入力文字の対応点Pi ^との間の距離di =d(Pi,Pi ^)を計算する。
距離総和計算部133は、標準文字パターン記憶部12に登録されている全ての標準パターンの各ストロークについて、特徴点対応点間距離計算部132で算出された当該ストローク上の各特徴点Pi と対応点Pi ^間の距離di のi=1〜i=n(nは該当するストローク上の特徴点の総数)までの総和Σdi をストローク間距離として求める。
パターン間距離計算部14は、ストローク間距離計算部13にて標準パターン別に求められた、当該標準パターンと入力文字との間の対応ストローク毎のストローク間距離をもとに、標準パターン別に当該ストローク間距離の和を算出し、その標準パターンと入力文字とのパターン間距離(パターン間類似度)とする。
パターン間距離比較部15は、パターン間距離計算部14により各標準パターン別に求められたパターン間距離を比較して、値が最小のパターン間距離を判断し、対応する標準パターンの文字を、入力文字に対する認識結果とする。なお、パターン間距離が小さいものから順に対応する標準パターンの文字を選択して認識候補とし、その順に表示して利用者に選択させることも可能である。
以上のように候補文字認識部5により、順次入力されてくる候補文字と各標準文字に対する相異度の中で最少となるものを検出し、候補文字認識結果としてその標準文字の名称と相異度とを最適文字列選出部7に入力する。
候補文字重み計算部6は、重み計算部4から得られる各基本セグメントの重み付け値と、候補文字生成部3から得られる基本セグメントの組み合わせの情報から、組み合わせられた基本セグメントの重み付け値の和を計算する。
最適文字列選出部7は、入力ストローク列に対して、相異度と候補文字重み付け値の積の総和を最少とする文字名称の系列を割り当てる。
図16(a)〜(e)に筆跡情報が入力されてから認識結果が出力されるまでの経緯を示す。図16(a)に示すように、座標入力部1に手書き入力文字列が入力されると、基本セグメント分割部2において、図16(b)にあるように基本セグメントS1〜S6に分割される。
基本セグメント分割部2により分割された基本セグメントS1〜S6は、候補文字生成部3により、基本セグメントの組み合せが所定条件を満たすものを候補文字とし生成される。更に候補文字(図16(c)ではS1〜S6、及びS3+S4、S5+S6からなる)について、重み計算部4により重み付け値が算出される。
また、16(c)にあるように、候補文字認識部5は、候補文字生成部3から入力された候補文字と標準文字群との間で逐次相異度を算出し、候補文字認識結果として標準文字の名称とその相異度とを検出される。このときS1の候補文字について、重み付け値1.0、認識結果は「文(1.1)」、「六(1.3)」等が出力され、基本セグメントS3+S4の候補文字はについて、組み合わせられた基本セグメントの重み付け値の和0.5+0.6を計算して1.1が算出される。
ここで認識された候補文字列は図16(d)にあるように示される。これら候補文字列について、最適文字列選出部7により、候補文字重み計算部6から得られる基本セグメントの組み合わせた重み付け値の和と、候補文字認識部5から得られる認識結果から、図16(e)にあるように相異度と候補文字重み付け値の積の総和を算出し、この中で最少とする文字名称の系列を選出し、最終の認識結果とする。
つまり、相違度と候補文字重み付け値の積の総和を用いることで、基本セグメントを組み合せた候補文字と、基本セグメントからなる候補文字とを同じ尺度で比較することができるため、異なる切り出し位置の候補文字列を正しく認識することができる。
本発明の実施例の構成を示すブロック図。 基本セグメントの分割を説明する図。 候補文字認識部の詳細構成を示すブロック図。 ストローク対応部11の内部構成を示すブロック図。 標準パターンのストローク数(画数)を入力文字のストローク数(画数)に合わせるために標準パターンのストロークを順序関係を保ってつなぐ場合のつなぎ方を示す図。 標準パターンのストロークを図5(a)のようにつないだ場合の、当該標準パターンと入力文字との間のストローク同士の対応を示す図。 図3中のストローク対応部11の変形例を示すブロック構成図。 図3中のストローク間距離計算部13の内部構成を示すブロック図。 図8中の対応点決定部131による標準パターンのストローク上の特徴点Pに対応する入力文字のストローク上の点(対応点)P^の求め方を説明するための図。 図8中の対応点決定部131で、図9とは異なる方法で対応点P^を求めるための、当該対応点決定部131の内部構成を示すブロック図。 図10の構成の対応点決定部131による対応点P^の求め方を説明するための図。 標準パターン内の複数のストロークをつないで1つのストロークとした場合の、特徴点の内分比の再計算の仕方を説明するための図。 同一文字に対する種々の続け書き文字の一例を、文字「口」の場合について示す図。 互いに画数の異なる標準パターンと入力文字の一例を、文字「口」の場合について示す図。 図14の標準パターンと入力文字との間でストローク対応がとれなくなることを説明するための図。 本発明の実施例の動作を説明する図。
符号の説明
1…座標入力部
2…基本セグメント分割部
3…候補文字生成部
4…重み計算部
5…候補文字認識部
6…候補文字重み計算部
7…最適文字列選出部

Claims (6)

  1. タブレットからストローク列として入力した手書き文字列を文字毎に区分けし、各文字を認識する手書き文字列認識装置において、
    入力ストローク列を複数の基本セグメントの列に分割する基本セグメント分割手段と、 前記基本セグメントごとに重み付け値を算出する重み計算手段と、
    前記基本セグメントを組み合わせて候補文字を順次生成する候補文字生成手段と、
    組み合わせた前記基本セグメントの重み付け値の和を候補文字重み付け値として計算する候補文字重み計算手段と、
    前記候補文字を標準文字群との照合によって認識した文字名称と相異度を検出する候補文字認識手段と、
    入力ストローク列に対し相異度と候補文字重みつけ値との積の総和を最小とする文字名称の系列を割り当てる最適文字列選出手段とを有することを特徴とする手書き文字列認識装置。
  2. 前記候補文字認識手段は、入力した手書き文字列の全ての候補文字に対して標準文字群との照合によって認識した文字名称と相異度を検出することを特徴とする請求項1記載の手書き文字認識装置。
  3. 前記重み計算手段は、前記基本セグメントを囲む外接四角形の面積から算出されることを特徴とする請求項1または請求項2記載の手書き文字認識装置。
  4. タブレットからストローク列として入力した手書き文字列を文字毎に区分けし、各文字を認識する手書き文字列認識方法において、
    入力ストローク列を複数の基本セグメントの列に分割するステップと、 前記基本セグメントごとに重み付け値を算出するステップと、
    前記基本セグメントを組み合わせて候補文字を順次生成するステップと、
    組み合わせた前記基本セグメントの重み付け値の和を候補文字重み付け値として計算するステップと、
    前記候補文字を標準文字群との照合によって認識した文字名称と相異度を検出するステップと、
    入力ストローク列に対し相異度と候補文字重みつけ値との積の総和を最小とする文字名称の系列を割り当てるステップとを有することを特徴とする手書き文字列認識方法。
  5. 前記検出するステップは、入力した手書き文字列の全ての候補文字に対して標準文字群との照合によって認識した文字名称と相異度を検出することを特徴とする請求項4記載の手書き文字認識方法。
  6. 前記重み付け値を算出するステップは、前記基本セグメントを囲む外接四角形の面積から算出されることを特徴とする請求項4または請求項5記載の手書き文字認識方法。
JP2003374831A 2003-11-04 2003-11-04 手書き文字認識装置、及び手書き文字認識方法 Pending JP2005141329A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003374831A JP2005141329A (ja) 2003-11-04 2003-11-04 手書き文字認識装置、及び手書き文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003374831A JP2005141329A (ja) 2003-11-04 2003-11-04 手書き文字認識装置、及び手書き文字認識方法

Publications (1)

Publication Number Publication Date
JP2005141329A true JP2005141329A (ja) 2005-06-02

Family

ID=34686425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003374831A Pending JP2005141329A (ja) 2003-11-04 2003-11-04 手書き文字認識装置、及び手書き文字認識方法

Country Status (1)

Country Link
JP (1) JP2005141329A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1332348C (zh) * 2005-09-23 2007-08-15 清华大学 印刷体阿拉伯字符集文本切分方法
JP2010039609A (ja) * 2008-08-01 2010-02-18 Tokyo Univ Of Agriculture & Technology プログラム、情報記憶媒体及び文字列認識装置
US7734094B2 (en) 2006-06-28 2010-06-08 Microsoft Corporation Techniques for filtering handwriting recognition results
JP2013186906A (ja) * 2012-03-09 2013-09-19 Fujitsu Ltd 画像中の文字列を認識する方法及び装置
JP2013543158A (ja) * 2010-08-24 2013-11-28 ノキア コーポレイション 重なった手書き文字のストロークを一つ又は複数のグループにグループ分けする方法及び装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1332348C (zh) * 2005-09-23 2007-08-15 清华大学 印刷体阿拉伯字符集文本切分方法
US7734094B2 (en) 2006-06-28 2010-06-08 Microsoft Corporation Techniques for filtering handwriting recognition results
JP2010039609A (ja) * 2008-08-01 2010-02-18 Tokyo Univ Of Agriculture & Technology プログラム、情報記憶媒体及び文字列認識装置
JP2013543158A (ja) * 2010-08-24 2013-11-28 ノキア コーポレイション 重なった手書き文字のストロークを一つ又は複数のグループにグループ分けする方法及び装置
JP2013186906A (ja) * 2012-03-09 2013-09-19 Fujitsu Ltd 画像中の文字列を認識する方法及び装置

Similar Documents

Publication Publication Date Title
US8005263B2 (en) Hand sign recognition using label assignment
US5729629A (en) Handwritten symbol recognizer
EP1374148B1 (en) Method and device for recognition of a handwritten pattern
CN111931710B (zh) 一种联机手写文字识别方法、装置、电子设备及存储介质
KR102293538B1 (ko) 음악 심볼들을 인식하기 위한 방법 및 장치
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
JP2007213433A (ja) 文字検索装置
JP2005141329A (ja) 手書き文字認識装置、及び手書き文字認識方法
Tung et al. Stroke-order-free on-line Chinese character recognition by stroke adjustment of two-layer bipartite weighted matching
CN107341429A (zh) 手写粘连字符串的切分方法、切分装置和电子设备
JP5729260B2 (ja) 文字認識用コンピュータプログラム、文字認識装置及び文字認識方法
CN114925252B (zh) 一种基于邻域的书法机械臂的笔画推荐方法
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JPS6129982A (ja) オンライン手書き文字列認識方式
JP3015137B2 (ja) 手書文字認識装置
JPH0922443A (ja) オンライン手書き文字認識方法
KR20240113259A (ko) 문자열 탐지를 위한 문자 탐지 방법 및 이를 수행하기 위한 장치
KR20240113261A (ko) 문자열 인식을 위한 문자 인식 방법 및 이를 수행하기 위한 장치
KR20240113263A (ko) 문자열 탐지를 위한 문자열 탐지 모델의 훈련 방법 및 이를 수행하기 위한 장치
KR20240113257A (ko) 비표 인식 방법 및 이를 수행하기 위한 장치
JP6437208B2 (ja) 手書き音楽記号認識装置及び手書き音楽記号認識プログラム
JPH0580711B2 (ja)
JPH10143610A (ja) 文字認識装置
JPS63204489A (ja) 類似文字識別方式
JPH07282200A (ja) オンライン文字認識装置

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071015

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071120