JP2003108926A - 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 - Google Patents
文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体Info
- Publication number
- JP2003108926A JP2003108926A JP2001295168A JP2001295168A JP2003108926A JP 2003108926 A JP2003108926 A JP 2003108926A JP 2001295168 A JP2001295168 A JP 2001295168A JP 2001295168 A JP2001295168 A JP 2001295168A JP 2003108926 A JP2003108926 A JP 2003108926A
- Authority
- JP
- Japan
- Prior art keywords
- character
- reliability
- weight
- candidate
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
を出力し得る文字認識装置および文字認識方法を提供す
ること 【解決手段】 認識候補文字群(類似度1位からN位)
の信頼度を算出し、かかる信頼度に応じて、文字群間の
連接確率の重みを動的に変化させる。
Description
て所定の文字を認識する文字認識装置、文字認識方法、
その実行プログラムおよびそれを記憶した記録媒体に関
する。
ば筆記入力された文字の特徴量を抽出し、これを認識辞
書中の特徴量と比較して、両者の類似度が高い(両者の
距離値が小さい)認識候補文字を出力するようにしてい
た。しかしながら、かかる一文字毎の文字認識では、認
識辞書の特徴量から離れた文字を筆記した場合に、適正
な認識結果を得ることができない。
識に加え、前後の文字あるいは単語間・文節間の連接確
率を判定する後処理を実行し、かかる後処理結果に基づ
いて認識文字列候補を出力するようにしている。
には、認識候補文字間の連接確率を判定して後処理を実
行する方法が記載されている。かかる後処理において
は、たとえば図12に示すように、「本日は晴」と手書
き入力がなされ、各手書き文字に対する認識候補文字
(類似度1位から3位)が同図に示すとおりであったと
すると、各認識文字を接続した34=81通りの文字列
に対する連接確率が算出される。例えば、各認識候補文
字の1位の文字を接続した文字列「本目は哨」について
は、「本」と「目」、「目」と「は」、「は」と「哨」
の連接確率が連接確率辞書から読み出され、これら各文
字間の連接確率の合計を当該文字列全体の連接確率の合
計値とする。そして、かかる連接確率の合計値と、当該
文字列を構成する各認識候補文字の類似度の合計値とを
合算し、これにより当該文字列の文字列評価値(整合
度)を算出する。このようにして81通りの文字列に対
する整合度が算出されると、これら整合度が比較され、
この内、整合度が最も大きな文字列が認識文字列候補と
して出力される。
においては、文字列の連接確率の合計値と各文字の類似
度の合計値を合算する場合、連接確率の合計値に一定の
重みwを乗じた後、これを類似度の合計値に加算するよ
うにしている。すなわち、手書き入力がT個の文字から
構成されているとすると(図12の場合はT=4)、所
定の文字列の整合度Lは以下のように算出される。
gP(1,2)+logP(2,3)+…+logP
(T−1,T)} ここで、SKは当該文字列を構成するK番目の文字の類
似度、P(K−1,K)はK−1番目の文字とK番目の
文字の連接確率である。
は、連接確率の項の重みwが一定であるため、類似度が
低い文字間についても類似度が高い文字間と同一の重み
が設定されることになる。その結果、上位の認識候補文
字に正解が存在している場合に、誤って下位の認識候補
文字が認識文字列候補として選択されたり、逆に、下位
に正解が含まれている場合に、当該正解を含む文字列が
認識文字列候補として選択され得ないとの問題が生じ
る。
解消し、上記従来例に比べて精度の高い認識文字列候補
を出力し得る文字認識装置および文字認識方法を提供す
ることを課題とする。
によって生成される認識結果(入力文字に対する認識候
補文字群、認識候補単語群、認識候補文節群など)の信
頼度を判定し、かかる信頼度に基づいて、後処理段階に
おける連接確率の重み付けを適宜変更するものである。
後処理を施すことにより認識文字列候補を出力する文字
認識装置において、前記文字認識結果の信頼度を算出す
る信頼度算出手段と、当該信頼度算出手段によって算出
された信頼度に基づいて、連接関係にある前記認識結果
の連接確率得点の重みを設定する重み設定手段とを備
え、前記重み設定手段によって設定された重みに基づい
て候補文字列の整合度を算出し、当該整合度の高い候補
文字列を認識文字列候補として出力する、ことを特徴と
する。
記信頼度算出手段は、認識候補文字群の上位の候補文字
に正解が含まれる確率として信頼度を算出し、前記重み
設定手段は、当該信頼度が大きい場合には重みを小さく
設定し、当該信頼度が小さい場合には重みを大きく設定
する、ことを特徴とする。
いて、前記信頼度算出手段は、信頼度と重みの関係を規
定する信頼度―重み変換テーブルを予め備えており、当
該変換テーブルに基づいて前記重みを設定する、ことを
特徴とする。
いて、前記候補文字列がT個の文字により構成され、そ
の内、K番目の文字の類似度をSK、K−1番目の文字
とK番目の文字の連接確率をP(K−1、K)、当該文
字間の連接確率の重みをw(K−1、K)とした場合、
前記整合度Lは、L=(S1+S2+…+ST)+{w
(1,2)・logP(1,2)+w(2,3)・lo
gP(2,3)+…+w(T−1,T)・logP(T
−1,T)}に従って算出される、ことを特徴とする。
みw(K−1、K)は、K番目の入力文字に対する認識
候補文字群の信頼度に基づいて設定される、ことを特徴
とする。
後処理を施すことにより認識文字列候補を出力する文字
認識方法において、前記文字認識結果の信頼度を算出す
る信頼度算出ステップと、当該信頼度算出手段によって
算出された信頼度に基づいて、連接関係にある前記認識
結果の連接確率得点の重みを設定する重み設定ステップ
と、当該重み設定ステップによって設定された重みに基
づいて候補文字列の整合度を算出する整合度算出ステッ
プと、当該整合度算出ステップによって算出された各候
補文字列の整合度を比較し、最も整合度の高い候補文字
列を認識文字列候補として出力する認識文字列候補出力
ステップと、を有することを特徴とする。
記信頼度算出ステップは、認識候補文字群の上位の候補
文字に正解が含まれる確率として信頼度を算出し、前記
重み設定ステップは、当該信頼度が大きい場合には重み
を小さく設定し、当該信頼度が小さい場合には重みを大
きく設定する、ことを特徴とする。
いて、前記信頼度算出ステップは、信頼度と重みの関係
を規定する信頼度―重み変換テーブルに基づいて前記重
みを設定する、ことを特徴とする。
いて、前記候補文字列がT個の文字により構成され、そ
の内、K番目の文字の類似度をSK、K−1番目の文字
とK番目の文字の連接確率をP(K−1、K)、当該文
字間の連接確率の重みをw(K−1、K)とした場合、
前記整合度算出ステップは、L=(S1+S2+…+
S T)+{w(1,2)・logP(1,2)+w
(2,3)・logP(2,3)+…+w(T−1,
T)・logP(T−1,T)}に従って整合度Lを算
出する、ことを特徴とする。
重みw(K−1、K)は、K番目の入力文字に対する認
識候補文字群の信頼度に基づいて設定される、ことを特
徴とする。
の何れかの文字認識方法の各処理ステップを実行するプ
ログラムである。
ラムを記憶した記録媒体である。
説明により更に明らかとなろう。
は実施の形態における認識信頼度算出部300(連接特
徴抽出部4、文字間連接確率辞書5、判別得点算出部
6、認識信頼度算出部7および判別得点―信頼度変換テ
ーブル8)が対応する。請求項における「重み設定手
段」は実施の形態における文字認識後処理部400(信
頼度―重み変換テーブル12)が対応する。
プ」は実施の形態における図10のステップS103〜
ステップS105が対応する。請求項における「重み設
定ステップ」は実施の形態における図10のステップS
107(後処理:信頼度―重み変換テーブル12に基づ
いて重みを設定する処理)が対応する。請求項における
「整合度算出ステップ」は実施の形態における図10の
ステップS107(後処理:式(1)に従って演算を行
う処理)が対応する。請求項における「認識文字列候補
出力ステップ」は実施の形態における図10のステップ
S107(後処理:整合度が最も高い文字列を認識文字
列候として出力する処理)が対応する。
は実施の形態における認識候補文字群が対応する。
も、本発明の一つの実施形態であって、本発明ないし各
構成要件の用語の意義は、以下の実施の形態に記載され
たものに制限されるものではない。
図面を参照して説明する。
の基本構成を示す機能ブロック図である。図において、
100は入力部で、入力文字の筆跡、形状等を検出し、
その特徴を示す情報を出力する。200は文字認識部
で、入力部1から供給された文字情報を文字認識辞書中
の特徴量と比較し、類似度が1位からN位までの文字を
認識候補文字として出力する。
200から出力された各入力文字の候補文字群(類似度
1位からN位)の信頼度を算出する。ここで信頼度と
は、当該候補文字群中の上位の候補文字に正解が含まれ
る確率のことである。例えば、当該候補文字群中の1位
の候補文字が正解である確率を、当該候補文字群の信頼
度とすることもできる。
識部200から出力される候補文字群を組み合わせて文
字列を生成し、文字列毎に整合度を算出する。そして、
算出した整合度のうち最も大きな整合度を有する文字列
を認識文字列候補として出力する。
頼度算出部300からの信頼度に基づいて算出される。
具体的には、認識信頼度算出部300からの信頼度に応
じて、以下の式(1)における重みw(K−1,K)を
適宜変更し、当該対象文字列の整合度Lを算出する。 L=(S1+S2+…+ST)+{w(1,2)・logP(1,2)+w(2, 3)・logP(2,3)+…+w(T−1,T)・logP(T−1,T)} …(1) ここで、Skは対象文字列中のK番目の文字の類似度、
P(K−1,K)は対象文字列中のK−1番目の文字と
K番目の文字との間の連接確率、w(K−1,K)は当
該K−1番目の文字とK番目の文字との間の連接関係に
適用される重みである。
連接関係にあるK−1番目の文字群とK番目の文字群の
内、K番目の文字群の信頼度に着目して設定される。具
体的には、かかるK番目の文字群の信頼度が高ければ重
みw(K−1,K)を小さく設定し、逆に、当該K番目
の文字群の信頼度が高ければ重みw(K−1,K)は大
きく設定する。
に正解が含まれる確率を示すものであるから、信頼度が
高い場合には類似度を強調して上位文字が選択されるよ
うにする。他方、文字群の信頼度が低い場合には、上位
よりも下位の文字中にも正解が含まれる可能性が高いの
で、類似度よりもむしろ連接確率の方を強調する。上記
重みw(K−1,K)は、かかる点を考慮して、上述の
如く、文字群の信頼度が高ければ小さく設定され、逆
に、文字群の信頼度が低ければ大きく設定されている。
識候補文字、類似度、生成文字列、連接確率、信頼度お
よび重みwの適用例を示す。なお、同図には、便宜上、
各入力文字に対する候補文字群は1位から3位までのみ
を図示している。
文字群と2文字目「日」の認識候補文字群との間の連接
関係に対しては、如何なる文字の組み合わせであっても
一様に重みw(1,2)が適用される。同様に、2文字
目「日」の認識候補文字群と3文字目「は」の認識候補
文字群との間の連接関係、および3文字目「は」の認識
候補文字群と4文字目「晴」の認識候補文字群との間の
連接関係に対しては、それぞれw(2,3)およびw
(3,4)が適用される。また、重みw(1,2)は、
2文字目「日」の認識候補文字群の信頼度0.82に基
づいて設定される。同様に、重みw(2,3)と重みw
(3,4)は、それぞれ3文字目「は」の認識候補文字
群の信頼度0.98および4文字目「晴」の認識候補文
字群の信頼度0.60に基づいて設定される。
認識候補文字群の信頼度を比較すると、3文字目の文字
群の信頼度が最も大きく、4文字目の文字群の信頼度が
最も小さいので、上記3つの重みの内、w(2,3)が
最も小さく設定され、w(3,4)が最も大きく設定さ
れる。例えば、信頼度に対する重みの設定が、図3のよ
うになっているとすると、これら3つの重みはそれぞ
れ、w(1,2)=0.34、w(2,3)=0.3
0、w(3,4)=0.45に設定される。
をこのよう変更して設定すれば、重みを一律とした場合
に比べ、信頼度が高い文字群では上位の候補文字が認識
文字列候補に含まれやすくなり、信頼度が低い文字群で
は下位の候補文字であっても認識文字列候補に含まれや
すくなる。
とえば以下の手順に従って行われる。
手書き文字データ)に対して文字認識を行う。次に各認
識候補文字群に対して信頼度を求める。さらに、求めら
れた信頼度の値に基づいて認識候補文字群をN個のグル
ープに分ける。
であるが、文字間の連接確率を用いて後処理を行うた
め、一つのグループ中に属する認識候補文字群だけを用
いて後処理を実行することはできない。従って、一のグ
ループに対する重みを設定する場合には、当該グループ
以外のグループの重みを何らかの重みに設定しておく必
要がある。
0−90201号公報に記載の方法に従って、学習サン
プル全体で最適な重みw0を予め求めておき、一つのグ
ループに対する重みを設定する場合には、当該グループ
以外のグループには、かかる全体の重みw0を設定す
る。そして、設定対象のグループに対する重みを変更し
ながら、学習サンプルに対して最も高い正解率が得られ
た重みを当該グループの重みとして設定する。同様に、
次のグループの重みを設定する場合には、それ以外のグ
ループの重みをw0に設定して、当該グループに最適な
重みを設定するようにする。
具体化した実施例について以下に説明する。なお、上記
基本構成を具体化する実施例は、以下の実施例に限られ
ず、他に種々の変更が可能である。特に、信頼度の算出
方法は以下の実施例以外のものも適用可能である。
装置のブロック図を示す。
に手書き入力された筆跡から筆跡文字情報を生成し出力
する。2は文字認識部で、入力部1から供給された筆跡
文字情報を文字認識辞書3の文字特徴量と比較し、両者
の類似度が1位からN位までの認識辞書中の文字を当該
筆跡文字の認識候補文字として出力する。3は文字認識
辞書で、候補文字がその文字特徴量とともに記憶されて
いる。
供給される認識候補文字列の内、正誤判定対象である一
の認識候補文字の連接特徴量を、文字間連接確率辞書5
を参照しながら抽出する。5は文字間連接辞書で、所定
の2つの文字が連接する確率を当該2つの文字に対応づ
けて記憶している。
からの連接特徴量を処理して、当該判定対象の認識候補
文字群の正誤判別得点を算出する。
6からの判別得点と、判別得点−信頼度変換テーブル8
とを比較して、当該判定対象の認識候補文字群の信頼度
を出力する。8は判別得点−信頼度変換テーブルで、判
別得点と信頼度の関係をテーブルとして記憶するもので
ある。
らの信頼度と、信頼度−累積正読率テーブル10とを比
較して、当該判定対象文字の認識候補数を制限するもの
である。10は信頼度−累積正読率テーブルで、信頼度
と正読率の関係をテーブルとして記憶するものである。
よって設定された個数の認識候補文字を対象として後処
理を行う。例えば、筆記入力文字の内、1番目の文字に
対する認識候補数がM1個、以下、2番目ないし7番目
の筆記文字に対する認識候補数がM2ないしM7個と設
定されたとすると、文字認識部2で生成されたこれら各
文字の認識候補文字の内、それぞれ類似度が上位M1、
M2、M3、M4、M5、M6、M7個の認識候補文字
のみを対象として、後処理部11にて、後処理が行われ
る。かかる後処理部11は、上記基本構成の説明にて示
した如く、これら上位M1、M2、M3、M4、M5、
M6、M7個の認識候補文字を組み合わせて文字列を生
成し、上記式(1)に従って、各生成文字列の整合度を
算出する。そして、整合度が最も高い文字列を認識文字
列候補として出力する。
ば、上記基本構成で示した図3のような変換テーブルを
記憶している。
理の詳細について説明する。まず、図5を参照して、連
接特徴抽出部4の処理について説明する。
認識候補文字群とその直前の第1位候補文字との間の連
接確率Pbkと、その直後の第1位候補文字との間の連
接確率Pfkの何れか一方または両方を文字間連接確率
辞書5から読み出し、当該認識候補文字群の連接特徴量
とする。例えば、連接確率PbkとPfkの両方を用い
て連接特徴量を抽出する場合には、図5に示すように、
判定対象文字の認識候補文字群(類似度1位からN位ま
で)である「目」、「日」、…、「田」と、その直前の
認識候補文字群の類似度1位文字「本」との間の連接確
率Pb1、Pb2、…、PbNと、その直後の類似度1
位文字「は」との間の連接確率Pf1、Pf2、…、P
fNをそれぞれ文字間連接確率辞書5から読み出し、こ
れら連接確率の値を、当該判定対象の認識候補文字群の
連接特徴量とする。
徴量をPbkとPfkの両方にて抽出するようにした
が、PbkまたはPfkの何れか一方にて抽出するよう
にしても良い。また、PbkとPfkの両方にて抽出す
る場合において、直前の第1位認識候補文字が存在しな
い場合(例えば、判定対象文字が文字列の先頭であるよ
うな場合)には、当該候補文字の直後文字に対する連接
確率Pfkをそのまま直前文字に対する連接確率Pbk
に代用して連接特徴量を抽出する。同様に、直後の第1
位認識候補文字が存在しない場合(例えば、判定対象文
字が文字列の末尾であるような場合)には、Pbkをそ
のまま代用する。
における処理について説明する。上記連接特徴抽出部4
にて抽出したPbkとPfkの値は、2N次元のベクト
ル空間において所定のベクトル(連接特徴ベクトル)と
して表現できる。判別得点算出部6では、予め第1位の
認識候補文字が正読(正解)または誤読(誤り)である
サンプルについて連接特徴ベクトルを学習データとして
抽出しておき、これと判定対象の認識候補文字群の連接
特徴ベクトルとを比較して、当該認識候補文字群の判別
得点を算出する。
の学習データと判定対象の認識候補文字群の連接特徴ベ
クトルが図6に示すような状態にあるとする。判別得点
算出部6は、正読、誤読のそれぞれの集合(クラス)の
特徴ベクトルの分布から、予め、両クラスの特徴ベクト
ルの平均値(重心ベクトル)および共分散行列を求め、
これを記憶している。そして、これら各クラスの重心と
判定対象文字群の連接特徴ベクトルとの間のマハラノビ
ス距離DMc、DMeを求め、これらの値の比、比の対
数または差を判別得点とする。
ようにして算出される。すなわち、クラスC1の重心ベ
クトルをm1、クラスC1の共分散行列をΣ1とする
と、所定の特徴ベクトルxからm1へのマハラノビス2
乗距離DM1は、次式で定義される。
(t:転置、−1:逆行列) ここで、共分散行列Σ1はn×nの正方行列であり
(n:特徴空間の次元数)、その(i,j)要素はi番
目の特徴量とj番目の特徴量の共分散、すなわちΣ
1(i,j)=σijである。
距離DMを用いて算出したが、これに替えて、正読、誤
読の各クラスの特徴ベクトルの分布から線形判別分析に
より線形判別関数を求めておき、判定対象の認識候補文
字群の特徴ベクトルに対してこの線形判別関数を当ては
めて判別得点を求めるようにしても良い。また、正読、
誤読の学習サンプルから抽出した特徴ベクトルを学習デ
ータとして、対象の特徴ベクトルが正読か誤読かを判定
できるように学習させたニューラルネットを用い、判定
対象の特徴ベクトルに対する当該ニューラルネットの出
力値を判別得点とするようにしてもよい。
の処理について説明する。たとえば、上記判別得点の算
出において、マハラノビス距離DMc、DMeの距離の
比または比の対数を判別得点とした場合、正読および誤
読の各学習サンプルから得られる判別得点と信頼度の関
係は図7に示すようになる。ここで、信頼度は、学習サ
ンプルからベイズの定理によって算出される。
ル個数の全正読サンプル個数に対する比率をp(y|X
1=C)、判別得点yを有する誤読サンプル個数の全誤
読サンプル個数に対する比率をp(y|X1=E)、全
サンプル数に対する正読サンプル数の総数の比率をP
(X1=C)、全サンプル数に対する誤読サンプル数の
総数の比率をP(X1=E)とすると、判別得点yを有
する認識候補文字群の類似度1位の認識候補文字の信頼
度は、次式によって算出できる。
・P(X1=C)/[p(y|X1=C)・P(X1=
C)+p(y|X1=E)・P(X1=E)] ここで、X1は1位の認識候補文字を表し、X1=C、
X1=Eはそれぞれ、1位認識候補文字が正解、不正解
である事象を意味する。
す判別得点―信頼度変換テーブルを予め作成しておき、
これを判別得点―信頼度変換テーブル8に記憶させてお
く。認識信頼度算出部7は判別得点算出部6からの判別
得点と、当該判別得点―信頼度変換テーブル8の得点を
比較し、該当する信頼度を、当該認識候補文字群の第1
位の認識候補文字の信頼度として出力する。
9の処理について説明する。図8の上部に示す表は、判
定対象の類似度1位の認識候補文字に対する信頼度と、
当該判定対象のN位までの認識候補文字の中に正読の文
字が含まれる累積確率との関係を示すものである。かか
る表中の確率は、上記正読、誤読の学習サンプルを基に
予め算出しておく。
かる表を記憶させておく。そして、認識候補数制御部9
は、判定対象の認識候補文字群の信頼度と当該テーブル
中の信頼度レベルとを比較し、該当する信頼度レベルの
累積確率を参照しながら何位までの認識候補文字を後処
理部11に出力するかを決定する。ここで、何位までを
出力するかは、例えば、該当する信頼度レベルの累積確
率が所定のしきい値に達したか否かで決定する。この
際、設定されるしきい値は、全ての信頼度レベルに対し
て一律としても良いし、あるいは、信頼度レベル毎に個
別に設定するようにしても良い。
レベル毎の出力候補数を予め設定し、これを信頼度−累
積正読率テーブル10に記憶させておいても良い。図8
の下部に示す表は、信頼度レベルと出力候補数とを予め
設定した場合の一例である。信頼度―累積正読率テーブ
ル10に予めかかる表を記憶させた場合には、認識候補
数制御部9は、該当する出力候補数を表から読み出し、
それに従って、後処理部11に出力される認識候補文字
を制限する。これにより、無駄な後処理を排除し、処理
の迅速化、効率化を図ることができる。
き各認識候補文字群の数が制限されると、後処理部11
は、対象とされる範囲の認識候補文字を組み合わせて後
処理対象の文字列を生成する。そして、各文字列中の文
字間の連接確率を文字間連接確率辞書5から読み出すと
共に、候補文字群の信頼度に基づいて当該候補文字群の
重みを信頼度―重み変換テーブル12から読み出す。そ
して、かかる連接確率と重みに基づいて、上記式(1)
の連接確率の項の得点を算出する。さらに、対象文字列
を構成する各文字の類似度を加算して、上記式(1)の
類似度の項の得点を算出する。そして、これら両得点を
合算して、対象文字列の整合度を算出する。かかる整合
度を全ての生成文字列について算出し、これら整合度を
順番に比較する。そして、最も整合度の高い生成文字列
を認識文字列候補として出力する。
例であるが、これ以外にも種々の実施例を構成し得る。
たとえば、上記実施例では、図5に示すとおり、判定対
象文字と直前および直後の1位文字との間の連接確率
(Pbk、Pfk)を当該判定対象文字の連接確率とし
たが、これに替えて、判定対象の認識候補文字と直前の
1位からM位までの文字との間の連接確率の最大値を直
前文字との連接確率とし、同様に、判定対象の認識候補
文字と直後の1位からM位までの文字との間の連接確率
の最大値を直後文字との連接確率とすることも可能であ
る。
「日」と直前文字群との間の連接確率として、当該
「日」と直前の1位文字「朋」からM位文字「胡」まで
のそれぞれの連接確率P(C1|Cbk)の内、最大の
連接確率を採用する。また、判定対象文字「日」と直後
文字群との間の連接確率として、当該「日」と直後の1
位文字「も」からM位文字「亡」までのそれぞれの連接
確率P(Cfk|C1)の内、最大の連接確率を採用す
る。同様に、判定対象の認識候補文字の2位文字「月」
以下の文字についても、直前、直後の文字群に対する連
接確率の最大値を連接確率としてそれぞれ採用する。
文字を表し、Cbk、Cfkはそれぞれ、直前、直後の
認識候補k位の文字を表す。そして、P(Cj|Ci)
は、文字Ciに続いて文字Cjが現れる連接確率を表
す。
ブロック毎に処理を分けて一連の処理フローを説明した
が、かかる処理フローを制御プログラムとして格納して
おけば、単一の演算処理部によって、上記と同様の処理
フローを実行させることもできる。かかる場合、文字認
識辞書3、文字間連接確率辞書5、判別得点―信頼度変
換テーブル8、信頼度―累積正読率テーブル10および
信頼度−重み変換テーブル12の参照データも同様に、
ROMまたはRAMに予め記憶しておく必要がある。
示すフローチャートである。ここで、ステップS101
は上記入力部1における処理、ステップS102は上記
文字認識部2における処理、ステップS103は上記連
接特徴抽出部4における処理、ステップS104は上記
判別得点算出部6における処理、ステップS105は上
記認識信頼度算出部7における処理、ステップS106
は上記認識候補数制御部9における処理、ステップS1
07は上記後処理部11における処理である。
タは、フロッピー(登録商標)ディスク等の記録媒体を
介して文字認識装置内のRAMに格納させることもでき
るし、または、インターネット等の伝送媒体を介して当
該RAMに格納させることもできる。格納されるべきデ
ータのファイル構造の一例を図11に示す。
フローのみを取り込みたい場合には、図10に示す全て
のステップに関するデータを文字認識装置内に格納する
必要はない。たとえば、信頼度算出の処理のみを取り込
んで実行させたい場合には、図10の内、ステップS1
03ないしS105の実行プログラムおよびそれに必要
な文字間連接確率辞書データ、判別得点―信頼度変換テ
ーブルデータのみを格納すれば良い。また、信頼度の算
出から後処理までの処理を実行させたい場合には、ステ
ップS103ないしS107の実行プログラムおよびそ
れに必要な参照データのみを格納すれば良い。記録媒体
または伝送媒体を介してインストールする場合には、こ
れらの制御プログラムと参照データをファイルとして記
録媒体に格納し、または、伝送媒体を介して伝送するよ
うにする。
明したが、本発明は係る実施の形態に制限されるもので
はなく、他に種々の変更が可能である。たとえば、上記
実施例では手書き文字認識装置に対して本発明を適用し
た例を示したが、本発明は、それ以外に、光学式文字認
識装置あるいは音声入力による認識装置等にも広く適用
し得るものである。
定方法として、直前の文字群と直後の文字群との間の連
接関係に基づく信頼度判定方法を示したが、これ以外の
信頼度判定方法を採用することも可能である。
して、文字間の連接確率に基づく後処理の方法を示した
が、これ以外に、たとえば、単語間、文節間の連接関係
に基づく後処理方法を採用することも可能である。かか
る場合、信頼度の算出は、単語群または文節群について
行われることになる。
後の文字群の内、後方の文字群の信頼度に基づいて当該
文字群間の連接関係の重みを設定したが、これ以外に、
前方の文字群の信頼度に基づいて重みを設定するように
してもよいし、両方の文字群の信頼度に基づいて重みを
設定するようにしてもよい。
テーブルは単なる一例であって、信頼度の区分は0.1
ずつでなくとも良く、さらに細かく信頼度を区分し、そ
れに応じた重みを設定するようにしてもよい。
点の算出方法や、ステップS105における認識信頼度
の算出方法も、上記実施の形態にて示したマハラノビス
距離DMを用いる方法や、ベイズの定理を用いる方法以
外の方法を採用することもできる。
の範囲内において、適宜、様々な変更が可能である。
信頼度に応じて後処理における連接確率の重み付けを個
別に設定するものであるから、当該重みを一律に設定す
る場合に比べ、正解文字列に近い文字列の整合度と正解
文字列から遠い文字列の整合度との間の区別をより明確
にすることができ、もって、後処理後の認識文字列候補
中に正解文字が含まれる確率を向上させることができ
る。
ク図
ート
ル構造を示す図
Claims (12)
- 【請求項1】 文字認識結果に対して後処理を施すこと
により認識文字列候補を出力する文字認識装置におい
て、 前記文字認識結果の信頼度を算出する信頼度算出手段
と、 当該信頼度算出手段によって算出された信頼度に基づい
て、連接関係にある前記認識結果の連接確率得点の重み
を設定する重み設定手段と、 を備え、 前記重み設定手段によって設定された重みに基づいて候
補文字列の整合度を算出し、当該整合度の高い候補文字
列を認識文字列候補として出力する、 ことを特徴とする文字認識装置。 - 【請求項2】 請求項1において、前記信頼度算出手段
は、認識候補文字群の上位の候補文字に正解が含まれる
確率として信頼度を算出し、 前記重み設定手段は、当該信頼度が大きい場合には重み
を小さく設定し、当該信頼度が小さい場合には重みを大
きく設定する、 ことを特徴とする文字認識装置。 - 【請求項3】 請求項1または2において、前記信頼度
算出手段は、信頼度と重みの関係を規定する信頼度―重
み変換テーブルを予め備えており、当該変換テーブルに
基づいて前記重みを設定する、 ことを特徴とする文字認識装置。 - 【請求項4】 請求項2または3において、前記候補文
字列がT個の文字により構成され、その内、K番目の文
字の類似度をSK、K−1番目の文字とK番目の文字の
連接確率をP(K−1、K)、当該文字間の連接確率の
重みをw(K−1、K)とした場合、前記整合度Lは、 L=(S1+S2+…+ST)+{w(1,2)・log
P(1,2)+w(2,3)・logP(2,3)+…
+w(T−1,T)・logP(T−1,T)} に従って算出される、ことを特徴とする文字認識装置。 - 【請求項5】 請求項4において、重みw(K−1、
K)は、K番目の入力文字に対する認識候補文字群の信
頼度に基づいて設定される、 ことを特徴とする文字認識装置。 - 【請求項6】 文字認識結果に対して後処理を施すこと
により認識文字列候補を出力する文字認識方法におい
て、 前記文字認識結果の信頼度を算出する信頼度算出ステッ
プと、 当該信頼度算出手段によって算出された信頼度に基づい
て、連接関係にある前記認識結果の連接確率得点の重み
を設定する重み設定ステップと、 当該重み設定ステップによって設定された重みに基づい
て候補文字列の整合度を算出する整合度算出ステップ
と、 当該整合度算出ステップによって算出された各候補文字
列の整合度を比較し、最も整合度の高い候補文字列を認
識文字列候補として出力する認識文字列候補出力ステッ
プと、 を有することを特徴とする文字認識方法。 - 【請求項7】 請求項6において、前記信頼度算出ステ
ップは、認識候補文字群の上位の候補文字に正解が含ま
れる確率として信頼度を算出し、 前記重み設定ステップは、当該信頼度が大きい場合には
重みを小さく設定し、当該信頼度が小さい場合には重み
を大きく設定する、 ことを特徴とする文字認識方法。 - 【請求項8】 請求項6または7において、前記信頼度
算出ステップは、信頼度と重みの関係を規定する信頼度
―重み変換テーブルに基づいて前記重みを設定する、 ことを特徴とする文字認識方法。 - 【請求項9】 請求項7または8において、前記候補文
字列がT個の文字により構成され、その内、K番目の文
字の類似度をSK、K−1番目の文字とK番目の文字の
連接確率をP(K−1、K)、当該文字間の連接確率の
重みをw(K−1、K)とした場合、前記整合度算出ス
テップは、 L=(S1+S2+…+ST)+{w(1,2)・log
P(1,2)+w(2,3)・logP(2,3)+…
+w(T−1,T)・logP(T−1,T)} に従って整合度Lを算出する、ことを特徴とする文字認
識方法。 - 【請求項10】 請求項9において、重みw(K−1、
K)は、K番目の入力文字に対する認識候補文字群の信
頼度に基づいて設定される、 ことを特徴とする文字認識方法。 - 【請求項11】 請求項6ないし10の何れかの文字認
識方法の各処理ステップを実行するプログラム。 - 【請求項12】 請求項11のプログラムを記憶した記
録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001295168A JP4326173B2 (ja) | 2001-09-26 | 2001-09-26 | 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001295168A JP4326173B2 (ja) | 2001-09-26 | 2001-09-26 | 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003108926A true JP2003108926A (ja) | 2003-04-11 |
JP4326173B2 JP4326173B2 (ja) | 2009-09-02 |
Family
ID=19116646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001295168A Expired - Fee Related JP4326173B2 (ja) | 2001-09-26 | 2001-09-26 | 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4326173B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026288A (ja) * | 2007-07-23 | 2009-02-05 | Sharp Corp | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
-
2001
- 2001-09-26 JP JP2001295168A patent/JP4326173B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026288A (ja) * | 2007-07-23 | 2009-02-05 | Sharp Corp | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
JP4533920B2 (ja) * | 2007-07-23 | 2010-09-01 | シャープ株式会社 | 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体 |
US8208765B2 (en) | 2007-07-23 | 2012-06-26 | Sharp Kabushiki Kaisha | Search and retrieval of documents indexed by optical character recognition |
Also Published As
Publication number | Publication date |
---|---|
JP4326173B2 (ja) | 2009-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108711422B (zh) | 语音识别方法、装置、计算机可读存储介质和计算机设备 | |
CN109032375B (zh) | 候选文本排序方法、装置、设备及存储介质 | |
US6513005B1 (en) | Method for correcting error characters in results of speech recognition and speech recognition system using the same | |
EP2486470B1 (en) | System and method for inputting text into electronic devices | |
Shannon | Optimizing expected word error rate via sampling for speech recognition | |
US6208971B1 (en) | Method and apparatus for command recognition using data-driven semantic inference | |
US20060136205A1 (en) | Method of refining statistical pattern recognition models and statistical pattern recognizers | |
JP6831343B2 (ja) | 学習装置、学習方法及び学習プログラム | |
CN111145718A (zh) | 一种基于自注意力机制的中文普通话字音转换方法 | |
CN116432655B (zh) | 基于语用知识学习的少样本命名实体识别方法和装置 | |
CN112232055A (zh) | 一种基于拼音相似度与语言模型的文本检测与纠正方法 | |
CN1391211A (zh) | 对识别系统中的参数进行训练的方法和系统 | |
CN112287680A (zh) | 一种问诊信息的实体抽取方法、装置、设备及存储介质 | |
Toselli et al. | Two methods to improve confidence scores for lexicon-free word spotting in handwritten text | |
CN111859967A (zh) | 实体识别方法、装置,电子设备 | |
CN111506726A (zh) | 基于词性编码的短文本聚类方法、装置及计算机设备 | |
CN113191133B (zh) | 一种基于Doc2Vec的音频文本对齐方法及系统 | |
US20050197838A1 (en) | Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously | |
CN112528003B (zh) | 一种基于语义排序和知识修正的多项选择问答方法 | |
CN112509565A (zh) | 语音识别方法、装置、电子设备及可读存储介质 | |
CN114444492B (zh) | 一种非标准词类判别方法及计算机可读存储介质 | |
CN115455142A (zh) | 文本检索方法、计算机设备和存储介质 | |
CN112651590B (zh) | 一种指令处理流程推荐的方法 | |
CN114579763A (zh) | 一种针对中文文本分类任务的字符级对抗样本生成方法 | |
CN110909546B (zh) | 一种文本数据的处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051208 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20051227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090512 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090609 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4326173 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130619 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |