JP2003108926A - 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 - Google Patents

文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体

Info

Publication number
JP2003108926A
JP2003108926A JP2001295168A JP2001295168A JP2003108926A JP 2003108926 A JP2003108926 A JP 2003108926A JP 2001295168 A JP2001295168 A JP 2001295168A JP 2001295168 A JP2001295168 A JP 2001295168A JP 2003108926 A JP2003108926 A JP 2003108926A
Authority
JP
Japan
Prior art keywords
character
reliability
weight
candidate
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001295168A
Other languages
English (en)
Other versions
JP4326173B2 (ja
Inventor
Akira Nakamura
明 中村
Hiromitsu Kawajiri
博光 川尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2001295168A priority Critical patent/JP4326173B2/ja
Publication of JP2003108926A publication Critical patent/JP2003108926A/ja
Application granted granted Critical
Publication of JP4326173B2 publication Critical patent/JP4326173B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 後処理によって、精度の高い認識文字列候補
を出力し得る文字認識装置および文字認識方法を提供す
ること 【解決手段】 認識候補文字群(類似度1位からN位)
の信頼度を算出し、かかる信頼度に応じて、文字群間の
連接確率の重みを動的に変化させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力情報を処理し
て所定の文字を認識する文字認識装置、文字認識方法、
その実行プログラムおよびそれを記憶した記録媒体に関
する。
【0002】
【従来の技術】従来の文字認識方法においては、たとえ
ば筆記入力された文字の特徴量を抽出し、これを認識辞
書中の特徴量と比較して、両者の類似度が高い(両者の
距離値が小さい)認識候補文字を出力するようにしてい
た。しかしながら、かかる一文字毎の文字認識では、認
識辞書の特徴量から離れた文字を筆記した場合に、適正
な認識結果を得ることができない。
【0003】そこで、通常は、かかる一文字毎の文字認
識に加え、前後の文字あるいは単語間・文節間の連接確
率を判定する後処理を実行し、かかる後処理結果に基づ
いて認識文字列候補を出力するようにしている。
【0004】例えば、特開2000−90201号公報
には、認識候補文字間の連接確率を判定して後処理を実
行する方法が記載されている。かかる後処理において
は、たとえば図12に示すように、「本日は晴」と手書
き入力がなされ、各手書き文字に対する認識候補文字
(類似度1位から3位)が同図に示すとおりであったと
すると、各認識文字を接続した34=81通りの文字列
に対する連接確率が算出される。例えば、各認識候補文
字の1位の文字を接続した文字列「本目は哨」について
は、「本」と「目」、「目」と「は」、「は」と「哨」
の連接確率が連接確率辞書から読み出され、これら各文
字間の連接確率の合計を当該文字列全体の連接確率の合
計値とする。そして、かかる連接確率の合計値と、当該
文字列を構成する各認識候補文字の類似度の合計値とを
合算し、これにより当該文字列の文字列評価値(整合
度)を算出する。このようにして81通りの文字列に対
する整合度が算出されると、これら整合度が比較され、
この内、整合度が最も大きな文字列が認識文字列候補と
して出力される。
【0005】
【発明が解決しようとする課題】上記従来の後処理方法
においては、文字列の連接確率の合計値と各文字の類似
度の合計値を合算する場合、連接確率の合計値に一定の
重みwを乗じた後、これを類似度の合計値に加算するよ
うにしている。すなわち、手書き入力がT個の文字から
構成されているとすると(図12の場合はT=4)、所
定の文字列の整合度Lは以下のように算出される。
【0006】L=(S1+S2+…+ST)+w・{lo
gP(1,2)+logP(2,3)+…+logP
(T−1,T)} ここで、SKは当該文字列を構成するK番目の文字の類
似度、P(K−1,K)はK−1番目の文字とK番目の
文字の連接確率である。
【0007】しかしながら、上記従来の後処理方法で
は、連接確率の項の重みwが一定であるため、類似度が
低い文字間についても類似度が高い文字間と同一の重み
が設定されることになる。その結果、上位の認識候補文
字に正解が存在している場合に、誤って下位の認識候補
文字が認識文字列候補として選択されたり、逆に、下位
に正解が含まれている場合に、当該正解を含む文字列が
認識文字列候補として選択され得ないとの問題が生じ
る。
【0008】そこで本発明は、かかる従来例の問題点を
解消し、上記従来例に比べて精度の高い認識文字列候補
を出力し得る文字認識装置および文字認識方法を提供す
ることを課題とする。
【0009】
【課題を解決するための手段】本発明は、文字認識処理
によって生成される認識結果(入力文字に対する認識候
補文字群、認識候補単語群、認識候補文節群など)の信
頼度を判定し、かかる信頼度に基づいて、後処理段階に
おける連接確率の重み付けを適宜変更するものである。
【0010】請求項1の発明は、文字認識結果に対して
後処理を施すことにより認識文字列候補を出力する文字
認識装置において、前記文字認識結果の信頼度を算出す
る信頼度算出手段と、当該信頼度算出手段によって算出
された信頼度に基づいて、連接関係にある前記認識結果
の連接確率得点の重みを設定する重み設定手段とを備
え、前記重み設定手段によって設定された重みに基づい
て候補文字列の整合度を算出し、当該整合度の高い候補
文字列を認識文字列候補として出力する、ことを特徴と
する。
【0011】請求項2の発明は、請求項1において、前
記信頼度算出手段は、認識候補文字群の上位の候補文字
に正解が含まれる確率として信頼度を算出し、前記重み
設定手段は、当該信頼度が大きい場合には重みを小さく
設定し、当該信頼度が小さい場合には重みを大きく設定
する、ことを特徴とする。
【0012】請求項3の発明は、請求項1または2にお
いて、前記信頼度算出手段は、信頼度と重みの関係を規
定する信頼度―重み変換テーブルを予め備えており、当
該変換テーブルに基づいて前記重みを設定する、ことを
特徴とする。
【0013】請求項4の発明は、請求項2または3にお
いて、前記候補文字列がT個の文字により構成され、そ
の内、K番目の文字の類似度をSK、K−1番目の文字
とK番目の文字の連接確率をP(K−1、K)、当該文
字間の連接確率の重みをw(K−1、K)とした場合、
前記整合度Lは、L=(S1+S2+…+ST)+{w
(1,2)・logP(1,2)+w(2,3)・lo
gP(2,3)+…+w(T−1,T)・logP(T
−1,T)}に従って算出される、ことを特徴とする。
【0014】請求項5の発明は、請求項4において、重
みw(K−1、K)は、K番目の入力文字に対する認識
候補文字群の信頼度に基づいて設定される、ことを特徴
とする。
【0015】請求項6の発明は、文字認識結果に対して
後処理を施すことにより認識文字列候補を出力する文字
認識方法において、前記文字認識結果の信頼度を算出す
る信頼度算出ステップと、当該信頼度算出手段によって
算出された信頼度に基づいて、連接関係にある前記認識
結果の連接確率得点の重みを設定する重み設定ステップ
と、当該重み設定ステップによって設定された重みに基
づいて候補文字列の整合度を算出する整合度算出ステッ
プと、当該整合度算出ステップによって算出された各候
補文字列の整合度を比較し、最も整合度の高い候補文字
列を認識文字列候補として出力する認識文字列候補出力
ステップと、を有することを特徴とする。
【0016】請求項7の発明は、請求項6において、前
記信頼度算出ステップは、認識候補文字群の上位の候補
文字に正解が含まれる確率として信頼度を算出し、前記
重み設定ステップは、当該信頼度が大きい場合には重み
を小さく設定し、当該信頼度が小さい場合には重みを大
きく設定する、ことを特徴とする。
【0017】請求項8の発明は、請求項6または7にお
いて、前記信頼度算出ステップは、信頼度と重みの関係
を規定する信頼度―重み変換テーブルに基づいて前記重
みを設定する、ことを特徴とする。
【0018】請求項9の発明は、請求項7または8にお
いて、前記候補文字列がT個の文字により構成され、そ
の内、K番目の文字の類似度をSK、K−1番目の文字
とK番目の文字の連接確率をP(K−1、K)、当該文
字間の連接確率の重みをw(K−1、K)とした場合、
前記整合度算出ステップは、L=(S1+S2+…+
T)+{w(1,2)・logP(1,2)+w
(2,3)・logP(2,3)+…+w(T−1,
T)・logP(T−1,T)}に従って整合度Lを算
出する、ことを特徴とする。
【0019】請求項10の発明は、請求項9において、
重みw(K−1、K)は、K番目の入力文字に対する認
識候補文字群の信頼度に基づいて設定される、ことを特
徴とする。
【0020】請求項11の発明は、請求項6ないし10
の何れかの文字認識方法の各処理ステップを実行するプ
ログラムである。
【0021】請求項12の発明は、請求項11のプログ
ラムを記憶した記録媒体である。
【0022】本発明の特徴は、以下に示す実施の形態の
説明により更に明らかとなろう。
【0023】なお、請求項における「信頼度算出手段」
は実施の形態における認識信頼度算出部300(連接特
徴抽出部4、文字間連接確率辞書5、判別得点算出部
6、認識信頼度算出部7および判別得点―信頼度変換テ
ーブル8)が対応する。請求項における「重み設定手
段」は実施の形態における文字認識後処理部400(信
頼度―重み変換テーブル12)が対応する。
【0024】また、請求項における「信頼度算出ステッ
プ」は実施の形態における図10のステップS103〜
ステップS105が対応する。請求項における「重み設
定ステップ」は実施の形態における図10のステップS
107(後処理:信頼度―重み変換テーブル12に基づ
いて重みを設定する処理)が対応する。請求項における
「整合度算出ステップ」は実施の形態における図10の
ステップS107(後処理:式(1)に従って演算を行
う処理)が対応する。請求項における「認識文字列候補
出力ステップ」は実施の形態における図10のステップ
S107(後処理:整合度が最も高い文字列を認識文字
列候として出力する処理)が対応する。
【0025】さらに、請求項における「文字認識結果」
は実施の形態における認識候補文字群が対応する。
【0026】ただし、以下の実施の形態は、あくまで
も、本発明の一つの実施形態であって、本発明ないし各
構成要件の用語の意義は、以下の実施の形態に記載され
たものに制限されるものではない。
【0027】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0028】図1は、本実施の形態に係る文字認識装置
の基本構成を示す機能ブロック図である。図において、
100は入力部で、入力文字の筆跡、形状等を検出し、
その特徴を示す情報を出力する。200は文字認識部
で、入力部1から供給された文字情報を文字認識辞書中
の特徴量と比較し、類似度が1位からN位までの文字を
認識候補文字として出力する。
【0029】300は認識信頼度算出部で、文字認識部
200から出力された各入力文字の候補文字群(類似度
1位からN位)の信頼度を算出する。ここで信頼度と
は、当該候補文字群中の上位の候補文字に正解が含まれ
る確率のことである。例えば、当該候補文字群中の1位
の候補文字が正解である確率を、当該候補文字群の信頼
度とすることもできる。
【0030】400は文字認識後処理部で、上記文字認
識部200から出力される候補文字群を組み合わせて文
字列を生成し、文字列毎に整合度を算出する。そして、
算出した整合度のうち最も大きな整合度を有する文字列
を認識文字列候補として出力する。
【0031】ここで、各文字列の整合度は、上記認識信
頼度算出部300からの信頼度に基づいて算出される。
具体的には、認識信頼度算出部300からの信頼度に応
じて、以下の式(1)における重みw(K−1,K)を
適宜変更し、当該対象文字列の整合度Lを算出する。 L=(S1+S2+…+ST)+{w(1,2)・logP(1,2)+w(2, 3)・logP(2,3)+…+w(T−1,T)・logP(T−1,T)} …(1) ここで、Skは対象文字列中のK番目の文字の類似度、
P(K−1,K)は対象文字列中のK−1番目の文字と
K番目の文字との間の連接確率、w(K−1,K)は当
該K−1番目の文字とK番目の文字との間の連接関係に
適用される重みである。
【0032】かかる重みw(K−1,K)は、例えば、
連接関係にあるK−1番目の文字群とK番目の文字群の
内、K番目の文字群の信頼度に着目して設定される。具
体的には、かかるK番目の文字群の信頼度が高ければ重
みw(K−1,K)を小さく設定し、逆に、当該K番目
の文字群の信頼度が高ければ重みw(K−1,K)は大
きく設定する。
【0033】文字群の信頼度は当該文字群の上位の文字
に正解が含まれる確率を示すものであるから、信頼度が
高い場合には類似度を強調して上位文字が選択されるよ
うにする。他方、文字群の信頼度が低い場合には、上位
よりも下位の文字中にも正解が含まれる可能性が高いの
で、類似度よりもむしろ連接確率の方を強調する。上記
重みw(K−1,K)は、かかる点を考慮して、上述の
如く、文字群の信頼度が高ければ小さく設定され、逆
に、文字群の信頼度が低ければ大きく設定されている。
【0034】図2に、入力文字「本日は晴」に対する認
識候補文字、類似度、生成文字列、連接確率、信頼度お
よび重みwの適用例を示す。なお、同図には、便宜上、
各入力文字に対する候補文字群は1位から3位までのみ
を図示している。
【0035】同図において、1文字目「本」の認識候補
文字群と2文字目「日」の認識候補文字群との間の連接
関係に対しては、如何なる文字の組み合わせであっても
一様に重みw(1,2)が適用される。同様に、2文字
目「日」の認識候補文字群と3文字目「は」の認識候補
文字群との間の連接関係、および3文字目「は」の認識
候補文字群と4文字目「晴」の認識候補文字群との間の
連接関係に対しては、それぞれw(2,3)およびw
(3,4)が適用される。また、重みw(1,2)は、
2文字目「日」の認識候補文字群の信頼度0.82に基
づいて設定される。同様に、重みw(2,3)と重みw
(3,4)は、それぞれ3文字目「は」の認識候補文字
群の信頼度0.98および4文字目「晴」の認識候補文
字群の信頼度0.60に基づいて設定される。
【0036】ここで、2文字目、3文字目、4文字目の
認識候補文字群の信頼度を比較すると、3文字目の文字
群の信頼度が最も大きく、4文字目の文字群の信頼度が
最も小さいので、上記3つの重みの内、w(2,3)が
最も小さく設定され、w(3,4)が最も大きく設定さ
れる。例えば、信頼度に対する重みの設定が、図3のよ
うになっているとすると、これら3つの重みはそれぞ
れ、w(1,2)=0.34、w(2,3)=0.3
0、w(3,4)=0.45に設定される。
【0037】しかして、各文字群の信頼度に応じて重み
をこのよう変更して設定すれば、重みを一律とした場合
に比べ、信頼度が高い文字群では上位の候補文字が認識
文字列候補に含まれやすくなり、信頼度が低い文字群で
は下位の候補文字であっても認識文字列候補に含まれや
すくなる。
【0038】ここで、信頼度に対する重みの設定は、た
とえば以下の手順に従って行われる。
【0039】まず、学習サンプル(文書形式で書かれた
手書き文字データ)に対して文字認識を行う。次に各認
識候補文字群に対して信頼度を求める。さらに、求めら
れた信頼度の値に基づいて認識候補文字群をN個のグル
ープに分ける。
【0040】しかる後、グループ毎に重みを設定するの
であるが、文字間の連接確率を用いて後処理を行うた
め、一つのグループ中に属する認識候補文字群だけを用
いて後処理を実行することはできない。従って、一のグ
ループに対する重みを設定する場合には、当該グループ
以外のグループの重みを何らかの重みに設定しておく必
要がある。
【0041】そこで、例えば従来例で示した特開200
0−90201号公報に記載の方法に従って、学習サン
プル全体で最適な重みw0を予め求めておき、一つのグ
ループに対する重みを設定する場合には、当該グループ
以外のグループには、かかる全体の重みw0を設定す
る。そして、設定対象のグループに対する重みを変更し
ながら、学習サンプルに対して最も高い正解率が得られ
た重みを当該グループの重みとして設定する。同様に、
次のグループの重みを設定する場合には、それ以外のグ
ループの重みをw0に設定して、当該グループに最適な
重みを設定するようにする。
【0042】次に、本実施の形態に係る上記基本構成を
具体化した実施例について以下に説明する。なお、上記
基本構成を具体化する実施例は、以下の実施例に限られ
ず、他に種々の変更が可能である。特に、信頼度の算出
方法は以下の実施例以外のものも適用可能である。
【0043】まず、図4に実施例に係る手書き文字認識
装置のブロック図を示す。
【0044】図において、1は入力部で、タブレット等
に手書き入力された筆跡から筆跡文字情報を生成し出力
する。2は文字認識部で、入力部1から供給された筆跡
文字情報を文字認識辞書3の文字特徴量と比較し、両者
の類似度が1位からN位までの認識辞書中の文字を当該
筆跡文字の認識候補文字として出力する。3は文字認識
辞書で、候補文字がその文字特徴量とともに記憶されて
いる。
【0045】4は連接特徴抽出部で、文字認識部2から
供給される認識候補文字列の内、正誤判定対象である一
の認識候補文字の連接特徴量を、文字間連接確率辞書5
を参照しながら抽出する。5は文字間連接辞書で、所定
の2つの文字が連接する確率を当該2つの文字に対応づ
けて記憶している。
【0046】6は判別得点算出部で、連接特徴抽出部4
からの連接特徴量を処理して、当該判定対象の認識候補
文字群の正誤判別得点を算出する。
【0047】7は認識信頼度算出部で、判別得点算出部
6からの判別得点と、判別得点−信頼度変換テーブル8
とを比較して、当該判定対象の認識候補文字群の信頼度
を出力する。8は判別得点−信頼度変換テーブルで、判
別得点と信頼度の関係をテーブルとして記憶するもので
ある。
【0048】9は認識候補数制御部で、認識信頼度7か
らの信頼度と、信頼度−累積正読率テーブル10とを比
較して、当該判定対象文字の認識候補数を制限するもの
である。10は信頼度−累積正読率テーブルで、信頼度
と正読率の関係をテーブルとして記憶するものである。
【0049】11は後処理部で、認識候補数制御部9に
よって設定された個数の認識候補文字を対象として後処
理を行う。例えば、筆記入力文字の内、1番目の文字に
対する認識候補数がM1個、以下、2番目ないし7番目
の筆記文字に対する認識候補数がM2ないしM7個と設
定されたとすると、文字認識部2で生成されたこれら各
文字の認識候補文字の内、それぞれ類似度が上位M1、
M2、M3、M4、M5、M6、M7個の認識候補文字
のみを対象として、後処理部11にて、後処理が行われ
る。かかる後処理部11は、上記基本構成の説明にて示
した如く、これら上位M1、M2、M3、M4、M5、
M6、M7個の認識候補文字を組み合わせて文字列を生
成し、上記式(1)に従って、各生成文字列の整合度を
算出する。そして、整合度が最も高い文字列を認識文字
列候補として出力する。
【0050】12は信頼度―重み変換テーブルで、例え
ば、上記基本構成で示した図3のような変換テーブルを
記憶している。
【0051】次に、上記ブロック図に示された各部の処
理の詳細について説明する。まず、図5を参照して、連
接特徴抽出部4の処理について説明する。
【0052】かかる連接特徴抽出部4では、判定対象の
認識候補文字群とその直前の第1位候補文字との間の連
接確率Pbkと、その直後の第1位候補文字との間の連
接確率Pfkの何れか一方または両方を文字間連接確率
辞書5から読み出し、当該認識候補文字群の連接特徴量
とする。例えば、連接確率PbkとPfkの両方を用い
て連接特徴量を抽出する場合には、図5に示すように、
判定対象文字の認識候補文字群(類似度1位からN位ま
で)である「目」、「日」、…、「田」と、その直前の
認識候補文字群の類似度1位文字「本」との間の連接確
率Pb1、Pb2、…、PbNと、その直後の類似度1
位文字「は」との間の連接確率Pf1、Pf2、…、P
fNをそれぞれ文字間連接確率辞書5から読み出し、こ
れら連接確率の値を、当該判定対象の認識候補文字群の
連接特徴量とする。
【0053】なお、上記では、認識候補文字群の連接特
徴量をPbkとPfkの両方にて抽出するようにした
が、PbkまたはPfkの何れか一方にて抽出するよう
にしても良い。また、PbkとPfkの両方にて抽出す
る場合において、直前の第1位認識候補文字が存在しな
い場合(例えば、判定対象文字が文字列の先頭であるよ
うな場合)には、当該候補文字の直後文字に対する連接
確率Pfkをそのまま直前文字に対する連接確率Pbk
に代用して連接特徴量を抽出する。同様に、直後の第1
位認識候補文字が存在しない場合(例えば、判定対象文
字が文字列の末尾であるような場合)には、Pbkをそ
のまま代用する。
【0054】次に、図6を参照して、判別得点算出部6
における処理について説明する。上記連接特徴抽出部4
にて抽出したPbkとPfkの値は、2N次元のベクト
ル空間において所定のベクトル(連接特徴ベクトル)と
して表現できる。判別得点算出部6では、予め第1位の
認識候補文字が正読(正解)または誤読(誤り)である
サンプルについて連接特徴ベクトルを学習データとして
抽出しておき、これと判定対象の認識候補文字群の連接
特徴ベクトルとを比較して、当該認識候補文字群の判別
得点を算出する。
【0055】たとえば、正読と誤読の連接特徴ベクトル
の学習データと判定対象の認識候補文字群の連接特徴ベ
クトルが図6に示すような状態にあるとする。判別得点
算出部6は、正読、誤読のそれぞれの集合(クラス)の
特徴ベクトルの分布から、予め、両クラスの特徴ベクト
ルの平均値(重心ベクトル)および共分散行列を求め、
これを記憶している。そして、これら各クラスの重心と
判定対象文字群の連接特徴ベクトルとの間のマハラノビ
ス距離DMc、DMeを求め、これらの値の比、比の対
数または差を判別得点とする。
【0056】ここで、上記マハラノビス距離DMは次の
ようにして算出される。すなわち、クラスC1の重心ベ
クトルをm1、クラスC1の共分散行列をΣ1とする
と、所定の特徴ベクトルxからm1へのマハラノビス2
乗距離DM1は、次式で定義される。
【0057】DM1=(x−m1)tΣ1 -1(x−m1)
(t:転置、−1:逆行列) ここで、共分散行列Σ1はn×nの正方行列であり
(n:特徴空間の次元数)、その(i,j)要素はi番
目の特徴量とj番目の特徴量の共分散、すなわちΣ
1(i,j)=σijである。
【0058】なお、上記では、判別得点をマハラノビス
距離DMを用いて算出したが、これに替えて、正読、誤
読の各クラスの特徴ベクトルの分布から線形判別分析に
より線形判別関数を求めておき、判定対象の認識候補文
字群の特徴ベクトルに対してこの線形判別関数を当ては
めて判別得点を求めるようにしても良い。また、正読、
誤読の学習サンプルから抽出した特徴ベクトルを学習デ
ータとして、対象の特徴ベクトルが正読か誤読かを判定
できるように学習させたニューラルネットを用い、判定
対象の特徴ベクトルに対する当該ニューラルネットの出
力値を判別得点とするようにしてもよい。
【0059】次に、図7を参照して認識信頼度算出部7
の処理について説明する。たとえば、上記判別得点の算
出において、マハラノビス距離DMc、DMeの距離の
比または比の対数を判別得点とした場合、正読および誤
読の各学習サンプルから得られる判別得点と信頼度の関
係は図7に示すようになる。ここで、信頼度は、学習サ
ンプルからベイズの定理によって算出される。
【0060】すなわち、判別得点yを有する正読サンプ
ル個数の全正読サンプル個数に対する比率をp(y|X
1=C)、判別得点yを有する誤読サンプル個数の全誤
読サンプル個数に対する比率をp(y|X1=E)、全
サンプル数に対する正読サンプル数の総数の比率をP
(X1=C)、全サンプル数に対する誤読サンプル数の
総数の比率をP(X1=E)とすると、判別得点yを有
する認識候補文字群の類似度1位の認識候補文字の信頼
度は、次式によって算出できる。
【0061】P(X1=C|y)=p(y|X1=C)
・P(X1=C)/[p(y|X1=C)・P(X1=
C)+p(y|X1=E)・P(X1=E)] ここで、X1は1位の認識候補文字を表し、X1=C、
X1=Eはそれぞれ、1位認識候補文字が正解、不正解
である事象を意味する。
【0062】かかる式から判別得点と信頼度の関係を示
す判別得点―信頼度変換テーブルを予め作成しておき、
これを判別得点―信頼度変換テーブル8に記憶させてお
く。認識信頼度算出部7は判別得点算出部6からの判別
得点と、当該判別得点―信頼度変換テーブル8の得点を
比較し、該当する信頼度を、当該認識候補文字群の第1
位の認識候補文字の信頼度として出力する。
【0063】次に、図8を参照して、認識候補数制御部
9の処理について説明する。図8の上部に示す表は、判
定対象の類似度1位の認識候補文字に対する信頼度と、
当該判定対象のN位までの認識候補文字の中に正読の文
字が含まれる累積確率との関係を示すものである。かか
る表中の確率は、上記正読、誤読の学習サンプルを基に
予め算出しておく。
【0064】信頼度―累積正読率テーブル10には、か
かる表を記憶させておく。そして、認識候補数制御部9
は、判定対象の認識候補文字群の信頼度と当該テーブル
中の信頼度レベルとを比較し、該当する信頼度レベルの
累積確率を参照しながら何位までの認識候補文字を後処
理部11に出力するかを決定する。ここで、何位までを
出力するかは、例えば、該当する信頼度レベルの累積確
率が所定のしきい値に達したか否かで決定する。この
際、設定されるしきい値は、全ての信頼度レベルに対し
て一律としても良いし、あるいは、信頼度レベル毎に個
別に設定するようにしても良い。
【0065】あるいは、図8の上部の表を基に、信頼度
レベル毎の出力候補数を予め設定し、これを信頼度−累
積正読率テーブル10に記憶させておいても良い。図8
の下部に示す表は、信頼度レベルと出力候補数とを予め
設定した場合の一例である。信頼度―累積正読率テーブ
ル10に予めかかる表を記憶させた場合には、認識候補
数制御部9は、該当する出力候補数を表から読み出し、
それに従って、後処理部11に出力される認識候補文字
を制限する。これにより、無駄な後処理を排除し、処理
の迅速化、効率化を図ることができる。
【0066】以上のようにして後処理の対象とされるべ
き各認識候補文字群の数が制限されると、後処理部11
は、対象とされる範囲の認識候補文字を組み合わせて後
処理対象の文字列を生成する。そして、各文字列中の文
字間の連接確率を文字間連接確率辞書5から読み出すと
共に、候補文字群の信頼度に基づいて当該候補文字群の
重みを信頼度―重み変換テーブル12から読み出す。そ
して、かかる連接確率と重みに基づいて、上記式(1)
の連接確率の項の得点を算出する。さらに、対象文字列
を構成する各文字の類似度を加算して、上記式(1)の
類似度の項の得点を算出する。そして、これら両得点を
合算して、対象文字列の整合度を算出する。かかる整合
度を全ての生成文字列について算出し、これら整合度を
順番に比較する。そして、最も整合度の高い生成文字列
を認識文字列候補として出力する。
【0067】以上が上記基本構成をより具体化した実施
例であるが、これ以外にも種々の実施例を構成し得る。
たとえば、上記実施例では、図5に示すとおり、判定対
象文字と直前および直後の1位文字との間の連接確率
(Pbk、Pfk)を当該判定対象文字の連接確率とし
たが、これに替えて、判定対象の認識候補文字と直前の
1位からM位までの文字との間の連接確率の最大値を直
前文字との連接確率とし、同様に、判定対象の認識候補
文字と直後の1位からM位までの文字との間の連接確率
の最大値を直後文字との連接確率とすることも可能であ
る。
【0068】たとえば図9において、判定対象文字
「日」と直前文字群との間の連接確率として、当該
「日」と直前の1位文字「朋」からM位文字「胡」まで
のそれぞれの連接確率P(C1|Cbk)の内、最大の
連接確率を採用する。また、判定対象文字「日」と直後
文字群との間の連接確率として、当該「日」と直後の1
位文字「も」からM位文字「亡」までのそれぞれの連接
確率P(Cfk|C1)の内、最大の連接確率を採用す
る。同様に、判定対象の認識候補文字の2位文字「月」
以下の文字についても、直前、直後の文字群に対する連
接確率の最大値を連接確率としてそれぞれ採用する。
【0069】ここで、C1は判定対象の認識候補1位の
文字を表し、Cbk、Cfkはそれぞれ、直前、直後の
認識候補k位の文字を表す。そして、P(Cj|Ci)
は、文字Ciに続いて文字Cjが現れる連接確率を表
す。
【0070】ところで、上記実施例では、図4における
ブロック毎に処理を分けて一連の処理フローを説明した
が、かかる処理フローを制御プログラムとして格納して
おけば、単一の演算処理部によって、上記と同様の処理
フローを実行させることもできる。かかる場合、文字認
識辞書3、文字間連接確率辞書5、判別得点―信頼度変
換テーブル8、信頼度―累積正読率テーブル10および
信頼度−重み変換テーブル12の参照データも同様に、
ROMまたはRAMに予め記憶しておく必要がある。
【0071】図10は、上記実施例にかかる処理手順を
示すフローチャートである。ここで、ステップS101
は上記入力部1における処理、ステップS102は上記
文字認識部2における処理、ステップS103は上記連
接特徴抽出部4における処理、ステップS104は上記
判別得点算出部6における処理、ステップS105は上
記認識信頼度算出部7における処理、ステップS106
は上記認識候補数制御部9における処理、ステップS1
07は上記後処理部11における処理である。
【0072】かかる制御プログラムおよび各種参照デー
タは、フロッピー(登録商標)ディスク等の記録媒体を
介して文字認識装置内のRAMに格納させることもでき
るし、または、インターネット等の伝送媒体を介して当
該RAMに格納させることもできる。格納されるべきデ
ータのファイル構造の一例を図11に示す。
【0073】ただし、上記処理フローの内、一部の処理
フローのみを取り込みたい場合には、図10に示す全て
のステップに関するデータを文字認識装置内に格納する
必要はない。たとえば、信頼度算出の処理のみを取り込
んで実行させたい場合には、図10の内、ステップS1
03ないしS105の実行プログラムおよびそれに必要
な文字間連接確率辞書データ、判別得点―信頼度変換テ
ーブルデータのみを格納すれば良い。また、信頼度の算
出から後処理までの処理を実行させたい場合には、ステ
ップS103ないしS107の実行プログラムおよびそ
れに必要な参照データのみを格納すれば良い。記録媒体
または伝送媒体を介してインストールする場合には、こ
れらの制御プログラムと参照データをファイルとして記
録媒体に格納し、または、伝送媒体を介して伝送するよ
うにする。
【0074】以上、本発明に係る実施の形態について説
明したが、本発明は係る実施の形態に制限されるもので
はなく、他に種々の変更が可能である。たとえば、上記
実施例では手書き文字認識装置に対して本発明を適用し
た例を示したが、本発明は、それ以外に、光学式文字認
識装置あるいは音声入力による認識装置等にも広く適用
し得るものである。
【0075】また、上記実施例では、文字群の信頼度判
定方法として、直前の文字群と直後の文字群との間の連
接関係に基づく信頼度判定方法を示したが、これ以外の
信頼度判定方法を採用することも可能である。
【0076】さらに、上記実施例では、後処理の手法と
して、文字間の連接確率に基づく後処理の方法を示した
が、これ以外に、たとえば、単語間、文節間の連接関係
に基づく後処理方法を採用することも可能である。かか
る場合、信頼度の算出は、単語群または文節群について
行われることになる。
【0077】また、上記実施例では、連接関係にある前
後の文字群の内、後方の文字群の信頼度に基づいて当該
文字群間の連接関係の重みを設定したが、これ以外に、
前方の文字群の信頼度に基づいて重みを設定するように
してもよいし、両方の文字群の信頼度に基づいて重みを
設定するようにしてもよい。
【0078】さらに、信頼度と重みの関係を示す図3の
テーブルは単なる一例であって、信頼度の区分は0.1
ずつでなくとも良く、さらに細かく信頼度を区分し、そ
れに応じた重みを設定するようにしてもよい。
【0079】その他、ステップS104における判別得
点の算出方法や、ステップS105における認識信頼度
の算出方法も、上記実施の形態にて示したマハラノビス
距離DMを用いる方法や、ベイズの定理を用いる方法以
外の方法を採用することもできる。
【0080】本発明の実施形態は、本発明の技術的思想
の範囲内において、適宜、様々な変更が可能である。
【0081】
【発明の効果】以上、本発明によれば、文字認識結果の
信頼度に応じて後処理における連接確率の重み付けを個
別に設定するものであるから、当該重みを一律に設定す
る場合に比べ、正解文字列に近い文字列の整合度と正解
文字列から遠い文字列の整合度との間の区別をより明確
にすることができ、もって、後処理後の認識文字列候補
中に正解文字が含まれる確率を向上させることができ
る。
【図面の簡単な説明】
【図1】 実施の形態に係る基本構成の機能ブロック図
【図2】 当該基本構成の機能を説明するための図
【図3】 当該基本構成の機能を説明するための図
【図4】 基本構成を具体化した一実施例の機能ブロッ
ク図
【図5】 実施例の処理を説明するための図
【図6】 実施例の処理を説明するための図
【図7】 実施例の処理を説明するための図
【図8】 実施例の処理を説明するための図
【図9】 実施例の処理を説明するための図
【図10】 実施例の処理を実行するためのフローチャ
ート
【図11】 当該実行プログラムと参照データのファイ
ル構造を示す図
【図12】 従来例の機能を説明するための図
【符号の説明】
100 入力部 200 文字認識部 300 認識信頼度算出部 400 文字認識後処理部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文字認識結果に対して後処理を施すこと
    により認識文字列候補を出力する文字認識装置におい
    て、 前記文字認識結果の信頼度を算出する信頼度算出手段
    と、 当該信頼度算出手段によって算出された信頼度に基づい
    て、連接関係にある前記認識結果の連接確率得点の重み
    を設定する重み設定手段と、 を備え、 前記重み設定手段によって設定された重みに基づいて候
    補文字列の整合度を算出し、当該整合度の高い候補文字
    列を認識文字列候補として出力する、 ことを特徴とする文字認識装置。
  2. 【請求項2】 請求項1において、前記信頼度算出手段
    は、認識候補文字群の上位の候補文字に正解が含まれる
    確率として信頼度を算出し、 前記重み設定手段は、当該信頼度が大きい場合には重み
    を小さく設定し、当該信頼度が小さい場合には重みを大
    きく設定する、 ことを特徴とする文字認識装置。
  3. 【請求項3】 請求項1または2において、前記信頼度
    算出手段は、信頼度と重みの関係を規定する信頼度―重
    み変換テーブルを予め備えており、当該変換テーブルに
    基づいて前記重みを設定する、 ことを特徴とする文字認識装置。
  4. 【請求項4】 請求項2または3において、前記候補文
    字列がT個の文字により構成され、その内、K番目の文
    字の類似度をSK、K−1番目の文字とK番目の文字の
    連接確率をP(K−1、K)、当該文字間の連接確率の
    重みをw(K−1、K)とした場合、前記整合度Lは、 L=(S1+S2+…+ST)+{w(1,2)・log
    P(1,2)+w(2,3)・logP(2,3)+…
    +w(T−1,T)・logP(T−1,T)} に従って算出される、ことを特徴とする文字認識装置。
  5. 【請求項5】 請求項4において、重みw(K−1、
    K)は、K番目の入力文字に対する認識候補文字群の信
    頼度に基づいて設定される、 ことを特徴とする文字認識装置。
  6. 【請求項6】 文字認識結果に対して後処理を施すこと
    により認識文字列候補を出力する文字認識方法におい
    て、 前記文字認識結果の信頼度を算出する信頼度算出ステッ
    プと、 当該信頼度算出手段によって算出された信頼度に基づい
    て、連接関係にある前記認識結果の連接確率得点の重み
    を設定する重み設定ステップと、 当該重み設定ステップによって設定された重みに基づい
    て候補文字列の整合度を算出する整合度算出ステップ
    と、 当該整合度算出ステップによって算出された各候補文字
    列の整合度を比較し、最も整合度の高い候補文字列を認
    識文字列候補として出力する認識文字列候補出力ステッ
    プと、 を有することを特徴とする文字認識方法。
  7. 【請求項7】 請求項6において、前記信頼度算出ステ
    ップは、認識候補文字群の上位の候補文字に正解が含ま
    れる確率として信頼度を算出し、 前記重み設定ステップは、当該信頼度が大きい場合には
    重みを小さく設定し、当該信頼度が小さい場合には重み
    を大きく設定する、 ことを特徴とする文字認識方法。
  8. 【請求項8】 請求項6または7において、前記信頼度
    算出ステップは、信頼度と重みの関係を規定する信頼度
    ―重み変換テーブルに基づいて前記重みを設定する、 ことを特徴とする文字認識方法。
  9. 【請求項9】 請求項7または8において、前記候補文
    字列がT個の文字により構成され、その内、K番目の文
    字の類似度をSK、K−1番目の文字とK番目の文字の
    連接確率をP(K−1、K)、当該文字間の連接確率の
    重みをw(K−1、K)とした場合、前記整合度算出ス
    テップは、 L=(S1+S2+…+ST)+{w(1,2)・log
    P(1,2)+w(2,3)・logP(2,3)+…
    +w(T−1,T)・logP(T−1,T)} に従って整合度Lを算出する、ことを特徴とする文字認
    識方法。
  10. 【請求項10】 請求項9において、重みw(K−1、
    K)は、K番目の入力文字に対する認識候補文字群の信
    頼度に基づいて設定される、 ことを特徴とする文字認識方法。
  11. 【請求項11】 請求項6ないし10の何れかの文字認
    識方法の各処理ステップを実行するプログラム。
  12. 【請求項12】 請求項11のプログラムを記憶した記
    録媒体。
JP2001295168A 2001-09-26 2001-09-26 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 Expired - Fee Related JP4326173B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001295168A JP4326173B2 (ja) 2001-09-26 2001-09-26 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001295168A JP4326173B2 (ja) 2001-09-26 2001-09-26 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体

Publications (2)

Publication Number Publication Date
JP2003108926A true JP2003108926A (ja) 2003-04-11
JP4326173B2 JP4326173B2 (ja) 2009-09-02

Family

ID=19116646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001295168A Expired - Fee Related JP4326173B2 (ja) 2001-09-26 2001-09-26 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体

Country Status (1)

Country Link
JP (1) JP4326173B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026288A (ja) * 2007-07-23 2009-02-05 Sharp Corp 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009026288A (ja) * 2007-07-23 2009-02-05 Sharp Corp 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
JP4533920B2 (ja) * 2007-07-23 2010-09-01 シャープ株式会社 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US8208765B2 (en) 2007-07-23 2012-06-26 Sharp Kabushiki Kaisha Search and retrieval of documents indexed by optical character recognition

Also Published As

Publication number Publication date
JP4326173B2 (ja) 2009-09-02

Similar Documents

Publication Publication Date Title
CN108711422B (zh) 语音识别方法、装置、计算机可读存储介质和计算机设备
CN109032375B (zh) 候选文本排序方法、装置、设备及存储介质
US6513005B1 (en) Method for correcting error characters in results of speech recognition and speech recognition system using the same
EP2486470B1 (en) System and method for inputting text into electronic devices
Shannon Optimizing expected word error rate via sampling for speech recognition
US20060136205A1 (en) Method of refining statistical pattern recognition models and statistical pattern recognizers
JP6831343B2 (ja) 学習装置、学習方法及び学習プログラム
CN111145718A (zh) 一种基于自注意力机制的中文普通话字音转换方法
CN112287680B (zh) 一种问诊信息的实体抽取方法、装置、设备及存储介质
CN112232055B (zh) 一种基于拼音相似度与语言模型的文本检测与纠正方法
JP2005505866A (ja) 文字認識
CN116432655B (zh) 基于语用知识学习的少样本命名实体识别方法和装置
CN1391211A (zh) 对识别系统中的参数进行训练的方法和系统
Toselli et al. Two methods to improve confidence scores for lexicon-free word spotting in handwritten text
CN111859967A (zh) 实体识别方法、装置,电子设备
CN111506726A (zh) 基于词性编码的短文本聚类方法、装置及计算机设备
CN113191133B (zh) 一种基于Doc2Vec的音频文本对齐方法及系统
US20050197838A1 (en) Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously
CN114020887A (zh) 用于确定响应语句的方法、设备、装置和介质
Aradilla Acoustic models for posterior features in speech recognition
CN115455142A (zh) 文本检索方法、计算机设备和存储介质
CN112651590B (zh) 一种指令处理流程推荐的方法
CN114579763A (zh) 一种针对中文文本分类任务的字符级对抗样本生成方法
CN110909546B (zh) 一种文本数据的处理方法、装置、设备及介质
JP2003108926A (ja) 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051208

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090609

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120619

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4326173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120619

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120619

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120619

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120619

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130619

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees