JP3374762B2 - 文字認識方法及びその装置 - Google Patents

文字認識方法及びその装置

Info

Publication number
JP3374762B2
JP3374762B2 JP25987998A JP25987998A JP3374762B2 JP 3374762 B2 JP3374762 B2 JP 3374762B2 JP 25987998 A JP25987998 A JP 25987998A JP 25987998 A JP25987998 A JP 25987998A JP 3374762 B2 JP3374762 B2 JP 3374762B2
Authority
JP
Japan
Prior art keywords
character
recognition
similarity
reliability
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP25987998A
Other languages
English (en)
Other versions
JP2000090203A (ja
Inventor
堅司 近藤
敏行 香田
強司 目片
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP25987998A priority Critical patent/JP3374762B2/ja
Publication of JP2000090203A publication Critical patent/JP2000090203A/ja
Application granted granted Critical
Publication of JP3374762B2 publication Critical patent/JP3374762B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字画像から抽出
した特徴量を他の文字の特徴量と比較することにより文
字認識結果の信頼度を計算する方法及びそれを用いて、
誤認識の可能性のある文字を訂正する誤認識訂正方法に
関する。
【0002】
【従来の技術】文字認識処理は、通常、文字単位で切り
出された文字画像から特徴量を抽出し、予め学習により
カテゴリ間の境界が形成された特徴量空間内での位置に
よって、文字画像のカテゴリを決定する。
【0003】例えば、統計的手法を用いた手書き文字認
識の場合は、予め、各文字カテゴリ毎に、多数の筆記者
によって記入された文字画像を用意し、その文字画像か
ら抽出された特徴量が、全体として最もうまくカテゴリ
間が分離できるようにカテゴリ間境界が形成される。
【0004】このようにして形成されたカテゴリ境界付
近では、しばしば次のような誤認識を生じる。
【0005】異なる筆記者間の手書き文字の変動は非常
に大きいため、学習データにおいて、ある筆記者Aの書
いたあるカテゴリ1の文字は、別の筆記者Bの書いた別
のカテゴリ2の文字と非常に類似している場合がある。
【0006】当然、特徴量空間内においても、カテゴリ
1とカテゴリ2の境界付近では2つのカテゴリの特徴量
が混在する。
【0007】このような場合、学習時には多数の筆記者
に記入された文字全体で最適になるようカテゴリ間境界
が形成される。つまり、局所的な境界全てにおいて、カ
テゴリを分離できるとは限らないということである。
【0008】よって、認識時にはカテゴリ1,2の境界
付近で誤認識が起こる。このような問題に関して、特開
平8-50635号公報、特開平10-63785号公報では、筆記の
個人性を用いて、カテゴリ間境界付近の誤認識を検出・
修正する試みがなされている。
【0009】特開平8-50635号公報に記載の方法は、誤
読文字の字形と正読文字の字形とを比較したとき、誤読
文字には何らかの不自然さが存在するという考え方に基
づいている。
【0010】同一筆記者による手書き文字においては、
「同じカテゴリに属する文字は同じような字形であ
る」、「異なるカテゴリにも字形の間には相関が存在す
る」という2つの特性があるとし、認識処理で用いられ
る特徴量ベクトルを用いて字形ベクトルを算出し、着目
文字の字形ベクトルと他の文字の字形ベクトルとの比較
より上記2つの特性を反映した着目文字の「不自然さ」
を求め、誤読の検出に用いる。
【0011】具体的には、着目する文字と同じカテゴリ
に認識された文字との関係を用いて不自然さを算出する
カテゴリ内検出と、着目する文字と異なるカテゴリに認
識された文字との関係を用いて不自然さを算出するカテ
ゴリ間検出とがある。
【0012】この特許公開公報の実施例では、カテゴリ
内検出については、(数1)のような不自然さQWを定
義している。
【0013】
【数1】
【0014】また、カテゴリ間検出について、(数2)
のような不自然さQBを定義している。
【0015】
【数2】
【0016】また、特開平10-63785号公報の方法は、
「同一筆者でも同一文字カテゴリに複数の字形を筆記す
る」という調査結果に基づいている。
【0017】まず、文字認識結果のカテゴリ毎に、認識
処理で用いられる特徴量ベクトルのクラスタリングを行
う。そして要素数の少ないクラスタを誤読文字からなる
クラスタと見なして抽出する。その誤読クラスタと最も
距離の近いクラスタを見つけ、それらのクラスタ間の距
離が閾値以下の場合に、要素数の少ないクラスタ内の要
素の文字カテゴリを統合相手クラスタの属する文字カテ
ゴリへと修正する。
【0018】
【発明が解決しようとする課題】しかし、特開平8-5063
5号公報に記載の方法では、不自然さQWがうまく働くた
めには、カテゴリaに認識された文字において、誤認識
文字数に対して正解文字数が十分大きくなくてはならな
い。また、QBを求めるためには、あらかじめ筆記者毎
の全文字カテゴリを備えた、膨大な文字データを必要と
する。
【0019】また、特開平10-63785号公報に記載の方法
は、「認識対象の文書画像内に、カテゴリ毎に文字数が
十分な数だけ存在する」ということが必要条件である。
つまり、振込伝票のような、口座、金額欄合わせて20
桁程度のものに対しては、全て同一人による手書き筆記
であったとしても、カテゴリ当たり十分な数が存在する
とは限らないため、この方法が有効であるとは言えな
い。
【0020】また、これら2つの他にも、前もって筆記
者毎に文字サンプルを収集して、これに基づいて認識辞
書を作成するという方法を採ったり、入力文字の特徴を
抽出する際に、筆記者に合わせた補正をするものもある
が、筆記者毎にサンプルを収集するのは大変な手間を必
要とするし、筆記者の筆記特性も月日と共に少しずつ変
化していくことが考えられるので、実用的ではない。
【0021】本発明は、予め筆記者毎のサンプル収集を
必要とすること無しに、手書き表記の振り込み伝票のよ
うな桁数の少ないものに対しても、文書画像内の筆記特
性を有効に利用した、信頼度計算方法および誤認識訂正
方法を提供することを目的とする。
【0022】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、以下の構成を採る。
【0023】請求項1記載の発明は、複数の文字画像を
含む文書画像内の前記文字画像を入力とし、認識対象の
全カテゴリのうち少なくとも1つ以上のカテゴリを認識
結果として出力する文字認識を行うステップと、前記文
字画像の形状を数値化した字形特徴量を抽出するステッ
プと、任意の文字に対して、前記文字の字形特徴量と他
の文字の字形特徴量間の類似度合と、前記文字の認識結
果と他の文字の認識結果が同一であるか異なっているか
ということにより、前記文字の認識結果の信頼性を表す
信頼度を算出するステップとを有する。
【0024】請求項7記載の発明は、任意の文字に対し
て、前記文字と他の文字の関係が、前記類似度合が類似
であり、かつ、認識結果が互いに異なる文字の個数と、
前記類似度合が非類似であり、かつ、認識結果が互いに
等しい文字の個数と、前記類似度合がが類似であり、か
つ、認識結果が互いに等しい文字の個数とを求め、前記
個数をもとに信頼度を算出する。
【0025】請求項8記載の発明は、任意の文字に対し
て、前記文字と他の文字との認識結果が同一の場合、前
記文字の字形特徴量と他の文字の字形特徴量間の類似度
に応じた信頼度S1を与え、前記文字と他の文字との認
識結果が異なる場合、前記文字の字形特徴量と他の文字
の字形特徴量間の類似度に応じた信頼度S2を与える。
【0026】請求項13記載の発明は、信頼度があらか
じめ定めた閾値よりも小さい文字に対しては認識結果
を、認識結果とは異なるカテゴリである修正カテゴリに
置換して、複数文字の信頼度を再計算し、前記再計算さ
れた信頼度がもとの信頼度よりも大きくなる場合に、認
識結果を前記修正カテゴリに決定する。
【0027】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0028】(実施の形態1)図1は、本発明の実施の
形態1に関わる文字認識装置の構成図である。
【0029】図1において、画像入力部1,前処理部
2,文字画像記憶部3,特徴抽出部4,認識部5,同一
字体ブロック抽出部6,字形特徴抽出部7,類似度計算
部8,類似判定部9,類似情報記憶部10,誤認識検出
部11とで、文字認識装置を構成する。
【0030】次にこのような文字認識装置の動作につい
て詳細に説明する。この文字認識装置は、あらかじめ多
数の学習データである文字画像から特徴抽出部4におい
て特徴量を抽出し、それらの特徴量から認識部5におけ
る、特徴量とカテゴリの対応付け(学習)を行ってお
く。
【0031】認識時においては、複数の文字が印字、ま
たは、手書き表記された文書画像を、画像入力部1によ
り入力する。入力された文書の例(振込伝票)を図2に
示す。前処理部2においては、ノイズ除去、枠線除去の
後、認識対象の複数の文字を1文字単位の画像に切り出
し、切り出された文字画像は文字画像記憶部3に蓄えら
れる。
【0032】特徴抽出部4では、文字画像から認識時に
用いる特徴量を抽出する。認識部5では、その特徴量を
用いて認識を行い、少なくとも1つ以上(本実施の形態
ではN=1)の認識候補カテゴリを出力する。
【0033】同一字体ブロック抽出部6では、文字画像
から得られる簡単な情報(本実施の形態では、文字幅、
文字高さ)により、入力された文字画像を、字体が同一
である文字のグループ(同一字体ブロック)に分類す
る。入力文字画像に対して、同一字体ブロックが求めら
れた結果の例を図3に示す。ここでいう文字の字体と
は、活字であるか手書き文字であるかということと、活
字であれば活字の字体の区別を含むものである。同一字
体ブロックに分類することの理由は、その後の誤認識検
出時に、文字の類似度合と認識カテゴリの関係により誤
認識の可能性がある文字を検出するわけであるが、手書
き文字と活字文字の場合、または、活字文字であっても
字体が異なる場合は、同一カテゴリの文字であっても文
字は類似していないため、これらの文字が混在した状態
で処理を行うと、その後の処理がうまく行かないためで
ある。本実施の形態では、活字文字であるならば文字
幅、高さはほぼ一定であると仮定し、文字幅、高さの分
散が予め定められた閾値以下の場合に活字であると決定
している。この時、手書き文字に関しては、1つの文書
内に書かれる手書き文字は、すべて同一の筆記者によっ
て記入されることを前提条件としている。
【0034】同一字体ブロック抽出部6で同一字体ブロ
ックであると判断されたブロック毎に、ブロックに含ま
れる全ての文字に対して、字形特徴抽出部7で字形特徴
量が抽出される。
【0035】類似度計算部8では、同一字体ブロック内
の全ての文字の組み合わせに対して、字形特徴量同士の
類似度を計算する。例えば、同一字体ブロックにM個の
文字が含まれているとすると、M文字の全ての組み合わ
せであるM・(M−1)/2個の類似度を計算する。本
実施の形態では、類似度に(数3)のような類似度を採
用する。
【0036】
【数3】
【0037】次に類似判定部9では、類似度計算部8で
求めた類似度が予め定めた閾値T1より大きければ”類
似”と判定し、予め定めた閾値T2より小さければ”非
類似”と判定する処理を行い、その結果を類似情報記憶
部10に蓄える。
【0038】また、誤認識検出部11では、同一字体で
あると判断された文字のグループ内の各文字に対して、 A.類似と判断され、認識結果の文字カテゴリが同一で
ある文字の数 B.類似と判断され、認識結果の文字カテゴリが異なる
文字の数 C.非類似と判断され、認識結果の文字カテゴリが同一
である文字の数 の各条件にあてはまる、同一グループ内の文字数をそれ
ぞれカウントする。ここでは、図4のように、[000120]
という数字の列を同一筆記者によって手書き筆記された
ものを認識した結果が[006120]であった場合について考
える。(3文字目は正解0に対して6と誤認識してい
る)このような文字画像と認識結果に対して、上記A,
B,Cの条件にあてはまる文字数をカウントした例を図
5に示す。
【0039】図5の結果を出したときの類似判定部9で
の判定結果は、1,2,3,6番目の文字のうちのどの
2文字も互いに類似と判定されており、4番目の文字と
1,2,3,6番目の文字は互いに非類似と判定されて
いる。その他の組み合わせは、類似、非類似とも判定さ
れていない組み合わせである。ここで、Aを正のスコ
ア、B,Cを負のスコアと考えると、これらの合計スコ
アが最も低いものは3番目の文字(スコアは-3)であ
り、4,5番目の文字がスコア0、1,2,6番目の文
字がスコア1という順になる。よってこのスコアをもと
に、誤認識らしい文字を検出(リジェクト)することが
出来る(3番目の文字は実際に誤認識である)。
【0040】以上のように、文字の字形同士の類似度合
と認識結果の関係から得られる情報A,B,Cを用いて
スコアを算出することにより、他の文字との関係も考慮
した、信頼性の高いスコアを定義することが出来る。ま
た、そのスコアを参考にリジェクト文字を決定すること
により、高精度に誤認識の可能性がある文字を検出する
ことができる。
【0041】なお、入力文書内の認識対象の文字が、す
べて同一の活字書体のみで印字される場合、もしくは、
すべて同一の筆記者により手書き筆記される場合は、同
一字体ブロック抽出部6は省略可能である。
【0042】なお、字形特徴量は、本実施の形態では認
識部で使用する特徴量と別のものを字形特徴抽出部で求
めているが、認識部で使用する特徴量と同一のものでも
良いし、主成分分析などを用いて認識部で使用する特徴
量の次元を削減したものでもよい。
【0043】なお、類似度計算部では、字形特徴量同士
について(数3)のような類似度を計算しているが、他
の類似度でもよい。または、特徴量間のユークリッド距
離、市街地距離、マハラノビス距離など他の距離尺度で
もよい。
【0044】なお、類似度計算部で類似度ではなく距離
を求める場合は、類似判定部では、予め定めた閾値T1
よりも小さければ”類似”と判定し、予め定めた閾値T
2よりも大きければ”非類似”と判定してもよい。
【0045】なお、スコアの計算方法は、A,B,Cの
数値に重み付けをして加算したものでもよいし、前処理
部(文字切り出し部)で得られる切り出しスコア、認識
部で得られる認識スコアなどと重み付けをして加算し、
総合的なスコアとして用いてもよい。
【0046】(実施の形態2)図6は、本発明の実施の
形態2に関わる文字認識装置の構成図である。実施の形
態1のときの類似判定部9がないほかは、実施の形態1
と同一の構成である。
【0047】次にこのような文字認識装置の動作につい
て詳細に説明するが、類似度計算部8までの動作は、実
施の形態1と同様である。
【0048】すなわち、同一字体ブロック抽出部6で同
一字体であると判断された文字ブロック毎に、ブロック
に含まれる全ての文字に対して字形特徴抽出部7で字形
特徴量が抽出され、類似度計算部8では、ブロックに含
まれる全ての文字間について(数3)の式に従って類似
度を求める。図4のような同一字体ブロックに含まれる
6個の文字画像について求めた類似度を図7に示す。こ
の類似度は類似情報記憶部10に蓄えられる。
【0049】誤認識検出部11では、同一字体であると
判断された文字のグループ内の各文字に対して、次のよ
うなスコアを計算する。
【0050】・着目文字と、認識結果が同一の文字全て
に対して、図8のような関数(類似度とスコアの関係を
表す)によりスコアを計算し、その平均Saを求める ・着目文字と、認識結果が異なる文字全てに対して、図
9のような関数(類似度とスコアの関係を表す)により
スコアを計算し、その平均Sbを求める ・スコアSaとスコアSbの和Sを求め、着目文字のスコ
アとする例えば、1番目の文字のスコアSは、認識結果
が同一の文字が2,6文字目の2文字であり、認識結果
が異なる文字が3,4,5文字目の3文字であるから、
下のようになる。
【0051】 Sa={(200 x 0.92 x 0.92 - 100) + (200 x 0.91 x 0.91 - 100)} / 2 =67.45 Sb=[{-400 x (0.94 - 0.5) x (0.94 - 0.5)} + 0 + {-400 x (0.62 - 0.5) x (0.62 - 0.5)] / 3 =-23.73... S=Sa+Sb= 67.45 + (-43.737) =39.72... このように、各文字に対してスコアを求めると、図10
のようになる(ただし小数点以下は四捨五入してあ
る)。
【0052】よってこのスコアをもとに、誤認識らしい
文字を検出(リジェクト)することが出来る(3番目の
文字は実際に誤認識である)。
【0053】以上のように、文字の字形同士の類似度合
を反映したスコアを算出することにより、他の文字との
関係も考慮した、信頼性の高いスコアを定義することが
出来る。また、そのスコアを参考にリジェクト文字を決
定することにより、高精度に誤認識の可能性がある文字
を検出することができる。
【0054】なお、入力文書内の認識対象の文字が、す
べて同一の活字書体のみで印字される場合、もしくは、
すべて同一の筆記者により手書き筆記される場合は、同
一字体ブロック抽出部6は省略可能である。
【0055】なお、字形特徴量は、本実施の形態では認
識部で使用する特徴量と別のものを字形特徴抽出部で求
めているが、認識部で使用する特徴量と同一のものでも
良いし、主成分分析などを用いて認識部で使用する特徴
量の次元を削減したものでもよい。
【0056】なお、類似度計算部では、字形特徴量同士
について(数3)のような類似度を計算しているが、他
の類似度でもよい。または、特徴量間のユークリッド距
離、市街地距離、マハラノビス距離など他の距離尺度で
もよい。
【0057】なお、類似度計算部で類似度ではなく距離
を求める場合は、誤認識検出部では、類似度とスコアの
関数ではなく、距離とスコアの関数を用意しておけばよ
い。また、類似度とスコアの関数は、必ずしも図8,図
9のものでなくてもよく、次の条件を満たしているもの
ならば他の適当な関数でもよい。
【0058】・認識結果が同一の文字であれば、類似度
が小さければ小さいスコアを、類似度が大きければ、大
きいスコアを与える単調増加の関数 ・認識結果が異なる文字であれば、類似度が小さければ
大きいスコアを、類似度が大きければ、小さいスコアを
与える単調減少の関数 なお、本実施の形態で計算されるスコアを、前処理部
(文字切り出し部)で得られる切り出しスコア、認識部
で得られる認識スコアなどと重み付けをして加算し、総
合的なスコアとして用いてもよい。
【0059】(実施の形態3)図11は、本発明の実施
の形態3に関わる文字認識装置の構成図である。構成に
関しては、誤認識検出部11が誤認識修正部12に変わ
ったほかは、実施の形態1と同様である。
【0060】次にこのような文字認識装置の動作につい
て詳細に説明するが、類似情報記憶部10までの動作
は、認識部5が、特徴抽出部4で抽出された特徴量を用
いて認識を行い複数(本実施の形態ではN=3)の認識
候補カテゴリを出力すること以外は、実施の形態1と同
様である。
【0061】誤認識修正部12では、実施の形態1の誤
認識検出部11の動作と同様に、同一字体であると判断
された文字ブロック内の各文字に対して、 A.類似と判断され、認識結果の文字カテゴリが同一で
ある文字の数 B.類似と判断され、認識結果の文字カテゴリが異なる
文字の数 C.非類似と判断され、認識結果の文字カテゴリが同一
である文字の数 の各条件にあてはまる、同一グループ内の文字数をそれ
ぞれカウントする。図12のような入力画像、認識結果
の場合に、第1候補の認識結果に対してそれぞれA,
B,Cをカウントした例を図13に示す。ここで、図1
2は、[000120]という数字の列を同一筆記者によって手
書き筆記されたものを認識部の第1〜3候補の出力と共
に示した結果であり、3番目の文字が6に誤認識されて
いる他は全て第1候補で正解である。図13は、そして
それぞれの文字の第1候補の認識結果に対してA,B,
Cの条件に当てはまる文字の個数をカウントしている。
因みに類似判定部での判定の結果は、1,2,3,6番
目の文字のうちのどの2文字も互いに類似と判定されて
おり、4番目の文字と1,2,3,6番目の文字は互い
に非類似と判定されている。その他の組み合わせは、類
似、非類似とも判定されていない組み合わせである。
A,B,Cのそれぞれの条件に当てはまる文字の個数を
カウントしてあるが、Aを正のスコア、B,Cを負のス
コアと考えると、これらの合計スコアが最も低いものは
3番目の文字(スコアは-3)であり、4,5番目の文字
がスコア0、1,2,6番目の文字がスコア1という順に
なる。
【0062】このスコアが最も低いものが、予め定めた
閾値T以下(本実施の形態ではT=−1)ならば、その
文字の認識結果を第2候補のものに置き換えて、再度
A,B,Cの文字をカウントする。その結果を図14に
示す。3番目の文字の認識結果を第2候補の”0”に変
えることで、負のスコアがなくなると共に全体のスコア
(例えば各文字のスコアの和)も向上している。すなわ
ち、単純な第1候補の認識結果の組み合わせよりは、今
回求めた、3番目の文字のみ第2候補を採用した組み合
わせの方が、認識の確からしさが増加したと考えられ
る。もし、別の認識候補カテゴリに変えた場合でも、ス
コアが改善しない場合は、その文字をリジェクトするこ
とも出来る。
【0063】この様に、他の文字との関係(類似度合、
認識結果)から求めたスコアが低い文字の認識結果を置
き換えることで、誤認識らしい文字を修正することがで
きる。
【0064】なお、入力文書内の認識対象の文字が、す
べて同一の活字書体のみで印字される場合、もしくは、
すべて同一の筆記者により手書き筆記される場合は、同
一字体ブロック抽出部6は省略可能である。
【0065】なお、字形特徴量は、本実施の形態では認
識部で使用する特徴量と別のものを字形特徴抽出部で求
めているが、認識部で使用する特徴量と同一のものでも
良いし、主成分分析などを用いて認識部で使用する特徴
量の次元を削減したものでもよい。
【0066】なお、類似度計算部では、字形特徴量同士
について(数3)のような類似度を計算しているが、他
の類似度でもよい。または、特徴量間のユークリッド距
離、市街地距離、マハラノビス距離など他の距離尺度で
もよい。
【0067】なお、類似度計算部で類似度ではなく距離
を求める場合は、類似判定部では、予め定めた閾値T1
よりも小さければ”類似”と判定し、予め定めた閾値T
2よりも大きければ”非類似”と判定してもよい。
【0068】なお、スコアの計算方法は、A,B,Cの
数値に重み付けをして加算したものでもよいし、前処理
部(文字切り出し部)で得られる切り出しスコア、認識
部で得られる認識スコアなどと重み付けをして加算し、
総合的なスコアとして用いてもよい。
【0069】なお、本実施の形態では、スコアが低い文
字の認識結果を、複数の認識結果を出力する認識部の認
識候補を利用して置換しているが、文字カテゴリ毎に予
め誤りやすいカテゴリを情報として保持している類似文
字テーブルのようなものを利用しても良い。
【0070】(実施の形態4)図15は、本発明の実施
の形態4に関わる文字認識装置の構成図である。構成に
関しては、誤認識検出部11が誤認識修正部12に変わ
ったほかは、実施の形態2と同様である。
【0071】次にこのような文字認識装置の動作につい
て詳細に説明するが、類似情報記憶部10までの動作
は、認識部5が、特徴抽出部4で抽出された特徴量を用
いて認識を行い複数(本実施の形態ではN=3)の認識
候補カテゴリを出力すること以外は、実施の形態2と同
様である。
【0072】誤認修正部12では、実施の形態2の誤認
識検出部11の動作と同様に、同一字体であると判断さ
れた文字のグループ内の各文字に対して、次のようなス
コアを計算する。ここで、認識結果とは、複数(候補数
N=3)の認識候補カテゴリのうちのどれかを指すが、
最初は、全て第1候補を使用する。
【0073】・着目文字と、認識結果が同一の文字全て
に対して、図8のような関数(類似度とスコアの関係を
表す)によりスコアを計算し、その平均Saを求める ・着目文字と、認識結果が異なる文字全てに対して、図
9のような関数(類似度とスコアの関係を表す)により
スコアを計算し、その平均Sbを求める ・スコアSaとスコアSbの和Sを求め、着目文字のスコ
アとする ここでは、図12のような文字イメージの集合が同一字
体ブロック抽出部6によって指定されたとし、類似度計
算部8では図7のような、文字同士の類似度が計算され
たとする。
【0074】例えば、1番目の文字のスコアSは、認識
結果が同一の文字が2,6文字目の2文字であり、認識
結果が異なる文字が3,4,5文字目の3文字であるか
ら、下のようになる。
【0075】 Sa={(200 x 0.92 x 0.92 - 100) + (200 x 0.91 x 0.91 - 100)} / 2 =67.45 Sb=[{-400 x (0.94 - 0.5) x (0.94 - 0.5)} + 0 + {-400 x (0.62 - 0.5) x (0.62 - 0.5)] / 3 =-23.73... S=Sa+Sb= 67.45 + (-43.737) =39.72... このように、各文字に対してスコアを求めると、図16
のようになる(ただし小数点以下は四捨五入してあ
る)。スコアSが最も低いものは3番目の文字(スコア
は-44)である。
【0076】スコアが最も低いものが、予め定めた閾値
T以下(本実施の形態ではT=−20)ならば、その文字
の認識結果を第2候補のものに置き換えて、再度スコア
計算を行う。
【0077】例えば、1番目のスコアSは、3文字目の
認識結果として第2候補である”0”が採用されたた
め、認識結果が同一の文字は、2,3,6文字目の3文
字であり、認識結果が異なる文字が4,5文字目の2文
字となるため、下のようになる。
【0078】 Sa={(200 x 0.92 x 0.92 - 100) + (200 x 0.91 x 0.91 - 100) + (200 x 0 .94 x 0-.94 - 100)} / 3 = 70.54 Sb=[0 + {-400 x (0.62 - 0.5) x (0.62 - 0.5)] / 2 = -2.88 S=Sa+Sb= 67.66 + (-2.88) = 67.66 このように、各文字に対してスコアを求めると、図17
のようになる。その結果を図17に示す。3番目の文字
の認識結果を第2候補の”0”に変えることで、3文字
目のスコアが上がるだけでなく、全体のスコア(例えば
各文字のスコアの和)も向上している。すなわち、単純
な第1候補の認識結果の組み合わせよりは、今回求め
た、3番目の文字のみ第2候補を採用した組み合わせの
方が、認識の確からしさが増加したと考えられる。も
し、別の認識候補カテゴリに変えた場合でも、スコアが
改善しない場合は、その文字をリジェクトすることも出
来る。また、スコアの低い文字が複数ある場合は、1文
字ずつ認識候補を変えて、スコアの変化を見てやればよ
い。
【0079】この様に、他の文字との関係(類似度合、
認識結果)から求めたスコアが低い文字の認識結果を置
き換えることで、誤認識らしい文字を修正することがで
きる。
【0080】なお、入力文書内の認識対象の文字が、す
べて同一の活字書体のみで印字される場合、もしくは、
すべて同一の筆記者により手書き筆記される場合は、同
一字体ブロック抽出部6は省略可能である。
【0081】なお、字形特徴量は、本実施の形態では認
識部で使用する特徴量と別のものを字形特徴抽出部で求
めているが、認識部で使用する特徴量と同一のものでも
良いし、主成分分析などを用いて認識部で使用する特徴
量の次元を削減したものでもよい。
【0082】なお、類似度計算部では、字形特徴量同士
について(数3)のような類似度を計算しているが、他
の類似度でもよい。または、特徴量間のユークリッド距
離、市街地距離、マハラノビス距離など他の距離尺度で
もよい。
【0083】なお、類似度計算部で類似度ではなく距離
を求める場合は、誤認識検出部では、類似度とスコアの
関数ではなく、距離とスコアの関数を用意しておけばよ
い。また、類似度とスコアの関数は、必ずしも図8,図
9のものでなくてもよく、次の条件を満たしているもの
ならば他の適当な関数でもよい。
【0084】・認識結果が同一の文字であれば、類似度
が小さければ小さいスコアを、類似度が大きければ、大
きいスコアを与える単調増加の関数 ・認識結果が異なる文字であれば、類似度が小さければ
大きいスコアを、類似度が大きければ、小さいスコアを
与える単調減少の関数 なお、本実施の形態で計算されるスコアを、前処理部
(文字切り出し部)で得られる切り出しスコア、認識部
で得られる認識スコアなどと重み付けをして加算し、総
合的なスコアとして用いてもよい。
【0085】なお、本実施の形態では、スコアが低い文
字の認識結果を、複数の認識結果を出力する認識部の認
識候補を利用して置換しているが、文字カテゴリ毎に予
め誤りやすいカテゴリを情報として保持している類似文
字テーブルのようなものを利用しても良い。
【0086】
【発明の効果】以上のように、本発明は(請求項1記載
の発明の効果)、文字認識結果の信頼性を表す信頼度
を、注目文字だけでなく、注目文字と他の文字からそれ
ぞれ抽出した字形特徴量間の関係をも用いて求めること
で、文字同士が類似しているのに認識結果が異なる場合
や、文字同士が類似していないのに認識結果が同一の場
合は、信頼度が低くなることにより誤認識の可能性のあ
る文字を検出できる。
【0087】また、予め筆記者毎の文字サンプルを集め
る必要もなく、認識対象の文書にカテゴリ当たりの文字
数が十分多くなくても動作する。
【0088】また、本発明は(請求項7記載の発明の効
果)、注目文字の信頼度を求める際に、注目文字に対し
て、字形特徴量同士が類似と判断され、かつ、認識結果
が異なる文字の個数、および、字形特徴量同士が非類似
と判断され、かつ、認識結果が同一の文字の個数を負の
信頼度としてカウントし、字形特徴量同士が類似と判断
され、かつ、認識結果が同一の文字の個数を正の信頼度
としてカウントすることにより、簡単な方法で字形特徴
量間の関係を用いた信頼度を定義し、その信頼度をもと
に誤認識の可能性のある文字を検出することができる。
【0089】また、本発明は(請求項8記載の発明の効
果)、注目文字の信頼度を求める際に、注目文字に対し
て、認識結果が同一の文字の場合は、字形特徴量間の類
似度に応じた信頼度S1を与え、認識結果が異なる文字
の場合は、字形特徴量間の類似度に応じた信頼度S2を
与えることにより、類似度の大きさを反映した、より精
度の高い信頼度を定義し、その信頼度をもとに誤認識の
可能性のある文字を検出することができる。
【0090】また、本発明は(請求項13記載の発明の
効果)、信頼度があらかじめ定めた閾値よりも小さい文
字に対しては認識結果を修正候補カテゴリに置換して信
頼度の再計算を行う。
【0091】この信頼度の再計算については、認識結果
を置換した文字だけではなく、他の文字に対しても再計
算を行う。
【0092】修正候補カテゴリが正解カテゴリの場合
は、認識結果を置換した文字の信頼度が上がるだけでな
く、認識結果と字形特徴量間の関係により他の文字の信
頼度も向上するため、修正候補カテゴリの正解可能性を
判断しやすい。
【0093】よって、高精度に誤認識の可能性のある文
字カテゴリを訂正することができる。
【0094】従って、本発明の信頼度計算方法、およ
び、誤認識訂正方法を帳票認識装置に用いることによ
り、高精度な認識が可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態1の構成を示すブロック図
【図2】本発明の実施の形態1で入力される文書画像の
一例を示す図
【図3】本発明の実施の形態1の同一字体ブロック抽出
部における判定結果の一例を示す図
【図4】本発明の実施の形態1の前処理部で切り出され
た文字画像と認識部で出力された認識結果の文字カテゴ
リの一例を示す図
【図5】本発明の実施の形態1の類似情報記憶部におけ
る字形同士の類似度合と認識結果の関係の一例を示す図
【図6】本発明の実施の形態2の構成を示すブロック図
【図7】本発明の実施の形態2の類似度計算部で計算さ
れた類似度の一覧を示す図
【図8】本発明の実施の形態2の誤認識検出部で、スコ
ア計算の際に利用される、認識結果が同一の場合の類似
度・スコア間の関数を示す図
【図9】本発明の実施の形態2の誤認識検出部で、スコ
ア計算の際に利用される、認識結果が異なる場合の類似
度・スコア間の関数を示す図
【図10】本発明の実施の形態2の誤認識検出部で計算
された各文字のスコアを示す図
【図11】本発明の実施の形態3の構成を示すブロック
【図12】本発明の実施の形態3の前処理部で切り出さ
れた文字画像と認識部で出力された認識結果の文字カテ
ゴリの一例を示す図
【図13】本発明の実施の形態3の類似情報記憶部にお
いて、全て第1候補の認識結果を用いた時の、字形同士
の類似度合と認識結果から求められるスコアを示す図
【図14】本発明の実施の形態3の類似情報記憶部にお
いて、3文字目だけ第2候補の認識結果を用い、その他
は全て第1候補の認識結果を用いた時の、字形同士の類
似度合と認識結果から求められるスコアを示す図
【図15】本発明の実施の形態4の構成を示すブロック
【図16】本発明の実施の形態4の類似情報記憶部にお
いて、全て第1候補の認識結果を用いた時の、字形同士
の類似度合と認識結果から求められるスコアを示す図
【図17】本発明の実施の形態4の類似情報記憶部にお
いて、3文字目だけ第2候補の認識結果を用い、その他
は全て第1候補の認識結果を用いた時の、字形同士の類
似度合と認識結果から求められるスコアを示す図
【符号の説明】
1 画像入力部 2 前処理部 3 文字画像記憶部 4 特徴抽出部 5 認識部 6 同一字体ブロック抽出部 7 字形特徴抽出部 8 類似度計算部 9 類似判定部 10 類似情報記憶部 11 誤認識検出部 12 誤認識修正部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−187499(JP,A) 特開 平2−300989(JP,A) 文字毎に認識信頼度を付与した誤認識 を含むテキストからの検索手法,電子情 報通信学会技術研究報告 PRMU99− 72,日本,1999年 9月16日,Vol. 99 No.305,pp.63−68 (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (17)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の文字画像を含む文書画像内の前記
    文字画像を入力とし、認識対象の全カテゴリのうち少な
    くとも1つ以上のカテゴリを認識結果として出力するこ
    とで文字認識を行うステップと、前記文字画像の形状を
    数値化した字形特徴量を抽出するステップと、前記複数
    の文字画像のうちの1文字と残りの文字画像のうちの1
    文字以上の文字との字形特徴量間の類似の度合および前
    記認識結果の相違をもとに前記文字の認識結果の信頼性
    を表す信頼度を算出するステップとを有することを特徴
    とする文字認識方法。
  2. 【請求項2】 前記文字認識を行うステップが、文字画
    像から何らかの方法で特徴量を抽出し、前記特徴量をも
    とに出力するカテゴリを決定する場合、字形特徴量を抽
    出するステップは、前記特徴量、または、前記特徴量の
    一部を字形特徴量として出力することを特徴とする請求
    項1記載の文字認識方法。
  3. 【請求項3】 前記字形特徴量を抽出するステップは、
    前記特徴量または前記特徴量の一部に主成分分析を行い
    次元圧縮を行ったものを字形特徴量として出力すること
    を特徴とする請求項2記載の文字認識方法。
  4. 【請求項4】 前記類似度合を類似という第1の状態
    と、非類似という第2の状態と、そのどちらでもないと
    いう第3の状態のいずれかにより表すことを特徴とする
    請求項1、2又は3に記載の文字認識方法。
  5. 【請求項5】 任意の文字に対して、前記文字の字形特
    徴量と他の文字の字形特徴量間の類似度が予め定めた閾
    値1よりも大きければ、前記類似度合を類似とし、予め
    定めた閾値2よりも小さければ、前記類似度合を非類似
    とすることを特徴とする請求項4記載の文字認識方法。
  6. 【請求項6】 任意の文字に対して、前記文字の字形特
    徴量と他の文字の字形特徴量間の距離が予め定めた閾値
    1よりも小さければ、前記類似度合を類似とし、予め定
    めた閾値2よりも大きければ、前記類似度合を非類似と
    することを特徴とする請求項4記載の信頼度計算方法。
  7. 【請求項7】 任意の文字に対して前記類似度合が類似
    でありかつ認識結果が異なる関係にある文字の個数と、
    前記類似度合が非類似でありかつ認識結果が等しい関係
    にある文字の個数と、前記類似度合が類似でありかつ認
    識結果が等しい関係にある文字の個数とを求め、前記個
    数をもとに信頼度を算出することを特徴とする請求項4
    から請求項6のいずれかに記載の文字認識方法。
  8. 【請求項8】 任意の文字に対して、前記文字と他の文
    字との認識結果が同一の場合、前記文字の字形特徴量と
    他の文字の字形特徴量間の類似度に応じた信頼度S1を
    与え、前記文字と他の文字との認識結果が異なる場合、
    前記文字の字形特徴量と他の文字の字形特徴量間の類似
    度に応じた信頼度S2を与えることを特徴とする請求項
    1、2又は3に記載の文字認識方法。
  9. 【請求項9】 任意の文字に対して、前記文字と他の文
    字との認識結果が同一の場合、前記文字の字形特徴量と
    他の文字の字形特徴量間の距離に応じた信頼度S1を与
    え、前記文字と他の文字との認識結果が異なる場合、前
    記文字の字形特徴量と他の文字の字形特徴量間の距離に
    応じた信頼度S2を与えることを特徴とする請求項1、
    2又は3に記載の文字認識方法。
  10. 【請求項10】請求項1から請求項9のいずれかに記載
    の文字認識方法で得られる信頼度と、他の処理から得ら
    れる信頼度とを合わせて文字の信頼度を算出することを
    特徴とする文字認識方法。
  11. 【請求項11】 同一人によって筆記された文字画像の
    集合、および、同一書体によって印字された文字画像の
    集合を同一字種セットとして出力するステップを備え、
    前記同一字種セットに含まれる文字画像に対して、文字
    の信頼度を計算することを特徴とする請求項1から請求
    項10のいずれかに記載の文字認識方法。
  12. 【請求項12】 請求項1から請求項11のいずれかに
    記載の文字認識方法で得られる信頼度をもとにリジェク
    ト文字を決定することを特徴とするリジェクト文字決定
    方法。
  13. 【請求項13】 請求項1から請求項11のいずれかに
    記載の文字認識方法において、信頼度があらかじめ定め
    た閾値よりも小さい文字に対しては認識結果を、前記認
    識結果とは異なるカテゴリである修正カテゴリに置換し
    て、複数文字の信頼度を再計算し、前記再計算された信
    頼度がもとの信頼度よりも大きくなる場合に、認識結果
    を前記修正カテゴリに決定することを特徴とする誤認識
    訂正方法。
  14. 【請求項14】 文字認識のステップが、認識結果とし
    て複数の候補のカテゴリを出力する場合、修正カテゴリ
    は、現在の信頼度を計算している候補と別の候補のカテ
    ゴリであることを特徴とする請求項13に記載の誤認識
    訂正方法。
  15. 【請求項15】 予め誤認識しやすい文字同士の関係を
    保持した誤認識文字テーブルを有し、修正カテゴリは、
    前記誤認識文字テーブル中の文字であることを特徴とす
    る請求項13に記載の誤認識訂正方法。
  16. 【請求項16】 請求項1から請求項15のいずれかに
    記載の前記各ステップの機能を実行することを特徴とす
    る文字認識装置。
  17. 【請求項17】 請求項1から請求項15のいずれかに
    記載の前記各ステップの機能をコンピュータに実行させ
    るプログラムを格納することを特徴とする記録媒体。
JP25987998A 1998-09-14 1998-09-14 文字認識方法及びその装置 Expired - Lifetime JP3374762B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25987998A JP3374762B2 (ja) 1998-09-14 1998-09-14 文字認識方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25987998A JP3374762B2 (ja) 1998-09-14 1998-09-14 文字認識方法及びその装置

Publications (2)

Publication Number Publication Date
JP2000090203A JP2000090203A (ja) 2000-03-31
JP3374762B2 true JP3374762B2 (ja) 2003-02-10

Family

ID=17340220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25987998A Expired - Lifetime JP3374762B2 (ja) 1998-09-14 1998-09-14 文字認識方法及びその装置

Country Status (1)

Country Link
JP (1) JP3374762B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7247496B2 (ja) * 2018-09-14 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2022088183A (ja) * 2020-12-02 2022-06-14 株式会社三菱Ufj銀行 帳票読取装置及び帳票読取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
文字毎に認識信頼度を付与した誤認識を含むテキストからの検索手法,電子情報通信学会技術研究報告 PRMU99−72,日本,1999年 9月16日,Vol.99 No.305,pp.63−68

Also Published As

Publication number Publication date
JP2000090203A (ja) 2000-03-31

Similar Documents

Publication Publication Date Title
US6249605B1 (en) Key character extraction and lexicon reduction for cursive text recognition
US7336827B2 (en) System, process and software arrangement for recognizing handwritten characters
US5768417A (en) Method and system for velocity-based handwriting recognition
Kanai et al. Automated evaluation of OCR zoning
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5802205A (en) Method and system for lexical processing
JP3452774B2 (ja) 文字認識方法
KR100249055B1 (ko) 문자인식장치및방법
JP2734386B2 (ja) 文字列読み取り装置
US6681044B1 (en) Retrieval of cursive Chinese handwritten annotations based on radical model
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
Gordo et al. Document classification and page stream segmentation for digital mailroom applications
JP2000315247A (ja) 文字認識装置
Favata Off-line general handwritten word recognition using an approximate beam matching algorithm
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP3216800B2 (ja) 手書き文字認識方法
Chandra et al. Optical character recognition-A review
JP3374762B2 (ja) 文字認識方法及びその装置
JP2008225695A (ja) 文字認識誤り修正装置およびプログラム
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP3415342B2 (ja) 文字切り出し方式
Halder et al. Individuality of Bangla numerals
Puri et al. Sentence detection and extraction in machine printed imaged document using matching technique

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071129

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081129

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091129

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091129

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101129

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111129

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121129

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121129

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131129

Year of fee payment: 11

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term