JP2936426B2 - 英文字認識装置 - Google Patents
英文字認識装置Info
- Publication number
- JP2936426B2 JP2936426B2 JP2239998A JP23999890A JP2936426B2 JP 2936426 B2 JP2936426 B2 JP 2936426B2 JP 2239998 A JP2239998 A JP 2239998A JP 23999890 A JP23999890 A JP 23999890A JP 2936426 B2 JP2936426 B2 JP 2936426B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- candidate
- region
- adjacent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、英文字の認識を行う英文字認識に関するも
のである。
のである。
(従来の技術) 近年、文字認識装置をコンピュータ等の入力装置とし
て利用する要求が高まっており、安定な認識結果を効率
的に得ることの出来る文字認識装置がコンピュータ等の
システムの性能向上に不可欠となっている。
て利用する要求が高まっており、安定な認識結果を効率
的に得ることの出来る文字認識装置がコンピュータ等の
システムの性能向上に不可欠となっている。
従来の認識装置は、一つの入力の認識結果として複数
の候補文字が得られた場合、候補文字の中から正解文字
を決定するために、その前後の文字からなる単語の認識
結果によりいくつかの文字列を生成し、その文字列の中
からスペルチェック等の手法を用いて正しい綴りとなる
文字列を決定し認識結果としていた。
の候補文字が得られた場合、候補文字の中から正解文字
を決定するために、その前後の文字からなる単語の認識
結果によりいくつかの文字列を生成し、その文字列の中
からスペルチェック等の手法を用いて正しい綴りとなる
文字列を決定し認識結果としていた。
(発明が解決しようとする課題) しかしながら上記従来の文字認識装置は、単語の候補
となる文字列を生成する際、認識結果の確度のみをもと
に候補文字列の順位付けがなされていたため同一単語内
での複数の文字が多くの候補文字を持っていた場合、候
補文字列の順位付けが必ずしも妥当でなく、スペルチェ
ック等の処理の回数が増加し処理時間の増大を招いてい
た。
となる文字列を生成する際、認識結果の確度のみをもと
に候補文字列の順位付けがなされていたため同一単語内
での複数の文字が多くの候補文字を持っていた場合、候
補文字列の順位付けが必ずしも妥当でなく、スペルチェ
ック等の処理の回数が増加し処理時間の増大を招いてい
た。
(課題を解決するための手段) 本発明は上記問題点を解決するため、単語候補文字列
の各組合せに対して、各文字の認識確度の積と統計的に
得られた文字の隣接頻度をもとに算出される補正値を加
え単語としての確度を求め、スペルチェックを行う際の
候補文字列の順位付けを効果的に行うことにより、スペ
ルチェック等の処理の回数を軽減し処理時間の短縮を図
るようにしたものである。
の各組合せに対して、各文字の認識確度の積と統計的に
得られた文字の隣接頻度をもとに算出される補正値を加
え単語としての確度を求め、スペルチェックを行う際の
候補文字列の順位付けを効果的に行うことにより、スペ
ルチェック等の処理の回数を軽減し処理時間の短縮を図
るようにしたものである。
(作用) したがって本発明によれば、スペルチェックを行う際
の候補文字列の順位を各文字の認識確度及び統計的に得
られた文字の隣接頻度をもとに付けることにより妥当な
順位付けを行い、スペルチェック等の処理の回数を軽減
し処理時間の短縮を図ることができる。
の候補文字列の順位を各文字の認識確度及び統計的に得
られた文字の隣接頻度をもとに付けることにより妥当な
順位付けを行い、スペルチェック等の処理の回数を軽減
し処理時間の短縮を図ることができる。
(実施例) 第1図は本発明の一実施例における英文字認識装置の
ブロック構成を示したものである。第1図において、1
は認識対象文書を文書画像として入力する画像入力部、
2は入力された文書画像から文字列の集まりを見つけ、
文章領域を出力する文章領域切り出し部、3は文章領域
から単語単位の区切りを見つけ1つの単語の範囲を単語
領域として出力する単語領域切り出し部、4は単語領域
から文字単位の区切りを見つけ1つの文字の範囲を文字
領域として出力する文字領域切り出し部、5は文字領域
から抽出した図形特徴をもとに該当する複数の候補文字
を出力する文字認識部、6は文字認識部から出力された
候補文字を1単語分蓄え、その組合せにて得られる文字
列に対して、各文字の認識確度の積と統計的に求められ
た文字の隣接頻度をもとに算出される補正値を加え単語
としての確度を求めることにより、候補としての順位を
付けた単語候補を生成する単語候補生成部、7は単語候
補のうち順位が高いものから綴りのチェックを行い、正
しい文字列を認識結果として出力するスペルチェック
部、8は前述の文字の隣接頻度を記憶している文字隣接
頻度リスト、9は1から7の各部をつなぐ内部バス、10
は単語候補生成部と文字隣接頻度リストをつなぐ内部バ
スである。
ブロック構成を示したものである。第1図において、1
は認識対象文書を文書画像として入力する画像入力部、
2は入力された文書画像から文字列の集まりを見つけ、
文章領域を出力する文章領域切り出し部、3は文章領域
から単語単位の区切りを見つけ1つの単語の範囲を単語
領域として出力する単語領域切り出し部、4は単語領域
から文字単位の区切りを見つけ1つの文字の範囲を文字
領域として出力する文字領域切り出し部、5は文字領域
から抽出した図形特徴をもとに該当する複数の候補文字
を出力する文字認識部、6は文字認識部から出力された
候補文字を1単語分蓄え、その組合せにて得られる文字
列に対して、各文字の認識確度の積と統計的に求められ
た文字の隣接頻度をもとに算出される補正値を加え単語
としての確度を求めることにより、候補としての順位を
付けた単語候補を生成する単語候補生成部、7は単語候
補のうち順位が高いものから綴りのチェックを行い、正
しい文字列を認識結果として出力するスペルチェック
部、8は前述の文字の隣接頻度を記憶している文字隣接
頻度リスト、9は1から7の各部をつなぐ内部バス、10
は単語候補生成部と文字隣接頻度リストをつなぐ内部バ
スである。
以上のように構成された本実施例の英文字認識装置に
ついて、第2図に全体の処理の流れ図を、第3図に文字
の隣接頻度を統計的に求めた隣接2文字の頻度表を示し
ている。次に実施例の動作を説明する。
ついて、第2図に全体の処理の流れ図を、第3図に文字
の隣接頻度を統計的に求めた隣接2文字の頻度表を示し
ている。次に実施例の動作を説明する。
認識したい文書を画像入力部1にて文書画像として入
力する(S11)。入力された文書画像を文章領域切り出
し部2に送り、文章領域切り出し部2にて文書画像の縦
方向および横方向の黒画素のヒストグラムを求め、これ
をもとに文章領域を見つける、そして文章領域の位置情
報を内部データとして蓄える(S12)。単語領域切り出
し部3に文章領域の位置情報を送り、文章領域内に対す
る単語領域切り出し処理を行う。単語領域切り出し部3
では単語の前後のスペースが単語内の文字間よりも大き
いことに注目し、ある幅以上のスペースに挾まれた文字
を単語領域として切り出す。文字領域切り出し部4にて
見つけられた文字領域内の全ての単語領域の位置情報を
求め、内部データとして蓄える(S13)。文字領域切り
出し部4に単語領域の位置情報を送り、単語領域に対す
る文字領域切り出し処理を行う。文字領域切り出し部4
では単語領域内の黒画素のヒストグラムの変化に注目
し、ヒストグラムがある値以下の部分を文字と文字の区
切りとして単語領域内の文字の連なりを文字単位に分離
し文字領域として切り出す。単語領域切り出し部にて見
つけられた単語領域内の全ての文字領域の位置情報を求
め、内部データとして蓄える(S14)。
力する(S11)。入力された文書画像を文章領域切り出
し部2に送り、文章領域切り出し部2にて文書画像の縦
方向および横方向の黒画素のヒストグラムを求め、これ
をもとに文章領域を見つける、そして文章領域の位置情
報を内部データとして蓄える(S12)。単語領域切り出
し部3に文章領域の位置情報を送り、文章領域内に対す
る単語領域切り出し処理を行う。単語領域切り出し部3
では単語の前後のスペースが単語内の文字間よりも大き
いことに注目し、ある幅以上のスペースに挾まれた文字
を単語領域として切り出す。文字領域切り出し部4にて
見つけられた文字領域内の全ての単語領域の位置情報を
求め、内部データとして蓄える(S13)。文字領域切り
出し部4に単語領域の位置情報を送り、単語領域に対す
る文字領域切り出し処理を行う。文字領域切り出し部4
では単語領域内の黒画素のヒストグラムの変化に注目
し、ヒストグラムがある値以下の部分を文字と文字の区
切りとして単語領域内の文字の連なりを文字単位に分離
し文字領域として切り出す。単語領域切り出し部にて見
つけられた単語領域内の全ての文字領域の位置情報を求
め、内部データとして蓄える(S14)。
以上のS12からS14にて求められた、文章領域・単語領
域・文字領域の位置データをもとに文字認識部5は1文
字単位の認識処理を行い、認識処理の結果である認識候
補文字・認識確度を内部データとして1単語分、蓄える
(S15〜S17)。
域・文字領域の位置データをもとに文字認識部5は1文
字単位の認識処理を行い、認識処理の結果である認識候
補文字・認識確度を内部データとして1単語分、蓄える
(S15〜S17)。
以下、1単語分の認識候補文字及び認識確度が次表の
ように求められたとして説明する。
ように求められたとして説明する。
求められた認識候補文字を組合せることにより単語候
補を求める(S18)。本例の場合、第一・第二・第三文
字目は候補が1文字だが、第四・第五文字目は2文字な
ので下記のような4つの組合せが単語候補として考えら
れる。
補を求める(S18)。本例の場合、第一・第二・第三文
字目は候補が1文字だが、第四・第五文字目は2文字な
ので下記のような4つの組合せが単語候補として考えら
れる。
単語候補1:appic 単語候補2:appie 単語候補3:applc 単語候補4:apple 次に、求められた全ての単語候補に対して単語として
の確度、即ち単語確度を求める(S18〜S21)。単語確度
は単語を構成する各文字の認識確度の積と文字の隣接頻
度をもとに算出される補正値を和算することにより求め
られ、認識確度は前記文字認識処理にて得られたもの、
また文字の隣接頻度は第3図に示すような英単語におけ
る文字単位の隣接頻度の統計を取った隣接2文字組の頻
度表(Cornew,R.W.:A Statistical Method of Spelling
Correction,Inf.Control,Vol.12,No.2,pp.79−93より
引用)をもとにする。尚、文字隣接頻度データは文字頻
度リストに格納されている。
の確度、即ち単語確度を求める(S18〜S21)。単語確度
は単語を構成する各文字の認識確度の積と文字の隣接頻
度をもとに算出される補正値を和算することにより求め
られ、認識確度は前記文字認識処理にて得られたもの、
また文字の隣接頻度は第3図に示すような英単語におけ
る文字単位の隣接頻度の統計を取った隣接2文字組の頻
度表(Cornew,R.W.:A Statistical Method of Spelling
Correction,Inf.Control,Vol.12,No.2,pp.79−93より
引用)をもとにする。尚、文字隣接頻度データは文字頻
度リストに格納されている。
まず各単語候補の認識確度の積を求める(S19)。認
識確度は1に近い程その認識結果が正しい確率が高いこ
とを示しており、単語全体の認識確度は構成する文字全
ての確度を掛け合わしたものとなる。下記に求めた結果
を示す。
識確度は1に近い程その認識結果が正しい確率が高いこ
とを示しており、単語全体の認識確度は構成する文字全
ての確度を掛け合わしたものとなる。下記に求めた結果
を示す。
単語候補1:1.0×1.0×1.0×0.7×0.6=0.42 単語候補2:1.0×1.0×1.0×0.7×0.4=0.28 単語候補3:1.0×1.0×1.0×0.3×0.6=0.18 単語候補4:1.0×1.0×1.0×0.3×0.4=0.12 つぎに隣接頻度による補正値を求める(S20)。
いま、単語候補内で複数の候補を持つ文字(本例では
第四文字目または第五文字目)の一つ前の文字との隣接
頻度と一つ後の文字との隣接頻度との積を文字隣接値と
し、単語候補内で複数の候補を持つ全ての文字の隣接値
を掛け合わせたものを単語隣接値とすると、補正値は各
単語候補の単語隣接値を全ての単語候補の単語隣接値の
和で割ったものとなる。
第四文字目または第五文字目)の一つ前の文字との隣接
頻度と一つ後の文字との隣接頻度との積を文字隣接値と
し、単語候補内で複数の候補を持つ全ての文字の隣接値
を掛け合わせたものを単語隣接値とすると、補正値は各
単語候補の単語隣接値を全ての単語候補の単語隣接値の
和で割ったものとなる。
以下に各単語候補の単語隣接値を求めた結果を示す。
単語候補1: ・第四文字目の文字隣接値 pとiの隣接頻度=8 iとcの隣接頻度=55 すなわち、文字隣接値=440 ・第五文字目の文字隣接値 iとcの隣接頻度=55 cとスペースの隣接頻度=7 すなわち、文字隣接値=385 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値) =169400 単語候補2: ・第四文字目の文字隣接値 pとiの隣接頻度=8 iとeの隣接頻度=37 すなわち、文字隣接値=296 ・第五文字目の文字隣接値 iとeの隣接頻度=37 eとスペースの隣接頻度=446 すなわち、文字隣接値=16502 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値)=4884592 単語候補3: ・第四文字目の文字隣接値 pとlの隣接頻度=29 lとcの隣接頻度=8 すなわち、文字隣接値=232 ・第五文字目の文字隣接値 lとcの隣接頻度=8 cとスペースの隣接頻度=7 すなわち、文字隣接値=56 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値)=12992 単語候補4: ・第四文字目の文字隣接値 pとlの隣接頻度=29 lとeの隣接頻度=72 すなわち、文字隣接値=2088 ・第五文字目の文字隣接値 lとeの隣接頻度=72 eとスペースの隣接頻度=446 すなわち、文字隣接値=32112 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値)=67049856 次に単語隣接値をもとに補正値を求めた結果を示す。
値) =169400 単語候補2: ・第四文字目の文字隣接値 pとiの隣接頻度=8 iとeの隣接頻度=37 すなわち、文字隣接値=296 ・第五文字目の文字隣接値 iとeの隣接頻度=37 eとスペースの隣接頻度=446 すなわち、文字隣接値=16502 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値)=4884592 単語候補3: ・第四文字目の文字隣接値 pとlの隣接頻度=29 lとcの隣接頻度=8 すなわち、文字隣接値=232 ・第五文字目の文字隣接値 lとcの隣接頻度=8 cとスペースの隣接頻度=7 すなわち、文字隣接値=56 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値)=12992 単語候補4: ・第四文字目の文字隣接値 pとlの隣接頻度=29 lとeの隣接頻度=72 すなわち、文字隣接値=2088 ・第五文字目の文字隣接値 lとeの隣接頻度=72 eとスペースの隣接頻度=446 すなわち、文字隣接値=32112 ・単語隣接値 (第四文字目の文字隣接値)×(第五文字目の文字隣接
値)=67049856 次に単語隣接値をもとに補正値を求めた結果を示す。
補正値は (各単語候補の隣接値)/(各単語候補の隣接値の和) で求められ、 各単語候補の隣接値の和=72116840 であるので、各単語候補の補正値は 単語候補1の補正値=169400/72116840 =0.0023 単語候補2の補正値=4884592/72116840 =0.0677 単語候補3の補正値=12992/72116840 =0.0002 単語候補4の補正値=67049856/72116840 =0.9297 となる。
各単語候補の単語確度を求める。
単語確度は認識確度に補正値を加えたものであるので 単語候補1の単語確度=0.42+0.0023=0.4223 単語候補2の単語確度=0.28+0.0677=0.3477 単語候補3の単語確度=0.18+0.0002=0.1802 単語候補4の単語確度=0.12+0.9297=1.0497 となる。
次に、以上の処理により求められた各単語候補の単語
確度が大きいものから順にスペルチェック処理を行う。
確度が大きいものから順にスペルチェック処理を行う。
スペルチェック処理は単語候補の文字列が英単語とし
て正しいか否かを判定するものでチェックした結果が正
しい場合はその単語候補を認識結果として出力し、誤っ
ていた場合は次の単語候補をチェックする。そして全て
の単語候補が誤っていた場合は各単語候補の中で一番認
識確度が高いものを認識結果として出力する(S22〜S2
6)。
て正しいか否かを判定するものでチェックした結果が正
しい場合はその単語候補を認識結果として出力し、誤っ
ていた場合は次の単語候補をチェックする。そして全て
の単語候補が誤っていた場合は各単語候補の中で一番認
識確度が高いものを認識結果として出力する(S22〜S2
6)。
従ってスペルチェックを行う順位は単語確度が大きい
ものから順に 単語候補4(apple) 単語候補1(appic) 単語候補2(appie) 単語候補3(applc) となり、順位の単語候補4(apple)の綴りが正しい
ので“apple"が認識結果として出力される。
ものから順に 単語候補4(apple) 単語候補1(appic) 単語候補2(appie) 単語候補3(applc) となり、順位の単語候補4(apple)の綴りが正しい
ので“apple"が認識結果として出力される。
以上説明した、S15からS26までを全ての単語領域に対
して繰り返し行うことにより与えられた文書画像の文字
認識処理を行う。
して繰り返し行うことにより与えられた文書画像の文字
認識処理を行う。
(発明の効果) 以上説明したようにこの発明によって、スペルチェッ
ク等の処理の回数を軽減することが出来、処理時間の短
縮を図ることが出来る効果を有する。
ク等の処理の回数を軽減することが出来、処理時間の短
縮を図ることが出来る効果を有する。
第1図は本発明の一実施例における英文字認識装置の構
成図、第2図は文字認識処理の全体の流れ図、第3図は
統計的な文字の隣接頻度を表わす文字隣接頻度表であ
る。 1…画像入力部、2…文字領域切り出し部、3…単語領
域切り出し部、4…文字領域切り出し部、5…文字認識
部、6…単語候補生成部、7…スペルチェック部、8…
文字隣接頻度リスト、9,10……内部バス。
成図、第2図は文字認識処理の全体の流れ図、第3図は
統計的な文字の隣接頻度を表わす文字隣接頻度表であ
る。 1…画像入力部、2…文字領域切り出し部、3…単語領
域切り出し部、4…文字領域切り出し部、5…文字認識
部、6…単語候補生成部、7…スペルチェック部、8…
文字隣接頻度リスト、9,10……内部バス。
Claims (1)
- 【請求項1】認識対象文書を入力する画像入力部と、入
力された文書画像から文章領域を出力する文章領域切り
出し部と、文章領域から単語領域を出力する単語領域切
り出し部と、単語領域から文字領域を出力する文字領域
切り出し部と、文字領域の図形特徴をもとに該当する複
数の候補文字を出力する文字認識部と、前記文字認識部
から出力された候補文字を1単語分蓄え、その組合せに
て得られる文字列に対して、各文字の認識確度を積算し
たものと統計的に求められた文字の隣接頻度をもとに算
出される補正値を加え単語としての確度を求めることに
より、候補としての順位を付けた単語候補を生成する単
語候補生成部と、単語候補のうち順位が高いものから綴
りのチェックを行い、正しい文字列を認識結果として出
力するスペルチェック部とからなる英文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2239998A JP2936426B2 (ja) | 1990-09-12 | 1990-09-12 | 英文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2239998A JP2936426B2 (ja) | 1990-09-12 | 1990-09-12 | 英文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04120679A JPH04120679A (ja) | 1992-04-21 |
JP2936426B2 true JP2936426B2 (ja) | 1999-08-23 |
Family
ID=17052949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2239998A Expired - Fee Related JP2936426B2 (ja) | 1990-09-12 | 1990-09-12 | 英文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2936426B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2741575B2 (ja) * | 1994-09-22 | 1998-04-22 | 日本アイ・ビー・エム株式会社 | 文字認識文字補完方法及びコンピュータ・システム |
JP6426417B2 (ja) * | 2014-09-26 | 2018-11-21 | 株式会社東芝 | 電子機器、方法及びプログラム |
-
1990
- 1990-09-12 JP JP2239998A patent/JP2936426B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04120679A (ja) | 1992-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8176050B2 (en) | Method and apparatus of supporting creation of classification rules | |
US7269544B2 (en) | System and method for identifying special word usage in a document | |
US7310773B2 (en) | Removal of extraneous text from electronic documents | |
JP2007517338A (ja) | サーチ品質の改善システムおよび改善方法 | |
JP5646792B2 (ja) | 単語分割装置、単語分割方法、及び単語分割プログラム | |
JP2020087353A (ja) | 要約文生成方法、要約文生成プログラム及び要約文生成装置 | |
CN107526721B (zh) | 一种对电商产品评论词汇的歧义消除方法及装置 | |
US20230177266A1 (en) | Sentence extracting device and sentence extracting method | |
KR101083455B1 (ko) | 통계 데이터에 기초한 사용자 질의 교정 시스템 및 방법 | |
CN118170878A (zh) | 基于大模型与知识库的智能问答方法及系统 | |
JP2936426B2 (ja) | 英文字認識装置 | |
US20070016567A1 (en) | Searching device and program product | |
JP3309174B2 (ja) | 文字認識方法及び装置 | |
CN115909381A (zh) | 一种文本图像识别方法、系统及相关装置 | |
US11763083B2 (en) | Inference methods for word or wordpiece tokenization | |
JP4682627B2 (ja) | 文書検索装置および方法 | |
JP2001101184A (ja) | 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体 | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JPH05174195A (ja) | 英文字認識装置 | |
CN111382322A (zh) | 字符串相似度的确定方法和装置 | |
JP6303508B2 (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
CN112434141A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
Singh | Post-Processing Techniques To Enhance The Performance Of Gurmukhi Text Recognition System | |
CN115329129A (zh) | 会议纪要文件生成方法、装置、电子设备及存储介质 | |
KR20230109868A (ko) | 공공기관에서 발주한 과제에 대한 평가자의 평가를 지원하기 위해, 과제 수행 계획서를 요약하여 제공할 수 있는 평가 관리 시스템 장치 및 그 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |