JPH05128308A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH05128308A JPH05128308A JP3293209A JP29320991A JPH05128308A JP H05128308 A JPH05128308 A JP H05128308A JP 3293209 A JP3293209 A JP 3293209A JP 29320991 A JP29320991 A JP 29320991A JP H05128308 A JPH05128308 A JP H05128308A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- recognition
- cutout
- contact
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】文字の切出しを高速かつ正確に行えるようにし
て、文字認識処理の高速化を図る。 【構成】接触する複数の文字の各構成部分を含む接触文
字要素E12に対して、その左端から、文字サイズSI
ZEの間隔で切出し候補位置a1,a2が設定される。
さらに、直前の文字要素E11の左端から、文字サイズ
SIZEの間隔で、切出し候補位置b0,b1,b2が
設定される。切出し候補位置a1,a2,b0,b1,
b2から選択した2つの切出し候補位置で切り出した画
像に対して文字認識処理が行われ、認識結果に対応した
認識評価値が算出される。そして、切り出された画像に
対する認識評価値が所定値以上である場合に、この画像
に対応した切出し候補位置が、切出し位置として決定さ
れる。
て、文字認識処理の高速化を図る。 【構成】接触する複数の文字の各構成部分を含む接触文
字要素E12に対して、その左端から、文字サイズSI
ZEの間隔で切出し候補位置a1,a2が設定される。
さらに、直前の文字要素E11の左端から、文字サイズ
SIZEの間隔で、切出し候補位置b0,b1,b2が
設定される。切出し候補位置a1,a2,b0,b1,
b2から選択した2つの切出し候補位置で切り出した画
像に対して文字認識処理が行われ、認識結果に対応した
認識評価値が算出される。そして、切り出された画像に
対する認識評価値が所定値以上である場合に、この画像
に対応した切出し候補位置が、切出し位置として決定さ
れる。
Description
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置
(OCR)などのように、文書画像から1文字ずつの画
像を切り出し、この切り出した画像に基づいて文字認識
処理を行う文字認識装置に関するものである。
(OCR)などのように、文書画像から1文字ずつの画
像を切り出し、この切り出した画像に基づいて文字認識
処理を行う文字認識装置に関するものである。
【0002】
【従来の技術】光学的文字読取装置などの文字認識装置
では、文書画像から1文字分ずつの文字画像を順に切り
出し、この文字画像から抽出した特徴量と、認識用辞書
に蓄積されている認識可能な各文字の特徴量との比較演
算を行うことで、文字の認識が行われ、認識された文字
に対応した文字コードが出力される。
では、文書画像から1文字分ずつの文字画像を順に切り
出し、この文字画像から抽出した特徴量と、認識用辞書
に蓄積されている認識可能な各文字の特徴量との比較演
算を行うことで、文字の認識が行われ、認識された文字
に対応した文字コードが出力される。
【0003】文字画像の切出しに当たっては、先ず文書
画像の行方向に関する黒画素の投影が求められ、白画素
で分離された1行ごとの画像が切り出される。さらに、
1行ごとの画像に関して、文字行に対して垂直な方向
(以下「行垂直方向」という。)についての黒画素の投
影が求められ、白画素で分離された個々の領域が文字画
像として切り出されることになる。
画像の行方向に関する黒画素の投影が求められ、白画素
で分離された1行ごとの画像が切り出される。さらに、
1行ごとの画像に関して、文字行に対して垂直な方向
(以下「行垂直方向」という。)についての黒画素の投
影が求められ、白画素で分離された個々の領域が文字画
像として切り出されることになる。
【0004】ところが、日本語の文字には、たとえば
「い」や「京」のように横方向や縦方向に分離した複数
の要素からなる分離文字が存在するため、上述の文字切
出し技術では、必ずしも個々の文字ごとの切出しが行え
ない。また、原稿に形成された文書画像の印刷状態によ
っては、隣接する文字同士が接触している場合もある。
このような場合には複数の文字を含む画像が1個の文字
画像として切り出されることになる。
「い」や「京」のように横方向や縦方向に分離した複数
の要素からなる分離文字が存在するため、上述の文字切
出し技術では、必ずしも個々の文字ごとの切出しが行え
ない。また、原稿に形成された文書画像の印刷状態によ
っては、隣接する文字同士が接触している場合もある。
このような場合には複数の文字を含む画像が1個の文字
画像として切り出されることになる。
【0005】そこで、この問題を解決するために、たと
えば特開平3−37782号公報に開示された先行技術
では、行方向についての黒画素の投影および行垂直方向
についての黒画素の投影に基づいて切り出された基本パ
ターンに対して一定の処理を施すことにより、認識処理
の対象となる文字画像の切出し位置を修正するようにし
ている。すなわち、個々の基本パターンおよび隣接する
複数の基本パターンの結合に対して、認識用辞書を参照
することにより、それらが文字を構成している可能性を
表す評価値が算出される。そして、この評価値が最大と
なる基本パターンの結合などを文字画像として切り出す
べく、切出し位置が決定される。
えば特開平3−37782号公報に開示された先行技術
では、行方向についての黒画素の投影および行垂直方向
についての黒画素の投影に基づいて切り出された基本パ
ターンに対して一定の処理を施すことにより、認識処理
の対象となる文字画像の切出し位置を修正するようにし
ている。すなわち、個々の基本パターンおよび隣接する
複数の基本パターンの結合に対して、認識用辞書を参照
することにより、それらが文字を構成している可能性を
表す評価値が算出される。そして、この評価値が最大と
なる基本パターンの結合などを文字画像として切り出す
べく、切出し位置が決定される。
【0006】また、隣接する文字同士が接触している場
合に対応するために、切り出された基本パターンの行方
向の長さが所定長を超えている場合には、行垂直方向に
関してとられた投影を基に、黒画素数が所定の閾値以下
の極小値をとる位置が分離候補位置として設定される。
さらに、この分離候補位置で分離された各分離画像およ
び結合可能な分離画像を組み合わせて得られた結合画像
に対して、認識用辞書を参照して、上記の評価値が算出
される。そして、この評価値に基づいて、分離候補位置
の最適な組合せが見出され、この最適な組合せを構成す
る分離候補位置で基本パターンの再度の分離が行われ、
この分離後の画像が改めて基本パターンとされる。
合に対応するために、切り出された基本パターンの行方
向の長さが所定長を超えている場合には、行垂直方向に
関してとられた投影を基に、黒画素数が所定の閾値以下
の極小値をとる位置が分離候補位置として設定される。
さらに、この分離候補位置で分離された各分離画像およ
び結合可能な分離画像を組み合わせて得られた結合画像
に対して、認識用辞書を参照して、上記の評価値が算出
される。そして、この評価値に基づいて、分離候補位置
の最適な組合せが見出され、この最適な組合せを構成す
る分離候補位置で基本パターンの再度の分離が行われ、
この分離後の画像が改めて基本パターンとされる。
【0007】
【発明が解決しようとする課題】しかしながら、上述の
先行技術では、たとえば図10(a) に示すように、多数
の文字が接触している場合には、行垂直方向の投影を求
めて得られた参照符号q1で示すヒストグラムにおける
極小値が多数存在することになる。このため、分離候補
位置が多数存在することになるから、この多数の分離候
補位置で分離して得られた個々の分離画像の結合可能な
組合せの数が極めて多くなる。この組合せの数の増大の
ために、文字切出しに要する処理量が極めて多くなり、
文字切出し処理に長時間を要するという問題がある。
先行技術では、たとえば図10(a) に示すように、多数
の文字が接触している場合には、行垂直方向の投影を求
めて得られた参照符号q1で示すヒストグラムにおける
極小値が多数存在することになる。このため、分離候補
位置が多数存在することになるから、この多数の分離候
補位置で分離して得られた個々の分離画像の結合可能な
組合せの数が極めて多くなる。この組合せの数の増大の
ために、文字切出しに要する処理量が極めて多くなり、
文字切出し処理に長時間を要するという問題がある。
【0008】また、図10(b) に示すように、接触して
いる文字の組合せによっては、必ずしも正しい切出し位
置q2においてヒストグラムが極小値をとるとは限らな
いから、切出しミスを生じることになる。そこで、本発
明の目的は、上述の技術的課題を解決し、文字の切出し
が高速にかつ正確に行えるようにして、文字認識処理の
高速化に寄与することができる文字認識装置を提供する
ことである。
いる文字の組合せによっては、必ずしも正しい切出し位
置q2においてヒストグラムが極小値をとるとは限らな
いから、切出しミスを生じることになる。そこで、本発
明の目的は、上述の技術的課題を解決し、文字の切出し
が高速にかつ正確に行えるようにして、文字認識処理の
高速化に寄与することができる文字認識装置を提供する
ことである。
【0009】
【課題を解決するための手段】上記の目的を達成するた
めの請求項1記載の文字認識装置は、認識可能な文字の
基本となる特徴量を記憶した認識用辞書と、文書画像か
ら切り出された1文字ごとの文字画像から抽出された特
徴量と、上記認識用辞書に記憶された特徴量とを照合し
て、最も類似する文字の文字コードを出力する認識処理
手段とを有する文字認識装置において、文書画像から文
字を構成する画素の塊である文字要素を切り出す仮切出
し手段と、所定の文字サイズに基づいて、上記切り出さ
れた文字要素のうちで、接触する複数の文字の各構成部
分を含む文字要素である接触文字要素を検出する接触文
字検出手段と、この接触文字検出手段により検出された
接触文字要素を文字ごとの文字画像に分離するための切
出し候補位置を、上記文字サイズおよび当該接触文字要
素とその直前の文字要素との位置関係に基づいて算出す
る接触文字分離手段と、この接触文字分離手段により算
出された切出し候補位置で分離して得た画像を上記認識
処理手段に与える手段と、認識処理手段が出力する文字
コードの類似度に対応した認識評価値を算出する手段
と、この認識評価値が所定値以上であるときに、その画
像に対応した上記切出し候補位置を文字画像の切出しの
ための切出し位置として決定する手段とを含むものであ
る。
めの請求項1記載の文字認識装置は、認識可能な文字の
基本となる特徴量を記憶した認識用辞書と、文書画像か
ら切り出された1文字ごとの文字画像から抽出された特
徴量と、上記認識用辞書に記憶された特徴量とを照合し
て、最も類似する文字の文字コードを出力する認識処理
手段とを有する文字認識装置において、文書画像から文
字を構成する画素の塊である文字要素を切り出す仮切出
し手段と、所定の文字サイズに基づいて、上記切り出さ
れた文字要素のうちで、接触する複数の文字の各構成部
分を含む文字要素である接触文字要素を検出する接触文
字検出手段と、この接触文字検出手段により検出された
接触文字要素を文字ごとの文字画像に分離するための切
出し候補位置を、上記文字サイズおよび当該接触文字要
素とその直前の文字要素との位置関係に基づいて算出す
る接触文字分離手段と、この接触文字分離手段により算
出された切出し候補位置で分離して得た画像を上記認識
処理手段に与える手段と、認識処理手段が出力する文字
コードの類似度に対応した認識評価値を算出する手段
と、この認識評価値が所定値以上であるときに、その画
像に対応した上記切出し候補位置を文字画像の切出しの
ための切出し位置として決定する手段とを含むものであ
る。
【0010】また、請求項2記載の文字認識装置は、接
触文字要素を文字画像に分離するための切出し位置が少
なくとも1つ確定したときに、この切出し位置から文字
サイズごとの間隔で、文字画像を切り出すための他の切
出し位置を設定する手段をさらに含むことを特徴とす
る。
触文字要素を文字画像に分離するための切出し位置が少
なくとも1つ確定したときに、この切出し位置から文字
サイズごとの間隔で、文字画像を切り出すための他の切
出し位置を設定する手段をさらに含むことを特徴とす
る。
【0011】
【作用】上記の構成によれば、所定の文字サイズに基づ
いて検出された接触文字要素を各文字に対応した文字に
分離するための切出し候補位置が、文字サイズおよび直
前の文字要素との位置関係に基づいて算出される。すな
わち、文字が接触している場合には、文字ピッチは文字
サイズにほぼ等しくなり、また文字間隔は零になるので
あるから、文字サイズごとに切出し位置を設定すれば、
良いことになる。したがって、接触文字要素の先頭部分
が、1個の文字の先頭部分と一致しているならば、この
接触文字要素の先頭から文字サイズごとに切出し位置を
設定すれば、文字画像を正しく切り出すことができる。
また、接触文字要素の先頭部分が、直前の文字要素とと
もに1個の文字を構成する文字要素であるときには、こ
の直前の文字要素の先頭位置から文字サイズごとの間隔
で切出し位置を設定すれば、文字画像の切出しを正しく
行える。
いて検出された接触文字要素を各文字に対応した文字に
分離するための切出し候補位置が、文字サイズおよび直
前の文字要素との位置関係に基づいて算出される。すな
わち、文字が接触している場合には、文字ピッチは文字
サイズにほぼ等しくなり、また文字間隔は零になるので
あるから、文字サイズごとに切出し位置を設定すれば、
良いことになる。したがって、接触文字要素の先頭部分
が、1個の文字の先頭部分と一致しているならば、この
接触文字要素の先頭から文字サイズごとに切出し位置を
設定すれば、文字画像を正しく切り出すことができる。
また、接触文字要素の先頭部分が、直前の文字要素とと
もに1個の文字を構成する文字要素であるときには、こ
の直前の文字要素の先頭位置から文字サイズごとの間隔
で切出し位置を設定すれば、文字画像の切出しを正しく
行える。
【0012】このように、接触文字の切出しの態様は、
2種類に大別されることになるが、いずれの態様で切出
しを行うかを決定するために、本発明では、接触文字分
離手段で得られた切出し候補位置で切り出した画像を認
識処理手段に与えて、各切出し候補位置で切り出された
画像に対して文字認識処理を行わせるようにしている。
そして、この文字認識処理の結果に対応した認識評価値
が算出され、この認識評価値が所定値以上であるとき
に、その画像に対応した切出し候補位置が切出し位置と
して決定される。
2種類に大別されることになるが、いずれの態様で切出
しを行うかを決定するために、本発明では、接触文字分
離手段で得られた切出し候補位置で切り出した画像を認
識処理手段に与えて、各切出し候補位置で切り出された
画像に対して文字認識処理を行わせるようにしている。
そして、この文字認識処理の結果に対応した認識評価値
が算出され、この認識評価値が所定値以上であるとき
に、その画像に対応した切出し候補位置が切出し位置と
して決定される。
【0013】このようにして、文書画像の投影をとるこ
とにより得られたヒストグラムを用いるのではなく、文
字サイズなどを用いて切出し候補位置を算出するように
しているから、切出し候補位置がむやみに増大すること
がない。したがって、切出し位置を決定するために必要
な文字認識処理の回数が過度に多くなることが防がれ、
文字切出し処理を簡素化することができる。また、ヒス
トグラムにおいて極小値が生じない場合であっても、適
切に切出し位置を設定することができる。
とにより得られたヒストグラムを用いるのではなく、文
字サイズなどを用いて切出し候補位置を算出するように
しているから、切出し候補位置がむやみに増大すること
がない。したがって、切出し位置を決定するために必要
な文字認識処理の回数が過度に多くなることが防がれ、
文字切出し処理を簡素化することができる。また、ヒス
トグラムにおいて極小値が生じない場合であっても、適
切に切出し位置を設定することができる。
【0014】上記のように、接触文字要素の切出しは、
文字サイズごとの間隔で行えばよいのであるから、接触
文字要素の切出し位置が少なくとも1つ決定すれば、こ
の切出し位置に基づいて残余の切出し位置は文字サイズ
ごとに設定すれば足りることになる。このようにするこ
とにより、文字画像の切出しのための処理を一層簡素化
することができる。
文字サイズごとの間隔で行えばよいのであるから、接触
文字要素の切出し位置が少なくとも1つ決定すれば、こ
の切出し位置に基づいて残余の切出し位置は文字サイズ
ごとに設定すれば足りることになる。このようにするこ
とにより、文字画像の切出しのための処理を一層簡素化
することができる。
【0015】
【実施例】以下では、本発明の実施例を、添付図面を参
照して詳細に説明する。図1は、本発明の一実施例の文
字認識装置である光学的文字読取装置の基本的な構成を
示すブロック図である。原稿1の表面に形成された文書
画像は、イメージスキャナ2で光学的に読み取られて
「1」または「0」の二値データで表された二値画像に
変換され、画像メモリ3に記憶される。この画像メモリ
3に記憶された文書画像は、1文字ずつの文字画像ごと
に認識処理部4に読み出され、認識用辞書5を参照した
認識処理の結果として、対応する文字コードが出力され
る。認識用辞書5は、当該装置によって認識可能な各文
字についての基本となる特徴量を各文字ごとに記憶した
ものである。
照して詳細に説明する。図1は、本発明の一実施例の文
字認識装置である光学的文字読取装置の基本的な構成を
示すブロック図である。原稿1の表面に形成された文書
画像は、イメージスキャナ2で光学的に読み取られて
「1」または「0」の二値データで表された二値画像に
変換され、画像メモリ3に記憶される。この画像メモリ
3に記憶された文書画像は、1文字ずつの文字画像ごと
に認識処理部4に読み出され、認識用辞書5を参照した
認識処理の結果として、対応する文字コードが出力され
る。認識用辞書5は、当該装置によって認識可能な各文
字についての基本となる特徴量を各文字ごとに記憶した
ものである。
【0016】1文字ずつの文字画像を切り出すために、
先ず、行切出し部6において、文書画像の行方向に関す
る周辺分布が求められる。すなわち、図2に示すよう
に、行方向R1に関して文書画像が走査され、各走査線
上の黒画素数を計算することによって参照符号A1で示
すヒストグラムが求められる。このヒストグラムに基づ
いて、白画素で分離された各領域の画像が1行ごとの画
像とされ、参照符号L1,L2,L3,・・・・で示す位置
の座標が、行切出し座標として、切出し情報記憶部7に
書き込まれる。
先ず、行切出し部6において、文書画像の行方向に関す
る周辺分布が求められる。すなわち、図2に示すよう
に、行方向R1に関して文書画像が走査され、各走査線
上の黒画素数を計算することによって参照符号A1で示
すヒストグラムが求められる。このヒストグラムに基づ
いて、白画素で分離された各領域の画像が1行ごとの画
像とされ、参照符号L1,L2,L3,・・・・で示す位置
の座標が、行切出し座標として、切出し情報記憶部7に
書き込まれる。
【0017】このようにして1行ごとの画像が切り出さ
れると、次に仮切出し部8では、行方向R1に対して垂
直な方向である行垂直方向R2(図2参照。)に関して
周辺分布が求められる。すなわち、図3に示すように、
1行ごとの画像が、行垂直方向R2に走査され、各走査
線上の黒画素数が計算されて、参照符号A2で示すヒス
トグラムが求められる。このヒストグラムを基に、黒画
素の塊である文字要素ごとの切出し位置r1,r2,r
3,・・・・が算出されて、切出し情報記憶部7に格納され
る。
れると、次に仮切出し部8では、行方向R1に対して垂
直な方向である行垂直方向R2(図2参照。)に関して
周辺分布が求められる。すなわち、図3に示すように、
1行ごとの画像が、行垂直方向R2に走査され、各走査
線上の黒画素数が計算されて、参照符号A2で示すヒス
トグラムが求められる。このヒストグラムを基に、黒画
素の塊である文字要素ごとの切出し位置r1,r2,r
3,・・・・が算出されて、切出し情報記憶部7に格納され
る。
【0018】仮切出し部8での切出し情報は、文字サイ
ズ推定部9に与えられる。この文字サイズ推定部9は、
切り出された文字要素の大きさに基づいて、文書画像を
構成する文字の大きさである文字サイズSIZEを推定
する。この文字サイズSIZEは切出し情報記憶部7に
記憶される。なお、文字サイズの推定は、たとえば行切
出し部6で切り出された1行の画像の縦幅の平均値をと
るようにして行われてもよい。すなわち、日本語文字で
は文字の縦幅と横幅との比はほぼ1であるから、行幅の
平均値を文字サイズとして採用することができる。
ズ推定部9に与えられる。この文字サイズ推定部9は、
切り出された文字要素の大きさに基づいて、文書画像を
構成する文字の大きさである文字サイズSIZEを推定
する。この文字サイズSIZEは切出し情報記憶部7に
記憶される。なお、文字サイズの推定は、たとえば行切
出し部6で切り出された1行の画像の縦幅の平均値をと
るようにして行われてもよい。すなわち、日本語文字で
は文字の縦幅と横幅との比はほぼ1であるから、行幅の
平均値を文字サイズとして採用することができる。
【0019】仮切出し部8で切り出された文字要素は、
接触文字検出部10に与えられる。この接触文字検出部
10は、図4(a) に示すように隣接する文字と接触した
2個以上の文字C11,C12を包含する文字要素E1
や、図4(b) に示すように文字C13と隣接する分離文
字C14の一部分C14aとを包含する文字要素E2の
ように、異なる文字に属する画像部分を含む文字要素
を、接触文字要素として検出する。すなわち、接触文字
検出部10は、切出し情報記憶部7から上述の文字サイ
ズSIZEを読み出し、この文字サイズSIZEを超え
る横幅を持つ文字要素を、接触文字要素として検出す
る。なお、図4において、参照符号A3,A4は、文字
要素E1,E2などに対して行垂直方向に関する周辺分
布を求めることにより得られたヒストグラムを示す。
接触文字検出部10に与えられる。この接触文字検出部
10は、図4(a) に示すように隣接する文字と接触した
2個以上の文字C11,C12を包含する文字要素E1
や、図4(b) に示すように文字C13と隣接する分離文
字C14の一部分C14aとを包含する文字要素E2の
ように、異なる文字に属する画像部分を含む文字要素
を、接触文字要素として検出する。すなわち、接触文字
検出部10は、切出し情報記憶部7から上述の文字サイ
ズSIZEを読み出し、この文字サイズSIZEを超え
る横幅を持つ文字要素を、接触文字要素として検出す
る。なお、図4において、参照符号A3,A4は、文字
要素E1,E2などに対して行垂直方向に関する周辺分
布を求めることにより得られたヒストグラムを示す。
【0020】処理対象の文字要素が接触文字要素である
ことが検出されると、このことを表す情報が接触文字分
離部11に与えられる。これに応答して、接触文字分離
部11は、当該接触文字要素に関する切出し情報などを
切出し情報記憶部7から読み出す。この接触文字分離部
11は、文字サイズSIZEや直前の文字要素との位置
関係などに基づいて、後述する処理によって、接触文字
要素を分離するための切出し候補位置を算出する。
ことが検出されると、このことを表す情報が接触文字分
離部11に与えられる。これに応答して、接触文字分離
部11は、当該接触文字要素に関する切出し情報などを
切出し情報記憶部7から読み出す。この接触文字分離部
11は、文字サイズSIZEや直前の文字要素との位置
関係などに基づいて、後述する処理によって、接触文字
要素を分離するための切出し候補位置を算出する。
【0021】算出された切出し候補位置は、評価画像作
成部12に与えられる。この評価画像作成部12は、文
字行の方向に離間した一対の切出し候補位置を認識処理
部4に与える。すなわち、処理対象の接触文字画像に対
応して、接触文字分離部11が複数の切出し候補位置を
算出したときには、この算出された複数の切出し候補位
置から2個の切出し候補位置を選択して認識処理部4に
与える。このことは、接触文字要素をいずれかの切出し
候補位置で分離した分離画像を認識処理部4に与えるこ
とと等価である。
成部12に与えられる。この評価画像作成部12は、文
字行の方向に離間した一対の切出し候補位置を認識処理
部4に与える。すなわち、処理対象の接触文字画像に対
応して、接触文字分離部11が複数の切出し候補位置を
算出したときには、この算出された複数の切出し候補位
置から2個の切出し候補位置を選択して認識処理部4に
与える。このことは、接触文字要素をいずれかの切出し
候補位置で分離した分離画像を認識処理部4に与えるこ
とと等価である。
【0022】すなわち、認識処理部4では、与えられた
一対の切出し候補位置に基づいて画像メモリ3内の文書
画像が切り出され、この切り出された画像が1文字ごと
の文字画像であるものとみなされて、文字認識処理が行
われる。すなわち、切り出された画像から所定の特徴量
が抽出され、認識用辞書5に記憶されている基本の特徴
量との比較演算が行われて、最も類似度の高い文字の文
字コードが求められる。そして、その文字コードと、そ
の類似度に対応した認識評価値が評価画像作成部12に
与えられる。
一対の切出し候補位置に基づいて画像メモリ3内の文書
画像が切り出され、この切り出された画像が1文字ごと
の文字画像であるものとみなされて、文字認識処理が行
われる。すなわち、切り出された画像から所定の特徴量
が抽出され、認識用辞書5に記憶されている基本の特徴
量との比較演算が行われて、最も類似度の高い文字の文
字コードが求められる。そして、その文字コードと、そ
の類似度に対応した認識評価値が評価画像作成部12に
与えられる。
【0023】この認識評価値が与えられた評価画像作成
部12では、この認識評価値が所定の閾値を超える場合
に、この認識評価値に対応した切出し候補位置を切出し
位置として決定して切出し情報記憶部7に格納する。な
お、評価画像作成部12における切出し候補位置の選択
は、この切出し候補位置で切り出されて構成される画像
の横幅が文字サイズSIZEを超えない範囲で行われ
る。これにより、現実に有り得ない大きさの評価画像に
対して無駄に文字認識処理が行われて認識評価値が算出
されることを防止できる。
部12では、この認識評価値が所定の閾値を超える場合
に、この認識評価値に対応した切出し候補位置を切出し
位置として決定して切出し情報記憶部7に格納する。な
お、評価画像作成部12における切出し候補位置の選択
は、この切出し候補位置で切り出されて構成される画像
の横幅が文字サイズSIZEを超えない範囲で行われ
る。これにより、現実に有り得ない大きさの評価画像に
対して無駄に文字認識処理が行われて認識評価値が算出
されることを防止できる。
【0024】図5は、接触文字検出部10、接触文字分
離部11および評価画像作成部12などでの処理を説明
するためのフローチャートである。処理は、個々の文字
要素ごとに行われる。ステップn1では、文字要素の行
方向の長さWが、文字サイズSIZE以下であるかどう
かが判断され、文字サイズSIZE以下であるときに
は、接触文字要素ではないものとして当該文字要素につ
いての処理を終了する。一方、長さWが文字サイズSI
ZEを超えている場合には接触文字要素であると考えら
れるので、ステップn2に進む。
離部11および評価画像作成部12などでの処理を説明
するためのフローチャートである。処理は、個々の文字
要素ごとに行われる。ステップn1では、文字要素の行
方向の長さWが、文字サイズSIZE以下であるかどう
かが判断され、文字サイズSIZE以下であるときに
は、接触文字要素ではないものとして当該文字要素につ
いての処理を終了する。一方、長さWが文字サイズSI
ZEを超えている場合には接触文字要素であると考えら
れるので、ステップn2に進む。
【0025】ステップn2では、当該接触文字要素の直
前の文字要素の横幅Wbと、この直前の文字要素との間
の間隔Sbとの和(Wb+Sb)が求められ、この和
(Wb+Sb)と文字サイズSIZEとが比較される。
和(Wb+Sb)が文字サイズSIZEよりも小さいと
きには、直前の文字要素が分離文字の一部を構成する文
字要素である可能性があり、この直前の文字要素と結合
されるべき画像部分が当該接触文字要素中に含まれてい
る可能性がある。このときには、ステップn3に進んで
複数の切出し候補位置が設定される。また、上記の和
(Wb+Sb)が文字サイズ以上であるときには、直前
の文字要素と接触文字要素内の画像とが結合される可能
性がないものとして、ステップn6に進む。
前の文字要素の横幅Wbと、この直前の文字要素との間
の間隔Sbとの和(Wb+Sb)が求められ、この和
(Wb+Sb)と文字サイズSIZEとが比較される。
和(Wb+Sb)が文字サイズSIZEよりも小さいと
きには、直前の文字要素が分離文字の一部を構成する文
字要素である可能性があり、この直前の文字要素と結合
されるべき画像部分が当該接触文字要素中に含まれてい
る可能性がある。このときには、ステップn3に進んで
複数の切出し候補位置が設定される。また、上記の和
(Wb+Sb)が文字サイズ以上であるときには、直前
の文字要素と接触文字要素内の画像とが結合される可能
性がないものとして、ステップn6に進む。
【0026】たとえば、図6に示すように、横方向に分
離している文字「が」の一部が文字要素E11とされ、
その濁点部分が直後の接触文字要素E12に包含されて
いる場合を想定する。この場合には、文字要素E11の
横幅Wbと、文字要素E11,E12間の間隔Sbとの
和(Wb+Sb)は文字サイズSIZEよりも小さくな
る。このため、処理は図5のステップn2からステップ
n3に進むことになる。そして、接触文字要素E12に
対して複数の切出し候補位置a1,a2;b1,b2が
設定される。切出し候補位置a1は接触文字要素E12
の切出し位置であり、この切出し候補位置a1から文字
サイズSIZEだけ間隔を開けて切出し候補位置a2が
設定される。また、切出し候補位置b1は、直前の文字
要素E11の切出し位置b0から文字サイズSIZEだ
け離れた位置に設定され、さらにこの切出し候補位置b
1から文字サイズSIZEだけ間隔を開けて切出し候補
位置b2が設定される。このようにして、接触文字要素
E12に対して複数の切出し候補位置が設定されること
になる。
離している文字「が」の一部が文字要素E11とされ、
その濁点部分が直後の接触文字要素E12に包含されて
いる場合を想定する。この場合には、文字要素E11の
横幅Wbと、文字要素E11,E12間の間隔Sbとの
和(Wb+Sb)は文字サイズSIZEよりも小さくな
る。このため、処理は図5のステップn2からステップ
n3に進むことになる。そして、接触文字要素E12に
対して複数の切出し候補位置a1,a2;b1,b2が
設定される。切出し候補位置a1は接触文字要素E12
の切出し位置であり、この切出し候補位置a1から文字
サイズSIZEだけ間隔を開けて切出し候補位置a2が
設定される。また、切出し候補位置b1は、直前の文字
要素E11の切出し位置b0から文字サイズSIZEだ
け離れた位置に設定され、さらにこの切出し候補位置b
1から文字サイズSIZEだけ間隔を開けて切出し候補
位置b2が設定される。このようにして、接触文字要素
E12に対して複数の切出し候補位置が設定されること
になる。
【0027】接触文字要素では、文字ピッチはぼぼ文字
サイズSIZEに等しくなり、また文字間隔が零となっ
ているのであるから、文字画像ごとに分離するための正
しい切出し位置は、ほぼ文字サイズごとに現れる。この
ため、上述のように文字サイズSIZEの間隔で設定し
た切出し候補位置a1,a2の組、または切出し候補位
置b0,b1,b2の組のいずれかが、正しい切出し位
置を与えることになる。
サイズSIZEに等しくなり、また文字間隔が零となっ
ているのであるから、文字画像ごとに分離するための正
しい切出し位置は、ほぼ文字サイズごとに現れる。この
ため、上述のように文字サイズSIZEの間隔で設定し
た切出し候補位置a1,a2の組、または切出し候補位
置b0,b1,b2の組のいずれかが、正しい切出し位
置を与えることになる。
【0028】なお、切出し候補位置を求める際に、行垂
直方向に関する周辺分布を求めて得られたヒストグラム
を補助的に用い、文字サイズSIZEに基づいて設定し
た切出し候補位置の近傍(たとえば前後数ドットの範
囲)にヒストグラムの極小値が存在しているときには、
このような極小値の位置に、切出し候補位置を補正する
ようにしてもよい。
直方向に関する周辺分布を求めて得られたヒストグラム
を補助的に用い、文字サイズSIZEに基づいて設定し
た切出し候補位置の近傍(たとえば前後数ドットの範
囲)にヒストグラムの極小値が存在しているときには、
このような極小値の位置に、切出し候補位置を補正する
ようにしてもよい。
【0029】このようにして複数の切出し候補位置が設
定されると、図5のステップn4では、設定された切出
し候補位置に基づいて、文書画像の切出しが行われ、ス
テップn5では、切り出された画像を文字画像と見なし
て認識処理が行われて認識評価値が算出される。さらに
詳細に説明すれば、先ず切出し候補位置a1で文字画像
の切出しが行われるものと仮定して、図7の参照符号7
1で示す文字要素E11単独の画像に関して処理が行わ
れる。すなわち、この画像が文字画像として認識処理部
4に与えられる。認識処理部4では、与えられた画像か
ら所定の特徴量を抽出し、認識用辞書5に記憶されてい
る特徴量と比較・照合するようにして、認識処理を行
う。この結果、特徴量が最も類似する文字が選択され、
この文字コードとその類似度に応じた認識評価値が生成
される。認識評価値は、1.00を満点として類似度に
比例した値とされており、図7の参照符号71の文字画
像の認識結果については、認識の確信度が低いと言え
る。
定されると、図5のステップn4では、設定された切出
し候補位置に基づいて、文書画像の切出しが行われ、ス
テップn5では、切り出された画像を文字画像と見なし
て認識処理が行われて認識評価値が算出される。さらに
詳細に説明すれば、先ず切出し候補位置a1で文字画像
の切出しが行われるものと仮定して、図7の参照符号7
1で示す文字要素E11単独の画像に関して処理が行わ
れる。すなわち、この画像が文字画像として認識処理部
4に与えられる。認識処理部4では、与えられた画像か
ら所定の特徴量を抽出し、認識用辞書5に記憶されてい
る特徴量と比較・照合するようにして、認識処理を行
う。この結果、特徴量が最も類似する文字が選択され、
この文字コードとその類似度に応じた認識評価値が生成
される。認識評価値は、1.00を満点として類似度に
比例した値とされており、図7の参照符号71の文字画
像の認識結果については、認識の確信度が低いと言え
る。
【0030】次に、切出し候補位置b1で文字要素の切
出しが行われるものと仮定して、図7の参照符号72で
示す画像が構成される。そして、この画像が文字画像と
されて、認識処理部4における上記と同様の処理が行わ
れる。以下、順に切出し候補位置a1,a2,b1,b
2の組合せによって分離された参照符号73〜77で示
す各画像を文字画像と仮定して上述の処理が行われ、各
画像に関する認識評価値が生成される。ただし、切出し
候補位置の組合せは、構成される画像の横幅が文字サイ
ズSIZEを超えない範囲で選択される。
出しが行われるものと仮定して、図7の参照符号72で
示す画像が構成される。そして、この画像が文字画像と
されて、認識処理部4における上記と同様の処理が行わ
れる。以下、順に切出し候補位置a1,a2,b1,b
2の組合せによって分離された参照符号73〜77で示
す各画像を文字画像と仮定して上述の処理が行われ、各
画像に関する認識評価値が生成される。ただし、切出し
候補位置の組合せは、構成される画像の横幅が文字サイ
ズSIZEを超えない範囲で選択される。
【0031】このようにして、複数の切出し候補位置に
基づいて認識評価値が求められると、参照符号72,7
6の画像のように認識評価値が高い画像が選択される。
そして、高い認識評価指数が得られた画像に対応する切
出し候補位置b1,b2が、切出し位置として決定され
ることになる(ステップn6)。さらに、ステップn7
では、文字要素の数が、元の文字要素の数に分離した位
置の数を加えた値に更新される。
基づいて認識評価値が求められると、参照符号72,7
6の画像のように認識評価値が高い画像が選択される。
そして、高い認識評価指数が得られた画像に対応する切
出し候補位置b1,b2が、切出し位置として決定され
ることになる(ステップn6)。さらに、ステップn7
では、文字要素の数が、元の文字要素の数に分離した位
置の数を加えた値に更新される。
【0032】なお、切出し候補位置a1,a2;b1,
b2の各組は、文字サイズSIZEに基づいて設定して
いるのであるから、先ず図7の画像72についての認識
評価値に基づいて、切出し候補位置b1が切出し位置で
あるものと決定することとし、その後の画像に関する処
理を省いて、切出し候補位置a1,a2を無効とすると
ともに、切出し候補位置b2を切出し位置として確定さ
せるようにしてもよい。このようにすれば、処理が簡素
化できるから、文字切出し処理の一層の高速化に寄与す
ることができる。
b2の各組は、文字サイズSIZEに基づいて設定して
いるのであるから、先ず図7の画像72についての認識
評価値に基づいて、切出し候補位置b1が切出し位置で
あるものと決定することとし、その後の画像に関する処
理を省いて、切出し候補位置a1,a2を無効とすると
ともに、切出し候補位置b2を切出し位置として確定さ
せるようにしてもよい。このようにすれば、処理が簡素
化できるから、文字切出し処理の一層の高速化に寄与す
ることができる。
【0033】また、文字切出し処理の過程で文字認識処
理が行われた文字画像に関しては、認識処理が終了して
いることを表すフラグを付与しておき、切出し位置決定
後の各文字画像に関する認識処理では、当該文字の認識
処理を省くようにしてもよい。このようにすれば、認識
処理に要する時間を短縮できるのて、文字認識処理の高
速化が図られる。
理が行われた文字画像に関しては、認識処理が終了して
いることを表すフラグを付与しておき、切出し位置決定
後の各文字画像に関する認識処理では、当該文字の認識
処理を省くようにしてもよい。このようにすれば、認識
処理に要する時間を短縮できるのて、文字認識処理の高
速化が図られる。
【0034】以下では、図8を参照して、実際の処理の
流れについて概説する。文字要素E21,E22は、い
ずれも接触文字を含む接触文字要素して検出される。ま
ず、始めの接触文字要素E21は、行頭の文字要素であ
って、その直前に文字要素が存在しない。この場合に
は、接触文字要素E21の左端の切出し位置a11から
文字サイズSIZEの間隔を隔てて切出し位置a12が
設定される。ここで、接触文字要素E21の横幅W21
から文字サイズSIZEを減じた値 W21′=W21−SIZE が算出され、この値が、 W21′>SIZE であるかどうかが調べられる。図8の場合には、この条
件が満たされるので、切出し位置a12から文字サイズ
SIZEを隔てた位置に、切出し位置a13が設定され
る。そして、 W21″=W21′−SIZE=W21−2×SIZE が計算され、 W21″>SIZE かどうかが調べられる。図8の場合には、この条件は満
たされないから、この接触文字要素E21に対しては、
それ以上の切出し位置が設定されることはなく、接触文
字要素E22に対する処理に移る。この時点では切出し
位置a11,a12,a13が確定しているから、接触
文字要素E22の直前の文字要素は、接触文字要素E2
1の一部を構成する文字要素E21a(文字「能」の偏
の部分)となる。
流れについて概説する。文字要素E21,E22は、い
ずれも接触文字を含む接触文字要素して検出される。ま
ず、始めの接触文字要素E21は、行頭の文字要素であ
って、その直前に文字要素が存在しない。この場合に
は、接触文字要素E21の左端の切出し位置a11から
文字サイズSIZEの間隔を隔てて切出し位置a12が
設定される。ここで、接触文字要素E21の横幅W21
から文字サイズSIZEを減じた値 W21′=W21−SIZE が算出され、この値が、 W21′>SIZE であるかどうかが調べられる。図8の場合には、この条
件が満たされるので、切出し位置a12から文字サイズ
SIZEを隔てた位置に、切出し位置a13が設定され
る。そして、 W21″=W21′−SIZE=W21−2×SIZE が計算され、 W21″>SIZE かどうかが調べられる。図8の場合には、この条件は満
たされないから、この接触文字要素E21に対しては、
それ以上の切出し位置が設定されることはなく、接触文
字要素E22に対する処理に移る。この時点では切出し
位置a11,a12,a13が確定しているから、接触
文字要素E22の直前の文字要素は、接触文字要素E2
1の一部を構成する文字要素E21a(文字「能」の偏
の部分)となる。
【0035】この直前の文字要素E21aの横幅Wb
と、文字要素E21aと接触文字要素C22との間隔S
bとの和(Wb+Sb)は、文字サイズSIZEに満た
ない値となる。このため、接触文字要素E22の処理に
当たっては、切出し位置a13から文字サイズSIZE
だけ離間した位置の切出し候補位置a21と、接触文字
要素E22の左端から文字サイズSIZEの間隔の位置
の切出し候補位置b21とが設定される。そして、これ
らの切出し候補位置a21,b21に基づき、図9にお
いて参照符号91〜94で示す複数の評価画像が順に構
成され、各評価画像に関して認識評価値が求められる。
と、文字要素E21aと接触文字要素C22との間隔S
bとの和(Wb+Sb)は、文字サイズSIZEに満た
ない値となる。このため、接触文字要素E22の処理に
当たっては、切出し位置a13から文字サイズSIZE
だけ離間した位置の切出し候補位置a21と、接触文字
要素E22の左端から文字サイズSIZEの間隔の位置
の切出し候補位置b21とが設定される。そして、これ
らの切出し候補位置a21,b21に基づき、図9にお
いて参照符号91〜94で示す複数の評価画像が順に構
成され、各評価画像に関して認識評価値が求められる。
【0036】図9の場合には、切出し位置a13と、切
出し候補位置a21との組合せにより構成した参照符号
92で示す画像の認識評価値が0.92と高く、このた
め、切出し候補位置a21が接触文字要素E22を文字
画像ごとに分離するための切出し位置として決定され
る。そして、さらに切出し候補位置a21から文字サイ
ズSIZEずつ間隔を開けた位置a22,a23も切出
し位置として決定されることになる。位置a22から接
触文字要素E22の右端に至る長さは、文字サイズSI
ZE以下であるので、接触文字要素E22は、結局、位
置a21,a22,a23で文字画像ごとに切り出され
ることになる。
出し候補位置a21との組合せにより構成した参照符号
92で示す画像の認識評価値が0.92と高く、このた
め、切出し候補位置a21が接触文字要素E22を文字
画像ごとに分離するための切出し位置として決定され
る。そして、さらに切出し候補位置a21から文字サイ
ズSIZEずつ間隔を開けた位置a22,a23も切出
し位置として決定されることになる。位置a22から接
触文字要素E22の右端に至る長さは、文字サイズSI
ZE以下であるので、接触文字要素E22は、結局、位
置a21,a22,a23で文字画像ごとに切り出され
ることになる。
【0037】なお、切出し候補位置a21が切出し位置
として確定した時点で、その他の切出し位置a22,a
23を確定させることができるから、図9において参照
符号93,94で示す評価画像についての認識処理は、
実際には省かれることになる。以上のように本実施例に
よれば、文字サイズSIZEよりも長い文字要素を接触
文字要素として検出し、この接触文字要素に対しては、
文字サイズSIZEおよび直前の文字要素との位置関係
などに基づいて、複数の切出し候補位置を設定するよう
にしている。そして、各切出候補位置で切り出した画像
に対して、認識処理部4で認識処理を行わせ、認識評価
値が高い画像に対応した切出し候補位置を切出し位置と
決定して、接触文字を個々の文字に対応した文字画像ご
とに切り出すようにしている。
として確定した時点で、その他の切出し位置a22,a
23を確定させることができるから、図9において参照
符号93,94で示す評価画像についての認識処理は、
実際には省かれることになる。以上のように本実施例に
よれば、文字サイズSIZEよりも長い文字要素を接触
文字要素として検出し、この接触文字要素に対しては、
文字サイズSIZEおよび直前の文字要素との位置関係
などに基づいて、複数の切出し候補位置を設定するよう
にしている。そして、各切出候補位置で切り出した画像
に対して、認識処理部4で認識処理を行わせ、認識評価
値が高い画像に対応した切出し候補位置を切出し位置と
決定して、接触文字を個々の文字に対応した文字画像ご
とに切り出すようにしている。
【0038】このように本実施例では、上述の先行技術
のようにヒストグラム中に現れる黒画素の分布の極小値
に基づくのではなく、文字サイズなどに基づいて、接触
文字要素に対する切出し候補位置を設定しているので、
このような切出し候補位置は確実に設定することがで
き、また過度に多くの切出し候補位置が生じることがな
いという利点がある。しかも、接触文字では、切出し位
置が文字サイズごとに現れることを利用すれば、接触文
字要素についての少なくとも1つの切出し位置が確定す
れば、残余の切出し位置を決定できるから、簡単な処理
で高速に文字切出し処理を行わせることができるように
なる。
のようにヒストグラム中に現れる黒画素の分布の極小値
に基づくのではなく、文字サイズなどに基づいて、接触
文字要素に対する切出し候補位置を設定しているので、
このような切出し候補位置は確実に設定することがで
き、また過度に多くの切出し候補位置が生じることがな
いという利点がある。しかも、接触文字では、切出し位
置が文字サイズごとに現れることを利用すれば、接触文
字要素についての少なくとも1つの切出し位置が確定す
れば、残余の切出し位置を決定できるから、簡単な処理
で高速に文字切出し処理を行わせることができるように
なる。
【0039】また、文字切出しのために認識処理部4で
の認識処理を要するのであるが、文字切出し処理の過程
で認識された文字画像については、適当なフラグを設け
て区別し、再度の認識処理を省くこととすれば、切出し
位置決定後の認識処理を軽減できるから、結果として、
文字認識処理全体に要する時間を格段に短縮することが
できるという利点がある。
の認識処理を要するのであるが、文字切出し処理の過程
で認識された文字画像については、適当なフラグを設け
て区別し、再度の認識処理を省くこととすれば、切出し
位置決定後の認識処理を軽減できるから、結果として、
文字認識処理全体に要する時間を格段に短縮することが
できるという利点がある。
【0040】なお、本発明は上記の実施例に限定される
ものではない。たとえば、上記の実施例では、横書き文
書に適用される例について説明したが、本発明は縦書き
文書の文字認識に対しても容易に応用できる。すなわ
ち、縦方向に接触した文字要素を文字サイズごとに設定
した切出し候補位置で分離し、各分離された画像に対し
て文字認識処理を施せばよい。この場合に、たとえば
「京」のような縦方向に分離された分離文字の一部が接
触文字要素に属する場合でも、上述の図6などを用いて
説明した処理に準ずる処理によって、正確な切出し位置
を設定することができる。
ものではない。たとえば、上記の実施例では、横書き文
書に適用される例について説明したが、本発明は縦書き
文書の文字認識に対しても容易に応用できる。すなわ
ち、縦方向に接触した文字要素を文字サイズごとに設定
した切出し候補位置で分離し、各分離された画像に対し
て文字認識処理を施せばよい。この場合に、たとえば
「京」のような縦方向に分離された分離文字の一部が接
触文字要素に属する場合でも、上述の図6などを用いて
説明した処理に準ずる処理によって、正確な切出し位置
を設定することができる。
【0041】さらに、上記の実施例では、文字要素の大
きさや、行幅に基づいて文字サイズが求められる場合に
ついて説明したが、文字サイズは、たとえばキー入力装
置などにより操作者が入力する構成としてもよい。ま
た、上記の実施例では、白色などのような明度の高い背
景に、黒色などのような明度の低い文書画像が形成され
ている場合を想定しているが、本発明は、たとえば黒色
の背景に白色の文書画像が形成されている場合に対して
も容易に応用できるものである。すなわち、この場合に
は、白画素が文字を構成する画素であるものとして処理
を行えばよい。
きさや、行幅に基づいて文字サイズが求められる場合に
ついて説明したが、文字サイズは、たとえばキー入力装
置などにより操作者が入力する構成としてもよい。ま
た、上記の実施例では、白色などのような明度の高い背
景に、黒色などのような明度の低い文書画像が形成され
ている場合を想定しているが、本発明は、たとえば黒色
の背景に白色の文書画像が形成されている場合に対して
も容易に応用できるものである。すなわち、この場合に
は、白画素が文字を構成する画素であるものとして処理
を行えばよい。
【0042】さらに、上記の実施例では、イメージスキ
ャナにより文書画像が光学的に読み取られて取得される
構成について説明したが、本発明はたとえば通信回線を
介して文書画像に対応した画像データが取得される構成
に対しても容易に応用することができるものである。そ
の他、本発明の要旨を変更しない範囲で種々の設計変更
を施すことが可能である。
ャナにより文書画像が光学的に読み取られて取得される
構成について説明したが、本発明はたとえば通信回線を
介して文書画像に対応した画像データが取得される構成
に対しても容易に応用することができるものである。そ
の他、本発明の要旨を変更しない範囲で種々の設計変更
を施すことが可能である。
【0043】
【発明の効果】以上のように本発明の文字認識装置によ
れば、文書画像の投影をとることにより得られたヒスト
グラムにおける極小値に基づくのではなく、文字サイズ
と直前の文字要素との位置関係に基づいて、接触文字要
素についての切出し候補位置を設定するようにしてい
る。このため、切出し候補位置がむやみに増大すること
がなく、したがって、切出し位置を決定するために要す
る文字認識処理の回数を格段に低減できる。このように
して、文字切出し処理を簡素化することができるから、
文字認識処理の高速化に寄与することができる。
れば、文書画像の投影をとることにより得られたヒスト
グラムにおける極小値に基づくのではなく、文字サイズ
と直前の文字要素との位置関係に基づいて、接触文字要
素についての切出し候補位置を設定するようにしてい
る。このため、切出し候補位置がむやみに増大すること
がなく、したがって、切出し位置を決定するために要す
る文字認識処理の回数を格段に低減できる。このように
して、文字切出し処理を簡素化することができるから、
文字認識処理の高速化に寄与することができる。
【0044】さらには、文書画像の投影をとることによ
って得られたヒストグラムにおける極小値を用いていな
いので、このような極小値が存在しない接触文字要素に
対しても、適切に切出し位置を設定することができる。
したがって、切出し位置を正確に設定して、文字切出し
処理を正確に行わせることができる。また、接触文字要
素の切出し位置が少なくとも1つが確定したときに、こ
の切出し位置に基づいて残余の切出し位置を文字サイズ
ごとに設定するようにすれば、文字画像の切出しのため
の処理を一層簡素化して、文字認識処理のさらなる高速
化が図られる。
って得られたヒストグラムにおける極小値を用いていな
いので、このような極小値が存在しない接触文字要素に
対しても、適切に切出し位置を設定することができる。
したがって、切出し位置を正確に設定して、文字切出し
処理を正確に行わせることができる。また、接触文字要
素の切出し位置が少なくとも1つが確定したときに、こ
の切出し位置に基づいて残余の切出し位置を文字サイズ
ごとに設定するようにすれば、文字画像の切出しのため
の処理を一層簡素化して、文字認識処理のさらなる高速
化が図られる。
【図1】本発明の一実施例の文字認識装置である光学的
文字読取装置の基本的な構成を示すブロック図である。
文字読取装置の基本的な構成を示すブロック図である。
【図2】1行ごとの画像を切り出すための処理を説明す
るための図である。
るための図である。
【図3】文字要素を切り出すための処理を説明するため
の図である。
の図である。
【図4】接触文字要素の例を示す図である。
【図5】文字切出し処理を説明するためのフローチャー
トである。
トである。
【図6】接触文字要素の切出し位置を決定するための処
理を説明するための図である。
理を説明するための図である。
【図7】切出し候補位置で切り出した画像と、各画像に
対する認識評価値の例を示す図である。
対する認識評価値の例を示す図である。
【図8】接触文字要素の切出し位置を決定するための処
理を説明するための図である。
理を説明するための図である。
【図9】切出し候補位置で切出した画像と、各画像に対
応する認識評価値の例を示す図である。
応する認識評価値の例を示す図である。
【図10】従来技術において、文字切出し処理に問題を
生じる接触文字要素の例を示す図である。
生じる接触文字要素の例を示す図である。
2 イメージスキャナ 3 画像メモリ 4 認識処理部 5 認識用辞書 6 行切出し部 7 切出し情報記憶部 8 仮切出し部 9 文字サイズ推定部 10 接触文字検出部 11 接触文字分離部 12 評価画像作成部
Claims (2)
- 【請求項1】認識可能な文字の基本となる特徴量を記憶
した認識用辞書と、 文書画像から切り出された1文字ごとの文字画像から抽
出された特徴量と、上記認識用辞書に記憶された特徴量
とを照合して、最も類似する文字の文字コードを出力す
る認識処理手段とを有する文字認識装置において、 文書画像から文字を構成する画素の塊である文字要素を
切り出す仮切出し手段と、 所定の文字サイズに基づいて、上記切り出された文字要
素のうちで、接触する複数の文字の各構成部分を含む文
字要素である接触文字要素を検出する接触文字検出手段
と、 この接触文字検出手段により検出された接触文字要素を
文字ごとの文字画像に分離するための切出し候補位置
を、上記文字サイズおよび当該接触文字要素とその直前
の文字要素との位置関係に基づいて算出する接触文字分
離手段と、 この接触文字分離手段により算出された切出し候補位置
で分離して得た画像を上記認識処理手段に与える手段
と、 認識処理手段が出力する文字コードの類似度に対応した
認識評価値を算出する手段と、 この認識評価値が所定値以上であるときに、その画像に
対応した上記切出し候補位置を文字画像の切出しのため
の切出し位置として決定する手段とを含むことを特徴と
する文字認識装置。 - 【請求項2】接触文字要素を文字画像に分離するための
切出し位置が少なくとも1つ確定したときに、この切出
し位置から文字サイズごとの間隔で、文字画像を切り出
すための他の切出し位置を設定する手段をさらに含むこ
とを特徴とする請求項1記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3293209A JPH05128308A (ja) | 1991-11-08 | 1991-11-08 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3293209A JPH05128308A (ja) | 1991-11-08 | 1991-11-08 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05128308A true JPH05128308A (ja) | 1993-05-25 |
Family
ID=17791840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3293209A Pending JPH05128308A (ja) | 1991-11-08 | 1991-11-08 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05128308A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2154632A2 (en) | 2008-08-11 | 2010-02-17 | Omron Corporation | Character recognition device, program and method |
US9280725B2 (en) | 2013-02-14 | 2016-03-08 | Fuji Xerox Co., Ltd. | Information processing apparatus, information processing method, and non-transitory computer readable medium |
JP2021005315A (ja) * | 2019-06-27 | 2021-01-14 | キヤノン株式会社 | 情報処理装置、プログラム及び制御方法 |
-
1991
- 1991-11-08 JP JP3293209A patent/JPH05128308A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2154632A2 (en) | 2008-08-11 | 2010-02-17 | Omron Corporation | Character recognition device, program and method |
US9280725B2 (en) | 2013-02-14 | 2016-03-08 | Fuji Xerox Co., Ltd. | Information processing apparatus, information processing method, and non-transitory computer readable medium |
JP2021005315A (ja) * | 2019-06-27 | 2021-01-14 | キヤノン株式会社 | 情報処理装置、プログラム及び制御方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001283152A (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP4392907B2 (ja) | 文字切出し方法 | |
JPH05128308A (ja) | 文字認識装置 | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
US11501515B2 (en) | Apparatus, storage medium, and control method for removing a noise from a divided line image obtained by a character image | |
JPH0997309A (ja) | 文字抽出装置 | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
JP2630261B2 (ja) | 文字認識装置 | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
JPH01169686A (ja) | 文字行検出装置 | |
JP3412441B2 (ja) | 画像処理装置 | |
JP2795222B2 (ja) | 文字切り出し方法および文字切り出し装置 | |
JP4810995B2 (ja) | 画像処理装置、方法及びプログラム | |
JPH10154191A (ja) | 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体 | |
JPH09179982A (ja) | 特定パターン検出方法 | |
JP2778436B2 (ja) | 文字切り出し装置 | |
JP3600364B2 (ja) | 文字切り出し方法及び装置 | |
JP3919390B2 (ja) | 文字認識装置 | |
JPH05135204A (ja) | 文字認識装置 | |
JPH0259502B2 (ja) | ||
JP2813601B2 (ja) | 表形式文書認識装置 | |
JP2899356B2 (ja) | 文字認識装置 | |
JPH11232388A (ja) | 文書・帳票認識システム |