JP2778436B2 - 文字切り出し装置 - Google Patents
文字切り出し装置Info
- Publication number
- JP2778436B2 JP2778436B2 JP5329343A JP32934393A JP2778436B2 JP 2778436 B2 JP2778436 B2 JP 2778436B2 JP 5329343 A JP5329343 A JP 5329343A JP 32934393 A JP32934393 A JP 32934393A JP 2778436 B2 JP2778436 B2 JP 2778436B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- width
- pitch
- cutout position
- cutout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【0001】
【産業上の利用分野】本発明は、印刷文書画像に対する
文字切り出し装置に関するものである。
文字切り出し装置に関するものである。
【0002】
【従来の技術】文書中の文字を読み取るためには、紙面
上に印刷あるいは手書きされた文字を光学的あるいは他
の手段により走査し文字行イメージ領域を抽出した後、
各々の文字を正確に切り出す必要がある。
上に印刷あるいは手書きされた文字を光学的あるいは他
の手段により走査し文字行イメージ領域を抽出した後、
各々の文字を正確に切り出す必要がある。
【0003】従来、文字分離処理は、文字を構成する連
結画素を検出するか、あるいは文字ピッチは一定である
との仮定のもとで文字ピッチを推定し、その値でもって
強制的に切り出しを行うという手法が一般的であった。
しかしながら、連結画素の有無のみを判断材料とした場
合には文字が接触した場合に文字切り出しが正しく行え
なくなる。一方、推定文字ピッチのみを判断材料にする
と、文字に接触が存在した場合でも正しく文字分離が行
えるが、文字によって文字幅が大きく変動する場合には
正しく文字分離が行えなくなる。従来の活版印刷物で
は、文字ピッチが印刷手法の性質上安定していたため、
後者の手法が有効であった。しかしながら、近年の印刷
技術の進歩により文字ピッチが一定でない印刷物も見ら
れる。
結画素を検出するか、あるいは文字ピッチは一定である
との仮定のもとで文字ピッチを推定し、その値でもって
強制的に切り出しを行うという手法が一般的であった。
しかしながら、連結画素の有無のみを判断材料とした場
合には文字が接触した場合に文字切り出しが正しく行え
なくなる。一方、推定文字ピッチのみを判断材料にする
と、文字に接触が存在した場合でも正しく文字分離が行
えるが、文字によって文字幅が大きく変動する場合には
正しく文字分離が行えなくなる。従来の活版印刷物で
は、文字ピッチが印刷手法の性質上安定していたため、
後者の手法が有効であった。しかしながら、近年の印刷
技術の進歩により文字ピッチが一定でない印刷物も見ら
れる。
【0004】このような文書から個々の文字を切り出す
手法としては、特開昭51−5927公報に示されるよ
うに、あらかじめ該文字行に存在する文字数及び文字ピ
ッチは既知であるとし、その情報を用いて切り出し位置
の存在個所を推定し、しかる後に該文字行2値パターン
を参照して文字間の空隙を検出することにより最終的な
各文字間の分割ラインを検出する方法が提案されてい
る。しかしながら、この文字切り出し手法では、該文字
列の文字数が既知でなかったり、文字のピッチがばらつ
いている文字行に対しては、文字切り出し位置の存在個
所の推定が正しく行えない、また文字に接触が存在する
場合には文字の空隙を検出することが正しく行えない、
などの理由により正しく文字分離を行うことができない
場合が生じている。
手法としては、特開昭51−5927公報に示されるよ
うに、あらかじめ該文字行に存在する文字数及び文字ピ
ッチは既知であるとし、その情報を用いて切り出し位置
の存在個所を推定し、しかる後に該文字行2値パターン
を参照して文字間の空隙を検出することにより最終的な
各文字間の分割ラインを検出する方法が提案されてい
る。しかしながら、この文字切り出し手法では、該文字
列の文字数が既知でなかったり、文字のピッチがばらつ
いている文字行に対しては、文字切り出し位置の存在個
所の推定が正しく行えない、また文字に接触が存在する
場合には文字の空隙を検出することが正しく行えない、
などの理由により正しく文字分離を行うことができない
場合が生じている。
【0005】以上述べたように、従来技術は、基本的に
文字ピッチ及び文字空白を個別に検出して文字分離を行
う方式であるため、文字の接触が存在したり、あるいは
ピッチの異なる文字が混在すると文字切り出し精度が低
下するという問題を有していた。
文字ピッチ及び文字空白を個別に検出して文字分離を行
う方式であるため、文字の接触が存在したり、あるいは
ピッチの異なる文字が混在すると文字切り出し精度が低
下するという問題を有していた。
【0006】この他の手法として、宮原らは、電子情報
通信学会論文誌D−IIVol.J72−D−II,N
o.6,pp.846−854,1989年6月に掲載
された論文「部分パターンによる可変ピッチ文書から文
字切り出しと認識」において、最初に文字分離可能な個
所をすべて抽出し、各々の文字分離位置での組合せによ
って得られる文字切り出しパタンを生成し、その後に各
々の文字パタンに対して認識処理を施した結果の信頼度
を判断基準として、文字切り出し位置を決定する、とい
う手法を提案している。
通信学会論文誌D−IIVol.J72−D−II,N
o.6,pp.846−854,1989年6月に掲載
された論文「部分パターンによる可変ピッチ文書から文
字切り出しと認識」において、最初に文字分離可能な個
所をすべて抽出し、各々の文字分離位置での組合せによ
って得られる文字切り出しパタンを生成し、その後に各
々の文字パタンに対して認識処理を施した結果の信頼度
を判断基準として、文字切り出し位置を決定する、とい
う手法を提案している。
【0007】
【発明が解決しようとする課題】しかしながら、当該手
法では、生成される文字切り出しパタンの組合せ数が膨
大なものとなりがちであること、文字認識結果の信頼度
の評価尺度の決定が困難であること、及び文字認識処理
は前記特開昭51−5927号公報などに示される手法
と比べて、処理手数が大きなものとなること、という問
題点を有している。
法では、生成される文字切り出しパタンの組合せ数が膨
大なものとなりがちであること、文字認識結果の信頼度
の評価尺度の決定が困難であること、及び文字認識処理
は前記特開昭51−5927号公報などに示される手法
と比べて、処理手数が大きなものとなること、という問
題点を有している。
【0008】このように、特開昭51−5927号公報
の問題を回避できる手法として文字らしい個所はすべて
選び出し、各々の切り出しパタンに対して認識処理を行
い、その認識結果を信頼度から切り出し位置を決定する
方式も提案されてはいるが、これらの手法には文字認識
精度が文字切り出し結果に大きく影響すること、認識処
理は多くの処理量を要すること、などの新たな問題が存
在している。
の問題を回避できる手法として文字らしい個所はすべて
選び出し、各々の切り出しパタンに対して認識処理を行
い、その認識結果を信頼度から切り出し位置を決定する
方式も提案されてはいるが、これらの手法には文字認識
精度が文字切り出し結果に大きく影響すること、認識処
理は多くの処理量を要すること、などの新たな問題が存
在している。
【0009】本発明の目的は、これらの課題を解決する
ために、対象文書中に複数の文字ピッチが存在するこ
と、及び文字の接触が存在することを想定し、複数の文
字幅からなる文字が混在した文字行に対して精度良く文
字切り出しを行う装置を提案することにある。
ために、対象文書中に複数の文字ピッチが存在するこ
と、及び文字の接触が存在することを想定し、複数の文
字幅からなる文字が混在した文字行に対して精度良く文
字切り出しを行う装置を提案することにある。
【0010】
【課題を解決するための手段】上述した問題点を解決す
るために、本発明の文字切り出し装置は文書画像中の文
字列部分の画像データを入力し、該文字列を構成する個
々の文字を切り出す文字切り出し装置において、文字列
画像データから射影パタンを算出し出力する、射影算出
手段と、前記文字列画像データ及び前記射影パタンから
半角文字に相当する文字ピッチを推定し半角文字ピッチ
として出力する、半角文字ピッチ推定手段と、前記文字
列画像データ及び前記射影パタンから全角文字に相当す
る文字ピッチを推定し全角文字ピッチとして出力する、
全角文字ピッチ推定手段と、前記射影パタンの谷間を検
出することにより、第1の文字切り出し位置候補を抽出
する、第1の文字切り出し位置候補変更手段と、前記第
1の文字切り出し位置候補、前記半角文字ピッチ及び前
記全角文字ピッチを参照し、第1の文字切り出し位置候
補から前記半角文字ピッチ、または前記全角文字ピッチ
分だけ離れた位置を新たに文字切り出し位置候補として
追加し、第2の文字切り出し位置候補として出力する、
第2の文字切り出し位置候補変更手段と、前記第2の文
字切り出し位置候補を参照し、各々の文字切り出し位置
候補に対して、隣接する文字切り出し位置候補間の距離
が所定のいき値よりも大きい個所がなくなるまで、当該
文字切り出し位置との距離が前記半角文字ピッチまたは
前記全角文字ピッチに一致する位置を新たに文字切り出
し位置候補として追加し、第3の文字切り出し位置候補
として出力する、第3の文字切り出し位置候補変更手段
と、前記第3の文字切り出し位置候補から任意の組合せ
の文字切り出し位置を抽出し、各々の隣接する文字切り
出し位置に対して、隣接する文字切り出し位置候補の距
離と前記全角文字ピッチとの差と、隣接する文字切り出
し位置候補間の距離と前記半角文字ピッチとの差、のう
ち大きくない方の値と、文字切り出し位置での射影パタ
ンの高さ、の2つを重み付け加算して各文字切り出し位
置間の評価値を求め、前記評価値の総和が最も小さくな
る場合の文字切り出し位置の組合せを、切り出し位置と
決定し出力する、文字切り出し位置決定手段と、を具備
する。
るために、本発明の文字切り出し装置は文書画像中の文
字列部分の画像データを入力し、該文字列を構成する個
々の文字を切り出す文字切り出し装置において、文字列
画像データから射影パタンを算出し出力する、射影算出
手段と、前記文字列画像データ及び前記射影パタンから
半角文字に相当する文字ピッチを推定し半角文字ピッチ
として出力する、半角文字ピッチ推定手段と、前記文字
列画像データ及び前記射影パタンから全角文字に相当す
る文字ピッチを推定し全角文字ピッチとして出力する、
全角文字ピッチ推定手段と、前記射影パタンの谷間を検
出することにより、第1の文字切り出し位置候補を抽出
する、第1の文字切り出し位置候補変更手段と、前記第
1の文字切り出し位置候補、前記半角文字ピッチ及び前
記全角文字ピッチを参照し、第1の文字切り出し位置候
補から前記半角文字ピッチ、または前記全角文字ピッチ
分だけ離れた位置を新たに文字切り出し位置候補として
追加し、第2の文字切り出し位置候補として出力する、
第2の文字切り出し位置候補変更手段と、前記第2の文
字切り出し位置候補を参照し、各々の文字切り出し位置
候補に対して、隣接する文字切り出し位置候補間の距離
が所定のいき値よりも大きい個所がなくなるまで、当該
文字切り出し位置との距離が前記半角文字ピッチまたは
前記全角文字ピッチに一致する位置を新たに文字切り出
し位置候補として追加し、第3の文字切り出し位置候補
として出力する、第3の文字切り出し位置候補変更手段
と、前記第3の文字切り出し位置候補から任意の組合せ
の文字切り出し位置を抽出し、各々の隣接する文字切り
出し位置に対して、隣接する文字切り出し位置候補の距
離と前記全角文字ピッチとの差と、隣接する文字切り出
し位置候補間の距離と前記半角文字ピッチとの差、のう
ち大きくない方の値と、文字切り出し位置での射影パタ
ンの高さ、の2つを重み付け加算して各文字切り出し位
置間の評価値を求め、前記評価値の総和が最も小さくな
る場合の文字切り出し位置の組合せを、切り出し位置と
決定し出力する、文字切り出し位置決定手段と、を具備
する。
【0011】
【実施例】以下に本願発明の一実施例について図面を参
照しながら説明する。
照しながら説明する。
【0012】図1は、本発明の一実施例を示したブロッ
ク図である。
ク図である。
【0013】図1において、1は射影算出手段であり、
文字行画像を読み込み、行方向と垂直な方向に黒画素数
を積算することにより、射影パタンを求めるものであ
る。2は半角ピッチ推定手段であり、前記画像データ及
び射影算出手段1から得られる射影パタンを参照して射
影塊の幅を求め、半角文字に相当する文字ピッチを推定
する。3は全角ピッチ推定手段であり、前記画像データ
及び射影算出部1から得られる射影パタンを参照して射
影塊の幅を求め、全角文字に相当する文字ピッチを推定
する。4は第1の文字切り出し位置候補変更手段であ
り、前記射影算出部1から得られる射影パタンを参照
し、射影パタンの谷間を検出することにより第1の文字
切り出し位置候補を生成する。5は第2の文字切り出し
位置候補変更手段であり、前記第1の文字切り出し位置
候補、前記半角文字ピッチ及び前記全角文字ピッチを参
照し、第1の文字切り出し位置候補との距離が前記半角
文字ピッチまたは前記全角文字ピッチに一致する位置を
新たに文字切り出し位置候補として追加し、第2の文字
切り出し位置候補として出力する。6は第3の文字切り
出し位置候補変更手段であり、前記第2の文字切り出し
位置候補を参照し、隣接する文字切り出し位置候補間の
距離が所定のいき値より大きい個所がなくなるまで、当
該文字切り出し位置との距離が前記半角文字ピッチまた
は前記全角文字ピッチに一致する位置を新たに文字切り
出し位置候補として追加し、第3の文字切り出し位置候
補として出力する。7は文字切り出し位置決定手段であ
り、前記第3の文字切り出し位置候補から任意の組合せ
の文字切り出し位置を抽出し、各々の隣接する文字切り
出し位置に対して、隣接する文字切り出し位置候補間の
距離と前記全角文字ピッチとの差と、隣接する文字切り
出し位置候補間の距離と前記半角文字ピッチとの差、の
うち大きくない方の値と、文字切り出し位置での射影パ
タンの高さ、の2つを重み付け加算し、加算した値を集
計することによって得られた値が最も小さくなる場合の
文字切り出し位置の組合せを、最終的に文字切り出し位
置と決定する。
文字行画像を読み込み、行方向と垂直な方向に黒画素数
を積算することにより、射影パタンを求めるものであ
る。2は半角ピッチ推定手段であり、前記画像データ及
び射影算出手段1から得られる射影パタンを参照して射
影塊の幅を求め、半角文字に相当する文字ピッチを推定
する。3は全角ピッチ推定手段であり、前記画像データ
及び射影算出部1から得られる射影パタンを参照して射
影塊の幅を求め、全角文字に相当する文字ピッチを推定
する。4は第1の文字切り出し位置候補変更手段であ
り、前記射影算出部1から得られる射影パタンを参照
し、射影パタンの谷間を検出することにより第1の文字
切り出し位置候補を生成する。5は第2の文字切り出し
位置候補変更手段であり、前記第1の文字切り出し位置
候補、前記半角文字ピッチ及び前記全角文字ピッチを参
照し、第1の文字切り出し位置候補との距離が前記半角
文字ピッチまたは前記全角文字ピッチに一致する位置を
新たに文字切り出し位置候補として追加し、第2の文字
切り出し位置候補として出力する。6は第3の文字切り
出し位置候補変更手段であり、前記第2の文字切り出し
位置候補を参照し、隣接する文字切り出し位置候補間の
距離が所定のいき値より大きい個所がなくなるまで、当
該文字切り出し位置との距離が前記半角文字ピッチまた
は前記全角文字ピッチに一致する位置を新たに文字切り
出し位置候補として追加し、第3の文字切り出し位置候
補として出力する。7は文字切り出し位置決定手段であ
り、前記第3の文字切り出し位置候補から任意の組合せ
の文字切り出し位置を抽出し、各々の隣接する文字切り
出し位置に対して、隣接する文字切り出し位置候補間の
距離と前記全角文字ピッチとの差と、隣接する文字切り
出し位置候補間の距離と前記半角文字ピッチとの差、の
うち大きくない方の値と、文字切り出し位置での射影パ
タンの高さ、の2つを重み付け加算し、加算した値を集
計することによって得られた値が最も小さくなる場合の
文字切り出し位置の組合せを、最終的に文字切り出し位
置と決定する。
【0014】以下、それぞれの手段について説明する。
処理内容の説明を簡単にするため、行方向は下辺と水平
な方向であるとする。行方向が下辺と垂直な方向と垂直
な方向である場合は、以下の水平方向と垂直方向をそれ
ぞれ入れ替えて読み替えることによって同様に行える。
処理内容の説明を簡単にするため、行方向は下辺と水平
な方向であるとする。行方向が下辺と垂直な方向と垂直
な方向である場合は、以下の水平方向と垂直方向をそれ
ぞれ入れ替えて読み替えることによって同様に行える。
【0015】射影算出手段1は、光学的画像取り込み装
置、その他の画像取り込み装置によってビットイメージ
形式で取り込まれた文字行画像を、画像取り込み装置あ
るいは磁気ディスクその他の画像格納装置から読み込
む。次に、読み込まれたビットイメージを走査線ごとに
走査し黒画素を検出する。各々の走査線ごとに検出され
た黒画素の数を積算し射影パタンを所定の記憶装置に格
納する。以上の処理によって射影パタンを求める。
置、その他の画像取り込み装置によってビットイメージ
形式で取り込まれた文字行画像を、画像取り込み装置あ
るいは磁気ディスクその他の画像格納装置から読み込
む。次に、読み込まれたビットイメージを走査線ごとに
走査し黒画素を検出する。各々の走査線ごとに検出され
た黒画素の数を積算し射影パタンを所定の記憶装置に格
納する。以上の処理によって射影パタンを求める。
【0016】半角文字ピッチ推定手段2は、当該文字行
に存在する半角文字のピッチを推定するものである。こ
こでは、半角文字の場合は文字の幅は文字の高さの半分
に近い値を取るという性質を利用して半角文字のピッチ
を算出する。具体的な実施例は、まず当該文字行の高さ
を求める。これは前記射影算出手段1によって得られる
射影パタンを参照し、射影が存在する連続領域の幅を測
定する。当該文字行の傾きが十分小さければこの幅の値
でもって文字の高さとすることができる。このようにし
て得られた文字の高さを2で除算することにより、半角
文字ピッチを推定することができる。
に存在する半角文字のピッチを推定するものである。こ
こでは、半角文字の場合は文字の幅は文字の高さの半分
に近い値を取るという性質を利用して半角文字のピッチ
を算出する。具体的な実施例は、まず当該文字行の高さ
を求める。これは前記射影算出手段1によって得られる
射影パタンを参照し、射影が存在する連続領域の幅を測
定する。当該文字行の傾きが十分小さければこの幅の値
でもって文字の高さとすることができる。このようにし
て得られた文字の高さを2で除算することにより、半角
文字ピッチを推定することができる。
【0017】さらに別の実施例として、前記ビットイメ
ージ形式で格納された画素を参照し、各々の黒画素の連
結成分をラベリング処理あるいは輪郭追跡処理によって
求め、黒画素連結成分の外接矩形を求める。この処理を
個々の黒画素連結成分ごとに行う。当該文字行は1行で
あるので、こうして得られた黒画素の連結成分の高さの
うち最も大きな値でもって文字の高さと定義することが
可能である。また、当該文字行にノイズなどが存在する
場合を想定する場合は、前記黒画素連結成分の高さのう
ち、最も頻度の多い高さでもって文字の高さと定義する
ことも可能である。
ージ形式で格納された画素を参照し、各々の黒画素の連
結成分をラベリング処理あるいは輪郭追跡処理によって
求め、黒画素連結成分の外接矩形を求める。この処理を
個々の黒画素連結成分ごとに行う。当該文字行は1行で
あるので、こうして得られた黒画素の連結成分の高さの
うち最も大きな値でもって文字の高さと定義することが
可能である。また、当該文字行にノイズなどが存在する
場合を想定する場合は、前記黒画素連結成分の高さのう
ち、最も頻度の多い高さでもって文字の高さと定義する
ことも可能である。
【0018】以上の手法を、必要ならば併用することに
より、当該文字行画像の高さを測定し、その半分の値を
以て半角文字ピッチとして出力する。
より、当該文字行画像の高さを測定し、その半分の値を
以て半角文字ピッチとして出力する。
【0019】全角文字ピッチ推定手段3は、前記半角文
字ピッチ推定手段2と同様の手順によって実現すること
ができる。前記半角文字ピッチ推定手段2との相違点
は、文字の高さの値を半分にする処理が不用である点で
ある。
字ピッチ推定手段2と同様の手順によって実現すること
ができる。前記半角文字ピッチ推定手段2との相違点
は、文字の高さの値を半分にする処理が不用である点で
ある。
【0020】以下の処理要素は、本願発明におけるポイ
ントである。
ントである。
【0021】第1の文字切り出し位置候補変更手段4
は、文字の空白位置を検出し、検出された空白位置を基
準にした文字切り出し位置候補を抽出する。具体的な実
施例を以下に記す。
は、文字の空白位置を検出し、検出された空白位置を基
準にした文字切り出し位置候補を抽出する。具体的な実
施例を以下に記す。
【0022】前記射影算出手段1によって得られた射影
パタンを走査し、射影の積算値が0である連続領域を抽
出する。これが空白位置を示す。当該文字にノイズなど
が存在する場合を想定する場合は、射影の積算値が0で
ある連続領域に替えて、射影の積算値があるいき値以下
の連続領域を抽出する、として実現することもできる。
パタンを走査し、射影の積算値が0である連続領域を抽
出する。これが空白位置を示す。当該文字にノイズなど
が存在する場合を想定する場合は、射影の積算値が0で
ある連続領域に替えて、射影の積算値があるいき値以下
の連続領域を抽出する、として実現することもできる。
【0023】このようにして得られた空白位置を基準と
して、文字切り出し位置候補を抽出し文字切り出し位置
候補を格納する装置に記録し内容を変更する。ここで記
録する位置は、文字の文字枠中の割り付け形態を考慮し
て、空白領域の左端、右端、及び中点の3個所を第1の
文字切り出し位置候補として選び出している。文字の文
字枠中の割り付け位置にバリエーションがあるのであれ
ば、それらの位置をさらに追加することも可能である。
して、文字切り出し位置候補を抽出し文字切り出し位置
候補を格納する装置に記録し内容を変更する。ここで記
録する位置は、文字の文字枠中の割り付け形態を考慮し
て、空白領域の左端、右端、及び中点の3個所を第1の
文字切り出し位置候補として選び出している。文字の文
字枠中の割り付け位置にバリエーションがあるのであれ
ば、それらの位置をさらに追加することも可能である。
【0024】第2の文字切り出し位置候補変更手段5
は、文字の接触、及び文字幅の変動を考慮して、文字切
り出し候補位置を追加する。具体的実施例を以下に記
す。前記第1の文字切り出し位置候補、前記半角文字ピ
ッチ及び前記全角文字ピッチを参照する。前記第1の文
字切り出し位置候補から前記全角文字ピッチだけ離れた
位置と前記半角文字ピッチだけ離れた位置を数値計算に
より算出し、その位置を新たな文字切り出し位置候補と
して追加し、第2の文字切り出し位置候補として出力す
る。この処理では射影の積算値は考慮しない。
は、文字の接触、及び文字幅の変動を考慮して、文字切
り出し候補位置を追加する。具体的実施例を以下に記
す。前記第1の文字切り出し位置候補、前記半角文字ピ
ッチ及び前記全角文字ピッチを参照する。前記第1の文
字切り出し位置候補から前記全角文字ピッチだけ離れた
位置と前記半角文字ピッチだけ離れた位置を数値計算に
より算出し、その位置を新たな文字切り出し位置候補と
して追加し、第2の文字切り出し位置候補として出力す
る。この処理では射影の積算値は考慮しない。
【0025】第3の文字切り出し位置候補変更手段6
は、連続して多くの文字が接触している場合を想定し
て、このような個所での文字切り出し位置を検出する。
具体的実施例を以下に記す。前記第2の文字切り出し位
置候補を参照し、すべての隣接する切り出し位置候補に
対して、隣接する切り出し位置の間隔を計算する。この
距離値が所定のいき値よりも大きい場合には、多くの文
字が接触していると判断し、隣接する切り出し位置の間
に、切り出し位置から前記半角ピッチだけ離れた位置、
及び前記切り出し位置から前記全角ピッチだけ離れた位
置を新たに文字切り出し位置候補として追加し、第3の
文字切り出し位置候補として出力する。この切り出し位
置追加処理は前記第2の文字切り出し位置候補変更手段
の処理と同じ手順で実現できる。前記第2の文字切り出
し位置候補変更手段との相違点は、この処理は任意の隣
接する切り出し位置の間隔がすべていき値以内になるま
で繰り返し行われるところにある。この繰り返し処理の
制御方法の実施例としては、プログラム可能なマイクロ
プロセッサに上記の条件処理を行うような処理プログラ
ムを格納して実行する、などの手法により容易に実現で
きる。
は、連続して多くの文字が接触している場合を想定し
て、このような個所での文字切り出し位置を検出する。
具体的実施例を以下に記す。前記第2の文字切り出し位
置候補を参照し、すべての隣接する切り出し位置候補に
対して、隣接する切り出し位置の間隔を計算する。この
距離値が所定のいき値よりも大きい場合には、多くの文
字が接触していると判断し、隣接する切り出し位置の間
に、切り出し位置から前記半角ピッチだけ離れた位置、
及び前記切り出し位置から前記全角ピッチだけ離れた位
置を新たに文字切り出し位置候補として追加し、第3の
文字切り出し位置候補として出力する。この切り出し位
置追加処理は前記第2の文字切り出し位置候補変更手段
の処理と同じ手順で実現できる。前記第2の文字切り出
し位置候補変更手段との相違点は、この処理は任意の隣
接する切り出し位置の間隔がすべていき値以内になるま
で繰り返し行われるところにある。この繰り返し処理の
制御方法の実施例としては、プログラム可能なマイクロ
プロセッサに上記の条件処理を行うような処理プログラ
ムを格納して実行する、などの手法により容易に実現で
きる。
【0026】文字切り出し位置決定手段7は、前記第3
の文字切り出し位置候補から、文字ピッチの推定値と文
字要素を表す連結画素の有無を判断材料として、最終的
に文字切り出し位置を決定する。
の文字切り出し位置候補から、文字ピッチの推定値と文
字要素を表す連結画素の有無を判断材料として、最終的
に文字切り出し位置を決定する。
【0027】今、前記第3の文字切り出し位置候補変更
手段6によって得られた文字切り出し位置候補の数がn
であるとする。各々の切り出し位置候補に対してその切
り出し位置候補を選択するか選択しないかの選択が考え
られるので、可能な切り出し位置の組合せの総数2n に
なる。原理的にはこれらすべての組合せを評価して最適
な切り出し位置を決定する。
手段6によって得られた文字切り出し位置候補の数がn
であるとする。各々の切り出し位置候補に対してその切
り出し位置候補を選択するか選択しないかの選択が考え
られるので、可能な切り出し位置の組合せの総数2n に
なる。原理的にはこれらすべての組合せを評価して最適
な切り出し位置を決定する。
【0028】しかしながら、前記の処理では組合せ数が
膨大なものとなり実用に乏しいことは明らかである。こ
の問題点を解決する実施例として、漸化式を用いて評価
する組合せ数を低減する実施例が考えられる。この方式
はDPマッチングと呼ばれる手法であり、評価すべき組
合せ数をnのオーダーに低減することが可能である。
膨大なものとなり実用に乏しいことは明らかである。こ
の問題点を解決する実施例として、漸化式を用いて評価
する組合せ数を低減する実施例が考えられる。この方式
はDPマッチングと呼ばれる手法であり、評価すべき組
合せ数をnのオーダーに低減することが可能である。
【0029】文字切り出し処理にDPマッチングを適用
するために、課題を次の様な数式で表現する。
するために、課題を次の様な数式で表現する。
【0030】文字切り出し処理は文字切り出し位置 を
文字切り出し位置候補へ対応づける操作とみなすことが
できる。ここで、前記文字切り出し位置を直接対応づけ
るかわりに、文字の幅を対応づけても同じ処理を実現で
きる。そこで以下は文字の幅を対応づける処理手法とし
てDPマッチングを行うことを考える。
文字切り出し位置候補へ対応づける操作とみなすことが
できる。ここで、前記文字切り出し位置を直接対応づけ
るかわりに、文字の幅を対応づけても同じ処理を実現で
きる。そこで以下は文字の幅を対応づける処理手法とし
てDPマッチングを行うことを考える。
【0031】文字切り出し位置の始点(すなわち左端)
を0番目とし順に文字切り出し位置を割り付け、j番目
の文字切り出し位置を決定した時の、j番目に切り出さ
れた文字の幅(j番目の文字切り出し位置−(j−1)
番目の文字切り出し位置)をdj ,j=1,2,…と
する。するとこの問題はある長さの文字行を幾つかに分
割し文字に割り付けて行く処理と見做すことができる。
行中の文字数はこの段階では不明であるが、最大でも文
字切り出し位置候補の総数(上の例ではn)まで考慮す
ればよい。
を0番目とし順に文字切り出し位置を割り付け、j番目
の文字切り出し位置を決定した時の、j番目に切り出さ
れた文字の幅(j番目の文字切り出し位置−(j−1)
番目の文字切り出し位置)をdj ,j=1,2,…と
する。するとこの問題はある長さの文字行を幾つかに分
割し文字に割り付けて行く処理と見做すことができる。
行中の文字数はこの段階では不明であるが、最大でも文
字切り出し位置候補の総数(上の例ではn)まで考慮す
ればよい。
【0032】対応づけを行う上で、切り出された文字の
確からしさを表す尺度が必要である。この評価関数をf
とする。評価関数fの値が大きいほど、切り出されたパ
タンが文字である信頼性が高いとしておく。
確からしさを表す尺度が必要である。この評価関数をf
とする。評価関数fの値が大きいほど、切り出されたパ
タンが文字である信頼性が高いとしておく。
【0033】
【0034】するとこの問題は、次の目的関数を最適に
するdj を決定する問題に帰着する。
するdj を決定する問題に帰着する。
【0035】 (切り出された文字数) 目的関数: F(n)=Σf(切り出された文字) … (1) j=1 (切り出された文字数) 制約関数: Σdj=const … (2) j=1
【0036】そして、最適解はこの評価関数を最大にす
ることにより得られる。ここで、DPマッチングの考え
方に基づき、以下のような漸化式を考える。
ることにより得られる。ここで、DPマッチングの考え
方に基づき、以下のような漸化式を考える。
【0037】k=0 → F(k)=0 k≧1 → F(k)=max{F(k-m)+ f(x k とx k-m を両端として切り出された文字))|m=1,
…,DPRANGE}… (4) x k は文字切り出し位置候補を表す。 DPRANGEは探索幅で
あり、1からnの間の任意の固定値とする
…,DPRANGE}… (4) x k は文字切り出し位置候補を表す。 DPRANGEは探索幅で
あり、1からnの間の任意の固定値とする
【0038】上記の漸化式をk=0から順にk=nまで
解いていくことにより、k=nに達した時点で目的関数
を最大とすることができる。最終的な文字の切り出し位
置は、逆にnから0まで辿っていくことにより求められ
る。すなわち、k=nを始点とし、F(k-m)+f(x k と
x k-m を両端として切り出された文字)を最大にするm
を選びながら、順次kをk−mで置き換えていく。かか
る過程で得られるx k が最終的な文字の切り出し位置と
なる。
解いていくことにより、k=nに達した時点で目的関数
を最大とすることができる。最終的な文字の切り出し位
置は、逆にnから0まで辿っていくことにより求められ
る。すなわち、k=nを始点とし、F(k-m)+f(x k と
x k-m を両端として切り出された文字)を最大にするm
を選びながら、順次kをk−mで置き換えていく。かか
る過程で得られるx k が最終的な文字の切り出し位置と
なる。
【0039】評価関数fには色々な例が考えられるが、
実施例では一例として、切り出された文字の確からしさ
は、文字切り出し位置での画素の有無と、文字のの幅、
をパラメタとした関数で定義する。すると、j番目に切
り出された文字の確からしさを表す評価値fは次のよう
に表現される。
実施例では一例として、切り出された文字の確からしさ
は、文字切り出し位置での画素の有無と、文字のの幅、
をパラメタとした関数で定義する。すると、j番目に切
り出された文字の確からしさを表す評価値fは次のよう
に表現される。
【0040】f(j番目に切り出された文字) =f(W(j番目に切り出された文字の幅)、 H(j番目に切り出された文字の切り出し位置での画素
の有無))…(5)
の有無))…(5)
【0041】但し、Wは切り出された文字の幅から得ら
れる評価関数を、Hは切り出された文字の切り出し位置
での画素の有無から得られる評価関数を表す。切り出さ
れた文字の幅から得られる評価関数の例としては、標準
的な文字幅との差の絶対値を用いる例を挙げることがで
きる。切り出された文字の切り出し位置での画素の有無
から得られる評価関数の例としては、文字切り出し位置
の射影パタンの絶対値、あるいは射影パタンの高さとい
き値との大小関係、などの関数を例として挙げることが
できる。
れる評価関数を、Hは切り出された文字の切り出し位置
での画素の有無から得られる評価関数を表す。切り出さ
れた文字の幅から得られる評価関数の例としては、標準
的な文字幅との差の絶対値を用いる例を挙げることがで
きる。切り出された文字の切り出し位置での画素の有無
から得られる評価関数の例としては、文字切り出し位置
の射影パタンの絶対値、あるいは射影パタンの高さとい
き値との大小関係、などの関数を例として挙げることが
できる。
【0042】評価値を算出するためのパラメタにはこの
他に文字の類似度や矩形の正方度、文字認識の結果得ら
れる信頼度などのパラメタを用いることも可能である。
また、前記文字切り出し位置評価値算出式には重み付け
を行ったり、あるいは非線形な計算式を用いることが可
能である。
他に文字の類似度や矩形の正方度、文字認識の結果得ら
れる信頼度などのパラメタを用いることも可能である。
また、前記文字切り出し位置評価値算出式には重み付け
を行ったり、あるいは非線形な計算式を用いることが可
能である。
【0043】
【発明の効果】本発明による文字切り出し装置を用いる
ことにより、文字の空隙位置から文字切り出し位置を抽
出する第1の文字切り出し位置候補の追加手段、文字ピ
ッチに変動がある場合、また少数の文字同志が接触して
いる場合に備えて文字切り出し位置の候補を抽出する第
2の文字切り出し位置候補の追加手段、複数の文字が連
続して接触している個所に対する文字切り出し位置を求
める第3の文字切り出し位置候補の追加手段、及びこれ
らの文字切り出し位置追加手段によって得られた文字切
り出し位置候補から最終的に文字切り出し位置を決定す
る文字切り出し位置決定手段、を設けることにより、文
字列中に接触している文字が存在したり、複数の文字ピ
ッチからなる文字列が存在していたりする場合にも個々
の文字を正しくかつ効率良く切り出すことができる。具
体的には、複数の文字幅からなる文字、例えば全角文字
や半角文字、あるいは日本語以外の言語が混在した文字
行、に対して精度良く切り出しを行うことが可能とな
る。
ことにより、文字の空隙位置から文字切り出し位置を抽
出する第1の文字切り出し位置候補の追加手段、文字ピ
ッチに変動がある場合、また少数の文字同志が接触して
いる場合に備えて文字切り出し位置の候補を抽出する第
2の文字切り出し位置候補の追加手段、複数の文字が連
続して接触している個所に対する文字切り出し位置を求
める第3の文字切り出し位置候補の追加手段、及びこれ
らの文字切り出し位置追加手段によって得られた文字切
り出し位置候補から最終的に文字切り出し位置を決定す
る文字切り出し位置決定手段、を設けることにより、文
字列中に接触している文字が存在したり、複数の文字ピ
ッチからなる文字列が存在していたりする場合にも個々
の文字を正しくかつ効率良く切り出すことができる。具
体的には、複数の文字幅からなる文字、例えば全角文字
や半角文字、あるいは日本語以外の言語が混在した文字
行、に対して精度良く切り出しを行うことが可能とな
る。
【図1】本発明の一実施例を示したブロック図である。
【図2】第1の文字切り出し位置候補の抽出方法を説明
するための図である。
するための図である。
【図3】第2の文字切り出し位置候補の抽出方法を説明
するための図である。
するための図である。
【図4】第3の文字切り出し位置候補の抽出方法を説明
するための図である。
するための図である。
1 射影算出手段 2 半角文字ピッチ推定手段 3 全角文字ピッチ推定手段 4 第1の文字切り出し位置候補変更手段 5 第2の文字切り出し位置候補変更手段 6 第3の文字切り出し位置候補変更手段 7 文字切り出し位置決定手段
Claims (1)
- 【請求項1】 文書画像中の文字列部分の画像データを
入力し、該文字列を構成する個々の文字を切り出す文字
切り出し装置において、 文字列画像データから射影パタンを算出し出力する、射
影算出手段と、前記文字列画像データ及び前記射影パタ
ンから半角文字に相当する文字ピッチを推定し半角文字
ピッチとして出力する、半角文字ピッチ推定手段と、 前記文字列画像データ及び前記射影パタンから全角文字
に相当する文字ピッチを推定し全角文字ピッチとして出
力する、全角文字ピッチ推定手段と、 前記射影パタンの谷間を検出することにより、第1の文
字切り出し位置候補を抽出する、第1の文字切り出し位
置候補変更手段と、 前記第1の文字切り出し位置候補、前記半角文字ピッチ
及び前記全角文字ピッチを参照し、第1の文字切り出し
位置候補から前記半角文字ピッチ、または前記全角文字
ピッチ分だけ離れた位置を新たに文字切り出し位置候補
として追加し、第2の文字切り出し位置候補として出力
する、第2の文字切り出し位置候補変更手段と、 前記第2の文字切り出し位置候補を参照し、各々の文字
切り出し位置候補に対して、隣接する文字切り出し位置
候補間の距離が所定のいき値よりも大きい個所がなくな
るまで、当該文字切り出し位置との距離が前記半角文字
ピッチまたは前記全角文字ピッチに一致する位置を新た
に文字切り出し位置候補として追加し、第3の文字切り
出し位置候補として出力する、第3の文字切り出し位置
候補変更手段と、 前記第3の文字切り出し位置候補から任意の組合せの文
字切り出し位置を抽出し、各々の隣接する文字切り出し
位置に対して、隣接する文字切り出し位置候補の距離と
前記全角文字ピッチとの差と、隣接する文字切り出し位
置候補間の距離と前記半角文字ピッチとの差、のうち大
きくない方の値と、文字切り出し位置での射影パタンの
高さ、の2つを重み付け加算して各文字切り出し位置間
の評価値を求め、前記評価値の総和が最も小さくなる場
合の文字切り出し位置の組合せを、切り出し位置と決定
し出力する、文字切り出し位置決定手段と、 を具備することを特徴とする文字切り出し装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5329343A JP2778436B2 (ja) | 1993-12-27 | 1993-12-27 | 文字切り出し装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5329343A JP2778436B2 (ja) | 1993-12-27 | 1993-12-27 | 文字切り出し装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07192089A JPH07192089A (ja) | 1995-07-28 |
JP2778436B2 true JP2778436B2 (ja) | 1998-07-23 |
Family
ID=18220398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5329343A Expired - Fee Related JP2778436B2 (ja) | 1993-12-27 | 1993-12-27 | 文字切り出し装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2778436B2 (ja) |
-
1993
- 1993-12-27 JP JP5329343A patent/JP2778436B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH07192089A (ja) | 1995-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3842006B2 (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Fujinaga | Staff detection and removal | |
US20050238257A1 (en) | Form search apparatus and method | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP2778436B2 (ja) | 文字切り出し装置 | |
KR100449486B1 (ko) | 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법 | |
JP3798179B2 (ja) | パターン抽出装置及び文字切り出し装置 | |
JP3090070B2 (ja) | 帳票識別方法及び装置 | |
JP3957471B2 (ja) | 分離文字列統合装置 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2020047138A (ja) | 情報処理装置 | |
JP2580976B2 (ja) | 文字切出し装置 | |
JP3157530B2 (ja) | 文字切り出し方法 | |
JP2630261B2 (ja) | 文字認識装置 | |
JP2768289B2 (ja) | 文字切り出し装置 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
JP2001291058A (ja) | 文字認識装置及び記録媒体 | |
JPH0950488A (ja) | 異サイズ混在文字列の読取り方法 | |
JP3100825B2 (ja) | 線認識方法 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JPH05128308A (ja) | 文字認識装置 | |
Messelodi et al. | Detection of polygonal frames in complex document images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980407 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090508 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100508 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |