JP2859307B2 - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JP2859307B2
JP2859307B2 JP1198710A JP19871089A JP2859307B2 JP 2859307 B2 JP2859307 B2 JP 2859307B2 JP 1198710 A JP1198710 A JP 1198710A JP 19871089 A JP19871089 A JP 19871089A JP 2859307 B2 JP2859307 B2 JP 2859307B2
Authority
JP
Japan
Prior art keywords
character
block
cutout
width
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1198710A
Other languages
English (en)
Other versions
JPH0362287A (ja
Inventor
孔司 桜田
晃治 伊東
義征 山下
Original Assignee
沖電気工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 沖電気工業株式会社 filed Critical 沖電気工業株式会社
Priority to JP1198710A priority Critical patent/JP2859307B2/ja
Publication of JPH0362287A publication Critical patent/JPH0362287A/ja
Application granted granted Critical
Publication of JP2859307B2 publication Critical patent/JP2859307B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は文書等の文字パタンを一文字単位に切出す
ための文字切出し装置に関する。
(従来の技術) 光学式読取装置における文字認識では、一文字単位に
切出した文字パタンを辞書と照合して文字を認識する。
文字枠を備える文書の文字パタン切出しを行なう場合に
は、文書上の文字枠位置を書式情報に加えておきこの書
式情報を利用して文字切出しを行なう。この場合の切出
し処理は比較的簡単となる。しかし文字枠を備えない一
般文書の文字パタン切出しは、文字枠を備える文書の文
字パタン切出しと同様の簡単な処理では行なえない。
文字枠を備えない文書の文字パタン切出しを行なう装
置として、例えば文献I:特開昭61−195474号公報に開示
されているものがある。
この従来装置では、文字列パタンの周辺分布値の連続
性に基づいて文字列パタンを基本パタンに分割し、基本
パタンの外接矩形の位置、大きさ等の情報を検出し、検
出した情報を文字切出し用辞書と照合し、辞書と整合す
る基本パタンの組を検出し切出す。辞書と整合しなかっ
た基本パタンに関しては、これら基本パタンの位置情報
に基づいて切出し候補位置のあらゆる可能な組合せを求
め、各切出し候補位置で切出した基本パタンに関する切
出し評価値を求め、求めた評価値から最適な組合せの文
字切出し位置を決定し、決定した文字切出し位置に基づ
いて文字パタンを切出す。
この従来装置は、複数個の基本パタンから成る文字パ
タンいわゆる分離文字の文字パタン切出しに、有効であ
る。
(発明が解決しようとする課題) しかしながら上述の文献Iの従来装置は、文字切出し
用辞書と整合しなかった基本パタンに関してこれら基本
パタンのあらゆる可能な組合せを求め、求めた各組合せ
につき切出し評価値を求め、この評価値に基づき最適な
切出し位置を決定するものである。これがため、一般に
処理時間が長くなり、またこのような処理機能を有する
装置のハード構成は複雑化するという問題点があった。
さらにワードプロセッサを用いて作成した文書や一般
の印刷文書では、ほぼ一定のピッチで配した全角文字と
全角文字のピッチのほぼ1/2で配した半角文字とが混在
する文書が多い。これら全角及び半角文字混在の文字列
を有する文書の文字切出しに上述の従来装置を用いた場
合、全角文字を構成する部分図形の形状及び大きさが半
角文字に類似することがあるので基本パタンの全ての組
合せの数が大きくなり、その結果、処理時間が長くなる
だけではなく文字の切出し精度も低下するという問題点
があった。
また上述の従来装置では、隣接する文字パタンが接触
している場合等に、複数個の隣接する文字パタンを1個
の基本パタンとみなして処理するので、精度良く文字パ
タンを切出すことが困難である。従って、例えば文字間
接触の発生しやすい一般の新聞記事や複写機により複写
された文書等の低品質の文書に対しては、文字パタンの
切出し精度が低下するという問題点があった。
この発明の目的は、上述した従来の問題点を解決し、
ワードプロセッサによる文書や一般の印刷文書等の全角
及び半角文字混在の文書の文字切出しを迅速でしかも精
度よく行なえ、さらに低品質な文書からの文字切出しを
精度良く行なえる文字切出し装置を提供することにあ
る。
(課題を解決するための手段) この目的の達成を図るため、この発明の文字切出し装
置は、 文字列パタンを得るための前処理手段と、 文字列パタンの黒ブロックの文字列方向における始端
及び終端位置を検出するブロック抽出手段と、 文字列パタンの推定文字ピッチを検出するピッチ推定
手段と、 2以上の文字パタンを含むと推定される長黒ブロック
を当該長黒ブロックの文字パタン推定個数に応じた黒ブ
ロックに分割し、分割した黒ブロックの始端及び終端位
置を設定するブロック補正手段と、 切出し開始位置からほぼ推定文字ピッチ離れた仮の切
出し終了候補位置を検出する仮候補検出手段と、 仮の切出し終了候補位置が黒ブロック領域内に位置す
るか否か判定し当該仮候補判定結果に応じて仮の切出し
終了位置を決定し、切出し開始位置及び仮の切出し終了
位置の間の仮の切出し領域内に位置する黒ブロックの位
置情報に基づいて仮の切出し領域内の黒ブロックが全角
及び半角のいずれの文字ブロックであるかの識別判定を
行なうブロック識別手段と、 仮の切出し終了候補位置及び識別判定結果に基づいて
切出し終了候補位置を検出する候補検出手段と、 切出し終了候補位置が黒ブロック領域内に位置するか
否か判定し当該候補判定結果に応じて切出し終了位置の
決定及び推定文字ピッチの補正を行ない、切出し終了位
置に基づいて次の切出し開始位置を設定する切出し制御
手段と、 切出し開始及び切出し終了位置に基づいて文字列パタ
ンから文字パタンを切出す切出し手段とを備えて成るこ
とを特徴とする。
(作用) このような構成の文字切出し装置によれば、抽出した
黒ブロックのなかから2以上の文字パタンを含むと推定
される長黒ブロックを検出した場合に、長黒ブロックの
文字パタン推定個数に応じた例えば文字パタン推定個数
と同数の黒ブロックに長黒ブロックを分割し、1つの分
割した黒ブロックを一文字分の黒ブロックとみなす。
そして、文字列方向における幅がほぼ推定文字ピッチ
程度となる仮の切出し領域を設定する。仮の切出し領域
内の一個又は複数個の黒ブロックは全角文字一文字を構
成するブロック、半角文字二文字を構成するブロック及
び半角文字一文字と全角文字一文字との組合せのブロッ
クのいずれかとなる。
一般の印刷文書やワードプロセッサで作成した文書等
においては半角文字のピッチは全角文字のピッチのほぼ
1/2となることから、例えば半角文字2文字を統合した
パタンの幅すなわち(半角文字2文字分の幅)+(これ
ら2文字の間の余白領域の幅)は全角文字一文字の幅よ
りも大きくなる傾向を有していたり、(縦横比)=(文
字の高さ)/(文字の横幅)とすれば全角文字の縦横比
は半角文字2文字を統合したパタンの縦横比よりも大き
くなる傾向を有していたり等の幾何学的特徴を有し、従
って仮の切出し領域内の黒ブロックの幅、高さその他の
幾何学的特徴を利用することによって仮の切出し領域内
の黒ブロックが半角及び全角のいずれの文字ブロックを
構成するかを識別できる。
従って、識別判定結果に基づき切出し開始位置及び仮
の切出し終了位置の間には全角文字1文字分の黒ブロッ
ク、半角文字二文字分の黒ブロック及び半角文字一文字
と全角文字一文字との組合せの黒ブロックのいずれかが
含まれているのかがわかる。従って、一般に半角文字1
文字のピッチが全角文字1文字のピッチのほぼ1/2とな
る傾向があるという事実を利用し、識別結果と黒ブロッ
ク及び仮の切出し終了位置の相対的位置関係とに基づ
き、全角文字の場合の切出し終了候補位置及び半角文字
の場合の切出し終了候補位置を設定できる。
また、一般に推定文字ピッチは誤差を含み、また文書
の文字列の文字ピッチが一定でなかったり文書の文字列
の文字ピッチはほぼ一定であっても文書の光学的読取り
時の紙送りスキュー等によって文字列パタン上での文字
ピッチは一定とならない場合がある。このように推定文
字ピッチと文字列パタン上での文字ピッチとの間には、
通常は誤差が存在する。誤差が存在するにも拘らず推定
文字ピッチを一定としておくと切出し位置を精度良く検
出できない場合がある。
しかしながらこの発明では推定文字ピッチを、切出し
終了候補位置及び黒ブロックとの相対的位置関係に応じ
て補正するので、推定文字ピッチと文字列パタン上での
文字ピッチとの間に誤差が存在する場合でも、切出し位
置を精度良く検出できる。
しかも一般の多くの印刷文書においては文字列中の各
文字が一定ピッチ或はばらつきを有しはするがほぼ一定
に近いピッチで配列されているという事実に鑑みれば、
特に一定ピッチ或は一定に近いピッチで文字を配列した
文書において、推定文字ピッチを用いて切出し位置を検
出することによって、切出し位置を高精度に検出でき
る。
また仮の切出し終了位置の決定を仮の切出し終了候補
位置と黒ブロックとの相対的位置関係に応じて、また識
別判定を仮の切出し領域内の黒ブロックの幾何学的特徴
に応じて、さらに切出し終了位置の決定を切出し終了候
補位置と黒ブロックとの相対的位置関係に応じて、一義
的に行なえるので、これら切出し開始及び終了位置を検
出するための処理を簡単化できる。
(実施例) 以下、図面を参照し、この発明の実施例につき説明す
る。尚、図面はこの発明が理解できる程度に概略的に示
してあるにすぎず、従って各構成成分の入出力信号の流
れ、動作の流れ、形状、寸法及び配設位置を図示例に限
定するものではない。
第一実施例 (1)装置構成 第1図はこの発明の実施例の構成を概略的に示す機能
ブロック図である。
同図にも示すように、この実施例の文字切出し装置
は、文字列パタンを得るための前処理手段10と、文字列
パタンの黒ブロックの文字列方向における始端及び終端
位置を検出するブロック抽出手段12と、文字列パタンの
推定文字ピッチを検出するピッチ推定手段14と、2以上
の文字パタンを含むと推定される長黒ブロックを当該長
黒ブロックの文字パタン推定個数に応じた黒ブロックに
分割し、分割した黒ブロックの始端及び終端位置を設定
するブロック補正手段15と、切出し開始位置からほぼ推
定文字ピッチ離れた仮の切出し終了候補位置を検出する
仮候補検出手段16と、仮の切出し終了候補位置が黒ブロ
ック領域内に位置するか否か判定し当該仮候補判定結果
に応じて仮の切出し終了位置を決定し、切出し開始位置
及び仮の切出し終了位置の間の仮の切出し領域内に位置
する黒ブロックの位置情報に基づいて仮の切出し領域内
の黒ブロックが全角及び半角のいずれの文字ブロックで
あるかの識別判定を行なうブロック識別手段18と、仮の
切出し終了候補位置及び識別判定結果に基づいて切出し
終了候補位置を検出する候補検出手段20と、切出し終了
候補位置が黒ブロック領域内に位置するか否か判定し当
該候補判定結果に応じて切出し終了位置の決定及び推定
文字ピッチの補正を行ない、切出し終了位置に基づいて
次の切出し開始位置を設定する切出し制御手段22と、切
出し開始及び切出し終了位置に基づいて文字列パタンか
ら文字パタンを切出す切出し手段24とを備えて成る。
尚、黒ブロックは文字列パタン中において文字列方向
に沿って並び文字を構成する部分図形パタンを表す。ま
た図中の符号40は推定文字ピッチ、切出し開始及び終了
位置の各パラメータを保存するためのパラメータメモリ
を示す。
以下、より詳細にこの実施例につき説明する。
(前処理手段) この実施例では前処理手段10を、画像読取り手段26及
び画像記憶手段28から構成する。
画像読取り手段26は文字を記載した用紙等の情報媒体
の所定の読取り範囲を光学的に走査し、この媒体からの
光信号Lを光電変換して量子化例えば2値化された電気
信号(画像パタン)を出力する。画像記憶手段28は複数
行の文字列パタンを含む画像パタンを格納する。
画像記憶手段28のメモリ上にはX−Y座標系を仮想的
に設定し、この座標系で表される位置の画素の画像パタ
ンを手段20のメモリから読出すことができるようにして
いる。
(ブロック抽出手段) この実施例ではブロック抽出手段12を、文字列方向と
ほぼ直交する方向に文字列パタンを走査して周辺分布を
得、周辺分布値が所定の閾値以上となる周辺分布領域の
黒ブロックの始端及び終端位置を検出する。
第2図及び第3図はブロック抽出手段の説明図であ
る。第2図及び第3図の(A)は画像記憶手段28に格納
した画像パタン30の所定の文字行領域32内の文字列パタ
ン34を示す図であり、第2図(A)の文字列パタン34は
文字間接触の存在しない例及び第3図(A)の文字列パ
タン34は文字間接触の存在する例を示す。これら図
(A)の縦軸及び横軸は手段28のメモリ上に設定したY
軸及びX軸を示す。また第2図及び第3図の(B)は文
字列パタン34の周辺分布を示す図であり、これら図
(B)の縦軸及び横軸は周辺分布値及び第2図(A)の
X軸に対応するX軸を示す。さらに第2図及び第3図の
(C)は黒ブロックの分布を示す図でありこれら図
(C)の横軸は図(A)のX軸に対応するX軸を示す。
画像記憶手段28が情報媒体の所定の読取り範囲全面の
画像パタン30を格納すると、ブロック抽出手段12は例え
ば第2図及び第3図の(A)に示すような文字行領域32
内の画像パタン30すなわち文字列パタン34を走査する。
この走査では文字列方向に直交する方向を主走査方向と
し、これら図(A)に示す例の場合Y軸方向が主走査方
向及びX軸方向が副走査方向となる。
画像パタン30における文字列方向及び文字行領域32は
従来公知の方法によって予め検出されており、ブロック
抽出手段12はこれら文字列方向及び文字行領域32に基づ
いて走査を行なう。図中、文字行領域32の上端、下端、
左端及び右端座標をそれぞれ符号YT、YB、XL及びXRで示
す。文字行領域32は点(XL、YT)、(XL、YB)、(XR
YT)及び(XR、YB)を結ぶ矩形領域である。
さらにブロック抽出手段12は文字列パタン34の走査
で、文字行領域32内の走査線上の黒画素の個数を計数す
る。この黒画素個数の計数値(周辺分布値)を各副走査
位置毎に求めて、例えば第2図及び第3図の(B)に示
すような周辺分布のデータS(X)を得る。データS
(X)は副走査位置Xにおける周辺分布値である。
次いでブロック抽出手段12は、周辺分布値を各副走査
位置毎に閾値THL1と比較し、第2図及び第3図の(C)
にも示すように、周辺分布値が閾値THL1以上となる周辺
分布領域の黒ブロック36を検出する。図中、ハッチング
を付して示す矩形ブロックは周辺分布値が閾値THL1以上
となる周辺分布領域の黒ブロック36及び黒ブロック36の
側部に隣接する余白領域が周辺分布値が閾値THL1未満と
なる周辺分布領域の文字背景領域38である。
ここで周辺分布値が閾値THL1未満となる走査線を白走
査線及び周辺分布値が閾値THL1以上となる走査線を黒走
査線と称するものとすると、黒ブロック36を検出すると
きには白走査線、複数の黒走査線及び白走査線を順次に
検出し、従って白及び黒走査線を順次に検出したときの
黒走査線の副走査位置が黒ブロック36の始端位置BSとな
り、また黒及び白走査線を順次に検出したときの黒走査
線の副走査位置が黒ブロック36の終端位置BEとなる。
ブロック抽出手段12は文字列パタン34中の各黒ブロッ
ク36の位置BS、BEを検出し、検出した位置BS、BEを各黒
ブロック別に格納する。
次に、第4図を参照し説明する。第4図(A)及び
(B)は第2図及び第3図の(C)と同様の黒ブロック
の分布を示す図であり、推定文字ピッチ、仮の切出し終
了候補位置、切出し終了候補位置、切出し開始及び終了
位置等の各パラメータと黒ブロックとの位置関係の一例
を概略的に示す。
(ピッチ推定手段) この実施例のピッチ推定手段14はブロック幅閾値以下
の黒ブロック幅のなかから最大の黒ブロック幅を検出し
当該最大幅の黒ブロックに隣接する文字背景領域の幅の
うち最小の文字背景領域幅を検出する。そしてこれら最
大黒ブロック幅及び最小文字背景領域幅の和を推定文字
ピッチとして検出する。
ピッチ推定手段14はブロック補正手段15からの黒ブロ
ックの位置BS、BEを入力すると、文字列パタン34中の各
黒ブロック36の文字列方向における幅を算出し、例えば
第4図にも示すように、ブロック幅閾値以下の黒ブロッ
ク幅のなかの最大幅Lを有する黒ブロック36aを検出す
る。そして黒ブロック36aの側部に隣接する文字背景領
域38a及び38bの文字列方向における幅を算出し、これら
領域38a、38bの幅のうち最小となる文字背景領域幅lを
検出する。ブロック幅閾値としては例えば文字パタン切
出しの対象となる情報媒体に関して予想される平均文字
幅に基づいて設定した値を用いることができる。この実
施例では一般的な印刷文字では文字の縦横比((文字の
縦横比)=(文字の高さ)÷(文字の横幅))がおよそ
1となる傾向を有するという事実を利用し、平均文字幅
に基づいて設定した値として例えば文字列パタンの黒ビ
ット部分に外接する矩形枠(文字外接枠)の高さの例え
ば1.2倍程度の値を用いる。
さらに文字列パタン34における推定文字ピッチの初
期値として=l+Lを算出し、の初期値をパラメー
タメモリ40に格納する。
推定文字ピッチを、=l+Lとすることによっ
て、文字列パタン34上での実際の文字ピッチに近いピッ
チをピッチの初期値とすることができる。また推定文
字ピッチの初期値の設定を簡単な処理で行なえる。
そしてこの実施例のピッチ推定手段14は、ブロック補
正手段15からの第1番目の黒ブロックの始端及び終端位
置BS1及びBE1に基づき第1番目の黒ブロックの中心位置
からX座標が小さくなる方向へ推定文字ピッチの初期値
のほぼ1/2離れた位置を検出し、この位置を切出し開始
位置XSの初期値としてパラメータメモリ40に保存する。
切出し開始位置XSの初期値は第1番目の文字パタンの切
出し開始位置となる。この初期値は次式(1)で表現で
きる。
但し、第1番目の黒ブロックは黒ブロックを始端位置
BSの小さい順に数えたときの1番目の黒ブロック、BS1
及びBE1は第1番目の黒ブロックの始端及び終端位置を
表し、式(1)においてはの値を初期値l+Lとす
る。
ピッチ推定手段14は切出し開始位置XSの初期値をパラ
メータメモリ40に格納すると、処理終了信号を出力す
る。
(ブロック補正手段) この実施例ではブロック補正手段15は、図示せずも、
黒ブロックの文字列方向における幅を推定文字ピッチ
で割った値に基づいて当該黒ブロックの文字パタン推定
個数Nを算出し、この個数Nが2以上となる長黒ブロッ
クを検出する文字パタン数推定手段と、長黒ブロックを
分割した各黒ブロックの始端及び終端位置を設定する黒
ブロック分割手段とから構成する。
そしてこの実施例では黒ブロック分割手段を、文字列
パタンを文字列方向とほぼ直交する方向に走査して得た
周辺分布が極小となる位置で、長黒ブロックを分割する
手段とする。
ここで第2図及び第3図を参照する。
文字パタン数推定手段は、ブロック抽出手段12が検出
した黒ブロックの文字列方向における幅BW(BW=BE−BS
+1、但しBS、BEはブロック抽出手段12が検出した始端
及び終端位置)を推定文字ピッチで割った値に基づき
文字パタン推定個数Nを算出する。個数Nは次式(2)
で表される。
N=max{BW/,1} …(2) 但しmax{A,B}はA及びBのうちの最大値であり、A/
BはAをBで除して得られる答が整数である場合にはそ
の整数の答をまたその答に小数点以下がある場合にはそ
の答を小数点以下を四捨五入して得られる整数値を表
し、例えばA=1、B=2としたときA/B=1である。
第2図にも示すように文字間接触の存在しない文字列
パタン32からは長黒ブロックを検出しないが、第3図に
も示すように文字間接触の存在する文字列パタン32から
は長黒ブロックBLを検出する。
文字パタン数推定手段は、長黒ブロックBLを検出しな
い場合、ブロック抽出手段12が検出した黒ブロック別の
始端及び終端位置BS及びBEを、文字パタンの切出し開始
及び終了位置を検出するためのデータとして格納する。
また長黒ブロックBLを検出した場合、ブロック分割手
段は、当該長黒ブロックBLを分割した各黒ブロックの始
端及び終端位置BS及びBEを、文字パタンの切出し開始及
び終了位置を検出するためのデータとして格納する。
この実施例のブロック分割手段の動作につき第3図を
参照し説明する。
ブロック分割手段は、文字パタン数推定手段が検出し
た長黒ブロックBLの境界位置αを求める。境界位置α
は、例えば長黒ブロックBLのN等分点のX座標とする。
そして境界位置α近傍の局所領域Rを設定する。局所
領域RはX座標が位置「α−t」〜位置「α+t」(t
は任意好適な正の値)となる領域である。
さらにブロック分割手段は、局所領域R内の周辺分布
S(X)に基づき局所領域Rにおける周辺分布が極小と
なるX座標βを検出する。
そして座標βを分割した黒ブロックの終端位置BE及び
座標βに1加算した位置を分割した次の黒ブロックの始
端位置BSとして設定する(第4図(B)参照)。
(仮候補検出手段) この実施例の仮候補検出手段16は、パラメータメモリ
40に格納されている推定文字ピッチ及び切出し開始位
置XSに基づいて仮の切出し終了候補位置kE1を算出し出
力する。仮の候補位置kE1は次式(3)で表現できる。
kE1=XS+−1 ……(3) (ブロック識別手段) この実施例のブロック識別手段18は、仮の候補位置k
E1と、ブロック補正手段15からの始端及び終端位置BS
びBEによって定められる分割した黒ブロックとの相対的
な位置関係に基づき次のa)〜c)に述べるようにして
仮の切出し終了位置KE1を決定する。
a)黒ブロック領域外の仮の候補位置kE1を検出したと
き当該候補位置kE1を仮の切出し終了位置KE1とする。
b)黒ブロック領域内の仮の候補位置kE1を検出したと
き当該候補位置kE1が黒ブロック領域内の中心位置Cか
ら始端位置BS側の位置にあれば、当該仮の候補位置kE1
が位置する黒ブロックの始端位置BSに負の仮候補補正値
を加算した位置を仮の切出し終了位置KE1とする。
c)黒ブロック領域内の仮の切出し終了候補位置kE1
検出したとき当該候補位置kE1が黒ブロック領域内の中
心位置Cから終端位置BE側の位置にあれば、当該候補位
置kE1が位置する黒ブロックの終端位置BEに正の仮候補
補正値(但し仮候補補正値が零となる場合を含む)を加
算した位置を仮の切出し終了位置KE1として検出する。
そしてブロック識別手段18は、仮の切出し領域(切出
し開始位置XS及び仮の切出し終了位置KE1の間の領域)
内の黒ブロックの外接枠の横幅mを求め、この横幅mを
所定の横幅閾値THL2と比較する。そして横幅mが閾値TH
L2より大きいとき仮の切出し領域内の黒ブロックは半角
文字ブロックであると判定し、また横幅mが閾値THL2以
下のとき仮の切出し領域内の黒ブロックは全角文字ブロ
ックであると判定する。
第4図からも理解できるように、XS、KE1間の仮の切
出し領域内には1又は複数個の黒ブロックが存在する。
仮の切出し領域の文字列方向における幅はほぼ推定文字
ピッチに等しく、従って文字ピッチがほぼ一定となる
多くの文書においては、仮の切出し領域内の黒ブロック
は半角文字二文字を構成するブロック、或は全角文字一
文字を構成するブロック、或は半角文字一文字及び全角
文字一文字の組合せを構成するブロックとみなせる。
横幅mにつき第5図を参照し説明する。第5図はブロ
ック識別手段の説明に供する図であり、第2図(A)に
示す文字列パタン34を部分的に示したものである。
この実施例では横幅mを、ブロック補正手段15からの
黒ブロックの始端位置BS及び終端位置BEを用いて求め
る。ブロック識別手段18はXS、KE1間の仮の切出し領域
内の1又は複数個の黒ブロックの始端位置BSのうち最小
の値となる位置BS(以下、BSMINと表す)及び終端位置B
Eのうち最大となる位置BE(以下、BEMAX)を検出する。
位置BSMIN及びBEMAXは仮の切出し領域内の1個の黒ブ
ロックの外接枠又は複数個の黒ブロックの外接枠(統合
パタンの外接枠)の文字列方向における始端位置及び終
端位置であり、従って横幅mを次式(4)に従って求め
ることができる。
m=BEMAX−BSMIN+1 ……(4) 閾値THL2は任意好適な値とすることができるが、この
実施例では例えばTHL2=Lとする。
(候補検出手段) この実施例の候補検出手段20はブロック識別手段18か
らの識別結果及び仮候補検出手段16からの仮の終了候補
位置kE1に基づいて次のd)〜e)に述べるようにして
切出し終了候補位置KE2を検出する。
d)識別結果が全角文字の黒ブロックを検出したことを
表すとき仮の終了候補位置kE1を切出し終了候補位置KE2
とする。
e)識別結果が半角文字の黒ブロックを検出したことを
表すとき仮の終了候補位置kE1からほぼ推定文字ピッチ
の1/2だけ減算した位置を切出し終了候補位置KE2とす
る。
(切出し制御手段) この実施例の切出し制御手段22は候補位置KE2を入力
すると候補位置KE2が黒ブロック内に位置するか否かを
判定しこの判定結果に応じて次の処理1)〜3)を行な
う。
1)黒ブロック領域外の切出し終了候補位置KE2を検出
したとき当該候補位置KE2を切出し終了位置XEとして検
出する。この処理では推定文字ピッチの補正を行なわ
ない。
2)黒ブロック領域内の切出し終了候補位置KE2を検出
したとき当該候補位置KE2が黒ブロックの中心位置Cか
ら始端位置BS側の位置にあれば、当該候補位置KE2が位
置する黒ブロックの始端位置BSに負の切出し補正値を加
算した位置を切出し終了位置XEとして検出すると共に推
定文字ピッチに負のピッチ補正値を加算したピッチを
新たな推定文字ピッチとして設定する。
3)黒ブロック領域内の切出し終了候補位置KE2を検出
したとき当該候補位置KE2が黒ブロック内の中心位置C
から終端位置BE側の位置にあれば、当該候補位置KE2
位置する黒ブロックの終端位置BEに正の切出し補正値
(但し切出し補正値が零となる場合を含む)を加算した
位置を切出し終了位置XEとして検出すると共に推定文字
ピッチに正のピッチ補正値を加算したピッチを新な推
定文字ピッチとして設定する。
切出し制御手段22は判定結果に応じて切出し終了位置
XEの検出及び推定文字ピッチの補正を行ない、検出し
た終了位置XE及び又は補正したピッチをパラメータメ
モリ40に格納する。
さらに切出し制御手段22は検出した切出し終了位置XE
から任意好適な距離離れた位置を次の切出し開始位置XS
として求める。次の切出し開始位置XSを例えばXE+1と
する。
一般にピッチ推定手段14が検出する推定文字ピッチ
は誤差を含んでいる。特にピッチ推定手段14をディジタ
ル回路を用いて構成した場合には推定手段14は離散デー
タを扱って処理を行なうので標本化及び量子化に起因す
る誤差が、必ず、推定文字ピッチには含まれる。従っ
て、推定文字ピッチを補正しないで文字の切出しを行
なえば、例えば分離文字(「か」、「ブ」、「設」等の
ように分離する複数の部分図形からなる文字)のパタン
を正しく1つのパタンで切出さずに2つの文字パタンに
分離して切出したり、偏在文字(「,」、「。」「(」
等のように文字位置が偏った位置となる文字)のパタン
をこの偏在文字と隣接する文字パタンと統合して切出し
たり等、文字パタン切出しを誤って行なう恐れがある。
また画像読取り手段16での紙送りスキューの発生等が
原因となって文字列パタン上での文字ピッチが必ずしも
定ピッチとならない場合においても、前述のような切出
しの誤りを発生する恐れが充分にある。
しかしながら、上述の処理2)及び3)のように黒ブ
ロックと切出し終了候補位置KE2との位置関係に応じて
推定文字ピッチを補正することによって、推定文字ピ
ッチが文字列パタン上での実際の文字ピッチにより近
い値となるように微調整が行なえ、常に実際の文字ピッ
チに近い値の推定文字ピッチを得ることができる。
第4図からも理解できるように、この実施例では例え
ば、推定文字ピッチが実際の文字ピッチよりも大きい
場合には上述の処理2)によって推定文字ピッチを短
くするように補正し、推定文字ピッチが実際の文字ピ
ッチよりも小さい場合には上述の処理3)によって推定
文字ピッチを長くするように補正して推定文字ピッチ
が実際の文字ピッチに近い値となるようにしている。
その結果、切出し精度を高くでき従って前述のような切
出しの誤り発生を実質的になくすことができる。
この説明からも理解できるように、上述の処理2)及
び3)のように黒ブロックと切出し終了候補位置KE2
の位置関係に応じて推定文字ピッチを補正することに
よって、厳密には一定ではないが、ほぼ一定となる文字
ピッチの文字列パタンの切出しにおいても切出しの誤り
の発生を実質的になくすことができる。
(切出し手段) 切出し手段24はパラメータメモリ40に格納されている
切出し開始位置XS及び切出し終了位置XEを読出し、これ
ら位置XS、XEに基づいて画像記憶手段28の文字列パタン
34から文字パタンを切出す。
第6図(A)及び(B)は文字間接触の存在しない及
び存在する文字列パタンからの文字パタン切出しの例を
示す図であり、図中、隣接する文字パタンの境界を点線
で概略的に示した。同図にも示すようにこの実施例で
は、点(XS、YT)、(XS、YB)、(XE、YT)及び(XE
YB)を結ぶ矩形領域内の文字列パタン34を文字パタンと
して切出す。
(2)動作の流れ 次に第7図を参照し、ブロック補正手段が処理を終了
してからの実施例の動作の流れにつき説明する。
第7図はこの実施例の動作の流れの一例を示す図であ
り、ブロック補正手段が処理を終了してからの実施例の
動作の流れを示す。尚、以下の動作の説明で用いるBS
びBEはブロック補正手段15からの始端及び終端位置を表
す。
ブロック補正手段15が処理終了信号を出力すると(第
7図の開始の状態)、ブロック補正手段15からの処理終
了信号を入力した仮候補検出手段16がパラメータメモリ
40に格納されている切出し開始位置XS及び推定文字ピッ
チを読出し、仮の切出し終了候補位置kE1=XS+−
1を算出し出力する(S1)。
ブロック識別手段18は仮の候補位置kE1を入力し、ブ
ロック補正手段15からの各黒ブロックの位置BS、BEを用
いてこの仮の候補位置kE1が黒ブロック領域内に位置す
るか否かを判定する(S2)。
S2の判定結果が仮候補位置kE1はいずれの黒ブロック
にも属さない場合であれば、ブロック識別手段18は仮終
了位置KE1をKE1=kE1と設定する(S3)。
S2の判定結果が仮候補位置kE1はいずれかの黒ブロッ
クに属する場合であれば(以下、この仮候補位置kE1
属する黒ブロックを黒ブロックAと称する)、ブロック
識別手段18は当該黒ブロックAの中心位置Cを検出しk
E1<Cか否かを調べる(S4)。中心位置CはC=(BSA
+BEA)/2と表せる。但し、BSA及びBEAは黒ブロックA
の始端及び終端位置である。
S4の判定結果がkE1<Cであれば、仮候補位置kE1は黒
ブロックA内の中心位置Cから始端位置BSA側に位置す
るので、ブロック識別手段18は次式(5)に従って仮の
終了位置KE1を検出する(S5)。
KE1=BSA−ΔX ……(5) 但しΔXはΔX>0となる任意好適な値であり、この
実施例ではΔX=1とする。
S4の判定結果がkE1≧Cであれば、仮終了位置kE1は黒
ブロックA内の中心位置から終端位置BEA側に位置する
ので、ブロック識別手段18は次式(6)に従って仮終了
位置KE1を検出する(S6)。
KE1=BEA+ΔX−1 ……(6) ブロック識別手段18はXS、KE1間の仮の切出し領域内
の1又は複数個の黒ブロックの外接枠の横幅mを算出す
る(S7)。
次に黒ブロック識別手段18は、横幅m及び最大ブロッ
ク幅Lを用いて、仮の切出し領域内の黒ブロックは半角
及び全角文字ブロックのいずれであるかを判定する(S
8)。
S8の判定結果がm>Lであれば、ブロック識別手段18
は仮の切出し領域内の黒ブロックは半角文字ブロックで
あることを表す識別結果を出力する。そして候補検出手
段20は仮候補検出手段16からの仮終了候補位置kE1及び
ブロック識別手段18からの識別結果に基づき、終了候補
位置KE2をKE2=kE1−/2と設定する(S9)。
またS8の判定結果がm≦Lであれば、ブロック識別手
段18は仮の切出し領域内の黒ブロックは全角文字ブロッ
クであることを表す識別結果を出力する。そして候補検
出手段20は識別結果及び仮終了候補位置kE1に基づい
て、終了候補位置KE2をKE2=kE1と設定する(S10)。
切出し制御手段22は終了候補位置KE2を入力し、ブロ
ック補正手段15からの各黒ブロックの位置BS、BEを用い
て、この候補位置KE2が文字列パタン中のいずれかの黒
ブロックに属するか否か(候補位置KE2が黒ブロック内
に位置するか否か)を判定する(S11)。
S11の判定結果が候補位置KE2はいずれかの黒ブロック
に属する場合であれば(以下、この候補位置KE2が属す
る黒ブロックを黒ブロックBと称する)、切出し制御手
段22は当該黒ブロックBの中心位置Cを検出し、KE2
Cか否かを調べる(S12)。中心位置CはC=(BSB+B
EB)/2と表現できる。但し、BSB及びBEBは黒ブロックB
の始端及び終端位置である。
S12の判定結果がKE2<Cであれば、候補位置KE2は黒
ブロックB内の中心位置Cから始端位置BSB側に位置す
るので、切出し制御手段22は、次式(7a)及び(7b)に
従って切出し終了位置XEの検出及び推定文字ピッチの
補正を行なう(S13)。
XE=BSB−ΔX …(7a) =−Δp …(7b) 但し、ΔpはΔp>0となる任意好適な値であって、
この実施例ではΔp=1とする。
切出し制御手段22は検出した切出し終了位置XE及び補
正した推定文字ピッチをパラメータメモリ40に格納す
る。格納したピッチが以後の処理で用いられる。
切出し制御手段22がXE及びをメモリ40に格納する
と、次にS15の処理が行なわれる。
S12の判定結果がKE2≧Cであれば、候補位置KEは黒ブ
ロックB内の中心位置Cから終端位置BEB側に位置する
ので、切出し制御手段22は次式(8a)及び(8b)に従っ
て切出し終了位置XEの検出及び推定文字ピッチの補正
を行なう(S14)。
XE=BEB+ΔX−1 …(8a) =+Δp …(8b) 切出し制御手段22は検出した切出し終了位置XE及び補
正した推定文字ピッチをパラメータメモリ40に格納す
る。格納したピッチが以後の処理で用いられる。切出
し制御手段22がXE及びpをメモリ40に格納すると、次に
S15の処理が行なわれる。
またS11の判定結果が候補位置KE2はいずれの黒ブロッ
クにも属さない場合であれば、切出し制御手段22は当該
候補位置KE2を、切出し終了位置XEとして検出しパラメ
ータメモリ40に格納する。この場合、推定文字 の補正は行なわない。終了位置XEを格納したら、次にS1
5の処理が行なわれる。
S15の処理では切出し手段24が文字パタンの切出しを
行なう(S15)。切出し手段24はパラメータメモリ40か
ら切出し開始位置XS及び切出し終了位置XEを読出し、こ
れら位置XS及びXEを用いて画像記憶手段20の文字列パタ
ンから文字パタンを切出す。
切出し手段24が文字パタンを一文字分切出したら、切
出し制御手段22は文字列パタン中の全ての文字パタンの
切出しを終了したか否かを判定する(S16)。切出し手
段24はこの判定のために終了位置XEをパラメータメモリ
40から読み込み文字列パタン中から最後に抽出された黒
ブロックEの終端位置BEEをブロック抽出手段12から読
出す。そしてBEE及びXEを比較しS16の判定を行なう。
尚、終端位置BEEは文字列パタン中の黒ブロックの位置B
S、BEのなかで最大の座標値となる。
BEE≦XEであれば切出すべき文字パタンを構成する黒
ブロックが無くなったことを表すのでS16の判定結果は
切出し終了となり、従って当該文字列パタンからの文字
パタン切出しを終了する(終了)。この実施例では、画
像記憶手段28に複数行の文字列パタンを格納しているの
で、次の行の文字列パタンに関して黒ブロックの始端、
終端位置及び推定文字ピッチを検出し、そして上述と同
様にして文字列パタン1行分の切出し処理を行なう。
またBEE>XEであれば切出すべき文字パタンを構成す
る黒ブロックがまだ有ることを表し従ってS16の判定結
果は切出し未終了となるので、切出し制御手段22は次の
切出し開始位置XSを求めパラメータメモリ40の切出し開
始位置XSを次の切出し開始位置XSに書換える(S17)。
この切出し開始位置XSの書換えが終わると、次の文字
パタンの切出し開始位置及び終了位置を検出すべく次に
S1の処理が行なわれる。
第8図(A)は仮候補位置kE1と黒ブロックとの位置
関係及び第8図(B)は候補位置KE2と黒ブロックとの
位置関係の判定処理の説明図であり、この判定処理のた
めのより具体的な動作の流れを示す図である。
第8図に示す動作の流れはS18を加えS2及びS11の処理
をより具体的に示している他は第7図に示す動作の流れ
と同様であるので、図面の簡単化のために第7図に示す
動作の流れと同様の部分については省略して示した。以
下の説明では、主として位置kE1、KE2及び黒ブロックの
位置関係の判定処理につき説明し第7図に示す動作の流
れと同様の点についてはその詳細な説明を省略する。
まず、第8図(A)を参照し、仮候補位置kE1と黒ブ
ロックとの位置関係の判定処理につき説明する。
ブロック補正手段15が処理終了信号を出力すると(開
始)、制御変数i、jを初期値1に設定し(S18)、次
いで仮候補検出手段16がS1を行なう。
S1の次にブロック識別手段18は、X座標の小さい順に
数えて第i番目の黒ブロックの終端位置BEiをブロック
補正手段15から読出し、仮候補位置kE1が第i番目の黒
ブロック内に位置するか否かを判定するため仮候補位置
kE1及び終端位置BEiを比較する(S21)。
S21の比較結果がkE1≦BEiであれば仮候補位置kE1は第
i番目の黒ブロック内に位置することを表すので、次に
ブロック識別手段18はS4の処理を行なう。
S21の比較結果がkE1>BEiであれば仮候補位置kE1は第
i番目の黒ブロック内に位置しないことを表すので、次
にX座標の小さい順に数えて第i+1番目の黒ブロック
の始端位置BS(i+1)をブロック補正手段15から読出し、
仮候補位置kE1が第i番目の黒ブロック及び第i+1番
目の黒ブロックの間に位置するか否かを判定するため仮
候補位置kE1及び始端位置BS(i+1)を比較する(S22)。
S22の比較結果がkE1<BS(i+1)であれば仮候補位置kE1
は第i番目及び第i+1番目の黒ブロック間に位置し従
って仮候補位置kE1はいずれの黒ブロックにも属さない
ことを表すので、ブロック識別手段18は次いでS3の処理
を行なう。
S22の比較結果がkE1≧BS(i+1)であれば仮候補位置kE1
は第i番目及び第i+1番目の黒ブロック間には位置し
ないことを表すので、ブロック識別手段18は当該仮候補
位置kE1が黒ブロック内に位置するか否かを調べるべく
iに1を加算し(S23)、次いでS21の処理に戻る。
次に第8図(B)を参照し候補位置KE2と黒ブロック
との位置関係の判定処理につき説明する。
S9或はS10の処理が終わると、切出し制御手段22は、
X座標の小さい順に数えて第j番目の黒ブロックの終端
位置BEjをブロック補正手段15から読出し、候補位置KE2
が第j番目の黒ブロック内に位置するか否かを判定する
ため候補位置KE2及び終端位置BEjを比較する(S111)。
S111の比較結果がKE2≦BEjであれば候補位置KE2は第
j番目の黒ブロック内に位置することを表すので、次に
S12の処理を行なう。
S111の比較結果がKE2>BEjであれば候補位置KE2は第
j番目の黒ブロック内に位置しないことを表すので、次
にX座標の小さい順に数えて第j+1番目の黒ブロック
の始端位置BS(j+1)をブロック補正手段15から読出し、
候補位置KE2が第j番目の黒ブロック及び第j+1番目
の黒ブロックの間に位置するか否かを判定するため候補
位置KE2及び始端位置BS(j+1)を比較する(S112)。
S112の比較結果がKE2<BS(j+1)であれば候補位置KE2
はいずれの黒ブロックにも属さないことを表すので、切
出し制御手段22は当該候補位置KE2を切出し終了位置XE
として検出しパラメータメモリ40に格納し、次いでS15
の処理を行なう。
S112の比較結果がKE2≧BS(j+1)であれば候補位置KE2
は第j番目及び第j+1番目の黒ブロック間には位置し
ないことを表すので、切出し制御手段22は当該候補位置
KE2が黒ブロック内に位置するか否かを調べるべくjに
1を加算し(S113)、次いでS111の処理に戻る。
既に説明した文献Iの従来装置のように、あらゆる可
能な切出し位置の組合せを得て、それぞれの組合せにつ
き個別に評価した上で最適な切出し位置の組合せを得る
装置では、最適な組合せを得るまで切出しを行なえない
文字パタンが残り、文字パタン切出し及び文字認識の並
行処理が実質的に行なえない。
しかしながら上述の第7図及び第8図に示す動作の例
では、仮の切出し領域内の黒ブロックが全角及び半角文
字ブロックのいずれであるかの判定を行ない文字列パタ
ンから一文字ずつ順次に文字パタンを切出すので、この
実施例装置を光学式読取り装置の前処理装置として用い
た場合には、一文字分の文字パタンの認識処理を行なっ
ている間に次の一文字の文字パタンの切出し開始及び終
了位置の検出を行なえる。従って認識処理に必要な文字
パタン切出しまでの待ち時間を短縮できさらに文字パタ
ン切出し及び文字認識を並行して行なえ、その結果、文
字認識処理の効率を向上し処理時間の短縮を図れる。
尚、この実施例の装置によって検出される開始位置
XS、終了位置XE、仮候補位置kE1等の例を、第4図中に
黒丸印で示した。
第二実施例 次に第二実施例につき説明する。第二実施例では、前
処理手段10、ブロック抽出手段12、ピッチ推定手段14、
ブロック補正手段15、仮候補検出手段16及びブロック識
別手段18の機能を第一実施例と同様とし、候補検出手段
20、切出し制御手段22及び切出し手段24の機能が第一実
施例と異なる。以下の第二実施例の説明では主として第
一実施例と相違する点につき説明し、第一実施例と同様
の点についてはその詳細な説明を省略する。
第二実施例の候補検出手段20は、識別判定結果及び仮
の切出し終了候補位置kE1に基づいて次のf)〜g)に
述べるように切出し終了候補位置KE2を検出する。
f)識別判定結果が全角文字ブロックを検出したことを
表すとき仮の切出し終了候補位置kE1を切出し終了候補
位置KE2とする。
g)識別判定結果が半角文字ブロックを検出したことを
表すとき仮の切出し終了候補位置kE1からほぼ推定文字
ピッチの1/2だけ減算した位置を前半の半角文字ブロ
ックの切出し終了候補位置KE2とすると共に仮の切出し
終了候補位置kE1を後半の半角文字ブロックの切出し終
了候補位置KE2とする。
尚、半角文字ブロックを検出したとき仮の切出し領域
内に含まれる半角文字一文字分の黒ブロックを原点側か
ら順次に、前半の半角文字ブロック及び後半の半角文字
ブロックと称する。
切出し制御手段22は、第一実施例と同様にして、切出
し終了候補位置KE2と黒ブロックとの相対的位置関係に
応じて、切出し終了位置XEの検出及び推定文字ピッチ
の補正を行なうが、識別判定結果が半角文字ブロックを
検出したことを表すときの動作が第一実施例と若干異な
る。
切出し制御手段22は仮の切出し領域内の黒ブロックが
半角文字ブロックであると判定された場合、第一実施例
と同様にして、前半の半角文字ブロックにつき終了位置
XEの検出及びピッチの補正に関する処理を行ない、次
いで前半の半角文字ブロックの終了位置XEに基づいて後
半の半角文字ブロックの開始位置XSを検出する。これと
共に後半の半角文字ブロックにつき終了位置XEの検出及
びピッチの補正に関する処理を行ない、文字列パタン
34からの切出しが終っていなければ後半の半角文字ブロ
ックの終了位置XEに基づいて次の開始位置XSを設定す
る。検出した前半及び後半の半角文字ブロックの開始位
置XS、終了位置XEをそれぞれパラメータメモリ40に格納
する。
第9図に位置XS、XE、kE1、KE1等の各パラメータと黒
ブロックとの位置関係を示す。第9図は第二実施例にお
ける各パラメータと黒ブロックとの位置関係を概略的に
示す、第4図と同様の図である。
切出し手段24は第一実施例と同様にして文字パタンの
切出し行なうが、識別判定結果が半角文字ブロックを検
出した場合の動作が第一実施例と若干異なる。
切出し手段24は半角文字ブロックが検出された場合に
は、パラメータメモリ40に格納されている前半の半角文
字ブロックの開始位置XS、終了位置XEを読出しこれら位
置に基づいて文字列パタン34から前半の半角文字ブロッ
クにつき文字パタンを切出し、さらに後半の半角文字ブ
ロックの開始位置XS、終了位置XEに基づいて後半の半角
文字ブロックにつき文字パタンを切出す。
切出し手段24は後半の半角文字ブロックにつき文字パ
タンを切出し終えると、文字列パタンからの切出しを全
て終了したか否かの判定を後半の文字ブロックの終了位
置XEに基づいて行なう。
第10図に文字パタンの切出しの一例を示す。第10図は
第二実施例における文字パタンの切出しの一例を示す、
第6図と同様の図である。
この発明は上述した実施例にのみ限定されるものでは
なく、従って各構成成分の構成、動作、入出力信号、動
作タイミング、入出力信号の流れ、数値的条件、寸法、
形状及びその他の条件を任意好適に変更できる。
例えば、ブロック抽出手段を画像読取手段からの画像
パタンを入力して黒ブロックの始端及び終端位置を検出
するようにし、画像読取手段からの画像パタンを画像記
憶手段及びブロック抽出手段に並行して同時に入力する
ようにしてもよい。
また画像読取手段を1行単位に文書等の光学的読取り
を行なう手段とし画像記憶手段に1行単位に文字列パタ
ンを格納し、1行の文字列パタンからの切出しを終えた
ら文書等の次の行の光学的読取りを行なって次の行の文
字列パタンを画像記憶手段に格納するようにしてもよ
い。
また上述した実施例では仮の切出し領域内の黒ブロッ
クの外接枠の幅を用いて識別判定を行なうようにした
が、この他、仮の切出し領域内の黒ブロックの外接枠の
位置、形状及び大きさのなかから選んだひとつ又は複数
の情報に基づいて識別判定を行なうようにすることがで
きる。
例えば仮の切出し領域内の黒ブロックの縦幅及び横幅
を求め、縦幅を横幅で除して得た縦横比を縦横比閾値と
比較し、縦横比が縦横閾値以下のとき仮の切出し領域内
の黒ブロックを半角の文字ブロックと判定し、縦横比が
縦横比閾値よりも大きいとき仮の切出し領域内の黒ブロ
ックを全角の文字ブロックと判定するようにしてもよ
い。この場合、ブロック識別手段は従来公知の手法によ
って仮の切出し領域内の黒ブロックの外接枠Gを検出
し、検出した外接枠GのY軸方向における上端位置GT、
下端位置GBを用いて外接枠Gの縦幅nを求める。縦幅n
はn=GB−GT+1と表せる。尚第5図にも示すように外
接枠Gは点(BSMIN、GT)、(BSMIN、GB)、(BEMAX、G
T)及び(BEMAX、GB)の4点を結んで得られる矩形枠と
なる。
また例えば上述した例においては横幅閾値をブロック
幅閾値以下の黒ブロック幅のうちの最大の黒ブロック幅
としたが、横幅閾値を全ての黒ブロックの幅に基づいて
設定した任意好適な値とすることができる。
また推定文字ピッチの初期値として従来公知の任意好
適な推定文字ピッチを用い、用いる推定文字ピッチの初
期値の検出のためにピッチ推定手段の構成を任意好適に
変更してもよい。推定文字ピッチの初期値を検出するた
めに、黒ブロックの位置、大きさ、幅のほかこれら黒ブ
ロックに関する情報以外のものを用いることもできる
が、好ましくは、ピッチ推定手段を、黒ブロックの始端
位置及び終端位置に基づいて、黒ブロックの幅及び黒ブ
ロック間の文字背景領域の幅を算出し、文字列パタンの
全ての黒ブロックの幅及び全ての文字背景領域の幅を用
いて推定文字ピッチを検出する手段とするのがよい。
またブロック分割手段を、上述した例の他例えば、長
黒ブロックを文字列方向における幅がそれぞれ等しい黒
ブロックに分割する手段としてもよい。この場合例え
ば、長黒ブロックのN等分点αのX座標の位置及びこの
αのX座標に1加算した位置を分割した黒ブロックの終
端位置BE及び次の黒ブロックの始端位置BSとすればよ
い。
また切出し開始位置の初期値を上述した実施例のもの
に限定するものではなく任意好適に変更でき、さらに切
出し開始位置の初期値を上述した実施例ではピッチ推定
手段が検出するようにしたがピッチ推定手段以外の手段
が行なうようにしてもよい。
また文字パタン切出しのための文字パタンの上端及び
下端位置として、行領域の上端及び下端位置のほか従来
用いられている任意好適な位置を用いることができる。
また切出し終了位置の検出及び文字ピッチの補正のし
かたを、上述の実施例にのみ限定するものではなく、黒
ブロックの中心位置と切出し終了候補位置との位置関係
に無関係に、黒ブロック内の切出し終了候補位置を検出
したとき、当該候補位置が位置する黒ブロックの始端位
置に負の切出し補正値を加算した位置を切出し終了位置
として検出すると共に推定文字ピッチに負のピッチ補正
値を加算したピッチを新な推定文字ピッチとして設定し
たり、或は当該候補位置が位置する黒ブロックの終端位
置に正の切出し補正値を加算した位置を切出し終了位置
として検出すると共に推定文字ピッチに正のピッチ補正
値を加算したピッチを新な推定文字ピッチとして設定す
るようにしてもよい。
また上述した実施例では一文字分の切出し開始及び切
出し終了位置を検出したら文字パタンを切出すようにし
たが、動作の流れをこれに限定するものではなくこのほ
か、例えば文字列パタン中の全文字パタンの切出し開始
及び切出し終了位置を検出し終えたら文字パタンを一文
字分ずつ切出すようにしてもよい。
また上述した実施例では、横書き文書の文字列パタン
からの文字パタン切出しを副走査位置のより小さい順に
行なうようにした例につき説明したが、この発明装置の
動作をこれにのみ限定するものではなく、この発明装置
の動作を横書き文書の文字列パタンから副走査位置のよ
り大きい順に文字パタンを切出すようにしたり、また横
書き文書のみならず縦書き文書の文字列パタンから文字
パタンを切出すようにしたりしてもよい。
(発明の効果) 上述した説明からも明らかなように、この発明の文字
切出し装置によれば、抽出した黒ブロックのなかから2
以上の文字パタンを含むと推定される長黒ブロックを検
出した場合に、長黒ブロックの文字パタン推定個数に応
じた個数例えば文字パタン推定個数と同数の黒ブロック
に分割し、分割した各黒ブロックの始端及び終端位置を
設定する。そして長黒ブロックを検出した場合には、ブ
ロック抽出手段からの長黒ブロックの始端及び終端位置
を用いるのではなく、ブロック補正手段からの分割した
各黒ブロックの始端及び終端位置を用いて、文字パタン
の切出し開始及び終了位置を検出する。
従って隣接する文字同志が接触する場合等に一文字分
のパタンとみなしうる文字パタンを1個の黒ブロックと
して抽出でき、この結果、新聞記事や複写機により複写
された文書に見られるような文字のつぶれ、雑音(ご
み)等に起因する文字間接触を持つ文字列パタンに対し
ても、精度よく文字の切出しが行なえる。
また仮の切出し終了候補位置が黒ブロック領域内に位
置するか否か判定し当該仮候補判定結果に応じて仮の切
出し終了位置を決定し、切出し開始位置及び仮の切出し
終了位置の間の仮の切出し領域内に位置する黒ブロック
の位置情報に基づいて仮の切出し領域内の黒ブロックが
全角及び半角のいずれの文字ブロックであるかの識別判
定を行ない、候補検出手段はこれら仮の切出し終了候補
位置及び識別判定結果に基づいて切出し終了候補位置を
検出する。
従って仮の切出し終了候補位置と黒ブロックとの相対
的位置関係に応じて、切出し開始位置からほぼ推定文字
ピッチ離れた位置を仮の切出し終了位置とすることがで
きる。切出し開始位置から仮の切出し終了位置までの離
間距離はほぼ推定文字ピッチ程度となるので、仮の切出
し領域内の一個又は複数個の黒ブロックは全角文字一文
字を構成するブロック、半角文字二文字を構成するブロ
ック、及び半角文字一文字と全角文字一文字とを構成す
るブロックのいずれかとみなせる。ところで一般の印刷
文書やワードプロセッサで作成した文書等においては半
角文字は全角文字のピッチのほぼ1/2となることから、
例えば半角文字2文字を統合したパタンの幅すなわち
(半角文字2文字分の幅)+(これら2文字の間の余白
領域の幅)は全角文字一文字の幅よりも大きくなる傾向
を有していたり、(縦横比)=(文字の高さ)/(文字
の横幅)とすれば全角文字の縦横比は半角文字2文字を
統合したパタンの縦横比よりも大きくなる傾向を有して
いたり等の幾何学的特徴を有し、従って仮の切出し領域
内の黒ブロックの幅、高さその他の幾何学的特徴を利用
することによって仮の切出し領域内の黒ブロックが半角
及び全角のいずれの文字ブロックを構成するかの識別判
定を行なうことができる。
さらにこの発明の切出し装置によれば、識別判定結果
から、切出し開始位置及び仮の切出し終了位置の間には
全角文字1文字分の黒ブロック、半角文字2文字分の黒
ブロック、及び、半角文字一文字分及び全角文字一文字
分の組合せの黒ブロックのいずれかが含まれているのか
がわかる。従って一般に半角文字1文字のピッチが全角
文字1文字のピッチのほぼ1/2となる傾向があるという
事実を利用し、仮の切出し終了候補位置に基づいて識別
判定結果に応じて全角文字の場合の切出し終了候補位置
及び半角文字の場合の切出し終了候補位置を設定でき
る。
また、一般に推定文字ピッチは誤差を含み、さらに文
書の文字列の文字ピッチが一定でなかったり文書の文字
列の文字ピッチはほぼ一定であっても文書の光学的読取
り時の紙送りスキュー等によって文字列パタン上での文
字ピッチは一定とならない場合がある。このように推定
文字ピッチと文字列パタン上での文字ピッチとの間に
は、通常は誤差が存在する。誤差が存在するにも拘らず
推定文字ピッチを一定としておくと切出し位置を精度良
く検出できない場合がある。
しかしながらこの発明では推定文字ピッチを、切出し
終了候補位置及び黒ブロックとの相対的位置関係に応じ
て補正するので、推定文字ピッチと文字列パタン上での
文字ピッチとの間に誤差が存在する場合でも、切出し位
置を精度良く検出できる。
しかも一般の多くの印刷文書においては文字列中の各
文字が一定ピッチ或はばらつきを有しはするがほぼ一定
に近いピッチで配列されているという事実に鑑みれば、
特に一定ピッチ或は一定に近いピッチで文字を配列した
文書において、推定文字ピッチを用いて切出し位置を検
出することによって、切出し位置を高精度に検出でき
る。
また仮の切出し終了位置の決定を仮の切出し終了候補
位置と黒ブロックとの相対的位置関係に応じて、また識
別判定を仮の切出し領域内の黒ブロックの幾何学的特徴
に応じて、さらに切出し終了位置の決定を切出し終了候
補位置と黒ブロックとの相対的位置関係に応じて一義的
に行なえるので、これら切出し開始及び終了位置を検出
するための処理を簡単化できる。
従ってこの発明によれば、ワードプロセッサによる文
書や一般の印刷文書等の全角及び半角文字混在の文書に
おける文字切出しを、迅速にしかも精度よく行なえ、さ
らに低品質な文書からの文字切出しを精度よく行なえる
文字切出し装置を提供できる。
【図面の簡単な説明】
第1図はこの発明の実施例の構成を概略的に示す機能ブ
ロック図、 第2図(A)〜(C)は実施例のブロック抽出及び補正
手段の説明に供する図、 第3図(A)〜(C)は実施例のブロック抽出及び補正
手段の説明に供する図、 第4図(A)〜(B)は第一実施例における黒ブロック
と各パラメータとの位置関係の一例を示す図、 第5図はブロック識別手段の説明に供する図、 第6図(A)〜(B)は第一実施例における文字パタン
切出しの例を示す図、 第7図は実施例の動作の流れの一例を示す図、 第8図(A)〜(B)は切出し終了候補位置及び黒ブロ
ックの位置関係の判定処理の説明に供する図、 第9図は第二実施例における黒ブロックと各パラメータ
との位置関係の一例を示す図、 第10図は第二実施例における文字パタン切出しの例を示
す図である。 10……前処理手段、12……ブロック抽出手段 14……ピッチ推定手段、15……ブロック補正手段 16……仮候補検出手段、18……ブロック識別手段 20……候補検出手段、22……切出し制御手段 24……切出し手段、26……画像読取手段 28……画像記憶手段。

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列パタンを得るための前処理手段と、 前記文字列パタンの黒ブロックの文字列方向における始
    端及び終端位置を検出するブロック抽出手段と、 前記文字列パタンの推定文字ピッチを検出するピッチ推
    定手段と、 2以上の文字パタンを含むと推定される長黒ブロックを
    当該長黒ブロックの文字パタン推定個数に応じた黒ブロ
    ックに分割し、分割した黒ブロックの始端及び終端位置
    を設定するブロック補正手段と、 切出し開始位置からほぼ推定文字ピッチ離れた仮の切出
    し終了候補位置を検出する仮候補検出手段と、 前記仮の切出し終了候補位置が黒ブロック領域内に位置
    するか否か判定し当該仮候補判定結果に応じて仮の切出
    し終了位置を決定し、前記切出し開始位置及び仮の切出
    し終了位置の間の仮の切出し領域内に位置する黒ブロッ
    クの位置情報に基づいて前記仮の切出し領域内の黒ブロ
    ックが全角及び半角のいずれの文字ブロックであるかの
    識別判定を行なうブロック識別手段と、 前記仮の切出し終了候補位置及び識別判定結果に基づい
    て切出し終了候補位置を検出する候補検出手段と、 前記切出し終了候補位置が黒ブロック領域内に位置する
    か否か判定し当該候補判定結果に応じて切出し終了位置
    の決定及び推定文字ピッチの補正を行ない、切出し終了
    位置に基づいて次の切出し開始位置を設定する切出し制
    御手段と、 前記切出し開始及び切出し終了位置に基づいて前記文字
    列パタンから文字パタンを切出す切出し手段とを備えて
    成ることを特徴とする文字切出し装置。
  2. 【請求項2】前記ブロック抽出手段を、 前記文字列方向とほぼ直交する方向に文字列パタンを走
    査して周辺分布を得、周辺分布値が所定の閾値以上とな
    る周辺分布領域の黒ブロックの始端及び終端位置を検出
    する手段としたことを特徴とする請求項1に記載の文字
    切出し装置。
  3. 【請求項3】前記ブロック補正手段を、 前記黒ブロックの文字列方向における幅を前記推定文字
    ピッチで割った値に基づいて当該黒ブロックの文字パタ
    ン個数を算出し、該文字パタン推定個数が2以上となる
    長黒ブロックを検出する文字パタン数推定手段と、 前記長黒ブロックを分割した各黒ブロックの始端及び終
    端位置を設定する黒ブロック分割手段とから構成するこ
    とを特徴とする請求項1又は2に記載の文字切出し装
    置。
  4. 【請求項4】前記ブロック分割手段を、前記長黒ブロッ
    クを前記文字列方向における幅がそれぞれ等しい黒ブロ
    ックに分割する境界位置を求める手段としたことを特徴
    とする請求項3に記載の文字切出し装置。
  5. 【請求項5】前記ブロック分割手段を、前記境界位置近
    傍の局所領域を設定し、前記文字列パタンを文字列方向
    とほぼ直交する方向に走査して得た周辺分布が極小とな
    る前記局所領域内の位置で、前記長黒ブロックを分割す
    る手段としたことを特徴とする請求項4に記載の文字切
    出し装置。
  6. 【請求項6】前記ピッチ推定手段を、 前記文字列パタンの全ての黒ブロックの幅及び全ての文
    字背景領域の幅を用いて推定文字ピッチを検出する手段
    としたことを特徴とする請求項1〜5のいずれか一項に
    記載の文字切出し装置。
  7. 【請求項7】前記ピッチ推定手段を、 ブロック幅閾値以下の黒ブロック幅のなかから最大の黒
    ブロック幅を検出し、当該最大幅の黒ブロックに隣接す
    る文字背景領域の幅のうち最小の文字背景領域幅を検出
    し、これら最大黒ブロック幅及び最小文字背景領域幅の
    和を推定文字ピッチとして検出する手段としたことを特
    徴とする請求項6に記載の文字切出し装置。
  8. 【請求項8】前記ブロック識別手段を、 黒ブロック領域外の仮の切出し終了候補位置を検出した
    とき当該候補位置を仮の切出し終了位置とし、 黒ブロック領域内の仮の切出し終了候補位置を検出した
    とき当該候補位置が黒ブロック領域内の中心位置から始
    端位置側の位置にあれば、当該仮の候補位置が位置する
    黒ブロックの始端位置に負の仮候補補正値を加算した位
    置を仮の切出し終了位置とし、 黒ブロック領域内の仮の切出し終了候補位置を検出した
    とき当該仮の候補位置が黒ブロック領域内の中心位置か
    ら終端位置側の位置にあれば、当該仮の候補位置が位置
    する黒ブロックの終端位置に正の仮候補補正値を加算し
    た位置を仮の切出し終了位置として検出する手段とした
    こと(但し仮候補補正値が零となる場合を含む)を特徴
    とする請求項1〜7のいずれか一項に記載の文字切出し
    装置。
  9. 【請求項9】前記ブロック識別手段を、 前記仮の切出し領域内の黒ブロックの外接枠の位置、形
    状及び大きさのなかから選んだひとつ又は複数の情報に
    基づいて識別判定を行なう手段としたことを特徴とする
    請求項1〜8のいずれか一項に記載の文字切出し装置。
  10. 【請求項10】前記ブロック識別手段を、 前記仮の切出し領域内の黒ブロックの外接枠の横幅を求
    め、該横幅を所定の横幅閾値と比較し、横幅が横幅閾値
    より大きいとき前記仮の切出し領域内の黒ブロックは半
    角の文字ブロックであると判定し、横幅が横幅閾値以下
    のとき前記仮の切出し領域内の黒ブロックは全角の文字
    ブロックであると判定する手段としたことを特徴とする
    請求項1〜9のいずれか一項に記載の文字切出し装置。
  11. 【請求項11】前記横幅閾値を全ての黒ブロックの幅に
    基づいて設定することを特徴とする請求項10に記載の文
    字切出し装置。
  12. 【請求項12】前記ブロック識別手段を、 前記仮の切出し領域内の黒ブロックの縦幅及び横幅を求
    め、該縦幅を横幅で除して得た縦横比を縦横比閾値と比
    較し、縦横比が縦横比閾値以下のとき前記仮の切出し領
    域内の黒ブロックを半角の文字ブロックと判定し、縦横
    比が縦横比閾値よりも大きいとき前記仮の切出し領域内
    の黒ブロックを全角の文字ブロックと判定する手段とし
    たことを特徴とする請求項1〜9のいずれか一項に記載
    の文字切出し装置。
  13. 【請求項13】前記候補検出手段を、 前記識別結果が全角の文字ブロックを検出したことを表
    すとき前記仮の切出し終了候補位置を切出し終了候補位
    置とし、 前記識別結果が半角の文字ブロックを検出したことを表
    すとき前記仮の切出し終了候補位置からほぼ推定文字ピ
    ッチの1/2だけ減算した位置を切出し終了候補位置とし
    て検出する手段としたことを特徴とする請求項1〜12の
    いずれか一項に記載の文字切出し装置。
  14. 【請求項14】前記候補検出手段を、 前記識別判定結果が全角の文字ブロックを検出したこと
    を表すとき前記仮の切出し終了候補位置を切出し終了候
    補位置とし、 前記識別判定結果が半角の文字ブロックを検出したこと
    を表すとき前記仮の切出し終了候補位置からほぼ推定文
    字ピッチの1/2だけ減算した位置を前半の半角文字ブロ
    ックの切出し終了候補位置とすると共に前記仮の切出し
    終了候補位置を後半の半角文字ブロックの切出し終了候
    補位置として検出する手段としたことを特徴とする請求
    項1〜12のいずれか一項に記載の文字切出し装置。
  15. 【請求項15】前記切出し制御手段を、 前記黒ブロック領域外の切出し終了候補位置を検出した
    とき当該候補位置を切出し終了位置とし、 前記黒ブロック領域内の切出し終了候補位置を検出した
    とき当該候補位置が黒ブロックの中心位置から始端位置
    側の位置にあれば、当該候補位置が位置する黒ブロック
    の始端位置に負の切出し補正値を加算した位置を切出し
    終了位置とすると共に推定文字ピッチに負のピッチ補正
    値を加算したピッチを新な推定文字ピッチとし、 前記黒ブロック領域内の切出し終了候補位置を検出した
    とき当該候補位置が黒ブロックの中心位置から終端位置
    の側にあれば、当該候補位置が位置する黒ブロックの終
    端位置に正の切出し補正値を加算した位置を切出し終了
    位置とすると共に推定文字ピッチに正のピッチ補正値を
    加算したピッチを新な推定文字ピッチとして設定する手
    段としたこと(但し切出し補正値が零となる場合を含
    む)を特徴とする請求項1〜14のいずれか一項に記載の
    文字切出し装置。
JP1198710A 1989-07-31 1989-07-31 文字切出し装置 Expired - Fee Related JP2859307B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1198710A JP2859307B2 (ja) 1989-07-31 1989-07-31 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1198710A JP2859307B2 (ja) 1989-07-31 1989-07-31 文字切出し装置

Publications (2)

Publication Number Publication Date
JPH0362287A JPH0362287A (ja) 1991-03-18
JP2859307B2 true JP2859307B2 (ja) 1999-02-17

Family

ID=16395726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1198710A Expired - Fee Related JP2859307B2 (ja) 1989-07-31 1989-07-31 文字切出し装置

Country Status (1)

Country Link
JP (1) JP2859307B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3639126B2 (ja) 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法

Also Published As

Publication number Publication date
JPH0362287A (ja) 1991-03-18

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US5410611A (en) Method for identifying word bounding boxes in text
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
JPH05233873A (ja) 領域分割方法
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
CN111814673A (zh) 一种修正文本检测边界框的方法、装置、设备及存储介质
US5923782A (en) System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings
US20120250985A1 (en) Context Constraints for Correcting Mis-Detection of Text Contents in Scanned Images
JP2859307B2 (ja) 文字切出し装置
CN116030472A (zh) 文字坐标确定方法及装置
JPH02293989A (ja) 文字認識装置
JP2827960B2 (ja) 宛名行抽出装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
CN115995080B (zh) 基于ocr识别的档案智能管理系统
JPH0728935A (ja) 文書画像処理装置
JP4242962B2 (ja) 文字切出装置
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
Gayashan et al. Old Sinhala newspaper article segmentation for content recognition using image processing
JPH052659A (ja) 文字切り出し装置
JPH031286A (ja) 文字切出し装置
JPH04241074A (ja) 自動文書清書装置
JPH0567235A (ja) 文字切り出し装置
JP2963807B2 (ja) 郵便番号枠検出装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees