JP3100619B2 - 写真領域抽出装置 - Google Patents
写真領域抽出装置Info
- Publication number
- JP3100619B2 JP3100619B2 JP02292440A JP29244090A JP3100619B2 JP 3100619 B2 JP3100619 B2 JP 3100619B2 JP 02292440 A JP02292440 A JP 02292440A JP 29244090 A JP29244090 A JP 29244090A JP 3100619 B2 JP3100619 B2 JP 3100619B2
- Authority
- JP
- Japan
- Prior art keywords
- photographic
- region
- photograph
- candidate
- photo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Description
【0001】
本発明は、文書画像中から写真領域を抽出する写真領
域抽出装置に関する。
域抽出装置に関する。
【0002】
写真を含む文書画像において、文字認識を行う場合、
その前処理として、写真領域を排除したり、あるいは画
像を符号化するときには、写真部と文字部に対してそれ
ぞれ異なる処理を施す必要があるため、その前処理とし
て、画像から文字領域と写真領域を抽出しなければなら
ない。
その前処理として、写真領域を排除したり、あるいは画
像を符号化するときには、写真部と文字部に対してそれ
ぞれ異なる処理を施す必要があるため、その前処理とし
て、画像から文字領域と写真領域を抽出しなければなら
ない。
【0003】 従来の領域抽出方法としては、例えば、小さな白領域
を黒領域に置き換えて黒画素を融合させて構成要素を抽
出した後に、写真部と文字部の判定を行う方法がある
(“Document analysis system",Proc.6th ICPR,pp496
−499 Oct.1982)。
を黒領域に置き換えて黒画素を融合させて構成要素を抽
出した後に、写真部と文字部の判定を行う方法がある
(“Document analysis system",Proc.6th ICPR,pp496
−499 Oct.1982)。
【0004】
上記した方法は、所謂ボカシ処理によって大きな黒画
素塊を生成し、これを一つの領域として処理しているの
で、各画素毎の処理量が多くなると共に、ボカシ処理で
生成された黒画素塊が抽出すべき領域と一致しないとい
う問題があった。
素塊を生成し、これを一つの領域として処理しているの
で、各画素毎の処理量が多くなると共に、ボカシ処理で
生成された黒画素塊が抽出すべき領域と一致しないとい
う問題があった。
【0005】 この点を解決する方法として、画像を所定の大きさの
小領域に分割し、小領域単位に空白部を検出することに
よって、領域を抽出する方法がある(特開昭63−304387
号公報)。
小領域に分割し、小領域単位に空白部を検出することに
よって、領域を抽出する方法がある(特開昭63−304387
号公報)。
【0006】 しかし、この方法では、空白部の検出に際し、縦、横
に連続している空白を利用しているので、文書が傾いて
いる場合には誤検出するという欠点があり、また小領域
を大きく設定すると写真領域と文字領域の両方に小領域
が跨り、領域の抽出が困難になるという問題があった。
に連続している空白を利用しているので、文書が傾いて
いる場合には誤検出するという欠点があり、また小領域
を大きく設定すると写真領域と文字領域の両方に小領域
が跨り、領域の抽出が困難になるという問題があった。
【0007】 本発明の目的は、処理単位を小さくして高速に領域を
抽出できる写真領域抽出装置を提供することにある。
抽出できる写真領域抽出装置を提供することにある。
【0008】
前記目的を達成するために、請求項1記載の発明で
は、2値化された文書画像データを横方向にランレング
ス符号化し、該符号化されたデータから写真領域を抽出
する写真領域抽出装置において、前記符号化されたデー
タの横方向の各スキャンラインについて、所定の大きさ
の画素列区間(以下、区間)毎に写真部か否かを判定す
る手段と、前記スキャンラインの縦方向の区間毎に、前
記判定された写真部を、所定ラインについて縦方向にラ
ンレングス符号化する手段と、該符号化された写真部
(以下、写真候補部)の縦方向の長さを調べ、所定の閾
値以上の長さで、横方向に接触している複数の写真候補
部を統合すると共に、前記複数の写真候補部の内、縦方
向にある第1の写真候補部と第2の写真候補部の間の、
所定の閾値以下の長さの空白部を写真候補部に変換する
ことにより写真領域に統合する手段とを備えたことを特
徴としている。
は、2値化された文書画像データを横方向にランレング
ス符号化し、該符号化されたデータから写真領域を抽出
する写真領域抽出装置において、前記符号化されたデー
タの横方向の各スキャンラインについて、所定の大きさ
の画素列区間(以下、区間)毎に写真部か否かを判定す
る手段と、前記スキャンラインの縦方向の区間毎に、前
記判定された写真部を、所定ラインについて縦方向にラ
ンレングス符号化する手段と、該符号化された写真部
(以下、写真候補部)の縦方向の長さを調べ、所定の閾
値以上の長さで、横方向に接触している複数の写真候補
部を統合すると共に、前記複数の写真候補部の内、縦方
向にある第1の写真候補部と第2の写真候補部の間の、
所定の閾値以下の長さの空白部を写真候補部に変換する
ことにより写真領域に統合する手段とを備えたことを特
徴としている。
【0009】 請求項2記載の発明では、前記統合された写真領域の
近傍に存在する黒画素の塊を写真領域にさらに統合する
ことにより、前記写真領域の近傍を補正する手段を更に
備えたことを特徴としている。
近傍に存在する黒画素の塊を写真領域にさらに統合する
ことにより、前記写真領域の近傍を補正する手段を更に
備えたことを特徴としている。
【0010】 前述した手段によれば、横方向のスキャンライン上の
画素列単位毎に写真領域か否かを判定しているので、ラ
ンレングスコードを利用することができ、高速に写真領
域を抽出することができる。
画素列単位毎に写真領域か否かを判定しているので、ラ
ンレングスコードを利用することができ、高速に写真領
域を抽出することができる。
【0011】 また、スキャンラインを適宜間引いて処理することに
よって、処理量を削減することができ、更に、写真領域
の近傍に存在する画素塊を補正処理しているので、本来
の写真領域にほぼ一致した領域を画像中から抽出するこ
とが可能となる。
よって、処理量を削減することができ、更に、写真領域
の近傍に存在する画素塊を補正処理しているので、本来
の写真領域にほぼ一致した領域を画像中から抽出するこ
とが可能となる。
【0012】
以下、本発明の一実施例を図面を用いて具体的に説明
する。 図1は、本発明の一実施例に係る領域抽出装置のブロ
ック構成図であり、1は2値化された原画像データ入力
部、2は2値化された原画像データを横方向にランレン
グス符号化する横方向ランレングス符号器、3はメモ
リ、4は写真領域抽出手段である。この写真領域抽出手
段4は、画素列区間が写真部であるか否かを判別する画
素列区間属性判別手段5と、写真候補の縦方向ランレン
グス符号の生成を行う写真候補縦方向ランレングス符号
生成手段6と、写真候補部を統合して写真領域を生成す
る写真候補部統合手段7と、統合された写真領域の近傍
を補正する写真領域近傍補正手段8とから構成されてい
る。9は抽出写真領域データ出力部である。
する。 図1は、本発明の一実施例に係る領域抽出装置のブロ
ック構成図であり、1は2値化された原画像データ入力
部、2は2値化された原画像データを横方向にランレン
グス符号化する横方向ランレングス符号器、3はメモ
リ、4は写真領域抽出手段である。この写真領域抽出手
段4は、画素列区間が写真部であるか否かを判別する画
素列区間属性判別手段5と、写真候補の縦方向ランレン
グス符号の生成を行う写真候補縦方向ランレングス符号
生成手段6と、写真候補部を統合して写真領域を生成す
る写真候補部統合手段7と、統合された写真領域の近傍
を補正する写真領域近傍補正手段8とから構成されてい
る。9は抽出写真領域データ出力部である。
【0013】 図2は、横方向のスキャンラインの画素列を示す図
で、21から24は本発明の処理単位となる画素列区間(例
えば、8画素)を示している。
で、21から24は本発明の処理単位となる画素列区間(例
えば、8画素)を示している。
【0014】 図3は、本発明の処理の流れを示すフローチャートで
ある。 以下、本発明の動作を図を参照して詳細に説明する。 横方向ランレングス符号化(ステップ31); 2値化された原画像データを横方向ランレングス符号器
2によって符号化し、この符号化されたデータに対して
写真領域の抽出を行う。
ある。 以下、本発明の動作を図を参照して詳細に説明する。 横方向ランレングス符号化(ステップ31); 2値化された原画像データを横方向ランレングス符号器
2によって符号化し、この符号化されたデータに対して
写真領域の抽出を行う。
【0015】 ランレングス符号生成処理(ステップ32); 次いで、ランレングス符号生成手段6によって、写真候
補縦方向ランレングス符号の生成を行う。この生成処理
を図4に示す。すなわち、図5に示すように各ライン
(50から54)の各画素列区間(55から58)毎に、画素列
区間属性判別手段5が写真部であるか否かを判別し(図
4のステップ43)、この結果を“0"、“1"で2値化し、
縦方向(図5の59)にランレングス符号化する。ここ
で、写真部であるか否かの判別は、画素列区間内の黒画
素数が所定の閾値以上のとき、写真部と判定し、そうで
ないとき非写真部と判定する。
補縦方向ランレングス符号の生成を行う。この生成処理
を図4に示す。すなわち、図5に示すように各ライン
(50から54)の各画素列区間(55から58)毎に、画素列
区間属性判別手段5が写真部であるか否かを判別し(図
4のステップ43)、この結果を“0"、“1"で2値化し、
縦方向(図5の59)にランレングス符号化する。ここ
で、写真部であるか否かの判別は、画素列区間内の黒画
素数が所定の閾値以上のとき、写真部と判定し、そうで
ないとき非写真部と判定する。
【0016】 そして、縦方向ランレングスは1ライン処理する度に
順次更新し(ステップ44)、画像の上から下のラインへ
と順次処理を繰り返す(ステップ41、46)。ただし、本
実施例では、全てのラインについて処理するのではな
く、何本かのラインをスキップすることによって、その
処理量を減らすようにしている。
順次更新し(ステップ44)、画像の上から下のラインへ
と順次処理を繰り返す(ステップ41、46)。ただし、本
実施例では、全てのラインについて処理するのではな
く、何本かのラインをスキップすることによって、その
処理量を減らすようにしている。
【0017】 写真候補部統合処理(ステップ33); 写真候補部統合手段7は、上記ステップによって処理さ
れた写真候補部を統合して写真領域を生成する。すなわ
ち、写真候補部は、画素列区間内の濃度の高い部分が選
ばれているので、実際には、図6の例に示すように写真
候補部61中に空白部62(つまり、判定手段5で「非写真
部」と判定された部分)が生じる。そこで、空白部62が
生じないように写真候補部61を統合処理して、一つの写
真領域とする。この統合処理を以下、詳細に説明する
と、写真候補部を左方向からサーチして、縦方向に所定
の閾値T1以上の長さの写真候補部を探す。ここで、所定
の閾値T1としては、文書中の文字の高さより大きく、使
用される写真の最小のサイズより少し短い値とする。
れた写真候補部を統合して写真領域を生成する。すなわ
ち、写真候補部は、画素列区間内の濃度の高い部分が選
ばれているので、実際には、図6の例に示すように写真
候補部61中に空白部62(つまり、判定手段5で「非写真
部」と判定された部分)が生じる。そこで、空白部62が
生じないように写真候補部61を統合処理して、一つの写
真領域とする。この統合処理を以下、詳細に説明する
と、写真候補部を左方向からサーチして、縦方向に所定
の閾値T1以上の長さの写真候補部を探す。ここで、所定
の閾値T1としては、文書中の文字の高さより大きく、使
用される写真の最小のサイズより少し短い値とする。
【0018】 次いで、探索された写真候補部に接触する右側の写真
候補部を探す。図7(a)は、探索された写真候補部71
とそれに接触する写真候補部72、73を示す図である。7
4、76はそれぞれ写真候補部72、73の長さであり、また7
5は写真候補部72と73の間の空白部の長さである。そし
て、写真候補部72、73の長さ74と76が共に所定の閾値T2
よりも長く、空白部の長さ75が所定の閾値よりも短いと
きに、空白部を埋めて、図7(b)のように写真候補部
を一つの候補部77とする。この処理を画像の左から右に
順次行い、その処理が終了したら、同じ処理を右から左
方向に順次行う。左から右への処理の流れを図8に示
す。
候補部を探す。図7(a)は、探索された写真候補部71
とそれに接触する写真候補部72、73を示す図である。7
4、76はそれぞれ写真候補部72、73の長さであり、また7
5は写真候補部72と73の間の空白部の長さである。そし
て、写真候補部72、73の長さ74と76が共に所定の閾値T2
よりも長く、空白部の長さ75が所定の閾値よりも短いと
きに、空白部を埋めて、図7(b)のように写真候補部
を一つの候補部77とする。この処理を画像の左から右に
順次行い、その処理が終了したら、同じ処理を右から左
方向に順次行う。左から右への処理の流れを図8に示
す。
【0019】 以上の処理によって小さな空白部であって本来写真領
域であるような部分は、写真候補部に変換される。
域であるような部分は、写真候補部に変換される。
【0020】 領域近傍補正処理(ステップ34); 写真領域近傍補正手段8は、上記したようにして統合さ
れた写真領域の近傍を補正する。すなわち、図7の如く
統合された写真領域は、本来抽出すべき写真領域とは一
致しないので、つまり写真領域の判定を画素列区間を単
位にして行っているため、この単位を僅かに超える写真
領域の画素は写真領域として判定されない場合があるこ
とと、処理ラインが間引かれているために、統合された
写真領域に対してその近傍を補正しなけばならない。
れた写真領域の近傍を補正する。すなわち、図7の如く
統合された写真領域は、本来抽出すべき写真領域とは一
致しないので、つまり写真領域の判定を画素列区間を単
位にして行っているため、この単位を僅かに超える写真
領域の画素は写真領域として判定されない場合があるこ
とと、処理ラインが間引かれているために、統合された
写真領域に対してその近傍を補正しなけばならない。
【0021】 この近傍補正は、図9に示すように、既に抽出された
写真領域(91から96)の近傍にある黒画素が連結した小
さな塊(以下、黒画素の塊)97を写真領域に統合するこ
とによって行われる。ただし、この黒画素の塊97は、既
に抽出された写真領域(91から96)の外接矩形98よりや
や大きい矩形に接触し、且つ図10に示すように、黒画素
の塊101の外接矩形102と抽出された写真領域103、104と
の縦方向、横方向の距離105、106が所定の閾値以下でな
ければならない。
写真領域(91から96)の近傍にある黒画素が連結した小
さな塊(以下、黒画素の塊)97を写真領域に統合するこ
とによって行われる。ただし、この黒画素の塊97は、既
に抽出された写真領域(91から96)の外接矩形98よりや
や大きい矩形に接触し、且つ図10に示すように、黒画素
の塊101の外接矩形102と抽出された写真領域103、104と
の縦方向、横方向の距離105、106が所定の閾値以下でな
ければならない。
【0022】 以上の処理によって、抽出された領域の周囲に多少の
凹凸を有する写真領域データが出力される。このように
若干の凹凸があっても、文字認識あるいは画像符号化の
ための前処理用の写真領域データとしては十分に満足で
きるものである。
凹凸を有する写真領域データが出力される。このように
若干の凹凸があっても、文字認識あるいは画像符号化の
ための前処理用の写真領域データとしては十分に満足で
きるものである。
【0023】
以上、説明したように、本発明によれば、横方向のス
キャンライン上の画素列単位毎に写真領域か否かを判定
しているので、ランレングスコードを利用することがで
き、従って高速に写真領域の抽出処理を行うことができ
る。
キャンライン上の画素列単位毎に写真領域か否かを判定
しているので、ランレングスコードを利用することがで
き、従って高速に写真領域の抽出処理を行うことができ
る。
【0024】 また、スキャンラインを適宜間引いて処理することに
よって、従来の方法に比べて、処理量を削減することが
できる。
よって、従来の方法に比べて、処理量を削減することが
できる。
【0025】 更に、写真領域の近傍に存在する画素塊を補正処理し
ているので、本来の写真領域にほぼ一致した領域を画像
中から抽出することが可能となる。
ているので、本来の写真領域にほぼ一致した領域を画像
中から抽出することが可能となる。
【図1】 本発明の一実施例に係る領域抽出装置のブロック構成図
である。
である。
【図2】 横方向のスキャンラインの画素列を示す図である。
【図3】 本発明の処理の流れを示すフローチャートである。
【図4】 本発明の写真候補縦方向ランレングス符号の生成処理の
フローチャートである。
フローチャートである。
【図5】 縦方向ランの説明図である。
【図6】 抽出写真候補の例を示す図である。
【図7】 (a)、(b)は、写真候補を統合した例を示す図であ
る。
る。
【図8】 写真候補部の統合処理の流れを示すフローチャートであ
る。
る。
【図9】 近傍補正を説明する図である。
【図10】 黒画素の塊の外接矩形と抽出された写真領域との距離関
係を説明する図である。
係を説明する図である。
【符号の説明】 1……原画像データ入力部 2……横方向ランレングス符号器 3……メモリ 4……写真領域抽出手段 5……画素列区間属性判別手段 6……写真候補縦方向ランレングス符号生成手段 7……写真候補部統合手段 8……写真領域近傍補正手段 9……抽出写真領域データ出力部
フロントページの続き (56)参考文献 特開 平3−208467(JP,A) 特開 平2−86369(JP,A) 特開 昭63−205238(JP,A) 特開 昭62−241082(JP,A) 特開 昭61−194968(JP,A) 特開 昭61−237173(JP,A) 特開 昭63−304387(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 1/40 - 1/409 H04N 1/46 H04N 1/60
Claims (2)
- 【請求項1】2値化された文書画像データを横方向にラ
ンレングス符号化し、該符号化されたデータから写真領
域を抽出する写真領域抽出装置において、前記符号化さ
れたデータの横方向の各スキャンラインについて、所定
の大きさの画素列区間(以下、区間)毎に写真部か否か
を判定する手段と、前記スキャンラインの縦方向の区間
毎に、前記判定された写真部を、所定ラインについて縦
方向にランレングス符号化する手段と、該符号化された
写真部(以下、写真候補部)の縦方向の長さを調べ、所
定の閾値以上の長さで、横方向に接触している複数の写
真候補部を統合すると共に、前記複数の写真候補部の
内、縦方向にある第1の写真候補部と第2の写真候補部
の間の、所定の閾値以下の長さの空白部を写真候補部に
変換することにより写真領域に統合する手段とを備えた
ことを特徴とする写真領域抽出装置。 - 【請求項2】前記統合された写真領域の近傍に存在する
黒画素の塊を写真領域をさらに統合することにより、前
記写真領域の近傍を補正する手段を更に備えたことを特
徴とする請求項1記載の写真領域抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02292440A JP3100619B2 (ja) | 1990-10-30 | 1990-10-30 | 写真領域抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02292440A JP3100619B2 (ja) | 1990-10-30 | 1990-10-30 | 写真領域抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04165870A JPH04165870A (ja) | 1992-06-11 |
JP3100619B2 true JP3100619B2 (ja) | 2000-10-16 |
Family
ID=17781823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02292440A Expired - Fee Related JP3100619B2 (ja) | 1990-10-30 | 1990-10-30 | 写真領域抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3100619B2 (ja) |
-
1990
- 1990-10-30 JP JP02292440A patent/JP3100619B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04165870A (ja) | 1992-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940936B2 (ja) | 表領域識別方法 | |
US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
WO2009114967A1 (zh) | 基于移动扫描的图像处理方法及装置 | |
JP2001266068A (ja) | 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体 | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
JP3100619B2 (ja) | 写真領域抽出装置 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JP3331095B2 (ja) | 車載用画像処理装置 | |
JP2871590B2 (ja) | 画像抽出方式 | |
JP3281469B2 (ja) | 文書画像の傾き検出方法および装置 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP3162414B2 (ja) | 罫線認識方法及び表処理方法 | |
JP2800192B2 (ja) | 高速文字図形分離装置 | |
JP3850488B2 (ja) | 文字抽出装置 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JPH0660220A (ja) | 文書画像の領域抽出方法 | |
JP3020293B2 (ja) | 属性判別方法 | |
JPH02166583A (ja) | 文字認識装置 | |
JP2004152048A (ja) | 車両ナンバー読み取り装置 | |
JPH04276888A (ja) | 文字読取装置 | |
JPH08171609A (ja) | 文字列高速抽出装置 | |
JPH06223224A (ja) | 行切出し方法 | |
JP2670074B2 (ja) | 車両番号認識装置 | |
JP4248700B2 (ja) | 罫線識別方法、罫線識別装置および記録媒体 | |
JPS6361382A (ja) | 線画像からの文字成分除去方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080818 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |