JP3556408B2 - 領域抽出方法 - Google Patents

領域抽出方法 Download PDF

Info

Publication number
JP3556408B2
JP3556408B2 JP24833296A JP24833296A JP3556408B2 JP 3556408 B2 JP3556408 B2 JP 3556408B2 JP 24833296 A JP24833296 A JP 24833296A JP 24833296 A JP24833296 A JP 24833296A JP 3556408 B2 JP3556408 B2 JP 3556408B2
Authority
JP
Japan
Prior art keywords
block
projection histogram
main scanning
area
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24833296A
Other languages
English (en)
Other versions
JPH1097664A (ja
Inventor
浩慶 土橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP24833296A priority Critical patent/JP3556408B2/ja
Publication of JPH1097664A publication Critical patent/JPH1097664A/ja
Application granted granted Critical
Publication of JP3556408B2 publication Critical patent/JP3556408B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Inspection Of Paper Currency And Valuable Securities (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は印刷物上の特定領域を抽出する方法に関し、特に文字や模様等の位置が予め分かっている印刷物の印刷欠陥や汚れを検出するために用いられる領域抽出方法に関する。
【0002】
【従来の技術】
従来の領域抽出方法は、印刷物の両端(左右上下)を基準に、そこからの距離を各領域ごとに予め規定しておき、その距離を用いて目的とする領域を抽出している。この場合、印刷物の両端と背景とのコントラストを大きくして、印刷物の両端を抽出しやすいようにしている。
【0003】
【発明が解決しようとする課題】
従来の方法においては、印刷物の搬送ムラや折れ、傾き、横ずれ及び汚れにより、印刷物の両端の位置がずれ、その結果目的とする領域の印刷物の端からの距離がずれてしまい、目的の領域を正確に抽出することができないという問題点があった。
【0004】
従って本発明は印刷物の搬送ムラや傾きや横ずれによる影響を低減し、印刷物の上下左右の端のみを基準にそこからの距離で抽出したい領域を抽出する従来方法に比べて、高精度に目的の領域を抽出することができる領域抽出方法を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記課題を解決するために本発明による領域抽出方法は、印刷物の画像データをもとに、主走査方向の特定幅を持った複数のブロックを算出し、各ブロックごとに主走査方向の射影ヒストグラムを算出し、この射影ヒストグラムを用いて印刷物画像内の特定領域、即ち白領域を抽出する。
【0006】
更に、本発明の領域抽出方法は、対象となる印刷物の特定領域を抽出する方法において、前記印刷物の画像データを入力する画像入力ステップと、前記画像入力ステップで得られた画像データをもとに、特定の主走査幅を持った複数のブロックを算出するブロック算出ステップと、前記ブロック算出ステップより得られたブロックごとに主走査方向の射影ヒストグラムを算出する射影ヒストグラム算出ステップと、前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップとを具備したことを特徴とする。
【0007】
又、本発明の領域抽出方法は、対象となる印刷物の特定領域を抽出する方法において、前記印刷物の画像データを入力する画像入力ステップと、前記画像入力ステップで得られた画像データをもとに、特定の主走査幅を持ったブロックをオーパーラップさせたブロックを算出するオーバーラップブロック算出ステップと、前記オーパーラップブロック算出ステップより得られたブロックごとに主走査方向の射影ヒストグフムを算出する射影ヒストダラム算出ステップと、前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップとを具備したことを持徴とする。
【0008】
又、本発明の領域抽出方法は、対象となる印刷物の特定領域を抽出する方法において、前記印刷物の画像データを入力する画像入力ステップと、予め分かっている模様の主走査幅を辞書として登録する主走査幅記億ステップと、前記画像入力ステップで得られた画像データをもとに、前記主走査幅記億ステップにより予め分かっている模様の主走査幅に合わせたブロックを算出する可変ブロック算出ステップと、前記可変ブロック算出ステップより得られたブロックごとに主走査方向の射影ヒストグラムを算出する射影ヒストグラム算出ステップと、前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップとを具備したことを特徴とする。
【0009】
又、本発明の領域抽出方法は、対象となる印刷物の特定領域を抽出する方法において、前記印刷物の画像データを入力する画像入力ステップと、前記画像入力ステップで得られた画像データをもとに、ある特定の主走査幅を持ったブロックを算出するブロック算出ステップと、予め分かっている模様の主走査幅を辞書として登録する主走査幅記億ステップと、前記主走査幅記億ステップより、ある特定のブロックは、前記ブロック算出ステップより得られたブロックごとに、主走査方向の射影ヒストグラムを算出し、別のブロックでは、前記ブロック算出ステップより得られたブロックを、そのブロックに存在する模様の主走査幅に合わせたブロックに細分割し、主走査方向の射影ヒストグラムを算出する射影ヒストグラム算出ステップと、前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップとを具備したことを特徴とする。
【0010】
更に本発明による領域抽出方法の前記ブロック算出ステップは、前記画像入力ステップで得られた画像データを2値化し、黒画素及び白画素を区別する2値化ステップを含み、射影ヒストグラム算出ステップは、白画素と黒画素が混在する領域について、更に副走査方向の射影ヒストグラムを算出する副走査方向射影ヒストグラム算出ステップを含み、前記領域抽出ステップは前記副走査方向の射影ヒストグラムを用いて前記特定領域を抽出するステップを含むことを特徴とする。
【0011】
又、本発明による領域抽出方法の前記領域抽出ステップは、前記射影ヒストグラム内の白画素と黒画素が混在する領域について、黒画素の画素数が所定値以下の領域を前記特定領域として抽出するステップを含むことを特徴とする。
【0012】
【発明の実施の形態】
以下、印刷物の特定領域を抽出する本発明による領域抽出方法の実施の形態を図面を参照して説明する。
図1は、本発明の第1の実施例に係わる領域抽出システムのブロック図である。また、図2は、本発明の実施例に係わる領域抽出システムの処埋方法を示すフローチャートである。
【0013】
印刷物Pは、ラインセンサなどの画像入力部101により、例えば印刷物の一方の面の全ラインの画像データが読み取られ、読み取られた画像データ(アナログ信号)は、AD変換部102によりデジタル化され、さらに2値化処理部103により固定閾値て2値化される。2値化された画像データをもとに、ブロック算出部104により、ある特定の主走査幅を持った各ブロックを算出し、算出されたブロックをもとに、射影ヒストグラム算出部105により、ブロックごとに主走査方向(以下、横方向)及び副走査方向(以下、縦方向)の射影ヒストグラムを算出する。さらに、領域抽出部106により、射影ヒストグラムを用いて模様(図形)や文字以外の領域を抽出する。この場合、抽出される領域は白領域である。印刷物上の予め分かっている白領域と、抽出された白領域が比較され、白領域中の汚れや印刷欠陥等が後の処理で検出されるが、本発明は白領域の抽出を目的とする。
【0014】
以下、各処理部を詳細に説明する。
画像入力部101は、印刷物全面の画像データをアナログ信号として収集する。ここでは、印刷物を搬送させて画像データを読み取る場合を例に説明するが、受光部を走査させて読み取る場合も同様である。
【0015】
図3は、画像入力部101の構成を示している。図3のように、画像入力部101は、受光部201、照明用光源202、基準板203から構成され、それぞれ図3に示す位置に配置されている。受光部201には、印刷物Pから垂直に反射光が入力されるか、又は、光源202が印刷物Pの下側に配置した構成の場合は、受光部201には透過光が入力される。照明用光源202は、印刷物Pと受光部201を結ぶ線Lからの角度が、0゜、もしくは、90゜に近くなることを避けるように設け、例えば、角度30゜〜60゜の間に設置する。図3は、搬送方向に対して進行方向から照明する場合を図示してあるが、後方から照明してもよい。
【0016】
また、印刷物Pは図3に示すようにローラにより搬送され、基準板203は、画像データが読み取られる印刷物Pの背面に配置される。この基準板203の役割を図4に示す印刷物を例として具体的に説明する。図4は、白紙内に白以外のインクにより種々の矩形模様(図形)や文字などが印刷されている画像であり、抽出する領域は図6に示す斜線領域、すなわち、画像データの矩形模様領域と文字領域以外の領域とする。
【0017】
まず、印刷物Pの背景に配置される基準板203は、印刷物の用紙に対してコントラストの高い色、例えば図4のように白色の用紙の場合は黒とする。これは、画像データを解析する場合に印刷物Pの位置を容易に決定できるようにするためである。この基準板203は、表裏に印刷のある印刷物Pを搬送させた場合、インクが付着してコントラストが低下しないように、汚れにくい物質でなければならない。
【0018】
AD変換部102では、画像入力部101で取り込まれた画像データ(アナログ信号)をデジタル信号に変換する処理を行う。
2値化処理部103では、AD変換部102により得られた濃淡画像データ(デジタル信号)に対して2値のデータに変換する処理を施す。濃淡画像の2値化方法として公知である「大津の判別分析法」などにより、2値化を行う。ここで、面像データ上では、値「1」は文章や図形などであり、値「0」は用紙である。また、印刷物Pの背景の部分は、値「1」となるような処理を施す。
【0019】
ブロック算出部104と射影ヒストグラム105と領域抽出部106では、印刷物Pの左角を抽出し(図2のステップ11)、左角から各ブロックごとに横方向の射影を算出する(図2のステップ12)。次に、算出した射影ヒストグラムから白の領域を抽出し(図2のステップ13)、さらに、縦方向の射影ヒストグラムを用いて(図2のステップ14)、黒領域と白領域の混在している領域での白領域の抽出を行う(図2のステップ15)。このように、抽出したい領域を分割したブロックごとに射影処理を用いて抽出する。
【0020】
次にこの射影処理を詳細に説明する。ブロック算出部104では、まず、主走査方向の左右いずれかの角、例えば、図7の左角(点A)の位置(座標)を抽出する。左角(点A)の位置(座標)を抽出する場合、画像データを左上から主走査方向及び副走査方向に1ラインずつ走査し、左角(点A)が見つかるまで走査していく。例えば、画像データの大きさをM×N(画素)とし、各画素における濃度値をFij(0≦i<M、0≦j<N.Fij=「1」or「0」)とすると、図8に示すように、まず、画像の左上から主走査方向に一行だけ検索し、Fij=1なる画素位置(以下、開始位置と呼ぶ)を検出する。もし検出されなければ、次のラインを前記同様に検索し、左角(点A)を検出する。前記「一行だけ検索する」とは、例えば左上から右方向に検索する場合、Fijのiとjの値を、j=0として、0≦i<Mと変化させていくことを意味している。
【0021】
次に、左角(点A)をもとに、例えば図9のように、主走査幅w×副走査幅hの大きさのブロックを算出する。ここでw及びhは共に画素数で表されている。さらに、射影ヒストグラム算出部105では、ブロック算出部104より算出した各ブロックごとに、横方向の射影ヒストグラムを算出していく。
【0022】
ここで、ブロックの主走査幅wは、矩形模様間の縦方向の画素数と印刷物Pの最大回転角によって決定する。例えば、抽出したい領域の縦方向の画素数、すなわち、矩形模様間の縦方向の画素数をc、印刷物Pの最大回転角をθとすると、
tanθ=c/w
従ってブロックの主走査幅wは、
w=c/tanθ
により算出される。ここで、ブロックの主走査幅は、wに固定する必要はなく、wより小さい値に設定しても良い。これにより、抽出される領域が多くなり精度が向上する。また、ブロックの副走査幅hは、画像データの縦幅とする。
【0023】
図10に、あるブロックの主走査方向の射影ヒストグラムの例を示す。図10中、例ば、「D」の部分が模様(図形)領域を示し、「H」の部分が模様(図形)以外の領域(ここでは抽出したい領域)を示している。また、印刷物P以外の領域、すなわち背景の領域は、前記2値化処理部により、値「1」としているため、射影ヒストグラムにおいては、図10にハッチングで示すような部分にあらわれる。
【0024】
領域抽出部106では、射影ヒストグラム算出部105より得られた、各ブロックごとの射影ヒストグラムから、累積黒画素数が、「0」の領域、すなわち白の領域(図10中「H」の部分)を抽出する。また、累積黒画素が(w−1)以下の場合は、その領域(図10中「C」の部分)において、副走査方向の射影ヒストグラムを算出する。図11に、副走査方向の射影ヒストグラムの例を示す。この射影ヒストグラムから、前記同様に累積黒画素数が「0」の領域、すなわち白領域(図11中「L」の部分)を抽出する。
【0025】
また、画像データに例えば図12のようにノイズが含まれていることがあるため、前記主走査方向及び副走査方向の射影ヒストグラムにおいて、累積黒画素数を「0」とせずに、例えば「1」以下の領域あるいは「2」以下の領域を白領城として抽出することで精度良く抽出したい領域を抽出することが可能である。
【0026】
ここで、累積黒画素が(w−1)以下の場合に上記のように副走査方向の射影ヒストグラムを用いて白領域を抽出する理由について説明する。累積黒画素数が(w−1)以下という場合は、例えば、図13(a)のように、矩形模様領域だけではなく、矩形以外の模様(図形)や文字が印刷物Pに存在する場合、あるいは矩形模様領域は存在するが主走査方向の幅が(w−1)以下である場合、図13(b)のような射影ヒストグラムが算出される。従って、主走査方向のヒストグラムだけでは図13(a)の斜線部のような領域(ブロック内で、主走査方向に黒領域と白領域が混在している領域)が抽出できないためである。この場合、前記のように累積黒画素数が(w−1)以下とすることで、図13(b)の斜線部の領域が抽出できることになる。
【0027】
次に本発明の第2の実施例について説明する。
図14は、本発明の第2の実施例に係わる領域抽出方法のブロック図である。
画像入力部301とAD変換部302及び2値化処理部303は、第1の実施例における画像入力部101とAD変換部102及び2値化処理部103と同様である。オーパーラップブロック算出部304により、ある特定の主走査幅を持ったブロックをオーパーラップさせて算出し、算出されたブロックをもとに、射影ヒストグラム算出部305により、各オーパーラップしたブロックごとに主走査方向及び副走査方向の射影ヒストグラムを算出する。さらに、領域抽出部306により、射影ヒストグラムを用いて模様(図形)や文字以外の領域を抽出する。
【0028】
以下に、オーパーラップブロック算出部304と射影ヒストグラム算出部305と領域抽出部306の具体的な処理方法について説明する。
オーバーラッブブロック算出部304では、印刷物Pの左角を抽出し、左角からある特定の主走査幅を持ったブロックをオーバーラッブさせたブロックを算出する。次に、射影ヒストグラム算出部305により、各オーバーラップさせたブロックごとに主走査方向の射影を算出する。次に、領域抽出部306により、射影ヒストグラム算出部305により算出した射影ヒストグラムから白の領域を抽出し、さらに、副走査方向の射影ヒストグラムを用いて、黒領域と白領域の混在している領域での白領域の抽出を行う。このように、抽出したい領域をある特定の主走査幅を持ったブロックをオーバーラッブさせたブロックごとに射影処理を用いて抽出する。
【0029】
以下にオーバーラッブブロック算出部304での処理について説明する。
図7の主走査方向の左右いずれかの角、例えば左角(点A)の位置(座標)を抽出する方法については、第1の実施例と同様である。
【0030】
次に、左角(点A)をもとに、主走査幅w×副走査幅hの大きさのブロックごとに、主走査方向の射影ヒストグラムを算出していくが、各ブロックをオーパーラップさせてたブロック(図15参照)を算出する。すなわち、第1のブロックが、例えば左角(点A)からSだけ離れた主走査幅wのブロックとすると、第2のブロックは、例えば、左角(点A)から主走査方向にS+(w/2)離れた距離にある主走査幅wのブロックを算出することになる。
【0031】
射影ヒストグラム算出部305では、オーパーラップブロック算出部304により得られた各ブロックごとに、主走査方向の射影ヒストグラムを算出していく。ここで、第1の実施例同様、ブロックの主走査幅wは、矩形模様間の副走査方向の画素数と印刷物Pの最大回転角によって決定する。例えば、抽出したい領域の副走査方向の画素数、すなわち、矩形模様間の副走査方向の画素数をc、印刷物Pの最大回転角をθとすると、ブロックの主走査幅wは、
w=c/tanθ
により算出される。また、ブロックの副走査幅はhは、画像データの縦幅とする。
【0032】
領域抽出部306では、各ブロックごとの主走査方向の射影ヒストグラムから、第1の実施例と同様に、累積黒画素数が、「0」の領域、すなわち白の領域を抽出する。また、累積黒画素が(w−1)以下の場合は、その領域において、副走査方向の射影ヒストグラムを算出する。この射影ヒストグラムから、前記同様に累積黒画素が「0」の領域、すなわち白領域を抽出する。
【0033】
また、画像データに例えば図12のようにノイズが含まれていることがあるため、前記累積黒画素数を「0」とせずに、例えば「1」以下の領域あるいは「2」以下の領域を白領域として抽出することで精度良く抽出したい領域を抽出することが可能である。また、累積黒画素が(w−1)以下の場合に上記のように副走査方向の射影ヒストグラムを用いて白領域を抽出する理由については、第1の実施例と同様である。
【0034】
次に本発明の第3の実施例について説明する。
図16は、本発明の第3の実施例に係わる領域抽出方法のブロック図である。
画像入力部401とAD変換部402及び2値化処理部403は、第1の実施例における画像入力部101とAD変換部102及び2値化処理部103と同様である。主走査幅記憶部407は予め分かっている模様の主走査幅を辞書として登録している。可変ブロック算出部404及び主走査幅記憶部407により、印刷物Pの模様(模様)や文字各々に応じた主走査幅を持ったブロックを算出し、算出された各ブロックをもとに、射影ヒストグラム算出部405により、各ブロックごとに主走査方向及び副走査方向の射影ヒストグラムを算出する。さらに、領域抽出部406により、射影ヒストグラムを用いて模様(図形)や文字以外の領域を抽出する。
【0035】
以下に、可変ブロック算出部404と射影ヒストグラム算出部405と領域抽出部406及び主走査幅記憶部407の具体的な処理方法について説明する。主走査幅記憶部407は左角から印刷物Pの模様(図形)や文字の主走査幅を記憶している。可変ブロック算出部404では、印刷物Pの左角を抽出し、主走査幅記憶部407からの情報をもとに、印刷物Pの模様(図形)や文字の主走査幅に応じた各ブロックを算出する。さらに、射影ヒストグラム算出部405により各ブロックごとに主走査方向の射影を算出する。次に、算出した射影ヒストグラムから白の領域を抽出し、さらに、副走査方向の射影ヒストグラムを用いて、黒領域と白領域の混在している領域での白領域の抽出を行う。このように、抽出したい領域を印刷物Pの模様(図形)や文字の主走査幅に応じたブロックごとに射影処理を用いて抽出する。
【0036】
以下に可変ブロック算出部404での処理について説明する。
図7の主走査方向の左右いずれかの角、例えば左角(点A)の位置(座標)を抽出する方法については、第1の実施例と同様である。
【0037】
次に、左角(点A)をもとに、主走査幅w×副走査幅hの大きさのブロックごとに、主走査方向の射影ヒストグラムを算出していくが、主走査幅wの大きさが第1の実施例や第2の実施例のように固定値ではなく、印刷物Pの模様(図形)や文字が予め分かっている場合は、図17に示すように、主走査幅記億部407により、その模様(図形)や文字の主走査方向の幅に合わせてブロックの主走査幅を変更して、各々ブロックを算出する。このようにブロックの主走査幅を変更する理由は、主走査幅wを模様(図形)や文字の幅に合わせると、算出されるヒストグラムが簡単な形状(主走査方向画素数がw又は0)となり、処理速度が向上するからである。
【0038】
射影ヒストグラム算出部405では、可変ブロック算出部404により得られた各ブロックごとに、主走査方向の射影ヒストグラムを算出する。ここで、第1の実施例同様、ブロックの主走査幅wは、矩形模様間の副走査方向の画素数と印刷物Pの最大回転角によって決定する。例えば、抽出したい領域の副走査方向の画素数、すなわち、矩形模様間の副走査方向の画素数をc、印刷物Pの最大回転角をθとすると、ブロックの主走査幅wは、
w=c/tanθ
により算出される。また、ブロックの副走査幅hは、画像データの縦幅とする。
【0039】
領域抽出部406では、射影ヒストグラム算出部405により得られた各ブロックごとの主走査方向の射影ヒストグラムから、第1の実施例と同様にして、累積黒画素数が、「0」の領域、すなわち白の領域を抽出する。また、累積黒画素が(w−1)以下の場合は、その領域において、副走査方向の射影ヒストグラムを算出する。この射影ヒストグラムから、前記同様に累積黒画素が「0」の領域、すなわち白領域を抽出する。
【0040】
また、画像データに例えば図12のようにノイズが含まれていることがあるため、前記累積黒画素数が「0」とせずに、例えば「1」以下の領域あるいは「2」以下の領域を白領域として抽出することで精度良く抽出したい領域を抽出することが可能である。ここで、累積黒画素が(w−1)以下の場合に上記のように副走査方向の射影ヒストグラムを用いて白領域を抽出する理由についても第1の実施例と同様である。
【0041】
次に本発明の第4の実施例について説明する。
図18は、本発明の第4の実施例に係わる領域抽出方法のブロック図である。画像入力部501とAD変換部502及び2値化処理部503は、第1の実施例における画像入力部101とAD変換部102及び2値化処理部103と同様である。ブロック算出部504により、ある特定の主走査幅を持ったブロックを算出し、算出されたブロック及び、主走査幅記億部507に記憶されている印刷物Pの模様(図形)や文字の主走査幅の情報をもとに、可変射影ヒストグラム算出部505により、ブロックごとに主走査方向及び副走査方向の射影ヒストグラムを算出する。さらに、領域抽出部506により、射影ヒストグラムを用いて模様(図形)や文字以外の領域を抽出する。
【0042】
以下に、ブロック算出部504と可変射影ヒストグラム算出部505と領域抽出部506及び主走査幅記憶部507の具体的な処理方法について説明する。
ブロック算出部504では、印刷物Pの左角を抽出し、左角からある特定の主走査幅を持ったブロックを算出する。主走査幅記憶部507に記憶されている印刷物Pの模様(図形)や文字の主走査幅の情報をもとに、ブロック算出部504により算出されたブロックごとに、その主走査幅をさらに主走査方向に分割し、その分割されたブロックごとに主走査方向の射影を算出する。次に、算出した射影ヒストグラムから白の領域を抽出し、さらに、縦方向の射影ヒストグラムを用いて、黒領域と白領域の混在している領域での白領域の抽出を行う。このように、抽出したい領域をある特定の主走査幅をさらに印刷物Pの模様(図形)や文字の主走査幅に応じて分割したブロックごとに射影処理を用いて抽出する。
【0043】
以下にブロック算出部504での処理について説明する。
図7の主走査方向の左右いずれかの角、例えば左角(点A)の位置(座標)を抽出する方法については、第1の実施例と同様である。
【0044】
次に、左角(点A)をもとに、主走査幅w×副走査幅hの大きさのブロックを算出する。
可変射影ヒストグラム算出部505では、ブロック算出部504により得られた各ブロックごとに、主走査方向の射影ヒストグラムを算出していくが、主走査幅wの大きさは第1の実施例や第2の実施例のように固定値ではあるが、印刷物Pの模様(図形)や文字が予め分かっている場合は、主走査幅記億部507に記億されている印刷物Pの模様(図形)や文字の主走査幅の情報をもとに、その模様(図形)や文字の幅に主走査幅にあわせてブロックを算出する。更に可変射影ヒストグラム算出部505は、ブロックの主走査幅wを細分割して、分割したブロックごとに、主走査方向の射影ヒストグラムを算出する。すなわち、図19において、左から3番目のブロックTの幅はwであるが、このブロック中の模様に合わせて、例えば主走査幅wをw/2とw/2のブロックに分割して、各々主走査方向の射影ヒストグラムを算出していく。
【0045】
ここで、第1の実施例同様、ブロックの主走査幅wは、矩形模様間の副走査方向の画素数と印刷物Pの最大回転角によって決定する。例えば、抽出したい領域の副走査方向の画素数、すなわち、矩形模様間の副走査方向の画素数をc、印刷物Pの最大回転角をθとすると、ブロックの主走査幅wは、
w=c/tanθ
により算出される。また、ブロックの副走査幅hは、画像データの副走査幅とする。
【0046】
領域抽出部506では、可変射影ヒストグラム算出部505により得られた各ブロック(細分割ブロックも含む)ごとの主走査方向の射影ヒストグラムから、第1の実施例と同様にして、累積黒画素数が、「0」の領域、すなわち白の領域を抽出する。また、累積黒画素が(w−1)以下の場合は、その領域において、副走査方向の射影ヒストグラムを算出する。この射影ヒストグラムから、前記同様に累積黒画素が「0」の領域、すなわち白領域を抽出する。
【0047】
また、画像データに例えば図12のようにノイズが含まれていることがあるため、前記累積黒画素数が「0」とせずに、例えば「1」以下の領域あるいは「2」以下の領域を白領域として抽出することで精度良く抽出したい領域を抽出することが可能である。ここで、累積黒画素が(w−1)以下の場合に上記のように副走査方向の射影ヒストグラムを用いて白領域を抽出する理由については、第1の実施例と同様である。
なお、この発明は上記実施例に限定されるものではなく、発明の要旨を変えない範囲において種々変形実施可能なことは勿論である。
【0048】
【発明の効果】
以上説明したように本発明によれば、縦方向に分割したブロックごとに、印刷物Pの矩形模様などの濃い模様領域を基準にして、横方向及び縦方向の射影処理を用いて、印刷物Pの抽出したい領域を抽出することで、印刷物Pの搬送ムラや傾きや横ずれによる影響を低減することが可能となり、印刷物Pの上下左右の端を基準にそこからの距離のみで抽出したい領域を抽出する従来の方法に比べて、高精度に抽出することができる。
【図面の簡単な説明】
【図1】図1は本発明の第1の実施例に係る領域抽出システムの構成を示すブロック図。
【図2】図2は本発明の第1の実施例に係る領域抽出部での処理方法を示すフローチャー卜。
【図3】図3は図1画像入力部の構成を示す図。
【図4】図4は印刷物画像の例を示す図。
【図5】図5は画像入力部における印刷物の背景の構成を示す図。
【図6】図6は印刷物から抽出する領域の例を示す図。
【図7】図7は画像データ上の印刷物の左角を示す図。
【図8】図8は画像データから印刷物の左角を探索する方法を示す図。
【図9】図9は画像データから横方向の射影ヒストグラムを算出する処理を説明するための図。
【図10】図10はあるブロックの横方向の射影ヒストグラムの例を示す図。
【図11】図11はあるブロック内での縦方向の射影ヒストグラムの例を示す図。
【図12】図12は画像データ上のノイズを示す図。
【図13】図13は画像データ上の縦方向の射影ヒストグラムを算出する処理を説明するための図。
【図14】図14は本発明の第2の実施例に係る領域抽出システムの構成を示すブロック図。
【図15】図15は本発明の第2の実施例に係る横方向の射影ヒストグラムを算出する処理を説明するための図。
【図16】図16は本発明の第3の実施例に係る領域抽出システムの構成を示すブロック図。
【図17】図17は本発明の第3の実施例に係る横方向の射影ヒストグラムを算出する処理を説明するための図。
【図18】図18は本発明の第4の実施例に係る領域抽出システムの構成を示すブロツク図。
【図19】図19は本発明の第4の実施例に係る横方向の射影ヒストグラムを算出する処理を説明するための図。

Claims (7)

  1. 対象となる印刷物の特定領域を抽出する方法において、
    前記印刷物の画像データを入力する画像入力ステップと、
    前記画像入力ステップで得られた画像データをもとに、特定の主走査幅を持った複数のブロックを算出するブロック算出ステップと、
    前記ブロック算出ステップより得られたブロックごとに主走査方向の射影ヒストグラムを算出する射影ヒストグラム算出ステップと、
    前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップ、
    とを具備したことを特徴とする領域抽出方法。
  2. 対象となる印刷物の特定領域を抽出する方法において、
    前記印刷物の画像データを入力する画像入力ステップと、
    前記画像入力ステップで得られた画像データをもとに、特定の主走査幅を持ったブロックをブロックごとにオーパーラップするように算出するオーバーラップブロック算出ステップと、
    前記オーパーラップブロック算出ステップより得られたブロックごとに主走査方向の射影ヒストグフムを算出する射影ヒストダラム算出ステップと、
    前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップ、
    とを具備したことを持徴とする領域抽出方法。
  3. 対象となる印刷物の特定領域を抽出する方法において、
    前記印刷物の画像データを入力する画像入力ステップと、
    予め分かっている模様の主走査幅を辞書として登録する主走査幅記億ステップと、
    前記画像入力ステップで得られた画像データをもとに、前記主走査幅記億ステップにより予め分かっている模様の主走査幅に合わせたブロックを算出する可変ブロック算出ステップと、
    前記可変ブロック算出ステップより得られたブロックごとに主走査方向の射影ヒストグラムを算出する射影ヒストグラム算出ステップと、
    前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップ、
    とを具備したことを特徴とする領域抽出方法。
  4. 対象となる印刷物の特定領域を抽出する方法において、
    前記印刷物の画像データを入力する画像入力ステップと、
    前記画像入力ステップで得られた画像データをもとに、ある特定の主走査幅を持ったブロックを算出するブロック算出ステップと、
    予め分かっている模様の主走査幅を辞書として登録する主走査幅記億ステップと、
    前記主走査幅記億ステップより、ある特定のブロックは、前記ブロック算出ステップより得られたブロックごとに、主走査方向の射影ヒストグラムを算出し、別のブロックでは、前記ブロック算出ステップより得られたブロックを、そのブロックに存在する模様の主走査幅に合わせたブロックに細分割し、主走査方向の射影ヒストグラムを算出する射影ヒストグラム算出ステップと、
    前記射影ヒストグラム算出ステップより得られた射影ヒストグラムを用いて前記特定領域を抽出する領域抽出ステップ、
    とを具備したことを特徴とする領域抽出方法。
  5. 前記ブロック算出ステップは、前記画像入力ステップで得られた画像データを2値化し、黒画素及び白画素を区別する2値化ステップを含むことを特徴とする請求項1乃至4内の1項に記載の領域抽出方法。
  6. 射影ヒストグラム算出ステップは、白画素と黒画素が混在する領域について、更に副走査方向の射影ヒストグラムを算出する副走査方向射影ヒストグラム算出ステップを含み、
    前記領域抽出ステップは前記副走査方向の射影ヒストグラムを用いて前記特定領域を抽出するステップを含むことを特徴とする請求項5記載の領域抽出方法。
  7. 前記領域抽出ステップは、前記射影ヒストグラム内の白画素と黒画素が混在する領域について、黒画素の画素数が所定値以下の領域を前記特定領域として抽出するステップを含むことを特徴とする請求項5記載の領域抽出方法。
JP24833296A 1996-09-19 1996-09-19 領域抽出方法 Expired - Fee Related JP3556408B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24833296A JP3556408B2 (ja) 1996-09-19 1996-09-19 領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24833296A JP3556408B2 (ja) 1996-09-19 1996-09-19 領域抽出方法

Publications (2)

Publication Number Publication Date
JPH1097664A JPH1097664A (ja) 1998-04-14
JP3556408B2 true JP3556408B2 (ja) 2004-08-18

Family

ID=17176519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24833296A Expired - Fee Related JP3556408B2 (ja) 1996-09-19 1996-09-19 領域抽出方法

Country Status (1)

Country Link
JP (1) JP3556408B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183630B (zh) * 2020-09-28 2023-09-26 中国平安人寿保险股份有限公司 基于埋点层级的嵌入向量生成方法、装置、设备及介质

Also Published As

Publication number Publication date
JPH1097664A (ja) 1998-04-14

Similar Documents

Publication Publication Date Title
EP1014677B1 (en) An artifact removal technique for skew corrected images
US8559748B2 (en) Edge detection
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
Fan et al. Marginal noise removal of document images
US20070253040A1 (en) Color scanning to enhance bitonal image
EP0961218A1 (en) Method of binarization in an optical character recognition system
JP3018949B2 (ja) 文字読取装置およびその方法
US7554698B2 (en) Robust document boundary determination
JPH09311905A (ja) 行検出方法および文字認識装置
JP3556408B2 (ja) 領域抽出方法
EP0505729B1 (en) Image binarization system
US6987880B2 (en) Efficient document boundary determination
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2845370B2 (ja) 文字認識方法
JPS6325391B2 (ja)
JP2009284190A (ja) 画像読み取り装置および画像読み取りシステム
JP3336046B2 (ja) 像域分離装置
JP2001229339A (ja) バーコード読み取り装置
JP3480234B2 (ja) 画像処理装置
JP2758255B2 (ja) 光学式文字読取装置における帳票端検出方法
JP3715473B2 (ja) 宛名読取装置
JP2000187706A (ja) 紙葉類読取装置
JP2022184098A (ja) 画像処理装置、画像処理方法及びプログラム
JP2000079776A (ja) 乱丁検出方法
JP2004045228A (ja) 印刷汚れ検査方法および装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040512

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees