JP4738645B2 - 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 - Google Patents
網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 Download PDFInfo
- Publication number
- JP4738645B2 JP4738645B2 JP2001181805A JP2001181805A JP4738645B2 JP 4738645 B2 JP4738645 B2 JP 4738645B2 JP 2001181805 A JP2001181805 A JP 2001181805A JP 2001181805 A JP2001181805 A JP 2001181805A JP 4738645 B2 JP4738645 B2 JP 4738645B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- shaded
- rectangle
- rectangles
- small dots
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
【発明の属する技術分野】
この発明は、網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体に関する。
【0002】
【従来の技術】
活字の文字認識においては、認識対象の文字に網掛けがかかっているために、文字認識の精度が悪くなる場合がある。そこで、網掛け領域を積極的に見つけ出し、独自の処理をすることで、網掛けされている文字の認識の精度を高める技術として、特開平7-93480号公報、特開平8-30723号公報などに開示のものがある。
【0003】
ここで、特開平7-93480号公報に開示の技術では、網掛け領域を構成する小ドットを抽出し、これらのドットを統合して網掛け領域を抽出する方法で網掛け領域の検出を行っている。
【0004】
また、特開平8-30723号公報に開示の技術では、ドットの密度から濃度も検出する方法が示しているが、網掛け領域そのものの検出方法は特開平7-93480号公報のものと変わっていない。
【0005】
別の方式として、特許第03021928号公報には、2値画像から多値画像を生成し、エッジ抽出をする技術が開示されている。
【0006】
【発明が解決しようとする課題】
しかしながら、特開平7-93480号公報、特開平8-30723号公報に開示の技術では、ワープロ原稿などをスキャンした画像を対象とした場合、網掛け領域が精度良く検出できるのであるが、汎用的なOCRの前処理として、さまざまな画像を対象として網掛け領域を検出する用途に用いると、例えば新聞画像の写真部分などのように、図、写真を網点で構成している書面では、図や写真の領域を網掛け領域として誤検出してしまうという不具合がある。
【0007】
このように、本来、図や写真である部分を前処理として網掛けの除去をしてしまうと、本来の図や写真の画像自体が損なわれてしまうことになり、またOCRにとっても、写真や図と判別するための有力な情報を消し去ることになり、様々な悪影響が発生してしまう。
【0008】
この点、従来は低解像度のため、網点がつぶれて前記の悪影響がでなかった書面でも、近年の画像スキャンの高画質化によって、問題が顕在化するようになってきている。
【0009】
また、特許第03021928号公報の技術では、2値化画像の論理積とるというような複雑で大量のメモリ容量、CPU資源を使う技術であり、処理速度も期待できないという不具合がある。
【0010】
この発明の目的は、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することである。
【0013】
【課題を解決するための手段】
請求項1に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するものである。
【0014】
したがって、小ドットを除外した矩形の大きさの分布により文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0015】
請求項2に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するものである。
【0016】
したがって、小ドットを除外した矩形の射影をとることにより文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0017】
請求項3に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するものである。
【0018】
したがって、白の小ドットの分布文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0019】
請求項4に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、対象となる領域中の全ての矩形を抽出し、前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積と、において、前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行うものである。
【0020】
したがって、文字部分の網掛け領域の判定を行う手段を複数組み合わせて、図写真領域と文字領域の網掛け領域との区別を更に精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0021】
請求項5に記載の発明は、請求項1〜4の何れかの一に記載の網掛け領域検出装置において、前記領域種類判定手段により文字部分の網掛け領域を構成すると判定されたドットを前記文書画像データから除去する除去手段を備えている。
【0022】
したがって、文字部分の網掛け領域を構成すると判定されたドットを文書画像から除去して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0023】
請求項6に記載の発明は、請求項1〜5の何れかの一に記載の網掛け領域検出装置において、前記領域種類判定手段により文字部分の網掛け領域を構成すると判定された網掛け領域の位置と濃度を記憶する記憶手段と、前記文書画像データの所定の領域毎に前記記憶手段に記憶されている網掛け領域を再現する再現手段と、を備えている。
【0024】
したがって、文字部分の網掛け領域を構成すると判定された網掛け領域を記憶しておいて再現することができる。
【0027】
請求項7に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するものである。
【0028】
したがって、小ドットを除外した矩形の大きさの分布により文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0029】
請求項8に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するものである。
【0030】
したがって、小ドットを除外した矩形の射影をとることにより文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0031】
請求項9に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するものである。
【0032】
したがって、白の小ドットの分布文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0033】
請求項10に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、対象となる領域中の全ての矩形を抽出し、前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積と、において、前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行うものである。
【0034】
したがって、文字部分の網掛け領域の判定を行う手段を複数組み合わせて、図写真領域と文字領域の網掛け領域との区別を更に精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0035】
請求項11に記載の発明は、請求項7〜10の何れかの一に記載の網掛け領域検出方法において、前記領域種類判定工程により文字部分の網掛け領域を構成すると判定されたドットを前記文書画像データから除去する除去工程を含んでなる。
【0036】
したがって、文字部分の網掛け領域を構成すると判定されたドットを文書画像から除去して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0037】
請求項12に記載の発明は、請求項7〜11の何れかの一に記載の網掛け領域検出方法において、前記領域種類判定工程により文字部分の網掛け領域を構成すると判定された網掛け領域の位置と濃度を記憶装置に記憶する記憶工程と、前記文書画像データの所定の領域毎に前記記憶工程で記憶された網掛け領域を再現する再現工程と、を含んでなる。
【0038】
したがって、文字部分の網掛け領域を構成すると判定された網掛け領域を記憶しておいて再現することができる。
【0041】
請求項13に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラムである。
【0042】
したがって、小ドットを除外した矩形の大きさの分布により文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0043】
請求項14に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラムである。
【0044】
したがって、小ドットを除外した矩形の射影をとることにより文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0045】
請求項15に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラムである。
【0046】
したがって、白の小ドットの分布文字列の存在を判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0047】
請求項16に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、対象となる領域中の全ての矩形を抽出し、前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積と、において、前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行うコンピュータに読取り可能なプログラムである。
【0048】
したがって、文字部分の網掛け領域の判定を行う手段を複数組み合わせて、図写真領域と文字領域の網掛け領域との区別を更に精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0049】
請求項17に記載の発明は、請求項13〜16の何れかの一に記載のプログラムにおいて、前記領域種類判定処理により文字部分の網掛け領域を構成すると判定されたドットを前記文書画像データから除去する除去処理をコンピュータに実行させる。
【0050】
したがって、文字部分の網掛け領域を構成すると判定されたドットを文書画像から除去して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0051】
請求項18に記載の発明は、請求項13〜17の何れかの一に記載のプログラムにおいて、前記領域種類判定処理により文字部分の網掛け領域を構成すると判定された網掛け領域の位置と濃度を記憶装置に記憶する記憶処理と、前記文書画像データの所定の領域毎に前記記憶工程で記憶された網掛け領域を再現する再現処理と、をコンピュータに実行させる。
【0052】
したがって、文字部分の網掛け領域を構成すると判定された網掛け領域を記憶しておいて再現することができる。
【0053】
請求項19に記載の発明は、請求項13〜18の何れかの一に記載のプログラムを記憶したコンピュータに読取り可能な記憶媒体である。
【0054】
したがって、請求項15〜21の何れかの一に記載の発明と同様の作用、効果を奏することができる。
【0055】
【発明の実施の形態】
この発明の一実施の形態について説明する。
【0056】
図1は、この実施の形態である網掛け領域検出装置の電気的な接続を示すブロック図である。図1に示すように、この網掛け領域検出装置1は、PCなどのコンピュータであり、各種演算を行ない網掛け領域検出装置1の各部を集中的に制御するCPU2と、各種のROM、RAMからなる記憶装置であるメモリ3とが、バス4で接続されている。
【0057】
バス4には、所定のインターフェイスを介して、ハードディスクなどの磁気記憶装置5と、マウス、キーボード等により構成される入力装置6と、表示装置7と、光ディスクなどの記憶媒体8を読み取る記憶媒体読取装置9と、イメージスキャナ12とが接続されている。また、インターネットなどのネットワーク10と通信を行う所定の通信インターフェイス11が接続されていてもよい。なお、記憶媒体8としては、CD,DVDなどの光ディスク、光磁気ディスク、フロッピーディスクなどの各種メディアを用いることができる。また、記憶媒体読取装置9は、具体的には記憶媒体8の種類に応じて光ディスク装置、光磁気ディスク装置、フロッピーディスク装置などが用いられる。
【0058】
磁気記憶装置5には、この発明のプログラムを実現する網掛け領域検出プログラムが記憶されている。この網掛け領域検出プログラムは、記憶媒体8から記憶媒体読取装置9により読み取るか、あるいは、インターネットなどのネットワーク10からダウンロードするなどして、磁気記憶装置5にインストールしたものである。このインストールにより網掛け領域検出装置1は動作可能な状態となる。この網掛け領域検出プログラムは、OCRソフトなど、特定のアプリケーションソフトの一部をなすものであってもよい。また、所定のOS上で動作するものであってもよい。
【0059】
以下では、網掛け領域検出プログラムに基づいて網掛け領域検出装置1が行う処理の内容について説明する。
【0060】
図2は、網掛け領域検出の基本処理を示すフローチャートである。網掛け領域の検出処理は、矩形抽出の処理(ステップS1,S2)と、矩形の統合の処理(ステップS3,S4)と、領域種類判定の処理(ステップS5)とからなる。ステップS1,S2により抽出手段、抽出工程、抽出処理を実現し、ステップS3,S4により統合手段、統合工程、統合処理を実現し、ステップS5により領域種類判定手段、領域種類判定工程、領域種類判定処理を実現している。
【0061】
矩形抽出の処理は、イメージスキャナ12などから入力された文書画像データ中の黒画素の連続性から黒ランを抽出して(ステップS1)、黒ランの外接矩形を抽出する(ステップS2)処理である。
【0062】
一般に、網掛け領域を構成するドットは、文字の外接矩形よりもはるかに微小な外接矩形として抽出される。この網掛け領域検出装置1では、処理対象の文書で使用している文字サイズに応じたしきい値(例えば、5×5画素以内のサイズ)を設定することによって、文書画像データ中の網掛けドットの情報のみが、小ドット(矩形)として抽出される。この場合に、設定するしきい値としては、処理対象の文書中のカンマや読点などを、網掛けドットと誤検出しない程度の値に設定する。
【0063】
次に、矩形の統合の処理は、抽出された小ドット間の距離に対して、水平方向(ステップS3)、垂直方向(ステップS4)のしきい値処理により、所定のしきい値以内の距離(例えば、15画素以内の距離)にある小ドット(矩形)を統合する処理を進めて、網掛け候補領域の矩形として抽出する処理である。
【0064】
領域種類判定の処理(ステップS5)は、この矩形の統合の処理によって生成された網掛け候補領域の座標情報から、網掛け候補領域の大きさを調べて、網掛け領域かどうかの判定を行うものである。通常、網掛けによる文字装飾は1文字のみに対して行うことは少ないので、ある程度の面積がある。そこで、得られた領域の面積や、縦・横の長さをしきい値処理することで、孤立している点が偶然近接していた場合に生じる網掛け候補領域は排除できる。
【0065】
ステップS5により文字上にある網掛け領域が判別されたときには、当該網掛け領域を構成するドットを文書画像データから除去して文書画像処理を行う(ステップS6)。ステップS6により除去手段、除去工程、除去処理を実現している。
【0066】
この文字上にある網掛け領域が判別された場合には、網掛け領域の位置と濃度をメモリ3などに記憶する(ステップS7)。ステップS7により記憶手段、記憶工程、記憶処理を実現している。これにより、本処理の対象となった文書画像データの所定の領域ごとに、網掛け領域を再現することができる。これにより再現処理、再現工程、再現処理を実現することができる。濃度の判定には、特開平8-30723号公報に開示のように小ドット矩形の面積と網掛け領域の面積の比で推定し、あるいは、小ドット間の距離の最頻値と小ドットの大きさの関係から推定することができる。
【0067】
図3は、領域種類判定の処理(ステップS5)の詳細を説明するフローチャートである。すなわち、孤立している点が偶然近接していた場合に生じる網掛け候補領域以外の網掛け候補領域内部の情報を用いて、この網掛け候補領域の種類を判定して、文字上の網掛け領域であるのか、図写真上にみつかった網掛け領域であるのかを判定する(ステップS11)。ステップS11は網掛け候補領域のすべてについて終了したときに(ステップS12のY)、終了する。
【0068】
次に、網掛け候補領域の種類を判定して、文字上の網掛け領域であるのか、図写真上にみつかった網掛け領域であるのかを判定する処理(ステップS11)の具体的な処理内容について説明する。
【0069】
図4は、かかる処理の一例を示すフローチャートである。すなわち、この網掛け候補領域の種類を判定するのに、ステップS1,S2で得られた全ての矩形から、該当する網掛け候補領域中に存在する矩形を選択し(ステップS21)、その中から小ドットの大きさの矩形を除外して残りをRとする(ステップS22)。図7は文字上に網掛けされた領域の例を示す平面図であり、図8は図7の領域から矩形を抽出し、5×5画素サイズ以下などの小ドットを除外した矩形を表示する平面図である。
【0070】
この残された矩形の縦、横の大きさの縦と横のヒストグラムを作成し(ステップS23)、この縦と横のヒストグラムのピーク値Pを求める(ステップS24)。そして、縦か横のヒストグラムに全体の分布の一定しきい値(例えば30%)以上のピークがみられるか否かを判断する(ステップS25)。すなわち、“P/R*100>30”であるか否かを判断する。
【0071】
縦か横のヒストグラムに全体の分布の一定しきい値以上のピークがみられるときは(ステップS25のY)、矩形が規則的に並んでいると判定できるために、候補領域は文字の可能性が高いと判断する(ステップS26)。そうでないときは(ステップS25のN)、候補領域は図、写真の可能性が高いと判断する(ステップS27)。
【0072】
これによって、図、写真の領域に誤って抽出される網掛け候補領域を文字上の網掛け領域と区別することが可能となる。
【0073】
なお、この例では、ステップ1,S2で得られた矩形を利用しているが、メモリ3の使用できる記憶容量が足りない場合は、網掛け候補領域の内部を、再度、矩形抽出を行うという手段でも実現が可能である。
【0074】
図5は、ステップS11の他の処理例を示すフローチャートである。すなわち、ステップS1,S2で得られた全ての矩形から、該当する網掛け候補領域中に存在する矩形を抽出し(ステップS31)、その中から小ドットの大きさの矩形を除外して残ったものをRとする(ステップS32)。そして、残された矩形の内部を全て黒画素であると考え、水平方向、垂直方向に射影をとり(ステップS33)、この得られた射影で、度数の少ないとみなせる部分を特徴として抽出し(ステップS34)、その度数が少ないとして抽出した部分が規則的に並んでいるか否かを標準偏差などでしきい値処理して判断する(ステップS35)。そして、規則性がある場合(ステップS35のY)、候補領域は文字の可能性が高いと判断する(ステップS36)。また、規則性がない場合(ステップS35のN)、候補領域は図、写真の可能性が高いと判断する(ステップS37)。
【0075】
図9は図8と同様の候補領域(a)から水平方向に射影をとったときの射影を示すグラフ(b)である。(b)中には度数にしきい値処理する所定のしきい値の例も示している。
【0076】
図6は、ステップS11の他の処理例を示すフローチャートである。すなわち、網掛け候補領域の種類を判定するのに、対象となる領域から、黒ではなく、白の小ドットの矩形を抽出する(ステップS41)。これには、ステップS1,S2と同様なアルゴリズムで、今度は白画素のランに注目して、矩形抽出を行う。そして、矩形の縦横の画素数の小さいものを白の小ドットとして抽出する(ステップS42)。写真画像などで、網点で書かれているものは、白っぽい画像では黒のドットで描画されているように見えるが、黒っぽい画像では逆に黒の背景に白のドットが確認できる。
【0077】
この白の小ドットを、ステップS3,S4と同じしきい値で縦横に統合した領域を作成し(ステップS43)、網掛け候補領域の中から白のドット領域で一定の面積未満の小さい統合領域を除外して(ステップS44)、白の小ドット領域の面積が所定程度に大きいか否かを判断する(ステップS45)。そして、白の小ドット領域の面積が大きいときは(ステップS45のY)、候補領域は図、写真の可能性が高いと判断し(ステップS46)、小さいときは(ステップS45のN)、候補領域は文字の可能性が高いと判断する(ステップS47)。
【0078】
図10は新聞の写真の画像例を示す平面図であり、図11は図10の画像からとった網掛け候補領域(符号k)を示す平面図である。図10の画像は小ドットが多数あるので、図11のように網掛け候補領域kを生成してしまう。しかし、白の小ドット(符号wで示す領域内)も検出できるので、検出した白の小ドットの面積との比をしきい値処理するなどして、文字上の網掛けか、図、写真かを判定することができることがわかる。
【0079】
なお、ステップS11の他の処理としては、図4〜図6を参照して前記した各処理のうち少なくとも2つを併用するようにしてもよい。具体的には、この各処理により見た網点候補領域が、図、写真らしいか文字列らしいかについてそれぞれ得点付け、その得点によって、最終的に文字列らしいか図写真らしいかを判定するようにすればよい。
【0081】
【発明の効果】
請求項1に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0082】
請求項2に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0083】
請求項3に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0084】
請求項4に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、前記領域種類判定手段は、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、対象となる領域中の全ての矩形を抽出し、前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積と、において、前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行う、図写真領域と文字領域の網掛け領域との区別を更に精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0085】
請求項5に記載の発明は、請求項1〜4の何れかの一に記載の網掛け領域検出装置において、文字部分の網掛け領域を構成すると判定されたドットを文書画像から除去して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0086】
請求項6に記載の発明は、請求項1〜5の何れかの一に記載の網掛け領域検出装置において、文字部分の網掛け領域を構成すると判定された網掛け領域を記憶しておいて再現することができる。
【0088】
請求項7に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0089】
請求項8に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0090】
請求項9に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0091】
請求項10に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、前記領域種類判定工程により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、対象となる領域中の全ての矩形を抽出し、前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積と、において、前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行い、図写真領域と文字領域の網掛け領域との区別を更に精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0092】
請求項11に記載の発明は、請求項7〜10の何れかの一に記載の網掛け領域検出方法において、文字部分の網掛け領域を構成すると判定されたドットを文書画像から除去して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0093】
請求項12に記載の発明は、請求項7〜11の何れかの一に記載の網掛け領域検出方法において、文字部分の網掛け領域を構成すると判定された網掛け領域を記憶しておいて再現することができる。
【0095】
請求項13に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラムにより、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0096】
請求項14に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラムにより、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0097】
請求項15に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラムにより、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0098】
請求項16に記載の発明は、文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、前記領域種類判定処理により、対象となる領域中の全ての矩形を抽出し、その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、対象となる領域中の全ての矩形を抽出し、前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、前記小ドットを統合した領域から白の小ドットの矩形を抽出し、該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、該統合された矩形から、一定の面積未満の矩形を除外し、残された矩形の面積と、において、前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行うコンピュータに読取り可能なプログラムにより、図写真領域と文字領域の網掛け領域との区別を更に精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0099】
請求項17に記載の発明は、請求項13〜16の何れかの一に記載のプログラムにおいて、文字部分の網掛け領域を構成すると判定されたドットを文書画像から除去して、図写真領域と文字領域の網掛け領域との区別を精度良く行い、高速に文書画像中の網掛け領域を抽出することができる。
【0100】
請求項18に記載の発明は、請求項13〜17の何れかの一に記載のプログラムにおいて、文字部分の網掛け領域を構成すると判定された網掛け領域を記憶しておいて再現することができる。
【0101】
請求項19に記載の発明は、請求項13〜18の何れかの一に記載の発明と同様の作用、効果を奏することができる。
【図面の簡単な説明】
【図1】この発明の一実施の形態である網掛け領域検出装置の電気的な接続を示すブロック図である。
【図2】前記網掛け領域検出装置が行う処理を説明するフローチャートである。
【図3】同フローチャートである。
【図4】同フローチャートである。
【図5】同フローチャートである。
【図6】同フローチャートである。
【図7】文字上に網掛けされた領域の例を示す平面図である。
【図8】図7の領域から矩形を抽出し、5×5画素サイズ以下などの小ドットを除外した矩形を表示する平面図である。
【図9】図8と同様の候補領域の平面図(a)と、この候補領域から水平方向に射影をとったときの射影を示すグラフ(b)である。
【図10】新聞の写真の画像例を示す平面図である。
【図11】図10の画像からとった網掛け候補領域を示す平面図である。
【符号の説明】
1 網掛け領域検出装置
3 記憶装置
8 記憶媒体
Claims (19)
- 文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、
前記領域種類判定手段は、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、
該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定する網掛け領域検出装置。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、
前記領域種類判定手段は、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、
行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定する網掛け領域検出装置。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、
前記領域種類判定手段は、
前記小ドットを統合した領域から白の小ドットの矩形を抽出し、
該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、
該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、
該統合された矩形から、一定の面積未満の矩形を除外し、
残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定する網掛け領域検出装置。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出手段と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合手段と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定手段と、を有し、
前記領域種類判定手段は、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、
対象となる領域中の全ての矩形を抽出し、
前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、
行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、
前記小ドットを統合した領域から白の小ドットの矩形を抽出し、
該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、
該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、
該統合された矩形から、一定の面積未満の矩形を除外し、
残された矩形の面積と、において、
前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行う網掛け領域検出装置。 - 前記領域種類判定手段により文字部分の網掛け領域を構成すると判定されたドットを前記文書画像データから除去する除去手段を備えている請求項1〜4の何れかの一に記載の網掛け領域検出装置。
- 前記領域種類判定手段により文字部分の網掛け領域を構成すると判定された網掛け領域の位置と濃度を記憶する記憶手段と、前記文書画像データの所定の領域毎に前記記憶手段に記憶されている網掛け領域を再現する再現手段と、を備えている請求項1〜5の何れかの一に記載の網掛け領域検出装置。
- 文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、
前記領域種類判定工程により、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、
該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定する網掛け領域検出方法。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、
前記領域種類判定工程により、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、
行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定する網掛け領域検出方法。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、
前記領域種類判定工程により、
前記小ドットを統合した領域から白の小ドットの矩形を抽出し、
該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、
該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、
該統合された矩形から、一定の面積未満の矩形を除外し、
残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定する網掛け領域検出方法。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出工程と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合工程と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定工程と、を有し、
前記領域種類判定工程により、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、
対象となる領域中の全ての矩形を抽出し、
前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、
行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、
前記小ドットを統合した領域から白の小ドットの矩形を抽出し、
該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、
該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、
該統合された矩形から、一定の面積未満の矩形を除外し、
残された矩形の面積と、において、
前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行う網掛け領域検出方法。 - 前記領域種類判定工程により文字部分の網掛け領域を構成すると判定されたドットを前記文書画像データから除去する除去工程を含んでなる請求項7〜10の何れかの一に記載の網掛け領域検出方法。
- 前記領域種類判定工程により文字部分の網掛け領域を構成すると判定された網掛け領域の位置と濃度を記憶装置に記憶する記憶工程と、前記文書画像データの所定の領域毎に前記記憶工程で記憶された網掛け領域を再現する再現工程と、を含んでなる請求項7〜11の何れかの一に記載の網掛け領域検出方法。
- 文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、
前記領域種類判定処理により、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の大きさの分布のピーク値を求め、
該ピーク値が一定しきい値以上であれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラム。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、
前記領域種類判定処理により、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、
行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを判定して、規則的に並んでいると判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラム。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、
前記領域種類判定処理により、
前記小ドットを統合した領域から白の小ドットの矩形を抽出し、
該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、
該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、
該統合された矩形から、一定の面積未満の矩形を除外し、
残された矩形の面積が所定値より小さいか否かを判定して、小さいと判定すれば、文字列の存在が確認できた領域を文字部分の網掛け領域と判定するコンピュータに読取り可能なプログラム。 - 文書画像データから網掛け領域を構成する小ドットを抽出する抽出処理と、
この小ドットを統合して網掛け候補領域の矩形として抽出する統合処理と、
この小ドットを統合した領域内に文字列が存在するかどうかを判定して文字列の存在が確認できた領域を文字部分の網掛け領域と判定する領域種類判定処理と、をコンピュータに実行させ、
前記領域種類判定処理により、
対象となる領域中の全ての矩形を抽出し、
その中から小ドットを除外して、残された矩形の大きさの分布のピーク値と、
対象となる領域中の全ての矩形を抽出し、
前記残された矩形の内部を全て黒画素と考え、水平方向、垂直方向に射影をとり、
行間に相当する度数の低い位置の間隔が規則的に並んでいるか否かを示す情報と、
前記小ドットを統合した領域から白の小ドットの矩形を抽出し、
該抽出された矩形から、縦横の画素数の小さい矩形を抽出し、
該抽出された矩形において、所定のしきい値以内の距離にある矩形を統合し、
該統合された矩形から、一定の面積未満の矩形を除外し、
残された矩形の面積と、において、
前記ピーク値、前記情報、前記面積のうち少なくとも2つを用いて文字部分の網掛け領域の判定を行うコンピュータに読取り可能なプログラム。 - 前記領域種類判定処理により文字部分の網掛け領域を構成すると判定されたドットを前記文書画像データから除去する除去処理をコンピュータに実行させる請求項13〜16の何れかの一に記載のプログラム。
- 前記領域種類判定処理により文字部分の網掛け領域を構成すると判定された網掛け領域の位置と濃度を記憶装置に記憶する記憶処理と、前記文書画像データの所定の領域毎に前記記憶工程で記憶された網掛け領域を再現する再現処理と、をコンピュータに実行させる請求項13〜17の何れかの一に記載のプログラム。
- 請求項13〜18の何れかの一に記載のプログラムを記憶したコンピュータに読取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001181805A JP4738645B2 (ja) | 2001-06-15 | 2001-06-15 | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001181805A JP4738645B2 (ja) | 2001-06-15 | 2001-06-15 | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002373341A JP2002373341A (ja) | 2002-12-26 |
JP4738645B2 true JP4738645B2 (ja) | 2011-08-03 |
Family
ID=19022013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001181805A Expired - Fee Related JP4738645B2 (ja) | 2001-06-15 | 2001-06-15 | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4738645B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4135752B2 (ja) | 2006-06-12 | 2008-08-20 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
JP5505187B2 (ja) * | 2010-08-11 | 2014-05-28 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000295468A (ja) * | 1999-04-01 | 2000-10-20 | Toshiba Corp | 画像処理装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62171275A (ja) * | 1986-01-22 | 1987-07-28 | Nec Corp | 像域分離装置 |
JPH03268181A (ja) * | 1990-03-19 | 1991-11-28 | Fujitsu Ltd | 文書読み取り装置 |
JP3303246B2 (ja) * | 1992-12-28 | 2002-07-15 | 株式会社リコー | 画像処理装置 |
JPH06274685A (ja) * | 1993-03-24 | 1994-09-30 | Toshiba Corp | 宛名画像抽出装置 |
JPH0830723A (ja) * | 1994-07-18 | 1996-02-02 | Ricoh Co Ltd | 網掛け領域処理方法 |
JPH11306197A (ja) * | 1998-04-24 | 1999-11-05 | Canon Inc | 画像処理装置及びその方法、コンピュータ可読メモリ |
-
2001
- 2001-06-15 JP JP2001181805A patent/JP4738645B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000295468A (ja) * | 1999-04-01 | 2000-10-20 | Toshiba Corp | 画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2002373341A (ja) | 2002-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US7738734B2 (en) | Image processing method | |
US7751648B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP4366011B2 (ja) | 文書処理装置及び方法 | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP4522468B2 (ja) | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 | |
JP2000194850A (ja) | ユ―ザ囲み領域の抽出装置及び抽出方法 | |
JP4613397B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP2002199206A (ja) | メッセージ埋込並びに抽出方法、装置および媒体 | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP2010074342A (ja) | 画像処理装置、画像形成装置、及びプログラム | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP4420440B2 (ja) | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 | |
JP3544324B2 (ja) | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 | |
JPH0721817B2 (ja) | 文書画像処理方法 | |
JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
JP4078045B2 (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
US11778122B2 (en) | Apparatus, method, and storage medium for removing shading dots | |
JP2000357287A (ja) | ナンバープレート認識方法および認識装置 | |
JP3960756B2 (ja) | 文書画像レイアウト識別方法および装置 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JP3086277B2 (ja) | 文書画像処理装置 | |
JP2022019253A (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041004 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20051021 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060905 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080516 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110218 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110427 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |