JP2004201240A - 境界検出方法、プログラム、及び画像処理装置 - Google Patents

境界検出方法、プログラム、及び画像処理装置 Download PDF

Info

Publication number
JP2004201240A
JP2004201240A JP2002370596A JP2002370596A JP2004201240A JP 2004201240 A JP2004201240 A JP 2004201240A JP 2002370596 A JP2002370596 A JP 2002370596A JP 2002370596 A JP2002370596 A JP 2002370596A JP 2004201240 A JP2004201240 A JP 2004201240A
Authority
JP
Japan
Prior art keywords
boundary
image
unit
region
unit region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002370596A
Other languages
English (en)
Other versions
JP4067957B2 (ja
Inventor
Shinichi Eguchi
真一 江口
Naoko Suzuki
直子 鈴木
Yutaka Katsumata
裕 勝又
Koichi Kanemoto
浩一 金元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2002370596A priority Critical patent/JP4067957B2/ja
Priority to TW092133881A priority patent/TWI295137B/zh
Priority to US10/728,906 priority patent/US7539344B2/en
Priority to DE60311748T priority patent/DE60311748T2/de
Priority to EP03257959A priority patent/EP1431913B1/en
Priority to CNB2003101239613A priority patent/CN1324873C/zh
Priority to KR1020030093650A priority patent/KR101011865B1/ko
Publication of JP2004201240A publication Critical patent/JP2004201240A/ja
Application granted granted Critical
Publication of JP4067957B2 publication Critical patent/JP4067957B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】本発明は、原稿とスキャナーカバーとの任意の組み合わせにおいて読み取られた画像データから原稿のエッジを検出することを目的とする。
【解決手段】画像データ(A)から、第一単位領域毎に第一画像周波数情報を抽出する特徴強調手段(102)と、該第一画像周波数情報を所定の重みで加算した値を代表特徴情報とし、隣接する領域の代表特徴情報との変化量が所定レベル以上となる第一単位領域を該境界として仮決定する境界仮決定手段(104)と、仮決定した位置及びその近傍を範囲として、該第一単位領域より狭い第二単位領域毎の第二周波数情報を抽出し、隣接する領域の第二周波数情報との変化量に基づく値が所定レベル以上となる第二単位領域を該境界とした境界情報(B)を生成する境界決定手段(106)と、を有する画像処理装置。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理技術に関し、特に、画像上の領域の特徴が変化する位置を検出する画像処理技術に関する。
【0002】
【従来の技術】
原稿(例えば紙媒体など)を読み取ることのできる装置として、スキャナやコピー機などの、光学式に読み取りを行なう画像読取装置が知られている。このような画像読取装置における原稿画像の読み取りは一般に、画像読取装置の読み取り面に向けて原稿の表面(読取対象面)がセットされ、その原稿の背面から、原稿を覆う原稿カバーが被せられた状態で、読み取りが行なわれる。
【0003】
そして、画像の読み取りに際しては、セットされた原稿表面に向けて読み取り面側から光を照射し、反射してきた光を読み取り面側に構成された光読み取り部(CCD)で読み取ることを一ライン単位で行ない、このように読み取った原稿表面の情報を電気信号に変換することにより、原稿の画像データを取得している。
【0004】
原稿の大きさが読み取り面よりも小さい場合には、読み取り面側から見た原稿の周りに原稿カバーの裏面側(原稿カバーの読み取り面側であり、原稿の背景となりうるので、以下、背景板と呼ぶこととする。)が現れてしまい、画像読み取り時には原稿の表面に加えてこの背景板も読み取られることとなるため、当然、取得される画像データは、原稿周りに背景板が写りこんだものとなる。
【0005】
そして、このように取得された画像データは、例えば、印字部によって印字されて紙出力されることに利用されたり、画像編集部に送られて画像データ内の部分的な切り抜きや画像データの回転補正等がなされ、さらには、画像データ中の文字領域のOCR処理に利用され、または画像データのままデータベースに保存されたりするなど様々な方面に活用されていく。しかし、このような活用、特に前述した活用においては顕著に表れるが、画像データにおける、原稿以外の背景板の写り込みは様々な問題を引き起こす。
【0006】
そして、このような問題を解決する技術も各方面において開示されてはいるが、何れも汎用的に利用できる技術には値しない。
【0007】
【発明が解決しようとする課題】
開示されている技術の一つに、取得した画像データをOCR処理したり、電子ファイルとしてデータベースに保存したりすることを対象に開発された技術がある。
【0008】
一般に、OCR処理を施す対象の原稿としては、帳票のように印字位置が一定の定型文書が利用され、データ化された定型文書画像のOCR処理を施す際は、定型文書画像を適宜回転補正するなどし、定型文書画像の基準位置(例えば定型文書画像の上端左端の位置)からどの位置に印字位置が位置するかを予め設定しておけば、対象の定型文書画像から印字位置を特定して、その特定した位置に対するOCR処理によって文字認識を行ない、所望の文字情報を取り出すことが可能となる。
【0009】
帳票のような原稿の縁は一般に白い余白を有するものが多く、同色またはそれに近い色の背景板を使用して、読み取り面よりも小さい原稿に対する画像データを取得すると、取得された画像データは原稿のエッジと背景板の境界を有しない、その境界付近では白一色の画像データが生成される。
【0010】
この画像データにおいて上記OCR処理を行なうためには、この画像データに原稿がどのような状態(角度や配置)で写り込んでいるのか特定する必要が生じる。
【0011】
しかし、原稿のエッジは背景板と同色のため検出できない。
そこで、これを解決する技術として、この画像データに写り込んでいる原稿の状態の指標となる画像データのエッジを検出できるように、背景板の色を黒にすることで、白い余白を縁に有する原稿の角度や配置を特定して、原稿の読み取りを行なわせるようにしている。
【0012】
しかし、このような方法を用いなければならない画像読取装置においては、汎用的でない特殊用途向きのものに使用されているため、非常に高価なものとなってしまうということや、背景板が黒であるため、厚みの薄い白色の原稿においては、背景板の黒色が透けてしまい、読み取った画像データの例えば文字などが判別しにくくなるという欠点がある。
【0013】
また、その他に開示されている技術としては、コピー機などに適用される原稿の大きさと同じ大きさで紙出力させるための技術がある。
これは、上述したように背景板を黒に変更するものとは異なり、背景板のRGB配列を恣意的に組替え操作して、コピー品質に影響を与えない程度の白色を背景板に構成させたものである。
【0014】
当然、そのRGB配列の組替え情報を認識しているため、画素一つ一つを判定することにより配列の異なるものと区別することが可能で、原稿の大きさを特定できるようになる。
【0015】
しかし、この場合においても、予め背景板のRGB配列情報を有した専用の画像読取装置でしか実現できないため、汎用途には向かない技術であった。
また、何れの技術も、画像を読み取る時点で細工をし、読み込んだ画像から原稿のエッジを特定しており、画像を読み込んだ後の画像処理のみで原稿のエッジを検出できるものはない。
【0016】
そこで本発明は、上記課題を解決するために、原稿と背景板との任意の組み合わせにおいて読み取られた画像データから原稿のエッジを検出する、境界検出方法、プログラム、及び画像処理装置を提供することを目的とする。
【0017】
【特許文献1】
特開平5−110779号公報
【特許文献2】
特開平7−115514号公報
【0018】
【課題を解決するための手段】
本発明は上記課題を解決するために以下のように構成する。
すなわち本発明の境界検出方法の態様の一つは、画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出することを前提とし、該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出し、任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する、ように実現させる。
【0019】
また、本発明の境界検出方法のその他の態様の一つは、画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出することを前提とし、該画像データの単位領域毎に、画像周波数情報を抽出し、該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する、ように実現させる。
【0020】
また、本発明の境界検出方法のその他の態様の一つは、画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出することを前提とし、該画像データの第一単位領域毎に、第一画像周波数情報を抽出し、該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定し、該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する、ように実現する。
【0021】
また、本発明の境界検出方法のその他の態様の一つは、背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出することを前提とし、該入力画像データの第一単位領域毎にフーリエへ変換を施し、該フーリエ変換処理によって得られる第一画像周波数情報を抽出し、該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定し、該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第二画像周波数情報を抽出し、該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、該代表特徴情報に対してウエーブレット変換を施し、該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、該直線近似によって得られる近似直線上の位置を該境界として決定する、ように実現する。
【0022】
なお、上述した境界検出方法の各態様においては、前記画像データまたは前記入力画像データに対して印字領域を特定することを最初に行ない、その後の工程では該印字領域を除外した画像データまたは入力画像データを利用するようにすることが望ましい。
【0023】
また、前記特徴情報または前記画像周波数情報は、該特徴情報または該画像周波数情報が抽出された前記単位領域に含まれる、高周波成分、低周波成分、直流成分、及び周波数分布とすることが望ましい。
【0024】
本発明のプログラムの態様の一つは、画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出することをコンピュータに実行させることを前提とし、該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出する機能と、任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求める機能と、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する機能と、を実現させる。
【0025】
また、本発明のプログラムのその他の態様の一つは、画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出することをコンピュータに実行させることを前提とし、該画像データの単位領域毎に、画像周波数情報を抽出する機能と、該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定する機能と、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求める機能と、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する機能と、を実現させる。
【0026】
また、本発明のプログラムのその他の態様の一つは、画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出することをコンピュータに実行させることを前提とし、該画像データの第一単位領域毎に、第一画像周波数情報を抽出する機能と、該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定する機能と、該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出する機能と、任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する機能と、を実現させる。
【0027】
また、本発明のプログラムのその他の態様の一つは、背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出することをコンピュータに実行させることを前提とし、該入力画像データの第一単位領域毎にフーリエ変換を施す機能と、該フーリエ変換によって得られる第一画像周波数情報を抽出する機能と、該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する機能と、該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施す機能と、該フーリエ変換によって得られる第二画像周波数情報を抽出する機能と、該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、該代表特徴情報に対してウエーブレット変換を施す機能と、該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施す機能と、該直線近似によって得られる近似直線上の位置を該境界として決定する機能と、を実現させる。
【0028】
なお、上記プログラムの各態様において、前記画像データまたは前記入力画像データに対して、印字領域を特定することを最初に行ない、その後は印字領域を除外した画像データまたは入力画像データを利用する機能をさらに実現させるようにすることが望ましい。
【0029】
また、前記特徴情報または前記画像周波数情報は、該特徴情報または該画像周波数情報が抽出された前記単位領域に含まれる、高周波成分、低周波成分、直流成分、及び周波数分布である、ことが望ましい。
【0030】
本発明の画像処理装置の態様の一つは、画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出することを前提とし、該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出する特徴強調手段と、任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する境界決定手段と、を有する。
【0031】
また、本発明の画像処理装置のその他の態様の一つは、画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出することを前提とし、該画像データの単位領域毎に画像周波数情報を抽出する特徴強調手段と、該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する境界決定手段と、を有する。
【0032】
また、本発明の画像処理装置のその他の態様の一つは、画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出することを前提とし、該画像データの第一単位領域毎に、第一画像周波数情報を抽出する特徴強調手段と、該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定する境界仮決定手段と、該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する境界決定手段と、を有する。
【0033】
また、本発明の画像処理装置のその他の態様の一つは、背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出することを前提とし、該入力画像データの第一単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第一画像周波数情報を抽出する特徴強調手段と、該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する境界仮決定手段と、該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第二画像周波数情報を抽出し、該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、該代表特徴情報に対してウエーブレット変換を施し、該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、該直線近似によって得られる近似直線上の位置を該境界として決定する境界決定手段と、を有する。
【0034】
なお、上記画像処理装置の各態様において、前記画像データの印字領域を除外する印字領域除外部をさらに有することが望ましい。
また、前記特徴情報または前記画像周波数情報は、該特徴情報または該画像周波数情報が抽出された前記単位領域に含まれる、高周波成分、低周波成分、直流成分、及び周波数分布である、ことが望ましい。
【0035】
また、原稿を光学式に読み取って該原稿の前記画像データを生成する画像読取手段を、さらに有する、ように構成してもよい。
本発明では、画像データ上の単位領域毎に、その単位画素の全体として決まる画像周波数などの特徴情報を抽出するので、その画像データに仮に表面の状態の異なる二つの紙が写り込んでいるとすれば、その二つの紙が同色であっても、その状態の違いを異なる特徴情報として抽出することができる。
【0036】
そして、そのように抽出した特徴情報を使って隣接領域間の変化量を求めれば、表面の状態が異なる上記二つの紙の境界で変化量が増大するので、画像上における変化量のその増大位置を二つの紙の境界として特定できる。
【0037】
また、画像データに、黒の印字を含む白色原稿と、白色原稿に隣接して同色の他原稿が写り込んでいる場合は、先ず濃度の高い印字領域を除外しておくこともできるので、それらの境界の位置を特定し易くできる。
【0038】
【発明の実施の形態】
以下、本発明の実施の形態について図を参照しながら詳細に説明する。
本発明の実施の形態における画像処理装置は、例えばスキャナやコピー機などに構成される、背景板(原稿を光読取面側に向けてセットする再に背面から原稿を押さえる、原稿背面と接する側の原稿カバーに構成される部材)を背に宛てて原稿画像の読み取りを行なう画像読取装置によって読み取られた、上記背景板の画像(以下、背景板画像と呼ぶこととする)を周囲に有する原稿画像(以下、枠付き原稿画像と呼ぶこととする)を対象に、上記枠付き原稿画像の原稿画像と背景板画像との境界検出を行なうこととする。
【0039】
そして、上記画像読取装置に読み取られる原稿は白色の余白領域を周囲に有し、背景板の色も余白領域と同様の白色であるものとする。
また、便宜上、上記原稿は矩形の紙を想定し、原稿の余白領域以外を、文字や罫線の印字されている印字領域が占有しているもの(例えば帳票など)とする。
【0040】
図1は、本発明の実施の形態における画像処理装置のブロック図である。
同図に示す画像処理装置は、印字領域除外部100、特徴強調部102、エッジ仮決定部104、及びエッジ決定部106によって構成され、入力情報として枠付き原稿画像Aを受け取り、出力情報としてエッジ情報Bを出力する。
【0041】
同図の枠付き原稿画像Aは、特に図示されていない上述した既知の画像読取装置によって原稿表面を画素単位で読み取り、それらの電気変換によって生成された画素毎のR(Red)、G(Green)、及びB(Blue)の濃度情報、またはルックアップテーブルによる管理に基づいた画像情報を有している。
【0042】
ここで、上記各部の説明をする前に、この枠付き原稿画像の特徴を図2に従って説明しておく。
図2は、上述したように生成された図1の枠付き原稿画像Aを図示されていない表示装置(例えばモニタなど)の画像平面(水平方向をX軸、垂直方向をY軸とした、X−Y座標平面)上に表示させた場合の一例である。
【0043】
同図の枠付き原稿画像Aは、以下の説明を分かり易くするために原稿の一辺(実際には枠付き原稿画像に示されないが、説明のため同図の破線で示す原稿画像の左端のエッジ)のみに着眼した画像で、図中の破線を境に、右側を原稿画像、左側を原稿外のために背景板の一部から読み取られた背景板画像としている。
【0044】
ここで、文字や罫線や記号などが示される領域を、原稿の印字領域200とし、その印字領域200を取り囲む、原稿画像の余白部分を余白領域202とし、背景板画像の領域を背景板領域204と呼ぶこととする。
【0045】
同図に示されるように画像中にエッジの影が写り込んでいる部分206においては、階調値の差が明確に検出できるため、エッジの位置の特定が可能である。
しかし、枠付き原稿画像から見て取る事のできない、エッジの影が写り込んでいない部分においては、同図からも明らかなように背景板の色と余白の色とが同色で、それらの境界の隣り合う画素間では色の差の生じない一続きのデータが形成されているため、エッジの位置の特定ができない。
【0046】
しかし、背景板の状態(例えば、表面が粗い状態、表面が滑らかな状態、または素材の種類によって他の素材との区別をする素材の状態など)と原稿の余白の状態(例えば、表面が粗い状態、表面が滑らかな状態、または素材の種類によって他の素材との区別をする素材の状態など)とは一般的に異なるため、その状態の違いを数種類の特徴量として抽出することに着目する、エッジ領域の特定方法が考えられる。
【0047】
同図に示す拡大図208は、枠付き原稿画像Aの背景板領域204と余白領域202を股がってそれらの境界を含むように設定した矩形領域210と、その矩形領域近傍を対象に、上記状態の違いを示す如く彩度の強調を施した場合の、部分拡大画像を示している。
【0048】
上記枠付き原稿画像Aに対して彩度の強調を施すことにより、余白領域202と背景板領域204の、上記状態の違いに基づくRGB配列パターンの相違が強調され、同図に示されるように、視覚的に、夫々の領域の違いによるそれらの境界を判別できるようになる。
【0049】
この特徴に着目して、枠付き原稿画像において判別ができなかった原稿のエッジを検出し、その画像上の原稿領域と背景板領域との区別を可能にする画像処理装置の各部について、図2の枠付き原稿画像Aを参照しながら以下に説明する。
【0050】
図1の印字領域除外部100では、枠付き原稿画像Aの各画素の階調値を走査して図2の印字領域200を特定する(例えば、RGBの階調値で200以下を含む画素を印字領域と判断し、エッジ検出の走査対象から外す)。
【0051】
図1の特徴強調部102では、枠付き原稿画像Aから、指定する範囲(またはブロックと呼ぶこととする)毎に異なる特徴量(例えば、その画素領域に含まれる画像周波数(またはスペクトル)や周波数分布など)を所定の範囲単位で抽出する(例えば、縦32pixel×横4pixel単位で2次元高速フーリエ変換を実行し、各領域のスペクトルを求め、求めたスペクトルの高周波成分、低周波成分、直流成分、及びスペクトルの周波数分布の夫々の平均値を該当領域の特徴量とする)。
【0052】
なお、上記所定の範囲とは、例えば、縦をlピクセル(pixel)とし、横をm(pixel)とした範囲(但しl及びmは整数)であり、上記画像平面上における枠付き原稿画像の、上記所定範囲を単位に指定される各画素の単位領域を、以下において画素領域と呼ぶこととする。
【0053】
この特徴強調部では、印字領域除外部100で特定した図2に示す印字領域200を除外して、各画素領域の特徴量を抽出することも可能である。
図1のエッジ仮決定部104では、特徴強調部102において画素領域毎に抽出した特徴量に基づいて、枠付き原稿画像上の原稿のエッジに相当する位置を仮決定する(例えば、その画素領域の各特徴量をある重みで足し合わせた値を差異値とし、その差異値の一番端側のピークをエッジとし、求めたエッジを元に直線近似を行ない、そのように得られた直線をエッジとして仮決定する)。
【0054】
図1のエッジ決定部106では、エッジ仮決定部104において仮決定したエッジの位置と、そのエッジの位置の、画像平面上の近傍領域とから、上記特徴強調部102において特長量を抽出する単位とした画素領域よりもさらに狭い範囲の画素領域を単位として各種の特徴量を抽出し、この特徴量に基づいて、枠付き原稿画像上の原稿のエッジ位置を最終決定する(例えば仮決定したエッジの位置とその近傍の領域を対象に縦32pixel×横4pixel単位で1次元高速フーリエ変換を実行し、この実行に基づいて抽出された特徴量にさらにウエーブレット変換を実行し、この結果得られる値に基づくピーク位置に直線近似を施すことによって、近似直線上の位置をエッジ位置と決定するなど)。
【0055】
そして、同図のようなエッジ情報Bを出力する。
次に、本発明の実施の形態における画像処理装置の、上記各部の動作フローの一例を以下に説明する。
【0056】
なお、本例に示す画像の処理の走査方法において、特に明記しない限り、図2に示される枠付き原稿画像A上の各画素を、同図の上端左端から縦32pixel単位で、水平方向の同一画素列に対して同図の右端に向かって走査をし、上記画素列の処理が終わると、その下の段を縦32pixel単位で、水平方向の同一画素列に対して上記同様の処理をし、同図枠付き原稿画像Aの下端に達するまで同様の処理を繰り返す、縦32pixel幅の横方向のラインを単位として処理が行なわれるものとして説明する。
【0057】
また、本動作フローの理解を助けるために、適宜、実測図等を参照しながら説明する。
図3は、図1の印字領域除外部100において行なわれる動作フローの一例である。
【0058】
図3の動作フローにおいては、先ず、図2の枠付き原稿画像Aの、画像平面上において最初の読み取り対象とする開始ラインの位置を図2に示す画像Aの上端の位置に設定する(S300)。
【0059】
そして、設定したラインの図2の左端に位置する画素を読み取り対象として設定する(S302)。
ここで、上記設定した画素のRGB階調値を読み取って、本例において予め取り決めた、印字領域として除外する基準となるRGB階調値200を超えないものがあるかどうかを判定する(S304)。
【0060】
この判定の基準となるRGB階調値は、原稿に応じて適宜設定してよい。
ステップS304において、読み取った画素のRGB階調値が200を超えている場合は、その画素は印字領域ではないと判定し、同一ライン上の右隣に位置する画素を次の読み取り対象として設定する(S306)。
【0061】
また、ステップS304において、読み取った画素のRGB階調値が200以下であった場合は、この領域に印字領域があるものと仮設定し、続くステップS308のノイズ判定処理に移行する。
【0062】
ステップS308においては、ステップS304において印字領域があるものと仮設定された画素に対し、画像平面上における位置が連続し、印字領域として仮設定されている画素が存在するかどうかの判定を行なう。
【0063】
このステップS308において連続する画素が存在しないと判定されると、ステップS306の処理に移行して、現在処理対象となっている画素の、同一ライン上の右隣に位置する画素を読み取り対象として設定し、上記同様なステップで処理を実行する。
【0064】
これは、2画素続けて印字領域として仮設定されていないものは、印字領域とは関係のない、ゴミ等によるノイズである可能性が高いためで、この判定の基準とする連続画素数の設定は、適宜設定できる。
【0065】
ステップS308において連続する画素が存在すると判定されると、当該画素を図2の画像Aの左端から最初に検出された印字領域200として設定する(S310)。
【0066】
続いて、ステップS312において、本ラインで処理されていない画素が残っているかどうかを判定する。
このステップS312において本ラインで処理する画素が残っていると判定されると、ステップS306の処理に移行して、残りの画素についても同様に、上述したステップで処理を実行する。
【0067】
ステップS312において本ラインで処理する画素がないと判定されると、本ラインが図2の画像Aの下端まで移動した最終ラインであるかどうかを判定する(S314)。
【0068】
このステップS314において本ラインが最終ラインではないと判定されると、画像平面上における、本ラインの直下の位置にラインを設定し(S316)、この設定されたラインの左端から、ステップS302以後に示す処理を繰り返し実行する。
【0069】
そして、図2の画像Aにおいて全ての走査が終了する、上記最終ラインまでの走査が終了すると、ステップS314において本ラインが最終ラインであると判定されて本処理を終了する。
【0070】
図4は、上記動作フローによって特定された印字領域を元画像と比較させた図である。
同図(a)は、元画像である図2の枠付き原稿画像Aを示した図であり、同図(b)は、上記動作フローによって特定された印字領域を黒塗りで示した図である。
【0071】
同図(b)に示されるように、図2の印字領域200とエッジの影が写り込んでいる部分206とが印字領域400として特定されたことが分かる。
このように、図1の印字領域除外部100に入力された枠付き原稿画像Aは、図2に画像平面上での表示を示す枠付き原稿画像Aの、印字領域200、及び本例においてはエッジの影が写り込んでいる部分206までをも、印字領域として特定している。
【0072】
そして、この後に続く処理において、このように特定した図4の印字領域400を除外する事が可能となる。
図5は、図1の特徴強調部102において行なわれる動作フローの一例である。
【0073】
本動作フローは、図1の印字領域除外部100によって印字領域を特定した画像Aを対象に行なわれる。
また、本動作フローにおいては、図6に示すように、画像平面上に示された枠付き原稿画像Aを同図に示す範囲600(本例においては、縦32pixel×横4pixelのブロックとする)を単位に領域分割させた各画素領域が、特に明記しない限り処理の単位として利用されるものとする。
【0074】
図5の動作フローにおいては、先ず、図6の枠付き原稿画像Aの上部左端に上記範囲600で指定される画素領域602を、処理対象とする開始ブロックとして設定する(S500)。
【0075】
そして、当該画素領域(本段階においては画素領域602であり、以下においても同様である)が図4の印字領域400を含んでいるかどうかを、図1の印字領域除外部100によって特定された画素の図4の印字領域400を示す情報に基づいて判定する(S502)。
【0076】
このステップS502において当該画素領域に図4の印字領域400が含まれていると判定されると、図6の画像Aにおいて当該画素領域の走査方向に位置する画素領域を処理対象の領域として設定し直す(S504)。
【0077】
ステップS502において当該画素領域に図4の印字領域400が含まれないと判定されると、当該画素領域に対し、画素領域単位で、既知の2次元高速フーリエ変換処理(以下、2DFFTと略記する)を実行し、当該画素領域のスペクトルを求める(S506)。
【0078】
ここで、当該画素領域において求めたスペクトルの、高周波成分(本例においては、1/2π≦ω<3/4πとする、なおωは周波数を示す変数である)の平均値を求める(S508)。
【0079】
続いて、当該画素領域において求めたスペクトルの、低周波成分(本例においては、0<ω<1/2πとする)の平均値を求める(S510)。
さらに続けて、当該画素領域において求めたスペクトルの、直流成分(本例においては、ω=0とする)の平均値を求める(S512)。
【0080】
図7は、図2に示される矩形領域210(縦32pixel×横144pixel)内において、縦32pixel×横4pixelを単位とした画素領域毎に求めた上記各種成分の平均値の実測データである。なお、この実測データにおいてはRGB別に算出結果を示すものとし、RGB別の各値の変動を分かり易いものとした。
【0081】
同図のX座標は、図2の画像AのX軸方向に対応し、図2の矩形領域210の左端をX座標の原点として右方向に画素数をカウントした時の画素数の値が示されている。
【0082】
そして、図7には、図2の矩形領域210の左端からの画素数の位置である、X座標に指定された位置に対応させて、RGB別の直流成分(直流成分R、直流成分G、及び直流成分B)として階調値、RGB別の低周波成分(低周波成分R、低周波成分G、及び低周波成分B)としてスペクトル値、及びRGB別の高周波成分(高周波成分R、高周波成分G、及び高周波成分B)としてスペクトル値が示されている。
【0083】
そして、これらの各成分の値を折れ線グラフで示すと、図8から図10のようなグラフが得られる。
図8は、高周波成分に対するグラフであり、横軸を画素数(各画素領域の左端の画素数)、縦軸をスペクトル値として、RGB別にスペクトルの変化を示した。
【0084】
図9は、低周波成分に対するグラフであり、高周波成分のグラフと同様に、横軸を画素数(各画素領域の左端の画素数)、縦軸をスペクトル値として、RGB別にスペクトルの変化を示した。
【0085】
図10は、直流成分に対するグラフであり、横軸を画素数(各画素領域の左端の画素数)、縦軸を階調値として、RGB別に階調値の変化を示した。
図8から図10の折れ線の変化からも予想されるように、X座標が136の位置において、最も急激な上下変化が見られ、図7から図10にもX座標が136の位置に実線で示されるように、この位置に対し、原稿のエッジの存在が予想される。
【0086】
さて、ここで図5の動作フローの説明に戻る。
上述したステップでは3種類の成分の平均値を求めたが、更にここでは、当該画素領域のスペクトルから半値幅を求め、求めた半値幅を当該画素領域の周波数分布として設定する(S514)。
【0087】
なお、半値幅とは、横軸を周期、縦軸をスペクトルの強さとした時に得られる周波数分布図において、ピーク値の半分の強さを示す、ピーク周期近傍の2つの周期間の間隔である。
【0088】
そして、ステップ508からステップS512で求めた各種成分毎の平均値、及びステップS514で設定した周波数分布を当該画素領域の特徴量として設定する(S516)。
【0089】
ここで、図6に示される枠付き原稿画像Aの全ての画素領域に対して上述した処理を実行したかどうかを判定する(S518)。
このステップS518において当該画素領域の次の走査対象となる画素領域があると判定されると、ステップS504に移行して図6の画像Aにおける次の走査対象となる画素領域を処理対象の領域として設定し直し、上述したステップで処理を実行する。
【0090】
そして、ステップS518において、画像Aの全ての画素領域に対して上述した処理が実行され、当該画素領域の次の走査対象となる画素領域がないと判定されると、本処理を終了する。
【0091】
なお、本動作フローにおいては、4つの特徴量を求めたが、これのみに限定されず、さらに他の特徴量を加えても良い。
このように、図1の特徴強調部102においては、印字領域除外部100によって処理を施された枠付き原稿画像Aから、所定の大きさの画素領域を単位とする各種特徴量を抽出することができる。
【0092】
図11は、図1のエッジ仮決定部104において行なわれる動作フローの一例である。
本動作フローは、図1の特徴強調部102で抽出した各種の特徴量に基づいて実行される。
【0093】
本動作フローにおいては、先ず、図2の枠付き原稿画像Aの領域を分割して示した、図6の範囲600で指定される画素領域を単位に、枠付き原稿画像の処理対象範囲を判定し、該当する処理範囲を設定する(S1100)。
【0094】
なお、本例における処理範囲の判定は、図4(b)に印字領域を黒塗りして示した画像Aの、左端から印字領域400までを処理対象範囲であるとして判定する。
【0095】
このようにして処理範囲が確定すると、図6に示される枠付き原稿画像Aの上端のラインを、画素領域を読み取る開始ラインとして設定する(S1102)。ここで、後に詳しく説明する、上記各種の特徴量の重み決定処理を実行する(S1104)。
【0096】
そして、当該設定されているラインの左端に位置する画素領域を、本ラインの最初に読み取る画素領域として設定する(S1106)。
続いて、当該画素領域に対して隣接して連なる画素領域(本例においては、該当する画素領域に対して左に隣接して連なる、最大で2つのまで画素領域とする)に対し、図5の動作フロー(ステップS508からステップS514)で求めた特徴量毎の平均を求める(S1108)。
【0097】
図12は、処理の対象となっている画素領域における、上記平均を求める対象となる画素領域の配置関係を図示したものである。
同図は、図6の枠付き原稿画像A上において処理対象の画素領域として指定される、画素領域604を処理の対象として示しており、この場合には、画素領域604の左に隣接する画素領域1202とさらに左に位置する画素領域1204の合計2つの画素領域が、処理の対象として指定されている画素領域604に対する、隣接画素領域の特徴量毎の平均を算出するための画素領域として指定される。
【0098】
そして、このようにして求めた特徴量毎の平均を、図11の引き続きの処理(ステップS1110)に使用する。
図11のステップS1110においては、処理の対象となっている画素領域の各種特徴量とステップS1108で求めた特徴量毎の平均との、特徴量毎の変化量を求める。
【0099】
このようにして求めた各種特徴量の変化量を、ステップS1104の重み決定処理で求めた各種特徴量の重み、または、予め統計的に求めておいた重み(望ましくは、高周波成分を1、低周波成分を2、直流成分を1、周波数分布を1とする)で足し合わせ、その値を当該画素領域における特徴変化量として設定する(S1112)。
【0100】
ここで、ステップS1112で画素領域毎に設定された特徴変化量のピークを求めるための処理を行なう(S1114)。
ここに示すピークを求めるための処理(ピーク検出処理)は、後に詳しく説明するものとする。
【0101】
そして、上記ピーク検出処理に基づく当該画素領域の特徴変化量の、ピーク判定を行なう(S1116)。
このステップS1116においてピーク無しと判定されると、続いて、次に走査する画素領域(図12においては画素領域1206)に対して、その画素領域が印字領域であるかどうかを判定する(S1118)。
【0102】
そして、このステップS1118において、次に走査する画素領域は印字領域ではないと判定されると、続いて、その画素領域(図12においては画素領域1206)は、中央の画素領域から1画素領域だけ走査方向側の画素領域であるかどうかを判定する(S1120)。
【0103】
このステップS1120においてその画素領域は中央の画素領域から1画素領域だけ走査方向側の画素領域であると判定されると、処理対象となっている画素領域が最終ラインに位置するものであるかどうかを判定する(S1122)。
【0104】
また、ステップS1116の処理にもどって、ステップS1116から示した各ステップが上記とは反対の判定を受けた場合は、以下のように処理を実行する。
【0105】
ステップS1116においてピーク有りと判定されると、処理対象となっているこの画素領域をエッジに相当する画素領域であると判定し、この画素領域を、本例では原稿画像の左端のエッジとして仮決定する(S1124)。そして、上述したステップS1122の処理に移行する。
【0106】
ステップS1118において、処理対象の画素領域が印字領域であると判定されると、ステップS1122の処理に移行する。
ステップS1120において、その画素領域(図12においては画素領域1206)は中央の画素領域から1画素領域だけ走査方向側の画素領域でないと判定されると、ステップS1126の処理に移行して次に走査する画素領域を処理対象の画素領域として設定し、ステップS1108から、上述したステップ順で処理を繰り返し実行する。
【0107】
ステップS1122において、処理対象となっている画素領域が最終ラインに位置するものでないと判定されると、ステップS1126の処理に移行して、上述したステップ順で処理を実行する。
【0108】
また、ステップS1122において、処理対象となっている画素領域が最終ラインに位置するものであると判定されると、続くステップS1128の処理に移行する。
【0109】
このステップS1128においては、ステップS1124で検出された、エッジに相当する全ての画素領域に対して、画像平面上における直線近似を施して、得られた近似直線上の画素を原稿画像左端のエッジ部分として仮決定して、本処理を終了する。
【0110】
なお、上記動作フロー(図11)は、RGB各色のスペクトル値において最も特徴が大きく示された色のみを対象に実行させてもよいし、RGBにおいて任意に組み合わせた2つ以上の色を対象に実行させてもよい。
【0111】
図13は、上記処理によって仮決定したエッジの配置を図2の枠付き原稿画像Aに照らして示した図である。
同図の画像Aに対して示される直線1300が、上記ステップS1128で求められる近似直線であり、この近似直線1300に対応した画素が、原稿画像の左端のエッジとして仮決定される。
【0112】
同図においては、図2に破線で示した余白領域202と背景板領域204の実際の境界に対して若干ズレているものの、その境界に近い位置に原稿画像のエッジを設定できた。
【0113】
このように、図1のエッジ仮決定部104において、実際のエッジの位置に対して、より近い位置にエッジを仮決めできる、エッジ位置の絞込みが行なえる。
ここで、図11に含まれる重み決定処理(ステップS1104)及び、ピーク検出処理(ステップS1114)について順番に説明する。
【0114】
図14は重み決定処理の動作フローを示している。
重み決定処理では、先ず、図1の特徴強調部102における動作フローを示した図5の各ステップの、ステップS506で求めた画素領域毎のスペクトルの各成分(高周波成分、低周波成分、及び直流成分)及び周波数分布を、例えば左右に位置する画素領域との単純平均等により正規化する(S1400)。
【0115】
この正規化によって、上記ステップS506で求めたスペクトルの各成分及び周波数分布の、微小変動による誤差を吸収できる。
続いて、図11のステップS1100において判定した処理範囲(枠付き原稿画像の左端から印字領域が始まる位置まで)における、上記各成分及び周波数分布の平均値を求め、その求めた平均値を基準に、上記所定範囲における上記各成分及び周波数分布の、分散量を算出する(S1402)。
【0116】
そして、このようにして算出した分散量が予め設定した閾値以上変動しているかどうかを、成分及び周波数分布毎に判定する(S1404)。
なお、上記閾値は例えば変動平均値の2割に設定するなどした値である。
【0117】
このステップS1404においてその分散量は予め設定した閾値以上変動していると判定されたものがあると、その成分及び周波数分布について分散量の最大を求め、その値を当該成分及び周波数分布の変化量として設定する(S1406)。
【0118】
また、ステップS1404においてその分散量は予め設定した閾値以上変動していないと判定されたものは、変化量無しとして設定する(S1408)。
そして最後に、上記設定した各成分及び周波数分布の変化量の比率に対する逆数を求め、その値を夫々の成分及び周波数分布の重みとして決定し(S1410)、本処理を終了する。
【0119】
図15は、ピーク検出処理の動作フローを示している。
ピーク検出処理では、先ず、処理対象とする画素領域を指定する(S1500)。
【0120】
そして、指定された画素領域よりも、走査方向とは反対方向に位置する、同一ラインの画素領域の全てに対してレベル平均値を求める(S1502)
図16は、横軸に図12の枠付き原稿画像Aの水平軸(X軸)をとり、縦軸に上記レベルをとった、一ラインに対するレベル分布図である。
【0121】
同図にプロットされた全ての白丸1600は、所定の画素領域単位の代表値を示している。
今、同図において突出した白丸1602を、ピーク検出処理の対象とする画素領域のレベルとすると、その左に位置する全ての画素領域のレベル1604が上記平均化される対象となる。
【0122】
なお、レベル平均値に示すレベルとは、図11のエッジ仮決定の処理においては特徴変化量のことを差すものとする。
本ピーク検出処理は、これから説明する、図1のエッジ決定部106の動作フローにおいても使用され、その際のステップS1502の処理においては特徴変化量を使用しないため、本ピーク検出処理フローの説明においては、便宜上、レベル平均値とした。
【0123】
さて、ステップS1502においてレベル平均値が求まると、処理対象となっている画素領域のピーク判定を行なう(S1504)。
これは、上記レベル平均値に対して、予め統計的に算出した定数α(本例で示すような水平方向の走査においては、α=2.5とすることが最も望ましく、また、縦4pixel×横32pixelを画素領域の単位として、これらの画素領域を垂直方向に走査する形態で各種の処理を行なう場合には、α=2.0とすることが最も望ましい)を掛け合わせ、処理対象となっている画素領域のレベル(図11のエッジ仮決定の処理においては特徴変化量)が、上記αを乗じたレベル平均値を超える頂点となっているかどうかの判定を行なうものである。
【0124】
このステップS1504において、対象となっているレベルが上記頂点ではないと判定されると、次に走査する画素領域をセットし直して(S1506)、ステップS1502から上記ステップ順で処理を繰り返す。
【0125】
また、対象となっているレベルが上記頂点であると判定されると、ピーク検出処理を終了する。
続いて、図1のエッジ仮決定部104で仮決定されたエッジを基にエッジの正確な位置を絞り込む、図1のエッジ決定部106の処理を説明する。
【0126】
なお、説明を分かり易くするために、図1のエッジ仮決定部104で仮決定されたエッジの位置は、縦32pixelを単位として、同一の列に並んだ画素に示されているものとする。
【0127】
図17は、図1のエッジ決定部106において行なわれる動作フローである。本動作フローにおいては、先ず、図13の枠付き原稿画像Aの上端のラインにエッジの位置として仮設定された画素列(縦32pixel×横1pixel)の、走査方向に対して前後に位置する各々16pixelの範囲を処理の対象として設定する(S1700)。
【0128】
そして、本処理における画素領域の単位を、縦32pixel、横1pixelの範囲とした画素列とし、この画素列単位で上記範囲の1次元高速フーリエ変換を行ない、各画素列のスペクトルを求める(S1702)。
【0129】
図18は、位置ラインに対する上記処理対象の範囲を示している。
図18(a)は、図13の近似直線1300の画素列を含む、一ラインの処理対象範囲を示している。
【0130】
同図の矩形領域1800が、破線で示すライン1802上の処理対象範囲となり、特に図示されていないが、他のラインも同様に処理対象範囲が設定される。
同図(b)は、上記矩形領域1800を拡大して、エッジの位置として仮決定された位置と上記処理対象の範囲の位置関係を示している。
【0131】
この図から、図中の中央に線で示された仮エッジ1804の、矢印で示す走査方向に対して前後16pixelに配列された各画素列1806(縦32pixel×横1pixel)を、上記処理対象の範囲としていることが分かる。
【0132】
さて、ステップS1702でスペクトルを求めると、続いて、スペクトルの各成分(高周波成分、低周波成分、及び直流成分)及び周波数分布の平均値を上記画素列1806単位で求める(S1704)。
【0133】
そして、図11のステップS1104で求めた、または予め統計的に求められた重みで、画素列1806ごとに成分及び周波数分布を足し合わせ、得られた値をその画素列の特徴値とする(S1706)。
【0134】
ここで、この特徴値に対して画素列ごとに既知のウエーブレット変換を行なう(S1708)。
ウエーブレット変換によって得られた値は、ライン単位で、図15及び図16で説明したピーク検出処理に使用される。
【0135】
以下は、ステップS1710で行なわれるピーク検出処理を図15に基づいて示している。
ステップS1710のピーク検出処理フローにおいては、先ず、当該ラインにおいて処理対象となる画素列の開始画素列を、図18(b)の例においては、左端の画素列に指定する(S1500)。
【0136】
続いて、指定された画素列よりも、走査方向とは反対方向に位置する、同一ラインの画素列の全てに対してレベル平均値(ここにおいては、ウエーブレット変換結果の平均値)を求める(S1502)
そして、ウエーブレット変換結果の平均値を基に、処理対象となっている画素列のピーク判定を行なう(S1504)。
【0137】
これは、上記ウエーブレット変換結果の平均値に対して、予め統計的に算出した定数αを掛け合わせ、処理対象となっている画素列のウエーブレット変換結果が、上記αを乗じたウエーブレット変換結果の平均値を超える頂点となっているかどうかの判定を行なうものである。
【0138】
このステップS1504において、対象となっているウエーブレット変換結果が上記頂点ではないと判定されると、次に走査する画素列をセットし直して(S1506)、ステップS1502から上記ステップ順で処理を繰り返す。
【0139】
また、対象となっているウエーブレット変換結果が上記頂点であると判定されると、ピーク検出処理を終了する。
さて、ステップS1710におけるピーク検出処理を終えると、処理の対象としているラインが仮エッジとして指定された最終のラインであるかどうかを判定する(S1712)。
【0140】
最終ラインでなければ、次に走査するラインを設定し(S1714)、ステップS1702から上述したステップを繰り返す。
ステップS1712において最終ラインと判定されると、図11のステップS1128に示した処理と同様な要領で、ステップS1710でピークが検出された全ての画素列に対して、画像平面上における直線近似を施して、得られた近似直線上の画素を原稿画像左端のエッジ部分として決定する(S1716)。
【0141】
そして、最後に、ロバスト補正をかけて本処理を終了する(S1718)。
なお、このロバスト補正は、以下に示すフローに基づいて処理が行なわれる。
図19は、ロバスト補正の処理フローである。
【0142】
同図のように、先ず、エッジとして決定した画素列間の画像平面上におけるX軸差分(Δx)を求めることにより、エッジの傾きを求める(S1900)。
続いて、上記求めた各傾きにおける、平均値とその分散値を算出する(S1902)。
【0143】
ここで、ステップS1900で求めた差分(Δx)が上記平均値、分散値を超えるような画素列を除外する(S1904)。
さらに、差分(Δx)がマイナス方向となる画素列を排除する(S1906)。
【0144】
そして、最小二乗法による直線近似を行なう(S1980)。
続くステップS1910では、本処理の回数を判定し、本例においては、本処理が3回完了していなければ、ステップS1912の処理に移行してステップS1908で得られた近似直線と、この直線の算出に使用された画素列との距離値を算出し、予め決めた閾値を超えている画素列がある場合には、閾値を超えている画素列を除外する(S1912)。
【0145】
この後の処理においては閾値を変更して(S1914)、ステップS1900から上述したステップを順番に実行する。
そして最後に、ステップS1910において本処理が3回実行されたと判定されると、その時点で得られている最新の近似直線上の画素が、原稿画像左端のエッジ部分として最終決定され、全処理を終了する。
【0146】
なお、上記動作フロー(図17)は、RGB各色のスペクトル値において最も特徴が大きく示された色のみを対象に実行させてもよいし、RGBにおいて任意に組み合わせた2つ以上の色を対象に実行させてもよい。
【0147】
このように、図1のエッジ決定部106においては、図1のエッジ仮決定部104で仮に求めたエッジ位置とその近傍範囲のみを対象に、エッジの特定処理を行なえばよい。
【0148】
そして、エッジと予想される付近のみを処理対象にできるので、エッジとは関係ない画像領域におけるノイズ(他の画像情報)に対して敏感に反応し易いウェーブレット変換を適用しても、エッジを含まない他の画像領域の範囲が狭くノイズが少ない本対象領域において、さらに正確なエッジ位置が検出できるようになる。
【0149】
また、上述した全ての処理は、説明を理解し易くするために、原稿の左端エッジについてのみ述べたが、その他のエッジ(原稿の上端エッジ、右端エッジ、または下端エッジ)においても、夫々の方向から対向する方向に向けて走査を行なうことで、各エッジの決定を行なうことが可能であり、この処理結果を統合することで、原稿を取り囲む全てのエッジや原稿サイズ等が判別できるようになる。
【0150】
図20は、上記4箇所のエッジ(原稿の左端エッジ、右端エッジ、上端エッジ、及び下端エッジ)の検出を行なって原稿周囲のエッジを特定する、全体処理フローの例である。
【0151】
同図の左側に各処理を示し、同図の右側に前記各処理に対応する、枠付き原稿画像(原稿領域を網掛けで示した)Aの処理イメージを示した。
なお、本処理においては、枠付き原稿画像Aに含まれる印字領域を上述したイに字領域除外処理を施して除外していることを前提とし、先ず、垂直エッジの検出を行なって、その後に水平エッジの検出を行なうこととした。
【0152】
先ず、垂直エッジの検出を行なうために、枠付き原稿画像Aから、特徴量(例えば、その領域に含まれる画像周波数(またはスペクトル)や周波数分布など)を、本例では、縦32pixel×横4pixel単位とした画素領域毎に、同処理の枠付き原稿画像内の横線で示されるような縦32pixelのライン単位で抽出する(S2000)。
【0153】
続いて、左側エッジを対象とした同図の左端側から右側への走査に基づいて、上記抽出した特徴量から左端エッジに相当する位置を仮決定し、左端エッジの仮決定位置及びその近傍(当該画素領域に隣接する画素領域)における特長量を抽出し、この特徴量に基づいて検出されるエッジ位置を左端エッジの位置と断定する(S2002)。
【0154】
続いて、右側エッジを対象とした同図の右側側から左側への走査に基づいて、上記抽出した特徴量から右端エッジに相当する位置を仮決定し、右端エッジの仮決定位置及びその近傍(当該画素領域に隣接する画素領域)における特長量を抽出し、この特徴量に基づいて検出されるエッジ位置を右端エッジの位置と断定する(S2004)。
【0155】
次に、水平エッジの検出を行なう。
先ず、水平エッジの検出を行なうために、枠付き原稿画像Aから、特徴量(例えば、その領域に含まれる画像周波数(またはスペクトル)や周波数分布など)を、本例では、縦4pixel×横32pixel単位とした画素領域毎に、同処理の枠付き原稿画像内の縦線で示されるような横32pixelのライン単位で抽出する(S2006)。
【0156】
続いて、上端エッジを対象とした同図の上端側から下端側への走査に基づいて、上記抽出した特徴量から上端エッジに相当する位置を仮決定し、上端エッジの仮決定位置及びその近傍(当該画素領域に隣接する画素領域)における特長量を抽出し、この特徴量に基づいて検出されるエッジ位置を上端エッジの位置と断定する(S2008)。
【0157】
続いて、下端エッジを対象とした同図の下側から上側への走査に基づいて、上記抽出した特徴量から下端エッジに相当する位置を仮決定し、下端エッジの仮決定位置及びその近傍における特長量を抽出し、この特徴量に基づいて検出されるエッジ位置を下端エッジの位置と断定する(S2010)。
【0158】
なお、上端エッジまたは下端エッジを検出するために上記走査において縦方向の走査を行なう場合には、上述したラインのピクセル設定や、画素領域を指定する範囲のピクセル設定に、上述した横方向の走査におけるピクセル設定の縦横を逆転させて用いることが望ましい。
【0159】
このように4方向からの処理を行なうことで、原稿の4箇所のエッジを特定できる。
なお、上記においては、原稿を白色の余白領域を周囲に有するもとのし、背景板の色も余白領域と同様の白色であるものとして説明を行なったが、当然、本発明はこれに限定されるものではなく、その他の色においても適用可能である。
【0160】
また、便宜上、原稿の余白領域以外を、文字や罫線の印字されている印字領域が占有しているものとして説明したが、印字領域が無い原稿に対しては、上述した印字領域除外処理を省くことも可能である。
【0161】
以上各種の動作フローに含まれる各機能は、画像処理装置に構成されるRAM(Random Access Memory)やROM(Read Only Memory)などのメモリに、CPU(中央演算処理装置)が読み取り可能なプログラムコードの形態で記憶され、メモリとバス接続されたCPUにそのプログラムが実行処理されることによって実現される。
【0162】
このような画像処理装置が構成されるものの一例としてコピー機がある。
図21は、コピー機のブロック図を示している。
同図のコピー機2100では、画像読取部2102に構成される読み取り面2104に対して原稿Cの表面(読取対象面)をセットし、その原稿の背面からは、原稿を覆う原稿カバー2106が被せられた状態で、画像の読み取りを行なう。
【0163】
画像読取部2102における画像の読み取りは、セットされた原稿Cに向けて読み取り面2104側から光を照射し、反射してきた光を画像読取部に構成された光読取部2108(CCD)が一ライン毎に読み取り、読み取った原稿表面の情報を電気信号に変換して、変換された画像情報を上述したエッジ検出処理を行なう画像処理部2110に送る。
【0164】
画像処理部2110では、上述したように、同色の、背景画像と原稿の余白の境界(原稿のエッジ)を検出できるので、この検出によって得られたエッジ情報を原稿サイズ検出部2112に送り、原稿サイズを特定することによって、この特定した原稿サイズでの原稿Cのコピーを、印字部2114から、コピー機の排出台2116に対して印字出力できる。
【0165】
図22は、上述した画像処理技術を使用するハードウエア構成の一例である。同図では、スキャナ2200と画像処理用パーソナルコンピュータ(PC)2202とがケーブル2204により接続された構成をとっている。
【0166】
このような構成においては、PC2202内部に構成される不図示のRAM(Random Access Memory)やROM(Read Only Memory)などのメモリに上記プログラムが記憶され、メモリとバス接続されたCPUにそのプログラムを実行させることにより、スキャナ2200で読み取られ、ケーブル2204を介してPC2202に送信される画像データから原稿エッジ情報を抽出する。
【0167】
図23は、上述した画像処理技術を使用するハードウエア構成の一例である。同図では、図20のスキャナ2200及びPC2202に加え、画像編集済の画像データを蓄積する画像データ蓄積部2300及びファイリングPCがケーブル2204によって接続された画像ファイリングシステムを構成する。
【0168】
このような構成においては、PC2202のスキャナドライバ2304を駆動してスキャナ2200から読み込んだ画像データを、PC2202に取り込み、その取り込んだ画像データに対して原稿エッジの検出処理2306を行ない、得られたエッジ情報を基に背景板画像を切り取って画像サイズを最適化したり、得られたエッジ情報を基に回転をかけて斜行補正したりする画像編集処理2308などをして、画像データ蓄積部2300に編集済みの画像データを蓄積する。
【0169】
この際、画像データ蓄積部2300に蓄積された画像データの関連情報を各画像データ毎にファイリングPC2302の図示されていない管理テーブルに対応付けして、ファイリングPC2302に画像データを管理させる。
【0170】
図24は、図23のハードウエア構成における動作フローの一例である。
先ず、スキャナドライバ2304を駆動してスキャナ2200から読み込んだ画像データを、PC2202に取り込む(S2400)。
【0171】
そして、上記において詳細に説明したエッジの検出処理をその画像データに施し(S2402)、原稿のエッジ情報を取得する(S2404)。
ここで、画像データの編集として、4方をエッジで囲まれた画像領域であるか否かの判定をし(S2406)、4方をエッジで囲まれた画像領域(原稿画像)のみを抽出する(S2408)。
【0172】
そして、このように最適化された画像原稿を画像データ蓄積部2300に記録する(S2410)。
図25は、図23のハードウエア構成における動作フローの一例である。
【0173】
先ず、スキャナドライバ2304を駆動してスキャナ2200から読み込んだ画像データを、PC2202に取り込む(S2500)。
そして、上記において詳細に説明したエッジの検出処理をその画像データに施し(S2502)、原稿のエッジ情報を取得する(S2504)。
【0174】
ここで、画像データの編集として、取得されたエッジの、画像平面上の軸(X軸またはY軸)に対する例えば最小の傾きを検出し(S2506)、その傾きがなくなるように画像データを回転して斜行補正する(S2508)。
【0175】
そして、このように補正された画像原稿を画像データ蓄積部2300に記録する(S2510)。
なお、上記図24と図25の動作フローを組み合わせることも可能であり、例えば、図25のステップS2506及びステップS2508の処理を図24のステップS2404及びステップS2406の処理の間に行なわせるようにすることができる。
【0176】
このように斜行補正を施すことにより、後処理をしやすくすることが可能になる。
また、背景画像データを切り落とすことによって、余分なデータを取り除く事が可能になり、データ量も小さくて済むので、データの保管も少ない容量で済み、データの利用において処理スピードを早くすることができる。
【0177】
続いて、図26は、上述した2つの構成のPC2202において実行させる処理の拡張例である。
同図では、Windows(登録商標)環境を有するPC2202での処理を示し、その環境の下、スキャナドライバ2304の駆動によってスキャナ2200から枠付き原稿画像Aを読み込み、PC2202に取り込んで、その画像Aに対して原稿エッジ検出処理2306を実行して、得られたエッジ情報を基に、その外側の背景板画像を黒色に着色した黒色背景板画像Eを生成して、この画像Eに対して既知の文字認識処理2308を実行した結果をアプリケーション2310に渡して、アプリケーション2310から文字認識された情報(コードデータなど)を取り出すことを可能にしている。
【0178】
図27は、上記黒色背景板画像Eを生成するためのフローである。
先ず、スキャナドライバ2304を駆動してスキャナ2200から読み込んだ画像データAを、PC2202に取り込む(S2700)。
【0179】
そして、上記において詳細に説明したエッジの検出処理をその画像データに施し(S2702)、原稿のエッジ情報を取得する(S2704)。
さらに、画像データに対して、4方をエッジで囲まれた画像領域以外の画像領域を判定し(S2706)、4方をエッジで囲まれた画像領域(原稿画像)以外の画像領域の階調濃度を黒色になるように変更する(S2708)。
【0180】
そして最後に、原稿画像の始点(例えば画像平面上における原稿画像の上端左端の位置)を特定して、例えば、予め記憶部などに記憶された、上記始点からの印字位置を対象に、画像を切り抜いてその画像を分析し、その画像に含まれる文字をパターン認識処理に基づいて抽出するなどといった文字認識処理を施す(S2710)。
【0181】
なお、本処理において、図25の動作フローと組み合わせることも可能であり、例えば、図25のステップS2506及びステップS2508の処理を図27のステップS2704及びステップS2706の処理の間に行なわせるようにすることができる。
【0182】
このように、背景板画像を黒色に着色することで、従来の黒色背景板のスキャナから取り込んだ、黒色背景板画像を原稿画像の縁の周辺に有した、従来画像と同じ仕様の画像データを作成できるので、従来の黒色背景を有した画像データを編集する装置(例えばOCR処理装置など)に対して、本発明の画像処理装置を介して得られた画像データを利用させることも可能である。
【0183】
なお、以上説明してきた各処理(当然、エッジ検出処理を含む)はプログラムの形態で配布することもできる。
その場合、フロッピー(登録商標)ディスク、CD−ROM、DVDなどの記録媒体(例えば、図22においてはCD-ROM挿入部2206に挿入されるCD−ROM)に上記プログラムを記録させて配布したり、或いは、公衆網等で用いられる伝送媒体を介して、そのプログラムの一部、若しくは全部を配信するようにしたりすることができる。
【0184】
そして、上記形態で配布されたプログラムを取得したユーザーは、コンピュータなどのデータ処理装置に構成される、例えば、前記記録媒体に記録された情報を読み取る読み取り部や外部機器とデータ通信を行う通信部などを介して、各々とバスを介して接続されるRAMやROMなどのメモリに上記プログラムを読み込ませ、上記メモリとバスを介して接続されるCPU(中央演算処理装置)にそのプログラムを実行させることで、上記画像処理をユーザのデータ処理装置において実現することが可能となる。
【0185】
以上述べたように、本発明の実施の形態においては、最初に印字領域を除外して処理対象を狭めているので、その後の処理を高速に行なえる。
また、印字領域に基づく、隣接領域との特徴情報の変化量を無視できるので、背景板と原稿との境界が特定し易くなる。
【0186】
また、本発明の実施の形態においては、先ず始めに、画像の単位領域をやや広めにとって、画像上の背景板と原稿との境界位置を2DFFTで得られた特徴量に基づいて仮決定し、この後、仮決定した位置と誤差範囲を含めた領域のみを対象に、上記単位領域よりも小さい領域を単位とした1次元高速フーリエ変換(1DFFT)を施して、さらにウエーブレット変換を施しているので、境界を検出するまでの処理を高速に行なうことができ、さらに、精度良く境界の位置を検出できる。
【0187】
また、上記画像処理は背景板と原稿の素材の組み合わせを選ばないので、如何なる背景板を有するスキャナから読み込まれた原稿画像であっても、適用することが可能である。
【0188】
(付記1) 画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出する境界検出方法であって、
該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出し、
任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する、
ことを特徴とする境界検出方法。
【0189】
(付記2) 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する境界検出方法であって、
該画像データの単位領域毎に、画像周波数情報を抽出し、
該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、
該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する、
ことを特徴とする境界検出方法。
【0190】
(付記3) 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する境界検出方法であって、
該画像データの第一単位領域毎に、第一画像周波数情報を抽出し、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、
任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定し、
該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、
任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する、
ことを特徴とする境界検出方法。
【0191】
(付記4) 背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出する境界検出方法であって、
該入力画像データの第一単位領域毎にフーリエ変換を施し、
該フーリエ変換によって得られる第一画像周波数情報を抽出し、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、
任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定し、
該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、
該フーリエ変換によって得られる第二画像周波数情報を抽出し、
該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、
該代表特徴情報に対してウエーブレット変換を施し、
該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、
該直線近似によって得られる近似直線上の位置を該境界として決定する、
ことを特徴とする境界検出方法。
【0192】
(付記5)前記原稿の四方が前記背景板によって取り囲まれた画像データにおいて、該画像データ上の、互いに平行または直交し、互いに方向の異なる4つの向きから前記検出を行なうことを特徴とする付記4に記載の境界検出方法。
【0193】
(付記6) 前記画像データまたは前記入力画像データに対して、最初、印字領域を特定し、該印字領域を除外した画像データまたは入力画像データを処理対象とすることを特徴とする付記1乃至5の何れか一つに記載の境界検出方法。
【0194】
(付記7) 前記特徴情報または前記周波数情報は、高周波成分、低周波成分、直流成分、及び周波数分布である、ことを特徴とする付記1乃至6の何れか一つに記載の境界検出方法。
【0195】
(付記8) 前記決定した境界が矩形である場合に、該境界を基に該矩形に含まれる領域の斜行補正を行なう、
ことを特徴とする付記1乃至7の何れか一つに記載の境界検出方法。
【0196】
(付記9) 前記決定した境界を基に、該境界に隣接する一方の領域または前記画像データの原稿部分を残して、他方の領域または前記画像データの背景板部分を取り除く、
ことを特徴とする付記1乃至8の何れか一つに記載の境界検出方法。
【0197】
(付記10) 前記決定した境界を基に、該境界に隣接する一方の領域または前記画像データの背景板部分を黒色に着色し、
該境界に隣接する、該黒色に着色した領域以外の、他方の領域に含まれる文字を認識する、
ことを特徴とする付記1乃至8の何れか一つに記載の境界検出方法。
【0198】
(付記11) 画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出する処理をコンピュータに実行させるプログラムであって、
該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出する機能と、
任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求める機能と、
該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する機能と、
を実現させるためのプログラム。
【0199】
(付記12) 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する処理をコンピュータに実行させるプログラムであって、
該画像データの単位領域毎に、画像周波数情報を抽出する機能と、
該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定する機能と、
任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求める機能と、
該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する機能と、
を実現させるためのプログラム。
【0200】
(付記13) 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する処理をコンピュータに実行させるプログラムであって、
該画像データの第一単位領域毎に、第一画像周波数情報を抽出する機能と、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、
任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定する機能と、
該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出する機能と、
任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する機能と、
を実現させるためのプログラム。
【0201】
(付記14) 背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出する処理をコンピュータに実行させるプログラムであって、
該入力画像データの第一単位領域毎にフーリエ変換を施す機能と、
該フーリエ変換によって得られる第一画像周波数情報を抽出する機能と、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、
任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する機能と、
該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施す機能と、
該フーリエ変換によって得られる第二画像周波数情報を抽出する機能と、
該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、
該代表特徴情報に対してウエーブレット変換を施す機能と、
該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施す機能と、
該直線近似によって得られる近似直線上の位置を該境界として決定する機能と、
を実現させるためのプログラム。
【0202】
(付記15)前記原稿の四方が前記背景板によって取り囲まれた画像データにおいて、該画像データ上の、互いに平行または直交し、互いに方向の異なる4つの向きから前記検出を行なう機能をさらに実現させることを特徴とする付記14に記載のプログラム。
【0203】
(付記16) 前記画像データまたは前記入力画像データに対して、最初、印字領域を特定し、該印字領域を除外した画像データまたは入力画像データを処理対象とする機能をさらに実現させる付記11乃至15の何れか一つに記載のプログラム。
【0204】
(付記17) 前記特徴情報または前記周波数情報は、高周波成分、低周波成分、直流成分、及び周波数分布である、ことを特徴とする付記11乃至16の何れか一つに記載のプログラム。
【0205】
(付記18) 前記決定した境界が矩形である場合に、該境界を基に該矩形に含まれる領域の斜行補正を行なう機能をさらに実現させる、付記11乃至17の何れか一つに記載のプログラム。
【0206】
(付記19) 前記決定した境界を基に、該境界に隣接する一方の領域または前記画像データの原稿部分を残して、他方の領域または前記画像データの背景板部分を取り除く機能をさらに実現させる、付記11乃至18の何れか一つに記載のプログラム。
【0207】
(付記20) 前記決定した境界を基に、該境界に隣接する一方の領域または前記画像データの背景板部分を黒色に着色する機能と、
該境界に隣接する、該黒色に着色した領域以外の、他方の領域に含まれる文字を認識する機能と、
をさらに実現させる付記11乃至19の何れか一つに記載のプログラム。
【0208】
(付記21) 画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出する画像処理装置であって、
該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出する特徴強調手段と、
任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する境界決定手段と、
を有することを特徴とする画像処理装置。
【0209】
(付記22) 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する画像処理装置であって、
該画像データの単位領域毎に画像周波数情報を抽出する特徴強調手段と、
該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する境界決定手段と、
を有することを特徴とする画像処理装置。
【0210】
(付記23) 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する画像処理装置であって、
該画像データの第一単位領域毎に、第一画像周波数情報を抽出する特徴強調手段と、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定する境界仮決定手段と、
該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する境界決定手段と、
を有することを特徴とする画像処理装置。
【0211】
(付記24) 背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出する画像処理装置であって、
該入力画像データの第一単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第一画像周波数情報を抽出する特徴強調手段と、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する境界仮決定手段と、
該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第二画像周波数情報を抽出し、該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、該代表特徴情報に対してウエーブレット変換を施し、該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、該直線近似によって得られる近似直線上の位置を該境界として決定する境界決定手段と、
を有することを特徴とする画像処理装置。
【0212】
(付記25)原稿の四方が前記背景板によって取り囲まれた画像データにおいて、前記各手段は、該画像データ上の、互いに平行または直交し、互いに方向の異なる4つの向きに対して機能することを特徴とする付記24に記載の画像処理装置。
【0213】
(付記26) 前記画像データの印字領域を除外する印字領域除外部をさらに有することを特徴とする請求項21乃至25の何れか一つに記載の画像処理装置。
【0214】
(付記27) 前記特徴情報または前記周波数情報は、高周波成分、低周波成分、直流成分、及び周波数分布である、ことを特徴とする請求項21乃至26の何れか一つに記載の画像処理装置。
【0215】
(付記28) 原稿を光学式に読み取って該原稿の前記画像データを生成する画像読取手段をさらに有することを特徴とする付記21乃至27の何れか一つに記載の画像処理装置。
【0216】
(付記29) 前記決定した境界が矩形である場合に、該境界を基に該矩形に含まれる領域の斜行補正を行なう斜行補正手段をさらに有する、ことを特徴とする付記21乃至28の何れか一つに記載の画像処理装置。
【0217】
(付記30) 前記決定した境界を基に、該境界に隣接する一方の領域または前記画像データの原稿部分を残して、他方の領域または前記画像データの背景板部分を取り除く画像除外部をさらに有する、ことを特徴とする付記21乃至29の何れか一つに記載の画像処理装置。
【0218】
(付記31) 前記決定した境界を基に、該境界に隣接する一方の領域または前記画像データの背景板部分を黒色に着色する画像着色手段と、
該境界に隣接する、該黒色に着色した領域以外の、他方の領域に含まれる文字を認識する、文字認識手段と、
を有することを特徴とする付記21乃至30の何れか一つに記載の画像処理装置。
【0219】
(付記32) 背景板を原稿の背面に配置して該原稿の画像情報を該原稿の正面から読み取り、該背景板と該原稿の境界検出に基づく該原稿サイズの特定により該原稿のコピーを出力するコピー機において、
画像情報の印字領域を除外する印字領域除外部と、
該画像情報上の単位領域毎に、該単位領域内の全画像情報によって決まる特徴情報を抽出する特徴強調手段と、
任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該印字領域以外の該基準の単位領域を該境界として決定する境界決定手段と、
を有することを特徴とするコピー機。
【0220】
(付記33) 背景板を原稿の背面に配置して該原稿の画像情報を該原稿の正面から読み取り、該背景板と該原稿の境界検出に基づく該原稿サイズの特定により該原稿のコピーを出力するコピー機において、
画像情報の印字領域を除外する印字領域除外部と、
該画像情報の単位領域毎に画像周波数情報を抽出する特徴強調手段と、
該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該印字領域以外の該基準の単位領域を該境界として決定する境界決定手段と、
を有することを特徴とするコピー機。
【0221】
(付記34) 背景板を原稿の背面に配置して該原稿の画像情報を該原稿の正面から読み取り、該背景板と該原稿の境界検出に基づく該原稿サイズの特定により該原稿のコピーを出力するコピー機において、
画像情報の印字領域を除外する印字領域除外部と、
該画像情報の第一単位領域毎に、第一画像周波数情報を抽出する特徴強調手段と、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる該印字領域以外の第一単位領域を該境界として仮決定する境界仮決定手段と、
該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する境界決定手段と、
を有することを特徴とするコピー機。
【0222】
(付記35) 背景板を原稿の背面に配置して該原稿の画像情報を該原稿の正面から読み取り、該背景板と該原稿の境界検出に基づく該原稿サイズの特定により該原稿のコピーを出力するコピー機において、
画像情報の印字領域を除外する印字領域除外部と、
該画像情報の第一単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第一画像周波数情報を抽出する特徴強調手段と、
該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる該印字領域以外の第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する境界仮決定手段と、
該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第二画像周波数情報を抽出し、該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、該代表特徴情報に対してウエーブレット変換を施し、該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、該直線近似によって得られる近似直線上の位置を該境界として決定する境界決定手段と、
を有することを特徴とするコピー機。
【0223】
(付記36)原稿の四方が前記背景板によって取り囲まれた画像データにおいて、前記各手段は、該画像データ上の、互いに平行または直交し、互いに方向の異なる4つの向きに対して機能することを特徴とする付記35に記載のコピー機。
【0224】
(付記37) 前記画像情報の印字領域を階調値に基づいて除外することを特徴とする付記32乃至36の何れか一つに記載のコピー機。
【0225】
【発明の効果】
以上述べたように、本発明によれば、原稿と背景板との任意の組み合わせにおいて読み取られた画像データから原稿のエッジを検出することが可能となり、既存の画像読取装置から入力された画像データであっても、原稿と背景板との境界を検出することが可能となる。
【0226】
また、黒背景の読取装置では得られない、白背景の読取装置の優位性、すなわちコントラストが高いという特徴、薄い紙の読み取りに強いという特徴、裏写りしないという特徴、を維持したままOCR処理を行なうことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における画像処理装置のブロック図である。
【図2】枠付き原稿画像の表示例である。
【図3】印字領域除外部100において行なわれる動作フローの一例である。
【図4】印字領域除外部100において特定された印字領域と元画像との比較図である。
【図5】特徴強調部102において行なわれる動作フローの一例である。
【図6】枠付き原稿画像A上を単位画素領域に分けて走査する場合の例である。
【図7】図2の矩形領域210内において求めた特徴量の実測データである。
【図8】図7の実測データに基づく高周波成分のグラフである。
【図9】図7の実測データに基づく低周波成分のグラフである。
【図10】図7の実測データに基づく直流成分のグラフである。
【図11】エッジ仮決定部104において行なわれる動作フローの一例である。
【図12】特徴量の平均を求める対象の、画素領域の配置関係である。
【図13】枠付き原稿画像Aに対して仮決定したエッジの配置である。
【図14】重み決定処理の動作フローである。
【図15】ピーク検出処理の動作フローである。
【図16】所定のラインを対象としたレベル分布図である。
【図17】エッジ決定部106において行なわれる動作フローである。
【図18】枠付き原稿画像Aに対し、エッジ決定部106において行なわれる単位画素領域を示した図である。
【図19】ロバスト補正の処理フローである。
【図20】原稿周囲のエッジを特定する、全体処理フローの一例である。
【図21】コピー機のブロック図である。
【図22】本画像処理技術を使用するハードウエア構成の一例である。(その1)
【図23】本画像処理技術を使用するハードウエア構成の一例である。(その2)
【図24】図23のハードウエア構成における動作フローの一例である。(その1)
【図25】図23のハードウエア構成における動作フローの一例である。(その2)
【図26】本画像処理技術の応用例である。
【図27】黒色背景板画像Eを生成するためのフローである。
【符号の説明】
100 印字領域除外部
102 特徴強調部
104 エッジ仮決定部
106 エッジ決定部
A 枠付き原稿画像
B エッジ情報

Claims (19)

  1. 画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出する境界検出方法であって、
    該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出し、
    任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する、
    ことを特徴とする境界検出方法。
  2. 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する境界検出方法であって、
    該画像データの単位領域毎に、画像周波数情報を抽出し、
    該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、
    任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、
    該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する、
    ことを特徴とする境界検出方法。
  3. 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する境界検出方法であって、
    該画像データの第一単位領域毎に、第一画像周波数情報を抽出し、
    該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、
    任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定し、
    該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、
    任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する、
    ことを特徴とする境界検出方法。
  4. 背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出する境界検出方法であって、
    該入力画像データの第一単位領域毎にフーリエ変換を施し、
    該フーリエ変換によって得られる第一画像周波数情報を抽出し、
    該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、
    任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定し、
    該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、
    該フーリエ変換によって得られる第二画像周波数情報を抽出し、
    該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、
    該代表特徴情報に対してウエーブレット変換を施し、
    該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、
    該直線近似によって得られる近似直線上の位置を該境界として決定する、
    ことを特徴とする境界検出方法。
  5. 前記画像データまたは前記入力画像データに対して、最初、印字領域を特定し、該印字領域を除外した画像データまたは入力画像データを処理対象とすることを特徴とする請求項1乃至4の何れか一つに記載の境界検出方法。
  6. 前記特徴情報または前記画像周波数情報は、該特徴情報または該画像周波数情報が抽出された前記単位領域に含まれる、高周波成分、低周波成分、直流成分、及び周波数分布である、ことを特徴とする請求項1乃至5の何れか一つに記載の境界検出方法。
  7. 画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出する処理をコンピュータに実行させるプログラムであって、
    該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出する機能と、
    任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求める機能と、
    該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する機能と、
    を実現させるためのプログラム。
  8. 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する処理をコンピュータに実行させるプログラムであって、
    該画像データの単位領域毎に、画像周波数情報を抽出する機能と、
    該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定する機能と、
    任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求める機能と、
    該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する機能と、
    を実現させるためのプログラム。
  9. 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する処理をコンピュータに実行させるプログラムであって、
    該画像データの第一単位領域毎に、第一画像周波数情報を抽出する機能と、
    該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、
    任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定する機能と、
    該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出する機能と、
    任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する機能と、
    を実現させるためのプログラム。
  10. 背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出する処理をコンピュータに実行させるプログラムであって、
    該入力画像データの第一単位領域毎にフーリエ変換を施す機能と、
    該フーリエ変換によって得られる第一画像周波数情報を抽出する機能と、
    該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、
    任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する機能と、
    該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施す機能と、
    該フーリエ変換によって得られる第二画像周波数情報を抽出する機能と、
    該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とする機能と、
    該代表特徴情報に対してウエーブレット変換を施す機能と、
    該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施す機能と、
    該直線近似によって得られる近似直線上の位置を該境界として決定する機能と、
    を実現させるためのプログラム。
  11. 前記画像データまたは前記入力画像データに対して、最初、印字領域を特定し、該印字領域を除外した画像データまたは入力画像データを処理対象とする機能をさらに実現させる請求項7乃至10の何れか一つに記載のプログラム。
  12. 前記特徴情報または前記画像周波数情報は、該特徴情報または該画像周波数情報が抽出された前記単位領域に含まれる、高周波成分、低周波成分、直流成分、及び周波数分布である、ことを特徴とする請求項7乃至11の何れか一つに記載のプログラム。
  13. 画像データ上の任意の隣り合う領域において、互いに特徴の異なる領域間の境界を検出する画像処理装置であって、
    該画像データ上の単位領域毎に、該単位領域内の全画素によって決まる特徴情報を抽出する特徴強調手段と、
    任意の該単位領域を基準に、隣接する該単位領域との該特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する境界決定手段と、
    を有することを特徴とする画像処理装置。
  14. 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する画像処理装置であって、
    該画像データの単位領域毎に画像周波数情報を抽出する特徴強調手段と、
    該単位領域毎に、該抽出した画像周波数情報に基づく代表特徴情報を決定し、任意の該単位領域を基準に、隣接する該単位領域との該代表特徴情報の差を求め、該差が少なくとも所定レベル以上となる、該基準の単位領域を該境界として決定する境界決定手段と、
    を有することを特徴とする画像処理装置。
  15. 画像データ上の任意の隣り合う領域において、互いに画素配列の異なる領域間の境界を検出する画像処理装置であって、
    該画像データの第一単位領域毎に、第一画像周波数情報を抽出する特徴強調手段と、
    該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域の該代表特徴情報において、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域を該境界として仮決定する境界仮決定手段と、
    該境界として仮決定した該第一単位領域及び該第一単位領域の近傍領域において、該第一単位領域より狭い第二単位領域毎に第二画像周波数情報を抽出し、任意の該第二単位領域の該第二画像周波数情報における、隣接する該第二単位領域の該第二画像周波数情報との変化量に基づく値が少なくとも所定レベル以上となる第二単位領域を該境界として決定する境界決定手段と、
    を有することを特徴とする画像処理装置。
  16. 背景板を背面に配置して正面から画像入力を行なった原稿の、該背景板の一部と該原稿とからなる入力画像データにおいて、該背景板の一部と該原稿の縁とが同一色で画像入力された入力画像データの、該背景板の一部と該原稿との境界を検出する画像処理装置であって、
    該入力画像データの第一単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第一画像周波数情報を抽出する特徴強調手段と、
    該第一単位領域毎に、該抽出した第一画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、任意の該第一単位領域における、隣接する該第一単位領域の代表特徴情報との変化量が少なくとも所定レベル以上となる第一単位領域に対し、直線近似を施す事によって近似直線上に該当する領域を該境界として仮決定する境界仮決定手段と、
    該境界として仮決定した領域及び該領域の近傍領域において、該第一単位領域より狭い第二単位領域毎にフーリエ変換を施し、該フーリエ変換によって得られる第二画像周波数情報を抽出し、該第二単位領域毎に、該抽出した第二画像周波数情報の各種を所定の重みで加算した値を代表特徴情報とし、該代表特徴情報に対してウエーブレット変換を施し、該ウエーブレット変換によって得られる該第二単位領域毎の値が少なくとも所定レベル以上となる第二単位領域に対して直線近似を施し、該直線近似によって得られる近似直線上の位置を該境界として決定する境界決定手段と、
    を有することを特徴とする画像処理装置。
  17. 前記画像データの印字領域を除外する印字領域除外部をさらに有することを特徴とする請求項13乃至16の何れか一つに記載の画像処理装置。
  18. 前記特徴情報または前記画像周波数情報は、該特徴情報または該画像周波数情報が抽出された前記単位領域に含まれる、高周波成分、低周波成分、直流成分、及び周波数分布である、ことを特徴とする請求項13乃至17の何れか一つに記載の画像処理装置。
  19. 原稿を光学式に読み取って該原稿の前記画像データを生成する画像読取手段を、さらに有することを特徴とする請求項13乃至18の何れか一つに記載の画像処理装置。
JP2002370596A 2002-12-20 2002-12-20 境界検出方法、プログラム、及び画像処理装置 Expired - Fee Related JP4067957B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2002370596A JP4067957B2 (ja) 2002-12-20 2002-12-20 境界検出方法、プログラム、及び画像処理装置
TW092133881A TWI295137B (en) 2002-12-20 2003-12-02 Boundary detection method between areas having different features in image data
US10/728,906 US7539344B2 (en) 2002-12-20 2003-12-08 Boundary detection method between areas having different features in image data
EP03257959A EP1431913B1 (en) 2002-12-20 2003-12-17 Method for detecting boundaries between areas having different features in image data
DE60311748T DE60311748T2 (de) 2002-12-20 2003-12-17 Verfahren zur Bestimmung von Rändern zwischen Bildbereichen mit verschiedenen Bildmerkmalen
CNB2003101239613A CN1324873C (zh) 2002-12-20 2003-12-19 边界检测方法、图像处理设备和复印机
KR1020030093650A KR101011865B1 (ko) 2002-12-20 2003-12-19 경계 검출 방법, 기록 매체, 및 화상 처리 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002370596A JP4067957B2 (ja) 2002-12-20 2002-12-20 境界検出方法、プログラム、及び画像処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007293115A Division JP4629718B2 (ja) 2007-11-12 2007-11-12 境界検出方法、プログラム、及び画像処理装置

Publications (2)

Publication Number Publication Date
JP2004201240A true JP2004201240A (ja) 2004-07-15
JP4067957B2 JP4067957B2 (ja) 2008-03-26

Family

ID=32376342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002370596A Expired - Fee Related JP4067957B2 (ja) 2002-12-20 2002-12-20 境界検出方法、プログラム、及び画像処理装置

Country Status (7)

Country Link
US (1) US7539344B2 (ja)
EP (1) EP1431913B1 (ja)
JP (1) JP4067957B2 (ja)
KR (1) KR101011865B1 (ja)
CN (1) CN1324873C (ja)
DE (1) DE60311748T2 (ja)
TW (1) TWI295137B (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8174737B2 (en) 2007-12-28 2012-05-08 Brother Kogyo Kabushiki Kaisha Image reading apparatus
US8284463B2 (en) 2007-12-28 2012-10-09 Brother Kogyo Kabushiki Kaisha Image reading apparatus
JP2013031148A (ja) * 2011-06-20 2013-02-07 Kyocera Document Solutions Inc 画像形成装置及び画像形成方法
US8606018B2 (en) 2008-06-17 2013-12-10 Canon Kabushiki Kaisha Image processing method and image processing apparatus
US8842917B2 (en) 2009-11-05 2014-09-23 Canon Kabushiki Kaisha Local feature extraction apparatus, control method therefor, and computer-readable medium
WO2017208368A1 (ja) * 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
EP3383014A1 (en) 2017-03-30 2018-10-03 Canon Kabushiki Kaisha Image reading apparatus and image forming apparatus for detecting whether sheet is protruding from readable range
US20210240977A1 (en) * 2020-02-03 2021-08-05 Fuji Xerox Co., Ltd. Document processing apparatus and non-transitory computer readable medium storing program

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4598426B2 (ja) * 2004-03-30 2010-12-15 富士通株式会社 境界抽出方法、プログラムおよびこれを用いた装置
JP4645498B2 (ja) * 2006-03-27 2011-03-09 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4885789B2 (ja) * 2007-05-14 2012-02-29 富士通株式会社 画像処理方法、画像領域検出方法、画像処理プログラム、画像領域検出プログラム、画像処理装置、および、画像領域検出装置
JP2009246620A (ja) * 2008-03-31 2009-10-22 Brother Ind Ltd イメージデータ作成装置
US11321772B2 (en) 2012-01-12 2022-05-03 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
EP2810427A4 (en) * 2012-01-31 2015-10-14 Hewlett Packard Development Co CHARACTER SET FOR PRINTING PATTERNS
US11620733B2 (en) 2013-03-13 2023-04-04 Kofax, Inc. Content-based object detection, 3D reconstruction, and data extraction from digital images
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10783615B2 (en) 2013-03-13 2020-09-22 Kofax, Inc. Content-based object detection, 3D reconstruction, and data extraction from digital images
KR101338138B1 (ko) * 2013-10-18 2013-12-06 주식회사 아나패스 전환 영역 검출 방법 및 이를 이용한 영상 처리 장치
WO2015167446A2 (en) * 2014-04-29 2015-11-05 Hewlett-Packard Development Company, L.P. Scanner with a background
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10467465B2 (en) 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
JP6634899B2 (ja) * 2016-03-11 2020-01-22 コニカミノルタ株式会社 原稿読み取り装置、画像処理装置、原稿読み取り方法及びプログラム
CN105868751B (zh) * 2016-03-28 2019-02-05 山东东港彩意网络科技有限公司 即开票兑奖区定位方法
CN107368829B (zh) * 2016-05-11 2020-08-14 富士通株式会社 确定输入图像中的矩形目标区域的方法和设备
JP2018198386A (ja) * 2017-05-24 2018-12-13 セイコーエプソン株式会社 読取装置および画像生成方法
US10803350B2 (en) * 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN110502205B (zh) * 2019-08-29 2023-08-01 百度在线网络技术(北京)有限公司 图片显示边缘处理方法、装置、电子设备和可读存储介质
CN111008969B (zh) * 2019-12-06 2023-07-18 浙江蓝鸽科技有限公司 黑板板书提取与智能识别方法及系统
CN112489129A (zh) * 2020-12-18 2021-03-12 深圳市优必选科技股份有限公司 位姿识别模型训练方法、装置、位姿识别方法和终端设备
CN113393387A (zh) * 2021-05-26 2021-09-14 房超 一种数学形态学自适应结构元素构造方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03170924A (ja) 1989-11-29 1991-07-24 Mita Ind Co Ltd 原稿サイズ検知装置
US5173788A (en) * 1990-02-07 1992-12-22 Brother Kogyo Kabushiki Kaisha Image reading device having moire depressing unit
JP2564959B2 (ja) * 1990-03-07 1996-12-18 富士ゼロックス株式会社 画像処理装置の絵文字領域識別方式
JPH06121161A (ja) * 1991-05-14 1994-04-28 Fuji Xerox Co Ltd カラー画像処理装置の文字処理方式
JPH0760462B2 (ja) 1991-07-08 1995-06-28 株式会社エイ・ティ・アール通信システム研究所 画像領域分割装置
JPH05110779A (ja) 1991-10-16 1993-04-30 Fuji Xerox Co Ltd 原稿認識装置
JPH0637987A (ja) 1992-07-20 1994-02-10 Canon Inc 原稿検知装置
JPH0660182A (ja) 1992-08-04 1994-03-04 Komatsu Ltd テクスチャ解析を用いた領域分割方法及び装置
JP3353968B2 (ja) 1992-09-25 2002-12-09 オリンパス光学工業株式会社 画像処理装置
DE69434131T2 (de) * 1993-05-05 2005-11-03 Koninklijke Philips Electronics N.V. Vorrichtung zur Segmentierung von aus Texturen bestehenden Bildern
JPH07115514A (ja) 1993-10-18 1995-05-02 Canon Inc 画像読取装置
JP3147278B2 (ja) * 1994-11-09 2001-03-19 キヤノン株式会社 原稿検知方法及び装置
JP3006466B2 (ja) * 1995-09-28 2000-02-07 日本電気株式会社 文字入力装置
JPH1023191A (ja) 1996-07-08 1998-01-23 Ricoh Co Ltd 画像評価方法および画像評価装置
US5889559A (en) * 1997-01-14 1999-03-30 Intel Coproration Method and apparatus for minimally-shifted wavelet decomposition and recomposition
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8284463B2 (en) 2007-12-28 2012-10-09 Brother Kogyo Kabushiki Kaisha Image reading apparatus
US8174737B2 (en) 2007-12-28 2012-05-08 Brother Kogyo Kabushiki Kaisha Image reading apparatus
US8606018B2 (en) 2008-06-17 2013-12-10 Canon Kabushiki Kaisha Image processing method and image processing apparatus
US8842917B2 (en) 2009-11-05 2014-09-23 Canon Kabushiki Kaisha Local feature extraction apparatus, control method therefor, and computer-readable medium
JP2013031148A (ja) * 2011-06-20 2013-02-07 Kyocera Document Solutions Inc 画像形成装置及び画像形成方法
US10706315B2 (en) 2016-05-31 2020-07-07 Pfu Limited Image processing device, image processing method, and computer program product
WO2017208368A1 (ja) * 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
EP3383014A1 (en) 2017-03-30 2018-10-03 Canon Kabushiki Kaisha Image reading apparatus and image forming apparatus for detecting whether sheet is protruding from readable range
US10602002B2 (en) 2017-03-30 2020-03-24 Canon Kabushiki Kaisha Image reading apparatus and image forming apparatus for detecting whether sheet is protruding from readable range
US10887473B2 (en) 2017-03-30 2021-01-05 Canon Kabushiki Kaisha Image reading apparatus and image forming apparatus for detecting whether sheet is protruding from readable range
EP4161046A1 (en) 2017-03-30 2023-04-05 Canon Kabushiki Kaisha Image reading apparatus and image forming apparatus for detecting whether sheet is protruding from readable range
US20210240977A1 (en) * 2020-02-03 2021-08-05 Fuji Xerox Co., Ltd. Document processing apparatus and non-transitory computer readable medium storing program
US11875588B2 (en) * 2020-02-03 2024-01-16 Fujifilm Business Innovation Corp. Document processing apparatus and non-transitory computer readable medium storing program

Also Published As

Publication number Publication date
CN1324873C (zh) 2007-07-04
TWI295137B (en) 2008-03-21
US20040170324A1 (en) 2004-09-02
KR20040055686A (ko) 2004-06-26
DE60311748T2 (de) 2007-06-14
US7539344B2 (en) 2009-05-26
EP1431913A1 (en) 2004-06-23
KR101011865B1 (ko) 2011-01-31
DE60311748D1 (de) 2007-03-29
EP1431913B1 (en) 2007-02-14
JP4067957B2 (ja) 2008-03-26
CN1525733A (zh) 2004-09-01
TW200414750A (en) 2004-08-01

Similar Documents

Publication Publication Date Title
JP4067957B2 (ja) 境界検出方法、プログラム、及び画像処理装置
JP4598426B2 (ja) 境界抽出方法、プログラムおよびこれを用いた装置
JP3964327B2 (ja) 画像内の関心領域を決定するための方法及び装置及び画像伝送方法及び装置
JP2001169080A (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
EP1477020A1 (en) DETECTION AND CORRECTION OF RED−EYE FEATURES IN DIGITAL IMAGES
KR101177626B1 (ko) 물체 검출 장치 및 방법
US7333656B2 (en) Image processing method and image processing apparatus
KR20030029187A (ko) 영상 의존적인 얼굴 영역 추출방법
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20140140620A1 (en) Image processing apparatus, image processing method and computer readable medium
JP4629718B2 (ja) 境界検出方法、プログラム、及び画像処理装置
US20110187721A1 (en) Line drawing processing apparatus, storage medium storing a computer-readable program, and line drawing processing method
JP4060559B2 (ja) 画像処理装置および画像処理方法
JP2010134958A (ja) 境界検出方法、プログラムおよびこれを用いた装置
JP6272219B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2011170554A (ja) 物体認識装置、物体認識方法及び物体認識プログラム
JP2004152087A (ja) 画像の特徴量を抽出する方法および装置
JP4579646B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP2005004470A (ja) 画像減色装置、画像減色方法および画像減色プログラム
Keramidas et al. Noise-robust statistical feature distributions for texture analysis
CN111491069B (zh) 一种文档图像的色彩模式自动设定方法
JP2005284509A (ja) 画像処理装置
JP2016126447A (ja) 画像処理装置および画像処理方法
JP2001127998A (ja) 画像処理装置および画像処理方法
KR20230020448A (ko) 자동화 아티팩트 검출

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4067957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120118

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140118

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees