JP4955096B2 - 検出装置、検出方法、検出プログラム、および記録媒体 - Google Patents

検出装置、検出方法、検出プログラム、および記録媒体 Download PDF

Info

Publication number
JP4955096B2
JP4955096B2 JP2010263891A JP2010263891A JP4955096B2 JP 4955096 B2 JP4955096 B2 JP 4955096B2 JP 2010263891 A JP2010263891 A JP 2010263891A JP 2010263891 A JP2010263891 A JP 2010263891A JP 4955096 B2 JP4955096 B2 JP 4955096B2
Authority
JP
Japan
Prior art keywords
boundary
image
detection
edge
projection histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010263891A
Other languages
English (en)
Other versions
JP2011129114A (ja
Inventor
エドワード ドーラン ジョン
シャオ−シェン チェン ローレンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2011129114A publication Critical patent/JP2011129114A/ja
Application granted granted Critical
Publication of JP4955096B2 publication Critical patent/JP4955096B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Input (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Analysis (AREA)

Description

本発明は、デジタル画像におけるコンテンツの境界を自動的に検出する検出装置および検出方法に関する。また、本発明は、コンピュータをそのような検出装置として動作させるための検出プログラム、および、そのような検出プログラムが記録されているコンピュータ読み取り可能な記録媒体に関する。
デジタルページ(デジタル画像、デジタル文書、および画像とも捉えられる)の本質的でない無関係な部分をトリミングすることが望ましい。特に、外側のページマージン、例えば、スキャン処理によりデジタルページが生成される際のバックプラテンに対応するデジタルページの領域を除去しつつ、デジタルページのコンテンツを保持することが望ましい。この処理が有効となる典型的なアプリケーションとしては、ページのコンテンツを元のページとは異なるサイズのページに再配置するアプリケーション、ページのコンテンツを追加の素材と合成するアプリケーション、および、その他の文書レイアウト用のアプリケーションが挙げられる。また、トリミングは、ユーザによる操作が介入することなく、自動的に行われることが望ましい。さらに、任意の形状のコンテンツ領域を含むデジタルページについてトリミングが可能であることが望ましく、デジタルページのコンテンツが、直交する画像軸に対して傾いている場合であっても、トリミングが可能であることが望ましい。
このようにコンテンツ領域をトリミング可能な装置として、特許文献1に開示されている原稿検出装置が挙げられる。特許文献1に開示されている原稿検出装置は、プラテンガラス上に載置された原稿を読み取って原稿の画像データを生成するとともに、画像データに含まれる各画素の濃度値と、プラテンガラス上に何もない場合に検出する規定の濃度値と、を比較することにより、画像中の原稿領域のエッジを検出する。より具体的には、特許文献1の段落〔0018〕〔0024〕および図15などに記載されているように、上記原稿検出装置は、走査線ごとに、上記規定の濃度値との濃度差が所定値以上であるような該走査線上の画素のうち、最も左側のある画素と最も右側にある画素とをエッジとして検出するように構成されている。
特開平11−255785号公報(平成11年11月30日公開)
ところで、プラテンガラスが汚れている場合などには、原稿の読み取りの際にプラテンガラス上の汚れを読み取ってしまい、原稿の画像データにノイズが含まれることになる。
これに関し、上記従来の構成では、画像データ中のノイズに相当する画素を原稿領域のエッジとして検出してしまう誤検出が生じやすいという問題があった。
本発明は、上記課題に鑑みてなされたものであり、その主な目的は、デジタル画像中のコンテンツの境界を自動的に、且つ、より正確に検出することが可能な検出装置および検出方法を実現することにある。
本発明に係る検出装置は、上記課題を解決するために、画像中の領域であって原稿が描画される領域である原稿領域の境界を検出する検出装置において、上記画像を正規化することにより正規化画像を生成する正規化手段と、上記正規化画像中の上記原稿について複数のエッジ点を検出するエッジ検出手段と、上記正規化画像における上記原稿の傾き角度の方向の第1の投影ヒストグラムであって、上記エッジ検出手段により検出された複数のエッジ点についての第1の投影ヒストグラムを作成する投影ヒストグラム作成手段と、上記第1の投影ヒストグラムおよび上記傾き角度から、上記境界の一部を検出する境界検出手段と、を備え、上記エッジ検出手段は、上記正規化画像中の各画素について、該画素から規定の範囲内に位置する画素群の最大濃度値と最小濃度値との濃度差が第1の閾値以上であって第2の閾値以下である場合に該画素を上記エッジ点として検出することを特徴としている。
上記の構成によれば、本発明に係る検出装置は、上記正規化画像中の各画素について、該画素から規定の範囲内に位置する画素群の最大濃度値と最小濃度値との濃度差が第1の閾値以上であって第2の閾値以下である場合に該画素を上記エッジ点として検出する。すなわち、上記画像にノイズが含まれ、且つ、上記正規化画像中のノイズに相当する画素の濃度値が上記最大濃度値または上記最小濃度値に該当する場合であっても、上記濃度差が上記第2の閾値より大きい場合には、本発明に係る検出装置は、上記ノイズに相当する画素およびその近傍の画素をエッジ点として誤検出しない。
したがって、本発明に係る検出装置は、デジタル画像中のコンテンツの境界を自動的に、且つ、より正確に検出することができるという効果を奏する。
本発明に係る検出方法は、画像中の領域であって原稿が描画される領域である原稿領域の境界を検出装置が検出する検出方法において、上記画像を正規化することにより正規化画像を生成する正規化工程と、上記正規化画像中の上記原稿について複数のエッジ点を検出するエッジ検出工程と、上記正規化画像における上記原稿の傾き角度の方向の第1の投影ヒストグラムであって、上記エッジ検出手段により検出された複数のエッジ点についての第1の投影ヒストグラムを作成する投影ヒストグラム作成工程と、上記第1の投影ヒストグラムおよび上記傾き角度から、上記境界の一部を検出する境界検出工程と、を含み、上記エッジ検出工程にて、上記正規化画像中の各画素について、該画素から規定の範囲内に位置する画素群の最大濃度値と最小濃度値との濃度差が第1の閾値以上であって第2の閾値以下である場合に該画素を上記エッジ点として検出することを特徴としている。
上記の構成によれば、本発明に係る検出方法は、本発明に係る検出装置と同様の作用効果を奏する。
上記検出装置は、上記エッジ検出手段が、上記エッジ点として無向エッジを検出することが望ましい。
上記検出装置は、上記エッジ検出手段が、上記濃度差が第1の閾値以上であって第2の閾値以下であるような画素のうち、所定の条件を満たす画素のみをエッジ点として検出するように構成されており、上記エッジ検出手段は、ダイナミックレンジ計算手段と、フィルタ手段と、局所濃度計算手段と、エッジ点決定手段と、を備え、上記エッジ検出手段が備える各手段は、上記正規化画像中の各画素について、上記ダイナミックレンジ計算手段が、該画素から規定の範囲内における局所ダイナミックレンジの応答を計算し、上記フィルタ手段が、該局所ダイナミックレンジの応答をフィルタリングし、上記局所濃度計算手段が、上記フィルタ手段によるフィルタリング後の該局所ダイナミックレンジの応答に応じた、該規定の範囲内における局所濃度を計算し、上記エッジ点決定手段が、該局所濃度が所定の閾値より大きいという上記所定の条件を満たす場合に限り該画素をエッジ点として決定する、ように構成されている、ことが望ましい。
上記検出装置は、上記境界検出手段が検出する上記境界の上記一部が、上記原稿領域の上記境界の一辺であり、上記境界検出手段が、上記第1の投影ヒストグラムと上記傾き角度とから、上記一辺とともに、上記一辺の対辺を検出するように構成されていることが望ましい。
上記検出装置は、上記投影ヒストグラム作成手段が、上記傾き角度に垂直な垂直角度の方向の第2の投影ヒストグラムであって、上記エッジ検出手段により検出された複数のエッジ点について第2の投影ヒストグラムを作成するように構成されており、上記境界検出手段が、上記第2の投影ヒストグラムと上記垂直角度とから、上記境界の一部を検出するように構成されていることが望ましい。
上記検出装置は、上記境界検出手段が検出する上記境界の上記一部が、上記原稿領域の上記境界の一辺であり、上記境界検出手段により上記第2の投影ヒストグラムと上記垂直角度とから検出される上記境界の一辺と、上記境界検出手段により上記第1の投影ヒストグラムと上記傾き角度とから検出される上記境界の一辺と、が交差する交点を検出する交点検出手段をさらに備えていることが望ましい。
上記検出装置は、上記境界検出手段が上記第2の投影ヒストグラムと上記垂直角度とから検出する上記境界の上記一部は、上記原稿領域の境界の一辺であり、上記境界検出手段が、上記第2の投影ヒストグラムと上記垂直角度とから、上記一辺とともに、上記一辺の対辺を検出するように構成されていることが望ましい。
上記検出装置は、上記境界検出手段により上記第2の投影ヒストグラムと上記垂直角度とから検出される1対の対辺が、上記境界検出手段により上記第1の投影ヒストグラムと上記傾き角度とから検出される1対の対辺に交差する4つの交点を検出する交点検出手段をさらに備えていることが望ましい。
上記検出装置は、上記画像が、複数の成分から構成されており、上記正規化手段が、上記画像をダウンサンプリングすることによりダウンサンプリング画像を生成するダウンサンプリング手段と、上記ダウンサンプリング画像から上記複数の成分のうち特定の成分を抽出することにより得られる特定成分画像を生成する成分抽出手段と、上記特定成分画像にガンマ伸張処理を施すガンマ伸張手段と、を備えていることが望ましい。
上記検出装置は、上記境界検出手段が、上記第1の投影ヒストグラムと上記傾き角度とに基づいて、第1の動的閾値を計算する動的閾値計算手段と、上記第1の動的閾値により上記第1の投影ヒストグラムを閾値処理する閾値処理手段と、上記第1の動的閾値により閾値処理が施された上記第1の投影ヒストグラムにおける先頭のピークを検出する境界ピーク検出手段と、上記先頭のピークと上記傾き角度とに基づいて、上記境界の上記一部を決定する決定手段と、を備えていることが望ましい。
上記エッジ検出手段は、上記正規化画像をフィルタリングするフィルタ手段を備えており、上記フィルタ手段は、上記傾き角度の方向の局所微分フィルタであることが望ましい。
また、上記検出装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記検出装置をコンピュータにおいて実現するプログラム、およびそのプログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
なお、本発明のいくつかの実施形態は、デジタル画像中のコンテンツの境界を自動的に検出する検出方法および検出システムを構成している。
本発明のいくつかの実施形態において、コンテンツの境界を検出する検出システムは、入力画像を受信する画像受信部と、入力画像に関する傾き情報を受信する傾き情報受信部と、を備えていてもよい。本発明のいくつかの実施形態において、画像受信部は、入力画像を調整する画像前調整部を備えていてもよい。画像前調整部は、一貫した処理を行うことが可能な正規化フォーマットになるように、入力画像に前調整を施してもよい。そして、画像前調整部は、正規化され、前調整された画像をエッジ検出部に供給するようにしてもよい。エッジ検出部は、正規化された画像から検出されたエッジ点を投影ヒストグラム作成部に供給してもよい。投影ヒストグラム作成部は、エッジ検出部から供給されたエッジ点と傾き情報受信部から供給された傾き情報とを用いて、2つの投影ヒストグラムを作成してもよい。エッジ点および投影ヒストグラムは、境界線を推定することが可能な境界推定部に供給されてもよい。境界線交点決定部は、境界推定部より供給された境界線から境界の角を決定してもよい。いくつかの実施形態において、コンテンツの境界を検出する検出システムは、境界の角を他のシステムおよび他のプロセスに利用させてもよい。
本発明の別のいくつかの実施形態は、1以上の計算デバイスを含む計算システムにおいて実行される方法を構成してもよい。これらの実施形態のいくつかは、計算システムにおいて入力画像および傾き情報を受信する受信ステップと、入力画像を正規化フォーマットに調整する調整ステップとを含んでいてもよい。正規化され、前調整された画像中のエッジの位置を決定してもよく、エッジと傾き情報とに基づいて投影ヒストグラムを作成してもよい。投影ヒストグラムとエッジ点とは、有向境界を推定するために使用されてもよく、有向境界は、境界の隅部と境界線とを決定するために使用されてもよい。
前述した本発明の目的、特徴および利点、並びに、本発明のその他の目的、特徴および利点は、添付の図面とともに以下の発明の詳細な説明を考慮すれば、より容易に理解できるであろう。
本発明の典型的な実施形態に係る図であり、画像受信部、傾き情報受信部、画像前調整部、エッジ検出部、投影ヒストグラム作成部、境界推定部、および境界線交点決定部を備えた画像処理装置の構成を示す図である。 図1に示す画像前調整部の典型的な実施形態を示す図である。 図1に示すエッジ検出部による無方向のエッジ検出の典型的な実施形態を示す図である。 図1に示す境界推定部の典型的な実施形態を示す図である。 本発明の典型的な実施形態に係る図であり、典型的な入力画像から青成分を抽出して描画した青成分画像である。 図5に示す青成分画像にガンマ伸張を適用した画像を示す図である。 本発明の典型的な実施形態に係る図であり、図5の正規化画像をブラケットフィルタリングすることにより得られる画像である。 図7に示す画像について、本発明の実施形態に係る画像処理装置が決定したフィルタ局所濃度を示す画像である。 本発明の実施形態に従って決定された、典型的な投影ヒストグラムの画像である。 本発明の実施形態に従って決定された、典型的な閾値付き投影ヒストグラムの画像である。 図5に関連する典型的な画像について本発明の実施形態に係る画像処理装置が決定したコンテンツの境界を示す画像である。 図11に示すコンテンツの境界について、本発明の実施形態に係る画像処理装置が決定した交差する隅部を示す画像である。 本発明の実施形態に係る図であり、回転ベクトルの角度とその角度に垂直な角度とに調整した有向局所微分フィルタを備えた画像処理装置の構成を示す図である。 典型的な有向局所微分フィルタを示す画像である。 本発明の実施形態に係る図であり、図14に示す典型的なフィルタを使用したエッジ検出の結果を示す画像である。 本発明の実施形態に係る有向局所微分フィルタを備えた画像処理装置が決定するコンテンツの境界を示す画像である。 本発明の実施形態に係る画像処理装置が決定する、図16に示すコンテンツの境界の交差する隅部を示す図である。 本発明の実施形態に係る画像処理装置が、入力画像と傾き情報とを受信し、入力画像に前調整を施し、正規化画像中のエッジの位置を決定し、投影ヒストグラムを作成し、有向境界を決定し、境界の隅部を決定する動作を示すフローチャート図である。 本発明の典型的な実施形態に係る図であり、図18における画像の前調整の動作を示すフローチャート図である。 本発明の典型的な実施形態に係る図であり、無向エッジ検出の動作を示すフローチャート図である。 本発明の典型的な実施形態に係る図であり、有向局所微分フィルタリングの動作を示すフローチャート図である。 本発明の典型的な実施形態を示す図であり、閾値処理された投影ヒストグラムからコンテンツの境界を決定する動作を示すフローチャート図である。 本発明の実施形態に基づいてサンプルされた対数曲線のプロット図である。
本発明の実施形態は図面を参照することにより最も良く理解できるであろう。ここで、図中においては、同じ部材が同じ数値により示されている。前述した各図は、明白に発明の詳細な説明の一部に含まれている。
広く説明され、図中に示されている本発明の各構成要素は、広く様々なバリエーションの異なる構成にアレンジおよび設計可能である。したがって、次に説明する、本発明に係る検出方法および検出システムのより詳細な説明は、本発明の範囲を限定するものではなく、単に、本発明のより好ましい実施形態を表すものである。
本発明の実施形態の構成要素は、ハードウェア、ファームウェアおよびソフトウェアのうち少なくとも1以上の形態によって具現化することができる。
ここで明らかにされる典型的な実施形態の要素は、これらの形態のうちの1つを説明しているのみであり、当業者であれば、本発明の範囲内にある限り、これらの要素を任意の形態で実現することができることは言うまでもない。
多くのアプリケーションにおいて、デジタルページ(デジタル画像、デジタル文書、および画像とも捉えられる)におけるコンテンツの境界の判定を行うことには利点がある。デジタルページの余分な部分を除去することが好ましい。特に、外部のページマージン、例えば、スキャン処理によりデジタルページが生成される際のバックプラテンに対応するデジタルページ中の領域を除去しつつ、デジタルページ中のコンテンツを保持することが望ましい。この処理が有用な典型的なアプリケーションには、ページ中のコンテンツを元のページとは異なるサイズのページ中に再配置するアプリケーション、ページのコンテンツを追加の素材と合成するアプリケーション、および、その他の文書レイアウト用のアプリケーションが含まれる。
コンテンツの境界は、ユーザが介入することなく、自動的に検出されることが好ましい。また、デジタルページ中のコンテンツが、直交する画像軸に対して傾いているときにコンテンツの境界を検出することが好ましい。そして、デジタルページに著しいノイズが含まれているときにコンテンツの境界を検出することが望ましい。
本発明の実施形態は、傾きおよびノイズの少なくもいずれかが存在するデジタルページ中のコンテンツの境界を自動的に検出する検出方法および検出システムを含んでいる。
図1と関連して説明される本発明の典型的な実施形態において、コンテンツ境界検出システム2は、入力画像5を受信する画像受信部4、入力画像5に関する傾き情報7を受信する傾き情報受信部6を備えている。いくつかの実施形態において、入力画像5は、スキャン処理で生成される画像であってもよい。別の実施形態では、入力画像5は、他の方法で生成される画像であってもよい。また、いくつかの実施形態では、入力画像5は、高解像度(例えば、300dpi(dots per inch)またはそれ以上)の画像であってもよい。また、いくつかの実施形態では、傾き情報7は、スキャン軸に対するローカルな文書座標系における推定値であってもよい。
画像受信部4は、入力画像5を画像前調整部8に供給してもよい。画像前調整部8は、前調整を施すことにより、入力画像5を一貫した処理を行うことが可能な正規化フォーマットにしてもよい。画像前調整部8は、正規化画像、すなわち、前調整された画像9をエッジ検出部10に供給してもよい。エッジ検出部10は、正規化画像9から検出された複数のエッジ点11を投影ヒストグラム作成部12に供給してもよい。投影ヒストグラム作成部12は、エッジ検出部10から供給される複数のエッジ点11と傾き情報受信部6から供給される傾き情報7とを用いて、2つの投影ヒストグラム13を作成する。複数のエッジ点11と2つの投影ヒストグラム13とは、境界線15に関する情報を推定可能な境界推定部14に供給されてもよい。境界線交点決定部は、境界推定部14によって供給される境界線15の情報から境界の隅部17を決定するようにしてもよい。いくつかの実施形態において、コンテンツ境界検出システム2は、境界の隅部17に関する情報を、他のシステムおよび他の処理に利用させてもよい。図示しない別の実施形態では、境界線15に関する情報が、他のシステムおよび他の処理で利用可能であってもよい。
図1および図2を参照すれば、本発明のいくつかの実施形態において、画像前調整部8は、ダウンサンプラ20、成分抽出部22、およびガンマ伸張部24を備えていてもよい。これらの実施形態のいくつかでは、ダウンサンプラ20は、画像受信部4から得られる入力画像5を、例えば、解像度300DPIから解像度75DPIにダウンサンプリングしてもよい。ダウンサンプラ20は、ダウンサンプルした画像21を成分抽出部22に供給してもよく、さらなる処理において、成分抽出部22は、例えば青成分や輝度成分などといった単一の成分を画像21から抽出し、単一成分画像23を生成してもよい。成分抽出部22は、単一成分画像23をガンマ伸張部24に供給し、ガンマ伸張部24は、例えば、単一成分画像23に対しガンマ値2のガンマ伸張を施すことにより、入力画像5中でコンテンツの部分に区分される範囲を広げ、正規化画像9を生成してもよい。画像前調整部8は、コンテンツ境界検出システム2の他の構成要素に正規化画像9を利用させてもよい。
当業者は、ダウンサンプラ20、成分抽出部22、およびガンマ伸張部24からなる構成以外の構成により、画像前調整部8の機能を実現できることについて十分に理解できるであろう。例えば、図示しない他の実施形態では、成分抽出部が入力画像から単一成分画像を抽出してもよい。ダウンサンプラは、単一成分画像をダウンサンプリングしてもよい。そして、ガンマ伸張部24は、ダウンサンプルされた単一成分画像にガンマ伸張を施してもよい。図示しない別の実施形態では、成分抽出部は、他のサンプルから単一成分画像を抽出してもよい。ガンマ伸張部24は単一成分画像にガンマ伸張を施してもよいし、ダウンサンプラは、単一成分画像にガンマ伸張が施された画像をダウンサンプリングしてもよい。
図1および図3を参照すれば、本発明のいくつかの実施形態では、エッジ検出部10は、ダイナミックレンジ計算部30、ブラケットフィルタ32、局所濃度計算部34、および閾値処理部36を備えていてもよい。これらの実施形態では、エッジ検出部10は、無向エッジを検出する。ダイナミックレンジ計算部30は、画像前調整部8から供給される正規化画像9に含まれる各画素について、局所ダイナミックレンジを計算してもよい。正規化画像に含まれる各画素において、(i、j)で示される該画素の位置の局所近傍におけるダイナミックレンジは、以下の式に従って決定される。
Figure 0004955096
ここで、Nは、局所近傍(例えば、ダイナミックレンジを決定する画素の位置を中心とする縦5画素×横5画素の画素群)を示しており、pは、画素における画素値を示している。正規化画像9中の各画素について決定される局所ダイナミックレンジを含むレンジ応答31は、ブラケットフィルタ32が利用することが可能になっていてもよい。ブラケットフィルタ32は、レンジ応答31のうち有効なレンジ値のみを保持することにより、局所濃度計算部34が利用可能なフィルタ処理されたレンジ応答33を生成してもよい。小さいほうの閾値以下のレンジ値は、準一様な領域を示しており、エッジでないと見なせばよい。大きいほうの閾値以上のレンジ値は、スキャン画像の場合、ほぼ、原稿画像中のコンテンツまたはバックプラテン上の模様について計算した結果のレンジ値となる。縦5画素×横5画素の局所近傍についてダイナミックレンジの計算を行う本発明のいくつかの実施形態では、ブラケットフィルタ32は、以下の式に従ったフィルタリングを実行する。
Figure 0004955096
ここで、rng’(i,j)は、画素の位置(i,j)におけるフィルタ処理されたレンジ応答を示している。一般には、ブラケットフィルタ32は、以下の式に従ったフィルタリングを実行する。
Figure 0004955096
ここで、THlowerおよびTHupperは、それぞれ、小さいほうの閾値(第1の閾値)と大きいほうの閾値(第2の閾値)とを示している。2つの閾値は、ダイナミックレンジ計算部30において使用される局所近傍(所定の範囲)をどのような範囲に設定するかに応じて異なる値となる。フィルタ処理されたレンジ応答33は、有効なレンジ値33の局所濃度を計算可能な局所濃度計算部34に供給されてもよい。局所濃度計算部34は、画素の位置(i,j)に隣接する近傍の画素を用いて局所濃度を決定してもよい。いくつかの実施形態では、局所濃度計算部34において使用される近傍の範囲は、ダイナミックレンジ計算部30において使用される近傍の範囲と同じであってもよい。また、別の実施形態では、局所濃度計算部34において使用される近傍の範囲と、ダイナミックレンジ計算部30において使用される近傍の範囲とが異なっていてもよい。いくつかの実施形態では、NLDで表される所定の近傍において、画素の位置(i,j)における局所濃度は、以下の式に従って決定することができる。
Figure 0004955096
いくつかの実施形態において、局所濃度の近傍NLDは、局所濃度を計算する画素を中心とする5画素×5画素の窓領域であってもよい。局所濃度計算部34は、閾値処理部36に
局所濃度35を供給し、閾値処理部36は、局所濃度計算部34から得られる局所濃度35に対して閾値処理を行う。これにより、閾値処理部36は、十分な局所濃度を持つ点のみを保持する。十分な局所濃度を持つ点は、原稿の境界遷移域に相当する十分なローカルサポートを持つ点から構成される。閾値処理された応答(すなわち、画素の位置(i,j)におけるエッジ点)は次の式に従って決定することができる。
Figure 0004955096
ここで、μは、局所濃度の閾値(所定の閾値)を示している。本発明のいくつかの実施形態において、局所濃度の閾値は、全体濃度の平均値であってもよいし、全体濃度に関する他の関数値であってもよい。エッジ検出部10は、エッジ点11をコンテンツ境界検出システム2の他の構成要素に利用させることができる。別の実施形態では、画素の位置(i,j)における局所濃度は、rng’(i,j)=1を満たすような画素の位置(i,j)のみで決定されてもよい。この実施形態では、計算コストを削減することができる。また、図示しない別の実施形態では、コンテンツ境界検出システム2は、局所濃度計算部34および閾値処理部36を備えていなくともよく、フィルタされたレンジ応答33は、エッジ点11としてシステムの他の部分に直接利用可能になっていてもよい。
図1を参照すれば、投影ヒストグラム作成部12は、エッジ検出部から供給されるエッジ点11と傾き情報受信部6から供給される傾き情報7とを用いて、投影ヒストグラム13を計算してもよい。投影ヒストグラム作成部12は、傾き情報7によって示される各方向の投影ヒストグラムを計算してもよい。傾き情報は、入力される回転ベクトルであるrvec=[rx,ry]と、当該回転ベクトルに垂直なベクトルvvec=rvec= [-ry,rx]とにより示される。そして、すべての境界位置の候補の位置ベクトルは、以下の式で表すことができる。
Figure 0004955096
上下方向投影ヒストグラムTBprojおよび左右方向投影ヒストグラムLRprojは、それぞれ、行列の乗算を示す以下の式に従って計算される。
Figure 0004955096
Figure 0004955096
投影ヒストグラム作成部12は、上下方向投影ヒストグラムと左右方向投影ヒストグラムとを、投影値を累積することにより計算してもよい。投影ヒストグラム作成部12は、投影ヒストグラム13を境界推定部14に供給してもよい。
図1および図4を参照すれば、境界推定部14は、動的閾値計算部40、閾値処理部42、境界ピーク検出部44およびライン調整部46を備えていてもよい。動的閾値計算部40は、各投影ヒストグラム31について閾値を計算することにより、各投影ヒストグラムにおける原稿でない部分のピークを抑制する。本発明のいくつかの実施形態では、投影ヒストグラムの閾値を、投影ヒストグラムのビンカウントの平均値と全体濃度比との関数により算出してもよい。また、これらの実施形態のいくつかでは、上下方向投影ヒストグラムの閾値を、以下の式に従って決定してもよい。
Figure 0004955096
また、左右方向投影ヒストグラムの閾値を、以下の式に従って決定してもよい。
Figure 0004955096
ここで、μTBとμLRとは、それぞれ、ヒストグラムのビンカウントの平均値を示している。また、典型的な実施形態においては、γ=0.8であり、Δは以下の式で表される。
Figure 0004955096
動的閾値計算部40は、決定した閾値41を閾値処理部42に利用させることができる。閾値処理部42は、閾値以下のビンカウントを持ついずれのヒストグラムビンについてもビンカウントを0に設定して投影値を抑えることにより、投影ヒストグラムに閾値処理を施してもよい。閾値処理部42は、閾値処理された複数の投影ヒストグラムを境界ピーク検出部44に供給してもよい。境界ピーク検出部44は、閾値処理された複数の投影ヒストグラムの各々について、有効な境界ピークを特定してもよい。上方向のピークは、上下方向投影ヒストグラムにおいて極大値をとる最初の(すなわち、先頭の)ビンを検索することにより特定される。左方向のピークは、左右方向投影ヒストグラムにおいて極大値をとる最初の(すなわち、先頭の)ビンを検索することにより特定される。右方向のピークは、左右方向投影ヒストグラムにおいて極大値をとる最後の(すなわち、末尾の)ビンを検索することにより特定される。下方向のピークは、上下方向投影ヒストグラムにおいて極大値をとる最後の(すなわち、末尾の)ビンを検索することにより特定される。極大値をとる先頭のビンは、ビンカウントが当該ビンに先行するいずれのビンのビンカウントよりも大きく、且つ、当該ビンに後続する少なくとも1以上のビンのビンカウントよりも大きいビンであるものとしてもよい。また、極大値をとる末尾のビンは、同様のプロセスを用いて逆順でヒストグラム信号を処理することにより特定してもよい。いくつかの実施形態では、ヒストグラムから一次微分係数を計算してもよく、一次微分係数が負になるような最初のビンを先頭のピークとしてもよいし、一次微分係数が正から負に変わるような最後のビンを末尾のピークとしてもよい。上方向、下方向、左方向および右方向のピークの位置は、それぞれ、CT、CB、CLおよびCRにより表される。ライン調整部46は、境界ピーク検出部44により供給されるピークの位置を用いて、境界線15を作成する。また、ライン調整部46は、傾き情報7を用いて境界線を調整する。いくつかの実施形態においては、境界線15は、以下の式に従って決定される。
Figure 0004955096
図1を参照すれば、境界線交点決定部16は、調整した複数の境界線を交差させ、画像前調整部8によって行われたダウンサンプリングの逆の動作を行うことにより、境界線上にあるページの各隅部を計算してもよい。左上隅の座標、右上隅の座標、左下隅の座標、および右下隅の座標は、それぞれ、TL、TR、BLおよびBRで表され、各座標は、M、CおよびPが次の各式で表されるような線形系MC=Pによって決定される。
Figure 0004955096
境界の各隅部17は、これらの座標TL、TR、BLおよびBRを入力画像5の座標系にスケーリングすることにより得られる、スケーリング後の座標TL、TR、BLおよびBRから決定してもよい。スケーリングの動作は、画像前調整部8により行われるダウンサンプリングの逆の動作であってもよい。入力画像の座標系における境界の各隅部17は、原稿をトリミングする長方形を定めている。
図5から図10は、本発明の実施形態に係る典型的な結果を示している。図5および図6は、本発明の実施形態に係る典型的な画像前調整の結果を表す画像50、60を示している。図5には、画像作成装置によってスキャンされた原稿に関する青成分画像50が描かれている。青成分画像50は、原稿に対応する画像領域52とプラテンカバーに対応する画像領域54とから構成されている。図6には、青成分画像50をガンマ値2でガンマ伸張したガンマ伸張画像60が描かれている。ガンマ伸張画像60は、画像領域62とプラテンカバー領域64とから構成されている。図7には、図6に示す前調整された画像60に対して本発明の実施形態に係るブラケットフィルタリング処理を施すことにより得られる画像70が描かれている。図8には、ブラケットフィルタリング処理により得られた画像70に関するフィルタ済み局所濃度画像80が描かれている。図9には、図8に示す局所濃度画像80に対応する投影ヒストグラム90および92が描かれている。図9の投影ヒストグラム90および92に本発明の実施形態に係る閾値処理を施すことにより得られる投影ヒストグラム100および102が描かれている。図11は、図8に示す画像上にオーバーレイされた複数の有向線分112、114、116および118を含む画像110を示している。図12には、図11に示す複数の有向線分が交差する隅部122、124、126および128を示す画像120が描かれている。
図1に関連した本発明の別のいくつかの実施形態では、エッジ検出部10は、有向エッジ検出部を備えていてもよい。図13には、典型的な有向エッジ検出部が示されている。いくつかの実施形態では、エッジ検出部10は、原稿の傾きに対応する回転ベクトルの角度と、上記回転ベクトルに垂直な角度と、に調整可能な有向局所微分フィルタを備えていても良い。いくつかの実施形態では、有向局所微分フィルタは、実行時に作成されてもよい。別の実施形態では、有向局所微分フィルタは、予め計算されているフィルタ群から選択可能になっていてもよい。いくつかの有向局所微分フィルタの実施形態では、エッジ検出部10が傾き情報7を利用可能になっていてもよく、フィルタ生成部130は、傾き情報を用いてフィルタパラメータ131を生成してもよい。また、フィルタパラメータ131は、拡張された画像コンテンツのエッジの最大応答を対応する角度において生成する複数のフィルタカーネルと関連付けられてもよい。正規化画像9にフィルタ処理を施す1以上の有向フィルタ132は、フィルタパラメータ131を用いて、方向微分成分を生成することができるようになっていてもよい。いくつかの実施形態では、フィルタは、原稿の傾きを表す回転ベクトルの角度で作成した一次微分ガウシアンフィルタと、原稿の傾きを表す回転ベクトルに対して垂直な角度で作成した一次微分ガウシアンフィルタと、で構成されていてもよい。これらの実施形態のいくつかでは、値1と値4.5とは、それぞれ、クロスエッジフィルタおよびalong edge フィルタのシグマ値として使用してもよい。また、カーネルのサイズは、39×39であってもよい。閾値計算部134は、方向微分成分133を用いて、方向微分成分133に閾値処理を施すために使用される閾値を計算してもよい。いくつかの実施形態では、方向微分成分133は、振幅に対して閾値処理が施されてもよい。これらの実施形態のいくつかでは、エッジ振幅がほぼ指数関数分布になると仮定すると、各成分の閾値は以下の式により決定することができる。
Figure 0004955096
Figure 0004955096
ここで、Dxは回転ベクトルに関するフィルタによって生成される方向微分成分であり、Dyは、回転ベクトルに垂直なベクトルに関するフィルタによって生成される方向微分成分である。μ(|・|)は成分の絶対値の平均を示しており、pは弱いエッジを取りのぞくためのエッジ強度の閾値に関する調整可能なパラメータである。本発明のいくつかの実施形態では、pの値をp=0.95に設定してもよい。閾値135と方向微分成分133とは閾値処理部136に利用可能になっていてもよく、方向微分成分の振幅には、次の式のような閾値処理が施されてもよい。
Figure 0004955096
Figure 0004955096
これにより得られる有向エッジ点137は、成分の計算結果137をエッジ点139に統合する統合部138に利用可能になっていてもよい。いくつかの実施形態では、成分の計算結果137は、論理演算(例えば、OR操作)を用いて統合することができる。別の実施形態では、各成分のエッジ点は、対応するベクトルを用いて生成されればよい。例えば、回転ベクトルに関するカーネルを用いて生成される成分のエッジ点は回転ベクトルを用いて生成されればよく、回転ベクトルに垂直な垂直ベクトルに関するカーネルを用いて生成される成分のエッジ点は垂直ベクトルを用いて生成されればよい。
図14(a)および図14(b)には、図5に対応する入力画像に関する典型的な有向フィルタ140、142が描かれている。図15(a)には、図14(a)に示す有向カーネル140を用いたエッジの結果150が描かれている。また、図15(b)には、図14(b)に示す有向カーネル142を用いたエッジの結果152が描かれている。図16は、図15(a)のエッジの結果と図15(b)のエッジの結果とを結合したエッジを含む画像180であって複数の境界線162、164、166および168がオーバーレイされた画像180が描かれている。図17は、図16に示す複数の境界線162、164、166および168の交差する隅部172、174、176および178を示す画像170である。
本発明の別の実施形態では、少なくとも1台の計算機を含む計算システムにおいて実行される方法が含まれている。図18と関連して説明されるこれらの実施形態のいくつかでは、計算システムにおいて入力画像と傾き情報とを受信する工程180と、入力画像を正規化フォーマットに前調整する工程182と、正規化画像(すなわち、前調整された画像)内のエッジの位置を決定する工程184と、エッジと傾き情報とに基づいて投影ヒストグラムを作成する工程186と、投影ヒストグラムおよびエッジ点を用いて有向境界を推定する工程188と、有向境界を用いて境界線と境界の隅部とを決定する工程190とを含んでいる。
図18および図19に関連して説明される本発明のいくつかの実施形態では、入力画像を前調整する工程182には、ダウンサンプリングを行う工程192と、単一成分画像を形成する工程194と、ガンマ伸張処理を行う工程196と、が含まれていてもよい。これらの実施形態のいくつかでは、ダウンサンプルの工程192の期間、入力画像が、例えば、300DPIの解像度から75DPIの解像度にダウンサンプリングされてもよい。工程194において、単一成分、例えば、青成分または輝度成分が抽出され、さらなる処理のために用いられる単一成分画像が作成されてもよい。工程196では、入力画像においてコンテンツの部分として区分される範囲を広げるために、単一成分画像は、例えば、ガンマ値2でガンマ伸張され、正規化画像が作成されてもよい。図19の図は、特定の実行順序を示しているが、実行順序が図示されている順序とは異なっていてもよいことは、明らかである。例えば、ブロック(工程)の実行順序は、図示されている順序とは異なっていてもよい。また、その他の例を挙げると、図中に連続的に示されている2以上のブロック(工程)は、並列的に実行されてもよいし、一部分が並列的に実行されてもよい。ここに記載されている様々な論理的な機能を実現するようなハードウェア、ソフトウェア、および/または、ファームウェアを当業者が作成可能であることは、当業者にとって当然のことである。
図18および図20を参照すれば、本発明のいくつかの実施形態では、正規化画像におけるエッジを決定する工程184には、入力画像に前調整を施す工程にて形成された正規化画像中の各画素について局所ダイナミックレンジを計算することにより、無向エッジを決定する工程が含まれていてもよい。正規化画像中の各画素の位置における、該位置(i,j)に関する局所近傍のダイナミッレンジは、以下の式により決定されてもよい。
Figure 0004955096
ここで、Nは局所近傍を示しており、例えば、ダイナミックレンジを決定すべき画素の位置を中心とする縦5ドット横5ドットで構成される近傍である。また、pは画素の画素値を示している。工程202において、正規化画像中の各画素について決定した局所ダイナミックレンジを含むレンジ応答には、ブラケットフィルタリング処理が施されてもよい。工程202のブラケットフィルタリング処理は、レンジ応答中の有効な範囲値のみを保持することにより、工程204において局所濃度値を計算可能なフィルタ済みレンジ応答を生成するようにしてもよい。小さいほうの閾値以下の範囲値は、準一様な領域を示しているので、エッジでないものと見なすようにしてもよい。大きいほうの閾値以上の範囲値は、スキャン画像の場合、原稿画像中のコンテンツまたはバックプラテン上の模様に対する計算結果であるものと想定され、原稿の境界遷移域において予想される範囲よりも大きいものとしてもよい。縦5ドット×横5ドットの近傍に対してダイナミックレンジを計算する、本発明のいくつかの実施形態では、工程202のブラケットフィルタリング処理は、以下の式に従って、実現されてもよい。
Figure 0004955096
rng’(i,j)は、画素の位置(i,j)におけるフィルタ済のレンジ応答を示している。一般的には、工程202のブラケットフィルタリング処理は、以下の式に従って実現される。
Figure 0004955096
THlowerおよびTHupperは、それぞれ、小さいほうの閾値および大きいほうの閾値を示している。各閾値は、工程200において局所ダイナミックレンジを計算するために使用される近傍の設定に応じた値としてもよい。工程204において有効な範囲値の局所濃度を計算するために、フィルタリング済のレンジ応答を使用してもよい。また、工程204において局所濃度を計算するために、画素の位置(i,j)の最近傍を使用してもよい。いくつかの実施形態では、上記近傍は、工程200において局所ダイナミックレンジを計算するために用いられる近傍と同じであってもよい。別の実施形態では、上記近傍は、工程200において局所ダイナミックレンジを計算するために用いられる近傍と異なっていてもよい。所定の近傍をNLDで表すものとすると、画素の位置(i,j)における局所濃度は、以下の式に従って決定されてもよい。
Figure 0004955096
いくつかの実施形態では、局所濃度近傍NLDは、局所濃度を計算すべき画素(i,j)を中心とする縦5ドット×横5ドットの窓領域であってもよい。工程206において、局所濃度値には、十分な濃度を持つ点のみを保持するような閾値が設定されてもよい。十分な濃度を持つ点は、原稿の境界遷移域と推定される十分なローカルサポートを持つ点で構成されてもよい。閾値が設定された応答(すなわち、画素の位置(i,j)における推定エッジ点)は、以下の式に従って決定される。
Figure 0004955096
ここで、μは、濃度の閾値を示している。本発明のいくつかの実施形態では、濃度の閾値は、全体濃度の平均であってもよく、全体濃度の他の関数値であってもよい。別の実施形態では、画素の位置(i,j)における局所濃度は、rng’(i,j)=1を満たすような画素の位置(i,j)のみについて決定されてもよい。これらの実施形態では、精度を犠牲にする代わりに、計算コストを削減することができる。図示しないさらに別の実施形態では、フィルタ済のレンジ応答がエッジ点として直接使用されてもよい。したがって、これらの別の実施形態では、エッジ検出の工程には、工程204の局所濃度を計算する工程および工程206の局所濃度に閾値を設定する工程が含まれない。
図18と関連して説明する本発明の別のいくつかの実施形態では、エッジの位置を決定する工程には、有向エッジを検出する工程が含まれていてもよい。これらの実施形態では、エッジを検出する工程184に、有向局所微分フィルタリングを行う工程が含まれていてもよい。有向局所微分フィルタリングを行う工程では、有向局所微分フィルタが、原稿の傾きに応じた回転ベクトルの角度、および、回転ベクトルに垂直な角度に調整されていてもよい。いくつかの実施形態では、有向局所微分フィルタは、実行時に構築されてもよい。別のいくつかの実施形態では、有向局所微分フィルタは、予め計算済のフィルタ群の中から選択されたものであってもよい。フィルタパラメータは、対応する角度において拡張された画像コンテンツのエッジの最大応答を生成するフィルタカーネルと関連付けられてもよい。図21に関連して示す本発明のいくつかの実施形態では、フィルタパラメータを生成し(工程210)、工程210において生成されたフィルタパラメータを含むフィルタにしたがって正規化画像をフィルタリングすることにより(工程212)、
方向微分成分を生成してもよい。いくつかの実施形態では、フィルタは、原稿の傾きを表す回転ベクトルの角度で作成した一次微分ガウシアンフィルタと、原稿の傾きを表す回転ベクトルに対して垂直な角度で作成した一次微分ガウシアンフィルタと、で構成されていてもよい。これらの実施形態のいくつかでは、値1と値45とは、それぞれ、クロスエッジフィルタおよびalong edge フィルタのシグマ値として使用してもよい。また、カーネルのサイズは、39×39であってもよい。工程214において、方向微分成成分から工程216にて方向微分成分に設定する閾値を計算してもよい。いくつかの実施形態では、方向微分成分は、振幅によって閾値が設定されてもよい。これらの実施形態のいくつかでは、エッジ振幅がほぼ指数関数分布となると仮定すると、各成分の閾値は以下の式により決定することができる。
Figure 0004955096
Figure 0004955096
xおよびDyは、それぞれ、回転ベクトルと回転ベクトルに垂直な垂直ベクトルとに応じて定まるフィルタによって生成される方向微分成分を示している。μ(|・|)は、成分の絶対値の平均を示しており、pは弱いエッジを排除するための閾値の強さに応じた調整可能なパラメータである。本発明のいくつかの実施形態では、pの値はp=0.95に設定されてもよい。工程216において成分の振幅には以下の式に従って閾値が設定されてもよい。
Figure 0004955096
Figure 0004955096
工程218において、得られた方向エッジ点を結合してエッジ点としてもよい。いくつかの実施形態では、工程218において、論理演算、例えば、OR演算を用いて、得られた成分を結合してもよい。別の実施形態では、エッジ点の各成分は、対応するベクトルを用いて投影されてもよい。例えば、回転ベクトルに関するカーネルを用いて生成されるエッジ点の成分は、該回転ベクトルを用いて投影されてもよい。また、回転ベクトルに垂直な垂直ベクトルに関するカーネルを用いて生成されるエッジ点の成分は、該垂直ベクトルを用いて投影されてもよい。
図18を参照すれば、投影ヒストグラムは、エッジ点と工程180にて受信した傾き情報とを用いて生成されてもよい(工程186)。投影ヒストグラムは、傾き情報によって示される複数の方向の各々について生成される。入力された回転ベクトルrvec=[rx,ry]および該回転ベクトルに垂直な垂直ベクトルvvec=rvec=[-ry,x]として傾き情報を表すと、すべての境界位置候補となり得る点ベクトルは、以下の式により与えられる。
Figure 0004955096
点に対する上下方向の投影と左右方向の投影とは、それぞれ、以下のように計算してもよい。
Figure 0004955096
Figure 0004955096
ここで、各式は、行列の乗算を示している。工程186において、上下方向境界ヒストグラムと左右方向境界ヒストグラムとは、投影値を累積することにより計算してもよい。各境界ヒストグラムは、工程188において有向境界を推定するために使用してもよい。
図18および図22を参照すれば、境界を推定する工程188には、各投影ヒストグラムに関する動的閾値を計算することにより、投影ヒストグラムにおける原稿でない部分のピークを抑制する工程220が含まれていてもよい。本発明のいくつかの実施形態では、投影ヒストグラムに関する上記閾値は、投影ヒストグラムの度数の平均値と濃度の全体比との関数値であってもよい。これらの実施形態のいくつかでは、上下方向境界投影ヒストグラムに関する閾値は、以下の式に従って決定されてもよい。
Figure 0004955096
同様に、左右方向境界投影ヒストグラムに関する閾値は、以下の式に従って決定されてもよい。
Figure 0004955096
ここで、μTBおよびμLRは、それぞれ、ヒストグラムの度数の平均値を示しており、典型的な実施形態ではγ=0.8である。そして、
Figure 0004955096
となる。計算される動的閾値は、閾値以下の度数を持つ任意のヒストグラムビンについて、その度数を0に設定することにより、投影ヒストグラムに閾値を設定する工程222のために使用される。工程224において、閾値が設定された投影ヒストグラムの各々について、有効な境界ピークを特定してもよい。上方向のピークは、閾値が設定された上下方向境界投影ヒストグラムにおいて極大値をとる最初の(すなわち、先頭の)ビンを検索することにより特定される。左方向のピークは、閾値が設定された左右方向境界投影ヒストグラムにおいて極大値をとる最初の(すなわち、先頭の)ビンを検索することにより特定される。下方向のピークは、閾値が設定された上下方向境界投影ヒストグラムにおいて極大値をとる最後の(すなわち、末尾の)ビンを検索することにより特定される。右方向のピークは、閾値が設定された左右方向境界投影ヒストグラムにおいて極大値をとる最後の(すなわち、末尾の)ビンを検索することにより特定される。極大値をとる先頭のビンは、ビンカウントが当該ビンに先行するいずれのビンのビンカウントよりも大きく、且つ、当該ビンに後続する少なくとも1以上のビンのビンカウントよりも大きいビンであるものとしてもよい。また、極大値をとる末尾のビンは、同様のプロセスを用いて逆順でヒストグラム信号を処理することにより特定してもよい。いくつかの実施形態では、ヒストグラムから一次微分係数を計算してもよく、一次微分係数が負になるような最初のビンを先頭のピークとしてもよいし、一次微分係数が正から負に変わるような最後のビンを末尾のビンとしてもよい。上方向、下方向、左方向および右方向のピークの位置は、それぞれ、CT、CB、CLおよびCRにより表される。工程226にて、境界線は、受信した傾き情報を用いて特定されたピークの位置に調整されてもよい。いくつかの実施形態においては、境界線は、以下の式に従って決定される。
Figure 0004955096
図18を参照すれば、境界線上のページの隅部は、調整された複数の境界線を交差させ、且つ、画像の前調整の工程182の期間に実行されたダウンサンプリングの演算と逆の演算を行うことにより、決定される(工程190)。左上隅の座標、右上隅の座標、左下隅の座標、および右下隅の座標は、それぞれ、TL、TR、BLおよびBRと表され、線形系MC=Pによって決定されてもよい。ここで、
Figure 0004955096
である。境界の隅部は、TL、TR、BLおよびBRから、これらの座標を入力画像の座標系にスケーリングすることにより決定することができる。スケーリングの工程には、入力画像を前調整する工程182の期間に行われたダウンサンプリングの演算と逆の演算を行う工程が含まれていてもよい。入力画像の座標系における境界の隅部は、原稿のトリミングすべき長方形を定めることになる。
複数枚の原稿が自動原稿送り装置によってスキャンされ、または、コピーされるときに、スキャンバーはロックされてもよく、複数枚の原稿は、送り機構(例えば、ベルトや他の機構等)によって1ページずつセンサを通過するように動かされてもよい。送り機構のすべり、摩擦、および/または、他の動作によって、時間とともに、送り機構上において送り方向に残存縞が増えていくことになる。本発明のいくつかの実施形態は、この残存縞に対応することができる。
これらの実施形態では、図4に示す動的閾値計算部40は、回転角に応じた閾値を与えることができる。特に、閾値は、回転角が増えるほど減ることになる。したがって、動的閾値計算部40は、原稿が送り方向に整列されていることを傾き情報が示すときにはより大きな閾値を与える。これにより、残像縞を排除することができる。角度が大きくなるほど、動的閾値計算部40は、上述した実施形態における値により近い値を供給する。いくつかの実施形態では、サンプルされた対数曲線に基づいて閾値を計算してもよい。図23には、典型的なサンプル曲線23が描かれている。この典型的なサンプル曲線23は、次の閉区間における20個の小さな数234の数列の負の対数である。
Figure 0004955096
回転ベクトルのy成分の絶対値を用いて、サンプル曲線を直接指数化するようにしてもよく、閾値は次の式に従って計算してもよい。
Figure 0004955096
ここで、crv(|ry|)は、回転成分ryによって指数化されたサンプル曲線の値である。μ(・)は、投影ヒストグラムの平均値であり、θ(・)は、対応する閾値である。
(プログラム等)
最後に、コンテンツ境界検出システム2に含まれている各ブロックは、ハードウェアロジックによって構成すればよい。また、コンテンツ境界検出システム2の各制御は、次のように、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
すなわち、コンテンツ境界検出システム2の各制御を実現する制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録していればよい。コンテンツ境界検出システム2(またはCPUやMPU)が、供給された記録媒体に記録されているプログラムコードを読み出し、実行すればよい。
コンテンツ境界検出システム2に供給する記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などとすることができる。
また、コンテンツ境界検出システム2は、通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介してコンテンツ境界検出システム2に供給する。この通信ネットワークは、コンテンツ境界検出システム2にプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、移動体通信網、衛星通信網等であればよい。
この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、IEEE1394、USB(Universal Serial Bus)、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線などの有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
(その他の構成)
なお、本発明を、以下の構成としても実現できる。
(第1構成)
画像中のコンテンツ境界を決定するシステムであって、a)画像を受信する画像受信部と、b)上記画像に関する傾き情報を受信する傾き情報受信部と、c)上記画像を正規化することにより正規化画像を生成する画像前調整部と、d)上記正規化画像中の画像コンテンツのエッジを検出するエッジ検出部と、e)上記傾き角度の方向の第1の投影ヒストグラムであって、上記検出された画像コンテンツのエッジの第1の投影ヒストグラムを作成する投影ヒストグラム作成部と、f)上記第1の投影ヒストグラムおよび上記傾き角度から、第1のコンテンツ境界を決定する境界推定部と、を備えていることを特徴とするシステム。
(第2構成)
第1構成に係るシステムであって、上記第1のコンテンツ境界と第2のコンテンツ境界とが交差する第1の交点を決定する境界線交点決定部をさらに備えていることを特徴とするシステム。
(第3構成)
第1構成に係るシステムであって、上記エッジ検出部が無向エッジを検出する無向エッジ検出部であることを特徴とするシステム。
(第4構成)
第3構成に係るシステムであって、上記無向エッジ検出部は、a)上記正規化画像に関する局所レンジ応答を計算するダイナミックレンジ計算部と、b)上記局所レンジ応答をフィルタリングするフィルタと、c)上記局所レンジ応答に関する局所濃度を計算する局所濃度計算部と、d)上記局所濃度からエッジ点を決定する閾値処理部と、を備えていることを特徴とするシステム
(第5構成)
第1構成に係るシステムであって、上記境界推定部が、上記第1の投影ヒストグラムと上記傾き角度とから、第2のコンテンツ境界を決定することを特徴とするシステム。
(第6構成)
第1構成に係るシステムであって、a)上記傾き角度に垂直な垂直角度を決定する垂直角度決定部を備え、b)i)上記投影ヒストグラム作成部は、上記垂直角度の方向の第2の投影ヒストグラムであって、上記検出された画像コンテンツのエッジの第2の投影ヒストグラムを作成するように構成されており、ii)上記境界推定部は、上記第2の投影ヒストグラムと上記垂直角度とから、第3のコンテンツ境界を決定するように構成されていることを特徴とするシステム。
(第7構成)
第6構成に係るシステムであって、上記境界推定部は、上記第2の投影ヒストグラムと上記垂直角度とから、第4のコンテンツ境界を決定するように構成されていることを特徴とするシステム。
(第8構成)
第7構成に係るシステムであって、境界線交点決定部をさらに備えており、上記境界線交点決定部は、a)第1のコンテンツ境界と第3のコンテンツ境界とが交差する第1の交点を決定し、b)第1のコンテンツ境界と第4のコンテンツ境界とが交差する第2の交点を決定し、c)第2のコンテンツ境界と第3のコンテンツ境界とが交差する第3の交点を決定し、d)第2のコンテンツ境界と第4のコンテンツ境界とが交差する第4の交点を決定する、ことを特徴とするシステム。
(第9構成)
第1構成に係るシステムであって、上記画像前調整部が、a)ダウンサンプラと、b)成分抽出部と、c)ガンマ伸張部と、を備えていることを特徴とするシステム。
(第10構成)
第1構成に係るシステムであって、上記境界線推定部が、a)上記第1の投影ヒストグラムと上記傾き角度とに基づいて、第1の動的閾値を計算する動的閾値計算部と、b)上記第1の動的閾値によって上記第1の投影ヒストグラムに閾値処理を施す閾値処理部と、c)閾値が設定された上記第1の投影ヒストグラムにおける第1のピークを検出する境界ピーク検出部と、d)上記第1のピークと上記傾き角度とに基づいて、上記第1のコンテンツ境界を決定するライン調整部と、を備えていることを特徴とするシステム。
(第11構成)
第1構成に係るシステムであって、a)上記エッジ検出部が、上記正規化画像をフィルタリングするフィルタを備えており、b)上記フィルタは、上記傾き角度に調整された局所微分フィルタであることを特徴とするシステム。
(第12構成)
画像中のコンテンツの境界を決定する方法であって、上記方法は、a)1以上の計算装置を含む計算システムにおいて画像を受信する第1の受信工程と、b)上記計算システムにおいて、上記画像に関する傾き角度を受信する第2の受信工程と、c)上記画像を正規化することにより正規化画像を生成する正規化工程と、d)上記正規化画像における画像コンテンツのエッジを検出する検出工程と、e)上記検出された画像コンテンツのエッジの第1の投影ヒストグラムであって、上記傾き角度の方向の第1の投影ヒストグラムを作成する作成工程と、f)上記第1の投影ヒストグラムと上記傾き角度とから第1のコンテンツ境界を決定する境界決定工程と、を含んでいることを特徴とする方法。
(第13構成)
第12構成に係る方法であって、上記第1のコンテンツ境界と第2のコンテンツ境界とが交差する第1の交点を決定する交点決定工程をさらに含んでいることを特徴とする方法。
(第14構成)
第12構成に係る方法であって、上記検出工程にて、無向エッジを検出する無効エッジ検出部を用いて、画像コンテンツのエッジを検出することを特徴とする方法。
(第15構成)
第14構成に係る方法であって、上記無効エッジ検出部が、a)上記正規化画像に関する局所レンジ応答を計算するダイナミックレンジ計算部と、b)上記局所レンジ応答をフィルタリングするフィルタと、c)上記局所レンジ応答に関する局所濃度を計算する局所濃度計算部と、d)上記局所濃度からエッジ点を決定する閾値処理部と、を備えていることを特徴とする方法。
(第16構成)
第12構成に係る方法であって、上記第1の投影ヒストグラムと上記傾き角度とから、第2のコンテンツ境界を決定する第2境界決定工程をさらに含んでいることを特徴とする方法。
(第17構成)
第12構成に係る方法であって、a)上記傾き角度に垂直な垂直角度を決定する第3決定工程と、b)上記投影ヒストグラム作成部は、上記垂直角度の方向の第2の投影ヒストグラムであって、上記検出された画像コンテンツのエッジの第2の投影ヒストグラムを作成する第2作成工程と、c)上記第2の投影ヒストグラムと上記垂直角度とから、第3のコンテンツ境界を決定する第3境界決定工程と、をさらに含んでいることを特徴とする方法。
(第18構成)
第17構成に係る方法であって、上記第2の投影ヒストグラムと上記垂直角度とから、第4のコンテンツ境界を決定する第4境界決定工程と、をさらに含んでいることを特徴とする方法。
(第19構成)
第18構成に係る方法であって、a)第1のコンテンツ境界と第3のコンテンツ境界とが交差する第1の交点を決定する第1交点決定工程と、b)第1のコンテンツ境界と第4のコンテンツ境界とが交差する第2の交点を決定する第2交点決定工程と、c)第2のコンテンツ境界と第3のコンテンツ境界とが交差する第3の交点を決定する第3交点決定工程と、d)第2のコンテンツ境界と第4のコンテンツ境界とが交差する第4の交点を決定する第4交点決定工程と、を含んでいることを特徴とする方法。
(第20構成)
第12構成に係る方法であって、上記正規化工程には、a)ダウンサンプリングを行う工程と、b)成分を抽出する工程と、c)ガンマ伸張を行う工程と、が含まれていることを特徴とする方法。
(第21構成)
第12構成に係る方法であって、a)上記第1の投影ヒストグラムと上記傾き角度とに基づいて、第1の動的閾値を計算する工程と、b)上記第1の動的閾値を上記第1の投影ヒストグラムに設定する工程と、c)閾値が設定された上記第1の投影ヒストグラムにおける第1のピークを検出する工程と、d)上記第1のピークと上記傾き角度とに基づいて、上記第1のコンテンツ境界を決定する工程と、をさらに含んでいることを特徴とする方法。
(第22構成)
第12構成に係る方法であって、画像コンテンツのエッジを検出する上記検出工程には、上記傾き角度に調整された局所微分フィルタを用いて上記正規化画像にフィルタリングを行う工程が含まれていることを特徴とする方法。
前述した明細書において使用した用語および表現は、説明のための用語として使用されているものであって発明の範囲を限定するものではない。そのような用語および表現の使用は、図示および記載した特徴との均等物またはその一部を排除することを意図したものではない。したがって、本発明の範囲は、次の特許請求の範囲によってのみ定められ、限定されることを認識すべきである。
2 コンテンツ境界検出システム(検出装置)
4 画像受信部
6 傾き情報受信部
8 画像前調整部(正規化手段)
10 エッジ検出部(エッジ検出手段)
12 投影ヒストグラム作成部(投影ヒストグラム作成手段)
14 境界推定部(境界検出手段)
16 境界線交点決定部(交点検出手段)
20 ダウンサンプラ(ダウンサンプリング手段)
22 成分抽出部(成分抽出手段)
24 ガンマ伸張部(ガンマ伸張手段)
30 ダイナミックレンジ計算部(ダイナミックレンジ計算手段)
32 ブラケットフィルタ(フィルタ手段)
34 局所濃度計算部(局所濃度計算手段)
36 閾値処理部(エッジ点決定手段)
40 動的閾値計算部(動的閾値計算手段)
42 閾値処理部(閾値処理手段)
44 境界ピーク検出部(境界ピーク検出手段)
46 ライン調整部
130 フィルタ生成部
132 有向フィルタ
134 閾値計算部
136 閾値処理部
138 統合部

Claims (14)

  1. 画像中の領域であって原稿が描画される領域である原稿領域の境界を検出する検出装置において、
    上記画像を正規化することにより正規化画像を生成する正規化手段と、
    上記正規化画像中の上記原稿について複数のエッジ点を検出するエッジ検出手段と、
    上記正規化画像における上記原稿の傾き角度の方向の第1の投影ヒストグラムであって、上記検出手段により検出された複数のエッジ点についての第1の投影ヒストグラムを作成する投影ヒストグラム作成手段と、
    上記第1の投影ヒストグラムおよび上記傾き角度から、上記境界の一部を検出する境界検出手段と、を備え、
    上記エッジ検出手段は、上記正規化画像中の各画素について、該画素から規定の範囲内に位置する画素群の最大濃度値と最小濃度値との濃度差が第1の閾値以上であって第2の閾値以下である場合に該画素を上記エッジ点として検出することを特徴とする検出装置。
  2. 上記エッジ検出手段は、上記エッジ点として無向エッジを検出することを特徴とする請求項1に記載の検出装置。
  3. 上記エッジ検出手段は、上記濃度差が第1の閾値以上であって第2の閾値以下であるような画素のうち、所定の条件を満たす画素のみをエッジ点として検出するように構成されており、
    上記エッジ検出手段は、ダイナミックレンジ計算手段と、フィルタ手段と、局所濃度計算手段と、エッジ点決定手段と、を備え、
    上記正規化画像中の各画素について、上記エッジ検出手段が備える各手段は、上記ダイナミックレンジ計算手段が、該画素から規定の範囲内における局所ダイナミックレンジの応答を計算し、上記フィルタ手段が、該局所ダイナミックレンジの応答をフィルタリングし、上記局所濃度計算手段が、上記フィルタ手段によるフィルタリング後の該局所ダイナミックレンジの応答に応じた、該規定の範囲内における局所濃度を計算し、上記エッジ点決定手段が、該局所濃度が所定の閾値より大きいという上記所定の条件を満たす場合に限り該画素をエッジ点として決定する、ように構成されている、ことを特徴とする請求項1に記載の検出装置。
  4. 上記境界検出手段が検出する上記境界の上記一部は、上記原稿領域の上記境界の一辺であり、
    上記境界検出手段は、上記第1の投影ヒストグラムと上記傾き角度とから、上記一辺とともに、上記一辺の対辺を検出するように構成されていることを特徴とする請求項1に記載の検出装置。
  5. 上記投影ヒストグラム作成手段は、上記傾き角度に垂直な垂直角度の方向の第2の投影ヒストグラムであって、上記エッジ検出手段により検出された複数のエッジ点について第2の投影ヒストグラムを作成するように構成されており、
    上記境界検出手段は、上記第2の投影ヒストグラムと上記垂直角度とから、上記境界の一部を検出するように構成されていることを特徴とする請求項1に記載の検出装置。
  6. 上記境界検出手段が検出する上記境界の上記一部は、上記原稿領域の上記境界の一辺であり、
    上記境界検出手段により上記第2の投影ヒストグラムと上記垂直角度とから検出される上記境界の一辺と、上記境界検出手段により上記第1の投影ヒストグラムと上記傾き角度とから検出される上記境界の一辺と、が交差する交点を検出する交点検出手段をさらに備えていることを特徴とする請求項5に記載の検出装置。
  7. 上記境界検出手段が上記第2の投影ヒストグラムと上記垂直角度とから検出する上記境界の上記一部は、上記原稿領域の境界の一辺であり、
    上記境界検出手段は、上記第2の投影ヒストグラムと上記垂直角度とから、上記一辺とともに、上記一辺の対辺を検出するように構成されていることを特徴とする請求項5に記載の検出装置。
  8. 上記境界検出手段により上記第2の投影ヒストグラムと上記垂直角度とから検出される1対の対辺が、上記境界検出手段により上記第1の投影ヒストグラムと上記傾き角度とから検出される1対の対辺に交差する4つの交点を検出する交点検出手段をさらに備えていることを特徴とする請求項7に記載の検出装置。
  9. 上記画像は、複数の成分から構成されており、
    上記正規化手段は、上記画像をダウンサンプリングすることによりダウンサンプリング画像を生成するダウンサンプリング手段と、上記ダウンサンプリング画像から上記複数の成分のうち特定の成分を抽出することにより得られる特定成分画像を生成する成分抽出手段と、上記特定成分画像にガンマ伸張処理を施すガンマ伸張手段と、を備えていることを特徴とする請求項1に記載の検出装置。
  10. 上記境界検出手段は、上記第1の投影ヒストグラムと上記傾き角度とに基づいて、第1の動的閾値を計算する動的閾値計算手段と、上記第1の動的閾値により上記第1の投影ヒストグラムを閾値処理する閾値処理手段と、上記第1の動的閾値により閾値処理が施された上記第1の投影ヒストグラムにおける先頭のピークを検出する境界ピーク検出手段と、上記先頭のピークと上記傾き角度とに基づいて、上記境界の上記一部を決定する決定手段と、を備えていることを特徴とする請求項1に記載の検出装置。
  11. 上記エッジ検出手段は、上記正規化画像をフィルタリングするフィルタ手段を備えており、上記フィルタ手段は、上記傾き角度の方向の局所微分フィルタであることを特徴とする請求項1に記載の検出装置。
  12. 画像中の領域であって原稿が描画される領域である原稿領域の境界を検出装置が検出する検出方法において、
    上記画像を正規化することにより正規化画像を生成する正規化工程と、
    上記正規化画像中の上記原稿について複数のエッジ点を検出するエッジ検出工程と、
    上記正規化画像における上記原稿の傾き角度の方向の第1の投影ヒストグラムであって、上記エッジ検出工程にて検出された複数のエッジ点についての第1の投影ヒストグラムを作成する投影ヒストグラム作成工程と、
    上記第1の投影ヒストグラムおよび上記傾き角度から、上記境界の一部を検出する境界検出工程と、を含み、
    上記エッジ検出工程にて、上記正規化画像中の各画素について、該画素から規定の範囲内に位置する画素群の最大濃度値と最小濃度値との濃度差が第1の閾値以上であって第2の閾値以下である場合に該画素を上記エッジ点として検出することを特徴とする検出方法。
  13. 請求項1から11のいずれか1項に記載の検出装置の各手段としてコンピュータを機能させることを特徴とする検出プログラム。
  14. 請求項13に記載の検出プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2010263891A 2009-12-16 2010-11-26 検出装置、検出方法、検出プログラム、および記録媒体 Expired - Fee Related JP4955096B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/639,895 US8873864B2 (en) 2009-12-16 2009-12-16 Methods and systems for automatic content-boundary detection
US12/639,895 2009-12-16

Publications (2)

Publication Number Publication Date
JP2011129114A JP2011129114A (ja) 2011-06-30
JP4955096B2 true JP4955096B2 (ja) 2012-06-20

Family

ID=44142980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010263891A Expired - Fee Related JP4955096B2 (ja) 2009-12-16 2010-11-26 検出装置、検出方法、検出プログラム、および記録媒体

Country Status (2)

Country Link
US (1) US8873864B2 (ja)
JP (1) JP4955096B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9547799B2 (en) * 2008-07-17 2017-01-17 Sharp Laboratories Of America, Inc. Methods and systems for content-boundary detection
US8873864B2 (en) 2009-12-16 2014-10-28 Sharp Laboratories Of America, Inc. Methods and systems for automatic content-boundary detection
US8571313B2 (en) * 2010-03-22 2013-10-29 Sharp Laboratories Of America, Inc. Methods and systems for estimation of document skew in an image
JP5784467B2 (ja) * 2011-11-18 2015-09-24 京セラドキュメントソリューションズ株式会社 画像形成装置
US9436981B2 (en) 2011-12-12 2016-09-06 Nec Corporation Dictionary creation device, image processing device, image processing system, dictionary creation method, image processing method, and program
US20130177237A1 (en) * 2012-01-09 2013-07-11 Gregory Gerhard SCHAMP Stereo-vision object detection system and method
US8855375B2 (en) * 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
KR20140137738A (ko) * 2013-05-23 2014-12-03 삼성전자주식회사 이미지 디스플레이 방법, 이미지 디스플레이 장치 및 기록 매체
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10467465B2 (en) 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
US9824267B2 (en) * 2015-12-18 2017-11-21 Konica Minolta Laboratory U.S.A., Inc. Writing board detection and correction
JP2018055496A (ja) * 2016-09-29 2018-04-05 日本電産サンキョー株式会社 媒体認識装置および媒体認識方法
KR101903523B1 (ko) * 2017-01-02 2018-10-04 안양대학교 산학협력단 비디오 데이터에서 에지 프로젝션 기반의 모자이크 검출 방법
US10318794B2 (en) 2017-04-28 2019-06-11 Microsoft Technology Licensing, Llc Intelligent auto cropping of digital images
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN114627046B (zh) * 2021-12-30 2024-07-16 山东爱普电气设备有限公司 一种基于可见光多滤波维度的电力线检测方法及系统

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5452374A (en) * 1992-04-06 1995-09-19 Ricoh Corporation Skew detection and correction of a document image representation
AU3544995A (en) * 1994-09-20 1996-04-09 Neopath, Inc. Apparatus for identification and integration of multiple cell patterns
US5528387A (en) 1994-11-23 1996-06-18 Xerox Corporation Electronic image registration for a scanner
JP3504054B2 (ja) 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
US5781665A (en) 1995-08-28 1998-07-14 Pitney Bowes Inc. Apparatus and method for cropping an image
JP3436025B2 (ja) 1995-12-27 2003-08-11 ミノルタ株式会社 読取り画像の修正方法及び画像読取り装置
US5901253A (en) 1996-04-04 1999-05-04 Hewlett-Packard Company Image processing system with image cropping and skew correction
US5978519A (en) 1996-08-06 1999-11-02 Xerox Corporation Automatic image cropping
US5892854A (en) 1997-01-21 1999-04-06 Xerox Corporation Automatic image registration using binary moments
US5974199A (en) 1997-03-31 1999-10-26 Eastman Kodak Company Method for scanning and detecting multiple photographs and removing edge artifacts
US5880858A (en) 1997-12-31 1999-03-09 Mustek Systems Inc. Method of auto-cropping images for scanners
US6298157B1 (en) 1998-02-27 2001-10-02 Adobe Systems Incorporated Locating and aligning embedded images
US6360026B1 (en) 1998-03-10 2002-03-19 Canon Kabushiki Kaisha Method for determining a skew angle of a bitmap image and de-skewing and auto-cropping the bitmap image
US6310984B2 (en) * 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
FR2778476B1 (fr) 1998-05-07 2000-06-16 France Telecom Procede de segmentation et de reconnaissance d'un document, notamment d'un plan technique
US6201901B1 (en) 1998-06-01 2001-03-13 Matsushita Electronic Industrial Co., Ltd. Border-less clock free two-dimensional barcode and method for printing and reading the same
US6456732B1 (en) 1998-09-11 2002-09-24 Hewlett-Packard Company Automatic rotation, cropping and scaling of images for printing
US6282326B1 (en) * 1998-12-14 2001-08-28 Eastman Kodak Company Artifact removal technique for skew corrected images
US6373590B1 (en) * 1999-02-04 2002-04-16 Seiko Epson Corporation Method and apparatus for slant adjustment and photo layout
US6674919B1 (en) * 1999-09-21 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for determining the skew angle of a two-dimensional barcode
US6556721B1 (en) 2000-01-07 2003-04-29 Mustek Systems Inc. Method for image auto-cropping
US6587596B1 (en) 2000-04-28 2003-07-01 Shutterfly, Inc. System and method of cropping an image
JP2001346031A (ja) 2000-06-05 2001-12-14 Fuji Photo Film Co Ltd 画像合成方法及び装置
GB2370438A (en) * 2000-12-22 2002-06-26 Hewlett Packard Co Automated image cropping using selected compositional rules.
US7034848B2 (en) 2001-01-05 2006-04-25 Hewlett-Packard Development Company, L.P. System and method for automatically cropping graphical images
US6987880B2 (en) 2001-03-22 2006-01-17 Sharp Laboratories Of America, Inc. Efficient document boundary determination
GB0116113D0 (en) 2001-06-30 2001-08-22 Hewlett Packard Co Tilt correction of electronic images
US7068855B2 (en) 2002-07-16 2006-06-27 Hewlett-Packard Development Company, L.P. System and method for manipulating a skewed digital image
US7339598B2 (en) 2003-07-11 2008-03-04 Vistaprint Technologies Limited System and method for automated product design
WO2005015355A2 (en) 2003-08-07 2005-02-17 Matsushita Electric Industrial Co., Ltd. Automatic image cropping system and method for use with portable devices equipped with digital cameras
US6956587B1 (en) 2003-10-30 2005-10-18 Microsoft Corporation Method of automatically cropping and adjusting scanned images
US20050168775A1 (en) 2004-01-26 2005-08-04 Liu K. C. Method and computer program product for in-house digital photo/card processing and printing/cutting production
US7386190B2 (en) 2004-04-30 2008-06-10 Corel Tw Corp. Method for image cropping
US20060072847A1 (en) 2004-10-01 2006-04-06 Microsoft Corporation System for automatic image cropping based on image saliency
US20060098844A1 (en) 2004-11-05 2006-05-11 Huitao Luo Object detection utilizing a rotated version of an image
US7151547B2 (en) 2004-11-23 2006-12-19 Hewlett-Packard Development Company, L.P. Non-rectangular image cropping methods and systems
JP4600019B2 (ja) 2004-12-07 2010-12-15 カシオ計算機株式会社 撮影装置、画像処理方法及びプログラム
US7528846B2 (en) 2005-02-23 2009-05-05 Microsoft Corporation Systems and methods to adjust a source image aspect ratio to match a different target display aspect ratio
TWI309026B (en) 2005-04-12 2009-04-21 Newsoft Technology Corp Method for auto-cropping image objects and method for detecting image object contour
JP2007020122A (ja) 2005-07-11 2007-01-25 Canon Inc 画像処理装置、画像処理装置の制御方法およびプログラム
US7529390B2 (en) 2005-10-03 2009-05-05 Microsoft Corporation Automatically cropping an image
JP4884305B2 (ja) 2007-06-06 2012-02-29 シャープ株式会社 画像処理装置、画像形成装置、コンピュータプログラム、及び記録媒体
US8027539B2 (en) 2008-01-11 2011-09-27 Sharp Laboratories Of America, Inc. Method and apparatus for determining an orientation of a document including Korean characters
US9547799B2 (en) * 2008-07-17 2017-01-17 Sharp Laboratories Of America, Inc. Methods and systems for content-boundary detection
US8873864B2 (en) 2009-12-16 2014-10-28 Sharp Laboratories Of America, Inc. Methods and systems for automatic content-boundary detection

Also Published As

Publication number Publication date
US20110142341A1 (en) 2011-06-16
JP2011129114A (ja) 2011-06-30
US8873864B2 (en) 2014-10-28

Similar Documents

Publication Publication Date Title
JP4955096B2 (ja) 検出装置、検出方法、検出プログラム、および記録媒体
US8213687B2 (en) Image processing methods, image processing systems, and articles of manufacture
US8467606B2 (en) Method for segmenting a composite image
US9509884B2 (en) Skew detection
US20120294528A1 (en) Method of Detecting and Correcting Digital Images of Books in the Book Spine Area
US8811751B1 (en) Method and system for correcting projective distortions with elimination steps on multiple levels
US8897600B1 (en) Method and system for determining vanishing point candidates for projective correction
US10748023B2 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
US9667841B2 (en) Image processing apparatus and image processing method
US10810711B2 (en) Information processing apparatus, storage medium, and information processing method
JP2016516245A (ja) モバイル装置を用いた画像内のオブジェクトの分類
US10455163B2 (en) Image processing apparatus that generates a combined image, control method, and storage medium
CN103119609B (zh) 一种确定视频前景主体图像区域的方法和装置
US8913836B1 (en) Method and system for correcting projective distortions using eigenpoints
US8306335B2 (en) Method of analyzing digital document images
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
KR101011908B1 (ko) 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
US9094617B2 (en) Methods and systems for real-time image-capture feedback
JP2021039698A (ja) 画像処理装置、方法、および、コンピュータプログラム
WO2016151706A1 (ja) 画像処理装置、領域決定方法及びコンピュータプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120314

R150 Certificate of patent or registration of utility model

Ref document number: 4955096

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees