JP2007189577A

JP2007189577A - コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法

Info

Publication number: JP2007189577A
Application number: JP2006007087A
Authority: JP
Inventors: Nobuhiko Higuchi; 暢彦樋口
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2006-01-16
Filing date: 2006-01-16
Publication date: 2007-07-26

Abstract

【課題】読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像に特徴がない場合等であっても、読み取った原稿画像の傾きを補正することが可能なコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法の提供を目的とする。
【解決手段】画像データ取得手段３１は、原稿画像を含む多値画像データを取得し、輪郭強調手段３２は、多値画像データの輪郭強調処理を行い、２値化手段３３は、輪郭強調処理後の多値画像データを２値化し、傾き検出手段３４は、２値化後の画像データの傾きを検出し、傾き補正手段３５は、検出された原稿画像領域傾きに基づいて２値化後の画像データから原稿画像領域の傾きを補正し、原稿画像領域検出手段３６は、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する。
【選択図】図４

Description

本発明は、画像データを入力するコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法に関する。

オートシードフィーダにより読取装置へ複数の原稿を連続的に供給し、読み取らせる場合、原稿が読取装置に対して斜めに供給されることがある。この場合、読み取られた画像データに含まれる原稿画像部分が傾いた状態になっているので、この原稿画像部分を傾いていない状態へと補正する必要がある。

従来、この傾き補正は、画像データに含まれる原稿画像のエッジ（輪郭）を抽出することにより、その傾きを補正したり、例えば、（特許文献１）に記載のように画像情報中に存在する水平方向の特徴を抽出し、その特徴から画像情報の傾きを自動的に検出し、検出した傾きを補正する値を元に画像情報を読み取ったりしている。
特開平２−１９９９５９号公報

ところが、上記従来の方法は、原稿画像のエッジが明確であったり、原稿画像に特徴があったりする場合のみ利用することが可能である。すなわち、読み取る原稿が、読取装置の原稿読取部の背後の色とあまり差異がない場合（例えば、読取部の背後が黒色で原稿の背景が黒の場合やこの逆の場合等）や、画像に特徴がない場合等には、原稿の傾きを抽出することが不可能である。

そこで、本発明においては、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像に特徴がない場合等であっても、読み取った原稿画像の傾きを補正することが可能なコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法を提供することを目的とする。

上記課題を解決するため、本発明は、原稿画像を含む多値画像データを取得し、多値画像データの輪郭強調処理を行い、輪郭強調処理後の多値画像データを２値化し、２値化後の画像データの傾きを検出し、検出された原稿画像領域傾きに基づいて２値化後の画像データから原稿画像領域の傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する構成としたものである。

本発明によれば、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能となる。

本願の第１の発明は、原稿画像を含む多値画像データを取得する第１ステップと、多値画像データの輪郭強調処理を行う第２ステップと、輪郭強調処理後の多値画像データを２値化する第３ステップと、２値化後の画像データから原稿画像の領域の傾きを検出する第４ステップと、原稿画像の領域の傾きに基づいて２値化後の画像データの傾きを補正する第５ステップと、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する第６ステップとをコンピュータに実行させるためのコンピュータプログラムであり、このコンピュータプログラムを実行したコンピュータによれば、原稿の多値画像データを取得して、この多値画像データの輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。そして、輪郭強調処理後の多値画像データを２値化し、２値化後の画像データから原稿画像領域の傾きを検出し、検出された原稿画像領域の傾きに基づいて２値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出することにより、原稿画像の傾きを補正することができる。

これにより、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能となる。

本願の第２の発明は、前記第２ステップにおける輪郭強調処理は、多値画像データとして、ブライトネス補正、コントラスト補正およびガンマ補正を行う前の多値画像データを用いることを特徴とするコンピュータプログラムとしたものであり、原稿画像を含む多値画像データをブライトネス補正、コントラスト補正またはガンマ補正すると、原稿画像領域とその読み取り時の背景色との極わずかな差がなくなってしまう可能性があるが、これらの補正前に輪郭強調を行うことにより、この極わずかな差を認識することが可能となる。

本願の第３の発明は、前記第３ステップは、多値画像データ中で順次２値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズの領域内で動的にしきい値を算出しながらこの算出したしきい値により２値化を行うことを特徴とするコンピュータプログラムとしたものであり、注目画素の周りの所定サイズの領域内の状況に応じて動的にしきい値を算出することにより、原稿画像を含む多値画像データ全体の背景色のむらに関係なく、エッジが最もはっきりと認識でき、かつノイズの少ない２値化画像を得ることが可能となり、より正確な傾き補正を行うことができる。

本願の第４の発明は、前記第４ステップは、２値化後の画像データをＹ方向に検索し、最初に黒画素から白画素へまたは白画素から黒画素へ変化する画素の集合をエッジの候補とし、このエッジの候補上の各２画素を結ぶ線分とエッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる２画素を結ぶ線分をエッジとし、このエッジの傾きを２値化後の画像データの傾きとすることを特徴とするコンピュータプログラムとしたものであり、エッジの候補上の各２画素を結ぶ線分とエッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる２画素を結ぶ線分をエッジとすることにより、ノイズを含むエッジの候補から最も可能性の高い線分を選択して傾き補正を行うことができる。

本願の第５の発明は、原稿画像を含む多値画像データを取得する手段と、多値画像データの輪郭強調処理を行う手段と、輪郭強調処理後の多値画像データを２値化する手段と、２値化後の画像データから原稿画像の領域の傾きを検出する手段と、原稿画像の領域の傾きに基づいて２値化後の画像データの傾きを補正する手段と、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する手段とを有する画像入力装置としたものであり、原稿の多値画像データを取得して、この多値画像データの輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。

そして、輪郭強調処理後の多値画像データを２値化し、２値化後の画像データから原稿画像領域の傾きを検出し、検出された原稿画像領域の傾きに基づいて２値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出することにより、原稿画像の傾きを補正することができる。

本願の第６の発明は、原稿を読み取る読取装置と、前記画像入力装置とを含む画像入力システムとしたものであり、読取装置により原稿を読み取り、この読み取った原稿画像を含む多値画像データから輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。

そして、輪郭強調処理後の多値画像データを２値化し、２値化後の画像データの傾きを検出し、検出された傾きに基づいて２値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿部分の領域を検出し、切り出すことができる。

これにより、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、画像に特徴がない場合等であっても、読み取った原稿画像の傾きを補正することが可能となる。

本願の第７の発明は、原稿画像を含む多値画像データを取得する第１ステップと、多値画像データの輪郭強調処理を行う第２ステップと、輪郭強調処理後の多値画像データを２値化する第３ステップと、２値化後の画像データから原稿画像の領域の傾きを検出する第４ステップと、原稿画像の領域の傾きに基づいて２値化後の画像データの傾きを補正する第５ステップと、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する第６ステップとを含む画像入力方法としたものであり、原稿の多値画像データを取得して、この多値画像データの輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。

以下、本発明の実施の形態について図面を参照して説明する。

図１は本発明の実施の形態における画像入力システムの構成図、図２は図１の画像読取装置のハードウェア構成図、図３は図１のコンピュータのハードウェア構成図、図４は図１の画像入力システムのブロック図である。

図１において、本発明の実施の形態における画像入力システムは、原稿から画像を読み取る読取装置としてのカラースキャナ１と、このカラースキャナ１が接続されるコンピュータ２とから構成される。カラースキャナ１は、原稿を多値（カラー）で読み取るものであり、多値の画像データをコンピュータ２へ出力する。また、カラースキャナ１は、自動的に原稿を給紙するオートシートフィーダ（図示せず。）を備え、複数の原稿を連続的に読み取ることが可能である。

カラースキャナ１は、図２に示すように、原稿から画像を読み取る読取部１０と、コンピュータ２に接続するための外部インターフェース（Ｉ／Ｆ）１１と、読取部１０による画像データの読み取り処理や外部Ｉ／Ｆ１１を通じたコンピュータ２との通信等の各種処理を行う中央処理装置（ＣＰＵ）１２と、ＣＰＵ１２を動作させるためのプログラム等を記録したリード・オンリ・メモリ（ＲＯＭ）１３と、読取部１０により読み取った画像データを一時記憶したり、ＣＰＵ１２による演算処理時のデータを一時記憶したりするランダム・アクセス・メモリ（ＲＡＭ）１４とを有する。読取部１０は、一般的なラインイメージセンサと、このラインイメージセンサに対向して配置された読み取り台とから構成される。読み取り台は、一般的に白色原稿が多いので、この白色原稿と背景色との差異が出るように黒色に着色されている。

コンピュータ２は、図３に示すように、各種データを表示するディスプレイ２０と、キーボードやポインティングデバイス等の操作入力部２１と、カラースキャナ１に接続するための外部インターフェース（Ｉ／Ｆ）２２と、各種データを保存する記憶手段３０（図４参照。）の一つとしてのハードディスク２３と、各種処理を行う中央処理装置（ＣＰＵ）２４と、ＣＰＵ２４を動作させるためのプログラム等を記録したリード・オンリ・メモリ（ＲＯＭ）２５と、ＣＰＵ２４による演算処理時のデータを一時記憶する記憶手段３０の一つとしてのランダム・アクセス・メモリ（ＲＡＭ）２６とを有する。

また、図４に示すように、コンピュータ２は、ハードディスク２３等の記憶手段３０に記録されたコンピュータプログラムとしての画像入力プログラムを実行することにより、原稿画像を含む多値画像データを取得する画像データ取得手段３１と、画像データ取得手段３１により取得した多値画像データの輪郭強調処理を行う輪郭強調手段３２と、輪郭強調処理後の多値画像データを２値化する２値化手段３３と、２値化後の画像データから原稿画像領域の傾きを検出する傾き検出手段３４と、原稿画像領域の傾きに基づいて２値化後の画像データの傾きを補正する傾き補正手段３５と、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する原稿画像領域検出手段３６と、原稿画像領域検出手段３６により検出された原稿画像領域に従って原稿画像を切り出す原稿画像領域切出手段３７として機能する。

図５は輪郭強調手段によるフィルタ処理の例を示す説明図、図６は動的なしきい値の例を示す図、図７はエッジの候補を検出する例を示す図、図８は傾き補正手段による傾き補正の例を示す図、図９は傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する例を示す図、図１０は原稿画像領域切出手段による原稿画像の切り出し例を示す図である。

画像データ取得手段３１は、カラースキャナ１から原稿画像を含む多値画像データを取得し、記憶手段３０へ格納する。カラースキャナ１により読み取られる多値画像データには、このカラースキャナ１に供給される原稿と、この原稿をラインイメージセンサにより読み取る際の背景となる読み取り台との両方が含まれる。画像データ取得手段３１は、このカラースキャナ１から取得した多値画像データを、ブライトネス補正、コントラスト補正やガンマ補正等の補正処理を行うことなく、そのまま記憶手段３０へ格納するとともに、輪郭強調手段３２へと渡す。

輪郭強調手段３２は、画像データ取得手段３１により取得した多値画像データの輪郭強調処理を行う。ここで用いる多値画像データは、ブライトネス補正、コントラスト補正およびガンマ補正を行う前の多値画像データである。輪郭強調処理は、ハイパスフィルタや、ラプラシアンフィルタ等の公知のフィルタ処理アルゴリズムを用いることができる。

図５は輪郭強調手段３２によるフィルタ処理の例を示しており、注目画素の周りの所定サイズの領域内の各画素の位置とフィルタ係数との対応を示している。輪郭強調手段３２は、注目画素の値をＶ００としたとき、この注目画素を中心とする５×５のサイズの領域内の各画素の値Ｖ００〜Ｖ０４，Ｖ１０〜Ｖ１４，Ｖ２０〜Ｖ２４，Ｖ３０〜Ｖ３４，Ｖ４０〜Ｖ４４を用いて、次式によるフィルタ処理を行う。

画素値＝（Ｖ００×ａ
＋（Ｖ２０＋Ｖ３０）×ｂ
＋（Ｖ１０＋Ｖ４０）×ｃ
＋（Ｖ０２＋Ｖ０３）×ｄ
＋（Ｖ０１＋Ｖ０４）×ｅ
＋（Ｖ２２＋Ｖ３２＋Ｖ２３＋Ｖ３３）×ｆ
＋（Ｖ１２＋Ｖ２１＋Ｖ３１＋Ｖ４２＋Ｖ１３＋Ｖ２４＋Ｖ３４＋Ｖ４３）×ｇ
＋（Ｖ１１＋Ｖ１４＋Ｖ４１＋Ｖ４４）×ｈ）／基数
（例：ａ＝５２，ｂ＝−６，ｃ＝−３，ｄ＝−６，ｅ＝−３，ｆ＝０，ｇ＝０，ｈ＝０，基数＝１６）
図４の２値化手段３３は、輪郭強調手段３２による輪郭強調処理後の多値画像データの中で順次２値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズ（例えば、１６×１６画素）の領域内で動的にしきい値を算出しながらこの算出したしきい値により２値化を行う。図６はこの算出された動的なしきい値の例を示している。

傾き検出手段３４は、２値化手段３３による２値化後の画像データをＹ方向に検索し、最初に変化する画素の集合をエッジの候補とし、このエッジの候補上の各２画素を結ぶ線分とエッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる２画素を結ぶ線分をエッジとし、このエッジの傾きを２値化後の画像データの傾きとする。図７はエッジの候補を検出する例を示している。

図４の傾き補正手段３５は、傾き検出手段３４により検出された原稿画像の傾きから回転角度θを算出し、２値化手段３３による２値化後の画像データの各画素をこの回転角度θだけ回転した際の位置を求めることにより傾きを補正する。このとき、回転後の位置が元の画像データの全体の範囲内に入っている場合にはその画素値をそのまま設定するが、入っていない場合には黒（背景値）を設定する。図８は傾き補正手段３５による傾き補正の例を示している。

原稿画像領域検出手段３６は、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する。図９は傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する例を示している。

原稿画像領域切出手段３７は、原稿画像領域検出手段３６により検出された原稿画像領域に従って原稿画像を切り出す。このとき、原稿画像領域切出手段３７は、２値の原稿画像を切り出す場合には、記憶手段３０に記憶されている多値画像を切り出した後、２値化処理する。また、多値の原稿画像を切り出す場合には、記憶手段３０に記憶されている多値画像データから原稿画像を切り出す。このとき、原稿画像領域検出３６は、傾き補正手段３５と同様の処理により多値画像データの傾き補正を行った後に原稿画像を切り出す。図１０は原稿画像領域切出手段による原稿画像の切り出し例を示している。

次に、上記構成の画像入力システムによる処理手順について、図１１を用いて説明する。図１１は画像入力システムによる処理手順を示すフローチャート、図１２は２値化処理の詳細なフローチャート、図１５はカラースキャナにより読み込んだ多値画像データの例を示す図である。

まず、カラースキャナ１により原稿を読み取り（ステップＳ１００）、画像データ取得手段３１によりこの原稿画像を含む多値画像データを取得する（ステップＳ１０１）。この多値画像データは、原稿画像とその背景（下地）画像を含む画像データであり、原稿が黒っぽい原稿の場合、図１５に示すように原稿画像とその背景画像との境界はほとんど判別できない。

次に、輪郭強調手段３２による輪郭強調処理（ステップＳ１０２）を行った後、２値化手段３３による２値化処理（ステップＳ１０３）を行う。図１２は２値化処理の詳細なフローチャートを示している。

図１２に示すように、２値化手段３３は、画像高さカウンタおよび画像幅カウンタを０から始め、画像高さカウンタが画像高さを超えていないかどうか確認する（ステップＳ２００）。画像高さを超えていない場合、画像幅を超えていないかどうか確認し（ステップＳ２０１）、画像幅を超えた場合には、画像高さカウンタをインクリメントし（ステップＳ２０２）、画像高さカウンタが画像高さを超えるまでステップＳ２００，Ｓ２０１を繰り返す。

ステップＳ２０１において、画像幅カウンタが画像幅を超えてない場合、所定サイズ（例えば、１６×１６）の領域内の画素値合計Ｖを初期化（＝０）する（ステップＳ２０３）。次に、この領域内の各画素を表す領域カウンタを０から始め、領域カウンタが領域を超えていないかどうかを確認する（ステップＳ２０４）。領域を超えていない場合、画素値がｍｉｎＬｉｍｉｔより小さいかどうかを確認し（ステップＳ２０５）、小さい場合にはＶにｍｉｎＬｉｍｉｔを加算し（ステップＳ２０６）、一方、大きい場合にはＶに画素値を加算する（ステップＳ２０７）。次に、領域カウンタをインクリメントし（ステップＳ２０８）、領域カウンタが領域を超えるまでステップＳ２０５〜Ｓ２０８を繰り返す（ステップＳ２０４）。なお、ｍｉｎＬｉｍｉｔは、下地の下限値で下地の画素値がこの値Ｗより小さく（暗く）ならないようにするためのしきい値である。小さくすると原稿の輪郭が出やすくなるが、ノイズも増加する。一方、大きくすると原稿の輪郭が出にくくなるが、ノイズは減少する。この値は、輪郭が最もはっきり認識でき、かつノイズが最小となる条件で決定する。

次に、２値化手段３３は、領域内の平均値（Ｖ／領域内画素数）を求め、これを下地レベルとして（ステップＳ２０９）、現領域内のしきい値（＝（２５５−Ｎ＋Ｍ）／２５５×下地レベル−Ｍ）を算出する（ステップＳ２１０）。なお、Ｎは黒または白になりやすくするための白色方向の調整値であり、Ｍは黒または白になりやすくするための黒色方向の調整値である。この値も、ｍｉｎＬｉｍｉｔと同様、輪郭が最もはっきり認識でき、かつノイズが最小となる条件で決定する。図６は横軸を領域内平均値、縦軸を注目画素レベルとして下地レベルおよびしきい値を表している。

２値化手段３３は、図６から注目画素の領域内平均値の軸（縦軸）上で、注目画素値がしきい値より小さいかどうか確認し（ステップＳ２１１）、小さい場合にはその注目画素値を黒画素とし（ステップＳ２１２）、そうでない場合にはその注目画素値を白画素とする（ステップＳ２１３）。そして、画像幅カウンタをインクリメントし（ステップＳ２１４）、画像幅カウンタが画像幅を超えるまでステップＳ２０１，Ｓ２０３〜２１４を繰り返す（ステップＳ２０１）。図１６は図１５の画像データを２値化した後の画像データの例を示す図である。

図１１に戻って、次に、傾き検出手段３４による原稿画像領域の傾き検出を行う（ステップ１０４）。図１３は傾き検出処理の詳細なフローチャート、図１４は傾き検出処理の流れのイメージを示す図である。

図１３に示すように、傾き検出手段３４は、画像の全幅に対し、上部から下方向へ向かって走査し（図７参照。）、白画素のｙ座標を求める（ステップＳ３００）。このとき、白画素がない場合はｙ座標は無効である。次に、有効な白画素の集合（ノイズを含むエッジの候補）の左端をＸｓ、右端をＸｅに初期化（図１４（ａ）参照。）し、最大ヒット数を０に初期化する（ステップＳ３０１）。

次に、傾き検出手段３４は、Ｘｅ−Ｘｓが最大ヒット数より小さいかどうかを確認し、小さくない場合、ＸｓとＸｅを結ぶ線分と、エッジの候補上の各画素との距離が所定長さ（例えば、０．３ｍｍ）以内にある画素をヒット数としてカウントする（ステップＳ３０３）。そして、このヒット数が最大ヒット数より大きいかどうか確認し（ステップＳ３０４）、大きい場合には最大ヒット数を更新する（ステップＳ３０５）。

次に、傾き検出手段３４は、Ｘｅのｘ座標を一つ左へ移動（図１４（ｂ）参照。）し（ステップＳ３０６）、Ｘｓ＝ＸｅとなるまでステップＳ３０２〜３０７を繰り返す（ステップＳ３０７）。Ｘｓ＝Ｘｅとなった場合（図１４（ｃ）参照。）、Ｘｓを一つ右へ、Ｘｅを最右へ移動（図１４（ｄ）参照。）し、Ｘｅ−Ｘｓが最大ヒット数より小さくなるまでステップＳ３０２〜３０８を繰り返す（ステップＳ３０２）。

傾き検出手段３４は、Ｘｅ−Ｘｓが最大ヒット数より小さくなると、求まった上辺（図１４（ｅ）参照。）の左右のｘ座標からｙ座標を取得し、この２点から傾きＳ＝（左ｙ座標−右ｙ座標）／（右ｘ座標−左ｘ座標）を求める（ステップＳ３０９）。

また、図１１に戻って、次に、傾き補正手段３５による画像データの傾き補正を行う（ステップＳ１０５）。傾き補正手段３５は、傾き検出手段３４により求めた傾きＳから回転角度θ（＝−ｔａｎ^-1Ｓ）を求め、回転処理を行って傾きを補正する。

ここで、傾き補正手段３５は、傾き補正（デスキュー）後に画像の左上端となる画素から走査し、画素が回転角度θだけ回転したときの位置を求める。そして、この位置がデスキュー前の画像の範囲（元の画像領域）に入っていればその画素値を、入っていなければ黒（背景値）をデスキュー後の画像領域に設定する（図８参照。）。図１７は図１６の画像データをデスキューした後の画像データの例を示す図である。

次に、原稿画像領域検出手段３６による原稿画像領域の検出を行う（ステップＳ１０６）。原稿画像領域検出手段３６は、デスキューされた状態で、縦方向および横方向それぞれの白画素のヒストグラムを作成する（図９参照。）。図１８は図１７の画像データの横方向のヒストグラムの例を示す図である。そして、このヒストグラムの変化量から、幅または高さの画素数に対する割合を変化量のしきい値として、縦方向および横方向それぞれの両端の座標を検出する。

次に、原稿画像領域切出手段３７による原稿画像領域の切り出し（クロップ）を行う（ステップＳ１０７）。図１９はカラースキャナにより入力された画像から原稿画像を切り出した例を示す図である。切り出しは、原稿画像領域検出手段３６により求めた縦方向および横方向それぞれの両端の座標（上端、下端、右端、左端）を４つの角とする矩形により、元の画像領域から新しい画像領域を切り出し、記憶手段３０へ格納する。これにより、図１９に示すように、カラースキャナ１により入力された画像４０から原稿画像４１が取得できる。

以上のように、本実施の形態における画像入力システムによれば、読み取る原稿が、カラースキャナ１の読取部１０の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿画像部分のみを切り出して取得することが可能である。

また、原稿画像を含む多値画像データをブライトネス補正、コントラスト補正またはガンマ補正すると、原稿画像領域とその読み取り時の背景色との極わずかな差がなくなってしまう可能性があるが、本実施の形態における画像処理システムでは、これらの補正前に輪郭強調を行うので、この極わずかな差を認識して傾きを補正することが可能である。

また、本実施の形態における画像処理システムでは、注目画素の周りの所定サイズの領域内の状況に応じて動的にしきい値を算出することにより、原稿画像を含む多値画像データ全体の背景色のむらに関係なく、エッジが最もはっきりと認識でき、かつノイズの少ない２値化画像を得ることができる。これにより、より正確な傾き補正を行うことができる。

本発明は、画像データを入力するコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法として有用である。特に、本発明は、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能な点で好適である。

本発明の実施の形態における画像入力システムの構成図図１の画像読取装置のハードウェア構成図図１のコンピュータのハードウェア構成図図１の画像入力システムのブロック図輪郭強調手段によるフィルタ処理の例を示す説明図動的なしきい値の例を示す図エッジの候補を検出する例を示す図傾き補正手段による傾き補正の例を示す図傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する例を示す図原稿画像領域切出手段による原稿画像の切り出し例を示す図画像入力システムによる処理手順を示すフローチャート２値化処理の詳細なフローチャート傾き検出処理の詳細なフローチャート傾き検出処理の流れのイメージを示す図カラースキャナにより読み込んだ多値画像データの例を示す図図１５の画像データを２値化した後の画像データの例を示す図図１６の画像データをデスキューした後の画像データの例を示す図図１７の画像データの横方向のヒストグラムの例を示す図カラースキャナにより入力された画像から原稿画像を切り出した例を示す図

符号の説明

１カラースキャナ
２コンピュータ
１０読取部
１１外部Ｉ／Ｆ
１２ＣＰＵ
１３ＲＯＭ
１４ＲＡＭ
２０ディスプレイ
２１操作入力部
２２外部Ｉ／Ｆ
２３ハードディスク
２４ＣＰＵ
２５ＲＯＭ
２６ＲＡＭ
３０記憶手段
３１画像データ取得手段
３２輪郭強調手段
３３２値化手段
３４傾き検出手段
３５傾き補正手段
３６原稿画像領域検出手段
３７原稿画像領域切出手段
４０画像
４１原稿画像

Claims

原稿画像を含む多値画像データを取得する第１ステップと、
前記多値画像データの輪郭強調処理を行う第２ステップと、
前記輪郭強調処理後の多値画像データを２値化する第３ステップと、
前記２値化後の画像データから前記原稿画像の領域の傾きを検出する第４ステップと、
前記原稿画像の領域の傾きに基づいて前記２値化後の画像データの傾きを補正する第５ステップと、
前記傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて
前記原稿画像の領域を検出する第６ステップとをコンピュータに実行させるためのコンピュータプログラム。
前記第２ステップにおける輪郭強調処理は、前記多値画像データとして、ブライトネス補正、コントラスト補正およびガンマ補正を行う前の多値画像データを用いることを特徴とする請求項１記載のコンピュータプログラム。
前記第３ステップは、前記多値画像データ中で順次２値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズの領域内で動的にしきい値を算出しながらこの算出したしきい値により２値化を行うことを特徴とする請求項１または２に記載のコンピュータプログラム。
前記第４ステップは、前記２値化後の画像データをＹ方向に検索し、最初に黒画素から白画素へまたは白画素から黒画素へ変化する画素の集合をエッジの候補とし、このエッジの候補上の各２画素を結ぶ線分と前記エッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる２画素を結ぶ線分をエッジとし、このエッジの傾きを前記２値化後の画像データの傾きとすることを特徴とする請求項１から３のいずれかに記載のコンピュータプログラム。
原稿画像を含む多値画像データを取得する手段と、
前記多値画像データの輪郭強調処理を行う手段と、
前記輪郭強調処理後の多値画像データを２値化する手段と、
前記２値化後の画像データから前記原稿画像の領域の傾きを検出する手段と、
前記原稿画像の領域の傾きに基づいて前記２値化後の画像データの傾きを補正する手段と、
前記傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて前記原稿画像の領域を検出する手段とを有することを特徴とする画像入力装置。
原稿を読み取る読取装置と、
請求項５記載の画像入力装置とを含むことを特徴とする画像入力システム。
原稿画像を含む多値画像データを取得する第１ステップと、
前記多値画像データの輪郭強調処理を行う第２ステップと、
前記輪郭強調処理後の多値画像データを２値化する第３ステップと、
前記２値化後の画像データから前記原稿画像の領域の傾きを検出する第４ステップと、
前記原稿画像の領域の傾きに基づいて前記２値化後の画像データの傾きを補正する第５ステップと、
前記傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて前記原稿画像の領域を検出する第６ステップとを含むことを特徴とする画像入力方法。