JP2007189577A - コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 - Google Patents
コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 Download PDFInfo
- Publication number
- JP2007189577A JP2007189577A JP2006007087A JP2006007087A JP2007189577A JP 2007189577 A JP2007189577 A JP 2007189577A JP 2006007087 A JP2006007087 A JP 2006007087A JP 2006007087 A JP2006007087 A JP 2006007087A JP 2007189577 A JP2007189577 A JP 2007189577A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- image
- inclination
- area
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004590 computer program Methods 0.000 title claims abstract description 14
- 238000012937 correction Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 40
- 238000010586 diagram Methods 0.000 description 21
- 238000001514 detection method Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Abstract
【課題】読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像に特徴がない場合等であっても、読み取った原稿画像の傾きを補正することが可能なコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法の提供を目的とする。
【解決手段】画像データ取得手段31は、原稿画像を含む多値画像データを取得し、輪郭強調手段32は、多値画像データの輪郭強調処理を行い、2値化手段33は、輪郭強調処理後の多値画像データを2値化し、傾き検出手段34は、2値化後の画像データの傾きを検出し、傾き補正手段35は、検出された原稿画像領域傾きに基づいて2値化後の画像データから原稿画像領域の傾きを補正し、原稿画像領域検出手段36は、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する。
【選択図】図4
【解決手段】画像データ取得手段31は、原稿画像を含む多値画像データを取得し、輪郭強調手段32は、多値画像データの輪郭強調処理を行い、2値化手段33は、輪郭強調処理後の多値画像データを2値化し、傾き検出手段34は、2値化後の画像データの傾きを検出し、傾き補正手段35は、検出された原稿画像領域傾きに基づいて2値化後の画像データから原稿画像領域の傾きを補正し、原稿画像領域検出手段36は、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する。
【選択図】図4
Description
本発明は、画像データを入力するコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法に関する。
オートシードフィーダにより読取装置へ複数の原稿を連続的に供給し、読み取らせる場合、原稿が読取装置に対して斜めに供給されることがある。この場合、読み取られた画像データに含まれる原稿画像部分が傾いた状態になっているので、この原稿画像部分を傾いていない状態へと補正する必要がある。
従来、この傾き補正は、画像データに含まれる原稿画像のエッジ(輪郭)を抽出することにより、その傾きを補正したり、例えば、(特許文献1)に記載のように画像情報中に存在する水平方向の特徴を抽出し、その特徴から画像情報の傾きを自動的に検出し、検出した傾きを補正する値を元に画像情報を読み取ったりしている。
特開平2−199959号公報
ところが、上記従来の方法は、原稿画像のエッジが明確であったり、原稿画像に特徴があったりする場合のみ利用することが可能である。すなわち、読み取る原稿が、読取装置の原稿読取部の背後の色とあまり差異がない場合(例えば、読取部の背後が黒色で原稿の背景が黒の場合やこの逆の場合等)や、画像に特徴がない場合等には、原稿の傾きを抽出することが不可能である。
そこで、本発明においては、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像に特徴がない場合等であっても、読み取った原稿画像の傾きを補正することが可能なコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法を提供することを目的とする。
上記課題を解決するため、本発明は、原稿画像を含む多値画像データを取得し、多値画像データの輪郭強調処理を行い、輪郭強調処理後の多値画像データを2値化し、2値化後の画像データの傾きを検出し、検出された原稿画像領域傾きに基づいて2値化後の画像データから原稿画像領域の傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する構成としたものである。
本発明によれば、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能となる。
本願の第1の発明は、原稿画像を含む多値画像データを取得する第1ステップと、多値画像データの輪郭強調処理を行う第2ステップと、輪郭強調処理後の多値画像データを2値化する第3ステップと、2値化後の画像データから原稿画像の領域の傾きを検出する第4ステップと、原稿画像の領域の傾きに基づいて2値化後の画像データの傾きを補正する第5ステップと、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する第6ステップとをコンピュータに実行させるためのコンピュータプログラムであり、このコンピュータプログラムを実行したコンピュータによれば、原稿の多値画像データを取得して、この多値画像データの輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。そして、輪郭強調処理後の多値画像データを2値化し、2値化後の画像データから原稿画像領域の傾きを検出し、検出された原稿画像領域の傾きに基づいて2値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出することにより、原稿画像の傾きを補正することができる。
これにより、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能となる。
本願の第2の発明は、前記第2ステップにおける輪郭強調処理は、多値画像データとして、ブライトネス補正、コントラスト補正およびガンマ補正を行う前の多値画像データを用いることを特徴とするコンピュータプログラムとしたものであり、原稿画像を含む多値画像データをブライトネス補正、コントラスト補正またはガンマ補正すると、原稿画像領域とその読み取り時の背景色との極わずかな差がなくなってしまう可能性があるが、これらの補正前に輪郭強調を行うことにより、この極わずかな差を認識することが可能となる。
本願の第3の発明は、前記第3ステップは、多値画像データ中で順次2値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズの領域内で動的にしきい値を算出しながらこの算出したしきい値により2値化を行うことを特徴とするコンピュータプログラムとしたものであり、注目画素の周りの所定サイズの領域内の状況に応じて動的にしきい値を算出することにより、原稿画像を含む多値画像データ全体の背景色のむらに関係なく、エッジが最もはっきりと認識でき、かつノイズの少ない2値化画像を得ることが可能となり、より正確な傾き補正を行うことができる。
本願の第4の発明は、前記第4ステップは、2値化後の画像データをY方向に検索し、最初に黒画素から白画素へまたは白画素から黒画素へ変化する画素の集合をエッジの候補とし、このエッジの候補上の各2画素を結ぶ線分とエッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる2画素を結ぶ線分をエッジとし、このエッジの傾きを2値化後の画像データの傾きとすることを特徴とするコンピュータプログラムとしたものであり、エッジの候補上の各2画素を結ぶ線分とエッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる2画素を結ぶ線分をエッジとすることにより、ノイズを含むエッジの候補から最も可能性の高い線分を選択して傾き補正を行うことができる。
本願の第5の発明は、原稿画像を含む多値画像データを取得する手段と、多値画像データの輪郭強調処理を行う手段と、輪郭強調処理後の多値画像データを2値化する手段と、2値化後の画像データから原稿画像の領域の傾きを検出する手段と、原稿画像の領域の傾きに基づいて2値化後の画像データの傾きを補正する手段と、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する手段とを有する画像入力装置としたものであり、原稿の多値画像データを取得して、この多値画像データの輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。
そして、輪郭強調処理後の多値画像データを2値化し、2値化後の画像データから原稿画像領域の傾きを検出し、検出された原稿画像領域の傾きに基づいて2値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出することにより、原稿画像の傾きを補正することができる。
これにより、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能となる。
本願の第6の発明は、原稿を読み取る読取装置と、前記画像入力装置とを含む画像入力システムとしたものであり、読取装置により原稿を読み取り、この読み取った原稿画像を含む多値画像データから輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。
そして、輪郭強調処理後の多値画像データを2値化し、2値化後の画像データの傾きを検出し、検出された傾きに基づいて2値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿部分の領域を検出し、切り出すことができる。
これにより、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、画像に特徴がない場合等であっても、読み取った原稿画像の傾きを補正することが可能となる。
本願の第7の発明は、原稿画像を含む多値画像データを取得する第1ステップと、多値画像データの輪郭強調処理を行う第2ステップと、輪郭強調処理後の多値画像データを2値化する第3ステップと、2値化後の画像データから原稿画像の領域の傾きを検出する第4ステップと、原稿画像の領域の傾きに基づいて2値化後の画像データの傾きを補正する第5ステップと、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する第6ステップとを含む画像入力方法としたものであり、原稿の多値画像データを取得して、この多値画像データの輪郭強調処理を行うことにより、原稿画像領域とその読み取り時の背景色との差が極わずかであっても認識することが可能となる。
そして、輪郭強調処理後の多値画像データを2値化し、2値化後の画像データから原稿画像領域の傾きを検出し、検出された原稿画像領域の傾きに基づいて2値化後の画像データの傾きを補正し、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出することにより、原稿画像の傾きを補正することができる。
これにより、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能となる。
以下、本発明の実施の形態について図面を参照して説明する。
図1は本発明の実施の形態における画像入力システムの構成図、図2は図1の画像読取装置のハードウェア構成図、図3は図1のコンピュータのハードウェア構成図、図4は図1の画像入力システムのブロック図である。
図1において、本発明の実施の形態における画像入力システムは、原稿から画像を読み取る読取装置としてのカラースキャナ1と、このカラースキャナ1が接続されるコンピュータ2とから構成される。カラースキャナ1は、原稿を多値(カラー)で読み取るものであり、多値の画像データをコンピュータ2へ出力する。また、カラースキャナ1は、自動的に原稿を給紙するオートシートフィーダ(図示せず。)を備え、複数の原稿を連続的に読み取ることが可能である。
カラースキャナ1は、図2に示すように、原稿から画像を読み取る読取部10と、コンピュータ2に接続するための外部インターフェース(I/F)11と、読取部10による画像データの読み取り処理や外部I/F11を通じたコンピュータ2との通信等の各種処理を行う中央処理装置(CPU)12と、CPU12を動作させるためのプログラム等を記録したリード・オンリ・メモリ(ROM)13と、読取部10により読み取った画像データを一時記憶したり、CPU12による演算処理時のデータを一時記憶したりするランダム・アクセス・メモリ(RAM)14とを有する。読取部10は、一般的なラインイメージセンサと、このラインイメージセンサに対向して配置された読み取り台とから構成される。読み取り台は、一般的に白色原稿が多いので、この白色原稿と背景色との差異が出るように黒色に着色されている。
コンピュータ2は、図3に示すように、各種データを表示するディスプレイ20と、キーボードやポインティングデバイス等の操作入力部21と、カラースキャナ1に接続するための外部インターフェース(I/F)22と、各種データを保存する記憶手段30(図4参照。)の一つとしてのハードディスク23と、各種処理を行う中央処理装置(CPU)24と、CPU24を動作させるためのプログラム等を記録したリード・オンリ・メモリ(ROM)25と、CPU24による演算処理時のデータを一時記憶する記憶手段30の一つとしてのランダム・アクセス・メモリ(RAM)26とを有する。
また、図4に示すように、コンピュータ2は、ハードディスク23等の記憶手段30に記録されたコンピュータプログラムとしての画像入力プログラムを実行することにより、原稿画像を含む多値画像データを取得する画像データ取得手段31と、画像データ取得手段31により取得した多値画像データの輪郭強調処理を行う輪郭強調手段32と、輪郭強調処理後の多値画像データを2値化する2値化手段33と、2値化後の画像データから原稿画像領域の傾きを検出する傾き検出手段34と、原稿画像領域の傾きに基づいて2値化後の画像データの傾きを補正する傾き補正手段35と、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像領域を検出する原稿画像領域検出手段36と、原稿画像領域検出手段36により検出された原稿画像領域に従って原稿画像を切り出す原稿画像領域切出手段37として機能する。
図5は輪郭強調手段によるフィルタ処理の例を示す説明図、図6は動的なしきい値の例を示す図、図7はエッジの候補を検出する例を示す図、図8は傾き補正手段による傾き補正の例を示す図、図9は傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する例を示す図、図10は原稿画像領域切出手段による原稿画像の切り出し例を示す図である。
画像データ取得手段31は、カラースキャナ1から原稿画像を含む多値画像データを取得し、記憶手段30へ格納する。カラースキャナ1により読み取られる多値画像データには、このカラースキャナ1に供給される原稿と、この原稿をラインイメージセンサにより読み取る際の背景となる読み取り台との両方が含まれる。画像データ取得手段31は、このカラースキャナ1から取得した多値画像データを、ブライトネス補正、コントラスト補正やガンマ補正等の補正処理を行うことなく、そのまま記憶手段30へ格納するとともに、輪郭強調手段32へと渡す。
輪郭強調手段32は、画像データ取得手段31により取得した多値画像データの輪郭強調処理を行う。ここで用いる多値画像データは、ブライトネス補正、コントラスト補正およびガンマ補正を行う前の多値画像データである。輪郭強調処理は、ハイパスフィルタや、ラプラシアンフィルタ等の公知のフィルタ処理アルゴリズムを用いることができる。
図5は輪郭強調手段32によるフィルタ処理の例を示しており、注目画素の周りの所定サイズの領域内の各画素の位置とフィルタ係数との対応を示している。輪郭強調手段32は、注目画素の値をV00としたとき、この注目画素を中心とする5×5のサイズの領域内の各画素の値V00〜V04,V10〜V14,V20〜V24,V30〜V34,V40〜V44を用いて、次式によるフィルタ処理を行う。
画素値=(V00×a
+(V20+V30)×b
+(V10+V40)×c
+(V02+V03)×d
+(V01+V04)×e
+(V22+V32+V23+V33)×f
+(V12+V21+V31+V42+V13+V24+V34+V43)×g
+(V11+V14+V41+V44)×h)/基数
(例:a=52,b=−6,c=−3,d=−6,e=−3,f=0,g=0,h=0,基数=16)
図4の2値化手段33は、輪郭強調手段32による輪郭強調処理後の多値画像データの中で順次2値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズ(例えば、16×16画素)の領域内で動的にしきい値を算出しながらこの算出したしきい値により2値化を行う。図6はこの算出された動的なしきい値の例を示している。
+(V20+V30)×b
+(V10+V40)×c
+(V02+V03)×d
+(V01+V04)×e
+(V22+V32+V23+V33)×f
+(V12+V21+V31+V42+V13+V24+V34+V43)×g
+(V11+V14+V41+V44)×h)/基数
(例:a=52,b=−6,c=−3,d=−6,e=−3,f=0,g=0,h=0,基数=16)
図4の2値化手段33は、輪郭強調手段32による輪郭強調処理後の多値画像データの中で順次2値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズ(例えば、16×16画素)の領域内で動的にしきい値を算出しながらこの算出したしきい値により2値化を行う。図6はこの算出された動的なしきい値の例を示している。
傾き検出手段34は、2値化手段33による2値化後の画像データをY方向に検索し、最初に変化する画素の集合をエッジの候補とし、このエッジの候補上の各2画素を結ぶ線分とエッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる2画素を結ぶ線分をエッジとし、このエッジの傾きを2値化後の画像データの傾きとする。図7はエッジの候補を検出する例を示している。
図4の傾き補正手段35は、傾き検出手段34により検出された原稿画像の傾きから回転角度θを算出し、2値化手段33による2値化後の画像データの各画素をこの回転角度θだけ回転した際の位置を求めることにより傾きを補正する。このとき、回転後の位置が元の画像データの全体の範囲内に入っている場合にはその画素値をそのまま設定するが、入っていない場合には黒(背景値)を設定する。図8は傾き補正手段35による傾き補正の例を示している。
原稿画像領域検出手段36は、傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する。図9は傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて原稿画像の領域を検出する例を示している。
原稿画像領域切出手段37は、原稿画像領域検出手段36により検出された原稿画像領域に従って原稿画像を切り出す。このとき、原稿画像領域切出手段37は、2値の原稿画像を切り出す場合には、記憶手段30に記憶されている多値画像を切り出した後、2値化処理する。また、多値の原稿画像を切り出す場合には、記憶手段30に記憶されている多値画像データから原稿画像を切り出す。このとき、原稿画像領域検出36は、傾き補正手段35と同様の処理により多値画像データの傾き補正を行った後に原稿画像を切り出す。図10は原稿画像領域切出手段による原稿画像の切り出し例を示している。
次に、上記構成の画像入力システムによる処理手順について、図11を用いて説明する。図11は画像入力システムによる処理手順を示すフローチャート、図12は2値化処理の詳細なフローチャート、図15はカラースキャナにより読み込んだ多値画像データの例を示す図である。
まず、カラースキャナ1により原稿を読み取り(ステップS100)、画像データ取得手段31によりこの原稿画像を含む多値画像データを取得する(ステップS101)。この多値画像データは、原稿画像とその背景(下地)画像を含む画像データであり、原稿が黒っぽい原稿の場合、図15に示すように原稿画像とその背景画像との境界はほとんど判別できない。
次に、輪郭強調手段32による輪郭強調処理(ステップS102)を行った後、2値化手段33による2値化処理(ステップS103)を行う。図12は2値化処理の詳細なフローチャートを示している。
図12に示すように、2値化手段33は、画像高さカウンタおよび画像幅カウンタを0から始め、画像高さカウンタが画像高さを超えていないかどうか確認する(ステップS200)。画像高さを超えていない場合、画像幅を超えていないかどうか確認し(ステップS201)、画像幅を超えた場合には、画像高さカウンタをインクリメントし(ステップS202)、画像高さカウンタが画像高さを超えるまでステップS200,S201を繰り返す。
ステップS201において、画像幅カウンタが画像幅を超えてない場合、所定サイズ(例えば、16×16)の領域内の画素値合計Vを初期化(=0)する(ステップS203)。次に、この領域内の各画素を表す領域カウンタを0から始め、領域カウンタが領域を超えていないかどうかを確認する(ステップS204)。領域を超えていない場合、画素値がminLimitより小さいかどうかを確認し(ステップS205)、小さい場合にはVにminLimitを加算し(ステップS206)、一方、大きい場合にはVに画素値を加算する(ステップS207)。次に、領域カウンタをインクリメントし(ステップS208)、領域カウンタが領域を超えるまでステップS205〜S208を繰り返す(ステップS204)。なお、minLimitは、下地の下限値で下地の画素値がこの値Wより小さく(暗く)ならないようにするためのしきい値である。小さくすると原稿の輪郭が出やすくなるが、ノイズも増加する。一方、大きくすると原稿の輪郭が出にくくなるが、ノイズは減少する。この値は、輪郭が最もはっきり認識でき、かつノイズが最小となる条件で決定する。
次に、2値化手段33は、領域内の平均値(V/領域内画素数)を求め、これを下地レベルとして(ステップS209)、現領域内のしきい値(=(255−N+M)/255×下地レベル−M)を算出する(ステップS210)。なお、Nは黒または白になりやすくするための白色方向の調整値であり、Mは黒または白になりやすくするための黒色方向の調整値である。この値も、minLimitと同様、輪郭が最もはっきり認識でき、かつノイズが最小となる条件で決定する。図6は横軸を領域内平均値、縦軸を注目画素レベルとして下地レベルおよびしきい値を表している。
2値化手段33は、図6から注目画素の領域内平均値の軸(縦軸)上で、注目画素値がしきい値より小さいかどうか確認し(ステップS211)、小さい場合にはその注目画素値を黒画素とし(ステップS212)、そうでない場合にはその注目画素値を白画素とする(ステップS213)。そして、画像幅カウンタをインクリメントし(ステップS214)、画像幅カウンタが画像幅を超えるまでステップS201,S203〜214を繰り返す(ステップS201)。図16は図15の画像データを2値化した後の画像データの例を示す図である。
図11に戻って、次に、傾き検出手段34による原稿画像領域の傾き検出を行う(ステップ104)。図13は傾き検出処理の詳細なフローチャート、図14は傾き検出処理の流れのイメージを示す図である。
図13に示すように、傾き検出手段34は、画像の全幅に対し、上部から下方向へ向かって走査し(図7参照。)、白画素のy座標を求める(ステップS300)。このとき、白画素がない場合はy座標は無効である。次に、有効な白画素の集合(ノイズを含むエッジの候補)の左端をXs、右端をXeに初期化(図14(a)参照。)し、最大ヒット数を0に初期化する(ステップS301)。
次に、傾き検出手段34は、Xe−Xsが最大ヒット数より小さいかどうかを確認し、小さくない場合、XsとXeを結ぶ線分と、エッジの候補上の各画素との距離が所定長さ(例えば、0.3mm)以内にある画素をヒット数としてカウントする(ステップS303)。そして、このヒット数が最大ヒット数より大きいかどうか確認し(ステップS304)、大きい場合には最大ヒット数を更新する(ステップS305)。
次に、傾き検出手段34は、Xeのx座標を一つ左へ移動(図14(b)参照。)し(ステップS306)、Xs=XeとなるまでステップS302〜307を繰り返す(ステップS307)。Xs=Xeとなった場合(図14(c)参照。)、Xsを一つ右へ、Xeを最右へ移動(図14(d)参照。)し、Xe−Xsが最大ヒット数より小さくなるまでステップS302〜308を繰り返す(ステップS302)。
傾き検出手段34は、Xe−Xsが最大ヒット数より小さくなると、求まった上辺(図14(e)参照。)の左右のx座標からy座標を取得し、この2点から傾きS=(左y座標−右y座標)/(右x座標−左x座標)を求める(ステップS309)。
また、図11に戻って、次に、傾き補正手段35による画像データの傾き補正を行う(ステップS105)。傾き補正手段35は、傾き検出手段34により求めた傾きSから回転角度θ(=−tan-1S)を求め、回転処理を行って傾きを補正する。
ここで、傾き補正手段35は、傾き補正(デスキュー)後に画像の左上端となる画素から走査し、画素が回転角度θだけ回転したときの位置を求める。そして、この位置がデスキュー前の画像の範囲(元の画像領域)に入っていればその画素値を、入っていなければ黒(背景値)をデスキュー後の画像領域に設定する(図8参照。)。図17は図16の画像データをデスキューした後の画像データの例を示す図である。
次に、原稿画像領域検出手段36による原稿画像領域の検出を行う(ステップS106)。原稿画像領域検出手段36は、デスキューされた状態で、縦方向および横方向それぞれの白画素のヒストグラムを作成する(図9参照。)。図18は図17の画像データの横方向のヒストグラムの例を示す図である。そして、このヒストグラムの変化量から、幅または高さの画素数に対する割合を変化量のしきい値として、縦方向および横方向それぞれの両端の座標を検出する。
次に、原稿画像領域切出手段37による原稿画像領域の切り出し(クロップ)を行う(ステップS107)。図19はカラースキャナにより入力された画像から原稿画像を切り出した例を示す図である。切り出しは、原稿画像領域検出手段36により求めた縦方向および横方向それぞれの両端の座標(上端、下端、右端、左端)を4つの角とする矩形により、元の画像領域から新しい画像領域を切り出し、記憶手段30へ格納する。これにより、図19に示すように、カラースキャナ1により入力された画像40から原稿画像41が取得できる。
以上のように、本実施の形態における画像入力システムによれば、読み取る原稿が、カラースキャナ1の読取部10の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿画像部分のみを切り出して取得することが可能である。
また、原稿画像を含む多値画像データをブライトネス補正、コントラスト補正またはガンマ補正すると、原稿画像領域とその読み取り時の背景色との極わずかな差がなくなってしまう可能性があるが、本実施の形態における画像処理システムでは、これらの補正前に輪郭強調を行うので、この極わずかな差を認識して傾きを補正することが可能である。
また、本実施の形態における画像処理システムでは、注目画素の周りの所定サイズの領域内の状況に応じて動的にしきい値を算出することにより、原稿画像を含む多値画像データ全体の背景色のむらに関係なく、エッジが最もはっきりと認識でき、かつノイズの少ない2値化画像を得ることができる。これにより、より正確な傾き補正を行うことができる。
本発明は、画像データを入力するコンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法として有用である。特に、本発明は、読み取る原稿が、読取装置の原稿読取部の背景色とあまり差異がない場合や、原稿画像領域に特徴がない場合等であっても、読み取った原稿画像の傾きを補正し、原稿領域にて切り出すことが可能な点で好適である。
1 カラースキャナ
2 コンピュータ
10 読取部
11 外部I/F
12 CPU
13 ROM
14 RAM
20 ディスプレイ
21 操作入力部
22 外部I/F
23 ハードディスク
24 CPU
25 ROM
26 RAM
30 記憶手段
31 画像データ取得手段
32 輪郭強調手段
33 2値化手段
34 傾き検出手段
35 傾き補正手段
36 原稿画像領域検出手段
37 原稿画像領域切出手段
40 画像
41 原稿画像
2 コンピュータ
10 読取部
11 外部I/F
12 CPU
13 ROM
14 RAM
20 ディスプレイ
21 操作入力部
22 外部I/F
23 ハードディスク
24 CPU
25 ROM
26 RAM
30 記憶手段
31 画像データ取得手段
32 輪郭強調手段
33 2値化手段
34 傾き検出手段
35 傾き補正手段
36 原稿画像領域検出手段
37 原稿画像領域切出手段
40 画像
41 原稿画像
Claims (7)
- 原稿画像を含む多値画像データを取得する第1ステップと、
前記多値画像データの輪郭強調処理を行う第2ステップと、
前記輪郭強調処理後の多値画像データを2値化する第3ステップと、
前記2値化後の画像データから前記原稿画像の領域の傾きを検出する第4ステップと、
前記原稿画像の領域の傾きに基づいて前記2値化後の画像データの傾きを補正する第5ステップと、
前記傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて
前記原稿画像の領域を検出する第6ステップとをコンピュータに実行させるためのコンピュータプログラム。 - 前記第2ステップにおける輪郭強調処理は、前記多値画像データとして、ブライトネス補正、コントラスト補正およびガンマ補正を行う前の多値画像データを用いることを特徴とする請求項1記載のコンピュータプログラム。
- 前記第3ステップは、前記多値画像データ中で順次2値化を行う各注目画素について、それぞれ各注目画素の周りの所定サイズの領域内で動的にしきい値を算出しながらこの算出したしきい値により2値化を行うことを特徴とする請求項1または2に記載のコンピュータプログラム。
- 前記第4ステップは、前記2値化後の画像データをY方向に検索し、最初に黒画素から白画素へまたは白画素から黒画素へ変化する画素の集合をエッジの候補とし、このエッジの候補上の各2画素を結ぶ線分と前記エッジの候補上の各画素との距離が所定の長さ以内にある画素の数を算出し、この数が最大となる2画素を結ぶ線分をエッジとし、このエッジの傾きを前記2値化後の画像データの傾きとすることを特徴とする請求項1から3のいずれかに記載のコンピュータプログラム。
- 原稿画像を含む多値画像データを取得する手段と、
前記多値画像データの輪郭強調処理を行う手段と、
前記輪郭強調処理後の多値画像データを2値化する手段と、
前記2値化後の画像データから前記原稿画像の領域の傾きを検出する手段と、
前記原稿画像の領域の傾きに基づいて前記2値化後の画像データの傾きを補正する手段と、
前記傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて前記原稿画像の領域を検出する手段とを有することを特徴とする画像入力装置。 - 原稿を読み取る読取装置と、
請求項5記載の画像入力装置とを含むことを特徴とする画像入力システム。 - 原稿画像を含む多値画像データを取得する第1ステップと、
前記多値画像データの輪郭強調処理を行う第2ステップと、
前記輪郭強調処理後の多値画像データを2値化する第3ステップと、
前記2値化後の画像データから前記原稿画像の領域の傾きを検出する第4ステップと、
前記原稿画像の領域の傾きに基づいて前記2値化後の画像データの傾きを補正する第5ステップと、
前記傾き補正後の画像データの縦方向および横方向それぞれのヒストグラムに基づいて前記原稿画像の領域を検出する第6ステップとを含むことを特徴とする画像入力方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006007087A JP2007189577A (ja) | 2006-01-16 | 2006-01-16 | コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006007087A JP2007189577A (ja) | 2006-01-16 | 2006-01-16 | コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007189577A true JP2007189577A (ja) | 2007-07-26 |
Family
ID=38344430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006007087A Pending JP2007189577A (ja) | 2006-01-16 | 2006-01-16 | コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007189577A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009152901A (ja) * | 2007-12-20 | 2009-07-09 | Konica Minolta Business Technologies Inc | 画像処理装置および画像処理方法 |
JP2009218953A (ja) * | 2008-03-11 | 2009-09-24 | Pfu Ltd | 画像処理装置、画像処理方法および画像処理プログラム |
WO2017033275A1 (ja) * | 2015-08-25 | 2017-03-02 | 株式会社日立情報通信エンジニアリング | 画像読取装置および画像読取方法ならびに画像読取プログラム |
JP2018535393A (ja) * | 2015-09-16 | 2018-11-29 | サーモ エレクトロン サイエンティフィック インストルメンツ リミテッド ライアビリティ カンパニー | 画像分析システム及び方法 |
JP2020178192A (ja) * | 2019-04-16 | 2020-10-29 | 株式会社リコー | エッジ検出装置、傾き補正装置、読取装置、画像処理装置およびエッジ検出方法 |
-
2006
- 2006-01-16 JP JP2006007087A patent/JP2007189577A/ja active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009152901A (ja) * | 2007-12-20 | 2009-07-09 | Konica Minolta Business Technologies Inc | 画像処理装置および画像処理方法 |
JP4502001B2 (ja) * | 2007-12-20 | 2010-07-14 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および画像処理方法 |
US8285043B2 (en) | 2007-12-20 | 2012-10-09 | Konica Minolta Business Technologies, Inc. | Image processing apparatus and image processing method |
JP2009218953A (ja) * | 2008-03-11 | 2009-09-24 | Pfu Ltd | 画像処理装置、画像処理方法および画像処理プログラム |
DE102008052601A1 (de) | 2008-03-11 | 2010-06-17 | Pfu Ltd., Kahoku | Bildprozessor, Bildverarbeitungsverfahren und Computerprogrammprodukt |
US8477390B2 (en) | 2008-03-11 | 2013-07-02 | Pfu Limited | Image processor, image processing method, and computer program product |
CN107211068A (zh) * | 2015-08-25 | 2017-09-26 | 株式会社日立信息通信工程 | 图像读取装置、图像读取方法及图像读取程序 |
JPWO2017033275A1 (ja) * | 2015-08-25 | 2017-08-31 | 株式会社日立情報通信エンジニアリング | 画像読取装置および画像読取方法ならびに画像読取プログラム |
WO2017033275A1 (ja) * | 2015-08-25 | 2017-03-02 | 株式会社日立情報通信エンジニアリング | 画像読取装置および画像読取方法ならびに画像読取プログラム |
KR20170140313A (ko) * | 2015-08-25 | 2017-12-20 | 주식회사 히타치 정보통신 엔지니어링 | 화상 판독 장치 및 화상 판독 방법 및 화상 판독 프로그램 |
EP3258681A4 (en) * | 2015-08-25 | 2018-03-28 | Hitachi Information & Telecommunication Engineering, Ltd. | Image reading apparatus, image reading method, and image reading program |
US10091392B2 (en) | 2015-08-25 | 2018-10-02 | Hitachi Information & Telecommunication Engineering, Ltd. | Image reading device, image reading method, and image reading program |
CN107211068B (zh) * | 2015-08-25 | 2019-05-03 | 株式会社日立信息通信工程 | 图像读取装置、图像读取方法及图像读取程序 |
KR102001331B1 (ko) * | 2015-08-25 | 2019-07-17 | 주식회사 히타치 정보통신 엔지니어링 | 화상 판독 장치 및 화상 판독 방법 및 매체에 저장된 화상 판독 컴퓨터 프로그램 |
JP2018535393A (ja) * | 2015-09-16 | 2018-11-29 | サーモ エレクトロン サイエンティフィック インストルメンツ リミテッド ライアビリティ カンパニー | 画像分析システム及び方法 |
US11057599B2 (en) | 2015-09-16 | 2021-07-06 | Thermo Electron Scientific Instruments Llc | Image analysis system and method |
JP7139243B2 (ja) | 2015-09-16 | 2022-09-20 | サーモ エレクトロン サイエンティフィック インストルメンツ リミテッド ライアビリティ カンパニー | 画像分析システム及び方法 |
JP2020178192A (ja) * | 2019-04-16 | 2020-10-29 | 株式会社リコー | エッジ検出装置、傾き補正装置、読取装置、画像処理装置およびエッジ検出方法 |
JP7211238B2 (ja) | 2019-04-16 | 2023-01-24 | 株式会社リコー | エッジ検出装置、傾き補正装置、読取装置、画像処理装置およびエッジ検出方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8849042B2 (en) | Image processing apparatus, rectangle detection method, and computer-readable, non-transitory medium | |
US8559748B2 (en) | Edge detection | |
US8254683B2 (en) | Code image processing method | |
JP4955096B2 (ja) | 検出装置、検出方法、検出プログラム、および記録媒体 | |
US7715628B2 (en) | Precise grayscale character segmentation apparatus and method | |
JP6099457B2 (ja) | 画像処理装置、領域決定方法及びコンピュータプログラム | |
US20160050338A1 (en) | Skew detection | |
EP2974261A2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
JP2009252115A (ja) | 画像抽出装置、及び画像抽出プログラム | |
JP6021665B2 (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
US6771842B1 (en) | Document image skew detection method | |
JP2007189577A (ja) | コンピュータプログラム、画像入力装置、画像入力システムおよび画像入力方法 | |
KR101011908B1 (ko) | 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치 | |
JP2022066697A (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
JPS63205783A (ja) | 画調識別装置 | |
JP2010250387A (ja) | 画像認識装置、及びプログラム | |
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム | |
JPH05284356A (ja) | 画像情報2値化方法および画像情報2値化 | |
JP4209804B2 (ja) | 画像処理装置および画像処理方法ならびに記憶媒体、プログラム | |
CN107680046A (zh) | 影像矫正方法、装置、存储介质和计算机设备 | |
JP5024006B2 (ja) | 画像処理プログラム及び画像処理装置 | |
JP3260891B2 (ja) | エッジ抽出方法 | |
JP2859603B2 (ja) | 画像データの2値化方法および装置 | |
JP2024067743A (ja) | 画像比較システムおよび画像比較プログラム | |
JP2024067741A (ja) | 画像比較システムおよび画像比較プログラム |