JP4692764B2 - 画像傾き検出装置および画像傾き検出処理プログラム - Google Patents

画像傾き検出装置および画像傾き検出処理プログラム Download PDF

Info

Publication number
JP4692764B2
JP4692764B2 JP2006136482A JP2006136482A JP4692764B2 JP 4692764 B2 JP4692764 B2 JP 4692764B2 JP 2006136482 A JP2006136482 A JP 2006136482A JP 2006136482 A JP2006136482 A JP 2006136482A JP 4692764 B2 JP4692764 B2 JP 4692764B2
Authority
JP
Japan
Prior art keywords
angle
block
image
detection
hough transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006136482A
Other languages
English (en)
Other versions
JP2007310466A (ja
Inventor
邦和 上野
晃一 藤井
俊輔 小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2006136482A priority Critical patent/JP4692764B2/ja
Publication of JP2007310466A publication Critical patent/JP2007310466A/ja
Application granted granted Critical
Publication of JP4692764B2 publication Critical patent/JP4692764B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像の傾きを検出する技術に関するものである。
旧来より画像の傾きを検出するための技術が多数案出され、実際に利用されてきている。代表的なものとして、以下のような従来技術がある。まず特許文献1に記載されている傾き検出技術は、角度θを順次変更しながら文書画像をθだけ回転させ、回転画像中に含まれる全黒画素を含む外接矩形を作成し、その外接矩形の面積が最小となる角度θを画像の傾き角とするものである。また特許文献2に記載されている技術は、黒画素の連結性から外接矩形を作成し。各外接矩形の一つの頂点について種々の方位に投影したヒストグラムを求め、最大頻度となる角度をスキュー角とするものである。
別の方法として、例えば特許文献3に記載されている方法では、画像データをエッジ処理してから2値化し、2値画像に対してハフ変換を施し、ハフ変換により得られたパラメータ空間(ρ−θ平面)上で頻度が所定値以上となる座標グループを生成し、その座標グループから画像の角度を推定している。
特開平2−170280号公報 特開平6−203202号公報 特開平11−328408号公報
本発明は、多大な処理時間を要することなく、簡単な処理によって精度よく画像の傾きを検出することができる画像傾き検出装置と、そのような画像傾き検出装置の機能をコンピュータに実行させる画像傾き検出処理プログラムを提供することを目的とするものである。
本発明は、傾きの検出対象となる画像に対して多階層のウェーブレット空間変換を行い、階層の深い方から順に、低周波ブロック(LLブロック)をハフ変換し、ハフ変換によって得られたρ−θ平面の2次元ヒストグラムを作成し、該2次元ヒストグラムのピークから画像の角度を検出してゆくことを特徴とするものである。
より具体的には、ハフ変換によって得られたρ−θ平面の2次元ヒストグラムから、最大頻度となる検知角度とその検知角度の分散値を求め、分散値が所定の閾値以下のときには、その検知角度をその階層における画像の角度として検出する。また、分散値が所定の閾値より大きい場合には、最大頻度となる検知角度から、検知角度が垂直に近ければ水平方向が高周波で垂直方向が低周波のブロック(HLブロック)を選択し、検知角度が水平に近ければ垂直方向が高周波で水平方向が低周波のブロック(LHブロック)を選択してハフ変換し、その階層における角度を検出することができる。このような処理を、深い階層から浅い階層へと順に行えばよい。
また本発明は、傾きの検出対象となる画像に対してウェーブレット空間変換を行い、ウェーブレット空間の低周波ブロック(LLブロック)をハフ変換して概略角度を検出した後、その概略角度が垂直に近ければ水平方向が高周波で垂直方向が低周波のブロック(HLブロック)を選択し、前記検知角度が水平に近ければ垂直方向が高周波で水平方向が低周波のブロック(LHブロック)を選択してハフ変換し、画像の角度を検出することを特徴とするものである。この場合も、多階層のウェーブレット空間変換を行い、階層の深い方から順に処理を行い、より詳細な角度を検出するように構成することもできる。
さらに本発明は、上述のような画像傾き検出装置の機能をコンピュータに実行させることを特徴とするものである。
本発明によれば、多階層にウェーブレット空間変換を行うことにより、深い階層では低周波ブロックのサイズは小さくなるため、高速な角度検出処理が可能である。また、例えば画像中に網点部分が存在していても網点がつぶれ、またノイズもつぶれたり除去されるため、これらの影響を受けずに角度を検出することができる。このとき、低周波ブロックを用いることによっても、さらにノイズの影響を受けずに角度を検出することができる。なお、深い階層ではブロックのサイズが小さいため、深い階層の低周波ブロックのみでは画像の角度としてはそれほどの精度が得られないが、深い階層から順に詳細に角度を求めてゆく階層的な角度検知を行うことによって、画像の傾きを精度よく求めることができるという効果がある。
また、低周波ブロックをハフ変換して角度を検出した後、その角度から縦あるいは横方向のいずれかが高周波で他方が低周波のブロック(LHブロックまたはHLブロック)のいずれか一方を選択してハフ変換して角度を検出したり、あるいは、低周波ブロック以外のブロックを合成して、より詳細な角度を検出するように構成しても、高速に精度よく画像の傾きを求めることができるという効果がある。
図1は、本発明の実施の一形態を示すブロック図である。図中、1はウェーブレット変換部、2は角度検出部である。ウェーブレット変換部1は、傾きの検出対象となる画像に対して多階層のウェーブレット空間変換を行う。
角度検出部2は、ウェーブレット変換部1で変換した各階層の少なくとも低周波ブロック(LLブロック)をハフ変換し、変換結果から画像の角度を検出する。より具体的には、ウェーブレット空間変換の結果得られる低周波ブロックについて、2値化してハフ変換を施し、得られたρ−θ平面の2次元ヒストグラムを作成する。この2次元ヒストグラムから各検知角度の分散値を求める。分散値が小さければρ−θ平面に点がまとまっていることを示し、角度がある程度定まっているものと判断できる。従って、分散値が所定の閾値以下のときに、最大頻度となる検知角度を画像の角度として検出する。分散値が所定の閾値より大きい場合には、ある角度に特定できない場合を示しており、その場合には、低周波ブロック以外のブロックを用いることができる。例えば、低周波ブロックをハフ変換して得られた2次元ヒストグラムから最大頻度となる角度を求めておき、低周波ブロック以外の、縦あるいは横方向のいずれかが高周波で他方が低周波のブロック(LHブロックまたはHLブロック)のいずれか一方を選択して2値化およびハフ変換して、低周波ブロックから求めた角度から所定範囲内で角度を検出する。LHブロックは水平成分を多く含み、HLブロックは垂直成分を多く含むので、低周波ブロックから得られた最大頻度となる角度が水平に近ければLHブロックを用い、垂直に近ければHLブロックを用いて、より詳細な角度検出を行えばよい。
そして、このような処理を、最も深い階層から浅い階層へ、階層的に順に角度を決定してゆく。このとき、ある階層で求めた角度をもとに、その角度を含む候補範囲を設定し、次の階層ではその候補範囲について細かい角度でのハフ変換を行って角度を検出してゆく。これにより、検出される角度は正しい角度へ次第に修正されてゆくことになり、最終的に精度よく画像の傾き角度を検出することができる。
上述の本発明の実施の一形態について、さらに説明してゆく。図2は、ウェーブレット変換部1において行うウェーブレット空間変換の説明図である。11〜16はフィルタ部である。一般的なウェーブレット空間変換は図2(A)に示すような構成により行われる。ここでは、1階層のみについて示している。フィルタ部11〜16は、フィルタ処理およびサブサンプリングを行うものであり、‘H’はハイパスフィルタ処理を、‘G’はローパスフィルタ処理を、それぞれ行う。また、‘↓2’は2画素に対して1画素を間引くサブサンプリングを行うことを示している。
まず、入力された画像に対して主走査方向に隣り合う2画素毎に、フィルタ部11ではハイパスフィルタ処理を行って1画素を間引く。またフィルタ部12ではローパスフィルタ処理を行って1画素を間引く。
フィルタ部11で処理された画像は、今度は副走査方向に隣り合う2画素毎に、フィルタ部13でハイパスフィルタ処理を行い、1画素を間引く。これにより主走査方向および副走査方向ともハイパスフィルタ処理を行って、主走査方向および副走査方向とも半分の解像度となった画像(HHブロック)が生成される。同様にフィルタ部14でローパスフィルタ処理を行い、1画素を間引く。これにより、主走査方向についてはハイパスフィルタ処理、副走査方向についてはローパスフィルタ処理を施した、主走査方向および副走査方向とも半分の解像度となった画像(HLブロック)が生成される。
また、フィルタ部12で処理された画像は、今度は副走査方向に隣り合う2画素毎に、フィルタ部15でハイパスフィルタ処理を行い、1画素を間引く。これにより、主走査方向についてはローパスフィルタ処理、副走査方向についてはハイパスフィルタ処理を施した、主走査方向および副走査方向とも半分の解像度となった画像(LHブロック)が生成される。同様に、フィルタ部16でローパスフィルタ処理を行い、1画素を間引く。これにより、主走査方向および副走査方向ともローパスフィルタ処理を行って、主走査方向および副走査方向とも半分の解像度となった画像(LLブロック)が生成される。
このようなウェーブレット空間変換によって、図2(B)に示した画像から図2(C)に示すようにLLブロック、HLブロック、LHブロック、HHブロックの4つのブロックが生成される。上述のような生成過程から分かるように、HHブロックには高周波成分が分離されており、細かに変化する画像成分が分離される。また、例えばノイズなどもこのHHブロックに分離される。HLブロックは、主走査方向にハイパスフィルタ処理、副走査方向にはローパスフィルタ処理を施したので、主走査方向については細かに変化するが、副走査方向には変化が緩やかな成分が分離される。例えば、副走査方向に延びる線分などがこのHLブロックに分離される。逆にLHブロックは、主走査方向にローパスフィルタ処理、副走査方向にはハイパスフィルタ処理を施したので、主走査方向については変化が緩やかであり、副走査方向には細かに変化する成分が分離される。例えば、主走査方向に延びる線分などがこのLHブロックに分離される。LLブロックは主走査方向および副走査方向ともにローパスフィルタ処理を行っているので低周波成分が分離されており、画像全体としての傾向がこのLLブロックに反映されている。従って、このLLブロックを参照することによって、画像全体としてどのような傾向にあるかが分かり、本発明においてはこのLLブロックから角度を検知している。
多階層のウェーブレット空間変換を行う場合には、上述のようにして得られた4つのブロックのうちのLLブロックを図2(A)に示した構成の入力として、処理を繰り返せばよい。2階層のウェーブレット空間変換を行った結果を図2(D)に示している。1回目の結果には‘1’を付し、2回目の結果には‘2’を付して示してある。太線で示したLL1ブロックについて再度のウェーブレット空間変換を行い、LL2、HL2、LH2、HH2ブロックを生成している。もちろん、同様にして3回以上のウェーブレット空間変換を行ってもよい。なお、説明の都合上、以下の例では2階層のウェーブレット空間変換を行うものとする。ウェーブレット変換部1では、入力された傾き検知の対象となる画像に対して、上述のような一般的な多階層のウェーブレット空間変換を行い、その結果を角度検出部2に渡す。
角度検出部2では、ウェーブレット変換部1から渡された、ウェーブレット空間変換された画像を受け取り、最下層の階層から順に角度を検出して行き、より詳細な角度を求めてゆく。各階層での角度の検出は、少なくとも低周波成分が分離されたLLブロックをハフ変換し、変換結果から画像の角度を検出する。
図3は、一般的なハフ変換の説明図である。ハフ変換は、x−y座標系における直線をρ−θ座標系(極座標系)における1点に変換するものである。変換式は、
ρ=X・cosθ+Y・sinθ
である。ρ、θが一意に決まれば(すなわちρ−θ座標系における1点は)、X、Yにおける一次式となり、x−y座標系における直線となる。
ハフ変換では、x−y座標系における1点(X,Y)は、上述の変換式からX、Yに依存した三角関数式となり、ρ−θ座標系における曲線となる。このとき、図3(A)に示すようにx−y座標系における直線上の複数の点についてのρ−θ座標系における曲線は、図3(B)に示すように1点で交差する。従って、この交点を見つけてx−y座標系における直線を求めれば、画像中に存在する直線成分の角度が得られることになる。
もちろん、画像中には様々な直線成分が存在するため、ρ−θ座標系においては多数の交点が存在することになる。そのため、例えば2値画像のそれぞれの黒画素について変換した曲線の軌跡をρ−θ座標系における座標毎に計数してρ−θ座標系における2次元ヒストグラムを作成し、ヒストグラムのピークや分散値などから、画像中の直線成分を推測し、角度を検出すればよい。
角度検出部2では、LLブロックをハフ変換の処理対象としているため、高周波成分、特にノイズなどの影響を受けにくく、また解像度が低くなっているため細かい部分はつぶれており、従って作成した2次元ヒストグラムにおいてピークができやすく、画像全体の傾向として角度を検出することができる。例えば網点部分などは、高周波成分としてHHブロックに分離され、LLブロックについてはローパスフィルタ処理およびサブサンプリングの際につぶされたり消去されてしまうため、個々の網点が角度の検出に影響することはない。
また、LLブロックの大きさは元の画像(あるいは1つ上の階層のLLブロック)の1/4であり、変換すべき画素数も少ないため高速に処理を行うことができる。例えば図2(D)に示したLL2ブロックであれば、元の画像の1/16の画素しかなく、高速に処理を行うことができる。
例えばウェーブレット変換部1において2階層のウェーブレット空間変換を行った場合、角度検出部2ではLL2ブロックについて上述のようにしてハフ変換を行い、角度を検出することができる。しかし、LL2ブロックは上述のように元の画像の1/16しかなく、サブサンプリングによりつぶれも生じているため、得られた角度の精度が低い可能性がある。このとき、上述の2次元ヒストグラムにおいてピークの分散値を求めると、分散値が小さい場合(例えば分散値が所定の閾値以下の場合)には、ピークがはっきりと表れていることを示すため、得られた角度は精度よく求められていると言える。しかし分散値が大きい場合(例えば分散値が所定の閾値より大きい場合)には、ピークがそれほどはっきりと表れておらず、従って得られた角度はそれほど精度よく求められていない可能性がある。このような場合には、さらに精度よく角度を求める処理を行う。
さらに精度よく角度を求める方法として、1つ上の階層のLLブロックを用い、既に得られている角度を含む候補範囲でハフ変換を行い、精度を高めてゆくことができる。もちろんそのまま1つ上の階層の処理に移行してもよいが、ここでは、1つ上の階層の処理に移行する前に同じ階層の他のブロックを用いて精度を高める処理を行う。
図2で説明したように、ウェーブレット空間変換を行うとHLブロックには垂直成分が、LHブロックには水平成分が含まれている。従って、ρ−θ平面の2次元ヒストグラムから得られた最大頻度の点に対応する画像の角度が垂直に近ければHLブロックを用い、水平に近ければLHブロックを用いることによって、さらに詳細な角度を検出することができる。例えばLLブロックから得られた角度が0°〜45°または135°〜180°であれば水平に近いと判断してLHブロックを用い、45°〜135°であれば垂直に近いと判断してHLブロックを用い、ハフ変換して角度を検出すればよい。このとき、LLブロックから得られた角度を含む候補範囲でハフ変換および角度の検出を行ってもよい。
あるいは、LLブロックを除くHLブロック、LHブロック、HHブロックを合成し、LLブロックから得られた角度を含む候補範囲でハフ変換および角度の検出を行うこともできる。例えばローパスフィルタ処理およびサブサンプリングによってつぶれたり白抜けが大きく発生している場合、高周波成分を利用することにより、さらに詳細な角度を検出することが可能である。このとき、候補範囲を設定しておけば、ノイズなどで全く異なる角度が検出されることはない。
このようにLLブロック以外のブロックを用いて得られた角度を、当該階層における角度とし、その角度を1つ上の階層において修正してゆくことにより精度よく画像の角度を求めることができる。なお、例えば上述の2次元ヒストグラムから求めたピークの分散値が十分小さい場合には、それより上位の階層についての処理を行うことなく、最終的な画像の角度として出力することができる。また、十分な精度が得られれば、1層のみにおいてLLブロックからの角度検出とLLブロック以外のブロックからの角度検出の処理のみで、最終的な画像の角度としてもよい。
図4および図5は、本発明の実施の一形態における動作の一例を示すフローチャートである。ここでは図2(D)に示すように2階層のウェーブレット空間変換をウェーブレット変換部1で行った場合に、角度検出部2で行う処理の一例について示している。図4は最下層(LL2、HL2、LH2、HH2)に対する角度検出の処理、図5はその上層(LL1、HL1、LH1、HH1)に対する角度検出の処理を示している。
角度検出部2は、まず、最下層の低周波ブロックであるLL2ブロックを用いて角度検出処理を行う。S51において、LL2ブロックを2値化する。そしてS52において、2値化したLL2ブロックについてハフ変換を行い、ρ−θ平面の2次元ヒストグラムを作成する。このとき作成する2次元ヒストグラムは、0°≦θ≦180°の範囲で作成する必要がある。範囲が広いため、処理速度などを考慮して、どの程度の精度で角度を求めるかを決めておけばよい。例えば数度単位のヒストグラムでもよい。ここでは3°単位で2次元ヒストグラムを作成した。
S53において、S52で作成した2次元ヒストグラムから最大頻度の(ρ,θ)を求める。これをmax(ρLL2 ,θLL2 )とする。また、このmax(ρLL2 ,θLL2 )についての分散値VLL2 を算出する。なお、この分散値VLL2 はθLL2 について求めるだけでもよい。
S54において、S53で求めたmax(ρLL2 ,θLL2 )についての分散値VLL2 が、所定の閾値THより大きいか否かを判定し、閾値TH以下である場合には十分な精度で角度が検出できたものとして、S55において、max(ρLL2 ,θLL2 )のθLL2 を入力された画像の傾き角度として出力し、処理を終える。これにより、以降の処理を行わなくてよいので、処理時間を短縮することができる。なお、さらに詳細に角度を求めるため、LL1ブロックの処理(S71)へ移行してもよい。
分散値VLL2 が所定の閾値THより大きい場合には、θLL2 を画像の角度として採用するには十分な精度ではないとして、この例では同じ階層のLLブロック以外のブロック、特にHLブロックかLHブロックのいずれかを用いて、さらに角度を求める。S56において、max(ρLL2 ,θLL2 )のθLL2 が0°<θLL2 <45°または135°<θLL2 <180°か否かを判断する。この角度の場合には傾きが水平に近いので、S57において処理対象をLH2ブロックとし、LH2ブロックを2値化する。S58において、2値化したLH2ブロックについてハフ変換を行い、ρ−θ平面の2次元ヒストグラムを作成する。このとき作成する2次元ヒストグラムも、S52と同様の精度で作成すればよい。あるいは、S56の条件の範囲内で精度を高めて2次元ヒストグラムを作成してもよい。ここではS52と同様、3°単位で2次元ヒストグラムを作成した。
S59において、S58で作成した2次元ヒストグラムから最大頻度の(ρ,θ)を求める。これをmax(ρLH2 ,θLH2 )とする。また、このmax(ρLH2 ,θLH2 )についての分散値VLH2 を算出する。なお、この分散値VLH2 についても、θLH2 に対して求めればよい。
S60において、S59で求めたmax(ρLH2 ,θLH2 )についての分散値VLH2 が、所定の閾値THより大きいか否かを判定し、閾値TH以下である場合には十分な精度で角度が検出できたものとして、S61において、max(ρLH2 ,θLH2 )のθLH2 を入力された画像の傾き角度として出力し、処理を終える。この場合も、ここまでの処理で終了させることにより、傾き検出のための処理時間を短縮することができる。なお、さらに詳細に角度を求めるため、LL1ブロックの処理(S71)へ移行してもよい。
分散値VLH2 が所定の閾値THより大きい場合には、θLH2 を画像の角度として採用するには十分な精度ではないとして、さらに詳細に角度を求めるため、LL1ブロックの処理(S71)へ移行する。
S56でmax(ρLL2 ,θLL2 )のθLL2 が0°<θLL2 <45°または135°<θLL2 <180°ではないと判断された場合、すなわち45°<θLL2 <135°の場合には、傾きが垂直に近いので、S62において処理対象をHL2ブロックとし、HL2ブロックを2値化する。S63において、2値化したHL2ブロックについてハフ変換を行い、ρ−θ平面の2次元ヒストグラムを作成する。このとき作成する2次元ヒストグラムも、S58と同様の精度で作成すればよい。
S64において、S63で作成した2次元ヒストグラムから最大頻度の(ρ,θ)を求める。これをmax(ρHL2 ,θHL2 )とする。また、このmax(ρHL2 ,θHL2 )についての分散値VHL2 を算出する。なお、この分散値VHL2 についても、θHL2 に対して求めればよい。
S65において、S64で求めたmax(ρHL2 ,θHL2 )についての分散値VHL2 が、所定の閾値THより大きいか否かを判定し、閾値TH以下である場合には十分な精度で角度が検出できたものとして、S66において、max(ρHL2 ,θHL2 )のθHL2 を入力された画像の傾き角度として出力し、処理を終える。これにより、傾き角度の検出処理時間を短縮することができる。なお、さらに詳細に角度を求めるため、LL1ブロックの処理(S71)へ移行してもよい。
分散値VHL2 が所定の閾値THより大きい場合には、θHL2 を画像の角度として採用するには十分な精度ではないとして、さらに詳細に角度を求めるため、LL1ブロックの処理(S71)へ移行する。
次にS71以降の処理により、これまで求めた角度をもとにして次の階層(LL1、HL1、LH1、HH1)に対する角度検出の処理を行う。S71において、LL1ブロックを2値化する。そしてS72において、2値化したLL1ブロックについてハフ変換を行い、ρ−θ平面の2次元ヒストグラムを作成する。このとき作成する2次元ヒストグラムは、S79やS84(またはS73)で求めた角度を含む候補範囲について、詳細に2次元ヒストグラムを作成する。例えば、先に求めた角度を中心に±3°の範囲を候補範囲とし、0.1°単位で2次元ヒストグラムを作成した。
S73において、S72で作成した2次元ヒストグラムから最大頻度の(ρ,θ)を求める。これをmax(ρLL1 ,θLL1 )とする。また、このmax(ρLL1 ,θLL1 )についての分散値VLL1 を算出する。なお、この分散値VLL1 はθLL1 について求めるだけでもよい。
S74において、S73で求めたmax(ρLL1 ,θLL1 )についての分散値VLL1 が、所定の閾値THより大きいか否かを判定し、閾値TH以下である場合には十分な精度で角度が検出できたものとして、S75において、max(ρLL1 ,θLL1 )のθLL1 を入力された画像の傾き角度として出力し、処理を終える。この時点で傾き角度を出力できれば、以降の処理を行わない分だけ処理時間を短縮することができる。
分散値VLL1 が所定の閾値THより大きい場合には、θLL1 を画像の角度として採用するには十分な精度ではないとして、この例では同じ階層のLLブロック以外のブロック、特にHLブロックかLHブロックのいずれかを用いて、さらに角度を求める。S76において、max(ρLL1 ,θLL1 )のθLL1 が0°<θLL1 <45°または135°<θLL1 <180°か否かを判断する。この角度の場合には傾きが水平に近いので、S77において処理対象をLH1ブロックとし、LH1ブロックを2値化する。S78において、2値化したLH1ブロックについてハフ変換を行い、ρ−θ平面の2次元ヒストグラムを作成する。このとき作成する2次元ヒストグラムも、S72と同様の精度で作成すればよい。あるいは、S73で得られた角度をもとに候補範囲を狭め、精度を高めて2次元ヒストグラムを作成してもよい。ここではS72と同様の候補範囲で、0.1°単位で2次元ヒストグラムを作成した。
S79において、S78で作成した2次元ヒストグラムから最大頻度の(ρ,θ)を求める。これをmax(ρLH1 ,θLH1 )とする。S80において、max(ρLH1 ,θLH1 )のθLH1 を入力された画像の傾き角度として出力し、処理を終える。
S76でmax(ρLL1 ,θLL1 )のθLL1 が0°<θLL1 <45°または135°<θLL1 <180°ではないと判断された場合、すなわち45°<θLL1 <135°の場合には、傾きが垂直に近いので、S81において処理対象をHL1ブロックとし、HL1ブロックを2値化する。S82において、2値化したHL1ブロックについてハフ変換を行い、ρ−θ平面の2次元ヒストグラムを作成する。このとき作成する2次元ヒストグラムも、S78と同様の候補範囲及び精度で作成すればよい。
S83において、S82で作成した2次元ヒストグラムから最大頻度の(ρ,θ)を求める。これをmax(ρHL1 ,θHL1 )とする。S84において、max(ρHL1 ,θHL1 )のθHL1 を入力された画像の傾き角度として出力し、処理を終える。
このように、多階層のウェーブレット変換を行って階層的に角度を検出することによって、精度よく画像の傾き角度を検出することができる。しかも、元の画像のままで同じ精度で角度を検出する場合に比べて高速に検出することができる。
なお、上述の動作例では分散値の判定を行うための閾値を区別していないが、同じであってもよいし、各階層や、各階層のLLブロックとLH、HLブロックに対する閾値を異ならせてもよい。もちろん、それぞれを任意に設定することができる。
また、この例では2階層の場合について示したが、3階層以上であっても同様にして階層的に角度を検出することができる。さらに、LHブロックまたはHLブロックを用いずにLLブロックのみにより階層的に角度を検出することもできる。あるいは、LHブロック、HLブロック、HHブロックを合成してハフ変換し、2次元ヒストグラムを作成して最大頻度の(ρ,θ)から当該階層の角度を求めてもよい。
図6は、本発明の画像傾き検出装置の機能をコンピュータプログラムで実現した場合におけるコンピュータプログラム及びそのコンピュータプログラムを格納した記憶媒体の一例の説明図である。図中、21はプログラム、22はコンピュータ、31は光磁気ディスク、32は光ディスク、33は磁気ディスク、34はメモリ、41は光磁気ディスク装置、42は光ディスク装置、43は磁気ディスク装置である。
上述の各実施の形態で説明した各部の機能の一部または全部を、コンピュータにより実行可能なプログラム21によって実現することが可能である。その場合、そのプログラム21およびそのプログラムが用いるデータなどは、コンピュータが読み取り可能な記憶媒体に記憶することも可能である。記憶媒体とは、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気等のエネルギーの変化状態を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。例えば、光磁気ディスク31,光ディスク32(CDやDVDなどを含む)、磁気ディスク33,メモリ34(ICカード、メモリカードなどを含む)等である。もちろんこれらの記憶媒体は、可搬型に限られるものではない。
これらの記憶媒体にプログラム21を格納しておき、例えばコンピュータ22の光磁気ディスク装置41,光ディスク装置42,磁気ディスク装置43,あるいは図示しないメモリスロットにこれらの記憶媒体を装着することによって、コンピュータからプログラム21を読み出し、本発明の画像傾き検出装置の機能を実行することができる。あるいは、ネットワークなどを介してプログラム21をコンピュータ22に転送し、実行させてもよい。
もちろん、一部の機能についてハードウェアによって構成することもできるし、すべてをハードウェアで構成してもよい。あるいは、他の構成とともに本発明も含めたプログラムとして構成することも可能である。例えば複写機などの画像形成装置における制御プログラムとともに1つのプログラムとして構成し、原稿の傾きを検知するように構成することもできる。もちろん、他の用途に適用する場合には、その用途におけるプログラムとの一体化も可能である。
本発明の実施の一形態を示すブロック図である。 ウェーブレット変換部1において行うウェーブレット空間変換の説明図である。 一般的なハフ変換の説明図である。 本発明の実施の一形態における動作の一例を示すフローチャートである。 本発明の実施の一形態における動作の一例を示すフローチャート(続き)である。 本発明の画像傾き検出装置の機能をコンピュータプログラムで実現した場合におけるコンピュータプログラム及びそのコンピュータプログラムを格納した記憶媒体の一例の説明図である。
符号の説明
1…ウェーブレット変換部、2…角度検出部、11〜16…フィルタ部、21…プログラム、22…コンピュータ、31…光磁気ディスク、32…光ディスク、33…磁気ディスク、34…メモリ、41…光磁気ディスク装置、42…光ディスク装置、43…磁気ディスク装置。

Claims (8)

  1. 傾きの検出対象となる画像に対して多階層のウェーブレット空間変換を行う変換手段と、各階層の低周波ブロックをハフ変換し前記画像の角度を検出する検出手段を有し、前記検出手段は、ハフ変換によって得られたρ−θ平面の2次元ヒストグラムを作成し、該2次元ヒストグラムのピークから前記画像の角度を検出することを特徴とする画像傾き検出装置。
  2. 前記検出手段は、階層の最も深い低周波ブロックをハフ変換して角度を検出した後、所定の精度まで順に階層の深い側から低周波ブロックをハフ変換して角度を修正してゆくことを特徴とする請求項1に記載の画像傾き検出装置。
  3. 前記検出手段は、階層が浅いほど細かい角度でハフ変換を行い、ある階層について、前の階層で得られた角度をもとに候補範囲を設定し、該候補範囲について細かい角度でのハフ変換を行って角度を求めることを特徴とする請求項2に記載の画像傾き検出装置。
  4. 前記検出手段は、前記2次元ヒストグラムから各検知角度の分散値を求め、分散値が所定の閾値以下のときに最大頻度となる検知角度を前記画像の角度として検出することを特徴とする請求項1ないし請求項3のいずれか1項に記載の画像傾き検出装置。
  5. 前記検出手段は、前記2次元ヒストグラムから最大頻度となる検知角度および該検知角度の分散値を求め、分散値が所定の閾値より大きい場合には、前記検知角度が垂直に近ければ水平方向が高周波で垂直方向が低周波のブロックHLブロック)を選択し、前記検知角度が水平に近ければ垂直方向が高周波で水平方向が低周波のブロック(LHブロック)を選択してハフ変換し、角度を検出することを特徴とする請求項1ないし請求項4のいずれか1項に記載の画像傾き検出装置。
  6. 前記検出手段は、前記2次元ヒストグラムから最大頻度となる検知角度および各検知角度の分散値を求め、分散値が所定の閾値より大きい場合には、低周波ブロック以外のブロックを合成して前記検知角度を含む候補範囲についてハフ変換し、角度を検出することを特徴とする請求項1ないし請求項4のいずれか1項に記載の画像傾き検出装置。
  7. 傾きの検出対象となる画像に対してウェーブレット空間変換を行う変換手段と、ウェーブレット空間の低周波ブロックをハフ変換して概略角度を検出し前記概略角度が垂直に近ければ水平方向が高周波で垂直方向が低周波のブロックHLブロック)を選択し、前記検知角度が水平に近ければ垂直方向が高周波で水平方向が低周波のブロック(LHブロック)を選択してハフ変換し前記画像の角度を検出する検出手段を有することを特徴とする画像傾き検出装置。
  8. コンピュータに、入力された画像の傾きを検出する処理を実行させる画像傾き検出処理プログラムであって、請求項1ないし請求項のいずれか1項に記載の画像傾き検出装置の機能をコンピュータに実行させることを特徴とする画像傾き検出処理プログラム。
JP2006136482A 2006-05-16 2006-05-16 画像傾き検出装置および画像傾き検出処理プログラム Expired - Fee Related JP4692764B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006136482A JP4692764B2 (ja) 2006-05-16 2006-05-16 画像傾き検出装置および画像傾き検出処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006136482A JP4692764B2 (ja) 2006-05-16 2006-05-16 画像傾き検出装置および画像傾き検出処理プログラム

Publications (2)

Publication Number Publication Date
JP2007310466A JP2007310466A (ja) 2007-11-29
JP4692764B2 true JP4692764B2 (ja) 2011-06-01

Family

ID=38843284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006136482A Expired - Fee Related JP4692764B2 (ja) 2006-05-16 2006-05-16 画像傾き検出装置および画像傾き検出処理プログラム

Country Status (1)

Country Link
JP (1) JP4692764B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110233947A (zh) * 2018-03-05 2019-09-13 光宝电子(广州)有限公司 图像角度检测的方法及其图像处理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227406A (ja) * 2003-01-24 2004-08-12 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体
JP2004236230A (ja) * 2003-01-31 2004-08-19 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328408A (ja) * 1998-05-12 1999-11-30 Advantest Corp データ処理装置および方法、情報記憶媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227406A (ja) * 2003-01-24 2004-08-12 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体
JP2004236230A (ja) * 2003-01-31 2004-08-19 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体

Also Published As

Publication number Publication date
JP2007310466A (ja) 2007-11-29

Similar Documents

Publication Publication Date Title
Lu et al. Safetynet: Detecting and rejecting adversarial examples robustly
KR101117837B1 (ko) 멀티 스케일 지향 패치를 이용한 멀티 이미지 특징 매칭
US9292739B1 (en) Automated recognition of text utilizing multiple images
US10839508B2 (en) Integrated circuit image alignment and stitching
US20130058569A1 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US20140125666A1 (en) Apparatus and method for generating depth map of stereoscopic image
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
CN105205486A (zh) 一种车标识别方法及装置
CN111353961B (zh) 一种文档曲面校正方法及装置
Chen et al. Binary Image Steganalysis Based on Distortion Level Co-Occurrence Matrix.
US20160245641A1 (en) Projection transformations for depth estimation
US20080025643A1 (en) Image processing system, method for processing image and computer readable medium
JPWO2018147059A1 (ja) 画像処理装置、および画像処理方法、並びにプログラム
Sommer et al. Primitect: Fast continuous hough voting for primitive detection
CN1411046A (zh) 图形评价装置、图形评价方法及程序
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
Wang et al. A Target Corner Detection Algorithm Based on the Fusion of FAST and Harris
JP4692764B2 (ja) 画像傾き検出装置および画像傾き検出処理プログラム
US10580127B2 (en) Model generation apparatus, evaluation apparatus, model generation method, evaluation method, and storage medium
CN115953399B (zh) 基于轮廓特征与svdd的工业部件结构性缺陷检测方法
Shapiro et al. On hausdorff distance measures
US20100158381A1 (en) Image processing device, image processing method, and computer readable medium
JP2007323381A (ja) 画像傾き検出装置、画像処理装置、画像傾き検出プログラム、画像処理プログラム
JP2005182164A (ja) 画像領域判定方法、ならびにその方法を利用可能な画像領域判定装置、画像補正装置および電子透かし抽出装置
JP4716029B2 (ja) 画像属性判別装置及び画像属性判別プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4692764

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees