JP4824101B2 - 傾斜画像データを検出及び補正するための方法及び装置 - Google Patents

傾斜画像データを検出及び補正するための方法及び装置 Download PDF

Info

Publication number
JP4824101B2
JP4824101B2 JP2009161658A JP2009161658A JP4824101B2 JP 4824101 B2 JP4824101 B2 JP 4824101B2 JP 2009161658 A JP2009161658 A JP 2009161658A JP 2009161658 A JP2009161658 A JP 2009161658A JP 4824101 B2 JP4824101 B2 JP 4824101B2
Authority
JP
Japan
Prior art keywords
image data
tilt
binary image
correction
frequency signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009161658A
Other languages
English (en)
Other versions
JP2010200288A (ja
Inventor
杜建輝
羅正岳
黄徳▲い▼
呉永煕
Original Assignee
圓展科技股▲分▼有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 圓展科技股▲分▼有限公司 filed Critical 圓展科技股▲分▼有限公司
Publication of JP2010200288A publication Critical patent/JP2010200288A/ja
Application granted granted Critical
Publication of JP4824101B2 publication Critical patent/JP4824101B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20068Projection on vertical or horizontal image axis

Description

本発明は傾斜画像データを検出及び補正するための方法及び装置に関するものであり、特に、画像処理装置において傾斜画像データを検出及び補正するための方法及び装置に関する。
デジタル技術の発展に伴い、文書の画像を読み取って電子ファイルにするための様々な画像処理装置が利用されている。一般的な画像処理装置としては、例えば、スキャナ、プリンタ、コピー機、ファクシミリ装置、書画カメラ等がある。
文書を読み取る又は撮影する処理において文書が斜めに配置されたり、画像処理装置内で文書を搬送する過程で文書が傾いたりすると、容易に傾いた文書画像が得られてしまう。文書解析システムの分野においては、画質を高めるため、傾斜した文書を検出及び補正する技術が重要な役割を担っている。傾斜した文書を検出及び補正する技術における課題は、文書中の非テキストシンボル(グラフ等)を除去することである。非テキストシンボルを除去するには、いくつかの重要な方法がある。第1の方法によると、隣接するピクセルをそれぞれ新しいオブジェクトとして組み合わせ、その後、テキストオブジェクトと予想されるものをカウントして保持し、最後に、残りのオブジェクトを除去する。この第1の方法は通常、大量の記憶容量を必要とする。また、この第1の方法は、テキストサイズ及び画像ノイズが特定の条件に適合する場合しか適用できない。第2の方法によると、テキスト部分が演算により多数のラインに変換され、その後、それらテキストラインの回転角度が計算され、最後に、その回転角度に従って文書の傾斜角が推測される。この第2の方法は、文書内容を無視して文書中の非テキストシンボル(グラフ等)を除去する。文書と背景との色差から認識される四隅や境界に従って、傾斜の程度が得られる。色差が明瞭でない場合や境界が走査範囲外にある場合、第2の方法は適用できない。これらの従来技術は、分類された統計データを記憶するための大量の記憶容量を必要とし、ハードウェアコンポーネントによる実施には適さない。
従って、先行技術が直面している問題点を避けるため、傾斜画像データを検出及び補正するための改良された方法及び装置を提供する必要がある。
本発明の一側面によると、画像処理装置において用いられる、横方向の文字列を含む画像の画像データの傾斜画像データ検出・補正方法が提供される。この傾斜画像データ検出・補正方法は以下のステップを含む。まず、画像データを出力する任意の装置から画像データを受け取り、各ピクセルが1ビットで表現される二値画像データを得るために画像データに対して任意の閾値で二値化処理を行う。次に、二値画像データを任意の複数の異なる回転角度で回転させ、それにより、複数の回転された二値画像データを得る。次に、複数の回転された二値画像データの各横列のピクセル値を各二値画像データ毎に合計し、それにより、複数の二値画像データに対応する複数の横方向ピクセル値分布曲線を得る。次に、横方向ピクセル値分布曲線に含まれる低周波ノイズを除去するためのハイパスフィルタリング処理を行い、それにより、複数の横方向ピクセル値分布曲線に対応する複数の高周波信号曲線を得る。次に、各高周波信号曲線で表される値の平方和を計算して、その計算値である平方和を各高周波信号曲線に対応するインデックス値とし、それにより、複数の高周波信号曲線に対応する複数のインデックス値を得る。その後、複数のインデックス値の中の最大値に対応する回転角度に従って画像データに対する回転補正処理を行い、それにより、補正された画像データを得る。複数のインデックス値の中の最大値に対応する回転角度は、複数のインデックス値の中の最大値のものを得たときにおける、回転された二値画像データを得るために二値画像データを回転させたときの回転角度である。
一実施形態においては、画像データは原画像データを縮小することにより得られる。
一実施形態においては、二値化処理を行う前に、縮小された画像データを複数のn×nセルに分け、半数以上のピクセルが中間レベルからフルブラックレベルの範囲にあるn×nセルの全ピクセルについて輝度反転処理を行い、且つ、n×nセルの境界における高周波ノイズを除去する。さらに、二値化処理を行った後に、n×nセルの境界を隣接ピクセル間の補間又は外挿により再構成する。
一実施形態においては、二値画像データを複数の異なる回転角度で回転させて複数の回転された二値画像データを得るステップは、二値画像データを第1の回転角度で回転させて第1の回転された二値画像データを得るサブステップと、第1の回転角度がサーチ角度範囲内にあれば、二値画像データを第2の回転角度で回転させて第2の回転された二値画像データを得るサブステップと、を含む。
一実施形態においては、各高周波信号曲線で表される値の平方和を計算するステップは、各高周波信号曲線における正の値の部分のみの平方和により実行する。
一実施形態においては、複数のインデックス値の中の最大値に対応する回転角度の正負を反転させた値が、画像データの傾斜角を表す。
本発明の別の側面によると、画像処理装置に備えられる、横方向の文字列を含む画像の画像データの傾斜画像データ検出・補正装置が提供される。この傾斜画像データ検出・補正装置は、傾斜角検出モジュールと画像回転補正モジュールとを含む。傾斜角検出モジュールは、画像データを出力する任意の装置から画像データを受け取って、二値画像データを得るために画像データに任意の閾値で二値化処理を行い、複数の回転された二値画像データを得るために二値画像データを任意の複数の異なる回転角度で回転させ、複数の回転された二値画像データに対応する複数の横方向ピクセル値分布曲線を得るために、回転された二値画像データの各横列のピクセル値を合計し、複数の横方向ピクセル値分布曲線に対応する複数の高周波信号曲線を得るために、複数の横方向ピクセル値分布曲線に含まれる低周波ノイズを除去するためのハイパスフィルタリング処理を行い、複数の高周波信号曲線に対応する複数のインデックス値を得るために各高周波信号曲線で表される値の平方和を計算して、その計算値である平方和を各高周波信号曲線に対応するインデックス値とし、複数のインデックス値の中の最大値に対応する回転角度に従って画像データの傾斜角を検出する。複数のインデックス値の中の最大値に対応する回転角度は、複数のインデックス値の中の最大値のものを得たときにおける、回転された二値画像データを得るために二値画像データを回転させたときの回転角度である。画像回転補正モジュールは、傾斜角検出モジュールと通信して、傾斜角に従って画像データに対する回転補正処理を行うことにより、補正された画像データを得る。
一実施形態においては、画像データは原画像データを縮小することにより得られる。画像回転補正モジュールは、傾斜角に従って原画像データに回転補正処理を行い、それにより、補正された原画像データを得る。
一実施形態においては、傾斜角検出モジュールは、前処理モジュールと、メモリと、投影プロファイル処理部と、ハイパスフィルタと、統計データ収集・傾斜角識別部とを含む。
本発明の上述の内容は、以下の詳細な説明及び添付図面を検討頂ければ、当業者にはより容易に理解されるであろう。
本発明の一実施形態による傾斜画像データ検出・補正装置を示す概略的な機能ブロック図。 本発明による傾斜画像データ検出・補正方法を概略的に説明するフローチャート。 傾きのない純テキスト画像の二値画像データにおける各横列のピクセル値を合計することにより得られた横方向ピクセル値分布曲線を概略的に示す図。 若干傾いた純テキスト画像の二値画像データにおける各横列のピクセル値を合計することにより得られた横方向ピクセル値分布曲線を概略的に示す図。 横方向ピクセル値分布曲線に含まれる低周波ノイズを除去することにより得られた高周波信号曲線を概略的に示す図。 横方向ピクセル値分布曲線に含まれる低周波ノイズを除去することにより得られた高周波信号曲線を概略的に示す図。 画像データに対して輝度反転処理を行う効果を概略的に示す図。 n×nセルの境界における高周波ノイズを除去し、隣接ピクセル間の補間又は外挿によりブランク領域を再構成する処理を概略的に示す図。
以下、実施形態に関して、本発明をより具体的に説明する。なお、本発明の好ましい実施形態についての以下の説明は、あくまで例示を目的とするものであり、網羅的なものではなく、開示されたとおりの形態に限定することを意図したものではない。
図1は、本発明の一実施形態による傾斜画像データ検出・補正装置を示す概略的な機能ブロック図である。この傾斜画像データ検出・補正装置2は、傾斜角検出モジュール21と画像回転補正モジュール22とを含む。原画像データ1が傾斜角検出モジュール21によって処理されると、原画像データ1の傾斜角が認識される。傾斜角に関する情報はその後、傾斜角検出モジュール21から画像回転補正モジュール22に送られる。傾斜角に従って、画像回転補正モジュール22は、原画像データ1に対して回転補正処理を行い、それにより、補正された画像データを得る。補正された画像データは、バックエンドディスプレイ装置31に送られて表示され、又は、記憶装置32に送られて記憶される。
図1に示されるように、傾斜角検出モジュール21は、前処理モジュール210と、メモリ211と、投影プロファイル処理部212と、ハイパスフィルタ213と、統計データ収集・傾斜角識別部214とを備える。
図2は、本発明による傾斜画像データ検出・補正方法を概略的に示すフローチャートである。以下、図1及び図2を参照し、傾斜画像データ検出・補正方法について詳しく説明する。
まず、前処理モジュール210は、原画像データ1を受け取り、その原画像データ1に対して縮小処理を行う(ステップ41)。例えば、原画像データ1は、メモリ使用量を削減するために、256×192ピクセルの解像度に縮小される。この縮小処理を行う手順は省略することもできる。縮小処理を行わない場合、メモリ使用量は相対的に大きくなり、計算負荷が大きくなる。
次に、前処理モジュール210は、縮小された画像データに対して前処理を実行する。本実施形態においては、前処理は、縮小された画像データを処理して二値画像データにするための二値化処理である。二値画像データにおいては、各ピクセルは1ビットで表現される。二値画像データはその後、メモリ211に記憶される(ステップ42)。
次に、投影プロファイル処理部212がメモリ211に記憶された二値画像データを読み出す。そして、投影プロファイル処理部212は、二値画像データの全横列におけるピクセルの値(0又は1)をそれぞれ合計し、それにより、横方向ピクセル値分布曲線を得る。その後、ハイパスフィルタ213が横方向ピクセル値分布曲線に含まれる低周波ノイズを除去し、それにより、高周波信号曲線を得る(ステップ43)。次に、統計データ収集・傾斜角識別部214が高周波信号曲線で表される値の平方和を計算し、それにより、インデックス値を得る(ステップ44)。
次に、統計データ収集・傾斜角識別部214は、メモリ211に記憶された二値画像データを読み出す。そして、二値画像データを特定の回転角度で回転させ、それにより、回転された二値画像データを得る(ステップ45)。特定の回転角度がサーチ角度範囲に入っている場合(ステップ46)、ステップ43及びステップ44を繰り返し、特定の回転角度に対応する別のインデックス値を得る。特定の回転角度がサーチ角度範囲を超えるまで(ステップ46)、得られた全インデックス値の中から最大のインデックス値を選択する。最大インデックス値に対応する回転角度の正負が逆の値(正負を反転させた値)が、画像データの傾斜角を表す(ステップ47)。傾斜角に関する情報はその後、傾斜角検出モジュール21から画像回転補正モジュール22に送られる。画像回転補正モジュール22は、傾斜角に従って、原画像データ1に対する回転補正処理を行い、それにより、補正された画像データを得る。補正された画像データは、バックエンドディスプレイ装置31に送られて表示され、又は、記憶装置32に送られて記憶される。図2に示されるように、傾斜画像データ検出・補正装置2はさらに、アプリケーションプログラムインタフェース30と通信する。アプリケーションプログラムインタフェース30を介して、特定の回転角度及びサーチ角度範囲が統計データ収集・傾斜角識別部214にプリセットされる。
周知のように、文書画像が黒色背景に白色テキストを含むものである場合、従来の方法ではしばしば識別に誤りが生じる。識別に誤りを生じる可能性を最小限に抑えるため、本発明の傾斜画像データ検出・補正方法は、テキスト特性を強調し、ノイズを除去し、非テキストシンボルによる干渉を低減することを試みている。いくつかの実施形態においては、縮小された画像データを二値画像データに処理するステップ(ステップ42)の前に、輝度反転処理を行う。縮小された画像データに含まれる各ピクセルのグレーレベルをフルホワイト(例えばレベル0)からフルブラック(例えばレベル255)の範囲に分ける。n×nセルごとに、半数以上のピクセルが中間レベルからフルブラックレベルの範囲にあれば、輝度反転処理を実行する。例えば、8×8セルの中で少なくとも32ピクセルが中間レベル(例えば128)からフルブラックレベル(例えば255)の範囲にあれば、その8×8セル中の全ピクセルについて輝度反転処理を行う。この輝度反転処理により、識別誤りが最小限に抑えられ、又は解消され、補正精度が向上する。
図5は、画像データに対して輝度反転処理を行う効果を概略的に示している。背景が黒色でテキストが白色の画像51をそのまま二値化処理にかけた場合、二値画像52が得られる。二値画像52においては、テキストシンボルと非テキストシンボル(グラフ等)を識別し難い。8×8セル53に対して上記のように8×8セル単位で輝度反転処理を行うと、輝度が反転された画像54が得られる。続いて、この輝度反転画像54に対して二値化処理を行うと、別の二値画像55が得られる。上記の画像データに対してそのまま二値化処理をかけた二値画像52と比べ、二値画像55のテキスト特性は強調されており、そのため、識別に誤りを生じる可能性が低くなる。
なお、n×nセルの大きさは、要求に応じて、又は縮小された画像データに応じて、変更することができる。但し、輝度反転処理は、隣接するセルの輝度値が互いに大きく異なるため、二値画像に高周波ノイズを生じてしまうことがある。
図6を参照いただきたい。高周波ノイズにより、二値画像6におけるn×nセルの境界にギザギザの線600が生じる場合がある。境界における高周波ノイズをそのまま削除すると、場合によっては二値画像6に格子状のブランク領域601が生じる。隣接ピクセル間の補間(内挿)又は外挿により、8×8セル61のブランク領域601の適切なピクセル値を再構成する。これにより、再構成された画像62に含まれる高周波ノイズを最小限に抑える。
図3Aは、傾きのない純テキスト画像の二値画像データにおける各横列のピクセル値を合計することにより得られた横方向ピクセル値分布曲線を概略的に示す。図3Bは、若干傾いた純テキスト画像の二値画像データにおける各横列のピクセル値を合計することにより得られた横方向ピクセル値分布曲線を概略的に示す。図3Aに示されるように、傾きのない純テキスト画像の横方向投影プロファイル(各横列のピクセル値の合計値)のピーク値(例えば60)は、若干傾いた純テキスト画像の横方向投影プロファイルのピーク値(例えば40)よりも大きい。
横方向投影プロファイルのピーク値は、傾きのない純テキスト画像と若干傾いた純テキスト画像を区別するのに有効であるが、依然として問題点がある。すなわち、画像がテキストシンボルと非テキストシンボルの両方を含む場合、傾斜量の識別に横方向投影プロファイルのピーク値を利用する効果は大幅に減少する。また、本発明の発明者は、横方向投影プロファイルの山と谷が顕著であることを発見した。本発明によると、横方向ピクセル値分布曲線に含まれる(非テキストシンボルに相当する)低周波ノイズはハイパスフィルタ213によって除去され、その結果、(テキストシンボルに対応した)高周波信号曲線が得られる。図4Bに示される傾いた文書の横方向投影プロファイル(における各横列のピクセル値の合計値)又は文書の非テキストシンボル(グラフ等)の横方向投影プロファイル(における各横列のピクセル値の合計値)は、図4Aに示される傾きのない純テキスト画像の横方向投影プロファイル(における各横列のピクセル値の合計値)と比べて小さくなる。ハイパスフィルタ213の一例は有限インパルス応答(FIR)フィルタであるが、これに限られない。
高周波信号曲線は、統計データ収集・傾斜角識別部214に送られる。統計データ収集・傾斜角識別部214は、高周波信号曲線で表される値の平方和を計算し、インデックス値を得る。いくつかの実施形態においては、統計データ収集・傾斜角識別部214は、ピークの重みを増すため、高周波信号曲線における正の値の部分のみの平方和を計算する。
さらに、二値画像データは、サーチ角度範囲内において複数の異なる回転角度で回転される。傾いた文書の傾斜角を判断するために、2段階のサーチ処理を行う。第1段階では、二値画像データを−45度から+45度までのサーチ角度範囲内において5度ずつ回転させることにより、複数の回転された二値画像データを得る。次に、それらの回転角度に対応する複数のインデックス値を得る。こうして得られた全てのインデックス値の中から、第1段階の回転角度に対応する最大インデックス値を選択する。第1段階の回転角度について、−5度から+5度までの別のサーチ角度範囲内で二値画像データを1度ずつ回転させる。次に、それらの回転角度に対応する複数のインデックス値を得る。得られた全インデックス値の中から、第2段階の回転角度に対応する最大インデックス値を選択する。第1段階の回転角度と第2段階の回転角度に従って、傾いた文書の傾斜角を正確に検出することができる。傾斜角に関する情報はその後、傾斜角検出モジュール21から画像回転補正モジュール22に送られる。傾斜角に従って、画像回転補正モジュール22は原画像データ1に対する回転補正処理を行い、それにより、補正された画像データを得る。補正された画像データは、バックエンドディスプレイ装置31に送られて表示され、又は、記憶装置32に送られて記憶される。
上述したように、本発明は、画像処理装置において傾斜画像データを検出及び補正するのに効果的である。画像処理装置には、例えば、スキャナ、プリンタ、コピー機、ファクシミリ装置、書画カメラ等が含まれる。本発明の傾斜画像データ検出・補正方法は、非テキストシンボルを除去する必要がなく、少ないハードウェア資源を用いて傾斜画像を検出・補正することができる。さらに、本発明の装置及び方法は、ハードウェアコンポーネントにより実現できるため、分類された統計データを記憶するための記憶容量が節約される。本発明の傾斜画像データ検出・補正方法は、画像処理装置を有するいかなる光電システムに適用してもよい。
本発明は、現時点で最も実用的かつ好ましいと考えられる実施形態に関して説明したが、本発明は、開示した実施形態に限定されるものではなく、請求項の要旨と範囲に含まれる様々な変形や類似の構成を、そのような全ての変形と類似の構造を含む最も広い解釈に従って、カバーするものであることを意図する。

Claims (12)

  1. 画像処理装置において用いられる、横方向の文字列を含む画像の画像データの傾斜画像データ検出・補正方法であって、
    画像データを出力する任意の装置から画像データを受け取り、各ピクセルが1ビットで表現される二値画像データを得るために前記画像データに対して任意の閾値で二値化処理を行うステップと、
    前記二値画像データを任意の複数の異なる回転角度で回転させ、それにより、複数の回転された二値画像データを得るステップと、
    前記複数の回転された二値画像データの各横列のピクセル値を各二値画像データ毎に合計し、それにより、前記複数の二値画像データに対応する複数の横方向ピクセル値分布曲線を得るステップと、
    前記横方向ピクセル値分布曲線に含まれる低周波ノイズを除去するためのハイパスフィルタリング処理を行い、それにより、前記複数の横方向ピクセル値分布曲線に対応する複数の高周波信号曲線を得るステップと、
    各高周波信号曲線で表される値の平方和を計算して、その計算値である平方和を各高周波信号曲線に対応するインデックス値とし、それにより、前記複数の高周波信号曲線に対応する複数のインデックス値を得るステップと、
    前記複数のインデックス値の中の最大値に対応する回転角度に従って前記画像データに対する回転補正処理を行い、それにより、補正された画像データを得るステップと、を備え、前記複数のインデックス値の中の最大値に対応する回転角度は、前記複数のインデックス値の中の最大値のものを得たときにおける、前記回転された二値画像データを得るステップにおいて前記二値画像データを回転させたときの回転角度であることを特徴とする傾斜画像データ検出・補正方法。
  2. 前記画像データは原画像データを縮小することにより得られることを特徴とする請求項1に記載の傾斜画像データ検出・補正方法。
  3. 前記二値化処理を行う前に、前記縮小された画像データを複数のn×nセルに分け、半数以上のピクセルが中間レベルからフルブラックレベルの範囲にあるn×nセルの全ピクセルについて輝度反転処理を行い、且つ、前記n×nセルの境界における高周波ノイズを除去し、
    前記二値化処理を行った後に、前記n×nセルの境界を隣接ピクセル間の補間又は外挿により再構成する、ことを特徴とする請求項2に記載の傾斜画像データ検出・補正方法。
  4. 前記二値画像データを複数の異なる回転角度で回転させて複数の回転された二値画像データを得るステップは、
    前記二値画像データを第1の回転角度で回転させて第1の回転された二値画像データを得るサブステップと、
    前記第1の回転角度がサーチ角度範囲内にあれば、前記二値画像データを第2の回転角度で回転させて第2の回転された二値画像データを得るサブステップと、を含むことを特徴とする請求項1に記載の傾斜画像データ検出・補正方法。
  5. 前記各高周波信号曲線で表される値の平方和を計算するステップは、前記各高周波信号曲線における正の値の部分のみの平方和により実行することを特徴とする請求項1に記載の傾斜画像データ検出・補正方法。
  6. 前記複数のインデックス値の中の最大値に対応する回転角度の正負を反転させた値が、前記画像データの傾斜角を表すことを特徴とする請求項1に記載の傾斜画像データ検出・補正方法。
  7. 画像処理装置に備えられる、横方向の文字列を含む画像の画像データの傾斜画像データ検出・補正装置であって、
    画像データを出力する任意の装置から画像データを受け取って、二値画像データを得るために前記画像データに任意の閾値で二値化処理を行い、複数の回転された二値画像データを得るために前記二値画像データを任意の複数の異なる回転角度で回転させ、前記複数の回転された二値画像データに対応する複数の横方向ピクセル値分布曲線を得るために前記回転された二値画像データの各横列のピクセル値を合計し、前記複数の横方向ピクセル値分布曲線に対応する複数の高周波信号曲線を得るために、前記複数の横方向ピクセル値分布曲線に含まれる低周波ノイズを除去するためのハイパスフィルタリング処理を行い、前記複数の高周波信号曲線に対応する複数のインデックス値を得るために各高周波信号曲線で表される値の平方和を計算して、その計算値である平方和を各高周波信号曲線に対応するインデックス値とし、前記複数のインデックス値の中の最大値に対応する回転角度に従って前記画像データの傾斜角を検出する、傾斜角検出モジュールと、
    前記傾斜角検出モジュールと通信して、前記傾斜角に従って前記画像データに対する回転補正処理を行うことにより、補正された画像データを得る、画像回転補正モジュールと、を備え
    前記複数のインデックス値の中の最大値に対応する回転角度は、前記複数のインデックス値の中の最大値のものを得たときにおける、前記回転された二値画像データを得るために前記二値画像データを回転させたときの回転角度であることを特徴とする傾斜画像データ検出・補正装置。
  8. 前記画像データは原画像データを縮小することにより得られ、前記画像回転補正モジュールは前記傾斜角に従って前記原画像データに前記回転補正処理を行い、それにより、補正された原画像データを得ることを特徴とする請求項7に記載の傾斜画像データ検出・補正装置。
  9. 前記傾斜角検出モジュールは、
    前記画像データを受け取って、前記二値画像データを得るために前記画像データに対して前記二値化処理を行う前処理モジュールと、
    前記前処理モジュールと通信して、前記二値画像データを記憶するメモリと、
    前記メモリと通信して、前記回転された二値画像データの各横列のピクセル値を合計することにより前記複数の横方向ピクセル値分布曲線を得る、投影プロファイル処理部と、
    前記投影プロファイル処理部と通信して、前記複数の横方向ピクセル値分布曲線に含まれる低周波ノイズを除去するためのハイパスフィルタリング処理を行い、それにより、対応する複数の高周波信号曲線を得る、ハイパスフィルタと、
    前記画像回転補正モジュール、前記ハイパスフィルタ及び前記メモリと通信して、前記二値画像データを複数の異なる回転角度で回転させて前記複数の回転された二値画像データを得、各高周波信号曲線で表される値の前記平方和を計算して前記複数のインデックス値を得、前記複数のインデックス値の中の最大値に対応する回転角度に従って前記画像データの傾斜角を検出し、前記傾斜角を前記画像回転補正モジュールに送信する、統計データ収集・傾斜角識別部と、を備えたことを特徴とする請求項7に記載の傾斜画像データ検出・補正装置。
  10. 前記二値化処理を行う前に、前記縮小された画像データを複数のn×nセルに分け、半数以上のピクセルが中間レベルからフルブラックレベルの範囲にあるn×nセルの全ピクセルについて輝度反転処理を行い、且つ、前記n×nセルの境界における高周波ノイズを除去し、
    前記二値化処理を行った後に、前記n×nセルの境界を、隣接ピクセル間の補間又は外挿により再構成する、ことを特徴とする請求項9に記載の傾斜画像データ検出・補正装置。
  11. 前記統計データ収集・傾斜角識別部は、前記各高周波信号曲線における正の値の部分のみの平方和を計算することを特徴とする請求項9に記載の傾斜画像データ検出・補正装置。
  12. 前記統計データ収集・傾斜角識別部は、前記複数のインデックス値の中の最大値に対応する回転角度の正負を反転させた値を前記画像データの傾斜角として識別することを特徴とする請求項9に記載の傾斜画像データ検出・補正装置。
JP2009161658A 2009-02-20 2009-07-08 傾斜画像データを検出及び補正するための方法及び装置 Active JP4824101B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW098105465 2009-02-20
TW098105465A TWI425444B (zh) 2009-02-20 2009-02-20 影像資料歪斜偵測校正方法與裝置

Publications (2)

Publication Number Publication Date
JP2010200288A JP2010200288A (ja) 2010-09-09
JP4824101B2 true JP4824101B2 (ja) 2011-11-30

Family

ID=42109990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009161658A Active JP4824101B2 (ja) 2009-02-20 2009-07-08 傾斜画像データを検出及び補正するための方法及び装置

Country Status (4)

Country Link
US (1) US8358871B2 (ja)
EP (1) EP2221767B1 (ja)
JP (1) JP4824101B2 (ja)
TW (1) TWI425444B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110038223A (ko) * 2009-10-08 2011-04-14 삼성전자주식회사 스캐너 및 화상형성장치와, 스캐너의 화상 보정 방법
US8571313B2 (en) * 2010-03-22 2013-10-29 Sharp Laboratories Of America, Inc. Methods and systems for estimation of document skew in an image
US9288362B2 (en) * 2014-02-03 2016-03-15 King Fahd University Of Petroleum And Minerals Technique for skew detection of printed arabic documents
TWI543110B (zh) 2015-04-27 2016-07-21 虹光精密工業股份有限公司 產生影像之方法及影像處理設備
CN105095896B (zh) * 2015-07-29 2019-01-08 江苏邦融微电子有限公司 一种基于查找表的图像畸变校正方法
US9621761B1 (en) 2015-10-08 2017-04-11 International Business Machines Corporation Automatic correction of skewing of digital images
CN105426887B (zh) * 2015-10-30 2019-04-12 北京奇艺世纪科技有限公司 一种文本图像校正的方法及装置
CN106131362B (zh) * 2016-07-12 2019-11-26 珠海赛纳打印科技股份有限公司 一种图像处理方法、装置及图像形成设备
JP6999318B2 (ja) * 2017-07-24 2022-01-18 ラピスセミコンダクタ株式会社 撮像装置及び水平方向検出方法
CN111950554A (zh) * 2020-08-17 2020-11-17 深圳市丰巢网络技术有限公司 一种身份证识别方法、装置、设备及存储介质
CN113420762B (zh) * 2021-07-01 2024-02-06 京东科技控股股份有限公司 一种图像处理方法、系统、电子设备及存储介质
TWI810813B (zh) * 2022-02-11 2023-08-01 圓展科技股份有限公司 影像校正系統及方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5521985A (en) * 1992-08-13 1996-05-28 International Business Machines Corporation Apparatus for recognizing machine generated or handprinted text
US5818976A (en) 1993-10-25 1998-10-06 Visioneer, Inc. Method and apparatus for document skew and size/shape detection
US5557784A (en) * 1995-03-30 1996-09-17 International Business Machines Corporation Power on timer for a personal computer system
US6310984B2 (en) 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
JPH11331558A (ja) 1998-05-21 1999-11-30 Dainippon Screen Mfg Co Ltd ページ位置補正方法、装置および記録媒体
JP3876531B2 (ja) 1998-05-28 2007-01-31 富士通株式会社 文書画像の傾き補正方法
FR2810765B1 (fr) 2000-06-27 2002-08-23 Mannesmann Dematic Postal Automation Sa Segmentation d'une image numerique d'un objet postal par la transformation de hough
US6735337B2 (en) * 2001-02-02 2004-05-11 Shih-Jong J. Lee Robust method for automatic reading of skewed, rotated or partially obscured characters
US6985640B2 (en) * 2002-01-07 2006-01-10 Xerox Corporation Parallel non-iterative method of determining and correcting image skew
ATE309583T1 (de) 2002-08-27 2005-11-15 Oce Print Logic Technologies S Ermittlung der schräglage von dokumentenbildern
JP2004128643A (ja) 2002-09-30 2004-04-22 Matsushita Electric Ind Co Ltd 画像の傾き補正方法
US7027666B2 (en) 2002-10-01 2006-04-11 Eastman Kodak Company Method for determining skew angle and location of a document in an over-scanned image
US7133573B2 (en) 2002-11-26 2006-11-07 Eastman Kodak Company Document skew accommodation
US7213140B2 (en) * 2003-10-30 2007-05-01 Micro-Star Int'l Co., Ltd. Method for self-starting a computer
US7336813B2 (en) 2004-04-26 2008-02-26 International Business Machines Corporation System and method of determining image skew using connected components
TWI238645B (en) * 2004-06-08 2005-08-21 Benq Corp Titled angle detection for document image deskew
US20060039627A1 (en) 2004-08-21 2006-02-23 Xerox Corporation Real-time processing of grayscale image data
JP4556813B2 (ja) * 2005-09-08 2010-10-06 カシオ計算機株式会社 画像処理装置、及びプログラム
US7752382B2 (en) * 2005-09-09 2010-07-06 Sandisk Il Ltd Flash memory storage system and method
TW200727126A (en) * 2006-01-12 2007-07-16 Mitac Int Corp Power management method
US8260047B2 (en) * 2008-06-23 2012-09-04 Texas Instruments Incorporated System and method for determining high frequency content in an analog image source
JP5201038B2 (ja) * 2009-03-18 2013-06-05 株式会社Jvcケンウッド 映像信号処理方法及び映像信号処理装置

Also Published As

Publication number Publication date
JP2010200288A (ja) 2010-09-09
TWI425444B (zh) 2014-02-01
EP2221767A1 (en) 2010-08-25
EP2221767B1 (en) 2013-03-27
US20100215285A1 (en) 2010-08-26
TW201032179A (en) 2010-09-01
US8358871B2 (en) 2013-01-22

Similar Documents

Publication Publication Date Title
JP4824101B2 (ja) 傾斜画像データを検出及び補正するための方法及び装置
EP1910994B1 (en) Binarization of an image
JP2871127B2 (ja) 画像処理装置及び方法
JP5566811B2 (ja) プリントアンドスキャン文書の画像評価のためのボケ除去および監視適応的スレッショルディング
US8768052B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US7800661B2 (en) Programmable pattern matching device
CN106780352B (zh) 图像旋转方法、装置及图像形成设备
KR101597739B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP5169994B2 (ja) 画像処理装置、撮像装置及び画像処理方法
JP2003016440A5 (ja)
US7970228B2 (en) Image enhancement methods with consideration of the smooth region of the image and image processing apparatuses utilizing the same
JP3989341B2 (ja) 画像処理装置
JP3604910B2 (ja) 画像縮小装置及び画像縮小プログラムを記録した記録媒体
JPH0950519A (ja) 画像処理装置及び方法
JP2002135623A (ja) ノイズ除去装置及びノイズ除去方法並びにコンピュータ読み取り可能な記録媒体
JP3480887B2 (ja) 画像処理装置および画像処理方法
CN113313642A (zh) 图像去噪方法、装置、存储介质及电子设备
CN111080550B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
WO2019019383A1 (zh) 影像矫正方法、装置、存储介质和计算机设备
CN114679542B (zh) 图像处理方法和电子装置
JP3326309B2 (ja) 画像処理装置
JP3705414B2 (ja) 2値化閾値決定方法
JP3705405B2 (ja) 2値化閾値決定方法
JP5453193B2 (ja) 傾き検出装置、撮像装置および方法
CN116416477A (zh) 一种证件识别方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110811

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4824101

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250