JP4509512B2 - スキュー検知 - Google Patents
スキュー検知 Download PDFInfo
- Publication number
- JP4509512B2 JP4509512B2 JP2003303546A JP2003303546A JP4509512B2 JP 4509512 B2 JP4509512 B2 JP 4509512B2 JP 2003303546 A JP2003303546 A JP 2003303546A JP 2003303546 A JP2003303546 A JP 2003303546A JP 4509512 B2 JP4509512 B2 JP 4509512B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- run
- erosion
- length
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Facsimile Scanning Arrangements (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Input (AREA)
- Image Processing (AREA)
Description
「ダイレーション(dilation)」(膨張)の操作即ち演算は、「構造要素Bが点x上に変換される場合に、それは画像オブジェクトAを定義するセット即ち組と相互作用を行うか?」という質問に対する解答を探し出すものである。構造要素Bを使用する画像オブジェクトAのダイレーションはδ1,B(A)と書くことが可能である。画像オブジェクトは繰返しダイレーションを行うことが可能である。ダイレーションがn回繰返される場合には、寸法nのダイレーションが実施されたと言われ、その結果はΔn,B(A)と書かれる。
エロージョン(erosion)はダイレーションに対して相補的なものである。「エロージョン(erosion)」(収縮)の操作即ち演算は、「構造要素Bが点x上に変換される場合に、その構造要素は画像オブジェクトAを定義するセット即ち組内に完全に包含されるか否か?」という質問に対する解答を求めるものである。構造要素Bを使用しての画像オブジェクトAのエロージョンは、ε1,B(A)と書くことが可能である。画像は繰返しエロージョン処理することが可能であり、且つεn,B(A)はn回エロージョン処理された画像Aを示す。
オープニング(opening)操作は、エロージョンとそれに続くダイレーションとから構成されている(これはダイレーションとそれに続くエロージョンと等価なものではない、以下の「クロージング(closing)」参照)。画像Aが構造要素Bによってオープニングされる場合には、その結果γ1,B(A)は多様な態様で表わすことが可能である。
クロージング(closing)操作はダイレーションとそれに続くエロージョンとから構成されている。クロージング操作即ち演算は、オープニング操作の二重操作(逆ではない)である。画像Aが構造要素Bによってクロージングされる場合、その結果φ1,B(A)は多様な態様で表わすことが可能である。
1.ランレングス平滑化アルゴリズムをドキュメント画像に対して適用し、且つ
2.これらの異なる角度で配向されたリニア構造要素を使用してエロージョン処理された場合のランレングス平滑化画像の表面積を決定することにより、異なる角度に対して、ランレングス平滑化した画像におけるラインが与えられた角度にあることの確率を調査する、
ことを包含している。本発明方法は、スキュー推定のみならずスキュー補正も包含するように拡張させることも可能である。
本発明に基づくスキュー推定方法のランレングス平滑化ステップにおいて、リニア構造要素を使用して画像Aをクロージング処理することにより、ドキュメント画像Aをランレングス平滑化処理することが可能である。好適には、構造要素k1L0を使用し、それは水平リニアセグメントである(L0は単位長さの水平リニアセグメントであり、k1はスケーリングパラメータである)。スケーリングパラメータk1の値は臨界的なものではないと考えられる。テキストドキュメントの場合には、k1は、好適には、テキスト中の典型的なワードとほぼ同一の寸法である。適宜の場合において、この寸法はドキュメント画像を発生するスキャナのdpiから評価することが可能である。一方、例えば、黒白画像内に存在する全ての接続したコンポーネント(即ち、文字)に対する取囲みボックスの寸法を計算することにより計算することが可能である。然しながら、k1に対して所定の値を設定することにより、スキュー推定における適宜のレベルの精度を得ることが可能であり、且つ全体的な方法をより速くレンダリングさせることが可能である。
画像Aを角度αで配向しているリニア構造要素k2Lαを使用してエロージョンする場合に、その結果は、構造要素の配向αが画像Aにおける支配的なラインの角度と一致する場合に、最大表面積を有している。従って、関数ρ(α)は以下の如くに定義することが可能である。
図1はドキュメント画像A(図1a)を示しており、且つランレングス平滑化し、次いで異なる角度に配向された構造要素を使用してこの画像をエロージョン処理した結果を例示している。図1(a)のドキュメント画像は−3゜のスキュー角度を有している。
本発明のスキュー角度推定方法を実現する場合に、計算を高速化させるために行うことが可能な多数の簡単化及び近似が存在している。
ダイレーション及びエロージョンの操作はフーリエ変換を使用して実施することが可能であり、そのことについては、J.E. Mazille著「数学的モルフォロジー及びコンボルーション(Mathematical morphology and convolution)」、ジャーナル・オブ・マイクロスコピー出版、156(1):3−13、1989年10月、及びM. Killinger、J.L. de bougrenet de la Tocnaye、P. Cambon及びC. Le Moing著「フーリエ変換フォログラムを使用したモルフォロジーフィルタ処理(Morthological filtering using a Fourier Transform hologram)」、オプテックス・コミュニケーションズ出版、73(6):434−438、1989年11月において説明されている。従って、本発明のスキュー推定方法は、Mazille及びKilinger et al.によって説明されている態様で、本発明に基づく方法により必要とされるダイレーション操作及びエロージョン走査を実施するために現在使用可能な高速フーリエ変換を利用することにより迅速且つ効率的な態様で実現することが可能である。
ラインセグメントである構造要素を使用してグレイスケール画像のダイレーション及びエロージョンを計算する場合、画像ピクセルあたりの最小/最大の比較の数は、M.van Herk著「矩形状及び直交カーネルに関する局所的最小及び最大フィルタに対する高速アルゴリズム(A fast algorithm for local minimum and maximum filters on rectangular and orthogonal kernels)」、パターン・レコグニション・レターズ、13:517−521、1992年の文献によって提案されている反復的アルゴリズムを使用して、ラインセグメントの長さに拘わらずに、3へ減少させることが可能である。このアルゴリズムは、P. Soille、E.J. Breen及びR. Jones著「任意の角度における個別的なラインに沿ってのエロージョン及びダイレーションの反復的実現(Recursive implementaton of erosions and dirations along discrete rines at arbitary angles)」、IEEE・トランズアクションズ・オン・PAMI、18(5):562−566、1996年の文献において説明されているように、任意の角度に配向されたリニア構造要素が関与するダイレーション及びエロージョンを計算する場合に適用することが可能である。ダイレーション及びエロージョンを実施する場合に、これらの反復的アルゴリズムを利用することは本発明に取って有益的である。
上の記述において、本発明のランレングス平滑化ステップ及びライン方向調査ステップがリニア構造要素を利用する面を期待している。理解すべきことであるが、このことはラインセグメントとすることが可能であるが、それは、又、主要な方向を有するその他の構造とすることも可能である。例えば、ライン方向調査ステップにおいて、構造要素k2P1,υを使用することも可能であり尚P1,υは次式から派生することが可能である。
ドキュメント画像のスキュー(skew)角度が推定/検知されると、例えば、簡単な回転アルゴリズムを実現することにより自動的にスキューを補正することは簡単明瞭なことである。スキュー補正した画像における位置(x,y)におけるピクセルに対する正しい値を計算するために、スキューした画像における対応するピクセルのオリジナルの位置(xold,yold)は次式を使用して計算される。
Claims (18)
- ドキュメント画像におけるスキュー角度を推定する方法において、
ドキュメント画像(A)をランレングス平滑化し、
複数個の異なる角度(α)の各々において配向されたリニア構造要素(k2Lα)により前記ランレングス平滑化した画像(RLSA)のエロージョンを決定し、それにより前記エロージョンを発生した画像の表面積が最大である角度を決定し、前記角度を前記ドキュメント画像のスキュー角度として指定する、
上記各ステップを有しており、
前記ドキュメント画像をランレングス平滑化するステップが、リニア構造要素(k 1 L)を使用して前記ドキュメント画像をクロージングすることを包含しており、
前記ドキュメント画像(A)をランレングス平滑化するステップが、複数個の異なるランレングス平滑化画像(RLSA α )を発生することを包含しており、前記ランレングス平滑化画像(RLSA α )の各々が前記複数個の異なる角度のうちの夫々の1つ(α i )に配向したリニア構造要素(k 1 L α )を使用して前記ドキュメント画像(A)をクロージングすることにより発生する、ことを包含しており、且つ
前記ランレングス平滑化した画像にエロージョンを発生するステップが、夫々のランレングス平滑化した画像(RLSA α )を発生する前記クロージング操作において使用したリニア構造要素と同じ角度(α i )に配向しているリニア構造要素(k 2 L α )を使用して前記複数個の異なるランレングス平滑化画像(RLSA α )の各々にエロージョンを発生させることを包含している、
方法。 - 請求項1において、前記エロージョンを発生するステップにおいて適用される前記又は各々のリニア構造要素が特定の角度関係を具備している一対の点(P1,v)から構成されていることを特徴とする方法。
- 請求項1乃至2のうちのいずれか1項において、前記エロージョンを発生するステップが、前記ランレングス平滑化画像の共分散(K)を決定することを包含していることを特徴とする方法。
- 請求項1乃至3のうちのいずれか1項において、前記エロージョンを発生するステップが、ランレングス平滑化画像のエロージョンが計算される角度の数を減少させるためにエロージョンが発生される画像の表面積が最大である角度を決定するために一次元最適化アルゴリズムを適用することを包含していることを特徴とする方法。
- 請求項4において、前記一次元最適化アルゴリズムを適用する前に前記ドキュメント画像をサブサンプリングするステップを有していることを特徴とする方法。
- 請求項1乃至5のうちのいずれか1項において、グレイスケールドキュメント画像に対して適用され、前記ランレングス平滑化及びエロージョン発生ステップにおいてダイレーション及びエロージョン操作を実施するために反復アルゴリズムを使用することを特徴とする方法。
- 請求項1乃至6のうちのいずれか1項において、二進ドキュメント画像に対して適用され、前記リニア構造要素が対数的に分解され、且つ前記ドキュメント画像のピクセルの並列処理を使用してダイレーション及び/又はエロージョン操作を実施することを特徴とする方法。
- 請求項1乃至7のうちのいずれか1項において、前記ランレングス平滑化及びエロージョン発生ステップにおいてダイレーション及びエロージョン操作を実施するために高速フーリエ変換を使用することを特徴とする方法。
- スキュー角度推定装置において、
ドキュメント画像(A)をランレングス平滑化すべく適合されている手段、
前記ドキュメント画像のスキュー角度として指定されるべき角度であってエロージョンが発生した画像の表面積が最大である角度を決定するために複数個の異なる角度の各々において配向されているリニア構造要素によりランレングス平滑化した画像(RLSA)のエロージョンを決定すべく適合されている手段、
を有しており、
前記ランレングス平滑化手段がリニア構造要素を使用して前記ドキュメント画像をクロージングすべく適合されており、
前記ランレングス平滑化手段が複数個の異なるランレングス平滑化画像(RLSA α )を発生すべく適合されており、前記異なるランレングス平滑化画像(RLSA α )の各々は前記複数個の異なる角度のうちの夫々の1つ(α)において配向されているリニア構造要素を使用してドキュメント画像(A)をクロージングすることにより発生され、
前記エロージョンを発生する手段が、夫々のランレングス平滑化画像(RLSA α )を発生する場合に前記ランレングス平滑化手段によって使用されるリニア構造要素と同じ角度(α)に配向されているリニア構造要素を使用して前記複数個の異なるランレングス平滑化画像(RLSA α )の各々にエロージョンを発生させるべく適合されている、
ことを特徴とする装置。 - 請求項9において、前記エロージョンを発生する手段により適用される前記又は各リニア構造要素が特定の角度関係を具備している一対の点から構成されていることを特徴とする装置。
- 請求項9乃至10のうちのいずれか1項において、前記エロージョンを発生する手段が、前記ランレングス平滑化画像の共分散(K)を決定すべく適合されている手段を有していることを特徴とする装置。
- 請求項9乃至11のうちのいずれか1項において、前記エロージョンを発生する手段が前記ランレングス平滑化画像のエロージョンが計算される角度の数を減少させるために前記エロージョンを発生させる画像の表面積が最大である角度を決定するために一次元最適化アルゴリズムを適用する手段を有していることを特徴とする装置。
- 請求項12において、前記一次元最適化アルゴリズムを適用する前に、前記ドキュメント画像をサブサンプリングすべく適合されているサブサンプリング手段を有していることを特徴とする装置。
- 請求項9乃至13のうちのいずれか1項において、前記ランレングス平滑化手段及びエロージョン発生手段が、前記ドキュメント画像がグレイスケール画像である場合にダイレーション及びエロージョン操作を実施するために反復アルゴリズムを使用すべく適合されていることを特徴とする装置。
- 請求項9乃至14のうちのいずれか1項において、wビットデータワードに対して前記ドキュメント画像のw個のピクセルを割当て且つビット毎のオペレーターを使用して前記wビットデータワードに対してダイレーション及び/又はエロージョン操作を適用する平滑化処理手段を有していることを特徴とする装置。
- 請求項9乃至15のうちのいずれか1項において、前記ランレングス平滑化手段及びエロージョン発生手段により必要とされるダイレーション及びエロージョン操作を実施するための高速フーリエ変換ユニットを有していることを特徴とする装置。
- 請求項9乃至16のうちのいずれか1項において、特別にプログラムされた汎用コンピュータとして実現されていることを特徴とする装置。
- 汎用コンピュータ上で使用する場合に、前記コンピュータをして請求項1乃至8のうちのいずれか1つのスキュー推定方法のステップを実施させるための1組の命令を有していることを特徴とするコンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02292100 | 2002-08-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004094952A JP2004094952A (ja) | 2004-03-25 |
JP4509512B2 true JP4509512B2 (ja) | 2010-07-21 |
Family
ID=32050105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003303546A Expired - Fee Related JP4509512B2 (ja) | 2002-08-27 | 2003-08-27 | スキュー検知 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7277600B2 (ja) |
JP (1) | JP4509512B2 (ja) |
AT (1) | ATE309583T1 (ja) |
DE (1) | DE60302191T2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007207009A (ja) * | 2006-02-02 | 2007-08-16 | Fujitsu Ltd | 画像処理方法及び画像処理装置 |
US8249391B2 (en) * | 2007-08-24 | 2012-08-21 | Ancestry.com Operations, Inc. | User interface method for skew correction |
US8370759B2 (en) | 2008-09-29 | 2013-02-05 | Ancestry.com Operations Inc | Visualizing, creating and editing blending modes methods and systems |
TWI425444B (zh) * | 2009-02-20 | 2014-02-01 | Avermedia Information Inc | 影像資料歪斜偵測校正方法與裝置 |
US20110052094A1 (en) * | 2009-08-28 | 2011-03-03 | Chunyu Gao | Skew Correction for Scanned Japanese/English Document Images |
CN111062264A (zh) * | 2019-11-27 | 2020-04-24 | 重庆邮电大学 | 一种基于双通路混合卷积网络的文档对象分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02108177A (ja) * | 1988-10-17 | 1990-04-20 | Hitachi Ltd | 画像の傾斜角検出装置 |
JPH02170280A (ja) * | 1988-12-22 | 1990-07-02 | Fuji Xerox Co Ltd | 文書傾き補正装置 |
JPH05143774A (ja) * | 1991-07-16 | 1993-06-11 | Sharp Corp | 文字原稿の傾き補正方法 |
JPH1091723A (ja) * | 1996-09-17 | 1998-04-10 | Toshiba Corp | 区分機及び宛名認識装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276742A (en) * | 1991-11-19 | 1994-01-04 | Xerox Corporation | Rapid detection of page orientation |
US5201011A (en) * | 1991-11-19 | 1993-04-06 | Xerox Corporation | Method and apparatus for image hand markup detection using morphological techniques |
US5848184A (en) * | 1993-03-15 | 1998-12-08 | Unisys Corporation | Document page analyzer and method |
US20030190090A1 (en) * | 2002-04-09 | 2003-10-09 | Beeman Edward S. | System and method for digital-image enhancement |
-
2003
- 2003-08-20 DE DE60302191T patent/DE60302191T2/de not_active Expired - Lifetime
- 2003-08-20 AT AT03077642T patent/ATE309583T1/de not_active IP Right Cessation
- 2003-08-27 JP JP2003303546A patent/JP4509512B2/ja not_active Expired - Fee Related
- 2003-08-27 US US10/648,348 patent/US7277600B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02108177A (ja) * | 1988-10-17 | 1990-04-20 | Hitachi Ltd | 画像の傾斜角検出装置 |
JPH02170280A (ja) * | 1988-12-22 | 1990-07-02 | Fuji Xerox Co Ltd | 文書傾き補正装置 |
JPH05143774A (ja) * | 1991-07-16 | 1993-06-11 | Sharp Corp | 文字原稿の傾き補正方法 |
JPH1091723A (ja) * | 1996-09-17 | 1998-04-10 | Toshiba Corp | 区分機及び宛名認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US20040120604A1 (en) | 2004-06-24 |
JP2004094952A (ja) | 2004-03-25 |
US7277600B2 (en) | 2007-10-02 |
DE60302191D1 (de) | 2005-12-15 |
ATE309583T1 (de) | 2005-11-15 |
DE60302191T2 (de) | 2006-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220292645A1 (en) | Method for restoring video data of drainage pipe based on computer vision | |
US11488308B2 (en) | Three-dimensional object detection method and system based on weighted channel features of a point cloud | |
Bhattacharya et al. | Offline signature verification using pixel matching technique | |
JP3073682B2 (ja) | イメージ内の幾何学的形状を認識するための方法および装置 | |
WO2019041590A1 (zh) | 任意角度的边缘检测方法 | |
JPH11149562A (ja) | 曲線セグメントのコーナーの特性付け | |
WO2017193414A1 (zh) | 一种基于转弯半径的图像角点检测方法 | |
CN108305268B (zh) | 一种图像分割方法及装置 | |
Rezaei et al. | Skew detection of scanned document images | |
CN110060260A (zh) | 一种图像处理方法及系统 | |
CN110675463B (zh) | 一种局部彩色铅笔画生成方法及装置 | |
JP4509512B2 (ja) | スキュー検知 | |
Wu et al. | Pyramid edge detection based on stack filter | |
JPH06274619A (ja) | 画像処理装置 | |
KR102223754B1 (ko) | 객체 이미지 개선 방법 및 장치 | |
CN117593187A (zh) | 基于元学习和Transformer的遥感图像任意尺度超分辨率重建方法 | |
Reddy et al. | Object detection by 2-D continuous wavelet transform | |
Gautam et al. | A GUI for automatic extraction of signature from image document | |
CN115719310A (zh) | 一种眼底图像数据集的预处理方法及眼底图像训练模型 | |
EP1394725B1 (en) | Skew detection in document images | |
Jini et al. | Image Inpainting Using Image Interpolation-An Analysis | |
JPH0628476A (ja) | 画像信号の処理装置 | |
Wang et al. | Detection of underwater objects by adaptive threshold FCM based on frequency domain and time domain | |
Peng et al. | Research on qr 2-d code graphics correction algorithms based on morphological expansion closure and edge detection | |
Qian et al. | Exemplar-based image inpainting algorithm using adaptive sample and candidate patch system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090324 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090624 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090629 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090723 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090728 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090820 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100406 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100428 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4509512 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |