JP2002133424A - 文書の傾き角度及び境界の検出方法 - Google Patents

文書の傾き角度及び境界の検出方法

Info

Publication number
JP2002133424A
JP2002133424A JP2001259634A JP2001259634A JP2002133424A JP 2002133424 A JP2002133424 A JP 2002133424A JP 2001259634 A JP2001259634 A JP 2001259634A JP 2001259634 A JP2001259634 A JP 2001259634A JP 2002133424 A JP2002133424 A JP 2002133424A
Authority
JP
Japan
Prior art keywords
image
boundary
document
contour
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001259634A
Other languages
English (en)
Inventor
Yongchun Lee
ヨンチュン・リー
Peter Rudak
ピーター・ルダック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JP2002133424A publication Critical patent/JP2002133424A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Image Input (AREA)
  • Image Analysis (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 ノイズのある背景を有する環境でのあらゆる
種類の文書の形状についての自動文書傾き角度検出,境
界検出及び境界除去のための方法を提供する。 【解決手段】 ラスター走査様式の線形CCD配列によ
り文書イメージを取得し、取得されたグレーイメージか
らイメージのエッジ画素を検出するステップを有する方
法であって、上記連続イメージ輪郭画素は、トレースさ
れグループ分けされる。また、最大の連続輪郭画素成分
が、走査された文書ページのアウトライン成分として選
択される。選択された輪郭成分は、走査されたページの
傾き角度及び境界を得るために分析される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、概して、文書を走
査することに、より詳しくは、スキャナ上の文書の傾き
角度を検出し、デジタル化されたイメージを方向付けし
直すことに関する。
【0002】
【従来の技術】用紙の文書が生産スキャナにより走査さ
れる場合、結果として得られるデジタルイメージは、し
ばしば斜めに傾いている。イメージが斜めに傾く原因と
しては、文書が適切に供給されなかったこと、あるい
は、用紙の搬送機構が1直線になっていないことがあ
る。文書イメージの傾きは、イメージの観察に際して、
不愉快な印象をもたらす。更に、それによって、光学式
の文字認識,文書分割及び文書分析は、一層複雑にな
る。したがって、文書走査システムにおいては、自動イ
メージ傾き検出及び補正が、求められる特徴である。
【0003】
【発明が解決しようとする課題】生産走査環境におい
て、走査されるべき堆積した文書は、しばしば、異なる
サイズの用紙を含んでいる。CCDスキャン幅を全ての
文書サイズに適合するように調整することは不可能であ
る。文書の切れ(カットオフ)を回避するために、CC
G走査幅は、しばしば、文書より広い範囲を走査可能な
ように設定される。このことは、デジタルイメージ内の
元の文書を取り囲む、黒又は白の所望でない境界をもた
らす。元の文書の様相及びサイズに一致するデジタルバ
ージョンを作成するには、システムにおける境界の検出
及び除去機能が必要である。
【0004】2つの米国特許第5,818,976号の
文書の傾き及びサイズ/形状検出用の方法及び装置と第
5,901,253号のイメージ切取り及び傾き補正を
備えたイメージ処理システムとは、走査された文書に関
する傾き角度検出及びイメージ境界検出について記述す
るものである。両方法の短所は、文書の傾き角度を評価
し、文書のページを位置決めするために、汚れていない
一様な背景の境界が必要とされることである。例えば回
転式走査等の高速の生産走査の環境では、背景の境界
が、しばしば、先の文書及びその後に続く文書の両方の
部分を含み、塵や埃によって,グレースケールにおいて
ノイズを伴ってあらわれる。隣接した文書イメージの干
渉および背景の境界のノイズは、従来の解決手段を、高
速の走査システムにて実際に遂行することを困難にす
る。境界検出における従来技術の他の短所は、矩形でな
い文書又は写真を扱う上で制限があることである。
【0005】本発明は、上記技術的課題に鑑みてなされ
たもので、高速生産スキャナにおける隣接した走査ペー
ジの干渉およびノイズ等の、ノイズのある背景を有する
環境での、あらゆる種類の文書の形状についての、自動
文書傾き角度検出,境界検出及び境界除去から構成され
る方法を提供することを目的とする。
【0006】
【課題を解決するための手段】簡単に、本発明の1つの
様相によれば、生産スキャナにより走査される文書の傾
き角度及び境界の検出用の方法が提供され、該方法は、
(a)ページ開始の信号を検出し、(b)イメージライ
ンを取得し、(c)ページ終了の信号の終了について調
べ、(d)ページ終了の信号が検出されれば、ステップ
(h)へ進み、ページ終了の信号が検出されなければ、
ステップ(e)へ進み、(e)イメージのエッジ画素を
検出し、(f)単一パスの連続輪郭画素成分の分析を実
行し、(g)ステップ(b)へ進み、(h)上記連続輪
郭画素成分を収集し、(i)最大成分を選択し、(j)
文書の傾き角度及び境界を得るために、上記最大成分を
分析するステップを有している。
【0007】本発明の他の様相によれば、ラスター走査
様式の線形CCD配列により文書イメージを取得し、取
得されたグレーイメージからイメージのエッジ画素を検
出するステップを有する方法が提供される。上記連続イ
メージ輪郭画素は、トレースされグループ分けされる。
また、最大連続輪郭画素成分が、走査された文書ページ
のアウトライン成分として選択される。選択された輪郭
成分は、走査されたページの傾き角度及び境界を得るた
めに分析される。
【0008】
【発明の実施の形態】以下、本発明の実施の形態につい
て、添付図面を参照しながら説明する。図1は、走査さ
れたページの信号の開始(S1,S2,S3,S
4,...)および走査されたページの終了(E1,E
2,E3,E4,...)を信号で合図する電子デバイ
スがオフである場合の、高速生産スキャナにより取得さ
れる最終的なイメージの図式的な例である。走査された
各ページは、異なる傾きの方向を有している可能性があ
る。背景の黒色境界12は、走査の進行中に、塵又は埃
が光源の照明経路をブロックすることにより、背景ノイ
ズ14及び垂直ライン16を含んでいる。高速の用紙搬
送及びキャプチャの為、あらゆる2つの連続したイメー
ジ18,20が、非常に短い時間間隔で代わる代わる取
得され、また、取得された2つのページのイメージ間の
間隔は非常に小さく、更に、現行ぺージのイメージの内
容が、それより前のまた次のページのイメージの一部を
含む可能性がある。
【0009】走査では、S信号(すなわちS1,S2,
S3,S4)が、通常、新しいページ18のキャプチャ
を開始すべく、スキャナを起動させ、E信号(すなわち
E1,E2,E3,E4)がページのキャプチャを停止
させる。S及びE信号は、走査された各ぺージを大まか
に位置決めするためのものである。図2は、次のページ
のイメージ(イメージ#2)の上側の一部22及びノイ
ズも含む、キャプチャされたイメージ#1の領域を示し
ている。図3に示されるようなキャプチャされた現行の
イメージ20は、先のページのイメージ18の一部19
と、次のページのイメージ24の一部23と、いくらか
の所望でない背景ノイズ14を含んでいる。
【0010】現行ページのイメージの傾き角度及び境界
を検出するための、本発明の方法の処理ステップが、図
4に示される。ページ開始信号(Si)(ステップ3
0)は、新しい走査ページの開始を促し、ページの終わ
りの信号(Ei)が検出される(ステップ34)まで用
紙の文書が移動させられつつ、ライン毎のイメージのキ
ャプチャ(ステップ32)を開始させる。走査中、全て
の走査ラインについて、イメージのエッジ画素を検出す
るプロセス(ステップ36)が実施され、単一パスの連
続輪郭画素成分の分析が、その連続輪郭画素をグループ
分けするために継続させられる。2つの動作は全ての走
査ラインに対して、ページの終了信号が検出される(ス
テップ40)まで、繰り返される。ページ走査の終了
時、2つのプロセスの出力は、連続成分データである。
連続成分データは収集される(ステップ42)。各成分
データの組は、成分幅及び成分の高さから構成される、
輪郭画素の座標及びその物理的なサイズを含んでいる。
最も大きな成分が選択され(ステップ44)、ページア
ウトライン成分として取得される。その後、走査された
ページの傾き角度及び境界が、ページアウトライン成分
データの分析により取得される(ステップ46)。3つ
の主要なプロセス、すなわち、イメージのエッジ画素の
検出,単一パスの連続アウトライン画素成分の分析、及
び、傾き角度及びページ境界の分析の詳細な記述が、次
の3つのセクションに提供される。
【0011】イメージのエッジ画素の検出 イメージのエッジ画素の検出用の方法が、図5に示され
る。この検出は、その値が0−255の間である各画素
の強度I(i,j)を、ビットマップ形式に変換する。
“1”と記された出力における画素は、エッジ画素と考
えられ、また、“0”に割り当てられた画素は、非エッ
ジ画素(non-edge pixel)である。まず、画素について
の勾配の強さが算出される(ステップ48)。画素
(i,j)についての勾配の強さは、図6に示されるよ
うに、画素(i,j)にセンタリングされる画素の3×
3のウィンドウ50において、所謂“ソベル(Sobe
l)”の勾配オペレータの使用によって判断される。ソ
ベルオペレータは、それぞれGX(i,j)及びGY
(i,j)の水平及び垂直な画素の強度勾配を算出し、
各画素位置(i,j)について、GX(i,j)及びG
Y(i,j)の絶対の合計として勾配の強さG(i,
j)を構成することに依存する。GX(i,j),GY
(i,j)及びG(i,j)は、 GX(i,j)=I(i+1,j−1)+2(i+1,
j)+I(i+1,j+1)−I(i−1,j−1)−
2I(i−1,j)−I(i−1,j+1) GY(i,j)=I(i−1,j+1)+2I(i,j
+1)+I(i+1,j+1)−I(i−1,j−1)
−2I(i,j−1)−I(i+1,j−1) G(i,j)=|GX(i,j)|+|GY(i,j)
| ここで、G(i,j)は、画素(i,j)での勾配の強
さである。図5に示されるように、値G(i,j)は、
一定のGTと比較される。もしG(i,j)がGTより
大きければ(ステップ52)、その画素はエッジ画素と
判定され、“0”が記される。このプロセスは、走査ラ
インの各画素について完了させられ、エッジのビットマ
ップラインを生成する。
【0012】単一パスの連続輪郭画素成分の分析 連続アウトライン画素の成分を抽出するための従来技術
が、J.ジメネズ(Jimenez)及びJ.L.ナバロン(N
avalon)による、IBM J res.Develop
mentのvol.26,第6の724−734頁の
“イメージングベクトル化における幾つかの試み”、及
び、L.T.セデルバーグ(Cederberg)によ
る、コンピュータビジョン,グラフィックス及びイメー
ジプロセッシングのvol.10,224−234頁の
“ラスタースキャンデバイスに関するチェーンリンクコ
ード化及びセグメンテーション”に見出される。これら
の従来技術の方法は、単一パス処理でない若しくは計算
上有効でないため、高速生産スキャンにおける使用に適
していない。以下、高速走査システムにおける実用に適
した、迅速で,単一パスのアウトライン画素成分の分析
の方法を説明する。
【0013】図7は、単一パス処理における連続輪郭画
素成分を抽出する方法の2ステップのプロセスを示すも
のである。その方法は、検出されたエッジのビットマッ
プにおいて、ライン毎に読むものである。輪郭画素は、
ルックアップテーブルの方法によって、移動式の3×3
のローカルウィンドウにおいて検出され(ステップ5
6)、検出された輪郭画素は、連続された輪郭画素とと
もにグループ分けされ(ステップ58)、二重リンクリ
ストデータチェーンに記録される。ルックアップテーブ
ルの使用及びリンクリストデータチェーンの構築の詳細
は、後述する。
【0014】図8は、輪郭画素の抽出手順(符号56)
を示す。輪郭画素の検出は、他の輪郭画素との連続性を
組み立てるために、3×3の隣接画素を要する。したが
って、入力60は、先のエッジ検出から得られた3×3
エッジビットマップである。3×3ビットマップは、ウ
ィンドウがエッジビットマップラインにわたり走査され
る間の一瞬に3×3のウィンドウ内に存在する9つのセ
ルをあらわしている。各セルの値が0か1(2つの状
態)であるため、3×3のウィンドウ(9つのエレメン
ト)におけるビットマップマップパターンの数は、51
2である(2の9乗)。512のパターンは、0−51
1で分類される。ステップ62では、各数が、3×3の
ビットマップパターンに対応している。この情報は、ル
ックアップテーブルとして用いられ(ステップ64)、
これにより、テンプレートコマンドが導かれる(ステッ
プ66)。
【0015】このことを、図9の(a)に示される特定
の例を取り上げて説明する。ビットA〜Iは、9ビット
の整数を構成すべく、特定の順で配列されている。その
9ビットの整数の値の範囲は、0〜511である。図9
の(b)に関して選ばれた特定のビットパターンの例
は、437を構成するような整数となっている。この整
数は、図9の(c)に示されるように、ルックアップテ
ーブルを、それに関連したテンプレートコマンド(この
場合、テンプレート5,2)を出力するために、アドレ
スするためのエントリ番号として用いられる。テーブル
1は、特定の3×3のビットマップと、それに関連する
エントリ番号との間の関係を示している。エントリ番号
は、図9の(c)において先に示された処理によって生
成される。また、表1は、対応するエントリ番号がルッ
クアップテーブル64へのアドレスとして適用される場
合に、ルックアップテーブルから出力されるテンプレー
トコマンドを示している。 テンプレートコマンド(ステップ66)は、3×3のビ
ットマップ内の中央のセル及びその近傍のセルの関係を
コード化する。このテンプレートコマンドは、0から6
までの範囲をとり、表2において定義付けされる。
【0016】3×3のビットマップにおいて、中央セル
とその近傍セルとの関係は、4つの条件の1つ又はそれ
らの組み合わせに分類され得る。4つの条件とは、境界
移動,ローカル最大値,ローカル最小値,非境界であ
る。境界移動のセルは、図10に示されるような3×3
のビットマップ内の4つの近接画素に連続する4つの可
能な方向(0度,45度,90度及び135度)を有す
る。4つの連続方向は、それぞれ、コマンド0,1,
2,3としてコード化される。全ての可能なローカル最
大値の3×3のパターンが、表3に示される。 外側の輪郭及び内側の輪郭についてのローカル最大値の
セルは、それぞれ、2つの境界画素列のトラッキング開
始を初期化するコマンド4及び5としてコード化され
る。全ての可能なローカル最小値の3×3のパターン
が、表4に示される。 ローカル最小値のセルが、2つの入力する境界画素列を
併合させ、取り除くコマンド6としてコード化される。
非境界セルは、コマンドを割り当てられない。3×3の
ウィンドウがエッジビットマップのフラットな範囲にあ
る場合に、動作はとられない。
【0017】図11は、イメージラスタ走査様式で生成
されるテンプレートコマンド列を読み出し実行すること
により、連続輪郭画素をグループ分けし、記録するフロ
ーを示す図である。プロセスの出力は、輪郭画素成分の
集合である。各成分データの組は、輪郭画素の(x,
y)座標と、そのサイズ(幅及び高さ)とを含んでい
る。輪郭画素成分の記録及びグループ分けは、輪郭画素
をあらわすコマンドが用いられて開始する。コマンド
は、それがローカル最大値(max_point:以
下、最大点という)であるか否かを判定すべくテストさ
れる(ステップ70)。もしそうであれば、2つの新た
なノード(Li,Ri)が、2つの関連した境界の座標
とともに、一続きのリンクリストデータに記載される。
2つの新たなノードが、同じ判別に割り当てられる(ス
テップ72)、つまり、左手側の判別(L_ID)が、
右手側のR_IDに等しくなるように設定される。その
後、次の輪郭画素に関して続けるために、新たな組のコ
マンドについて、次のテンプレートコマンドが読まれ
る、あるいは、新たな3×3のビットマップが読まれ
る。もしコマンドが最大点をあらわしていなければ、コ
マンドは、それがローカル最小値(min_poin
t:以下、最小点という)であるとしてテストされ、他
方、もしそうでなければ、それは、その(x,y)座標
がセーブされる(ステップ76)輪郭移動画素であり、
次のコマンドが次の輪郭画素を抽出すべく読み出され
る。もしそれがローカル最小値であれば、2つの併合す
る輪郭列の識別子(L_ID及びR_ID)がそれらが
同じであるか否かについてテストされる。もしそうであ
れば、完全な輪郭が見出され、境界画素の座標が、リン
クリストのノード80を引っ込めることにより集められ
る。もしそうでなければ、L_IDがL_IRに等しく
なるように設定され、リンクリストデータの列から2つ
のノードを取り除き(ステップ82)、図12〜19に
示されるように、次のテンプレートコマンドを開始させ
続ける。
【0018】輪郭画素を記録するためのリンクリストの
構成の一例が図12〜16に示される。ビットマップイ
メージの左から右への走査は、走査線Aにおいて、1の
ローカル最大値を検出する。検出時、2つの新たなノー
ド(L1,R1)およびL_ID及びR_IDが、数I
=2へ設定される。境界列の境界座標は、(X1,Y
1)及び(X2,Y2)として記録される。次のローカ
ル最大値2は、走査線Bにて検出され、2つの付加的な
ノード(L2,R2)がL1及びR1の右側へ形成され
る。走査を続けると、別のローカル最大値3が走査線C
で検出され、2つの付加的なノード(L3,R3)は、
ノード(L1,R1)とノード(L2,R2)との間に
形成される。走査線Dでは、ローカル最小値4が検出さ
れ、2つの境界チェーンR2及びL2の併合を信号で知
らせる。その結果、2つのノードR3及びL2は、L3
に指向するR2に指向するL3の前向きポインタをリセ
ットすることにより、リンクリストのループから除去さ
れる。それは、また、ノード(L2,R2)及び(L
3,R3)が同じ輪郭の一部であることをあらわし、そ
れらの識別子L2_ID,R2_ID,L3_ID及び
R3_IDが、同じ識別子番号に設定される。この場
合、番号Iは6である。走査を続けると、走査線Eにお
いて、新たなローカル最大値が検出され、2つのノード
(L5,R5)が、L3とR2との間に挿入される。ロ
ーカル最小値6が、走査線Fにおいて検出され、それ
は、2つの入力する境界チェーンL1及びR1の併合を
合図で知らせる。L1_IDがR1_ID(=2)に等
しいので、それは、連続輪郭画素成分が仕上げられセー
ブされ、また、ノードL1及びR1がリンクリストルー
プから除去されることをあらわしている。走査が再開さ
れ、検出は、図14,15及び16に示されるようなビ
ットマップの終りまで続けられる。プロセスの終りに
は、3つの輪郭が抽出され、輪郭画素の座標が、記録さ
れたリンクリストチェーンから読み出される。
【0019】走査されたページの傾き角度及び境界の算
図20は、前の章で記述されたプロセスにより取得され
る図3のイメージ20に関して抽出された輪郭成分を示
している。7つの抽出された輪郭成分が存在し、各成分
を識別するために、それぞれ、符号14,15,19,
20,21,23,24及び25が付されている。これ
らの輪郭成分は、走査ページのアウトラインであるか、
若しくは、ノイズドットの輪郭である。符号20が付さ
れた最も大きな成分が、対象とするページのアウトライ
ンとして識別されるフレームの中央に位置決めされてい
る。成分データは、輪郭のトレースに沿った一連の
(x,y)座標によって保存されるもので、走査された
ページの傾き角度及び境界を取得するための分析用に得
られる。
【0020】傾き角度は、図21に示されるように、ペ
ージの上部境界に対応する輪郭点の座標に基づき概算さ
れる。上部境界の輪郭点は、水平方向におけるDxの増
加ごとにとられる(ステップ84)。それに対応する、
副標本である隣接点の対ごとの垂直方向の距離Dyが計
算される(ステップ86)。上部境界における副標本で
ある隣接点の全ての対に関し、|Dx|の値は、|Dy
|の値よりも大きくなければならない。そのため、|D
x|<|Dy|を示す点の対が、それらが上部境界に属
さないことから、記録されたデータの組から取り除かれ
る。残りのデータは、ヒストグラムを構成すべく(ステ
ップ88)用いられる。このヒストグラムでは、図22
に示されるように、水平軸がX,垂直軸がYと符号付け
され、隣接点の対ごとの水平方向及び垂直方向の距離D
x及びDyが算出される。ヒストグラムDyのモード
(Dm)は、最も大きな数のヒットを有するDyの値と
して定義される。ページの境界ノイズに関連したデータ
点を最小にするには、Dyの値がDm−K及びDm+K
mの範囲の外側になる(ステップ90)データの点が削
除される。ここで、Kは境界値である。データのクリー
ンアップ後、残りのデータの点が、(x,y)変域にお
ける線形性について評価される。線形相関係数(Cor
r)が算出され(ステップ92)、傾いた直線を検出す
る上で、信頼性のレベルの測定値として採用される。も
し信頼性のレベルが特定の境界値(Ck)以下であれ
ば、傾き角度は0に設定される(ステップ94)。この
ことは、対象とするページが、右上がりであるか、ある
いは、それが不規則な上部境界を含んでいることを表し
ている。他方、もし信頼性のレベルが特定の境界値より
も大きければ、傾斜した直線状の上部境界が検出され、
その直線の式が、データの点の最小2乗法により算出さ
れる(ステップ96)。傾き角度は、適合した直線の勾
配から読み取られる。それは、逆正接の勾配である。
【0021】相関係数が、次のように決定される。点の
座標が(xi,yi)であるとする。また、ここでは、
I=1,...,Nであり、Nは、残りのデータの点の
数である。相関係数(rxy)は、rxy=Sxy/
(SxSy)により定義される。相関係数(rxy
は、 により定義される。相関係数の値は、上記の定義によっ
て、0と1との間にある。もし相関係数が1に近けれ
ば、それは、これらの点が同一線上にあり、線形の最小
2乗法がこれらの点に適用されることを示している。回
転角度θは、適合した直線y=a+bxの勾配(θ
=b)から読み取られる。ここで、 である。回転角度は、走査された文書の傾き角度として
とられる。
【0022】相関係数の値は、上記の定義にしたがっ
て、0と1との間にある。もし相関係数が1に近けれ
ば、それは、これらのデータの点が、完全な直線の関係
を有し、点が、直線y=a+bxに適合され得ることを
示している。ここで、走査されたページの傾き角度であ
る角度は、逆正接(b)として算出される。
【0023】ある成分の輪郭点の座標(x,y)が輪郭
のトレースに沿って順に記録されるため、黒色の境界除
去が一線ずつなされるように、輪郭点を再編成すること
が必要となる。データの再編成は、y座標値に基づき点
を分類し、上から下の順に格納することにより行なわれ
る。各y座標において、それは、表5に示されるような
x座標で記された交点のリストに対応する。 表中のx座標は、図24に示されるイメージ走査線(y
座標)とイメージアウトラインとの交点である。輪郭の
頂点となるコーナ部において、“o”が付された交点
が、偶数を保証するために複製を作られる。x−y座標
テーブルは、グレースケールイメージ又は二値化イメー
ジについての境界除去に適用される。
【0024】なお、本発明は、例示された実施の形態に
限定されるものでなく、本発明の要旨を逸脱しない範囲
において、種々の改良及び設計上の変更が可能であるこ
とは言うまでもない。
【0025】
【発明の効果】以上の説明から明らかなように、本願発
明によれば、ノイズのある背景を有する環境において、
あらゆる種類の文書の形状についての自動文書傾き角度
検出,境界検出及び境界除去を行なうことができる。
【図面の簡単な説明】
【図1】 停止及び終了信号なしで、高速生産スキャナ
により取得されるデジタルイメージの例である。
【図2】 第1の取得されたイメージフレームの例であ
る。
【図3】 第2の取得されたイメージフレームの例であ
る。
【図4】 本発明における個々のイメージキャプチャ及
び処理のステップを概略的に示すフローチャートであ
る。
【図5】 イメージのエッジ画素の検出のステップを示
すフローチャートである。
【図6】 勾配の強さを算出するための3×3のセルの
位置インデックスを示す。
【図7】 単一パスの連続輪郭画素成分の分析を実行す
る2つの主要なプロセスを示すフローチャートである。
【図8】 ルックアップテーブルを用いて輪郭画素を抽
出するためのステップを示す。
【図9】 (a)3×3のビットマップからのテーブル
整数エントリの生成をあらわす。 (b)テーブル整数エントリの生成の一例である。 (c)ルックアップテーブルを用いたテンプレートコマ
ンドの生成の一例である。
【図10】 4つの接続するチェーンコードを概略的に
示す図である。
【図11】 連続輪郭成分を追跡し抽出する際の、テン
プレートコマンドの二重リンクリストデータチェーンへ
の変換をあらわすフローチャートである。
【図12】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第1段階のプロセスの例である。
【図13】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第2段階のプロセスの例である。
【図14】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第3段階のプロセスの例である。
【図15】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第4段階のプロセスの例である。
【図16】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第5段階のプロセスの例である。
【図17】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第6段階のプロセスの例である。
【図18】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第7段階のプロセスの例である。
【図19】 連続輪郭画素を追跡するための、また、全
ての輪郭成分を抽出するための二重リンクリストデータ
チェーンを構成する第8段階のプロセスの例である。
【図20】 7つの抽出された図3の連続輪郭成分を概
略的に示すである。
【図21】 輪郭成分の傾き角度を算出するブロック図
である。
【図22】 形状,サイズ及び傾き角度の分析のため
に、ページのアウトラインとして取得される最も大きな
成分の輪郭を示す図である。
【図23】 図22に示されるような、垂直距離Dyの
ヒストグラムチャートの例である。
【図24】 イメージ走査ラインとページのアウトライ
ンとの間の実際の交差点をあらわす例である。
【符号の説明】
12…黒色境界 14,15,21,25…ノイズ 16…垂直ライン 18…イメージ♯1 19…イメージ♯1の部分的な輪郭 20…イメージ♯2 23…イメージ♯3の部分的な輪郭 24…イメージ♯3 50…3×3のウィンドウ 64…ルックアップテーブル
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // G06T 3/60 H04N 1/40 F Fターム(参考) 5B047 AA01 CB12 CB21 5B057 AA11 BA02 CA12 CA16 DA07 DB02 DC08 5C076 AA24 BA07 5C077 LL02 LL20 MM03 MP04 MP07 NP01 PP59 PP68 PQ23 5L096 FA03 FA06 FA64 FA67 GA12

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 生産スキャナにより走査される文書の傾
    き角度及び境界の検出用の方法において、該方法は、 (a)ページ開始の信号を検出し、 (b)イメージラインを取得し、 (c)ページ終了の信号について調べ、 (d)ページ終了の信号が検出されれば、ステップ
    (h)へ進み、ページ終了の信号了が検出されなけれ
    ば、ステップ(e)へ進み、 (e)イメージのエッジ画素を検出し、 (f)単一パスの連続輪郭画素成分の分析を実行し、 (g)ステップ(b)へ進み、 (h)上記連続輪郭画素成分を収集し、 (i)最大成分を選択し、 (j)文書の傾き角度及び境界を得るために、上記最大
    成分を分析するステップを有していることを特徴とする
    文書の傾き角度及び境界の検出方法。
  2. 【請求項2】 上記イメージのエッジ画素を検出するス
    テップが、 移動する3×3のウィンドウにおける、イメージの強度
    勾配を算出し、 イメージオブジェクトのエッジビットマップを抽出すべ
    く、上記強度勾配について閾値を設定するステップを有
    していることを特徴とする請求項1記載の文書の傾き角
    度及び境界の検出方法。
  3. 【請求項3】 上記単一パスの連続輪郭画素成分の分析
    を実行するステップが、 ルックアップテーブル法および一連のテンプレートコマ
    ンドによって、移動する3×3のローカルウィンドウに
    おける上記イメージのエッジ画素を抽出するステップを
    有していることを特徴とする請求項1記載の文書の傾き
    角度及び境界の検出方法。
  4. 【請求項4】 上記傾き角度が、 上記最大輪郭成分の向きを検出し、 上記最大輪郭成分の向きに基づいて、傾き角度を算出す
    ることにより得られることを特徴とする請求項1記載の
    文書の傾き角度及び境界の検出方法。
JP2001259634A 2000-08-29 2001-08-29 文書の傾き角度及び境界の検出方法 Pending JP2002133424A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US65020300A 2000-08-29 2000-08-29
US09/650203 2000-08-29

Publications (1)

Publication Number Publication Date
JP2002133424A true JP2002133424A (ja) 2002-05-10

Family

ID=24607915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001259634A Pending JP2002133424A (ja) 2000-08-29 2001-08-29 文書の傾き角度及び境界の検出方法

Country Status (2)

Country Link
EP (1) EP1184808A3 (ja)
JP (1) JP2002133424A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258718A (ja) * 2004-03-10 2005-09-22 Casio Comput Co Ltd 画像処理装置、画像投影装置、画像処理方法及びプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7068855B2 (en) * 2002-07-16 2006-06-27 Hewlett-Packard Development Company, L.P. System and method for manipulating a skewed digital image
US7027666B2 (en) 2002-10-01 2006-04-11 Eastman Kodak Company Method for determining skew angle and location of a document in an over-scanned image
US7262781B2 (en) 2004-07-27 2007-08-28 Hewlett-Packard Development Company, L.P. Document creation system and related methods
JP5756455B2 (ja) * 2010-06-11 2015-07-29 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像処理装置および画像処理方法
CN109146908A (zh) * 2018-07-25 2019-01-04 安徽师范大学 一种二值图像流快速连通域标记算法
CN110147765B (zh) * 2019-05-21 2021-05-28 新华三信息安全技术有限公司 一种图像处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10208066A (ja) * 1997-01-28 1998-08-07 Matsushita Electric Works Ltd 被検査物のエッジライン抽出方法及びこの方法を用いた外観検査方法
JPH11313207A (ja) * 1998-04-09 1999-11-09 Hewlett Packard Co <Hp> ドキュメント画像の傾き角度決定方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10208066A (ja) * 1997-01-28 1998-08-07 Matsushita Electric Works Ltd 被検査物のエッジライン抽出方法及びこの方法を用いた外観検査方法
JPH11313207A (ja) * 1998-04-09 1999-11-09 Hewlett Packard Co <Hp> ドキュメント画像の傾き角度決定方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258718A (ja) * 2004-03-10 2005-09-22 Casio Comput Co Ltd 画像処理装置、画像投影装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
EP1184808A3 (en) 2003-10-29
EP1184808A2 (en) 2002-03-06

Similar Documents

Publication Publication Date Title
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
US7543753B2 (en) Reconstruction of virtual raster
JP4232800B2 (ja) ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2001109895A (ja) 複数のディジタル画像の処理方法
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP4132766B2 (ja) 画像処理装置および方法
JP2871601B2 (ja) 文字列検出装置及び方法
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
JP2871590B2 (ja) 画像抽出方式
WO2000049569A1 (fr) Procede servant a extraire les caracteristiques d&#39;une image binaire
JP3164835B2 (ja) 人物画像認識における前処理方法および後処理方法
JP2002150213A (ja) バーコード読み取り装置
JP2899383B2 (ja) 文字切出し装置
JP2963508B2 (ja) 文字切出し装置
JP2812619B2 (ja) 画像処理装置
JP2002230564A (ja) 輪郭抽出装置、方法および輪郭抽出プログラム
JP3046656B2 (ja) 文字原稿の傾き補正方法
JP3084833B2 (ja) 特徴抽出装置
JPH1040333A (ja) 帳票認識装置
JP4406974B2 (ja) 画像検出装置、画像検出方法および記録媒体
JP2966448B2 (ja) 画像処理装置
JPH096909A (ja) 文字読取装置
JP4218179B2 (ja) パターン検出装置及び方法
JPH07120392B2 (ja) 文字パターン切り出し装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101116