JP2978496B2 - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2978496B2
JP2978496B2 JP63259461A JP25946188A JP2978496B2 JP 2978496 B2 JP2978496 B2 JP 2978496B2 JP 63259461 A JP63259461 A JP 63259461A JP 25946188 A JP25946188 A JP 25946188A JP 2978496 B2 JP2978496 B2 JP 2978496B2
Authority
JP
Japan
Prior art keywords
image
document
inclination
document image
integration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63259461A
Other languages
English (en)
Other versions
JPH02108177A (ja
Inventor
好博 嶋
康明 中野
雅章 藤縄
達也 村上
浩道 藤沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63259461A priority Critical patent/JP2978496B2/ja
Publication of JPH02108177A publication Critical patent/JPH02108177A/ja
Application granted granted Critical
Publication of JP2978496B2 publication Critical patent/JP2978496B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文書画像の傾斜角を検出する方法及び傾斜を
補正する装置に関する。
〔従来の技術〕
従来、文書画像の傾き検出については、中野康明,東
野純一,藤澤浩道:“文書画像の傾き補正のための一方
式”電子通信学会論文誌研究速報'86/11Vol.J69−D,No.
11,pp.1833−1834(1986年11月)において論じられてい
る。この中野らの方法は、文書画像の傾き検出は、文書
中に印刷されている各文字は概ね一直線の上にあるとみ
なされることを利用しており、複数の方向に対してある
特徴量を積分し、その最も尖鋭となる方向を探すもので
ある。しかしながら、積分した特徴量から尖鋭な方向を
求める方法は明示されていない。また、文書画像の種類
によっては、傾き検出に誤りが生じ、文書画像の傾き補
正の信頼性が低い。
〔発明が解決しようとする課題〕 上記従来技術は、多数の方向に積分を行つたのち文字
列の傾きを積分値の尖鋭性を基に推定する処理の手法に
ついては明らかでなく、また、文書画像の傾き検出に誤
りが発生した場合について配慮がされておらず、文書画
像の傾き補正の信頼性が低いという問題があつた。
本発明の目的は、傾きを推定する方法を明示すること
を目的としており、さらに信頼性の高い傾き検出方法を
提供することを目的としている。
印刷物など既存文書は、スキヤナでデイジタル画像に
変換され、画像フアイルシステムに格納される。入力す
べき文書画像がスキヤナ上で傾いて設定されると、回転
した画像がそのまま画像フアイルシステムに格納される
ことになる。この傾斜した文書画像は美観上好ましくな
く、またデイスプレイ上では読みづらい。さらに、文書
のデータベース化のため、文字認識を用いて文書中の書
誌事項などを抽出する際、文書画像が傾いていると、文
字認識が困難となる。これらの理由から、文書画像の傾
き補正が必要である。
〔課題を解決するための手段〕
上記目的を達成するために、文書画像全面に対してラ
ベル付けをもとにした連結成分の抽出を行う。次いで、
連結成分ごとに特徴量とその位置座標を求め、多数の方
向に特徴量を積分する。最後に、多数の方向から、積分
した結果が最も尖鋭となる方向を求め、この方向を文書
の傾き方向と推定する。積分した結果から最も尖鋭な方
向を求める判定手段として、積分値の差分の絶対値の和
が最大となる方向、積分値のうち最大となる値をもつ方
向、積分値の山の平均的な傾斜の和が最大となる方向、
積分値の零値の個数が最大となる方向、をそれぞれ尖鋭
な方向と判定するものである。
さらに、文書画像をある所定の角度だけ回転させ、そ
の回転した画像の傾きを、元の画像の傾き角度を比較す
ることにより、信頼性の高い文書画像の傾き角度を検出
するものである。
〔作用〕
文書画像の傾き検出は、文書中に印刷されている各文
字は概ね一直線の上にあるとみなされることを利用す
る。ここでは、文書画像は白黒2値画像とし、文字等は
白い背景にある黒い画素の集まりとして表現されてい
る。傾き検出の原理は、複数の方向に対してある特徴量
を積分し、その際も尖鋭となる方向を探すものである。
〔実施例〕
以下、本発明の一実施例を第1図により説明する。表
示端末100には文書画像が表示される。印刷物など既存
文書は、スキヤナなど光学的入力装置104でデイジタル
画像に変換され、画像フアイルシステム102に格納され
る。入力すべき文書画像がスキヤナ103上で傾いて設定
されると、回転した画像がそのまま画像フアイルシステ
ム102に格納されることになる。この傾斜した文書画像
は美観上好ましくなく、またデイスプレイ100上では読
みづらい。さらに、文書のデータベース化のため、文字
認識を用いて文書中の書誌事項などを抽出する際、文書
画像が傾いていると、文字認識が困難となる。これらの
理由から、文書画像の傾き補正が必要である。画像傾き
検出部105では、文書画像の傾きを検出する。また、画
像傾き補正部106では、文書画像を回転させ傾きを補正
する。さらに、傾きの補正が必要とされる文書画像には
文字だけでなく図や表が混在しており、このように文書
に対しても傾きを検出する。
文書画像の傾き検出は、文書中に印刷されている各文
字は概ね一直線の上にあるとみなされることを利用す
る。ここでは、文書画像は白黒2値画像とし、文字等は
白い背景にある黒い画素の集まりとして表現されてい
る。傾き検出の原理は、複数の方向に対してある特徴量
を積分し、その最も尖鋭となる方向を探すものである。
この傾き検出の手順は、最初に文書画像全面に対してラ
ベル付けをもとにした連結成分の抽出を行う。次いで、
連結成分ごとに特徴量とその位置座標を求め、多数の方
向に特徴量を積分する。最後に、多数の方向の中から、
積分した結果が最も尖鋭となる方向を求め、この方向を
文書の傾き方向と推定する。この方法において、連結成
分の代わりに輪郭線を用いる方法もある。また、積分す
べき特徴量としては、連結成分の外接長方形の底辺の長
さ、外接長方形の面積や個数などがある。さらに、積分
するための位置座標として外接長方形の頂点や重心の位
置、連結成分と下端点の位置がある。
積分した結果から最も尖鋭な方向を求める判定手段と
して、積分値の差分の絶対値の和が最大となる方向、
積分値のうち最大となる値をもつ方向、積分値の山
の平均的な傾斜の和が最大となる方向、積分値の零値
の個数が最大となる方向、のそれぞれについての判定手
段を明示する。
今、第2図は傾き検出の原理を説明する図である。文
書画像の横方向をX座標200,縦方向をY座標201とする
(1≦x≦x0,1≦y≦y0)。そして、連結成分に番号を
付けるものとし、第k番目の連結成分の外接長方形202
の左下および右下の頂点203,204を、(x1k,y1k),(x2
k,y2k)とする。但し、kは正の整数であり、全連結成
分の個数を表す。連結成分の抽出時、連結成分のX,Y座
標の最大値および最小値を求めておくことにより、これ
ら連結成分の外接長方形が同時に求まる。積分する方向
の数を−Nから+Nまで(2N+1)方向とする。また、
δを傾き検出の角度分解能とする。従つて、特徴量の積
分は、X軸を中心とする206で示すi・δ(但し、i=
−N,…,0,…,N)の方向について行うことになる。特徴
量の積分210は次の式で計算される。
for k=1 to K do; if(連結成分選択条件成立); y=y1k−x1k・tan(i・δ); Si(y)=(x2k−x1k)+Si(y); end if; end do; ここで、Si(y)210は外接長方形の底辺をi・δ方
向206に積分したものである。上式で文字のみを積分す
るためには、連結成分選択条件として、連結成分の大き
さが文字サイズの範囲に入るという条件を設定すればよ
い。この条件によつて、文書中の罫線,図形,模様や雑
音の影響を受けにくくできる。
特徴量を積分した結果Si(y)210は(2N+1)の方
向数(i=−N〜N)について計算されることになり、
その最も尖鋭となる方向を求めれば文書の傾きを推定で
きる。尖鋭な方向を求める判定基準としては、次の2つ
の方法を考案した。第4図は、判定基準の説明図であ
る。差分法は積分値400の差分406の絶対値の和が最大と
なる方向iを文書の傾き方向とする方法である。この差
分法は以下の式で表される。
最大法は、積分値410のうち最大となる値412をもつ方
向iを文書の傾き方向とする方法であり、この最大法は
以下の式で表される。
第5図は他の二つの方法による判定基準の説明図であ
る。平均法は、山の平均的な傾斜の和が最大となる方向
iを文書の傾き方向とする方法であり、この平均法は以
下の式で表される。
但し、502及び503で示すyd1,yd2は連続する非零値の
上端Y座標と下端Y座標であり、積分値500の谷の位置
に相当する。また、Jは非零値が連続する区間、即ち、
積分値の山の個数である。
零数法は、積分値510の零値の個数が最大となる方向
iを文書の傾き方向とする方法である。ここで、Y座標
511の区間512,513,514,515が積分値510の値が零値であ
る区間であり、この区間の長さを算出する方法である。
この零数法は以下の式で表される。
但し、関数u(v)は、u(v)=0(v≠0)、u
(v)=1(v=0)である。この零数法では、積分値
が零値である個数を求めているため、積分する特徴量と
して外接長方形の個数をとつた方法と、検出した傾き方
向は同一となる。
文書画像に対する傾き検出の手順は、第3図に示すよ
うに4つの過程からなる。まず、(1)連結成分の抽出
過程300では、文書画像全面に対しラベル付けを基にし
た連結成分の抽出を行う。連結成分とは、2値画像中で
同じ値を持つ画素が互いに近接していて一つの塊を形成
しているものであり、それぞれに異なつたラベルを割り
当てることになる。ここでは、ラベリングを高速で行う
ため、2値画像をランで表し、ラベルを近接のランに伝
播させながらラベリングを行う。次いで、(2)特徴量
の抽出の過程301では、連結成分ごとに特徴量とその位
置座標を求める。ここでは、特徴量として、連結成分の
外接長方形の底辺の長さ(=x2k−x1k)をとる。位置座
標としては、連結成分の外接長方形の左下の頂点の座標
(x1k,y1k)をとる。連結成分を抽出する際、X,Y座標の
最大,最小を求めておくことにより連結成分の外接長方
形が、連結成分と同時に求まる。文書中に含まれる文字
部分の選択条件として連結成分の面積が一定範囲内かど
うかを選択条件とする。これにより、罫線,図形,雑音
の影響を受けにくくしている。そして、(3)特徴量の
多方向への積分過程302では、多数の方向に対して、こ
の特徴量を積分する。積分の方向はX軸を中心とするi
・δの方向とする。積分の方向は、順次、iをステツプ
310に示すように−Nから+Nまで変え、−N・δから
+N・δまで、δ刻みとする。ここでは、積分のための
方向数を81(N=40)とする。また、δは角度分解能で
あり、δは0.05゜及び0.5゜にそれぞれ設定した。ステ
ツプ311では積分テーブルSi(y)を初期化する。そし
て、ステツプ312に示すように外接長方形が尽きるま
で、ステツプ314以下の処理を行う。ステツプ314では外
接長方形の面積が所定範囲かどうかの判定を行い、もし
所定範囲内であれば、ステツプ315に移行する。それぞ
れの積分方向に対して、特徴量を積分し、その値を一次
元のテーブルSi(y)に格納する。一次元テーブルにお
いて特徴量を格納する番地yは、ステツプ315に示すよ
うにy=y1k−x1k・tan(i・δ)を計算することによ
り求まる。外接長方形ごとに、乗算と減算をそれぞれ1
回行うことになる。さらに、ステツプ316で示すように
該当y座標に外接長方形の横の長さを累算する。最後に
(4)積分値を基にした傾き方向の推定過程303では、
多数の方向の中から、積分した結果が最も尖鋭となる方
向を求め、この方向を文書の傾き方向と推定する。尖鋭
な方向を求める判定基準として、積分値の差分の絶対値
の和が最大となる方向を文書の傾き方向とする差分法、
積分値のうち最大となる値をもつ方向を文書の傾き方向
とする最大法、山の平均的な傾斜の和が最大となる方向
を文書の傾き方向とする平均法、積分値の零値の個数が
最大となる方向を文書の傾き方向とする零数法を、それ
ぞれ用い、文書の傾きを推定する。
第6図は、画像の傾きを検出する他の実施例の処理過
程である。ステツプ600で画像を入力する。そして、画
像を回転する回数rがステツプ601で示すように尽きる
まで、ステツプ602,603,604,605を行う。ここで、ステ
ツプ602では、画像を回転させる時の回転角を設定す
る。次いで、ステツプ603で、画像を設定した回転角Ar
だけ回転させる。この回転した画像に対して、ステツプ
604で傾き角αrを検出する。そして、ステツプ605で検
出した傾き角度αrと設定していた回転角度Arとを登録
する。ステツプ601が終了すると、ステツプ606で傾き角
度の精度を判定する。ステップ601でr回目の回転角Ar
に対応する傾き角αrが登録されている。正確に傾き角
度を検出している場合は、i回目、j回目の回転の時の
回転角Ai、Ajと傾き角αi、αjとの間には次の一定の
関係がある。
αi−αj=Ai−Aj よって、αi=Ai−Aj+αj(但し1≦i,j≦R、i
≠j) それに対して、ステップ604で誤って傾き角を検出し
ている場合は、傾き角と回転角の間には一定の関係がな
い。従って、この一定の関係がある時は、任意の回転時
に検出された傾き角から回転角を減じた値が画像の傾き
角となる。
こうして一定の関係の有無により正確に傾き角が検出
されていると判定された場合にのみ、画像の傾き角(α
i−Ai)だけステップ607で、ステップ600で入力された
画像の傾きを補正する。このように、画像を回転させな
がら傾き角を検出することにより、高い精度で傾き角を
求めることができる。
〔発明の効果〕
印刷物など既存の文書のデータベース化を行う場合、
文字部については文字認識を行い、書誌事項やキヤプシ
ヨンといった検索情報を抽出するとともに文字部は符号
化してフアイルに格納する。また、画像部分について
は、この部分を分離抽出し、高圧縮符号化を行う。この
ような既存文書のデータベース化を行う際、文書をスキ
ヤナ等で入力することになるが、入力すべき文書が設定
状況によつては傾き、回転した紙面画像が入力されるこ
とがある。傾いた文書画像に対して文字認識を行うこと
は一般に困難であり、従つて、文字認識および文書認識
の前処理として、文書画像の傾きを補正することができ
る。また、文書編集や検索処理において、原文書に加筆
したメモ等の追記情報を得るため、原文書との画像のパ
ターンマツチングにより原文書に記入された追記情報を
分離抽出することになるが、この場合、追記情報を加筆
した文書画像に対して、その傾きを補正することができ
る。さらに、文書画像の通信や検索において、出力され
た文書の傾きを補正することができる。また、光デイス
クを用いた文書画像の検索において、検索結果である文
書が傾きなく表示されることが望まれており、高速ペー
ジめくりにおける表示紙面の傾き補正が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成図、第2図は傾き検出
の原理を説明する図、第3図は文書画像に対する傾き検
出の手順を示す図、第4図は判定基準の説明図、第5図
は他の方法による判定基準の説明図、第6図は画像の傾
きを検出する他の実施例の処理過程を説明する図であ
る。 100……表示端末、102……画像フアイル、105……画像
傾き検出部、106……画像傾き補正部、202……外接長手
形、210……特徴量の積分値、302……多方向への特徴量
の積分、606……検出傾き角の精度判定過程、607……画
像傾き補正過程。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤縄 雅章 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 村上 達也 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤沢 浩道 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (56)参考文献 特開 昭55−33254(JP,A) 特開 昭61−166685(JP,A) 特開 昭57−69372(JP,A) 特開 昭62−14277(JP,A) 特開 昭61−251982(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】画像入力手段と、画像を予め設定した複数
    個(R)の回転角(Arはr回目の回転角)だけ回転する
    手段と、複数個の回転した画像に対する傾き角(αrは
    r回転した画像の傾き角)を検出する手段と、Ar、αr
    を記憶する記憶手段とを有する画像処理装置において、 上記記憶手段からi回目、j回目の回転の時の傾き角α
    i、αjと回転角Ai、Ajがαi=Ai−Aj+αjの関係を
    満たしているかを判定する手段と、該関係を満たしてい
    るときにαi−Aiを入力された画像の傾き角として画像
    の傾きを補正する手段とを具備することを特徴とする画
    像処理装置(但し1≦i,j≦R、i≠j)。
JP63259461A 1988-10-17 1988-10-17 画像処理装置 Expired - Fee Related JP2978496B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63259461A JP2978496B2 (ja) 1988-10-17 1988-10-17 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63259461A JP2978496B2 (ja) 1988-10-17 1988-10-17 画像処理装置

Publications (2)

Publication Number Publication Date
JPH02108177A JPH02108177A (ja) 1990-04-20
JP2978496B2 true JP2978496B2 (ja) 1999-11-15

Family

ID=17334391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63259461A Expired - Fee Related JP2978496B2 (ja) 1988-10-17 1988-10-17 画像処理装置

Country Status (1)

Country Link
JP (1) JP2978496B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2177029B1 (en) * 2007-08-16 2018-03-28 Sony Interactive Entertainment Inc. Object detection using video input combined with tilt angle information

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60302191T2 (de) * 2002-08-27 2006-07-27 Oce Print Logic Technologies S.A. Ermittlung der Schräglage von Dokumentenbildern

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2177029B1 (en) * 2007-08-16 2018-03-28 Sony Interactive Entertainment Inc. Object detection using video input combined with tilt angle information

Also Published As

Publication number Publication date
JPH02108177A (ja) 1990-04-20

Similar Documents

Publication Publication Date Title
US6778703B1 (en) Form recognition using reference areas
EP1999688B1 (en) Converting digital images containing text to token-based files for rendering
US6754369B1 (en) License plate reading apparatus and method
US6774889B1 (en) System and method for transforming an ordinary computer monitor screen into a touch screen
JP3576570B2 (ja) 比較方法
Nakano et al. An algorithm for the skew normalization of document image
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
JP3320759B2 (ja) 文書画像傾き検出装置およびその方法
US5822454A (en) System and method for automatic page registration and automatic zone detection during forms processing
US20020191847A1 (en) Portable text capturing method and device therefor
EP1703444A2 (en) Detecting an orientation of characters in a document image
US20050196070A1 (en) Image combine apparatus and image combining method
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP2001175807A (ja) テキスト領域選択方法
JPH05250409A (ja) ページ方向の高速検出
Pal et al. Multi-skew detection of Indian script documents
JP2978496B2 (ja) 画像処理装置
JP3006466B2 (ja) 文字入力装置
JP3303246B2 (ja) 画像処理装置
US5790701A (en) Character recognition apparatus using edge images
JPH11219409A (ja) 文書読取装置
JP2669661B2 (ja) 文書画像処理方法
JPS6214277A (ja) 画像処理方式
JPH09120430A (ja) 画像処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees