JPH02158882A - 原稿傾き検出装置 - Google Patents

原稿傾き検出装置

Info

Publication number
JPH02158882A
JPH02158882A JP63311978A JP31197888A JPH02158882A JP H02158882 A JPH02158882 A JP H02158882A JP 63311978 A JP63311978 A JP 63311978A JP 31197888 A JP31197888 A JP 31197888A JP H02158882 A JPH02158882 A JP H02158882A
Authority
JP
Japan
Prior art keywords
image
line
white run
end part
image end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63311978A
Other languages
English (en)
Inventor
Junichi Osumi
大住 淳一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP63311978A priority Critical patent/JPH02158882A/ja
Publication of JPH02158882A publication Critical patent/JPH02158882A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 文書画像認識装置等のページ単位の文書画像を処理する
デジタル画像処理装置における入力画像の傾き検出装置
に関する。
(従来の技術) 入力画像から文字領誠、図形領域、写真領域を抽出する
時や文字領域の中から一文字ずつ切り出して認識すると
き、画像が傾いていると、切り出し処理が非常に難しく
なるばかりでなく、認識も困難になることがある。
従来、原稿の傾き検出は、原稿画像を微小角度毎に回転
させ周辺分布を取り、分布が最も急峻になった回転角を
原稿傾きとする手法や文字列の疑似的な中心線を求めて
、そのaきにより、原稿傾きを抽出する手法や二次元フ
ーリエ変換(FFT)により、文字や文字列の空間分布
を求めて、それから角度を推定する手法等が提案されて
いる。
(発明が解決しようとする課題) しかし、各手法とも、数回の画像回転、liI像の膨張
・細線化処理、二次元FFT等時間の掛かる複雑な処理
を必要とするという問題点があった。
本発明は、以上の様な従来技術の問題点を解決し、単純
で短時間で簡単に原稿傾きを求めることを目的とする。
(S題を解決するための手段) 上記目的を達成するための本発明の原稿傾き検出装置の
構成は、第1図に示すように、ページ単位の文書画像を
処理するデジタル画像処理装置において、画像の各走査
線の白ラン長を計測する白ラン計測部11と、白ラン計
測部11により計測した白ラン長を所定の複数走査線内
で比較し、最小の白ラン長とその走査線位置を画像端部
点として抽出する画像端部点抽出部12と、複数の画像
端部点を最もよ(連結できる直線を画像端部線として抽
出する画像端部線抽出部14と、画像端部線抽出部14
により得られた画像端部線の垂直線からの傾きを原稿傾
きとして算出する傾き算出部15とを備えている。
(作用) まず、白ラン計測部11により各走査線毎の白ランを計
測する。画像端部点抽出部12により、原稿を所定走査
線ごとに分割して(ブロック)、その中で最小の白ラン
を持つ走査線位置と白ランを求め、画像端部点とする。
最小の白ランは各白ラン計測時に一回前の走査までに求
められており、前回までの最小の白ランと今回の白ラン
とを比較し、小さい方を取るようにすればよい。また、
この時、走査線の位置も残す。この処理を第3図に示す
ような各ブロック毎に行うと、第4図に示すような各ブ
ロック毎の画像端部点が得られる。画像端部線抽出部1
4は、画像端部点を最もよく連結できる直線を第8図に
示すように画像端部線として抽出する。原稿傾き算出部
15は垂直線と画像端部線との角度θを算出する。
本発明は以上のように、画像の白ランの最小値を所定間
隔毎に求め、その点列から画像の端部を求め、原稿画像
の傾きを検出するので、従来の技術のように時間の掛か
る複雑な処理を必要とせず、簡単な構成により高速に原
稿傾きを検出することができる。
(実施例) 第2図は本発明の実施例の原稿傾き検出装置を含む文書
画像処理装置の全体構成を示す。この文書画像処理装置
は、文書画像をデジタル画像として走査入力するイメー
ジスキャナ11人力画像を処理のため記憶するイメージ
メモリ2、本発明の原稿画像の傾き検出装置からなる原
稿傾き検出部3、装置全体を制御するCPU4、各要素
間でデータを送受するためのデータバス5、画像やメツ
セージを表示するモニター6、コマンドやデータをキー
人力するキーボード7、画像等を格納する外部記憶装置
8、画像を出力するプリンタ9からなっている。
第1図に本発明の原稿傾き検出部3の構成を示し、この
原稿傾き検出部3は、二次元走査部10、白ラン計測部
11、画像端部点抽出部12、端部格納部13、画像端
部線抽出部14および傾き算出部15からなっている。
二次元走査部10は、イメージメモリ上の文書画像を走
査アドレス信号16により二次元的に走査し、読み出し
た画像を順次、白ラン計測部11へ送ると共に、白ラン
計測部11へ1走査線毎に、白ランの計測を指示する一
次元走査開始信号17を供給し、また画像端部抽出部1
2および端部格納部13へ1ブロック終了信号18を供
給するものである。画像端部点抽出部12は所定の走査
線の範囲内で最小の白ランを抽出するものであり、1ブ
ロック終了信号18により、初期化される。1ブロック
終了信号18は上記所定の走査線数毎に出力される。端
部格納部13は、画像端部抽出部12で抽出された各ブ
ロック内の最小白ランとその位置を順次格納してゆ(も
のである。画像端部線抽出部14は端部格納部13に蓄
えられた、画像の端部情報から画像の端部を推定し、そ
れを直線として抽出し、傾き算出部15はその抽出した
直線と垂直線とのなす角度を原稿の傾き(回転角)とし
て出力するものである。
文書は、文書の開始部(横書き文書の場合は左端)は段
落の最初等を除いて揃うように、作成されるのが普通で
ある。したがって、そのように作成された文書は、画像
の左端がほぼ直線に接する。
これは画像が回転していても同様である。この直線を検
出できれば、原稿載置台等の標準位置からの原稿の傾き
θを求めることができる。
まず、原稿を所定走査線ごとに分割して(ブロック)、
その中で最小の白ランを持つ走査線位置と白ランを求め
る。白ランの計測は白ラン計測部11で行う。本実施例
の場合、標準位置の原稿の左端からの白画素の数をカウ
ントすればよい。最小の白ランは、各白ラン計測時に一
回前の走査までに求められている白ランと今回の白ラン
とを比較し、小さい方を取るようにすればよい。また、
この時、走査線の位置も残す。この処理を第3図に示す
ような各ブロック毎に行うと、第4図に示すような結果
が得られる。ブロックの大きさは原稿で1ないし2行に
相当する大きさ例えば1〜2cm程度で良い。
このような最小の白ラン長の点列即ち画像端部点列を求
める手順を第5図を用いて更に詳細に説明する。
二次元走査部10の初期設定として走査線番号■を1と
しくステップ21)、ブロック番号kを0に設定する(
ステップ22)。また、白ラン計測部11の初期設定と
して、最小白ラン長R1゜を文書の輻Wに設定しくステ
ップ23)、最小白ラン縦位[Y(k)をOに設定しく
ステップ24)、ブロック内走査綜数をbに設定する(
ステップ25)。
二次元走査部10からの走査線番号iに対応するアドレ
ス信号によりイメージメモリ2から走査線番号iの画像
が読み出され、白ラン計測部11に供給される。白ラン
計測部11はその白ラン長WRLを計測する(ステップ
26)。画像端部点抽出部12は、白ラン計測部11で
計測したデータを、もしそのデータが最初の走査線に関
するものであれば初期設定されたR II I mと比
較し、2番目以降の走査線に関するものであればそれま
での最小の白ランとして保持されている最小白ラン長R
a l mと比較する(ステップ27)、比較の結果R
,,,>WRLであれば、それまでの最小白ラン長に代
えて新しく計測した白ラン長を最小の白ラン長としてレ
ジスタ等に保持する(ステップ28)と共に、その走査
線番号1を最小白ラン縦位置Y (k)として保持する
(ステップ29)、もし、比較の結果R−+−< W 
RLであれば、上述のステップ28.29の最小白ラン
の更新は行わない。
一つの走査線の処理が終了すると、次の走査線の読み出
しを行うため、二次元走査部lOに保持されている走査
線番号iを1だけ増加すると共に、ブロック内走査線数
すの値を1だけ減する(ステップ30)。そしてbの値
を調べて(ステップ31)、b=oでなければまだブロ
ック内に読み出してない走査線部分があるので、走査線
i+1の処理を行うためステップ26へ戻る。b=0で
あれば、そのブロックの処理は終了ルでいるので、保持
されている最小白ランの閣僚1?ZY(k)と、これに
対応する最小白ラン長R11、即ちそのブロックにの最
小白ランの横位置X(k)とを画像の端部として端部格
納部13に格納する。以上のようにして一つのブロック
について最小白ランの縦横の位置で表わされる画像の端
部の検出処理が終ると、次のブロックの処理をするため
、ブロック番号kを1だけ増加する(ステップ33)。
ブロック番号kが分割ブロック数Bに達しているかを調
べ(ステップ34)、k=Bでなければ次のブロックの
処理をするためにステップ23に戻り、k=Bであれば
全てのブロックについて最小白ラフの検出処理が終了し
たことになるので、最小白ラン長点列を求める手順を終
了する。
次に抽出された画像の端部のデータからこれに最も合致
する直線を求める。抽出の方法は種々考えられるが、本
実施例では上記のデータの各2点から直線を求め他の点
との距離が最小になる直線を画像端部線とする方法を用
いる。
第6図はその画像端部線の式を求める手順を示すもので
ある。画像端部線抽出部14は、端部格納部13から白
ラン長X (k)の小さいものをn点抽出する(ステッ
プ35)。次に、画像端部線抽出部14は、抽出された
n点の各2点を通る直線X = a(1)・Y +b(
1)を求める(ステップ36)。
直線の数はN=−Cs=n!/ (n−2)L2t1=
0−N−1である。求めたN本の直線と画像端部点の全
点列のずれjlD(1)をそれぞれ求める(ステップ3
7)。そして、ずれjlD(1)が最小となるf=Iを
求め、そのIに対応する目的の直線X=a(I)・Y+
b(1)が得られる(ステップ38.39)。
第7図は前記ステップ37のずれ量D(1)を計算する
手順の一例を示すフロー図である。直線より左側にある
点は、かなり少ないので距離の重みを、直線の右と左で
変えるようにしている。原稿の下方向をY軸方向、右方
向をX軸にとり、直線の式をX == a (D・Y 
+ b (1)とし、データ点の座標を(x(k)、 
Y(k))とする。
まず、k=0.ずれ量D(1)=Oに設定する(ステッ
プ40)。k番目のデータのX座標が直mX=a、・y
十す。の左側にあるか右側にあるかを、X−X(k)≧
0つまり、ao4(k)+bo−X(k)≧Oであるか
否かりより判定する(ステップ41)。
判定の結果、左側にあるとき、即ち、ao−Y(k)+
bo−X(k)ao0とき、 D(k)== ao’Y(k)+ bo−X(k)とす
る。そして距離の合計D(1)を順次積算するため、す
でに得られて埴るD(1)との和を新しいD(1)とす
る。即ち、D(1)”D(1)+D(k)=D(1)+
 ao’Y(k)+bo−X (k)を算出する(ステ
ッープ42)。
判定の結果、右側にあるとき、即ちao・Y (k)十
bo−X(k)<Oのときは、 D(k);(X(k)−ao e Y(k)−bo) 
/ cとする。重みCは1以上とする。そして距離の合
計D(1)を順次積算するため、すでに得られているD
(1)との和を新しいD (+)とする。即ちD(1)
=  D(1)+  D(k) =  D([)+  
(ao  −Y(k)+  bo −X(k))/cを
算出する(ステップ43)。
k=に+ 1としくステップ44)、すべての端点につ
いて距離の計算が終了したかどうかを判定し、終了して
いなければ、ステップ41に戻って、次の画像端部点に
ついての距離の計算を続行し、全ての計算が終了してい
れば、一つの直線とのずれ量の算出手順を終了する(ス
テップ45)。
なお、直線を検出する他の方法として)tough変換
を用いてもよい。
以上のようにして画像の左端を示す画像端部線を画像端
部線抽出部14により求め、傾き検出部15により標準
の位置(垂直線)からのその画像端部線の傾きを示す回
転角を求める。システムとしてはこの後回転万分だけ逆
回転し、l1ii像を修正する。
本実施例では、画像の例として横書きのもので説明した
が、縦書きのものでも可能である。また、原稿として文
字のみで構成されたものだけでなく、帳票のような回り
に枠が有るような文書にも適用可能である。また、ラン
の計測箇所を左側の一辺のみで実施したが、他の辺も同
時に実施することにより、精度を上げることが可能であ
る。又、実施例では触れなかったが、画像入力時1〜2
画素程度のノイズが画像に乗ることがあるので、傾き検
出処理の前にノイズ除去処理が必要な場合もある。
(発明の効果) 本発明は以上のように、画像の白ランの最小値を所定間
隔毎に求め、その点列から画像の端部を求め、原稿画像
の傾きを検出するので、従来の技術のように時間の掛か
る複雑な処理を必要とせず、簡単な構成により高速に原
稿傾きを検出することができる。
【図面の簡単な説明】
第1図は本発明の一実施例による原稿傾き検出部の構成
を示す図である。 第2図は本発明の原稿傾き検出部を有する文書画像処理
装置の構成の一例を示す図である。 第3図は原稿の分割の例を示す図である。 第4図はブロック内最小うン位置の説明図である。 第5図は最小の白ラン長点列を求める手順の一例を示す
フローチャートである。 第6図は画像端部点列から直線の式を求める手順の一例
を示すフローチャートである。 第7図はずれ量の算出手順の一例を示すフローチャート
である。 第8図は原稿傾き検出の説明図である。 l・・・イメージスキャナ、2・・・イメージメモリ、
3・・・原稿傾き検出部、4・・・CPU、5・・・デ
ータバス、8・・・モニター 7・・・キーボード、8
・・・外部記憶装置、9・・・プリンタ、lO・・・二
次元走査部、11・・・白ラン計測部、12・・・画像
端部点抽出部、13・・・端部格納部、14・・・画像
端部線抽出部、15・・・傾き算出部。 第 図 第 図 第5図 第6図 第7図 第 図 θ 嵐稿べ頃さ

Claims (1)

  1. 【特許請求の範囲】 ページ単位の文書画像を処理するデジタル画像処理装置
    において、 画像の各走査線の白ラン長を計測する白ラン計測部と、 白ラン計測部により計測した白ラン長を所定の複数走査
    線内で比較し、最小の白ラン長とその走査線位置を画像
    端部点として抽出する画像端部点抽出部と、 複数の画像端部点を最もよく連結できる直線を画像端部
    線として抽出する画像端部線抽出部と、その画像端部線
    抽出部により得られた画像端部線の垂直線からの傾きを
    算出する傾き算出部とを備えたことを特徴とする原稿傾
    き検出装置。
JP63311978A 1988-12-12 1988-12-12 原稿傾き検出装置 Pending JPH02158882A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63311978A JPH02158882A (ja) 1988-12-12 1988-12-12 原稿傾き検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63311978A JPH02158882A (ja) 1988-12-12 1988-12-12 原稿傾き検出装置

Publications (1)

Publication Number Publication Date
JPH02158882A true JPH02158882A (ja) 1990-06-19

Family

ID=18023728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63311978A Pending JPH02158882A (ja) 1988-12-12 1988-12-12 原稿傾き検出装置

Country Status (1)

Country Link
JP (1) JPH02158882A (ja)

Similar Documents

Publication Publication Date Title
JP2940960B2 (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
JP3302724B2 (ja) 画像処理装置
Sun et al. Skew and slant correction for document images using gradient direction
EP0543593B1 (en) Method for determining boundaries of words in text
EP0543590B1 (en) Method for comparing word shapes
JP3841321B2 (ja) 画像レジストレーション方法
US20030095709A1 (en) Multiple image area detection in a digital image
JPH02285475A (ja) エッジとラインとの抽出方法とその装置
JPH05242298A (ja) 記号列の認識方法
JP2003529114A (ja) 光学スキャナとそのためのソフトウエア
JP4114959B2 (ja) 画像処理方法及び装置
WO2016086877A1 (zh) 一种文本检测的方法和装置
EP2536123A1 (en) Image processing method and image processing apparatus
JP3471578B2 (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
JP3303246B2 (ja) 画像処理装置
JPH1196372A (ja) 画像処理方法およびその装置、ならびに画像処理用の制御プログラムの記録媒体
JPH02158882A (ja) 原稿傾き検出装置
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JP2002536709A (ja) 第1の構造と少なくとも1つの予め設定された第2の構造との類似度を算出するための方法及び装置
JPH05174182A (ja) 文書傾き角検出方法および文書傾き角検出装置
JP3311551B2 (ja) イメージデータ入力処理方法およびその装置
JPH06281421A (ja) 画像処理方法
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JPH03212780A (ja) 文字列傾き検出装置