JPH03213053A - 原稿傾き検出装置 - Google Patents

原稿傾き検出装置

Info

Publication number
JPH03213053A
JPH03213053A JP2007065A JP706590A JPH03213053A JP H03213053 A JPH03213053 A JP H03213053A JP 2007065 A JP2007065 A JP 2007065A JP 706590 A JP706590 A JP 706590A JP H03213053 A JPH03213053 A JP H03213053A
Authority
JP
Japan
Prior art keywords
reference point
processing
document
image
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007065A
Other languages
English (en)
Inventor
Yutaka Nakamura
豊 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2007065A priority Critical patent/JPH03213053A/ja
Publication of JPH03213053A publication Critical patent/JPH03213053A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【産業上の利用分野】
本発明は、文書画像認識装置等のページ単位の文書画像
を処理するデジタル画像処理装置における入力画像の傾
き検出装置に関する。
【従来の技術】
入力画像から文字領域、図形領域、写真領域を抽出する
ときや文字領域の中から一文字づつ切り出して認識する
とき、画像が傾いていると、切り出し処理が非常に難し
くなるばかりでな(、認識も困難になることがある。 従来、原稿の傾き検出は、原稿画像を微小角度毎に回転
させ周辺分布を取り、分布が最も急峻になった回転角を
原稿傾きとする手法〔電子通信学会研究報告(信学技報
) PR−L80−70.PP9−16)や、文字列の
疑似的な中心線を求めて、その傾きにより、原稿傾きを
抽出する手法〔信学論 84/1.1゜VOL、67D
 、 mll、 PP1277−1284)や、二次元
フーリエ変換(F F T)により、文字や文字列の空
間分布を求めて、それから角度を推定する手法〔信学論
 ’84/9. VOL、67D 、 1m 9 、 
PP1044−1051)等が提案されている。 C発明が解しようとする課Hi】 しかし、各手法とも、数回の画像回転、画像の膨張・細
線化処理、二次元FFT等時間の掛かる複雑な処理が必
要となっている。 本発明は、以上のような従来技術の問題点を解決し、単
純で短時間で簡単に原稿傾きを求めることを目的とする
【課題を解決するための手段】
上記目的を達成するための本発明の原稿傾き検出装置は
、第1図に示すように、ページ単位の文書画像を処理す
るデジタル画像処理装置において、2値画像の黒画素に
対して、黒画素を含む外接矩形を求める矩形化処理部1
と、その矩形化処理部lにより得られた外接矩形から傾
き検知の基準となる点を抽出する基準点抽出部2と、そ
の基準点抽出部2により得られた傾き検知の基準点に基
づき入力原稿の傾きを算出する傾き算出部3とを備えて
いる。
【作 用】
入力された文書画像は2値化されて矩形化処理部1に入
力される。 矩形化処理部1は、入力された2値画像の各黒画素群の
領域に外接する外接矩形を求め、各領域が矩形化された
画像を出力する。 基準点抽出部2は、矩形化処理部1により矩形化された
画像の各外接矩形を代表する一点(例えば外接矩形の4
ずみのいずれか一点)の座標を、傾き検知を求める基準
となる基準点の位置として求める。この基準点は例えば
マスク走査と論理演算とを組み合せた単純な処理により
求めることができる。 傾き算出部3は基準点抽出部2により求めた基準点の座
標に基づいて入力原稿の傾きを算出する。 例えば、基準点群を最もよく結ぶ直線をハフ(Houg
h)変換を用いて推定し、その推定により求めた直線の
傾斜により原稿の傾きを得る。
【実施例】
第2図は本発明の一実施例による文書画像処理装置の全
体構成を示すものである。この文書画像処理装置は、文
書画像をデジタル画像として走査入力するイメージスキ
ャナ11、入力画像を処理のため記憶するイメージメモ
リI2、本発明の原稿画像の傾き検出を行うために矩形
化処理および基準点の抽出をする特徴点抽出部13、装
置全体を制御するCPU14、データバス15、画像や
メツセージを表示するモニター16、キーボード17、
画像等を格納する外部記憶装置18、および画像を出力
するプリンタ19等からなっている。 第3図は第2図における本発明の原稿傾き検出に関する
部分を示す図であり、イメージメモリ12を呼び出すた
めのアドレスを発生するアドレス発生装置20を有し、
特徴点抽出部13はラスタ走査型マスク処理装ff!2
1.外接矩形処理マスク12および特徴抽出処理マスク
23等からなっている。 イメージメモリ12に格納されたデータはアドレス発生
装置20により指定された順にテスク走査型マスク処理
装置21に送られる。 テスク走査型マスク処理装置21は外接矩形処理マスク
パターン22より、入力データの外接矩形を求める。 さらに特徴抽出処理マスクパターン21より傾き検出の
基準となる点を抽出するとともに、その結果をイメージ
メモリ12に格納する。 傾き検出はCPU 14を用いて、イメージメモリ内の
基準点をもとにHough変換を行い、原稿の傾きを求
める。 以下、本実施例の動作をさらに詳細に説明する。 第4図には人力される原稿例として、傾いていない文書
(a)、および傾いた文書(b)を示す。 第4図(b)かられかるように、傾いた文書では文字を
行単位でとらえると、行が右方向に進むに従って下にず
れて(る。このようなずれは人間にとっては明らかであ
るが、計算機は画像を面ととらえる処理が不得意である
ため、このままではずれを検知することが難しい。この
ずれを検知しやすくするために外接矩形を用いる。外接
矩形処理を行うことにより、個々の文字が矩形となり、
それぞれの矩形をか座標値、幅、高さなどの計算機にと
って扱やすいデータ形状とすることができる。第4図(
a)の傾きのない原稿および同図(b)の傾きのある原
稿をそれぞれ外接矩形処理を施した例を第5図(a)お
よび(b)に示す。 ここで、外接矩形化処理について説明する。外接矩形化
処理は種々の公知の方法、例えば画像の輪郭線を追跡し
黒画素群を含む要素の最小x+3’座標および最大のX
、y座標を求めることにより外接矩形を得る方法、があ
り、これらの任意の方法を用いることができる。本願の
発明者はこれらの公知の矩形化処理方法を改良して高速
にかつ精度良(矩形化処理を行う外接矩形処理方法を先
に提案した(特願平1−87039号「画像領域識別装
置およびそれに使用できる構造情報抽出装置」)。本実
施例では、この特願平1−87039号の技術を用いた
場合について説明する。 入力されたアナログ画像はデジタル変換された後、2値
処理される。アナログ値をデジタルの2値に圧縮するた
め、画像が持っている各種情報(特に濃度に関する情報
)の多(が失われる。しかし、大局的な特徴として文字
、図形、表、中間調等の各構造情報が独立して存在する
という情報は2値画像になってもに失われない。そこで
その情報を積極的に利用することによって、構造情報を
独立して矩形領域で囲むことができる。 ここでは構造情報の抽出方式の一例として文字である「
辺」という画像を例として説明する。 第6図に「辺」という文字を画素単位で示す。 図に示すように、文字領域などは含まれていない。 そこでこの画像中に含まれる黒画素をもとに、ある一定
の領域で囲むことができれば、その領域は一意の属性(
文字、図形、表、中間調)で表すことができる。 そこでこの画像に対して第7図(a)に示すマスクパタ
ーンを用いて左上から右下に黒画素の連結を行う。注目
画素に対して上の画素、左の画素が共に黒画素であった
ならば注目画素を黒画素に変換する処理を行う。このマ
スク処理を行った例を第7図(b)に示す。黒画素を右
手方向に連結した画像が得られる。 次に第8図(a)に示すマスクパターンで右上から左下
に対して黒画素連結処理を行う。得られた結果を第8図
(b)に示す。先程の処理と逆に左方向に黒画素を連結
した画像が得られる。 次に第9図(a)に示すマスクパターンで左下から右上
に対して黒画素連結処理を行う。得られた結果を第9図
(b)に示す。文字全体がほぼ矩形領域で囲まれてきた
ことがわかる。 最後に第10図(a)に示すマスクパターンで右下から
左上に対して黒画素の連結処理を行う。 得られた結果を第10図(b)に示す。 このように一連の4回の処理を行うことにより文字領域
を矩形で囲むことができる。 黒画素の連結処理は順次的であるため専用ハードウェア
化が可能であり、より高速な処理を行うこともできる。 第3図において、イメージメモリ12には2値化された
画像が最初記憶され、その記憶画像はアドレス発生装置
によって順次アドレス指定されて読み出され、データバ
ス5を介してラスタ走査型マスク処理装置21へ与えら
れる。外接矩形処理マスク22を含むラスタ走査型マス
ク処理装置21は、例えば第11図のように、1ライン
分の遅延記憶を行うラインメモリ31、■画素分の遅延
のためのラッチ回路32、アンド回路33およびオア回
路34からなる簡単な回路によって構成することができ
る。 次に外接矩形から角度検知の基準となる点を抽出する。 第5図より外接矩形はほぼ同じ形をしている。これは文
字の大きさがほぼ等しいことを意味している。文書画像
には種々の大きさの文字が含まれるが行単位でみた場合
は同じ大きさの文字であるといえる。そこでこの外接矩
形を1つの基準点で表すことが可能となる。外接矩形の
基準となる点としては外接矩形の4ずみのいずれかの1
点1重心等が考えられる。ここでは−例として左下の点
を抽出する方式について説明する。 入力画像はすべて矩形であるため、左下の点を抽出する
場合は第12図に示す特徴抽出処理マスクでマツチング
をとることにより抽出することができる。このマスクパ
ターンは、注目パターンが黒で、■画素左、下の画素が
白画素であった場合、注目画素は外接矩形の左下の点で
あるとして出力するものである。この処理は第3図の特
徴抽出部13において特徴抽出処理マスク23とラスタ
走査型マスク処理袋!21により行う。この処理は外接
矩形処理と基本的に同等の処理であるため、マスクパタ
ーンの変更のみで対処できる。回路構成としては、例え
ば、第13図に示す回路を用いる。アドレス発生装置に
よるマスク走査のアドレスを第9図(a)に示すような
走査方向となるよう発生してイメージメモリ12から順
次画像を読み出して、注目画素の下の画素(1ライン前
の対応画素)をラインメモリ35から得、注目画素の左
の画素(1画素前の画素)をラッチ回路36から得て、
NAND回路37によりNAND演算をし、NAND演
算結果と注目画素とのANDをAND回路38により行
うことにより、各矩形の左下の角の点を抽出する。処理
結果の一例を第14図に示す。 第14図に示すように処理結果は、基準点は少なく、デ
ータが圧縮されていることがわかる。また矩形の大きさ
にかかわらず1点に圧縮するため、図形、中間調のよう
な大きな矩形が存在した場合も問題がないことがわかる
。 最後に傾き検知の基準点から原稿の傾きを求める処理を
行う。この処理には、線を検出するのに有効な手法であ
るHough変換を用いる。即ち、Hough変換によ
り基準点のグルービングを行う。Hough変換の角度
検出精度をあまくして、おなし角度に近い直線の点を集
め、集まった点から傾きを最小2乗法で求める。 ここで、Hough変換について簡単に説明する。 第15図(a)(b)にHough変換の説明の図を示
す。XY座標系で表される1点aを通る直線は、無数に
考えられるが、その直線を原点からの距離pと、なす角
θで表すと、次の関係式が成立する。 p=Xcosθ+Ysinθ 従って、点aを通るすべての直線は、上式θを0〜18
0度までふることにより求めることができる。つまりX
Y座標系の点aが第15図(b)に示すpθ座標系の1
曲線すに変換される。この操作をすべての基準点につい
て行うと、xY座標系の1直線上にある点はすべて同じ
p、θで表されるため、pθ座標系の1点に収束する。 このように、Hough変換を用いるとXY座標系の魚
群から直線群を抽出することができる。 この)(ough変換を第14図の画像に適用すると第
16図(a)(b)で示される直線群が抽出される。こ
の直線のθより原稿の傾きが推定される。 )1ough変換は一般には処理速度の遅さが問題とな
るが、木刀発明では、データの圧縮を行っているため問
題はなφ。そのため高精度の検知を高速に行うことがで
きる。 以上に詳述した実施例では、すべての外接矩形に対して
基準点を求めたが、基準点を求める前処理として、しき
い値処理を行い、ある程度率さい矩形は処理対象からは
ずす手法が考えられる。この処理を行うことにより、ノ
イズ成分が除去されるばかりでな(、破線のように処理
対象から省きたい者も除去できるため、データ圧縮のみ
ならず、測定精度も向上する。 また、実施例では横書き文書を例に説明を行ったが、こ
の方式は縦書き文書についても同様にできる。 さらにこの傾きと文書の関係より文書に対して縦方向、
横方向のどちらに行があるかが判定できるため、縦書き
/横書きの判定および角度修正が可能となる。 【発明の効果] 本発明は、外接矩形処理を基本として、矩形を代表する
基準点を求め、これを傾き検知の基準となる点とすると
ともに、その段階でデータ圧縮が行われたことになる。 従って、基準点をもとに原稿の傾き角を算出する処理速
度は速くなる。 また、本発明によれば、従来のように画像回転、画像の
膨張・細線化処理、二次元FET等の時間のかかる処理
を必要とせず、かつ高精度の角度検出が可能となる。 基準点の抽出を、ラスタ走査と論理演算をもとに順次的
な処理により行うようにした場合、専用ハードウェア化
が可能であり、基準点抽出処理がより高速となり、ひい
ては原稿傾き検出装置の全体としての処理速度も一層速
くなる。 さらに、基準点を元にした傾き角の算出にH。 ugh変換を用いるようにした場合、−層正確な角度の
算出ができる。
【図面の簡単な説明】
第1図は本発明の基本的な構成を示すブロック図である
。 第2図は本発明を実施した文書画像処理装置の一例を示
す図である。 第3図は原稿傾き検出部の構成を示す図である。 第4図は入力原稿の一例を示す図で、(a)は原稿傾き
のない場合、(b)は原稿傾きのある場合を示す図であ
る。 第5図(a)および(b)は、それぞれ第4図(a)お
よび(b)の各入力原稿画像の外接矩形を示す図である
。 第6図は、外接矩形を説明するための文字の一例を示す
図である。 第7図〜10図は、外接矩形を求めるための黒連結処理
の過程を説明するための図であり、各(a)は黒連結の
マスクパターンと走査方向を示し、各(b)はそれぞれ
の過程での黒連結処理の結果を示す図である。 第11図は矩形化処理のための回路の一例を示す図であ
る。 第12図(a)は角度検知基準点を求めるマスクパター
ンの一例を示す図であり、同図(b)は外接矩形におけ
るマスクパターンを示す図である。 第13図は角度検知基準点を求めるための回路の一例を
示す図である。 第14図(a)および(b)は、第5図(a)および(
b)に示す外接矩形から求めた角度検知基準点の一例を
示す図である。 第15図(a)および(b)は、Hough変換による
直線の求め方を説明するための図である。 第16図(a)および(b)は、直線推定の一例を示す
図である。 1・・・矩形化処理部、2・・・基準点抽出部、3・・
・傾き算出部、11・・・イメージスキャナ、12・・
・イメージメモリ、13・・・特徴点抽出部、14・・
・CPU、15・・・バス、16・・・モニター 17
・・・キーボード、18・・・外部記憶装置、19・・
・プリンタ、20・・・アドレス発生装置、21・・・
テスク走査型マスク処理装置、22・・・外接矩形処理
マスク、23・・・特徴点抽出処理マスク。

Claims (3)

    【特許請求の範囲】
  1. (1)ページ単位の文書画像を処理するデジタル画像処
    理装置において、 2値画像の黒画素に対して、黒画素を含む外接矩形を求
    める矩形化処理部と、 矩形化処理部により得られた外接矩形から傾き検知の基
    準となる点を抽出する基準点抽出部と、基準点抽出部に
    より得られた基準点に基づき入力原稿の傾きを算出する
    傾き算出部と を備えたことを特徴とする原稿傾き検出装置。
  2. (2)前記基準点抽出部は、ラスタ走査と論理演算をも
    とにした処理より基準点を求めるものであることを特徴
    とする請求項(1)記載の原稿傾き検出装置。
  3. (3)傾き算出部はハフ(Hough)変換を用いて傾
    きを求めるものであるることを特徴とする請求項(1)
    記載の原稿傾き検出装置。
JP2007065A 1990-01-18 1990-01-18 原稿傾き検出装置 Pending JPH03213053A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007065A JPH03213053A (ja) 1990-01-18 1990-01-18 原稿傾き検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007065A JPH03213053A (ja) 1990-01-18 1990-01-18 原稿傾き検出装置

Publications (1)

Publication Number Publication Date
JPH03213053A true JPH03213053A (ja) 1991-09-18

Family

ID=11655668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007065A Pending JPH03213053A (ja) 1990-01-18 1990-01-18 原稿傾き検出装置

Country Status (1)

Country Link
JP (1) JPH03213053A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2136318A2 (en) 2008-06-19 2009-12-23 Canon Kabushiki Kaisha Image processing apparatus and image processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2136318A2 (en) 2008-06-19 2009-12-23 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US8326085B2 (en) 2008-06-19 2012-12-04 Canon Kabushiki Kaisha Image processing apparatus and image processing method

Similar Documents

Publication Publication Date Title
CN108960229B (zh) 一种面向多方向的文字检测方法和装置
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH0685183B2 (ja) 2次元像による3次元物体の同定方法
EP1081648B1 (en) Method for processing a digital image
US8615129B2 (en) Pattern separating extraction device, and pattern separating extraction method
JPH03213053A (ja) 原稿傾き検出装置
CN115187744A (zh) 一种基于激光点云的机柜识别方法
EP0702320A1 (en) Skew detection
JP4238323B2 (ja) 画像処理方法及び画像処理装置
JP2770849B2 (ja) 画像処理装置
JPH0373915B2 (ja)
JP3095470B2 (ja) 文字認識装置
CN111797843B (zh) 一种激光标刻汉字轮廓的提取方法、系统、存储介质及设备
JP2004151815A (ja) 特定領域抽出方法、特定領域抽出装置、特定領域抽出プログラム及びそのプログラムを記録した記録媒体
JP2800192B2 (ja) 高速文字図形分離装置
JP2803224B2 (ja) パターンマッチング方法
JP2795860B2 (ja) 文字認識装置
Yıldırım et al. Recognition of Single-Land Countries on Outline Images by Using BAS Feature
JP2755299B2 (ja) 画像処理方法
JPS59140589A (ja) 輪郭抽出装置
JPH08226961A (ja) 自動目標識別装置
JPH0656625B2 (ja) 特徴抽出方式
JP3536589B2 (ja) 高速ハフ変換装置
Kiiko et al. Fast dilation and skeletonization of compressed binary pictures
JPH08315155A (ja) 図形前処理装置