JP2644724B2 - 文書画像傾き補正方法 - Google Patents

文書画像傾き補正方法

Info

Publication number
JP2644724B2
JP2644724B2 JP60152210A JP15221085A JP2644724B2 JP 2644724 B2 JP2644724 B2 JP 2644724B2 JP 60152210 A JP60152210 A JP 60152210A JP 15221085 A JP15221085 A JP 15221085A JP 2644724 B2 JP2644724 B2 JP 2644724B2
Authority
JP
Japan
Prior art keywords
contour
document image
distribution
inclination
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60152210A
Other languages
English (en)
Other versions
JPS6214277A (ja
Inventor
康明 中野
浩道 藤澤
純一 東野
歳弘 花野井
清道 栗野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60152210A priority Critical patent/JP2644724B2/ja
Publication of JPS6214277A publication Critical patent/JPS6214277A/ja
Application granted granted Critical
Publication of JP2644724B2 publication Critical patent/JP2644724B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は画像処理方式に係り、特に文書画像の傾きの
正規化に好適な画像処理方式に関する。
〔発明の背景〕
従来の文書画像処理特に二値文書画像処理において、
画像を光電変換及びデイジタル化を行つて、入力画像を
デイジタル画像に変換してから処理を行うのが普通であ
る。この際用いる光電変換及びデイジタル化のための装
置をスキヤナと呼ぶ。画像の入力の際、文書とスキヤナ
との相対的な傾きは避けられず、その結果生ずる画像の
傾きは文書画像処理、たとえば文書中の文字列の抽出に
悪影響を及ぼす。また文書とスキヤナとの相対的な傾き
を極めて小さくできたとしても、文書をタイプライタで
作成する場合や文書を複写した場合など、文書中の文字
列が用紙に対し元々傾いていることもある。
従来技術ではこのような問題点に対処するため、文書
画像を複数の方向に対して積分し、その積分値がピーク
となるような方向を求め、その方向が紙面のエツジとな
す角度だけ文書画像を回転する方法が知られており、た
とえば昭和59年度電子通信学会全国大会講演論文集第17
69番「黒色背景を有する帳票上の文字切り出し方式」で
報告されている。しかし、この方法は処理量が尨大とな
るため高速処理が望まれていた。
〔発明の目的〕
本発明の目的は、画像の傾きを高速に補正できる文書
画像処理方式を提供することにある。
〔発明の概要〕
かかる目的を達成するために、本発明は、画像の文字
列、または文字列の構成要素の輪郭に外接する矩形を求
め、この矩形の傾きが水平(あるいは垂直)になるよう
に傾きを補正することにより画像の傾きを高速に補正す
ることを特徴とする。第1図にその原理を示す。第1図
(A)は文書画像の例、(B)は(A)から輪郭抽出を
行つて得られる画像、(C)は(B)の中で外輪郭だけ
を抽出した画像を示す。(A)の罫線11に対応して、
(B)の輪郭21が得られる。(C)の21は同じ輪郭を示
す。輪郭は、その上を黒地を左に見て一周するときの座
標系列として表現されており、その場合反時計方向に一
周するならば外輪郭、時計方向に一周するならば内輪郭
として区別できる。輪郭座標系列を (Xi,Yi),i=0,1,2,,,(L−1) とする(Lは点列の長さ)。このとき2個の量 (Xi−Yi),(Xi+Yi) の最大値及び最小値を与える点を求めることにより、第
1図(D)のように輪郭21の4隅を求めることができ
る。ただし、(D)では輪郭21は拡大して示してある。
全ての輪郭について輪郭の4隅を求め、その間の距離を
求めることにより、細長い輪郭のみを抽出することがで
きる文書上に(水平の)罫線と文字部のみしか存在しな
いことが分つている場合、上記の細長い輪郭は罫線であ
り、その水平線となす角度もまた輪郭4隅の座標を用い
て求めることができる。この角度を用いて、罫線が水平
となるように文書画像全体を回転すればよい。回転は、
原画像を直接回転してもよいが、輪郭座標系列について
座標変換した後、画像に戻してもよい。また、文書上に
罫線以外の細長い模様が存在するときは、輪郭4隅の間
を結ぶ点列の直線性を検定して罫線のみを抽出できる。
また、文書上の直線として斜線や垂直線も存在するとき
は、同様に直線の傾きを求めて水平線と垂直線(ほぼ水
平または垂直に近い線)のみを抽出し、そのどちらかを
用いて傾きを補正すことにより画像の傾きを高速に補正
するればよい。
また、本発明の態様においては、画像から抽出された
輪郭に対して特徴量を求め、この特徴量をいろいろな方
向に積分し、その積分値がピークとなるような方向を求
め、その方向が紙面のエツジとなす角度だけ傾きを補正
することにより画像の傾きを高速に補正するものであ
る。
画像から抽出された輪郭に対する特徴量の例として
は、輪郭(外輪郭)に外接する長方形を作り、その辺の
長さを取ることができる。この方法は、罫線が存在しな
い場合に文字列の傾きを求めるために使用できる。第2
図、第3図にその原理を示す。第2図(A)は文書画像
の例、(B)は(A)から輪郭抽出を行つて得られてい
る画像、(C)は(B)の中で外輪郭だけを抽出した画
像を示す。(C)の外輪郭から(D)のような外接長方
形を作る。外接長方形の座標は、輪郭点列座標の最大値
と最小値とから容易に求められるが、これを、 (PXj,PYj),(QXj,QYj),(RXj,RYj),(SXj,SYj) とする。ここで、P,Q,R,Sはそれぞれ、外接長方形jの
左上、左下、右下、右上を表す。すなわち、 (QXj,QYj),(RXj,RYj) はそれぞれ、外接長方形jの下辺の両端を表す。このと
き、ある角度αに対し次の量V(α)を計算する。ま
ず、ヒストグラムを格納する配列 H(k),k=0,1,,,(N−1) を0クリアする。Nは文書画像をM×Nとしたきの縦の
長さである。つぎに、jに関するループにより H(Kj)←H(kj)+|QXj−RXj| ただし、Kj=G[QYj−QXj・tan(α)] を計算する。上記において記号←はプログラム記法にお
ける代入を意味し、G[x]は実数xを整数に変換する
関数である。すなわち第3図に示すようにKjは、31の外
接長方形jの左下隅の点Qjから角度αの直線を引いたと
き、画像の左辺32と交わる点のY座標である。したがつ
て、ヒストグラムH(Kj)は角度αだけ画像を傾けて外
接長方形jの下辺の長さを積分することに相当する。こ
れを角度α方向の辺長周辺分布と呼ぶ。jに関するルー
プが終了すると V(α)=Σ|H(k)−H(k−1)| を計算する。V(α)は角度α方向の辺長周辺分布の鋭
さを表す量である。角度αを例えば−2°から+2°ま
で0.1°きざみで変化させ、V(α)の最大となる角度
を求めることにより、外接長方形の下辺が最もよく重な
るような方向が求まる。一般に文字の行はほぼ下辺が揃
つて印刷あるいは書かれるから、これが同じ線上に並ぶ
ような角度は文字列の傾きと考えることができる。
〔発明の実施例〕
以下、本発明の実施例について図面を用いて詳細に説
明する。
第4図は本発明の一実施例による文書処理方式を採用
した装置の構成を示すプロツク図である。装置の各部は
バス1に接続され、全体の動作は制御部2により制御さ
れる。文書3上の情報(文書画像)はスキヤナ4により
光電変換・デイジタル化されてデイジタル画像となり、
バス1を介してメモリ51に各納される。メモリ51は後述
する52,53,54とともにメモリ5の一部をなす。デイジタ
ル画像51をスキヤナ4から得る代わりに、光デイスクな
どのデイジタル画像フアイル装置から読みこんでもよ
い。また、以下の説明では1画素1ビツトに二値化する
ものとするが、1画素を多値で表現したものや、カラー
スキヤナにより光電変換して色情報を付与したもので
も、処理に僅かの変更を加えるのみで適用できることは
明らかである。
制御部2のソフトウエアにより、メモリ51中の画像に
対し輪郭抽出を行い、メモリ52に格納する。輪郭抽出は
公知の手法を使用すればよいので詳細は省略する。輪郭
抽出の代わりにいわゆる連結領域抽出法を使用してもよ
い。次に後述するようにして、メ字リ52の中の輪郭デー
タからその4隅の座標を求め、メモリ53に各納する。次
にメモリ52中の輪郭データに対し傾き補正処理を行い、
補正後の輪郭データをメモリ54に格納する。この補正後
の輪郭データから内部を塗り漬した画像を生成し、メモ
リ51に傾き補正した画像を得る。補正完了後、コンソー
ル6を用いた使用者との対話により、この画像を格納す
べきフアイル7中のアドレスを決定し、フアイル7に格
納する。
次に、本発明の説明のために、4隅の抽出と傾き補正
処理の詳細を、罫線が存在する場合を例にとり説明す
る。
第5図は、これらの処理の流れを説明する図である。
処理の流れは、PAD(Program Analysis Diagram)形式
で書かれている。101で文書画像の輪郭データ(メモリ5
2中にある)を入力する。102は、輪郭iに関するループ
制御である。
103で各輪郭の輪郭データからそのX座標及びY座標の
和及び差 (X(i)−Y(i)),(X(i)+Y(i)) の最大値及び最小値を抽出する。iは輪郭上の番号。こ
の4個の数値を与えるiから輪郭の4隅の座標 (PXi,PYi),(QXi,QYi),(RXi,RYi),(SXi,SYi) が決まる。(前述した外接長方形の4隅とは異なること
に注意)。
104〜109は罫線判定処理を行う部分である。103では
最大値Rmaxの初期化を行う。
104は、輪郭iに関するループ制御である。
106で幅Wiと高さHiの比をそれまでの最大値と比較し、
新しい最大値の場合は107でRmaxを更新しそのときのi
をimとして登録する。108では輪郭imの幅Wiと高さHiが
ある範囲に入つているかを判定する。範囲に入つている
とき、輪郭imは水平の罫線(複数ある時は最も細長いも
の)であると判定し、109で罫線と判定された輪郭imの
傾きθを求める。ただし、 θ=arctan((SYi−RYi)/(SXi−RXi)) また、110は、失敗したときの出口である。
111〜116は傾き補正処理した画像を生成する部分であ
る。111は、出力画像エリアBをクリアする。112は、輪
郭iに関するループ制御である。113は、輪郭iを構成
する点jに関するループ制御である。114は点jの座標
(Xj,Yj)を傾き補正した座標(Xj,Yj)を計算式 Yj′=Yj−Xj・tan(θ) によつて求める処理である。115は画素B(Xj,Yj)を1
とするもので、出力画像エリア上に輪郭iの点列データ
をマツピングする処理である。116は輪郭内部を塗り漬
す処理であり、外輪郭では内部を黒で、内輪郭では内部
白で塗り漬す。外輪郭を塗り漬した後、内輪郭をを塗り
漬すようにすれば、原パターンが完全に復元される。
以上の説明から理解されるように、傾き補正はずれ変
形を用いているが、回転変形を用いることもできる。
また、108の罫線判定の論理を変更することにより罫
線の代りに表の上下辺あるいは左右辺を使用することも
できる。
次に、本発明の実施例について説明する。本実施例に
よる文書処理方式を採用した装置の構成は先に説明した
例と同様であり、制御部2における処理が異なつてい
る。本実施例では、文字列の傾きを検出して傾き補正を
行うものであり、先に説明した例と異なる点は傾き検出
の部分であるので、この部分について説明する。
第6図は、本発明の実施例における傾き検出の処理の
流れ図であり、第5図の103〜107の罫線判定処理を行う
部分に対応する。第6図で201〜211は文字列の傾きを検
出する部分である。201は、Vmaxを初期値にセツトす
る。202は、角度αに関するループ制御である。203はV
(α)の初期値を0にセツトする。204はバツフアエリ
ア H(k),k=0.1,,,(N−1) を0クリアする。205は輪郭iに関するループ制御であ
る。206は、輪郭iの外接長方形の下辺の両端の座標 (QXi,QYi),(RXi,RYi) を求める。207は輪郭iの大きさがある範囲に入つてい
るときのみ208以降の処理を行う。208は H(Kj)←H(Kj)+|QXj−RXj| ただし、Kj=QYj−QXj・tan(α) を計算する。輪郭iに関するループが終了すると209で
α方向の辺長周辺分布の鋭さを、次式 V(α)=Σ|H(k)−H(k−1)| によつて計算する。210,211はV(α)の最大値を与え
るαの値αm及び最大値Vmaxを更新する。202のループ
を終了したときのαmが文字列の傾きを与える。
以上の説明から理解されるように、先に説明した例及
び本発明の実施例では罫線あるいは文字列はほぼ水平で
あるとしたが、これらが垂直の場合であつても処理内容
をそのように変更することは容易である。また、これら
の傾きが水平か垂直か不明の場合でも、水平あるいは垂
直に近い方向の直線を選択し、それを用いて傾き補正す
るように処理内容を修正することは容易である。
〔発明の効果〕
以上の説明から理解されるように、本発明では傾き補
正で対象とする演算が全画素ではなく、黒領域の輪郭の
みであるので処理量が著しく減少しているため、文書の
傾き補正を高速に行うことができる。
また、文字列に着目する本発明では、罫線の存在しな
い文書でも補正が可能である。また論郭の大きさを判定
して文字らしい輪郭のみ積分し、文字以外の模様や雑音
を積分から除外しているので、高速性と耐雑音性を兼ね
備えることができる。
【図面の簡単な説明】
第1〜3図は本発明の原理を説明する図、第4図は本発
明の文書処理方式を実施する装置の構成を示すブロツク
図、第5図及び第6図は第4図の制御部2における処理
の流れ図である。 1……バス、2……制御部、3……文書、4……スキヤ
ナ、5……メモリ、6……コンソール、7……フアイ
ル。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 東野 純一 国分寺市東恋ヶ窪1丁目280番地 株式 会社日立製作所中央研究所内 (72)発明者 花野井 歳弘 小田原市国府津2880番地 株式会社日立 製作所小田原工場内 (72)発明者 栗野 清道 小田原市国府津2880番地 株式会社日立 製作所小田原工場内 (56)参考文献 特開 昭60−27079(JP,A) 特開 昭58−100568(JP,A) 特開 昭58−169293(JP,A) 特開 昭57−52971(JP,A)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文書画像を入力し、 入力した文書画像の複数の黒画素連結成分からそれぞれ
    に対応する輪郭データを抽出し、 その輪郭に外接する矩形の頂点座標を上記複数の輪郭デ
    ータに対して検出し、 上記複数の輪郭データに対してそれらの頂点座標に基づ
    いた検出値として上記外接する矩形の辺の長さを算出
    し、 上記検出値を複数の方向角度に投影して積分し、それら
    複数の方向角度のそれぞれに対応した周辺分布を求め、 それら複数の周辺分布のなかで周辺分布の鋭さが最大で
    ある周辺分布を選択し、その選択した周辺分布に対応す
    る方向角度を文書画像の傾き角度であると推定し、 その推定した傾き角度に応じて上記文書画像の傾きを補
    正することを特徴とする文書画像傾き補正方法。
  2. 【請求項2】特許請求の範囲第1項において、各輪郭に
    外接する矩形の頂点座標から求める上記検出値は、矩形
    の一辺の両端の座標(QXj,QYj),(RXj,RYj)から算出
    できる一辺の長さ|QXj−RXj|であり、 検出値を方向角度αに投影して積分して得られる周辺分
    布は H(Kj)←H(Kj)+|QXj−RXj| ただし、Kj=G[QYj−QXj・tan(α)] に従って算出される周辺分布H(K)であり(ここで、
    記号←は代入を意味し、G[x]は実数xを整数に変換
    する関数である)、 その周辺分布の鋭さを表す量V(α)を V(α)=Σ|H(K)−H(K−1)| に基づいて算出することにより、周辺分布の鋭さが最大
    な周辺分布を求めて、それに対応する方向角度αmaxを
    求めることを特徴とする文書画像傾き補正方法。
JP60152210A 1985-07-12 1985-07-12 文書画像傾き補正方法 Expired - Lifetime JP2644724B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60152210A JP2644724B2 (ja) 1985-07-12 1985-07-12 文書画像傾き補正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60152210A JP2644724B2 (ja) 1985-07-12 1985-07-12 文書画像傾き補正方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8275812A Division JPH09120430A (ja) 1996-10-18 1996-10-18 画像処理装置

Publications (2)

Publication Number Publication Date
JPS6214277A JPS6214277A (ja) 1987-01-22
JP2644724B2 true JP2644724B2 (ja) 1997-08-25

Family

ID=15535473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60152210A Expired - Lifetime JP2644724B2 (ja) 1985-07-12 1985-07-12 文書画像傾き補正方法

Country Status (1)

Country Link
JP (1) JP2644724B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07107696B2 (ja) * 1986-04-08 1995-11-15 アルプス電気株式会社 画像の位置ずれ自動修正処理方法
US7401551B2 (en) * 2004-02-25 2008-07-22 Riso Kagaku Corporation Stencil printing machine
JP4598426B2 (ja) 2004-03-30 2010-12-15 富士通株式会社 境界抽出方法、プログラムおよびこれを用いた装置
JP5204686B2 (ja) * 2009-02-13 2013-06-05 大日本スクリーン製造株式会社 配列方向検出装置、配列方向検出方法および配列方向検出プログラム
CN114354634B (zh) * 2022-01-17 2024-07-26 中国人民解放军空军勤务学院 基于磨粒图像自动采集与分析的磨损快速检测装置和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5752971A (en) * 1980-09-12 1982-03-29 Nippon Telegr & Teleph Corp <Ntt> Two-dimensional character area extracting device
JPS58100568A (ja) * 1981-12-10 1983-06-15 Ricoh Co Ltd スキユ−検出方法
JPS58169293A (ja) * 1982-03-31 1983-10-05 Toshiba Corp 文字切り出し方式
JPS6027079A (ja) * 1983-07-22 1985-02-12 Mitsubishi Heavy Ind Ltd 文字列の傾斜角検出装置

Also Published As

Publication number Publication date
JPS6214277A (ja) 1987-01-22

Similar Documents

Publication Publication Date Title
JP2644724B2 (ja) 文書画像傾き補正方法
JPH09120430A (ja) 画像処理装置
US5355448A (en) Method of generating dot signals corresponding to character pattern and the system therefor
JP2000076378A (ja) 文字認識方法
JP7327810B2 (ja) 画像生成プログラム、文字認識システム、画像生成方法、画像生成装置、および文字認識モデル
JP2513617B2 (ja) 正規化回路
JP2954218B2 (ja) 画像処理方法及び装置
JP2954778B2 (ja) 画像入力装置の線図形分岐点接続方法
JPH08194773A (ja) 画像処理方法および画像処理装置
JPH0668245A (ja) 画像回転補正処理方法および画像回転補正処理装置
JP2802646B2 (ja) ベクトルフオントによる文字パターンの変倍処理方法
JP2962525B2 (ja) テキストブロック認識方法
JP2937607B2 (ja) レイアウト作成装置
JP2639489B2 (ja) 画像データ抽出方法
JPH02110796A (ja) 手書き文字の認識辞書作成方式
JP2801246B2 (ja) 文字処理装置及び方法
JPS58109962A (ja) 画像メモリ内デ−タの抽出方法
JPS6249482A (ja) 画像前処理装置
JPS5814709B2 (ja) 閉図形の形状認識方式
JPS62290979A (ja) 枠線構成装置
JPS60231267A (ja) 文字間制御方式
JPH04590A (ja) 文字認識方法
JPS62189592A (ja) 線図形端点検出方式
JPH02158888A (ja) パターンマッチング回路
JPH05242235A (ja) 画像処理装置