JPH02273884A - 文書画像の歪検出補正方法 - Google Patents

文書画像の歪検出補正方法

Info

Publication number
JPH02273884A
JPH02273884A JP1096684A JP9668489A JPH02273884A JP H02273884 A JPH02273884 A JP H02273884A JP 1096684 A JP1096684 A JP 1096684A JP 9668489 A JP9668489 A JP 9668489A JP H02273884 A JPH02273884 A JP H02273884A
Authority
JP
Japan
Prior art keywords
character
document image
distortion
string
graphic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1096684A
Other languages
English (en)
Inventor
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1096684A priority Critical patent/JPH02273884A/ja
Publication of JPH02273884A publication Critical patent/JPH02273884A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の属する技術分野 本発明は5文書読取装置や文書ファイリング装置などに
おいて1文書画像の局所的な歪を検出し。
文書画像の歪を修復したり、アラームを送出してオペレ
ータに通知したりする文書画像の歪検出補正方法に関す
るものである。
(2)従来の技術 文書画像から文字列や傾きを検出する手法としては、従
来技術として特願昭57−005206号“文字行切出
し方式” 〔特許l〕や、“英文文書の傾き検出及び単
語切り出しに関する検討“昭和62年度信学総会大、 
NO,1510,(1987) (文献1〕などがある
。特許1の方法は文書画像中の黒画素の射影を求め、そ
の射影関数の連続性から文字列や文書の傾きを検出する
ものであり1文献1の方法は文書画像上の黒画素の塊り
から外接矩形を求める処理を行った後に、大きさの等し
い矩形を検出し。
注目する矩形とその上下左右に存在する隣接矩形とを結
ぶことによって局所的な文字同士の傾き方向を求める処
理を9文書画像の本文領域の全面にわたって行い、検出
された個々の傾きの平均値を文書の傾きとして検出する
ものなどが提案されていた。しかし2文書画像の歪を検
出して補正する方法は未開発の分野であった。
(3)発明の目的 本発明の目的は文書画像の入力において1文書画像中に
局所的な歪が生じた場合にその歪を補正して9きれいな
文書を得る手法を提供することにある。
(4)発明の構成 (4−1)発明の特徴と従来技術との差率発明は9文書
上のある限定された領域の文字列や図形列に注目すれば
1文書画像に歪が生じても、はぼ大きさの等しい文字や
図形あるいは線分が特定の方向(例えば縦方向、あるい
は横方向)に並んだり伸びたりしているだけでそれら相
互の位置関係は保存されていることに注目し2文書画像
上の黒画素の塊りあるいは周辺分布から1文字図形列あ
るいは文字図形列領域を予測・抽出し。
文字図形列内あるいは文字図形列領域内の文字図形の位
置の相互関係から文書画像の文字図形列のtlIきを積
出し、一定領域内の文字列の傾きの相互関係から検出し
た補正情報を用いて文書画像の歪を補正することを最も
主要な特徴とする。そのため従来技術として取り上げた
文書中の黒画素の射影から文字列や文書の傾きを求める
特許lの方法や、注目する外接矩形の上下方向の隣接矩
形の位置から求まる局所的な傾きを統計的に処理して文
書全体の傾きを求める文献1の方法とは1文書画像中の
局所領域の図形を選択的に用いてその歪を検出し2文書
画像を補正する点で異なる。
(4−2)実施例 第1図は本発明の実施例構成図であって、lは文書画像
の入力端子、2は連続する黒画素あるいは強制分割した
黒画素あるいはそれらを射影した特徴を検出して文字図
形領域を抽出する文字図形領域検出工程、3は文字図形
列および文字図形列領域を検出する文字図形列検出工程
、4は文字図形列検出工程、5は歪検出補正工程、6は
出力端子、7は制御部である。
この方法を実行するには、入力端子1から白。
黒などのよ→に0と1とで表現された2値から成る文書
画像データを人力する。
文字図形領域検出工程2では2人力された文書画像デー
タに対して、 (イ)黒画素の連続性の検出処理の結果
〔第2図(a))、あるいは、 (ロ)黒画素の連続性
の検出において黒画素に途切れがない場合の強制分割処
理の結果(一定間隔〔第2図(b)(c))や周辺分布
の変化〔第2図(d)〕による分割)から黒画素の塊り
を囲む文字図形領域M−を検出し、その存在位置情報、
すなわち上辺、底辺、左辺、右辺のアドレス)’+++
V !!+  xlI+  X l!を求め1次の処理
工程に送出する。なお、外接矩形MOHの代わりに短区
間の周辺分布B’t(sl域あるいは位置情報として横
方向のアドレスV tt+  V !!+ あるいは縦
方向のアドレスX11.  Xttを求めることを意味
する)を求めても後続処理を近似的に実現できる。第2
図(a)(b)(c)(d)は文字図形領域の抽出の様
子を示す説明図である。第2図(a)においては。
連続する黒画素を塊りとし、当該塊りを囲むようにして
文字図形領域M−を検出している。第2図(b)および
第2図(C)においては、黒画素が所定以上連続してい
て途切れがないことから、所定の幅を用いて強制的に分
割することによって9文字図形領域M@□を抽出してい
る。更に第2図(d)においては、連続して途切れのな
い黒画素に対して、上下方向の突出の度合いなどに注目
して強制的な分割を行うことによって1文字図形領域M
−を抽出している。
なお、以下において上記M0iに対応してM’lが現れ
、また後述するθ@1に対応してθ1!やθ−などが現
れるが、これらは原情報をM−やθ−としたとき当該原
情報について何んらかの加工を第1次加工や第2次加工
・・・・・・の如くほどこした情報を意味している。
文字図形列検出工程3では、まず文書画像データの上端
や下端、あるいは左端や右端から文字図形領域M−を検
出しその位置関係から文字図形列検出、あるいは文字図
形列領域検出の処理を行う。
なお1文字図形列検出工程3の処理は横方向の処理と縦
方向との処理とが同一の処理なので、横方向(縦幅)の
処理について述べ、縦方向の情報を使用するときは記号
の添字を区別することによって表記する。第3図は文字
図形列検出の様子を示す説明図であり、注目する文字図
形領域M−が第1行目の文字図形列に存在する場合を示
しており。
文字図形列の抽出過程を示している。この図が示すよう
に、注目する文字図形領域M−を文書画像上の横方向に
射影し、射影が重なる文字図形領域の中で注目する文字
図形領域に最も近い矩形を検出し、右側に存在すればそ
の文字図形領域をM ” 1 +l 1とし1次に注目
する文字図形領域をM’i、。
に移し、前記と同様にして右方向への射影をとり。
最も近い文字図形領域M−08を検出する処理を繰り返
す(以後、この処理を伝播処理と呼ぶ)0文字図形領域
M@lの左側についても右側と同様な伝播処理を繰り返
す、このようにして文字図形列の抽出ができ、この処理
を文字図形列の検出用開始端と反対方向に順次繰り返し
てゆくことにより。
第1行から最終行までの文字図形列を検出するようにす
る。
次に1文字図形列処理工程4では1文字図形列の単位で
文字図形領域の局所的な傾き検出の処理を行う、すなわ
ち検出された文字図形列に対して個々の文字図形領域M
・ムごとの傾きを検出するものである。第4図は局所的
な傾きを検出する様子を示す説明図であり、同−文字図
形列において文字図形領域M01を中心に、ある限定さ
れた区間(LO)内で1文字図形領域M−の傾き検出用
の特徴点m(mは特徴点番号で1.2.3の値をとる。
m=lは文字図形領域の中心点のアドレス。
m−2は底辺の中心点のアドレス、m−3は上辺の中心
点のアドレスなどが考えられる)同士を直線で結んで得
られる傾きθ−(m)を用いて、最頻値抽出などの処理
により得られる真の傾きθ@ムを求め、その値を個々の
文字図形領域の傾きとみなして検出する。また他の手段
として1例えば。
文字図形領域M−が等しい特f!(縦幅、縦幅と横幅、
黒画素の配値や変化点、あるいは矩形パターンの識別結
果など)を有する文字図形領域M11を選択し、その文
字図形領域MI!の傾き検出用特徴点同士を直線で結び
、このときの直線の傾きθ’五(m)から求められる値
θ′五を個々の文字図形領域の傾きと見なして検出する
ようにしてもよい。
第5図は歪検出補正工程における処理フローを示し、第
6図は歪検出補正工程における処理概念図を示す0次に
歪検出補正工程5では、これまでの処理で求められた個
々の文字図形領域M′1の傾きθ1!に対し、まず、同
一文字列内の一定区間(Ll)に存在する文字図形領域
の傾き情報を用いて1個々の文字図形領域の傾き情報に
スムージングの処理を施す0例として、注目する文字図
形領域M ’ 1の前後2個の文字図形領域を用いて第
5図図示処理■のスムージングを施した場合。
(1)式で示すような文字図形領域の傾きθ8.が得ら
れる。
(ただし、l−2〜i+2は区間Ll内)次に第5図図
示処理■の文字列相互に対してスムージングの処理を施
す、すなわち、一定区間(Ll)内に存在する複数の文
字列を対象にして。
個々の文字図形領域M’lの傾きθ81にスムージング
の処理を施す0例として、注目する文字列に(には文字
列番号)が前後1個の文字列を用いてスムージングを施
した場合、 (2)式で示すような文字図形領域の傾き
θ31が得られる。
(ただし、に−1〜に+1は区間L2内)このようにし
て検出された歪(局所的な傾き)θ−が滑らかに変化す
るようにして、歪検出の処理を終了する。
第7図は歪補正の処理の様子を示す説明図であり、第5
図図示処理■の処理においては9文書画像データを第7
図に示すように短冊状にn分割し。
分割した領域ごとに文字図形領域の傾き(K個の02i
)についての平均値θ(n)と分散σ(n)とを求め1
分散が最も小さい値を示す傾きθを有する短冊領域を文
字列の歪(局所的な傾き)補正のための基準短冊領域と
する。そして、基準短冊領域の文字図形領域とその傾き
θとから文字列全体の歪(局所的な傾き)θhとの整合
をとるため・の基準線(たとえば文字列における文字図
形領域の底辺が並ぶ直vA)を求める。そして、第5図
図示処理■の処理において、他の短冊領域に位置する文
字図形領域M@1を基準線に一致させるとともに、各文
字図形領域の傾きがθになるように存在位置0’五I+
  )’ti、  X!l+  X1x)を修正する。
第6図(b)はこの修正結果を示している。即ち。
第6図(b)に示す基準短冊領域10にもとづいて基準
線11が設定され、他の短冊領域20や30に位置する
文字図形領域M0.の底辺を基準線llに一致させるよ
うにし、かつ各文字図形領域M−の傾きがθになるよう
に位置修正が行われる(即ち個々の文字図形領域M#!
のアドレス(yム1゜yム1+  Xt++  X1t
)が修正され、一般には図示斜線で示す如く平行四辺形
の領域となる)。
最後に、このような処理を文書画像データの全面に対し
て施すことにより1文書画像の歪が補正され、この結果
を出力端子6に出力する。
このようにして第8図(a)は処理対象文書画像の一例
を示し、第8図(b)は処理結果の文書画像を示す、第
8図(a)図示の文書画像について歪を検出し、その歪
の検出値を用いて、歪を補正する。
第1図図示の制御部7は、各処理工程において。
どの処理を施したのかを必要に応じて所定の工程に対し
て伝達する役割をする。
本発明は1文字列の多い文書画像だけでなく。
文字列の少ない文書画像に対しても精度よく、かつ高速
にその歪を検出して補正できることがら。
文書画像の高速、高精度の書式認識や2文書ファイリン
グにおける品賀のよい画像の蓄積に効果を発揮する。
(5)発明の効果 以上説UAしたように1本発明によれば5文書画像の文
字図形列と文字図形列の局所的な傾きと。
文字列相互の局所的な傾きとを夫々精度よく検出し、そ
の情報から文書画像の歪を補正することにより、歪の少
ない整った文書画像を得るのに効果がある。
【図面の簡単な説明】
第1図は本発明の実施例構成図、第2図は文字図形領域
の抽出の様子を示す説明図、第3図は文字図形列検出の
様子を示す説明図、第4図は局所的な傾きを検出する様
子を示す説明図、第5図は歪検出補正工程における処理
フロー、第6図は歪検出補正工程における処理概念図、
第7図は歪補正の処理の様子を示す説明図、第8図は歪
I★出補正の様子を示す図である。 図中、1は入力端子、2は文字図形領域検出工程、3は
文字図形列検出工程、4は文字図形列検出工程、5は歪
検出補正工程、6は出力端子、7は制御部である。 特許出願人 日本電信電話株式会社

Claims (1)

  1. 【特許請求の範囲】 イメージスキャナなどの画像入力部から入力された文書
    画像データに対し、文書の傾きを検出・補正する文書画
    像処理において、 文書画像上の黒画素の塊り、あるいは黒画素の塊りを強
    制的に分割して得られる部分的な塊りの外接矩形の位置
    や大きさ、あるいは黒画素を射影して得られる周辺分布
    のいずれかまたはすべてを特徴として文字図形の領域を
    求める文字図形領域検出工程と、 該抽出された文字図形領域の近傍に存在する文字図形領
    域との重なり具合やその位置関係から文字図形の並びを
    検出する文字図形列検出工程と、全ての文字図形領域あ
    るいは選択された文字図形領域を用いて、各文字図形列
    を構成する文字図形領域相互の大きさや特徴と位置関係
    とから文字図形列の傾きを検出する文字図形列処理工程
    と、文字図形列間の傾きの相互関係から文書画像の局所
    的な歪を検出し、文書画像を修復する歪検出補正工程と を順に実行するようにした ことを特徴とする文書画像の歪検出補正方法。
JP1096684A 1989-04-17 1989-04-17 文書画像の歪検出補正方法 Pending JPH02273884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1096684A JPH02273884A (ja) 1989-04-17 1989-04-17 文書画像の歪検出補正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1096684A JPH02273884A (ja) 1989-04-17 1989-04-17 文書画像の歪検出補正方法

Publications (1)

Publication Number Publication Date
JPH02273884A true JPH02273884A (ja) 1990-11-08

Family

ID=14171620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1096684A Pending JPH02273884A (ja) 1989-04-17 1989-04-17 文書画像の歪検出補正方法

Country Status (1)

Country Link
JP (1) JPH02273884A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528321A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 画像認識方法および画像認識システム
JP2006098590A (ja) * 2004-09-29 2006-04-13 Casio Comput Co Ltd 画像投影装置、画像投影方法、及び画像位置補正プログラム
JP2007316754A (ja) * 2006-05-23 2007-12-06 Canon Inc 手書文字処理装置及び手書文字処理方法
JP2014044500A (ja) * 2012-08-24 2014-03-13 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2015184691A (ja) * 2014-03-20 2015-10-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528321A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 画像認識方法および画像認識システム
JP2006098590A (ja) * 2004-09-29 2006-04-13 Casio Comput Co Ltd 画像投影装置、画像投影方法、及び画像位置補正プログラム
JP2007316754A (ja) * 2006-05-23 2007-12-06 Canon Inc 手書文字処理装置及び手書文字処理方法
JP2014044500A (ja) * 2012-08-24 2014-03-13 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2015184691A (ja) * 2014-03-20 2015-10-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
US7342572B2 (en) System and method for transforming an ordinary computer monitor into a touch screen
EP1234278B1 (en) System and method for rectified mosaicing of images recorded by a moving camera
JP3049672B2 (ja) 画像処理方法及び装置
JP3253356B2 (ja) 文書画像の領域識別方法
JP2974061B2 (ja) パタン抽出装置
US20070122037A1 (en) Image processing apparatus and image processing method
JP2007241356A (ja) 画像処理装置および画像処理プログラム
US7480410B2 (en) Image recognition method and apparatus for the same method
JPH02273884A (ja) 文書画像の歪検出補正方法
JPH04270485A (ja) 印刷文字認識装置
JP2000076378A (ja) 文字認識方法
JPS60189084A (ja) 文字区域抽出回路
JPS6214277A (ja) 画像処理方式
JPS61117670A (ja) 文字切り出し処理方式
JPH06281421A (ja) 画像処理方法
JPS63158676A (ja) 領域抽出装置
JPH0244486A (ja) 文書画像処理方法
JP3430506B2 (ja) 画像処理方法及び該方法を用いたナンバープレートのサーチ方法
JPH0573718A (ja) 領域属性識別方式
JP3275475B2 (ja) 文字配列が既知の対象文字列の認識装置
JP2853510B2 (ja) 画像ノイズ除去装置
JPH09121279A (ja) 画像処理装置
JPH05128305A (ja) 領域分割方法
JPH05290166A (ja) 線分認識方式
JPH1031715A (ja) 文字列抽出方法および装置