JPH02278104A - 文書画像の傾き角検出方法 - Google Patents

文書画像の傾き角検出方法

Info

Publication number
JPH02278104A
JPH02278104A JP1097494A JP9749489A JPH02278104A JP H02278104 A JPH02278104 A JP H02278104A JP 1097494 A JP1097494 A JP 1097494A JP 9749489 A JP9749489 A JP 9749489A JP H02278104 A JPH02278104 A JP H02278104A
Authority
JP
Japan
Prior art keywords
document image
extracted
character
inclination
rectangular area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1097494A
Other languages
English (en)
Inventor
Shinji Matsui
伸二 松井
Hitoshi Ichinohe
一戸 均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP1097494A priority Critical patent/JPH02278104A/ja
Publication of JPH02278104A publication Critical patent/JPH02278104A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] この発明は、文書画像処理において、何らかの理由によ
り傾いて入力される文書画像のf−さ;!:、 +1出
方法に関する。
〔従来の技術〕
従来、文書画像の傾き角検出方法として、例えば周辺分
布を複数の方向について求め、最も尖鋭となる方向から
求める方法がある。これは最も単純な方法であるが、周
辺分布を求めるための計算量がぼう大になると言う難点
がある。
そこで、周辺分布を求めるにあたり画像を複数の帯領域
に分割し、各領域での周辺分布のピークの位相差を利用
する手法が提案されている〔例えば、特公昭61−67
5公報、第37回情処全大。
6W−1(昭63−9)に発表の“文字列抽出型周辺分
布法による文書の傾き検出パなる論文を参照のこと〕。
また、輪郭抽出で求められた連結成分に対して、外接長
方形の底辺に関する周辺分布が鋭くなる方向を抽出し、
文書画像の傾きを検出する手法も堤案されている〔例え
ば、第37同情処全大、  6W3(昭639)に発表
の“光学的文字認識の文字切り出し処理における書類の
傾き補正アルゴリズム°′なる論文を参照のこと)、シ
かし、この手法では、傾き角を検出する以前に文字の切
り出しが終了している必要があり、処理が煩雑になるだ
けでなく、日本語文書中に良く出現する、いわゆる分離
文字について特別な処理を必要とすると言う問題がある
〔発明が解決しようとする課題〕
つまり、上記いずれの方法も取り扱うデータ量が多すぎ
、そのため容量が大きくかつ高価なメモリを必要とする
だけでなく、演算量も多くなって処理時間が長くなるな
どの問題がある。
したがって、この発明の課題は取り扱うデータ¥を減ら
してメモリ容量および演算量を減少させることにある。
〔課題を解決するための手段〕
矩形領域内にある文書画像を矩形領域の端辺から水平ま
たは垂直方向に走査し、その各々で最初に出現し文字を
示す各画素を点列として抽出して所定のメモリに記憶し
、この記憶された各点列にて形成される形状特徴から文
字列の下端、上端または左端、右端に相当する点列のみ
を抽出し、この抽出された点列を直線近似して文書画像
の傾き角を求める。
(作用) 水平または垂直方向走査で最初に出現し文字を示す各画
素を点列として抽出する処理は、文字切り出しの際に一
般的に行われる処理であるので、抽出すべきデータを特
に増やすことなく処理が出来るようになる。
〔実施例〕
第1図はこの発明の詳細な説明するための説明図、第2
図は文書画像の例と走査方法を説明するための説明図、
第3図はモデル化された文字列から点列を抽出する方法
を説明するための説明図、第4図は第3図から抽出され
る各特徴点を説明するための説明図である。
すなわち、第1図は第2図(イ)に符号1で示される如
き矩形領域内にある横書きの文書画像を、その端辺(第
2図では左端)から水平(x)方向に走査し、最初に文
字や記号等を示す黒画素を発見した点までの画素@(x
座標)を、垂直(y)方向の画素数の関数R(y)とし
て順次記憶したもの、つまり、各点を点列として抽出し
たものをモデル化して示している。このとき、黒画素が
発見できなかったときは、対向辺までの長さ(最大)を
記憶することとする。また、第2図(ロ)は走査結果を
示している。縦書き文書の場合は、黒画素を垂直方向に
走査し、関数RをXの関数として求める。
こうして抽出された点列について、その形状特徴を次の
ようにして調べる。
まず、関数Rについて、 R(y)−R(y+1)>TI となった時のyをCn −+ 、 ! + 1をa、、
とするとともに、y>a、の領域で最初に R(b、  )  −R(a、  )  >T2なる条
件を満たすbnを求める。第1図にはこれらan + 
 bn +  C11の関係が図示されている。このと
き、C7を発見するより前に黒画素が見つからない領域
があった場合、その領域の中で最もbnに近いyを07
とし、領域の終端+1をa、、とする。なお、TI、T
2は文書画像の図形的特徴によって定まるしきい値であ
る。この値の決め方ととしては、対象となる文M画像に
出現する可能性がある最小のフォントの標準的な文字サ
イズをTOとすれば、T1.T2は最初は暫定的にTO
とされる。また、ao=0(画像領域の上端)とおく。
第2図では上端に空白領域があるため、bO。
coは求められず、alを求めることになる。したがっ
て、第3図の如く文字列をモデル化したちの2について
は、C4,br、C+の関係は第4図のようになる。
以上の処理により、b、l≦y≦C,1の領域のR(y
)が文字列の下端に対する値の集合となり、これを求め
る点列rn(y:bn≦y≦en)とする。そして、こ
の点列について最小二乗法等を適用して直線近似を行え
ば、その傾きDnが求められることになる。実際のr7
は文字自体の形などから影響を受けるため、個々のDn
はかなりの誤差をもつ。このため、文書画像の傾きは複
数のDnから総合的に求めることとする。このとき、文
書画像平面r (x、  y)上で、全てのr、に対し
て点f (rn (c、)、cn)を原点に移動するよ
うな平行移動を施し、このようにしてもとめた点列に対
して例えば最小二乗法による直線近似を行えば、文書画
像全体の傾きを直接求めることができる。こうすれば、
成る文字列が改行などにより他の文字列より極端に短く
、r7に含まれるデータ数が少ない場合でも有効にデー
タを利用することができる。
ところで、様々な文書に対応させるためには、処理の途
中で得られる文書画像の特徴を用いてしきい値を更新し
ていく方が望ましい。このため、前述のTI、T2は初
期値として用いる。例えば、R(cn )  R(cn
 +1) >cn  ar+=tlfl (=TI) R(b、、)−R(an  )>bn −an=t2f
l (=T2) a、  =cn +1 として局所的なしきい値を定義し、各特徴点を求めてや
れば、1つの文書画像内に行ピッチや文字サイズが異な
る文書が存在していても、対処することができる。ここ
に、Ll、t2はそれぞれ局所的な行ピッチと文字サイ
ズに略相当する。なお、このようにした場合、anを求
めた後のbnの探索は、第2図に示すようなR(y)の
細かな凹凸を拾わないよう、afl+TQから始める等
の工夫が必要となる。また、1つの文書画像内で、行ピ
ッチや文字サイズが変化しないことが分かっている場合
には、Cnを求めるためのしきい値TIをt L−1、
T2をt2.−+ までの平均値とする。
以上のようにして、文書画像が正方向に傾いている場合
の傾き角を検出するが、−船釣にはスキャナ等から入力
された文書画像はどちらに傾いているかは不明である。
また、本手法ではどちらに傾いているかによって、R(
y)に対するアクセスの方向が変わるため、傾いている
方向を知る手段が必要になる。第5図に負方向に回転し
た文書画像に対するR (y)のモデルを示す。
同図では、R(y)は不連続に立ち上がったのち、文字
列の上端に沿って減少する。つまり、文書画像が正方向
に傾いているものと仮定して処理を行えば、まず黒画素
がない領域の終端としてalが求められる。そのあとの
blは、不連続な立ち上り点でその条件を満たすことに
なる。b1以陣はR(y)は減少して行くが、 R(bn) −R(d) >T3 (b、 <d)を満
たすdがCnの見つかる前に存在する場合は、その文字
列は前記の仮定に違反しているものとみなし、Cnの定
義は行わずに、dをan+l とする。
また、1つの文書画像の中にこのような文字列が多数存
在する場合は、文書画像は負方向に回転しているものと
見なし、処理をやり直す。なお、T3は文書画像の図形
的特徴から求められるしきい値である。
以上では点列の形状特徴に着目したが、次のようにする
ことが出来る。
第6図はこの発明の他の実施例を説明するための説明図
である。
すなわち、ここでは先ず文書画像の左上端から垂線を下
ろし、最初に黒画素と当たる所で止める。
画面の下端まで止まらないものは、黒画素無しとと考え
る。ついで、この垂線と平行かつ等間隔に垂線を下ろし
ていき、最初に黒画素と当たる所でそれぞれ止める。た
だし、ノイズの黒点で止まることを防ぐため、着目点を
中心に3×3画素全てが黒となることを条件として付加
する。かかる操作を画面全体について施して抽出された
垂線3を同図(イ)に示している。次に、各垂線が止ま
った点を線分で結んで折れ線グラフを描き、線分の方向
を平均化することにより、文字画像の上端部に位置する
行の傾きを検出する。このとき、水平から+40度を越
える傾きのときは、水平方向に置き換える。これは、画
面上端から垂直に下ろした線は「見出しコ、「日付コな
と、異なる行で止まる場合がある。また、文字と文字の
隙間に入り込むことがある。さらには、傾いた原稿の最
上端を峠として左右に傾きが分かれることがあるので、
±40度を越える傾きを除外することにより、平均角度
を文字列の傾きに近づけるためである。
具体的には、次のようにする。
左端の停止位置を基準点(0,O)とし、垂直に下ろす
線の間隔をΔXとする。なお、ΔXは最小文字行間隔以
下に選ばれる。そして、隣り合う2点間のy方向の偏差
をΔyとするとき、Δy≧tan40XΔχ なる条件、つまり水平方向に対する傾きが40度以上と
なる場合は、 Δy=0 として、次へ進む。このとき、水平方向に進んだ回数も
覚えておく。
このようにすれば、A点(0,0)より出発した点は、
第6図(イ)の例では同図(ロ)の如く、7回の水平移
動を含んでB点(x、y)に達することになる。そこで
、B点より水平移動した分のΔχの偏位を引けば、C点
(x−7Δx、y)M得られる。よって、求める文書画
像の傾きθは、A点からC点へ至る傾きとして、 θ=ta n (y/ (x−7ΔX))の如く得られ
る。なお、縦書き文書の場合は、処理方向を上記とは9
0度変えることにより行われる。
〔発明の効果〕
この発明によれば、前記関数Rは文字切り出しの際に一
般的に行われる周辺分布を求めるための処理と並行して
求めることができ、文書画像の傾きを算出するためにア
クセスされるデータは、高々数千の要素からなる1次元
配列である関数Rのみであるため、効率的に文書画像の
傾きを求めることができる。
また、種々のしきい値を用いて、関数R上の特徴点an
 、bn、Cnを求めれば、文字サイズや行ピッチが未
知である文書画像に対しても適用することが可能となる
さらに、文書画像の傾きが予め分かれば、その傾きと平
行に文字切り出しをすることができるので、文字切り出
しの精度が改善される。また、光ファイルシステム等で
は、傾いた文書画像を水平方向に回転させることにより
、ファイルの容量をセーブすることができる。
【図面の簡単な説明】
第1図はこの発明の詳細な説明するための説明図、第2
図は文書画像の例と走査方法を説明するための説明図、
第3図はモデル化された文字列から点列を抽出する方法
を説明するための説明図、第4図は第3図から抽出され
る各特徴点を説明するための説明図、第5図は負方向に
傾いた文書画像をモデル化して説明するための説明図、
第6図はこの発明の他の実施例を説明するための説明図
である。 符号説明 ■・・・矩形領域、2・・・モデル化された文字列、3
・・・昨直線。 第 1 図 第5 因

Claims (1)

  1. 【特許請求の範囲】 1)矩形領域内にある文書画像を矩形領域の端辺から水
    平または垂直方向に走査し、その各々で最初に出現し文
    字を示す各画素を点列として抽出して所定のメモリに記
    憶し、この記憶された各点列にて形成される形状特徴か
    ら文字列の下端、上端または左端、右端に相当する点列
    のみを抽出し、この抽出された点列を直線近似して文書
    画像の傾き角を求めることを特徴とする文書画像の傾き
    角検出方法。 2)矩形領域内にある文書画像を矩形領域の端辺から水
    平または垂直方向に走査し、その各々で最初に出現し文
    字を示す各画素を点列として抽出して所定のメモリに記
    憶し、この記憶された各点列の相隣る2点間で順次走査
    方向と同方向の画素数差を抽出し、この差が所定値以上
    となる点を除外した差積算値から文書画像の傾き角を求
    めることを特徴とする文書画像の傾き角検出方法。
JP1097494A 1989-04-19 1989-04-19 文書画像の傾き角検出方法 Pending JPH02278104A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1097494A JPH02278104A (ja) 1989-04-19 1989-04-19 文書画像の傾き角検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1097494A JPH02278104A (ja) 1989-04-19 1989-04-19 文書画像の傾き角検出方法

Publications (1)

Publication Number Publication Date
JPH02278104A true JPH02278104A (ja) 1990-11-14

Family

ID=14193823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1097494A Pending JPH02278104A (ja) 1989-04-19 1989-04-19 文書画像の傾き角検出方法

Country Status (1)

Country Link
JP (1) JPH02278104A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4926795A (en) * 1989-02-14 1990-05-22 Hom, Inc. Method of reinstating acceptable flavor to off-flavor catfish by treatment with peroxide additives
JPH07192086A (ja) * 1993-12-27 1995-07-28 Ricoh Co Ltd 画像傾き検出方法
CN104732228A (zh) * 2015-04-16 2015-06-24 同方知网数字出版技术股份有限公司 一种pdf文档乱码的检测、校正的方法
CN107121096A (zh) * 2017-03-30 2017-09-01 复旦大学 一种基于图像的空间立体角计算方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4926795A (en) * 1989-02-14 1990-05-22 Hom, Inc. Method of reinstating acceptable flavor to off-flavor catfish by treatment with peroxide additives
JPH07192086A (ja) * 1993-12-27 1995-07-28 Ricoh Co Ltd 画像傾き検出方法
CN104732228A (zh) * 2015-04-16 2015-06-24 同方知网数字出版技术股份有限公司 一种pdf文档乱码的检测、校正的方法
CN107121096A (zh) * 2017-03-30 2017-09-01 复旦大学 一种基于图像的空间立体角计算方法
CN107121096B (zh) * 2017-03-30 2020-04-24 复旦大学 一种基于图像的空间立体角计算方法

Similar Documents

Publication Publication Date Title
EP0543593B1 (en) Method for determining boundaries of words in text
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5687253A (en) Method for comparing word shapes
JP3259993B2 (ja) 語形測定方法及び画像信号処理方法
JPH05242298A (ja) 記号列の認識方法
US5172422A (en) Fast character segmentation of skewed text lines for optical character recognition
EP0750415B1 (en) Image processing method and apparatus
US6771842B1 (en) Document image skew detection method
JP4323606B2 (ja) 文書画像傾き検出装置
JP3774690B2 (ja) 画像を文字画像行に分割する方法および装置、ならびに、文字画像認識方法および装置
JP3615333B2 (ja) 罫線消去装置
JPH05500875A (ja) 光学式文字認識のために英数字文字を細線化するための方法及び装置
KR20010015025A (ko) 문자인식장치의 문자추출방법 및 장치
JPH02278104A (ja) 文書画像の傾き角検出方法
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
JP3153439B2 (ja) 文書画像傾き検出方法
JP2576079B2 (ja) 文字切出し方法
JPS62121589A (ja) 文字切出し方法
US5313529A (en) System for representing line drawings by polygonal lines
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP3190794B2 (ja) 文字切り出し装置
JP2789647B2 (ja) 線画像認識方法
JPS63101983A (ja) 文字列抽出方式
Ashkan et al. Skew estimation in Persian documents: A novel approach