JPH103517A - 文書画像傾き角検出装置 - Google Patents

文書画像傾き角検出装置

Info

Publication number
JPH103517A
JPH103517A JP8177284A JP17728496A JPH103517A JP H103517 A JPH103517 A JP H103517A JP 8177284 A JP8177284 A JP 8177284A JP 17728496 A JP17728496 A JP 17728496A JP H103517 A JPH103517 A JP H103517A
Authority
JP
Japan
Prior art keywords
document image
circumscribed rectangle
tilt angle
character
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8177284A
Other languages
English (en)
Inventor
Shinkou Tai
震江 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP8177284A priority Critical patent/JPH103517A/ja
Publication of JPH103517A publication Critical patent/JPH103517A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 印刷文書では文字列の基線は水平方向あるい
は垂直方向に近いほぼ一直線の上にあると見なされるこ
とから、複雑な演算処理を要することなく、単純な処理
により高速かつ高精度に文書画像の傾き角を求めること
ができる文書画像傾き角検出装置を提供する。 【解決手段】 文書画像をイメージデータとして入力す
る入力手段と、前記入力手段により得られたイメージデ
ータの中の連結している黒画素の塊の外接矩形を作成す
る外接矩形作成手段と、該外接矩形作成手段により作成
された前記外接矩形から文字領域を推定し、前記イメー
ジデータから文字外接矩形に対応する部分画像を分離す
る文字矩形分離手段と、前記文字矩形分離手段で分離さ
れた部分画像の特定位置を特徴点として抽出する特徴点
抽出手段と、抽出された特徴点に基づき入力文書画像の
傾き角を検出する傾き角検出手段とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像の傾き角
を検出する文書画像傾き角検出装置に関し、更に詳細に
は、光学式文字読み取り装置や文書ファイリング装置な
どの文書画像読み取り装置において読みとった文書画像
の傾きを修正するために用いて好適な文書画像傾き角検
出装置に関するものである。
【0002】
【従来の技術】オフィスにおける文書処理の合理化を図
る手段として、印刷文書を機械に読み取らせ、電子的に
取り扱えるようにすることが望まれている。その場合
に、文書読み取り装置においては、入力された文書画像
の傾きが検出され、補正されていると、入力された文書
のレイアウト等の構造の解析が、入力文書に記載されて
いる文字の傾きを補正しない場合に較べて容易になる。
このため、文書画像の傾きを検出する技術が、従来から
様々に開発されている。
【0003】例えば、文献「書式指定情報によらない紙
面構成要素抽出法」(電子情報通信学会、論文誌D,V
ol,J66−D,No.1,P111〜P118,1
983)に記載されているように、文書画像を入力状態
から微小角度づつ回転させ、周辺分布を複数の角度方向
に対して求め、周辺分布の山と谷が最も急峻となる角度
を文書画像の傾き角とする方法がある。
【0004】しかし、この方法では、各画素に対してヒ
ストグラムを計算することが必要であり、文書中の図や
写真による悪影響を受けやすく、また、デジタルノイズ
による悪影響も受けやすく、処理時間が多くかかるとい
う問題点がある。
【0005】また、別の例として、文献「文書画像の傾
き補正のための一方式」(電子情報通信学会、論文誌
D,Vol,J69−D,No.11,P1833〜P
1834,1986)に記載されている方法がある。こ
の方法では、文書画像の黒画素の輪郭を抽出し、その輪
郭の外接矩形の底辺の長さを任意の方向に積分する。こ
の処理を多数の方向について行い、積分値が最も尖鋭と
なる方向を文書画像の傾き角として検出する方法であ
る。
【0006】しかし、この方法では、黒画素の輪郭を抽
出する処理や、積分値の最も尖鋭となる方向の探索処理
などを行っているため、処理の演算量が多くなり、ま
た、検出精度が低いという問題がある。
【0007】更に、別の例として、例えば、文献「文書
構造解析のための前処理」(電子情報通信学会、信学技
報,PRU92−32,P57〜P64,1992)に
記載されているように、文書画像中の白画素から黒画素
に変化する回数の分散を「複雑度」と定義し、入力画像
を複数の角度の方向に走査して「複雑度」を抽出し、そ
の分布においてピークとなる角度を検出することによっ
て、傾きを検出する方法がある。
【0008】しかし、この方法を用いる場合には、文字
列が大半を占める局所的な文章領域の抽出を必要とし、
入力文書において文章領域が紙面を占める割合が低い場
合には、傾きの検出精度が劣化し、パフォーマンスに問
題が生じる。
【0009】
【発明が解決しようとする課題】このように、従来にお
ける文書画像の傾きを検出する方法では、図や写真およ
びノイズなどにより悪影響を受けやすいという問題点が
あり、処理速度が遅く、また、傾き検出精度も低いとい
う問題点がある。
【0010】本発明は、上記のような問題点を解決する
ためになされたものであり、本発明の目的は、印刷文書
では文字列の基線は水平方向あるいは垂直方向に近いほ
ぼ一直線の上にあると見なされることから、複雑な演算
処理を要することなく、単純な処理により高速かつ高精
度に文書画像の傾き角を求めることができる文書画像傾
き角検出装置を提供することにある。
【0011】
【課題を解決するための手段】上記のような目的を達成
するため、本発明の文書画像傾き角検出装置において
は、第1の特徴として、文書画像をイメージデータとし
て入力する入力手段(11)と、前記入力手段により得
られたイメージデータの中の連結している黒画素の塊の
外接矩形を作成する外接矩形作成手段(12)と、該外
接矩形作成手段により作成された前記外接矩形から文字
領域を推定し、前記イメージデータから文字外接矩形に
対応する部分画像を分離する文字矩形分離手段(13)
と、前記文字矩形分離手段で分離された部分画像の特定
位置を特徴点として抽出する特徴点抽出手段(14)
と、抽出された特徴点に基づき入力文書画像の傾き角を
検出する傾き角検出手段(15)とを備えることを特徴
とする。
【0012】また、第2の特徴として、本発明の文書画
像傾き角検出装置において、傾き角検出手段は、抽出さ
れた各々の特徴点を2次元平面上の傾き角θを持つ直線
に投影した値の各々の値の度数のピークを求め、各々の
傾き角θについて一次元配列を用いて度数のピークのみ
を記録し、可能な全ての傾き角θについて度数のピーク
の検索を行い、最もピークの度数の大きい傾き角θを文
書画像の傾き角として検出することを特徴とする。
【0013】また、本発明の文書画像傾き角検出装置
は、第3の特徴として、傾き角検出手段が、水平方向ま
たは垂直方向のどちらか一方の方向から所定の角度の範
囲で傾き角θを変化させた複数の角度の直線について、
特徴点を投影した値の度数のピークの分布を求め、度数
のピークの分布の最も大きい角度を文書画像中の文書画
像の傾きとして検出し、検出した傾き角から水平方向ま
たは垂直方向の文字列方向を判定することを特徴とす
る。
【0014】このような特徴を有する文書画像傾き角検
出装置によれば、印刷文書中の文字列の基線が、水平方
向あるいは垂直方向にほぼ一直線の上にあると見なされ
ることを利用して、文字に対応する外接矩形の特徴点を
抽出する。そして、この特徴点に基づき、入力した印刷
文書の文書画像の傾き角および文字列方向を検出する処
理を行う。
【0015】文書画像の傾き角の検出処理では、文書画
像をイメージデータとして入力し、入力文書画像のイメ
ージデータに対して、ラベリング処理を行い、イメージ
データ中の連結している黒画素の塊から文字領域の外接
矩形を生成する。次に、黒画素の塊の外接矩形の幅およ
び高さにより矩形内の文字らしいものを推定し、文字に
対応した外接矩形を抽出する。そして、抽出された文字
の外接矩形から特徴点を求め、この各々の特徴点につい
て、直交座標の(x−y)平面上の傾き角θを持つ直線
に投影した値ρを求め、傾き角θについての値ρの度数
の分布を求めて、度数のピークを求める。
【0016】次に、求めた度数のピークを各々の傾き角
θについての一次元配列で度数ピークを記録し、度数ピ
ークを検索して、検出する全ての傾き角θについて、最
も大きな度数ピークとなる傾き角θを判定し、この傾き
角θを入力文書画像の傾き角θとする。
【0017】この場合において、文書画像の読みとりの
文書画像の傾きは、一般的には、水平方向または垂直方
向からわずかな範囲にしかずれないことから、文書画像
の傾き角θの範囲を、例えば、水平方向から所定の角度
の範囲の(0±α)度の範囲とし、傾き角θを求める角
度の精度を0.1度として、その角度の精度の刻みでの
各々の角度方向θの直線に特徴点を投影し、その投影さ
れる特徴点の値ρの分布を求め、更に、その度数ピーク
を抽出する。
【0018】次いで、垂直方向から所定の角度の範囲の
(90±α)度の範囲とし、角度の精度を0.1度と
し、その角度の精度の刻みでの各々の角度方向θの直線
に特徴点を投影し、その投影される特徴点の値ρの分布
を求める。更に、その度数ピークを抽出する。水平方向
および垂直方向から得られた度数ピークを比較し、最も
度数ピークの大きい角度を検出し、その角度を文書画像
の傾き角とする。この場合に、傾き角が(0±α)度の
範囲内であれば、その文書画像中の文字列方向を水平方
向とし、傾き角が(90±α)度の範囲内であれば、文
書画像中の文字列方向を垂直方向と判定する。
【0019】
【発明の実施の形態】次に、本発明を実施する場合の形
態について、具体的に図面を参照して説明する。図1
は、本発明の一実施例にかかる文書画像傾き角検出装置
の基本構成を説明するブロック図である。図1におい
て、11は画像入力処理部、12は外接矩形作成処理
部、13は文字矩形分離処理部、14は特徴点抽出処理
部、15は傾き角検出手処理部である。
【0020】画像入力処理部11は、画像読取り装置等
によって文書の画像を読み取り、得られたデータをイメ
ージデータとして入力する。外接矩形作成処理部12
は、画像入力処理部11で入力されたイメージデータに
対し、連結している黒画素の塊の外接矩形を作成する。
文字矩形分離処理部13では、外接矩形作成処理部12
で得られたそれぞれの外接矩形の縦方向および横方向の
長さが、所定の閾値より小さいものを選別して、その外
接矩形に対応する部分画像を切り出し、文字領域に対応
する外接矩形の画像データを作成する。作成された外接
矩形の画像データは、特徴点抽出部14に送出される。
【0021】特徴点抽出処理部14では、文字矩形分離
処理部13で得られた文字に対応する外接矩形から、傾
き角を検出するための基準となる特徴点を抽出する。こ
こでの抽出する特徴点としては、例えば、外接矩形の左
上,右上,左下,右上の各頂点,中心点などのいずれか
の1点とする。傾き角検出処理部15は、特徴点抽出処
理部14で得られた特徴点について、直交座標系のx−
y平面上での傾き角θを持つ直線に投影した値ρを求
め、投影した座標系のθ−ρ平面上での各々の値ρの度
数分布をカウントして求め、更にその度数分布のピーク
を求める。検出する各々の可能な総ての傾き角θについ
て、この度数ピークを求めることを繰り返す、そして、
度数ピークが最も大きい傾き角θを、入力された文書画
像の傾き角とする。
【0022】以下、各々の処理部の処理機能について、
更に詳細に説明すると、画像入力処理部11は、文書画
像を入力し、イメージデータとする。例えば、イメージ
スキャナのような画像読取り装置を用いて、紙面に印刷
された文書をイメージデータとして入力する。画像読取
り装置により得られたイメージデータを画像入力処理部
11から得られると、外接矩形作成処理部12は、ま
ず、イメージデータ中の各黒画素の塊に対してラベル付
けを行い、各黒画素の塊に一意の番号を与えたラベル画
像を作成し、このラベル画像を用いて、各黒画素の塊の
外接矩形を作成する。
【0023】ここでの外接矩形作成処理部12における
画像のラベル付け処理に関しては、例えば、長尾真監訳
「ディジタル画像処理」(P360−361)に記載さ
れている技術を利用する。このラベル付け処理は、画像
の第1行目において、各ランに異なったラベルを与え、
第2行以下の行では、1つのランを調べて前行のランと
位置を比べる。そして、ランpが前行のどのランとも隣
接していなければ当該ランpに新しいラベルを付ける。
ランpが前行の1つのランのみに隣接しているなら、そ
の隣接するランのラベルを付ける。ランpが前行の2つ
以上のランに隣接しているなら、ランpにはこれらのラ
ベルの最小値をつけるが、これらのラベルはすべて同一
成分に属することも記録しておく。このようにして、イ
メージデータが、すべて走査されたとき、記録内容をチ
ェックし、同一と判定されたものには等しいラベルが付
くようにラベル番号を付け直す。このラベル付け処理に
より、各黒画素の塊に一意の番号が付与されるので、番
号が与えられたラベル画像により、このラベル画像を用
いて、各黒画素の塊の外接矩形を作成する。
【0024】文字矩形分離処理部13は、外接矩形作成
処理部12により作成された外接矩形を用いて、画像入
力処理部11で得られたイメージデータから文字や記号
の領域を分離する。これは、まず、外接矩形作成処理部
12で得られたイメージデータの連結している黒画素の
塊の各外接矩形の縦方向および横方向の長さが所定の閾
値より小さいものを文字らしいものと推定する。このと
き、用いる所定の閾値としては、文字の大きさよりも多
少大きめに設定すればよい。例えば、この実施例では、
400spi(dpi)の2値画像に対して、閾値は
“36”としている。
【0025】特徴点抽出部処理部14では、外接矩形を
用いて分離した文字記号領域の文字外接矩形から傾き角
を検出するための基準となる特徴点を抽出する。ここで
の文字外接矩形の特徴点としては、前述したように外接
矩形の4つの頂点,中心点,重心点のいずれかの1点と
するが、ここでは外接矩形の左下の頂点を特徴点とす
る。このようにして、抽出した特徴点は、傾き角検出処
理部15に送出する。
【0026】傾き角検出処理部15では、特徴点抽出処
理部14で得られた各々の特徴点をx−y平面上の傾き
角θを持つ直線に投影して、その度数のピークから傾き
角θを検出する。すなわち、各特徴点について、x−y
平面上での傾き角θを持つ直線に投影した値ρを求め、
これを傾き角θを検出する角度の精度の刻みで、投影す
る直線の傾き角θを変えて繰り返し行い、その傾き角θ
ごとの値ρの度数の分布を求めて、その最大の度数とな
る対応の傾き角θを、入力された文書画像の傾き角とす
る。
【0027】この場合の処理では、作業用に使用するメ
モリ容量を少なくするため、まず、検出する傾き角θに
ついて、特徴点抽出処理部14で得られた各々の特徴点
をx−y平面上の当該傾き角θを持つ直線に投影する。
そして、θ−ρ平面上での各々の値ρの度数分布をカウ
ントして求め、その度数分布のピークを求める。求めた
度数ピークを傾き角θについての一次元配列に登録す
る。これを、検出する総ての傾き角θのそれぞれについ
て度数ピークを求めることを繰り返し行い、検出する全
ての傾き角θの度数ピークが求められると、傾き角θに
ついての一次元配列を探索し、度数ピークが最も大きい
ものに対応する傾き角θを入力された文書画像の傾き角
とする。ここでの作業用に使用するメモリ容量は、検出
する傾き角θの角度の精度に応じた度数ピーク保持用の
一次元配列と、各傾き角θについて投影した値ρの度数
ピークを求めるため一時作業用の一次元配列となる。こ
の一時作業用の一次元配列はハッシュテーブルを使用す
ることにより、更に少ないメモリ容量で作業を行うこと
ができる。
【0028】ここで、文書画像の傾き角θを検出する原
理について具体的に説明する。文書画像の傾き角を検出
するのための手法として、Hough変換の手法を用い
る。Hough変換の手法については、その詳細は、例
えば、文献『與水「直線パターン検出のためのHoug
h曲線追跡型アルゴリズムについて」(電子情報通信学
会、論文誌D,Vol,J68−D,No.10,P1
769〜1776,1985)』に記載されている内容
が参照できる。
【0029】具体的には、図2に示すように、直交座標
系のx−y平面上の傾き角θを持つ直線は、ρ,θをパ
ラメータとする次の式(1)により表現できるので、こ
れを利用する。 ρ=x・cosθ+y・sinθ ……(1) つまり、入力された文書画像について、その直交座標系
のx−y平面上の各座標点(X,Y)の内、上記の式
(1)で表現される傾き角θの直線上にある全ての点
(Xj,Yj)は、上記の(1)式により投影変換する
と、θ−ρ平面上では1点(1つの値ρ)に収束するこ
とになる。
【0030】したがって、x−y平面上の傾き角θkを
持つ直線に対して、特徴点抽出部処理部14で抽出した
x−y平面上での特徴点(xi,yi)(i=1,2,
…,m)から、次に示す式(2)で決まる値ρiを求
め、そのパラメータ対(θk,ρi)を得る。 ρi=xi・cosθk+yi・sinθk ……(2) ここで得られたパラメータ対(θk,ρi)に対して、
θ−ρ平面上での各々の値ρの度数をカウントし、度数
ピークを検出するため、その度数の分布を記録する。こ
の場合、1次元配列b[i](i=1,2,…,m)を
用いて、各々の値ρiについて、その度数を7の次の式
(3)より数え上げる。 b[ρi]=b[ρi]+1 ……(3) 全ての特徴点(xi,yi)(i=1,2,…,m)に
ついて、傾き角θkを持つ直線のθ−ρ平面上での分布
は、上記の式(2)でのそれぞれの値ρiの度数を求め
れば得られるので、その投影された値ρの度数の分布か
ら、その度数ピークを求め、各々の傾き角θについて度
数ピーク保持用の一次元配列c[θk]に記録する。
【0031】この結果、一次元配列c[θk]に記録さ
れた内容は、等価的には、図3に示すように、例えば、
各々の特徴点についてのHough変換したHough
曲線〜を求め、その各特徴点のHough曲線〜
の交差する回数をカウントし、その度数ピークを求め
たものに相当するものとなる。つまり、θ−ρ平面上に
てθ=θkとなるHough曲線の交差の回数の度数ピ
ークを求めたものに相当するものとなる。この場合の度
数ピーク(曲線の交点の最大数)が、傾き角θkについ
ての度数ピーク保持用の1次元配列c[θk]に記録さ
れている。
【0032】すなわち、傾き角θkを変化させ、検出可
能な傾き角θの角度精度での刻みの全ての傾き角θk
(k=1,2,…N)について、特徴点を投影した度数
ピークの度数分布を求め、その度数ピークの探索を行う
ことは、度数ピーク保持用の一次元配列c[θk]に記
録された内容の度数ピークを探索することとなり、この
度数ピーク保持用の一次元配列c[θk]から最も大き
な度数ピークを求めることにより、その対応の傾き角θ
kから入力された文書画像の傾き角θを検出することが
できる。
【0033】このようにして、入力文書画像の傾き角を
検出する場合、Hough変換による一般的な方法で
は、多くの直線群を抽出することになるため、多くのメ
モリが必要となり、かなり長い計算時間がかかるが、本
発明による度数ピークのカウントの演算処理では、傾き
角θの直線に投影した値ρの度数分布のピークを求め、
その度数ピークを傾き角θkについて度数ピーク保持用
の一次元配列c[θk]に記録する。そして、記録した
一次元配列c[θk]の度数ピークを更に探索すること
により、その度数ピークの対応の傾き角から、文書画像
の傾き角を検出する。その結果、θ−ρ平面上でのρ度
数をカウントし、度数ピークを求めることとと等価とな
り、必要なメモリを少なくすることができ、処理時間も
短縮して、文書画像の傾き角を検出することができる。
【0034】また、この場合に、更に、文書画像中の文
字列方向を検出するようにも変形できる。図4は、傾き
角検出処理部において、文書画像中の文字列方向を検出
する処理を行う処理フローを示すフローチャートであ
る。
【0035】文字列の方向を検出する場合の処理では、
前述のようにして、特徴点抽出処理部14から特徴点が
供給されるので、ここでの処理を開始すると、ステップ
41において、水平方向に対して(0±α)度の範囲の
複数の角度方向での直線に特徴点を投影し、その値の度
数の分布を求め、度数ピークを抽出する。次に、ステッ
プ42において、垂直方向に対して(90±α)度の範
囲の複数の角度方向での直線に特徴点を投影し、その度
数の分布を求め、度数ピークを抽出する。
【0036】そして、次のステップ43において、水平
方向および垂直方向から得られた度数ピークを比較し、
最も度数ピークの大きい角度から文字列方向を検出す
る。その結果、検出した文字列方向の角度を文書画像の
傾き角とするが、このとき、傾き角が(0±α)度の範
囲内であれば、文書画像中の文字列方向は水平方向と判
定し、また、傾き角が(90±α)度の範囲内であれ
ば、文書画像中の文字列方向は垂直方向と判定する。こ
のようにして検出する傾き角θの処理範囲を制限するこ
とにより、高速かつ高精度に文書画像の傾き角を検出す
ることができる。また、文字列方向を検出することが可
能となる。
【0037】次に、具体的にサンプルの文書画像につい
て傾き角を求めた処理例について説明する。図5は、水
平方向に対し傾き角θで傾いて読み取られた横書きの入
力文書画像の一例を示す図であり、図6は、図5に例示
した入力文書画像から抽出された文字外接矩形とそれに
対応する文字画像データを示す図であり、また、図7
は、図6に示す文字外接矩形から抽出した特徴点の一例
を示す図である。
【0038】図5に示すように、イメージスキャナなど
の文書画像読み取り装置で読み取られた文書画像51
は、水平方向50に対し傾き角θで傾いて読み取られた
ものとなっている。この文書画像51は、文字列方向が
横方向となっている。この文書画像51に対して、外接
矩形形成処理部12が文字外接矩形とそれに対応する文
字画像データを求めると、図6に示すように、文字外接
矩形が生成され、文字領域に対応する画像データが抽出
される。図6に示す文字外接矩形の画像データに対し
て、特徴点抽出処理部14によって、特徴点を抽出する
と、図7に示すように、各々の外接矩形に対応して、特
徴点が抽出される。
【0039】また、図8は、水平方向に対し傾き角θで
傾いて読み取られた縦書きの入力文書画像の一例を示す
図であり、図9は、図8に例示した入力文書画像から抽
出された文字外接矩形とそれに対応する文字画像データ
を示す図である。図10は、図9に示す文字外接矩形か
ら抽出した特徴点の一例を示す図である。
【0040】この場合、図8に示すように、イメージス
キャナなどの文書画像読み取り装置により読み取られた
文書画像61は、水平方向60に対し傾き角θで傾いて
読み取られたものとなっている。この文書画像61は、
中央部に写真部分があり、文字列方向が縦方向となって
いる。この文書画像61に対して、外接矩形形成処理部
12が、文字外接矩形とそれに対応する文字画像データ
を求めると、図9に示すように、文字の領域では、文字
外接矩形が生成され、文字領域に対応する画像データが
抽出される。この図9に示す文字外接矩形の画像データ
に対して、特徴点抽出処理部14によって、特徴点を抽
出すると、図10に示すように、各々の外接矩形に対応
して、特徴点が抽出される。
【0041】一般に、Hough変換を用いた傾き検出
方法は、一つの特徴点毎にHough曲線を求めるた
め、多くのメモリが必要となり、また、かなり長い処理
時間を要することになる。例えば、特徴点の個数をNと
し、θ−ρ平面上でのθ軸の分割数をKとし、ρ軸の分
割数をLとすると、各々の特徴点から1つのHough
曲線が得られるので、その記録用として二次元配列のメ
モリ容量が必要になる。その大きさは(K×L)とな
り、処理時間がO(N×K)となる。
【0042】しかし、本発明によると、処理範囲を±α
の範囲に制限することにより、必要なメモリは、大きさ
Nの一次元配列に短縮できる。すなわち、前述した場合
と同じ精度で傾きを検出すると仮定としても、この場
合、例えば、0〜360度の分割数をKとし、角度の範
囲を±α度とすると、処理時間が、Hough変換で
は、O(N×K)となるのに対し、本発明の文書画像傾
き検出装置によると、O(N×K×(2α/360)×
2)の処理時間で済む。具体的な数値例で説明すると、
αを10度とすると、処理時間は、40/360=1/
9となる。
【0043】(実験結果)本発明者が、文字、図形、写
真を含む雑誌、論文等の文書17枚に対して、傾きと文
字列方向を検出する実験を行った結果について説明する
と、実験を行ったサンプル文書は、全てA4サイズの文
書であり、400dpiの解像度で2値画像として入力
した。17枚の文書の平均傾き検出時間は、データ処理
装置としてエンジニアリングワークステーションの「S
PARCstation(28MIPS)」を使用した
場合、2.88秒で処理結果が得られた。この結果は、
全ての入力文書画像に対し、文字列方向を正しく検出す
ることができ、文字、図形、写真混在文書に対するこの
手法の有効性が確認できた。
【0044】
【発明の効果】以上説明したように、本発明の文書画像
傾き角検出装置によれば、文書画像全体に対し外接矩形
化処理を行い、外接矩形から文字の外接矩形を選択し特
徴点を求め、この特徴点を基づき文書画像の傾きを検出
するため、文書画像の傾き角をすくない演算量で効率よ
く確実に検出することができる。
【図面の簡単な説明】
【図1】 図1は本発明の一実施例にかかる文書画像傾
き角検出装置の基本構成を説明するブロック図、
【図2】 図2はHough変換の原理を説明するため
の(x−y)平面上の傾き角θを持つ直線の例を示す
図、
【図3】 図3は本発明の文書画像傾き角の検出処理に
かかる(θ−ρ)平面上の度数ピークを求める方法を説
明図、
【図4】 図4は傾き角検出処理部において文書画像中
の文字列方向を検出する処理を行う処理フローを示すフ
ローチャート、
【図5】 図5は水平方向に対し傾き角θで傾いて読み
取られた横書きの入力文書画像の一例を示す図、
【図6】 図6は図5に例示した入力文書画像から抽出
された文字外接矩形とそれに対応する文字画像データを
示す図、
【図7】 図7は図6に示す文字外接矩形から抽出した
特徴点の一例を示す図、
【図8】 図8は水平方向に対し傾き角θで傾いて読み
取られた縦書きの入力文書画像の一例を示す図、
【図9】 図9は図8に例示した入力文書画像から抽出
された文字外接矩形とそれに対応する文字画像データを
示す図、
【図10】 図10は図9に示す文字外接矩形から抽出
した特徴点の一例を示す図である。
【符号の説明】
11…画像入力処理部、12…外接矩形作成処理部、1
3…文字矩形分離処理部、14…特徴点抽出処理部、1
5…傾き角検出処理部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文書画像をイメージデータとして入力す
    る入力手段と、 前記入力手段により得られたイメージデータの中の連結
    している黒画素の塊の外接矩形を作成する外接矩形作成
    手段と、 該外接矩形作成手段により作成された前記外接矩形から
    文字領域を推定し、前記イメージデータから文字外接矩
    形に対応する部分画像を分離する文字矩形分離手段と、 前記文字矩形分離手段で分離された部分画像の特定位置
    を特徴点として抽出する特徴点抽出手段と、 抽出された特徴点に基づき入力文書画像の傾き角を検出
    する傾き角検出手段とを備えることを特徴とする文書画
    像傾き角検出装置。
  2. 【請求項2】 請求項1に記載の文書画像傾き角検出装
    置において、傾き角検出手段は、 抽出された各々の特徴点を2次元平面上の傾き角θを持
    つ直線に投影した値の各々の値の度数のピークを求め、 各々の傾き角θについて一次元配列を用いて度数のピー
    クのみを記録し、 可能な全ての傾き角θについて度数のピークの検索を行
    い、最もピークの度数の大きい傾き角θを文書画像の傾
    き角として検出することを特徴とする文書画像傾き角検
    出装置。
  3. 【請求項3】 請求項1に記載の文書画像傾き角検出装
    置において、傾き角検出手段は、 水平方向または垂直方向のどちらか一方の方向から所定
    の角度の範囲で傾き角θを変化させた複数の角度の直線
    について、特徴点を投影した値の度数のピークの分布を
    求め、 度数のピークの分布の最も大きい角度を文書画像中の文
    書画像の傾きとして検出し、検出した傾き角から水平方
    向または垂直方向の文字列方向を判定することを特徴と
    する文書画像傾き角検出装置。
JP8177284A 1996-06-18 1996-06-18 文書画像傾き角検出装置 Pending JPH103517A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8177284A JPH103517A (ja) 1996-06-18 1996-06-18 文書画像傾き角検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8177284A JPH103517A (ja) 1996-06-18 1996-06-18 文書画像傾き角検出装置

Publications (1)

Publication Number Publication Date
JPH103517A true JPH103517A (ja) 1998-01-06

Family

ID=16028349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8177284A Pending JPH103517A (ja) 1996-06-18 1996-06-18 文書画像傾き角検出装置

Country Status (1)

Country Link
JP (1) JPH103517A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020086847A (ja) * 2018-11-22 2020-06-04 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
CN113158895A (zh) * 2021-04-20 2021-07-23 北京中科江南信息技术股份有限公司 票据识别方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020086847A (ja) * 2018-11-22 2020-06-04 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
CN113158895A (zh) * 2021-04-20 2021-07-23 北京中科江南信息技术股份有限公司 票据识别方法、装置、电子设备及存储介质
CN113158895B (zh) * 2021-04-20 2023-11-14 北京中科江南信息技术股份有限公司 票据识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US6778703B1 (en) Form recognition using reference areas
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
KR100390264B1 (ko) 폼처리중자동페이지등록및자동영역검출을위한시스템및방법
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5410611A (en) Method for identifying word bounding boxes in text
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
JP2930612B2 (ja) 画像形成装置
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
EP0389988A2 (en) Detecting line segments and predetermined patterns in an optically scanned document
US6268935B1 (en) Image processor
US8064636B2 (en) Image processing apparatus and method of controlling the same
US20080131000A1 (en) Method for generating typographical line
JP3728224B2 (ja) 文書処理装置及び方法
JP3006466B2 (ja) 文字入力装置
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
JPH103517A (ja) 文書画像傾き角検出装置
JP3303246B2 (ja) 画像処理装置
EP0975146B1 (en) Locating the position and orientation of multiple objects with a smart platen
JPS6325391B2 (ja)
JPH03126181A (ja) 文書画像の領域分割方法
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JP2861860B2 (ja) 宛名行抽出装置
Wijaya et al. Staff line restoration