JPH103517A

JPH103517A - 文書画像傾き角検出装置

Info

Publication number: JPH103517A
Application number: JP8177284A
Authority: JP
Inventors: Shinkou Tai; 震江戴
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1996-06-18
Filing date: 1996-06-18
Publication date: 1998-01-06

Abstract

(57)【要約】【課題】印刷文書では文字列の基線は水平方向あるい
は垂直方向に近いほぼ一直線の上にあると見なされるこ
とから、複雑な演算処理を要することなく、単純な処理
により高速かつ高精度に文書画像の傾き角を求めること
ができる文書画像傾き角検出装置を提供する。【解決手段】文書画像をイメージデータとして入力す
る入力手段と、前記入力手段により得られたイメージデ
ータの中の連結している黒画素の塊の外接矩形を作成す
る外接矩形作成手段と、該外接矩形作成手段により作成
された前記外接矩形から文字領域を推定し、前記イメー
ジデータから文字外接矩形に対応する部分画像を分離す
る文字矩形分離手段と、前記文字矩形分離手段で分離さ
れた部分画像の特定位置を特徴点として抽出する特徴点
抽出手段と、抽出された特徴点に基づき入力文書画像の
傾き角を検出する傾き角検出手段とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文書画像の傾き角
を検出する文書画像傾き角検出装置に関し、更に詳細に
は、光学式文字読み取り装置や文書ファイリング装置な
どの文書画像読み取り装置において読みとった文書画像
の傾きを修正するために用いて好適な文書画像傾き角検
出装置に関するものである。

【０００２】

【従来の技術】オフィスにおける文書処理の合理化を図
る手段として、印刷文書を機械に読み取らせ、電子的に
取り扱えるようにすることが望まれている。その場合
に、文書読み取り装置においては、入力された文書画像
の傾きが検出され、補正されていると、入力された文書
のレイアウト等の構造の解析が、入力文書に記載されて
いる文字の傾きを補正しない場合に較べて容易になる。
このため、文書画像の傾きを検出する技術が、従来から
様々に開発されている。

【０００３】例えば、文献「書式指定情報によらない紙
面構成要素抽出法」（電子情報通信学会、論文誌Ｄ，Ｖ
ｏｌ，Ｊ６６−Ｄ，Ｎｏ．１，Ｐ１１１〜Ｐ１１８，１
９８３）に記載されているように、文書画像を入力状態
から微小角度づつ回転させ、周辺分布を複数の角度方向
に対して求め、周辺分布の山と谷が最も急峻となる角度
を文書画像の傾き角とする方法がある。

【０００４】しかし、この方法では、各画素に対してヒ
ストグラムを計算することが必要であり、文書中の図や
写真による悪影響を受けやすく、また、デジタルノイズ
による悪影響も受けやすく、処理時間が多くかかるとい
う問題点がある。

【０００５】また、別の例として、文献「文書画像の傾
き補正のための一方式」（電子情報通信学会、論文誌
Ｄ，Ｖｏｌ，Ｊ６９−Ｄ，Ｎｏ．１１，Ｐ１８３３〜Ｐ
１８３４，１９８６）に記載されている方法がある。こ
の方法では、文書画像の黒画素の輪郭を抽出し、その輪
郭の外接矩形の底辺の長さを任意の方向に積分する。こ
の処理を多数の方向について行い、積分値が最も尖鋭と
なる方向を文書画像の傾き角として検出する方法であ
る。

【０００６】しかし、この方法では、黒画素の輪郭を抽
出する処理や、積分値の最も尖鋭となる方向の探索処理
などを行っているため、処理の演算量が多くなり、ま
た、検出精度が低いという問題がある。

【０００７】更に、別の例として、例えば、文献「文書
構造解析のための前処理」（電子情報通信学会、信学技
報，ＰＲＵ９２−３２，Ｐ５７〜Ｐ６４，１９９２）に
記載されているように、文書画像中の白画素から黒画素
に変化する回数の分散を「複雑度」と定義し、入力画像
を複数の角度の方向に走査して「複雑度」を抽出し、そ
の分布においてピークとなる角度を検出することによっ
て、傾きを検出する方法がある。

【０００８】しかし、この方法を用いる場合には、文字
列が大半を占める局所的な文章領域の抽出を必要とし、
入力文書において文章領域が紙面を占める割合が低い場
合には、傾きの検出精度が劣化し、パフォーマンスに問
題が生じる。

【０００９】

【発明が解決しようとする課題】このように、従来にお
ける文書画像の傾きを検出する方法では、図や写真およ
びノイズなどにより悪影響を受けやすいという問題点が
あり、処理速度が遅く、また、傾き検出精度も低いとい
う問題点がある。

【００１０】本発明は、上記のような問題点を解決する
ためになされたものであり、本発明の目的は、印刷文書
では文字列の基線は水平方向あるいは垂直方向に近いほ
ぼ一直線の上にあると見なされることから、複雑な演算
処理を要することなく、単純な処理により高速かつ高精
度に文書画像の傾き角を求めることができる文書画像傾
き角検出装置を提供することにある。

【００１１】

【課題を解決するための手段】上記のような目的を達成
するため、本発明の文書画像傾き角検出装置において
は、第１の特徴として、文書画像をイメージデータとし
て入力する入力手段（１１）と、前記入力手段により得
られたイメージデータの中の連結している黒画素の塊の
外接矩形を作成する外接矩形作成手段（１２）と、該外
接矩形作成手段により作成された前記外接矩形から文字
領域を推定し、前記イメージデータから文字外接矩形に
対応する部分画像を分離する文字矩形分離手段（１３）
と、前記文字矩形分離手段で分離された部分画像の特定
位置を特徴点として抽出する特徴点抽出手段（１４）
と、抽出された特徴点に基づき入力文書画像の傾き角を
検出する傾き角検出手段（１５）とを備えることを特徴
とする。

【００１２】また、第２の特徴として、本発明の文書画
像傾き角検出装置において、傾き角検出手段は、抽出さ
れた各々の特徴点を２次元平面上の傾き角θを持つ直線
に投影した値の各々の値の度数のピークを求め、各々の
傾き角θについて一次元配列を用いて度数のピークのみ
を記録し、可能な全ての傾き角θについて度数のピーク
の検索を行い、最もピークの度数の大きい傾き角θを文
書画像の傾き角として検出することを特徴とする。

【００１３】また、本発明の文書画像傾き角検出装置
は、第３の特徴として、傾き角検出手段が、水平方向ま
たは垂直方向のどちらか一方の方向から所定の角度の範
囲で傾き角θを変化させた複数の角度の直線について、
特徴点を投影した値の度数のピークの分布を求め、度数
のピークの分布の最も大きい角度を文書画像中の文書画
像の傾きとして検出し、検出した傾き角から水平方向ま
たは垂直方向の文字列方向を判定することを特徴とす
る。

【００１４】このような特徴を有する文書画像傾き角検
出装置によれば、印刷文書中の文字列の基線が、水平方
向あるいは垂直方向にほぼ一直線の上にあると見なされ
ることを利用して、文字に対応する外接矩形の特徴点を
抽出する。そして、この特徴点に基づき、入力した印刷
文書の文書画像の傾き角および文字列方向を検出する処
理を行う。

【００１５】文書画像の傾き角の検出処理では、文書画
像をイメージデータとして入力し、入力文書画像のイメ
ージデータに対して、ラベリング処理を行い、イメージ
データ中の連結している黒画素の塊から文字領域の外接
矩形を生成する。次に、黒画素の塊の外接矩形の幅およ
び高さにより矩形内の文字らしいものを推定し、文字に
対応した外接矩形を抽出する。そして、抽出された文字
の外接矩形から特徴点を求め、この各々の特徴点につい
て、直交座標の（ｘ−ｙ）平面上の傾き角θを持つ直線
に投影した値ρを求め、傾き角θについての値ρの度数
の分布を求めて、度数のピークを求める。

【００１６】次に、求めた度数のピークを各々の傾き角
θについての一次元配列で度数ピークを記録し、度数ピ
ークを検索して、検出する全ての傾き角θについて、最
も大きな度数ピークとなる傾き角θを判定し、この傾き
角θを入力文書画像の傾き角θとする。

【００１７】この場合において、文書画像の読みとりの
文書画像の傾きは、一般的には、水平方向または垂直方
向からわずかな範囲にしかずれないことから、文書画像
の傾き角θの範囲を、例えば、水平方向から所定の角度
の範囲の（０±α）度の範囲とし、傾き角θを求める角
度の精度を０．１度として、その角度の精度の刻みでの
各々の角度方向θの直線に特徴点を投影し、その投影さ
れる特徴点の値ρの分布を求め、更に、その度数ピーク
を抽出する。

【００１８】次いで、垂直方向から所定の角度の範囲の
（９０±α）度の範囲とし、角度の精度を０．１度と
し、その角度の精度の刻みでの各々の角度方向θの直線
に特徴点を投影し、その投影される特徴点の値ρの分布
を求める。更に、その度数ピークを抽出する。水平方向
および垂直方向から得られた度数ピークを比較し、最も
度数ピークの大きい角度を検出し、その角度を文書画像
の傾き角とする。この場合に、傾き角が（０±α）度の
範囲内であれば、その文書画像中の文字列方向を水平方
向とし、傾き角が（９０±α）度の範囲内であれば、文
書画像中の文字列方向を垂直方向と判定する。

【００１９】

【発明の実施の形態】次に、本発明を実施する場合の形
態について、具体的に図面を参照して説明する。図１
は、本発明の一実施例にかかる文書画像傾き角検出装置
の基本構成を説明するブロック図である。図１におい
て、１１は画像入力処理部、１２は外接矩形作成処理
部、１３は文字矩形分離処理部、１４は特徴点抽出処理
部、１５は傾き角検出手処理部である。

【００２０】画像入力処理部１１は、画像読取り装置等
によって文書の画像を読み取り、得られたデータをイメ
ージデータとして入力する。外接矩形作成処理部１２
は、画像入力処理部１１で入力されたイメージデータに
対し、連結している黒画素の塊の外接矩形を作成する。
文字矩形分離処理部１３では、外接矩形作成処理部１２
で得られたそれぞれの外接矩形の縦方向および横方向の
長さが、所定の閾値より小さいものを選別して、その外
接矩形に対応する部分画像を切り出し、文字領域に対応
する外接矩形の画像データを作成する。作成された外接
矩形の画像データは、特徴点抽出部１４に送出される。

【００２１】特徴点抽出処理部１４では、文字矩形分離
処理部１３で得られた文字に対応する外接矩形から、傾
き角を検出するための基準となる特徴点を抽出する。こ
こでの抽出する特徴点としては、例えば、外接矩形の左
上，右上，左下，右上の各頂点，中心点などのいずれか
の１点とする。傾き角検出処理部１５は、特徴点抽出処
理部１４で得られた特徴点について、直交座標系のｘ−
ｙ平面上での傾き角θを持つ直線に投影した値ρを求
め、投影した座標系のθ−ρ平面上での各々の値ρの度
数分布をカウントして求め、更にその度数分布のピーク
を求める。検出する各々の可能な総ての傾き角θについ
て、この度数ピークを求めることを繰り返す、そして、
度数ピークが最も大きい傾き角θを、入力された文書画
像の傾き角とする。

【００２２】以下、各々の処理部の処理機能について、
更に詳細に説明すると、画像入力処理部１１は、文書画
像を入力し、イメージデータとする。例えば、イメージ
スキャナのような画像読取り装置を用いて、紙面に印刷
された文書をイメージデータとして入力する。画像読取
り装置により得られたイメージデータを画像入力処理部
１１から得られると、外接矩形作成処理部１２は、ま
ず、イメージデータ中の各黒画素の塊に対してラベル付
けを行い、各黒画素の塊に一意の番号を与えたラベル画
像を作成し、このラベル画像を用いて、各黒画素の塊の
外接矩形を作成する。

【００２３】ここでの外接矩形作成処理部１２における
画像のラベル付け処理に関しては、例えば、長尾真監訳
「ディジタル画像処理」（Ｐ３６０−３６１）に記載さ
れている技術を利用する。このラベル付け処理は、画像
の第１行目において、各ランに異なったラベルを与え、
第２行以下の行では、１つのランを調べて前行のランと
位置を比べる。そして、ランｐが前行のどのランとも隣
接していなければ当該ランｐに新しいラベルを付ける。
ランｐが前行の１つのランのみに隣接しているなら、そ
の隣接するランのラベルを付ける。ランｐが前行の２つ
以上のランに隣接しているなら、ランｐにはこれらのラ
ベルの最小値をつけるが、これらのラベルはすべて同一
成分に属することも記録しておく。このようにして、イ
メージデータが、すべて走査されたとき、記録内容をチ
ェックし、同一と判定されたものには等しいラベルが付
くようにラベル番号を付け直す。このラベル付け処理に
より、各黒画素の塊に一意の番号が付与されるので、番
号が与えられたラベル画像により、このラベル画像を用
いて、各黒画素の塊の外接矩形を作成する。

【００２４】文字矩形分離処理部１３は、外接矩形作成
処理部１２により作成された外接矩形を用いて、画像入
力処理部１１で得られたイメージデータから文字や記号
の領域を分離する。これは、まず、外接矩形作成処理部
１２で得られたイメージデータの連結している黒画素の
塊の各外接矩形の縦方向および横方向の長さが所定の閾
値より小さいものを文字らしいものと推定する。このと
き、用いる所定の閾値としては、文字の大きさよりも多
少大きめに設定すればよい。例えば、この実施例では、
４００ｓｐｉ（ｄｐｉ）の２値画像に対して、閾値は
“３６”としている。

【００２５】特徴点抽出部処理部１４では、外接矩形を
用いて分離した文字記号領域の文字外接矩形から傾き角
を検出するための基準となる特徴点を抽出する。ここで
の文字外接矩形の特徴点としては、前述したように外接
矩形の４つの頂点，中心点，重心点のいずれかの１点と
するが、ここでは外接矩形の左下の頂点を特徴点とす
る。このようにして、抽出した特徴点は、傾き角検出処
理部１５に送出する。

【００２６】傾き角検出処理部１５では、特徴点抽出処
理部１４で得られた各々の特徴点をｘ−ｙ平面上の傾き
角θを持つ直線に投影して、その度数のピークから傾き
角θを検出する。すなわち、各特徴点について、ｘ−ｙ
平面上での傾き角θを持つ直線に投影した値ρを求め、
これを傾き角θを検出する角度の精度の刻みで、投影す
る直線の傾き角θを変えて繰り返し行い、その傾き角θ
ごとの値ρの度数の分布を求めて、その最大の度数とな
る対応の傾き角θを、入力された文書画像の傾き角とす
る。

【００２７】この場合の処理では、作業用に使用するメ
モリ容量を少なくするため、まず、検出する傾き角θに
ついて、特徴点抽出処理部１４で得られた各々の特徴点
をｘ−ｙ平面上の当該傾き角θを持つ直線に投影する。
そして、θ−ρ平面上での各々の値ρの度数分布をカウ
ントして求め、その度数分布のピークを求める。求めた
度数ピークを傾き角θについての一次元配列に登録す
る。これを、検出する総ての傾き角θのそれぞれについ
て度数ピークを求めることを繰り返し行い、検出する全
ての傾き角θの度数ピークが求められると、傾き角θに
ついての一次元配列を探索し、度数ピークが最も大きい
ものに対応する傾き角θを入力された文書画像の傾き角
とする。ここでの作業用に使用するメモリ容量は、検出
する傾き角θの角度の精度に応じた度数ピーク保持用の
一次元配列と、各傾き角θについて投影した値ρの度数
ピークを求めるため一時作業用の一次元配列となる。こ
の一時作業用の一次元配列はハッシュテーブルを使用す
ることにより、更に少ないメモリ容量で作業を行うこと
ができる。

【００２８】ここで、文書画像の傾き角θを検出する原
理について具体的に説明する。文書画像の傾き角を検出
するのための手法として、Ｈｏｕｇｈ変換の手法を用い
る。Ｈｏｕｇｈ変換の手法については、その詳細は、例
えば、文献『與水「直線パターン検出のためのＨｏｕｇ
ｈ曲線追跡型アルゴリズムについて」（電子情報通信学
会、論文誌Ｄ，Ｖｏｌ，Ｊ６８−Ｄ，Ｎｏ．１０，Ｐ１
７６９〜１７７６，１９８５）』に記載されている内容
が参照できる。

【００２９】具体的には、図２に示すように、直交座標
系のｘ−ｙ平面上の傾き角θを持つ直線は、ρ，θをパ
ラメータとする次の式（１）により表現できるので、こ
れを利用する。 ρ＝ｘ・ｃｏｓθ＋ｙ・ｓｉｎθ ……（１）つまり、入力された文書画像について、その直交座標系
のｘ−ｙ平面上の各座標点（Ｘ，Ｙ）の内、上記の式
（１）で表現される傾き角θの直線上にある全ての点
（Ｘｊ，Ｙｊ）は、上記の（１）式により投影変換する
と、θ−ρ平面上では１点（１つの値ρ）に収束するこ
とになる。

【００３０】したがって、ｘ−ｙ平面上の傾き角θｋを
持つ直線に対して、特徴点抽出部処理部１４で抽出した
ｘ−ｙ平面上での特徴点（ｘｉ，ｙｉ）（ｉ＝１，２，
…，ｍ）から、次に示す式（２）で決まる値ρｉを求
め、そのパラメータ対（θｋ，ρｉ）を得る。 ρｉ＝ｘｉ・ｃｏｓθｋ＋ｙｉ・ｓｉｎθｋ ……（２）ここで得られたパラメータ対（θｋ，ρｉ）に対して、
θ−ρ平面上での各々の値ρの度数をカウントし、度数
ピークを検出するため、その度数の分布を記録する。こ
の場合、１次元配列ｂ［ｉ］（ｉ＝１，２，…，ｍ）を
用いて、各々の値ρｉについて、その度数を７の次の式
（３）より数え上げる。ｂ［ρｉ］＝ｂ［ρｉ］＋１ ……（３）全ての特徴点（ｘｉ，ｙｉ）（ｉ＝１，２，…，ｍ）に
ついて、傾き角θｋを持つ直線のθ−ρ平面上での分布
は、上記の式（２）でのそれぞれの値ρｉの度数を求め
れば得られるので、その投影された値ρの度数の分布か
ら、その度数ピークを求め、各々の傾き角θについて度
数ピーク保持用の一次元配列ｃ［θｋ］に記録する。

【００３１】この結果、一次元配列ｃ［θｋ］に記録さ
れた内容は、等価的には、図３に示すように、例えば、
各々の特徴点についてのＨｏｕｇｈ変換したＨｏｕｇｈ
曲線〜を求め、その各特徴点のＨｏｕｇｈ曲線〜
の交差する回数をカウントし、その度数ピークを求め
たものに相当するものとなる。つまり、θ−ρ平面上に
てθ＝θｋとなるＨｏｕｇｈ曲線の交差の回数の度数ピ
ークを求めたものに相当するものとなる。この場合の度
数ピーク（曲線の交点の最大数）が、傾き角θｋについ
ての度数ピーク保持用の１次元配列ｃ［θｋ］に記録さ
れている。

【００３２】すなわち、傾き角θｋを変化させ、検出可
能な傾き角θの角度精度での刻みの全ての傾き角θｋ
（ｋ＝１，２，…Ｎ）について、特徴点を投影した度数
ピークの度数分布を求め、その度数ピークの探索を行う
ことは、度数ピーク保持用の一次元配列ｃ［θｋ］に記
録された内容の度数ピークを探索することとなり、この
度数ピーク保持用の一次元配列ｃ［θｋ］から最も大き
な度数ピークを求めることにより、その対応の傾き角θ
ｋから入力された文書画像の傾き角θを検出することが
できる。

【００３３】このようにして、入力文書画像の傾き角を
検出する場合、Ｈｏｕｇｈ変換による一般的な方法で
は、多くの直線群を抽出することになるため、多くのメ
モリが必要となり、かなり長い計算時間がかかるが、本
発明による度数ピークのカウントの演算処理では、傾き
角θの直線に投影した値ρの度数分布のピークを求め、
その度数ピークを傾き角θｋについて度数ピーク保持用
の一次元配列ｃ［θｋ］に記録する。そして、記録した
一次元配列ｃ［θｋ］の度数ピークを更に探索すること
により、その度数ピークの対応の傾き角から、文書画像
の傾き角を検出する。その結果、θ−ρ平面上でのρ度
数をカウントし、度数ピークを求めることとと等価とな
り、必要なメモリを少なくすることができ、処理時間も
短縮して、文書画像の傾き角を検出することができる。

【００３４】また、この場合に、更に、文書画像中の文
字列方向を検出するようにも変形できる。図４は、傾き
角検出処理部において、文書画像中の文字列方向を検出
する処理を行う処理フローを示すフローチャートであ
る。

【００３５】文字列の方向を検出する場合の処理では、
前述のようにして、特徴点抽出処理部１４から特徴点が
供給されるので、ここでの処理を開始すると、ステップ
４１において、水平方向に対して（０±α）度の範囲の
複数の角度方向での直線に特徴点を投影し、その値の度
数の分布を求め、度数ピークを抽出する。次に、ステッ
プ４２において、垂直方向に対して（９０±α）度の範
囲の複数の角度方向での直線に特徴点を投影し、その度
数の分布を求め、度数ピークを抽出する。

【００３６】そして、次のステップ４３において、水平
方向および垂直方向から得られた度数ピークを比較し、
最も度数ピークの大きい角度から文字列方向を検出す
る。その結果、検出した文字列方向の角度を文書画像の
傾き角とするが、このとき、傾き角が（０±α）度の範
囲内であれば、文書画像中の文字列方向は水平方向と判
定し、また、傾き角が（９０±α）度の範囲内であれ
ば、文書画像中の文字列方向は垂直方向と判定する。こ
のようにして検出する傾き角θの処理範囲を制限するこ
とにより、高速かつ高精度に文書画像の傾き角を検出す
ることができる。また、文字列方向を検出することが可
能となる。

【００３７】次に、具体的にサンプルの文書画像につい
て傾き角を求めた処理例について説明する。図５は、水
平方向に対し傾き角θで傾いて読み取られた横書きの入
力文書画像の一例を示す図であり、図６は、図５に例示
した入力文書画像から抽出された文字外接矩形とそれに
対応する文字画像データを示す図であり、また、図７
は、図６に示す文字外接矩形から抽出した特徴点の一例
を示す図である。

【００３８】図５に示すように、イメージスキャナなど
の文書画像読み取り装置で読み取られた文書画像５１
は、水平方向５０に対し傾き角θで傾いて読み取られた
ものとなっている。この文書画像５１は、文字列方向が
横方向となっている。この文書画像５１に対して、外接
矩形形成処理部１２が文字外接矩形とそれに対応する文
字画像データを求めると、図６に示すように、文字外接
矩形が生成され、文字領域に対応する画像データが抽出
される。図６に示す文字外接矩形の画像データに対し
て、特徴点抽出処理部１４によって、特徴点を抽出する
と、図７に示すように、各々の外接矩形に対応して、特
徴点が抽出される。

【００３９】また、図８は、水平方向に対し傾き角θで
傾いて読み取られた縦書きの入力文書画像の一例を示す
図であり、図９は、図８に例示した入力文書画像から抽
出された文字外接矩形とそれに対応する文字画像データ
を示す図である。図１０は、図９に示す文字外接矩形か
ら抽出した特徴点の一例を示す図である。

【００４０】この場合、図８に示すように、イメージス
キャナなどの文書画像読み取り装置により読み取られた
文書画像６１は、水平方向６０に対し傾き角θで傾いて
読み取られたものとなっている。この文書画像６１は、
中央部に写真部分があり、文字列方向が縦方向となって
いる。この文書画像６１に対して、外接矩形形成処理部
１２が、文字外接矩形とそれに対応する文字画像データ
を求めると、図９に示すように、文字の領域では、文字
外接矩形が生成され、文字領域に対応する画像データが
抽出される。この図９に示す文字外接矩形の画像データ
に対して、特徴点抽出処理部１４によって、特徴点を抽
出すると、図１０に示すように、各々の外接矩形に対応
して、特徴点が抽出される。

【００４１】一般に、Ｈｏｕｇｈ変換を用いた傾き検出
方法は、一つの特徴点毎にＨｏｕｇｈ曲線を求めるた
め、多くのメモリが必要となり、また、かなり長い処理
時間を要することになる。例えば、特徴点の個数をＮと
し、θ−ρ平面上でのθ軸の分割数をＫとし、ρ軸の分
割数をＬとすると、各々の特徴点から１つのＨｏｕｇｈ
曲線が得られるので、その記録用として二次元配列のメ
モリ容量が必要になる。その大きさは（Ｋ×Ｌ）とな
り、処理時間がＯ（Ｎ×Ｋ）となる。

【００４２】しかし、本発明によると、処理範囲を±α
の範囲に制限することにより、必要なメモリは、大きさ
Ｎの一次元配列に短縮できる。すなわち、前述した場合
と同じ精度で傾きを検出すると仮定としても、この場
合、例えば、０〜３６０度の分割数をＫとし、角度の範
囲を±α度とすると、処理時間が、Ｈｏｕｇｈ変換で
は、Ｏ（Ｎ×Ｋ）となるのに対し、本発明の文書画像傾
き検出装置によると、Ｏ（Ｎ×Ｋ×（２α／３６０）×
２）の処理時間で済む。具体的な数値例で説明すると、
αを１０度とすると、処理時間は、４０／３６０＝１／
９となる。

【００４３】（実験結果）本発明者が、文字、図形、写
真を含む雑誌、論文等の文書１７枚に対して、傾きと文
字列方向を検出する実験を行った結果について説明する
と、実験を行ったサンプル文書は、全てＡ４サイズの文
書であり、４００ｄｐｉの解像度で２値画像として入力
した。１７枚の文書の平均傾き検出時間は、データ処理
装置としてエンジニアリングワークステーションの「Ｓ
ＰＡＲＣｓｔａｔｉｏｎ（２８ＭＩＰＳ）」を使用した
場合、２．８８秒で処理結果が得られた。この結果は、
全ての入力文書画像に対し、文字列方向を正しく検出す
ることができ、文字、図形、写真混在文書に対するこの
手法の有効性が確認できた。

【００４４】

【発明の効果】以上説明したように、本発明の文書画像
傾き角検出装置によれば、文書画像全体に対し外接矩形
化処理を行い、外接矩形から文字の外接矩形を選択し特
徴点を求め、この特徴点を基づき文書画像の傾きを検出
するため、文書画像の傾き角をすくない演算量で効率よ
く確実に検出することができる。

【図面の簡単な説明】

【図１】図１は本発明の一実施例にかかる文書画像傾
き角検出装置の基本構成を説明するブロック図、

【図２】図２はＨｏｕｇｈ変換の原理を説明するため
の（ｘ−ｙ）平面上の傾き角θを持つ直線の例を示す
図、

【図３】図３は本発明の文書画像傾き角の検出処理に
かかる（θ−ρ）平面上の度数ピークを求める方法を説
明図、

【図４】図４は傾き角検出処理部において文書画像中
の文字列方向を検出する処理を行う処理フローを示すフ
ローチャート、

【図５】図５は水平方向に対し傾き角θで傾いて読み
取られた横書きの入力文書画像の一例を示す図、

【図６】図６は図５に例示した入力文書画像から抽出
された文字外接矩形とそれに対応する文字画像データを
示す図、

【図７】図７は図６に示す文字外接矩形から抽出した
特徴点の一例を示す図、

【図８】図８は水平方向に対し傾き角θで傾いて読み
取られた縦書きの入力文書画像の一例を示す図、

【図９】図９は図８に例示した入力文書画像から抽出
された文字外接矩形とそれに対応する文字画像データを
示す図、

【図１０】図１０は図９に示す文字外接矩形から抽出
した特徴点の一例を示す図である。

【符号の説明】

１１…画像入力処理部、１２…外接矩形作成処理部、１
３…文字矩形分離処理部、１４…特徴点抽出処理部、１
５…傾き角検出処理部。

Claims

【特許請求の範囲】

【請求項１】文書画像をイメージデータとして入力す
る入力手段と、前記入力手段により得られたイメージデータの中の連結
している黒画素の塊の外接矩形を作成する外接矩形作成
手段と、該外接矩形作成手段により作成された前記外接矩形から
文字領域を推定し、前記イメージデータから文字外接矩
形に対応する部分画像を分離する文字矩形分離手段と、前記文字矩形分離手段で分離された部分画像の特定位置
を特徴点として抽出する特徴点抽出手段と、抽出された特徴点に基づき入力文書画像の傾き角を検出
する傾き角検出手段とを備えることを特徴とする文書画
像傾き角検出装置。
【請求項２】請求項１に記載の文書画像傾き角検出装
置において、傾き角検出手段は、抽出された各々の特徴点を２次元平面上の傾き角θを持
つ直線に投影した値の各々の値の度数のピークを求め、各々の傾き角θについて一次元配列を用いて度数のピー
クのみを記録し、可能な全ての傾き角θについて度数のピークの検索を行
い、最もピークの度数の大きい傾き角θを文書画像の傾
き角として検出することを特徴とする文書画像傾き角検
出装置。
【請求項３】請求項１に記載の文書画像傾き角検出装
置において、傾き角検出手段は、水平方向または垂直方向のどちらか一方の方向から所定
の角度の範囲で傾き角θを変化させた複数の角度の直線
について、特徴点を投影した値の度数のピークの分布を
求め、度数のピークの分布の最も大きい角度を文書画像中の文
書画像の傾きとして検出し、検出した傾き角から水平方
向または垂直方向の文字列方向を判定することを特徴と
する文書画像傾き角検出装置。