JP2000090194A

JP2000090194A - 画像処理方法および画像処理装置

Info

Publication number: JP2000090194A
Application number: JP10256614A
Authority: JP
Inventors: Masahiro Kato; 雅弘加藤
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1998-09-10
Filing date: 1998-09-10
Publication date: 2000-03-31
Anticipated expiration: 2018-09-10
Also published as: JP3852218B2

Abstract

(57)【要約】【課題】文書内における縦書き文章領域や横書き文章
領域の段組構成、文章領域内の各文字サイズ等を考慮す
ることなく、局所的な画素の配置情報に基づいて領域の
抽出処理を行うと、結果として得られる領域情報は必ず
しも文書の論理構造を反映するものとはならない。【解決手段】画像入力部１１から入力された文書画像
を分割して文章領域を抽出する画像処理装置１０におい
て、入力文書画像に含まれる文章が縦書きであるか又は
横書きであるかを文章方向算定部１３で算定し、この文
章方向算定部１３による算定結果を参照して分割境界設
定部１４で入力文書画像を分割する境界を設定する。そ
して、領域分割部１３において、分割境界設定部１４で
設定された境界にて入力文書画像を分割する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力された文書画
像を分割して文章領域を抽出する画像処理方法および画
像処理装置に関し、特に画像データとして入力された新
聞や雑誌等の各種印刷文書から所望の文章領域を抽出す
る画像処理方法および画像処理装置に関するものであ
る。

【０００２】

【従来の技術】近年、ワードプロセッサやパーソナルコ
ンピュータ等を用いた、電子データを出力形態とする電
子文書作成装置の普及に加え、インターネットやイント
ラネット等に代表されるようにオフィスや家庭を取り巻
くネットワーク環境が急速に発達しており、情報を伝達
したり、蓄積する手段として電子データ化された文書が
広く用いられている。そのうえさらに、新聞や雑誌等の
紙面上の文書情報を利用したいというニーズも多く、こ
れらを上記電子文書作成装置によって作成された文書と
混在させて利用するためには、紙面上の文書情報を何ら
かの手段を用いて電子データに変換する必要が生じる。

【０００３】これを実現する最も基本的な手段として
は、紙面上の文書情報をデジタル画像として取り込んだ
文書画像データそのものを所望の電子データとして利用
することである。しかし、このような電子データは文章
や図形、表等といった文書の構成要素がどのようなもの
であろうと文書全体が一律に画素の集合として表現され
てしまうため、上記電子文書作成装置によって作成され
た文書と同等に文書内の文章や図形を自由に検索、編集
するなど多岐にわたる利用が困難であるという問題点が
ある。

【０００４】上述した問題点を解決するために、文書画
像を図形領域や写真領域などの他、縦書き文章領域や横
書き文章領域のように、ある属性を持つ複数の領域に分
割して所望の文章領域を抽出する技術として、以下に示
すような文書画像領域分割方式が提案されている。

【０００５】例えば、特開平９−１６７２３３号公報に
は、黒画素成分の大きさに基づいて文章領域を抽出する
技術が開示されている。これは、先ず、入力された文書
画像を２値化し、黒画素連結成分を抽出してその外接矩
形のサイズから文字と判定されるものを抽出する。次
に、文章領域としての評価値が最良となるまで統合条件
を変更しながら統合処理を繰り返すことで、文書領域を
抽出するというものである。

【０００６】また、特開平３−２６８１８１号公報に
は、白画素成分の密度に着目して文書画像を分割し、分
割された領域の特性から文章領域を抽出する技術が開示
されている。これは、先ず、入力された文書画像を一定
の大きさのセルに分割して各セルの黒画素数をカウント
し、黒画素数がしきい値以下であればそのセルを空白セ
ルとする。次に、４近傍で隣接する空白セル同士を連結
して空白セル領域を作成し、空白領域で区切られた矩形
領域をブロックとして抽出する。そして、平均黒画素数
がしきい値よりも少なく、水平／垂直方向に作成した投
影分布に周期性のあるものを文章領域として抽出すると
いうものである。

【０００７】また、文献「信学技法（ＰＲＬ８５−１
７，１９８５）」には、文書画像において投影分布を作
成し、分布の形状に基づいて文書画像を分割し、文章領
域を抽出する技術が開示されている。これは、先ず、入
力された文書画像に対して水平または垂直方向に投影分
布を作成し、この作成した投影分布上で頻度が存在する
部分（以下、黒領域部と称す）と頻度が０の部分（以
下、空白部と称す）を抽出する。このとき、黒領域部に
一定の条件を満たす極小点が存在する場合には、この極
小点から当該黒領域部を分割した場合の両領域同士の相
関比を評価することで、黒領域部間の分離と統合を繰り
返しながら最終的な黒領域部を抽出する。

【０００８】次に、投影分布上における複数黒領域部の
規則性情報、即ち黒領域部の平均区間幅、空間部の平均
区間幅、黒領域部の面積などを算出することで、縦書き
文章領域か、横書き文章領域かまたは未確定領域かを判
断する。ここでは、相関比が高い複数個の黒領域群が連
続し、かつ一定許容範囲で配置されている場合に、これ
らの黒領域群を一つの文章領域としている。一方、相関
比と共に、空白部の区間幅を文章領域の分離情報として
利用する。そして、これらの処理を水平方向と垂直方向
で交互に繰り返して実施することで、最終的に確定した
文章領域を抽出するというものである。

【０００９】

【発明が解決しようとする課題】しかしながら、上述し
た従来の文章画像領域分割方式では、いずれの場合も文
書内における縦書き文章領域や横書き文章領域の段組構
成、文章領域内の各文字サイズ等を考慮することなく、
局所的な画素の配置情報に基づいて領域を抽出するよう
にしているため、結果として得られる領域情報は必ずし
も文書の論理構造を反映するものではなかった。

【００１０】例えば、特開平９−１６７２３３号公報に
開示の従来技術では、統合条件として、統合後の領域が
抽出した文字列に対する文字認識処理結果を用いたり、
または、統合後の領域から抽出した文字列の幾何学的情
報を用いるなどしているが、領域を個々の連結成分単位
の細かさで分割してしまうと、１文字が複数の連結成分
から表現されることとなり、統合条件によってはこれら
を正しく統合できないことも予想される。

【００１１】また、統合後に縦書き文章領域かあるいは
横書き文章領域かを算出しているため、統合誤りが発生
した場合には、文章領域全体の属性を誤って判断されて
しまうことがある。さらには、どのような統合条件を利
用するにせよ、何度にも亘って統合処理を行い、その結
果から最良のものを選択する必要があるため、処理時間
がかかるという問題点がある。

【００１２】また、特開平３−２６８１８１号公報に開
示の従来技術では、文章中の文字サイズの如何に関わら
ず、文書画像を一定の大きさのセルに分割して空白セル
を抽出している。このとき、空白セルを作成する際には
文書画像中の最も小さい文字が抽出できるようなセルの
サイズを設定する必要がある。

【００１３】このように小さなサイズのセルを用いて空
白領域を抽出した場合、例えば、より大きなサイズの文
字から構成される文章領域の文字間において、小さなサ
イズの文字から構成される文章領域の文字間隔に比べて
広いことが原因で不必要に空白セルが作成されてしまう
可能性がある。その結果、得られる文章領域も本来なら
ば同一の文章領域として扱われるべきものが、不自然に
分割された複数の文章領域として抽出されてしまうとい
う問題点がある。

【００１４】また、文献「信学技法（ＰＲＬ８５−１
７，１９８５）」に開示の従来技術では、水平および垂
直方向の投影分布を交互に作成し、投影分布上の空白部
を検出して領域を分割しているが、複雑な構造の文書で
は明確な空白部が検出されることは少ないため、領域の
分割ができない場合があるという問題点がある。さらに
は、各黒領域部において相関比を求めているが、この相
関比は頻度分布の分散に基づく特徴量であることから、
その算出には数度に亘る浮動小数点演算を必要とする。
さらには、相関比に基づいて黒領域部の分離と統合処理
を繰り返す必要があるため、やはり多くの演算処理を必
要とする問題点がある。

【００１５】本発明は、上述した事情に鑑みてなされた
ものであり、その目的とするところは、文書構造が未知
である文書画像に対して、文書の論理構造に逆らうこと
なく領域を分割し、かつ縦書き文書領域と横書き文書領
域を分離して抽出できる画像処理方法および画像処理装
置を提供することにある。

【００１６】

【課題を解決するための手段】本発明による画像処理方
法は、入力された文書画像に含まれる文章が縦書きであ
るか又は横書きであるかを算定し、その算定した結果を
参照して入力文書画像を分割する境界を設定し、その設
定した境界において入力文書画像を分割することを特徴
としている。

【００１７】本発明による画像処理装置は、上記画像処
理方法を実現するための画像処理装置であって、入力さ
れた文書画像に含まれる文章が縦書きであるか又は横書
きであるかを算定する算定手段と、この算定手段による
算定結果を参照して入力文書画像を分割する境界を設定
する境界設定手段と、この境界設定手段によって設定さ
れた境界において入力文書画像を分割する分割手段とを
備えることを特徴としている。

【００１８】上記構成の画像処理装置において、先ず、
算定手段は、入力された文書画像に含まれる文章が縦書
きであるか又は横書きであるかを算定することで、文書
の論理構造を把握する。この算定結果を受けて、境界設
定手段は、算定された文章方向を考慮して入力文書画像
を分割する境界を設定する。そして、分割手段は、境界
設定手段で文章方向に応じて設定された境界において入
力文書画像を分割することで、文書の論理構造を尊重し
た文章領域の抽出を行う。

【００１９】本発明による他の画像処理方法は、入力さ
れた文書画像を構成する画素の投影分布を算出し、その
算出した投影分布において、所定のしきい値に満たない
頻度を有する区間幅を用いて入力文書画像を分割する境
界を設定し、その設定した境界において入力文書画像を
分割することを特徴としている。

【００２０】本発明による他の画像処理装置は、上記他
の画像処理方法を実現するための画像処理装置であっ
て、入力された文書画像を構成する画素の投影分布を算
出する投影分布算出手段と、この投影分布算出手段によ
って算出された投影分布において、所定のしきい値に満
たない頻度を有する区間幅を用いて文書画像を分割する
境界を設定する境界設定手段と、この境界設定手段によ
って設定された境界において文書画像を分割する分割手
段とを備える構成となっている。

【００２１】上記構成の他の画像処理装置において、先
ず、投影分布算出手段は、入力された文書画像を構成す
る画素の投影分布を算出する。この算出結果を受けて、
境界設定手段は、算出された投影分布において、所定の
しきい値に満たない頻度を有する区間幅を用いて入力文
書画像を分割する境界を設定する。投影分布においてし
きい値を設定することで、空白領域（画素数が０）の検
出が難しい複雑な文書であっても、分割領域の境界を精
度良く設定できる。そして、分割手段は、境界設定手段
で設定された境界において入力文書画像を分割する。

【００２２】

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しつつ詳細に説明する。

【００２３】図１は、本発明の第１実施形態に係る画像
処理装置１０の構成を概略的に示したブロック図であ
る。図１において、第１実施形態に係る画像処理装置１
０は、画像入力部１１、前処理部１２、文章方向算定部
１３、分割境界設定部１４および領域分割部１５を有す
る構成となっている。なお、これら構成部分の各処理に
ついては、マイクロコンピュータ等によって構成される
制御部（図示せず）によって制御されるものとする。

【００２４】この画像処理装置１０において、画像入力
部１１は、文書画像を入力するためのものである。この
画像入力部１１としては、スキャナ等光学的に文書情報
を入力する手段であっても良いし、また予めデジタル画
像に変換された文書情報を入力する手段であっても良
い。画像入力部１１から入力された画像に対し、ここで
は公知の技術によって２値化した後、傾きを検出してそ
の補正処理を施すこととする。以降、この処理によって
得られた画像を入力画像と称す。なお、入力画像では文
字をはじめとする文書構成要素が黒画素で表現されるも
のとする。

【００２５】前処理部１２は、画像入力部１１によって
入力された画像から、文章方向算定部１３および分割境
界設定部１４で処理を施す際に利用する特徴量を抽出す
る。ここでは、特徴量として黒画素連結成分に対して外
接する矩形（以下、外接矩形と称す）の幾何情報を用い
るものとして説明する。文章方向算定部１３は、画像入
力部１１から入力された文書画像の文章が、縦書き主体
であるか横書き主体であるかを算定する。

【００２６】分割境界設定部１４は、文章方向算定部１
３によって算定された文章方向によって、画像入力部１
１から入力された文書画像を分割する境界を設定する。
そして、領域分割部１５は、分割境界設定部１４によっ
て設定された分割境界に基づいて、画像入力部１１から
入力された文書画像を分割する。

【００２７】次に、上記構成の第１実施形態に係る画像
処理装置１０の全体の動作につき、図２のフローチャー
トを用いて説明する。

【００２８】先ず、画像入力部１１から文書画像を入力
し（ステップＳ１１）、次いで前処理部１２で前処理を
実施して分割対象領域を入力画像全体に設定する（ステ
ップＳ１２）。次に、文章方向算定部１３で分割対象領
域における文章領域の主体となる文章方向を算出し（ス
テップＳ１３）、得られた情報を利用して分割境界設定
部１４で分割境界を設定する（ステップＳ１４）。

【００２９】続いて、図示せぬ制御部により、ステップ
Ｓ１４において分割境界が設定できたかどうかを判定し
（ステップＳ１５）、分割境界を設定できた場合には、
その設定された分割境界に基づいて領域分割部１５で領
域を分割する（ステップＳ１６）。そして、図示せぬ制
御部により、分割後の１つの領域を新たな分割対象領域
として設定し（ステップＳ１７）、しかる後ステップＳ
１３へ移行する。

【００３０】一方、ステップＳ１５においてステップＳ
１４での分割境界の設定が不可能であったと判断した場
合には、さらに分割対象領域とすることのできる領域が
他に存在するか否かを判断する（ステップＳ１８）。こ
こで、他に存在すると判断した場合には、ステップＳ１
７に移行してこの領域を新たな分割対象領域として設定
する。他に分割対象領域となる分割処理後の領域が存在
しない場合には、一連の処理を終了する。

【００３１】次に、図１の画像処理装置１０における各
構成部分の動作について説明する。先ず、画像入力部１
１から入力された画像に対する処理として、前処理部１
２の処理内容について図３のフローチャートを用いて説
明する。

【００３２】先ず、入力画像に対して公知のラベリング
処理を施し、黒画素連結成分を抽出する（ステップＳ２
１）。ここに、ラベリング処理とは、連結している画素
の成分からなる１つの領域に１つの識別値を与える処理
を言う。次いで、抽出したすべての黒画素連結成分に対
して外接する矩形を作成し（ステップＳ２２）、続いて
各外接矩形の高さＨと幅Ｗを算出する（ステップＳ２
３）。

【００３３】次に、各外接矩形の高さＨと幅Ｗを参照
し、予め設定しておいたサイズに関するしきい値ＴＨ
_SMALLとＴＨ_LARGEおよび形状に関するしきい値ＴＨ
_SEPARATORを用いて、外接矩形によって囲まれる黒画素
連結成分を、以下に示すように、文字候補、図形候補、
フィールドセパレータ候補、ノイズ候補の４種類に分類
する（ステップＳ２４）。

【００３４】・文字候補： [(ＴＨ_SMALL＜Ｈ＜ＴＨ_LARGE）∩（Ｗ＜ＴＨ_LARGE)] ∪[(Ｈ＜ＴＨ_LARGE）∩（ＴＨ_SMALL＜Ｗ＜ＴＨ_LARGE)] …（１）

【００３５】・図形候補： [(ＴＨ_LARGE≦Ｈ）∪（ＴＨ_LARGE≦Ｗ)] ∩[(ＴＨ_SEPARATOR≧（Ｈ／Ｗ)]（ただし、Ｈ≧Ｗの場合） [(ＴＨ_LARGE≦Ｈ）∪（ＴＨ_LARGE≦Ｗ)] ∩[(ＴＨ_SEPARATOR≧（Ｈ／Ｗ)]（ただし、Ｈ＜Ｗの場合）…（２）

【００３６】・フィールドセパレータ候補： [(ＴＨ_LARGE≦Ｈ）∪（ＴＨ_LARGE≦Ｗ)] ∩[(ＴＨ_SEPARATOR＜（Ｈ／Ｗ)]（ただし、Ｈ≧Ｗの場合） [(ＴＨ_LARGE≦Ｈ）∪（ＴＨ_LARGE≦Ｗ)] ∩[(ＴＨ_SEPARATOR＜（Ｈ／Ｗ)]（ただし、Ｈ＜Ｗの場合）…（３）

【００３７】・ノイズ候補：（Ｈ≦ＴＨ_SMALL）∩（Ｗ≦ＴＨ_SMALL） ………（４）

【００３８】次に、文章方向算定部１３の処理内容につ
いて、図４のフローチャートを用いて説明する。なお、
以下に言う水平方向および垂直方向とは、横書きおよび
縦書きの各文章方向にそれぞれ対応する方向を言うもの
とする。

【００３９】先ず、水平方向に隣接する文字候補の外接
矩形間の平均間隔である水平方向平均間隔Ｓ_Hと、垂直
方向に隣接する文字候補の外接矩形間の平均間隔である
垂直方向平均間隔Ｓ_Vを算出する（ステップＳ３１）。
ただし、算出に用いる外接矩形間隔が予め設定しておい
たしきい値ＴＨ_SPACEよりも広い場合には、この値を利
用しないものとする。

【００４０】このことについて、図５を用いて詳細に説
明する。例えば、水平方向平均間隔Ｓ_Hを算出するので
あれば、しきい値ＴＨ_SPACE以下である間隔ＤＨ１は算
出に利用するが、しきい値ＴＨ_SPACEを超える間隔ＤＨ
２は利用しない。同様に、垂直方向平均間隔Ｓ_Vを算出
するのであれば、しきい値ＴＨ_SPACE以下である間隔Ｄ
Ｖ２は算出に利用するが、しきい値ＴＨ_SPACEを超える
間隔ＤＶ１は利用しない。このようなしきい値ＴＨ
_SPACEによる判断処理を導入することで、安定して平均
間隔を算出することができる。

【００４１】なお、しきい値ＴＨ_SPACEは予備実験によ
って統計的に設定しても良いし、又文字候補の外接矩形
における高さの平均値Ｈ_AVEと幅の平均値Ｗ_AVEを算出
し、これらに基づいてその都度算出しても良い。実際に
は、水平方向平均間隔Ｓ_Hは平均列間隔とほぼ等しく、
垂直方向平均間隔Ｓ_Vは平均行間隔とほぼ等しい値とな
ることから、ここでは水平方向平均間隔Ｓ_Hを平均列間
隔、垂直方向平均間隔Ｓ_Vを平均行間隔と呼ぶこととす
る。

【００４２】続いて、算出した平均列間隔Ｓ_Hと平均行
間隔Ｓ_Vから、以下のように対象領域の文章方向を算定
する（ステップＳ３２）。・Ｓ_V＜Ｓ_Hである場合、縦書き文章領域が主体であ
る。・Ｓ_V＞Ｓ_Hである場合、横書き文章領域が主体であ
る。

【００４３】ただし、Ｓ_V＝Ｓ_Hである場合は、予め縦
書きまたは横書きのどちらか一方を優先的に選択するよ
うにしても良いし、文字候補の配置状態から水平方向へ
の分布範囲と垂直方向への分布範囲を比較し、水平方向
への分布範囲が広い場合には横書き文章領域であり、逆
に垂直方向への分布範囲が広い場合には縦書き文章領域
であるとしても良い。

【００４４】次に、分割境界設定部１４の処理内容につ
いて、図６のフローチャートを用いて説明する。

【００４５】先ず、水平方向および垂直方向に入力画像
の投影分布を作成する（ステップＳ４１）。このとき、
投影する画素は、入力画像中のすべての連結成分を対象
としても良いし、文字候補である連結成分のみを対象と
しても良い。続いて、作成した投影分布情報を利用して
分割境界候補を抽出する（ステップＳ４２）。ここで
は、分割境界候補の抽出について、図７を用いて説明す
る。

【００４６】図７において、（ａ）が水平方向の投影分
布を示し、（ｂ）が垂直方向の投影分布を示すものとす
る。水平方向および垂直方向の両投影分布において、し
きい値ＴＨ_DISTRIBUTIONに満たない頻度を持つ閉区間Ｄ
１〜Ｄ５に着目し、区間Ｄ１〜Ｄ３のうちのしきい値Ｔ
Ｈ_SPLIT-H以上の区間幅を持つ区間を、また区間Ｄ４と
Ｄ５のうちのしきい値ＴＨ_SPLIT-V以上の区間幅を持つ
区間を分割境界候補として抽出する。

【００４７】ここで、文章方向算定部１３により算定さ
れた主体となる文章方向を考慮し、しきい値ＴＨ
_SPLIT-VとＴＨ_SPLIT-Hを、平均行間隔Ｓ_Vと平均列間
隔Ｓ_Hを用いて以下のように設定する。ＴＨ_SPLIT-V＝Ｓ_V×Ｃ１ＴＨ_SPLIT-H＝Ｓ_H×Ｃ２ ………（５）

【００４８】なお、係数Ｃ１とＣ２は文章方向によって
変更する。ただし、両者は以下の関係を保つものとす
る。・縦書き文章領域が主体である場合：Ｃ１＝Ｃ２×α ・横書き文章領域が主体である場合：Ｃ２＝Ｃ１×α ………（６）ここに、αは、１よりも大きい（１＜α）係数である。

【００４９】これにより、縦書き文章領域が主体である
場合には、しきい値ＴＨ_SPLIT-Vがしきい値ＴＨ
_SPLIT-Hに比べて大きくなることから、水平方向の投影
分布上から分割境界候補が抽出される確率が高くなり、
垂直方向の投影分布上からは分割境界候補が抽出される
確率が低くなる。逆に、横書き文章領域が主体である場
合には、しきい値ＴＨ_SPLIT-Hがしきい値ＴＨ_SPLIT-V
に比べて大きくなることから、垂直方向の投影分布上か
ら分割境界候補が抽出される確率が高くなり、水平方向
の投影分布上から分割境界候補が抽出される確率が低く
なる。

【００５０】ここで、分割境界候補を抽出する投影分布
方向を確定しないのは、例えば、図８に示すように、文
章がすべて縦書きであった場合でも、段組構成により複
数の文章領域として抽出することが必要な場合などに対
する配慮である。

【００５１】次に、文章方向算定部１３において縦書き
文章領域が主体であると算定された場合は、少なくとも
しきい値ＴＨ_SPLIT-Vが区間Ｄ４の区間幅よりも大きな
値となり、しきい値ＴＨ_SPLIT-Hが最大でも区間Ｄ３の
区間幅と等しくなるような式（６）の係数αを設定する
ことにより、垂直方向の投影分布上からは分割境界候補
が抽出されず、水平方向の投影分布のみから境界分割候
補が抽出されることとなる。

【００５２】逆に、文章方向算定部１３において横書き
文章領域が主体であると算定された場合は、少なくとも
しきい値ＴＨ_SPLIT-Hが区間Ｄ３の区間幅よりも大きな
値となり、しきい値ＴＨ_SPLIT-Vが最大でも区間Ｄ４の
区間幅と等しくなるような式（６）の係数αを設定する
ことにより、水平方向の投影分布上からは分割境界候補
が抽出されず、垂直方向の投影分布のみから境界分割候
補が抽出されることとなる。

【００５３】再び図６のフローチャートにおいて、ステ
ップＳ４２で抽出した分割境界候補の中から最も区間幅
の広いものを分割境界として設定する（ステップＳ４
３）。例えば、図７の投影分布のうち、同図（ａ）の区
間Ｄ１〜Ｄ３が分割境界候補として抽出された場合、分
割境界として設定するのは区間Ｄ３となる。

【００５４】すなわち、図７（ａ）が入力画像の水平方
向の投影分布を表しているのであれば、図９（ａ）に示
すように、分割境界は画像において垂直方向に設定さ
れ、図７（ａ）が入力画像の垂直方向の投影分布を表し
ているのであれば、図９（ｂ）に示すように、分割境界
は画像において水平方向に設定されることになる。

【００５５】次に、領域分割部１５の処理内容につい
て、図１０のフローチャートを用いて説明する。先ず、
分割境界設定部１４で設定された投影分布上の分割境界
において、分割境界の両端から投影分布を走査して最小
頻度点を検出する（ステップＳ５１）。

【００５６】ここで、最小頻度点の検出について、図１
１を用いて説明する。図１１（ａ）の場合では、分割境
界である区間Ｄ１において最小頻度点はＳ１が唯一求ま
る。図１１（ｂ）の場合では、Ｓ１からＳ２に亘って最
小頻度を持つ区間Ｄ２が求まるが、この場合、Ｓ１およ
びＳ２の２点を最小頻度点とする。

【００５７】次に、図１１（ｃ）の場合では、Ｓ１から
Ｓ２に亘って最小頻度を持つ区間Ｄ２と、Ｓ３からＳ４
に亘って最小頻度を持つ区間Ｄ３が求まる。ここでは、
分割境界の端点Ｐ１から走査して初めて最小頻度点とし
て検出されたＳ１からの区間幅Ｄ２と、分割境界のもう
一方の端点Ｐ２から走査して初めて最小頻度点として検
出されたＳ４からの区間幅Ｄ３を比較する。

【００５８】そして、以下のように最小頻度点を設定す
る。・Ｄ２＜Ｄ３の場合：Ｓ３とＳ４を最小頻度点とする。・Ｄ２＞Ｄ３の場合：Ｓ１とＳ２を最小頻度点とする。・Ｄ２＝Ｄ３の場合：水平方向の投影分布であれば、Ｓ
１とＳ２を最小頻度点とする。逆に、垂直方向の投影分
布であれば、Ｓ３とＳ４を最小頻度点とする。これは、
文章領域において、最終行や最終列は、他の行や列と比
べて文字数が少ない場合が多いことを考慮したものであ
る。

【００５９】続いて、ステップＳ５１で検出した最小頻
度点に基づいて領域を分割する（ステップＳ５２）。分
割後、例えば図１１（ａ）においてＳ１が分割後の２つ
の領域の端点となり、図１１（ｂ）においてはＳ１およ
びＳ２が分割後の２つの領域のそれぞの端点となる。ま
た、図１１（ｃ）においては、Ｓ１とＳ２、またはＳ３
とＳ４が対となって分割後の２つの領域の端点となる。

【００６０】そして、分割後の各領域において不要なマ
ージンを削除し文章領域を抽出する（ステップＳ５
３）。この様子を図１２を用いて説明する。図１２
（ａ）は、縦書き文章領域が主体である文書画像を上述
の手法により２つの領域に分割した直後の様子を示して
いる。この２つの領域において水平方向の投影分布の端
点Ｐ３とＰ４を用いて、図１２（ｂ）に示すように文章
領域を矩形で限定することにより、文章領域を抽出する
ことができる。

【００６１】以上説明した一連の処理は、一度の領域分
割処理に対応するものである。次に、既に抽出した文章
領域を新たな分割対象領域として設定し、上述した文章
方向算定部１３、分割境界設定部１４および領域分割部
１５による一連の処理を再び実行する。このように、分
割境界が抽出できなくなるまで画像を細分化して文章を
抽出することで、複雑な文章構造を持つ文章画像から最
終的に複数の文章領域群を得ることができる。

【００６２】なお、式（６）において、適切な係数αと
係数Ｃ１、または係数αと係数Ｃ２の組み合わせを設定
することにより、最終的に得られる文章領域の形態を、
図１２（ｂ）に示すように人の目で判断して同一属性を
持つと考えられるブロックとしたり、または、１行／１
列単位とすることも可能である。

【００６３】これにより、文章だけでなく、複雑な形状
を持つ図形が文書内に混在す場合でも、適切に文章領域
を抽出することが可能となる。例えば、最終的に得られ
る文章領域の形態が、図１２（ｂ）に示すように、人の
目で判断して同一属性を持つと考えられるブロックとし
て抽出されるような値α１に係数αを固定し、図１３
（ａ）に示す文書画像から文章領域を抽出することを考
える。

【００６４】この場合、横書き文章領域が主体であると
判断されたとしても、区間Ｄ１の区間幅が上記係数αに
て設定されたしきい値ＴＨ_SPLIT-Hよりも大きいため、
ステップＳ４２で分割領域候補として設定されてしま
い、同じように分割領域候補として設定された区間Ｄ２
〜Ｄ８よりも区間幅が広いことから、ステップＳ４３に
おいて分割境界として設定されてしまう。この結果、文
章領域抽出結果は、図１３（ｂ）に示すようになってし
まい、本来の文書が持つ文書構造に反すものとなってし
まう。

【００６５】これに対して、係数αを分割対象領域の文
書構成に応じて動的に変更させた場合を考える。ここで
は、対象分割領域中に図形属性を持つ黒画素連結成分が
存在した場合、最終的に得られる文章領域の形態が１行
／１列単位となる値α２を選択する。局所的に領域分割
および文章領域抽出処理が繰り返されても、分割対象領
域中に図形候補が存在する限りα２を選択することで、
得られる最終結果は図１３（ｃ）に示すようになり、同
図（ｂ）のような不自然な文章領域抽出を防ぐことがで
きる。

【００６６】なお、ステップＳ４３において分割境界を
分割境界候補の中から設定する際の条件を、最小頻度点
を持つものとして変更しても良いし、最小頻度点を持つ
分割境界候補が複数存在する場合には、さらにその中で
最大の区間幅を持つものとしても良い。

【００６７】また、上述の処理で得られた最終的な文章
領域中に、フィールドセパレータ候補が含まれている場
合、水平方向に延びるフィールドセパレータなのか、垂
直方向に延びるフィールドセパレータなのかの情報を利
用し、フィールドセパレータ候補の外接矩形の座標に基
づいて領域を分割しても良い。例えば、新聞記事など込
み入った複数の文章領域から構成される文書では、句読
点とその次に続く文字との間隔が段組間の間隔よりも広
いことがあり、フィールドセパレータ候補の幾何情報を
利用して文章領域を分割することが有効である。

【００６８】上述したように、入力された文書画像を分
割して文章領域を抽出する処理方法として、入力文書画
像に含まれる文章が縦書きであるか又は横書きであるか
を算定し、その算定した結果を参照して入力文書画像を
分割する境界を設定し、その設定した境界において入力
文書画像を分割するようにしたことにより、文書構造が
未知である文書画像に対しても、文書の論理構造を考慮
して領域分割の境界を設定できるため、文書の論理構造
に逆らうような不自然な領域の分割を防ぐことができ
る。

【００６９】また、文章領域を得るために、従来方式の
ように、細分化した連結成分同士の再統合処理や、投影
分布上の黒領域の統合処理など一切の統合処理を行うこ
となく、領域分割を中心とする処理のみで、縦書き文書
領域と横書き文書領域を分離して抽出することができ
る。さらには、複雑な浮動小数点演算が少ないので、高
速な処理を実現することができる。

【００７０】また、領域分割の境界の設定に際して、入
力された文書画像を構成する画素の投影分布を算出し、
この投影分布において、所定のしきい値ＴＨ
_DISTRIBUTIONに満たない頻度を有する区間幅を用いて分
割境界を設定するようにしているので、従来技術のよう
に、投影分布上の空白部（頻度が０の部分）を分割境界
としているのに比べて、文書の論理構造を考慮したより
精度の高い分割境界の設定が可能となる。

【００７１】すなわち、複雑な文書になればなる程、明
確な空白領域、即ち頻度が存在しない区間の検出が困難
となるのであるが、しきい値ＴＨ_DISTRIBUTIONを設定
し、このしきい値ＴＨ_DISTRIBUTION以下の頻度を有する
区間幅を用いて分割境界を設定するようにすることで、
入力された文書画像が複雑な文書画像であっても、文書
の論理構造を考慮して領域分割の境界をより精度良く設
定できるのである。

【００７２】なお、入力された文書画像を構成する画素
の投影分布を算出し、この投影分布において、所定のし
きい値に満たない頻度を有する区間幅を用いて分割境界
を設定するという技術思想は本発明の特徴の一つであ
り、上記実施形態の場合のように、入力された文書画像
に含まれる文章が縦書きであるか又は横書きであるかを
算定し、その算定した結果を参照して入力文書画像を分
割する境界を設定し、その設定した境界において入力文
書画像を分割する画像処理方法および画像処理装置への
適用に限定されるものではなく、一般的な画像処理方法
および画像処理装置にも適用可能である。

【００７３】図１４は、この技術思想を用いた本発明の
第２実施形態に係る画像処理装置２０の構成を概略的に
示したブロック図である。

【００７４】図１４において、第２実施形態に係る画像
処理装置２０は、画像入力部２１、前処理部２２、投影
方向算出部２３、分割境界設定部２４および領域分割部
２５を有する構成となっている。なお、これら構成部分
の各処理については、マイクロコンピュータ等によって
構成される制御部（図示せず）によって制御されるもの
とする。

【００７５】この画像処理装置２０において、画像入力
部２１は、文書画像を入力するためのものである。この
画像入力部１１としては、スキャナ等光学的に文書情報
を入力する手段であっても良いし、また予めデジタル画
像に変換された文書情報を入力する手段であっても良
い。画像入力部１１から入力された画像に対し、ここで
は公知の技術によって２値化した後、傾きを検出してそ
の補正処理を施すこととする。なお、入力画像では文字
をはじめとする文書構成要素が黒画素で表現されるもの
とする。

【００７６】前処理部２２は、画像入力部２１から入力
された文書画像から、投影分布算出部２３および分割境
界設定部２４で処理を施す際に利用する特徴量を抽出す
る。ここでは、特徴量として黒画素連結成分の外接矩形
の幾何情報を用いるものとして説明する。投影分布算出
部２３は、画像入力部２１から入力された文書画像を構
成する画素の投影分布を算出する。

【００７７】分割境界設定部２４は、投影分布算出部２
３によって算出された投影分布において、所定のしきい
値に満たない頻度を有する区間幅を用いて入力文書画像
を分割する境界を設定する。そして、領域分割部２５
は、分割境界設定部２４によって設定された分割境界に
基づいて、画像入力部２１から入力された文書画像を分
割する。

【００７８】上記の構成において、画像入力部２１、前
処理部２２および領域分割部２５はそれぞれ、図１に示
した画像入力部１１、前処理部１２および領域分割部１
５と内部構成および処理内容が同一であることから、そ
の処理内容の説明については割愛する。また、投影分布
算出部２３および分割境界設定部２４についても、基本
的には、図１に示した分割境界設定部１４の内部構成お
よび処理内容をそれぞれ分担したものである。

【００７９】このように、入力された文書画像を構成す
る画素の投影分布を算出し、この投影分布を用いて分割
領域の境界を設定する際に、投影分布において、所定の
しきい値を設定し、このしきい値に満たない頻度を有す
る区間幅を用いて分割境界を設定することで、複雑な文
書であっても、文書の論理構造を考慮したより精度の高
い分割境界の設定が可能となる。

【００８０】図１５は、本発明の第３実施形態に係る画
像処理装置３０の構成を概略的に示したブロック図であ
る。この第３実施形態に係る画像処理装置３０は、第１
実施形態に係る画像処理装置１０に対し、入力画像を垂
直方向に膨張した画像と、入力画像を水平方向に膨張し
た画像との論理積を求めることにより、個々の連結成分
が個々の文字を表わす確率を高められた画像を新たな入
力画像として生成する構成を採っている。

【００８１】すなわち、図１５において、第３実施形態
に係る画像処理装置３０は、画像入力部３１、入力画像
再生成部３２、前処理部３３、文章方向算定部３４、分
割境界設定部３５および領域分割部３６を有する構成と
なっている。なお、これら構成部分の各処理について
は、マイクロコンピュータ等によって構成される制御部
（図示せず）によって制御されるものとする。

【００８２】この画像処理装置３０において、画像入力
部３１は、文書画像を入力するためのものである。この
画像入力部３１としては、スキャナ等光学的に文書情報
を入力する手段であっても良いし、また予めデジタル画
像に変換された文書情報を入力する手段であっても良
い。画像入力部３１から入力された画像に対し、ここで
は公知の技術によって２値化した後、傾きを検出してそ
の補正処理を施すこととする。なお、入力画像では文字
をはじめとする文書構成要素が黒画素で表現されるもの
とする。

【００８３】入力画像再生成部３２は、画像入力部３１
から入力された画像に対して、画像を垂直方向に膨張処
理した画像と、入力画像を水平方向に膨張処理した画像
との論理積を求めることにより、個々の連結成分が個々
の文字を表わす確率を高められた画像を新たな入力画像
として生成する。以降、この入力画像再生成部３２での
処理により得られた画像を入力画像と称す。

【００８４】前処理部３３は、入力画像再生成部３２で
再生成した入力画像から、文章方向算定部３４および分
割境界設定部３５で処理を施す際に利用する特徴量を抽
出する。ここでは、特徴量として黒画素連結成分の外接
矩形の幾何情報を用いるものとして説明する。文章方向
算定部３４は、入力画像再生成部３２で再生成した入力
画像の文章が、縦書き主体であるか横書き主体であるか
を算定する。

【００８５】分割境界設定部３５は、文章方向算定部３
４によって算定された文章方向によって、入力画像再生
成部３２で再生成した入力画像を分割する境界を設定す
る。そして、領域分割部３６は、分割境界設定部３５に
よって設定された分割境界に基づいて、入力画像再生成
部３２で再生成した画像を分割する。

【００８６】次に、上記構成の第３実施形態に係る画像
処理装置３０の全体の動作につき、図１６のフローチャ
ートを用いて説明する。

【００８７】先ず、画像入力部３１から文書画像を入力
し（ステップＳ６１）、次いで入力画像再生成部３２に
おいて入力画像を再生成する処理を実施する（ステップ
Ｓ６２）。次に、前処理部３３で前処理を実施して分割
対象領域を入力画像全面に設定する（ステップＳ６
３）。続いて、文章方向算定部３４で分割対象領域にお
ける文章領域の主体となる文章方向を算出し（ステップ
Ｓ６４）、得られた情報を利用して分割境界設定部３５
で分割境界を設定する（ステップＳ６５）。

【００８８】続いて、図示せぬ制御部により、ステップ
Ｓ６５において分割境界が設定できたかどうかを判定し
（ステップＳ６６）、分割境界を設定できた場合には、
その設定された分割境界に基づいて領域分割部３６で領
域を分割する（ステップＳ６７）。そして、図示せぬ制
御部により、分割後の１つの領域を新たな分割対象領域
として設定し（ステップＳ６８）、しかる後ステップＳ
６４へ移行する。

【００８９】一方、ステップＳ６６においてステップＳ
６５での分割境界の設定が不可能であったと判断した場
合には、さらに分割対象領域とすることのできる領域が
他に存在するか否かを判断する（ステップＳ６９）。こ
こで、他に存在すると判断した場合には、ステップＳ６
８に移行してこの領域を新たな分割対象領域として設定
する。他に分割対象領域となる分割処理後の領域が存在
しない場合には、一連の処理を終了する。

【００９０】上述した画像入力部３１、前処理部３３、
文章方向算定部３４、分割境界設定部３５および領域分
割部３６はそれぞれ、図１に示した画像入力部１１、前
処理部１２、文章方向算定部１３、分割境界設定部１４
および領域分割部１５と内部構成および処理内容が同一
であることから、その処理内容の説明については割愛す
る。そして、ここでは、入力画像再生成部３２の処理内
容について、図１７のフローチャートを用いて説明す
る。

【００９１】先ず、画像入力部３１から入力された画像
に対して、予め設定した画素数ＥＸＰ_H分だけ水平方向
に膨張処理を施す（ステップＳ７１）。画素数ＥＸＰ_H
は、最低でも抽出対象とする最大サイズの濁点を持つ文
字において、これら濁点が文字中核部と融合する程度が
好ましい。

【００９２】続いて、画像入力部３１から入力された画
像に対して、予め設定した画素数ＥＸＰ_V分だけ垂直方
向に膨張処理を施す（ステップＳ７２）。画素数ＥＸＰ
_Vは画素数ＥＸＰ_Hと同様に、最低でも抽出対象とする
最大サイズの濁点を持つ文字において、これら濁点が文
字中核部と融合する程度が好ましい。ＥＸＰ_V＝ＥＸＰ
_Hとしても良い。

【００９３】次に、ステップＳ７１で作成した水平方向
の膨張画像とステップＳ７２で作成した垂直方向の膨張
画像の論理積画像を作成する（ステップＳ７３）。これ
により、文字の濁点を表わす連結成分が文字中核部と統
合され、１連結成分が１文字を表わす確率を高めること
ができる。その結果、文字方向算定部３４において算出
する平均列間隔Ｓ_Hと平均行間隔Ｓ_Vの精度が高くな
る。すなわち、文章が縦書き主体であるか横書き主体で
あるかを算定する際に、平均列間隔Ｓ_Hと平均行間隔Ｓ
_Vを用いていることから、より精度の高い算出が可能と
なる。

【００９４】さらには、分解境界設定部３５において、
文章方向算定部３４で算出する平均列間隔Ｓ_Hと平均行
間隔Ｓ_Vを用いて領域分割の境界を設定しているため、
この領域分割境界が誤って設定される可能性も低くな
る。これにより、最終的に得られる文章領域を、より安
定的に文章の論理構造に沿った形態で抽出することがで
きる。

【００９５】さらにまた、連結成分の画素数や外接矩形
のサイズによってしきい値を設け、このしきい値よりも
小さな画素数や外接矩形のサイズを持つ連結成分をノイ
ズとして除去するような、公知のノイズ成分除去方式を
併用した場合には、上述のような統合作用があるため、
濁点を表わす連結成分がノイズとして誤認識されること
を防ぐことができる。

【００９６】また、連結成分を抽出する際に、前処理部
３３においてラベリング処理を行うが、ラベリング処理
は連結成分が少ないほど処理時間も短くなるため、入力
画像再生成部３２によって再生成された画像を入力画像
として用いることで、連結成分の算出時間を短縮するこ
とができる。

【００９７】上述したように、入力画像を垂直方向に膨
張処理した画像と、入力画像を水平方向に膨張処理した
画像との論理積を求めることで、個々の連結成分が個々
の文字を表わす確率を高められた画像を新たな文書画像
として入力するようにしたことにより、文章が縦書き主
体であるか又は横書き主体であるかを、連結成分の中で
文字として考えられるものの配置から算出する場合に、
例えば、文字の濁点を表わす連結成分が文字中核部と統
合され、１連結成分が１文字を表わす確率が高くなるた
め、より精度の高い文章方向の算出が可能になる。

【００９８】また、結果的に、連結成分の数が削減され
ることになることから、連結成分を抽出する際に一般的
に用いられるラベリング処理を利用する場合には処理時
間を短縮することができるため、処理の高速化と領域分
割精度の向上を図ることが可能となる。

【００９９】

【発明の効果】以上説明したように、本発明によれば、
入力された文書画像に含まれる文章が縦書きであるか又
は横書きであるかを算定し、その算定した結果を参照し
て入力文書画像を分割する境界を設定し、その設定した
境界において入力文書画像を分割するようにしたことに
より、文書構造が未知である文書画像に対しても、文書
の論理構造を考慮して領域分割の境界を設定できるた
め、文書の論理構造に逆らうような不自然な領域の分割
を防ぐことができるとともに、複雑な浮動小数点演算が
少ないので、高速な処理を実現することができる。

【０１００】また、入力された文書画像を構成する画素
の投影分布を算出し、この投影分布を用いて分割領域の
境界を設定する際に、投影分布において所定のしきい値
を設定し、このしきい値に満たない頻度を有する区間幅
を用いて分割境界を設定するようにしたことにより、明
確な空白領域の検出が困難な複雑な文書であっても、文
書の論理構造を考慮したより精度の高い分割境界の設定
が可能となる。

【図面の簡単な説明】

【図１】本発明の第１実施形態に係る画像処理装置の
構成を概略的に示すブロック図である。

【図２】第１実施形態に係る画像処理装置の全体の動
作を説明するフローチャートである。

【図３】第１実施形態の前処理部の処理内容を説明す
るフローチャートである。

【図４】第１実施形態の文章方向算定部の処理内容を
説明するフローチャートである。

【図５】第１実施形態の文章方向算定部で参照される
文字間隔を算定する処理の説明図である。

【図６】第１実施形態の分割境界設定部の処理内容を
説明するフローチャートである。

【図７】第１実施形態の分割境界設定部において投影
分布上の分割境界候補を抽出する処理の説明図である。

【図８】第１実施形態の分割境界設定部において分割
境界候補を抽出する際に注意する必要がある文書画像例
を示す図である。

【図９】第１実施形態の分割境界設定部において投影
分布上の分割境界候補から分割境界を設定する処理の説
明図である。

【図１０】第１実施形態の領域分割部の処理内容を説
明するフローチャートである。

【図１１】第１実施形態の領域分割部において投影分
布上の分割境界から分割に用いる最小頻度点を抽出する
処理の説明図である。

【図１２】第１実施形態の領域分割部において投影分
布上の分割境界における最小頻度点から領域を分割する
処理の説明図である。

【図１３】第１実施形態の分割境界設定部において分
割境界の設定次第で文章領域抽出結果が改善される様子
の説明図である。

【図１４】本発明の第２実施形態に係る画像処理装置
の構成を概略的に示すブロック図である。

【図１５】本発明の第３実施形態に係る画像処理装置
の構成を概略的に示すブロック図である。

【図１６】第３実施形態に係る画像処理装置の全体の
動作を説明するフローチャートである。

【図１７】第３実施形態の入力画像再生成部の処理内
容を説明するフローチャートである。

【符号の説明】

１１，２１，３１…画像入力部、１２，２２，３２…前
処理部、１３，３４…文章方向算定部、１４，２４，３
５…分割境界設定部、１５，２５，３６…領域分割部、
２３…投影分布算出部、３２…入力画像再生成部

Claims

【特許請求の範囲】

【請求項１】入力された文書画像に含まれる文章が縦
書きであるか又は横書きであるかを算定し、その算定した結果を参照して前記文書画像を分割する境
界を設定し、その設定した境界において前記文書画像を分割すること
を特徴とする画像処理方法。
【請求項２】前記文書画像を横書き文章方向に膨張処
理した画像と、前記文書画像を縦書き文章方向に膨張処
理した画像との論理積を求め、この論理積画像を新たな
文書画像として入力することを特徴とする請求項１記載
の画像処理方法。
【請求項３】前記境界の設定に際しては、前記文書画
像を構成する画素の横書き文章方向および縦書き文章方
向における投影分布を算出し、この算出した投影分布を
用いて前記境界を設定することを特徴とする請求項１又
は２記載の画像処理方法。
【請求項４】前記算定の結果において、前記文書画像
に含まれ文章が縦書き主体である場合には、縦書き文章
方向に境界を設定する確率を高め、横書き主体である場
合には、横書き文章方向に境界を設定する確率を高める
ことを特徴とする請求項１，２又は３記載の画像処理方
法。
【請求項５】前記文書画像に含まれる文章が縦書き主
体であるか又は横書き主体であるかを、前記文書画像の
連結成分の中で文字と考えられるものの配置情報から算
出することを特徴とする請求項１，２又は３記載の画像
処理方法。
【請求項６】入力された文書画像を構成する画素の投
影分布を算出し、その算出した投影分布において、所定のしきい値に満た
ない頻度を有する区間幅を用いて前記文書画像を分割す
る境界を設定し、その設定した境界において前記文書画像を分割すること
を特徴とする画像処理方法。
【請求項７】前記文書画像を分割する境界を、前記区
間幅が最も広いところで設定することを特徴とする請求
項６記載の画像処理方法。
【請求項８】前記文書画像を分割する境界を、前記区
間幅が所定のしきい値以上で、かつ最も頻度が小さいと
ころで設定することを特徴とする請求項６又は７記載の
画像処理方法。
【請求項９】前記文書画像を分割する境界を、前記区
間幅が所定のしきい値以上で、かつ最も頻度が小さい区
間のうちの最も区間幅が広いところで設定することを特
徴とする請求項６又は７記載の画像処理方法。
【請求項１０】入力された文書画像に含まれる文章が
縦書きであるか又は横書きであるかを算定する算定手段
と、前記算定手段による算定結果を参照して前記文書画像を
分割する境界を設定する境界設定手段と、前記境界設定手段によって設定された境界において前記
文書画像を分割する分割手段とを備えることを特徴とす
る画像処理装置。
【請求項１１】前記文書画像を横書き文章方向に膨張
処理した画像と、前記文書画像を縦書き文章方向に膨張
処理した画像との論理積を求め、この論理積画像を新た
な文書画像として入力する入力画像再生成手段をさらに
備えることを特徴とする請求項１０記載の画像処理装
置。
【請求項１２】前記境界設定手段は、前記文書画像を
構成する画素の横書き文章方向および縦書き文章方向に
おける投影分布を算出する投影分布算出手段を有し、こ
の投影分布算出手段によって算出された投影分布を用い
て前記境界を設定することを特徴とする請求項１０又は
１１記載の画像処理装置。
【請求項１３】前記境界設定手段は、前記算定手段に
よって前記文書画像に含まれ文章が縦書き主体であると
判定された場合には、縦書き文章方向に境界を設定する
確率を高め、横書き主体であると判定された場合には、
横書き文章方向に境界を設定する確率を高めることを特
徴とする請求項１０，１１又は１２記載の画像処理装
置。
【請求項１４】前記算定手段は、前記文書画像に含ま
れる文章が縦書き主体であるか又は横書き主体であるか
を、前記文書画像の連結成分の中で文字と考えられるも
のの配置情報から算出することを特徴とする請求項１
０，１１又は１２記載の画像処理装置。
【請求項１５】入力された文書画像を構成する画素の
投影分布を算出する投影分布算出手段と、前記投影分布算出手段によって算出された投影分布にお
いて、所定のしきい値に満たない頻度を有する区間幅を
用いて前記文書画像を分割する境界を設定する境界設定
手段と、前記境界設定手段によって設定された境界において前記
文書画像を分割する分割手段とを備えることを特徴とす
る画像処理装置。
【請求項１６】前記境界設定手段は、前記区間幅が最
も広いところで前記文書画像を分割する境界を設定する
ことを特徴とする請求項１５記載の画像処理装置。
【請求項１７】前記境界設定手段は、前記区間幅が所
定のしきい値以上で、かつ最も頻度が小さいところで前
記文書画像を分割する境界を設定することを特徴とする
請求項１５又は１６記載の画像処理装置。
【請求項１８】前記境界設定手段は、前記区間幅が所
定のしきい値以上で、かつ最も頻度が小さい区間のうち
の最も区間幅が広いところで前記文書画像を分割する境
界を設定することを特徴とする請求項１５又は１６記載
の画像処理装置。
【請求項１９】前記文書画像に含まれる文章が縦書き
主体であるか又は横書き主体であるかを算定する算定手
段をさらに備え、前記境界設定手段は、前記算定手段による算定結果を参
照し、かつ前記投影分布算出手段によって算出された投
影分布を用いて前記文書画像を分割する境界を設定する
ことを特徴とする請求項１５又は１６記載の画像処理装
置。
【請求項２０】前記投影分布算出手段は、前記文書画
像を構成する画素の横書き文章方向および縦書き文章方
向における投影分布を算出することを特徴とする請求項
１９記載の画像処理装置。