JPH08115380A

JPH08115380A - 画像処理装置及び方法

Info

Publication number: JPH08115380A
Application number: JP6252115A
Authority: JP
Inventors: Kazuyuki Saito; 和之齋藤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1994-10-18
Filing date: 1994-10-18
Publication date: 1996-05-07
Anticipated expiration: 2018-05-19
Also published as: JP3406942B2

Abstract

(57)【要約】【目的】文字のみではなく、それに図や写真等が混在
していても、文字領域をより確実に認識する。【構成】入力部１０１より入力した画像データ中の黒
画素の連続する領域を領域抽出部１０５で抽出する。そ
して、各領域のサイズ、画素数に応じて個々の領域の属
性を判定する。そして、文字領域と判定された場合に
は、その文字領域に近接する領域を合併する。こうして
合併した文字領域に非文字領域が重複するしていると判
断した場合には、文字領域の状態情報と非文字領域の状
態情報に従って、その文字良識の真意を属性再判別部１
０６で再度判別する。そして、各領域の判定結果とその
画像を出力部１０４を介して下位の装置に出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は画像処理装置及び方法、
詳しくは入力画像の像域分離を行う画像処理装置及び方
法に関するものである。

【０００２】

【従来の技術】一般に、ＯＣＲ（光学的文字認識）装
置、複写機、ファクシミリ等の電子装置において、入力
される画像を認識するには、その入力画像が認識対象と
なる文字のみで構成されることを前提としている。

【０００３】従来の画像処理装置においては領域分割手
段として、スペクトル分析方式の様に入力画像のフーリ
ェスペクトルを分析し各種領域に分割する方式を用いた
ものや、特開昭６４−４５８８９号公報の様に垂直及び
水平方向の射影を交互に繰り返して取り周辺分布の情報
から領域を分割していく方式を用いたものなどがある。

【０００４】

【発明が解決しようとする課題】しかしながら、上述の
従来技術では、図や写真等の領域内に文字があった場合
にそれが図として誤って判別されたり、逆に図や写真の
一部であるのに文字として判別されたりするという問題
点があった。

【０００５】さらには、図や写真等の領域内に文字があ
った場合に、文字領域矩形内に図や写真等の実画素が混
入するといった問題点があった。

【０００６】

【課題を解決するための手段】及び

【作用】本発明は上記従来技術に鑑みなされたものであ
り、文字のみではなく、それに図や写真等が混在してい
ても、文字領域をより確実に認識することを可能ならし
める画像処理装置及び方法を提供しようとするものであ
る。

【０００７】この課題解決するため、例えば本発明の画
像処理装置は以下の構成を備える。すなわち、入力され
た画像中の像の種類を矩形領域として判定する画像処理
装置において、有意な画素の連続する領域と当該領域の
状態情報を抽出する抽出手段と、抽出された領域の状態
情報に応じて、少なくとも各領域の種別を予測する予測
手段と、該予測手段で予測された各領域のうち、近接す
る予測文字領域どうしを合併する合併手段と、合併され
た予測文字領域が予測非文字領域と重複する場合、当該
予測文字領域の状態情報と前記予測非文字領域の状態情
報に基づいて、当該予測文字領域の真偽を判定する判定
手段とを備える。

【０００８】また、本発明の好適な実施態様に従えば、
前記抽出手段が抽出する状態情報は、各矩形領域固有の
ＩＤ番号、位置及びサイズ、画素数、領域の属性情報を
含み、前記合併手段で合併した際には、組方向、行数の
情報が追加されることが望ましい。これによって、予測
手段の予測の信頼性を高めるためのパラメータを得るこ
とが可能になる。

【０００９】また、前記判定手段は、重複する予測非文
字領域の大きさ、予測文字領域の行数、及び予測文字領
域が予測非文字領域に内包されるか、その一部が重なっ
ているかに応じて、判定することが望ましい。

【００１０】また、更に、入力画像を縮小する縮小手段
を備え、前記抽出手段は当該縮小手段による縮小結果の
画像に対して付勢することが望ましい。この結果、処理
する画素数が少なくなるので、処理速度を大幅にあげる
ことが可能になるる。

【００１１】また、前記縮小手段は、入力画像中のｍ×
ｎ画素領域内の各画素の値を論理和する論理演算手段を
含み、当該論理演算結果を１画素の値として出力するこ
とが望ましい。この結果、入力画像の文字或いは文字を
構成している線分が連続し、文字の行単位の矩形領域が
抽出されることになる。

【００１２】また、前記論理演算手段におけるｍ、ｎ
は、入力画像の解像度に応じて変化させることが望まし
い。これによって、入力画像の解像度に関らず精度良
く、かつ高速に処理することが可能になる。

【００１３】また、更に、前記判定手段によって文字領
域であることが判明した領域内に図形等の実画像が混入
しているか否かを判別する実画素混入判定手段と、図形
等の実画素が混入していたと判明した文字矩形領域を行
に分割する文字行分割手段とを備えることが望ましい。
この結果、分割した文字矩形領域には図形等の他の属性
の画像の混在を避けることが可能になる。

【００１４】

【実施例】以下、添付図面に従って本発明に係る実姉例
を詳細に説明する。

【００１５】図１は、本実施例の画像処理装置を表すブ
ロック図である。

【００１６】同図において、１０１は画像データの入力
部であり、例えばイメージスキャナである。但し、入力
部１０１からは画像が入力されればよいので、ファクシ
ミリ受信機（復号器を含む）や、画像データを記憶して
いる記憶媒体の駆動装置であっても良いのは勿論であ
る。

【００１７】１０２は装置の制御や各部処理の演算を行
う演算処理部（ＣＰＵ）、１０３は制御プログラムや、
各種データを記憶しておく記憶部である。尚、この記憶
部１０３には、読み取り画像を記憶するだけの容量を持
ったＲＡＭが含まれる。１０４は演算処理結果や画像処
理結果、及び画像データを出力する出力部、１０５は本
文やセパレータや表、図形等を抽出する領域抽出部、１
０６は図形等の矩形領域に重複している文字矩形領域を
検出し、真に文字矩形領域か否かを再度判別する属性再
判別部である。

【００１８】図２は、本実施例の画像処理装置における
画像処理手順（記憶部１０３にプログラムとして記憶さ
れている）を示すフローチャートである。以下、同フロ
ーチャートに従って説明する。

【００１９】＜ステップＳ２０１＞画像入力部１０１か
ら元画像を入力し、記憶部１０３に記憶する。

【００２０】＜ステップＳ２０２＞入力画像に対し解像
度が閾値Ｒｄｐｉ以上であれば、縦ｍドット、横ｎドッ
トの論理和をとって新たにｍ×ｎ画素を１画素に縮小
し、解像度が閾値Ｒｄｐｉ未満であれば縦ｐドット、横
ｑドットの論理和をとって新たにｐ×ｑ画素を１画素に
縮小する。

【００２１】ここで、入力画像のｍ×ｎ画像またはｐ×
ｑ画像中に１ドットでも黒画素が有れば縮小画像は黒と
なる。

【００２２】次に、読み取った画像に対して１ラインず
つスキャンし、黒画素をサーチする。そして、黒画素が
発見されると、その画素にラベルを付加する。このと
き、上下・左右・斜めで連続している画素には同一ラベ
ルを付け、同時に矩形をかたどっていく。但し、実施例
では、処理を簡略化するため、従前に処理を行ったライ
ンと注目ラインとの間でラベル付け処理を行う（後続す
るラインは処理対象としない）。

【００２３】図４を例に取ると、最初に検出される黒画
素Ａ（以下、単に画素）には矩形ラベル“１”が付けら
れる。そして、図５に示すような矩形データを記憶部１
０３に作成する。矩形データは、まず、画素Ａの座標
（Ｘａ，Ｙａ）を矩形の始点と終点とし、画素数を
“１”、画素Ａと同じラベル“１”を付加して矩形デー
タ（とする。

【００２４】以上の処理が完了すると、着目画素を右方
向に移動し、画素Ｂを検出することになる。この画素Ｂ
は連続していない（１行目であるのでもちろん上からも
連続画素はない）ので、ラベル“２”が付けられ、この
画素Ｂの座標（Ｘｂ，Ｙｂ）を矩形の始点と終点とし、
画素数を“１”、矩形を区別するための矩形ラベルに画
素と同じラベル“２”を付加して記憶部１０３に矩形デ
ータ（図５（Ａ）参照）を作成する。つまり、この時点
では画素Ａ、Ｂとは互いに独立しているものとして扱わ
れる。

【００２５】さて、以上の様にして１行目（１ライン
目）のラベリングが終了したら２行目に移る。

【００２６】２行目の最初に検出された画素Ｃはラベル
“１”の画素Ａと上から連続しているので画素ラベル
“１”を付加し、矩形ラベル“１”の矩形データに対し
画素数“１”を加算して計２画素とする。矩形ラベルは
変わらず“１”のままである。そして、矩形座標は終点
のみを（Ｘａ，Ｙａ）から（Ｘａ，Ｙｃ）へと更新する
（始点の座標は変わらない）。

【００２７】尚、説明が前後するが、矩形の始点とはそ
の左上隅を、矩形の終点とはその右下隅の座標を言う。

【００２８】さて、次に、画素Ｄを着目するが、この画
素Ｄは画素Ｃに隣接すると共に、画素Ｂにも斜めに連続
している。従って、画素Ｄは勿論、画素Ｂのラベルを
“１”へと変更し、矩形ラベル“１”の画素数を計４個
に更新する。また、画素Ａ〜Ｄが１つの矩形ラベルを表
わしているので、その始点座標は（Ｘａ，Ｙａ）、終点
座標は（Ｘｂ，Ｙｄ）へと更新する。

【００２９】尚、矩形ラベル“２”の矩形データについ
ては矩形ラベル“０”として無効とする（矩形ラベル
“２”を新たに使用することを許可する）。

【００３０】以上の様にして２行目が終了したら３行目
に移る。

【００３１】３行目の最初の画素Ｅは画素Ｃと斜めに連
続している。従ってこの画素Ｅに画素ラベル“１”に付
加し、矩形ラベル“１”の矩形データに対し画素数を１
加算させ、計５画素とする。矩形ラベルは変わらず
“１”のままで、矩形ラベル１の始点座標を（Ｘａ，Ｙ
ａ）から（Ｘｅ，Ｙａ）へ、終点座標を（Ｘｂ，Ｙｄ）
から（Ｘｂ，Ｙｅ）へと更新する。

【００３２】以下同様にして全縮小画像中の画素に対
し、ラベリングと矩形のかたどりを行う。

【００３３】この結果、縮小画像中の画素が連続する領
域について、それぞれ矩形データを得ることになる。次
に、ラベリングと矩形のかたどりの後、本文に該当する
矩形、図形または写真、表等に該当する矩形、セパレー
タに該当する矩形等を、矩形の幅Ｗ、高さＨ、面積Ｓ、
面積に対する画素の数すなわち画素密度Ｄ（これらは矩
形データを用いて計算する事により容易に求まる、つま
り、画素数／面積である）を用いて区別する。そして、
区別結果は、図５（Ｂ）に示す属性値を各矩形データの
“属性”項目に与えることで行われる。

【００３４】この属性を決定する原理及び処理内容を図
６のフローチャート及び図７を用いて説明する。

【００３５】セパレータは、幅Ｗが閾値Ｔｗ１以下でか
つ高さＨが幅Ｗの閾値Ｔｗ２倍以上（Ｓ６０３）、もし
くは幅Ｗが閾値Ｔｗ１より大きくかつ高さＨが幅Ｗの閾
値Ｔｗ３倍以上（Ｓ６０４）である場合とする。この場
合、注目矩形データの属性には、縦長セパレータとして
属性「−３」として統一し（Ｓ６１４）、矩形を構成す
る画素ラベルは属性とは別にそのまま保持しておく。

【００３６】また幅と高さを入れ替えたものも上記と同
様にして（Ｓ６０５，Ｓ６０６）、縦長セパレータとし
て注目矩形データの属性を「−３」にする。

【００３７】次に図７に示す様に、画素密度Ｄが閾値Ｔ
ｄ１以下の時（Ｓ６０７）、カギ型などの変形セパレー
タと見なして属性を「−３」にする（Ｓ６１４）。

【００３８】つまり、セパレータは、一般に本文や他の
情報を区切り線であるので、その長さはあるものの、そ
の幅は小さいという特性がある。上記判別は、これを利
用していることになる。

【００３９】また、面積Ｓが閾値Ｔｓ１より大きい場合
で（Ｓ６０８）、画素密度Ｄが閾値Ｔｄ２未満（Ｓ６０
９）ならば表と見なして属性を「−４」にし（Ｓ６１
５）、画素密度Ｄが閾値Ｔｄ２以上ならば図形または写
真とみなして属性を「−５」にする（Ｓ６１６）。

【００４０】すなわち、表等は一般に罫線で構成される
わけであるから、その面積に対する画素密度は低く、図
形や写真等は画素密度は罫線より高いという特徴を利用
していることになる。

【００４１】また、面積Ｓが閾値Ｔｓ１以下でかつ閾値
Ｔｓ２以上の場合であって（Ｓ６１０）、画素密度Ｄが
閾値Ｔｄ３以上（Ｓ６１１）の矩形や、幅Ｗ及び高さＨ
が共に閾値Ｔｗ４以上でかつ画素密度ＤがＴｄ５以上の
時（Ｓ６１３）の矩形も図形または写真とみなして属性
を「−５」にする。

【００４２】更に、面積Ｓが閾値Ｔｓ１以下でかつ閾値
Ｔｗ２以上の場合であって（Ｓ６１０）、画素密度Ｄが
閾値Ｔｄ４未満（Ｓ６１２）の矩形を表とみなし属性を
「−４」にする（Ｓ６１５）。

【００４３】以上の様にして、図形または写真、表等に
該当する矩形、セパレータに該当する矩形等を検出し、
残った矩形を本文として属性は初期値のままにしておく
（Ｓ６１７）。

【００４４】次に、横書き文章の場合、本文として残っ
た矩形は横方向に縮小画素が連続して横長の矩形になり
やすく、縦書き文章であれば、本文として残った矩形は
縦長になりやすい。理由は、先に説明したように、ｍ×
ｎの画素ブロック中の各画素を論理和して１個の縮小画
素を形成するためであり、文章としての文字の流れに沿
った文字間が、その行間より狭いために画像縮小処理を
行うと隣接する文字が接続状態になるからである。

【００４５】そこで本文の矩形の幅Ｗと高さＨの平均値
を算出し、平均幅ｗが平均高さｈより大きい場合は横書
きの多い章と見なし、平均高さｈを１文字の文字サイズ
とする。逆に平均高さｈが平均幅ｗより大きい場合は縦
書きの多い文章と見なし、平均幅ｗを１文字の文字サイ
ズとする。

【００４６】次に、何の関連もなくばらばらに存在した
ままの本文に該当する矩形を合併する。

【００４７】図８を例に説明する。今、本文であると判
定された矩形Ａ１と矩形Ｂとの合併を考える。矩形Ａ１
に対してＸ方向に対してＰｘ，Ｙ方向に対してＰｙだけ
拡張した仮想矩形Ａ１′を考え、Ａ１′に対してその周
囲に接触或は内包する、本文であると判定された矩形が
あるかサーチし、矩形Ｂの様に接触していれば矩形Ａ１
と矩形Ｂを合併して新しく合併矩形Ａ２を作成し、矩形
Ａ１の矩形データを更新する。この結果、矩形Ｂのデー
タは不要になるので無効とする。ただし、この時Ｐｘ，
Ｐｙは文字サイズ等から求めた値である。

【００４８】この様にして、本文矩形どうしを段落ごと
に分割された状態まで合併していく（図９）と同時に、
矩形データの組方向に、それが横書きであれば０、縦書
きであれば１として記憶してゆく。

【００４９】次に、段階にわけられた本文矩形ごとに行
数を計数し、矩形データに記憶する。

【００５０】図１０を例に示すと、あらかじめ上記の様
に段落ごとに組方向が検出されており、この例の場合横
書きということが判明しているので、Ｙ軸方向に矩形の
ヒストグラムを取り（画素の頻度）、Ｙ軸方向の谷（行
間に相当する）の数に１を加算した数を行数とみなす。
図示の場合、谷の和は“６”になるので、その数に１を
加算した数“７”が行数として計算され、矩形データの
“行数”の項目に記憶される。

【００５１】＜ステップＳ２０３＞次に、属性再判別部
１０６の処理を図１１、図１２を用い、その手順を図１
３のフローチャートに従って説明する。

【００５２】図１１の例では、文字矩形領域（１１０
２）の場合は、ステップＳ１３０１、１３０２で矩形領
域同士が重複しているものの図形矩形領域（１１０１）
からはみ出していると判明するので、ステップＳ１３０
３で文字矩形領域（１１０２）内の行数が閾値Ｌ１と比
較される。この例の場合、７行である事があらかじめ領
域抽出手段によって判明しているので（矩形データ内に
記憶されているので）ステップＳ１３０９で文字矩形領
域として再度判別される事になる。

【００５３】また図１２の例では、本来は図形矩形領域
であるはずの領域が文字矩形領域（１２０２）として抽
出されており、ステップＳ１３０２でその文字矩形領域
（１２０２）は図形矩形領域（１２０１）に完全に内包
しているとして判定される。そこでステップＳ１３０７
に進み、図形矩形領域（１２０１）の面積が閾値Ｓ１と
比較される。

【００５４】この例の場合、図形矩形領域（１２０１）
の面積はあらかじめ領域抽出手段によって判明し、矩形
データ内に記憶されており、もし図形矩形領域（１２０
１）の面積が閾値Ｓ１以下であれば文字であると仮判定
されている矩形領域（１２０２）はステップＳ１３１０
において図形矩形領域として再度判別され、矩形データ
内に記憶されていた属性データを図形に変更される事に
なる。

【００５５】この理由は、図形領域が小さい場合、その
小さい図形の矩形領域内に実際に文字が存在するという
ことはないからである。

【００５６】また、図形矩形領域（１２０１）の面積が
閾値Ｓ１より大であれば、その図形の一部に対しての説
明文等のある可能性も出てくる。従って、文字矩形領域
（１２０２）はステップＳ１３０８において文字矩形領
域（１２０２）内の行数が所定の閾値Ｌ１（例えばＬ１
＝２）と比較される。行数はあらかじめ領域抽出手段に
よって判明し、矩形データ内に記憶されているので、条
件を満たせない場合、文字矩形領域（１２０２）はステ
ップＳ１３１０において図形矩形領域として再度判別さ
れ、矩形データ内に記憶されていた属性データが図形に
変更される事になる。

【００５７】＜ステップＳ２０４＞最後に、以上の様に
して求めた各種領域の矩形データを画像データと共に出
力部１０４から出力する。

【００５８】但し、この際、出力先の装置には、原画像
（縮小するまえの画像）を出力する。また、当然のこと
ながら、出力する矩形データの各座標値やサイズ等は、
原画像に対応した情報にする。

【００５９】また、上記実施例では、入力画像の解像度
に応じて縮小する対象の画素ブロックサイズを２段階に
変化させたが、３段階或いはそれ以上であっても良い。
つまり、解像度に応じで縮小する画素の占める面積割合
の変化を小さくする。

【００６０】また、上記の如く、本文を縮小した再、最
低でも、行と行の間の空白部分（上記例では谷の部分）
は残ることが望ましいから、縮小対象となる画素ブロッ
クのサイズは任意に設定できた方が良い。これによっ
て、行間の異なる原稿画像に対してもケースに応じて正
しく認識することが可能になる。

【００６１】

【他の実施例】他の実施例を説明する。

【００６２】１：再判別手段の後、まず実画素混入判定
手段を挿入することによって、図形等の実画素が混入し
ているか否かを判別し、次に文字行分割手段を挿入する
事によって、図形等の実画素が混入していたと判明した
文字矩形領域を行に分割する。

【００６３】図１４に例を示すと、符号１４０２の矩形
は段落にまとまった文字矩形領域（１４０１）と重複し
ており、図１５（Ｂ）の矩形データ１４０４から図形の
画素ラベルにｎが付けられている事がわかる。次に文字
の矩形領域１４０１内の実画素を順次探索し、各実画素
の画素ラベルがｎであるものの有無を検査すること（図
１６の符号１４０５参照）で、図形の実画素が文字の矩
形領域内に混入しているか否かが判定できる。

【００６４】つぎに、もし図形の実画素が文字の矩形領
域内に混入している場合、図１５に例を示すように、実
画素が入っている文字の矩形領域の射影（黒画素の有無
のみをとる）を用いて、周辺分布の形状から各行矩形の
座標を検出する。この時、文字の実画素の画素ラベルと
図の実画素の画素ラベルは異なるので、文字の画素のみ
から容易に射影をとることができる。

【００６５】この例の場合、矩形データから組方向が横
書きであることが分かっているので、横方向に射影をと
り、各行の存在するＹ座標を定める（図１７の符号１５
０１）。次に各行の文字画素の縦方向への射影をとりＸ
座標を定め（符号１５０２）、各行ごとの矩形データを
作成し座標等を記憶させる。

【００６６】上記の様に、行に分割する事によって、Ｏ
ＣＲ等の認識処理の際に文字矩形領域内の図形の実画素
を認識対象から外し、認識率等の向上をはかれる。

【００６７】尚、上記処理手順は、図３に示すフローチ
ャートによって示されるのは容易に想到できよう。

【００６８】２：上記実画素混入判定手段において、文
字矩形領域の概説矩形の１画素分外側の画素を追跡し、
画素の有無を調査する事でも、文字以外の画素の文字矩
形領域への混入を知ることができ、処理時間の短縮もは
かれる。

【００６９】３：文字行分割手段において、あらかじめ
領域抽出手段で行数を計数する際に行矩形の座標を検出
しておければ、実画素混入判定手段の後、もし図形の実
画素が文字の矩形領域内に混入している場合、矩形デー
タの作成のみの処理となり、処理時間の短縮がはかれ
る。

【００７０】４：領域抽出手段において、図１８に例を
示すように、段落ごとにＸ軸方向、Ｙ軸方向それぞれに
矩形のヒストグラムを取り、周辺分布の形状から、Ｘ軸
方向では、周辺分布の高さｈ１よりも幅ｗ１のほうが長
く、Ｙ軸方向では周辺分布の高さｈ２のほうが幅ｗ２よ
りも長いので、Ｙ軸方向の谷の数に１を加算した数を行
数とみなし、再度組方向を横書きであると検出すること
によって、組方向があらかじめ判明していない場合で
も、行数の計数および組方向検出が同時に可能となり、
あらかじめ判明していた場合には、組方向検出の正確度
を向上させることが可能である。

【００７１】以上説明した様に本実施例によれば、画像
入力手段と領域抽出手段と属性再判別手段を用いて、入
力画像に対し、複数の属性に分類して矩形領域等を抽出
し、本文に該当する矩形領域のうち図形または写真に該
当する矩形領域に重複するか否かを判別して、図形また
は写真の矩形領域に重複していると検出された文字矩形
領域が真に文字矩形領域か否かを再度判別する事によっ
て、画像処理全体の処理時間の大幅な増加や、既存のプ
ログラムの大幅な変更なしに、図や写真等の領域内の
文字領域の判別精度の向上、図や写真の一部を文字と
する誤判定の減少等がはかれる効果がある。

【００７２】また、さらに前記属性再判別手段によって
再度真の文字矩形領域であることが判明した矩形領域に
対して、実画素混入判定手段と文字行分割手段を用い
て、図形等の実画素が混入しているか否かを判別し、図
形等の実画素が混入していたと判明した文字矩形領域を
行に分割する事によって、画像処理全体の処理時間の大
幅な増加や、既存のプログラムの大幅な変更なしに、
文字領域矩形内に図や写真等の実画素が混入する事を防
ぐ効果がある。

【００７３】尚、本発明は、複数の機器から構成される
システムに適用しても、１つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることは言うまでもない。

【００７４】

【発明の効果】以上説明したように本発明によれば、文
字のみではなく、それに図や写真等が混在していても、
文字領域をより確実に認識することが可能になる。

【００７５】

【図面の簡単な説明】

【図１】本発明の実施例の画像処理装置の概略構成を示
すブロック図である。

【図２】本実施例の画像処理装置における画像処理を示
すフローチャートである。

【図３】他の実施例画像処理装置における画像処理を示
すフローチャートである。

【図４】本実施例の領域抽出部のラベリング処理の例を
示す図である。

【図５】本実施例の矩形データ構造および属性の種類を
示す図である。

【図６】本実施例の領域抽出の属性分類処理を示すフロ
ーチャートである。

【図７】本実施例の矩形（領域）の属性の密度Ｄと面積
Ｓでの切り分けを示す図である。

【図８】本実施例の領域抽出部の矩形の合併処理を示す
図である。

【図９】本実施例の領域抽出部の本文矩形同士を段落ご
とに分割された状態まで合併処理を行った例を示す図で
ある。

【図１０】本実施例の領域抽出部の本文矩形ごとに行数
を計数する処理の例を示す図である。

【図１１】他の実施例の属性再判別部の属性再判別処理
の例を示す図である。

【図１２】他の実施例の属性再判別部の属性再判別処理
の例を示す図である。

【図１３】他の実施例の属性再判別部の属性再判別処理
を示すフローチャートである。

【図１４】他の実施例の実画素混入判定部の実画素混入
判定処理の例を示す図である。

【図１５】図１４における各領域の矩形データの内容を
示す図である。

【図１６】実画素混入部の処理の原理を示す図である。

【図１７】他の実施例の文字行分割部の文字行分割処理
の例を示す図である。

【図１８】他の実施例の領域抽出部の本文矩形ごとに行
数を計数する処理の例を示す図である。

【符号の説明】

１０１入力部１０２演算処理部（ＣＰＵ）１０３記憶部１０４出力部１０５領域抽出部１０６属性再判別部

Claims

【特許請求の範囲】

【請求項１】入力された画像中の像の種類を矩形領域
として判定する画像処理装置において、有意な画素の連続する領域と当該領域の状態情報を抽出
する抽出手段と、抽出された領域の状態情報に応じて、少なくとも各領域
の種別を予測する予測手段と、該予測手段で予測された各領域のうち、近接する予測文
字領域どうしを合併する合併手段と、合併された予測文字領域が予測非文字領域と重複する場
合、当該予測文字領域の状態情報と前記予測非文字領域
の状態情報に基づいて、当該予測文字領域の真偽を判定
する判定手段とを備えることを特徴とする画像処理装
置。
【請求項２】前記抽出手段が抽出する状態情報は、各
矩形領域固有のＩＤ番号、位置及びサイズ、画素数、領
域の属性情報を含み、前記合併手段で合併した際には、
組方向、行数の情報が追加されることを特徴とする請求
項第１項に記載の画像処理装置。
【請求項３】前記判定手段は、重複する予測非文字領
域の大きさ、予測文字領域の行数、及び予測文字領域が
予測非文字領域に内包されるか、その一部が重なってい
るかに応じて、判定することを特徴とする請求項第２項
に記載の画像処理装置。
【請求項４】更に、入力画像を縮小する縮小手段を備
え、前記抽出手段は当該縮小手段による縮小結果の画像
に対して付勢することを特徴とする請求項第１項に記載
の画像処理装置。
【請求項５】前記縮小手段は、入力画像中のｍ×ｎ画
素領域内の各画素の値を論理和する論理演算手段を含
み、当該論理演算結果を１画素の値として出力すること
を特徴とする請求項第４項に記載の画像処理装置。
【請求項６】前記論理演算手段におけるｍ、ｎは、入
力画像の解像度に応じて変化させることを特徴とする請
求項第５項に記載の画像処理装置。
【請求項７】更に、前記判定手段によって文字領域で
あることが判明した領域内に図形等の実画像が混入して
いるか否かを判別する実画素混入判定手段と、図形等の実画素が混入していたと判明した文字矩形領域
を行に分割する文字行分割手段とを備えることを特徴と
する請求項第１項に記載の画像処理装置。
【請求項８】入力された画像中の像の種類を矩形領域
として判定する画像処理方法において、有意な画素の連続する領域と当該領域の状態情報を抽出
する抽出工程と、抽出された領域の状態情報に応じて、少なくとも各領域
の種別を予測する予測工程と、該予測工程で予測された各領域のうち、近接する予測文
字領域どうしを合併する合併工程と、合併された予測文字領域が予測非文字領域と重複する場
合、当該予測文字領域の状態情報と前記予測非文字領域
の状態情報に基づいて、当該予測文字領域の真偽を判定
する判定工程とを備えることを特徴とする画像処理方
法。
【請求項９】前記抽出工程が抽出する状態情報は、各
矩形領域固有のＩＤ番号、位置及びサイズ、画素数、領
域の属性情報を含み、前記合併工程で合併した際には、
組方向、行数の情報が追加されることを特徴とする請求
項第８項に記載の画像処理方法。
【請求項１０】前記判定工程は、重複する予測非文字
領域の大きさ、予測文字領域の行数、及び予測文字領域
が予測非文字領域に内包されるか、その一部が重なって
いるかに応じて、判定することを特徴とする請求項第９
項に記載の画像処理方法。
【請求項１１】更に、入力画像を縮小する縮小工程を
備え、前記抽出工程は当該縮小工程による縮小結果の画
像に対して付勢することを特徴とする請求項第８項に記
載の画像処理方法。
【請求項１２】前記縮小工程は、入力画像中のｍ×ｎ
画素領域内の各画素の値を論理和する論理演算工程を含
み、当該論理演算結果を１画素の値として出力すること
を特徴とする請求項第１１項に記載の画像処理方法。
【請求項１３】前記論理演算工程におけるｍ、ｎは、
入力画像の解像度に応じて変化させることを特徴とする
請求項第１２項に記載の画像処理方法。
【請求項１４】更に、前記判定工程によって文字領域
であることが判明した領域内に図形等の実画像が混入し
ているか否かを判別する実画素混入判定工程と、図形等の実画素が混入していたと判明した文字矩形領域
を行に分割する文字行分割工程とを備えることを特徴と
する請求項第８項に記載の画像処理方法。