JP3666903B2

JP3666903B2 - 画像処理方法および装置

Info

Publication number: JP3666903B2
Application number: JP16090194A
Authority: JP
Inventors: 和之齋藤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1994-07-13
Filing date: 1994-07-13
Publication date: 2005-06-29
Anticipated expiration: 2020-06-29
Also published as: JPH0830788A

Description

【０００１】
【産業上の利用分野】
本発明は、ＯＣＲ（光学的文字認識）装置、複写機、ファクシミリ等において、入力画像を文字、図形、表等の領域に分割する画像処理方法及び装置に関するものである。
【０００２】
【従来の技術】
入力画像を文字、図形、写真、表等の領域に分割し、夫々の領域毎に画像の種類に応じた処理を行うことを可能とする画像処理装置がある。このような画像処理装置によれば、例えば文字と写真が混在したような画像において、文字の領域についてはＯＣＲによって文字コード化し、写真の領域については画像用の圧縮を行う等、各領域の画像の種別に適した処理を行うことができる。
【０００３】
この種の画像処理装置における入力画像の領域分割手法において、点線や破線の抽出方法としては、
▲１▼ 破線らしい図形を発見してその延長上に次の破線を探索する方法、
▲２▼ 短線分の角度と距離を利用して抽出する方法、
▲３▼ 画素の集まりが孤立しているものをグループ化し最初と最後を結んだ直線と各グループ要素の距離及びグループの高さから抽出する方法
等が挙げられる。
【０００４】
【発明が解決しようとする課題】
しかしながら、上述の従来技術では、演算処理に多大な時間を費やし、かつ点線に対する抽出精度が低くまた図１１の１００１や１００２に示すような特殊な破線の場合は検出ができないという問題があった。このため、入力画像を画像の種別によって領域分割し、文字認識等を行う場合、破線や点線の領域について文字認識処理を行ってしまう可能性があり、効率的な文字認識や正しい文字認識ができなくなるという問題がある。
【０００５】
本発明は上記の問題点に鑑みてなされたものであり、破線や点線等によるセパレータの矩形領域をより確実に抽出することを可能とする画像処理方法及び装置を提供することを目的とする。
【０００６】
又、本発明の他の目的は、画像領域の分割に先立って、処理対象となる画像を縮小することにより、処理速度の向上、メモリ消費量の低減を図る画像処理方法及び装置を提供することにある。
【０００７】
又、本発明の他の目的は、画像領域の分割に先立って、処理対象となる画像が多値画像である場合には当該画像を２値画像へ変換することを可能とし、多値画像の領域分割にも対応可能な画像処理方法及び装置を提供することにある。
【０００８】
又、本発明の他の目的は、特定の条件を有する画像領域をノイズとみなすことにより、画像よりのノイズ除去を容易に行うことを可能とする画像処理方法及び装置を提供することにある。
【０００９】
【課題を解決するための手段】
上記の目的を達成するための本発明の画像処理装置は以下の構成を備えるものである。即ち、
画像を複数の矩形領域に分割する画像処理装置であって、
画像データ中の１つもしくは複数の連続する黒画素を含む矩形領域を形成する形成手段と、
前記形成手段により形成された矩形領域に関するデータに基づいて、各矩形領域の領域属性を判別する判別手段と、
前記判別手段においてセパレータ、図形、写真、表の何れにも属さない所定の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する抽出手段と、
前記抽出手段により抽出された候補領域から所定の距離内に他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する合併手段と、
前記合併手段により得られた合併領域の夫々について、その合併領域の幅と高さとに基づいて、該合併領域が点破線であるか否かを判定し、当該点破線であると判定された合併領域に対して点破線の領域属性を付与する判定手段とを備える。
【００１１】
又、好ましくは、上記の構成において、前記合併手段は、前記抽出手段により抽出された候補領域を幅方向に第１の所定量拡大し且つ高さ方向に第２の所定量拡大して得られた領域に、その一部もしくは全てが重なる他の候補領域がある場合、該候補領域と該他の候補領域を合併して合併領域を生成する。
【００１２】
又、上記の構成において、前記判別手段は、前記形成手段により形成された矩形領域の幅、高さ、面積、黒画素の密度に基づいて、各矩形領域の領域属性を判別する。
【００１３】
又、好ましくは、上記の構成において、前記形成手段による矩形領域の形成に先立って、処理対象の画像データの解像度に基づいて縮小率を定め、当該定められた縮小率に基づいて前記画像データを縮小する縮小手段を更に備える。
【００１４】
又、好ましくは、上記の構成において、処理対象の画像データが多値画像であるか否かを識別する識別手段と、前記識別手段により前記画像データが多値画像であると識別された場合、該画像データを２値画像に変換する変換手段とを更に備える。
【００１５】
又、好ましくは、上記の構成において、前記判定手段において点破線でないと判定された合併領域をノイズとみなして除去する除去手段を更に備える。
又、好ましくは、上記の構成において、前記判別手段は、前記形成手段により形成された矩形領域のデータに基づいて、各矩形領域の領域属性を本文・表・図形または写真の領域属性のいずれかに判別し、前記抽出手段は、前記判別手段において本文の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する。
【００１６】
尚、特許請求の範囲における「黒画素」とは、有意な画素を意味するものである。従って、例えば、黒い背景に白のイメージを有するような画像であれば、「黒画素」とは白い画素を指すことになる。
【００１７】
【実施例】
以下に添付の図面を参照して本発明の好適な実施例を説明する。
【００１８】
図１は、本実施例の画像処理装置の制御構成を表すブロック図である。同図において、１０１は入力部であり、領域分割を行うべき画像データを入力する。１０２は演算処理部（ＣＰＵ）であり、本画像処理の全体の制御を行うとともに、各処理の演算を行う。１０３は記憶部であり、演算処理部１０２が実行する制御プログラムや、各種データを記憶する。記憶部１０３は、ＲＯＭやＲＡＭ、ハードディスク等から構成される。１０４は出力部であり、演算処理結果や画像処理結果、及び画像データを出力する。
【００１９】
１０５は領域分割部であり、入力部１０１より入力された画像データに対して領域分割処理を行う。尚、この領域分割部１０５は演算処理部１０２が後述の領域分割処理を実行することで実現されてもよいし、専用のプロセッサを具備した構成としてもよい。
【００２０】
１０６はラベリング部であり、初期の矩形データ（入力された画像データを矩形領域に分割したデータ）を作成するとともに、各矩形領域にラベルをつける。１０７は領域属性検出部であり、各矩形領域の属性（セパレータ、表、図形、文字等）を検出する。１０８は点・破線要素抽出部であり、領域属性検出部１０７において文字に分類された矩形の中から、更に点線もしくは破線で構成されている可能性のある矩形領域を抽出する。１０９は矩形合併部であり、点・破線要素抽出部１０８によって抽出された矩形領域同士で所定の範囲にある矩形領域を合併する。１１０は点・破線セパレータ検出部であり、矩形合併部１０９で合併して得られた各矩形領域が点・破線セパレータであるか否かを検出する。
【００２１】
図１の構成において、概略の動作を説明する。入力部１０１より入力された画像は領域分割部１０５により複数の領域に分割される。まず、ラベリング部１０６にて、画像データ中の１つ又は連続する複数の黒画素を内包する矩形領域が生成される。そして、領域属性検出部１０７において、生成された各矩形領域の画像の種別（図形、表、文字等）を検出する。点・破線要素検出部１０８は、生成された矩形領域のうち、所定の大きさに満たない矩形領域を、例えば点線、破線等の一部を含む点・破線候補として抽出する。矩形合併部１０９は、この点・破線候補と所定の距離内にある他の点・破線候補とを合併して合併矩形領域を生成する。更に、点・破線セパレータ検出部１１０において、各合併矩形領域に対して画像領域の仕切りとしての形状を満足するか否かを判定することにより、例えば点線、破線によるセパレータを検出することができる。
【００２２】
図２は、本実施例の画像処理装置における画像処理の全体的な流れを示すフローチャートであり、この処理を実行する制御プログラムは記憶部１０３に記憶されている。以下、このフローチャートに基づいて本実施例の画像処理装置の領域分割処理を説明する。
【００２３】
まず、ステップＳ２０１において、入力部１０１から元画像を入力する。次に、ステップＳ２０２において、ラベリング部１０６は、入力された元画像からの矩形領域の抽出と、抽出された各矩形領域へのラベリングを行う。
【００２４】
ラベリング部１０６では、入力画像について１行ずつ画像を走査し、黒画素に対してラベルを付加していく。このとき、上下・左右・斜めで連続している画素には同一ラベルを付け、同時にこれらの画素を内包する矩形領域を生成し、各矩形領域の矩形データを生成して行く。
【００２５】
上述のラベリング処理について更に具体的に説明する。図３は、画像データの一部分を表す図である。又、図４は矩形データのデータ構成例を表す図である。図３の画像データを例に取ると、最初に検出される黒画素Ａにはラベル１が付けられる。また、この黒画素Ａの座標（Ｘａ，Ｙａ）を矩形の始点及び終点とし、画素数を１、矩形を区別するための矩形ラベルに画素と同じラベル１を付加し、以上のデータを矩形データ（図４）として記憶部１０３に記憶する。尚、図４中の点・破線要素フラグについては後述する。
【００２６】
次に、図３において、黒画素Ａと連続していない（１行目であるので上からの連続画素はない）黒画素Ｂにはラベル２が付けられる。そして、この黒画素Ｂの座標（Ｘｂ，Ｙｂ）を矩形の始点と終点とし、画素数を１、矩形を区別するための矩形ラベルに画素と同じラベル２を付加し、新たな矩形データとして記憶部１０３に記憶する。以上の様な処理を１行目の画素について実行し、１行目のラベリングが終了すると、処理は２行目に移る。
【００２７】
図３において、２行目の最初の黒画素Ｃはラベル１の黒画素Ａと上下に連続しているので、黒画素Ｃには画素ラベル１を付加する。又、矩形ラベル１の矩形データに対して、画素数を１加算して計２画素とし、矩形ラベルは変わらず１のままで、矩形座標は終点のみを（Ｘａ，Ｙａ）から（Ｘａ，Ｙｃ）へと更新する（始点の座標は変わらない）。
【００２８】
次の黒画素Ｄは黒画素Ｃと左から連続しているので、黒画素Ｄにはラベル１が付加される。そして、矩形ラベル１の矩形データに対して、画素数が１加算されて計３画素となり、矩形ラベルは変わらず１のままで、矩形座標は終点のみを（Ｘａ，Ｙｃ）から（Ｘｄ，Ｙｃ）へと更新する（終点のＹ座標は変わらない）。以上のように矩形座標を変更することにより、黒画素Ａ，Ｃ，Ｄを含む矩形領域（矩形ラベル＝１）が得られる。
【００２９】
このとき、黒画素Ｄは黒画素Ｂとも斜めに連続しているので、画素Ｂのラベルをラベル２からラベル１へと変更する。そして、矩形ラベル１の矩形データにおける「画素数」に、矩形ラベル２の「画素数」の内容を加算する。ここでは、この処理により矩形ラベル１の「画素数」が計４画素となる。又、矩形ラベル１の矩形データにおける矩形ラベルは変わらず１のままとなる。更に、矩形座標は画素Ａ，Ｂ，Ｃ，Ｄをすべて含むように終点のみを（Ｘｄ，Ｙｃ）から（Ｘｂ，Ｙｃ）へと更新する。又、矩形ラベル２の矩形データについてはその矩形ラベルを０として無効とする。
【００３０】
以上の様にして２行目が終了したら３行目に移る。
【００３１】
３行目の最初の画素Ｅは画素Ｃと斜めに連続しているので画素ラベル１を付加する。そして、矩形ラベル１の矩形データに対し、画素数を１加算して計５画素とし、矩形ラベルは変わらず１のままで、矩形座標は始点を（Ｘａ，Ｙａ）から（Ｘｅ，Ｙａ）へ、終点を（Ｘｂ，Ｙｄ）から（Ｘｂ，Ｙｅ）へと更新する。以下同様にして、全入力画素に対して矩形領域の抽出を行うとともに、各矩形領域にラベリングを行う。
【００３２】
矩形領域の抽出及びラベリングを終了すると処理はステップＳ２０３へ進む（図２）。ステップＳ２０３では、領域属性検出部１０７において、文字の矩形領域、図形または写真の矩形領域、表の矩形領域、セパレータの矩形領域に分類し、夫々の矩形領域の矩形ラベルを図５に示すように変更する。尚、図５は本実施例における矩形ラベルと領域属性の関係を表す図である。
【００３３】
図６は本実施例における領域属性検出処理の手順を表すフローチャートである。本例では、矩形の幅Ｗ、高さＨ、面積Ｓ（矩形領域内の全画素数に対応する）、面積Ｓに対する黒画素の数（即ち画素密度Ｄ）を用いて矩形領域の属性を区別する。これらの値は、上述の矩形データを用いて計算することにより容易に求まることは明らかである。
【００３４】
図６の領域属性検出処理を説明すると、まず、ステップＳ５０１において、ラベリング部１０６において獲得された矩形領域の一つを取り出す。そして、ステップＳ５０２で、すべての矩形領域について矩形領域属性の判別処理が終了しているか否かを判定し、終了しいていれば本処理を終了する。一方、未処理の矩形領域があればステップＳ５０３へ進み、領域属性の判別を行う。
【００３５】
まず、ある矩形領域の幅Ｗが閾値Ｔｗ１以下でかつ高さＨが幅Ｗの閾値Ｔｗ２倍以上（図６のステップＳ５０３）、もしくは幅Ｗが閾値Ｔｗ１より大きくかつ高さＨが幅Ｗの閾値Ｔｗ３倍以上（図６のステップＳ５０４）であれば、当該矩形領域は縦長セパレータであると判断して、その矩形データ中の矩形ラベルを−３とする（図６のステップＳ５１４）。尚、矩形領域を構成する画素の画素ラベルは矩形ラベルとは別にそのままの値を保持しておく。また、幅と高さが入れ替わった場合も上記と同様にして横長セパレータと判定して矩形ラベルを−３に変更する（図６のステップＳ５０５，ステップＳ５０６）。
【００３６】
次に、上述の条件を満足しない場合でも、画素密度Ｄが閾値Ｔｄ１以下の時（図６のステップＳ５０７）はカギ型などの変形セパレータと見なして矩形ラベルを−３に変更する（図６のステップＳ５１４）。
【００３７】
また、面積Ｓが閾値Ｔｓ１より大きい場合（図６のステップＳ５０８）に、画素密度Ｄが閾値Ｔｄ２未満（図６のステップＳ５０９）ならば表と見なして矩形ラベルを−４に変更（図６のステップＳ５１５）し、画素密度Ｄが閾値Ｔｄ２以上ならば図形または写真とみなして矩形ラベルを−５に変更する（図６のステップＳ５１６）。
【００３８】
また、面積Ｓが閾値Ｔｓ１以下でかつ閾値Ｔｓ２以上の時（図６のステップＳ５１０）の画素密度Ｄが閾値Ｔｄ３以上（図６のステップＳ５１１）の矩形や、幅Ｗ及び高さＨが元に閾値Ｔｗ４以上でかつ画素密度ＤがＴｄ５以上の時（図６のステップＳ５１３）の矩形も図形または写真とみなして矩形ラベルを−５に変更する。
【００３９】
更に、面積Ｓが閾値Ｔｓ１以下でかつ閾値Ｔｓ２以上の時（図６のステップＳ５１０）、画素密度Ｄが閾値Ｔｄ４未満（図６のステップＳ５１２）の矩形を表とみなし矩形ラベルを−４に変更する（図６のステップＳ５１５）。
【００４０】
以上の様にして、「セパレータ」、「図形または写真」、「表」に該当する矩形領域が抽出される。そして、残った矩形領域を本文とし、矩形ラベルを変更せずに、そのまま画素ラベルと同一にしておく（図６のステップＳ５１７）。
【００４１】
以上の領域属性検出部１０７の処理により、ラベリング部で形成された各矩形領域の属性が区別される。図７は本実施例の領域属性検出部１０７による、面積Ｓと画素密度Ｄによる領域属性の識別基準を説明する図である。上述の図６のフローチャートによれば、各矩形領域の面積Ｓ及び画素密度Ｄに基づいて、図７に示されるように領域属性が区別される。尚、図６のステップＳ５０３〜ステップＳ５０６による判定は、矩形領域の縦横の長さの関係でセパレータ矩形か否かを判定しており、図７では示されていない。
【００４２】
次に、図２のステップＳ２０４において、領域属性検出部１０７による領域属性検出（ステップＳ２０３）の結果、点・破線要素抽出部１０８により本文と判定された矩形（即ち、矩形ラベルが正の整数である矩形領域）より点・破線要素の候補を抽出する。
【００４３】
図８は、本実施例の点・破線要素抽出部１０８の処理手順を表すフローチャートである。まず、ステップＳ７０１において、矩形領域をサーチする。ステップＳ７０２において、全ての矩形領域についてサーチが終了していれば本処理を終了する。一方、未処理の矩形領域が存在すればステップＳ７０３へ進む。ステップＳ７０３では、注目している矩形領域の矩形ラベルがゼロより大きいか否かを判定する。矩形ラベルがゼロより大きい場合は、当該矩形領域は「本文」であり、処理はステップＳ７０４へ進み、当該矩形領域が点・破線要素か否かの判定を行う。矩形ラベルがゼロ以下の場合は、当該矩形領域は「本文」ではないので、ステップＳ７０１へ戻り、次の矩形領域をサーチする。
【００４４】
ステップＳ７０４、ステップＳ７０５において、矩形領域の幅Ｗ、高さＨのうちの少なくとも一方が閾値Ｔｘ未満の場合は、該矩形領域を点・破線セパレータ要素の候補であると判定し、ステップＳ７０６へ進む。ステップＳ７０６では、当該矩形データの点・破線要素フラグを１にセットする。一方、矩形領域の幅Ｗ、高さＨの両方とも閾値Ｔｘ以上であれば、該矩形領域は本文であるとし、当該矩形データの点・破線要素フラグを０に設定する（図８のＳ７０７）。
【００４５】
次に処理は図２のステップＳ２０５に進み、上述のステップＳ２０４の処理において点・破線要素フラグが１にセットされた矩形領域（即ち、点・破線要素の候補）のうち、所定の近さに存在する領域同士を合併する。
【００４６】
図９は点・破線要素の候補となった矩形領域同士の合併方法を説明する図である。図９に示されるように、点・破線要素として抽出された矩形領域Ａ１と矩形領域Ｂとの合併を考える。まず、矩形領域Ａ１に対してＸ方向にＰｘ，Ｙ方向にＰｙだけ拡張した仮想矩形Ａ１’を考える。そして、仮想矩形Ａ１’の周囲に接触或は内包する点、破線要素の候補の矩形領域があるかをサーチする。図９においては、矩形領域Ｂが仮想矩形Ａ１’に接触しているので、矩形領域Ａ１と矩形領域Ｂが合併される。このようにして、新たな矩形領域Ａ２（合併矩形）が生成される。
【００４７】
この合併矩形Ａ２の矩形データは、矩形領域Ａ１の矩形データを更新することで獲得し、記憶する。そして、矩形領域Ｂのデータはその矩形ラベルをゼロとすることで、無効とする。ただし、ここで用いられるＰｘ，Ｐｙは予め定められた値であり、矩形を合併してできた合併矩形が図形や表や点・破線でないセパレータ等と接触する場合は、合併する事自体を無効とし、元の矩形領域のままとしておく。
【００４８】
以上のように矩形の合併を繰り返し、合併可能な矩形が無くなったらば本処理を終了する。
【００４９】
次に処理はステップＳ２０６（図２）に進み、点・破線セパレータ検出部１１０により、上述のステップＳ２０５で合併してできた合併領域の夫々が、点・破線セパレータであるか否かの判定を行う。図１０は合併領域が点・破線セパレータであるか否かを判定する手順を表すフローチャートである。
【００５０】
まず、ステップＳ９０１において、矩形領域をサーチする。次に、ステップＳ９０２において、全ての矩形領域についてのサーチが終了していれば本処理を終了する。一方、未処理の矩形領域が存在すればステップＳ９０３へ進む。ステップＳ９０３では、注目している矩形領域が点・破線要素の候補であるか否かを判定する。即ち、当該矩形領域の矩形データ中の点・破線要素フラグが１であるか否かを判定し、１でなければ次の矩形領域を処理するべくステップＳ９０１へ戻る。一方、点・破線要素フラグが１であればステップＳ９０４へ進む。
【００５１】
ステップＳ９０４以降では、矩形領域の縦横長さの関係で定まる形状より点・破線セパレータであるか否かを判定する。本例では、直線のセパレータ検出と同様に、幅Ｗが閾値Ｔｗ１以下でかつ高さＨが幅Ｗの閾値Ｔｗ２倍以上（図９のＳ９０４）もくしは幅Ｗが閾値Ｔｗ１より大きくかつ高さＨが幅Ｗの閾値Ｔｗ３倍以上（図９のＳ９０５）であれば点・破線セパレータである判断し、ステップＳ９０８で矩形ラベルを−６に更新する。尚、矩形を構成する画素ラベルは矩形ラベルとは別にそのまま保持しておく。
【００５２】
また幅と高さの関係をを入れ替えた条件で上記と同様のチェックを行い（図９のステップＳ９０６，Ｓ９０７）、条件を満たす場合は点・破線セパレータとして矩形ラベルを−６に変更する。
【００５３】
最後に、ステップＳ２０７（図２）において、以上の様にして求めた点・破線セパレータの矩形データを各種領域の矩形データや画像データと共に出力部１０４から出力する。
【００５４】
尚、領域分割処理に先立って、入力画像に対して縮小処理を施すようにしてもよい。例えば、入力画像に対して解像度がＲｄｐｉ以上であれば、縦ｍドット、横ｎドットの論理和をとって得られた値を、このｍ×ｎ画素に対応する画素値として、入力画像を縦１／ｍ、横１／ｎに縮小する。又、解像度がＲｄｐｉ未満であれば縦ｐ（ｐ＜ｍ）ドット、横ｑ（ｑ＜ｎ）ドットの論理和をとって、ｐ×ｑ画素に対応する画素値とし、入力画像を縦１／ｐ、横１／ｎに縮小する。この例では、入力画像のｍ×ｎ画像またはｐ×ｑ画像中に１ドットでも黒画素が有れば縮小画像は黒となる。ここで、解像度に応じて縮小率を変えるのは、単位長さ当りの画素数を一定に保つためであり、こすることにより、前述の領域属性の識別に用いた閾値をそのまま用いることが可能となるからである。
【００５５】
上記のようにして得られた縮小画素に対して上述の領域分割処理を施すことにより、記憶領域の更なる縮小や、処理時間の更なる短縮がはかれる。また、複数の画素をオアにより統合するので、計算量が節約できるが、画像の縮小においては他の方法を用いてもよいことはいうまでもない。
【００５６】
また、入力部１０１において、入力画像が多値であるかどうかを判断し、多値であった場合はこれを２値画像に変換するように構成してもよい。このようにすれば、入力画像がカラー等の多値画像であっても領域分割処理が可能となる。
【００５７】
また、点・破線セパレータ検出部１１０において、点・破線セパレータとして検出されなかった残りの点・破線要素候補の矩形領域をノイズとして扱うようにしてもよい。このようにすれば、画像データからのノイズの除去を容易に行うことができる。
【００５８】
以上説明した様に、上記の実施例によれば、入力画像を複数の矩形領域に分割し、夫々の属性を判定し、その後、微小なサイズの矩形領域を点・破線要素として抽出し、点・破線要素の合併をとることにより点・破線セパレータを抽出することが可能となる。このように、一般的な領域分割プログラムに対して点・破線セパレータ検出用のプログラムをモジュールとして追加すればよい。従って、既存のプログラムの大幅な変更無しに、▲１▼処理時間の短縮、▲２▼複雑な領域構成の分割、特に点・破線を含む領域構成の分割に対して精度の向上、▲３▼図１１に示すような特殊な破線（１００１、１００２）の検出が可能となる、▲４▼ノイズの削除を容易に行える、等の効果がある。
【００５９】
又、入力画像について、縦ｍドット、横ｎドットの論理和をとって、ｍ×ｎ画素を１画素とする縮小処理を行うことによって、既存のプログラムの大幅な変更無しに、▲１▼画像処理時間の短縮、▲２▼記憶領域等の小規模化等がはかれる効果がある。
【００６０】
尚、本発明は、複数の機器から構成されるシステムに適用しても１つの機器からなる装置に適用しても良い。また、本発明はシステム或いは装置に本発明により規定される処理を実行させるプログラムを供給することによって達成される場合にも適用できることはいうまでもない。
【００６１】
【発明の効果】
以上説明したように、本発明によれば、破線や点線等によるセパレータの矩形領域をより確実に抽出することが可能となる。
【００６２】
【図面の簡単な説明】
【図１】本実施例の画像処理装置の制御構成を表すブロック図である。
【図２】本実施例の画像処理装置における画像処理の全体的な流れを示すフローチャートである。
【図３】本実施例で用いる画像データの一部分を表す図である。
【図４】本実施例における矩形データのデータ構成例を表す図である。
【図５】本実施例における矩形ラベルと領域属性の関係を表す図である。
【図６】本実施例における領域属性検出処理の手順を表すフローチャートである。
【図７】本実施例の領域属性検出部による、面積Ｓと画素密度Ｄによる領域属性の識別基準を説明する図である。
【図８】本実施例の点・破線要素抽出部の処理手順を表すフローチャートである。
【図９】点・破線要素の候補となった矩形領域同士の合併方法を説明する図である。
【図１０】合併領域が点・破線セパレータであるか否かを判定する手順を表すフローチャートである。
【図１１】特殊な破線セパレータを表す図である。
【符号の説明】
１０１入力部
１０２演算処理部（ＣＰＵ）
１０３記憶部
１０４出力部
１０５領域分割部
１０６ラベリング部
１０７領域属性抽出部
１０８点・破線要素抽出部
１０９矩形の合併部
１１０点・破線セパレータ検出部

Claims

画像を複数の矩形領域に分割する画像処理装置であって、
画像データ中の１つもしくは複数の連続する黒画素を含む矩形領域を形成する形成手段と、
前記形成手段により形成された矩形領域に関するデータに基づいて、各矩形領域の領域属性を判別する判別手段と、
前記判別手段においてセパレータ、図形、写真、表の何れにも属さない所定の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する抽出手段と、
前記抽出手段により抽出された候補領域から所定の距離内に他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する合併手段と、
前記合併手段により得られた合併領域の夫々について、その合併領域の幅と高さとに基づいて、該合併領域が点破線であるか否かを判定し、当該点破線であると判定された合併領域に対して点破線の領域属性を付与する判定手段とを備えることを特徴とする画像処理装置。
前記合併手段は、前記抽出手段により抽出された候補領域を幅方向に第１の所定量拡大し且つ高さ方向に第２の所定量拡大して得られた領域に、その一部もしくは全てが重なる他の候補領域がある場合、該候補領域と該他の候補領域を合併して合併領域を生成することを特徴とする請求項１に記載の画像処理装置。
前記判別手段は、前記形成手段により形成された矩形領域の幅、高さ、面積、黒画素の密度に基づいて、各矩形領域の領域属性を判別することを特徴とする請求項１に記載の画像処理装置。
前記形成手段による矩形領域の形成に先立って、処理対象の画像データの解像度に基づいて縮小率を定め、当該定められた縮小率に基づいて前記画像データを縮小する縮小手段を更に備えることを特徴とする請求項１に記載の画像処理装置。
処理対象の画像データが多値画像であるか否かを識別する識別手段と、前記識別手段により前記画像データが多値画像であると識別された場合、該画像データを２値画像に変換する変換手段とを更に備えることを特徴とする請求項１に記載の画像処理装置。
前記判定手段において点破線でないと判定された合併領域をノイズとみなして除去する除去手段を更に備えることを特徴とする請求項１に記載の画像処理装置。
前記判別手段は、前記形成手段により形成された矩形領域のデータに基づいて、各矩形領域の領域属性を本文・表・図形または写真の領域属性のいずれかに判別し、
前記抽出手段は、前記判別手段において本文の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出することを特徴とする請求項１に記載の画像処理装置。
画像を複数の矩形領域に分割する画像処理方法であって、
画像データ中の１つもしくは複数の連続する黒画素を含む矩形領域を形成する形成工程と、
前記形成工程により形成された矩形領域に関するデータに基づいて、各矩形領域の領域属性を判別する判別工程と、
前記判別工程においてセパレータ、図形、写真、表の何れにも属さない所定の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する抽出工程と、
前記抽出工程により抽出された候補領域から所定の距離内に他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する合併工程と、
前記合併工程により得られた合併領域の夫々について、その合併領域の幅と高さとに基づいて、該合併領域が点破線であるか否かを判定し、当該点破線であると判定された合併領域に対して点破線の領域属性を付与する判定工程とを備えることを特徴とする画像処理方法。