JP3666903B2 - 画像処理方法および装置 - Google Patents

画像処理方法および装置 Download PDF

Info

Publication number
JP3666903B2
JP3666903B2 JP16090194A JP16090194A JP3666903B2 JP 3666903 B2 JP3666903 B2 JP 3666903B2 JP 16090194 A JP16090194 A JP 16090194A JP 16090194 A JP16090194 A JP 16090194A JP 3666903 B2 JP3666903 B2 JP 3666903B2
Authority
JP
Japan
Prior art keywords
area
rectangular
region
image
merged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16090194A
Other languages
English (en)
Other versions
JPH0830788A (ja
Inventor
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP16090194A priority Critical patent/JP3666903B2/ja
Priority to EP95304854A priority patent/EP0692767B1/en
Priority to DE69531882T priority patent/DE69531882D1/de
Priority to US08/501,562 priority patent/US5966455A/en
Publication of JPH0830788A publication Critical patent/JPH0830788A/ja
Application granted granted Critical
Publication of JP3666903B2 publication Critical patent/JP3666903B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、OCR(光学的文字認識)装置、複写機、ファクシミリ等において、入力画像を文字、図形、表等の領域に分割する画像処理方法及び装置に関するものである。
【0002】
【従来の技術】
入力画像を文字、図形、写真、表等の領域に分割し、夫々の領域毎に画像の種類に応じた処理を行うことを可能とする画像処理装置がある。このような画像処理装置によれば、例えば文字と写真が混在したような画像において、文字の領域についてはOCRによって文字コード化し、写真の領域については画像用の圧縮を行う等、各領域の画像の種別に適した処理を行うことができる。
【0003】
この種の画像処理装置における入力画像の領域分割手法において、点線や破線の抽出方法としては、
▲1▼ 破線らしい図形を発見してその延長上に次の破線を探索する方法、
▲2▼ 短線分の角度と距離を利用して抽出する方法、
▲3▼ 画素の集まりが孤立しているものをグループ化し最初と最後を結んだ直線と各グループ要素の距離及びグループの高さから抽出する方法
等が挙げられる。
【0004】
【発明が解決しようとする課題】
しかしながら、上述の従来技術では、演算処理に多大な時間を費やし、かつ点線に対する抽出精度が低くまた図11の1001や1002に示すような特殊な破線の場合は検出ができないという問題があった。このため、入力画像を画像の種別によって領域分割し、文字認識等を行う場合、破線や点線の領域について文字認識処理を行ってしまう可能性があり、効率的な文字認識や正しい文字認識ができなくなるという問題がある。
【0005】
本発明は上記の問題点に鑑みてなされたものであり、破線や点線等によるセパレータの矩形領域をより確実に抽出することを可能とする画像処理方法及び装置を提供することを目的とする。
【0006】
又、本発明の他の目的は、画像領域の分割に先立って、処理対象となる画像を縮小することにより、処理速度の向上、メモリ消費量の低減を図る画像処理方法及び装置を提供することにある。
【0007】
又、本発明の他の目的は、画像領域の分割に先立って、処理対象となる画像が多値画像である場合には当該画像を2値画像へ変換することを可能とし、多値画像の領域分割にも対応可能な画像処理方法及び装置を提供することにある。
【0008】
又、本発明の他の目的は、特定の条件を有する画像領域をノイズとみなすことにより、画像よりのノイズ除去を容易に行うことを可能とする画像処理方法及び装置を提供することにある。
【0009】
【課題を解決するための手段】
上記の目的を達成するための本発明の画像処理装置は以下の構成を備えるものである。即ち、
画像を複数の矩形領域に分割する画像処理装置であって、
画像データ中の1つもしくは複数の連続する黒画素を含む矩形領域を形成する形成手段と、
前記形成手段により形成された矩形領域に関するデータに基づいて、各矩形領域の領域属性を判別する判別手段と、
前記判別手段においてセパレータ、図形、写真、表の何れにも属さない所定の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する抽出手段と、
前記抽出手段により抽出された候補領域から所定の距離内に他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する合併手段と、
前記合併手段により得られた合併領域の夫々について、その合併領域の幅と高さとに基づいて、該合併領域が点破線であるか否かを判定し、当該点破線であると判定された合併領域に対して点破線の領域属性を付与する判定手段とを備える。
【0011】
又、好ましくは、上記の構成において、前記合併手段は、前記抽出手段により抽出された候補領域を幅方向に第1の所定量拡大し且つ高さ方向に第2の所定量拡大して得られた領域にその一部もしくは全てが重なる他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する。
【0012】
又、上記の構成において、前記判別手段は、前記形成手段により形成された矩形領域の幅、高さ、面積、黒画素の密度に基づいて、各矩形領域の領域属性を判別する。
【0013】
又、好ましくは、上記の構成において、前記形成手段による矩形領域の形成に先立って、処理対象の画像データの解像度に基づいて縮小率を定め、当該定められた縮小率に基づいて前記画像データを縮小する縮小手段を更に備える。
【0014】
又、好ましくは、上記の構成において、処理対象の画像データが多値画像でるか否かを識別する識別手段と、前記識別手段により前記画像データが多値画像であると識別された場合、該画像データを2値画像に変換する変換手段とを更に備える。
【0015】
又、好ましくは、上記の構成において、前記判定手段において点破線でないと判定された合併領域をノイズとみなして除去する除去手段を更に備える。
又、好ましくは、上記の構成において、前記判別手段は、前記形成手段により形成された矩形領域のデータに基づいて、各矩形領域の領域属性を本文・表・図形または写真の領域属性のいずれかに判別し、前記抽出手段は、前記判別手段において本文の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する。
【0016】
尚、特許請求の範囲における「黒画素」とは、有意な画素を意味するものである。従って、例えば、黒い背景に白のイメージを有するような画像であれば、「黒画素」とは白い画素を指すことになる。
【0017】
【実施例】
以下に添付の図面を参照して本発明の好適な実施例を説明する。
【0018】
図1は、本実施例の画像処理装置の制御構成を表すブロック図である。同図において、101は入力部であり、領域分割を行うべき画像データを入力する。102は演算処理部(CPU)であり、本画像処理の全体の制御を行うとともに、各処理の演算を行う。103は記憶部であり、演算処理部102が実行する制御プログラムや、各種データを記憶する。記憶部103は、ROMやRAM、ハードディスク等から構成される。104は出力部であり、演算処理結果や画像処理結果、及び画像データを出力する。
【0019】
105は領域分割部であり、入力部101より入力された画像データに対して領域分割処理を行う。尚、この領域分割部105は演算処理部102が後述の領域分割処理を実行することで実現されてもよいし、専用のプロセッサを具備した構成としてもよい。
【0020】
106はラベリング部であり、初期の矩形データ(入力された画像データを矩形領域に分割したデータ)を作成するとともに、各矩形領域にラベルをつける。107は領域属性検出部であり、各矩形領域の属性(セパレータ、表、図形、文字等)を検出する。108は点・破線要素抽出部であり、領域属性検出部107において文字に分類された矩形の中から、更に点線もしくは破線で構成されている可能性のある矩形領域を抽出する。109は矩形合併部であり、点・破線要素抽出部108によって抽出された矩形領域同士で所定の範囲にある矩形領域を合併する。110は点・破線セパレータ検出部であり、矩形合併部109で合併して得られた各矩形領域が点・破線セパレータであるか否かを検出する。
【0021】
図1の構成において、概略の動作を説明する。入力部101より入力された画像は領域分割部105により複数の領域に分割される。まず、ラベリング部106にて、画像データ中の1つ又は連続する複数の黒画素を内包する矩形領域が生成される。そして、領域属性検出部107において、生成された各矩形領域の画像の種別(図形、表、文字等)を検出する。点・破線要素検出部108は、生成された矩形領域のうち、所定の大きさに満たない矩形領域を、例えば点線、破線等の一部を含む点・破線候補として抽出する。矩形合併部109は、この点・破線候補と所定の距離内にある他の点・破線候補とを合併して合併矩形領域を生成する。更に、点・破線セパレータ検出部110において、各合併矩形領域に対して画像領域の仕切りとしての形状を満足するか否かを判定することにより、例えば点線、破線によるセパレータを検出することができる。
【0022】
図2は、本実施例の画像処理装置における画像処理の全体的な流れを示すフローチャートであり、この処理を実行する制御プログラムは記憶部103に記憶されている。以下、このフローチャートに基づいて本実施例の画像処理装置の領域分割処理を説明する。
【0023】
まず、ステップS201において、入力部101から元画像を入力する。次に、ステップS202において、ラベリング部106は、入力された元画像からの矩形領域の抽出と、抽出された各矩形領域へのラベリングを行う。
【0024】
ラベリング部106では、入力画像について1行ずつ画像を走査し、黒画素に対してラベルを付加していく。このとき、上下・左右・斜めで連続している画素には同一ラベルを付け、同時にこれらの画素を内包する矩形領域を生成し、各矩形領域の矩形データを生成して行く。
【0025】
上述のラベリング処理について更に具体的に説明する。図3は、画像データの一部分を表す図である。又、図4は矩形データのデータ構成例を表す図である。図3の画像データを例に取ると、最初に検出される黒画素Aにはラベル1が付けられる。また、この黒画素Aの座標(Xa,Ya)を矩形の始点及び終点とし、画素数を1、矩形を区別するための矩形ラベルに画素と同じラベル1を付加し、以上のデータを矩形データ(図4)として記憶部103に記憶する。尚、図4中の点・破線要素フラグについては後述する。
【0026】
次に、図3において、黒画素Aと連続していない(1行目であるので上からの連続画素はない)黒画素Bにはラベル2が付けられる。そして、この黒画素Bの座標(Xb,Yb)を矩形の始点と終点とし、画素数を1、矩形を区別するための矩形ラベルに画素と同じラベル2を付加し、新たな矩形データとして記憶部103に記憶する。以上の様な処理を1行目の画素について実行し、1行目のラベリングが終了すると、処理は2行目に移る。
【0027】
図3において、2行目の最初の黒画素Cはラベル1の黒画素Aと上下に連続しているので、黒画素Cには画素ラベル1を付加する。又、矩形ラベル1の矩形データに対して、画素数を1加算して計2画素とし、矩形ラベルは変わらず1のままで、矩形座標は終点のみを(Xa,Ya)から(Xa,Yc)へと更新する(始点の座標は変わらない)。
【0028】
次の黒画素Dは黒画素Cと左から連続しているので、黒画素Dにはラベル1が付加される。そして、矩形ラベル1の矩形データに対して、画素数が1加算されて計3画素となり、矩形ラベルは変わらず1のままで、矩形座標は終点のみを(Xa,Yc)から(Xd,Yc)へと更新する(終点のY座標は変わらない)。以上のように矩形座標を変更することにより、黒画素A,C,Dを含む矩形領域(矩形ラベル=1)が得られる。
【0029】
このとき、黒画素Dは黒画素Bとも斜めに連続しているので、画素Bのラベルをラベル2からラベル1へと変更する。そして、矩形ラベル1の矩形データにおける「画素数」に、矩形ラベル2の「画素数」の内容を加算する。ここでは、この処理により矩形ラベル1の「画素数」が計4画素となる。又、矩形ラベル1の矩形データにおける矩形ラベルは変わらず1のままとなる。更に、矩形座標は画素A,B,C,Dをすべて含むように終点のみを(Xd,Yc)から(Xb,Yc)へと更新する。又、矩形ラベル2の矩形データについてはその矩形ラベルを0として無効とする。
【0030】
以上の様にして2行目が終了したら3行目に移る。
【0031】
3行目の最初の画素Eは画素Cと斜めに連続しているので画素ラベル1を付加する。そして、矩形ラベル1の矩形データに対し、画素数を1加算して計5画素とし、矩形ラベルは変わらず1のままで、矩形座標は始点を(Xa,Ya)から(Xe,Ya)へ、終点を(Xb,Yd)から(Xb,Ye)へと更新する。以下同様にして、全入力画素に対して矩形領域の抽出を行うとともに、各矩形領域にラベリングを行う。
【0032】
矩形領域の抽出及びラベリングを終了すると処理はステップS203へ進む(図2)。ステップS203では、領域属性検出部107において、文字の矩形領域、図形または写真の矩形領域、表の矩形領域、セパレータの矩形領域に分類し、夫々の矩形領域の矩形ラベルを図5に示すように変更する。尚、図5は本実施例における矩形ラベルと領域属性の関係を表す図である。
【0033】
図6は本実施例における領域属性検出処理の手順を表すフローチャートである。本例では、矩形の幅W、高さH、面積S(矩形領域内の全画素数に対応する)、面積Sに対する黒画素の数(即ち画素密度D)を用いて矩形領域の属性を区別する。これらの値は、上述の矩形データを用いて計算することにより容易に求まることは明らかである。
【0034】
図6の領域属性検出処理を説明すると、まず、ステップS501において、ラベリング部106において獲得された矩形領域の一つを取り出す。そして、ステップS502で、すべての矩形領域について矩形領域属性の判別処理が終了しているか否かを判定し、終了しいていれば本処理を終了する。一方、未処理の矩形領域があればステップS503へ進み、領域属性の判別を行う。
【0035】
まず、ある矩形領域の幅Wが閾値Tw1以下でかつ高さHが幅Wの閾値Tw2倍以上(図6のステップS503)、もしくは幅Wが閾値Tw1より大きくかつ高さHが幅Wの閾値Tw3倍以上(図6のステップS504)であれば、当該矩形領域は縦長セパレータであると判断して、その矩形データ中の矩形ラベルを−3とする(図6のステップS514)。尚、矩形領域を構成する画素の画素ラベルは矩形ラベルとは別にそのままの値を保持しておく。また、幅と高さが入れ替わった場合も上記と同様にして横長セパレータと判定して矩形ラベルを−3に変更する(図6のステップS505,ステップS506)。
【0036】
次に、上述の条件を満足しない場合でも、画素密度Dが閾値Td1以下の時(図6のステップS507)はカギ型などの変形セパレータと見なして矩形ラベルを−3に変更する(図6のステップS514)。
【0037】
また、面積Sが閾値Ts1より大きい場合(図6のステップS508)に、画素密度Dが閾値Td2未満(図6のステップS509)ならば表と見なして矩形ラベルを−4に変更(図6のステップS515)し、画素密度Dが閾値Td2以上ならば図形または写真とみなして矩形ラベルを−5に変更する(図6のステップS516)。
【0038】
また、面積Sが閾値Ts1以下でかつ閾値Ts2以上の時(図6のステップS510)の画素密度Dが閾値Td3以上(図6のステップS511)の矩形や、幅W及び高さHが元に閾値Tw4以上でかつ画素密度DがTd5以上の時(図6のステップS513)の矩形も図形または写真とみなして矩形ラベルを−5に変更する。
【0039】
更に、面積Sが閾値Ts1以下でかつ閾値Ts2以上の時(図6のステップS510)、画素密度Dが閾値Td4未満(図6のステップS512)の矩形を表とみなし矩形ラベルを−4に変更する(図6のステップS515)。
【0040】
以上の様にして、「セパレータ」、「図形または写真」、「表」に該当する矩形領域が抽出される。そして、残った矩形領域を本文とし、矩形ラベルを変更せずに、そのまま画素ラベルと同一にしておく(図6のステップS517)。
【0041】
以上の領域属性検出部107の処理により、ラベリング部で形成された各矩形領域の属性が区別される。図7は本実施例の領域属性検出部107による、面積Sと画素密度Dによる領域属性の識別基準を説明する図である。上述の図6のフローチャートによれば、各矩形領域の面積S及び画素密度Dに基づいて、図7に示されるように領域属性が区別される。尚、図6のステップS503〜ステップS506による判定は、矩形領域の縦横の長さの関係でセパレータ矩形か否かを判定しており、図7では示されていない。
【0042】
次に、図2のステップS204において、領域属性検出部107による領域属性検出(ステップS203)の結果、点・破線要素抽出部108により本文と判定された矩形(即ち、矩形ラベルが正の整数である矩形領域)より点・破線要素の候補を抽出する。
【0043】
図8は、本実施例の点・破線要素抽出部108の処理手順を表すフローチャートである。まず、ステップS701において、矩形領域をサーチする。ステップS702において、全ての矩形領域についてサーチが終了していれば本処理を終了する。一方、未処理の矩形領域が存在すればステップS703へ進む。ステップS703では、注目している矩形領域の矩形ラベルがゼロより大きいか否かを判定する。矩形ラベルがゼロより大きい場合は、当該矩形領域は「本文」であり、処理はステップS704へ進み、当該矩形領域が点・破線要素か否かの判定を行う。矩形ラベルがゼロ以下の場合は、当該矩形領域は「本文」ではないので、ステップS701へ戻り、次の矩形領域をサーチする。
【0044】
ステップS704、ステップS705において、矩形領域の幅W、高さHのうちの少なくとも一方が閾値Tx未満の場合は、該矩形領域を点・破線セパレータ要素の候補であると判定し、ステップS706へ進む。ステップS706では、当該矩形データの点・破線要素フラグを1にセットする。一方、矩形領域の幅W、高さHの両方とも閾値Tx以上であれば、該矩形領域は本文であるとし、当該矩形データの点・破線要素フラグを0に設定する(図8のS707)。
【0045】
次に処理は図2のステップS205に進み、上述のステップS204の処理において点・破線要素フラグが1にセットされた矩形領域(即ち、点・破線要素の候補)のうち、所定の近さに存在する領域同士を合併する。
【0046】
図9は点・破線要素の候補となった矩形領域同士の合併方法を説明する図である。図9に示されるように、点・破線要素として抽出された矩形領域A1と矩形領域Bとの合併を考える。まず、矩形領域A1に対してX方向にPx,Y方向にPyだけ拡張した仮想矩形A1’を考える。そして、仮想矩形A1’の周囲に接触或は内包する点、破線要素の候補の矩形領域があるかをサーチする。図9においては、矩形領域Bが仮想矩形A1’に接触しているので、矩形領域A1と矩形領域Bが合併される。このようにして、新たな矩形領域A2(合併矩形)が生成される。
【0047】
この合併矩形A2の矩形データは、矩形領域A1の矩形データを更新することで獲得し、記憶する。そして、矩形領域Bのデータはその矩形ラベルをゼロとすることで、無効とする。ただし、ここで用いられるPx,Pyは予め定められた値であり、矩形を合併してできた合併矩形が図形や表や点・破線でないセパレータ等と接触する場合は、合併する事自体を無効とし、元の矩形領域のままとしておく。
【0048】
以上のように矩形の合併を繰り返し、合併可能な矩形が無くなったらば本処理を終了する。
【0049】
次に処理はステップS206(図2)に進み、点・破線セパレータ検出部110により、上述のステップS205で合併してできた合併領域の夫々が、点・破線セパレータであるか否かの判定を行う。図10は合併領域が点・破線セパレータであるか否かを判定する手順を表すフローチャートである。
【0050】
まず、ステップS901において、矩形領域をサーチする。次に、ステップS902において、全ての矩形領域についてのサーチが終了していれば本処理を終了する。一方、未処理の矩形領域が存在すればステップS903へ進む。ステップS903では、注目している矩形領域が点・破線要素の候補であるか否かを判定する。即ち、当該矩形領域の矩形データ中の点・破線要素フラグが1であるか否かを判定し、1でなければ次の矩形領域を処理するべくステップS901へ戻る。一方、点・破線要素フラグが1であればステップS904へ進む。
【0051】
ステップS904以降では、矩形領域の縦横長さの関係で定まる形状より点・破線セパレータであるか否かを判定する。本例では、直線のセパレータ検出と同様に、幅Wが閾値Tw1以下でかつ高さHが幅Wの閾値Tw2倍以上(図9のS904)もくしは幅Wが閾値Tw1より大きくかつ高さHが幅Wの閾値Tw3倍以上(図9のS905)であれば点・破線セパレータである判断し、ステップS908で矩形ラベルを−6に更新する。尚、矩形を構成する画素ラベルは矩形ラベルとは別にそのまま保持しておく。
【0052】
また幅と高さの関係をを入れ替えた条件で上記と同様のチェックを行い(図9のステップS906,S907)、条件を満たす場合は点・破線セパレータとして矩形ラベルを−6に変更する。
【0053】
最後に、ステップS207(図2)において、以上の様にして求めた点・破線セパレータの矩形データを各種領域の矩形データや画像データと共に出力部104から出力する。
【0054】
尚、領域分割処理に先立って、入力画像に対して縮小処理を施すようにしてもよい。例えば、入力画像に対して解像度がRdpi以上であれば、縦mドット、横nドットの論理和をとって得られた値を、このm×n画素に対応する画素値として、入力画像を縦1/m、横1/nに縮小する。又、解像度がRdpi未満であれば縦p(p<m)ドット、横q(q<n)ドットの論理和をとって、p×q画素に対応する画素値とし、入力画像を縦1/p、横1/nに縮小する。この例では、入力画像のm×n画像またはp×q画像中に1ドットでも黒画素が有れば縮小画像は黒となる。ここで、解像度に応じて縮小率を変えるのは、単位長さ当りの画素数を一定に保つためであり、こすることにより、前述の領域属性の識別に用いた閾値をそのまま用いることが可能となるからである。
【0055】
上記のようにして得られた縮小画素に対して上述の領域分割処理を施すことにより、記憶領域の更なる縮小や、処理時間の更なる短縮がはかれる。また、複数の画素をオアにより統合するので、計算量が節約できるが、画像の縮小においては他の方法を用いてもよいことはいうまでもない。
【0056】
また、入力部101において、入力画像が多値であるかどうかを判断し、多値であった場合はこれを2値画像に変換するように構成してもよい。このようにすれば、入力画像がカラー等の多値画像であっても領域分割処理が可能となる。
【0057】
また、点・破線セパレータ検出部110において、点・破線セパレータとして検出されなかった残りの点・破線要素候補の矩形領域をノイズとして扱うようにしてもよい。このようにすれば、画像データからのノイズの除去を容易に行うことができる。
【0058】
以上説明した様に、上記の実施例によれば、入力画像を複数の矩形領域に分割し、夫々の属性を判定し、その後、微小なサイズの矩形領域を点・破線要素として抽出し、点・破線要素の合併をとることにより点・破線セパレータを抽出することが可能となる。このように、一般的な領域分割プログラムに対して点・破線セパレータ検出用のプログラムをモジュールとして追加すればよい。従って、既存のプログラムの大幅な変更無しに、▲1▼処理時間の短縮、▲2▼複雑な領域構成の分割、特に点・破線を含む領域構成の分割に対して精度の向上、▲3▼図11に示すような特殊な破線(1001、1002)の検出が可能となる、▲4▼ノイズの削除を容易に行える、等の効果がある。
【0059】
又、入力画像について、縦mドット、横nドットの論理和をとって、m×n画素を1画素とする縮小処理を行うことによって、既存のプログラムの大幅な変更無しに、▲1▼画像処理時間の短縮、▲2▼記憶領域等の小規模化等がはかれる効果がある。
【0060】
尚、本発明は、複数の機器から構成されるシステムに適用しても1つの機器からなる装置に適用しても良い。また、本発明はシステム或いは装置に本発明により規定される処理を実行させるプログラムを供給することによって達成される場合にも適用できることはいうまでもない。
【0061】
【発明の効果】
以上説明したように、本発明によれば、破線や点線等によるセパレータの矩形領域をより確実に抽出することが可能となる。
【0062】
【図面の簡単な説明】
【図1】本実施例の画像処理装置の制御構成を表すブロック図である。
【図2】本実施例の画像処理装置における画像処理の全体的な流れを示すフローチャートである。
【図3】本実施例で用いる画像データの一部分を表す図である。
【図4】本実施例における矩形データのデータ構成例を表す図である。
【図5】本実施例における矩形ラベルと領域属性の関係を表す図である。
【図6】本実施例における領域属性検出処理の手順を表すフローチャートである。
【図7】本実施例の領域属性検出部による、面積Sと画素密度Dによる領域属性の識別基準を説明する図である。
【図8】本実施例の点・破線要素抽出部の処理手順を表すフローチャートである。
【図9】点・破線要素の候補となった矩形領域同士の合併方法を説明する図である。
【図10】合併領域が点・破線セパレータであるか否かを判定する手順を表すフローチャートである。
【図11】特殊な破線セパレータを表す図である。
【符号の説明】
101 入力部
102 演算処理部(CPU)
103 記憶部
104 出力部
105 領域分割部
106 ラベリング部
107 領域属性抽出部
108 点・破線要素抽出部
109 矩形の合併部
110 点・破線セパレータ検出部

Claims (8)

  1. 画像を複数の矩形領域に分割する画像処理装置であって、
    画像データ中の1つもしくは複数の連続する黒画素を含む矩形領域を形成する形成手段と、
    前記形成手段により形成された矩形領域に関するデータに基づいて、各矩形領域の領域属性を判別する判別手段と、
    前記判別手段においてセパレータ、図形、写真、表の何れにも属さない所定の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する抽出手段と、
    前記抽出手段により抽出された候補領域から所定の距離内に他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する合併手段と、
    前記合併手段により得られた合併領域の夫々について、その合併領域の幅と高さとに基づいて、該合併領域が点破線であるか否かを判定し、当該点破線であると判定された合併領域に対して点破線の領域属性を付与する判定手段とを備えることを特徴とする画像処理装置。
  2. 前記合併手段は、前記抽出手段により抽出された候補領域を幅方向に第1の所定量拡大し且つ高さ方向に第2の所定量拡大して得られた領域に、その一部もしくは全てが重なる他の候補領域がある場合、該候補領域と該他の候補領域を合併して合併領域を生成することを特徴とする請求項1に記載の画像処理装置。
  3. 前記判別手段は、前記形成手段により形成された矩形領域の幅、高さ、面積、黒画素の密度に基づいて、各矩形領域の領域属性を判別することを特徴とする請求項1に記載の画像処理装置。
  4. 前記形成手段による矩形領域の形成に先立って、処理対象の画像データの解像度に基づいて縮小率を定め、当該定められた縮小率に基づいて前記画像データを縮小する縮小手段を更に備えることを特徴とする請求項1に記載の画像処理装置。
  5. 処理対象の画像データが多値画像であるか否かを識別する識別手段と、前記識別手段により前記画像データが多値画像であると識別された場合、該画像データを2値画像に変換する変換手段とを更に備えることを特徴とする請求項1に記載の画像処理装置。
  6. 前記判定手段において点破線でないと判定された合併領域をノイズとみなして除去する除去手段を更に備えることを特徴とする請求項1に記載の画像処理装置。
  7. 前記判別手段は、前記形成手段により形成された矩形領域のデータに基づいて、各矩形領域の領域属性を本文・表・図形または写真の領域属性のいずれかに判別し、
    前記抽出手段は、前記判別手段において本文の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出することを特徴とする請求項1に記載の画像処理装置。
  8. 画像を複数の矩形領域に分割する画像処理方法であって、
    画像データ中の1つもしくは複数の連続する黒画素を含む矩形領域を形成する形成工程と、
    前記形成工程により形成された矩形領域に関するデータに基づいて、各矩形領域の領域属性を判別する判別工程と、
    前記判別工程においてセパレータ、図形、写真、表の何れにも属さない所定の領域属性であると判別された矩形領域について、該矩形領域の幅と高さの少なくともいずれかが所定の閾値よりも小さいか否か判断し、当該所定の閾値よりも小さいと判断した矩形領域を候補領域として抽出する抽出工程と、
    前記抽出工程により抽出された候補領域から所定の距離内に他の候補領域がある場合、該候補領域と他の候補領域を合併して合併領域を生成する合併工程と、
    前記合併工程により得られた合併領域の夫々について、その合併領域の幅と高さとに基づいて、該合併領域が点破線であるか否かを判定し、当該点破線であると判定された合併領域に対して点破線の領域属性を付与する判定工程とを備えることを特徴とする画像処理方法。
JP16090194A 1994-07-13 1994-07-13 画像処理方法および装置 Expired - Lifetime JP3666903B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP16090194A JP3666903B2 (ja) 1994-07-13 1994-07-13 画像処理方法および装置
EP95304854A EP0692767B1 (en) 1994-07-13 1995-07-11 Image processing apparatus and method
DE69531882T DE69531882D1 (de) 1994-07-13 1995-07-11 Gerät und Verfahren zur Bildverarbeitung
US08/501,562 US5966455A (en) 1994-07-13 1995-07-12 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16090194A JP3666903B2 (ja) 1994-07-13 1994-07-13 画像処理方法および装置

Publications (2)

Publication Number Publication Date
JPH0830788A JPH0830788A (ja) 1996-02-02
JP3666903B2 true JP3666903B2 (ja) 2005-06-29

Family

ID=15724804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16090194A Expired - Lifetime JP3666903B2 (ja) 1994-07-13 1994-07-13 画像処理方法および装置

Country Status (1)

Country Link
JP (1) JP3666903B2 (ja)

Also Published As

Publication number Publication date
JPH0830788A (ja) 1996-02-02

Similar Documents

Publication Publication Date Title
US9965695B1 (en) Document image binarization method based on content type separation
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US5335290A (en) Segmentation of text, picture and lines of a document image
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
EP0692767B1 (en) Image processing apparatus and method
Das et al. A fast algorithm for skew detection of document images using morphology
EP2569930A2 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
EP1017011A2 (en) Block selection of table features
CN109948533B (zh) 一种文本检测方法、装置、设备及可读存储介质
JP2019016350A (ja) 電子文書における強調テキストの識別
Chen et al. Efficient text localization in born-digital images by local contrast-based segmentation
JP2004288158A (ja) 最短サイクルによる画像分割
JP3666903B2 (ja) 画像処理方法および装置
JP4390523B2 (ja) 最小領域による合成画像の分割
JP2004282701A5 (ja)
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
Loo et al. Word and sentence extraction using irregular pyramid
JPH0696275A (ja) 画像処理装置
JP2832928B2 (ja) 文字認識方法
JP3406942B2 (ja) 画像処理装置及び方法
JP2003281469A (ja) 文書画像処理方法
JP2002015283A (ja) 分離文字列統合方法および装置
JPH0830725A (ja) 画像処理装置及び方法
JPH09134404A (ja) 棒グラフ認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050405

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090415

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090415

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100415

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110415

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130415

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130415

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 9

EXPY Cancellation because of completion of term