JP3733154B2 - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法 Download PDF

Info

Publication number
JP3733154B2
JP3733154B2 JP02289995A JP2289995A JP3733154B2 JP 3733154 B2 JP3733154 B2 JP 3733154B2 JP 02289995 A JP02289995 A JP 02289995A JP 2289995 A JP2289995 A JP 2289995A JP 3733154 B2 JP3733154 B2 JP 3733154B2
Authority
JP
Japan
Prior art keywords
character
area
image
region
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02289995A
Other languages
English (en)
Other versions
JPH08221513A (ja
Inventor
修 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP02289995A priority Critical patent/JP3733154B2/ja
Priority to US08/597,871 priority patent/US5920655A/en
Priority to DE69618262T priority patent/DE69618262T2/de
Priority to EP96300909A priority patent/EP0731599B1/en
Publication of JPH08221513A publication Critical patent/JPH08221513A/ja
Application granted granted Critical
Publication of JP3733154B2 publication Critical patent/JP3733154B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【産業上の利用分野】
本発明は画像処理装置及びその方法に関し、例えば、画像中の文字認識処理のための画像領域分割処理を行なう画像処理装置及びその方法に関するものである。
【0002】
【従来の技術】
近年の画像処理技術の進歩に伴い、文字や写真、グラフ等が混在した画像を例えばコンピュータ等の画像処理装置において処理することが増えてきた。この場合の処理手順としては、まずスキャナ等の画像入力装置で処理対象の画像を読み取り、画像処理装置に入力する。そして、画像処理装置では入力された画像に対して領域分割処理や光学的文字認識処理(以下、OCR処理)等を施し、文書管理を行って、得られた画像や文字を利用していた。尚、領域分割処理とは、画像中の文字/写真/グラフ/表等の領域をそれぞれの特徴によって分離し、各領域情報を取り出す処理である。また、OCR処理とは、画像内の文字領域について、該文字イメージを形成するビットマップを文字コードへ変換する文字認識処理である。
【0003】
次に、上述した従来の画像処理装置における文字を含んだ画像処理を図22のフローチャートに示し、説明する。
【0004】
まず、ステップS221で原稿となる画像をスキャナ等の画像処理装置により入力する。尚、この入力は、例えば8ビットの多値画像データとして行なわれる。次にステップS222において、画像入力時に発生するスキャナの電気的ノイズの除去をはじめ、入力された原稿画像の劣化、原稿の傾き等を補正する。次いでステップS223で、入力画像に対して所定の固定閾値による単純2値化を施して領域分割処理を行い、各領域データを出力することにより、文字領域を抽出する。尚、この時の単純2値化処理は、例えば入力画像の濃度に応じた2値化処理であっても良い。そしてステップS224では、抽出された文字領域に対して各領域毎にOCR処理又は擬似中間調処理等の所望する画像処理を行なうことにより、文字認識を行う。そして最後にステップS225において、認識された文字等の処理結果を表示する。
【0005】
以上説明した様に従来の画像処理装置においては、入力画像を固定閾値での単純2値化、又は原稿画像の濃度に応じた単純2値化の後、領域分割処理を行うことによって画像中の文書領域を抽出し、文字認識処理を行っていた。
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来の画像処理装置においては、以下に示す問題点があった。
【0007】
例えば、原稿画像の下地が白であって、文字が黒色、又は灰色によって描かれている場合について考える。この場合、即ち原稿画像内に3つ以上の輝度レベル対象が混在しており、このような画像に対して固定閾値による単純2値化を施すと、灰色の文字領域については「白」として2値化される領域と、「黒」として2値化される領域とが発生する。これら2領域は不規則に発生するため、灰色文字のつぶれやかすれ等が発生し、高精度の2値化結果が得られなかった。従って正確な文字認識処理を行うことができず、特に灰色文字の認識率が著しく低下してしまっていた。
【0008】
また、原稿画像の濃度に応じた単純2値化を行う場合においても、例えば下地も純粋に「白」ではないため、下地を「白」、黒色文字と灰色文字を「黒」として2値化したり、又は、下地と灰色文字を「白」、黒色文字を「黒」として2値化してしまっていた。従って、やはり灰色文字を精度良く2値化することができないため正確な文字認識処理を行うことができず、灰色文字の認識率が著しく低下してしまっていた。
【0009】
更に、灰色文字の文字認識ができたとしても、黒色文字と区別して認識することはできなかった。
【0010】
本発明は上述した問題点を解決するためになされたものであり、3つ以上の輝度レベル対象が存在した画像を処理する場合においても、輝度階層別に高精度に文字認識が可能となる画像処理装置及びその方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
上述した目的を達成するために、本発明は以下の構成を備える。
【0012】
即ち、本発明の一側面に係る画像処理装置は、第1入力画像のヒストグラムを算出するヒストグラム算出手段と、前記ヒストグラムの分布の偏りを示す統計量が所定の範囲内に収まるように2値化閾値を設定する第1の閾値設定手段と、前記第1の閾値設定手段により設定された2値化閾値により前記第1入力画像を2値化して第1の2値画像を生成する第1の2値化手段と、前記第1の2値化手段で生成された第1の2値画像に基づいて領域を分割する領域分割手段と、前記分割された領域を前記第1入力画像から削除することによって第2入力画像を生成し、当該生成された第2入力画像を前記第1入力画像の代わりに用いて前記ヒストグラム算出手段と前記閾値設定手段と前記領域分割手段とによる処理を繰り返すことによって、輝度階層別に分割された領域を取得する繰り返し手段と、前記輝度階層別に分割された領域の中から文字領域を判別し、当該判別された文字領域に対して文字認識を行なう文字認識手段とを有することを特徴とする。
【0019】
【作用】
以上の構成により、輝度階層別に2値化閾値を算出し、該輝度階層別の2値化閾値により輝度階層別の2値画像を作成し、該輝度階層別の2値画像から黒画素領域を分割し、該分割済み領域以外の領域の2値化閾値を算出し、該2値化閾値により2値画像を作成し、該2値画像に対して文字認識処理を行なうことができる。
【0020】
これにより、画像中の輝度階層別の文字認識処理を施すことができる画像処理装置及びその方法を提供することができるという特有の作用効果が得られる。
【0021】
【実施例】
以下、本発明に係る一実施例について、図面を参照して詳細に説明する。
【0022】
図1は、本実施例における画像処理装置を含んだシステム構成を示すブロック図である。図1に示す各構成における動作の詳細については、後述する。
【0023】
図1において、1は本実施例における文書管理を行なう画像処理装置であり、2は画像を入力するスキャナ等の画像入力装置、3は処理後の画像を表示する画像表示装置である。
【0024】
画像処理装置1において、4は画像入力装置2とのインターフェースとなる入力部、5は処理中のデータを記憶するメモリ等の記憶部、6は入力画像の輝度頻度(ヒストグラム)を累計する輝度頻度累計部である。7は入力画像の輝度階層別の2値化閾値を算出する2値化閾値算出部であり、8は2値化閾値算出部7において算出された閾値を用いて輝度階層別の2値画像を作成する2値化部である。9は画像を属性毎の領域に分割する領域分割部であり、10は領域分割により文字領域として抽出された領域に対する文字認識処理を行う文字認識部、11は文字領域以外に分割された領域に対する各種画像処理を行う画像処理部、12は画像表示装置3とのインターフェースとなる出力部である。これら各構成は、不図示のCPUにより統括的に制御されている。
【0025】
以下、画像処理装置1における画像処理を図2のフローチャートに示し、説明する。
【0026】
まずステップS21で、画像入力装置2により原稿となる画像を入力部4を介して画像処理装置1に入力する。尚、この入力は8ビットの多値画像データとして行い、入力画像は不図示の作業用メモリに展開される。そしてステップS22では、画像入力時に発生する画像入力装置2の電気的ノイズの除去や、原稿画像の劣化、原稿の傾き等、入力画像に対する補正を行う。次にステップS23に進み、輝度頻度累計部6,2値化閾値算出部7,及び2値化部8による輝度階層別の2値化処理と、領域分割部9による領域分割処理を行なう。ステップS23における輝度階層別領域分割処理の詳細については、後述する。
【0027】
次にステップS24に進み、ステップS23における輝度階層別の領域分割結果に応じて、文字領域に対しては文字認識部10でOCR処理を、文字領域以外に対しては画像処理部11で誤差拡散法やディザ法等の擬似中間調処理等の画像処理を行なう。そしてステップS25に進み、輝度階層別に画像処理された各領域を1枚の画像に合成し、合成された画像をステップS26で出力部12を介して画像表示装置3に表示する。
【0028】
<輝度階層別領域分割処理>
次に、図2のステップS23に示す輝度階層別領域分割処理について、詳細に説明する。
【0029】
本実施例においては、白地に黒色文字と灰色文字による文字が描かれている画像を処理する場合を例として、以下説明する。
【0030】
図4に、本実施例において処理される文字領域を含む画像の輝度頻度(ヒストグラム)の例を示す。
【0031】
図4に示すヒストグラムにおいて、横軸は左端が「0」、右端が「255」を表す輝度値であり、この値はデジタル値である。即ち、横軸の左端が「黒」、右端が「白」に相当する。また、縦軸は、夫々のデジタル値の頻度を表している。従って図4において、処理対象となる画像の白地部分は高輝度であるため右側の山に相当し、黒色文字部分は低輝度であるため左側の山に相当し、また、灰色文字は中輝度であるため、中央の山に相当する。
【0032】
以下、本実施例における輝度階層別領域分割処理を図3のフローチャートに示し、説明する。
【0033】
まず、ステップS31で輝度階層番号を「1」にセットする。ここで、輝度階層番号とは画像内の輝度頻度の特徴(山の数)に基づいて設定されるものであり、図4に示した例の場合、黒色文字の輝度階層番号が「1」、灰色文字の輝度階層番号が「2」、白地の輝度階層番号が「3」である。輝度階層番号は最終的に文字認識を行いたい輝度レベル毎に付与される。
【0034】
続いてステップS32において、領域分割の前処理として領域分割に最も適した閾値による単純2値化を行なう。その後ステップS33において、2値化された画像から黒画素領域を抽出して、その特徴等により文字領域、写真領域、図形領域等に分割する領域分割処理を行い、後述する領域データを出力する。そしてステップS34に進み、領域分割の後処理として領域誤りを除去する。ステップS34の領域誤り除去処理については、詳細を後述する。次にステップS35では、輝度階層番号が「1」以下であるか否かを判断する。輝度階層番号が「1」以下である、即ち「1」であれば処理はステップS36へ進み、「1」以下でない、即ち「2」以上であれば処理を終了する。
【0035】
尚、ステップS35においては輝度階層番号が「1」以下であるか否かの判定を行うが、この値は輝度階層番号の最大値「3」から固定値「2」を減じることにより設定する。これにより、本実施例は輝度階層数の増減にも対応することができる。
【0036】
ステップS36では、輝度階層番号が「1」、即ち黒色文字として分割された黒画素領域を、分割済み領域として入力画像から削除して記憶部5に格納しておく。この削除を行うことにより、輝度階層番号が「2」である領域、即ち灰色文字領域の分割処理を行なう際に、輝度階層番号が「1」である黒色文字領域を除いた領域のみに注目して処理することができる。そしてステップS37では、輝度階層番号に「1」を加算し、ステップS32の領域分割前処理へ戻る。
【0037】
以上説明したように本実施例の輝度階層別領域分割処理においては、まず輝度階層番号が「1」、即ち黒色文字領域である場合について2値化を行い、領域分割の後に領域誤りが除去され、該分割された黒画素領域が削除された後に、今度は輝度階層番号が「2」、即ち灰色文字領域である場合について2値化を行い、領域分割、領域誤り除去が行われる。
【0038】
<<領域分割前処理(2値化処理)>>
次に、図3のステップS32における領域分割前処理としての2値化処理について、図5のフローチャートを参照して詳細に説明する。ステップS32の領域分割前処理は、輝度階層番号が「1」である場合と「2」である場合との2回実行される。従って、それぞれに対応する2値化閾値としてTH1,TH2をパラメータとして使用するが、図5においてはこれをTHで一括して表記することとする。
【0039】
まず、輝度階層番号が「1」である場合について説明する。
【0040】
図5のステップS51においては、入力画像のヒストグラムを算出する。ここでは、画像中の全画素を用い、8ビット、即ち「0」から「255」までの各デジタル値に対する頻度を計算する。これにより、例えば図4に示したヒストグラムが得られる。
【0041】
次にステップS52において、パラメータSTART,ENDにそれぞれ「0」、「255」をセットする。START,ENDはそれぞれ、後段のステップS53やステップS54で求める輝度値の統計量の始点及び終点に対応する。
【0042】
ステップS53では、STARTからENDまでのデジタル値に対応する画素の平均値AVを算出する。例えば、START=0,END=255であれば「0」から「255」の値を持つ画素(この場合、全画素)の平均値AVを算出し、START=0,END=177であれば「0」から「177」の値を持つ画素の平均値AVを算出する。
【0043】
ステップS54では、STARTからENDまでの輝度値に対応する画素のスキュー値SKを算出する。スキュー値とは、ヒストグラム分布の偏りを示す統計量である。スキュー値の算出には、以下に示す(1)式を用いる。
【0044】
SK=(Σ(Xi−AV)^3)/D ・・・(1)
(尚、R^3 の表記によってRの3乗を示すものとする。)
ここで、Xiは画素の輝度値である。また、Dは画像全体の分散値であり、(2)式により算出される。
【0045】
D=Σ(Xi−AV)^2 ・・・(2)
(尚、R^2 の表記によってRの2乗を示すものとする。)
続いてステップS55、S56では、ヒストグラムの偏りの方向を判断する。まずステップS55では、以下に示す(3)式によりヒストグラムの偏りの方向を判断する。これは、ヒストグラムの偏りが左方向であるか否かの判断となる。
【0046】
SK<−1.0 ・・・(3)
ステップS55において(3)式が真ならばステップS59へ進み、偽ならばステップS56へ進む。ステップS59では、STARTは変化させず、ENDに平均値AVをセットする。そしてステップS53に戻り、再びSTART値からEND値までの平均値AVを算出する。
【0047】
一方、ステップS56では以下に示す(4)式によりヒストグラムの偏りの方向を判断する。これは、ヒストグラムの偏りが右方向であるか否かの判断となる。
【0048】
SK>1.0 ・・・(4)
ステップS56において(4)式が真ならばステップS510へ進み、偽ならばステップS57へ進む。ステップS510では、STARTに平均値AVをセットし、ENDは変化させない。そしてステップS53に戻り、再びSTART値からEND値までの平均値AVを算出する。
【0049】
一方、ステップS57ではステップS55,S56における条件が共に偽である場合の平均値AVを、2値化閾値TH1として設定する。そして、ステップS58で2値化閾値TH1を用いた単純2値化処理を行なう。
【0050】
以上説明したようにして、本実施例では輝度階層番号が「1」である場合の2値化処理が行われる。この処理により、黒色文字が描かれた領域についての適切な2値化閾値が設定され、単純2値化処理が行われる。言い換えれば、黒色文字領域において適切な2値化が行われる。
【0051】
次に、図4に示すヒストグラムの例を用いて、上述した2値化閾値TH1の決定処理について、更に詳細に説明する。
【0052】
図6は、図4に示す様なヒストグラムを有する画像に対して、上述した図5で示す領域分割前処理を行った際の、各パラメータの値の変化を示す図である。図6において示される各パラメータ値は、図5のフローチャートにおいてステップS53及びS54を通過する回数によって、それぞれ示されている。
【0053】
まず、ステップS53及びS54を通過する1回目の処理では、START=0,END=255で平均値AV,統計量SKを計算し、それぞれ「185」,「−102.5」という値を得る。この場合、統計量SKが「−1.0」未満であるため、ステップS59においてSTART=0,END=185が設定される。
【0054】
続いて2回目の処理ではSTART=0,END=185における平均値AV,統計量SKを計算し、それぞれ「98」,「−14.6」という値を得る。これも、統計量SKが「−1.0」未満であるため、ステップS59においてSTART=0,END=98が設定される。
【0055】
続いて3回目の処理では、START=0,END=98における平均値AV,統計量SKを計算し、それぞれ「45」,「10.7」という値を得る。この場合は、統計量SKが「1.0」を超えるため、ステップS510においてSTART=45,END=98が設定される。
【0056】
続いて4回目の処理では、START=45,END=98における平均値AV,統計量SKを計算し、それぞれ「77」,「−8.2」という値を得る。これも、統計量SKが「−1.0」未満であるため、ステップS59においてSTART=45,END=77が設定される。
【0057】
続いて5回目の処理では、START=45,END=77における平均値AV,統計量SKを計算し、それぞれ「63」,「−3.0」という値を得る。これも、統計量SKが「−1.0」未満であるため、ステップS59においてSTART=45,END=63が設定される。
【0058】
そして6回目の処理では、START=45,END=63における平均値AV,統計量SKを計算し、それぞれ「54」,「−0.9」という値を得る。ここで、統計量SKが「−1.0」以上かつ「1.0」以下であるため、ステップS55,S56の条件を満たさず、ステップS57へ進んで2値化閾値TH1として、「54」が設定される。そしてステップS58において、2値化閾値TH1を用いた単純2値化処理が行われる。
【0059】
以上説明したように、スキュー値が所定値まで収束するように、2値化閾値を決定する。
【0060】
以上、輝度階層番号が「1」である場合の2値化処理について説明したが、次に、輝度階層番号が「2」である中輝度文字の2値化処理について、上述した図5のフローチャートを参照して同様に説明する。
【0061】
まずステップS51において、対象画像のヒストグラムを算出する。この場合、上述した図3におけるステップS36で、輝度階層番号が「1」である分割済み領域(黒色文字領域)を削除し、ステップS37で輝度階層番号を「2」にセットしてあるため、ステップS51では画像中の輝度階層番号が「1」である分割済み領域以外の画素を用いて、輝度階層番号「2」に対応する輝度値に対する頻度を算出することができる。
【0062】
その結果、ステップS51において得られるヒストグラムは、図7に示すような形状を呈する。尚、図4と図7においては、縦軸のスケールは異なっている。そして、ステップS52からステップS58までの処理は上述した輝度階層番号が「1」である場合と同様であるが、もちろん決定される2値化閾値TH2は、上述した2値化閾値TH1とは異なっている。
【0063】
以下、図7に示すヒストグラムの例を用いて、上述した2値化閾値TH2の決定処理について、更に詳細に説明する。
【0064】
図8は、図7に示す様なヒストグラムを有する画像に対して、上述した図5で示す領域分割前処理を行った際の、各パラメータの値の変化を示す図である。図8において示される各パラメータ値は、図5のフローチャートにおいてステップS53及びS54を通過する回数によって、それぞれ示されている。
【0065】
まず、ステップS53及びS54を通過する1回目の処理では、START=0,END=255で平均値AV,統計量SKを計算し、それぞれ「186」,「−53.4」という値を得る。この場合、統計量SKが「−1.0」未満であるため、ステップS59においてSTART=0,END=186が設定される。
【0066】
続いて2回目の処理では、START=0,END=186における平均値AV,統計量SKを計算し、それぞれ「122」,「4.2」という値を得る。この場合、統計量SKが「1.0」を超えるため、ステップS510においてSTART=122,END=186が設定される。
【0067】
続いて3回目の処理では、START=122,END=186における平均値AV,統計量SKを計算し、それぞれ「149」,「5.8」という値を得る。この場合は、統計量SKが「1.0」を超えるため、ステップS510においてSTART=149,END=186が設定される。
【0068】
そして4回目の処理では、START=149,END=186における平均値AV,統計量SKを計算し、それぞれ「167」,「−0.5」という値を得る。ここで、統計量SKが「−1.0」以上かつ「1.0」以下となるため、ステップS55,S56で示される条件を満たさないため、ステップS57へ進んで2値化閾値TH2=167が設定される。そしてステップS58において、2値化閾値TH2を用いて単純2値化処理が行われる。
【0069】
以上説明したようにして、輝度階層番号が「2」である領域について2値化処理が行われる。
【0070】
以上説明した、輝度階層番号が「1」である場合の2値化閾値TH1と、輝度階層番号が「2」である場合の2値化閾値TH2とは、図9の示すような関係にになる。図9に示すのヒストグラムは図4のそれと同一であり、全画素による輝度頻度を表わしている。即ち、まず輝度階層番号が「1」について2値化閾値TH1=54で2値化され、「黒」となる領域Aが「白」となる領域Bから分割される。また、輝度階層番号が「2」について、全画素から領域Aを削除した領域、即ち領域Bの画像が2値化閾値TH2=167で2値化され、「黒」となる領域Cが「白」となる領域Dから分割される。
【0071】
以上説明したように図9によれば、本実施例において全画素は輝度値が「0〜54」(領域A),「54〜167」(領域C),「167〜255」(領域D)の3領域に分割されることが分かる。
【0072】
<<領域分割処理>>
次に、上述した図3のステップS33で示した領域分割処理について、図10のフローチャートを参照して詳細に説明する。
【0073】
まず、ステップS101において、入力部4を介して入力した2値画像を作業用メモリに入力する。そしてステップS102ではm×n画素が1画素となるように入力画像を間引き、領域分割用の画像を生成する。この時、m×n画素中に1つでも黒色画素が存在していれば、該m×n画素を黒の1画素とする。
【0074】
そしてステップS103では、領域分割用画像の全画素について、黒画素が上下、左右、斜めの方向に所定数連続している領域を一つの領域として、領域分割を行なう。その際、領域の検出順に番号を付すことにより、各領域に対するラベル付けを行なう。次にステップS104において、各領域の幅、高さ、面積、領域内の黒画素密度により領域を分類し、属性のラベル付けを行なう。領域の属性としては、詳細は後述するが、「テーブル」,「外枠領域」,「テキスト」等がある。
【0075】
そしてステップS105では、「テキスト」とラベル付けされた全ての領域の幅と高さの平均を算出し、得られた平均幅が平均高さより大きい場合には処理画像は横書きの文書であるとみなし、逆の場合は縦書きの文書であるとみなすことにより、文字組みを判断する。同時に、横書きならば平均高さを、縦書きならば平均幅をもって、一文字の文字サイズとする。
【0076】
また、領域分割用画像上の縦方向(横書き時)または横方向(縦書き時)の「テキスト」領域全てのヒストグラムから、文章の段組、行間隔、が検出される。ステップS106では、「テキスト」領域において文字サイズが大きい領域については、「タイトル」とする。そしてステップS107では、何の関連もなくばらばらに存在したままの「タイトル」領域、「テキスト」領域を、周りの領域との間隔に応じて併合し、一つのまとまった領域とする。次にステップS108において、各領域毎に属性、原画像における座標や大きさ等の領域データを記憶部5に出力し、記憶する。
【0077】
以上の処理を行なうことにより、本実施例では2値画像の領域分割処理を行い、各領域データが得られる。
【0078】
図11に、上述した領域データの例を示す。図11に示す各領域データ項目について、以下説明する。
・「番号」:領域の検出順序を示す。
・「属性」:領域の属性情報を示し、以下に示す8通りが用意されている。
【0079】
「ルート」 入力画像そのものであることを示す。
【0080】
「テキスト」 文字領域であることを示す。
【0081】
「タイトル」 見出し領域であることを示す。
【0082】
「テーブル」 表領域であることを示す。
【0083】
「ノイズ」 文字領域とも画像領域とも判断できなかった領域であることを示す。
【0084】
「外枠」 罫線等の領域であることを示す。
【0085】
「写真画像」 写真領域であることを示す。
【0086】
「線画像」 線画像領域であることを示す。
・「始点座標」:原画像における領域開始のX,Y座標を示す。
・「終点座標」:原画像における領域終了のX,Y座標を示す。
・「画素数」:領域内の全画素数を示す。
・「文字組情報」:縦書き,横書き,不明の3通りの文字組情報を示す。
【0087】
図11に示す領域データについて、「属性」が「テキスト」で示される領域のみ、図10に示すステップS107における併合前の、行に関する領域データ(行領域データ)を階層的に保持している。
【0088】
以上説明したようにして、本実施例では領域分割処理が行われる。尚、図11に示した領域データは本実施例を適用した一例にすぎず、画像処理装置に応じて例えば他の情報を適宜追加しても良いし、または減らしても良い。
【0089】
<<領域分割後処理(領域除去処理)>>
次に、図3のステップS34に示す領域分割後処理について、図12のフローチャートを参照して詳細に説明する。本実施例における領域分割後処理は、領域分割された各領域のうち、領域分割誤りの領域を除去する処理であり、以下、レイアウトノイズリダクション(LNR)と称する。
【0090】
まずステップS121で、領域分割後の各領域データはルート領域であるか否かが判断される。ルート領域とは画像全体を囲む領域、即ち全体領域のことであり、ルート領域であればステップS126に進み、LNR処理は施さない。ルート領域でなければステップS122に進み、テキスト領域(文字領域)であるか、またはノイズ領域であるかが判断される。テキスト領域またはノイズ領域である場合には処理はステップS123へ、いずれでもない場合はステップS125へ進む。
【0091】
ステップS123では、領域の大きさに応じて領域データが領域分割誤りとして除去されるLNR処理1を行い、次にステップS124で、領域内の黒比率に応じて領域データが領域分割誤りとして除去されるLNR処理3を行う。一方、ステップS125では、テキスト領域でなく、かつノイズ領域でもない領域データが、領域の大きさに応じて領域分割誤りとして除去されるLNR処理2が行われる。尚、ステップS123,S124,S125におけるLNR処理1,3,2については、それぞれ以下に詳述する。
【0092】
そしてステップS126において、全ての領域に対する処理が終了したか否かが判断され、終了していなければステップS121へ戻り、終了していればLNR処理を終了する。
【0093】
以上説明したようにして、本実施例においては領域分割により黒画素領域として分割された領域データから、領域分割誤りとなる領域を除去する。
【0094】
以下、まずステップS123に示すLNR処理1について詳細に説明する。図13は、LNR処理1を示すフローチャートである。まずステップS131で、処理対象領域の領域データから高さH1,幅W1を参照する。そして、領域の大きさの判断に用いる高さの閾値HT1,幅の閾値WT1を算出するために、ステップS132において、スキャナ等の画像入力装置2の読み取り解像度SRと、画像中の除去しない最小文字のポイント数MP1をそれぞれ高さ,幅についてMP1h,MP1wとして設定する。
【0095】
本実施例において、閾値HT1,WT1は以下に示す(5),(6)式により算出される。
【0096】
HT1=(SR/72.0)×MP1h ・・・(5)
WT1=(SR/72.0)×MP1w ・・・(6)
ステップS133では、(5)式により高さの閾値HT1を算出する。例えば、画像入力装置2の解像度SRが400dpiで、画像中の最小文字の高さポイント数MP1hが4ポイントである場合、高さの閾値HT1は「22」として算出される。そしてステップS134で、領域データの高さH1とステップS133で算出した高さの閾値HT1との比較を行なう。領域データの高さH1が閾値HT1より大きい場合はステップS135へ進み、閾値HT1より小さい場合はステップS138へ進む。
【0097】
ステップS135では、(6)式により幅の閾値WT1を算出する。続いてステップS136で、領域データの幅W1とステップS135で算出した幅の閾値WT1との比較を行なう。領域データの幅W1が閾値WT1よりも大きい場合には、LNR処理1は終了する。一方、領域データの幅W1が閾値WT1よりも小さい場合はステップS137に進み、領域データの高さH1と幅W1との比H1/W1の判断を行なう。この比が「2」以下である場合には、LNR処理1は終了する。一方、比が「2」を超える場合には処理中の領域が領域分割誤りであると判断されるため、ステップS138へ進んで、該領域が除去される。
【0098】
次に、図12のステップS124に示すLNR処理3について、図14のフローチャートを参照して詳細に説明する。まずステップS141において、領域中の黒画素数BCを累計する。そしてステップS142で、領域中の黒比率BR1を以下に示す(7)式により計算する。
【0099】
BR1=BC/(W1×H1)×100 ・・・(7)
次にステップS143において、最小黒比率BRT1と、最大黒比率BRT2とを設定する。BRT1とBRT2は、文字の黒比率特性により予め設定されており、例えばBRT1=5,BRT2=52である。
【0100】
ステップS144では、領域中の黒比率BR1と、最小黒比率BRT1及び最大黒比率BRT2との比較を行なう。黒比率BR1が最小黒比率BRT1より小さい、又は最大黒比率BRT2より大きい場合には、処理中の領域が領域分割誤りであると判断され、ステップS145に進んで該領域が除去される。その他の場合は、LNR処理3は終了する。
【0101】
次に、図12のステップS125に示すLNR処理2について、図15のフローチャートを参照して詳細に説明する。まずステップS151において、処理対象領域の領域データから高さH2,幅W2を参照する。そして、領域の大きさの判断に用いる高さの閾値HT2,幅の閾値WT2を算出するために、ステップS152において、画像入力装置2の解像度SRを設定する。そして、ステップS153において、処理中の領域の属性が外枠領域であるか否かが判断される。そして、外枠領域であればステップS154へ、外枠領域でなければステップS157へ進む。
【0102】
ステップS154においては、最小ポイント数MP21をそれぞれ高さ,幅についてMP21h,MP21wとして設定する。また、ステップS157でも同様に、最小ポイント数MP22をそれぞれ高さ,幅についてMP22h,MP22wとして設定する。ここで最小ポイント数MP21,MP22とは、LNR処理2において外枠領域であるか否かに応じて、除去しない領域の最小サイズを文字のポイント数により表わしたものである。
【0103】
そして、ステップS155およびS158においては、上述した(5),(6)式により、高さの閾値HT21,HT22と幅の閾値WT21,WT22を算出する。例えば、画像入力装置2の解像度SRが400dpiで、最小ポイント数MP22が高さ、幅共に4ポイントである場合、各閾値HT22,WT22は「22」として算出される。そして、ステップS156およびS159において、それぞれ高さの閾値HT2と幅の閾値WT2を設定する。
【0104】
続いてステップS1510では、領域データの高さH2と、ステップS156およびS159で設定した高さの閾値HT2との比較、及び領域データの幅W2と同じく幅の閾値WT2との比較を行なう。領域データの高さH2が閾値HT2より小さい、または幅W2が閾値WT2より小さい場合、処理中の領域が領域分割誤りであると判断され、ステップS1511において該領域が除去される。その他の場合は、LNR処理2を終了する。
【0105】
以上説明したように本実施例のLNR処理は、3種類の処理によって領域分割誤りと判断される領域を除去する。
【0106】
<輝度階層別画像処理>
次に、上述した図2のステップS24に示す輝度階層別画像処理について、図16のフローチャートを参照して詳細に説明する。
【0107】
まずステップS161において、上述した図3のステップS36において入力画像から削除され、記憶部5に格納された輝度階層番号が「1」である領域データを読み込む。そしてステップS162では、該領域データの属性により、文字領域であるか否かの判断を行なう。文字領域である場合にはステップS163に進み、詳細は後述するが、後段のOCRによる文書認識処理に最も適した閾値で単純2値化を行う。そしてステップS164でOCR処理を行なう。一方、文字領域でない場合には画像領域であると見なし、ステップS165に進んで誤差拡散法やディザ法等の擬似中間調処理を行って2値化する。
【0108】
次にステップS166において、未処理の領域が残っているかを判断し、残っている場合はステップS162へ、残っていない場合はステップS167へ進む。ステップS167では、処理中の領域データの輝度階層番号が「1」であるか否かの判断を行い、「1」であればステップS168へ、「1」でなければ輝度階層別画像処理を終了する。ステップS168では、輝度階層番号が「2」である領域データを読み込み、ステップS162へ戻る。
【0109】
即ち本実施例においては、輝度階層別に、文字領域に対してそれぞれ独立して文字認識処理を行う。
【0110】
<<文字認識前処理>>
次に、図16のステップS163で示した文字認識前処理について、図17のフローチャートを参照して詳細に説明する。図17は、文字認識前処理である2値化処理の特徴を最もよく表すフローチャートである。
【0111】
まずステップS171において、文字領域内の行領域の領域データから、高さH、幅Wを入力する。そしてステップS172で、スキャナ等の画像入力装置2の解像度SRを設定する。次にステップS173では、処理対象の行領域の8ビットの多値画像を作業用メモリに読み込む。ステップS174では、処理対象の行領域のヒストグラム(「0」〜「255」の各デジタル値の頻度)の累計を算出する。そしてステップS175では、行領域の高さHと画像入力装置2の解像度SRとの関係に基づいて予め設定されている黒比率BRを読み込む。尚、この黒比率BRについての詳細は後述するが、上記はテキストが縦書きの場合であり、横書きの場合には文字領域の幅Wと解像度SRとにより、BRが設定される。
【0112】
続いてステップS176では、詳細は後述するが、BR値に基づいて2値化の閾値を設定する。そしてステップS177において、ステップS176で設定された閾値を用い、単純2値化を行う。そして最後にステップS178で未処理の行領域が残っているかを判断し、文字領域内の行領域が全て2値化されるまで上述した処理を繰り返す。
【0113】
以下、上述した行領域の高さHと画像入力装置2の解像度SRとの関係により予め設定される黒比率BRについて、図18を参照して詳細に説明する。
【0114】
図18に示すように、BR値は文字のポイント数P毎に設定される。文字のポイント数Pは、以下に示す(8)式により算出される。
【0115】
P=(72.0/SR)×H ・・・(8)
(8)式から分かるように、行領域の高さHと解像度SRとによって、対象行領域の文字ポイント数Pが算出できるため、該ポイント数Pの文字が最も良く認識されるような行領域の黒比率BRを実験的に求め、図18のように設定しておく。例えば行領域の高さHが「56」で、入力時の解像度が400dpiの場合には、この行領域の文字のポイント数Pは「10」となる。10ポイントの文字は、領域内の黒比率が14%である時に、最も文字認識率が高いという実験結果に基づいて、BR値は「14」に設定される。
【0116】
即ち、文字認識前処理は輝度階層番号が「1」である領域と、「2」である領域についてそれぞれ独立して行われるため、各ヒストグラムに応じて適切な2値化を行った後に、確実に文字認識を行うことができる。
【0117】
<具体例>
以下、上述した本実施例における画像処理装置2において、実際にテキストを含んだ画像を画像入力装置2から入力して、画像表示装置3に表示する例を説明する。原稿画像として、ゴシック体で『文字』と書かれた文字領域を抜粋して説明する。
【0118】
まず、上述した原稿画像がスキャナ等の画像入力装置2により入力されると、白に近い下地にテキストが黒色文字で描かれている場合を図19の(a)に示し、同様にテキストが灰色文字で描かれている場合を図19の(b)に示す。ここで、行領域の高さHが「34」、画像入力装置2における入力時の解像度が400dpiであるとする。すると、上述した(8)式より文字のポイント数Pが「6」と算出されるため、図18によりBR値は「13」である。そして、それぞれの画像のヒストグラムを算出すると、図20の(a),(b)に示すようになる。これらのヒストグラムに対し、黒比率が13%になるような閾値は、それぞれ「29」と「123」である。これらの閾値により図19の(a),(b)を2値化した結果が、図21の(a),(b)となる。これにより、黒色文字,灰色文字のいずれも適切に2値化されていることが分かる。
【0119】
以上説明したように、OCRに適する2値化のための閾値を適切に求めることにより、行領域の多値画像が劣化することなく適切に2値化される。従って、OCRによる文字認識処理における認識率を向上させることができる。
【0120】
以上説明したように本実施例によれば、3つ以上の輝度レベル(白,灰色,黒)が混在した画像を処理する場合においても、灰色文字に対しても高精度の2値化処理が行えるため、より正確な文字認識処理を行うことができる。
【0121】
【他の実施例】
上述した実施例においては、輝度階層を3つとして説明を行ったが、本発明はこの例に限定されるものではなく、実際の画像に応じて輝度階層数を決定すれば良い。
【0122】
また、実施例において入力される画像は8ビットの多値画像データとしたが、これに限定する必要はなく、例えばカラー画像等、即ち、2値化するために画像情報として複数ビットの情報があれば良い。
【0123】
また、ヒストグラムを算出する際の画像におけるサンプリングについて、全画素でも、数画素おきでもよく限定しない。さらに、平均AVや統計量SK等の計算は、必ずしも8ビットで行う必要はなく、高速化、メモリの削減等のため、少ないビット数で演算するようにしてもよい。
【0124】
また、統計量であるスキュー値SKの収束条件を±1.0としたが、これに限定されるものではない。スキュー値SKを用いて2値化の閾値を決定するように構成されていれば良い。
【0125】
また、前記実施例において、黒比率BRの例としてゴシック体について説明を行ったが、もちろん他の書体についても同様に処理されることは言うまでもない。更には、書体によってBR値の設定を切り替えるようにしても良い。
【0126】
また、前記実施例においては、黒比率BRを予めテーブルに設定しておき、文字領域の高さと画像入力装置の解像度から、文字領域毎のBR値を選択する例について説明したが、操作者が文字領域毎に好みのBR値を定めるようにしても良い。即ち、何らかの手段によってBR値が決定されればよい。
【0127】
更に、前記実施例では文字領域中の各行領域毎にそれぞれ閾値を定めるとして説明したが、閾値の設定方法はこの例に限定されるものではなく、例えば、同一文字領域内の他の行領域の閾値を参照して、同一文字領域内での閾値に大きな隔たりがないよう、各閾値に制限を加えるようにしても良い。
【0128】
また、更に領域データに輝度階層情報を設けることにより、灰色文字領域と黒色文字領域とを区別して文字認識を行うことも可能となる。
【0129】
尚、本発明は、イメージスキャナ、プリンタコントローラ、プリンタ等の複数の機器から構成されるシステムに適用しても、カラー複写機のような1つの機器から成る装置に適用しても良い。また、本発明は上述のように画像処理装置にハードウェアを設けるものに限らず、システム或は装置に磁気ディスク等の媒体に記憶されたプログラムを供給することによって達成される場合にも適用できることはいうまでもない。
【0130】
【発明の効果】
以上説明したように本発明によれば、輝度階層別に第1の2値化閾値を算出して2値化を行ってから領域分割を行い、その結果分割済み領域以外の領域に対して第2の2値化閾値を算出して2値化を行い、該2値化された文字領域に対して文字認識処理を行なうことにより、3つ以上の輝度レベル対象が混在した画像を処理する場合においても、それぞれの輝度レベルに対して高精度の2値化結果が得られるため、より正確な文字認識処理を行なうことができる。従って、例えば灰色文字の文字認識率が向上する。
【0131】
更に、各領域を複数の輝度階層毎に区別することができるため、灰色文字領域と黒色文字領域とを区別して文字認識処理を行なうことも可能となる。
【0132】
【図面の簡単な説明】
【図1】本発明に係る一実施例における画像処理装置のシステム構成を示すブロック図である。
【図2】本実施例における文字を含んだ画像処理を示すフローチャートである。
【図3】本実施例における輝度階層別領域分割処理を示すフローチャートである。
【図4】本実施例における原稿画像のヒストグラムの例を示す図である。
【図5】本実施例における領域分割前処理を示すフローチャートである。
【図6】本実施例の領域分割前処理における各変数値の例を示す図である。
【図7】本実施例における原稿画像の輝度階層番号が「2」である領域のヒストグラムの例を示す図である。
【図8】本実施例の領域分割前処理における各変数値の例を示す図である。
【図9】本実施例における領域分割前処理における輝度階層毎の2値化結果を示す図である。
【図10】本実施例における領域分割処理を示すフローチャートである。
【図11】本実施例における領域分割処理により得られる領域データ例を示す図である。
【図12】本実施例における領域分割後処理を示すフローチャートである。
【図13】本実施例における領域の大きさによる領域除去処理1を示すフローチャートである。
【図14】本実施例における黒比率による領域除去処理2を示すフローチャートである。
【図15】本実施例における領域の大きさによる領域除去処理3を示すフローチャートである。
【図16】本実施例における輝度階層別画像処理を示すフローチャートである。
【図17】本実施例における文字認識前処理を示すフローチャートである。
【図18】本実施例における黒比率を設定するテーブル例を示す図である。
【図19】本実施例における入力多値画像の例を示す図である。
【図20】本実施例における入力多値画像のヒストグラム例を示す図である。
【図21】本実施例における入力多値画像を2値化した画像例を示す図である。
【図22】従来の画像処理装置における文字を含んだ画像処理を示すフローチャートである。
【符号の説明】
1 画像処理装置
2 画像入力装置
3 画像表示装置
4 入力部
5 記憶部
6 輝度頻度累計部
7 2値化閾値算出部
8 2値化部
9 領域分割部
10 文字認識部
11 画像処理部
12 出力部

Claims (15)

  1. 第1入力画像のヒストグラムを算出するヒストグラム算出手段と、
    前記ヒストグラムの分布の偏りを示す統計量が所定の範囲内に収まるように2値化閾値を設定する第1の閾値設定手段と、
    前記第1の閾値設定手段により設定された2値化閾値により前記第1入力画像を2値化して第1の2値画像を生成する第1の2値化手段と、
    前記第1の2値化手段で生成された第1の2値画像に基づいて領域を分割する領域分割手段と、
    前記分割された領域を前記第1入力画像から削除することによって第2入力画像を生成し、当該生成された第2入力画像を前記第1入力画像の代わりに用いて前記ヒストグラム算出手段と前記第1の閾値設定手段と前記領域分割手段とによる処理を繰り返すことによって、輝度階層別に分割された領域を取得する繰り返し手段と、
    前記輝度階層別に分割された領域の中から文字領域を判別し、当該判別された文字領域に対して文字認識を行なう文字認識手段と
    を有することを特徴とする画像処理装置。
  2. 記第1の閾値設定手段は、前記統計量計算の始点(START)及び終点(END)間において、前記ヒストグラムの平均値(AV)を算出し、当該算出された平均値(AV)と各画素の輝度値とに基づいて前記ヒストグラムの分布の偏りを示す統計量を算出し、当該算出された統計量が前記所定の範囲内に収まるか判断して、収まると判断した場合、当該平均値(AV)を前記2値化閾値として設定し、一方、収まらないと判断した場合は、当該平均値(AV)を用いて前記統計量計算の始点(START)及び終点(END)を設定し直して該統計量の計算を繰り返すことを特徴とする請求項1記載の画像処理装置。
  3. 前記始点(START)の初期値を0、前記終点(END)の初期値を255とすることを特徴とする請求項2記載の画像処理装置。
  4. 前記文字認識手段は、前記判別された文字領域内の特徴に基づいて2値化閾値を設定する第2の閾値設定手段を含み、前記第2の閾値設定手段で設定された2値化閾値に基づいて当該文字領域を2値化した後、前記文字認識を行なうことを特徴とする請求項1記載の画像処理装置。
  5. 前記第2の閾値設定手段は、前記文字領域内に含まれる文字行領域の濃度及び高さと、前記第1入力画像の解像度とに基づいて当該2値化閾値を設定することを特徴とする請求項4記載の画像処理装置。
  6. 前記第2の閾値設定手段は、前記文字領域内に含まれる文字行領域の黒比率が所定値となるように2値化閾値を設定することを特徴とする請求項4記載の画像処理装置。
  7. 前記第1の2値化手段は、前記設定された2値化閾値を用いて単純2値化することにより、前記第1の2値画像を生成することを特徴とする請求項1記載の画像処理装置。
  8. 第1入力画像のヒストグラムを算出するヒストグラム算出工程と、
    前記ヒストグラムの分布の偏りを示す統計量が所定の範囲内に収まるように2値化閾値を設定する第1の閾値設定工程と、
    前記第1の閾値設定工程により設定された2値化閾値により前記第1入力画像を2値化して第1の2値画像を生成する第1の2値化工程と、
    前記第1の2値化工程で生成された第1の2値画像に基づいて領域を分割する領域分割工程と、
    前記分割された領域を前記第1入力画像から削除することによって第2入力画像を生成し、当該生成された第2入力画像を前記第1入力画像の代わりに用いて前記ヒストグラム算出工程と前記第1の閾値設定工程と前記領域分割工程とによる処理を繰り返すことによって、輝度階層別に分割された領域を取得する繰り返し工程と、
    前記輝度階層別に分割された領域の中から文字領域を判別し、当該判別された文字領域に対して文字認識を行なう文字認識工程と
    を有することを特徴とする画像処理方法。
  9. 記第1の閾値設定工程は、前記統計量計算の始点(START)及び終点(END)間において、前記ヒストグラムの平均値(AV)を算出し、当該算出された平均値(AV)と各画素の輝度値とに基づいて前記ヒストグラムの分布の偏りを示す統計量を算出し、当該算出された統計量が前記所定の範囲内に収まるか判断して、収まると判断した場合、当該平均値(AV)を前記2値化閾値として設定し、一方、収まらないと判断した場合は、当該平均値(AV)を用いて前記統計量計算の始点(START)及び終点(END)を設定し直して該統計量の計算を繰り返すことを特徴とする請求項8記載の画像処理方法。
  10. 前記始点(START)の初期値を0、前記終点(END)の初期値を255とすることを特徴とする請求項9記載の画像処理方法。
  11. 前記文字認識工程では、前記判別された文字領域内の特徴に基づいて2値化閾値を設定する第2の閾値設定工程を含み、前記第2の閾値設定工程で設定された2値化閾値に基づいて当該文字領域を2値化した後、前記文字認識を行なうことを特徴とする請求項8記載の画像処理方法。
  12. 前記第2の閾値設定工程は、文字領域内に含まれる文字行領域の濃度及び高さと、前記第1入力画像の解像度とに基づいて当該2値化閾値を設定することを特徴とする請求項11記載の画像処理方法。
  13. 前記第2の閾値設定工程は、前記文字領域内に含まれる文字行領域の黒比率が所定値となるように2値化閾値を設定することを特徴とする請求項11記載の画像処理方法。
  14. 前記黒比率は、前記文字領域内に含まれる文字行領域内の黒画素密度であり、該領域の高さ、該領域の解像度、該領域内の文字フォントの種類に応じて変化することを特徴とする請求項13記載の画像処理方法。
  15. 前記文字行領域の高さは該領域内の文字の大きさであることを特徴とする請求項14記載の画像処理方法。
JP02289995A 1995-02-10 1995-02-10 画像処理装置及びその方法 Expired - Fee Related JP3733154B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP02289995A JP3733154B2 (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法
US08/597,871 US5920655A (en) 1995-02-10 1996-02-07 Binarization image processing for multi-level image data
DE69618262T DE69618262T2 (de) 1995-02-10 1996-02-09 Bilderverarbeitungsgerät und -verfahren
EP96300909A EP0731599B1 (en) 1995-02-10 1996-02-09 Image processing apparatus and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02289995A JP3733154B2 (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH08221513A JPH08221513A (ja) 1996-08-30
JP3733154B2 true JP3733154B2 (ja) 2006-01-11

Family

ID=12095503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02289995A Expired - Fee Related JP3733154B2 (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3733154B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3917341B2 (ja) * 2000-01-05 2007-05-23 株式会社東芝 画像処理装置
JPWO2017009910A1 (ja) * 2015-07-10 2017-07-13 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム

Also Published As

Publication number Publication date
JPH08221513A (ja) 1996-08-30

Similar Documents

Publication Publication Date Title
JP4219542B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
KR100512831B1 (ko) 이미지 처리 방법, 장치 및 프로그램 저장 매체
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
EP0731599B1 (en) Image processing apparatus and method therefor
US8385643B2 (en) Determination of inputted image to be document or non-document
US6813367B1 (en) Method and apparatus for site selection for data embedding
US8705134B2 (en) Method of processing an image to clarify text in the image
JPH09270917A (ja) 画像処理装置
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3733154B2 (ja) 画像処理装置及びその方法
JP3733155B2 (ja) 画像処理装置及びその方法
JPH08221512A (ja) 画像処理装置及びその方法
US11100355B1 (en) Document image content protection in the context of noise reduction
JP2001222683A (ja) 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体
JP2004110606A (ja) 画像処理装置及び方法並びにプログラム
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JP7402931B2 (ja) 方法、コンピュータ可読プログラムおよびシステム
Kurilin et al. Generation of PDF with vector symbols from scanned document
JP6701773B2 (ja) 罫線削除装置、罫線削除方法、および罫線削除プログラム
JP3103387B2 (ja) 濃淡画像の適応2値化方法
JPH08221565A (ja) 画像処理装置及びその方法
JP3025365B2 (ja) 画像の二値化処理装置
CN117392013A (zh) 暗角消除方法、装置、设备及计算机可读存储介质
JPH09167228A (ja) 画像変換方法及び装置、並びに、それらを利用した画像整形方法及び装置、並びに、それらを利用したシステム
KR100408521B1 (ko) 영상 데이터베이스로부터의 질의 객체 추출방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051017

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121021

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131021

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees