JPH08221513A - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法

Info

Publication number
JPH08221513A
JPH08221513A JP7022899A JP2289995A JPH08221513A JP H08221513 A JPH08221513 A JP H08221513A JP 7022899 A JP7022899 A JP 7022899A JP 2289995 A JP2289995 A JP 2289995A JP H08221513 A JPH08221513 A JP H08221513A
Authority
JP
Japan
Prior art keywords
area
threshold value
luminance
image
binarization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7022899A
Other languages
English (en)
Other versions
JP3733154B2 (ja
Inventor
Osamu Yamada
修 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP02289995A priority Critical patent/JP3733154B2/ja
Priority to US08/597,871 priority patent/US5920655A/en
Priority to EP96300909A priority patent/EP0731599B1/en
Priority to DE69618262T priority patent/DE69618262T2/de
Publication of JPH08221513A publication Critical patent/JPH08221513A/ja
Application granted granted Critical
Publication of JP3733154B2 publication Critical patent/JP3733154B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 3つ以上の輝度レベル対象が存在した画像を
処理する場合においても、輝度階層別に高精度に文字認
識が可能となる画像処理装置及びその方法を提供するこ
とを目的とする。 【構成】 輝度頻度のピークが3つ以上存在する画像に
対して、まず第1の閾値TH1による2値化により第1
の輝度レベルを持つ領域Aを分割する。次に画像全体か
ら領域Aを削除し、領域Bに対して第2の閾値TH2に
よる2値化を行い、第2の輝度レベルを持つ領域Cを分
割する。そして、領域A及び領域C内の文字領域に対し
てそれぞれ文字認識処理を行うことにより、文字認識率
が向上する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理装置及びその方
法に関し、例えば、画像中の文字認識処理のための画像
領域分割処理を行なう画像処理装置及びその方法に関す
るものである。
【0002】
【従来の技術】近年の画像処理技術の進歩に伴い、文字
や写真、グラフ等が混在した画像を例えばコンピュータ
等の画像処理装置において処理することが増えてきた。
この場合の処理手順としては、まずスキャナ等の画像入
力装置で処理対象の画像を読み取り、画像処理装置に入
力する。そして、画像処理装置では入力された画像に対
して領域分割処理や光学的文字認識処理(以下、OCR
処理)等を施し、文書管理を行って、得られた画像や文
字を利用していた。尚、領域分割処理とは、画像中の文
字/写真/グラフ/表等の領域をそれぞれの特徴によっ
て分離し、各領域情報を取り出す処理である。また、O
CR処理とは、画像内の文字領域について、該文字イメ
ージを形成するビットマップを文字コードへ変換する文
字認識処理である。
【0003】次に、上述した従来の画像処理装置におけ
る文字を含んだ画像処理を図22のフローチャートに示
し、説明する。
【0004】まず、ステップS221で原稿となる画像
をスキャナ等の画像処理装置により入力する。尚、この
入力は、例えば8ビットの多値画像データとして行なわ
れる。次にステップS222において、画像入力時に発
生するスキャナの電気的ノイズの除去をはじめ、入力さ
れた原稿画像の劣化、原稿の傾き等を補正する。次いで
ステップS223で、入力画像に対して所定の固定閾値
による単純2値化を施して領域分割処理を行い、各領域
データを出力することにより、文字領域を抽出する。
尚、この時の単純2値化処理は、例えば入力画像の濃度
に応じた2値化処理であっても良い。そしてステップS
224では、抽出された文字領域に対して各領域毎にO
CR処理又は擬似中間調処理等の所望する画像処理を行
なうことにより、文字認識を行う。そして最後にステッ
プS225において、認識された文字等の処理結果を表
示する。
【0005】以上説明した様に従来の画像処理装置にお
いては、入力画像を固定閾値での単純2値化、又は原稿
画像の濃度に応じた単純2値化の後、領域分割処理を行
うことによって画像中の文書領域を抽出し、文字認識処
理を行っていた。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の画像処理装置においては、以下に示す問題点があっ
た。
【0007】例えば、原稿画像の下地が白であって、文
字が黒色、又は灰色によって描かれている場合について
考える。この場合、即ち原稿画像内に3つ以上の輝度レ
ベル対象が混在しており、このような画像に対して固定
閾値による単純2値化を施すと、灰色の文字領域につい
ては「白」として2値化される領域と、「黒」として2
値化される領域とが発生する。これら2領域は不規則に
発生するため、灰色文字のつぶれやかすれ等が発生し、
高精度の2値化結果が得られなかった。従って正確な文
字認識処理を行うことができず、特に灰色文字の認識率
が著しく低下してしまっていた。
【0008】また、原稿画像の濃度に応じた単純2値化
を行う場合においても、例えば下地も純粋に「白」では
ないため、下地を「白」、黒色文字と灰色文字を「黒」
として2値化したり、又は、下地と灰色文字を「白」、
黒色文字を「黒」として2値化してしまっていた。従っ
て、やはり灰色文字を精度良く2値化することができな
いため正確な文字認識処理を行うことができず、灰色文
字の認識率が著しく低下してしまっていた。
【0009】更に、灰色文字の文字認識ができたとして
も、黒色文字と区別して認識することはできなかった。
【0010】本発明は上述した問題点を解決するために
なされたものであり、3つ以上の輝度レベル対象が存在
した画像を処理する場合においても、輝度階層別に高精
度に文字認識が可能となる画像処理装置及びその方法を
提供することを目的とする。
【0011】
【課題を解決するための手段】上述した目的を達成する
ために、本発明は以下の構成を備える。
【0012】即ち、入力画像の輝度階層別に2値化閾値
を設定する第1の閾値設定手段と、前記第1の閾値設定
手段により設定された輝度階層別の2値化閾値により前
記入力画像を2値化して輝度階層別の第1の2値画像を
生成する第1の2値化手段と、前記輝度階層別の第1の
2値画像から所定の領域を分割する領域分割手段と、前
記輝度階層別の分割済み領域以外の領域の2値化閾値を
設定する第2の閾値設定手段と、前記第2の閾値設定手
段により設定された2値化閾値により前記輝度階層別の
分割済み領域以外の領域を2値化して輝度階層別の第2
の2値画像を生成する第2の2値化手段と、前記輝度階
層別の第2の2値画像に対して文字認識を行なう文字認
識手段とを有することを特徴とする。
【0013】更に、入力画像の輝度頻度を累計する累計
手段を有し、前記第1の閾値設定手段は、前記累計手段
による輝度頻度の累計結果により第1の2値化閾値を設
定することを特徴とする。
【0014】例えば、前記第1の閾値設定手段は、前記
累計手段による輝度頻度の累計が極小となる領域を特定
し、該領域における平均輝度を2値化閾値とすることを
特徴とする。
【0015】例えば、前記第2の閾値設定手段は、前記
輝度階層別の分割済み領域以外の領域の特徴に基づいて
2値化閾値を設定することを特徴とする。
【0016】例えば、前記第2の閾値設定手段は、前記
輝度階層別の分割済み領域以外の領域の濃度及び高さ
と、前記入力画像の解像度とに基づいて2値化閾値を設
定することを特徴とする。
【0017】例えば、前記第2の閾値設定手段は、前記
輝度階層別の分割済み領域以外の領域の黒比率が所定値
となるように2値化閾値を設定することを特徴とする。
【0018】例えば、前記第1の2値化手段は、前記入
力画像を単純2値化することを特徴とする。
【0019】
【作用】以上の構成により、輝度階層別に2値化閾値を
算出し、該輝度階層別の2値化閾値により輝度階層別の
2値画像を作成し、該輝度階層別の2値画像から黒画素
領域を分割し、該分割済み領域以外の領域の2値化閾値
を算出し、該2値化閾値により2値画像を作成し、該2
値画像に対して文字認識処理を行なうことができる。
【0020】これにより、画像中の輝度階層別の文字認
識処理を施すことができる画像処理装置及びその方法を
提供することができるという特有の作用効果が得られ
る。
【0021】
【実施例】以下、本発明に係る一実施例について、図面
を参照して詳細に説明する。
【0022】図1は、本実施例における画像処理装置を
含んだシステム構成を示すブロック図である。図1に示
す各構成における動作の詳細については、後述する。
【0023】図1において、1は本実施例における文書
管理を行なう画像処理装置であり、2は画像を入力する
スキャナ等の画像入力装置、3は処理後の画像を表示す
る画像表示装置である。
【0024】画像処理装置1において、4は画像入力装
置2とのインターフェースとなる入力部、5は処理中の
データを記憶するメモリ等の記憶部、6は入力画像の輝
度頻度(ヒストグラム)を累計する輝度頻度累計部であ
る。7は入力画像の輝度階層別の2値化閾値を算出する
2値化閾値算出部であり、8は2値化閾値算出部7にお
いて算出された閾値を用いて輝度階層別の2値画像を作
成する2値化部である。9は画像を属性毎の領域に分割
する領域分割部であり、10は領域分割により文字領域
として抽出された領域に対する文字認識処理を行う文字
認識部、11は文字領域以外に分割された領域に対する
各種画像処理を行う画像処理部、12は画像表示装置3
とのインターフェースとなる出力部である。これら各構
成は、不図示のCPUにより統括的に制御されている。
【0025】以下、画像処理装置1における画像処理を
図2のフローチャートに示し、説明する。
【0026】まずステップS21で、画像入力装置2に
より原稿となる画像を入力部4を介して画像処理装置1
に入力する。尚、この入力は8ビットの多値画像データ
として行い、入力画像は不図示の作業用メモリに展開さ
れる。そしてステップS22では、画像入力時に発生す
る画像入力装置2の電気的ノイズの除去や、原稿画像の
劣化、原稿の傾き等、入力画像に対する補正を行う。次
にステップS23に進み、輝度頻度累計部6,2値化閾
値算出部7,及び2値化部8による輝度階層別の2値化
処理と、領域分割部9による領域分割処理を行なう。ス
テップS23における輝度階層別領域分割処理の詳細に
ついては、後述する。
【0027】次にステップS24に進み、ステップS2
3における輝度階層別の領域分割結果に応じて、文字領
域に対しては文字認識部10でOCR処理を、文字領域
以外に対しては画像処理部11で誤差拡散法やディザ法
等の擬似中間調処理等の画像処理を行なう。そしてステ
ップS25に進み、輝度階層別に画像処理された各領域
を1枚の画像に合成し、合成された画像をステップS2
6で出力部12を介して画像表示装置3に表示する。
【0028】<輝度階層別領域分割処理>次に、図2の
ステップS23に示す輝度階層別領域分割処理につい
て、詳細に説明する。
【0029】本実施例においては、白地に黒色文字と灰
色文字による文字が描かれている画像を処理する場合を
例として、以下説明する。
【0030】図4に、本実施例において処理される文字
領域を含む画像の輝度頻度(ヒストグラム)の例を示
す。
【0031】図4に示すヒストグラムにおいて、横軸は
左端が「0」、右端が「255」を表す輝度値であり、
この値はデジタル値である。即ち、横軸の左端が
「黒」、右端が「白」に相当する。また、縦軸は、夫々
のデジタル値の頻度を表している。従って図4におい
て、処理対象となる画像の白地部分は高輝度であるため
右側の山に相当し、黒色文字部分は低輝度であるため左
側の山に相当し、また、灰色文字は中輝度であるため、
中央の山に相当する。
【0032】以下、本実施例における輝度階層別領域分
割処理を図3のフローチャートに示し、説明する。
【0033】まず、ステップS31で輝度階層番号を
「1」にセットする。ここで、輝度階層番号とは画像内
の輝度頻度の特徴(山の数)に基づいて設定されるもの
であり、図4に示した例の場合、黒色文字の輝度階層番
号が「1」、灰色文字の輝度階層番号が「2」、白地の
輝度階層番号が「3」である。輝度階層番号は最終的に
文字認識を行いたい輝度レベル毎に付与される。
【0034】続いてステップS32において、領域分割
の前処理として領域分割に最も適した閾値による単純2
値化を行なう。その後ステップS33において、2値化
された画像から黒画素領域を抽出して、その特徴等によ
り文字領域、写真領域、図形領域等に分割する領域分割
処理を行い、後述する領域データを出力する。そしてス
テップS34に進み、領域分割の後処理として領域誤り
を除去する。ステップS34の領域誤り除去処理につい
ては、詳細を後述する。次にステップS35では、輝度
階層番号が「1」以下であるか否かを判断する。輝度階
層番号が「1」以下である、即ち「1」であれば処理は
ステップS36へ進み、「1」以下でない、即ち「2」
以上であれば処理を終了する。
【0035】尚、ステップS35においては輝度階層番
号が「1」以下であるか否かの判定を行うが、この値は
輝度階層番号の最大値「3」から固定値「2」を減じる
ことにより設定する。これにより、本実施例は輝度階層
数の増減にも対応することができる。
【0036】ステップS36では、輝度階層番号が
「1」、即ち黒色文字として分割された黒画素領域を、
分割済み領域として入力画像から削除して記憶部5に格
納しておく。この削除を行うことにより、輝度階層番号
が「2」である領域、即ち灰色文字領域の分割処理を行
なう際に、輝度階層番号が「1」である黒色文字領域を
除いた領域のみに注目して処理することができる。そし
てステップS37では、輝度階層番号に「1」を加算
し、ステップS32の領域分割前処理へ戻る。
【0037】以上説明したように本実施例の輝度階層別
領域分割処理においては、まず輝度階層番号が「1」、
即ち黒色文字領域である場合について2値化を行い、領
域分割の後に領域誤りが除去され、該分割された黒画素
領域が削除された後に、今度は輝度階層番号が「2」、
即ち灰色文字領域である場合について2値化を行い、領
域分割、領域誤り除去が行われる。
【0038】<<領域分割前処理(2値化処理)>>次
に、図3のステップS32における領域分割前処理とし
ての2値化処理について、図5のフローチャートを参照
して詳細に説明する。ステップS32の領域分割前処理
は、輝度階層番号が「1」である場合と「2」である場
合との2回実行される。従って、それぞれに対応する2
値化閾値としてTH1,TH2をパラメータとして使用
するが、図5においてはこれをTHで一括して表記する
こととする。
【0039】まず、輝度階層番号が「1」である場合に
ついて説明する。
【0040】図5のステップS51においては、入力画
像のヒストグラムを算出する。ここでは、画像中の全画
素を用い、8ビット、即ち「0」から「255」までの
各デジタル値に対する頻度を計算する。これにより、例
えば図4に示したヒストグラムが得られる。
【0041】次にステップS52において、パラメータ
START,ENDにそれぞれ「0」、「255」をセ
ットする。START,ENDはそれぞれ、後段のステ
ップS53やステップS54で求める輝度値の統計量の
始点及び終点に対応する。
【0042】ステップS53では、STARTからEN
Dまでのデジタル値に対応する画素の平均値AVを算出
する。例えば、START=0,END=255であれ
ば「0」から「255」の値を持つ画素(この場合、全
画素)の平均値AVを算出し、START=0,END
=177であれば「0」から「177」の値を持つ画素
の平均値AVを算出する。
【0043】ステップS54では、STARTからEN
Dまでの輝度値に対応する画素のスキュー値SKを算出
する。スキュー値とは、ヒストグラム分布の偏りを示す
統計量である。スキュー値の算出には、以下に示す
(1)式を用いる。
【0044】 SK=(Σ(Xi−AV)^3)/D ・・・(1) (尚、R^3 の表記によってRの3乗を示すものとす
る。) ここで、Xiは画素の輝度値である。また、Dは画像全
体の分散値であり、(2)式により算出される。
【0045】 D=Σ(Xi−AV)^2 ・・・(2) (尚、R^2 の表記によってRの2乗を示すものとす
る。) 続いてステップS55、S56では、ヒストグラムの偏
りの方向を判断する。まずステップS55では、以下に
示す(3)式によりヒストグラムの偏りの方向を判断す
る。これは、ヒストグラムの偏りが左方向であるか否か
の判断となる。
【0046】 SK<−1.0 ・・・(3) ステップS55において(3)式が真ならばステップS
59へ進み、偽ならばステップS56へ進む。ステップ
S59では、STARTは変化させず、ENDに平均値
AVをセットする。そしてステップS53に戻り、再び
START値からEND値までの平均値AVを算出す
る。
【0047】一方、ステップS56では以下に示す
(4)式によりヒストグラムの偏りの方向を判断する。
これは、ヒストグラムの偏りが右方向であるか否かの判
断となる。
【0048】 SK>1.0 ・・・(4) ステップS56において(4)式が真ならばステップS
510へ進み、偽ならばステップS57へ進む。ステッ
プS510では、STARTに平均値AVをセットし、
ENDは変化させない。そしてステップS53に戻り、
再びSTART値からEND値までの平均値AVを算出
する。
【0049】一方、ステップS57ではステップS5
5,S56における条件が共に偽である場合の平均値A
Vを、2値化閾値TH1として設定する。そして、ステ
ップS58で2値化閾値TH1を用いた単純2値化処理
を行なう。
【0050】以上説明したようにして、本実施例では輝
度階層番号が「1」である場合の2値化処理が行われ
る。この処理により、黒色文字が描かれた領域について
の適切な2値化閾値が設定され、単純2値化処理が行わ
れる。言い換えれば、黒色文字領域において適切な2値
化が行われる。
【0051】次に、図4に示すヒストグラムの例を用い
て、上述した2値化閾値TH1の決定処理について、更
に詳細に説明する。
【0052】図6は、図4に示す様なヒストグラムを有
する画像に対して、上述した図5で示す領域分割前処理
を行った際の、各パラメータの値の変化を示す図であ
る。図6において示される各パラメータ値は、図5のフ
ローチャートにおいてステップS53及びS54を通過
する回数によって、それぞれ示されている。
【0053】まず、ステップS53及びS54を通過す
る1回目の処理では、START=0,END=255
で平均値AV,統計量SKを計算し、それぞれ「18
5」,「−102.5」という値を得る。この場合、統
計量SKが「−1.0」未満であるため、ステップS5
9においてSTART=0,END=185が設定され
る。
【0054】続いて2回目の処理ではSTART=0,
END=185における平均値AV,統計量SKを計算
し、それぞれ「98」,「−14.6」という値を得
る。これも、統計量SKが「−1.0」未満であるた
め、ステップS59においてSTART=0,END=
98が設定される。
【0055】続いて3回目の処理では、START=
0,END=98における平均値AV,統計量SKを計
算し、それぞれ「45」,「10.7」という値を得
る。この場合は、統計量SKが「1.0」を超えるた
め、ステップS510においてSTART=45,EN
D=98が設定される。
【0056】続いて4回目の処理では、START=4
5,END=98における平均値AV,統計量SKを計
算し、それぞれ「77」,「−8.2」という値を得
る。これも、統計量SKが「−1.0」未満であるた
め、ステップS59においてSTART=45,END
=77が設定される。
【0057】続いて5回目の処理では、START=4
5,END=77における平均値AV,統計量SKを計
算し、それぞれ「63」,「−3.0」という値を得
る。これも、統計量SKが「−1.0」未満であるた
め、ステップS59においてSTART=45,END
=63が設定される。
【0058】そして6回目の処理では、START=4
5,END=63における平均値AV,統計量SKを計
算し、それぞれ「54」,「−0.9」という値を得
る。ここで、統計量SKが「−1.0」以上かつ「1.
0」以下であるため、ステップS55,S56の条件を
満たさず、ステップS57へ進んで2値化閾値TH1と
して、「54」が設定される。そしてステップS58に
おいて、2値化閾値TH1を用いた単純2値化処理が行
われる。
【0059】以上説明したように、スキュー値が所定値
まで収束するように、2値化閾値を決定する。
【0060】以上、輝度階層番号が「1」である場合の
2値化処理について説明したが、次に、輝度階層番号が
「2」である中輝度文字の2値化処理について、上述し
た図5のフローチャートを参照して同様に説明する。
【0061】まずステップS51において、対象画像の
ヒストグラムを算出する。この場合、上述した図3にお
けるステップS36で、輝度階層番号が「1」である分
割済み領域(黒色文字領域)を削除し、ステップS37
で輝度階層番号を「2」にセットしてあるため、ステッ
プS51では画像中の輝度階層番号が「1」である分割
済み領域以外の画素を用いて、輝度階層番号「2」に対
応する輝度値に対する頻度を算出することができる。
【0062】その結果、ステップS51において得られ
るヒストグラムは、図7に示すような形状を呈する。
尚、図4と図7においては、縦軸のスケールは異なって
いる。そして、ステップS52からステップS58まで
の処理は上述した輝度階層番号が「1」である場合と同
様であるが、もちろん決定される2値化閾値TH2は、
上述した2値化閾値TH1とは異なっている。
【0063】以下、図7に示すヒストグラムの例を用い
て、上述した2値化閾値TH2の決定処理について、更
に詳細に説明する。
【0064】図8は、図7に示す様なヒストグラムを有
する画像に対して、上述した図5で示す領域分割前処理
を行った際の、各パラメータの値の変化を示す図であ
る。図8において示される各パラメータ値は、図5のフ
ローチャートにおいてステップS53及びS54を通過
する回数によって、それぞれ示されている。
【0065】まず、ステップS53及びS54を通過す
る1回目の処理では、START=0,END=255
で平均値AV,統計量SKを計算し、それぞれ「18
6」,「−53.4」という値を得る。この場合、統計
量SKが「−1.0」未満であるため、ステップS59
においてSTART=0,END=186が設定され
る。
【0066】続いて2回目の処理では、START=
0,END=186における平均値AV,統計量SKを
計算し、それぞれ「122」,「4.2」という値を得
る。この場合、統計量SKが「1.0」を超えるため、
ステップS510においてSTART=122,END
=186が設定される。
【0067】続いて3回目の処理では、START=1
22,END=186における平均値AV,統計量SK
を計算し、それぞれ「149」,「5.8」という値を
得る。この場合は、統計量SKが「1.0」を超えるた
め、ステップS510においてSTART=149,E
ND=186が設定される。
【0068】そして4回目の処理では、START=1
49,END=186における平均値AV,統計量SK
を計算し、それぞれ「167」,「−0.5」という値
を得る。ここで、統計量SKが「−1.0」以上かつ
「1.0」以下となるため、ステップS55,S56で
示される条件を満たさないため、ステップS57へ進ん
で2値化閾値TH2=167が設定される。そしてステ
ップS58において、2値化閾値TH2を用いて単純2
値化処理が行われる。
【0069】以上説明したようにして、輝度階層番号が
「2」である領域について2値化処理が行われる。
【0070】以上説明した、輝度階層番号が「1」であ
る場合の2値化閾値TH1と、輝度階層番号が「2」で
ある場合の2値化閾値TH2とは、図9の示すような関
係にになる。図9に示すのヒストグラムは図4のそれと
同一であり、全画素による輝度頻度を表わしている。即
ち、まず輝度階層番号が「1」について2値化閾値TH
1=54で2値化され、「黒」となる領域Aが「白」と
なる領域Bから分割される。また、輝度階層番号が
「2」について、全画素から領域Aを削除した領域、即
ち領域Bの画像が2値化閾値TH2=167で2値化さ
れ、「黒」となる領域Cが「白」となる領域Dから分割
される。
【0071】以上説明したように図9によれば、本実施
例において全画素は輝度値が「0〜54」(領域A),
「54〜167」(領域C),「167〜255」(領
域D)の3領域に分割されることが分かる。
【0072】<<領域分割処理>>次に、上述した図3
のステップS33で示した領域分割処理について、図1
0のフローチャートを参照して詳細に説明する。
【0073】まず、ステップS101において、入力部
4を介して入力した2値画像を作業用メモリに入力す
る。そしてステップS102ではm×n画素が1画素と
なるように入力画像を間引き、領域分割用の画像を生成
する。この時、m×n画素中に1つでも黒色画素が存在
していれば、該m×n画素を黒の1画素とする。
【0074】そしてステップS103では、領域分割用
画像の全画素について、黒画素が上下、左右、斜めの方
向に所定数連続している領域を一つの領域として、領域
分割を行なう。その際、領域の検出順に番号を付すこと
により、各領域に対するラベル付けを行なう。次にステ
ップS104において、各領域の幅、高さ、面積、領域
内の黒画素密度により領域を分類し、属性のラベル付け
を行なう。領域の属性としては、詳細は後述するが、
「テーブル」,「外枠領域」,「テキスト」等がある。
【0075】そしてステップS105では、「テキス
ト」とラベル付けされた全ての領域の幅と高さの平均を
算出し、得られた平均幅が平均高さより大きい場合には
処理画像は横書きの文書であるとみなし、逆の場合は縦
書きの文書であるとみなすことにより、文字組みを判断
する。同時に、横書きならば平均高さを、縦書きならば
平均幅をもって、一文字の文字サイズとする。
【0076】また、領域分割用画像上の縦方向(横書き
時)または横方向(縦書き時)の「テキスト」領域全て
のヒストグラムから、文章の段組、行間隔、が検出され
る。ステップS106では、「テキスト」領域において
文字サイズが大きい領域については、「タイトル」とす
る。そしてステップS107では、何の関連もなくばら
ばらに存在したままの「タイトル」領域、「テキスト」
領域を、周りの領域との間隔に応じて併合し、一つのま
とまった領域とする。次にステップS108において、
各領域毎に属性、原画像における座標や大きさ等の領域
データを記憶部5に出力し、記憶する。
【0077】以上の処理を行なうことにより、本実施例
では2値画像の領域分割処理を行い、各領域データが得
られる。
【0078】図11に、上述した領域データの例を示
す。図11に示す各領域データ項目について、以下説明
する。 ・「番号」:領域の検出順序を示す。 ・「属性」:領域の属性情報を示し、以下に示す8通り
が用意されている。
【0079】「ルート」 入力画像そのものである
ことを示す。
【0080】「テキスト」 文字領域であることを示
す。
【0081】「タイトル」 見出し領域であることを
示す。
【0082】「テーブル」 表領域であることを示
す。
【0083】「ノイズ」 文字領域とも画像領域と
も判断できなかった領域であることを示す。
【0084】「外枠」 罫線等の領域であること
を示す。
【0085】「写真画像」 写真領域であることを示
す。
【0086】「線画像」 線画像領域であることを
示す。 ・「始点座標」:原画像における領域開始のX,Y座標
を示す。 ・「終点座標」:原画像における領域終了のX,Y座標
を示す。 ・「画素数」:領域内の全画素数を示す。 ・「文字組情報」:縦書き,横書き,不明の3通りの文
字組情報を示す。
【0087】図11に示す領域データについて、「属
性」が「テキスト」で示される領域のみ、図10に示す
ステップS107における併合前の、行に関する領域デ
ータ(行領域データ)を階層的に保持している。
【0088】以上説明したようにして、本実施例では領
域分割処理が行われる。尚、図11に示した領域データ
は本実施例を適用した一例にすぎず、画像処理装置に応
じて例えば他の情報を適宜追加しても良いし、または減
らしても良い。
【0089】<<領域分割後処理(領域除去処理)>>
次に、図3のステップS34に示す領域分割後処理につ
いて、図12のフローチャートを参照して詳細に説明す
る。本実施例における領域分割後処理は、領域分割され
た各領域のうち、領域分割誤りの領域を除去する処理で
あり、以下、レイアウトノイズリダクション(LNR)
と称する。
【0090】まずステップS121で、領域分割後の各
領域データはルート領域であるか否かが判断される。ル
ート領域とは画像全体を囲む領域、即ち全体領域のこと
であり、ルート領域であればステップS126に進み、
LNR処理は施さない。ルート領域でなければステップ
S122に進み、テキスト領域(文字領域)であるか、
またはノイズ領域であるかが判断される。テキスト領域
またはノイズ領域である場合には処理はステップS12
3へ、いずれでもない場合はステップS125へ進む。
【0091】ステップS123では、領域の大きさに応
じて領域データが領域分割誤りとして除去されるLNR
処理1を行い、次にステップS124で、領域内の黒比
率に応じて領域データが領域分割誤りとして除去される
LNR処理3を行う。一方、ステップS125では、テ
キスト領域でなく、かつノイズ領域でもない領域データ
が、領域の大きさに応じて領域分割誤りとして除去され
るLNR処理2が行われる。尚、ステップS123,S
124,S125におけるLNR処理1,3,2につい
ては、それぞれ以下に詳述する。
【0092】そしてステップS126において、全ての
領域に対する処理が終了したか否かが判断され、終了し
ていなければステップS121へ戻り、終了していれば
LNR処理を終了する。
【0093】以上説明したようにして、本実施例におい
ては領域分割により黒画素領域として分割された領域デ
ータから、領域分割誤りとなる領域を除去する。
【0094】以下、まずステップS123に示すLNR
処理1について詳細に説明する。図13は、LNR処理
1を示すフローチャートである。まずステップS131
で、処理対象領域の領域データから高さH1,幅W1を
参照する。そして、領域の大きさの判断に用いる高さの
閾値HT1,幅の閾値WT1を算出するために、ステッ
プS132において、スキャナ等の画像入力装置2の読
み取り解像度SRと、画像中の除去しない最小文字のポ
イント数MP1をそれぞれ高さ,幅についてMP1h,
MP1wとして設定する。
【0095】本実施例において、閾値HT1,WT1は
以下に示す(5),(6)式により算出される。
【0096】 HT1=(SR/72.0)×MP1h ・・・(5) WT1=(SR/72.0)×MP1w ・・・(6) ステップS133では、(5)式により高さの閾値HT
1を算出する。例えば、画像入力装置2の解像度SRが
400dpiで、画像中の最小文字の高さポイント数M
P1hが4ポイントである場合、高さの閾値HT1は
「22」として算出される。そしてステップS134
で、領域データの高さH1とステップS133で算出し
た高さの閾値HT1との比較を行なう。領域データの高
さH1が閾値HT1より大きい場合はステップS135
へ進み、閾値HT1より小さい場合はステップS138
へ進む。
【0097】ステップS135では、(6)式により幅
の閾値WT1を算出する。続いてステップS136で、
領域データの幅W1とステップS135で算出した幅の
閾値WT1との比較を行なう。領域データの幅W1が閾
値WT1よりも大きい場合には、LNR処理1は終了す
る。一方、領域データの幅W1が閾値WT1よりも小さ
い場合はステップS137に進み、領域データの高さH
1と幅W1との比H1/W1の判断を行なう。この比が
「2」以下である場合には、LNR処理1は終了する。
一方、比が「2」を超える場合には処理中の領域が領域
分割誤りであると判断されるため、ステップS138へ
進んで、該領域が除去される。
【0098】次に、図12のステップS124に示すL
NR処理3について、図14のフローチャートを参照し
て詳細に説明する。まずステップS141において、領
域中の黒画素数BCを累計する。そしてステップS14
2で、領域中の黒比率BR1を以下に示す(7)式によ
り計算する。
【0099】 BR1=BC/(W1×H1)×100 ・・・(7) 次にステップS143において、最小黒比率BRT1
と、最大黒比率BRT2とを設定する。BRT1とBR
T2は、文字の黒比率特性により予め設定されており、
例えばBRT1=5,BRT2=52である。
【0100】ステップS144では、領域中の黒比率B
R1と、最小黒比率BRT1及び最大黒比率BRT2と
の比較を行なう。黒比率BR1が最小黒比率BRT1よ
り小さい、又は最大黒比率BRT2より大きい場合に
は、処理中の領域が領域分割誤りであると判断され、ス
テップS145に進んで該領域が除去される。その他の
場合は、LNR処理3は終了する。
【0101】次に、図12のステップS125に示すL
NR処理2について、図15のフローチャートを参照し
て詳細に説明する。まずステップS151において、処
理対象領域の領域データから高さH2,幅W2を参照す
る。そして、領域の大きさの判断に用いる高さの閾値H
T2,幅の閾値WT2を算出するために、ステップS1
52において、画像入力装置2の解像度SRを設定す
る。そして、ステップS153において、処理中の領域
の属性が外枠領域であるか否かが判断される。そして、
外枠領域であればステップS154へ、外枠領域でなけ
ればステップS157へ進む。
【0102】ステップS154においては、最小ポイン
ト数MP21をそれぞれ高さ,幅についてMP21h,
MP21wとして設定する。また、ステップS157で
も同様に、最小ポイント数MP22をそれぞれ高さ,幅
についてMP22h,MP22wとして設定する。ここ
で最小ポイント数MP21,MP22とは、LNR処理
2において外枠領域であるか否かに応じて、除去しない
領域の最小サイズを文字のポイント数により表わしたも
のである。
【0103】そして、ステップS155およびS158
においては、上述した(5),(6)式により、高さの
閾値HT21,HT22と幅の閾値WT21,WT22
を算出する。例えば、画像入力装置2の解像度SRが4
00dpiで、最小ポイント数MP22が高さ、幅共に
4ポイントである場合、各閾値HT22,WT22は
「22」として算出される。そして、ステップS156
およびS159において、それぞれ高さの閾値HT2と
幅の閾値WT2を設定する。
【0104】続いてステップS1510では、領域デー
タの高さH2と、ステップS156およびS159で設
定した高さの閾値HT2との比較、及び領域データの幅
W2と同じく幅の閾値WT2との比較を行なう。領域デ
ータの高さH2が閾値HT2より小さい、または幅W2
が閾値WT2より小さい場合、処理中の領域が領域分割
誤りであると判断され、ステップS1511において該
領域が除去される。その他の場合は、LNR処理2を終
了する。
【0105】以上説明したように本実施例のLNR処理
は、3種類の処理によって領域分割誤りと判断される領
域を除去する。
【0106】<輝度階層別画像処理>次に、上述した図
2のステップS24に示す輝度階層別画像処理につい
て、図16のフローチャートを参照して詳細に説明す
る。
【0107】まずステップS161において、上述した
図3のステップS36において入力画像から削除され、
記憶部5に格納された輝度階層番号が「1」である領域
データを読み込む。そしてステップS162では、該領
域データの属性により、文字領域であるか否かの判断を
行なう。文字領域である場合にはステップS163に進
み、詳細は後述するが、後段のOCRによる文書認識処
理に最も適した閾値で単純2値化を行う。そしてステッ
プS164でOCR処理を行なう。一方、文字領域でな
い場合には画像領域であると見なし、ステップS165
に進んで誤差拡散法やディザ法等の擬似中間調処理を行
って2値化する。
【0108】次にステップS166において、未処理の
領域が残っているかを判断し、残っている場合はステッ
プS162へ、残っていない場合はステップS167へ
進む。ステップS167では、処理中の領域データの輝
度階層番号が「1」であるか否かの判断を行い、「1」
であればステップS168へ、「1」でなければ輝度階
層別画像処理を終了する。ステップS168では、輝度
階層番号が「2」である領域データを読み込み、ステッ
プS162へ戻る。
【0109】即ち本実施例においては、輝度階層別に、
文字領域に対してそれぞれ独立して文字認識処理を行
う。
【0110】<<文字認識前処理>>次に、図16のス
テップS163で示した文字認識前処理について、図1
7のフローチャートを参照して詳細に説明する。図17
は、文字認識前処理である2値化処理の特徴を最もよく
表すフローチャートである。
【0111】まずステップS171において、文字領域
内の行領域の領域データから、高さH、幅Wを入力す
る。そしてステップS172で、スキャナ等の画像入力
装置2の解像度SRを設定する。次にステップS173
では、処理対象の行領域の8ビットの多値画像を作業用
メモリに読み込む。ステップS174では、処理対象の
行領域のヒストグラム(「0」〜「255」の各デジタ
ル値の頻度)の累計を算出する。そしてステップS17
5では、行領域の高さHと画像入力装置2の解像度SR
との関係に基づいて予め設定されている黒比率BRを読
み込む。尚、この黒比率BRについての詳細は後述する
が、上記はテキストが縦書きの場合であり、横書きの場
合には文字領域の幅Wと解像度SRとにより、BRが設
定される。
【0112】続いてステップS176では、詳細は後述
するが、BR値に基づいて2値化の閾値を設定する。そ
してステップS177において、ステップS176で設
定された閾値を用い、単純2値化を行う。そして最後に
ステップS178で未処理の行領域が残っているかを判
断し、文字領域内の行領域が全て2値化されるまで上述
した処理を繰り返す。
【0113】以下、上述した行領域の高さHと画像入力
装置2の解像度SRとの関係により予め設定される黒比
率BRについて、図18を参照して詳細に説明する。
【0114】図18に示すように、BR値は文字のポイ
ント数P毎に設定される。文字のポイント数Pは、以下
に示す(8)式により算出される。
【0115】 P=(72.0/SR)×H ・・・(8) (8)式から分かるように、行領域の高さHと解像度S
Rとによって、対象行領域の文字ポイント数Pが算出で
きるため、該ポイント数Pの文字が最も良く認識される
ような行領域の黒比率BRを実験的に求め、図18のよ
うに設定しておく。例えば行領域の高さHが「56」
で、入力時の解像度が400dpiの場合には、この行
領域の文字のポイント数Pは「10」となる。10ポイ
ントの文字は、領域内の黒比率が14%である時に、最
も文字認識率が高いという実験結果に基づいて、BR値
は「14」に設定される。
【0116】即ち、文字認識前処理は輝度階層番号が
「1」である領域と、「2」である領域についてそれぞ
れ独立して行われるため、各ヒストグラムに応じて適切
な2値化を行った後に、確実に文字認識を行うことがで
きる。
【0117】<具体例>以下、上述した本実施例におけ
る画像処理装置2において、実際にテキストを含んだ画
像を画像入力装置2から入力して、画像表示装置3に表
示する例を説明する。原稿画像として、ゴシック体で
『文字』と書かれた文字領域を抜粋して説明する。
【0118】まず、上述した原稿画像がスキャナ等の画
像入力装置2により入力されると、白に近い下地にテキ
ストが黒色文字で描かれている場合を図19の(a)に
示し、同様にテキストが灰色文字で描かれている場合を
図19の(b)に示す。ここで、行領域の高さHが「3
4」、画像入力装置2における入力時の解像度が400
dpiであるとする。すると、上述した(8)式より文
字のポイント数Pが「6」と算出されるため、図18に
よりBR値は「13」である。そして、それぞれの画像
のヒストグラムを算出すると、図20の(a),(b)
に示すようになる。これらのヒストグラムに対し、黒比
率が13%になるような閾値は、それぞれ「29」と
「123」である。これらの閾値により図19の
(a),(b)を2値化した結果が、図21の(a),
(b)となる。これにより、黒色文字,灰色文字のいず
れも適切に2値化されていることが分かる。
【0119】以上説明したように、OCRに適する2値
化のための閾値を適切に求めることにより、行領域の多
値画像が劣化することなく適切に2値化される。従っ
て、OCRによる文字認識処理における認識率を向上さ
せることができる。
【0120】以上説明したように本実施例によれば、3
つ以上の輝度レベル(白,灰色,黒)が混在した画像を
処理する場合においても、灰色文字に対しても高精度の
2値化処理が行えるため、より正確な文字認識処理を行
うことができる。
【0121】
【他の実施例】上述した実施例においては、輝度階層を
3つとして説明を行ったが、本発明はこの例に限定され
るものではなく、実際の画像に応じて輝度階層数を決定
すれば良い。
【0122】また、実施例において入力される画像は8
ビットの多値画像データとしたが、これに限定する必要
はなく、例えばカラー画像等、即ち、2値化するために
画像情報として複数ビットの情報があれば良い。
【0123】また、ヒストグラムを算出する際の画像に
おけるサンプリングについて、全画素でも、数画素おき
でもよく限定しない。さらに、平均AVや統計量SK等
の計算は、必ずしも8ビットで行う必要はなく、高速
化、メモリの削減等のため、少ないビット数で演算する
ようにしてもよい。
【0124】また、統計量であるスキュー値SKの収束
条件を±1.0としたが、これに限定されるものではな
い。スキュー値SKを用いて2値化の閾値を決定するよ
うに構成されていれば良い。
【0125】また、前記実施例において、黒比率BRの
例としてゴシック体について説明を行ったが、もちろん
他の書体についても同様に処理されることは言うまでも
ない。更には、書体によってBR値の設定を切り替える
ようにしても良い。
【0126】また、前記実施例においては、黒比率BR
を予めテーブルに設定しておき、文字領域の高さと画像
入力装置の解像度から、文字領域毎のBR値を選択する
例について説明したが、操作者が文字領域毎に好みのB
R値を定めるようにしても良い。即ち、何らかの手段に
よってBR値が決定されればよい。
【0127】更に、前記実施例では文字領域中の各行領
域毎にそれぞれ閾値を定めるとして説明したが、閾値の
設定方法はこの例に限定されるものではなく、例えば、
同一文字領域内の他の行領域の閾値を参照して、同一文
字領域内での閾値に大きな隔たりがないよう、各閾値に
制限を加えるようにしても良い。
【0128】また、更に領域データに輝度階層情報を設
けることにより、灰色文字領域と黒色文字領域とを区別
して文字認識を行うことも可能となる。
【0129】尚、本発明は、イメージスキャナ、プリン
タコントローラ、プリンタ等の複数の機器から構成され
るシステムに適用しても、カラー複写機のような1つの
機器から成る装置に適用しても良い。また、本発明は上
述のように画像処理装置にハードウェアを設けるものに
限らず、システム或は装置に磁気ディスク等の媒体に記
憶されたプログラムを供給することによって達成される
場合にも適用できることはいうまでもない。
【0130】
【発明の効果】以上説明したように本発明によれば、輝
度階層別に第1の2値化閾値を算出して2値化を行って
から領域分割を行い、その結果分割済み領域以外の領域
に対して第2の2値化閾値を算出して2値化を行い、該
2値化された文字領域に対して文字認識処理を行なうこ
とにより、3つ以上の輝度レベル対象が混在した画像を
処理する場合においても、それぞれの輝度レベルに対し
て高精度の2値化結果が得られるため、より正確な文字
認識処理を行なうことができる。従って、例えば灰色文
字の文字認識率が向上する。
【0131】更に、各領域を複数の輝度階層毎に区別す
ることができるため、灰色文字領域と黒色文字領域とを
区別して文字認識処理を行なうことも可能となる。
【0132】
【図面の簡単な説明】
【図1】本発明に係る一実施例における画像処理装置の
システム構成を示すブロック図である。
【図2】本実施例における文字を含んだ画像処理を示す
フローチャートである。
【図3】本実施例における輝度階層別領域分割処理を示
すフローチャートである。
【図4】本実施例における原稿画像のヒストグラムの例
を示す図である。
【図5】本実施例における領域分割前処理を示すフロー
チャートである。
【図6】本実施例の領域分割前処理における各変数値の
例を示す図である。
【図7】本実施例における原稿画像の輝度階層番号が
「2」である領域のヒストグラムの例を示す図である。
【図8】本実施例の領域分割前処理における各変数値の
例を示す図である。
【図9】本実施例における領域分割前処理における輝度
階層毎の2値化結果を示す図である。
【図10】本実施例における領域分割処理を示すフロー
チャートである。
【図11】本実施例における領域分割処理により得られ
る領域データ例を示す図である。
【図12】本実施例における領域分割後処理を示すフロ
ーチャートである。
【図13】本実施例における領域の大きさによる領域除
去処理1を示すフローチャートである。
【図14】本実施例における黒比率による領域除去処理
2を示すフローチャートである。
【図15】本実施例における領域の大きさによる領域除
去処理3を示すフローチャートである。
【図16】本実施例における輝度階層別画像処理を示す
フローチャートである。
【図17】本実施例における文字認識前処理を示すフロ
ーチャートである。
【図18】本実施例における黒比率を設定するテーブル
例を示す図である。
【図19】本実施例における入力多値画像の例を示す図
である。
【図20】本実施例における入力多値画像のヒストグラ
ム例を示す図である。
【図21】本実施例における入力多値画像を2値化した
画像例を示す図である。
【図22】従来の画像処理装置における文字を含んだ画
像処理を示すフローチャートである。
【符号の説明】
1 画像処理装置 2 画像入力装置 3 画像表示装置 4 入力部 5 記憶部 6 輝度頻度累計部 7 2値化閾値算出部 8 2値化部 9 領域分割部 10 文字認識部 11 画像処理部 12 出力部

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 入力画像の輝度階層別に2値化閾値を設
    定する第1の閾値設定手段と、 前記第1の閾値設定手段により設定された輝度階層別の
    2値化閾値により前記入力画像を2値化して輝度階層別
    の第1の2値画像を生成する第1の2値化手段と、 前記輝度階層別の第1の2値画像から所定の領域を分割
    する領域分割手段と、 前記輝度階層別の分割済み領域以外の領域の2値化閾値
    を設定する第2の閾値設定手段と、 前記第2の閾値設定手段により設定された2値化閾値に
    より前記輝度階層別の分割済み領域以外の領域を2値化
    して輝度階層別の第2の2値画像を生成する第2の2値
    化手段と、 前記輝度階層別の第2の2値画像に対して文字認識を行
    なう文字認識手段とを有することを特徴とする画像処理
    装置。
  2. 【請求項2】 更に、入力画像の輝度頻度を累計する累
    計手段を有し、 前記第1の閾値設定手段は、前記累計手段による輝度頻
    度の累計結果により第1の2値化閾値を設定することを
    特徴とする請求項1記載の画像処理装置。
  3. 【請求項3】 前記第1の閾値設定手段は、前記累計手
    段による輝度頻度の累計が極小となる領域を特定し、該
    領域における平均輝度を2値化閾値とすることを特徴と
    する請求項2記載の画像処理装置。
  4. 【請求項4】 前記第2の閾値設定手段は、前記輝度階
    層別の分割済み領域以外の領域の特徴に基づいて2値化
    閾値を設定することを特徴とする請求項1記載の画像処
    理装置。
  5. 【請求項5】 前記第2の閾値設定手段は、前記輝度階
    層別の分割済み領域以外の領域の濃度及び高さと、前記
    入力画像の解像度とに基づいて2値化閾値を設定するこ
    とを特徴とする請求項4記載の画像処理装置。
  6. 【請求項6】 前記第2の閾値設定手段は、前記輝度階
    層別の分割済み領域以外の領域の黒比率が所定値となる
    ように2値化閾値を設定することを特徴とする請求項4
    記載の画像処理装置。
  7. 【請求項7】 前記第1の2値化手段は、前記入力画像
    を単純2値化することを特徴とする請求項1記載の画像
    処理装置。
  8. 【請求項8】 入力画像の輝度階層別に2値化閾値を設
    定する第1の閾値設定工程と、 前記第1の閾値設定工程により設定された輝度階層別の
    2値化閾値により前記入力画像を2値化して輝度階層別
    の第1の2値画像を生成する第1の2値化工程と、 前記輝度階層別の第1の2値画像から所定の領域を分割
    する領域分割工程と、 前記輝度階層別の分割済み領域以外の領域の2値化閾値
    を設定する第2の閾値設定工程と、 前記第2の閾値設定工程により設定された2値化閾値に
    より前記輝度階層別の分割済み領域以外の領域を2値化
    して輝度階層別の第2の2値画像を生成する第2の2値
    化工程と、 前記輝度階層別の第2の2値画像に対して文字認識を行
    なう文字認識工程とを有することを特徴とする画像処理
    方法。
  9. 【請求項9】 更に、入力画像の輝度頻度を累計する累
    計工程を有し、 前記第1の閾値設定工程は、前記累計工程による輝度頻
    度の累計結果により第1の2値化閾値を設定することを
    特徴とする請求項8記載の画像処理方法。
  10. 【請求項10】 前記第1の閾値設定工程は、前記累計
    工程による輝度頻度の累計が極小となる領域を特定し、
    該領域における平均輝度を2値化閾値とすることを特徴
    とする請求項9記載の画像処理方法。
  11. 【請求項11】 前記第2の閾値設定工程は、前記輝度
    階層別の分割済み領域以外の領域の特徴に基づいて2値
    化閾値を設定することを特徴とする請求項8記載の画像
    処理方法。
  12. 【請求項12】 前記第2の閾値設定工程は、前記輝度
    階層別の分割済み領域以外の領域の濃度及び高さと、前
    記入力画像の解像度とに基づいて2値化閾値を設定する
    ことを特徴とする請求項11記載の画像処理方法。
  13. 【請求項13】 前記第2の閾値設定工程は、前記輝度
    階層別の分割済み領域以外の領域の黒比率が所定値とな
    るように2値化閾値を設定することを特徴とする請求項
    11記載の画像処理方法。
  14. 【請求項14】 前記黒比率は、前記輝度階層別の分割
    済み領域以外の領域内の黒画素密度であり、該領域の高
    さ、該領域の解像度、該領域内の文字フォントの種類に
    応じて変化することを特徴とする請求項13記載の画像
    処理方法。
  15. 【請求項15】 前記輝度階層別の分割済み領域以外の
    領域の高さは該領域内の文字の大きさであることを特徴
    とする請求項14記載の画像処理方法。
  16. 【請求項16】 前記第2の閾値設定工程は、前記第2
    の閾値を前記輝度階層別の分割済み領域以外の領域の行
    領域単位に設定することを特徴とする請求項8記載の画
    像処理方法。
  17. 【請求項17】 前記第2の閾値設定工程は、前記第2
    の閾値を前記輝度階層別の分割済み領域以外の領域の他
    の行における閾値により制限することを特徴とする請求
    項16記載の画像処理方法。
  18. 【請求項18】 前記領域分割工程は、前記第1の2値
    画像から所定の領域を分割し、その画像特徴に基づいて
    領域を抽出することを特徴とする請求項8記載の画像処
    理方法。
  19. 【請求項19】 前記第1の2値化工程は、前記入力画
    像を単純2値化することを特徴とする請求項8記載の画
    像処理方法。
  20. 【請求項20】 第1の入力画像の2値化閾値を設定す
    る第1の閾値設定工程と、 前記第1の閾値設定工程により設定された2値化閾値に
    より前記第1の入力画像を2値化して第1の2値画像を
    生成する第1の2値化工程と、 前記第1の2値画像から所定の黒画素領域を分割して文
    字領域を抽出する第1の領域分割工程と、 前記第1の入力画像から前記第1の領域分割工程により
    分割された黒画素領域を削除して第2の入力画像を生成
    する第2画像生成工程と、 前記第2の入力画像の2値化閾値を設定する第2の閾値
    設定工程と、 前記第2の閾値設定工程により設定された2値化閾値に
    より前記第2の入力画像を2値化して第2の2値画像を
    生成する第2の2値化工程と、 前記第2の2値画像から黒画素領域を分割して文字領域
    を抽出する第2の領域分割工程と、 前記第1の領域分割工程により抽出された文字領域と、
    前記第2の領域分割工程により抽出された文字領域に対
    して文字認識を行う文字認識工程とを有することを特徴
    とする画像処理方法。
  21. 【請求項21】 更に、前記第1の入力画像の輝度頻度
    を累計する第1の累計工程と、 前記第2の入力画像の輝度頻度を累計する第2の累計工
    程とを有し、 前記第1の閾値設定工程は、前記第1の累計工程による
    輝度頻度の累計結果により第1の2値化閾値を設定し、 前記第2の閾値設定工程は、前記第2の累計工程による
    輝度頻度の累計結果により第2の2値化閾値を設定する
    ことを特徴とする請求項20記載の画像処理方法。
  22. 【請求項22】 更に、前記第1の領域分割工程により
    分割された黒画素領域から領域分割誤りを除去する第1
    の除去工程と、 前記第2の領域分割工程により分割された黒画素領域か
    ら領域分割誤りを除去する第2の除去工程とを有し、 前記文字認識工程は、前記第1の除去工程により領域分
    割誤りを除去した文字領域と、前記第2の除去工程によ
    り領域分割誤りを除去した文字領域に対して文字認識を
    行うことを特徴とする請求項20記載の画像処理方法。
  23. 【請求項23】 前記第1の2値化工程及び前記第2の
    2値化工程は、単純2値化を行うことを特徴とする請求
    項20記載の画像処理方法。
JP02289995A 1995-02-10 1995-02-10 画像処理装置及びその方法 Expired - Fee Related JP3733154B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP02289995A JP3733154B2 (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法
US08/597,871 US5920655A (en) 1995-02-10 1996-02-07 Binarization image processing for multi-level image data
EP96300909A EP0731599B1 (en) 1995-02-10 1996-02-09 Image processing apparatus and method therefor
DE69618262T DE69618262T2 (de) 1995-02-10 1996-02-09 Bilderverarbeitungsgerät und -verfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02289995A JP3733154B2 (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH08221513A true JPH08221513A (ja) 1996-08-30
JP3733154B2 JP3733154B2 (ja) 2006-01-11

Family

ID=12095503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02289995A Expired - Fee Related JP3733154B2 (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3733154B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197305A (ja) * 2000-01-05 2001-07-19 Toshiba Corp 画像処理装置および画像処理方法
WO2017010351A1 (ja) * 2015-07-10 2017-01-19 楽天株式会社 画像処理装置、画像処理方法、及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197305A (ja) * 2000-01-05 2001-07-19 Toshiba Corp 画像処理装置および画像処理方法
WO2017010351A1 (ja) * 2015-07-10 2017-01-19 楽天株式会社 画像処理装置、画像処理方法、及びプログラム
WO2017009910A1 (ja) * 2015-07-10 2017-01-19 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
JPWO2017009910A1 (ja) * 2015-07-10 2017-07-13 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
JPWO2017010351A1 (ja) * 2015-07-10 2018-03-08 楽天株式会社 画像処理装置、画像処理方法、及びプログラム
US10572759B2 (en) 2015-07-10 2020-02-25 Rakuten, Inc. Image processing device, image processing method, and program

Also Published As

Publication number Publication date
JP3733154B2 (ja) 2006-01-11

Similar Documents

Publication Publication Date Title
KR100512831B1 (ko) 이미지 처리 방법, 장치 및 프로그램 저장 매체
JP5008572B2 (ja) 画像処理方法、画像処理装置およびコンピュータ可読媒体
US5920655A (en) Binarization image processing for multi-level image data
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US8385643B2 (en) Determination of inputted image to be document or non-document
JPH02105978A (ja) 自動文書セグメンテーションのためのシステム及び方法
JP5337563B2 (ja) 帳票認識方法および装置
US6813367B1 (en) Method and apparatus for site selection for data embedding
US6269186B1 (en) Image processing apparatus and method
JPH11213160A (ja) 画像処理方法及び装置及びその記憶媒体
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3733154B2 (ja) 画像処理装置及びその方法
JPH08221512A (ja) 画像処理装置及びその方法
JP3733155B2 (ja) 画像処理装置及びその方法
JPH08223409A (ja) 画像処理装置およびその方法
JP2786355B2 (ja) 文章画像の属性判別方法
JP2001222717A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JPH09233326A (ja) 画像処理装置及びその方法及びそのコンピュータプログラム製品
JPH08221565A (ja) 画像処理装置及びその方法
JP2881066B2 (ja) 文章画像の属性判別方法
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP3025365B2 (ja) 画像の二値化処理装置
JPH08221511A (ja) 画像処理装置及びその方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051017

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121021

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131021

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees