JPH08221512A - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法

Info

Publication number
JPH08221512A
JPH08221512A JP7022896A JP2289695A JPH08221512A JP H08221512 A JPH08221512 A JP H08221512A JP 7022896 A JP7022896 A JP 7022896A JP 2289695 A JP2289695 A JP 2289695A JP H08221512 A JPH08221512 A JP H08221512A
Authority
JP
Japan
Prior art keywords
area
image
image processing
character
binarization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7022896A
Other languages
English (en)
Inventor
Osamu Yamada
修 山田
Takeshi Makita
剛 蒔田
Hiroshi Mori
浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7022896A priority Critical patent/JPH08221512A/ja
Publication of JPH08221512A publication Critical patent/JPH08221512A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 原稿画像の濃度によらずOCRによる文字認
識率が向上するように、OCRの前処理として原稿画像
を2値化する画像処理装置及びその方法を提供すること
を目的とする。 【構成】 ステップS1で多値入力画像の文字領域にお
ける文字サイズを入力し、ステップS2で解像度を入力
し、ステップS4で輝度頻度を求める。ステップS5で
文字サイズ及び解像度より最適な黒比率BRを決定し、
ステップS6で該黒比率を満たすように前記輝度頻度に
より2値化閾値を設定する。ステップS7において該文
字領域に対して該閾値による単純2値化を施す。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理装置及びその方
法に関し、例えば、多値画像を2値化して文字認識を行
う画像処理装置及びその方法に関する。
【0002】
【従来の技術】近年の画像処理技術の進歩に伴い、例え
ば図17に示すように、文字や写真、グラフ等が混在し
た画像を、例えばコンピュータ等の画像処理装置におい
て処理することが増えてきた。この場合の処理手順とし
ては、まずスキャナ等の画像入力装置で処理対象の画像
を読み取り、画像処理装置に入力する。そして、画像処
理装置では入力された画像に対して領域分割処理(以
下、BS処理)や光学的文字認識処理(以下、OCR処
理)等を施し、文書管理を行って、得られた画像や文字
を利用していた。尚、BS処理とは、画像中の文字/写
真/グラフ/表等の領域をそれぞれの特徴によって分離
し、各領域情報を取り出す処理である。また、OCR処
理とは、画像内の文字領域について、該文字イメージを
形成するビットマップを文字コードへ変換する文字認識
処理である。
【0003】次に、上述した従来の画像処理装置におけ
る文字を含んだ画像処理を図18のフローチャートに示
し、説明する。
【0004】まず、ステップS171で原稿となる画像
をスキャナ等の画像処理装置により入力する。尚、この
入力は、例えば8ビットの多値画像データとして行なわ
れる。次にステップS172において、画像入力時に発
生するスキャナの電気的ノイズの除去をはじめ、入力さ
れた原稿画像の劣化、原稿の傾き等を補正する。次いで
ステップS173で、上述したBS処理の前処理とし
て、入力画像に対して所定の固定閾値による単純2値
化、又は、原稿濃度に応じて決定された閾値による単純
2値化を行う。そしてステップS174で上述したBS
処理を行い、入力画像をその特徴によってそれぞれ分離
し、各領域情報を領域データとして出力する。次にステ
ップS175において、BS処理の結果分離された各領
域毎に、その領域データにより当該領域が文字領域であ
るか否かの判断を行う。文字領域の場合ステップS17
6に進み、該領域に対してOCR処理を行って、ステッ
プS177へ進む。一方、文字領域でない場合には、O
CR処理を行わずにステップS177へ進む。そしてス
テップS177において、未処理の領域が残っているか
否かを判断をし、残っている場合はステップS175へ
戻って処理を継続し、残っていなければ全体のOCR処
理を終了する。
【0005】以上説明した様に従来の画像処理装置にお
いては、入力画像を固定閾値での単純2値化、又は原稿
画像の濃度に応じた単純2値化の後、BS処理を行うこ
とによって画像中の文字領域を抽出し、文字認識処理を
行っていた。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の画像処理装置においては、以下に示す問題点があっ
た。
【0007】例えば濃度等の状態が異なる原稿画像をス
キャナ等で読み取った後、固定閾値で単純2値化を施す
と、高濃度の原稿の文字はつぶれ、低濃度の原稿の文字
はかすれてしまっていた。従って、このような原稿に対
しては正確なOCR処理が行なえず、文字認識率が著し
く低下してしまっていた。
【0008】また、閾値を原稿画像の濃度に応じて設定
して2値化を行う場合においても、その閾値は単に画像
濃度の濃淡に応じて設定されるため、文字のかすれや、
つぶれとは無関係に閾値が設定される。従って、適切な
閾値を設定することができないため正確なOCR処理が
行なえず、文字認識率が著しく低下してしまっていた。
【0009】更には、原稿画像中の文字の大きさ(ポイ
ント数)が異なる文字に対して、固定閾値で2値化を施
すと、文字の大きさによってはつぶれやかすれ等が生じ
てしまっていた。従って文字情報が失われてしまうため
正確なOCR処理が行なえず、文字認識率が著しく低下
してしまっていた。
【0010】本発明は上述した問題を解決するためにな
されたものであり、原稿画像の濃度によらずOCRによ
る文字認識率が向上するように、OCRの前処理として
原稿画像を2値化する画像処理装置及びその方法を提供
することを目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、本発明は以下の構成を備える。
【0012】即ち、入力画像から所定の領域を分離する
分離手段と、前記分離手段により分離された所定の領域
の濃度及び高さと、前記入力画像の解像度とに基づいて
2値化閾値を設定する閾値設定手段と、前記分離手段に
より分離された所定の領域を前記閾値設定手段により設
定された閾値で2値化する2値化手段とを有することを
特徴とする。
【0013】更に、前記2値化手段により2値化された
領域に対して文字認識を行う文字認識手段を有すること
を特徴とする。
【0014】例えば、前記閾値設定手段は、前記分離手
段により分離された所定の領域の輝度頻度ヒストグラム
を算出し、該領域の黒比率が所定値となるように2値化
閾値を設定することを特徴とする。
【0015】例えば、前記黒比率は、前記所定領域内の
黒画素密度であることを特徴とする。
【0016】例えば、前記黒比率の所定値は、前記分離
手段により分離された所定の領域の高さ、解像度、該領
域内のフォント種別に応じて変化することを特徴とす
る。
【0017】例えば、前記分離手段は、入力画像から文
字領域を分離することを特徴とする。
【0018】例えば、前記分離手段は、入力画像から文
字領域を行単位で分離し、前記閾値設定手段は、前記文
字領域の行単位に2値化閾値を設定することを特徴とす
る。
【0019】例えば、前記閾値設定手段は、行単位の閾
値を同一文字領域内の他の行の閾値により制限して設定
することを特徴とする。
【0020】例えば、前記2値化手段は単純2値化を行
うことを特徴とする。
【0021】
【作用】以上の構成により、入力画像内の文字領域の高
さ、画像入力時の解像度により該文字領域の黒比率を設
定し、該文字領域の輝度頻度ヒストグラムを算出して該
黒比率を満たす2値化閾値を設定して該文字領域を2値
化することができる。
【0022】このように2値化された文字領域に対して
OCR処理を施すと、文字認識率が向上するという特有
の作用効果が得られる。
【0023】
【実施例】以下、本発明に係る一実施例について、図面
を参照して詳細に説明する。
【0024】図1は、本実施例における画像処理装置を
含んだシステム構成を示すブロック図である。
【0025】図1において、1は本実施例における文書
管理を行なう画像処理装置であり、2は画像を入力する
スキャナ等の画像入力装置、3は処理後の画像を表示す
る画像表示装置である。
【0026】画像処理装置1において、4は画像入力装
置2とのインターフェースとなる入力部、5は処理中の
データを記憶するメモリ等の記憶部、6は入力画像の輝
度頻度(ヒストグラム)を累計する輝度頻度累計部であ
る。7は入力画像の2値化閾値を算出する2値化閾値算
出部であり、8は2値化閾値算出部7において算出され
た閾値を用いて2値画像を作成する2値化部である。9
は画像を属性毎の領域に分離する領域分離部であり、1
0は領域分離により文字領域として抽出された領域に対
する文字認識処理を行う文字認識部、11は文字領域以
外に分割された領域に対する各種画像処理を行う画像処
理部、12は画像表示装置3とのインターフェースとな
る出力部である。これら各構成は、不図示のCPUによ
り統括的に制御されている。
【0027】以下、画像処理装置1における画像処理の
1つである文字認識処理を図2のフローチャートに示
し、説明する。
【0028】まずステップS61で、画像入力装置2に
より原稿となる画像を入力部4を介して画像処理装置1
に入力する。尚、この入力は8ビットの多値画像データ
として行い、入力画像は不図示の作業用メモリに記憶さ
れる。そしてステップS62では、画像入力時に発生す
る画像入力装置2の電気的ノイズの除去や、原稿画像の
劣化、原稿の傾き等、入力画像に対する補正を行う。次
にステップS63に進み、BS前処理として、輝度頻度
累計部6,2値化閾値算出部7,及び2値化部8におい
て、BS処理に最も適した閾値による単純2値化処理を
行う。そしてステップS64に進み、領域分離部9にお
いてBS処理を行ない、分離された各領域毎に領域デー
タを出力する。尚、領域データにおいて文字領域である
ことが示される領域については、該文字の高さ及び幅等
の情報が行領域データとして階層的に保持される。次に
ステップS65において、BS後処理として領域誤りを
除去する。尚、領域誤り除去の詳細については後述す
る。
【0029】続いてステップS66では、BS処理によ
り分離された各領域を、その領域データを参照すること
により文字領域であるか否かの判断を行う。尚、領域デ
ータの詳細については後述する。ステップS66におい
て当該領域が文字領域である場合はステップS67に進
み、OCR処理の前処理として、本実施例の特徴である
ところのOCRに最も適した閾値による単純2値化処理
を行い、ステップS68でOCR処理を行う。ステップ
S66において当該領域が文字領域でない場合には画像
慮域であるとみなし、ステップS69で、誤差拡散方や
ディザ法等の擬似中間調処理により2値化する。そして
ステップS610で、未処理の領域が残っているか否か
を判断し、残っている場合はステップS66へ戻って、
処理を継続する。残っていない場合はステップS611
へ進み、ステップS68によるOCR処理結果と、ステ
ップS69による擬似中間調処理結果とを合成し、原稿
と同様な画像レイアウトを生成する。
【0030】<<OCR前処理>>次に、図2のステッ
プS67で示したOCR前処理について、図3のフロー
チャートを参照して詳細に説明する。図3は、OCR前
処理である2値化処理の特徴を最もよく表すフローチャ
ートである。
【0031】まずステップS1において、BS処理によ
り分離された文字領域における行領域データから、文字
の高さH、幅Wを入力する。そしてステップS2で、ス
キャナ等の画像入力装置2の解像度SRを設定する。次
にステップS3では、処理対象の行領域の8ビットの多
値画像を作業用メモリに読み込む。ステップS4では、
処理対象の行領域のヒストグラム(「0」〜「255」
の各デジタル値の頻度)の累計を算出する。そしてステ
ップS5では、行領域の高さHと画像入力装置2の解像
度SRとの関係に基づいて予め設定されている黒比率B
Rを読み込む。尚、この黒比率BRについての詳細は後
述するが、上記はテキストが縦書きの場合であり、横書
きの場合には文字領域の幅Wと解像度SRとにより、B
Rが設定される。
【0032】続いてステップS6では、詳細は後述する
が、BR値に基づいて2値化の閾値を設定する。そして
ステップS7において、ステップS6で設定された閾値
を用い、単純2値化を行う。そして最後にステップS8
で未処理の行領域が残っているかを判断し、文字領域内
の行領域が全て2値化されるまで上述した処理を繰り返
す。
【0033】以下、上述した行領域の高さHと画像入力
装置2の解像度SRとの関係により予め設定される黒比
率BRについて、図4を参照して詳細に説明する。
【0034】図4に示すように、BR値は文字のポイン
ト数P毎に設定される。文字のポイント数Pは、以下に
示す(1)式により算出される。
【0035】 P=(72.0/SR)×H ・・・(1) (1)式から分かるように、行領域の高さHと解像度S
Rとによって、対象行領域の文字ポイント数Pが算出で
きるため、該ポイント数Pの文字が最も良く認識される
ような行領域の黒比率BRを実験的に求め、図4のよう
に設定しておく。例えば行領域の高さHが「56」で、
入力時の解像度が400dpiの場合には、この行領域
の文字のポイント数Pは「10」となる。10ポイント
の文字は、領域内の黒比率が14%である時に、最も文
字認識率が高いという実験結果に基づいて、BR値は
「14」に設定される。
【0036】このように文字のポイント数に応じた黒比
率BRを予め準備しておくことにより、大きさの異なる
文字に対しても、後述するように適切な2値化閾値を設
定することができる。
【0037】以下、上述した本実施例における画像処理
装置2において、実際にテキストを含んだ画像を画像入
力装置2から入力して、画像表示装置3に表示する具体
的な例を説明する。
【0038】細明朝体で『今回の成果として以下のこと
が挙げられる』と書かれた文字領域を含む原稿画像をス
キャナ等の画像入力装置2により読み込んだ場合につい
て考える。まず、該原稿画像が高濃度である場合を図5
の(a)に示し、低濃度である場合を図5の(b)に示
す。ここで、行領域の高さHが「34」、画像入力装置
2における入力時の解像度が400dpiであるとす
る。すると、上述した(1)式より文字のポイント数P
が「6」と算出されるため、図4によりBR値は「1
3」である。そして、それぞれの画像のヒストグラムを
算出すると、図6の(a),(b)に示すようになる。
これらのヒストグラムに対し、黒比率が13%になるよ
うな閾値は、それぞれ「32」と「173」である。こ
れらの閾値により図5の(a),(b)を2値化した結
果が、図7の(a),(b)となる。これにより、原稿
画像が高濃度である場合と低濃度である場合とのいずれ
も適切に2値化されていることが分かる。
【0039】以上説明したようにして、OCRに適する
2値化のための閾値を適切に求めることにより、行領域
の多値画像が劣化することなく適切に2値化される。従
って、OCRにおける文字認識率を向上させることがで
きる。
【0040】<<BS前処理(2値化処理)>>次に、
図2のステップS63におけるBS前処理としての2値
化処理について、図8のフローチャートを参照して詳細
に説明する。
【0041】まず図8のステップS71において、スキ
ャナ等の画像入力装置2により、多値画像を入力する。
そしてステップS72においては、入力画像のヒストグ
ラムを算出する。ここでは、画像中の全画素を用い、8
ビット、即ち「0」から「255」までの各デジタル値
に対する頻度を計算する。これにより、例えば図6に示
したヒストグラムが得られる。
【0042】次にステップS73において、パラメータ
START,ENDにそれぞれ「0」、「255」をセ
ットする。START,ENDはそれぞれ、後段のステ
ップS74やステップS75で求める輝度値の統計量の
始点及び終点に対応する。
【0043】ステップS74では、STARTからEN
Dまでのデジタル値に対応する画素の平均値AVを算出
する。例えば、START=0,END=255であれ
ば「0」から「255」の値を持つ画素(この場合、全
画素)の平均値AVを算出し、START=0,END
=177であれば「0」から「177」の値を持つ画素
の平均値AVを算出する。
【0044】ステップS75では、STARTからEN
Dまでの輝度値に対応する画素のスキュー値SKを算出
する。スキュー値とは、ヒストグラム分布の偏りを示す
統計量である。スキュー値の算出には、以下に示す
(2)式を用いる。
【0045】 SK=(Σ(Xi−AV)^3)/D ・・・(2) (尚、R^3 の表記によってRの3乗を示すものとす
る。) ここで、Xiは画素の輝度値である。また、Dは画像全
体の分散値であり、(3)式により算出される。
【0046】 D=Σ(Xi−AV)^2 ・・・(3) (尚、R^2 の表記によってRの2乗を示すものとす
る。) 続いてステップS76、S77では、ヒストグラムの偏
りの方向を判断する。まずステップS76では、以下に
示す(4)式によりヒストグラムの偏りの方向を判断す
る。これは、ヒストグラムの偏りが左方向であるか、即
ち、平均値AVよりも小さい値の範囲にあるか否かの判
断となる。
【0047】 SK<−1.0 ・・・(4) ステップS76において(4)式が真ならばステップS
710へ進み、偽ならばステップS77へ進む。ステッ
プS710では、STARTは変化させず、ENDに平
均値AVをセットする。そしてステップS74に戻り、
再びSTART値からEND値までの平均値AVを算出
する。
【0048】一方、ステップS77では以下に示す
(5)式によりヒストグラムの偏りの方向を判断する。
これは、ヒストグラムの偏りが右方向であるか、即ち平
均値AVよりも大きい値の範囲にあるか否かの判断とな
る。
【0049】 SK>1.0 ・・・(5) ステップS77において(5)式が真ならばステップS
711へ進み、偽ならばステップS78へ進む。ステッ
プS711では、STARTに平均値AVをセットし、
ENDは変化させない。そしてステップS74に戻り、
再びSTART値からEND値までの平均値AVを算出
する。
【0050】一方、ステップS78ではステップS7
6,S77における条件が共に偽である場合の平均値A
Vを、2値化閾値THとして設定する。そして、ステッ
プS79で2値化閾値THを用いた単純2値化処理を行
なう。
【0051】以上説明したようにして本実施例における
2値化処理が行われるが、式(4),(5)で示した範
囲は、これに限定されるものではない。
【0052】以下、具体的な画像の例を参照して更に詳
細に説明する。図9に示すヒストグラムの例を用いて、
上述した2値化閾値THの決定処理について説明する。
【0053】図9は、ある画像(8ビット入力)のヒス
トグラムを示したものである。図9において、横軸は左
端が「0」即ち黒、右端が「255」即ち白を表わす輝
度のデジタル値であり、縦軸は各デジタル値の頻度を表
わしている。図10は、図9に示す様なヒストグラムを
有する画像に対して、上述した図8で示す2値化処理に
おいてステップS74およびS75で示した処理の際
の、各パラメータの値の変化を示す図である。尚、図8
において示される各パラメータ値は、ステップS74及
びS75を通過する回数によって、それぞれ示されてい
る。
【0054】まず、ステップS74及びS75を通過す
る1回目の処理では、START=0,END=255
で平均値AV,統計量SKを計算し、それぞれ「17
7」,「−78.9」という値を得る。この場合、統計
量SKが「−1.0」未満であるため、ステップS71
0においてSTART=0,END=177が設定され
る。
【0055】続いて2回目の処理ではSTART=0,
END=177における平均値AV,統計量SKを計算
し、それぞれ「91」,「−8.6」という値を得る。
これも、統計量SKが「−1.0」未満であるため、ス
テップS710においてSTART=0,END=91
が設定される。
【0056】続いて3回目の処理では、START=
0,END=91における平均値AV,統計量SKを計
算し、それぞれ「43」,「9.6」という値を得る。
この場合は、統計量SKが「1.0」を超えるため、ス
テップS711においてSTART=43,END=9
1が設定される。
【0057】続いて4回目の処理では、START=4
3,END=91における平均値AV,統計量SKを計
算し、それぞれ「72」,「−7.0」という値を得
る。これも、統計量SKが「−1.0」未満であるた
め、ステップS710においてSTART=43,EN
D=72が設定される。
【0058】続いて5回目の処理では、START=4
3,END=72における平均値AV,統計量SKを計
算し、それぞれ「58」,「−2.2」という値を得
る。これも、統計量SKが「−1.0」未満であるた
め、ステップS710においてSTART=43,EN
D=58が設定される。
【0059】そして6回目の処理では、START=4
3,END=58における平均値AV,統計量SKを計
算し、それぞれ「50」,「−0.4」という値を得
る。ここで、統計量SKが「−1.0」以上かつ「1.
0」以下であるため、ステップS76,S77の条件を
満たさず、ステップS78へ進んで2値化閾値THとし
て、「50」が設定される。そしてステップS79にお
いて、2値化閾値THを用いた単純2値化処理が行わ
れ、2値化された画像は記憶部5に格納される。
【0060】以上説明したように、本実施例において
は、スキュー値が所定値まで収束するようにして2値化
閾値を決定し、2値化を行う。即ち、入力された多値画
像において、輝度頻度とその偏りに基づいて、画像内の
背景と対象物とを分離するために最も適した閾値が存在
する領域を特定した後、該特定領域の平均輝度値をもっ
て、2値化閾値とする。これにより、多値入力画像上の
領域内における各画素の輝度値を背景と対象物との2つ
のクラスに分類する際の最適閾値を、自動的に求めるこ
とができる。
【0061】<<像域分割(BS)処理>>次に、上述
した図2のステップS64で示したBS処理について、
図11のフローチャートを参照して詳細に説明する。
【0062】まず、ステップS101において、2値画
像を入力して作業用メモリに格納する。そしてステップ
102ではm×n画素が1画素となるように入力画像を
間引き、像域分離用の画像を生成する。この時、m×n
画素中に1つでも黒色画素が存在していれば、該m×n
画素を黒の1画素とする。
【0063】そしてステップS103では、BS用画像
の全画素について、黒画素が上下、左右、斜めの方向に
所定数連続している領域を一つの領域として、領域分離
を行なう。その際、領域の検出順に番号を付すことによ
り、各領域に対するラベル付けを行なう。次にステップ
S104において、各領域の幅、高さ、面積、領域内の
黒画素密度により領域を分類し、属性のラベル付けを行
なう。領域の属性としては、詳細は後述するが、「テー
ブル」,「外枠領域」,「テキスト」等がある。
【0064】そしてステップS105では、「テキス
ト」とラベル付けされた全ての領域の幅と高さの平均を
算出し、得られた平均幅が平均高さより大きい場合には
処理画像は横書きであるとみなし、逆の場合は縦書きで
あるとみなすことにより、文字組みを判断する。同時
に、横書きならば平均高さを、縦書きならば平均幅をも
って、一文字の文字サイズとする。
【0065】また、BS用画像上の縦方向(横書き時)
または横方向(縦書き時)の「テキスト」領域全てのヒ
ストグラムから、文章の段組、行間隔、が検出される。
ステップS106では、「テキスト」領域において文字
サイズが大きい領域については、「タイトル」とする。
そしてステップS107では、何の関連もなくばらばら
に存在したままの「タイトル」領域、「テキスト」領域
を、周りの領域との間隔に応じて併合し、一つのまとま
った領域とする。次にステップS108において、各領
域毎に属性、原画像における座標や大きさ等の領域デー
タを出力する。
【0066】以上の処理を行なうことにより、本実施例
では2値画像のBS処理を行い、各領域データが得られ
る。
【0067】図12に、上述した領域データの例を示
す。図12に示す各領域データ項目について、以下説明
する。 ・「番号」:領域の検出順序を示す。 ・「属性」:領域の属性情報を示し、以下に示す8通り
が用意されている。
【0068】「ルート」 入力画像そのものである
ことを示す。
【0069】「テキスト」 文字領域であることを示
す。
【0070】「タイトル」 見出し領域であることを
示す。
【0071】「テーブル」 表領域であることを示
す。
【0072】「ノイズ」 文字領域とも画像領域と
も判断できなかった領域であることを示す。
【0073】「外枠」 罫線等の領域であること
を示す。
【0074】「写真画像」 写真領域であることを示
す。
【0075】「線画像」 線画像領域であることを
示す。 ・「始点座標」:原画像における領域開始のX,Y座標
を示す。 ・「終点座標」:原画像における領域終了のX,Y座標
を示す。 ・「画素数」:領域内の全画素数を示す。 ・「文字組情報」:縦書き,横書き,不明の3通りの文
字組情報を示す。
【0076】図12に示す領域データについて、「属
性」が「テキスト」で示される領域のみ、図11に示す
ステップS107における併合前の、行に関する領域デ
ータ(行領域データ)を階層的に保持している。
【0077】以上説明したようにして、本実施例では像
域分割処理が行われる。尚、図12に示した領域データ
は本実施例を適用した一例にすぎず、画像処理装置に応
じて例えば他の情報を適宜追加しても良いし、または減
らしても良い。
【0078】<<領域除去処理>>次に、図2のステッ
プS65に示す、BS後処理としてのレイアウトノイズ
リダクション(以下、LNR)処理について、図13の
フローチャートを参照して詳細に説明する。LNR処理
とは、BS処理により分離された各領域のうち、像域分
離誤りの領域を除去する処理である。
【0079】まず図13のステップS121で、BS後
の各領域データはルート領域であるか否かが判断され
る。ルート領域とは画像全体を囲む領域、即ち全体領域
のことであり、ルート領域であればステップS126に
進み、LNR処理は施さない。ルート領域でなければス
テップS122に進み、テキスト領域(文字領域)であ
るか、またはノイズ領域であるかが判断される。テキス
ト領域またはノイズ領域である場合には処理はステップ
S123へ、いずれでもない場合はステップS125へ
進む。
【0080】ステップS123では、領域の大きさに応
じて領域データが領域分離誤りとして除去されるLNR
処理1を行い、次にステップS124で、領域内の黒比
率に応じて領域データが領域分離誤りとして除去される
LNR処理3を行う。一方、ステップS125では、テ
キスト領域でなく、かつノイズ領域でもない領域データ
が、領域の大きさに応じて領域分離誤りとして除去され
るLNR処理2が行われる。尚、ステップS123,S
124,S125におけるLNR処理1,3,2につい
ては、それぞれ以下に詳述する。
【0081】そしてステップS126において、全ての
領域に対する処理が終了したか否かが判断され、終了し
ていなければステップS121へ戻り、終了していれば
LNR処理を終了する。
【0082】以下、まずステップS123に示すLNR
処理1について詳細に説明する。
【0083】図14は、LNR処理1を示すフローチャ
ートである。まずステップS131で、処理対象領域の
領域データから高さH1,幅W1を参照する。そして、
領域の大きさの判断に用いる高さの閾値HT1,幅の閾
値WT1を算出するために、ステップS132におい
て、スキャナ等の画像入力装置2の読み取り解像度SR
と、画像中の除去しない最小文字のポイント数MP1を
それぞれ高さ,幅についてMP1h,MP1wとして設
定する。
【0084】本実施例において、閾値HT1,WT1は
以下に示す(6),(7)式により算出される。
【0085】 HT1=(SR/72.0)×MP1h ・・・(6) WT1=(SR/72.0)×MP1w ・・・(7) ステップS133では、(6)式により高さの閾値HT
1を算出する。例えば、画像入力装置2の解像度SRが
400dpiで、画像中の最小文字の高さポイント数M
P1hが4ポイントである場合、高さの閾値HT1は
「22」として算出される。そしてステップS134
で、領域データの高さH1とステップS133で算出し
た高さの閾値HT1との比較を行なう。領域データの高
さH1が閾値HT1より大きい場合はステップS135
へ進み、閾値HT1より小さい場合はステップS138
へ進む。
【0086】ステップS135では、(7)式により幅
の閾値WT1を算出する。続いてステップS136で、
領域データの幅W1とステップS135で算出した幅の
閾値WT1との比較を行なう。領域データの幅W1が閾
値WT1よりも大きい場合には、LNR処理1は終了す
る。一方、領域データの幅W1が閾値WT1よりも小さ
い場合はステップS137に進み、領域データの高さH
1と幅W1との比H1/W1の判断を行なう。この比が
「2」以下である場合には、LNR処理1は終了する。
一方、比が「2」を超える場合には処理中の領域が領域
分離誤りであると判断されるため、ステップS138へ
進んで、該領域が除去される。
【0087】次に、図13のステップS124に示すL
NR処理3について、図15のフローチャートを参照し
て詳細に説明する。まずステップS141において、領
域中の黒画素数BCを累計する。そしてステップS14
2で、領域中の黒比率BR1を以下に示す(8)式によ
り計算する。
【0088】 BR1=BC/(W1×H1)×100 ・・・(8) 次にステップS143において、最小黒比率BRT1
と、最大黒比率BRT2とを設定する。BRT1とBR
T2は、文字の黒比率特性により予め設定されており、
例えばBRT1=5,BRT2=52である。
【0089】ステップS144では、領域中の黒比率B
R1と、最小黒比率BRT1及び最大黒比率BRT2と
の比較を行なう。黒比率BR1が最小黒比率BRT1よ
り小さい、又は最大黒比率BRT2より大きい場合に
は、処理中の領域が領域分離誤りであると判断され、ス
テップS145に進んで該領域が除去される。その他の
場合は、LNR処理3は終了する。
【0090】次に、図13のステップS125に示すL
NR処理2について、図16のフローチャートを参照し
て詳細に説明する。まずステップS151において、処
理対象領域の領域データから高さH2,幅W2を参照す
る。そして、領域の大きさの判断に用いる高さの閾値H
T2,幅の閾値WT2を算出するために、ステップS1
52において、画像入力装置2の解像度SRを設定す
る。そして、ステップS153において、処理中の領域
の属性が外枠領域であるか否かが判断される。そして、
外枠領域であればステップS154へ、外枠領域でなけ
ればステップS157へ進む。
【0091】ステップS154においては、最小ポイン
ト数MP21をそれぞれ高さ,幅についてMP21h,
MP21wとして設定する。また、ステップS157で
も同様に、最小ポイント数MP22をそれぞれ高さ,幅
についてMP22h,MP22wとして設定する。ここ
で最小ポイント数MP21,MP22とは、LNR処理
2において外枠領域であるか否かに応じて、除去しない
領域の最小サイズを文字のポイント数により表わしたも
のである。
【0092】そして、ステップS155およびS158
においては、上述した(6),(7)式により、高さの
閾値HT21,HT22と幅の閾値WT21,WT22
を算出する。例えば、画像入力装置2の解像度SRが4
00dpiで、最小ポイント数MP22が高さ、幅共に
4ポイントである場合、各閾値HT22,WT22は
「22」として算出される。そして、ステップS156
およびS159において、それぞれ高さの閾値HT2と
幅の閾値WT2を設定する。
【0093】続いてステップS1510では、領域デー
タの高さH2と、ステップS156およびS159で設
定した高さの閾値HT2との比較、及び領域データの幅
W2と同じく幅の閾値WT2との比較を行なう。領域デ
ータの高さH2が閾値HT2より小さい、または幅W2
が閾値WT2より小さい場合、処理中の領域が領域分離
誤りであると判断され、ステップS1511において該
領域が除去される。その他の場合は、LNR処理2を終
了する。
【0094】以上説明したように本実施例のLNR処理
は、3種類の処理によってSB誤りと判断される領域を
除去する。
【0095】以上説明したように本実施例によれば、2
値化による文字のつぶれ、かすれ等の不具合を防止する
ことができ、従って原稿画像の濃度にかかわらず正確な
OCR処理を行うことができ、文字認識率が向上する。
また、大きさの異なる文字に対しても、2値化によるつ
ぶれ、かすれ等の不具合を防止することができる。
【0096】<その他の実施例>上述した実施例におい
て入力される画像は、8ビットの多値画像データとして
説明を行ったが、本発明はこれに限定する必要はなく、
例えばカラー画像等、即ち、2値化するために画像情報
として複数ビットの情報があれば良い。
【0097】また、ヒストグラムを算出する際の画像に
おけるサンプリングについて、全画素でも、数画素おき
でもよく限定しない。さらに、平均AVや統計量SK等
の計算は、必ずしも8ビットで行なう必要はなく、高速
化、メモリの削減等のため、少ないビット数で演算する
ようにしてもよい。
【0098】また、統計量であるスキュー値SKの収束
条件を±1.0としたが、これに限定されるものではな
い。スキュー値SKを用いて2値化の閾値を決定するよ
うに構成されていれば良い。
【0099】また、前記実施例において、黒比率BRの
例として細明朝体について説明を行ったが、もちろん他
の書体(フォント)についても同様に処理されることは
言うまでもない。更には、書体(フォント)によってB
R値の設定を切り替えるようにしても良い。
【0100】また、前記実施例においては、黒比率BR
を予めテーブルに設定しておき、文字領域の高さと画像
入力装置の解像度から、文字領域毎のBR値を選択する
例について説明したが、操作者が文字領域毎に好みのB
R値を定めるようにしても良い。即ち、何らかの手段に
よってBR値が決定されればよい。
【0101】更に、前記実施例では文字領域中の各行領
域毎にそれぞれ閾値を定めるとして説明したが、閾値の
設定方法はこの例に限定されるものではなく、例えば、
同一文字領域内の他の行領域の閾値を参照して、同一文
字領域内での閾値に大きな隔たりがないよう、各閾値に
制限を加えるようにしても良い。
【0102】尚、本発明は、イメージスキャナ、プリン
タコントローラ、プリンタ等の複数の機器から構成され
るシステムに適用しても、カラー複写機のような1つの
機器から成る装置に適用しても良い。また、本発明は上
述のように画像処理装置にハードウェアを設けるものに
限らず、システム或は装置に磁気ディスク等の媒体に記
憶されたプログラムを供給することによって達成される
場合にも適用できることはいうまでもない。
【0103】
【発明の効果】以上説明したように本発明によれば、文
字領域の輝度頻度ヒストグラムを算出し、該文字領域の
高さ、画像入力時の解像度により文字領域の黒比率を決
定し、文字領域の輝度頻度ヒストグラムを用いて黒該比
率を満たす2値化の閾値を設定して、文字領域の単純2
値化を行う。これにより、2値化による文字のつぶれ、
かすれ等の不具合を防止することができ、従って原稿画
像の濃度にかかわらず正確なOCR処理を行うことがで
き、文字認識率が向上する。
【0104】また、大きさの異なる文字に対しても、そ
の大きさにおいて最適な黒比率を満たす様に閾値を設定
するため、2値化によるつぶれ、かすれ等の不具合を防
止することができ、正確なOCR処理を行うことができ
る。
【0105】
【図面の簡単な説明】
【図1】本発明に係る一実施例における画像処理装置の
システム構成を示すブロック図である。
【図2】本実施例における文字認識処理を示すフローチ
ャートである。
【図3】本実施例における文字認識前処理を示すフロー
チャートである。
【図4】本実施例における黒比率を設定するテーブル例
を示す図である。
【図5】本実施例における入力多値画像の例を示す図で
ある。
【図6】本実施例における入力多値画像のヒストグラム
例を示す図である。
【図7】本実施例における入力多値画像を2値化した画
像例を示す図である。
【図8】本実施例における領域分離前処理を示すフロー
チャートである。
【図9】本実施例における原稿画像のヒストグラムの例
を示す図である。
【図10】本実施例の2値化処理における各変数値の変
遷例を示す図である。
【図11】本実施例における領域分割処理を示すフロー
チャートである。
【図12】本実施例における領域分割処理により得られ
る領域データ例を示す図である。
【図13】本実施例における領域分離後処理を示すフロ
ーチャートである。
【図14】本実施例における領域の大きさによる領域除
去処理1を示すフローチャートである。
【図15】本実施例における黒比率による領域除去処理
2を示すフローチャートである。
【図16】本実施例における領域の大きさによる領域除
去処理3を示すフローチャートである。
【図17】文字、写真、グラフが混在した原稿画像例を
示す図である。
【図18】従来の画像処理装置における文字認識処理を
示すフローチャートである。
【符号の説明】
1 画像処理装置 2 画像入力装置 3 画像表示装置 4 入力部 5 記憶部 6 輝度頻度累計部 7 2値化閾値算出部 8 2値化部 9 像域分離部 10 文字認識部 11 画像処理部 12 出力部

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 入力画像から所定の領域を分離する分離
    工程と、 前記分離工程により分離された所定の領域の濃度及び高
    さと、前記入力画像の解像度とに基づいて2値化閾値を
    設定する閾値設定工程と、 前記分離工程により分離された所定の領域を前記閾値設
    定工程により設定された閾値で2値化する2値化工程と
    を有することを特徴とする画像処理方法。
  2. 【請求項2】 更に、前記2値化工程により2値化され
    た領域に対して文字認識を行う文字認識工程を有するこ
    とを特徴とする請求項1記載の画像処理方法。
  3. 【請求項3】 前記閾値設定工程は、前記分離工程によ
    り分離された所定の領域の輝度頻度ヒストグラムを算出
    し、該領域の黒比率が所定値となるように2値化閾値を
    設定することを特徴とする請求項1記載の画像処理方
    法。
  4. 【請求項4】 前記黒比率は、前記所定領域内の黒画素
    密度であることを特徴とする請求項3記載の画像処理方
    法。
  5. 【請求項5】 前記黒比率の所定値は、前記分離工程に
    より分離された所定の領域の高さ、解像度、該領域内の
    フォント種別に応じて変化することを特徴とする請求項
    4記載の画像処理方法。
  6. 【請求項6】 前記分離工程は、入力画像から文字領域
    を分離することを特徴とする請求項1記載の画像処理方
    法。
  7. 【請求項7】 前記分離工程は、入力画像から文字領域
    を行単位で分離し、 前記閾値設定工程は、前記文字領域の行単位に2値化閾
    値を設定することを特徴とする請求項6記載の画像処理
    方法。
  8. 【請求項8】 前記閾値設定工程は、行単位の閾値を同
    一文字領域内の他の行の閾値により制限して設定するこ
    とを特徴とする請求項7記載の画像処理方法。
  9. 【請求項9】 前記分離工程は入力画像から文字領域を
    分離し、 前記文字領域の高さは、該領域内の文字の大きさである
    ことを特徴とする請求項5記載の画像処理方法。
  10. 【請求項10】 前記2値化工程は単純2値化を行うこ
    とを特徴とする請求項1記載の画像処理方法。
  11. 【請求項11】 入力画像から所定の領域を分離する分
    離手段と、 前記分離手段により分離された所定の領域の濃度及び高
    さと、前記入力画像の解像度とに基づいて2値化閾値を
    設定する閾値設定手段と、 前記分離手段により分離された所定の領域を前記閾値設
    定手段により設定された閾値で2値化する2値化手段と
    を有することを特徴とする画像処理装置。
  12. 【請求項12】 更に、前記2値化手段により2値化さ
    れた領域に対して文字認識を行う文字認識手段を有する
    ことを特徴とする請求項1記載の画像処理装置。
  13. 【請求項13】 前記閾値設定手段は、前記分離手段に
    より分離された所定の領域の輝度頻度ヒストグラムを算
    出し、該領域の黒比率が所定値となるように2値化閾値
    を設定することを特徴とする請求項1記載の画像処理装
    置。
  14. 【請求項14】 前記黒比率は、前記所定領域内の黒画
    素密度であることを特徴とする請求項13記載の画像処
    理装置。
  15. 【請求項15】 前記黒比率の所定値は、前記分離手段
    により分離された所定の領域の高さ、解像度、該領域内
    のフォント種別に応じて変化することを特徴とする請求
    項14記載の画像処理装置。
  16. 【請求項16】 前記分離手段は、入力画像から文字領
    域を分離することを特徴とする請求項11記載の画像処
    理装置。
  17. 【請求項17】 前記分離手段は、入力画像から文字領
    域を行単位で分離し、 前記閾値設定手段は、前記文字領域の行単位に2値化閾
    値を設定することを特徴とする請求項16記載の画像処
    理装置。
  18. 【請求項18】 前記閾値設定手段は、行単位の閾値を
    同一文字領域内の他の行の閾値により制限して設定する
    ことを特徴とする請求項17記載の画像処理装置。
  19. 【請求項19】 前記2値化手段は単純2値化を行うこ
    とを特徴とする請求項11記載の画像処理装置。
JP7022896A 1995-02-10 1995-02-10 画像処理装置及びその方法 Withdrawn JPH08221512A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7022896A JPH08221512A (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7022896A JPH08221512A (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH08221512A true JPH08221512A (ja) 1996-08-30

Family

ID=12095420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7022896A Withdrawn JPH08221512A (ja) 1995-02-10 1995-02-10 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH08221512A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7142870B2 (en) 2001-11-21 2006-11-28 Samsung Electronics Co., Ltd. Apparatus and method for displaying direction and position information of portable terminal
CN1324521C (zh) * 2003-03-15 2007-07-04 三星电子株式会社 用于识别图象字符的预处理设备和方法
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
JP2016086389A (ja) * 2014-10-29 2016-05-19 京セラドキュメントソリューションズ株式会社 画像読取装置および画像形成装置
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
US10380416B2 (en) 2017-02-14 2019-08-13 Pfu Limited Date identifying apparatus, date identifying method, and computer-readable recording medium

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7142870B2 (en) 2001-11-21 2006-11-28 Samsung Electronics Co., Ltd. Apparatus and method for displaying direction and position information of portable terminal
CN1324521C (zh) * 2003-03-15 2007-07-04 三星电子株式会社 用于识别图象字符的预处理设备和方法
US7471830B2 (en) 2003-03-15 2008-12-30 Samsung Electronics Co., Ltd. Preprocessing device and method for recognizing image characters
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
JP2016086389A (ja) * 2014-10-29 2016-05-19 京セラドキュメントソリューションズ株式会社 画像読取装置および画像形成装置
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
CN105989359A (zh) * 2015-03-20 2016-10-05 株式会社Pfu 日期识别装置
US9594985B2 (en) 2015-03-20 2017-03-14 Pfu Limited Date identification apparatus
CN105989359B (zh) * 2015-03-20 2019-06-18 株式会社Pfu 日期识别装置
US10380416B2 (en) 2017-02-14 2019-08-13 Pfu Limited Date identifying apparatus, date identifying method, and computer-readable recording medium

Similar Documents

Publication Publication Date Title
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JP4219542B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
US7738734B2 (en) Image processing method
EP1569170A1 (en) Characteristic region extraction device, characteristic region extraction method, and characteristic region extraction program
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US8385643B2 (en) Determination of inputted image to be document or non-document
US5920655A (en) Binarization image processing for multi-level image data
US7110607B2 (en) Image processing apparatus
US6269186B1 (en) Image processing apparatus and method
JPH08221512A (ja) 画像処理装置及びその方法
JP2003067738A (ja) 網点除去方法及びシステム
JP3100383B2 (ja) 文字領域分離方法および装置
JP2000022943A (ja) 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体
JP3733154B2 (ja) 画像処理装置及びその方法
JP3733155B2 (ja) 画像処理装置及びその方法
JP2786355B2 (ja) 文章画像の属性判別方法
JP3106080B2 (ja) 画像処理装置及びその方法
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JPH08221511A (ja) 画像処理装置及びその方法
JP2881066B2 (ja) 文章画像の属性判別方法
JPH03126180A (ja) 画像処理装置
JPH05292312A (ja) 網点領域分離装置
JP2003189090A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
EP2806625B1 (en) Image processing apparatus, image processing method, and non-transitory computer readable recording medium storing an image processing program
JP2877548B2 (ja) 文書画像の属性判別方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020507