JP3624045B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置 Download PDF

Info

Publication number
JP3624045B2
JP3624045B2 JP04175296A JP4175296A JP3624045B2 JP 3624045 B2 JP3624045 B2 JP 3624045B2 JP 04175296 A JP04175296 A JP 04175296A JP 4175296 A JP4175296 A JP 4175296A JP 3624045 B2 JP3624045 B2 JP 3624045B2
Authority
JP
Japan
Prior art keywords
value
luminance
image
character
luminance frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04175296A
Other languages
English (en)
Other versions
JPH09233322A (ja
Inventor
修 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP04175296A priority Critical patent/JP3624045B2/ja
Priority to US08/807,605 priority patent/US5956421A/en
Publication of JPH09233322A publication Critical patent/JPH09233322A/ja
Application granted granted Critical
Publication of JP3624045B2 publication Critical patent/JP3624045B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像処理方法及び装置に関し、特に多値画像の2値化閾値を決定して2値化を行う画像処理方法及び装置に関する。
【0002】
【従来の技術】
近年の画像処理技術の発展には目覚ましいものがあり、写真/文字が混在するフルカラー画像等の多値画像処理や、多値画像内の文字認識処理等が可能な画像処理装置も普及してきている。
【0003】
このような画像処理技術において、写真/文字が混在する多値画像の2値化処理は不可欠な技術となっている。
【0004】
従来の2値化手法としては、あらかじめ設定してある固定閾値による単純2値化法を始めとして、ある閾値でヒストグラムを2クラスに分割した場合のクラス間分散が最大になる時の閾値を2値化閾値とする大津法(大津、“判別及び最小2乗規準に基づく自動しきい値選定方”、電子通信学会論文誌、Vol.J63−D,no.4,pp.349−356,1980)や、また階調を持つ画像に対して、局所的濃度に応じ閾値を設定する2値化法等がある。
【0005】
【発明が解決しようとする課題】
しかしながら、上述したような従来の画像処理装置における2値化方法においては、以下のような問題があった。
【0006】
画像中に写真/文字が混在する原稿を2値化する際、固定閾値による単純2値化法では、写真/文字それぞれに適した閾値を設定することが難しく、その結果、写真部分を優先すると文字部分がつぶれてしまったり、文字部分を優先すると写真部分がつぶれたり、かすれたりしてしまっていた。また大津法では、写真部分と文字部分において2クラスの分布の特徴が異なり、2クラスの分布が極端に異なる場合においては、大きい方のクラスに閾値が寄ってしまうという性質があり、従ってノイズの多い2値画像が生成されてしまっていた。更に、局所的濃度に応じ閾値を設定する2値化法では、下地の上に文字がある場合、その下地までも濃度を再現してしまい、文字部分にノイズの多い2値画像が生成されてしまうという問題もあった。
【0007】
本発明は上述した課題を解決するために成されたものであり、画像内の文字部分とそれ以外の部分とのそれぞれに適切な2値化閾値を自動的に設定可能な画像処理方法及び装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成するために、本発明の画像処理方法は、多値画像の輝度頻度を所定のブロック毎に算出し、該輝度頻度の偏りを示すスキュー値に基づいて前記輝度頻度の平均輝度値及びスキュー値を算出するための輝度頻度領域を設定する設定工程と、前記設定された輝度頻度領域における前記輝度頻度の平均輝度値及びスキュー値を算出する算出工程と、前記算出されたスキュー値が所定範囲内か否かを判定する判定工程と、前記判定工程で所定範囲内と判定された場合、処理ブロックがかすれ文字を含む場合、所定回数以内に前記所定範囲内と判定されなかった場合の何れかの場合に、前記算出工程で算出された平均輝度値を、当該処理ブロックにおける多値画像を2値化するための2値化閾値に設定する閾値設定工程とを有し、前記スキュー値が所定範囲外で、かつ、正の場合、前記輝度頻度の平均輝度値を始点とし、前記輝度頻度の最大輝度値を終点として前記輝度頻度領域を設定し、前記スキュー値が所定範囲外で、かつ、負の場合、前記輝度頻度の最小輝度値を始点とし、前記輝度頻度の平均輝度値を終点として前記輝度頻度領域を設定し、前記所定回数前記設定工程、前記算出工程、及び前記判定工程を繰り返すことを特徴とする。
【0009】
また、上記目的を達成するために、本発明の画像処理装置は、多値画像の輝度頻度を所定のブロック毎に算出し、該輝度頻度の偏りを示すスキュー値に基づいて前記輝度頻度の平均輝度値及びスキュー値を算出するための輝度頻度領域を設定する設定手段と、前記設定された輝度頻度領域における前記輝度頻度の平均輝度値及びスキュー値を算出する算出手段と、前記算出されたスキュー値が所定範囲内か否かを判定する判定手段と、前記判定手段で所定範囲内と判定された場合、処理ブロックがかすれ文字を含む場合、所定回数以内に前記所定範囲内と判定されなかった場合の何れかの場合に、前記算出手段で算出された平均輝度値を、当該処理ブロックにおける多値画像を2値化するための2値化閾値に設定する閾値設定手段とを有し、前記スキュー値が所定範囲外で、かつ、正の場合、前記輝度頻度の平均輝度値を始点とし、前記輝度頻度の最大輝度値を終点として前記輝度頻度領域を設定し、前記スキュー値が所定範囲外で、かつ、負の場合、前記輝度頻度の最小輝度値を始点とし、前記輝度頻度の平均輝度値を終点として前記輝度頻度領域を設定し、前記所定回数前記設定手段、前記算出手段、及び前記判定手段による処理を繰り返すことを特徴とする。
【0013】
【発明の実施の形態】
以下、図面を参照して本発明に係る実施形態について詳細に説明する。
【0014】
<第1実施形態>
図1は、本実施形態における2値化処理を実行する画像処理システムの構成を示すブロック図である。図1において、1は画像の2値化処理、文字認識処理などを行う画像処理装置である。2は画像を入力するスキャナ等の画像入力装置である。そして、3は処理後の画像を表示する画像表示装置である。
【0015】
上記の画像処理装置1において、4は入力部であり、画像入力装置2とのインターフェイスとして機能する。5はメモリ等の記憶部であり、処理中のデータを記憶する。6は輝度頻度累計部であり、入力画像の輝度頻度(ヒストグラム)を累計する。7は画像特徴判別部であり、入力画像が文字画像か否かを判別する。8は2値化閾値算出部であり、入力画像の2値化閾値を算出する。9は2値化部であり、2値化閾値算出部8にて算出された閾値を用い2値化画像を作成する。10は文字認識部であり、文字領域として抽出された領域に対する文字認識処理を行う。11は画像処理部であり、文字領域以外に分離された領域に対する各種画像処理や画像のレイアウト処理を行う。12は出力部であり、画像表示装置3とのインターフェイスとして機能する。これら各構成は、不図示のCPUにより統括的に制御されている。
【0016】
以上の構成における本実施形態の画像処理装置1にて実行されるOCR処理について、以下に説明する。
【0017】
図2は、本実施形態の特徴である2値化閾値決定方法を利用した文字認識処理を示すフローチャートである。まず、ステップS201において、スキャナなどの画像入力装置2より画像データを入力する。ここでの入力は、8ビットの多値画像データとして行われる。次に、ステップS202では、画像入力時に発生する画像入力装置2の電気的ノイズの除去や、原稿画像の劣化、原稿の傾きなど、入力画像に対する補正を行う。そして、ステップS203において、ステップS201で入力した多値画像データに対し、本実施形態の特徴である文字ブロック(つぶれ文字ブロック、かすれ文字ブロック)の判別を行い、それぞれに最適な2値化閾値を決定し、その2値化閾値により2値画像を生成する。尚、この2値化処理については、更に後述する。
【0018】
その後、ステップS204に進み、ステップS203で2値化された2値画像が文字ブロックと判別されたブロックか否かを判断する。ここで、文字ブロックと判別された場合はステップS205に進み、その文字ブロックを2値画像から切り出し、その2値画像に対して文字認識処理を行い、認識された文字コードを出力する。そして、ステップS206で未処理ブロックが画像中にあるか否かを判断し、ある場合はステップS204へ、ない場合はステップS207へ進む。ステップS207では、文字ブロックと、非文字ブロックとを合成し、原稿画像と同じレイアウトにする。
【0019】
[2値化処理]
次に、上述したステップS203での2値化処理の詳細について、図3に示すフローチャートに従って以下に説明する。
【0020】
まず、ステップS301において、8ビットの多値画像データを画像処理装置1内の記憶部5から不図示のメモリ等に処理ブロックの単位(本実施形態では、64×64画素)毎に入力する。尚、この多値画像データはスキャナなどの画像入力装置2により予め記憶部5に格納されているものである。そして、ステップS302で文字ブロック(つぶれ文字ブロック、かすれ文字ブロック)か否かを判別し、入力画像データの処理ブロックの単位(64×64画素)毎に2値化のための閾値を決定する。次に、ステップS303では、後述する文字フラグMFが「1」か否かを判断する。尚、処理中のブロックが文字ブロックか否かの判断については更に後述する。その結果、文字ブロックであればステップS305へ進むが、文字ブロックでなければステップS304へ進み、閾値THを下限値Lと上限値Hとにより制限する。つまり、ステップS302で決定された閾値THが下限値Lよりも小さい場合には閾値THをLで代表させ、また上限値Hよりも大きい場合には閾値THをHで代表させるような制限処理を行う。ここで、この下限値Lと上限値Hは画像入力装置2の特性によって決定される値である。
【0021】
次に、ステップS305において、後述するつぶれ文字フラグTFが「1」か否かを判断する。尚、処理中のブロックがつぶれ文字ブロックか否かの判断については更に後述する。その結果、つぶれ文字ブロックであればステップS306へ進むが、つぶれ文字ブロックでなければステップS307へ進み、閾値THを制限する。つまり、ステップS302又はステップS304で決定された閾値THに文字つぶれ防止用の定数TPをかけるような制限処理を行う。尚、定数TPは画像入力装置2の特性によって決定される値である。次に、ステップS307では、ステップS302,S304,S306で決定された閾値THに基づいて単純2値化処理を行う。そして、ステップS308では、入力画像の最後の処理ブロック(64×64画素)か否かを判断し、最後の処理ブロックであれば2値化処理を終了するが、未処理ブロックがあればステップS301へ戻る。
【0022】
[閾値決定処理]
次に、上述したステップS302での2値化の閾値決定処理の詳細について、図4に示すフローチャートに従って以下に説明する。
【0023】
まず、ステップS401において、パラメータSTART、ENDにそれぞれ「0」、「255」をセットする。パラメータSTART、ENDはそれぞれ、後段のステップS402やステップS403で求める輝度値の統計量の始点及び終点に対応する。また、閾値決定処理ループ回数iに「0」をセットし、初期化する。そして、ステップS401では同時に、処理ブロック(64×64画素)中の全画素を用い、8ビット、即ち「0」から「255」までの各ディジタル値に対する頻度(ヒストグラム)を計算する。
【0024】
次に、ステップS402では、STARTからENDまでのデジタル値に対応する画素の平均値AVを算出する。例えば、START=0、END=255であれば、「0」から「255」の値を持つ画素の平均値AVを算出し、START=0、END=109であれば「0」から「109」の値を持つ画素の平均値AVを算出する。そして、ステップS403では、STARTからENDまでの輝度値に対応する画素のスキュー値SKを算出する。ここで、スキュー値とは、ヒストグラム分布の偏りを示す統計量である。このスキュー値の算出には、以下に示す(1)式を用いる。
【0025】
SK=(Σ(Xi −AV)^3)/D …(1)
ここで、Xi は画素の輝度値であリ、x^yはxのy乗を示す。また、Dは画像全体の分散値であり、(2)式により算出される。
【0026】
D=Σ(Xi −AV)^2 …(2)
上記(1)式において、スキュー値は各画素の輝度値と、その平均値との差分を3乗することにより算出されるが、奇数乗であれば3乗に限定されるものではない。
【0027】
次に、ステップS404において、1つの処理ブロックにおける閾値決定処理ループ回数iの判断(i=0、つまり、最初のループかどうかの判断)を行う。ここで、iが「0」であればステップS405へ、「0」以外であればステップS406へ進む。ステップS405では、処理中のブロックが「文字ブロック」か否かの画像特徴判別を行い(詳細は後述する)、ステップS414へ進む。
【0028】
一方、ステップS406では、以下に示す(3)式によりヒストグラムの偏りの大きさを判断する。
【0029】
−0.1 < SK かつ SK < 0.1 …(3)
つまり、スキュー値SKの絶対値が「0.1」未満かの判断を行う。その結果、真ならばステップS416へ進むが、偽ならばステップS407へ進み、閾値決定処理ループ回数iの判断を行う。このループ回数iが「1」ならばステップS408へ、「1」以外ならステップS409へ進む。ステップS408では、処理中のブロックが「つぶれ文字ブロック」か否かの判断と処理を行う(詳細は後述する)。そして、ステップS409において、閾値決定処理ループ回数iの判断を行い、iが「9」ならばステップS416へ、「9」以外ならステップS410へ進む。ステップS410では、処理中のブロックが「かすれ文字ブロック」か否かの判断と処理を行う(詳細は後述する)。そして、ステップS411において、かすれ文字フラグKFが「1」か否かを判断し、「1」ならばステップS416へ、「1」以外ならステップS412へ進む。
【0030】
このステップS412では、以下に示す(4)式によりヒストグラムの偏りの方向を判断する。
【0031】
SK > 0 …(4)
上記(4)式が真(ヒストグラムの偏りが平均値AVよりも大きい値の範囲にあることを意味する)ならばステップS413へ進み、また偽(ヒストグラムの偏りが平均値AVよりも小さい値の範囲にあることを意味する)ならばステップS414へ進む。ステップS413では、STARTに平均値AVをセットし、ENDは変化させない。一方、ステップS414では、STARTは変化させず、ENDに平均値AVをセットする。そして、ステップS415では、閾値決定処理ループ回数iに「1」を加え、ステップS402に戻り、再びSTART値からEND値までの平均値AVを算出する。
【0032】
最後に、ステップS416では平均値AVを、2値化閾値THとして設定し、この閾値決定処理を終える。
【0033】
このように、本実施形態における2値化処理を行っているが、上記(3)式、(4)式で示した範囲は、これに限定されるものではない。
【0034】
[画像特徴判別処理]
次に、上述したステップS405での画像特徴判別処理の詳細について、図5に示すフローチャートに従って以下に説明する。
【0035】
まず、ステップS501では、処理中のブロックが「文字ブロック」か否かを示す文字フラグMFに「0」をセットする。また、閾値決定処理ループにおける最初のスキュー値を表わすSK0にスキュー値SKをセットする(これは、画像特徴判別処理が閾値決定処理ループにおける最初のループでのみ行われるからである)。ステップS502では、処理中のブロックが「文字ブロック」か否かの判断を以下に示す(5)式により行う。
【0036】
SK0 < MH …(5)
ここで、MHは処理中のブロックが「文字ブロック」か否かを示す値であり、ここでは、「MH=−20.0」とする。ステップS502で、上記(5)式が真ならばステップS503へ、また偽ならばこの画像特徴判別処理を終了する。ステップS503では、処理中のブロックが「文字ブロック」であることを示す文字フラグMFに「1」をセットし、この画像特徴判別処理を終了する。
【0037】
このように、本実施形態における画像特徴判別処理を行っているが、上記(5)式で示した条件は、これに限定されるものではない。
【0038】
[つぶれ文字処理]
次に、上述したステップS408でのつぶれ文字処理の詳細について、図6に示すフローチャートに従って説明する。まず、ステップS601では、処理中のブロックが「つぶれ文字ブロック」か否かを示すつぶれ文字フラグTHに「0」をセットする。また、処理中のブロックのヒストグラムの偏りが大きいことを示すフラグPFに「0」をセットする。そして、ステップS602では、閾値決定処理ループにおける最初のループのスキュー値SK0と、処理中のループのスキュー値SKが共にマイナスであるか判断し、共にマイナスであれば、ステップS603でフラグPFに「1」をセットする。ステップS604では、文字フラグMFが「1」か否かの判断(つまり、処理中のブロックが文字ブロックか否かの判断)を行い、「1」ならばステップS605へ、「1」以外ならばこのつぶれ文字処理を終了する。ステップS605では、処理中のブロックが「つぶれ文字ブロック」か否かの判断を以下に示す(6)式により行う。
【0039】
SK0/SK < −SR …(6)
ここで、−SRは処理のブロックが「つぶれ文字ブロック」か否かを示す値であり、本実施形態では「−SR=−3.0」とする。ステップS605において上記(6)式が真ならばステップS606へ、また偽ならばこのつぶれ文字処理を終了する。そして、ステップS606では、処理中のブロックが「つぶれ文字ブロック」であることを示す、つぶれ文字TFに「1」をセットし、このつぶれ文字処理を終了する。
【0040】
このように、本実施形態におけるつぶれ文字処理を行っているが、上記(6)式で示した条件は、これに限定されるものではない。
【0041】
[かすれ文字処理]
次に、上述したステップS410でのかすれ文字処理の詳細について、図7に示すフローチャートに従って説明する。まず、ステップS701では、処理中のブロックが「かすれ文字ブロック」か否かを示すかすれ文字フラグKFに「0」をセットする。次に、ステップS702では、文字フラグMFが「1」か否かの判断(処理中のブロックが文字ブロックか否かの判断)を行い、「1」ならばステップS703へ、「1」以外ならこのかすれ文字処理を終了する。ステップS703では、処理中のブロックのヒストグラムの偏りが大きいことを示すフラグPFが「1」か否かを判断し、「1」ならばステップS704へ、「1」以外ならこのかすれ文字処理を終了する。ステップS704では、処理中のブロックが「かすれ文字ブロック」か否かの判断を以下に示す(7)式により行う。
【0042】
SK0/SK > SR …(7)
ここで、SRは処理中のブロックが「かすれ文字ブロック」か否かを示す値であり、本実施形態では「SR=3.0」とする。ステップS704において、上記(7)式が真ならばステップS705へ、また偽ならばこのかすれ文字処理を終了する。そして、ステップS705では、処理中のブロックが「かすれ文字ブロック]であることを示す、かすれ文字フラグKFに「1」をセットし、このかすれ文字処理を終了する。
【0043】
このように、本実施形態におけるかすれ文字処理を行っているが、上記(7)式で示した条件は、これに限定されるものではない。
【0044】
ここで、具体的な画像の例を参照し、本実施形態の2値化処理について、更に詳細に説明する。
【0045】
まず、図8に示すヒストグラムの例を用いて、本実施形態における2値化閾値THの決定処理(図4)について説明する。
【0046】
図8は、つぶれ文字画像(8ビット入力)のヒストグラムを示すものである。図8において、横軸は左端が「0」即ち黒を、右端が「255」即ち白を表わす輝度のデジタル値である。そして、縦軸は各デジタル値の頻度を表わしている。図9は、図8に示すようなヒストグラムを有する画像に対して、前述した図4に示す2値化処理のステップS402とS403で算出される各パラメータの値の変化を示す図である。尚、図9に示される各パラメータの値はステップS402及びS403を通過する回数に対応してそれぞれ示されている。
【0047】
まず、ステップS402及びS403を通過する1回目の処理(閾値決定処理ループ回数i=0)では、START=0、END=255で平均値AV、統計量SKを計算し、それぞれ「109」、「−27.4」という値を得る。そして、i=0であるので、ステップS404からステップS405へ進む。ステップS405の画像特徴判別処理では、(5)式により統計量SKが「−20.0」未満であるため真となり、文字フラグMFに「1」がセットされ、ステップS414でSTART=0、END=109が設定される。
【0048】
次に、2回目の処理(i=1)では、START=0、END=109における平均値AV、統計量SKを計算し、それぞれ「62」、「8.9」という値を得る。統計量SKが「0.1」を越えるため、ステップS406からステップS407へ進み、i=1であるのでステップS408へ進む。ステップS408では、スキュー値SKがプラスのため、フラグPFは「0」のままとなる。そして、(6)式の結果が「−3.08(=−27.4/8.9)」と真なので、つぶれ文字フラグTFに「1」がセットされる。ステップS410では、フラグPFが「0」のままなのでかすれフラグKFは「0」のままである。更に、スキュー値SKがプラスのため、ステップS413でSTART=62、END=109が設定される。
【0049】
続いて、3回目の処理(i=2)では、START=62、END=109における平均値AV、統計量SKを計算し、それぞれ「84」、「1.9」という値を得る。この場合、統計量SKが「0.1」を超えるため、ステップS407、ステップS409へと進む。そして、スキュー値SKがプラスのため、ステップS413でSTART=84、END=109が設定される。
【0050】
続いて、4回目の処理(i=3)では、START=84、END=109における平均値AV、統計量SKを計算し、それぞれ「96」、「0.6」という値を得る。この場合、統計量SKが「0.1」を超えるため、ステップS407、ステップS409へと処理が続き、スキュー値SKがプラスのため、ステップS413でSTART=96、END=109が設定される。
【0051】
続いて、5回目の処理(i=4)では、START=96、END=109における平均値AV、計算量SKを計算し、それぞれ「102」、「−0.3」という値を得る。この場合は、統計量SKが「−0.1」未満のため、ステップS407、ステップS409へと処理が続き、スキュー値SKがマイナスのため、ステップS414でSTART=96、END=102が設定される。
【0052】
続いて、6回目の処理(i=5)では、START=96、END=102における平均値AV、計算量SKを計算し、それぞれ「98」、「0.3」という値を得る。この場合、統計量SKが「0.1」を超えるため、ステップS407、ステップS409へと処理が続き、スキュー値SKがプラスのため、ステップS413でSTART=98、END=102が設定される。
【0053】
続いて、7回目の処理(i=6)では、START=98、END=102における平均値AV、計算量SKを計算し、それぞれ「99」、「0.4」という値を得る。この場合、統計量SKが「0.1」を超えるため、ステップS407、ステップS409へと処理が続き、スキュー値SKがプラスのため、ステップS413でSTART=99、END=102が設定される。
【0054】
続いて、8回目の処理(i=7)では、START=99、END=102における平均値AV、計算量SKを計算し、それぞれ「100」、「0.2」という値を得る。この場合、統計量SKが「0.1」を超えるため、ステップS407、ステップS409へと処理が続き、スキュー値SKがプラスのため、ステップS413でSTART=100、END=102が設定される。
【0055】
続いて、9回目の処理(i=8)では、START=100、END=102における平均値AV、計算量SKを計算し、それぞれ「101」、「−0.2」という値を得る。この場合は、統計量SKが「−0.1」未満のため、ステップS407、ステップS409へと処理が続き、スキュー値SKがマイナスのため、ステップS414でSTART=100、END=101が設定される。
【0056】
続いて、10回目の処理(i=9)では、START=100、END=101における平均値AV、計算量SKを計算し、それぞれ「100」、「0.2」という値を得る。この場合、統計量SKが「0.1」を超えるが、閾値決定処理ループ回数iが「9」のため、ステップS409の判断でステップS416へと進み、閾値THに平均値AVである「100」をセットし、この閾値決定処理を終了する。但し、この例におけるブロックは、つぶれ文字フラグTHに「1」がセットされているため、図3のステップS305の判断が真となり、ステップS306で閾値に制限を受け、THには「85(=100×0.85)」がセットされ、ステップS307で2値化される(この場合TPに「0.85」がセットされている)。そして、2値化された画像が記憶部5に格納される。
【0057】
次に、図10に示すヒストグラムの例を用いて、本実施形態における2値化閾値THの決定処理(図4)について説明する。
【0058】
図10は、かすれ文字画像(8ビット入力)のヒストグラムを示すものである。図11は、図10に示すようなヒストグラムを有する画像に対して、前述した図4に示す2値化処理のステップS402とS403で算出される各パラメータの値の変化を示す図である。尚、図11に示される各パラメータの値はステップS402及びS403を通過する回数に対応してそれぞれ示されている。
【0059】
まず、ステップS402及びS403を通過する1回目の処理(閾値決定書るループ回数i=0)では、START=0、END=255で平均値AV、統計量SKを計算し、それぞれ「130」、「−60.2」という値を得る。そして、i=0であるので、ステップS404からステップS405へ進む。ステップS405の画像特徴判別処理では、(5)式により統計量SKが「−20.0」未満であるため真となり、文字フラグMFに「1」がセットされ、ステップS414でSTART=0、END=130が設定される。
【0060】
次に、2回目の処理(i=1)では、START=0、END=130における平均値AV、統計量SKを計算し、それぞれ「95」、「−19.3」という値を得る。統計量SKが「0.1」を超えるため、ステップS406からステップS407へ進み、i=1であるのでステップS408へ進む。ステップS408では、スキュー値SK、SK0が共にマイナスのため、フラグPFに「1」がセットされる。そして、(6)式の結果が「3.11(=−60.2/−19.3)]と偽なので、つぶれ文字フラグTFは「0」のままとなる。次に、ステップS410のかすれ文字処理では、文字フラグMF、フラグPF共に「1」なので、ステップS704で(7)式の計算を行い、結果が「3.11(=−60.2/−19.3)」と真なので、かすれ文字フラグKFに「1」をセットする。かすれフラグKFが「1」なので、ステップS411からステップS416へと進み、閾値THに平均値AVの「95」をセットし、この閾値決定処理を終了する。そして、図3のステップS307の2値化処理で2値化され、2値化された画像が記憶部5に格納される。
【0061】
以上説明したように、本実施形態においては、処理中のブロックが、「つぶれ文字ブロック」か、「かすれ文字ブロック」か判断し、ブロックの種類によってスキュー値に対する収束条件を設定し、スキュー値が所定条件まで収束するようにして2値化閾値を決定し、2値化を行う。即ち、入力された多値画像において、輝度頻度とその偏りに基づいて画像の特徴を判別し、画像内の背景と対象物をを分離するために最も適した閾値が存在する領域を特定した後、その特定領域の平均輝度値を持って2値化閾値とする。これにより、多値入力画像上の領域内における各画素の輝度値を背景と対象物との2つのクラスに分類する際の最適閾値を、自動的に求めることができる。
【0062】
[他の実施形態]
前述した実施形態では、入力画像はグレイ8ビットとしたが、これに限定する必要はなく、カラーであってもよい。つまりは、2値化するためのデータとして複数ビットの情報があればよく、限定されるものではない。
【0063】
また、ヒストグラムを算出する際の画像の処理ブロックも、64×64画素としたが、ブロックの大きさとして32×32画素でもよく限定しない。更には、ブロックの形は正方形でも長方形でもかまわない。つまり、処理ブロックを64×96画素のようにしてもよい。メモリの容量によっては、画像全面を処理ブロックとしてもよい。
【0064】
また、ヒストグラムを算出する際の画像のサンプリングについて、全画素でも、数画素おきでもよく限定しない。更に、平均AVや統計量SKなどの計算は、8ビットで行わなくてもよく、高速化、メモリ削減等のため、少ないビット数で演算するようにしてもよい。
【0065】
また、統計量SKの収束条件を「±0.1」としたが、これに限定するものではなく、別の条件を定めてもよく、統計量SKを用いて2値化の閾値を決定するように構成すればよく、限定しない。また、画像入力装置や画像入力条件により変化させる等、別の条件を定めてもよい。
【0066】
また、(5)式の文字ブロックの判定に関し、文字フラグMFを「−20.0」としたが、これに限定するものではなく、統計量SKを用いて文字ブロックの判定を行うよう、別の条件を定めてもよい。また、画像入力装置や画像入力条件により変化させる等、別の条件を定めてもよい。
【0067】
また、(6)式、(7)式でつぶれ文字ブロックやかすれ文字ブロックの判定にSR値を用い「3.0」としたが、これに限定するものではなく、統計量SKを用いてつぶれ文字ブロックやかすれ文字ブロックの判定を行うよう、別の条件を定めてもよい。また、画像入力装置や画像入力条件により変化させる等、別の条件を定めてもよい。
【0068】
また、閾値決定処理ループ回数iを10回で打ち切るようにしたが、この回数についても10回に限定されないのは言うまでもない。
【0069】
また、閾値の下限値Lと上限値Hについて、画像入力装置や画像入力条件により変化させる等、構成してもよい。
【0070】
また、つぶれ防止のために定数TPを用い「0.85」としたが、これに限定するものではなく、画像入力装置や画像入力条件により変化させる等、別の条件を定めてもよい。
【0071】
尚、本発明は複数の機器(例えば、ホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0072】
また、本発明の目的は前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(CPU若しくはMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0073】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0074】
プログラムコードを供給するための記憶媒体としては、例えばフロッピーディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0075】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0076】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0077】
【発明の効果】
以上説明したように、本発明によれば、多値画像の輝度頻度を所定のブロック毎に算出し、その輝度頻度の偏りを示すスキュー値に基づいて設定された輝度頻度領域におけるスキュー値が所定範囲内と判定された場合、処理ブロックがかすれ文字を含む場合、所定回数以内に前記所定範囲内と判定されなかった場合の何れかの場合に、その輝度頻度領域で算出された平均輝度値を、処理ブロックにおける多値画像を2値化するための2値化閾値に設定することにより、処理ブロックに応じた適切な2値化閾値を自動的に設定することができる。
【0078】
【図面の簡単な説明】
【図1】本実施形態における画像処理システムの構成を示すブロック図である。
【図2】本実施形態における文字認識処理を示すフローチャートである。
【図3】本実施形態における2値化処理を示すフローチャートである。
【図4】本実施形態における閾値決定処理を示すフローチャートである。
【図5】本実施形態における画像特徴判別処理を示すフローチャートである。
【図6】本実施形態におけるつぶれ文字処理を示すフローチャートである。
【図7】本実施形態におけるかすれ文字処理を示すフローチャートである。
【図8】本実施形態におけるつぶれ文字画像のヒストグラム例を示す図である。
【図9】本実施形態のつぶれ文字画像の2値化処理における各変数値の変遷例を示す図である。
【図10】本実施形態におけるかすれ文字画像のヒストグラム例を示す図である。
【図11】本実施形態のかすれ文字画像の2値化処理における各変数値の変遷例を示す図である。
【符号の説明】
1 画像処理装置
2 画像入力装置
3 画像表示装置
4 入力部
5 記憶部
6 輝度頻度累計部
7 画像特徴判別部
8 2値化閾値算出部
9 2値化部
10 文字認識部
11 画像処理部
12 出力部

Claims (6)

  1. 多値画像の輝度頻度を所定のブロック毎に算出し、該輝度頻度の偏りを示すスキュー値に基づいて前記輝度頻度の平均輝度値及びスキュー値を算出するための輝度頻度領域を設定する設定工程と、
    前記設定された輝度頻度領域における前記輝度頻度の平均輝度値及びスキュー値を算出する算出工程と、
    前記算出されたスキュー値が所定範囲内か否かを判定する判定工程と、
    前記判定工程で所定範囲内と判定された場合、処理ブロックがかすれ文字を含む場合、所定回数以内に前記所定範囲内と判定されなかった場合の何れかの場合に、前記算出工程で算出された平均輝度値を、当該処理ブロックにおける多値画像を2値化するための2値化閾値に設定する閾値設定工程とを有し、
    前記スキュー値が所定範囲外で、かつ、正の場合、前記輝度頻度の平均輝度値を始点とし、前記輝度頻度の最大輝度値を終点として前記輝度頻度領域を設定し、前記スキュー値が所定範囲外で、かつ、負の場合、前記輝度頻度の最小輝度値を始点とし、前記輝度頻度の平均輝度値を終点として前記輝度頻度領域を設定し、前記所定回数前記設定工程、前記算出工程、及び前記判定工程を繰り返すことを特徴とする画像処理方法。
  2. 前記2値化閾値を用いて前記多値画像を2値化する2値化工程を更に有することを特徴とする請求項1記載の画像処理方法。
  3. 前記かすれ文字は、前記スキュー値に基づいて判別されることを特徴とする請求項1記載の画像処理方法。
  4. 前記スキュー値は、各画素の輝度値と前記輝度頻度の平均輝度値との差に基づいて算出されることを特徴とする請求項1記載の画像処理方法。
  5. 前記スキュー値は、各画素の輝度値と前記輝度頻度の平均輝度値との差の奇数乗に基づいて算出されることを特徴とする請求項1記載の画像処理方法。
  6. 多値画像の輝度頻度を所定のブロック毎に算出し、該輝度頻度の偏りを示すスキュー値に基づいて前記輝度頻度の平均輝度値及びスキュー値を算出するための輝度頻度領域を設定する設定手段と、
    前記設定された輝度頻度領域における前記輝度頻度の平均輝度値及びスキュー値を算出する算出手段と、
    前記算出されたスキュー値が所定範囲内か否かを判定する判定手段と、
    前記判定手段で所定範囲内と判定された場合、処理ブロックがかすれ文字を含む場合、所定回数以内に前記所定範囲内と判定されなかった場合の何れかの場合に、前記算出手段で算出された平均輝度値を、当該処理ブロックにおける多値画像を2値化するための2値化閾値に設定する閾値設定手段とを有し、
    前記スキュー値が所定範囲外で、かつ、正の場合、前記輝度頻度の平均輝度値を始点とし、前記輝度頻度の最大輝度値を終点として前記輝度頻度領域を設定し、前記スキュー値が所定範囲外で、かつ、負の場合、前記輝度頻度の最小輝度値を始点とし、前記輝度頻度の平均輝度値を終点として前記輝度頻度領域を設定し、前記所定回数前記設定手段、前記算出手段、及び前記判定手段による処理を繰り返すことを特徴とする画像処理装置。
JP04175296A 1996-02-28 1996-02-28 画像処理方法及び装置 Expired - Fee Related JP3624045B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04175296A JP3624045B2 (ja) 1996-02-28 1996-02-28 画像処理方法及び装置
US08/807,605 US5956421A (en) 1996-02-28 1997-02-27 Image processing method and apparatus for determining a binarization threshold value used for binarizing a multi-valued image and performing binarization processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04175296A JP3624045B2 (ja) 1996-02-28 1996-02-28 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH09233322A JPH09233322A (ja) 1997-09-05
JP3624045B2 true JP3624045B2 (ja) 2005-02-23

Family

ID=12617163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04175296A Expired - Fee Related JP3624045B2 (ja) 1996-02-28 1996-02-28 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP3624045B2 (ja)

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5593365A (en) * 1979-01-09 1980-07-15 Ricoh Co Ltd Judging method for video quality
JPS5840976A (ja) * 1981-09-03 1983-03-10 Konishiroku Photo Ind Co Ltd 画像記録方法
JPS58111570A (ja) * 1981-12-25 1983-07-02 Konishiroku Photo Ind Co Ltd 画像判別装置
JPS58106570A (ja) * 1981-12-19 1983-06-24 Konishiroku Photo Ind Co Ltd 画像判別装置
JPS58115976A (ja) * 1981-12-28 1983-07-09 Konishiroku Photo Ind Co Ltd 画像判別装置
JPS58129875A (ja) * 1981-12-25 1983-08-03 Konishiroku Photo Ind Co Ltd 画像判別装置
JPS58116870A (ja) * 1981-12-28 1983-07-12 Konishiroku Photo Ind Co Ltd 画像判別装置
JPS58154969A (ja) * 1982-03-09 1983-09-14 Konishiroku Photo Ind Co Ltd 画像判別方法
JPS58197960A (ja) * 1982-05-13 1983-11-17 Konishiroku Photo Ind Co Ltd 画像処理方法及び装置
JPS58215882A (ja) * 1982-06-07 1983-12-15 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン ドキユメント分類方法
JPS5954376A (ja) * 1982-09-21 1984-03-29 Konishiroku Photo Ind Co Ltd 画像処理方法
JPS59133770A (ja) * 1983-01-19 1984-08-01 Konishiroku Photo Ind Co Ltd 画像判別装置
JPS59168767A (ja) * 1983-03-14 1984-09-22 Konishiroku Photo Ind Co Ltd 画像判別方法
JPS6039980A (ja) * 1983-08-12 1985-03-02 Konishiroku Photo Ind Co Ltd 画像読取装置
JPS6135673A (ja) * 1984-07-27 1986-02-20 Konishiroku Photo Ind Co Ltd 領域抽出方法
JPS6170859A (ja) * 1984-09-14 1986-04-11 Hitachi Ltd 画像情報の処理方法
JPS6180961A (ja) * 1984-09-28 1986-04-24 Fuji Xerox Co Ltd 画信号処理方法
JPS61150574A (ja) * 1984-12-25 1986-07-09 Fuji Xerox Co Ltd 中間調記録装置
JPS6238667A (ja) * 1985-08-14 1987-02-19 Hitachi Ltd 画像領域分離方法
JPH0636552B2 (ja) * 1986-08-06 1994-05-11 キヤノン株式会社 画質制御装置
JPS6340462A (ja) * 1986-08-06 1988-02-20 Canon Inc 画質制御装置
JPH0681251B2 (ja) * 1988-05-31 1994-10-12 松下電器産業株式会社 画像処理装置
JPH02195774A (ja) * 1989-01-25 1990-08-02 Fujitsu Ltd 多値画像の2値化方式
JPH02205984A (ja) * 1989-02-06 1990-08-15 Canon Inc 画像処理装置
JPH0344272A (ja) * 1989-07-12 1991-02-26 Konica Corp カラー画像処理装置
JPH03181276A (ja) * 1989-12-11 1991-08-07 Canon Inc 画像複写装置
JPH05260296A (ja) * 1991-04-12 1993-10-08 Nippon Telegr & Teleph Corp <Ntt> カラー画像入出力処理方法
JPH0548891A (ja) * 1991-08-20 1993-02-26 Omron Corp 画像領域分離装置
JPH0563973A (ja) * 1991-08-30 1993-03-12 Omron Corp 画像領域識別装置
JPH0563972A (ja) * 1991-08-30 1993-03-12 Omron Corp 画像領域識別装置
JPH0567210A (ja) * 1991-09-09 1993-03-19 Seiko Epson Corp 画像領域検出装置
JPH0575865A (ja) * 1991-09-10 1993-03-26 Ricoh Co Ltd デジタル複写機
JP3216165B2 (ja) * 1991-09-17 2001-10-09 オムロン株式会社 画像領域識別装置および画像領域識別方法
JPH05130397A (ja) * 1991-10-31 1993-05-25 Canon Inc 画像処理装置
JP2910000B2 (ja) * 1991-12-19 1999-06-23 国際電信電話 株式会社 2値画像混在静止自然画像の符号化方法
JPH06284281A (ja) * 1993-03-25 1994-10-07 Toshiba Corp 画像処理装置
JP2800633B2 (ja) * 1993-04-30 1998-09-21 富士ゼロックス株式会社 画像符号化装置
JPH0721371A (ja) * 1993-06-15 1995-01-24 Canon Inc 画像処理装置
JP3165589B2 (ja) * 1994-06-06 2001-05-14 シャープ株式会社 画像分類装置

Also Published As

Publication number Publication date
JPH09233322A (ja) 1997-09-05

Similar Documents

Publication Publication Date Title
US7221790B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
JP4219542B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
US7738734B2 (en) Image processing method
US5995665A (en) Image processing apparatus and method
EP1569170A1 (en) Characteristic region extraction device, characteristic region extraction method, and characteristic region extraction program
US8265345B2 (en) Image processing method, image processing apparatus, image forming apparatus, and image reading apparatus
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US10855882B2 (en) Image processing to set an output gradation number based on an information-loss evaluation value
EP0731599B1 (en) Image processing apparatus and method therefor
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US7986838B2 (en) Image processing apparatus and image processing method
JPH11213160A (ja) 画像処理方法及び装置及びその記憶媒体
CN106488074A (zh) 图像处理装置以及电子文件生成方法
JP3624045B2 (ja) 画像処理方法及び装置
JP4135656B2 (ja) 画像領域判定方法、画像処理装置およびプログラム
JP2008252877A (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体
US20200175308A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JPH08221512A (ja) 画像処理装置及びその方法
JP6441772B2 (ja) 画像処理装置、画像形成装置、及び、画像処理方法
JPH08221513A (ja) 画像処理装置及びその方法
JPH08221515A (ja) 画像処理装置
JPH09238253A (ja) 画像処理装置及びその方法
JP2000261666A (ja) 画像処理装置
JP2000013611A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040212

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040310

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees