JP3871876B2 - 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3871876B2
JP3871876B2 JP2000340944A JP2000340944A JP3871876B2 JP 3871876 B2 JP3871876 B2 JP 3871876B2 JP 2000340944 A JP2000340944 A JP 2000340944A JP 2000340944 A JP2000340944 A JP 2000340944A JP 3871876 B2 JP3871876 B2 JP 3871876B2
Authority
JP
Japan
Prior art keywords
density
value
minimum
density value
binarization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000340944A
Other languages
English (en)
Other versions
JP2002150276A (ja
Inventor
昌利 大西
博史 亀山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2000340944A priority Critical patent/JP3871876B2/ja
Publication of JP2002150276A publication Critical patent/JP2002150276A/ja
Application granted granted Critical
Publication of JP3871876B2 publication Critical patent/JP3871876B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、該作成した濃度ヒストグラムに基づいて選択された二値化しきい値により前記濃度画像を二値化する二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体に関し、特に、帳票の登録時および照合時において適切な二値化しきい値を選択し、もって帳票の濃度画像を安定して二値化することができる二値化装置、二値化方法および記録媒体に関する。
【0002】
【従来の技術】
従来、帳票の本質的特徴である罫線を利用して帳票の種類を判別する場合には、入力された帳票の濃度画像を二値画像に変換し、当該二値画像から罫線の特徴を抽出して帳票の種類を判別することが多い。
【0003】
この濃度画像を二値画像に変換する二値化処理は、所定のしきい値以上の濃度値を有する画素を値「0」の白画素に変換するとともに、このしきい値よりも小さな濃度値を有する画素を値「1」の黒画素に変換する処理である。そして、この二値化処理に際しては、入力された濃度画像から濃度ヒストグラムを作成し、当該濃度ヒストグラムに基づいて所定のしきい値を選択する。
【0004】
ここで、濃度画像から作成される濃度ヒストグラムの概念を説明する。図3は、帳票の一例を示す図であり、同図(a)は、未記入の帳票、すなわち帳票登録時の帳票を示し、同図(b)は、記入済みの帳票、すなわち帳票照合時の帳票を示す。また、図4(a)は、図3(a)に示した帳票から作成される濃度ヒストグラムの一例を示す図であり、図4(b)は、図3(b)に示した帳票から作成される濃度ヒストグラムの一例を示す図である。
【0005】
図3(a)および(b)に示す帳票は、同じ種類の帳票であるが、それぞれの帳票から作成される濃度ヒストグラムは、図4(a)および(b)に示すように同一のものとはならない。すなわち、図4(a)および(b)を比較すると、全体的な山の形は変化していないが、各山の形は若干変化し、また、各山が全体的に高濃度値側に移動している。この濃度ヒストグラムの変化は、帳票の濃度画像をスキャナで入力するときの帳票の傾き、帳票登録時のスキャナと帳票照合時のスキャナとの間の機差、同機種のスキャナ間で生じる個体差、帳票への文字記入の有無、帳票の経年変化などの影響である。
【0006】
このため、帳票の登録時および照合時において、逐次濃度ヒストグラムを作成してしきい値を選択する必要がある。たとえば、このしきい値を選択する技術として「判別基準法」と呼ばれる技術が知られている。この「判別基準法」は、濃度画像から濃度ヒストグラムを作成し、当該濃度ヒストグラムにおいて、分離する二つのクラスのクラス間分散が最大となる濃度値をしきい値として選択するものである。
【0007】
【発明が解決しようとする課題】
しかしながら、上記の従来技術は、濃度ヒストグラムにおいて二つの山が現れるような濃度画像に基づいてしきい値を選択するものであり、濃度ヒストグラムにおいて三つ以上の山が現れるような多色刷り帳票であって、登録時と照合時とで濃度ヒストグラムが変化するような帳票に対しては、適切なしきい値を選択することができないという問題点がある。
【0008】
たとえば、図4(a)および(b)に示した濃度ヒストグラムにおいて、判別基準法を用いてしきい値を選択すると、同図に示すように、P1およびP2の濃度値がしきい値として選択される。すなわち、図4(a)に示した濃度ヒストグラムでは、低濃度値側から数えて二番目の山における高濃度値側の中腹部分においてしきい値P1が選択され、一方、図4(b)に示した濃度ヒストグラムでは、低濃度値側から数えて二番目の山における低濃度値側の中腹部分においてしきい値P2が選択される。なお、低濃度値側から数えて二番目の山は、図3(a)および(b)に示した帳票の網掛け部分の濃度値が反映されたものである。
【0009】
また、図6(a)は、図4(a)に示したしきい値P1によって二値化した場合の二値画像の一例を示す図であり、図6(b)は、図4(b)に示したしきい値P2によって二値化した場合の二値画像の一例を示す図である。図6(a)および(b)に示す二値画像は、同じ種類の帳票の二値画像であるが、網掛け部分の二値化処理が異なるため、大きく相違した二値画像になってしまう。このような二値画像を用いたのでは、同じ種類の帳票であるにもかかわらず同様の罫線特徴を抽出することができず、結局、帳票の種類を安定して判別することが不可能になる。
【0010】
そこで、帳票の登録時の濃度ヒストグラムと帳票の照合時の濃度ヒストグラムとが相違するような場合に、いかに適切なしきい値を選択して二値化するかが極めて重要な課題となっている。
【0011】
この発明は、上述した従来技術による問題点を解決するためになされたものであり、帳票の登録時および照合時において適切な二値化しきい値を選択し、もって帳票の濃度画像を安定して二値化することができる二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0012】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、請求項1の発明に係る二値化装置は、入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、該作成した濃度ヒストグラムに基づいて選択された二値化しきい値により前記濃度画像を二値化する二値化装置において、前記濃度ヒストグラムにおいて所定の濃度値以下の累積画素数と前記所定の濃度値を越える累積画素数とが所定の比率となるように前記所定の濃度値を決定した後、前記所定の濃度値が前記濃度ヒストグラムの谷部に属しない場合には、該濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、前記所定の濃度値が前記濃度ヒストグラムの谷部に属する場合には、該谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出する検出手段と、前記検出手段により検出された極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択する選択手段とを備えたことを特徴とする。
【0013】
また、請求項の発明に係る二値化装置は、請求項に記載の発明において、前記選択手段は、前記検出手段によって検出された極小値の濃度値に前記濃度ヒストグラムの最低濃度値または最高濃度値が含まれる場合には、当該最低濃度値または最高濃度値以外の極小値のうちから二値化しきい値を選択することを特徴とする。
【0014】
また、請求項の発明に係る二値化方法は、入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、該作成した濃度ヒストグラムに基づいて選択された二値化しきい値により前記濃度画像を二値化する二値化方法において、前記濃度ヒストグラムにおいて所定の濃度値以下の累積画素数と前記所定の濃度値を越える累積画素数とが所定の比率となるように前記所定の濃度値を決定した後、前記所定の濃度値が前記濃度ヒストグラムの谷部に属しない場合には、該濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、前記所定の濃度値が前記濃度ヒストグラムの谷部に属する場合には、該谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出する検出工程と、前記検出工程により検出された極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択する選択工程とを含んだことを特徴とする。
【0015】
また、請求項の発明に係る記録媒体は、請求項に記載された方法をコンピュータに実行させるプログラムを記録したことで、そのプログラムを機械読み取り可能となり、これによって、請求項の動作をコンピュータによって実行することができる。
【0016】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の好適な実施の形態を詳細に説明する。
【0017】
図1は、本実施の形態に係る二値化装置の構成を示す機能ブロック図である。同図に示す二値化装置10は、帳票の本質的特徴である罫線を利用して帳票の種類を判別する帳票類判別技術に用いられる装置であり、具体的には、帳票を判別時の比較対象として辞書登録する場合や、判別対象となる帳票の画像を入力して帳票の種別を判定する場合において、罫線の特徴を安定して得るために、適切な二値化しきい値を選択して帳票の濃度画像を二値化する装置である。
【0018】
図1に示すように、この二値化装置10は、画像入力部11と、濃度ヒストグラム作成部12と、極小値検出部13と、二値化しきい値選択部14と、二値化処理部15と、出力部16とからなる。なお、この極小値検出部13は請求項1に記載の検出手段に対応し、二値化しきい値選択部14は請求項1に記載の選択手段に対応する。
【0019】
画像入力部11は、帳票の画像データを光学的に入力するスキャナであり、入力した画像データを濃度ヒストグラム作成部12および二値化処理部15に出力する。なお、この画像入力部11は、モノクロスキャナであって、256階調からなる濃度画像を出力するものとする。
【0020】
濃度ヒストグラム作成部12は、画像入力部11から受け取った濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成する処理部であり、作成した濃度ヒストグラムを極小値検出部13に出力する。
【0021】
極小値検出部13は、濃度ヒストグラム作成部12から受け取った濃度ヒストグラムの所定の濃度値付近に位置する複数の極小値を検出する処理部であり、検出した極小値を二値化しきい値選択部14に出力する。具体的には、所定の濃度値以下の累積画素数と所定の濃度値を越える累積画素数とが所定の比率となるように、すなわち濃度ヒストグラムを所定の面積比に分割するように所定の濃度値を検出し、検出した濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値、すなわち画素数分布が極小となる濃度値とその画素数を検出する。
【0022】
また、この極小値検出部13は、所定の濃度値が濃度ヒストグラムの谷部、すなわち濃度ヒストグラムの曲線上において下に凸となる変曲点間に属する場合には、この谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出する。
【0023】
なお、所定の面積比は、所定の濃度値が濃度ヒストグラムの中央付近で検出されるように、たとえば、(低濃度値側面積:高濃度値側面積)=(4:6)、あるいは(低濃度値側面積:高濃度値側面積)=(5:5)のようにあらかじめ設定され、全ての種類の帳票に対して固定のものである。このように極小値の検出に際して面積比を基準とした理由は、同一の帳票から作成される濃度ヒストグラムの山の形が変化するような場合でも面積比は変動しにくいからである。
【0024】
二値化しきい値選択部14は、極小値検出部13から受け取った複数の極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択する処理部であり、選択した二値化しきい値を二値化処理部15に出力する。具体的には、極小値として検出された濃度値の画素数を比較し、最小の画素数を有する濃度値を二値化しきい値として選択する。
【0025】
また、二値化しきい値選択部14は、極小値検出部13から受け取った極小値の濃度値に濃度ヒストグラムの最低濃度値または最高濃度値が含まれる場合には、最低濃度値または最高濃度値以外の極小値のうちから二値化しきい値を選択する。このように濃度ヒストグラムの最低濃度値および最高濃度値を除外して二値化しきい値を選択することとした理由は、最低濃度値または最高濃度値で二値化処理すると、真白または真黒の二値画像が作成されて帳票の罫線の特徴を抽出できないからである。
【0026】
二値化処理部15は、二値化しきい値選択部14から受け取った二値化しきい値により、画像入力部11から受け取った濃度画像を二値化する処理部である。具体的には、二値化しきい値以上の濃度値を有する画素を値「0」の白画素に変換するとともに、この二値化しきい値よりも小さな濃度値を有する画素を値「1」の黒画素に変換する。
【0027】
出力部16は、二値化処理部15から受け取った二値画像を、図示しない罫線特徴抽出部、すなわち二値画像から罫線の特徴を抽出する処理部に出力する処理部である。
【0028】
次に、本実施の形態に係る二値化装置による二値化処理手順について具体例を用いて説明する。図2は、図1に示した二値化装置10による二値化しきい値の選択処理手順を示すフローチャートである。
【0029】
また、図3は、本実施の形態で二値化対象とする帳票の一例を示す図であり、図4は、図3に示した帳票から作成される濃度ヒストグラムの一例を示す図であり、図5は、図4に示した濃度ヒストグラムに基づいて選択された二値化しきい値により二値化した場合の二値画像の一例を示す図である。
【0030】
図2に示すように、まず最初に、帳票の濃度画像を画像入力部11から取り込み(ステップS201)、この濃度画像から濃度ヒストグラムを作成する(ステップS202)。具体的には、濃度画像から濃度値x{x=0〜L(255)}ごとに画素数h(x)を算出する。
【0031】
たとえば、図3(a)および(b)に示した帳票の濃度画像からは、図4(a)および(b)に示すような濃度ヒストグラムがそれぞれ作成される。なお、図4(a)および(b)に示すように、同じ種類の帳票から作成された濃度ヒストグラムが相違しているのは、帳票入力時の帳票の傾き、帳票登録時のスキャナと帳票照合時のスキャナとの間の機差、同機種のスキャナ間で生じる個体差、帳票への文字記入の有無、帳票の経年変化などの影響である。
【0032】
そして、極小値検出部13は、濃度ヒストグラムを所定の面積比に分割する濃度値を検出する(ステップS203)。具体的には、濃度値0〜Lまでの累積画素数、すなわち濃度ヒストグラムの全面積Sに対して、濃度値0〜xまでの面積S1が所定の面積比(k1%)以下となるような最大の濃度値αを検出する。
【0033】
その後、極小値検出部13は、濃度値αが谷部に属するか否かを判定する(ステップS204)。濃度値αが谷部に属しない場合には(ステップS204否定)、ボックスAに濃度ヒストグラムの全面積Sをセットする(ステップS206)。一方、濃度値αが谷部に属する場合には(ステップS204肯定)、当該谷部において極小値をとる濃度値を検出し、検出した濃度値を改めて濃度値αとするとともに、ボックスAに当該濃度値αの画素数h(α)をセットする(ステップS205)。
【0034】
たとえば、図4(a)および(b)に示した濃度ヒストグラムにおいては、それぞれ図示するように濃度値α1および濃度値α2が検出され、この濃度値α1および濃度値α2は谷部に属さないため、いずれの帳票の場合もボックスAに濃度ヒストグラムの全面積Sがセットされる。
【0035】
その後、極小値検出部13は、濃度値αの高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出する(ステップS207〜S208)。具体的には、濃度値α+1〜Lの範囲の極小値であって、数式(x−α)が最小となる濃度値を検出し、検出した濃度値を濃度値βとするとともに、ボックスBに当該濃度値βの画素数h(β)をセットする(ステップS207)。また、濃度値0〜αの範囲の極小値であって、数式(α−x)が最小となる濃度値を検出し、検出した濃度値を濃度値γとするとともに、ボックスCに当該濃度値γの画素数h(γ)をセットする(ステップS208)。
【0036】
そして、極小値検出部13は、濃度値βが濃度ヒストグラムの最高濃度値であるか否かを判定する(ステップS209)。具体的には、濃度値0〜Lまでの濃度ヒストグラムの全面積Sに対して、濃度値β〜Lまでの面積S2が所定の面積比(k2%)以上となるか否かを判定し、これを越えない場合には(ステップS209否定)、濃度値βが濃度ヒストグラムの最高濃度値であるものとして、ボックスBに濃度ヒストグラムの全面積Sをセットする(ステップS210)。
【0037】
たとえば、図4(a)および(b)に示した濃度ヒストグラムにおいては、それぞれ図示するように濃度値β1および濃度値β2が検出され、この濃度値β1および濃度値β2は濃度ヒストグラムの最高濃度値ではないため、つまり、面積S2がk2%以上であるため、いずれの帳票の場合もボックスBに濃度値β1の画素数h(β1)、濃度値β2の画素数h(β2)がセットされる。
【0038】
その後、極小値検出部13は、濃度値γが濃度ヒストグラムの最低濃度値であるか否かを判定する(ステップS211)。具体的には、濃度値γが画素数h(x)>0を満たす濃度値xの最小値であるか否かを判定し、最小値である場合には(ステップS211肯定)、濃度値γが濃度ヒストグラムの最低濃度値であるものとして、ボックスCに濃度ヒストグラムの全面積Sをセットする(ステップS212)。
【0039】
たとえば、図4(a)および(b)に示した濃度ヒストグラムにおいては、それぞれ図示するように濃度値γ1および濃度値γ2が検出され、この濃度値γ1および濃度値γ2は濃度ヒストグラムの最低濃度値ではないため、いずれの帳票の場合もボックスCに濃度値γ1の画素数h(γ1)、濃度値γ2の画素数h(γ2)がセットされる。
【0040】
そして、二値化しきい値選択部14は、ボックスA〜Cにセットされた値がいずれも濃度ヒストグラムの全面積Sであるか否かを判定し(ステップS213)、いずれも濃度ヒストグラムの全面積Sである場合には(ステップS213肯定)、この帳票は仕様外の帳票であるとしてリジェクトする。
【0041】
一方、ボックスA〜Cにセットされた値に濃度ヒストグラムの全面積S以外の値がセットされている場合には(ステップS213否定)、二値化しきい値選択部14は、ボックスA〜Cにセットされた値を比較して二値化しきい値を選択する(ステップS214)。具体的には、ボックスA〜Cにセットされた値のうちで、Aが最小値である場合には濃度値αを二値化しきい値として選択し、Bが最小値である場合には濃度値βを二値化しきい値として選択し、Cが最小値である場合には濃度値γを二値化しきい値として選択する。
【0042】
たとえば、図4(a)および(b)に示した濃度ヒストグラムにおいては、それぞれボックスCにセットされた値、すなわち画素数h(γ1)および画素数h(γ2)が最小値になるため、図示する濃度値γ1および濃度値γ2が二値化しきい値としてそれぞれ選択される。
【0043】
その後、二値化しきい値選択部14は、選択した二値化しきい値を二値化処理部15に出力し、二値化処理部15は、この二値化しきい値により帳票の濃度画像を二値化する。たとえば、図4(a)および(b)に示した濃度ヒストグラムに基づいて選択された二値化しきい値、すなわち濃度値γ1および濃度値γ2により二値化処理をおこなった場合には、図5(a)および(b)に示すように、いずれの帳票も網掛け部分が黒画素に変換された二値画像が作成される。
【0044】
上記一連の処理をおこなうことにより、図4に示すように同種の帳票から異なった濃度ヒストグラムが作成される場合でも、適切な二値化しきい値を選択して、図5に示すように同様の罫線特徴を抽出することが可能な二値画像を作成することができる。なお、図5(b)では記入文字が残っているが、図示しない罫線特徴抽出部では、これら記入文字の影響を殆ど受けずに罫線の特徴のみを抽出するので、図5(a)および(b)は同一の帳票と判別されることになる。
【0045】
上述してきたように、本実施の形態によれば、極小値検出部13が濃度ヒストグラム作成部12から受け取った濃度ヒストグラムの所定の濃度値付近に位置する複数の極小値を検出し、二値化しきい値選択部14が極小値検出部13により検出された複数の極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択するよう構成したので、帳票の登録時および照合時において適切な二値化しきい値を選択し、もって帳票の濃度画像を安定して二値化することができる。
【0046】
なお、本実施の形態で説明した二値化方法は、あらかじめ用意されたプログラムをパーソナル・コンピューターやワークステーションなどのコンピュータで実行することによって実現することができる。このプログラムは、ハードディスク、フロッピーディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、上記記録媒体を介して、インターネットなどのネットワークを介して配布することができる。
【0047】
【発明の効果】
以上説明したように、請求項1の発明によれば、入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、作成した濃度ヒストグラムにおいて所定の濃度値以下の累積画素数と所定の濃度値を越える累積画素数とが所定の比率となるように所定の濃度値を決定した後、所定の濃度値が濃度ヒストグラムの谷部に属しない場合には、該濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、所定の濃度値が濃度ヒストグラムの谷部に属する場合には、該谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、検出された極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択することとしたので、帳票の登録時と照合時における濃度ヒストグラムの変化に適切に対応して二値化しきい値を選択すること、つまり、ノイズや記入文字などによって濃度ヒストグラムの山の形が変形するような場合でも適切な二値化しきい値を選択することが可能であり、もって帳票の濃度画像を安定して二値化することが可能な二値化装置が得られるという効果を奏する。
【0048】
また、請求項の発明によれば、検出された極小値の濃度値に濃度ヒストグラムの最低濃度値または最高濃度値が含まれる場合には、当該最低濃度値または最高濃度値以外の極小値のうちから二値化しきい値を選択することとしたので、真白または真黒の二値画像が作成されてしまうことを防ぎ、もって帳票の濃度画像を安定して二値化することが可能な二値化装置が得られるという効果を奏する。
【0049】
また、請求項の発明によれば、入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、作成した濃度ヒストグラムにおいて所定の濃度値以下の累積画素数と所定の濃度値を越える累積画素数とが所定の比率となるように所定の濃度値を決定した後、所定の濃度値が濃度ヒストグラムの谷部に属しない場合には、該濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、所定の濃度値が濃度ヒストグラムの谷部に属する場合には、該谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、検出された極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択することとしたので、帳票の登録時と照合時における濃度ヒストグラムの変化に適切に対応して二値化しきい値を選択すること、つまり、ノイズや記入文字などによって濃度ヒストグラムの山の形が変形するような場合でも適切な二値化しきい値を選択することが可能であり、もって帳票の濃度画像を安定して二値化することが可能な二値化方法が得られるという効果を奏する。
【0050】
また、請求項の発明によれば、請求項に記載された方法をコンピュータに実行させるプログラムを記録したことで、そのプログラムを機械読み取り可能となり、これによって、請求項の動作をコンピュータによって実現することが可能な記録媒体が得られるという効果を奏する。
【図面の簡単な説明】
【図1】 本実施の形態に係る二値化装置の構成を示す機能ブロック図である。
【図2】 図1に示した二値化装置による二値化しきい値の選択処理手順を示すフローチャートである。
【図3】 本実施の形態で二値化対象とする帳票の一例を示す図である。
【図4】 図3に示した帳票から作成される濃度ヒストグラムの一例を示す図である。
【図5】 図4に示した濃度ヒストグラムに基づいて選択された二値化しきい値により二値化した場合の二値画像の一例を示す図である。
【図6】 従来技術の判別基準法を用いて選択された二値化しきい値により二値化した場合の二値画像の一例を示す図である。
【符号の説明】
10 二値化装置
11 画像入力部
12 濃度ヒストグラム作成部
13 極小値検出部
14 二値化しきい値選択部
15 二値化処理部
16 出力部

Claims (4)

  1. 入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、該作成した濃度ヒストグラムに基づいて選択された二値化しきい値により前記濃度画像を二値化する二値化装置において、
    前記濃度ヒストグラムにおいて所定の濃度値以下の累積画素数と前記所定の濃度値を越える累積画素数とが所定の比率となるように前記所定の濃度値を決定した後、前記所定の濃度値が前記濃度ヒストグラムの谷部に属しない場合には、該濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、前記所定の濃度値が前記濃度ヒストグラムの谷部に属する場合には、該谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出する検出手段と、
    前記検出手段により検出された極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択する選択手段と
    を備えたことを特徴とする二値化装置。
  2. 前記選択手段は、前記検出手段によって検出された極小値の濃度値に前記濃度ヒストグラムの最低濃度値または最高濃度値が含まれる場合には、当該最低濃度値または最高濃度値以外の極小値のうちから二値化しきい値を選択することを特徴とする請求項1に記載の二値化装置。
  3. 入力された濃度画像から濃度値ごとの画素数分布を示す濃度ヒストグラムを作成し、該作成した濃度ヒストグラムに基づいて選択された二値化しきい値により前記濃度画像を二値化する二値化方法において、
    前記濃度ヒストグラムにおいて所定の濃度値以下の累積画素数と前記所定の濃度値を越える累積画素数とが所定の比率となるように前記所定の濃度値を決定した後、前記所定の濃度値が前記濃度ヒストグラムの谷部に属しない場合には、該濃度値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出し、前記所定の濃度値が前記濃度ヒストグラムの谷部に属する場合には、該谷部の極小値を検出するとともに、当該検出した極小値から高濃度値方向および低濃度値方向にそれぞれ最初に現れる極小値を検出する検出工程と、
    前記検出工程により検出された極小値のうちで最小値となる極小値の濃度値を二値化しきい値として選択する選択工程と
    を含んだことを特徴とする二値化方法。
  4. 前記請求項に記載された方法をコンピュータに実行させるプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2000340944A 2000-11-08 2000-11-08 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3871876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000340944A JP3871876B2 (ja) 2000-11-08 2000-11-08 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000340944A JP3871876B2 (ja) 2000-11-08 2000-11-08 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002150276A JP2002150276A (ja) 2002-05-24
JP3871876B2 true JP3871876B2 (ja) 2007-01-24

Family

ID=18815771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000340944A Expired - Fee Related JP3871876B2 (ja) 2000-11-08 2000-11-08 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3871876B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093472A (ja) * 2007-10-10 2009-04-30 Mitsubishi Electric Corp 文字表示領域検出装置及びその方法、並びに携帯端末

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4867903B2 (ja) * 2007-12-06 2012-02-01 セイコーエプソン株式会社 画像処理プログラム及び画像処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093472A (ja) * 2007-10-10 2009-04-30 Mitsubishi Electric Corp 文字表示領域検出装置及びその方法、並びに携帯端末
JP4613941B2 (ja) * 2007-10-10 2011-01-19 三菱電機株式会社 文字表示領域検出装置及びその方法、並びに携帯端末

Also Published As

Publication number Publication date
JP2002150276A (ja) 2002-05-24

Similar Documents

Publication Publication Date Title
EP1146478B1 (en) A method for extracting titles from digital images
US7813554B2 (en) Method and apparatus of extracting text from document image with complex background, computer program and storage medium thereof
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US20050201619A1 (en) Video text processing apparatus
JP4339925B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
CN112861865B (zh) 一种基于ocr技术的辅助审计方法
JPH05225378A (ja) 文書画像の領域分割システム
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
WO2000062243A1 (fr) Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
US6269186B1 (en) Image processing apparatus and method
JP3871876B2 (ja) 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Ranka et al. Automatic table detection and retention from scanned document images via analysis of structural information
JP2861860B2 (ja) 宛名行抽出装置
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
JP2001291058A (ja) 文字認識装置及び記録媒体
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP3020293B2 (ja) 属性判別方法
Boiangiu et al. Automatic Correction of OCR Results Using Similarity Detection for Words and Fonts
JP2005208979A (ja) 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091027

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101027

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111027

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111027

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121027

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121027

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131027

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131027

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees