JP3759349B2 - 画像解析装置と画像解析方法 - Google Patents

画像解析装置と画像解析方法 Download PDF

Info

Publication number
JP3759349B2
JP3759349B2 JP25345399A JP25345399A JP3759349B2 JP 3759349 B2 JP3759349 B2 JP 3759349B2 JP 25345399 A JP25345399 A JP 25345399A JP 25345399 A JP25345399 A JP 25345399A JP 3759349 B2 JP3759349 B2 JP 3759349B2
Authority
JP
Japan
Prior art keywords
histogram
image
value
pixel
brightness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25345399A
Other languages
English (en)
Other versions
JP2001076096A (ja
Inventor
佳孝 濱口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP25345399A priority Critical patent/JP3759349B2/ja
Publication of JP2001076096A publication Critical patent/JP2001076096A/ja
Application granted granted Critical
Publication of JP3759349B2 publication Critical patent/JP3759349B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、多値画像中に含まれる処理対象となる画像の形状解析に利用される画像解析装置と画像解析方法に関する。
【0002】
【従来の技術】
例えば、帳票に記入された文字を認識する場合に、帳票に予め印刷された枠と、その枠の中に記入された文字とを区別して、文字の部分を切り出し、認識を行うといった処理がされる。帳票が多値画像で処理される場合に、文字と背景色とのコントラストが十分にある場合、2値化をして文字の画像を抽出することが可能である。しかしながら、実際には、微妙な濃淡の変化が存在することが多い。そこで、ヒストグラム等によって濃淡の境目を検出し、その境目の値を閾値として、一方を背景色他方を対象物の画像とするといった方式が採用されている。(画像解析ハンドブック第502ページ〜第505ページ 高木幹雄、下田陽久監修 東京大学出版)
【0003】
【発明が解決しようとする課題】
ところで、上記のような従来の技術には次のような解決すべき課題があった。
例えば、帳票に、2種以上の濃度の異なる背景色を施した部分が設けられ、それぞれの部分に文字が記入されていたとする。このような場合にはヒストグラムが複雑になり、単純に1つの閾値を用いて2値化処理をすることができなくなる。また、例えば白抜き文字等が存在した場合には、2値化処理をしてもOCR(光学的文字読み取り装置)によって文字を認識することができない。
【0004】
【課題を解決するための手段】
本発明は以上の点を解決するため次の構成を採用する。
〈構成1〉
解析対象となる画像に含まれる各画素の明度値を読み取り、それぞれ同一の明度値を持つ画素の数を計数して、明度値毎の画素数の分布を示すヒストグラムを生成する明度値ヒストグラム生成部と、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成する黒孤立点ヒストグラム生成部と、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき、画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成する白孤立点ヒストグラム生成部と、上記明度値ヒストグラムを、一定以上の大きさのピークを含み、これらのピーク間に挟まれた明度値が極小値を示す位置を境界とする、複数の明度領域に分割する明度領域分割部と、上記各明度領域において、上記黒孤立点ヒストグラムと上記白孤立点ヒストグラムとを参照して、上記ピークの前後の明度値において、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者が十分に近似しているとき、上記ピークの明度値を持つ画素群を背景色を描画する画素群と判定する属性判定部とを備えたことを特徴とする画像解析装置。
【0005】
〈構成2〉
構成1に記載の画像解析装置において、属性判定部において背景色を描画すると判定された画素群を白画素とし、当該画素群以外の画素群を黒画素にする2値化部を備えたことを特徴とする画像解析装置。
【0006】
〈構成3〉
構成2に記載の画像解析装置において、それぞれ一つの明度領域に着目して2値化処理を行い、他の明度領域を白とする処理を、背景色を描画すると判定された画素群以外の全ての明度領域について行う2値化部と、上記2値化部の出力から黒の孤立点を除去するノイズ除去部と、ノイズを除去した上記2値化部の出力を比較して、いずれかの出力で黒となる画素を黒画素とし、全ての出力で白となる部分を白画素とするように合成する合成部とを備えたことを特徴とする画像解析装置。
【0007】
〈構成4〉
構成1に記載の画像解析装置において、属性判定部は、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者の近似度が、画像の性質に従って予め設定した基準に達しているとき、上記ピークの明度値を持つ画素群を背景色を描画する画素群と判定することを特徴とする画像解析装置。
【0008】
〈構成5〉
解析対象となる画像に含まれる各画素の明度値を読み取り、それぞれ同一の明度値を持つ画素の数を計数して、明度値毎の画素数の分布を示すヒストグラムを生成し、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成し、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき、画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成し、上記明度値ヒストグラムを、一定以上の大きさのピークを含み、これらのピーク間に挟まれた極小値を示す位置を境界とする、複数の明度領域に分割して、上記各明度領域において、上記黒孤立点ヒストグラムと上記白孤立点ヒストグラムとを参照して、上記ピークの前後の明度値において、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者が十分に近似しているとき、上記ピークの明度値を持つ画素群を背景色を描画する画素群と判定することを特徴とする画像解析方法。
【0009】
〈構成6〉
解析対象となる画像に含まれる各画素の明度値を読み取り、それぞれ同一の明度値を持つ画素の数を計数して、明度値毎の画素数の分布を示すヒストグラムを生成する明度値ヒストグラム生成部と、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成する黒孤立点ヒストグラム生成部と、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき、画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成する白孤立点ヒストグラム生成部と、上記明度値ヒストグラムを、一定以上の大きさのピークを含み、これらのピーク間に挟まれた明度値が極小値を示す位置を境界とする、複数の明度領域に分割する明度領域分割部と、各明度領域毎に、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者の近似度に基づいて、当該明度領域の画像の属性を判定する属性判定部を備えたことを特徴とする画像解析装置。
【0010】
【発明の実施の形態】
以下、本発明の実施の形態を具体例を用いて説明する。
〈具体例1〉
図1は、具体例1の画像解析装置を示すブロック図である。
この装置は、入力部1、明度値ヒストグラム生成部3、黒孤立点ヒストグラム生成部4、白孤立点ヒストグラム生成部5、明度領域分割部7、属性判定部8を備えている。入力部1は、例えばスキャナやCCDカメラ等、文書や帳票等のイメージデータを多値画像として取り込むことのできるデバイスにより構成される。この入力部1以外の部分は、例えばパーソナルコンピュータ等により構成され、それぞれ以下のような処理を実行するプログラムモジュール等によって実現される。
【0011】
解析対象となる画像は多値の画像であるが、明度値ヒストグラム生成部3は、この画像中に含まれる各画素の明度値を1つずつ読み取り、それぞれ同一の明度値を持つ画素の数を計数する。明度値は、例えば8ビットのディジタル値等で表現されるから、全ての画素についてその明度値を読み取り、明度値毎に設けたカウンタを順にインクリメントしていけばよい。こうして得られたカウンタのカウント値列が、明度値毎の画素数の分布を示すヒストグラムとなる。
【0012】
コンピュータ上では、カウント値のリストであって、例えば明度値0が1100、明度値1が700、明度値250が15000といったデータの内容となる。これから説明するヒストグラムは理解を容易にするためにグラフ化するが、コンピュータ上はこのようなデータリストでよい。明度値ヒストグラム生成部3の得るヒストグラムを明度値ヒストグラムと呼ぶ。
【0013】
また、黒孤立点ヒストグラム生成部4は、解析対象となる画像に含まれる画像のとる明度値の範囲で閾値を変化させて、閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成する部分である。
【0014】
多値画像の画素が明度値0〜256の範囲に分布しているとき、閾値を明度値0から256まで順に変化させる。そして、例えば閾値の明度値が100のとき各画素を2値化して、その画像中に発生した黒の孤立点を数える。黒の孤立点は1個の画素の周囲が全て白の画素により囲まれている状態の部分をカウントすればよい。このヒストグラムは、閾値の値と黒の孤立点の値とを対応付けたデータ列としてコンピュータのメモリ上に保持される。
【0015】
白孤立点ヒストグラム生成部5は、黒孤立点ヒストグラム生成部4と同様の方法によって白孤立点を見つける部分である。即ち、解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成する。
【0016】
明度領域分割部7は、明度値ヒストグラム生成部3の出力を参照して、画素値が極小値を示す位置を境界にして、複数の明度領域にヒストグラムを分割する部分である。明度値ヒストグラムをグラフ化すると、同一の濃度の画素群によっていくつかのピークが認められる。一定以上の大きさのピークを検出し、これらのピーク間に挟まれた明度値が極小値を示す位置を境界とする。この処理の具体的な説明は、後で図4を用いて行う。
【0017】
属性判定部8は、後で説明するように、各明度領域において、黒孤立点ヒストグラムと白孤立点ヒストグラムとを参照して、ピークの前後の明度値において黒孤立点と白孤立点の数を比較し、両者が十分近似しているとき、ピークの明度値を持つ画素群を、背景色を描画する画素群と判定する処理を行う。即ち、この属性判定部8によって、明度値ヒストグラムによって得られたいくつかの画素群が背景色に該当するか、文字等の認識対象となる画素群に該当するかを区別し、各画素群の属性値を求めてメモリに記憶する。なお、この具体例では黒孤立点と白孤立点の数を比較するが、黒孤立点と白孤立点のヒストグラムの、高さや面積や幅等、ピークの形状全体をみて、その特徴部分を適宜選択して比較をし、両者が十分近似しているかどうかで判定を下すようにすればよい。どのような特徴部分を選択するかは画像の性質から判断すればよい。以下の具体例でも同様である。
【0018】
図2に、解析対象となる文書画像例の説明図を示す。
この発明の装置は、このような画像中に含まれる文字の部分を抽出して、例えばOCRで認識するためのデータを生成することができる。図の画像は、4種類の濃度値を持つ画素群により描画されている。最も明度値の低い画素群がB1、次はB2、その次はB3で、最も明度値の高い画素群がB4である。この画像は多値の画像であるから、各B1,B2,B3,B4の画素群の明度値は必ずしも同一明度値に集中しない。それぞれある明度値を中心としてやや分散している。従って、明度値ヒストグラムは次のようになる。
【0019】
図3には、ヒストグラム例説明図を示す。
図の横軸は明度値で、一番左側が明度値0即ち黒色の部分で、一番右側は明度値が255即ち白の部分である。図の縦軸は画素数を示す。図の実線に示したものが明度値ヒストグラムであって、4つのピークP11,P12,P13,P14を持つ。ピークP11は、図2に示した画素群B1によるものである。また、ピークP12は、図2に示した画素群B2によるものである。ピークP13は、図2に示した画素群B3によるものである。ピークP14は、図2に示した画素群B4によるものである。
【0020】
次に、孤立点が発生するメカニズムを説明する。
図4は、孤立点の説明図である。
図4(a)には、白色Wの背景色の上に黒色Bの直線が描かれている状態を示す。この直線は、1画素分の太さで描かれているものとする。なお、黒色Bは明度値が0ではなく、例えば明度値が50に近い画素の集合とする。このとき、閾値を明度値50に選定して、この画像の2値化処理を行うと、直線上に配列された黒画素のうちのいずれかは白と判断され、残りは黒と判断される。従って、図4(b)に示すように、直線が寸断された2値化出力が得られる。
【0021】
ここで、図の右側に存在する画素KBは、その周囲が全て白色の画素に囲まれた孤立点となる。図1に示した黒孤立点ヒストグラム生成部4は、このように例えば閾値を明度値50としたとき、黒の孤立点が“1”という結果を得て、ヒストグラム用のデータにする。
【0022】
図4の(c)には、上半分が白画素群、下半分が黒画素群により描画された画像を示す。白画素群の明度値の中心は、例えば200であるとする。また、黒画素群の明度値の中心は50であるとする。この場合、閾値を50より明度値の低い、例えば45に設定すると、図の(b)に示したような要領で黒の孤立点が発生しやすくなる。
【0023】
一方、閾値を55に設定した場合には、図の黒の画素群の大部分が黒画素と判定され、その一部が白画素と判定されるから、白の孤立点が増えることになる。(a)と(c)とを比較した場合に、(a)の場合は黒で描かれた線が細いため、黒の孤立点が発生しやすいが、白の孤立点は発生しにくい。即ち、文字や罫線等を描画するための細い線を構成する画素群の場合、黒の孤立点の方が白の孤立点よりも多く発生する傾向がある。一方、(c)に示すように、背景色となるような面積の広い黒画素群の場合、黒孤立点と白孤立点の発生割合がほぼ近い値になる。この発明では、こうした画像の性質を利用する。
【0024】
再び、図3に戻って、黒孤立点、白孤立点のヒストグラムについて説明をする。この図に示すピークP21,P22,P23,P24が黒孤立点ヒストグラムである。また、ピークP31,P32,P33,P34は白孤立点ヒストグラムを示す。例えば、図2に示す画素群B1は、明度値ヒストグラムのピークP11と対応するが、閾値をこのピークの明度値を中心に左から右に向かって順に変化させて2値化処理を行うと、黒孤立点のヒストグラムのピークがP21となり、白孤立点のヒストグラムのピークがP31になる。
【0025】
図4を用いて説明したように、画素群B1は、背景色であって、黒孤立点と白孤立点のピークの大きさがほぼ等しい。一方、ピークP12は、図2に示す画素群B2に相当する。これは、文字を構成する細い線から成るため、図4を用いて説明したように、黒孤立点ヒストグラムのピークP22が白孤立点ヒストグラムのピークP32に比べてかなり大きい。
【0026】
このような性質から、ピークP11が背景色の画素群であり、ピークP12は文字や罫線等の描画のための画素群であると判定できる。図1に示す属性判定部8は、このような判定を行う。なお、こうした判定を行うために、予め明度領域分割部7は、図3に示す各明度値ヒストグラムのピークP11,P12,P13,P14の間にある明度値が極小値をとる部分を、境界V21,V22,V23,V23に設定する。そして、4つの明度領域即ち0〜V21,V21〜V22,V22〜V23,V23〜255の設定を行う。こうして分割された明度領域毎にヒストグラムの解析を行う。
【0027】
なお、上記孤立点ヒストグラムの生成のための演算処理は、閾値を0〜255の範囲で変化させて、それぞれ各画素値を2値化する方法により行うことができる。また、この他に各画素の明度値と、その画素に接しその画素の周囲を取り囲む全ての画素の明度値とを取得する。そして、着目する画素の明度値をMとする。また、周囲の画素のうち、最も暗い画素の明度値をSとする。そして、Mの方がSよりも小さい場合、即ちMの方が明度値が低い場合には、SとMとの間の明度値をとる閾値によって着目する画素が必ず黒の孤立点になる。このような判断を全ての画素について行えばよい。
【0028】
上記明度領域の分割は、明度値ヒストグラム中から一定以上の大きさのピークを見つけて行う。また、黒孤立点ヒストグラムと白孤立点ヒストグラムの比較は、ピークの大きさを比較する。このように、ピークの大きさを判断する場合には、ピークの最大値を比較する他、ピークの面積を比較してもよい。孤立点が一定の明度値の範囲に幅広く分布する場合もあるからである。また、グラデーションで表現されたような文字もあるからである。
【0029】
なお、このようなピークの大きさの判断とピークの比較判断のための基準は、解析対象となる画像に応じて実験的に最適なものを選択することが好ましい。ピークが近似しているかどうかの判断には、ピークの最大値の比や面積の差、面積の比の比較等、様々な比較方法が選定できる。
【0030】
〈具体例1の効果〉
以上のように、図1に示した入力部1から入力された解析対象となる画像を元に、明度値ヒストグラムと、黒孤立点ヒストグラムと、白孤立点ヒストグラムをそれぞれ生成し、明度領域分割部7によって画素群を所定の明度領域に分割し、それぞれについて黒孤立点ヒストグラムと白孤立点ヒストグラムとを比較し、両者が十分に近似している場合を背景色とし、その他の場合を文字等の意味のある図形を描画する画素群と判定すれば、各明度値を持つ画素群の属性を比較的簡単な演算処理によって明確に区別することが可能になる。
【0031】
〈具体例2〉
上記の具体例では、例えば図2に示した画素群B1を背景色とし、B3はその中に描かれた文字等と判定し、B4は背景色とし、B2はその中に書かれた文字等と判定する。ところが、このような背景上に記入された文字をOCRを用いて認識する場合には、2値化された画像であって、文字の部分が黒になるようなデータが望ましい。この具体例では、図1に示した装置に2値化部を追加することによってこれを実現する。
【0032】
図5には、具体例2の画像解析装置ブロック図を示す。
この装置の、入力部1、明度値ヒストグラム生成部3、黒孤立点ヒストグラム生成部4、白孤立点ヒストグラム生成部5、明度領域分割部7及び属性判定部8は、具体例1に示したものと同一のものである。そして、属性判定部8の出力側に新たに2値化部9を設ける。この2値化部9は、入力部1から入力された解析対象となる画像に対し、属性判定部8において判定された属性を利用して2値化処理を行う。具体的には、背景色と判定された画素群を白とし、それ以外の画素群を黒にするように2値化処理を行う。
【0033】
具体的には、図3に示すヒストグラムを参照し、明度値が0〜V21の範囲にある画素群は背景色と判定されたから、これらを白画素とする。また、明度領域V21〜V22の間に存在する画素群は、背景色以外のものと判定されたから黒画素にする。明度領域V22〜V23にある画素群も黒画素にする。明度領域V23〜明度値255の範囲にある画素群は背景色であるから、白画素にする。こうすれば、2値化処理された画像を得る。
【0034】
図6に、具体例2の2値化出力説明図を示す。
図5に示す2値化部9の出力は、この図に示すようになる。即ち、図2に示した背景色の部分は全て白となり、それ以外の部分は黒になる。このようにして文字認識が可能になる。
【0035】
〈具体例2の効果〉
以上のように、属性判定部において、背景色を描画すると判定された画素群を白画素とし、背景色と判定された画素群以外の画素群を黒画素にすれば、多値画像であって、様々な背景色の上に描かれた文字等をOCRで認識できる画像に変換することが可能になる。
【0036】
〈具体例3〉
上記具体例2では、図2に示すように、例えば画像の上半分と下半分の背景領域の色が異なっていても、それぞれの背景領域を白に変換して、文字の部分を全て黒画像にすることが可能になる。しかしながら、このような変換処理を行った場合、丁度領域の境界部分に存在する画素のうち、いくらかの画素は白色に変換されず、ノイズとなって残ることがある。具体例3では、このようなノイズを減少させる。
【0037】
図7は、具体例3の画像解析装置ブロック図を示す。
この図では、具体例2の装置に対し、2値化部9を部分2値化部11に置き換える。そして、その出力側にノイズ除去部12と合成部13とを備える。
【0038】
図8に、ノイズの説明図を示す。
図6を用いて説明した具体例2の2値化出力の、丁度上辺と下辺の中間部分を拡大すると、この図に示すようになる。即ち、ごく少量であるがノイズN1が残っていることがわかる。背景色の切り替わる境界部分で、中間的な明度値の画素がいくらか存在するためである。このようなノイズの量が増えると、文字認識等の誤りを発生する。具体例3の装置は、まず部分2値化部11が明度領域別に2値化を行う。
【0039】
即ち、図3を参照して説明すれば、明度値V21〜V22の範囲にあるピークP12を形成する画素群を黒画素にし、その他の画素を白画素にするように2値化処理を行う。明度値V22〜V23の範囲の明度領域については、ピークP13を形成する画素値を黒画素にし、その他の画素を白画素にするように2値化処理を行う。
【0040】
更に、図7に示すノイズ除去部12は、各2値化画像について、それぞれノイズ除去を行う。ノイズ除去の手法は従来からよく知られており、いわゆる孤立点の除去を行う処理である。例えば、背景色白色の部分に、黒の孤立点があれば全てこれを白に反転する。こうした処理によって、主として境界部分のノイズを効果的に除去できる。
【0041】
図9には、部分2値画像のノイズ除去処理例説明図を示す。
図9(a)に示したものが部分2値化部11の出力である。この部分2値化部11の出力した2値画像は、白色の地色である部分にノイズが存在する。(b)にはその拡大図を示す。ここで、(c)に示すような孤立点を画像中で探索し、孤立点を白色に反転する処理を行う。この結果、図の(d)に示すようにして、ノイズが除去される。この2値画像は、上部の文字に着目して2値化処理を行っているから、それ以外の部分はノイズ除去によって大部分が背景色に変換される。
【0042】
部分2値化部11の2種類の2値化出力について、それぞれノイズ除去を行い、更に合成部13で各出力を合成する。このとき、合成部13は、いずれかの出力で黒となる画素を黒画素とし、全ての出力で白となる部分を白画素とするように合成する。以上のような処理を行うと、特に、2種の背景色の境界部分で中間的な明度を持つ画素がにじみ出すようにして生じるノイズを十分に削減することができる。上記のように、分割した明度領域毎にノイズ除去を行えば、各領域に含まれる画素群は、いずれも同一の属性値を持つため、ノイズと区別しやすいからノイズ除去が容易になる。
【0043】
〈具体例3の効果〉
以上のように、明度領域毎にノイズ除去を施して、2値化画像を合成すると、ノイズの少ない高品質な2値化画像を得ることができる。即ち、図10に示すように、ノイズを除去した画像を上部の部分の2値化画像(a)と、ノイズを除去した画像下部の部分2値画像(b)とを重ね合わせて、ノイズの少ない合成出力(c)を得ることができる。
【0044】
〈具体例4〉
この具体例では、例えば文字枠が印刷された帳票に角印を押したような画像であっても、このような角印部分を除外して帳票の罫線を認識することを可能にする。
【0045】
図11は、具体例4の画像解析装置ブロック図を示す。
この装置には、具体例3の装置の合成部に代えて、帳票解析部15と帳票処理部16を追加する。
【0046】
図12には、角印を押した帳票画像例説明図を示す。
この図に示すように、黒の文字枠に対し朱肉を用いて角印を押した場合、肉眼では罫線部分と角印の部分を区別できる。しかしながら、これを2値化処理すると、例えば角印の周辺を取り囲む枠の部分も帳票の罫線と認識されることがある。これに対し、本発明の装置は、次のような処理によって罫線と角印を押した部分を区別する。
【0047】
図13に、帳票のヒストグラム例説明図を示す。
このヒストグラムは、図3に示した例と全く同様の要領で、明度値ヒストグラム生成部3と、黒孤立点ヒストグラム生成部4と、白孤立点ヒストグラム生成部5とが生成処理したものである。図のピークP41,P42,P43は、明度値ヒストグラム、P51,P52,P53は、黒孤立点ヒストグラム、P61,P62,P63は、白孤立点ヒストグラムを示す。
【0048】
ここで、図12に示す印鑑の画像に着目する。この印影は帳票の罫線と比較すると、太く、更に濃度がやや明るくややムラがある。従って、罫線と全く同一のヒストグラムにはならない。
【0049】
図13に示す明度値0〜V51までの範囲の明度領域には、罫線の画素群によるヒストグラムが得られている。また、明度領域V51〜V52の間には、印鑑の画素群によるヒストグラムが得られている。両者を比較すると、罫線の場合には、これまで説明したように、黒孤立点ヒストグラムと白孤立点ヒストグラムのピーク値の比がかなり大きい。面積を比べても、黒孤立点ヒストグラムが十分大きい。これに対し、印鑑の印影を形成する画素群では、黒孤立点ヒストグラムが白孤立点ヒストグラムのピークよりもやや大きいものの、罫線ほどの違いはない。
【0050】
一方、背景色を表す明度値V52〜255までの間の明度領域では、これまで説明した通り、黒孤立点ヒストグラムと白孤立点ヒストグラムとがほぼ同等の大きさになっている。従って、属性判定部8は、両ヒストグラムの比が2以上の場合に罫線と判定し、両ヒストグラムの比が1.2〜2の範囲にある場合にはその他の画素群と判定し、両ヒストグラムの比が1.2以下の場合には背景色の画素群と判定する。もちろん、この数値は、画素の性質が異なれば自由に変更できる値であって、解析を行う画像に応じて実験的に最適値を定めればよい。
【0051】
以上の処理の結果、部分2値化部11は、属性判定部8の判定結果に基づいて、印鑑の印影部分は背景色と同一の色に、即ち白色に変換する。これにより、図14に示すように、印鑑の印影を除外した罫線のみを含む帳票の画像を2値化出力することができる。
【0052】
図11に示すノイズ除去部12は、これまで説明した通りの方法で孤立点等を除去するノイズ除去処理を行う。帳票解析部15は、この出力を受け入れてノイズが除去され罫線のみを含んだ画像に対し、罫線の位置、セルの位置等の情報を出力する帳票解析処理を行う。この画像には印影が含まれていないため角印の枠を帳票の罫線と誤ることなく、より正確に帳票解析処理を行うことができる。なお、帳票解析処理は長い黒ランを検索して罫線として検出する等、従来の手法でよい。帳票処理部16は、帳票解析部15で出力されたセル位置等の表情報に従って、入力部1で得られた画像もしくは2値化された画像について、文字認識、印鑑照合等の帳票処理を行う。
【0053】
上記の属性判定部8の判定結果を利用すれば、各明度領域の画像がそれぞれどのような性質の画像かを区別できる。従って例えば帳票中にさまざまな性質の画像が含まれている場合に、この発明によって各画像を区別し、それぞれ別々の処理をすることが可能になる。例えば、特定の属性を持つ明度の画素を黒画素とし、それ以外の画素を背景色とする2値化処理を行えば、帳票に含まれる印鑑の画像のみを切り出すことが可能になる。さらに別の属性を持つ明度の画素以外の画素を背景色の画像とする2値化処理を行えば、別の画像の切り出しが可能になる。こうして2値化部の出力する2種以上の2値化画像を使用して、それぞれの2値化画像に適した処理を行うことが可能になる。
【0054】
〈具体例4の効果〉
明度領域毎に処理を行わせることにより、以上に例示したように帳票解析においては罫線の明度領域の画素についてのみ処理が行われるため、印鑑等の帳票以外のものを罫線等の帳票の構成要素として誤認識することがなく処理を行える等、画像処理の性能向上を図ることができる。
【図面の簡単な説明】
【図1】具体例1の画像解析装置ブロック図である。
【図2】文書画像例説明図である。
【図3】ヒストグラム例説明図である。
【図4】孤立点の説明図である。
【図5】具体例2の画像解析装置ブロック図である。
【図6】具体例2の2値化出力説明図である。
【図7】具体例3の画像解析装置ブロック図である。
【図8】ノイズの説明図である。
【図9】部分2値画像のノイズ除去処理例説明図である。
【図10】具体例3の動作説明図である。
【図11】具体例4の画像解析装置ブロック図である。
【図12】帳票画像例説明図である。
【図13】帳票のヒストグラム例説明図である。
【図14】部分2値化出力説明図である。
【符号の説明】
1 入力部
3 明度値ヒストグラム生成部
4 黒孤立点ヒストグラム生成部
5 白孤立点ヒストグラム生成部
7 明度領域分割部
8 属性判定部

Claims (6)

  1. 解析対象となる画像に含まれる各画素の明度値を読み取り、それぞれ同一の明度値を持つ画素の数を計数して、明度値毎の画素数の分布を示すヒストグラムを生成する明度値ヒストグラム生成部と、
    解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成する黒孤立点ヒストグラム生成部と、
    解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき、画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成する白孤立点ヒストグラム生成部と、
    前記明度値ヒストグラムを、一定以上の大きさのピークを含み、これらのピーク間に挟まれた明度値が極小値を示す位置を境界とする、複数の明度領域に分割する明度領域分割部と、
    前記各明度領域において、前記黒孤立点ヒストグラムと前記白孤立点ヒストグラムとを参照して、前記ピークの前後の明度値において、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者が十分に近似しているとき、前記ピークの明度値を持つ画素群を背景色を描画する画素群と判定する属性判定部とを備えたことを特徴とする画像解析装置。
  2. 請求項1に記載の画像解析装置において、
    属性判定部において背景色を描画すると判定された画素群を白画素とし、当該画素群以外の画素群を黒画素にする2値化部を備えたことを特徴とする画像解析装置。
  3. 請求項2に記載の画像解析装置において、
    それぞれ一つの明度領域に着目して2値化処理を行い、他の明度領域を白とする処理を、背景色を描画すると判定された画素群以外の全ての明度領域について行う2値化部と、
    前記2値化部の出力から黒の孤立点を除去するノイズ除去部と、
    ノイズを除去した前記2値化部の出力を比較して、いずれかの出力で黒となる画素を黒画素とし、全ての出力で白となる部分を白画素とするように合成する合成部とを備えたことを特徴とする画像解析装置。
  4. 請求項1に記載の画像解析装置において、
    属性判定部は、
    黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者の近似度が、画像の性質に従って予め設定した基準に達しているとき、前記ピークの明度値を持つ画素群を背景色を描画する画素群と判定することを特徴とする画像解析装置。
  5. 解析対象となる画像に含まれる各画素の明度値を読み取り、それぞれ同一の明度値を持つ画素の数を計数して、明度値毎の画素数の分布を示すヒストグラムを生成し、
    解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成し、
    解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき、画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成し、
    前記明度値ヒストグラムを、一定以上の大きさのピークを含み、これらのピーク間に挟まれた極小値を示す位置を境界とする、複数の明度領域に分割して、
    前記各明度領域において、前記黒孤立点ヒストグラムと前記白孤立点ヒストグラムとを参照して、前記ピークの前後の明度値において、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者が十分に近似しているとき、前記ピークの明度値を持つ画素群を背景色を描画する画素群と判定することを特徴とする画像解析方法。
  6. 解析対象となる画像に含まれる各画素の明度値を読み取り、それぞれ同一の明度値を持つ画素の数を計数して、明度値毎の画素数の分布を示すヒストグラムを生成する明度値ヒストグラム生成部と、
    解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき画像中に発生した黒の孤立点の数を計数し、閾値毎の黒の孤立点数の分布を示すヒストグラムを生成する黒孤立点ヒストグラム生成部と、
    解析対象となる画像に含まれる画素のとる明度値の範囲で閾値を変化させて、各閾値毎に各画素の明度値を2値化したとき、画像中に発生した白の孤立点の数を計数し、閾値毎の白の孤立点数の分布を示すヒストグラムを生成する白孤立点ヒストグラム生成部と、
    前記明度値ヒストグラムを、一定以上の大きさのピークを含み、これらのピーク間に挟まれた明度値が極小値を示す位置を境界とする、複数の明度領域に分割する明度領域分割部と、
    各明度領域毎に、黒孤立点ヒストグラムのピークの形状と白孤立点ヒストグラムのピークの形状を比較して、両者の近似度に基づいて、当該明度領域の画像の属性を判定する属性判定部を備えたことを特徴とする画像解析装置。
JP25345399A 1999-09-07 1999-09-07 画像解析装置と画像解析方法 Expired - Fee Related JP3759349B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25345399A JP3759349B2 (ja) 1999-09-07 1999-09-07 画像解析装置と画像解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25345399A JP3759349B2 (ja) 1999-09-07 1999-09-07 画像解析装置と画像解析方法

Publications (2)

Publication Number Publication Date
JP2001076096A JP2001076096A (ja) 2001-03-23
JP3759349B2 true JP3759349B2 (ja) 2006-03-22

Family

ID=17251616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25345399A Expired - Fee Related JP3759349B2 (ja) 1999-09-07 1999-09-07 画像解析装置と画像解析方法

Country Status (1)

Country Link
JP (1) JP3759349B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8693743B1 (en) 2010-02-19 2014-04-08 Olive Tree Media, LLC Analysis and display of multiple biomarker co-expression in cells and tissues

Also Published As

Publication number Publication date
JP2001076096A (ja) 2001-03-23

Similar Documents

Publication Publication Date Title
US10455117B2 (en) Image processing apparatus, method, and storage medium
JP4016342B2 (ja) コード認識のための装置及びその方法
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
EP1173003B1 (en) Image processing method and image processing apparatus
US8351720B2 (en) Method and system providing edge enhanced image binarization
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
EP1269394A2 (en) Improved method for image binarization
JP5337563B2 (ja) 帳票認識方法および装置
KR20120132314A (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP2018139457A (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP3906221B2 (ja) 画像処理方法及び画像処理装置
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
CN111445402A (zh) 一种图像去噪方法及装置
JP3759349B2 (ja) 画像解析装置と画像解析方法
JP5979008B2 (ja) 画像処理装置、画像処理方法及びプログラム
RU2571510C2 (ru) Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении
JP3115725B2 (ja) 背景付き文字列からの文字列画像の抽出処理方式
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
WO2017168889A1 (en) Object detection device and vehicle having the object detection device
KR100537827B1 (ko) 경계선 분포를 이용한 스캔 영상의 상역 분리 방법
JP3268542B2 (ja) 微細文字画像の拡大方法
Boiangiu et al. Bitonal image creation for automatic content conversion

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051228

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100113

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100113

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110113

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110113

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120113

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130113

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140113

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees