JP4409713B2 - 文書画像認識装置及び記録媒体 - Google Patents

文書画像認識装置及び記録媒体 Download PDF

Info

Publication number
JP4409713B2
JP4409713B2 JP2000102968A JP2000102968A JP4409713B2 JP 4409713 B2 JP4409713 B2 JP 4409713B2 JP 2000102968 A JP2000102968 A JP 2000102968A JP 2000102968 A JP2000102968 A JP 2000102968A JP 4409713 B2 JP4409713 B2 JP 4409713B2
Authority
JP
Japan
Prior art keywords
image
binarization
character
character image
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000102968A
Other languages
English (en)
Other versions
JP2001291056A (ja
Inventor
昌己 濱口
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000102968A priority Critical patent/JP4409713B2/ja
Publication of JP2001291056A publication Critical patent/JP2001291056A/ja
Application granted granted Critical
Publication of JP4409713B2 publication Critical patent/JP4409713B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、スキャナやデジタルカメラ等で取り込んだ多値画像から、文字を認識する文書画像認識装置及び記録媒体に関する。
【0002】
【従来の技術】
画像の特徴を解析するとき、多値画像から対象図形と背景を分離した2値画像を作成して取り扱うことが多い。画像の2値化は、多値画像の階調値がしきい値以下のときは黒とし、しきい値を超えるときは白とするしきい値処理によって行われる。通常、2値画像の黒の部分は対象図形を、白の部分は背景を表している。
【0003】
しきい値を決める手法には、与えられた多値画像の階調ヒストグラムを求めた結果、2つのピークをもつ分布になる場合、この2つの山の間の谷をしきい値とするモード法や、階調ヒストグラムにおいて、階調値の集合をしきい値tで2つのクラス(t以上とt未満)に分割したと仮定したとき、2つのクラス間の分離(分散値)が最も良くなるようにパラメータ(しきい値t)を決める(文献:電子情報通信学会論文誌80/4Vol.J63−D No.4,p.349−356参照)、判別分析における判別基準を用いた2値化処理などがある。
【0004】
文書画像認識装置では、このような2値化処理によって作成された2値画像を認識用画像として扱い、文字の抽出(コード化)が行われていた。
【0005】
【発明が解決しようとする課題】
前記従来のものには、次のような課題があった。
【0006】
従来の2値化処理では、抽出対象である文字画像の背景に色が付いている場合、読み取られた文字画像と背景色の濃度が近くなるため、適切なしきい値を求めることが困難となり、作成された2値画像において背景領域の一部が文字画像と共に黒画素として表されることがあった。このような2値画像を用いて文字認識を行うと認識精度が低くなるといった問題が発生していた。また、このような2値画像は、見やすさといった点から、表示用の画像としては適さないといった問題があった。
【0007】
本発明は、このような従来の課題を解決し、入力された多値画像から文字画像とそれ以外の性質の異なる画像領域を適切に、かつ高速に2値化することを目的とする。
【0008】
【課題を解決するための手段】
図1は本発明の原理説明図である。図1中、1は入力多値画像、10aは画像2値化手段、14aは画像認識手段である。
【0009】
本発明は前記従来の課題を解決するため次のように構成した。
【0010】
(1):入力多値画像1から2値画像を作成する画像2値化手段10aと、該作成した2値画像の認識を行う画像認識手段14aとを備えた文書画像認識装置において、前記画像2値化手段10aは、前記入力多値画像1を文字画像領域と背景画像領域とに分離し、該分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行う。
【0011】
(2):前記(1)の文書画像認識装置において、前記画像2値化手段10aは、前記入力多値画像1に含まれる低階調の代表値を選んで2値化処理を行い、該作成された2値画像から文字画像を多く含む文字画像領域とそれ以外の背景画像領域とに分離する。
【0012】
(3):前記(1)の文書画像認識装置において、前記画像2値化手段10aは、前記分離した文字画像領域内が全て文字画像の単一階調である場合、該単一階調の文字画像領域に背景画像が含まれるように該文字画像領域を変更して、2値化処理を行う。
【0013】
(4):前記(1)の文書画像認識装置において、前記画像2値化手段10aは、前記分離した各文字画像領域に対して行った2値化処理時の各2値化しきい値を求め、前記2値化処理された領域を含むように拡大した矩形内の領域を前記求めた2値化しきい値で2値化処理する。
【0014】
(5):入力多値画像を文字画像領域と背景画像領域とに分離し、該分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行う画像2値化手段10aと、該2値化処理で作成した2値画像の認識を行う画像認識手段14aと、してコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体とする。
【0015】
(作用)
前記構成に基づく作用を説明する。
【0016】
画像2値化手段10aで入力多値画像1から2値画像を作成し、画像認識手段14aで作成した2値画像の認識を行う文書画像認識装置において、前記画像2値化手段10aで、前記入力多値画像1を文字画像領域と背景画像領域とに分離し、該分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行う。このため、文字画像の背景に色が付いている画像であっても高精度に2値化でき、かつ一定しきい値で2値化処理を行うため高速に2値化することができる。
【0017】
また、前記画像2値化手段10aで、前記入力多値画像1に含まれる低階調の代表値を選んで2値化処理を行い、該作成された2値画像から文字画像を多く含む文字画像領域とそれ以外の背景画像領域とに分離する。このため、低階調である黒い部分のみ2値化して、容易に文字画像領域を分離することができる。
【0018】
さらに、前記画像2値化手段10aで、前記分離した文字画像領域内が全て文字画像の単一階調である場合、該単一階調の文字画像領域に背景画像が含まれるように該文字画像領域を変更して、2値化処理を行う。このため、文字画像領域内が全て文字画像の場合でも、文字画像が細く出力されることを防止し、適切な2値化を行うことができる。
【0019】
また、前記画像2値化手段10aで、前記分離した各文字画像領域に対して行った2値化処理時の各2値化しきい値を求め、前記2値化処理された領域を含むように拡大した矩形内の領域を前記求めた2値化しきい値で2値化処理する。このため、文字画像領域として、抽出されなかった文字画像部分を適切に2値化処理することができる。
【0020】
さらに、入力多値画像を文字画像領域と背景画像領域とに分離し、該分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行う画像2値化手段10aと、該2値化処理で作成した2値画像の認識を行う画像認識手段14aと、してコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体とする。このため、この記録媒体のプログラムをコンピュータにインストールすることで、文字画像の背景に色が付いている画像であっても高精度に2値化でき、かつ高速に2値化することができる文書画像認識装置を容易に提供することができる。
【0021】
【発明の実施の形態】
本発明の文書画像認識装置は、入力多値画像から文字画像を多く含む画像領域とそれ以外の画像領域に分離し、該分離された2種類の画像領域に対して異なる画像処理を行い、高速に2値画像を作成する2値化処理手段を備えるものである。
【0022】
また、入力多値画像の文字画像に含まれる低階調(黒)の代表値を選んで2値化処理を行い、該作成された2値画像から文字画像に含まれる画素を抽出し、文字画像を多く含む画像領域とそれ以外の背景画像領域を分離する2値画像領域分離手段を備えるものである。
【0023】
さらに、前記2値画像領域分離手段により求められた文字画像を多く含む画像領域に対して個々に判別分析における判別基準を用いた2値化処理を行い、2値画像を作成する文字画像領域2値化手段と、該文字画像領域2値化手段で求められた文字画像領域の分散値から、その文字画像領域内が単一階調であることを判断する単一階調画像領域判別手段と、該単一階調画像領域判別手段により単一階調と判断された文字画像領域に、背景画像が含まれるように文字画像領域を膨張し、再度判別分析における判別基準を用いた2値化処理を行う単一階調画像領域2値化手段とを備えるものである。
【0024】
また、前記文字画像領域2値化手段により求められた個々の文字画像領域のしきい値から最適なしきい値を求め、前記文字画像領域2値化手段により2値化処理された領域を含むn×m矩形内の背景画像領域を2値化することで、文字画像領域に含まれなかった文字画像部分を2値化処理する背景画像領域2値化手段を備えるものである。
【0025】
このような手段を備えることにより、入力された多値画像から文字画像とそれ以外の性質の異なる画像領域とに分離された2値画像が作成されるため、従来技術で問題になっていた背景色のある文字画像の適切な2値化を行うことができる。
【0026】
以下、図面を参照して本発明の実施の形態を説明する。
【0027】
(1):文書画像認識装置の構成の説明
図2は本発明の実施の形態における文書画像認識装置の構成の説明図である。図2において、文書画像認識装置には、多値画像2値化部10と2値画像認識部14が設けてある。また、多値画像2値化部10には、文字画像領域検出部11、文字画像領域2値化部12、背景画像領域2値化部13が設けてある。
【0028】
この文書画像認識装置は、多値画像(グレースケールイメージ)を入力とし、多値画像2値化部10で各画素を文字画像領域と背景画像領域のいずれかを意味する値を持つ2値画像に変換するものである。
【0029】
文字画像領域検出部11は、グレースケールイメージ全体に代表的なしきい値で2値化処理を実行し、文字画像を多く含む領域を決定するものである。文字画像領域2値化部12は、文字画像を多く含む領域について個々に2値化処理を実行するものである。背景画像領域2値化部13は、文字画像領域のしきい値を基に背景画像領域の2値化処理を実行し、最終的な2値画像を出力するものである。2値画像認識部14は、多値画像2値化部10で作成した2値画像から文字を認識し、認識結果を出力するものである。
【0030】
(2):多値画像2値化部の文字画像領域検出部の説明
図3は文字画像領域検出部の処理の説明図である。図3において、文字画像領域検出部11の処理は、先ず一定しきい値2値化処理S1を行い、次にラベリング処理S2を行い、最後に有効セグメント領域抽出処理(文字画像領域検出)S3を行うものである(2値画像領域分離手段)。
【0031】
一定しきい値2値化処理S1では、入力グレースケールイメージに対して、一定しきい値で2値化を行う。このときのしきい値は、文字画像の中でもより黒い部分のみが2値化される階調を選ぶ。
【0032】
ラベリング処理S2では、前記一定しきい値2値化処理S1で得られた2値画像の連結成分の集合をラベリング処理により抽出する。
【0033】
有効セグメント領域抽出処理(文字画像領域検出)S3では、文字画像に適さないサイズの連結部分を排除する(サイズにより罫線や1ドットのゴミ等を除く)ことで、有効なセグメントを選び、その選んだセグメントの外接矩形をとり、文字画像領域とする。
【0034】
(具体的イメージによる説明)
図4は2値画像領域分離手段のイメージによる説明図であり、図4(a)は入力グレースケールイメージである。図4(a)において、文字画像は、薄い黒い部分(灰色部分)a1、b1とより黒い部分a2、b2とから成り、背景は白い部分である。
【0035】
図4(b)は一定しきい値2値化処理S1の処理結果である。図4(b)において、一定しきい値2値化処理S1の処理で、一定しきい値で2値化処理して文字画像中のより黒い部分a2、b2のみを2値化し、ラベリング処理S2、文字画像領域検出S3を行って、より黒い部分a2、b2の外接矩形(点線で示してある)を抽出する。
【0036】
図4(c)は背景領域と文字画像領域に分離したグレースケールイメージの説明である。図4(c)において、図4(b)の外接矩形座標をグレースケールイメージ(図4(a)参照))に適応して、背景領域を含んだ文字画像領域(点線内)と、他の背景領域(点線外)とに分離する。
【0037】
このように外接矩形を取るのは、文字画像中のより黒い部分以外の文字画像領域と背景画像領域を部分2値化領域に含ませるためである。本実施の形態の2値化処理で使用している、判別分析における判別基準を用いた2値化処理では、抽出対象階調画像(文字画像)と非抽出対象画像(背景画像)を含む領域にすることで、最適な2値化が行われるからである。
【0038】
また、文字画像領域を決める従来の方法として、文字画像全体のエッジを抽出する(画素間の階調の変化量を計算する)ようなソーベルフィルタ処理が用いられることがある。これに対し、本発明では、一定しきい値2値化処理を用いることで計算量を減らし、より高速な文字画像領域の検出を行っている。
【0039】
(3):多値画像2値化部の文字画像領域2値化部の説明
文字画像領域2値化部12では、文字画像領域検出部11で決定した文字画像を多く含む領域(外接矩形の文字画像領域)について、領域毎に判別分析における判別基準を用いた2値化処理を行うものである。
【0040】
図5は文字画像領域2値化部の説明図であり、図5(a)は文字画像領域2値化部の処理の説明である。図5(a)において、文字画像領域2値化部12の処理は、先ず文字画像領域の2値化しきい値・分散値算出処理S11を行い、次に文字画像領域に背景が含まれているかを領域内分散値により判定S12を行う。この判定で、文字画像領域に背景が含まれている場合は文字画像領域内の2値化処理S13を行い、もし背景が含まれていない場合は文字画像領域膨張処理S14を行い再度文字画像領域の2値化しきい値・分散値算出処理S11に戻る。
【0041】
・この文字画像領域の2値化しきい値・分散値算出処理S11では、先ず各文字画像領域について、判別分析における判別基準を用いた2値化しきい値の算出とクラス内分散値の算出処理が行われる。
【0042】
(2値化しきい値とクラス内分散値の算出方法の説明)
以下、2値化しきい値とクラス内分散値の算出方法を説明する。図5(b)は階調ヒストグラムの説明である。図5(b)において、横軸は階調、縦軸は画素数を示している。なお、階調は左から右方向に黒から白に変化するものである。
【0043】
与えられた領域のしきい値をtとして、t以上の階調を持つ画素と、それより小さな値を持つ画素の2つのグループに分ける。この2つのグループをクラス1、クラス2とする。クラス1の画素数をω1(t)、クラス1の平均階調をM1(t)、クラス2の画素数をω2(t)、クラス2の平均階調をM2(t)とおき、全画素の平均階調をMT とおくと、クラス間分散σB2 は次の式で与えられる。
【0044】
σB2 =ω1(M1 −MT )2+ω2(M2 −MT )2=ω1 ω2(M1 −M2)2
ここで、tを変化させてクラス間分散σB2 を最大にするtの値を求め、その領域内の2値化しきい値とする。
【0045】
(文字画像領域に背景が含まれているかの判定の説明)
・次に文字画像領域に背景が含まれているかを領域内分散値による判定S12を行う(単一階調画像領域判別手段)。これは、文字画像領域内がすべて文字画像で背景画像を含まない場合、上記の判別分析における判別基準を用いた2値化しきい値の算出方法では、微小な階調差を感知してしきい値を求めてしまうため、そのしきい値で正しく2値化できずに文字画像が細く出力されるといった現象が起きる。
【0046】
図6は判別分析における判別基準を用いた2値化処理例の説明図であり、図6(a)は領域内がすべて文字画像で背景画像を含まない例の説明である。図6(a)において、文字画像領域内がすべて文字画像で、a1の階調の画素とa2の階調の画素よりなり、文字画像領域内の画素がすべて2値化対象の階調となっている。この場合、その領域内で2値化しきい値を求めてしまうため、図6(a)の右図のように文字画像が細く出力される(a2の階調の画素のみ出力される)ことになる。このため、判別分析における判別基準を用いた2値化処理では正しく2値化できないことになる。
【0047】
・文字画像領域内がすべて文字画像で背景画像を含まない場合、このような領域のクラス間分散値は、背景を含む領域に比べ小さい値を取ることから判断できる。このため、クラス間分散しきい値を定め、そのしきい値以下の領域に対しては、周囲の背景を取り込むように領域膨張を行い(文字画像領域膨張処理S14)、該膨張した新たな領域について2値化しきい値とクラス間分散値の算出を再度行う。
【0048】
図6(b)は単一階調画像領域2値化手段の説明である。図6(b)において、図6(b)の左のように、文字画像領域内のすべての画素(a1の階調の画素とa2の階調の画素)が2値化対象の階調となっている場合、図6(b)の中央のように、領域を広げて(膨張して)背景画像(白い部分)を取り込む。次に、広げた領域について、再度、判別分析における判別基準を用いた2値化しきい値とクラス間分散値の算出を行う。
【0049】
・クラス間分散がクラス間分散しきい値より大きく、文字画像領域内に背景画像が含まれると判断した領域については、求めた2値化しきい値により、2値画像を作成する(文字画像領域2値化手段)。
【0050】
図6(c)は領域内に文字画像と背景画像が含まれると判断した領域の例の説明である。図6(c)において、左図のように文字画像領域内に背景(白い部分)が含まれている場合は、判別分析における判別基準を用いた2値化処理で適切なしきい値が求まり、右図のように適切な2値化処理が行われる。
【0051】
以上の処理を文字画像領域検出部11で決定した全ての文字画像領域に対して行うことで、文字画像の2値化が行われる。
【0052】
(4):背景画像領域2値化部の説明
前記(3)では文字画像領域検出部11で検出した領域について2値化処理を行った。しかし、この領域は、文字画像の中でもより黒い部分の外接矩形であるため、この領域外にも文字画像が含まれている可能性がある。したがって、背景画像領域2値化部13では、背景画像領域について2値化を行い、この領域に含まれる文字画像の抽出を行う。
【0053】
図7は背景画像領域2値化部の処理の説明図である。図7において、先ず、文字画像領域2値化しきい値を用いて背景画像領域の2値化しきい値を算出する(S21)。次に、該算出した2値化しきい値を用いて背景画像領域の2値化処理を行う(S22)。
【0054】
(背景画像領域の2値化例の説明)
a:文字画像領域2値化しきい値から代表例を選ぶ方法(第1の方法)
第1の方法として、文字画像領域検出部11で求めた各領域のしきい値(記憶装置等に記憶しておく)から代表値を選び、背景画像領域全面に適応する方法である。例えば、各領域のしきい値から最も低い(黒い)階調を背景画像領域のしきい値とする。このしきい値が文字画像領域検出部11で用いた一定しきい値の階調より高い(白い)場合、本来掠れるはずであった背景画像領域中の文字画像が2値化されるため、より文字らしくなる。なお、しきい値の選び方として、各領域のしきい値の平均、又は、最も高い(白い)階調を用いることもできる。
【0055】
図8は背景画像領域2値化の例1の説明図である。図8において、先ず、上図の▲1▼のように、2値画像領域分離手段を用いて、文字画像領域(点線内の領域1、領域2)を求める。次に、中図の▲2▼のように、各文字画像領域内を文字画像領域2値化手段、及び単一階調画像領域2値化手段を用いて2値化する。この時、領域1内の2値化しきい値をt1 、領域2内の2値化しきい値をt2 とする(t1 >t2 )。最後に、下図の▲3▼のように、文字画像領域内の2値化しきい値のうち最も階調が低いt2 で背景画像領域の2値化を行い、文字画像部分の抽出を行う。
【0056】
b:文字画像領域2値化部で求めた各領域のしきい値をその領域の周囲の背景画像領域に適応させる方法(第2の方法)
第2の方法として、文字画像領域2値化部で求めた各領域のしきい値をその領域の周囲の背景画像領域に適応させる方法である。この方法では、狭い領域で求めた2値化しきい値がその周囲にのみ用いられるため、1文字毎の2値化がより適切に行えるようになる。
【0057】
図9は背景画像領域2値化の例2の説明図である。図9において、先ず、上図の▲1▼のように、2値画像領域分離手段を用いて、文字画像領域(点線内の領域1、領域2)を求める。次に、中図の▲2▼のように、各文字画像領域内を文字画像領域2値化手段、及び単一階調画像領域2値化手段を用いて2値化する。この時、領域1内の2値化しきい値をt1 、領域2内の2値化しきい値をt2 とする(t1 >t2 )。最後に、下図の▲3▼のように、各文字画像領域を含むn×m領域(一点鎖線内)を各文字画像領域内の2値化しきい値で2値化する。即ち、領域1を含むn×m領域は2値化しきい値t1 で2値化し、領域2を含むn×m領域は2値化しきい値t2 で2値化する。これにより、背景画像領域内に残った文字画像部分を2値化する。なお、領域n×mの範囲は、文字となると予測できる範囲まで拡大するものである。また、2値化の結果は黒で示してある。
【0058】
以上、実施の形態で説明したように、入力された多値画像から文字画像とそれ以外の性質の異なる画像領域(背景画像領域)とに分離し、先ず、分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から背景画像領域の2値化しきい値を決定して背景画像領域の2値化処理を行い、2値画像を作成する。そのため、従来できなかった文字画像の背景に色が付いているような画像であっても、高精度かつ高速に2値画像が作成できる。また、この2値画像を用いることで認識精度を向上することができる。
【0059】
(5):プログラムのインストールの説明
画像2値化手段10a、画像認識手段14a、多値画像2値化部10、文字画像領域検出部11、文字画像領域2値化部12、背景画像領域2値化部13、2値画像認識部14等は、プログラムで構成でき、主制御部(CPU)が実行するものであり、主記憶に格納されているものである。このプログラムは、一般的な、コンピュータで処理されるものである。このコンピュータは、主制御部、主記憶、ファイル装置、表示装置、キーボード等の入力手段である入力装置などのハードウェアで構成されている。
【0060】
このコンピュータに、本発明のプログラムをインストールする。このインストールは、フロッピィ、光磁気ディスク等の可搬型の記録(記憶)媒体に、これらのプログラムを記憶させておき、コンピュータが備えている記録媒体に対して、アクセスするためのドライブ装置を介して、或いは、LAN等のネットワークを介して、コンピュータに設けられたファイル装置にインストールされる。そして、このファイル装置から処理に必要なプログラムステップを主記憶に読み出し、主制御部が実行するものである。
【0061】
【発明の効果】
以上説明したように、本発明によれば次のような効果がある。
【0062】
(1):画像2値化手段で、入力多値画像を文字画像領域と背景画像領域とに分離し、該分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行うため、文字画像の背景に色が付いている画像であっても高精度に2値化でき、かつ一定しきい値で2値化処理を行うため高速に2値化することができる。
【0063】
(2):画像2値化手段で、入力多値画像に含まれる低階調の代表値を選んで2値化処理を行い、該作成された2値画像から文字画像を多く含む文字画像領域とそれ以外の背景画像領域とに分離するため、低階調である黒い部分のみ2値化して、容易に文字画像領域を分離することができる。
【0064】
(3):画像2値化手段で、分離した文字画像領域内が全て文字画像の単一階調である場合、該単一階調の文字画像領域に背景画像が含まれるように該文字画像領域を変更して、2値化処理を行うため、文字画像領域内が全て文字画像の場合でも、文字画像が細く出力されることを防止し、適切な2値化を行うことができる。
【0065】
(4):画像2値化手段で、分離した各文字画像領域に対して行った2値化処理時の各2値化しきい値を求め、前記2値化処理された領域を含むように拡大した矩形内の領域を前記求めた2値化しきい値で2値化処理するため、文字画像領域として、抽出されなかった文字画像部分を適切に2値化処理することができる。
【0066】
(5):入力多値画像を文字画像領域と背景画像領域とに分離し、該分離した各文字画像領域に対して2値化処理を行い、該2値化処理時の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行う画像2値化手段と、該2値化処理で作成した2値画像の認識を行う画像認識手段と、してコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体とするため、この記録媒体のプログラムをコンピュータにインストールすることで、文字画像の背景に色が付いている画像であっても高精度に2値化でき、かつ高速に2値化することができる文書画像認識装置を容易に提供することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】実施の形態における文書画像認識装置の構成の説明図である。
【図3】実施の形態における文字画像領域検出部の処理の説明図である。
【図4】実施の形態における2値画像領域分離手段のイメージによる説明図である。
【図5】実施の形態における文字画像領域2値化部の説明図である。
【図6】実施の形態における判別分析における判別基準を用いた2値化処理例の説明図である。
【図7】実施の形態における背景画像領域2値化部の処理の説明図である。
【図8】実施の形態における背景画像領域2値化の例1の説明図である。
【図9】実施の形態における背景画像領域2値化の例2の説明図である。
【符号の説明】
1 入力多値画像
10a 画像2値化手段
14a 画像認識手段

Claims (5)

  1. 入力多値画像に含まれる低階調の代表値を2値化しきい値に用いて該入力多値画像の2値化処理を行って第1の2値画像を作成し、該作成された第1の2値画像を基に、前記入力多値画像を、文字画像を多く含む文字画像領域とそれ以外の背景画像領域とに分離し、該文字画像領域毎に判別分析における判別基準を用いて2値化しきい値を決定して2値化処理を行い、該文字画像領域毎の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行い、第2の2値画像を作成する画像2値化手段と、
    前記第2の2値画像の認識を行う画像認識手段と
    を備えることを特徴とした文書画像認識装置。
  2. 前記画像2値化手段は、
    前記文字画像領域毎に当該文字画像領域内に背景画像が含まれるか否かを判定する判定手段を更に備え、
    前記背景画像が含まれないと判定した文字画像領域については背景画像が含まれるように変更し、
    前記背景画像が含まれると判定した文字画像領域については、判別分析における判別基準を用いて2値化しきい値を決定して2値化処理を行う、
    ことを特徴とした請求項1記載の文書画像認識装置。
  3. 前記画像2値化手段は、前記各文字画像領域毎に決定した2値化しきい値を用いて、当該文字画像領域及び当該文字画像領域の周囲の背景画像領域の2値化処理を行う
    ことを特徴とした請求項1記載の文書画像認識装置。
  4. 前記画像2値化手段は、前記文字画像領域内の、前記判別分析における判別基準を用いて決定した前記2値化しきい値以上の階調の画素群の平均階調と前記判別分析における判別基準を用いて決定した前記2値化しきい値より小さい階調の画素群の平均階調との間の分散値が、所定の分散しきい値以下であるか否かにより前記文字画像領域内が全て文字画像であるか否かを判定する判定手段を更に備え、
    前記判定手段で背景画像が含まれると判定されるまで、前記文字画像領域を膨張し、該膨張後の文字画像領域について前記判別分析における判別基準を用いて2値化しきい値を決定する処理を繰り返し、
    前記判定手段で背景画像が含まれると判定した前記文字画像領域について、前記判別分析における判別基準を用いて決定した2値化しきい値による2値化処理を行う
    ことを特徴とする請求項1記載の文書画像認識装置。
  5. 入力多値画像に含まれる低階調の代表値を2値化しきい値に用いて該入力多値画像の2値化処理を行って第1の2値画像を作成し、該作成された第1の2値画像を基に、前記入力多値画像を、文字画像を多く含む文字画像領域とそれ以外の背景画像領域とに分離し、該文字画像領域毎に判別分析における判別基準を用いて2値化しきい値を決定して2値化処理を行い、該文字画像領域毎の2値化しきい値から前記背景画像領域の2値化しきい値を決定して前記背景画像領域の2値化処理を行い、第2の2値画像を作成する画像2値化手段と、
    前記第2の2値画像の認識を行う画像認識手段と
    してコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2000102968A 2000-04-05 2000-04-05 文書画像認識装置及び記録媒体 Expired - Lifetime JP4409713B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000102968A JP4409713B2 (ja) 2000-04-05 2000-04-05 文書画像認識装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000102968A JP4409713B2 (ja) 2000-04-05 2000-04-05 文書画像認識装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001291056A JP2001291056A (ja) 2001-10-19
JP4409713B2 true JP4409713B2 (ja) 2010-02-03

Family

ID=18616743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000102968A Expired - Lifetime JP4409713B2 (ja) 2000-04-05 2000-04-05 文書画像認識装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP4409713B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1398726B1 (en) 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
KR100703284B1 (ko) 2003-01-30 2007-04-03 삼성전자주식회사 영상신호의 이진화 장치 및 방법
JP6173542B1 (ja) * 2016-08-10 2017-08-02 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
JP6294524B1 (ja) * 2017-02-15 2018-03-14 ソフネック株式会社 画像処理方法、及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2001291056A (ja) 2001-10-19

Similar Documents

Publication Publication Date Title
Gllavata et al. A robust algorithm for text detection in images
Parker et al. An approach to license plate recognition
US5073953A (en) System and method for automatic document segmentation
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
US7346211B2 (en) Image type classification using color discreteness features
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US7379593B2 (en) Method for image segmentation from proved detection of background and text image portions
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
US6985628B2 (en) Image type classification using edge features
KR20010110416A (ko) 비디오 스트림 분류가능 심볼 고립 방법 및 시스템
WO2003034335A2 (en) Method and apparatus for discriminating between different regions of an image
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
US6269186B1 (en) Image processing apparatus and method
US6289120B1 (en) Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form
US20110194759A1 (en) Mouth Removal Method For Red-Eye Detection And Correction
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JPH0565911B2 (ja)
US20060269132A1 (en) Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
JPH10285399A (ja) 画像の二値化方法
JPH064704A (ja) 罫線識別方法及び領域識別方法
JP3150762B2 (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
JPH10232926A (ja) 画像処理装置及びその方法
JP4213357B2 (ja) 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JPH0535914A (ja) 画像傾き検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090507

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090507

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091112

R150 Certificate of patent or registration of utility model

Ref document number: 4409713

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131120

Year of fee payment: 4

EXPY Cancellation because of completion of term