JP2007102299A - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP2007102299A
JP2007102299A JP2005287780A JP2005287780A JP2007102299A JP 2007102299 A JP2007102299 A JP 2007102299A JP 2005287780 A JP2005287780 A JP 2005287780A JP 2005287780 A JP2005287780 A JP 2005287780A JP 2007102299 A JP2007102299 A JP 2007102299A
Authority
JP
Japan
Prior art keywords
plane
character
black
pattern
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005287780A
Other languages
English (en)
Other versions
JP4682783B2 (ja
Inventor
Masahiro Sakurai
雅寛 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2005287780A priority Critical patent/JP4682783B2/ja
Publication of JP2007102299A publication Critical patent/JP2007102299A/ja
Application granted granted Critical
Publication of JP4682783B2 publication Critical patent/JP4682783B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】多値の文字パターンの黒画素の密度を用いて文字認識に最適な2値の文字パターンを得るためのプレーンを決定する文字認識装置の提供。
【解決手段】多値の文字パターンの各画素を輝度値毎のプレーンに割り当て、文字認識に最適なプレーンを選択して2値の文字パターンを得る文字認識装置において、プレーンごとの黒画素数を測定する黒画素数測定部と、前記黒画素数の累積度数をプレーンごとに計算する累積度数計算部と、前記累積度数からプレーンごとの累積黒画素密度を求め、所定値にもっとも近い累積黒画素密度となるプレーンを出力するプレーン選択部と、を備えた。
【選択図】 図1

Description

本発明は、多値の文字パターンの黒画素の密度を用いて文字認識に最適な2値の文字パターンを得るためのプレーンを決定する文字認識装置に関するものである。
一般に、文字認識装置では光学スキャナ等により紙をイメージデータ化し、書かれている文字を切り出して1文字ごとにパターン化し、前記パターンから特徴を抽出し、前記特徴と辞書にある特徴との差分を取り、差分の最も少ない文字を選択することで文字認識を行っている。この時紙の材質や筆記具、記入者、印刷装置が一定でない場合、紙と文字との光学的な反射率が変化するため、前記光学スキャナで電子化される前記パターンは一定の濃度で収集されず、場合によっては濃くなったり、薄くなったりする。
通常、前記文字認識装置が持つ辞書は特定の条件下で収集されたパターンの特徴で作られているため、前記光学スキャナから取得した前記パターンが濃すぎたり、薄すぎたりすると正確に文字認識を行うことができない。そのため文字認識装置では前記パターンを多値のパターンとして取得し、前記多値パターンから文字認識に最適な2値パターンを生成する機能を有することで前記パターンが濃すぎたり、薄すぎたりすることを防いでいる。
参考として図4に多値パターン及びそれから作成された2値パターンの例を示す。本例では多値パターンから選択するプレーンによって薄すぎるパターン、適当なパターン、濃すぎるパターンが生成されることが判る。
さて、多値パターンから文字認識に最適な2値パターンを作成する方法として平均線幅を利用した方法が既に提案されている。(例えば、特許文献1参照)前記特許では、まず多値パターンから適当な2値パターンを生成し、前記2値パターンから平均線幅を求め、前記平均線幅が予め設定されている線幅許容範囲外の場合は前記平均線幅と理想とする平均線幅との差分の分だけ2値化閾値を変更して再度2値パターンを作成し、前記平均線幅が前記線幅許容範囲に入るまで前記2値化処理と前記平均線幅の計算を繰り返すというものである。
特開2002−157552
しかし前記の方法では平均線幅が線幅許容値内に収まるまで何度も2値化処理を行う必要があるため最初の2値化閾値が妥当な値でない場合は2値化処理と平均線幅の計算を繰り返すため処理速度の低下の原因となっていた。
このような課題を解決するために、本発明の文字認識装置は以下の構成を備える。
<構成1>
多値の文字パターンの各画素を輝度値毎のプレーンに割り当て、文字認識に最適なプレーンを選択して2値の文字パターンを得る文字認識装置において、プレーンごとの黒画素数を測定する黒画素数測定部と、前記黒画素数の累積度数をプレーンごとに計算する累積度数計算部と、前記累積度数からプレーンごとの累積黒画素密度を求め、所定値にもっとも近い累積黒画素密度となるプレーンを出力するプレーン選択部と、を備えた。
<構成2>
前記文字パターンのサイズの縦横比を計算する縦横比計算部をさらに備え、前記縦横比が一定以上横長の場合、前記プレーン選択部は第2の所定値にもっとも近い累積黒画素密度となるプレーンを出力する。
<構成3>
前記所定値は黒画素数と白画素数が略同数となるように選ばれ、前記第2の所定値は、黒画素数がより少なくなるように選ばれる。
黒密度を利用することで2値化処理をせずに文字認識に最適なプレーンを決定することが可能とり、従来方式に比べて処理速度を向上させることができる。
本発明の実施例について、以下のとおり説明する。
本発明においては黒画素の密度を用いることにより認識に最適な2値化閾値を求める。なお最適な2値化閾値を求めることと、最適なプレーンを求めることは同意なのでこれ以降は「最適なプレーンを求める」という表現に統一する。
<実施例1の構成>
図1は、本発明のシステム構成図である。スキャナ4は認識対象となる文字が記入や印刷等された帳票等の紙を読み取って電子化された多値のイメージデータを得るためのものであり、文字認識装置3に接続されている。文字認識装置3は前記イメージデータを受け取り文字認識を行うための装置である。文字認識装置3は、ここでは、後述する各処理部やデータからなる文字認識プログラムを備えたコンピュータであることを想定するが、同様な機能を備えていれば文字認識専用のハードウェアとしても実現可能である。
文字認識装置3は、記憶部5、文字切り出し部6、最適プレーン計算部7、2値化部8、認識部9を備える。
記憶部5はメモリおよびハードディスクからなる。メモリはプログラムやデータ等を一時的にロードして利用し、ハードディスクはそれらのプログラムやデータ等を保存しておく。ここでは両者を記憶部5として総称する。記憶部5からデータを取り出す場合、ハードディスクから取り出してもよいし、いったんメモリにロードしたデータを取り出すようにしてもよい。
文字切り出し部6は、帳票上の文字を文字認識するために、前記多値のイメージデータ上から文字部分を切り出し各文字の文字パターンを得るための処理部である。文字パターンを切り出すには、まず文字の記入位置を割り出す。例えば定型の帳票であればあらかじめ帳票上の文字枠位置を登録しておいて、イメージデータ上から当該位置を切り出せばよい。非定型の帳票であれば、イメージデータ上の黒画素の横方向のヒストグラムをとり、ピークが発生する部分を行部分として切り出した後、各行部分に対して縦方向のヒストグラムをとり、ピークが発生する部分を文字部分として切り出せばよい。そのようにして文字データが存在する箇所を割り出した後、文字を形成する黒画素の外接矩形を抽出する。従って、外接矩形のサイズは縦横比は一定ではなく、文字の種類によって異なる。この外接矩形を切り出すことにより、文字パターンの切り出しが完了する。
最適プレーン計算部7は、切り出した多値の文字パターン(多値パターン)を2値化して文字認識する際の、最適なプレーンを求めるための処理部である。最適プレーン計算部の処理の詳細については後述する。
2値化部8は、求めた最適なプレーンによって多値パターンを2値化して2値の文字パターン(2値パターン)を得るための処理部である。
認識部9は、得られた2値パターンから文字の特徴データを取得し、あらかじめ登録してある特徴データと比較することにより文字を特定する処理部である。
図2は、本実施例における最適プレーン計算部7の構成図である。
最適プレーン計算部7は多値パターン1と、前記多値パターン1からプレーン別に黒画素数を測定する黒画素数測定部10、前記黒画素数から黒画素の累積度数を計算する累積度数計算部20、予め認識に最適と思われる黒画素の密度である黒密度を記憶しておく黒密度指定記憶部100、前記累積度数計算部20の結果から黒密度を計算し、前記黒密度指定記憶部100で記憶している値に最も近い黒密度を特定して前記黒密度に対応するプレーンを出力する黒密度比較部30および、前記黒密度比較部30が特定したプレーンの番号であるプレーン番号2から構成される。
ここで、多値の文字パターンと、その各プレーンについて、例をとって説明する。
第6図に文字が「+」の場合の4階調の文字パターンの例とプレーン毎の黒画素数と累積度数および黒密度を示す。図6(a)は文字パターンの各画素の輝度を示す。プレーンは画素の輝度値と一致するので、各画素がどのプレーンに属するかの情報も同時に示している。4階調のパターンにおいて値が0の場合が一番濃く、値が3の場合が一番薄い事を示している。
図6(b)から(e)は、各プレーンに属する画素のみを取り出した場合の画素の分布を示すものである。(b)のプレーン0が一番濃い画素であり、プレーン0のみを取り出した場合、文字の線幅は1画素分の太さとなる。(e)のプレーン3は一番薄い画素であり、プレーン3までを取り出した場合、すべての画素が含まれる。従って、図6(b)のプレーン0を選択して2値化すると、1画素分の幅を持つ細い線幅の「+」の2値パターンが得られる。これに対し、図6(e)のプレーン3を選択して2値化した場合は、すべての画素が含まれてしまうので、真っ黒な2値パターンとなってしまう。同様に、(c)プレーン1の場合は3画素分の文字幅の2値パターンが、(d)プレーン2の場合は5画素分の線幅の2値パターンが得られる。
図7はプレーン別の黒密度のグラフである。ここで黒密度とは、そのプレーンまでのすべてのプレーンに含まれる黒画素の数を累積し、総画素数で割って求める値である。図7からも分かるように、プレーン3を選択すると、黒密度は100%であり、すべての画素が含まれるので、プレーン3で2値化すれば真っ黒な文字パターンとなってしまう。プレーン2の場合は70%程度であり、プレーン1の場合はおよそ50%弱となる。本発明においては、前記黒密度について、通常の文字の文字パターン中に黒画素が閉める割合は略50%となるという認識のもとに、50%付近の値を黒密度の目標値として設定する。ここでは50%を設定したものとする。これにより、黒密度が50%となるようなプレーンが選択される。なお、ちょうど50%とならない場合は、50%に近い方のプレーンを選択する。図7の場合は、プレーン1が選択される。
<実施例1の動作>
図5に本実施例における動作の処理フローを示す。
まずS001において黒画素数測定部10は、多値パターンからプレーン毎のドット数を計算する。これは第6図における黒画素数に相当する。なおここで注目すべきは前記処理が多値パターンの全ドットを1回走査するだけで済み、2値化処理が必要無いことにある。
次にS002で累積度数計算部20は、S001で求めた黒画素数を足してプレーン0から各プレーンまでの黒画素数の累積度数を各プレーン毎に計算する。例えば、プレーン1であれば、プレーン0から1まで、プレーン2であれば、プレーン0から2まで、プレーン3であればプレーン0から3までといった具合に、プレーンの順序に従って累積度数を計算する。
続いてS003で累積度数計算部20は、文字パターンの総ドット数を計算するが、これは最後のプレーンであるプレーン3における累積度数と同じ値となるため特別な計算は必要無い。
さらにS004で黒密度比較部30は、各プレーンごとの累積度数を総ドット数で割って黒密度を計算する。第6図の文字パターンの場合は縦11ドット、横11ドットの合計121ドットで構成されているため、黒密度は(各プレーンにおける累積度数)/121で計算できる。
S005では、黒密度比較部30は、指定された黒密度に一番近い黒密度を探す。ここでは前述のとおり、指定黒密度を50%と設定する。その場合、第7図において黒密度50%に近いプレーンはプレーン1の47.1%である。
従ってS006では黒密度比較部30は、プレーン1を出力することになる。図8にプレーン1を選択した場合の2値パターンを図示する。前記図より黒密度により認識に適当な濃さの2値パターンが得られたことが判る。
前述の通り本方式では黒密度を利用することで2値化処理をせずに文字認識に最適なプレーンを決定することが可能となる。これにより従来方式に比べて処理速度を向上させることができる。
「−」のようにほぼ文字パターンと文字とが一致するような文字の場合には、文字パターン中に背景部分が占める割合が極めて少なく黒画素の占める割合が多いので、通常の文字と同じ方式でプレーンの選択を行うと薄いプレーンで2値化することになってしまう。その場合2値パターンの文字かすれが発生しやすく、文字認識の精度に悪影響を及ぼす。このため、本実施例では、実施例1の構成に加え、「−」のような横長文字であることが検出できたら指定黒密度を切り替えることにより、横長文字の場合にも望ましいプレーンを選択できるようにする。
<実施例2の構成>
本実施例のシステム構成は実施例1と同じく図1で示されるので説明は省略する。
図3は、本実施例における最適プレーン計算部7の構成図である。
本構成図において、多値パターン1、黒画素数測定部10、累積度数計算部20、黒密度指定記憶部100、プレーン番号2は実施例1と同じであるため説明を省略する。前記以外の構成としては文字パターンの縦および横の画素数をもとに縦横比を計算するパターン縦横比計算部40、縦横比が設定値以上の場合に使用される第2の指定黒密度を格納する黒密度指定記憶部B110が追加されている。さらに、黒密度比較部30は、指定黒密度として黒密度指定記憶部100と黒密度指定記憶部B110のいずれの値を用いるかを、前記パターン縦横比計算部40の計算結果を元に決定して切り替える機能を持っている。
図10に、文字が[−]の場合の4階調の文字パターン「−」の例とプレーン毎の黒画素数と累積度数および黒密度を示す。図10の(a)から(e)の意味は図6と同様である。
また、図11はプレーン毎の黒密度を示す。
図10の多値パターンから判るとおり、前記多値パターンは薄めな横長文字である。このような文字の場合に実施例1の処理を行うと図11において黒密度50%に一番近いプレーンはプレーン2であるため、2値パターンは図12(a)になる。前記2値パターンは黒画素数が少なく、中央が膨らんだような形状になっており、認識対象としては不適格である。
上記問題を回避するために黒密度指定記憶部B110を追加し、指定黒密度として例えば75%という値を設定する。前記値は前記黒密度指定記憶部100に記憶した50%という値よりも大きな値であることが重要である。
<実施例2の動作>
図9に実施例2における動作の処理フローを示す。
まずS001からS004までの累積度数の計算までは実施例1と同じなので省略する。
次にS021においてパターン縦横比計算部40は、パターンの縦横比を計算する。本例における文字パターンは「−」という横に長いパターンのため縦横比は横に大きな値となる。ここでは図による説明の都合上1:2以上を想定するが、実際には1:4等もっと大きな比率を用いてもよい。
続いてS022で黒密度比較部30は、縦横比が予め設定されている閾値以上かどうかを確認する。閾値より小さい場合は「No」ということでS023に進む。
S023では黒密度比較部30は、黒密度指定値として前記黒密度指定記憶部100に設定されている値50%を使用する。一方縦横比が閾値以上の場合は「Yes」ということでS024に進む。
S024では黒密度比較部30は、前記黒密度指定記憶部B110に設定されている値75%を使用する。以上の処理により縦横比の値が大きい場合は黒密度値は75%という値になる。
その後の処理については実施例1のS005以降と同じなので省略する。
上述のとおり、横長文字の場合には、第2の黒密度指定値である75%が使用される。第10図から黒密度が75%に近いのはプレーン3であるため、最適なプレーンはプレーン3となる。この場合の2値パターンは第12に示すパターンとなり、認識に十分な濃さを持ったパターンを得ることができる。
システム構成図 実施例1の最適プレーン計算部 実施例2の最適プレーン計算部 多値パターンおよび2値パターン 実施例1の処理フロー プレーンの説明 プレーンと黒密度の関係 2値パターンの例 実施例2の処理フロー プレーンの説明 プレーンと黒密度の関係 2値パターンの例
符号の説明
1 多値パターン
2 プレーン番号
3 文字認識装置
4 スキャナ
5 記憶部
6 文字切り出し部
7 最適プレーン計算部
8 2値化部
9 認識部
10 黒画素数測定部
20 累積度数計算部
30 黒密度比較部
100 黒密度指定記憶部
110 黒密度指定記憶部B

Claims (3)

  1. 多値の文字パターンの各画素を輝度値毎のプレーンに割り当て、文字認識に最適なプレーンを選択して2値の文字パターンを得る文字認識装置において、プレーンごとの黒画素数を測定する黒画素数測定部と、プレーンごとの黒画素数をプレーンの順序に従い累積した累積度数を計算する累積度数計算部と、プレーンごとの前記累積度数からプレーンごとの累積黒画素密度を求め、所定値にもっとも近い累積黒画素密度となるプレーンを出力するプレーン選択部と、を備えた文字認識装置。
  2. 前記文字パターンのサイズの縦横比を計算する縦横比計算部をさらに備え、前記縦横比が一定以上横長の場合、前記プレーン選択部は第2の所定値にもっとも近い累積黒画素密度となるプレーンを出力する、請求項1に記載の文字認識装置。
  3. 前記所定値は黒画素数と白画素数が略同数となるように選ばれ、前記第2の所定値は、黒画素数がより多くなるように選ばれる、請求項2に記載の文字認識装置。
JP2005287780A 2005-09-30 2005-09-30 文字認識装置 Active JP4682783B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005287780A JP4682783B2 (ja) 2005-09-30 2005-09-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005287780A JP4682783B2 (ja) 2005-09-30 2005-09-30 文字認識装置

Publications (2)

Publication Number Publication Date
JP2007102299A true JP2007102299A (ja) 2007-04-19
JP4682783B2 JP4682783B2 (ja) 2011-05-11

Family

ID=38029214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005287780A Active JP4682783B2 (ja) 2005-09-30 2005-09-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP4682783B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03218590A (ja) * 1988-07-29 1991-09-26 Ricoh Co Ltd 最適2値化方法
JPH04343193A (ja) * 1991-05-20 1992-11-30 Ricoh Co Ltd 2値化閾値設定方法
JPH08274993A (ja) * 1995-03-29 1996-10-18 Kawasaki Steel Corp 画像処理における地肌色除去処理方法及び装置
JP2003228691A (ja) * 2002-02-04 2003-08-15 Fujitsu Ltd 帳票読取装置および帳票読取処理用プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03218590A (ja) * 1988-07-29 1991-09-26 Ricoh Co Ltd 最適2値化方法
JPH04343193A (ja) * 1991-05-20 1992-11-30 Ricoh Co Ltd 2値化閾値設定方法
JPH08274993A (ja) * 1995-03-29 1996-10-18 Kawasaki Steel Corp 画像処理における地肌色除去処理方法及び装置
JP2003228691A (ja) * 2002-02-04 2003-08-15 Fujitsu Ltd 帳票読取装置および帳票読取処理用プログラム

Also Published As

Publication number Publication date
JP4682783B2 (ja) 2011-05-11

Similar Documents

Publication Publication Date Title
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
JP4494563B2 (ja) トークン化によるイメージ分割を用いたイメージ処理方法および装置
US20010036314A1 (en) Image processing device
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
US20110164284A1 (en) Image processing apparatus and method
JP5229328B2 (ja) 文字領域抽出装置,文字領域抽出機能を備えた撮像装置,および文字領域抽出プログラム
US8463054B2 (en) Hierarchical OCR using decision tree and nonparametric classifier
JP5028911B2 (ja) 文字列認識プログラム、方法および装置
US8768058B2 (en) System for extracting text from a plurality of captured images of a document
US8472716B2 (en) Block-based noise detection and reduction method with pixel level classification granularity
JP4682783B2 (ja) 文字認識装置
JP3985928B2 (ja) 画像処理方法、画像処理装置、文字認識装置及び記憶媒体
US7702154B2 (en) Method and apparatus indentifying halftone regions within a digital image
JPH09305707A (ja) 画像抽出方式
JP4237642B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP5145862B2 (ja) 画像処理プログラムおよび画像処理装置
JP2004094292A (ja) 文字認識装置、文字認識方法及び該方法の実行に用いるプログラム
JP2002157552A (ja) 光学式文字読取装置
Battiato et al. Red-eyes removal through cluster-based boosting on gray codes
JPH0916715A (ja) 文字認識装置および方法
JP2004062385A (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4682783

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350