JP2008134970A - 文字認識装置、文字認識方法および文字認識プログラム - Google Patents

文字認識装置、文字認識方法および文字認識プログラム Download PDF

Info

Publication number
JP2008134970A
JP2008134970A JP2006322316A JP2006322316A JP2008134970A JP 2008134970 A JP2008134970 A JP 2008134970A JP 2006322316 A JP2006322316 A JP 2006322316A JP 2006322316 A JP2006322316 A JP 2006322316A JP 2008134970 A JP2008134970 A JP 2008134970A
Authority
JP
Japan
Prior art keywords
pixel
image
halftone dot
character recognition
halftone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006322316A
Other languages
English (en)
Other versions
JP4435141B2 (ja
Inventor
Kazuaki Yokota
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006322316A priority Critical patent/JP4435141B2/ja
Publication of JP2008134970A publication Critical patent/JP2008134970A/ja
Application granted granted Critical
Publication of JP4435141B2 publication Critical patent/JP4435141B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】網掛け文字を含む画像を文字認識する場合の文字認識精度を向上する。
【解決手段】この文字認識装置は、網掛け画像から、文字の周囲の網点を除去して第1網点除去画像を生成する第1画像処理部12と、予め設定された網点の配置パターンを用いて除去した2つ網点に近接する他の網点の位置を求め、その網点の位置の画素が黒画素の場合、その位置を中心として円周を計算し、円周上にある画素が、連続する白画素と連続する黒画素とに2分された場合、その2つの区分点間を結んで第1網点除去画像を区分し、円周の白画素の側にある黒画素の領域を除去して第2網点除去画像を生成する第2画像処理部16と、第2網点除去画像に対して文字認識を行う文字認識部17とを備える。
【選択図】図1

Description

本発明は、例えば網掛け領域に文字が記入された帳票がスキャナなどで読み取られたときの画像データから文字を認識する文字認識装置、文字認識方法および文字認識プログラムに関する。
帳票をスキャナなどで帳票の画像を読み取って、その画像から帳票に記入された文字を認識する文字認識装置が既にある。
近年、演算速度の向上や文字解析プログラムの高精度化により、文字認識装置の文字認識精度は向上してきたものの、帳票に記載されている文字の字体や書体によっては、文字認識精度が落ちるものも多い。以下、網掛けされた画像(以下「網掛け画像」と称す。)に対して文字認識装置が文字を認識する場合について説明する。
通常、網掛けのある帳票から文字を文字認識装置で読み取る場合、通常、大きさが小さな連結成分、つまり文字以外の部分に点在する網点を除去した後の画像を用いて文字認識処理を行う。
このような画像に対して網点を除去する従来の技術としては、例えば網掛けのある帳票の画像を、高速フーリエ変換することで、特定の空間周波数成分を除去する技術がある(例えば特許文献1参照)。
また、他の先行技術として、例えば文字の輪郭を追跡することで突起状のものを取り除く技術がある(例えば特許文献2参照)。
特開2000−293630公報 特開2003−67738公報
上記特許文献1の技術の場合、高速フーリエ変換とは言っても計算量が甚大であるため、帳票を連続して読み取るような業務処理には向かない。また、この技術の場合、特定の空間周波数成分を除去するため、元の文字の画像も除去されてしまうなどの欠点がある。
また上記特許文献2の技術の場合、濁点やピリオドなどのように、文字から離れている微小な文字の特徴部分も同時に失われてしまうという問題がある。
本発明はこのような課題を解決するためになされたもので、網掛けされた画像に含まれる文字の画像に重なる網点を文字にできるだけ忠実に除去して文字認識精度を向上することのできる文字認識装置、文字認識方法および文字認識プログラムを提供することを目的とする。
上記の課題を解決するために本発明の文字認識装置は、規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置において、記憶装置と、前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、その位置の前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、前記第2処理画像に対して文字認識を行う文字認識手段とを具備することを特徴とする。
本発明の文字認識装置方法は、規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置における文字認識方法において、前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、その位置の前記画素連結成分を前記網掛け画像から除去した第1処理画像とを記憶装置に記憶するステップと、前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出するステップと、前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定するステップと、前記黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算するステップと、前記計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定するステップと、前記2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成するステップと、前記第2処理画像に対して文字認識を行うステップとを有することを特徴とする。
本発明のプログラムは、規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置を動作させるプログラムにおいて、前記文字認識装置を、記憶装置と、前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、その位置の前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、前記第2処理画像に対して文字認識を行う文字認識手段として機能させることを特徴とする。
本発明によれば、網掛けされた画像に含まれる文字の画像に重なる網点を、文字にできるだけ忠実に除去して文字認識精度を向上することができる。
以下、本発明の実施の形態について図面を参照しながら説明する。図1は本発明の実施形態に係る文字認識装置の構成を示すブロック図である。
図1に示すように、この文字認識装置は、帳票21を読み取るスキャナ22などの入力ユニット20と、入力ユニット20から入力される画像データを受け付けて文字認識処理を実行するコンピュータ1(以下「PC1」と称す。)とを備える。
PC1は、入力インターフェース部11(以下「入力I/F11」と称す。)、第1網点除去手段としての第1画像処理部12、記憶装置3、網点判定部13、円周計算部14、区分点判定部15、第2網点除去手段としての第2画像処理部16、文字認識部17、出力インターフェース部18(以下「出力I/F18」と称す。)とを備える。
記憶装置3は、例えばRAM、ROMおよびハードディスクドライブ装置等により実現される。入力I/F11および出力I/F18は、PC1の外部インターフェース装置の一つであり、例えばUSBインターフェース、LANインターフェース、D−sub端子などである。
第1画像処理部12、網点判定部13、円周計算部14、区分点判定部15、第2画像処理部16、文字認識部17などは、ソフトウェア(プログラム)の機能をブロック化したものであり、PC1のセントラルプロセッシングユニット(以下「CPU」と称す。)の一つの機能として実現される。CPUは、記憶装置3に記憶されたプログラムのコードを読み込んで上記各部の機能を実現する。また各部は、ソフトウェア(プログラム)に限定されることなく、独立したハードウェア(機能部品)で構成しても良い。
スキャナ22は、読み取り対象の文字が記載された帳票21から文字、図形、写真等を読み取って、画像データとしてPC1に転送(入力)する画像入力装置である。スキャナ22は、帳票21の表面に光を当てて、その反射光をCCDなどの光電変換素子で読み取ってデジタルデータに変換する。
記憶装置3には、処理対象画像記憶部31、網点位置情報記憶部32、第1網点除去画像記憶部33、第2網点除去画像記憶部34、帳票定義記憶部35、辞書データ記憶部36、認識結果記憶部37等を有している。
処理対象画像記憶部31には、処理対象の画像として入力ユニット20から入力された帳票21の画像データ(以下「網掛け画像と称す。」が記憶される。
網点位置情報記憶部32には、網掛け画像から検出された網点の位置情報が記憶される。
第1網点除去画像記憶部33には、網掛け画像から、所定の直径(径)以下の網点を除去した第1処理画像としての第1網点除去画像が記憶される。網点とは、スキャナ22の解像度を例えば400dpi程度に設定し帳票21をスキャニングして得られた画像の場合、10ピクセル(0.6mm)程度の黒画素の集合体(画素の連結成分)である。なお、これは一例であり、解像度の設定によってはピクセル数が変化する場合がある。
第2網点除去画像記憶部34には、第1網点除去画像から文字に重なった網点を除去して生成された第2処理画像としての第2網点除去画像が記憶される。
帳票定義記憶部35には、帳票定義情報としての帳票21のフォーマットコントロールデータが記憶されている。フォーマットコントロールデータは、タイミングマークの位置、帳票21の大きさ(mm単位)、読み取り対象の文字が記入された枠の種類及び大きさ、文字数、文字ピッチ、文字の属性(住所、氏名等)、出力形式(テキスト、CSV、XML等)、加工情報(全角・半角変換、順序変更等)、画像出力形式(JPEG/TIFF)、画像の解像度、画像の切り出し位置が定義されている。
タイミングマークは、帳票21の読み取り開始位置を示すものである。また、タイミングマークは、帳票21から読み取った網掛け画像の基点(座標)にされる。タイミングマーク以外では、例えば帳票21の四角のいずれか一点を基点にしても良い。
辞書データ記憶部36には、文字認識処理を行う際に参照される辞書データが記憶されている。辞書データは、文字イメージ(文字パターン)に文字コードを対応させたデータである。
認識結果記憶部37には、第2網点除去画像から切り出された文字イメージとそれを文字認識した文字コードとが対応して記憶される。
第1画像処理部12は、規則的に点在する網点によって網掛け領域が形成された文字を含む帳票21の画像データ、つまり網掛け画像から、標準的な網点とほぼ同じ径を持つ黒画素の連結成分の中心位置を検出し、その連結成分を網掛け画像から除去して第1処理画像としての第1網点除去画像を生成し、検出した黒画素の連結成分の中心位置の位置情報と第1網点除去画像を記憶装置3に記憶する。網掛け画像に形成される網掛け領域は一部分でもよく全部でも良い。
規則的に点在する網点とは、例えば格子状に線分を引き、多数の正方形またはひし形を形成したときの交点(頂点)の位置に点在させた網点を言う。
網点判定部13は、記憶装置3に記憶された第1網点除去画像と、除去された黒画素の連結成分の位置情報のうちの任意の隣接する2つ黒画素の連結成分の位置情報を読み出して、予め設定された計算ルールから、2つ黒画素の連結成分に近接する他の黒画素の連結成分の位置を算出し、その位置の第1網点除去画像の画素が白画素か黒画素かを判定する。
計算ルールとは、例えば直角二等三角形の1辺からその頂点を求める計算式等である。この他、予め記憶装置3に網点の配置パターン等を記憶しておき、その配置パターンから他の網点の位置を求めても良い。
円周計算部14は、網点判定部13により黒画素と判定された位置を中心とし、網点(黒画素の連結成分)がとり得る所定の径の範囲で円周座標を計算する。
網点(黒画素の連結成分)がとり得る所定の径の範囲とは、網点の径の平均値Wを例えば10ピクセル程度とすると、初期値を下限値minの5ピクセル程度として、その値から増分Δ(例えば1ピクセル)ずつプラスして円周を計算し、最大値maxの例えば15ピクセル程度まで行う(min<W<max)。
つまり、網点(黒画素の連結成分)がとり得る所定の径の範囲とは、網点の径の下限値から上限値までの範囲を言う。網点の径の下限値や上限値は、実際の帳票21から計測して統計をとってもよく、帳票21の規格書などに設定されている値を用いても良い。また、下限値、上限値にマージンをとっても良い。
区分点判定部15は、円周計算部14により計算された円周座標上にある第1網点除去画像の全ての画素の色を検出し、検出した円周座標上の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する。
第2画像処理部16は、区分点判定部15により円周が2分されたものと判定された画素の区分点間を結んで第1網点除去画像を2つの領域に区分し、円周の白画素の側にある黒画素の領域を除去して第2網点除去画像を生成し、第2網点除去画像記憶部34に記憶する。
文字認識部17は、文字の画像に重なった網点(黒画素の連結成分)が除去された第2網点除去画像を第2網点除去画像記憶部34から読み出し、読み出した第2網点除去画像に対して記憶装置3の辞書データを用いて文字認識処理を行う。
以下、図2乃至図9を参照してこの文字認識装置の第1の動作例を説明する。なおこの例は、帳票21から読み取った画像がモノクロ画像の場合の例で説明するが、カラー画像でも良い。
この文字認識装置の場合、帳票21がスキャナ22に設置されて、読み取り開始のボタン操作が行われると、帳票21の表面がスキャナ22により読み取られてその画像データがPC1の入力I/F11を通じて処理対象画像記憶部31に記憶される。
すると、第1画像処理部12は、処理対象画像記憶部31に記憶された帳票21の画像データである網掛け画像(図3参照)を読み出して、網点とほぼ同じ径を持つ黒画素の連結成分の中心位置を検出し、その位置にある黒画素の連結成分を網掛け画像から除去して第1網点除去画像(図4参照)を生成し、検出した黒画素の連結成分の中心位置の位置情報(以下「中心座標」と称す。)を網点位置情報記憶部32に記憶すると共に、第1網点除去画像を第1網点除去画像記憶部33に記憶する。
すなわち、第1画像処理部12は、文字周辺部の網点を除去し、文字周辺部の網点を除去した第1網点除去画像と、除去した網点の中心座標とを記憶装置3に記憶する(図2のステップ:S101)。
図4に示すように、第1網点除去画像では、文字に重なった(接触した)網点は、文字の連結成分と判断されるため、除去されない。
次に、網点判定部13は、除去した網点(黒画素の連結成分)の中心座標のうちの任意の上下に隣接する2つ網点(黒画素の連結成分)の中心座標(x座標,y座標)を網点位置情報記憶部32から読み出して、その2つの網点の組について処理済みを示すフラグを付し、図5に示すように、2つ網点Pのy座標間を一辺とし、その辺の両端の2角が45°となる直角二等辺三角形の頂点(網点)A,Bの座標を算出する(S102)。なお、2つ網点(黒画素の連結成分)が左右に隣接する場合はx座標間を一辺とする。
そして、網点判定部13は、処理対象画像記憶部31から第1網点除去画像を読み出して、それぞれの頂点(網点)A,Bに位置する、第1網点除去画像上の画素が白画素か黒画素かを判定する(S103)。
この例では、頂点(網点)Aの位置は、第1網点除去画像において既に消去された網点の位置であるため白画素であり、頂点(網点)Bの位置は、第1網点除去画像上では文字にかかっているため黒画素となっている。
円周計算部14は、図6に示すように、網点判定部13により黒画素と判定された頂点(網点)Bの位置を中心として、円周を求める計算式の径の値の初期値として、予め設定されている下限値minの5ピクセルを代入して(S104)、円周座標を計算する(S105)。初期値は、この例では下限値minとしたが、他の値でも良く変更可能である。
円周計算部14により円周座標が計算されると、区分点判定部15は、その円周座標上にある第1網点除去画像の全ての画素の色を検出し、検出した円周座標上の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する(S106)。
図6に示すように、この例では、初期値では円周61が第1網点除去画像の網点領域よりも十分小さいため、円周座標上の画素は全て黒画素である。
このように円周座標上の画素が白画素と黒画素に2分されない場合(S106のNo)、区分点判定部15は、円周計算部14に対して円周を再計算するよう指示する。
円周の再計算にあたり、円周計算部14は、直前の直径Sの値から増分Δ(例えば1ピクセル)をプラスして(S107)、直径Sが網点の最大値maxを超えたか否かを判定する(S108)。最大値maxおよび増分Δの値は予め設定されている値であり、修正可能である。
この判定の結果、最大値maxを超えていない場合(S108のNo)、円周計算部14は、S105の処理に戻り、再度円周を計算する。この計算は、2分されない間、網点の最大値maxの、例えば15ピクセル程度まで繰り返される。つまり、除去した網点の径よりも円周が十分大きくなるまで繰り返される。
円周計算を繰り返している間に、円の直径Sが網点の最大値maxを超えた場合(S108のYes)、円周計算部14は、S102の処理に戻り、除去した中で、フラグが付されていない任意の2つの網点(黒画素の連結成分)の中心座標を読み出して今までの処理を繰り返す。
そして、除去した全ての隣接する網点の組合せについて処理を行った場合(S110のYes)、処理を終了する。
上記円周座標計算を繰り返した結果、図7に示すように、円周61が連続する白画素61aと連続する黒画素61bとに2分された場合、区分点判定部15により、連続する白画素と連続する黒画素とに2分されたものと判定される(S106のYes)。なお図面上、点線で示す円の色が白画素と黒画素とが逆になっている。
この場合、第2画像処理部16は、図8に示すように、白画素と黒画素との区分点62間を直線63で結んで第1網点除去画像60を2つの領域に区分し、円周の白画素の側にある黒画素の領域64を除去して第2網点除去画像を生成し、生成した第2網点除去画像を第2網点除去画像記憶部34に記憶する。
換言すると、第2画像処理部16は、直線63と円周の白画素61aで囲まれた領域を白画素に置換する(塗りつぶす)。つまり、第2画像処理部16は、区分点62間を結ぶ直線63で2分された文字の外側の黒画素の領域を消去する(S109)。
この結果、図9に示すように、第1網点除去画像で文字画像65から突出していた網点66が消去されて、文字のラインに忠実な、なめらかな文字画像67が得られる。
その後、文字認識部17は、文字の外縁から突出していた網点が除去された第2網点除去画像を第2網点除去画像記憶部34から読み出し、その第2網点除去画像に対して辞書データ記憶部36の辞書データを用いて文字認識処理を行い、文字認識処理の結果を記憶装置3に記憶する。
文字認識処理は、帳票定義に従って第2処理画像から文字画像を切り出す処理や、切り出した文字画像と辞書データ記憶部36の辞書データとをマッチングし、合致度の高い文字コードを選出し、その文字コードと文字画像とを認識結果記憶部37に記憶する処理などが含まれる。
続いて、図10乃至図13を参照してこの文字認識装置の他の動作例について説明する。まず、図10を参照して第2動作例について説明する。上記動作例では、網点が斜めに並んでいる網掛けを除去したが、この第2動作例では、図2に示したS101の処理において、第1画像処理部12は、所定の径以下の網点を除去したときの網点の中心座標の分布(配置または並び)から、網掛けのパターンが正方形パターンかひし形パターンかを識別する。
正方形パターンの場合、次のS102の処理において、網点判定部13は、除去した網点(黒画素の連結成分)の中心座標のうちの任意の上下に隣接する2つ網点(黒画素の連結成分)の中心座標(x座標,y座標)を網点位置情報記憶部32から読み出して、その2つの網点(黒画素の連結成分)の組について処理済みを示すフラグを付し、図10に示すように、上下に隣接する2つの網点Pのy座標間を一辺とする正方形を、辺の左右に2つ作成し、それぞれの頂点(網点)A,B,C,Dの座標を算出する。
以降の処理は、図2のフローチャートの処理と同様である。この第2動作例によれば、網点が縦横に並んでいる網掛け(正方形パターン)の場合にも対応でき、文字に接触した網点を除去できる。
図11を参照して第3動作例について説明する。この例では、図2のS101の処理において、第1画像処理部12は、除去した網点(黒画素の連結成分)の中の任意の2つの隣接する網点Pの中心座標から、互いの間の距離と方向を算出する。
続いて、第1画像処理部12は、図11に示すように、算出した網点P間の距離と方向に従って網点P間を結ぶ辺を延長して画像全面の網点の位置(中心座標)を算出する。
以降の処理は、図2のフローチャートの処理と同様であり、算出された網点の位置(中心座標)が黒画素であった場合に、その位置を中心に円周を計算し、文字に重なった網点を消去する。この第3動作例によれば、消去した網点から離れて文字画像の反対側の縁で文字と繋がった網点も消去することができる。
図12,図13を参照して第4動作例について説明する。スキャナ22の解像度が低い場合等、図12に示すように、網点よりも大きく網点とほぼ変わらない大きさの微小な連結成分、例えばピリオドや濁点等の画像が網点と重なったことで乱れる場合がある。
このような場合、上記実施形態では、ピリオドが線分Xの位置で削られることになるため、図13に示すように、元の文字画像(ピリオド)よりも文字の形状が悪化してしまう。
そこで、この第4動作例では、除去しようとする連結成分と網点の大きさとを比較して互いの差(面積の差等)を調べ、互いの差が所定の値に満たない場合、つまりあまり差がない場合、S109の消去処理をスキップする。
これにより、微小な連結成分については、重なっている網点の削除を行わない方が画像の乱れが小さい場合が多いため、「連結成分と網点の大きさの差が所定の値に満たない場合に消去処理を行わない」という条件を入れることで文字認識精度を高めることができる。
このようにこの実施形態の文字認識装置によれば、始めに、画像から、文字自体に関連しない部分の網点を除去して第1網点除去画像を生成し、次に、除去した網点の位置から、文字と接触または文字の中に含まれる網点の中心位置を特定し、その中心位置から計算した円周上の黒画素と白画素の分布を調べる。そして、円周が、連続する黒画素と連続する白画素とに2分された時点で、その2分された区分点を結んで第1網点除去画像を区分し、円周の白画素の側に位置する黒画素を除去して第2網点除去画像を生成し、この第2網点除去画像を用いて文字認識を行う。これにより、帳票21の網掛け画像から網掛け部分を高速かつ高精度に除去し文字認識精度を向上できる。
すなわち、この実施形態の文字認識装置によれば、網掛け画像に含まれる文字の画像に重なる網点を、文字の形状をできるだけ損なうことなく除去できる。つまり文字の画像に重なる網点を、文字にできるだけ忠実に除去して文字認識精度を向上することができる。
なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。また、上記実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の発明を構成できる。
例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の一実施形態の文字認識装置の構成を示す図である。 文字認識装置の動作を示すフローチャートである。 網点がひし形の頂点にある網掛け画像の一例を示す図である。 網掛け画像から網点を除去して生成した第1網点除去画像を示す図である。 除去した任意の隣接する2つの網点の位置から、第1網点除去画像の文字にかかる網点の位置を特定する動作を説明するための図である。 文字にかかった除去対象の網点の中心から円周座標を計算する動作を説明するための図である。 円の径を増分ずつ徐々に大きくしていったときに円周が白画素と黒画素に2分された状態を示す図である。 2分された位置で区分点間を結んで、円周の白画素の側にある第1網点除去画像の黒画素の領域を削除した様子を示す図である。 第1網点除去画像の文字画像と第2網点除去画像の文字画像とを比較して示す図である。 文字認識装置において、網点が正方形の頂点にある場合に、除去した網点の中心座標を求める動作を説明するための図である。 網点がひし形の頂点にある場合に、離れた文字画像の縁の位置に網点の中心位置を求める動作を説明するための図である。 網点とほぼ同じ大きさの連結成分(文字の一部)が存在する例を示す図である。 図12の連結成分を除去した場合の様子を示す図である。
符号の説明
1…コンピュータ(PC)、3…記憶装置、11…入力インターフェース部(入力I/F)、12…第1画像処理部、13…網点判定部、14…円周計算部、15…区分点判定部、16…第2画像処理部、17…文字認識部、18…出力インターフェース部(出力I/F)、20…入力ユニット、21…帳票、22…スキャナ、31…処理対象画像記憶部、32…網点位置情報記憶部、33…第1網点除去画像記憶部、34…第2網点除去画像記憶部、35…帳票定義記憶部、36…辞書データ記憶部、37…認識結果記憶部。

Claims (7)

  1. 規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置において、
    記憶装置と、
    前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、その位置の前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、
    前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、
    前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、
    前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、
    前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、
    前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、
    前記第2処理画像に対して文字認識を行う文字認識手段と
    を具備することを特徴とする文字認識装置。
  2. 前記他点位置算出手段は、
    消去された中の隣接する2つの画素連結成分のx座標間またはy座標間を一辺とし両端の角度が45°の直角二等辺三角形を作成し、その頂点の座標を算出することを特徴とする請求項1記載の文字認識装置。
  3. 前記他点位置算出手段は、
    消去された中の隣接する2つの画素連結成分のx座標間またはy座標間を一辺とする正方形を作成し、その頂点の座標を算出することを特徴とする請求項1記載の文字認識装置。
  4. 前記他点位置算出手段は、
    除去された中の任意の2つの隣接する画素連結成分の中心座標から、互いの間の距離と方向を算出し、算出した画素連結成分間の距離と方向に従って互いの間を結ぶ線分を延長して画像全面の画素連結成分の中心座標を算出することを特徴とする請求項1記載の文字認識装置。
  5. 前記第2網点除去手段は、
    除去対象の画素連結成分と網点の大きさとを比較して互いの差が所定の値に満たない画素連結成分については消去しないことを特徴とする請求項1記載の文字認識装置。
  6. 規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置における文字認識方法において、
    前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、その位置の前記画素連結成分を前記網掛け画像から除去した第1処理画像とを記憶装置に記憶するステップと、
    前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出するステップと、
    前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定するステップと、
    前記黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算するステップと、
    前記計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定するステップと、
    前記2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成するステップと、
    前記第2処理画像に対して文字認識を行うステップと
    を有することを特徴とする文字認識方法。
  7. 規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置を動作させるプログラムにおいて、
    前記文字認識装置を、
    記憶装置と、
    前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、その位置の前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、
    前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、
    前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、
    前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、
    前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、
    前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、
    前記第2処理画像に対して文字認識を行う文字認識手段
    として機能させることを特徴とする文字認識プログラム。
JP2006322316A 2006-11-29 2006-11-29 文字認識装置、文字認識方法および文字認識プログラム Expired - Fee Related JP4435141B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006322316A JP4435141B2 (ja) 2006-11-29 2006-11-29 文字認識装置、文字認識方法および文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006322316A JP4435141B2 (ja) 2006-11-29 2006-11-29 文字認識装置、文字認識方法および文字認識プログラム

Publications (2)

Publication Number Publication Date
JP2008134970A true JP2008134970A (ja) 2008-06-12
JP4435141B2 JP4435141B2 (ja) 2010-03-17

Family

ID=39559773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006322316A Expired - Fee Related JP4435141B2 (ja) 2006-11-29 2006-11-29 文字認識装置、文字認識方法および文字認識プログラム

Country Status (1)

Country Link
JP (1) JP4435141B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020089984A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020089984A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JPWO2020089984A1 (ja) * 2018-10-29 2021-06-03 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JP7022847B2 (ja) 2018-10-29 2022-02-18 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
US11620736B2 (en) 2018-10-29 2023-04-04 Pfu Limited Image processing device, control method, and control program

Also Published As

Publication number Publication date
JP4435141B2 (ja) 2010-03-17

Similar Documents

Publication Publication Date Title
JP5361574B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US7925084B1 (en) Merge and removal in a planar map of an image
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
GB2559446A (en) Generating a three-dimensional model from a scanned object
US20110113323A1 (en) Systems and methods to resize document content
JP5017031B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、並びに、記憶媒体
EP2782065B1 (en) Image-processing device removing encircling lines for identifying sub-regions of image
JP2009093638A (ja) 画像検出装置および画像検出方法
JP5067882B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP2010056691A (ja) 画像処理装置及び画像処理方法
US20110187721A1 (en) Line drawing processing apparatus, storage medium storing a computer-readable program, and line drawing processing method
JP4435141B2 (ja) 文字認識装置、文字認識方法および文字認識プログラム
JP2010011450A (ja) 画像形成装置及び画像処理方法
JP2007109177A (ja) 画像処理装置及びその制御方法、プログラム
JP4873554B2 (ja) 画像配信装置および画像配信方法
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
JP4825888B2 (ja) 文書画像処理装置および文書画像処理方法
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
US6661535B1 (en) Moire fringe eliminating apparatus and a method for eliminating moire fringes
KR100587979B1 (ko) 이미지 확대를 위한 경계선 및 귀퉁이 기반 보간 방법
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP6613625B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP7402931B2 (ja) 方法、コンピュータ可読プログラムおよびシステム
JP5499727B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、及びシール製造システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091222

R150 Certificate of patent or registration of utility model

Ref document number: 4435141

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140108

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees