JP5189056B2 - マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム - Google Patents

マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム Download PDF

Info

Publication number
JP5189056B2
JP5189056B2 JP2009227468A JP2009227468A JP5189056B2 JP 5189056 B2 JP5189056 B2 JP 5189056B2 JP 2009227468 A JP2009227468 A JP 2009227468A JP 2009227468 A JP2009227468 A JP 2009227468A JP 5189056 B2 JP5189056 B2 JP 5189056B2
Authority
JP
Japan
Prior art keywords
mark
character
guide
recognition
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009227468A
Other languages
English (en)
Other versions
JP2011076390A (ja
Inventor
勝利 小原
将平 長谷川
博貴 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2009227468A priority Critical patent/JP5189056B2/ja
Publication of JP2011076390A publication Critical patent/JP2011076390A/ja
Application granted granted Critical
Publication of JP5189056B2 publication Critical patent/JP5189056B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、帳票の画像データから、選択項目を表すガイド文字と、選択項目を選択するために記入されたマーク図形を含むマーク項目を抽出して認識処理を行うマーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラムに関する。
一般に、帳票等、予め記入する項目が決められている定型の文書では、記入が必須で、かつ、いくつかの選択候補が存在する項目については、予め選択肢として選択候補を表すガイド文字を帳票上に印刷してある。利用者は、その中から選択するガイド文字に丸やレ点等の印を記入する。以下、このような印をマークまたはマーク図形とし、ガイド文字にマーク図形を記入することによって選択する項目をマーク項目とする。従来、このような帳票では、帳票の認識処理において選択項目を表すガイド文字とその他を分離できるように、ガイド文字をドロップアウト色で印刷していた。認識処理では、ガイド文字をドロップアウトさせて、残った画像の位置によって選択された選択項目を判定していた。しかし、近年は、IT(Information Technology)適用分野の拡大に伴って、認識対象の帳票の範囲が広がり、ガイド文字がドロップアウト色でないマーク項目の認識機能の実現要望が高まっている。
このため、未記入帳票のイメージをフォームイメージとして予め登録しておき、入力イメージからフォームイメージを除去し、除去後のイメージに基づいてマーク記入箇所を判定する方法がある(例えば、特許文献1)。また、入力イメージの投影分布からガイド文字とその周囲に記入したマーク範囲を抽出することで、マーク記入箇所を判定する方法がある(例えば、特許文献2)。さらに、ガイド文字を探索して除去し、周囲の画素数をカウントし、閾値以上にある場合に選択されたと判定することで、マーク記入箇所を判定する方法もある(例えば、特許文献3)。
特開2002−259909号公報 特開2008−77606号公報 特開2008−197764号公報
しかし、従来のマーク項目認識方法では、マーク項目認識の精度が低いという問題点があった。
帳票のマーク記入は、不特定多数の帳票の利用者がそれぞれに行うものであるため、帳票に記入されたマークの形状は一様ではない。例えば、ガイド文字を囲むようにマークすることを促すため、ガイド文字の周囲に補助情報としてガイド図形を印刷している帳票もある。しかし、ガイド図形が印刷されていても、記入されるマークの形状は、ガイド文字を囲むようにマークされている場合ばかりではない。記入マークが、ガイド文字上にガイド文字の一部のみを囲む形状である場合、選択したガイド文字の近くにある他のガイド文字にもマークが一部重なる形状の場合、囲み記号ではなく、レ点のような他の記号をガイド文字に書き込んだ場合、記入の一部がかすれた場合等、様々なケースがある。
しかしながら、単に、ガイド文字の周囲を検索し、マーク記入箇所を判定する従来の方法では、ガイド文字の周囲を囲むようにマークされている形状は認識できるが、それ以外の認識の精度は低くなる。予め未記入の帳票のイメージをフォームイメージとして登録しておけば、マーク項目認識の精度は上がる。しかし、認識対象の全帳票について未記入状態の帳票を入手し、登録するのは手間がかかるため、利用者の大きな負担となる。さらに、帳票が改訂された場合には、新たな帳票を入手してフォームイメージを登録し直す必要があった。また、帳票のフォームイメージが僅かに異なれば、そのフォームイメージでは対応することができなくなる等、利便性が低かった。
本発明は、このような点に鑑みてなされたものであり、事前のフォームイメージの登録を行うことなく、マーク項目の認識精度を上げることが可能なマーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラムを提供することを目的とする。
上記課題を解決するために、マーク図形除去手段、文字認識手段及び認識制御手段を有し、帳票の画像データからマーク項目を抽出して認識処理を行うマーク項目認識装置が提供される。マーク図形除去手段は、対象帳票の画像データを取得し、対象帳票に予め印刷された選択項目を表すガイド文字と、選択項目を選択するために記入されたマーク図形とが含まれるマーク項目領域の画像データを抽出する。マーク図形の形状を予め定義したマーク図形定義に基づいて、マーク項目領域の画像データに含まれるマーク図形定義に適合する形状を探索し、検出したマーク図形の位置を特定する。さらに、マーク図形と判定した形状をマーク項目領域の画像データから除去する。文字認識手段は、指示された対象の画像データから文字を抽出し、文字認識辞書記憶手段に記憶する文字認識辞書に基づいて、抽出した文字を認識する。認識制御手段は、マーク図形除去手段によってマーク図形を除去したマーク項目領域の画像データを対象とする文字認識を文字認識手段に行わせ、得られた文字認識結果及びマーク図形の位置をマーク項目認識結果として出力する。
また、上記課題を解決するために、上記マーク項目認識装置と同様の処理手順を実行するマーク項目認識方法と、コンピュータを上記マーク項目認識装置と同様に機能させるマーク項目認識プログラムと、が提供される。
また、上記課題を解決するために、さらに、マーク記入位置判定手段を有するマーク項目認識装置が提供される。マーク記入位置判定手段は、ガイド文字を含む文字の字形画像を文字の識別情報に対応付けて定義した字形辞書を字形辞書記憶手段に記憶しておき、文字認識手段によって認識された認識文字の識別情報に基づいて字形辞書を検索して該認識文字の字形画像を取得し、字形画像をマーク項目領域の画像データ上の認識文字と重ね合わせ、重なる部分を除去して認識文字をマーク項目領域の画像データから除去し、残った画像データと、マーク図形定義とを比較して適合しているか否かを判定し、適合しているときは残った画像データをマーク図形と見なし、マーク図形の位置を判定し、認識制御手段は、マーク図形が検出できないとき及びマーク項目領域の一部のガイド文字で文字認識手段による文字認識ができないときは、マーク記入位置判定手段によってマーク項目領域のマーク図形の位置を特定する。
開示のマーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラムによれば、マーク項目領域内のマーク図形を検出してマーク位置を特定するとともに、マーク図形の形状を画像データから除去することによって、ガイド文字をマーク図形から分離して文字認識を行う。これにより、マーク図形とガイド文字とが重なっている場合であっても、それぞれが認識可能となり、マーク項目の認識精度を上げることができる。
第1の実施の形態のマーク項目認識装置の構成例を示したブロック図である。 読み取り対象の帳票の一例を示した図である。 マーク項目認識装置のハードウェア構成例を示すブロック図である。 マーク項目認識装置のソフトウェア構成例を示すブロック図である。 対象帳票及び対象帳票マーク項目位置の一例を示した図である。 ガイド図形の検出と除去処理の一例を示した図である。 ガイド文字範囲の特定処理の一例を示した図である。 文字認識処理の一例を示した図である。 ガイド文字テーブルと文字認識結果チェック処理の一例を示した図である。 マーク図形の探索処理の一例を示した図である。 マーク付き文字認識処理部の文字認識処理の一例を示した図である。 認識結果情報の一例を示した図である。 マーク記入位置判定処理における字形抽出までの処理の一例を示した図である。 ガイド文字除去のための字形画像の生成処理を示した図である。 ガイド文字除去処理の一例を示した図である。 マーク図形の位置特定処理の一例を示した図である。 ガイド文字テーブルを用いた文字認識結果の補正処理の一例を示した図である。 その他の帳票イメージの例を示した図である。 マーク項目認識処理全体の処理手順の一例を示した図である。 一次文字認証処理の処理手順の一例を示したフローチャートである。 マーク付き文字認証処理の処理手順の一例を示したフローチャートである。 リトライ処理の処理手順の一例を示したフローチャートである。
以下、実施の形態を、図面を参照して説明する。
図1は、第1の実施の形態のマーク項目認識装置の構成例を示したブロック図である。
マーク項目認識装置10は、文字認識辞書記憶手段11a、ガイド文字テーブル記憶手段11b及び字形辞書記憶手段11cの記憶手段と、マーク項目位置特定手段12、ガイド図形除去手段13、認識制御手段14、文字認識手段15、マーク図形除去手段16及びマーク記入位置判定手段17の各処理手段を有する。各処理手段は、コンピュータがマーク項目認識プログラムを実行することにより、その処理機能を実現する。
文字認識辞書記憶手段11aは、画像データから抽出した文字画像の文字を認識するため、文字の画像特徴と、文字の識別情報とを対応付けた文字認識辞書を記憶する。ガイド文字テーブル記憶手段11bは、帳票に予め印刷されたガイド文字を定義したガイド文字定義を有するガイド文字テーブルを記憶する。ガイド文字は、利用者等がマークを記入して選択する選択項目を表す文字である。例えば、金融機関での振込に使用する振込依頼書で、科目の選択項目を表す「普通」、「当座」等の文字がガイド文字である。字形辞書記憶手段11cは、フォントに応じた文字の字形、すなわち文字の画像データを、文字の識別情報に関連付けた字形辞書を記憶する。
マーク項目位置特定手段12は、認識対象の帳票をスキャナ等で読み取ったイメージ画像の画像データを取得し、マーク項目認識を行う項目の位置を特定する。例えば、マーク項目に設定されている文字枠を検出し、その文字枠内をマーク項目領域としてマーク項目の位置を特定する。また、事前に作成した定義情報の位置を用いるとしてもよい。
ガイド図形除去手段13は、マーク項目位置特定手段12によって特定したマーク項目領域にガイド図形が含まれていないかどうかを判定する。ガイド図形とは、選択記入位置を示したガイド文字にマークを記入する際のガイドとなる図形である。例えば、予め印刷されたガイド文字の周囲を囲む楕円または円状の図形等である。ここでは、ガイド図形は、点線で描かれた閉じた形状(円状とする)であるとする。ガイド図形除去手段13では、マーク項目領域の画像データを読み出し、ガイド図形の条件に合致する形状を探索する。探索できたときは、検出した形状をガイド図形と判定し、画像データのガイド図形に対応する画素の色を帳票背景色に置き換え、ガイド図形を除去する。
認識制御手段14は、文字認識手段15、マーク図形除去手段16及びマーク記入位置判定手段17を制御し、マーク項目領域に含まれるガイド文字を認識するとともに、マーク図形の記入位置を検出する。文字認識手段15が認識した認識文字と、ガイド文字テーブル記憶手段11bが記憶するガイド文字テーブルとを照合し、一致率を求める。一致率が所定の閾値を超えたときは、文字認識が正しくできたと判定する。一致率が所定の閾値を超えないときは、文字認識不可としてマーク図形除去手段16によってマーク図形を除去して文字認識を行わせる。また、マーク図形の位置が特定できないときは、マーク記入位置判定手段17によってガイド文字を除去してマーク図形の位置を特定する。
文字認識手段15は、マーク項目内のガイド文字の画素を縦及び横に投影してヒストグラムを求め、ひとかたまりのガイド文字範囲の位置を探索する。そして、探索したガイド文字範囲の位置ごとに、文字認識辞書記憶手段11aが記憶する文字認識辞書を用いて文字認識を実行する。このとき、ガイド文字1文字の判別がしにくいものがあった場合には、認識できたガイド文字の画素を縦、横に投影して1文字のサイズを求め、1文字のサイズをガイド文字範囲に適用し、1文字ごとに分割した分割画像を用いて文字認識を行うとしてもよい。
マーク図形除去手段16は、文字認識手段15が検出したガイド文字範囲を周辺のガイド文字まで拡張した領域を探索範囲として、各ガイド文字に対するマーク図形を探索する。マーク図形の形状は予め定義されており、探索範囲の画像データを読み出し、マーク図形の定義に適合する形状を探索し、マーク図形の位置を特定する。探索できたときは、検出した形状をマーク図形と判定し、画像データのマーク図形に対応する画素の色を背景色に変え、マーク図形を除去する。
マーク記入位置判定手段17は、文字認識手段15において認識できた文字から1文字のサイズを求める。サイズの求め方は上記の文字認識手段15と同様である。そして、認識された文字に対応する字形を字形辞書記憶手段11cが記憶する字形辞書から抽出し、認識できた文字の認識画像のサイズに合わせて字形を拡大または縮小(以下、拡縮とする)する。そして、拡縮した字形画像と、認識画像とを重ね合わせ、一致する画素の色を帳票背景色に置き換えることにより、ガイド文字を除去する。そして、画像データ上に残った図形からマーク図形を探索し、位置を特定する。
このような構成のマーク項目認識装置10を用いたガイド文字の文字認識処理及びマーク記入位置検出処理について説明する。
マーク項目認識装置10は、帳票のイメージ画像の画像データを入力し、マーク項目位置特定手段12によってマーク項目領域の位置を特定する。次に、ガイド図形除去手段13は、マーク項目領域の画像データを読み出し、ガイド図形を探索する。ガイド図形の条件に合致する形状を探索し、検出した形状をガイド図形と判定して、画像データのガイド図形に対応する画素の色を帳票背景色に置き換え、ガイド図形を除去する。検出できないときは、ガイド図形の除去は行わない。以降の処理では、ガイド図形除去手段13によってガイド図形が除去された画像データを対象として処理を行う。
認識制御手段14は、文字認識手段15にマーク項目領域の文字認識を指示する。文字認識手段15は、マーク項目領域内のガイド文字の画素を縦及び横に投影してヒストグラムを求めてガイド文字範囲の位置を探索する。そして、探索したガイド文字範囲の位置ごとに、文字認識辞書記憶手段11aが記憶する文字認識辞書を用いて文字認識を実行する。文字認識結果は、認識制御手段14に通知する。認識制御手段14は、認識結果と、ガイド文字テーブル記憶手段11bのガイド文字テーブルから一致するガイド文字定義を検索し、一致率を算出する。所定の閾値以上一致する場合は、文字認識が正しく実行できたと判定する。認識ができなかった認識不可のガイド文字と、正しく認識できたガイド文字が存在するときは、マーク図形がガイド文字に重なっている可能性が高い。そこで、マーク図形除去手段16にマーク図形の検出と除去を指示する。マーク図形除去手段16は、文字認識手段15が検出した認識不可のガイド文字を含むガイド文字範囲を周辺のガイド文字まで拡張した領域を探索範囲として、各ガイド文字範囲に存在するマーク図形を探索する。検出されたときは、マーク項目領域の画像データからマーク図形を除去する。マーク図形の位置及びマーク図形を除去した画像データは、認識制御手段14に出力する。認識制御手段14は、マーク図形を除去したマーク項目領域の画像データに対し、文字認識を行うように文字認識手段15に指示する。文字認識手段15は、マーク図形が除去された画像データに基づいて2回目の文字認識を行い、結果を認識制御手段14に通知する。認識制御手段14は、ガイド文字テーブルと比較して一致率を算出し、所定の閾値を超える一致率のとき、正しく読めたと判定する。そして、1回目及び2回目の文字認識結果と、マーク図形の位置とをマーク項目認識結果として出力する。マーク図形の位置は、マーク図形がどのガイド文字範囲に記入されているかを示す情報であり、選択されたガイド文字がわかればよく、正確な座標は必要ない。
さらに、認識制御手段14は、マーク図形が検出できない場合等、必要に応じて、マーク記入位置判定手段17にマーク記入位置の検出を指示する。マーク記入位置判定手段17は、認識文字の字形を字形辞書記憶手段11cの字形辞書から抽出し、その字形をマーク項目領域の画像データのガイド文字と重ね合わせて一致する箇所を除去し、画像データからガイド文字を除去する。そして残ったマーク図形の位置を特定し、認識制御手段14に通知する。認識制御手段14は、特定されたマーク図形の位置と、文字認識結果とをマーク項目認識結果として出力する。
このように、マーク項目領域内のマーク図形を除去してガイド文字の文字認識を行うことにより、ガイド文字とマーク図形とが同じ色で、かつ、ガイド文字とマーク図形とが重なった場合でもガイド文字の文字認識の精度を上げることができる。また、画像データからガイド文字を除去し、マーク図形の位置を特定することにより、どのような形状の図形がガイド文字上に記入されたかをより高精度に判定することができる。以上のように、ガイド文字とマーク図形を分離してそれぞれ認識処理を行うことにより、それぞれを高い精度で認識することが可能となり、また未記入帳票を予め用意する必要もなくなり、利便性が向上する。
以下、第2の実施の形態として、マーク項目認識処理を金融機関等で使用する帳票に適用した場合を例に、図面を参照して詳細に説明する。まず、読み取り対象の帳票の例を説明する。図2は、読み取り対象の帳票の一例を示した図である。(1)はガイド図形がない場合、(2)はガイド図形がある場合の例を示した図である。ガイド図形は、記入を促す補助情報となる図形で、図2では、ガイド文字「普通預金」と「当座預金」、それぞれを囲む点線で構成される楕円形状を有する。マーク図形も同様に、選択するガイド文字を囲む閉じた図形であるとする。また、図2では、ガイド文字及びガイド図形は、記入文字と同じ黒色であるとする。
(1)ガイド図形がない場合の一例として、6つのパターンを示している。(1−a)は、ガイド文字を囲むようにマーク図形が記入されている例である。帳票210aには、ガイド文字の「普通預金」212a及び「当座預金」213aが予め印刷されている。ここでは、「普通預金」212aが選択され、「普通預金」212aを囲むようにマーク図形211aが記入されている。以下、ガイド文字は同じであるので、番号は省略する。(1−b)は、ガイド文字上にマーク図形が記入されている例である。帳票210bには、ガイド文字「普通預金」の文字上にマーク図形211bが記入されている。(1−c)は、選択した以外のガイド文字に影響があるマーク図形が記入されている例である。帳票210cには、選択したガイド文字「普通預金」を超えて、マーク図形211cが、他のガイド文字「当座預金」にかかっている。(1−d)は、ガイド文字の前にマーク図形を記入されている例である。帳票210dは、ガイド文字「普通預金」の前にマーク図形211dが記入されている。(1−e)は、定義されたマーク図形以外の図形が記入されている例である。帳票210eは、ガイド文字「普通預金」の上にレ点の形状のマーク図形211eが記入されている。(1−f)は、マーク図形がかすれている例である。帳票210fは、ガイド文字「普通預金」を囲むマーク図形211fがかすれている。
(2)ガイド図形がある場合の一例として、(1)と同様の6つのパターンを示している。(2−a)は、ガイド図形に沿ってガイド文字を囲むようにマーク図形が記入されている例である。帳票220aには、ガイド文字の「普通預金」及び「当座預金」とともにガイド図形224a,225aが予め印刷されている。ここでは、ガイド文字「普通預金」の周囲にガイド図形224a、ガイド文字「当座預金」の周囲にガイド図形225aが印刷されている。ここでは、「普通預金」が選択され、マーク図形221aが記入されている。(2−b)は、ガイド文字上にマーク図形が記入されている例であり、帳票220bには、ガイド文字「普通預金」の文字上にマーク図形221bが記入されている。(2−c)は、選択した以外のガイド文字に影響があるマーク図形が記入されている例であり、帳票220cには、選択したガイド文字「普通預金」を超えて、マーク図形221cが、他のガイド文字「当座預金」にかかっている。(2−d)は、ガイド文字の前にマーク図形を記入されている例であり、帳票220dは、ガイド文字「普通預金」の前にマーク図形221dが記入されている。(2−e)は、定義されたマーク図形以外の図形が記入されている例である。帳票220eは、ガイド文字「普通預金」の上にレ点の形状のマーク図形221eが記入されている。(2−f)は、マーク図形がかすれている例であり、帳票220fは、ガイド文字「普通預金」を囲むマーク図形221fがかすれている。なお、図2のマーク図形の記入例は一例であり、実際にはさらに多くのパターンが存在する。
ここで、マーク項目認識装置のハードウェア構成について説明する。図3は、マーク項目認識装置のハードウェア構成例を示すブロック図である。
マーク項目認識装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、及び画像入力部106が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラムが格納される。グラフィック処理装置104には、モニタ108が接続されており、CPU101からの命令に従って画像をモニタ108の画面に表示させる。入力インタフェース105には、キーボード109aやマウス109bが接続されており、キーボード109aやマウス109bから送られてくる信号を、バス107を介してCPU101に送信する。画像入力部106は、スキャナ300に接続されており、スキャナ300が読み取った対象帳票の画像データを入力する。
このようなハードウェア構成によって、マーク項目認識装置の処理機能を実現することができる。
次に、マーク項目認識装置100のソフトウェア構成について説明する。図4は、マーク項目認識装置のソフトウェア構成例を示すブロック図である。
マーク項目認識装置100は、スキャナ制御部110、入力イメージ格納メモリ120、マーク項目位置特定部130、マーク項目認識処理部140及び文字認識結果格納メモリ150を有する。各処理部は、コンピュータがマーク項目認識処理プログラムを実行することにより、その処理機能を実現する。
スキャナ制御部110は、スキャナ300を制御し、対象帳票のイメージ画像の読み取りを実行させる。そして、スキャナ300が読み取った対象帳票イメージの画像データを入力し、入力イメージ格納メモリ120に格納する。
入力イメージ格納メモリ120は、スキャナ制御部110を介して入力した対象帳票の画像データを記憶する。他の各処理から読み書き可能なメモリで、途中で画像処理を施した画像データを格納するとしてもよい。
マーク項目位置特定部130は、入力イメージ格納メモリ120から対象帳票の画像データを読み出し、マーク項目領域の位置を特定する。
マーク項目認識処理部140は、認識制御部141、マーク色判定処理部142、一次文字認識処理部143、マーク付き文字認識処理部144、マーク記入位置判定部145、文字認識辞書データベース(以下、DBとする)146、字形辞書DB147及びガイド文字テーブルDB148を有する。認識制御部141は、マーク色判定処理部142、一次文字認識処理部143、マーク付き文字認識処理部144及びマーク記入位置判定部145を制御し、マーク項目の認識処理を行う。ガイド文字の文字認識を行い、マーク図形の位置を特定することにより、マーク図形によって選択されている選択項目の内容を認識する。マーク色判定処理部142は、マーク項目領域内のガイド文字やマーク図形の色を抽出する。色が異なるときは、色の違いに応じてガイド文字とマーク図形とを分離することができる。一次文字認識処理部143は、マーク項目領域内のガイド文字の位置を特定して文字を抽出し、文字認識辞書DB146を用いて文字認識を行う。マーク付き文字認識処理部144は、マーク項目領域内のマーク図形の位置を特定し、マーク図形を画像データから除去した後、文字認識を行う。マーク記入位置判定部145は、マーク項目領域の画像データからガイド文字を除去し、マーク図形を検索して、その記入位置を判定する。文字認識辞書DB146は、文字を認識するための文字画像の特徴と、文字コードとが対応付けられている。字形辞書DB147は、文字の字形(文字の画像データ)が、文字コードに対応付けられている。ガイド文字テーブルDB148は、ガイド文字として存在し得る文言のコードデータを事前に定義したガイド文字テーブルを記憶する。なお、一致率の閾値で認識文字と比較するため、ガイド文字テーブルには認識対象帳票上のガイド文字が漏れなく定義されている必要はない。
文字認識結果格納メモリ150は、マーク項目認識処理部140が求めたガイド文字の文字認識結果と、マーク図形の位置とを記憶する。
上記の構成のマーク項目認識装置100の動作及びマーク項目認識方法について説明する。以下では、マーク項目認識処理手順を、[1]準備処理、[2]一次文字認識処理、[3]マーク付き文字認識処理、[4]マーク記入位置判定処理、に分けて説明する。
[1]準備処理
準備処理では、マーク項目認識装置100が画像データを入力し、対象のマーク項目領域を特定するまでの処理手順を行う。
マーク項目認識装置100では、スキャナ制御部110がスキャナ300を制御し、対象帳のイメージ画像の画像データを取得し、画像データを入力イメージ格納メモリ120に格納する。マーク項目位置特定部130は、入力イメージ格納メモリ120に格納される対象帳票の画像データを解析し、選択項目を表すガイド文字と、選択項目の選択を記入したマーク図形とが含まれるマーク項目領域の位置を特定する。
図5は、対象帳票及び対象帳票マーク項目位置の一例を示した図である。(a)は、対象帳票の一例、(b)は、対象帳票マーク項目位置の一例を示している。
(a)対象帳票は、認識対象の帳票の一部を示している。帳票200には、見出し部201と、対応するデータ部202とが、それぞれ文字枠によって囲まれている。見出し部201には、予め見出し文言の「科目」が印刷されている。データ部202には、「科目」に対応するデータとして、予めガイド文字「普通預金」及び「当座預金」が上下に並んで印刷されている。「普通預金」及び「当座預金」は、「科目」の選択項目に相当する。
(b)対象帳票マーク項目位置は、マーク項目位置特定部130が検出したマーク項目領域の座標値を示している。マーク項目位置特定部130は、解析範囲を大まかに背景、文字枠、及び文字に分類し、その分類結果に基づいて文字枠を特定する。例えば、本願出願人による特願2008−089118号に記載の文字枠検出方法を用いる。ここでは、見出し部201の文字枠の位置座標として、左上隅(DXs1,DYs1)と、右下隅(MXs1,MYs1)とを検出する。また、データ部202の文字枠の位置座標として、左上隅(DXs2,DYs2)と、右下隅(MXs2,MYs2)とを検出する。マーク項目認識処理部140の処理では、データ部202の位置座標に基づいてマーク項目領域を決める。なお、マーク項目位置特定部130によるのではなく、事前にデータ部202の位置座標(DXs1,DYs1)、(MXs1,MYs1)を定義しておくとしてもよい。
以上の処理手順により、入力イメージ格納メモリ120に対象帳票の画像データが格納され、認識対象のマーク項目領域の位置が特定される。
[2]一次文字認識処理
一次文字認識処理では、一次文字認識処理部143が、マーク項目領域のガイド文字の文字認識処理を行う。
認識制御部141は、マーク色判定処理部142によってガイド文字、ガイド図形及びマーク図形の色を判定する。ここでは、すべて同種の色であるという判定がされたとする。
認識制御部141は、続いて一次文字認識処理部143による文字認識処理を指示する。一次文字認識処理部143は、マーク項目位置特定部130が特定したデータ部202の位置座標に基づいて、マーク項目領域の画像データを入力イメージ格納メモリ120から抽出する。そして、ガイド図形の検出と除去を行う。
図6は、ガイド図形の検出と除去処理の一例を示した図である。(a)は入力画像を示している。(b)はガイド図形除去後の画像を示している。
(a)対象帳票に示した画像230は、一次文字認識処理部143が、入力イメージ格納メモリ120から読み出したマーク項目領域の画像データに基づく画像である。ガイド文字「普通預金」に対するガイド図形234aと、ガイド文字「当座預金」に対するガイド図形234bが存在する。また、利用者が記入したマーク図形231も画像230に含まれている。ここで、一次文字認識処理部143は、ガイド図形の定義に基づき、画像230の画像データを調べ、画像230内のガイド図形を探索する。ガイド図形の色の画素を矢印のようにトレースし、ガイド図形の定義に適合する形状を探索する。ここでは、ガイド図形の定義を「同じ長さの点が円状に配置されている」とし、このような形状が検出されるかどうかを探索する。探索の結果、ガイド図形234a,234bを検出する。検出したガイド図形234a,234bを画像230の画像データから除去し、画像230aの状態にする。例えば、画像230のガイド図形234a,234bに相当する画像データの画素を背景色に置き換えて除去する。こうして、ガイド図形234a,234bが除去され、マーク図形231が残った画像230aに対応する画像データを生成する。
続いて、画像230aの画像データを用いて文字認識処理を行う。文字認識処理では、最初に、ガイド文字範囲を特定する。図7は、ガイド文字範囲の特定処理の一例を示した図である。(a)はガイド図形が除去された画像、(b)は縦方向のヒストグラム、(c)は横方向のヒストグラム、(d)はガイド文字範囲、を示している。
一次文字認識処理部143は、ガイド図形234a,234bが除去された画像230aの画像データを用いて、画像230aの縦方向に画素を投影し、ヒストグラム230bを作成する。同様に、画像230aの画像データを用いて、横方向に画素を投影し、ヒストグラム230cを作成する。作成したヒストグラムは文字範囲に画素がカウントされ、文字の中心付近が最大値となる。値が所定の閾値を超える範囲を検出し、縦方向に画素を投影したヒストグラム230bから文字列高さ235を検出する。同様に、横方向に画素を投影したヒストグラム230cから文字列幅236を検出する。検出した文字列の高さと、文字列幅236とを組み合わせ、ガイド文字範囲の位置を特定する。図7の例では、ガイド文字範囲230dに示したように、第1のガイド文字範囲237と、第2のガイド文字範囲238の位置を特定する。
一次文字認識処理部143は、こうして特定した第1のガイド文字範囲237と第2のガイド文字範囲238を、ガイド図形を除去した画像230aに適用し、ガイド文字の文字認識を行う。図8は、文字認識処理の一例を示した図である。
一次文字認識処理部143は、特定したガイド文字範囲の位置に基づいて、ガイド図形を除去した画像230aから、第1のガイド文字範囲237の画像241aと、第2のガイド文字範囲238の画像241bと、を切り出す。そして、第1のガイド文字範囲237の画像241aについて、文字を抽出し、文字認識辞書DB146を用いて文字認識処理を行う。画像241aには、マーク図形231が含まれていることから、マーク図形231が掛かる「普」、「通」、「預」、の文字認識はできず、「金」のみを文字認識する。これにより、文字認識結果「?金」242aが得られる。なお、「?」は、識別不能の文字を表すリジェクト文字である。第2のガイド文字範囲238の画像241bについても同様にして文字認識を行う。画像241bには、マーク図形231が含まれていないことから、「当座預金」すべてを文字認識する。これにより、文字認識結果「当座預金」242bが得られる。文字認識結果は、認識制御部141へ送る。
認識制御部141は、受け取った文字認識結果、「?金」242aと、「当座預金」242bとを、ガイド文字テーブルDB148に記憶されているガイド文字テーブルのガイド文字定義と照合し、チェックを行う。図9は、ガイド文字テーブルと文字認識結果チェック処理の一例を示した図である。
ガイド文字テーブル1480には、分類「科目」のガイド文字として、ガイド1(1481)と、ガイド2(1482)が登録されている。ガイド1(1481)は、種別が「普通」で、ガイド文字として“普通”、“普通預金”、“普”が定義されている。ガイド1(1482)は、種別が「当座」で、ガイド文字として“当座”、“当座預金”、“当”が定義されている。
認識制御部141は、文字認識結果「?金」242a及び「当座預金」242bと、ガイド1(1481)及びガイド2(1482)とを照合して一致率を算出し、文字認識結果のチェックを行う。ここで、「当座預金」242bは、ガイド2(1482)の“当座預金”と一致する。一致率を、例えば、ガイド文字テーブル1480の定義文字列のうち、どの程度一致するかの割合とすると、“当座預金”の4文字すべてが一致するので、一致率は100パーセント(以下、%と表記する)となる。また、ガイド1(1481)とは、一致する文字が“普通預金”の“預金”のみであり、“当座預金”と一意に特定できるので、正しく認識できたと判定する。「?金」242aについては、ガイド1(1481)の“普通預金”の“金”と、ガイド2(1482)の“当座預金”の“金”とが一致する。4文字のうち1文字が一致するが、ガイド1(1481)またはガイド2(1482)のどちらに対応するのかを一意に特定できないため、認識できなかったと判定する。
なお、1文字しか文字認識できなかった場合であっても、「普?」と認識できれば、ガイド1(1481)の“普”と一致し、かつ、ガイド1(1481)に対応すると一意に特定できるので、正しく認識できたと判定できる。また、正しく文字認識できたと判定する閾値を50%であるとし、「普?金」と文字認識できたとする。この場合、ガイド1(1481)の“普通預金”との一致率は50%であり、かつ、ガイド1(1481)に対応すると一意に特定できるので、正しく認識できたと判定できる。このように、一致率で判定を行うことにより、ガイド文字の判定パターンをすべて定義しておかなくても判定を行うことができる。なお、上記の一致率は一例であり、一致率は、一致した文字の位置や、一致しなかった文字の個数などを加味し、適宜計算式が決められる。
以上の処理手順が実行されることにより、一次文字認識処理が行われ、ガイド文字の認識結果が得られる。しかし、この例では、これまでの処理でガイド文字「当座預金」は文字認識されたが、ガイド文字「普通預金」の文字認識と、マーク図形の位置の特定はできていない。続けて、マーク付き文字認識処理を行う。
[3]マーク付き文字認識処理
マーク付き文字認識処理では、マーク付き文字認識処理部144が、マーク項目領域のマーク図形の位置を特定し、マーク項目領域の画像からマーク図形を除去してガイド文字の文字認識処理を行う。
認識制御部141は、マーク付き文字認識処理部144による文字認識処理を指示する。マーク付き文字認識処理部144は、ガイド図形を除去したマーク項目領域の画像230aの画像データを読み出し、マーク図形の探索を行う。図10は、マーク図形の探索処理の一例を示した図である。(a)は対象領域の切り出し、(b)はマーク図形の探索、(c)はマーク図形の除去を示している。
マーク付き文字認識処理部144は、一次文字認識処理部143の文字認識処理において文字認識ができなかった第1のガイド文字範囲237を対象として処理を行う。まず、(a)に示したように、第1のガイド文字範囲237の範囲を隣接するガイド文字まで拡張し、図形探索範囲250を切り出す。図10の例では、隣接するガイド文字「当座預金」の領域に到達するまで図形探索範囲250を拡張している。画像230aから図形探索範囲250の画像を切り出す。続いて、(b)に示したように、図形探索範囲250からマーク図形定義に適合する形状を探索する。ここでは、マーク図形定義を「円状の閉じた図形」とし、条件に適合する図形を探索する。例えば、画像データを用いて連続する画素を辿り、閉じているかどうかを判定する。こうして、マーク図形231を検出し、位置を特定する。次に、(c)に示したように、特定したマーク図形231を除去した画像250aの画像データを生成する。マーク図形231に対応する画素の色を背景色に置き換え、マーク図形231を除去する。
マーク付き文字認識処理部144は、マーク図形231を除去した画像250aの画像データを用いて、第1のガイド文字範囲237の文字認識を行う。一次文字認識処理部143と同様に、第1のガイド文字範囲237から文字画像を抽出し、文字認識を行うとすることもできるが、ここでは、1文字ずつ切り出して文字認識を行う。図11は、マーク付き文字認識処理部の文字認識処理の一例を示した図である。(a)は1文字サイズの抽出、(b)は文字単位の分割、(c)は文字認識、の処理を示している。
(a)に示したように、マーク付き文字認識処理部144は、一次文字認識処理部143において正しく文字認識が実行できたガイド文字「当座預金」を対象として1文字サイズを抽出する。なお、これは、通常、第1のガイド文字範囲237のガイド文字のサイズと、第2のガイド文字範囲238のガイド文字のサイズは同じであるという前提に基づいている。「当座預金」について、縦方向に画素を投影したヒストグラム230eを作成し、文字列の高さを求める。また、「当座預金」について、横方向に画素を投影したヒストグラム230fを作成し、1文字の文字幅を求める。文字列の高さ及び文字幅の求め方は、図7に示した一次文字認識処理部143の場合と同様である。こうして、文字列の高さと文字幅とを組み合わせ、1文字のサイズ251を特定する。ここでは、再度ヒストグラムを作成するとしているが、一次文字認識処理部143によって作成したヒストグラムを利用するとしてもよい。また、一次文字認識処理部143で、ガイド文字範囲を求めるときに、1文字の文字幅も求めておくとしてもよい。こうして1文字のサイズが決定したら、(b)に示したように、マーク図形を除去した画像データ250aの第1のガイド文字範囲237に相当する領域を、1文字サイズ251aで、1文字ごとに分割する。そして、(c)に示したように、1文字ごとに文字認識を行い、文字認識結果「普」、「通」、「預」、「金」を得る。マーク図形部分を除去したことにより、認識対象の文字は一部欠損しているので、ノイズがある状態での文字に対応した文字認識処理を用いることにより、文字認識を行うとしてもよい。文字認識結果は、認識制御部141に送る。
認識制御部141は、受け取った文字認識結果、「普通預金」をガイド文字テーブル1480のガイド文字定義と照合し、チェックを行う。「普通預金」は、図9に示したガイド文字テーブル1480のガイド1(1481)の“普通預金”と一致し、かつ、“普通預金”と一意に特定できるので、正しく認識できたと判定する。こうして、認識制御部141は、一次文字認識処理部143及びマーク付き文字認識処理部144による処理で得た文字認識結果と、マーク図形の位置とを、認識結果として文字認識結果格納メモリ150に登録する。
図12は、認識結果情報の一例を示した図である。
認識結果情報151には、「ガイド文字列数」、「ガイド文字列1」、「ガイド文字列2」及び「選択ガイド文字」の各項目のデータを登録する。「ガイド文字列数」は、ガイド文字列の列数である。ここでは、図7に示したガイド文字列領域の検出処理で2列の文字列が検出されたので、「2」を登録する。そして、それぞれのガイド文字列について文字認識した結果を登録する。「ガイド文字列1」には、マーク付き文字認識処理部144が文字認識を行った第1のガイド文字範囲237の文字認識結果「普通預金」を登録する。「ガイド文字列2」には、一次文字認識処理部143が文字認識を行った第2のガイド文字範囲238の文字認識結果「当座預金」を登録する。「選択ガイド文字」は、マーク付き文字認識処理部144が検出したマーク図形の位置に基づいて、「普通預金」を登録する。
こうして、一次文字認識処理と、マーク付き文字認識処理が行われることにより、図2に示した(1−a)、(1−b)、(2−a)及び(2―b)のように、マーク図形が選択したガイド文字に掛っているときでも、正しい文字認識結果を得ることができる。しかし、(1−c)〜(1−f)及び(2−c)〜(2−f)のようなマーク図形の場合、検出は容易ではない。そこで、上記の処理でマーク図形が検出できないときは、続けてマーク記入位置判定処理を行う。
[4]マーク記入位置判定処理
マーク記入位置判定処理では、マーク記入位置判定部145が、マーク項目領域の画像データからガイド文字を除去してマーク図形が記入された位置を判定する処理を行う。
認識制御部141は、マーク記入位置判定部145によるマーク記入位置の判定処理を指示する。なお、マーク記入位置判定部145が処理を開始する前には、一次文字認識処理部143によるガイド図形の除去と、文字認識処理とは終了しているとする。
図13は、マーク記入位置判定処理における字形抽出までの処理の一例を示した図である。(a)は文字認識処理、(b)は文字認識結果コード取り出し処理、(c)は字形抽出処理をそれぞれ示している。
(a)に示したように文字認識処理では、ガイド文字「普通預金」と、ガイド文字に重ならないマーク図形261とを含む画像260の画像データに対し、文字認識を行う。ここでは、「普通預金」が認識されたとする。認識した文字は、それぞれの文字コードに対応付ける。マーク記入位置判定部145は、認識された文字それぞれの文字コードに基づいて字形辞書DB147を検索し、対応する字形画像データを抽出する。字形辞書DB147には、それぞれの文字コードに対応付けて文字の字形画像が記憶されている。A001〜A004、B001〜B002は、それぞれの文字の文字コードである。ここで、文字認識の結果、文字「普」262は、文字コードA001であることが検出されたとする。マーク記入位置判定部145は、文字コードA001で字形辞書DB147を検索し、文字コードA001の字形画像263を得る。他の「通」、「預」、「金」、「当」、「座」、「預」、「金」についても同様にして字形画像を得る。マーク記入位置判定部145は、次に、取得した字形画像263を用いて画像260の画像データからガイド文字を除去する。まず、ガイド文字を除去するための字形画像を生成する。図14は、ガイド文字除去のための字形画像の生成処理を示した図である。(a)は字形画像サイズ計測、(b)は拡縮後の字形画像を示している。
マーク記入位置判定部145は、(a)字形画像サイズ計測に示したように、画像260の画像データから文字認識を行った認識文字を抽出し、縦横の大きさを計測する。例えば、「普」262を抽出し、高さH1、幅W1を計測する。また、取得した字形画像263についても縦横の大きさを計測する。「普」の字形画像263の高さH2、幅W2を計測する。そして、画像260の認識文字と、字形画像の文字サイズの比率を算出する。
高さ比: Hr= H1/H2
幅比: Wr= W1/W2 ・・・(1)
によって、縦横それぞれの比率を算出する。そして、字形画像263を高さHr倍、幅Wr倍に拡縮し、拡縮後の字形画像263aを得る。
(b)拡縮後の字形画像に示したように、同様の処理を他の文字に対しても実行し、画像260の認識文字と同じサイズに拡縮した字形画像「通」263b、「預」263c、「金」263d、「当」263e、「座」263f、「預」263g、「金」263hを得る。こうして得た字形画像に基づいて、画像260のガイド文字を除去する。図15は、ガイド文字除去処理の一例を示した図である。(a)はガイド文字除去前の画像、(b)はガイド文字除去を行った画像、(c)はノイズを除去した画像を示している。
マーク記入位置判定部145は、図14に示したガイド文字の大きさに合わせて拡縮した字形画像263a〜263hを、(a)に示した画像260の対応する認識文字と重ね合わせる。そして、一致する画素を背景色に置換し、(b)に示した画像260aを得る。さらに、画像260aに残る不一致文字片部分をノイズとして除去し、(c)に示したノイズを除去した画像260bを生成する。これにより、マーク項目領域の画像260bのガイド文字は除去され、マーク図形261だけが残る。次に、マーク記入位置判定部145は、画像260bに残ったマーク図形を解析し、マーク図形位置を特定する処理を行う。図16は、マーク図形の位置特定処理の一例を示した図である。(a)はマーク図形が閉じた図形、(b)はマーク図形がかすれている場合、(c)はマーク図形がレ点の場合、をそれぞれ示している。
(a)に示したように、画像260bについて、画像上に残った画素を矢印のようにトレースし、残った画像がマーク図形の条件に適合した形状であるかどうかを判定する。マーク図形261の場合は、形状が円状の閉じた図形であることが検出されるので、マーク図形の条件に適合すると判定し、位置を特定する。ここでの位置は、正確な座標を求める必要はなく、どのガイド文字に対応する位置であるかが特定できればよい。この場合には、第1のガイド文字範囲と重なるので、認識結果情報151の「選択ガイド文字」は、第1のガイド文字「普通預金」であると判定し、認識結果情報151に登録する。(b)はマーク図形264が途中でかすれている場合を示している。画像260cの画像データについて、画像データ上に残った画素を矢印のようにトレースし、残った画像がマーク図形の条件に適合した形状であるかどうかを判定する。トレースすることで、途中がかすれていた場合であっても、マーク図形の条件に適合するかどうかを判定することができる。例えば、途切れた区間の前後の形状を比較し、接続関係があるかどうかを判定する。接続関係があると認められたときは、マーク図形の一部であると判断する。マーク図形264の場合は、形状が円状の閉じた図形であることが検出されるので、マーク図形の条件に適合すると判定し、位置を特定する。以降の処理は、(a)の場合と同様である。(c)はマーク図形265が閉じた円状でない場合を示している。この場合、上記と同様に、マーク図形は閉じた円状の形状であるという定義では、マーク図形265を検出することはできない。そこで、円状のトレースができなかったときは、次の候補としてレ点や×印等を検出する処理を行う。検出方法は、上記と同様で、例えばレ点であれば、画素を矢印のようにトレースし、レ点の形状を有しているかどうかを判定する。レ点の形状を有していれば、マーク図形と判定し、位置を特定する。以降の処理は、(a)の場合と同様である。
こうして、一次文字認識処理と、マーク記入位置判定処理が行われることにより、図2に示した(1−c)、(1−d)、(1−e)、(1−f)、(2−c)、(2―d)、(2−e)、(2−f)のような場合でも、マーク図形の位置を正しく判定することができる。なお、例えば、図2の(1−e)、(2−e)は、マーク記入位置判定処理によってマーク図形の位置を判定することができる。しかし、「普通預金」はマーク図形211e,221eによって文字認識することができない。この場合、マーク付き文字認識処理部144と同様にして、検出したマーク図形を画像から除去し、文字認識を行うことにより、ガイド文字の文字認識結果が得られる。マーク付き文字認識処理部144において、第1のマーク図形定義(ここでは円状の閉じた図形)に適合するマーク図形が見つからない場合、第2のマーク図形定義(ここではレ点)に適合する形状を探索し、これを除去するとしてもよい。
さらに、マーク項目認識装置100では、ガイド文字テーブルDB148に記憶されているガイド文字テーブル1480を用いて、文字認識の精度を上げることができる。文字認識の精度を上げる処理について説明する。図17は、ガイド文字テーブルを用いた文字認識結果の補正処理の一例を示した図である。
一次文字認識処理部143では、ガイド文字範囲を切り出して文字認識を行う。画像データ270は、ガイド文字「普通預金」と「当座預金」が一列に並んでおり、マーク図形271は、「当座預金」にまで掛かっている。この状態で、ガイド文字範囲の切り出しを行うと、マーク図形271を含む第1のガイド文字範囲272aと、残りの第2のガイド文字範囲272bと、が切り出される。第1のガイド文字範囲272aについて文字認識を行い、「?通預金 当座」273aという文字認識結果を得る。同様に、第2のガイド文字範囲272bについて文字認識を行い「預金」273bという文字認識結果を得る。認識制御部141は、文字認識結果273a,273bを、ガイド文字テーブル1480のガイド文字定義と照合し、文字認識結果のチェックを行う。認識制御部141は、文字認識結果「?通預金 当座」273aは、図9に示したガイド文字テーブル1480のガイド1(1481)に登録されている“普通預金”との一致率が高いので、「普通預金」であると判定する。そこで、「?」を「普」に補正し、「普通預金」274aという文字認識結果を得る。また、「当座」については別項目であると判定する。ここでは、同じ列上の次の項目と同一項目である可能性が高いので、文字認識結果「預金」273bと合わせ、「当座預金」としてガイド文字テーブル1480と照合する。ガイド2(1482)の“当座預金”と一致するので、もう一方のガイド文字は、「当座預金」274bであると判定する。このように、ガイド文字テーブル1480を用いてガイド文字の文字認識結果を補正することにより、文字認識の精度を向上させることができる。
マーク項目認識装置100では、図2に示した帳票イメージばかりでなく、様々な種類の帳票のマーク項目認識処理を高い精度で行うことができる。図18は、その他の帳票イメージの例を示した図である。(a)はガイド図形が長めの点線の形状の例、(b)はガイド図形がガイド文字の一部だけを囲む形状の例、(c)はガイド文字の高さが異なる形状の例、(d)は同一欄にマーク項目と別の項目が同居する形状の例、(e)はガイド文字テーブル内にはないガイド文字の例である。
(a)の帳票イメージ280aは、ガイド図形282aの点線が長く、マーク図形281aと区別がつきにくい場合の例である。一次文字認識処理部143では、ガイド図形の除去時に、ガイド図形の条件「同じ長さの点が円状に配置されている」に適合する形状を、画素をトレースして検出するので、ガイド図形を特定し、除去することができる。ガイド図形同士が近接していても同様にして、ガイド図形を抽出することができる。
(b)の帳票イメージ280bは、ガイド図形282bがガイド文字の一部だけを囲む場合の例である。一次文字認識処理部143では、ガイド図形の除去時に、ガイド図形の条件「同じ長さの点が円状に配置されている」に適合する形状を、マーク項目領域の全領域に渡って探索するので、ガイド図形を特定し、除去することができる。
(c)の帳票イメージ280cは、ガイド文字の高さが異なる形状の例である。一次文字認識処理部143では、画素を投影したヒストグラムからガイド文字範囲を検出し、文字認識を行うので、高さが異なるガイド文字「年金が主な収入源の方」については、文字認識ができない可能性がある。しかし、マーク付き文字認識処理部144において、文字認識ができなかった領域についてヒストグラムを作成し、ガイド文字範囲を再度設定すれば、文字認識を行うことができる。
(d)の帳票イメージ280dは、同一欄にマーク項目と、別の項目とが同居する形状の例である。ガイド文字「普通預金」と「当座預金」に加え、番号が同一欄にある。認識制御部141は、文字認識結果を、ガイド文字テーブル1480のガイド文字定義と照合し、文字認識結果がガイド文字であるかどうかの判定を行うので、ここでは、「普通預金」と「当座預金」のみがガイド文字であると判定できる。
(e)は、ガイド文字テーブル内にはない類似のガイド文字の例である。認識制御部141は、文字認識結果を、ガイド文字テーブル1480のガイド文字定義と照合する際に、一致率を用いて判定を行う。例えば、「普通預(貯)金」であれば、ガイド文字テーブル1480に定義されている“普通預金”との一致率が高いので、ガイド文字であると判定することができる。また、「普通預(貯)金」が予め決めた閾値よりも高い頻度で出現する場合には、ガイド文字として、ガイド文字テーブル1480に登録するとしてもよい。
このように、マーク項目認識装置100によれば、対象帳票に事前に印刷された選択項目を表すガイド文字と、選択記入されたマーク図形とを分離して認識処理を行うため、認識の精度を上げることができる。従来技術では、文字認識の精度に応じて一定の割合で発生する誤認識等の認識失敗の影響を受けるマーク項目の誤った認識を低減することができる。また、ガイド文字テーブル1480と文字認識結果の比較は、一致率を閾値と比較する構成としたことにより、ガイド文字テーブル1480には認識対象のすべての帳票で使用されるガイド文字を事前登録しておく必要がない。このため、想定外のガイド文字列に対しても、マーク項目ごとの再分割等の補正を行うことができる。さらに、事前に対象帳票のレイアウト形式を定義したレイアウト定義体を使用しないで認識処理を行うことができるため、利用者の負担を軽減することができる。特に、同一種類だがレイアウトや文字表現が若干異なる複数の帳票が認識対象である場合、従来であればすべての帳票のレイアウト定義体が必要であったが、マーク項目認識装置100では、このようなレイアウト定義体が必要ない。
次に、マーク項目認識処理の処理手順を、フローチャートを用いて説明する。図19は、マーク項目認識処理全体の処理手順の一例を示した図である。
[ステップS01] スキャナ制御部110は、スキャナ300を制御して、認識対象の帳票のイメージを読み取る。読み取った帳票イメージの画像データは、入力イメージ格納メモリ120に格納する。
[ステップS02] マーク項目位置特定部130は、入力イメージ格納メモリ120に格納される帳票イメージの画像データを読み込み、マーク認識を行うマーク項目領域の位置を特定する。このとき、画像データを解析して文字枠を検出し、検出した文字枠に基づいてマーク項目領域の位置を特定することにより、定義情報を用いずに位置を特定することができる。なお、事前に作成した定義情報を使用して位置を特定するとしてもよい。
[ステップS03] 認識制御部141は、ステップS02で位置を特定したマーク項目領域の文字認識処理を一次文字認識処理部143に指示し、一次文字認識処理を実行する。一次文字認識処理の詳細は、後述する。
[ステップS04] ステップS03の一次文字認識処理により、ガイド図形を除去した画像データと、1回目の文字認識結果が得られる。認識制御部141は、取得した文字認識結果を、ガイド文字テーブル1480のガイド文字定義と照合し、文字認識結果が正しいかどうかを判定する。判定は一致率で行う。文字認識結果と、ガイド文字テーブル1480のガイド文字定義との一致率を算出し、一致率が所定の閾値を超えていれば、正しく認識できたと判定する。そして、文字認識結果が正しいと判定したときは、処理をステップS05に進める。ここでは、少なくとも1つのガイド文字範囲のガイド文字が正しく認識できれば、認識可と判定する。正しい文字認識結果が得られなかったときは、処理をステップS09に進める。
[ステップS05] 認識制御部141は、正しい文字認識結果が得られたときは、認識不可のガイド文字があったかどうかを判定する。認識不可が検出されたときは、処理をステップS06に進める。認識不可がないときは、分岐点Aに処理を進める。分岐点Aは、リトライ処理であるが、ここまでの処理で選択されたガイド文字は特定されていないので、文字認識がすべて正常に終了したときは、リトライ処理でマーク図形の位置を判定し、選択されたガイド文字を特定する。
[ステップS06] 認識不可のガイド文字があったとき、認識制御部141は、マーク付き文字認識処理部144に指示し、マーク付き文字認識処理を実行する。
[ステップS07] ステップS06のマーク付き文字認識処理により、ガイド文字とマーク図形が重なっていた箇所の文字認識結果と、マーク図形の位置と、が得られる。認識制御部141は、取得した文字認識結果を、ガイド文字テーブルDB148に記憶されるガイド文字テーブル1480のガイド文字定義と照合し、文字認識結果が正しいかどうかを一致率で判定する。文字認識結果と、ガイド文字テーブル1480のガイド文字定義との一致率を算出し、一致率が所定の閾値を超えていれば、正しく認識できたと判定する。認識可と判定したときは、処理をステップS08に進める。認識不可と判定したときは、処理を分岐点Aに進め、リトライ処理を行う。
[ステップS08] 認識制御部141は、ステップS06のマーク付き文字認識処理により得られた文字認識結果と、マーク図形の位置とから、どのガイド文字が選択されているかを判定する。そして、ガイド文字の文字認識結果と、マーク記入位置とを認識結果情報151として、文字認識結果格納メモリ150に格納する。また、利用者から要求があるときは、モニタ108に認識結果情報を表示し、利用者に結果を通知する。このように、文字認識結果を出力した後、処理を終了する。
[ステップS09] 認識制御部141は、一次文字認識処理で正しい文字認識結果が得られなかったときは、認識不可エラーを発生し、処理を終了する。
図20は、一次文字認証処理の処理手順の一例を示したフローチャートである。
[ステップS31] 一次文字認識処理部143は、ステップS02のマーク項目位置特定処理によって特定したマーク項目領域の画像データを読み出し、ガイド図形の条件に適合する形状を探索する。例えば、ガイド図形の条件を「点が円状に配置される」とし、ガイド図形の色の画素の並びをトレースし、条件に適合するかどうかを判定する。検出したときは、ガイド図形に対応する画素の色を背景色に置き換え、ガイド図形を除去する。
[ステップS32] 一次文字認識処理部143は、ステップS31によってガイド図形が除去された画像データを用いて、マーク項目領域内のガイド文字を探索する。マーク項目領域内の画素を縦方向及び横方向に投影し、ヒストグラムを作成する。そして、ヒストグラムの値が閾値を超える範囲をガイド文字範囲とし、ガイド文字の位置を特定する。
[ステップS33] 一次文字認識処理部143は、ステップS32によって特定したガイド文字の位置ごとに、文字認識辞書DB146を用いて文字認識を実行する。
以上の一次文字認識処理手順が実行されることにより、マーク項目領域のガイド文字のうち、文字認識ができたガイド文字の文字コードが文字結果として得られる。
図21は、マーク付き文字認証処理の処理手順の一例を示したフローチャートである。
文字認識結果のいずれかに認識不可、すなわち、リジェクト文字「?」が含まれる場合に呼び出され、以下の処理手順を実行する。
[ステップS61] マーク付き文字認識処理部144は、ガイド文字を選択するマーク図形を検索する。認識不能のリジェクト文字「?」が含まれるガイド文字範囲の範囲を周辺のガイド文字まで広げて図形探索範囲を設定し、マーク図形の条件に適合する形状を探索する。
[ステップS62] マーク付き文字認識処理部144は、ステップS61で検出したマーク図形の位置を特定し、図形位置として一時的に記憶する。また、マーク図形に対応する画素の色を背景色に置き換え、画像データからマーク図形を除去する。
[ステップS63] マーク付き文字認識処理部144は、一次文字認識処理によって正読と判定したガイド文字の画素を縦方向及び横方向に投影して、1文字の大きさを求める。そして、1文字の大きさをステップS62でマーク図形を除去した画像データのガイド文字範囲に適用して1文字ごとに画像を分割し、分割画像ごとに文字認識を実行する。得られた文字認識結果と、ステップS62で一時的に保存した図形位置とを、文字認識結果として出力する。
以上のマーク付き文字認識処理手順が実行されることにより、マーク図形が重なるガイド文字を文字認識し、その文字コードと、マーク図形位置とが文字認識結果として得られる。
図22は、リトライ処理の処理手順の一例を示したフローチャートである。
[ステップS111] スキャナ制御部110は、認識対象の帳票のイメージを読み取る。読み取った帳票イメージの画像データは、入力イメージ格納メモリ120に格納する。
[ステップS112] マーク項目位置特定部130は、入力イメージ格納メモリ120に格納される帳票イメージの画像データを読み込み、マーク認識を行うマーク項目領域の位置を特定する。
[ステップS113] 認識制御部141は、ステップS112で位置を特定したマーク項目領域の文字認識処理を一次文字認識処理部143に指示し、一次文字認識処理を実行する。
なお、ここまでの処理手順は、図19に示したステップS01からステップS03の処理手順と同じ処理を繰り返す。したがって、ステップS05において、すべての文字認識が正しく行えたと判定したときは、ステップS111からステップS113までの処理を省略するとしてもよい。
[ステップS114] 認識制御部141は、マーク記入位置判定部145を起動し、マーク記入位置判定処理を実行する。マーク記入位置判定部145は、帳票イメージの正読したガイド文字部分の画素を縦方向と横方向に投影してヒストグラムを作成し、1文字文のガイド文字サイズを算出する。複数のガイド文字に対してサイズを求めた場合、それらの平均値をサイズとして抽出する。
[ステップS115] マーク記入位置判定部145は、字形辞書DB147を用いて、ステップS113において正しく文字認識したガイド文字の文字コードに対応する字形画像を字形辞書から抽出する。
[ステップS116] マーク記入位置判定部145は、文字認識を行った画像データの認識文字の画像に基づき、認識文字の縦横のサイズを計測する。同様に、ステップS115で抽出した字形画像の文字の縦横のサイズも計測する。そして、画像データの認識文字と、字形画像の文字のサイズ比を算出し、字形画像の文字が認識文字と同サイズになるように、字形画像を拡大または縮小する。
[ステップS117] マーク記入位置判定部145は、ステップS116で認識文字と同サイズに変換した字形画像を、画像データの認識文字と重ね合わせ、一致する画素を帳票の背景色に置換し、除去する。認識画像の帳票端を探索して傾きがある場合は、字形画像を回転させて傾きを同じにした後で重ね合わせを行う。また、ノイズ等が残ったときは、ノイズも除去する。
[ステップS118] マーク記入位置判定部145は、ステップS117の処理でガイド文字を除去した画像上に残った図形の形状を判定し、残った図形がマーク図形の条件に適合しているかどうかを判定する。適合しているときは、残った図形がマーク図形と判定する。
[ステップS119] 認識制御部141は、ステップS113のマーク付き文字認識処理により得られた文字認識結果と、ステップS118によって検出したマーク図形の位置とから、どのガイド文字が選択されているかを判定する。そして、ガイド文字の文字認識結果と、マーク記入位置とを認識結果情報151として、文字認識結果格納メモリ150に格納する。また、利用者から要求があるときは、モニタ108に認識結果情報を表示し、利用者に結果を通知する。このように、文字認識結果を出力した後、処理を終了する。
以上の処理手順が実行されることにより、ガイド文字と重ならないマーク図形の位置を特定し、ガイド文字の文字認識及びマーク図形による選択を認識する。
以上のように、マーク項目認識装置100及びそのマーク項目認識方法によれば、マーク項目内のマーク項目数やガイド文字の位置を自動的に抽出して、ガイド文字とマーク図形を画像探索により分離して認識処理を行う。これにより、ガイド文字上に様々なパターンで記入されるマーク図形に対し、どのようなガイド文字上にどのような形状の図形が記入されたかをより高精度に判定できる。この結果、認識対象のすべての帳票に対して、マーク項目のある位置、その内部情報であるガイド文字の位置や文言を事前に定義しておく必要は、未記入帳票を確保する必要がなくなる。さらに、ガイド文字テーブルを使用して文字認識結果を補正することにより、様々な記入状態によって欠損したガイド文字の抽出が可能となり、より高精度なマーク認識が可能となる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、マーク項目認識装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
10 マーク項目認識装置
11a 文字認識辞書記憶手段
11b ガイド文字テーブル記憶手段
11c 字形辞書記憶手段
12 マーク項目位置特定手段
13 ガイド図形除去手段
14 認識制御手段
15 文字認識手段
16 マーク図形除去手段
17 マーク記入位置判定手段

Claims (8)

  1. 帳票の画像データからマーク項目を抽出して認識処理を行うマーク項目認識装置において、
    対象帳票の画像データを取得し、前記対象帳票に予め印刷された選択項目を表すガイド文字と、前記選択項目を選択するために記入されたマーク図形とが含まれるマーク項目領域の画像データを抽出し、前記マーク図形の形状を予め定義したマーク図形定義に基づいて、前記マーク項目領域の画像データに含まれる前記マーク図形定義に適合する形状を探索し、検出した前記マーク図形の位置を特定するとともに、前記マーク図形と判定した形状を前記マーク項目領域の画像データから除去するマーク図形除去手段と、
    指示された対象の画像データから文字を抽出し、文字認識辞書記憶手段に記憶する文字認識辞書に基づいて抽出した文字を認識する文字認識手段と、
    前記マーク図形除去手段によって前記マーク図形を除去した前記マーク項目領域の画像データを対象とする文字認識を前記文字認識手段に行わせ、得られた文字認識結果及び前記マーク図形の位置をマーク項目認識結果として出力する認識制御手段と、
    を有することを特徴とするマーク項目認識装置。
  2. 帳票の画像データからマーク項目を抽出して認識処理を行うマーク項目認識装置において、
    対象帳票の画像データを取得し、前記対象帳票に予め印刷された選択項目を表すガイド文字と、前記選択項目を選択するために記入されたマーク図形とが含まれるマーク項目領域の画像データを抽出し、前記マーク図形の図形特徴を予め定義したマーク図形定義に基づいて、前記マーク項目領域の画像データに含まれる前記マーク図形定義に適合する形状を探索し、検出した前記マーク図形の位置を特定するとともに、前記マーク図形と判定した形状を前記マーク項目領域の画像データから除去するマーク図形除去手段と、
    指示された対象の画像データから文字を抽出し、文字認識辞書記憶手段に記憶する文字認識辞書に基づいて抽出した文字を認識する文字認識手段と、
    前記マーク図形除去手段によって前記マーク図形を除去した前記マーク項目領域の画像データを対象とする文字認識を前記文字認識手段に行わせ、得られた文字認識結果及び前記マーク図形の位置をマーク項目認識結果として出力する認識制御手段と、
    前記ガイド文字を含む文字の字形画像を文字の識別情報に対応付けて定義した字形辞書を字形辞書記憶手段に記憶しておき、前記文字認識手段によって認識された認識文字の識別情報に基づいて前記字形辞書を検索して該認識文字の字形画像を取得し、前記字形画像を前記マーク項目領域の画像データ上の前記認識文字と重ね合わせ、重なる部分を除去して前記認識文字を前記マーク項目領域の画像データから除去し、残った画像データと、前記マーク図形定義とを比較して適合しているか否かを判定し、適合しているときは前記残った画像データを前記マーク図形と見なし、前記マーク図形の位置を判定するマーク記入位置判定手段と、
    を有し、
    前記認識制御手段は、前記マーク図形が検出できないとき及び前記マーク項目領域の一部のガイド文字で前記文字認識手段による文字認識ができないときは、前記マーク記入位置判定手段によって前記マーク項目領域の前記マーク図形の位置を特定する、
    ことを特徴とするマーク項目認識装置。
  3. 前記認識制御手段は、前記ガイド文字として存在する文字を定義したガイド文字テーブルをガイド文字テーブル記憶手段に記憶しておき、前記文字認識手段の文字認識により得られた認識文字を前記ガイド文字テーブルのガイド文字定義と照合し、前記認識文字が前記ガイド文字定義と一致する割合を一致率として算出し、前記一致率が所定の閾値を超えたか否かに応じて前記認識文字が正しいかどうかを判定する、
    ことを特徴とする請求項1または2記載のマーク項目認識装置。
  4. 前記認識制御手段は、前記ガイド文字テーブル記憶手段に格納される前記ガイド文字テーブルの前記ガイド文字定義に基づき、前記文字認識手段が認識した認識文字と前記ガイド文字定義とを比較し、前記認識文字と前記ガイド文字定義との一致率が所定の閾値を超えるときは、前記ガイド文字定義に基づいて、前記認識文字の前記ガイド文字定義と一致しない箇所の前記ガイド文字定義の文字への置き換えや、前記認識文字の文字区切り位置の変更を行うことによって前記認識文字の補正を行う、
    ことを特徴とする請求項3記載のマーク項目認識装置。
  5. 前記文字認識手段は、前記マーク項目領域内の画素を縦方向及び横方向にそれぞれ投影してヒストグラムを求め、前記ヒストグラムに基づいて前記画素が多い領域をガイド文字範囲と見なして前記ガイド文字範囲の位置を特定し、特定した前記ガイド文字範囲について前記文字認識を行う、
    ことを特徴とする請求項1または請求項2記載のマーク項目認識装置。
  6. 前記文字認識手段による文字認識を行う前に、前記マーク項目領域の画像データを抽出し、前記マーク図形の記入する位置を示し、前記ガイド文字にマークを記入する際のガイドとなるガイド図形の図形特徴を予め定義したガイド図形定義に基づいて、前記マーク項目領域の画像データに含まれる前記ガイド図形に適合する形状を探索し、検出した前記ガイド図形を前記マーク項目領域の画像データから除去するガイド図形除去手段、
    を有することを特徴とする請求項1または請求項2記載のマーク項目認識装置。
  7. 帳票の画像データからマーク項目を抽出して認識処理を行うマーク項目認識方法において、
    コンピュータが、
    対象帳票の画像データを取得し、前記対象帳票に予め印刷された選択項目を表すガイド文字と、前記選択項目を選択するために記入されたマーク図形とが含まれるマーク項目領域の画像データを抽出し、前記マーク図形の形状を予め定義したマーク図形定義に基づいて、前記マーク項目領域の画像データに含まれる前記マーク図形定義に適合する形状を探索し、検出した前記マーク図形の位置を特定するとともに、前記マーク図形と判定した形状を前記マーク項目領域の画像データから除去し、
    マーク図形除去手段によって前記マーク図形を除去した前記マーク項目領域の画像データを対象とし、前記対象の画像データから文字を抽出し、文字認識辞書記憶手段に記憶する文字認識辞書に基づいて抽出した文字を認識し、
    得られた文字認識結果及び前記マーク図形の位置をマーク項目認識結果として出力する、
    を有することを特徴とするマーク項目認識方法。
  8. 帳票の画像データからマーク項目を抽出して認識処理を行うマーク項目認識プログラムにおいて、
    コンピュータを、
    対象帳票の画像データを取得し、前記対象帳票に予め印刷された選択項目を表すガイド文字と、前記選択項目を選択するために記入されたマーク図形とが含まれるマーク項目領域の画像データを抽出し、前記マーク図形の形状を予め定義したマーク図形定義に基づいて、前記マーク項目領域の画像データに含まれる前記マーク図形定義に適合する形状を探索し、検出した前記マーク図形の位置を特定するとともに、前記マーク図形と判定した形状を前記マーク項目領域の画像データから除去するマーク図形除去手段、
    指示された対象の画像データから文字を抽出し、文字認識辞書記憶手段に記憶する文字認識辞書に基づいて抽出した文字を認識する文字認識手段、
    前記マーク図形除去手段によって前記マーク図形を除去した前記マーク項目領域の画像データを対象とする文字認識を前記文字認識手段に行わせ、得られた文字認識結果及び前記マーク図形の位置をマーク項目認識結果として出力する認識制御手段、
    として機能させることを特徴とするマーク項目認識プログラム。
JP2009227468A 2009-09-30 2009-09-30 マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム Active JP5189056B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009227468A JP5189056B2 (ja) 2009-09-30 2009-09-30 マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009227468A JP5189056B2 (ja) 2009-09-30 2009-09-30 マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム

Publications (2)

Publication Number Publication Date
JP2011076390A JP2011076390A (ja) 2011-04-14
JP5189056B2 true JP5189056B2 (ja) 2013-04-24

Family

ID=44020304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009227468A Active JP5189056B2 (ja) 2009-09-30 2009-09-30 マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム

Country Status (1)

Country Link
JP (1) JP5189056B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6193830B2 (ja) * 2014-09-18 2017-09-06 富士通フロンテック株式会社 帳票認識装置、帳票認識方法、及び、プログラム
JP2017033205A (ja) * 2015-07-31 2017-02-09 富士通フロンテック株式会社 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム
JP2018055578A (ja) * 2016-09-30 2018-04-05 富士通フロンテック株式会社 帳票仕分プログラム、帳票仕分装置及び帳票仕分方法
JP7231844B2 (ja) * 2020-09-11 2023-03-02 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3266687B2 (ja) * 1993-03-16 2002-03-18 株式会社日立製作所 マーク認識方法
JP3294995B2 (ja) * 1996-06-21 2002-06-24 三菱電機株式会社 帳票読取装置
JP3361258B2 (ja) * 1997-11-11 2003-01-07 沖電気工業株式会社 文字読取装置
JP2000207488A (ja) * 1999-01-19 2000-07-28 Ricoh Co Ltd 文字認識方法、装置および記録媒体
JP2002259909A (ja) * 2001-02-28 2002-09-13 Oki Electric Ind Co Ltd 文字読取装置
JP2008077606A (ja) * 2006-09-25 2008-04-03 Oki Electric Ind Co Ltd マーク認識装置およびマーク認識方法

Also Published As

Publication number Publication date
JP2011076390A (ja) 2011-04-14

Similar Documents

Publication Publication Date Title
JP5837205B2 (ja) 画像領域を使用するテキスト検出
US7627148B2 (en) Image data processing apparatus and method, and image data processing program
KR100658119B1 (ko) 문자 인식 장치 및 방법
US8155425B1 (en) Automated check detection and image cropping
EP3522038A1 (en) Method for translating characters and apparatus therefor
US6920247B1 (en) Method for optical recognition of a multi-language set of letters with diacritics
CN103902993A (zh) 文档图像识别方法和设备
JP5189056B2 (ja) マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム
US11348331B2 (en) Information processing apparatus and non-transitory computer readable medium
EP2816506A1 (en) Character-recognition method and character-recognition device and program using said method
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN109409180B (zh) 图像分析装置和图像分析方法
CN107798355B (zh) 一种基于文档图像版式自动分析与判断的方法
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JP2023043910A (ja) 文字列抽出装置、文字列抽出方法、および文字列抽出プログラム
KR102102394B1 (ko) 문자 인식을 위한 영상 전처리 장치 및 방법
Halder et al. Word & character segmentation for Bangla handwriting analysis & recognition
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JPH09274645A (ja) 文字認識方法および装置
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP2010039615A (ja) 文字認識方法及び文字認識装置
CN115100672A (zh) 文字检测识别方法、装置、设备与计算机可读存储介质
CN116958995A (zh) 一种基于字符在平面位置信息的分段方法
Mishra et al. Automatic localization and correction of line segmentation errors

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5189056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150