JP2003044785A - 文字認識装置、文字認識方法およびプログラム - Google Patents

文字認識装置、文字認識方法およびプログラム

Info

Publication number
JP2003044785A
JP2003044785A JP2001229882A JP2001229882A JP2003044785A JP 2003044785 A JP2003044785 A JP 2003044785A JP 2001229882 A JP2001229882 A JP 2001229882A JP 2001229882 A JP2001229882 A JP 2001229882A JP 2003044785 A JP2003044785 A JP 2003044785A
Authority
JP
Japan
Prior art keywords
format
recognition
character
illegal
entered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001229882A
Other languages
English (en)
Inventor
Tomohisa Suzuki
智久 鈴木
Hiroyuki Mizutani
博之 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001229882A priority Critical patent/JP2003044785A/ja
Publication of JP2003044785A publication Critical patent/JP2003044785A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】本発明は、予め定められた書式に従って記入さ
れるべき帳票に於いて、正規形式の認識を含む1回の認
識処理で、仕様外の記入が行われている場合であっても
既知の不正形式であれば複数種の不正形式についていず
れも認識可能な装置および方法を提供することを課題と
する。 【解決手段】形式照合手段12は、帳票上の認識対象と
なる文字が記入された記入欄と、正規形式、既知の不正
形式を照合し、記入文字の認識手段として、正規形式認
識手段13、各不正形式毎に実装された特定不正形式認
識手段14(14-1〜14-n)、または未知不正形式認
識手段15のいずれか一つを選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置に関
し、特に、帳票上で予め定められた書式に従って記入さ
れるべき文字、および予め定められた書式に従って記入
されない文字を含めて認識する文字認識装置、文字認識
方法、および文字認識処理プログラムに関する。
【0002】
【従来の技術】OCR入力用の帳票や、既存帳票等に於
いては、通常、各記入項目毎に記入欄が設けられてお
り、それらの記入欄には、帳票設計者が意図した記入形
式通りに文字を記入することが要求される。
【0003】多くの文字認識装置では、帳票上への実際
の記入が上記した形式通りに記入されている場合にの
み、読み取り(文字認識)が可能な仕様になっている
が、現実には、帳票設計者の意図に反した不正な形式で
記入が行われていることも多く、そのような場合には、
正しい形式でのみ読み取る仕様では、正しい読み取りが
行えない。
【0004】例えば、OCR入力用帳票に於いては、文
字位置の特定を容易にする等の目的から、入力欄がマス
に区切られている場合が多く、マス内に文字を記入する
のが正しいが、実際には、1マス内に複数の文字が記入
されたり、マスからずれて文字が印字又は記入(以下、
単に記入と記す)されている場合等があるため、正しい
形式の記入のみを仕様とした文字認識装置では、不正な
記入を行った場合には、正しい読み取りを行うことがで
きない。この種、文字認識の従来技術としては、特開平
10−269316号公報に示されるように、記入欄か
ら文字がはみ出している場合に、記入欄の外側まで文字
の読み取り範囲を拡張する方法等が存在する。
【0005】従来の文字認識装置に於いては、正しい読
み取りを行うことができない際に、直ちにリジェクト文
字扱いとせず、ある条件の下に、再度、認識処理を実行
して、リジェクト文字扱いの発生頻度をできるだけ低減
させるようにしている。 しかしながら、従来のこの
種、文字認識装置に於いては、正しい読み取り認識行う
ことができない帳票に対して、正規の条件とは異なる特
定の条件の下に、再度、認識を行う構成であることか
ら、文字認識処理に、より多くの時間が必要となり、装
置全体の処理能力が低下してしまうという問題があっ
た。
【0006】また、上記した理由から、実際には、正し
い読み取り認識を行うことができない帳票に対して、あ
る一つの限られた特定の条件下でのみしか、再認識を行
うことができず、その特定の条件を外れた記入文字につ
いては読み取り認識が不可であり、文字認識性能、およ
び処理能力の面で問題を残していた。
【0007】
【発明が解決しようとする課題】上述したように従来で
は、正しい読み取りを行うことができない際に、直ちに
リジェクト文字扱いとせず、ある条件の下に、再度、認
識処理を実行して、リジェクト文字扱いの発生頻度をで
きるだけ低減させるようとした際、読取処理に、より多
くの時間が必要となり、装置全体の処理能力が低下して
しまうという問題があった。更に、上記理由から、実際
には、正しい読み取りを行うことができない帳票に対し
て、ある一つの限られた特定の条件下でのみしか再読取
を行うことができず、その特定の条件を外れた記入文字
については読み取りが不可であることから、文字認識性
能、および処理能力の面でも問題があった。
【0008】本発明は上記実情に鑑みなされたもので、
正しい読み取りを行うことができない場合に、正規の記
入形式を逸脱した諸々の条件に対しての文字認識を、効
率よく迅速に実行でき、これにより、文字認識性能、お
よび処理能力を大幅に向上できる、文字認識装置、文字
認識方法、および文字認識処理プログラムを提供するこ
とを目的とする。
【0009】
【課題を解決するための手段】本発明は、既定の形式に
従って記入されるべき記入欄をもつ帳票の記入文字認識
処理に於いて、既定の形式に適合しない不正な形式で記
入された場合に於いて、既定の形式に適合した認識処理
に連動して、読取条件を異にする複数種の不正形式を対
象に記入欄を認識可能としたことを特徴とする。これに
より、予め定められた書式に従って記入されるべき帳票
に於いて、正規形式の認識を含む1回の認識処理で、仕
様外の記入が行われている場合であっても既知の不正形
式であれば複数種の不正形式についていずれも認識可能
な装置が実現できる。
【0010】即ち、本発明に係る文字認識装置は、記入
欄に記入された正規形式に適合している記入文字を認識
する正規形式認識手段と、前記記入欄に記入された、特
定の不正形式に適合している記入文字を認識する複数種
の不正形式それぞれに固有の複数の特定不正形式認識手
段と、前記記入欄に記入された文字を前記正規形式認識
手段、または前記複数の特定不正形式認識手段のいずれ
かの認識手段で認識させるかを判定する形式照合手段と
を具備したことを特徴とする。
【0011】また、本発明に係る文字認識装置は、記入
欄に記入された、正規形式に適合している記入文字を認
識する正規形式認識手段と、前記記入欄に記入された、
特定の不正形式に適合している記入文字を認識する少な
くとも1種の特定不正形式認識手段と、前記正規形式、
前記不正形式のいずれとも適合しない前記記入文字を認
識する未知不正形式認識手段と、前記記入欄に記入され
た文字を前記正規形式認識手段、または前記特定不正形
式認識手段、または前記未知不正形式認識手段のいずれ
で認識させるかを判定する形式照合手段とを具備したこ
とを特徴とする。
【0012】また、本発明は、定められた記入形式通り
に文字を記入することが要求される帳票を対象とした文
字認識方法に於いて、記入欄に記入された文字が予め定
められた正規の形式に適合しているか否かを判定し、前
記正規の形式に適合しているときは、予め定めた正規形
式の認識処理により前記記入欄に記入された文字に対し
て文字認識を行い、前記正規の形式に適合していないと
きは、予め定めた複数の不正形式から適合する不正形式
を判定して、当該判定に従う不正形式の認識処理により
前記文字の文字認識を行うことを特徴とする。
【0013】また、本発明は、文字認識装置としてコン
ピュータを機能させるためのプログラムであって、記入
欄に記入された文字が予め定められた正規の形式に適合
しているか否かを判定し、前記正規の形式に適合しない
とき、予め定めた複数の不正形式から適合する不正形式
を判定する機能と、前記正規の形式に適合していると判
定した際は、予め定めた正規形式の認識処理により前記
記入欄に記入された文字に対して文字認識を行う機能
と、前記正規の形式に適合していないと判定した際は、
前記判定に従う不正形式の認識処理により前記文字の文
字認識を行う機能とをコンピュータに実現させることを
特徴とする。
【0014】上記した本発明の不正形式認識機能をもつ
ことにより、正しい読み取りを行うことができない場合
に、正規の記入形式を逸脱した諸々の条件に対しての文
字認識を、効率よく迅速に実行でき、これにより、文字
認識性能、および処理能力を大幅に向上できる。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。
【0016】先ず、図1〜図10を参照して本発明の第
1の実施形態を説明する。
【0017】本発明の第1実施形態では、先ず、記入形
式が、正規形式(即ち、帳票設計者が意図した記入形
式)、あるいは既知の不正形式(即ち、帳票設計者が意
図した記入形式と異なる記入形式)のいずれか、あるい
は未知の不正形式のうちの、いずれを仮定して認識を行
うべきかが形式照合手段によって判定される。そして、
正規形式を仮定して認識すべきであると判定した場合
は、正規形式認識手段により記入文字を認識し、既知の
不正形式を仮定して認識すべきであると判定した場合に
は対応する特定不正形式認識手段によって記入文字を認
識する。また、未知の形式の不正形式を仮定して認識す
べきであると判定した場合は、未知不正形式認識手段に
より記入文字を認識する。
【0018】図1は本発明の第1実施形態に於ける文字
認識装置の構成を示すブロック図、図2は上記図1に示
す形式照合手段12の処理手順を示すフローチャート、
図3乃至図6は記入欄、およびそれぞれ記入欄の記入例
を示す図、図7乃至図10はそれぞれ形式照合手段12
の各種構成例を示すブロック図である。
【0019】本発明の第1実施形態に於ける文字認識装
置は、図1に示すように、入力された画像に対して処理
対象となる記入欄の周辺の画像の切り出しや、二値化、
ラベル付け、ノイズ除去等の画像処理を行う前処理手段
11と、記入形式が正規形式、あるいは既知の不正形式
のいずれか、あるいは未知の形式のうちのいずれを仮定
して認識を行うべきかを判定する形式照合手段12と、
正規形式を仮定して認識すべきであると判定した場合
に、記入文字の認識を行う正規形式認識手段13、不正
形式のいずれかを仮定して認識を行うべきであると判定
した場合に、記入文字を認識する各不正形式毎の特定不
正形式認識手段14(14-1〜14-n)、未知の不正形
式に対して間に合わせの認識を行う未知不正形式認識手
段15等の構成要素でなる。
【0020】前処理手段11では、入力された画像に対
して、帳票上の処理対象となる記入欄の周辺の画像の切
り出しや、二値化、ラベル付け、ノイズ除去等の画像処
理を行う。
【0021】形式照合手段12では、帳票上の認識対象
となる文字が記入された記入欄と、正規形式、既知の不
正形式を照合し、記入文字の認識手段として、正規形式
認識手段13、各不正形式毎に実装された特定不正形式
認識手段14(14-1〜14-n)、または未知不正形式
認識手段15のいずれか一つを選択する。
【0022】ここで、「正規形式」は、帳票設計者が意
図した仕様通りの記入形式、「不正形式」は帳票設計者
が意図した仕様から外れた記入形式を意味している。形
式照合手段12の構成例としては、以下の二通りが挙げ
られる。
【0023】この形式照合手段12の第1構成例を図7
に示す。
【0024】この図7に示す第1構成例に於いては、形
式照合手段12が、正規形式に対応する正規形式照合手
段A1と、各不正形式に対応する特定不正形式照合手段
A2〜An+1とを有して構成される。
【0025】ここで、既知の不正形式の数をnとする
と、形式照合手段12では、先ず、正規形式照合手段A
1により、記入形式が正規形式と適合するか否かを判定
し、適合する場合は、正規形式認識手段13を選択す
る。
【0026】また、正規形式と適合しない場合は、1番
目からn番目までの各特定不正形式照合手段A2〜An
+1により、記入文字がいずれの不正形式と適合するか
の判定が、適合するまで行われ、適合する不正形式が存
在するとき、その不正形式に対応する特定不正形式認識
手段14i(i=1,2,…n)を選択する。また、最後の特定
不正形式照合手段An+1で適合しない場合、つまり、
正規形式、不正形式のいずれとも適合しない場合は、未
知不正形式認識手段15を選択する。
【0027】ここで、「適合する」とは、帳票上の記入
欄に記入した文字の記入形式が、設計仕様通りの記入形
式であることを意味している。各記入形式と適合してい
るか否かの判定は、入力画像から文字の画像と位置情報
を抽出した後に、抽出した文字の位置や形状、認識結果
等が、上記記入形式について予め定められた仕様と合致
しているか否かの判定によって行うことができる。ま
た、各記入形式と適合しているか否かの判定は横方向、
縦方向への射影の結果など、入力画像全体から直接抽出
した特徴が上記仕様と矛盾するか否かによって行える場
合もあり、照合する形式について定められた仕様と合致
しているか判定できる方法であるならば、ここで挙げた
方法のみに限らず、どのようなもので実施してもよい。
【0028】具体例として、記入欄が図3に示すように
マスで区切られており、各マスにアラビア数字が記入さ
れていないか、一文字のみ記入されていて、どの文字も
マスの範囲内に完全に収まっていることが仕様として定
められている場合を例に取ると、この場合、正規形式と
適合するか否かの判定は、図2にフローチャートで示す
ように、記入欄の矩形内に複数の重心が含まれたマスが
無く(図2ステップS11のNO)、抽出した文字の各々
とマスの枠線が接触していない(図2ステップS12の
NO)ことを確認した後に、記入欄の各文字に対して個別
文字認識を行い(図2ステップS13のNO)、どの文字
の認識結果もアラビア数字である(図2ステップS14
のYES)ことを確認することによって、正規形式に適合
するか否かの判定する。
【0029】上記した判定により、記入欄に、図4に示
すように文字が記入されている場合は、正規形式に適合
すると判定される。これに対して、図5に示すように、
一マス内に複数の手書き文字が記入されている場合は、
右端のマスの矩形内に二つの文字の重心が含まれている
(図2ステップS11の YES)ため、正規形式とは適合
していないと判定(図2ステップS16)される。ま
た、図6に示すように、マスからずれて印刷文字が印字
されている場合は、マスの枠線と文字が接触している
(図2ステップS12のYES)ため、また、アラビア数
字ではなく漢数字を記入した場合(図示せず)には、個
別文字認識の結果がアラビア数字以外になる(図2ステ
ップS14のNO)ため、正規形式とは適合していないと
判定(図2ステップS16)される。
【0030】不正形式の一例として、図6に示すよう
に、記入欄からずれた印刷活字が十分な隙間で隔てられ
てマスと同じ間隔で並んでいる形式を例に採ると、この
不正形式と適合しているか否かの判定は、抽出した文字
の重心の間隔とマスの間隔との差の自乗平均と、文字の
隙間の最小値と文字の外接矩形の横幅の平均値の比が一
定未満であり、マスの罫線にかかっている文字が一定数
以上あるか否かの判定によって不正形式の判定を行うこ
とができる。この場合、特定不正形式認識手段14−1
が選択されて、罫線除去して文字の認識が行われる。
【0031】また、不正形式の他の例として、図5に示
すように、複数の文字が、マスに収まっている形式を例
に取ると、この不正形式と適合しているか否かの判定
は、抽出した文字の重心を複数含むマスがあり、どの文
字もマスの枠と接触していないことを確認することによ
って不正形式の判定を行うことができる。この場合、特
定不正形式認識手段14−2が選択されて、1マス内の
2文字を認識する手段を実行して、文字認識を行う。ま
た、アラビア数字以外の文字を判定した場合には、特定
不正形式認識手段14−3が選択されて、漢数字モード
に切り替えて文字認識を行う。
【0032】上記形式照合手段12の第2構成例を図8
に示す。
【0033】この図8に示す第2構成例では、形式照合
手段12が、正規形式に対応する正規形式照合手段B1
と、不正形式照合手段B2とにより構成され、上述した
第1構成例と同様に、正規形式照合手段B1により、記
入形式が正規形式と適合するか否かを判定し、適合する
場合は、正規形式認識手段13が選択される。
【0034】また、正規形式と適合しない場合、不正形
式照合手段B2に於いて、記入文字と既知の不正形式が
照合され、記入文字の認識手段として各不正形式毎に実
装された特定不正形式認識手段14のいずれかまたは、
未知不正形式認識手段15が選択される。
【0035】不正形式照合手段B2では、図9に示すよ
うに、既知不正形式照合手段C1(11)〜(1n)に於
いて、記入された帳票と既知の不正形式が照合され、そ
の照合結果の各々について、評価値付加手段C2(21)
〜(2n)により点数付けが行われ、その最大値が、予
め定められた閾値以上ならば、点数が最大になる形式に
対応する特定不正形式認識手段14i(i=1,2,…n)を選
択し、上記最大値が上記閾値未満ならば、未知不正形式
認識手段15を選択するように構成することができる。
【0036】個別文字認識の方法として、複合類似度法
を用いている場合を例に挙げると、上記点数付けの方法
としては、各不正形式毎に特定不正形式認識手段14
(14-1〜14-n)を用いて全記入文字を認識し、全文
字の認識結果の類似度の平均値を点数として用いる方法
が挙げられる。また、上記点数付けは各不正形式との整
合性が反映されるように行われる限り、上記した例で挙
げた方法に限らずどのような方法に基づいて行ってもよ
い。
【0037】また、不正形式照合手段は、図10に示す
構成としてもよい。この図10に示す構成では、不正形
式照合手段D1〜Dnにより、上記図7に示した第1構
成例の場合と同様に、記入文字を各不正形式毎に照合
し、最初に適合した不正形式に対応する不正形式認識手
段が選択されるようにしている。この場合、形式照合手
段全体の構成は第1構成例と等価になる。
【0038】以上、形式照合手段の構成例を示したが、
形式照合手段の構成方法としては、実際の記入形式に最
も近い不正形式に対応する認識手段が選択されることが
期待できる方法であれば、上記したものに限らず、他の
構成であってもよい。
【0039】正規形式認識手段13では、記入形式が正
規形式に適合している場合に記入文字の認識が行われ
る。
【0040】記入欄が図3に示すように、マスで区切ら
れている場合は、入力画像から各文字の画像と位置の情
報を抽出した上で、各マスに重心が含まれる文字の各々
について個別文字認識を行い、その結果をマスの並びの
順番に整列することによって認識対象となる記入欄の認
識結果が得られる。
【0041】特定不正形式認識手段14(14-1〜14
-n)では、特定の不正形式に記入が適合すると判定され
た場合に、当該不正形式に対応した方法で記入文字の認
識が行われる。
【0042】また、未知不正形式認識手段15では、記
入形式が未知の不正形式であるとことを仮定した、間に
合わせの認識結果が与えられる。未知の不正形式に対し
て適切な認識を行うのは困難であるので、この場合は認
識結果としてリジェクト文字が出力される。
【0043】また、本発明を実現する装置では、特定不
正形式照合手段と、特定不正形式認識手段として、予め
組み込まれたものが利用可能であるが、後で本装置を変
更することなく新しい不正形式に対応するため、新しい
特定不正形式照合手段を追加可能とするための新不正形
式照合手段追加手段と、新しい特定不正形式認識手段を
追加可能とするための新不正形式認識手段追加手段の両
方または一方を組み込んでもよい。
【0044】新不正形式照合手段追加手段では、新しい
不正形式に対応するための新しい特定不正形式照合手段
が本装置に追加される。また、新不正形式認識手段追加
手段では、新しい不正形式に対応するための新しい特定
不正形式認識手段が本装置に追加される。また、新不正
形式認識手段の追加手段では、新しい不正形式に対応す
るための新しい不正形式認識手段が本装置に追加され
る。
【0045】本発明が、コンピュータと文字認識ソフト
ウェアの組合せとして実現されている場合は、ソフトウ
ェアプラグインとして特定不正形式照合手段と特定不正
形式認識手段を追加可能なように文字認識ソフトウェア
を構成することが可能であり、新不正形式照合手段追加
手段、新不正形式認識手段追加手段は、それぞれ、新し
い特定不正形式照合手段、特定不正形式認識手段に対応
するプラグインを受け入れるためのプログラムとして実
現することが可能である。
【0046】このように構成された文字認識装置では、
後に特定不正形式照合手段と特定不正形式認識手段をソ
フトウェアプラグインとして作成し、組み込むことが可
能である。特に文字認識ソフトウェアをパッケージソフ
トウェアとして販売/配布する場合は、販売した後に、
プラグインを作成し、販売/配布することにより、低コ
ストで新しい不正形式への対応機能を提供することが可
能である。
【0047】ソフトウェアプラグインはダイナミックリ
ンクライブラリとして実現することも可能であるし、ソ
フトウェアにプラグイン用のインタープリタを組み込む
ことによってスクリプトとして実現することも可能であ
る。特に、スクリプトとして実現する場合は、ユーザー
自身がスクリプトを作成して組み込むことによって、不
正形式への対応方法をカスタマイズすることが可能とな
る。
【0048】また、ソフトウェアプラグインではなく、
拡張部品として特定不正形式照合手段と特定不正形式認
識手段を追加できるように文字認識装置を構成してもよ
く、本発明が専用ハードウェアとして実現されている場
合にも新しい不正形式へ対応することが適用可能であ
り、新しい不正形式に対応するために、特定不正形式照
合手段と特定不正形式認識手段の一方または両方を追加
可能とする機構として、新不正形式照合手段追加手段、
新不正形式認識手段追加手段を実装するという趣旨に沿
っている限り、新不正形式照合手段追加手段と新不正形
式認識手段追加手段としては上記した例で挙げたものに
限らず、どのようなものを用いてもよい。
【0049】次に、図11乃至図17を参照して本発明
の第2実施形態を説明する。
【0050】本発明の第2実施形態では、形式照合手段
に於いて、認識手段を一意には絞らず、正規形式認識手
段、特定不正形式認識手段、未知不正形式認識手段のう
ちの一つまたは複数の認識手段で認識を行い、それらの
認識手段の各々による認識結果の中から最終的に出力す
る認識結果が認識結果選択手段によって選択される。認
識結果選択手段に於ける認識結果の選択は、各認識結果
の点数付けにより自動的に行うこともできるし、各認識
手段による認識結果をオペレータに提示する記入形式表
示手段と、オペレータによる認識結果を選択するための
記入形式選択手段により、手動で行うこともできる。
【0051】図11は本発明の第2実施形態に於ける文
字認識装置の構成を示すブロック図、図12は上記図1
1に示す形式照合手段22の一構成例を示すブロック
図、図13は上記第2実施形態に於ける認識結果選択手
段の一構成例を示すブロック図、図14は上記第2実施
形態に於ける認識結果選択手段の他の構成例を示すブロ
ック図、図15は上記第2実施形態の動作を説明するた
めの文字記入例を示す図、図16および図17はそれぞ
れ上記第2実施形態に於ける記入形式表示手段261に
よる表示例を示す図である。
【0052】本発明の第2実施形態に於ける文字認識装
置は、前処理手段21と、形式照合手段22と、正規形
式認識手段23と、特定不正形式認識手段24(24-1
〜24-n)と、未知不正形式認識手段25とを有して構
成される。
【0053】これらの構成要素のうち、正規形式認識手
段23、特定不正形式認識手段24(24-1〜24-
n)、未知不正形式認識手段25は、それぞれ上述した
第1実施形態と同様の機能をもつ。また、形式照合手段
22については、図12を参照して後述する。
【0054】更に、この第2実施形態に於いては、上記
正規形式認識手段23、特定不正形式認識手段24(2
4-1〜24-n)、未知不正形式認識手段25での各認識
結果の中から、最終的に出力する認識結果を選択する認
識結果選択手段26を有する。この第2実施形態では、
上述した第1実施形態と異なり、形式照合手段22に於
いて、正規形式および全ての不正形式の中から適合して
いる記入形式全てが列挙される。
【0055】この第2実施形態に於ける形式照合手段2
2の一構成例を図12に示す。この図12に示す構成例
では、正規形式照合手段により、記入内容が正規形式と
適合するか否かが判定され、適合する場合は正規形式が
列挙する記入形式に追加される。
【0056】また、不正形式の各々について、特定不正
形式照合手段(1)〜(n)のうちの対応する特定不正
形式照合手段によって記入形式と適合するか否かが判定
され、適合する場合は不正形式が列挙する記入形式に追
加される。
【0057】ここで、上記の特定不正形式照合手段とし
ては、第1実施例で述べたものと同じものを用いる。そ
して、正規形式が列挙された記入形式に含まれる場合
は、正規形式認識手段23により、正規形式に対応した
方法で記入内容が認識される。
【0058】また、列挙された不正形式の各々につい
て、特定不正形式認識手段24(24-1〜24-n)のう
ちの対応する特定不正形式認識手段により記入内容が認
識される。また、場合によっては、未知不正形式認識手
段25による記入内容の認識も行われる。未知不正形式
認識手段25による認識は、必ず行うようにしてもよい
し、正規形式、不正形式のいずれとも記入形式が適合し
ない場合のみ等、条件付きで行うようにしてもよい。
【0059】認識結果選択手段26では、正規形式認識
手段23、特定不正形式認識手段24(24-1〜24-
n)、未知不正形式認識手段25の各々に対応する認識
結果の中から最終的に出力する認識結果が選択される。
【0060】この認識結果選択手段26の一構成例を図
13に示す。
【0061】この図13に示す構成例に於いて、認識結
果選択手段26は、上記の如くして列挙された記入形式
に対応する認識結果と未知不正形式認識手段25による
認識結果を表示するための記入形式表示手段261と、
オペレータによる上記の認識結果の選択を行うための記
入形式選択手段262とを有する。
【0062】記入形式表示手段261では、形式照合手
段22で適合すると判定された記入形式の各々と対応す
る認識結果の全部または一部が表示される。一部のみを
表示する場合には、表示する記入形式を選択しなければ
ならないが、例えば、個別文字認識に複合類似度法を用
いている場合は、各記入形式に対応する認識結果に於け
る類似度の平均値を点数として点数付けを行い、その順
位が予め定められた順位以上の認識結果のみを表示対象
とすることができるが、表示対象の選択方法としては、
ここで挙げた例に限らず、その他の方法を用いてもよ
い。また、認識結果とともに、入力画像や認識対象とな
った文字の画像を表示してもよい。そして、記入形式選
択手段では表示された記入形式のうちで最も適切である
と思われるものがオペレータによって選択され、最終的
な認識結果となる。
【0063】図16および図17はそれぞれ記入形式表
示手段261に於ける表示例を示す図であり、ここで
は、同一の表示内容について画面上の表示形態を変えた
例を示している。この図16および図17に示す例で
は、図15に示すような、記入枠よりずれた印刷文字に
ノイズが紛れ込んだ場合の認識結果として、正規形式認
識手段23による認識結果と、特定不正形式認識手段2
4(24-1〜24-n)の各々による認識結果、および未
知不正形式認識手段25による認識結果と、文字の画像
とがそれぞれ対応付けて表示されている。
【0064】記入形式選択手段262では、オペレータ
が、マウスなどのポインティングデバイスや、キーボー
ドなどで表示された認識結果を選択することによって、
最終的な認識結果が決定される。
【0065】認識結果選択手段26の他の構成例を図1
4に示す。この図14に示す構成例では、列挙された認
識結果の各々について評価値付加手段により点数付けを
行い、それが最大となる認識結果が最終的に出力する認
識結果として選択される。個別文字認識の方法として複
合類似度法を用いている場合を例に挙げると、上記点数
付けの方法としては、各不正形式毎に特定不正形式認識
手段24(24-1〜24-n)を用いて全記入文字を認識
し、全文字の認識結果の類似度の平均値を点数として用
いる方法が挙げられるが、点数付けの方法としては、上
で述べたものに限らず、他の方法を用いてもよい。ま
た、この第2実施形態に於いても、上述した第1実施形
態と同様に、新しい特定不正形式照合手段を追加可能と
するための新不正形式照合手段追加手段と、新しい特定
不正形式認識手段を追加可能とするための新不正形式認
識手段追加手段の両方または一方を組み込んでもよい。
【0066】上記した本発明の実施形態によれば、予め
定められた書式に従って記入されるべき帳票に於いて、
正規形式の認識を含む1回の認識処理で、仕様外の記入
が行われている場合であっても既知の不正形式であれば
複数種の不正形式についていずれも認識可能となる。
【0067】
【発明の効果】以上詳記したように本発明によれば、予
め定められた書式に従って記入されるべき帳票に於い
て、正規形式の認識を含む1回の認識処理で、仕様外の
記入が行われている場合であっても既知の不正形式であ
れば複数種の不正形式についていずれも認識可能な装置
が実現でき、これにより、正しい読み取りを行うことが
できない場合に、正規の記入形式を逸脱した諸々の条件
に対しての文字認識を、効率よく迅速に実行でき、文字
認識性能、および処理能力を大幅に向上できる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に於ける文字認識装置の
構成を示すブロック図。
【図2】上記実施形態に於ける形式照合手段の処理手順
を示すフローチャート。
【図3】上記実施形態の動作を説明するための帳票上の
記入欄の一構成例を示す図。
【図4】上記実施形態の動作を説明するための帳票上の
記入欄に於ける文字記入例を示す図。
【図5】上記実施形態の動作を説明するための帳票上の
記入欄に於ける文字記入例を示す図。
【図6】上記実施形態の動作を説明するための帳票上の
記入欄に於ける文字記入例を示す図。
【図7】上記実施形態に於ける形式照合手段の第1構成
例を示すブロック図。
【図8】上記実施形態に於ける形式照合手段の第2構成
例を示すブロック図。
【図9】上記図8に示す不正形式照合手段の一構成例を
示すブロック図。
【図10】上記図8に示す不正形式照合手段の他の構成
例を示すブロック図。
【図11】本発明の第2実施形態に於ける文字認識装置
の構成を示すブロック図。
【図12】上記図11に示す形式照合手段の一構成例を
示すブロック図。
【図13】上記第2実施形態に於ける認識結果選択手段
の一構成例を示すブロック図。
【図14】上記第2実施形態に於ける認識結果選択手段
の他の構成例を示すブロック図。
【図15】上記第2実施形態の動作を説明するための文
字記入例を示す図。
【図16】上記第2実施形態に於ける記入形式表示手段
による表示例を示す図。
【図17】上記第2実施形態に於ける記入形式表示手段
による表示例を示す図。
【符号の説明】
11…前処理手段 12…形式照合手段 13…正規形式認識手段 14,14-1,14-2,…14-n…特定不正形式認識手
段 15…未知不正形式認識手段 21…前処理手段 22…形式照合手段 23…正規形式認識手段 24,24-1,24-2,…24-n…特定不正形式認識手
段 25…未知不正形式認識手段 26…認識結果選択手段、 261…記入形式表示手段 262…記入形式選択手段

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 記入欄に記入された、正規形式に適合し
    ている記入文字を認識する正規形式認識手段と、 前記記入欄に記入された、特定の不正形式に適合してい
    る記入文字を認識する複数種の不正形式それぞれに固有
    の複数の特定不正形式認識手段と、 前記記入欄に記入された文字を前記正規形式認識手段、
    または前記複数の特定不正形式認識手段のいずれかの認
    識手段で認識させるかを判定する形式照合手段とを具備
    したことを特徴とする文字認識装置。
  2. 【請求項2】 記入欄に記入された文字が予め定められ
    た正規の形式に適合しているか否かを判定し、正規の形
    式に適合していないとき、正規の形式に適合していない
    複数の不正形式から適合する不正形式を判定する形式照
    合手段と、 前記形式照合手段が正規の形式に適合していると判定し
    たとき、前記記入欄に記入された文字の認識処理を実行
    する正規形式認識手段と、 前記複数の不正形式それぞれに対応して設けられた複数
    種の不正形式認識手段と具備し、 前記形式照合手段が正規の形式に適合していないと判定
    したとき、その判定に従い前記複数種の不正形式認識手
    段の中から選択された不正形式認識手段により前記文字
    の認識処理を実行するとことを特徴とする文字認識装
    置。
  3. 【請求項3】 記入欄に記入された文字が予め定められ
    た正規の形式に適合していることを判定する手段と、 前記判定手段が正規の形式に適合していることを判定し
    た際に、前記記入欄に記入された文字の認識処理を実行
    する正規形式認識手段と、 複数の不正形式それぞれに対応して設けられる複数種の
    不正形式認識手段と、 前記判定手段が正規の形式に適合していないと判定した
    際に、正規の形式に適合していない複数の不正形式から
    適合する不正形式に対応する前記不正形式認識手段を選
    択して前記文字の認識処理を実行する手段とを具備した
    ことを特徴とする文字認識装置。
  4. 【請求項4】 記入欄に記入された、正規形式に適合し
    ている記入文字を認識する正規形式認識手段と、 前記記入欄に記入された特定の不正形式に適合している
    記入文字を認識する少なくとも1種の特定不正形式認識
    手段と、 前記正規形式、前記不正形式のいずれとも適合しない前
    記記入文字を認識する未知不正形式認識手段と、 前記記入欄に記入された文字を前記正規形式認識手段、
    または前記特定不正形式認識手段、または前記未知不正
    形式認識手段のいずれで認識させるかを判定する形式照
    合手段とを具備したことを特徴とする文字認識装置。
  5. 【請求項5】 記入欄に記入された文字が予め定められ
    た正規の形式に適合しているか否かを判定し、前記正規
    の形式に適合していないとき、前記正規の形式に適合し
    ていない既知の不正形式を判定し、前記正規の形式及び
    既知の不正形式のいずれにも該当しないとき、未知の不
    正形式を判定する形式照合手段と、 前記形式照合手段が前記正規の形式に適合していると判
    定したとき、前記記入欄に記入された文字の認識処理を
    実行する正規形式認識手段と、 前記形式照合手段が前記既知の不正形式に適合している
    と判定したとき、前記既知の不正形式に固有の文字認識
    処理により前記記入欄に記入された文字の認識処理を実
    行する少なくとも1種の既知不正形式認識手段と、 前記形式照合手段が前記未知の不正形式に適合している
    と判定したとき、前記未知の不正形式に固有の文字認識
    処理を実行する未知不正形式認識手段とを具備したこと
    を特徴とする文字認識装置。
  6. 【請求項6】 記入欄に記入された文字が予め定められ
    た正規の形式に適合していることを判定する第1の判定
    手段と、 記入欄に記入された文字が既知の不正形式、若しくは未
    知の不正形式に適合していることを判定する第2の判定
    手段と、 前記第1の判定手段が正規の形式に適合していることを
    判定した際に、前記記入欄に記入された文字の認識処理
    を実行する正規形式認識手段と、 前記第2の判定手段が既知の不正形式に適合しているこ
    とを判定した際に、その判定した不正形式に従い、前記
    記入欄に記入された文字の認識処理を実行する既知の不
    正形式認識手段と、 前記第2の判定手段が未知の不正形式に適合しているこ
    とを判定した際に、その判定した不正形式に従い、前記
    記入欄に記入された文字の認識処理を実行する未知の不
    正形式認識手段とを具備したことを特徴とする文字認識
    装置。
  7. 【請求項7】 記入欄に記入された文字をそれぞれ認識
    する正規形式認識手段と、および複数種の不正形式それ
    ぞれに固有の複数の不正形式認識手段と、および未知の
    不正形式に固有の文字認識処理を実行する未知不正形式
    認識手段と、 前記正規形式認識手段、および前記複数の不正形式認識
    手段、および前記未知不正形式認識手段の各認識結果か
    ら最終的に出力される認識結果を選択する認識結果選択
    手段とを具備したことを特徴とする文字認識装置。
  8. 【請求項8】 前記正規形式認識手段の認識結果、およ
    び前記特定不正形式認識手段の認識結果、および前記未
    知不正形式認識手段の認識結果を同一画面上に表示し、
    当該同一画面上で何れか一つの認識結果を選択操作可能
    にしたGUIとを具備したことを特徴とする請求項7記
    載の文字認識装置。
  9. 【請求項9】 記入欄に記入された文字が予め定められ
    た正規の形式に適合しているか否かを判定し、 前記正規の形式に適合しているときは、予め定めた正規
    形式の認識処理により前記記入欄に記入された文字に対
    して文字認識を行い、 前記正規の形式に適合していないときは、予め定めた複
    数の不正形式から適合する不正形式を判定して、当該判
    定に従う不正形式の認識処理により前記文字の文字認識
    を行うことを特徴とする文字認識方法。
  10. 【請求項10】 記入欄に記入された文字が予め定めら
    れた正規の形式に適合しているか否かを判定し、 前記正規の形式に適合しているときは、予め定めた正規
    形式の認識処理により前記記入欄に記入された文字に対
    して文字認識を行い、 前記正規の形式に適合していないときは、予め定めた複
    数の既知不正形式から適合する不正形式を判定して、当
    該判定に従う不正形式の認識処理により前記記入欄に記
    入された文字に対して文字認識を行い、 前記正規の形式、および前記既知不正形式のいずれにも
    適合していないときは、未知不正形式の認識処理により
    前記文字の文字認識を行うことを特徴とする文字認識方
    法。
  11. 【請求項11】 文字認識装置としてコンピュータを機
    能させるためのプログラムであって、 記入欄に記入された文字が予め定められた正規の形式に
    適合しているか否かを判定し、前記正規の形式に適合し
    ないとき、予め定めた複数の不正形式から適合する不正
    形式を判定する機能と、 前記正規の形式に適合していると判定した際は、予め定
    めた正規形式の認識処理により前記記入欄に記入された
    文字に対して文字認識を行う機能と、 前記正規の形式に適合していないと判定した際は、前記
    判定に従う不正形式の認識処理により前記文字の文字認
    識を行う機能とをコンピュータに実現させるためのプロ
    グラム。
  12. 【請求項12】 文字認識装置としてコンピュータを機
    能させるためのプログラムであって、 記入欄に記入された文字が、正規形式、既知不正形式、
    未知不正形式のいずれに適合しているかを判定する機能
    と、 前記正規形式に適合していると判定された際に、予め定
    めた正規形式の認識処理により前記文字の文字認識を行
    う機能と、 前記既知不正形式に適合していると判定された際に、当
    該判定された既知不正形式の認識処理により前記文字の
    文字認識を行う機能と、 前記未知不正形式に適合していると判定された際に、未
    知不正形式の認識処理により前記文字の文字認識を行う
    機能とを具備するコンピュータに実現させるためのプロ
    グラム。
JP2001229882A 2001-07-30 2001-07-30 文字認識装置、文字認識方法およびプログラム Pending JP2003044785A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001229882A JP2003044785A (ja) 2001-07-30 2001-07-30 文字認識装置、文字認識方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001229882A JP2003044785A (ja) 2001-07-30 2001-07-30 文字認識装置、文字認識方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2003044785A true JP2003044785A (ja) 2003-02-14

Family

ID=19062174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001229882A Pending JP2003044785A (ja) 2001-07-30 2001-07-30 文字認識装置、文字認識方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2003044785A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139384A (ja) * 2018-02-07 2019-08-22 グローリー株式会社 文字認識システム、文字認識プログラム、文字認識方法、文字認識結果の表示装置、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP2021152689A (ja) * 2020-03-24 2021-09-30 株式会社東芝 情報処理装置、情報処理方法、プログラムおよび順序情報

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139384A (ja) * 2018-02-07 2019-08-22 グローリー株式会社 文字認識システム、文字認識プログラム、文字認識方法、文字認識結果の表示装置、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP7075770B2 (ja) 2018-02-07 2022-05-26 グローリー株式会社 文字認識システム、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP2021152689A (ja) * 2020-03-24 2021-09-30 株式会社東芝 情報処理装置、情報処理方法、プログラムおよび順序情報

Similar Documents

Publication Publication Date Title
US6047251A (en) Automatic language identification system for multilingual optical character recognition
US6038351A (en) Apparatus and method for multi-entity, mixed document environment document identification and processing
JP2000181993A (ja) 文字認識方法および装置
JP2008204226A (ja) 帳票認識装置およびそのプログラム
US6920247B1 (en) Method for optical recognition of a multi-language set of letters with diacritics
JP4733577B2 (ja) 帳票認識装置及び帳票認識プログラム
JP4280355B2 (ja) 文字認識装置
EP2191396B1 (en) An apparatus for preparing a display document for analysis
JP2003044785A (ja) 文字認識装置、文字認識方法およびプログラム
CN106846603B (zh) 一种纸币真伪的识别方法及其装置
JP3159087B2 (ja) 文書照合装置および方法
JP3467437B2 (ja) 文字認識装置及びその方法とプログラム記録媒体
US7110600B1 (en) Document identifying device and method
JP3673616B2 (ja) 商品券識別方法及び装置
JP2002358521A (ja) 帳票フォーマット登録・識別装置、方法及びプログラム
JP4109738B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP3151866B2 (ja) 英文字認識方法
JP2752499B2 (ja) 文字読取り装置
JP2002007960A (ja) 帳票読み取り方法および帳票読み取りシステム
JP2002150263A (ja) 辞書作成装置、辞書作成方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3595081B2 (ja) 文字認識方法
JP2001236454A (ja) スクリプトファイルを用いた帳票認識方法
JPH11265424A (ja) 文字認識方法、装置および記録媒体
JPH06309503A (ja) 英文字認識装置
JP2003203201A (ja) 帳票のイメージデータを用いた自動取引

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080513