JPH08153159A - パターン認識システム - Google Patents

パターン認識システム

Info

Publication number
JPH08153159A
JPH08153159A JP6296418A JP29641894A JPH08153159A JP H08153159 A JPH08153159 A JP H08153159A JP 6296418 A JP6296418 A JP 6296418A JP 29641894 A JP29641894 A JP 29641894A JP H08153159 A JPH08153159 A JP H08153159A
Authority
JP
Japan
Prior art keywords
character
pattern
factor information
recognition
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6296418A
Other languages
English (en)
Inventor
Masanori Terasaki
正則 寺崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6296418A priority Critical patent/JPH08153159A/ja
Publication of JPH08153159A publication Critical patent/JPH08153159A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】認識結果(正読、リジェクト、誤読)の因子
(原因)を判別できるようにして、適切な改善、改良を
することを容易にする。 【構成】用紙に記録されたパターンを読取るパターン認
識システムにおいて、パターンを読取った結果がどのよ
うな処理過程を経て決定されたかを示す因子情報を、読
取り結果と共に出力するパターン認識装置10と、パタ
ーン認識装置10から出力された読取り結果を表示する
と共に、因子情報に応じた読取り結果に関する通知を表
示するホストシステム12中の読取り結果表示部30を
具備して構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置
(OCR)、マークリーダ、テキストリーダ、名刺OC
R等に好適なパターン認識装置に関する。
【0002】
【従来の技術】一般に、光学的文字読取装置(OCR)
等のパターン認識装置では、文字の読取り結果として、
認識結果(第1位候補文字の文字コード)と複数の文字
コード列(第2候補以降の候補文字)、及び各候補文字
の順位を決定するもとになった類似度(予め設定された
辞書との比較によって求められる)がホストシステム側
に出力される。
【0003】ホストシステムでは、パターン認識装置側
からの読取り結果に応じて表示出力して処理の結果を使
用者に通知する。通常、各文字に対する認識結果として
は、正しく認識された正読、十分な認識結果が得られな
かったリジェクト、及び誤って認識された誤読がある。
【0004】従来、リジェクト、あるいは誤読された文
字については、その原因がどの処理にあるか読取り結果
らは明確には判別することができなかった。リジェクト
については、パターン認識装置側からリジェクトが発生
した原因となった処理を示す特殊コードを出力すること
により、ある程度はホストシステム側で判別することが
できるが明確には判別できなかった。特に、誤読につい
ては、どの処理でエラーが発生したのか全く判別するこ
とができなかった。
【0005】
【発明が解決しようとする課題】このように従来のパタ
ーン認識システムでは、リジェクトあるいは誤読した文
字については、どの処理でエラーが発生したのか明確に
判別することができず、例えば運用(文字の記入)の問
題か、辞書の問題か、あるいは認識処理の問題であるの
か特定できなかった。
【0006】従って、読取り処理の改善を行なうにして
も、評価者の判断(推測)で決定し、概ねの改善、改良
にとどまっていた。本発明は前記のような事情を考慮し
てなされたもので、認識結果(正読、リジェクト、誤
読)の因子(原因)を判別できるようにして、適切な改
善、改良をすることが容易なパターン認識システムを提
供することを目的とする。
【0007】
【課題を解決するための手段】本発明は、用紙に記録さ
れたパターンを読取るパターン認識システムにおいて、
パターンを読取った結果がどのような処理過程を経て決
定されたかを示す因子情報を、読取り結果と共に出力す
るパターン認識手段と、前記パターン認識手段から出力
された読取り結果を表示すると共に、前記因子情報に応
じた前記読取り結果に関する通知を表示する読取り結果
表示手段とを具備したことを特徴とする。
【0008】
【作用】このような構成によれば、最終的な文字認識結
果に影響する原因を示す因子情報を認識結果と共に出力
するので、各文字の認識結果がどのように決定されたか
を判別することができる。従って、誤読あるいはリジェ
クトした文字についての因子情報を参照することによ
り、今後の処理の際に、どのような運用をすべきか、あ
るいは修正等が必要であるかを明確に判別することがで
きる。また、因子情報に応じた通知(メッセージ)を表
示させることにより、容易かつ明確にシステムの状況を
判別することができる。
【0009】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本実施例に係わるパターン認識システム
の構成を示すブロック図である。図1に示すように、本
実施例におけるパターン認識システムは、パターン認識
装置10、ホストシステム12、表示部14、及び入力
部15によって構成されている。
【0010】パターン認識装置10は、制御部20、F
C格納部21、スキャナ部22、バッファ部23、及び
認識処理部24によって構成されている。制御部20
は、ホストシステム12からの指示に応じて、パターン
認識装置10の全体の制御を司るものである。制御部2
0は、ホストシステム12から与えられるパターン認識
装置10の動作を定義する情報(フォーマットコントロ
ール情報:FC情報と略称する)を、FC格納部21に
格納し、処理に応じて適宜参照する。
【0011】FC格納部21は、各部における処理動作
を定義する情報を格納するもので、処理対象とする用紙
(帳票)に記載される文字に関する情報(文字位置、文
字種等)等の他、認識処理部24に対しては処理毎に認
識因子情報をホストシステム12に出力することを指定
する因子情報出力制御情報21aが含まれている。
【0012】スキャナ部22は、処理対象とする用紙
(帳票等)を光学的に走査して、文字等のパターンを含
むイメージを検出する。バッファ部23は、スキャナ部
22によって検出されたイメージを格納するためのメモ
リである。
【0013】認識処理部24は、制御部20のもとにF
C情報格納部21に格納されたFC情報にしたがって、
バッファ部23に格納されたイメージ中に含まれる文字
パターンを認識するものである。認識処理部24には、
文字切り出し部25、文字認識部27、及び辞書格納部
29が含まれている。
【0014】文字切り出し部25は、バッファ部24に
格納されたイメージ中から、1文字分の文字パターンを
検出するものである(検切り処理)。本実施例では、帳
票に設けられた文字枠内に文字が記入され、文字切り出
し部25は、基本的には文字枠位置に基づいて文字パタ
ーンの切り出し処理を実行するものとする。また、文字
切り出し部25には、検切り処理において最終的な文字
認識結果に影響する原因を示す因子情報に関する処理を
行なう検切り処理因子情報制御部25aが設けられてい
る。
【0015】文字認識部27は、文字切り出し部25に
よって切り出された文字パターンについて、辞書格納部
29に格納された辞書パターンとの比較によって辞書パ
ターン毎の類似度を求め、類似度値に基づいて認識結果
を決定する。また、文字認識部27には、文字認識処理
において最終的な文字認識結果に影響する原因を示す因
子情報に関する処理を行なう認識処理因子情報制御部2
7aが設けられている。
【0016】辞書格納部29は、認識の対象とする文字
カテゴリの辞書パターン情報を格納するためのものであ
る。(辞書の具体的な構成については後述する)。ホス
トシステム12は、パターン認識装置10を制御し、制
御部20を介して得られる文字の読取り結果として認識
結果、候補文字類似度、さらには認識因子情報をもと
に、文字読取り結果の表示を行なうものである。ホスト
システム12では、読取り結果表示部30が動作し、読
取り結果の表示の制御を行なっている。さらに読取り結
果表示部30では、因子情報表示部32によって各文字
に対応する認識因子情報に関する表示の制御を行なって
いる。因子情報表示部32は、因子情報に対応するメッ
セージを格納するメッセージファイル32aを有してお
り、必要に応じて因子情報に対応するメッセージを表示
させる。
【0017】表示部14は、ホストシステム12の読取
り結果表示部30の制御のもとで、文字読取り結果の表
示を行なうものである。入力部15は、ホストシステム
12に対する利用者からの指示等を入力するもので、例
えば文字読取り結果中のリジェクトや誤読された文字に
対する訂正指示等を入力する。
【0018】次に、本実施例の動作について説明する。
まず、処理対象とする帳票がスキャナ部22によって光
学的に走査され、これによって得られたイメージがバッ
ファ部23に格納される。制御部24は、認識処理部2
4に対して、バッファ部23に格納されたイメージに対
する文字認識処理の実行を指示する。
【0019】認識処理部24は、まず文字切出し部25
によってバッファ部23中のイメージに対して検切り処
理を実行し、文字パターンを抽出する。この際、文字切
出し部25の検切り処理因子情報制御部25aは、文字
切出し処理において、最終的な文字読取り結果に影響す
る原因となる処理結果について因子情報として記録す
る。
【0020】本実施例においては、検切り処理によって
最終的な文字読取り結果に影響する因子情報(検切処理
因子情報)として、(1)強制切断情報、(2)接続情
報、(3)リジェクト情報、(4)その他の情報、があ
るものとする。
【0021】検切り処理因子情報制御部25aは、検切
り処理によって決定された検切処理因子情報を、例えば
図2に示すように1ワード(32ビット)で生成する。
すなわち、各情報(1)〜(4)を、それぞれ1バイト
で表わす。なお、各情報は、以下のような内容を示して
いる。
【0022】(1)強制切断情報は、文字パターンが文
字枠の位置をはみだして存在しているために強制的に切
断した際の文字枠位置(上下左右)とストロークの関係
(交差しているストローク本数等)を示すものである。
例えば、図3に示すように、文字枠の右辺と交差するス
トロークが文字パターン中に存在していれば(図3
(a))、該当するビットに値をセットする(図2
(b))。強制切断情報は、各辺に対しては2ビットが
割り当てられているため、4つの状態を強制切断情報と
して設定できる(例えば“0”であれば正常、他の値で
あれば枠と交差しているストローク本数とする)。
【0023】(2)接続情報は、文字パターンのストロ
ークが他の文字枠中の文字パターンと接続されている場
合に、接続先を示す該当するビットに値をセットする。 (3)リジェクト情報は、検切り処理を行なう段階で、
認識処理の対象としないと判別された文字パターンにつ
いて、そのリジェクトの原因を示す該当するビットに値
をセットする。例えば、文字パターンのストローク中に
かすれ、つぶれなどがあり、適切な検切り処理が実行で
きない場合に、認識処理の対象としないものとする(リ
ジェクトする)。
【0024】(4)その他の情報は、その他に検切り処
理において、文字読取り結果に影響する原因となる処理
結果を含み、因子情報として予め定義された所定のビッ
トにセットされる。
【0025】検切り処理因子情報制御部25aは、処理
の対象とする1文字分の文字パターンに対応づけて、前
述したような内容に従って設定された検切り処理因子情
報を設定して制御部20に出力する。
【0026】次に、認識処理部27は、文字切出し部2
5によって抽出された文字パターンについて、辞書格納
部29に格納された辞書パターンと比較することによっ
て、各辞書パターン毎に類似度を求める。そして、認識
処理部24は、各辞書パターンの類似度値に基づいて、
認識対象としていた文字パターンについての認識結果を
決定する。
【0027】この際、文字認識部27の認識処理因子情
報制御部27aは、文字認識処理において、最終的な文
字読取り結果に影響する原因となる処理結果について因
子情報として記録する。
【0028】本実施例においては、文字認識処理によっ
て最終的な文字読取り結果に影響する因子情報(認識処
理因子情報)として、(1)サブセット番号、(2)エ
ントリ番号、(3)類似度情報、(4)その他の情報
(リジェクト情報等)、があるものとする。
【0029】なお、辞書格納部29に格納された辞書
は、例えば図4に示すように構成されているものとす
る。すなわち、辞書は、複数個のサブセットで構成され
ており、さらに1つのサブセットには決められた字種の
複数の文字カテゴリに対応する辞書が納められている。
【0030】図4では、数字サブセット(サブセット番
号3)と、カナサブセット(サブセット番号4)の一部
を図示している。図4に示すように、各文字カテゴリに
は複数の文字分の辞書が用意されており、1つの文字の
辞書はサブセット番号とエントリ番号によって特定され
る。
【0031】認識処理因子情報制御部27aは、認識処
理によって決定された認識処理因子情報を、例えば図2
に示すように、検切り処理の場合と同様にして、1ワー
ド(32ビット)で生成する。すなわち、各情報(1)
〜(4)を、それぞれ1バイトで表わす。
【0032】認識処理因子情報制御部27aは、処理の
対象とする1文字分の認識結果に対応づけて、前述した
ような内容に従って設定された認識処理因子情報を設定
して制御部20に出力する。文字認識処理によって、複
数の認識候補が得られた場合には、各認識候補毎に認識
処理因子情報が設定される。
【0033】例えば、認識処理によって、図5に示すよ
うな結果が得られたものとする。図5は数字「9」(図
6中に示す文字パターン)に対する認識結果を示してい
る。候補文字として第1位から第5位から文字認識候補
が得られ、それぞれの候補文字に対応するサブセット番
号、エントリ番号、類似度が得られている。サブセット
番号、エントリ番号、及び類似度は、各候補文字の認識
因子情報として設定される。
【0034】制御部20は、文字の読取り結果として、
認識結果(第1位候補文字の文字コード)と複数の文字
コード列(第2候補以降の候補文字)、及びそれぞれの
候補文字の類似度と共に、さらに各候補文字毎に設定さ
れた因子情報を付加してホストシステム12に返す(ま
た、認識対象としたイメージ部分のデータについてもホ
ストシステム12に出力する)。
【0035】ホストシステム12、パターン認識装置1
0からの文字の読取り結果を受けると、読取り結果表示
部30によって、例えば図6に示すような画面を表示部
14において表示させる。
【0036】図6に示す表示画面中には、認識対象とし
たイメージ40、認識対象とするイメージに対応した認
識結果41(第1の認識候補)、カーソル42が示す位
置の文字についての候補文字(第2位以降の候補文字を
含む)43が表示される。さらに、因子情報表示部32
によって、認識結果41として表示された候補文字に関
する因子情報44及び因子情報に対応するメッセージ4
5が必要に応じて表示される(図6では文字「9」に対
して正読されているためメッセージが表示されていな
い)。
【0037】因子情報に対応したメッセージ43は、例
えば因子情報表示部32のメッセージファイル32aに
おいて予め用意されているメッセージが、因子情報に応
じて表示される。例えば、メッセージファイル32a
は、図7に示すようなメッセージが格納されたテキスト
ファイルである。
【0038】例えば、図7中に示す「認識辞書が壊れて
います。お近くの保守員まで連絡下さい。」のメッセー
ジは、認識因子情報中のサブセット番号あるいはエント
リ番号が、辞書格納部29中に本来存在しない辞書を示
す場合に、辞書が異常であるものとして、辞書格納部2
9の取換え等を促すものである。
【0039】また、図7中に示す「文字の記入を濃くし
てください。」のメッセージは、例えば図8(a)に示
すような記入を、図8(b)に示すようなイメージとし
て検出し、その結果、図8(c)に示すように、2番目
の文字をリジェクトした場合に表示される。
【0040】なお、メッセージは、全ての因子情報(ビ
ットの組み合わせ)に応じて用意されている必要はな
い。また、メッセージの内容は、システムを管理する保
守員に対するもの、あるいは利用者に対するもの等、任
意に用意することができ、またメッセージを表示するか
否かは任意に設定することができる。
【0041】このようにして、図6に示すように、検切
り処理及び認識処理における因子情報に基づいて因子情
報、及びメッセージを表示させることにより、認識結果
がどのような処理を経て決定されたのかを判別すること
ができる。従って、誤読やリジェクトが発生した場合
に、その原因が適切に判別でき、今後の処理の際に問題
箇所について対処することができる。例えば、運用の問
題(帳票に対する文字の記載状態)、イメージ検出の問
題(かすれやつぶれがあればスキャナ部22におけるイ
メージ検出状態を変更する)、辞書格納部29に格納さ
れた辞書パターンの問題など、メッセージに応じた対応
をすることで、文字認識の品質(認識精度)やメンテナ
ンスの作業効率の向上が図れる。
【0042】なお、前述した説明では、パターン認識装
置10から各候補文字に対応する因子情報をホストシス
テム12に返すものとしているが、FC情報格納部21
に因子情報出力制御情報21aとして因子情報の出力に
関する定義を設定することにより、制御部20によって
因子情報のホストシステム12への出力を制御すること
もできる。
【0043】因子情報出力制御情報21aでは、認識処
理部24において因子情報を生成するか否かの指定、因
子情報を生成する特定の処理の指定、あるいは生成した
因子情報をホストシステム12に出力するか否かの指定
等を行なう。例えば、正読あるいは誤読した文字に関す
る因子情報については、選択的に画面上で確認できるよ
うにする。認識処理部24は、因子情報出力制御情報2
1aの設定内容に応じて、因子情報に関する処理を実行
する。また、制御部20は、指定の内容に応じて特定の
因子情報をホストシステム12に出力する。ここで、制
御部20は、リジェクトされた文字に関しては、無条件
に因子情報を出力するようにし、それ以外の文字、つま
り正読あるいは誤読された文字に関して選択的に出力す
るようにしても良い。
【0044】このようにして、ホストシステム12に対
して返す因子情報を制限することで、パターン認識装置
10とホストシステム12間でのデータ転送の負担を軽
減することができる。
【0045】また、前述した説明では、ホストシステム
12は、パターン認識装置10からの因子情報に応じ
て、それぞれに対応するメッセージを表示するものとし
て説明したが、入力部15からの指示によって特定の読
取り結果を指示して、選択的にメッセージ(因子情報)
を表示させるようにしても良い。例えば、因子情報表示
部32は、例えば、リジェクトされた文字の読取り結果
についてはメッセージの表示を行ない、正読あるいは誤
読した文字に関する因子情報については、入力部15に
設定された特殊キーの押下による指示に応じて選択的に
画面上で確認できるようにする。
【0046】このようにして、表示される因子情報に応
じたメッセージを、選択的に表示させるようにすること
により、見やすい画面にすることができる。なお、前記
実施例においては、帳票に記録された文字を読取る装置
を例にして説明したが、マークリーダ、日本語テキスト
リーダ(文字の記録フォーマットが特定されない)、名
刺OCR等に適用することが可能である。
【0047】
【発明の効果】以上詳述したように本発明によれば、最
終的な読み取り結果に影響する処理過程を因子情報とし
て付加し、この因子情報に基づいて認識結果(正読、リ
ジェクト、誤読)の表示を行なうことができるので、適
切な改善、改良をすることが容易となるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係わるパターン認識システ
ムの構成を示すブロック図。
【図2】本実施例における因子情報のフォーマットの一
例を示す図。
【図3】文字パターンの強制切断を説明するための図。
【図4】辞書の構成の一例を説明するための図。
【図5】認識結果の一例を示す図。
【図6】本実施例における表示画面の一例を示す図。
【図7】本実施例におけるメッセージの一例を示す図。
【図8】本実施例におけるメッセージ表示の一例を説明
するための図。
【符号の説明】
10…パターン認識装置、12…ホストシステム、14
…表示部、15…入力部、20…制御部、21…FC格
納部、21a…因子情報出力制御情報、22…スキャナ
部、23…バッファ部、24…認識処理部、25…文字
切り出し部、25a…検切り処理因子情報制御部、27
…文字認識部、27a…認識処理因子情報制御部、29
…辞書格納部、30…読取り結果表示部、32…因子情
報表示部、32a…メッセージファイル。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 用紙に記録されたパターンを読取るパタ
    ーン認識システムにおいて、 パターンを読取った結果がどのような処理過程を経て決
    定されたかを示す因子情報を、読取り結果と共に出力す
    るパターン認識手段と、 前記パターン認識手段から出力された読取り結果を表示
    すると共に、前記因子情報に応じた前記読取り結果に関
    する通知を表示する読取り結果表示手段と、 を具備したことを特徴とするパターン認識システム。
  2. 【請求項2】 読取り結果として特定のパターンに限定
    できなかった場合に、前記読取り結果表示手段は、前記
    読取り結果に関する通知を表示することを特徴とする請
    求項1記載のパターン認識システム。
  3. 【請求項3】 前記パターン認識手段は、 読取り結果として特定のパターンに限定できなかった場
    合以外では、予め設定された出力制御情報に応じて、選
    択的に前記因子情報を出力することを特徴とする請求項
    1記載のパターン認識システム。
  4. 【請求項4】 前記結果表示手段は、 前記因子情報に応じた前記読取り結果に関する通知を、
    指示に応じて選択的に表示することを特徴とする請求項
    1記載のパターン認識システム。
JP6296418A 1994-11-30 1994-11-30 パターン認識システム Pending JPH08153159A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6296418A JPH08153159A (ja) 1994-11-30 1994-11-30 パターン認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6296418A JPH08153159A (ja) 1994-11-30 1994-11-30 パターン認識システム

Publications (1)

Publication Number Publication Date
JPH08153159A true JPH08153159A (ja) 1996-06-11

Family

ID=17833293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6296418A Pending JPH08153159A (ja) 1994-11-30 1994-11-30 パターン認識システム

Country Status (1)

Country Link
JP (1) JPH08153159A (ja)

Similar Documents

Publication Publication Date Title
US20080298668A1 (en) Method for fraud detection using multiple scan technologies
JP2835178B2 (ja) 文書読取装置
JP2008021068A (ja) 帳票認識装置及び帳票認識プログラム
US4566039A (en) Facsimile system
JP4020924B2 (ja) イメージ処理装置
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH08153159A (ja) パターン認識システム
JPS63146187A (ja) 文字認識装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP4224914B2 (ja) 文字読取システム及び文字読取方法
JP3310063B2 (ja) 文書処理装置
JPH10175385A (ja) 検査文字付き印刷物
JP4457725B2 (ja) 帳票仕分装置及びプログラム
JP3648270B2 (ja) 帳票類読取装置及び会計帳票読取装置
JP2784004B2 (ja) 文字認識装置
JPH07296102A (ja) データ入力方式
JPH04293185A (ja) ファイリング装置
JPH10187885A (ja) 文字認識装置およびその文字認識処理を記憶した記憶媒体
JP2570571B2 (ja) 光学文字読取装置
JPS62295192A (ja) 光学文字画像読取装置
JPH04274580A (ja) 光学文字読取り装置
JPH08194772A (ja) 光学的文字読取り装置
JPS588382A (ja) 文字読取装置
JPS6326789A (ja) 文字認識装置
JP2002092545A (ja) 文字認識方法