JPH03163681A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH03163681A JPH03163681A JP1302564A JP30256489A JPH03163681A JP H03163681 A JPH03163681 A JP H03163681A JP 1302564 A JP1302564 A JP 1302564A JP 30256489 A JP30256489 A JP 30256489A JP H03163681 A JPH03163681 A JP H03163681A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- result
- unit
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 31
- 239000000945 filler Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、文字認識技術に関し、特に、不特定多数の印
字装置および記入者などによって印字または記入される
文字の読み取り処理に好適な技術に関する。
字装置および記入者などによって印字または記入される
文字の読み取り処理に好適な技術に関する。
たとえば、情報処理システムなどにおけるデータの人力
手段の一つとして、帳票などに記入された文字をパター
ン認識などの手法によって自動的に読み取る光学式文字
読取装置などが使用されている。
手段の一つとして、帳票などに記入された文字をパター
ン認識などの手法によって自動的に読み取る光学式文字
読取装置などが使用されている。
通常、このような光学式文字読取装置などにおいては、
帳票上に記入された複数の文字をl文字単位に切り出し
、1文字毎に認識処理することが行われている。しかし
ながら、手書き文字などの場合には、記入者の癖などに
よって、たとえば、“1”のような文字は、当該文字を
単独で見ただけでは″1″であるのか“7′であるのか
判定することができない。
帳票上に記入された複数の文字をl文字単位に切り出し
、1文字毎に認識処理することが行われている。しかし
ながら、手書き文字などの場合には、記入者の癖などに
よって、たとえば、“1”のような文字は、当該文字を
単独で見ただけでは″1″であるのか“7′であるのか
判定することができない。
このため、従来、手書き文字を光学式文字読取装置など
によって読み取る場合には、手書き文字の書き方規則を
各文字毎に定めて記入者に遵守させることにより、個々
の記入者の癖などによる読み取り不能の曖昧な文字が出
現することを防いでいる。
によって読み取る場合には、手書き文字の書き方規則を
各文字毎に定めて記入者に遵守させることにより、個々
の記入者の癖などによる読み取り不能の曖昧な文字が出
現することを防いでいる。
また、活字文字を読み取る場合、印字装置によって、た
とえば、“0”および“O”のように、数字のゼロと英
字のオーとが紛らわしく、従来では、予め登録されてい
る読み取り対象の字体に対応したパターン辞書などを読
み取り動作を行っている。
とえば、“0”および“O”のように、数字のゼロと英
字のオーとが紛らわしく、従来では、予め登録されてい
る読み取り対象の字体に対応したパターン辞書などを読
み取り動作を行っている。
このため、複数種の印字装置によって印字された種々の
字体を読み取る場合には、それぞれの字体に対応した辞
書を指定したり、帳票の特定領域に、予め取り決められ
た共通の字体(たとえばJISOCR−B)を用いて印
字字体の種別を示す識別情報を印刷しておき、通常の読
み取り動作に先立って当該識別情報を読み取ることによ
り、対象の帳票に印字されている字体の種別を装置に認
識させるなどの方法が採られている。
字体を読み取る場合には、それぞれの字体に対応した辞
書を指定したり、帳票の特定領域に、予め取り決められ
た共通の字体(たとえばJISOCR−B)を用いて印
字字体の種別を示す識別情報を印刷しておき、通常の読
み取り動作に先立って当該識別情報を読み取ることによ
り、対象の帳票に印字されている字体の種別を装置に認
識させるなどの方法が採られている。
ところが、上記の従来技術において、読み取り対象文字
が手書き文字の場合、記入者が不特定多数のときには、
書き方規則の遵守を記入者全員に徹底することは実際上
不可能であり、個々の記入者独特の癖などによる前述の
ような読み取り不能文字が多発することは避けられない
という問題がある。
が手書き文字の場合、記入者が不特定多数のときには、
書き方規則の遵守を記入者全員に徹底することは実際上
不可能であり、個々の記入者独特の癖などによる前述の
ような読み取り不能文字が多発することは避けられない
という問題がある。
また、読み取り対象が活字文字の場合には、個々の字体
毎に予め多数のパターン辞書を作戒・登録する必要があ
るとともに、実際の読み取り処理に際しては、対応した
辞書を指定しなければならず、さらに、複数の帳票を各
字体毎に仕分けする必要があるなど、読み取り処理全体
の作業が煩雑になるという問題があった。
毎に予め多数のパターン辞書を作戒・登録する必要があ
るとともに、実際の読み取り処理に際しては、対応した
辞書を指定しなければならず、さらに、複数の帳票を各
字体毎に仕分けする必要があるなど、読み取り処理全体
の作業が煩雑になるという問題があった。
このような問題の対策として、たとえば、特開昭53−
81586号公報に開示されているように、曖昧な文字
データについては、過去の履歴を用いて判定する技術が
知られているが、当該技術では、操作者の介入を前提と
しており、種々の帳票の円滑な読み取り作業の遂行は困
難であるという問題がある。
81586号公報に開示されているように、曖昧な文字
データについては、過去の履歴を用いて判定する技術が
知られているが、当該技術では、操作者の介入を前提と
しており、種々の帳票の円滑な読み取り作業の遂行は困
難であるという問題がある。
そこで、本発明の目的は、不特定多数の記入者や印字装
置などによって記入されたされた手書き文字や活字など
を精度良く読み取ることが可能な文字認識技術を提供す
ることにある。
置などによって記入されたされた手書き文字や活字など
を精度良く読み取ることが可能な文字認識技術を提供す
ることにある。
本発明の前記ならびにその他の目的と新規な特徴は、本
明細書の記述および添付図面から明らかになるであろう
。
明細書の記述および添付図面から明らかになるであろう
。
本願において開示される発明のうち、代表的なものの概
要を簡単に説明すれば、下記のとおりである。
要を簡単に説明すれば、下記のとおりである。
すなわち、本発明になる文字認識方式は、複数種の印字
装置によって印字された文字または複数の記入者による
手書き文字を読み取る文字XR R方法であって、複数
の文字の各々の認識経過情報および認識結果を所望の印
字単位または記入単位毎に保持し、&ffm結果が不確
定の任意の文字の認識結果を、同じ印字単位または記入
単位に属する他の文字の認識経過情報および認識結果に
基づいて確定するようにしたものである。
装置によって印字された文字または複数の記入者による
手書き文字を読み取る文字XR R方法であって、複数
の文字の各々の認識経過情報および認識結果を所望の印
字単位または記入単位毎に保持し、&ffm結果が不確
定の任意の文字の認識結果を、同じ印字単位または記入
単位に属する他の文字の認識経過情報および認識結果に
基づいて確定するようにしたものである。
上記した本発明の文字認識方式によれば、たとえば、第
1の辞書部と比較することによって、読み取られた1文
字が、特定のカテゴリコードと1対1に対応するか否か
の認識結果を判別し、カテゴリコードが不確定の文字に
ついては、さらに、第2の辞書部を用いて、当該1文字
が複数のカテゴリコードのいずれかに対応する可能性の
ある曖昧な文字か否か判定する処理を、同一の印字装置
または記入者によって記入されたフィールド単位または
帳票単位に実施するとともに、判定結果を当該フィール
ド単位または帳票単位に第1の手段に保持する。
1の辞書部と比較することによって、読み取られた1文
字が、特定のカテゴリコードと1対1に対応するか否か
の認識結果を判別し、カテゴリコードが不確定の文字に
ついては、さらに、第2の辞書部を用いて、当該1文字
が複数のカテゴリコードのいずれかに対応する可能性の
ある曖昧な文字か否か判定する処理を、同一の印字装置
または記入者によって記入されたフィールド単位または
帳票単位に実施するとともに、判定結果を当該フィール
ド単位または帳票単位に第1の手段に保持する。
そして、複数のカテゴリコードのいずれかに対応する可
能性のある曖昧な文字の複数のカテゴリコードについて
、第1の手段にフィールド単位または帳票単位に第lの
手段に保持された他の確定した文字のカテゴリコードに
一致するものがあるか否かを調べ、存在する場合には、
一致した当該カテゴリコードを捨てて、(すなわち当該
カテゴリコードに対応する文字パターンは他の文字に対
応することが他の文字の判定結果から判明しているので
)他のカテゴリコードを確定した認識結果として採用す
る。
能性のある曖昧な文字の複数のカテゴリコードについて
、第1の手段にフィールド単位または帳票単位に第lの
手段に保持された他の確定した文字のカテゴリコードに
一致するものがあるか否かを調べ、存在する場合には、
一致した当該カテゴリコードを捨てて、(すなわち当該
カテゴリコードに対応する文字パターンは他の文字に対
応することが他の文字の判定結果から判明しているので
)他のカテゴリコードを確定した認識結果として採用す
る。
これにより、たとえば、個々の印字装置の字体に対応し
た複数の辞書を容易したり、個々の記入者の癖などの惑
わされることなく、不特定多数の記入者や印字装置など
によって記入された手書き文字や活字などを精度良く読
み取ることができる。
た複数の辞書を容易したり、個々の記入者の癖などの惑
わされることなく、不特定多数の記入者や印字装置など
によって記入された手書き文字や活字などを精度良く読
み取ることができる。
以下、本発明の一実施例である文字認識方式の一例につ
いて、図面を参照しながら詳細に説明する。
いて、図面を参照しながら詳細に説明する。
第1図は、本実施例の文字認識方式が実施される文字認
識装置の4ii或の一例を示すブロック図であり、第2
図および第3図は、その要部の一例をさらに詳細に示す
図、さらに第4図は、読み取り処理の対象となる帳票の
一例を示す図である。
識装置の4ii或の一例を示すブロック図であり、第2
図および第3図は、その要部の一例をさらに詳細に示す
図、さらに第4図は、読み取り処理の対象となる帳票の
一例を示す図である。
本実施例の文字認識装置は、第4図に示される帳票など
から、一つの文字パターンを切り出して取り込む文字切
り出し部1lと、切り出された1文字を認識する認識部
■2と、当該認識部l2によって参照される標準パター
ンが格納されている辞書部13と、認識結果を出力する
出力部17と、前記各部を統轄して制御する制御部l8
とを備えている。
から、一つの文字パターンを切り出して取り込む文字切
り出し部1lと、切り出された1文字を認識する認識部
■2と、当該認識部l2によって参照される標準パター
ンが格納されている辞書部13と、認識結果を出力する
出力部17と、前記各部を統轄して制御する制御部l8
とを備えている。
前記辞書部13には、たとえば第2図に示されるように
、複数の標準となる文字の標準パターン13bと、当該
標準パターン13bに1対1に対応するカテゴリコード
13cとが対応付けられて格納されており、各々の組に
パターン番号13aを付与して管理している。
、複数の標準となる文字の標準パターン13bと、当該
標準パターン13bに1対1に対応するカテゴリコード
13cとが対応付けられて格納されており、各々の組に
パターン番号13aを付与して管理している。
この場合、前記認識部12には、前記辞書部13ととも
に候補辞書部14が接続されて随時参照されるようにな
っている。
に候補辞書部14が接続されて随時参照されるようにな
っている。
すなわち、この候補辞書部14は、たとえば第3図に示
されるように、“1”と″7″あるいは“0”と“6″
などのように、手書き文字では1文字を見ただけでは一
意的な判読が困難になる可能性のある標準パターン14
bと、当該標準パターン14bに対応する可能性の高い
複数のカテゴリコード14cと、当該カテゴリコード1
4cに対応する辞書部13の複数のパターン番号13a
からなる判定用パターン番号14dとを、パターン番号
14aを付与して管理する構造となっている。
されるように、“1”と″7″あるいは“0”と“6″
などのように、手書き文字では1文字を見ただけでは一
意的な判読が困難になる可能性のある標準パターン14
bと、当該標準パターン14bに対応する可能性の高い
複数のカテゴリコード14cと、当該カテゴリコード1
4cに対応する辞書部13の複数のパターン番号13a
からなる判定用パターン番号14dとを、パターン番号
14aを付与して管理する構造となっている。
なお、第l図では、説明を判りやすくするため、辞書部
13と候補辞書部14とを独立に図示しているが、同一
の記憶媒体の中に共存するように構威してもよいことは
言うまでもない。
13と候補辞書部14とを独立に図示しているが、同一
の記憶媒体の中に共存するように構威してもよいことは
言うまでもない。
さらに、本実施例の場合には、認識部12による辞書部
13および候補辞書部14などの参照によって得られる
後述のような認識経過が格納される結果情報格納部l5
と、当該結果情報格納部l5に保持されている情報に基
づいて、後述のような手順により、当該認識部12によ
る認識結果を修正する結果修正部16とを備えている。
13および候補辞書部14などの参照によって得られる
後述のような認識経過が格納される結果情報格納部l5
と、当該結果情報格納部l5に保持されている情報に基
づいて、後述のような手順により、当該認識部12によ
る認識結果を修正する結果修正部16とを備えている。
結果情報格納部l5には、たとえば第5図(a)および
(b)などに示されるように、個々の読み取り文字毎に
、該当するパターンが前記の辞書部13または候補辞書
部14に存在するか否かを示す文字読み取り情報15a
と、いずれかに存在した場合のパターン番号情報15b
(パターン番号13aまたは14a)と、対応するカテ
ゴリコード情報15C (カテゴリコード13cまたは
14c〉とが対応付けられて格納されるようになってい
る。
(b)などに示されるように、個々の読み取り文字毎に
、該当するパターンが前記の辞書部13または候補辞書
部14に存在するか否かを示す文字読み取り情報15a
と、いずれかに存在した場合のパターン番号情報15b
(パターン番号13aまたは14a)と、対応するカテ
ゴリコード情報15C (カテゴリコード13cまたは
14c〉とが対応付けられて格納されるようになってい
る。
結果情報格納部I5の文字読み取り情報15aには、当
該読み取り文字と同じ標準パターンが、辞書部l3に見
出され、カテゴリコード14cが一意に決定した場合に
“0“がセットされ、一方、辞書部l3にはなく、候補
辞書部14に見出された場合には、“1”がセ−/ }
され、辞書部l3および候補辞書部14のいずれにも見
出されなかった場合には、認識不能を示す“2″がセッ
トされる。
該読み取り文字と同じ標準パターンが、辞書部l3に見
出され、カテゴリコード14cが一意に決定した場合に
“0“がセットされ、一方、辞書部l3にはなく、候補
辞書部14に見出された場合には、“1”がセ−/ }
され、辞書部l3および候補辞書部14のいずれにも見
出されなかった場合には、認識不能を示す“2″がセッ
トされる。
以下、上述のような構戊の本実施例の文字認識装置にお
ける文字認識方式の作用の一例を、第6図〜第8図に示
されるフローチャートなどを参照しtよから説明する。
ける文字認識方式の作用の一例を、第6図〜第8図に示
されるフローチャートなどを参照しtよから説明する。
読み取り処理の対象となる帳票20には、第4図に示さ
れるように、フィールド番号#1〜#3が付与された複
数のフィールド20a.フィールド20b.フィールド
20Cが設けられており、フィールド番号#1および#
2のフィールド20aおよび20bには、それぞれ手書
き文字31〜手書き文字36および手書き文字37およ
り手書き文字40が記入されている。
れるように、フィールド番号#1〜#3が付与された複
数のフィールド20a.フィールド20b.フィールド
20Cが設けられており、フィールド番号#1および#
2のフィールド20aおよび20bには、それぞれ手書
き文字31〜手書き文字36および手書き文字37およ
り手書き文字40が記入されている。
まず、帳票20が図示しないイメージスキャナなどの読
み取り部によって読み取られ、フィールド20aおよび
20bの領域の切り出しを行う(ステップ100)っ 次に、文字切り出し部11は、前記読み取り部から到来
するフィールド20aおよび20bのイメージパターン
から、1文字毎の文字パターンを順次切り出して認識部
12に送出する(ステップ200)。
み取り部によって読み取られ、フィールド20aおよび
20bの領域の切り出しを行う(ステップ100)っ 次に、文字切り出し部11は、前記読み取り部から到来
するフィールド20aおよび20bのイメージパターン
から、1文字毎の文字パターンを順次切り出して認識部
12に送出する(ステップ200)。
認識部12は、後述のようにして、順次到来する読み取
り文字(手書き文字31〜40)の文字パターンを1文
字毎に認識する〈ステップ300)。
り文字(手書き文字31〜40)の文字パターンを1文
字毎に認識する〈ステップ300)。
すなわち、認識部12は文字切り出し部11から到来す
る1文字分の文字パターンを、まず辞書部13の標準パ
ターン13bと照合しくステップ301)、一致する標
準パターン13bが辞書部13に存在するか否かを判定
する(ステップ302)。
る1文字分の文字パターンを、まず辞書部13の標準パ
ターン13bと照合しくステップ301)、一致する標
準パターン13bが辞書部13に存在するか否かを判定
する(ステップ302)。
そして、一致する標準パターン13bが辞書部13に存
在する場合には、結果情報格納部l5のパターン番号情
報15bおよびカテゴリコード情報15cに、一致した
標準パターン13bのパターン番号13aおよびカテゴ
リコード13Cをそれぞれ格納し(ステップ303)、
さらに、文字読み取り情報15aに、“0” (カテゴ
リコードが一意に確走)をセットする(ステップ304
〉。
在する場合には、結果情報格納部l5のパターン番号情
報15bおよびカテゴリコード情報15cに、一致した
標準パターン13bのパターン番号13aおよびカテゴ
リコード13Cをそれぞれ格納し(ステップ303)、
さらに、文字読み取り情報15aに、“0” (カテゴ
リコードが一意に確走)をセットする(ステップ304
〉。
一方、ステップ302において一致する標準パターン+
3bが辞書部13に存在しな5)と判定された場合には
、候補辞書部l4の,標準パターン14bと照合し(ス
テップ305)、一致する標準パターン14bが存在す
るか否かを判定し(ステップ3 0 6) 、一致する
標準パターン]. 4 bが存在した場合には、結果情
報格納部15のパターン番号情報15bおよびカテゴリ
コード情報15cに、一致した標準パターン14bのパ
ターン番号14aおよびカテゴリコード14cをそれぞ
れ格納し(ステップ308)、さらに、文字読み取り情
報15aに、“1” (複数のカテゴリコードの候補有
り)をセットする(ステップ309)。
3bが辞書部13に存在しな5)と判定された場合には
、候補辞書部l4の,標準パターン14bと照合し(ス
テップ305)、一致する標準パターン14bが存在す
るか否かを判定し(ステップ3 0 6) 、一致する
標準パターン]. 4 bが存在した場合には、結果情
報格納部15のパターン番号情報15bおよびカテゴリ
コード情報15cに、一致した標準パターン14bのパ
ターン番号14aおよびカテゴリコード14cをそれぞ
れ格納し(ステップ308)、さらに、文字読み取り情
報15aに、“1” (複数のカテゴリコードの候補有
り)をセットする(ステップ309)。
前記ステップ306における判定で一致する標準パター
ン14bが存在しないと判定された場合には、結果情報
格納部l5の文字読み取り情報15aに“2” (認識
不能)をセットする(ステップ307)。
ン14bが存在しないと判定された場合には、結果情報
格納部l5の文字読み取り情報15aに“2” (認識
不能)をセットする(ステップ307)。
そして、上記のステップ200〜ステップ300の一連
の処理をフィールド20aおよび2Ob内の全手書き文
字31〜40について行わせ(ステップ400)、結果
情報格納部15に対応する前述のような文字読み取り情
報15a1パターン番号情報15b,カテゴリコード情
報15cからなる個々の文字の読み取り結果312〜読
み取り結果40aを格納した後、認識部12から結果修
正部16に制御を移す。
の処理をフィールド20aおよび2Ob内の全手書き文
字31〜40について行わせ(ステップ400)、結果
情報格納部15に対応する前述のような文字読み取り情
報15a1パターン番号情報15b,カテゴリコード情
報15cからなる個々の文字の読み取り結果312〜読
み取り結果40aを格納した後、認識部12から結果修
正部16に制御を移す。
この時の結果情報格納部15の状態の一例を示したもの
が第5図(a)である。
が第5図(a)である。
結果修正部l6は、まず結果情報格納部15から、文字
読み取り情報15aが”1″の文字の読み取り結果を選
出する(ステップ501)。
読み取り情報15aが”1″の文字の読み取り結果を選
出する(ステップ501)。
たとえば、選出された読み取り結果33aの場合には、
当該文字に対応するカテゴリコード情報15Cに格納さ
れているmmのカテゴリコード14c(カテゴリコード
1および7)の一方(たとえばカテゴリコード1)が、
他の読み取り結果3la,32a,34a〜40aの中
に存在するか否かを調べる(ステップ502)。
当該文字に対応するカテゴリコード情報15Cに格納さ
れているmmのカテゴリコード14c(カテゴリコード
1および7)の一方(たとえばカテゴリコード1)が、
他の読み取り結果3la,32a,34a〜40aの中
に存在するか否かを調べる(ステップ502)。
そして、存在すると判明した場合には(この場合、手書
き文字31の読み取り結果31aが該当している)、対
応するパターン番号情報15bに保持されているパター
ン番号201を求め、候補辞書部14の判定用パターン
番号14dの中に、当該パターン番号201が存在する
か否かを調べる。
き文字31の読み取り結果31aが該当している)、対
応するパターン番号情報15bに保持されているパター
ン番号201を求め、候補辞書部14の判定用パターン
番号14dの中に、当該パターン番号201が存在する
か否かを調べる。
この場合、候補辞書部14のパターン番号300に対応
する判定用パターン番号14dの中に、パターン番号2
01が存在するので、当該読み取り拮果33aをもつ文
字のカテゴリコードは、カテゴリコード情報15cに保
持されている他方のカテゴリコード7と決定し、探索に
用いたカテゴリコードIを捨てる(ステップ503)。
する判定用パターン番号14dの中に、パターン番号2
01が存在するので、当該読み取り拮果33aをもつ文
字のカテゴリコードは、カテゴリコード情報15cに保
持されている他方のカテゴリコード7と決定し、探索に
用いたカテゴリコードIを捨てる(ステップ503)。
すなわち、上記の例の場合には、“1″であるか“7″
であるかを単独では判定できない手書き文字33に対し
て、同一記人者が記入したフィールド20aおよび2O
b内に、当該手書き文字33とは明らかに異なる手書き
文字31 (文字パターン)により、“l”という文字
(カテゴリコードl)が記入されており、従って、現在
判定対象の手書き文字33を、“7” (カテゴリコー
ド7)と決定することができる。
であるかを単独では判定できない手書き文字33に対し
て、同一記人者が記入したフィールド20aおよび2O
b内に、当該手書き文字33とは明らかに異なる手書き
文字31 (文字パターン)により、“l”という文字
(カテゴリコードl)が記入されており、従って、現在
判定対象の手書き文字33を、“7” (カテゴリコー
ド7)と決定することができる。
なお、同様に、フィールド20cの場合には判定が逆に
なり、先頭に位置する手書き文字41 (“1”)は、
当該手書き文字41 (“1″)とは明らかに異なる手
書き文字43(“7”)の出現によって、“1” {カ
テゴリコードl}と判定されることになる。
なり、先頭に位置する手書き文字41 (“1”)は、
当該手書き文字41 (“1″)とは明らかに異なる手
書き文字43(“7”)の出現によって、“1” {カ
テゴリコードl}と判定されることになる。
こうして、結果情報格納部15のカテゴリコード情報1
5cの複数のカテゴリコードのうちの一方にカテゴリコ
ードが確定した読み取り結果33aの文字読み取り情報
L5aを“1″ (複数候補有り)から“0″ (確定
)に変える(ステノブ504)。
5cの複数のカテゴリコードのうちの一方にカテゴリコ
ードが確定した読み取り結果33aの文字読み取り情報
L5aを“1″ (複数候補有り)から“0″ (確定
)に変える(ステノブ504)。
そして、同一記入者によるフィールド20aおよび20
bの手書き文字31〜40の全てについて、上述の一連
の処理が完了したか否かを判定し(ステップ505)、
結果情報格納115における文字読み取り情報15aが
“1”の文字すべてについて上記の処理を施す。
bの手書き文字31〜40の全てについて、上述の一連
の処理が完了したか否かを判定し(ステップ505)、
結果情報格納115における文字読み取り情報15aが
“1”の文字すべてについて上記の処理を施す。
一方、前記ステップ502において、カテゴリコード情
報15cの複数のカテゴリコードのどれも、他の文字読
み取り情報15aが“0”の文字のカテゴリコードに一
致するものがないと判定された場合には、結果情報格納
部15の当該文字に関する読み取り情報15aを“1”
(複数候補有り)から“2″ (認識不能)に変える
{ステップ506}。
報15cの複数のカテゴリコードのどれも、他の文字読
み取り情報15aが“0”の文字のカテゴリコードに一
致するものがないと判定された場合には、結果情報格納
部15の当該文字に関する読み取り情報15aを“1”
(複数候補有り)から“2″ (認識不能)に変える
{ステップ506}。
その後、当該帳票内の全フィールドについて、上述のよ
うな一連の認識および認識結果の修正処理が完了したか
否かを調べ(ステップ600)、いまだ、読み取り処理
が行われていないフィールドが存在する場合には、前記
ステップ100に戻って、前述のような処理を繰り返す
。
うな一連の認識および認識結果の修正処理が完了したか
否かを調べ(ステップ600)、いまだ、読み取り処理
が行われていないフィールドが存在する場合には、前記
ステップ100に戻って、前述のような処理を繰り返す
。
このような処理により、結果情報格納部15の内容は、
第5図(a)の状態から同図ら)に示される状態となり
、修正後の当該図(ロ)における個々の文字のカテゴリ
コード情報15cを、最終的な認識結果として出力部1
7に出力する。
第5図(a)の状態から同図ら)に示される状態となり
、修正後の当該図(ロ)における個々の文字のカテゴリ
コード情報15cを、最終的な認識結果として出力部1
7に出力する。
また、すべてのフィールドについて読み取り処理が完了
している場合には、当該帳票に対する読み取り処理を林
了する。
している場合には、当該帳票に対する読み取り処理を林
了する。
このように、本実施例の文字認識方式によれば、同一の
記入者や印字装置などによる文字群の中に、当該記入者
の個性や印字装置に特有の字体などによって、単独では
判読が困難な文字が混在する場合でも、すでにK7j
aQk結果が確定している類似の文字パターンに関する
カテゴリコードやパターン番号などに基づいて、辞書8
13および候補辞書部14などを適宜参照することで、
当該文字の認識結果(カテゴリコード)を精度良く確定
することができる。
記入者や印字装置などによる文字群の中に、当該記入者
の個性や印字装置に特有の字体などによって、単独では
判読が困難な文字が混在する場合でも、すでにK7j
aQk結果が確定している類似の文字パターンに関する
カテゴリコードやパターン番号などに基づいて、辞書8
13および候補辞書部14などを適宜参照することで、
当該文字の認識結果(カテゴリコード)を精度良く確定
することができる。
この結果、記入者に対して特定の記入字体の規則の遵守
を徹底したり、認識時に参照される辞書を複数容易した
り、特定の辞書を指定したり、さらには多数の帳票を各
活字の字体や記入者毎に仕分けるなどのような、従来で
は必須となっていた煩雑な配慮や作業が不要となり、多
数の帳票の読み取り作業の作業効率を大幅に向上させる
ことができる。
を徹底したり、認識時に参照される辞書を複数容易した
り、特定の辞書を指定したり、さらには多数の帳票を各
活字の字体や記入者毎に仕分けるなどのような、従来で
は必須となっていた煩雑な配慮や作業が不要となり、多
数の帳票の読み取り作業の作業効率を大幅に向上させる
ことができる。
以上本発明者によってなされた発明を実施例に基づき具
体的に説明したが、本発明は前記実施例に限定されるも
のではなく、その要旨を逸脱しない範囲で種々変更可能
であることはいうまでもない。
体的に説明したが、本発明は前記実施例に限定されるも
のではなく、その要旨を逸脱しない範囲で種々変更可能
であることはいうまでもない。
たとえば、文字認識装置の全体構或としては、前記実施
例中に例示されたものに限らず、同様の作用を実現でき
るものであれば、他の構或であってもよいことは言うま
でもない。
例中に例示されたものに限らず、同様の作用を実現でき
るものであれば、他の構或であってもよいことは言うま
でもない。
本願において開示される発明のうち、代表的なものによ
って得られる効果を簡単に説明すれば、以下のとおりで
ある。
って得られる効果を簡単に説明すれば、以下のとおりで
ある。
すなわち、本発明の文字認識方式によれば、複数種の印
字装置によって印字された文字または複数の記入者によ
る手書き文字を読み取る文字認識方法であって、複数の
文字の各々の認識経過情報および認識結果を所望の印字
単位または記入単位毎に保持し、前記認識結果が不確定
の任意の文字の認識結果を、同じ前記印字単位または記
入単位に属する他の文字の認識経過情報および認識結果
に基づいて確定するので、たとえば、第1の辞書部と比
較することによって、読み取られた1文字が、特定のカ
テゴリコードと1対1に対応するか否かの認識結果を判
別し、カテゴリコードが不確定の文字については、さら
に、第2の辞書部を用いて、当該1文字が複数のカテゴ
リコードのいずれかに対応する可能性のある曖昧な文字
か否か判定する処理を、同一の印字装置または記入者に
よって記入されたフィールド単位または帳票単位に実施
するとともに、判定結果を当該フィールド単位または帳
票単位に第1の手段に保持し、複数のカテゴリコードの
いずれかに対応する可能性のある曖昧な文字の複数のカ
テゴリコードについて、第lの手段にフィールド単位ま
たは帳票単位に第1の手段に保持された他の確定した文
字のカテゴリコードに一致するものがあるか否かをしら
べ、存在する場合には、一致した当該カテゴリコードを
捨てて、(すなわち当該カテゴリコードに対応する文字
パターンは他の文字に対応することが他の文字の判定結
果から判明しているので)他のカテゴリコードを確定結
果として採用することにより、たとえば、個々の印字装
置の字体に対応した複数の辞書を容易したり、個々の記
入者の癖などの惑わされることなく、不特定多数の記入
者や印字装置などによって記入されたされた手書き文字
や活字などを精度良く読み取ることができる。
字装置によって印字された文字または複数の記入者によ
る手書き文字を読み取る文字認識方法であって、複数の
文字の各々の認識経過情報および認識結果を所望の印字
単位または記入単位毎に保持し、前記認識結果が不確定
の任意の文字の認識結果を、同じ前記印字単位または記
入単位に属する他の文字の認識経過情報および認識結果
に基づいて確定するので、たとえば、第1の辞書部と比
較することによって、読み取られた1文字が、特定のカ
テゴリコードと1対1に対応するか否かの認識結果を判
別し、カテゴリコードが不確定の文字については、さら
に、第2の辞書部を用いて、当該1文字が複数のカテゴ
リコードのいずれかに対応する可能性のある曖昧な文字
か否か判定する処理を、同一の印字装置または記入者に
よって記入されたフィールド単位または帳票単位に実施
するとともに、判定結果を当該フィールド単位または帳
票単位に第1の手段に保持し、複数のカテゴリコードの
いずれかに対応する可能性のある曖昧な文字の複数のカ
テゴリコードについて、第lの手段にフィールド単位ま
たは帳票単位に第1の手段に保持された他の確定した文
字のカテゴリコードに一致するものがあるか否かをしら
べ、存在する場合には、一致した当該カテゴリコードを
捨てて、(すなわち当該カテゴリコードに対応する文字
パターンは他の文字に対応することが他の文字の判定結
果から判明しているので)他のカテゴリコードを確定結
果として採用することにより、たとえば、個々の印字装
置の字体に対応した複数の辞書を容易したり、個々の記
入者の癖などの惑わされることなく、不特定多数の記入
者や印字装置などによって記入されたされた手書き文字
や活字などを精度良く読み取ることができる。
第1rI!Jは、本発明の一実施例である文字認識方式
が実施される文字認識装置の構或の一例を示すブロック
図、 第2図は、その要部の一例をさらに詳細に示す図、 第3図は、同じくその要部の一例をさらに詳細に示す図
、 第4図は、読み取り処理の対象となる帳票の一例を示す
図、 第5図(a)および(b)は、拮果情報格納部の状態の
移り変わりの一例を説明する図、 第6図は、本発明の一実施例である文字認識方式の作用
の一例を示すフローチャート、第7図は、同じく、その
作用の一部をさらに詳細に税明するフローチャート、 第8図は、同じく、その作用の一部をさらに詳細に説明
するフローチャートである。 11・・・文字切り出し部、12・・・認識部、13・
・・辞書部、13a・・・バクーン番号、13b・・・
標準パターン、13C・・ ・カテコリコード、14・
・・候補辞書部、14a・・・パターン番号、14b・
・・I l パターン、l4C・・・カテゴリコード、
14d・・・判定用パターン番号、15・・・結果情報
格納部、15a・・・読み取り情報、15a・・・文字
読み取り情報、15b・・・パターン番号情報、15c
・・・カテゴリコード情報、16・・・結果修正部、1
7・・・出力部、18・・・制御部、20・・・帳票、
20a〜20c・・・フィールド、31〜40.41〜
45・・・手書き文字、31a〜40a・・・読み取り
結果、100〜600・・・文字認識方式の作用の一例
を説明する処理ステップ、301〜309・・・認識情
報のバッファリング動作の一例を示す処理ステップ、5
01〜506・・・認識結果が保留の文字の結果修正動
作の一例を示す処理ステップ。
が実施される文字認識装置の構或の一例を示すブロック
図、 第2図は、その要部の一例をさらに詳細に示す図、 第3図は、同じくその要部の一例をさらに詳細に示す図
、 第4図は、読み取り処理の対象となる帳票の一例を示す
図、 第5図(a)および(b)は、拮果情報格納部の状態の
移り変わりの一例を説明する図、 第6図は、本発明の一実施例である文字認識方式の作用
の一例を示すフローチャート、第7図は、同じく、その
作用の一部をさらに詳細に税明するフローチャート、 第8図は、同じく、その作用の一部をさらに詳細に説明
するフローチャートである。 11・・・文字切り出し部、12・・・認識部、13・
・・辞書部、13a・・・バクーン番号、13b・・・
標準パターン、13C・・ ・カテコリコード、14・
・・候補辞書部、14a・・・パターン番号、14b・
・・I l パターン、l4C・・・カテゴリコード、
14d・・・判定用パターン番号、15・・・結果情報
格納部、15a・・・読み取り情報、15a・・・文字
読み取り情報、15b・・・パターン番号情報、15c
・・・カテゴリコード情報、16・・・結果修正部、1
7・・・出力部、18・・・制御部、20・・・帳票、
20a〜20c・・・フィールド、31〜40.41〜
45・・・手書き文字、31a〜40a・・・読み取り
結果、100〜600・・・文字認識方式の作用の一例
を説明する処理ステップ、301〜309・・・認識情
報のバッファリング動作の一例を示す処理ステップ、5
01〜506・・・認識結果が保留の文字の結果修正動
作の一例を示す処理ステップ。
Claims (1)
- 【特許請求の範囲】 1、複数種の印字装置によって印字された文字または複
数の記入者による手書き文字を読み取る文字認識方法で
あって、複数の文字の各々の認識経過情報および認識結
果を所望の印字単位または記入単位毎に保持し、前記認
識結果が不確定の任意の文字の認識結果を、同じ前記印
字単位または記入単位に属する他の文字の認識経過情報
および認識結果に基づいて確定することを特徴とする文
字認識方式。 2、一つの文字パターンと対応するカテゴリコードとを
1対1に対応付けて保持する第1の辞書部と、一つの文
字パターンに対して、当該文字パターンに適合する可能
性のある複数のカテゴリコードとを対応付けて保持する
第2の辞書部と、読み取られた文字パターンと前記第1
および第2の辞書部の少なくとも一方と比較して得られ
る認識経過情報および認識結果を、所望の印字単位また
は記入単位毎に保持する第1の手段と、前記認識結果が
不確定の任意の文字の認識結果を、同じ前記印字単位ま
たは記入単位に属する他の文字の認識経過情報および認
識結果に基づいて確定する第2の手段とを備えたことを
特徴とする請求項1記載の文字認識方式。 3、前記印字単位または記入単位が、同一の前記印字装
置または記入者によって印字または記入が行われる個々
のフィールドまたは帳票である請求項1記載の文字認識
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1302564A JP2529421B2 (ja) | 1989-11-21 | 1989-11-21 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1302564A JP2529421B2 (ja) | 1989-11-21 | 1989-11-21 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03163681A true JPH03163681A (ja) | 1991-07-15 |
JP2529421B2 JP2529421B2 (ja) | 1996-08-28 |
Family
ID=17910496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1302564A Expired - Lifetime JP2529421B2 (ja) | 1989-11-21 | 1989-11-21 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2529421B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002207965A (ja) * | 2001-01-12 | 2002-07-26 | Nippon Digital Kenkyusho:Kk | 帳票又は原稿の文字相等性判定方法、記入者同一性判定方法、文字認識装置及び文字相等性判定プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53135524A (en) * | 1977-05-02 | 1978-11-27 | Hitachi Ltd | Judging method for reading chracters |
JPS5638685A (en) * | 1979-09-05 | 1981-04-13 | Mitsubishi Electric Corp | Character recognizing system |
JPS59121479A (ja) * | 1982-12-27 | 1984-07-13 | Casio Comput Co Ltd | 文字認識装置 |
JPS62251986A (ja) * | 1986-04-25 | 1987-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 誤読文字訂正処理装置 |
JPS63216189A (ja) * | 1987-03-04 | 1988-09-08 | Sharp Corp | 文字認識方法 |
-
1989
- 1989-11-21 JP JP1302564A patent/JP2529421B2/ja not_active Expired - Lifetime
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53135524A (en) * | 1977-05-02 | 1978-11-27 | Hitachi Ltd | Judging method for reading chracters |
JPS5638685A (en) * | 1979-09-05 | 1981-04-13 | Mitsubishi Electric Corp | Character recognizing system |
JPS59121479A (ja) * | 1982-12-27 | 1984-07-13 | Casio Comput Co Ltd | 文字認識装置 |
JPS62251986A (ja) * | 1986-04-25 | 1987-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 誤読文字訂正処理装置 |
JPS63216189A (ja) * | 1987-03-04 | 1988-09-08 | Sharp Corp | 文字認識方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002207965A (ja) * | 2001-01-12 | 2002-07-26 | Nippon Digital Kenkyusho:Kk | 帳票又は原稿の文字相等性判定方法、記入者同一性判定方法、文字認識装置及び文字相等性判定プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2529421B2 (ja) | 1996-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4771385A (en) | Word recognition processing time reduction system using word length and hash technique involving head letters | |
US5161245A (en) | Pattern recognition system having inter-pattern spacing correction | |
US6038351A (en) | Apparatus and method for multi-entity, mixed document environment document identification and processing | |
EP0657840A2 (en) | Method of, and apparatus for, character recognition through related spelling heuristics | |
US4860376A (en) | Character recognition system for optical character reader | |
JPS63182793A (ja) | 文字切り出し方式 | |
JPH0520500A (ja) | 文書認識装置 | |
JPH03163681A (ja) | 文字認識装置 | |
JPH06124366A (ja) | 住所読取装置 | |
JPS6262388B2 (ja) | ||
JPH06103402A (ja) | 名刺認識装置 | |
JP2784004B2 (ja) | 文字認識装置 | |
JP3138665B2 (ja) | 手書き文字認識方式および記録媒体 | |
JPH06251187A (ja) | 文字認識誤り修正方法及び装置 | |
JPS6330991A (ja) | 文字認識装置 | |
JPH041882A (ja) | 文字認識方法およびその装置 | |
JPS6336487A (ja) | 文字読取方式 | |
JPH0318987A (ja) | 辞書登録方法 | |
JPH0338787A (ja) | 文字認識処理装置 | |
JPH04109379A (ja) | Ocrシステム | |
JPS6174087A (ja) | 単語読み取り装置 | |
JPS5953986A (ja) | 文字認識装置 | |
JPH11232393A (ja) | 文字認識装置 | |
JPS6389990A (ja) | 文字読取装置 | |
JPH06236454A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080614 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080614 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090614 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100614 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100614 Year of fee payment: 14 |