JPH1097593A - 名刺認識装置及び文字認識装置 - Google Patents

名刺認識装置及び文字認識装置

Info

Publication number
JPH1097593A
JPH1097593A JP8271283A JP27128396A JPH1097593A JP H1097593 A JPH1097593 A JP H1097593A JP 8271283 A JP8271283 A JP 8271283A JP 27128396 A JP27128396 A JP 27128396A JP H1097593 A JPH1097593 A JP H1097593A
Authority
JP
Japan
Prior art keywords
character
recognition
business card
error rate
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8271283A
Other languages
English (en)
Inventor
Satoru Handa
悟 半田
Tatsuya Nakamura
達哉 中村
Takao Maekawa
誉雄 前川
Ken Mukai
謙 向井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8271283A priority Critical patent/JPH1097593A/ja
Publication of JPH1097593A publication Critical patent/JPH1097593A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】名刺毎の文字認識において誤り率が一定値を越
えたもののみ確認及び修正を促すことにより高精度及び
短時間で文字を認識しうる名刺認識装置及び文字認識装
置を提供すること。 【解決手段】名刺の画像データの認識結果から認識誤り
率を算出する文字認識エンジン1と、氏名または会社名
等名刺の要素毎にその属する文字を識別して要素毎の要
素認識誤り率を算出する名刺データ認識エンジン13
と、各名刺単位の名刺認識誤り率を算出する名刺認識誤
り率算出手段20と、要素毎の認識結果と名刺認識誤り
率とを併せて格納する名刺認識結果格納手段22と、該
名刺認識誤り率が予め設定された名刺容認誤り率を上回
る誤り率の名刺データに対してのみ認識の確認及び修正
を促す名刺認識結果確認手段24とを備えたことを特徴
とし、名刺認識の確認及び修正作業を大きく短縮するこ
とができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、名刺等の画像デー
タを分析し文字コードに変換して認識の正誤を判別する
名刺認識装置及び文字認識装置に関する。
【0002】
【従来の技術】従来、例えば、自動的に文書を読み取り
修正して記憶手段に格納する文字認識装置の例として
は、図10に示すような名刺認識装置があった。図10
は従来の名刺認識装置の構成を示すブロック図である。
(尚、以下、名刺認識装置と指定してある場合でも文字
認識装置としての範疇にも入る。)まず、図10を参照
して、従来の名刺認識装置の構成について説明する。
【0003】図10において、31は名刺認識装置で読
み取るために名刺を台紙に添付した原稿、33は原稿3
1を読み取り読み取った画像イメージを文字コード等を
含む画像データ32に変換するデジタイズ手段、35は
入力した画像データ32から名刺部分に含まれている会
社名、氏名、電話番号など各要素または項目の要素デー
タ34を作成する要素データ作成手段、36は要素デー
タ34及び名刺を含む画像データ32を表示する表示装
置、37は要素データ34を表示装置36に表示させる
表示手段、38は表示装置36の表示画像データ32を
参照して要素データ34を修正することができる要素デ
ータ修正手段、40は要素データ修正手段38で修正し
た修正済要素データ39を格納する格納メモリである。
【0004】次に、図10を参照して、上記従来の名刺
認識装置の動作について説明する。まず、名刺を台紙に
添付して原稿31を作成し、デジタイズ手段33によっ
て読み取らせる。デジタイズ手段33は読み取った原稿
31を文字コード等を含む画像データ32に変換して、
要素データ作成手段35及び表示装置36に出力する。
要素データ作成手段35はデジタイズ手段33から得ら
れた画像データ32からその名刺部分に含まれている会
社名、氏名、電話番号、FAX番号など各要素区分内の
要素データ34を作成する。
【0005】そこで、表示手段37は要素データ作成手
段35において作成された各要素データ34を、例え
ば、図9に示すように構成して表示装置36に送る。表
示装置36はデジタイズ手段33から得られた画像デー
タ32と表示手段37からの要素データ34とを、例え
ば、図9に示すように表示し、操作者は表示された名刺
を含む画像データ32と各要素データ34とを見比べて
正誤判別する。要素データ34が正しければそのまま決
定キーを押し、誤りがあれば、例えば、キー入力などの
要素データ修正手段38により誤り部分を修正した後、
決定キーを押す。修正した修正済要素データ39は格納
メモリ40に格納される。
【0006】このように、従来の名刺認識装置において
は、読み取られた名刺の全文字または要素の出力された
認識結果についてチェックし、文字単位に認識の妥当性
を判断すると同時に、氏名及び住所等の要素として正確
に認識しているか否かを判定するようにしていた。従来
の名刺認識装置においても、読み取られた名刺文字の要
素データを修正して正しい要素データを作成し格納する
ことができる。
【0007】
【発明が解決しようとする課題】しかしながら、一般
に、従来の画像データからの文字認識においては、印刷
精度とか汚れ等の問題から、文字を確実に認識して文字
コードに変換することは困難であった。
【0008】そのため、従来の文字認識装置を使用した
場合、認識した結果の全てを画面上で確認し、元の画像
データと比較することによってその認識の正確性を確保
しなければならず、確実な認識結果を得るためには、全
文の目視による確認が必要であるという問題があった。
以上説明したように、名刺認識装置など文字認識装置に
おいては、従来から全文字を照合する手間を省き、かつ
高い認識精度が確保できる文字認識装置の開発が強く要
望されていた。
【0009】本発明は、上記従来の問題を解決するため
になされたもので、文字の認識における誤り率(文字認
識の難度)を算出し、誤り率が一定値を越えたもののみ
確認し修正することを促すことにより、全文字の認識結
果を確認することなく、また確認しなくとも高い精度で
文字を認識することができる文字認識装置を提供するこ
とを目的とする。
【0010】特に、名刺には特殊なロゴとか字体が多く
含まれているほか、会社名、部署名、役職等の配置が様
々であり、かすれとか汚れもあるため、名刺情報を正し
く認識して、文字データを氏名とか会社名等といった各
要素ごとに正しく変換することは困難であった。
【0011】そのため、従来の名刺認識装置において
は、認識した結果を画面上に表示して、操作者が認識を
実行した全ての名刺に対し、氏名とか会社名等といった
各要素ごとにその認識結果と画像データとを照合し、各
要素が正しく認識され、且つ全文字が正しい文字データ
に変換されているか否かを確認するようにしていた。す
なわち、従来の名刺認識装置においては、全要素の全て
の文字について、正しく認識したか否かにつき操作者が
目視により確認することが必要であるという問題があっ
た。
【0012】以上説明したように、名刺の認識におい
て、従来から名刺の全要素の全文字に対して確認する照
合の手間を省き、認識誤りの可能性がある要素または文
字のみを照合することにより、名刺データを正しく認識
したか否かを確認できる認識精度の高い名刺認識装置の
提供が強く要望されていた。
【0013】従って、本発明は、上記従来の問題を解決
するためになされたもので、1枚毎の名刺の認識におい
て誤り率(文字認識の難度)を算出し、誤り率が一定値
を越えたもののみ確認し修正することを促すことによ
り、名刺の全文字の認識結果を確認することなく、また
確認しなくとも高い精度で文字を認識することができる
名刺認識装置を提供することを目的とする。尚、以下、
名刺認識装置と指定してある場合でも文字認識装置とし
ての範疇にも入ることは明らかである。
【0014】
【課題を解決するための手段】本発明による文書認識装
置は、画像読み取り装置によって読み取られた画像デー
タを分析して文字データを認識し、文字コードに変換す
るとともに、文字認識の誤り率を算出する文字認識エン
ジンを備えるようにしたものである。
【0015】本発明によれば、文字認識の誤り率を算出
し、誤り率が一定値を越えたもののみ確認し修正するよ
うにしたことにより、文書の全文字の認識結果を確認し
なくとも(誤り率が一定値を越えないものの確認を省
略)高い精度で文字を認識することができる文書認識装
置が得られる。
【0016】また、本発明による文書認識装置は、前述
の文字認識エンジンと、文字認識エンジンから出力され
た文字コード及び文字認識誤り率を対として格納する文
字認識結果格納手段とを備えるようにしたものである。
【0017】本発明によれば、全ての文書を文字コード
に変換した後、一括して、誤り文字に対してのみ注目し
て文書文字の認識結果を確認及び修正することができる
文書認識装置が得られる。
【0018】また、本発明による文書認識装置は、前述
の文字認識エンジン及び文字認識結果格納手段のほか、
文字認識結果格納手段から文字コード及び文字認識誤り
率を読み出して文字コード列及び文字認識誤り率のデー
タ列として出力する認識結果読出手段と、読み出された
文字列を表示画面に表示するとともに、予め設定された
容認誤り率より高い誤り率の文字に対してのみ認識の確
認及び必要な修正を促す認識結果確認手段とを備えるよ
うにしたものである。
【0019】本発明によれば、認識した一まとまりの文
字列において、認識の誤り率が低い文字列については確
認動作を省略し、誤り率が高いもののみ認識結果の確認
及び修正を促し、文書単位あるいは章節単位での認識に
おいて、確認及び修正動作の所要時間及び手間を大きく
削減することができる文字認識装置が得られる。
【0020】また、本発明による名刺認識装置及び文字
認識装置は、前述の文字認識エンジンのほか、文字認識
エンジンからの文字コード及び文字認識誤り率とに基づ
き認識した文字の画面上での配置を分析してその文字が
属する氏名または会社名等の要素を識別し、該識別され
た要素の区分とその構成文字列とを出力するとともに、
名刺の各要素を構成する文字の文字認識誤り率に基づき
要素毎の要素認識誤り率を算出する名刺データ認識エン
ジンと、該名刺データ認識エンジンから出力された要素
区分と要素を構成する文字列と要素認識誤り率とを対と
して格納する名刺要素認識結果格納手段とを備えるよう
にしたものである。
【0021】本発明によれば、全ての名刺要素を認識し
た後、一括して、名刺の要素毎に誤り率を算出し、誤り
率の高い要素に対してのみ名刺の要素の認識結果を確認
及び修正することができる名刺認識装置及び文字認識装
置が得られる。
【0022】また、本発明による名刺認識装置及び文字
認識装置は、前述の文字認識エンジン、名刺データ認識
エンジン及び名刺要素認識結果格納手段のほか、名刺及
び要素区分とそれを構成する文字列を表示画面に表示す
るとともに、予め設定された名刺要素容認誤り率より高
い誤り率の要素に対し認識の確認及び修正を促す名刺要
素認識結果確認手段を備えるようにしたものである。
【0023】本発明によれば、全ての名刺要素を認識し
た後、一括して、予め定められた名刺要素容認誤り率よ
り誤り率が高い要素に対してのみ名刺の各要素の認識結
果の確認及び修正を促し、名刺単位あるいは要素単位で
の認識において、確認及び修正動作の所要時間及び手間
を大きく削減することができる名刺認識装置及び文字認
識装置が得られる。
【0024】また、本発明による名刺認識装置及び文字
認識装置は、前述の文字認識エンジン及び名刺データ認
識エンジンのほか、各要素の要素認識誤り率に基づき各
名刺に対する名刺認識誤り率を算出する名刺認識誤り率
算出手段と、要素認識誤り率とそれに基づき算出された
名刺認識誤り率とを併せて格納する名刺認識結果格納手
段とを備えるようにしたものである。
【0025】本発明によれば、複数の名刺を認識した
後、一括して、各名刺毎に誤り率を算出し、誤り率の高
い名刺に対してのみ名刺の認識結果を確認及び修正する
ことができる名刺認識装置及び文字認識装置が得られ
る。
【0026】また、本発明による名刺認識装置及び文字
認識装置は、前述の文字認識エンジン、名刺データ認識
エンジン、名刺認識誤り率算出手段及び名刺認識結果格
納手段のほか、名刺認識結果格納手段から読み出された
名刺認識誤り率が予め設定された名刺容認誤り率より高
い誤り率の名刺に対してのみ認識の確認及び修正を促す
名刺認識結果確認手段を備えるようにしたものである。
【0027】本発明によれば、複数の名刺を認識した
後、一括して、予め定められた名刺容認誤り率より誤り
率が高い名刺に対してのみ名刺の要素の認識結果の確認
及び修正を促し、誤り率が低い名刺に対しては確認動作
を省略して、名刺単位の認識における確認及び修正動作
の所要時間及び手間を大きく削減することができる名刺
認識装置及び文字認識装置が得られる。
【0028】
【発明の実施の形態】本発明の請求項1に記載の発明
は、画像データを分析して文字データを認識し、文字コ
ードに変換するとともに、文字認識の誤り率を算出する
文字認識エンジンを備えるようにしたものであり、文書
の全文字の認識結果を確認しなくとも高い精度で文字を
認識することができる文書認識装置が得られるという作
用を有する。
【0029】本発明の請求項2に記載の発明は、画像デ
ータを分析して文字データを認識し、文字コードに変換
するとともに、文字認識の誤り率を算出する文字認識エ
ンジンと、前記文字認識エンジンから出力された文字コ
ード及び文字認識誤り率を対として格納する文字認識結
果格納手段とを備えるようにしたものであり、全ての文
書を文字コードに変換した後、一括して、誤り文字に対
してのみ注目して文書文字の認識結果を確認及び修正す
ることができる文書認識装置が得られるという作用を有
する。
【0030】本発明の請求項3に記載の発明は、前記文
字認識装置が、更に文字認識結果格納手段から文字コー
ド及び文字認識誤り率を読み出して文字コード列及び文
字認識誤り率のデータ列として出力する認識結果読出手
段と、読み出された文字列を表示画面に表示するととも
に、予め設定された容認誤り率より高い誤り率の文字に
対してのみ認識の確認及び修正を促す認識結果確認手段
を備えるようにしたものであり、認識の誤り率が低い文
字列については確認動作を省略し、誤り率が高いものの
み認識結果の確認及び修正を促し、文書単位あるいは章
節単位での認識において、確認及び修正動作の所要時間
及び手間を大きく削減することができる文字認識装置が
得られるにしたという作用を有する。
【0031】本発明の請求項4に記載の発明は、名刺の
画像データを分析して文字データを認識し、文字コード
に変換するとともに、文字認識の誤り率を算出する文字
認識エンジンと、画像データと前記文字認識エンジンか
らの文字コード及び文字認識誤り率とに基づき認識した
文字の画面上での配置を分析してその文字が属する氏名
または会社名等の要素を識別し、該識別された要素の区
分とその構成文字列とを出力するとともに、名刺の各要
素を構成する文字の文字認識誤り率に基づき要素毎の要
素認識誤り率を算出する名刺データ認識エンジンと、該
名刺データ認識エンジンから出力された要素区分と要素
を構成する文字列と要素認識誤り率とを対として格納す
る名刺要素認識結果格納手段とを備えるようにしたもの
であり、全ての名刺要素を認識した後、一括して、名刺
の要素毎に誤り率を算出し、誤り率の高い要素に対して
のみ名刺の要素の認識結果を確認及び修正することがで
きる名刺認識装置が得られるという作用を有する。
【0032】本発明の請求項5に記載の発明は、前記名
刺認識装置が、更に少なくとも前記名刺要素認識結果格
納手段からの要素区分とそれを構成する文字列を表示画
面に表示するとともに、予め設定された名刺要素容認誤
り率より高い誤り率の要素に対し認識の確認及び修正を
促す名刺要素認識結果確認手段を備えるようにしたもの
であり、全ての名刺要素を認識した後、一括して、予め
定められた名刺要素容認誤り率より誤り率が高い要素に
対してのみ名刺の各要素の認識結果の確認及び修正を促
し、名刺単位あるいは要素単位での認識において、確認
及び修正動作の所要時間及び手間を大きく削減すること
ができる名刺認識装置が得られるという作用を有する。
【0033】本発明の請求項6に記載の発明は、名刺の
画像データを分析して文字データを認識し、文字コード
に変換するとともに、文字認識の誤り率を算出する文字
認識エンジンと、画像データと前記文字認識エンジンか
らの文字コード及び文字認識誤り率とに基づき認識した
文字の画面上での配置を分析してその文字が属する氏名
または会社名等の要素を識別し、該識別された要素の区
分とその構成文字列とを出力するとともに、名刺の各要
素を構成する文字の文字認識誤り率に基づき要素毎の要
素認識誤り率を算出する名刺データ認識エンジンと、各
要素毎の要素認識誤り率に基づき名刺単位の名刺認識誤
り率を算出する名刺認識誤り率算出手段と、要素区分及
び要素を構成する文字列とともに該要素の要素認識誤り
率とそれに基づき算出された名刺認識誤り率とを併せて
格納する名刺認識結果格納手段とを備えるようにしたも
のであり、複数の名刺を認識した後、一括して、各名刺
毎に誤り率を算出し、誤り率の高い名刺に対してのみ名
刺の認識結果を確認及び修正することができる名刺認識
装置が得られるという作用を有する。
【0034】本発明の請求項7に記載の発明は、前記名
刺認識装置が、更に名刺認識結果格納手段から読み出さ
れた名刺認識誤り率が予め設定された名刺容認誤り率よ
り高い誤り率の名刺に対してのみ認識の確認及び修正を
促す名刺認識結果確認手段を備えるようにしたものであ
り、複数の名刺を認識した後、一括して、予め定められ
た名刺容認誤り率より誤り率が高い名刺に対してのみ名
刺の要素の認識結果の確認及び修正を促し、名刺単位の
認識における確認及び修正動作の所要時間及び手間を大
きく削減することができる名刺認識装置が得られるとい
う作用を有する。
【0035】以下、添付図面、図1乃至図9に基づき、
本発明の実施の形態を詳細に説明する。図1は本発明の
第1の実施の形態における文字認識装置の構成を示すブ
ロック図、図2は本発明の第2の実施の形態における文
字認識装置の構成を示すブロック図、図3は本発明の第
3の実施の形態における文字認識装置の構成を示すブロ
ック図、図4は本発明の第4の実施の形態における名刺
認識装置の構成を示すブロック図、図5は本発明の第5
の実施の形態における名刺認識装置の構成を示すブロッ
ク図、図6は本発明の第6の実施の形態における名刺認
識装置の構成を示すブロック図、図7は本発明の第7の
実施の形態における名刺認識装置の構成を示すブロック
図、図8は図6及び図7に示す名刺認識結果格納手段に
格納された名刺データの例を示す図、図9は図7に示す
名刺認識結果確認手段の動作画面の例を示す図である。
【0036】まず、図1を参照して、本発明の第1の実
施の形態における文字認識装置の構成について説明す
る。図1において、2は画像スキャナあるいはファイル
などからの画像イメージを表現する画像データ、1は画
像データ2を受取り、文字の認識作業によりその結果を
文字コード3として出力し、文字認識の際に行なった文
字認識の試行回数から算出した文字認識誤り率4を出力
する文字認識機能からなる文字認識エンジン、3は読み
取られた文書の文字を認識して得られた文字コード、4
は文字が認識されるまでに行なった文字認識の試行回数
から得られた文字認識誤り率である。
【0037】次に、図1を参照して、本発明の第1の実
施の形態における文字認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。
【0038】文字認識誤り率4の算出例としては、パタ
ーンマッチングにより文字認識を行なう場合、パターン
マッチングの結果、試行回数1回で合致した場合を誤り
率0とし、試行回数100回でも合致しなかった場合を
誤り率1とするなどの方法があり、以下で説明する本発
明の他の実施の形態においても、文字、要素または名刺
認識誤り率の算出方法は、特に指定しなくともこれと同
様の方法をとるものとする。このように、本実施の形態
における文字認識装置により、文字認識における誤り率
が一定の値を越えるもののみ認識結果の確認及び修正を
促すようにしたことにより、高い認識精度を維持しつ
つ、認識した文字全部についての確認を行なう手間を省
略することによって、文字の認識結果の確認及び修正に
対する所要時間及び手間を大きく削減することができ
る。
【0039】次に、図2を参照して、本発明の第2の実
施の形態における文字認識装置の構成について説明す
る。図2において、2は画像スキャナあるいはファイル
などからの画像イメージを表現する画像データ、1は画
像データ2を受取り、文字の認識作業によりその結果を
文字コード3として出力し、文字認識の際に行なった文
字認識の試行回数から算出した文字認識誤り率4を出力
する文字認識機能からなる文字認識エンジン、3は読み
取られた文書の文字を認識して得られた文字コード、4
は文字が認識されるまでに行なった文字認識の試行回数
から得られた文字認識誤り率、5は文字認識エンジン1
における文字認識の結果出力された文字コード3、及び
文字認識誤り率4を対として格納する文字認識結果格納
手段である。
【0040】次に、図2を参照して、本発明の第2の実
施の形態における文字認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。
【0041】文字認識結果格納手段5は文字認識エンジ
ン1から出力した文字コード3及び文字認識誤り率4を
対として、認識を実行した文字列を一まとめにし、それ
を1章節分あるいは1文書分などまとめて格納する。本
実施の形態における文字認識装置により、全画像データ
を認識した後、一括して各文字認識における誤り率が一
定の値を越えるもののみ確認及び修正を促すようにした
ことにより、高い認識精度を維持しつつ、認識した文字
全部についての確認を行なう手間を省略することによっ
て、文字の認識結果の確認及び修正に対する所要時間及
び手間を大きく削減することができる。
【0042】次に、図3を参照して、本発明の第3の実
施の形態における文字認識装置の構成について説明す
る。図3において、2は画像スキャナあるいはファイル
などからの画像イメージを表現する画像データ、1は画
像データ2を受取り、文字の認識作業によりその結果を
文字コード3として出力し、文字認識の際に行なった文
字認識の試行回数から算出した文字認識誤り率4を出力
する文字認識機能からなる文字認識エンジン、3は読み
取られた文書の文字を認識して得られた文字コード、4
は文字が認識されるまでに行なった文字認識の試行回数
から得られた文字認識誤り率である。
【0043】また、5は文字認識エンジン1における文
字認識の結果出力された文字コード3及び文字認識誤り
率4を格納する文字認識結果格納手段、8は文字認識結
果格納手段5に1章節分あるいは1文書分などまとめて
格納されている文字コード6及びそれに対応する文字認
識誤り率7を読み出し文字コード列9及び文字認識誤り
率のデータ列10に構成して出力する認識結果読出手段
である。尚、文字コード列9に含まれている各文字コー
ドは文字認識誤り率のデータ列10に含まれている各文
字認識誤り率と1対1で対応している。
【0044】11は予めパラメータとして設定されてい
る容認誤り率、12は認識結果読出手段8から文字コー
ド列9及び文字認識誤り率のデータ列10を受取りその
各文字コードに対する文字認識誤り率と予め設定されて
いる容認誤り率11と対比して文字認識誤り率が容認誤
り率11より高い文字コードに対してのみ表示(例え
ば、赤色を付す)してそれに対応する文字の確認及び修
正を促す認識結果確認手段である。
【0045】次に、図3を参照して、本発明の第3の実
施の形態における文字認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。尚、文字認識誤り率
の算出例は前述したものと同様であるから、再度の説明
は省略する。
【0046】文字認識結果格納手段5は文字認識エンジ
ン1から出力した文字コード3及び文字認識誤り率4を
対として、認識を実行した文字列を一まとめにし、それ
を1章節分あるいは1文書分などまとめて格納する。認
識結果読出手段8は文字認識結果格納手段5に格納され
ている一まとまりの変換結果である文字コード6及び文
字認識誤り率7を読み出して文字コード列9及び文字認
識誤り率のデータ列10として出力する。尚、文字コー
ド列9に含まれている各文字コードは文字認識誤り率の
データ列10に含まれている各文字認識誤り率と1対1
で対応している。
【0047】認識結果確認手段12は認識結果読出手段
8から文字コード列9及び文字認識誤り率のデータ列1
0を受取り、文字コード列9に対応する文字列を画面上
に青色に表示する。そして文字コード列9の各文字コー
ドに対応して文字認識誤り率のデータ列10に含まれて
いる文字認識誤り率を予め設定されている容認誤り率1
1と順次比較して、各文字認識誤り率が容認誤り率11
より高い場合は対応する文字の表示色を青色から赤色に
変更して、その文字の確認及び修正を促す。
【0048】以上説明したように、本実施の形態におけ
る文字認識装置により、認識したひとまとまりの文字か
らなる文字列について誤り率の高い文字列についてのみ
認識の確認及び修正を促すようにしたことにより、高い
認識精度を維持しつつ、誤り率が低い文字または文字列
については確認を行なわず、認識した文字または文字列
全部についての確認を行なう手間を省略することによっ
て、文書単位または章節単位の認識結果の確認及び修正
に対する所要時間及び手間を大きく削減することができ
る。
【0049】次に、図4を参照して、本発明の第4の実
施の形態における名刺認識装置の構成について説明す
る。図4において、2は画像スキャナあるいはファイル
などからの画像イメージを表現する画像データ、1は画
像データ2を受取り、文字の認識作業によりその結果を
文字コード3として出力し、文字認識の際に行なった文
字認識の試行回数から算出した文字認識誤り率4を出力
する文字認識機能からなる文字認識エンジン、3は読み
取られた名刺の文字を認識して得られた文字コード、4
は文字が認識されるまでに行なった文字認識の試行回数
から得られた文字認識誤り率である。
【0050】また、13は画像スキャナなどからの画像
データ2と文字認識エンジン1における文字認識の結果
出力された文字コード3及び文字認識誤り率4とを受取
り、それを名刺データとして名刺データに対する各要素
(項目ともいう)、具体的には、例えば、氏名、会社
名、電話番号など各要素毎にその構成文字の認識を行
い、要素の区分14とその要素を構成する文字列15と
その要素に対する要素認識誤り率16とを出力する名刺
データ認識エンジンである。
【0051】14は各要素(氏名、会社名、電話番号な
ど)の区分を示す要素区分、15は各要素を構成する文
字列、16は文字認識エンジン1からの各文字に対する
文字認識誤り率4と名刺の各要素としての認識の試行具
合(例えば、試行回数)とから算出する要素としての要
素認識誤り率、17は名刺データ認識エンジン13にお
ける名刺データ認識の結果出力された名刺の要素区分4
と要素を構成する文字列15と要素認識誤り率16とを
対として格納する名刺要素認識結果格納手段である。
【0052】次に、図4を参照して、本発明の第4の実
施の形態における名刺認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。
【0053】そこで、名刺データ認識エンジン13は画
像スキャナなどからの画像データ2と文字認識エンジン
1における文字認識の結果出力された文字コード3及び
文字認識誤り率4とを受取り、それを名刺データとして
名刺データに対する各要素、具体的には、例えば、氏
名、会社名、電話番号など各要素を識別し、各要素毎に
その構成文字の認識を行い、要素の区分14とその要素
を構成する文字列15とを出力するとともに、文字認識
エンジン1から出力された文字コード3自体の文字認識
誤り率4と名刺の要素として試行した要素に対する試行
具合とから各要素を構成する文字列15の認識の誤り度
合い、すなわち、要素認識誤り率16を算出して出力す
る。
【0054】要素認識誤り率16の算出例としては、文
字列の種類とか配置位置などに基づく要素認識の結果、
試行回数1回で合致した場合を誤り率0とし、試行回数
100回でも合致しなかった場合を誤り率1として、そ
れを文字認識エンジン1からの文字認識誤り率4と複合
して要素認識誤り率16を算出するなどの方法がある。
【0055】更に、名刺要素認識結果格納手段17は名
刺データ認識エンジン13における名刺データ認識の結
果出力された名刺の要素区分4と要素を構成する文字列
15と上記のようにして算出された要素認識誤り率16
とを各名刺ごとにまとめて格納する。
【0056】本実施の形態における名刺認識装置によ
り、名刺の全要素に対する文字列を認識した後、全要素
一括して、各要素に対する要素認識誤り率16が一定の
値を越えるもののみ確認及び修正を促すようにしたこと
により、高い認識精度を維持しつつ、誤り率が低い要素
については確認を行なわず、認識した名刺の要素全部の
文字列について要素単位の認識結果の確認を行なう手間
を省略することによって、要素単位の認識結果の確認及
び修正に対する時間及び手間を大きく削減することがで
きる。
【0057】次に、図5を参照して、本発明の第5の実
施の形態における名刺認識装置の構成について説明す
る。図5において、文字認識エンジン1、画像データ
2、文字コード3、文字認識誤り率4、名刺データ認識
エンジン13、要素区分14、要素を構成する文字列1
5、要素認識誤り率16及び名刺要素認識結果格納手段
17は上記本発明の第4の実施の形態におけるものと同
様であるから、更に詳細な説明は省略する。
【0058】また、図5において、19は名刺要素認識
結果格納手段17に格納された名刺データを動作画面
(例えば、図9に示すような動作画面でもよい)に表示
するとともに、予め設定されている名刺要素容認誤り率
18と名刺要素認識結果格納手段17からの要素認識誤
り率16とを比較して要素認識誤り率16の値の方が大
きい要素の文字列を、例えば、色彩表示して誤りの確認
及び修正を促す名刺要素認識結果確認手段である。
【0059】次に、図5を参照して、本発明の第5の実
施の形態における名刺認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。
【0060】そこで、名刺データ認識エンジン13は画
像スキャナなどからの画像データ2と文字認識エンジン
1における文字認識の結果出力された文字コード3及び
文字認識誤り率4とを受取り、それを名刺データとして
名刺データに対する各要素、具体的には、例えば、氏
名、会社名、電話番号など各要素を識別し、各要素毎に
その構成文字の認識を行い、要素の区分14とその要素
を構成する文字列15とを出力するとともに、文字認識
エンジン1から出力された文字コード3自体の文字認識
誤り率4と名刺の要素として試行した要素に対する試行
具合とから各要素を構成する文字列15の認識の誤り度
合い、すなわち、要素認識誤り率16を算出して出力す
る。
【0061】要素認識誤り率16の算出例としては、文
字列の種類とか配置位置などに基づく要素認識の結果、
試行回数1回で合致した場合を誤り率0とし、試行回数
100回でも合致しなかった場合を誤り率1として、そ
れを文字認識エンジン1からの文字認識誤り率4と複合
して要素認識誤り率16を算出するなどの方法がある。
【0062】名刺要素認識結果格納手段17は名刺デー
タ認識エンジン13における名刺データ認識の結果出力
された名刺の要素区分4と要素を構成する文字列15と
上記のようにして算出された要素認識誤り率16とを各
名刺ごとにまとめて格納する。
【0063】名刺要素認識結果確認手段19は名刺要素
認識結果格納手段17に格納された名刺データ(要素区
分及び各要素を構成する文字など)を、例えば、図9に
示す動作画面と同様な動作画面に表示するとともに、予
め設定されている名刺要素容認誤り率18と名刺要素認
識結果格納手段17からの要素認識誤り率16とを比較
して要素認識誤り率16の値の方が大きい要素の文字列
を、例えば、色彩表示して(青色を赤色に変更するな
ど)その確認及び修正を促す。
【0064】本実施の形態における名刺認識装置によ
り、名刺の全要素に対する文字列を認識した後、全要素
一括して、各要素に対する要素認識誤り率16が一定の
値を越えるもののみ確認及び修正を促すようにしたこと
により、高い認識精度を維持しつつ、誤り率が低い要素
については確認を行なわず、認識した要素全部について
要素単位の認識結果の確認を行なう手間を省略すること
によって、名刺の要素単位の認識結果の確認及び修正に
対する時間及び手間を大きく削減することができる。
【0065】次に、図6を参照して、本発明の第6の実
施の形態における名刺認識装置の構成について説明す
る。図6において、2は画像スキャナあるいはファイル
などからの画像イメージを表現する画像データ、1は画
像データ2を受取り、文字の認識作業によりその結果を
文字コード3として出力し、文字認識の際に行なった文
字認識の試行回数から算出した文字認識誤り率4を出力
する文字認識機能からなる文字認識エンジン、3は読み
取られた名刺の文字を認識して得られた文字コード、4
は文字が認識されるまでに行なった文字認識の試行回数
から得られた文字認識誤り率である。
【0066】また、13は画像スキャナなどからの画像
データ2と文字認識エンジン1における文字認識の結果
出力された文字コード3及び文字認識誤り率4とを受取
り、それを名刺データとして名刺データに対する各要素
(項目ともいう)、具体的には、例えば、氏名、会社
名、電話番号など各要素毎にその構成文字の認識を行
い、要素の区分14とその要素を構成する文字列15と
その要素に対する要素認識誤り率16とを出力する名刺
データ認識エンジンである。
【0067】14は各要素(氏名、会社名、電話番号な
ど)の区分を示す要素区分、15は各要素を構成する文
字列、16は文字認識エンジン1からの各文字に対する
文字認識誤り率4と名刺の各要素としての認識の試行具
合(例えば、試行回数)とから算出する要素としての要
素認識誤り率、20は名刺データ認識エンジン13から
の要素認識誤り率16を用いて該当する名刺1枚分の名
刺認識誤り率21を算出して出力する名刺認識誤り率算
出手段である。
【0068】22は名刺認識誤り率算出手段20を通し
て名刺データ認識エンジン13からの要素区分14と各
要素を構成する文字列15と要素認識誤り率16ととも
に、名刺認識誤り率算出手段20で算出された名刺認識
誤り率21を併せて格納する名刺認識結果格納手段であ
る。
【0069】次に、図6を参照して、本発明の第6の実
施の形態における名刺認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。
【0070】そこで、名刺データ認識エンジン13は画
像スキャナなどからの画像データ2と文字認識エンジン
1における文字認識の結果出力された文字コード3及び
文字認識誤り率4とを受取り、それを名刺データとして
名刺データに対する各要素、具体的には、例えば、氏
名、会社名、電話番号など各要素を識別し、各要素毎に
その構成文字の認識を行い、要素の区分14とその要素
を構成する文字列15とを出力するとともに、文字認識
エンジン1から出力された文字コード3自体の文字認識
誤り率4と名刺の要素として試行した要素に対する試行
具合とから各要素を構成する文字列15の認識の誤り度
合い、すなわち、要素認識誤り率16を算出して出力す
る。
【0071】要素認識誤り率16の算出例としては、文
字列の種類とか配置位置などに基づく要素認識の結果、
試行回数1回で合致した場合を誤り率0とし、試行回数
100回でも合致しなかった場合を誤り率1として、そ
れを文字認識エンジン1からの文字認識誤り率4と複合
して要素認識誤り率16を算出するなどの方法がある。
【0072】名刺認識誤り率算出手段20は名刺データ
認識エンジン13からの要素認識誤り率16を用いて該
当する名刺1枚分の名刺認識誤り率21を算出して出力
する。その算出方法の一適用例として、本実施の形態で
は、名刺の各要素の要素認識誤り率16のうち最も大き
な値を名刺認識誤り率21として出力する。この名刺認
識誤り率21は、要素区分14、各要素を構成する文字
列15、要素認識誤り率16とともに名刺認識結果格納
手段22に併せて格納される。これらの名刺情報は各名
刺毎にまとめて、複数枚数分格納することができる。
【0073】本実施の形態における名刺認識装置によ
り、複数枚の名刺に対する文字列を認識した後、各名刺
につき一括して、名刺認識誤り率21が一定の値を越え
るもののみ確認及び修正を促すようにしたことにより、
高い認識精度を維持しつつ、誤り率が低い名刺について
は確認を行なわず、認識した名刺全部について名刺単位
の認識結果の確認を行なう手間を省略することによっ
て、名刺単位の認識結果の確認及び修正に対する時間及
び手間を大きく削減することができる。
【0074】次に、図7を参照して、本発明の第7の実
施の形態における名刺認識装置の構成について説明す
る。図7において、文字認識エンジン1、画像データ
2、文字コード3、文字認識誤り率4、名刺データ認識
エンジン13、要素区分14、要素を構成する文字列1
5、要素認識誤り率16、名刺認識誤り率算出手段2
0、名刺認識誤り率21及び名刺認識結果格納手段22
は上記本発明の第6の実施の形態におけるものと同様で
あるから、更に詳細な説明は省略する。
【0075】更に、図7において、23は名刺について
予め設定されている名刺容認誤り率、24は名刺認識結
果格納手段22から名刺データを名刺1枚毎に読み出し
て名刺認識結果確認動作用の動作画面(図9、詳細は後
述する)に表示するとともに、名刺認識結果格納手段2
2から読み出されたその名刺の名刺認識誤り率21を名
刺容認誤り率23と比較して、名刺として誤り率の高い
文字または要素のみを強調表示してその確認及び修正を
促す名刺認識結果確認手段である。
【0076】次に、図7を参照して、本発明の第7の実
施の形態における名刺認識装置の動作について説明す
る。まず、文字認識エンジン1は画像スキャナあるいは
ファイルなどからの画像イメージを表現する画像データ
2を受取り文字認識を行ない、その結果を文字コード3
として出力する。それと同時に、文字認識エンジン1は
文字認識の際の文字認識の試行具合、すなわち、文字が
認識されるまでに行なった文字認識の試行回数に基づ
き、文字認識の誤っている度合い(文字認識の難度)を
文字認識誤り率4として出力する。
【0077】そこで、名刺データ認識エンジン13は画
像スキャナなどからの画像データ2と文字認識エンジン
1における文字認識の結果出力された文字コード3及び
文字認識誤り率4とを受取り、それを名刺データとして
名刺データに対する各要素、具体的には、例えば、氏
名、会社名、電話番号など各要素を識別し、各要素毎に
その構成文字の認識を行い、要素の区分14とその要素
を構成する文字列15とを出力するとともに、文字認識
エンジン1から出力された文字コード3自体の文字認識
誤り率4と名刺の要素として試行した要素に対する試行
具合とから各要素を構成する文字列15の認識の誤り度
合い、すなわち、要素認識誤り率16を算出して出力す
る。
【0078】要素認識誤り率16の算出例としては、文
字列の種類とか配置位置などに基づく要素認識の結果、
試行回数1回で合致した場合を誤り率0とし、試行回数
100回でも合致しなかった場合を誤り率1として、そ
れを文字認識エンジン1からの文字認識誤り率4と複合
して要素認識誤り率16を算出するなどの方法がある。
【0079】名刺認識誤り率算出手段20は名刺データ
認識エンジン13からの要素認識誤り率16を用いて該
当する名刺1枚分の名刺認識誤り率21を算出して出力
する。その算出方法の一適用例として、本実施の形態で
は、名刺の各要素の要素認識誤り率16のうち最も大き
な値を名刺認識誤り率21として出力する。この名刺認
識誤り率21と、要素区分14、各要素を構成する文字
列15、要素認識誤り率16とともに名刺認識結果格納
手段22に格納される。これらの名刺情報は各名刺毎に
まとめて、複数枚数分格納することができる。
【0080】名刺認識結果確認手段24は名刺認識結果
格納手段22から名刺データを名刺1枚分づつ読み出し
て名刺認識結果確認動作用の動作画面(図9、詳細は後
述する)に表示するとともに、名刺認識結果格納手段2
2から読み出されたその名刺の名刺認識誤り率21を名
刺容認誤り率23と比較して、その名刺の名刺認識誤り
率21が名刺容認誤り率23より高い名刺の名刺データ
のみを画面表示し、更に要素認識誤り率16を参照し
て、誤り率の高い要素、またはその要素における誤り率
の高い文字を強調表示してその確認及び修正を促すよう
にする。
【0081】本実施の形態における名刺認識装置によ
り、複数枚の名刺に対する文字列を認識した後、各名刺
につき一括して、名刺認識誤り率21が一定の値を越え
る名刺のみを動作画面に表示して、その誤り率の高い要
素または文字について確認及び修正を促すようにしたこ
とにより、高い認識精度を維持しつつ、誤り率が低い名
刺については確認を行なわず、認識した複数の名刺全部
について名刺単位の認識結果の確認を行なう手間を省略
することによって、名刺単位の認識結果の確認及び修正
に対する時間及び手間を大きく削減することができる。
【0082】図8は、例えば、上記本発明の第6及び第
7の実施の形態において、その動作により格納された各
名刺の名刺データの内容を示す図であり、この例では、
横1列が名刺1枚分の名刺データを構成する。
【0083】図9は、例えば、上記本発明の第7の実施
の形態において、名刺データ確認のために使用される名
刺認識結果確認手段24の動作画面の1例である。この
例では、名刺容認誤り率23は、0.6に設定されてい
るものとする。従って、図8に示す5枚の名刺に対する
認識においては、名刺容認誤り率23が0.6以上の名
刺は、名刺認識誤り率23が1であるナンバー3である
ことがわかる。従って、図9に示す名刺認識結果確認手
段24の動作画面にはナンバー3の名刺のみを表示す
る。
【0084】ナンバー3の名刺の各要素において、氏名
の要素の要素認識誤り率23が1であるから、図9に示
す動作画面の認識結果の氏名欄の下にマークを表示し
て、操作者に対しその文字列または要素の確認を促す。
そのため、操作者はこのマークが表示されている要素の
みを確認して、必要に応じそれを修正する。
【0085】以上説明した本発明の実施の形態において
は、適用される原稿として名刺を主体として説明してき
たが、その形態は名刺のみでなく、例えば、葉書等、如
何なる形態の文書でもよく、その場合、名刺の文字を文
書または文字に読替えればよい。また、誤り率の高い文
字または要素の確認及び修正を促す手法として、本実施
の形態においては、誤り率の高い文字または要素の色彩
を変化するかマークを付けるようにしてそれを強調して
いるが、他の方法、例えば、文字の形態または大きさを
変えて強調してもよく、または確認が必要な要素のみを
表示するようにしてもよい。更に、本実施の形態におい
ては、誤り率の高い名刺及びその動作画面のみを表示す
るようにしているが、誤り率の低い名刺も表示して、そ
の各要素を空白にするか、例えば、「誤りなし」の表示
をするようにしてもよい。
【0086】
【発明の効果】本発明による文字認識装置は、以上説明
したように構成し、特に、文字認識誤り率を算出する文
字認識エンジンを備えて、誤り率の高い文字についての
み注目しうるようにし、文字認識の結果を格納する文字
認識結果格納手段を備えて、一定量の文字を変換して格
納した後、一括して誤り率の高い文字についてのみ認識
の確認及び修正を促し、また、認識した各文字コード列
に対する文字認識誤り率と予め設定されている容認誤り
率とを対比して文字認識誤り率の値の方が高い文字コー
ド列に対してのみ確認及び修正を促す認識結果確認手段
を備えて、ひとまとまりの文字からなる文字列(文字コ
ード列)について誤り率の高い文字列についてのみ認識
の確認及び修正を促すようにしたことにより、高い認識
精度を維持しつつ、誤り率が低い文字または文字列につ
いては確認を行なわず、認識した文字または文字列全部
についての確認を行なう手間を省略することによって、
文書単位または章節単位の認識結果の確認及び修正に対
する時間及び手間を大きく削減することができる。
【0087】本発明による名刺認識装置は、以上説明し
たように構成し、特に、名刺の要素に対する要素認識誤
り率を算出する名刺データ認識エンジンと、それを格納
する名刺要素認識結果格納手段とを備えて、一定量の要
素を構成する文字列を格納した後、一括して誤り率の高
い文字列についてのみ認識の確認及び修正を促し、予め
設定されている名刺要素容認誤り率と名刺要素認識結果
格納手段からの要素認識誤り率とを比較して要素認識誤
り率の値の方が大きい要素の文字列を表示して誤りの確
認及び修正を促す名刺要素認識結果確認手段を備えて、
誤り率の高い要素に対してのみ認識の確認及び修正を促
すようにしたことにより、高い認識精度を維持しつつ、
誤り率が低い名刺要素の文字または文字列については確
認を行なわず、認識した名刺要素の文字または文字列全
部についての確認を行なう手間を省略することによっ
て、文字列単位または要素単位の認識結果の確認及び修
正に対する時間及び手間を大きく削減することができ
る。
【0088】また、本発明による名刺認識装置は、名刺
データ認識エンジンからの要素認識誤り率を用いて各名
刺毎の名刺認識誤り率を算出して出力する名刺認識誤り
率算出手段を備えて、誤り率の高い名刺に対してのみ認
識の確認及び修正を促し、また、予め設定されている名
刺容認誤り率と名刺認識結果格納手段からの名刺認識誤
り率とを比較して名刺認識誤り率の値の方が大きい名刺
の各要素の文字列を表示して誤りの確認及び修正を促す
名刺認識結果確認手段を備えて、誤り率の高い名刺に対
してのみ認識の確認及び修正を促すようにしたことによ
り、高い認識精度を維持しつつ、誤り率が低い名刺及び
名刺要素の文字または文字列については確認を行なわ
ず、認識した名刺要素の文字または文字列全部について
の確認を行なう手間を省略することによって、名刺単位
または要素単位の認識結果の確認及び修正に対する時間
及び手間を大きく削減することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における文字認識装
置の構成を示すブロック図
【図2】本発明の第2の実施の形態における文字認識装
置の構成を示すブロック図
【図3】本発明の第3の実施の形態における文字認識装
置の構成を示すブロック図
【図4】本発明の第4の実施の形態における名刺認識装
置の構成を示すブロック図
【図5】本発明の第5の実施の形態における名刺認識装
置の構成を示すブロック図
【図6】本発明の第6の実施の形態における名刺認識装
置の構成を示すブロック図
【図7】本発明の第7の実施の形態における名刺認識装
置の構成を示すブロック図
【図8】図6及び図7に示す名刺認識結果格納手段に格
納された名刺データの例を示す図
【図9】図7に示す名刺認識結果確認手段の動作画面の
例を示す図
【図10】従来の名刺認識装置の構成を示すブロック図
【符号の説明】
1 文字認識エンジン 2 画像データ 3 文字コード 4 文字認識誤り率 5 文字認識結果格納手段 6 文字コード 7 文字認識誤り率 8 認識結果読出手段 9 文字コード列 10 文字認識誤り率 11 容認誤り率 12 認識結果確認手段 13 名刺データ認識エンジン 14 要素区分 15 要素を構成する文字列 16 要素認識誤り率 17 名刺要素認識結果格納手段 18 名刺要素容認誤り率 19 名刺要素認識結果確認手段 20 名刺認識誤り率算出手段 21 名刺認識誤り率 22 名刺認識結果格納手段 23 名刺容認誤り率 24 名刺認識結果確認手段 31 原稿 32 画像データ 33 デジタイズ手段 34 要素データ 35 要素データ作成手段 36 表示装置 37 表示手段 38 要素データ修正手段 39 修正済要素データ 40 格納メモリ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 向井 謙 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】画像データを分析して文字データを認識
    し、文字コードに変換するとともに、文字認識の誤り率
    を算出する文字認識エンジンを備えたことを特徴とする
    文字認識装置。
  2. 【請求項2】画像データを分析して文字データを認識
    し、文字コードに変換するとともに、文字認識の誤り率
    を算出する文字認識エンジンと、前記文字認識エンジン
    から出力された文字コード及び文字認識誤り率を対とし
    て格納する文字認識結果格納手段とを備えたことを特徴
    とする文字認識装置。
  3. 【請求項3】前記文字認識装置は、更に文字認識結果格
    納手段から文字コード及び文字認識誤り率を読み出して
    文字コード列及び文字認識誤り率のデータ列として出力
    する認識結果読出手段と、読み出された文字列を表示画
    面に表示するとともに、予め設定された容認誤り率より
    高い誤り率の文字に対してのみ認識の確認及び修正を促
    す認識結果確認手段を備えたことを特徴とする請求項2
    記載の文字認識装置。
  4. 【請求項4】名刺の画像データを分析して文字データを
    認識し、文字コードに変換するとともに、文字認識の誤
    り率を算出する文字認識エンジンと、画像データと前記
    文字認識エンジンからの文字コード及び文字認識誤り率
    とに基づき認識した文字の画面上での配置を分析してそ
    の文字が属する氏名または会社名等の要素を識別し、該
    識別された要素の区分とその構成文字列とを出力すると
    ともに、名刺の各要素を構成する文字の文字認識誤り率
    に基づき要素毎の要素認識誤り率を算出する名刺データ
    認識エンジンと、該名刺データ認識エンジンから出力さ
    れた要素区分と要素を構成する文字列と要素認識誤り率
    とを対として格納する名刺要素認識結果格納手段とを備
    えたことを特徴とする名刺認識装置。
  5. 【請求項5】前記名刺認識装置は、更に少なくとも前記
    名刺要素認識結果格納手段からの要素区分とそれを構成
    する文字列を表示画面に表示するとともに、予め設定さ
    れた名刺要素容認誤り率より高い誤り率の要素に対し認
    識の確認及び修正を促す名刺要素認識結果確認手段を備
    えたことを特徴とする請求項4記載の名刺認識装置。
  6. 【請求項6】名刺の画像データを分析して文字データを
    認識し、文字コードに変換するとともに、文字認識の誤
    り率を算出する文字認識エンジンと、画像データと前記
    文字認識エンジンからの文字コード及び文字認識誤り率
    とに基づき認識した文字の画面上での配置を分析してそ
    の文字が属する氏名または会社名等の要素を識別し、該
    識別された要素の区分とその構成文字列とを出力すると
    ともに、名刺の各要素を構成する文字の文字認識誤り率
    に基づき要素毎の要素認識誤り率を算出する名刺データ
    認識エンジンと、各要素毎の要素認識誤り率に基づき名
    刺単位の名刺認識誤り率を算出する名刺認識誤り率算出
    手段と、要素区分及び要素を構成する文字列とともに該
    要素の要素認識誤り率とそれに基づき算出された名刺認
    識誤り率とを併せて格納する名刺認識結果格納手段とを
    備えたことを特徴とする名刺認識装置。
  7. 【請求項7】前記名刺認識装置は、更に名刺認識結果格
    納手段から読み出された名刺認識誤り率が予め設定され
    た名刺容認誤り率より高い誤り率の名刺に対してのみ認
    識の確認及び修正を促す名刺認識結果確認手段を備えた
    ことを特徴とする請求項7記載の名刺認識装置。
JP8271283A 1996-09-24 1996-09-24 名刺認識装置及び文字認識装置 Pending JPH1097593A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8271283A JPH1097593A (ja) 1996-09-24 1996-09-24 名刺認識装置及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8271283A JPH1097593A (ja) 1996-09-24 1996-09-24 名刺認識装置及び文字認識装置

Publications (1)

Publication Number Publication Date
JPH1097593A true JPH1097593A (ja) 1998-04-14

Family

ID=17497914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8271283A Pending JPH1097593A (ja) 1996-09-24 1996-09-24 名刺認識装置及び文字認識装置

Country Status (1)

Country Link
JP (1) JPH1097593A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005694A (ja) * 2016-07-05 2018-01-11 株式会社近畿システムサービス パスポート情報を利用した免税書類用データ生成装置、免税書類作成システム、および免税書類作成方法。

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018005694A (ja) * 2016-07-05 2018-01-11 株式会社近畿システムサービス パスポート情報を利用した免税書類用データ生成装置、免税書類作成システム、および免税書類作成方法。

Similar Documents

Publication Publication Date Title
US11475655B2 (en) Methods for optical character recognition (OCR)
JP3139521B2 (ja) 自動言語決定装置
US7840092B2 (en) Medium processing method, copying apparatus, and data filing apparatus
US20020141660A1 (en) Document scanner, system and method
WO1997005561A1 (fr) Processeur de supports et procede de traitement de supports
JP2835178B2 (ja) 文書読取装置
US20020025081A1 (en) Document image processing device, document image processing method, and memory medium
WO2021141747A1 (en) Method for generating a quick response code and printing apparatus
KR101942468B1 (ko) 정형 및 비정형 데이터 추출 시스템 및 방법
CN112084748A (zh) 一种文本比对方法
US6042011A (en) System and method for printing and error correction of hangul barcode
JP2004341764A (ja) 認識方法および認識装置
JPH1097593A (ja) 名刺認識装置及び文字認識装置
JP2006260051A (ja) 申込書の登録方法
JP2019032645A (ja) 書類管理装置、書類管理方法、および、書類管理装置用のプログラム
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
CN106980604B (zh) 合同内容校阅装置
JP2007052682A (ja) 帳票処理装置
JP2733837B2 (ja) 文字読取装置
US6049637A (en) System and method for automated data capture of sequential form numbers at a collator/press assembly machine using an optical reader which does not capture an image of the form number
CN113255613B (zh) 判题方法、装置及计算机存储介质
WO2004084539A1 (ja) 記入用文書作成装置及び作成方法、記入内容抽出装置及び抽出方法、記入用文書
JP2005050094A (ja) 光学的文字読取装置
JP3823005B2 (ja) ビットマップフォント作成装置および文書復元装置
US20110134492A1 (en) Image processing apparatus and controlling method for the same