JP2002324210A - 文字認識処理システムおよびプログラム - Google Patents

文字認識処理システムおよびプログラム

Info

Publication number
JP2002324210A
JP2002324210A JP2001126116A JP2001126116A JP2002324210A JP 2002324210 A JP2002324210 A JP 2002324210A JP 2001126116 A JP2001126116 A JP 2001126116A JP 2001126116 A JP2001126116 A JP 2001126116A JP 2002324210 A JP2002324210 A JP 2002324210A
Authority
JP
Japan
Prior art keywords
data
character recognition
character
item
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001126116A
Other languages
English (en)
Other versions
JP4190159B2 (ja
Inventor
Yasunori Adachi
泰則 足立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001126116A priority Critical patent/JP4190159B2/ja
Publication of JP2002324210A publication Critical patent/JP2002324210A/ja
Application granted granted Critical
Publication of JP4190159B2 publication Critical patent/JP4190159B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】検索キーを任意に設定可能とし、過去に蓄積され
たテ゛ータを有効に活用することによって、文字認識率を高
め、オヘ゜レータの負担の低減を図る。 【解決手段】帳票の画像イメーシ゛に基づいて文字認識処理
する文字認識部4と、過去に文字認識された帳票を記憶
した帳票テ゛ータ蓄積DB14と、文字認識処理された各テ゛ータの
中に、文字認識されなかったテ゛ータがあった場合には、文
字認識されたテ゛ータの項目に基づいて、帳票テ゛ータ蓄積DB14
に記憶された帳票を検索するための検索キーとなる項目
を、文字認識されたテ゛ータに対応する項目の中から選択す
る検索キー選択部6と、選択された検索キーの項目に対応す
るテ゛ータを含む帳票を帳票テ゛ータ蓄積DB14から検索する帳票
テ゛ータ検索部7と、検索された帳票およびその各項目に対
応するテ゛ータに基づいて、文字認識されなかったテ゛ータを推
定する文字推定部9と、推定されたテ゛ータに文字認識され
なかったテ゛ータを置き換える文字置換部10とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識処理シス
テムおよびプログラムに係り、更に詳しくは、帳票に記
入されたデータに基づいて文字認識処理を行うととも
に、文字認識されなかったデータについては、過去に文
字認識処理された帳票およびそのデータに基づいてその
内容を推定することによって文字認識率を高めることが
可能な文字認識処理システムおよびプログラムに関す
る。
【0002】
【従来の技術】通常、帳票に記入されたデータを入力す
るシステムでは、業務の効率化のためにOCRを利用し
て文字認識を行い、データ入力を簡素化することがよく
行われる。
【0003】この種の文字認識処理システムでは、繰り
返し発生するようなデータについては、処理実績として
データベースに蓄積しておき、次回同様のデータが発生
した時に、蓄積されたデータベースから過去の処理実績
を取り出し利用することによりデータ入力を省力化する
場合が多い。この場合、帳票に記入されたデータは以下
のようにして処理がなされる。
【0004】1)日々文字認識された帳票データを、処
理実績としてデータベースに追加更新して行く。
【0005】2)新たな帳票データの文字認識を行う場
合には、OCRによりその帳票データの画像イメージに
基づいて、読み込んだ帳票データの文字認識を行う。こ
の文字認識処理の結果、文字認識されなかったデータが
あった場合には、以下に示す3)以降の処理を行う。
【0006】3)OCRによって文字認識処理を行って
も、帳票に記入されたデータの文字認識ができないデー
タがあった場合には、予め定められているデータ項目で
あるキー項目のデータに合致する帳票データをデータベ
ースから検索する。
【0007】例えば図6に示すように、銀行名、支店
名、科目、口座番号、受取人名、振込金額、依頼人名の
各項目からなる振込依頼帳票において、いずれかの項目
に記入されたデータの文字認識ができないデータがあっ
た場合には、銀行名、支店名、科目、口座番号の各項目
を検索キーとして予め定めておき、これら検索キーのデ
ータに合致する帳票をデータベースから検索する。
【0008】4)そして、データベースから検索した結
果、検索キーとして定められた項目のデータに合致する
帳票が存在する場合には、補正画面上のデータを、検索
された帳票のデータに置き換える。
【0009】図6に示す例では、文字認識処理の結果、
受取人名が「ヤマ?? タロウ」として正しく認識され
なかったが、3)において銀行名、支店名、科目、口座
番号を検索キーとして設定し、この検索キーに合致する
帳票がデータベースから検索された結果、この銀行名
「XXギンコウ」、支店名「ホンテン」、科目「普
通」、口座番号「12345」に一致する受取人名とし
て「ヤマダ タロウ」が検索された。よって、文字認識
されなかった受取人名「ヤマ?? タロウ」が「ヤマダ
タロウ」というデータに置き換えられる。
【0010】このようにして、過去に文字認識処理され
た帳票およびそのデータを利用することによって、文字
認識されなかったデータの文字認識の支援がなされてい
る。
【0011】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の文字認識処理システムでは、以下のような問
題がある。
【0012】すなわち、上述したような文字認識処理シ
ステムでは、検索キーとする項目は、予め定めておくも
のであって、いったん検索キーを決めてしまうと、文字
認識処理する帳票毎にその検索キーを変更するようなこ
とはできない。
【0013】したがって、検索キーとして決められた項
目に対するデータが、正しく文字認識されない場合には
利用することができない。たとえば、図6に示すよう
に、帳票データの文字認識処理を行う場合、検索キーと
して銀行名、支店名、科目、口座番号の各項目が指定さ
れ、指定された全ての項目のデータが正しく文字認識処
理されている場合には検索キーとして正しく機能する
が、検索キーとして指定された項目のうちの1つでも認
識されなかった文字があった場合には利用することがで
きない。
【0014】図7は、このような場合を示す一例であっ
て、検索キーとして指定された項目のうちの支店名のデ
ータが認識されなかった場合を示している。
【0015】このように、検索キーとして指定された項
目の中に、認識されなかったデータがある場合には、デ
ータベースに記憶された過去に処理された帳票データを
利用することができないために、帳票に記入されたデー
タをオペレータが読み取り、直接手入力しなくてはなら
ず、オペレータの負担が増大するという問題がある。
【0016】本発明はこのような事情に鑑みてなされた
ものであり、検索キーとする項目を任意に設定可能と
し、文字認識処理において認識されなかったデータの推
定を、過去に蓄積されたデータを有効に活用して行い、
もって、文字認識率を高め、オペレータの負担の低減を
図ることが可能な文字認識処理システムおよびプログラ
ムを提供することを目的とする。
【0017】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明では、以下のような手段を講じる。
【0018】すなわち、請求項1の発明では、複数の項
目からなる帳票の各データを帳票の画像イメージに基づ
いて文字認識処理する文字認識手段と、過去に文字認識
された帳票を、この帳票の各項目に対応するデータとと
もに記憶した帳票データ記憶手段と、文字認識手段によ
って文字認識処理された各データの中に、文字認識され
なかったデータがあった場合には、文字認識手段によっ
て文字認識されたデータの項目に基づいて、帳票データ
記憶手段に記憶された帳票およびその各項目のデータを
検索するための検索キーとなる項目を、文字認識された
データに対応する項目の中から選択する選択手段と、選
択手段によって選択された検索キーの項目に対応するデ
ータを含む帳票およびその各項目に対応するデータを帳
票データ記憶手段から検索する検索手段と、検索手段に
よって検索された帳票およびその各項目に対応するデー
タに基づいて、文字認識されなかったデータを推定する
推定手段と、推定手段によって推定されたデータに文字
認識されなかったデータを置き換える置換手段とを備え
る。
【0019】従って、請求項1の発明の文字認識処理シ
ステムにおいては、以上のような手段を講じることによ
り、複数の項目からなる帳票の中から任意の項目を検索
キーとして指定することを可能とし、指定した検索キー
に基づいて過去のデータから類似のデータを検索するこ
とにより、認識されなかったデータの推定を高い精度で
行うことができる。
【0020】請求項2の発明では、請求項1の発明の文
字認識処理システムにおいて、検索手段によって検索さ
れた帳票が複数ある場合には、検索された帳票の各項目
に対応するデータと、文字認識手段によって文字認識処
理された帳票の各項目に対応するデータとの一致度を、
検索された各帳票毎に演算する演算手段を付加し、推定
手段は、演算手段によって演算された一致度が所定値以
上の帳票の各項目に対応するデータに基づいて、文字認
識されなかったデータを推定する。
【0021】従って、請求項2の発明の文字認識処理シ
ステムにおいては、以上のような手段を講じることによ
り、検索キーに基づいて検索された過去の帳票が複数あ
る場合には、より一致度の高い帳票に基づいて認識され
なかったデータの推定を行うことができるので、推定精
度をより高めることができる。
【0022】請求項3の発明では、請求項1または請求
項2の発明の文字認識処理システムにおいて、置換手段
によって置き換えられたデータを、異なる表示色、また
は異なる文字サイズ、または異なる修飾方法を用いて表
示することによって、帳票の各データを、この帳票の画
像イメージとともに表示する表示手段と、表示手段によ
って表示された置き換えられたデータの変更入力を受け
付ける変更入力手段とを付加する。
【0023】従って、請求項3の発明の文字認識処理シ
ステムにおいては、以上のような手段を講じることによ
り、置き換えられたデータについては、データが置き換
えられたことを容易に認識することができる。また、入
力された画像イメージと比較することによって、データ
の変更を要する場合には、変更するデータを入力するこ
ともできる。
【0024】請求項4の発明では、各項目に対応して帳
票に記入されたデータに基づいて文字認識処理を行うと
ともに、文字認識されなかったデータについては、過去
に文字認識された帳票およびその各項目に対応するデー
タに基づいてその内容を推定することによって文字認識
率を高めるコンピュータ読み取り可能なプログラムであ
って、複数の項目からなる帳票の各データを帳票の画像
イメージに基づいて文字認識処理する文字認識手段、過
去に文字認識処理された帳票を、この帳票の各項目に対
応するデータとともに記憶した帳票データ記憶手段、文
字認識手段によって文字認識処理された各データの中
に、文字認識されなかったデータがあった場合には、文
字認識手段によって文字認識されたデータの項目に基づ
いて、帳票データ記憶手段に記憶された帳票およびその
各項目のデータを検索するための検索キーとなる項目
を、文字認識されたデータに対応する項目の中から選択
する選択手段、選択手段によって選択された検索キーの
項目に対応するデータを含む帳票およびその各項目に対
応するデータを帳票データ記憶手段から検索する検索手
段、検索手段によって検索された帳票およびその各項目
に対応するデータに基づいて、文字認識されなかったデ
ータを推定する推定手段、推定手段によって推定された
データに文字認識されなかったデータを置き換える置換
手段をコンピュータに実現させるプログラムである。
【0025】従って、請求項4の発明のプログラムにお
いては、以上のような手段を講じることにより、複数の
項目からなる帳票の中から任意の項目を検索キーとして
指定することを可能とし、指定した検索キーに基づいて
過去のデータから類似のデータを検索することにより、
認識されなかったデータの推定を高い精度で行うことが
できる。
【0026】
【発明の実施の形態】以下に、本発明の実施の形態につ
いて図面を参照しながら説明する。
【0027】本発明の実施の形態を図1から図6を用い
て説明する。
【0028】図1は、本発明の実施の形態に係る文字認
識処理システムの全体構成の一例を示す構成図である。
【0029】本発明の実施の形態に係る文字認識処理シ
ステム1は、ワークステーション等の計算機からなり、
画像データ変換部2と、画像イメージデータ蓄積データ
ベース(画像イメージデータ蓄積DB)3と、文字認識
部4と、文字認識データ蓄積データベース(文字認識デ
ータ蓄積DB)5と、検索キー選択部6と、帳票データ
検索部7と、一致度演算部8と、文字推定部9と、文字
置換部10と、置換後文字認識データ蓄積データベース
(置換後文字認識データ蓄積DB)11と、表示部12
と、変更入力部13と、帳票データ蓄積データベース
(帳票データ蓄積DB)14とを備えている。
【0030】画像データ変換部2は、例えばスキャナが
用いられ、手書きで帳票に記入されたデータを画像デー
タに変換し、変換した画像データを画像イメージデータ
蓄積DB3に記憶させると共に、文字認識部4に出力す
る。
【0031】画像イメージデータ蓄積DB3は、画像デ
ータ変換部2から出力された帳票の画像データを記憶す
る。また、表示部12からの要求に基づいて、記憶して
いる画像データを表示部12に出力する。
【0032】文字認識部4は、例えばOCRが用いら
れ、画像データ変換部2から出力された画像データに基
づいて、文字認識処理を行う。そして、文字認識された
結果である文字認識データを文字認識データ蓄積DB5
に記憶させると共に、検索キー選択部6に出力する。な
お、図2に、文字認識部4によって文字認識処理された
帳票の一例を示す。この帳票は、銀行名、支店名、科
目、口座番号、受取人名、振込金額、依頼人名の各項目
からなるものであって、銀行名、科目、口座番号、振込
金額、依頼人名については正しく文字認識されており、
支店名、受取人名については認識されなかった場合を示
している。
【0033】文字認識データ蓄積DB5は、図2にその
一例を示すような文字認識部4から出力された文字認識
データを記憶する。また、検索キー選択部6からの要求
に基づいて、記憶している文字認識データを検索キー選
択部6に出力する。
【0034】検索キー選択部6は、文字認識部4から出
力された文字認識データ、または文字認識データ蓄積D
B5から必要に応じて取得した文字認識データに基づい
て、各項目のうちのいずれかに、文字認識されなかった
データがあった場合には、データが文字認識された項目
に基づいて、帳票データ蓄積DB14に記憶された帳票
およびその各項目に対応するデータを検索するための検
索キーとなる項目を、文字認識されたデータに対応する
項目の中から選択し、その選択結果を帳票データ検索部
7に出力する。
【0035】たとえば、図2に示すような文字認識デー
タの場合、支店名、受取人名は文字認識されなかった項
目である。これを、文字認識された項目である銀行名、
科目、口座番号、振込金額、振込人名のうちのいずれか
の項目を検索キーとして選択する。なお、検索キーとし
て選択する項目の数は任意である。
【0036】一方、検索キー選択部6は、文字認識部4
から出力された文字認識データ、または文字認識データ
蓄積DB5から必要に応じて取得した文字認識データに
基づいて、各項目のデータが全て文字認識された場合に
は、この文字認識データを表示部12に出力する。
【0037】帳票データ検索部7は、検索キー選択部6
によって選択された検索キーの項目を含む帳票およびそ
の各項目に対応するデータを帳票データ蓄積DB14か
ら検索し、その検索結果を一致度演算部8に出力する。
図3は、検索キー選択部6において検索キーとして銀行
名、科目、口座番号が選択された場合において、帳票デ
ータ蓄積DB14から検索された帳票およびその項目に
対応するデータの一例を示すものである。銀行名として
「XXギンコウ」、科目として「普通」、口座番号とし
て「12345」の検索キーで検索した結果、支店名と
して「シンジュク」、受取人名として「サトウ ハナ
コ」のデータ1)と、支店名として「ホンテン」、受取
人名として「ヤマダ タロウ」のデータ2)とが検索さ
れた。
【0038】一致度演算部8は、帳票データ検索部7に
よって検索された帳票のデータについて、文字認識部4
によって文字認識処理された帳票とのデータの一致度を
演算する。なお、帳票データ検索部7によって検索され
た帳票が複数ある場合には、文字認識部4によって文字
認識処理された帳票の各データとの一致度を、検索され
た各帳票毎に演算する。そして、演算した結果である一
致度を文字推定部9に出力する。
【0039】一致度αの演算は、たとえば、以下に示す
(1)式に基づいて行う。すなわち、 α=Σf(r,j)/len(r,j)×φ …(1) 但し、 Σf(x,y):文字列xと文字列yとを比較し、一
致した文字数を求める関数。 len(x,y):文字列xと文字列yについて文字数
の大きい方の値を求める関数。 r:認識結果のn番目の項目。 j:実績検索結果のn番目の項目。 φ:n番目の項目の重み係数。
【0040】なお、φ(n番目の項目の重み係数)
は、各項目の文字種類による認識精度を考慮した重み付
けを行うために設定するものであり、例えば、認識精度
の高い数字項目は高く、認識精度の低いカタカナ、漢字
項目は低く設定する。
【0041】文字推定部9は、帳票データ検索部7によ
って1件のみの帳票が検索された場合であって、その帳
票について一致度演算部8によりなされた一致度αが、
所定基準値以上である場合には、この検索された帳票の
内容を正とする。この場合、文字置換部10は、帳票デ
ータ検索部7によって検索された帳票のデータに基づい
て、文字認識部4によって認識されなかったデータを置
き換えるとともに、置き換えを行ったデータについて
は、置き換えたことが識別できるように置換フラグをセ
ットする。なお、置換フラグについては後述する。
【0042】また、文字推定部9は、帳票データ検索部
7によって複数の帳票が検索された場合には、一致度演
算部8によってなされた一致度αが最大値を示す帳票の
内容を正とする。この場合、文字置換部10は、帳票デ
ータ検索部7によって検索された帳票のデータに基づい
て、文字認識部4によって認識されなかったデータを置
き換えるとともに、置き換えを行ったデータについて
は、置き換えたことが識別できるように置換フラグをセ
ットする。
【0043】図4は、文字置換部10によって、データ
の置き換えがなされるとともに、置き換えられたデータ
について置換フラグがセットされた状態を示す図であ
る。図2に示す帳票との一致度αを、図3に示すデータ
1)、およびデータ2)のそれぞれについて演算した場
合、データ2)の方が一致度αの値が大きい。したがっ
て、図2に示す帳票において支店名は、データ2)に入
力されている「ホンテン」が正であり、受取人もまたデ
ータ2)に入力されている「ヤマダ タロウ」が正であ
る。したがって、図2の帳票における支店名「ホン?
?」を「ホンテン」を置き換え、受取人名「ヤマ??
タロウ」を「ヤマダ タロウ」に置き換えている。更
に、置き換えられたデータについては、データとともに
括弧付きで付された置換フラグのデータを「1」として
いる。図2に示す帳票のうち銀行名、科目、口座番号の
データについてはデータが置き換えられていないので置
換フラグのデータを「0」としている。なお、図2に示
す帳票のデータのうち振込金額と依頼人名については、
図3に示す帳票のデータとの比較を行っていないので置
換フラグを付していない。
【0044】文字置換部10は、図4に示すように、デ
ータの置き換えを行った置換後文字認識データを置換後
文字認識データ蓄積DB11に記憶させると共に、表示
部12に出力する。なお、帳票データ検索部7によって
帳票データが検索されなかった場合、あるいは帳票デー
タ検索部7によって検索された帳票データがあった場合
であっても、一致度演算部8によって演算された一致度
αの値が所定基準値に満たない場合には、データの置き
換えは行わない。文字置換部10は、このようにデータ
の置き換えを行わなかった場合であっても、文字推定部
9から出力された文字認識データを表示部12に出力す
る。
【0045】置換後文字認識データ蓄積DB11は、図
4にその一例を示すような置換後文字認識データが文字
置換部10から出力されると、その出力された置換後文
字認識データを記憶する。また、表示部12からの要求
に基づいて、記憶している置換後文字認識データを表示
部12に出力する。
【0046】表示部12は、文字置換部10または置換
後文字認識データ蓄積DB11から出力された置換後文
字認識データを、画像イメージデータ蓄積DB3に蓄積
されたこの帳票の画像データとともに画面表示する。こ
の場合、文字置換部10によって置換されたデータにつ
いては、置換フラグが「1」であることを認識すること
によって、異なる表示色、または異なる文字サイズ、ま
たは異なる修飾方法を用いて表示する。これによって、
置換されたデータであることが識別できるようにしてい
る。置換されたデータの確度を明らかにするため、一致
度αの値により色を分けて表示するようにしても良い。
【0047】なお、表示部12は、文字置換部10か
ら、認識されなかったデータがあるにもかかわらずその
データの置換がなされなかった文字認識データが出力さ
れた場合には、認識されなかったデータが含まれた文字
認識データを、画像イメージデータ蓄積DB3に蓄積さ
れたこの帳票の画像データとともに画面表示する。
【0048】また、表示部12は、検索キー選択部6か
ら全てのデータが認識された文字認識データが出力され
た場合には、この文字認識データを、画像イメージデー
タ蓄積DB3に蓄積されたこの帳票の画像データととも
に画面表示する。
【0049】このようにして、文字認識データと、その
帳票に対応する画像データを表示部12に並列して画面
表示することによって、オペレータが両データの内容を
対比できるようにしている。
【0050】両データの対比の結果、オペレータが、文
字認識データの中に、誤って認識されたデータや誤って
置換されたデータがあるものと判断した場合には、変更
入力部13より変更データを入力することによって、任
意の文字認識データの内容を変更することを可能として
いる。
【0051】また、文字認識データの中に、文字認識さ
れていないデータが含まれている場合には、オペレータ
が、この文字認識データに対応する帳票の画像データか
らそのデータを読み取ることによって、読み取ったデー
タをこの変更入力部13から手入力することを可能とし
ている。
【0052】変更入力部13は、オペレータよって変更
データの入力、あるいは認識されなかったデータの入力
がなされると、入力されたデータに基づいて、文字認識
データの内容を更新する。
【0053】なお、変更入力部13からのデータ入力が
全て完了した場合には、オペレータが、変更入力部13
に備えられた図示しない確定キーを押圧することによっ
て、文字認識データが確定されるとともに、確定された
文字認識データが帳票データ蓄積DB14に出力される
ようにしている。
【0054】帳票データ蓄積DB14は、変更入力部1
3から出力された文字認識データを、過去に文字認識処
理された帳票、およびこの帳票の各項目に対するデータ
として記憶する。この記憶された帳票、およびこの帳票
の各項目に対するデータは、帳票データ検索部7によっ
て行われる検索に供される。
【0055】以上の様に構成した本発明の実施の形態に
係る文字認識処理システム1は、例えば磁気ディスク等
の記憶媒体に記憶されたプログラムを読み込み、このプ
ログラムによって動作が制御されるコンピュータによっ
て実現される。
【0056】次に、以上のように構成した本発明の実施
の形態に係る文字認識処理システムの動作について図5
に示すフローチャートを用いて説明する。
【0057】本発明の実施の形態に係る文字認識処理シ
ステム1を用いて帳票に記入されたデータを処理する場
合には、まず、各項目に手書きでデータが記入された帳
票が、画像データ変換部2によって画像データに変換さ
れる(S1)。変換された画像データは、画像データ変
換部2から画像イメージデータ蓄積DB3に出力され、
そこで記憶されると共に、文字認識部4に出力される。
【0058】画像データ変換部2から文字認識部4に出
力された画像データは、文字認識部4によって、文字認
識処理が行われる(S2)。文字認識された結果である
文字認識データは、文字認識部4から文字認識データ蓄
積DB5に出力され、そこで記憶されると共に、検索キ
ー選択部6に出力される。
【0059】検索キー選択部6には、文字認識部4から
文字認識データが出力される。また、必要に応じて、文
字認識データ蓄積DB5に記憶されている文字認識デー
タを取得することも可能である。検索キー選択部6で
は、文字認識部4から出力された文字認識データ、また
は文字認識データ蓄積DB5から必要に応じて取得した
文字認識データに基づいて、各データの中に、文字認識
されなかったデータがあった場合(S3:Yes)に
は、文字認識されたデータの項目に基づいて、帳票デー
タ蓄積DB14に記憶された帳票およびその各項目に対
応するデータを検索するための検索キーとなる項目が、
文字認識されたデータに対応する項目の中から選択され
る(S4)。そして、このようにして選択された検索キ
ーは、帳票データ検索部7に出力される。
【0060】一方、文字認識部4から出力された文字認
識データ、または文字認識データ蓄積DB5から必要に
応じて取得した文字認識データに基づいて、各項目のデ
ータが全て文字認識されている場合(S3:No)に
は、この文字認識データは、検索キー選択部6から表示
部12へ出力される(S11)。
【0061】そして、帳票データ検索部7によって、検
索キーの項目を含む帳票およびその各項目に対応するデ
ータが帳票データ蓄積DB14から検索され、その検索
結果が一致度演算部8に出力される(S5)。
【0062】一致度演算部8では、帳票データ検索部7
によって検索された帳票の各項目に対応するデータにつ
いて、文字認識部4によって文字認識処理された帳票の
各項目に対応するデータとの一致度αの演算がなされる
(S6)。なお、帳票データ検索部7によって検索され
た帳票が複数ある場合には、文字認識部4によって文字
認識処理された帳票の各項目に対応するデータとの一致
度αが、検索された各帳票毎に演算される。そして、演
算した結果である一致度αは、文字推定部9に出力され
る。
【0063】文字推定部9では、帳票データ検索部7に
よって1件のみの帳票が検索された場合(S7:1件)
であって、その帳票について一致度演算部8によってな
された一致度αが、所定基準値以上である場合(S8:
Yes)には、この検索された帳票の内容が正とされ
る。この場合、文字置換部10によって、帳票データ検
索部7によって検索された帳票のデータに基づいて、文
字認識部4によって認識できなかったデータが置換され
る(S9)。置換されたデータについては、置換フラグ
がセットされる。
【0064】また、文字推定部9では、帳票データ検索
部7によって複数の帳票が検索された場合(S7:2件
以上)には、一致度演算部8によってなされた一致度α
が最大値を示す帳票の内容が正とされる(S18)。こ
の場合、文字置換部10によって、帳票データ検索部7
によって検索された帳票のデータに基づいて、文字認識
部4によって認識されなかったデータが置換される(S
9)。置換されたデータについては、置換フラグがセッ
トされる。
【0065】このようにしてデータが置換された置換後
文字認識データは、文字置換部10から置換後文字認識
データ蓄積DB11に出力され、そこで記憶されると共
に、表示部12にもまた出力される(S10)。
【0066】なお、帳票データ検索部7によって帳票が
検索されなかった場合(S7:0件)、あるいは帳票デ
ータ検索部7によって検索された帳票があった場合であ
っても、一致度演算部8によって演算された一致度αの
値が所定基準値に満たない場合(S8:No)には、デ
ータは置換されない。このように、データが置換されな
かった場合でも、文字推定部9から出力された文字認識
データは、文字置換部10から表示部12に出力される
(S11)。
【0067】このようにして表示部12に出力された文
字認識データは、画像イメージデータ蓄積DB3に蓄積
されたこの帳票の画像データとともに画面表示される
(S12)。この場合、文字置換部10によって置換さ
れたデータについては、置換フラグが「1」であること
を認識することによって、異なる表示色、または異なる
文字サイズ、または異なる修飾方法を用いて表示され
る。これによって、置換されたデータであることが識別
される。また、置換されたデータの確度を明らかにする
ために、一致度αの値により色を分けて表示することも
可能である。
【0068】このようにして、文字認識データと、その
帳票に対応する画像データとが並列表示されることによ
って、オペレータによって両データの内容が対比され、
文字認識部4によってデータが正しく認識されたか否
か、あるいは文字置換部10によってデータが正しく置
換されたか否かが確認される(S13)。
【0069】両データの対比の結果、オペレータが、文
字認識データの中に、誤って認識されたデータや、誤っ
て置換されたデータがあるものと判断した場合、あるい
は文字認識されていないデータが含まれている場合(S
14:Yes)には、オペレータによって、変更入力部
13から変更データの入力がなされ、文字認識データの
内容が変更される(S15)。
【0070】文字認識されていないデータが含まれてい
ない場合(S14:No)、またはこのようにして変更
入力部13に、オペレータからの変更データの入力、あ
るいは認識されなかったデータの入力がなされると、入
力されたデータに基づいて、文字認識データの内容が更
新され、確定される(S16)。
【0071】このようにして全てのデータが認識された
文字認識データは、変更入力部13から帳票データ蓄積
DB14に出力され、過去に文字認識処理された帳票、
およびこの帳票の各項目に対応するデータとして記憶さ
れる(S17)。この記憶された帳票、およびこの帳票
の各項目に対応するデータは、ステップS5において行
われる検索に供される。
【0072】なお、本発明の実施の形態に説明した文字
認識処理システム1は、記憶媒体に格納したプログラム
をコンピュータに読み込ませることで実現させることが
できる。
【0073】ここでいう記憶媒体としては、磁気ディス
ク、フロッピー(登録商標)ディスク、ハードディス
ク、光ディスク(CD−ROM、DVD等)、光磁気デ
ィスク(MO等)、半導体メモリ等、プログラムを記憶
でき、かつコンピュータが読み取り可能な記憶媒体であ
れば、その記憶形式は何れの形態であってもよい。
【0074】また、記憶媒体からコンピュータにインス
トールされたプログラムの指示に基づきコンピュータ上
で稼働しているOS(オペレーティングシステム)や、
データベース管理ソフト、ネットワークソフト等のMW
(ミドルウェア)等が本発明の実施の形態を実現するた
めの各処理の一部を実行してもよい。
【0075】さらに、本発明の実施の形態における記憶
媒体は、コンピュータと独立した媒体に限らず、LAN
やインターネット等により伝送されたプログラムをダウ
ンロードして記憶または一時記憶した記憶媒体も含まれ
る。
【0076】また、記憶媒体は1つに限らず、複数の媒
体から本実施の形態における処理が実行される場合も本
発明における記憶媒体に含まれ、媒体構成は何らの構成
であってもよい。
【0077】なお、本発明の実施の形態におけるコンピ
ュータは、記憶媒体に記憶されたプログラムに基づき、
同実施の形態における各処理を実行するものであって、
パソコン等の1つからなる装置、複数の装置がネットワ
ーク接続されたシステム等の何れの構成であってもよ
い。
【0078】また、同実施の形態におけるコンピュータ
とは、パソコンに限らず、情報処理機器に含まれる演算
処理装置、マイコン等も含み、プログラムによって同実
施の形態の機能を実現することが可能な機器、装置を総
称している。
【0079】上述したように、本発明の実施の形態に係
る文字認識処理システムにおいては、上記のような作用
により、文字認識部4によってなされた文字認識処理の
結果、認識されないデータがあった場合、認識されたデ
ータに対応する項目の中から任意に検索キーを選択する
ことができる。このように、検索キーを任意に選択する
ことができることから、過去に処理された帳票の中から
データの一致率の高い帳票を柔軟に検索することができ
るようになり、過去に処理された帳票およびその各項目
に対応するデータを有効に利用することが可能となる。
【0080】そして、この選択した検索キーに基づい
て、過去に処理された帳票の中から、データの一致率の
高い帳票を検索することができる。検索された帳票は、
データ一致率の高い帳票であるために、このデータを用
いて置き換えられたデータは、正しいデータであるとい
う確率が極めて高い。したがって、誤った置換えを防止
し、より精度の高い置換えを行うことが可能となる。
【0081】更にまた、文字認識、あるいは置換された
データを、データが記入された状態の画像データと併せ
て表示することによって、正しく文字認識されたこと、
あるいは正しく置換されたことを確認するとともに、必
要な場合にはその内容を修正することもできる。
【0082】以上のように、本発明の実施の形態に係る
文字認識処理システムを用いることによって、帳票の画
像データから認識されない文字があった場合であって
も、過去に処理された帳票、およびその項目に対応する
データを利用することによって、認識されない文字を、
より高い精度で推定し、推定したデータに置き換えるこ
とによって認識することが可能となる。これによって、
オペレータの作業負荷を低減することが可能となる。
【0083】以上、本発明の好適な実施の形態につい
て、添付図面を参照しながら説明したが、本発明はかか
る構成に限定されない。特許請求の範囲の発明された技
術的思想の範疇において、当業者であれば、各種の変更
例及び修正例に想到し得るものであり、それら変更例及
び修正例についても本発明の技術的範囲に属するものと
了解される。
【0084】
【発明の効果】以上説明したように、本発明によれば、
検索キーとする項目を任意に設定可能とし、文字認識処
理において認識されなかったデータの推定を、過去に蓄
積されたデータを有効に活用することによって、文字認
識率を高め、オペレータの負担の低減を図ることが可能
な文字認識処理システムおよびプログラムを実現するこ
とができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文字認識処理システ
ムの全体構成の一例を示す構成図
【図2】文字認識処理された帳票の一例を示す図
【図3】帳票データ蓄積DBから検索された帳票および
そのデータの一例を示す図
【図4】置換されたデータに置換フラグがセットされた
状態の一例を示す図
【図5】本発明の実施の形態に係る文字認識処理システ
ムの動作を示すフローチャート
【図6】文字認識処理された帳票の一例を示す図
【図7】検索キーとして指定されたデータに認識不可能
なデータを含む帳票の一例を示す図
【符号の説明】
1…文字認識処理システム 2…画像データ変換部 3…画像イメージデータ蓄積データベース 4…文字認識部 5…文字認識データ蓄積データベース 6…検索キー選択部 7…帳票データ検索部 8…一致度演算部 9…文字推定部 10…文字置換部 11…置換後文字認識データ蓄積データベース 12…表示部 13…変更入力部 14…帳票データ蓄積データベース

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数の項目からなる帳票の各データを前
    記帳票の画像イメージに基づいて文字認識処理する文字
    認識手段と、 過去に文字認識された帳票を、この帳票の各項目に対応
    するデータとともに記憶した帳票データ記憶手段と、 前記文字認識手段によって文字認識処理された各データ
    の中に、文字認識されなかったデータがあった場合に
    は、前記文字認識手段によって文字認識されたデータの
    項目に基づいて、前記帳票データ記憶手段に記憶された
    帳票およびその各項目のデータを検索するための検索キ
    ーとなる前記項目を、前記文字認識されたデータに対応
    する項目の中から選択する選択手段と、 前記選択手段によって選択された検索キーの項目に対応
    するデータを含む帳票およびその各項目に対応するデー
    タを前記帳票データ記憶手段から検索する検索手段と、 前記検索手段によって検索された帳票およびその各項目
    に対応するデータに基づいて、前記文字認識されなかっ
    たデータを推定する推定手段と、 前記推定手段によって推定されたデータに前記文字認識
    されなかったデータを置き換える置換手段とを備えたこ
    とを特徴とする文字認識処理システム。
  2. 【請求項2】 請求項1に記載の文字認識処理システム
    において、 前記検索手段によって検索された帳票が複数ある場合に
    は、検索された帳票の各項目に対応するデータと、前記
    文字認識手段によって文字認識処理された帳票の各項目
    に対応するデータとの一致度を、検索された各帳票毎に
    演算する演算手段を付加し、 前記推定手段は、前記演算手段によって演算された一致
    度が所定値以上の帳票の各項目に対応するデータに基づ
    いて、前記文字認識されなかったデータを推定するよう
    にしたことを特徴とする文字認識処理システム。
  3. 【請求項3】 請求項1または請求項2に記載の文字認
    識処理システムにおいて、 前記置換手段によって置き換えられたデータを、異なる
    表示色、または異なる文字サイズ、または異なる修飾方
    法を用いて表示することによって、前記帳票の各データ
    を、この帳票の画像イメージとともに表示する表示手段
    と、 前記表示手段によって表示された前記置き換えられたデ
    ータの変更入力を受け付ける変更入力手段とを付加した
    ことを特徴とする文字認識処理システム。
  4. 【請求項4】 各項目に対応して帳票に記入されたデー
    タに基づいて文字認識処理を行うとともに、文字認識さ
    れなかったデータについては、過去に文字認識処理され
    た帳票およびその各項目に対応するデータに基づいてそ
    の内容を推定することによって文字認識率を高めるコン
    ピュータ読み取り可能なプログラムであって、 複数の項目からなる帳票の各データを前記帳票の画像イ
    メージに基づいて文字認識処理する文字認識手段、 過去に文字認識された帳票を、この帳票の各項目に対応
    するデータとともに記憶した帳票データ記憶手段、 前記文字認識手段によって文字認識処理された各データ
    の中に、文字認識されなかったデータがあった場合に
    は、前記文字認識手段によって文字認識されたデータの
    項目に基づいて、前記帳票データ記憶手段に記憶された
    帳票およびその各項目のデータを検索するための検索キ
    ーとなる前記項目を、前記文字認識されたデータに対応
    する項目の中から選択する選択手段、 前記選択手段によって選択された検索キーの項目に対応
    するデータを含む帳票およびその各項目に対応するデー
    タを前記帳票データ記憶手段から検索する検索手段、 前記検索手段によって検索された帳票およびその各項目
    に対応するデータに基づいて、前記文字認識されなかっ
    たデータを推定する推定手段、 前記推定手段によって推定されたデータに前記文字認識
    されなかったデータを置き換える置換手段をコンピュー
    タに実現させることを特徴とするプログラム。
JP2001126116A 2001-04-24 2001-04-24 文字認識処理システムおよびプログラム Expired - Fee Related JP4190159B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001126116A JP4190159B2 (ja) 2001-04-24 2001-04-24 文字認識処理システムおよびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001126116A JP4190159B2 (ja) 2001-04-24 2001-04-24 文字認識処理システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2002324210A true JP2002324210A (ja) 2002-11-08
JP4190159B2 JP4190159B2 (ja) 2008-12-03

Family

ID=18975208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001126116A Expired - Fee Related JP4190159B2 (ja) 2001-04-24 2001-04-24 文字認識処理システムおよびプログラム

Country Status (1)

Country Link
JP (1) JP4190159B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073174A (ja) * 2008-09-22 2010-04-02 Fuji Xerox Co Ltd 文書処理装置及びプログラム
JP2013196091A (ja) * 2012-03-16 2013-09-30 Mitsubishi Electric Corp データ修正装置
WO2015166925A1 (ja) * 2014-05-01 2015-11-05 智恵子 永井 情報管理支援システムにおけるサーバ、その制御方法、及びその制御プログラム
JP7505432B2 (ja) 2021-03-25 2024-06-25 コニカミノルタ株式会社 医療被ばく線量管理装置及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073174A (ja) * 2008-09-22 2010-04-02 Fuji Xerox Co Ltd 文書処理装置及びプログラム
JP2013196091A (ja) * 2012-03-16 2013-09-30 Mitsubishi Electric Corp データ修正装置
WO2015166925A1 (ja) * 2014-05-01 2015-11-05 智恵子 永井 情報管理支援システムにおけるサーバ、その制御方法、及びその制御プログラム
JP2015222564A (ja) * 2014-05-01 2015-12-10 智恵子 永井 情報管理支援システムにおけるサーバ、その制御方法、及びその制御プログラム
CN106462925A (zh) * 2014-05-01 2017-02-22 永井智惠子 信息管理支援系统中的服务器、其控制方法及其控制程序
US20170053070A1 (en) * 2014-05-01 2017-02-23 Chieko NAGAI Server for information management support system, control method therefor, and control program therefor
JP7505432B2 (ja) 2021-03-25 2024-06-25 コニカミノルタ株式会社 医療被ばく線量管理装置及びプログラム

Also Published As

Publication number Publication date
JP4190159B2 (ja) 2008-12-03

Similar Documents

Publication Publication Date Title
JP2957375B2 (ja) 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法
JP3689455B2 (ja) 情報処理方法及び装置
CA2657212C (en) Systems and methods for data indexing and processing
CN101978348B (zh) 管理关于近似串匹配的档案
JP3958902B2 (ja) 文字列入力装置及び方法
JPH087033A (ja) 情報処理方法及び装置
JP4190159B2 (ja) 文字認識処理システムおよびプログラム
WO2011099082A1 (ja) データベース管理システム
JPH11231998A (ja) ヘルプ表示装置及びヘルプ表示プログラムを記録した媒体
JP2001147923A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP3972309B2 (ja) 情報変換装置及びプログラム
JP7378939B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US20220165076A1 (en) Processing apparatus, processing method, and non-strategy medium
JP3005380B2 (ja) 伝票取引データ入力装置および入力方法
JP3419425B2 (ja) 認識文字補正装置
JP2003233516A (ja) データベース、コンピュータ読取可能なプログラム、データベース管理システム、データベースの新規登録方法、データベースの検索方法、および、データベースの更新登録方法
JP4139805B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPH0830421A (ja) 対話によりコマンドを実行する方法
JPS613245A (ja) 情報整理装置
JP4076533B2 (ja) 情報変換装置及びプログラム
JP2006099346A (ja) 情報変換装置及びプログラム
JPS61281368A (ja) 画像情報検索装置
JP2009252044A (ja) 文書管理システム、方法及びプログラム
JP2000163433A (ja) 同意語登録管理システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees