JP2002324210A - 文字認識処理システムおよびプログラム - Google Patents
文字認識処理システムおよびプログラムInfo
- Publication number
- JP2002324210A JP2002324210A JP2001126116A JP2001126116A JP2002324210A JP 2002324210 A JP2002324210 A JP 2002324210A JP 2001126116 A JP2001126116 A JP 2001126116A JP 2001126116 A JP2001126116 A JP 2001126116A JP 2002324210 A JP2002324210 A JP 2002324210A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character recognition
- character
- item
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
たテ゛ータを有効に活用することによって、文字認識率を高
め、オヘ゜レータの負担の低減を図る。 【解決手段】帳票の画像イメーシ゛に基づいて文字認識処理
する文字認識部4と、過去に文字認識された帳票を記憶
した帳票テ゛ータ蓄積DB14と、文字認識処理された各テ゛ータの
中に、文字認識されなかったテ゛ータがあった場合には、文
字認識されたテ゛ータの項目に基づいて、帳票テ゛ータ蓄積DB14
に記憶された帳票を検索するための検索キーとなる項目
を、文字認識されたテ゛ータに対応する項目の中から選択す
る検索キー選択部6と、選択された検索キーの項目に対応す
るテ゛ータを含む帳票を帳票テ゛ータ蓄積DB14から検索する帳票
テ゛ータ検索部7と、検索された帳票およびその各項目に対
応するテ゛ータに基づいて、文字認識されなかったテ゛ータを推
定する文字推定部9と、推定されたテ゛ータに文字認識され
なかったテ゛ータを置き換える文字置換部10とを備える。
Description
テムおよびプログラムに係り、更に詳しくは、帳票に記
入されたデータに基づいて文字認識処理を行うととも
に、文字認識されなかったデータについては、過去に文
字認識処理された帳票およびそのデータに基づいてその
内容を推定することによって文字認識率を高めることが
可能な文字認識処理システムおよびプログラムに関す
る。
るシステムでは、業務の効率化のためにOCRを利用し
て文字認識を行い、データ入力を簡素化することがよく
行われる。
返し発生するようなデータについては、処理実績として
データベースに蓄積しておき、次回同様のデータが発生
した時に、蓄積されたデータベースから過去の処理実績
を取り出し利用することによりデータ入力を省力化する
場合が多い。この場合、帳票に記入されたデータは以下
のようにして処理がなされる。
理実績としてデータベースに追加更新して行く。
合には、OCRによりその帳票データの画像イメージに
基づいて、読み込んだ帳票データの文字認識を行う。こ
の文字認識処理の結果、文字認識されなかったデータが
あった場合には、以下に示す3)以降の処理を行う。
も、帳票に記入されたデータの文字認識ができないデー
タがあった場合には、予め定められているデータ項目で
あるキー項目のデータに合致する帳票データをデータベ
ースから検索する。
名、科目、口座番号、受取人名、振込金額、依頼人名の
各項目からなる振込依頼帳票において、いずれかの項目
に記入されたデータの文字認識ができないデータがあっ
た場合には、銀行名、支店名、科目、口座番号の各項目
を検索キーとして予め定めておき、これら検索キーのデ
ータに合致する帳票をデータベースから検索する。
果、検索キーとして定められた項目のデータに合致する
帳票が存在する場合には、補正画面上のデータを、検索
された帳票のデータに置き換える。
受取人名が「ヤマ?? タロウ」として正しく認識され
なかったが、3)において銀行名、支店名、科目、口座
番号を検索キーとして設定し、この検索キーに合致する
帳票がデータベースから検索された結果、この銀行名
「XXギンコウ」、支店名「ホンテン」、科目「普
通」、口座番号「12345」に一致する受取人名とし
て「ヤマダ タロウ」が検索された。よって、文字認識
されなかった受取人名「ヤマ?? タロウ」が「ヤマダ
タロウ」というデータに置き換えられる。
た帳票およびそのデータを利用することによって、文字
認識されなかったデータの文字認識の支援がなされてい
る。
うな従来の文字認識処理システムでは、以下のような問
題がある。
ステムでは、検索キーとする項目は、予め定めておくも
のであって、いったん検索キーを決めてしまうと、文字
認識処理する帳票毎にその検索キーを変更するようなこ
とはできない。
目に対するデータが、正しく文字認識されない場合には
利用することができない。たとえば、図6に示すよう
に、帳票データの文字認識処理を行う場合、検索キーと
して銀行名、支店名、科目、口座番号の各項目が指定さ
れ、指定された全ての項目のデータが正しく文字認識処
理されている場合には検索キーとして正しく機能する
が、検索キーとして指定された項目のうちの1つでも認
識されなかった文字があった場合には利用することがで
きない。
て、検索キーとして指定された項目のうちの支店名のデ
ータが認識されなかった場合を示している。
目の中に、認識されなかったデータがある場合には、デ
ータベースに記憶された過去に処理された帳票データを
利用することができないために、帳票に記入されたデー
タをオペレータが読み取り、直接手入力しなくてはなら
ず、オペレータの負担が増大するという問題がある。
ものであり、検索キーとする項目を任意に設定可能と
し、文字認識処理において認識されなかったデータの推
定を、過去に蓄積されたデータを有効に活用して行い、
もって、文字認識率を高め、オペレータの負担の低減を
図ることが可能な文字認識処理システムおよびプログラ
ムを提供することを目的とする。
めに、本発明では、以下のような手段を講じる。
目からなる帳票の各データを帳票の画像イメージに基づ
いて文字認識処理する文字認識手段と、過去に文字認識
された帳票を、この帳票の各項目に対応するデータとと
もに記憶した帳票データ記憶手段と、文字認識手段によ
って文字認識処理された各データの中に、文字認識され
なかったデータがあった場合には、文字認識手段によっ
て文字認識されたデータの項目に基づいて、帳票データ
記憶手段に記憶された帳票およびその各項目のデータを
検索するための検索キーとなる項目を、文字認識された
データに対応する項目の中から選択する選択手段と、選
択手段によって選択された検索キーの項目に対応するデ
ータを含む帳票およびその各項目に対応するデータを帳
票データ記憶手段から検索する検索手段と、検索手段に
よって検索された帳票およびその各項目に対応するデー
タに基づいて、文字認識されなかったデータを推定する
推定手段と、推定手段によって推定されたデータに文字
認識されなかったデータを置き換える置換手段とを備え
る。
ステムにおいては、以上のような手段を講じることによ
り、複数の項目からなる帳票の中から任意の項目を検索
キーとして指定することを可能とし、指定した検索キー
に基づいて過去のデータから類似のデータを検索するこ
とにより、認識されなかったデータの推定を高い精度で
行うことができる。
字認識処理システムにおいて、検索手段によって検索さ
れた帳票が複数ある場合には、検索された帳票の各項目
に対応するデータと、文字認識手段によって文字認識処
理された帳票の各項目に対応するデータとの一致度を、
検索された各帳票毎に演算する演算手段を付加し、推定
手段は、演算手段によって演算された一致度が所定値以
上の帳票の各項目に対応するデータに基づいて、文字認
識されなかったデータを推定する。
ステムにおいては、以上のような手段を講じることによ
り、検索キーに基づいて検索された過去の帳票が複数あ
る場合には、より一致度の高い帳票に基づいて認識され
なかったデータの推定を行うことができるので、推定精
度をより高めることができる。
項2の発明の文字認識処理システムにおいて、置換手段
によって置き換えられたデータを、異なる表示色、また
は異なる文字サイズ、または異なる修飾方法を用いて表
示することによって、帳票の各データを、この帳票の画
像イメージとともに表示する表示手段と、表示手段によ
って表示された置き換えられたデータの変更入力を受け
付ける変更入力手段とを付加する。
ステムにおいては、以上のような手段を講じることによ
り、置き換えられたデータについては、データが置き換
えられたことを容易に認識することができる。また、入
力された画像イメージと比較することによって、データ
の変更を要する場合には、変更するデータを入力するこ
ともできる。
票に記入されたデータに基づいて文字認識処理を行うと
ともに、文字認識されなかったデータについては、過去
に文字認識された帳票およびその各項目に対応するデー
タに基づいてその内容を推定することによって文字認識
率を高めるコンピュータ読み取り可能なプログラムであ
って、複数の項目からなる帳票の各データを帳票の画像
イメージに基づいて文字認識処理する文字認識手段、過
去に文字認識処理された帳票を、この帳票の各項目に対
応するデータとともに記憶した帳票データ記憶手段、文
字認識手段によって文字認識処理された各データの中
に、文字認識されなかったデータがあった場合には、文
字認識手段によって文字認識されたデータの項目に基づ
いて、帳票データ記憶手段に記憶された帳票およびその
各項目のデータを検索するための検索キーとなる項目
を、文字認識されたデータに対応する項目の中から選択
する選択手段、選択手段によって選択された検索キーの
項目に対応するデータを含む帳票およびその各項目に対
応するデータを帳票データ記憶手段から検索する検索手
段、検索手段によって検索された帳票およびその各項目
に対応するデータに基づいて、文字認識されなかったデ
ータを推定する推定手段、推定手段によって推定された
データに文字認識されなかったデータを置き換える置換
手段をコンピュータに実現させるプログラムである。
いては、以上のような手段を講じることにより、複数の
項目からなる帳票の中から任意の項目を検索キーとして
指定することを可能とし、指定した検索キーに基づいて
過去のデータから類似のデータを検索することにより、
認識されなかったデータの推定を高い精度で行うことが
できる。
いて図面を参照しながら説明する。
て説明する。
識処理システムの全体構成の一例を示す構成図である。
ステム1は、ワークステーション等の計算機からなり、
画像データ変換部2と、画像イメージデータ蓄積データ
ベース(画像イメージデータ蓄積DB)3と、文字認識
部4と、文字認識データ蓄積データベース(文字認識デ
ータ蓄積DB)5と、検索キー選択部6と、帳票データ
検索部7と、一致度演算部8と、文字推定部9と、文字
置換部10と、置換後文字認識データ蓄積データベース
(置換後文字認識データ蓄積DB)11と、表示部12
と、変更入力部13と、帳票データ蓄積データベース
(帳票データ蓄積DB)14とを備えている。
用いられ、手書きで帳票に記入されたデータを画像デー
タに変換し、変換した画像データを画像イメージデータ
蓄積DB3に記憶させると共に、文字認識部4に出力す
る。
ータ変換部2から出力された帳票の画像データを記憶す
る。また、表示部12からの要求に基づいて、記憶して
いる画像データを表示部12に出力する。
れ、画像データ変換部2から出力された画像データに基
づいて、文字認識処理を行う。そして、文字認識された
結果である文字認識データを文字認識データ蓄積DB5
に記憶させると共に、検索キー選択部6に出力する。な
お、図2に、文字認識部4によって文字認識処理された
帳票の一例を示す。この帳票は、銀行名、支店名、科
目、口座番号、受取人名、振込金額、依頼人名の各項目
からなるものであって、銀行名、科目、口座番号、振込
金額、依頼人名については正しく文字認識されており、
支店名、受取人名については認識されなかった場合を示
している。
一例を示すような文字認識部4から出力された文字認識
データを記憶する。また、検索キー選択部6からの要求
に基づいて、記憶している文字認識データを検索キー選
択部6に出力する。
力された文字認識データ、または文字認識データ蓄積D
B5から必要に応じて取得した文字認識データに基づい
て、各項目のうちのいずれかに、文字認識されなかった
データがあった場合には、データが文字認識された項目
に基づいて、帳票データ蓄積DB14に記憶された帳票
およびその各項目に対応するデータを検索するための検
索キーとなる項目を、文字認識されたデータに対応する
項目の中から選択し、その選択結果を帳票データ検索部
7に出力する。
タの場合、支店名、受取人名は文字認識されなかった項
目である。これを、文字認識された項目である銀行名、
科目、口座番号、振込金額、振込人名のうちのいずれか
の項目を検索キーとして選択する。なお、検索キーとし
て選択する項目の数は任意である。
から出力された文字認識データ、または文字認識データ
蓄積DB5から必要に応じて取得した文字認識データに
基づいて、各項目のデータが全て文字認識された場合に
は、この文字認識データを表示部12に出力する。
によって選択された検索キーの項目を含む帳票およびそ
の各項目に対応するデータを帳票データ蓄積DB14か
ら検索し、その検索結果を一致度演算部8に出力する。
図3は、検索キー選択部6において検索キーとして銀行
名、科目、口座番号が選択された場合において、帳票デ
ータ蓄積DB14から検索された帳票およびその項目に
対応するデータの一例を示すものである。銀行名として
「XXギンコウ」、科目として「普通」、口座番号とし
て「12345」の検索キーで検索した結果、支店名と
して「シンジュク」、受取人名として「サトウ ハナ
コ」のデータ1)と、支店名として「ホンテン」、受取
人名として「ヤマダ タロウ」のデータ2)とが検索さ
れた。
よって検索された帳票のデータについて、文字認識部4
によって文字認識処理された帳票とのデータの一致度を
演算する。なお、帳票データ検索部7によって検索され
た帳票が複数ある場合には、文字認識部4によって文字
認識処理された帳票の各データとの一致度を、検索され
た各帳票毎に演算する。そして、演算した結果である一
致度を文字推定部9に出力する。
(1)式に基づいて行う。すなわち、 α=Σfn(rn,jn)/len(rn,jn)×φn …(1) 但し、 Σfn(x,y):文字列xと文字列yとを比較し、一
致した文字数を求める関数。 len(x,y):文字列xと文字列yについて文字数
の大きい方の値を求める関数。 rn:認識結果のn番目の項目。 jn:実績検索結果のn番目の項目。 φn:n番目の項目の重み係数。
は、各項目の文字種類による認識精度を考慮した重み付
けを行うために設定するものであり、例えば、認識精度
の高い数字項目は高く、認識精度の低いカタカナ、漢字
項目は低く設定する。
って1件のみの帳票が検索された場合であって、その帳
票について一致度演算部8によりなされた一致度αが、
所定基準値以上である場合には、この検索された帳票の
内容を正とする。この場合、文字置換部10は、帳票デ
ータ検索部7によって検索された帳票のデータに基づい
て、文字認識部4によって認識されなかったデータを置
き換えるとともに、置き換えを行ったデータについて
は、置き換えたことが識別できるように置換フラグをセ
ットする。なお、置換フラグについては後述する。
7によって複数の帳票が検索された場合には、一致度演
算部8によってなされた一致度αが最大値を示す帳票の
内容を正とする。この場合、文字置換部10は、帳票デ
ータ検索部7によって検索された帳票のデータに基づい
て、文字認識部4によって認識されなかったデータを置
き換えるとともに、置き換えを行ったデータについて
は、置き換えたことが識別できるように置換フラグをセ
ットする。
の置き換えがなされるとともに、置き換えられたデータ
について置換フラグがセットされた状態を示す図であ
る。図2に示す帳票との一致度αを、図3に示すデータ
1)、およびデータ2)のそれぞれについて演算した場
合、データ2)の方が一致度αの値が大きい。したがっ
て、図2に示す帳票において支店名は、データ2)に入
力されている「ホンテン」が正であり、受取人もまたデ
ータ2)に入力されている「ヤマダ タロウ」が正であ
る。したがって、図2の帳票における支店名「ホン?
?」を「ホンテン」を置き換え、受取人名「ヤマ??
タロウ」を「ヤマダ タロウ」に置き換えている。更
に、置き換えられたデータについては、データとともに
括弧付きで付された置換フラグのデータを「1」として
いる。図2に示す帳票のうち銀行名、科目、口座番号の
データについてはデータが置き換えられていないので置
換フラグのデータを「0」としている。なお、図2に示
す帳票のデータのうち振込金額と依頼人名については、
図3に示す帳票のデータとの比較を行っていないので置
換フラグを付していない。
ータの置き換えを行った置換後文字認識データを置換後
文字認識データ蓄積DB11に記憶させると共に、表示
部12に出力する。なお、帳票データ検索部7によって
帳票データが検索されなかった場合、あるいは帳票デー
タ検索部7によって検索された帳票データがあった場合
であっても、一致度演算部8によって演算された一致度
αの値が所定基準値に満たない場合には、データの置き
換えは行わない。文字置換部10は、このようにデータ
の置き換えを行わなかった場合であっても、文字推定部
9から出力された文字認識データを表示部12に出力す
る。
4にその一例を示すような置換後文字認識データが文字
置換部10から出力されると、その出力された置換後文
字認識データを記憶する。また、表示部12からの要求
に基づいて、記憶している置換後文字認識データを表示
部12に出力する。
後文字認識データ蓄積DB11から出力された置換後文
字認識データを、画像イメージデータ蓄積DB3に蓄積
されたこの帳票の画像データとともに画面表示する。こ
の場合、文字置換部10によって置換されたデータにつ
いては、置換フラグが「1」であることを認識すること
によって、異なる表示色、または異なる文字サイズ、ま
たは異なる修飾方法を用いて表示する。これによって、
置換されたデータであることが識別できるようにしてい
る。置換されたデータの確度を明らかにするため、一致
度αの値により色を分けて表示するようにしても良い。
ら、認識されなかったデータがあるにもかかわらずその
データの置換がなされなかった文字認識データが出力さ
れた場合には、認識されなかったデータが含まれた文字
認識データを、画像イメージデータ蓄積DB3に蓄積さ
れたこの帳票の画像データとともに画面表示する。
ら全てのデータが認識された文字認識データが出力され
た場合には、この文字認識データを、画像イメージデー
タ蓄積DB3に蓄積されたこの帳票の画像データととも
に画面表示する。
帳票に対応する画像データを表示部12に並列して画面
表示することによって、オペレータが両データの内容を
対比できるようにしている。
字認識データの中に、誤って認識されたデータや誤って
置換されたデータがあるものと判断した場合には、変更
入力部13より変更データを入力することによって、任
意の文字認識データの内容を変更することを可能として
いる。
れていないデータが含まれている場合には、オペレータ
が、この文字認識データに対応する帳票の画像データか
らそのデータを読み取ることによって、読み取ったデー
タをこの変更入力部13から手入力することを可能とし
ている。
データの入力、あるいは認識されなかったデータの入力
がなされると、入力されたデータに基づいて、文字認識
データの内容を更新する。
全て完了した場合には、オペレータが、変更入力部13
に備えられた図示しない確定キーを押圧することによっ
て、文字認識データが確定されるとともに、確定された
文字認識データが帳票データ蓄積DB14に出力される
ようにしている。
3から出力された文字認識データを、過去に文字認識処
理された帳票、およびこの帳票の各項目に対するデータ
として記憶する。この記憶された帳票、およびこの帳票
の各項目に対するデータは、帳票データ検索部7によっ
て行われる検索に供される。
係る文字認識処理システム1は、例えば磁気ディスク等
の記憶媒体に記憶されたプログラムを読み込み、このプ
ログラムによって動作が制御されるコンピュータによっ
て実現される。
の形態に係る文字認識処理システムの動作について図5
に示すフローチャートを用いて説明する。
ステム1を用いて帳票に記入されたデータを処理する場
合には、まず、各項目に手書きでデータが記入された帳
票が、画像データ変換部2によって画像データに変換さ
れる(S1)。変換された画像データは、画像データ変
換部2から画像イメージデータ蓄積DB3に出力され、
そこで記憶されると共に、文字認識部4に出力される。
力された画像データは、文字認識部4によって、文字認
識処理が行われる(S2)。文字認識された結果である
文字認識データは、文字認識部4から文字認識データ蓄
積DB5に出力され、そこで記憶されると共に、検索キ
ー選択部6に出力される。
文字認識データが出力される。また、必要に応じて、文
字認識データ蓄積DB5に記憶されている文字認識デー
タを取得することも可能である。検索キー選択部6で
は、文字認識部4から出力された文字認識データ、また
は文字認識データ蓄積DB5から必要に応じて取得した
文字認識データに基づいて、各データの中に、文字認識
されなかったデータがあった場合(S3:Yes)に
は、文字認識されたデータの項目に基づいて、帳票デー
タ蓄積DB14に記憶された帳票およびその各項目に対
応するデータを検索するための検索キーとなる項目が、
文字認識されたデータに対応する項目の中から選択され
る(S4)。そして、このようにして選択された検索キ
ーは、帳票データ検索部7に出力される。
識データ、または文字認識データ蓄積DB5から必要に
応じて取得した文字認識データに基づいて、各項目のデ
ータが全て文字認識されている場合(S3:No)に
は、この文字認識データは、検索キー選択部6から表示
部12へ出力される(S11)。
索キーの項目を含む帳票およびその各項目に対応するデ
ータが帳票データ蓄積DB14から検索され、その検索
結果が一致度演算部8に出力される(S5)。
によって検索された帳票の各項目に対応するデータにつ
いて、文字認識部4によって文字認識処理された帳票の
各項目に対応するデータとの一致度αの演算がなされる
(S6)。なお、帳票データ検索部7によって検索され
た帳票が複数ある場合には、文字認識部4によって文字
認識処理された帳票の各項目に対応するデータとの一致
度αが、検索された各帳票毎に演算される。そして、演
算した結果である一致度αは、文字推定部9に出力され
る。
よって1件のみの帳票が検索された場合(S7:1件)
であって、その帳票について一致度演算部8によってな
された一致度αが、所定基準値以上である場合(S8:
Yes)には、この検索された帳票の内容が正とされ
る。この場合、文字置換部10によって、帳票データ検
索部7によって検索された帳票のデータに基づいて、文
字認識部4によって認識できなかったデータが置換され
る(S9)。置換されたデータについては、置換フラグ
がセットされる。
部7によって複数の帳票が検索された場合(S7:2件
以上)には、一致度演算部8によってなされた一致度α
が最大値を示す帳票の内容が正とされる(S18)。こ
の場合、文字置換部10によって、帳票データ検索部7
によって検索された帳票のデータに基づいて、文字認識
部4によって認識されなかったデータが置換される(S
9)。置換されたデータについては、置換フラグがセッ
トされる。
文字認識データは、文字置換部10から置換後文字認識
データ蓄積DB11に出力され、そこで記憶されると共
に、表示部12にもまた出力される(S10)。
検索されなかった場合(S7:0件)、あるいは帳票デ
ータ検索部7によって検索された帳票があった場合であ
っても、一致度演算部8によって演算された一致度αの
値が所定基準値に満たない場合(S8:No)には、デ
ータは置換されない。このように、データが置換されな
かった場合でも、文字推定部9から出力された文字認識
データは、文字置換部10から表示部12に出力される
(S11)。
字認識データは、画像イメージデータ蓄積DB3に蓄積
されたこの帳票の画像データとともに画面表示される
(S12)。この場合、文字置換部10によって置換さ
れたデータについては、置換フラグが「1」であること
を認識することによって、異なる表示色、または異なる
文字サイズ、または異なる修飾方法を用いて表示され
る。これによって、置換されたデータであることが識別
される。また、置換されたデータの確度を明らかにする
ために、一致度αの値により色を分けて表示することも
可能である。
帳票に対応する画像データとが並列表示されることによ
って、オペレータによって両データの内容が対比され、
文字認識部4によってデータが正しく認識されたか否
か、あるいは文字置換部10によってデータが正しく置
換されたか否かが確認される(S13)。
字認識データの中に、誤って認識されたデータや、誤っ
て置換されたデータがあるものと判断した場合、あるい
は文字認識されていないデータが含まれている場合(S
14:Yes)には、オペレータによって、変更入力部
13から変更データの入力がなされ、文字認識データの
内容が変更される(S15)。
ない場合(S14:No)、またはこのようにして変更
入力部13に、オペレータからの変更データの入力、あ
るいは認識されなかったデータの入力がなされると、入
力されたデータに基づいて、文字認識データの内容が更
新され、確定される(S16)。
文字認識データは、変更入力部13から帳票データ蓄積
DB14に出力され、過去に文字認識処理された帳票、
およびこの帳票の各項目に対応するデータとして記憶さ
れる(S17)。この記憶された帳票、およびこの帳票
の各項目に対応するデータは、ステップS5において行
われる検索に供される。
認識処理システム1は、記憶媒体に格納したプログラム
をコンピュータに読み込ませることで実現させることが
できる。
ク、フロッピー(登録商標)ディスク、ハードディス
ク、光ディスク(CD−ROM、DVD等)、光磁気デ
ィスク(MO等)、半導体メモリ等、プログラムを記憶
でき、かつコンピュータが読み取り可能な記憶媒体であ
れば、その記憶形式は何れの形態であってもよい。
トールされたプログラムの指示に基づきコンピュータ上
で稼働しているOS(オペレーティングシステム)や、
データベース管理ソフト、ネットワークソフト等のMW
(ミドルウェア)等が本発明の実施の形態を実現するた
めの各処理の一部を実行してもよい。
媒体は、コンピュータと独立した媒体に限らず、LAN
やインターネット等により伝送されたプログラムをダウ
ンロードして記憶または一時記憶した記憶媒体も含まれ
る。
体から本実施の形態における処理が実行される場合も本
発明における記憶媒体に含まれ、媒体構成は何らの構成
であってもよい。
ュータは、記憶媒体に記憶されたプログラムに基づき、
同実施の形態における各処理を実行するものであって、
パソコン等の1つからなる装置、複数の装置がネットワ
ーク接続されたシステム等の何れの構成であってもよ
い。
とは、パソコンに限らず、情報処理機器に含まれる演算
処理装置、マイコン等も含み、プログラムによって同実
施の形態の機能を実現することが可能な機器、装置を総
称している。
る文字認識処理システムにおいては、上記のような作用
により、文字認識部4によってなされた文字認識処理の
結果、認識されないデータがあった場合、認識されたデ
ータに対応する項目の中から任意に検索キーを選択する
ことができる。このように、検索キーを任意に選択する
ことができることから、過去に処理された帳票の中から
データの一致率の高い帳票を柔軟に検索することができ
るようになり、過去に処理された帳票およびその各項目
に対応するデータを有効に利用することが可能となる。
て、過去に処理された帳票の中から、データの一致率の
高い帳票を検索することができる。検索された帳票は、
データ一致率の高い帳票であるために、このデータを用
いて置き換えられたデータは、正しいデータであるとい
う確率が極めて高い。したがって、誤った置換えを防止
し、より精度の高い置換えを行うことが可能となる。
データを、データが記入された状態の画像データと併せ
て表示することによって、正しく文字認識されたこと、
あるいは正しく置換されたことを確認するとともに、必
要な場合にはその内容を修正することもできる。
文字認識処理システムを用いることによって、帳票の画
像データから認識されない文字があった場合であって
も、過去に処理された帳票、およびその項目に対応する
データを利用することによって、認識されない文字を、
より高い精度で推定し、推定したデータに置き換えるこ
とによって認識することが可能となる。これによって、
オペレータの作業負荷を低減することが可能となる。
て、添付図面を参照しながら説明したが、本発明はかか
る構成に限定されない。特許請求の範囲の発明された技
術的思想の範疇において、当業者であれば、各種の変更
例及び修正例に想到し得るものであり、それら変更例及
び修正例についても本発明の技術的範囲に属するものと
了解される。
検索キーとする項目を任意に設定可能とし、文字認識処
理において認識されなかったデータの推定を、過去に蓄
積されたデータを有効に活用することによって、文字認
識率を高め、オペレータの負担の低減を図ることが可能
な文字認識処理システムおよびプログラムを実現するこ
とができる。
ムの全体構成の一例を示す構成図
そのデータの一例を示す図
状態の一例を示す図
ムの動作を示すフローチャート
なデータを含む帳票の一例を示す図
Claims (4)
- 【請求項1】 複数の項目からなる帳票の各データを前
記帳票の画像イメージに基づいて文字認識処理する文字
認識手段と、 過去に文字認識された帳票を、この帳票の各項目に対応
するデータとともに記憶した帳票データ記憶手段と、 前記文字認識手段によって文字認識処理された各データ
の中に、文字認識されなかったデータがあった場合に
は、前記文字認識手段によって文字認識されたデータの
項目に基づいて、前記帳票データ記憶手段に記憶された
帳票およびその各項目のデータを検索するための検索キ
ーとなる前記項目を、前記文字認識されたデータに対応
する項目の中から選択する選択手段と、 前記選択手段によって選択された検索キーの項目に対応
するデータを含む帳票およびその各項目に対応するデー
タを前記帳票データ記憶手段から検索する検索手段と、 前記検索手段によって検索された帳票およびその各項目
に対応するデータに基づいて、前記文字認識されなかっ
たデータを推定する推定手段と、 前記推定手段によって推定されたデータに前記文字認識
されなかったデータを置き換える置換手段とを備えたこ
とを特徴とする文字認識処理システム。 - 【請求項2】 請求項1に記載の文字認識処理システム
において、 前記検索手段によって検索された帳票が複数ある場合に
は、検索された帳票の各項目に対応するデータと、前記
文字認識手段によって文字認識処理された帳票の各項目
に対応するデータとの一致度を、検索された各帳票毎に
演算する演算手段を付加し、 前記推定手段は、前記演算手段によって演算された一致
度が所定値以上の帳票の各項目に対応するデータに基づ
いて、前記文字認識されなかったデータを推定するよう
にしたことを特徴とする文字認識処理システム。 - 【請求項3】 請求項1または請求項2に記載の文字認
識処理システムにおいて、 前記置換手段によって置き換えられたデータを、異なる
表示色、または異なる文字サイズ、または異なる修飾方
法を用いて表示することによって、前記帳票の各データ
を、この帳票の画像イメージとともに表示する表示手段
と、 前記表示手段によって表示された前記置き換えられたデ
ータの変更入力を受け付ける変更入力手段とを付加した
ことを特徴とする文字認識処理システム。 - 【請求項4】 各項目に対応して帳票に記入されたデー
タに基づいて文字認識処理を行うとともに、文字認識さ
れなかったデータについては、過去に文字認識処理され
た帳票およびその各項目に対応するデータに基づいてそ
の内容を推定することによって文字認識率を高めるコン
ピュータ読み取り可能なプログラムであって、 複数の項目からなる帳票の各データを前記帳票の画像イ
メージに基づいて文字認識処理する文字認識手段、 過去に文字認識された帳票を、この帳票の各項目に対応
するデータとともに記憶した帳票データ記憶手段、 前記文字認識手段によって文字認識処理された各データ
の中に、文字認識されなかったデータがあった場合に
は、前記文字認識手段によって文字認識されたデータの
項目に基づいて、前記帳票データ記憶手段に記憶された
帳票およびその各項目のデータを検索するための検索キ
ーとなる前記項目を、前記文字認識されたデータに対応
する項目の中から選択する選択手段、 前記選択手段によって選択された検索キーの項目に対応
するデータを含む帳票およびその各項目に対応するデー
タを前記帳票データ記憶手段から検索する検索手段、 前記検索手段によって検索された帳票およびその各項目
に対応するデータに基づいて、前記文字認識されなかっ
たデータを推定する推定手段、 前記推定手段によって推定されたデータに前記文字認識
されなかったデータを置き換える置換手段をコンピュー
タに実現させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001126116A JP4190159B2 (ja) | 2001-04-24 | 2001-04-24 | 文字認識処理システムおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001126116A JP4190159B2 (ja) | 2001-04-24 | 2001-04-24 | 文字認識処理システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002324210A true JP2002324210A (ja) | 2002-11-08 |
JP4190159B2 JP4190159B2 (ja) | 2008-12-03 |
Family
ID=18975208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001126116A Expired - Fee Related JP4190159B2 (ja) | 2001-04-24 | 2001-04-24 | 文字認識処理システムおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4190159B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010073174A (ja) * | 2008-09-22 | 2010-04-02 | Fuji Xerox Co Ltd | 文書処理装置及びプログラム |
JP2013196091A (ja) * | 2012-03-16 | 2013-09-30 | Mitsubishi Electric Corp | データ修正装置 |
WO2015166925A1 (ja) * | 2014-05-01 | 2015-11-05 | 智恵子 永井 | 情報管理支援システムにおけるサーバ、その制御方法、及びその制御プログラム |
JP7505432B2 (ja) | 2021-03-25 | 2024-06-25 | コニカミノルタ株式会社 | 医療被ばく線量管理装置及びプログラム |
-
2001
- 2001-04-24 JP JP2001126116A patent/JP4190159B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010073174A (ja) * | 2008-09-22 | 2010-04-02 | Fuji Xerox Co Ltd | 文書処理装置及びプログラム |
JP2013196091A (ja) * | 2012-03-16 | 2013-09-30 | Mitsubishi Electric Corp | データ修正装置 |
WO2015166925A1 (ja) * | 2014-05-01 | 2015-11-05 | 智恵子 永井 | 情報管理支援システムにおけるサーバ、その制御方法、及びその制御プログラム |
JP2015222564A (ja) * | 2014-05-01 | 2015-12-10 | 智恵子 永井 | 情報管理支援システムにおけるサーバ、その制御方法、及びその制御プログラム |
CN106462925A (zh) * | 2014-05-01 | 2017-02-22 | 永井智惠子 | 信息管理支援系统中的服务器、其控制方法及其控制程序 |
US20170053070A1 (en) * | 2014-05-01 | 2017-02-23 | Chieko NAGAI | Server for information management support system, control method therefor, and control program therefor |
JP7505432B2 (ja) | 2021-03-25 | 2024-06-25 | コニカミノルタ株式会社 | 医療被ばく線量管理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4190159B2 (ja) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2957375B2 (ja) | 文書書式のデジタル・イメージの文字認識誤りを修復するデータ処理システム及び方法 | |
JP3689455B2 (ja) | 情報処理方法及び装置 | |
CA2657212C (en) | Systems and methods for data indexing and processing | |
CN101978348B (zh) | 管理关于近似串匹配的档案 | |
JP3958902B2 (ja) | 文字列入力装置及び方法 | |
JPH087033A (ja) | 情報処理方法及び装置 | |
JP4190159B2 (ja) | 文字認識処理システムおよびプログラム | |
WO2011099082A1 (ja) | データベース管理システム | |
JPH11231998A (ja) | ヘルプ表示装置及びヘルプ表示プログラムを記録した媒体 | |
JP2001147923A (ja) | 類似文書検索装置、類似文書検索方法及び記録媒体 | |
JP2932667B2 (ja) | 情報の検索方法および情報蓄積装置 | |
JP3972309B2 (ja) | 情報変換装置及びプログラム | |
JP7378939B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20220165076A1 (en) | Processing apparatus, processing method, and non-strategy medium | |
JP3005380B2 (ja) | 伝票取引データ入力装置および入力方法 | |
JP3419425B2 (ja) | 認識文字補正装置 | |
JP2003233516A (ja) | データベース、コンピュータ読取可能なプログラム、データベース管理システム、データベースの新規登録方法、データベースの検索方法、および、データベースの更新登録方法 | |
JP4139805B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JPH0830421A (ja) | 対話によりコマンドを実行する方法 | |
JPS613245A (ja) | 情報整理装置 | |
JP4076533B2 (ja) | 情報変換装置及びプログラム | |
JP2006099346A (ja) | 情報変換装置及びプログラム | |
JPS61281368A (ja) | 画像情報検索装置 | |
JP2009252044A (ja) | 文書管理システム、方法及びプログラム | |
JP2000163433A (ja) | 同意語登録管理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060905 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080821 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080916 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130926 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |