JPH10105654A - 帳票用文字認識装置 - Google Patents

帳票用文字認識装置

Info

Publication number
JPH10105654A
JPH10105654A JP8258747A JP25874796A JPH10105654A JP H10105654 A JPH10105654 A JP H10105654A JP 8258747 A JP8258747 A JP 8258747A JP 25874796 A JP25874796 A JP 25874796A JP H10105654 A JPH10105654 A JP H10105654A
Authority
JP
Japan
Prior art keywords
character
character string
cell
recognition
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8258747A
Other languages
English (en)
Inventor
Hideyuki Adachi
秀行 足立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AIBITSUKUSU KK
Original Assignee
AIBITSUKUSU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AIBITSUKUSU KK filed Critical AIBITSUKUSU KK
Priority to JP8258747A priority Critical patent/JPH10105654A/ja
Publication of JPH10105654A publication Critical patent/JPH10105654A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 帳票を銀行窓口などのスキャナなどで読み取
って本体側で文字認識する装置では辞書ファイルを使用
するものがあるが、顧客が振込依頼書に記入するであろ
う文字列をほぼ網羅的に辞書ファイルに予め登録してお
くのは困難である。 【解決手段】 セル文字列認識手段15の認識結果とし
て得られた文字列をディスプレイ24に表示する。ま
た、セル文字列認識手段15の認識結果としての文字列
に対して必要な修正操作を施すための修正手段25を備
えている。そして、この修正手段により修正された文字
列をフィールドの分類に従ってカテゴリ辞書ファイル3
4に登録する自動学習登録手段18とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この出願に係る発明は、帳票
をスキャナなどで読み取り、この読み取った画像情報か
ら、辞書ファイルを参照して、文字列を認識する帳票用
文字認識装置に関する。
【0002】
【従来の技術】従来、この種の帳票用文字認識装置とし
ては、次のような装置があった。例えば、銀行の営業所
窓口において振込依頼を行うに際しては、顧客があらか
じめ銀行側によって決められた帳票、すなわち、振込依
頼書に必要事項を書き込む。必要事項とは、例えば、振
込依頼人名、振込先銀行名、振込先受取人名などであ
る。これらの事項を銀行が指定する振込依頼書の所定の
記入欄に書き込んで、営業窓口に持ち込む。窓口の業務
員はこの依頼書を受取り、これを端末装置のスキャナで
読み取る。この依頼書のフォーマットはすでに装置本体
側に登録されているため、スキャナで読み取った画像情
報を本体側に伝送すると、本体装置は、この画像情報を
振込依頼書のフォーマットに照らして、この画像情報か
らセル文字を切り取り、1文字単位でセル文字を文字認
識してから、振込依頼書のフィールド(項目)単位で文
字列として合成する。そして、この合成された文字列
は、辞書ファイルを照合することにより、辞書ファイル
の登録された文字列のうちの近似するものに置き換えら
れる。よって、誤認識された文字や認識不能の文字を多
少含むような文字列であっても、正しい文字列に置き換
えられる。また、この辞書ファイルは振込依頼書のフィ
ールド(項目)毎の分類がされているので、そのフィー
ルド(項目)に応じた的確な文字列に置き換えられる。
【0003】
【発明が解決しようとする課題】しかし、上述した装置
では、辞書ファイルに登録されていない文字列が、振込
依頼書に記入されたような場合は、この辞書ファイルは
用をなさない。したがって、顧客が振込依頼書に記入す
るであろう文字列をほぼ網羅的に辞書ファイルに予め登
録しておけばよいのであるが、例えば、顧客が振込依頼
書に、新しくできた銀行の支店名などの文字列を記入す
る場合も多いので、顧客の記入するであろうすべての文
字列を予想して、これを予め辞書ファイルに登録してお
くのは、非常に困難である。
【0004】この出願に係る発明の目的は、かかる従来
の課題に鑑み、使用を重ねるに従って徐々に辞書ファイ
ルの内容が充実し、よって、顧客が帳票に記入するであ
ろう文字列を予め網羅的に登録しておく必要のないよう
な帳票用文字認識装置を提供することにある。
【0005】また、この出願に係る他の発明の目的は、
帳票のフィールド間の相関関係や、過去に処理された帳
票の内容を利用して、精度の高い文字列認識ができるよ
うな帳票用文字認識装置を提供することにある。
【0006】
【課題を解決するための手段】この出願に係る発明は、
セル文字列認識手段の認識結果として得られた文字列を
表示手段に表示する。また、セル文字列認識手段の認識
結果としての文字列に対して必要な修正操作を施すため
の修正手段を備えている。そして、この修正手段により
修正された文字列をフィールドの分類に従って辞書ファ
イルに登録する登録手段とを備えている。
【0007】従って、装置を使用するに従い、修正後の
文字列が辞書ファイルに登録されていき、辞書ファイル
の内容が充実していく。
【0008】また、この出願に係る他の発明は、帳票フ
ォーマット単位で互いのフィールドがどのように関係し
ているかという相関関係を登録ファイルに登録する。そ
して、この登録ファイルに登録された相関関係に基づい
て、セル文字列認識手段により認識された複数のフィー
ルドの文字列の組み合わせに近似するものを、過去に処
理された帳票の複数のフィールドの文字列の組み合わせ
の中から検索する。そして、この検索結果によってセル
文字列認識手段の認識結果としての文字列を補正する。
【0009】従って、フィールド間の相関関係と過去の
帳票処理の内容とを利用して、より精度の高い文字列認
識ができる。
【0010】
【発明の実施の形態】この出願に係る発明の帳票用文字
認識装置は、帳票を光学的に読み取りその画像情報を得
る読み取り手段と、文字列を帳票のフィールド毎に分類
して登録するための辞書ファイルと、前記画像情報を前
記帳票の帳票フォーマットに照らし、この画像情報から
セル文字を切り取り、この切り取られたセル文字を文字
認識してから帳票のフィールド単位で文字列として合成
し、この合成された文字列を前記辞書ファイルに登録さ
れたそのフィールドに属する文字列のうちの近似するも
のとして認識するセル文字列認識手段とを備えた帳票用
文字認識装置において、前記セル文字列認識手段の認識
結果として得られた文字列を表示する表示手段と、前記
セル文字列認識手段の認識結果としての文字列に対して
必要な修正操作を施すための修正手段と、この修正手段
により修正された文字列をフィールドの分類に従って前
記辞書ファイルに登録する登録手段とを備えている。
【0011】従って、操作者は、表示手段に表示された
文字列を見ながら、文字列の修正を行うことができる。
しかも、修正後の文字列を辞書ファイルに登録すること
ができるので、辞書ファイルの内容を徐々に充実させる
ことができる。
【0012】かかる帳票用文字認識装置のうち、表示手
段が、セル文字列認識手段の認識結果として得られた文
字列とともに、画像情報から切り取られた前記セル文字
を表示するものにあっては、認識結果としての文字列と
画像情報とを表示手段上で比較しながら修正操作をする
ことができるので、修正操作が容易になる。
【0013】また、この出願に係る他の発明の帳票用文
字認識装置は、帳票を光学的に読み取りその画像情報を
得る読み取り手段と、文字列を帳票のフィールド毎に分
類して登録するための辞書ファイルと、前記画像情報を
前記帳票の帳票フォーマットに照らし、この画像情報か
らセル文字を切り取り、この切り取られたセル文字を文
字認識してから帳票のフィールド単位で文字列として合
成し、この合成された文字列を前記辞書ファイルに登録
されたそのフィールドに属する文字列のうちの近似する
ものとして認識するセル文字列認識手段とを備えた帳票
用文字認識装置において、前記帳票フォーマット単位で
互いのフィールドがどのように関係しているかという相
関関係を登録しておく登録ファイルと、この登録ファイ
ルに登録された相関関係に基づいて、前記セル文字列認
識手段により認識された複数のフィールドの文字列の組
み合わせに近似するものを、過去に処理された帳票の複
数のフィールドの文字列の組み合わせの中から検索する
検索手段と、この検索手段の検索結果によって前記セル
文字列認識手段の認識結果としての文字列を補正する補
正手段とを備えている。
【0014】従って、フィールド間の相関関係と過去の
帳票処理の内容とを利用して、セル文字列認識手段の認
識結果が補正される。よって、より的確な文字列認識を
行うことができる。
【0015】かかる帳票用文字認識装置のうち、補正手
段の出力として得られた文字列を表示する表示手段と、
補正手段の出力としての文字列に対して必要な修正操作
を施すための修正手段と、この修正手段により修正操作
が施された文字列をフィールドの分類に従って辞書ファ
イルに登録する登録手段とを備えたものにあっては、操
作者が表示手段に表示された文字列を見ながら、補正手
段の出力としての文字列の修正を行うことができる。し
かも、修正後の文字列を辞書ファイルに登録することが
できるので、辞書ファイルの内容を徐々に充実させるこ
とができる。
【0016】かかる帳票用文字認識装置のうち、補正手
段の出力としての複数の文字列に対して、この中に修正
手段によって修正された文字列が含まれる場合にはその
文字列を修正後の文字列に置き換えてから、この複数の
文字列を帳票フォーマット単位で記録するための記録フ
ァイルを備えたものにあっては、帳票を処理する毎に、
記録ファイルに内容が追加される。よって、記録ファイ
ルの内容を徐々に充実させることができる。
【0017】かかる帳票用文字認識装置のうち、表示手
段が、補正手段の出力として得られた文字列とともに、
画像情報から切り取られたセル文字を表示するものにあ
っては、補正手段の出力としての文字列と画像情報とを
表示手段上で比較しながら修正操作をすることができる
ので、修正操作が容易になる。
【0018】
【実施例】以下、この出願発明にかかる実施例を図面を
参照しながら説明する。
【0019】まず、図1を参照しながら、この発明に係
る帳票用文字認識装置の概念を示す。1は装置の本体で
あり、2はその端末である。
【0020】端末2は、スキャナ22、端末操作器2
3、ディスプレイ24、および、情報送受信手段21を
備えている。端末操作器23は修正手段25を含み、ま
た、図示していないが、キーボードを有する。
【0021】本体1は、複数回線制御手段11、情報受
信手段12、一時記憶手段13、帳票フォーマット検索
手段14、セル文字列認識手段15、結果情報返送手段
16、帳票フォーマット登録手段17、自動学習登録手
段18、帳票フォーマットデータベース33、カテゴリ
辞書ファイル34、保存手段41を備えている。そし
て、一時記憶手段13は、依頼情報用メモリ31と、画
像情報用メモリ32とを含んでいる。また、保存手段4
1は、コンピューター・アウトプット・マイクロフィル
ム(以下、「COM」と略す。)42を、記録媒体とし
て備えている。
【0022】本体1は、通信回線3を介して複数の端末
2と接続されている。
【0023】次に、この装置が銀行の営業所において振
込業務等に使用される場合を想定して、この装置の使用
形態を説明する。
【0024】まず、フォーマットがすでに帳票フォーマ
ットデータベース33に登録されているような帳票、例
えば銀行指定の振込依頼書を使用して振込依頼をする場
合を説明する。この場合は、次のように帳票処理がされ
る。
【0025】顧客は銀行の指定する振込依頼書に必要項
目を手書きで書き込む。必要項目とは、例えば、振込依
頼人名、相手先口座番号、口座名義人、振込先銀行名、
振込先銀行支店名、振込先銀行支店番号、振込金額など
である。また、振込用紙に押印欄があれば、顧客はここ
に押印する。
【0026】銀行の営業窓口には、通常、業務員が居
り、この者が端末2の操作者となる。この操作者は、こ
れらの項目が記入され、または、押印された振込依頼書
をスキャナ22で光学的に読み取る。このスキャナ22
は、振込依頼書を読み取ることによって得られる画像情
報に基づく画像を法的証拠として利用できる程度の解像
度を有している。すなわち、この振込依頼書には、顧客
の手書きによる振込人名などが記されており、また、こ
れらに加えて顧客の押印した印影が記されている場合も
ある。そして、振込依頼書に関して、後に法的証拠が求
められる事態も予想される。ここで、スキャナ22の解
像度が高く、スキャナ22から出力される画像情報から
再現された画像によって、顧客の手書きによる文字の筆
跡や印影を鮮明に識別できるなら、この再現された画像
を法的証拠として利用できる。すなわち、スキャナ22
の解像度が、振込依頼書を読み取ることによって得られ
る画像情報に基づく画像を法的証拠として利用できる程
度に高ければ、後に法的証拠を求められるような事態と
なっても、振込依頼書そのものではなく、この再現され
た画像を法的証拠として利用することができる。なお、
具体的には、スキャナ22の解像度は、200ドット・
パー・インチ以上が好ましい。
【0027】このように、スキャナ22によって振込依
頼書を光学的に読み取ったら、次に、この振込依頼書の
IDコードを端末操作器23のキーボードによって指定
する。このIDコードというのは、帳票の帳票フォーマ
ットを特定するためのデータであって、例えば、3桁の
数字から構成される。
【0028】スキャナ22で振込依頼書を読み取って得
た画像情報と、振込依頼書のIDコードのデータは、情
報送受信手段21から通信回線3を介して本体1側に伝
送される。画像情報を伝送するに際しては、スキャナ2
2によって得た画像情報を、圧縮(データ圧縮)せずに
本体1側に伝送してもよいし、あらかじめ端末2側で圧
縮してから、本体1側に伝送し、本体1側で伸長しても
よい。但し、圧縮して伝送するのであれば、圧縮後の画
像情報を伸長し、画像として再現しても、これを法的証
拠として利用できるような圧縮方法を採用する。ここ
で、伸長とは、圧縮された画像情報を再生時に復元する
ことをいう。圧縮後の画像情報を伸長し、画像として再
現した結果、手書き文字の筆跡や印影が識別できないよ
うな圧縮方法では、この再現された画像を法的証拠とし
て利用することができない。ここで採用しうる圧縮方法
としては、例えば、米国のカリフォルニア大学で開発さ
れた、レンプル・ジブ・ウェルチ・アルゴリズムによる
圧縮方法などがある。
【0029】このようにして本体1側に伝送された画像
情報と振込依頼書のIDコードのデータは、複数回線制
御手段11、情報受信手段12を介して、一旦、一時記
憶手段13に格納される。画像情報は一時記憶手段13
内部の画像情報用メモリ32に、IDコードのデータは
依頼情報用メモリ31に格納される。なお、通常の帳票
処理の業務においては、端末2側から本体1側には、画
像情報、IDコードのデータの他に、帳票が一度に何件
処理されるかといった件数のデータや、処理される合計
金額のデータなどが送られるが、これらのデータも一時
記憶手段13の中の依頼情報用メモリ31に格納され
る。
【0030】一旦、この一時記憶手段13の画像情報用
メモリ32に格納された画像情報は、保存手段41によ
って読み出され、画像として再現されてから、この保存
手段41に保存される。保存手段41は、伝送された画
像情報から再現した画像を記録するための記録媒体とし
て、コンピューター・アウトプット・マイクロフィルム
42を備えており、再現された画像はこのコンピュータ
ー・アウトプット・マイクロフィルム42に記録されて
保存される。
【0031】このようにして、再現された画像を保存す
るのは、再現された画像を後に法的証拠として利用でき
るからである。よって、本体1側に伝送された画像情報
のすべてを画像として再現して保存する必要はない。す
なわち、後に法的証拠が求められるような事態の想定さ
れる場合のみ、伝送された画像情報に基づいて画像とし
て再現して、保存手段41に保存するようにしてもよ
い。この画像を保存手段41に保存するか否かは、端末
操作器23のキーボード操作により選択できるように構
成してもよい。
【0032】なお、ここでは、保存手段41が備える記
録媒体の好適な例として、コンピュータ・アウトプット
・マイクロフィルム42を挙げて説明したが、画像情報
から再現した画像を記録できる媒体であれば、コンピュ
ータ・アウトプット・マイクロフィルム42に限らず、
種々のものを採用することができる。
【0033】一方、一旦、一時記憶手段31内の依頼情
報用メモリ31に格納されたIDコードのデータは、帳
票フォーマット検索手段14によって読み出される。そ
して、帳票フォーマット検索手段14は、このIDコー
ドのデータに基づき、このIDコードが付与された帳票
フォーマットを帳票フォーマットデータベース33から
検索する。
【0034】帳票フォーマットデータベース33には、
複数の帳票フォーマットが登録されている。図2は、こ
の帳票フォーマットデータベース33の内容を概念的に
示したものである。図2において、「001」、「00
2」、「XXX」と表されているものは、帳票フォーマ
ットを特定するためのIDコードである。個々の帳票フ
ォーマットの内容としては、前述のIDコードの他、文
字位置、文字ピッチなどがある。文字位置とは、帳票上
で文字が記入される記入欄の座標を特定する情報であ
る。また、文字ピッチとは文字が記入される記入欄の一
文字分の大きさを特定するものである。この他にも、帳
票フォーマットの内容データとしては、文字記入欄に記
入される文字数のデータ、ある記入欄に記入される文字
が漢字であるかカナであるか数字であるかなど、文字の
種類を特定するデータ、ある記入欄に記入される文字列
が住所を表すのか振込人名を表すのかなど、フィールド
(項目)を指定するデータ、このフィールド(項目)が
後述するカテゴリ辞書ファイル34の内部のどの辞書フ
ァイルと照会されるべきであるかを特定するための辞書
ファイル番号のデータ、帳票フォーマット単位で互いの
フィールドがどのように関係しているかという相関関係
のデータなどがある。なお、帳票フォーマット単位で互
いのフィールドがどのように関係しているかという相関
関係とは、具体的にどのようなものであるかについては
後に詳述する。図3に、この帳票フォーマットの内容を
概念的に示す。
【0035】帳票フォーマット検索手段14が、帳票フ
ォーマットデータベース33から、指定されたIDコー
ドの帳票フォーマットを検索すれば、あとは、この帳票
フォーマットに照らして、画像情報用メモリ32に格納
された画像情報、すなわち、スキャナ22で読み取った
帳票の画像情報から一文字単位のセル文字を切り出すこ
とができる。切り出されたセル文字はセル文字列認識手
段15によって文字認識される。一文字単位で文字認識
されたセル文字は、再度、フィールド単位で文字列とし
て合成され、この文字列がカテゴリ辞書ファイル34の
データに照会される。カテゴリ辞書ファイル34には複
数の辞書ファイルが含まれている。図4は、カテゴリ辞
書ファイル34の内容を示したものである。このよう
に、帳票上のフィールドに対応した、個々のカテゴリ
(銀行名、銀行支店名、住所域など)の辞書ファイルが
用意されている。例えば、図4においては、銀行名辞書
の辞書ファイルには辞書ファイル番号として2が付され
ている。フィールド単位で合成された文字列は、そのフ
ィールドが対応する辞書ファイルのデータに照会され
る。そして、一部に認識不能の文字または誤認識した文
字を含むような文字列であっても、辞書ファイルを照会
して正しい文字列に修正する。
【0036】例えば、顧客が振込依頼書に銀行支店名と
して手書きで「中野南口」と記入したとする。そして、
これをセル文字列認識手段15が一文字単位の文字認識
をしたところ、一部に認識不能の文字があり、これ「中
野X口」という文字列として認識したとする。ここで
「X」は認識不能の文字を表す。この「中野X口」を図
4の銀行支店名辞書の辞書ファイルのデータを照会し
て、「中野南口」に修正する。
【0037】また、別の例としては、例えば銀行支店名
を一文字単位で文字認識したところ、一部に誤認識した
文字があり、「仲野南口」という文字列として認識した
とする。この「仲野南口」を図4の銀行支店名辞書の辞
書ファイルのデータを照会して、「中野南口」に修正す
る。
【0038】このようにして認識された文字列(例えば
「中野南口」)は、セル文字列認識手段15から結果情
報返送手段16、複数回線制御手段11、通信回線3を
介して端末2に伝送される。端末2では、この文字列
「中野南口」を画像情報から切り取られたセル文字とと
もにディスプレイ24に表示する。図5は、このときの
ディスプレイ24の表示状態を示すものである。図5に
おいては、上段に、認識結果としての文字列が表示され
ており、下段に、画像情報から切り取られたセル文字が
表示されている。なお、図5のように、画像情報から切
り取られたセル文字を、帳票のフィールド単位でまとめ
て文字列として表示すると、よりわかりやすい。端末2
の操作者は、この表示を見て、振込依頼書への記入が正
しく認識されたことを確認する。
【0039】次に、振込依頼書には「中野南口」と記入
されているにもかかわらず、セル文字列認識手段15が
「中野北口」と認識した場合について説明する。この場
合は、セル文字列認識手段15の認識結果としてディス
プレイ24に「中野北口」と表示される。このような場
合は、操作者は、セル文字列認識手段15に、再度、カ
テゴリ辞書ファイル34を照会させるためのコマンドを
本体1側に伝送する。このコマンドを受けて、セル文字
列認識手段15は、カテゴリ辞書ファイルから「中野北
口」以外の文字列を検索する。この結果、「中野南口」
なる文字列が検索され、これが端末2側に伝送され、デ
ィスプレイ24に表示されると、操作者は正しい文字認
識がされたことを確認できる。
【0040】次に、カテゴリ辞書ファイル34には登録
されていない文字列を振込依頼書に記入したような場合
を説明する。いま、振込依頼書の銀行支店名の欄に「中
野東口」と記入したとする。ところが、カテゴリ辞書フ
ァイル34の銀行支店名辞書には、「中野東口」なる文
字列が登録されていないとする。この場合は、セル文字
列認識手段15がカテゴリ辞書ファイル34を照会した
としても、正しい文字列は認識されない。このとき、セ
ル文字列認識手段15の認識結果として、「中野南口」
なる文字列がディスプレイ24に表示されたとする。こ
のような場合は、操作者はこの表示を確認して、端末操
作器23のキーボードを操作することにより修正手段2
5を使って、「中野東口」に修正する。そして、この修
正後の文字列「中野東口」のコードデータを、端末2側
から通信回線3を介して本体1側に伝送する。本体1は
これを受けて、このコードデータを、複数回線制御手段
11、情報受信手段12を介して自動学習登録手段18
に送る。そして自動学習登録手段18は、このコードデ
ータをカテゴリ辞書ファイル34の中の銀行支店名辞書
に登録する。
【0041】これによって、以後、「中野東口」と記入
された振込依頼書がスキャナ22により読み込まれた場
合でも、セル文字列認識手段15は正しい文字列認識を
することができるようになる。
【0042】このようにして、本装置は使用されるに従
い、カテゴリ辞書ファイル34の内容が充実してゆき、
より正確な文字列認識ができるようになってゆく。すな
わち、当初は、カテゴリ辞書ファイル34の内容があま
り充実していなくても、あるいは、カテゴリ辞書ファイ
ル34に文字列が一つも登録されていなくても、徐々に
内容が充実するので、顧客が振込依頼書に記入するであ
ろう文字列を当初から網羅的に登録しておく必要がな
い。
【0043】次に、カテゴリ辞書ファイル34のみなら
ず、過去に処理された帳票の内容をも参考にしながら、
より正確な文字列認識を行う技術について、図6を参照
しながら説明する。
【0044】図6においては、図1に示す帳票用文字認
識装置と同様に、1は本体、2は端末である。図1の帳
票用文字認識装置と異なり、本体1は、検索・補正手段
61、記録手段62、記録ファイル35を含んでいる。
他は、図1の帳票用文字認識装置と同様である。
【0045】図6においては、セル文字列認識装置15
の出力側が検索・補正手段61の入力側に接続されてい
る。そして、検索・補正手段61の出力側は結果情報返
送手段16に接続されている。また、記録手段62の入
力側は情報受信手段12に接続されている。
【0046】前述したように、帳票フォーマットデータ
ベース33には、帳票フォーマット単位で互いのフィー
ルドがどのように関係しているかという相関関係の情報
が登録されている。この相関関係の情報というのは、例
えば、振込先銀行支店名と振込先銀行支店番号の間の相
関関係の情報のようなものをいう。両者は、ある銀行に
ついては1対1に対応するので、非常に相関関係が強い
と考えることができる。また、1つの銀行に属する銀行
支店は限られているので、振込先銀行名と振込先銀行支
店名も比較的相関関係が強いと考えることができる。さ
らには、2つのフィールドの相関関係のみならず、振込
先銀行名、振込先銀行支店名、振込先銀行支店番号とい
うような3つのフィールドも、互いに相関関係が強いと
考えることができる。また、相手先口座番号と口座名義
人も、ある銀行については1対1に対応するので、互い
に相関関係が強いフィールドであると考えることができ
る。
【0047】一方、振込先銀行名と振込金額とは、互い
の相関関係が弱いと考えることができる。銀行は任意の
金額を振込金額として扱うからである。
【0048】帳票フォーマットデータベース33には、
例えば、振込先銀行名、振込先銀行支店名、振込先銀行
支店番号の3つのフィールドの相関関係は互いに強いと
いうことが、情報として登録されている。また、これら
についての相関関係の強さを数値化あるいはランク付け
し、この情報が併せて登録されていてもよい。つまり、
帳票フォーマットデータベース33は、このような相関
関係を登録しておくための登録ファイルとして機能す
る。
【0049】記録ファイル35には、過去に処理された
帳票の複数のフィールドの文字列が、処理された1件の
帳票のフォーマット単位で記録されている。
【0050】帳票の複数のフィールドの文字列というの
は、例えば、振込先銀行名としての「第一勧業」という
文字列や、振込銀行支店名としての「中野南口」という
文字列や、振込銀行支店番号としての「021」という
文字列のことである。例えば、過去に処理された帳票に
ついての振込先銀行名、振込先銀行支店名、振込先銀行
支店番号の3つのフィールドの文字列が記録されている
のであるが、この3つのフィールドの文字列「第一勧
業」、「中野南口」、「021」は、帳票フォーマット
単位で、記録ファイル35に記録される。帳票フォーマ
ット単位で記録するのは、すでに処理された1件の帳票
に、これら3つの文字列が含まれていたということを記
録として残すためである。図7は、この記録ファイル3
5の記録内容の例を、概念的に示した図である。これを
見ると、例えば、過去(1996年3月3日)に、第一
勧業銀行の中野南口支店の甲野乙太郎の口座に1000
0円が振り込まれたことがわかる。さらに中野南口支店
の支店番号が「021」であり、甲野乙太郎の口座の口
座番号が「0755312012」であることもわか
る。記録ファイル35には、互いに相関関係が強い複数
のフィールドの文字列のみならず、図7に示されるよう
に、他のフィールドとの相関関係が弱いようなフィール
ド、例えば、振込金額についての文字列が含まれていて
もかまわない。
【0051】検索・補正手段61は、セル文字列認識手
段15の認識結果としての文字列を入力するのである
が、このときは、帳票フォーマットデータベース33に
登録された、フィールド間の相関関係の情報に基づい
て、1件の帳票についての少なくとも互いに相関関係の
強いフィールドの文字列を一つの単位として入力する。
例えば、振込先銀行名としての「第一勧業」という文字
列、振込先銀行支店名としての「中野南口」という文字
列、および、振込先銀行支店番号としての「021」と
いう文字列を、一つの単位として受け取る。これら3つ
のフィールドが互いの相関関係が強いものであるという
ことは、帳票フォーマットデータベース33に情報とし
て登録されている。もちろん、これら以外のフィールド
の文字列、例えば、振込金額の文字列などをいっしょに
入力してもかまわない。
【0052】次に、検索・補正手段61は、これら「第
一勧業」、「中野南口」、「021」という文字列の組
み合わせを、1件に含むような帳票が過去に処理されて
いないかどうかを、記録ファイル35の記録内容を検索
することによって調査する。図7を参照すると、「第一
勧業」、「中野南口」、「021」という3つの文字列
の組み合わせが、1件の帳票のものとして記録されてい
ることがわかる。よって、検索・補正手段61は、入力
した3つの文字列「第一勧業」、「中野南口」、「02
1」の組み合わせは、正しい組み合わせであり、補正す
る必要がないと判断する。このように判断した場合は、
入力したこれらの文字列をそのまま、すなわち、補正す
ることなく、結果情報返送手段16に出力する。なお、
検索・補正手段61が他のフィールドとの相関関係が弱
いようなフィールドの文字列、例えば、振込金額の文字
列などを入力する場合は、この文字列をそのまま結果情
報返送手段16に出力する。
【0053】結果情報返送手段16に出力された、これ
ら3つの文字列は、複数回線制御手段11、通信回線3
を介して、端末2に送出される。端末2側では、これ
ら、検索・補正手段61の出力として文字列を、画像情
報から切り取ったセル文字とともに、ディスプレイ24
に表示する。図8は、このときのディスプレイ24の表
示状態を示すものである。図8においては、上段に、検
索・補正手段61の出力としての文字列が表示されてお
り、下段に、画像情報から切り取られたセル文字が表示
されている。なお、図8のように、画像情報から切り取
られたセル文字を、帳票のフィールド単位でまとめて文
字列として表示すると、よりわかりやすい。端末2の操
作者は、この表示を見て、振込依頼書への記入が、正し
く認識されたことを知ることができる。なお、図8で
は、3つのフィールドの文字列を同時に表示している
が、1つのフィールド毎に表示してもかまわない。
【0054】ディスプレイ24の表示により、振込依頼
書への記入が正しく認識されたことを知った端末2の操
作者は、端末操作器23のキーボードによって、確認信
号を本体1側に送出する。本体1はこの確認信号を受け
て、検索・補正手段61の出力としての3つの文字列の
組み合わせを含む、1件の振込依頼書に関する複数の文
字列を、記録手段62を使って、帳票フォーマット単位
で記録ファイル35に記録する。記録手段62は、これ
らの文字列を検索・補正手段61から直接受け取るよう
にしてもよいし、端末2側から受け取るようにしてもよ
い。このようにして、記録ファイル35の記録内容がさ
らに充実したことになる。このように、1件の帳票がこ
の装置によって処理されるたびに、記録ファイル35の
内容は充実するので、装置の使用を重ねるたびに、文字
列の認識の精度が向上していく。
【0055】次に、セル文字列認識手段15が、振込先
銀行名として振込依頼書に記入された「第一勧業」とい
う文字列を、誤って「第一興業」と認識したような場合
について説明する。なお、振込依頼書に記入された振込
先銀行支店名としての「中野南口」と、振込先銀行支店
番号としての「021」は、セル文字列認識手段15に
よって、正しく認識されたものとする。このような場合
は、検索・補正手段61は、振込先銀行名として「第一
興業」という文字列、振込銀行支店名として「中野南
口」という文字列、および、振込銀行支店番号として
「021」という文字列を、セル文字列認識手段15の
認識結果として受け取る。
【0056】そして、検索・補正手段61は、これら
「第一興業」、「中野南口」、「021」という文字列
の組み合わせを、1件に含むような帳票が過去に処理さ
れていないかどうかを、記録ファイル35の記録内容を
検索することによって調査する。図7を参照すると、こ
のような3つの文字列の組み合わせは、1件の帳票のも
のとしては記録されていない。しかし、「第一勧業」、
「中野南口」、「021」という3つの文字列の組み合
わせは、1件の帳票のものとして記録されている。この
3つの文字列の組み合わせと入力された3つの文字列の
組み合わせとは、「中野南口」および「021」が共通
し、両者は近似する。そこで、検索・補正手段61は、
入力した3つの文字列「第一興業」、「中野南口」、
「021」の組み合わせは、誤った組み合わせであり、
補正する必要があると判断する。そして、入力した3つ
の文字列のうちの「第一興業」を「第一勧業」に補正す
る。そして、入力された文字列「第一興業」を「第一勧
業」に置き換え、3つの文字列「第一勧業」、「中野南
口」、「021」を結果情報返送手段16に出力する。
【0057】結果情報返送手段16に出力されたこれら
3つの文字列が、複数回線制御手段11、通信回線3を
介して端末2に送出され、端末2の操作者に確認され
て、1件の振込依頼書に関する複数の文字列として、記
録ファイル35に記録される過程については、前述して
あるので、ここでの重複する説明は省略する。
【0058】次に、振込依頼書には、振込先銀行名とし
て「第一勧業」なる文字列が、振込先銀行支店名として
「中野東口」なる文字列が、振込先銀行支店番号として
「030」なる文字列が記入されているにもかかわら
ず、カテゴリ辞書ファイル34に「中野東口」なる文字
列が登録されていないために、セル文字列認識手段15
の認識結果が、「第一勧業」、「中野南口」および「0
30」となった場合を例にあげて説明する。なお、「0
30」なる文字列は、ある銀行の支店番号として、すで
にカテゴリ辞書ファイル34に登録されていたものとす
る。
【0059】この場合、検索・補正手段61は、振込先
銀行名として「第一勧業」という文字列、振込先銀行支
店名として「中野南口」という文字列、および、振込先
銀行支店番号として「030」という文字列を、セル文
字列認識手段15の認識結果として受け取る。
【0060】そして、検索・補正手段61は、これら
「第一勧業」、「中野南口」、「030」という文字列
の組み合わせを1件に含むような帳票が過去に処理され
ていないかどうかを、記録ファイル35の記録内容を検
索することによって調査する。図7を参照すると、この
ような3つの文字列の組み合わせは、1件の帳票のもの
としては記録されていない。しかし、「第一勧業」、
「中野南口」、「021」という3つの文字列の組み合
わせは、1件の帳票のものとして記録されている。この
3つの文字列の組み合わせと入力された3つの文字列の
組み合わせとは、「第一勧業」および「中野南口」が共
通し、両者は近似する。そこで、検索・補正手段61
は、入力した3つの文字列「第一勧業」、「中野南
口」、「030」の組み合わせは、誤った組み合わせで
あり、補正する必要があると判断する。そして、入力し
た3つの文字列のうちの「030」を「021」に補正
する。そして、入力された文字列「030」を「02
1」に置き換え、3つの文字列「第一勧業」、「中野南
口」、「021」を結果情報返送手段16に出力する。
【0061】結果情報返送手段16は、これら3つの文
字列を、複数回線制御手段11、通信回線3を介して、
端末2に送出する。端末2側では、これら、検索・補正
手段61の出力として文字列を、画像情報から切り取っ
たセル文字とともに、ディスプレイ24に表示する。図
9は、このときのディスプレイ24の表示状態を示すも
のである。図9においては、上段に、検索・補正手段6
1の出力としての文字列が表示されており、下段に、画
像情報から切り取られたセル文字が表示されている。端
末2の操作者は、この表示を見て、振込依頼書への記入
が、誤って認識されたことを知ることができる。ディス
プレイ24の表示により、振込依頼書への記入が誤って
認識されたことを知った端末2の操作者は、検索・補正
手段61の出力結果としての文字列「中野南口」を「中
野東口」に、また、「021」を「030」に修正す
る。この修正は、端末操作器23のキーボードを操作す
ることにより修正手段25を使って行う。誤って認識さ
れた文字列を正しく修正できたことを確認した操作者
は、端末操作器23のキーボードによって、確認信号を
本体1側に送出する。このとき、修正後の文字列「中野
東口」「030」も本体1側に送出される。本体1側で
は、修正後の文字列「中野東口」のコードデータを、複
数回線制御手段11、情報受信手段12を介して自動学
習登録手段18に送る。そして自動学習登録手段18
は、このコードデータをカテゴリ辞書ファイル34の中
の銀行支店名辞書に登録する。これによって、以後、
「中野東口」と記入された振込依頼書がスキャナ22に
より読み込まれた場合でも、セル文字列認識手段15は
正しい文字列認識をすることができるようになる。な
お、修正後の文字列「030」は、前述したように、す
でにカテゴリ辞書ファイル34に登録されているので、
端末2から本体1側に伝送されたとしても、カテゴリ辞
書ファイル34に新たな文字列として登録されることは
ない。
【0062】さらに、本体1側では、検索・補正手段6
1の出力としての文字列「第一勧業」「中野南口」「0
21」に対して、その中の「中野南口」を修正後の文字
列「中野東口」に置き換え、また、「021」を修正後
の文字列「030」に置き換える。そして、置き換えら
れた後の3つの文字列「第一勧業」「中野東口」「03
0」を、1件の振込依頼書に関する複数の文字列とし
て、記録手段62を使って帳票フォーマット単位で記録
ファイル35に記録する。これにより、記録ファイル3
5の記録内容が充実したことになる。
【0063】次に、フォーマットがまだ帳票フォーマッ
トデータベース33に登録されていないような帳票を使
用して振込依頼をする場合を説明する。この場合は、次
のように帳票処理がされる。
【0064】いま、顧客が会社であるとする。この顧客
は社内の会計業務に使用するためのその会社独自の帳票
を、銀行振込のために銀行の営業窓口に持ち込む。この
帳票のフォーマットは、例えば図10に示されるような
ものである。図10において50は帳票である。51は
この帳票のフォーマットを特定するためのIDコードを
記入する記入欄である。52は振込先の銀行名を記入す
る記入欄、53は振込先の銀行支店名を記入する記入
欄、54は振込人名を記入する記入欄、55は振込金額
を記入する記入欄である。その他、振込依頼のために必
要なフィールド(項目)は他にもあるが、図10では省
略している。
【0065】この帳票50の帳票フォーマットは帳票フ
ォーマットデータベース33には登録されていないた
め、この帳票50を使って振込を行う前に、まず、この
帳票50の帳票フォーマットを帳票フォーマットデータ
ベース33に登録する必要がある。
【0066】この登録の手順を、以下、説明する。
【0067】顧客が銀行の営業窓口に持ち込んだ帳票5
0は、まず、スキャナ22により読み取られ画像情報が
得られる。このとき、帳票50には、銀行名などの項目
が記入されていてもよいし、記入されていなくてもよい
が、ここでは記入されていないものを例に挙げて説明す
る。この画像情報はディスプレイ24に送られ、ディス
プレイ24には図11のような表示がされる。操作者
は、図11のような表示を見ながら、この帳票50の帳
票フォーマットをデータ化していく。データ化の手順は
例えば次のとおりである。
【0068】まず、この帳票が振込に使用される帳票で
ある旨を端末操作器23のキーボードから指定する。
【0069】次に、図11のように表示されたディスプ
レイ24を見ながら、各記入欄の座標を指定する。例え
ば、51は前述したように、この帳票の帳票フォーマッ
トを特定するためのIDコードを記入する記入欄であ
る。この記入欄51には、帳票の帳票フォーマットを特
定するための3桁の数字が所定の大きさの文字により記
入されるのであるが、この記入欄51に関しては、次の
ような指定が必要である。
【0070】まず、この記入欄51の座標位置をまず指
定する。座標位置の指定のためには、例えば、マウスを
使うことができる。すなわち、端末操作器23に接続さ
れたマウスによりディスプレイ24上に表示されるカー
ソルを移動させながら、図11のA点とB点においてク
リックする。これにより、方形の記入欄51の座標を指
定することができる。次に、この記入欄51に記入され
る最大文字数として、例えば「3」を端末操作器23の
キーボードから指定する。また、この記入欄51に記入
される文字のピッチを指定してもよい。次にこの記入欄
51には、帳票フォーマットを特定するためのIDコー
ドが記入される旨を端末操作器23のキーボードから指
定する。次に、この記入欄51には、数字が記入される
旨を端末操作器23のキーボードから指定する。
【0071】また、例えば、振込先の銀行名の記入欄5
2に関しては次のような指定が必要である。まず、記入
欄52の座標を指定する。このために、マウスによりデ
ィスプレイ24上に表示されるカーソルを移動させなが
ら、図11のC点とD点においてクリックする。これに
より、方形の記入欄52の座標を指定することができ
る。次に、この記入欄52に記入される最大文字数を端
末操作器23のキーボードから指定する。また、この記
入欄52に記入される文字のピッチを指定してもよい。
次にこの記入欄52には振込先の銀行名が記入される旨
を端末操作器23のキーボードから指定する。そして、
この記入欄52には、漢字、ひらがな、カタカナの文字
が記入される旨を端末操作器23のキーボードから指定
する。さらに、この記入欄52に係るフィールドは、こ
の帳票の他のフィールドのうちのどのフィールドとどの
程度の相関関係があるかということを、端末操作器23
のキーボードから指定する。
【0072】他の記入欄についても、同様に必要な指定
を行う。必要な記入欄すべてについての座標などの指定
を完了させることにより、この帳票50の帳票フォーマ
ットをデータ化したことになる。また、この帳票につ
き、互いのフィールドがどのように関係しているかとい
う相関関係を帳票フォーマット単位でデータ化したこと
にもなる。そして次に、この帳票フォーマットを特定す
るためのIDコードを指定する。
【0073】データ化に際し、座標の指定のためには、
マウス、端末操作器23、ディスプレイ24を使用し
た。また、記入欄に記入される最大文字数の指定などの
ためには、端末操作器23とキーボードを使用した。す
なわち、ここでは、帳票フォーマットをデータ化するた
めのデータ化手段として、マウス、端末操作器23、デ
ィスプレイ24、キーボードなどが使われたこととな
る。
【0074】つぎに、このデータ化した帳票フォーマッ
トを本体1側に通信回線3を介して伝送する。本体1側
ではこれを受けて、このデータ化された帳票フォーマッ
トを複数回線制御手段11、情報受信手段12を介し
て、帳票フォーマット登録手段17に送る。帳票フォー
マット登録手段17は、この、データ化された帳票フォ
ーマットをIDコードとともに、帳票フォーマットデー
タベース33に登録する。
【0075】このように、一旦、この帳票50の帳票フ
ォーマットが帳票フォーマットデータベース33に登録
されたら、顧客は、銀行指定の振込依頼書と同様に、こ
の帳票50を利用することができる。
【0076】すなわち、顧客は銀行の営業窓口に、各記
入欄に必要項目を記入した帳票50を持ち込む。端末2
の操作者は、これらの項目が記入された帳票50をスキ
ャナ22で光学的に読み取る。そして、この帳票50の
IDコードを端末操作器23のキーボードによって指定
する。スキャナ22で読み取った画像情報と帳票50の
IDコードのデータは、情報送受信手段21から通信回
線3を介して本体1側に伝送され、複数回線制御手段1
1、情報受信手段12を介して、一時記憶手段13に格
納される。伝送された画像情報は一時記憶手段13内部
の画像情報用メモリ32に、IDコードのデータは依頼
情報用メモリ31に格納される。
【0077】これ以降の、画像情報やIDコードのデー
タの流れや、文字認識の手順は、すでに前述してあるの
で、ここでの重複する説明は省略する。
【0078】なお、図1においては、本体1に対して複
数の端末2が通信回線3介して接続されている。これ
は、数多くの銀行営業所などにおいて、多くの顧客に上
述の機能を提供できるようにするためである。
【0079】以上の説明においては、銀行業務を例に挙
げて説明したが、これに限らず帳票処理を行う分野全般
について、この発明は適用可能である。
【0080】また、光学的な読み取り手段としてスキャ
ナ22を用いる場合について説明したが、光学的な読み
取りが可能でありさえすれば、これに限らない。たとえ
ば、ファクシミリ装置に内蔵されている光学的読み取り
装置を利用してもよい。
【0081】また、通信回線3としては、公衆電話回
線、高速信号線や構内専用回線でもよい。要するに、画
像情報やコードデータを伝送できる通信回線であればど
のようなものでもよい。
【0082】さらに、帳票フォーマットをデータ化する
に際しては、ディプレイ24上で座標位置を指定する方
法を例に挙げたが、記入欄の座標位置を指定できるので
あれば、このような方法に限らない。例えば、ディスプ
レイ24上に帳票の画像情報と重ねて映し出された方眼
模様を見ながら、キーボードによって座標位置の数値デ
ータを打ち込んでもよい。また、ディスプレイ24上で
座標位置を指定する方法にしても、マウスによる方法に
限らず、種々の方法を採用することができる。例えば、
デジタイザによる方法や、タッチディスプレイの画面上
をタッチしながら座標位置指定する方法も採用すること
ができる。
【0083】
【発明の効果】上述のように、この出願に係る発明によ
れば、操作者は、表示手段に表示された文字列を見なが
ら、文字列の修正を行うことが可能となる。しかも、修
正後の文字列を辞書ファイルに登録することができるの
で、装置を使用するに従い、辞書ファイルの内容を充実
させることが可能となる。従って、しだいに精度の高い
文字列認識が可能となる。
【0084】また、特に、表示手段を、セル文字列認識
手段の認識結果として得られた文字列とともに、画像情
報から切り取られた前記セル文字を表示するものとする
と、認識結果としての文字列と画像情報とを表示手段上
で比較しながら修正操作をすることができるので、修正
操作が容易になる。
【0085】また、この出願に係る他の発明によれば、
フィールド間の相関関係と過去の帳票処理の内容とを利
用して、セル文字列認識手段の認識結果が補正されの
で、より的確な文字列認識を行うことが可能となる。
【0086】また、特に、補正手段の出力として得られ
た文字列を表示する表示手段と、補正手段の出力として
の文字列に対して必要な修正操作を施すための修正手段
と、この修正手段により修正操作が施された文字列をフ
ィールドの分類に従って辞書ファイルに登録する登録手
段とを備えるようにすると、操作者が表示手段に表示さ
れた文字列を見ながら、補正手段の出力としての文字列
の修正を行うことが可能となる。しかも、修正後の文字
列を辞書ファイルに登録することができ、辞書ファイル
の内容を徐々に充実させることが可能となる。
【0087】また、特に、補正手段の出力としての複数
の文字列に対して、この中に修正手段によって修正され
た文字列が含まれる場合にはその文字列を修正後の文字
列に置き換えてから、この複数の文字列を帳票フォーマ
ット単位で記録するための記録ファイルを備えるように
すると、帳票を処理する毎に、記録ファイルに内容が追
加されるので、記録ファイルの内容を徐々に充実させる
ことが可能となる。従って、しだいに、より精度の高い
文字列認識が可能となる。
【0088】また、特に、表示手段を、補正手段の出力
として得られた文字列とともに、画像情報から切り取ら
れたセル文字を表示するものとすると、補正手段の出力
としての文字列と画像情報とを表示手段上で比較しなが
ら修正操作をすることが可能となり、修正操作が容易に
なる。
【図面の簡単な説明】
【図1】この出願発明に係る帳票用文字認識装置を概念
的に示したブロック図である。
【図2】複数の帳票フォーマットがデータ登録された帳
票フォーマットデータベースを概念的に示した図であ
る。
【図3】データ化された帳票フォーマットを概念的に示
した図である。
【図4】カテゴリ辞書ファイルの構成を概念的に示した
図である。
【図5】ディスプレイの表示状態を示した図である。
【図6】この出願発明に係る帳票用文字認識装置を概念
的に示したブロック図である。
【図7】記録ファイルの記録内容を概念的に示した図で
ある。
【図8】ディスプレイの表示状態を示した図である。
【図9】ディスプレイの表示状態を示した図である。
【図10】帳票の一例を示した図である。
【図11】ディスプレイの表示状態を示した図である。
【符号の説明】
1…本体 2…端末 3…通信回線 11…複数回線制御手段 12…情報受信手段 13…一時記憶手段 14…帳票フォーマット検索手段 15…セル文字列認識手段 16…結果情報返送手段 17…帳票フォーマット登録手段 18…自動学習登録手段 21…情報送受信手段 22…スキャナ 23…端末操作器 24…ディスプレイ 25…修正手段 31…依頼情報用メモリ 32…画像情報用メモリ 33…帳票フォーマットデータベース 34…カテゴリ辞書ファイル 35…記録ファイル 41…保存手段 42…コンピューター・アウトプット・マイクロフィル
ム 50…帳票 51、52、53、54、55…記入欄 61…検索・補正手段 62…記録手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 帳票を光学的に読み取りその画像情報を
    得る読み取り手段と、文字列を帳票のフィールド毎に分
    類して登録するための辞書ファイルと、前記画像情報を
    前記帳票の帳票フォーマットに照らし、この画像情報か
    らセル文字を切り取り、この切り取られたセル文字を文
    字認識してから帳票のフィールド単位で文字列として合
    成し、この合成された文字列を前記辞書ファイルに登録
    されたそのフィールドに属する文字列のうちの近似する
    ものとして認識するセル文字列認識手段とを備えた帳票
    用文字認識装置において、 前記セル文字列認識手段の認識結果として得られた文字
    列を表示する表示手段と、前記セル文字列認識手段の認
    識結果としての文字列に対して必要な修正操作を施すた
    めの修正手段と、この修正手段により修正された文字列
    をフィールドの分類に従って前記辞書ファイルに登録す
    る登録手段とを備えたことを特徴とする帳票用文字認識
    装置。
  2. 【請求項2】 請求項1記載の帳票用文字認識装置にお
    いて、前記表示手段は、前記セル文字列認識手段の認識
    結果として得られた文字列とともに、前記画像情報から
    切り取られた前記セル文字を表示することを特徴とする
    帳票用文字認識装置。
  3. 【請求項3】 帳票を光学的に読み取りその画像情報を
    得る読み取り手段と、文字列を帳票のフィールド毎に分
    類して登録するための辞書ファイルと、前記画像情報を
    前記帳票の帳票フォーマットに照らし、この画像情報か
    らセル文字を切り取り、この切り取られたセル文字を文
    字認識してから帳票のフィールド単位で文字列として合
    成し、この合成された文字列を前記辞書ファイルに登録
    されたそのフィールドに属する文字列のうちの近似する
    ものとして認識するセル文字列認識手段とを備えた帳票
    用文字認識装置において、 前記帳票フォーマット単位で互いのフィールドがどのよ
    うに関係しているかという相関関係を登録しておく登録
    ファイルと、この登録ファイルに登録された相関関係に
    基づいて、前記セル文字列認識手段により認識された複
    数のフィールドの文字列の組み合わせに近似するもの
    を、過去に処理された帳票の複数のフィールドの文字列
    の組み合わせの中から検索する検索手段と、この検索手
    段の検索結果によって前記セル文字列認識手段の認識結
    果としての文字列を補正する補正手段とを備えたことを
    特徴とする帳票用文字認識装置。
  4. 【請求項4】 請求項3記載の帳票用文字認識装置にお
    いて、前記補正手段の出力として得られた文字列を表示
    する表示手段と、前記補正手段の出力としての文字列に
    対して必要な修正操作を施すための修正手段と、この修
    正手段により修正操作が施された文字列をフィールドの
    分類に従って前記辞書ファイルに登録する登録手段とを
    備えたことを特徴とする帳票用文字認識装置。
  5. 【請求項5】 請求項4記載の帳票用文字認識装置にお
    いて、前記補正手段の出力としての複数の文字列に対し
    て、この中に前記修正手段によって修正された文字列が
    含まれる場合にはその文字列を修正後の文字列に置き換
    えてから、この複数の文字列を帳票フォーマット単位で
    記録するための記録ファイルを備えたことを特徴とする
    帳票用文字認識装置。
  6. 【請求項6】 請求項4乃至5記載の帳票用文字認識装
    置において、前記表示手段が、前記補正手段の出力とし
    て得られた文字列とともに、前記画像情報から切り取ら
    れた前記セル文字を表示することを特徴とする帳票用文
    字認識装置。
JP8258747A 1996-09-30 1996-09-30 帳票用文字認識装置 Pending JPH10105654A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8258747A JPH10105654A (ja) 1996-09-30 1996-09-30 帳票用文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8258747A JPH10105654A (ja) 1996-09-30 1996-09-30 帳票用文字認識装置

Publications (1)

Publication Number Publication Date
JPH10105654A true JPH10105654A (ja) 1998-04-24

Family

ID=17324529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8258747A Pending JPH10105654A (ja) 1996-09-30 1996-09-30 帳票用文字認識装置

Country Status (1)

Country Link
JP (1) JPH10105654A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000073975A1 (fr) * 1999-05-31 2000-12-07 Cai Co., Ltd. Systeme de reecriture
JP2003085187A (ja) 2001-09-11 2003-03-20 Canon Inc 文書登録システム、方法、プログラム及び記憶媒体
JP2006155551A (ja) * 2004-10-26 2006-06-15 Canon Inc データ処理装置、ネットワークシステム、制御方法、及びプログラム
JP2006155550A (ja) * 2004-10-26 2006-06-15 Canon Inc 画像読取り装置およびサーバ装置および画像処理システムおよび画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP2007043388A (ja) * 2005-08-02 2007-02-15 Brother Ind Ltd 情報処理装置およびプログラム
US7933048B2 (en) 2005-01-31 2011-04-26 Canon Kabushiki Kaisha Image reading apparatus, server apparatus, and image processing system
JP2014182477A (ja) * 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000073975A1 (fr) * 1999-05-31 2000-12-07 Cai Co., Ltd. Systeme de reecriture
JP2003085187A (ja) 2001-09-11 2003-03-20 Canon Inc 文書登録システム、方法、プログラム及び記憶媒体
JP2006155551A (ja) * 2004-10-26 2006-06-15 Canon Inc データ処理装置、ネットワークシステム、制御方法、及びプログラム
JP2006155550A (ja) * 2004-10-26 2006-06-15 Canon Inc 画像読取り装置およびサーバ装置および画像処理システムおよび画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP4724428B2 (ja) * 2004-10-26 2011-07-13 キヤノン株式会社 画像読み取り装置および画像処理方法
US7933048B2 (en) 2005-01-31 2011-04-26 Canon Kabushiki Kaisha Image reading apparatus, server apparatus, and image processing system
JP2007043388A (ja) * 2005-08-02 2007-02-15 Brother Ind Ltd 情報処理装置およびプログラム
JP4645349B2 (ja) * 2005-08-02 2011-03-09 ブラザー工業株式会社 情報処理装置およびプログラム
JP2014182477A (ja) * 2013-03-18 2014-09-29 Fuji Xerox Co Ltd プログラム及び帳票処理装置

Similar Documents

Publication Publication Date Title
US5235654A (en) Advanced data capture architecture data processing system and method for scanned images of document forms
US7081975B2 (en) Information input device
US6697056B1 (en) Method and system for form recognition
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
US8386923B2 (en) Document generation apparatus, method, and storage medium
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4020924B2 (ja) イメージ処理装置
JPH10105654A (ja) 帳票用文字認識装置
JP4208566B2 (ja) 文書画像検索装置及びその方法、文書画像検索システム、プログラム
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH10105621A (ja) 帳票用文字認識装置
JP6870159B1 (ja) データ処理装置、データ処理方法及びプログラム
JP7160432B2 (ja) 画像処理装置、画像処理方法、プログラム
JP2000090192A (ja) 住所および郵便番号の文字列修正方法
JPH1097587A (ja) 帳票用文字認識装置
JP2792515B1 (ja) カスタマバーコードの読み取りによる住所情報入力方式
JP3770812B2 (ja) 金融機関用の営業店端末装置
JPH1063813A (ja) イメージ文書管理方法及びその装置
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JPH09204473A (ja) 帳票管理装置
JPH06208563A (ja) 情報表示装置及びそれにおける銘柄選択方法
JPH0619884A (ja) 名称入力システム
JPH1185884A (ja) 文書処理システム及びプログラムを記録した記録媒体