JP2005018678A - 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム - Google Patents
帳票データ入力処理装置、帳票データ入力処理方法及びプログラム Download PDFInfo
- Publication number
- JP2005018678A JP2005018678A JP2003186128A JP2003186128A JP2005018678A JP 2005018678 A JP2005018678 A JP 2005018678A JP 2003186128 A JP2003186128 A JP 2003186128A JP 2003186128 A JP2003186128 A JP 2003186128A JP 2005018678 A JP2005018678 A JP 2005018678A
- Authority
- JP
- Japan
- Prior art keywords
- field
- character
- recognition
- recognition result
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】認識結果に誤読文字を含むフィールドの照査を確実かつ容易に行なうことができる新たな帳票データ入力処理装置及び方法を提供する。
【解決手段】帳票読取制御部21の制御下で、認識部25はスキャナ31から入力された帳票フィールド内の文字を認識してその認識結果を認識結果メモリ26に格納する。照合部28は認識結果メモリ27に格納された認識結果とフィールド単位に業務アプリケーションで使用されるデータとの整合性の判別結果を認識状態メモリ30に格納する。そして帳票処理部10は帳票定義ファイル13からの帳票定義に従って認識結果を該当するフィールドに表示させると共に、そのフィールドの表示色を認識状態に応じた背景色に変更を行なう。
【選択図】 図1
【解決手段】帳票読取制御部21の制御下で、認識部25はスキャナ31から入力された帳票フィールド内の文字を認識してその認識結果を認識結果メモリ26に格納する。照合部28は認識結果メモリ27に格納された認識結果とフィールド単位に業務アプリケーションで使用されるデータとの整合性の判別結果を認識状態メモリ30に格納する。そして帳票処理部10は帳票定義ファイル13からの帳票定義に従って認識結果を該当するフィールドに表示させると共に、そのフィールドの表示色を認識状態に応じた背景色に変更を行なう。
【選択図】 図1
Description
【0001】
【発明が属する技術分野】
本発明は光学式文字読取システム(以下、「OCR」という)、特にその読み取り結果の表示形式に関する。
【0002】
【従来の技術】
昨今、業務アプリケーションにOCRを取り入れ、キーボード上のキー操作によるデータ入力作業の軽減あるいは誤入力防止を図るための帳票データ入力処理システムが提供されている。かかる帳票データ入力処理システムでは、入力対象の帳票をOCRが光学的に読み取って得た画像イメージの文字フィールドに含まれる文字の認識結果の表示を行なう際に、文字認識によって認識できた文字は所定の文字フォントによって黒色の表示を行ない、また、認識できなかった文字の不読文字は特定の記号によって赤色の「?」で表示を行なうことにより、照査訂正を行なうオペレータが不読文字を見落とすことなく正しい文字に修正を可能としているものがある(例えば、特許文献1を参照。)。
【0003】
【特許文献1】
特開2002−133367号
【0004】
【発明が解決しようとする課題】
このようなOCRを用いた帳票データ入力システムでは、OCRにて認識できなかった不読文字は赤色の「?」で表示されるので、フィールド内の文字数が多くなっても不読文字を含むフィールドを容易に視認することができるが、それでも、一度に視認できる範囲には限度があるので常に注意を払ってフィールドの確認を行なう必要があった。また、OCRにて認識できた文字は黒色で表示されるので、文字としては認識されたものの論理的に整合性が取れていない誤読文字を表示しているフィールド内容を瞬時に視認するのは困難であった。
【0005】
以上の事情を鑑み、認識結果に不読の文字又は誤読の文字を含むフィールドの照査をオペレータが確実かつ容易に行なうことができる新たな帳票データ入力処理装置、帳票処理方法を提供することが本発明が解決しようとする課題である。
【0006】
【課題を解決するための手段】
本発明の態様のひとつである帳票データ入力処理装置は、読み取り対象の帳票を光学的に読み取って画像イメージを生成する読取手段と、予め格納されている帳票の帳票定義情報に基づいて前記画像イメージのフィールド領域を検出するフィールド領域検出手段と、前記検出手段によって検出されたフィールド領域ごとに、夫々のフィールドに含まれる文字イメージを文字認識し、文字を認識できた場合には対応する文字コードを付与する文字認識手段と、前記文字認識手段によってすべての文字が認識されたフィールドに対しては、それら認識できた文字からなる文字列を前記帳票に用いられる文字列と照合し、その照合結果が前記帳票に用いられない文字列である場合には、該フィールドが誤読フィールドであることを示す認識状態情報を出力する照合手段と、前記文字認識手段によって付与された文字コードに対応する文字フォントをフィールドイメージと対比して表示する際に、前記照合手段によって出力される識別状態情報に基づいて誤読フィールドを正読フィールドと識別可能に表示する表示手段と、を備えるように構成することによって前述した課題を解決する。
【0007】
この構成によれば、OCRによって読み込まれた帳票フィールドの文字イメージの認識結果と入力必須データとの整合性の結果に応じてフィールドイメージを夫々に識別可能に表示させることができるので、フィールド内の文字がすべて認識されているにも拘わらず整合性がとれないフィールドをオペレータは照査必須フィールドとして間違いなく確認できる。
【0008】
なお、上述した本発明に係わる帳票データ入力処理装置において、前記認識手段を、認識できなかった文字には不読を示す認識できた文字コードとは異なる記号コードを付与し、前記表示手段を、前記認識手段において認識できなかった文字に対応するフィールド内の文字イメージを、付与された記号コードに対応する記号で表示するように構成できる。
こうすることにより、フィールド内の修正対象の文字イメージを容易に特定することができる。
【0009】
なお、このとき、前記表示手段は、すべてのフィールドを表示する際に、フィールド内に不読文字を含む不読フィールドを他のフィールドと識別可能に表示するように構成できる。
こうすることにより、修正対象のフィールドを確実に特定することができる。
【0010】
また、更に、前記表示手段は、前記認識手段または前記照合手段によって前記フィールド内の文字イメージの認識結果に基づいてフィールド夫々の背景色を異なる表示色で表示するように構成できる。
こうすることにより、「不読」文字、「誤読」文字を含む夫々のフィールドを区別して視認することができ、修正漏れなどを防止できる。
【0011】
なお、上述した本発明に係わる帳票データ入力処理装置において、帳票処理に用いられる各種ファイルを格納するデータベースを、更に備えることが望ましく、この場合、前記照合手段は、前記定義手段に定義されている照合対象とするフィールドと連携関係にある前記データベース内のデータベースファイルを指定する第1の指定手段と、前記第1の指定手段によって指定されたデータベースファイル内の文字列と前記照合対象のフィールドの文字列とを比較する比較手段と、を備えることができる。
こうすることにより、各種帳票処理に用いるファイルから認識結果の文字列の照合に最適なファイルを指定できるので、誤照合の可能性が低減し、またその照合のための処理時間が削減される。
【0012】
なお、このとき、前記照合手段によって前記フィールドにおける認識結果の文字列が前記指定データベースファイルに存在しないと判別された場合に、前記帳票定義手段に前記フィールドに関連付けて定義されている他のフィールドと連携関係にあるデータベースファイルを指定する第2の指定手段と、前記第2の指定手段によって指定されたデータベースファイルから前記連携関係にある他のフィールドにおける認識結果の文字列をキーとした索引を行なって得た索引結果を前記フィールドにおける認識結果の修正文字列として設定する補完手段と、を備えることができる。
こうすることで、照合結果によって誤読文字を含むフィールドであっても、連係関係にある他のフィールドにおける照合処理を行なうようにすることで、照合結果が認識結果とされるので、誤読文字を含む認識結果の誤りを補完することができる。
【0013】
また、上述した本発明に係わる帳票データ入力処理装置において、前記照合手段は、文字フィールドが合計フィールドである場合には、合計フィールドに対応して前記帳票定義手段によって定義されている計算式の変数として指定される他のフィールドの認識結果を用いて該計算式の実行を行なう計算手段と、前記計算手段による計算結果の文字列と該合計フィールドに対応する認識結果の文字列を比較し、一部あるいは全部の文字が異なっているときは論理的誤読を示す第3の認識状態情報を出力する出力手段と、を備えることができる。
こうすることにより、合計フィールド以外の他のフィールドの認識結果を用いて実際に計算を行なった計算結果の値と異なっていれば論理的エラーの誤読の決定を行うようにすることで、誤照合の可能性は低減される。
【0014】
また、前記計算手段は、前記計算式の変数として指定されたフィールドのデータの認識結果が不読あるいは誤読の場合には計算を行なわないことができる。
【0015】
また、上述した本発明に係わる帳票データ入力処理装置において、前記文字認識手段による認識結果に不読文字を示す記号コードが含まれている場合、その認識結果に含まれる前記記号コードをすべての任意の文字を表現する特殊コードに置き換えた文字列に該当する文字列のすべてをを前記フィールドと連携関係にあるデータベースファイルから抽出し、それら文字列を認識結果候補として表示を行なう検索手段と、前記検索手段によって候補表示されている文字列の中から選択された文字列を認識結果として設定する修正手段と、を備えることができる。こうすることによって、認識結果の不読文字をワイルドカードとした文字列に該当する文字列をデータベース内にある一覧表示を行なうことにより、それら認識結果候補の文字列から最適な文字列を認識結果として修正設定できる。
【0016】
また、上述した本発明に係わる帳票データ入力処理装置において、入力部から与えられた修正データに基づいて前記認識手段の認識結果を修正すると共に、修正されたフィールドの背景色を変更する表示制御手段を、更に備えることができる。
【0017】
また、本発明の別の態様のひとつである帳票データ入力処理方法は、読み取り対象の帳票を光学的に読み取って画像イメージの生成を行なう帳票データ入力処理方法であって、前記帳票の帳票定義情報を格納し、前記帳票定義情報に基づいて前記画像イメージのフィールド領域の検出を行ない、前記検出されたフィールド領域から文字イメージを1文字づつ切り出して文字認識し、各文字を認識できた場合には対応する文字コードを、文字を認識できない場合には不読を示す記号コードを前記画像イメージ上の前記フィールドに対応付けて出力すると共に、不読を示す第1の識別情報を前記フィールドの属性として設定を行ない、前記フィールドに対応付けて出力された各認識結果の文字列と前記帳票に用いられる文字列とを照合し、前記帳票に用いられない文字列である場合には誤読を示す第2の識別情報を前記フィールドの属性として設定を行ない、前記認識結果を対応するフィールドに表示すると共に、該フィールドの属性としての前記第1、第2の識別情報の設定状態に応じてフィールドの背景色を所定の背景色に変更して表示を行なう、ことによって前述した課題を解決する。
【0018】
こうすることにより、前述した本発明に係わる帳票データ入力装置と同様な作用・効果が得られる。
【0019】
また、前述した本発明に係わる帳票処理装置に相当する処理をコンピュータに行わせるためのプログラムであっても、そのプログラムをコンピュータに読み込ませて実行させることによって、前述した本発明に係わる帳票処理方法と同様な作用・効果が得られ、前述した問題が解決される。
【0020】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて説明する。
図1は本実施の形態の帳票データ入力処理装置1のブロック構成を示す図である。
【0021】
帳票処理部10は、帳票ベースで構築される業務アプリケーションに基づいて業務データベース11を用いてマスタ登録、受注伝票入力や仕入伝票入力などの伝票入力処理における全体の制御を行なう。
【0022】
業務データベース11は、伝票入力処理を実行するアプリケーションプログラムやその実行結果などのデータが格納される記憶媒体であり、この記憶媒体は磁気的、光学的記憶媒体、若しくは半導体メモリで構成されている。
【0023】
帳票フォーム情報生成部12は、表示部16に表示される処理対象の索引項目名、その項目入力枠や罫線などからなる画面フォームを帳票定義ファイル13に予め格納されている各種帳票定義情報に基づいて生成を行なう。
【0024】
帳票定義ファイル13の構成は、図2に示すように、画面制御情報、データ処理制御情報、および表示部16に表示される画面フォームを表現する帳票フォーム属性情報が組として入力対象帳票ごとに予め格納されている。帳票形式は、図3に示すように、伝票名、受注番号、受注日、得意先コード、及び得意先名等からなるヘッダ部と、商品名、商品コード、数量、単価、及び金額等からなる明細部と、総額等からなる集計部とから構成される帳票形式で表現されることにする。
【0025】
表示画面生成部14は、帳票フォーム情報生成部12によって生成された画面フォームと後述するOCR20からの認識結果とを対比して表示する表示画面の生成を行なう。
【0026】
表示メモリ15は、表示画面生成部14によって生成された表示画面情報が格納され、その情報を表示部16が読み出して表示を行なう。
ここまでの構成が帳票処理システムの構成である。
【0027】
OCR20は帳票のOCR読取処理を実行し、処理結果を帳票処理システムに渡す。
【0028】
OCR読取制御部21は、帳票処理部10から読取要求が出力された後、OCR処理全体の制御を行なう。
【0029】
画像メモリ23は、図3に示すような伝票をスキャナ22によって光学的に走査を行って読み取った帳票イメージが格納される。
OCR帳票定義ファイル24は、図2に示される帳票定義ファイル13に予め設定作成されて登録されている帳票定義情報中の帳票フォーム属性情報と同一の情報を複製処理などによって格納している。このOCR帳票定義ファイル24の構造は、図4に示す。
【0030】
認識部25は、OCR帳票定義ファイル24に登録された帳票属性情報に従って、画像メモリ23内に格納された投票イメージから読み取り対象の文字が存在するフィールドを検出し、そのフィールドイメージ中の文字イメージを1文字単位ごとに認識辞書26を参照して文字の認識を行なって、その認識結果(正読、不読)に応じた文字コードの生成を行なうものである。
認識部25は認識結果バッファ25−1を有している。
【0031】
認識結果バッファ25−1の構造は、認識部25によって文字イメージの認識結果である文字コードを一時的に格納を行なうフィールド最大認識文字数分の容量を有するFIFO(First−In First−Out)バッファである。
【0032】
認識辞書26は文字の特徴を見出し語とし、それに対応する文字コードを1対とする多数の単語が収録されているものである。
【0033】
認識結果メモリ27は、図6(a)に示すように、OCR帳票定義ファイル24に登録された帳票属性情報に従って、認識結果バッファ25−1から認識結果が出力される度に、図5に示されるその認識結果データをフィールド領域に従って置き換えられるセル領域に格納可能な表形式のセル構造を有している。
【0034】
照合部28は、認識結果メモリ27のセル領域に格納された認識結果を読み出し、その認識結果と照合辞書29との照合を行なう。そして、その照合結果に基づく認識状態を示す値を生成させ、それらの値を認識状態メモリ30に格納させるためOCR読取制御部21に出力する。
【0035】
照合辞書29には、業務アプリケーションが使用する各種マスタファイル/データファイルそれぞれの内容が照合部28が利用可能な形式に変換されて格納されている。
【0036】
認識状態メモリ30の構造は、図6(b)に示すように、図6(a)に示される認識結果メモリ30と同じ表形式のセル構造を有している。照合部28から出力された認識状態を示す値はフィールド位置に対応するセル位置に、すなわち認識結果メモリ27のセル領域に帳票読取制御部21によって格納される。
【0037】
そして、OCR読取制御部21は、照合部28によって認識結果メモリ27に格納されている認識結果のすべての照合が終わった際に、認識結果メモリ27及び認識結果メモリ30におけるセル領域が同一のセル領域の内容を組として対比するフィールド情報と共に帳票処理部10に出力する。
【0038】
帳票処理部10は、OCR読取制御部21からの認識状態に対する色コード変換を行なって対応するフィールド属性として認識結果と共に表示画面生成部14に渡す。
【0039】
表示画面生成部14は、帳票処理部10から渡された認識結果と帳票フォーム情報生成部12が帳票定義ファイル13に従って生成した画面フォームと認識結果を対比させ、認識状態に応じて変換された色コードに対応する表示色をフィールド背景色とした表示画面の生成を行なう。
そして、画面情報は表示メモリ15に格納されて表示部16によって表示される。
【0040】
このOCR読取制御部21は、表示部16によって表示された不読または誤読を含む認識結果を修正するためのキーボードやマウスなどの入力部31と認識結果修正部32を備えている。
【0041】
認識結果修正部32は、入力部31によって修正対象のフィールドが指定された際、認識状態メモリ30の認識状態が正読状態でなければ、照合部28によって照合辞書29から当該認識結果と類似する文字列を修正候補として出力を行なって表示部16に表示させ、そして入力部31によって選択された文字列によって認識結果メモリ27中の認識結果と認識状態メモリ30中の認識状態の更新を行なう。尚、入力部31から文字あるいは文字列が入力された際には、認識結果メモリ27と認識状態メモリ30中のセルのうち、選択フィールドに対比する認識結果と認識状態を書き換えが行なわれる。
【0042】
本実施例の帳票入力処理装置1は以上のように構成されている。
以下、本実施の形態の動作を説明する。
【0043】
図7は帳票入力処理装置1で行われるOCR帳票入力処理の処理内容を示すフローチャートである。
まず、S101では、帳票入力処理装置1の起動がなされると表示部16の画面にダイアログボックス表示される選択メニュー(図示せず)から業務処理対象の業務項目の選択がマウス操作等により行われる。ここでの選択メニュー項目は、例えばマスタ登録業務、受注伝票入力業務や仕入伝票/請求書入力業務などである。
以下の説明においては、処理対象の業務として受注伝票入力業務が選択されたものとする。
【0044】
S102では、帳票処理制御部10において選択された業務項目に対応する業務アプリケーションプログラム及び帳票定義情報を業務データベース11、帳票定義ファイル13からRAM(図示せず)内のそれぞれの所定領域に読み込まれる。また、業務定義ファイル13中のOCRフォーム属性情報はOCR帳票定義ファイル24に格納される。
【0045】
S103では、前述したS102の読み込み処理によってRAM内に業務アプリケーションプログラムと帳票定義の読み込みが終了すると、帳票処理部10はOCRシステム20に入力処理を要求し、その要求を受け取ったOCR読込制御部21によってOCR帳票入力処理が開始され、イメージスキャナ22から伝票のイメージが入力されて、その伝票のイメージデータが画像メモリ23内に格納される。図2に示した伝票は、イメージスキャナ22によりイメージが取り込まれる伝票の例を示す。この伝票は、受注伝票であり、伝票名、受注番号、受注日、得意先コード、及び得意先名等からなるヘッダ部と、商品名、商品コード、数量、単価、及び金額等からなる明細部と、総額等からなる集計部とから構成される。
【0046】
S104では、画像メモリ23に格納されている帳票イメージからOCR帳票定義ファイル24に項目定義されている各フィールド領域に従ってその領域内の文字イメージの文字認識が認識辞書26を参照する認識部25によって認識できなかった文字は不読文字とした記号コード、また認識できた文字は対応する文字コードを付与して認識結果メモリ27内の指定された保存先に格納を行なう。この認識処理は後述する。
【0047】
S105では、前述したS104の認識処理によって認識結果メモリ27に全てのフィールドに対しての認識結果の格納が終わると、不読記号コードを含む認識結果を除いた各認識結果の整合性判別を照合辞書29を参照して照合部28により行ない、その判別結果に応じた値を認識状態として認識状態メモリ30内の指定された格納先に格納を行なう。この整合性判別処理は後述する。
【0048】
S106では、前述したS104の認識処理とS105の整合性判別処理によって認識結果メモリ27と認識状態メモリ30にそれぞれ格納された帳票イメージ上のフィールド領域毎の認識結果及びその認識状態が帳票読取制御部21によって帳票処理部10に渡される。そして、帳票処理部10では、RAM内に読み込まれた帳票定義中の画面制御情報と帳票フォーム属性情報に従ったフィールドイメージの生成を帳票フォーム情報生成部12によって行なう。
【0049】
S107では、前述したS106の処理によって生成されたフィールドイメージと帳票読取制御部21から渡された認識結果とを対比して認識結果を表示する表示画面を生成すると共に、認識結果それぞれに対応してその認識状態を示す値(正読=0、不読=1、照合的誤読=2、論理的誤読=3)に応じたそれぞれの所定の表示色にフィールド背景色が変更された図8に示すような表示画面を生成して表示メモリ15に格納が表示画面生成部14によって行なわれる。背景色変更処理は後述する。
【0050】
S108では、背景色が標準色とは異なる色にて表示されるフィールド、つまり不読文字あるいは誤読文字を含むフィールドがあるか否かを認識状態メモリ31各項目に格納されている認識結果の認識状態の値が0以外の値か否かにより帳票読取制御部21によって判別される。ここでの認識状態の値は正読=0、不読=1、照合的誤読=2、および論理的誤読=3を示している。そして、この判別結果がYesならば、すなわち標準色とは異なる背景色のフィールドがあれば、S109に処理が進み、NoならばS115に処理が進む。
【0051】
S109では、フィールドが入力部40によって指定されたか否かが帳票読取制御部21によって判別される。そして、結果がYesならばS109に処理が進み、Noならばこの判別処理がYesになるまで繰り返す。
【0052】
S110では、前述したS108の判別処理によって判別されたフィールドに対する認識結果に含まれる不読部分または誤読部分を他のフィールドの認識結果あるいは他の情報を基に認識結果を修正する補完処理を行なう指定が設定されているか否かの判別を帳票読取制御部21によって行われる。この判別処理は当該項目内容に照合辞書名または合計フィールド名が設定されているか否かによって判別される。そして、結果がYesならばS111に、NoならばS112のそれぞれの処理に進む。
【0053】
S111では、S110の判定処理によって補完処理が指定されていると判定されたフィールドの不読文字または誤読文字を含む認識結果に対して修正を施す処理が照合辞書29を用いた照合部28と認識結果修正部32によって行なわれる。この補完処理は後述する。
【0054】
S112では、入力部31から入力される1文字また2以上の文字からなる文字列のワークメモリ(図示せず)への格納が認識結果修正部32によって行なわれる。
【0055】
S113では、上述のS111あるいはS112の補完または修正入力処理によって不読または誤読を含む認識結果に対して修正された認識結果が認識結果メモリ27中の該当セル位置に格納する更新が行われる。
【0056】
S114では、S113の認識結果更新処理によって認識結果メモリ27内で更新された認識結果に対応する認識状態メモリ30内の認識状態の値が「0」にセットされ、当該フィールドの認識結果が修正されたことが示される。そして、図9に示すような帳票イメージの表示画面が表示部16に表示される。
そして、S114の処理が終了したときにS106へ処理が戻って上述した処理が繰り返される。
【0057】
以上のS106〜S114の処理が繰り返され、前述したS108の判別処理の結果がYesであったとき、つまり、不読または誤読を含む認識結果を有する各フィールドが正しい認識結果に修正されて認識状態を示す値が「0」にセットされたとき、認識結果が帳票処理部10で指定される保存先のデータベースにレコード形式の格納がS115〜S118の処理にて行われる。
【0058】
S115では、認識結果メモリ27の内容に基づいて、ヘッダ部、明細部、及び集計部に分けて構成される伝票フォーム情報の作成成が行われる。
【0059】
S116では、上述の帳票フォーム作成処理によって作成された帳票フォームをワークメモリ内の図示しないフォームメモリに格納が行われる。
【0060】
S117では、各明細部データ毎にヘッダ部データと集計部データを付加した伝票レコードの作成が行われる。
【0061】
S118では、前述したS117で作成された伝票レコードを図10に示すようなデータベースレコードとして業務データベース11に格納が行われる。
【0062】
以上までの処理がOCR帳票入力処理である。
次に、図7に示したOCR帳票入力処理におけるS104の処理において行われる認識処理の詳細について説明する。この処理は、スキャナによって既に読み込まれて画像メモリに格納されている伝票イメージから文字認識し、認識結果を認識結果メモリ27内の格納先に格納を行なう認識処理である。
【0063】
図11は認識処理の処理内容を示すフローチャートである。
まず、S201では、OCR帳票定義ファイル24に格納されている入力フィールド属性情報のフィールド項目座標とその大きさに従って画像メモリ23内のブロック領域の切り出しが認識部25によって行われる。
【0064】
S202では、上述されたS201の切り出し処理によって切り出されたブロック領域内の文字イメージを一文字単位づつ切り出して特徴を抽出し、この特徴に合致する見出しが認識辞書35内にあるか否かの検索が行われる。
【0065】
S203では、上述したS202の検索処理によって文字イメージの特徴に合致する見出しが検出されたか否かが判定される。その結果、Yesであれば文字が認識されたとしてS204の処理に進み、Noであれば文字が認識されないとしてS205の処理に進む。
【0066】
S204では、上述したS202の検索処理で合致するとして検索された見出しに対応して認識辞書26内に記憶されている文字コードが認識結果として出力される。
【0067】
S205では、上述したS202の検索処理で該当する対象物がない、すなわち認識ができない不読文字として記号コード「?」を出力される。
【0068】
S206では、上述したS204とS205の処理によって出力されたコードを認識結果バッファ25−1に格納を行なう。
【0069】
S207では、フィールド内のすべての文字の認識結果が認識結果バッファ25−1に格納されたか否かの判別が行われる。その結果、YesであればS208に処理が進み、NoであればS202の処理に戻り、S202〜S206の処理が繰り返し行われる。
【0070】
S208では、認識結果バッファ25−1に格納された認識結果を、図12に示すように、図5に示された帳票フォーム属性情報に基づいて指定される認識結果メモリ27のセル領域への格納が帳票読取制御部21によって行われる。
【0071】
S209では、帳票フォーム属性情報に基づいて、上述したS201の切出処理によって切り出すべきフィールド領域があるか否かの判定を行なう。その結果、Yesであれば全てのフィィールド領域が切り出されたとしてS210の処理に進み、Noであれば未だ切り出すべきフィールド領域があるとしてS201の処理に戻って上述した処理が繰り返される。
【0072】
S210では、上述したS208の処理によって認識結果メモリ30内に格納された認識結果の呼び出しを行なう。なお、図12で示すように、その読み出しの方向順序は認識結果メモリ30左上隅の項目を先頭に横方向あるいは縦方向のいずれであってもよい。
【0073】
S211では、S210によって読み出された認識結果に不読文字を示す記号コード「?」が含まれているか否かの判定を行なう。その結果、YesならばS212に、Noならば元の処理に戻る。
【0074】
S212では、S211の判定処理によって認識結果に不読文字を含むと判定されたフィールドに対応する図13に示される認識状態メモリ30内のD1セル領域の内容が「1」に更新される。
【0075】
S213では、図12で示される認識結果メモリ27内の右下隅のセル領域内に格納されている認識結果が読み出されて不読フィールドか否かの判別処理を行われたか否かの判別を帳票読取制御部21によって行われる。この判別結果がYesであれば、これらの処理を終えた後には図4のS104に戻る。また、NoであればS210の処理に戻って上述した処理が繰り返される。
【0076】
次に、図7に示した帳票処理おけるS105の処理において行われる整合性判別処理の詳細について説明する。この処理は、図7に示したS104の認識処理によって文字認識された結果の整合性をOCR帳票定義ファイル24に格納されているOCR項目属性の中の照合型に従って照合処理を行ない、整合性がない場合には誤認識の可能性が高いことを示す誤読状態を認識状態メモリ30に格納を行なう整合性判定処理である。
【0077】
図14は整合性判別処理の処理内容を示すフローチャートである。
この整合性判定処理はOCR帳票定義に設定されている内容に使用辞書名が設定されていれば候補照合形式、他の項目名が設定されていれば索引照合形式、あるいは計算式が設定されていれば計算結果照合形式のいずれかの照合形式にて処理の実行を行うものとする。
【0078】
まず、S301では、認識結果メモリ27の各セル領域内の認識結果の整合性照合を行う際に、照合対象のセル領域に対応するOCR帳票定義ファイル24のOCR帳票フォーム属性に使用辞書名が設定されているか否かの判定が行われる。つまり、辞書を参照して照合する形式か、あるいは計算式を実行した結果によって照合する計算結果照合形式かの判別を行なう。その結果、YesであればS302、NoであればS309の処理のそれぞれに進む。
【0079】
S302では、上述したS301の判別処理によって辞書名が設定されていると判別された照合形式が認識結果を直接的に照合を行う候補照合形式か、または間接的に照合を行う索引照合形式のいずれかであるかをOCR帳票定義ファイル24のOCRフォーム属性項目に同一項目の辞書名が格納されているか否かで形式判別を行なう。その結果、YesであればS303、NoであればS304のそれぞれの処理に進む。
【0080】
S303では、認識結果をキーとして該当する文字列が照合辞書30内の辞書名に対応する辞書の中に存在するか否かの検索を行なった検索結果をワークメモリ(図示せず)に一時的に格納を行なう。この候補照合処理の詳細は後述する。
【0081】
S304では、S302の判別処理によって候補照合型でないと判別されたときにOCR帳票定義ファイル24のフォーム属性項目に索引条件が設定されているか否かの判別を行なう。この結果がYesならばS305の処理に進み、Noならばこの整合性判別処理は終了し、元の処理に戻る。
【0082】
S305では、上述したS304の判別処理によって索引照合型であると判別された際に、索引条件に従って認識結果以外の他の項目の認識結果を認識結果メモリ27から取得すると共にその取得の認識結果をキーとして他の項目のフィールド属性に設定されている辞書名に対応する照合辞書29内の辞書を索引し、その索引結果に対応する認識結果と同一項目データと認識結果データとの比較を行なう処理が行われる。この索引照合処理の詳細は後述する。
【0083】
S306では、上述したS313及びS305の処理によって得た認識結果と同一の文字列が存在したときのみ、すなわち不読または誤読文字を含まない正読の認識結果であると判別したときにはS307に処理が進み、そうではないときにはS308に処理が進む。
【0084】
S307では、認識結果の認識状態が正読を示す値として「0」を認識状態メモリ30の指定のセル領域に格納が行われる。
【0085】
S308では、帳票読取制御部21において認識結果の認識状態を示す値として「2」を認識状態メモリ30の指定セル領域に格納が行われる。
【0086】
ところで、S301の判別処理の結果がNoであったときには、S309においてOCR帳票定義ファイル24内のOCRフィールド属性項目にセル領域位置を係数とする計算式が設定されているか否かを帳票読取制御部21において判別される。そして、この判別結果がYesならばS310に処理が進み、Noならば照合処理を行わず、図11に示されるS213に戻る。
【0087】
S310では、OCRフィールド属性項目の計算式に従った計算を実行し、その計算結果と認識結果との照合処理が行われる。この処理の詳細は後述する。
【0088】
S311では、S310の処理により、計算結果と認識結果とが一致したときのみS312に処理が進み、そうではないときにはS307に処理が進む。
【0089】
S312では、帳票読取制御部21において認識結果の認識状態を示す値として「3」が認識状態メモリ30に格納が行われる。
【0090】
以上のS307及びS308、S312における認識状態の設定処理が終えた後は整合性判別処理が終了し、元の処理に戻る。
以上までの処理が整合性判別処理である。
次に、図14に示した整合性判別処理におけるS303の候補照合処理の詳細について説明する。
図13は候補照合処理の処理内容を示すフローチャートである。
【0091】
まず、S410では、OCR帳票定義ファイル24内の対応するOCRフィールド属性項目の使用辞書名の取得を行なう。
【0092】
S411では、上述したS410の取得処理によって取得した辞書名に対応する照合辞書29内の辞書ファイルの特定を行なう。
【0093】
S412では、S411の処理によって特定された辞書を認識結果を主キーとし、且つ項目名をサブキーとして検索を行ない、一致する文字列があれば照合部37に設けたワークメモリ(図示せず)に一時的に格納を行なう。
S412の処理を終えた後には候補照合処理が終了し、元の処理へと戻る。
【0094】
以上までの処理が候補照合処理である。
次に、図12に示した整合性判別処理におけるS305の索引照合処理について詳細に説明する。
図14は索引照合処理の処理内容を示すフローチャートである。
【0095】
まず、S510では、OCR帳票フィールド属性項目から索引条件内容の取得を行なう。索引条件としては認識結果の索引照合、つまり間接的な照合を行う他方の帳票上の項目名とその照合対象の辞書名の取得を行なう。
【0096】
S511では、前述したS510の索引条件取得処理によって取得した項目名をキーとして対応する認識結果データを認識結果メモリ27から検索して取得を行なう。
【0097】
S512では、前述したS511の取得処理によって取得した項目データである認識結果を格納している認識結果メモリ27のセル領域と同一のセル領域内の認識状態値が「0」、すなわち正読フィールドであるか否かの判別を行なうこの判別結果がYesであれば、すなわち「0」の値であればS513の処理に進み、Noであれば、すなわち値が「0」以外の値である「1」〜「3」の値のいずれかであれば認識結果に不読または誤読文字を含むとして索引照合処理を終了して元の処理へと戻る。
【0098】
S513では、上述したS510の索引条件取得処理にて取得した辞書名に対応する辞書ファイルを照合辞書38内から照合部37によって選択が行なわれる。
【0099】
S514では、上述したS510の索引条件取得処理によって取得した索引項目と同一項目に属する認識結果からS511の処理によって取得された認識結果に該当する文字列をS513の選択処理によって選択された辞書ファイル内の検索が行われる。
【0100】
S515では、S514の検索処理によって該当する文字列が辞書ファイル内から検索されたか、すなわち該当の文字列が存在したか否かの判別が行われる。この判別結果がYesであればS516の処理に進み、Noであれば索引照合処理を行わずに元の処理に戻る。
【0101】
S516では、S514の検索処理によって検索された文字列に対応して辞書ファイル内に記憶されている項目データの中から認識結果が属する項目の項目データが取り出される。つまり、逆引き検索が行われる。
【0102】
S517では、S516の逆引き検索処理によって取得された取得結果と認識結果との比較照合が行なわれる。
S517の処理を終えた後には索引照合処理は終了し、元の処理に戻る。
【0103】
以上までの処理が索引照合処理である。
次に、図14に示した整合性判別処理におけるS309の処理において行われる計算結果照合処理について説明する。
図17は計算結果照合処理の処理内容を示すフローチャートである。
【0104】
まず、S610では、OCR帳票定義ファイル24におけるOCR帳票フィールド属性項目の計算式の取得を行なう。この計算式の変数は認識結果メモリ27のセル座標で示される。
【0105】
S611では、S610の処理で取得された計算式の変数によって示されたセル内容が認識結果メモリ27から取得が行われる。
【0106】
S612では、S611の取得処理によって計算式の変数として取得された認識結果それぞれが不読または誤読文字を含んでいない正しい認識結果であるか否かの判別を行なう。この判別結果がYesならばS613の処理に進み、Noならば元の処理へと戻る。
【0107】
S613では、上述したS611の処理によって取得された計算式の各変数の値を計算式に代入した演算を行なうと共に、その計算結果の値を帳票読取制御部21内のワークメモリ(図示せず)に一時的に格納を行なう。
【0108】
S614では、前述したS613の演算処理によって求めた値と認証結果とが同一か否かの比較を行なう。
S614の処理を終えた後には計算結果照合処理が終了し、元の処理へと戻る。
【0109】
以上までの処理が計算結果照合処理である。
次に、図7に示した帳票データ入力処理におけるS107の処理において行なわれるフィールド背景色変更処理について詳細に説明する。この処理は、上述したS104の認識処理によって認識結果が出力され、その認識結果とフィールドイメージとを対比させて表示を行なう際に、各フィールドの認識状態に応じた所定の表示色にて背景色の表示を行なう処理である。
図18は背景色変更処理の処理内容を示すフローチャートである。
【0110】
まず、S710では、認識状態メモリ30の内容が帳票読取制御部21によって読み出され、帳票処理部10に渡される。そして、帳票処理部10において帳票状態メモリ30の内容を順次読み出される。
【0111】
S711では、前述したS710の処理によって読み出された認識状態値が「0」(正読)か否かの判別を行なう。この判別結果がYes、すなわち認識状態=0ならばS712の処理に進み、NoならばS713の処理に進む。
【0112】
S712では、フィールドの背景色コードの変更が行なわれ、正読状態を示す表示色に対応する「白」コードに帳票処理部10の背景色変更部(図示せず)によって変更される。
【0113】
S713では、前述したS710の処理によって読み出された認識状態値が「1」(不読状態)か否かの判別を行なう。この判別結果がYes、すなわち認識状態=1ならばS714の処理に進み、NoならばS715の処理に進む。
【0114】
S714では、フィールドの背景色コードの変更が行なわれ、不読状態を示す表示色に対応する「桃色」コードに変更を帳票処理部10の背景色変更部(図示せず)によって行なわれる。
【0115】
S715では、前述したS710によって読み出された認識状態値が「2」(照合的誤読状態)か否かの判別を行なう。その判別結果がYesならば、すなわち認識状態値=2(照合的誤読状態)ならばS716の処理に進み、Noならば、すなわち認識状態=3(論理的誤読状態)ならばS717の処理に進む。
【0116】
S716では、フィールドの背景色コードの変更が行なわれ、照合的誤読状態を示す表示色に対応する「水色」コードに背景色変更部(図示せず)によって変更される。
【0117】
S717では、フィールドの背景色コードの変更が行なわれ、論理的誤読状態を示す表示色に対応する「黄色」コードに背景色変更部(図示せず)によって変更される。
【0118】
S718では、上述したS712、S714、S716、及びS717の各処理によって認識結果の認識状態に応じて設定されたフィールドの背景色コードをそれぞれのフィールドにおける表示属性として表示画面生成部14によって設定が行われる。
【0119】
S719では、S710の処理によって認識状態メモリ30から全ての認識状態が読み出されたか否かの判別が行われる。この判別結果がYesならばSS720の処理に進み、NoならばS710の処理に戻る。そしてS710乃至S718の処理をYesになるまで繰り返す。
【0120】
S720では、上述したS718の処理によって設定された色コードに基づいた背景色にて各フィールドそれぞれが表示される。
S720の処理を終えた後には背景色変更処理は終了し、元の処理へと戻る。
【0121】
以上までの処理が背景色変更処理である
次に、図7で示した帳票データ入力処理におけるS111において行われる補完処理について詳細に説明する。この処理は、前述のS105の整合性判別処理によって不読、誤読状態になった認識結果を同一帳票の他の項目の認識結果に基づいて修正を行なう処理である。
図19は補完処理の処理内容を示すフローチャートである。
【0122】
まず、S810では、入力部40によって修正すべく指定されたフィールドが不読フィールドか否かを認識状態メモリ30の認識状態の値によって判別を行なう。つまり、認識状態の値=1であるか否かの判別である。この判別結果がYesならばS811の処理に進み、NoならばS819の処理に進む。
【0123】
S811では、前述したS810の判別処理によって不読フィールドと判別されたフィールドに対するフィールド属性項目から辞書名の取得を行なう。
【0124】
S812では、取得した辞書名に対応する照合辞書30内の辞書ファイルから認識結果に含まれる不読文字をワイルドカードとした検索キーワードに該当する全ての文字列を抽出する曖昧検索が照合部28によって行なわれる。
【0125】
S813では、S812の検索処理によって抽出された文字列があるか否かが照合部28によって判別される。この判別結果がYesならばS814の処理に、NoならばS816の処理にそれぞれ進む。
【0126】
S814では、前述したS812の検索処理によって抽出された文字列のすべてを帳票処理部10に渡す。ここで、帳票表示部10は認識結果の修正候補として表示部16に一覧表示を行なう。S815では、S814の処理によって表示部16に表示された認識結果候補一覧のいずれかの文字列が入力部31から指定されたか否かが帳票読取制御部21によって判別され、この判別結果がYesになるまでこのS815の処理が繰り返される。
S815の判別結果がYesならばこの補完処理が終了し、元の処理へ戻る。
【0127】
ところで、S812の検索処理によって指定された照合辞書29内の辞書ファイル内に該当する文字列が検索され、S813の判別処理によって文字列がなかったと判別されたときには、検索対象の認識結果に類似する文字列を同ファイルから検索を行なうために、S816において認識結果である1つまたはそれ以上の文字からなる文字列の最後尾文字の削除を帳票読取制御部21によって行なわれる。
【0128】
S816では、前述したS816の文字削除処理によって認識結果の文字が全て削除されたか否かの判別がされ、この判別結果がYesならばS818の処理に進み、NoならばS812の処理に戻って上述した曖昧検索処理を繰り返す。
【0129】
S818では、認識結果を構成する文字数を取得し、その文字数に合致するすべての文字列を上述したS812の処理によって指定されている照合辞書29内の辞書ファイルから検索を行なう。
S818での処理が終わると上述したS814の候補一覧表示処理に進む。
【0130】
ところで、上述したS810の処理によって認識結果の認識状態を示す値が「1」でないと判別されたときには、S819において認識状態が誤読状態(照合的誤読)を示す値である「2」であるか否かの判別を行なう。この判別結果がYesならば図12に示した照合処理におけるS303の処理と同様の処理に進み、NoならばS820の処理に進む。
【0131】
S820では、認識結果の認識状態を示す値が「3」であるか否かの判別を行なう。この判別結果がYesならば、図12に示した照合処理におけるS310の処理と同様の処理に進み、Noならば不読または誤読フィールド以外のフィールドが指定されているので、この修正補完処理を終了し、元の処理へと戻る。
【0132】
以上までの処理が補完処理である。
以上までに説明した図4から図18にかけての処理が行なわれることによって、スキャナ22により入力された帳票イメージに基づいた帳票項目の入力処理が実現される。
【0133】
なお、上記実施の形態では、1ページ分の伝票項目を持つ伝票を読み込んだ際、1ページ分の項目情報として伝票データ入力を行うものであるが、複数に分類された項目領域を持つ伝票を読み込んだ際、それら分類された項目データを、分類別の項目情報ページで構成される分類タブ構造のうち対応する分類タブページに伝票データ入力を行うことができる。その際、図20に示すように、タブ上の誤読・不読フィールドの有無によって最上部又は左右端のタブラベル色を変更するようにしてもよい。
【0134】
なお、前述した図7、図11及び図14から図19にかけて示した各種の処理を前述したような標準的な構成を有するコンピュータに行わせるための制御プログラムを作成し、その制御プログラムをそのコンピュータに読み込ませて実行させることにより、上述した実施例における帳票データ入力装置1に相当する機能をそのようなコンピュータに行なわせることも可能である。またこのような制御プログラムを読み取り可能な記録媒体に記録させ、そのプログラムを記録媒体からコンピュータに読み出させて実行させることによってこの実施例における帳票データ入力装置に相当する機能をこのようなコンピュータに行なわせることも可能である。
ここでの記録媒体としては、例えば、コンピュータに内蔵若しくは外付けの付属装置として備えられるROMやハードディスク装置などの記憶装置、あるいはフレシキブルディスク、MO(光磁気ディスク)、CD−ROM、DVD−ROMなどといった携帯可能記録媒体などが利用できる。また、記録媒体はネットワークを介してコンピュータと接続される、プログラムサーバとして機能するコンピュータが備えている記録装置であってもよい。この場合には、制御プログラムを表現するデータ信号で搬送波を変調して得られる伝送信号を、プログラムサーバから伝送媒体であるネットワークを通じて伝送するようにし、コンピュータでは受信した伝送信号を復調して制御プログラムを再生することで当該制御プログラムを実行できるようになる。
【0135】
【発明の効果】
以上詳細に説明したように、本発明によれば、OCRによって読み込んだ帳票フィールド領域のイメージを1文字イメージごとに文字認識を行ない、フィールド単位での認識結果の読取データと入力必須データとのデータ整合性の判別を行ない、それら判別結果それぞれに応じて照査必須フィールドの背景色を異ならせて表示することが可能となり、照査必須フィールドを間違いなく確認できる効果を奏する。
【図面の簡単な説明】
【図1】本発明を実施する帳票データ入力装置の構成を示す図である。
【図2】帳票様式を示す図である。
【図3】帳票定義ファイルの構造を示す図である。
【図4】帳票定義ファイルに定義されたフィールド属性に従って、伝票イメージデータをセル領域に置き換えた状態の例を示す図である。
【図5】OCR帳票定義ファイルの構造を示す図である。
【図6】各種データを格納するメモリ構造を示す図であり、(a)は認識結果が格納される認識結果メモリの構造を示し、(b)は認識状態が格納される認識状態メモリの構造を示す。
【図7】帳票データ入力処理の処理内容を示すフローチャートである。
【図8】OCRによる認識結果の表示例を示す図である。
【図9】認識結果の修正後の表示例を示す図である。
【図10】データベースに格納されるデータベースレコードの構造を示す図である。
【図11】認識処理の処理内容を示すフローチャートである。
【図12】認識結果メモリ内に認識結果を格納した状態の例を示す図
【図13】認識状態メモリ内に認識常態を格納した状態の例を示す図
【図14】整合性判別処理の処理内容を示すフローチャートである。
【図15】候補照合処理の処理内容を示すフローチャートである。
【図16】索引照合処理の処理内容を示すフローチャートである。
【図17】計算結果照合処理の処理内容を示すフローチャートである。
【図18】背景色変更処理の処理内容を示すフローチャートである。
【図19】補完処理の処理内容を示すフローチャートである。
【図20】誤読フィールドに対応するタブラベル表示例を示す図である。
【符号の説明】
1 帳票データ入力装置
10 帳票処理部
11 データベース
12 帳票フォーム情報生成部
13 帳票定義ファイル
14 表示画面生成部
15 表示メモリ
16 表示部
20 OCRシステム
21 帳票読取制御部
22 スキャナ
23 画像メモリ
24 OCR帳票定義ファイル
25 認識部
25−1 結果バッファ
26 認識辞書
27 認識結果メモリ
28 照合部
29 照合辞書
30 認識状態メモリ
31 入力部
32 認識結果修正部
【発明が属する技術分野】
本発明は光学式文字読取システム(以下、「OCR」という)、特にその読み取り結果の表示形式に関する。
【0002】
【従来の技術】
昨今、業務アプリケーションにOCRを取り入れ、キーボード上のキー操作によるデータ入力作業の軽減あるいは誤入力防止を図るための帳票データ入力処理システムが提供されている。かかる帳票データ入力処理システムでは、入力対象の帳票をOCRが光学的に読み取って得た画像イメージの文字フィールドに含まれる文字の認識結果の表示を行なう際に、文字認識によって認識できた文字は所定の文字フォントによって黒色の表示を行ない、また、認識できなかった文字の不読文字は特定の記号によって赤色の「?」で表示を行なうことにより、照査訂正を行なうオペレータが不読文字を見落とすことなく正しい文字に修正を可能としているものがある(例えば、特許文献1を参照。)。
【0003】
【特許文献1】
特開2002−133367号
【0004】
【発明が解決しようとする課題】
このようなOCRを用いた帳票データ入力システムでは、OCRにて認識できなかった不読文字は赤色の「?」で表示されるので、フィールド内の文字数が多くなっても不読文字を含むフィールドを容易に視認することができるが、それでも、一度に視認できる範囲には限度があるので常に注意を払ってフィールドの確認を行なう必要があった。また、OCRにて認識できた文字は黒色で表示されるので、文字としては認識されたものの論理的に整合性が取れていない誤読文字を表示しているフィールド内容を瞬時に視認するのは困難であった。
【0005】
以上の事情を鑑み、認識結果に不読の文字又は誤読の文字を含むフィールドの照査をオペレータが確実かつ容易に行なうことができる新たな帳票データ入力処理装置、帳票処理方法を提供することが本発明が解決しようとする課題である。
【0006】
【課題を解決するための手段】
本発明の態様のひとつである帳票データ入力処理装置は、読み取り対象の帳票を光学的に読み取って画像イメージを生成する読取手段と、予め格納されている帳票の帳票定義情報に基づいて前記画像イメージのフィールド領域を検出するフィールド領域検出手段と、前記検出手段によって検出されたフィールド領域ごとに、夫々のフィールドに含まれる文字イメージを文字認識し、文字を認識できた場合には対応する文字コードを付与する文字認識手段と、前記文字認識手段によってすべての文字が認識されたフィールドに対しては、それら認識できた文字からなる文字列を前記帳票に用いられる文字列と照合し、その照合結果が前記帳票に用いられない文字列である場合には、該フィールドが誤読フィールドであることを示す認識状態情報を出力する照合手段と、前記文字認識手段によって付与された文字コードに対応する文字フォントをフィールドイメージと対比して表示する際に、前記照合手段によって出力される識別状態情報に基づいて誤読フィールドを正読フィールドと識別可能に表示する表示手段と、を備えるように構成することによって前述した課題を解決する。
【0007】
この構成によれば、OCRによって読み込まれた帳票フィールドの文字イメージの認識結果と入力必須データとの整合性の結果に応じてフィールドイメージを夫々に識別可能に表示させることができるので、フィールド内の文字がすべて認識されているにも拘わらず整合性がとれないフィールドをオペレータは照査必須フィールドとして間違いなく確認できる。
【0008】
なお、上述した本発明に係わる帳票データ入力処理装置において、前記認識手段を、認識できなかった文字には不読を示す認識できた文字コードとは異なる記号コードを付与し、前記表示手段を、前記認識手段において認識できなかった文字に対応するフィールド内の文字イメージを、付与された記号コードに対応する記号で表示するように構成できる。
こうすることにより、フィールド内の修正対象の文字イメージを容易に特定することができる。
【0009】
なお、このとき、前記表示手段は、すべてのフィールドを表示する際に、フィールド内に不読文字を含む不読フィールドを他のフィールドと識別可能に表示するように構成できる。
こうすることにより、修正対象のフィールドを確実に特定することができる。
【0010】
また、更に、前記表示手段は、前記認識手段または前記照合手段によって前記フィールド内の文字イメージの認識結果に基づいてフィールド夫々の背景色を異なる表示色で表示するように構成できる。
こうすることにより、「不読」文字、「誤読」文字を含む夫々のフィールドを区別して視認することができ、修正漏れなどを防止できる。
【0011】
なお、上述した本発明に係わる帳票データ入力処理装置において、帳票処理に用いられる各種ファイルを格納するデータベースを、更に備えることが望ましく、この場合、前記照合手段は、前記定義手段に定義されている照合対象とするフィールドと連携関係にある前記データベース内のデータベースファイルを指定する第1の指定手段と、前記第1の指定手段によって指定されたデータベースファイル内の文字列と前記照合対象のフィールドの文字列とを比較する比較手段と、を備えることができる。
こうすることにより、各種帳票処理に用いるファイルから認識結果の文字列の照合に最適なファイルを指定できるので、誤照合の可能性が低減し、またその照合のための処理時間が削減される。
【0012】
なお、このとき、前記照合手段によって前記フィールドにおける認識結果の文字列が前記指定データベースファイルに存在しないと判別された場合に、前記帳票定義手段に前記フィールドに関連付けて定義されている他のフィールドと連携関係にあるデータベースファイルを指定する第2の指定手段と、前記第2の指定手段によって指定されたデータベースファイルから前記連携関係にある他のフィールドにおける認識結果の文字列をキーとした索引を行なって得た索引結果を前記フィールドにおける認識結果の修正文字列として設定する補完手段と、を備えることができる。
こうすることで、照合結果によって誤読文字を含むフィールドであっても、連係関係にある他のフィールドにおける照合処理を行なうようにすることで、照合結果が認識結果とされるので、誤読文字を含む認識結果の誤りを補完することができる。
【0013】
また、上述した本発明に係わる帳票データ入力処理装置において、前記照合手段は、文字フィールドが合計フィールドである場合には、合計フィールドに対応して前記帳票定義手段によって定義されている計算式の変数として指定される他のフィールドの認識結果を用いて該計算式の実行を行なう計算手段と、前記計算手段による計算結果の文字列と該合計フィールドに対応する認識結果の文字列を比較し、一部あるいは全部の文字が異なっているときは論理的誤読を示す第3の認識状態情報を出力する出力手段と、を備えることができる。
こうすることにより、合計フィールド以外の他のフィールドの認識結果を用いて実際に計算を行なった計算結果の値と異なっていれば論理的エラーの誤読の決定を行うようにすることで、誤照合の可能性は低減される。
【0014】
また、前記計算手段は、前記計算式の変数として指定されたフィールドのデータの認識結果が不読あるいは誤読の場合には計算を行なわないことができる。
【0015】
また、上述した本発明に係わる帳票データ入力処理装置において、前記文字認識手段による認識結果に不読文字を示す記号コードが含まれている場合、その認識結果に含まれる前記記号コードをすべての任意の文字を表現する特殊コードに置き換えた文字列に該当する文字列のすべてをを前記フィールドと連携関係にあるデータベースファイルから抽出し、それら文字列を認識結果候補として表示を行なう検索手段と、前記検索手段によって候補表示されている文字列の中から選択された文字列を認識結果として設定する修正手段と、を備えることができる。こうすることによって、認識結果の不読文字をワイルドカードとした文字列に該当する文字列をデータベース内にある一覧表示を行なうことにより、それら認識結果候補の文字列から最適な文字列を認識結果として修正設定できる。
【0016】
また、上述した本発明に係わる帳票データ入力処理装置において、入力部から与えられた修正データに基づいて前記認識手段の認識結果を修正すると共に、修正されたフィールドの背景色を変更する表示制御手段を、更に備えることができる。
【0017】
また、本発明の別の態様のひとつである帳票データ入力処理方法は、読み取り対象の帳票を光学的に読み取って画像イメージの生成を行なう帳票データ入力処理方法であって、前記帳票の帳票定義情報を格納し、前記帳票定義情報に基づいて前記画像イメージのフィールド領域の検出を行ない、前記検出されたフィールド領域から文字イメージを1文字づつ切り出して文字認識し、各文字を認識できた場合には対応する文字コードを、文字を認識できない場合には不読を示す記号コードを前記画像イメージ上の前記フィールドに対応付けて出力すると共に、不読を示す第1の識別情報を前記フィールドの属性として設定を行ない、前記フィールドに対応付けて出力された各認識結果の文字列と前記帳票に用いられる文字列とを照合し、前記帳票に用いられない文字列である場合には誤読を示す第2の識別情報を前記フィールドの属性として設定を行ない、前記認識結果を対応するフィールドに表示すると共に、該フィールドの属性としての前記第1、第2の識別情報の設定状態に応じてフィールドの背景色を所定の背景色に変更して表示を行なう、ことによって前述した課題を解決する。
【0018】
こうすることにより、前述した本発明に係わる帳票データ入力装置と同様な作用・効果が得られる。
【0019】
また、前述した本発明に係わる帳票処理装置に相当する処理をコンピュータに行わせるためのプログラムであっても、そのプログラムをコンピュータに読み込ませて実行させることによって、前述した本発明に係わる帳票処理方法と同様な作用・効果が得られ、前述した問題が解決される。
【0020】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて説明する。
図1は本実施の形態の帳票データ入力処理装置1のブロック構成を示す図である。
【0021】
帳票処理部10は、帳票ベースで構築される業務アプリケーションに基づいて業務データベース11を用いてマスタ登録、受注伝票入力や仕入伝票入力などの伝票入力処理における全体の制御を行なう。
【0022】
業務データベース11は、伝票入力処理を実行するアプリケーションプログラムやその実行結果などのデータが格納される記憶媒体であり、この記憶媒体は磁気的、光学的記憶媒体、若しくは半導体メモリで構成されている。
【0023】
帳票フォーム情報生成部12は、表示部16に表示される処理対象の索引項目名、その項目入力枠や罫線などからなる画面フォームを帳票定義ファイル13に予め格納されている各種帳票定義情報に基づいて生成を行なう。
【0024】
帳票定義ファイル13の構成は、図2に示すように、画面制御情報、データ処理制御情報、および表示部16に表示される画面フォームを表現する帳票フォーム属性情報が組として入力対象帳票ごとに予め格納されている。帳票形式は、図3に示すように、伝票名、受注番号、受注日、得意先コード、及び得意先名等からなるヘッダ部と、商品名、商品コード、数量、単価、及び金額等からなる明細部と、総額等からなる集計部とから構成される帳票形式で表現されることにする。
【0025】
表示画面生成部14は、帳票フォーム情報生成部12によって生成された画面フォームと後述するOCR20からの認識結果とを対比して表示する表示画面の生成を行なう。
【0026】
表示メモリ15は、表示画面生成部14によって生成された表示画面情報が格納され、その情報を表示部16が読み出して表示を行なう。
ここまでの構成が帳票処理システムの構成である。
【0027】
OCR20は帳票のOCR読取処理を実行し、処理結果を帳票処理システムに渡す。
【0028】
OCR読取制御部21は、帳票処理部10から読取要求が出力された後、OCR処理全体の制御を行なう。
【0029】
画像メモリ23は、図3に示すような伝票をスキャナ22によって光学的に走査を行って読み取った帳票イメージが格納される。
OCR帳票定義ファイル24は、図2に示される帳票定義ファイル13に予め設定作成されて登録されている帳票定義情報中の帳票フォーム属性情報と同一の情報を複製処理などによって格納している。このOCR帳票定義ファイル24の構造は、図4に示す。
【0030】
認識部25は、OCR帳票定義ファイル24に登録された帳票属性情報に従って、画像メモリ23内に格納された投票イメージから読み取り対象の文字が存在するフィールドを検出し、そのフィールドイメージ中の文字イメージを1文字単位ごとに認識辞書26を参照して文字の認識を行なって、その認識結果(正読、不読)に応じた文字コードの生成を行なうものである。
認識部25は認識結果バッファ25−1を有している。
【0031】
認識結果バッファ25−1の構造は、認識部25によって文字イメージの認識結果である文字コードを一時的に格納を行なうフィールド最大認識文字数分の容量を有するFIFO(First−In First−Out)バッファである。
【0032】
認識辞書26は文字の特徴を見出し語とし、それに対応する文字コードを1対とする多数の単語が収録されているものである。
【0033】
認識結果メモリ27は、図6(a)に示すように、OCR帳票定義ファイル24に登録された帳票属性情報に従って、認識結果バッファ25−1から認識結果が出力される度に、図5に示されるその認識結果データをフィールド領域に従って置き換えられるセル領域に格納可能な表形式のセル構造を有している。
【0034】
照合部28は、認識結果メモリ27のセル領域に格納された認識結果を読み出し、その認識結果と照合辞書29との照合を行なう。そして、その照合結果に基づく認識状態を示す値を生成させ、それらの値を認識状態メモリ30に格納させるためOCR読取制御部21に出力する。
【0035】
照合辞書29には、業務アプリケーションが使用する各種マスタファイル/データファイルそれぞれの内容が照合部28が利用可能な形式に変換されて格納されている。
【0036】
認識状態メモリ30の構造は、図6(b)に示すように、図6(a)に示される認識結果メモリ30と同じ表形式のセル構造を有している。照合部28から出力された認識状態を示す値はフィールド位置に対応するセル位置に、すなわち認識結果メモリ27のセル領域に帳票読取制御部21によって格納される。
【0037】
そして、OCR読取制御部21は、照合部28によって認識結果メモリ27に格納されている認識結果のすべての照合が終わった際に、認識結果メモリ27及び認識結果メモリ30におけるセル領域が同一のセル領域の内容を組として対比するフィールド情報と共に帳票処理部10に出力する。
【0038】
帳票処理部10は、OCR読取制御部21からの認識状態に対する色コード変換を行なって対応するフィールド属性として認識結果と共に表示画面生成部14に渡す。
【0039】
表示画面生成部14は、帳票処理部10から渡された認識結果と帳票フォーム情報生成部12が帳票定義ファイル13に従って生成した画面フォームと認識結果を対比させ、認識状態に応じて変換された色コードに対応する表示色をフィールド背景色とした表示画面の生成を行なう。
そして、画面情報は表示メモリ15に格納されて表示部16によって表示される。
【0040】
このOCR読取制御部21は、表示部16によって表示された不読または誤読を含む認識結果を修正するためのキーボードやマウスなどの入力部31と認識結果修正部32を備えている。
【0041】
認識結果修正部32は、入力部31によって修正対象のフィールドが指定された際、認識状態メモリ30の認識状態が正読状態でなければ、照合部28によって照合辞書29から当該認識結果と類似する文字列を修正候補として出力を行なって表示部16に表示させ、そして入力部31によって選択された文字列によって認識結果メモリ27中の認識結果と認識状態メモリ30中の認識状態の更新を行なう。尚、入力部31から文字あるいは文字列が入力された際には、認識結果メモリ27と認識状態メモリ30中のセルのうち、選択フィールドに対比する認識結果と認識状態を書き換えが行なわれる。
【0042】
本実施例の帳票入力処理装置1は以上のように構成されている。
以下、本実施の形態の動作を説明する。
【0043】
図7は帳票入力処理装置1で行われるOCR帳票入力処理の処理内容を示すフローチャートである。
まず、S101では、帳票入力処理装置1の起動がなされると表示部16の画面にダイアログボックス表示される選択メニュー(図示せず)から業務処理対象の業務項目の選択がマウス操作等により行われる。ここでの選択メニュー項目は、例えばマスタ登録業務、受注伝票入力業務や仕入伝票/請求書入力業務などである。
以下の説明においては、処理対象の業務として受注伝票入力業務が選択されたものとする。
【0044】
S102では、帳票処理制御部10において選択された業務項目に対応する業務アプリケーションプログラム及び帳票定義情報を業務データベース11、帳票定義ファイル13からRAM(図示せず)内のそれぞれの所定領域に読み込まれる。また、業務定義ファイル13中のOCRフォーム属性情報はOCR帳票定義ファイル24に格納される。
【0045】
S103では、前述したS102の読み込み処理によってRAM内に業務アプリケーションプログラムと帳票定義の読み込みが終了すると、帳票処理部10はOCRシステム20に入力処理を要求し、その要求を受け取ったOCR読込制御部21によってOCR帳票入力処理が開始され、イメージスキャナ22から伝票のイメージが入力されて、その伝票のイメージデータが画像メモリ23内に格納される。図2に示した伝票は、イメージスキャナ22によりイメージが取り込まれる伝票の例を示す。この伝票は、受注伝票であり、伝票名、受注番号、受注日、得意先コード、及び得意先名等からなるヘッダ部と、商品名、商品コード、数量、単価、及び金額等からなる明細部と、総額等からなる集計部とから構成される。
【0046】
S104では、画像メモリ23に格納されている帳票イメージからOCR帳票定義ファイル24に項目定義されている各フィールド領域に従ってその領域内の文字イメージの文字認識が認識辞書26を参照する認識部25によって認識できなかった文字は不読文字とした記号コード、また認識できた文字は対応する文字コードを付与して認識結果メモリ27内の指定された保存先に格納を行なう。この認識処理は後述する。
【0047】
S105では、前述したS104の認識処理によって認識結果メモリ27に全てのフィールドに対しての認識結果の格納が終わると、不読記号コードを含む認識結果を除いた各認識結果の整合性判別を照合辞書29を参照して照合部28により行ない、その判別結果に応じた値を認識状態として認識状態メモリ30内の指定された格納先に格納を行なう。この整合性判別処理は後述する。
【0048】
S106では、前述したS104の認識処理とS105の整合性判別処理によって認識結果メモリ27と認識状態メモリ30にそれぞれ格納された帳票イメージ上のフィールド領域毎の認識結果及びその認識状態が帳票読取制御部21によって帳票処理部10に渡される。そして、帳票処理部10では、RAM内に読み込まれた帳票定義中の画面制御情報と帳票フォーム属性情報に従ったフィールドイメージの生成を帳票フォーム情報生成部12によって行なう。
【0049】
S107では、前述したS106の処理によって生成されたフィールドイメージと帳票読取制御部21から渡された認識結果とを対比して認識結果を表示する表示画面を生成すると共に、認識結果それぞれに対応してその認識状態を示す値(正読=0、不読=1、照合的誤読=2、論理的誤読=3)に応じたそれぞれの所定の表示色にフィールド背景色が変更された図8に示すような表示画面を生成して表示メモリ15に格納が表示画面生成部14によって行なわれる。背景色変更処理は後述する。
【0050】
S108では、背景色が標準色とは異なる色にて表示されるフィールド、つまり不読文字あるいは誤読文字を含むフィールドがあるか否かを認識状態メモリ31各項目に格納されている認識結果の認識状態の値が0以外の値か否かにより帳票読取制御部21によって判別される。ここでの認識状態の値は正読=0、不読=1、照合的誤読=2、および論理的誤読=3を示している。そして、この判別結果がYesならば、すなわち標準色とは異なる背景色のフィールドがあれば、S109に処理が進み、NoならばS115に処理が進む。
【0051】
S109では、フィールドが入力部40によって指定されたか否かが帳票読取制御部21によって判別される。そして、結果がYesならばS109に処理が進み、Noならばこの判別処理がYesになるまで繰り返す。
【0052】
S110では、前述したS108の判別処理によって判別されたフィールドに対する認識結果に含まれる不読部分または誤読部分を他のフィールドの認識結果あるいは他の情報を基に認識結果を修正する補完処理を行なう指定が設定されているか否かの判別を帳票読取制御部21によって行われる。この判別処理は当該項目内容に照合辞書名または合計フィールド名が設定されているか否かによって判別される。そして、結果がYesならばS111に、NoならばS112のそれぞれの処理に進む。
【0053】
S111では、S110の判定処理によって補完処理が指定されていると判定されたフィールドの不読文字または誤読文字を含む認識結果に対して修正を施す処理が照合辞書29を用いた照合部28と認識結果修正部32によって行なわれる。この補完処理は後述する。
【0054】
S112では、入力部31から入力される1文字また2以上の文字からなる文字列のワークメモリ(図示せず)への格納が認識結果修正部32によって行なわれる。
【0055】
S113では、上述のS111あるいはS112の補完または修正入力処理によって不読または誤読を含む認識結果に対して修正された認識結果が認識結果メモリ27中の該当セル位置に格納する更新が行われる。
【0056】
S114では、S113の認識結果更新処理によって認識結果メモリ27内で更新された認識結果に対応する認識状態メモリ30内の認識状態の値が「0」にセットされ、当該フィールドの認識結果が修正されたことが示される。そして、図9に示すような帳票イメージの表示画面が表示部16に表示される。
そして、S114の処理が終了したときにS106へ処理が戻って上述した処理が繰り返される。
【0057】
以上のS106〜S114の処理が繰り返され、前述したS108の判別処理の結果がYesであったとき、つまり、不読または誤読を含む認識結果を有する各フィールドが正しい認識結果に修正されて認識状態を示す値が「0」にセットされたとき、認識結果が帳票処理部10で指定される保存先のデータベースにレコード形式の格納がS115〜S118の処理にて行われる。
【0058】
S115では、認識結果メモリ27の内容に基づいて、ヘッダ部、明細部、及び集計部に分けて構成される伝票フォーム情報の作成成が行われる。
【0059】
S116では、上述の帳票フォーム作成処理によって作成された帳票フォームをワークメモリ内の図示しないフォームメモリに格納が行われる。
【0060】
S117では、各明細部データ毎にヘッダ部データと集計部データを付加した伝票レコードの作成が行われる。
【0061】
S118では、前述したS117で作成された伝票レコードを図10に示すようなデータベースレコードとして業務データベース11に格納が行われる。
【0062】
以上までの処理がOCR帳票入力処理である。
次に、図7に示したOCR帳票入力処理におけるS104の処理において行われる認識処理の詳細について説明する。この処理は、スキャナによって既に読み込まれて画像メモリに格納されている伝票イメージから文字認識し、認識結果を認識結果メモリ27内の格納先に格納を行なう認識処理である。
【0063】
図11は認識処理の処理内容を示すフローチャートである。
まず、S201では、OCR帳票定義ファイル24に格納されている入力フィールド属性情報のフィールド項目座標とその大きさに従って画像メモリ23内のブロック領域の切り出しが認識部25によって行われる。
【0064】
S202では、上述されたS201の切り出し処理によって切り出されたブロック領域内の文字イメージを一文字単位づつ切り出して特徴を抽出し、この特徴に合致する見出しが認識辞書35内にあるか否かの検索が行われる。
【0065】
S203では、上述したS202の検索処理によって文字イメージの特徴に合致する見出しが検出されたか否かが判定される。その結果、Yesであれば文字が認識されたとしてS204の処理に進み、Noであれば文字が認識されないとしてS205の処理に進む。
【0066】
S204では、上述したS202の検索処理で合致するとして検索された見出しに対応して認識辞書26内に記憶されている文字コードが認識結果として出力される。
【0067】
S205では、上述したS202の検索処理で該当する対象物がない、すなわち認識ができない不読文字として記号コード「?」を出力される。
【0068】
S206では、上述したS204とS205の処理によって出力されたコードを認識結果バッファ25−1に格納を行なう。
【0069】
S207では、フィールド内のすべての文字の認識結果が認識結果バッファ25−1に格納されたか否かの判別が行われる。その結果、YesであればS208に処理が進み、NoであればS202の処理に戻り、S202〜S206の処理が繰り返し行われる。
【0070】
S208では、認識結果バッファ25−1に格納された認識結果を、図12に示すように、図5に示された帳票フォーム属性情報に基づいて指定される認識結果メモリ27のセル領域への格納が帳票読取制御部21によって行われる。
【0071】
S209では、帳票フォーム属性情報に基づいて、上述したS201の切出処理によって切り出すべきフィールド領域があるか否かの判定を行なう。その結果、Yesであれば全てのフィィールド領域が切り出されたとしてS210の処理に進み、Noであれば未だ切り出すべきフィールド領域があるとしてS201の処理に戻って上述した処理が繰り返される。
【0072】
S210では、上述したS208の処理によって認識結果メモリ30内に格納された認識結果の呼び出しを行なう。なお、図12で示すように、その読み出しの方向順序は認識結果メモリ30左上隅の項目を先頭に横方向あるいは縦方向のいずれであってもよい。
【0073】
S211では、S210によって読み出された認識結果に不読文字を示す記号コード「?」が含まれているか否かの判定を行なう。その結果、YesならばS212に、Noならば元の処理に戻る。
【0074】
S212では、S211の判定処理によって認識結果に不読文字を含むと判定されたフィールドに対応する図13に示される認識状態メモリ30内のD1セル領域の内容が「1」に更新される。
【0075】
S213では、図12で示される認識結果メモリ27内の右下隅のセル領域内に格納されている認識結果が読み出されて不読フィールドか否かの判別処理を行われたか否かの判別を帳票読取制御部21によって行われる。この判別結果がYesであれば、これらの処理を終えた後には図4のS104に戻る。また、NoであればS210の処理に戻って上述した処理が繰り返される。
【0076】
次に、図7に示した帳票処理おけるS105の処理において行われる整合性判別処理の詳細について説明する。この処理は、図7に示したS104の認識処理によって文字認識された結果の整合性をOCR帳票定義ファイル24に格納されているOCR項目属性の中の照合型に従って照合処理を行ない、整合性がない場合には誤認識の可能性が高いことを示す誤読状態を認識状態メモリ30に格納を行なう整合性判定処理である。
【0077】
図14は整合性判別処理の処理内容を示すフローチャートである。
この整合性判定処理はOCR帳票定義に設定されている内容に使用辞書名が設定されていれば候補照合形式、他の項目名が設定されていれば索引照合形式、あるいは計算式が設定されていれば計算結果照合形式のいずれかの照合形式にて処理の実行を行うものとする。
【0078】
まず、S301では、認識結果メモリ27の各セル領域内の認識結果の整合性照合を行う際に、照合対象のセル領域に対応するOCR帳票定義ファイル24のOCR帳票フォーム属性に使用辞書名が設定されているか否かの判定が行われる。つまり、辞書を参照して照合する形式か、あるいは計算式を実行した結果によって照合する計算結果照合形式かの判別を行なう。その結果、YesであればS302、NoであればS309の処理のそれぞれに進む。
【0079】
S302では、上述したS301の判別処理によって辞書名が設定されていると判別された照合形式が認識結果を直接的に照合を行う候補照合形式か、または間接的に照合を行う索引照合形式のいずれかであるかをOCR帳票定義ファイル24のOCRフォーム属性項目に同一項目の辞書名が格納されているか否かで形式判別を行なう。その結果、YesであればS303、NoであればS304のそれぞれの処理に進む。
【0080】
S303では、認識結果をキーとして該当する文字列が照合辞書30内の辞書名に対応する辞書の中に存在するか否かの検索を行なった検索結果をワークメモリ(図示せず)に一時的に格納を行なう。この候補照合処理の詳細は後述する。
【0081】
S304では、S302の判別処理によって候補照合型でないと判別されたときにOCR帳票定義ファイル24のフォーム属性項目に索引条件が設定されているか否かの判別を行なう。この結果がYesならばS305の処理に進み、Noならばこの整合性判別処理は終了し、元の処理に戻る。
【0082】
S305では、上述したS304の判別処理によって索引照合型であると判別された際に、索引条件に従って認識結果以外の他の項目の認識結果を認識結果メモリ27から取得すると共にその取得の認識結果をキーとして他の項目のフィールド属性に設定されている辞書名に対応する照合辞書29内の辞書を索引し、その索引結果に対応する認識結果と同一項目データと認識結果データとの比較を行なう処理が行われる。この索引照合処理の詳細は後述する。
【0083】
S306では、上述したS313及びS305の処理によって得た認識結果と同一の文字列が存在したときのみ、すなわち不読または誤読文字を含まない正読の認識結果であると判別したときにはS307に処理が進み、そうではないときにはS308に処理が進む。
【0084】
S307では、認識結果の認識状態が正読を示す値として「0」を認識状態メモリ30の指定のセル領域に格納が行われる。
【0085】
S308では、帳票読取制御部21において認識結果の認識状態を示す値として「2」を認識状態メモリ30の指定セル領域に格納が行われる。
【0086】
ところで、S301の判別処理の結果がNoであったときには、S309においてOCR帳票定義ファイル24内のOCRフィールド属性項目にセル領域位置を係数とする計算式が設定されているか否かを帳票読取制御部21において判別される。そして、この判別結果がYesならばS310に処理が進み、Noならば照合処理を行わず、図11に示されるS213に戻る。
【0087】
S310では、OCRフィールド属性項目の計算式に従った計算を実行し、その計算結果と認識結果との照合処理が行われる。この処理の詳細は後述する。
【0088】
S311では、S310の処理により、計算結果と認識結果とが一致したときのみS312に処理が進み、そうではないときにはS307に処理が進む。
【0089】
S312では、帳票読取制御部21において認識結果の認識状態を示す値として「3」が認識状態メモリ30に格納が行われる。
【0090】
以上のS307及びS308、S312における認識状態の設定処理が終えた後は整合性判別処理が終了し、元の処理に戻る。
以上までの処理が整合性判別処理である。
次に、図14に示した整合性判別処理におけるS303の候補照合処理の詳細について説明する。
図13は候補照合処理の処理内容を示すフローチャートである。
【0091】
まず、S410では、OCR帳票定義ファイル24内の対応するOCRフィールド属性項目の使用辞書名の取得を行なう。
【0092】
S411では、上述したS410の取得処理によって取得した辞書名に対応する照合辞書29内の辞書ファイルの特定を行なう。
【0093】
S412では、S411の処理によって特定された辞書を認識結果を主キーとし、且つ項目名をサブキーとして検索を行ない、一致する文字列があれば照合部37に設けたワークメモリ(図示せず)に一時的に格納を行なう。
S412の処理を終えた後には候補照合処理が終了し、元の処理へと戻る。
【0094】
以上までの処理が候補照合処理である。
次に、図12に示した整合性判別処理におけるS305の索引照合処理について詳細に説明する。
図14は索引照合処理の処理内容を示すフローチャートである。
【0095】
まず、S510では、OCR帳票フィールド属性項目から索引条件内容の取得を行なう。索引条件としては認識結果の索引照合、つまり間接的な照合を行う他方の帳票上の項目名とその照合対象の辞書名の取得を行なう。
【0096】
S511では、前述したS510の索引条件取得処理によって取得した項目名をキーとして対応する認識結果データを認識結果メモリ27から検索して取得を行なう。
【0097】
S512では、前述したS511の取得処理によって取得した項目データである認識結果を格納している認識結果メモリ27のセル領域と同一のセル領域内の認識状態値が「0」、すなわち正読フィールドであるか否かの判別を行なうこの判別結果がYesであれば、すなわち「0」の値であればS513の処理に進み、Noであれば、すなわち値が「0」以外の値である「1」〜「3」の値のいずれかであれば認識結果に不読または誤読文字を含むとして索引照合処理を終了して元の処理へと戻る。
【0098】
S513では、上述したS510の索引条件取得処理にて取得した辞書名に対応する辞書ファイルを照合辞書38内から照合部37によって選択が行なわれる。
【0099】
S514では、上述したS510の索引条件取得処理によって取得した索引項目と同一項目に属する認識結果からS511の処理によって取得された認識結果に該当する文字列をS513の選択処理によって選択された辞書ファイル内の検索が行われる。
【0100】
S515では、S514の検索処理によって該当する文字列が辞書ファイル内から検索されたか、すなわち該当の文字列が存在したか否かの判別が行われる。この判別結果がYesであればS516の処理に進み、Noであれば索引照合処理を行わずに元の処理に戻る。
【0101】
S516では、S514の検索処理によって検索された文字列に対応して辞書ファイル内に記憶されている項目データの中から認識結果が属する項目の項目データが取り出される。つまり、逆引き検索が行われる。
【0102】
S517では、S516の逆引き検索処理によって取得された取得結果と認識結果との比較照合が行なわれる。
S517の処理を終えた後には索引照合処理は終了し、元の処理に戻る。
【0103】
以上までの処理が索引照合処理である。
次に、図14に示した整合性判別処理におけるS309の処理において行われる計算結果照合処理について説明する。
図17は計算結果照合処理の処理内容を示すフローチャートである。
【0104】
まず、S610では、OCR帳票定義ファイル24におけるOCR帳票フィールド属性項目の計算式の取得を行なう。この計算式の変数は認識結果メモリ27のセル座標で示される。
【0105】
S611では、S610の処理で取得された計算式の変数によって示されたセル内容が認識結果メモリ27から取得が行われる。
【0106】
S612では、S611の取得処理によって計算式の変数として取得された認識結果それぞれが不読または誤読文字を含んでいない正しい認識結果であるか否かの判別を行なう。この判別結果がYesならばS613の処理に進み、Noならば元の処理へと戻る。
【0107】
S613では、上述したS611の処理によって取得された計算式の各変数の値を計算式に代入した演算を行なうと共に、その計算結果の値を帳票読取制御部21内のワークメモリ(図示せず)に一時的に格納を行なう。
【0108】
S614では、前述したS613の演算処理によって求めた値と認証結果とが同一か否かの比較を行なう。
S614の処理を終えた後には計算結果照合処理が終了し、元の処理へと戻る。
【0109】
以上までの処理が計算結果照合処理である。
次に、図7に示した帳票データ入力処理におけるS107の処理において行なわれるフィールド背景色変更処理について詳細に説明する。この処理は、上述したS104の認識処理によって認識結果が出力され、その認識結果とフィールドイメージとを対比させて表示を行なう際に、各フィールドの認識状態に応じた所定の表示色にて背景色の表示を行なう処理である。
図18は背景色変更処理の処理内容を示すフローチャートである。
【0110】
まず、S710では、認識状態メモリ30の内容が帳票読取制御部21によって読み出され、帳票処理部10に渡される。そして、帳票処理部10において帳票状態メモリ30の内容を順次読み出される。
【0111】
S711では、前述したS710の処理によって読み出された認識状態値が「0」(正読)か否かの判別を行なう。この判別結果がYes、すなわち認識状態=0ならばS712の処理に進み、NoならばS713の処理に進む。
【0112】
S712では、フィールドの背景色コードの変更が行なわれ、正読状態を示す表示色に対応する「白」コードに帳票処理部10の背景色変更部(図示せず)によって変更される。
【0113】
S713では、前述したS710の処理によって読み出された認識状態値が「1」(不読状態)か否かの判別を行なう。この判別結果がYes、すなわち認識状態=1ならばS714の処理に進み、NoならばS715の処理に進む。
【0114】
S714では、フィールドの背景色コードの変更が行なわれ、不読状態を示す表示色に対応する「桃色」コードに変更を帳票処理部10の背景色変更部(図示せず)によって行なわれる。
【0115】
S715では、前述したS710によって読み出された認識状態値が「2」(照合的誤読状態)か否かの判別を行なう。その判別結果がYesならば、すなわち認識状態値=2(照合的誤読状態)ならばS716の処理に進み、Noならば、すなわち認識状態=3(論理的誤読状態)ならばS717の処理に進む。
【0116】
S716では、フィールドの背景色コードの変更が行なわれ、照合的誤読状態を示す表示色に対応する「水色」コードに背景色変更部(図示せず)によって変更される。
【0117】
S717では、フィールドの背景色コードの変更が行なわれ、論理的誤読状態を示す表示色に対応する「黄色」コードに背景色変更部(図示せず)によって変更される。
【0118】
S718では、上述したS712、S714、S716、及びS717の各処理によって認識結果の認識状態に応じて設定されたフィールドの背景色コードをそれぞれのフィールドにおける表示属性として表示画面生成部14によって設定が行われる。
【0119】
S719では、S710の処理によって認識状態メモリ30から全ての認識状態が読み出されたか否かの判別が行われる。この判別結果がYesならばSS720の処理に進み、NoならばS710の処理に戻る。そしてS710乃至S718の処理をYesになるまで繰り返す。
【0120】
S720では、上述したS718の処理によって設定された色コードに基づいた背景色にて各フィールドそれぞれが表示される。
S720の処理を終えた後には背景色変更処理は終了し、元の処理へと戻る。
【0121】
以上までの処理が背景色変更処理である
次に、図7で示した帳票データ入力処理におけるS111において行われる補完処理について詳細に説明する。この処理は、前述のS105の整合性判別処理によって不読、誤読状態になった認識結果を同一帳票の他の項目の認識結果に基づいて修正を行なう処理である。
図19は補完処理の処理内容を示すフローチャートである。
【0122】
まず、S810では、入力部40によって修正すべく指定されたフィールドが不読フィールドか否かを認識状態メモリ30の認識状態の値によって判別を行なう。つまり、認識状態の値=1であるか否かの判別である。この判別結果がYesならばS811の処理に進み、NoならばS819の処理に進む。
【0123】
S811では、前述したS810の判別処理によって不読フィールドと判別されたフィールドに対するフィールド属性項目から辞書名の取得を行なう。
【0124】
S812では、取得した辞書名に対応する照合辞書30内の辞書ファイルから認識結果に含まれる不読文字をワイルドカードとした検索キーワードに該当する全ての文字列を抽出する曖昧検索が照合部28によって行なわれる。
【0125】
S813では、S812の検索処理によって抽出された文字列があるか否かが照合部28によって判別される。この判別結果がYesならばS814の処理に、NoならばS816の処理にそれぞれ進む。
【0126】
S814では、前述したS812の検索処理によって抽出された文字列のすべてを帳票処理部10に渡す。ここで、帳票表示部10は認識結果の修正候補として表示部16に一覧表示を行なう。S815では、S814の処理によって表示部16に表示された認識結果候補一覧のいずれかの文字列が入力部31から指定されたか否かが帳票読取制御部21によって判別され、この判別結果がYesになるまでこのS815の処理が繰り返される。
S815の判別結果がYesならばこの補完処理が終了し、元の処理へ戻る。
【0127】
ところで、S812の検索処理によって指定された照合辞書29内の辞書ファイル内に該当する文字列が検索され、S813の判別処理によって文字列がなかったと判別されたときには、検索対象の認識結果に類似する文字列を同ファイルから検索を行なうために、S816において認識結果である1つまたはそれ以上の文字からなる文字列の最後尾文字の削除を帳票読取制御部21によって行なわれる。
【0128】
S816では、前述したS816の文字削除処理によって認識結果の文字が全て削除されたか否かの判別がされ、この判別結果がYesならばS818の処理に進み、NoならばS812の処理に戻って上述した曖昧検索処理を繰り返す。
【0129】
S818では、認識結果を構成する文字数を取得し、その文字数に合致するすべての文字列を上述したS812の処理によって指定されている照合辞書29内の辞書ファイルから検索を行なう。
S818での処理が終わると上述したS814の候補一覧表示処理に進む。
【0130】
ところで、上述したS810の処理によって認識結果の認識状態を示す値が「1」でないと判別されたときには、S819において認識状態が誤読状態(照合的誤読)を示す値である「2」であるか否かの判別を行なう。この判別結果がYesならば図12に示した照合処理におけるS303の処理と同様の処理に進み、NoならばS820の処理に進む。
【0131】
S820では、認識結果の認識状態を示す値が「3」であるか否かの判別を行なう。この判別結果がYesならば、図12に示した照合処理におけるS310の処理と同様の処理に進み、Noならば不読または誤読フィールド以外のフィールドが指定されているので、この修正補完処理を終了し、元の処理へと戻る。
【0132】
以上までの処理が補完処理である。
以上までに説明した図4から図18にかけての処理が行なわれることによって、スキャナ22により入力された帳票イメージに基づいた帳票項目の入力処理が実現される。
【0133】
なお、上記実施の形態では、1ページ分の伝票項目を持つ伝票を読み込んだ際、1ページ分の項目情報として伝票データ入力を行うものであるが、複数に分類された項目領域を持つ伝票を読み込んだ際、それら分類された項目データを、分類別の項目情報ページで構成される分類タブ構造のうち対応する分類タブページに伝票データ入力を行うことができる。その際、図20に示すように、タブ上の誤読・不読フィールドの有無によって最上部又は左右端のタブラベル色を変更するようにしてもよい。
【0134】
なお、前述した図7、図11及び図14から図19にかけて示した各種の処理を前述したような標準的な構成を有するコンピュータに行わせるための制御プログラムを作成し、その制御プログラムをそのコンピュータに読み込ませて実行させることにより、上述した実施例における帳票データ入力装置1に相当する機能をそのようなコンピュータに行なわせることも可能である。またこのような制御プログラムを読み取り可能な記録媒体に記録させ、そのプログラムを記録媒体からコンピュータに読み出させて実行させることによってこの実施例における帳票データ入力装置に相当する機能をこのようなコンピュータに行なわせることも可能である。
ここでの記録媒体としては、例えば、コンピュータに内蔵若しくは外付けの付属装置として備えられるROMやハードディスク装置などの記憶装置、あるいはフレシキブルディスク、MO(光磁気ディスク)、CD−ROM、DVD−ROMなどといった携帯可能記録媒体などが利用できる。また、記録媒体はネットワークを介してコンピュータと接続される、プログラムサーバとして機能するコンピュータが備えている記録装置であってもよい。この場合には、制御プログラムを表現するデータ信号で搬送波を変調して得られる伝送信号を、プログラムサーバから伝送媒体であるネットワークを通じて伝送するようにし、コンピュータでは受信した伝送信号を復調して制御プログラムを再生することで当該制御プログラムを実行できるようになる。
【0135】
【発明の効果】
以上詳細に説明したように、本発明によれば、OCRによって読み込んだ帳票フィールド領域のイメージを1文字イメージごとに文字認識を行ない、フィールド単位での認識結果の読取データと入力必須データとのデータ整合性の判別を行ない、それら判別結果それぞれに応じて照査必須フィールドの背景色を異ならせて表示することが可能となり、照査必須フィールドを間違いなく確認できる効果を奏する。
【図面の簡単な説明】
【図1】本発明を実施する帳票データ入力装置の構成を示す図である。
【図2】帳票様式を示す図である。
【図3】帳票定義ファイルの構造を示す図である。
【図4】帳票定義ファイルに定義されたフィールド属性に従って、伝票イメージデータをセル領域に置き換えた状態の例を示す図である。
【図5】OCR帳票定義ファイルの構造を示す図である。
【図6】各種データを格納するメモリ構造を示す図であり、(a)は認識結果が格納される認識結果メモリの構造を示し、(b)は認識状態が格納される認識状態メモリの構造を示す。
【図7】帳票データ入力処理の処理内容を示すフローチャートである。
【図8】OCRによる認識結果の表示例を示す図である。
【図9】認識結果の修正後の表示例を示す図である。
【図10】データベースに格納されるデータベースレコードの構造を示す図である。
【図11】認識処理の処理内容を示すフローチャートである。
【図12】認識結果メモリ内に認識結果を格納した状態の例を示す図
【図13】認識状態メモリ内に認識常態を格納した状態の例を示す図
【図14】整合性判別処理の処理内容を示すフローチャートである。
【図15】候補照合処理の処理内容を示すフローチャートである。
【図16】索引照合処理の処理内容を示すフローチャートである。
【図17】計算結果照合処理の処理内容を示すフローチャートである。
【図18】背景色変更処理の処理内容を示すフローチャートである。
【図19】補完処理の処理内容を示すフローチャートである。
【図20】誤読フィールドに対応するタブラベル表示例を示す図である。
【符号の説明】
1 帳票データ入力装置
10 帳票処理部
11 データベース
12 帳票フォーム情報生成部
13 帳票定義ファイル
14 表示画面生成部
15 表示メモリ
16 表示部
20 OCRシステム
21 帳票読取制御部
22 スキャナ
23 画像メモリ
24 OCR帳票定義ファイル
25 認識部
25−1 結果バッファ
26 認識辞書
27 認識結果メモリ
28 照合部
29 照合辞書
30 認識状態メモリ
31 入力部
32 認識結果修正部
Claims (12)
- 読み取り対象の帳票を光学的に読み取って画像イメージを生成する読取手段と、
予め格納されている帳票の帳票定義情報に基づいて前記画像イメージのフィールド領域を検出するフィールド領域検出手段と、
前記検出手段によって検出されたフィールド領域ごとに、夫々のフィールドに含まれる文字イメージを文字認識し、文字を認識できた場合には対応する文字コードを付与する文字認識手段と、
前記文字認識手段によってすべての文字が認識されたフィールドに対しては、それら認識できた文字からなる文字列を前記帳票に用いられる文字列と照合し、その照合結果が前記帳票に用いられない文字列である場合には、該フィールドが誤読フィールドであることを示す認識状態情報を出力する照合手段と、
前記文字認識手段によって付与された文字コードに対応する文字フォントをフィールドイメージと対比して表示する際に、前記照合手段によって出力される識別状態情報に基づいて誤読フィールドを正読フィールドと識別可能に表示する表示手段と、
を備えたことを特徴とする帳票データ入力処理装置。 - 前記認識手段は、認識できなかった文字には不読を示す認識できた文字コードとは異なる記号コードを付与し、
前記表示手段は、前記認識手段において認識できなかった文字に対応するフィールド内の文字イメージを、付与された記号コードに対応する記号で表示するようにしたことを特徴とする請求項1記載の帳票データ入力処理装置。 - 前記表示手段は、すべてのフィールドを表示する際に、フィールド内に不読文字を含む不読フィールドを他のフィールドと識別可能に表示することを特徴とする請求項1または2記載の帳票データ入力処理装置。
- 前記表示手段は、前記認識手段または前記照合手段によって前記フィールド内の文字イメージの認識結果に基づいてフィールド夫々の背景色を異なる表示色で表示するようにしたことを特徴とする請求項1乃至3記載の帳票データ入力装置。
- 帳票処理に用いられる各種ファイルを格納するデータベースを、更に備え、
前記照合手段は、
前記定義手段に定義されている照合対象とするフィールドと連携関係にある前記データベース内のデータベースファイルを指定する第1の指定手段と、
前記第1の指定手段によって指定されたデータベースファイル内の文字列と前記照合対象のフィールドにおける認識結果の文字列とを比較する比較手段と、
を備えたことを特徴とする請求項1記載の帳票データ入力処理装置。 - 前記照合手段によって前記フィールドにおける認識結果の文字列が前記指定データベースファイルに存在しないと判別された場合に、前記帳票定義手段に前記フィールドに関連付けて定義されている他のフィールドと連携関係にあるデータベースファイルを指定する第2の指定手段と、
前記第2の指定手段によって指定されたデータベースファイルから前記連携関係にある他のフィールドにおける認識結果の文字列をキーとした索引を行なって得た索引結果を前記フィールドにおける認識結果の修正文字列として設定する補完手段と、
を、更に備えたことを特徴とする請求項5記載の帳票データ入力処理装置。 - 前記照合手段は、
文字フィールドが合計フィールドである場合には、合計フィールドに対応して前記帳票定義手段によって定義されている計算式の変数として指定される他のフィールドの認識結果を用いて該計算式の実行を行なう計算手段と、
前記計算手段による計算結果の文字列と該合計フィールドに対応する認識結果の文字列を比較し、一部あるいは全部の文字が異なっているときは論理的誤読を示す第3の認識状態情報を出力する出力手段と、
を備えたことを特徴とする請求項1記載の帳票データ入力処理装置。 - 前記計算手段は、前記計算式の変数として指定されたフィールドのデータの認識結果が不読あるいは誤読の場合には計算の実行を行なわないことを特徴とする請求項7記載の帳票データ入力処理装置。
- 前記文字認識手段による認識結果に不読文字を示す記号コードが含まれている場合、その認識結果に含まれる前記記号コードをすべての任意の文字を表現する特殊コードに置き換えた文字列に該当する文字列のすべてを前記フィールドと連携関係にあるデータベースファイルから抽出し、それら文字列を認識結果候補として表示を行なう検索手段と、
前記検索手段によって候補表示されている文字列の中から選択された文字列を認識結果として設定する修正手段と、
を、更に備えたことを特徴とする請求項1記載の帳票データ入力処理装置。 - 入力部から与えられた修正データに基づいて前記認識手段の認識結果を修正すると共に、修正されたフィールドの背景色を変更する表示制御手段を、更に備えたことを特徴とする請求項1記載の帳票データ入力処理装置。
- 読み取り対象の帳票を光学的に読み取って画像イメージの生成を行ない、
予め格納されている帳票の帳票定義情報に基づいて前記画像イメージのフィールド領域の検出を行ない、
前記検出されたフィールド領域ごとに、夫々のフィールドに含まれる文字イメージを文字認識し、文字を認識できた場合には対応する文字コードの付与を行ない、
すべての文字が認識されたフィールドに対しては、それら認識できた文字からなる文字列を前記帳票に用いられる文字列と照合し、その照合結果が前記帳票に用いられない文字列である場合には、該フィールドが誤読フィールドであることを示す認識状態情報の出力を行ない、
前記付与された文字コードに対応する文字フォントをフィールドイメージと対比して表示する際に、前記照合手段によって出力される識別状態情報に基づいて誤読フィールドを正読フィールドと識別可能に表示を行なう、
ことを特徴とする帳票データ入力処理方法。 - コンピュータを、
読み取り対象の帳票を光学的に読み取って画像イメージを生成する読取処理部、
予め格納されている帳票の帳票定義情報に基づいて前記画像イメージのフィールド領域を検出するフィールド領域検出処理部、
前記検出処理部によって検出されたフィールド領域ごとに、夫々のフィールドに含まれる文字イメージを文字認識し、文字を認識できた場合には対応する文字コードを付与する文字認識処理部、
前記文字認識処理部によってすべての文字が認識されたフィールドに対しては、それら認識できた文字からなる文字列を前記帳票に用いられる文字列と照合し、その照合結果が前記帳票に用いられない文字列である場合には、該フィールドが誤読フィールドであることを示す認識状態情報を出力する照合処理部、
前記文字認識処理部によって付与された文字コードに対応する文字フォントをフィールドイメージと対比して表示する際に、前記照合処理部によって出力される識別状態情報に基づいて誤読フィールドを正読フィールドと識別可能に表示する表示処理部、
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003186128A JP2005018678A (ja) | 2003-06-30 | 2003-06-30 | 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003186128A JP2005018678A (ja) | 2003-06-30 | 2003-06-30 | 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005018678A true JP2005018678A (ja) | 2005-01-20 |
Family
ID=34185340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003186128A Pending JP2005018678A (ja) | 2003-06-30 | 2003-06-30 | 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005018678A (ja) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009122696A1 (ja) * | 2008-04-04 | 2009-10-08 | Matsuda Hiroaki | 文字認識装置、文字認識プログラム、及び、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
WO2009122695A1 (ja) * | 2008-04-04 | 2009-10-08 | Matsuda Hiroaki | シンクライアントネットワークシステム |
US8228522B2 (en) | 2007-01-29 | 2012-07-24 | Kabushiki Kaisha Toshiba | Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data |
JP2012517637A (ja) * | 2009-02-10 | 2012-08-02 | コファックス, インコーポレイテッド | 文書の有効性を決定するためのシステム、方法およびコンピュータプログラム製品 |
US8774516B2 (en) | 2009-02-10 | 2014-07-08 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8879120B2 (en) | 2012-01-12 | 2014-11-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US8879846B2 (en) | 2009-02-10 | 2014-11-04 | Kofax, Inc. | Systems, methods and computer program products for processing financial documents |
US8885229B1 (en) | 2013-05-03 | 2014-11-11 | Kofax, Inc. | Systems and methods for detecting and classifying objects in video captured using mobile devices |
US8958605B2 (en) | 2009-02-10 | 2015-02-17 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9058515B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9058580B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9137417B2 (en) | 2005-03-24 | 2015-09-15 | Kofax, Inc. | Systems and methods for processing video data |
US9141926B2 (en) | 2013-04-23 | 2015-09-22 | Kofax, Inc. | Smart mobile application development platform |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
US9311531B2 (en) | 2013-03-13 | 2016-04-12 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9386235B2 (en) | 2013-11-15 | 2016-07-05 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
US9483794B2 (en) | 2012-01-12 | 2016-11-01 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
JP2017033477A (ja) * | 2015-08-06 | 2017-02-09 | 日本電気株式会社 | 画像判定システム、画像判定方法、画像判定プログラム、画像判定プログラムを記録する記録媒体 |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9747269B2 (en) | 2009-02-10 | 2017-08-29 | Kofax, Inc. | Smart optical input/output (I/O) extension for context-dependent workflows |
JP2017156922A (ja) * | 2016-03-01 | 2017-09-07 | 株式会社ビーアイ | 書類の認識制御システム |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
JP2018085093A (ja) * | 2016-11-17 | 2018-05-31 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
CN111582222A (zh) * | 2020-05-19 | 2020-08-25 | 国网吉林省电力有限公司 | 一种基于标题位置参照模板的票据图像位置精确修正方法 |
US10803350B2 (en) | 2017-11-30 | 2020-10-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
JP2020187493A (ja) * | 2019-05-13 | 2020-11-19 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
KR102282025B1 (ko) * | 2021-02-08 | 2021-07-28 | 로지스원 주식회사 | 컴퓨터를 이용한 문서 분류 및 문자 추출 방법 |
-
2003
- 2003-06-30 JP JP2003186128A patent/JP2005018678A/ja active Pending
Cited By (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
US9137417B2 (en) | 2005-03-24 | 2015-09-15 | Kofax, Inc. | Systems and methods for processing video data |
US8228522B2 (en) | 2007-01-29 | 2012-07-24 | Kabushiki Kaisha Toshiba | Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data |
WO2009122695A1 (ja) * | 2008-04-04 | 2009-10-08 | Matsuda Hiroaki | シンクライアントネットワークシステム |
WO2009122696A1 (ja) * | 2008-04-04 | 2009-10-08 | Matsuda Hiroaki | 文字認識装置、文字認識プログラム、及び、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2012517637A (ja) * | 2009-02-10 | 2012-08-02 | コファックス, インコーポレイテッド | 文書の有効性を決定するためのシステム、方法およびコンピュータプログラム製品 |
US8855425B2 (en) | 2009-02-10 | 2014-10-07 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8879846B2 (en) | 2009-02-10 | 2014-11-04 | Kofax, Inc. | Systems, methods and computer program products for processing financial documents |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US8958605B2 (en) | 2009-02-10 | 2015-02-17 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9747269B2 (en) | 2009-02-10 | 2017-08-29 | Kofax, Inc. | Smart optical input/output (I/O) extension for context-dependent workflows |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8774516B2 (en) | 2009-02-10 | 2014-07-08 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9396388B2 (en) | 2009-02-10 | 2016-07-19 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9514357B2 (en) | 2012-01-12 | 2016-12-06 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10664919B2 (en) | 2012-01-12 | 2020-05-26 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9158967B2 (en) | 2012-01-12 | 2015-10-13 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9165187B2 (en) | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9165188B2 (en) | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US8879120B2 (en) | 2012-01-12 | 2014-11-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10657600B2 (en) | 2012-01-12 | 2020-05-19 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9342742B2 (en) | 2012-01-12 | 2016-05-17 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US8971587B2 (en) | 2012-01-12 | 2015-03-03 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US8989515B2 (en) | 2012-01-12 | 2015-03-24 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9058580B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9483794B2 (en) | 2012-01-12 | 2016-11-01 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9058515B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9311531B2 (en) | 2013-03-13 | 2016-04-12 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9754164B2 (en) | 2013-03-13 | 2017-09-05 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9996741B2 (en) | 2013-03-13 | 2018-06-12 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US10127441B2 (en) | 2013-03-13 | 2018-11-13 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US9141926B2 (en) | 2013-04-23 | 2015-09-22 | Kofax, Inc. | Smart mobile application development platform |
US10146803B2 (en) | 2013-04-23 | 2018-12-04 | Kofax, Inc | Smart mobile application development platform |
US8885229B1 (en) | 2013-05-03 | 2014-11-11 | Kofax, Inc. | Systems and methods for detecting and classifying objects in video captured using mobile devices |
US9253349B2 (en) | 2013-05-03 | 2016-02-02 | Kofax, Inc. | Systems and methods for detecting and classifying objects in video captured using mobile devices |
US9584729B2 (en) | 2013-05-03 | 2017-02-28 | Kofax, Inc. | Systems and methods for improving video captured using mobile devices |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
US9946954B2 (en) | 2013-09-27 | 2018-04-17 | Kofax, Inc. | Determining distance between an object and a capture device based on captured image data |
US9747504B2 (en) | 2013-11-15 | 2017-08-29 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
US9386235B2 (en) | 2013-11-15 | 2016-07-05 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
JP2017033477A (ja) * | 2015-08-06 | 2017-02-09 | 日本電気株式会社 | 画像判定システム、画像判定方法、画像判定プログラム、画像判定プログラムを記録する記録媒体 |
JP2017156922A (ja) * | 2016-03-01 | 2017-09-07 | 株式会社ビーアイ | 書類の認識制御システム |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
JP2018085093A (ja) * | 2016-11-17 | 2018-05-31 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
US10803350B2 (en) | 2017-11-30 | 2020-10-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
JP2020187493A (ja) * | 2019-05-13 | 2020-11-19 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
US11210506B2 (en) | 2019-05-13 | 2021-12-28 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
JP7338230B2 (ja) | 2019-05-13 | 2023-09-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
CN111582222A (zh) * | 2020-05-19 | 2020-08-25 | 国网吉林省电力有限公司 | 一种基于标题位置参照模板的票据图像位置精确修正方法 |
CN111582222B (zh) * | 2020-05-19 | 2023-12-22 | 国网吉林省电力有限公司 | 一种基于标题位置参照模板的票据图像位置精确修正方法 |
KR102282025B1 (ko) * | 2021-02-08 | 2021-07-28 | 로지스원 주식회사 | 컴퓨터를 이용한 문서 분류 및 문자 추출 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005018678A (ja) | 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム | |
JP4926004B2 (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
US7937652B2 (en) | Document processing device, computer readable recording medium, and computer data signal | |
US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
JPH03161873A (ja) | データベース構築機能を有する電子フアイリング装置 | |
JP2005285009A (ja) | 画面に表示されたデータを介して異なるアプリケーションで連携を行う方法およびプログラム | |
JPH08161436A (ja) | 領収書読取装置 | |
US7844138B2 (en) | History control apparatus | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP2020154962A (ja) | 情報処理装置及びプログラム | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP2002024761A (ja) | 画像処理装置及び画像処理方法並びに記憶媒体 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JPH09282328A (ja) | 文書画像処理装置及びその方法 | |
JP4143245B2 (ja) | 画像処理方法および装置並びに記憶媒体 | |
JP4823049B2 (ja) | 文書画像検索装置及びプログラム | |
JPH10187751A (ja) | 認識データ処理装置およびそのプログラム記録媒体 | |
JP2005165978A (ja) | 帳票ocrプログラム、方法及び装置 | |
JP2002032704A (ja) | 帳票処理システム、帳票処理方法、記憶媒体、帳票 | |
JP2932667B2 (ja) | 情報の検索方法および情報蓄積装置 | |
JP2003178071A (ja) | 文書管理システム | |
JP2003316802A (ja) | イメージ管理システム、イメージ管理方法及びイメージ管理プログラム | |
JP2008046850A (ja) | 文書種類判別装置及び文書種類判別プログラム |