JP2015146075A - 会計データ入力支援システム、方法およびプログラム - Google Patents

会計データ入力支援システム、方法およびプログラム Download PDF

Info

Publication number
JP2015146075A
JP2015146075A JP2014017803A JP2014017803A JP2015146075A JP 2015146075 A JP2015146075 A JP 2015146075A JP 2014017803 A JP2014017803 A JP 2014017803A JP 2014017803 A JP2014017803 A JP 2014017803A JP 2015146075 A JP2015146075 A JP 2015146075A
Authority
JP
Japan
Prior art keywords
recognition
processing
evaluation
information
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014017803A
Other languages
English (en)
Other versions
JP6528147B2 (ja
Inventor
土本 一生
Kazuo Tsuchimoto
一生 土本
眞樹 桑島
Maki Kuwajima
眞樹 桑島
孝志 勝毛
Takashi Katsuge
孝志 勝毛
秀規 真後
Hideki Masago
秀規 真後
直樹 松永
Naoki Matsunaga
直樹 松永
真史 土田
Masashi Tsuchida
真史 土田
聡司 横山
Satoshi Yokoyama
聡司 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Digital Laboratory Co Ltd
Original Assignee
Japan Digital Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Digital Laboratory Co Ltd filed Critical Japan Digital Laboratory Co Ltd
Priority to JP2014017803A priority Critical patent/JP6528147B2/ja
Publication of JP2015146075A publication Critical patent/JP2015146075A/ja
Application granted granted Critical
Publication of JP6528147B2 publication Critical patent/JP6528147B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】会計データをOCR読取する際の認識処理の確からしさを評価して、必要な場合にオペレータの確認を促す。
【解決手段】 原始証憑を読取った読取画像から認識候補のテキストデータを生成する会計処理支援システムにおいて、濃度調整や背景処理を含む画像処理を経て文字列の存在する箇所を把握し文字列ないし文字を切り出す前処理と、文字認識処理と、認識対象の解析処理を含む後処理とで構成される認識処理を行い、この認識処理を構成する各処理の処理状況を取得して、前処理情報と文字認識処理情報と解析処理情報の各処理情報を構成する各要素情報に対し、第1の評価用パラメータを適用して、各要素情報の全体の信頼性に対する重要度を考慮した各処理の信頼性を評価することにより評価の信頼性情報を生成し、これに基づいて、別途認識処理過程で生成した認識候補の確からしさを評価して分類する。
【選択図】図1−A

Description

本発明は、公認会計士事務所や税理士事務所(以下単に「会計事務所」または「事務所」と称す。)の顧問先企業などで会計ソフトを利用する場合や、会計事務所で仕訳入力を行う場合に用いられる会計処理システムにおいて、仕訳入力の元となる領収書や通帳等の原始証憑類からのデータ入力を行なう際に、原始証憑類の金額等をスキャナ等の光学装置で読み取り、その結果をテキストデータに変換した時に、読取った文字の確からしさを分類した上で、データ入力を支援する技術に関する。
従来、会計事務所では、顧問先から種々の形式で会計処理の元となるデータや原始証憑類を受け取って当該顧問先の会計処理を行っている。近年、パソコンの普及により、顧問先から会計事務所へ提出される基礎資料は電子媒体である場合が多くなっている。
顧問先から会計事務所へ電子媒体(データ)で基礎資料を提出する場合、一般的に顧問先側で会計ソフト(出納帳形式等)を使用して取引のデータを入力し、データのままネットワークを介して会計事務所に送信するか、メモリカードなどの記憶媒体に格納して会計事務所に渡している。
このような会計ソフトへのデータ入力は通常、取引の際に発生した領収書や通帳等の原始証憑類をユーザーが目視しながら、キーボードから入力される。データ入力に際し、キーボードからの入力作業を軽減し、データ入力ミスの削減を図るような技術がある(例えば、特許文献1)。
また、例えばパソコン操作が不慣れで会計ソフトへのデータ入力が困難な顧問先においては、従前からプレプリントされた定型伝票へ手書きにて文字を記入し、記入済みとなった伝票を会計事務所へ提出して、会計事務所にて伝票をOCR処理して、データ入力を効率化する方法がある(例えば、特許文献2)。
また、取引の際に発生した領収書や通帳等の原始証憑類をスキャナ等の光学装置によりイメージとして取得し、イメージから数字等を切り出し、辞書等との判定結果の確からしさを予め定めていた閾値と比較して文字認識の精度を高める技術がある(例えば、特許文献3)。
また、取引の際に発生した領収書や通帳等の原始証憑類の金額等をスキャナ等の光学装置で読み取り、その結果をテキストデータに変換した場合に、どの位置にある文字が金額等であるかが不明な為、読み取った帳票の種類を特定することで読み取ったテキストの文字列の意味を特定する技術がある(例えば、特許文献4)。
また、取引の際に発生した領収書や通帳等の原始証憑類をスキャナ等の光学装置によりイメージとして取得し、イメージから数字等を切り出し、切り出した数字等の文字と一番近い単語候補を辞書から表示させる技術がある(例えば、特許文献5)。
また、文字群単位、文字列群単位、文字ブロック群単位といった3種の単位で状態の評価を行う技術がある(例えば、特許文献6)。
また、枠線に接触した文字、かすれ文字、取消し線による訂正文字の有無を判定し、枠線接触文字、かすれ文字、訂正文字の有無に応じて、利用する認識辞書を入替える技術がある(例えば、特許文献7)。
また、文字認識結果の確からしさについて、認識処理の各段階の評価結果から総合して、各文字についての確からしさを0%から100%の数値にて算出する技術がある。(例えば、特許文献8)。
また、文字認識に関して、言語処理の確からしさを優先して、各文字についての確からしさを評価する技術がある。(例えば、特許文献9)。
特開平10−275196 特開平8−30719 特開平11−224305 特開平9−330363 特開平5−40854 特開平11−195087 特開平10−154204 特開平4−211883 特開平9−134410
プレプリントされた定型のOCR読取り専用の伝票を使う場合には、顧問先にて取引の際に発生した領収書や通帳等の原始証憑類をユーザーが目視しながら、手書きで伝票に文字を記入することになる。これは煩雑な作業であり、また誤入力も多くなる問題があった。
領収書(レシート)や通帳等の原始証憑類をスキャナにて読み取り、OCR処理して、会計ソフトへデータ出力する場合は、読み取る原始証憑類が定型化されており会計ソフトで対応していれば認識精度が高まりデータ入力作業の軽減が図れるが、領収書(レシート)のフォーマットは発行者が任意に設定できるため定型化されておらず、通帳も金融機関毎に項目の並びが違ったり定型化されていない。このため会計ソフトで対応していない形式のレシートや通帳は読み取り不可能となるか、認識精度が大幅に下落するという問題がある。
また、原始証憑類をスキャナにて読み取らせ、OCR処理するためには、原始証憑類のどの部分を認識してデータ出力すべきかの処理が複雑化する。実際、特にレシートはフォーマットが定義されておらず記載内容に意味づけがなされていないため、会計情報として取り込みたいデータがどこにあるのか把握しづらく、したがって必要な情報を抽出しづらい問題がある。処理の複雑化は、誤認識の発生箇所が多くなることの要因となり、ユーザーは誤認識した箇所の修正作業を行う機会が多くなるので、データ入力作業の軽減が図れないという問題がある。
また、例えば特許文献6のように、読取りイメージを文字と文字列と文字列群に分けて判定した上での切り出しの際に、パターン認識の向上を狙い、文字群単位、文字列群単位、文字ブロック群単位といった3種の単位で、各単位ごとに評価関数を設けて評価し、各単位ごとの処理の順番を調整するを行うような技術があるが、多数の文字列が並ぶワープロ文書のようなものには有用であるが、文字列が散在し、特に読み取るべき文字の選択自体が問題となるような原始証憑類には適合せず、加えて、評価関数は文字列等の切り出しの際に利用されるに過ぎず、文字認識の結果を評価するという点は想定していないという問題がある。
また、特許文献7のように、枠線に接触した文字を、記入枠に対する文字の位置、かすれまたはつぶれなどの文字の状態に応じて、文字認識処理で使用する認識辞書を入れ替えて、それぞれの文字の状態に応じたパターン認識を用いる方法があるが、あくまで文字認識処理の範囲内の技術であり、会計情報として意味のある文字列を抽出して認識対象とし、認識対象とした適切性も含めて、文字認識結果を評価する点は想定しておらず、特に読み取るべき文字の選択自体が問題となるような原始証憑類には適合しないという問題がある。
また、特許文献8のように、文字認識結果の確からしさを、認識処理の各段階の評価結果から総合して、各文字についての確からしさを0%から100%の数値にて算出する方法があるが、各段階での評価結果を総合するため、どの段階を優先して数値を算出したのかや、人が見た判断結果と認識処理の差異が考慮されていないため、数値の信憑性に問題がある。
また、この技術は一文字単位での認識処理を行い、一文字単位の文字コードを出力するまでの過程での確信度を判定するに過ぎず、ワープロ文書のようなドキュメントを、一定の認識精度で認識できれば実用になるという技術分野においては有用であるが、本願発明のように、レシート等の取引年月日と、合計金額とを読取って会計処理に用いるような用途では、レシートを構成する文字列を全体としてみて、一定の認識精度で認識すれば足りるというものではなく、一部に記載された取引年月日や合計金額の文字列を、複数の文字の集合体である文字列単位で正確に認識する必要があり、取引年月日や合計金額の文字列全体としての各処理の信頼度情報を判断していない以上、この技術は会計処理に用いることはできなかった。
また、この技術は、切出し処理の確信度や、文字認識処理の確認度、言語処理の確信度などを用いて、文字単位の認識処理結果の確信度を評価しているが、切出し処理での判断要素は全角か/半角かという程度の判断要素に過ぎない。このため、ワープロ文書のように、本文の文字列が基本的に同じポイント数で、かつ等間隔で文字が並んでいるような文書であれば有用な情報となりうるが、レシートのように、必ずしも文字が等間隔に並んでおらず、ポイント数も一枚のレシートの中で統一性がないような場合には、有用な確信度とならず、同様に、文字認識処理の確信度も、辞書のパターンマッチングの確信度を用いるのみであり、カスレの多いレシートのようなものに対しては、有用な確信度とはならないという課題があった。
また、特許文献8の改良技術として、特許文献9のように、文字認識結果の確からしさとして言語処理の判定結果を用いるものがあるが、この技術は、日本語の文法を中心とした形態素解析を用いる関係で、ワープロ文書には適合するものの、レシートのように、日本語として意味を有するものではなく、単なる日付情報と金額で構成されるようなものにおいては、認識精度を向上させることに貢献する技術ではなかった。また、この文献では、言語処理の結果を最優先で用いることから、日付と金額で構成されるレシート等の会計処理に用られるようなものに対しては、特に、適合性が低いという課題があった。
文字認識結果の信頼度は、多種多様な方法を用いても100%になることはないため、正確性を要求される会計データ入力において、OCR処理した結果をそのまま会計データ入力として利用してしまうと、不正確なデータを含んだ状態で入力されてしまうため、チェック作業、修正作業が多大になるという問題がある。このように、ワープロなどの多数の文字列を含む文書を対象とし、一定の認識精度で認識できれば、人が目で見て、入力するよりも短い時間で処理できることができる一定の有意な技術が開示されているが、本願発明が対象とするレシート等の文書では、全体を一定の品質で認識しても何ら意義はなく、上述した従来技術は、レシートを構成するごく一部の文字列(例えば日付と合計金額)だけを認識対象として把握し、しかも、一切の誤りが許されない会計処理の情報として用いるような用途には不適切(不適合)であった。
また、従来技術では、文字認識精度を向上させるための学習機能として、認識処理部にて、文字認識パターン辞書の更新を図るような部分が着目されているが、人が読取り対象の原稿とOCR処理の結果を見て、文字認識結果の正誤を、OCR処理全体にフィードバックするような構成となっておらず、あくまで文字認識パターン辞書を更新する範囲でのフィードバックに留まっており、人の目では読めても、OCR処理装置では判別の難しいフォントや濃度の不十分な文字の認識は、認識率が期待通りに向上しないという問題があった。
ところで、原始証憑類から得られる、会計処理に関する情報として重要なのは日付と合計金額であるので、原始証憑類をスキャナにて読取りOCR処理を行う場合、日付と合計金額の情報を精度良く取得することが重要となる。
そこで、本発明は、会計事務所の顧問先企業などで、領収書(レシート)や通帳等の原始証憑類をスキャナにて読み取った画像をOCR処理して会計ソフトへデータ出力を行う場合の処理について、会計処理に必要な取引の日付や合計金額などを抽出した上で、認識対象として把握し、会計処理に好適な認識処理を行った上で、さらに、認識結果の確からしさを、OCR処理(認識処理)の過程で生成した信頼性情報と、各処理過程の処理状況を評価DBに記録した上で、認識処理とは独立した評価処理部の処理の中で、評価DBに記録された各処理の処理状況を利用して、評価処理としての信頼性情報を生成し、両者の信頼性情報を総合的に比較評価して、認識結果の確からしさを評価、分類処理することを目的とする。
また、認識処理の信頼性の判定とは独立して、評価の信頼性判定を行うことで、オペレータへ効果的な認識結果の確からしさの情報提供を行い、必要な場合にオペレータの目視による確認と訂正を経ることにより、積極的に認識処理の学習処理を促して、学習頻度を高めることを目的とする。
上記目的を達成すべく、本発明は、原始証憑を読取った読取画像から、濃度調整や背景処理を含む画像処理を経て文字列の存在する箇所を把握し文字列ないし文字を切り出す前処理と、文字認識を行う文字認識処理と、文字認識処理後の後処理とを行い、認識候補のテキストデータを生成する会計処理支援システムにおいて、
前処理と、文字認識処理と、認識対象の解析処理を含む後処理とで構成される認識処理を行い、各処理の状況を記録する認識処理部と、
前記認識処理部が生成した、前記認識処理を構成する各処理の処理状況を取得して、各処理状況を評価して、各処理の全体としての信頼性を判定する評価処理部と、を備え、
記憶部に、
前記認識処理で利用するための認識辞書と各種の認識用パラメータを記録した認識DBと、
前記認識処理における各処理過程の処理状況をその都度記録し、処理状況を評価するための指標となる評価用パラメータを格納するための評価DBであって、
各処理過程の処理状況に基づいて、全体としての処理状況の信頼性を評価して「評価の信頼性情報」を生成するための第1の評価用パラメータを記録した、評価DBと、を備え、
前記認識処理部は、
前処理過程における処理の状況を前処理情報として前記評価DBに記録し、文字認識処理における処理の状況を文字認識処理情報として前記評価DBに記録し、原始証憑の特性に応じた認識候補の解析処理の状況を解析処理情報として、前記評価DBに記録し、
前記評価処理部が、前記評価DBに記録された前処理情報と文字認識処理情報と解析処理情報の各処理情報を構成する各要素情報に対し、前記第1の評価用パラメータを適用して、各要素情報の全体の信頼性に対する重要度を考慮した各処理の信頼性を評価して、前記「評価の信頼性情報」を生成し、
当該評価の信頼性情報に基づいて、別途認識処理過程で前記認識処理部が生成した認識候補の確からしさを、評価して分類することを最も主要な特徴とする。
さらに、本発明の会計データ入力支援システムは、前記評価処理部による信頼性に、前記認識処理部が生成した信頼性情報を加味して、認識処理と評価処理全体の総合的な信頼性を判定する総合比較評価処理部を備え、
前記記憶部の前記評価DBに、
前記「評価の信頼性情報」と、別途、認識処理における各処理過程の信頼性を評価して、前記認識処理部が生成した「認識の信頼性情報」と、を比較し総合評価を行うための第2の評価用パラメータが記録され、
前記総合比較評価処理部が、
前記「評価の信頼性情報」と、前記「認識の信頼性情報」とを比較し、当該比較結果に対し前記第2の評価用パラメータを適用して、前記「評価処理の信頼性」と、前記「認識処理の信頼性」とを総合的に評価することで、別途認識処理過程で前記認識処理部が生成した認識候補の確からしさを、総合的に評価して分類することが有効である。
本発明では、顧問先企業や会計事務所において、領収書(レシート)や通帳等の原始証憑類をスキャナ等やカメラ機能付きモバイル機器等にて読取り、認識処理(OCR処理)して、認識処理の認識結果を生成し、その際の信頼性情報に加え、別途、評価処理の中で、OCR処理における各処理過程の各処理状況を評価して評価の信頼性情報を生成し、両者の信頼性情報を、総合的に比較評価することで、精度の高い認識結果の確からしさを提示することができる。また認識結果の確からしさは、再確認要、訂正要、再入力要などのように分類して提示できるので、オペレータの負担を大幅に低減した上で、正確な会計データ入力を行うことができる。
また、本発明では訂正入力、再入力があった場合は、その結果を認識処理の認識DBと、評価処理の評価DBに、それぞれに適合した情報としてフィードバックすることで、次回からの認識結果に反映することが出来るので、顧問先企業や会計事務所において、原始証憑類を読取る場合などの最適化がされ、読取りの精度向上につながり、利便性の向上を図ることができる。
本発明では、認識結果の確からしさに応じた分類分けを行い、差別表示を伴って、オペレータに再確認、訂正、再入力を促すことにより、オペレータの確認を最小限としつつ、短時間かつ効率的に、必要な訂正、再入力等を行うことにより、取引データの会計ソフトへのデータ入力(システムから見るとデータ出力)を行うことが可能となる。
また、オペレータに再確認、訂正、再入力を促した結果、合っているとして認識結果をそのまま会計ソフトに出力したり、あるいは間違っていたとして訂正ないし再入力を行った入力データにより、判明した正誤情報という同一の情報を、OCR処理(認識処理)と、評価処理の双方へフィードバックすることにより、OCR処理(認識処理)として、通常の認識処理の範囲内の学習処理(文字認識パターン辞書等の更新)を行い、 別途独立した評価処理として、評価結果に対する誤り情報の追加を行い、同様の評価用パラメータの閾値を持つ評価結果に対しての評価の正確性を増すように学習処理を行う、という独立した2つの学習処理を行うことができる。このような独立した学習処理を行うことにより、評価処理の学習処理単独の効果としてみても、評価結果の更新が行われることにより、認識結果の提示を行う際の確からしさの精度が向上することになる。
また、仮に認識処理の学習処理が、単に文字認識パターン辞書を更新するに留まったり、その他文字認識処理の範囲内の狭い学習処理に留まることで、学習処理の効果が余り期待できない場合において、より具体的には、(1個や2個の更新では、文字認識パターン辞書の更新の効果がすぐには期待できず、多くの辞書パターンを学習してようやく効果が出る性質を有すること、つまり、学習直後の認識精度の問題を背景として)認識処理自体の精度が向上しない場合において、認識処理として、認識結果が「正しい」と判定したとしても、別途、評価処理として「誤っている可能性が高い(訂正要/再入力など)」と判定して提示し、オペレータに再確認等を促すことで、繰り返し、認識処理の学習も行うことにつながるので、次第に、認識処理の学習効果が向上するという効果が期待できる。
また、逆に、認識処理として、認識結果が「正しい」と判定し、別途、評価処理として「誤っている可能性が高い(訂正要/再入力など)」と判定して提示した場合において、本当に正しかった(つまり認識処理の結果の方が適切な)場合は、評価処理の学習が行われることになる。ここで、認識処理として認識結果が「正しい」と判定した場合において、評価処理で「誤っている可能性が高い」と提示した上で、本当に誤っていて、オペレータによって訂正がなされた場合であっても、学習直後の、評価処理において、「誤っていることが確実」という判定を下すことは、難しく、同様のパターンが繰り返し学習され、評価処理の学習処理が蓄積されることで、次第に、評価処理の学習効果が高まっていく点は、同様である。
また、認識処理として認識結果が「正しい」と判定し、別途、評価処理として「誤っている可能性が高い(訂正要/再入力など)」と判定して提示した場合において、本当に正しかった(つまり認識処理の結果の方が適切な)場合における、評価処理の学習についても、(文字認識処理において生成される文字認識パターン辞書に関するマッチングの度合いが高いという信頼性情報が、評価処理に用いられることを介して)評価処理の精度が向上するという、両者の学習処理が効果を高め合うということが期待できる。
また、逆に、認識処理において学習対象とした文字イメージの品質が、カスレや濃度が低いこと等により低い場合において、文字認識パターン辞書への学習効果が低い場合には、次回の認識処理において、誤認識を繰り返すことになるが、評価処理としては、評価の信頼性が低い中で、認識処理の結果が正しいと誤認識していることを、記録して(知って)いるので、従前の評価処理(例えば「誤っている可能性が高い」)を改善し、認識結果が「誤っている」という判断に改善されることが期待できる。このように、独立した学習処理を介して、他方の処理の誤りの判定、およびその学習を、繰り返すことで、認識の精度をさらに改善していくことが期待でき、何度も辞書登録を行い、認識率が向上されれば、訂正不要に向かっての学習を行うことになり、 何度も修正を行って、オペレータによって確認した際に、何度でも間違ったままの場合には、「誤っていることが確実」と判定できるので、「最初からリジェクトしてしまい手入力にまわす」ということも実現できるようになることが期待できる。
図1−A、1−Bは、本発明にかかる会計データ入力システムの全体概要を説明する概略図である。 図2−A、2−Bは、評価処理を説明するための概念図である。 図3−Aは、評価処理を説明するための概念図であり、図3−Bは、学習による評価の修正の概念説明するための図である。 図4A−Dは、本発明にかかる会計データ入力システムのいくつかのシステム構成例を示す図である。 図5は、本発明の会計データ入力方法の全体処理フローを示す図である。 図6は、認識処理を構成する各処理(前処理、文字認識処理、および解析処理)の処理情報の生成・出力のフローを説明する図である。 図7は、評価処理のフローを説明する図である。 図8は、前処理、文字認識処理、および解析処理で出力される各処理情報のテーブル構成を示す図である。 図9は、評価処理で用いられる重みづけ係数テーブルの実施例を示す図である。 図10は、評価処理の別の実施例を説明するための図である。 図11は、評価の信頼性情報の多段階化を行うための参照テーブルの例である。 図12は、評価の調整を行うための調整処理テーブルの一実施例である。 図13は、総合比較評価処理で用いられる総合判定テーブルの一実施例である。 図14は、図13に示す総合判定テーブルの別の実施例である。 図15は、認識処理に用いられる、漢字等を含む辞書と、数字用の辞書の実施例である。 図16は、本願システムが具えるキーワード辞書の一実施例である。 図17は、本願システムが具える推定処理テーブルの一実施例である。 図18−Aは、学習処理においてフィードバックする情報の一例であり、図18−Bは、学習結果の取り込み用の評価結果テーブルの一実施例である。
[全体概要]
本発明を実施するための形態について、添付の図面を参照しながら以下に詳細に説明する。図1−A、1−Bは、本発明にかかる会計データ入力システムの全体概要を説明する概略図である。本発明はフリーフォーマットの領収書(レシート)や通帳等の原始証憑10をスキャナや、被写体を撮影して画像データとして保存することができるデジタルカメラ、デジタルビデオ等(無線機能で画像をアップロードできる機能や、メモリ装置を介する場合を含む)、カメラ付き携帯電話、カメラ付きスマートフォン、カメラ付きモバイル端末、カメラ付きタブレット端末、モバイルカメラ等のモバイル端末(携帯電話、スマートフォン等の携帯型の端末装置、カメラ機能付きタブレット端末等(以下単に「カメラ機能付きモバイル機器」))のカメラ、あるいはその他の原始証憑をデジタル化できる各種の読取装置20で読み取り、画像処理を行ってコンピュータ端末100上で動作する会計ソフトに会計データが自動的に反映されるようにするものである。ここで、会計ソフトが対応している伝票形式であれば予めどの部分に何が記載されているかが判明しているため、必要な部分を読み取ってOCR処理を行い会計データに反映することができるが、定型化されていないフリーフォーマットの原始証憑はこのような処理ができない。本発明は、フリーフォーマットの原始証憑であっても、図1下側の拡大画面に示すように、伝票イメージから日付や合計金額といった必要な会計データのみを抽出して認識するとともに、同時に行った各処理の信頼性を総合評価して認識結果の確からしさを求め、その度合いが低い場合にオペレータに再確認を促すようにすることを特徴とする。
図1−Aに示すように、例えば顧問先企業において、原始証憑10が読取装置20で読み込まれる。必要に応じて同じシートを複数回読み込むマルチスキャニングや、露出を変えて複数回読み込むオートブラケッティングが行われてもよい。この場合において、認識処理や評価処理に先立って、予め、複数回のスキャニングを行って読み取りイメージを複数保存しておいてもよいし、認識結果の確からしさの評価を行って、読み取りが「不可」と判定された場合に、再度のスキャニングを促すようにしてもよい。
この伝票イメージがコンピュータ端末100に送られ、端末画面101の一部(本例では左側)に表示される。一方、図1−Aの中段左側に示すブロックにおいて、伝票イメージの認識処理が行われる。この認識処理は、伝票イメージから日付と合計金額のみを抽出したり、通帳から自動的に日付・出金・入金・残高をそれぞれ抽出したりするものである。この認識処理は大別すると、前処理(カスレや濃度調整等)、文字認識処理(文字単位での読み取り等)、および後処理として単語照合処理(図では省略)と解析処理(必要な会計データの抽出等)があり、これらの処理によって認識結果が生成される。
認識処理では、認識DBに格納された認識辞書や、各種の認識用パラメータを用いて処理が行われる、より詳細には、主に文字認識処理で利用する認識辞書(1文字単位の認識に用いられる文字認識辞書)および、後処理として単語レベルの照合評価を行う単語辞書などや、各種の認識処理で利用される認識用パラメータ(前処理で利用される濃度調整用パラメータや、解析処理で利用されるキーワード辞書など)を用いて処理が行われる。
ここで、本発明では、前処理、文字認識処理、および後処理(解析処理を含む)の各処理における具体的な処理内容の状況が、それぞれ前処理情報、文字認識処理情報、および後処理情報(単語辞書照合情報、解析処理情報)といった処理情報として、認識処理の次の工程に利用されるほか、別途、図1−Aの中段中央ブロックにある評価DBに出力される。評価DBの各処理情報に対しては、後に詳述するように多変量解析による評価処理が行われ、「評価の信頼性情報」が生成される。さらに実施例によっては、文字認識における辞書データとの特徴量の類似度などに基づいて認識処理全体としての信頼性を評価し、「高・中・低」といった、「認識の信頼性情報」が生成されてもよい。
この評価の信頼性情報と、必要に応じて認識の信頼性情報とが総合比較評価処理100cにて総合的に評価され、認識結果について、複数段階(例えば、読取OK/目視確認要/読取不可など)の振り分け処理が行われる。図に吹き出しで示すように、認識の信頼性情報としては「文字を読めたはず(認識できたはず)」と評価することとは別に、評価の信頼性情報として「読めていないはず(処理状況からして認識結果が必ずしも正しくない)」というように、相互に独立した評価を行うことで、認識結果を客観的、多面的に評価することができる。例えば、認識の信頼性情報が良と判断しても、評価の信頼性がよくない場合は、総合評価として良から可に変更する評価を行うなど、認識結果の確からしさを、より精度よく判定することができ、確からしさに応じた注意をオペレータに促すことができる。
その結果、図1−Aの下側に拡大して示す端末画面101において、一実施例では信頼性が高い場合はそのまま画面右側の会計データに反映したり、信頼性が中程度の場合は認識結果を示してオペレータの再確認を促したり、信頼性が低い場合は認識結果を示さず空欄への入力を促したりするなど、振り分け内容に応じて認識結果が表示される。さらに、このオペレータが画面上で実際の伝票イメージを見て認識結果を訂正/再入力した場合は、上述した認識処理用の認識DBの辞書学習にフィードバックされるほか、別途、認識結果(テキストデータ)と訂正/再入力の比較照合により生成した正誤情報と評価結果などが評価DBにフィードバックされ、評価処理のパラメータや処理を変更するなどの認識処理、評価処理のそれぞれに応じた学習処理が行われる。
図1−Bは、図1−Aの変形例であり、図1−Aでは点線で囲っている総合比較処理100c(中段中央部)の機能を、端末100内の独立したモジュール100dとして示している。
次に、図2、図3−A等を参照して、本発明の特徴である評価処理について説明する。図2−Aには、上述した前処理情報、文字認識処理情報、および解析処理情報をそれぞれX軸、Y軸、およびZ軸に設定した座標系が示されている。
このうち、例えば、X軸は、図8に示すような前処理の処理状況の各要素であるx1、x2、・・・を、それぞれの重要度を元に適宜重みづけして生成した値であって、前処理全体としての信頼性を示すものであり、Y軸、Z軸も同様である。
前処理情報、文字認識処理情報、および解析処理情報はそれぞれ値が高いほど信頼性が高く、したがって一枚の伝票を読み取った際の各処理の信頼性をプロットした点が原点から近ければ信頼性が低く、原点から離れれば信頼性が高くなる。図2−Aにおいて、点aは前処理と解析処理の信頼性がやや高めで、文字認識処理の信頼性が中程度であり、全体として信頼性が高いといえる。点bは全体の信頼性が低く、伝票イメージからの誤読の可能性がありオペレータによる訂正が必要な場合が多い。点cは、文字認識処理の信頼性は高いものの、前処理の信頼性が極端に低い。このような場合、他の信頼性が高い場合でも総合的に見れば認識結果が誤っている可能性が高い。このような読み込みおよびプロットを数百枚〜数万枚の伝票について実施すると、図2−Bのような集合が形成される。図2−Bでは、読み取り可能な群20aがあり、その外側に読み取り不可能な群20bが2つ存在している。さらなる実施例では、図3−Aに示すように、読み取り可能な群20aが「OK」、「ほぼOK」、「目視による確認要」、「訂正が必要」に細分化されている。これらは多変量解析により定量化した評価の信頼性を閾値管理することにより導出される。
なお、前処理情報、文字認識情報、および解析処理情報はそれぞれ1以上の要素からなり、これらを全体として多次元解析(多変量解析)することにより、本図に示すような3次元での評価の信頼性情報のみを用いて読み取りOK/NGといった判定を行ってもよいし、さらに従来技術で用いていた指標である、文字認識結果の信頼性情報(辞書データとの類似度等)を加味して4次元以上の多次元での評価を行ってもよい。なお、4次元評価の一実施例として、図13のテーブル処理があり、詳細は後述する。
さらに、図3−Bを用いて学習による評価の修正の概念を簡単に説明する。本図では、学習効果がより良く期待できる例として、「可」と評価した場合において、「不可」として訂正された場合、および「不可」と評価した場合において、実際には正しかった場合において「正しい」に修正した場合を想定した例をあげて説明する。例えば評価の信頼性情報が「可」以外の部分となった場合には、オペレータによる目視確認が促されるか、目視による直接入力が促されるが、入力された数値が読み取った数値と同一である場合は、正常に読み取れていたのに読取不可と評価されていることとなる。これを是正すべく、この場合の評価の信頼性情報の座標位置が「可」に含まれるように、XYZ軸を構成するパラメータを修正したり(重みづけ基本評価の修正の例)、クラスター解析や最小二乗法により当該座標を含む所定部分が「可」に含まれるように修正するなど(各軸の傾向を評価する傾向評価の修正の例)、評価の修正が行われる。これにより、以降に同じ評価の伝票があった場合には、評価の信頼性が「不可」ではなく「可」となり、オペレータの確認負担も軽減する。
[システム構成]
次に、図4を用いて、本発明にかかる会計データ入力システムのシステム構成について説明する。一実施例では、会計データ入力システムは、顧問先あるいは会計事務所に設置されるコンピューターシステムとして構成される。図4に示すように、システム構成例1は、原始証憑10を読み取るためのスキャナまたはカメラ機能付きモバイル機器等の読取装置20と、当該読取装置20と直接あるいはネットワークを介して接続された端末装置100とを具える。端末装置100は、キーボードやマウス等の入力部110と、ディスプレイ等の表示部120と、USBポートや可搬型記憶ドライブ等の出力部130と、インターネット等のネットワークに接続するための通信部140と、端末装置100の各種制御を司る制御部150と、各種データが格納される記憶部160とを具える。
記憶部160の記憶領域には、伝票イメージデータと、濃度処理などの前処理用の各種認識用パラメータと、前処理によって出力される前処理情報と、文字認識用辞書(数字用辞書と、漢字等を含む辞書の2種)、文字認識処理によって出力される文字認識処理情報と、単語辞書と、解析処理用のキーワード辞書を含む認識用パラメータと、解析処理によって出力される解析処理情報と、認識の信頼性情報と、評価処理に用いられる各種データが登録される評価DB162と、評価結果としての評価の信頼性情報と、その他の取引情報格納部および会計データ格納部とがある。
制御部150の機能としては、読み取り処理部、管理部、大概念としての認識処理部、大概念としての評価処理部、取引データ生成部、および仕訳処理部がある。さらに、認識処理部は中概念として前処理部、1文字単位の文字認識処理部、解析処理部と単語照合部を含む後処理部(図示せず)の他、認識の学習処理部に別れる。前処理部(画像処理部)は、濃度処理・罫線検出部、行検出・文字切出部、および前処理情報生成部を具える。1文字単位の文字認識処理部は、文字認識処理部、辞書ハンドリング部、文字認識候補生成部、および文字認識処理情報生成部を具える。
後処理部の一部を構成する単語照合部は、文字列を単語辞書と照合して文字認識結果の妥当性を確認する処理を行うほか、後述の解析処理において、キーワードを検出する際にも用いられる。また、単語照合部は必要に応じて単語辞書とのマッチングレベルを処理情報として生成する。
解析処理部は、キーワード検出部、最適化処理部、解析処理情報生成部を具える。解析処理情報処理部は、解析処理における処理の状況として、例えば、キーワードの検出の有無や、キーワードの優先順位といった処理情報を生成記録する。この際、解析処理において、単語照合部が生成した単語辞書とのマッチングレベルを、検出したキーワードの付帯情報として生成し記録するようにしても良い。
一方、評価処理部は、比較評価・分類処理部、振分処理部、訂正、再入力処理部、および評価の学習処理部を具える。これらの機能は記憶部160に格納された会計ソフトあるいは別個のプログラムモジュールを制御部150で読み出して展開することにより実現される。なお、本発明の実施例は図4に示す形態のものに限られず、一部の要素がなくても、また他の要素を具えてもよい。
読取処理部は、読取装置20で原始証憑を読み取り、イメージデータ(読取画像)を作成する。この読取処理部が破線で示されているのは、原始証憑の読取り自体は、当該端末装置で行うことは必須ではなく、カメラ機能を有する他の装置(カメラ機能付きモバイル機器やデジタルカメラ等)で行ってもよいことによるものである。すなわち、読取処理部(破線囲みで図示)は、端末装置100内または読取装置20内、さらにこれとネットワーク接続された他の端末装置100a、読取装置20、データサーバやNAS(Network Attached Storage)等にあってもよい。また、当該端末装置100は、デスクトップ型のコンピュータの他、ノート型のコンピュータ、あるいは、カメラ機能付モバイル機器であってもよい。カメラ機能付モバイル機器の場合は、図1、図4の読取装置(スキャナ等)は端末装置100の内部に構成されることになる。
管理部は、読取処理部で作成されたイメージデータと仕訳処理部で仕訳入力される仕訳データの関連づけを行う。
認識処理部は、前処理部、1文字単位の文字認識処理部、および解析処理部を有し、伝票イメージから会計データ作成に必要な部分、例えばレシートの場合は日付と合計金額を抽出して認識する。このとき同時に、認識処理部をそれぞれ構成する、前処理部、1文字単位の文字認識処理部、および解析処理部から認識処理の内容や信頼性のパラメータとなる前処理情報、文字認識処理情報、および解析処理情報を出力し、評価DB162に登録する。評価処理部は、前処理情報、文字認識処理方法、および解析処理情報等の各種処理情報をそれぞれの情報の評価処理の信頼性全体に占める重要度を考慮して(後述の重みづけ係数テーブルを利用)、認識の確からしさに関する評価の信頼性情報を生成する。
例えば、前処理の信頼性が、その後の文字認識処理や解析処理に大きな影響を与えるので、前処理の処理状況に対して重みづけの程度を大きくするなどして、評価の信頼性情報を生成する。そして、比較評価・分類処理部によって、別途、認識処理の過程で生成した認識の信頼性情報と、評価の信頼性情報とを、総合的に比較評価することで、認識結果の確からしさを総合評価して分類し、オペレータに分類に応じた注意を促す。そして、生成した信頼性により会計データへの認識結果の反映方法(読み取りOK(そのまま会計データとして採用)/オペレータの要確認など)を振り分け、必要に応じてオペレータによる訂正や再入力を受け付ける。さらに、オペレータによる再入力等があった場合に、入力値(数値や正誤情報等)と認識結果を比較して、評価の学習処理を行う。
仕訳処理部は、例えば図1に示すような2画面式会計入力画面101の入力内容から仕訳データを作成し、会計データ格納部へ保存する。取引データ生成部は、仕訳処理部で生成された仕訳データから取引情報である摘要を取引情報格納部へ保存する。
本発明の実施形態において、記憶部160の一部または全部のデータは、端末装置100内にあってもよいし、端末装置100とネットワーク接続されたデータサーバやNAS(Network Attached Storage)等にあってもよい。このようなシステム構成の変形例を図4−B〜Dに示す。図4−Bの実施例では、記憶部160がネットワーク接続されたサーバー装置50上に配置され、さらに原始証憑を読み取った読取装置20に接続された端末装置100aとは異なる端末装置100bで会計処理支援を行うようにしている。本例ではさらに、サーバー装置50を設けずに他の端末装置100aに記憶部160が配置され、これをネットワーク接続された端末装置100bで読み出して会計処理支援を行うようにすることも考えられる。
また、原始証憑が通常顧問先において発生した取引に係るものであることから、端末装置100b、他の端末装置100aは、共に顧問先側の端末装置であることが想定されるが、他の端末装置100aは、会計事務所側の端末、もしくは会計事務所の職員が持ち込んだ端末装置であってもよい。会計事務所側のサービスとして、顧問先から原始証憑を預かって読取りを行う場合もあるからである。あるいは、逆に、端末装置100bが会計事務所側の端末装置であり、他の端末装置100aが顧問先側の端末装置として原始証憑の読取りを行うように構成してもよい。また、端末装置100bおよび他の端末装置100aはともに会計事務所側の端末装置として構成されていても良い。
図4−Cの実施例では、例えばスマートフォンといったカメラ機能付モバイル機器(すなわち読取装置20)から直接ネットワークを介してサーバー装置50にイメージデータが格納され、これを端末装置100bで読み出して処理が行われる。この場合のサーバー装置50はNASやクラウドであってもよい。図4−Dの実施例では、原始証憑が他の端末装置100aの記憶部160に格納されており、ネットワークを介してこれを端末装置100bで読み出して会計処理支援を行うようにしている。このように、システム構成は多様であり、特に限定する趣旨ではなく、何らかの形で、原始証憑を読み取ったイメージが存在しさえすれば足りる趣旨である。
[全体処理フロー]
図5を参照して、本発明の全体処理フローを説明する。最初に読取装置あるいは記憶領域から処理対象となる伝票イメージを取り込む(S5−01)。ここで、必要に応じて、白抜けやノイズ除去のためのマルチスキャニングや、露出補正のためのオートブラケティングが行われてもよい。次に、図6を用いて後述するが、前処理工程として、濃度調整等や、文字の切り出しが行われる(S05−02〜03)。文字列の切り出しでは、イメージ内に文字列(すなわちドットの固まり)がどこにあるかが判断され、一文字単位の切り出しでは全角/半角等のピッチ判定が行われる。この場合に用いられる切出しの手法としては、文字列を構成する微細なドットの固まりをX軸側およびY軸側からサンプリングしてヒストグラム化して、ドットの固まりの存在箇所を把握する射影手法が知られている。なお、この前処理において、レシートであるか通帳であるか等の大枠の原稿タイプ判定を行ってもよい。このような前処理の具体的な調整度合い(カスレの有無、濃度、切出等)などが前処理情報として出力される(S5−04)。
次に、文字認識処理として、イメージに含まれる文字列について、1文字単位の文字認識を行う(S5−05)。この処理は、1文字単位で切り出された各文字について、その切り出した文字単位でのカスレ等による文字分割ブロック数の評価や、文字の解像度に対する大きさの評価を経て、文字認識処理と、辞書ハンドリングと、1文字単位の認識候補生成により実現される。この場合、通常モードでの文字認識(漢字等を含む認識辞書を用いた認識候補生成)に加え、本発明の適用対象としてはレシート等の会計書類に好適であるため、数字のみの辞書を適用して、数字と仮定した認識候補を生成するようにすると、認識精度を向上させることができる。なお、数字と仮定した場合の認識候補の生成処理は、日付情報や(合計)金額情報であると推定した場合において、その都度実行してもよいし、予めすべての文字列について実行するようにしてもよい。このような文字認識処理の状況(文字認識辞書とのパターンマッチングにおけるマッチングレベルの状況(特徴量との距離等)、カスレによるブロック数増加、大きさ等)などが、文字認識処理情報として出力される(S5−06)。
次に、後処理として単語照合処理と解析処理が行われる。単語照合処理では、単語辞書とのパターンマッチングを行ってマッチングレベル(マッチングの度合い)を判定し、認識候補として生成した各文字の妥当性を判定する。また、解析処理で行われるキーワードの検出処理もこの単語照合処理を利用して行われる。単語照合処理では、前述の単語辞書とのマッチングレベルを処理情報として生成記録してもよく、この場合には、解析処理で検出したキーワードの優先順位の情報に加えて、付帯情報として、単語照合処理で生成した単語辞書とのマッチングレベルを処理情報としてさらに加えるようにしても良い。この場合において、キーワードの優先順位が高いことに加えて、単語辞書とのマッチングレベルが高いほど、解析処理としての信頼性が高いことを意味する情報として利用することができる。
解析処理として、1文字単位で認識された各文字について単語レベルでの単語照合が行われ(S5−07)、「合計」等のキーワードに対応する文字列の認識候補としての精度を向上させる処理として、認識候補の最適化処理が行われる(S05−08)。月日や合計金額のキーワードがあれば対応する文字列を日時や合計金額として抽出し、あるいは証憑タイプが「領収書」等であることが判明しているにも拘わらず、「合計」等のキーワードが見つからない場合には、最もフォントサイズの大きな数字列の特定を行い、注目する文字列の絞り込みが行われる。このような解析処理の状況(キーワードの優先順位等)などが、解析処理情報として出力される(S5−09)。この処理により、日付あるいは合計金額といった注目すべき文字列が決定する。そして、注目すべき文字列に対して最適化処理を行い、最適な認識候補が決定されて出力される(S5−10)。さらに、同時に辞書データとの類似度などに関する、認識結果の信頼性情報(数値あるいは良・可・不可など)が出力される(S5−11)。
次に、図5右側に示す評価処理について説明する。上述したステップS5−04、06、09において、認識処理における前処理情報、文字認識処理情報、解析処理情報が出力され、評価DB162に登録されている。後に詳細に説明するが、各処理で出力される処理情報のテーブル例が、図8に示されている。評価DB162にはまた、評価に用いる各種パラメータである評価用パラメータが登録されており、これには重みづけ係数テーブル(図9)や、総合判定テーブル(図13、図14)が含まれる。このうち重みづけ係数テーブル等が読み出され、各処理情報に対する多変量解析による評価処理が行われて(S5−12)、評価による信頼性情報が生成される(S5−13)。このうち、主に、図8、図9〜図12までのテーブルを第1の評価用パラメータと呼び、図13〜図14のテーブルを第2の評価用パラメータと呼ぶこととする。
このようにして、認識結果の信頼性情報と、評価による信頼性情報とが生成された場合において、ステップS5−13で出力される評価による信頼性情報と、ステップS5−11で出力される認識結果の信頼性情報との総合比較評価が行われる。
総合比較処理では、例えば図13、14に示すような総合判定テーブルを用いて、信頼度を総合評価して分類処理が行なわれる(S5−14)。図13に示すテーブルでは、ステップS5−11で得られる認識の信頼性情報が3段階(良/可/不可)で縦の行に、ステップS5−13で得られる評価による信頼性情報が同じく3段階で横の列に配置されており、テーブルの行と列が交差する部分を総合的な信頼性として分類する。図13に示す例では、信頼性はOK/ほぼOK/目視による要確認/要訂正/読取不可の五段階に分類される。一方、図14に示す実施例のように、認識の信頼性情報を用いることなく、ステップS5−13で得られる評価による信頼性情報のみを直接的に用いるようにしてもよい。この実施例の場合、認識処理においてステップS5−11での認識の信頼性情報の生成・出力は行われなくてもよい。
ここで、「認識の信頼性情報を用いることなく・・・評価による信頼性情報のみを直接的に用いる」としているのは、これに限定する趣旨ではなく、「認識の信頼性情報を生成するが、認識の信頼性情報を全く用いないで評価の信頼性情報をそのまま総合比較評価の結果として出力する」という場合と、「認識の信頼性情報を生成せず、評価の信頼性情報をそのまま総合比較評価の結果として出力する」という場合を含み、加えて、「認識の信頼性情報を生成する/しないに拘わらず、認識結果として信頼度の最も高い第一順位の認識候補に対し、一元的な取り扱いを行い、例えば、認識の信頼性情報として、一律に良として取り扱い、評価の信頼性をそのまま総合比較評価の結果として出力する」という場合を含む趣旨である。
従って、総合判定テーブルに代表される第2の評価用パラメータは、存在しないとしてもよいし、第2の評価用パラメータが存在するとした上で認識の信頼性情報を一元的に取り扱い(テーブル上は横1行であると読み替えるように取り扱い)、例えば、図13の総合判定テーブルその1の、認識の信頼性情報に対応する任意の1行(例えば「良」の行)をもって総合判定テーブルその1を使用して、第2の評価用パラメータとして用いたとしても良いし、あるいは、図14の総合判定テーブルその2の、1行が認識の信頼性情報を1元的に取り扱った結果として表現されているとして、総合判定テーブルその2を使用して、第2の評価用パラメータとして用いたとしても良い。
その後、分類結果に応じた振分処理が行われる(S5−15)。図5に示す実施例では、例えば分類結果のうちOKとほぼOKが「信頼性高い」、要確認と要訂正が「信頼性グレー(どちらともいえない)」、読取不可が「信頼性低い」として振り分けられる。この振り分けに応じて、図1に示す会計入力画面101に認識結果が表示される(S5−16)。すなわち、信頼性が高い場合には認識結果が通常表示されて、何もしないでそのまま自動的に、あるいは訂正等がないかどうかだけを判定して自動的に、あるいは必要に応じて確認を促した上で「OK」ボタン押下により、画面右側の会計入力画面に反映される。信頼性がグレーの場合は認識結果をそのまま反映せず、強調表示や音声等によりオペレータに確認を促して、例えばオペレータが「OK」ボタンを押すことにより反映させる。信頼性が低い場合には認識結果を示すことなく、空欄にオペレータの入力を促す。オペレータは伝票イメージを見て金額や日付等の情報を直接入力することになる(S5−18)。このとき、オペレータによる訂正や再入力があった場合には、認識結果の正誤情報が認識DBと評価DBへフィードバックされ、評価の学習処理(S5−19)と、認識の学習処理(S5−22)が行われる。
評価の学習処理(S5−19)としては、評価DB162内に認識結果の正誤情報が蓄積され、蓄積された認識結果とフィードバックにより正しいと認識された認識結果のテキスト文字列と入力文字列とを比較することにより、比較結果が一致する場合は、その結果を正しい認識結果として採用し、新しく採用した認識結果のパラメータと採用している現在の評価処理で使用しているパラメータと差異が生じた部分を補正するように、各処理テーブルのパラメータを補正したり(重みづけ基本評価の修正)、図18−Bを用いて後述するように、修正があった評価を含む部分について評価の引き上げ/引き下げといった傾向評価を加えるようにする。一方、文字認識の学習処理(S5−22)としては、フィードバックされた正誤情報を基に認識手法を調整し、文字イメージと認識辞書との特徴量を比較する際の類似度を引き上げるといった処理を行う。
以上のようにして決定された日付や金額の値が会計アプリへ出力され(S5−20)、集計される(S5−21)。なお、最初から、認識処理を行うことなく、人が伝票(あるいは伝票イメージ)を目で確認しながら人手による入力を行う場合もあるが(S5−23)、その場合の入力データは、信頼性が高い類型として、ステップS5-15の信頼性が高い場合の認識結果と同様に取り扱われて、集計処理されたり、あえて認識処理を施した上で、比較結果を認識DBに反映するように活用したり、あるいは評価処理の学習結果として評価DBに反映するように活用することができる。
[認識処理の詳細]
図6を参照して、認識処理を構成する各処理(前処理、文字認識処理、および解析処理)の処理情報の生成・出力のフローを説明する。最初に前処理として、全体の画像処理が行われる(S6−01)。ここでは、レシートや通帳の背景色を除去して、文字列を効率よく抽出できるように、色単位で濃度を調整したうえで、グレースケール化または2値化する。このとき、前処理情報その1(画像処理情報)として、行った濃度調整の度合い(x1)、背景処理の度合い(x2)、伝票全体におけるカスレの有無(x3)、除去した罫線数(x4)などを出力する(S6−02)。次に、行検出の画像処理として、背景色を除去した後、文字列すなわち黒画素の集合をヒストグラム化して検出し(S6−03)、一文字単位で文字の切り出し処理を行う(S6−04)。このとき、前処理情報その2(切出処理情報)として、縦方向のスキャン時のドット抜け本数(x5)、上下の接触の文字分割状況(x6)、左右の接触の文字分割状況(x7)などを出力する(S6−05)。上下あるいは左右の文字分割とは、図6の右側のボックスに示すように一部の文字が重なって記載されているような場合に一文字単位に分割して抽出することである。この処理自体は公知技術であるため詳細は省略するが、本発明では文字分割を行った場合にその旨を評価のパラメータとして出力する。
ここで、図6の中段右端の例では、上下方向の文字分割状況として、「7,700」と「25,500」とが、上下に接するように記載されているが、この例のように、上段の「7」と下段の「5」とが接しているような場合には、切り出した文字が一部欠けるような態様、あるいは逆に、他方の文字の一部が余分に付加される態様となり、文字認識辞書とパターンマッチングさせた場合の適合度が低下する可能性があり、上下に分割したかどうか、分割に際し、どの程度厳しい状況だったかを示す分割状況が、文字認識処理の信頼性を基礎付ける有用な指標となる。左右の分割も同様である。このような処理情報はさらに以降の認識処理にフィードバックされてもよい(例えばS6−05からS6−06への矢印)。
次に、文字認識処理として、文字単位での認識処理が行われる(S6−06)。この処理は文字認識、辞書ハンドリング、および1文字単位での認識候補生成により行われるが、例えば図15に示すように、漢字等を含む一般的な認識辞書(図15左側)を用いた認識と併せて、会計データであることを考慮して数字や会計記号のみで構成される認識辞書(図15右側)を用いた認識を行って、認識の適切度を向上させることができる。このとき、文字認識処理情報その1として、解像度に対する文字の大きさ(y1)、カスレの状況(y2)などを出力する(S6−07)。カスレの状況について、図6の右側ボックスに示すように、数字の「5」がカスレやドット抜け等により複数の分割されたブロックとして検出された場合でもこれらを組み合わせて「5」として認識するが、その際に検出されたブロック数をカスレの状況として評価パラメータを出力する。
例えば、図6中段右端の例では、「5」という文字が、縦方向のカスレによって4つに分割されている様子が示されており、この分割数が多いほど、文字認識パターン辞書とのパターンマッチングの精度が悪化する等の事態を招来する等の弊害が生じることになるため、信頼性情報を生成する際に、文字認識の精度が低くなる方向で考慮されることになる。なお、図は省略するが、横方向のカスレによっても同様に分割数が増加することになり、信頼性情報を生成する際に、文字認識の精度が低くなる方向で考慮されることになる。
このように一文字単位の認識処理を行い、日付、金額の認識候補を出力する(S6−08)。このとき、文字認識処理情報その2として、各文字の認識辞書とのパターンマッチングを行ってパターンマッチングのマッチングレベルとして例えば特徴量との距離などとの距離を出力する。これを認識結果の信頼性情報(図5S5−11参照)として用いることができる。
以上のように、文字認識処理では、各種の文字認識処理を行う中で、文字認識処理情報として文字認識処理情報その1のほか文字認識処理情報その2を生成記録するが、後述の評価の信頼性情報を生成する際には、文字認識処理情報その1、文字認識処理情報その2のいずれか一方だけを利用するようにしても良いし、両方を利用するようにしてもよい。なお、実験結果では、一方だけでも十分な実用レベルに達していることが判明している。
次に解析処理へと移り、例えばレシートや領収書から日付と合計金額のみを抽出すべく、単語照合を行って、キーワードを検出する(S6−10)。例えば伝票から日付を抽出する場合、「年、月、日」、「/」、「平成」等のキーワードを検出する。また、合計金額を抽出する場合、「合計」、「現計」、「買上計」等のキーワードを検出する。本願システムが具えるキーワード辞書の一実施例が図16に示されている。このキーワード辞書では、項目ごとに複数のキーワードが優先順位を設けて登録されており、1の伝票内で複数のキーワードが検出された場合に順位の高いキーワードを優先して扱うようになっている。
キーワード辞書は、多数の伝票を統計処理し、そのキーワードが用いられていれば、所定の意味を表している確率(可能性)が高いと判断されるものを、その確率の順位に応じて生成された辞書である。キーワードの優先順位は、たとえば、領収書において、「合計金額情報」が検出された場合、その右側領域の文字列を合計金額と推定するが(図17の最上段)、その「合計金額情報」として、「合計」の文字列が検出された場合、「支払」など優先順位が低いものよりも、その右側領域の文字列が「合計金額情報」を示す可能性が高いことを意味している(図16)。
次に、認識候補の最適化として、上記のようなキーワードが検出された場合にはそのキーワードを含む文字列を日付や合計金額情報として推定し、最適化処理を行う(S6−11)。ここで、推定処理に用いられる推定処理テーブルの一例を図17に示す。図17のテーブルに示すように、例えば、レシートにおいて、合計金額のキーワードがあった場合はその右側領域を合計金額の数字と推定したり、合計金額のキーワードがない場合は最も大きな文字列を合計金額の数字と推定する。
この場合において、最も大きな文字列とはフォントサイズを考慮して判断することもできるが、縦横の両方を考慮するようにしてもよいし、縦だけ長くなっている場合や、横だけ長くなっている場合を想定して、いずれか一方だけを考慮するようにしてもよい。また、文字の大きさ以外に、文字の太さを考慮要素としてもよく、さらには文字の大きさと文字の太さの両方を考慮要素としても良い(図17参照)。なお、文字の太さの判定手法としては、切り出した文字において、黒ドットの割合を調べることで(例えば、他の同種文字との対比を行う等)、より太い文字であることが判断できる。このほか、例えば、パターン認識を行いフォントタイプが他と異なっていることを判定したり、文字の色が異なっていたり、網掛けが掛けられていたり、囲み線が設けられていたりするなど、所定の強調文字を検出しさえすればよく、大きさや太さに限定しない趣旨である。いずれの場合でも、サイズが大きい方、太さがより太い方が、一層、合計金額である可能性(信頼性)が高いことを示す指標として用いられる。
また、通帳において左端の列が日付であり、右端の列が残高であると推定したりすることが予め定義されている。また、認識候補の最適化としては、例えば検出された年度が現在から過去3年以内であることを確認したり、日付や金額の情報が数字で構成されるものとして数字に特化した辞書を用いて認識結果を確認したりすることが挙げられる。一方、キーワードが検出されない場合には、図17に定義されるような予め設定された代替処理を行って、日付や合計金額の推定および最適化処理を行う。この代替処理としては、合計金額はレシートに比較的大きな文字や太字で記載されることが多いことに鑑み、大きな文字や太字で記載された数字群を合計金額として推定したり、通帳の列に入金、出金のキーワードがない場合に行ごとの残高推移を考慮していずれの列が入金/出金であるかを判定したりすることが含まれる。このような認識処理により、認識結果が出力される(S6−13)。
さらに、解析処理情報として、キーワード検出の有無(z1)、キーワード検出の一致状況(完全一致、前方一致、後方一致等)(z2)、検出されたキーワードの図16の辞書における優先順位(z3)、キーワード検出でヒットした個数・強調の有無(z4)、キーワードが見つからなかった場合における文字の大きさ(z5)、該当文字列の位置情報(伝票上の相対位置)(z6)、年月日情報の適切性(現在より所定期間以内であるか)(z7)、桁数のカンマ区切りの適切性(z8)などを出力する(S6−12)。このような前処理、文字認識処理、および解析処理の処理情報は評価DB162に登録され、評価の信頼性情報の生成に用いられる。本発明において、評価の信頼性は前処理情報x1〜xn、文字認識処理情報y1〜yn、解析処理情報z1〜znといった多岐にわたる複数の項目を多変量解析することにより求められることを特徴とする。
ここで、例えば、領収書において、キーワードが検出された場合は、そのキーワードの優先順位が高いほど、その右側領域の文字列が合計金額情報である可能性が高く、解析処理としての信頼性が高いことを意味することになる。また、前述のように、付帯情報として、単語辞書とのマッチングレベルの情報を活用し、マッチングレベルが高いほど、解析処理としての信頼性が高いことを意味する情報として、評価の信頼性情報を生成する際に考慮するようにしてもよい。また、キーワードが検出されない場合は、キーワードが検出された場合よりも、合計金額の情報を示す文字列の判定の信頼性が低いことになる。キーワードが検出されない場合、最も大きな数字の文字列を合計金額情報を示すものと推定するが、これも多数の伝票類(原始証憑類)を統計処理して得た判定のための情報であり、さらに、その際の、相対的な大きさの比率が大きければ大きいほど合計金額を示す可能性が高いという統計処理の結果に基づいて、キーワードが検出されなかった場合の信頼性情報とすることができる。これ以外の解析処理情報についても同様であり、各パラメータは、解析処理の確からしさを、それぞれの伝票類(原始証憑類)毎に特有の性質を統計処理した結果に基づいて数値化したものであり、数値が高いほど、解析処理としての信頼性が高い(より確からしい)と判断する指標となる。
一方、認識の信頼性情報の生成は、各処理情報の少なくとも1つを適宜利用してもよいし、処理情報を利用することなく、処理の積み重ねの結果生成された信頼度の順位、あるいは辞書のパターンマッチングの結果などをそのまま利用してもよい。
[評価処理]
次に、図7を参照して、評価処理について説明する。前述のように、前処理、文字認識処理、および解析処理を行ったことにより、前処理情報その1、その2、文字認識処理情報、および解析処理情報が評価DB162に出力されている。制御部150の比較評価・分類処理部は、評価DB162からすべての処理情報を取得し(S7−01〜04)、多変量解析による評価処理を行う(S7−05)。この評価処理は、前処理情報、文字認識情報、および解析処理情報の各要素のそれぞれに重みづけを行い、全体の信頼性を評価することにより行う(S7−05−01:重みづけ基本評価処理)。この重みづけ基本評価処理について、図8−9を参照して詳細に説明する。
図8は、前処理、文字認識処理、および解析処理で出力される各処理情報のテーブル構成を示す図である。本図に示すように、各処理情報の個々の要素について、その調整度合いや、ドット抜けの数、文字分割状況、文字の大きさ、キーワードの有無などが、1〜10の値で記録される様子が示されているが、1〜100など他の数値を与えてもよいし、10段階ではなく、5段階であったり、あるいは1〜10までの数値であって小数点以下を含むように記録してもよい。これらの値は、実際の処理を行った際にその処理内容に応じて認識処理部により出力されるものである。
なお、図8において、文字認識処理情報を構成するy1、y2の要素(文字認識処理情報その1に対応)、またはy3の要素(文字認識処理情報その2に対応)は全てが必須というわけではなく、いずれか一つの要素のみを利用して、評価の信頼性情報を生成しても良い。実験では、X軸ないしY軸の各要素のみを考慮をした評価の信頼性情報でも十分に実用になることを確認しており、Y軸の要素は全く用いないか、用いる場合でもいずれか一つの要素を考慮するだけで十分な評価の精度が得られることを確認している。
なお、さらなる変形例として、y3の要素(文字認識辞書とのマッチングレベル)は、認識候補として、文字認識辞書とのマッチングが最も高い文字のみを認識候補として挙げるようにした上で、一定の固定数値を設定しておくことで済ませることも可能である。この場合、文字認識処理情報としては一定の固定値を用いることになり、事実上、文字認識処理情報を用いないで評価の信頼性情報を生成したことと等価となる。但し、あくまで、文字認識処理情報を評価の信頼性情報を生成する計算過程の中で直接的には用いないでもよいとしているだけであり、文字認識処理の認識候補として第1順位の認識候補を出力するという過程を通じて、文字認識処理情報が計算とは別の形で考慮するということに変容したと説明できる。
さらに、システムには予め図9に示すような重みづけ係数テーブルが登録されており、処理情報の各要素について重みづけ係数が設定されている。重みづけの数値は、多数の伝票類を読み取って、評価処理の信頼性情報を生成し、認識結果と照合した結果を統計解析した上で決定された数値であって、評価の信頼性情報に対する貢献度(重要度、影響度)を考慮して付与された数値である。換言すると、評価の信頼性全体の中における、各処理情報の各要素ごとの重要性を示す指標となる。
評価処理部は、前処理情報、文字認識情報、および解析処理情報のそれぞれに重みづけを行い、図2、図3で説明した評価軸ごとの信頼性を数値化する。この重みづけ基本評価処理のイメージは以下のようになる:
X=Ax1+Bx2+Cx3+・・・
Y=Ay1+By2+Cy3+・・・
Z=Az1+Bz2+Cz3+・・・
例えば、ある伝票を読み取った際に、各軸の各要素のパラメータが最大値をとる場合:
X=2×10+1.5×10+2×10+1×10+0.5×10+0.5×10+0.5×10=80
Y=2×10+3×10=50
Z=1.5×10+2×10+1×10+2×10+3×10+1×10+1×10+1×10=125
のように算出され、これをプロットすると図2−Aのようになり、複数の伝票についてプロットすると図2−Bのように表現される。
上記の例では、重みづけを線形処理によって行っているが、各要素の値が、信頼性に対し非線形に影響を及ぼす場合には、X=A(x1)・(x1)+・・・のように2乗する等、非線形処理による重みづけを行うようにしてもよい。なお、上記の評価の信頼性情報を生成する計算処理の説明に際しては、すべての軸の全ての要素(x1、x2、・・・、y1、y2、・・・、z1、z2、・・・)を用いるように説明したが、前述のように、X軸とZ軸だけの各要素を用いるだけでも実用になる旨説明したように、各軸の要素の一部のみを利用しても良い。例えば、X軸では特に有用な指標となることが多いx1とx3のみを利用し、Y軸では認識辞書とのマッチングレベルy3(文字認識処理情報その2)のみを利用し、Z軸ではz1とz3のみを利用して評価の信頼性情報を生成する等である。
なお、本実施例では図8に示すように処理情報の各要素の値を1〜10とし、さらに図9に示すように設定された重みづけ係数を乗算しているが、図9の係数テーブルを設ける代わりに、例えば要素x1「濃度調整の度合い」(図9では重みづけ係数2)の出力値を1〜10ではなく予め2〜20とするなど、図8の処理情報テーブルのみで予め重みづけを考慮した出力値となるよう設定することもできる。
さらに、別途用意した図10は、評価処理の別の実施例を説明するための図である。本実施例では、評価処理部は図8に示す処理情報ごとの各要素の点数、あるいはこれに重みづけを加えたものを、図10に示すような多角形のグラフにプロットして、内側の面積を評価値としてもよい。この場合、面積計算という2次元の計算を含むため、ある種の非線形(2乗に類似)による重み付けを行うことになる。
上記のような処理によりX軸、Y軸、Z軸の値が導出されるが、一実施例ではさらに各軸の重みづけを行って、最終的な評価の指標性δを導出するようにしてもよい。すなわち、指標δ=α・x+β・y+γ・z(α、β、γは所定の重みづけ係数)のように、各軸の重みづけを行うとともに、この指標δを算出し、一定幅の基準を設けることで、五段階「秀/優/良/可/不可」や三段階「良/可/不可」のように多段階化する。この概念を図11に示す。
ここで、例えば、指標δの値として0〜最大100の範囲の値をとるように正規化した場合において、実際の認識結果の確からしさと比較して統計処理した上で、認識結果の確からしさを数段階に分類するような閾値を設定した場合において、図11のように三段階の閾値を設定した場合、50ポイント未満は「不可」となり、50−70ポイントは「可」となり、ポイント70以上は「良」として扱うという分類を行うことができる。
図7に戻り、本発明の一実施例ではさらに、重みづけによる全体評価に加え、各処理情報の個々の要素の偏差に着目した調整処理が行われる(S7−05−02)。これは、例えば他の軸の信頼性の評価値が一定程度あり、重みづけによる指標値δが「可」となった場合でも、特定の軸の信頼性の評価値が著しく低い場合には、全体として信頼性が低いといえるため、別途、排除の基準を設けて、重みづけ基本評価に対して調整を行う(傾向評価)。例えば、前処理において濃度調整を限界まで行ってようやく文字列を抽出できたような場合(すなわち極度に印刷品質が悪い場合)は、X軸の評価値が極端に低くなる(例えば10ポイント以下となる)。このような場合、他のY軸、Z軸のポイントが高く全体として「良」と評価された場合でも五段階評価の最下位「不可」、あるいは「可」に引き下げる。これにより、いずれかの要素が著しく低く問題となる場合を適切に抽出して、オペレータの確認を促す等することができる。
なお、評価処理は、重みづけによる基本評価をベースに、傾向評価を付加するというように、2つの評価処理を両方を行うように記載したが、どちらか一方だけであってもよく、実験でも、一方だけの評価処理を行うことで十分な実用性があることを確認している。
逆に、総合評価の評価値(指標値δ)があまり高くない場合でも、極端に低くない場合(例えば指標値δ=45程度)であって、解析処理の信頼性が高い(例えばz>100:キーワードの優先順位が高く、数字が大きく合計金額として評価してよい)場合には、「不可」から「可」に修正するようにしてもよい。このような調整手法が、図12に示す記憶領域の調整処理テーブルに予め登録されている。例えば最上のレコードのケースでは、指標値δが70−80あっても、x値が25未満と低ければ、分類ランキングをランクダウンする。
再び図7に戻り、評価による信頼性情報が出力される(S7−06)。上述したようにこの信頼性情報は例えば三段階でも五段階であってもよい。次に、任意であるが、認識の信頼性情報を取得し、図13の総合判定テーブルを用いて評価による信頼性と認識結果の信頼性の双方を考慮してもよい(S7−07、08)。その後、文字認識結果を振り分け(S7−09)、認識結果が振り分けに沿った方法で画面表示される(S7−10)。すなわち、上述したように問題なければそのまま会計入力データに反映され、信頼性がグレーであればオペレータの確認が促され、読み取り不可であれば空欄のみが表示され入力が促される。オペレータによる再確認/訂正/再入力があれば(S7−11、12)、評価の学習処理が行われる(S7−13)。
[学習処理の詳細]
次に、信頼性によって振り分けた認識結果を表示した場合に、訂正や再入力があった場合の学習処理の詳細について説明する。前述のように、学習処理は、図1の中段などに示すように、認識の学習処理(S5−22)と評価の学習処理(S5−19)があり、以下それぞれについて詳述する。
(1)認識の学習処理について
表示した日付や金額についてオペレータの修正や再入力があった場合、訂正された文字について正誤情報を元に、認識DBの認識用パラメータや文字認識辞書に対する学習処理が行われる。例えば、合計金額の認識結果が3000円だったのにも拘らず、オペレータにより3100円に修正された場合には、「0」が「1」に修正されたことを正誤情報として抽出し、今回の修正に係る「1」の読取りイメージの特徴量を算出し、文字認識辞書(例えば図15の数字用の文字認識辞書)の「1」の箇所に、追加の特徴量として格納する等の、文字認識辞書の更新処理によって学習がなされることになる。
また、同時に、当該文字イメージを「0」と誤認識したことについても措置を行い、例えば、文字認識辞書の「0」の箇所から、当該文字イメージから算出した特徴量に最も近い特徴量を削除する等して、次回の認識処理において、今回誤認識した文字イメージに似たような文字パターンを読み取った際に、「0」の候補を選定しないような学習処理を行うようにしてもよい。
認識の学習処理は、上記の文字認識処理における文字認識辞書の更新のほか、濃度処理テーブルなど前処理用の認識用パラメータについて、濃度処理のレベルが不適切だった場合に、濃度処理の程度(レベルが最小で1〜最大で10までと仮定)を、例えばレベル8のやや高い濃度調整を行った際に、訂正があった場合において、濃度調整のレベルが高すぎて文字がかすれた、あるいは逆にノイズが浮かび上がって余計な黒点を文字の一部を構成してしまった等と判定するような場合に、濃度調整のレベルを例えばレベル7に変更する等の処理を行う。
以上、認識の学習処理において、文字認識辞書や認識用パラメータなどについて、学習結果が評価DBにフィードバックされる様子について説明したが、一つの認識結果に対して一度の修正や再入力を行ったことに対し、認識の学習処理とは別に、評価の学習処理が併行して行われ別途評価DBにフィードバックされることになる。以下、評価の学習処理について説明する。
(2)評価の学習処理について
表示した日付や金額についてオペレータの修正や再入力があった場合、その情報が図18−Aに示すように、フィードバックして蓄積される。このデータとしては、伝票ID、認識対象、認識結果、総合評価、訂正/再入力の別、再入力/訂正文字列、認識結果の正誤、および各認識処理での認識処理情報が蓄積される。例えば、図18−Aの伝票ID「R032」のレコードでは、合計金額の認識結果が3000円だったのにも拘らず、オペレータにより3100円に修正されている。これについて個々の処理情報を分析すると、Y軸、Z軸の数値(信頼性)がやや高く、総合評価での信頼性が「可」と判定されたものの、濃度処理の数値が低く、これが原因で読み取りエラーが生じた可能性がある。また、伝票ID「R033」のレコードでは、合計金額の認識結果が280円で合っていたのに、Y軸、Z軸の数値が低く、総合評価での信頼性が低く「読み取り不可」と分類されたものの、例えば、レシートの印刷品質がよく、濃度調整を必要最小限しか行わないような場合であったこと等により、濃度処理の数値が高いため、結果として適切に読み取れていたことが分かる。
図18−Bは、学習結果の取り込み用の評価結果テーブルの一例を示す。学習手順としては、図18−Aで説明したようにフィードバックして蓄積した結果は、認識結果の誤りデータ等の学習に反映すべきでない特異な場合といえるものを除去(蓄積した評価結果から認識結果の正しいデータを抽出)したうえで、製品出荷段階やカストマ等による初期導入時ないし会計事務所が顧問先にシステムを初期導入する際などに組み込まれた伝票読み取り結果が予め登録された図18−Bのテーブルに組み込まれる。
ここで、学習に適さない特異な場合(特異点)の判定手法としては、学習可否の対象となる評価結果および正誤情報について、従前の評価DBにおける学習結果の取り込み用の評価結果テーブル中(図18)の過去の評価結果や正誤情報と、当該学習対象となる評価結果との類似性を、各評価結果に対応づけられた各処理情報の要素情報(x1、x2、・・・、y1、y2、・・・、z1、z2、・・・)に基づいて、クラスター解析や最小二乗法などを用いて判定し、極端に類似性が低い場合は特異点として学習処理に反映しない等の手法が採られる。
図18−Bにおいて、伝票IDが「DF1230」と「DF1134」とあるのが出荷段階等において予め組み込まれた伝票読み取り結果の例である。そして、出荷後のユーザー使用段階で再入力/訂正があった場合に、入力値と認識結果を比較し、比較結果が一致する場合は、一致した結果を読み取り結果として採用し、一致しない場合は、各評価軸(X、Y、Z)の各要素(x1、x2、・・・y1、y2・・・z1、z2・・)をクラスター解析や最小二乗法を用いることにより、各要素が似たような傾向の読み取り結果の近傍に組み込む。図18−Bの例では、比較結果が一致しないので、出荷段階等において予め設定された「DF1230」のすぐ下に、認識処理情報の各要素が似た傾向にある修正レコード「R032」が登録される。また、出荷時伝票「DF1134」の直下に伝票R033、R035が登録され、これらはすべて認識処理情報の各要素が似ているといえる。
このように学習結果の取り込みを行った結果、例えば以下のように処理の修正を行う:
(1)「可」と判断したのに、認識結果が間違っていたとして、訂正入力があった場合
蓄積結果をクラスター解析等して、似たような傾向の各評価軸(X、Y、Z)の各要素(x1、x2、・・・y1、y2・・・z1、z2・・)で構成される群がある場合には、これを括るような形で把握し、以後、原始証憑を読み取った結果が、各評価軸の各要素において、似たような傾向と判断される場合には、「可」と判断されても「不可」となるように修正する判断を行う(傾向評価に反映する学習処理)。
(2)誤読の可能性があり「読み取り不可」としたのに、オペレータの入力値が認識内容と合致していた場合
上記と同様に、その認識結果が「可」となるように、修正した判断を行う。
この概念を図3−Bを用いて説明すると、図18−Bのテーブル管理により、似たような傾向の要素を有する群20cは学習前は「不可」の範囲に属していたが、学習後はこの群20cは「不可」から「可」に修正する傾向評価を行うべきと判断される。したがって、新たな伝票イメージがこの群20cに入る場合には、クラスター解析や最小二乗法により、傾向処理として評価の修正が行われる。なお、例えば評価結果が「読み取り不可」であって、オペレータの入力内容も認識結果と違っていた場合や、評価結果が「可」であって、オペレータによる修正もなく採用された場合のデータも図18のテーブルに登録して、正解を正しく判断している場合についても随時学習処理を行って、評価の精度をより高めるようにしてもよい。また、学習処理によって蓄積結果の傾向が変わってきた時に、図9の重み付けテーブルの各重み付け係数へ反映させてもよい。
以上、認識の学習処理と、評価の学習処理について説明したように、一つの認識結果に対し一度の修正入力、再入力により、同時に複数の学習処理がなされることになる。また、それぞれの学習処理それ自体は独立して実行されるが、それぞれの学習の結果は、以降の認識処理において相互に影響し合い、例えば、認識の学習処理において認識辞書の更新を行った結果、次回以降の認識処理の過程において出力される処理情報は異なることになり、評価DBに記録される処理情報が以前とは異なる傾向となるため、評価処理で用いられる処理情報も異なることになり、評価の信頼性情報の値が変わり、評価にも影響を与えることになる。同様に、評価の学習結果も、以降の認識処理においてオペレータに示す認識結果の確からしさの指標ないし分類が異なることになり、オペレータの修正入力等を介して次回の評価結果に影響を及ぼし、それぞれの学習結果は相互に影響を及ぼし合うことになる。
以上、本発明の数々の実施形態および実施例について詳細に説明したが、本発明の技術的範囲は上記の実施形態ないし実施例に限定されるものではなく、本発明は添付の特許請求の範囲を逸脱することなく様々な変形例、変更例として実現することができ、このような変形例、変更例はすべて本発明の技術的範囲に属すると解されるべきである。
本発明は、会計事務所の顧問先企業などで会計ソフトを利用するコンピューターシステムや、会計事務所で仕訳入力を行う場合に用いられる会計処理システムに利用することができる。
1 会計データ入力システム
10 原始証憑
20 読取装置
50 サーバー装置
100 端末装置
110 入力部
120 表示部
130 出力部
140 通信部
150 制御部
160 記憶部
162 評価DB

Claims (12)

  1. 原始証憑を読取った読取画像から、濃度調整や背景処理を含む画像処理を経て文字列の存在する箇所を把握し文字列ないし文字を切り出す前処理と、文字認識を行う文字認識処理と、文字認識処理後の後処理とを行い、認識候補のテキストデータを生成する会計処理支援システムにおいて、
    前処理と、文字認識処理と、認識対象の解析処理を含む後処理とで構成される認識処理を行い、各処理の状況を記録する認識処理部と、
    前記認識処理部が生成した、前記認識処理を構成する各処理の処理状況を取得して、各処理状況を評価して、各処理の全体としての信頼性を判定する評価処理部と、を備え、
    記憶部に、
    前記認識処理で利用するための認識辞書と各種の認識用パラメータを記録した認識DBと、
    前記認識処理における各処理過程の処理状況をその都度記録し、処理状況を評価するための指標となる評価用パラメータを格納するための評価DBであって、
    各処理過程の処理状況に基づいて、全体としての処理状況の信頼性を評価して「評価の信頼性情報」を生成するための第1の評価用パラメータを記録した、評価DBと、を備え、
    前記認識処理部は、
    前処理過程における処理の状況を前処理情報として前記評価DBに記録し、
    文字認識処理における処理の状況を文字認識処理情報として前記評価DBに記録し、
    原始証憑の特性に応じた認識候補の解析処理の状況を解析処理情報として、前記評価DBに記録し、
    前記評価処理部が、前記評価DBに記録された前処理情報と文字認識処理情報と解析処理情報の各処理情報を構成する各要素情報に対し、前記第1の評価用パラメータを適用して、各要素情報の全体の信頼性に対する重要度を考慮した各処理の信頼性を評価して、前記「評価の信頼性情報」を生成し、
    当該評価の信頼性情報に基づいて、別途認識処理過程で前記認識処理部が生成した認識候補の確からしさを、評価して分類することを特徴とする会計データ入力支援システム。
  2. 請求項1に記載の会計データ入力支援システムにおいて、
    さらに、前記評価処理部による信頼性に、前記認識処理部が生成した信頼性情報を加味して、認識処理と評価処理全体の総合的な信頼性を判定する総合比較評価処理部を備え、
    前記記憶部の前記評価DBに、
    前記「評価の信頼性情報」と、別途、認識処理における各処理過程の信頼性を評価して、 前記認識処理部が生成した「認識の信頼性情報」と、を比較し総合評価を行うための第2の評価用パラメータが記録され、
    前記総合比較評価処理部が、
    前記「評価の信頼性情報」と、前記「認識の信頼性情報」とを比較し、当該比較結果に対し前記第2の評価用パラメータを適用して、前記「評価処理の信頼性」と、前記「認識処理の信頼性」とを総合的に評価することで、別途認識処理過程で前記認識処理部が生成した認識候補の確からしさを、総合的に評価して分類することを特徴とする会計データ入力支援システム。
  3. 前記評価処理部および/または総合比較評価処理部が、認識候補の確からしさに応じて分類した結果に基づいて前記認識結果を振分けて、前記認識候補の確からしさに応じた区別を伴って、システムの画面に差別表示することを特徴とする、請求項1または2に記載の会計データ入力支援システム。
  4. 前記差別表示が、正しい認識結果であることを示す表示、認識結果が正しいか否かの確認を要することを示す要確認の表示、および、認識結果が誤っている可能性が高いとして訂正を要することを示す訂正要ないし再入力を促すための空白表示を含む再入力表示、の少なくとも3段階の区別を伴う差別表示を含むことを特徴とする、請求項3に記載の会計データ入力支援システム。
  5. 前記差別表示に対し、認識結果の訂正ないし再入力があった場合、当該訂正ないし再入力された文字列と、認識結果の文字列を比較して、両者の差異を判定して正誤情報を生成し、
    当該正誤情報と、評価処理において当該認識結果を評価した評価結果と、当該評価に際して使用した認識処理の各処理の過程における各処理情報の要素情報とを対応づけ、
    当該評価結果に対応づけられた各処理情報の要素情報と、
    記録済みの従前の評価結果に対応づけられた各処理情報の要素情報との類似性に基づいて当該評価結果を分類した上で、学習データとして前記評価DBに記録すると共に、前記正誤情報に基づいて当該学習データに係る評価の取り扱いを更新すること、を特徴とする、請求項3または4に記載の会計データ入力支援システム。
  6. 前記認識処理過程における前処理において、少なくとも、濃度調整処理、およびカスレの有無の判定処理を行い、その際の処理状況として、少なくとも、濃度調整処理における濃度調整の度合い、およびカスレの有無の判定処理におけるカスレの度合いを、前処理情報として生成し、前記評価DBに記録することを特徴とする、請求項1から5のいずれか一つに記載の会計データ入力支援システム。
  7. 前記認識処理過程における文字認識処理において、少なくとも、切り出して文字認識処理の対象とした文字の大きさを判定する処理、および切り出した個々の文字においてカスレの状況に関する判定処理を行い、その際の処理状況として、少なくとも、文字認識処理の対象とした文字の大きさの状況、およびカスレの状況に関する情報を、文字認識処理情報として生成し、前記評価DBに記録することを特徴とする、請求項1から6のいずれか一つに記載の会計データ入力支援システム。
  8. 前記認識処理過程における解析処理において、少なくとも、キーワードの有無の検出処理、および検出したキーワードの優先順位の判定処理を行い、その際の処理状況として、少なくとも、キーワード検出の有無の状況、およびキーワードを検出した場合におけるキーワードの優先順位の情報を、解析処理情報として生成し、前記評価DBに記録することを特徴とする、請求項1から7のいずれか一つに記載の会計データ入力支援システム。
  9. 前記評価処理部および/または総合比較評価処理部が認識結果を総合評価して分類した結果に基づいて、認識結果をシステムの画面上に差別表示し、当該差別表示に従って訂正、再入力された文字列を受付け、
    当該認識結果の文字列と、訂正ないし再入力による文字列との比較による正誤情報を、評価処理で用いる評価DBに記録する処理とは別に、独立して、かつ認識処理に適合する態様で異なる学習内容として、認識処理で用いる認識DBにフィードバックすることで、フィードバック後の認識処理において、新たに生成される認識処理の過程における前処理、文字認識処理、解析処理の各処理情報の要素情報が変化し、当該変化した要素情報が評価DBに記録され、
    評価処理において、評価DBの、変化した要素情報を取得して生成された評価の信頼度情報を用いて、認識結果の総合比較評価処理を行うことで、相互に学習効果を高め合うことを特徴とする、
    請求項1から8のいずれか一つに記載の会計データ入力支援システム。
  10. 原始証憑を読取った読取画像から、濃度調整や背景処理を含む画像処理を経て文字列の存在する箇所を把握し文字列ないし文字を切り出す前処理と、文字認識を行う文字認識処理と、文字認識処理後の後処理とを行い、認識候補のテキストデータを生成する会計処理支援システムにおける文字認識方法において、
    認識処理部が、前処理と、文字認識処理と、認識対象の解析処理を含む後処理とで構成される認識処理を行い、各処理の状況を記録する認識処理ステップと、
    評価処理部が、前記認識処理部が生成した、前記認識処理を構成する各処理の処理状況を取得して、各処理状況を評価して、各処理の全体としての信頼性を判定する評価処理ステップと、を備え、
    前記会計処理支援システムの記憶部が、
    前記認識処理で利用するための認識辞書と各種の認識用パラメータを記録した認識DBと、
    前記認識処理における各処理過程の処理状況をその都度記録し、処理状況を評価するための指標となる評価用パラメータを格納するための評価DBであって、
    各処理過程の処理状況に基づいて、全体としての処理状況の信頼性を評価して「評価の信頼性情報」を生成するための第1の評価用パラメータを記録した、評価DBと、を備え、
    前記認識処理ステップは、
    前処理過程における処理の状況を前処理情報として前記評価DBに記録し、
    文字認識処理における処理の状況を文字認識処理情報として前記評価DBに記録し、
    原始証憑の特性に応じた認識候補の解析処理の状況を解析処理情報として、前記評価DBに記録し、
    前記評価処理ステップは、前記評価DBに記録された前処理情報と文字認識処理情報と解析処理情報の各処理情報を構成する各要素情報に対し、前記第1の評価用パラメータを適用して、各要素情報の全体の信頼性に対する重要度を考慮した各処理の信頼性を評価して、前記「評価の信頼性情報」を生成し、
    当該評価の信頼性情報に基づいて、別途認識処理過程で前記認識処理部が生成した認識候補の確からしさを、評価して分類することを特徴とする会計データ入力支援方法。
  11. 請求項10に記載の会計データ入力支援方法において、
    さらに、総合比較評価処理部が、前記評価処理部による信頼性に、前記認識処理部が生成した信頼性情報を加味して、認識処理と評価処理全体の総合的な信頼性を判定する総合比較評価処理ステップを備え、
    前記記憶部の前記評価DBに、
    前記「評価の信頼性情報」と、別途、認識処理における各処理過程の信頼性を評価して、前記認識処理部が生成した「認識の信頼性情報」と、を比較し総合評価を行うための第2の評価用パラメータが記録され、
    前記総合比較評価処理ステップが、
    前記「評価の信頼性情報」と、前記「認識の信頼性情報」とを比較し、当該比較結果に対し前記第2の評価用パラメータを適用して、前記「評価処理の信頼性」と、前記「認識処理の信頼性」とを総合的に評価することで、別途認識処理過程で前記認識処理部が生成した認識候補の確からしさを、総合的に評価して分類することを特徴とする会計データ入力支援方法。
  12. 請求項10または11の会計データ入力支援方法を、コンピュータに実行させることを特徴とする会計データ入力支援プログラム。
JP2014017803A 2014-01-31 2014-01-31 会計データ入力支援システム、方法およびプログラム Active JP6528147B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014017803A JP6528147B2 (ja) 2014-01-31 2014-01-31 会計データ入力支援システム、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014017803A JP6528147B2 (ja) 2014-01-31 2014-01-31 会計データ入力支援システム、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2015146075A true JP2015146075A (ja) 2015-08-13
JP6528147B2 JP6528147B2 (ja) 2019-06-12

Family

ID=53890282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014017803A Active JP6528147B2 (ja) 2014-01-31 2014-01-31 会計データ入力支援システム、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6528147B2 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109426810A (zh) * 2017-08-30 2019-03-05 精工爱普生株式会社 处理装置、处理系统、处理方法以及计算机可读记录介质
JP6535860B1 (ja) * 2018-01-29 2019-07-03 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム
JP2019124981A (ja) * 2018-01-11 2019-07-25 株式会社リコー 連携システム、情報処理装置、情報登録方法、プログラム
JP2019135669A (ja) * 2018-01-29 2019-08-15 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム
WO2019234865A1 (ja) * 2018-06-06 2019-12-12 株式会社Pfu 検査装置、制御方法及び制御プログラム
WO2020012539A1 (ja) * 2018-07-09 2020-01-16 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理システム、仕訳要素解析方法、仕訳要素解析プログラム
JP2020086975A (ja) * 2018-11-27 2020-06-04 辻・本郷税理士法人 通帳変換装置、通帳変換システム及びプログラム
JP2020086974A (ja) * 2018-11-27 2020-06-04 辻・本郷税理士法人 通帳変換装置、通帳変換システム及びプログラム
WO2020255361A1 (ja) * 2019-06-20 2020-12-24 ファーストアカウンティング株式会社 会計処理システム、会計処理方法、会計処理プログラム
JP2021002330A (ja) * 2020-04-21 2021-01-07 ファーストアカウンティング株式会社 会計処理システム、会計処理方法、会計処理プログラム
US20210124973A1 (en) * 2019-10-29 2021-04-29 Ricoh Company, Ltd. Information processing system and method
WO2022019145A1 (ja) * 2020-07-20 2022-01-27 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US11238305B2 (en) 2020-02-12 2022-02-01 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program
JP2022072841A (ja) * 2020-10-30 2022-05-17 みずほリサーチ&テクノロジーズ株式会社 モデル評価システム、モデル評価方法及びモデル評価プログラム
US11354890B2 (en) 2020-02-12 2022-06-07 Fujifilm Business Innovation Corp. Information processing apparatus calculating feedback information for partial region of image and non-transitory computer readable medium storing program
WO2022254560A1 (ja) * 2021-05-31 2022-12-08 株式会社KPMG Ignition Tokyo 光学文字認識により生成されるテキストデータを用いたデータマッチング

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468057B2 (ja) 2020-03-26 2024-04-16 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム、及び情報処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05182014A (ja) * 1991-12-28 1993-07-23 Ricoh Co Ltd 文字認識方法
JPH09134410A (ja) * 1995-11-13 1997-05-20 Ricoh Co Ltd 認識結果の確信度決定方法及び文字認識装置
JP2013073439A (ja) * 2011-09-28 2013-04-22 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05182014A (ja) * 1991-12-28 1993-07-23 Ricoh Co Ltd 文字認識方法
JPH09134410A (ja) * 1995-11-13 1997-05-20 Ricoh Co Ltd 認識結果の確信度決定方法及び文字認識装置
JP2013073439A (ja) * 2011-09-28 2013-04-22 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019045932A (ja) * 2017-08-30 2019-03-22 セイコーエプソン株式会社 処理装置、処理システム、処理方法および処理プログラム
CN109426810A (zh) * 2017-08-30 2019-03-05 精工爱普生株式会社 处理装置、处理系统、处理方法以及计算机可读记录介质
JP2019124981A (ja) * 2018-01-11 2019-07-25 株式会社リコー 連携システム、情報処理装置、情報登録方法、プログラム
JP6535860B1 (ja) * 2018-01-29 2019-07-03 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム
JP2019135669A (ja) * 2018-01-29 2019-08-15 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理装置、仕訳要素解析方法、仕訳要素解析プログラム
JP7039693B2 (ja) 2018-06-06 2022-03-22 株式会社Pfu 検査装置、制御方法及び制御プログラム
WO2019234865A1 (ja) * 2018-06-06 2019-12-12 株式会社Pfu 検査装置、制御方法及び制御プログラム
JPWO2019234865A1 (ja) * 2018-06-06 2021-01-07 株式会社Pfu 検査装置、制御方法及び制御プログラム
WO2020012539A1 (ja) * 2018-07-09 2020-01-16 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理システム、仕訳要素解析方法、仕訳要素解析プログラム
JP6635563B1 (ja) * 2018-07-09 2020-01-29 ファーストアカウンティング株式会社 仕訳要素解析装置、会計処理システム、仕訳要素解析方法、仕訳要素解析プログラム
JP2020086975A (ja) * 2018-11-27 2020-06-04 辻・本郷税理士法人 通帳変換装置、通帳変換システム及びプログラム
JP2020086974A (ja) * 2018-11-27 2020-06-04 辻・本郷税理士法人 通帳変換装置、通帳変換システム及びプログラム
WO2020255361A1 (ja) * 2019-06-20 2020-12-24 ファーストアカウンティング株式会社 会計処理システム、会計処理方法、会計処理プログラム
JPWO2020255361A1 (ja) * 2019-06-20 2021-09-13 ファーストアカウンティング株式会社 会計処理システム、会計処理方法、会計処理プログラム
US20210124973A1 (en) * 2019-10-29 2021-04-29 Ricoh Company, Ltd. Information processing system and method
US11532146B2 (en) * 2019-10-29 2022-12-20 Ricoh Company, Ltd. Information processing system, information processing method, and information processing apparatus for assisting input of information
US11238305B2 (en) 2020-02-12 2022-02-01 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program
US11354890B2 (en) 2020-02-12 2022-06-07 Fujifilm Business Innovation Corp. Information processing apparatus calculating feedback information for partial region of image and non-transitory computer readable medium storing program
JP2021002330A (ja) * 2020-04-21 2021-01-07 ファーストアカウンティング株式会社 会計処理システム、会計処理方法、会計処理プログラム
WO2022019145A1 (ja) * 2020-07-20 2022-01-27 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2022072841A (ja) * 2020-10-30 2022-05-17 みずほリサーチ&テクノロジーズ株式会社 モデル評価システム、モデル評価方法及びモデル評価プログラム
JP7085605B2 (ja) 2020-10-30 2022-06-16 みずほリサーチ&テクノロジーズ株式会社 モデル評価システム、モデル評価方法及びモデル評価プログラム
WO2022254560A1 (ja) * 2021-05-31 2022-12-08 株式会社KPMG Ignition Tokyo 光学文字認識により生成されるテキストデータを用いたデータマッチング

Also Published As

Publication number Publication date
JP6528147B2 (ja) 2019-06-12

Similar Documents

Publication Publication Date Title
JP6528147B2 (ja) 会計データ入力支援システム、方法およびプログラム
US11170248B2 (en) Video capture in data capture scenario
US20190286898A1 (en) System and method for data extraction and searching
US9342741B2 (en) Systems, methods and computer program products for determining document validity
US8897563B1 (en) Systems and methods for automatically processing electronic documents
JP6268352B2 (ja) 会計データ入力システム、方法、およびプログラム
US20140153830A1 (en) Systems, methods and computer program products for processing financial documents
US20160379186A1 (en) Element level confidence scoring of elements of a payment instrument for exceptions processing
US20110052075A1 (en) Remote receipt analysis
US10482323B2 (en) System and method for semantic textual information recognition
US20220292861A1 (en) Docket Analysis Methods and Systems
US20150186739A1 (en) Method and system of identifying an entity from a digital image of a physical text
US9256805B2 (en) Method and system of identifying an entity from a digital image of a physical text
JPWO2019008766A1 (ja) 証憑処理システムおよび証憑処理プログラム
US10049350B2 (en) Element level presentation of elements of a payment instrument for exceptions processing
WO2022103564A1 (en) Fraud detection via automated handwriting clustering
Correia et al. Digitizing historical balance sheet data: A practitioner’s guide
JP4356908B2 (ja) 財務諸表自動入力装置
US11335108B2 (en) System and method to recognise characters from an image
JP2015187765A (ja) 帳票フォーマット情報登録方法及びシステム並びにプログラム
JP2007280413A (ja) 財務諸表自動入力装置
JP7021496B2 (ja) 情報処理装置及びプログラム
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
US20230140357A1 (en) Image processing apparatus, image processing method, and non-transitory storage medium
EP4325447A1 (en) Machine learning based system and method for facilitating correction of data in documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190417

R150 Certificate of patent or registration of utility model

Ref document number: 6528147

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150