JP6507459B2 - Accounting system - Google Patents

Accounting system Download PDF

Info

Publication number
JP6507459B2
JP6507459B2 JP2017090095A JP2017090095A JP6507459B2 JP 6507459 B2 JP6507459 B2 JP 6507459B2 JP 2017090095 A JP2017090095 A JP 2017090095A JP 2017090095 A JP2017090095 A JP 2017090095A JP 6507459 B2 JP6507459 B2 JP 6507459B2
Authority
JP
Japan
Prior art keywords
image
character recognition
comparison
feature pattern
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017090095A
Other languages
Japanese (ja)
Other versions
JP2018190064A (en
Inventor
土本 一生
一生 土本
眞樹 桑島
眞樹 桑島
浩一 鎌田
浩一 鎌田
孝志 勝毛
孝志 勝毛
秀規 真後
秀規 真後
直樹 松永
直樹 松永
雄大 深見
雄大 深見
聡司 横山
聡司 横山
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP2017090095A priority Critical patent/JP6507459B2/en
Publication of JP2018190064A publication Critical patent/JP2018190064A/en
Application granted granted Critical
Publication of JP6507459B2 publication Critical patent/JP6507459B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、レシート等の証ひょう画像(以下、「レシート等の画像」と略す)を読み取って、会計処理を行なう場合に、過去に読み取った登録済みのレシート等の画像と重複していないかどうかを判定し、ユーザーに対し、重複しているかどうかを確認するための画面表示を行ない、誤って重複入力することを防止すると共に、2重の仕訳の発生と本当に2つの取引が発生したことを峻別しつつ適切な会計データの作成を支援することで、会計処理の効率化、確実化を図ることに関する。 In the present invention, when a proof image such as a receipt (hereinafter referred to as “image such as receipt”) is read and accounting processing is performed, it may not overlap with an image such as a registered receipt read in the past Determine whether and display the screen to confirm whether the user is overlapping, to prevent accidental duplicate input, and the occurrence of double journaling and the fact that two transactions actually occurred To create more efficient accounting data, and to make accounting more efficient and reliable.

従来より、例えば、特許文献1に記載の発明のように、レシート等の画像から経費データを入力する際に、画像をテキストに変換して、経費データを取り出して、データ入力するためのシステムがあった。 Conventionally, when inputting expense data from an image such as a receipt, for example, as in the invention described in Patent Document 1, a system for converting the image into text, extracting the expense data, and inputting the data there were.

特表2006−511896号公報Japanese Patent Application Publication No. 2006-511896

レシートや伝票などの証ひょうは、会計処理のために重要な資料であって、企業や個人事業主が自ら管理して、会計税務処理の基礎資料として用いるほか、会計税務処理を専門家である会計事務所等に依頼する際には、会計事務所の職員等が顧問先を訪問して証ひょうを読み取るほか、顧問先から会計事務所の職員等に手渡し、または郵送等して、会計事務所で会計データ入力の際に参照した後、顧問先に返却するという運用がされている。
その際、顧問先などでレシート等の管理が不十分な場合には、同じレシート等を重複して読み取ってしまう可能性があった。
Proofs such as receipts and slips are important materials for accounting, and they are managed by companies and individual business owners and used as basic materials for accounting and tax processing, and they are specialists in accounting and tax processing. When asking the accounting office etc., staff of the accounting office visit the adviser to read the certificate, or hand over or mail to the staff of the accounting office from the adviser, accounting affairs After referring to it at the time of accounting data input at the office, it is managed to return to the adviser.
At that time, if the management of the receipts and the like is insufficient at the adviser or the like, there is a possibility that the same receipts and the like are read in duplicate.

そこで、従来、レシート等の画像を読み取って、システムの画面に表示して、会計処理に関するデータ入力を行なう際に、過去に読み取ったレシート等の画像と重複しているかどうかを判定する処理として、レシート等の画像に印字された情報について文字認識処理を行ない、テキスト文字化して、過去に読み取ったレシート等の画像のテキスト文字と比較する手法が用いられていた。
しかし、レシート等の画像のテキスト文字は、発行する店舗や業種によって、その態様は千差万別であり、かつ印字される文字の大きさもかなり小さいものが含まれるため、印字文字等について確実に文字認識処理を行なって、全てをテキスト化することは困難であった。
Therefore, conventionally, an image such as a receipt is read and displayed on the screen of the system, and when performing data input relating to accounting processing, as processing to determine whether or not an image such as a receipt read in the past is overlapped. A method has been used in which character recognition processing is performed on information printed on an image such as a receipt, text conversion is performed, and comparison is made with text characters of an image such as a receipt read in the past.
However, the text characters of images such as receipts vary depending on the store and type of business, and the aspect varies widely, and the size of the characters to be printed is considerably small. It was difficult to convert all into text by performing character recognition processing.

この点、特許文献1に記載のシステムでは、複数の印字情報について文字認識処理することにより、それらの情報が複数合致していることを条件に、レシート等の画像の重複判定を行なうことが記載されているが、もし文字認識処理で、複数の印字情報をうまくテキスト化できない場合には、過去に読み取ったレシート等の画像との重複判定を行なうことができなかった。 In this respect, in the system described in Patent Document 1, it is described that by performing character recognition processing on a plurality of print information, an overlap determination of an image such as a receipt is performed on the condition that a plurality of pieces of the information match. However, if character recognition processing can not successfully convert a plurality of print information into text, it has not been possible to judge duplication with an image such as a receipt read in the past.

また、文字認識処理で取得したテキスト文字に、誤認識した結果が含まれる場合もあり、そのような場合には、重複するレシート等の画像を取りこぼす可能性もあった。
この点、誤認識していた場合に、たまたま文字列が一致していたような場合には、そのレシート等の画像を、端末等の操作者であるユーザーに提示することで、ユーザーの判定を待つことができるが、誤認識の結果、テキスト文字が過去に読み取ったレシート等の画像のテキスト文字と一致しない場合には、そもそも、ユーザーに提示することもできず、誤って重複入力してしまう可能性があった。
In addition, the text character acquired by the character recognition processing may include the result of erroneous recognition, and in such a case, there is also a possibility that an image such as a duplicate receipt is missed.
In this respect, when the character string is coincident by chance when it is erroneously recognized, the user is determined by presenting the image such as the receipt to the user who is the operator such as the terminal. It is possible to wait, but as a result of misrecognition, if the text character does not match the text character of the image such as a receipt read in the past, it can not be presented to the user in the first place, resulting in erroneous duplicate input There was a possibility.

上記課題を解決すべく、本発明の第1の発明は、証ひょう画像を読み取って、会計処理を行なうためのシステムであって、読み取った証ひょう画像から、日付、金額を含む文字をテキストとして文字認識する文字認識手段と、日付、金額、店名を含む会計処理に有用な情報の画像の特徴パターンを、所定の領域毎に抽出する画像の特徴パターン抽出手段とを備え、前記文字認識手段で取得した文字認識結果を記憶部に登録する文字認識結果登録手段と、前記の画像の特徴パターン抽出手段で抽出した画像の特徴パターンを前記記憶部に登録する画像の特徴パターン登録手段とを備え、新たに読み取った当該証ひょう画像について、前記文字認識手段によって、日付、金額を含む文字をテキストとして文字認識し、前記の画像の特徴パターン抽出手段によって画像の特徴パターンを抽出すると共に、前記記憶部から、登録済みの証ひょう画像の文字認識結果と画像の特徴パターンを読出し、当該新たな読み取った証ひょう画像の文字認識結果と前記登録済み証ひょう画像の文字認識結果とを比較する文字認識結果比較手段と、当該新たな読み取った証ひょう画像について抽出した画像の特徴パターンと前記登録済み証ひょう画像の画像の特徴パターンとを比較する画像の特徴パターン比較手段とを備え、文字認識結果比較手段による比較結果と画像の特徴パターン比較手段による比較結果と組み合わせて、当該新たな証ひょう画像と、前記登録済みの証ひょう画像とが、重複している可能性を判定する重複可能性判定手段、を備えたことにより、重複する可能性があると判定された新たな証ひょう画像の取り込みを防止することを特徴とする。
また、本発明の第2の発明は、前記画像の特徴パターン抽出手段において、日付、金額、店名を含む会計処理に有用な情報の画像のパターンを、所定の領域毎に抽出する際に、領域毎の画像の特徴パターンとして、少なくとも、画素のある領域の位置と範囲のパターンまたはビットマップパターンの態様を含み、前記画像の特徴パターン比較手段において、所定の領域毎に、画像の特徴パターンの態様を比較することで、仮に文字認識結果に誤りがある場合や文字認識結果を取得できない場合にも、画素のある領域の位置と範囲のパターンまたはビットマップパターンの比較により、日付、金額、店名を含む会計処理に有用な情報が一致している可能性を判定することで、重複可能性判定手段が、文字認識結果比較手段による比較結果と画像の特徴パターン比較手段による比較結果とを総合して、重複している可能性を判定すること、を特徴とする。

また、本発明の第3の発明は、証ひょう画像を複数枚まとめて読み取ったときに、証ひょう画像の1つ1つの重複可能性を判定すると共に、当該複数枚の証ひょう画像の纏まりについて、前記登録済みの証ひょう画像の、日単位、週単位を含む所定の単位の纏まりと重複している可能性を判定して出力すること、を特徴とする。

また、本発明の第4の発明は、証ひょう画像を読み取って、その証ひょう画像に関する取引の内容を、会計データとして入力を受け付け、取得した会計データのうち、少なくとも摘要情報または科目情報と、証ひょう画像の画像の特徴パターンとを関連付けて登録し、次回の会計データの入力の際に、文字認識結果の比較手段および画像の特徴パターンとの比較手段による比較処理に加えて、当該証ひょう画像に対応付けられた摘要情報または科目情報と入力した摘要情報又は科目との比較を行い、会計データの入力の精度を向上させること、を特徴とする。

また、本発明の第5の発明は、前記重複可能性判定手段によって、重複する可能性が閾値を超えた場合に、当該新たな証ひょう画像と重複する可能性のある前記登録済みの証ひょう画像を、対比して表示することにより、重複する可能性があると判定された新たな証ひょう画像の取り込みを防止することを特徴とする。

また、本発明の第6の発明は、新たに読み取った証ひょう画像と重複する可能性のある前記登録済みの証ひょう画像を、対比して表示する場合において、一方の証ひょう画像を拡大した場合に、他方を同率で拡大表示すると共に、一方の証ひょう画像をスクロールした場合に、他方のスクロールを追従させること、を特徴とする。


また、本発明の第7の発明は、新たに証ひょう画像を複数枚まとめて読み取ったとき、または連続して読み取ったときに、証ひょう画像の1つ1つの重複可能性を判定し、前記登録済みの証ひょう画像と重複している可能性のある新たに読み取った証ひょう画像が存在した場合は、複数枚まとめて、または連続して読み取った証ひょう画像を、少なくとも2以上、同時に表示させると共に、前記登録済みの証ひょう画像と重複している可能性のある新たに読み取った証ひょう画像を、他と区別して表示すること、を特徴とする。
In order to solve the above-mentioned problems, a first invention of the present invention is a system for reading a proof image and performing accounting processing, in which a character including a date and an amount is used as text from the read proof image. Character recognition means for character recognition, and image feature pattern extraction means for extracting a feature pattern of an image of information useful for accounting processing including a date, an amount, and a store name for each predetermined area; Character recognition result registration means for registering the obtained character recognition result in the storage unit, and image feature pattern registration means for registering the feature pattern of the image extracted by the feature pattern extraction means of the image in the storage unit, The character recognition means character-recognizes characters including date and amount of money as texts for the newly read out said proof image, and extracts the feature pattern of the image. The feature pattern of the image is extracted by the means, and the character recognition result of the registered proof image and the feature pattern of the image are read out from the storage unit, and the character recognition result of the new read proof image and the registered Character recognition result comparison means for comparing the character recognition result of the proof image, and an image for comparing the feature pattern of the image extracted about the new read proof image with the feature pattern of the image of the registered proof image And a combination of the comparison result by the character recognition result comparison unit and the comparison result by the feature pattern comparison unit of the image, the new proof image and the registered proof image are overlapped with each other. New possibility that is determined to have a possibility of duplication by providing a means for determining possibility of duplication Characterized in that it prevents the uptake of such testimony leopard image.
Further, according to the second aspect of the present invention, in extracting the pattern of the image of the information useful for accounting processing including the date, the amount of money, and the name of the store in each of the predetermined regions in the feature pattern extraction unit of the image The feature pattern of each image includes at least the pattern of the position and range of the region with pixels and the aspect of the bit map pattern, and the feature pattern comparison means of the image, the feature pattern aspect of the image for each predetermined region Even if there is an error in the character recognition result or the character recognition result can not be obtained by comparing the date, amount, and store name by comparing the position of the area with the pixel with the range pattern or bitmap pattern. The duplication possibility determination means determines the possibility that the information useful for the accounting process including is matched, the comparison result by the character recognition result comparison means and the image Comprehensively the comparison result by the feature pattern comparing means, determining the possibility that the overlapping, characterized by.

Further, according to the third invention of the present invention, when a plurality of proof images are read at one time, determination is made as to the possibility of duplication of each of the proof images, and a combination of the plurality of proof images is determined. And determining and outputting the possibility that the registered proof image is overlapped with a predetermined unit including daily units and weekly units.

Further, according to a fourth aspect of the present invention, at least abstract information or subject information among accounting data acquired by reading a proof image, accepting an input of contents of a transaction regarding the proof image as accounting data, In addition to the comparison process by the comparison means of the character recognition result and the comparison means of the image at the time of the input of the next accounting data, the relevant certificate is registered in association with the feature pattern of the image of the proof image. The summary information or the subject information associated with the image is compared with the input summary information or the subject to improve the accuracy of the input of the accounting data.

Further, according to a fifth aspect of the present invention, in the case where the duplication possibility determining means causes the registered evidence to possibly duplicate the new evidence image when the duplication probability exceeds a threshold. The images are displayed in contrast to prevent capture of a new proof image that is determined to have a possibility of overlapping.

The sixth invention of the present invention enlarges one proof image in the case where the registered proof image which may overlap with the newly read proof image is displayed in contrast. In this case, the other is enlarged and displayed at the same rate, and when one proof image is scrolled, the other scroll is made to follow.


In the seventh invention of the present invention, when a plurality of proof images are newly read collectively or continuously read, each duplication possibility of the proof images is determined, If there is a newly read proof image that may overlap with the registered proof image, display at least two or more proof images simultaneously read in a batch or continuously And displaying a newly read proof image that may overlap with the registered proof image separately from the others.

過去に読み取ったレシート等の画像について、文字認識結果と、領域毎に区別した画像の特徴パターンとを保存しておき、新たに読み取ったレシート等の画像の文字認識結果と画像の特徴パターンとを比較し、両方の比較結果を組み合わせて判断することで、重複する可能性を段階的に判断することができる。
これにより、日付や金額等の文字認識結果が一致していることに加え、画像の特徴パターンどうしが一致していることも加味して、重複している可能性が高いことを判定することができ、たまたま日付や金額等の文字認識結果が一致していただけで重複しているとしてユーザーに提示することはないので、ユーザーに無用な負担を掛けないで済むという効果がある。
For images such as receipts read in the past, character recognition results and feature patterns of images distinguished for each area are stored, and character recognition results of images such as receipts newly read and feature patterns of images By comparing and judging by combining both comparison results, the possibility of overlapping can be judged stepwise.
Thereby, in addition to the fact that character recognition results such as date and amount of money match, it is possible to determine that the possibility of overlapping is high in consideration of the fact that the feature patterns of the images also match. Since it is possible and presented to the user as if it happens that the character recognition results such as date and amount of money are identical and duplicated, there is an effect that the user is not burdened unnecessarily.

また、日付や金額等の文字認識結果に誤認識が含まれている場合や、文字認識に失敗してテキスト文字の全部又は一部を取得できない場合でも、日付や金額や店舗名等の画像の特徴パターンとの比較結果も併用することで、重複している可能性の判定の漏れなく行なうことができるので、重複入力することを防止する精度を向上させることができる。 In addition, even if incorrect recognition is included in the character recognition result such as date or amount, or even if the character recognition fails and all or part of the text character can not be acquired, the image of date, amount, store name, etc. By using the comparison result with the feature pattern as well, the determination of the possibility of overlapping can be performed without omission, so that the accuracy of preventing duplicate input can be improved.

また、1枚1枚のレシート等の画像の重複可能性を判定することに加え、複数枚を連続または纏めて読み取った際に、全体として重複している可能性を判定することができるので、1枚1枚の読取りの際にかすれたりして重複判定の精度が不十分な場合でも、全体として、過去に読み取ったものと重複している可能性を判定することができるので、会計事務所と顧問先の間で、レシート等の管理に漏れがあって重複読取りをしてしまったような場合に、いち早くレシート等の管理の不備による、日単位や週単位などの所定の単位毎のレシート等の重複可能性を効果的に判定することができる。
Further, in addition to determining the duplication possibility of images such as one sheet of one receipt, when reading a plurality of sheets continuously or collectively, it is possible to determine the possibility of duplication as a whole. Even if the accuracy of the duplicate determination is insufficient due to blurring at the time of reading each sheet, it is possible to determine the possibility of overlapping with what was read in the past as a whole. If there is a leak in the management of receipts etc. and duplicate readings have been made between the adviser and the adviser, receipts per predetermined unit such as daily units or weekly units due to a defect in management of receipts etc. promptly Etc. can be effectively determined.

図1−1は、本発明のシステム構成を示す図であり、端末装置10と画像取込装置50のセットを示す例である。
図1−2は、本発明のシステム構成を示す図であり、本発明の端末装置10と画像取込装置50のセットが、LAN60を介して相互に接続される場合を示す図である。
図1−3は、本発明のシステム構成を示す図であり、本発明の端末装置10と画像取込装置50のセットが、LAN60を介して、サーバー100に接続される場合を示す図である。
図1−4は、本発明のシステム構成を示す図であり、本発明の端末装置10と画像取込装置50のセットが、LANやルーター60を介して、WAN(ワイドエリアネットワーク)70の先にあるサーバー100に接続される場合を示す図である。
図1−5は、会計事務所と顧問先の間で、レシート等の画像をやりとりする際のシステム構成を示す図である。
図1−6は、会計事務所と在宅ワーカーとの間で、レシート等の画像をやりとりする際のシステム構成を示す図である。
図1−7は、企業の本店(本社)と支店等の間で、レシート等の画像をやりとりする際のシステム構成を示す図である。
図2−1は、端末装置10の機能ブロック図である。
図2−2は、サーバー100の機能ブロック図である。
図3Aは、本発明の会計処理システムの、処理内容の全体を示すフローチャートである。
図3Bは、全体処理フローのステップS3A−5の処理内容を詳細に記載した、過去に取り込んだレシート等との重複判定処理サブルーチンの処理フローを示す図である。
図3Cは、図3Bの重複判定処理サブルーチンの変形例を示す図である。
図3Dと図3Eは、図3Bの文字認識結果の比較処理と、画像の特徴パターンの比較処理をそれぞれ独立のサブルーチンにした場合の図である。
図4は、サーバー100と端末装置10が接続された状態から、端末装置10を持ち出して運用する携帯処理の処理フローを示す図である。
図5−1は、イメージ管理テーブルであり、顧問先毎や会社毎に、あるいは会社内の本店や支店や営業所等の組織毎に読み取ったレシート等の画像にイメージIDを割り当てて、そのレシート等の画像の文字認識の結果や画像の特徴パターンおよび会計データなどを対応付けて管理している様子を示す図である。
図5−2は、会計入力アプリなどを用いて生成されたデータであって、仕訳データなどの会計データのデータ構成を示す図である。
図5−3は、新たに読み込んだレシート等の画像1枚ごとに、過去に読み取ったレシート等の画像と重複している可能性を判定するためのテーブルであって、文字認識結果の比較結果と画像の特徴パターンの比較結果とを総合して判定するための重複総合判定テーブルの一例を示す図である。(1)デフォルトパターンと、(2)閾値(パラメータ)を変更した例、及び(3)顧問先毎や、会社の組織毎あるいは会社の業種毎に用意したテーブルがある。「重複:大」とは重複可能性が大であることを示すが、重複可能性が大とすることに代えて、重複している可能性を確率などの数値で表しても良く、重複している可能性が大の場合は0.9(90%)、中の場合は0.6(60%)、小の場合は0.2(20%)などの数値が割り当てられる。
図5−4は、1枚ごとの重複可能性を判定した後、複数枚まとめて、または連続で読み取ったとき、過去に読み取ったレシート等の画像の束(一定の期間あるいはある店舗での取引に関する複数のレシート等)と重複している可能性を総合的に判定するためのテーブル例を示す図である。(1)デフォルトパターンと(2)顧問先毎、会社の組織毎、あるいは業種毎に閾値(パラメータ)を変更した例を示す。
複数枚まとめて読む場合とは、フラットベットスキャナやカメラなどで10枚くらい一度に読み取る場合、あるいは1枚のシート(紙など)にレシート等を10枚くらい貼り付けてあるものを読み取る場合などがある(図8参照)。
あるいは1枚のシート(紙など)にレシート等を10枚くらい貼り付けてあるものを読み取る場合には、レシート等の画像を、それぞれ1枚ずつ切り出して、レシート等のサイズなども取得して、1枚ずつ別々に登録する。
図5−5は、会計事務所の顧問先毎や、会社の組織毎に管理するための会社マスタの一実施例を示すテーブルで、図5−5(A)は、会計事務所と顧問先間でシステムを運用する場合を示し、図5−5(B)は、本店と支店等の間で運用する場合の例を示している。
図5−6は、図3C用の重複総合判定テーブル(1枚ごとの判定用)であり、顧問先毎あるいは会社の業種毎に、判定結果イ、ロ、ハ、ニの重複可能性の数値に対し、それぞれ一定の重み付けをした、複数の判定パターンのテーブルである。
図6−1は、重複可能性が一定の閾値以上の場合のユーザーの確認画面であって、過去に読み取ったレシート等の画像と新たに読み込んだレシート等の画像とを左右に対比して確認するための画面の一例である。
左右対比は、あくまで一例であって、上下で対比したりするほか、新たに読み込んだレシート等の画像に対し、重複する可能性のあるレシート等の画像をポップアップ表示で対比できるように表示しても構わない。
図6−2は、重複可能性が一定の閾値以上の場合のユーザーの確認画面であって、いずれかのレシート等の画像を拡大表示した場合において、もう一方の画像を同じ拡大率で表示すると共に、一方の画像をスクロールすると、他方の画像も同様に自動スクロールされる様子を示す図である。
図6−3は、重複可能性が一定の閾値以上の場合のユーザーの確認画面であって、重複する可能性のある取り込み済みのレシート等が複数ある場合の例である。
図6−4は、今回新たに読み込んだ複数のレシート等の画像のうち、複数枚が、過去に読み取ったレシート等の画像と重複する場合の区別表示の例を示している。また、重複候補が多い場合は、操作者が簡易的に選別できるように重複候補をリスト形式で表示してもよい。
図6−5は、カメラやスキャナなど、どの画像取込装置を使用するかの設定、および重複判定処理を行なうか否か、および重複判定を行なう場合に、今行なうか、それとも画像を読み込んで仮登録した後に行なうかの設定を行なう画面である。
図7は、イメージ管理テーブル(図5−1)で管理しているレシート等の画像について、レシート等の画像に対する処理(テキスト等の認識処理、レシート等の画像の特徴パターンの抽出処理の内容)、および、これらの情報と、会計データ入力によって取得したデータに基づいて、品名辞書や店名辞書などを別途用意して、品名や店舗名などの情報や、勘定科目との対応付けを行なう処理の概要を示す図である。
図8は、1枚のシート(紙)に複数枚のレシート等を貼り付けて管理し、纏めて読み取る場合の例である。
FIG. 1A is a diagram showing a system configuration of the present invention, and is an example showing a set of a terminal device 10 and an image capturing device 50. As shown in FIG.
FIG. 1B is a diagram showing a system configuration of the present invention, and shows a case where sets of the terminal device 10 and the image capturing device 50 of the present invention are mutually connected via the LAN 60.
FIG. 1-3 is a diagram showing a system configuration of the present invention, showing a case where a set of the terminal device 10 and the image capturing device 50 of the present invention is connected to the server 100 via the LAN 60. .
1-4 is a view showing a system configuration of the present invention, and a set of the terminal device 10 and the image capturing device 50 of the present invention is a point of a WAN (wide area network) 70 via a LAN or a router 60. It is a figure which shows the case where it connects to the server 100 in FIG.
FIGS. 1-5 is a figure which shows the system configuration | structure at the time of exchanging images, such as a receipt, between an accounting office and an advisor.
1-6 is a figure which shows the system configuration | structure at the time of exchanging images, such as a receipt, between an accounting office and a home worker.
FIG. 1-7 is a diagram showing a system configuration when exchanging an image such as a receipt between a head office (head office) of a company and a branch office or the like.
FIG. 2A is a functional block diagram of the terminal device 10.
FIG. 2B is a functional block diagram of the server 100.
FIG. 3A is a flowchart showing the entire processing contents of the accounting system of the present invention.
FIG. 3B is a diagram showing a processing flow of an overlap determination processing subroutine with a receipt or the like captured in the past, in which the processing content of step S3A-5 of the entire processing flow is described in detail.
FIG. 3C is a diagram showing a modification of the overlap determination processing subroutine of FIG. 3B.
FIGS. 3D and 3E are diagrams in the case where the comparison processing of the character recognition result of FIG. 3B and the comparison processing of the feature patterns of the image are respectively independent subroutines.
FIG. 4 is a diagram showing a processing flow of portable processing in which the terminal device 10 is brought out for operation from the state where the server 100 and the terminal device 10 are connected.
Fig. 5-1 shows an image management table, which assigns an image ID to an image such as a receipt read for each adviser or company, or for each organization such as a head office, branch or sales office within the company, and receives the receipt. , Etc. are shown in association with each other as a result of character recognition of an image, a feature pattern of the image, accounting data, and the like.
FIG. 5-2 is data generated using an accounting input application or the like, and is a diagram showing a data configuration of accounting data such as journal data.
FIG. 5C is a table for determining the possibility of overlapping with an image such as a receipt read in the past, for each image of a newly read receipt etc., and a comparison result of character recognition results It is a figure which shows an example of the duplication synthetic | combination determination table for combining and determining with and the comparison result of the feature pattern of an image. There are (1) default patterns, (2) an example where threshold values (parameters) are changed, and (3) tables prepared for each adviser, each organization of a company, or each industry of a company. “Duplicate: large” indicates that the possibility of duplication is large, but instead of making the possibility of duplication large, the possibility of duplication may be represented by a numerical value such as probability, or duplication If the possibility is high, a numerical value such as 0.9 (90%), medium (0.6), or 0.2 (20%) will be allocated.
Fig. 5-4 shows a bundle of images such as receipts read in the past (a transaction in a certain period or a certain store, when a plurality of sheets are read collectively or continuously after determining the possibility of duplication for each sheet) Is a diagram showing an example of a table for comprehensively determining the possibility of overlapping with a plurality of receipts etc.). An example is shown in which the threshold (parameter) is changed for (1) default pattern and (2) for each adviser, for each organization of a company, or for each type of industry.
When reading multiple sheets at once, when reading about 10 sheets at once with a flatbed scanner or camera, or when reading a sheet with about 10 receipts etc. on a sheet (paper etc.), etc. There is (see FIG. 8).
Alternatively, when reading a sheet with about 10 receipts etc. attached to one sheet (paper etc.), cut out one image each of the receipt etc. and acquire the size etc. of the receipt etc. Register one by one separately.
FIG. 5-5 is a table showing an embodiment of a company master for managing for each accounting firm adviser and company organization, and FIG. 5-5 (A) is an accounting firm and adviser FIG. 5-5 (B) shows an example in which the system is operated between the head office and the branch office.
Fig. 5-6 is a table of overlapping comprehensive judgment for Fig. 3C (for judgment for each sheet), and for each adviser or for each type of business of the company, numerical values of the judgment results of the judgment results i, b, c and d. The table is a table of a plurality of determination patterns, each of which has a certain weight.
FIG. 6-1 is a confirmation screen of the user in the case where the possibility of duplication is equal to or higher than a certain threshold value, and the image of the receipt read in the past and the image of the newly read receipt etc. It is an example of the screen for doing.
Contrasting the left and right is only an example, and in addition to contrasting in the top and bottom, a pop-up display of images such as receipts that may overlap with the newly read images such as receipts can be displayed. I don't care.
FIG. 6-2 is a confirmation screen of the user in the case where the duplication possibility is equal to or more than a certain threshold, and in the case where an image such as a receipt is enlarged, the other image is displayed at the same magnification In addition, when one image is scrolled, the other image is similarly scrolled automatically.
FIG. 6C is a confirmation screen of the user in the case where the possibility of duplication is equal to or more than a certain threshold, and is an example in the case where there are a plurality of received receipts and the like which may be duplicated.
FIG. 6-4 shows an example of a distinguishable display in the case where a plurality of sheets of a plurality of images such as receipts newly read this time overlap with an image such as a receipt read in the past. If there are many duplicate candidates, the duplicate candidates may be displayed in a list format so that the operator can easily select.
Fig. 6-5 shows which image capture device to use, such as a camera or scanner, and whether or not to perform overlap determination processing, and whether to perform overlap determination now, or to read an image. It is a screen for setting whether to perform after temporary registration.
FIG. 7 shows a process for an image such as a receipt, etc., regarding an image such as a receipt managed in the image management table (FIG. 5-1) (content of recognition process of text etc., extraction process of feature pattern of image such as receipt) And, based on these information and data acquired by input of accounting data, separately prepare item name dictionary and store name dictionary etc., and processing such as information such as item name and store name and association with account items It is a figure showing an outline.
FIG. 8 shows an example of a case where a plurality of receipts and the like are attached to one sheet (paper) and managed, and collectively read.

[用語の説明]
証ひょうとは、レシート、領収書、領収書や伝票、クレジットカードの利用明細、通帳のコピーなど、取引の内容及び取引があった事実を証明する資料であり、原始証憑などと呼ばれることもある。紙媒体のほか、イメージで取得する場合を含む。
会計データとは、取引の情報、取引の情報から勘定科目などを確定させた仕訳データ、その他の会計処理に用いられる情報をいう。取引の日付や金額、品名や数量、店名のほか、どういう経緯や内容の取引であるかを示す摘要、勘定科目などを含む概念である。
会計データDBとは、会計データを格納しておくデータベースである。
会計事務所とは、税理士や会計士および職員によって運営され、会計専門知識を持つ専門家が所属する会計事務処理を行う会計専門家組織をいう。
顧問先とは、会計事務所との契約又は業務委託などにより、会計税務処理や会計税務処理にかかわる指導やサービスを受ける個人や個人事業主をいう。
本店等とは、一企業内の本社や本店のほかグループ企業内の親会社を含む概念である。
支店等とは、一企業内の支社や支店のほかグループ企業内の子会社を含む。支店等には事業所、営業所を含む概念である。また、企業の各部門などの概念も含み、要するに企業の各組織を示す用語である。なお、本支店間の会計処理においては、本店等では、会計知識を有する経理部門等に所属する者による会計データ入力などの会計処理が行なわれ、支店等では会計知識を有しない者による取引データの入力などが行なわれることが多い。
在宅ワーカー(在宅者)とは、自宅等の会計事務所外の場所で会計処理等の業務を行う会計事務所の先生や職員が、会計処理業務のうちの一部を委託された場合の外部の業者ないし個人事業主等をいう。
監査とは、会計事務所が顧問先の会計データを月次(月毎)あるいは4半期ないし半期ないし1会計期間ごとに、会計基準や税法に則しているかどうかを確認して、適宜修正等することをいう。会計事務所の税理士や会計士等の先生や職員の場合は、会計監査として、会計システムで表示された会計データに対し、検証(チェック)を行い、検証の結果、必要に応じて会計データの修正等を行ないながら、会計システムに表示されている会計データ(日付、科目、金額、取引情報等)の適切性を確認する。
イメージ管理DBとは、レシート等の画像にIDを割り振って、顧問先毎や会社毎に、あるいは会社内の本店や支店や営業所等の組織毎に管理し、レシート等の画像の文字認識結果や特徴パターンおよび会計データ入力によって取得したデータとの対応付けを行なうデータベースである。その内容は図5−1のイメージ管理テーブルに記載する。

1枚ごとの重複可能性の閾値とは、図5−3に示すように、文字認識の比較結果と画像の特徴パターンの比較結果との組み合わせによって、重複している可能性が「高い、中程度、低い、殆ど無い」などと、段階的に区別できる場合において、例えば、重複して可能性が「中程度」を閾値として、これを超える場合に、図6−1〜図6−4のように重複する可能性のあるレシート等の画像をユーザーに提示する。

複数枚まとめての判定するための重複可能性の閾値とは、図5−4に示すように、複数枚まとめて、または連続で読み取ったとき、読み込んだレシート等の画像について、全体として、過去に登録したレシート等の画像と重複している可能性が高いかどうかを判定するための閾値であって、例えば、新たにレシート等の画像を10枚読み込んだ中で、重複している可能性が中程度以上のものが2枚以上あった場合には、そういうことは希であるはずなので、この「2枚以上(あるいは2割以上など)」を閾値とし、この閾値を超える場合に、全体として、重複している可能性が高いと判定する。

実際には重複していないのに重複していると誤判定する場合には、日付や金額等の文字認識結果について誤認識した場合に、金額や日付等の桁数が合致していることにより画像の特徴パターンが同じであると判定されたような場合がある。具体的には、出先で同じタクシー会社を利用して、移動をくり返し、かつ金額の桁数が同じ場合や、同じ店舗で同じ品物を複数回購入した場合には、日付や金額や店名などの画像の特徴パターンが似ていることにより、文字認識結果に誤認識した場合は、重複している可能性があると判定される。
レシート等の画像の文字認識結果を取得できない場合や、誤認識する場合には、印刷状態が悪く、文字や店名などがかすれている場合のほか、スキャナで紙詰まりを起こしてレシート等の用紙が折れたりシワができたり破れてしまった場合などがある。
このような利用環境で重複の有無を正確に判断するため、1枚ごとの重複可能性の閾値及び、複数枚まとめての判定するための重複可能性の閾値を調整することもできる(図3A及び図3C 後述)。
[Explanation of terms]
Proof is a document that proves the details of the transaction and the fact of the transaction, such as receipts, receipts, receipts and vouchers, credit card statement details, copy of passbook, etc., and may be called primitive vouchers etc. . In addition to paper media, this includes cases of image acquisition.
Accounting data refers to information on transactions, journal data in which account items are determined from information on transactions, and other information used for accounting. It is a concept that includes the date and amount of the transaction, the item name and quantity, the store name, as well as an abstract indicating what kind of process and content the transaction is, account items, and the like.
The accounting data DB is a database for storing accounting data.
An accounting firm is an accounting professional organization that is operated by a tax accountant, an accountant, and staff members, and performs accounting processing to which a specialist with accounting expertise belongs.
An adviser refers to an individual or an individual business owner who receives guidance and services related to accounting tax processing and accounting tax processing by a contract with an accounting office or outsourcing.
The head office etc. is a concept including the head office in one company and the parent company in the group company besides the head office.
Branches, etc. include branch offices and branches within one company and subsidiaries within group companies. The concept of branch offices includes business offices and sales offices. It also includes the concept of each department of a company, which is a term that indicates each organization of a company. In addition, in the accounting process between branch offices, accounting processes such as accounting data input are performed by those who belong to the accounting department having accounting knowledge in the head office etc. Transaction data by persons who do not have accounting knowledge in the branch office etc. Input is often performed.
An at-home worker (home-based person) means that an accounting office teacher or staff who performs accounting work at a place outside the accounting office such as a home is outsourced when part of the accounting work is outsourced Company or private business owner etc.
An audit refers to whether the accounting firm checks the accounting data of the adviser on a monthly basis (monthly basis) or quarterly accounting period to quarterly accounting period and whether it complies with accounting standards and tax laws, and revises them as appropriate. Say what to do. In the case of an accounting firm's tax accountant or a teacher or staff member such as an accountant, as accounting audit, the accounting data displayed in the accounting system is verified (checked), and as a result of verification, correction of accounting data as necessary Check the appropriateness of the accounting data (date, items, amount, transaction information, etc.) displayed in the accounting system while conducting etc.
The image management DB assigns IDs to images such as receipts, and manages them for each adviser or company, or for each organization such as head office, branch or sales office within the company, and results of character recognition of images such as receipts This is a database for correlating with feature patterns and data acquired by inputting accounting data. The contents are described in the image management table of FIG. 5-1.

As shown in FIG. 5-3, the threshold value of duplication possibility for each sheet is “high, middle, and high possibility of duplication” by the combination of the comparison result of the character recognition and the comparison result of the feature pattern of the image. In the case where it is possible to distinguish stepwise, for example, from “degree, low, almost nothing”, for example, in the case where the possibility exceeds “middle” as the threshold, for example, FIG. Present the user with images such as receipts that may overlap.

The threshold value of overlap possibility for determining a plurality of sheets collectively is, as shown in FIG. 5-4, a whole of the past as to an image such as a read receipt when the plurality of sheets are read collectively or continuously. A threshold value for determining whether there is a high possibility of overlapping with an image such as a receipt registered, for example, the possibility of overlapping among 10 images newly read such as a receipt If there are two or more cards with medium or higher, such should be rare, so if this "two or more (or 20% or more, etc.)" is the threshold, and this threshold is exceeded, the whole It is determined that there is a high possibility of duplication.

When it is misjudged as overlapping even though they are not actually overlapping, the number of digits such as the amount of money or the date matches when the character recognition result such as date or amount of money is misrecognized There are cases where it is determined that the feature patterns of the images are the same. Specifically, if you use the same taxi company on the go, repeat the move, and if the number of digits in the amount is the same, or if you purchase the same item multiple times in the same store, such as date, amount, store name, etc. If the character recognition result is misrecognized due to the similarity of the feature patterns of the images, it is determined that there is a possibility of overlapping.
In addition to the case where print condition is bad and characters and shop name are faint when character recognition results of images such as receipts can not be acquired or misrecognized, paper jams occur with the scanner and paper such as receipts In some cases, it may break, wrinkle or break.
In order to accurately determine the presence or absence of duplication in such a usage environment, it is also possible to adjust the threshold of the duplication possibility for each sheet and the threshold of the duplication possibility for determining a plurality of sheets collectively (FIG. 3A) And FIG. 3C described later).

[会計処理システムの一実施例の構成]
図1−1は、本発明の端末装置10と画像取込装置50のセットを示す例であり、画像取込装置50は、モバイル機器などの端末装置10内に構成されたカメラであってもよい。
この態様は、主に、会計事務所の職員や企業等の経理担当者などが、スタンドアローンとしての端末装置を用いて、会計データ入力する場合を想定している。
例えば、会計事務所の職員顧問先企業のレシート等を預かって、会計データ入力する場合や、顧問先企業に端末装置(ノートタイプやモバイル)を持ち込んで、顧問先で会計データ入力する場合や、企業の経理担当者が、自社の取引で発生したレシートや伝票などを、会計データ入力する場合である。
[Configuration of One Embodiment of Accounting System]
FIG. 1A is an example showing a set of the terminal device 10 and the image capturing device 50 of the present invention, and the image capturing device 50 may be a camera configured in the terminal device 10 such as a mobile device. Good.
In this aspect, it is mainly assumed that staff of accounting firm or accounting personnel such as companies input accounting data using a terminal device as a stand-alone.
For example, when receiving receipts of a staff adviser company of an accounting firm and entering accounting data, or when bringing a terminal device (note type or mobile) to the adviser company and entering accounting data at an adviser site, This is a case where a person in charge of accounting in a company inputs accounting data, such as receipts and slips generated in their own transactions.

図1−2は、本発明の端末装置10と画像取込装置50(図1−1を参照)のセットが、LAN60を介して相互に接続され、読み取ったレシート等の画像などを共有するような場合を示す図である。
図1−3は、本発明の端末装置10と画像取込装置50のセットが、LAN60を介して、サーバー100に接続され、読み取ったレシート等の画像などをサーバー100の記憶部内で管理するような場合を示す図である。サーバー100は実サーバーの他、仮想サーバーなどを含むものとする。
図1−3の場合において、端末装置10は、LAN60やサーバー100に接続したまま、レシート等を読み取るほか、LAN60やサーバー100から切り離して、顧問先企業や支店等に持ち込んで、レシート等を読み取ることがあるものとする。
なお、サーバー100に無線LANやWANなどのインターフェースを介して、画像取込装置50を接続して、レシート等の画像をアップロードするようにしても良い。
In FIG. 1-2, a set of the terminal device 10 and the image capturing device 50 (see FIG. 1-1) of the present invention are mutually connected via the LAN 60 to share an image such as a read receipt etc. It is a figure which shows a case.
In FIGS. 1-3, a set of the terminal device 10 and the image capturing device 50 of the present invention is connected to the server 100 via the LAN 60, and manages an image such as a read receipt etc. in the storage unit of the server 100. It is a figure which shows a case. The server 100 includes a virtual server and the like in addition to a real server.
In the case of FIG. 1-3, the terminal device 10 reads receipts and the like while being connected to the LAN 60 and the server 100, separates from the LAN 60 and the server 100, and brings it to a consulting company or branch office to read receipts and the like. Suppose that there is something.
The image capturing apparatus 50 may be connected to the server 100 via an interface such as a wireless LAN or WAN to upload an image such as a receipt.

図1−4は、本発明の端末装置10と画像取込装置50のセットが、LANやルーター60を介して、WAN(ワイドエリアネットワーク)70の先にあるサーバー100に接続され、読み取ったレシート等の画像などをサーバー100の記憶部内で管理するような場合を想定している。また、サーバー100に、端末装置10および画像取込装置50を接続して、読み取ったレシート等の画像の重複判定と、レシート等の画像の登録を行なうようにしても良い。
この構成では、LANシステム構成の側が、会計事務所のシステムの場合の他、会計事務所の職員が、顧問先企業に出向いていた場合において、持ち込んだ端末装置10をWAN70の先のサーバー100に接続して、サーバー100の記憶部内でレシート等の画像を管理することができる。
なお、図示はしないが、LANシステム内の端末装置10は、さらにサーバー装置に接続され、サーバー装置を介して、ネットワーク(WAN70)の先にあるサーバー100に接続されるようにしてもよい。
1-4, a set of the terminal device 10 and the image capturing device 50 according to the present invention is connected to the server 100 at the end of a wide area network (WAN) 70 via a LAN or a router 60, and the receipt is read. And the like are managed in the storage unit of the server 100. Alternatively, the terminal device 10 and the image capturing device 50 may be connected to the server 100 to determine whether an image such as a read receipt is duplicated and to register an image such as a receipt.
In this configuration, in the case where the LAN system configuration side is not the accounting office system, but the accounting office staff is visiting the adviser company, the terminal device 10 brought in to the server 100 on the WAN 70 side. By connecting, an image such as a receipt can be managed in the storage unit of the server 100.
Although not illustrated, the terminal device 10 in the LAN system may be further connected to a server device, and may be connected to the server 100 located beyond the network (WAN 70) via the server device.

あるいは、LANシステム構成の側が、顧問先企業のシステムであって、レシート等を読み取って、WAN70の先の会計事務所のサーバー100にレシート等の画像を登録するようにしても良い。このほか、LANシステム構成の側が、在宅ワーカーや外注業者あるいは企業内の各組織のシステムであってもよい。
サーバー100は、会計事務所内のサーバーであってもよく、クラウドやIDC(インターネットデータセンター)の実サーバーであってもよいし、仮想サーバーであってもよい。この場合において、会計事務所の職員は、サーバー100に接続された端末装置10を用いて、顧問先企業から送付されたレシート等の画像を表示しながら、会計データ入力することができる。
Alternatively, the side of the LAN system configuration may be a system of an adviser company, which may read a receipt or the like and register an image such as the receipt or the like in the server 100 of the accounting office ahead of the WAN 70. Besides, the LAN system configuration may be a system of a home worker, an outsourcing company, or each organization in a company.
The server 100 may be a server in an accounting office, may be a real server of a cloud or an IDC (Internet data center), or may be a virtual server. In this case, the staff of the accounting office can use the terminal device 10 connected to the server 100 to input accounting data while displaying an image such as a receipt sent from the adviser company.

あるいは、LANシステム構成の側が、企業の支店等のシステムであってWAN70の先のサーバー100が本店等に設置されたサーバーであってもよい。この場合、支店等の担当者がレシート等を端末装置10で読み取って、サーバー100の記憶部に保存する。そして、企業の本店等の経理担当者が本店側のサーバー100に接続された端末装置10を用いて、会計データ入力する。
Alternatively, the side of the LAN system configuration may be a system such as a branch office of a company, and the server 100 ahead of the WAN 70 may be a server installed in a head office or the like. In this case, a person in charge at a branch office or the like reads a receipt or the like by the terminal device 10 and stores it in the storage unit of the server 100. Then, a person in charge of accounting, such as the head office of a company, inputs accounting data using the terminal device 10 connected to the server 100 on the head office side.

図1−5は、会計事務所と顧問先の間で、WAN70を介して、レシート等の画像をやりとりする際のシステム構成を示す図である。この場合において、レシート等の画像を読み込んでサーバー100の記憶部に格納するのは、顧問先の端末装置10の場合の他、会計事務所の端末装置10をサーバー100から切り離して、顧問先に持ち込んで読み取った後、会計事務所に戻ってから、再び、サーバー100に接続して、サーバー100の記憶部に格納するようにしても良い。
FIGS. 1-5 is a figure which shows the system configuration at the time of exchanging images, such as a receipt, via WAN70 between an accounting office and an adviser. In this case, reading an image such as a receipt and storing it in the storage unit of the server 100 separates the terminal device 10 of the accounting office from the server 100 in addition to the case of the terminal device 10 of the advisor. After bringing it in and reading it, after returning to the accounting office, it may be connected to the server 100 again and stored in the storage unit of the server 100.

図1−6は、会計事務所と在宅ワーカーとの間で、WAN70を介して、レシート等の画像をやりとりする際のシステム構成を示す図である。在宅ワーカーは、会計事務所の職員の他、外部の業者ないし個人事業主等の場合がある。外部の業者ないし個人事業主等の場合、会計事務所側で顧問先毎のレシート等の画像について重複判定しない状態でサーバーに暫定的に格納して、重複判定および会計データ入力を在宅ワーカーの端末で行なう。
FIGS. 1-6 is a figure which shows the system configuration | structure at the time of exchanging images, such as a receipt, via WAN70 between an accounting office and a home worker. The home worker may be an external contractor or a sole proprietor in addition to the staff of the accounting office. In the case of an external trader or an individual business owner, the accounting office temporarily stores the receipt image etc. for each adviser in the server without making a duplicate judgment, and stores the duplicate judgment and the accounting data input at the terminal of the home worker Do with

図1−7は、企業の本店(本社)と支店等の間で、WAN70を介して、レシート等の画像をやりとりする際のシステム構成を示す図である。この場合において、レシート等の画像を読み込んでサーバー100の記憶部に格納するのは、支店等の端末装置10の場合の他、本店(本社)の端末装置10をサーバー100から切り離して、支店等に持ち込んで読み取った後、本店に戻ってから、再び、サーバー100に接続して、サーバー100の記憶部に格納するようにしても良い。
FIG. 1-7 is a diagram showing a system configuration when exchanging an image such as a receipt between the head office (head office) of a company and a branch office via the WAN 70. In this case, reading an image such as a receipt and storing it in the storage unit of the server 100 separates the terminal device 10 of the head office (head office) from the server 100, in addition to the terminal device 10 such as a branch After bringing it in and reading it, after returning to the main store, it may be connected to the server 100 again and stored in the storage unit of the server 100.

図2−1は、端末装置10の機能ブロック図である。
端末装置10では、通信部16を介して接続された画像取込装置50又は、内蔵のカメラなどの画像取込部12により、レシート等の画像を読み込んで、制御部14のOCR処理部で抽出されたテキスト文字について文字認識処理を行なうと共に、画像の特徴パターン抽出部により、レシート等の領域毎に、画像の特徴パターンを抽出する。
そして、文字認識処理で取得した文字認識結果と、画像の特徴パターン抽出部で取得した画像の特徴パターンをレシート等の画像と関連付けて、記憶部15に登録すると共に、重複可能性判定部により、過去に取り込んだレシート等の画像の文字認識結果および画像の特徴パターンと比較して、新たに読み取ったレシート等の画像が、過去に登録したレシート等の画像と重複している可能性を判定して、表示画像制御部により出力部13を介して、ユーザーに提示する。
FIG. 2A is a functional block diagram of the terminal device 10.
In the terminal device 10, an image such as a receipt is read by the image capturing device 50 connected via the communication unit 16 or the image capturing unit 12 such as a built-in camera, and extracted by the OCR processing unit of the control unit 14. The character recognition process is performed on the text character, and the feature pattern extraction unit of the image extracts the feature pattern of the image for each area such as a receipt.
Then, the character recognition result obtained by the character recognition processing and the feature pattern of the image obtained by the feature pattern extraction unit of the image are associated with the image such as a receipt and registered in the storage unit 15, and the overlap possibility determination unit Compared with character recognition results of images such as receipts captured in the past and feature patterns of images, it is determined whether an image such as a newly read receipt overlaps an image such as a receipt registered in the past Then, the image is presented to the user via the output unit 13 by the display image control unit.

制御部の各機能を実行するそれぞれの処理部は、CPU(中央処理装置)が、HDDなどの記憶部に記憶されたプログラムを、DRAMやSRAMなどで構成されたメインメモリにロードして、CPU(中央処理装置)がプログラムの各ステップを実行することで実現される。
In each processing unit that executes each function of the control unit, a CPU (central processing unit) loads a program stored in a storage unit such as an HDD into a main memory configured by DRAM, SRAM, etc. (Central processing unit) is implemented by executing each step of the program.

図2−2は、サーバー100の機能ブロック図である。
サーバー100は、実サーバーのほか仮想サーバーその他のクラウドであってもよい。
サーバー100では、端末装置10で読み取ったレシート等の画像を、通信部160を介して受信して、記憶部150に保存すると共に、端末装置10の操作に応じて、制御部140のOCR処理部で抽出されたテキスト文字について文字認識処理を行なうと共に、画像の特徴パターン抽出部により、レシート等の領域毎に、画像の特徴パターンを抽出する。
そして、文字認識処理で取得した文字認識結果と、画像の特徴パターン抽出部で取得した画像の特徴パターンをレシート等の画像と関連付けて、記憶部150に登録すると共に、重複可能性判定部により、過去に取り込んだレシート等の画像の文字認識結果および画像の特徴パターンと比較して、新たに読み取ったレシート等の画像が、過去に登録したレシート等の画像と重複している可能性を判定し、重複している可能性の判定結果を記憶部150に保存する。
重複している可能性の判定結果は、WAN70やLAN60のネットワークを介して、端末装置10の表示部で表示される。


[全体処理フロー]
FIG. 2B is a functional block diagram of the server 100.
The server 100 may be a real server or a virtual server or other cloud.
The server 100 receives an image such as a receipt read by the terminal device 10 via the communication unit 160, stores the image in the storage unit 150, and the OCR processing unit of the control unit 140 according to the operation of the terminal device 10. The character recognition process is performed on the text characters extracted in the above, and the feature pattern extraction unit of the image extracts the feature pattern of the image for each area such as a receipt.
Then, the character recognition result obtained in the character recognition process and the feature pattern of the image obtained by the feature pattern extraction unit of the image are associated with the image such as a receipt and registered in the storage unit 150, and the overlap possibility determination unit Compared with character recognition results of images such as receipts captured in the past and feature patterns of images, it is determined whether an image such as a newly read receipt overlaps an image such as a receipt registered in the past The determination result of the possibility of duplication is stored in the storage unit 150.
The determination result of the possibility of duplication is displayed on the display unit of the terminal device 10 via the network of the WAN 70 or the LAN 60.


[Overall processing flow]

図3Aは、本発明の会計処理システムの、処理内容の全体を示すフローチャートである。
レシート等の画像は、会計事務所にとっての顧問先毎、あるいは本店にとっての支店毎に管理されており、その管理のために会社マスタが用意されている。
以下、主に、会計事務所が顧問先の会計専門サービスを行なう場合を例に説明するが、本店と支店の関係に置き換えても同様である。
FIG. 3A is a flowchart showing the entire processing contents of the accounting system of the present invention.
Images such as receipts are managed for each adviser for the accounting office or for each branch for the head office, and a company master is prepared for the management.
The following description will be mainly made on the assumption that the accounting firm performs accounting special services for the adviser, but the same is true for the relationship between the head office and the branch office.

図3Aにおいて、まず、処理対象の顧問先を選択し(ステップS3A−1)、所定の枚数のレシート等を読み込む(ステップS3A−2)。
所定の枚数のレシート等の読み込みを終えると(ステップS3A−3)、レシート等に印字されている文字列をテキストとして把握するための文字認識処理(OCR処理)を行なうと共に、印字されているロゴなどの店名や、品名、数量、金額、年月日などの画像の特徴パターンを、ビットマップ画像ないし始点と終点の座標や矩形領域の位置や範囲の情報(以下、画像の特徴パターン)として抽出する処理を行なう(ステップS3A−4)。
In FIG. 3A, first, an adviser to be processed is selected (step S3A-1), and a predetermined number of receipts and the like are read (step S3A-2).
After reading a predetermined number of receipts and the like (step S3A-3), character recognition processing (OCR processing) for grasping the character string printed on the receipt etc as text is performed, and the printed logo is displayed. Etc. Extract the store name such as, item name, quantity, amount of money, image feature pattern such as date, as a bitmap image or coordinates of start point and end point, position or range information of rectangular area (hereinafter, feature pattern of image) Processing is performed (step S3A-4).

なお、ステップS3A−2からステップS3A−3のレシート等の画像の読取り処理およびステップS3A−4のテキスト等の文字認識処理と画像の特徴パターンの抽出処理は、それぞれ独立して行なうことにしても構わないし、レシート等の画像の読み込みと文字認識結果及び抽出した画像の特徴パターンの登録処理と、重複判定処理は連続して行なってもよいし、レシート等の画像や文字認識結果及び抽出した画像の特徴パターンの登録処理後に重複判定処理を行なうようにしても良い。
この重複判定処理を適用するかどうか、いつ適用するかの設定画面の様子を、図6−5に示す。
図6−5によれば、端末装置10で使用する画像取込装置50の種類(内蔵カメラ、外付けのスキャナなど)の設定、および、重複判定処理を行なうかどうか、重複判定処理を行なう場合に、新たなレシート等の画像を読み取っている「今行なう」か、それともレシート等の画像を読み取って、一時、記憶部に仮登録した「後に(別途)行なうか」などの設定を行なうことができる。
この重複判定処理の設定を「後に(別途)行なうか」と設定した場合は、図5−1のイメージ管理テーブルに、重複判定を後で行なうフラグを立てて、レシート等の画像を本登録する際に、当該フラグで重複判定処理を自動実行したり、あるいは重複判定処理の実行を促す画面表示を行なう(図示せず)。
The reading process of an image such as a receipt from step S3A-2 to step S3A-3 and the character recognition process such as text of step S3A-4 and the extraction process of a feature pattern of an image may be performed independently of each other. The reading of an image such as a receipt, registration processing of character recognition results and feature patterns of extracted images, and overlap judgment processing may be performed continuously, and an image such as a receipt or character recognition result and an extracted image The overlap determination process may be performed after the registration process of the feature pattern of.
The state of the setting screen of whether or not to apply this duplication determination process is shown in FIG. 6-5.
According to FIG. 6-5, when performing the duplication determination process whether to set the type (built-in camera, external scanner, etc.) of the image capture device 50 used in the terminal device 10, and whether to perform the duplication determination process. Setting “read now” or “read later (separately)” temporarily reading an image such as a receipt and temporarily storing it in a storage unit. it can.
If it is set to "do later (separately) do the setting of the overlap determination processing", a flag is set in the image management table of FIG. At the time, a duplicate determination process is automatically executed with the flag, or a screen is displayed to urge execution of the duplicate determination process (not shown).

図7に示すように、画像の特徴パターンの一具体例としては、レシート等の上部から順に、会社名などのロゴ領域、店舗名や電話番号、担当者、取引の年月日、品名、数量、金額、バーコードなどが、各段落ないし領域毎に印刷されているのを、それぞれビットマップ画像ないし始点と終点の座標や矩形領域の位置や範囲の情報として取得したものである。なお、取引内容として会社名、電話番号、担当者、取引の年月日、品名、数量、金額や店舗名の他に他部署名や取引先名、支社や営業所等の名前も含まれる。
ここで、例えば、年月日や金額の画像の特徴パターンは、その幅に日付や金額の桁数などが反映された特徴を有しており、画像の特徴パターンの比較において、このような特徴を比較することで、同一の取引内容であるかどうかの判断指標とすることができる。
なお、画像の特徴パターンとしては、領域毎の部分的な画像の特徴パターンのほか、レシート等の全体を把握した特徴パターンがあり、図7の右側に、特徴パターン(全体)のように一例を示している。
As shown in FIG. 7, as one specific example of the feature pattern of the image, logo areas such as company name, store name and phone number, person in charge, date of transaction, item name, quantity, in order from the top of the receipt etc. The amount of money, the bar code, and the like are printed for each paragraph or region, respectively, as bitmap image, coordinates of start point and end point, and information of position and range of rectangular region. The contents of the transaction include company name, telephone number, person in charge, date of transaction, item name, quantity, amount and store name, as well as other department signatures, supplier names, and names of branch offices and sales offices.
Here, for example, the feature pattern of the image of the date and the amount of money has a feature in which the number of digits of the date and the amount of money is reflected in the width, and in the comparison of the feature pattern of the image Can be used as a judgment index as to whether the contents of the transaction are the same.
As a feature pattern of an image, there is a feature pattern obtained by grasping the whole of a receipt or the like in addition to a feature pattern of a partial image for each region, and an example is shown on the right side of FIG. It shows.

ここで、画像の特徴パターンの抽出処理は、ロゴなどの店名や、品名、数量、金額、年月日などの属性を把握した上で行なうようにしても良いし、特に個々の画像の特徴パターンの属性を把握せずに、おおまかに、上段は何、中段は何、という大まかな把握の他、何らかの店名ないし品名等の会計処理に有用な情報のいずれかであるという把握の仕方で個々の画像の特徴パターンの属性を問わずに画像の特徴パターンを抽出するようにしても良い。
個々のロゴなどの店名や、品名、数量、金額、年月日などの属性を正確に把握して重複判定できるのが理想的ではあるが、文字のカスレ等により文字認識に失敗したり文字認識の精度が低い場合には、逆に重複判定ができないことになるので、本発明では、文字認識に失敗したり文字認識の精度が低く、店名や、品名、数量、金額、年月日などの属性を把握できないようなケースを想定して、重複判定ができる範囲を広げる趣旨である。
また、画像の特徴パターンとしては、カラー情報も利用することができる。
Here, the extraction process of the feature pattern of the image may be performed after grasping the store name such as the logo, and the attribute such as the item name, the quantity, the amount, the price, the date, etc. In addition to the rough grasp of what the upper row is what, and the middle row what, without grasping the attribute of the individual, it is an individual's grasping method of information useful for accounting processing of any store name or item name etc. The feature pattern of the image may be extracted regardless of the attribute of the feature pattern of the image.
Ideally, it is possible to accurately identify and identify shop names such as individual logos, item names, quantities, amounts, amounts of money, dates, and other attributes, but it is ideally possible to make duplicate determinations, but character recognition failure or character recognition due to character blur etc. In the present invention, the character recognition fails or the character recognition accuracy is low, and the shop name, the item name, the quantity, the amount, the date, etc. is low. This is intended to expand the range in which duplicate determination can be performed, assuming a case where the attribute can not be grasped.
In addition, color information can also be used as the feature pattern of the image.

なお、画像の特徴パターンは、上記及び図5−1のイメージ管理テーブルで例示したものに限られず、画像の特徴を表すものであれば何でも構わない。もちろん、レシート等の外形サイズも含まれる。外形サイズは、品数が増えるとそれに対応して増大するほか、店舗や取引先毎にユニークなサイズを採用しているので、特徴を良く表現しているからである。
また、画像の特徴パターンは、例示した中の、いずれか1つ以上を使用すれば良く、複数を組み合わせることで判定の精度が向上していく。
The feature pattern of the image is not limited to the one exemplified in the image management table described above and in FIG. 5-1, and any feature pattern may be used as long as it represents the feature of the image. Of course, the external size of a receipt etc. is also included. The external size increases correspondingly as the number of products increases, and a unique size is adopted for each store and customer, so that the features are well expressed.
In addition, any one or more of the illustrated feature patterns may be used as the feature pattern of the image, and the accuracy of the determination is improved by combining a plurality.

図3AのステップS3A−4の文字認識処理、画像の特徴パターンの抽出処理を終えると、過去に読み取ったレシート等の画像との重複判定処理のサブルーチンをコールして実行(ステップS3A−5)。
重複判定処理のサブルーチンの詳細は後述する。
When the character recognition process of step S3A-4 in FIG. 3A and the extraction process of the feature pattern of the image are finished, a subroutine of overlap determination process with an image such as a receipt read in the past is called and executed (step S3A-5).
Details of the subroutine of the overlap determination process will be described later.

読み込んだ所定の枚数のレシート等について、重複判定処理が終了すると、ユーザーに、重複している可能性が一定の閾値を超えたものを提示して、読み込んだレシート等の画像を、記憶部に正式に登録するか、あるいは削除するかの操作を求める画面表示を行なう(ステップS3A−6)。
確認表示の特徴については後述する。
When the duplication determination processing is completed for the predetermined number of receipts and the like read, the user is presented with an item whose possibility of duplication exceeds a certain threshold, and the read receipt and other images are displayed in the storage unit. A screen is displayed asking for an operation of officially registering or deleting (step S3A-6).
The features of the confirmation display will be described later.

ユーザーによる確認の結果、重複していない場合には(ステップS3A−7:重複なし)、新たに読み込んだレシート等の画像を、認識結果や画像の特徴パターンの情報と関連付けて記憶部に正式に登録(学習)する(ステップS3A−8)。
記憶部に登録されたレシート等の画像は、以後、過去に読み取ったレシート画像として管理され、重複判定時に使用される。
他方、重複していると判定される場合には(ステップS3A−7:重複あり)、ユーザーの操作により、当該新たに読み込んだレシート等の画像を削除する処理を行なうと共に、重複判定の結果を記憶部に登録する(ステップS3A−9)。
As a result of confirmation by the user, when the image is not duplicated (step S3A-7: no duplication), an image such as a newly read receipt is associated with the information of the recognition result and the feature pattern of the image and formally stored in the storage unit. Registration (learning) is performed (step S3A-8).
Thereafter, an image such as a receipt registered in the storage unit is managed as a receipt image read in the past, and used at the time of overlap determination.
On the other hand, when it is determined that the image is duplicated (step S3A-7: presence of duplication), a process of deleting the image such as the newly read receipt is performed by the user operation, and the result of the duplication determination is It registers in a memory | storage part (step S3 A-9).

図3AのステップS3A−9のレシート等の画像の重複判定の処理を終えると、会計データ入力の処理を行なう(ステップS3A−10)。
会計データ入力の処理では、例えば、仕訳データを入力するアプリを起動したり、現金の取引を入力する出納帳アプリを起動して行なう(ステップS3A−10)。
入力した情報のうち、摘要の情報については、さらに予め店舗名辞書や、品名辞書などを登録しておいて、摘要の情報から店舗名や品名の情報を抽出し、文字認識結果や画像の特徴パターンの情報と関連付けて学習、登録して再利用することができる(ステップS3A−11)。
When the process of determination of duplication of images such as receipts in step S3A-9 of FIG. 3A is completed, processing of accounting data input is performed (step S3A-10).
In the accounting data input process, for example, an application for inputting journal data is activated, and a cashier application for inputting cash transactions is activated and performed (step S3A-10).
Among the input information, a store name dictionary, a product name dictionary, and the like are further registered in advance for the summary information, the store name and product name information is extracted from the summary information, and the character recognition result and the image feature Learning, registration and reuse can be associated with pattern information (step S3A-11).

例えば、イメージ管理テーブル(図5−1)で、店舗名と他の情報との紐付けを行ない、店舗毎にソートすることで、イメージ管理テーブルを辞書として用い、店舗毎のイメージ管理ができ、ある店舗では、日用品、ある店舗では、飲食費といった勘定科目との対応付けも可能となり、これらと異なる勘定科目を入力しようとすると注意表示を行なったり、あるいは自動的によく使う推奨科目を提示することができる。
また、イメージ管理テーブル(図5−1)では、レシート等の画像に対し、仕訳などの会計データとの紐付けもされているので、推奨科目を提示すると共に、そのレシート等の店名や科目に関連する仕訳データを提示することもできる。
また、あるレシート等の画像に対し、関連するレシート等の画像を検索して提示することもできる。その際の検索処理では、ユーザーが検索条件を入力するためのUI(ユーザーインターフェース)により検索項目を選択したり入力を受付けるようにしたり、そのレシート等の画像に関連付けられた科目や摘要あるいは店名などの情報に基づいて、登録済みのレシート画像を検索する。
あるいは、そのレシート等の画像に対し、登録済みのレシート等の文字認識結果や画像の特徴パターンの比較で一致する項目が多い順などにソートして、一致する項目が多い順に列挙することもできる。
For example, by linking the store name with other information in the image management table (FIG. 5-1) and sorting by store, the image management table can be used as a dictionary to perform image management for each store, In some stores, it is also possible to associate items such as daily necessities and certain stores with food and beverage expenses, and if you try to enter accounts different from these items, you will be given a notice or automatically suggested recommended items. be able to.
Also, in the image management table (Fig. 5-1), since images such as receipts are linked with accounting data such as journals, recommended items are presented, and store names and subjects such as receipts Relevant journal data can also be presented.
In addition, with respect to an image such as a receipt, an image such as a related receipt can be retrieved and presented. In the search process at that time, the user selects a search item or accepts an input using a UI (user interface) for inputting a search condition, or an item, an abstract, a shop name, or the like associated with an image such as a receipt. The registered receipt image is searched based on the information of.
Alternatively, images such as receipts may be sorted in the order of many matching items by character recognition results such as registered receipts or comparison of feature patterns of images, and may be listed in order of many matching items. .

図7に示すように、レシート等の画像から、文字認識処理および画像の特徴パターン抽出処理を経て取得した、文字認識結果と、領域毎の画像の特徴パターン(部分)が、最終的に会計データ入力によって取得したデータ(日付、金額、摘要、店名、品名、勘定科目)などと対応付けられて、イメージ管理テーブル(図5−1)に登録される。

[過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチン]
As shown in FIG. 7, the character recognition result and the feature pattern (part) of the image for each area obtained from the image of the receipt etc. through the character recognition process and the feature pattern extraction process of the image are finally account data It is registered in the image management table (FIG. 5-1) in association with data (date, amount of money, abstract, store name, item name, account item) acquired by input and the like.

[Drug Judgment Processing Subroutine with Registered Receipts etc Imported in the Past]

図3Bは、図3Aの全体処理フローのステップS3A−5の処理内容を詳細に記載した、過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチンの処理フローを示す図である。
このサブルーチンでは、文字認識処理で取得した日付や金額等のテキスト文字を利用した比較処理と、画像の特徴パターンの情報を利用した比較処理を組み合わせて、新たに読み込んだレシート等の画像が、過去に読み取ったレシート等の画像と重複している可能性を判定する処理を行なう。
ここで記載の「I」は文字認識の結果が「あり(結果が取得できた)」かつ文字認識の比較結果「一致」、「J」は文字認識の結果が「あり(結果が取得できた)」かつ文字認識の比較結果が「一部でも不一致(部分的に一致)」、「K」は文字認識結果が「なし(結果を取得できない)」、および「L」は画像の特徴パターンの比較結果が「一致」かつ画像全体の比較結果が「一致」、「M」は画像の特徴パターンの比較結果が「一致」かつ画像全体の比較結果が「不一致」、「N」は画像の特徴パターンが「不一致」、といったそれぞれの比較結果の状況を表すものとしてあくまで簡易的に付した符号である。
FIG. 3B is a diagram showing a processing flow of an overlap determination processing subroutine with registered receipts and the like fetched in the past, in which the processing contents of step S3A-5 of the entire processing flow of FIG. 3A are described in detail.
In this subroutine, comparison processing using text characters such as date and amount acquired in character recognition processing and comparison processing using feature pattern information of images are combined, and an image such as a newly read receipt etc. is in the past Processing to determine the possibility of overlapping with an image such as a receipt read in
Here, "I" described here is the result of character recognition "Available (result could be obtained)" and the comparison result of character recognition "match", "J" the result of character recognition "Available (result acquired And the character recognition comparison result is “partially non-matching (partially matching)”, “K” is character recognition result “none (cannot obtain results)”, and “L” is a feature pattern of the image The comparison result is “match” and the comparison result of the whole image is “match”, “M” is the comparison result of the feature pattern of the image is “match”, the comparison result of the whole image is “mismatch”, and “N” is the feature of the image It is a code simply attached to show the situation of each comparison result that the pattern is "mismatch".

図3Bにおいて、まず、必要に応じて処理を高速化するために、過去に読み取ったレシート等の画像の文字認識結果のテキスト文字や画像の特徴パターンの情報をメインメモリなどにロードするが(ステップS3B−1)、HDDやSSD、フラッシュメモリその他の長期記憶媒体に記憶したものと比較しても構わない。

重複元として参照するレシート等の画像は、図5−1のイメージ管理テーブルのように、会社ID毎(つまり顧問先毎や企業の支店などの部門毎)に管理されたものが対象となる。
また、時期的な範囲としては、「会計年度の初日の取引についての登録済みレシート等から」あるいは、「当月の初日の取引についての登録済みレシート等から」といった、ユーザー設定あるいは、システムのデフォルトで設定された範囲が対象とされる。
システムのデフォルトの設定としては、会計年度の初日、例えば3月末決算であれば、4月1日以降のレシート等を対象範囲とする設定が考えられる。
あるいは、顧問先等の企業等において、レシート等の管理が厳密であり、前月分までは確実に混じり合うことがないのであれば、ユーザー設定により、当月の初日からのレシート等の画像を対象範囲とする設定に変更できるようにしても良い。対象範囲を狭めることで、重複判定の処理を高速化することができるからである。
これらの設定は、図5−5(会社マスタ)などに反映され保存されている。
In FIG. 3B, first, in order to speed up the process as necessary, the text character of the character recognition result of the image such as a receipt read in the past and the information of the feature pattern of the image are loaded into the main memory (step S3B-1) may be compared with those stored in HDD, SSD, flash memory, and other long-term storage media.

Images such as receipts referred to as duplication sources are those managed for each company ID (that is, for each adviser, each department such as a branch of a company) as in the image management table of FIG. 5-1.
In addition, as the time range, it is the user setting or system default such as “from the registered receipt etc. of the transaction on the first day of the fiscal year” or “from the registered receipt etc. of the transaction on the first day of this month”. The set range is considered.
As the default setting of the system, for example, in the case of closing on the first day of the fiscal year, for example, at the end of March, it may be considered that the receipt range after April 1 is set as the target range.
Alternatively, if the management of receipts etc. is strict in companies such as advisors, and there is no possibility of mixing up until the previous month, the scope of images such as receipts from the first day of the current month by user setting It may be possible to change to the setting to be. By narrowing the target range, it is possible to speed up the process of the overlap determination.
These settings are reflected and stored in FIG. 5-5 (company master) and the like.

次に、重複判定処理に移行するが、当期の初日からのレシート等の画像を対象範囲とする場合において、1社あたり、1ヶ月で1,000枚のレシート等の画像がある場合、12月に参照するレシート等の画像の枚数は、4月から12月までの9ヶ月分、つまり9,000枚にも及ぶため、重複判定処理の処理内容や処理順序に工夫が必要となる。
この処理の高速化のため、例えば、文字認識結果の比較処理と画像の特徴パターンの比較処理を並列処理として起動する(ステップS3B−2)。
そして、文字認識結果の比較処理では、新たに読み込んだレシート等の画像の文字認識結果を取得できたかを確認し(ステップS3B−3)、カスレ等でそもそも文字認識結果を取得できないような場合には(ステップS3B−3の「なし」)、その比較結果の状況を「K」として記録し(ステップS3B−7)、文字認識結果を取得できた場合には(ステップS3B−3の「あり」)、テキスト文字を比較して、全てが一致する場合、一部でも不一致になる場合(部分的に一致する場合)などに場合分けして、それぞれの文字認識結果の状況を、「I」、「J」、・・・などとして記録する(ステップS3B−4、S3B−7)。
Next, the process proceeds to duplication determination processing, but when an image such as a receipt from the first day of the current period is included in the target range, if there are 1,000 receipts or other images per month per company, December Since the number of images such as receipts to be referred to is nine months from April to December, that is, 9,000 sheets, it is necessary to devise the processing content and processing order of the duplication determination processing.
In order to speed up this process, for example, the comparison process of the character recognition result and the comparison process of the feature pattern of the image are activated as parallel processes (step S3B-2).
Then, in the comparison process of the character recognition result, it is confirmed whether the character recognition result of the image such as a newly read receipt can be acquired (step S3B-3), and the character recognition result can not be acquired in the first place due to blurring or the like. (“NO” in step S3B-3), the status of the comparison result is recorded as “K” (step S3B-7), and the character recognition result can be obtained (“YES” in step S3B-3) ), Compare the text characters, and if all match, partial match (partial match), etc., the status of each character recognition result is “I”, Record as “J”,... (Steps S3B-4, S3B-7).

また、図3BのステップS3B−2からの文字認識処理と並行する処理として、画像の特徴パターンどうしを比較する処理を行なう(ステップS3B−5、S3B−6)。
具体的には、画像の領域毎の特徴パターン同士を比較し(ステップS3B−5)、いくつか画像の特徴パターンに不一致が含まれる場合には(ステップS3B−5の「不一致あり」)、比較結果の状況を「N」として記録し(ステップS3B−8)、画像の領域毎の特徴パターン同士が全て一致している場合には(ステップS3B−5の「一致」)、画像全体の画像の特徴パターンどうしの比較を行い(ステップS3B−6)、一致している場合には(ステップS3B−6の「一致」)、比較結果の状況を「L」として記録し(ステップS3B−8)、不一致の場合には(ステップS3B−6の「不一致」)、比較結果の状況を「M」として記録する(ステップS3B−8)。
Further, as a process parallel to the character recognition process from step S3B-2 in FIG. 3B, a process of comparing feature patterns of images is performed (steps S3B-5, S3B-6).
Specifically, the feature patterns of each area of the image are compared with each other (step S3B-5), and when some feature patterns of the image contain a mismatch ("No match" in step S3B-5), the comparison is performed. The resulting status is recorded as "N" (step S3B-8), and if all the feature patterns of each area of the image match ("match" in step S3B-5), the image of the entire image is The feature patterns are compared with each other (step S3B-6), and if they match ("match" in step S3B-6), the status of the comparison result is recorded as "L" (step S3B-8), If they do not match (“mismatch” in step S3B-6), the status of the comparison result is recorded as “M” (step S3B-8).

なお、この場合において、画像の特徴パターンの比較処理で、領域毎あるいは画像全体の比較の順番は前後しても構わない。
また、本願実施例の図3Bでは並行処理した例を記載したが、文字認識結果の比較処理と、画像の特徴パターンの比較処理は、いずれか一方が他方に前後した処理としても構わない。
そして、文字認識結果の比較処理と、画像の特徴パターンの比較処理の両方が終了するようにタイミングを調整する等の同期処理を行なう(ステップS3B−9)。
なお、文字認識結果の比較処理は、テキスト文字の比較なので比較的軽い処理であるのに対し、画像の特徴パターンの比較処理は、比較的重い処理なので、システムの初期設定では、文字認識結果の比較処理を先に行なって重複可能性のある登録済みのレシート等の画像をできるだけ絞り込んだ上で、その後に画像の特徴パターンの比較処理を行なう処理を行い、処理時間の高速化を図るようにしても良い。
In this case, in the comparison processing of the feature patterns of the image, the order of the comparison of each area or the entire image may be reversed.
Further, although an example in which parallel processing is performed is described in FIG. 3B of the embodiment of the present application, comparison processing of character recognition results and comparison processing of feature patterns of images may be processing in which either one precedes or follows the other.
Then, synchronization processing such as adjusting timing is performed so that both the comparison processing of the character recognition result and the comparison processing of the feature pattern of the image are completed (step S3B-9).
It should be noted that comparison processing of character recognition results is relatively light processing because it is comparison of text characters, while comparison processing of feature patterns of images is processing that is relatively heavy. The comparison processing is performed first to narrow down as much as possible the images such as registered receipts that may have duplicates, and thereafter the processing of comparing the feature patterns of the images is performed to speed up the processing time. It is good.

以上の文字認識処理で取得した日付や金額等のテキスト文字を利用した比較処理と、画像の特徴パターンの情報を利用した比較処理を組み合わせた処理により、文字認識結果は不一致だが、画像の特徴パターンの比較では一致しているというような場合(例えば、金額は一致しているが、年月日は文字が込み入っていて誤認識したような場合である)を含む、様々な態様の比較結果を得る。
このような比較結果を得て、当該1枚の新たに読み込んだレシート等の画像が、過去に読み取ったレシート等の画像と重複している可能性を総合的に判定する総合判定処理を行ない(ステップS3B−10)、判定結果を主記憶やHDDなどの記憶部に保存する(ステップS3B−11)。
Although the character recognition result does not match due to the process combining the comparison process using text characters such as date and amount acquired in the above character recognition process and the comparison process using information of the feature pattern of the image, the feature pattern of the image The comparison results of various aspects are included, including the case where the comparison of the two matches (for example, the amount of money matches but the date is the case where the characters are complicated and misrecognized). obtain.
Based on such comparison results, a comprehensive judgment process is performed to comprehensively judge the possibility that the image of the newly read receipt etc. is overlapped with the image of the receipt read in the past Step S3B-10) The determination result is stored in the main storage or a storage unit such as an HDD (step S3B-11).

1枚ごとの判定結果は、ステップS3B−13の複数枚まとめての判定で読み出して利用するほか、重複レシート等の重複確認画面(図6−1〜図6−4)で表示する際に用いられる。
なお、上記の文字認識結果の比較処理と、画像の特徴パターンの比較処理は、画像の特徴パターンの比較処理の方が処理量が多くなる傾向があり、並行して処理するか、いずれか一方を先に行なうかなどの判定を行なって決定することができる。
The judgment result for each sheet is read out and used in the judgment of a plurality of sheets collectively in step S3B-13, and used when displaying on the duplication confirmation screen (FIGS. 6-1 to 6-4) such as duplicate receipts. Be
Note that the comparison processing of character recognition results and the comparison processing of feature patterns of images tend to have a larger processing amount in the comparison processing of feature patterns of images, and either processing is performed in parallel It can be determined by making a determination as to whether or not to perform first.

1枚ごとの総合判定処理は、図5−3に示すような重複総合判定テーブルを用いて行なうことができるが、これに限られず、場合分けの組み合わせた処理フローの形で実施することもできる。
図5−3の重複総合判定テーブルでは、文字認識結果が一致していて(文字認識の比較結果の状況がI)、画像の特徴パターンの比較結果も領域毎の部分的な画像の特徴パターンの比較結果も一致し、画像全体での画像の特徴パターンの比較結果も一致しているような場合には(画像の特徴パターンの比較結果の状況がL)、重複している可能性が高いと判定される。
Although the comprehensive judgment processing for each sheet can be performed using the overlapping comprehensive judgment table as shown in FIG. 5-3, the present invention is not limited to this, and can be carried out in the form of a combined processing flow of cases. .
In the overlap total determination table of FIG. 5-3, the character recognition results match (the state of the comparison result of the character recognition is I), and the comparison result of the feature patterns of the image is also the feature pattern of the partial image of each area. If the comparison results also match, and if the comparison results of the feature patterns of the image in the entire image also match (the status of the comparison results of the feature patterns of the image is L), it is highly likely that they overlap. It is judged.

他方、文字認識結果が一致していて(比較結果の状況がI)、画像の特徴パターンの比較結果において、領域毎の部分的な画像の特徴パターンの比較結果に不一致な領域が含まれる場合には(画像の特徴パターンの比較結果の状況がN)、日付や金額などの桁数が違うと推測されるので、文字認識に誤認識があったなどと推定され、重複している可能性は低いと判定される。 On the other hand, when the character recognition result is in agreement (the state of the comparison result is I), and in the comparison result of the feature patterns of the image, the non-matching region is included in the comparison result of the feature patterns of partial images for each region. (The situation of the comparison result of the feature pattern of the image is N), and it is presumed that the number of digits such as date and money is different, so it is presumed that the character recognition is wrong recognition etc. There is a possibility of overlapping It is determined to be low.

同様に、文字認識結果が取得できない場合でも(文字認識の状況がK)、画像の特徴パターンの比較結果が、領域毎の部分的な画像の特徴パターンどうしが一致し、かつ全体の画像の特徴パターンどうしが一致するような場合には、日付や金額の桁数も同じであると推定され、品名や個数なども同じであると推定され、さらに発行した店舗も同じと推定されるので、カスレ等でたまたま文字認識がうまくいかなかったと推定し、重複している可能性を中くらいと判定した上で、重複判定の漏れを防止し、ユーザーに念のために提示することができるように調整して判定する。
そして、今回読み込んだ、所定の枚数のレシート等の全てについて、それぞれの重複可能性を判定する(図3BのステップS3B−12)。
Similarly, even when the character recognition result can not be acquired (the character recognition status is K), the comparison results of the feature patterns of the images indicate that the feature patterns of partial images of each region match each other and the features of the entire image If the patterns match, it is assumed that the date and the number of digits of the amount are also the same, and it is assumed that the item name and the number etc. are also the same, and furthermore, the issued stores are also presumed to be the same. It is presumed that the character recognition did not work well by chance etc., and it is judged that the possibility of duplication is medium, and leak of duplication judgment is prevented, and adjustment is made so that it can be presented to the user just in case To judge.
Then, with respect to all the predetermined number of receipts and the like read this time, the respective duplication possibilities are determined (step S3B-12 in FIG. 3B).

それぞれ、1枚ごとの重複可能性の判定処理を終えると、複数枚まとめての重複判定の処理を行なう(ステップS3B−13)。
ここでは、後述の図5−4の重複総合判定テーブル(複数枚まとめての判定用)を使った処理を行なうものであるが、複数枚まとめての重複判定では、読み込んだ中で複数枚の重複可能性が中程度以上のものが含まれているような場合に、その一連のレシート等は、過去に読み取ったレシート等の画像等と重複する可能性が類型的に高いことを示すもので、1枚1枚の重複判定では、必ずしも高い精度で重複可能性を判定できない場合があるのを補完し、総合的に見て、今回新たに読み込んだレシート等は、管理が不十分で、過去に読み取ったレシート等と重複している可能性が高いという情報を、タイムリーにユーザーに提示でき、ユーザーは残りの数十枚、数百枚のレシート等の読取りを中断して、袋などに入っている残りのレシート等を再確認でき、無駄な読み込み作業をしないで済む点で、実務上有用である。
When the process of determining the possibility of duplication for each sheet is completed, the process of determining whether a plurality of sheets are combined is performed (step S3B-13).
Here, processing is performed using the overlapping comprehensive determination table (for determination of a plurality of sheets collectively) shown in FIG. 5-4 to be described later. In the case where medium or higher duplication possibility is included, the series of receipts etc. show that there is a high possibility of duplication with the image etc. of receipts etc. read in the past. In the case of 1 sheet 1 sheet duplicate judgment, it is complemented that there is a case where the duplication possibility may not necessarily be judged with high accuracy, comprehensively, the receipt newly read this time is insufficiently managed, and the past Information can be presented to the user in a timely manner that there is a high possibility of duplication with the receipt etc. read by the user, and the user interrupts reading of the remaining dozens and hundreds of receipts etc. Remaining receipts etc. contained It can be re-confirmation, in that it is not necessary to wasteful read work, is a practice useful.

なお、複数枚まとめての重複判定により、過去の読み取ったレシート等の画像と完全に一致する場合はユーザーが同じレシート等の再度読取りを行ったものと、一部のみ一致する場合は取引内容が同じレシート等が含まれた新しいレシート等の読取を行ったものと判断してもよい。
以上の処理を終えると、サブルーチンを終了して、全体処理フローのステップS3A−6の確認表示に移行する。

In the case of perfect coincidence with a past read image of a receipt etc. by duplication judgment of a plurality of sheets collectively, the transaction content is in the case where the user only rereads the same receipt etc. when only partial matches. It may be determined that a new receipt or the like including the same receipt or the like has been read.
When the above process is completed, the subroutine is ended, and the process proceeds to the confirmation display of step S3A-6 of the entire processing flow.

[過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチンの変形例]
過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチンの変形例を、図3C、図3D、図3Eにより説明する。
図3Bとの相違は、文字認識結果の比較処理と、画像の特徴パターンの比較処理をそれぞれ図3Dおよび図3Eのようにサブルーチン化し、文字認識結果の比較処理と、画像の特徴パターンの比較処理について、それぞれ、比較するための重複判定の閾値などのパラメータを変更して、複数回ループさせる処理を追加したことである。
[Modification example of duplication judgment processing subroutine with registered receipts etc. taken in the past]
A modified example of the overlap determination processing subroutine with registered receipts and the like fetched in the past will be described with reference to FIGS. 3C, 3D and 3E.
The difference from FIG. 3B is that the comparison processing of character recognition results and the comparison processing of feature patterns of the image are respectively made into subroutines as in FIG. 3D and FIG. 3E, the comparison processing of character recognition results and the comparison processing of feature patterns of the image For each of the above, processing such as looping a plurality of times is added by changing parameters such as a threshold value of overlap determination for comparison.

また、取引先や店舗などによって、発行するレシート等には、文字の大きさが小さいとか、ロゴや図形のようなものが含まれるなど一定の傾向があり、文字認識結果の比較処理や画像の特徴パターンの比較処理との相性がある。
このため、文字認識結果の比較処理と、画像の特徴パターンの比較処理を、それぞれ相互に前後させることで、文字認識結果の比較処理で合致するレシート等の画像を絞り込むのか、あるいは画像の特徴パターンの比較処理で合致するレシート等の画像を絞り込むのか、あるいは両方の比較処理を並行して動作させ、いずれか一方で絞り込むのではなく両方の比較処理をマージしてから絞り込むのか、といった複数の処理パターンを走らせて、それぞれ相性の良い比較方法を選択したり、それぞれを重み付けしたり、重み付けの数値を学習によって最適化することができる。
In addition, there is a certain tendency that receipts etc. to be issued have small size of characters or something like logos and figures depending on customers and stores, etc. It is compatible with feature pattern comparison processing.
Therefore, by making the comparison process of character recognition result and the comparison process of feature pattern of the image mutually go back and forth, it is necessary to narrow down the image such as receipt matching in the comparison process of the character recognition result or the feature pattern of the image Multiple processes such as narrowing down images such as receipts that match in the comparison process, or operating both comparison processes in parallel and merging both comparison processes and then narrowing down instead of narrowing down with one or the other By running a pattern, it is possible to select a comparison method that is respectively compatible with each other, to weight each one, and to optimize the weight value by learning.


図3Cにおいて、例えば、印字されている文字が大きく、画像が鮮明で文字認識結果の信頼度が高い場合には、まず、ステップS3C−3で文字認識結果の比較処理を行ない過去に読み取ったレシート等の画像で重複しそうなものをある程度絞り込んだ上で、引き続いて、文字認識結果の比較で重複が疑われるものについてステップS3C−4で画像の特徴パターンの比較処理を行ない、さらに閾値などのパラメータを変えて(ステップS3C−5)、文字認識結果の比較処理と画像の特徴パターンの比較処理を再度行なうこともできる。
あるいは、印字されている文字が小さかったり、レシート等の画像においてカスレ等が多い場合には、文字認識結果の信頼度が低いので、まず画像の特徴パターンの比較処理を先に実行し、画像の特徴パターンどうしが似ているものをピックアップし、その上で文字認識結果の比較処理を後に実行して、さらに絞込み、さらに閾値などのパラメータを変えて(ステップS3C−5)、文字認識結果の比較処理と画像の特徴パターンの比較処理を再度行なうこともできる。

In FIG. 3C, for example, when the printed character is large, the image is clear, and the reliability of the character recognition result is high, first, the comparison processing of the character recognition result is performed in step S3C-3, and the receipt read in the past is received. Etc. are narrowed down to a certain extent, and then the feature pattern comparison processing of the image is performed in step S3C-4 for the suspected duplication in the comparison of the character recognition results, and further parameters such as threshold values Can be changed (step S3C-5), and the comparison process of the character recognition result and the comparison process of the feature pattern of the image can be performed again.
Alternatively, if the characters printed are small or there is a lot of blurring or the like in the image of the receipt, etc., the reliability of the character recognition result is low, so first the process of comparing the feature patterns of the image is executed to Pick up ones that have similar feature patterns, execute comparison processing of character recognition results on that later, narrow down further, and change parameters such as threshold (step S3C-5), compare character recognition results The processing and the comparison processing of the feature patterns of the image can also be performed again.

なお、図3Bで、イ、ロの重複判定処理、およびハと二を合わせた重複判定処理においては、図5−3の(1)デフォルトパターン、あるいは顧問先毎や会社の業種毎にカスタマイズした判定テーブルを用いて、閾値(パラメータ)を変えて、各重複判定処理を繰り返し行なうこともできる。
各重複判定処理が終了するように同期処理が行なわれ(ステップS3C−7)、重複判定処理の判定結果として、それぞれイ、ロ、ハ、二の4つの重複判定結果(1枚ごと)が得られる。
なお、ハとニの結果は、図5―5の重複判定テーブルに当てはめられて、文字認識結果の比較と、画像の特徴パターンの比較結果とを総合した重複可能性を出力する。
各判定結果は、重複可能性が大、中、小などで出力される他、重複可能性が大の場合は0.9(90%)、中の場合は0.6(60%)、小の場合は0.2(20%)などの重複している確率などの数値を用いてもよい。
In FIG. 3B, in the overlap determination process of B and B, and the overlap determination process of combining C and B, (1) default pattern in FIG. 5-3 or customized for each adviser or company type It is also possible to change each threshold (parameter) using the determination table and repeat each duplication determination process.
Synchronous processing is performed so that each overlap determination process is completed (step S3C-7), and four overlap determination results (for each sheet) are obtained as the determination results of the overlap determination process. Be
Note that the results of c and d are applied to the overlap determination table of FIG. 5-5, and output the possibility of overlap obtained by combining the comparison of the character recognition result and the comparison result of the feature pattern of the image.
Each judgment result is output with the possibility of duplication being large, medium, small, etc. In addition, 0.9 (90%) in the case of large possibility of duplication, 0.6 (60%) in the case of medium In the case of, numerical values such as overlapping probabilities such as 0.2 (20%) may be used.

そして、イ、ロ、ハ、二の4つの重複判定結果(1枚ごと)が得られたのち、これらのうち、それぞれの重複判定処理の結果に対して、相性に応じて重み付けをして、重複可能性の総合判定を行なう(S3C−8)。
総合判定は、図5−6重複総合判定テーブル(1枚ごとの判定用)(図3C用)に当てはめて出力される。
その際、顧問先毎あるいは会社の業種毎に、各判定結果に対する重み付け(a、b、cの数値)をして、それぞれの業態に則した重複判定に最適化することができる。
なお、顧問先毎あるいは会社の業種毎に、重み付けを調整するのは、顧問先毎や、業種毎に、その取引先が一定の範囲になることが多く、その結果、レシート等にも一定の傾向が生じることになるため、顧問先毎や、業種毎に、レシート等の画像の重複判定処理において、文字認識結果の判定処理と画像の特徴パターンの比較処理それぞれの順番や閾値(パラメータ)の設定との間に相性が生じるからである。
Then, after four duplicate determination results (one sheet) are obtained for B, B, C, and C, of these, each of the results of the duplication determination process is weighted according to the compatibility, A comprehensive determination of the possibility of duplication is performed (S3C-8).
The comprehensive judgment is applied by being applied to FIG. 5-6 overlapping comprehensive judgment table (for judgment for each sheet) (for FIG. 3C) and output.
At this time, weighting (numerical values of a, b, c) on each determination result can be performed for each adviser or for each type of business of the company, and optimization can be made to overlap determination according to each type of business.
It should be noted that it is often the case that the client is in a certain range for each adviser or for each industry, adjusting the weighting for each adviser or for each industry of the company, and as a result, the receipt etc. Since a tendency will occur, in the overlap determination process for images such as receipts for each adviser or for each type of industry, the order of the process for determining the character recognition result and the process for comparing the feature patterns of the image and the threshold (parameter) This is because compatibility occurs with the setting.

また、文字認識結果の比較処理は、テキスト文字の比較なので比較的軽い処理であるのに対し、画像の特徴パターンの比較処理は、比較的重い処理なので、システムの初期設定では、文字認識結果の比較処理を先に行なって重複可能性のあるレシート等の画像をできるだけ絞り込んだ上で、その後に画像の特徴パターンの比較処理を行なう処理(つまり図3Cの「イ」までの処理)の重み付けを(画像の特徴パターンの比較を先に行なう図3Cの「ロ」までの処理よりも)高くして、処理時間の高速化を図るようにしても良い。 In addition, comparison processing of character recognition results is relatively light processing because it is comparison of text characters, while comparison processing of feature patterns of images is relatively heavy processing, so at system initialization, character recognition results The comparison process is performed first to narrow down as much as possible the images such as receipts that may be duplicated, and then the process of comparing the feature patterns of the images (that is, the process to “I” in FIG. 3C) is weighted. The processing time may be increased by making the processing time higher (than the processing up to “b” in FIG. 3C in which comparison of feature patterns of images is performed first).

図5−6の重複判定テーブルは、判定パターン1、2、3・・・のように判定パターン毎に用意された例を示したが、各判定パターンの重み付け(a、b、c)は、重複している可能性が一定レベル以上(例えば、中(0.6)以上)の場合に、ユーザーに提示して、実際に重複しているかどうかを確認し、その確認結果を得て、重複可能性の判定結果と、ユーザーの確認結果の誤差を、二乗平均誤差などの誤差関数で換算して、誤差関数が最小になるように、各判定パターンの重み付けの数値(a、b、c)を更新する機械学習を行ない、判定パターンの精度を向上させていくことができる。   Although the overlap determination table of FIGS. 5-6 shows the example prepared for every determination pattern like determination pattern 1, 2, 3 ..., the weighting (a, b, c) of each determination pattern is If the possibility of duplication is a certain level or more (for example, medium (0.6) or more), the user is presented to confirm whether or not duplication actually occurs, and the confirmation result is obtained to obtain duplication. Convert the error of the judgment result of the possibility and the confirmation result of the user by the error function such as the root mean square error, and weight value of each judgment pattern (a, b, c) so that the error function is minimized. Machine learning can be performed to update the accuracy of the determination pattern.

[携帯処理フロー]
図1−5などの場合のように、会計事務所のサーバー100と職員の端末装置10とがクライアントサーバーシステムを構成している場合において、端末装置10をサーバー100から切り離して、顧問先に持ち込んで、顧問先でレシート等の画像を読み込む場合には、顧問先に端末装置10を携帯することから、携帯処理と呼ぶことにする。
このような携帯処理の処理フローを図4に示す。
図4において、対象となる顧問先を決定した上で(ステップS4T−1)、端末装置10を持ち込む顧問先のデータ(レシート等の画像データ、それに対応付けられた文字認識結果、画像の特徴パターンの情報など)を、会計事務所のサーバー10から(ステップS4SV−1)、端末装置10の記憶部に一時的に格納し(ステップS4T−2)、出先の顧問先での重複判定に備えることができる。
Mobile processing flow
In the case where the server 100 of the accounting office and the terminal device 10 of the staff constitute a client server system as in the case of FIG. 1-5 etc., the terminal device 10 is separated from the server 100 and brought to the adviser. Then, when reading an image such as a receipt at the advisor, since the terminal device 10 is carried at the advisor, it will be called portable processing.
The processing flow of such portable processing is shown in FIG.
In FIG. 4, after determining the target adviser (step S4T-1), the data of the adviser bringing in the terminal device 10 (image data such as receipt, character recognition result associated with it, feature pattern of the image Of the accounting office etc. (step S4SV-1) from the accounting office server 10 (step S4SV-1), temporarily store it in the storage unit of the terminal device 10 (step S4T-2), and prepare for duplicate judgment at the adviser on the go Can.

そして、この場合に、処理対象となる顧問先のデータを全てロックして、その顧問先のデータを一切追加したり更新したりできないようにする処理を行なうこともできるし(ステップS4SV−2の「ロックする」)、ロックしないで、会計事務所の別の職員が別の端末装置10を用いて、レシート等の画像の取り込み処理を続行したり、あるいは、顧問先が直接に、会計事務所のサーバー100にアクセスして、レシート等の画像をアップロードできるようにする場合がある(ステップS4SV−2の「ロックしない」)。 Then, in this case, it is possible to lock all the data of the adviser to be processed and perform a process to make it impossible to add or update any data of the adviser (step S4SV-2). “Lock”), do not lock, another staff member of the accounting office uses another terminal 10 to continue the process of capturing an image such as a receipt, or the adviser can directly directly The server 100 may be accessed to upload an image such as a receipt (“do not lock” in step S4SV-2).

<サーバー側で顧問先のデータをロックする場合とロックしない場合の共通の処理>
図4において、顧問先に持ち込んだ端末装置10で、レシート等の画像を読み込み(ステップS4T−3)、端末装置10の記憶部に記憶したレシート等の画像や画像に関連付けられた文字認識結果や画像の特徴パターンとの比較を行ない、顧問先で重複判定処理を行ないながら、レシート等の画像の取り込みを行なう(ステップS4T−4)。
<Common processing when locking and not locking the adviser's data on the server side>
In FIG. 4, an image such as a receipt is read by the terminal device 10 brought to the advisor (step S4T-3), and the image or the character recognition result associated with the image stored in the storage unit of the terminal device 10 The comparison with the feature pattern of the image is performed, and the image such as a receipt is taken in while performing the overlap determination process at the advisor (step S4T-4).

<サーバー側で顧問先のデータをロックする場合>
そして、会計事務所のサーバー100において、その顧問先のデータをロックしていた場合には、会計事務所に戻った後、再度、サーバー100と接続して、そのまま顧問先で読み込んだレシート等の画像を追加登録する(ステップS4T−8、ステップS4SV−5)。

<サーバー側で顧問先のデータをロックしない場合>
他方、会計事務所のサーバー100において、その顧問先のデータをロックしていない場合には、携帯処理中に他の職員や顧問先から追加されたレシート等の画像との重複判定をさらに行ない(ステップS4T−6)、その上で、重複していないものについて、追加登録を行なう(ステップS4T−7、ステップS4SV−4)。
<When locking data of adviser on server side>
Then, when the data of the adviser is locked in the server 100 of the accounting office, after returning to the accounting office, the server 100 is connected again, and the receipt read etc. An image is additionally registered (step S4T-8, step S4SV-5).

<When not locking the adviser's data on the server side>
On the other hand, when the data of the adviser is not locked in the server 100 of the accounting firm, the overlap judgment with the image such as a receipt added from another staff member or the adviser during the mobile processing is further performed ( In step S4T-6), additional registration is performed on the non-overlapping ones (step S4T-7, step S4SV-4).

[テーブル]
図5−1は、イメージ管理テーブルであり、顧問先毎や会社毎に、あるいは会社内の本店や支店や営業所等の組織毎に、読み取ったレシート等の画像にイメージIDを割り当てて、そのレシート等の画像の文字認識の結果や画像の特徴パターンの情報を、領域毎の部分的な画像の特徴パターン、ないし、全体の画像の特徴パターンの情報、および、ユーザーがそのレシート等の画像に関する取引の内容を仕訳データなどの会計データとして入力して得た店名や取引先名、品名、摘要や勘定科目の情報とが関連付けられて登録され、管理されている。
ここで、例えば、会社IDがK0001はB社(顧問先B)を示している。
画像全体の特徴パターンは、印刷領域全体の画像の特徴パターンのほか、レシート等の画像の外枠のサイズの特徴パターンなども含まれる。
また、図6−5の読取り設定画面で、重複判定処理を行なうかどうか、行なう場合に、今行なうか、後で行なうかの設定を保存しておくフラグ、および重複判定処理を実行したかどうかのフラグを備えている。
[table]
Fig. 5-1 is an image management table, in which an image ID is assigned to an image such as a receipt that has been read for each adviser or company, or for each organization such as a head office, branch or sales office within the company. Information about the result of character recognition of images such as receipts and feature patterns of images is related to the feature patterns of partial images for each area or information of feature patterns of the entire image and the image of the receipt such as the user Store names, business partners' names, item names, and information on notes and accounts associated with the contents of transactions as accounting data such as journal data are registered and managed in association with one another.
Here, for example, company ID K0001 indicates company B (adviser B).
The feature pattern of the entire image includes the feature pattern of the size of the outer frame of the image such as a receipt as well as the feature pattern of the image of the entire printing area.
Also, in the reading setting screen of FIG. 6-5, it is determined whether or not to perform the duplicate determination process, a flag for storing the setting of whether to perform now or later, and whether the duplicate determination process has been executed. It has the flag of.

ここで、図5−1の特徴パターン(特徴PTNと略す)は、ドットのある領域の矩形の幅や高さ、ビットマップのほか、ヒストグラム形式で量子化した情報(X、Y方向から投影する等して得た情報)、数学的処理でベクトル化した情報などを含む特徴量をいうものとする。
特徴PTNは、何らかの会計に関する画像なので、個々の領域の会計処理上の属性(個数、品名、日付、金額など)を有するので、位置や範囲、幅や高さなどが重要な意味を持つ。
特徴パターン(部分)は領域毎の画像の特徴パターンであり、(特徴1(店名等の特徴PTN)、特徴2(位置、特徴PTN)、特徴3(位置、特徴PTN)、・・・)のように記述することができる。
Here, the feature pattern (abbreviated as feature PTN) in FIG. 5-1 is projected from the X and Y directions as well as the width and height of the rectangle of the region with dots, bitmap, and the histogram format. Etc.), vectorized information by mathematical processing, and the like.
Since the feature PTN is an image relating to some accounting, it has accounting attributes (number, item name, date, amount of money, etc.) of each area, and therefore position, range, width, height, etc. have important meanings.
The feature pattern (part) is the feature pattern of the image for each region, and (of feature 1 (feature PTN such as store name), feature 2 (position, feature PTN), feature 3 (position, feature PTN, ...) It can be written as

図5−2は、会計入力アプリなどを用いて生成されたデータであって、仕訳データなどの会計データのデータ構成を示す図であり、顧問先毎に、仕訳データIDなどが割り付けられ、科目や摘要、金額や日付などの情報が対応付けられており、さらに、イメージ管理テーブルにより、どのレシート等の画像に関する会計データであるかも対応付けられている。
FIG. 5-2 is data generated using an accounting input application or the like, and is a diagram showing the data configuration of accounting data such as journal data, and a journal data ID etc. is assigned to each adviser, The information such as the description, the amount of money, the date, and the like are associated with each other, and further, the image management table associates which accounting data regarding the image such as a receipt is associated with.

図5−3.重複総合判定テーブル(1枚ごとの判定用)と図5−4.重複総合判定テーブル(複数枚まとめての判定用)は、前述したので、詳細は省略するが、図5−4.重複総合判定テーブル(複数枚まとめての判定用)では、判定条件として、読みこんだ中で2枚以上と記載しているが、複数枚が重複している場合や、2割以上の割合で重複している等の一定の閾値に代えることができる。 Figure 5-3. Duplicate comprehensive judgment table (for each judgment) and FIG. 5-4. The duplicate comprehensive determination table (for determination of a plurality of sheets collectively) has been described above, and thus details thereof will be omitted. In the Overlap Comprehensive Judgment Table (for multiple judgments collectively), it is described as two or more of the readings as the judgment condition, but in the case where two or more sheets overlap, or at a ratio of 20% or more It can replace with a certain threshold, such as overlapping.

要するに、10枚読み込んで、1枚が重複可能性があるというのであれば、その10枚は、1週前とか、前月とか、前年同月とか、同一店舗とかという範囲で、管理が不十分で、過去に読み取ったレシート等の画像と重複している可能性が低いと言えるが、2枚とか3枚が重複している可能性が高いと判定されたような場合は、偶然ではなく、全体の10枚およびその後に続けて読み込もうとしている多数のレシート等の画像が、類型的に過去に読み取ったレシート等の画像と重複している可能性が高く、ユーザーにいち早く、全てのレシート等の画像を読み込む前に、注意深く確認するようなオペレーションを行なうことができ、無駄のない会計処理を行なうことができる。
In short, if 10 sheets are read and there is a possibility that 1 sheet is duplicated, the 10 sheets are insufficiently managed in the range of 1 week ago, the previous month, the same month last year, the same store, etc. It can be said that the possibility of overlapping with an image such as a receipt read in the past is low, but when it is judged that the possibility of overlapping two or three sheets is high, it is not accidental but whole. There is a high possibility that images of 10 sheets and a large number of receipts etc. which are going to be read subsequently are overlapped with images of receipts etc. which are typically read in the past, and it is quick for the user, images of all receipts etc. Before loading, you can perform operations such as checking carefully, and you can do lean accounting.

[重複している可能性があると判定した場合の画面表示の特徴]
次に、全体処理フロー図(図3A)のステップS3A−6で表示される、重複する可能性が一定レベル以上(可能性が中以上)あると判定された場合のレシート等の確認画面について説明する。
図6−1は、重複する可能性が一定レベル以上(可能性が中以上)あると判定された場合のレシート等の確認画面 (左右対比)である。この画面例では、右側に今回新たに読み込んだレシート等の画像のうち、過去に読み取ったレシート等の画像と重複する可能性のあるものが3枚列挙されており、そのうち、レシート番号でID0065のものを選択した場合に、そのレシート等の画像が表示されると同時に、左側の画面で、過去に読み取ったレシート等の画像のうち重複する可能性のある重複元のレシート等の画像が表示されている様子を示している。
この画面例では、左右に重複する可能性のあるレシート等の画像を見比べながら確認できるので、作業効率が向上する。
なお、左右対比で確認する画面は一例であり、上下に対比したり、新たに読み取ったレシート等の画像だけを表示し、レシート等の画像にマウスカーソルなどをフォーカスすると、過去に読み取った登録済みのレシート等の画像で重複する可能性のあるものをポップアップ表示するようにしても良い(図6−2、図6−3も同様)。
[Features of screen display when it is determined that there is a possibility of overlapping]
Next, a description will be given of a confirmation screen such as a receipt when it is determined in step S3A-6 of the overall processing flow chart (FIG. 3A) that the possibility of overlapping is greater than or equal to a certain level (possibility is middle or higher). Do.
FIG. 6A is a confirmation screen (left-right comparison) of receipts and the like when it is determined that the possibility of overlapping is higher than or equal to a certain level (possibly middle or higher). In this screen example, among the images such as receipts newly read this time on the right are listed three sheets that may overlap with the images such as receipts read in the past, and among them, the receipt number is ID0065. When the item is selected, the image of the receipt etc. is displayed, and at the same time, the image of the duplicate original receipt etc., which may be duplicated, is displayed on the screen on the left side. It shows how it is.
In this screen example, it is possible to check while comparing images such as receipts that may overlap left and right, so work efficiency is improved.
Note that the screen to check the left / right contrast is an example, and if you compare the top and bottom, or display only the image of the newly read receipt etc. and focus the mouse cursor etc. on the image of the receipt etc, registered in the past read It is also possible to pop-up an image such as a receipt having a possibility of overlapping (the same applies to FIGS. 6-2 and 6-3).

図6−2は、図6−1の重複する可能性が一定レベル以上(可能性が中以上)あると判定された場合のレシート等の確認画面 (左右対比)に対し、いずれかのレシート画像を拡大表示した場合において、もう一方の画像を同じ拡大率で表示すると共に、一方の画像をスクロールすると、他方の画像も同様に自動スクロールされる様子を示している。画像のスクロール量の値を、他方に適用することで、同じ箇所を拡大して確認することができ、重複しているかどうかを確実に視認することを支援する。
6-2 shows any receipt image for the confirmation screen (left-right contrast) such as a receipt when it is determined that the overlapping possibility in FIG. 6-1 is determined to have a certain level or higher (possibly middle or higher). When is displayed in an enlarged manner, the other image is displayed at the same enlargement ratio, and when one image is scrolled, the other image is similarly automatically scrolled. By applying the value of the scroll amount of the image to the other, the same portion can be enlarged and confirmed, and it is supported to reliably confirm whether or not the image is duplicated.

図6−3は、重複レシート等の確認画面で、重複する可能性のある取り込み済みのレシート等が複数ある場合の例である。
図6−1および図6−2が、新たに読み込んだレシート等の画像1枚に対し、重複している可能性のある取り込み済みのレシート等の画像が1枚ある場合を例示しているのに対し、図6−3では、新たに読み込んだレシート等の画像1枚に対し、重複可能性のある取り込み済みのレシート等の画像が複数枚ある場合であるという相違がある。
図6−3では、新たに読み込んだレシート等の画像1枚に対し、重複している可能性のある取り込み済みの重複元レシート等の画像が2枚ある場合に、重複している可能性が高い順にレシート番号が列挙されており、選択した画像が左側に表示され、右側に表示された、今回新たに読み込んだレシート等の画像と対比して確認できることが示されている。
重複している可能性のレベルは、図5−3の重複総合判定テーブルに示すように、高い、中程度といった区別でも良いし、ユーザーが最終的に確認して重複判定した結果を学習したうえで、確率で表現されたレベルを用いても良い。
FIG. 6C is an example of the case where there are a plurality of captured receipts and the like that may be duplicated on the confirmation screen of the duplicate receipts and the like.
FIGS. 6-1 and 6-2 illustrate the case where there is one image such as an already-captured receipt which may be overlapped with one image of a newly-read receipt or the like. On the other hand, in FIG. 6C, there is a difference in that there is a case where there are a plurality of images such as already-captured receipts which may be overlapped with one image of the newly read-in receipt and the like.
In FIG. 6-3, there is a possibility of overlapping when there are two images such as already acquired imported original receipts which may be overlapped with one image of the newly read receipt etc. Receipt numbers are listed in descending order, and it is shown that the selected image is displayed on the left side and can be checked in contrast to the image displayed on the right side, such as a newly read receipt this time.
The level of the possibility of duplication may be a distinction such as high or medium as shown in the duplication total determination table of FIG. And the level expressed by the probability may be used.

図6−4は、今回新たに読み込んだ複数のレシート等の画像のうち、複数枚が、過去に読み取ったレシート等の画像と重複する場合の区別表示の例を示している。
右側には、今回新たに読み込んだレシート等の画像が5枚表示され、そのうち、過去に読み取ったレシート等の画像と重複している可能性が一定レベル以上のものについて、背景が区別表示されている例が示されている。
この場合において、右側の重複している可能性のあるレシート等の画像にマウスのカーソルを当てたり、モバイル端末の場合には画面上のタッチパネル上で、そのレシート等の画像に触れた場合には、左側の画面で、重複の可能性がある取り込み済みの重複元のレシート等の画像が次々と切り換えられて表示され、重複しているかどうかを確認することができる。
FIG. 6-4 shows an example of a distinguishable display in the case where a plurality of sheets of a plurality of images such as receipts newly read this time overlap with an image such as a receipt read in the past.
On the right side, 5 sheets of images such as receipts newly read this time are displayed, and among them, the background is distinguished and displayed for those having a certain level of possibility of overlapping with the images such as receipts read in the past Examples are shown.
In this case, when the mouse cursor is placed on an image such as a receipt that may be overlapping on the right side, or in the case of a mobile terminal, the image such as the receipt is touched on the touch panel on the screen. On the left side of the screen, images such as already-captured duplicate original receipts which may be duplicates are successively switched and displayed, and it is possible to check whether duplicates are present or not.

そして、この例では、5枚中2枚ものレシート等の画像が重複している可能性があることが示されており、こういう場合は、レシート等の管理が不十分で、これから読み込もうとしているレシート等の画像が、全体として、類型的に重複している可能性があるので、画面の上部に、「この一群のレシート等は、以前に取り込んだレシート等と重複している可能性が高いので注意してください!」といった警告表示を行なうことで、ユーザーは直ちにレシート等の画像の読み込みを中断して、袋等に保管したレシート等の画像の管理状況を確認し、既に取り込み済みのレシート等であるかどうかを確認することができ、無駄な読み込み作業を行なわないようにすることができる。
なお、図示はしないが、取り込み済みの重複元レシート等が複数ある場合も想定され、その場合は、重複している重複元レシート等を図6−3の左側のように表示しても良い。
And in this example, it is shown that there is a possibility that images such as two out of five receipts may overlap, and in such a case, management of receipts etc. is insufficient and it is going to be read from now on At the top of the screen, there is a possibility that the images, such as receipts, are generally overlapped in a typical manner, “This group of receipts, etc. is highly likely to be overlapped with the receipts, etc. taken earlier. Therefore, by displaying a warning such as “!”, The user immediately interrupts the reading of images such as receipts, confirms the management status of images such as receipts stored in a bag, etc., and has already taken in receipts. It can be checked whether it is the same or not, and it is possible to prevent unnecessary reading work.
Although not shown, it is also assumed that there are a plurality of imported duplicate original receipts and the like, and in this case, duplicate overlapped original receipts and the like may be displayed as shown on the left side of FIG.

また、上記の重複判定処理を行なう/行なわないに関わらず、レシート等の文字認識結果と画像の特徴パターンおよび、勘定科目や摘要あるいは店名などの情報を登録しているので、あるレシート等の画像に対し、これらの情報を検索キーとして、ヒットする項目が多いものを検索することができる。
あるレシート等の画像に対し、勘定科目や摘要あるいは店名などの情報を検索キーにして、関連するレシート等の画像を検索して列挙したり、列挙したレシート等の画像に紐付いている勘定科目や摘要あるいは仕訳等の会計データを参照することもできる。
Also, regardless of whether or not the above-described duplication determination processing is performed, character recognition results such as receipts and feature patterns of images, and information such as account items, notes or store names are registered, so an image such as a certain receipt On the other hand, using these pieces of information as search keys, it is possible to search for items that hit many items.
For an image such as a receipt, the information such as an account name, a note or store name is used as a search key to search for and list images such as related receipts, or an account attached to an image such as a listed receipt You can also refer to accounting data such as notes or journals.

あるいは、あるレシート等の画像に対し、文字認識結果や画像の特徴パターンの情報を検索キーとして、似たようなレシート等の画像を検索して、ヒットした項目の多い順に列挙したり、列挙したレシート等の画像に紐付いている勘定科目や摘要あるいは仕訳等の会計データを参照することもできる。この場合、文字認識結果と画像の特徴パターンの比較のいずれか一方を使用したり、重複判定と同様に両方の比較処理を組み合わせることができる。文字認識結果や画像の特徴パターンの比較で一致する項目が多い順などにソートして、一致する項目の多い順に列挙したり、上位のものだけを10枚列挙するといった提示の仕方が可能である。

以上の検索処理や列挙表示は、新たにレシート等の画像を読み取った場合や、既に読み取って登録済みのレシートのうち任意のレシート等の画像に対し、検索する場合のいずれに対しても適用可能である。
Alternatively, for an image such as a receipt, the image of a similar receipt or the like is searched using information on character recognition results and feature patterns of the image as a search key, and the images are listed in descending order of hit items. It is also possible to refer to accounts attached to images such as receipts and accounting data such as notes or journals. In this case, either one of the comparison of the character recognition result and the feature pattern of the image can be used, or both comparison processes can be combined similarly to the overlap determination. It is possible to present data such as sorting in the order of many matching items by character recognition results or comparison of feature patterns of images, etc., listing them in descending order of matching items, or listing only 10 high-order items. .

The above search processing and enumeration display can be applied to either the case where an image such as a receipt is newly read or the case where an image such as an arbitrary receipt is retrieved from among already read and registered receipts. It is.

以上のように、文字認識結果の比較と、画像の特徴パターンの比較を組み合わせて、重複する可能性の判定を行なうことで、カスレ等や文字が小さい等により正確に文字認識ができない場合でも、重複している可能性を精度良く判定することができる。

また、重複している可能性が一定レベル以上の場合に、ユーザーに対し、重複しているかどうか確認しやすい画面を表示することで、重複したレシート等の画像を登録することを防止することによって、重複した会計データを作成することを防止すると共に、似たようなレシート等の画像であるが、本当に2つの異なる取引があったことを確認した上で、会計データを入力することができるので、2重の仕訳の発生と本当に2つの取引が発生したことを峻別しつつ適切な会計データの作成を支援することで、会計処理の効率化、確実化を図ることができる。
そして、本システムによれば、会計事務所や企業内の本店などの監査する側で、顧問先や企業の支店など、サービスを受ける側に対する監査の段階でも、レシート等の証ひょう画像まで遡った上での正確な指導がし易くなり、業務効率化につなげることができる。
As described above, by combining the comparison of the character recognition result and the comparison of the feature pattern of the image to determine the possibility of duplication, even if the character recognition can not be accurately performed due to small blurring or characters, etc., The possibility of duplication can be determined with high accuracy.

In addition, when the possibility of duplication is a certain level or more, by displaying a screen that is easy to confirm to the user whether or not duplication is performed, it is possible to prevent registration of images such as duplicate receipts. Because it is possible to input the accounting data after confirming that there are two different transactions, which are images of similar receipts etc., while preventing the creation of duplicate accounting data. The accounting can be made more efficient and reliable by supporting the creation of appropriate accounting data while distinguishing the occurrence of double journaling and the occurrence of two transactions.
And, according to this system, audits by the accounting firm and the head office in the company, and audits at the service receiving side such as the adviser and the branch of the company trace back to the proof image of the receipt etc. It makes it easier to give accurate guidance above, which can lead to more efficient operations.

10 端末装置
11 入力部
12 画像取込部
13 出力部(表示、印刷)
14 制御部
15 記憶部(RAM等の主記憶、SRAMやHDD等の長期記憶)
16 通信部
50 画像取込装置(カメラ、スキャナ)
60 LAN(ローカルエリアネットワーク)
70 WAN(ワイドエリアネットワーク、インターネット等)
100 サーバー(仮想サーバー含む)
130 出力部
140 制御部
150 記憶部
160 通信部
10 terminal 11 input unit 12 image capture unit 13 output unit (display, printing)
14 control unit 15 storage unit (main storage such as RAM, long-term storage such as SRAM and HDD)
16 communication unit 50 image capturing device (camera, scanner)
60 LAN (Local Area Network)
70 WAN (Wide Area Network, Internet etc)
100 servers (including virtual servers)
130 output unit 140 control unit 150 storage unit 160 communication unit

Claims (7)

証憑画像を読み取って、読み取った証憑画像の登録及び類似する証憑画像を検索する画像DBをもつ会計処理を行なうためのシステムであって、
読み取った証画像から、
日付、金額を含む文字を文字認識する文字認識手段と、
日付、金額、店名を含む会計処理に有用な情報の画像の特徴パターンを、所定の領域毎に抽出する画像の特徴パターン抽出手段とを備え、
前記文字認識手段で取得した文字認識結果を記憶部に登録する文字認識結果登録手段と、
前記の画像の特徴パターン抽出手段で抽出した画像の特徴パターンを前記記憶部に登録する画像の特徴パターン登録手段と
当該新たな証憑画像と前記登録済みの証憑画像とが重複している可能性を検出する重複度検出手段を備え、
前記重複度検出手段は、
前記文字認識手段により当該新たな読み取った証憑画像の文字認識結果を検索条件とする前記登録済み証画像の文字認識結果に対する検索結果を少なくとも全部一致、一部一致、不一致の項目に分類した文字認識結果の類似度として取得し、
前記の画像の特徴パターン抽出手段により当該新たな読み取った証憑画像について抽出した画像の特徴パターンを検索条件とする前記登録済み証画像の画像の特徴パターンに対する検索結果を少なくとも全部一致、一部一致、不一致の項目に分類した画像の特徴パターンの類似度として取得し、
マトリクスの要素として重複度の状態が設定された重複度検出用マトリクスを用意し、
前記重複度検出用マトリクスの列として文字認識結果の類似度の項目に少なくとも全部一致、一部一致、不一致の項目を含む設定をし、
前記重複度検出用マトリクスの行として画像の特徴パターンの類似度の項目に少なくとも全部一致、一部一致、不一致の項目を含む設定をし、
取得した前記文字認識結果の類似度と取得した前記画像の特徴パターンの類似度の組み合わせをキーとして前記重複度検出用マトリクスを検索し、一致するマトリクスの要素である重複度の状態を検出し、
検出した前記重複度が高い場合には、
新たな証憑画像の取り込みを防止し、
検出した前記重複度が高い以外の場合には、新たな証憑画像を前記画像DBに登録することを特徴とする会計処理システム。
A system for performing accounting processing with an image DB for reading a voucher image, registering a read voucher image, and retrieving a similar voucher image ,
From the read testimony possession image,
Character recognition means for character recognition of characters including date and money;
Image feature pattern extraction means for extracting, for each predetermined area, a feature pattern of an image of information useful for accounting processing including a date, an amount of money, and a store name;
Character recognition result registration means for registering the character recognition result acquired by the character recognition means in a storage unit;
Image feature pattern registration means for registering the image feature pattern extracted by the image feature pattern extraction means in the storage unit ;
A duplication degree detection unit that detects a possibility that the new voucher image and the registered voucher image overlap ;
The duplication degree detection means
Wherein at least all matching search results for the registered card possessed image character recognition result of a part matching the character classified mismatched items that the character recognition result of the new read voucher image search condition by said character recognition means Acquired as similarity of recognition result,
At least all matching search results for the characteristic pattern of the image of the registered card possessed image to search the characteristic pattern of the images extracted for the new read voucher image by the feature pattern extraction means of the image, some matches , Acquired as the similarity of the feature pattern of the image classified into unmatched items,
Prepare an overlap detection matrix with the overlap state set as a matrix element,
Setting items including at least all matching, partial matching and non-matching items at least in the item of similarity of character recognition result as a column of the matrix for detecting the degree of duplication,
As the rows of the multiplicity detection matrix, the items including at least all matching, partial matching, and non-matching at least in all the items of the similarity of the feature pattern of the image are set,
The duplication degree detection matrix is searched using a combination of the obtained similarity degree of the character recognition result and the obtained similarity degree of the feature pattern of the image as a key to detect the state of the duplication degree which is an element of the matching matrix,
If the degree of duplication detected is high,
Prevent the capture of new voucher images ,
The accounting processing system characterized in that a new voucher image is registered in the image DB unless the detected degree of duplication is high .
前記記憶部は、顧問先毎に管理するための会社マスタと顧問先毎の重複度検出用マトリクスを備え、  The storage unit includes a company master for managing for each adviser and a matrix for detecting the degree of duplication for each adviser.
前記会社マスタから顧問先を選択した場合に、選択した顧問先の重複度検出用マトリクスを利用して前記重複度を検出することを特徴とする請求項1に記載の会計処理システム。  2. The accounting system according to claim 1, wherein, when an adviser is selected from the company master, the overlap is detected using a matrix for detecting the overlap of the selected adviser.
画像を読み取って、会計処理を行なうためのシステムであって、
読み取った証画像から、
日付及び又は金額を含む文字をテキストとして文字認識する文字認識手段と、
日付、金額及び又は店名を含む会計処理に有用な情報の画像の特徴パターンであって、
所定の領域毎の部分的な画像の特徴パターンと
印刷領域全体の画像の特徴パターンと
を含む画像の特徴パターンを抽出する画像の特徴パターン抽出手段とを備え、
前記文字認識手段で取得した文字認識結果を記憶部に登録する文字認識結果登録手段と、
前記の画像の特徴パターン抽出手段で抽出した画像の特徴パターンを前記記憶部に登録する画像の特徴パターン登録手段とを備え、
新たに読み取った当該証画像について、
前記文字認識手段によって、日付、金額を含む文字をテキストとして文字認識し、
前記の画像の特徴パターン抽出手段によって画像の特徴パターンを抽出すると共に、
前記記憶部から、登録済みの証画像の文字認識結果と画像の特徴パターンを読出し、
当該新たな読み取った証画像の文字認識結果と前記登録済み証画像の文字認識結果とを比較する文字認識結果比較手段と、
当該新たな読み取った証画像について抽出した画像の特徴パターンと前記登録済み証画像の画像の特徴パターンとを比較する際に、前記所定の領域毎の部分的な画像の特徴パターンどうしの比較内容と、前記印刷領域全体の画像の特徴パターンどうしの比較内容を含む画像の特徴パターン比較手段とを備え、
前記文字認識結果比較手段による比較結果と
前記画像の特徴パターン比較手段による比較結果である、前記所定の領域毎の部分的な画像の特徴パターンどうしの比較内容と、前記印刷領域全体の画像の特徴パターンどうしの比較内容と組み合わせて、
所定の領域毎の部分的な画像についての、前記文字認識手段による文字認識結果の有無、及び又は、前記文字認識結果比較手段による比較結果の一致している度合いと、
前記画像の特徴パターン比較手段による、前記印刷領域全体の画像の特徴パターンの比較結果の一致している度合いと、前記領域毎の部分的な画像の特徴パターンの比較結果の一致している度合いによって、
前記文字認識結果比較手段による否定的な比較結果を低く評価、又は、画像の特徴パターン比較手段による否定的な比較結果を優先、又は画像の特徴パターン比較手段による肯定的な比較結果を優先する、相補的重複判定手段を含む、
当該新たな証画像と、前記登録済みの証画像とが、重複している可能性を判定する重複可能性判定手段、
を備えたことにより、
前記重複可能性判定手段により重複する可能性があると判定された新たな証画像の
取り込みを防止することを特徴とする会計処理システム。
Read the testimony possession image, a system for accounting,
From the read testimony possession image,
Character recognition means for recognizing characters including texts and / or amounts as texts;
Image feature patterns of information useful for accounting including date, amount and / or store name ,
Partial image feature patterns for each predetermined area,
Feature patterns of the entire print area ,
And image feature pattern extraction means for extracting a feature pattern of the image including
Character recognition result registration means for registering the character recognition result acquired by the character recognition means in a storage unit;
Image feature pattern registration means for registering the feature pattern of the image extracted by the image feature pattern extraction means in the storage unit;
For the certificate possessed image newly read,
The character recognition means recognizes characters including date and money as texts,
While extracting the feature pattern of the image by the feature pattern extraction means of the image,
From the storage unit, it reads the feature pattern of a character recognition result and image registered testimony possession image,
A character recognition result comparison means for comparing the character recognition result of the new read testimony possession character recognition result and the registered card possessed image of the image,
When comparing the characteristic pattern of the image of the new read testimony possession characteristic pattern and the registered card possessed images of the extracted image on images comparison of characteristic patterns each other partial image for each of the predetermined areas A feature pattern comparison unit of an image including content and comparison content of feature patterns of images of the entire print area ;
A comparison result by the character recognition result comparison means ;
Combining the comparison content of the feature patterns of the partial images of each predetermined area, which is the comparison result by the feature pattern comparison means of the image, with the comparison content of the feature patterns of the entire print area ;
Presence or absence of a character recognition result by the character recognition unit and / or a matching degree of a comparison result by the character recognition result comparison unit with respect to a partial image of each predetermined area;
The matching degree of the comparison result of the feature patterns of the entire print area by the feature pattern comparison means of the image and the matching degree of the comparison result of the partial image of each area ,
The negative comparison result by the character recognition result comparison means is evaluated low, or the negative comparison result by the feature pattern comparison means of the image is prioritized, or the positive comparison result by the feature pattern comparison means of the image is prioritized. Including complementary duplication determination means,
The a new testimony possession image, wherein the registered testimony possessed images, overlap possibility determining means for determining the possibility of the overlapping,
By having
Accounting system characterized by preventing new testimony possession of the image capture it is determined that there may overlap by the overlap possibility determining means.
請求項3に記載の前記重複可能性判定手段が、The duplication possibility determination means according to claim 3,
前記文字認識結果比較手段による比較結果において、文字認識結果の一部が不一致の場合でも、In the comparison result by the character recognition result comparing means, even if a part of the character recognition result does not match,
前記画像の特徴パターン比較手段による比較結果において、前記印刷領域全体の画像の特徴パターンと、前記領域毎の部分的な画像の特徴パターンの比較結果が一致している場合には、In the comparison result by the feature pattern comparison means of the image, when the comparison result of the feature pattern of the entire print area and the feature pattern of the partial image for each area is identical,
文字認識処理が部分的に失敗している可能性を考慮して、前記文字認識結果比較手段による比較結果を低く評価し、Evaluating the comparison result by the character recognition result comparison means low in consideration of the possibility of partial failure of the character recognition process,
重複している可能性が中程度と判定する第1の重複判定手段と、First duplication determining means for determining that the possibility of duplication is medium;
前記文字認識結果比較手段による比較結果において、文字認識結果が一致している場合でも、In the comparison result by the character recognition result comparison means, even when the character recognition result matches,
前記画像の特徴パターン比較手段による比較結果において、前記領域毎の部分的な画像の特徴パターンの比較結果に不一致な領域が含まれる場合には、In the comparison result by the feature pattern comparison means of the image, when the comparison result of the feature pattern of the partial image for each region includes an unmatched region,
前記画像の特徴パターン比較手段による比較結果を優先し、日付や金額などの桁数が違うと推測して、重複している可能性を低く判定する第2の重複判定手段と、A second overlap determination unit that prioritizes the comparison result by the feature pattern comparison unit of the image, and determines that the possibility of overlapping is low, by inferring that the number of digits such as date or money is different;
前記文字認識手段において、文字認識結果が取得できない場合でも、Even if the character recognition result can not be obtained by the character recognition means,
前記画像の特徴パターン比較手段による比較結果において、前記領域毎の部分的な画像の特徴パターンと前記印刷領域全体の画像の特徴パターンどうしが一致するような場合には、In the comparison result by the feature pattern comparison means of the image, when the feature pattern of the partial image for each area and the feature pattern of the image of the whole print area coincide with each other,
前記画像の特徴パターン比較手段による比較結果を優先し、日付や金額の桁数ないし、品名や個数あるいは、発行した店舗も同じと推定され、カスレ等でたまたま文字認識がうまくいかなかったと推定し、重複している可能性を中程度と判定する第3の重複判定手段と、Prioritizing the comparison result by the feature pattern comparison means of the image, it is presumed that the date or the number of digits, the item name, the number, or the issued store is also the same, and it is presumed that accidental character recognition failed A third duplication determining means for determining the possibility of duplication as medium;
のいずれか一つ以上を備えた、ことを特徴とする会計処理システム。An accounting system characterized by comprising any one or more of the above.
画像を複数枚まとめて読み取ったときに、証画像の1つ1つの重複可能性を判定すると共に、当該複数枚の証画像の纏まりについて、前記登録済みの証画像の、日単位、週単位を含む所定の単位の纏まりと重複している可能性を判定して出力すること、
を特徴とする請求項1〜4のいずれか1つに記載の会計処理システム。
When reading the testimony possessed images plurality collectively, together determine one single Duplicatability testament possession image for collection of the plurality of testimony possession image, the registered testimony possession image, day Determining and outputting the possibility of overlapping with a predetermined unit group including a unit, a week unit,
The accounting system according to any one of claims 1 to 4 , characterized in that
画像を読み取って、その証画像に関する取引の内容を、会計データとして入力を受け付け、取得した会計データのうち、少なくとも摘要情報または科目情報と、証画像の画像の特徴パターンとを関連付けて登録し、次回の会計データの入力の際に、前記文字認識結果の比較手段および前記画像の特徴パターンとの比較手段による比較処理に加えて、当該証画像に対応付けられた摘要情報または科目情報と、入力した摘要情報又は科目との比較処理を行い、会計データの入力の精度を向上させること、
を特徴とする請求項1〜5のいずれか1つに記載の会計処理システム。
Read the testimony possession image, the contents of transactions involving the witness possession image, receives an input as accounting data, among the acquired accounting data, associated with at least summary information or subject information, the feature pattern of the image of the witness possessed images register Te, the time of input of the next accounting data, in addition to said comparison processing by the comparison means, wherein the pattern of the character recognition result of the comparison means and the image, or summary information associated with the certificate possessed images To compare the subject information with the input summary information or subject to improve the accuracy of the accounting data entry,
The accounting system according to any one of claims 1 to 5 , characterized in that
新たに証画像を複数枚まとめて読み取ったとき、または連続して読み取ったときに、証画像の1つ1つの重複可能性を判定し、前記登録済みの証画像と重複している可能性のある新たに読み取った証画像が存在した場合は、 複数枚まとめて、または連続して読み取った証画像を、少なくとも2以上、同時に表示させると共に、前記登録済みの証画像と重複している可能性のある新たに読み取った証画像を、他と区別して表示すること、
を特徴とする請求項1〜6のいずれか1つに記載の会計処理システム。
When read by newly grouped plurality testimonies possession image, or when read in succession, and determine one single Duplicatability testament possession image overlaps with the registered testimony possessed images If newly read testimony possession images that may have been present, in a plurality of sheets, or the testimony possessed images read in succession, at least two, with simultaneously displayed, the a registered testimony possessed images the testimony possession image newly read that may be overlapping, that displayed differently from others,
The accounting system according to any one of claims 1 to 6 , characterized in that
JP2017090095A 2017-04-28 2017-04-28 Accounting system Active JP6507459B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017090095A JP6507459B2 (en) 2017-04-28 2017-04-28 Accounting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017090095A JP6507459B2 (en) 2017-04-28 2017-04-28 Accounting system

Publications (2)

Publication Number Publication Date
JP2018190064A JP2018190064A (en) 2018-11-29
JP6507459B2 true JP6507459B2 (en) 2019-05-08

Family

ID=64479561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017090095A Active JP6507459B2 (en) 2017-04-28 2017-04-28 Accounting system

Country Status (1)

Country Link
JP (1) JP6507459B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7077998B2 (en) * 2019-03-07 2022-05-31 セイコーエプソン株式会社 Information processing equipment
CN114723541A (en) * 2022-04-01 2022-07-08 北京零点远景网络科技有限公司 Crowd portrait construction method, tutoring type determination method, device and medium
WO2024154339A1 (en) * 2023-01-20 2024-07-25 日本電気株式会社 Identification system, identification method, and program
JP7312980B1 (en) * 2023-02-21 2023-07-24 株式会社Tokium Program, computer and information processing method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011741A (en) * 2005-06-30 2007-01-18 Sharp Corp Image management apparatus and image forming apparatus provided with the same
JP2009026075A (en) * 2007-07-19 2009-02-05 Canon Inc Image processing device
JP5083162B2 (en) * 2008-10-06 2012-11-28 富士ゼロックス株式会社 Image data determination apparatus, image data determination system, and program
JP2011118513A (en) * 2009-12-01 2011-06-16 Toshiba Corp Character recognition device and form identification method
JP2016173838A (en) * 2016-05-09 2016-09-29 フリー株式会社 Accounting processor, accounting processing method and accounting processing program

Also Published As

Publication number Publication date
JP2018190064A (en) 2018-11-29

Similar Documents

Publication Publication Date Title
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
JP6507459B2 (en) Accounting system
US20190279170A1 (en) Dynamic resource management associated with payment instrument exceptions processing
US7940899B2 (en) Fraud detection, risk analysis and compliance assessment
US20060219773A1 (en) System and method for correcting data in financial documents
BRPI0614879A2 (en) real-time image quality analysis and verification
JP6357621B1 (en) Accounting processing apparatus, accounting processing system, accounting processing method and program
JP6507357B2 (en) Accounting system, method and program
JP6504514B1 (en) Document classification system and method and accounting system and method.
CN115017272B (en) Intelligent verification method and device based on registration data
JP2017182786A (en) Accounting processing device, accounting processing method, and accounting processing program
WO2019008766A1 (en) Voucher processing system and voucher processing program
US9436937B1 (en) Highlight-based bill processing
JP2020057186A (en) Accounting software and system
JP2014137605A (en) Receipt definition data generation device and program thereof
CN115358751A (en) Automatic auditing method and device for transaction document and electronic equipment
US10614068B2 (en) Transaction slip search method, information processing apparatus, and computer product
JP2002024539A (en) Individual identification system for credit accommodation
CN115374204A (en) Technical scheme for efficiently tracking fund source and destination
JP5304397B2 (en) Form processing apparatus and form processing program
JP2021093222A (en) Accounting processor, accounting processing system, method for accounting processing, and program
JP6250307B2 (en) Image information processing apparatus and image information processing method
JP2007280413A (en) Automatic input device of financial statement
JP2001005804A (en) Data base registering method utilizing character recognizing device
JPH11219394A (en) Automatic various financial chart input device

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190315

R150 Certificate of patent or registration of utility model

Ref document number: 6507459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150