JP2018190064A - Accounting processing system - Google Patents

Accounting processing system Download PDF

Info

Publication number
JP2018190064A
JP2018190064A JP2017090095A JP2017090095A JP2018190064A JP 2018190064 A JP2018190064 A JP 2018190064A JP 2017090095 A JP2017090095 A JP 2017090095A JP 2017090095 A JP2017090095 A JP 2017090095A JP 2018190064 A JP2018190064 A JP 2018190064A
Authority
JP
Japan
Prior art keywords
image
character recognition
feature pattern
accounting
possibility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017090095A
Other languages
Japanese (ja)
Other versions
JP6507459B2 (en
Inventor
土本 一生
Kazuo Tsuchimoto
一生 土本
眞樹 桑島
Maki Kuwajima
眞樹 桑島
浩一 鎌田
Koichi Kamata
浩一 鎌田
孝志 勝毛
Takashi Katsuge
孝志 勝毛
秀規 真後
Hideki Masago
秀規 真後
直樹 松永
Naoki Matsunaga
直樹 松永
雄大 深見
Takehiro Fukami
雄大 深見
聡司 横山
Satoshi Yokoyama
聡司 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Digital Laboratory Co Ltd
Original Assignee
Japan Digital Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Digital Laboratory Co Ltd filed Critical Japan Digital Laboratory Co Ltd
Priority to JP2017090095A priority Critical patent/JP6507459B2/en
Publication of JP2018190064A publication Critical patent/JP2018190064A/en
Application granted granted Critical
Publication of JP6507459B2 publication Critical patent/JP6507459B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an accounting processing system which determines, when performing accounting processing by reading out an image such as a receipt, whether the image is not overlapped with an image read in the past, eliminates wrong duplicate input, and supports preparation of appropriate accounting data.SOLUTION: A system for performing accounting processing by reading out an image such as a receipt comprises: character recognition means which makes character recognition of a character including a date and an amount as a text; image feature pattern extracting means which extracts an image pattern of information useful for the accounting processing including the date, the amount and a shop name, for each prescribed region; and duplication possibility determination means which combines comparison of a result of the character recognition and the comparison of the image feature pattern, and determines duplication possibility between an image such as a new receipt, and an image such as the receipt read in the past.SELECTED DRAWING: Figure 2-1

Description

本発明は、レシート等の証ひょう画像(以下、「レシート等の画像」と略す)を読み取って、会計処理を行なう場合に、過去に読み取った登録済みのレシート等の画像と重複していないかどうかを判定し、ユーザーに対し、重複しているかどうかを確認するための画面表示を行ない、誤って重複入力することを防止すると共に、2重の仕訳の発生と本当に2つの取引が発生したことを峻別しつつ適切な会計データの作成を支援することで、会計処理の効率化、確実化を図ることに関する。 In the present invention, when reading a hail image such as a receipt (hereinafter abbreviated as “image such as a receipt”) and performing an accounting process, it does not overlap with an image such as a registered receipt read in the past. A screen is displayed to confirm whether or not it is duplicated for the user, and it is possible to prevent duplicate entries from being entered by mistake. The present invention relates to improving the efficiency and certainty of accounting processing by supporting the creation of appropriate accounting data while distinguishing between them.

従来より、例えば、特許文献1に記載の発明のように、レシート等の画像から経費データを入力する際に、画像をテキストに変換して、経費データを取り出して、データ入力するためのシステムがあった。 2. Description of the Related Art Conventionally, for example, as in the invention described in Patent Document 1, when inputting expense data from an image such as a receipt, there is a system for converting the image into text, taking out expense data, and inputting the data. there were.

特表2006−511896号公報JP-T-2006-511896

レシートや伝票などの証ひょうは、会計処理のために重要な資料であって、企業や個人事業主が自ら管理して、会計税務処理の基礎資料として用いるほか、会計税務処理を専門家である会計事務所等に依頼する際には、会計事務所の職員等が顧問先を訪問して証ひょうを読み取るほか、顧問先から会計事務所の職員等に手渡し、または郵送等して、会計事務所で会計データ入力の際に参照した後、顧問先に返却するという運用がされている。
その際、顧問先などでレシート等の管理が不十分な場合には、同じレシート等を重複して読み取ってしまう可能性があった。
Receipts such as receipts and slips are important materials for accounting processing. They are managed by companies and individual business owners and used as basic materials for accounting tax processing, and they are experts in accounting tax processing. When making a request to an accounting firm, etc., the accounting firm's staff visit the advisor to read the evidence, and the consultant will hand it over to the accounting firm's staff, etc. After referring to accounting data at the office, it is operated to return it to the consultant.
At that time, if the management of the receipt or the like is inadequate at the consultant or the like, there is a possibility that the same receipt or the like is duplicated.

そこで、従来、レシート等の画像を読み取って、システムの画面に表示して、会計処理に関するデータ入力を行なう際に、過去に読み取ったレシート等の画像と重複しているかどうかを判定する処理として、レシート等の画像に印字された情報について文字認識処理を行ない、テキスト文字化して、過去に読み取ったレシート等の画像のテキスト文字と比較する手法が用いられていた。
しかし、レシート等の画像のテキスト文字は、発行する店舗や業種によって、その態様は千差万別であり、かつ印字される文字の大きさもかなり小さいものが含まれるため、印字文字等について確実に文字認識処理を行なって、全てをテキスト化することは困難であった。
Therefore, conventionally, as a process of reading an image of a receipt or the like, displaying it on a system screen, and determining whether it overlaps with an image of a receipt or the like read in the past when inputting data relating to accounting processing, A method has been used in which character recognition processing is performed on information printed on an image such as a receipt, converted into text characters, and compared with text characters of an image such as a receipt read in the past.
However, the text characters of images such as receipts vary widely depending on the store and business type to be issued, and the size of the characters to be printed is quite small. It was difficult to convert the text into text by performing character recognition processing.

この点、特許文献1に記載のシステムでは、複数の印字情報について文字認識処理することにより、それらの情報が複数合致していることを条件に、レシート等の画像の重複判定を行なうことが記載されているが、もし文字認識処理で、複数の印字情報をうまくテキスト化できない場合には、過去に読み取ったレシート等の画像との重複判定を行なうことができなかった。 In this regard, in the system described in Patent Document 1, it is described that character recognition processing is performed on a plurality of pieces of print information to determine whether or not an image such as a receipt is duplicated on condition that a plurality of pieces of the information match. However, if a plurality of pieces of print information cannot be converted into text in the character recognition process, it is not possible to determine whether or not there is an overlap with an image such as a receipt read in the past.

また、文字認識処理で取得したテキスト文字に、誤認識した結果が含まれる場合もあり、そのような場合には、重複するレシート等の画像を取りこぼす可能性もあった。
この点、誤認識していた場合に、たまたま文字列が一致していたような場合には、そのレシート等の画像を、端末等の操作者であるユーザーに提示することで、ユーザーの判定を待つことができるが、誤認識の結果、テキスト文字が過去に読み取ったレシート等の画像のテキスト文字と一致しない場合には、そもそも、ユーザーに提示することもできず、誤って重複入力してしまう可能性があった。
Moreover, the result of misrecognition may be included in the text characters acquired in the character recognition process. In such a case, there is a possibility that an image such as a duplicate receipt may be missed.
In this regard, if the character string happens to be coincident when it is misrecognized, the user's decision is made by presenting the image such as the receipt to the user who is the operator of the terminal or the like. Can wait, but as a result of misrecognition, if the text characters do not match the text characters of the receipt or other image that was read in the past, it cannot be presented to the user in the first place, and duplicated input will be made by mistake There was a possibility.

上記課題を解決すべく、本発明の第1の発明は、証ひょう画像を読み取って、会計処理を行なうためのシステムであって、読み取った証ひょう画像から、日付、金額を含む文字をテキストとして文字認識する文字認識手段と、日付、金額、店名を含む会計処理に有用な情報の画像の特徴パターンを、所定の領域毎に抽出する画像の特徴パターン抽出手段とを備え、前記文字認識手段で取得した文字認識結果を記憶部に登録する文字認識結果登録手段と、前記の画像の特徴パターン抽出手段で抽出した画像の特徴パターンを前記記憶部に登録する画像の特徴パターン登録手段とを備え、新たに読み取った当該証ひょう画像について、前記文字認識手段によって、日付、金額を含む文字をテキストとして文字認識し、前記の画像の特徴パターン抽出手段によって画像の特徴パターンを抽出すると共に、前記記憶部から、登録済みの証ひょう画像の文字認識結果と画像の特徴パターンを読出し、当該新たな読み取った証ひょう画像の文字認識結果と前記登録済み証ひょう画像の文字認識結果とを比較する文字認識結果比較手段と、当該新たな読み取った証ひょう画像について抽出した画像の特徴パターンと前記登録済み証ひょう画像の画像の特徴パターンとを比較する画像の特徴パターン比較手段とを備え、文字認識結果比較手段による比較結果と画像の特徴パターン比較手段による比較結果と組み合わせて、当該新たな証ひょう画像と、前記登録済みの証ひょう画像とが、重複している可能性を判定する重複可能性判定手段、を備えたことにより、重複する可能性があると判定された新たな証ひょう画像の取り込みを防止することを特徴とする。
また、本発明の第2の発明は、前記画像の特徴パターン抽出手段において、日付、金額、店名を含む会計処理に有用な情報の画像のパターンを、所定の領域毎に抽出する際に、領域毎の画像の特徴パターンとして、少なくとも、画素のある領域の位置と範囲のパターンまたはビットマップパターンの態様を含み、前記画像の特徴パターン比較手段において、所定の領域毎に、画像の特徴パターンの態様を比較することで、仮に文字認識結果に誤りがある場合や文字認識結果を取得できない場合にも、画素のある領域の位置と範囲のパターンまたはビットマップパターンの比較により、日付、金額、店名を含む会計処理に有用な情報が一致している可能性を判定することで、重複可能性判定手段が、文字認識結果比較手段による比較結果と画像の特徴パターン比較手段による比較結果とを総合して、重複している可能性を判定すること、を特徴とする。

また、本発明の第3の発明は、証ひょう画像を複数枚まとめて読み取ったときに、証ひょう画像の1つ1つの重複可能性を判定すると共に、当該複数枚の証ひょう画像の纏まりについて、前記登録済みの証ひょう画像の、日単位、週単位を含む所定の単位の纏まりと重複している可能性を判定して出力すること、を特徴とする。

また、本発明の第4の発明は、証ひょう画像を読み取って、その証ひょう画像に関する取引の内容を、会計データとして入力を受け付け、取得した会計データのうち、少なくとも摘要情報または科目情報と、証ひょう画像の画像の特徴パターンとを関連付けて登録し、次回の会計データの入力の際に、文字認識結果の比較手段および画像の特徴パターンとの比較手段による比較処理に加えて、当該証ひょう画像に対応付けられた摘要情報または科目情報と入力した摘要情報又は科目との比較を行い、会計データの入力の精度を向上させること、を特徴とする。

また、本発明の第5の発明は、前記重複可能性判定手段によって、重複する可能性が閾値を超えた場合に、当該新たな証ひょう画像と重複する可能性のある前記登録済みの証ひょう画像を、対比して表示することにより、重複する可能性があると判定された新たな証ひょう画像の取り込みを防止することを特徴とする。

また、本発明の第6の発明は、新たに読み取った証ひょう画像と重複する可能性のある前記登録済みの証ひょう画像を、対比して表示する場合において、一方の証ひょう画像を拡大した場合に、他方を同率で拡大表示すると共に、一方の証ひょう画像をスクロールした場合に、他方のスクロールを追従させること、を特徴とする。


また、本発明の第7の発明は、新たに証ひょう画像を複数枚まとめて読み取ったとき、または連続して読み取ったときに、証ひょう画像の1つ1つの重複可能性を判定し、前記登録済みの証ひょう画像と重複している可能性のある新たに読み取った証ひょう画像が存在した場合は、複数枚まとめて、または連続して読み取った証ひょう画像を、少なくとも2以上、同時に表示させると共に、前記登録済みの証ひょう画像と重複している可能性のある新たに読み取った証ひょう画像を、他と区別して表示すること、を特徴とする。
In order to solve the above-mentioned problems, a first invention of the present invention is a system for reading a testimonial image and performing accounting processing. From the read testimonial image, characters including date and amount are converted into text. Character recognition means for character recognition, and image feature pattern extraction means for extracting image feature patterns of information useful for accounting processing including date, price, and store name for each predetermined area, the character recognition means Character recognition result registration means for registering the acquired character recognition result in the storage unit, and image feature pattern registration means for registering the image feature pattern extracted by the image feature pattern extraction means in the storage unit, With respect to the newly read evidence image, the character recognition means recognizes characters including date and amount as text, and extracts the feature pattern of the image. The feature pattern of the image is extracted by the means, the character recognition result of the registered testimonial image and the feature pattern of the image are read from the storage unit, and the character recognition result of the newly read testimonial image and the registered Character recognition result comparison means for comparing the character recognition result of the testimony image, and an image for comparing the feature pattern of the image extracted with respect to the newly read testimony image and the feature pattern of the image of the registered certificate And a comparison result of the character recognition result comparison means and a comparison result of the image feature pattern comparison means, the new testimony image overlaps with the registered testimony image. New duplication possibility judging means for judging the possibility of duplication Characterized in that it prevents the uptake of such testimony leopard image.
According to a second aspect of the present invention, when the image feature pattern extraction unit extracts an image pattern of information useful for accounting processing including a date, an amount of money, and a store name for each predetermined area, The feature pattern of each image includes at least a position and range pattern or bitmap pattern aspect of a region with pixels, and the image feature pattern comparison means for each predetermined region in the image feature pattern comparison means Even if there is an error in the character recognition result or when the character recognition result cannot be obtained, the date, price, and store name can be compared by comparing the position of the area with the pixel and the pattern of the range or bitmap pattern. By determining the possibility that the information useful for the accounting process that includes them matches, the possibility of duplication determination means that the comparison result by the character recognition result comparison means and the image Comprehensively the comparison result by the feature pattern comparing means, determining the possibility that the overlapping, characterized by.

According to a third aspect of the present invention, when a plurality of testimony images are read together, the possibility of overlapping each of the testimony images is determined, and a group of the plurality of testimony images is collected. , And determining and outputting the possibility that the registered evidence image overlaps with a group of predetermined units including a daily unit and a week unit.

In addition, the fourth invention of the present invention reads a testimony image, accepts input of transaction contents relating to the testimony image as accounting data, and among the acquired accounting data, at least summary information or subject information, The image feature pattern of the testimonial image is registered in association with it, and when the next accounting data is input, in addition to the comparison process by the character recognition result comparison means and the image feature pattern comparison means, The summary information or subject information associated with the image is compared with the inputted summary information or subject to improve the accuracy of accounting data input.

According to a fifth aspect of the present invention, when the possibility of duplication exceeds a threshold value by the duplication possibility determination means, the registered evidence may be duplicated with the new evidence image. By displaying the images in comparison, it is possible to prevent a new identification image that has been determined to be possibly duplicated from being captured.

Further, the sixth invention of the present invention has enlarged one of the testimony images when the registered testimonial image that may overlap with the newly read testimony image is displayed in contrast. In the case, the other is enlarged and displayed at the same rate, and when one of the testimonial images is scrolled, the other scroll is caused to follow.


Further, according to a seventh aspect of the present invention, when a plurality of evidence images are newly read collectively or continuously, the possibility of overlapping each evidence image is determined, If there is a newly scanned proof image that may be duplicated with the registered proof image, at least two or more proof images are displayed at the same time. In addition, a newly read evidence image that may possibly overlap with the registered evidence image is displayed separately from the others.

過去に読み取ったレシート等の画像について、文字認識結果と、領域毎に区別した画像の特徴パターンとを保存しておき、新たに読み取ったレシート等の画像の文字認識結果と画像の特徴パターンとを比較し、両方の比較結果を組み合わせて判断することで、重複する可能性を段階的に判断することができる。
これにより、日付や金額等の文字認識結果が一致していることに加え、画像の特徴パターンどうしが一致していることも加味して、重複している可能性が高いことを判定することができ、たまたま日付や金額等の文字認識結果が一致していただけで重複しているとしてユーザーに提示することはないので、ユーザーに無用な負担を掛けないで済むという効果がある。
The character recognition result and the image feature pattern distinguished for each region are stored for images such as receipts read in the past, and the character recognition result and image feature pattern of the newly read image such as receipt are stored. By comparing and judging by combining both comparison results, the possibility of overlapping can be judged in stages.
This makes it possible to determine that there is a high possibility of overlapping, taking into account that the character recognition results such as date and amount of money match, and that the feature patterns of the images match. It is possible to avoid unnecessary burdens on the user because the character recognition results such as the date and the amount of money are not coincidentally presented to the user.

また、日付や金額等の文字認識結果に誤認識が含まれている場合や、文字認識に失敗してテキスト文字の全部又は一部を取得できない場合でも、日付や金額や店舗名等の画像の特徴パターンとの比較結果も併用することで、重複している可能性の判定の漏れなく行なうことができるので、重複入力することを防止する精度を向上させることができる。 Even if character recognition results such as date or amount of money include misrecognition, or even if character recognition fails and all or part of the text characters cannot be obtained, the image of date, amount or store name etc. By using the comparison result with the feature pattern together, it is possible to perform the determination of the possibility of duplication without omission, so that the accuracy of preventing duplicate input can be improved.

また、1枚1枚のレシート等の画像の重複可能性を判定することに加え、複数枚を連続または纏めて読み取った際に、全体として重複している可能性を判定することができるので、1枚1枚の読取りの際にかすれたりして重複判定の精度が不十分な場合でも、全体として、過去に読み取ったものと重複している可能性を判定することができるので、会計事務所と顧問先の間で、レシート等の管理に漏れがあって重複読取りをしてしまったような場合に、いち早くレシート等の管理の不備による、日単位や週単位などの所定の単位毎のレシート等の重複可能性を効果的に判定することができる。
Moreover, in addition to determining the possibility of overlapping images such as one receipt, it is possible to determine the possibility of overlapping as a whole when reading a plurality of images continuously or collectively. Even if the accuracy of duplication determination is insufficient due to fading at the time of reading one by one, it is possible to determine the possibility of duplication with what has been read in the past as a whole, so the accounting office Receipts for each unit, such as daily or weekly, due to inadequate management of receipts, etc. Etc. can be effectively determined.

図1−1は、本発明のシステム構成を示す図であり、端末装置10と画像取込装置50のセットを示す例である。
図1−2は、本発明のシステム構成を示す図であり、本発明の端末装置10と画像取込装置50のセットが、LAN60を介して相互に接続される場合を示す図である。
図1−3は、本発明のシステム構成を示す図であり、本発明の端末装置10と画像取込装置50のセットが、LAN60を介して、サーバー100に接続される場合を示す図である。
図1−4は、本発明のシステム構成を示す図であり、本発明の端末装置10と画像取込装置50のセットが、LANやルーター60を介して、WAN(ワイドエリアネットワーク)70の先にあるサーバー100に接続される場合を示す図である。
図1−5は、会計事務所と顧問先の間で、レシート等の画像をやりとりする際のシステム構成を示す図である。
図1−6は、会計事務所と在宅ワーカーとの間で、レシート等の画像をやりとりする際のシステム構成を示す図である。
図1−7は、企業の本店(本社)と支店等の間で、レシート等の画像をやりとりする際のシステム構成を示す図である。
図2−1は、端末装置10の機能ブロック図である。
図2−2は、サーバー100の機能ブロック図である。
図3Aは、本発明の会計処理システムの、処理内容の全体を示すフローチャートである。
図3Bは、全体処理フローのステップS3A−5の処理内容を詳細に記載した、過去に取り込んだレシート等との重複判定処理サブルーチンの処理フローを示す図である。
図3Cは、図3Bの重複判定処理サブルーチンの変形例を示す図である。
図3Dと図3Eは、図3Bの文字認識結果の比較処理と、画像の特徴パターンの比較処理をそれぞれ独立のサブルーチンにした場合の図である。
図4は、サーバー100と端末装置10が接続された状態から、端末装置10を持ち出して運用する携帯処理の処理フローを示す図である。
図5−1は、イメージ管理テーブルであり、顧問先毎や会社毎に、あるいは会社内の本店や支店や営業所等の組織毎に読み取ったレシート等の画像にイメージIDを割り当てて、そのレシート等の画像の文字認識の結果や画像の特徴パターンおよび会計データなどを対応付けて管理している様子を示す図である。
図5−2は、会計入力アプリなどを用いて生成されたデータであって、仕訳データなどの会計データのデータ構成を示す図である。
図5−3は、新たに読み込んだレシート等の画像1枚ごとに、過去に読み取ったレシート等の画像と重複している可能性を判定するためのテーブルであって、文字認識結果の比較結果と画像の特徴パターンの比較結果とを総合して判定するための重複総合判定テーブルの一例を示す図である。(1)デフォルトパターンと、(2)閾値(パラメータ)を変更した例、及び(3)顧問先毎や、会社の組織毎あるいは会社の業種毎に用意したテーブルがある。「重複:大」とは重複可能性が大であることを示すが、重複可能性が大とすることに代えて、重複している可能性を確率などの数値で表しても良く、重複している可能性が大の場合は0.9(90%)、中の場合は0.6(60%)、小の場合は0.2(20%)などの数値が割り当てられる。
図5−4は、1枚ごとの重複可能性を判定した後、複数枚まとめて、または連続で読み取ったとき、過去に読み取ったレシート等の画像の束(一定の期間あるいはある店舗での取引に関する複数のレシート等)と重複している可能性を総合的に判定するためのテーブル例を示す図である。(1)デフォルトパターンと(2)顧問先毎、会社の組織毎、あるいは業種毎に閾値(パラメータ)を変更した例を示す。
複数枚まとめて読む場合とは、フラットベットスキャナやカメラなどで10枚くらい一度に読み取る場合、あるいは1枚のシート(紙など)にレシート等を10枚くらい貼り付けてあるものを読み取る場合などがある(図8参照)。
あるいは1枚のシート(紙など)にレシート等を10枚くらい貼り付けてあるものを読み取る場合には、レシート等の画像を、それぞれ1枚ずつ切り出して、レシート等のサイズなども取得して、1枚ずつ別々に登録する。
図5−5は、会計事務所の顧問先毎や、会社の組織毎に管理するための会社マスタの一実施例を示すテーブルで、図5−5(A)は、会計事務所と顧問先間でシステムを運用する場合を示し、図5−5(B)は、本店と支店等の間で運用する場合の例を示している。
図5−6は、図3C用の重複総合判定テーブル(1枚ごとの判定用)であり、顧問先毎あるいは会社の業種毎に、判定結果イ、ロ、ハ、ニの重複可能性の数値に対し、それぞれ一定の重み付けをした、複数の判定パターンのテーブルである。
図6−1は、重複可能性が一定の閾値以上の場合のユーザーの確認画面であって、過去に読み取ったレシート等の画像と新たに読み込んだレシート等の画像とを左右に対比して確認するための画面の一例である。
左右対比は、あくまで一例であって、上下で対比したりするほか、新たに読み込んだレシート等の画像に対し、重複する可能性のあるレシート等の画像をポップアップ表示で対比できるように表示しても構わない。
図6−2は、重複可能性が一定の閾値以上の場合のユーザーの確認画面であって、いずれかのレシート等の画像を拡大表示した場合において、もう一方の画像を同じ拡大率で表示すると共に、一方の画像をスクロールすると、他方の画像も同様に自動スクロールされる様子を示す図である。
図6−3は、重複可能性が一定の閾値以上の場合のユーザーの確認画面であって、重複する可能性のある取り込み済みのレシート等が複数ある場合の例である。
図6−4は、今回新たに読み込んだ複数のレシート等の画像のうち、複数枚が、過去に読み取ったレシート等の画像と重複する場合の区別表示の例を示している。また、重複候補が多い場合は、操作者が簡易的に選別できるように重複候補をリスト形式で表示してもよい。
図6−5は、カメラやスキャナなど、どの画像取込装置を使用するかの設定、および重複判定処理を行なうか否か、および重複判定を行なう場合に、今行なうか、それとも画像を読み込んで仮登録した後に行なうかの設定を行なう画面である。
図7は、イメージ管理テーブル(図5−1)で管理しているレシート等の画像について、レシート等の画像に対する処理(テキスト等の認識処理、レシート等の画像の特徴パターンの抽出処理の内容)、および、これらの情報と、会計データ入力によって取得したデータに基づいて、品名辞書や店名辞書などを別途用意して、品名や店舗名などの情報や、勘定科目との対応付けを行なう処理の概要を示す図である。
図8は、1枚のシート(紙)に複数枚のレシート等を貼り付けて管理し、纏めて読み取る場合の例である。
FIG. 1-1 is a diagram showing a system configuration of the present invention, and is an example showing a set of a terminal device 10 and an image capturing device 50.
FIG. 1-2 is a diagram illustrating a system configuration of the present invention, and illustrates a case where a set of the terminal device 10 and the image capturing device 50 of the present invention is connected to each other via the LAN 60.
1-3 is a diagram showing a system configuration of the present invention, and shows a case where a set of the terminal device 10 and the image capturing device 50 of the present invention is connected to the server 100 via the LAN 60. FIG. .
FIG. 1-4 is a diagram showing a system configuration of the present invention. A set of the terminal device 10 and the image capturing device 50 of the present invention is connected to the end of a WAN (wide area network) 70 via a LAN or a router 60. It is a figure which shows the case where it connects to the server 100 in.
FIG. 1-5 is a diagram illustrating a system configuration when an image such as a receipt is exchanged between an accounting office and a consultant.
FIG. 1-6 is a diagram illustrating a system configuration when an image such as a receipt is exchanged between an accounting office and a home worker.
FIG. 1-7 is a diagram illustrating a system configuration for exchanging images such as receipts between a company head office (head office) and a branch office.
FIG. 2A is a functional block diagram of the terminal device 10.
FIG. 2B is a functional block diagram of the server 100.
FIG. 3A is a flowchart showing the entire processing contents of the accounting processing system of the present invention.
FIG. 3B is a diagram showing a processing flow of a duplication determination processing subroutine for receipts and the like captured in the past, in which the processing contents of step S3A-5 of the overall processing flow are described in detail.
FIG. 3C is a diagram illustrating a modification of the duplication determination processing subroutine of FIG. 3B.
FIGS. 3D and 3E are diagrams in the case where the character recognition result comparison process and the image feature pattern comparison process of FIG.
FIG. 4 is a diagram showing a processing flow of portable processing for taking out and operating the terminal device 10 from a state in which the server 100 and the terminal device 10 are connected.
FIG. 5A is an image management table in which an image ID is assigned to an image such as a receipt read for each advisor or company, or for each organization such as a head office, a branch, or a sales office in the company. FIG. 6 is a diagram showing a state in which character recognition results of images and the like, image feature patterns, accounting data, and the like are managed in association with each other.
FIG. 5B is a diagram illustrating a data configuration of accounting data such as journal data, which is data generated using an accounting input application.
FIG. 5-3 is a table for determining the possibility that each newly read image such as a receipt is duplicated with an image such as a receipt read in the past. 2 is a diagram illustrating an example of an overlap comprehensive determination table for comprehensively determining an image feature pattern comparison result. There are (1) a default pattern, (2) an example in which a threshold value (parameter) is changed, and (3) a table prepared for each advisor, for each organization of the company, or for each type of business of the company. “Duplicate: Large” indicates that the possibility of duplication is high, but instead of increasing the possibility of duplication, the possibility of duplication may be expressed by a numerical value such as probability. A numerical value such as 0.9 (90%) is assigned when the possibility is high, 0.6 (60%) is indicated when it is medium, and 0.2 (20%) is assigned when the value is small.
Fig. 5-4 shows a bundle of images such as receipts read in the past (determined for a certain period or transaction at a certain store) when multiple sheets are read together or continuously after determining the possibility of overlap for each sheet. It is a figure which shows the example of a table for comprehensively determining the possibility of overlapping with a plurality of receipts etc.). (1) Default pattern and (2) An example in which threshold values (parameters) are changed for each advisor, each company organization, or each industry.
Reading multiple sheets collectively means reading about 10 sheets at a time with a flatbed scanner or camera, or reading about 10 sheets of receipts attached to a single sheet (paper, etc.). Yes (see FIG. 8).
Alternatively, when reading about 10 sheets of receipts attached to a single sheet (paper, etc.), cut out the images of the receipts one by one, obtain the size of the receipts, etc. Register one by one separately.
FIG. 5-5 is a table showing an example of a company master for management for each accounting firm advisor or each company organization, and FIG. 5-5 (A) shows the accounting office and advisors. FIG. 5B shows an example in which the system is operated between a head office and a branch office.
FIG. 5-6 is an overlap comprehensive determination table (for determination for each sheet) for FIG. 3C. Numerical values of the possibility of overlap of determination results (i), (b), (c), (d) for each consultant or for each business type of company. On the other hand, it is a table of a plurality of determination patterns, each of which has a constant weight.
FIG. 6A is a user confirmation screen when the possibility of duplication is equal to or greater than a certain threshold, and confirms a receipt image read in the past and a newly read receipt image or the like in comparison with the left and right. It is an example of the screen for doing.
The left-right contrast is just an example, and in addition to comparing the top and bottom, images such as receipts that may overlap are displayed in a pop-up display so that they can be compared with newly read images such as receipts. It doesn't matter.
FIG. 6-2 is a user confirmation screen when the possibility of duplication is equal to or greater than a certain threshold value. When an image such as one of receipts is enlarged and displayed, the other image is displayed at the same magnification. In addition, when one image is scrolled, the other image is automatically scrolled in the same manner.
FIG. 6C is an example of a user confirmation screen when the possibility of duplication is equal to or greater than a certain threshold value, and is an example in which there are a plurality of received receipts that may overlap.
FIG. 6-4 illustrates an example of the distinguishing display when a plurality of images such as receipts newly read this time overlap with images such as receipts read in the past. If there are many duplicate candidates, the duplicate candidates may be displayed in a list format so that the operator can easily select them.
FIG. 6-5 shows the setting of which image capturing device such as a camera or scanner is used, whether or not to perform duplication determination processing, and whether or not to perform duplication determination, or whether to read an image. This is a screen for setting whether to perform after temporary registration.
FIG. 7 shows processing of images such as receipts managed by the image management table (FIG. 5A) (contents of recognition processing of texts, extraction processing of feature patterns of images such as receipts). In addition, based on this information and data acquired by accounting data input, a product name dictionary, store name dictionary, etc. are prepared separately, and information such as product name and store name, and processing for associating with account items It is a figure which shows an outline.
FIG. 8 shows an example in which a plurality of receipts and the like are pasted and managed on a single sheet (paper) and collectively read.

[用語の説明]
証ひょうとは、レシート、領収書、領収書や伝票、クレジットカードの利用明細、通帳のコピーなど、取引の内容及び取引があった事実を証明する資料であり、原始証憑などと呼ばれることもある。紙媒体のほか、イメージで取得する場合を含む。
会計データとは、取引の情報、取引の情報から勘定科目などを確定させた仕訳データ、その他の会計処理に用いられる情報をいう。取引の日付や金額、品名や数量、店名のほか、どういう経緯や内容の取引であるかを示す摘要、勘定科目などを含む概念である。
会計データDBとは、会計データを格納しておくデータベースである。
会計事務所とは、税理士や会計士および職員によって運営され、会計専門知識を持つ専門家が所属する会計事務処理を行う会計専門家組織をいう。
顧問先とは、会計事務所との契約又は業務委託などにより、会計税務処理や会計税務処理にかかわる指導やサービスを受ける個人や個人事業主をいう。
本店等とは、一企業内の本社や本店のほかグループ企業内の親会社を含む概念である。
支店等とは、一企業内の支社や支店のほかグループ企業内の子会社を含む。支店等には事業所、営業所を含む概念である。また、企業の各部門などの概念も含み、要するに企業の各組織を示す用語である。なお、本支店間の会計処理においては、本店等では、会計知識を有する経理部門等に所属する者による会計データ入力などの会計処理が行なわれ、支店等では会計知識を有しない者による取引データの入力などが行なわれることが多い。
在宅ワーカー(在宅者)とは、自宅等の会計事務所外の場所で会計処理等の業務を行う会計事務所の先生や職員が、会計処理業務のうちの一部を委託された場合の外部の業者ないし個人事業主等をいう。
監査とは、会計事務所が顧問先の会計データを月次(月毎)あるいは4半期ないし半期ないし1会計期間ごとに、会計基準や税法に則しているかどうかを確認して、適宜修正等することをいう。会計事務所の税理士や会計士等の先生や職員の場合は、会計監査として、会計システムで表示された会計データに対し、検証(チェック)を行い、検証の結果、必要に応じて会計データの修正等を行ないながら、会計システムに表示されている会計データ(日付、科目、金額、取引情報等)の適切性を確認する。
イメージ管理DBとは、レシート等の画像にIDを割り振って、顧問先毎や会社毎に、あるいは会社内の本店や支店や営業所等の組織毎に管理し、レシート等の画像の文字認識結果や特徴パターンおよび会計データ入力によって取得したデータとの対応付けを行なうデータベースである。その内容は図5−1のイメージ管理テーブルに記載する。

1枚ごとの重複可能性の閾値とは、図5−3に示すように、文字認識の比較結果と画像の特徴パターンの比較結果との組み合わせによって、重複している可能性が「高い、中程度、低い、殆ど無い」などと、段階的に区別できる場合において、例えば、重複して可能性が「中程度」を閾値として、これを超える場合に、図6−1〜図6−4のように重複する可能性のあるレシート等の画像をユーザーに提示する。

複数枚まとめての判定するための重複可能性の閾値とは、図5−4に示すように、複数枚まとめて、または連続で読み取ったとき、読み込んだレシート等の画像について、全体として、過去に登録したレシート等の画像と重複している可能性が高いかどうかを判定するための閾値であって、例えば、新たにレシート等の画像を10枚読み込んだ中で、重複している可能性が中程度以上のものが2枚以上あった場合には、そういうことは希であるはずなので、この「2枚以上(あるいは2割以上など)」を閾値とし、この閾値を超える場合に、全体として、重複している可能性が高いと判定する。

実際には重複していないのに重複していると誤判定する場合には、日付や金額等の文字認識結果について誤認識した場合に、金額や日付等の桁数が合致していることにより画像の特徴パターンが同じであると判定されたような場合がある。具体的には、出先で同じタクシー会社を利用して、移動をくり返し、かつ金額の桁数が同じ場合や、同じ店舗で同じ品物を複数回購入した場合には、日付や金額や店名などの画像の特徴パターンが似ていることにより、文字認識結果に誤認識した場合は、重複している可能性があると判定される。
レシート等の画像の文字認識結果を取得できない場合や、誤認識する場合には、印刷状態が悪く、文字や店名などがかすれている場合のほか、スキャナで紙詰まりを起こしてレシート等の用紙が折れたりシワができたり破れてしまった場合などがある。
このような利用環境で重複の有無を正確に判断するため、1枚ごとの重複可能性の閾値及び、複数枚まとめての判定するための重複可能性の閾値を調整することもできる(図3A及び図3C 後述)。
[Explanation of terms]
A proof is a document that proves the contents of a transaction and the fact that the transaction has occurred, such as a receipt, receipt, receipt or slip, credit card usage details, passbook copy, etc. . This includes not only paper media but also images.
The accounting data refers to transaction information, journal data in which account items are determined from the transaction information, and other information used for accounting processing. It is a concept that includes a transaction date and amount, a product name and quantity, a store name, a description showing what kind of process and content the transaction is, and account items.
The accounting data DB is a database that stores accounting data.
An accounting office is an accounting professional organization operated by a tax accountant, accountant, or staff who performs accounting operations to which specialists with accounting expertise belong.
An advisor refers to an individual or an individual business owner who receives guidance or services related to accounting tax processing or accounting tax processing by contracting or outsourcing with an accounting firm.
The head office is a concept that includes the head office and head office in one company as well as the parent company in a group company.
Branches, etc. include branch offices and branches within one company as well as subsidiaries within a group company. The concept of a branch includes a business office and a sales office. In addition, it includes concepts such as each department of a company, and is a term indicating each organization of a company. In the accounting process between head offices, accounting data such as accounting data input by persons belonging to the accounting department with accounting knowledge is performed at the head office, etc., and transaction data by persons who do not have accounting knowledge at the branch office, etc. Are often entered.
A home worker is a person who is entrusted with a part of accounting work by a teacher or staff member of an accounting office that performs work such as accounting at a place outside the accounting office such as home. This means a contractor or individual business owner.
Auditing means that the accounting firm confirms whether or not the accounting data of the client is in compliance with accounting standards and tax laws on a monthly (monthly) or quarterly or semiannual basis or in each accounting period, etc. To do. In the case of teachers and staff such as tax accountants and accountants at accounting firms, the accounting data displayed in the accounting system is verified (checked) as an accounting audit, and as a result of the verification, the accounting data is corrected as necessary. Confirm the appropriateness of the accounting data (date, subject, amount, transaction information, etc.) displayed in the accounting system.
Image management DB assigns an ID to images such as receipts, and manages them for each advisor or company, or for each organization such as a head office, branch, or sales office in the company, and results in character recognition of images such as receipts And a database for associating data acquired by inputting characteristic data and accounting data. The contents are described in the image management table of FIG.

As shown in FIG. 5-3, the threshold value for the possibility of duplication for each image is determined by the combination of the character recognition comparison result and the image feature pattern comparison result as “high, medium possibility of duplication”. In the case where it is possible to distinguish in stages, such as “degree, low, almost none”, etc., for example, when the possibility of “medium” is duplicated and exceeds this threshold, Thus, images such as receipts that may overlap are presented to the user.

As shown in FIG. 5-4, the threshold value for the possibility of duplication for determining a plurality of sheets collectively is the past of the images such as receipts that are read when a plurality of sheets are read together or continuously. This is a threshold value for determining whether or not there is a high possibility of overlapping with an image such as a receipt registered in, and for example, there is a possibility that the image is duplicated while 10 images such as a receipt are newly read. If there are two or more cards with medium or higher, such a thing should be rare, so this “two or more (or more than 20% etc.)” is set as a threshold, and when this threshold is exceeded, the whole It is determined that there is a high possibility of overlap.

If it is not actually duplicated, but it is mistakenly judged that it is duplicated, the character recognition result such as date or amount will be misrecognized. There are cases where it is determined that the feature patterns of the images are the same. Specifically, if the same taxi company is used at the destination and the movement is repeated and the number of digits of the amount is the same, or if the same item is purchased multiple times at the same store, the date, price, store name, etc. If the character recognition result is erroneously recognized due to the similarity of the feature patterns of the images, it is determined that there is a possibility of duplication.
If the character recognition result of an image such as a receipt cannot be obtained or is misrecognized, the printing status is poor and the characters or store name is faint, and the paper such as a receipt is caused by a paper jam in the scanner. There are cases where it is broken, wrinkled, or torn.
In order to accurately determine the presence or absence of duplication in such a use environment, it is possible to adjust the duplication possibility threshold for each sheet and the duplication possibility threshold for judging a plurality of sheets together (FIG. 3A). And FIG. 3C described later).

[会計処理システムの一実施例の構成]
図1−1は、本発明の端末装置10と画像取込装置50のセットを示す例であり、画像取込装置50は、モバイル機器などの端末装置10内に構成されたカメラであってもよい。
この態様は、主に、会計事務所の職員や企業等の経理担当者などが、スタンドアローンとしての端末装置を用いて、会計データ入力する場合を想定している。
例えば、会計事務所の職員顧問先企業のレシート等を預かって、会計データ入力する場合や、顧問先企業に端末装置(ノートタイプやモバイル)を持ち込んで、顧問先で会計データ入力する場合や、企業の経理担当者が、自社の取引で発生したレシートや伝票などを、会計データ入力する場合である。
[Configuration of one embodiment of accounting system]
FIG. 1-1 is an example showing a set of the terminal device 10 and the image capturing device 50 of the present invention. The image capturing device 50 may be a camera configured in the terminal device 10 such as a mobile device. Good.
This mode mainly assumes a case where accounting staff or accounting staff such as a company inputs accounting data using a stand-alone terminal device.
For example, when accepting a receipt of an accounting firm employee advisory company and entering accounting data, bringing a terminal device (note type or mobile) to the advisory company and entering accounting data at the advisory company, This is a case where an accounting person in a company inputs accounting data such as a receipt or a slip generated in his / her transaction.

図1−2は、本発明の端末装置10と画像取込装置50(図1−1を参照)のセットが、LAN60を介して相互に接続され、読み取ったレシート等の画像などを共有するような場合を示す図である。
図1−3は、本発明の端末装置10と画像取込装置50のセットが、LAN60を介して、サーバー100に接続され、読み取ったレシート等の画像などをサーバー100の記憶部内で管理するような場合を示す図である。サーバー100は実サーバーの他、仮想サーバーなどを含むものとする。
図1−3の場合において、端末装置10は、LAN60やサーバー100に接続したまま、レシート等を読み取るほか、LAN60やサーバー100から切り離して、顧問先企業や支店等に持ち込んで、レシート等を読み取ることがあるものとする。
なお、サーバー100に無線LANやWANなどのインターフェースを介して、画像取込装置50を接続して、レシート等の画像をアップロードするようにしても良い。
FIG. 1-2 shows that a set of the terminal device 10 and the image capturing device 50 (see FIG. 1-1) of the present invention is connected to each other via the LAN 60 and shares an image such as a read receipt. It is a figure which shows a case.
FIG. 1-3 shows that the set of the terminal device 10 and the image capturing device 50 of the present invention is connected to the server 100 via the LAN 60 and manages images such as read receipts in the storage unit of the server 100. It is a figure which shows a case. The server 100 includes a virtual server in addition to a real server.
In the case of FIG. 1-3, the terminal device 10 reads a receipt or the like while being connected to the LAN 60 or the server 100, and disconnects from the LAN 60 or the server 100 and brings it to an advisory company or a branch to read the receipt or the like. There shall be.
Note that an image such as a receipt may be uploaded by connecting the image capturing device 50 to the server 100 via an interface such as a wireless LAN or WAN.

図1−4は、本発明の端末装置10と画像取込装置50のセットが、LANやルーター60を介して、WAN(ワイドエリアネットワーク)70の先にあるサーバー100に接続され、読み取ったレシート等の画像などをサーバー100の記憶部内で管理するような場合を想定している。また、サーバー100に、端末装置10および画像取込装置50を接続して、読み取ったレシート等の画像の重複判定と、レシート等の画像の登録を行なうようにしても良い。
この構成では、LANシステム構成の側が、会計事務所のシステムの場合の他、会計事務所の職員が、顧問先企業に出向いていた場合において、持ち込んだ端末装置10をWAN70の先のサーバー100に接続して、サーバー100の記憶部内でレシート等の画像を管理することができる。
なお、図示はしないが、LANシステム内の端末装置10は、さらにサーバー装置に接続され、サーバー装置を介して、ネットワーク(WAN70)の先にあるサーバー100に接続されるようにしてもよい。
1-4 shows a receipt in which a set of a terminal device 10 and an image capturing device 50 of the present invention is connected to a server 100 at the end of a WAN (wide area network) 70 via a LAN or router 60 and read. It is assumed that images such as are managed in the storage unit of the server 100. Alternatively, the terminal device 10 and the image capturing device 50 may be connected to the server 100 to perform duplication determination of images such as read receipts and to register images such as receipts.
In this configuration, when the LAN system configuration side is an accounting office system or when an accounting office staff is visiting an advisory company, the brought-in terminal device 10 is transferred to the server 100 ahead of the WAN 70. By connecting, images such as receipts can be managed in the storage unit of the server 100.
Although not shown, the terminal device 10 in the LAN system may be further connected to the server device and connected to the server 100 at the end of the network (WAN 70) via the server device.

あるいは、LANシステム構成の側が、顧問先企業のシステムであって、レシート等を読み取って、WAN70の先の会計事務所のサーバー100にレシート等の画像を登録するようにしても良い。このほか、LANシステム構成の側が、在宅ワーカーや外注業者あるいは企業内の各組織のシステムであってもよい。
サーバー100は、会計事務所内のサーバーであってもよく、クラウドやIDC(インターネットデータセンター)の実サーバーであってもよいし、仮想サーバーであってもよい。この場合において、会計事務所の職員は、サーバー100に接続された端末装置10を用いて、顧問先企業から送付されたレシート等の画像を表示しながら、会計データ入力することができる。
Alternatively, the LAN system configuration side may be a system of a consulting company, read a receipt, etc., and register an image, such as a receipt, in the server 100 of the accounting office ahead of the WAN 70. In addition, the LAN system configuration side may be a home worker, a subcontractor, or a system of each organization in the company.
The server 100 may be a server in an accounting office, a real server of a cloud or IDC (Internet data center), or a virtual server. In this case, the staff of the accounting office can input accounting data using the terminal device 10 connected to the server 100 while displaying an image such as a receipt sent from the consulting company.

あるいは、LANシステム構成の側が、企業の支店等のシステムであってWAN70の先のサーバー100が本店等に設置されたサーバーであってもよい。この場合、支店等の担当者がレシート等を端末装置10で読み取って、サーバー100の記憶部に保存する。そして、企業の本店等の経理担当者が本店側のサーバー100に接続された端末装置10を用いて、会計データ入力する。
Alternatively, the LAN system configuration side may be a system such as a branch office of a company, and the server 100 at the end of the WAN 70 may be a server installed at a head office or the like. In this case, a person in charge such as a branch reads the receipt or the like with the terminal device 10 and stores it in the storage unit of the server 100. Then, an accounting person such as a company head office enters accounting data using the terminal device 10 connected to the server 100 on the head office side.

図1−5は、会計事務所と顧問先の間で、WAN70を介して、レシート等の画像をやりとりする際のシステム構成を示す図である。この場合において、レシート等の画像を読み込んでサーバー100の記憶部に格納するのは、顧問先の端末装置10の場合の他、会計事務所の端末装置10をサーバー100から切り離して、顧問先に持ち込んで読み取った後、会計事務所に戻ってから、再び、サーバー100に接続して、サーバー100の記憶部に格納するようにしても良い。
FIG. 1-5 is a diagram illustrating a system configuration when an image such as a receipt is exchanged between the accounting office and the consultant via the WAN 70. In this case, an image such as a receipt is read and stored in the storage unit of the server 100 in addition to the case of the terminal device 10 of the advisor, and the terminal device 10 of the accounting office is separated from the server 100 and sent to the advisor. After bringing it in and reading it, it may be stored in the storage unit of the server 100 by connecting to the server 100 again after returning to the accounting office.

図1−6は、会計事務所と在宅ワーカーとの間で、WAN70を介して、レシート等の画像をやりとりする際のシステム構成を示す図である。在宅ワーカーは、会計事務所の職員の他、外部の業者ないし個人事業主等の場合がある。外部の業者ないし個人事業主等の場合、会計事務所側で顧問先毎のレシート等の画像について重複判定しない状態でサーバーに暫定的に格納して、重複判定および会計データ入力を在宅ワーカーの端末で行なう。
FIG. 1-6 is a diagram illustrating a system configuration when an image such as a receipt is exchanged between the accounting office and the home worker via the WAN 70. A home worker may be an outside trader or an individual business owner in addition to the staff of an accounting firm. In the case of an external business operator or individual business owner, the accounting office temporarily stores the images such as receipts for each consultant on the server in a state where there is no duplication judgment, and duplicate judgment and accounting data input are performed at the terminal of the home worker. To do.

図1−7は、企業の本店(本社)と支店等の間で、WAN70を介して、レシート等の画像をやりとりする際のシステム構成を示す図である。この場合において、レシート等の画像を読み込んでサーバー100の記憶部に格納するのは、支店等の端末装置10の場合の他、本店(本社)の端末装置10をサーバー100から切り離して、支店等に持ち込んで読み取った後、本店に戻ってから、再び、サーバー100に接続して、サーバー100の記憶部に格納するようにしても良い。
FIG. 1-7 is a diagram illustrating a system configuration when an image such as a receipt is exchanged via the WAN 70 between a company head office (head office) and a branch office. In this case, an image such as a receipt is read and stored in the storage unit of the server 100 in addition to the terminal device 10 such as a branch office, or the terminal device 10 of the head office (head office) is separated from the server 100 and the branch office or the like. After returning to the main store and returning to the main store, it may be connected to the server 100 again and stored in the storage unit of the server 100.

図2−1は、端末装置10の機能ブロック図である。
端末装置10では、通信部16を介して接続された画像取込装置50又は、内蔵のカメラなどの画像取込部12により、レシート等の画像を読み込んで、制御部14のOCR処理部で抽出されたテキスト文字について文字認識処理を行なうと共に、画像の特徴パターン抽出部により、レシート等の領域毎に、画像の特徴パターンを抽出する。
そして、文字認識処理で取得した文字認識結果と、画像の特徴パターン抽出部で取得した画像の特徴パターンをレシート等の画像と関連付けて、記憶部15に登録すると共に、重複可能性判定部により、過去に取り込んだレシート等の画像の文字認識結果および画像の特徴パターンと比較して、新たに読み取ったレシート等の画像が、過去に登録したレシート等の画像と重複している可能性を判定して、表示画像制御部により出力部13を介して、ユーザーに提示する。
FIG. 2A is a functional block diagram of the terminal device 10.
In the terminal device 10, an image such as a receipt is read by the image capturing device 50 connected via the communication unit 16 or the image capturing unit 12 such as a built-in camera and extracted by the OCR processing unit of the control unit 14. A character recognition process is performed on the text characters thus performed, and an image feature pattern is extracted for each region such as a receipt by the image feature pattern extraction unit.
Then, the character recognition result acquired in the character recognition process and the image feature pattern acquired by the image feature pattern extraction unit are associated with an image such as a receipt and registered in the storage unit 15, and the duplication possibility determination unit Compared with the character recognition result and image feature pattern of images such as receipts captured in the past, it is possible to determine the possibility that newly read images such as receipts overlap with images registered in the past. Then, it is presented to the user via the output unit 13 by the display image control unit.

制御部の各機能を実行するそれぞれの処理部は、CPU(中央処理装置)が、HDDなどの記憶部に記憶されたプログラムを、DRAMやSRAMなどで構成されたメインメモリにロードして、CPU(中央処理装置)がプログラムの各ステップを実行することで実現される。
Each processing unit that executes each function of the control unit is configured such that a CPU (central processing unit) loads a program stored in a storage unit such as an HDD into a main memory including a DRAM, an SRAM, and the like, and the CPU (Central processing unit) is implemented by executing each step of the program.

図2−2は、サーバー100の機能ブロック図である。
サーバー100は、実サーバーのほか仮想サーバーその他のクラウドであってもよい。
サーバー100では、端末装置10で読み取ったレシート等の画像を、通信部160を介して受信して、記憶部150に保存すると共に、端末装置10の操作に応じて、制御部140のOCR処理部で抽出されたテキスト文字について文字認識処理を行なうと共に、画像の特徴パターン抽出部により、レシート等の領域毎に、画像の特徴パターンを抽出する。
そして、文字認識処理で取得した文字認識結果と、画像の特徴パターン抽出部で取得した画像の特徴パターンをレシート等の画像と関連付けて、記憶部150に登録すると共に、重複可能性判定部により、過去に取り込んだレシート等の画像の文字認識結果および画像の特徴パターンと比較して、新たに読み取ったレシート等の画像が、過去に登録したレシート等の画像と重複している可能性を判定し、重複している可能性の判定結果を記憶部150に保存する。
重複している可能性の判定結果は、WAN70やLAN60のネットワークを介して、端末装置10の表示部で表示される。


[全体処理フロー]
FIG. 2B is a functional block diagram of the server 100.
The server 100 may be a virtual server or other cloud in addition to a real server.
In the server 100, an image such as a receipt read by the terminal device 10 is received via the communication unit 160 and stored in the storage unit 150, and the OCR processing unit of the control unit 140 is operated according to the operation of the terminal device 10. In addition to performing character recognition processing on the text characters extracted in step 1, an image feature pattern extraction unit extracts an image feature pattern for each region such as a receipt.
Then, the character recognition result acquired in the character recognition process and the image feature pattern acquired by the image feature pattern extraction unit are associated with an image such as a receipt and registered in the storage unit 150, and the duplication possibility determination unit Compared with the character recognition result and image feature pattern of images such as receipts captured in the past, it is possible to determine the possibility that newly read images such as receipts overlap with images registered in the past. The determination result of the possibility of duplication is stored in the storage unit 150.
The determination result of the possibility of duplication is displayed on the display unit of the terminal device 10 via the WAN 70 or LAN 60 network.


[Overall process flow]

図3Aは、本発明の会計処理システムの、処理内容の全体を示すフローチャートである。
レシート等の画像は、会計事務所にとっての顧問先毎、あるいは本店にとっての支店毎に管理されており、その管理のために会社マスタが用意されている。
以下、主に、会計事務所が顧問先の会計専門サービスを行なう場合を例に説明するが、本店と支店の関係に置き換えても同様である。
FIG. 3A is a flowchart showing the entire processing contents of the accounting processing system of the present invention.
Images such as receipts are managed for each advisor for the accounting office or for each branch for the head office, and a company master is prepared for the management.
Hereinafter, the case where the accounting office provides the accounting specialist service of the consultant will be described as an example, but the same applies to the relationship between the head office and the branch.

図3Aにおいて、まず、処理対象の顧問先を選択し(ステップS3A−1)、所定の枚数のレシート等を読み込む(ステップS3A−2)。
所定の枚数のレシート等の読み込みを終えると(ステップS3A−3)、レシート等に印字されている文字列をテキストとして把握するための文字認識処理(OCR処理)を行なうと共に、印字されているロゴなどの店名や、品名、数量、金額、年月日などの画像の特徴パターンを、ビットマップ画像ないし始点と終点の座標や矩形領域の位置や範囲の情報(以下、画像の特徴パターン)として抽出する処理を行なう(ステップS3A−4)。
In FIG. 3A, first, an advisor to be processed is selected (step S3A-1), and a predetermined number of receipts are read (step S3A-2).
When reading of a predetermined number of receipts and the like is completed (step S3A-3), a character recognition process (OCR process) for grasping a character string printed on the receipt or the like as text and a printed logo are performed. Image feature patterns such as store names, product names, quantities, amounts, and dates are extracted as bitmap images or coordinates of the start and end points, and information on the position and range of rectangular areas (hereinafter referred to as image feature patterns). (Step S3A-4).

なお、ステップS3A−2からステップS3A−3のレシート等の画像の読取り処理およびステップS3A−4のテキスト等の文字認識処理と画像の特徴パターンの抽出処理は、それぞれ独立して行なうことにしても構わないし、レシート等の画像の読み込みと文字認識結果及び抽出した画像の特徴パターンの登録処理と、重複判定処理は連続して行なってもよいし、レシート等の画像や文字認識結果及び抽出した画像の特徴パターンの登録処理後に重複判定処理を行なうようにしても良い。
この重複判定処理を適用するかどうか、いつ適用するかの設定画面の様子を、図6−5に示す。
図6−5によれば、端末装置10で使用する画像取込装置50の種類(内蔵カメラ、外付けのスキャナなど)の設定、および、重複判定処理を行なうかどうか、重複判定処理を行なう場合に、新たなレシート等の画像を読み取っている「今行なう」か、それともレシート等の画像を読み取って、一時、記憶部に仮登録した「後に(別途)行なうか」などの設定を行なうことができる。
この重複判定処理の設定を「後に(別途)行なうか」と設定した場合は、図5−1のイメージ管理テーブルに、重複判定を後で行なうフラグを立てて、レシート等の画像を本登録する際に、当該フラグで重複判定処理を自動実行したり、あるいは重複判定処理の実行を促す画面表示を行なう(図示せず)。
It should be noted that the image reading process such as receipts in steps S3A-2 to S3A-3 and the character recognition process such as text and the image feature pattern extraction process in step S3A-4 are performed independently of each other. Of course, reading of images such as receipts, character recognition results and feature pattern registration processing of extracted images, and overlap determination processing may be performed continuously, or images of receipts and character recognition results and extracted images. The overlap determination processing may be performed after the feature pattern registration processing.
FIG. 6-5 shows the state of the setting screen whether or not to apply this duplication determination process.
According to FIG. 6-5, when setting the type of the image capturing device 50 (internal camera, external scanner, etc.) used in the terminal device 10 and whether or not to perform duplication determination processing, the duplication determination processing is performed. In addition, it is possible to make settings such as “to do now” when reading an image such as a new receipt or “reading (separately)” after temporarily reading an image such as a receipt and temporarily registering it in the storage unit. it can.
When the setting for the duplication determination process is set to “whether it will be performed later (separately)”, a flag for performing the duplication determination later is set in the image management table in FIG. At this time, the overlap determination process is automatically executed by the flag, or a screen display for prompting the execution of the overlap determination process is performed (not shown).

図7に示すように、画像の特徴パターンの一具体例としては、レシート等の上部から順に、会社名などのロゴ領域、店舗名や電話番号、担当者、取引の年月日、品名、数量、金額、バーコードなどが、各段落ないし領域毎に印刷されているのを、それぞれビットマップ画像ないし始点と終点の座標や矩形領域の位置や範囲の情報として取得したものである。なお、取引内容として会社名、電話番号、担当者、取引の年月日、品名、数量、金額や店舗名の他に他部署名や取引先名、支社や営業所等の名前も含まれる。
ここで、例えば、年月日や金額の画像の特徴パターンは、その幅に日付や金額の桁数などが反映された特徴を有しており、画像の特徴パターンの比較において、このような特徴を比較することで、同一の取引内容であるかどうかの判断指標とすることができる。
なお、画像の特徴パターンとしては、領域毎の部分的な画像の特徴パターンのほか、レシート等の全体を把握した特徴パターンがあり、図7の右側に、特徴パターン(全体)のように一例を示している。
As shown in FIG. 7, as an example of the feature pattern of the image, in order from the top of the receipt, etc., the logo area such as the company name, the store name and telephone number, the person in charge, the date of transaction, the product name, the quantity The amount, bar code, and the like are printed for each paragraph or area, respectively, as bitmap images, coordinates of the start and end points, and information on the position and range of the rectangular area. In addition to the company name, telephone number, person in charge, date of transaction, product name, quantity, amount of money, and store name, the contents of the transaction include names of other departments, names of business partners, branch offices, sales offices, and the like.
Here, for example, the feature pattern of the image of the date and the amount of money has a feature in which the date and the number of digits of the amount are reflected in the width, and such a feature is compared in the comparison of the feature pattern of the image. Can be used as a determination index as to whether or not the transaction contents are the same.
In addition to the partial image feature pattern for each region, there are feature patterns that grasp the entire receipt, etc., and an example of the feature pattern of the image is shown on the right side of FIG. Show.

ここで、画像の特徴パターンの抽出処理は、ロゴなどの店名や、品名、数量、金額、年月日などの属性を把握した上で行なうようにしても良いし、特に個々の画像の特徴パターンの属性を把握せずに、おおまかに、上段は何、中段は何、という大まかな把握の他、何らかの店名ないし品名等の会計処理に有用な情報のいずれかであるという把握の仕方で個々の画像の特徴パターンの属性を問わずに画像の特徴パターンを抽出するようにしても良い。
個々のロゴなどの店名や、品名、数量、金額、年月日などの属性を正確に把握して重複判定できるのが理想的ではあるが、文字のカスレ等により文字認識に失敗したり文字認識の精度が低い場合には、逆に重複判定ができないことになるので、本発明では、文字認識に失敗したり文字認識の精度が低く、店名や、品名、数量、金額、年月日などの属性を把握できないようなケースを想定して、重複判定ができる範囲を広げる趣旨である。
また、画像の特徴パターンとしては、カラー情報も利用することができる。
Here, the image feature pattern extraction process may be performed after grasping the store name such as logo, and the attributes such as product name, quantity, price, and date, and in particular, the feature pattern of each image. Rather than grasping the attributes of the individual, in general, in addition to a rough grasp of what is in the upper row and what is in the middle row, it is individual information in a way of grasping that it is any information useful for accounting processing such as some store name or product name The feature pattern of the image may be extracted regardless of the attribute of the feature pattern of the image.
Ideally, it would be possible to determine the duplicates by accurately grasping the store name such as individual logos and the attributes such as product name, quantity, price, date, etc., but character recognition failed or character recognition due to character blurring etc. If the accuracy is low, duplicate determination cannot be made, so in the present invention, the character recognition fails or the character recognition accuracy is low, and the store name, product name, quantity, amount, date, etc. This is intended to widen the range where duplication can be determined assuming a case where the attribute cannot be grasped.
Further, color information can also be used as an image feature pattern.

なお、画像の特徴パターンは、上記及び図5−1のイメージ管理テーブルで例示したものに限られず、画像の特徴を表すものであれば何でも構わない。もちろん、レシート等の外形サイズも含まれる。外形サイズは、品数が増えるとそれに対応して増大するほか、店舗や取引先毎にユニークなサイズを採用しているので、特徴を良く表現しているからである。
また、画像の特徴パターンは、例示した中の、いずれか1つ以上を使用すれば良く、複数を組み合わせることで判定の精度が向上していく。
Note that the feature pattern of the image is not limited to that illustrated in the above and the image management table in FIG. 5A, and may be anything as long as it represents the feature of the image. Of course, an external size such as a receipt is also included. This is because the outer size increases correspondingly as the number of products increases, and the unique size is adopted for each store and business partner, so the features are well expressed.
Further, any one or more of the illustrated feature patterns may be used, and the accuracy of determination is improved by combining a plurality of feature patterns.

図3AのステップS3A−4の文字認識処理、画像の特徴パターンの抽出処理を終えると、過去に読み取ったレシート等の画像との重複判定処理のサブルーチンをコールして実行(ステップS3A−5)。
重複判定処理のサブルーチンの詳細は後述する。
When the character recognition process and the image feature pattern extraction process in step S3A-4 in FIG. 3A are completed, a subroutine for a process for determining overlap with an image such as a receipt read in the past is called and executed (step S3A-5).
Details of the duplication determination subroutine will be described later.

読み込んだ所定の枚数のレシート等について、重複判定処理が終了すると、ユーザーに、重複している可能性が一定の閾値を超えたものを提示して、読み込んだレシート等の画像を、記憶部に正式に登録するか、あるいは削除するかの操作を求める画面表示を行なう(ステップS3A−6)。
確認表示の特徴については後述する。
When the duplication determination process is completed for a predetermined number of receipts and the like that have been read, the user is presented with a possibility of duplication exceeding a certain threshold value, and the read receipt and other images are stored in the storage unit. A screen display requesting an operation for formal registration or deletion is performed (step S3A-6).
The features of the confirmation display will be described later.

ユーザーによる確認の結果、重複していない場合には(ステップS3A−7:重複なし)、新たに読み込んだレシート等の画像を、認識結果や画像の特徴パターンの情報と関連付けて記憶部に正式に登録(学習)する(ステップS3A−8)。
記憶部に登録されたレシート等の画像は、以後、過去に読み取ったレシート画像として管理され、重複判定時に使用される。
他方、重複していると判定される場合には(ステップS3A−7:重複あり)、ユーザーの操作により、当該新たに読み込んだレシート等の画像を削除する処理を行なうと共に、重複判定の結果を記憶部に登録する(ステップS3A−9)。
As a result of confirmation by the user, if there is no duplication (step S3A-7: no duplication), the newly read image such as a receipt is officially stored in the storage unit in association with the recognition result and the feature pattern information of the image. Register (learn) (step S3A-8).
An image such as a receipt registered in the storage unit is thereafter managed as a receipt image read in the past, and is used when determining duplication.
On the other hand, if it is determined that there is an overlap (step S3A-7: there is an overlap), a process for deleting the newly read image such as a receipt is performed by the user's operation, and the result of the overlap determination is displayed. Register in the storage unit (step S3A-9).

図3AのステップS3A−9のレシート等の画像の重複判定の処理を終えると、会計データ入力の処理を行なう(ステップS3A−10)。
会計データ入力の処理では、例えば、仕訳データを入力するアプリを起動したり、現金の取引を入力する出納帳アプリを起動して行なう(ステップS3A−10)。
入力した情報のうち、摘要の情報については、さらに予め店舗名辞書や、品名辞書などを登録しておいて、摘要の情報から店舗名や品名の情報を抽出し、文字認識結果や画像の特徴パターンの情報と関連付けて学習、登録して再利用することができる(ステップS3A−11)。
When the processing for determining the overlap of images such as receipts in step S3A-9 in FIG. 3A is completed, processing for inputting accounting data is performed (step S3A-10).
In the accounting data input process, for example, an application for inputting journal data or an accounting application for inputting a cash transaction is started (step S3A-10).
Of the input information, for the summary information, register a store name dictionary, product name dictionary, etc. in advance, extract the store name and product name information from the summary information, character recognition results and image features Learning, registering, and reusing can be performed in association with pattern information (step S3A-11).

例えば、イメージ管理テーブル(図5−1)で、店舗名と他の情報との紐付けを行ない、店舗毎にソートすることで、イメージ管理テーブルを辞書として用い、店舗毎のイメージ管理ができ、ある店舗では、日用品、ある店舗では、飲食費といった勘定科目との対応付けも可能となり、これらと異なる勘定科目を入力しようとすると注意表示を行なったり、あるいは自動的によく使う推奨科目を提示することができる。
また、イメージ管理テーブル(図5−1)では、レシート等の画像に対し、仕訳などの会計データとの紐付けもされているので、推奨科目を提示すると共に、そのレシート等の店名や科目に関連する仕訳データを提示することもできる。
また、あるレシート等の画像に対し、関連するレシート等の画像を検索して提示することもできる。その際の検索処理では、ユーザーが検索条件を入力するためのUI(ユーザーインターフェース)により検索項目を選択したり入力を受付けるようにしたり、そのレシート等の画像に関連付けられた科目や摘要あるいは店名などの情報に基づいて、登録済みのレシート画像を検索する。
あるいは、そのレシート等の画像に対し、登録済みのレシート等の文字認識結果や画像の特徴パターンの比較で一致する項目が多い順などにソートして、一致する項目が多い順に列挙することもできる。
For example, in the image management table (FIG. 5-1), the store name and other information are linked and sorted for each store, so that the image management table can be used as a dictionary and image management can be performed for each store. In some stores, it is possible to associate items such as daily necessities and in some stores with food and beverage expenses. When you try to enter a different account item, a warning is displayed or a recommended item that is frequently used is automatically presented. be able to.
In the image management table (FIG. 5-1), since images such as receipts are linked to accounting data such as journals, recommended courses are presented, and store names and courses such as receipts are displayed. Related journal data can also be presented.
Further, an image such as a related receipt can be searched and presented for an image such as a certain receipt. In the search process at that time, the user selects a search item or accepts input through a UI (user interface) for inputting search conditions, and the subject, description, shop name, etc. associated with the image of the receipt, etc. The registered receipt image is searched based on the information.
Alternatively, the images such as receipts can be sorted in the order in which there are many matching items in the comparison of character recognition results such as registered receipts and feature patterns of images, and listed in the order in which there are many matching items. .

図7に示すように、レシート等の画像から、文字認識処理および画像の特徴パターン抽出処理を経て取得した、文字認識結果と、領域毎の画像の特徴パターン(部分)が、最終的に会計データ入力によって取得したデータ(日付、金額、摘要、店名、品名、勘定科目)などと対応付けられて、イメージ管理テーブル(図5−1)に登録される。

[過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチン]
As shown in FIG. 7, the character recognition result obtained from the image such as a receipt through the character recognition process and the feature pattern extraction process of the image, and the feature pattern (part) of the image for each area are finally converted into the accounting data. The data is registered in the image management table (FIG. 5-1) in association with data (date, amount, description, store name, product name, account item) acquired by input.

[Duplicate judgment processing subroutine with registered receipts imported in the past]

図3Bは、図3Aの全体処理フローのステップS3A−5の処理内容を詳細に記載した、過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチンの処理フローを示す図である。
このサブルーチンでは、文字認識処理で取得した日付や金額等のテキスト文字を利用した比較処理と、画像の特徴パターンの情報を利用した比較処理を組み合わせて、新たに読み込んだレシート等の画像が、過去に読み取ったレシート等の画像と重複している可能性を判定する処理を行なう。
ここで記載の「I」は文字認識の結果が「あり(結果が取得できた)」かつ文字認識の比較結果「一致」、「J」は文字認識の結果が「あり(結果が取得できた)」かつ文字認識の比較結果が「一部でも不一致(部分的に一致)」、「K」は文字認識結果が「なし(結果を取得できない)」、および「L」は画像の特徴パターンの比較結果が「一致」かつ画像全体の比較結果が「一致」、「M」は画像の特徴パターンの比較結果が「一致」かつ画像全体の比較結果が「不一致」、「N」は画像の特徴パターンが「不一致」、といったそれぞれの比較結果の状況を表すものとしてあくまで簡易的に付した符号である。
FIG. 3B is a diagram showing a processing flow of a duplication determination processing subroutine with a registered receipt and the like imported in the past, in which the processing contents of step S3A-5 of the entire processing flow of FIG. 3A are described in detail.
This subroutine combines a comparison process using text characters such as date and amount acquired in the character recognition process with a comparison process using information on the feature pattern of the image. A process of determining the possibility of overlapping with an image such as a receipt read in the above is performed.
Here, “I” indicates that the result of character recognition is “Yes (result was able to be obtained)” and comparison result of character recognition is “match”, and “J” is that the result of character recognition is “Yes” (result was obtained) ) ”And the character recognition comparison result is“ partial disagreement (partial match) ”,“ K ”is the character recognition result“ none (cannot obtain the result) ”, and“ L ”is the feature pattern of the image The comparison result is “match”, the comparison result of the entire image is “match”, “M” is the comparison result of the feature pattern of the image is “match”, the comparison result of the entire image is “mismatch”, and “N” is the feature of the image It is a code that is simply added as a representation of the status of each comparison result, such as a pattern “mismatch”.

図3Bにおいて、まず、必要に応じて処理を高速化するために、過去に読み取ったレシート等の画像の文字認識結果のテキスト文字や画像の特徴パターンの情報をメインメモリなどにロードするが(ステップS3B−1)、HDDやSSD、フラッシュメモリその他の長期記憶媒体に記憶したものと比較しても構わない。

重複元として参照するレシート等の画像は、図5−1のイメージ管理テーブルのように、会社ID毎(つまり顧問先毎や企業の支店などの部門毎)に管理されたものが対象となる。
また、時期的な範囲としては、「会計年度の初日の取引についての登録済みレシート等から」あるいは、「当月の初日の取引についての登録済みレシート等から」といった、ユーザー設定あるいは、システムのデフォルトで設定された範囲が対象とされる。
システムのデフォルトの設定としては、会計年度の初日、例えば3月末決算であれば、4月1日以降のレシート等を対象範囲とする設定が考えられる。
あるいは、顧問先等の企業等において、レシート等の管理が厳密であり、前月分までは確実に混じり合うことがないのであれば、ユーザー設定により、当月の初日からのレシート等の画像を対象範囲とする設定に変更できるようにしても良い。対象範囲を狭めることで、重複判定の処理を高速化することができるからである。
これらの設定は、図5−5(会社マスタ)などに反映され保存されている。
In FIG. 3B, in order to speed up the processing as necessary, first, text characters and image feature pattern information of a character recognition result of an image such as a receipt read in the past are loaded into a main memory or the like (step S3B-1), HDD, SSD, flash memory and other long-term storage media may be compared.

Images such as receipts that are referred to as duplication sources are those managed for each company ID (that is, for each advisor or branch of a company) as in the image management table of FIG.
In addition, the time range includes user settings such as “from registered receipts for transactions on the first day of the fiscal year” or “from registered receipts for transactions on the first day of the current month” or system defaults. The set range is targeted.
As the default setting of the system, for the first day of the fiscal year, for example, if the settlement is at the end of March, a setting that covers receipts from April 1 onward can be considered.
Or, if the management of receipts, etc. is strict in a company such as an advisor, and the images do not mix reliably until the previous month, the scope of the images such as receipts from the first day of the current month is set by the user setting. It may be possible to change the setting to This is because it is possible to speed up the overlap determination process by narrowing the target range.
These settings are reflected and stored in FIG. 5-5 (company master).

次に、重複判定処理に移行するが、当期の初日からのレシート等の画像を対象範囲とする場合において、1社あたり、1ヶ月で1,000枚のレシート等の画像がある場合、12月に参照するレシート等の画像の枚数は、4月から12月までの9ヶ月分、つまり9,000枚にも及ぶため、重複判定処理の処理内容や処理順序に工夫が必要となる。
この処理の高速化のため、例えば、文字認識結果の比較処理と画像の特徴パターンの比較処理を並列処理として起動する(ステップS3B−2)。
そして、文字認識結果の比較処理では、新たに読み込んだレシート等の画像の文字認識結果を取得できたかを確認し(ステップS3B−3)、カスレ等でそもそも文字認識結果を取得できないような場合には(ステップS3B−3の「なし」)、その比較結果の状況を「K」として記録し(ステップS3B−7)、文字認識結果を取得できた場合には(ステップS3B−3の「あり」)、テキスト文字を比較して、全てが一致する場合、一部でも不一致になる場合(部分的に一致する場合)などに場合分けして、それぞれの文字認識結果の状況を、「I」、「J」、・・・などとして記録する(ステップS3B−4、S3B−7)。
Next, the process proceeds to duplication determination processing. In the case where images such as receipts from the first day of the current period are targeted, if there are 1,000 images such as receipts per company per month, December Since the number of images such as receipts to be referred to is nine months from April to December, that is, 9,000, it is necessary to devise the processing contents and processing order of the duplication determination processing.
In order to speed up this process, for example, the character recognition result comparison process and the image feature pattern comparison process are started as parallel processes (step S3B-2).
Then, in the character recognition result comparison process, it is confirmed whether or not the character recognition result of the newly read image such as a receipt has been acquired (step S3B-3). (“No” in step S3B-3), the status of the comparison result is recorded as “K” (step S3B-7), and if the character recognition result can be acquired (“Yes” in step S3B-3) ), Comparing the text characters, if all match, even if some match (partial match), etc., the status of each character recognition result is "I", It is recorded as “J”,... (Steps S3B-4, S3B-7).

また、図3BのステップS3B−2からの文字認識処理と並行する処理として、画像の特徴パターンどうしを比較する処理を行なう(ステップS3B−5、S3B−6)。
具体的には、画像の領域毎の特徴パターン同士を比較し(ステップS3B−5)、いくつか画像の特徴パターンに不一致が含まれる場合には(ステップS3B−5の「不一致あり」)、比較結果の状況を「N」として記録し(ステップS3B−8)、画像の領域毎の特徴パターン同士が全て一致している場合には(ステップS3B−5の「一致」)、画像全体の画像の特徴パターンどうしの比較を行い(ステップS3B−6)、一致している場合には(ステップS3B−6の「一致」)、比較結果の状況を「L」として記録し(ステップS3B−8)、不一致の場合には(ステップS3B−6の「不一致」)、比較結果の状況を「M」として記録する(ステップS3B−8)。
Further, as a process in parallel with the character recognition process from step S3B-2 in FIG. 3B, a process for comparing the feature patterns of the images is performed (steps S3B-5 and S3B-6).
Specifically, the feature patterns for each area of the image are compared (step S3B-5), and if some of the feature patterns of the image include a mismatch (“mismatch” in step S3B-5), the comparison is performed. The status of the result is recorded as “N” (step S3B-8), and when all the feature patterns for each region of the image match (“match” in step S3B-5), the image of the entire image is recorded. The feature patterns are compared (step S3B-6). If they match (step S3B-6 “match”), the comparison result is recorded as “L” (step S3B-8). In the case of mismatch (“mismatch” in step S3B-6), the comparison result is recorded as “M” (step S3B-8).

なお、この場合において、画像の特徴パターンの比較処理で、領域毎あるいは画像全体の比較の順番は前後しても構わない。
また、本願実施例の図3Bでは並行処理した例を記載したが、文字認識結果の比較処理と、画像の特徴パターンの比較処理は、いずれか一方が他方に前後した処理としても構わない。
そして、文字認識結果の比較処理と、画像の特徴パターンの比較処理の両方が終了するようにタイミングを調整する等の同期処理を行なう(ステップS3B−9)。
なお、文字認識結果の比較処理は、テキスト文字の比較なので比較的軽い処理であるのに対し、画像の特徴パターンの比較処理は、比較的重い処理なので、システムの初期設定では、文字認識結果の比較処理を先に行なって重複可能性のある登録済みのレシート等の画像をできるだけ絞り込んだ上で、その後に画像の特徴パターンの比較処理を行なう処理を行い、処理時間の高速化を図るようにしても良い。
In this case, in the comparison process of the feature pattern of the image, the comparison order of each region or the entire image may be changed.
In FIG. 3B of the embodiment of the present application, an example in which parallel processing is performed is described. However, the character recognition result comparison processing and the image feature pattern comparison processing may be processing in which one of them is before or after the other.
Then, synchronization processing such as adjusting the timing is performed so that both the character recognition result comparison processing and the image feature pattern comparison processing are completed (step S3B-9).
The character recognition result comparison process is comparatively light because it compares text characters, whereas the image feature pattern comparison process is comparatively heavy. Perform comparison processing first to narrow down the images of registered receipts and the like that may be duplicated as much as possible, and then perform comparison processing of the image feature patterns to speed up the processing time. May be.

以上の文字認識処理で取得した日付や金額等のテキスト文字を利用した比較処理と、画像の特徴パターンの情報を利用した比較処理を組み合わせた処理により、文字認識結果は不一致だが、画像の特徴パターンの比較では一致しているというような場合(例えば、金額は一致しているが、年月日は文字が込み入っていて誤認識したような場合である)を含む、様々な態様の比較結果を得る。
このような比較結果を得て、当該1枚の新たに読み込んだレシート等の画像が、過去に読み取ったレシート等の画像と重複している可能性を総合的に判定する総合判定処理を行ない(ステップS3B−10)、判定結果を主記憶やHDDなどの記憶部に保存する(ステップS3B−11)。
Character recognition results do not match, but the image recognition pattern is the result of the combination of the comparison process using text characters such as date and amount obtained in the above character recognition process and the comparison process using image feature pattern information. The comparison results of various aspects, including the case where they match in the comparison of (for example, the amount of money is the same, but the date is misunderstood with letters included) obtain.
Obtaining such a comparison result, comprehensive determination processing is performed for comprehensively determining the possibility that the one newly read receipt image or the like overlaps with a previously read receipt image or the like ( In step S3B-10), the determination result is stored in a storage unit such as a main memory or HDD (step S3B-11).

1枚ごとの判定結果は、ステップS3B−13の複数枚まとめての判定で読み出して利用するほか、重複レシート等の重複確認画面(図6−1〜図6−4)で表示する際に用いられる。
なお、上記の文字認識結果の比較処理と、画像の特徴パターンの比較処理は、画像の特徴パターンの比較処理の方が処理量が多くなる傾向があり、並行して処理するか、いずれか一方を先に行なうかなどの判定を行なって決定することができる。
The determination result for each sheet is read and used in the determination of a plurality of sheets at the same time in step S3B-13, and is used when displayed on the overlap confirmation screen (FIGS. 6-1 to 6-4) such as a duplicate receipt. It is done.
Note that the comparison process of the character recognition result and the comparison process of the image feature pattern tend to have a larger processing amount in the comparison process of the feature pattern of the image. Can be determined by making a determination as to whether or not to perform the operation first.

1枚ごとの総合判定処理は、図5−3に示すような重複総合判定テーブルを用いて行なうことができるが、これに限られず、場合分けの組み合わせた処理フローの形で実施することもできる。
図5−3の重複総合判定テーブルでは、文字認識結果が一致していて(文字認識の比較結果の状況がI)、画像の特徴パターンの比較結果も領域毎の部分的な画像の特徴パターンの比較結果も一致し、画像全体での画像の特徴パターンの比較結果も一致しているような場合には(画像の特徴パターンの比較結果の状況がL)、重複している可能性が高いと判定される。
Comprehensive determination processing for each sheet can be performed using an overlap comprehensive determination table as shown in FIG. 5-3, but is not limited to this, and can also be performed in the form of a processing flow that combines cases. .
In the overlap comprehensive determination table of FIG. 5-3, the character recognition results match (the status of the character recognition comparison results is I), and the image feature pattern comparison results are also the partial image feature patterns for each region. If the comparison result also matches and the comparison result of the image feature pattern in the entire image also matches (the situation of the comparison result of the image feature pattern is L), the possibility of overlap is high Determined.

他方、文字認識結果が一致していて(比較結果の状況がI)、画像の特徴パターンの比較結果において、領域毎の部分的な画像の特徴パターンの比較結果に不一致な領域が含まれる場合には(画像の特徴パターンの比較結果の状況がN)、日付や金額などの桁数が違うと推測されるので、文字認識に誤認識があったなどと推定され、重複している可能性は低いと判定される。 On the other hand, when the character recognition results match (the comparison result status is I), and the comparison results of the image feature patterns include a mismatched region in the partial image feature pattern comparison results for each region. (The feature pattern comparison result status is N), and it is estimated that the number of digits such as date and amount is different. Determined to be low.

同様に、文字認識結果が取得できない場合でも(文字認識の状況がK)、画像の特徴パターンの比較結果が、領域毎の部分的な画像の特徴パターンどうしが一致し、かつ全体の画像の特徴パターンどうしが一致するような場合には、日付や金額の桁数も同じであると推定され、品名や個数なども同じであると推定され、さらに発行した店舗も同じと推定されるので、カスレ等でたまたま文字認識がうまくいかなかったと推定し、重複している可能性を中くらいと判定した上で、重複判定の漏れを防止し、ユーザーに念のために提示することができるように調整して判定する。
そして、今回読み込んだ、所定の枚数のレシート等の全てについて、それぞれの重複可能性を判定する(図3BのステップS3B−12)。
Similarly, even when the character recognition result cannot be acquired (character recognition status is K), the comparison result of the image feature patterns shows that the partial image feature patterns for each region match, and the entire image features If the patterns match, the date and amount of money are presumed to be the same, the product name and quantity are presumed to be the same, and the issued stores are also presumed to be the same. Estimated that the character recognition happened to be unsuccessful by mistake, etc., and determined that the possibility of duplication was medium, and adjusted so that duplication judgment can be prevented and presented to the user just in case Judgment.
Then, the possibility of duplication is determined for all of the predetermined number of receipts read this time (step S3B-12 in FIG. 3B).

それぞれ、1枚ごとの重複可能性の判定処理を終えると、複数枚まとめての重複判定の処理を行なう(ステップS3B−13)。
ここでは、後述の図5−4の重複総合判定テーブル(複数枚まとめての判定用)を使った処理を行なうものであるが、複数枚まとめての重複判定では、読み込んだ中で複数枚の重複可能性が中程度以上のものが含まれているような場合に、その一連のレシート等は、過去に読み取ったレシート等の画像等と重複する可能性が類型的に高いことを示すもので、1枚1枚の重複判定では、必ずしも高い精度で重複可能性を判定できない場合があるのを補完し、総合的に見て、今回新たに読み込んだレシート等は、管理が不十分で、過去に読み取ったレシート等と重複している可能性が高いという情報を、タイムリーにユーザーに提示でき、ユーザーは残りの数十枚、数百枚のレシート等の読取りを中断して、袋などに入っている残りのレシート等を再確認でき、無駄な読み込み作業をしないで済む点で、実務上有用である。
When the process for determining the possibility of duplication for each sheet is completed, the process for determining the duplication of a plurality of sheets is performed (step S3B-13).
Here, a process using the overlap overall determination table (for determination of a plurality of sheets collectively) shown in FIG. 5-4 described later is performed. However, in the overlap determination of a plurality of sheets, a plurality of sheets are read while being read. In cases where the possibility of duplication is moderate or higher, the series of receipts etc. indicates that the possibility of duplication with images such as receipts read in the past is typologically high. The duplication judgment of each sheet complements that the possibility of duplication may not always be judged with high accuracy, and comprehensively, receipts newly read this time are insufficiently managed, and the past Information that is likely to be duplicated with receipts, etc. read in a timely manner can be presented to the user in a timely manner, and the user interrupts reading of the remaining tens or hundreds of receipts and puts them in bags, etc. The remaining receipts etc. It can be re-confirmation, in that it is not necessary to wasteful read work, is a practice useful.

なお、複数枚まとめての重複判定により、過去の読み取ったレシート等の画像と完全に一致する場合はユーザーが同じレシート等の再度読取りを行ったものと、一部のみ一致する場合は取引内容が同じレシート等が含まれた新しいレシート等の読取を行ったものと判断してもよい。
以上の処理を終えると、サブルーチンを終了して、全体処理フローのステップS3A−6の確認表示に移行する。

In addition, due to the duplication determination of a plurality of sheets, if the image completely matches the image of a receipt read in the past, if the user re-reads the same receipt, etc. It may be determined that a new receipt including the same receipt has been read.
When the above processing is completed, the subroutine is terminated and the process proceeds to the confirmation display in step S3A-6 of the overall processing flow.

[過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチンの変形例]
過去に取り込んだ登録済みのレシート等との重複判定処理サブルーチンの変形例を、図3C、図3D、図3Eにより説明する。
図3Bとの相違は、文字認識結果の比較処理と、画像の特徴パターンの比較処理をそれぞれ図3Dおよび図3Eのようにサブルーチン化し、文字認識結果の比較処理と、画像の特徴パターンの比較処理について、それぞれ、比較するための重複判定の閾値などのパラメータを変更して、複数回ループさせる処理を追加したことである。
[Modified example of duplication judgment processing subroutine for registered receipts imported in the past]
A modification example of the duplication determination processing subroutine for a registered receipt or the like that has been captured in the past will be described with reference to FIGS.
The difference from FIG. 3B is that the character recognition result comparison process and the image feature pattern comparison process are converted into subroutines as shown in FIGS. 3D and 3E, respectively, and the character recognition result comparison process and the image feature pattern comparison process are performed. For each of the above, a process of changing a parameter such as a duplication determination threshold value for comparison and looping a plurality of times is added.

また、取引先や店舗などによって、発行するレシート等には、文字の大きさが小さいとか、ロゴや図形のようなものが含まれるなど一定の傾向があり、文字認識結果の比較処理や画像の特徴パターンの比較処理との相性がある。
このため、文字認識結果の比較処理と、画像の特徴パターンの比較処理を、それぞれ相互に前後させることで、文字認識結果の比較処理で合致するレシート等の画像を絞り込むのか、あるいは画像の特徴パターンの比較処理で合致するレシート等の画像を絞り込むのか、あるいは両方の比較処理を並行して動作させ、いずれか一方で絞り込むのではなく両方の比較処理をマージしてから絞り込むのか、といった複数の処理パターンを走らせて、それぞれ相性の良い比較方法を選択したり、それぞれを重み付けしたり、重み付けの数値を学習によって最適化することができる。
In addition, depending on the business partners and stores, the receipts issued, etc. tend to have a certain tendency such as small size of letters or things like logos or figures. Compatibility with feature pattern comparison processing.
Therefore, by comparing the character recognition result comparison process and the image feature pattern comparison process with each other, it is possible to narrow down images such as receipts that match the character recognition result comparison process, or the image feature pattern. Multiple processes such as whether to narrow down images such as receipts that match in the comparison process, or whether both comparison processes are operated in parallel, and both comparison processes are merged instead of narrowing down one of them By running the pattern, it is possible to select a comparison method having good compatibility with each other, weight each of them, and optimize the numerical value of weighting by learning.


図3Cにおいて、例えば、印字されている文字が大きく、画像が鮮明で文字認識結果の信頼度が高い場合には、まず、ステップS3C−3で文字認識結果の比較処理を行ない過去に読み取ったレシート等の画像で重複しそうなものをある程度絞り込んだ上で、引き続いて、文字認識結果の比較で重複が疑われるものについてステップS3C−4で画像の特徴パターンの比較処理を行ない、さらに閾値などのパラメータを変えて(ステップS3C−5)、文字認識結果の比較処理と画像の特徴パターンの比較処理を再度行なうこともできる。
あるいは、印字されている文字が小さかったり、レシート等の画像においてカスレ等が多い場合には、文字認識結果の信頼度が低いので、まず画像の特徴パターンの比較処理を先に実行し、画像の特徴パターンどうしが似ているものをピックアップし、その上で文字認識結果の比較処理を後に実行して、さらに絞込み、さらに閾値などのパラメータを変えて(ステップS3C−5)、文字認識結果の比較処理と画像の特徴パターンの比較処理を再度行なうこともできる。

In FIG. 3C, for example, when the printed character is large, the image is clear, and the reliability of the character recognition result is high, first, the receipt processing read in the past by comparing the character recognition result in step S3C-3. The images that are likely to overlap are narrowed down to some extent, and subsequently, the image feature pattern comparison process is performed in step S3C-4 for those that are suspected of being duplicated in the comparison of the character recognition results. (Step S3C-5), the character recognition result comparison process and the image feature pattern comparison process can be performed again.
Alternatively, if the printed characters are small or there are a lot of blurs in an image such as a receipt, the reliability of the character recognition result is low. Character patterns similar to each other are picked up, and then a character recognition result comparison process is executed later, further narrowing down and further changing parameters such as a threshold (step S3C-5), and comparing character recognition results The process and the comparison process of the feature pattern of the image can be performed again.

なお、図3Bで、イ、ロの重複判定処理、およびハと二を合わせた重複判定処理においては、図5−3の(1)デフォルトパターン、あるいは顧問先毎や会社の業種毎にカスタマイズした判定テーブルを用いて、閾値(パラメータ)を変えて、各重複判定処理を繰り返し行なうこともできる。
各重複判定処理が終了するように同期処理が行なわれ(ステップS3C−7)、重複判定処理の判定結果として、それぞれイ、ロ、ハ、二の4つの重複判定結果(1枚ごと)が得られる。
なお、ハとニの結果は、図5―5の重複判定テーブルに当てはめられて、文字認識結果の比較と、画像の特徴パターンの比較結果とを総合した重複可能性を出力する。
各判定結果は、重複可能性が大、中、小などで出力される他、重複可能性が大の場合は0.9(90%)、中の場合は0.6(60%)、小の場合は0.2(20%)などの重複している確率などの数値を用いてもよい。
In FIG. 3B, in the overlap determination process of (a) and (b) and the overlap determination process that combines c and c, (1) the default pattern of FIG. 5-3, or customized for each advisor or company type Using the determination table, each duplication determination process can be repeated by changing the threshold value (parameter).
Synchronization processing is performed so that each duplication determination process is completed (step S3C-7), and four duplication judgment results (each) are obtained as the judgment results of the duplication judgment processing. It is done.
The results of C and D are applied to the duplication determination table of FIG. 5-5, and the duplication possibility is output by combining the character recognition result comparison and the image feature pattern comparison result.
Each determination result is output with a high possibility of duplication, medium, small, etc., or 0.9 (90%) when the possibility of duplication is high, 0.6 (60%) when it is medium, and small In the case of, a numerical value such as the probability of duplication such as 0.2 (20%) may be used.

そして、イ、ロ、ハ、二の4つの重複判定結果(1枚ごと)が得られたのち、これらのうち、それぞれの重複判定処理の結果に対して、相性に応じて重み付けをして、重複可能性の総合判定を行なう(S3C−8)。
総合判定は、図5−6重複総合判定テーブル(1枚ごとの判定用)(図3C用)に当てはめて出力される。
その際、顧問先毎あるいは会社の業種毎に、各判定結果に対する重み付け(a、b、cの数値)をして、それぞれの業態に則した重複判定に最適化することができる。
なお、顧問先毎あるいは会社の業種毎に、重み付けを調整するのは、顧問先毎や、業種毎に、その取引先が一定の範囲になることが多く、その結果、レシート等にも一定の傾向が生じることになるため、顧問先毎や、業種毎に、レシート等の画像の重複判定処理において、文字認識結果の判定処理と画像の特徴パターンの比較処理それぞれの順番や閾値(パラメータ)の設定との間に相性が生じるからである。
Then, after four overlap determination results (each) are obtained (i, b, c), the weight of each overlap determination process is weighted according to the compatibility. A comprehensive determination of the possibility of duplication is performed (S3C-8).
The comprehensive determination is output by applying to the overlap comprehensive determination table (for determination for each sheet) (for FIG. 3C) in FIG.
At that time, weighting (numerical values of a, b, and c) for each determination result can be optimized for each consultant or for each type of business of the company, and optimization for duplication determination according to each business condition can be performed.
In addition, adjusting the weighting for each advisory company or each industry of a company often has a certain range of business partners for each advisory or industry, and as a result, a certain amount is also applied to receipts, etc. Since there is a tendency, the order of the character recognition results and the comparison process of the image feature patterns and threshold values (parameters) in the image duplication judgment processing such as receipts for each consultant and for each industry This is because compatibility occurs with the setting.

また、文字認識結果の比較処理は、テキスト文字の比較なので比較的軽い処理であるのに対し、画像の特徴パターンの比較処理は、比較的重い処理なので、システムの初期設定では、文字認識結果の比較処理を先に行なって重複可能性のあるレシート等の画像をできるだけ絞り込んだ上で、その後に画像の特徴パターンの比較処理を行なう処理(つまり図3Cの「イ」までの処理)の重み付けを(画像の特徴パターンの比較を先に行なう図3Cの「ロ」までの処理よりも)高くして、処理時間の高速化を図るようにしても良い。 The comparison process of character recognition results is a relatively light process because it compares text characters, whereas the comparison process of image feature patterns is a relatively heavy process. The comparison process is performed first to narrow down the images such as receipts that may be duplicated as much as possible, and thereafter the process of comparing the feature pattern of the image (that is, the process up to “A” in FIG. 3C) is weighted. It is also possible to increase the processing time (in comparison with the processing up to “B” in FIG. 3C in which the comparison of the image feature patterns is performed first) to increase the processing time.

図5−6の重複判定テーブルは、判定パターン1、2、3・・・のように判定パターン毎に用意された例を示したが、各判定パターンの重み付け(a、b、c)は、重複している可能性が一定レベル以上(例えば、中(0.6)以上)の場合に、ユーザーに提示して、実際に重複しているかどうかを確認し、その確認結果を得て、重複可能性の判定結果と、ユーザーの確認結果の誤差を、二乗平均誤差などの誤差関数で換算して、誤差関数が最小になるように、各判定パターンの重み付けの数値(a、b、c)を更新する機械学習を行ない、判定パターンの精度を向上させていくことができる。   Although the duplication determination table of FIGS. 5-6 showed the example prepared for every determination pattern like the determination patterns 1, 2, 3, ..., the weight (a, b, c) of each determination pattern is as follows. When the possibility of duplication is above a certain level (for example, medium (0.6) or more), present it to the user, check whether it is actually duplicated, obtain the confirmation result, The error between the determination result of the possibility and the confirmation result of the user is converted by an error function such as a mean square error, and weight values (a, b, c) of each determination pattern so that the error function is minimized. Can be performed to improve the accuracy of the determination pattern.

[携帯処理フロー]
図1−5などの場合のように、会計事務所のサーバー100と職員の端末装置10とがクライアントサーバーシステムを構成している場合において、端末装置10をサーバー100から切り離して、顧問先に持ち込んで、顧問先でレシート等の画像を読み込む場合には、顧問先に端末装置10を携帯することから、携帯処理と呼ぶことにする。
このような携帯処理の処理フローを図4に示す。
図4において、対象となる顧問先を決定した上で(ステップS4T−1)、端末装置10を持ち込む顧問先のデータ(レシート等の画像データ、それに対応付けられた文字認識結果、画像の特徴パターンの情報など)を、会計事務所のサーバー10から(ステップS4SV−1)、端末装置10の記憶部に一時的に格納し(ステップS4T−2)、出先の顧問先での重複判定に備えることができる。
[Mobile processing flow]
As in the case of FIG. 1-5 and the like, in the case where the accounting server 100 and the staff terminal device 10 constitute a client server system, the terminal device 10 is separated from the server 100 and brought to the advisor. Thus, when an image such as a receipt is read by the consultant, the terminal device 10 is carried by the consultant, so that it is referred to as portable processing.
A processing flow of such portable processing is shown in FIG.
In FIG. 4, after determining the target advisor (step S4T-1), the data of the advisor to bring in the terminal device 10 (image data such as a receipt, character recognition result associated therewith, image feature pattern) Information from the accounting office server 10 (step S4SV-1) and temporarily stored in the storage unit of the terminal device 10 (step S4T-2) to prepare for duplication determination at the consultant at the destination. Can do.

そして、この場合に、処理対象となる顧問先のデータを全てロックして、その顧問先のデータを一切追加したり更新したりできないようにする処理を行なうこともできるし(ステップS4SV−2の「ロックする」)、ロックしないで、会計事務所の別の職員が別の端末装置10を用いて、レシート等の画像の取り込み処理を続行したり、あるいは、顧問先が直接に、会計事務所のサーバー100にアクセスして、レシート等の画像をアップロードできるようにする場合がある(ステップS4SV−2の「ロックしない」)。 In this case, it is also possible to perform a process of locking all the data of the advisor to be processed so that the data of the advisor cannot be added or updated at all (in step S4SV-2). “Lock”), without locking, another staff member of the accounting office uses another terminal device 10 to continue the process of capturing images such as receipts, or the advisor directly The server 100 may be accessed so that an image such as a receipt can be uploaded ("Do not lock" in step S4SV-2).

<サーバー側で顧問先のデータをロックする場合とロックしない場合の共通の処理>
図4において、顧問先に持ち込んだ端末装置10で、レシート等の画像を読み込み(ステップS4T−3)、端末装置10の記憶部に記憶したレシート等の画像や画像に関連付けられた文字認識結果や画像の特徴パターンとの比較を行ない、顧問先で重複判定処理を行ないながら、レシート等の画像の取り込みを行なう(ステップS4T−4)。
<Common processing when locking and not locking advisor data on the server>
In FIG. 4, an image such as a receipt is read by the terminal device 10 brought into the advisor (step S <b> 4 </ b> T- 3), and the image such as a receipt stored in the storage unit of the terminal device 10 and the character recognition result associated with the image are displayed. A comparison with the image feature pattern is performed, and an image such as a receipt is taken in while performing duplication determination processing at the consultant (step S4T-4).

<サーバー側で顧問先のデータをロックする場合>
そして、会計事務所のサーバー100において、その顧問先のデータをロックしていた場合には、会計事務所に戻った後、再度、サーバー100と接続して、そのまま顧問先で読み込んだレシート等の画像を追加登録する(ステップS4T−8、ステップS4SV−5)。

<サーバー側で顧問先のデータをロックしない場合>
他方、会計事務所のサーバー100において、その顧問先のデータをロックしていない場合には、携帯処理中に他の職員や顧問先から追加されたレシート等の画像との重複判定をさらに行ない(ステップS4T−6)、その上で、重複していないものについて、追加登録を行なう(ステップS4T−7、ステップS4SV−4)。
<When locking advisor data on the server>
In the accounting office server 100, if the data of the advisor is locked, after returning to the accounting office, the server 100 is connected to the server 100 again, and the receipt or the like read by the advisor as it is. An image is additionally registered (step S4T-8, step S4SV-5).

<If the server does not lock the advisor data>
On the other hand, in the accounting office server 100, when the data of the advisor is not locked, the duplication determination with an image such as a receipt added from another staff member or advisor during the portable processing is further performed ( In step S4T-6), additional registration is performed for those that do not overlap (step S4T-7, step S4SV-4).

[テーブル]
図5−1は、イメージ管理テーブルであり、顧問先毎や会社毎に、あるいは会社内の本店や支店や営業所等の組織毎に、読み取ったレシート等の画像にイメージIDを割り当てて、そのレシート等の画像の文字認識の結果や画像の特徴パターンの情報を、領域毎の部分的な画像の特徴パターン、ないし、全体の画像の特徴パターンの情報、および、ユーザーがそのレシート等の画像に関する取引の内容を仕訳データなどの会計データとして入力して得た店名や取引先名、品名、摘要や勘定科目の情報とが関連付けられて登録され、管理されている。
ここで、例えば、会社IDがK0001はB社(顧問先B)を示している。
画像全体の特徴パターンは、印刷領域全体の画像の特徴パターンのほか、レシート等の画像の外枠のサイズの特徴パターンなども含まれる。
また、図6−5の読取り設定画面で、重複判定処理を行なうかどうか、行なう場合に、今行なうか、後で行なうかの設定を保存しておくフラグ、および重複判定処理を実行したかどうかのフラグを備えている。
[table]
FIG. 5A is an image management table in which an image ID is assigned to an image of a read receipt or the like for each advisor or company, or for each organization such as a head office, a branch, or a sales office in the company. Information on character recognition results of images such as receipts and information on image feature patterns, information on partial image feature patterns for each region, or information on feature patterns of the entire image, and information on images such as receipts by the user Store names, business partner names, product names, descriptions, and account information obtained by inputting transaction details as accounting data such as journal data are registered and managed in association with each other.
Here, for example, the company ID K0001 indicates the company B (consultant B).
The feature pattern of the entire image includes a feature pattern of the size of the outer frame of the image such as a receipt, in addition to the feature pattern of the image of the entire print area.
Also, whether or not duplication determination processing is to be performed on the reading setting screen of FIG. 6-5, a flag for saving the setting of whether to perform now or later, and whether or not duplication determination processing has been executed. It has a flag.

ここで、図5−1の特徴パターン(特徴PTNと略す)は、ドットのある領域の矩形の幅や高さ、ビットマップのほか、ヒストグラム形式で量子化した情報(X、Y方向から投影する等して得た情報)、数学的処理でベクトル化した情報などを含む特徴量をいうものとする。
特徴PTNは、何らかの会計に関する画像なので、個々の領域の会計処理上の属性(個数、品名、日付、金額など)を有するので、位置や範囲、幅や高さなどが重要な意味を持つ。
特徴パターン(部分)は領域毎の画像の特徴パターンであり、(特徴1(店名等の特徴PTN)、特徴2(位置、特徴PTN)、特徴3(位置、特徴PTN)、・・・)のように記述することができる。
Here, the feature pattern (abbreviated as feature PTN) in FIG. 5A is projected from the rectangular width and height of a region with dots, bitmap, and information quantized in a histogram format (X and Y directions). And the like, and feature amounts including information vectorized by mathematical processing.
Since the feature PTN is an image related to some kind of accounting, it has attributes (number, product name, date, amount of money, etc.) in accounting processing of each area, so the position, range, width, height, etc. are important.
A feature pattern (part) is a feature pattern of an image for each region, and includes (feature 1 (feature PTN such as store name), feature 2 (position, feature PTN), feature 3 (position, feature PTN),. Can be described as:

図5−2は、会計入力アプリなどを用いて生成されたデータであって、仕訳データなどの会計データのデータ構成を示す図であり、顧問先毎に、仕訳データIDなどが割り付けられ、科目や摘要、金額や日付などの情報が対応付けられており、さらに、イメージ管理テーブルにより、どのレシート等の画像に関する会計データであるかも対応付けられている。
FIG. 5-2 is a diagram showing the data structure of accounting data such as journal data, generated using an accounting input application, etc., and journal data IDs are assigned to each advisor, Information such as a summary, amount, date, and the like are associated with each other, and an image management table also associates which receipt or other accounting data is related to the image.

図5−3.重複総合判定テーブル(1枚ごとの判定用)と図5−4.重複総合判定テーブル(複数枚まとめての判定用)は、前述したので、詳細は省略するが、図5−4.重複総合判定テーブル(複数枚まとめての判定用)では、判定条件として、読みこんだ中で2枚以上と記載しているが、複数枚が重複している場合や、2割以上の割合で重複している等の一定の閾値に代えることができる。 Fig. 5-3. Overlapping comprehensive determination table (for determination for each sheet) and Fig. 5-4. Since the duplicate comprehensive determination table (for determining a plurality of sheets) has been described above, the details are omitted, but FIG. In the duplicate comprehensive judgment table (for judgment of multiple sheets collectively), as a judgment condition, it is described that two or more sheets have been read. However, when multiple sheets are duplicated, the ratio is 20% or more. It can be replaced with a certain threshold such as overlapping.

要するに、10枚読み込んで、1枚が重複可能性があるというのであれば、その10枚は、1週前とか、前月とか、前年同月とか、同一店舗とかという範囲で、管理が不十分で、過去に読み取ったレシート等の画像と重複している可能性が低いと言えるが、2枚とか3枚が重複している可能性が高いと判定されたような場合は、偶然ではなく、全体の10枚およびその後に続けて読み込もうとしている多数のレシート等の画像が、類型的に過去に読み取ったレシート等の画像と重複している可能性が高く、ユーザーにいち早く、全てのレシート等の画像を読み込む前に、注意深く確認するようなオペレーションを行なうことができ、無駄のない会計処理を行なうことができる。
In short, if 10 sheets are read and there is a possibility that one sheet is duplicated, the 10 sheets are insufficiently managed within the range of one week ago, the previous month, the same month last year, the same store, It can be said that there is a low possibility of overlapping with images such as receipts read in the past, but if it is determined that there is a high possibility that two or three images are overlapping, the whole There is a high possibility that images of 10 receipts and many receipts to be read subsequently are duplicated with images of receipts, etc. that have been read in the past in the past. Before reading the, you can perform operations that check carefully, so that you can perform lean accounting.

[重複している可能性があると判定した場合の画面表示の特徴]
次に、全体処理フロー図(図3A)のステップS3A−6で表示される、重複する可能性が一定レベル以上(可能性が中以上)あると判定された場合のレシート等の確認画面について説明する。
図6−1は、重複する可能性が一定レベル以上(可能性が中以上)あると判定された場合のレシート等の確認画面 (左右対比)である。この画面例では、右側に今回新たに読み込んだレシート等の画像のうち、過去に読み取ったレシート等の画像と重複する可能性のあるものが3枚列挙されており、そのうち、レシート番号でID0065のものを選択した場合に、そのレシート等の画像が表示されると同時に、左側の画面で、過去に読み取ったレシート等の画像のうち重複する可能性のある重複元のレシート等の画像が表示されている様子を示している。
この画面例では、左右に重複する可能性のあるレシート等の画像を見比べながら確認できるので、作業効率が向上する。
なお、左右対比で確認する画面は一例であり、上下に対比したり、新たに読み取ったレシート等の画像だけを表示し、レシート等の画像にマウスカーソルなどをフォーカスすると、過去に読み取った登録済みのレシート等の画像で重複する可能性のあるものをポップアップ表示するようにしても良い(図6−2、図6−3も同様)。
[Characteristics of screen display when it is determined that there is a possibility of duplication]
Next, a description will be given of a confirmation screen for a receipt or the like displayed when it is determined in step S3A-6 in the overall processing flowchart (FIG. 3A) that the possibility of duplication is a certain level or more (possibility is medium or more). To do.
FIG. 6A is a confirmation screen (left-right comparison) of a receipt or the like when it is determined that the possibility of overlap is a certain level or more (medium or more possibility). In this screen example, on the right side, among the newly read receipt images and the like, three images that may overlap with the previously read receipt images and the like are listed, and of these, the receipt number is ID0065. When an item is selected, the receipt image is displayed, and at the same time, the left-side screen displays a duplicate original receipt image that may overlap among previously read receipt images. It shows how it is.
In this screen example, since it can be confirmed while comparing images such as receipts that may overlap on the left and right, the work efficiency is improved.
In addition, the screen to check with the left and right contrast is an example, only the image such as a newly read receipt is displayed, and if you focus the mouse cursor etc. on the image such as a receipt, it has been registered in the past Alternatively, an image such as a receipt may be displayed in a pop-up display (the same applies to FIGS. 6-2 and 6-3).

図6−2は、図6−1の重複する可能性が一定レベル以上(可能性が中以上)あると判定された場合のレシート等の確認画面 (左右対比)に対し、いずれかのレシート画像を拡大表示した場合において、もう一方の画像を同じ拡大率で表示すると共に、一方の画像をスクロールすると、他方の画像も同様に自動スクロールされる様子を示している。画像のスクロール量の値を、他方に適用することで、同じ箇所を拡大して確認することができ、重複しているかどうかを確実に視認することを支援する。
FIG. 6-2 shows one of the receipt images in contrast to the confirmation screen (left / right comparison) of the receipt or the like when it is determined that the possibility of overlapping in FIG. 6-1 is a certain level or more (medium or more possibility). Is displayed with the same enlargement factor, and when one image is scrolled, the other image is automatically scrolled in the same manner. By applying the value of the scroll amount of the image to the other, the same portion can be enlarged and confirmed, and it is supported to surely recognize whether or not they overlap.

図6−3は、重複レシート等の確認画面で、重複する可能性のある取り込み済みのレシート等が複数ある場合の例である。
図6−1および図6−2が、新たに読み込んだレシート等の画像1枚に対し、重複している可能性のある取り込み済みのレシート等の画像が1枚ある場合を例示しているのに対し、図6−3では、新たに読み込んだレシート等の画像1枚に対し、重複可能性のある取り込み済みのレシート等の画像が複数枚ある場合であるという相違がある。
図6−3では、新たに読み込んだレシート等の画像1枚に対し、重複している可能性のある取り込み済みの重複元レシート等の画像が2枚ある場合に、重複している可能性が高い順にレシート番号が列挙されており、選択した画像が左側に表示され、右側に表示された、今回新たに読み込んだレシート等の画像と対比して確認できることが示されている。
重複している可能性のレベルは、図5−3の重複総合判定テーブルに示すように、高い、中程度といった区別でも良いし、ユーザーが最終的に確認して重複判定した結果を学習したうえで、確率で表現されたレベルを用いても良い。
FIG. 6C is an example in which there are a plurality of receipts and the like that may be duplicated on the confirmation screen for duplicate receipts.
FIG. 6A and FIG. 6B illustrate a case where there is one captured receipt image that may be duplicated with respect to a newly read receipt image. On the other hand, in FIG. 6C, there is a difference that there is a plurality of images such as receipts that may be duplicated with respect to one newly read image such as a receipt.
In FIG. 6C, there is a possibility of duplication in the case where there are two images, such as already received duplicate original receipts, which may be duplicated with respect to one newly read receipt image or the like. Receipt numbers are listed in descending order, and the selected image is displayed on the left side, and it is shown that it can be confirmed in comparison with the image such as a receipt newly read this time.
As shown in the overlap overall determination table of FIG. 5-3, the level of possibility of overlap may be distinguished as high or medium, and after the user finally confirms and learns the result of overlap determination Thus, a level expressed by a probability may be used.

図6−4は、今回新たに読み込んだ複数のレシート等の画像のうち、複数枚が、過去に読み取ったレシート等の画像と重複する場合の区別表示の例を示している。
右側には、今回新たに読み込んだレシート等の画像が5枚表示され、そのうち、過去に読み取ったレシート等の画像と重複している可能性が一定レベル以上のものについて、背景が区別表示されている例が示されている。
この場合において、右側の重複している可能性のあるレシート等の画像にマウスのカーソルを当てたり、モバイル端末の場合には画面上のタッチパネル上で、そのレシート等の画像に触れた場合には、左側の画面で、重複の可能性がある取り込み済みの重複元のレシート等の画像が次々と切り換えられて表示され、重複しているかどうかを確認することができる。
FIG. 6-4 illustrates an example of the distinguishing display when a plurality of images such as receipts newly read this time overlap with images such as receipts read in the past.
On the right side, five newly read receipts and other images are displayed. Of these, the background is distinguished and displayed for those that are more than a certain level that may overlap with previously received receipts and other images. An example is shown.
In this case, if you place the mouse cursor on an image of a receipt that may overlap on the right side, or touch the image of the receipt on the touch panel on the screen in the case of a mobile terminal In the screen on the left, images such as already received duplicated receipts that may be duplicated are displayed one after another, and it is possible to check whether or not they are duplicated.

そして、この例では、5枚中2枚ものレシート等の画像が重複している可能性があることが示されており、こういう場合は、レシート等の管理が不十分で、これから読み込もうとしているレシート等の画像が、全体として、類型的に重複している可能性があるので、画面の上部に、「この一群のレシート等は、以前に取り込んだレシート等と重複している可能性が高いので注意してください!」といった警告表示を行なうことで、ユーザーは直ちにレシート等の画像の読み込みを中断して、袋等に保管したレシート等の画像の管理状況を確認し、既に取り込み済みのレシート等であるかどうかを確認することができ、無駄な読み込み作業を行なわないようにすることができる。
なお、図示はしないが、取り込み済みの重複元レシート等が複数ある場合も想定され、その場合は、重複している重複元レシート等を図6−3の左側のように表示しても良い。
In this example, it is shown that there is a possibility that images such as two receipts out of five may overlap. In such a case, management of receipts is insufficient, and an attempt is made to read from now on. Since images such as receipts may overlap in a typical manner, the top of the screen says, “This group of receipts is likely to overlap with previously received receipts. By displaying a warning message such as “Please pay attention!”, The user immediately stops reading receipts and other images, checks the management status of receipts and other images stored in bags, and takes receipts that have already been imported. Therefore, it is possible to prevent useless reading work.
Although not shown, there may be a case where there are a plurality of duplicate source receipts that have been captured. In this case, the duplicate source receipts may be displayed as shown on the left side of FIG. 6-3.

また、上記の重複判定処理を行なう/行なわないに関わらず、レシート等の文字認識結果と画像の特徴パターンおよび、勘定科目や摘要あるいは店名などの情報を登録しているので、あるレシート等の画像に対し、これらの情報を検索キーとして、ヒットする項目が多いものを検索することができる。
あるレシート等の画像に対し、勘定科目や摘要あるいは店名などの情報を検索キーにして、関連するレシート等の画像を検索して列挙したり、列挙したレシート等の画像に紐付いている勘定科目や摘要あるいは仕訳等の会計データを参照することもできる。
Regardless of whether or not the above-described duplication determination process is performed, information such as a character recognition result such as a receipt, an image feature pattern, and an account item, a description, or a store name is registered. On the other hand, it is possible to search for items with many hits using these pieces of information as search keys.
For an image of a certain receipt, etc., use the information such as account item, description, or store name as a search key to search and enumerate images of related receipts, etc. It is also possible to refer to accounting data such as a summary or journal entry.

あるいは、あるレシート等の画像に対し、文字認識結果や画像の特徴パターンの情報を検索キーとして、似たようなレシート等の画像を検索して、ヒットした項目の多い順に列挙したり、列挙したレシート等の画像に紐付いている勘定科目や摘要あるいは仕訳等の会計データを参照することもできる。この場合、文字認識結果と画像の特徴パターンの比較のいずれか一方を使用したり、重複判定と同様に両方の比較処理を組み合わせることができる。文字認識結果や画像の特徴パターンの比較で一致する項目が多い順などにソートして、一致する項目の多い順に列挙したり、上位のものだけを10枚列挙するといった提示の仕方が可能である。

以上の検索処理や列挙表示は、新たにレシート等の画像を読み取った場合や、既に読み取って登録済みのレシートのうち任意のレシート等の画像に対し、検索する場合のいずれに対しても適用可能である。
Alternatively, for images such as receipts, search for similar receipt images using the character recognition results and image feature pattern information as search keys, and list them in the order of the number of hit items. It is also possible to refer to account data associated with images such as receipts and accounting data such as abstracts or journals. In this case, either one of the character recognition result and the comparison of the feature pattern of the image can be used, or both comparison processes can be combined in the same manner as the overlap determination. Sorting in the order of matching items in the comparison of character recognition results and image feature patterns, etc., and listing them in order of the number of matching items, or listing only the top 10 items is possible. .

The above search process and enumeration display can be applied to both when a new image such as a receipt is read, or when searching for an image such as an arbitrary receipt among already read receipts registered. It is.

以上のように、文字認識結果の比較と、画像の特徴パターンの比較を組み合わせて、重複する可能性の判定を行なうことで、カスレ等や文字が小さい等により正確に文字認識ができない場合でも、重複している可能性を精度良く判定することができる。

また、重複している可能性が一定レベル以上の場合に、ユーザーに対し、重複しているかどうか確認しやすい画面を表示することで、重複したレシート等の画像を登録することを防止することによって、重複した会計データを作成することを防止すると共に、似たようなレシート等の画像であるが、本当に2つの異なる取引があったことを確認した上で、会計データを入力することができるので、2重の仕訳の発生と本当に2つの取引が発生したことを峻別しつつ適切な会計データの作成を支援することで、会計処理の効率化、確実化を図ることができる。
そして、本システムによれば、会計事務所や企業内の本店などの監査する側で、顧問先や企業の支店など、サービスを受ける側に対する監査の段階でも、レシート等の証ひょう画像まで遡った上での正確な指導がし易くなり、業務効率化につなげることができる。
As described above, by combining the comparison of the character recognition result and the comparison of the feature pattern of the image, and determining the possibility of overlapping, even when character recognition cannot be performed accurately due to blurring or small characters, The possibility of overlapping can be determined with high accuracy.

In addition, when the possibility of duplication is more than a certain level, by displaying a screen that makes it easy for the user to check whether there is duplication, by preventing registration of images such as duplicate receipts In addition to preventing the creation of duplicate accounting data, it is an image of a similar receipt, etc., but it is possible to enter accounting data after confirming that there were really two different transactions By supporting the creation of appropriate accounting data while distinguishing between the occurrence of double journals and the occurrence of two transactions, accounting processing can be made more efficient and reliable.
And according to this system, the auditing side of the accounting office or the head office in the company goes back to the testimonial image of the receipt etc. even at the auditing stage for the service receiving side such as the advisor or the branch of the company It is easy to give accurate guidance on the above, and it can lead to operational efficiency.

10 端末装置
11 入力部
12 画像取込部
13 出力部(表示、印刷)
14 制御部
15 記憶部(RAM等の主記憶、SRAMやHDD等の長期記憶)
16 通信部
50 画像取込装置(カメラ、スキャナ)
60 LAN(ローカルエリアネットワーク)
70 WAN(ワイドエリアネットワーク、インターネット等)
100 サーバー(仮想サーバー含む)
130 出力部
140 制御部
150 記憶部
160 通信部
10 terminal device 11 input unit 12 image capture unit 13 output unit (display, print)
14 Control unit 15 Storage unit (main storage such as RAM, long-term storage such as SRAM and HDD)
16 Communication unit 50 Image capture device (camera, scanner)
60 LAN (Local Area Network)
70 WAN (Wide Area Network, Internet etc.)
100 servers (including virtual servers)
130 Output unit 140 Control unit 150 Storage unit 160 Communication unit

Claims (7)

証ひょう画像を読み取って、会計処理を行なうためのシステムであって、

読み取った証ひょう画像から、
日付、金額を含む文字をテキストとして文字認識する文字認識手段と、
日付、金額、店名を含む会計処理に有用な情報の画像の特徴パターンを、所定の領域毎に抽出する画像の特徴パターン抽出手段とを備え、

前記文字認識手段で取得した文字認識結果を記憶部に登録する
文字認識結果登録手段と、

前記の画像の特徴パターン抽出手段で抽出した画像の特徴パターンを前記記憶部に登録する画像の特徴パターン登録手段とを備え、

新たに読み取った当該証ひょう画像について、
前記文字認識手段によって、日付、金額を含む文字をテキストとして文字認識し、
前記の画像の特徴パターン抽出手段によって画像の特徴パターンを抽出すると共に、

前記記憶部から、登録済みの証ひょう画像の文字認識結果と画像の特徴パターンを読出し、
当該新たな読み取った証ひょう画像の文字認識結果と前記登録済み証ひょう画像の文字認識結果とを比較する文字認識結果比較手段と、当該新たな読み取った証ひょう画像について抽出した画像の特徴パターンと前記登録済み証ひょう画像の画像の特徴パターンとを比較する画像の特徴パターン比較手段とを備え、
前記文字認識結果比較手段による比較結果と前記画像の特徴パターン比較手段による比較結果と組み合わせて、
当該新たな証ひょう画像と、前記登録済みの証ひょう画像とが、重複している可能性を判定する重複可能性判定手段、
を備えたことにより、

前記重複可能性判定手段により重複する可能性があると判定された新たな証ひょう画像の取り込みを防止することを特徴とする会計処理システム。

A system for reading a testimony image and performing accounting processing,

From the read proof image,
Character recognition means for recognizing characters including date and amount as text,
Image feature pattern extraction means for extracting the feature pattern of the image of information useful for accounting processing including date, price, and store name for each predetermined area;

Character recognition result registration means for registering the character recognition result acquired by the character recognition means in a storage unit;

Image feature pattern registration means for registering the image feature pattern extracted by the image feature pattern extraction means in the storage unit;

For the newly read proof image,
The character recognition means recognizes characters including date and money as text,
Extracting the feature pattern of the image by the feature pattern extraction means of the image,

From the storage unit, read the character recognition result of the registered proof image and the feature pattern of the image,
A character recognition result comparing means for comparing the character recognition result of the newly read testimony image and the character recognition result of the registered certificate image, and a feature pattern of the image extracted for the new read testimony image; Image feature pattern comparison means for comparing the image with the feature pattern of the registered card image,
In combination with the comparison result by the character recognition result comparison means and the comparison result by the feature pattern comparison means of the image,
A duplication possibility determination means for determining a possibility that the new certificate image and the registered certificate image overlap;
By having

An accounting processing system for preventing a new identification image that has been judged to be possibly duplicated by the duplication possibility judging means.

前記画像の特徴パターン抽出手段において、日付、金額、店名を含む会計処理に有用な情報の画像のパターンを、所定の領域毎に抽出する際に、領域毎の画像の特徴パターンとして、少なくとも、画素のある領域の位置と範囲のパターンまたはビットマップパターンの態様を含み、
前記画像の特徴パターン比較手段において、所定の領域毎に、画像の特徴パターンの態様を比較することで、仮に文字認識結果に誤りがある場合や文字認識結果を取得できない場合にも、画素のある領域の位置と範囲のパターンまたはビットマップパターンの比較により、日付、金額、店名を含む会計処理に有用な情報が一致している可能性を判定することで、
前記重複可能性判定手段が、前記文字認識結果比較手段による比較結果と前記画像の特徴パターン比較手段による比較結果とを総合して、重複している可能性を判定すること、
を特徴とする 請求項1に記載の会計処理システム。
In the image feature pattern extraction means, when extracting an image pattern of information useful for accounting processing including date, price, and store name for each predetermined area, at least a pixel as an image feature pattern for each area Including aspects of the location and range pattern or bitmap pattern of the region,
In the image feature pattern comparison means, there is a pixel even if there is an error in the character recognition result or the character recognition result cannot be obtained by comparing the feature pattern of the image for each predetermined region. By comparing the position of the area and the pattern of the range or bitmap pattern, it is possible to determine the possibility that the information useful for accounting including date, amount, and store name matches,
The duplication possibility determination means determines the possibility of duplication by combining the comparison result by the character recognition result comparison means and the comparison result by the feature pattern comparison means of the image;
The accounting system according to claim 1.
証ひょう画像を複数枚まとめて読み取ったときに、証ひょう画像の1つ1つの重複可能性を判定すると共に、当該複数枚の証ひょう画像の纏まりについて、前記登録済みの証ひょう画像の、日単位、週単位を含む所定の単位の纏まりと重複している可能性を判定して出力すること、
を特徴とする請求項1又は2のいずれか1つに記載の会計処理システム。
When a plurality of evidence images are read together, the possibility of duplication of the evidence images is determined, and the date of the registered evidence images is determined for the collection of the plural evidence images. Determine and output the possibility of overlapping with a group of predetermined units including units and weeks,
The accounting system according to any one of claims 1 and 2.
証ひょう画像を読み取って、その証ひょう画像に関する取引の内容を、会計データとして入力を受け付け、取得した会計データのうち、少なくとも摘要情報または科目情報と、証ひょう画像の画像の特徴パターンとを関連付けて登録し、次回の会計データの入力の際に、前記文字認識結果の比較手段および前記画像の特徴パターンとの比較手段による比較処理に加えて、当該証ひょう画像に対応付けられた摘要情報または科目情報と、入力した摘要情報又は科目との比較処理を行い、会計データの入力の精度を向上させること、
を特徴とする請求項1から3のいずれか1つに記載の会計処理システム。
Reads the testimony image, accepts the transaction details related to the testimony image as accounting data, and associates at least summary information or subject information with the acquired accounting data and the feature pattern of the image of the testimony image In addition to comparison processing by the character recognition result comparison unit and the image feature pattern comparison unit when inputting the next accounting data, the summary information associated with the test image or Compare the subject information with the summary information or subject you entered to improve the accuracy of accounting data input,
The accounting system according to any one of claims 1 to 3, wherein
前記重複可能性判定手段によって、重複する可能性が閾値を超えた場合に、
当該新たな証ひょう画像と重複する可能性のある前記登録済みの証ひょう画像を、対比して表示することにより、
重複する可能性があると判定された新たな証ひょう画像の取り込みを防止することを特徴とする、請求項1から4のいずれか1つに記載の会計処理システム。

When the possibility of duplication exceeds a threshold by the duplication possibility determination means,
By displaying the registered proof image that may overlap with the new proof image, in contrast,
5. The accounting system according to claim 1, further comprising: taking in a new evidence image determined to have a possibility of overlapping.

新たに読み取った証ひょう画像と重複する可能性のある前記登録済みの証ひょう画像を、対比して表示する場合において、
一方の証ひょう画像を拡大した場合に、他方を同率で拡大表示すると共に、
一方の証ひょう画像をスクロールした場合に、他方のスクロールを追従させること、
を特徴とする請求項5に記載の会計処理システム。
In contrast to displaying the registered proof image that may overlap with the newly read proof image,
When one proof image is enlarged, the other is enlarged and displayed at the same rate,
When scrolling one of the testimonial images, make the other scroll follow,
The accounting system according to claim 5.
新たに証ひょう画像を複数枚まとめて読み取ったとき、または連続して読み取ったときに、証ひょう画像の1つ1つの重複可能性を判定し、前記登録済みの証ひょう画像と重複している可能性のある新たに読み取った証ひょう画像が存在した場合は、 複数枚まとめて、または連続して読み取った証ひょう画像を、少なくとも2以上、同時に表示させると共に、前記登録済みの証ひょう画像と重複している可能性のある新たに読み取った証ひょう画像を、他と区別して表示すること、
を特徴とする請求項1から4のいずれか1つに記載の会計処理システム。

When a plurality of new proof images are read all at once or when they are read consecutively, it is determined whether each proof image is duplicated, and it overlaps with the registered proof image. If there is a possibility that a newly read testimony image exists, at least two or more of the testimonial images read together or continuously are displayed at the same time, and the registered testimonial image and Display newly read evidence images that may be duplicated separately from others,
The accounting processing system according to claim 1, wherein:

JP2017090095A 2017-04-28 2017-04-28 Accounting system Active JP6507459B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017090095A JP6507459B2 (en) 2017-04-28 2017-04-28 Accounting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017090095A JP6507459B2 (en) 2017-04-28 2017-04-28 Accounting system

Publications (2)

Publication Number Publication Date
JP2018190064A true JP2018190064A (en) 2018-11-29
JP6507459B2 JP6507459B2 (en) 2019-05-08

Family

ID=64479561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017090095A Active JP6507459B2 (en) 2017-04-28 2017-04-28 Accounting system

Country Status (1)

Country Link
JP (1) JP6507459B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020144636A (en) * 2019-03-07 2020-09-10 セイコーエプソン株式会社 Information processing apparatus, learning device, and learned model
JP7312980B1 (en) 2023-02-21 2023-07-24 株式会社Tokium Program, computer and information processing method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011741A (en) * 2005-06-30 2007-01-18 Sharp Corp Image management apparatus and image forming apparatus provided with the same
JP2009026075A (en) * 2007-07-19 2009-02-05 Canon Inc Image processing device
JP2010092159A (en) * 2008-10-06 2010-04-22 Fuji Xerox Co Ltd Image data decision device, image data decision system and program
JP2011118513A (en) * 2009-12-01 2011-06-16 Toshiba Corp Character recognition device and form identification method
JP2016173838A (en) * 2016-05-09 2016-09-29 フリー株式会社 Accounting processor, accounting processing method and accounting processing program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011741A (en) * 2005-06-30 2007-01-18 Sharp Corp Image management apparatus and image forming apparatus provided with the same
JP2009026075A (en) * 2007-07-19 2009-02-05 Canon Inc Image processing device
JP2010092159A (en) * 2008-10-06 2010-04-22 Fuji Xerox Co Ltd Image data decision device, image data decision system and program
JP2011118513A (en) * 2009-12-01 2011-06-16 Toshiba Corp Character recognition device and form identification method
JP2016173838A (en) * 2016-05-09 2016-09-29 フリー株式会社 Accounting processor, accounting processing method and accounting processing program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020144636A (en) * 2019-03-07 2020-09-10 セイコーエプソン株式会社 Information processing apparatus, learning device, and learned model
JP7077998B2 (en) 2019-03-07 2022-05-31 セイコーエプソン株式会社 Information processing equipment
JP7312980B1 (en) 2023-02-21 2023-07-24 株式会社Tokium Program, computer and information processing method

Also Published As

Publication number Publication date
JP6507459B2 (en) 2019-05-08

Similar Documents

Publication Publication Date Title
CN108765118B (en) Method and system for generating voucher by mixed scanning of bills
JP6165957B1 (en) Accounting processing apparatus, accounting processing system, accounting processing method, and accounting processing program
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
JP6357621B1 (en) Accounting processing apparatus, accounting processing system, accounting processing method and program
US20070033118A1 (en) Document Scanning and Data Derivation Architecture.
JP7000052B2 (en) Accounting equipment and programs
JP6001743B1 (en) Data management system, method and program
JP2015118488A (en) System, method and program for inputting account data
JPWO2019008766A1 (en) Voucher processing system and voucher processing program
US20220067365A1 (en) System and method for domain aware document classification and information extraction from consumer documents
KR101084440B1 (en) Automatic entry generation appartus and method thereof
JP2017182786A (en) Accounting processing device, accounting processing method, and accounting processing program
WO2020179055A1 (en) Voucher analysis device, accounting system, voucher analysis method, and voucher analysis program
CN115017272A (en) Intelligent verification method and device based on registration data
JP2018190064A (en) Accounting processing system
JP2015088030A (en) Estate evaluation management integration system and computer program
JP6895632B1 (en) Accounting equipment, accounting systems, accounting methods and programs
US20170148033A1 (en) Preventing restricted trades using physical documents
US10614068B2 (en) Transaction slip search method, information processing apparatus, and computer product
JP4516376B2 (en) Form processing system
JP2007280413A (en) Automatic input device of financial statement
JP6858420B1 (en) Accounting equipment, accounting systems, accounting methods and programs
JP6993032B2 (en) Accounting equipment, accounting systems, accounting methods and programs
JP6835382B1 (en) Electronic data judgment system, electronic data judgment device, electronic data judgment method, electronic data judgment program
US20230132441A1 (en) Expense management device, information processing method, and recording medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190315

R150 Certificate of patent or registration of utility model

Ref document number: 6507459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150