JP2012221183A - Receipt data recognition device and program therefor - Google Patents

Receipt data recognition device and program therefor Download PDF

Info

Publication number
JP2012221183A
JP2012221183A JP2011085854A JP2011085854A JP2012221183A JP 2012221183 A JP2012221183 A JP 2012221183A JP 2011085854 A JP2011085854 A JP 2011085854A JP 2011085854 A JP2011085854 A JP 2011085854A JP 2012221183 A JP2012221183 A JP 2012221183A
Authority
JP
Japan
Prior art keywords
data
receipt
character
item
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011085854A
Other languages
Japanese (ja)
Other versions
JP5202677B2 (en
JP2012221183A5 (en
Inventor
Kazunari Nozaki
一成 野崎
Yasuhiro Umemura
泰広 梅村
Kiichiro Watanabe
起一郎 渡邊
Rie Hasada
理恵 羽佐田
Junya Suzuki
惇也 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Computer Technologies Ltd
Fujitsu Marketing Ltd
Original Assignee
Fujitsu Computer Technologies Ltd
Fujitsu Marketing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Computer Technologies Ltd, Fujitsu Marketing Ltd filed Critical Fujitsu Computer Technologies Ltd
Priority to JP2011085854A priority Critical patent/JP5202677B2/en
Priority to CN201110292107.4A priority patent/CN102737239B/en
Publication of JP2012221183A publication Critical patent/JP2012221183A/en
Publication of JP2012221183A5 publication Critical patent/JP2012221183A5/ja
Application granted granted Critical
Publication of JP5202677B2 publication Critical patent/JP5202677B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To correctly and efficiently collect sales management data from an individual tenant shop and improve a speed and efficiency in sales management work at the tenant.SOLUTION: For a recognition character read from a receipt image, a receipt data extraction part 141 extracts a recognition character from a character string of an item name that is registered in definition data different for each shop and is shown on a receipt and from positional data of a money-amount item shown at an intra-receipt position; an inclination detection part 142 detects an inclination of the recognition character from the positional data of the extracted recognition character; an inclination correction part 143 corrects, if an inclination of the recognition character is detected, the positional data of the applicable money-amount item in accordance with the detected inclination; a receipt data identification part 144 extracts a recognition character representing the money-amount item from the recognition character and the positional data using the corrected positional data; and a sales management data generation part 15 outputs, or stores, data of the recognition result based on a recognition character matching the item name and the recognition character representing the money-amount item.

Description

本発明は,レシートデータ認識装置およびそのプログラムに関し,特に,例えばショッピングモールなどの複数の店舗の売上を管理するために,文字認識により読み取ったレシートデータから必要なデータを正確に抽出する技術に関するものである。   The present invention relates to a receipt data recognition apparatus and a program thereof, and more particularly to a technique for accurately extracting necessary data from receipt data read by character recognition in order to manage sales at a plurality of stores such as a shopping mall. It is.

ショッピングセンター,ショッピングモール等に出店するテナント(店舗を運営する会社など)の店舗を管理するテナント管理部門では,各店舗の一日の売上を収集し,現金売上,クーポン売上,…といった売上内訳(売上管理項目)を作成している。この売上内訳作成の際には,各店舗から提供される精算レシートが集められて,売上管理項目の数値を算出することが行われる。しかし,各店舗から提供される精算レシートの形式は,店舗毎に導入されているPOSシステムに依存するため,さまざまな形式で作成されているのが現状である。そのため,テナント管理部門が処理する精算レシートは,項目の種類,項目名,印字サイズ,印字字体などにおいて多種多様である。   The tenant management department that manages stores of tenants (such as companies that operate stores) that open stores in shopping centers, shopping malls, etc. collects daily sales for each store, and breakdowns of sales such as cash sales, coupon sales, etc. ( Sales management item). When creating the sales breakdown, payment receipts provided from each store are collected and the numerical value of the sales management item is calculated. However, since the format of the payment receipt provided from each store depends on the POS system installed in each store, it is currently created in various formats. Therefore, the payment receipt processed by the tenant management department has a wide variety of items, item names, print sizes, print fonts, and the like.

例えば,精算レシートの項目の名称について,売上合計,売上計,合計売上,総売上,…等は,同等の内容を示すものであっても,POSシステムによって異なる名称が印字されている。また,出店するテナントの店舗の入れ替えなどが頻繁に行われるため,新たな精算レシートの形式にも対応しなければならない。そのため,テナント管理部門では,精算レシートを統一された売上データとして集計する売上集計作業に莫大な労力を要し,そのための人的および時間的負担に多大なコストを要しているのが現状である。   For example, regarding the names of the items on the payment receipt, even though the total sales, total sales, total sales, total sales, etc. indicate the same contents, different names are printed depending on the POS system. In addition, since the tenant's store that opens a store is frequently replaced, a new payment receipt format must also be supported. For this reason, the tenant management department currently requires enormous labor for the work of totaling the payment receipts as unified sales data, and the human and time burden for that is enormous. is there.

なお,特許文献1には,文書画像認識装置が開示されている。この文書画像認識装置では,文書画像を参照して文字を構成する成分の集合を抽出し,これをもとに横および縦の行候補を抽出し,行候補に対して信頼度を推定する。その後,推定した行信頼度に基づいて確度の高い行の集合を抽出し,その結果をもとに確度の高い行の集合の文字成分の配置を用いて傾きを推定する。そして,文書画像を構成する基礎要素の集合から行方向の確定した行集合を抽出し,行同士の関連付けによる段抽出と段を制約とした行抽出とを相互に実行して行と段を抽出する。   Note that Patent Document 1 discloses a document image recognition apparatus. In this document image recognition apparatus, a set of components constituting a character is extracted with reference to a document image, horizontal and vertical line candidates are extracted based on the set, and reliability is estimated for the line candidates. Thereafter, a set of lines with high accuracy is extracted based on the estimated line reliability, and the inclination is estimated using the arrangement of the character components of the set of lines with high accuracy based on the result. Then, a line set with a fixed line direction is extracted from the set of basic elements that make up the document image, and a line and a stage are extracted by associating the lines with each other and performing a line extraction with a stage as a constraint. To do.

また,特許文献2には,レシート処理装置が開示されている。このレシート処理装置では,レシートの画像から文字を認識してテキストデータを生成し,テキストデータから所定の文字列を選択し,選択された所定の文字列が含まれる行位置を検出する。そして,検出された行位置に基づいて定まるテキストデータ上の所定の行範囲から行を単位とするラインデータを順に選択し,ラインデータから品目に関わるデータを抽出する。   Patent Document 2 discloses a receipt processing apparatus. In this receipt processing apparatus, text data is generated by recognizing characters from the receipt image, a predetermined character string is selected from the text data, and a line position including the selected predetermined character string is detected. Then, line data in units of lines is sequentially selected from a predetermined line range on the text data determined based on the detected line position, and data relating to the item is extracted from the line data.

特開平11−219407号公報JP 11-219407 A 特開2004−164218号公報JP 2004-164218 A

前述したような,ショッピングセンター等の各店舗から提供される精算レシート(以下,レシートという)を集計するために,ショッピングセンター等を運営する会社(組織)のテナント管理部門では,従来,事務員が目視でレシートを読み取り,読み取ったデータを手作業でデータ処理装置に入力していた。この売上集計作業の作業量は,店舗数が100店舗以上に及ぶこともあり,しかも毎日行わなければならない作業であるため,非常に負担が大きいものであった。   In the tenant management department of a company (organization) that operates a shopping center or the like, the clerk has traditionally used to collect the payment receipts (hereinafter referred to as receipts) provided by each store such as a shopping center. The receipt was read visually, and the read data was manually input to the data processing device. The work amount of the sales totaling work is very heavy because the number of stores may reach 100 stores or more and must be performed every day.

この負担を軽減するための一案としては,各店舗の売上データ(レシートデータ)を,各店舗の端末からネットワークを介して自動収集することが考えられる。しかし,一般に各店舗は企業体が異なるため,個々にネットワーク開設の許諾を得る必要があり,さらに導入されているシステムによって接続するネットワーク種類やアプリケーションの追加・修正の難易度が異なるなど,解決が困難な問題が存在する。   As a proposal for reducing this burden, it is conceivable to automatically collect sales data (receipt data) of each store from a terminal of each store via a network. However, in general, each store has a different corporate body, so it is necessary to obtain permission to open the network individually, and the type of network to be connected and the difficulty of adding / modifying applications differ depending on the installed system. There are difficult problems.

既存のシステムの変更,特に各店舗における端末などの情報機器の変更をできるだけ行わないで,前述した作業負担を軽減する他の案としては,レシートデータを人間が読み取るのではなく,文字画像の認識によって読み取る方法が考えられる。すなわち,各店舗のレシートを,例えばOCR(Optical Character Recognition )機能を有する読取装置,スキャナー等で読み取り,読み取ったレシート項目とその数値データについて売上管理項目に必要なものを抽出し,売上管理データに入力し直す方法である。   Another way to reduce the above-mentioned work load by changing the existing system, especially information devices such as terminals in each store as much as possible, is to recognize character images instead of reading receipt data by humans. The reading method can be considered. That is, the receipt of each store is read by, for example, a reader or scanner having an OCR (Optical Character Recognition) function, and the necessary receipt items and their numerical data are extracted as sales management items, and the sales management data is extracted. This is a method to re-enter.

しかし,この方法の場合にも,一般的な従来の文字画像の認識では解決できない問題を解決しなければならない。次に,この問題について説明する。   However, even in this method, it is necessary to solve a problem that cannot be solved by the conventional recognition of character images. Next, this problem will be described.

OCR機能を有する読取装置等によりレシートを読み取らせる場合,レシートを透明シートに挟んだり,紙などに貼付するなどして固定した状態で,読取装置等に読み取らせる必要がある。   When a receipt is read by a reading device or the like having an OCR function, the reading device or the like needs to be read in a state where the receipt is fixed by being sandwiched between transparent sheets or attached to paper or the like.

例えば,透明シートなどに挟持されたレシートは,細長いスリット状の形式であり,読み込ませる際に,挟持された精算レシート(レシート)がシートに対して傾きが発生することがある。また,シートなどに挟持されたレシートは,レシート全体が一定の角度で傾くのではなく,途中から別の角度で傾く場合がある。また,印字された際に,プリンタの紙送りずれや,調整不備などで,レシートの途中の行で,印字された項目がその前の行の項目よりもスペースが空いたりすることや,傾きを有することがある。また,レシートの途中で紙が一部折れ曲がって固定されることもある。   For example, a receipt sandwiched between transparent sheets or the like is in the form of an elongated slit, and when it is read, the settlement receipt (receipt) sandwiched may be inclined with respect to the sheet. In addition, a receipt sandwiched between sheets or the like may not be inclined at a constant angle, but may be inclined at a different angle from the middle. In addition, when printing, the printed item may have more space than the previous line item on the line in the middle of the receipt due to misalignment of the paper feed or improper adjustment. May have. In addition, the paper may be partially bent and fixed in the middle of the receipt.

図15は,レシートのOCR処理において誤認識が生じる例を説明する図である。図15に示すように,例えばレシート22uが長いシートの場合など,レシート上部221uからレシート下部222uの途中で紙が一部折れ曲がって傾いてしまうことがある。このような状態で,シートに挟持されているレシート22uを読取装置で読み取り,OCR処理した場合,レシート項目中の項目名称と金額との対応が正しい対応関係の行で読み取られず,項目名称と金額とが異なる行の関係で読み取られることがある。その結果,レシート項目の金額が別なレシート項目の金額に誤認識されて,売上が集計されてしまうことがある。   FIG. 15 is a diagram for explaining an example in which erroneous recognition occurs in the receipt OCR process. As shown in FIG. 15, for example, when the receipt 22u is a long sheet, the paper may be partially bent and inclined midway from the receipt upper part 221u to the receipt lower part 222u. In this state, when the receipt 22u sandwiched between the sheets is read by the reading device and subjected to OCR processing, the correspondence between the item name and the amount in the receipt item is not read in the line of the correct correspondence, and the item name and the amount May be read in different row relationships. As a result, the amount of the receipt item may be misrecognized as the amount of another receipt item, and sales may be aggregated.

図16(A)に,レシート項目の金額が誤認識されない場合の一例を示し,図16(B)に,レシート項目の金額が誤認識される場合の一例を示す。   FIG. 16A shows an example when the amount of the receipt item is not erroneously recognized, and FIG. 16B shows an example when the amount of the receipt item is erroneously recognized.

図16(A)では,レシート22vにおける傾いたレシート下部222vが示されている。レシート22vの基準とする方向Lbからの傾きの角度α1(図示の破線に対する角度)は,レシート項目の金額が誤認識されない範囲であるとする。例えば,レシート下部項目222vにあるレシート項目名称「総売上」(図に示すStr#101)に対応する金額項目Dat#101は,「¥654,735」であり,OCR処理により「総売上 ¥654,735」と正しく認識される。   In FIG. 16A, the receipt lower part 222v inclined in the receipt 22v is shown. It is assumed that the inclination angle α1 (the angle with respect to the broken line in the figure) of the receipt 22v from the reference direction Lb is a range in which the amount of the receipt item is not erroneously recognized. For example, the amount item Dat # 101 corresponding to the receipt item name “total sales” (Str # 101 shown in the figure) in the receipt lower item 222v is “¥ 654,735”, and “total sales ¥ 654” is obtained by OCR processing. , 735 ".

一方,図16(B)では,精算レシート22wにおける傾いたレシート下部222wが示されている。レシート22wの基準とする方向Lcからの傾きの角度α2(図示の破線に対する角度)は,レシート項目の金額が誤認識される範囲であるとする。例えば,レシート下部222wにあるレシート項目名称「総売上」(図に示すStr#102)に対応する金額項目Dat#102は,正しくは「¥654,735」であるが,ここでは,OCR処理の結果により「総売上 ¥623,603」と誤認識されてしまっている。   On the other hand, FIG. 16 (B) shows an inclined receipt lower portion 222w in the payment receipt 22w. It is assumed that the inclination angle α2 (angle with respect to the broken line in the figure) of the receipt 22w from the reference direction Lc is a range in which the amount of the receipt item is erroneously recognized. For example, the amount item Dat # 102 corresponding to the receipt item name “total sales” (Str # 102 shown in the figure) in the lower portion 222w of the receipt is correctly “¥ 654,735”. As a result, it is misrecognized as “total sales ¥ 623,603”.

この誤認識の原因は,OCR処理結果の出力が各項目の文字列とそれらの座標情報だけであるので,その座標情報から,項目名称「総売上」(Str#102)の下段の行に位置する項目名称「純売上」に対応する金額項目Dat#102の「¥623,603」が,傾きの角度α2の大きさに起因して,レシート項目名称「総売上」と同じ行に位置する文字列として認識してしまうためである。   The cause of this misrecognition is that the output of the OCR processing result is only the character strings of each item and their coordinate information. The character item “at 623,603” of the amount item Dat # 102 corresponding to the item name “net sales” to be placed on the same line as the receipt item name “total sales” due to the inclination angle α2 This is because it is recognized as a column.

基準とする方向に対して,レシート22全体が同じ傾きの角度である場合には,解決手段として,OCR処理においてレシート22全体の傾きの角度を検出して,レシート全体の行の傾きを補正することにより,正しい金額を抽出することはできる。しかし,図15に示すような場合,レシート上部221uでは傾きの角度が小さく,途中の部分からのレシート下部222uでは大きく傾いている場合,レシート22u全体の傾きの角度を検出し,補正しても,図15に示したように行の一部が異なる傾きである場合には適用できない。   When the entire receipt 22 has the same inclination angle with respect to the reference direction, as a solving means, the OCR process detects the inclination angle of the entire receipt 22 and corrects the inclination of the entire receipt line. Therefore, the correct amount can be extracted. However, in the case shown in FIG. 15, when the receipt upper portion 221u has a small inclination angle and the receipt lower portion 222u is inclined at a midway portion, the receipt angle of the entire receipt 22u is detected and corrected. , As shown in FIG. 15, it cannot be applied when some of the rows have different slopes.

以上説明したように,このようなレシート22uを読取装置等で読み取り,レシートの数値データをOCR処理した場合,レシート項目名称と対応しない金額項目が処理されることがある。それにより,売上管理データに集計エラーが発生する。そのチェックのために,手作業で,精算レシートを照合する作業が必要となり,人的負担が軽減されない。   As described above, when such a receipt 22u is read by a reading device or the like and the receipt numerical data is subjected to OCR processing, a monetary item that does not correspond to the receipt item name may be processed. As a result, an aggregation error occurs in the sales management data. For this check, it is necessary to manually check the payment receipt, and the human burden is not reduced.

本発明は,以上の点に鑑み,各店舗の情報機器などの現状のシステムを大幅に変えることなく,各テナントの店舗のレシートから売上管理データを正確かつ効率よく収集し,売上管理業務におけるスピード化,効率化を図ることを目的としている。   In view of the above, the present invention collects sales management data accurately and efficiently from the receipts of each tenant's store without significantly changing the current system of each store's information device, etc. The purpose is to improve efficiency and efficiency.

本発明は,例えば店舗ごとに印刷されたレシートを,統一された売上管理項目に集計し直すために,レシート画像を読み取り得られた認識文字について,レシートを発行した店舗ごとに異なる定義データに登録されたレシート内の項目名称の文字列と,レシート内位置からの金額項目の相対位置データとから,必要な認識文字を抽出し,抽出された認識文字の位置データから,認識文字の傾きを検出し,認識文字の傾きが検出された場合に,該当する金額項目の相対位置データを検出された傾きに応じて補正し,補正された相対位置データを用いて,認識文字とその位置データから金額項目を表す認識文字を抽出し,項目名称に一致する認識文字と金額項目を表す認識文字とから,認識結果のデータを出力または記憶することを特徴とする。   In the present invention, for example, in order to recalculate receipts printed for each store into a unified sales management item, recognition characters obtained by reading receipt images are registered in different definition data for each store that issued the receipt. The necessary recognition characters are extracted from the character string of the item name in the received receipt and the relative position data of the monetary item from the position in the receipt, and the inclination of the recognition character is detected from the extracted position data of the recognition character When the inclination of the recognized character is detected, the relative position data of the corresponding monetary item is corrected according to the detected inclination, and the amount of money is calculated from the recognized character and its position data using the corrected relative position data. A recognition character representing an item is extracted, and recognition result data is output or stored from a recognition character that matches the item name and a recognition character that represents a monetary item.

すなわち,レシート画像を読取機で読み取るときに,レシートが細長いスリット状の形式であるため,レシートに傾きが発生したり,レシートの途中から傾く場合があっても,正確にレシート内の項目と金額を読み取ることができるようにしたものであり,複数の異なる形式で印刷されたレシートから必要な項目のみを正確に抽出して,売上管理に必要なレシート内の項目と金額を,認識結果のデータとして出力または記憶することができるようにしている。詳しくは,本発明は以下の手段を備える。   In other words, when the receipt image is read by a reader, the receipt is in the form of a long and narrow slit. Therefore, even if the receipt is tilted or tilted from the middle of the receipt, the items and the amount in the receipt are accurate. Can be read, and only necessary items are accurately extracted from receipts printed in different formats, and the items and amounts in the receipts necessary for sales management are recognized data. Can be output or stored as. Specifically, the present invention includes the following means.

(1)本発明は,レシートデータ認識装置が,レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶部と,レシートに印字される項目名称の文字列と,前記項目名称のレシート内位置からの,その項目名称に対応する金額項目の相対位置データとを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶部と,前記画像データ記憶部に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出部と,抽出された認識文字の位置データから,認識文字の傾きを検出する傾き検出部と,認識文字の傾きが検出された場合に,前記定義データにおける該当する金額項目の相対位置データを,検出された傾きに応じて補正する傾き補正部と,補正された相対位置データを用いて,前記画像データ記憶部に記憶された認識文字とその位置データから前記金額項目を表す認識文字を抽出するレシートデータ特定部と,前記項目名称に一致する認識文字と前記金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成部とを備えることを特徴とする。   (1) The present invention provides an image data storage unit for storing a recognized character obtained by character recognition of a receipt image and its position data, and a character string of an item name printed on the receipt. And a definition data storage unit for storing definition data defined for each item name to be read in the receipt, relative position data of the amount item corresponding to the item name from the position in the receipt of the item name , A receipt data extracting unit that extracts a recognized character that matches the character string of the item name defined in the definition data from the recognized character stored in the image data storage unit, and a recognition from the extracted recognized character position data Relative position data of the corresponding monetary item in the definition data when the inclination detector for detecting the inclination of the character and the inclination of the recognized character are detected , Using a tilt correction unit that corrects the detected tilt according to the detected tilt, and using the corrected relative position data, a recognition character stored in the image data storage unit and a recognition character representing the amount item are extracted from the position data. A receipt data specifying unit that generates a recognition result data from a recognition character that matches the item name and a recognition character that represents the amount item, and outputs or stores the recognition result data. It is characterized by.

これによって,事前に入力された売上管理項目に変換すべきレシート項目について,項目名称とそれに対応する金額欄の相対位置とを定義データに登録し,レシート画像から読み取った認識文字の傾きを検出するため,認識文字の傾きがある場合であっても,認識文字の傾きを補正することにより,項目名称に対応する金額欄の相対位置を補正することができ,正確に売上管理項目に必要なレシート項目の金額を読み取ることができる。   As a result, for the receipt item to be converted into the sales management item inputted in advance, the item name and the relative position of the corresponding money amount column are registered in the definition data, and the inclination of the recognized character read from the receipt image is detected. Therefore, even if there is a tilt of the recognized character, the relative position of the amount column corresponding to the item name can be corrected by correcting the tilt of the recognized character, and the receipt required for the sales management item accurately. You can read the amount of the item.

(2)また,本発明は,さらに前記発明において,前記レシートは,店舗ごとに異なるフォーマットで印刷されたレシートであり,前記定義データ記憶部には,店舗ごとに前記定義データが記憶され,レシートを発行した店舗ごとに異なる定義データを用いて,前記レシートデータ抽出部と,前記傾き検出部と,前記傾き補正部と,前記レシートデータ特定部と,前記データ生成部による処理を実行することを特徴とする。   (2) Further, according to the present invention, in the above invention, the receipt is a receipt printed in a format different for each store, and the definition data storage unit stores the definition data for each store. The receipt data extracting unit, the tilt detecting unit, the tilt correcting unit, the receipt data specifying unit, and the data generating unit are executed using different definition data for each store that issued Features.

これによって,店舗ごとに印刷されたレシートの項目名称や印字位置が異なる場合であっても,店舗ごとに項目名称とそれに対応する金額欄の相対位置とを定義データに登録するため,店舗ごとのレシート項目名称およびそれに対応する金額欄の位置の相違に関係なく,レシート画像から必要なレシートデータを読み取ることができる。   As a result, even if the item name and print position of the receipt printed at each store are different, the item name and the relative position of the corresponding amount field are registered in the definition data for each store. The necessary receipt data can be read from the receipt image regardless of the difference between the receipt item name and the position of the corresponding money amount column.

(3)また,本発明は,さらに前記発明において,前記定義データ記憶部に記憶される定義データは,前記レシートに印字される項目名称の文字列に対応して,複数の店舗の売上管理に共通に用いられる売上管理項目名称のデータを含み,前記データ生成部は,前記項目名称に一致する認識文字を,前記定義データに定義された対応する売上管理項目名称に変換した認識結果のデータを生成することを特徴とする。   (3) Further, according to the present invention, in the above invention, the definition data stored in the definition data storage unit corresponds to the character string of the item name printed on the receipt and is used for sales management of a plurality of stores. Including data on sales management item names used in common, and the data generation unit converts recognition character data that matches the item names into corresponding sales management item names defined in the definition data. It is characterized by generating.

これによって,店舗ごとに印刷されたレシートの項目名称や印字位置が異なる場合であっても,事前に入力された売上管理項目に変換すべきレシート項目について,店舗ごとに項目名称とそれに対応する金額欄の相対位置とを定義データに登録するため,店舗ごとのレシート項目名称およびそれに対応する金額欄の位置の相違に関係なく,レシート画像から必要なレシートデータを読み取り,統一した売上管理データを生成することができる。   As a result, even if the item name and print position of the receipt printed at each store are different, the item name and the corresponding amount for each receipt item to be converted into the sales management item input in advance. Regardless of the difference between the receipt item name for each store and the position of the corresponding monetary amount column, the necessary receipt data is read from the receipt image and unified sales management data is generated to register the relative position of the column in the definition data. can do.

本発明の効果は以下のとおりである。
(1)レシートから売上管理項目に必要なレシート項目を予め定義データに登録することにより,それらを用いて自動的に必要なレシートデータを抽出することができるため,売上情報の入力作業の省力化およびスピード化が達成できる。
(2)予め店舗ごとに登録,設定された定義データによって,どのような種類のレシートであるか,どのような項目名称を有し,金額に関する相対位置などの情報を画像の解析に利用することができ,文字認識などを含めて読み取りの精度を高めることができる。
(3)レシートから読み取られた認識文字の各々について文字列の傾きを検出して,それらを用いて定義データの金額に関する相対位置を補正することができるため,レシートの一部の行に傾きがある場合に,レシートデータの抽出の誤認識を回避し,正しいレシートデータを抽出することができる。このため,文字認識などを含めて読み取りの精度を,さらに高めることができる。また,誤認識を低減できるため,チェック作業の省力化およびスピード化が達成できる。
(4)また,レシートの項目が異なる各店舗のレシートデータから,売上管理部門が必要とする基本的なデータを統一的に収集し,売上管理データベースなどに保存することができるようになる。
The effects of the present invention are as follows.
(1) By registering the receipt items necessary for sales management items from the receipt in advance in the definition data, the necessary receipt data can be automatically extracted using them. And speeding up can be achieved.
(2) Using the definition data registered and set in advance for each store, what kind of receipt it has, what item name it has, and information such as relative position with respect to the amount of money is used for image analysis Reading accuracy, including character recognition.
(3) Since the inclination of the character string can be detected for each of the recognized characters read from the receipt and the relative position with respect to the amount of the definition data can be corrected using them, the inclination of some lines of the receipt can be corrected. In some cases, it is possible to avoid erroneous recognition of receipt data extraction and to extract correct receipt data. For this reason, it is possible to further improve the reading accuracy including character recognition. In addition, since recognition errors can be reduced, labor saving and speeding up of the check work can be achieved.
(4) Further, basic data required by the sales management department can be uniformly collected from the receipt data of each store having different receipt items, and stored in a sales management database or the like.

本発明の実施形態の装置構成例を示す図である。It is a figure which shows the apparatus structural example of embodiment of this invention. レシート挟持用シートを説明する図である。It is a figure explaining the sheet | seat for receipt clamping. 売上管理項目とレシート項目との対応関係の例を示す図である。It is a figure which shows the example of the correspondence of a sales management item and a receipt item. 本発明の実施形態に係るレシートデータ認識装置の処理フローチャートである。It is a process flowchart of the receipt data recognition apparatus which concerns on embodiment of this invention. レシート画像の例を示す図である。It is a figure which shows the example of a receipt image. 認識文字データの一例を示す図である。It is a figure which shows an example of recognition character data. 認識文字テーブルの例を示す図である。It is a figure which shows the example of a recognition character table. 定義データテーブルを説明する図である。It is a figure explaining a definition data table. レシートデータ処理のフローチャートである。It is a flowchart of a receipt data process. 傾き補正処理のフローチャートである。It is a flowchart of an inclination correction process. 傾き検出処理および傾き補正処理を説明する図である。It is a figure explaining an inclination detection process and an inclination correction process. 特定されたレシートデータの一例を示す図である。It is a figure which shows an example of the specified receipt data. 売上管理データ生成処理のフローチャートである。It is a flowchart of a sales management data generation process. 売上管理DBの例を示す図である。It is a figure which shows the example of sales management DB. 本発明の課題を説明する図である。It is a figure explaining the subject of this invention. 本発明の課題を説明する図である。It is a figure explaining the subject of this invention.

以下,図面を用いながら,本発明の実施の形態について詳細に説明する。なお,以下では,主に店舗売上を集計する装置の例について説明するが,本発明は売上集計に限られるわけではなく,仕入集計データやその他の伝票などに印字された実績データを集計するための装置などにも同様に適用することができる。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following, an example of an apparatus for totalizing store sales will be described. However, the present invention is not limited to sales totalization, and totals actual data printed on purchase total data or other slips. The present invention can be applied to a device for the same.

図1は,本発明の概要を説明するための装置構成例を示す。図1において,1はCPUおよびハードディスクやメモリ等の記憶装置等から構成され,レシートから読み取ったデータをもとに売上の集計に関する処理を実行するレシートデータ認識装置,20は各店舗に対応付けられた識別コード21(図2に示す)がマーキングされ,各店舗のレシート22(図2に示す)を挟持するレシート挟持用シートである。レシート22は,店舗ごとに異なるフォーマットで印刷されたレシートである。   FIG. 1 shows an apparatus configuration example for explaining the outline of the present invention. In FIG. 1, reference numeral 1 is composed of a CPU and a storage device such as a hard disk and a memory, etc., and a receipt data recognition device for executing processing relating to sales aggregation based on data read from a receipt, and 20 is associated with each store. This is a receipt holding sheet that is marked with the identification code 21 (shown in FIG. 2) and holds the receipt 22 (shown in FIG. 2) of each store. The receipt 22 is a receipt printed in a different format for each store.

なお,レシート22は,テナントの店舗ごとに,例えば一日の店舗の売上を各店舗に備えられたキャッシュレジスタなどで集計した結果が印刷されたものである。また,これらのレシート22は,売上集計に関する一例として示したものであり,売上集計以外にも,仕入集計,その他帳票処理に関するものであってもよい。   The receipt 22 is printed for each tenant's store, for example, the result of totaling the sales of the store in one day using a cash register provided in each store. Further, these receipts 22 are shown as an example related to sales aggregation, and may be related to purchase aggregation and other form processing in addition to sales aggregation.

最初に,レシート挟持用シート20について説明する。図2は,レシート挟持用シート20の一実施態様の構成を示す図である。特に,図2(A)は,レシート挟持用シート20を透明フィルム231側から見た上面図であり,図2(B)は,レシート挟持用シート20においてレシート22が透明シート23に挟持される前の状態を説明する斜視図である。   First, the receipt clamping sheet 20 will be described. FIG. 2 is a diagram showing a configuration of one embodiment of the receipt clamping sheet 20. 2A is a top view of the receipt sandwiching sheet 20 as viewed from the transparent film 231 side, and FIG. 2B is a receipt sandwiching sheet 20 in which the receipt 22 is sandwiched by the transparent sheet 23. FIG. It is a perspective view explaining the previous state.

図2(A)に示すように,例えばレシート挟持用シート20は各店舗のレシート22を台紙付の透明シート23に挟持する。透明シート23の上右端隅には,当該店舗に対応する識別コード21(QRコード(登録商標)などの2次元コード等)が印刷,またはシールなどでマーキングされる。   As shown in FIG. 2A, for example, the receipt holding sheet 20 holds a receipt 22 of each store on a transparent sheet 23 with a mount. In the upper right corner of the transparent sheet 23, an identification code 21 (two-dimensional code such as QR code (registered trademark)) corresponding to the store is printed or marked with a seal or the like.

図2(B)に示すように,透明シート23は,例えば透明フィルム(シート)231と台紙232とが一端233で接続(粘着等)されており,レシート22を挟持する前の状態では透明シート23が半開封状態にある。この半開封状態の透明シート23の台紙232上にレシート22が載せられ,例えば密着面が多少粘着性を有する透明フィルム231と台紙232とが貼り合わされることにより,レシート22が挟持される。なお,前述の識別コード21は,例えば台紙232の上右端隅に位置決めされた範囲で,印刷,シールなどによりマーキングされる。   As shown in FIG. 2B, the transparent sheet 23 is, for example, a transparent film (sheet) 231 and a mount 232 connected (adhesive or the like) at one end 233, and in a state before the receipt 22 is sandwiched, 23 is in a half-opened state. The receipt 22 is placed on the mount 232 of the transparent sheet 23 in the semi-opened state, and the receipt 22 is sandwiched, for example, by adhering the mount 232 and the transparent film 231 having a slightly adhesive surface. The above-described identification code 21 is marked by printing, sticking, or the like within a range positioned at the upper right corner of the mount 232, for example.

次に,レシートデータ認識装置1が処理する,店舗ごとのレシート22におけるレシート項目と,テナント管理部門が集計する売上管理項目との対応関係について説明する。   Next, the correspondence relationship between the receipt items in the receipt 22 for each store and the sales management items counted by the tenant management department, which is processed by the receipt data recognition apparatus 1, will be described.

図3は,売上管理項目とレシート項目との対応関係の一例を示す図である。図3の例では,テナント管理部門が店舗の売上管理に実際に必要な売上集計のデータは,No.1の現金売上からNo.11の客数までの11個の売上管理項目である。しかし,これらの売上管理項目が各店舗のレシート22のレシート項目として,そのまま1対1の関係で印字されていることはない。そこで,店舗ごとの対応関係情報1022(1022a)を用いて,各店舗のレシート項目から11個の各売上管理項目を算出する処理を行う。   FIG. 3 is a diagram illustrating an example of a correspondence relationship between sales management items and receipt items. In the example of FIG. 3, the sales summary data actually required by the tenant management department for store sales management is “No. No. 1 cash sales 11 sales management items up to 11 customers. However, these sales management items are not printed as a one-to-one relationship as receipt items of the receipt 22 of each store. Therefore, processing for calculating each of the eleven sales management items from the receipt item of each store is performed using correspondence information 1022 (1022a) for each store.

図3に示すレシート22aの場合,14番目のレシート項目の「現金売上金額」が,No.1の売上管理項目の「現金売上」に相当することが,対応関係情報1022(1022a)に示されている。その他の売上管理項目についても,それぞれ対応関係情報1022によって対応付けられる。なお,図3に示すような店舗ごとの売上管理項目とレシート項目との対応関係情報1022は,定義データ記憶部102(図1に示す)に予め登録され,格納される。   In the case of the receipt 22 a shown in FIG. 3, the “cash sales amount” of the 14th receipt item is “No. Correspondence information 1022 (1022a) indicates that it corresponds to “cash sales” of one sales management item. Other sales management items are also associated with each other by the correspondence information 1022. The correspondence information 1022 between the sales management item and the receipt item for each store as shown in FIG. 3 is registered and stored in advance in the definition data storage unit 102 (shown in FIG. 1).

図3では,レシート22aに示すレシート項目が,例えば14番目に「現金売上金額」等と示しているが,実際には,14番目(n番目)がレシート内の最上段の位置から固定した行の位置にあるわけではない。店舗の当日のレシート集計結果により,n番目以前のレシート項目で印字行数が増えたり,また印刷時に省かれるレシート項目などがある。このため,レシートデータ認識装置1では,レシート項目におけるレシート項目名称とそれに対応する金額項目の相対位置(相対的な金額欄の位置)とを含む定義データを予め登録し,対応関係情報1022と共に用いることで,上記課題の解決を図っている。   In FIG. 3, the receipt item shown in the receipt 22a is, for example, 14th “cash sales amount” or the like, but in actuality, the 14th (nth) row is fixed from the top position in the receipt. Is not in the position. Depending on the result of receipt collection on the day of the store, the number of print lines increases in the nth or earlier receipt items, or there are receipt items that are omitted during printing. For this reason, in the receipt data recognition device 1, definition data including the receipt item name in the receipt item and the relative position of the corresponding amount item (relative amount field position) is registered in advance and used together with the correspondence information 1022. In this way, the above problems are solved.

レシートデータ認識装置1は,以上のような定義データおよび対応関係情報1022に従って,店舗コードごとに,「売上日付」,売上管理項目No.1「現金売上」,No.2「掛売上」,No.3「クレジット売上」,…などの売上に関する項目に対応する金額を集計し,売上管理データ記憶部103に格納する。そのために,レシートデータ認識装置1は,以下に説明する処理を実行する。   The receipt data recognition apparatus 1 determines the “sales date” and the sales management item No. for each store code according to the definition data and the correspondence information 1022 as described above. 1 “Cash Sales”, No. 1 2 “Multiple sales”, No. 2 3 Amounts corresponding to items related to sales such as “credit sales”,... Are aggregated and stored in the sales management data storage unit 103. For this purpose, the receipt data recognition apparatus 1 executes processing described below.

レシートデータ認識装置1は,レシート挟持用シート20からレシート22を読み取る。レシートデータ認識装置1は,レシート22についての定義データを用いて,レシート項目中の項目名称および金額を含むレシートデータを抽出する。レシートデータ認識装置1は,売上管理項目とレシート項目との対応関係情報1022を用いて,抽出したレシートデータの項目を売上管理データに変換する。すなわち,売上管理データに必要となるレシート項目が抽出され,レシート項目の金額が売上管理データとして集計される。   The receipt data recognition device 1 reads a receipt 22 from a receipt holding sheet 20. The receipt data recognition device 1 uses the definition data for the receipt 22 to extract receipt data including the item name and amount in the receipt item. The receipt data recognition apparatus 1 converts the extracted receipt data item into sales management data using the correspondence information 1022 between the sales management item and the receipt item. That is, receipt items necessary for the sales management data are extracted, and the amounts of the receipt items are aggregated as sales management data.

以上のように,レシートデータ認識装置1は,レシート22を発行した店舗ごとに定義データを用いて,レシートデータ認識処理を実行する。   As described above, the receipt data recognition device 1 executes the receipt data recognition process using the definition data for each store that issued the receipt 22.

以下,上述したレシートデータ認識処理を実行するための,図1に示すレシートデータ認識装置1の構成について,具体的に説明する。   The configuration of the receipt data recognition apparatus 1 shown in FIG. 1 for executing the receipt data recognition process described above will be specifically described below.

画像データ記憶部101は,読取機10により読み取られたレシート挟持用シート20の画像データを記憶する。画像データは,レシート22の画像をOCR処理することにより得られた認識文字およびその座標(位置データ)を含むデータである。さらに,画像データは,識別コード21を含んでもよい。また,画像データ記憶部101は,画像データに関連付けて,レシート挟持用シート20の画像ファイル,例えばビットマップ形式ファイル等を格納してもよい。   The image data storage unit 101 stores the image data of the receipt sandwiching sheet 20 read by the reader 10. The image data is data including a recognized character and its coordinates (position data) obtained by performing OCR processing on the image of the receipt 22. Furthermore, the image data may include an identification code 21. The image data storage unit 101 may store an image file of the receipt sandwiching sheet 20 such as a bitmap format file in association with the image data.

定義データ記憶部102は,レシートデータ認識装置1に用いられる定義データを格納する記憶手段である。定義データは,店舗ごとにレシート22のレシート項目および金額の位置などの情報を含む。   The definition data storage unit 102 is a storage unit that stores definition data used in the receipt data recognition apparatus 1. The definition data includes information such as the receipt item of the receipt 22 and the position of the amount for each store.

具体的には,定義データは,レシート22に印字されるレシート項目名称の文字列に対応して,複数の店舗の売上管理に共通に用いられる売上管理項目名称が登録される。例えば,定義データは,レシート22に印字されるレシート項目名称の文字列と,レシート項目名称のレシート内位置からの,そのレシート項目名称に対応する金額項目の相対位置データとを含み,レシート22における読取り対象となる各レシート項目名称ごとに定義される。このような定義データは,集計する店舗のレシート22ごとに,予め作成され,定義データ記憶部102に格納される。なお,定義データの詳細は,図8を用いて後述する。   Specifically, in the definition data, sales management item names that are commonly used for sales management of a plurality of stores are registered corresponding to the character string of the receipt item name printed on the receipt 22. For example, the definition data includes a receipt item name character string printed on the receipt 22 and a relative position data of a monetary item corresponding to the receipt item name from the position in the receipt of the receipt item name. Defined for each receipt item name to be read. Such definition data is created in advance for each receipt 22 of the store to be tabulated and stored in the definition data storage unit 102. Details of the definition data will be described later with reference to FIG.

売上管理データ記憶部103は,レシートデータ認識装置1が生成する売上管理データを保存する記憶手段である。売上管理データは,店舗ごとに異なるレシート項目を統一した売上管理項目に対応させて,各店舗のレシート項目の金額を収集した結果のデータである。なお,売上管理データの詳細は,図14を用いて後述する。   The sales management data storage unit 103 is a storage unit that stores sales management data generated by the receipt data recognition apparatus 1. The sales management data is data obtained as a result of collecting the amounts of the receipt items of each store in association with the sales management items in which the receipt items different for each store are unified. Details of the sales management data will be described later with reference to FIG.

読取機10は,画像のスキャンニングに光学方式などを用いて,レシート挟持用シート20の画像を読み取る装置である。読取機10は,レシート挟持用シート20が入力されると,レシート挟持用シート20を画像データに変換する。画像データは,例えば画像ファイル,OCRによる認識文字データを含む。読取機10は,変換した画像データを画像データ記憶部101に保存する。例えば,読取機10は,スキャナー,OCR処理装置などの周知の技術によるものである。   The reader 10 is an apparatus that reads an image on the receipt sandwiching sheet 20 by using an optical method or the like for image scanning. When the receipt holding sheet 20 is input, the reader 10 converts the receipt holding sheet 20 into image data. The image data includes, for example, an image file and character data recognized by OCR. The reader 10 stores the converted image data in the image data storage unit 101. For example, the reader 10 is based on a known technique such as a scanner or an OCR processing device.

画像データ読込部11は,画像データ記憶部101に保存された画像データを読み出す。なお,画像データ読込部11が,レシートデータ認識装置1の外部の入力装置から画像データを入力してもよい。外部の入力装置は,読取装置,ネットワーク装置などである。この場合には,例えばネットワーク等を介して,レシートデータ認識装置1の設置場所以外に設置されている読取装置で入力されたレシート挟持用シート20の画像データを,入力装置(図示しない)が入力し,画像データ記憶部101に保存する。   The image data reading unit 11 reads the image data stored in the image data storage unit 101. Note that the image data reading unit 11 may input image data from an input device external to the receipt data recognition device 1. The external input device is a reading device, a network device, or the like. In this case, an input device (not shown) inputs the image data of the receipt sandwiching sheet 20 input by a reading device installed at a location other than the installation location of the receipt data recognition device 1 via a network or the like. And stored in the image data storage unit 101.

店舗特定部12は,レシート挟持用シート20の識別コード21を識別して,店舗コード(または店舗)を特定する。なお,図1の構成例では,店舗コードのための識別コード21がレシート挟持用シート20上に認識マーク化されているが,店舗コードの読み取り方法は本実施例に限定されない。例えば,レシート22の読み取りの際に,ユーザが,店舗コードをテンキー,カードリーダなどの外部の入力装置を介して入力してもよい。その場合には,外部の入力装置から入力された店舗コードを店舗特定部12が受ける。また,読取機10がレシート挟持用シート20の識別コード21を読み取り,店舗特定部12がその読み取られた識別コード21から店舗コードを特定してもよい。   The store specifying unit 12 specifies the store code (or store) by identifying the identification code 21 of the receipt sandwiching sheet 20. In the configuration example of FIG. 1, the identification code 21 for the store code is formed as a recognition mark on the receipt sandwiching sheet 20, but the method of reading the store code is not limited to this embodiment. For example, when reading the receipt 22, the user may input the store code via an external input device such as a numeric keypad or a card reader. In that case, the store specifying unit 12 receives a store code input from an external input device. Alternatively, the reader 10 may read the identification code 21 of the receipt holding sheet 20 and the store specifying unit 12 may specify the store code from the read identification code 21.

定義データ読込部13は,店舗特定部12により特定された店舗コードを受けると,定義データ記憶部102から店舗コードに対応付けられた定義データを検索する。定義データ読込部13は,定義データ記憶部102から検索した定義データを読み出し,読み出した定義データをレシートデータ処理部14に送る。   When the definition data reading unit 13 receives the store code specified by the store specifying unit 12, the definition data reading unit 13 searches the definition data storage unit 102 for definition data associated with the store code. The definition data reading unit 13 reads the definition data retrieved from the definition data storage unit 102 and sends the read definition data to the receipt data processing unit 14.

レシートデータ処理部14は,店舗コードごとの定義データを用いて,画像データからレシート項目名称およびその金額を含むレシートデータを抽出し,抽出したレシートデータから売上管理項目に必要となるレシートデータを特定する。そのために,レシートデータ処理部14は,図1に示すように,以下の機能部を含む。   The receipt data processing unit 14 uses the definition data for each store code to extract receipt data including the receipt item name and its amount from the image data, and specifies the receipt data required for the sales management item from the extracted receipt data. To do. For this purpose, the receipt data processing unit 14 includes the following functional units as shown in FIG.

レシートデータ抽出部141は,画像データ記憶部101に記憶された画像データの認識文字データから,定義データに定義されたレシート項目名称の文字列に一致する認識文字を検索し,その認識文字データを抽出する。認識文字データは,予めレシートデータ認識装置1が備える辞書(図示しない)による候補文字と,OCR処理による認識文字との相違度を示す値と,文字の範囲を示す相対的な座標位置(相対位置)を含む。なお,認識文字データについては,図6を用いて後述する。   The receipt data extraction unit 141 searches the recognized character data of the image data stored in the image data storage unit 101 for a recognized character that matches the character string of the receipt item name defined in the definition data, and uses the recognized character data. Extract. The recognized character data includes a value indicating a difference between a candidate character by a dictionary (not shown) provided in the receipt data recognition device 1 in advance and a recognized character by OCR processing, and a relative coordinate position (relative position) indicating a character range. )including. The recognized character data will be described later with reference to FIG.

傾き検出部142は,抽出された認識文字データの認識文字の相対位置を用いて,認識文字の傾きを検出する。例えば,認識文字の傾きを検出するために,傾き検出部142は,レシート項目名称の文字列に一致する,1または複数の認識文字について,予め基準とする方向に対しての相対位置のずれを求める。傾き検出部142は,予め基準とする方向に対しての相対位置のずれの方向とのなす角を,傾きの角度として求める。なお,傾きの検出方法については,図11を用いて後述する。   The inclination detecting unit 142 detects the inclination of the recognized character using the relative position of the recognized character in the extracted recognized character data. For example, in order to detect the inclination of the recognized character, the inclination detecting unit 142 detects the deviation of the relative position with respect to the reference direction in advance for one or more recognized characters that match the character string of the receipt item name. Ask. The inclination detection unit 142 obtains an angle formed by the direction of the relative position shift with respect to a reference direction in advance as an inclination angle. A method for detecting the inclination will be described later with reference to FIG.

傾き補正部143は,認識文字の傾きが検出された場合に,定義データを参照して,レシート項目名称の文字列に一致する認識文字に対応する金額項目の相対位置を,検出された傾きの角度に応じて補正する。一方,傾き補正部143は,認識文字の傾きが検出されない場合に,レシート項目名称の文字列に一致する認識文字に対応する金額項目の相対位置を補正しない。   When the inclination of the recognized character is detected, the inclination correction unit 143 refers to the definition data, and determines the relative position of the amount item corresponding to the recognized character that matches the character string of the receipt item name. Correct according to the angle. On the other hand, when the inclination of the recognized character is not detected, the inclination correction unit 143 does not correct the relative position of the amount item corresponding to the recognized character that matches the character string of the receipt item name.

レシートデータ特定部144は,傾き補正部143からレシート項目名称に対応する金額項目の相対位置を受けると,画像データ記憶部101に記憶された認識文字の中から,その金額項目の相対位置に対応する認識文字を抽出する。これにより,レシートデータ特定部144は,レシート項名称に対応する金額項目を正確に特定することができる。   When receiving the relative position of the amount item corresponding to the receipt item name from the inclination correcting unit 143, the receipt data specifying unit 144 corresponds to the relative position of the amount item from the recognized characters stored in the image data storage unit 101. The recognition character to be extracted is extracted. Accordingly, the receipt data specifying unit 144 can accurately specify the amount item corresponding to the receipt item name.

売上管理データ生成部15は,レシートデータ処理部14により特定されたレシートデータを用いて,売上管理データを生成する。具体的には,売上管理データ生成部15は,レシート項目名称に一致する認識文字と,定義データに定義された対応する売上管理項目名称とに対応付けられる対応関係情報1022とを用いて,認識結果における金額項目の数値データを演算(変換)し,売上管理データを生成する。売上管理データは,店舗コード,売上管理項目および売上管理項目に対応する金額を含む。   The sales management data generation unit 15 generates sales management data using the receipt data specified by the receipt data processing unit 14. Specifically, the sales management data generation unit 15 recognizes using the recognition character that matches the receipt item name and the correspondence information 1022 that is associated with the corresponding sales management item name defined in the definition data. Calculate (convert) the numerical data of the monetary item in the result to generate sales management data. The sales management data includes a store code, a sales management item, and an amount corresponding to the sales management item.

例えば,売上管理データ生成部15は,売上管理項目とレシート項目との対応関係情報1022に従って,店舗コードごとに,「売上日付」,売上管理項目No.1「現金売上」,No.2「掛売上」,No.3「クレジット売上」,…などの売上に関する項目に対応する金額に変換し,これらを売上管理データ記憶部103に記憶する。   For example, the sales management data generation unit 15 sets the “sales date”, the sales management item No., for each store code in accordance with the correspondence information 1022 between the sales management item and the receipt item. 1 “Cash Sales”, No. 1 2 “Multiple sales”, No. 2 3 Converts the amount corresponding to the item related to sales such as “credit sales”,... And stores them in the sales management data storage unit 103.

以下に,図4,図9,図10および図13の処理フローチャートに従って,その他の図も用いながら,図1に示すレシートデータ認識装置1の詳細な機能について説明する。   In the following, the detailed functions of the receipt data recognition apparatus 1 shown in FIG. 1 will be described with reference to the processing flowcharts of FIGS. 4, 9, 10 and 13 while also using other figures.

図4は,本発明の実施形態に係るレシートデータ認識装置1の処理フローチャートである。図4に従って,レシートデータ認識装置1が実行する処理について具体的に説明する。   FIG. 4 is a process flowchart of the receipt data recognition apparatus 1 according to the embodiment of the present invention. The processing executed by the receipt data recognition apparatus 1 will be specifically described with reference to FIG.

レシートデータ認識装置1が起動されて,本処理が開始される。読取機10にレシート挟持用シート20が入力されると,読取機10がレシート挟持用シート20を読み取り,読み取ったレシート挟持用シート20の画像データを,画像データ記憶部101に保存する(ステップS11)。   The receipt data recognition apparatus 1 is activated and this process is started. When the receipt holding sheet 20 is input to the reader 10, the reader 10 reads the receipt holding sheet 20, and stores the read image data of the receipt holding sheet 20 in the image data storage unit 101 (step S11). ).

具体的に説明するために,図5〜図7を用いて,レシートの画像データからOCR処理される文字列を説明する。   For specific description, a character string that is OCR processed from receipt image data will be described with reference to FIGS.

図5は,読取機10により読み取られたレシート22bの画像の例を示している。読取機10により生成された画像データは,OCR処理による認識文字データを含む。読取機10は,レシート22(22b)の画像をOCR処理すると,認識文字データを生成し,画像データ読込部11に記憶する。認識文字データは,認識文字からなる文字列の文字数および文字列の座標,文字列を構成する文字の座標および辞書からの候補文字とされる認識文字リストを含む。OCR処理による認識文字の対象は,レシート22bに印刷されている文字列#1,文字列#2,…,文字列#14,…等である。例えば,文字列#14は,「総売上」である。   FIG. 5 shows an example of an image of the receipt 22b read by the reader 10. The image data generated by the reader 10 includes recognized character data by OCR processing. When the image of the receipt 22 (22b) is OCR processed, the reader 10 generates recognized character data and stores it in the image data reading unit 11. The recognized character data includes the number of characters of the character string composed of the recognized characters and the coordinates of the character string, the coordinates of the characters constituting the character string, and a recognized character list that is a candidate character from the dictionary. Recognized characters by the OCR process are character string # 1, character string # 2,..., Character string # 14,. For example, the character string # 14 is “total sales”.

図6は,OCR処理による認識文字データの一例を示す図である。特に,図6には,図5に示す文字列#14「総売上」の認識文字データ110について示す。   FIG. 6 is a diagram showing an example of recognized character data by OCR processing. In particular, FIG. 6 shows the recognized character data 110 of the character string # 14 “total sales” shown in FIG.

図6において,認識文字データ110は,文字列#14「総売上」の文字数3,座標(x,y)−(x’,y’)を含む。また,認識文字データ110は,文字列#14を構成する文字#141「総」,#142「売」および#143「上」の3文字について,各々の座標を含む。例えば,文字#141「総」の座標は,(x1,y1)−(x’1,y’1)であり,その他の文字についても,図示のとおりである。なお,(x,y)−(x’,y’)等は,図示の長方形枠の座標を表すものであり,紙面上から見て(x,y)が左上,(x’,y’)が右下に対応する座標である。例えば,左上が座標原点へ向かう方向であり,右下が原点座標から離れる方向である。座標原点は,例えばレシート挟持用シート20における画像の特定位置とされる。   In FIG. 6, the recognized character data 110 includes the number of characters 3 and the coordinates (x, y) − (x ′, y ′) of the character string # 14 “total sales”. The recognized character data 110 also includes the coordinates of the three characters of character # 141 “total”, # 142 “sell”, and # 143 “upper” that constitute character string # 14. For example, the coordinates of the character # 141 “total” are (x1, y1) − (x′1, y′1), and the other characters are as illustrated. Note that (x, y) − (x ′, y ′) and the like represent the coordinates of the illustrated rectangular frame, and (x, y) is the upper left as viewed from the paper, and (x ′, y ′). Is the coordinate corresponding to the lower right. For example, the upper left is the direction toward the coordinate origin, and the lower right is the direction away from the origin coordinates. The coordinate origin is, for example, a specific position of the image on the receipt holding sheet 20.

さらに,認識文字データ110は,文字#141「総」,#142「売」および#143「上」の3文字の認識文字リストを含む。認識文字リストは,辞書からの候補文字とされる認識順位に応じて,その候補とされる認識文字と,その認識文字と読み取られた文字の相違度(または一致度)とが格納される。例えば,文字#141「総」の認識文字リストでは,順位「1」が,認識文字「総」,相違度「1311」であり,順位「2」が,「脆」,相違度「1581」であり,その他の順位についても同様に示される。相違度は,例えば0に近い数値ほど,予め備えられた辞書(図示しない)の候補文字と一致する度合いが大きく,その値が大きいほど,辞書の候補文字と相違する度合いが大きいことを示す。文字#142「売」および#143「上」の認識文字リストについても,図6に示すとおりである。   Further, the recognized character data 110 includes a recognized character list of three characters of character # 141 “total”, # 142 “sell”, and # 143 “upper”. The recognized character list stores the recognized characters that are candidates and the degree of difference (or degree of coincidence) between the recognized characters and the read characters in accordance with the recognition order that is the candidate character from the dictionary. For example, in the recognized character list of the character # 141 “total”, the rank “1” is the recognized character “total” and the dissimilarity “1311”, the rank “2” is “fragile”, and the dissimilarity is “1581”. Yes, other rankings are shown in the same way. The degree of difference indicates that, for example, a numerical value closer to 0 indicates a higher degree of matching with a candidate character (not shown) provided in advance, and a higher value indicates a higher degree of difference from the dictionary candidate character. The recognized character lists of the characters # 142 “Sell” and # 143 “Up” are also as shown in FIG.

図7は,画像データ記憶部101に保存される認識文字テーブル1011の一例を示す図である。認識文字テーブル1011は,読み込まれた画像データごとに,認識文字データを格納するテーブルである。さらに,認識文字テーブル1011は,レシート22の認識された文字列ごとに,認識文字データを含む。認識文字データは,前述したとおりである。   FIG. 7 is a diagram illustrating an example of the recognized character table 1011 stored in the image data storage unit 101. The recognized character table 1011 is a table that stores recognized character data for each read image data. Further, the recognized character table 1011 includes recognized character data for each recognized character string of the receipt 22. The recognized character data is as described above.

図7に示す認識文字テーブル1011は,図5で示す文字列#1〜#14,…等の認識文字データを格納する。例えば,前述した文字列#14「総売上」,文字列#14を構成する文字#141「総」,#142「売」および#143「上」が,認識文字テーブル1011に格納されている。その他の文字列についても同様に格納されている。なお,図7に示す認識文字テーブル1011における項目,設定等の定義は,図6の認識文字データのそれらと同様であるため,ここでは説明を省く。   The recognized character table 1011 shown in FIG. 7 stores recognized character data such as character strings # 1 to # 14,... Shown in FIG. For example, the character string # 14 “total sales” and the characters # 141 “total”, # 142 “sell”, and # 143 “upper” constituting the character string # 14 are stored in the recognized character table 1011. Other character strings are stored in the same manner. Note that the definitions of items, settings, etc. in the recognized character table 1011 shown in FIG. 7 are the same as those of the recognized character data in FIG.

次に,画像データ読込部11が,画像データ記憶部101から画像データを読み込むと,店舗特定部12は,画像データからレシート挟持用シート20の識別コード21を判別し,判別した識別コード21から店舗コードを読み取る(ステップS12)。   Next, when the image data reading unit 11 reads the image data from the image data storage unit 101, the store specifying unit 12 determines the identification code 21 of the receipt sandwiching sheet 20 from the image data, and from the determined identification code 21. The store code is read (step S12).

具体的には,店舗特定部12は,例えばQRコード等を復号し,復号したデータから店舗コード,もしくは,店舗コードに対応付けられた識別番号などを特定する。なお,読取機10によりQRコードを復号し,店舗特定部12が復号したデータから店舗コードを特定してもよく,その特定方法は限定されない。   Specifically, the store specifying unit 12 decodes a QR code or the like, for example, and specifies a store code or an identification number associated with the store code from the decoded data. The QR code may be decoded by the reader 10 and the store code may be specified from the data decoded by the store specifying unit 12, and the specifying method is not limited.

次に,定義データ読込部13は,店舗特定部12により特定された店舗コードを受けると,店舗コードに対応付けられた定義データを,定義データ記憶部102から取得する(ステップS13)。   Next, upon receiving the store code specified by the store specifying unit 12, the definition data reading unit 13 acquires definition data associated with the store code from the definition data storage unit 102 (step S13).

具体的には,図8に,定義データテーブル1021を説明する図を示す。以下,図8を用いて,定義データ読込部13が取得する定義データの一例を説明する。   Specifically, FIG. 8 is a diagram illustrating the definition data table 1021. Hereinafter, an example of the definition data acquired by the definition data reading unit 13 will be described with reference to FIG.

図8に示すレシート22tは,ある店舗の定義データの作成のために用意されるレシート22(基準レシートとする)の画像の一部である。また,図8において,定義データテーブル1021は,予め作成された定義データを格納し,定義データ記憶部102に記憶されるデータである。なお,レシート22tには,行番号と,レシート項目名称と,金額とが表示されている。このレシート22tから,14行目(BX14)の「現金売上金額」と,18行目(BX18)の「その他金券金額」とが抽出対象のレシート項目であるとする。   A receipt 22t shown in FIG. 8 is a part of an image of a receipt 22 (referred to as a reference receipt) prepared for creating definition data of a certain store. In FIG. 8, a definition data table 1021 stores definition data created in advance and is stored in the definition data storage unit 102. The receipt 22t displays the line number, receipt item name, and amount. From this receipt 22t, it is assumed that “cash sales amount” on the 14th line (BX14) and “other voucher amount” on the 18th line (BX18) are the receipt items to be extracted.

定義データテーブル1021では,抽出対象のレシート項目が,定義データとして登録される。定義データを予め作成するために,店舗ごとの基準とされる基準レシート(レシート22t)が用いられ,基準レシートをもとにして店舗ごとのレシート22に対する定義データが作成される。   In the definition data table 1021, receipt items to be extracted are registered as definition data. In order to create the definition data in advance, a reference receipt (receipt 22t) used as a reference for each store is used, and definition data for the receipt 22 for each store is created based on the reference receipt.

定義データテーブル1021には,対象の店舗コードと,抽出するレシート項目ごとに,「読取項目」,「項目属性」,「読取文字」および「金額欄の読取位置」とが格納される。「店舗コード」は,対象となるレシートの店舗に対応する店舗ごとの識別番号である。「読取項目」は,売上管理項目の名称である。「項目属性」は,読み取るべきレシート項目名称の属性である。その属性は,例えば“1”,“2”または“3”のいずれかの値である。“1”は売上管理項目に対応するレシート項目名称が基準レシートに重複していない(通常の項目)場合,“2”は重複している同一名称がありかつアンカー文字を設定する場合,“3”は重複している同一名称がありかつ複数キーワードを設定する場合の属性とされる。「読取文字」は,売上管理項目に対応する基準レシート上に印字されるレシート項目名称である。「金額欄の読取位置」は,読取文字からのレシート項目の金額(数値文字,通貨記号などを含む)の相対位置である。   The definition data table 1021 stores “read item”, “item attribute”, “read character”, and “read position of the money amount column” for each target store code and receipt item to be extracted. “Store code” is an identification number for each store corresponding to the store of the target receipt. “Read item” is the name of a sales management item. “Item attribute” is an attribute of a receipt item name to be read. The attribute is, for example, a value of “1”, “2”, or “3”. “1” indicates that the receipt item name corresponding to the sales management item is not duplicated in the standard receipt (ordinary item), “2” indicates that there is an identical duplicate name and an anchor character is set, and “3” "" Is an attribute when there are duplicate names and multiple keywords are set. “Reading character” is a receipt item name printed on the reference receipt corresponding to the sales management item. The “reading position in the amount field” is a relative position of the amount (including numerical characters, currency symbols, etc.) of the receipt item from the reading character.

図8に示す基準レシートとされるレシート22tにおいて,画像位置BX14には,「現金売上金額」および「¥139,639」とされる文字列Str#1およびDat#1がある。また,文字列Str#1と文字列Dat#1との相対距離は,Dis#1とする。画像位置BX18には,「その他金券金額」および「¥8,000」とされる文字列Str#2およびDat#2がある。また,文字列Str#2と文字Dat#2との相対距離は,Dis#2とする。   In the receipt 22t that is the reference receipt shown in FIG. 8, the image position BX14 includes character strings Str # 1 and Dat # 1 that are “cash sales amount” and “¥ 139,639”. The relative distance between the character string Str # 1 and the character string Dat # 1 is set to Dis # 1. In the image position BX18, there are character strings Str # 2 and Dat # 2 that are “other money voucher amount” and “¥ 8,000”. The relative distance between the character string Str # 2 and the character Dat # 2 is set to Dis # 2.

図8に示す定義データテーブル1021は,図8に示すレシート22tから作成される定義データを格納する。図8に示すように,定義データテーブル1021には,「店舗コード」:“100001”が,基準レシートの対象となる店舗コードとして設定される。「読取項目#1」:“現金売上”は,売上管理項目の中の項目名称“現金売上”が設定された結果である。「項目属性#1」:“1”は,前述した通常の項目が設定された結果である。「読取文字#1」:“現金売上金額”は,レシート22tの画像位置BX14における文字列Str#1が設定された結果である。「金額欄の読取位置#1」:“(x11,y11)−(x’11,y’11)”は,文字列Str#1と文字列Dat#1との相対距離Dis#1として,文字列Str#1の位置から文字列Dat#1の位置の相対位置が設定された結果である。なお,相対位置として,図示された文字列Dat#1の長方形枠の左上の座標(x11,y11),同じく右下の座標(x’11,y’11)が格納されていることを示す。なお,これらの座標は,相対的な座標である。その他の定義データについても同様に格納されている。なお,図8に示す定義データテーブル1021における#nは,複数の定義データの設定項目を区別するための識別子であり,nは1,2等の整数とする。   The definition data table 1021 shown in FIG. 8 stores definition data created from the receipt 22t shown in FIG. As shown in FIG. 8, “store code”: “100001” is set in the definition data table 1021 as a store code that is a target of the reference receipt. “Read item # 1”: “cash sales” is a result of setting the item name “cash sales” in the sales management items. “Item attribute # 1”: “1” is a result of setting the above-described normal item. “Reading character # 1”: “cash sales amount” is a result of setting the character string Str # 1 at the image position BX14 of the receipt 22t. “Money amount reading position # 1”: “(x11, y11) − (x′11, y′11)” is a character as a relative distance Dis # 1 between the character string Str # 1 and the character string Dat # 1. This is a result of setting the relative position of the position of the character string Dat # 1 from the position of the string Str # 1. As relative positions, the upper left coordinates (x11, y11) and the lower right coordinates (x'11, y'11) of the rectangular frame of the illustrated character string Dat # 1 are stored. These coordinates are relative coordinates. Other definition data is stored in the same manner. Note that #n in the definition data table 1021 shown in FIG. 8 is an identifier for distinguishing the setting items of a plurality of definition data, and n is an integer such as 1, 2.

以上説明した定義データテーブル1021は,レシートデータ抽出部141がレシートデータを抽出する際に,定義データ読込部13を介して参照される。レシートデータ抽出部141は,定義データテーブル1021に格納された定義データに基づき,読み込んだ画像データ(レシート22の認識文字)について,レシート項目を抽出する。すなわち,レシートデータ抽出部141は,基準レシートの定義データにより,抽出すべきレシート項目を判断することができる。   The definition data table 1021 described above is referred to via the definition data reading unit 13 when the receipt data extraction unit 141 extracts receipt data. The receipt data extraction unit 141 extracts receipt items for the read image data (recognized characters of the receipt 22) based on the definition data stored in the definition data table 1021. That is, the receipt data extraction unit 141 can determine the receipt item to be extracted based on the definition data of the reference receipt.

なお,実際には,精算レシート(レシート22)は,同じPOSシステムで印刷した場合であっても,その時々の出力により,途中のレシート項目の一部を飛ばして(抜かす)印刷する場合がある。従って,定義データテーブル1021における「金額欄の読取位置」を固定座標で作成すると,このような一部のレシート項目を飛ばして印刷する場合に対応できない。そのため,図8に示す定義データテーブル1021のように,レシート項目名称の文字列位置からの相対位置の座標位置を定義データとして用いることにより,このような一部のレシート項目を飛ばして印刷する場合に対応することができる。また,図8においては,レシート項目名称とその対応する金額が,同じ行に印刷されている例で説明しているが,レシート項目名称とその対応する金額が,異なる行であっても良い。その場合には,定義データにその異なる行の金額の相対位置などが登録される。   Actually, even when the payment receipt (receipt 22) is printed by the same POS system, some receipt items in the middle may be skipped (dropped) depending on the output at that time. . Accordingly, if the “reading position of the amount column” in the definition data table 1021 is created with fixed coordinates, it is not possible to cope with a case where such a part of receipt item is skipped and printed. Therefore, as in the definition data table 1021 shown in FIG. 8, by using the coordinate position of the relative position from the character string position of the receipt item name as the definition data, printing such a part of the receipt items is skipped. It can correspond to. In FIG. 8, the receipt item name and the corresponding amount of money are printed on the same line. However, the receipt item name and the corresponding amount of money may be on different lines. In that case, the relative position of the amount of money in the different rows is registered in the definition data.

次に,レシートデータ処理部14は,定義データ読込部13から店舗コードに対応付けられた定義データを受けると,レシートデータ処理を実行する(ステップS14)。このレシートデータ処理の詳細なフローについては,図9を用いて後述する。   Next, when the receipt data processing unit 14 receives the definition data associated with the store code from the definition data reading unit 13, the receipt data processing unit 14 executes receipt data processing (step S14). A detailed flow of the receipt data processing will be described later with reference to FIG.

レシートデータ処理部14によりレシートデータ処理された後に,売上管理データ生成部15は,処理されたレシートデータから売上管理データを生成する。売上管理データ生成部15は,生成した売上管理データを売上管理データ記憶部103に保存する(ステップS15)。売上管理データを保存後,レシートデータ認識装置1は,本処理を終了する。なお,ステップS15の詳細な処理フローについては,図13を用いて後述する。   After receipt data processing is performed by the receipt data processing unit 14, the sales management data generating unit 15 generates sales management data from the processed receipt data. The sales management data generation unit 15 stores the generated sales management data in the sales management data storage unit 103 (step S15). After storing the sales management data, the receipt data recognition apparatus 1 ends this processing. The detailed processing flow of step S15 will be described later with reference to FIG.

以上説明した処理フローが,レシートデータ認識装置1が実行する処理全体のフローである。   The processing flow described above is the overall processing flow executed by the receipt data recognition apparatus 1.

図9は,図4に示すステップS14におけるレシートデータ処理の詳細な処理フローチャートである。図9に従って,レシートデータ処理部14が実行するレシートデータ処理について具体的に説明する。   FIG. 9 is a detailed process flowchart of the receipt data process in step S14 shown in FIG. The receipt data processing executed by the receipt data processing unit 14 will be specifically described with reference to FIG.

レシートデータ抽出部141は,画像データの中からレシート22の対象とする行の項目名称のみを抽出する(ステップS21)。   The receipt data extraction unit 141 extracts only the item name of the line targeted for the receipt 22 from the image data (step S21).

具体的には,レシートデータ抽出部141は,画像データ読込部11から画像データ(認識文字データ)を受けると,レシート22の1行目から項目名称のみを抽出する。例えば,図5の画像データである場合,レシート22bの文字列#1「2010年10月10日(日) 22:30 No:0002」が抽出され。文字列#2「**」,…,文字列#7「売計」,文字列#8「297点」,文字列#9「¥226,701」,…等が抽出され,空行などは抽出されない。なお,このステップS21では,項目名称として,レシート項目名称,金額,記号(例えば「**」)なども含めて抽出される。   Specifically, upon receipt of image data (recognized character data) from the image data reading unit 11, the receipt data extraction unit 141 extracts only the item name from the first line of the receipt 22. For example, in the case of the image data of FIG. 5, the character string # 1 “October 10, 2010 (Sunday) 22:30 No: 0002” of the receipt 22b is extracted. Character string # 2 “**”,..., Character string # 7 “sales”, character string # 8 “297 points”, character string # 9 “¥ 226,701”,. Not extracted. In step S21, the item name including the receipt item name, amount, symbol (for example, “**”) is extracted.

次に,レシートデータ抽出部141は,定義データテーブル1021に格納された定義データを参照する(ステップS22)。   Next, the receipt data extraction unit 141 refers to the definition data stored in the definition data table 1021 (step S22).

具体的には,定義データ読込部13が,定義データ記憶部102に格納された定義データテーブル1021から店舗コードに対応する定義データを読み出す。定義データ読込部13は,読み出した定義データをレシートデータ抽出部141に送る。レシートデータ抽出部141は,ステップS23以降の処理において,定義データ読込部13から送られた定義データを用いる。なお,レシートデータ抽出部141は,定義データ読込部13から送られた定義データを,ワークメモリ(図示しない)に保存し,ワークメモリ上で定義データを参照する。   Specifically, the definition data reading unit 13 reads definition data corresponding to the store code from the definition data table 1021 stored in the definition data storage unit 102. The definition data reading unit 13 sends the read definition data to the receipt data extraction unit 141. The receipt data extraction unit 141 uses the definition data sent from the definition data reading unit 13 in the processing from step S23. The receipt data extraction unit 141 stores the definition data sent from the definition data reading unit 13 in a work memory (not shown), and refers to the definition data on the work memory.

次に,レシートデータ抽出部141は,抽出した項目名称が定義データに設定されているかをチェックする(ステップS23)。   Next, the receipt data extraction unit 141 checks whether or not the extracted item name is set in the definition data (step S23).

具体的には,レシートデータ抽出部141は,図5に示す文字列#14「総売上」について,定義データテーブル1021の読取文字#n(nは整数)の中に一致するものがあるかをチェックする。   Specifically, the receipt data extraction unit 141 determines whether there is a match among the read characters #n (n is an integer) in the definition data table 1021 for the character string # 14 “total sales” shown in FIG. To check.

次に,定義データに設定されている場合(ステップS23:Yes),傾き検出部142が,定義データの読取文字と一致する認識文字について傾きを算出する(ステップS24)。一方,定義データに設定されていない場合(ステップS23:No),ステップS28に処理を移す。   Next, when it is set in the definition data (step S23: Yes), the inclination detection unit 142 calculates an inclination for the recognized character that matches the read character of the definition data (step S24). On the other hand, if it is not set in the definition data (step S23: No), the process proceeds to step S28.

具体的には,傾き検出部142が,定義データの読取文字と一致する認識文字のy座標から傾きを検出する。   Specifically, the inclination detecting unit 142 detects the inclination from the y coordinate of the recognized character that matches the read character of the definition data.

図11は,傾き検出処理および傾き補正処理を説明する図である。特に,図11(A)は,レシート22dにおけるレシート項目の並びの例を示す図であり,図11(B)は,認識文字の傾きの検出および補正の動作を説明する図である。   FIG. 11 is a diagram for explaining the inclination detection process and the inclination correction process. In particular, FIG. 11A is a diagram showing an example of the arrangement of receipt items in the receipt 22d, and FIG. 11B is a diagram for explaining the operation of detecting and correcting the inclination of the recognized character.

図11(A)および図11(B)に示すように,文字列Str#20「総売上」は,認識文字Str#21「総」,Str#22「売」およびStr#23「上」からなる文字列であり,これらの文字は,画像データ上において基準となる方向に対して,傾きの角度αを成すものとする。   As shown in FIGS. 11A and 11B, the character string Str # 20 “total sales” is obtained from the recognized characters Str # 21 “total”, Str # 22 “sell”, and Str # 23 “above”. It is assumed that these characters form an inclination angle α with respect to a reference direction on the image data.

画像データ読込部11から送られた認識文字について,レシートデータ抽出部141は,定義データテーブル1021の読取文字#nを参照して,一致するものがあるかをチェックする。例えば,認識文字である文字列Str#20「総売上」について,定義データテーブル1021の読取文字#n「総売上」にあるとする。   For the recognized character sent from the image data reading unit 11, the receipt data extraction unit 141 refers to the read character #n in the definition data table 1021 to check whether there is a match. For example, it is assumed that the character string Str # 20 “total sales”, which is a recognized character, is in the read character #n “total sales” of the definition data table 1021.

レシートデータ抽出部141は,画像データ読込部11から送られた文字列Str#20「総売上」について,ワークメモリ上の認識文字テーブル1011を参照する。レシートデータ抽出部141は,認識文字テーブル1011上で検索ヒットした認識文字Str#21「総」,Str#22「売」およびStr#23「上」の画像データ(認識文字データ)を取得する。すなわち,レシートデータ抽出部141は,レシート項目名称として,文字列Str#20「総売上」を抽出する。   The receipt data extraction unit 141 refers to the recognized character table 1011 on the work memory for the character string Str # 20 “total sales” sent from the image data reading unit 11. The receipt data extraction unit 141 acquires the image data (recognized character data) of the recognized characters Str # 21 “Total”, Str # 22 “Sell”, and Str # 23 “Up” searched on the recognized character table 1011. That is, the receipt data extraction unit 141 extracts the character string Str # 20 “total sales” as the receipt item name.

傾き検出部142は,レシートデータ抽出部141により取得された認識文字データを用いて,以下のように,認識文字の傾きを求める。   The inclination detection unit 142 uses the recognized character data acquired by the receipt data extraction unit 141 to determine the inclination of the recognized character as follows.

例えば,レシートデータ抽出部141により取得された画像データは,図6の例に示すようなStr#21「総」の座標位置(x1,y1)−(x’1,y’1),Str#22「売」の座標位置(x2,y2)−(x’2,y’2),Str#23「上」の座標位置(x3,y3)−(x’3,y’3)等である。なお,座標位置(x1,y1)−(x’1,y’1)等は,長方形枠の左上および右下の座標を示すものとする。また,図11(B)に示す座標(図示では黒丸)Pt1=(x’1,y’1),座標Pt2=(x’2,y’2),座標Pt3=(x’3,y’3)として説明する。   For example, the image data acquired by the receipt data extraction unit 141 is the coordinate position (x1, y1) − (x′1, y′1), Str # of Str # 21 “total” as shown in the example of FIG. 22 “Sell” coordinate position (x2, y2) − (x′2, y′2), Str # 23 “Up” coordinate position (x3, y3) − (x′3, y′3), etc. . The coordinate position (x1, y1) − (x′1, y′1) and the like indicate the upper left and lower right coordinates of the rectangular frame. Also, coordinates (black circles in the figure) Pt1 = (x′1, y′1), coordinates Pt2 = (x′2, y′2), coordinates Pt3 = (x′3, y ′) shown in FIG. This will be described as 3).

傾き検出部142は,図11(B)に示すx座標間距離k1およびy座標間距離k2について,座標Pt1〜Pt3を用いることにより,以下に示すように,傾きの角度αを算出する。k1,k2,tan(α)を求めると,
k1= x’3−x’1
k2=y’3−y’1
tan(α)=k2/k1
α=arctan(k2/k1)
となる。
The inclination detection unit 142 calculates the inclination angle α as shown below by using the coordinates Pt1 to Pt3 for the x-coordinate distance k1 and the y-coordinate distance k2 shown in FIG. When k1, k2, and tan (α) are obtained,
k1 = x'3-x'1
k2 = y'3-y'1
tan (α) = k2 / k1
α = arctan (k2 / k1)
It becomes.

次に,傾き補正部143は,算出された傾きから認識文字の傾きを補正する必要があるかを判断する(ステップS25)。傾きを補正する必要がない場合(ステップS25:No),ステップS27に処理が進む。一方,傾きを補正する必要がある場合(ステップS25:Yes),傾き補正部143は,傾き補正処理を実行する(ステップS26)。   Next, the inclination correction unit 143 determines whether it is necessary to correct the inclination of the recognized character from the calculated inclination (step S25). If it is not necessary to correct the inclination (step S25: No), the process proceeds to step S27. On the other hand, when it is necessary to correct the inclination (step S25: Yes), the inclination correction unit 143 executes an inclination correction process (step S26).

具体的に説明すると,傾き補正部143は,算出された傾きの角度αを予め定めた許容角度と比較して,許容角度より小さい場合に,図11(B)に示す金額項目Dat#30に対して,Y座標を補正する必要がないと判断する。一方,算出された傾きの角度αが許容角度以上の場合に,傾き補正部143は,図11(B)に示す金額項目Dat#30に対して,Y座標を補正する必要があると判断する。なお,図11(B)の例では,算出された傾きの角度αが許容角度以上の場合である。   More specifically, the inclination correction unit 143 compares the calculated inclination angle α with a predetermined allowable angle, and when the inclination angle α is smaller than the allowable angle, the inclination correction unit 143 sets the amount item Dat # 30 shown in FIG. On the other hand, it is determined that there is no need to correct the Y coordinate. On the other hand, when the calculated inclination angle α is equal to or larger than the allowable angle, the inclination correction unit 143 determines that the Y coordinate needs to be corrected for the monetary item Dat # 30 shown in FIG. . In the example of FIG. 11B, the calculated inclination angle α is greater than or equal to the allowable angle.

図12は,特定されたレシートデータの一例を示す図である。特に,図12では,レシート22内の異なる行の文字列を例として,比較して説明する。   FIG. 12 is a diagram illustrating an example of the specified receipt data. In particular, in FIG. 12, a character string on a different line in the receipt 22 will be described as an example for comparison.

(1)傾き検出を行わなかった場合
レシートデータ抽出部141は,OCR処理の結果および定義データテーブル1021を用いて,レシート項目名称の文字列Str#10「現金在高」に対応する金額項目が,Dat#10の「¥335,275」であると認識する。また,レシート項目名称の文字列Str#20「総売上」に対応する金額項目が,Dat#30の「¥623,603」であると認識する。これは正しい結果ではない。これを傾きの検出を行うことにより,次のように正しい金額項目を抽出し,解決する。
(2)傾き検出を行った場合
図12に示す文字列Str#10「現金在高」について,傾き検出部142が傾きの角度α1を検出する。傾き補正部143は,傾きの角度α1を予め定めた許容角度と比較して,許容角度より小さいと判断し,補正処理を行わない。
(1) When the inclination detection is not performed The receipt data extraction unit 141 uses the result of the OCR process and the definition data table 1021 to calculate the amount item corresponding to the character string Str # 10 “cash balance” of the receipt item name. , Dat # 10 is recognized as “¥ 335,275”. Further, it is recognized that the amount item corresponding to the character string Str # 20 “total sales” of the receipt item name is “¥ 623,603” of Dat # 30. This is not the correct result. By detecting this, the correct amount item is extracted and resolved as follows.
(2) When inclination detection is performed For the character string Str # 10 “cash balance” shown in FIG. 12, the inclination detection unit 142 detects an inclination angle α1. The inclination correction unit 143 compares the inclination angle α1 with a predetermined allowable angle, determines that it is smaller than the allowable angle, and does not perform the correction process.

図12に示す文字列Str#20「総売上」について,傾き検出部142が傾きの角度α2を検出する。傾き補正部143は,傾きの角度α2を予め定めた許容角度と比較して,許容角度以上と判断し,補正処理を行う。   For the character string Str # 20 “total sales” shown in FIG. 12, the inclination detector 142 detects the inclination angle α2. The inclination correction unit 143 compares the inclination angle α2 with a predetermined allowable angle, determines that the angle is equal to or larger than the allowable angle, and performs correction processing.

図10は,ステップS26における傾き補正処理の詳細な処理フローチャートである。以下,図10に従って,レシートデータ処理部14が実行する傾き補正処理について具体的に説明する。   FIG. 10 is a detailed process flowchart of the inclination correction process in step S26. Hereinafter, the inclination correction process executed by the receipt data processing unit 14 will be described in detail with reference to FIG.

レシートデータ抽出部141は,定義データの中からレシート項目名称に対応する金額項目の位置情報(金額欄の位置)を取得する(ステップS261)。   The receipt data extraction unit 141 acquires the position information (position of the amount column) of the amount item corresponding to the receipt item name from the definition data (step S261).

具体的に説明するために,図11(A)に,レシートデータの抽出対象となるレシート22dを示す。図11(A)において,レシート22dには,レシート項目名称として認識される文字列Str#10〜#30と,その各々に対応する金額項目(金額の文字列)Dat#10〜#30とがある。例えば,レシート項目名称として認識される文字列Str#10「現金在高」,Str#20「総売上」およびStr#30「純売上」とし,その各々に対応する金額項目Dat#10「¥335,275」,Dat#20「¥654,735」およびDat#30「¥623,603」とする。   For specific description, FIG. 11A shows a receipt 22d from which receipt data is extracted. In FIG. 11A, the receipt 22d includes character strings Str # 10 to # 30 recognized as receipt item names, and monetary items (monetary character strings) Dat # 10 to # 30 corresponding thereto. is there. For example, the character strings Str # 10 “cash balance”, Str # 20 “total sales”, and Str # 30 “net sales” recognized as receipt item names are used, and the corresponding monetary item Dat # 10 “¥ 335”. , 275 ”, Dat # 20“ ¥ 654,735 ”and Dat # 30“ ¥ 623,603 ”.

レシートデータ抽出部141は,レシート22dに対応する店舗コードの定義データテーブル1021(例えば図8)を用いて,「読取文字#10」からレシート項目名称の文字列Str#10を取得し,「金額欄の読取位置#10」から対応する金額項目Dat#10の位置情報(金額欄の位置)を取得する。また,同様に,文字列Str#20およびStr#30についても,同様に金額項目Dat#20およびDat#30の位置情報が取得される。   The receipt data extraction unit 141 uses the store code definition data table 1021 (for example, FIG. 8) corresponding to the receipt 22d to acquire the receipt item name character string Str # 10 from “reading character # 10”. The position information of the corresponding monetary item Dat # 10 (the position of the monetary column) is acquired from the column reading position # 10. Similarly, the position information of the monetary items Dat # 20 and Dat # 30 is also acquired for the character strings Str # 20 and Str # 30.

次に,傾き補正部143は,検出された傾きの角度から金額欄の位置のY座標の補正量を算出する(ステップS262)。続いて,傾き補正部143は,算出された補正量から金額欄の位置のY座標を補正する(ステップS263)。   Next, the inclination correction unit 143 calculates the correction amount of the Y coordinate at the position of the money amount column from the detected inclination angle (step S262). Subsequently, the inclination correction unit 143 corrects the Y coordinate of the position of the money amount column from the calculated correction amount (step S263).

具体的には,傾き補正部143は,金額項目Dat#30に対して,以下に説明するように,金額欄の位置のY座標を補正する。   Specifically, the inclination correction unit 143 corrects the Y coordinate of the position of the money amount column as described below for the money amount item Dat # 30.

補正前の金額欄の位置は,図11(B)の実線長方形枠に示すように,「金額欄の読取位置#20」から取得した位置情報(x21,y21)−(x’21,y’21)にある。傾き補正部143は,検出された傾きの角度αを用いて,取得した位置情報におけるy座標の補正量Δyを算出する。ここで,
Δy=x21・tan(α)
とされる。なお,上記に示す傾き角度および補正量の算出法は一例であり,その他の算出方法であっても良い。例えば,
Δy={(x21+x’21)/2}・tan(α)
というように,金額欄の読取位置#20における左端と右端のx座標の平均値を用いて計算してもよい。
The position of the amount column before correction is the position information (x21, y21) − (x′21, y ′) acquired from “amount column reading position # 20” as indicated by the solid-line rectangular frame in FIG. 21). The inclination correction unit 143 calculates the correction amount Δy of the y coordinate in the acquired position information using the detected inclination angle α. here,
Δy = x21 · tan (α)
It is said. Note that the calculation method of the tilt angle and the correction amount described above is an example, and other calculation methods may be used. For example,
Δy = {(x21 + x′21) / 2} · tan (α)
In this way, the calculation may be performed using the average value of the left and right x coordinates at the reading position # 20 in the amount column.

これにより,図11(B)の破線長方形枠に示すように,傾き補正部143は,補正後の金額欄の位置を(x21,y21+Δy)−(x’21,y’21+Δy)と補正する。図11(B)の破線長方形枠内に金額項目Dat#20「¥654,735」があることより,傾き補正部143は,文字列Str#20に対応する金額項目はDat#20であると判断する。   As a result, as shown in the broken-line rectangular frame in FIG. 11B, the inclination correction unit 143 corrects the position of the corrected money amount column to (x21, y21 + Δy) − (x′21, y′21 + Δy). Since there is a money amount item Dat # 20 “¥ 654,735” in the broken-line rectangular frame in FIG. 11B, the inclination correction unit 143 determines that the money amount item corresponding to the character string Str # 20 is Dat # 20. to decide.

以上説明した補正処理後,ステップS26(S261〜S263)を終了する。ここで,図9の処理フローチャートのステップS27に戻り,図9に従って,説明する。   Step S26 (S261-S263) is complete | finished after the correction process demonstrated above. Here, it returns to step S27 of the process flowchart of FIG. 9, and demonstrates according to FIG.

次に,レシートデータ特定部144は,定義データに設定されている金額の位置情報または補正された金額の位置情報を用いて,金額項目を取得する(ステップS27)。   Next, the receipt data specifying unit 144 acquires the amount item using the position information of the amount set in the definition data or the position information of the corrected amount (step S27).

具体的には,レシートデータ特定部144は,補正された位置情報の座標または補正されずにそのままとされた金額の位置情報の座標に近い,定義データの「読取項目#n」の座標の文字列を取得する。   Specifically, the receipt data specifying unit 144 reads the character of the coordinates of the “read item #n” of the definition data that is close to the coordinates of the corrected position information or the position information of the amount of money left uncorrected. Get the column.

例えば,図12に示す文字列Str#10「現金在高」の金額項目については,傾き補正部143は,傾きの角度α1が許容角度より小さいため,傾き補正処理を実行しない。これにより,レシートデータ特定部144は,文字列Str#10「現金在高」に対応する金額項目Dat#10「¥335,275」と認識する。すなわち,レシート項目名称「現金在高」および金額項目「¥335,275」とされるレシートデータが特定される。   For example, for the monetary item of the character string Str # 10 “cash balance” shown in FIG. 12, the inclination correction unit 143 does not execute the inclination correction process because the inclination angle α1 is smaller than the allowable angle. As a result, the receipt data specifying unit 144 recognizes the monetary item Dat # 10 “¥ 335,275” corresponding to the character string Str # 10 “cash balance”. That is, the receipt data having the receipt item name “cash balance” and the amount item “¥ 335,275” is specified.

一方,図12において,文字列Str#20「総売上」の金額項目については,傾き検出部142により検出した傾きの角度α2が許容角度以上のため,傾き補正部143は,傾き補正処理を実行する。傾き補正処理を実行後,傾き補正部143は,文字列Str#20「総売上」の金額項目について,方向L#21の距離Dis#21にある金額項目Dat#20「¥654,735」とする。これにより,レシートデータ特定部144は,文字列Str#20「総売上」に対応する金額項目Dat#20「¥654,735」と認識する。すなわち,レシート項目名称「総売上」および金額項目「654,735」とされるレシートデータが特定される。   On the other hand, in FIG. 12, for the amount item of the character string Str # 20 “total sales”, since the inclination angle α2 detected by the inclination detection unit 142 is equal to or larger than the allowable angle, the inclination correction unit 143 executes the inclination correction processing. To do. After executing the inclination correction process, the inclination correction unit 143 sets the amount item Dat # 20 “¥ 654,735” at the distance Dis # 21 in the direction L # 21 for the amount item of the character string Str # 20 “total sales”. To do. Accordingly, the receipt data specifying unit 144 recognizes the monetary item Dat # 20 “¥ 654,735” corresponding to the character string Str # 20 “total sales”. That is, the receipt data having the receipt item name “total sales” and the amount item “654,735” is specified.

次に,レシート項目の最終行の処理が終了したかを判断する(ステップS28)。レシート項目の最終行の処理が終了していない場合(ステップS28:No),ステップS21に処理を戻し,次のレシート項目の行からのステップS21〜S27の処理を繰り返す。一方,レシート項目の最終行の処理が終了した場合(ステップS28:Yes),本処理を終了する。   Next, it is determined whether the processing of the last line of the receipt item is completed (step S28). When the process of the last line of the receipt item is not completed (step S28: No), the process returns to step S21, and the processes of steps S21 to S27 from the line of the next receipt item are repeated. On the other hand, when the process on the last line of the receipt item is completed (step S28: Yes), this process is terminated.

以上の補正処理により,図11(A)に示すように,レシートデータ特定部144は,例えばレシート項目名称Str#20「総売上」に対応する金額項目Dat#20「¥654,735」を特定することができる。   11A, the receipt data specifying unit 144 specifies the amount item Dat # 20 “¥ 654,735” corresponding to the receipt item name Str # 20 “total sales”, for example. can do.

以上のように,レシートデータ処理部14は,定義データを用いて,レシート画像から読み取ったレシート項目の認識文字に対して,各々について傾きを検出し,検出した傾きに応じて補正処理を実行し,必要なレシートデータを抽出することができる。   As described above, the receipt data processing unit 14 detects the inclination of each recognized character of the receipt item read from the receipt image using the definition data, and executes the correction process according to the detected inclination. , Necessary receipt data can be extracted.

また,レシートデータ処理部14は,売上管理データに必要なレシートデータを抽出することができ,抽出したレシートデータのレシート項目名称および金額を,予め定めた対応関係で売上管理項目の売上管理データに変換(集計)することができる。   The receipt data processing unit 14 can extract the receipt data necessary for the sales management data, and the receipt item name and the amount of the extracted receipt data are converted into the sales management data of the sales management item in a predetermined correspondence relationship. Can be converted (aggregated).

以上説明したレシートデータ認識処理によって,レシート行の各々の認識文字に対して,傾きの検出とその傾きの補正とを行うことができるため,レシート用紙が途中で折れ曲がっている場合や,印刷ずれ等の影響を排除して,レシート項目名称および対応する金額項目を正確に抽出することができる。これにより,売上管理データを正確に集計することができる。   With the receipt data recognition process described above, it is possible to detect the inclination and correct the inclination of each recognized character in the receipt line, so that the receipt paper is bent halfway, printing misalignment, etc. Thus, the receipt item name and the corresponding monetary item can be accurately extracted. Thereby, sales management data can be correctly totaled.

図13は,ステップS15における売上管理データ生成処理の詳細な処理フローチャートを示す。図13に従って,売上管理データ生成部15が実行する売上管理データ生成処理について具体的に説明する。   FIG. 13 shows a detailed process flowchart of the sales management data generation process in step S15. The sales management data generation process executed by the sales management data generation unit 15 will be specifically described with reference to FIG.

売上管理データ生成部15は,レシートデータ特定部144から売上集計に必要となるレシートデータを取得する(ステップS31)。   The sales management data generation unit 15 acquires receipt data necessary for sales aggregation from the receipt data specifying unit 144 (step S31).

具体的には,売上管理データ生成部15は,店舗コードと,認識文字データから特定したレシート項目名称およびその金額を含むデータと,図3に示す対応関係情報1022とを含むレシートデータを,レシートデータ特定部144から取得する。   Specifically, the sales management data generating unit 15 receives receipt data including a store code, data including a receipt item name and its amount specified from the recognized character data, and correspondence information 1022 shown in FIG. Obtained from the data identification unit 144.

次に,売上管理データ生成部15は,対応関係情報1022を用いて,売上管理項目の売上管理データとして集計する(ステップS32)。   Next, the sales management data generation unit 15 aggregates the sales management data as sales management data using the correspondence relationship information 1022 (step S32).

具体的には,売上管理データ生成部15は,対応関係情報1022から売上管理項目とレシート項目の対応関係に基づいて,レシート項目名称に対応する金額を,売上管理項目の売上管理データとして集計する。以上により,レシート項目の金額(数値データ)が,売上管理項目の数値データに変換される。   Specifically, the sales management data generation unit 15 aggregates the amount corresponding to the receipt item name as sales management data of the sales management item based on the correspondence relationship between the sales management item and the receipt item from the correspondence relationship information 1022. . As described above, the amount (numerical data) of the receipt item is converted into the numerical data of the sales management item.

次に,売上管理データ生成部15は,保存対象となる店舗コードの売上管理データを,売上管理データ記憶部103の売上管理DB1031に保存する(ステップS33)。   Next, the sales management data generation unit 15 stores the sales management data of the store code to be stored in the sales management DB 1031 of the sales management data storage unit 103 (step S33).

例えば,図14に,売上管理DB(データベース)1031の例を示す。売上管理DB1031には,図14に示すように,店舗コードごとに,「売上日付」,売上管理項目No.1「現金売上」,No.2「掛売上」,No.3「クレジット売上」,…などの売上に関する精算項目に対応する数値(金額)が格納される。   For example, FIG. 14 shows an example of a sales management DB (database) 1031. In the sales management DB 1031, as shown in FIG. 14, “sales date”, sales management item No. 1 “Cash Sales”, No. 1 2 “Multiple sales”, No. 2 3 A numerical value (amount) corresponding to a settlement item relating to sales such as “credit sales”,... Is stored.

以上により,売上管理DB1031には,店舗ごとにまったく異なるフォーマット(シート形式)であったレシート22のレシート項目が一元化され,各テナントの店舗により出力されたレシートで統一の取れないレシート項目,名称,数値などが,統一性のとれた売上管理項目による売上管理データとして,手入力による作業なしに自動的に収集できるようになる。これにより,テナント管理部門の業務担当者は,自動的に店舗ごとの売上を集計することができるため,店舗の売上管理業務を効率よく,スピーディに行うことができる。   As described above, in the sales management DB 1031, the receipt items of the receipt 22, which have a completely different format (sheet format) for each store, are unified, and the receipt item, name, Numerical values can be automatically collected without any manual input as sales management data based on unified sales management items. As a result, the person in charge of the tenant management department can automatically count the sales for each store, so that the store sales management business can be performed efficiently and speedily.

また,各店舗に備えられたキャッシュレジスタなどのレシート出力装置を変更する必要がないため,テナント側にとっては余計な出費を抑えることができる。   In addition, since there is no need to change a receipt output device such as a cash register provided in each store, an extra expense can be suppressed for the tenant.

以上のレシートデータ認識装置が行う処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。   The processing performed by the above receipt data recognition apparatus can be realized by a computer and a software program, and the program can be recorded on a computer-readable recording medium or provided through a network.

1 レシートデータ認識装置
10 読取機
11 画像データ読込部
12 店舗特定部
13 定義データ読込部
14 レシートデータ処理部
15 売上管理データ生成部
20 レシート挟持用シート
101 画像データ記憶部
102 定義データ記憶部
103 売上管理データ記憶部
141 レシートデータ抽出部
142 傾き検出部
143 傾き補正部
144 レシートデータ特定部
DESCRIPTION OF SYMBOLS 1 Receipt data recognition apparatus 10 Reader 11 Image data reading part 12 Store identification part 13 Definition data reading part 14 Receipt data processing part 15 Sales management data generation part 20 Receipt clamping sheet 101 Image data storage part 102 Definition data storage part 103 Sales Management data storage unit 141 Receipt data extraction unit 142 Inclination detection unit 143 Inclination correction unit 144 Receipt data identification unit

Claims (6)

レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶部と,
レシートに印字される項目名称の文字列と,前記項目名称のレシート内位置からの,その項目名称に対応する金額項目の相対位置データとを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶部と,
前記画像データ記憶部に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出部と,
抽出された認識文字の位置データから,認識文字の傾きを検出する傾き検出部と,
認識文字の傾きが検出された場合に,前記定義データにおける該当する金額項目の相対位置データを,検出された傾きに応じて補正する傾き補正部と,
補正された相対位置データを用いて,前記画像データ記憶部に記憶された認識文字とその位置データから前記金額項目を表す認識文字を抽出するレシートデータ特定部と,
前記項目名称に一致する認識文字と前記金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成部とを備える
ことを特徴するレシートデータ認識装置。
An image data storage unit for storing a recognized character obtained by character recognition of the receipt image and its position data;
The character string of the item name printed on the receipt and the relative position data of the amount item corresponding to the item name from the position in the receipt of the item name are defined for each item name to be read in the receipt. A definition data storage unit for storing definition data;
A receipt data extracting unit that extracts a recognized character that matches the character string of the item name defined in the definition data from the recognized character stored in the image data storage unit;
An inclination detection unit for detecting the inclination of the recognized character from the extracted position data of the recognized character;
An inclination correction unit that corrects relative position data of the corresponding monetary item in the definition data according to the detected inclination when the inclination of the recognized character is detected;
Using the corrected relative position data, a recognized character stored in the image data storage unit and a receipt data specifying unit for extracting a recognized character representing the amount item from the position data;
A receipt data recognition device comprising: a data generation unit that generates recognition result data from a recognition character that matches the item name and a recognition character that represents the amount item, and outputs or stores the data of the recognition result .
請求項1記載のレシートデータ認識装置において,
前記レシートは,店舗ごとに異なるフォーマットで印刷されたレシートであり,
前記定義データ記憶部には,店舗ごとに前記定義データが記憶され,
レシートを発行した店舗ごとに異なる定義データを用いて,前記レシートデータ抽出部と,前記傾き検出部と,前記傾き補正部と,前記レシートデータ特定部と,前記データ生成部による処理を実行する
ことを特徴とするレシートデータ認識装置。
The receipt data recognition apparatus according to claim 1,
The receipt is a receipt printed in a different format for each store,
The definition data storage unit stores the definition data for each store,
Executing processing by the receipt data extracting unit, the tilt detecting unit, the tilt correcting unit, the receipt data specifying unit, and the data generating unit using different definition data for each store that issued the receipt. Receipt data recognition device characterized by this.
請求項2記載のレシートデータ認識装置において,
前記定義データ記憶部に記憶される定義データは,前記レシートに印字される項目名称の文字列に対応して,複数の店舗の売上管理に共通に用いられる売上管理項目名称のデータを含み,
前記データ生成部は,前記項目名称に一致する認識文字を,前記定義データに定義された対応する売上管理項目名称に変換した認識結果のデータを生成する
ことを特徴とするレシートデータ認識装置。
In the receipt data recognition device according to claim 2,
The definition data stored in the definition data storage unit includes sales management item name data commonly used for sales management of a plurality of stores, corresponding to the character string of the item name printed on the receipt,
The receipt data recognition apparatus, wherein the data generation unit generates recognition result data obtained by converting a recognition character matching the item name into a corresponding sales management item name defined in the definition data.
コンピュータを,
レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶手段と,
レシートに印字される項目名称の文字列と,前記項目名称のレシート内位置からの,その項目名称に対応する金額項目の相対位置データとを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶手段と,
前記画像データ記憶手段に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出手段と,
抽出された認識文字の位置データから,認識文字の傾きを検出する傾き検出手段と,
認識文字の傾きが検出された場合に,前記定義データにおける該当する金額項目の相対位置データを,検出された傾きに応じて補正する傾き補正手段と,
補正された相対位置データを用いて,前記画像データ記憶手段に記憶された認識文字とその位置データから前記金額項目を表す認識文字を抽出するレシートデータ特定手段と,
前記項目名称に一致する認識文字と前記金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成手段として
機能させるためのレシートデータ認識プログラム。
Computer
Image data storage means for storing a recognized character obtained by character recognition of a receipt image and its position data;
The character string of the item name printed on the receipt and the relative position data of the amount item corresponding to the item name from the position in the receipt of the item name are defined for each item name to be read in the receipt. Definition data storage means for storing definition data;
Receipt data extracting means for extracting a recognized character that matches the character string of the item name defined in the definition data from the recognized character stored in the image data storage means;
Inclination detecting means for detecting the inclination of the recognized character from the extracted position data of the recognized character;
Inclination detecting means for correcting the relative position data of the corresponding monetary item in the definition data according to the detected inclination when the inclination of the recognized character is detected;
Using the corrected relative position data, a recognized character stored in the image data storage means and a receipt data specifying means for extracting a recognized character representing the amount item from the position data;
A receipt data recognition program for generating recognition result data from a recognition character matching the item name and a recognition character representing the monetary item, and functioning as data generation means for outputting or storing the recognition result data.
請求項4記載のレシートデータ認識プログラムにおいて,
前記レシートは,店舗ごとに異なるフォーマットで印刷されたレシートであり,
前記定義データ記憶手段には,店舗ごとに前記定義データが記憶され,
前記コンピュータに,
レシートを発行した店舗ごとに異なる定義データを用いて,前記レシートデータ抽出手段と,前記傾き検出手段と,前記傾き補正手段と,前記レシートデータ特定手段と,前記データ生成手段による処理を実行させる
ことを特徴とするレシートデータ認識プログラム。
In the receipt data recognition program according to claim 4,
The receipt is a receipt printed in a different format for each store,
The definition data storage means stores the definition data for each store,
In the computer,
Using the definition data different for each store that issued the receipt, and executing the processing by the receipt data extracting means, the inclination detecting means, the inclination correcting means, the receipt data specifying means, and the data generating means. Receipt data recognition program characterized by
請求項5記載のレシートデータ認識プログラムにおいて,
前記定義データ記憶手段に記憶される定義データは,前記レシートに印字される項目名称の文字列に対応して,複数の店舗の売上管理に共通に用いられる売上管理項目名称のデータを含み,
前記データ生成手段は,前記項目名称に一致する認識文字を,前記定義データに定義された対応する売上管理項目名称に変換した認識結果のデータを生成する
ことを特徴とするレシートデータ認識プログラム。
In the receipt data recognition program according to claim 5,
The definition data stored in the definition data storage means includes data of sales management item names commonly used for sales management of a plurality of stores, corresponding to the character strings of the item names printed on the receipts,
The receipt data recognition program characterized in that the data generation means generates recognition result data obtained by converting a recognition character matching the item name into a corresponding sales management item name defined in the definition data.
JP2011085854A 2011-04-08 2011-04-08 Receipt data recognition device and program thereof Active JP5202677B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011085854A JP5202677B2 (en) 2011-04-08 2011-04-08 Receipt data recognition device and program thereof
CN201110292107.4A CN102737239B (en) 2011-04-08 2011-09-29 Receipt data recognition device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011085854A JP5202677B2 (en) 2011-04-08 2011-04-08 Receipt data recognition device and program thereof

Publications (3)

Publication Number Publication Date
JP2012221183A true JP2012221183A (en) 2012-11-12
JP2012221183A5 JP2012221183A5 (en) 2013-02-21
JP5202677B2 JP5202677B2 (en) 2013-06-05

Family

ID=46992708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011085854A Active JP5202677B2 (en) 2011-04-08 2011-04-08 Receipt data recognition device and program thereof

Country Status (2)

Country Link
JP (1) JP5202677B2 (en)
CN (1) CN102737239B (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206942A (en) * 2013-04-16 2014-10-30 株式会社富士通マーケティング Shop-by-shop sales data management system and shop-by-shop sales data management program
CN105139009A (en) * 2015-07-10 2015-12-09 安徽清新互联信息科技有限公司 Credit card number identification method based on edge characteristics
JP2016110225A (en) * 2014-12-02 2016-06-20 東芝テック株式会社 Information processing device and program
JP2018018303A (en) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 Information extraction device and image forming apparatus having the same
JP2019215882A (en) * 2019-07-17 2019-12-19 東芝テック株式会社 Electronic receipt system and method for displaying electronic receipt in electronic receipt system
CN111444792A (en) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 Bill recognition method, electronic device, storage medium and device
JP2020184382A (en) * 2019-07-17 2020-11-12 東芝テック株式会社 Electronic receipt system and electronic receipt processing method in electronic receipt system

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807453A (en) * 2018-08-06 2020-02-18 研祥智能科技股份有限公司 OCR-based product character online detection method, device and system
CN110956739A (en) 2019-05-09 2020-04-03 杭州睿琪软件有限公司 Bill identification method and device
CN113435993A (en) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 Receipt data recognition system and method thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319824A (en) * 1996-05-30 1997-12-12 Hitachi Ltd Document recognizing method
JP2002109470A (en) * 2000-09-27 2002-04-12 Minolta Co Ltd Image recognition device, image recognition method, and computer readable recording medium stored with image recognition program
JP2005092635A (en) * 2003-09-18 2005-04-07 Ricoh Co Ltd Receipt information collection and processing system
JP2008234586A (en) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd Consumption information acquiring terminal, consumption information acquiring server and household account book management device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251012A (en) * 1999-03-01 2000-09-14 Hitachi Ltd Method and system for document processing
JP4052095B2 (en) * 2002-11-12 2008-02-27 セイコーエプソン株式会社 Receipt processing apparatus and method, and computer program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319824A (en) * 1996-05-30 1997-12-12 Hitachi Ltd Document recognizing method
JP2002109470A (en) * 2000-09-27 2002-04-12 Minolta Co Ltd Image recognition device, image recognition method, and computer readable recording medium stored with image recognition program
JP2005092635A (en) * 2003-09-18 2005-04-07 Ricoh Co Ltd Receipt information collection and processing system
JP2008234586A (en) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd Consumption information acquiring terminal, consumption information acquiring server and household account book management device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206942A (en) * 2013-04-16 2014-10-30 株式会社富士通マーケティング Shop-by-shop sales data management system and shop-by-shop sales data management program
JP2016110225A (en) * 2014-12-02 2016-06-20 東芝テック株式会社 Information processing device and program
CN105139009A (en) * 2015-07-10 2015-12-09 安徽清新互联信息科技有限公司 Credit card number identification method based on edge characteristics
JP2018018303A (en) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 Information extraction device and image forming apparatus having the same
US10452903B2 (en) 2016-07-28 2019-10-22 Kyocera Document Solutions Inc. Information extraction device, image forming apparatus including information extraction device and method of controlling information extraction device
JP2019215882A (en) * 2019-07-17 2019-12-19 東芝テック株式会社 Electronic receipt system and method for displaying electronic receipt in electronic receipt system
JP2020184382A (en) * 2019-07-17 2020-11-12 東芝テック株式会社 Electronic receipt system and electronic receipt processing method in electronic receipt system
CN111444792A (en) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 Bill recognition method, electronic device, storage medium and device
CN111444792B (en) * 2020-03-13 2023-05-09 安诚迈科(北京)信息技术有限公司 Bill identification method, electronic equipment, storage medium and device

Also Published As

Publication number Publication date
CN102737239B (en) 2015-01-07
JP5202677B2 (en) 2013-06-05
CN102737239A (en) 2012-10-17

Similar Documents

Publication Publication Date Title
JP5202677B2 (en) Receipt data recognition device and program thereof
JP5216890B2 (en) Receipt data recognition device and program thereof
US8879846B2 (en) Systems, methods and computer program products for processing financial documents
US9342741B2 (en) Systems, methods and computer program products for determining document validity
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
US6885769B2 (en) Business form handling method and system for carrying out the same
JP6100532B2 (en) Receipt definition data creation device and program thereof
JP6504514B1 (en) Document classification system and method and accounting system and method.
US9027833B2 (en) Commodity information display apparatus and method for displaying commodity information in different forms
US20170293820A1 (en) Image processing device
JP5810568B2 (en) Information processing apparatus, program, and data extraction method
US10509958B2 (en) Systems and methods for capturing critical fields from a mobile image of a credit card bill
JP6108927B2 (en) Sales data management system by store and sales data management program by store
JP2019091501A (en) Information detection apparatus and information detection program
JP5253462B2 (en) Receipt data collection device for each store and its program
CN112487859A (en) Information processing apparatus, information processing method, and computer readable medium
JP3491636B2 (en) Form processing method and system
TWM626292U (en) Business-oriented key item key-value identification system
JP4516376B2 (en) Form processing system
JP2012181620A (en) Pos system, pos device, read error detection method of bar code and program thereof
JP5654627B2 (en) Receipt data collection device for each store and its program
JP2001312694A (en) Method and device for recognizing many kinds of slips
JP2020126326A (en) Device, method, and program for identifying character string contained in business form
TWM593028U (en) Voucher scanning and automatic verification device
JP2000194775A (en) Method for generating client data and computer readable recording medium recording program for computer to execute the method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121227

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20121227

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20130128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130212

R150 Certificate of patent or registration of utility model

Ref document number: 5202677

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350