JP2014041442A - Receipt definition data preparation device and program - Google Patents

Receipt definition data preparation device and program Download PDF

Info

Publication number
JP2014041442A
JP2014041442A JP2012182806A JP2012182806A JP2014041442A JP 2014041442 A JP2014041442 A JP 2014041442A JP 2012182806 A JP2012182806 A JP 2012182806A JP 2012182806 A JP2012182806 A JP 2012182806A JP 2014041442 A JP2014041442 A JP 2014041442A
Authority
JP
Japan
Prior art keywords
item
receipt
character
information
definition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012182806A
Other languages
Japanese (ja)
Other versions
JP5702342B2 (en
Inventor
Kazunari Nozaki
一成 野崎
Yasuhiro Umemura
泰広 梅村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Marketing Ltd
Original Assignee
Fujitsu Marketing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Marketing Ltd filed Critical Fujitsu Marketing Ltd
Priority to JP2012182806A priority Critical patent/JP5702342B2/en
Publication of JP2014041442A publication Critical patent/JP2014041442A/en
Application granted granted Critical
Publication of JP5702342B2 publication Critical patent/JP5702342B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To enable an efficient preparation of definition data required upon collecting sales management data for managing sales of each tenant from various receipts by character recognition.SOLUTION: An image data analysis unit 12 determines a character string area recognized by a character from image data on a receipt as a character item and a money amount column, a relative position to the money amount column is calculated in association with the money amount column having a specific position relation with the character item, and reading information is prepared. A reading item calculation unit 13 extracts a character item coinciding with a name corresponding to a sales management item from the reading information as a reading item while referring to an item dictionary storage unit 103. A definition input screen display unit 14 displays a definition input screen including the sales management item, information on the character item extracted as the reading item of the sales management item and the image data on the receipt. An input data processing unit 15 receives input of a calculation expression of the reading item of the sales management item from the definition input screen. A definition data preparation unit 16 prepares, after input processing of the input data processing unit 15, receipt definition data from information on the definition input screen.

Description

本発明は,レシート定義データ作成装置およびプログラムに関し,特に,例えばショッピングモールなどの複数の店舗の売上を管理するために,文字認識により読み取ったレシートデータから必要なデータを正確に抽出するときに必要となる定義データの作成を支援する技術に関するものである。   The present invention relates to a receipt definition data creation apparatus and program, and in particular, necessary for accurately extracting necessary data from receipt data read by character recognition in order to manage sales at a plurality of stores such as a shopping mall. The present invention relates to a technology that supports the creation of definition data.

ショッピングセンター,ショッピングモール等に出店するテナント(店舗を運営する会社など)の店舗を管理するテナント管理部門では,各店舗の一日の売上を収集し,現金売上,クーポン売上,…といった売上内訳(売上管理項目)を作成している。この売上内訳作成の際には,各店舗から提供される精算レシートが集められて,売上管理項目の数値を算出することが行われる。しかし,各店舗から提供される精算レシートの形式は,店舗ごとに導入されているPOSシステムに依存するため,さまざまな形式で作成されているのが現状である。そのため,テナント管理部門が処理する精算レシートは,項目の種類,項目名,印字サイズ,印字字体などにおいて多種多様である。   The tenant management department that manages stores of tenants (such as companies that operate stores) that open stores in shopping centers, shopping malls, etc. collects daily sales for each store, and breakdowns of sales such as cash sales, coupon sales, etc. ( Sales management item). When creating the sales breakdown, payment receipts provided from each store are collected and the numerical value of the sales management item is calculated. However, since the format of the payment receipt provided from each store depends on the POS system installed in each store, it is currently created in various formats. Therefore, the payment receipt processed by the tenant management department has a wide variety of items, item names, print sizes, print fonts, and the like.

例えば,精算レシートの項目の名称について,売上合計,売上計,合計売上,総売上,…等は,同等の内容を示すものであっても,POSシステムによって異なる名称が印字されている。また,出店するテナントの店舗の入れ替えなどが頻繁に行われるため,新たな精算レシートの形式にも対応しなければならない。そのため,テナント管理部門では,精算レシートを統一された売上管理データとして集計する売上集計作業に莫大な労力を要し,そのための人的および時間的負担に多大なコストを要しているのが現状である。   For example, regarding the names of the items on the payment receipt, even though the total sales, total sales, total sales, total sales, etc. indicate the same contents, different names are printed depending on the POS system. In addition, since the tenant's store that opens a store is frequently replaced, a new payment receipt format must also be supported. For this reason, the tenant management department requires a great deal of labor for the sales totaling work for totaling the payment receipts as unified sales management data, and the human and time burden for that is very expensive. It is.

なお,特許文献1には,レシート処理装置が開示されている。このレシート処理装置では,レシートの画像から文字を認識してテキストデータを生成し,テキストデータから所定の文字列を選択し,選択された所定の文字列が含まれる行位置を検出する。そして,検出された行位置に基づいて定まるテキストデータ上の所定の行範囲から行を単位とするラインデータを順に選択し,ラインデータから品目に関わるデータを抽出する。   Note that Patent Document 1 discloses a receipt processing apparatus. In this receipt processing apparatus, text data is generated by recognizing characters from the receipt image, a predetermined character string is selected from the text data, and a line position including the selected predetermined character string is detected. Then, line data in units of lines is sequentially selected from a predetermined line range on the text data determined based on the detected line position, and data relating to the item is extracted from the line data.

また,特許文献2には,罫線がない不定型帳票を含む任意の帳票に対して,人手を介入することなく,自動的に帳票定義を作成する技術が開示されている。この技術では,レシートを画像として読み込み,印紙されている項目を表領域として切り出し,表領域ごとにx座標,y座標を算出し,x座標の度数分布表を作成する。それから位置揃えを判定して,商品欄,個数欄,価格欄を決定することにより,帳票定義を作成する。   Patent Document 2 discloses a technique for automatically creating a form definition for any form including an indefinite form without a ruled line without manual intervention. In this technique, a receipt is read as an image, a stamped item is cut out as a table area, x-coordinate and y-coordinate are calculated for each table area, and a frequency distribution table of x-coordinate is created. Then, the form definition is created by determining the alignment and determining the product field, the number field, and the price field.

特開2004−164218号公報JP 2004-164218 A 特開2006−178802号公報JP 2006-178802 A

前述したような,ショッピングセンター等の各店舗から提供される精算レシート(以下,レシートという)を集計するために,ショッピングセンター等を運営する会社(組織)のテナント管理部門では,従来,事務員が目視でレシートを読み取り,読み取ったデータを手作業でデータ処理装置に入力していた。この売上集計作業の作業量は,店舗数が100店舗以上に及ぶこともあり,しかも毎日行わなければならない作業であるため,非常に負担が大きいものであった。   In the tenant management department of a company (organization) that operates a shopping center or the like, the clerk has traditionally used to collect the payment receipts (hereinafter referred to as receipts) provided by each store such as a shopping center. The receipt was read visually, and the read data was manually input to the data processing device. The work amount of the sales totaling work is very heavy because the number of stores may reach 100 stores or more and must be performed every day.

この負担を軽減するための一案としては,各店舗の売上データ(レシートデータ)を,各店舗の端末からネットワークを介して自動収集することが考えられる。しかし,一般に各店舗は企業体が異なるため,個々にネットワーク開設の許諾を得る必要があり,さらに導入されているシステムによって接続するネットワークの種類やアプリケーションの追加・修正の難易度が異なるなど,解決が困難な問題が存在する。   As a proposal for reducing this burden, it is conceivable to automatically collect sales data (receipt data) of each store from a terminal of each store via a network. However, in general, each store has a different business entity, so it is necessary to obtain permission to open the network individually, and the type of network to be connected and the difficulty of adding / modifying applications differ depending on the installed system. There are difficult problems.

既存のシステムの変更,特に各店舗における端末などの情報機器の変更をできるだけ行わないで,前述した作業負担を軽減する他の案としては,レシートデータを人間が読み取るのではなく,文字画像の認識によって読み取る方法が考えられる。すなわち,各店舗のレシートを,例えばOCR(Optical Character Recognition )機能を有する読取装置,スキャナー等で読み取り,読み取ったレシート項目とその数値データについて売上管理項目に必要なものを抽出し,売上管理データに入力し直す方法である。   Another way to reduce the above-mentioned work load by changing the existing system, especially information devices such as terminals in each store as much as possible, is to recognize character images instead of reading receipt data by humans. The reading method can be considered. That is, the receipt of each store is read by, for example, a reader or scanner having an OCR (Optical Character Recognition) function, and the necessary receipt items and their numerical data are extracted as sales management items, and the sales management data is extracted. This is a method to re-enter.

このように,レシートの文字画像を認識して,売上管理データを自動で作成する場合,売上管理データとして必要な売上管理項目とレシートの読取項目とがどのように対応しているかの対応情報,また,レシートの読取項目の文字列(項目名称)およびその読取項目に対応する金額欄の画像上の位置情報を,レシート定義データとして事前に用意する必要がある。   In this way, when recognizing a character image of a receipt and automatically creating sales management data, correspondence information on how sales management items required as sales management data correspond to read items of receipts, In addition, it is necessary to prepare in advance the receipt definition data as the character string (item name) of the read item of the receipt and the position information on the image of the amount column corresponding to the read item.

このレシート定義データを一度作成して,レシート認識装置に登録すれば,OCR機能を有する読取装置等によりレシート画像を読み取り,その読み取ったレシート画像から売上管理データの作成に必要なレシート項目を抽出し,毎日の売上管理データをある程度自動で収集することができると考えられる。   Once this receipt definition data is created and registered in the receipt recognition device, the receipt image is read by a reading device or the like having an OCR function, and the receipt items necessary for creating sales management data are extracted from the read receipt image. , It is thought that daily sales management data can be collected to some extent automatically.

問題は,このレシート定義データをどのような方法により作成するかである。まず,人手により,レシート定義データを一つずつ入力することが考えられるが,大規模ショッピングモール等では,店舗数が100店舗以上にもなることがざらであり,レシート定義データを人手により入力するのは大変な作業量となる。さらに,ショッピングモール等では,出店する店舗の入れ替えが頻繁にあり,新しい店舗が加入する都度,新しいレシート定義データを人手により入力するのは,煩雑な作業となる。   The problem is how to create this receipt definition data. First, it is conceivable to manually input the receipt definition data one by one. However, in a large-scale shopping mall or the like, the number of stores may be more than 100, and the receipt definition data is manually input. This is a huge amount of work. Furthermore, in a shopping mall or the like, stores that are opened frequently are frequently replaced, and it is troublesome to manually input new receipt definition data every time a new store joins.

そこで,レシート定義データをできるだけ簡単に作成することができるコンピュータによる支援技術が望まれるが,特許文献2のレシート画像から自動的に帳票定義を作成する技術は,本発明が対象とするようなケースでは不十分であり,次の理由により用いることができない。   Therefore, a computer-aided technology capable of creating receipt definition data as easily as possible is desired. However, the technology for automatically creating a form definition from the receipt image of Patent Document 2 is a case that is covered by the present invention. Is insufficient and cannot be used for the following reasons.

(1)特許文献2では,テナント部門が必要とする各店舗の売上の管理に共通する特定の売上管理項目群からなる売上管理データがまったく考慮されていない。   (1) In Patent Document 2, sales management data including a specific group of sales management items common to sales management of each store required by the tenant department is not considered at all.

(2)また,特許文献2の技術では,個々のレシートごとの項目定義情報の作成は可能であるが,レシートに印字されている全ての項目を対象としており,必要な項目だけを選択することはできない。   (2) Also, with the technology of Patent Document 2, it is possible to create item definition information for each receipt, but all items printed on the receipt are targeted, and only the necessary items must be selected. I can't.

(3)また,特にテナント管理部門が必要とする売上管理項目は,各店舗のレシートに印字されたレシート項目の項目名称と一致するとは限らず,また,必ずしも売上管理項目とレシート項目とが,一対一に対応しているとは限らない。   (3) In addition, the sales management items particularly required by the tenant management department do not always match the item names of the receipt items printed on the receipts of each store, and the sales management items and the receipt items are not necessarily It does not necessarily correspond one-on-one.

図32は,売上管理項目とレシート項目との対応関係の例を示す図である。   FIG. 32 is a diagram illustrating an example of a correspondence relationship between sales management items and receipt items.

テナント管理部門が必要とする売上管理項目は,例えば図32(A)に示すように,「現金売上」,「掛売上」,「クレジット売上」,……,「純売上」というような,各店舗に共通の統一された項目である。図32(B)に示すレシートでは,第14行目の「現金売上金額」が,第1番目の売上管理項目「現金売上」に対応しており,第2番目の売上管理項目「掛売上」に対応するレシート項目はなく,第18行目の「その他金券金額」が,第3番目の売上管理項目「クレジット売上」に対応している。   The sales management items required by the tenant management department are, for example, “cash sales”, “payable sales”, “credit sales”,..., “Net sales” as shown in FIG. It is a unified item common to stores. In the receipt shown in FIG. 32B, the “cash sales amount” on the 14th line corresponds to the first sales management item “cash sales”, and the second sales management item “overtime sales”. There is no receipt item corresponding to, and the “other voucher amount” on the 18th line corresponds to the third sales management item “credit sales”.

一方,図示省略するが,他の店舗のレシートでは,例えばレシート項目「日報上現金有高」とレシート項目「感謝カード」の金額を加算したものが,第1番目の売上管理項目「現金売上」に対応しており,レシート項目「日報上掛売上」が,第2番目の売上管理項目「掛売上」に対応しており,…というように,各売上管理項目とレシート項目との対応関係が店舗ごとに全く異なる。   On the other hand, although not shown in the drawings, in the receipt of another store, for example, the sum of the receipt item “cash amount on daily report” and the receipt item “thank you card” is the first sales management item “cash sales”. The receipt item “Daily Overtime Sales” corresponds to the second sales management item “Overhead Sales”, and so on, the correspondence between each sales management item and the receipt item is Every store is completely different.

本発明は,このような背景において,売上管理データをレシートの認識により収集するためのレシート定義データを簡易に作成するための手段を提供することを目的とする。すなわち,本発明は,ショッピングモール等の複数の店舗から出力される形式の異なるレシートを読み込み,必要な売上管理項目だけを正確かつ効率的に取得するためのレシート定義データを簡易に効率よく作成する手段を提供することを目的としている。   In view of such a background, an object of the present invention is to provide means for easily creating receipt definition data for collecting sales management data by recognition of a receipt. That is, the present invention reads receipts of different formats output from a plurality of stores such as shopping malls, and easily and efficiently creates receipt definition data for acquiring only necessary sales management items accurately and efficiently. It aims to provide a means.

本発明の一態様として開示するレシート定義データ作成装置は,以下のとおりである。なお,以下ではレシートから収集する各店舗に共通な特定の基本管理項目として,売上管理項目を用いる場合を例に説明する。
(1)基本管理項目(精算項目ともいう)毎に,その項目にレシートのイメージデータ上で対応する読取項目(レシート項目ともいう)の名称を対応付けた項目辞書を用意しておく。
(2)売上管理データを収集するためのレシート定義データの作成対象となる店舗が発行したレシートを画像として読み込み,レシートのイメージデータを文字認識して得た文字列領域をもとに,金額を示す領域以外の文字項目の位置,一定の位置関係を持つ金額欄との対応関係,文字項目と対応する金額欄との位置関係を含む読取情報を作成する。さらに,レシート内で一意(ユニーク)であるかの情報を含む読取情報を作成してもよい。
(3)あらかじめ定められた必要な基本管理項目を画面上に表示し,画面操作によりレシート定義データを作成する。
The receipt definition data creation device disclosed as one aspect of the present invention is as follows. In the following, a case where a sales management item is used as a specific basic management item common to each store collected from a receipt will be described as an example.
(1) For each basic management item (also referred to as a checkout item), an item dictionary is prepared in which each item is associated with the name of a reading item (also referred to as a receipt item) corresponding to the image data of the receipt.
(2) Read the receipt issued by the store where the receipt definition data for collecting sales management data is issued as an image, and calculate the amount based on the character string area obtained by character recognition of the receipt image data. Read information including the position of the character item other than the area to be shown, the correspondence with the amount column having a certain positional relationship, and the positional relationship between the character item and the corresponding amount column is created. Further, read information including information indicating whether the receipt is unique (unique) may be created.
(3) Necessary basic management items determined in advance are displayed on the screen, and receipt definition data is created by screen operation.

このとき,読取情報を参照して,基本管理項目ごとに,レシートのイメージデータ上で対応する文字項目を基本管理項目の読取項目に設定して画面上に表示する。   At this time, with reference to the read information, for each basic management item, the corresponding character item on the receipt image data is set as the read item of the basic management item and displayed on the screen.

以上により作成されるレシート定義データは,以下の情報を含む。
・ 基本管理項目とレシート内の読取項目との対応情報。すなわち,基本管理項目として計上する金額は,レシート内のどの読取項目に対する金額であるかを示す情報。
・ レシート内の読取項目の文字列と,それに対応する金額欄の位置関係を示す情報。
・ 基本管理項目の金額が,複数の読取項目の金額の四則演算によって算出される場合には,その演算式を示す情報。
・ その他,レシート内に読取項目と同一名称(同じ文字列)の文字項目が複数ある場合に,基本管理項目に対応づける読取項目を特定するためのマーカー項目などの文字情報および読取文字との位置関係を示す情報。
The receipt definition data created as described above includes the following information.
-Correspondence information between basic management items and read items in receipts. That is, information indicating which reading item in the receipt the amount to be recorded as a basic management item.
-Information indicating the positional relationship between the character string of the read item in the receipt and the corresponding money amount column.
• Information indicating the calculation formula when the amount of the basic management item is calculated by the four arithmetic operations of the amounts of the reading items.
・ In addition, when there are multiple character items with the same name (same character string) as the reading item in the receipt, the position of the character information and the reading character such as the marker item for identifying the reading item associated with the basic management item Information indicating the relationship.

上記について,より詳しくは,開示するレシート定義データ作成装置は,複数の店舗それぞれが発行したレシートの画像から特定の基本管理項目からなる基本管理データを収集するレシート認識システムで実行される前記店舗ごとのレシートの画像認識処理に用いるレシート定義データを作成する処理装置であって,基本管理項目の情報を記憶する基本データ記憶手段と,前記基本管理項目に対応して前記レシートから読み込まれる項目の名称を示す項目辞書を記憶する項目辞書記憶手段と,レシートのイメージデータを記憶する画像データ記憶手段と,前記イメージデータに対して文字認識処理を行い,認識した文字列の前記イメージデータ上での位置情報を取得し,前記認識した文字列が金額を表示する金額欄であるか前記金額欄以外の文字項目であるかを判定し,前記文字項目と予め設定した位置関係を持つ金額欄とを対応付け,前記文字項目,前記対応付けた前記金額欄,および前記文字項目と前記対応付けた金額欄との位置関係を含む読取情報を作成する画像データ解析手段と,前記項目辞書を参照して,前記読取情報から前記基本管理項目に対応する項目の名称と一致する文字項目の情報を抽出する読取項目算出手段と,レシート定義データの情報として,前記基本管理項目の情報,前記基本管理項目について前記イメージデータから読み取る読取項目および前記イメージデータを表示する定義入力画面を生成し,前記読取情報から抽出した文字項目の情報を前記読取項目の情報に設定した前記定義入力画面を表示する定義入力画面表示手段とを備える。   More specifically, the disclosed receipt definition data creation device is configured to execute each store executed by a receipt recognition system that collects basic management data including specific basic management items from images of receipts issued by a plurality of stores. A processing device for generating receipt definition data used for image recognition processing of a receipt, and a basic data storage means for storing information on basic management items, and names of items read from the receipt corresponding to the basic management items An item dictionary storage means for storing an item dictionary indicating image data, an image data storage means for storing image data of a receipt, a character recognition process for the image data, and a position of the recognized character string on the image data Information is acquired, and the recognized character string is an amount field for displaying an amount or other than the amount field It is determined whether it is a character item, the character item is associated with an amount field having a preset positional relationship, the character item, the associated amount field, and the associated amount field An image data analyzing means for creating read information including a positional relationship with the image data, and reading for extracting information on a character item that matches the name of the item corresponding to the basic management item from the read information with reference to the item dictionary As the item calculation means and receipt definition data information, the basic management item information, a reading item to be read from the image data for the basic management item, and a definition input screen for displaying the image data are generated and extracted from the reading information. And a definition input screen display means for displaying the definition input screen in which the information of the read character item is set as the information of the read item.

開示するレシート定義データ作成装置によれば,レシートのイメージデータの文字認識結果から作成した読取情報から,基本管理項目に対応してレシートから読み取る文字項目を読取項目として表示するので,操作員は,表示された読取項目を確認しながら作業をすることができる。また,操作員は,レシートのイメージデータから読取項目となる文字項目を探す手間を省くことができる。
(4)レシート内での同一名称の文字項目の存在をチェックし,同一名称の複数の文字項目が存在する場合に,レシート内で一意の文字項目を,読取項目を特定するためのマーカー項目の候補として表示する。
According to the disclosed receipt definition data creation device, the character information read from the receipt corresponding to the basic management item is displayed as the read item from the read information created from the character recognition result of the image data of the receipt. It is possible to work while confirming the displayed reading items. In addition, the operator can save the trouble of searching for a character item as a reading item from the image data of the receipt.
(4) Check the existence of a character item with the same name in the receipt. If there are multiple character items with the same name, the unique character item in the receipt is used as the marker item for identifying the read item. Display as a candidate.

上記について,より詳しくは,前記レシート定義データ作成装置において,前記読取項目算出手段が,前記読取情報から前記基本管理項目に対応する項目の名称と一致する複数の文字項目の情報を抽出した場合に,前記読取情報から前記イメージデータにおいて一意の文字項目を抽出し,前記定義入力画面表示手段は,前記一意の文字項目の情報を,前記読取項目を特定するマーカー項目の候補項目の情報に設定した前記定義入力画面を表示する。   More specifically, in the receipt definition data creation device, when the reading item calculation means extracts information on a plurality of character items that match the names of items corresponding to the basic management items from the reading information. The unique character item in the image data is extracted from the read information, and the definition input screen display means sets the information on the unique character item as the information on the candidate item of the marker item that identifies the read item. The definition input screen is displayed.

これにより,操作員は,レシートからマーカー項目となる文字列を探す手間を省くことができる。   As a result, the operator can save the trouble of searching for a character string as a marker item from the receipt.

(5)画面上でのマウス等の入力装置によるポイント操作またはドラッグ操作等により,読取項目の情報が確認されると,読取情報から読取項目として抽出した文字項目の情報(読取項目となる文字項目,文字項目に対応する金額欄,文字項目と金額欄との位置関係)をもとにレシート定義データを作成する。さらに,マーカー項目が必要な場合に,マーカー項目の候補項目から選択された文字項目の情報をもとに,マーカー項目の情報(マーカー項目となった文字項目の位置,対象となる読取項目,マーカー項目と金額欄との位置関係)をレシート定義データに追加する。   (5) When reading item information is confirmed by a pointing operation or dragging operation using an input device such as a mouse on the screen, information on the character item extracted as the reading item from the reading information (character item to be the reading item) Receipt definition data is created based on the amount field corresponding to the character item and the positional relationship between the character item and the amount field. In addition, if a marker item is required, information on the marker item (position of the character item that became the marker item, target read item, marker, etc.) based on the information on the character item selected from the candidate items of the marker item (Positional relationship between item and amount column) is added to the receipt definition data.

より詳しくは,開示するレシート定義データ作成装置は,前記レシート定義データから前記基本管理項目の読取項目に設定されている文字項目を抽出し,前記抽出した文字項目の名称を前記項目辞書の前記基本管理項目に対応する項目の名称に登録する定義データ解析手段を備える。   More specifically, the disclosed receipt definition data creation device extracts a character item set as a reading item of the basic management item from the receipt definition data, and uses the name of the extracted character item as the basic item of the item dictionary. Definition data analysis means for registering the name of the item corresponding to the management item is provided.

作成されたレシート定義データから,売上管理項目に対応付けられた読取項目の名称を収集して読取情報の作成処理に用いる項目辞書の該当する売上管理項目に関する読取文字列に登録することができるので,項目辞書の作成,更新を自動化することができる。これにより,操作員は,項目辞書を作成する作業を省略することができる。   Since the name of the read item associated with the sales management item can be collected from the created receipt definition data, it can be registered in the read character string related to the corresponding sales management item in the item dictionary used for the read information creation processing. The creation and update of item dictionaries can be automated. As a result, the operator can omit the work of creating the item dictionary.

本発明の効果は以下のとおりである。
(1)レシートから基本管理項目に必要な読取項目を抽出する場合,どの基本管理項目にどの読取項目が対応するかを示すレシート定義データを,実際のレシートを用いて簡易に作成することができる。特に,基本管理項目に必要な読取項目が予め画面上に表示されるため,操作員は,レシートデータ上から読取項目を探す作業を省くことができ,作業経験が少ない操作員であっても,読取項目の設定を容易かつ効率良く行うことができる。
(2)レシートから基本管理項目に必要な読取項目について同一名称の文字項目が複数存在する場合に,読取項目を特定するための複数のキーワードとなる文字項目や読取項目の位置の基準となるマーカー項目などのマーカー定義の情報をレシート定義データに設定することができる。特に,マーカー項目の候補となる文字項目を画面上に表示することができるので,操作員は,レシートデータ上からマーカ項目となるユニークな文字項目を探す手間を省くことができ,作業経験が少ない操作員であっても,マーカー項目の設定を容易かつ効率良く行うことができる。
(3)作成されたレシート定義データをもとに項目辞書が自動生成されるため,操作員は,項目辞書を作成する作業を省くことができる。
The effects of the present invention are as follows.
(1) When reading items necessary for basic management items are extracted from receipts, receipt definition data indicating which basic management items correspond to which reading items can be easily created using actual receipts. . In particular, since the reading items necessary for basic management items are displayed on the screen in advance, the operator can omit the task of searching for the reading items from the receipt data. Reading items can be set easily and efficiently.
(2) When there are a plurality of character items with the same name for a reading item necessary for the basic management item from the receipt, a character item serving as a plurality of keywords for identifying the reading item and a marker serving as a reference for the position of the reading item Marker definition information such as items can be set in the receipt definition data. In particular, since character items that are candidates for marker items can be displayed on the screen, the operator can save time and effort to search for unique character items that become marker items from the receipt data, and there is little work experience. Even an operator can easily and efficiently set marker items.
(3) Since the item dictionary is automatically generated based on the created receipt definition data, the operator can omit the work of creating the item dictionary.

以上のように,本発明によって作成されたレシート定義データを用いることにより,レシートの読取項目が異なる各種店舗のレシートデータから,テナントの管理部門が必要とする基本的なデータを統一的に収集し,売上管理データベースなどの基本データ管理データベースに保存することができるようになる。   As described above, by using the receipt definition data created according to the present invention, basic data required by the tenant's management department is uniformly collected from receipt data of various stores with different receipt reading items. , It can be stored in a basic data management database such as a sales management database.

レシート定義データ作成装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of a receipt definition data creation apparatus. レシート定義データ作成装置の処理の概要を示すフローチャートである。It is a flowchart which shows the outline | summary of a process of a receipt definition data creation apparatus. 読取機によって読み取られるレシートの例を示す図である。It is a figure which shows the example of the receipt read by the reader. 画像データ記憶部に格納される画像データの例を示す図である。It is a figure which shows the example of the image data stored in an image data storage part. 読取情報記憶部に格納される読取情報の例を示す図である。It is a figure which shows the example of the reading information stored in a reading information storage part. 項目辞書記憶部に格納される項目辞書の例を示す図である。It is a figure which shows the example of the item dictionary stored in an item dictionary memory | storage part. 基本データ記憶部に格納される基本テーブルの例を示す図である。It is a figure which shows the example of the basic table stored in a basic data storage part. 店舗マスタの例を示す図である。It is a figure which shows the example of a store master. 通常のレシート定義データ例を示す図である。It is a figure which shows the example of normal receipt definition data. レシート内に同一名称の読取項目が複数存在する場合のレシート定義データの例を示す図である。It is a figure which shows the example of receipt definition data in case there exist two or more reading items of the same name in a receipt. 演算式を定義するレシート定義データの例を示す図である。It is a figure which shows the example of the receipt definition data which defines a computing equation. 履歴データ記憶部に格納される履歴データの例を示す図である。It is a figure which shows the example of the history data stored in a history data storage part. 履歴データの辞書部の例を示す図である。It is a figure which shows the example of the dictionary part of log | history data. レシート定義データ作成処理の全体のフローチャートである。It is a flowchart of the whole receipt definition data creation process. レシート定義データ作成処理の全体のフローチャートである。It is a flowchart of the whole receipt definition data creation process. レシート定義データ作成処理の全体のフローチャートである。It is a flowchart of the whole receipt definition data creation process. 定義入力画面の構成例を示す図である。It is a figure which shows the structural example of a definition input screen. 売上管理項目一覧の例を示す図である。It is a figure which shows the example of a sales management item list. OCR読取定義一覧表示領域の表示例を示す図である。It is a figure which shows the example of a display of an OCR reading definition list display area. 読取項目の変更の例を示す図である。It is a figure which shows the example of a change of a reading item. 初期画面表示処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of an initial screen display process. 同一名称の文字項目が複数存在する場合のOCR読取定義一覧表示領域とマーカー定義一覧表示領域の表示例を示す図である。It is a figure which shows the example of a display of an OCR reading definition list display area and a marker definition list display area when two or more character items of the same name exist. 演算定義処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of a calculation definition process. 演算定義の例を示す図である。It is a figure which shows the example of a calculation definition. ある店舗のレシートと売上管理項目との対応関係が計算式によって定義されている例を示す図である。It is a figure which shows the example in which the correspondence of the receipt and sales management item of a certain store is defined by the calculation formula. マーカー定義処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of a marker definition process. マーカー項目の定義例を示す図である。It is a figure which shows the example of a definition of a marker item. 複数キーワードの設定例を示す図である。It is a figure which shows the example of a setting of a several keyword. 代替項目の設定例を示す図である。It is a figure which shows the example of a setting of an alternative item. 類似データの有無を判断する処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the process which judges the presence or absence of similar data. 履歴データ作成処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of a history data creation process. 売上管理項目とレシート項目との対応関係の例を示す図である。It is a figure which shows the example of the correspondence of a sales management item and a receipt item.

以下,図面を用いながら,本発明の実施の形態について詳細に説明する。なお,以下では,主に店舗売上を集計する装置の例について説明するが,本発明は売上集計に限られるわけではなく,仕入集計データやその他の伝票などに印字された実績データを集計するための装置などにも同様に適用することができる。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following, an example of an apparatus for totalizing store sales will be described. However, the present invention is not limited to sales totalization, and totals actual data printed on purchase total data or other slips. The present invention can be applied to a device for the same.

図1は,本発明の概要を説明するための装置構成例を示す。図1において,1はCPUおよびハードディスクやメモリ等の記憶装置等から構成され,レシートから読み取った画像データをもとに,レシート定義データを作成する処理を実行するレシート定義データ作成装置,2はレシート定義データの作成対象となるレシート,3は表示装置,4はキーボードやマウス等の入力装置である。   FIG. 1 shows an apparatus configuration example for explaining the outline of the present invention. In FIG. 1, reference numeral 1 is a CPU and a storage device such as a hard disk or memory, etc., and a receipt definition data creation device that executes processing for creating receipt definition data based on image data read from a receipt, and 2 is a receipt. A receipt for which definition data is to be created, 3 is a display device, and 4 is an input device such as a keyboard or a mouse.

レシート2は,透明なキャリアシート等に挟まれた状態で読取機10に読み取られる。読取機10は,光学方式などによる画像のスキャンニングにより,レシート2の画像を読み取る装置である。画像データ読込部11は,周知のOCR処理機能を持ち,読取機10により読み取った画像を所定の画像データに変換する。なお,読取機10がOCR処理機能を有する場合には,画像データ読込部11は,OCR処理機能を持たなくてもよい。画像データは,例えばイメージデータが格納された画像ファイル,OCRによる認識文字データを含む。画像データ読込部11は,OCR処理結果の画像データを画像データ記憶部101に保存する。   The receipt 2 is read by the reader 10 while being sandwiched between transparent carrier sheets and the like. The reader 10 is a device that reads an image on the receipt 2 by scanning an image using an optical method or the like. The image data reading unit 11 has a known OCR processing function and converts an image read by the reader 10 into predetermined image data. When the reader 10 has an OCR processing function, the image data reading unit 11 may not have an OCR processing function. The image data includes, for example, an image file in which image data is stored and character data recognized by OCR. The image data reading unit 11 stores the image data of the OCR processing result in the image data storage unit 101.

画像データ解析部12は,画像データ記憶部101に記憶されているレシートの画像データから文字認識で抽出された文字列の矩形領域の位置を特定し,文字項目とあらかじめ定めた位置関係にある金額項目(金額欄)とを対応付け,文字項目と対応づけた金額欄との位置関係,文字項目がレシートデータ内で一意であるかを示す情報とを含む読取情報を作成し,読取情報記憶部102に格納する。作成される読取情報の詳細については後述する。   The image data analysis unit 12 specifies the position of the rectangular area of the character string extracted by character recognition from the image data of the receipt stored in the image data storage unit 101, and the amount of money that has a predetermined positional relationship with the character item A reading information storage unit that creates a reading information that associates an item (amount field) with the item, a positional relationship between the character field and the amount field associated with the item, and information indicating whether the character item is unique in the receipt data 102. Details of the created read information will be described later.

項目辞書記憶部103に記憶されている項目辞書は,売上管理項目毎に,その項目対応してレシートから読み取られる文字項目の名称(文字列)を登録する辞書情報である。   The item dictionary stored in the item dictionary storage unit 103 is dictionary information for registering, for each sales management item, the name (character string) of the character item read from the receipt corresponding to the item.

読取項目算出部13は,項目辞書記憶部103に記憶されている項目辞書を参照して,読取情報記憶部102に記憶されている読取情報から,基本データ記憶部104に格納されている基本管理項目(売上管理項目)について,レシートのイメージデータから読み取る文字項目(読取項目)の情報として,読取項目となる文字項目,対応付けられた金額欄,読取項目と金額欄との位置関係とを含む情報を抽出する。   The read item calculation unit 13 refers to the item dictionary stored in the item dictionary storage unit 103 and reads basic information stored in the basic data storage unit 104 from read information stored in the read information storage unit 102. For the item (sales management item), the information of the character item (read item) read from the image data of the receipt includes the character item to be read item, the associated amount field, and the positional relationship between the read item and the amount field. Extract information.

定義入力画面表示部14は,定義入力画面を表示装置3に表示する。定義入力画面は,指定された店舗のレシート定義データを作成するためのユーザインタフェースであり,基本データ記憶部104に記憶されている基本的な売上管理項目の情報,売上管理項目に対応する読取情報としてレシートから読み取る文字項目,読み取る文字項目と対応する金額欄の位置情報,マーカー項目の情報,画像データ記憶部101に記憶されているレシートのイメージデータ等の表示領域を有する。定義入力画面表示部14は,読取項目算出部13により抽出された文字項目の情報を読取項目に設定し,定義入力画面のOCR読取定義一覧に表示する。さらに,定義入力画面表示部14は,読取項目とした文字項目と対応する金額欄との位置情報をもとに,レシートのイメージデータ上で,文字項目と対応する金額欄の位置に矩形を表示して,どの文字項目が読取項目に設定され,どの金額欄が対応しているのかを操作員が確認できるようにする。   The definition input screen display unit 14 displays a definition input screen on the display device 3. The definition input screen is a user interface for creating receipt definition data of a designated store, and information on basic sales management items stored in the basic data storage unit 104 and read information corresponding to the sales management items As a character item to be read from the receipt, position information of the money amount column corresponding to the character item to be read, information of the marker item, image data of the receipt stored in the image data storage unit 101, and the like. The definition input screen display unit 14 sets the character item information extracted by the read item calculation unit 13 as a read item, and displays it in the OCR reading definition list on the definition input screen. Further, the definition input screen display unit 14 displays a rectangle at the position of the money field corresponding to the character item on the image data of the receipt based on the positional information of the text item as the read item and the corresponding money field. Thus, the operator can check which character item is set as the read item and which amount column corresponds.

入力データ処理部15は,表示された定義入力画面から,表示されているレシートの読取項目の情報,基本管理項目と文字項目(読取項目)との対応関係を入力する。このため,入力データ処理部15は,読取項目の変更などがあった場合に操作員の操作により入力された読取項目を取得する読取項目取得部151,複数の読取項目を一つの売上管理項目に対応づける演算式を定義する演算定義部152を備える。   The input data processing unit 15 inputs information on the read item of the displayed receipt and the correspondence between the basic management item and the character item (read item) from the displayed definition input screen. For this reason, the input data processing unit 15 reads the read item input unit 151 that acquires the read item input by the operation of the operator when the read item is changed, etc., into a single sales management item. An operation definition unit 152 that defines an operation expression to be associated is provided.

また,入力データ処理部15は,レシート内に読取項目として抽出した同一名称の文字項目が複数存在する場合に,読取項目を特定する基準となる複数キーワードを定義入力画面から入力して設定する複数キーワード設定部153および読取項目を特定する基準となる他のユニークな文字項目を定めるマーカー項目設定部154を備える。さらに,入力データ処理部15は,入力した読取項目について認識エラーがあった場合や文字認識精度が悪い場合に,読取項目に代替する他のレシート項目を代替項目として操作員に指定させて代替項目を入力する代替項目処理部155を備える。   Further, the input data processing unit 15 inputs and sets a plurality of keywords that serve as a reference for specifying the read item from the definition input screen when there are a plurality of character items with the same name extracted as read items in the receipt. A keyword setting unit 153 and a marker item setting unit 154 that determines other unique character items serving as a reference for specifying a reading item are provided. Further, the input data processing unit 15 causes the operator to designate another receipt item to be substituted for the read item as a substitute item when the input read item has a recognition error or the character recognition accuracy is poor. The alternative item processing unit 155 is input.

定義データ作成部16は,読取項目算出部13によって抽出した文字項目の情報と入力データ処理部15によって入力した情報とをもとに,店舗ごとのレシート定義データを作成し,定義データ記憶部106に格納する。   The definition data creation unit 16 creates receipt definition data for each store based on the character item information extracted by the read item calculation unit 13 and the information input by the input data processing unit 15, and the definition data storage unit 106. To store.

レシート定義データは,レシートの読取項目における項目名称とそれに対応する金額項目の相対位置(相対的な金額欄の位置)などの情報を含むとともに,売上管理項目との対応関係情報を含んでいる。   The receipt definition data includes information such as the item name in the read item of the receipt and the relative position of the corresponding monetary item (the position of the relative monetary column) and the correspondence information with the sales management item.

履歴データ作成部18は,定義データ作成部16によって作成されたレシート定義データの履歴データを作成し,履歴データ記憶部107に格納する。この履歴データは,類似する他のレシートのレシート定義データを作成するときに参照して利用することができる。   The history data creation unit 18 creates history data of the receipt definition data created by the definition data creation unit 16 and stores it in the history data storage unit 107. This history data can be used by referring to the receipt definition data of other similar receipts.

図2は,図1に示すレシート定義データ作成装置1の処理の概要を示すフローチャートである。   FIG. 2 is a flowchart showing an outline of processing of the receipt definition data creation device 1 shown in FIG.

ステップS11では,画像データ読込部11が,読取機10により精算レシートを読み取る。精算レシートは,各店舗における1日分の売上情報の集計データであり,レシート項目は各店舗が使用しているPOSシステムによって異なっている。画像データ読込部11は,文字認識などによって得られた項目明細やレシートの全体イメージのデータを画像データ記憶部101に格納する。   In step S <b> 11, the image data reading unit 11 reads the payment receipt by the reader 10. The payment receipt is total data of sales information for one day at each store, and the receipt item varies depending on the POS system used by each store. The image data reading unit 11 stores in the image data storage unit 101 the item details obtained by character recognition and the data of the entire image of the receipt.

ステップS12では,画像データ解析部12が,画像データ記憶部101に記憶されている精算レシートの画像データから文字認識処理で抽出した文字データ(文字列)の矩形領域の位置を特定し,さらに,文字列を,金額を示す金額欄とそれ以外の文字項目とに分ける。金額欄は,特定の記号(例えば,「¥」,「,」等)と数字のみから構成される文字列であり,文字項目は,金額項目以外であって読取項目となりうる文字列である。さらに,画像データ解析部12が,文字項目と所定の位置関係にある金額欄とを対応づけ,文字項目と金額欄との位置関係,レシート内で文字項目が一意であるかを示す情報などを含む読取情報を作成し,読取情報記憶部102に格納する。   In step S12, the image data analysis unit 12 specifies the position of the rectangular area of the character data (character string) extracted by the character recognition process from the image data of the payment receipt stored in the image data storage unit 101, and The character string is divided into an amount field indicating the amount of money and other character items. The amount column is a character string composed of only a specific symbol (for example, “¥”, “,”, etc.) and a number, and the character item is a character string that can be a read item other than the amount item. Further, the image data analysis unit 12 associates the character item with the amount field having a predetermined positional relationship, the positional relationship between the character item and the amount field, information indicating whether the character item is unique in the receipt, and the like. The read information that is included is created and stored in the read information storage unit 102.

ステップS13では,読取項目算出部13が,項目辞書記憶部103に記憶されている項目辞書を参照して,読取情報記憶部102に記憶されている読取情報から,基本データ記憶部104に格納されている売上管理項目に対応してレシートから読み込まれる文字項目の情報を抽出する。そして,定義入力画面表示部14が,画像データ記憶部101,基本データ記憶部104,店舗マスタ105のデータ,読取項目として抽出した文字項目の情報,読取項目と金額欄との位置を示すレシートの全体イメージなどを含む定義入力画面を作成し,表示装置3に表示する。   In step S <b> 13, the read item calculation unit 13 refers to the item dictionary stored in the item dictionary storage unit 103 and stores the read information stored in the read information storage unit 102 in the basic data storage unit 104. The information of the character item read from the receipt corresponding to the sales management item is extracted. Then, the definition input screen display unit 14 displays the image data storage unit 101, the basic data storage unit 104, the store master 105 data, the character item information extracted as the reading item, and the receipt indicating the position of the reading item and the amount column. A definition input screen including the entire image is created and displayed on the display device 3.

ステップS14では,入力データ処理部15が,定義入力画面からの入力により,精算レシートの売上管理項目に対する演算式などを設定し,読取項目と売上管理項目との対応関係などを定める。   In step S14, the input data processing unit 15 sets an arithmetic expression or the like for the sales management item of the payment receipt and determines the correspondence between the read item and the sales management item, etc., by inputting from the definition input screen.

ステップS15では,定義データ作成部16が,入力データ処理部15により入力した情報と読取項目算出部13により設定した情報とをもとに,レシート定義データを作成し,定義データ記憶部106に格納する。   In step S 15, the definition data creation unit 16 creates receipt definition data based on the information input by the input data processing unit 15 and the information set by the reading item calculation unit 13, and stores it in the definition data storage unit 106. To do.

ステップS16では,履歴データ作成部18が,作成したレシート定義データについての履歴データを作成し,履歴データ記憶部107に保存する。   In step S <b> 16, the history data creation unit 18 creates history data for the created receipt definition data and stores it in the history data storage unit 107.

ステップS17では,定義データ解析部17が,作成したレシート定義データに含まれる読取項目の名称を,項目辞書記憶部103に記憶されている項目辞書の対応する設定項目(基本管理項目)の読取文字列に追加する。   In step S <b> 17, the definition data analysis unit 17 sets the name of the read item included in the created receipt definition data to the read character of the setting item (basic management item) corresponding to the item dictionary stored in the item dictionary storage unit 103. Add to column.

以上,レシート定義データ作成装置1が実行する大まかな処理を説明したが,以下では,具体的な処理内容やデータ構造について詳しく説明する。   The rough processing executed by the receipt definition data creation device 1 has been described above. Specific processing contents and data structure will be described in detail below.

図3は,読取機10によって読み取られるレシート2の例を示す図である。読取機10が図3に示すようなレシート2を読み取ると,読取機10または画像データ読込部11のOCR処理により,画像の解析による文字認識が行われる。この文字認識では,図3に示すレシート2における文字列#1,#2,…,#14,…のように,一連の文字列ごとに,文字列を構成する各認識文字の候補とその位置情報とが画像データとして抽出され,画像データ記憶部101に格納される。   FIG. 3 is a diagram illustrating an example of the receipt 2 read by the reader 10. When the reader 10 reads the receipt 2 as shown in FIG. 3, character recognition is performed by analyzing the image by the OCR processing of the reader 10 or the image data reading unit 11. In this character recognition, each recognized character candidate constituting the character string and its position for each series of character strings, such as character strings # 1, # 2,..., # 14,. Information is extracted as image data and stored in the image data storage unit 101.

図4は,画像データ記憶部101に格納される画像データの例を示す図である。画像データ記憶部101には,図4(A)に示すように,レシート画像のイメージデータに関するデータと,図4(B)に示すように,レシートの文字認識結果のデータ(以下,認識文字データという)とが格納される。   FIG. 4 is a diagram illustrating an example of image data stored in the image data storage unit 101. As shown in FIG. 4A, the image data storage unit 101 stores data relating to the image data of the receipt image, and data of the character recognition result of the receipt (hereinafter, recognized character data) as shown in FIG. Are stored.

レシート画像のイメージデータは,例えばレシート全体またはレシートにおける文字が印字された部分全体の矩形領域の画像イメージがビットマップ形式の画像ファイルとして格納され,また,このレシート2を発行した店舗を識別する店舗コードが付与される。この店舗コードは,入力装置4から事前に入力してもよいし,また,レシート2を読取機10に読み取らせるときのレシート挟持用シート(キャリアシート)に付与された各店舗識別用の2次元コード等を解析して入力するようにしてもよい。   As the image data of the receipt image, for example, the image image of the rectangular area of the entire receipt or the entire portion of the receipt printed with characters is stored as a bitmap image file, and the store that identifies the store that issued this receipt 2 A code is given. This store code may be input in advance from the input device 4, or a two-dimensional identification for each store given to a receipt sandwiching sheet (carrier sheet) when the receipt 2 is read by the reader 10. The code or the like may be analyzed and input.

図4(B)に示す認識文字データは,一連の文字列#n(n=1,2,…)についての文字認識の結果が格納されるが,その内容を図3に示す文字列#14の例を用いて説明する。まず,文字列#14がレシート2における14番目の文字列であり,識別番号がそれを示している。文字列#14の文字数は3(第1候補の並びは「総売上」)であり,文字列#14の座標は,(x,y)−(x’,y’)である。この座標は,あらかじめ定められたレシート2の画像の基準位置(例えばレシート画像の左上角または文字列群を囲む矩形領域の左上角など)を原点とした座標である。   In the recognized character data shown in FIG. 4B, the result of character recognition for a series of character strings #n (n = 1, 2,...) Is stored, the contents of which are character string # 14 shown in FIG. An example will be described. First, the character string # 14 is the 14th character string in the receipt 2, and the identification number indicates it. The number of characters in the character string # 14 is 3 (the first candidate is “total sales”), and the coordinates of the character string # 14 are (x, y) − (x ′, y ′). This coordinate is a coordinate whose origin is the predetermined reference position of the image of the receipt 2 (for example, the upper left corner of the receipt image or the upper left corner of the rectangular area surrounding the character string group).

さらに,認識文字データは,文字列#14を構成する各文字#141,#142,#143の3文字について,各々の座標情報を持つ。また,認識結果の文字と認識用の辞書との相違度の小さい順に,認識結果のいくつかの文字が相違度とともに格納される。例えば,文字#141の認識結果の第1番目の候補は「総」(相違度=1311)であり,第2番目の候補は「脆」(相違度=1581),第3番目の候補は「聡」(相違度=1640)である。   Further, the recognized character data has coordinate information for each of the three characters # 141, # 142, and # 143 constituting the character string # 14. In addition, some characters of the recognition result are stored together with the degree of difference in ascending order of the degree of difference between the recognition result character and the recognition dictionary. For example, the first candidate of the recognition result of the character # 141 is “total” (difference = 1311), the second candidate is “brittle” (difference = 1581), and the third candidate is “聡 ”(difference = 1640).

ここで,画像データ読込部11は,これらの認識結果の候補をすべて画像データ記憶部101に格納するのではなく,各文字列#nを構成する認識候補の各文字の組み合わせと,すべての店舗に共通にあらかじめ用意された認識結果単語辞書であって,レシートに印字される可能性のある文字列があらかじめ格納されている辞書中の単語との照合により,認識結果の文字列を絞り込んで,その絞り込んだ結果だけを画像データ記憶部101に格納するようにしてもよい。   Here, the image data reading unit 11 does not store all of these recognition result candidates in the image data storage unit 101, but each character combination of the recognition candidates constituting each character string #n and all stores. This is a recognition result word dictionary prepared in advance in common, and by narrowing down the recognition result character string by collating with words in the dictionary where the character string that may be printed on the receipt is stored in advance, Only the narrowed result may be stored in the image data storage unit 101.

図5は,読取情報記憶部102に格納される読取情報の例を示す図である。読取情報は,図5(A)に示すように,文字項目,読取位置,金額欄の相対位置,一意のデータ項目を有する。「文字項目」は,精算レシートから文字認識された金額欄以外の文字列である。画像データ解析部12は,精算レシートから文字認識された文字列から,例えば「¥」,「,」のような所定の記号と数字のみで構成されている文字列を金額欄と判断し,金額欄以外の文字列を文字項目とする。読取情報の「文字項目」に,文字項目と判断された全ての文字列が記録される。   FIG. 5 is a diagram illustrating an example of read information stored in the read information storage unit 102. As shown in FIG. 5A, the reading information has a character item, a reading position, a relative position in the amount column, and a unique data item. The “character item” is a character string other than the money amount field that has been character-recognized from the payment receipt. The image data analysis unit 12 determines a character string composed of only predetermined symbols and numbers such as “¥”, “,”, and the like from the character string recognized from the payment receipt as an amount column, A character string other than a field is a character item. All character strings determined as character items are recorded in the “character item” of the read information.

「読取位置」は,文字項目の矩形領域のイメージデータ上の位置(座標情報)である。画像データ解析部12は,図5(B)に示すように,画像データ記憶部101に格納される精算レシートのイメージデータから文字認識された各文字列の矩形領域を特定し,レシート上でその文字列が読み取られた位置(座標)を算出する。読取情報の「読取位置」に,各文字項目の座標情報が記録される。   “Reading position” is the position (coordinate information) on the image data of the rectangular area of the character item. As shown in FIG. 5 (B), the image data analysis unit 12 specifies a rectangular area of each character string recognized from the image data of the payment receipt stored in the image data storage unit 101, and on the receipt, The position (coordinates) at which the character string is read is calculated. The coordinate information of each character item is recorded in the “read position” of the read information.

「金額欄の相対位置」は,文字項目に対応する金額欄の矩形領域の位置を,文字項目の矩形領域からの相対位置で示す情報(相対座標情報)である。画像データ解析部12は,図5(C)に示すように,文字項目と金額欄との各座標情報から,文字項目のY座標値と近似するY座標値を持つ金額欄とを対応付け,文字項目の矩形領域から対応付けた金額欄の矩形領域への相対的位置を算出する。読取情報の「金額欄の相対位置」に,文字項目に対応付けられた金額欄の相対位置が記録される。文字項目に金額欄が対応付けられていない場合に,「金額欄の相対位置」に位置情報が設定されない。   “Relative position of money field” is information (relative coordinate information) indicating the position of the rectangular area of the money field corresponding to the character item as a relative position from the rectangular area of the character item. As shown in FIG. 5C, the image data analysis unit 12 associates the amount of money field having the Y coordinate value that approximates the Y coordinate value of the character item from the coordinate information of the character item and the amount of money field, The relative position from the rectangular area of the character item to the rectangular area of the associated money amount column is calculated. The relative position of the amount field associated with the character item is recorded in the “relative position of the amount field” of the read information. If the amount field is not associated with the character item, the position information is not set in the “relative position of the amount field”.

「一意」は,その文字項目が精算レシート内でユニークな存在であるかを示す情報である。画像データ解析部12は,画像データ中に同じ名称の文字項目が存在するかを調べる。文字項目がユニークであれば,読取情報の「一意」に一意を示す値(丸印)が設定され,同じ文字項目が複数存在していれば,読取情報の「一意」に複数あることを示す値(×印)が設定される。   “Unique” is information indicating whether or not the character item is unique in the checkout receipt. The image data analysis unit 12 checks whether there is a character item with the same name in the image data. If the character item is unique, a unique value (circle) is set for the reading information “unique”. If there are multiple character items, it indicates that there is more than one in the reading information “unique”. A value (x mark) is set.

図6は,項目辞書記憶部103に格納される項目辞書の例を示す図である。項目辞書は,基本管理項目に設定される項目を示す「設定項目(売上管理項目)」と,各設定項目に対応付けられる文字項目の名称を示す「読取文字列」とが対応づけられた辞書データである。項目辞書はあらかじめ項目辞書記憶部103に格納されている。   FIG. 6 is a diagram illustrating an example of an item dictionary stored in the item dictionary storage unit 103. The item dictionary is a dictionary in which “setting items (sales management items)” indicating items set as basic management items and “reading character strings” indicating the names of character items associated with the setting items are associated with each other. It is data. The item dictionary is stored in the item dictionary storage unit 103 in advance.

定義データ解析部17は,レシート定義データから,テナント管理部門が集計する売上管理項目に対応付けられた読取項目の名称を抽出し,項目辞書記憶部103の該当する基本管理項目の読取文字列に登録する。なお,管理者の入力操作によって,基本管理項目となる設定項目の名称,読取文字列を登録するようにしてもよい。   The definition data analysis unit 17 extracts the name of the read item associated with the sales management item aggregated by the tenant management department from the receipt definition data, and stores it in the read character string of the corresponding basic management item in the item dictionary storage unit 103. sign up. Note that the name of the setting item, which is a basic management item, and the read character string may be registered by an input operation by the administrator.

図7は,基本データ記憶部104に格納される基本テーブルの例を示す図である。この基本テーブルは,テナント管理部門が集計する売上管理項目の情報を格納している。具体的には,ショッピングセンターにおける売上管理データの管理を対象とした場合,ショッピングセンターを識別するショッピングセンターコード,ショッピングセンターの名称および所在地,ショッンピングセンター内の店舗数の情報を格納している。また,テナント管理に必要な各売上管理項目の項目名称が格納される。   FIG. 7 is a diagram illustrating an example of a basic table stored in the basic data storage unit 104. This basic table stores information on sales management items that are aggregated by the tenant management department. Specifically, in the case of managing sales management data in a shopping center, information on a shopping center code for identifying the shopping center, the name and location of the shopping center, and the number of stores in the shopping center is stored. In addition, the item name of each sales management item necessary for tenant management is stored.

この例では,売上管理項目として8個の項目があり,これらの各項目の名称が「現金売上」,「掛売上」,「クレジット売上」,「商品券」,「総売上」,「消費税」,「その他控除」,「純売上」である。本システムは,各店舗ごとに異なる各種のレシートの項目の中から,これらの売上管理項目の情報を自動で抽出するためのレシート定義データを,単純な操作で作成することができるようにすることを目的としている。   In this example, there are eight items as sales management items, and the names of these items are “cash sales”, “payment sales”, “credit sales”, “gift certificate”, “total sales”, “consumption tax” ”,“ Other deductions ”and“ Net sales ”. This system enables receipt definition data for automatically extracting information on these sales management items from various receipt items that differ for each store to be created with a simple operation. It is an object.

また,この基本テーブルには,各演算管理項目ごとにその演算管理項目が取り得る値の下限値と上限値とが定められ,格納されている。この下限値と上限値とは,レシート画像を文字認識することによってレシートから売上管理項目の金額を自動で抽出した場合に,,誤認識・誤入力を少なくするためのチェックに用いられる。   In this basic table, a lower limit value and an upper limit value that can be taken by the calculation management item are determined and stored for each calculation management item. The lower limit value and the upper limit value are used for checking to reduce erroneous recognition and erroneous input when the amount of the sales management item is automatically extracted from the receipt by character recognition of the receipt image.

図8は,店舗マスタ105の例を示す図である。店舗マスタ105は,レシートを発行する個別の店舗の情報を格納するテーブルであり,あらかじめ用意される。1番目の設定項目である店舗コードは,店舗を識別する番号である。2番目の店舗名称は,店舗の名称である。3番目の業種コードは,店舗の業種を表すコードである。4番目の業種名は,業種の名称である。続いてPOSシステム情報1,2,3として,順に,導入されているPOSシステムの識別コード(例:F001),POSシステムのメーカー(例:AAAAA),POSシステムの導入年月日(例:2000年1月1日)などの情報が格納される。また,精算レシート情報1,2,3,4として,順に,精算レシートの長さ,読込形式,精算レシート中の印字項目数,その他の必要な情報が格納される。読込形式の欄には,読取機10がレシート2をそのままの形で読み込む場合には“0”,レシート2が長過ぎるため,レシート2を複数片にカットして読み込む場合には“1”の値が設定される。   FIG. 8 is a diagram illustrating an example of the store master 105. The store master 105 is a table that stores information on individual stores that issue receipts, and is prepared in advance. The store code which is the first setting item is a number for identifying the store. The second store name is the name of the store. The third business type code is a code representing the business type of the store. The fourth industry name is the name of the industry. Subsequently, as the POS system information 1, 2 and 3, the identification code of the installed POS system (example: F001), the manufacturer of the POS system (example: AAAAA), the date of introduction of the POS system (example: 2000) Such as January 1st) is stored. Further, as the payment receipt information 1, 2, 3 and 4, the length of the payment receipt, the reading format, the number of print items in the payment receipt, and other necessary information are sequentially stored. In the column of the reading format, “0” is read when the reader 10 reads the receipt 2 as it is, and “1” is read when the receipt 2 is cut into a plurality of pieces because the receipt 2 is too long. Value is set.

本システムは,以上の読取情報記憶部102,基本データ記憶部104,店舗マスタ105に格納されているデータをもとに,レシート定義データを作成する。なお,店舗マスタ105は,店舗情報が既知であるか入力装置4から事前に入力される場合には必須ではない。   This system creates receipt definition data based on the data stored in the read information storage unit 102, basic data storage unit 104, and store master 105 described above. The store master 105 is not essential when store information is known or input in advance from the input device 4.

図9は,レシート定義データであって,もっとも基本的なデータの例を示している。店舗コードは,どの店舗のレシート定義データであるかを示す店舗の識別コードである。続いて,レシートから読み取るレシート項目の情報が,各項目ごとに格納される。読取項目1識別コードは,1番目の読取項目1の識別コードであり,レシート定義データ内で読取項目を一意に識別するコードである。   FIG. 9 shows an example of the most basic data as receipt definition data. The store code is a store identification code indicating which store has the receipt definition data. Subsequently, receipt item information read from the receipt is stored for each item. The reading item 1 identification code is an identification code of the first reading item 1, and is a code for uniquely identifying the reading item in the receipt definition data.

項目属性には,読取項目の属性が設定される。レシート内に同一名称(読取文字が同じ)の読取項目が存在しない場合,属性値=1である。レシート内に同一名称の読取項目が存在したときに,マーカー項目を基準にして読取項目を特定する場合には,属性値=2である。レシート内に同一名称の読取項目が存在したときに,複数キーワードをもとに読取項目を特定する場合には,属性値=3である。読取文字の認識が困難で代替項目を設定した場合には,属性値=4である。   In the item attribute, the attribute of the read item is set. If there is no reading item with the same name (the same reading character) in the receipt, the attribute value = 1. When there is a reading item with the same name in the receipt, the attribute value = 2 when the reading item is specified based on the marker item. When there is a reading item with the same name in the receipt, when specifying the reading item based on a plurality of keywords, attribute value = 3. When it is difficult to recognize the read character and an alternative item is set, attribute value = 4.

図9(A)のレシート定義データは,同一名称の読取項目が複数存在しない場合の例であり,項目属性の属性値は1となっている。1番目の読取項目の読取文字1は,この例では「総売上」となっている。金額欄の相対読取位置1は,「総売上」に対応する金額の文字列がどの部分に印字されているかを「総売上」の文字列の位置からの相対位置で示す。ここで相対位置とは,例えば「総売上」の文字列領域の左上角を原点としたときの金額欄の位置の座標であり,読取情報記憶部102に格納されている文字項目「総売上」に対応する「金額欄の相対位置」の座標である。金額欄の位置を読取文字1の位置からの相対位置で示すのは,同じレシートであっても,日によって実際にレシートに印字される行数が異なり,読取文字1の位置が可変であるからである。   The receipt definition data in FIG. 9A is an example when there are not a plurality of read items with the same name, and the attribute value of the item attribute is 1. The read character 1 of the first read item is “total sales” in this example. The relative reading position 1 in the amount column indicates in which position the character string of the amount corresponding to “total sales” is printed in a relative position from the position of the character string “total sales”. Here, the relative position is, for example, the coordinates of the position of the amount column when the upper left corner of the character string area of “total sales” is the origin, and the character item “total sales” stored in the read information storage unit 102. Are the coordinates of the “relative position of the amount column” corresponding to. The position of the amount column is indicated by the relative position from the position of the read character 1 because the number of lines actually printed on the receipt differs depending on the day even if the receipt is the same, and the position of the read character 1 is variable. It is.

2番目の読取項目の読取文字2「その他金券金額」,3番目の読取項目の読取文字3「現金売上」についても,同様に識別コード,項目属性,読取文字,金額欄の相対読取位置のデータがレシート定義データとして格納される。   Similarly, for the reading character 2 of the second reading item “other amount of cash voucher” and the reading character 3 of the third reading item 3 “cash sales”, the identification code, the item attribute, the reading character, the data of the relative reading position of the amount column Is stored as receipt definition data.

図9(B)のレシート定義データは,読取項目の文字認識が困難な場合の例であり,項目属性の属性値は4となっている。この場合,読取項目(例えば消費税)の認識の代わりとなる項目を代替項目(例えば小計)として定義し,金額欄の相対読取位置として代替項目からの相対距離を設定する。   The receipt definition data in FIG. 9B is an example when it is difficult to recognize the characters of the read item, and the attribute value of the item attribute is 4. In this case, an item that replaces recognition of a reading item (for example, consumption tax) is defined as an alternative item (for example, a subtotal), and a relative distance from the alternative item is set as a relative reading position in the amount column.

図10は,読取項目としてレシート内に同一名称が複数存在する場合のレシート定義データの例を示している。図10(A)は,項目属性の属性値が2の場合の例,図10(B)は,項目属性の属性値が3の場合の例である。   FIG. 10 shows an example of receipt definition data when a plurality of identical names exist as receipt items in a receipt. 10A shows an example when the attribute value of the item attribute is 2, and FIG. 10B shows an example when the attribute value of the item attribute is 3.

レシート内に読取項目の名称が同じ項目が複数存在する場合(例えば,読取項目の項目名称が「消費税」であり,その「消費税」という用語が複数行に印字されている場合),どちらの金額を売上管理項目として抽出するかを特定する情報が必要となる。   When there are multiple items with the same read item name in the receipt (for example, the item name of the read item is "consumption tax" and the term "consumption tax" is printed on multiple lines) Is required to specify whether to extract the amount of money as a sales management item.

項目属性の属性値が2の場合,読取項目の位置を特定する基準となる他のユニークな項目名称をマーカー項目として定義することにより,同一の名称の項目の一つを実際の読取項目として特定する。図10(A)の例では,「総売上」が読取文字1であるが,レシート内に「総売上」の項目名称が複数存在するため,他のユニークなレシート上の印字名称である「貸在高」の項目をマーカー項目として定義している。また,読取文字1の読取位置およびその項目に対応する金額欄の相対読取位置1の他に,マーカー項目からの距離(方向を含む)の情報が定義される。このマーカー項目からの距離の情報は,マーカー項目「貸在高」の文字位置から読取文字1「総売上」の文字位置までの距離(x座標,y座標)の上限値を示しており,x座標については,読取文字1が右方向に存在する場合には正の値,左方向に存在する場合には負の値をとる。また,y座標については,読取文字1が上方向に存在する場合には正の値,読取文字1が下方向に存在する場合には負の値をとる。図10(A)の例では,この値が「(−50,+100)」であり,マーカー項目「貸在高」の文字位置からx座標で−50(左方向),かつ,y座標で+100(上方向)の範囲内に,収集対象となる読取文字1「総売上」が存在することを示している。   If the attribute value of the item attribute is 2, define one of the items with the same name as the actual reading item by defining another unique item name that serves as a reference for specifying the position of the reading item as a marker item To do. In the example of FIG. 10A, “total sales” is the read character 1, but there are a plurality of item names of “total sales” in the receipt. The item of “Holding” is defined as a marker item. In addition to the reading position of the reading character 1 and the relative reading position 1 of the amount column corresponding to the item, information on the distance (including direction) from the marker item is defined. The distance information from the marker item indicates the upper limit value of the distance (x coordinate, y coordinate) from the character position of the marker item “loan amount” to the character position of the read character 1 “total sales”. As for the coordinates, when the read character 1 is present in the right direction, a positive value is assumed. The y-coordinate takes a positive value when the read character 1 exists in the upward direction, and takes a negative value when the read character 1 exists in the downward direction. In the example of FIG. 10A, this value is “(−50, +100)”, −50 (left direction) in the x coordinate from the character position of the marker item “loan amount”, and +100 in the y coordinate. This indicates that the read character 1 “total sales” to be collected exists within the range (upward).

項目属性の属性値が3の場合,複数行に連続して並ぶ複数の項目名称をキーワードとして,それらの複数のキーワードがレシート内でユニークになるように定義することにより,同一の名称の項目の一つを実際の読取項目として特定する。図10(B)の例では,「総売上」が売上管理項目として必要な読取文字1であるが,レシート内に「総売上」の項目名称が複数存在するため,レシート内でユニークになる「総売上」,「純売上」,「現金有高」,「貸在高」の複数行にわたる一連の項目を,複数キーワードとして設定し,これらの一塊の文字列により,「総売上」の読取項目の位置を特定するようにしている。読取文字1の読取位置1は,「総売上」,「純売上」,「現金有高」,「貸在高」の複数キーワードが印字された最小矩形領域の左上と右下の座標である。また,金額欄の相対読取位置1は,読取文字1の読取位置1の左上の座標を原点として定義した座標である。   When the attribute value of an item attribute is 3, by defining multiple item names that are consecutively arranged in multiple lines as keywords and defining the multiple keywords to be unique in the receipt, the items with the same name One is specified as an actual reading item. In the example of FIG. 10B, “total sales” is the read character 1 necessary as a sales management item, but since there are a plurality of item names of “total sales” in the receipt, it is unique in the receipt. A series of items covering multiple lines, such as “total sales”, “net sales”, “cash amount”, and “loan amount”, are set as multiple keywords. The position of is specified. The reading position 1 of the reading character 1 is the upper left and lower right coordinates of the minimum rectangular area on which a plurality of keywords “total sales”, “net sales”, “cash amount”, and “loan amount” are printed. The relative reading position 1 in the money amount column is a coordinate defined with the upper left coordinate of the reading position 1 of the reading character 1 as the origin.

さらに,レシート定義データとして,図9および図10に示すレシート定義データによって定義された読取項目と,図7に示した基本テーブル中の売上管理項目との対応関係を示す演算式の定義情報が設定される。図11は,その演算式を定義するレシート定義データの例を示している。   Further, as the receipt definition data, the definition information of the arithmetic expression indicating the correspondence between the read item defined by the receipt definition data shown in FIGS. 9 and 10 and the sales management item in the basic table shown in FIG. 7 is set. Is done. FIG. 11 shows an example of receipt definition data that defines the arithmetic expression.

演算式の定義情報は,図11に示すように,店舗を識別する店舗コードの他に,各売上管理項目と1または複数の読取項目識別コードとの対応情報を持つ。複数の読取項目が,1つの売上管理項目に対応づけられる場合には,複数の読取項目識別コードについての四則演算の演算式が用いられる。図11の例で説明すると,売上管理項目1「現金売上」に対応する読取項目識別コードは,「A+B」となっている。これは,読取項目識別コード=Aの読取項目に対応する金額欄に印字された数値と,読取項目識別コード=Bの読取項目に対応する金額欄に印字された数値とを加算した値を,売上管理項目1「現金売上」の金額として計上することを示している。2番目の売上管理項目2「掛売上」については,読取項目識別コード「C」の読取項目を,そのまま「掛売上」の金額とすることを示している。他の売上管理項目についても同様に,読取項目識別コードの演算式(1対1対応の場合を含む)によって,各売上管理項目とレシートからの読取項目との対応情報が定義される。   As shown in FIG. 11, the definition information of the arithmetic expression has correspondence information between each sales management item and one or a plurality of read item identification codes in addition to the store code for identifying the store. When a plurality of reading items are associated with one sales management item, arithmetic expressions of four arithmetic operations for a plurality of reading item identification codes are used. In the example of FIG. 11, the read item identification code corresponding to the sales management item 1 “cash sales” is “A + B”. This is a value obtained by adding the numerical value printed in the amount column corresponding to the reading item with the reading item identification code = A and the numerical value printed in the amount column corresponding to the reading item with the reading item identification code = B, It shows that it is recorded as the amount of sales management item 1 “cash sales”. For the second sales management item 2 “paid sales”, the read item of the read item identification code “C” is used as the amount of “paid sales” as it is. Similarly for other sales management items, the correspondence information between each sales management item and the read item from the receipt is defined by the operation formula of the read item identification code (including the case of one-to-one correspondence).

次に,履歴データ作成部18によって作成され,履歴データ記憶部107に格納される履歴データの例を,図12に従って説明する。   Next, an example of history data created by the history data creation unit 18 and stored in the history data storage unit 107 will be described with reference to FIG.

履歴データは,定義データ作成部16によって作成されたレシート定義データの内容を,他の同業種の店舗でのレシート定義データの作成に流用できるようにするために,まとめたものである。業種情報として,業種コード,業種名,POSシステム情報1〜3,精算レシート情報1〜4などが格納される。また,項目情報として,各読取項目の識別コード,項目属性,読取文字等が格納される。また,演算情報として,各売上管理項目と,該当する読取項目識別コードを用いた演算式が格納される。これらの具体的な内容は,図9ないし図11を用いて説明したレシート定義データの内容と同様である。   The history data is collected so that the contents of the receipt definition data created by the definition data creation unit 16 can be used for the creation of receipt definition data at other stores in the same industry. As the industry information, the industry code, industry name, POS system information 1 to 3, payment receipt information 1 to 4 and the like are stored. In addition, as the item information, an identification code, an item attribute, a reading character, and the like of each reading item are stored. In addition, as the calculation information, an arithmetic expression using each sales management item and the corresponding read item identification code is stored. These specific contents are the same as the contents of the receipt definition data described with reference to FIGS.

また,履歴データ作成部18は,履歴データとして辞書情報を作成し,履歴データ記憶部107に格納する。図13は,その履歴データの辞書部の例を示す。   Further, the history data creation unit 18 creates dictionary information as history data and stores it in the history data storage unit 107. FIG. 13 shows an example of the dictionary portion of the history data.

履歴データの辞書部には,図13に示すように,業種コード,POSシステム情報,売上管理項目,読取文字,…などの実際にレシート定義データに利用された文字列情報(単語など)が格納される。この辞書部に格納された文字列情報は,作成済みのレシート定義データを用いて,新しい店舗のレシート定義データを作成する場合に,売上管理項目に該当する読取項目を類推するために用いられる。また,例えば図4で説明した文字認識結果の画像データにおいて,正しい認識結果の文字列を抽出するのに用いることができる。また,実際の売上管理データの収集作業において,自動で誤認識,誤入力を防止するのに用いることができる。   In the dictionary section of the history data, as shown in FIG. 13, character string information (words etc.) actually used for receipt definition data such as industry codes, POS system information, sales management items, read characters,. Is done. The character string information stored in the dictionary part is used to infer the reading items corresponding to the sales management items when the receipt definition data of a new store is created by using the created receipt definition data. For example, it can be used to extract a character string of a correct recognition result in the image data of the character recognition result described with reference to FIG. It can also be used to prevent erroneous recognition and erroneous input automatically in the actual sales management data collection operation.

次に,レシート定義データ作成装置1が実行する処理について,さらに詳しく説明する。図14〜図16は,本実施形態に係るレシート定義データ作成処理の全体のフローチャートである。   Next, the process executed by the receipt definition data creation device 1 will be described in more detail. 14 to 16 are flowcharts of the entire receipt definition data creation process according to the present embodiment.

まず,ステップS201では,入力装置4からの操作員の入力を待ち合わせる。操作員が,メニュー等により,レシート定義データを新規に作成するのか,または作成済みのレシート定義データを参照して作成するのかを指定すると,ステップS202へ進む。   First, in step S201, an operator input from the input device 4 is waited. If the operator designates whether receipt definition data is newly created or created by referring to the created receipt definition data by using a menu or the like, the process proceeds to step S202.

ステップS202では,レシート定義データの新規作成か参照作成かを判定し,参照作成の場合,図15のステップ220へ進み,新規作成の場合には,ステップS203へ進む。   In step S202, it is determined whether the receipt definition data is newly created or reference created. If reference creation is to be performed, the process proceeds to step 220 in FIG. 15, and if newly created, the process proceeds to step S203.

ステップS203では,レシート定義データを作成するための定義入力画面の初期画面を表示装置3に表示する。   In step S203, an initial screen of a definition input screen for creating receipt definition data is displayed on the display device 3.

図17に,定義入力画面の構成例を示す。定義入力画面30には,レシート定義データを作成する施設とテナント(店舗)情報の表示領域の下に,売上管理項目一覧表示領域31,OCR読取定義一覧表示領域32,レシート画像表示領域33,マーカー定義一覧表示領域34,計算式入力用領域35が設けられる。   FIG. 17 shows a configuration example of the definition input screen. The definition input screen 30 includes a sales management item list display area 31, an OCR reading definition list display area 32, a receipt image display area 33, a marker below the display area of the facility for creating receipt definition data and tenant (store) information. A definition list display area 34 and a calculation formula input area 35 are provided.

図18は,売上管理項目一覧表示領域31の表示例を示す図である。売上管理項目一覧表示領域31には,売上管理項目一覧が表示される。売上管理項目一覧は,図7で説明した基本テーブルに格納されている売上管理項目の項目名称と,売上管理項目と読取項目とを対応づける計算式(演算式)が確定したときに,その計算式が表示される欄を持つ。   FIG. 18 is a diagram showing a display example of the sales management item list display area 31. In the sales management item list display area 31, a sales management item list is displayed. The sales management item list is calculated when an item name of the sales management item stored in the basic table described in FIG. 7 and a calculation formula (calculation formula) that associates the sales management item with the read item are determined. Has a field that displays an expression.

図19は,OCR読取定義一覧表示領域32の表示例を示す図である。OCR読取定義一覧表示領域32には,読取項目算出部13により抽出した読取項目,読取項目の位置(領域情報)が設定されていることを示す情報(項目領域),読取項目に対応する金額欄の位置(領域情報)が設定されていることを示す情報(金額領域)が表示される。   FIG. 19 is a diagram showing a display example of the OCR reading definition list display area 32. In the OCR reading definition list display area 32, the reading item extracted by the reading item calculation unit 13, information (item area) indicating that the position (area information) of the reading item is set, and an amount column corresponding to the reading item Information (amount area) indicating that the position (area information) is set is displayed.

レシート画像表示領域33には,読取機10で読み取ったレシートの画像(イメージデータ)が表示される。この領域の表示においては,スクロール,拡大/縮小などの機能が設けられている。   In the receipt image display area 33, an image (image data) of a receipt read by the reader 10 is displayed. In the display of this area, functions such as scrolling and enlargement / reduction are provided.

マーカー定義一覧表示領域34は,レシート内に同一名称の読取項目が複数存在する場合に,読取項目を特定するためのユニークなマーカー項目を定義するための情報が表示される。また,計算式入力用領域35には,入力された売上管理項目と読取項目とを対応づける計算式が表示される。   The marker definition list display area 34 displays information for defining a unique marker item for specifying a reading item when there are a plurality of reading items with the same name in the receipt. In the calculation formula input area 35, a calculation formula for associating the input sales management item and the read item is displayed.

ステップS203で,以上のような定義入力画面30の初期画面を表示した後,ステップS204で,操作員の入力を待ち合わせる。ステップS205では,すべての項目の入力が終わると,操作員が「定義確定」のキーを押すので,その入力があったかどうかを判定し,「定義確定」の指示が入力されたならば,ステップS208へ進む。   In step S203, the initial screen of the definition input screen 30 as described above is displayed, and in step S204, an operator input is waited for. In step S205, when all the items have been input, the operator presses the “define definition” key. Therefore, it is determined whether or not the input has been made, and if the “define definition” instruction is input, step S208 is performed. Proceed to

「定義確定」の指示がない場合には,ステップS206へ進み,読取項目の変更処理を行う。   If there is no “define definition” instruction, the process advances to step S206 to change the read item.

定義入力画面30の初期画面では,OCR読取定義一覧表示領域32は,図19に示すように,読取項目算出部13により自動で付与される読取項目ID(例えば,a)の表示と,読取情報から抽出された読取項目,項目領域,金額領域の表示が行われている。   On the initial screen of the definition input screen 30, the OCR reading definition list display area 32 displays the reading item ID (for example, a) automatically given by the reading item calculation unit 13 and the reading information, as shown in FIG. The reading item, item area, and monetary area extracted from are displayed.

レシート画像表示領域33には,図20(A)に示すようなレシート画像が表示されているとする。   Assume that a receipt image as shown in FIG. 20A is displayed in the receipt image display area 33.

ここで,操作員が,OCR読取定義一覧に表示された読取項目の「総売上」を「純売上」に変更したいとする。この場合に,操作員は,レシート画像表示領域33における画像上で,マウス等の入力装置4により,「純売上」の文字列部分をポイントして,ドラッグまたはクリックする。入力データ処理部15の読取項目取得部151は,この入力を検知し,レシート画像における「純売上」の文字列を枠線で囲んで表示する。このとき,例えば図20(B)の左側の図に示す矢印のように,「純売上」の文字列部分を大きくドラッグしても,枠線の自動調整により,図20(B)の右側の図に示す点線枠のように必要最小限の大きさで枠線が表示される。なお,枠線で囲む領域の大きさの自動調整は,図5に示す読取情報を参照することにより,行うことができる。このようにして選択された文字項目の領域の位置情報が読取情報から抽出され,内部メモリに記憶される。   Here, it is assumed that the operator wants to change “total sales” of the reading items displayed in the OCR reading definition list to “net sales”. In this case, the operator points and drags or clicks on the character string portion of “net sales” with the input device 4 such as a mouse on the image in the receipt image display area 33. The read item acquisition unit 151 of the input data processing unit 15 detects this input, and displays the character string of “net sales” in the receipt image surrounded by a frame line. At this time, for example, as shown by the arrow in the left diagram of FIG. 20B, even if the character string portion of “net sales” is largely dragged, the right side of FIG. A frame line is displayed with a minimum necessary size as shown by a dotted line frame in the figure. Note that the automatic adjustment of the size of the area surrounded by the frame line can be performed by referring to the reading information shown in FIG. The position information of the area of the character item selected in this way is extracted from the read information and stored in the internal memory.

定義入力画面表示部14は,読取項目算出部13を介して,読取情報記憶部102から,操作員の入力操作により選択された文字項目に関連する情報を,変更された読取項目としてOCR読取定義一覧に設定する。   The definition input screen display unit 14 reads the information related to the character item selected by the operator's input operation from the reading information storage unit 102 via the reading item calculation unit 13 as the changed reading item. Set to list.

以上の読取項目の定義処理に続いて,ステップS207では,演算定義処理が行われる。演算定義処理は,売上管理項目とステップS206で定義された1または複数の読取項目との対応関係を示す計算式を定義する処理である。詳しくは後述する。その後,ステップS204へ戻り,同様に処理を繰り返す。   Subsequent to the reading item definition processing described above, in step S207, calculation definition processing is performed. The calculation definition process is a process for defining a calculation formula indicating the correspondence between the sales management item and one or more reading items defined in step S206. Details will be described later. Then, it returns to step S204 and repeats a process similarly.

「定義確定」の指示があった場合,ステップS208へ進み,ステップS208では,読取項目の再チェックを行う。ここでは,読取項目の項目領域について再度,文字認識を行う。または,図4(B)で説明した画像データ記憶部101に格納されている認識文字データの中の読取項目の各認識文字に対する相違度の情報から,認識の精度を判定し,誤認識が生じていないかどうか,または認識の精度が所定の閾値より悪いかどうかをチェックする。   If there is an instruction for “definition of definition”, the process proceeds to step S208. In step S208, the reading item is rechecked. Here, character recognition is performed again for the item area of the read item. Alternatively, the recognition accuracy is determined based on the difference information for each recognized character of the read item in the recognized character data stored in the image data storage unit 101 described with reference to FIG. It is checked whether or not the recognition accuracy is worse than a predetermined threshold.

ステップS209の判定により,認識エラーがないと判定された場合,または認識の精度が悪くないと判定された場合には,図16のステップS230へ進む。そうでない場合には,ステップS210へ進み,操作員に対して代替項目の入力を促す。代替項目は,本来の読取項目について,認識が困難であるか誤認識の可能性が大きいために,他のレシート項目を代替項目として認識対象とし,その代替項目からの相対位置情報によって,本来の読取項目に対する金額を取得することを目的とした項目である。操作員からの代替項目の入力操作があれば,ステップS211により,代替項目の定義処理を行う。その後に,ステップS204へ戻る。代替項目の具体例については,後に,図を用いて説明する。   If it is determined in step S209 that there is no recognition error, or if it is determined that the recognition accuracy is not bad, the process proceeds to step S230 in FIG. If not, the process proceeds to step S210 to prompt the operator to input a substitute item. Because the substitution item is difficult to recognize or has a high possibility of misrecognition of the original reading item, other receipt items are to be recognized as substitution items, and the original item is determined based on the relative position information from the substitution item. This is an item for the purpose of acquiring the amount of money for the read item. If there is an input operation of the substitute item from the operator, the substitute item definition process is performed in step S211. Thereafter, the process returns to step S204. Specific examples of alternative items will be described later with reference to the drawings.

ステップS202でレシート定義データの参照作成が指定された場合,図15のステップS220へ進み,参照するレシート定義データを手動で選択するか自動で選択するかの指示を入力する。手動で選択する場合,ステップS221へ進む。ステップS221では,既にレシート定義データを作成済みの店舗の店舗コードを指定する情報を入力し,その店舗コードに該当するレシート定義データを定義データ記憶部106から取得し,ステップS226へ進む。   If reference creation of receipt definition data is specified in step S202, the process proceeds to step S220 in FIG. 15, and an instruction is input to select the receipt definition data to be referred to manually or automatically. When selecting manually, it progresses to step S221. In step S221, information specifying a store code of a store for which receipt definition data has already been created is input, and receipt definition data corresponding to the store code is acquired from the definition data storage unit 106, and the process proceeds to step S226.

参照するレシート定義データを自動で選択する場合,ステップS222へ進み,履歴データ記憶部107に格納されている履歴データを参照する。次に,ステップS223では,類似データの有無を判断する。この類似データの有無を判断する処理については,図を用いて後述する。   When the receipt definition data to be referred to is automatically selected, the process proceeds to step S222, and the history data stored in the history data storage unit 107 is referred to. Next, in step S223, the presence / absence of similar data is determined. The process for determining the presence or absence of similar data will be described later with reference to the drawings.

ステップS224の判定により,履歴データ中に,これから作成しようとする店舗のレシート定義データと類似するデータがない場合には,参照作成は不可であるので,ステップS203へ戻り,新規作成と同様な処理を実行する。   If it is determined in step S224 that there is no data similar to the receipt definition data of the store to be created in the history data, reference creation is not possible, so the process returns to step S203, and processing similar to that for new creation is performed. Execute.

履歴データ中に,類似するデータがあると判定された場合には,ステップS225へ進み,その類似した店舗のレシート定義データを取得する。   If it is determined that there is similar data in the history data, the process proceeds to step S225, and receipt definition data of the similar store is acquired.

ステップS226では,ステップS221またはステップS225で取得したレシート定義データから,取得した店舗の読取項目を類推し,定義入力画面30の編集を行う。すなわち,定義入力画面30の初期画面として,OCR読取定義一覧が空欄の画面を表示するのではなく,参照するレシート定義データ中で定義されている読取項目のデータや,売上管理項目一覧における売上管理項目の計算式を埋め込んだ形の画面を作成し,表示する。その後,ステップS204に進む。ステップS204以降の処理は,前述した処理と同様である。これにより,参照作成の場合には,操作員は,参照する店舗のレシート定義データと異なる部分を必要に応じて修正するだけで,新しい店舗のレシート定義データを簡単に作成することができる。   In step S226, the read item of the acquired store is inferred from the receipt definition data acquired in step S221 or step S225, and the definition input screen 30 is edited. That is, as an initial screen of the definition input screen 30, a screen with an empty OCR reading definition list is not displayed, but reading item data defined in the receipt definition data to be referred to and sales management in the sales management item list are displayed. Create and display a screen with the item formula embedded. Thereafter, the process proceeds to step S204. The processing after step S204 is the same as the processing described above. As a result, in the case of reference creation, the operator can easily create receipt definition data for a new store by simply modifying a portion different from the receipt definition data for the store to be referenced as necessary.

上述したステップS209で,読取項目の認識エラーがない,または認識精度が悪くないと判断された場合,図16のステップS230へ進む。ステップS230では,ステップS206で定義された読取項目について,レシート内に同一文字列の項目がないかをチェックする。続く,ステップ231の判定において,同一文字列があると判定された場合には,ステップS233へ進み,同一文字列がないと判定された場合には,ステップS232へ進む。   If it is determined in step S209 described above that there is no reading item recognition error or the recognition accuracy is not bad, the process proceeds to step S230 in FIG. In step S230, the receipt item defined in step S206 is checked for an item of the same character string in the receipt. If it is determined in step 231 that there is an identical character string, the process proceeds to step S233. If it is determined that there is no identical character string, the process proceeds to step S232.

ステップS232では,履歴データを作成した後,処理を終了する。履歴データ作成処理についての詳細は後述する。   In step S232, after the history data is created, the process ends. Details of the history data creation processing will be described later.

同一文字列があった場合,ステップS233により,売上管理項目の読取項目として読み取る文字項目を特定するためのマーカー定義処理を行う。ここでは,精算レシート内で一意の文字項目をマーカー項目とする設定が行われるが,詳しくは後述する。マーカー定義処理の後,ステップS204へ戻り,同様に処理を続ける。   If there is an identical character string, a marker definition process for specifying a character item to be read as a sales management item reading item is performed in step S233. Here, a unique character item is set as a marker item in the payment receipt, which will be described in detail later. After the marker definition process, the process returns to step S204 and continues in the same manner.

図21は,初期画面表示処理(図14のステップS203)の詳細を示すフローチャートである。以下の処理は,読取項目算出部13および定義入力画面表示部14が実行する。   FIG. 21 is a flowchart showing details of the initial screen display process (step S203 in FIG. 14). The following processing is executed by the read item calculation unit 13 and the definition input screen display unit 14.

ステップS301では,読取項目算出部13が,項目辞書記憶部103に格納されている項目辞書を参照し,読取情報記憶部102に格納されている読取情報から,項目辞書の売上管理項目の読取文字列に該当する文字項目を抽出する。さらに,抽出した各文字項目の情報として,文字項目の位置,対応する金額欄への位置関係(相対位置)を取得する。   In step S301, the read item calculation unit 13 refers to the item dictionary stored in the item dictionary storage unit 103, and reads the read character of the sales management item in the item dictionary from the read information stored in the read information storage unit 102. Extract the character items that correspond to the column. Further, as the information of each extracted character item, the position of the character item and the positional relationship (relative position) to the corresponding money amount column are acquired.

ステップS302では,定義入力画面表示部14が,読取項目として抽出した文字項目をOCR読取定義一覧の読取項目に設定する。さらに,各文字項目の項目領域と金額領域に精算レシートに位置(領域情報)の設定があることを示す情報を表示する。   In step S302, the definition input screen display unit 14 sets the character item extracted as a reading item as a reading item in the OCR reading definition list. Further, information indicating that the position (area information) is set in the payment receipt is displayed in the item area and the money area of each character item.

ステップS303では,読取情報から抽出した文字項目中に同じ名称の項目が複数あるかを判断し,同じ名称の項目が複数あれば,ステップS304へ進み,複数なければ処理を終了する。   In step S303, it is determined whether or not there are a plurality of items with the same name in the character items extracted from the read information. If there are a plurality of items with the same name, the process proceeds to step S304.

ステップS304では,マーカー定義処理が必要であることを示すアラームをOCR読取定義一覧の複数の文字項目の読取項目に表示する。   In step S304, an alarm indicating that marker definition processing is necessary is displayed in the reading items of a plurality of character items in the OCR reading definition list.

ステップS305では,読取情報から,複数の同一名称の文字項目があると判断された場合に,精算レシート内で一意である文字項目を抽出する。そして,抽出した文字項目の情報をマーカー項目定義一覧の候補項目に設定し,候補項目ごとの選択用ラジオボタンを表示する。   In step S305, when it is determined from the read information that there are a plurality of character items having the same name, a character item that is unique in the checkout receipt is extracted. The extracted character item information is set as a candidate item in the marker item definition list, and a selection radio button for each candidate item is displayed.

図22は,同じ名称の文字項目が複数存在する場合のOCR読取定義一覧表示領域32とマーカー定義一覧表示領域34の表示例を示す図である。   FIG. 22 is a diagram illustrating a display example of the OCR reading definition list display area 32 and the marker definition list display area 34 when there are a plurality of character items having the same name.

図22(A)に示すOCR読取定義一覧表示領域32には,読取項目として抽出された文字項目「消費税」が複数存在し,重複項目が存在する旨の表示(「複」)が表示される。   In the OCR reading definition list display area 32 shown in FIG. 22A, there are displayed a plurality of character items “consumption tax” extracted as reading items and an indication that there are duplicate items (“duplicate”). The

図22(B)に示すマーカー定義一覧表示領域34には,読取項目算出部13が,読取情報から抽出したマーカー項目の候補となる文字項目と,精算レシート上で項目領域が設定されていることを示す情報(項目領域)と,選択用のラジオボタンを持つ。図22に示す表示例では,「返品明細」の文字項目がマーカー項目として選択されたことを表している。   In the marker definition list display area 34 shown in FIG. 22 (B), the read item calculation unit 13 sets character items that are candidates for marker items extracted from the read information and item areas on the checkout receipt. Information (item area) and a radio button for selection. The display example shown in FIG. 22 indicates that the character item “return details” has been selected as the marker item.

図23は,演算定義処理(図14のステップS207)の詳細を示すフローチャートである。以下の処理は,入力データ処理部15における演算定義部152が実行する。   FIG. 23 is a flowchart showing details of the calculation definition process (step S207 in FIG. 14). The following processing is executed by the calculation definition unit 152 in the input data processing unit 15.

ステップS351では,演算の定義に対する入力を待ち合わせる。入力があれば,ステップS352へ進み,その入力をもとに,演算を定義する売上管理項目と,その演算に使用する読取項目を選択する。読取項目は,読取項目IDの指定によって選択することができる。読取項目の選択は1個でも複数個でもよい。   In step S351, an input for the calculation definition is awaited. If there is an input, the process proceeds to step S352, and based on the input, a sales management item that defines the calculation and a reading item to be used for the calculation are selected. A reading item can be selected by specifying a reading item ID. One or a plurality of reading items may be selected.

ステップS353では,四則演算の演算子を入力し,演算子の選択を行う。なお,%などの算術記号や演算の順序を指定する括弧記号等を用いることもできる。入力する演算子の数は,選択した読取項目の数による。1個の読取項目の場合には,演算子を入力する必要はない。   In step S353, an arithmetic operation operator is input, and the operator is selected. Arithmetic symbols such as% and parenthesis symbols that specify the order of operations can also be used. The number of operators to enter depends on the number of selected reading items. In the case of one reading item, it is not necessary to input an operator.

ステップS354の判定処理により,必要なすべての読取項目および演算子の選択が終了するまで,ステップS351へ戻って同様に処理を繰り返す。   Until the selection of all necessary reading items and operators is completed by the determination process in step S354, the process returns to step S351 and the same process is repeated.

読取項目および演算子の選択が終了したならば,ステップS355では,入力した演算子のチェックを行う。これは,以下のチェックである。
1)定義されていない読取項目IDを使用していないか。
2)使用できない演算子が指定されていないか。
3)設定された計算式を用いて金額を計算した場合に,結果が許容範囲内か。
If the selection of the reading item and the operator is completed, the input operator is checked in step S355. This is the following check.
1) Is an undefined reading item ID used?
2) Is an operator that cannot be used specified?
3) Whether the result is within the allowable range when the amount is calculated using the set formula.

なお,結果が許容範囲内であるかどうかは,実際にレシートの画像データから得られた金額の数値を用いて計算した場合に,基本テーブルに格納されている該当する売上管理項目の下限値から上限値までの範囲に入っているかどうかにより判断される。   Whether or not the result is within the allowable range is calculated from the lower limit value of the corresponding sales management item stored in the basic table when calculated using the numerical value of the amount actually obtained from the image data of the receipt. Judgment is made based on whether it is within the range up to the upper limit.

ステップS356によるチェック結果の判定により,エラーが検出されれば,ステップS351に戻って,読取項目の再選択または演算子の再入力を行う。エラーがなければ,売上管理項目一覧における該当する売上管理項目の計算式の欄に,入力された計算式を表示し,一つの売上管理項目に対する演算定義を終了する。演算定義は,基本的にはすべての売上管理項目に対して行うが,該当する読取項目が存在しない売上管理項目に対しては,未定義であってもよい。   If an error is detected as a result of the check in step S356, the process returns to step S351 to reselect the reading item or re-enter the operator. If there is no error, the input calculation formula is displayed in the calculation formula column of the corresponding sales management item in the sales management item list, and the calculation definition for one sales management item is terminated. Calculation definition is basically performed for all sales management items, but may be undefined for sales management items for which no corresponding read item exists.

図24は,演算定義の例を示している。図24(A)に示すように,OCR読取定義一覧表示領域32には,読取項目の純売上(ID=a)と消費税(ID=b)と金券(ID=c)とが定義されていたとする。ここで,売上管理項目である「総売上」,「商品券」について,それぞれ図24(B)に示すような読取項目との対応関係があった場合,図24(C)に示すように,「総売上」に対して「a+b」の計算式の定義,「商品券」に対して「c」の計算式の定義を行う。この計算式を演算定義として,レシート定義データに設定することにより,店舗が発行する実際のレシートから,売上管理項目の金額を算出することが可能になる。   FIG. 24 shows an example of calculation definition. As shown in FIG. 24A, in the OCR reading definition list display area 32, net sales (ID = a), consumption tax (ID = b), and cash voucher (ID = c) of reading items are defined. Suppose. Here, if the sales management items “total sales” and “gift certificate” have a corresponding relationship with the read items as shown in FIG. 24B, as shown in FIG. Define a calculation formula of “a + b” for “total sales” and a calculation formula of “c” for “gift certificate”. By setting this calculation formula as the operation definition in the receipt definition data, the amount of the sales management item can be calculated from the actual receipt issued by the store.

図25は,ある店舗のレシートと売上管理項目との対応関係が,計算式によって定義されている例を示している。レシートの読取項目は,一般に店舗によって異なるので,テナント管理部門が必要とする売上管理項目と,各店舗のレシートの読取項目との対応関係は,店舗ごとに異なる。しかし,図25に示すように,店舗ごとに計算式を定義することができるので,売上管理項目とレシートの項目との対応づけを柔軟に行うことができる。   FIG. 25 shows an example in which the correspondence between the receipt of a certain store and the sales management item is defined by a calculation formula. Receipt reading items generally differ from store to store, so the correspondence between sales management items required by the tenant management department and receipt reading items at each store differs from store to store. However, as shown in FIG. 25, since a calculation formula can be defined for each store, it is possible to flexibly associate sales management items with receipt items.

図26は,マーカー定義処理(図16のステップS233)の詳細を示すフローチャートである。以下の処理は,入力データ処理部15における複数キーワード設定部153およびマーカー項目設定部154が実行する。   FIG. 26 is a flowchart showing details of the marker definition process (step S233 in FIG. 16). The following processing is executed by the multiple keyword setting unit 153 and the marker item setting unit 154 in the input data processing unit 15.

ステップS401では,OCR読取定義一覧表示領域32中で定義された読取項目に同一名称のものが複数あることを示すアラームを表示して,操作員からのマーカー定義設定入力を待ち合わせる。   In step S401, an alarm indicating that there are a plurality of reading items defined in the OCR reading definition list display area 32 having the same name is displayed, and a marker definition setting input from the operator is waited.

ステップS402では,操作員の入力に対して,マーカー項目の種別を判定する。すなわち,複数の同一名称の文字項目中の読取項目を1つのユニークな文字項目によって特定するか(マーカー項目),または,複数の文字項目によって特定するか(複数キーワード)を判定する。マーカー項目が選択された場合,ステップS403へ進み,複数キーワードが選択された場合,ステップS406へ進む。   In step S402, the type of the marker item is determined in response to the operator input. That is, it is determined whether a reading item in a plurality of character items with the same name is specified by one unique character item (marker item) or specified by a plurality of character items (multiple keywords). If a marker item is selected, the process proceeds to step S403, and if a plurality of keywords are selected, the process proceeds to step S406.

ステップS403では,マーカー項目の指定の入力を待ち合わせる。マーカー定義一覧に表示された各候補項目の選択用ラジオボタンによって選択された文字項目をマーカー項目の指定とする。ステップS404では,指定された候補項目である文字項目の位置を取得する。続いて,ステップS405では,読取項目の位置と指定された候補項目との位置をもとに,同一文字列の読取項目の中で売上管理項目の定義で用いる読取項目が指定されたマーカー項目の上方向にあるのか下方向にあるのかを示す方向と,マーカー項目からの距離とを算出し,読取項目がマーカー項目の上方向にあれば距離を正の値,下方向にあれば距離を負の値で定義する。この距離の値には,実際に日々発行されるレシートにおける読取項目の行位置の変動を考慮して,所定の行数分の距離を余裕分として加算してもよい。   In step S403, a marker item designation input is awaited. The character item selected by the radio button for selecting each candidate item displayed in the marker definition list is designated as the marker item. In step S404, the position of the character item that is the designated candidate item is acquired. Subsequently, in step S405, based on the position of the reading item and the position of the designated candidate item, among the reading items of the same character string, the marker item in which the reading item used in the definition of the sales management item is specified. Calculate the direction indicating whether it is up or down and the distance from the marker item. If the reading item is above the marker item, the distance is a positive value. If the reading item is down, the distance is negative. Define with the value of. A distance corresponding to a predetermined number of lines may be added to the distance value as a margin in consideration of fluctuations in the line position of the reading item in a receipt that is actually issued every day.

図27は,マーカー項目の定義例を示している。図27(A)に示すレシート画像表示領域33に表示されたレシート画像において,実際に売上管理項目として必要になる読取項目が「消費税」であったとする。ここでは,「消費税」という同一名称の項目が複数存在するが,このうち,上方にある「消費税」が読取項目として定義したい項目であったとする。そこで,レシート内でユニークな他の文字項目(この例では「返品明細」)がマーカー項目として指定されていたとする。   FIG. 27 shows a definition example of marker items. In the receipt image displayed in the receipt image display area 33 shown in FIG. 27A, it is assumed that the reading item actually required as a sales management item is “consumption tax”. Here, there are a plurality of items with the same name “consumption tax”, and it is assumed that “consumption tax” above is an item to be defined as a read item. Therefore, it is assumed that another character item unique in the receipt (in this example, “return item”) is designated as the marker item.

すなわち,図27(B)に示すように,マーカー項目が「返品明細」であり,「消費税」への距離が右方向へ「110」,上方向へ「100」であったとする。このとき,マーカー項目「返品明細」からの読取項目「消費税」への距離として,(110,100)を定義する。   That is, as shown in FIG. 27B, it is assumed that the marker item is “return details” and the distance to “consumption tax” is “110” in the right direction and “100” in the upward direction. At this time, (110, 100) is defined as the distance from the marker item “details of return” to the read item “consumption tax”.

マーカー項目は,1個に限らず複数個定義してもよい。図27(C)の例では,「返品明細」をマーカー項目として定義する他に,「売上明細」についてもマーカー項目の定義を行っている。この場合,すべてのマーカー項目の定義による条件を満たした読取項目だけが,該当する読取項目として抽出され,読取項目がマーカー項目定義の条件を一つでも満たさない場合には,「該当読取項目なし」と認定されることになる。   The number of marker items is not limited to one, and a plurality of marker items may be defined. In the example of FIG. 27C, in addition to defining “returned goods details” as a marker item, marker items are also defined for “sales details”. In this case, only the read items that satisfy the conditions defined by the definition of all marker items are extracted as the corresponding read items. If the read item does not satisfy any of the marker item definition conditions, Will be certified.

図26のステップS402で,複数キーワードによって読取項目を特定すると判定された場合,ステップS406へ進み,複数キーワードの選択の入力を待ち合わせる。複数キーワードの選択の入力があれば,ステップS407では,複数キーワードとする文字項目と金額領域の座標を取得し,複数キーワードの定義とする。   If it is determined in step S402 in FIG. 26 that a reading item is specified by a plurality of keywords, the process proceeds to step S406, and input for selecting a plurality of keywords is waited. If there is an input for selecting a plurality of keywords, in step S407, the character items to be used as a plurality of keywords and the coordinates of the amount of money are acquired and defined as a plurality of keywords.

図28に,複数キーワードの設定例を示す。図28の例では,読取項目「総売上」と同一名称の文字項目が,Str#12,Str#22,Str#32の3個存在する。また,その各々に対応する金額の文字列もDat#12「¥168,735」,Dat#22「¥48,195」およびDat#32「¥32,025」の3個存在する。   FIG. 28 shows an example of setting a plurality of keywords. In the example of FIG. 28, there are three character items having the same name as the read item “total sales”, Str # 12, Str # 22, and Str # 32. In addition, there are three character strings corresponding to each of Dat # 12 “¥ 168,735”, Dat # 22 “¥ 48,195”, and Dat # 32 “¥ 32,025”.

ここで必要とする読取項目がStr#12の「総売上」であったとすると,「総売上」の文字列だけではStr#12の読取項目を特定できないので,Str#12を含む複数の文字項目を複数キーワードKey#1として定義する。この例では,「総売上」,「純売上」,「現金在高」および「貸在高」を,複数のキーワードKey#1として定義している。このレシート定義データでは,項目属性#1として複数キーワードを示す「3」を定義し,読取文字#1として「総売上」,「純売上」,「現金在高」,「貸在高」を定義する。また,売上管理項目の収集に必要な,金額の文字列Dat#12の金額欄の相対読取位置#1についても,読取項目算出部13により取得した文字列Dat#12の金額欄の相対読取位置をレシート定義データ中に定義する。これによって,レシート中に「総売上」の文字列が複数個存在しても,複数キーワードがユニークであれば,複数キーワードに一致する文字列に含まれる「総売上」の読取項目が特定されることになる。   If the read item required here is “total sales” of Str # 12, the read item of Str # 12 cannot be specified only by the character string of “total sales”. Therefore, a plurality of character items including Str # 12 are included. Is defined as a plurality of keywords Key # 1. In this example, “total sales”, “net sales”, “cash balance”, and “lending balance” are defined as a plurality of keywords Key # 1. In this receipt definition data, “3” indicating a plurality of keywords is defined as item attribute # 1, and “total sales”, “net sales”, “cash balance”, and “loan amount” are defined as read character # 1. To do. The relative reading position # 1 of the amount column of the character string Dat # 12 necessary for collecting the sales management item is also relative to the relative reading position # 1 of the amount column of the character string Dat # 12 acquired by the reading item calculation unit 13. Is defined in the receipt definition data. As a result, even if there are a plurality of character strings of “total sales” in the receipt, if multiple keywords are unique, the reading item of “total sales” included in the character string matching the plurality of keywords is specified. It will be.

図29は,代替項目の設定例を示す図である。前述した図14のステップS210,S211において,代替項目処理部155が行う処理について説明する。   FIG. 29 is a diagram illustrating an example of setting alternative items. Processing performed by the alternative item processing unit 155 in steps S210 and S211 of FIG. 14 described above will be described.

今,図29(A)に示すように,OCR読取定義一覧表示領域32において,消費税の定義が行われ,また,その項目領域についても座標情報が取得されていたとする。ここで,図29(A)に示すレシート画像表示領域33の表示元となったレシートの原画像について,再度この部分をOCR処理によって文字認識する。実際に操作員が入力した「消費税」と認識された場合には,正しいので代替項目の処理は行わない。違う文字に認識されて認識エラーがあった場合には,図29(B)に示すように,「読取困難な文字列です。代替項目を設定してください。」という代替項目の入力を促す警告メッセージを出力する。なお,実際にOCR処理を行うのではなく,図4(B)に示した認識文字データから,認識精度を推定してもよい。   Now, as shown in FIG. 29A, it is assumed that the consumption tax is defined in the OCR reading definition list display area 32 and the coordinate information is also acquired for the item area. Here, for the original image of the receipt that is the display source of the receipt image display area 33 shown in FIG. 29A, this portion is again recognized by OCR processing. If it is actually recognized as “consumption tax” entered by the operator, the substitute item is not processed because it is correct. If there is a recognition error due to recognition of a different character, as shown in FIG. 29 (B), a warning prompting the user to enter an alternative item “This is a hard-to-read character string. Set an alternative item.” Output a message. Instead of actually performing the OCR process, the recognition accuracy may be estimated from the recognized character data shown in FIG.

操作員は,図29(B)に示すような警告メッセージが出力された場合,図29(C)のレシート画像表示領域33における「小計」のような読取が容易なレシート項目を代替項目として指定する。代替項目は,本来の読取項目(消費税)の上側であっても下側であってもどちらでもよいが,行が近いほうが望ましい。この例のように,「小計」が代替項目として指定されると,消費税に対応する金額「¥7,234」の相対読取位置の情報は,レシート定義データ内において,「消費税」からの相対位置ではなく,読取が容易な「小計」からの相対位置が定義される。   When the warning message as shown in FIG. 29B is output, the operator designates an easy-to-read receipt item such as “subtotal” in the receipt image display area 33 in FIG. 29C as an alternative item. To do. The substitute item may be either above or below the original reading item (consumption tax), but it is desirable that the line is close. As in this example, when “subtotal” is specified as an alternative item, the information on the relative reading position of the amount “¥ 7,234” corresponding to the consumption tax is included in the receipt definition data from “consumption tax”. Relative position from “subtotal” that is easy to read is defined, not relative position.

また,代替項目によって定義されたことを示すために,OCR読取定義一覧表示領域32内では,図29(D)に示すように,代替項目「小計」と本来の読取項目「消費税」とが所定の区切記号「!」で連結されて表示される。レシート定義データ内においても,図9(B)に示すように,読取文字が「小計!消費税」と定義され,代替項目によって定義されたことが示される。   Further, in order to show that it is defined by the substitute item, in the OCR reading definition list display area 32, as shown in FIG. 29D, the substitute item “subtotal” and the original reading item “consumption tax” are displayed. They are displayed concatenated with a predetermined separator “!”. Also in the receipt definition data, as shown in FIG. 9B, the read character is defined as “subtotal! Consumption tax”, which indicates that it is defined by an alternative item.

図30は,類似データの有無を判断する処理(図15のステップS223)の詳細を示すフローチャートである。   FIG. 30 is a flowchart showing details of the process for determining the presence or absence of similar data (step S223 in FIG. 15).

新しい店舗のレシート定義データの作成において,既に作成済みのレシート定義データを参照して作成に利用する場合に,履歴データから類似するレシート定義データを自動抽出する処理を行うために,類似データの有無を判断する。まず,ステップS501では,店舗マスタ105を参照する。また,ステップS502では,履歴データ記憶部107に格納された履歴データを参照する。   When creating receipt definition data for a new store, whether or not there is similar data in order to automatically extract similar receipt definition data from history data when referring to already created receipt definition data Judging. First, in step S501, the store master 105 is referred to. In step S502, the history data stored in the history data storage unit 107 is referred to.

ステップS501,S502で参照した結果,新たにレシート定義データを作成する新規店舗の業種コードと履歴データ中の業種コードとが等しく,かつ,新規店舗のPOSシステム情報と履歴データ中のPOSシステム情報とが等しいものがあるかどうかを,ステップS503およびステップS504で判定する。判定した結果,どちらも等しいものが存在した場合,ステップS506へ進む。どちらも等しいものが存在しない場合には,ステップS505へ進み,判断結果を「類似性無し」とする。   As a result of referring to steps S501 and S502, the business type code of the new store that newly creates receipt definition data is the same as the business type code in the history data, and the POS system information in the new store and the POS system information in the history data Are determined in steps S503 and S504. As a result of the determination, if both are equal, the process proceeds to step S506. If neither is equal, the process proceeds to step S505, and the determination result is “no similarity”.

一方,ステップS506では,「類似性有り」と判断し,ステップS507では,履歴データ(辞書部)を参照する。ステップS508では,履歴データ(辞書部)を参照した結果から,売上管理項目に該当する読取項目を類推する。   On the other hand, in step S506, it is determined that “similarity exists”, and in step S507, history data (dictionary part) is referred to. In step S508, the reading item corresponding to the sales management item is inferred from the result of referring to the history data (dictionary part).

図31は,履歴データ作成処理(図16のステップS232)の詳細を示すフローチャートである。   FIG. 31 is a flowchart showing details of the history data creation process (step S232 in FIG. 16).

ステップS601では,新しくレシート定義データを作成した店舗の店舗コードから店舗マスタ105を参照する。ステップS602では,店舗マスタ105から該当する業種コード,POSシステム情報,精算レシート情報を取得する。ステップS603では,作成したレシート定義データから項目情報,演算情報を取得する。ステップS604では,図12および図13に示すような履歴データと履歴データの辞書部とを作成し,履歴データ記憶部107に格納する。   In step S601, the store master 105 is referred to from the store code of the store where the receipt definition data is newly created. In step S602, the corresponding business type code, POS system information, and payment receipt information are acquired from the store master 105. In step S603, item information and calculation information are acquired from the created receipt definition data. In step S604, history data and a history data dictionary as shown in FIGS. 12 and 13 are created and stored in the history data storage unit 107.

以上のレシート定義データを作成する処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。   The processing for creating the receipt definition data described above can be realized by a computer and a software program, and the program can be recorded on a computer-readable recording medium or provided through a network.

1 レシート定義データ作成装置
10 読取機
11 画像データ読込部
12 画像データ解析部
13 読取項目算出部
14 定義入力画面表示部
15 入力データ処理部
151 読取項目取得部
152 演算定義部
153 複数キーワード設定部
154 マーカー項目設定部
155 代替項目処理部
16 定義データ作成部
17 定義データ解析部
18 履歴データ作成部
101 画像データ記憶部
102 読取情報記憶部
103 項目辞書記憶部
104 基本データ記憶部
105 店舗マスタ
106 定義データ記憶部
107 履歴データ記憶部
2 レシート
3 表示装置
4 入力装置
DESCRIPTION OF SYMBOLS 1 Receipt definition data creation apparatus 10 Reader 11 Image data reading part 12 Image data analysis part 13 Reading item calculation part 14 Definition input screen display part 15 Input data processing part 151 Reading item acquisition part 152 Calculation definition part 153 Multiple keyword setting part 154 Marker item setting unit 155 Alternative item processing unit 16 Definition data creation unit 17 Definition data analysis unit 18 History data creation unit 101 Image data storage unit 102 Reading information storage unit 103 Item dictionary storage unit 104 Basic data storage unit 105 Store master 106 Definition data Storage unit 107 History data storage unit 2 Receipt 3 Display device 4 Input device

Claims (6)

複数の店舗それぞれが発行したレシートの画像から特定の基本管理項目からなる基本管理データを収集するレシート認識システムで実行される前記店舗ごとのレシートの画像認識処理に用いるレシート定義データを作成するレシート定義データ作成装置であって,
基本管理項目の情報を記憶する基本データ記憶手段と,
前記基本管理項目に対応して前記レシートから読み込まれる項目の名称を示す項目辞書を記憶する項目辞書記憶手段と,
レシートのイメージデータを記憶する画像データ記憶手段と,
前記イメージデータに対して文字認識処理を行い,認識した文字列の前記イメージデータ上での位置情報を取得し,前記認識した文字列が金額を表示する金額欄であるか前記金額欄以外の文字項目であるかを判定し,前記文字項目と予め設定した位置関係を持つ金額欄とを対応付け,前記文字項目,前記対応付けた前記金額欄,および前記文字項目と前記対応付けた金額欄との位置関係を含む読取情報を作成する画像データ解析手段と,
前記項目辞書を参照して,前記読取情報から前記基本管理項目に対応する項目の名称と一致する文字項目の情報を抽出する読取項目算出手段と,
レシート定義データの情報として,前記基本管理項目の情報,前記基本管理項目について前記イメージデータから読み取る読取項目および前記イメージデータを表示する定義入力画面を生成し,前記読取情報から抽出した文字項目の情報を前記読取項目の情報に設定した前記定義入力画面を表示する定義入力画面表示手段とを備える
ことを特徴とするレシート定義データ作成装置。
Receipt definition for creating receipt definition data used for receipt image recognition processing for each store executed in a receipt recognition system that collects basic management data consisting of specific basic management items from receipt images issued by each of a plurality of stores A data creation device,
Basic data storage means for storing information on basic management items;
Item dictionary storage means for storing an item dictionary indicating names of items read from the receipt corresponding to the basic management items;
Image data storage means for storing receipt image data;
Character recognition processing is performed on the image data, position information of the recognized character string on the image data is acquired, and the recognized character string is a money amount column for displaying a monetary amount or a character other than the monetary amount column Determining whether the item is an item, associating the character item with an amount field having a preset positional relationship, the character item, the associated amount field, and the character item and the associated amount field; Image data analysis means for creating read information including the positional relationship of
Reading item calculation means for referring to the item dictionary and extracting character item information that matches the name of the item corresponding to the basic management item from the reading information;
As the receipt definition data information, the basic management item information, the reading item read from the image data for the basic management item, and the definition input screen for displaying the image data are generated, and the character item information extracted from the reading information And a definition input screen display means for displaying the definition input screen in which the information of the read item is set.
請求項1記載のレシート定義データ作成装置において,
前記読取項目算出手段が,前記読取情報から前記基本管理項目に対応する項目の名称と一致する複数の文字項目の情報を抽出した場合に,前記読取情報から前記イメージデータにおいて一意の文字項目を抽出し,
前記定義入力画面表示手段は,前記一意の文字項目の情報を,前記読取項目を特定するマーカー項目の候補項目の情報に設定した前記定義入力画面を表示する
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to claim 1,
When the reading item calculation unit extracts, from the reading information, information on a plurality of character items that matches the name of the item corresponding to the basic management item, a unique character item in the image data is extracted from the reading information. And
The definition input screen display means displays the definition input screen in which the information of the unique character item is set to the information of the candidate item of the marker item that identifies the reading item. .
請求項1または請求項2に記載のレシート定義データ作成装置において,
前記レシート定義データから前記基本管理項目の読取項目に設定されている文字項目を抽出し,前記抽出した文字項目の名称を前記項目辞書の前記基本管理項目に対応する項目の名称に登録する定義データ解析手段を備える
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to claim 1 or 2,
Definition data for extracting the character item set in the reading item of the basic management item from the receipt definition data and registering the name of the extracted character item in the item name corresponding to the basic management item of the item dictionary A receipt definition data creation device comprising an analysis means.
複数の店舗それぞれが発行したレシートの画像から特定の基本管理項目からなる基本管理データを収集するレシート認識システムで実行される前記店舗ごとのレシートの画像認識処理に用いるレシート定義データを作成するために,記憶手段を備えるコンピュータを,
前記記憶手段に記憶されているレシートのイメージデータに対して文字認識処理を行い,認識した文字列の前記イメージデータ上での位置情報を取得し,
前記認識した文字列が金額を表示する金額欄であるか前記金額欄以外の文字項目であるかを判定し,前記文字項目と予め設定した位置関係を持つ金額欄とを対応付け,前記文字項目,前記対応付けた前記金額欄,および前記文字項目と前記対応付けた金額欄との位置関係を含む読取情報を作成し,
前記記憶手段に記憶されている,基本管理項目に対応して前記レシートから読み込まれる項目の名称を示す項目辞書を参照して,前記読取情報から前記基本管理項目に対応する項目の名称と一致する文字項目の情報を抽出し,
レシート定義データの情報として,基本管理データを構成する基本管理項目の情報,前記基本管理項目について前記イメージデータから読み取る読取項目および前記イメージデータを表示する定義入力画面を生成する際に,前記読取情報から抽出した文字項目の情報を前記読取項目の情報に設定した前記定義入力画面を表示する,
処理を実行させるためのレシート定義データ作成プログラム。
To create receipt definition data used for receipt image recognition processing for each store executed in a receipt recognition system that collects basic management data consisting of specific basic management items from receipt images issued by a plurality of stores , A computer with storage means,
Character recognition processing is performed on the receipt image data stored in the storage means, and position information of the recognized character string on the image data is obtained,
It is determined whether the recognized character string is an amount field for displaying an amount or a character item other than the amount field, the character item is associated with an amount field having a preset positional relationship, and the character item , Creating the read information including the positional relationship between the associated amount field, and the character item and the associated amount field,
Refers to an item dictionary stored in the storage means that indicates the name of an item read from the receipt corresponding to the basic management item, and matches the name of the item corresponding to the basic management item from the read information. Extract information about character items,
As the receipt definition data information, the basic management item information constituting the basic management data, the reading item to be read from the image data for the basic management item, and the definition input screen for displaying the image data are generated. Display the definition input screen in which the information of the character item extracted from the information of the reading item is set;
Receipt definition data creation program for executing processing.
請求項4記載のレシート定義データ作成プログラムにおいて,
前記読取情報から前記基本管理項目に対応する項目の名称と一致する文字項目の情報を抽出する処理において,前記基本管理項目に対応する項目の名称と一致する複数の文字項目の情報を抽出した場合に,前記読取情報から前記イメージデータにおいて一意の文字項目を抽出し,
前記定義入力画面を表示する処理において,前記一意の文字項目の情報を,前記読取項目を特定するマーカー項目の候補項目の情報に設定した前記定義入力画面を表示する
ことを特徴とするレシート定義データ作成プログラム。
In the receipt definition data creation program according to claim 4,
When extracting information on a plurality of character items that match the name of the item corresponding to the basic management item in the process of extracting information on the character item that matches the name of the item corresponding to the basic management item from the read information In addition, a unique character item in the image data is extracted from the read information,
In the process of displaying the definition input screen, the definition input screen is displayed in which the information of the unique character item is set to the information of the candidate item of the marker item that identifies the read item. Creation program.
請求項4または請求項5に記載のレシート定義データ作成プログラムにおいて,
前記レシート定義データから前記基本管理項目の読取項目に設定されている文字項目を抽出し,抽出した文字項目の名称を前記項目辞書の基本管理項目に対応する項目の名称に登録する処理を,
前記コンピュータに実行させるためのレシート定義データ作成プログラム。
In the receipt definition data creation program according to claim 4 or 5,
Extracting a character item set in the reading item of the basic management item from the receipt definition data and registering the name of the extracted character item in the item name corresponding to the basic management item of the item dictionary;
A receipt definition data creation program to be executed by the computer.
JP2012182806A 2012-08-22 2012-08-22 Receipt definition data creation device and program Active JP5702342B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012182806A JP5702342B2 (en) 2012-08-22 2012-08-22 Receipt definition data creation device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012182806A JP5702342B2 (en) 2012-08-22 2012-08-22 Receipt definition data creation device and program

Publications (2)

Publication Number Publication Date
JP2014041442A true JP2014041442A (en) 2014-03-06
JP5702342B2 JP5702342B2 (en) 2015-04-15

Family

ID=50393667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012182806A Active JP5702342B2 (en) 2012-08-22 2012-08-22 Receipt definition data creation device and program

Country Status (1)

Country Link
JP (1) JP5702342B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014137605A (en) * 2013-01-15 2014-07-28 Fujitsu Marketing Ltd Receipt definition data generation device and program thereof
JP2016126356A (en) * 2014-12-26 2016-07-11 ブラザー工業株式会社 Image processing program, image processing method, and image processing apparatus
US10146995B2 (en) 2015-12-28 2018-12-04 Seiko Epson Corporation Storage medium storing a program, information processing device, and control method of an information processing device for keyword and relationship-based word detection
JP6894615B1 (en) * 2020-08-20 2021-06-30 株式会社丸井グループ Sales management server
JP2022013441A (en) * 2020-07-03 2022-01-18 株式会社リゾーム Notification method and notification system for specific numerical values from shops
JP7358838B2 (en) 2019-08-21 2023-10-11 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161436A (en) * 1994-12-06 1996-06-21 Toshiba Corp Receipt reader
JPH11265409A (en) * 1998-03-18 1999-09-28 Nec Software Ltd Housekeeping book processor
JP2000331012A (en) * 1999-05-19 2000-11-30 Oki Electric Ind Co Ltd Electronic document retrieval method
JP2008234586A (en) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd Consumption information acquiring terminal, consumption information acquiring server and household account book management device
JP2011150466A (en) * 2010-01-20 2011-08-04 Fujitsu Ltd Device, program and method for recognizing character string
JP2012133507A (en) * 2010-12-21 2012-07-12 Fujitsu Marketing Ltd Receipt data collation support apparatus and receipt data collation support program
JP2013041388A (en) * 2011-08-15 2013-02-28 Fujitsu Marketing Ltd Receipt definition data generation device and program therefor

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161436A (en) * 1994-12-06 1996-06-21 Toshiba Corp Receipt reader
JPH11265409A (en) * 1998-03-18 1999-09-28 Nec Software Ltd Housekeeping book processor
JP2000331012A (en) * 1999-05-19 2000-11-30 Oki Electric Ind Co Ltd Electronic document retrieval method
JP2008234586A (en) * 2007-03-23 2008-10-02 Nomura Research Institute Ltd Consumption information acquiring terminal, consumption information acquiring server and household account book management device
JP2011150466A (en) * 2010-01-20 2011-08-04 Fujitsu Ltd Device, program and method for recognizing character string
JP2012133507A (en) * 2010-12-21 2012-07-12 Fujitsu Marketing Ltd Receipt data collation support apparatus and receipt data collation support program
JP2013041388A (en) * 2011-08-15 2013-02-28 Fujitsu Marketing Ltd Receipt definition data generation device and program therefor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014137605A (en) * 2013-01-15 2014-07-28 Fujitsu Marketing Ltd Receipt definition data generation device and program thereof
JP2016126356A (en) * 2014-12-26 2016-07-11 ブラザー工業株式会社 Image processing program, image processing method, and image processing apparatus
US10146995B2 (en) 2015-12-28 2018-12-04 Seiko Epson Corporation Storage medium storing a program, information processing device, and control method of an information processing device for keyword and relationship-based word detection
JP7358838B2 (en) 2019-08-21 2023-10-11 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program
JP2022013441A (en) * 2020-07-03 2022-01-18 株式会社リゾーム Notification method and notification system for specific numerical values from shops
JP6894615B1 (en) * 2020-08-20 2021-06-30 株式会社丸井グループ Sales management server
JP2022035068A (en) * 2020-08-20 2022-03-04 株式会社丸井グループ Sales management server

Also Published As

Publication number Publication date
JP5702342B2 (en) 2015-04-15

Similar Documents

Publication Publication Date Title
JP5385349B2 (en) Receipt definition data creation device and program thereof
US10366123B1 (en) Template-free extraction of data from documents
JP5702342B2 (en) Receipt definition data creation device and program
US10248858B2 (en) Multi-page document recognition in document capture
JP6871840B2 (en) Calculator and document identification method
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
JP6100532B2 (en) Receipt definition data creation device and program thereof
RU2679209C2 (en) Processing of electronic documents for invoices recognition
US10671805B2 (en) Digital processing and completion of form documents
JP5216890B2 (en) Receipt data recognition device and program thereof
EP3779782A1 (en) Image processing device, image processing method, and storage medium for storing program
JP2012221183A (en) Receipt data recognition device and program therefor
EP3779781A1 (en) Image processing device, image processing method, and storage medium on which program is stored
JP2013164740A (en) Accounting information reading system, accounting information reading method, and program
JP2012194862A (en) Information processing device, program, and data extraction method
CN106056418A (en) Invoice submission method, device and system
JP2016192223A (en) Accounting information reading system and program
JP2019191665A (en) Financial statements reading device, financial statements reading method and program
KR101606788B1 (en) Method of form information management for electronic document-based business processes
US20170032469A1 (en) Transaction slip search method, information processing apparatus, and computer product
CN113626655A (en) Method for extracting information in file, computer equipment and storage device
CN113763143A (en) Auditing processing method, computer equipment and storage device
JP2017151627A (en) Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device
WO2023047570A1 (en) Information processing device, information processing method, and information processing program
JP7473900B2 (en) FORMAT CREATION DEVICE, FORMAT CREATION METHOD, AND FORMAT CREATION PROGRAM

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150219

R150 Certificate of patent or registration of utility model

Ref document number: 5702342

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350