JP2013041388A - Receipt definition data generation device and program therefor - Google Patents

Receipt definition data generation device and program therefor Download PDF

Info

Publication number
JP2013041388A
JP2013041388A JP2011177408A JP2011177408A JP2013041388A JP 2013041388 A JP2013041388 A JP 2013041388A JP 2011177408 A JP2011177408 A JP 2011177408A JP 2011177408 A JP2011177408 A JP 2011177408A JP 2013041388 A JP2013041388 A JP 2013041388A
Authority
JP
Japan
Prior art keywords
receipt
item
definition
data
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011177408A
Other languages
Japanese (ja)
Other versions
JP5385349B2 (en
Inventor
Kazunari Nozaki
一成 野崎
Yasuhiro Umemura
泰広 梅村
Atsushi Miyatake
淳 宮武
Hiroyuki Suzuki
博之 鈴木
Yasuto Watanabe
康人 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Computer Technologies Ltd
Fujitsu Marketing Ltd
Original Assignee
Fujitsu Computer Technologies Ltd
Fujitsu Marketing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Computer Technologies Ltd, Fujitsu Marketing Ltd filed Critical Fujitsu Computer Technologies Ltd
Priority to JP2011177408A priority Critical patent/JP5385349B2/en
Priority to CN201210289710.1A priority patent/CN103150652B/en
Publication of JP2013041388A publication Critical patent/JP2013041388A/en
Application granted granted Critical
Publication of JP5385349B2 publication Critical patent/JP5385349B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To efficiently generate definition data which is necessary to gather sales management data for managing sales of respective tenants from various receipts through character recognition.SOLUTION: A definition input screen display part 12 displays a definition input screen including display of information on sales management items and display of image data on a receipt. An input data processing part 13 inputs read items of the receipt, position information on amount fields corresponding to the read items in the image data, and information on correspondence between the read items and sales management items from the definition input screen. A definition data generation part 14 generates receipt definition data from the information that the input data processing part 13 inputs, and stores the receipt definition data in a definition data storage part 104.

Description

本発明は,レシート定義データ作成装置およびそのプログラムに関し,特に,例えばショッピングモールなどの複数の店舗の売上を管理するために,文字認識により読み取ったレシートデータから必要なデータを正確に抽出するときに必要となる定義データの作成を支援する技術に関するものである。   The present invention relates to a receipt definition data creation device and a program thereof, and more particularly, when managing necessary data from receipt data read by character recognition in order to manage sales of a plurality of stores such as a shopping mall. The present invention relates to a technology that supports creation of necessary definition data.

ショッピングセンター,ショッピングモール等に出店するテナント(店舗を運営する会社など)の店舗を管理するテナント管理部門では,各店舗の一日の売上を収集し,現金売上,クーポン売上,…といった売上内訳(売上管理項目)を作成している。この売上内訳作成の際には,各店舗から提供される精算レシートが集められて,売上管理項目の数値を算出することが行われる。しかし,各店舗から提供される精算レシートの形式は,店舗ごとに導入されているPOSシステムに依存するため,さまざまな形式で作成されているのが現状である。そのため,テナント管理部門が処理する精算レシートは,項目の種類,項目名,印字サイズ,印字字体などにおいて多種多様である。   The tenant management department that manages stores of tenants (such as companies that operate stores) that open stores in shopping centers, shopping malls, etc. collects daily sales for each store, and breakdowns of sales such as cash sales, coupon sales, etc. ( Sales management item). When creating the sales breakdown, payment receipts provided from each store are collected and the numerical value of the sales management item is calculated. However, since the format of the payment receipt provided from each store depends on the POS system installed in each store, it is currently created in various formats. Therefore, the payment receipt processed by the tenant management department has a wide variety of items, item names, print sizes, print fonts, and the like.

例えば,精算レシートの項目の名称について,売上合計,売上計,合計売上,総売上,…等は,同等の内容を示すものであっても,POSシステムによって異なる名称が印字されている。また,出店するテナントの店舗の入れ替えなどが頻繁に行われるため,新たな精算レシートの形式にも対応しなければならない。そのため,テナント管理部門では,精算レシートを統一された売上管理データとして集計する売上集計作業に莫大な労力を要し,そのための人的および時間的負担に多大なコストを要しているのが現状である。   For example, regarding the names of the items on the payment receipt, even though the total sales, total sales, total sales, total sales, etc. indicate the same contents, different names are printed depending on the POS system. In addition, since the tenant's store that opens a store is frequently replaced, a new payment receipt format must also be supported. For this reason, the tenant management department requires a great deal of labor for the sales totaling work for totaling the payment receipts as unified sales management data, and the human and time burden for that is very expensive. It is.

なお,特許文献1には,レシート処理装置が開示されている。このレシート処理装置では,レシートの画像から文字を認識してテキストデータを生成し,テキストデータから所定の文字列を選択し,選択された所定の文字列が含まれる行位置を検出する。そして,検出された行位置に基づいて定まるテキストデータ上の所定の行範囲から行を単位とするラインデータを順に選択し,ラインデータから品目に関わるデータを抽出する。   Note that Patent Document 1 discloses a receipt processing apparatus. In this receipt processing apparatus, text data is generated by recognizing characters from the receipt image, a predetermined character string is selected from the text data, and a line position including the selected predetermined character string is detected. Then, line data in units of lines is sequentially selected from a predetermined line range on the text data determined based on the detected line position, and data relating to the item is extracted from the line data.

また,特許文献2には,罫線がない不定型帳票を含む任意の帳票に対して,人手を介入することなく,自動的に帳票定義を作成する技術が開示されている。この技術では,レシートを画像として読み込み,印紙されている項目を表領域として切り出し,表領域ごとにx座標,y座標を算出し,x座標の度数分布表を作成する。それから位置揃えを判定して,商品欄,個数欄,価格欄を決定することにより,帳票定義を作成する。   Patent Document 2 discloses a technique for automatically creating a form definition for any form including an indefinite form without a ruled line without manual intervention. In this technique, a receipt is read as an image, a stamped item is cut out as a table area, x-coordinate and y-coordinate are calculated for each table area, and a frequency distribution table of x-coordinate is created. Then, the form definition is created by determining the alignment and determining the product field, the number field, and the price field.

特開2004−164218号公報JP 2004-164218 A 特開2006−178802号公報JP 2006-178802 A

前述したような,ショッピングセンター等の各店舗から提供される精算レシート(以下,レシートという)を集計するために,ショッピングセンター等を運営する会社(組織)のテナント管理部門では,従来,事務員が目視でレシートを読み取り,読み取ったデータを手作業でデータ処理装置に入力していた。この売上集計作業の作業量は,店舗数が100店舗以上に及ぶこともあり,しかも毎日行わなければならない作業であるため,非常に負担が大きいものであった。   In the tenant management department of a company (organization) that operates a shopping center or the like, the clerk has traditionally used to collect the payment receipts (hereinafter referred to as receipts) provided by each store such as a shopping center. The receipt was read visually, and the read data was manually input to the data processing device. The work amount of the sales totaling work is very heavy because the number of stores may reach 100 stores or more and must be performed every day.

この負担を軽減するための一案としては,各店舗の売上データ(レシートデータ)を,各店舗の端末からネットワークを介して自動収集することが考えられる。しかし,一般に各店舗は企業体が異なるため,個々にネットワーク開設の許諾を得る必要があり,さらに導入されているシステムによって接続するネットワークの種類やアプリケーションの追加・修正の難易度が異なるなど,解決が困難な問題が存在する。   As a proposal for reducing this burden, it is conceivable to automatically collect sales data (receipt data) of each store from a terminal of each store via a network. However, in general, each store has a different business entity, so it is necessary to obtain permission to open the network individually, and the type of network to be connected and the difficulty of adding / modifying applications differ depending on the installed system. There are difficult problems.

既存のシステムの変更,特に各店舗における端末などの情報機器の変更をできるだけ行わないで,前述した作業負担を軽減する他の案としては,レシートデータを人間が読み取るのではなく,文字画像の認識によって読み取る方法が考えられる。すなわち,各店舗のレシートを,例えばOCR(Optical Character Recognition )機能を有する読取装置,スキャナー等で読み取り,読み取ったレシート項目とその数値データについて売上管理項目に必要なものを抽出し,売上管理データに入力し直す方法である。   Another way to reduce the above-mentioned work load by changing the existing system, especially information devices such as terminals in each store as much as possible, is to recognize character images instead of reading receipt data by humans. The reading method can be considered. That is, the receipt of each store is read by, for example, a reader or scanner having an OCR (Optical Character Recognition) function, and the necessary receipt items and their numerical data are extracted as sales management items, and the sales management data is extracted. This is a method to re-enter.

このように,レシートの文字画像を認識して,売上管理データを自動で作成する場合,売上管理データとして必要な売上管理項目とレシートの読取項目とがどのように対応しているかの対応情報,また,レシートの読取項目の文字列(項目名称)およびその読取項目に対応する金額欄の画像上の位置情報を,レシート定義データとして事前に用意する必要がある。   In this way, when recognizing a character image of a receipt and automatically creating sales management data, correspondence information on how sales management items required as sales management data correspond to read items of receipts, In addition, it is necessary to prepare in advance the receipt definition data as the character string (item name) of the read item of the receipt and the position information on the image of the amount column corresponding to the read item.

このレシート定義データを一度作成して,レシート認識装置に登録すれば,OCR機能を有する読取装置等によりレシート画像を読み取り,その読み取ったレシート画像から売上管理データの作成に必要なレシート項目を抽出し,毎日の売上管理データをある程度自動で収集することができると考えられる。   Once this receipt definition data is created and registered in the receipt recognition device, the receipt image is read by a reading device or the like having an OCR function, and the receipt items necessary for creating sales management data are extracted from the read receipt image. , It is thought that daily sales management data can be collected to some extent automatically.

問題は,このレシート定義データをどのような方法により作成するかである。まず,人手により,レシート定義データを一つずつ入力することが考えられるが,大規模ショッピングモール等では,店舗数が100店舗以上にもなることがざらであり,レシート定義データを人手により入力するのは大変な作業量となる。さらに,ショッピングモール等では,出店する店舗の入れ替えが頻繁にあり,新しい店舗が加入する都度,新しいレシート定義データを人手により入力するのは,煩雑な作業となる。   The problem is how to create this receipt definition data. First, it is conceivable to manually input the receipt definition data one by one. However, in a large-scale shopping mall or the like, the number of stores may be more than 100, and the receipt definition data is manually input. This is a huge amount of work. Furthermore, in a shopping mall or the like, stores that are opened frequently are frequently replaced, and it is troublesome to manually input new receipt definition data every time a new store joins.

そこで,レシート定義データをできるだけ簡単に作成することができるコンピュータによる支援技術が望まれるが,特許文献2のレシート画像から自動的に帳票定義を作成する技術は,本発明が対象とするようなケースでは不十分であり,次の理由により用いることができない。   Therefore, a computer-aided technology capable of creating receipt definition data as easily as possible is desired. However, the technology for automatically creating a form definition from the receipt image of Patent Document 2 is a case that is covered by the present invention. Is insufficient and cannot be used for the following reasons.

(1)特許文献2では,テナント部門が必要とする各店舗の売上の管理に共通する特定の売上管理項目群からなる売上管理データがまったく考慮されていない。   (1) In Patent Document 2, sales management data including a specific group of sales management items common to sales management of each store required by the tenant department is not considered at all.

(2)また,特許文献2の技術では,個々のレシートごとの項目定義情報の作成は可能であるが,レシートに印字されている全ての項目を対象としており,必要な項目だけを選択することはできない。   (2) Also, with the technology of Patent Document 2, it is possible to create item definition information for each receipt, but all items printed on the receipt are targeted, and only the necessary items must be selected. I can't.

(3)また,特にテナント管理部門が必要とする売上管理項目は,各店舗のレシートに印字されたレシート項目の項目名称と一致するとは限らず,また,必ずしも売上管理項目とレシート項目とが,一対一に対応しているとは限らない。   (3) In addition, the sales management items particularly required by the tenant management department do not always match the item names of the receipt items printed on the receipts of each store, and the sales management items and the receipt items are not necessarily It does not necessarily correspond one-on-one.

図27は,売上管理項目とレシート項目との対応関係の例を示す図である。   FIG. 27 is a diagram illustrating an example of a correspondence relationship between sales management items and receipt items.

テナント管理部門が必要とする売上管理項目は,例えば図27(A)に示すように,「現金売上」,「掛売上」,「クレジット売上」,……,「純売上」というような,各店舗に共通の統一された項目である。図27(B)に示すレシートでは,第14行目の「現金売上金額」が,第1番目の売上管理項目「現金売上」に対応しており,第2番目の売上管理項目「掛売上」に対応するレシート項目はなく,第18行目の「その他金券金額」が,第3番目の売上管理項目「クレジット売上」に対応している。   For example, as shown in FIG. 27A, the sales management items required by the tenant management department are “cash sales”, “payment sales”, “credit sales”,. It is a unified item common to stores. In the receipt shown in FIG. 27B, the “cash sales amount” on the 14th line corresponds to the first sales management item “cash sales”, and the second sales management item “overtime sales”. There is no receipt item corresponding to, and the “other voucher amount” on the 18th line corresponds to the third sales management item “credit sales”.

一方,図示省略するが,他の店舗のレシートでは,例えばレシート項目「日報上現金有高」とレシート項目「感謝カード」の金額を加算したものが,第1番目の売上管理項目「現金売上」に対応しており,レシート項目「日報上掛売上」が,第2番目の売上管理項目「掛売上」に対応しており,…というように,各売上管理項目とレシート項目との対応関係が店舗ごとに全く異なる。   On the other hand, although not shown in the drawings, in the receipt of another store, for example, the sum of the receipt item “cash amount on daily report” and the receipt item “thank you card” is the first sales management item “cash sales”. The receipt item “Daily Overtime Sales” corresponds to the second sales management item “Overhead Sales”, and so on, the correspondence between each sales management item and the receipt item is Every store is completely different.

本発明は,このような背景において,売上管理データをレシートの認識により収集するためのレシート定義データを簡易に作成するための手段を提供することを目的とする。すなわち,本発明は,ショッピングモール等の複数の店舗から出力される形式の異なるレシートを読み込み,必要な売上管理項目だけを正確かつ効率的に取得するためのレシート定義データを簡易に効率よく作成する手段を提供することを目的としている。   In view of such a background, an object of the present invention is to provide means for easily creating receipt definition data for collecting sales management data by recognition of a receipt. That is, the present invention reads receipts of different formats output from a plurality of stores such as shopping malls, and easily and efficiently creates receipt definition data for acquiring only necessary sales management items accurately and efficiently. It aims to provide a means.

上記課題を解決するための本発明の概要は,以下のとおりである。なお,以下ではレシートから収集する各店舗に共通な特定の基本管理項目として,売上管理項目を用いる場合を例に説明する。
(1)売上管理データを収集するためのレシート定義データの作成対象となる店舗が発行したレシートを画像として読み込み,画面上に表示し,画面操作によりレシート定義データを作成する。
(2)このとき,あらかじめ定められた必要な売上管理項目(精算項目ともいう)を画面に表示し,その項目ごとにレシートのイメージデータ上で対応する読取項目(レシート項目ともいう)を,マウス等の入力装置によるポイント操作またはドラッグ操作等により選択させ,位置情報を取得してレシート定義データを作成する。なお,マウス等でドラッグする場合には,厳密である必要はなく,該当する項目上のどこかにあればよい。例えば,ドラッグされた位置をシステム側で判断して,選択された項目を囲む枠線を自動的に表示し,操作員が正しく指定されたことが確認できるようにする。
(3)選択した項目を読取項目として表示するので,操作員は確認しながら作業ができる。
(4)選択した読取項目は,例えば四則演算の指定により,他の読取項目との演算を可能にする。演算式が指定された場合のその演算式をレシート定義データ内に設定することにより,一つの売上管理項目に複数の読取項目を対応づけることができる。
(5)また,レシート内において,選択した項目と同一名称の項目の存在をチェックする。同一名称の複数の項目が存在する場合,読取項目として特定するための複数のキーワードやマーカー項目(必要な項目位置の基準を定める項目)の設定を促す。
(6)また,読取項目がOCR認識困難(文字の潰れ,文字接触,罫線接触など)と想定される場合に,読取項目に代替するレシート項目を代替項目として定義し,代替項目からの相対位置の金額を認識できるようにする。
(7)また,例えば店舗情報を参照することにより,類似する業務のレシート定義データが既に存在する場合,その既存のレシート定義データを利用して,新しいレシート定義データを作成することを可能とする。
The outline of the present invention for solving the above problems is as follows. In the following, a case where a sales management item is used as a specific basic management item common to each store collected from a receipt will be described as an example.
(1) A receipt issued by a store that is a creation target of receipt definition data for collecting sales management data is read as an image, displayed on a screen, and receipt definition data is created by screen operation.
(2) At this time, the necessary necessary sales management items (also referred to as checkout items) are displayed on the screen, and the corresponding read items (also referred to as receipt items) on the receipt image data are displayed for each item. The selection is made by a point operation or a drag operation using an input device such as the above, and the position information is acquired to generate receipt definition data. When dragging with a mouse or the like, it is not necessary to be exact, and it may be anywhere on the corresponding item. For example, the system determines the dragged position and automatically displays a frame line surrounding the selected item so that the operator can confirm that it has been correctly specified.
(3) Since the selected item is displayed as a read item, the operator can work while confirming.
(4) The selected reading item can be operated with other reading items by specifying four arithmetic operations, for example. When an arithmetic expression is specified, the arithmetic expression is set in the receipt definition data, whereby a plurality of read items can be associated with one sales management item.
(5) Also, the presence of an item having the same name as the selected item is checked in the receipt. When there are a plurality of items having the same name, the user is prompted to set a plurality of keywords and marker items (items that determine the criteria for the necessary item positions) to be specified as read items.
(6) Also, when the read item is assumed to be difficult to recognize OCR (character collapse, character contact, ruled line contact, etc.), a receipt item that replaces the read item is defined as a substitute item, and the relative position from the substitute item To recognize the amount of money.
(7) Also, for example, by referring to store information, when there is already receipt definition data for a similar job, it is possible to create new receipt definition data using the existing receipt definition data. .

詳しくは,本発明は,複数の店舗がそれぞれ発行したレシートの画像を認識することにより,各店舗に共通な特定の基本管理項目からなる基本管理データを収集するレシート認識システムが各店舗ごとのレシートの認識に用いるレシート定義データを作成するレシート定義データ作成装置であって,レシートのイメージデータを含む画像データを記憶する画像データ記憶手段と,前記基本管理項目の情報を記憶する基本データ記憶手段と,前記基本データ記憶手段に記憶された基本管理項目の情報の表示と前記画像データ記憶手段に記憶されたレシートのイメージデータの表示とを含む定義入力画面を表示する定義入力画面表示手段と,前記定義入力画面から,レシートの読取項目と,前記イメージデータにおける前記読取項目に対応する金額欄の位置情報と,前記読取項目と前記基本管理項目との対応情報とを入力する入力データ処理手段と,前記入力データ処理手段が入力した情報に基づき,前記レシートの読取項目,および前記イメージデータにおける前記読取項目に対応する金額欄の位置情報,および前記読取項目と前記基本管理項目との対応情報を含むレシート定義データを作成する定義データ作成手段と,作成されたレシート定義データを記憶する定義データ記憶手段とを備えることを特徴とする。   Specifically, according to the present invention, a receipt recognition system that collects basic management data composed of specific basic management items common to each store by recognizing images of receipts issued by a plurality of stores is provided for each store. A receipt definition data creation device for creating receipt definition data used for recognition of an image, an image data storage means for storing image data including image data of a receipt, and a basic data storage means for storing information on the basic management items Definition input screen display means for displaying a definition input screen including display of information on basic management items stored in the basic data storage means and display of image data of receipts stored in the image data storage means, From the definition input screen, the receipt reading item and the money corresponding to the reading item in the image data Input data processing means for inputting position information of the column, correspondence information between the read item and the basic management item, the read item of the receipt, and the image data based on the information input by the input data processing means Definition data creating means for creating receipt definition data including position information of the amount column corresponding to the read item and correspondence information between the read item and the basic management item, and a definition for storing the created receipt definition data And a data storage means.

また,本発明の一態様においては,さらに,前記定義入力画面は,前記読取項目に対する演算式の入力画面を有し,前記入力データ処理手段は,前記定義入力画面に前記読取項目の演算式が入力された場合に,入力された演算式に従って複数の前記読取項目を一つの前記基本管理項目に対応づける対応情報を作成する手段を有することを特徴とする。   Further, in one aspect of the present invention, the definition input screen further includes an operation expression input screen for the read item, and the input data processing means includes an operation expression for the read item on the definition input screen. It has means for creating correspondence information for associating a plurality of read items with one basic management item according to the inputted arithmetic expression.

また,本発明の他の一態様においては,前記入力データ処理手段は,レシート内に前記読取項目と同一名称の他の項目が存在する場合に,前記読取項目を特定する基準となる複数キーワードまたはマーカー項目を前記定義入力画面から入力する手段を有し,前記定義データ作成手段は,作成するレシート定義データ内の前記読取項目の定義データに前記複数キーワードまたは前記マーカー項目のデータを設定する手段を有することを特徴とする。   In another aspect of the present invention, the input data processing means may include a plurality of keywords or a reference for specifying the reading item when another item having the same name as the reading item exists in a receipt. Means for inputting a marker item from the definition input screen, wherein the definition data creation means comprises means for setting the plurality of keywords or the data of the marker item in the definition data of the reading item in the receipt definition data to be created. It is characterized by having.

また,本発明の他の一態様においては,前記入力データ処理手段は,前記定義入力画面からの前記レシートの読取項目または前記金額欄の位置情報の入力において,前記レシートのイメージデータの表示における入力装置によるポイント操作またはドラッグ操作に対して,該当する読取項目の文字列または金額の文字列の領域を定めるとともに,その領域の大きさを自動調整し,領域を囲む枠線の表示または強調表示によって文字領域を特定する表示を行う手段を有することを特徴とする。   Further, in another aspect of the present invention, the input data processing means is an input for displaying the image data of the receipt in inputting the read item of the receipt or the position information of the amount column from the definition input screen. For the point operation or drag operation by the device, the area of the character string of the corresponding reading item or the character string of the monetary amount is determined, the size of the area is automatically adjusted, and the frame surrounding the area is displayed or highlighted. It has the means to perform the display which specifies a character area, It is characterized by the above-mentioned.

また,本発明の他の一態様においては,前記入力データ処理手段は,入力した前記読取項目について誤認識した場合またはその文字認識精度が悪い場合に,前記読取項目に代替する代替項目をユーザに指定させて代替項目を入力する手段を有し,前記定義データ作成手段は,前記読取項目に加えて前記代替項目をレシート定義データ内に設定するとともに,前記金額欄の位置情報を前記代替項目からの相対距離で設定する手段を有することを特徴とする。   In another aspect of the present invention, the input data processing means may provide the user with an alternative item to replace the read item when the input read item is erroneously recognized or when the character recognition accuracy is poor. The definition data creating means sets the substitute item in the receipt definition data in addition to the read item, and sets the position information of the amount column from the substitute item. It has the means to set by relative distance of this, It is characterized by the above-mentioned.

また,本発明の他の一態様においては,前記入力データ処理手段は,前記作成されたレシート定義データまたはその履歴データから抽出したデータを,前記定義入力画面に設定し,他のレシート定義データの作成時に参照させる手段を有することを特徴とする。   According to another aspect of the present invention, the input data processing means sets the created receipt definition data or data extracted from the history data on the definition input screen, and stores other receipt definition data. It has a means to refer at the time of creation.

以上により作成されるレシート定義データは,以下のデータを含む。
(1)基本管理項目とレシート内の読取項目との対応情報。すなわち,基本管理項目として計上する金額は,レシート内のどの読取項目に対する金額であるかを示す情報。
(2)レシート内の読取項目の文字列と,それに対応する金額欄の相対的な位置情報。
(3)基本管理項目の金額が,複数の読取項目の金額の四則演算によって算出される場合には,その演算式を示す情報。
(4)その他,レシート内に必要な読取項目と同一名称(同じ文字列)の項目が複数あった場合に,必要な読取項目を特定するための複数キーワードやマーカー項目などの文字情報および読取文字との位置関係を示す情報。
The receipt definition data created as described above includes the following data.
(1) Correspondence information between basic management items and read items in receipts. That is, information indicating which reading item in the receipt the amount to be recorded as a basic management item.
(2) The relative position information of the character string of the reading item in the receipt and the corresponding money amount column.
(3) Information indicating an arithmetic expression when the amount of the basic management item is calculated by four arithmetic operations of the amounts of the plurality of reading items.
(4) In addition, when there are multiple items with the same name (same character string) as the required reading items in the receipt, character information and reading characters such as multiple keywords and marker items for specifying the required reading items Information indicating the positional relationship with

本発明の効果は以下のとおりである。
(1)レシートから基本管理項目に必要な読取項目を抽出する場合,どの基本管理項目にどの読取項目が対応するかを示すレシート定義データを,実際のレシートを用いて簡易に作成することができる。特に,操作員は,選択した読取項目を画面上で確認しながら,入力ミスを防いで容易に入力作業をすることができる。
(2)レシート定義データ中に読取項目の演算式を設定することができるので,一つの基本管理項目の金額を,複数の読取項目に対応する金額から算出することができ,レシート項目の内容が個々の店舗によって種々異なる場合でも,統一した基本管理項目のデータを収集することができる。
(3)レシートから基本管理項目に必要な読取項目について項目名称に同一の名称が複数存在する場合に,選択する読取項目を特定するための複数のキーワードとなる項目名称や読取項目に対する位置関係を特定する他のユニークな項目名称を持つマーカー項目の情報をレシート定義データに設定することができる。これにより,基本管理データの収集時におけるレシートデータの抽出の誤認識を回避することができる。
(4)画面上で基本管理項目に対応する読取項目を簡単な操作で選択することができ,また,指定された領域の自動調整機能を有することにより,その入力および確認が容易であり,効率よくレシート定義データを作成することができる。
(5)また,レシートの印字における文字の潰れ,文字接触,罫線接触などにより,読取項目についてOCR認識困難な場合があっても,レシート内の他の項目を読取項目の代替項目として定義できるので,読取精度のよいレシート定義データの作成が可能になる。
(6)また,同様な業務内容の店舗の新しいレシート定義データを作成する場合に,既存のレシート定義データを流用して,異なる読取項目の部分だけの入力でレシート定義データを作成することができるため,迅速にレシート定義データを作成することができる。
The effects of the present invention are as follows.
(1) When reading items necessary for basic management items are extracted from receipts, receipt definition data indicating which basic management items correspond to which reading items can be easily created using actual receipts. . In particular, the operator can easily perform an input operation while preventing an input error while checking the selected reading item on the screen.
(2) Since the calculation formula of the reading item can be set in the receipt definition data, the amount of one basic management item can be calculated from the amounts corresponding to a plurality of reading items. Even if it differs from store to store, data on unified basic management items can be collected.
(3) When there are a plurality of reading items necessary for the basic management item from the receipt, the item names that become a plurality of keywords for specifying the reading item to be selected and the positional relationship with the reading item are indicated. Information of marker items having other unique item names to be identified can be set in the receipt definition data. As a result, it is possible to avoid erroneous recognition of receipt data extraction when collecting basic management data.
(4) Reading items corresponding to basic management items can be selected on the screen with a simple operation, and it has an automatic adjustment function for the specified area, making it easy to input and confirm. You can often create receipt definition data.
(5) In addition, even if there is a case where OCR recognition is difficult for the read item due to character crushing, character contact, ruled line contact, etc. in printing the receipt, other items in the receipt can be defined as substitute items for the read item. , Receipt definition data with high reading accuracy can be created.
(6) In addition, when creating new receipt definition data for a store with the same business content, the receipt definition data can be created by inputting only the portions of different reading items by diverting the existing receipt definition data. Therefore, receipt definition data can be created quickly.

本発明によって作成されたレシート定義データを用いることにより,レシートの読取項目が異なる各種店舗のレシートデータから,テナントの管理部門が必要とする基本的なデータを統一的に収集し,売上管理データベースなどの基本データ管理データベースに保存することができるようになる。   By using the receipt definition data created by the present invention, basic data required by the tenant's management department is uniformly collected from receipt data of various stores with different receipt reading items, and a sales management database, etc. Can be saved in the basic data management database.

レシート定義データ作成装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of a receipt definition data creation apparatus. レシート定義データ作成装置の処理の概要を示すフローチャートである。It is a flowchart which shows the outline | summary of a process of a receipt definition data creation apparatus. 読取機によって読み取られるレシートの例を示す図である。It is a figure which shows the example of the receipt read by the reader. 画像データ記憶部に格納される画像データの例を示す図である。It is a figure which shows the example of the image data stored in an image data storage part. 基本データ記憶部に格納される基本テーブルの例を示す図である。It is a figure which shows the example of the basic table stored in a basic data storage part. 店舗マスタの例を示す図である。It is a figure which shows the example of a store master. 通常のレシート定義データ例を示す図である。It is a figure which shows the example of normal receipt definition data. レシート内に同一名称の読取項目が複数存在する場合のレシート定義データの例を示す図である。It is a figure which shows the example of receipt definition data in case there exist two or more reading items of the same name in a receipt. 演算式を定義するレシート定義データの例を示す図である。It is a figure which shows the example of the receipt definition data which defines a computing equation. 履歴データ記憶部に格納される履歴データの例を示す図である。It is a figure which shows the example of the history data stored in a history data storage part. 履歴データの辞書部の例を示す図である。It is a figure which shows the example of the dictionary part of log | history data. レシート定義データ作成処理の全体のフローチャートである。It is a flowchart of the whole receipt definition data creation process. レシート定義データ作成処理の全体のフローチャートである。It is a flowchart of the whole receipt definition data creation process. レシート定義データ作成処理の全体のフローチャートである。It is a flowchart of the whole receipt definition data creation process. 定義入力画面の構成例を示す図である。It is a figure which shows the structural example of a definition input screen. 売上管理項目一覧とOCR読取定義一覧の例を示す図である。It is a figure which shows the example of a sales management item list and an OCR reading definition list. 読取項目の設定方法の例を示す図である。It is a figure which shows the example of the setting method of a reading item. 演算定義処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of a calculation definition process. 演算定義の例を示す図である。It is a figure which shows the example of a calculation definition. ある店舗のレシートと売上管理項目との対応関係が計算式によって定義されている例を示す図である。It is a figure which shows the example in which the correspondence of the receipt and sales management item of a certain store is defined by the calculation formula. 同一文字列処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the same character string process. マーカー項目の定義例を示す図である。It is a figure which shows the example of a definition of a marker item. 複数キーワードの設定例を示す図である。It is a figure which shows the example of a setting of a several keyword. 代替項目の設定例を示す図である。It is a figure which shows the example of a setting of an alternative item. 類似データの有無を判断する処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the process which judges the presence or absence of similar data. 履歴データ作成処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of a history data creation process. 売上管理項目とレシート項目との対応関係の例を示す図である。It is a figure which shows the example of the correspondence of a sales management item and a receipt item.

以下,図面を用いながら,本発明の実施の形態について詳細に説明する。なお,以下では,主に店舗売上を集計する装置の例について説明するが,本発明は売上集計に限られるわけではなく,仕入集計データやその他の伝票などに印字された実績データを集計するための装置などにも同様に適用することができる。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following, an example of an apparatus for totalizing store sales will be described. However, the present invention is not limited to sales totalization, and totals actual data printed on purchase total data or other slips. The present invention can be applied to a device for the same.

図1は,本発明の概要を説明するための装置構成例を示す。図1において,1はCPUおよびハードディスクやメモリ等の記憶装置等から構成され,レシートから読み取った画像データをもとに,レシート定義データを作成する処理を実行するレシート定義データ作成装置,2はレシート定義データの作成対象となるレシート,3は表示装置,4はキーボードやマウス等の入力装置である。   FIG. 1 shows an apparatus configuration example for explaining the outline of the present invention. In FIG. 1, reference numeral 1 is a CPU and a storage device such as a hard disk or memory, etc., and a receipt definition data creation device that executes processing for creating receipt definition data based on image data read from a receipt, and 2 is a receipt. A receipt for which definition data is to be created, 3 is a display device, and 4 is an input device such as a keyboard or a mouse.

レシート2は,透明なキャリアシート等に挟まれた状態で読取機10に読み取られる。読取機10は,光学方式などによる画像のスキャンニングにより,レシート2の画像を読み取る装置である。画像データ読込部11は,周知のOCR処理機能を持ち,読取機10により読み取った画像を所定の画像データに変換する。なお,読取機10がOCR処理機能を有する場合には,画像データ読込部11は,OCR処理機能を持たなくてもよい。画像データは,例えばイメージデータが格納された画像ファイル,OCRによる認識文字データを含む。画像データ読込部11は,OCR処理結果の画像データを画像データ記憶部101に保存する。   The receipt 2 is read by the reader 10 while being sandwiched between transparent carrier sheets and the like. The reader 10 is a device that reads an image on the receipt 2 by scanning an image using an optical method or the like. The image data reading unit 11 has a known OCR processing function and converts an image read by the reader 10 into predetermined image data. When the reader 10 has an OCR processing function, the image data reading unit 11 may not have an OCR processing function. The image data includes, for example, an image file in which image data is stored and character data recognized by OCR. The image data reading unit 11 stores the image data of the OCR processing result in the image data storage unit 101.

定義入力画面表示部12は,店舗マスタ103を参照し,指定された店舗のレシート定義データを作成するために,基本データ記憶部102に格納されている基本的な売上管理項目の情報と,画像データ記憶部101に格納されているレシートのイメージデータを含む画像データの表示領域を有する定義入力画面を,表示装置3に表示する。   The definition input screen display unit 12 refers to the store master 103, and generates basic sales management item information and images stored in the basic data storage unit 102 in order to create receipt definition data for the specified store. A definition input screen having an image data display area including receipt image data stored in the data storage unit 101 is displayed on the display device 3.

入力データ処理部13は,表示された定義入力画面から,レシートの読取項目と,イメージデータにおける読取項目に対応する金額欄の位置情報と,読取項目と売上管理項目との対応情報とを入力する。このため,入力データ処理部13は,イメージデータにおける読取項目の位置の座標およびそれに対応する金額欄の位置の座標を入力装置4から取得する座標取得部131,複数の読取項目を一つの売上管理項目に対応づける演算式を定義する演算定義部132を備える。   The input data processing unit 13 inputs the receipt reading item, the position information of the amount column corresponding to the reading item in the image data, and the correspondence information between the reading item and the sales management item from the displayed definition input screen. . For this reason, the input data processing unit 13 obtains the coordinates of the position of the reading item in the image data and the coordinates of the position of the corresponding money amount column from the input device 4, and manages a plurality of reading items as one sales management. An operation definition unit 132 that defines an operation expression associated with an item is provided.

また,入力データ処理部13は,レシート内に読取項目と同一名称の他の項目が存在する場合に,読取項目を特定する基準となる複数キーワードを定義入力画面から入力して設定する複数キーワード設定部133および読取項目を特定する基準となる他のユニークな読取項目を定めるマーカー項目設定部134を備える。さらに,入力データ処理部13は,入力した読取項目について認識エラーがあった場合や文字認識精度が悪い場合に,読取項目に代替する他のレシート項目を代替項目として操作員に指定させて代替項目を入力する代替項目処理部135を備える。   The input data processing unit 13 also sets a plurality of keywords that are set by inputting, from the definition input screen, a plurality of keywords that serve as a reference for specifying the reading item when another item having the same name as the reading item exists in the receipt. And a marker item setting unit 134 for determining other unique reading items as a reference for specifying the reading unit 133 and the reading items. Further, the input data processing unit 13 causes the operator to designate another receipt item to be substituted for the read item as a substitute item when the input read item has a recognition error or the character recognition accuracy is poor. The alternative item processing unit 135 is input.

定義データ作成部14は,入力データ処理部13によって入力した情報をもとに,店舗ごとのレシート定義データを作成し,定義データ記憶部104に格納する。作成されるレシート定義データの具体例については後述する。レシート定義データは,レシートの読取項目における項目名称とそれに対応する金額項目の相対位置(相対的な金額欄の位置)などの情報を含むとともに,売上管理項目との対応関係情報を含んでいる。   The definition data creation unit 14 creates receipt definition data for each store based on the information input by the input data processing unit 13 and stores the receipt definition data in the definition data storage unit 104. A specific example of the receipt definition data to be created will be described later. The receipt definition data includes information such as the item name in the read item of the receipt and the relative position of the corresponding monetary item (the position of the relative monetary column) and the correspondence information with the sales management item.

履歴データ作成部15は,定義データ作成部14によって作成されたレシート定義データの履歴データを作成し,履歴データ記憶部105に格納する。この履歴データは,類似する他のレシートのレシート定義データを作成するときに参照して利用することができる。   The history data creation unit 15 creates history data of the receipt definition data created by the definition data creation unit 14 and stores it in the history data storage unit 105. This history data can be used by referring to the receipt definition data of other similar receipts.

図2は,図1に示すレシート定義データ作成装置1の処理の概要を示すフローチャートである。   FIG. 2 is a flowchart showing an outline of processing of the receipt definition data creation device 1 shown in FIG.

ステップS11では,画像データ読込部11が,読取機10により精算レシートを読み取る。精算レシートは,各店舗における1日分の売上情報の集計データであり,レシート項目は各店舗が使用しているPOSシステムによって異なっている。画像データ読込部11は,文字認識などによって得られた項目明細やレシートの全体イメージのデータを画像データ記憶部101に格納する。   In step S <b> 11, the image data reading unit 11 reads the payment receipt by the reader 10. The payment receipt is total data of sales information for one day at each store, and the receipt item varies depending on the POS system used by each store. The image data reading unit 11 stores in the image data storage unit 101 the item details obtained by character recognition and the data of the entire image of the receipt.

ステップS12では,定義入力画面表示部12が,画像データ記憶部101,基本データ記憶部102,店舗マスタ103のデータから定義入力画面を作成し,表示装置3に表示する。定義入力画面には,レシートの全体イメージの表示も行われる。   In step S <b> 12, the definition input screen display unit 12 creates a definition input screen from the data of the image data storage unit 101, the basic data storage unit 102, and the store master 103 and displays it on the display device 3. The entire image of the receipt is also displayed on the definition input screen.

ステップS13では,入力データ処理部13が,定義入力画面からの入力により,精算レシートの項目について,読取項目および演算式などを設定し,読取項目と売上管理項目との対応関係,読取項目とその読取項目に対応する金額欄の位置関係を定める。   In step S13, the input data processing unit 13 sets a reading item, an arithmetic expression, and the like for the item of the payment receipt by inputting from the definition input screen, and the correspondence between the reading item and the sales management item, the reading item and its item The positional relationship of the amount column corresponding to the reading item is determined.

ステップS14では,定義データ作成部14が,入力データ処理部13により入力した情報をもとに,レシート定義データを作成し,定義データ記憶部104に格納する。   In step S 14, the definition data creation unit 14 creates receipt definition data based on the information input by the input data processing unit 13 and stores it in the definition data storage unit 104.

ステップS15では,履歴データ作成部15が,作成したレシート定義データについての履歴データを作成し,履歴データ記憶部105に保存する。   In step S <b> 15, the history data creation unit 15 creates history data for the created receipt definition data and stores it in the history data storage unit 105.

以上,レシート定義データ作成装置1が実行する大まかな処理を説明したが,以下では,具体的な処理内容やデータ構造について詳しく説明する。   The rough processing executed by the receipt definition data creation device 1 has been described above. Specific processing contents and data structure will be described in detail below.

図3は,読取機10によって読み取られるレシート2の例を示す図である。読取機10が図3に示すようなレシート2を読み取ると,読取機10または画像データ読込部11のOCR処理により,画像の解析による文字認識が行われる。この文字認識では,図3に示すレシート2における文字列#1,#2,…,#14,…のように,一連の文字列ごとに,文字列を構成する各認識文字の候補とその位置情報とが画像データとして抽出され,画像データ記憶部101に格納される。   FIG. 3 is a diagram illustrating an example of the receipt 2 read by the reader 10. When the reader 10 reads the receipt 2 as shown in FIG. 3, character recognition is performed by analyzing the image by the OCR processing of the reader 10 or the image data reading unit 11. In this character recognition, each recognized character candidate constituting the character string and its position for each series of character strings, such as character strings # 1, # 2,..., # 14,. Information is extracted as image data and stored in the image data storage unit 101.

図4は,画像データ記憶部101に格納される画像データの例を示す図である。画像データ記憶部101には,図4(A)に示すように,レシート画像のイメージデータに関するデータと,図4(B)に示すように,レシートの文字認識結果のデータ(以下,認識文字データという)とが格納される。   FIG. 4 is a diagram illustrating an example of image data stored in the image data storage unit 101. As shown in FIG. 4A, the image data storage unit 101 stores data relating to the image data of the receipt image, and data of the character recognition result of the receipt (hereinafter, recognized character data) as shown in FIG. Are stored.

レシート画像のイメージデータは,例えばレシート全体またはレシートにおける文字が印字された部分全体の矩形領域の画像イメージがビットマップ形式の画像ファイルとして格納され,また,このレシート2を発行した店舗を識別する店舗コードが付与される。この店舗コードは,入力装置4から事前に入力してもよいし,また,レシート2を読取機10に読み取らせるときのレシート挟持用シート(キャリアシート)に付与された各店舗識別用の2次元コード等を解析して入力するようにしてもよい。   As the image data of the receipt image, for example, the image image of the rectangular area of the entire receipt or the entire portion of the receipt printed with characters is stored as a bitmap image file, and the store that identifies the store that issued this receipt 2 A code is given. This store code may be input in advance from the input device 4, or a two-dimensional identification for each store given to a receipt sandwiching sheet (carrier sheet) when the receipt 2 is read by the reader 10. The code or the like may be analyzed and input.

図4(B)に示す認識文字データは,一連の文字列#n(n=1,2,…)についての文字認識の結果が格納されるが,その内容を図3に示す文字列#14の例を用いて説明する。まず,文字列#14がレシート2における14番目の文字列であり,識別番号がそれを示している。文字列#14の文字数は3(第1候補の並びは「総売上」)であり,文字列#14の座標は,(x,y)−(x’,y’)である。この座標は,あらかじめ定められたレシート2の画像の基準位置(例えばレシート画像の左上角または文字列群を囲む矩形領域の左上角など)を原点とした座標である。   In the recognized character data shown in FIG. 4B, the result of character recognition for a series of character strings #n (n = 1, 2,...) Is stored, the contents of which are character string # 14 shown in FIG. An example will be described. First, the character string # 14 is the 14th character string in the receipt 2, and the identification number indicates it. The number of characters in the character string # 14 is 3 (the first candidate is “total sales”), and the coordinates of the character string # 14 are (x, y) − (x ′, y ′). This coordinate is a coordinate whose origin is the predetermined reference position of the image of the receipt 2 (for example, the upper left corner of the receipt image or the upper left corner of the rectangular area surrounding the character string group).

さらに,認識文字データは,文字列#14を構成する各文字#141,#142,#143の3文字について,各々の座標情報を持つ。また,認識結果の文字と認識用の辞書との相違度の小さい順に,認識結果のいくつかの文字が相違度とともに格納される。例えば,文字#141の認識結果の第1番目の候補は「総」(相違度=1311)であり,第2番目の候補は「脆」(相違度=1581),第3番目の候補は「聡」(相違度=1640)である。   Further, the recognized character data has coordinate information for each of the three characters # 141, # 142, and # 143 constituting the character string # 14. In addition, some characters of the recognition result are stored together with the degree of difference in ascending order of the degree of difference between the recognition result character and the recognition dictionary. For example, the first candidate of the recognition result of the character # 141 is “total” (difference = 1311), the second candidate is “brittle” (difference = 1581), and the third candidate is “聡 ”(difference = 1640).

ここで,画像データ読込部11は,これらの認識結果の候補をすべて画像データ記憶部101に格納するのではなく,各文字列#nを構成する認識候補の各文字の組み合わせと,すべての店舗に共通にあらかじめ用意された認識結果単語辞書であって,レシートに印字される可能性のある文字列があらかじめ格納されている辞書中の単語との照合により,認識結果の文字列を絞り込んで,その絞り込んだ結果だけを画像データ記憶部101に格納するようにしてもよい。   Here, the image data reading unit 11 does not store all of these recognition result candidates in the image data storage unit 101, but each character combination of the recognition candidates constituting each character string #n and all stores. This is a recognition result word dictionary prepared in advance in common, and by narrowing down the recognition result character string by collating with words in the dictionary where the character string that may be printed on the receipt is stored in advance, Only the narrowed result may be stored in the image data storage unit 101.

図5は,基本データ記憶部102に格納される基本テーブルの例を示す図である。この基本テーブルは,テナント管理部門が集計する売上管理項目の情報を格納している。具体的には,ショッピングセンターにおける売上管理データの管理を対象とした場合,ショッピングセンターを識別するショッピングセンターコード,ショッピングセンターの名称および所在地,ショッンピングセンター内の店舗数の情報を格納している。また,テナント管理に必要な各売上管理項目の項目名称が格納される。   FIG. 5 is a diagram illustrating an example of a basic table stored in the basic data storage unit 102. This basic table stores information on sales management items that are aggregated by the tenant management department. Specifically, in the case of managing sales management data in a shopping center, information on a shopping center code for identifying the shopping center, the name and location of the shopping center, and the number of stores in the shopping center is stored. In addition, the item name of each sales management item necessary for tenant management is stored.

この例では,売上管理項目として8個の項目があり,これらの各項目の名称が「現金売上」,「掛売上」,「クレジット売上」,「商品券」,「総売上」,「消費税」,「その他控除」,「純売上」である。本システムは,各店舗ごとに異なる各種のレシートの項目の中から,これらの売上管理項目の情報を自動で抽出するためのレシート定義データを,単純な操作で作成することができるようにすることを目的としている。   In this example, there are eight items as sales management items, and the names of these items are “cash sales”, “payment sales”, “credit sales”, “gift certificate”, “total sales”, “consumption tax” ”,“ Other deductions ”and“ Net sales ”. This system enables receipt definition data for automatically extracting information on these sales management items from various receipt items that differ for each store to be created with a simple operation. It is an object.

また,この基本テーブルには,各演算管理項目ごとにその演算管理項目が取り得る値の下限値と上限値とが定められ,格納されている。この下限値と上限値とは,レシート画像を文字認識することによってレシートから売上管理項目の金額を自動で抽出した場合に,,誤認識・誤入力を少なくするためのチェックに用いられる。   In this basic table, a lower limit value and an upper limit value that can be taken by the calculation management item are determined and stored for each calculation management item. The lower limit value and the upper limit value are used for checking to reduce erroneous recognition and erroneous input when the amount of the sales management item is automatically extracted from the receipt by character recognition of the receipt image.

図6は,店舗マスタ103の例を示す図である。店舗マスタ103は,レシートを発行する個別の店舗の情報を格納するテーブルであり,あらかじめ用意される。1番目の設定項目である店舗コードは,店舗を識別する番号である。2番目の店舗名称は,店舗の名称である。3番目の業種コードは,店舗の業種を表すコードである。4番目の業種名は,業種の名称である。続いてPOSシステム情報1,2,3として,順に,導入されているPOSシステムの識別コード(例:F001),POSシステムのメーカー(例:AAAAA),POSシステムの導入年月日(例:2000年1月1日)などの情報が格納される。また,精算レシート情報1,2,3,4として,順に,精算レシートの長さ,読込形式,精算レシート中の印字項目数,その他の必要な情報が格納される。読込形式の欄には,読取機10がレシート2をそのまま形で読み込む場合には“0”,レシート2が長過ぎるため,レシート2を複数片にカットして読み込む場合には“1”の値が設定される。   FIG. 6 is a diagram illustrating an example of the store master 103. The store master 103 is a table that stores information on individual stores that issue receipts, and is prepared in advance. The store code which is the first setting item is a number for identifying the store. The second store name is the name of the store. The third business type code is a code representing the business type of the store. The fourth industry name is the name of the industry. Subsequently, as the POS system information 1, 2 and 3, the identification code of the installed POS system (example: F001), the manufacturer of the POS system (example: AAAAA), the date of introduction of the POS system (example: 2000) Such as January 1st) is stored. Further, as the payment receipt information 1, 2, 3 and 4, the length of the payment receipt, the reading format, the number of print items in the payment receipt, and other necessary information are sequentially stored. In the reading format column, the value is “0” when the reader 10 reads the receipt 2 as it is, and the value is “1” when the receipt 2 is cut into a plurality of pieces because the receipt 2 is too long. Is set.

本システムは,以上の画像データ記憶部101,基本データ記憶部102,店舗マスタ103に格納されているデータをもとに,レシート定義データを作成する。なお,店舗マスタ103は,店舗情報が既知であるか入力装置4から事前に入力される場合には必須ではない。   This system creates receipt definition data based on the data stored in the image data storage unit 101, basic data storage unit 102, and store master 103 described above. The store master 103 is not essential when the store information is known or is input in advance from the input device 4.

図7は,レシート定義データであって,もっとも基本的なデータの例を示している。店舗コードは,どの店舗のレシート定義データであるかを示す店舗の識別コードである。続いて,レシートから読み取るレシート項目の情報が,各項目ごとに格納される。読取項目1識別コードは,1番目の読取項目1の識別コードであり,レシート定義データ内で読取項目を一意に識別するコードである。   FIG. 7 shows an example of the most basic data as receipt definition data. The store code is a store identification code indicating which store has the receipt definition data. Subsequently, receipt item information read from the receipt is stored for each item. The reading item 1 identification code is an identification code of the first reading item 1, and is a code for uniquely identifying the reading item in the receipt definition data.

項目属性には,読取項目の属性が設定される。レシート内に同一名称(読取文字が同じ)の読取項目が存在しない場合,属性値=1である。レシート内に同一名称の読取項目が存在したときに,マーカー項目を基準にして読取項目を特定する場合には,属性値=2である。レシート内に同一名称の読取項目が存在したときに,複数キーワードをもとに読取項目を特定する場合には,属性値=3である。読取文字の認識が困難で代替項目を設定した場合には,属性値=4である。   In the item attribute, the attribute of the read item is set. If there is no reading item with the same name (the same reading character) in the receipt, the attribute value = 1. When there is a reading item with the same name in the receipt, the attribute value = 2 when the reading item is specified based on the marker item. When there is a reading item with the same name in the receipt, when specifying the reading item based on a plurality of keywords, attribute value = 3. When it is difficult to recognize the read character and an alternative item is set, attribute value = 4.

図7(A)のレシート定義データは,同一名称の読取項目が複数存在しない場合の例であり,項目属性の属性値は1となっている。1番目の読取項目の読取文字1は,この例では「総売上」となっている。金額欄の相対読取位置1は,「総売上」に対応する金額の文字列がどの部分に印字されているかを「総売上」の文字列の位置からの相対位置で示す。ここで相対位置とは,例えば「総売上」の文字列領域の左上角を原点としたときの金額欄の位置の座標である。金額欄の位置を読取文字1の位置からの相対位置で示すのは,同じレシートであっても,日によって実際にレシートに印字される行数が異なり,読取文字1の位置が可変であるからである。   The receipt definition data in FIG. 7A is an example when there are not a plurality of read items with the same name, and the attribute value of the item attribute is 1. The read character 1 of the first read item is “total sales” in this example. The relative reading position 1 in the amount column indicates in which position the character string of the amount corresponding to “total sales” is printed in a relative position from the position of the character string “total sales”. Here, the relative position is, for example, the coordinates of the position of the amount column when the upper left corner of the character string area of “total sales” is the origin. The position of the amount column is indicated by the relative position from the position of the read character 1 because the number of lines actually printed on the receipt differs depending on the day even if the receipt is the same, and the position of the read character 1 is variable. It is.

2番目の読取項目の読取文字2「その他金券金額」,3番目の読取項目の読取文字3「現金売上」についても,同様に識別コード,項目属性,読取文字,金額欄の相対読取位置のデータがレシート定義データとして格納される。   Similarly, for the reading character 2 of the second reading item “other amount of cash voucher” and the reading character 3 of the third reading item 3 “cash sales”, the identification code, the item attribute, the reading character, and the data of the relative reading position of the amount column Is stored as receipt definition data.

図7(B)のレシート定義データは,読取項目の文字認識が困難な場合の例であり,項目属性の属性値は4となっている。この場合,読取項目(例えば消費税)の認識の代わりとなる項目を代替項目(例えば小計)として定義し,金額欄の相対読取位置として代替項目からの相対距離を設定する。   The receipt definition data in FIG. 7B is an example when it is difficult to recognize the characters of the read item, and the attribute value of the item attribute is 4. In this case, an item that replaces recognition of a reading item (for example, consumption tax) is defined as an alternative item (for example, a subtotal), and a relative distance from the alternative item is set as a relative reading position in the amount column.

図8は,読取項目としてレシート内に同一名称が複数存在する場合のレシート定義データの例を示している。図8(A)は,項目属性の属性値が2の場合の例,図8(B)は,項目属性の属性値が3の場合の例である。   FIG. 8 shows an example of receipt definition data when there are a plurality of identical names in the receipt as read items. 8A shows an example when the attribute value of the item attribute is 2, and FIG. 8B shows an example when the attribute value of the item attribute is 3.

レシート内に読取項目の名称が同じ項目が複数存在する場合(例えば,読取項目の項目名称が「消費税」であり,その「消費税」という用語が複数行に印字されている場合),どちらの金額を売上管理項目として抽出するかを特定する情報が必要となる。   When there are multiple items with the same read item name in the receipt (for example, the item name of the read item is "consumption tax" and the term "consumption tax" is printed on multiple lines) Is required to specify whether to extract the amount of money as a sales management item.

項目属性の属性値が2の場合,読取項目の位置を特定する基準となる他のユニークな項目名称をマーカー項目として定義することにより,同一の名称の項目の一つを実際の読取項目として特定する。図8(A)の例では,「総売上」が読取文字1であるが,レシート内に「総売上」の項目名称が複数存在するため,他のユニークなレシート上の印字名称である「貸在高」の項目をマーカー項目として定義している。また,読取文字1の読取位置およびその項目に対応する金額欄の相対読取位置1の他に,マーカー項目からの距離(方向を含む)の情報が定義される。このマーカー項目からの距離の情報は,マーカー項目「貸在高」の文字位置から読取文字1「総売上」の文字位置までの距離(x座標,y座標)の上限値を示しており,x座標については,読取文字1が右方向に存在する場合には正の値,左方向に存在する場合には負の値をとる。また,y座標については,読取文字1が上方向に存在する場合には正の値,読取文字1が下方向に存在する場合には負の値をとる。図8(A)の例では,この値が「(−50,+100)」であり,マーカー項目「貸在高」の文字位置からx座標で−50(左方向),かつ,y座標で+100(上方向)の範囲内に,収集対象となる読取文字1「総売上」が存在することを示している。   If the attribute value of the item attribute is 2, define one of the items with the same name as the actual reading item by defining another unique item name that serves as a reference for specifying the position of the reading item as a marker item To do. In the example of FIG. 8A, “total sales” is the read character 1, but since there are a plurality of item names of “total sales” in the receipt, “print” is the print name on another unique receipt. The item of “Holding” is defined as a marker item. In addition to the reading position of the reading character 1 and the relative reading position 1 of the amount column corresponding to the item, information on the distance (including direction) from the marker item is defined. The distance information from the marker item indicates the upper limit value of the distance (x coordinate, y coordinate) from the character position of the marker item “loan amount” to the character position of the read character 1 “total sales”. As for the coordinates, a positive value is taken when the read character 1 is present in the right direction, and a negative value is obtained when it is present in the left direction. The y-coordinate takes a positive value when the read character 1 exists in the upward direction, and takes a negative value when the read character 1 exists in the downward direction. In the example of FIG. 8A, this value is “(−50, +100)”, −50 (left direction) in the x coordinate from the character position of the marker item “loan amount”, and +100 in the y coordinate. This indicates that the read character 1 “total sales” to be collected exists within the range (upward).

項目属性の属性値が3の場合,複数行に連続して並ぶ複数の項目名称をキーワードとして,それらの複数のキーワードがレシート内でユニークになるように定義することにより,同一の名称の項目の一つを実際の読取項目として特定する。図8(B)の例では,「総売上」が売上管理項目として必要な読取文字1であるが,レシート内に「総売上」の項目名称が複数存在するため,レシート内でユニークになる「総売上」,「純売上」,「現金有高」,「貸在高」の複数行にわたる一連の項目を,複数キーワードとして設定し,これらの一塊の文字列により,「総売上」の読取項目の位置を特定するようにしている。読取文字1の読取位置1は,「総売上」,「純売上」,「現金有高」,「貸在高」の複数キーワードが印字された最小矩形領域の左上と右下の座標である。また,金額欄の相対読取位置1は,読取文字1の読取位置1の左上の座標を原点として定義した座標である。   When the attribute value of an item attribute is 3, by defining multiple item names that are consecutively arranged in multiple lines as keywords and defining the multiple keywords to be unique in the receipt, the items with the same name One is specified as an actual reading item. In the example of FIG. 8B, “total sales” is the read character 1 necessary as a sales management item, but since there are a plurality of item names of “total sales” in the receipt, it is unique in the receipt. A series of items covering multiple lines, such as “total sales”, “net sales”, “cash amount”, and “loan amount”, are set as multiple keywords. The position of is specified. The reading position 1 of the reading character 1 is the upper left and lower right coordinates of the minimum rectangular area on which a plurality of keywords “total sales”, “net sales”, “cash amount”, and “loan amount” are printed. The relative reading position 1 in the money amount column is a coordinate defined with the upper left coordinate of the reading position 1 of the reading character 1 as the origin.

さらに,レシート定義データとして,図7および図8に示すレシート定義データによって定義された読取項目と,図5に示した基本テーブル中の売上管理項目との対応関係を示す演算式の定義情報が設定される。図9は,その演算式を定義するレシート定義データの例を示している。   Further, as the receipt definition data, the definition information of the arithmetic expression indicating the correspondence between the read item defined by the receipt definition data shown in FIGS. 7 and 8 and the sales management item in the basic table shown in FIG. 5 is set. Is done. FIG. 9 shows an example of receipt definition data that defines the arithmetic expression.

演算式の定義情報は,図9に示すように,店舗を識別する店舗コードの他に,各売上管理項目と1または複数の読取項目識別コードとの対応情報を持つ。複数の読取項目が,1つの売上管理項目に対応づけられる場合には,複数の読取項目識別コードについての四則演算の演算式が用いられる。図9の例で説明すると,売上管理項目1「現金売上」に対応する読取項目識別コードは,「A+B」となっている。これは,読取項目識別コード=Aの読取項目に対応する金額欄に印字された数値と,読取項目識別コード=Bの読取項目に対応する金額欄に印字された数値とを加算した値を,売上管理項目1「現金売上」の金額として計上することを示している。2番目の売上管理項目2「掛売上」については,読取項目識別コード「C」の読取項目を,そのまま「掛売上」の金額とすることを示している。他の売上管理項目についても同様に,読取項目識別コードの演算式(1対1対応の場合を含む)によって,各売上管理項目とレシートからの読取項目との対応情報が定義される。   As shown in FIG. 9, the definition information of the arithmetic expression has correspondence information between each sales management item and one or a plurality of read item identification codes in addition to the store code for identifying the store. When a plurality of reading items are associated with one sales management item, arithmetic expressions of four arithmetic operations for a plurality of reading item identification codes are used. In the example of FIG. 9, the read item identification code corresponding to the sales management item 1 “cash sales” is “A + B”. This is a value obtained by adding the numerical value printed in the amount column corresponding to the reading item with the reading item identification code = A and the numerical value printed in the amount column corresponding to the reading item with the reading item identification code = B, It shows that it is recorded as the amount of sales management item 1 “cash sales”. For the second sales management item 2 “paid sales”, the read item of the read item identification code “C” is used as the amount of “paid sales” as it is. Similarly for other sales management items, the correspondence information between each sales management item and the read item from the receipt is defined by the operation formula of the read item identification code (including the case of one-to-one correspondence).

次に,履歴データ作成部15によって作成され,履歴データ記憶部105に格納される履歴データの例を,図10に従って説明する。   Next, an example of history data created by the history data creation unit 15 and stored in the history data storage unit 105 will be described with reference to FIG.

履歴データは,定義データ作成部14によって作成されたレシート定義データの内容を,他の同業種の店舗でのレシート定義データの作成に流用できるようにするために,まとめたものである。業種情報として,業種コード,業種名,POSシステム情報1〜3,精算レシート情報1〜4などが格納される。また,項目情報として,各読取項目の識別コード,項目属性,読取文字等が格納される。また,演算情報として,各売上管理項目と,該当する読取項目識別コードを用いた演算式が格納される。これらの具体的な内容は,図7ないし図10を用いて説明したレシート定義データの内容と同様である。   The history data is collected so that the contents of the receipt definition data created by the definition data creation unit 14 can be used for creating receipt definition data at other stores in the same industry. As the industry information, the industry code, industry name, POS system information 1 to 3, payment receipt information 1 to 4 and the like are stored. In addition, as the item information, an identification code of each reading item, item attributes, reading characters, and the like are stored. In addition, as the calculation information, an arithmetic expression using each sales management item and the corresponding read item identification code is stored. These specific contents are the same as the contents of the receipt definition data described with reference to FIGS.

また,履歴データ作成部15は,履歴データとして辞書情報を作成し,履歴データ記憶部105に格納する。図11は,その履歴データの辞書部の例を示す。   The history data creation unit 15 creates dictionary information as history data and stores it in the history data storage unit 105. FIG. 11 shows an example of the dictionary portion of the history data.

履歴データの辞書部には,図11に示すように,業種コード,POSシステム情報,売上管理項目,読取文字,…などの実際にレシート定義データに利用された文字列情報(単語など)が格納される。この辞書部に格納された文字列情報は,作成済みのレシート定義データを用いて,新しい店舗のレシート定義データを作成する場合に,売上管理項目に該当する読取項目を類推するために用いられる。また,例えば図4で説明した文字認識結果の画像データにおいて,正しい認識結果の文字列を抽出するのに用いることができる。また,実際の売上管理データの収集作業において,自動で誤認識,誤入力を防止するのに用いることができる。   In the history data dictionary section, as shown in FIG. 11, character string information (words, etc.) actually used for receipt definition data, such as industry code, POS system information, sales management items, read characters,... Is done. The character string information stored in the dictionary part is used to infer the reading items corresponding to the sales management items when the receipt definition data of a new store is created by using the created receipt definition data. For example, it can be used to extract a character string of a correct recognition result in the image data of the character recognition result described with reference to FIG. It can also be used to prevent erroneous recognition and erroneous input automatically in the actual sales management data collection operation.

次に,レシート定義データ作成装置1が実行する処理について,さらに詳しく説明する。図12〜図14は,本実施形態に係るレシート定義データ作成処理の全体のフローチャートである。   Next, the process executed by the receipt definition data creation device 1 will be described in more detail. 12 to 14 are flowcharts of the entire receipt definition data creation process according to the present embodiment.

まず,ステップS201では,入力装置4からの操作員の入力を待ち合わせる。操作員が,メニュー等により,レシート定義データを新規に作成するのか,または作成済みのレシート定義データを参照して作成するのかを指定すると,ステップS202へ進む。   First, in step S201, an operator input from the input device 4 is waited. If the operator designates whether receipt definition data is newly created or created by referring to the created receipt definition data by using a menu or the like, the process proceeds to step S202.

ステップS202では,レシート定義データの新規作成か参照作成かを判定し,参照作成の場合,図13のステップ220へ進み,新規作成の場合には,ステップS203へ進む。   In step S202, it is determined whether the receipt definition data is newly created or reference created. If reference creation is made, the process proceeds to step 220 in FIG. 13, and if newly created, the process proceeds to step S203.

ステップS203では,レシート定義データを作成するための定義入力画面の初期画面を表示装置3に表示する。   In step S203, an initial screen of a definition input screen for creating receipt definition data is displayed on the display device 3.

図15に,定義入力画面の構成例を示す。定義入力画面30には,レシート定義データを作成する施設とテナント(店舗)情報の表示領域の下に,売上管理項目一覧表示領域31,OCR読取定義一覧表示領域32,レシート画像表示領域33,マーカー定義一覧表示領域34,計算式入力用領域35が設けられる。   FIG. 15 shows a configuration example of the definition input screen. The definition input screen 30 includes a sales management item list display area 31, an OCR reading definition list display area 32, a receipt image display area 33, a marker below the display area of the facility for creating receipt definition data and tenant (store) information. A definition list display area 34 and a calculation formula input area 35 are provided.

売上管理項目一覧表示領域31には,図16(A)に示すように,売上管理項目一覧が表示される。売上管理項目一覧は,図5で説明した基本テーブルに格納されている売上管理項目の項目名称と,売上管理項目と読取項目とを対応づける計算式(演算式)が確定したときに,その計算式が表示される欄を持つ。   In the sales management item list display area 31, a sales management item list is displayed as shown in FIG. The sales management item list is calculated when an item name of the sales management item stored in the basic table described in FIG. 5 and a calculation formula (calculation formula) that associates the sales management item with the read item are determined. Has a field that displays an expression.

また,OCR読取定義一覧表示領域32には,図16(B)に示すように,操作員の入力操作によって入力されるOCRの読取項目や,レシート画像内においてその項目の領域情報が設定されたどうかを示す情報(項目領域),その項目に対応する金額欄の領域情報が設定されたかどうかを示す情報(金額情報)が表示される。   In the OCR reading definition list display area 32, as shown in FIG. 16B, OCR reading items inputted by the operator's input operation and area information of the items in the receipt image are set. Information indicating whether or not (item area) and information (amount information) indicating whether or not the area information of the amount column corresponding to the item has been set are displayed.

レシート画像表示領域33には,読取機10で読み取ったレシートの画像(イメージデータ)が表示される。この領域の表示においては,スクロール,拡大/縮小などの機能が設けられている。   In the receipt image display area 33, an image (image data) of a receipt read by the reader 10 is displayed. In the display of this area, functions such as scrolling and enlargement / reduction are provided.

マーカー定義一覧表示領域34は,レシート内に同一名称の読取項目が複数存在する場合に,読取項目を特定するためのユニークなマーカー項目を定義するための情報が表示される。また,計算式入力用領域35には,入力された売上管理項目と読取項目とを対応づける計算式が表示される。   The marker definition list display area 34 displays information for defining a unique marker item for specifying a reading item when there are a plurality of reading items with the same name in the receipt. In the calculation formula input area 35, a calculation formula for associating the input sales management item and the read item is displayed.

ステップS203で,以上のような定義入力画面30の初期画面を表示した後,ステップS204で,操作員の入力を待ち合わせる。ステップS205では,すべての項目の入力が終わると,操作員が「定義確定」のキーを押すので,その入力があったかどうかを判定し,「定義確定」の指示が入力されたならば,ステップS208へ進む。   In step S203, the initial screen of the definition input screen 30 as described above is displayed, and in step S204, an operator input is waited for. In step S205, when all the items have been input, the operator presses the “define definition” key. Therefore, it is determined whether or not the input has been made, and if the “define definition” instruction is input, step S208 is performed. Proceed to

「定義確定」の指示がない場合には,ステップS206へ進み,読取項目の入力と,項目領域の選択と,金額領域の選択処理を行う。この処理の例について,図16および図17を用いて説明する。   If there is no “define definition” instruction, the process advances to step S206 to input a reading item, select an item area, and select a money area. An example of this processing will be described with reference to FIGS.

定義入力画面30の初期画面では,OCR読取定義一覧表示領域32は,図16(B1)に示すように自動で付与される読取項目ID(例えば,a)の表示と,空欄の読取項目,項目領域,金額領域の表示が行われている。ここで,読取項目として,例えば「純売上」が入力により設定されると,その「純売上」の項目に対するレシート内の項目領域および金額領域の領域が未設定であることを示す「未設定」の文字が,目立ちやすい表示色で,図16(B2)に示すように表示される。そこで,操作員は,項目領域の設定操作と金額領域の設定操作を行う。   On the initial screen of the definition input screen 30, the OCR reading definition list display area 32 displays a reading item ID (for example, a) automatically given as shown in FIG. Area and amount area are displayed. Here, for example, when “net sales” is set as an input item by reading, “unset” indicating that the item area and the amount area in the receipt for the “net sales” item are not set. Are displayed in a conspicuous display color as shown in FIG. Therefore, the operator performs an item area setting operation and a monetary area setting operation.

図17は,項目領域の設定を説明する図である。OCR読取定義一覧表示領域32の表示が図17(A)に示すとおりであり,レシート画像表示領域33には,図17(B)に示すようなレシート画像が表示されているとする。操作員は,レシート画像表示領域33における画像上で,マウス等の入力装置4により,「純売上」の文字列部分をポイントして,ドラッグまたはクリックする。入力データ処理部13の座標取得部131は,この入力を検知し,レシート画像における「純売上」の文字列を枠線で囲んで表示する。このとき,例えば図17(C)の左側の図に示す矢印のように,「純売上」の文字列部分を大きくドラッグしても,枠線の自動調整により,図17(C)の右側の図に示す点線枠のように必要最小限の大きさで枠線が表示される。このようにして選択された項目領域の左上角座標と,右下角座標とが,内部メモリに記憶される。OCR読取定義一覧では,図17(D)に示すように,項目領域の欄が「未設定」から「○」に書き換えられ,項目領域の選択処理が済んだことが示される。枠線で囲む領域の大きさの自動調整は,図5で説明したOCRによる認識結果の画像データを参照することにより行うことができる。   FIG. 17 is a diagram for explaining the setting of the item area. Assume that the display in the OCR reading definition list display area 32 is as shown in FIG. 17A, and the receipt image as shown in FIG. 17B is displayed in the receipt image display area 33. On the image in the receipt image display area 33, the operator points and drags or clicks the character string portion of “net sales” with the input device 4 such as a mouse. The coordinate acquisition unit 131 of the input data processing unit 13 detects this input, and displays the character string “pure sales” in the receipt image surrounded by a frame line. At this time, for example, as shown by the arrow in the left diagram of FIG. 17C, even if the character string portion of “net sales” is dragged greatly, the right side of FIG. A frame line is displayed with a minimum necessary size as shown by a dotted line frame in the figure. The upper left corner coordinates and lower right corner coordinates of the item area selected in this way are stored in the internal memory. In the OCR reading definition list, as shown in FIG. 17D, the item area column is rewritten from “not set” to “◯”, indicating that the item area selection processing has been completed. The automatic adjustment of the size of the area surrounded by the frame line can be performed by referring to the image data of the recognition result by the OCR described with reference to FIG.

金額領域の選択処理についても,同様に,レシート画像における該当する金額欄に対するマウス等によるドラッグまたはクリックによって,枠線が表示され,その領域の座標情報が取り込まれることにより行われる。金額領域の設定により,OCR読取定義一覧における金額領域の欄は,「未設定」から「○」に書き換えられ,「純売上」の読取項目に対する定義が終了する。入力欄は,次の行に移る。入力欄がなければ,新しい入力欄が自動的に追加される。なお,枠線の表示で領域を示す代わりに,背景や文字の表示色を変えて領域を示してもよい。   Similarly, the amount area selection process is performed by displaying a frame line by dragging or clicking the corresponding amount field in the receipt image with a mouse or the like, and taking in the coordinate information of the area. By setting the amount area, the amount area column in the OCR reading definition list is rewritten from “not set” to “◯”, and the definition for the reading item “net sales” is completed. The input field moves to the next line. If there is no entry field, a new entry field is automatically added. Instead of showing the area by displaying the frame line, the background or character display color may be changed to show the area.

以上の読取項目の定義処理に続いて,ステップS207では,演算定義処理が行われる。演算定義処理は,売上管理項目とステップS206で定義された1または複数の読取項目との対応関係を示す計算式を定義する処理である。詳しくは後述する。その後,ステップS204へ戻り,同様に処理を繰り返す。   Subsequent to the reading item definition processing described above, in step S207, calculation definition processing is performed. The calculation definition process is a process for defining a calculation formula indicating the correspondence between the sales management item and one or more reading items defined in step S206. Details will be described later. Then, it returns to step S204 and repeats a process similarly.

「定義確定」の指示があった場合,ステップS208へ進み,ステップS208では,読取項目の再チェックを行う。ここでは,読取項目の項目領域について再度,文字認識を行う。または,図4(B)で説明した画像データ記憶部101に格納されている認識文字データの中の読取項目の各認識文字に対する相違度の情報から,認識の精度を判定し,誤認識が生じていないかどうか,または認識の精度が所定の閾値より悪いかどうかをチェックする。   If there is an instruction for “definition of definition”, the process proceeds to step S208. In step S208, the reading item is rechecked. Here, character recognition is performed again for the item area of the read item. Alternatively, the recognition accuracy is determined based on the difference information for each recognized character of the read item in the recognized character data stored in the image data storage unit 101 described with reference to FIG. It is checked whether or not the recognition accuracy is worse than a predetermined threshold.

ステップS209の判定により,認識エラーがないと判定された場合,または認識の精度が悪くないと判定された場合には,図14のステップS230へ進む。そうでない場合には,ステップS210へ進み,操作員に対して代替項目の入力を促す。代替項目は,本来の読取項目について,認識が困難であるか誤認識の可能性が大きいために,他のレシート項目を代替項目として認識対象とし,その代替項目からの相対位置情報によって,本来の読取項目に対する金額を取得することを目的とした項目である。操作員からの代替項目の入力操作があれば,ステップS211により,代替項目の定義処理を行う。その後に,ステップS204へ戻る。代替項目の具体例については,後に,図24を用いて説明する。   If it is determined in step S209 that there is no recognition error, or if it is determined that the recognition accuracy is not bad, the process proceeds to step S230 in FIG. If not, the process proceeds to step S210 to prompt the operator to input a substitute item. Because the substitution item is difficult to recognize or has a high possibility of misrecognition of the original reading item, other receipt items are to be recognized as substitution items, and the original item is determined based on the relative position information from the substitution item. This is an item for the purpose of acquiring the amount of money for the read item. If there is an input operation of the substitute item from the operator, the substitute item definition process is performed in step S211. Thereafter, the process returns to step S204. Specific examples of alternative items will be described later with reference to FIG.

ステップS202でレシート定義データの参照作成が指定された場合,ステップS220へ進み,参照するレシート定義データを手動で選択するか自動で選択するかの指示を入力する。手動で選択する場合,ステップS221へ進む。ステップS221では,既にレシート定義データを作成済みの店舗の店舗コードを指定する情報を入力し,その店舗コードに該当するレシート定義データを定義データ記憶部104から取得し,ステップS226へ進む。   When the receipt creation data reference creation is designated in step S202, the process proceeds to step S220, and an instruction is input to select the receipt definition data to be referred to manually or automatically. When selecting manually, it progresses to step S221. In step S221, information specifying a store code of a store for which receipt definition data has already been created is input, receipt definition data corresponding to the store code is acquired from the definition data storage unit 104, and the process proceeds to step S226.

参照するレシート定義データを自動で選択する場合,ステップS222へ進み,履歴データ記憶部105に格納されている履歴データを参照する。次に,ステップS223では,類似データの有無を判断する。この類似データの有無を判断する処理については,図25を用いて後述する。   When the receipt definition data to be referred to is automatically selected, the process proceeds to step S222, and the history data stored in the history data storage unit 105 is referred to. Next, in step S223, the presence / absence of similar data is determined. The process for determining the presence or absence of similar data will be described later with reference to FIG.

ステップS224の判定により,履歴データ中に,これから作成しようとする店舗のレシート定義データと類似するデータがない場合には,参照作成は不可であるので,ステップS203へ戻り,新規作成と同様な処理を実行する。   If it is determined in step S224 that there is no data similar to the receipt definition data of the store to be created in the history data, reference creation is not possible, so the process returns to step S203, and processing similar to that for new creation is performed. Execute.

履歴データ中に,類似するデータがあると判定された場合には,ステップS225へ進み,その類似した店舗のレシート定義データを取得する。   If it is determined that there is similar data in the history data, the process proceeds to step S225, and receipt definition data of the similar store is acquired.

ステップS226では,ステップS221またはステップS225で取得したレシート定義データから,取得した店舗の読取項目を類推し,定義入力画面30の編集を行う。すなわち,定義入力画面30の初期画面として,OCR読取定義一覧が空欄の画面を表示するのではなく,参照するレシート定義データ中で定義されている読取項目のデータや,売上管理項目一覧における売上管理項目の計算式を埋め込んだ形の画面を作成し,表示する。その後,ステップS204に進む。ステップS204以降の処理は,前述した処理と同様である。これにより,参照作成の場合には,操作員は,参照する店舗のレシート定義データと異なる部分を必要に応じて修正するだけで,新しい店舗のレシート定義データを簡単に作成することができる。   In step S226, the read item of the acquired store is inferred from the receipt definition data acquired in step S221 or step S225, and the definition input screen 30 is edited. That is, as an initial screen of the definition input screen 30, a screen with an empty OCR reading definition list is not displayed, but reading item data defined in the receipt definition data to be referred to and sales management in the sales management item list are displayed. Create and display a screen with the item formula embedded. Thereafter, the process proceeds to step S204. The processing after step S204 is the same as the processing described above. As a result, in the case of reference creation, the operator can easily create receipt definition data for a new store by simply modifying a portion different from the receipt definition data for the store to be referenced as necessary.

上述したステップS209で,読取項目の認識エラーがない,または認識精度が悪くないと判断された場合,図14のステップS230へ進む。ステップS230では,ステップS206で定義された読取項目について,レシート内に同一文字列の項目がないかをチェックする。続く,ステップ231の判定において,同一文字列があると判定された場合には,ステップS233へ進み,同一文字列がないと判定された場合には,ステップS232へ進む。   If it is determined in step S209 described above that there is no reading item recognition error or the recognition accuracy is not bad, the process proceeds to step S230 in FIG. In step S230, the receipt item defined in step S206 is checked for an item of the same character string in the receipt. If it is determined in step 231 that there is an identical character string, the process proceeds to step S233. If it is determined that there is no identical character string, the process proceeds to step S232.

ステップS232では,履歴データを作成した後,処理を終了する。履歴データ作成処理についての詳細は後述する。   In step S232, after the history data is created, the process ends. Details of the history data creation processing will be described later.

同一文字列があった場合,ステップS233により,必要な読取項目を特定するための同一文字列処理を行う。ここでは,マーカー項目の設定や複数キーワードの設定が行われるが,詳しくは後述する。同一文字列処理の後,ステップS204へ戻り,同様に処理を続ける。   If there is the same character string, in step S233, the same character string processing for specifying a necessary reading item is performed. Here, marker items and multiple keywords are set, which will be described in detail later. After the same character string processing, the process returns to step S204 and continues in the same manner.

図18は,演算定義処理(図12のステップS207)の詳細を示すフローチャートである。以下の処理は,入力データ処理部13における演算定義部132が実行する。   FIG. 18 is a flowchart showing details of the calculation definition process (step S207 in FIG. 12). The following processing is executed by the calculation definition unit 132 in the input data processing unit 13.

ステップS301では,演算の定義に対する入力を待ち合わせる。入力があれば,ステップS302へ進み,その入力をもとに,演算を定義する売上管理項目と,その演算に使用する読取項目を選択する。読取項目は,読取項目IDの指定によって選択することができる。読取項目の選択は1個でも複数個でもよい。   In step S301, an input for the calculation definition is awaited. If there is an input, the process proceeds to step S302, and based on the input, a sales management item that defines the calculation and a reading item that is used for the calculation are selected. A reading item can be selected by specifying a reading item ID. One or a plurality of reading items may be selected.

ステップS303では,四則演算の演算子を入力し,演算子の選択を行う。なお,%などの算術記号や演算の順序を指定する括弧記号等を用いることもできる。入力する演算子の数は,選択した読取項目の数による。1個の読取項目の場合には,演算子を入力する必要はない。   In step S303, an arithmetic operation operator is input and the operator is selected. Arithmetic symbols such as% and parenthesis symbols that specify the order of operations can also be used. The number of operators to enter depends on the number of selected reading items. In the case of one reading item, it is not necessary to input an operator.

ステップS304の判定処理により,必要なすべての読取項目および演算子の選択が終了するまで,ステップS301へ戻って同様に処理を繰り返す。   Until the selection of all necessary reading items and operators is completed by the determination process in step S304, the process returns to step S301 and the same process is repeated.

読取項目および演算子の選択が終了したならば,ステップS305では,入力した演算子のチェックを行う。これは,以下のチェックである。
1)定義されていない読取項目IDを使用していないか。
2)使用できない演算子が指定されていないか。
3)設定された計算式を用いて金額を計算した場合に,結果が許容範囲内か。
If the selection of the reading item and the operator is completed, the input operator is checked in step S305. This is the following check.
1) Is an undefined reading item ID used?
2) Is an operator that cannot be used specified?
3) Whether the result is within the allowable range when the amount is calculated using the set formula.

なお,結果が許容範囲内であるかどうかは,実際にレシートの画像データから得られた金額の数値を用いて計算した場合に,基本テーブルに格納されいてる該当する売上管理項目の下限値から上限値までの範囲に入っているかどうかにより判断される。   Whether or not the result is within the allowable range is calculated based on the lower limit value of the corresponding sales management item stored in the basic table when it is calculated using the numerical value of the amount actually obtained from the receipt image data. Judgment is made based on whether the value is within the range.

ステップS306によるチェック結果の判定により,エラーが検出されれば,ステップS301に戻って,読取項目の再選択または演算子の再入力を行う。エラーがなければ,売上管理項目一覧における該当する売上管理項目の計算式の欄に,入力された計算式を表示し,一つの売上管理項目に対する演算定義を終了する。演算定義は,基本的にはすべての売上管理項目に対して行うが,該当する読取項目が存在しない売上管理項目に対しては,未定義であってもよい。   If an error is detected by the determination of the check result in step S306, the process returns to step S301 to reselect the reading item or re-enter the operator. If there is no error, the input calculation formula is displayed in the calculation formula column of the corresponding sales management item in the sales management item list, and the calculation definition for one sales management item is terminated. Calculation definition is basically performed for all sales management items, but may be undefined for sales management items for which no corresponding read item exists.

図19は,演算定義の例を示している。図19(A)に示すように,OCR読取定義一覧表示領域32には,読取項目の純売上(ID=a)と消費税(ID=b)と金券(ID=c)とが定義されていたとする。ここで,売上管理項目である「総売上」,「商品券」について,それぞれ図19(B)に示すような読取項目との対応関係があった場合,図19(C)に示すように,「総売上」に対して「a+b」の計算式の定義,「商品券」に対して「c」の計算式の定義を行う。この計算式を演算定義として,レシート定義データに設定することにより,店舗が発行する実際のレシートから,売上管理項目の金額を算出することが可能になる。   FIG. 19 shows an example of calculation definition. As shown in FIG. 19A, in the OCR reading definition list display area 32, net sales (ID = a), consumption tax (ID = b), and cash voucher (ID = c) of reading items are defined. Suppose. Here, if the sales management items “total sales” and “gift certificate” have a corresponding relationship with the read items as shown in FIG. 19B, as shown in FIG. 19C, Define a calculation formula of “a + b” for “total sales” and a calculation formula of “c” for “gift certificate”. By setting this calculation formula as the operation definition in the receipt definition data, the amount of the sales management item can be calculated from the actual receipt issued by the store.

図20は,ある店舗のレシートと売上管理項目との対応関係が,計算式によって定義されている例を示している。レシートの読取項目は,一般に店舗によって異なるので,テナント管理部門が必要とする売上管理項目と,各店舗のレシートの読取項目との対応関係は,店舗ごとに異なる。しかし,図20に示すように,店舗ごとに計算式を定義することができるので,売上管理項目とレシートの項目との対応づけを柔軟に行うことができる。   FIG. 20 shows an example in which the correspondence between the receipt of a certain store and the sales management item is defined by a calculation formula. Receipt reading items generally differ from store to store, so the correspondence between sales management items required by the tenant management department and receipt reading items at each store differs from store to store. However, as shown in FIG. 20, since a calculation formula can be defined for each store, it is possible to flexibly associate sales management items with receipt items.

図21は,同一文字列処理(図14のステップS233)の詳細を示すフローチャートである。以下の処理は,入力データ処理部13における複数キーワード設定部133およびマーカー項目設定部134が実行する。   FIG. 21 is a flowchart showing details of the same character string processing (step S233 in FIG. 14). The following processing is executed by the multiple keyword setting unit 133 and the marker item setting unit 134 in the input data processing unit 13.

ステップS401では,OCR読取定義一覧表示領域32中で定義された読取項目に同一名称のものが複数あることを示すアラームを表示して,操作員からの入力を待ち合わせる。   In step S401, an alarm indicating that there are a plurality of reading items defined in the OCR reading definition list display area 32 having the same name is displayed, and an input from the operator is waited.

ステップS402では,操作員の入力に対して,複数の同一名称の中の読取項目をマーカー項目によって特定するか,複数キーワードによって特定するかを判定する。マーカー項目が選択された場合,ステップS403へ進み,複数キーワードが選択された場合,ステップS406へ進む。   In step S <b> 402, it is determined whether a reading item in the same name is specified by a marker item or a plurality of keywords in response to an input from the operator. If a marker item is selected, the process proceeds to step S403, and if a plurality of keywords are selected, the process proceeds to step S406.

ステップS403では,マーカー項目の入力を待ち合わせる。マーカー項目の入力方法は,図17で説明した項目領域の設定における入力方法と同様である。ステップS404では,指定されたマーカー項目の文字項目の座標を取得する。続いて,ステップS405では,同一文字列の読取項目の中で,実際に定義で用いる読取項目がマーカー項目の上方向にあるのか下方向にあるのかを示す方向と,マーカー項目からの距離を算出し,読取項目がマーカー項目の上方向にあれば距離を正の値,下方向にあれば距離を負の値で定義する。この距離の値には,実際に日々発行されるレシートにおける読取項目の行位置の変動を考慮して,所定の行数分の距離を余裕分として加算してもよい。   In step S403, input of marker items is waited. The marker item input method is the same as the input method in the item area setting described with reference to FIG. In step S404, the coordinates of the character item of the designated marker item are acquired. In step S405, the direction indicating whether the reading item actually used in the definition is in the upward direction or the downward direction and the distance from the marker item are calculated. If the reading item is in the upward direction of the marker item, the distance is defined as a positive value, and if it is in the downward direction, the distance is defined as a negative value. A distance corresponding to a predetermined number of lines may be added to the distance value as a margin in consideration of fluctuations in the line position of the reading item in a receipt that is actually issued every day.

図22は,マーカー項目の定義例を示している。図22(A)に示すレシート画像表示領域33に表示されたレシート画像において,実際に売上管理項目として必要になる読取項目が「消費税」であったとする。ここでは,「消費税」という同一名称の項目が複数存在するが,このうち,上方にある「消費税」が読取項目として定義したい項目であったとする。そこで,レシート内でユニークな他の項目(この例では「返品明細」)をマーカー項目として定義する。   FIG. 22 shows a definition example of marker items. In the receipt image displayed in the receipt image display area 33 shown in FIG. 22A, it is assumed that the reading item actually required as a sales management item is “consumption tax”. Here, there are a plurality of items with the same name “consumption tax”, and it is assumed that “consumption tax” above is an item to be defined as a read item. Therefore, another item unique in the receipt (in this example, “return item”) is defined as a marker item.

すなわち,図22(B)に示すように,マーカー項目が「返品明細」であり,「消費税」への距離が右方向へ「110」,上方向へ「100」であったとする。このとき,マーカー項目「返品明細」からの読取項目「消費税」への距離として,(110,100)を定義する。   That is, as shown in FIG. 22B, it is assumed that the marker item is “returned goods details” and the distance to “consumption tax” is “110” in the right direction and “100” in the upward direction. At this time, (110, 100) is defined as the distance from the marker item “details of return” to the read item “consumption tax”.

マーカー項目は,1個に限らず複数個定義してもよい。図22(C)の例では,「返品明細」をマーカー項目として定義する他に,「売上明細」についてもマーカー項目の定義を行っている。この場合,すべてのマーカー項目の定義による条件を満たした読取項目だけが,該当する読取項目として抽出され,読取項目がマーカー項目定義の条件を一つでも満たさない場合には,「該当読取項目なし」と認定されることになる。   The number of marker items is not limited to one, and a plurality of marker items may be defined. In the example of FIG. 22C, in addition to defining “returned goods details” as a marker item, a marker item is also defined for “sales details”. In this case, only the read items that satisfy the conditions defined by the definition of all marker items are extracted as the corresponding read items. If the read item does not satisfy any of the marker item definition conditions, Will be certified.

図21のステップS402で,複数キーワードによって読取項目を特定すると判定された場合,ステップS406へ進み,複数キーワードの入力を待ち合わせる。複数キーワードの入力があれば,ステップS407では,複数キーワードの文字項目と金額領域の座標を取得し,複数キーワードの定義とする。   If it is determined in step S402 in FIG. 21 that the reading item is specified by a plurality of keywords, the process proceeds to step S406, and the input of the plurality of keywords is awaited. If there is an input of a plurality of keywords, in step S407, the character items of the plurality of keywords and the coordinates of the amount area are acquired, and the plurality of keywords are defined.

図23に,複数キーワードの設定例を示す。図23の例では,読取項目「総売上」と同一名称の文字項目が,Str#12,Str#22,Str#32の3個存在する。また,その各々に対応する金額の文字列もDat#12「¥168,735」,Dat#22「¥48,195」およびDat#32「¥32,025」の3個存在する。   FIG. 23 shows an example of setting a plurality of keywords. In the example of FIG. 23, there are three character items having the same name as the read item “total sales”, Str # 12, Str # 22, and Str # 32. In addition, there are three character strings corresponding to each of Dat # 12 “¥ 168,735”, Dat # 22 “¥ 48,195”, and Dat # 32 “¥ 32,025”.

ここで必要とする読取項目がStr#12の「総売上」であったとすると,「総売上」の文字列だけではStr#12の読取項目を特定できないので,Str#12を含む複数の文字項目を複数キーワードKey#1として定義する。この例では,「総売上」,「純売上」,「現金在高」および「貸在高」を,複数のキーワードKey#1として定義している。このレシート定義データでは,項目属性#1として複数キーワードを示す「3」を定義し,読取文字#1として「総売上」,「純売上」,「現金在高」,「貸在高」を定義する。また,売上管理項目の収集に必要な,金額の文字列Dat#12の金額欄の相対読取位置#1についてもレシート定義データ中に定義する。これによって,レシート中に「総売上」の文字列が複数個存在しても,複数キーワードがユニークであれば,複数キーワードに一致する文字列に含まれる「総売上」の読取項目が特定されることになる。   If the read item required here is “total sales” of Str # 12, the read item of Str # 12 cannot be specified only by the character string of “total sales”. Therefore, a plurality of character items including Str # 12 are included. Is defined as a plurality of keywords Key # 1. In this example, “total sales”, “net sales”, “cash balance”, and “lending balance” are defined as a plurality of keywords Key # 1. In this receipt definition data, “3” indicating a plurality of keywords is defined as item attribute # 1, and “total sales”, “net sales”, “cash balance”, and “loan amount” are defined as read character # 1. To do. Further, the relative reading position # 1 of the amount column of the amount character string Dat # 12 necessary for collecting the sales management items is also defined in the receipt definition data. As a result, even if there are a plurality of character strings of “total sales” in the receipt, if multiple keywords are unique, the reading item of “total sales” included in the character string matching the plurality of keywords is specified. It will be.

図24は,代替項目の設定例を示す図である。前述した図12のステップS210,S211において,代替項目処理部135が行う処理について説明する。   FIG. 24 is a diagram illustrating an example of setting alternative items. Processing performed by the alternative item processing unit 135 in steps S210 and S211 of FIG. 12 described above will be described.

今,図24(A)に示すように,OCR読取定義一覧表示領域32において,消費税の定義が行われ,また,その項目領域についても座標情報が取得されていたとする。ここで,図24(A)に示すレシート画像表示領域33の表示元となったレシートの原画像について,再度この部分をOCR処理によって文字認識する。実際に操作員が入力した「消費税」と認識された場合には,正しいので代替項目の処理は行わない。違う文字に認識されて認識エラーがあった場合には,図24(B)に示すように,「読取困難な文字列です。代替項目を指定してください。」という代替項目の入力を促す警告メッセージを出力する。なお,実際にOCR処理を行うのではなく,図4(B)に示した認識文字データから,認識精度を推定してもよい。   Now, as shown in FIG. 24A, it is assumed that the consumption tax is defined in the OCR reading definition list display area 32, and the coordinate information is also acquired for the item area. Here, with respect to the original image of the receipt that is the display source of the receipt image display area 33 shown in FIG. If it is actually recognized as “consumption tax” entered by the operator, the substitute item is not processed because it is correct. If there is a recognition error due to recognition of a different character, as shown in FIG. 24 (B), a warning prompting the user to enter an alternative item “This character string is difficult to read. Please specify an alternative item.” Output a message. Instead of actually performing the OCR process, the recognition accuracy may be estimated from the recognized character data shown in FIG.

操作員は,図24(B)に示すような警告メッセージが出力された場合,図24(C)のレシート画像表示領域33における「小計」のような読取が容易なレシート項目を代替項目として指定する。代替項目は,本来の読取項目(消費税)の上側であっても下側であってもどちらでもよいが,行が近いほうが望ましい。この例のように,「小計」が代替項目として指定されると,消費税に対応する金額「¥7,234」の相対読取位置の情報は,レシート定義データ内において,「消費税」からの相対位置ではなく,読取が容易な「小計」からの相対位置が定義される。   When the warning message as shown in FIG. 24B is output, the operator designates an easy-to-read receipt item such as “subtotal” in the receipt image display area 33 of FIG. 24C as an alternative item. To do. The substitute item may be either above or below the original reading item (consumption tax), but it is desirable that the line is close. As in this example, when “subtotal” is specified as an alternative item, the information on the relative reading position of the amount “¥ 7,234” corresponding to the consumption tax is included in the receipt definition data from “consumption tax”. Relative position from “subtotal” that is easy to read is defined, not relative position.

また,代替項目によって定義されたことを示すために,OCR読取定義一覧表示領域32内では,図24(D)に示すように,代替項目「小計」と本来の読取項目「消費税」とが所定の区切記号「!」で連結されて表示される。レシート定義データ内においても,図7(B)に示すように,読取文字が「小計!消費税」と定義され,代替項目によって定義されたことが示される。   In addition, in order to show that the item is defined by the substitute item, the substitute item “subtotal” and the original read item “consumption tax” are displayed in the OCR reading definition list display area 32 as shown in FIG. They are displayed concatenated with a predetermined separator “!”. Also in the receipt definition data, as shown in FIG. 7B, the read character is defined as “subtotal! Consumption tax”, indicating that it is defined by an alternative item.

図25は,類似データの有無を判断する処理(図13のステップS223)の詳細を示すフローチャートである。   FIG. 25 is a flowchart showing details of the process for determining the presence or absence of similar data (step S223 in FIG. 13).

新しい店舗のレシート定義データの作成において,既に作成済みのレシート定義データを参照して作成に利用する場合に,履歴データから類似するレシート定義データを自動抽出する処理を行うために,類似データの有無を判断する。まず,ステップS501では,店舗マスタ103を参照する。また,ステップS502では,履歴データ記憶部105に格納された履歴データを参照する。   When creating receipt definition data for a new store, whether or not there is similar data in order to automatically extract similar receipt definition data from history data when referring to already created receipt definition data Judging. First, in step S501, the store master 103 is referred to. In step S502, the history data stored in the history data storage unit 105 is referred to.

ステップS501,S502で参照した結果,新たにレシート定義データを作成する新規店舗の業種コードと履歴データ中の業種コードとが等しく,かつ,新規店舗のPOSシステム情報と履歴データ中のPOSシステム情報とが等しいものがあるかどうかを,ステップS503およびステップS504で判定する。判定した結果,どちらも等しいものが存在した場合,ステップS506へ進む。どちらも等しいものが存在しない場合には,ステップS505へ進み,判断結果を「類似性無し」とする。   As a result of referring to steps S501 and S502, the business type code of the new store that newly creates receipt definition data is the same as the business type code in the history data, and the POS system information in the new store and the POS system information in the history data Are determined in steps S503 and S504. As a result of the determination, if both are equal, the process proceeds to step S506. If neither is equal, the process proceeds to step S505, and the determination result is “no similarity”.

一方,ステップS506では,「類似性有り」と判断し,ステップS507では,履歴データ(辞書部)を参照する。ステップS508では,履歴データ(辞書部)を参照した結果から,売上管理項目に該当する読取項目を類推する。   On the other hand, in step S506, it is determined that “similarity exists”, and in step S507, history data (dictionary part) is referred to. In step S508, the reading item corresponding to the sales management item is inferred from the result of referring to the history data (dictionary part).

図26は,履歴データ作成処理(図14のステップS232)の詳細を示すフローチャートである。   FIG. 26 is a flowchart showing details of the history data creation process (step S232 in FIG. 14).

ステップS601では,新しくレシート定義データを作成した店舗の店舗コードから店舗マスタ103を参照する。ステップS602では,店舗マスタ103から該当する業種コード,POSシステム情報,精算レシート情報を取得する。ステップS603では,作成したレシート定義データから項目情報,演算情報を取得する。ステップS604では,図10および図11に示すような履歴データと履歴データの辞書部とを作成し,履歴データ記憶部105に格納する。   In step S601, the store master 103 is referenced from the store code of the store for which the receipt definition data has been newly created. In step S602, the corresponding industry code, POS system information, and payment receipt information are acquired from the store master 103. In step S603, item information and calculation information are acquired from the created receipt definition data. In step S604, history data and a history data dictionary as shown in FIGS. 10 and 11 are created and stored in the history data storage unit 105.

以上のレシート定義データを作成する処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。   The processing for creating the receipt definition data described above can be realized by a computer and a software program, and the program can be recorded on a computer-readable recording medium or provided through a network.

1 レシート定義データ作成装置
10 読取機
11 画像データ読込部
12 定義入力画面表示部
13 入力データ処理部
131 座標取得部
132 演算定義部
133 複数キーワード設定部
134 マーカー項目設定部
135 代替項目処理部
14 定義データ作成部
15 履歴データ作成部
101 画像データ記憶部
102 基本データ記憶部
103 店舗マスタ
104 定義データ記憶部
105 履歴データ記憶部
2 レシート
3 表示装置
4 入力装置
DESCRIPTION OF SYMBOLS 1 Receipt definition data creation apparatus 10 Reader 11 Image data reading part 12 Definition input screen display part 13 Input data processing part 131 Coordinate acquisition part 132 Calculation definition part 133 Multiple keyword setting part 134 Marker item setting part 135 Alternative item processing part 14 Definition Data creation unit 15 History data creation unit 101 Image data storage unit 102 Basic data storage unit 103 Store master 104 Definition data storage unit 105 History data storage unit 2 Receipt 3 Display device 4 Input device

Claims (7)

複数の店舗がそれぞれ発行したレシートの画像を認識することにより,各店舗に共通な特定の基本管理項目からなる基本管理データを収集するレシート認識システムが各店舗ごとのレシートの認識に用いるレシート定義データを作成するレシート定義データ作成装置であって,
レシートのイメージデータを含む画像データを記憶する画像データ記憶手段と,
前記基本管理項目の情報を記憶する基本データ記憶手段と,
前記基本データ記憶手段に記憶された基本管理項目の情報の表示と前記画像データ記憶手段に記憶されたレシートのイメージデータの表示とを含む定義入力画面を表示する定義入力画面表示手段と,
前記定義入力画面から,レシートの読取項目と,前記イメージデータにおける前記読取項目に対応する金額欄の位置情報と,前記読取項目と前記基本管理項目との対応情報とを入力する入力データ処理手段と,
前記入力データ処理手段が入力した情報に基づき,前記レシートの読取項目,および前記イメージデータにおける前記読取項目に対応する金額欄の位置情報,および前記読取項目と前記基本管理項目との対応情報を含むレシート定義データを作成する定義データ作成手段と,
作成されたレシート定義データを記憶する定義データ記憶手段とを備える
ことを特徴とするレシート定義データ作成装置。
Receipt definition data used for receipt recognition for each store by a receipt recognition system that collects basic management data consisting of specific basic management items common to each store by recognizing receipt images issued by multiple stores. A receipt definition data creation device for creating
Image data storage means for storing image data including receipt image data;
Basic data storage means for storing information of the basic management items;
Definition input screen display means for displaying a definition input screen including display of information on basic management items stored in the basic data storage means and display of receipt image data stored in the image data storage means;
Input data processing means for inputting a receipt reading item, position information of an amount column corresponding to the reading item in the image data, and correspondence information between the reading item and the basic management item from the definition input screen; ,
Based on the information input by the input data processing means, the receipt reading item, the position information of the amount column corresponding to the reading item in the image data, and the correspondence information between the reading item and the basic management item are included. Definition data creation means for creating receipt definition data;
A receipt definition data creation device comprising: definition data storage means for storing the created receipt definition data.
請求項1記載のレシート定義データ作成装置において,
前記定義入力画面は,前記読取項目に対する演算式の入力画面を有し,
前記入力データ処理手段は,前記定義入力画面に前記読取項目の演算式が入力された場合に,入力された演算式に従って複数の前記読取項目を一つの前記基本管理項目に対応づける対応情報を作成する手段を有する
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to claim 1,
The definition input screen has an operation expression input screen for the reading item,
The input data processing means creates correspondence information for associating a plurality of reading items with one basic management item according to the inputted arithmetic expression when the arithmetic expression of the reading item is input to the definition input screen. A receipt definition data creation device.
請求項1または請求項2記載のレシート定義データ作成装置において,
前記入力データ処理手段は,レシート内に前記読取項目と同一名称の他の項目が存在する場合に,前記読取項目を特定する基準となる複数キーワードまたはマーカー項目を前記定義入力画面から入力する手段を有し,
前記定義データ作成手段は,作成するレシート定義データ内の前記読取項目の定義データに前記複数キーワードまたは前記マーカー項目のデータを設定する手段を有する
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to claim 1 or 2,
The input data processing means is means for inputting a plurality of keywords or marker items as a reference for specifying the read item from the definition input screen when another item having the same name as the read item exists in the receipt. Have
The receipt definition data creation device, wherein the definition data creation means includes means for setting the data of the plurality of keywords or the marker items in the definition data of the reading item in the receipt definition data to be created.
請求項1から請求項3までのいずれか1項に記載のレシート定義データ作成装置において,
前記入力データ処理手段は,前記定義入力画面からの前記レシートの読取項目または前記金額欄の位置情報の入力において,前記レシートのイメージデータの表示における入力装置によるポイント操作またはドラッグ操作に対して,該当する読取項目の文字列または金額の文字列の領域を定めるとともに,その領域の大きさを自動調整し,領域を囲む枠線の表示または強調表示によって文字領域を特定する表示を行う手段を有する
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to any one of claims 1 to 3,
The input data processing means corresponds to a point operation or a drag operation by an input device in displaying the image data of the receipt in inputting the receipt reading item or the position information of the amount column from the definition input screen. There is a means to determine the character area of the reading item to be read or the character string of the monetary amount, to automatically adjust the size of the area, and to specify the character area by displaying or highlighting the frame surrounding the area Receipt definition data creation device characterized by this.
請求項1から請求項4までのいずれか1項に記載のレシート定義データ作成装置において,
前記入力データ処理手段は,入力した前記読取項目について誤認識した場合またはその文字認識精度が悪い場合に,前記読取項目に代替する代替項目をユーザに指定させて代替項目を入力する手段を有し,
前記定義データ作成手段は,前記読取項目に加えて前記代替項目をレシート定義データ内に設定するとともに,前記金額欄の位置情報を前記代替項目からの相対距離で設定する手段を有する
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to any one of claims 1 to 4,
The input data processing means has means for inputting a substitute item by allowing the user to designate a substitute item to be substituted for the read item when the inputted read item is erroneously recognized or when the character recognition accuracy is poor. ,
The definition data creating means has means for setting the substitute item in receipt definition data in addition to the read item, and setting position information of the amount column by a relative distance from the substitute item. Receipt definition data creation device.
請求項1から請求項5までのいずれか1項に記載のレシート定義データ作成装置において,
前記入力データ処理手段は,前記作成されたレシート定義データまたはその履歴データから抽出したデータを,前記定義入力画面に設定し,他のレシート定義データの作成時に参照させる手段を有する
ことを特徴とするレシート定義データ作成装置。
In the receipt definition data creation device according to any one of claims 1 to 5,
The input data processing means includes means for setting the created receipt definition data or data extracted from the history data on the definition input screen and referencing it when creating other receipt definition data. Receipt definition data creation device.
コンピュータを,
請求項1から請求項6までのいずれか1項に記載のレシート定義データ作成装置が備える,前記画像データ記憶手段と,前記基本データ記憶手段と,前記定義入力画面表示手段と,前記入力データ処理手段と,前記定義データ作成手段と,定義データ記憶手段,
として機能させるためのレシート定義データ作成プログラム。
Computer
The receipt definition data creation device according to any one of claims 1 to 6, comprising the image data storage means, the basic data storage means, the definition input screen display means, and the input data processing Means, definition data creation means, definition data storage means,
Receipt definition data creation program to function as
JP2011177408A 2011-08-15 2011-08-15 Receipt definition data creation device and program thereof Active JP5385349B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011177408A JP5385349B2 (en) 2011-08-15 2011-08-15 Receipt definition data creation device and program thereof
CN201210289710.1A CN103150652B (en) 2011-08-15 2012-08-15 Receipt definition data organization device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011177408A JP5385349B2 (en) 2011-08-15 2011-08-15 Receipt definition data creation device and program thereof

Publications (2)

Publication Number Publication Date
JP2013041388A true JP2013041388A (en) 2013-02-28
JP5385349B2 JP5385349B2 (en) 2014-01-08

Family

ID=47889737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011177408A Active JP5385349B2 (en) 2011-08-15 2011-08-15 Receipt definition data creation device and program thereof

Country Status (2)

Country Link
JP (1) JP5385349B2 (en)
CN (1) CN103150652B (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014041442A (en) * 2012-08-22 2014-03-06 Fujitsu Marketing Ltd Receipt definition data preparation device and program
CN104216504A (en) * 2013-05-30 2014-12-17 冲电气工业株式会社 Display control device and display control method
JP2015222556A (en) * 2014-04-30 2015-12-10 キヤノンマーケティングジャパン株式会社 Document system, processing method therefor, and program
JP2016126356A (en) * 2014-12-26 2016-07-11 ブラザー工業株式会社 Image processing program, image processing method, and image processing apparatus
JP2016133917A (en) * 2015-01-16 2016-07-25 東芝テック株式会社 Server and program
JP2018124705A (en) * 2017-01-31 2018-08-09 日本Ics株式会社 Voucher management program
JP2018156403A (en) * 2017-03-17 2018-10-04 富士ゼロックス株式会社 Retrieving apparatus, retrieving program, and retrieving system
JP2021033534A (en) * 2019-08-21 2021-03-01 富士ゼロックス株式会社 Information processing device and information processing program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7081179B2 (en) * 2018-01-31 2022-06-07 セイコーエプソン株式会社 Image processing equipment and image processing program
CN113435993A (en) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 Receipt data recognition system and method thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09147238A (en) * 1995-11-17 1997-06-06 Tec Corp Sales management system
JPH10275196A (en) * 1997-03-28 1998-10-13 Sanyo Electric Co Ltd Data input device
JPH11272794A (en) * 1998-03-24 1999-10-08 Sanyo Electric Co Ltd Receipt data processing device
JP2003223610A (en) * 2002-01-28 2003-08-08 Toshiba Corp Character recognizing device and character recognizing method
JP2005038077A (en) * 2003-07-17 2005-02-10 Hitachi Ltd Written data input device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001184453A (en) * 1999-12-22 2001-07-06 Hitachi Ltd Document processing system and document filing system
JP2002024760A (en) * 2000-06-30 2002-01-25 Toshiba Corp Character reading method, character reader, and carrier sheet

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09147238A (en) * 1995-11-17 1997-06-06 Tec Corp Sales management system
JPH10275196A (en) * 1997-03-28 1998-10-13 Sanyo Electric Co Ltd Data input device
JPH11272794A (en) * 1998-03-24 1999-10-08 Sanyo Electric Co Ltd Receipt data processing device
JP2003223610A (en) * 2002-01-28 2003-08-08 Toshiba Corp Character recognizing device and character recognizing method
JP2005038077A (en) * 2003-07-17 2005-02-10 Hitachi Ltd Written data input device

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014041442A (en) * 2012-08-22 2014-03-06 Fujitsu Marketing Ltd Receipt definition data preparation device and program
CN104216504A (en) * 2013-05-30 2014-12-17 冲电气工业株式会社 Display control device and display control method
CN104216504B (en) * 2013-05-30 2017-05-10 冲电气工业株式会社 Display control device and display control method
JP2015222556A (en) * 2014-04-30 2015-12-10 キヤノンマーケティングジャパン株式会社 Document system, processing method therefor, and program
JP2016126356A (en) * 2014-12-26 2016-07-11 ブラザー工業株式会社 Image processing program, image processing method, and image processing apparatus
JP2016133917A (en) * 2015-01-16 2016-07-25 東芝テック株式会社 Server and program
JP2018124705A (en) * 2017-01-31 2018-08-09 日本Ics株式会社 Voucher management program
JP2018156403A (en) * 2017-03-17 2018-10-04 富士ゼロックス株式会社 Retrieving apparatus, retrieving program, and retrieving system
US10977301B2 (en) 2017-03-17 2021-04-13 Fuji Xerox Co., Ltd. Search apparatus, search system, and non-transitory computer readable medium
JP7017027B2 (en) 2017-03-17 2022-02-08 富士フイルムビジネスイノベーション株式会社 Search device, search program, and search system
JP2021033534A (en) * 2019-08-21 2021-03-01 富士ゼロックス株式会社 Information processing device and information processing program
JP7358838B2 (en) 2019-08-21 2023-10-11 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program

Also Published As

Publication number Publication date
JP5385349B2 (en) 2014-01-08
CN103150652A (en) 2013-06-12
CN103150652B (en) 2016-08-03

Similar Documents

Publication Publication Date Title
JP5385349B2 (en) Receipt definition data creation device and program thereof
JP5702342B2 (en) Receipt definition data creation device and program
US10366123B1 (en) Template-free extraction of data from documents
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
JP6100532B2 (en) Receipt definition data creation device and program thereof
US9213893B2 (en) Extracting data from semi-structured electronic documents
RU2679209C2 (en) Processing of electronic documents for invoices recognition
JP5216890B2 (en) Receipt data recognition device and program thereof
US11403455B2 (en) Electronic form generation from electronic documents
JP5202677B2 (en) Receipt data recognition device and program thereof
CN108241603A (en) A kind of financial statement generation method and system
CN106056418A (en) Invoice submission method, device and system
JP2019191665A (en) Financial statements reading device, financial statements reading method and program
JP2013164740A (en) Accounting information reading system, accounting information reading method, and program
CN112487859A (en) Information processing apparatus, information processing method, and computer readable medium
KR101606788B1 (en) Method of form information management for electronic document-based business processes
JP2011192041A (en) Export control server device, export control method, and program
US20170032469A1 (en) Transaction slip search method, information processing apparatus, and computer product
JP2017151627A (en) Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device
JP7473900B2 (en) FORMAT CREATION DEVICE, FORMAT CREATION METHOD, AND FORMAT CREATION PROGRAM
WO2023047570A1 (en) Information processing device, information processing method, and information processing program
US12088770B2 (en) Display system, display method, and display program for displaying a content of electronic document
JP2015005156A (en) Clientele guidance system and clientele guidance method
US12118002B2 (en) Data processing system
JP7550181B2 (en) Payment management device, payment management method, and payment management program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131003

R150 Certificate of patent or registration of utility model

Ref document number: 5385349

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350