JP2022029398A - Data processing device, data processing method and data processing program - Google Patents

Data processing device, data processing method and data processing program Download PDF

Info

Publication number
JP2022029398A
JP2022029398A JP2020205033A JP2020205033A JP2022029398A JP 2022029398 A JP2022029398 A JP 2022029398A JP 2020205033 A JP2020205033 A JP 2020205033A JP 2020205033 A JP2020205033 A JP 2020205033A JP 2022029398 A JP2022029398 A JP 2022029398A
Authority
JP
Japan
Prior art keywords
unit
display
display area
displayed
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020205033A
Other languages
Japanese (ja)
Inventor
鴻鵬 葛
hong peng Ge
顕 松田
Akira Matsuda
智 小俣
Satoshi Komata
啓太郎 森
Keitaro Mori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fast Accounting Inc
Original Assignee
Fast Accounting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fast Accounting Inc filed Critical Fast Accounting Inc
Priority to JP2020205033A priority Critical patent/JP2022029398A/en
Publication of JP2022029398A publication Critical patent/JP2022029398A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Abstract

PROBLEM TO BE SOLVED: To lighten the confirmation work of persons in charge of accounting.
SOLUTION: A data processing device 1 comprises: a data acquisition unit 151 for acquiring voucher data; a region specification unit 152 for specifying a display region, out of the display region indicated by voucher data, that includes a plurality of items corresponding to numeric values; a numeric value specification unit 153 for specifying a display numeric value that is the numeric value displayed in the display region; a determination unit 154 for determining, on the basis of the result of having added up at least some of the plurality of specified display numeric values, whether or not the region specification unit 152 has correctly specified the display region; and an acceptance unit 156 for causing a display unit to display information that indicates the display region specified by the region specification unit 152 when it is determined by the determination unit 154 that the display region is not correctly specified.
SELECTED DRAWING: Figure 3
COPYRIGHT: (C)2022,JPO&INPIT

Description

本発明は、証憑データを処理するデータ処理装置、データ処理方法及びデータ処理プログラムに関する。 The present invention relates to a data processing apparatus, a data processing method and a data processing program for processing voucher data.

請求書等の証憑データの画像データから商品名及び金額を読み取り、読み取った商品名及び金額に基づいて仕訳データを作成する会計処理システムが知られている(例えば、特許文献1を参照)。 An accounting system is known that reads a product name and amount from image data of voucher data such as an invoice and creates journal data based on the read product name and amount (see, for example, Patent Document 1).

特開2018-173935号公報JP-A-2018-173935

証憑データの画像データでは、金額の表示領域が小さいことから金額の位置を正しく読み取れないことがある。この場合には、証憑データ内の金額が正しく読み取られないため、証憑データを管理するシステムに、正しい金額が登録されない。その結果、正しい金額が登録されたのかを経理担当者が逐一確認する必要があり、業務効率が低下していた。 In the image data of the voucher data, the position of the amount may not be read correctly because the display area of the amount is small. In this case, since the amount in the voucher data cannot be read correctly, the correct amount is not registered in the system for managing the voucher data. As a result, it was necessary for the accounting staff to confirm whether the correct amount was registered one by one, and the work efficiency was reduced.

そこで、本発明はこれらの点に鑑みてなされたものであり、経理担当者の確認作業を軽減することを目的とする。 Therefore, the present invention has been made in view of these points, and an object thereof is to reduce the confirmation work of the accounting staff.

本発明の第1の態様に係るデータ処理装置は、証憑データを取得するデータ取得部と、前記証憑データにおける数値に対応する複数の項目を含む表示領域を特定する領域特定部と、前記表示領域に表示されている数値である表示数値を特定する数値特定部と、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部と、前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部と、を有する。 The data processing device according to the first aspect of the present invention includes a data acquisition unit for acquiring voucher data, an area specifying unit for specifying a display area including a plurality of items corresponding to numerical values in the voucher data, and the display area. Was the area specifying part correctly specifying the display area based on the result of adding at least a part of the specified display value and the numerical value specifying part that specifies the displayed value, which is the numerical value displayed in? A determination unit that determines whether or not the display area is determined, and a display control unit that displays information indicating the display area specified by the area identification unit on the display unit when the determination unit determines that the display area cannot be correctly specified. And have.

前記判定部は、所定列に表示されている複数の前記表示数値と、前記所定列に表示されている複数の前記表示数値を合計した数値を示す表示合計値とを特定し、前記所定列に表示されている複数の前記表示数値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。 The determination unit identifies a plurality of the displayed numerical values displayed in the predetermined column and a display total value indicating a numerical value obtained by totaling the plurality of the displayed numerical values displayed in the predetermined column, and in the predetermined column. When the total value of the plurality of displayed numerical values and the display total value do not match, it may be determined that the area specifying unit cannot correctly specify the display area.

前記判定部は、所定行に表示されている複数の前記表示数値と、前記所定行に表示されている複数の前記表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、前記所定行に表示されている複数の前記表示数値の演算値と、前記表示演算値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。 The determination unit specifies a plurality of the displayed numerical values displayed on the predetermined line and a display operation value indicating the result of performing a predetermined operation based on the plurality of the displayed numerical values displayed on the predetermined line. However, even if it is determined that the area specifying unit cannot correctly specify the display area when the calculated values of the plurality of displayed numerical values displayed on the predetermined line do not match the displayed calculated values. good.

前記判定部は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定してもよい。 In the determination unit, when the total value of the calculated values of the plurality of display values displayed in each of the plurality of lines does not match the display total value, the area identification unit can correctly specify the display area. It may be determined that there is no such thing.

前記データ処理装置は、前記表示領域の少なくとも一部を囲う一以上の枠線を前記証憑データに重畳して表示部に表示させ、前記一以上の枠線のうち、いずれかの枠線の選択を受け付ける受付部をさらに有し、前記数値特定部は、選択された前記枠線に含まれる領域内の前記表示数値を再度特定してもよい。 The data processing device superimposes one or more frame lines surrounding at least a part of the display area on the voucher data and displays them on the display unit, and selects one of the one or more frame lines. The numerical value specifying unit may further specify the displayed numerical value in the area included in the selected frame line.

前記データ処理装置は、前記証憑データに含まれている複数の文字列を特定し、前記複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて前記一以上の枠線を作成する枠線作成部をさらに有してもよい。 The data processing device identifies a plurality of character strings included in the voucher data, and is based on the positions of a plurality of recognized character strings whose probability of being correctly recognized is equal to or higher than a threshold value among the plurality of character strings. Further, it may have a frame line creating unit for creating one or more borders.

前記データ取得部が過去に取得した前記証憑データと、当該証憑データに対して正しいと判定された前記表示領域に対応する枠線とを教師データとして学習し、前記証憑データの入力に対して、複数の前記枠線を出力するモデルを記憶する記憶部を有し、前記受付部は、前記データ取得部が取得した前記証憑データを前記モデルに入力し、前記モデルから出力された複数の前記枠線を前記証憑データに重畳して表示部に表示させてもよい。 The voucher data acquired in the past by the data acquisition unit and the frame line corresponding to the display area determined to be correct for the voucher data are learned as teacher data, and the voucher data is input. The reception unit has a storage unit for storing a model that outputs a plurality of the frame lines, and the reception unit inputs the voucher data acquired by the data acquisition unit into the model, and the plurality of frames output from the model. The line may be superimposed on the voucher data and displayed on the display unit.

本発明の第2の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定するステップと、前記表示領域に表示されている数値である表示数値を特定するステップと、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記表示領域を特定するステップにおいて前記表示領域を正しく特定できたか否かを判定するステップと、前記表示領域を正しく特定できていないと判定した場合に、前記表示領域を特定するステップにおいて特定された前記表示領域を示す情報を表示部に表示させるステップと、を有する。 In the data processing method according to the second aspect of the present invention, a step of acquiring voucher data executed by a computer and a display area including a plurality of items corresponding to numerical values among the display areas indicated by the voucher data are specified. In the step of specifying the display area, the step of specifying the display value which is the numerical value displayed in the display area, and the step of specifying the display area based on the result of adding at least a part of the specified plurality of display values. Displaying information indicating the display area specified in the step of determining whether or not the display area can be correctly specified and the step of specifying the display area when it is determined that the display area cannot be specified correctly. It has a step to be displayed on the unit.

本発明の第3の態様に係るデータ処理プログラムは、コンピュータを、証憑データを取得するデータ取得部、前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部、前記表示領域に表示されている数値である表示数値を特定する数値特定部、特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部、及び、前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部、として機能させる。 The data processing program according to the third aspect of the present invention specifies a computer as a data acquisition unit for acquiring voucher data, and a display area including a plurality of items corresponding to numerical values among the display areas indicated by the voucher data. Based on the result of adding up at least a part of the area specifying unit, the numerical value specifying unit that specifies the displayed numerical value that is the numerical value displayed in the display area, and the specified plurality of displayed numerical values, the area specifying unit displays the display. A determination unit for determining whether or not the area can be correctly specified, and information indicating the display area specified by the area identification unit when the determination unit determines that the display area cannot be specified correctly are displayed. It functions as a display control unit to be displayed on the unit.

本発明によれば、経理担当者の確認作業を軽減することができるという効果を奏する。 According to the present invention, there is an effect that the confirmation work of the accounting staff can be reduced.

データ処理装置の概要を説明するための図である。It is a figure for demonstrating the outline of a data processing apparatus. 被請求者が受領する請求書の一例を示す図である。It is a figure which shows an example of the invoice received by the demandee. データ処理装置の機能構成を示す図である。It is a figure which shows the functional structure of a data processing apparatus. 請求書情報データベースの一例を示す図である。It is a figure which shows an example of an invoice information database. 請求書データに複数の枠線が重畳して表示された例を示す図である。It is a figure which shows the example which superposed and displayed a plurality of borders on the invoice data. データ処理装置における処理の流れを示すフローチャートである。It is a flowchart which shows the flow of processing in a data processing apparatus.

[データ処理装置1の概要]
図1は、データ処理装置1の概要を説明するための図である。データ処理装置1は、スキャナ又はデジタルカメラ等の読取装置2が証憑を読み取ることによって生成された証憑データを取得し、証憑データに含まれる文字列を解析した結果を用いて証憑を管理するための装置であり、例えばコンピュータである。データ処理装置1は、1台のコンピュータにより構成されていてもよく、複数のコンピュータにより構成されていてもよい。証憑は、例えば、請求書や発注書等の、商品の単価、数量、金額等の商品に関する数値が示された証憑である。本実施形態では、証憑が請求書である場合を例として説明を進める。
[Overview of data processing device 1]
FIG. 1 is a diagram for explaining an outline of the data processing device 1. The data processing device 1 acquires voucher data generated by reading a voucher by a reading device 2 such as a scanner or a digital camera, and manages the voucher using the result of analyzing a character string included in the voucher data. It is a device, for example a computer. The data processing device 1 may be configured by one computer or may be configured by a plurality of computers. A voucher is a voucher that shows numerical values related to a product such as a unit price, quantity, and amount of the product, such as an invoice or a purchase order. In this embodiment, the description will proceed by taking the case where the voucher is an invoice as an example.

図2は、被請求者としてのデータ処理装置1のユーザが受領する請求書の一例を示す図である。図2に示す請求書には、請求書を発行した事業者、すなわち取引における代金を請求する請求者の名称、住所、連絡先が記載されている。また、請求書には、件名(図2に示す2020年1月分)、請求の対象となる商品の単価、個数及び商品の合計金額(すなわち小計)、複数の商品の合計金額(すなわち請求額)が記載されている。データ処理装置1は、これら請求書に記載された情報と、読取装置2が請求書を読み取ることによって生成された請求書データを取得した取得日とを関連付けて請求書情報データベースに登録して管理する。 FIG. 2 is a diagram showing an example of an invoice received by a user of the data processing device 1 as a demandee. The invoice shown in FIG. 2 describes the name, address, and contact information of the business operator that issued the invoice, that is, the requester who charges the price in the transaction. In addition, the invoice includes the subject (January 2020 shown in Fig. 2), the unit price of the product to be billed, the total price of the quantity and products (that is, the subtotal), and the total price of multiple products (that is, the billing amount). ) Is described. The data processing device 1 registers and manages the information described in these invoices in the invoice information database in association with the acquisition date when the invoice data generated by the reading device 2 reading the invoice is acquired. do.

データ処理装置1は、請求書に記載された数値に関する情報を取得するにあたり、請求書の表示領域のうち、商品の単価、個数、小計、請求額等の数値に対応する複数の項目を含む表示領域を特定する。データ処理装置1は、表示領域に表示されている数値である表示数値を特定し、特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する。データ処理装置1は、表示領域を正しく特定できていないと判定した場合に、表示領域を示す情報を表示部に表示させる。 When the data processing device 1 acquires information on the numerical value described in the invoice, the data processing device 1 includes a display including a plurality of items corresponding to the numerical value such as the unit price, the quantity, the subtotal, and the invoice amount of the product in the display area of the invoice. Identify the area. The data processing device 1 identifies a display numerical value that is a numerical value displayed in the display area, and determines whether or not the display area can be correctly specified based on the result of adding at least a part of the specified plurality of display numerical values. judge. When the data processing device 1 determines that the display area cannot be correctly specified, the data processing device 1 causes the display unit to display information indicating the display area.

このようにすることで、ユーザは、正しい金額が登録されない場合に、表示領域を確認し、表示領域が正しくないことにより表示数値を特定できなかったのか、表示領域内で表示数値を正しく特定できなかったのかを確認し、その後の対応をとることができる。これにより、データ処理装置1は、ユーザの確認作業を軽減することができる。 By doing so, the user can check the display area when the correct amount is not registered, and can correctly specify the display value in the display area, whether the display value could not be specified because the display area is incorrect. You can check if it wasn't there and take further action. As a result, the data processing device 1 can reduce the user's confirmation work.

[データ処理装置1の機能構成及び動作]
図3は、データ処理装置1の機能構成を示す図である。データ処理装置1は、通信部11と、操作部12と、表示部13と、記憶部14と、制御部15とを有する。制御部15は、データ取得部151と、領域特定部152と、数値特定部153と、判定部154と、枠線作成部155と、受付部156と、登録部157と、学習部158とを有する。
[Functional configuration and operation of data processing device 1]
FIG. 3 is a diagram showing a functional configuration of the data processing device 1. The data processing device 1 includes a communication unit 11, an operation unit 12, a display unit 13, a storage unit 14, and a control unit 15. The control unit 15 includes a data acquisition unit 151, an area identification unit 152, a numerical value identification unit 153, a determination unit 154, a frame line creation unit 155, a reception unit 156, a registration unit 157, and a learning unit 158. Have.

通信部11は、ネットワーク(例えばイントラネット又はインターネット)に接続するための通信インターフェースであり、読取装置2からデータを受信したり、他のコンピュータとの間でデータを送受信したりするための通信コントローラを有する。 The communication unit 11 is a communication interface for connecting to a network (for example, an intranet or the Internet), and provides a communication controller for receiving data from the reading device 2 and transmitting / receiving data to / from another computer. Have.

操作部12は、請求書に重畳して表示された一以上の枠線のうち、いずれかの枠線をユーザが選択する操作を行ったり、文字列や数値を訂正したりするためのキーボード、マウス及びディスプレイ等のデバイスを有する。
表示部13は、情報を表示するディスプレイである。表示部13は、制御部15の指示に基づいて情報を表示する。
The operation unit 12 is a keyboard for performing an operation for the user to select one of the one or more borders displayed superimposed on the invoice, and for correcting a character string or a numerical value. It has devices such as a mouse and a display.
The display unit 13 is a display for displaying information. The display unit 13 displays information based on the instructions of the control unit 15.

記憶部14は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部14は、制御部15が実行するプログラムを記憶する。また、記憶部14は、読取装置2が請求書を読み取ることによって生成された請求書データを記憶する。記憶部14は、さらに、請求書データから抽出された情報を管理する請求書情報データベースを記憶する。 The storage unit 14 has a storage medium such as a ROM (Read Only Memory), a RAM (Random Access Memory), and a hard disk. The storage unit 14 stores a program executed by the control unit 15. Further, the storage unit 14 stores the invoice data generated by the reading device 2 reading the invoice. The storage unit 14 further stores an invoice information database that manages information extracted from the invoice data.

図4は、請求書情報データベースの一例を示す図である。図4に示すように請求書情報データベースは、請求書を発行した事業者を識別する発行事業者名と、請求書の発行日と、請求書データが取得された取得日と、請求書の件名と、複数の商品それぞれの品名と、複数の商品それぞれの単価、購入数、及び購入金額とが関連付けられている。請求書情報データベースにおいては、請求書を特定するための請求書識別情報(例えば請求書番号)がさらに含まれていてもよい。 FIG. 4 is a diagram showing an example of an invoice information database. As shown in FIG. 4, the invoice information database contains the name of the issuing company that identifies the company that issued the invoice, the issue date of the invoice, the acquisition date from which the invoice data was acquired, and the subject of the invoice. And the product name of each of the plurality of products, and the unit price, the number of purchases, and the purchase price of each of the plurality of products are associated with each other. The invoice information database may further include invoice identification information (eg, invoice number) for identifying the invoice.

制御部15は、例えばCPU(Central Processing Unit)である。制御部15は、記憶部14に記憶されたプログラムを実行することにより、データ取得部151と、領域特定部152、数値特定部153、判定部154、枠線作成部155、受付部156、登録部157、及び学習部158として機能する。 The control unit 15 is, for example, a CPU (Central Processing Unit). By executing the program stored in the storage unit 14, the control unit 15 has a data acquisition unit 151, an area identification unit 152, a numerical value identification unit 153, a determination unit 154, a frame line creation unit 155, a reception unit 156, and registration. It functions as a unit 157 and a learning unit 158.

データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する。データ取得部151は、読取装置2から請求書データを直接取得してもよいし、データ処理装置1と通信可能に接続されている端末から請求書データを取得してもよい。 The data acquisition unit 151 acquires the invoice data generated by the reading device 2 reading the invoice. The data acquisition unit 151 may directly acquire the invoice data from the reading device 2, or may acquire the invoice data from a terminal communicably connected to the data processing device 1.

領域特定部152は、請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する。領域特定部152は、例えばOCR処理を実行することにより、請求書データが示す請求書に含まれている文字列を特定する。領域特定部152は、特定した文字列のうち、数字に対応する複数の項目に対応する文字列の位置を特定する。数字に対応する複数の項目は、図2に示す例では、単価、個数、金額、合計である。領域特定部152は、例えば、数値に対応する複数の項目を含む矩形領域を数値に対応する表示領域として特定する。 The area specifying unit 152 specifies a display area including a plurality of items corresponding to numerical values in the display area indicated by the invoice data. The area specifying unit 152 identifies the character string included in the invoice indicated by the invoice data, for example, by executing the OCR process. The area specifying unit 152 specifies the position of the character string corresponding to a plurality of items corresponding to the numbers among the specified character strings. In the example shown in FIG. 2, the plurality of items corresponding to the numbers are the unit price, the number, the amount, and the total. The area specifying unit 152 specifies, for example, a rectangular area including a plurality of items corresponding to a numerical value as a display area corresponding to the numerical value.

数値特定部153は、領域特定部152が特定した表示領域に表示されている数値である表示数値を特定する。具体的には、数値特定部153は、領域特定部152が特定した表示領域に表示されている表示数値を、当該数値に対応する項目と関連付けて特定する。数値特定部153は、請求書において、横に並んでいる複数の表示数値を一つの組み合わせとして特定する。数値特定部153は、図2に示す例において、単価「550」、個数「10」、金額「5500」を一つの組み合わせとして複数の表示数値を特定する。また、数値特定部153は、合計「11,100」を、請求書が示す請求合計金額として特定する。 The numerical value specifying unit 153 specifies a display numerical value which is a numerical value displayed in the display area specified by the area specifying unit 152. Specifically, the numerical value specifying unit 153 specifies the display numerical value displayed in the display area specified by the area specifying unit 152 in association with the item corresponding to the numerical value. The numerical value specifying unit 153 specifies a plurality of displayed numerical values arranged side by side as one combination in the invoice. In the example shown in FIG. 2, the numerical value specifying unit 153 specifies a plurality of displayed numerical values by using the unit price “550”, the number “10”, and the amount “5500” as one combination. Further, the numerical value specifying unit 153 specifies the total "11,100" as the total billing amount indicated by the invoice.

判定部154は、数値特定部153が特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、領域特定部152が表示領域を正しく特定できたか否かを判定する。具体的には、判定部154は、所定列に表示されている複数の表示数値と、所定列に表示されている複数の表示数値を合計した数値を示す表示合計値とを特定し、所定列に表示されている複数の表示数値の合計値と、表示合計値とが一致しない場合に、表示領域を正しく特定できていないと判定する。 The determination unit 154 determines whether or not the area identification unit 152 can correctly specify the display area based on the result of adding at least a part of the plurality of display values specified by the numerical value identification unit 153. Specifically, the determination unit 154 identifies a plurality of display numerical values displayed in a predetermined column and a display total value indicating a numerical value obtained by totaling a plurality of display numerical values displayed in the predetermined column, and identifies the predetermined column. If the total value of the plurality of display values displayed in is not the same as the total display value, it is determined that the display area cannot be specified correctly.

図2に示す例では、判定部154は、「金額」列に表示されている複数の表示数値の合計値である縦計を算出する。そして、判定部154は、算出した縦計と、「合計」に対応して表示されている請求合計金額とが一致するか否かを判定する。判定部154は、縦計と、請求合計金額とが一致しない場合に、表示領域を正しく特定できていないと判定する。図2に示す例において、数値特定部153が、「金額」に対応して、「4,400」、「1,200」のみ特定し、「5,500」の数値の特定ができなかった場合、判定部154は、縦計「5,600」と、請求合計金額「11,100」とが一致せず、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、複数商品の全てに対応する金額を漏れなく取得できているか否かを判定することができる。 In the example shown in FIG. 2, the determination unit 154 calculates a vertical total which is the total value of a plurality of displayed numerical values displayed in the “amount” column. Then, the determination unit 154 determines whether or not the calculated vertical total and the total billing amount displayed corresponding to the "total" match. When the vertical total and the total billing amount do not match, the determination unit 154 determines that the display area cannot be correctly specified. In the example shown in FIG. 2, when the numerical value specifying unit 153 specifies only "4,400" and "1,200" corresponding to the "amount" and cannot specify the numerical value of "5,500". , The determination unit 154 determines that the vertical total "5,600" and the total billing amount "11,100" do not match, and the display area cannot be correctly specified. By doing so, the determination unit 154 can determine whether or not the amount of money corresponding to all of the plurality of products has been acquired without omission.

また、判定部154は、所定行に表示されている複数の表示数値と、所定行に表示されている複数の表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、所定行に表示されている複数の表示数値の演算値と、表示演算値とが一致しない場合に、表示領域を正しく特定できていないと判定する。 Further, the determination unit 154 specifies a plurality of display numerical values displayed on a predetermined line and a display calculation value indicating the result of performing a predetermined operation based on the plurality of display numerical values displayed on the predetermined line. , If the calculated values of a plurality of displayed numerical values displayed on a predetermined line do not match the displayed calculated values, it is determined that the display area cannot be specified correctly.

図2に示す例では、判定部154は、「単価」に対応する表示数値と、「個数」に対応する表示数値との乗算値を横計演算値(表示演算値)として特定する。また、判定部154は、「金額」が、「単価」と「個数」とを乗算した結果を示す横計に対応する表示数値である横計表示数値と特定する。判定部154は、数値特定部153が特定した、各行のそれぞれに対し、算出した横計演算値と、当該横計演算値に対応する横計表示数値とが一致するか否かを判定する。判定部154は、横計演算値と横計表示数値とが一致しない場合に、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、商品に対応する項目「単価」、「個数」、「金額」に対応する表示数値を正しく取得できているか否かを判定することができる。 In the example shown in FIG. 2, the determination unit 154 specifies the multiplication value of the display value corresponding to the "unit price" and the display value corresponding to the "number" as the horizontal total calculation value (display calculation value). Further, the determination unit 154 identifies the "amount" as a horizontal total display value which is a display value corresponding to the horizontal total indicating the result of multiplying the "unit price" and the "quantity". The determination unit 154 determines whether or not the calculated horizontal total calculated value and the horizontal total display value corresponding to the horizontal total calculated value match each of the rows specified by the numerical value specifying unit 153. When the horizontal total calculated value and the horizontal total display value do not match, the determination unit 154 determines that the display area cannot be correctly specified. By doing so, the determination unit 154 can determine whether or not the display numerical values corresponding to the items "unit price", "quantity", and "amount" corresponding to the product can be correctly acquired.

さらに、判定部154は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値、すなわち横計演算値の合計値と、表示合計値とが一致しない場合に、表示領域を正しく特定できていないと判定する。このようにすることで、判定部154は、全ての商品に対応する項目「単価」、「個数」、「金額」に対応する表示数値を漏れなく取得できているか否かを判定することができる。 Further, the determination unit 154 sets the display area when the total value of the calculated values of the plurality of display values displayed in each of the plurality of lines, that is, the total value of the horizontal total calculated values and the total displayed value do not match. Judge that it has not been identified correctly. By doing so, the determination unit 154 can determine whether or not the display numerical values corresponding to the items "unit price", "quantity", and "amount" corresponding to all the products can be acquired without omission. ..

枠線作成部155は、請求書データに重畳して表示させる一以上の枠線を作成する。例えば、記憶部14に、過去に取得した請求書データと、当該請求書データに対して正しいと判定された表示領域を囲う矩形形状の枠線の表示位置とを教師データとして学習し、請求書データの入力に対して、複数の枠線を示す枠線情報を出力するモデルを記憶する。枠線情報は、例えば、請求書データにおける枠線の表示位置及び大きさを示す情報である。 The border creation unit 155 creates one or more borders to be superimposed and displayed on the invoice data. For example, the storage unit 14 learns the invoice data acquired in the past and the display position of the rectangular frame line surrounding the display area determined to be correct for the invoice data as teacher data, and invoices are invoiced. Stores a model that outputs border information indicating multiple borders for data input. The border information is, for example, information indicating the display position and size of the border in the invoice data.

枠線作成部155は、判定部154が表示領域を正しく特定できていないと判定した場合に、記憶部14に記憶されているモデルに、データ取得部151が取得した請求書データを入力し、当該モデルから出力された複数の枠線情報を取得する。そして、枠線作成部155は、取得した枠線情報に基づいて複数の枠線を作成する。 When the determination unit 154 determines that the display area cannot be correctly specified, the frame line creation unit 155 inputs the invoice data acquired by the data acquisition unit 151 into the model stored in the storage unit 14. Acquire multiple border information output from the model. Then, the border creation unit 155 creates a plurality of borders based on the acquired border information.

なお、枠線作成部155は、記憶部14に記憶されているモデルに、データ取得部151が取得した請求書データを入力することにより、複数の枠線を取得したが、これに限らない。枠線作成部155は、請求書データに含まれている複数の文字列を特定し、複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて、請求書データに重畳して表示させる一以上の枠線を作成してもよい。 The frame line creating unit 155 acquires a plurality of borders by inputting the invoice data acquired by the data acquisition unit 151 into the model stored in the storage unit 14, but the present invention is not limited to this. The border creation unit 155 identifies a plurality of character strings included in the invoice data, and is based on the positions of the plurality of recognition character strings whose probability of being correctly recognized is equal to or higher than the threshold value among the plurality of character strings. You may create one or more borders to be superimposed and displayed on the invoice data.

例えば、枠線作成部155は、請求書データに含まれている複数の文字列として、商品名に対応する文字列を特定する。図2に示す例では、枠線作成部155は、「コピー用紙」、「インク」、「ボールペン」を特定する。枠線作成部155は、請求書情報データベースに既に格納されている品名のうち、特定した商品名に一致又は類似する品名を特定する。そして、枠線作成部155は、請求書データから特定した商品名と、当該商品名に一致又は類似する品名との類似度を、商品名が正しく認識されている蓋然性を示す指標として算出する。 For example, the border creation unit 155 specifies a character string corresponding to the product name as a plurality of character strings included in the invoice data. In the example shown in FIG. 2, the frame line creating unit 155 identifies "copy paper", "ink", and "ballpoint pen". The border creation unit 155 identifies a product name that matches or is similar to the specified product name among the product names already stored in the invoice information database. Then, the frame line creating unit 155 calculates the degree of similarity between the product name specified from the invoice data and the product name that matches or is similar to the product name as an index indicating the probability that the product name is correctly recognized.

請求書では、商品名の近傍に単価、個数、金額等の、数値が表示されている蓋然性が高い。このため、枠線作成部155は、算出した類似度が所定の閾値以上の複数の商品名の表示位置を囲うとともに、請求書データにおいて、当該複数の商品名の右側の表示位置を囲う一以上の枠線を作成する。このようにすることで、データ処理装置1は、数値が表示されている蓋然性が高い領域を囲う枠線を作成することができる。 In the invoice, it is highly probable that numerical values such as unit price, quantity, amount, etc. are displayed in the vicinity of the product name. Therefore, the frame line creating unit 155 surrounds the display positions of a plurality of product names whose calculated similarity is equal to or higher than a predetermined threshold value, and at the same time, encloses one or more display positions on the right side of the plurality of product names in the invoice data. Create a border for. By doing so, the data processing apparatus 1 can create a frame line surrounding an area with a high probability that a numerical value is displayed.

受付部156は、表示制御部として機能し、判定部154が表示領域を正しく特定できていないと判定した場合に、領域特定部152が特定した表示領域を示す情報を表示部13に表示させる。例えば、受付部156は、判定部154が表示領域を正しく特定できていないと判定した場合に、請求書データに重畳して、領域特定部152が特定した表示領域の境界を示す枠線を表示部13に表示させる。さらに、受付部156は、判定部154が表示領域を正しく特定できていないことを示す警告情報を表示部13に表示させ、ユーザから表示数値を囲う枠線を表示させ、表示数値を再度特定するかの指示を受け付ける。なお、受付部156は、表示領域の境界を示す枠線を表示部13に表示させたが、これに限らず、表示領域をハイライト表示させる等、他の領域とは異なる態様で表示させてもよい。 The reception unit 156 functions as a display control unit, and when the determination unit 154 determines that the display area cannot be correctly specified, the reception unit 156 causes the display unit 13 to display information indicating the display area specified by the area identification unit 152. For example, when the reception unit 156 determines that the display area cannot be correctly specified, the reception unit 156 superimposes it on the invoice data and displays a frame line indicating the boundary of the display area specified by the area identification unit 152. Displayed on the unit 13. Further, the reception unit 156 causes the display unit 13 to display warning information indicating that the determination unit 154 has not correctly specified the display area, causes the user to display a frame line surrounding the display value, and specifies the display value again. Accept the instruction. The reception unit 156 displays a frame line indicating the boundary of the display area on the display unit 13, but the reception unit 156 is not limited to this, and displays the display area in a different manner from other areas such as highlighting the display area. May be good.

受付部156は、ユーザから表示数値を再度特定する指示を受け付けると、枠線作成部155が作成した、当該表示領域の少なくとも一部を囲う一以上の枠線を請求書データに重畳して表示部13に表示させる。そして、受付部156は、操作部12を介して、一以上の枠線のうち、いずれかの枠線の選択をユーザから受け付ける。 When the reception unit 156 receives an instruction to specify the display numerical value again from the user, the reception unit 156 superimposes and displays one or more frame lines that surround at least a part of the display area created by the frame line creation unit 155 on the invoice data. Displayed on the unit 13. Then, the reception unit 156 receives from the user the selection of one of the one or more frame lines via the operation unit 12.

図5は、請求書データに複数の枠線が重畳して表示された例を示す図である。図5に示す例では、請求書データに2つの枠線L1、L2が表示されていることが確認できる。ユーザは、枠線L1、L2のうち、数値を正しく囲っている枠線を選択する。図5に示す例では、枠線L1が数値を正しく囲っていることから、ユーザは、枠線L1を選択するものとする。なお、受付部156は、操作部12を介して、ユーザから枠線の選択を受け付けた後に、選択された枠線の調整を受け付けるようにしてもよい。 FIG. 5 is a diagram showing an example in which a plurality of borders are superimposed and displayed on the invoice data. In the example shown in FIG. 5, it can be confirmed that the two border lines L1 and L2 are displayed in the invoice data. The user selects a frame line that correctly encloses the numerical value from the frame lines L1 and L2. In the example shown in FIG. 5, since the frame line L1 correctly surrounds the numerical value, the user selects the frame line L1. The reception unit 156 may accept the adjustment of the selected frame line after receiving the selection of the frame line from the user via the operation unit 12.

数値特定部153は、受付部156がユーザから選択を受け付けると、選択された枠線に含まれる領域内の表示数値を再度特定する。数値特定部153は、請求書データにおいて、選択された枠線に囲まれる領域内のOCR処理を領域特定部152に行わせる。数値特定部153は、選択された枠線に囲まれる領域内において特定された数値を表示数値として特定する。その後、判定部154は、数値特定部153が再度特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを再度判定する。 When the reception unit 156 accepts a selection from the user, the numerical value specifying unit 153 again specifies the display numerical value in the area included in the selected frame line. The numerical value specifying unit 153 causes the area specifying unit 152 to perform OCR processing in the area surrounded by the selected frame line in the invoice data. The numerical value specifying unit 153 specifies a numerical value specified in the area surrounded by the selected frame line as a display numerical value. After that, the determination unit 154 redetermines whether or not the display area can be correctly specified based on the result of adding at least a part of the plurality of display numerical values re-specified by the numerical value identification unit 153.

登録部157は、判定部154が表示領域を正しく特定できたと判定すると、複数の表示数値を請求書情報データベースに記憶させる。登録部157は、判定部154が表示領域を正しく特定できたと判定すると、ユーザから、複数の表示数値を請求書情報データベースに記憶させる登録指示を受け付けてもよい。そして、登録部157は、登録指示を受け付けたことに応じて、請求書情報データベースに複数の表示数値を記憶させてもよい。 When the registration unit 157 determines that the display area can be correctly specified by the determination unit 154, the registration unit 157 stores a plurality of display numerical values in the invoice information database. When the registration unit 157 determines that the display area can be correctly specified by the determination unit 154, the registration unit 157 may receive a registration instruction for storing a plurality of display numerical values in the invoice information database from the user. Then, the registration unit 157 may store a plurality of display numerical values in the invoice information database in response to receiving the registration instruction.

学習部158は、複数の枠線を示す枠線情報を出力するモデルの学習を行う。例えば、学習部158は、受付部156が枠線の選択を受け付けた場合、登録部157が複数の表示数値を請求書情報データベースに記憶させた後、データ取得部151が取得した請求書データと、選択された枠線を示す枠線情報とを教師データとして、当該教師データに含まれる請求書データの入力に対し、当該枠線情報を出力するようにモデルの学習を行う。 The learning unit 158 learns a model that outputs frame line information indicating a plurality of frame lines. For example, in the learning unit 158, when the reception unit 156 accepts the selection of the frame line, the registration unit 157 stores a plurality of display numerical values in the invoice information database, and then the invoice data acquired by the data acquisition unit 151. , The frame line information indicating the selected frame line is used as teacher data, and the model is trained so as to output the frame line information in response to the input of the invoice data included in the teacher data.

また、学習部158は、判定部154が、一度目の判定で表示領域を正しく特定できたと判定すると、登録部157が複数の表示数値を請求書情報データベースに記憶させた後、データ取得部151が取得した請求書データと、表示領域を囲う枠線を示す枠線情報とを教師データとして、当該教師データに含まれる請求書データの入力に対し、当該枠線情報を出力するようにモデルの学習を行う。このようにすることで、データ処理装置1においては、複数の表示数値が請求書情報データベースに登録されればされるほどモデルが学習することができるので、表示数値を囲う枠線がモデルから出力される確率を高めることができる。 Further, when the determination unit 154 determines that the display area can be correctly specified in the first determination, the learning unit 158 stores the plurality of display values in the invoice information database by the registration unit 157, and then the data acquisition unit 151. The invoice data acquired by the company and the frame line information indicating the frame line surrounding the display area are used as teacher data, and the frame line information is output in response to the input of the invoice data included in the teacher data. Do learning. By doing so, in the data processing device 1, the more a plurality of displayed numerical values are registered in the invoice information database, the more the model can be learned. Therefore, a frame line surrounding the displayed numerical values is output from the model. You can increase the probability of being done.

[データ処理装置1における処理の流れ]
図6は、データ処理装置1における処理の流れを示すフローチャートである。
まず、データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する(S1)。
[Process flow in data processing device 1]
FIG. 6 is a flowchart showing a processing flow in the data processing apparatus 1.
First, the data acquisition unit 151 acquires the invoice data generated by the reading device 2 reading the invoice (S1).

続いて、領域特定部152は、請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する(S2)。
続いて、数値特定部153は、領域特定部152が特定した表示領域に表示されている数値である表示数値を特定する(S3)。
Subsequently, the area specifying unit 152 identifies a display area including a plurality of items corresponding to the numerical values in the display area indicated by the invoice data (S2).
Subsequently, the numerical value specifying unit 153 specifies a display numerical value which is a numerical value displayed in the display area specified by the area specifying unit 152 (S3).

続いて、判定部154は、数値特定部153が特定した複数の表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する(S4)。判定部154は、表示領域を正しく特定できたと判定すると、S9に処理を移し、表示領域を正しく特定できていないと判定すると、S5に処理を移す。 Subsequently, the determination unit 154 determines whether or not the display area can be correctly specified based on the result of adding at least a part of the plurality of display numerical values specified by the numerical value identification unit 153 (S4). When the determination unit 154 determines that the display area can be correctly specified, the process is transferred to S9, and when the determination unit 154 determines that the display area cannot be correctly specified, the process is transferred to S5.

S5において、受付部156は、表示領域の領域を示す枠線を表示部13に表示させ、ユーザに、表示領域が正しく特定されなかったことを通知する。その後、枠線作成部155は、請求書データに重畳して表示させる一以上の枠線を作成する(S6)。
続いて、受付部156は、枠線作成部155が作成した、表示領域の少なくとも一部を囲う一以上の枠線を請求書データに重畳して表示部13に表示させ(S7)、操作部12を介して、一以上の枠線のうち、いずれかの枠線の選択をユーザから受け付ける(S8)。受付部156は、枠線の選択を受け付けるとS3に処理を移す。
In S5, the reception unit 156 causes the display unit 13 to display a frame line indicating the area of the display area, and notifies the user that the display area has not been correctly specified. After that, the border creation unit 155 creates one or more borders to be superimposed and displayed on the invoice data (S6).
Subsequently, the reception unit 156 superimposes one or more frame lines that surround at least a part of the display area created by the frame line creation unit 155 on the invoice data and displays them on the display unit 13 (S7), and the operation unit. 12 is used to accept the selection of one of the one or more borders from the user (S8). When the reception unit 156 receives the selection of the frame line, the reception unit 156 shifts the processing to S3.

S9において、登録部157は、判定部154が表示領域を正しく特定できたと判定すると、複数の表示数値を請求書情報データベースに記憶させる。
続いて、学習部158は、複数の枠線を示す枠線情報を出力するモデルの学習を行う(S10)。
In S9, when the determination unit 154 determines that the display area can be correctly specified, the registration unit 157 stores a plurality of display numerical values in the invoice information database.
Subsequently, the learning unit 158 learns a model that outputs frame line information indicating a plurality of frame lines (S10).

[データ処理装置1による効果]
以上説明したように、データ処理装置1は、証憑データとしての請求書データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定し、表示領域に表示されている数値である表示数値の少なくとも一部を合算した結果に基づいて、表示領域を正しく特定できたか否かを判定する。そして、データ処理装置1は、表示領域を正しく特定できていないと判定した場合に、表示領域を示す情報を表示部に表示させる。
[Effect of data processing device 1]
As described above, the data processing device 1 identifies a display area including a plurality of items corresponding to numerical values in the display area indicated by the invoice data as voucher data, and uses the numerical values displayed in the display area. Based on the result of adding up at least a part of a certain display numerical value, it is determined whether or not the display area can be correctly specified. Then, when the data processing device 1 determines that the display area cannot be correctly specified, the data processing device 1 causes the display unit to display information indicating the display area.

このようにすることで、ユーザは、表示領域を確認し、表示領域が正しくないことにより表示数値を特定できなかったのか、表示領域内で表示数値を正しく特定できなかったのかを確認し、その後の対応をとることができる。これにより、データ処理装置1は、ユーザの確認作業を軽減することができる。 By doing so, the user checks the display area to see if the display value could not be specified because the display area was incorrect, or if the display value could not be specified correctly within the display area, and then Can be taken. As a result, the data processing device 1 can reduce the user's confirmation work.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist. be. For example, all or part of the device can be functionally or physically distributed / integrated in any unit. Also included in the embodiments of the present invention are new embodiments resulting from any combination of the plurality of embodiments. The effect of the new embodiment produced by the combination has the effect of the original embodiment together.

1 データ処理装置
2 読取装置
11 通信部
12 操作部
13 表示部
14 記憶部
15 制御部
151 データ取得部
152 領域特定部
153 数値特定部
154 判定部
155 枠線作成部
156 受付部
157 登録部
158 学習部
1 Data processing device 2 Reading device 11 Communication unit 12 Operation unit 13 Display unit 14 Storage unit 15 Control unit 151 Data acquisition unit 152 Area specification unit 153 Numerical value specification unit 154 Judgment unit 155 Frame line creation unit 156 Reception unit 157 Registration unit 158 Learning unit Department

Claims (9)

証憑データを取得するデータ取得部と、
前記証憑データにおける数値に対応する複数の項目を含む表示領域を特定する領域特定部と、
前記表示領域に表示されている数値である表示数値を特定する数値特定部と、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部と、
前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる表示制御部と、
を有するデータ処理装置。
The data acquisition department that acquires voucher data, and
An area specifying unit that specifies a display area including a plurality of items corresponding to numerical values in the voucher data, and an area specifying unit.
A numerical value specifying unit that specifies a displayed numerical value, which is a numerical value displayed in the display area, and
A determination unit that determines whether or not the area identification unit can correctly specify the display area based on the result of adding up at least a part of the specified plurality of display values.
A display control unit that displays information indicating the display area specified by the area specifying unit on the display unit when the determination unit determines that the display area cannot be correctly specified.
Data processing device with.
前記判定部は、所定列に表示されている複数の前記表示数値と、前記所定列に表示されている複数の前記表示数値を合計した数値を示す表示合計値とを特定し、前記所定列に表示されている複数の前記表示数値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定する、
請求項1に記載のデータ処理装置。
The determination unit identifies a plurality of the displayed numerical values displayed in the predetermined column and a display total value indicating a numerical value obtained by totaling the plurality of the displayed numerical values displayed in the predetermined column, and displays the total value in the predetermined column. When the total value of the plurality of displayed numerical values and the display total value do not match, it is determined that the area specifying unit cannot correctly specify the display area.
The data processing apparatus according to claim 1.
前記判定部は、所定行に表示されている複数の前記表示数値と、前記所定行に表示されている複数の前記表示数値に基づいて所定の演算を行った結果を示す表示演算値とを特定し、前記所定行に表示されている複数の前記表示数値の演算値と、前記表示演算値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定する、
請求項2に記載のデータ処理装置。
The determination unit specifies a plurality of the displayed numerical values displayed on the predetermined line and a display operation value indicating the result of performing a predetermined operation based on the plurality of the displayed numerical values displayed on the predetermined line. Then, when the calculated values of the plurality of displayed numerical values displayed on the predetermined line do not match the displayed calculated values, it is determined that the area specifying unit cannot correctly specify the displayed area.
The data processing apparatus according to claim 2.
前記判定部は、複数行のそれぞれにおいて表示されている複数の表示数値の演算値の合計値と、前記表示合計値とが一致しない場合に、前記領域特定部が前記表示領域を正しく特定できていないと判定する、
請求項2又は3に記載のデータ処理装置。
In the determination unit, when the total value of the calculated values of the plurality of display values displayed in each of the plurality of lines does not match the display total value, the area identification unit can correctly specify the display area. Judge not,
The data processing apparatus according to claim 2 or 3.
前記表示領域の少なくとも一部を囲う一以上の枠線を前記証憑データに重畳して表示部に表示させ、前記一以上の枠線のうち、いずれかの枠線の選択を受け付ける受付部をさらに有し、
前記数値特定部は、選択された前記枠線に含まれる領域内の前記表示数値を再度特定する、
請求項1から4のいずれか一項に記載のデータ処理装置。
Further, a reception unit that superimposes one or more frame lines surrounding at least a part of the display area on the voucher data and displays them on the display unit and accepts selection of one of the one or more frame lines. Have and
The numerical value specifying unit respecifies the displayed numerical value in the area included in the selected frame line.
The data processing apparatus according to any one of claims 1 to 4.
前記証憑データに含まれている複数の文字列を特定し、前記複数の文字列のうち、正しく認識されている蓋然性が閾値以上である複数の認識文字列の位置に基づいて前記一以上の枠線を作成する枠線作成部をさらに有する、
請求項5に記載のデータ処理装置。
A plurality of character strings included in the voucher data are specified, and among the plurality of character strings, the one or more frames are based on the positions of the plurality of recognition character strings whose probability of being correctly recognized is equal to or higher than the threshold value. It also has a border creation unit that creates lines,
The data processing apparatus according to claim 5.
前記データ取得部が過去に取得した前記証憑データと、当該証憑データに対して正しいと判定された前記表示領域に対応する枠線とを教師データとして学習し、前記証憑データの入力に対して、複数の前記枠線を出力するモデルを記憶する記憶部を有し、
前記受付部は、前記データ取得部が取得した前記証憑データを前記モデルに入力し、前記モデルから出力された複数の前記枠線を前記証憑データに重畳して表示部に表示させる、
請求項5又は6に記載のデータ処理装置。
The voucher data acquired in the past by the data acquisition unit and the frame line corresponding to the display area determined to be correct for the voucher data are learned as teacher data, and the voucher data is input. It has a storage unit for storing a model that outputs a plurality of the borders, and has a storage unit.
The reception unit inputs the voucher data acquired by the data acquisition unit to the model, and superimposes a plurality of the frame lines output from the model on the voucher data and displays them on the display unit.
The data processing apparatus according to claim 5 or 6.
コンピュータが実行する、
証憑データを取得するステップと、
前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定するステップと、
前記表示領域に表示されている数値である表示数値を特定するステップと、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記表示領域を特定するステップにおいて前記表示領域を正しく特定できたか否かを判定するステップと、
前記表示領域を正しく特定できていないと判定した場合に、前記表示領域を特定するステップにおいて特定された前記表示領域を示す情報を表示部に表示させるステップと、
を有するデータ処理方法。
Computer runs,
Steps to get voucher data and
A step of specifying a display area including a plurality of items corresponding to numerical values in the display area indicated by the voucher data, and
A step of specifying a displayed numerical value, which is a numerical value displayed in the display area,
Based on the result of adding up at least a part of the specified plurality of display numerical values, a step of determining whether or not the display area can be correctly specified in the step of specifying the display area, and a step of determining whether or not the display area can be correctly specified.
When it is determined that the display area cannot be correctly specified, the step of displaying the information indicating the display area specified in the step of specifying the display area on the display unit, and the step of displaying the information indicating the display area.
Data processing method.
コンピュータを、
証憑データを取得するデータ取得部、
前記証憑データが示す表示領域のうち、数値に対応する複数の項目を含む表示領域を特定する領域特定部、
前記表示領域に表示されている数値である表示数値を特定する数値特定部、
特定された複数の表示数値の少なくとも一部を合算した結果に基づいて、前記領域特定部が前記表示領域を正しく特定できたか否かを判定する判定部、及び、
前記判定部が前記表示領域を正しく特定できていないと判定した場合に、前記領域特定部が特定した前記表示領域を示す情報を表示部に表示させる、
データ処理プログラム。
Computer,
Data acquisition department to acquire voucher data,
Of the display area indicated by the voucher data, an area specifying unit that specifies a display area including a plurality of items corresponding to numerical values,
Numerical value identification unit that specifies the displayed numerical value, which is the numerical value displayed in the display area.
A determination unit for determining whether or not the area identification unit can correctly specify the display area based on the result of adding up at least a part of the specified plurality of display values, and a determination unit.
When the determination unit determines that the display area cannot be correctly specified, the display unit displays information indicating the display area specified by the area identification unit.
Data processing program.
JP2020205033A 2020-08-04 2020-12-10 Data processing device, data processing method and data processing program Pending JP2022029398A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020205033A JP2022029398A (en) 2020-08-04 2020-12-10 Data processing device, data processing method and data processing program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/JP2020/029777 WO2022029874A1 (en) 2020-08-04 2020-08-04 Data processing device, data processing method, and data processing program
JP2020542356A JP6810303B1 (en) 2020-08-04 2020-08-04 Data processing equipment, data processing method and data processing program
JP2020205033A JP2022029398A (en) 2020-08-04 2020-12-10 Data processing device, data processing method and data processing program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020542356A Division JP6810303B1 (en) 2020-08-04 2020-08-04 Data processing equipment, data processing method and data processing program

Publications (1)

Publication Number Publication Date
JP2022029398A true JP2022029398A (en) 2022-02-17

Family

ID=73992887

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020542356A Active JP6810303B1 (en) 2020-08-04 2020-08-04 Data processing equipment, data processing method and data processing program
JP2020205033A Pending JP2022029398A (en) 2020-08-04 2020-12-10 Data processing device, data processing method and data processing program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020542356A Active JP6810303B1 (en) 2020-08-04 2020-08-04 Data processing equipment, data processing method and data processing program

Country Status (2)

Country Link
JP (2) JP6810303B1 (en)
WO (1) WO2022029874A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023032802A1 (en) * 2021-09-01 2023-03-09 株式会社KPMG Ignition Tokyo Annotation assistance device, annotation assistance method, and annotation assistance program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0737035A (en) * 1993-07-21 1995-02-07 Oki Electric Ind Co Ltd Character recognizer
JP2001084332A (en) * 1999-09-10 2001-03-30 Toshiba Corp Reader and reading method
JP2005326972A (en) * 2004-05-12 2005-11-24 Sun Corp Purchase information management device
JP2009188707A (en) * 2008-02-06 2009-08-20 Seiko Epson Corp Printer and control method thereof
WO2020012539A1 (en) * 2018-07-09 2020-01-16 ファーストアカウンティング株式会社 Journalization element analysis device, accounting system, journalization element analysis method, and journalization element analysis program

Also Published As

Publication number Publication date
JPWO2022029874A1 (en) 2022-02-10
JP6810303B1 (en) 2021-01-06
WO2022029874A1 (en) 2022-02-10

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
RU2679209C2 (en) Processing of electronic documents for invoices recognition
JP2019086984A (en) Computer and document identification method
JP2015118488A (en) System, method and program for inputting account data
JPWO2019008766A1 (en) Voucher processing system and voucher processing program
JP2022125220A (en) Image processing apparatus, image processing method, and program
JP6810303B1 (en) Data processing equipment, data processing method and data processing program
JP2019191665A (en) Financial statements reading device, financial statements reading method and program
JP6810306B1 (en) Data processing equipment, data processing methods and programs
US20220207584A1 (en) Learning device, computer-readable information storage medium, and learning method
JP6944603B1 (en) Data processing equipment, data processing methods and programs
JP2022028599A (en) Data processor, method for processing data, and program
JP2022008289A (en) Bill management device, bill management method and program
JP6844076B1 (en) Data processing equipment, data processing methods and programs
JP2001005886A (en) Data processor and storage medium
JP6802417B1 (en) Data processing equipment, data processing methods and programs
JP6929487B1 (en) Data processing equipment, data processing methods and programs
WO2023062798A1 (en) Information processing system, item value extraction method, model generation method, and program
JP6810302B1 (en) Data processing equipment, data processing methods and programs
JP6855641B1 (en) Data processing equipment, data processing methods and programs
JP2019200692A (en) Accounting journal issue system and accounting journal issue program
JP6967174B1 (en) Data processing equipment, data processing methods and programs
JP2022077946A (en) Data processor, data processing method and program
JP2022035923A (en) Data processing device, data processing method, and program
JP2023020842A (en) Data processing device, data processing method, and program