WO2022102065A1 - データ処理装置、データ処理方法及びプログラム - Google Patents

データ処理装置、データ処理方法及びプログラム Download PDF

Info

Publication number
WO2022102065A1
WO2022102065A1 PCT/JP2020/042309 JP2020042309W WO2022102065A1 WO 2022102065 A1 WO2022102065 A1 WO 2022102065A1 JP 2020042309 W JP2020042309 W JP 2020042309W WO 2022102065 A1 WO2022102065 A1 WO 2022102065A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
invoice
unit
detailed
past
Prior art date
Application number
PCT/JP2020/042309
Other languages
English (en)
French (fr)
Inventor
鴻鵬 葛
顕 松田
智 小俣
啓太郎 森
貴亮 佐藤
央 坂倉
Original Assignee
ファーストアカウンティング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファーストアカウンティング株式会社 filed Critical ファーストアカウンティング株式会社
Priority to JP2020564009A priority Critical patent/JP6844076B1/ja
Priority to PCT/JP2020/042309 priority patent/WO2022102065A1/ja
Priority to JP2021027022A priority patent/JP2022077944A/ja
Publication of WO2022102065A1 publication Critical patent/WO2022102065A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Definitions

  • the present invention relates to a data processing device, a data processing method and a program for processing voucher data.
  • the present invention has been made in view of these points, and an object thereof is to reduce the burden of checking the invoice data.
  • the data processing apparatus has a data acquisition unit for acquiring invoice data indicating an invoice and the same attributes as the invoice data acquired by the data acquisition unit, and the data acquisition unit.
  • the invoice data acquired by the data acquisition unit includes the detail data based on the judgment history indicating the result of determining whether or not the detail data indicating the details is included in the past invoice data acquired in the past. It has a determination unit for determining whether or not the invoice data is included, and an output unit for outputting a determination result as to whether or not the invoice data is included in the invoice data by the determination unit.
  • the data processing device further includes an extraction unit that extracts the issuer of the invoice from the invoice data, and the determination unit includes the past invoice with the same issuer of the invoice extracted by the extraction unit. Based on the determination history of the invoice data, it may be determined whether or not the detailed data is included in the invoice data.
  • the data processing device is based on an extraction unit that extracts text information from the invoice data and a text information extracted by the extraction unit when the determination unit determines that the invoice data contains detailed data. Further, it may have a generation unit for generating the detailed data.
  • the determination unit determines that the invoice data includes the detailed data
  • the determination unit generates the detailed data for the invoice data based on the generation history of the detailed data for the past invoice data. If it is determined whether or not the invoice is generated and the determination unit determines that the detailed data is generated, the detailed data may be generated.
  • the text information includes the name of the issuer of the invoice, the product or service, and the determination unit includes the issuer of the invoice included in the text information and the name of the product or service. It may be determined whether or not the detailed data is generated based on the generation history of the past invoice data in which at least one of the above is the same.
  • the determination unit determines whether or not the determination unit generates the detailed data based on the one or more information contained in the text information and the generation history of the past invoice data to which the invoice issuance destination is the same. May be determined.
  • the data processing device further has a correction unit that corrects the detailed data generated by the generation unit according to the operation of the user, and the determination unit is the generation unit from the invoice data of the invoice acquired in the past. Based on the past detail data generated by the user and the correction history of the past detail data by the correction unit, it is determined whether or not the user needs to confirm the detail data generated by the generation unit, and the output unit. May output a determination result indicating whether or not the user needs to confirm the detailed data generated by the generation unit.
  • the data processing device further includes a setting unit for setting a threshold of reliability of the detailed data used for determining whether or not the user needs to confirm, and the determination unit includes the past detailed data and the past detailed data.
  • the reliability of the detail data is specified based on the correction history of the past detail data by the correction unit, and the specification is based on whether or not the specified reliability exceeds the threshold set by the setting unit. It may be determined whether the data needs to be confirmed by the user.
  • the data processing method has a step of acquiring invoice data indicating an invoice executed by a computer and having the same attributes as the acquired invoice data, and has past invoices acquired in the past. Based on the judgment history showing the result of determining whether or not the detailed data indicating the detailed data is included in the written data, the step of determining whether or not the acquired invoice data includes the detailed data and the acquisition It has a step of outputting a determination result of whether or not detailed data is included in the invoice data.
  • the computer has the same attributes as the data acquisition unit for acquiring the invoice data indicating the invoice and the invoice data acquired by the data acquisition unit, and the data acquisition unit.
  • the invoice data acquired by the data acquisition unit includes the detail data based on the judgment history indicating the result of determining whether or not the detail data indicating the details is included in the past invoice data acquired in the past. It functions as a determination unit for determining whether or not the data is included, and an output unit for outputting the determination result as to whether or not the invoice data included in the invoice data by the determination unit.
  • FIG. 1 is a diagram for explaining an outline of the data processing device 1 according to the first embodiment.
  • the data processing device 1 acquires invoice data, which is image data of an invoice generated by reading an invoice by a reading device 2 such as a scanner or a digital camera, and analyzes a character string included in the invoice data.
  • a device for managing invoices using results such as a computer.
  • the data processing device 1 may be configured by one computer or may be configured by a plurality of computers.
  • FIG. 2 is a diagram showing an example of an invoice received by a user of the data processing device 1 as a demandee.
  • the invoice shown in FIG. 2 displays the name, address, and contact information of the business operator that issued the invoice, that is, the business partner who charges the price in the transaction.
  • the invoice includes the subject (January 2020 shown in Fig. 2), the unit price of the product to be billed, the total price of the quantity and products (that is, the subtotal), and the total price of multiple products (that is, the billing amount). ) Is displayed.
  • the invoice shows the payee's bank account and the due date.
  • the data processing device 1 associates the information displayed on these invoices with the acquisition date when the invoice data generated by the reading device 2 reading the invoice is acquired, and registers and manages the information in the invoice information database. do.
  • the data processing device 1 When the data processing device 1 acquires the invoice data, it has the same attributes as the invoice data, determines whether or not the invoice data acquired in the past includes detailed data, and outputs the determination result. ..
  • An attribute is at least one type of information contained in an invoice indicated by the invoice data that correlates with the presence or absence of line item data, such as the invoice's account name, transfer destination. Account number, person in charge name, product name or service name. Having the same attribute means, for example, that at least one kind of information indicating the content of the invoice data is the same. By doing so, the user can easily determine whether or not the invoice data includes the details as compared with the case where the determination result is not output by confirming the determination result. As a result, the data processing device 1 can reduce the burden of checking the invoice data.
  • FIG. 3 is a diagram showing a functional configuration of the data processing device 1 according to the first embodiment.
  • the data processing device 1 includes a communication unit 11, an operation unit 12, a display unit 13, a storage unit 14, and a control unit 15.
  • the control unit 15 includes a data acquisition unit 151, an extraction unit 152, a determination unit 153, a generation unit 154, an output unit 155, a correction unit 156, and a registration unit 157.
  • the communication unit 11 is a communication interface for connecting to a network (for example, an intranet or the Internet), and provides a communication controller for receiving data from the reading device 2 and transmitting / receiving data to / from another computer.
  • a network for example, an intranet or the Internet
  • the operation unit 12 has a device such as a keyboard, a mouse, and a display for correcting character strings and numerical values read from the invoice.
  • the display unit 13 is a display for displaying information.
  • the display unit 13 displays information based on the instructions of the control unit 15.
  • the storage unit 14 has a storage medium such as a ROM (ReadOnlyMemory), a RAM (RandomAccessMemory), and a hard disk.
  • the storage unit 14 stores a program executed by the control unit 15. Further, the storage unit 14 stores the invoice data generated by the reading device 2 reading the invoice.
  • the storage unit 14 further stores an invoice information database that manages information extracted from the invoice data.
  • FIG. 4 is a diagram showing an example of an invoice information database.
  • the invoice information database includes the reference data shown in FIG. 4 (a) and the detailed data shown in FIG. 4 (b).
  • the invoice data includes the invoice ID for identifying the invoice, the name of the supplier who identifies the supplier who issued the invoice, the issue date of the invoice, the acquisition date when the invoice data was acquired, and the price. It is the data that associates the payment date of the invoice, the invoice amount, and the subject of the invoice.
  • the detailed data is data in which the invoice ID, the product name of each of the plurality of products, and the unit price, the number of purchases, and the purchase price of each of the plurality of products are associated with each other.
  • the reference data is used, for example, to make a single journal entry in an accounting system (not shown) to which the data is output.
  • the detailed data is used, for example, for performing compound journals in the accounting system to which the data is output.
  • the control unit 15 is, for example, a CPU (Central Processing Unit).
  • the control unit 15 functions as a data acquisition unit 151, an extraction unit 152, a determination unit 153, a generation unit 154, an output unit 155, a correction unit 156, and a registration unit 157 by executing a program stored in the storage unit 14. do.
  • a CPU Central Processing Unit
  • the data acquisition unit 151 acquires the invoice data generated by the reading device 2 reading the invoice.
  • the data acquisition unit 151 may directly acquire the invoice data from the reading device 2, or may acquire the invoice data from a terminal communicably connected to the data processing device 1.
  • the extraction unit 152 extracts the text information contained in the invoice from the invoice data by executing the OCR process.
  • the text information includes at least the issuer (customer) of the invoice, the issuer, the issue date, the due date, and the invoice amount. If the invoice contains a statement, the textual information includes the name, unit price, quantity, and subtotal of the goods or services.
  • the extraction unit 152 extracts the issuer information indicating the issuer of the invoice from the text information included in the invoice.
  • the determination unit 153 determines whether or not the invoice data acquired by the data acquisition unit 151 includes detailed data.
  • the determination unit 153 has the same attributes as the invoice data acquired by the data acquisition unit 151, and determines whether or not the past invoice data acquired by the data acquisition unit 151 includes the detail data indicating the details. Based on the determination history indicating the result, it is determined whether or not the invoice data acquired by the data acquisition unit 151 includes detailed data.
  • the determination unit 153 has acquired the invoice data based on the determination history of the past invoice data issued by the issuer in the past, which is indicated by the issuer information extracted by the extraction unit 152 from the invoice data acquired by the data acquisition unit 151. It is determined whether or not the detailed data is included in the document data.
  • the determination unit 153 determines whether or not the acquired invoice data includes detailed data using the first classification model stored in the storage unit 14.
  • the first classification model is, for example, a model of a neural network that outputs information indicating whether or not detailed data is included in the invoice data when the invoice data and the issuer information are input.
  • the first classification model includes the past invoice data acquired by the data acquisition unit 151 in the past, the issuer information of the past invoice data, and the determination result of whether or not the past invoice data includes detailed data. It is generated by learning based on the teacher data including, and is stored in the storage unit 14.
  • the determination unit 153 inputs the invoice data acquired by the data acquisition unit 151 and the issuer information extracted by the extraction unit 152 into the first classification model, and acquires the determination result output from the first classification model. It is determined whether or not the acquired invoice data includes detailed data.
  • the determination unit 153 has determined whether or not the invoice data includes detailed data using the first classification model, but the present invention is not limited to this.
  • the determination unit 153 generates determination history information in which the issuer information indicating the issuer of the invoice and the determination result of whether or not the invoice data of the invoice issued by the issuer includes detailed data are associated with each other. Based on the determination result associated with the issuer indicated by the issuer information extracted from the invoice data by the extraction unit 152, it is determined whether or not the acquired invoice data includes detailed data. May be good.
  • the determination unit 153 determines that the invoice data includes the detailed data, whether or not to generate the detailed data for the invoice data based on the generation history of the detailed data for the past invoice data. Is determined. The determination unit 153 is based on the generation history of detailed data of past invoice data in which at least one of the issuer of the invoice included in the text information extracted by the extraction unit 152 and the name of the product or service is the same. It is determined whether or not to generate detailed data.
  • the determination unit 153 determines whether or not the acquired invoice data includes detailed data using the second classification model stored in the storage unit 14.
  • the second classification model for example, when the issuer information and the name of the product or service included in the text information extracted by the extraction unit 152 are input, information indicating whether or not to create detailed data is input. This is a model of the neural network to be output.
  • the second classification model is detailed from the issuer information of the past invoice data acquired in the past by the data acquisition unit 151, the names of one or more products or services included in the past invoice data, and the past invoice data. It is assumed that the data is generated by learning based on the teacher data including the determination result of whether or not to create the data, and is stored in the storage unit 14.
  • the determination unit 153 determines that the invoice data includes detailed data
  • the determination unit 152 classifies the issuer information extracted by the extraction unit 152 and the name of one or more products or services included in the text information into a second classification model. It is determined whether or not to generate detailed data by inputting to and acquiring the determination result output from the second classification model.
  • the determination unit 153 used the second classification model to determine whether or not to generate detailed data, but the present invention is not limited to this.
  • the determination unit 153 refers to the invoice information database stored in the storage unit 14, and whether or not there is detailed data corresponding to the past invoice data of the same issuer as the issuer of the acquired invoice data. It may be determined whether or not to generate detailed data by determining.
  • the determination unit 153 generates detailed data from the acquired invoice data based on one or more information included in the text information and the generation history of the past invoice data to which the invoice issuance destination is the same. It may be determined whether or not. For example, whether or not the determination unit 153 generates detailed data from the acquired invoice data based on the generation history of the past invoice data in which the issuer included in the text information and the invoice issue destination are the same. May be determined. By doing so, for example, when reading invoices sent to each of a plurality of bases of the organization to which the user belongs, whether or not to generate detailed data from the invoice data corresponds to the invoice. It can be judged for each base.
  • the generation unit 154 generates the reference data based on the text information extracted by the extraction unit 152. For example, the generation unit 154 generates the invoice ID of the invoice data acquired by the data acquisition unit 151, and sets the current date as the invoice acquisition date. Further, the generation unit 154 specifies the customer name, issue date, payment date, and billing amount of the business partner who is the issuer of the invoice from the text information extracted by the extraction unit 152. The generation unit 154 generates invoice data in which the invoice ID, the customer name, the issue date, the acquisition date, the payment due date, and the invoice amount are associated with each other.
  • the generation unit 154 generates the detailed data from the invoice data when it is determined by the determination unit 153 that the detailed data is included in the invoice data and the detailed data is generated from the invoice data.
  • the generation unit 154 specifies the name, unit price, quantity, and subtotal of each of the one or more goods or services included in the invoice from the text information extracted by the extraction unit 152.
  • the generation unit 154 generates detailed data in which the invoice ID generated when the invoice data is generated is associated with the name, unit price, quantity, and subtotal of each of the specified one or more goods or services.
  • the output unit 155 outputs the reference data generated by the generation unit 154 to the display unit 13.
  • the output unit 155 outputs the detailed data to the display unit 13.
  • the output unit 155 outputs to the display unit 13 a determination result as to whether or not the invoice data by the determination unit 153 includes detailed data.
  • the output unit 155 outputs text information or an image indicating whether or not the invoice data by the determination unit 153 includes detailed data to the display unit 13.
  • the output unit 155 may output the invoice data to the display unit 13.
  • the output unit 155 outputs a reading result screen including at least the reference data and the determination result of whether or not the invoice data includes the detailed data to the display unit 13.
  • FIG. 5 is a diagram showing an example of a reading result screen according to the first embodiment.
  • the determination unit 153 determines that the invoice data does not include the detailed data, so that the text information indicating the determination result that "the invoice does not include the detailed data" is displayed. You can confirm that it is displayed. By confirming the determination result output to the display unit 13, the user can easily confirm whether or not the invoice data includes the detailed data.
  • the correction unit 156 corrects at least one of the reference data and the detailed data generated by the generation unit 154 according to the operation of the user. For example, in the example shown in FIG. 5, a correction button for accepting correction of the reference data is displayed. For example, when the correction button is pressed, the correction unit 156 accepts the correction of the reference data shown in FIG. When the correction unit 156 receives the correction, the correction unit 156 reflects the correction result on the reading result screen. Further, when the correction unit 156 receives the correction, the correction unit 156 generates correction history information indicating the correction history. For example, the correction unit 156 generates correction history information in which the invoice ID, the data before the correction, and the data after the correction are associated with each other, and stores the correction history information in the storage unit 14.
  • the registration unit 157 registers the reference data generated by the generation unit 154 in the invoice information database according to the user's operation. Further, when the detail data generated by the generation unit 154 is generated, the registration unit 157 registers the detail data in the invoice information database according to the operation of the user. In the example shown in FIG. 5, a registration button for accepting registration in the invoice information database is displayed. When the registration button is pressed, the registration unit 157 registers the reference data displayed on the reading result screen in the invoice information database. Further, when the registration button is pressed when the detailed data is displayed on the reading result screen, the registration unit 157 also registers the detailed data displayed on the reading result screen in the invoice information database.
  • FIG. 6 is a flowchart showing a processing flow in the data processing apparatus 1 according to the first embodiment.
  • the data acquisition unit 151 acquires the invoice data generated by the reading device 2 reading the invoice (S1).
  • the extraction unit 152 extracts the text information included in the invoice data (S2).
  • the determination unit 153 determines whether or not the invoice data includes detailed data (S3). When the determination unit 153 determines that the invoice data contains the detailed data, the determination unit 153 transfers the process to S4, and when the determination unit 153 determines that the invoice data does not include the detailed data, the determination unit 153 processes the S7. Move.
  • the determination unit 153 determines whether or not to generate detailed data from the invoice data (S4).
  • the process is transferred to S5
  • the determination unit 153 determines that the detailed data is not generated from the invoice data
  • the generation unit 154 When the determination unit 153 determines that the invoice data includes the detailed data and determines that the detailed data is generated from the invoice data, the generation unit 154 generates the reference data and the detailed data (S5). Then, the output unit 155 outputs a reading result screen including a determination result as to whether or not the detailed data is included in the reference data, the detailed data, and the invoice data by the determination unit 153 to the display unit 13 (S6).
  • the determination unit 153 determines that the invoice data does not include the detailed data, or when the generation unit 154 determines that the detailed data is not generated from the invoice data, the generation unit 154 does not generate the detailed data. Only the data is generated (S7). Then, the output unit 155 outputs a reading result screen including a determination result as to whether or not the detailed data is included in the invoice data and the invoice data by the determination unit 153 to the display unit 13 (S8).
  • the correction unit 156 accepts the correction of the reference data displayed on the reading result screen according to the user's operation. Further, when the detailed data is displayed on the reading result screen, the correction unit 156 accepts the correction of the detailed data displayed on the reading result screen according to the user's operation (S9). It should be noted that the process of S9 is performed according to the correction operation of the user, and is not always performed.
  • the registration unit 157 registers the reference data generated by the generation unit 154 in the invoice information database according to the operation of the user. Further, when the detail data generated by the generation unit 154 is generated, the registration unit 157 registers the data in the invoice information database according to the operation of the user (S10).
  • the data processing device 1 according to the first embodiment has the same attributes as the acquired invoice data, and whether or not the past invoice data acquired in the past includes detailed data indicating the details. It is determined whether or not the acquired invoice data includes detailed data based on the determination history indicating the result of the determination. Then, the data processing device 1 outputs a determination result as to whether or not the invoice data includes detailed data. By doing so, the user can easily determine whether or not the invoice data includes the details by checking the determination result. As a result, the data processing device 1 can reduce the burden of checking the invoice data.
  • the determination unit 153 is based on the past detail data generated by the generation unit 154 from the invoice data of the invoice acquired in the past and the correction history by the correction unit 156 for the past detail data. It is determined whether or not the user needs to confirm the detailed data generated by the generation unit 154.
  • the determination unit 153 determines whether or not the acquired invoice data includes detailed data using the third classification model stored in the storage unit 14.
  • the third classification model is a model of a neural network that outputs information indicating whether or not the user needs to confirm the detailed data when the detailed data is input.
  • the third classification model is based on the teacher data including the past detailed data of the past invoice data acquired by the data acquisition unit 151 in the past and the information indicating whether or not the user needs to confirm the past detailed data. Generated by learning. Information indicating whether or not the past detail data needs to be confirmed is generated based on whether or not there is a correction history of the past detail data. Whether or not the determination unit 153 needs to confirm the detail data by inputting the detail data generated by the generation unit 154 into the third classification model and acquiring the determination result output from the third classification model. Is determined.
  • the determination unit 153 has determined whether or not the user needs to confirm the detailed data using the third classification model, but the present invention is not limited to this. Whether or not the determination unit 153 stores in the storage unit 14 the correction history of the past detailed data corresponding to the past invoice data issued in the past by the issuer extracted from the invoice data acquired by the data acquisition unit 151. Based on the above, it may be determined whether or not the user needs to confirm the generated detailed data.
  • the determination unit 153 determines whether or not the user needs to confirm the generated detailed data, but is not limited to this, and also determines whether or not the user needs to confirm the generated reference data. You may. In this case, the determination unit 153 stores in the storage unit 14 the correction history of the past book data corresponding to the past invoice data issued in the past by the issuer extracted from the invoice data acquired by the data acquisition unit 151. It is determined whether or not the user needs to confirm the generated data based on whether or not the data is generated.
  • the output unit 155 outputs a determination result indicating whether or not the user needs to confirm the detailed data generated by the generation unit 154.
  • the output unit 155 outputs a reading result screen including at least the reference data, the detailed data, and a determination result as to whether or not the user needs to confirm the detailed data to the display unit 13.
  • the determination unit 153 determines whether or not the user needs to confirm the reference data generated by the generation unit 154
  • the output unit 155 determines whether or not the user needs to confirm the reference data.
  • the result may be included in the reading result screen.
  • the data processing device 1 according to the second embodiment includes the past detailed data generated from the invoice data of the invoice acquired in the past and the correction history by the correction unit 156 for the past detailed data. Based on the above, it is determined whether or not the user needs to confirm the detailed data generated by the generation unit 154, and the determination result is output. By doing so, the user can easily determine whether or not to carefully check the detailed data, so that the burden of checking the invoice data can be further reduced.
  • the data processing device 1 according to the third embodiment is different from the second embodiment in that it outputs information indicating whether or not a person needs to confirm the detailed data based on the reliability of the generated detailed data.
  • FIG. 7 is a diagram showing a functional configuration of the data processing device 1 according to the third embodiment.
  • the control unit 15 of the data processing device 1 according to the third embodiment further includes a setting unit 158.
  • the third classification model outputs the reliability of the detailed data as information indicating that the user needs to confirm the detailed data generated by the generation unit 154.
  • the setting unit 158 sets a threshold value of reliability of detailed data used for determining whether or not the user needs to confirm. For example, the setting unit 158 sets the threshold value of the reliability of the detailed data by receiving the designation of the threshold value of the reliability of the detailed data from the user via the operation unit 12.
  • the determination unit 153 specifies the reliability of the detailed data generated by the generation unit 154 based on the past detailed data and the correction history of the past detailed data by the correction unit. Specifically, the determination unit 153 inputs the generated detailed data into the third classification model, and acquires the reliability from the third classification model. The determination unit 153 determines whether or not the user needs to confirm the detailed data based on whether or not the specified reliability exceeds the threshold value set by the setting unit 158.
  • the output unit 155 outputs a reading result screen including at least the reference data, the detailed data, and a determination result as to whether or not the user needs to confirm the detailed data to the display unit 13. do.
  • the data processing device 1 according to the third embodiment sets a threshold value of the reliability of the detailed data used for determining whether or not the user needs to confirm, and specifies the reliability of the detailed data. Then, it is determined whether or not the user needs to confirm the detailed data based on whether or not the specified reliability exceeds the set threshold value. By doing so, for example, by adjusting the threshold value to a high value, the user causes the determination unit 153 to determine that the detailed data with high reliability does not need to be confirmed by a person, and the reliability is relatively low. , The user can be made to focus on the detailed data determined by the determination unit 153 that the user needs to confirm.
  • the invoice data is supposed to be data created by reading by the reading device 2, but is not limited to this, and may be electronic data such as a pdf file created by a computer.
  • all or part of the device can be functionally or physically distributed / integrated in any unit.
  • Also included in the embodiments of the present invention are new embodiments resulting from any combination of the plurality of embodiments. The effect of the new embodiment produced by the combination has the effect of the original embodiment together.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

データ処理装置1は、請求書を示す請求書データを取得するデータ取得部151と、データ取得部151が取得した請求書データと同じ属性を有し、データ取得部151が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、データ取得部151が取得した請求書データに明細データが含まれているか否かを判定する判定部153と、判定部153による請求書データに明細データが含まれているか否かの判定結果を出力する出力部155と、を有する。

Description

データ処理装置、データ処理方法及びプログラム
 本発明は、証憑データを処理するデータ処理装置、データ処理方法及びプログラムに関する。
 請求書の画像データから商品名及び金額を含む明細を読み取り、読み取った明細を示す明細データに基づいて仕訳データを作成する会計処理システムが知られている(例えば、特許文献1を参照)。
特開2018-173935号公報
 請求書の画像データに明細が含まれていない場合に明細を読み取ろうとすると、誤認識が発生してしまう。このため、担当者が、請求書の画像データからの読み取りが正常に行われたか否かを逐一確認する必要があり、確認作業が煩雑であった。
 そこで、本発明はこれらの点に鑑みてなされたものであり、請求書データの確認作業の負担を軽減することを目的とする。
 本発明の第1の態様に係るデータ処理装置は、請求書を示す請求書データを取得するデータ取得部と、前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部と、前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部と、を有する。
 前記データ処理装置は、前記請求書データから前記請求書の発行元を抽出する抽出部をさらに有し、前記判定部は、前記抽出部が抽出した前記請求書の発行元が同一の前記過去請求書データの前記判定履歴に基づいて、前記請求書データに前記明細データが含まれているか否かを判定してもよい。
 前記データ処理装置は、前記請求書データからテキスト情報を抽出する抽出部と、前記請求書データに明細データが含まれていると前記判定部が判定すると、前記抽出部が抽出したテキスト情報に基づいて前記明細データを生成する生成部と、をさらに有してもよい。
 前記判定部は、前記請求書データに明細データが含まれていると判定すると、前記過去請求書データに対する前記明細データの生成履歴に基づいて、前記請求書データに対して前記明細データを生成するか否かを判定し、前記生成部は、前記明細データを生成すると前記判定部が判定すると、前記明細データを生成してもよい。
 前記テキスト情報には、前記請求書の発行元、商品又はサービスの名称が含まれており、前記判定部は、前記テキスト情報に含まれている前記請求書の発行元と、商品又はサービスの名称との少なくともいずれかが同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定してもよい。
 前記判定部は、前記テキスト情報に含まれている一以上の情報と、前記請求書の発行先が同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定してもよい。
 前記データ処理装置は、ユーザの操作に応じて前記生成部が生成した明細データを訂正する訂正部をさらに有し、前記判定部は、過去に取得された請求書の請求書データから前記生成部が生成した過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記生成部が生成した明細データをユーザが確認する必要があるか否かを判定し、前記出力部は、前記生成部が生成した明細データをユーザが確認する必要があるか否かを示す判定結果を出力してもよい。
 前記データ処理装置は、前記ユーザが確認する必要があるか否かの判定に用いる前記明細データの信頼度の閾値を設定する設定部をさらに有し、前記判定部は、前記過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記明細データの信頼度を特定し、特定した信頼度が前記設定部が設定した前記閾値を超えるか否かに基づいて、前記明細データをユーザが確認する必要があるか否かを判定してもよい。
 本発明の第2の態様に係るデータ処理方法は、コンピュータが実行する、請求書を示す請求書データを取得するステップと、取得した請求書データと同じ属性を有し、過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定するステップと、取得した請求書データに明細データが含まれているか否かの判定結果を出力するステップと、を有する。
 本発明の第3の態様に係るプログラムは、コンピュータを、請求書を示す請求書データを取得するデータ取得部、前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部、及び、前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部、として機能させる。
 本発明によれば、請求書データの確認作業の負担を軽減することができるという効果を奏する。
第1実施形態に係るデータ処理装置の概要を説明するための図である。 被請求者が受領する請求書の一例を示す図である。 第1実施形態に係るデータ処理装置の機能構成を示す図である。 請求書情報データベースの一例を示す図である。 第1実施形態に係る読取結果画面の一例を示す図である。 第1実施形態に係るデータ処理装置における処理の流れを示すフローチャートである。 第3実施形態に係るデータ処理装置の機能構成を示す図である。
<第1実施形態>
[データ処理装置1の概要]
 図1は、第1実施形態に係るデータ処理装置1の概要を説明するための図である。データ処理装置1は、スキャナ又はデジタルカメラ等の読取装置2が請求書を読み取ることによって生成された請求書の画像データである請求書データを取得し、請求書データに含まれる文字列を解析した結果を用いて請求書を管理するための装置であり、例えばコンピュータである。データ処理装置1は、1台のコンピュータにより構成されていてもよく、複数のコンピュータにより構成されていてもよい。
 図2は、被請求者としてのデータ処理装置1のユーザが受領する請求書の一例を示す図である。図2に示す請求書には、請求書を発行した事業者、すなわち取引における代金を請求する取引先の名称、住所、連絡先が表示されている。また、請求書には、件名(図2に示す2020年1月分)、請求の対象となる商品の単価、個数及び商品の合計金額(すなわち小計)、複数の商品の合計金額(すなわち請求額)が表示されている。また、請求書には、代金の振込先、支払期日が表示されている。データ処理装置1は、これら請求書に表示された情報と、読取装置2が請求書を読み取ることによって生成された請求書データを取得した取得日とを関連付けて請求書情報データベースに登録して管理する。
 データ処理装置1は、請求書データを取得すると、当該請求書データと同じ属性を有し、過去に取得した請求書データに明細データが含まれているか否かを判定し、判定結果を出力する。属性は、明細データが含まれているか否かとの相関性がある、請求書データが示す請求書に含まれている少なくとも一以上の情報の種類であり、例えば請求書の取引先名、振込先口座番号、担当者名、商品名又はサービス名である。同じ属性を有するとは、例えば、請求書データの内容を示す少なくとも一つの種類の情報が同一であることを意味する。このようにすることで、ユーザは判定結果を確認することにより、判定結果が出力されない場合に比べて、請求書データに明細が含まれているか否かを容易に判断することができる。これにより、データ処理装置1は、請求書データの確認作業の負担を軽減することができる。
[データ処理装置1の機能構成及び動作]
 図3は、第1実施形態に係るデータ処理装置1の機能構成を示す図である。データ処理装置1は、通信部11と、操作部12と、表示部13と、記憶部14と、制御部15とを有する。制御部15は、データ取得部151と、抽出部152と、判定部153と、生成部154と、出力部155と、訂正部156と、登録部157とを有する。
 通信部11は、ネットワーク(例えばイントラネット又はインターネット)に接続するための通信インターフェースであり、読取装置2からデータを受信したり、他のコンピュータとの間でデータを送受信したりするための通信コントローラを有する。
 操作部12は、請求書から読み取った文字列や数値を訂正したりするためのキーボード、マウス及びディスプレイ等のデバイスを有する。
 表示部13は、情報を表示するディスプレイである。表示部13は、制御部15の指示に基づいて情報を表示する。
 記憶部14は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部14は、制御部15が実行するプログラムを記憶する。また、記憶部14は、読取装置2が請求書を読み取ることによって生成された請求書データを記憶する。記憶部14は、さらに、請求書データから抽出された情報を管理する請求書情報データベースを記憶する。
 図4は、請求書情報データベースの一例を示す図である。請求書情報データベースは、図4(a)に示す鑑データと、図4(b)に示す明細データとを含んでいる。鑑データは、請求書を識別するための請求書IDと、請求書を発行した取引先を識別する取引先名と、請求書の発行日と、請求書データが取得された取得日と、代金の支払期日と、請求金額と、請求書の件名とを関連付けたデータである。明細データは、請求書IDと、複数の商品それぞれの品名と、複数の商品それぞれの単価、購入数、及び購入金額とを関連付けたデータである。鑑データは、例えば、データの出力先となる会計システム(不図示)において単一仕訳を行うために用いられる。明細データは、例えば、データの出力先となる会計システムにおいて複合仕訳を行うために用いられる。
 制御部15は、例えばCPU(Central Processing Unit)である。制御部15は、記憶部14に記憶されたプログラムを実行することにより、データ取得部151、抽出部152、判定部153、生成部154、出力部155、訂正部156、及び登録部157として機能する。
 データ取得部151は、読取装置2が請求書を読み取ることにより生成された請求書データを取得する。データ取得部151は、読取装置2から請求書データを直接取得してもよいし、データ処理装置1と通信可能に接続されている端末から請求書データを取得してもよい。
 抽出部152は、OCR処理を実行することにより、請求書データから、請求書に含まれているテキスト情報を抽出する。テキスト情報には、請求書の発行元(取引先)、発行先、発行日、支払期日、請求金額が少なくとも含まれている。また、請求書に明細が含まれている場合、テキスト情報には、商品又はサービスの名称、単価、数量、小計が含まれている。抽出部152は、請求書に含まれているテキスト情報の中から、請求書の発行元を示す発行元情報を抽出する。
 判定部153は、データ取得部151が取得した請求書データに明細データが含まれているか否かを判定する。判定部153は、データ取得部151が取得した請求書データと同じ属性を有し、データ取得部151が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、データ取得部151が取得した請求書データに明細データが含まれているか否かを判定する。例えば、判定部153は、データ取得部151が取得した請求書データから抽出部152が抽出した発行元情報が示す発行元が過去に発行した過去請求書データの判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定する。
 具体的には、判定部153は、記憶部14に記憶されている第1分類モデルを用いて、取得した請求書データに明細データが含まれているか否かを判定する。第1分類モデルは、例えば、請求書データと発行元情報が入力されると、当該請求書データに明細データが含まれているか否かを示す情報を出力するニューラルネットワークのモデルである。
 第1分類モデルは、データ取得部151が過去に取得した過去請求書データと、当該過去請求書データの発行元情報と、過去請求書データに明細データが含まれているか否かの判定結果とを含む教師データに基づいて学習することにより生成され、記憶部14に記憶される。判定部153は、データ取得部151が取得した請求書データと、抽出部152が抽出した発行元情報とを第1分類モデルに入力し、第1分類モデルから出力された判定結果を取得することにより、取得した請求書データに明細データが含まれているか否かを判定する。
 なお、判定部153は、第1分類モデルを用いて請求書データに明細データが含まれているか否かを判定したが、これに限らない。判定部153は、請求書の発行元を示す発行元情報と、当該発行元が発行した請求書の請求書データに明細データが含まれているか否かの判定結果とを関連付けた判定履歴情報を参照し、抽出部152が請求書データから抽出した発行元情報が示す発行元に関連付けられている判定結果に基づいて、取得した請求書データに明細データが含まれているか否かを判定してもよい。
 また、判定部153は、請求書データに明細データが含まれていると判定すると、過去請求書データに対する明細データの生成履歴に基づいて、請求書データに対して明細データを生成するか否かを判定する。判定部153は、抽出部152が抽出したテキスト情報に含まれている請求書の発行元と、商品又はサービスの名称との少なくともいずれかが同一の過去請求書データの明細データの生成履歴に基づいて、明細データを生成するか否かを判定する。
 例えば、判定部153は、記憶部14に記憶されている第2分類モデルを用いて、取得した請求書データに明細データが含まれているか否かを判定する。第2分類モデルは、例えば、発行元情報と、抽出部152が抽出したテキスト情報に含まれている商品又はサービスの名称とが入力されると、明細データを作成するか否かを示す情報を出力するニューラルネットワークのモデルである。
 第2分類モデルは、データ取得部151が過去に取得した過去請求書データの発行元情報と、過去請求書データに含まれている一以上の商品又はサービスの名称と、過去請求書データから明細データを作成するか否かの判定結果とを含む教師データに基づいて学習することにより生成され、記憶部14に記憶されているものとする。判定部153は、請求書データに明細データが含まれていると判定すると、抽出部152が抽出した発行元情報と、テキスト情報に含まれる一以上の商品又はサービスの名称とを第2分類モデルに入力し、第2分類モデルから出力された判定結果を取得することにより、明細データを生成するか否かを判定する。
 なお、判定部153は、第2分類モデルを用いて、明細データを生成するか否かを判定したが、これに限らない。判定部153は、記憶部14に記憶されている請求書情報データベースを参照し、取得した請求書データの発行元と同一の発行元の過去請求書データに対応する明細データが存在するか否かを判定することにより、明細データを生成するか否かを判定してもよい。
 また、判定部153は、テキスト情報に含まれている一以上の情報と、請求書の発行先が同一の過去請求書データの生成履歴に基づいて、取得した請求書データから明細データを生成するか否かを判定してもよい。例えば、判定部153は、テキスト情報に含まれている発行元と、請求書の発行先が同一の過去請求書データの生成履歴に基づいて、取得した請求書データから明細データを生成するか否かを判定してもよい。このようにすることで、例えば、ユーザが属する組織の複数の拠点のそれぞれに発送された請求書をまとめて読み取る場合に、請求書データから明細データを生成するか否かを請求書に対応する拠点別に判定することができる。
 生成部154は、抽出部152が抽出したテキスト情報に基づいて鑑データを生成する。例えば、生成部154は、データ取得部151が取得した請求書データの請求書IDを生成するとともに、現在の日付を請求書の取得日とする。また、生成部154は、抽出部152が抽出したテキスト情報から、請求書の発行元である取引先の取引先名、発行日、支払期日、請求金額を特定する。生成部154は、これら請求書ID、取引先名、発行日、取得日、支払期日、請求金額を関連付けた鑑データを生成する。
 生成部154は、判定部153により請求書データに明細データが含まれていると判定されるとともに、請求書データから明細データを生成すると判定されると、請求書データから明細データを生成する。生成部154は、抽出部152が抽出したテキスト情報から、請求書に含まれる一以上の商品又はサービスそれぞれの名称、単価、数量、小計を特定する。生成部154は、鑑データを生成するときに生成した請求書IDと、特定した一以上の商品又はサービスそれぞれの名称、単価、数量、小計とを関連付けた明細データを生成する。
 出力部155は、生成部154が生成した鑑データを表示部13に出力する。出力部155は、生成部154が明細データを生成した場合、明細データを表示部13に出力する。出力部155は、判定部153による請求書データに明細データが含まれているか否かの判定結果を表示部13に出力する。出力部155は、判定部153による請求書データに明細データが含まれているか否かを示すテキスト情報又は画像を表示部13に出力する。出力部155は、請求書データを表示部13に出力してもよい。
 例えば、出力部155は、鑑データと、請求書データに明細データが含まれているか否かの判定結果とを少なくとも含む読取結果画面を表示部13に出力する。図5は、第1実施形態に係る読取結果画面の一例を示す図である。図5に示す例では、画面の右側に請求書データが表示されているとともに、画面の左側に、請求書データから生成した鑑データが表示されていることが確認できる。また、図5に示す例では、請求書データに明細データが含まれていないと判定部153が判定したことにより、「請求書に明細が含まれていません」という判定結果を示すテキスト情報が表示されていることが確認できる。ユーザは、表示部13に出力された判定結果を確認することにより、請求書データに明細データが含まれているか否かを容易に確認することができる。
 訂正部156は、ユーザの操作に応じて、生成部154が生成した鑑データ及び明細データの少なくともいずれかを訂正する。例えば、図5に示す例では、鑑データの訂正を受け付ける訂正ボタンが表示されている。例えば、訂正ボタンが押下されると、訂正部156は、図5に示す鑑データの訂正を受け付ける。訂正部156は、訂正を受け付けると、読取結果画面に訂正結果を反映する。また、訂正部156は、訂正を受け付けると、訂正履歴を示す訂正履歴情報を生成する。例えば、訂正部156は、請求書IDと、訂正前のデータと、訂正後のデータとを関連付けた訂正履歴情報を生成し、記憶部14に記憶させる。
 登録部157は、ユーザの操作に応じて、生成部154が生成した鑑データを請求書情報データベースに登録する。また、登録部157は、生成部154が生成した明細データを生成した場合、ユーザの操作に応じて、明細データを請求書情報データベースに登録する。図5に示す例では、請求書情報データベースへの登録を受け付ける登録ボタンが表示されている。登録部157は、登録ボタンが押下されると、読取結果画面に表示されている鑑データを請求書情報データベースに登録する。また、登録部157は、読取結果画面に明細データが表示されている場合、登録ボタンが押下されると、読取結果画面に表示されている明細データも請求書情報データベースに登録する。
[データ処理装置1における処理の流れ]
 続いて、データ処理装置1における処理の流れを説明する。図6は、第1実施形態に係るデータ処理装置1における処理の流れを示すフローチャートである。
 まず、データ取得部151は、読取装置2が請求書を読み取ることによって生成した請求書データを取得する(S1)。
 続いて、抽出部152は、請求書データに含まれているテキスト情報を抽出する(S2)。
 続いて、判定部153は、請求書データに明細データが含まれているか否かを判定する(S3)。判定部153は、請求書データに明細データが含まれていると判定すると、S4に処理を移し、判定部153は、請求書データに明細データが含まれていないと判定すると、S7に処理を移す。
 続いて、判定部153は、請求書データから明細データを生成するか否かを判定する(S4)。判定部153は、請求書データから明細データを生成すると判定すると、S5に処理を移し、判定部153は、請求書データから明細データを生成しないと判定すると、S7に処理を移す。
 生成部154は、判定部153が請求書データに明細データが含まれていると判定し、請求書データから明細データを生成すると判定すると、鑑データ及び明細データを生成する(S5)。そして、出力部155は、鑑データ、明細データ、及び判定部153による請求書データに明細データが含まれているか否かの判定結果を含む読取結果画面を表示部13に出力する(S6)。
 一方、生成部154は、判定部153が請求書データに明細データが含まれていないと判定した場合、又は請求書データから明細データを生成しないと判定した場合、明細データを生成せずに鑑データのみを生成する(S7)。そして、出力部155は、鑑データ、及び判定部153による請求書データに明細データが含まれているか否かの判定結果を含む読取結果画面を表示部13に出力する(S8)。
 その後、訂正部156は、ユーザの操作に応じて、読取結果画面に表示されている鑑データの訂正を受け付ける。また、訂正部156は、読取結果画面に明細データが表示されている場合には、ユーザの操作に応じて、読取結果画面に表示されている明細データの訂正を受け付ける(S9)。なお、S9の処理は、ユーザの訂正操作に応じて行われるものであり、常に行われるものではないものとする。
 その後、登録部157は、ユーザの操作に応じて、生成部154が生成した鑑データを請求書情報データベースに登録する。また、登録部157は、生成部154が生成した明細データを生成した場合、ユーザの操作に応じて、当該データを請求書情報データベースに登録する(S10)。
[第1実施形態に係るデータ処理装置1による効果]
 以上説明したように、第1実施形態に係るデータ処理装置1は、取得した請求書データと同じ属性を有し、過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定する。そして、データ処理装置1は、請求書データに明細データが含まれているか否かの判定結果を出力する。このようにすることで、ユーザは判定結果を確認することにより、請求書データに明細が含まれているか否かを容易に判断することができる。これにより、データ処理装置1は、請求書データの確認作業の負担を軽減することができる。
<第2実施形態>
[明細データを人が確認する必要があるかを示す情報を出力する]
 続いて、第2実施形態に係るデータ処理装置1について説明する。第2実施形態に係るデータ処理装置1は、明細データを人が確認する必要があるかを示す情報を出力する機能を有する。以下、第2実施形態に係るデータ処理装置1の説明を行う。なお、第1実施形態と同じ部分については適宜説明を省略する。
 第2実施形態に係る判定部153は、過去に取得された請求書の請求書データから生成部154が生成した過去明細データと、当該過去明細データに対する訂正部156による訂正履歴とに基づいて、生成部154が生成した明細データをユーザが確認する必要があるか否かを判定する。
 例えば、判定部153は、記憶部14に記憶されている第3分類モデルを用いて、取得した請求書データに明細データが含まれているか否かを判定する。第3分類モデルは、明細データが入力されると、明細データをユーザが確認する必要があるか否かを示す情報を出力するニューラルネットワークのモデルである。
 第3分類モデルは、データ取得部151が過去に取得した過去請求書データの過去明細データと、当該過去明細データをユーザが確認する必要があったか否かを示す情報とを含む教師データに基づいて学習することにより生成される。過去明細データを確認する必要があったか否かを示す情報は、過去明細データの訂正履歴があるか否かに基づいて生成される。判定部153は、生成部154が生成した明細データを第3分類モデルに入力し、第3分類モデルから出力された判定結果を取得することにより、明細データをユーザが確認する必要があるか否かを判定する。
 なお、判定部153は、第3分類モデルを用いて明細データをユーザが確認する必要があるか否かを判定したが、これに限らない。判定部153は、データ取得部151が取得した請求書データから抽出された発行元が過去に発行した過去請求書データに対応する過去明細データの訂正履歴が記憶部14に記憶されている否かに基づいて、生成された明細データをユーザが確認する必要があるか否かを判定してもよい。
 また、判定部153は、生成された明細データをユーザが確認する必要があるか否かを判定したが、これに限らず、生成された鑑データをユーザが確認する必要があるか否かも判定してもよい。この場合、判定部153は、データ取得部151が取得した請求書データから抽出された発行元が過去に発行した過去請求書データに対応する過去鑑データの訂正履歴が記憶部14に記憶されている否かに基づいて、生成された鑑データをユーザが確認する必要があるか否かを判定する。
 出力部155は、生成部154が生成した明細データをユーザが確認する必要があるか否かを示す判定結果を出力する。例えば、出力部155は、鑑データと、明細データと、明細データをユーザが確認する必要があるか否かの判定結果とを少なくとも含む読取結果画面を表示部13に出力する。なお、生成部154が生成した鑑データをユーザが確認する必要があるか否かを判定部153が判定した場合、出力部155は、鑑データをユーザが確認する必要があるか否かの判定結果を読取結果画面に含めるようにしてもよい。
[第2実施形態に係るデータ処理装置1による効果]
 以上説明したように、第2実施形態に係るデータ処理装置1は、過去に取得された請求書の請求書データから生成された過去明細データと、当該過去明細データに対する訂正部156による訂正履歴とに基づいて、生成部154が生成した明細データをユーザが確認する必要があるか否かを判定し、判定結果を出力する。このようにすることで、ユーザは明細データを注意して確認するべきか否かを容易に判断することができるので、請求書データの確認作業の負担をさらに軽減することができる。
<第3実施形態>
[明細データの信頼度に基づいてユーザが確認する必要があるか否かを判定する]
 続いて、第3実施形態に係るデータ処理装置1について説明する。第3実施形態に係るデータ処理装置1は、生成した明細データの信頼度に基づいて、明細データを人が確認する必要があるかを示す情報を出力する点で第2実施形態と異なる。
 図7は、第3実施形態に係るデータ処理装置1の機能構成を示す図である。第3実施形態に係るデータ処理装置1の制御部15は、設定部158をさらに有する。
 第3実施形態において、第3分類モデルは、生成部154が生成した明細データをユーザが確認する必要があることを示す情報として、明細データの信頼度を出力する。
 設定部158は、ユーザが確認する必要があるか否かの判定に用いる明細データの信頼度の閾値を設定する。例えば、設定部158は、操作部12を介してユーザから明細データの信頼度の閾値の指定を受け付けることにより、明細データの信頼度の閾値を設定する。
 判定部153は、過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、生成部154により生成された明細データの信頼度を特定する。具体的には、判定部153は、生成された明細データを第3分類モデルに入力し、第3分類モデルから信頼度を取得する。判定部153は、特定した信頼度が、設定部158が設定した閾値を超えるか否かに基づいて、明細データをユーザが確認する必要があるか否かを判定する。
 出力部155は、第2実施形態と同様に、鑑データと、明細データと、明細データをユーザが確認する必要があるか否かの判定結果とを少なくとも含む読取結果画面を表示部13に出力する。
[第3実施形態に係るデータ処理装置1による効果]
 以上説明したように、第3実施形態に係るデータ処理装置1は、ユーザが確認する必要があるか否かの判定に用いる明細データの信頼度の閾値を設定し、明細データの信頼度を特定し、特定した信頼度が、設定された閾値を超えるか否かに基づいて、明細データをユーザが確認する必要があるか否かを判定する。このようにすることで、ユーザは例えば閾値を高い値に調整することにより、信頼度が高い明細データを人が確認する必要がないものと判定部153に判定させ、信頼度が相対的に低く、ユーザが確認する必要があると判定部153が判定した明細データをユーザに重点的に確認させることができる。
 以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、請求書データは、読取装置2が読み取ることにより作成されたデータであることとしたが、これに限らず、コンピュータが作成したpdfファイル等の電子データであってもよい。また、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
1 データ処理装置
2 読取装置
11 通信部
12 操作部
13 表示部
14 記憶部
15 制御部
151 データ取得部
152 抽出部
153 判定部
154 生成部
155 出力部
156 訂正部
157 登録部
158 設定部

 

Claims (10)

  1.  請求書を示す請求書データを取得するデータ取得部と、
     前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部と、
     前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部と、
     を有するデータ処理装置。
  2.  前記請求書データから前記請求書の発行元を抽出する抽出部をさらに有し、
     前記判定部は、前記抽出部が抽出した前記請求書の発行元が同一の前記過去請求書データの前記判定履歴に基づいて、前記請求書データに前記明細データが含まれているか否かを判定する、
     請求項1に記載のデータ処理装置。
  3.  前記請求書データからテキスト情報を抽出する抽出部と、
     前記請求書データに明細データが含まれていると前記判定部が判定すると、前記抽出部が抽出したテキスト情報に基づいて前記明細データを生成する生成部と、
     をさらに有する、
     請求項1又は2に記載のデータ処理装置。
  4.  前記判定部は、前記請求書データに明細データが含まれていると判定すると、前記過去請求書データに対する前記明細データの生成履歴に基づいて、前記請求書データに対して前記明細データを生成するか否かを判定し、
     前記生成部は、前記明細データを生成すると前記判定部が判定すると、前記明細データを生成する、
     請求項3に記載のデータ処理装置。
  5.  前記テキスト情報には、前記請求書の発行元、商品又はサービスの名称が含まれており、
     前記判定部は、前記テキスト情報に含まれている前記請求書の発行元と、商品又はサービスの名称との少なくともいずれかが同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定する、
     請求項4に記載のデータ処理装置。
  6.  前記判定部は、前記テキスト情報に含まれている一以上の情報と、前記請求書の発行先が同一の前記過去請求書データの前記生成履歴に基づいて、前記明細データを生成するか否かを判定する、
     請求項4又は5に記載のデータ処理装置。
  7.  ユーザの操作に応じて前記生成部が生成した明細データを訂正する訂正部をさらに有し、
     前記判定部は、過去に取得された請求書の請求書データから前記生成部が生成した過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記生成部が生成した明細データをユーザが確認する必要があるか否かを判定し、
     前記出力部は、前記生成部が生成した明細データをユーザが確認する必要があるか否かを示す判定結果を出力する、
     請求項3から6のいずれか一項に記載のデータ処理装置。
  8.  前記ユーザが確認する必要があるか否かの判定に用いる前記明細データの信頼度の閾値を設定する設定部をさらに有し、
     前記判定部は、前記過去明細データと、当該過去明細データに対する前記訂正部による訂正履歴とに基づいて、前記明細データの信頼度を特定し、特定した信頼度が前記設定部が設定した前記閾値を超えるか否かに基づいて、前記明細データをユーザが確認する必要があるか否かを判定する、
     請求項7に記載のデータ処理装置。
  9.  コンピュータが実行する、
     請求書を示す請求書データを取得するステップと、
     取得した請求書データと同じ属性を有し、過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、取得した請求書データに明細データが含まれているか否かを判定するステップと、
     取得した請求書データに明細データが含まれているか否かの判定結果を出力するステップと、
     を有するデータ処理方法。
  10.  コンピュータを、
     請求書を示す請求書データを取得するデータ取得部、
     前記データ取得部が取得した請求書データと同じ属性を有し、前記データ取得部が過去に取得した過去請求書データに明細を示す明細データが含まれているか否かが判定された結果を示す判定履歴に基づいて、前記データ取得部が取得した請求書データに明細データが含まれているか否かを判定する判定部、及び、
     前記判定部による前記請求書データに明細データが含まれているか否かの判定結果を出力する出力部、
     として機能させるプログラム。
PCT/JP2020/042309 2020-11-12 2020-11-12 データ処理装置、データ処理方法及びプログラム WO2022102065A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020564009A JP6844076B1 (ja) 2020-11-12 2020-11-12 データ処理装置、データ処理方法及びプログラム
PCT/JP2020/042309 WO2022102065A1 (ja) 2020-11-12 2020-11-12 データ処理装置、データ処理方法及びプログラム
JP2021027022A JP2022077944A (ja) 2020-11-12 2021-02-24 データ処理装置、データ処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/042309 WO2022102065A1 (ja) 2020-11-12 2020-11-12 データ処理装置、データ処理方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2022102065A1 true WO2022102065A1 (ja) 2022-05-19

Family

ID=74860888

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/042309 WO2022102065A1 (ja) 2020-11-12 2020-11-12 データ処理装置、データ処理方法及びプログラム

Country Status (2)

Country Link
JP (2) JP6844076B1 (ja)
WO (1) WO2022102065A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259455A (ja) * 1993-03-08 1994-09-16 Nec Corp 取引データ入力方式
JP2018097813A (ja) * 2016-12-16 2018-06-21 ファーストアカウンティング株式会社 会計処理装置、会計処理システム、会計処理方法、及び会計処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259455A (ja) * 1993-03-08 1994-09-16 Nec Corp 取引データ入力方式
JP2018097813A (ja) * 2016-12-16 2018-06-21 ファーストアカウンティング株式会社 会計処理装置、会計処理システム、会計処理方法、及び会計処理プログラム

Also Published As

Publication number Publication date
JP2022077944A (ja) 2022-05-24
JPWO2022102065A1 (ja) 2022-05-19
JP6844076B1 (ja) 2021-03-17

Similar Documents

Publication Publication Date Title
US20080144881A1 (en) Electronic transaction processing server with automated transaction evaluation
WO2004055725A2 (en) System and method for capture, storage and processing of receipts and related data
JPWO2019008766A1 (ja) 証憑処理システムおよび証憑処理プログラム
JP2022079352A (ja) 情報処理装置、情報処理システム、及び情報処理プログラム
JP6732325B1 (ja) 会計処理システム、会計処理方法、会計処理プログラム
JP6810306B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6944603B1 (ja) データ処理装置、データ処理方法及びプログラム
WO2022102065A1 (ja) データ処理装置、データ処理方法及びプログラム
JP6810303B1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
WO2022049689A1 (ja) データ処理装置、データ処理方法及びプログラム
JP6855641B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6929487B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6967174B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6848134B1 (ja) データ処理装置、データ処理方法及びプログラム
JP7021819B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6993032B2 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP6858420B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP6884197B1 (ja) 決済装置、決済方法及び決済プログラム
JP7063963B2 (ja) 支払支援システム、支払支援方法及び支払支援プログラム
JP6946595B1 (ja) データ処理装置、データ処理方法及びプログラム
WO2020255361A1 (ja) 会計処理システム、会計処理方法、会計処理プログラム
JP2023168826A (ja) 仕訳不要の会計ソフトウェア及び会計システム
US20170221114A1 (en) SYSTEM for GENERATING and IDENTIFYING an OCR FINGERPRINT
JP2023026278A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2020564009

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20961593

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20961593

Country of ref document: EP

Kind code of ref document: A1