JP2023129229A - Data processing device, data processing method, and program - Google Patents

Data processing device, data processing method, and program Download PDF

Info

Publication number
JP2023129229A
JP2023129229A JP2022170385A JP2022170385A JP2023129229A JP 2023129229 A JP2023129229 A JP 2023129229A JP 2022170385 A JP2022170385 A JP 2022170385A JP 2022170385 A JP2022170385 A JP 2022170385A JP 2023129229 A JP2023129229 A JP 2023129229A
Authority
JP
Japan
Prior art keywords
data
acquired
determination
voucher
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022170385A
Other languages
Japanese (ja)
Inventor
鴻鵬 葛
hong peng Ge
顕 松田
Akira Matsuda
智 小俣
Satoshi Komata
啓太郎 森
Keitaro Mori
将和 早川
Masakazu Hayakawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fast Accounting Inc
Original Assignee
Fast Accounting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fast Accounting Inc filed Critical Fast Accounting Inc
Priority to JP2022170385A priority Critical patent/JP2023129229A/en
Publication of JP2023129229A publication Critical patent/JP2023129229A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Abstract

To determine whether or not voucher data is authentic.SOLUTION: A data processing device 1 comprises: a storage section 22 that stores, in association with a plurality of issue sources of vouchers, a plurality of pieces of determination data indicating at least any feature of a predetermined character or image included in authorized voucher data; an acquisition section 231 that acquires voucher data; an identification section 232 that identifies an issue source of the voucher data on the basis of at least any of a character or image included in the acquired voucher data acquired by the acquisition section 231; a determination section 233 that determines whether or not the acquired voucher data is authentic data by comparing at least any feature of the predetermined character or image included in the determination data stored in the storage section 22 in association with the issue source identified by the identification section 232 with at least any feature of the predetermined character or image included in the acquired voucher data; and an output section 234 that outputs a determination result of the determination section 233.SELECTED DRAWING: Figure 2

Description

本発明は、請求データを処理するためのデータ処理装置、データ処理方法及びプログラムに関する。 The present invention relates to a data processing device, a data processing method, and a program for processing billing data.

従来、証憑データ等の帳票データの発行元の真偽を判定することが行われている(例えば、特許文献1を参照)。特許文献1には、帳票データに埋め込まれた電子署名を検証することにより、帳票データの真正性を検証することが記載されている。 BACKGROUND ART Conventionally, the authenticity of the issuer of document data such as voucher data has been determined (for example, see Patent Document 1). Patent Document 1 describes that the authenticity of form data is verified by verifying an electronic signature embedded in the form data.

特開2007―206964号公報Japanese Patent Application Publication No. 2007-206964

特許文献1に記載された技術では、証憑データに電子署名が埋め込まれていない場合、証憑データが真正なものであるか否かを判定することができないという問題があった。 The technique described in Patent Document 1 has a problem in that if an electronic signature is not embedded in the voucher data, it cannot be determined whether the voucher data is authentic.

そこで、本発明はこれらの点に鑑みてなされたものであり、証憑データが真正なものであるか否かを判定することができる情報出力装置、情報出力方法及びプログラムを提供することを目的とする。 Therefore, the present invention has been made in view of these points, and an object thereof is to provide an information output device, an information output method, and a program that can determine whether or not evidence data is genuine. do.

本発明の第1の態様に係るデータ処理装置は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部と、証憑データを取得する取得部と、前記取得部が取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定する特定部と、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定する判定部と、前記判定部の判定結果を出力する出力部と、を備える。 A data processing device according to a first aspect of the present invention stores a plurality of pieces of determination data indicating characteristics of at least one of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers. an acquisition unit that acquires the voucher data; and an identification unit that identifies the issuer of the voucher data based on at least one of characters or images included in the acquired voucher data acquired by the acquisition unit; the characteristics of at least one of the predetermined characters or images included in the determination data stored in the storage unit in association with the issuer identified by the identification unit; and the predetermined characteristics included in the acquired voucher data. a determination unit that determines whether the acquired evidence data is genuine data by comparing the characteristics of at least one of characters or images; and an output unit that outputs the determination result of the determination unit. Be prepared.

前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の位置と、前記取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定してもよい。前記取得部は、データ構造を指定するためのマークアップ言語を含む電子インボイスを前記証憑データとして取得し、前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定してもよい。 The determination unit is configured to determine the position of the predetermined character or image included in the determination data stored in the storage unit in association with the issuer identified by the identification unit, and the predetermined character or image included in the acquired voucher data. It may be determined whether or not the acquired evidence data is genuine data by comparing the position of the character or image. The acquisition unit acquires an electronic invoice including a markup language for specifying a data structure as the evidence data, and the determination unit stores it in the storage unit in association with the issuer specified by the identification unit. By comparing the predetermined characters included in the determined determination data and the predetermined characters included in the acquired voucher data, it is determined whether the acquired voucher data is genuine data. Good too.

前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字との一致度を特定し、特定した当該一致度に基づいて、前記取得証憑データが真正なデータであるか否かを判定してもよい。前記判定部は、前記証憑データと当該証憑データの発行元を示す情報とを入力データとし、当該証憑データが当該発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルに対し、前記取得部が取得した前記取得証憑データ及び前記特定部が特定した前記発行元を示す情報を入力し、当該機械学習モデルが出力した前記証憑データが当該発行元により発行された真正なものであるか否かを示す情報に基づいて、前記取得証憑データが真正なデータであるか否かを判定してもよい。 The determination unit is configured to distinguish between the predetermined characters included in the determination data stored in the storage unit in association with the issuer identified by the identification unit and the predetermined characters included in the acquired voucher data. The degree of coincidence may be specified, and based on the specified degree of coincidence, it may be determined whether the acquired evidence data is genuine data. The determination unit uses the voucher data and information indicating the issuer of the voucher data as input data, and outputs information indicating whether the voucher data is authentic issued by the publisher. The acquired voucher data acquired by the acquisition unit and the information indicating the issuer identified by the identification unit are input into the trained machine learning model, and the voucher data output by the machine learning model It may be determined whether the acquired voucher data is genuine data based on information indicating whether the acquired voucher data is genuine or not issued by the source.

前記データ処理装置は、真正な発行元から取得したことを示すラベルに関連付けられた前記証憑データと、偽の発行元から取得したことを示すラベルに関連付けられた前記証憑データとを含む学習データを機械学習させることにより、前記機械学習モデルを生成する生成部をさらに備えてもよい。前記データ処理装置は、前記判定結果が正しいか否かのユーザの入力を受け付ける受付部をさらに備え、前記生成部は、前記取得証憑データが真正であるという前記判定結果が正しいことを示すユーザの入力を受け付けた場合に、対応する前記証憑データが真正であることを示すラベルに関連付けて当該証憑データを前記学習データに加えた新たな学習データを用いて機械学習することにより、前記機械学習モデルを生成してもよい。 The data processing device generates learning data including the voucher data associated with a label indicating that the voucher data was acquired from a genuine publisher and the voucher data associated with a label indicating that the voucher data was acquired from a fake publisher. The image forming apparatus may further include a generation unit that generates the machine learning model by performing machine learning. The data processing device further includes a reception unit that receives a user's input as to whether or not the determination result is correct, and the generation unit receives a user input indicating that the determination result that the acquired voucher data is genuine is correct. When input is accepted, the machine learning model performs machine learning using new learning data obtained by associating the corresponding evidence data with a label indicating that it is genuine and adding the corresponding evidence data to the learning data. may be generated.

本発明の第2の態様に係るデータ処理装置は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部と、証憑データを取得する取得部と、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得部が取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データに最も類似する特徴を示す前記判定用データを特定する特定部と、前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、前記特定部が特定した前記判定用データに対応する前記発行元と一致するか否かを判定する判定部と、前記判定部の判定結果を出力する出力部と、を備える。 A data processing device according to a second aspect of the present invention stores a plurality of pieces of determination data indicating characteristics of at least one of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers. an acquisition unit that acquires evidence data; a characteristic of at least one of the predetermined characters or images included in each of the plurality of determination data stored in the storage unit; an identifying unit that identifies the determination data that shows the most similar feature to the acquired voucher data by comparing the characteristics of at least one of the predetermined characters or images included in the acquired voucher data; a determining unit that determines whether a publisher identified based on at least one of characters or images included in the evidence data matches the publisher corresponding to the determination data specified by the identifying unit; , and an output section that outputs the determination result of the determination section.

本発明の第3の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、判定結果を出力するステップと、を備える。 A data processing method according to a third aspect of the present invention includes the step of acquiring evidence data executed by a computer, and the step of acquiring evidence data based on at least one of characters or images included in the acquired acquired voucher data. the step of identifying the issuer, and referring to a storage unit that stores a plurality of determination data indicating characteristics of at least one of a predetermined character or an image included in the regular voucher data in association with a plurality of issuers of the voucher; and the characteristics of at least one of the predetermined characters or images included in the determination data stored in the storage unit in association with the specified issuer, and the predetermined characters or images included in the acquired voucher data. The method includes a step of determining whether the acquired evidence data is genuine data by comparing at least one feature of the image, and a step of outputting the determination result.

本発明の第4の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データに最も類似する前記判定用データを特定するステップと、前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、判定結果を出力するステップと、を備える。 A data processing method according to a fourth aspect of the present invention includes the step of acquiring voucher data executed by a computer; With reference to a storage unit that stores a plurality of pieces of determination data indicating any one of the characteristics, at least one of the characteristics of the predetermined character or image included in each of the plurality of pieces of determination data stored in the storage unit and identifying the determination data that is most similar to the acquired voucher data by comparing the characteristics of at least one of the predetermined characters or images included in the acquired acquired voucher data; determining whether a publisher identified based on at least one of characters or images included in the data matches the publisher corresponding to the identified determination data; and outputting a determination result. and a step.

本発明の第5の態様に係るプログラムは、コンピュータに、証憑データを取得するステップと、取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、判定結果を出力するステップと、を実行させる。 A program according to a fifth aspect of the present invention includes the steps of: acquiring evidence data; and specifying the issuer of the voucher data based on at least one of characters or images included in the acquired acquired voucher data. and a step of identifying the information by referring to a storage unit that stores a plurality of determination data indicating at least one of characteristics of predetermined characters or images included in the regular voucher data in association with a plurality of issuers of the vouchers. characteristics of at least one of the predetermined characters or images included in the determination data stored in the storage unit in association with the issuer; and at least one of the predetermined characters or images included in the acquired voucher data. A step of determining whether or not the acquired evidence data is genuine data by comparing the characteristics with the above characteristics, and a step of outputting the determination result are executed.

本発明の第6の態様に係るプログラムは、コンピュータに、証憑データを取得するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記判定用データに最も類似する前記判定用データを特定するステップと、前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、判定結果を出力するステップと、を実行させる。 A program according to a sixth aspect of the present invention includes the steps of: acquiring voucher data; and determining characteristics of at least one of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers; The characteristics of at least one of the predetermined characters or images included in each of the plurality of determination data stored in the storage section and the acquired identifying the determination data that is most similar to the determination data by comparing the characteristics of at least one of the predetermined characters or images included in the acquired voucher data; a step of determining whether a publisher specified based on at least one of characters or images matches the publisher corresponding to the identified determination data; and a step of outputting a determination result. Let it run.

本発明によれば、証憑データが真正なものであるか否かを判定するという効果を奏する。 According to the present invention, it is possible to determine whether or not evidence data is genuine.

第1の実施形態に係るデータ処理システムの概要を説明するための図である。FIG. 1 is a diagram for explaining an overview of a data processing system according to a first embodiment. データ処理装置の構成を示す。The configuration of a data processing device is shown. 判定用データテーブルの一例を示す。An example of a determination data table is shown. 取得証憑データの特徴抽出の例を示す。An example of feature extraction of acquired voucher data is shown. 判定用データの別の一例を示す。Another example of the determination data is shown. 証憑データの特徴抽出の別の一例を示す。Another example of feature extraction of evidence data is shown. データ処理装置による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。3 is a flowchart illustrating a processing procedure for determining the authenticity of the issuer of evidence data by the data processing device. 変形例のデータ処理装置2による証憑データの真偽判定の処理手順を示すフローチャートである。こIt is a flowchart which shows the processing procedure of the authenticity determination of evidence data by the data processing apparatus 2 of a modification. child 第2の実施形態のデータ処理装置の構成を示す。7 shows the configuration of a data processing device according to a second embodiment. データ処理装置による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。3 is a flowchart illustrating a processing procedure for determining the authenticity of the issuer of evidence data by the data processing device.

[データ処理システムSの概要]
図1は、第1の実施形態に係るデータ処理システムSの概要を説明するための図である。データ処理システムSは、外部装置1、データ処理装置2及び担当者端末3を備える。データ処理システムSは、複数の担当者端末3を備えてもよい。
[Overview of data processing system S]
FIG. 1 is a diagram for explaining an overview of a data processing system S according to the first embodiment. The data processing system S includes an external device 1, a data processing device 2, and a person in charge terminal 3. The data processing system S may include a plurality of person-in-charge terminals 3.

外部装置1は、例えば、取引先等の事業者の施設に設置されたコンピュータ、データ処理装置2を使用する事業者の従業員のコンピュータ、又は電子インボイスが送受信されるネットワークのアクセスポイントである。外部装置1は、ネットワークを介して、データ処理装置2と通信する。外部装置1は、請求書データ等の証憑データをデータ処理装置2へ送信する。証憑データは、例えば、請求書データ、領収書データである。証憑データは、電子インボイスであってもよく、PDF(Portable Document Format)データ等の電子データであってもよい。証憑データは、紙の請求書をOCR(Optical Character Recognition)で読み取ったものであってもよい。担当者端末3が外部装置1として機能してもよい。 The external device 1 is, for example, a computer installed in a facility of a business partner such as a business partner, a computer of an employee of the business who uses the data processing device 2, or an access point of a network through which electronic invoices are sent and received. . External device 1 communicates with data processing device 2 via a network. The external device 1 transmits evidence data such as bill data to the data processing device 2. The evidence data is, for example, bill data and receipt data. The evidence data may be an electronic invoice or electronic data such as PDF (Portable Document Format) data. The evidence data may be obtained by reading a paper bill using OCR (Optical Character Recognition). The person in charge terminal 3 may function as the external device 1.

担当者端末3は、例えば、データ処理装置2を使用する経理部門の担当者が使用するコンピュータである。担当者端末3は、ネットワークを介してデータ処理装置2と通信する。なお、担当者端末3は、ネットワークを介して外部装置1との間でデータを送受信してもよい。 The person in charge terminal 3 is, for example, a computer used by a person in charge of an accounting department who uses the data processing device 2. The person in charge terminal 3 communicates with the data processing device 2 via the network. Note that the person in charge terminal 3 may transmit and receive data to and from the external device 1 via the network.

データ処理装置2は、ネットワークNを介して、外部装置1及び担当者端末3と通信する。データ処理装置2は、例えば事業者のローカルネットワークに接続されたサーバであるが、クラウドサーバであってもよい。データ処理装置2は、外部装置1から証憑データ(以下、「取得証憑データ」ともいう)を取得する(図1中の(1)))。データ処理装置2は、担当者端末3が外部装置1から証憑データを受信した場合には、担当者端末3からこの証憑データを取得してもよい。 The data processing device 2 communicates with the external device 1 and the person in charge terminal 3 via the network N. The data processing device 2 is, for example, a server connected to a local network of a business operator, but may also be a cloud server. The data processing device 2 acquires evidence data (hereinafter also referred to as "obtained evidence data") from the external device 1 ((1) in FIG. 1). If the person in charge terminal 3 receives the evidence data from the external device 1, the data processing device 2 may acquire this evidence data from the person in charge terminal 3.

データ処理装置2は、取得した取得証憑データに含まれる会社を示す文字又は画像等(以下、「文字等」という)に基づいて、取得証憑データの発行元を特定する(図1中の(2))。データ処理装置2は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字等の特徴を示す複数の判定用データを含む判定用データテーブルを記憶している。データ処理装置2は、記憶している判定用データテーブルを参照して、特定した発行元に関連付けて記憶されている判定用データを特定する。 The data processing device 2 identifies the issuer of the acquired voucher data based on characters, images, etc. (hereinafter referred to as "characters, etc.") indicating the company included in the acquired acquired voucher data ((2 in FIG. 1). )). The data processing device 2 stores a determination data table including a plurality of determination data indicating characteristics such as predetermined characters included in the regular voucher data in association with a plurality of issuers of the vouchers. The data processing device 2 refers to the stored determination data table and identifies determination data stored in association with the identified issuer.

データ処理装置2は、特定した判定用データに含まれる所定の文字等の特徴と、取得証憑データに含まれる対応する所定の文字等の特徴とを比較することにより、取得証憑データ発行元が真正であるか否かを判定する(図1中の(3))。データ処理装置2は、取得証憑データが真正であるか否かの判定結果を担当者端末3へ出力する(図1中の(4))。 The data processing device 2 compares the characteristics of predetermined characters included in the identified determination data with the corresponding features of predetermined characters included in the acquired voucher data to determine whether the issuer of the acquired voucher data is genuine. ((3) in FIG. 1). The data processing device 2 outputs the determination result of whether the obtained voucher data is genuine to the person in charge terminal 3 ((4) in FIG. 1).

このようにして、データ処理装置2は、取得証憑データに含まれる文字又は画像の少なくともいずれかの特徴に基づいて、請求データが真正であるか否かの判定結果を出力するので、発行元を偽った証憑データを受信した場合に、ユーザが詐欺の被害にあうことを抑制することができる。 In this way, the data processing device 2 outputs the determination result of whether or not the request data is genuine based on the characteristics of at least one of the characters and images included in the acquired voucher data, so that the issuer can be identified. It is possible to prevent a user from falling victim to fraud when false evidence data is received.

[データ処理装置2の構成]
図2は、データ処理装置2の構成を示す。データ処理装置2は、通信部21、記憶部22及び制御部23を備える。制御部23は、取得部231、特定部232、判定部233及び出力部234を備える。
[Configuration of data processing device 2]
FIG. 2 shows the configuration of the data processing device 2. As shown in FIG. The data processing device 2 includes a communication section 21, a storage section 22, and a control section 23. The control unit 23 includes an acquisition unit 231, a identification unit 232, a determination unit 233, and an output unit 234.

通信部21は、担当者端末3と通信するためのインターフェースである。記憶部22は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部22は、制御部23が実行するプログラムを記憶する。記憶部22には、証憑データの発行元と、証憑データの発行元を示すロゴ等の画像とを関連付けた発行元情報が記憶されている。 The communication unit 21 is an interface for communicating with the person in charge terminal 3. The storage unit 22 includes storage media such as a ROM (Read Only Memory), a RAM (Random Access Memory), and a hard disk. The storage unit 22 stores programs executed by the control unit 23. The storage unit 22 stores issuer information that associates the issuer of the voucher data with an image such as a logo indicating the issuer of the voucher data.

記憶部22には、証憑の複数の発行元を示す情報と、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データとが関連付けられた判定用データテーブルが記憶されている。正規証憑データは、正規の発行元が発行したことが予め分かっている証憑データである。判定用データは、例えば、発行元を示す文字列の位置を、正規証憑データに含まれる所定の文字又は画像の特徴として示す。発行元を示す文字列の位置は、一例としては発行元を示す文字列の位置の紙面の左端からの距離と、発行元を示す文字列の位置の紙面の上端からの距離とを含み、ミリメートル単位で表現される。 The storage unit 22 includes a determination data table in which information indicating a plurality of issuers of vouchers is associated with a plurality of determination data indicating characteristics of at least one of predetermined characters or images included in regular voucher data. is memorized. The regular voucher data is voucher data that is known in advance to have been issued by a regular publisher. The determination data indicates, for example, the position of a character string indicating the issuer as a feature of a predetermined character or image included in the regular evidence data. The position of the character string indicating the publisher includes, for example, the distance from the left edge of the paper to the position of the character string indicating the publisher, and the distance from the top edge of the paper to the position of the character string indicating the publisher, and is expressed in millimeters. expressed in units.

図3は、判定用データテーブルの一例を示す。図4は、取得証憑データの特徴抽出の例を示す。図3に示す判定用データテーブルでは、正規証憑データの発行元と、正規証憑データに含まれる発行元名の位置の紙面左端からの距離を示す第1判定用データと、正規証憑データに含まれる発行元名の位置の紙面上端からの距離を示す第2判定用データとが関連付けられている。 FIG. 3 shows an example of a determination data table. FIG. 4 shows an example of feature extraction of acquired voucher data. In the judgment data table shown in FIG. 3, the issuer of the regular voucher data, the first judgment data indicating the distance from the left edge of the page of the position of the issuer name included in the regular voucher data, and the issuer of the regular voucher data. It is associated with second determination data indicating the distance from the top edge of the page of the publisher's name.

発行元名の位置の紙面左端からの距離は、例えば図4に示すD1である。図4に示す例においては、発行元名を示す文字列の左端を発行元名の位置としているが、発行元名の位置は発行元名を示す文字列の右端であってもよく、文字列の中央であってもよい。同様に、発行元名の位置の紙面上端からの距離は、例えば図4に示すD2である。図4に示す例においては、発行元名を示す文字列の上端を発行元名の位置としているが、発行元名の位置は発行元名を示す文字列の下端であってもよく、文字列の中央であってもよい。 The distance from the left edge of the page of the publisher's name is, for example, D1 shown in FIG. 4. In the example shown in Figure 4, the left end of the character string indicating the publisher name is the position of the publisher name, but the position of the publisher name may be the right end of the character string indicating the publisher name, and the character string It may be in the center of Similarly, the distance of the publisher's name from the top of the page is, for example, D2 shown in FIG. 4. In the example shown in Figure 4, the upper end of the character string indicating the publisher name is the position of the publisher name, but the position of the publisher name may be the lower end of the character string indicating the publisher name. It may be in the center of

図3の上から1段目の例では、発行元「AB商事」が発行した正規証憑データにおいて発行元名を示す文字列の紙面左端からの距離は、201ミリメートルであり、発行元名を示す文字列の位置の紙面上端からの距離は、60ミリメートルであることを示す。図3の上から2段目の例では、発行元「CD製造所」が発行した正規証憑データにおいて発行元名を示す文字列の位置の紙面左端からの距離は、170ミリメートルであり、発行元名を示す文字列の位置の紙面上端からの距離は、30ミリメートルであることを示す。 In the example in the first row from the top of Figure 3, the distance from the left edge of the page of the character string indicating the publisher's name in the official document data issued by the publisher "AB Shoji" is 201 mm, indicating the publisher's name. The distance from the top of the paper to the position of the character string is 60 mm. In the example in the second row from the top of FIG. 3, the distance from the left edge of the page of the position of the character string indicating the publisher's name in the official document data issued by the publisher "CD Manufacturing" is 170 mm, and the distance from the left edge of the paper is 170 mm. The distance from the top of the page to the position of the character string indicating the name is 30 mm.

図4は、証憑データの特徴の抽出の例を示す。図4中には、発行元名の会社名「AB商事」を破線の枠線で示す。図4の例では、取得証憑データに含まれる発行元の会社名を示す文字列「AB商事」の位置の紙面左端からの距離D1は、後述する判定部233により特徴として抽出される。取得証憑データに含まれる発行元を示す文字列「AB商事」の位置の紙面上端からの距離D2は、判定部233により特徴として抽出される。 FIG. 4 shows an example of extracting characteristics of voucher data. In FIG. 4, the company name "AB Shoji", which is the publisher's name, is indicated by a dashed frame line. In the example of FIG. 4, the distance D1 from the left edge of the page of the character string "AB Shoji" indicating the company name of the issuer included in the acquired voucher data is extracted as a feature by the determining unit 233, which will be described later. The distance D2 from the top edge of the page of the character string "AB Shoji" indicating the issuer included in the acquired voucher data is extracted as a feature by the determining unit 233.

図5は、判定用データの別の一例を示す。図6は、証憑データの特徴抽出の別の一例を示す。図5に示す判定用データでは、正規証憑データの発行元と、正規証憑データに含まれる発行元を示すロゴ画像の位置の紙面左端からの距離を示す第1判定用データと、正規証憑データに含まれる発行元を示すロゴ画像の位置の紙面上端からの距離を示す第2判定用データとが関連付けられている。 FIG. 5 shows another example of the determination data. FIG. 6 shows another example of feature extraction of evidence data. In the determination data shown in FIG. 5, the issuer of the regular evidence data, the first determination data indicating the distance from the left edge of the page of the position of the logo image indicating the issuer included in the regular evidence data, and the issuer of the regular evidence data. It is associated with second determination data indicating the distance from the top edge of the page of the position of the logo image indicating the included publisher.

発行元を示すロゴ画像の位置の紙面左端からの距離は、例えば図6に示すD1’である。図6に示す例においては、発行元を示すロゴ画像の左端をロゴ画像の位置としているが、発行元を示すロゴ画像の位置は発行元を示すロゴ画像右端であってもよく、ロゴ画像の中央であってもよい。同様に、ロゴ画像の位置の紙面上端からの距離は、例えば図6に示すD2’である。図6に示す例においては、発行元を示すロゴ画像の上端をロゴ画像の位置としているが、ロゴ画像の位置は発行元を示すロゴ画像の下端であってもよく、ロゴ画像の中央であってもよい。 The distance of the position of the logo image indicating the publisher from the left edge of the page is, for example, D1' shown in FIG. 6. In the example shown in FIG. 6, the left end of the logo image showing the publisher is the position of the logo image, but the position of the logo image showing the publisher may be the right end of the logo image showing the publisher. It may be in the center. Similarly, the distance of the position of the logo image from the top of the page is, for example, D2' shown in FIG. In the example shown in FIG. 6, the top edge of the logo image indicating the publisher is the position of the logo image, but the position of the logo image may be the bottom edge of the logo image indicating the publisher, or the center of the logo image. It's okay.

図5の上から1段目の例では、発行元「AB商事」が発行した正規証憑データにおいて発行元を示すロゴ画像の位置の紙面左端からの距離は、20ミリメートルであり、発行元を示すロゴ画像の紙面上端からの距離は、16ミリメートルであることを示す。図5の上から2段目の例では、発行元「CD製造所」が発行した正規証憑データにおいて発行名を示すロゴ画像の位置の紙面左端からの距離は、17ミリメートルであり、発行元を示すロゴ画像の紙面上端からの距離は、30ミリメートルであることを示す。 In the example in the first row from the top of Figure 5, the distance from the left edge of the page of the position of the logo image indicating the publisher in the official document data issued by the publisher "AB Shoji" is 20 mm, indicating the publisher. The distance of the logo image from the top of the page is 16 mm. In the example in the second row from the top of FIG. 5, the distance from the left edge of the page of the position of the logo image indicating the issue name in the official document data issued by the publisher "CD Manufacturing" is 17 mm, which indicates that the issuer is The distance of the logo image shown from the top of the page is 30 mm.

図6は、取得証憑データの特徴の抽出の別の例を示す。図6の例に示すように、取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面左端からの距離D1’は、後述する判定部233により特徴として抽出される。取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面上端からの距離D2’は、判定部233により特徴として抽出される。 FIG. 6 shows another example of extracting features of acquired voucher data. As shown in the example of FIG. 6, the distance D1' from the left edge of the paper of the position of the logo image in the shape of "AB" of the publisher "AB Shoji" included in the acquired voucher data is determined as a characteristic by the determination unit 233, which will be described later. Extracted. The distance D2' from the top of the page of the position of the logo image shaped like "AB" of the publisher "AB Shoji" included in the acquired voucher data is extracted as a feature by the determination unit 233.

図2の制御部23は、例えばCPU(Central Processing Unit)である。制御部23は、記憶部22に記憶されたプログラムを実行することにより、取得部231、特定部232、判定部233及び出力部234として機能する。 The control unit 23 in FIG. 2 is, for example, a CPU (Central Processing Unit). The control unit 23 functions as an acquisition unit 231, a identification unit 232, a determination unit 233, and an output unit 234 by executing a program stored in the storage unit 22.

取得部231は、通信部21を介して、外部装置1又は担当者端末3と通信する。取得部231は、外部装置1を介して証憑データを取得する。取得部231は、データ構造を指定するためのマークアップ言語を含む電子インボイスを証憑データとして取得してもよい。例えば、取得部231は、XML形式で記述された電子インボイスを証憑データとして取得してもよい。取得部231は、担当者端末3が外部装置1から証憑データを受信した場合には、担当者端末3から証憑データを取得してもよい。取得部231は、取得した証憑データを特定部232へ出力する。 The acquisition unit 231 communicates with the external device 1 or the person in charge terminal 3 via the communication unit 21 . The acquisition unit 231 acquires evidence data via the external device 1. The acquisition unit 231 may acquire an electronic invoice including a markup language for specifying a data structure as evidence data. For example, the acquisition unit 231 may acquire an electronic invoice written in XML format as evidence data. The acquisition unit 231 may acquire the evidence data from the person in charge terminal 3 when the person in charge terminal 3 receives the evidence data from the external device 1 . The acquisition unit 231 outputs the acquired evidence data to the identification unit 232.

[発行元の特定]
特定部232は、取得部231が取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、証憑データの発行元を特定する。例えば、特定部232は、取得証憑データに含まれる企業名のうち、宛先を示す「御中」等のキーワードが付されていない企業名を証憑データの発行元として特定する。特定部232は、証憑データが電子インボイスである場合には、発行元であることを示すタグが付された文字列を発行元名として特定する。
[Identification of publisher]
The identification unit 232 identifies the issuer of the evidence data based on at least one of the characters and images included in the acquired evidence data acquired by the acquisition unit 231. For example, the specifying unit 232 specifies, as the issuer of the voucher data, a company name that does not have a keyword such as "Ochu" indicating the destination among the company names included in the acquired voucher data. When the evidence data is an electronic invoice, the identification unit 232 identifies a character string with a tag indicating the issuer as the issuer name.

特定部232は、証憑データの発行元を示すロゴ画像に基づいて、証憑データの発行元を特定してもよい。まず、特定部232は、証憑データの発行元と、証憑データの発行元を示すロゴ画像とを関連付けた発行元情報を記憶部22から読み出す。特定部232は、読み出した発行元情報を参照して、取得証憑データに含まれるロゴ画像との類似度が閾値以上のロゴ画像に発行元情報において関連付けて記憶されている発行元を特定してもよい。閾値は、例えば、取得証憑データに含まれる企業名に基づいて証憑データの発行元を特定する場合と同等の精度で発行元を特定するために必要な値として定められた値である。特定部232は、特定した発行元を示す情報を判定部233へ出力する。 The identifying unit 232 may identify the issuer of the voucher data based on a logo image indicating the issuer of the voucher data. First, the specifying unit 232 reads from the storage unit 22 issuer information that associates the issuer of the voucher data with a logo image indicating the issuer of the voucher data. The identifying unit 232 refers to the read publisher information and identifies the publisher stored in association with the logo image whose similarity to the logo image included in the acquired voucher data is equal to or higher than the threshold value. Good too. The threshold value is, for example, a value determined as a value necessary to specify the issuer with the same accuracy as when specifying the issuer of the voucher data based on the company name included in the acquired voucher data. The identifying unit 232 outputs information indicating the identified issuer to the determining unit 233.

[取得証憑データの発行元の真偽判定]
判定部233は、取得証憑データが真正であるか否かを判定する。まず、判定部233は、取得証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を抽出する。例えば、判定部233は、取得証憑データに含まれる所定の文字又は画像の位置、サイズ又は書体等を特徴として抽出する。
[Verification of authenticity of issuer of acquired voucher data]
The determination unit 233 determines whether the acquired evidence data is authentic. First, the determination unit 233 extracts the characteristics of at least one of a predetermined character or image included in the acquired voucher data. For example, the determination unit 233 extracts the position, size, font, etc. of a predetermined character or image included in the acquired voucher data as a feature.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。この判定データには、正規証憑データから抽出された所定の文字又は画像の位置、サイズ又は書体等の特徴が含まれている。判定部233は、取得証憑データから抽出した所定の文字又は画像の位置、サイズ又は書体等の特徴と、特定した判定用データに含まれる対応する特徴とを比較することにより、取得証憑データが真正なデータであるか否かを判定する。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies the determination data stored in association with the publisher identified by the identification unit 232. This determination data includes characteristics such as the position, size, or font of a predetermined character or image extracted from the regular evidence data. The determination unit 233 determines whether the acquired voucher data is genuine by comparing features such as the position, size, or font of a predetermined character or image extracted from the acquired voucher data with the corresponding features included in the specified determination data. Determine whether the data is valid.

図4の例では、判定部233は、上述のように、取得証憑データに含まれる発行元の会社名を示す文字列「AB商事」の位置の紙面左端からの距離D1を特徴として抽出する。判定部233は、取得証憑データに含まれる発行元を示す文字列「AB商事」の位置の紙面上端からの距離D2を特徴として抽出する。 In the example of FIG. 4, as described above, the determination unit 233 extracts the distance D1 from the left edge of the page of the position of the character string "AB Shoji" indicating the company name of the issuer included in the acquired voucher data as a feature. The determination unit 233 extracts as a feature the distance D2 from the top of the page of the position of the character string "AB Shoji" indicating the issuer included in the acquired voucher data.

判定部233は、記憶部22に記憶されている判定用データテーブル(図3参照)を参照して、特定部232が特定した発行元「AB商事」に関連付けて記憶されている第1判定用データが示す正規証憑データに含まれる発行元名の位置の紙面左端からの距離が201ミリメートルであることを特定する。 The determination unit 233 refers to the determination data table (see FIG. 3) stored in the storage unit 22 and determines the first determination data table stored in association with the publisher “AB Shoji” identified by the identification unit 232. It is specified that the distance from the left edge of the page of the position of the issuer's name included in the regular evidence data indicated by the data is 201 mm.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元「AB商事」に関連付けて記憶されている第2判定用データが示す正規証憑データに含まれる発行元名の位置の紙面上端からの距離が160ミリメートルであることを特定する。判定部233は、抽出した距離D1と、特定した第1判定用データが示す距離(201ミリメートル)との差が閾値以下であるか否かを判定する。判定部233は、抽出した距離D2と、特定した第2判定用データが示す距離(160ミリメートル)との差が閾値以下であるか否かを判定する。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and determines whether the genuine evidence is indicated by the second determination data stored in association with the issuer “AB Shoji” identified by the identification unit 232. It is specified that the distance from the top edge of the page of the publisher name included in the data is 160 mm. The determination unit 233 determines whether the difference between the extracted distance D1 and the distance (201 mm) indicated by the specified first determination data is less than or equal to a threshold value. The determination unit 233 determines whether the difference between the extracted distance D2 and the distance (160 millimeters) indicated by the specified second determination data is less than or equal to a threshold value.

判定部233は、抽出した距離D1と、特定した第1判定用データが示す距離との差が閾値以下であり、且つ、抽出した距離D2と、特定した第2判定用データが示す距離との差が閾値以下である場合に、取得証憑データが発行元「AB商事」により発行された真正の証憑データであると判定する。一方、判定部233は、抽出した距離D1と、特定した第1判定用データが示す距離との差が閾値を超える場合、又は、抽出した距離D2と、特定した第2判定用データが示す距離との差が閾値を超える場合に、取得証憑データが発行元「AB商事」により発行された真正の証憑データではないと判定する。 The determination unit 233 determines that the difference between the extracted distance D1 and the distance indicated by the identified first determination data is less than or equal to the threshold value, and that the difference between the extracted distance D2 and the distance indicated by the identified second determination data is less than or equal to the threshold value. If the difference is less than or equal to the threshold, it is determined that the acquired voucher data is genuine voucher data issued by the issuer "AB Shoji". On the other hand, if the difference between the extracted distance D1 and the distance indicated by the identified first determination data exceeds the threshold, or the difference between the extracted distance D2 and the distance indicated by the identified second determination data If the difference exceeds a threshold value, it is determined that the acquired voucher data is not genuine voucher data issued by the issuer "AB Shoji".

図6の例に示すように、判定部233は、上述のとおり、取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面左端からの距離D1’を特徴として抽出してもよい。判定部233は、取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面上端からの距離D2’を特徴として抽出してもよい。判定部233が抽出したロゴ画像の位置の紙面左端及び上端からの距離D1’及び距離D2’を利用して取得証憑データの発行元の真偽を判定する方法については、発行元名の位置の紙面の左端及び上端からの距離D1及び距離D2を利用して取得証憑データの発行元の真偽を判定する方法と同様であるため、説明を省略する。 As shown in the example of FIG. 6, the determination unit 233 determines the distance D1' from the left edge of the paper of the position of the logo image shaped like "AB" of the publisher "AB Shoji" included in the acquired voucher data, as described above. It may be extracted as a feature. The determination unit 233 may extract as a feature the distance D2' from the top of the page of the position of the logo image shaped like "AB" of the publisher "AB Shoji" included in the acquired voucher data. Regarding the method of determining the authenticity of the publisher of the acquired voucher data using the distance D1' and the distance D2' from the left edge and top edge of the page of the position of the logo image extracted by the determination unit 233, This method is the same as the method of determining the authenticity of the issuer of the acquired voucher data using the distance D1 and distance D2 from the left end and top end of the page, so the explanation will be omitted.

また、判定部233は、取得証憑データに含まれる発行元を示す文字列の位置に基づいて、発行元の真偽を判定する例に限定されない。判定部233は、振込先口座名を示す文字列のように、発行元と一対一に対応する文字列の位置に基づいて、発行元の真偽を判定してもよい。 Further, the determination unit 233 is not limited to the example in which the authenticity of the issuer is determined based on the position of the character string indicating the issuer included in the acquired voucher data. The determination unit 233 may determine the authenticity of the issuer based on the position of a character string that corresponds one-to-one with the issuer, such as a character string indicating the name of a payee account.

[電子インボイスの発行元の真偽判定]
判定部233は、取得部231が取得した証憑データが電子インボイスである場合には、特定部232が特定した発行元に関連付けて記憶部22に記憶された判定用データに含まれる所定の文字と、取得証憑データに含まれる所定の文字とを比較することにより、取得証憑データが真正なデータであるか否かを判定する。
[Verification of authenticity of electronic invoice issuer]
If the evidence data acquired by the acquisition unit 231 is an electronic invoice, the determination unit 233 determines whether the document data acquired by the acquisition unit 231 is an electronic invoice or not, the determination unit 233 determines whether or not the document data acquired by the acquisition unit 231 is an electronic invoice. By comparing the obtained document data with predetermined characters included in the obtained document data, it is determined whether the obtained document data is genuine data or not.

まず、判定部233は、取得証憑データにおいて発行元を示す文字列又はロゴ画像に対応するタグ情報又はレイアウト情報を示すXMLテキストを抽出する。判定部233は、取得証憑データにおいて振込先口座を示す文字列に対応するタグ情報又はレイアウト情報を示すXMLテキストを抽出してもよい。 First, the determination unit 233 extracts an XML text indicating tag information or layout information corresponding to a character string indicating an issuer or a logo image in the acquired voucher data. The determination unit 233 may extract XML text indicating tag information or layout information corresponding to a character string indicating a transfer destination account in the acquired voucher data.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。この判定用データには、発行元を示す文字列又はロゴ画像に対応するタグ情報又はレイアウト情報を示すXMLテキストが所定の文字の特徴として含まれている。判定部233は、特定した判定用データに含まれるタグ情報又はレイアウト情報を示すXMLテキストと、抽出したタグ情報又はレイアウト情報を示すXMLテキストとを比較することにより、取得証憑データの発行元が真正であるか否かを判定する。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies the determination data stored in association with the publisher identified by the identification unit 232. This determination data includes a character string indicating the publisher, or an XML text indicating tag information or layout information corresponding to the logo image, as a predetermined character feature. The determination unit 233 compares the XML text indicating the tag information or layout information included in the identified determination data with the extracted XML text indicating the tag information or layout information, thereby determining whether the issuer of the acquired evidence data is genuine. Determine whether or not.

より詳しくは、判定部233は、特定した判定用データに含まれるタグ情報等を示すXMLテキストと、抽出したタグ情報等を示すXMLテキストとが一致する場合に、取得証憑データの発行元が真正であると判定する。判定部233は、特定した判定用データに含まれるタグ情報等を示すXMLテキストと、抽出した対応するタグ情報等を示すXMLテキストとが一致しない場合に、取得証憑データの発行元が真正ではないと判定する。 More specifically, the determination unit 233 determines that the issuer of the acquired evidence data is genuine when the XML text indicating tag information etc. included in the identified determination data matches the extracted XML text indicating tag information etc. It is determined that The determination unit 233 determines that the issuer of the acquired evidence data is not genuine when the XML text indicating tag information etc. included in the identified determination data does not match the extracted XML text indicating the corresponding tag information etc. It is determined that

判定部233は、特定部232が特定した発行元に関連付けて記憶部22に記憶された判定用データに含まれる所定の文字と、取得証憑データに含まれる所定の文字との一致度を特定する。判定部233は、特定した一致度に基づいて、取得証憑データが真正な証憑データであるか否かを判定してもよい。 The determination unit 233 identifies the degree of matching between predetermined characters included in the determination data stored in the storage unit 22 in association with the issuer identified by the identification unit 232 and predetermined characters included in the acquired voucher data. . The determination unit 233 may determine whether the obtained evidence data is genuine evidence data based on the specified degree of matching.

例えば、判定部233は、取得証憑データにおいて発行元を示す文字列に対応する複数のタグ情報又はレイアウト情報を示す文字列を所定の文字として抽出した場合には、取得証憑データから抽出した複数のタグ情報又はレイアウト情報を示す文字列のうち、特定した判定用データに含まれる複数のタグ情報又はレイアウト情報を示す文字列のいずれかと一致する文字列の割合を一致度として特定する。判定部233は、特定した一致度が閾値以上である場合に、取得証憑データが真正な証憑データであると判定してもよい。判定部233は、特定した一致度が閾値未満である場合に、取得証憑データが真正な証憑データでないと判定してもよい。閾値は、例えば、ユーザにより指定される。 For example, when the determination unit 233 extracts as predetermined characters a plurality of tag information or a character string indicating layout information corresponding to a character string indicating the issuer in the acquired voucher data, the determination unit 233 Among the character strings indicating tag information or layout information, the proportion of character strings that match any one of the plurality of character strings indicating tag information or layout information included in the specified determination data is specified as a degree of matching. The determination unit 233 may determine that the acquired evidence data is genuine evidence data when the identified degree of matching is equal to or greater than a threshold value. The determination unit 233 may determine that the acquired evidence data is not genuine evidence data when the specified degree of matching is less than a threshold value. The threshold value is specified by the user, for example.

[判定結果の出力]
出力部234は、通信部21を介して、担当者端末3と通信する。出力部234は、取得証憑データの発行元が真正であるか否かの判定部233の判定結果を出力する。例えば、出力部234は、特定部232が特定した発行元と、判定部233の判定結果を担当者端末3のディスプレイに表示させる。
[Output of judgment results]
The output unit 234 communicates with the person in charge terminal 3 via the communication unit 21 . The output unit 234 outputs the determination result of the determination unit 233 as to whether the issuer of the acquired voucher data is authentic. For example, the output unit 234 causes the issuer identified by the identifying unit 232 and the determination result of the determining unit 233 to be displayed on the display of the person in charge terminal 3.

[データ処理装置2による証憑データの真偽判定の処理手順]
図7は、データ処理装置2による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。この処理手順は、例えば、取得部231が外部装置1から証憑データを取得したときに開始する。まず、取得部231は、取得した証憑データが電子インボイスであるか否かを判定する(S101)。特定部232は、取得した証憑データが電子インボイスではないと取得部231が判定した場合に(S101のNO)、取得部231が取得した取得証憑データに含まれる文字に基づいて、取得証憑データの発行元を特定する(S102)。
[Processing procedure for determining authenticity of evidence data by data processing device 2]
FIG. 7 is a flowchart showing a processing procedure for determining the authenticity of the issuer of evidence data by the data processing device 2. This processing procedure starts, for example, when the acquisition unit 231 acquires evidence data from the external device 1. First, the acquisition unit 231 determines whether the acquired evidence data is an electronic invoice (S101). When the acquisition unit 231 determines that the acquired voucher data is not an electronic invoice (NO in S101), the identification unit 232 identifies the acquired voucher data based on the characters included in the acquired voucher data acquired by the acquisition unit 231. The publisher is identified (S102).

判定部233は、取得証憑データに含まれる所定の文字の位置を特徴として抽出する。判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。判定部233は、取得証憑データから抽出した所定の文字の位置と、特定した判定用データに含まれる所定の文字の位置とのずれが閾値以下であるか否かを判定する(S103)。 The determination unit 233 extracts the position of a predetermined character included in the acquired voucher data as a feature. The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies the determination data stored in association with the publisher identified by the identification unit 232. The determination unit 233 determines whether the deviation between the position of a predetermined character extracted from the acquired voucher data and the position of a predetermined character included in the specified determination data is less than or equal to a threshold value (S103).

判定部233は、取得証憑データから抽出した所定の文字の位置と、特定した判定用データに含まれる所定の文字の位置とのずれが閾値以下である場合に(S103のYES)、取得証憑データの発行元が真正であると判定する(S104)。出力部234は、判定部233の判定結果を担当者端末3へ出力し(S105)、処理を終了する。 If the difference between the position of a predetermined character extracted from the acquired voucher data and the position of a predetermined character included in the specified determination data is equal to or less than a threshold value (YES in S103), the determination unit 233 determines whether the acquired voucher data It is determined that the publisher is genuine (S104). The output unit 234 outputs the determination result of the determination unit 233 to the person in charge terminal 3 (S105), and ends the process.

取得部231は、S101の判定において取得証憑データが電子インボイスであると判定した場合に(S101のYES)、取得証憑データに含まれるXMLテキストを取得する(S106)。特定部232は、取得したXMLテキストに基づいて、取得証憑データの発行元を特定する(S107)。判定部233は、取得証憑データにおいて発行元を示す文字列に対応するタグ情報又はレイアウト情報を示すXMLテキストを所定の文字の特徴として抽出する。 When the acquisition unit 231 determines that the acquired voucher data is an electronic invoice in the determination at S101 (YES at S101), the acquisition unit 231 acquires the XML text included in the acquired voucher data (S106). The identification unit 232 identifies the issuer of the acquired evidence data based on the acquired XML text (S107). The determination unit 233 extracts, as a predetermined character feature, an XML text indicating tag information or layout information corresponding to a character string indicating an issuer in the acquired voucher data.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。判定部233は、特定した判定用データに含まれるタグ情報又はレイアウト情報を示す文字列と、抽出したタグ情報又はレイアウト情報を示す文字列とが一致するか否かを判定する(S108)。判定部233は、特定した判定用データに含まれるタグ情報又はレイアウト情報を示す文字列と、抽出したタグ情報又はレイアウト情報を示す文字列とが一致しない場合に(S108のNO)、取得証憑データの発行元は真正ではないと判定し(S109)、S105の処理に進む。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies the determination data stored in association with the publisher identified by the identification unit 232. The determining unit 233 determines whether a character string indicating tag information or layout information included in the specified determination data matches a character string indicating extracted tag information or layout information (S108). If the character string indicating the tag information or layout information included in the identified determination data does not match the extracted character string indicating the tag information or layout information (NO in S108), the determination unit 233 determines whether the acquired evidence data It is determined that the publisher is not genuine (S109), and the process proceeds to S105.

判定部233は、S103の判定において取得証憑データから抽出した所定の文字の位置と、特定した判定用データに含まれる所定の文字の位置とのずれが閾値より大きい場合に(S103のNO)、取得証憑データの発行元は真正ではないと判定し(S109)、S105の処理に進む。判定部233は、S108の判定において、特定した判定用データに含まれるタグ情報等と、抽出したタグ情報等とが一致する場合に(S108のYES)、取得証憑データの発行元は真正であると判定し(S110)、S105の処理に進む。 If the difference between the position of the predetermined character extracted from the acquired evidence data and the position of the predetermined character included in the specified determination data is larger than the threshold value in the determination of S103 (NO in S103), the determination unit 233 determines that It is determined that the issuer of the acquired voucher data is not genuine (S109), and the process proceeds to S105. In the determination of S108, the determination unit 233 determines that the issuer of the acquired voucher data is genuine if the tag information, etc. included in the identified determination data matches the extracted tag information, etc. (YES in S108). It is determined that (S110), and the process proceeds to S105.

[第1の実施形態のデータ処理装置2による効果]
第1の実施形態のデータ処理装置2では、出力部234は、取得証憑データに含まれる文字又は画像の少なくともいずれかの特徴に基づいて、請求データの発行元が真正であるか否かの判定結果を出力する。このため、出力部234は、発行元を偽った証憑データを取得部231が取得した場合に、証憑データを受け取った事業者が詐欺の被害にあうことを抑制することができる。
[Effects of the data processing device 2 of the first embodiment]
In the data processing device 2 of the first embodiment, the output unit 234 determines whether the issuer of the billing data is authentic based on the characteristics of at least one of characters and images included in the acquired voucher data. Output the results. For this reason, the output unit 234 can prevent the business entity that received the voucher data from falling victim to fraud when the acquisition unit 231 acquires voucher data with a false origin.

<変形例>
第1の実施形態では、特定部232が証憑データの発行元を特定した後に、特定した証憑データの発行元が真正であるか否かを判定部233が判定する場合の例について説明したが、本発明はこれに限定されない。例えば、特定部232は、取得証憑データから抽出した特徴と最も類似する特徴を有する正規証憑データを特定し、特定した正規証憑データの発行元を取得証憑データの発行元として特定してもよい。
<Modified example>
In the first embodiment, an example has been described in which, after the identification unit 232 identifies the issuer of the evidence data, the determination unit 233 determines whether or not the identified issuer of the evidence data is authentic. The present invention is not limited to this. For example, the identifying unit 232 may identify regular voucher data having the most similar features to the features extracted from the acquired voucher data, and identify the issuer of the identified regular voucher data as the issuer of the acquired voucher data.

本変形例の特定部232は、第1の実施形態と同様に、取得部231が取得した取得証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を抽出する。特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、記憶部22の判定用データテーブルに記憶された複数の判定用データそれぞれに含まれる所定の文字又は画像の少なくともいずれかの特徴と、取得証憑データから抽出した特徴とを比較することにより、取得証憑データに最も類似する特徴を示す判定用データを特定する。 Similar to the first embodiment, the identification unit 232 of this modification extracts the characteristics of at least one of a predetermined character or image included in the acquired evidence data acquired by the acquisition unit 231. The specifying unit 232 refers to the determination data table stored in the storage unit 22 and identifies at least one of the predetermined characters or images included in each of the plurality of determination data stored in the determination data table of the storage unit 22. By comparing any of the features with the features extracted from the acquired voucher data, determination data indicating the most similar feature to the acquired voucher data is identified.

特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、取得証憑データに最も類似する特徴を含む判定用データに対応する第1発行元を特定する。特定部232は、第1の実施形態と同様に、取得証憑データに含まれる発行元名等の文字列又は画像の少なくともいずれかに基づいて、取得証憑データの第2発行元を特定する。 The identifying unit 232 refers to the determination data table stored in the storage unit 22 and identifies the first issuer corresponding to the determination data that includes the characteristics most similar to the acquired voucher data. Similar to the first embodiment, the identifying unit 232 identifies the second issuer of the acquired voucher data based on at least one of a character string such as the publisher's name or an image included in the acquired voucher data.

判定部233は、特定部232が特定した第1発行元と、第2発行元とが一致するか否かを判定する。判定部233は、第1発行元と第2発行元とが一致する場合に、取得証憑データの発行元が真正であると判定する。判定部233は、第1発行元と第2発行元とが一致しない場合に、取得証憑データの発行元が真正ではないと判定する。 The determining unit 233 determines whether the first issuer identified by the identifying unit 232 and the second issuer match. The determining unit 233 determines that the issuer of the acquired voucher data is authentic when the first issuer and the second issuer match. If the first issuer and the second issuer do not match, the determining unit 233 determines that the issuer of the acquired voucher data is not authentic.

図8は、本変形例のデータ処理装置2による証憑データの真偽判定の処理手順を示すフローチャートである。この処理手順は、例えば、取得部231が外部装置1から取得証憑データを取得したときに開始する。まず、取得部231は、取得した証憑データが電子インボイスか否かを判定する(S201)。特定部232は、取得した証憑データが電子インボイスではないと取得部231が判定した場合に(S201のNO)、取得部231が取得した取得証憑データに含まれる所定の文字の位置を特徴として抽出する。 FIG. 8 is a flowchart showing a processing procedure for determining the authenticity of evidence data by the data processing device 2 of this modification. This processing procedure starts, for example, when the acquisition unit 231 acquires the acquired evidence data from the external device 1. First, the acquisition unit 231 determines whether the acquired evidence data is an electronic invoice (S201). When the acquisition unit 231 determines that the acquired voucher data is not an electronic invoice (NO in S201), the identifying unit 232 determines the position of a predetermined character included in the acquired voucher data acquired by the acquisition unit 231 as a feature. Extract.

特定部232は、記憶部22に記憶された複数の判定用データそれぞれに含まれる所定の文字の位置と、取得証憑データから抽出した所定の文字の位置とを比較することにより、取得証憑データに最も類似する所定の文字の位置を示す判定用データを特定する(S202)。特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、取得証憑データに最も類似する特徴を含む判定用データに関連付けて記憶されている第1発行元を特定する。 The specifying unit 232 compares the position of a predetermined character included in each of the plurality of pieces of determination data stored in the storage unit 22 with the position of a predetermined character extracted from the acquired voucher data, thereby identifying the acquired voucher data. Determination data indicating the position of the most similar predetermined character is specified (S202). The identifying unit 232 refers to the determination data table stored in the storage unit 22 and identifies the first issuer that is stored in association with the determination data that includes the characteristics most similar to the acquired voucher data.

特定部232は、第1の実施形態と同様に、取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、取得証憑データの第2発行元を特定する。判定部233は、特定部232が特定した第2発行元が、判定用データに関連付けて記憶されている第1発行元と一致するか否かを判定する(S203)。判定部233は、特定部232が特定した第2発行元が第1発行元と一致する場合に(S203のYES)、取得証憑データの発行元が真正であると判定する(S204)。出力部234は、判定部233の判定結果を担当者端末3へ出力し(S205)、処理を終了する。 Similar to the first embodiment, the identifying unit 232 identifies the second issuer of the acquired voucher data based on at least one of the characters and images included in the acquired voucher data. The determining unit 233 determines whether the second publisher specified by the identifying unit 232 matches the first publisher stored in association with the determination data (S203). If the second issuer identified by the identifying unit 232 matches the first issuer (YES in S203), the determining unit 233 determines that the issuer of the acquired voucher data is authentic (S204). The output unit 234 outputs the determination result of the determination unit 233 to the person in charge terminal 3 (S205), and ends the process.

取得部231は、S201の判定において取得した証憑データが電子インボイスであると取得部231が判定した場合(S201のYES)、取得証憑データに含まれるXMLテキストを取得する(S206)。特定部232は、取得証憑データにおいて発行元を示す文字列に対応する複数のタグ情報又はレイアウト情報を示すXMLテキストを所定の文字の特徴として抽出する。特定部232は、記憶部22の判定用データテーブルに記憶されている複数の判定用データのうち、特定部232が特定したタグ情報又はレイアウト情報との一致度が最も高いタグ情報等を示す判定用データを特定する(S207)。 When the acquisition unit 231 determines that the acquired voucher data is an electronic invoice in the determination of S201 (YES in S201), the acquisition unit 231 acquires the XML text included in the acquired voucher data (S206). The specifying unit 232 extracts, as a predetermined character feature, an XML text indicating a plurality of tag information or layout information corresponding to a character string indicating an issuer in the acquired voucher data. The specifying unit 232 determines which tag information, etc. has the highest degree of matching with the tag information or layout information specified by the specifying unit 232, among the plurality of determination data stored in the determination data table of the storage unit 22. (S207).

特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、一致度が最も高いタグ情報等を示す判定用データに関連付けて記憶されている第1発行元を特定する。特定部232は、第1の実施形態と同様にして、取得証憑データから取得したXMLテキストに基づいて、取得証憑データの第2発行元を特定し、S203の判定に進む。 The identifying unit 232 refers to the determination data table stored in the storage unit 22 and identifies the first issuer stored in association with determination data indicating tag information etc. with the highest degree of matching. Similar to the first embodiment, the identifying unit 232 identifies the second issuer of the acquired voucher data based on the XML text acquired from the acquired voucher data, and proceeds to determination in S203.

判定部233は、S203の判定において特定部232が特定した第2発行元が第1発行元と一致しない場合に(S203のNO)、取得証憑データの発行元が真正ではないと判定し(S208)、S205の処理に進む。 If the second issuer identified by the identifying unit 232 does not match the first issuer in the determination of S203 (NO in S203), the determination unit 233 determines that the issuer of the acquired voucher data is not authentic (S208). ), the process proceeds to S205.

<第2の実施形態>
第2の実施形態では、学習済みの機械学習モデルを用いて、取得証憑データの真偽を判定する場合の例について説明する。図9は、第2の実施形態のデータ処理装置300の構成を示す。第2の実施形態のデータ処理装置300では、制御部23が判定部301、生成部302及び受付部303を備える点を除いて、図4と同様である。図4と同様の機能ブロックについては図4と同じ符号を付して説明を省略する。
<Second embodiment>
In the second embodiment, an example will be described in which the authenticity of acquired voucher data is determined using a trained machine learning model. FIG. 9 shows the configuration of a data processing device 300 according to the second embodiment. The data processing device 300 of the second embodiment is the same as that in FIG. 4 except that the control unit 23 includes a determination unit 301, a generation unit 302, and a reception unit 303. Functional blocks similar to those in FIG. 4 are designated by the same reference numerals as in FIG. 4, and description thereof will be omitted.

判定部301は、証憑データとこの証憑データの発行元を示す情報とを入力データとし、証憑データが発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルを用いて、取得証憑データが真正なものであるか否かを判定する。証憑データは、電子インボイスであってもよい。まず、判定部301は、この学習済みの機械学習モデルを記憶部22から読み出す。判定部301は、読み出した機械学習モデルに対し、取得部231が取得した取得証憑データ及び特定部232が特定した発行元を示す情報を入力し、取得証憑データがこの発行元により発行された真正なものであるか否かを示す機械学習モデルが出力した情報を取得する。判定部301は、この機械学習モデルが出力した情報に基づいて、取得証憑データが真正なデータであるか否かを判定する。 The determination unit 301 is trained to use voucher data and information indicating the issuer of this voucher data as input data, and to output information indicating whether the voucher data is authentic issued by the issuer as output data. This machine learning model is used to determine whether the acquired evidence data is authentic. The evidence data may be an electronic invoice. First, the determination unit 301 reads this learned machine learning model from the storage unit 22. The determining unit 301 inputs the acquired voucher data acquired by the acquiring unit 231 and information indicating the issuer identified by the specifying unit 232 to the read machine learning model, and determines whether the acquired voucher data is genuine issued by this publisher. Obtain the information output by the machine learning model that indicates whether the The determination unit 301 determines whether the acquired evidence data is genuine data based on the information output by this machine learning model.

[機械学習モデルの学習時の処理手順]
以下、記憶部22に記憶されている機械学習モデルの学習時の処理について説明する。生成部302は、証憑データとこの証憑データの発行元を示す情報とを入力データとし、証憑データが発行元により発行された真正なものであるか否かを示す情報を出力データとする機械学習モデルを生成する。生成部302は、真正な発行元から取得したことを示すラベルに関連付けられた証憑データと、偽の発行元から取得したことを示すラベルに関連付けられた証憑データとを含む学習データを機械学習することにより、機械学習モデルを生成する。
[Processing procedure during machine learning model learning]
Hereinafter, processing during learning of the machine learning model stored in the storage unit 22 will be described. The generation unit 302 uses machine learning that uses voucher data and information indicating the issuer of this voucher data as input data, and uses information indicating whether the voucher data is authentic issued by the issuer as output data. Generate the model. The generation unit 302 performs machine learning on learning data including evidence data associated with a label indicating that the information was obtained from a genuine publisher and evidence data associated with a label indicating that the information was obtained from a fake publisher. By doing so, a machine learning model is generated.

偽の発行元から取得したラベルに関連付けられた証憑データとしては、例えば、証憑データに含まれる発行元名、発行元を示すロゴ画像又は振込先口座名の位置が、真正な発行元から取得したことを示すラベルに関連付けられた証憑データの発行元名等の位置とは閾値以上ずれている複数の証憑データを用いる。閾値は、例えば、学習済みの機械学習モデルによる証憑データの発行元の真偽判定に要求される精度に応じて当分野の専門家が定める。 Evidence data associated with a label obtained from a fake publisher includes, for example, the publisher's name, the logo image representing the publisher, or the location of the remittance account name included in the voucher data, but the location of the label obtained from the genuine publisher is A plurality of pieces of evidence data are used that are deviated by a threshold value or more from the position of the issuer name, etc. of the piece of evidence data associated with the label indicating the fact. The threshold value is determined by an expert in the field, for example, depending on the accuracy required for determining the authenticity of the issuer of evidence data using a trained machine learning model.

偽の発行元から取得したラベルに関連付けられた証憑データとしては、この証憑データに含まれる発行元名等のサイズ又は書体が、真正な発行元から取得したことを示すラベルに関連付けられた証憑データの発行元名のサイズ又は書体と異なる複数の証憑データを用いてもよい。証憑データは、電子インボイスであってもよい。 Evidence data associated with a label obtained from a fake publisher includes evidence data associated with a label that indicates that the size or font of the publisher name included in this evidence data is obtained from a genuine publisher. A plurality of pieces of evidence data may be used that are different in size or font of the publisher's name. The evidence data may be an electronic invoice.

また、第2の実施形態のデータ処理装置は、判定部301において取得証憑データが真正なデータであるか否かを判定した後、判定部301による取得証憑データの発行元が真正であるか否かを示す判定結果が正しいか否かのユーザの入力を受け付ける受付部303を備えてもよい。生成部302は、判定部301による発行元が真正であるか否かを示す情報が正しいことを示すユーザの入力を受付部303が受け付けた場合に、判定部301による判定結果に対応する新たな学習データを作成する。 Further, in the data processing device of the second embodiment, after the determination unit 301 determines whether the acquired voucher data is genuine data, the determination unit 301 determines whether the issuer of the acquired voucher data is genuine. The computer may also include a reception unit 303 that accepts a user's input as to whether or not the determination result indicating whether or not the determination result is correct. When the reception unit 303 receives a user input indicating that the information indicating whether the issuer is authentic or not by the determination unit 301 is correct, the generation unit 302 generates a new information corresponding to the determination result by the determination unit 301. Create training data.

生成部302は、証憑データが真正であるという判定部301による判定結果が正しいことを示すユーザの入力を受付部303が受け付けた場合に、判定部301が判定した対象の取得証憑データが真正であることを示すラベルに関連付けて当該取得証憑データを学習データに加える。生成部302は、証憑データが真正でないという判定部301による判定結果が正しいことを示すユーザの入力を受付部303が受け付けた場合に、判定部301が判定した対象の取得証憑データが真正でないことを示すラベルに関連付けて当該取得証憑データを学習データに加える。 When the reception unit 303 receives a user input indicating that the determination result by the determination unit 301 that the voucher data is genuine is correct, the generation unit 302 determines that the target acquired voucher data determined by the determination unit 301 is genuine. The acquired evidence data is added to the learning data in association with a label indicating that there is a certain fact. When the reception unit 303 receives a user input indicating that the determination result by the determination unit 301 that the voucher data is not authentic is correct, the generation unit 302 generates a message indicating that the target acquired voucher data determined by the determination unit 301 is not genuine. The acquired evidence data is added to the learning data in association with the label indicating the .

生成部302は、証憑データが真正であるという判定部301の判定結果が正しくないことを示すユーザの入力を受け付けた場合に、判定部301が判定した対象の取得証憑データが真正でないことを示すラベルに関連付けて当該取得証憑データを学習データに加える。生成部302は、証憑データが真正でないという判定部301による判定結果が正しくないことを示すユーザの入力を受付部303が受け付けた場合に、判定部301が判定した対象の取得証憑データが真正であることを示すラベルに関連付けて当該取得証憑データを学習データに加える。 When the generation unit 302 receives a user input indicating that the determination result of the determination unit 301 that the voucher data is genuine is incorrect, the generation unit 302 indicates that the target acquired voucher data determined by the determination unit 301 is not genuine. The acquired evidence data is added to the learning data in association with the label. When the reception unit 303 receives a user input indicating that the determination result by the determination unit 301 that the voucher data is not genuine is incorrect, the generation unit 302 determines whether the target acquired voucher data determined by the determination unit 301 is genuine. The acquired evidence data is added to the learning data in association with a label indicating that there is a certain fact.

生成部302は、このようにしてユーザにより真正であるか否かが判断された証憑データを加えた後の新たな学習データを機械学習させることにより、機械学習モデルを生成してもよい。このようにして、生成部302は、学習済みの機械学習モデルによる証憑データの発行元の真偽判定の精度をより向上させることができる。生成部302は、生成した学習済みの機械学習モデルを記憶部22に記憶させる。 The generation unit 302 may generate a machine learning model by performing machine learning on new learning data after adding the evidence data whose authenticity has been determined by the user in this way. In this way, the generation unit 302 can further improve the accuracy of determining the authenticity of the issuer of evidence data using the trained machine learning model. The generation unit 302 causes the storage unit 22 to store the generated trained machine learning model.

[データ処理装置300による証憑データの真偽判定の処理手順]
図10は、データ処理装置300による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。この処理手順は、例えば、データ処理装置300が外部装置1と通信している状態において開始する。まず、取得部231は、外部装置1から証憑データを取得する(S301)。特定部232は、取得証憑データの発行元を特定する(S302)。特定部232は、取得証憑データが電子インボイスである場合には、取得証憑データに含まれるXMLテキストに基づいて、取得証憑データの発行元を特定する。
[Processing procedure for determining authenticity of evidence data by data processing device 300]
FIG. 10 is a flowchart showing a processing procedure for determining the authenticity of the issuer of evidence data by the data processing device 300. This processing procedure starts, for example, in a state where the data processing device 300 is communicating with the external device 1. First, the acquisition unit 231 acquires evidence data from the external device 1 (S301). The identifying unit 232 identifies the issuer of the acquired voucher data (S302). When the acquired voucher data is an electronic invoice, the identification unit 232 identifies the issuer of the acquired voucher data based on the XML text included in the acquired voucher data.

判定部233は、証憑データとこの証憑データの発行元を示す情報とを入力データとし、証憑データが発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルを記憶部22から読み出す。判定部233は、読み出した機械学習モデルに対し、取得部231が取得した取得証憑データ及び特定部232が特定した発行元を示す情報を入力し(S303)、取得証憑データがこの発行元により発行された真正なものであるか否かを示す機械学習モデルが出力した情報を取得する。判定部301は、この機械学習モデルが出力した情報に基づいて、取得証憑データが真正なデータであるか否かを判定する(S304)。出力部234は、取得証憑データが真正なデータであるか否かの判定部233による判定結果を担当者端末3へ出力し(S305)、処理を終了する。 The determination unit 233 has been trained to use voucher data and information indicating the issuer of this voucher data as input data, and to output data as information indicating whether the voucher data is authentic issued by the issuer. The machine learning model is read from the storage unit 22. The determining unit 233 inputs the acquired voucher data acquired by the acquiring unit 231 and the information indicating the publisher specified by the specifying unit 232 to the read machine learning model (S303), and determines whether the acquired voucher data is issued by this publisher. Obtain information output by a machine learning model that indicates whether the item is genuine or not. The determination unit 301 determines whether the acquired evidence data is genuine data based on the information output by this machine learning model (S304). The output unit 234 outputs the determination result by the determination unit 233 as to whether the acquired voucher data is genuine data to the person in charge terminal 3 (S305), and ends the process.

[第2の実施形態のデータ処理装置2による効果]
第2の実施形態のデータ処理装置2では、出力部234は、学習済みの機械学習モデルにより、取得証憑データの発行元の真偽の判定精度が向上するので、発行元を偽った証憑データによりユーザが詐欺の被害にあうことを抑制することができる。
[Effects of the data processing device 2 of the second embodiment]
In the data processing device 2 of the second embodiment, the output unit 234 improves the accuracy of determining the authenticity of the issuer of acquired voucher data using the trained machine learning model, so It is possible to prevent users from falling victim to fraud.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist. be. All or part of the device can be configured by being functionally or physically distributed and integrated in arbitrary units. In addition, new embodiments created by arbitrary combinations of multiple embodiments are also included in the embodiments of the present invention. The effects of the new embodiment resulting from the combination have the effects of the original embodiment.

1 外部装置
2 データ処理装置
3 担当者端末
21 通信部
22 記憶部
23 制御部
231 取得部
232 特定部
233 判定部
234 出力部
300 データ処理装置
301 判定部
302 生成部
303 受付部
1 External device 2 Data processing device 3 Person in charge terminal 21 Communication section 22 Storage section 23 Control section 231 Acquisition section 232 Specification section 233 Judgment section 234 Output section 300 Data processing device 301 Judgment section 302 Generation section 303 Reception section

Claims (12)

証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部と、
証憑データを取得する取得部と、
前記取得部が取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定する特定部と、
前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定する判定部と、
前記判定部の判定結果を出力する出力部と、
を備えるデータ処理装置。
a storage unit that stores a plurality of determination data indicating characteristics of at least one of predetermined characters or images included in the regular voucher data in association with a plurality of issuers of the voucher;
an acquisition unit that acquires evidence data;
an identification unit that identifies the issuer of the voucher data based on at least one of characters or images included in the acquired voucher data acquired by the acquisition unit;
the characteristics of at least one of the predetermined characters or images included in the determination data stored in the storage unit in association with the issuer identified by the identification unit; and the predetermined characteristics included in the acquired voucher data. a determination unit that determines whether the acquired evidence data is genuine data by comparing the characteristics of at least one of characters or images;
an output unit that outputs the determination result of the determination unit;
A data processing device comprising:
前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の位置と、前記取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定する、
請求項1に記載のデータ処理装置。
The determination unit is configured to determine the position of the predetermined character or image included in the determination data stored in the storage unit in association with the issuer identified by the identification unit, and the predetermined character or image included in the acquired voucher data. determining whether the acquired evidence data is genuine data by comparing the position of the character or image of
The data processing device according to claim 1.
前記取得部は、データ構造を指定するためのマークアップ言語を含む電子インボイスを前記証憑データとして取得し、
前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定する、
請求項1又は2に記載のデータ処理装置。
The acquisition unit acquires an electronic invoice including a markup language for specifying a data structure as the voucher data,
The determination unit is configured to identify the predetermined characters included in the determination data stored in the storage unit in association with the issuer identified by the identification unit and the predetermined characters included in the acquired voucher data. determining whether the acquired evidence data is genuine data by comparing;
The data processing device according to claim 1 or 2.
前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字との一致度を特定し、特定した当該一致度に基づいて、前記取得証憑データが真正なデータであるか否かを判定する、
請求項3に記載のデータ処理装置。
The determination unit is configured to distinguish between the predetermined characters included in the determination data stored in the storage unit in association with the issuer identified by the identification unit and the predetermined characters included in the acquired voucher data. identifying a degree of coincidence, and determining whether the acquired evidence data is genuine data based on the identified degree of coincidence;
The data processing device according to claim 3.
前記判定部は、前記証憑データと当該証憑データの発行元を示す情報とを入力データとし、当該証憑データが当該発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルに対し、前記取得部が取得した前記取得証憑データ及び前記特定部が特定した前記発行元を示す情報を入力し、当該機械学習モデルが出力した前記証憑データが当該発行元により発行された真正なものであるか否かを示す情報に基づいて、前記取得証憑データが真正なデータであるか否かを判定する、
請求項1に記載のデータ処理装置。
The determination unit uses the voucher data and information indicating the issuer of the voucher data as input data, and outputs information indicating whether the voucher data is authentic issued by the publisher. The acquired voucher data acquired by the acquisition unit and the information indicating the issuer identified by the identification unit are input into the trained machine learning model, and the voucher data output by the machine learning model Determining whether the acquired voucher data is genuine data based on information indicating whether or not it is genuine issued by the source;
The data processing device according to claim 1.
真正な発行元から取得したことを示すラベルに関連付けられた前記証憑データと、偽の発行元から取得したことを示すラベルに関連付けられた前記証憑データとを含む学習データを機械学習させることにより、前記機械学習モデルを生成する生成部をさらに備える、
請求項5に記載のデータ処理装置。
By performing machine learning on learning data including the evidence data associated with a label indicating that the information was obtained from a genuine publisher and the evidence data associated with a label indicating that the information was obtained from a fake publisher, further comprising a generation unit that generates the machine learning model;
The data processing device according to claim 5.
前記判定結果が正しいか否かのユーザの入力を受け付ける受付部をさらに備え、
前記生成部は、前記取得証憑データが真正であるという前記判定結果が正しいことを示すユーザの入力を受け付けた場合に、対応する前記証憑データが真正であることを示すラベルに関連付けて当該証憑データを前記学習データに加えた新たな学習データを用いて機械学習することにより、前記機械学習モデルを生成する、
請求項6に記載のデータ処理装置。
further comprising a reception unit that receives a user's input as to whether or not the determination result is correct;
When the generation unit receives a user input indicating that the determination result that the acquired voucher data is genuine is correct, the generating unit generates the voucher data in association with a label indicating that the corresponding voucher data is genuine. Generate the machine learning model by performing machine learning using new learning data added to the learning data.
The data processing device according to claim 6.
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部と、
証憑データを取得する取得部と、
前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得部が取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データに最も類似する特徴を示す前記判定用データを特定する特定部と、
前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、前記特定部が特定した前記判定用データに対応する前記発行元と一致するか否かを判定する判定部と、
前記判定部の判定結果を出力する出力部と、
を備えるデータ処理装置。
a storage unit that stores a plurality of determination data indicating characteristics of at least one of predetermined characters or images included in the regular voucher data in association with a plurality of issuers of the voucher;
an acquisition unit that acquires evidence data;
the characteristics of at least one of the predetermined characters or images included in each of the plurality of pieces of determination data stored in the storage unit; and the characteristics of at least one of the predetermined characters or images included in the acquired evidence data acquired by the acquisition unit. a specifying unit that specifies the determination data that indicates the most similar feature to the acquired voucher data by comparing the data with at least one of the features;
determination of whether or not an issuer identified based on at least one of characters or images included in the acquired voucher data matches the issuer corresponding to the determination data identified by the identification unit; Department and
an output unit that outputs the determination result of the determination unit;
A data processing device comprising:
コンピュータが実行する、
証憑データを取得するステップと、
取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、
判定結果を出力するステップと、
を備えるデータ処理方法。
computer executes
a step of obtaining evidence data;
identifying the issuer of the acquired voucher data based on at least one of characters or images included in the acquired acquired voucher data;
The specified issuer is associated with a plurality of issuers of the evidence by referring to a storage unit that stores a plurality of determination data indicating characteristics of at least one of predetermined characters or images included in the regular evidence data. At least one feature of the predetermined character or image included in the determination data stored in the storage unit in association with at least one feature of the predetermined character or image included in the acquired voucher data. a step of determining whether the acquired voucher data is genuine data by comparing the data;
a step of outputting a determination result;
A data processing method comprising:
コンピュータが実行する、
証憑データを取得するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データに最も類似する前記判定用データを特定するステップと、
前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、
判定結果を出力するステップと、
を備えるデータ処理方法。
computer executes
a step of obtaining evidence data;
with reference to a storage unit that stores a plurality of pieces of determination data indicating characteristics of at least one of predetermined characters or images included in the regular voucher data in association with a plurality of issuers of the vouchers; Comparing at least one feature of the predetermined character or image included in each of the plurality of determination data and at least one feature of the predetermined character or image included in the acquired acquired evidence data. identifying the determination data that is most similar to the acquired evidence data;
determining whether an issuer identified based on at least one of characters or images included in the acquired voucher data matches the issuer corresponding to the identified determination data;
a step of outputting a determination result;
A data processing method comprising:
コンピュータに、
証憑データを取得するステップと、
取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、
判定結果を出力するステップと、
を実行させる、プログラム。
to the computer,
a step of obtaining evidence data;
identifying the issuer of the acquired voucher data based on at least one of characters or images included in the acquired acquired voucher data;
The specified issuer is associated with a plurality of issuers of the evidence by referring to a storage unit that stores a plurality of determination data indicating characteristics of at least one of predetermined characters or images included in the regular evidence data. At least one feature of the predetermined character or image included in the determination data stored in the storage unit in association with at least one feature of the predetermined character or image included in the acquired voucher data. a step of determining whether the acquired voucher data is genuine data by comparing the data;
a step of outputting a determination result;
A program to run.
コンピュータに、
証憑データを取得するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記判定用データに最も類似する前記判定用データを特定するステップと、
前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、
判定結果を出力するステップと、
を実行させる、プログラム。

to the computer,
a step of obtaining evidence data;
with reference to a storage unit that stores a plurality of pieces of determination data indicating characteristics of at least one of predetermined characters or images included in the regular voucher data in association with a plurality of issuers of the vouchers; Comparing at least one feature of the predetermined character or image included in each of the plurality of determination data and at least one feature of the predetermined character or image included in the acquired acquired evidence data. identifying the determination data most similar to the determination data by;
determining whether an issuer identified based on at least one of characters or images included in the acquired voucher data matches the issuer corresponding to the identified determination data;
a step of outputting a determination result;
A program to run.

JP2022170385A 2022-03-04 2022-10-25 Data processing device, data processing method, and program Pending JP2023129229A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022170385A JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2022514751A JP7170366B1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method and program
PCT/JP2022/009374 WO2023166698A1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method, and program
JP2022170385A JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2022514751A Division JP7170366B1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method and program

Publications (1)

Publication Number Publication Date
JP2023129229A true JP2023129229A (en) 2023-09-14

Family

ID=84027198

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022514751A Active JP7170366B1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method and program
JP2022170385A Pending JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2022514751A Active JP7170366B1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method and program

Country Status (2)

Country Link
JP (2) JP7170366B1 (en)
WO (1) WO2023166698A1 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080281871A1 (en) * 2004-10-14 2008-11-13 Kocteq Ab Method for Handling Electronic Documents
JP6743445B2 (en) * 2016-03-25 2020-08-19 大日本印刷株式会社 Portable information device and program
JP6712738B1 (en) * 2019-10-31 2020-06-24 株式会社日本デジタル研究所 Voucher judging device, accounting processor, voucher judging program, voucher judging system and voucher judging method
JP6794564B1 (en) * 2020-04-09 2020-12-02 ファーストアカウンティング株式会社 Invoice management device, invoice management method and program
WO2021205619A1 (en) * 2020-04-09 2021-10-14 ファーストアカウンティング株式会社 Invoice management device, invoice management method, and program

Also Published As

Publication number Publication date
WO2023166698A1 (en) 2023-09-07
JP7170366B1 (en) 2022-11-14
JPWO2023166698A1 (en) 2023-09-07

Similar Documents

Publication Publication Date Title
JP5090369B2 (en) Automated processing using remotely stored templates (method for processing forms, apparatus for processing forms)
US9864920B2 (en) Semiautomatic multifunction device-based validation of secure documents
US20050096992A1 (en) Image-enabled item processing for point of presentment application
CN108960223A (en) The method for automatically generating voucher based on bill intelligent recognition
US10102439B2 (en) Document verification method and system
US9390089B2 (en) Distributed capture system for use with a legacy enterprise content management system
US9864906B2 (en) Method and system for creating a validation document for security
CN112487982A (en) Merchant information auditing method, system and storage medium
JP2013025571A (en) Card issue system and card issue method
KR101841928B1 (en) Method for issuing document offline, method for validating issued offline document, and server using the same
JP5659505B2 (en) Authentication apparatus and authentication method
CN110956166A (en) Bill marking method and device
CN114202759A (en) Multi-currency paper currency crown word number identification method and device based on deep learning
JP7170366B1 (en) Data processing device, data processing method and program
CN112541498A (en) Information processing apparatus and recording medium
WO2008004221A2 (en) Inserting digital signatures into a transformed document
JP4594692B2 (en) Loan contract office processing system
CN110609987B (en) Document making and processing system
CN112560055B (en) Credible electronic license system based on PKI technology and working method
CN110288472B (en) Bill transaction risk control method and device
CN108074324B (en) Paper money counterfeit distinguishing method and device
KR20230148556A (en) Method and apparatus for validating a certification using nof-fungible token
TWI669670B (en) Electronic trading system
JP2022136711A (en) Information processing device, information processing system, and information processing program
Nugroho et al. The Design of a C1 Document Data Extraction Application Using a Tesseract-Optical Character Recognition Engine

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20231014