JP7170366B1 - Data processing device, data processing method and program - Google Patents

Data processing device, data processing method and program Download PDF

Info

Publication number
JP7170366B1
JP7170366B1 JP2022514751A JP2022514751A JP7170366B1 JP 7170366 B1 JP7170366 B1 JP 7170366B1 JP 2022514751 A JP2022514751 A JP 2022514751A JP 2022514751 A JP2022514751 A JP 2022514751A JP 7170366 B1 JP7170366 B1 JP 7170366B1
Authority
JP
Japan
Prior art keywords
data
issuer
voucher
unit
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022514751A
Other languages
Japanese (ja)
Other versions
JPWO2023166698A1 (en
Inventor
鴻鵬 葛
顕 松田
智 小俣
啓太郎 森
将和 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fast Accounting Inc
Original Assignee
Fast Accounting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fast Accounting Inc filed Critical Fast Accounting Inc
Priority to JP2022170385A priority Critical patent/JP2023129229A/en
Application granted granted Critical
Publication of JP7170366B1 publication Critical patent/JP7170366B1/en
Publication of JPWO2023166698A1 publication Critical patent/JPWO2023166698A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

データ処理装置1は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部22と、証憑データを取得する取得部231と、取得部231が取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、証憑データの発行元を特定する特定部232と、特定部232が特定した発行元に関連付けて記憶部22に記憶された判定用データに含まれる所定の文字又は画像の少なくともいずれかの特徴と、取得証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、取得証憑データが真正なデータであるか否かを判定する判定部233と、判定部233の判定結果を出力する出力部234と、を備える。

The data processing device 1 includes a storage unit 22 for storing a plurality of determination data indicating at least one of the characteristics of predetermined characters or images included in the regular voucher data in association with a plurality of issuers of the voucher, and the voucher data. an acquiring unit 231 that acquires the acquired voucher data, a specifying unit 232 that specifies the issuer of the voucher data based on at least one of characters or images included in the acquired voucher data acquired by the acquiring unit 231, and the specifying unit 232 specifies At least one of the characteristics of predetermined characters or images included in the determination data stored in the storage unit 22 in association with the issuer and at least one of the characteristics of the predetermined characters or images included in the obtained voucher data It comprises a determination unit 233 that determines whether or not the obtained voucher data is authentic data by comparison, and an output unit 234 that outputs the determination result of the determination unit 233 .

Description

本発明は、請求データを処理するためのデータ処理装置、データ処理方法及びプログラムに関する。 The present invention relates to a data processing device, data processing method and program for processing billing data.

従来、証憑データ等の帳票データの発行元の真偽を判定することが行われている(例えば、特許文献1を参照)。特許文献1には、帳票データに埋め込まれた電子署名を検証することにより、帳票データの真正性を検証することが記載されている。 2. Description of the Related Art Conventionally, the authenticity of an issuer of document data such as voucher data is determined (see Patent Document 1, for example). Patent Document 1 describes verifying the authenticity of form data by verifying an electronic signature embedded in the form data.

特開2007―206964号公報JP 2007-206964 A

特許文献1に記載された技術では、証憑データに電子署名が埋め込まれていない場合、証憑データが真正なものであるか否かを判定することができないという問題があった。 The technique described in Patent Literature 1 has a problem that if the electronic signature is not embedded in the voucher data, it cannot be determined whether or not the voucher data is genuine.

そこで、本発明はこれらの点に鑑みてなされたものであり、証憑データが真正なものであるか否かを判定することができる情報出力装置、情報出力方法及びプログラムを提供することを目的とする。 Accordingly, the present invention has been made in view of these points, and it is an object of the present invention to provide an information output device, an information output method, and a program capable of determining whether documented evidence data is genuine. do.

本発明の第1の態様に係るデータ処理装置は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部と、証憑データを取得する取得部と、前記取得部が取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定する特定部と、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定する判定部と、前記判定部の判定結果を出力する出力部と、を備える。 A data processing apparatus according to a first aspect of the present invention stores a plurality of determination data indicating at least one of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers. a storage unit that acquires evidence data, an identification unit that identifies an issuer of the evidence data based on at least one of characters or images included in the acquired evidence data acquired by the acquisition unit; At least one of the characteristics of the predetermined character or image included in the determination data stored in the storage unit in association with the issuer identified by the identification unit, and the predetermined character included in the obtained voucher data a determination unit that determines whether or not the obtained voucher data is authentic data by comparing at least one characteristic of characters or images; and an output unit that outputs the determination result of the determination unit. Prepare.

前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の位置と、前記取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定してもよい。前記取得部は、データ構造を指定するためのマークアップ言語を含む電子インボイスを前記証憑データとして取得し、前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定してもよい。 The determination unit determines the position of the predetermined character or image included in the determination data stored in the storage unit in association with the issuer identified by the identification unit, and the predetermined character or image included in the obtained voucher data. It may be determined whether or not the obtained voucher data is authentic data by comparing the positions of the characters or images of the above. The acquisition unit acquires an electronic invoice including a markup language for designating a data structure as the voucher data, and the determination unit stores it in the storage unit in association with the issuer identified by the identification unit. determining whether or not the obtained voucher data is authentic data by comparing the predetermined characters included in the obtained judgment data with the predetermined characters included in the obtained voucher data. good too.

前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字との一致度を特定し、特定した当該一致度に基づいて、前記取得証憑データが真正なデータであるか否かを判定してもよい。前記判定部は、前記証憑データと当該証憑データの発行元を示す情報とを入力データとし、当該証憑データが当該発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルに対し、前記取得部が取得した前記取得証憑データ及び前記特定部が特定した前記発行元を示す情報を入力し、当該機械学習モデルが出力した前記証憑データが当該発行元により発行された真正なものであるか否かを示す情報に基づいて、前記取得証憑データが真正なデータであるか否かを判定してもよい The judging unit determines whether the predetermined character included in the judgment data stored in the storage unit in association with the issuer identified by the identifying unit and the predetermined character included in the obtained voucher data. A degree of matching may be specified, and based on the specified degree of matching, it may be determined whether or not the obtained voucher data is genuine data. The judging unit uses the voucher data and information indicating an issuer of the voucher data as input data, and outputs information indicating whether or not the voucher data is issued by the issuer and is genuine. The acquired voucher data acquired by the acquisition unit and the information indicating the issuer identified by the identification unit are input to the learned machine learning model, and the voucher data output by the machine learning model is the issuer It may be determined whether or not the obtained voucher data is authentic based on information issued by the source indicating whether or not the data is authentic.

前記データ処理装置は、真正な発行元から取得したことを示すラベルに関連付けられた前記証憑データと、偽の発行元から取得したことを示すラベルに関連付けられた前記証憑データとを含む学習データを機械学習させることにより、前記機械学習モデルを生成する生成部をさらに備えてもよい。前記データ処理装置は、前記判定結果が正しいか否かのユーザの入力を受け付ける受付部をさらに備え、前記生成部は、前記取得証憑データが真正であるという前記判定結果が正しいことを示すユーザの入力を受け付けた場合に、対応する前記証憑データが真正であることを示すラベルに関連付けて当該証憑データを前記学習データに加えた新たな学習データを用いて機械学習することにより、前記機械学習モデルを生成してもよい。 The data processing device stores learning data including the evidenced data associated with a label indicating that it has been obtained from an authentic issuer and the evidenced data associated with a label that indicates that it has been obtained from a false issuer. It may further include a generation unit that generates the machine learning model by performing machine learning. The data processing apparatus further includes a receiving unit that receives a user input as to whether or not the determination result is correct, and the generating unit receives a user input indicating that the determination result that the acquired voucher data is authentic is correct. When an input is received, the machine learning model performs machine learning using new learning data obtained by adding the corresponding evidenced data to the learning data in association with a label indicating that the corresponding evidenced data is authentic. may be generated.

本発明の第2の態様に係るデータ処理装置は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部と、証憑データを取得する取得部と、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得部が取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データに最も類似する特徴を示す前記判定用データを特定する特定部と、前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、前記特定部が特定した前記判定用データに対応する前記発行元と一致するか否かを判定する判定部と、前記判定部の判定結果を出力する出力部と、を備える。 A data processing apparatus according to a second aspect of the present invention stores a plurality of determination data indicating at least one of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers. a storage unit that acquires documentary evidence data; a feature of at least one of the predetermined characters or images included in each of the plurality of determination data stored in the storage unit; an identification unit that identifies the determination data indicating characteristics most similar to the acquired evidenced data by comparing the characteristics of at least one of the predetermined characters or images included in the acquired evidenced evidenced data; a determination unit that determines whether or not the issuer specified based on at least one of characters or images included in the voucher data matches the issuer corresponding to the determination data specified by the specification unit; and an output unit for outputting the determination result of the determination unit.

本発明の第3の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、判定結果を出力するステップと、を備える。 A data processing method according to a third aspect of the present invention is a computer-executed step of acquiring voucher data; a step of identifying an issuer; and referring to a storage unit that stores a plurality of judgment data indicating characteristics of at least one of predetermined characters or images included in the normalized voucher data in association with a plurality of issuers of the voucher. and at least one of the predetermined character or image included in the determination data stored in the storage unit in association with the specified issuer, and the predetermined character or image included in the obtained voucher data. determining whether or not the acquired documented voucher data is authentic data by comparing with at least one feature of the image; and outputting the determination result.

本発明の第4の態様に係るデータ処理方法は、コンピュータが実行する、証憑データを取得するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データに最も類似する前記判定用データを特定するステップと、前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、判定結果を出力するステップと、を備える。 A data processing method according to a fourth aspect of the present invention is a computer-executed step of acquiring voucher data; At least one of the characteristics of the predetermined character or image included in each of the plurality of determination data stored in the storage unit with reference to a storage unit that stores a plurality of determination data indicating any of the characteristics and the characteristics of at least one of the predetermined characters or images included in the acquired voucher data to identify the judgment data most similar to the acquired voucher data; determining whether or not a publisher identified based on at least one of characters or images included in the data matches the publisher corresponding to the identified determination data; and outputting a determination result. a step;

本発明の第5の態様に係るプログラムは、コンピュータに、証憑データを取得するステップと、取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、前記証憑データの発行元を特定するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、前記取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、判定結果を出力するステップと、を実行させる。 A program according to a fifth aspect of the present invention provides a computer with a step of acquiring voucher data; and referring to a storage unit that stores a plurality of judgment data indicating at least one of the characteristics of predetermined characters or images included in the normal voucher data in association with a plurality of issuers of the voucher, At least one of the predetermined character or image included in the determination data stored in the storage unit in association with the issuer, and at least one of the predetermined character or image included in the obtained voucher data A step of determining whether or not the acquired documented voucher data is authentic data by comparing with the characteristic, and a step of outputting the determination result are executed.

本発明の第6の態様に係るプログラムは、コンピュータに、証憑データを取得するステップと、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の少なくともいずれかの特徴と、取得した取得証憑データに含まれる前記所定の文字又は画像の少なくともいずれかの特徴とを比較することにより、前記判定用データに最も類似する前記判定用データを特定するステップと、前記取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、判定結果を出力するステップと、を実行させる。 A program according to a sixth aspect of the present invention is provided in a computer with a step of obtaining voucher data, and at least one characteristic of a predetermined character or image included in regular voucher data in association with a plurality of issuers of voucher data. with reference to a storage unit that stores a plurality of determination data indicating the acquired a step of identifying the judgment data most similar to the judgment data by comparing the characteristics of at least one of the predetermined characters or images contained in the acquired voucher data; determining whether or not a publisher identified based on at least one of characters or images matches the publisher corresponding to the identified determination data; and outputting a determination result. let it run.

本発明によれば、証憑データが真正なものであるか否かを判定するという効果を奏する。 According to the present invention, there is an effect that it is determined whether or not evidenced document data is authentic.

第1の実施形態に係るデータ処理システムの概要を説明するための図である。1 is a diagram for explaining an overview of a data processing system according to a first embodiment; FIG. データ処理装置の構成を示す。1 shows the configuration of a data processing device; 判定用データテーブルの一例を示す。An example of a determination data table is shown. 取得証憑データの特徴抽出の例を示す。An example of feature extraction of acquired voucher data is shown. 判定用データの別の一例を示す。Another example of determination data is shown. 証憑データの特徴抽出の別の一例を示す。Another example of feature extraction of voucher data is shown. データ処理装置による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。10 is a flow chart showing a processing procedure for authenticity determination of an issuer of voucher data by a data processing device; 変形例のデータ処理装置2による証憑データの真偽判定の処理手順を示すフローチャートである。こ10 is a flow chart showing a processing procedure for authenticity determination of documented voucher data by the data processing device 2 of the modified example. child 第2の実施形態のデータ処理装置の構成を示す。1 shows the configuration of a data processing device according to a second embodiment; データ処理装置による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。10 is a flow chart showing a processing procedure for authenticity determination of an issuer of voucher data by a data processing device;

[データ処理システムSの概要]
図1は、第1の実施形態に係るデータ処理システムSの概要を説明するための図である。データ処理システムSは、外部装置1、データ処理装置2及び担当者端末3を備える。データ処理システムSは、複数の担当者端末3を備えてもよい。
[Overview of data processing system S]
FIG. 1 is a diagram for explaining an outline of a data processing system S according to the first embodiment. A data processing system S includes an external device 1 , a data processing device 2 and a staff terminal 3 . The data processing system S may include a plurality of person-in-charge terminals 3 .

外部装置1は、例えば、取引先等の事業者の施設に設置されたコンピュータ、データ処理装置2を使用する事業者の従業員のコンピュータ、又は電子インボイスが送受信されるネットワークのアクセスポイントである。外部装置1は、ネットワークを介して、データ処理装置2と通信する。外部装置1は、請求書データ等の証憑データをデータ処理装置2へ送信する。証憑データは、例えば、請求書データ、領収書データである。証憑データは、電子インボイスであってもよく、PDF(Portable Document Format)データ等の電子データであってもよい。証憑データは、紙の請求書をOCR(Optical Character Recognition)で読み取ったものであってもよい。担当者端末3が外部装置1として機能してもよい。 The external device 1 is, for example, a computer installed at a facility of a business partner such as a business partner, a computer of an employee of the business operator who uses the data processing device 2, or an access point of a network through which electronic invoices are transmitted and received. . The external device 1 communicates with the data processing device 2 via a network. The external device 1 transmits voucher data such as invoice data to the data processing device 2 . The voucher data is bill data and receipt data, for example. The voucher data may be an electronic invoice or electronic data such as PDF (Portable Document Format) data. The voucher data may be obtained by reading a paper bill with OCR (Optical Character Recognition). The person in charge terminal 3 may function as the external device 1 .

担当者端末3は、例えば、データ処理装置2を使用する経理部門の担当者が使用するコンピュータである。担当者端末3は、ネットワークを介してデータ処理装置2と通信する。なお、担当者端末3は、ネットワークを介して外部装置1との間でデータを送受信してもよい。 The person in charge terminal 3 is, for example, a computer used by a person in charge of an accounting department who uses the data processing device 2 . The person in charge terminal 3 communicates with the data processing device 2 via the network. Note that the person in charge terminal 3 may transmit and receive data to and from the external device 1 via a network.

データ処理装置2は、ネットワークNを介して、外部装置1及び担当者端末3と通信する。データ処理装置2は、例えば事業者のローカルネットワークに接続されたサーバであるが、クラウドサーバであってもよい。データ処理装置2は、外部装置1から証憑データ(以下、「取得証憑データ」ともいう)を取得する(図1中の(1)))。データ処理装置2は、担当者端末3が外部装置1から証憑データを受信した場合には、担当者端末3からこの証憑データを取得してもよい。 The data processing device 2 communicates with the external device 1 and the person in charge terminal 3 via the network N. FIG. The data processing device 2 is, for example, a server connected to a local network of an operator, but may be a cloud server. The data processing device 2 acquires voucher data (hereinafter also referred to as “obtained voucher data”) from the external device 1 ((1) in FIG. 1). When the person in charge terminal 3 receives the evidence data from the external device 1 , the data processing device 2 may acquire the evidence data from the person in charge terminal 3 .

データ処理装置2は、取得した取得証憑データに含まれる会社を示す文字又は画像等(以下、「文字等」という)に基づいて、取得証憑データの発行元を特定する(図1中の(2))。データ処理装置2は、証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字等の特徴を示す複数の判定用データを含む判定用データテーブルを記憶している。データ処理装置2は、記憶している判定用データテーブルを参照して、特定した発行元に関連付けて記憶されている判定用データを特定する。 The data processing device 2 identifies the issuer of the acquired voucher data based on characters or images (hereinafter referred to as "characters, etc.") indicating the company included in the acquired voucher data ((2 in FIG. 1). )). The data processing device 2 stores a determination data table containing a plurality of determination data indicating characteristics such as predetermined characters included in the regular voucher data in association with multiple issuers of the voucher. The data processing device 2 refers to the stored judgment data table and identifies the judgment data stored in association with the identified issuer.

データ処理装置2は、特定した判定用データに含まれる所定の文字等の特徴と、取得証憑データに含まれる対応する所定の文字等の特徴とを比較することにより、取得証憑データ発行元が真正であるか否かを判定する(図1中の(3))。データ処理装置2は、取得証憑データが真正であるか否かの判定結果を担当者端末3へ出力する(図1中の(4))。 The data processing device 2 compares the characteristics such as predetermined characters included in the specified determination data with the corresponding characteristics such as predetermined characters included in the acquired voucher data, thereby confirming the authenticity of the issuer of the acquired voucher data. ((3) in FIG. 1). The data processing device 2 outputs the determination result as to whether or not the obtained voucher data is authentic to the person in charge terminal 3 ((4) in FIG. 1).

このようにして、データ処理装置2は、取得証憑データに含まれる文字又は画像の少なくともいずれかの特徴に基づいて、請求データが真正であるか否かの判定結果を出力するので、発行元を偽った証憑データを受信した場合に、ユーザが詐欺の被害にあうことを抑制することができる。 In this way, the data processing device 2 outputs the judgment result as to whether or not the billing data is authentic based on at least one of the characters or images included in the acquired voucher data. To prevent a user from being a victim of fraud when falsified documented evidence data is received.

[データ処理装置2の構成]
図2は、データ処理装置2の構成を示す。データ処理装置2は、通信部21、記憶部22及び制御部23を備える。制御部23は、取得部231、特定部232、判定部233及び出力部234を備える。
[Configuration of data processor 2]
FIG. 2 shows the configuration of the data processing device 2. As shown in FIG. The data processing device 2 includes a communication section 21 , a storage section 22 and a control section 23 . The control unit 23 includes an acquisition unit 231 , an identification unit 232 , a determination unit 233 and an output unit 234 .

通信部21は、担当者端末3と通信するためのインターフェースである。記憶部22は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部22は、制御部23が実行するプログラムを記憶する。記憶部22には、証憑データの発行元と、証憑データの発行元を示すロゴ等の画像とを関連付けた発行元情報が記憶されている。 The communication unit 21 is an interface for communicating with the person in charge terminal 3 . The storage unit 22 has a storage medium such as a ROM (Read Only Memory), a RAM (Random Access Memory), and a hard disk. The storage unit 22 stores programs executed by the control unit 23 . The storage unit 22 stores issuer information that associates the issuer of the evidenced data with an image such as a logo indicating the issuer of the evidenced data.

記憶部22には、証憑の複数の発行元を示す情報と、正規証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を示す複数の判定用データとが関連付けられた判定用データテーブルが記憶されている。正規証憑データは、正規の発行元が発行したことが予め分かっている証憑データである。判定用データは、例えば、発行元を示す文字列の位置を、正規証憑データに含まれる所定の文字又は画像の特徴として示す。発行元を示す文字列の位置は、一例としては発行元を示す文字列の位置の紙面の左端からの距離と、発行元を示す文字列の位置の紙面の上端からの距離とを含み、ミリメートル単位で表現される。 The storage unit 22 stores a data table for determination in which information indicating a plurality of issuers of vouchers is associated with a plurality of data for determination indicating at least one characteristic of predetermined characters or images included in the normal voucher data. is stored. Authentic evidence data is evidence data that is known in advance to have been issued by a legitimate issuer. The determination data indicates, for example, the position of a character string indicating the issuer as a feature of a predetermined character or image included in the authorized voucher data. For example, the position of the character string indicating the publisher includes the distance from the left edge of the page to the position of the character string indicating the publisher, and the distance from the top edge of the page to the position of the character string indicating the publisher. Expressed in units.

図3は、判定用データテーブルの一例を示す。図4は、取得証憑データの特徴抽出の例を示す。図3に示す判定用データテーブルでは、正規証憑データの発行元と、正規証憑データに含まれる発行元名の位置の紙面左端からの距離を示す第1判定用データと、正規証憑データに含まれる発行元名の位置の紙面上端からの距離を示す第2判定用データとが関連付けられている。 FIG. 3 shows an example of the determination data table. FIG. 4 shows an example of feature extraction of acquired voucher data. In the judgment data table shown in FIG. 3, the issuer of the authorized voucher data, the first judgment data indicating the distance from the left edge of the paper surface of the name of the issuer included in the authorized voucher data, and the first judgment data included in the authorized voucher data It is associated with second determination data indicating the distance from the upper edge of the paper surface to the position of the publisher name.

発行元名の位置の紙面左端からの距離は、例えば図4に示すD1である。図4に示す例においては、発行元名を示す文字列の左端を発行元名の位置としているが、発行元名の位置は発行元名を示す文字列の右端であってもよく、文字列の中央であってもよい。同様に、発行元名の位置の紙面上端からの距離は、例えば図4に示すD2である。図4に示す例においては、発行元名を示す文字列の上端を発行元名の位置としているが、発行元名の位置は発行元名を示す文字列の下端であってもよく、文字列の中央であってもよい。 The distance from the left edge of the page to the position of the publisher name is D1 shown in FIG. 4, for example. In the example shown in FIG. 4, the left end of the character string indicating the publisher name is the position of the publisher name, but the position of the publisher name may be the right end of the character string indicating the publisher name. may be in the center of Similarly, the distance from the upper edge of the page to the position of the publisher name is D2 shown in FIG. 4, for example. In the example shown in FIG. 4, the upper end of the character string indicating the publisher name is the position of the publisher name, but the position of the publisher name may be the lower end of the character string indicating the publisher name. may be in the center of

図3の上から1段目の例では、発行元「AB商事」が発行した正規証憑データにおいて発行元名を示す文字列の紙面左端からの距離は、201ミリメートルであり、発行元名を示す文字列の位置の紙面上端からの距離は、60ミリメートルであることを示す。図3の上から2段目の例では、発行元「CD製造所」が発行した正規証憑データにおいて発行元名を示す文字列の位置の紙面左端からの距離は、170ミリメートルであり、発行元名を示す文字列の位置の紙面上端からの距離は、30ミリメートルであることを示す。 In the example in the first row from the top of FIG. 3, the distance from the left edge of the paper surface of the character string indicating the name of the issuer in the authentic voucher data issued by the issuer "AB Trading" is 201 mm, indicating the name of the issuer. The distance from the upper edge of the paper surface to the position of the character string is 60 millimeters. In the example on the second row from the top of FIG. It indicates that the distance from the top edge of the paper surface to the position of the character string indicating the name is 30 millimeters.

図4は、証憑データの特徴の抽出の例を示す。図4中には、発行元名の会社名「AB商事」を破線の枠線で示す。図4の例では、取得証憑データに含まれる発行元の会社名を示す文字列「AB商事」の位置の紙面左端からの距離D1は、後述する判定部233により特徴として抽出される。取得証憑データに含まれる発行元を示す文字列「AB商事」の位置の紙面上端からの距離D2は、判定部233により特徴として抽出される。 FIG. 4 shows an example of extracting features of voucher data. In FIG. 4, the company name "AB Trading" of the issuer name is indicated by a dashed frame line. In the example of FIG. 4, the distance D1 from the left edge of the page to the position of the character string "AB Trading" indicating the company name of the issuer included in the acquired voucher data is extracted as a feature by the determination unit 233, which will be described later. The determination unit 233 extracts the distance D2 from the upper end of the page to the position of the character string “AB Trading” indicating the issuer included in the acquired voucher data as a feature.

図5は、判定用データの別の一例を示す。図6は、証憑データの特徴抽出の別の一例を示す。図5に示す判定用データでは、正規証憑データの発行元と、正規証憑データに含まれる発行元を示すロゴ画像の位置の紙面左端からの距離を示す第1判定用データと、正規証憑データに含まれる発行元を示すロゴ画像の位置の紙面上端からの距離を示す第2判定用データとが関連付けられている。 FIG. 5 shows another example of determination data. FIG. 6 shows another example of feature extraction of voucher data. The data for determination shown in FIG. It is associated with the second determination data indicating the distance from the top edge of the page to the position of the included logo image indicating the publisher.

発行元を示すロゴ画像の位置の紙面左端からの距離は、例えば図6に示すD1’である。図6に示す例においては、発行元を示すロゴ画像の左端をロゴ画像の位置としているが、発行元を示すロゴ画像の位置は発行元を示すロゴ画像右端であってもよく、ロゴ画像の中央であってもよい。同様に、ロゴ画像の位置の紙面上端からの距離は、例えば図6に示すD2’である。図6に示す例においては、発行元を示すロゴ画像の上端をロゴ画像の位置としているが、ロゴ画像の位置は発行元を示すロゴ画像の下端であってもよく、ロゴ画像の中央であってもよい。 The distance from the left edge of the page to the position of the logo image indicating the publisher is D1' shown in FIG. 6, for example. In the example shown in FIG. 6, the left end of the logo image indicating the publisher is the position of the logo image, but the position of the logo image indicating the publisher may be the right end of the logo image indicating the publisher. It can be central. Similarly, the distance of the position of the logo image from the upper edge of the paper surface is, for example, D2' shown in FIG. In the example shown in FIG. 6, the position of the logo image is the upper end of the logo image indicating the issuer, but the position of the logo image may be the lower end of the logo image indicating the issuer, or the center of the logo image. may

図5の上から1段目の例では、発行元「AB商事」が発行した正規証憑データにおいて発行元を示すロゴ画像の位置の紙面左端からの距離は、20ミリメートルであり、発行元を示すロゴ画像の紙面上端からの距離は、16ミリメートルであることを示す。図5の上から2段目の例では、発行元「CD製造所」が発行した正規証憑データにおいて発行名を示すロゴ画像の位置の紙面左端からの距離は、17ミリメートルであり、発行元を示すロゴ画像の紙面上端からの距離は、30ミリメートルであることを示す。 In the example in the first row from the top of FIG. 5, the distance from the left edge of the page to the position of the logo image indicating the issuer in the regular document data issued by the issuer "AB Trading" is 20 mm, indicating the issuer. It shows that the distance from the top edge of the paper surface of the logo image is 16 millimeters. In the example on the second row from the top of FIG. 5, the distance from the left edge of the page to the position of the logo image indicating the issuing name in the official document data issued by the issuing source “CD Manufacturing” is 17 mm. The logo image shown is 30 millimeters from the top edge of the paper surface.

図6は、取得証憑データの特徴の抽出の別の例を示す。図6の例に示すように、取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面左端からの距離D1’は、後述する判定部233により特徴として抽出される。取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面上端からの距離D2’は、判定部233により特徴として抽出される。 FIG. 6 shows another example of extraction of features of acquired voucher data. As shown in the example of FIG. 6, the distance D1' from the left edge of the page to the position of the logo image of the issuer "AB Trading" in the form of "AB" included in the acquired voucher data is determined as a feature by the determination unit 233, which will be described later. extracted. The determination unit 233 extracts the distance D2' from the top edge of the paper surface to the position of the logo image shaped like "AB" of the issuer "AB Trading" included in the acquired voucher data as a feature.

図2の制御部23は、例えばCPU(Central Processing Unit)である。制御部23は、記憶部22に記憶されたプログラムを実行することにより、取得部231、特定部232、判定部233及び出力部234として機能する。 The control unit 23 in FIG. 2 is, for example, a CPU (Central Processing Unit). The control unit 23 functions as an acquisition unit 231 , an identification unit 232 , a determination unit 233 and an output unit 234 by executing programs stored in the storage unit 22 .

取得部231は、通信部21を介して、外部装置1又は担当者端末3と通信する。取得部231は、外部装置1を介して証憑データを取得する。取得部231は、データ構造を指定するためのマークアップ言語を含む電子インボイスを証憑データとして取得してもよい。例えば、取得部231は、XML形式で記述された電子インボイスを証憑データとして取得してもよい。取得部231は、担当者端末3が外部装置1から証憑データを受信した場合には、担当者端末3から証憑データを取得してもよい。取得部231は、取得した証憑データを特定部232へ出力する。 The acquisition unit 231 communicates with the external device 1 or the person in charge terminal 3 via the communication unit 21 . Acquisition unit 231 acquires voucher data via external device 1 . The acquisition unit 231 may acquire an electronic invoice including a markup language for designating the data structure as the voucher data. For example, the acquisition unit 231 may acquire an electronic invoice written in XML format as voucher data. The obtaining unit 231 may obtain the voucher data from the terminal 3 of the person in charge when the terminal 3 of the person in charge receives the voucher data from the external device 1 . The acquisition unit 231 outputs the acquired voucher data to the identification unit 232 .

[発行元の特定]
特定部232は、取得部231が取得した取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、証憑データの発行元を特定する。例えば、特定部232は、取得証憑データに含まれる企業名のうち、宛先を示す「御中」等のキーワードが付されていない企業名を証憑データの発行元として特定する。特定部232は、証憑データが電子インボイスである場合には、発行元であることを示すタグが付された文字列を発行元名として特定する。
[Identify publisher]
The identifying unit 232 identifies the issuer of the voucher data based on at least one of the characters or images included in the acquired voucher data acquired by the acquiring unit 231 . For example, the identifying unit 232 identifies, as the issuer of the voucher data, a company name that does not have a keyword such as "your" indicating the destination among the company names included in the acquired voucher data. When the documented evidence data is an electronic invoice, the identification unit 232 identifies a character string with a tag indicating the issuer as the issuer name.

特定部232は、証憑データの発行元を示すロゴ画像に基づいて、証憑データの発行元を特定してもよい。まず、特定部232は、証憑データの発行元と、証憑データの発行元を示すロゴ画像とを関連付けた発行元情報を記憶部22から読み出す。特定部232は、読み出した発行元情報を参照して、取得証憑データに含まれるロゴ画像との類似度が閾値以上のロゴ画像に発行元情報において関連付けて記憶されている発行元を特定してもよい。閾値は、例えば、取得証憑データに含まれる企業名に基づいて証憑データの発行元を特定する場合と同等の精度で発行元を特定するために必要な値として定められた値である。特定部232は、特定した発行元を示す情報を判定部233へ出力する。 The identification unit 232 may identify the issuer of the evidenced data based on the logo image indicating the issuer of the evidenced data. First, the identifying unit 232 reads from the storage unit 22 the issuer information that associates the issuer of the evidenced data with the logo image indicating the issuer of the evidenced data. The specifying unit 232 refers to the read issuer information, and specifies the issuer stored in association with the logo image whose similarity to the logo image included in the acquired voucher data is equal to or greater than a threshold in the issuer information. good too. The threshold is, for example, a value determined as a value required to identify the issuer of the voucher data with the same accuracy as when identifying the issuer of the voucher data based on the company name included in the acquired voucher data. The identification unit 232 outputs information indicating the identified publisher to the determination unit 233 .

[取得証憑データの発行元の真偽判定]
判定部233は、取得証憑データが真正であるか否かを判定する。まず、判定部233は、取得証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を抽出する。例えば、判定部233は、取得証憑データに含まれる所定の文字又は画像の位置、サイズ又は書体等を特徴として抽出する。
[Verification of the authenticity of the issuer of the acquired voucher data]
The determination unit 233 determines whether or not the obtained voucher data is authentic. First, the determination unit 233 extracts the characteristics of at least one of predetermined characters or images included in the obtained voucher data. For example, the determination unit 233 extracts the position, size, typeface, or the like of predetermined characters or images included in the obtained voucher data as features.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。この判定データには、正規証憑データから抽出された所定の文字又は画像の位置、サイズ又は書体等の特徴が含まれている。判定部233は、取得証憑データから抽出した所定の文字又は画像の位置、サイズ又は書体等の特徴と、特定した判定用データに含まれる対応する特徴とを比較することにより、取得証憑データが真正なデータであるか否かを判定する。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies determination data stored in association with the issuer identified by the identification unit 232 . This determination data includes characteristics such as the position, size, or typeface of predetermined characters or images extracted from the regular voucher data. The judging unit 233 determines the authenticity of the acquired voucher data by comparing the characteristics such as the position, size, or typeface of a predetermined character or image extracted from the acquired voucher data with the corresponding characteristics included in the specified determination data. It is determined whether or not the data is valid.

図4の例では、判定部233は、上述のように、取得証憑データに含まれる発行元の会社名を示す文字列「AB商事」の位置の紙面左端からの距離D1を特徴として抽出する。判定部233は、取得証憑データに含まれる発行元を示す文字列「AB商事」の位置の紙面上端からの距離D2を特徴として抽出する。 In the example of FIG. 4, the determination unit 233 extracts, as described above, the distance D1 from the left edge of the page to the position of the character string "AB Trading" indicating the company name of the issuer included in the acquired voucher data as a feature. The determination unit 233 extracts the distance D2 from the upper edge of the page to the position of the character string “AB Trading” indicating the issuer contained in the acquired voucher data as a feature.

判定部233は、記憶部22に記憶されている判定用データテーブル(図3参照)を参照して、特定部232が特定した発行元「AB商事」に関連付けて記憶されている第1判定用データが示す正規証憑データに含まれる発行元名の位置の紙面左端からの距離が201ミリメートルであることを特定する。 The determination unit 233 refers to the determination data table (see FIG. 3) stored in the storage unit 22, and refers to the first determination data table stored in association with the issuer “AB Trading” identified by the identification unit 232. It is specified that the distance from the left edge of the page to the position of the issuer name included in the regular voucher data indicated by the data is 201 millimeters.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元「AB商事」に関連付けて記憶されている第2判定用データが示す正規証憑データに含まれる発行元名の位置の紙面上端からの距離が160ミリメートルであることを特定する。判定部233は、抽出した距離D1と、特定した第1判定用データが示す距離(201ミリメートル)との差が閾値以下であるか否かを判定する。判定部233は、抽出した距離D2と、特定した第2判定用データが示す距離(160ミリメートル)との差が閾値以下であるか否かを判定する。 The judging unit 233 refers to the judging data table stored in the storage unit 22, and confirms the authentic document indicated by the second judging data stored in association with the issuer "AB Trading" identified by the identifying unit 232. Specify that the distance from the top edge of the page to the position of the publisher name included in the data is 160 millimeters. The determination unit 233 determines whether the difference between the extracted distance D1 and the distance (201 mm) indicated by the specified first determination data is equal to or less than a threshold. The determination unit 233 determines whether the difference between the extracted distance D2 and the distance (160 mm) indicated by the specified second determination data is equal to or less than a threshold.

判定部233は、抽出した距離D1と、特定した第1判定用データが示す距離との差が閾値以下であり、且つ、抽出した距離D2と、特定した第2判定用データが示す距離との差が閾値以下である場合に、取得証憑データが発行元「AB商事」により発行された真正の証憑データであると判定する。一方、判定部233は、抽出した距離D1と、特定した第1判定用データが示す距離との差が閾値を超える場合、又は、抽出した距離D2と、特定した第2判定用データが示す距離との差が閾値を超える場合に、取得証憑データが発行元「AB商事」により発行された真正の証憑データではないと判定する。 The determination unit 233 determines that the difference between the extracted distance D1 and the distance indicated by the specified first determination data is equal to or less than a threshold, and the difference between the extracted distance D2 and the specified distance indicated by the second determination data is determined. If the difference is equal to or less than the threshold value, it is determined that the acquired voucher data is genuine voucher data issued by the issuer "AB Trading". On the other hand, if the difference between the extracted distance D1 and the distance indicated by the specified first determination data exceeds a threshold, or if the difference between the extracted distance D2 and the specified second determination data exceeds a threshold value, it is determined that the obtained voucher data is not genuine voucher data issued by the issuer "AB Trading".

図6の例に示すように、判定部233は、上述のとおり、取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面左端からの距離D1’を特徴として抽出してもよい。判定部233は、取得証憑データに含まれる発行元「AB商事」の「AB」をかたどったロゴ画像の位置の紙面上端からの距離D2’を特徴として抽出してもよい。判定部233が抽出したロゴ画像の位置の紙面左端及び上端からの距離D1’及び距離D2’を利用して取得証憑データの発行元の真偽を判定する方法については、発行元名の位置の紙面の左端及び上端からの距離D1及び距離D2を利用して取得証憑データの発行元の真偽を判定する方法と同様であるため、説明を省略する。 As shown in the example of FIG. 6, the determination unit 233 determines the distance D1′ from the left edge of the page to the position of the logo image of the issuer “AB Trading” in the shape of “AB” included in the acquired voucher data, as described above. You may extract it as a feature. The determination unit 233 may extract the distance D2' from the upper edge of the page to the position of the logo image shaped like "AB" of the issuer "AB Trading" included in the acquired voucher data as a feature. Regarding the method of determining the authenticity of the issuer of the acquired voucher data using the distance D1′ and the distance D2′ from the left edge and the upper edge of the position of the logo image extracted by the determination unit 233, Since it is the same as the method of judging the authenticity of the issuer of the obtained voucher data using the distance D1 and the distance D2 from the left edge and the upper edge of the paper, the explanation is omitted.

また、判定部233は、取得証憑データに含まれる発行元を示す文字列の位置に基づいて、発行元の真偽を判定する例に限定されない。判定部233は、振込先口座名を示す文字列のように、発行元と一対一に対応する文字列の位置に基づいて、発行元の真偽を判定してもよい。 Further, the determination unit 233 is not limited to determining the authenticity of the issuer based on the position of the character string indicating the issuer included in the acquired voucher data. The determination unit 233 may determine the authenticity of the issuer based on the position of the character string that corresponds one-to-one with the issuer, such as the character string indicating the bank account name.

[電子インボイスの発行元の真偽判定]
判定部233は、取得部231が取得した証憑データが電子インボイスである場合には、特定部232が特定した発行元に関連付けて記憶部22に記憶された判定用データに含まれる所定の文字と、取得証憑データに含まれる所定の文字とを比較することにより、取得証憑データが真正なデータであるか否かを判定する。
[E-invoice issuer authenticity determination]
When the voucher data acquired by the acquisition unit 231 is an electronic invoice, the determination unit 233 determines the predetermined characters included in the determination data stored in the storage unit 22 in association with the issuer specified by the specification unit 232. and predetermined characters included in the acquired voucher data, it is determined whether or not the acquired voucher data is authentic data.

まず、判定部233は、取得証憑データにおいて発行元を示す文字列又はロゴ画像に対応するタグ情報又はレイアウト情報を示すXMLテキストを抽出する。判定部233は、取得証憑データにおいて振込先口座を示す文字列に対応するタグ情報又はレイアウト情報を示すXMLテキストを抽出してもよい。 First, the determination unit 233 extracts the XML text indicating the tag information or layout information corresponding to the character string indicating the issuer or the logo image in the obtained voucher data. The determination unit 233 may extract tag information or XML text indicating layout information corresponding to the character string indicating the bank account in the acquired voucher data.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。この判定用データには、発行元を示す文字列又はロゴ画像に対応するタグ情報又はレイアウト情報を示すXMLテキストが所定の文字の特徴として含まれている。判定部233は、特定した判定用データに含まれるタグ情報又はレイアウト情報を示すXMLテキストと、抽出したタグ情報又はレイアウト情報を示すXMLテキストとを比較することにより、取得証憑データの発行元が真正であるか否かを判定する。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies determination data stored in association with the issuer identified by the identification unit 232 . This determination data includes a character string indicating the publisher, tag information corresponding to the logo image, or XML text indicating layout information as predetermined character features. The determination unit 233 compares the XML text indicating the tag information or layout information included in the specified determination data with the XML text indicating the extracted tag information or layout information, thereby confirming the authenticity of the issuer of the acquired voucher data. It is determined whether or not.

より詳しくは、判定部233は、特定した判定用データに含まれるタグ情報等を示すXMLテキストと、抽出したタグ情報等を示すXMLテキストとが一致する場合に、取得証憑データの発行元が真正であると判定する。判定部233は、特定した判定用データに含まれるタグ情報等を示すXMLテキストと、抽出した対応するタグ情報等を示すXMLテキストとが一致しない場合に、取得証憑データの発行元が真正ではないと判定する。 More specifically, the determining unit 233 determines that the issuer of the acquired voucher data is authentic when the XML text indicating the tag information and the like included in the specified determination data matches the XML text indicating the extracted tag information and the like. It is determined that If the XML text indicating the tag information, etc. included in the specified determination data does not match the extracted XML text indicating the corresponding tag information, etc., the determination unit 233 determines that the issuer of the obtained voucher data is not authentic. I judge.

判定部233は、特定部232が特定した発行元に関連付けて記憶部22に記憶された判定用データに含まれる所定の文字と、取得証憑データに含まれる所定の文字との一致度を特定する。判定部233は、特定した一致度に基づいて、取得証憑データが真正な証憑データであるか否かを判定してもよい。 The judgment unit 233 identifies the degree of matching between the predetermined characters included in the determination data stored in the storage unit 22 in association with the issuer identified by the identification unit 232 and the predetermined characters included in the obtained voucher data. . The determination unit 233 may determine whether or not the acquired voucher data is authentic voucher data based on the specified degree of matching.

例えば、判定部233は、取得証憑データにおいて発行元を示す文字列に対応する複数のタグ情報又はレイアウト情報を示す文字列を所定の文字として抽出した場合には、取得証憑データから抽出した複数のタグ情報又はレイアウト情報を示す文字列のうち、特定した判定用データに含まれる複数のタグ情報又はレイアウト情報を示す文字列のいずれかと一致する文字列の割合を一致度として特定する。判定部233は、特定した一致度が閾値以上である場合に、取得証憑データが真正な証憑データであると判定してもよい。判定部233は、特定した一致度が閾値未満である場合に、取得証憑データが真正な証憑データでないと判定してもよい。閾値は、例えば、ユーザにより指定される。 For example, when the determination unit 233 extracts, as predetermined characters, a plurality of tag information corresponding to a character string indicating an issuer in the acquired voucher data or a character string indicating layout information, the determination unit 233 extracts a plurality of characters extracted from the acquired voucher data. Among the character strings indicating the tag information or the layout information, the ratio of the character strings indicating the plurality of tag information or the character strings indicating the layout information included in the identified determination data is specified as the degree of matching. The determination unit 233 may determine that the acquired voucher data is authentic voucher data when the specified degree of matching is equal to or greater than a threshold. The determining unit 233 may determine that the acquired voucher data is not authentic voucher data when the specified degree of matching is less than a threshold. The threshold is specified by the user, for example.

[判定結果の出力]
出力部234は、通信部21を介して、担当者端末3と通信する。出力部234は、取得証憑データの発行元が真正であるか否かの判定部233の判定結果を出力する。例えば、出力部234は、特定部232が特定した発行元と、判定部233の判定結果を担当者端末3のディスプレイに表示させる。
[Output judgment result]
The output unit 234 communicates with the person in charge terminal 3 via the communication unit 21 . The output unit 234 outputs the determination result of the determination unit 233 as to whether or not the issuer of the obtained voucher data is genuine. For example, the output unit 234 displays the issuer identified by the identification unit 232 and the determination result of the determination unit 233 on the display of the person in charge terminal 3 .

[データ処理装置2による証憑データの真偽判定の処理手順]
図7は、データ処理装置2による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。この処理手順は、例えば、取得部231が外部装置1から証憑データを取得したときに開始する。まず、取得部231は、取得した証憑データが電子インボイスであるか否かを判定する(S101)。特定部232は、取得した証憑データが電子インボイスではないと取得部231が判定した場合に(S101のNO)、取得部231が取得した取得証憑データに含まれる文字に基づいて、取得証憑データの発行元を特定する(S102)。
[Processing procedure for authenticity determination of voucher data by data processing device 2]
FIG. 7 is a flow chart showing the processing procedure of authenticity determination of the issuer of the voucher data by the data processing device 2 . This processing procedure is started, for example, when the acquisition unit 231 acquires the voucher data from the external device 1 . First, the acquisition unit 231 determines whether or not the acquired voucher data is an electronic invoice (S101). When the acquiring unit 231 determines that the acquired voucher data is not an electronic invoice (NO in S101), the specifying unit 232 determines the acquired voucher data based on the characters included in the acquired voucher data acquired by the acquiring unit 231. is specified (S102).

判定部233は、取得証憑データに含まれる所定の文字の位置を特徴として抽出する。判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。判定部233は、取得証憑データから抽出した所定の文字の位置と、特定した判定用データに含まれる所定の文字の位置とのずれが閾値以下であるか否かを判定する(S103)。 The determination unit 233 extracts the positions of predetermined characters included in the obtained voucher data as features. The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies determination data stored in association with the issuer identified by the identification unit 232 . The determination unit 233 determines whether or not the deviation between the position of the predetermined character extracted from the obtained voucher data and the position of the predetermined character included in the specified determination data is equal to or less than a threshold value (S103).

判定部233は、取得証憑データから抽出した所定の文字の位置と、特定した判定用データに含まれる所定の文字の位置とのずれが閾値以下である場合に(S103のYES)、取得証憑データの発行元が真正であると判定する(S104)。出力部234は、判定部233の判定結果を担当者端末3へ出力し(S105)、処理を終了する。 If the deviation between the position of the predetermined character extracted from the acquired voucher data and the position of the predetermined character included in the specified determination data is equal to or less than the threshold (YES in S103), the determination unit 233 determines the acquired voucher data. is determined to be authentic (S104). The output unit 234 outputs the determination result of the determination unit 233 to the person in charge terminal 3 (S105), and ends the process.

取得部231は、S101の判定において取得証憑データが電子インボイスであると判定した場合に(S101のYES)、取得証憑データに含まれるXMLテキストを取得する(S106)。特定部232は、取得したXMLテキストに基づいて、取得証憑データの発行元を特定する(S107)。判定部233は、取得証憑データにおいて発行元を示す文字列に対応するタグ情報又はレイアウト情報を示すXMLテキストを所定の文字の特徴として抽出する。 When the acquisition unit 231 determines that the acquired voucher data is an electronic invoice in the determination of S101 (YES in S101), it acquires the XML text included in the acquired voucher data (S106). The identification unit 232 identifies the issuer of the obtained voucher data based on the obtained XML text (S107). The determination unit 233 extracts tag information corresponding to the character string indicating the issuer in the acquired voucher data or XML text indicating layout information as a feature of predetermined characters.

判定部233は、記憶部22に記憶されている判定用データテーブルを参照して、特定部232が特定した発行元に関連付けて記憶されている判定用データを特定する。判定部233は、特定した判定用データに含まれるタグ情報又はレイアウト情報を示す文字列と、抽出したタグ情報又はレイアウト情報を示す文字列とが一致するか否かを判定する(S108)。判定部233は、特定した判定用データに含まれるタグ情報又はレイアウト情報を示す文字列と、抽出したタグ情報又はレイアウト情報を示す文字列とが一致しない場合に(S108のNO)、取得証憑データの発行元は真正ではないと判定し(S109)、S105の処理に進む。 The determination unit 233 refers to the determination data table stored in the storage unit 22 and identifies determination data stored in association with the issuer identified by the identification unit 232 . The determination unit 233 determines whether or not the character string indicating the tag information or layout information included in the specified determination data matches the extracted character string indicating the tag information or layout information (S108). If the character string indicating the tag information or layout information included in the specified determination data does not match the character string indicating the extracted tag information or layout information (NO in S108), the determination unit 233 determines the obtained voucher data. is not authentic (S109), and the process proceeds to S105.

判定部233は、S103の判定において取得証憑データから抽出した所定の文字の位置と、特定した判定用データに含まれる所定の文字の位置とのずれが閾値より大きい場合に(S103のNO)、取得証憑データの発行元は真正ではないと判定し(S109)、S105の処理に進む。判定部233は、S108の判定において、特定した判定用データに含まれるタグ情報等と、抽出したタグ情報等とが一致する場合に(S108のYES)、取得証憑データの発行元は真正であると判定し(S110)、S105の処理に進む。 If the position of the predetermined character extracted from the acquired voucher data in the determination of S103 and the position of the predetermined character included in the specified determination data is greater than a threshold value (NO in S103), the determining unit 233 It is determined that the issuer of the obtained voucher data is not authentic (S109), and the process proceeds to S105. In the determination of S108, if the tag information included in the specified determination data matches the extracted tag information (YES in S108), the determination unit 233 determines that the issuer of the obtained voucher data is genuine. (S110), and the process proceeds to S105.

[第1の実施形態のデータ処理装置2による効果]
第1の実施形態のデータ処理装置2では、出力部234は、取得証憑データに含まれる文字又は画像の少なくともいずれかの特徴に基づいて、請求データの発行元が真正であるか否かの判定結果を出力する。このため、出力部234は、発行元を偽った証憑データを取得部231が取得した場合に、証憑データを受け取った事業者が詐欺の被害にあうことを抑制することができる。
[Effects of the data processing device 2 of the first embodiment]
In the data processing device 2 of the first embodiment, the output unit 234 determines whether or not the issuer of the billing data is genuine, based on at least one of the characteristics of characters or images included in the acquired voucher data. Output the result. Therefore, the output unit 234 can prevent the business operator who received the evidenced data from being a victim of fraud when the acquiring unit 231 acquires the evidenced data whose issuer is false.

<変形例>
第1の実施形態では、特定部232が証憑データの発行元を特定した後に、特定した証憑データの発行元が真正であるか否かを判定部233が判定する場合の例について説明したが、本発明はこれに限定されない。例えば、特定部232は、取得証憑データから抽出した特徴と最も類似する特徴を有する正規証憑データを特定し、特定した正規証憑データの発行元を取得証憑データの発行元として特定してもよい。
<Modification>
In the first embodiment, an example has been described in which the determining unit 233 determines whether or not the specified issuer of the evidenced data is authentic after the specifying unit 232 specifies the issuer of the evidenced data. The invention is not limited to this. For example, the specifying unit 232 may specify regular voucher data having features most similar to the features extracted from the acquired voucher data, and specify the issuer of the specified regular voucher data as the issuer of the acquired voucher data.

本変形例の特定部232は、第1の実施形態と同様に、取得部231が取得した取得証憑データに含まれる所定の文字又は画像の少なくともいずれかの特徴を抽出する。特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、記憶部22の判定用データテーブルに記憶された複数の判定用データそれぞれに含まれる所定の文字又は画像の少なくともいずれかの特徴と、取得証憑データから抽出した特徴とを比較することにより、取得証憑データに最も類似する特徴を示す判定用データを特定する。 As in the first embodiment, the identifying unit 232 of this modified example extracts the characteristics of at least one of predetermined characters or images included in the acquired voucher data acquired by the acquiring unit 231 . The identification unit 232 refers to the determination data table stored in the storage unit 22, and identifies at least predetermined characters or images included in each of the plurality of determination data stored in the determination data table of the storage unit 22. By comparing any of the features with the features extracted from the acquired voucher data, determination data indicating the features most similar to the acquired voucher data are specified.

特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、取得証憑データに最も類似する特徴を含む判定用データに対応する第1発行元を特定する。特定部232は、第1の実施形態と同様に、取得証憑データに含まれる発行元名等の文字列又は画像の少なくともいずれかに基づいて、取得証憑データの第2発行元を特定する。 The specifying unit 232 refers to the determination data table stored in the storage unit 22 to specify the first issuer corresponding to the determination data including the characteristics most similar to the acquired voucher data. As in the first embodiment, the identification unit 232 identifies the second issuer of the acquired voucher data based on at least one of a character string such as an issuer name or an image included in the acquired voucher data.

判定部233は、特定部232が特定した第1発行元と、第2発行元とが一致するか否かを判定する。判定部233は、第1発行元と第2発行元とが一致する場合に、取得証憑データの発行元が真正であると判定する。判定部233は、第1発行元と第2発行元とが一致しない場合に、取得証憑データの発行元が真正ではないと判定する。 The determination unit 233 determines whether or not the first issuer identified by the identification unit 232 matches the second issuer. The determination unit 233 determines that the issuer of the obtained voucher data is authentic when the first issuer and the second issuer match. If the first issuer and the second issuer do not match, the determination unit 233 determines that the issuer of the obtained voucher data is not authentic.

図8は、本変形例のデータ処理装置2による証憑データの真偽判定の処理手順を示すフローチャートである。この処理手順は、例えば、取得部231が外部装置1から取得証憑データを取得したときに開始する。まず、取得部231は、取得した証憑データが電子インボイスか否かを判定する(S201)。特定部232は、取得した証憑データが電子インボイスではないと取得部231が判定した場合に(S201のNO)、取得部231が取得した取得証憑データに含まれる所定の文字の位置を特徴として抽出する。 FIG. 8 is a flow chart showing a processing procedure for determining authenticity of documented voucher data by the data processing device 2 of the present modification. This processing procedure is started, for example, when the obtaining unit 231 obtains the obtained voucher data from the external device 1 . First, the acquisition unit 231 determines whether or not the acquired voucher data is an electronic invoice (S201). When the acquiring unit 231 determines that the acquired voucher data is not an electronic invoice (NO in S201), the identifying unit 232 uses the position of a predetermined character included in the acquired voucher data acquired by the acquiring unit 231 as a feature. Extract.

特定部232は、記憶部22に記憶された複数の判定用データそれぞれに含まれる所定の文字の位置と、取得証憑データから抽出した所定の文字の位置とを比較することにより、取得証憑データに最も類似する所定の文字の位置を示す判定用データを特定する(S202)。特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、取得証憑データに最も類似する特徴を含む判定用データに関連付けて記憶されている第1発行元を特定する。 The identification unit 232 compares the position of a predetermined character included in each of the plurality of judgment data stored in the storage unit 22 with the position of a predetermined character extracted from the acquired voucher data, thereby identifying the acquired voucher data. Determination data indicating the position of the most similar predetermined character is specified (S202). The specifying unit 232 refers to the determination data table stored in the storage unit 22 and specifies the first issuer stored in association with the determination data including the characteristics most similar to the acquired voucher data.

特定部232は、第1の実施形態と同様に、取得証憑データに含まれる文字又は画像の少なくともいずれかに基づいて、取得証憑データの第2発行元を特定する。判定部233は、特定部232が特定した第2発行元が、判定用データに関連付けて記憶されている第1発行元と一致するか否かを判定する(S203)。判定部233は、特定部232が特定した第2発行元が第1発行元と一致する場合に(S203のYES)、取得証憑データの発行元が真正であると判定する(S204)。出力部234は、判定部233の判定結果を担当者端末3へ出力し(S205)、処理を終了する。 As in the first embodiment, the identification unit 232 identifies the second issuer of the acquired voucher data based on at least one of characters or images included in the acquired voucher data. The determination unit 233 determines whether or not the second issuer identified by the identification unit 232 matches the first issuer stored in association with the determination data (S203). If the second issuer identified by the identification unit 232 matches the first issuer (YES in S203), the determination unit 233 determines that the issuer of the obtained voucher data is authentic (S204). The output unit 234 outputs the determination result of the determination unit 233 to the person in charge terminal 3 (S205), and ends the process.

取得部231は、S201の判定において取得した証憑データが電子インボイスであると取得部231が判定した場合(S201のYES)、取得証憑データに含まれるXMLテキストを取得する(S206)。特定部232は、取得証憑データにおいて発行元を示す文字列に対応する複数のタグ情報又はレイアウト情報を示すXMLテキストを所定の文字の特徴として抽出する。特定部232は、記憶部22の判定用データテーブルに記憶されている複数の判定用データのうち、特定部232が特定したタグ情報又はレイアウト情報との一致度が最も高いタグ情報等を示す判定用データを特定する(S207)。 If the obtaining unit 231 determines that the obtained voucher data is an electronic invoice in the determination of S201 (YES in S201), the obtaining unit 231 obtains the XML text included in the obtained voucher data (S206). The identification unit 232 extracts a plurality of pieces of tag information corresponding to the character string indicating the issuer in the acquired voucher data or XML text indicating layout information as predetermined character features. The identification unit 232 determines, among a plurality of pieces of determination data stored in the determination data table of the storage unit 22, the tag information or the like having the highest degree of matching with the tag information or layout information specified by the identification unit 232. data is specified (S207).

特定部232は、記憶部22に記憶されている判定用データテーブルを参照して、一致度が最も高いタグ情報等を示す判定用データに関連付けて記憶されている第1発行元を特定する。特定部232は、第1の実施形態と同様にして、取得証憑データから取得したXMLテキストに基づいて、取得証憑データの第2発行元を特定し、S203の判定に進む。 The specifying unit 232 refers to the determination data table stored in the storage unit 22 to specify the first issuer stored in association with the determination data indicating the tag information with the highest degree of matching. As in the first embodiment, the identification unit 232 identifies the second issuer of the acquired voucher data based on the XML text acquired from the acquired voucher data, and proceeds to the determination of S203.

判定部233は、S203の判定において特定部232が特定した第2発行元が第1発行元と一致しない場合に(S203のNO)、取得証憑データの発行元が真正ではないと判定し(S208)、S205の処理に進む。 If the second issuer specified by the specifying unit 232 does not match the first issuer in the determination of S203 (NO in S203), the determination unit 233 determines that the issuer of the acquired voucher data is not authentic (S208 ), the process proceeds to S205.

<第2の実施形態>
第2の実施形態では、学習済みの機械学習モデルを用いて、取得証憑データの真偽を判定する場合の例について説明する。図9は、第2の実施形態のデータ処理装置300の構成を示す。第2の実施形態のデータ処理装置300では、制御部23が判定部301、生成部302及び受付部303を備える点を除いて、図4と同様である。図4と同様の機能ブロックについては図4と同じ符号を付して説明を省略する。
<Second embodiment>
In the second embodiment, an example of determining the authenticity of the acquired voucher data using a machine learning model that has already been learned will be described. FIG. 9 shows the configuration of a data processing device 300 according to the second embodiment. A data processing apparatus 300 according to the second embodiment is the same as that shown in FIG. Functional blocks similar to those in FIG. 4 are given the same reference numerals as those in FIG. 4, and descriptions thereof are omitted.

判定部301は、証憑データとこの証憑データの発行元を示す情報とを入力データとし、証憑データが発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルを用いて、取得証憑データが真正なものであるか否かを判定する。証憑データは、電子インボイスであってもよい。まず、判定部301は、この学習済みの機械学習モデルを記憶部22から読み出す。判定部301は、読み出した機械学習モデルに対し、取得部231が取得した取得証憑データ及び特定部232が特定した発行元を示す情報を入力し、取得証憑データがこの発行元により発行された真正なものであるか否かを示す機械学習モデルが出力した情報を取得する。判定部301は、この機械学習モデルが出力した情報に基づいて、取得証憑データが真正なデータであるか否かを判定する。 The judging unit 301 has learned that the voucher data and the information indicating the issuer of the voucher data are input data, and the information indicating whether or not the voucher data is issued by the issuer is genuine as the output data. machine learning model to determine whether the acquired voucher data is genuine. The voucher data may be electronic invoices. First, the determination unit 301 reads this learned machine learning model from the storage unit 22 . The determination unit 301 inputs the acquired voucher data acquired by the acquisition unit 231 and the information indicating the issuer identified by the identification unit 232 to the read machine learning model, and the acquired voucher data is authenticated as issued by this issuer. Acquire the information output by the machine learning model that indicates whether or not the Based on the information output by the machine learning model, the determination unit 301 determines whether or not the acquired voucher data is authentic data.

[機械学習モデルの学習時の処理手順]
以下、記憶部22に記憶されている機械学習モデルの学習時の処理について説明する。生成部302は、証憑データとこの証憑データの発行元を示す情報とを入力データとし、証憑データが発行元により発行された真正なものであるか否かを示す情報を出力データとする機械学習モデルを生成する。生成部302は、真正な発行元から取得したことを示すラベルに関連付けられた証憑データと、偽の発行元から取得したことを示すラベルに関連付けられた証憑データとを含む学習データを機械学習することにより、機械学習モデルを生成する。
[Processing procedure for machine learning model learning]
Hereinafter, the processing during learning of the machine learning model stored in the storage unit 22 will be described. The generation unit 302 performs machine learning using the evidenced data and information indicating the issuer of the evidenced data as input data and outputting information indicating whether the evidenced data is authentic and issued by the issuer. Generate a model. The generation unit 302 machine-learns learning data including evidenced data associated with a label indicating that it has been obtained from an authentic issuer and evidenced data associated with a label that indicates that it has been obtained from a fake issuer. to generate a machine learning model.

偽の発行元から取得したラベルに関連付けられた証憑データとしては、例えば、証憑データに含まれる発行元名、発行元を示すロゴ画像又は振込先口座名の位置が、真正な発行元から取得したことを示すラベルに関連付けられた証憑データの発行元名等の位置とは閾値以上ずれている複数の証憑データを用いる。閾値は、例えば、学習済みの機械学習モデルによる証憑データの発行元の真偽判定に要求される精度に応じて当分野の専門家が定める。 Voucher data associated with a label obtained from a fake issuer includes, for example, the issuer name, the logo image indicating the issuer, or the position of the transfer account name included in the voucher data. A plurality of voucher data are used that are shifted by a threshold value or more from the position of the issuer name, etc. of the voucher data associated with the label indicating that. The threshold is determined by an expert in the field according to, for example, the accuracy required for authenticity determination of the issuer of documented document data by a machine learning model that has already been trained.

偽の発行元から取得したラベルに関連付けられた証憑データとしては、この証憑データに含まれる発行元名等のサイズ又は書体が、真正な発行元から取得したことを示すラベルに関連付けられた証憑データの発行元名のサイズ又は書体と異なる複数の証憑データを用いてもよい。証憑データは、電子インボイスであってもよい。 The evidence data associated with a label obtained from a fake publisher is the evidence data associated with a label that indicates that the size or typeface of the publisher name, etc. included in this evidence data has been obtained from a genuine publisher. A plurality of voucher data different from the size or typeface of the issuer name may be used. The voucher data may be electronic invoices.

また、第2の実施形態のデータ処理装置は、判定部301において取得証憑データが真正なデータであるか否かを判定した後、判定部301による取得証憑データの発行元が真正であるか否かを示す判定結果が正しいか否かのユーザの入力を受け付ける受付部303を備えてもよい。生成部302は、判定部301による発行元が真正であるか否かを示す情報が正しいことを示すユーザの入力を受付部303が受け付けた場合に、判定部301による判定結果に対応する新たな学習データを作成する。 Further, in the data processing apparatus of the second embodiment, after the determination unit 301 determines whether or not the acquired voucher data is authentic data, the determination unit 301 determines whether or not the issuer of the acquired voucher data is authentic. A reception unit 303 may be provided to receive user input as to whether the determination result indicating whether or not is correct. When the receiving unit 303 receives a user's input indicating that the information indicating whether the issuer is authentic by the determining unit 301 is correct, the generating unit 302 generates new data corresponding to the determination result by the determining unit 301 . Create training data.

生成部302は、証憑データが真正であるという判定部301による判定結果が正しいことを示すユーザの入力を受付部303が受け付けた場合に、判定部301が判定した対象の取得証憑データが真正であることを示すラベルに関連付けて当該取得証憑データを学習データに加える。生成部302は、証憑データが真正でないという判定部301による判定結果が正しいことを示すユーザの入力を受付部303が受け付けた場合に、判定部301が判定した対象の取得証憑データが真正でないことを示すラベルに関連付けて当該取得証憑データを学習データに加える。 When the reception unit 303 receives a user input indicating that the determination result by the determination unit 301 that the voucher data is authentic is correct, the generation unit 302 determines that the target acquired voucher data determined by the determination unit 301 is authentic. The obtained voucher data is added to the learning data in association with a label indicating that there is. When the reception unit 303 receives a user input indicating that the determination result by the determination unit 301 that the voucher data is not authentic is correct, the generation unit 302 determines that the acquired voucher data determined by the determination unit 301 is not authentic. is added to the learning data in association with the label indicating the acquired voucher data.

生成部302は、証憑データが真正であるという判定部301の判定結果が正しくないことを示すユーザの入力を受け付けた場合に、判定部301が判定した対象の取得証憑データが真正でないことを示すラベルに関連付けて当該取得証憑データを学習データに加える。生成部302は、証憑データが真正でないという判定部301による判定結果が正しくないことを示すユーザの入力を受付部303が受け付けた場合に、判定部301が判定した対象の取得証憑データが真正であることを示すラベルに関連付けて当該取得証憑データを学習データに加える。 When the generation unit 302 receives user input indicating that the determination result of the determination unit 301 that the voucher data is authentic is not correct, the generation unit 302 indicates that the target acquired voucher data determined by the determination unit 301 is not authentic. Add the obtained voucher data to the learning data in association with the label. When the reception unit 303 receives a user's input indicating that the determination result by the determination unit 301 that the voucher data is not authentic is incorrect, the generation unit 302 determines that the target acquired voucher data determined by the determination unit 301 is authentic. The obtained voucher data is added to the learning data in association with a label indicating that there is.

生成部302は、このようにしてユーザにより真正であるか否かが判断された証憑データを加えた後の新たな学習データを機械学習させることにより、機械学習モデルを生成してもよい。このようにして、生成部302は、学習済みの機械学習モデルによる証憑データの発行元の真偽判定の精度をより向上させることができる。生成部302は、生成した学習済みの機械学習モデルを記憶部22に記憶させる。 The generation unit 302 may generate a machine learning model by performing machine learning on new learning data after addition of documented evidence data whose authenticity has been determined by the user in this way. In this way, the generation unit 302 can further improve the accuracy of authenticity determination of the issuer of the documented evidence data by the learned machine learning model. The generating unit 302 causes the storage unit 22 to store the generated learned machine learning model.

[データ処理装置300による証憑データの真偽判定の処理手順]
図10は、データ処理装置300による証憑データの発行元の真偽判定の処理手順を示すフローチャートである。この処理手順は、例えば、データ処理装置300が外部装置1と通信している状態において開始する。まず、取得部231は、外部装置1から証憑データを取得する(S301)。特定部232は、取得証憑データの発行元を特定する(S302)。特定部232は、取得証憑データが電子インボイスである場合には、取得証憑データに含まれるXMLテキストに基づいて、取得証憑データの発行元を特定する。
[Processing procedure for authenticity determination of voucher data by data processing device 300]
FIG. 10 is a flow chart showing the processing procedure of authenticity determination of the issuer of the voucher data by the data processing device 300 . This processing procedure starts, for example, while the data processing device 300 is communicating with the external device 1 . First, the acquiring unit 231 acquires voucher data from the external device 1 (S301). The identification unit 232 identifies the issuer of the obtained voucher data (S302). When the acquired voucher data is an electronic invoice, the specifying unit 232 specifies the issuer of the acquired voucher data based on the XML text included in the acquired voucher data.

判定部233は、証憑データとこの証憑データの発行元を示す情報とを入力データとし、証憑データが発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルを記憶部22から読み出す。判定部233は、読み出した機械学習モデルに対し、取得部231が取得した取得証憑データ及び特定部232が特定した発行元を示す情報を入力し(S303)、取得証憑データがこの発行元により発行された真正なものであるか否かを示す機械学習モデルが出力した情報を取得する。判定部301は、この機械学習モデルが出力した情報に基づいて、取得証憑データが真正なデータであるか否かを判定する(S304)。出力部234は、取得証憑データが真正なデータであるか否かの判定部233による判定結果を担当者端末3へ出力し(S305)、処理を終了する。 The judging unit 233 has learned that the voucher data and information indicating the issuer of the voucher data are input data, and the information indicating whether or not the voucher data is issued by the issuer is genuine as output data. is read out from the storage unit 22. The determining unit 233 inputs the obtained voucher data obtained by the obtaining unit 231 and the information indicating the issuer identified by the identifying unit 232 to the read machine learning model (S303), and the obtained voucher data is issued by this issuer. Obtain the information output by the machine learning model that indicates whether the product is authentic or not. Based on the information output by the machine learning model, the determination unit 301 determines whether or not the acquired voucher data is authentic data (S304). The output unit 234 outputs the determination result of the determination unit 233 as to whether or not the obtained voucher data is authentic data to the person in charge terminal 3 (S305), and ends the process.

[第2の実施形態のデータ処理装置2による効果]
第2の実施形態のデータ処理装置2では、出力部234は、学習済みの機械学習モデルにより、取得証憑データの発行元の真偽の判定精度が向上するので、発行元を偽った証憑データによりユーザが詐欺の被害にあうことを抑制することができる。
[Effects of the data processing device 2 of the second embodiment]
In the data processing device 2 of the second embodiment, the output unit 234 improves the accuracy of determining the authenticity of the issuer of the acquired voucher data by using a learned machine learning model. It is possible to prevent the user from becoming a victim of fraud.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes are possible within the scope of the gist thereof. be. All or part of the device can be functionally or physically distributed and integrated in arbitrary units. In addition, new embodiments resulting from arbitrary combinations of multiple embodiments are also included in the embodiments of the present invention. The effect of the new embodiment caused by the combination has the effect of the original embodiment.

1 外部装置
2 データ処理装置
3 担当者端末
21 通信部
22 記憶部
23 制御部
231 取得部
232 特定部
233 判定部
234 出力部
300 データ処理装置
301 判定部
302 生成部
303 受付部
1 External device 2 Data processing device 3 Person in charge terminal 21 Communication unit 22 Storage unit 23 Control unit 231 Acquisition unit 232 Identification unit 233 Judgment unit 234 Output unit 300 Data processing unit 301 Judgment unit 302 Generation unit 303 Acceptance unit

Claims (11)

証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の位置を示す複数の判定用データを記憶する記憶部と、
証憑データを取得する取得部と、
前記取得部が取得した取得証憑データに含まれる発行元を示す文字列又はタグに基づいて、前記証憑データの発行元を特定する特定部と、
前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の前記位置と、前記取得証憑データに含まれる前記所定の文字又は画像の位置を比較することにより、前記取得証憑データが真正なデータであるか否かを判定する判定部と、
前記判定部の判定結果を出力する出力部と、
を備えるデータ処理装置。
a storage unit that stores a plurality of determination data indicating the positions of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers;
an acquisition unit that acquires voucher data;
an identification unit that identifies an issuer of the evidenced data acquired by the acquisition unit based on a character string or a tag indicating an issuer included in the acquired evidenced data;
The position of the predetermined character or image included in the determination data stored in the storage unit in association with the issuer identified by the identification unit, and the predetermined character or image included in the obtained voucher data a determination unit that determines whether or not the acquired voucher data is authentic data by comparing the positions of
an output unit that outputs the determination result of the determination unit;
A data processing device comprising:
前記取得部は、データ構造を指定するためのマークアップ言語を含む電子インボイスを前記証憑データとして取得し、
前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定する、
請求項1に記載のデータ処理装置。
The acquisition unit acquires an electronic invoice including a markup language for designating a data structure as the voucher data,
The determination unit determines the predetermined character included in the determination data stored in the storage unit in association with the issuer identified by the identification unit, and the predetermined character included in the obtained voucher data. determining whether the obtained voucher data is authentic data by comparison;
2. A data processing apparatus according to claim 1 .
前記判定部は、前記特定部が特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字と、前記取得証憑データに含まれる前記所定の文字との一致度を特定し、特定した当該一致度に基づいて、前記取得証憑データが真正なデータであるか否かを判定する、
請求項に記載のデータ処理装置。
The judging unit determines whether the predetermined character included in the judgment data stored in the storage unit in association with the issuer identified by the identifying unit and the predetermined character included in the obtained voucher data. identifying the degree of matching, and determining whether or not the obtained voucher data is genuine data based on the identified degree of matching;
3. A data processing apparatus according to claim 2 .
前記判定部は、前記証憑データと当該証憑データの発行元を示す情報とを入力データとし、当該証憑データが当該発行元により発行された真正なものであるか否かを示す情報を出力データとする学習済みの機械学習モデルに対し、前記取得部が取得した前記取得証憑データ及び前記特定部が特定した前記発行元を示す情報を入力し、当該機械学習モデルが出力した前記証憑データが当該発行元により発行された真正なものであるか否かを示す情報に基づいて、前記取得証憑データが真正なデータであるか否かを判定する、
請求項1に記載のデータ処理装置。
The judging unit uses the voucher data and information indicating an issuer of the voucher data as input data, and outputs information indicating whether or not the voucher data is issued by the issuer and is genuine. The acquired voucher data acquired by the acquisition unit and the information indicating the issuer identified by the identification unit are input to the learned machine learning model, and the voucher data output by the machine learning model is the issuer Determining whether or not the obtained voucher data is authentic based on information issued by the source indicating whether or not it is authentic;
2. A data processing apparatus according to claim 1.
真正な発行元から取得したことを示すラベルに関連付けられた前記証憑データと、偽の発行元から取得したことを示すラベルに関連付けられた前記証憑データとを含む学習データを機械学習させることにより、前記機械学習モデルを生成する生成部をさらに備える、
請求項に記載のデータ処理装置。
By machine learning learning data including the evidence data associated with a label indicating that it was obtained from a genuine issuer and the evidence data associated with a label indicating that it was obtained from a fake issuer, Further comprising a generation unit that generates the machine learning model,
5. A data processing apparatus according to claim 4 .
前記判定結果が正しいか否かのユーザの入力を受け付ける受付部をさらに備え、
前記生成部は、前記取得証憑データが真正であるという前記判定結果が正しいことを示すユーザの入力を受け付けた場合に、対応する前記証憑データが真正であることを示すラベルに関連付けて当該証憑データを前記学習データに加えた新たな学習データを用いて機械学習することにより、前記機械学習モデルを生成する、
請求項に記載のデータ処理装置。
further comprising a reception unit that receives a user's input as to whether the determination result is correct,
When receiving user input indicating that the determination result that the obtained evidenced data is authentic is correct, the generation unit associates the corresponding evidenced evidenced data with a label indicating that the corresponding evidenced evidence data is authentic. is added to the learning data, and machine learning is performed using new learning data to generate the machine learning model.
6. A data processing apparatus according to claim 5 .
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の位置を示す複数の判定用データを記憶する記憶部と、
証憑データを取得する取得部と、
前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の前記位置と、前記取得部が取得した取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データに最も類似する特徴を示す前記判定用データを特定する特定部と、
前記取得証憑データに含まれる発行元を示す文字列又はタグに基づいて特定される発行元が、前記特定部が特定した前記判定用データに対応する前記発行元と一致するか否かを判定する判定部と、
前記判定部の判定結果を出力する出力部と、
を備えるデータ処理装置。
a storage unit that stores a plurality of determination data indicating the positions of predetermined characters or images included in regular voucher data in association with a plurality of issuers of vouchers;
an acquisition unit that acquires voucher data;
the position of the predetermined character or image included in each of the plurality of determination data stored in the storage unit and the position of the predetermined character or image included in the acquired voucher data acquired by the acquisition unit; a specifying unit that specifies the data for determination that exhibits characteristics most similar to the obtained documented document data by comparison;
It is determined whether or not the issuer specified based on the character string or tag indicating the issuer included in the obtained voucher data matches the issuer corresponding to the determination data specified by the specifying unit. a determination unit;
an output unit that outputs the determination result of the determination unit;
A data processing device comprising:
コンピュータが実行する、
証憑データを取得するステップと、
取得した取得証憑データに含まれる発行元を示す文字列又はタグに基づいて、前記証憑データの発行元を特定するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の位置を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の前記位置と、前記取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、
判定結果を出力するステップと、
を備えるデータ処理方法。
the computer runs
obtaining voucher data;
a step of identifying an issuer of the acquired voucher data based on a character string or a tag indicating an issuer included in the obtained acquired voucher data;
Referring to a storage unit for storing a plurality of data for determination indicating positions of predetermined characters or images included in normal voucher data in association with a plurality of issuers of the voucher, and storing the data in association with the specified issuer. By comparing the position of the predetermined character or image included in the determination data stored in the unit and the position of the predetermined character or image included in the acquired voucher data, the obtained voucher data is determined as a step of determining whether the data is authentic;
a step of outputting a judgment result;
A data processing method comprising:
コンピュータが実行する、
証憑データを取得するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の位置を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の前記位置と、取得した取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データに最も類似する前記判定用データを特定するステップと、
前記取得証憑データに含まれる発行元を示す文字列又はタグに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、
判定結果を出力するステップと、
を備えるデータ処理方法。
the computer runs
obtaining voucher data;
By referring to a storage unit that stores a plurality of determination data indicating the positions of predetermined characters or images included in the normalized voucher data in association with a plurality of issuers of the voucher, By comparing the position of the predetermined character or image included in each judgment data with the position of the predetermined character or image included in the acquired voucher data, the most similar to the acquired voucher data is determined. identifying decision data;
a step of determining whether or not the issuer specified based on the character string or tag indicating the issuer included in the acquired voucher data matches the issuer corresponding to the specified determination data;
a step of outputting a judgment result;
A data processing method comprising:
コンピュータに、
証憑データを取得するステップと、
取得した取得証憑データに含まれる発行元を示す文字列又はタグに基づいて、前記証憑データの発行元を特定するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の位置を示す複数の判定用データを記憶する記憶部を参照して、特定した前記発行元に関連付けて前記記憶部に記憶された前記判定用データに含まれる前記所定の文字又は画像の前記位置と、前記取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記取得証憑データが真正なデータであるか否かを判定するステップと、
判定結果を出力するステップと、
を実行させる、プログラム。
to the computer,
obtaining voucher data;
a step of identifying an issuer of the acquired voucher data based on a character string or a tag indicating an issuer included in the obtained acquired voucher data;
Referring to a storage unit for storing a plurality of data for determination indicating positions of predetermined characters or images included in normal voucher data in association with a plurality of issuers of the voucher, and storing the data in association with the specified issuer. By comparing the position of the predetermined character or image included in the determination data stored in the unit and the position of the predetermined character or image included in the acquired voucher data, the obtained voucher data is determined as a step of determining whether the data is authentic;
a step of outputting a judgment result;
The program that causes the to run.
コンピュータに、
証憑データを取得するステップと、
証憑の複数の発行元に関連付けて、正規証憑データに含まれる所定の文字又は画像の位置を示す複数の判定用データを記憶する記憶部を参照して、前記記憶部に記憶された複数の前記判定用データそれぞれに含まれる前記所定の文字又は画像の前記位置と、取得した取得証憑データに含まれる前記所定の文字又は画像の位置とを比較することにより、前記判定用データに最も類似する前記判定用データを特定するステップと、
前記取得証憑データに含まれる発行元を示す文字列又はタグに基づいて特定される発行元が、特定した前記判定用データに対応する前記発行元と一致するか否かを判定するステップと、
判定結果を出力するステップと、
を実行させる、プログラム。
to the computer,
obtaining voucher data;
By referring to a storage unit that stores a plurality of determination data indicating the positions of predetermined characters or images included in the normalized voucher data in association with a plurality of issuers of the voucher, By comparing the position of the predetermined character or image included in each of the data for determination with the position of the predetermined character or image included in the acquired documented document data, the position of the predetermined character or image that is most similar to the data for determination is determined. identifying decision data;
a step of determining whether or not the issuer specified based on the character string or tag indicating the issuer included in the acquired voucher data matches the issuer corresponding to the specified determination data;
a step of outputting a judgment result;
The program that causes the to run.
JP2022514751A 2022-03-04 2022-03-04 Data processing device, data processing method and program Active JP7170366B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022170385A JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/009374 WO2023166698A1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method, and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022170385A Division JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Publications (2)

Publication Number Publication Date
JP7170366B1 true JP7170366B1 (en) 2022-11-14
JPWO2023166698A1 JPWO2023166698A1 (en) 2023-09-07

Family

ID=84027198

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022514751A Active JP7170366B1 (en) 2022-03-04 2022-03-04 Data processing device, data processing method and program
JP2022170385A Pending JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022170385A Pending JP2023129229A (en) 2022-03-04 2022-10-25 Data processing device, data processing method, and program

Country Status (2)

Country Link
JP (2) JP7170366B1 (en)
WO (1) WO2023166698A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008517371A (en) * 2004-10-14 2008-05-22 ドクテク・アクチボラゲット How to handle electronic documents
JP2017174309A (en) * 2016-03-25 2017-09-28 大日本印刷株式会社 Portable information device, server device, data input supporting system, and program
JP6712738B1 (en) * 2019-10-31 2020-06-24 株式会社日本デジタル研究所 Voucher judging device, accounting processor, voucher judging program, voucher judging system and voucher judging method
WO2021205619A1 (en) * 2020-04-09 2021-10-14 ファーストアカウンティング株式会社 Invoice management device, invoice management method, and program
JP2021168106A (en) * 2020-04-09 2021-10-21 ファーストアカウンティング株式会社 Invoice management apparatus, invoice management method, and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008517371A (en) * 2004-10-14 2008-05-22 ドクテク・アクチボラゲット How to handle electronic documents
JP2017174309A (en) * 2016-03-25 2017-09-28 大日本印刷株式会社 Portable information device, server device, data input supporting system, and program
JP6712738B1 (en) * 2019-10-31 2020-06-24 株式会社日本デジタル研究所 Voucher judging device, accounting processor, voucher judging program, voucher judging system and voucher judging method
WO2021205619A1 (en) * 2020-04-09 2021-10-14 ファーストアカウンティング株式会社 Invoice management device, invoice management method, and program
JP2021168106A (en) * 2020-04-09 2021-10-21 ファーストアカウンティング株式会社 Invoice management apparatus, invoice management method, and program

Also Published As

Publication number Publication date
JPWO2023166698A1 (en) 2023-09-07
JP2023129229A (en) 2023-09-14
WO2023166698A1 (en) 2023-09-07

Similar Documents

Publication Publication Date Title
US11210510B2 (en) Storing anonymized identifiers instead of personally identifiable information
EP3414867B1 (en) A system and method for document information authenticity verification
US9864920B2 (en) Semiautomatic multifunction device-based validation of secure documents
US10102439B2 (en) Document verification method and system
US9864906B2 (en) Method and system for creating a validation document for security
JP2004513543A (en) How to insert and extract text from electronic documents
JP2009522675A (en) Automated processing using remotely stored templates (method for processing forms, apparatus for processing forms)
US10452908B1 (en) Document fraud detection
US20180033020A1 (en) System and apparatus for detecting forgery features on identification documents
US11488419B2 (en) Identity and liveness verification
KR101841928B1 (en) Method for issuing document offline, method for validating issued offline document, and server using the same
JP2013025571A (en) Card issue system and card issue method
JP5659505B2 (en) Authentication apparatus and authentication method
US7035428B1 (en) Workpiece authentication based upon one or more workpiece images
JP7170366B1 (en) Data processing device, data processing method and program
JP2011034497A (en) Handwriting collation system, handwriting collation method and handwriting collation program
BR112020017923A2 (en) METHOD AND SYSTEM OF AUTOMATIC VERIFICATION OF THE AUTHENTICITY OF DOCUMENTS
KR101841929B1 (en) Method for issuing document offline and method for validating issued offline document on the basis of merkle tree structure, and server using the same
US10061981B2 (en) Security improvements for tickets
WO2008004221A2 (en) Inserting digital signatures into a transformed document
JP4594692B2 (en) Loan contract office processing system
JP6167671B2 (en) Image forming apparatus, program, and examination system
CN108074324B (en) Paper money counterfeit distinguishing method and device
TWI669670B (en) Electronic trading system
KR20010087749A (en) Apparatus and method for manufacturing and authenticating a card using watermarking technique

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220304

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221025

R150 Certificate of patent or registration of utility model

Ref document number: 7170366

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150