JP7452809B1 - Information processing device, information processing method and program - Google Patents

Information processing device, information processing method and program Download PDF

Info

Publication number
JP7452809B1
JP7452809B1 JP2023548329A JP2023548329A JP7452809B1 JP 7452809 B1 JP7452809 B1 JP 7452809B1 JP 2023548329 A JP2023548329 A JP 2023548329A JP 2023548329 A JP2023548329 A JP 2023548329A JP 7452809 B1 JP7452809 B1 JP 7452809B1
Authority
JP
Japan
Prior art keywords
item
items
candidate
unspecified
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023548329A
Other languages
Japanese (ja)
Inventor
鴻鵬 葛
顕 松田
智 小俣
啓太郎 森
将和 早川
将人 藤武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fast Accounting Inc
Original Assignee
Fast Accounting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fast Accounting Inc filed Critical Fast Accounting Inc
Application granted granted Critical
Publication of JP7452809B1 publication Critical patent/JP7452809B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部12と、複数の項目が含まれる処理対象データを取得する取得部131と、処理対象データに含まれる複数の項目それぞれの名称に基づいて、複数の項目それぞれがフォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定部132と、処理対象データに含まれる項目のうち項目特定部132が対応する定義済項目を特定できない項目である未特定項目が有る場合、未特定項目について、フォーマット情報において未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定部133と、未特定項目と、候補特定部133が特定した候補項目と、を対応付けて出力する出力部134と、を有する情報処理装置1である。The information processing device 1 has a memory unit 12 that stores format information including defined items that are multiple defined items; an acquisition unit 131 that acquires data to be processed that includes the multiple items; an item identification unit 132 that identifies to which of the defined items included in the format information each of the multiple items included in the data to be processed corresponds based on the names of each of the multiple items included in the data to be processed; a candidate identification unit 133 that identifies, when there is an unspecified item among the items included in the data to be processed for which the item identification unit 132 cannot identify a corresponding defined item, a candidate item for the unspecified item in the format information that is a defined item that is a candidate for the unspecified item to correspond to; and an output unit 134 that outputs the unspecified item in association with the candidate items identified by the candidate identification unit 133.

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。 The present invention relates to an information processing device, an information processing method, and a program.

事前にデータ変換プロファイルを定義しておき、ユーザ企業固有のデータフォーマットで取得したデータを標準フォーマットに変換して取得する技術が知られている(例えば特許文献1)。 There is a known technique in which a data conversion profile is defined in advance and data acquired in a data format specific to a user company is converted into a standard format and acquired (for example, Patent Document 1).

特開2003-208382号公報Japanese Patent Application Publication No. 2003-208382

先行技術においては、予め変換プロファイルが定められていない項目を含むデータを取得した場合に、ユーザがデータの内容を確認して予め定められていない項目が事前定義された項目のうちどの項目に対応するかを決定する必要があり、当該データの処理が煩雑となるという問題が生じていた。 In the prior art, when data including items for which a conversion profile is not determined in advance is obtained, the user checks the contents of the data and determines which of the predefined items the undefined item corresponds to. It is necessary to decide whether to do so, which poses a problem in that the processing of the data becomes complicated.

そこで、本発明はこれらの点に鑑みてなされたものであり、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減することを目的とする。 The present invention has been made in view of these points, and it is an object of the present invention to reduce the effort required to process data to be processed, including items for which conversion profiles are not defined in advance.

本発明の第1の態様の情報処理装置においては、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部と、複数の項目が含まれる処理対象データを取得する取得部と、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定部と、前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定部と、前記未特定項目と、前記候補特定部が特定した候補項目と、を対応付けて出力する出力部と、を有する。 The information processing device according to the first aspect of the present invention includes a storage unit that stores format information including a plurality of predefined items, and an acquisition unit that obtains processing target data including a plurality of items. an item identifying unit that identifies which of the defined items included in the format information each of the plurality of items corresponds to, based on the name of each of the plurality of items included in the processing target data; If there is an unspecified item that is an item for which the item identifying unit cannot identify a corresponding defined item among the items included in the target data, the format information indicates that the unspecified item is a corresponding candidate. and an output unit that outputs the unspecified item and the candidate item identified by the candidate identifying unit in association with each other.

前記候補特定部は、前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である前記未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定してもよい。 When there is an unspecified item that is an item for which the item specifying unit cannot identify a corresponding defined item among the items included in the processing target data, the candidate specifying unit determines the processing target data for the unspecified item. A candidate item, which is a defined item to which the unspecified item corresponds in the format information, may be identified based on the relationship between items included in the format information.

前記項目特定部は、前記複数の項目の名称それぞれが示す意味に基づいて、前記複数の項目それぞれが対応する定義済項目を特定してもよい。 The item specifying unit may specify a defined item to which each of the plurality of items corresponds, based on the meaning indicated by each of the names of the plurality of items.

前記取得部は、前記複数の項目のうちの少なくともいずれかに関連付けられた金額をさらに含む前記処理対象データを取得し、前記候補特定部は、前記金額を演算した結果に基づいて、前記未特定項目に対応する候補項目を特定してもよい。 The acquisition unit acquires the processing target data further including an amount associated with at least one of the plurality of items, and the candidate identification unit determines whether or not the unspecified amount is determined based on the result of calculating the amount. Candidate items corresponding to the item may be specified.

前記処理対象データに含まれる項目それぞれが前記処理対象データにおいて配置された位置を特定する位置特定部をさらに有し、前記候補特定部は、前記未特定項目が前記処理対象データにおいて配置された位置に基づいて、前記未特定項目に対応する候補項目を特定してもよい。 The candidate identification unit further includes a position specifying unit that specifies a position where each item included in the processing target data is placed in the processing target data, and the candidate specifying unit specifies a position where the unspecified item is placed in the processing target data. A candidate item corresponding to the unspecified item may be identified based on the above.

前記出力部は、前記未特定項目と、前記候補特定部が特定した候補項目と、が対応する蓋然性の高さを示すスコアをさらに出力してもよい。 The output unit may further output a score indicating a high probability that the unspecified item corresponds to the candidate item specified by the candidate specifying unit.

前記出力部は、前記候補特定部が、前記未特定項目に対応する候補項目を特定できない場合、前記未特定項目に設定すべき名称を表示させてもよい。 The output unit may display a name to be set to the unspecified item when the candidate specifying unit cannot specify a candidate item corresponding to the unspecified item.

本発明の第2の態様の情報処理方法においては、コンピュータが実行する、複数の項目が含まれる処理対象データを取得するステップと、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定ステップと、前記未特定項目と、前記候補特定ステップにおいてが特定された候補項目と、を対応付けて出力するステップと、を有する。 The information processing method according to the second aspect of the present invention includes the steps of acquiring processing target data including a plurality of items, executed by a computer, and formatting information including a plurality of predefined items. An item for specifying which of the defined items included in the format information each of the plurality of items corresponds to, based on the name of each of the plurality of items included in the processing target data, by referring to a storage unit to store the data; If there is an unspecified item that is an item for which a corresponding defined item cannot be specified in the item specifying step among the items included in the process target data in the specifying step, the unspecified item is included in the process target data. a candidate identifying step of identifying a candidate item that is a defined item to which the unspecified item corresponds in the format information based on the relationship between the items; and identifying the unspecified item and the candidate item in the candidate specifying step. and outputting the candidate items in association with each other.

本発明の第3の態様のプログラムにおいては、コンピュータに、複数の項目が含まれる処理対象データを取得するステップと、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定ステップと、前記未特定項目と、前記候補特定ステップにおいてが特定された候補項目と、を対応付けて出力するステップと、を実行させる。 In the program according to the third aspect of the present invention, the computer includes a step of acquiring processing target data including a plurality of items, and a storage unit storing format information including the predefined items, which are a plurality of predefined items. an item specifying step of identifying which of the defined items included in the format information each of the plurality of items corresponds to, based on the name of each of the plurality of items included in the processing target data; If there is an unspecified item that is an item for which a corresponding defined item cannot be identified in the item identification step among the items included in the processing target data, the relationship between the items included in the processing target data is determined for the unspecified item. a candidate specifying step of specifying a candidate item that is a defined item to which the unspecified item corresponds in the format information based on the unspecified item; and a candidate item identified in the candidate specifying step. A step of associating and outputting is executed.

本発明によれば、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するためのコストを低減するという効果を奏する。 Advantageous Effects of Invention According to the present invention, it is possible to reduce the cost for processing data to be processed, including items for which conversion profiles are not defined in advance.

実施形態にかかる情報処理システムSの概要を説明するための図である。FIG. 1 is a diagram for explaining an overview of an information processing system S according to an embodiment. 情報処理装置1の構成を示すブロック図である。1 is a block diagram showing the configuration of an information processing device 1. FIG. 記憶部12が記憶するフォーマット情報のデータ構造の一例を示す図である。3 is a diagram showing an example of a data structure of format information stored in a storage unit 12. FIG. 取得部131が取得する処理対象データの一例を示す図である。5 is a diagram illustrating an example of processing target data acquired by an acquisition unit 131. FIG. 出力部134が出力する画面の一例を示す図である。3 is a diagram showing an example of a screen output by the output unit 134. FIG. 情報処理装置1における処理の流れを示すフローチャートである。3 is a flowchart showing the flow of processing in the information processing device 1. FIG.

[情報処理システムSの概要]
図1は、情報処理システムSの概要を説明するための図である。情報処理システムSは、事務処理を支援するためのシステムである。情報処理システムSは、情報処理装置1及び情報端末2を有する。情報処理装置1及び情報端末2は、ネットワークを介して通信可能に接続されている。情報処理システムSにおいては、さらに取得したデータに対する後続の処理を実行する装置がさらに含まれていてもよい。
[Overview of information processing system S]
FIG. 1 is a diagram for explaining an overview of the information processing system S. As shown in FIG. The information processing system S is a system for supporting office processing. The information processing system S includes an information processing device 1 and an information terminal 2. The information processing device 1 and the information terminal 2 are communicably connected via a network. The information processing system S may further include a device that performs subsequent processing on the acquired data.

情報処理装置1は、処理対象のデータ(以下、「処理対象データ」と言う)を取得し、取得した処理対象データに含まれるそれぞれの項目をネットワーク上で交換可能なデータにマッピングするための装置である。より具体的には、情報処理装置1は、フォーマット情報を記憶している。フォーマット情報については後述するが、情報処理システムSにおいて処理可能なデータを示す。処理対象データは、事務処理の対象の書類の電子データである。処理対象データは一例として、発注書、納品書、請求書等の証憑や、契約書等であるがこれに限られない。 The information processing device 1 is a device for acquiring processing target data (hereinafter referred to as "processing target data") and mapping each item included in the acquired processing target data to data that can be exchanged on a network. It is. More specifically, the information processing device 1 stores format information. The format information will be described later, but it indicates data that can be processed by the information processing system S. The data to be processed is electronic data of documents to be processed. Examples of data to be processed include, but are not limited to, evidence such as purchase orders, delivery notes, and invoices, and contracts.

情報端末2は、ユーザが使用する端末装置である。情報端末2は、処理対象データを情報処理装置1に送信する。情報端末2は、情報処理装置1から取得した情報に基づいて、処理対象データの項目と、フォーマット情報に含まれる項目と、のマッピングの候補をユーザが確認するための画面を表示する。なお、情報処理システムSのユーザは、処理対象データを使用した事務処理をする事業者における担当者である。 The information terminal 2 is a terminal device used by a user. The information terminal 2 transmits processing target data to the information processing device 1. Based on the information acquired from the information processing device 1, the information terminal 2 displays a screen for the user to check mapping candidates between the items of the processing target data and the items included in the format information. Note that the user of the information processing system S is a person in charge at a company that performs administrative processing using processing target data.

情報処理システムSにおける処理について説明する。情報処理装置1は、処理対象データを取得する(図1における(1))。情報処理装置1は、処理対象データに含まれる複数の項目それぞれについて、対応する定義済み項目を特定する(図1における(2))。一例として、情報処理装置1は、処理対象データに含まれる項目の名称に基づいて、対応する定義済み項目を特定する。 Processing in the information processing system S will be explained. The information processing device 1 acquires processing target data ((1) in FIG. 1). The information processing device 1 identifies a corresponding defined item for each of a plurality of items included in the processing target data ((2) in FIG. 1). As an example, the information processing device 1 identifies a corresponding defined item based on the name of the item included in the processing target data.

情報処理装置1は、処理対象データに含まれる項目のうち、対応する定義済み項目を特定できない項目を未特定項目として特定する(図1における(3))。情報処理装置1は、未特定項目に対応する候補項目として特定する(図1における(4))。候補項目は、フォーマット情報において未特定項目が対応する候補となる定義済項目である。一例として、情報処理装置1は、フォーマット情報に含まれる定義済み項目が示す内容と、未特定項目と、定義済み項目を特定済みの項目との関係に基づいて、候補項目を特定する。情報処理装置1は、候補項目を出力する(図1における(5))。一例として、情報処理装置1は、未特定項目と、候補項目と、を対応付けて情報端末2に表示させる。 The information processing device 1 identifies, as unspecified items, items for which the corresponding defined items cannot be identified among the items included in the processing target data ((3) in FIG. 1). The information processing device 1 identifies the item as a candidate item corresponding to the unspecified item ((4) in FIG. 1). The candidate item is a defined item that is a candidate to which an unspecified item corresponds in the format information. As an example, the information processing device 1 identifies candidate items based on the content indicated by the defined items included in the format information, the relationship between unspecified items, and items for which the defined items have been identified. The information processing device 1 outputs candidate items ((5) in FIG. 1). As an example, the information processing device 1 causes the information terminal 2 to display unspecified items and candidate items in association with each other.

情報処理装置1は、情報端末2を介して候補項目を未特定項目に対応する項目として確定させる操作を受付けた場合、情報処理装置1は、当該項目の名称を当該候補項目の名称で置換した処理対象データを生成する。情報処理装置1は、一例として、置換した処理対象データを、後続処理を実行する装置に出力してもよい。 When the information processing device 1 receives an operation to confirm a candidate item as an item corresponding to an unspecified item via the information terminal 2, the information processing device 1 replaces the name of the item with the name of the candidate item. Generate processing target data. For example, the information processing device 1 may output the replaced processing target data to a device that executes subsequent processing.

情報処理システムSがこのように構成されることで、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減するという効果を奏する。 By configuring the information processing system S in this way, it is possible to reduce the effort required to process data to be processed, including items for which conversion profiles are not defined in advance.

[情報処理装置1の構成]
図2は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、取得部131、項目特定部132、候補特定部133、出力部134及び位置特定部135を有する。
[Configuration of information processing device 1]
FIG. 2 is a block diagram showing the configuration of the information processing device 1. As shown in FIG. The information processing device 1 includes a communication section 11, a storage section 12, and a control section 13. The control unit 13 includes an acquisition unit 131 , an item identification unit 132 , a candidate identification unit 133 , an output unit 134 , and a position identification unit 135 .

通信部11は、ネットワークを介して他の装置とデータの送受信をするための通信インターフェースである。記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部13が実行するプログラムを予め記憶している。 The communication unit 11 is a communication interface for transmitting and receiving data to and from other devices via a network. The storage unit 12 is a storage medium including a ROM (Read Only Memory), a RAM (Random Access Memory), an SSD (Solid State Drive), a hard disk drive, and the like. The storage unit 12 stores in advance a program to be executed by the control unit 13.

記憶部12は、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する。図3は、記憶部12が記憶するフォーマット情報のデータ構造の一例を示す図である。フォーマット情報においては、「項目ID」、「項目名」、「データ型」、「定義」及び「関連項目」を含む。「項目ID」は、定義済み項目を識別するID(Identificatoin)である。「項目名」は、定義済み項目の項目名を示す。「データ型」は、当該定義済み項目において許容されるデータ型を示す。「定義」は、当該定義済み項目が示す内容、他の項目との関係を示す。定義においては、一例として、当該項目が他の定義済み項目との間で満たすべき計算式を含む。「関連項目」は、当該定義済み項目の値を算出するために参照される項目の項目IDを示す。定義においては、当該定義済み項目が取り得る値が含まれていてもよい。 The storage unit 12 stores format information including defined items, which are a plurality of defined items. FIG. 3 is a diagram showing an example of the data structure of format information stored in the storage unit 12. The format information includes "item ID", "item name", "data type", "definition", and "related item". “Item ID” is an ID (Identificatoin) that identifies a defined item. “Item name” indicates the item name of the defined item. “Data type” indicates the data type allowed in the defined item. “Definition” indicates the content indicated by the defined item and the relationship with other items. The definition includes, for example, a calculation formula that must be satisfied between the item and other defined items. “Related item” indicates the item ID of the item that is referred to in order to calculate the value of the defined item. The definition may include values that the defined item can take.

制御部13は、例えばCPU(Central Processing Unit)等のプロセッサである。制御部13は、記憶部12に記憶されたプログラムを実行することにより、取得部131、項目特定部132、候補特定部133、出力部134及び位置特定部135として機能する。 The control unit 13 is, for example, a processor such as a CPU (Central Processing Unit). The control unit 13 functions as an acquisition unit 131 , an item identification unit 132 , a candidate identification unit 133 , an output unit 134 , and a position identification unit 135 by executing the program stored in the storage unit 12 .

取得部131は、複数の項目が含まれる処理対象データを取得する。図4は、取得部131が取得する処理対象データの一例を示す図である。処理対象データにおいては、複数の項目を含み、それぞれの項目について項目名と、当該項目についての値と、を含む。一例として、取得部131は、情報端末2から処理対象データを取得する。取得部131は、不図示の外部装置から処理対象データを取得してもよい。なお、取得部131は、書類の画像データを取得し、取得した画像データをOCR処理することにより処理対象データを取得してもよい。 The acquisition unit 131 acquires processing target data that includes a plurality of items. FIG. 4 is a diagram illustrating an example of processing target data acquired by the acquisition unit 131. The processing target data includes a plurality of items, and includes an item name and a value for each item. As an example, the acquisition unit 131 acquires processing target data from the information terminal 2. The acquisition unit 131 may acquire processing target data from an external device (not shown). Note that the acquisition unit 131 may acquire processing target data by acquiring image data of a document and performing OCR processing on the acquired image data.

項目特定部132は、処理対象データに含まれる複数の項目それぞれの名称に基づいて、複数の項目それぞれがフォーマット情報に含まれる定義済項目のいずれに対応するかを特定する。項目特定部132は、処理対象データに含まれる項目それぞれの名称と、フォーマット情報に含まれる「項目名」において一致する名称を有する項目を、それぞれの項目に対応する定義済み項目として特定する。項目特定部132は、処理対象データに含まれる項目のうち、名称に基づいて定義済み項目を特定できない項目を未特定項目として特定する。一例として、図4に示す処理対象データにおいては、「合計額」が定義済み項目のいずれにも一致しないため、未特定項目として特定する。なお、後述するように項目特定部132は、処理対象データに含まれる項目の意味に基づいて処理対象データに含まれる項目に対応する定義済み項目を特定してもよい。 The item specifying unit 132 specifies which of the defined items included in the format information each of the plurality of items corresponds to, based on the name of each of the plurality of items included in the processing target data. The item specifying unit 132 specifies items having names that match the names of each item included in the processing target data and the "item name" included in the format information, as defined items corresponding to the respective items. The item specifying unit 132 specifies, as unspecified items, items included in the processing target data that cannot be specified as defined items based on their names. As an example, in the processing target data shown in FIG. 4, since "total amount" does not match any of the defined items, it is specified as an unspecified item. Note that, as described later, the item specifying unit 132 may specify defined items corresponding to items included in the processing target data based on the meanings of the items included in the processing target data.

候補特定部133は、処理対象データに含まれる項目のうち項目特定部132が対応する定義済項目を特定できない項目である未特定項目が有る場合、未特定項目について、候補項目を特定する。一例として、候補特定部133は未特定項目について、処理対象データに含まれる項目同士の関係に基づいて、フォーマット情報において未特定項目が対応する候補となる定義済項目である候補項目を特定する。すなわち、候補特定部133は、未特定項目と、対応する定義済み項目が特定された他の項目(以下、特定済み項目と言う)との関係が、いずれかの定義済み項目についての「定義」が示す関係と合致するか否かを判定する。候補特定部133は、未特定項目と、特定済み項目と、の関係が「定義」が示す関係に合致する定義済み項目を、未特定項目に対応する候補項目として特定する。また、候補特定部133は、後述するように項目同士の距離に基づいて候補項目を特定してもよい。 If there is an unspecified item that is an item for which the item specifying unit 132 cannot specify a corresponding defined item among the items included in the processing target data, the candidate specifying unit 133 specifies a candidate item for the unspecified item. As an example, the candidate specifying unit 133 specifies, for an unspecified item, a candidate item that is a defined item that is a candidate to which the unspecified item corresponds in the format information, based on the relationship between items included in the processing target data. That is, the candidate specifying unit 133 determines whether the relationship between the unspecified item and another item for which a corresponding defined item has been specified (hereinafter referred to as a specified item) is the "definition" of any defined item. Determine whether it matches the relationship indicated by . The candidate specifying unit 133 specifies a defined item whose relationship between the unspecified item and the specified item matches the relationship indicated by "definition" as a candidate item corresponding to the unspecified item. Further, the candidate specifying unit 133 may specify candidate items based on distances between items, as described later.

出力部134は、未特定項目と、候補特定部133が特定した候補項目と、を対応付けて出力する。出力部134は、未特定項目に対応する候補項目を確定させるための画面を情報端末2に表示させる。図5は、出力部134が表示させる画面の一例を示す図である。図5に示す画面においては、未特定項目と、候補特定部133が特定した候補項目と、が表示されている。ユーザが情報端末2において、未特定項目と、候補項目を対応付ける操作をすると(例えば、図5に示す画面における「OK」と表示されたボタンが押された場合)、出力部134は、処理対象データにおける未特定項目と、特定された候補項目とをマッピングさせる。一例として、出力部134は、処理対象データにおける未特定項目の項目名を、特定された候補項目の項目名で置換した処理対象データを生成する。出力部134は、生成した置換後の処理対象データを記憶部12に記憶させてもよいし、処理対象データの後続処理を行う外部装置に出力してもよい。 The output unit 134 outputs the unspecified item and the candidate item specified by the candidate specifying unit 133 in association with each other. The output unit 134 causes the information terminal 2 to display a screen for determining candidate items corresponding to the unspecified items. FIG. 5 is a diagram showing an example of a screen displayed by the output unit 134. In the screen shown in FIG. 5, unspecified items and candidate items specified by the candidate specifying unit 133 are displayed. When the user performs an operation on the information terminal 2 to associate an unspecified item with a candidate item (for example, when the button displayed as "OK" on the screen shown in FIG. 5 is pressed), the output unit 134 outputs the processing target Unspecified items in the data and identified candidate items are mapped. As an example, the output unit 134 generates processing target data by replacing the item name of an unspecified item in the processing target data with the item name of a specified candidate item. The output unit 134 may cause the storage unit 12 to store the generated data to be processed after replacement, or may output it to an external device that performs subsequent processing of the data to be processed.

なお、候補特定部133は、1の未特定項目について、複数の候補項目を特定してもよい。候補特定部133が複数の候補項目を特定した場合、出力部134は、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示してもよい。この場合、出力部134は、処理対象データにおける未特定項目の項目名を、表示された画面においてユーザが選択した候補項目で置換した処理対象データを生成する。 Note that the candidate specifying unit 133 may specify a plurality of candidate items for one unspecified item. When the candidate specifying unit 133 specifies a plurality of candidate items, the output unit 134 may display a screen for selecting a defined item corresponding to the unspecified item from the plurality of specified candidate items. In this case, the output unit 134 generates processing target data in which the item name of the unspecified item in the processing target data is replaced with a candidate item selected by the user on the displayed screen.

また、候補特定部133が未特定項目に対応する候補項目を特定できない場合、出力部134は、未特定項目に対応する候補項目を特定できないことを警告するアラートを情報端末2に表示させる。 Further, when the candidate specifying unit 133 cannot specify a candidate item corresponding to the unspecified item, the output unit 134 causes the information terminal 2 to display an alert warning that the candidate item corresponding to the unspecified item cannot be specified.

情報処理装置1がこのように構成されることで、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減するという効果を奏する。 By configuring the information processing device 1 in this way, it is possible to reduce the effort required to process data to be processed, including items for which conversion profiles are not defined in advance.

情報処理装置1は、項目の名称が有する意味に基づいて処理対象データに含まれる項目に対応する定義済み項目を特定してもよい。 The information processing device 1 may identify defined items corresponding to items included in the processing target data based on the meanings of the item names.

項目特定部132は、複数の項目の名称それぞれが示す意味に基づいて、複数の項目それぞれが対応する定義済項目を特定する。一例として、項目特定部132は、処理対象データに含まれる項目の名称を既知の自然言語処理技術を用いて、処理対象データに含まれる項目の項目名それぞれが有する意味と類似する項目名を有する項目を特定する。より具体的には、項目特定部132は、処理対象データに含まれる項目の項目名それぞれについて、フォーマット情報に含まれる定義済み項目それぞれとの類似度を算出し、類似度が所定の閾値以上である定義済み項目を、処理対象データに含まれる項目に対応する定義済み項目として特定する。 The item specifying unit 132 specifies defined items to which each of the plurality of items corresponds, based on the meaning indicated by each of the names of the plurality of items. As an example, the item specifying unit 132 uses known natural language processing technology to determine the names of items included in the processing target data, so that the item names have similar meanings to the respective item names of the items included in the processing target data. Identify the item. More specifically, the item specifying unit 132 calculates the degree of similarity between each item name of the items included in the processing target data and each defined item included in the format information, and if the degree of similarity is equal to or greater than a predetermined threshold. A certain defined item is identified as a defined item corresponding to an item included in the processing target data.

情報処理装置1がこのように構成されることで、項目の名称が完全に一致していない場合であっても対応する定義済み項目を特定することができる。その結果、情報処理装置1においては、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを定義済みのデータとマッピングさせやすくない、データを処理するための手間を低減することができる。 By configuring the information processing device 1 in this way, even if the names of the items do not completely match, the corresponding defined items can be specified. As a result, in the information processing device 1, it is difficult to map data to be processed, including items for which conversion profiles have not been defined in advance, with defined data, and it is possible to reduce the effort required to process data. can.

フォーマット情報において定義済み項目の算出方法が定義されている場合には、当該算出方法と一致する場合に、未特定項目に対応する定義済み項目として特定するよう情報処理装置1が構成されてもよい。 If a calculation method for a defined item is defined in the format information, the information processing device 1 may be configured to identify the item as a defined item corresponding to an unspecified item if the calculation method matches the calculation method. .

取得部131は、複数の項目のうちの少なくともいずれかに関連付けられた金額をさらに含む処理対象データを取得する。図4に示す処理対象データにおいては、「商品1」の「小計」、「商品2」の「小計」、「合計額(税抜き)」、「合計額(10%対象)」、「合計額(8%対象)」、「消費税額合計」、「消費税額合計(10%)、「消費税額合計(8%)」及び「合計額」において金額が関連付けられている。 The acquisition unit 131 acquires processing target data that further includes an amount associated with at least one of the plurality of items. In the processing target data shown in Figure 4, "Subtotal" of "Product 1", "Subtotal" of "Product 2", "Total amount (excluding tax)", "Total amount (10% subject)", "Total amount" Amounts are associated in "(8% target)", "Total consumption tax amount", "Total consumption tax amount (10%)", "Total consumption tax amount (8%)", and "Total amount".

図4に示す処理対象データにおいては、「合計額」の項目がフォーマット情報に含まれる項目名と対応していないため、項目特定部132の処理の結果、「合計額」の項目が未特定項目として特定される。そして、候補特定部133は、金額を演算した結果に基づいて、未特定項目に対応する候補項目を特定する。すなわち、候補特定部133は、未特定項目に関連付けられた金額が、処理対象データに含まれる他の1以上の項目に関連付けられた金額を、フォーマット情報に含まれる特定の定義済み項目に関連付けられた関連項目を特定し、関連項目同士の演算方法に基づいて演算した結果と一致するか否かを判定する。候補特定部133は、判定した結果が一致する場合、当該定義済み項目を未特定項目の候補項目として特定する。 In the processing target data shown in FIG. 4, since the item "total amount" does not correspond to the item name included in the format information, as a result of the processing by the item specifying unit 132, the item "total amount" is an unspecified item. Identified as Then, the candidate specifying unit 133 specifies a candidate item corresponding to the unspecified item based on the result of calculating the amount. That is, the candidate specifying unit 133 determines whether an amount associated with an unspecified item is associated with one or more other items included in the processing target data, or an amount associated with a specific predefined item included in the format information. The related items are identified, and it is determined whether the results match the calculated results based on the calculation method for the related items. If the determined results match, the candidate specifying unit 133 specifies the defined item as a candidate item of the unspecified item.

具体的には、候補特定部133は、「合計額」の項目に関連付けられた金額と、他の特定済みの項目と、がフォーマット情報に含まれるいずれかの定義済み項目の「定義」が示す計算式を満たす場合に、当該定義済み項目を「合計額」の候補項目として特定する。具体的には、「請求額合計」の関連項目は、「合計額(税抜き)」と「消費税額合計」であり、「合計額(税抜き)」の金額は「150,000円」であり、「消費税額合計」の金額は、「13,000円」である。そして、処理対象データにおける「合計額」の金額「163,000円」と、「合計額(税抜き)」の金額「150,000円」と、「消費税額合計」の金額「13,000円」と、は、フォーマット情報における「請求額合計」に関連付けられた「定義」における「合計額(税抜き)+消費税額合計」との関係を満たすため、候補特定部133は、処理対象データにおける定義済み項目のうち「請求額合計」を未特定項目である「合計額」の候補項目として特定する。 Specifically, the candidate specifying unit 133 determines whether the “definition” of any predefined item whose format information includes the amount associated with the “total amount” item and other specified items is indicated. If the calculation formula is satisfied, the defined item is identified as a candidate item for the "total amount". Specifically, the related items for "Total billed amount" are "Total amount (excluding tax)" and "Total consumption tax amount", and the amount of "Total amount (excluding tax)" is "150,000 yen". Yes, and the amount of "total consumption tax" is "13,000 yen." Then, in the data to be processed, the amount of "Total Amount" is "163,000 yen", the amount of "Total Amount (excluding tax)" is "150,000 yen", and the amount of "Total Consumption Tax" is "13,000 yen". " satisfies the relationship with "total amount (excluding tax) + total consumption tax amount" in the "definition" associated with "total billed amount" in the format information, so the candidate specifying unit 133 Among the defined items, "total billed amount" is specified as a candidate item for "total amount", which is an unspecified item.

情報処理装置1がこのように構成されることで、事前に定義されていない項目を含む事務処理対象のデータを定義済みの項目にマッピングさせることができる。 By configuring the information processing device 1 in this way, it is possible to map data to be processed including items that are not defined in advance to defined items.

未特定項目が含まれる位置に基づいて候補項目を特定するよう情報処理装置1が構成されることで、事前に変換プロファイルを定めておかなくてもデータをマッピングできる場合がある。 By configuring the information processing device 1 to identify candidate items based on the position where an unspecified item is included, data may be mapped without having to define a conversion profile in advance.

位置特定部135は、処理対象データに含まれる項目それぞれが処理対象データにおいて配置された位置を特定する。項目それぞれが処理対象データにおいて配置された位置は、一例として、処理対象データにおける項目の順序であってもよい。また、処理対象データが入力された画像データをOCR処理して取得した場合においては、当該画像データに当該項目が配置された座標であってもよい。 The position specifying unit 135 specifies the position where each item included in the processing target data is arranged in the processing target data. The position where each item is placed in the processing target data may be, for example, the order of the items in the processing target data. Furthermore, in the case where the image data into which the data to be processed is input is obtained by OCR processing, the coordinates of the item may be arranged in the image data.

候補特定部133は、未特定項目が処理対象データにおいて配置された位置に基づいて、未特定項目に対応する候補項目を特定する。例えば、処理対象データに日付を示す項目が含まれていて、対応する定義済み項目を項目特定部132が特定できない場合、当該日付が含まれる位置と、「書類番号」が含まれる位置と、が予め定められた閾値以上近い場合に「発行日」を当該日付の候補項目として特定する。また、同様の場合であって、日付が含まれる位置と、「振込先情報」が含まれる位置と、が予め定められた閾値以上近い場合に「支払期日」を当該日付の候補項目として特定する。 The candidate specifying unit 133 specifies a candidate item corresponding to the unspecified item based on the position where the unspecified item is placed in the processing target data. For example, if the data to be processed includes an item indicating a date, and the item specifying unit 132 cannot identify the corresponding defined item, the position where the date is included and the position where the "document number" is included are different. If the date is closer than a predetermined threshold, the "issue date" is specified as a candidate item for the date. Additionally, in a similar case, if the location containing the date and the location containing "remittance information" are closer than a predetermined threshold, "payment date" is identified as a candidate item for that date. .

候補項目としての確からしさを示すスコアが表示するよう情報処理装置1が構成されてもよい。 The information processing device 1 may be configured to display a score indicating the likelihood of a candidate item.

出力部134は、未特定項目と、候補特定部133が特定した候補項目と、が対応する蓋然性の高さを示すスコアをさらに出力する。すなわち、候補特定部133は、当該候補項目についてのスコアを算出する。スコアは一例として、未特定項目の項目名と、候補項目の項目名の類似度に基づいて算出される。候補特定部133はさらに、当該未特定項目と、当該候補項目に関連する他の項目と、の位置関係に基づいてスコアを算出してもよい。出力部134は、候補項目を表示する画面において、当該候補項目について算出したスコアをさらに表示させてもよい。 The output unit 134 further outputs a score indicating the high probability that the unspecified item corresponds to the candidate item specified by the candidate specifying unit 133. That is, the candidate specifying unit 133 calculates the score for the candidate item. For example, the score is calculated based on the similarity between the item name of the unspecified item and the item name of the candidate item. The candidate specifying unit 133 may further calculate a score based on the positional relationship between the unspecified item and other items related to the candidate item. The output unit 134 may further display the score calculated for the candidate item on the screen displaying the candidate item.

情報処理装置1がこのように構成されることで、ユーザは特定された候補項目が未特定項目に対応するか否かを判断しやすくなるという効果を奏する。 By configuring the information processing device 1 in this way, the user can easily determine whether or not the specified candidate item corresponds to an unspecified item.

未特定項目に対応する候補項目が特定できない場合、当該未特定項目に設定すべき名称を表示するよう情報処理装置1が構成されてもよい。 When a candidate item corresponding to an unspecified item cannot be specified, the information processing device 1 may be configured to display a name to be set for the unspecified item.

出力部134は、候補特定部133が、未特定項目に対応する候補項目を特定できない場合、未特定項目に設定すべき名称を表示させる。一例として、記憶部12においては、処理対象データと、処理対象データにおいて名称を設定すべき項目と、を入力すると、当該項目に設定すべき名称を出力するよう学習された学習済みモデルが記憶されており、出力部134は、処理対象データと、未特定項目と、を記憶部12が記憶する学習済みモデルに入力し、出力された名称を情報端末2に表示させる。ユーザが、情報端末2を操作し、当該名称を確定させる操作をした場合、未特定項目の名称を学習済みモデルが出力した名称で置換した処理対象データを生成する。 If the candidate specifying unit 133 cannot specify a candidate item corresponding to the unspecified item, the output unit 134 displays a name to be set for the unspecified item. As an example, in the storage unit 12, when processing target data and an item for which a name is to be set in the processing target data are input, a trained model that is trained to output a name to be set for the item is stored. The output unit 134 inputs the processing target data and the unspecified item into the learned model stored in the storage unit 12 and causes the information terminal 2 to display the output name. When the user operates the information terminal 2 to confirm the name, processing target data is generated in which the name of the unspecified item is replaced with the name output by the learned model.

情報処理装置1がこのように構成されることで、未特定項目に対応するユーザの負担を軽減することができる。 By configuring the information processing device 1 in this way, it is possible to reduce the burden on the user in dealing with unspecified items.

[情報処理装置1における処理の流れ]
図6は、情報処理装置1における処理の流れを示すフローチャートである。図6におけるフローチャートは、処理対象データを取得した時点から開始している。
[Flow of processing in information processing device 1]
FIG. 6 is a flowchart showing the flow of processing in the information processing device 1. The flowchart in FIG. 6 starts from the time when the data to be processed is acquired.

取得部131は、処理対象データを取得する(S01)。項目特定部132は、取得した処理対象データに含まれる項目それぞれについて、フォーマット情報において対応する定義済み項目を特定する(S02)。項目特定部132は、処理対象データに含まれる項目のうち、対応する定義済み項目を特定できない項目を、未特定項目として特定する(S03)。 The acquisition unit 131 acquires processing target data (S01). The item identifying unit 132 identifies a corresponding defined item in the format information for each item included in the acquired processing target data (S02). The item specifying unit 132 specifies, as an unspecified item, an item included in the processing target data for which a corresponding defined item cannot be specified (S03).

候補特定部133は、未特定項目に対応する候補項目を特定する(S04)。出力部134は、未特定項目に対応する候補項目が特定されたか否かを判定する(S05)。候補項目が特定された場合(S05におけるYES)、出力部134は、未特定項目に対応する定義済み項目を確定するための画面を情報端末2に出力する(S06)。出力部134は、情報端末2に表示された画面において、候補特定部133が特定した候補項目と、を対応付けて出力する。出力部134は、出力部134は、未特定項目に対応する定義済み項目を確定する操作がされた場合、未特定項目の名称を候補項目の名称で置換した処理対象データを記憶部12に記憶させてもよいし、後続処理を実行する装置に置換後の処理対象データを出力してもよい。そして、情報処理装置1は、処理を終了する。 The candidate specifying unit 133 specifies candidate items corresponding to the unspecified items (S04). The output unit 134 determines whether a candidate item corresponding to the unspecified item has been identified (S05). If a candidate item is identified (YES in S05), the output unit 134 outputs a screen for determining the defined item corresponding to the unspecified item to the information terminal 2 (S06). The output unit 134 outputs the candidate items identified by the candidate identifying unit 133 in association with each other on the screen displayed on the information terminal 2 . When the output unit 134 performs an operation to confirm a defined item corresponding to an unspecified item, the output unit 134 stores processing target data in which the name of the unspecified item is replaced with the name of a candidate item in the storage unit 12. Alternatively, the replaced data to be processed may be output to a device that executes subsequent processing. The information processing device 1 then ends the process.

候補項目が特定されない場合(S05におけるNO)、出力部134は、処理対象データがフォーマット情報に含まれる項目とマッピングできない項目を含むことを示すアラートを出力する(S07)。そして、情報処理装置1は、処理を終了する。 If a candidate item is not specified (NO in S05), the output unit 134 outputs an alert indicating that the processing target data includes an item included in the format information and an item that cannot be mapped (S07). The information processing device 1 then ends the process.

[本実施の形態における効果]
以上説明したとおり、情報処理装置1においては、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減するという効果を奏する。
[Effects of this embodiment]
As described above, the information processing device 1 has the effect of reducing the effort required to process data to be processed, including items for which conversion profiles are not defined in advance.

以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist. be. For example, all or part of the device can be functionally or physically distributed and integrated into arbitrary units. In addition, new embodiments created by arbitrary combinations of multiple embodiments are also included in the embodiments of the present invention. The effects of the new embodiment resulting from the combination have the effects of the original embodiment.

1 情報処理装置
11 通信部
12 記憶部
13 制御部
131 取得部
132 項目特定部
133 候補特定部
134 出力部
135 位置特定部
1 Information processing device 11 Communication section 12 Storage section 13 Control section 131 Acquisition section 132 Item specification section 133 Candidate specification section 134 Output section 135 Position specification section

Claims (8)

複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部と、
複数の項目が含まれる処理対象データを取得する取得部と、
前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定部と、
前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である1以上の候補項目を特定する候補特定部と、
前記未特定項目と、前記候補特定部が特定した1以上の候補項目と、を対応付けて出力する出力部と、
を有し、
前記処理対象データにおいては、前記複数の項目のうちの少なくともいずれかに金額が関連付けられており、
前記候補特定部は、前記金額を演算した結果に基づいて、前記未特定項目に対応する1以上の候補項目を特定し、
前記出力部は、前記候補特定部が複数の候補項目を特定した場合、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示させるよう制御する、
報処理装置。
a storage unit that stores format information including predefined items that are a plurality of predefined items;
an acquisition unit that acquires processing target data that includes multiple items;
an item specifying unit that specifies which of the defined items included in the format information each of the plurality of items corresponds to, based on the name of each of the plurality of items included in the processing target data;
If there is an unspecified item that is an item for which the item identifying unit cannot identify a corresponding defined item among the items included in the processing target data, the unspecified item corresponds to the unspecified item in the format information. a candidate identification unit that identifies one or more candidate items that are defined items that are candidates;
an output unit that outputs the unspecified item and one or more candidate items identified by the candidate identifying unit in association with each other;
has
In the processing target data, an amount is associated with at least one of the plurality of items,
The candidate identifying unit identifies one or more candidate items corresponding to the unspecified item based on the result of calculating the amount,
When the candidate identifying unit identifies a plurality of candidate items, the output unit controls to display a screen for selecting a defined item corresponding to the unidentified item from among the identified candidate items.
Information processing device.
前記候補特定部は、前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である前記未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である1以上の候補項目を特定する、
請求項1に記載の情報処理装置。
When there is an unspecified item that is an item for which the item specifying unit cannot identify a corresponding defined item among the items included in the processing target data, the candidate specifying unit determines the processing target data for the unspecified item. identifying one or more candidate items that are defined items to which the unspecified item corresponds in the format information, based on the relationship between items included in the format information;
The information processing device according to claim 1.
前記項目特定部は、前記複数の項目の名称それぞれが示す意味に基づいて、前記複数の項目それぞれが対応する定義済項目を特定する、
請求項1に記載の情報処理装置。
The item specifying unit specifies a defined item to which each of the plurality of items corresponds based on the meaning indicated by each of the names of the plurality of items.
The information processing device according to claim 1.
前記処理対象データに含まれる項目それぞれが前記処理対象データにおいて配置された位置を特定する位置特定部をさらに有し、
前記候補特定部は、前記未特定項目が前記処理対象データにおいて配置された位置に基づいて、前記未特定項目に対応する1以上の候補項目を特定する、
請求項1に記載の情報処理装置。
further comprising a position specifying unit that specifies a position where each item included in the processing target data is placed in the processing target data,
The candidate identifying unit identifies one or more candidate items corresponding to the unspecified item based on a position where the unspecified item is placed in the processing target data.
The information processing device according to claim 1.
前記出力部は、前記未特定項目と、前記候補特定部が特定した候補項目と、が対応する蓋然性の高さを示すスコアをさらに出力する、
請求項1に記載の情報処理装置。
The output unit further outputs a score indicating a high probability that the unspecified item and the candidate item identified by the candidate identification unit correspond.
The information processing device according to claim 1.
前記出力部は、前記候補特定部が、前記未特定項目に対応する候補項目を特定できない場合、前記未特定項目に設定すべき名称を表示させる、
請求項1に記載の情報処理装置。
The output unit displays a name to be set for the unspecified item when the candidate specifying unit cannot specify a candidate item corresponding to the unspecified item.
The information processing device according to claim 1.
コンピュータが実行する、
複数の項目が含まれる処理対象データを取得するステップと、
複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、
前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である1以上の候補項目を特定する候補特定ステップと、
前記未特定項目と、前記候補特定ステップにおいてが特定された1以上の候補項目と、を対応付けて出力するステップと、
を有し、
前記処理対象データにおいては、前記複数の項目のうちの少なくともいずれかに金額が関連付けられており、
前記候補特定ステップにおいては、前記金額を演算した結果に基づいて、前記未特定項目に対応する1以上の候補項目を特定し、
前記出力するステップにおいては、前記候補特定ステップにおいて複数の候補項目を特定した場合、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示させるよう制御する、
情報処理方法。
computer executes
a step of obtaining processing target data including multiple items;
Referring to a storage unit that stores format information including predefined items that are a plurality of predefined items, each of the plurality of items is assigned the format information based on the name of each of the plurality of items included in the processing target data. an item identification step for identifying which of the defined items included in the item corresponds to;
If there is an unspecified item that is an item for which a corresponding defined item cannot be identified in the item identification step among the items included in the processing target data, the relationship between the items included in the processing target data is determined for the unspecified item. a candidate identifying step of identifying one or more candidate items that are defined items to which the unspecified item corresponds in the format information, based on the format information;
outputting the unspecified item in association with one or more candidate items identified in the candidate identifying step;
has
In the processing target data, an amount is associated with at least one of the plurality of items,
In the candidate identification step, one or more candidate items corresponding to the unspecified item are identified based on the result of calculating the amount,
In the outputting step, if a plurality of candidate items are identified in the candidate identification step, controlling the outputting method to display a screen for selecting a defined item corresponding to the unidentified item from among the identified plurality of candidate items;
Information processing method.
コンピュータに、
複数の項目が含まれる処理対象データを取得するステップと、
複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、
前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である1以上の候補項目を特定する候補特定ステップと、
前記未特定項目と、前記候補特定ステップにおいてが特定された1以上の候補項目と、を対応付けて出力するステップと、
を実行させ
前記処理対象データにおいては、前記複数の項目のうちの少なくともいずれかに金額が関連付けられており、
前記候補特定ステップにおいては、前記金額を演算した結果に基づいて、前記未特定項目に対応する1以上の候補項目を特定し、
前記出力するステップにおいては、前記候補特定ステップにおいて複数の候補項目を特定した場合、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示させるよう制御する、
ログラム。
to the computer,
a step of obtaining processing target data including multiple items;
Referring to a storage unit that stores format information including predefined items that are a plurality of predefined items, each of the plurality of items is assigned the format information based on the name of each of the plurality of items included in the processing target data. an item identification step for identifying which of the defined items included in the item corresponds to;
If there is an unspecified item that is an item for which a corresponding defined item cannot be identified in the item identification step among the items included in the processing target data, the relationship between the items included in the processing target data is determined for the unspecified item. a candidate identifying step of identifying one or more candidate items that are defined items to which the unspecified item corresponds in the format information, based on the format information;
outputting the unspecified item in association with one or more candidate items identified in the candidate identifying step;
run the
In the processing target data, an amount is associated with at least one of the plurality of items,
In the candidate identification step, one or more candidate items corresponding to the unspecified item are identified based on the result of calculating the amount,
In the outputting step, if a plurality of candidate items are identified in the candidate identification step, controlling the outputting method to display a screen for selecting a defined item corresponding to the unidentified item from among the identified plurality of candidate items;
program .
JP2023548329A 2023-08-09 2023-08-09 Information processing device, information processing method and program Active JP7452809B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023029107 2023-08-09

Publications (1)

Publication Number Publication Date
JP7452809B1 true JP7452809B1 (en) 2024-03-19

Family

ID=90273443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023548329A Active JP7452809B1 (en) 2023-08-09 2023-08-09 Information processing device, information processing method and program

Country Status (1)

Country Link
JP (1) JP7452809B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005165978A (en) 2003-12-05 2005-06-23 Fuji Photo Film Co Ltd Business form ocr program, method and device thereof
WO2020071558A1 (en) 2018-10-05 2020-04-09 Arithmer株式会社 Business form layout analysis device, and analysis program and analysis method therefor
JP6856916B1 (en) 2020-01-08 2021-04-14 ジーニアルテクノロジー,インク. Information processing equipment, information processing methods and information processing programs
JP2021196686A (en) 2020-06-10 2021-12-27 キヤノン株式会社 Information processing device and information processing method
JP2022101136A (en) 2020-12-24 2022-07-06 キヤノン株式会社 Information processing apparatus, information processing method, and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005165978A (en) 2003-12-05 2005-06-23 Fuji Photo Film Co Ltd Business form ocr program, method and device thereof
WO2020071558A1 (en) 2018-10-05 2020-04-09 Arithmer株式会社 Business form layout analysis device, and analysis program and analysis method therefor
JP6856916B1 (en) 2020-01-08 2021-04-14 ジーニアルテクノロジー,インク. Information processing equipment, information processing methods and information processing programs
JP2021196686A (en) 2020-06-10 2021-12-27 キヤノン株式会社 Information processing device and information processing method
JP2022101136A (en) 2020-12-24 2022-07-06 キヤノン株式会社 Information processing apparatus, information processing method, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
eFLOWソリューションのご紹介,金融国際情報技術展 FIT2018,株式会社 Top Image Systems Japan,2018年10月25日

Similar Documents

Publication Publication Date Title
US11710332B2 (en) Electronic document data extraction
JP5670787B2 (en) Information processing apparatus, form type estimation method, and form type estimation program
EP3779782A1 (en) Image processing device, image processing method, and storage medium for storing program
AU2019306148A1 (en) Improved request handling
US11710386B2 (en) Processing apparatus, and accounting apparatus
US20220351051A1 (en) Analysis system, apparatus, control method, and program
JP6736012B2 (en) Information processing apparatus, information processing method, program, and form reading system
JP7452809B1 (en) Information processing device, information processing method and program
US11972490B2 (en) Determining a category of a request by word vector representation of a natural language text string with a similarity value
KR20220037073A (en) Method and apparatus for managing commodity information
CN112560418A (en) Creating row item information from freeform tabular data
US10216988B2 (en) Information processing device, information processing method, and computer program product
JP2016042236A (en) Housekeeping book preparation system and housekeeping book preparation method
JP5311949B2 (en) Business support system
JP6980927B1 (en) Data processing equipment, data processing methods and programs
WO2021059848A1 (en) Information processing device, information processing method, and information processing program
CN112434997A (en) Date generation device, control method, and non-transitory computer-readable medium
JP7384345B2 (en) Patent information processing device, patent information processing method, and program
US20220165076A1 (en) Processing apparatus, processing method, and non-strategy medium
US11676409B2 (en) Form data acquirement system and non-transitory computer readable recording medium storing form data acquiring program
JP7484461B2 (en) Information processing device, information processing system, and program
JP6858420B1 (en) Accounting equipment, accounting systems, accounting methods and programs
WO2021024882A1 (en) Assessment server for handling mulitple pieces of product information used in product sales forecasts, and assessment method
WO2022054136A1 (en) Data processing device, data processing method, and program
JP7126808B2 (en) Information processing device and program for information processing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230809

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230809

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20231014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240227

R150 Certificate of patent or registration of utility model

Ref document number: 7452809

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150