JP7299822B2 - Apparatus for semantic analysis of trade transaction message, semantic analysis method and program - Google Patents

Apparatus for semantic analysis of trade transaction message, semantic analysis method and program Download PDF

Info

Publication number
JP7299822B2
JP7299822B2 JP2019197461A JP2019197461A JP7299822B2 JP 7299822 B2 JP7299822 B2 JP 7299822B2 JP 2019197461 A JP2019197461 A JP 2019197461A JP 2019197461 A JP2019197461 A JP 2019197461A JP 7299822 B2 JP7299822 B2 JP 7299822B2
Authority
JP
Japan
Prior art keywords
entity
unit
extraction
trade
ontology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019197461A
Other languages
Japanese (ja)
Other versions
JP2021071866A (en
Inventor
信義 荒木
拓真 西村
正欣 大川戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2019197461A priority Critical patent/JP7299822B2/en
Publication of JP2021071866A publication Critical patent/JP2021071866A/en
Application granted granted Critical
Publication of JP7299822B2 publication Critical patent/JP7299822B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

本発明は、貿易取引電文の意味解析装置、意味解析方法およびプログラムに関する。 The present invention relates to a semantic analysis device, a semantic analysis method, and a program for trade transaction messages.

一般に、貿易における輸出者と輸入者との間の代金決済では、非特許文献1に開示されているように、輸出者と輸入者とで直接代金の受け渡しを行うのではなく、銀行の発行した信用状(Letter of Credit。以下、L/Cという。)を用いた決済が行われる(L/C決済)。L/Cは、輸入者側の取引銀行である開設銀行により作成される。当該作成されたL/Cは、開設銀行から輸出者側の取引銀行である通知銀行に向けて発信されて、輸出者に通知される。 Generally, in the payment settlement between the exporter and the importer in trade, as disclosed in Non-Patent Document 1, the payment is not made directly between the exporter and the importer, but the bank issued Settlement using a letter of credit (hereinafter referred to as L/C) is performed (L/C settlement). The L/C is prepared by the opening bank, which is the importer's bank. The created L/C is sent from the opening bank to the advising bank, which is the exporter's bank, and notified to the exporter.

L/C決済において、輸出者は、通知されたL/Cに基づいて必要な貿易書類(必要書類)を用意し、L/Cと合わせて通知銀行(買取銀行)に提出し、買取銀行がL/Cの内容と一致した書類であることを確認することで、輸出者は当該通知銀行から代金を受け取ることができる。そして、提出された必要書類は、通知銀行から開設銀行へと送付され、開設銀行はL/Cの内容と一致した書類であることを確認することで開設銀行から通知銀行へ代金が支払われ、その後、当該L/Cおよび必要書類が輸入者に提示されることで通知銀行は代金を回収する。当該必要書類は、輸入者側が商品を受け取るために必要な書類を含んでいる。こうしたL/C決済では、輸出者にとっては船積み後すぐに輸出代金を回収することができ、また、輸入者にとっても、輸入代金を前払いする必要がなくなり、代金決済を円滑かつ安全に行うことができるといった利点がある。 In L/C settlement, the exporter prepares the necessary trade documents (required documents) based on the notified L/C, submits them together with the L/C to the advising bank (purchasing bank), and the purchasing bank By confirming that the documents match the contents of the L/C, the exporter can receive the payment from the advising bank. Then, the required documents submitted are sent from the advising bank to the opening bank, and the opening bank confirms that the documents match the contents of the L/C, and the opening bank pays the advising bank, After that, the advising bank collects the payment by presenting the relevant L/C and necessary documents to the importer. The required documents include the documents necessary for the importer to receive the goods. With such L/C settlement, the exporter can collect the export payment immediately after shipment, and the importer does not need to pay the import payment in advance, making the payment smooth and safe. It has the advantage of being able to

”L/C決済の流れ”、[Online]、[令和1年10月16日検索]、インターネット<URL:https://www.toishi.info/lc/index.html>"Flow of L/C Payment", [Online], [Searched on October 16, 2019], Internet <URL: https://www.toishi.info/lc/index.html>

しかしながら、非特許文献1に記載のL/C決済において用いられるL/Cには、記載形式が定まっておらず、輸入者側にて任意に入力可能な項目が含まれる。そのため、L/Cを受け取った輸出者や取引銀行において、L/Cの記載内容の把握やチェックに多大な労力を要していた。また、輸出者がL/Cに基づいて必要書類を作成する際に、転記ミスが生じる恐れもある。このように、L/C決済における手続きを円滑化するという観点からすると未だ十分ではなかった。 However, the L/C used in the L/C settlement described in Non-Patent Document 1 does not have a fixed description format, and includes items that can be arbitrarily input by the importer. Therefore, the exporter and bank who received the L/C required a great deal of effort to understand and check the contents of the L/C. In addition, there is a risk of transcription errors when the exporter prepares the necessary documents based on the L/C. Thus, from the viewpoint of facilitating procedures in L/C settlement, it is still insufficient.

本発明は、上述のような事情に鑑みてなされたものであり、L/C決済における手続きを円滑化することのできる貿易取引電文の意味解析装置、意味解析方法およびプログラムを提供することを目的としている。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a semantic analysis apparatus, a semantic analysis method, and a program for trade transaction messages that are capable of facilitating L/C settlement procedures. and

上記目的を達成するため、本発明の第1の観点に係る意味解析装置は、
貿易取引文書データを、形態素に分割する形態素解析部と、
ユーザにより予め定められたルールベースモデルに基づいて、前記形態素解析部により分割された形態素から、信用状を用いる決済に必要な情報であるエンティティを抽出する第1エンティティ抽出部と、
過去の貿易取引文書データから学習された学習モデルに基づいて、前記形態素解析部により分割された形態素から、前記エンティティを抽出する第2エンティティ抽出部と、
前記第1エンティティ抽出部による抽出結果と前記第2エンティティ抽出部による抽出結果とが予め定められた基準を満たすか否かを判定する判定部と、
前記判定部により前記基準を満たすと判定された抽出結果に含まれるエンティティが前記信用状を用いる決済におけるいずれの分類に属するかを、予め定められた条件に従って学習された貿易オントロジに基づいて解析するセマンティック解析部と、
前記セマンティック解析部により解析された前記エンティティを、前記分類と対応付けて記憶する記憶部と、
前記分類と対応付けて前記記憶部に記憶された前記エンティティに基づく学習を行い、前記学習モデルおよび前記貿易オントロジの内容を更新する更新部と、
を備える。
In order to achieve the above object, the semantic analysis device according to the first aspect of the present invention includes:
a morphological analysis unit that divides trade transaction document data into morphemes;
a first entity extraction unit for extracting an entity, which is information necessary for settlement using a letter of credit, from the morphemes divided by the morpheme analysis unit based on a rule-based model predetermined by a user;
a second entity extraction unit that extracts the entity from the morphemes divided by the morphological analysis unit based on a learning model learned from past trade transaction document data;
a determination unit that determines whether or not the extraction result by the first entity extraction unit and the extraction result by the second entity extraction unit satisfy a predetermined criterion;
Analyzing to which classification in settlement using the letter of credit the entity included in the extraction result determined by the determining unit to satisfy the criteria belongs, based on a trade ontology learned according to predetermined conditions. a semantic analysis unit;
a storage unit that stores the entity analyzed by the semantic analysis unit in association with the classification;
an updating unit that performs learning based on the entity stored in the storage unit in association with the classification, and updates the contents of the learning model and the trade ontology;
Prepare.

前記記憶部に記憶された前記エンティティを、前記エンティティに対応付けられた前記分類とともに出力する出力部、をさらに備え、
前記セマンティック解析部は、前記エンティティがいずれの分類に属するかを解析する際に、予め定められたスコア値を付与し、
前記判定部は、
前記第1エンティティ抽出部による抽出結果と前記第2エンティティ抽出部による抽出結果とが一致する場合に、前記基準を満たすと判定し、
前記第1エンティティ抽出部による抽出結果と前記第2エンティティ抽出部による抽出結果とが一致しない場合、前記セマンティック解析部により前記第1エンティティ抽出部による抽出結果に含まれるエンティティと前記第2エンティティ抽出部による抽出結果に含まれるエンティティとを、それぞれ前記貿易オントロジに基づいて解析することで付与されたそれぞれのスコア値のうち、高いスコア値に対応する抽出結果を、前記基準を満たす抽出結果であると判定し、
前記第1エンティティ抽出部と前記第2エンティティ抽出部とのうち、いずれか一方の抽出部からのみ前記抽出結果が抽出された場合、抽出された前記抽出結果に含まれるエンティティを、前記貿易オントロジに基づいて解析することで付与された前記スコア値が予め定められた閾値以上の場合、前記抽出結果を、前記基準を満たす抽出結果であると判定する、
ようにしてもよい。
an output unit that outputs the entity stored in the storage unit together with the classification associated with the entity;
The semantic analysis unit assigns a predetermined score value when analyzing which classification the entity belongs to,
The determination unit is
determining that the criterion is satisfied when the extraction result by the first entity extraction unit and the extraction result by the second entity extraction unit match;
When the extraction result by the first entity extraction unit and the extraction result by the second entity extraction unit do not match, the semantic analysis unit extracts entities included in the extraction result by the first entity extraction unit and the second entity extraction unit. Among the score values assigned by analyzing the entities included in the extraction results based on the trade ontology, the extraction results corresponding to the high score values are regarded as the extraction results that satisfy the criteria. judge,
When the extraction result is extracted only from one of the first entity extraction unit and the second entity extraction unit, the entity included in the extracted extraction result is added to the trade ontology If the score value assigned by analyzing based on is equal to or greater than a predetermined threshold value, the extraction result is determined to be an extraction result that satisfies the criterion;
You may do so.

前記貿易オントロジは、前記判定部により前記基準を満たすと判定された抽出結果に含まれるエンティティが、前記信用状を用いる決済におけるいずれの分類に属するかを解析するための学習モデルである信用状解析オントロジと、前記信用状解析オントロジに基づき前記セマンティック解析部により前記信用状を用いる決済におけるいずれの分類に属するかが解析されたエンティティが、前記貿易取引文書データとは異なる貿易必要データにおけるいずれの分類に属するかを解析するための学習モデルである必要情報オントロジと、を含み、
前記セマンティック解析部は、前記記憶部に記憶されたデータに含まれるエンティティが、前記貿易必要データにおけるいずれの分類に属するかを前記必要情報オントロジに基づいて解析し、
前記記憶部は、前記セマンティック解析部により前記必要情報オントロジに基づいて解析されたエンティティを、前記貿易必要データの分類と対応付けて記憶する、
ようにしてもよい。
The trade ontology is a letter of credit analysis that is a learning model for analyzing to which classification in settlement using the letter of credit an entity included in the extraction results determined by the determination unit to satisfy the criteria belongs. The ontology and the entity whose classification in the settlement using the letter of credit is analyzed by the semantic analysis unit based on the ontology and the letter of credit analysis ontology is the classification in the trade necessary data different from the trade transaction document data. a necessary information ontology, which is a learning model for analyzing whether it belongs to
The semantic analysis unit analyzes, based on the necessary information ontology, which classification in the trade necessary data the entity included in the data stored in the storage unit belongs to,
The storage unit stores the entity analyzed by the semantic analysis unit based on the necessary information ontology in association with the classification of the trade necessary data.
You may do so.

前記貿易必要データにおける分類は、取引者毎に異なり、
前記必要情報オントロジは、前記信用状解析オントロジに基づき前記セマンティック解析部により前記信用状を用いる決済におけるいずれの分類に属するかが解析されたエンティティが、前記貿易必要データにおけるいずれの分類に属するかを解析するための学習モデルである必要情報基礎オントロジと、前記セマンティック解析部により前記貿易必要データにおけるいずれの分類に属するかが解析されたエンティティが、前記貿易必要データにおける前記取引者毎に異なるいずれの分類に属するかを解析するための学習モデルである必要情報個別オントロジと、を含み、
前記セマンティック解析部は、前記必要情報基礎オントロジに基づいて解析したエンティティが、前記貿易必要データにおける前記取引者毎に異なるいずれの分類に属するかを前記必要情報個別オントロジに基づいて解析し、
前記記憶部は、前記セマンティック解析部により前記必要情報個別オントロジに基づいて解析されたエンティティを、前記貿易必要データにおける前記取引者毎に異なる分類と対応付けて記憶する、
ようにしてもよい。
The classification in the trade necessary data is different for each trader,
The necessary information ontology indicates to which classification in the trade necessary data an entity whose classification in the settlement using the letter of credit is analyzed by the semantic analysis unit based on the letter of credit analysis ontology. The basic ontology of necessary information, which is a learning model for analysis, and the entity whose classification in the trade-required data is analyzed by the semantic analysis unit is different for each trader in the trade-required data. a necessary information individual ontology, which is a learning model for analyzing whether it belongs to a classification,
The semantic analysis unit analyzes, based on the necessary information individual ontology, to which class the entity analyzed based on the necessary information basic ontology belongs to, which differs for each trader in the necessary trade data, and
The storage unit stores the entity analyzed by the semantic analysis unit based on the individual necessary information ontology in association with the classification that differs for each trader in the necessary trade data,
You may do so.

上記目的を達成するため、本発明の第2の観点に係る意味解析方法は、
形態素解析部と、第1エンティティ抽出部と、第2エンティティ抽出部と、判定部と、セマンティック解析部と、記憶部と、更新部と、を備える意味解析装置による意味解析方法であって、
前記形態素解析部が、貿易取引文書データを、形態素に分割する形態素解析ステップと、
前記第1エンティティ抽出部が、ユーザにより予め定められたルールベースモデルに基づいて、前記形態素解析ステップにより分割された形態素から、信用状を用いる決済に必要な情報であるエンティティを抽出する第1エンティティ抽出ステップと、
前記第2エンティティ抽出部が、過去の貿易取引文書データから学習された学習モデルに基づいて、前記形態素解析ステップにより分割された形態素から、前記エンティティを抽出する第2エンティティ抽出ステップと、
前記判定部が、前記第1エンティティ抽出ステップによる抽出結果と前記第2エンティティ抽出ステップによる抽出結果とが予め定められた基準を満たすか否かを判定する判定ステップと、
前記セマンティック解析部が、前記判定ステップにより前記基準を満たすと判定された抽出結果に含まれるエンティティが前記信用状を用いる決済におけるいずれの分類に属するかを、予め定められた条件に従って学習された貿易オントロジに基づいて解析するセマンティック解析ステップと、
前記記憶部が、前記セマンティック解析ステップにより解析された前記エンティティを、前記分類と対応付けて記憶する記憶ステップと、
前記更新部が、前記分類と対応付けて前記記憶ステップにより記憶された前記エンティティに基づく学習を行い、前記学習モデルおよび前記貿易オントロジの内容を更新する更新ステップと、
を含む。
In order to achieve the above object, the semantic analysis method according to the second aspect of the present invention comprises:
A semantic analysis method by a semantic analysis device comprising a morphological analysis unit, a first entity extraction unit, a second entity extraction unit, a determination unit, a semantic analysis unit, a storage unit, and an update unit,
a morphological analysis step in which the morphological analysis unit divides the trade transaction document data into morphemes;
The first entity extracting unit, based on a rule-based model predetermined by a user, extracts an entity that is information necessary for payment using a letter of credit from the morphemes divided by the morphological analysis step. an extraction step;
a second entity extraction step in which the second entity extraction unit extracts the entity from the morphemes divided by the morphological analysis step based on a learning model learned from past trade document data;
a determination step in which the determination unit determines whether or not the extraction result of the first entity extraction step and the extraction result of the second entity extraction step satisfy a predetermined criterion;
The semantic analysis unit learns, according to a predetermined condition, to which classification in settlement using the letter of credit the entity included in the extraction result determined to satisfy the criteria in the determination step belongs. a semantic parsing step that parses based on the ontology;
a storage step in which the storage unit stores the entity analyzed by the semantic analysis step in association with the classification;
an updating step in which the updating unit performs learning based on the entities stored in the storing step in association with the classification, and updates the contents of the learning model and the trade ontology;
including.

上記目的を達成するため、本発明の第3の観点に係るプログラムは、
コンピュータに、
貿易取引文書データを、形態素に分割する形態素解析処理と、
ユーザにより予め定められたルールベースモデルに基づいて、前記形態素解析処理により分割された形態素から、信用状を用いる決済に必要な情報であるエンティティを抽出する第1エンティティ抽出処理と、
過去の貿易取引文書データから学習された学習モデルに基づいて、前記形態素解析処理により分割された形態素から、前記エンティティを抽出する第2エンティティ抽出処理と、
前記第1エンティティ抽出処理による抽出結果と前記第2エンティティ抽出処理による抽出結果とが予め定められた基準を満たすか否かを判定する判定処理と、
前記判定処理により前記基準を満たすと判定された抽出結果に含まれるエンティティが前記信用状を用いる決済におけるいずれの分類に属するかを、予め定められた条件に従って学習された貿易オントロジに基づいて解析するセマンティック解析処理と、
前記セマンティック解析処理により解析された前記エンティティを、前記分類と対応付けて記憶する記憶処理と、
前記分類と対応付けて前記記憶処理により記憶された前記エンティティに基づく学習を行い、前記学習モデルおよび前記貿易オントロジの内容を更新する更新処理と、
を実行させる。
In order to achieve the above object, the program according to the third aspect of the present invention is
to the computer,
Morphological analysis processing for dividing trade transaction document data into morphemes;
a first entity extraction process for extracting an entity, which is information necessary for settlement using a letter of credit, from the morphemes divided by the morphological analysis process based on a rule-based model predetermined by a user;
a second entity extraction process for extracting the entity from the morphemes divided by the morphological analysis process based on a learning model learned from past trade transaction document data;
a determination process for determining whether or not the extraction result of the first entity extraction process and the extraction result of the second entity extraction process satisfy a predetermined criterion;
Analyzing to which classification in settlement using the letter of credit the entity included in the extraction results determined by the determination processing to satisfy the criteria belongs, based on a trade ontology learned according to predetermined conditions. a semantic analysis process;
a storage process for storing the entity analyzed by the semantic analysis process in association with the classification;
an update process for performing learning based on the entity stored by the storage process in association with the classification, and updating the contents of the learning model and the trade ontology;
to run.

本発明によれば、L/C決済における手続きを円滑化することができる。 ADVANTAGE OF THE INVENTION According to this invention, the procedure in L/C settlement can be facilitated.

L/Cデータの一例を示す図である。It is a figure which shows an example of L/C data. 本発明の実施の形態に係る情報処理システムの一例を示すブロック図である。1 is a block diagram showing an example of an information processing system according to an embodiment of the present invention; FIG. 実施の形態に係る意味解析装置と端末の一例を示すブロック図である。1 is a block diagram showing an example of a semantic analysis device and a terminal according to an embodiment; FIG. 記憶部に記憶されるマスタフォーマットの一例を示す図である。4 is a diagram showing an example of a master format stored in a storage unit; FIG. 記憶部に記憶される貿易オントロジの一例を示す図である。It is a figure which shows an example of the trade ontology memorize|stored in a memory|storage part. (A)は、構造化処理の一例を示すフローチャートであり、(B)は、L/Cデータに含まれる非構造化データの一例を示す図であり、(C)は、構造化データの一例を示す図である。(A) is a flowchart showing an example of structuring processing, (B) is a diagram showing an example of unstructured data included in L/C data, and (C) is an example of structured data It is a figure which shows. (A)は、形態素解析部の抽出結果の一例を示す図であり、(B-1)は、第1エンティティ抽出部の抽出結果の一例を示す図であり、(B-2)は、第2エンティティ抽出部の抽出結果の一例を示す図である。(A) is a diagram showing an example of an extraction result of a morphological analysis unit; (B-1) is a diagram showing an example of an extraction result of a first entity extraction unit; (B-2) is a diagram showing an example of a first entity extraction unit; FIG. 10 is a diagram showing an example of an extraction result of a two-entity extraction unit; エンティティ抽出処理の一例を示すフローチャートである。6 is a flowchart illustrating an example of entity extraction processing; セマンティック解析部の処理の結果の一例を示す図である。FIG. 10 is a diagram showing an example of a result of processing by the semantic analysis unit; (A)は、変形例に係る貿易オントロジの一例を示す図であり、(B)は、I/Vデータの一例を示す図である。(A) is a diagram showing an example of a trade ontology according to a modification, and (B) is a diagram showing an example of I/V data. (A)は、変形例に係る貿易オントロジに含まれるI/Vオントロジの一例を示す図であり、(B)は、I/Vデータの入力データおよび出力データの一例を示す図である。(A) is a diagram showing an example of an I/V ontology included in a trade ontology according to a modification, and (B) is a diagram showing an example of input data and output data of I/V data.

本発明の実施の形態に係る意味解析装置について図面を参照して詳細に説明する。なお、図中、同一又は相当部分には同一符号を付す。以下、本発明の意味解析装置を、輸出者(荷主)がL/C決済の際に使用する意味解析システムに適用した場合を例に説明する。具体的には、輸入者の取引銀行である開設銀行により作成されたL/Cが、開設銀行から輸出者の取引銀行である通知銀行に向けて発信され、通知銀行から輸出者に通知される際に、当該意味解析システムを適用した場合を例に説明する。 A semantic analysis device according to an embodiment of the present invention will be described in detail with reference to the drawings. In addition, in the figure, the same code|symbol is attached|subjected to the same or corresponding part. A case where the semantic analysis apparatus of the present invention is applied to a semantic analysis system used by an exporter (consignor) for L/C settlement will be described below as an example. Specifically, the L/C prepared by the opening bank, which is the importer's bank, is sent from the opening bank to the advising bank, which is the exporter's bank, and the advising bank notifies the exporter. A case in which the semantic analysis system is applied will be described as an example.

図1は、開設銀行により作成され、通知銀行を介して輸出者により意味解析システムに入力されるL/Cデータの一例を示す図である。図示するように、L/Cデータには、取引対象の商品名や数量、単価や使用する通貨の種類と単位など、貿易取引の対象となる情報、すなわち決済に必要な情報(項目データ)が含まれている。なお、これらの項目データについては、輸入者にて順不同に任意に入力される。このように、項目データが輸入者にて任意に入力されたL/Cデータを非構造化データという。また、項目データが予め定められたフォーマットに基づいて記載されたL/Cデータについては、構造化データという。図1に示すL/Cデータは、非構造化データのL/Cデータの例を示している。 FIG. 1 is a diagram showing an example of L/C data prepared by an opening bank and input to a semantic analysis system by an exporter via an advising bank. As shown in the figure, the L/C data contains the information (item data) required for trade transactions, such as the product name, quantity, unit price, currency type and unit used, etc. include. These item data are arbitrarily input by the importer in random order. In this way, L/C data in which item data is arbitrarily input by the importer is called unstructured data. Also, L/C data in which item data is described based on a predetermined format is referred to as structured data. The L/C data shown in FIG. 1 is an example of unstructured L/C data.

本実施の形態に係る意味解析システムは、非構造化データのL/CデータからL/C決済に必要な情報である項目データを、エンティティとして抽出し、予め設計されたオントロジに基づいて、当該抽出したエンティティそれぞれに意味を付与する(それぞれのエンティティが何を意味しているのかを分類する)。これにより、意味解析システム1は、輸入者にて任意に入力された項目データそれぞれを分類し(構造化ともいう)、構造化データを生成する。こうすることにより、非構造化データに含まれる項目データそれぞれが分類されるため、L/Cの記載内容の把握やチェックが容易となり、L/C決済における手続きを円滑化することができる。 The semantic analysis system according to the present embodiment extracts item data, which is information necessary for L/C settlement, from unstructured L/C data as entities, and based on a pre-designed ontology, Assign meaning to each extracted entity (classify what each entity means). As a result, the semantic analysis system 1 classifies (also referred to as structuring) each item data arbitrarily input by the importer, and generates structured data. By doing so, each item data included in the unstructured data is classified, so that it becomes easy to understand and check the description contents of the L/C, and the procedure for L/C settlement can be facilitated.

ここで、本実施の形態におけるエンティティとは、L/C決済に必要な情報である項目データであり、図1に示す取引対象の商品名や数量、単価や使用する通貨の種類と単位など、貿易取引の対象となる情報である。図1に示す他、商品の型番や輸入先の国名、輸出先の国名などの固有名詞及び、日付などの数値表現などが含まれる。本実施の形態におけるオントロジとは、エンティティを意味づけするために定められる概念であって、エンティティの定義(クラス)やエンティティ間の関係を示す関係情報などにより構成される。 Here, the entity in the present embodiment is item data that is information necessary for L/C settlement. It is information that is the subject of trade transactions. In addition to those shown in Fig. 1, it also includes proper nouns such as product model numbers, country names of import destinations, country names of export destinations, and numerical expressions such as dates. An ontology in the present embodiment is a concept defined for giving meaning to entities, and is composed of entity definitions (classes), relationship information indicating relationships between entities, and the like.

意味解析システム1は、図2に示すように、意味解析装置100と端末200とを備える。意味解析装置100は、メインフレームやワークステーション、あるいはPC(Personal Computer)等の任意のコンピュータ装置(情報処理装置)である。端末200は、携帯電話やスマートフォン、タブレットやPC等の情報端末(所謂コンピュータ)であり、クライアント・サーバ型等の分散型のネットワーク210を構築している。なお、意味解析システム1は、クライアント・サーバ型のシステムに限られず、例えばクラウドコンピューティング型であってもよい。意味解析装置100は、端末200から送信されるL/Cデータに含まれる非構造化データから構造化データを生成する。端末200は、通知銀行により送信されるL/Cデータ、輸入者により送信される発注書(P/O:Purchase Order)データなどの契約書類データの入力を輸出者から受け付け、意味解析装置100に出力する。意味解析装置100と端末200とはネットワークを210介して通信可能に接続される。 The semantic analysis system 1 includes a semantic analysis device 100 and a terminal 200, as shown in FIG. The semantic analysis device 100 is an arbitrary computer device (information processing device) such as a mainframe, a workstation, or a PC (Personal Computer). The terminal 200 is an information terminal (so-called computer) such as a mobile phone, a smart phone, a tablet, or a PC, and constructs a distributed network 210 such as a client-server type. Note that the semantic analysis system 1 is not limited to a client-server system, and may be a cloud computing system, for example. Semantic analysis device 100 generates structured data from unstructured data included in L/C data transmitted from terminal 200 . The terminal 200 accepts input of contract document data such as L/C data sent by the advising bank and purchase order (P/O) data sent by the importer from the exporter, and sends it to the semantic analysis device 100 Output. Semantic analysis apparatus 100 and terminal 200 are communicably connected via network 210 .

なお、図2では、端末200が1つのみ示されているが、意味解析システム1は、輸出者の端末200の他、通知銀行の端末200、開設銀行の端末200、輸入者の端末200など複数の端末200を備えて、いずれの端末200からでも意味解析装置100と通信できるようにしてもよい。例えば、通知銀行に設けられた端末200から、ネットワーク210を介して意味解析装置100にL/Cデータを直接入力するようにしてもよい。また、この実施の形態では、意味解析システム1が意味解析装置100と端末200とから構成される例を示しているが、当該意味解析装置100の機能を端末200が備えていてもよい。すなわち、当該意味解析装置100の機能を備えた端末200が意味解析装置100として機能してもよい。 Although only one terminal 200 is shown in FIG. 2, the semantic analysis system 1 includes, in addition to the terminal 200 of the exporter, the terminal 200 of the advising bank, the terminal 200 of the opening bank, the terminal 200 of the importer, and the like. A plurality of terminals 200 may be provided so that any terminal 200 can communicate with the semantic analysis apparatus 100 . For example, the L/C data may be directly input to the semantic analysis apparatus 100 via the network 210 from the terminal 200 provided at the advising bank. In this embodiment, the semantic analysis system 1 is composed of the semantic analysis device 100 and the terminal 200 , but the terminal 200 may have the functions of the semantic analysis device 100 . That is, terminal 200 having the functions of semantic analysis device 100 may function as semantic analysis device 100 .

次に、図3~図5を参照して、意味解析装置100と端末200の構成について説明する。まず、意味解析装置100の構成について説明する。図3に示すように、意味解析装置100は、記憶部110と、制御部120と、通信部130と、これらを相互に接続するシステムバス(図示省略)と、を備えている。 Next, configurations of semantic analysis apparatus 100 and terminal 200 will be described with reference to FIGS. 3 to 5. FIG. First, the configuration of the semantic analysis device 100 will be described. As shown in FIG. 3, the semantic analysis apparatus 100 includes a storage unit 110, a control unit 120, a communication unit 130, and a system bus (not shown) interconnecting these units.

記憶部110は、ROM(Read Only Memory)、RAM(Random Access Memory)等を備える。RAMは制御部120のCPU(Central Processing Unit)のワークエリアとして使用される。ROMは、制御部120のCPUが実行するプログラムを記憶し、プログラム実行の際に使用される各種データを記憶する。 The storage unit 110 includes a ROM (Read Only Memory), a RAM (Random Access Memory), and the like. The RAM is used as a work area for a CPU (Central Processing Unit) of the controller 120 . The ROM stores programs executed by the CPU of the control unit 120, and stores various data used when executing the programs.

具体的に、記憶部110は、書類データ111、マスタフォーマット112、ルールベースモデル113、学習モデル114、貿易オントロジ115を記憶する。 Specifically, storage unit 110 stores document data 111 , master format 112 , rule base model 113 , learning model 114 , and trade ontology 115 .

書類データ111は、後述する第2エンティティ抽出部125bが使用する学習モデル114を生成する際にユーザにより入力されるデータである。書類データ111は、例えば、過去のL/Cデータ、P/Oデータなどである。 The document data 111 is data input by the user when generating a learning model 114 used by the second entity extraction unit 125b, which will be described later. The document data 111 is, for example, past L/C data, P/O data, and the like.

マスタフォーマット112は、構造化データを生成するための雛形となるデータであって、予め記憶部110に記憶される。図4にマスタフォーマット112の例を示す。図4に示すように、マスタフォーマット112には、「Products」、「Quantity」、「Unit Price」など、L/Cデータから抽出され意味付けされるべきエンティティの分類名により構成される。意味解析システム1は、当該マスタフォーマット112に、抽出して意味づけしたエンティティを入力することにより、構造化データを生成する。 The master format 112 is data that serves as a template for generating structured data, and is stored in advance in the storage unit 110 . An example of the master format 112 is shown in FIG. As shown in FIG. 4, the master format 112 is composed of classification names of entities to be extracted from L/C data and given meanings, such as "Products", "Quantity", and "Unit Price". The semantic analysis system 1 generates structured data by inputting the extracted and semantic entities into the master format 112 .

ルールベースモデル113は、後述する第1エンティティ抽出部125aがエンティティを抽出するための規則を示すモデルであり、当該ルールベースモデル113には、L/Cデータから抽出すべき項目データがユーザにより登録されている。また、ルールベースモデル113には、例えば、非構造化データ内の「JPY」、「USD」など所定の文字列に通貨タグを付与し、通貨タグが付与された文字列の前又は後の数字を「金額」として抽出する、等のエンティティを抽出するための規則がユーザにより記述される。ルールベースモデル113は、予め記憶部110に記憶される。 The rule base model 113 is a model indicating rules for extracting entities by the first entity extraction unit 125a, which will be described later. Item data to be extracted from the L/C data is registered in the rule base model 113 by the user. It is Also, in the rule-based model 113, for example, a predetermined character string such as "JPY" or "USD" in the unstructured data is given a currency tag, and numbers before or after the character string to which the currency tag is given are added. is written by the user for extracting entities such as extracting as "amount". The rule base model 113 is stored in the storage unit 110 in advance.

学習モデル114は、後述する第2エンティティ抽出部125bがエンティティを抽出する際に使用されるモデルである。学習モデル114は、書類データ111に記憶された過去のL/Cデータ、P/Oデータ等に基づいて機械学習が行われることで生成される。機械学習は、例えば、NCRF(Neural Conditional Random Fields)などの教師有り学習アルゴリズムにより実行される。書類データ111に記憶されたL/Cデータは当該機械学習における入力データとして使用され、P/Oデータは商品名、型番などの正解データとして使用される。 The learning model 114 is a model used when a second entity extraction unit 125b, which will be described later, extracts entities. The learning model 114 is generated by performing machine learning based on the past L/C data, P/O data, etc. stored in the document data 111 . Machine learning is performed by a supervised learning algorithm such as NCRF (Neural Conditional Random Fields). The L/C data stored in the document data 111 is used as input data in the machine learning, and the P/O data is used as correct data such as product names and model numbers.

貿易オントロジ115は、L/C決済におけるエンティティの定義(クラス)、クラス間の関係を示す関係情報等のデータを含む。図5に、L/Cの貿易オントロジ115の一例を示す。図5に示す通り、貿易オントロジ115は、「Products」、「Quantity」、「Unit Price」などのクラスが記述され、さらに「Products」には、「Category」、「Product Name」、「Model」が属するという関係情報が木構造で表される。貿易オントロジ115は、予め設計されて、記憶部110に記憶される。貿易オントロジ115は、後述するセマンティック解析部122が、エンティティに意味を付与する際に使用される。 The trade ontology 115 includes data such as entity definitions (classes) in L/C settlement and relationship information indicating relationships between classes. FIG. 5 shows an example of L/C's trade ontology 115 . As shown in FIG. 5, the trade ontology 115 describes classes such as "Products", "Quantity", and "Unit Price", and "Products" includes "Category", "Product Name", and "Model". Relational information of belonging is represented by a tree structure. Trade ontology 115 is designed in advance and stored in storage unit 110 . The trade ontology 115 is used when the semantic analysis unit 122, which will be described later, gives meaning to entities.

制御部120は、CPUを備え、記憶部110に記憶されたプログラムに従って動作し、当該プログラムに従った処理を実行する。制御部120は、記憶部110に記憶されたプログラムにより提供される主要な機能部として、エンティティ抽出部121と、セマンティック解析部122と、出力部123と、を備える。 Control unit 120 includes a CPU, operates according to a program stored in storage unit 110, and executes processing according to the program. The control unit 120 includes an entity extraction unit 121 , a semantic analysis unit 122 and an output unit 123 as main functional units provided by the programs stored in the storage unit 110 .

エンティティ抽出部121は、L/Cデータに含まれる非構造化データを抽出し、形態素解析を行なって、非構造化データを形態素単位に分解し、分解した形態素の中からエンティティを抽出する処理を行う機能部である。エンティティ抽出部121は、さらに、形態素解析部124、第1エンティティ抽出部125aと、第2エンティティ抽出部125bと、判定部126とを備える。これらの機能部が協働して、エンティティ抽出部121の機能を実現する。 The entity extraction unit 121 extracts unstructured data contained in the L/C data, performs morphological analysis, decomposes the unstructured data into morphemes, and extracts entities from the decomposed morphemes. It is a functional part that performs The entity extraction unit 121 further includes a morphological analysis unit 124, a first entity extraction unit 125a, a second entity extraction unit 125b, and a determination unit 126. These functional units cooperate to implement the functions of the entity extraction unit 121 .

形態素解析部124は、非構造化データを形態素毎に分割する機能部である。なお、分割された形態素毎のデータを形態素データという。また、形態素解析部124は、形態素データそれぞれに品詞情報を含めてもよく、後述する第1エンティティ抽出部125aや第2エンティティ抽出部125bにて、当該品詞情報に基づいてエンティティを抽出してもよい。 The morphological analysis unit 124 is a functional unit that divides unstructured data into morphemes. Data for each divided morpheme is called morpheme data. Further, the morphological analysis unit 124 may include part-of-speech information in each morpheme data, and the first entity extraction unit 125a and the second entity extraction unit 125b, which will be described later, may extract entities based on the part-of-speech information. good.

第1エンティティ抽出部125aは、ユーザにより定められたルールベースモデル113に基づいて、形態素解析部124により形態素解析がされた形態素データからエンティティを抽出する機能部である。具体的に、第1エンティティ抽出部125aは、ルールベースモデル113に登録された項目データに合致する形態素データをL/Cデータからエンティティとして抽出する。なお、第1エンティティ抽出部125aが抽出に用いるルールベースモデル113は、ユーザにより定められているため、第1エンティティ抽出部125aによれば、新たに取引対象となる商品や型番、商品名や型番が変更になった取引対象などの項目データを抽出することができる。 The first entity extraction unit 125a is a functional unit that extracts entities from the morphological data morphologically analyzed by the morphological analysis unit 124 based on the rule base model 113 defined by the user. Specifically, the first entity extraction unit 125a extracts morphological data that matches the item data registered in the rule base model 113 from the L/C data as an entity. Note that the rule base model 113 used for extraction by the first entity extraction unit 125a is defined by the user. It is possible to extract the item data such as the transaction target that has been changed.

第2エンティティ抽出部125bは、機械学習による学習モデル114に基づいて、形態素解析部124により形態素解析がされた形態素データからエンティティを抽出する機能部である。第2エンティティ抽出部125bが抽出に用いる学習モデル114は、過去のL/CデータとP/Oデータに基づいて機械学習を行うことにより生成されたものであるため、第1エンティティ抽出部125aと比較して、新たに取引対象となる商品や型番、商品名や型番が変更になった取引対象などの項目データを抽出するといった面では精度が落ちる可能性がある。しかし、過去のL/CデータとP/Oデータに基づいて機械学習されていることから、ユーザの入力ミスなどによる不完全なルールベースモデル113に基づいた抽出が行われることを防止することができる。 The second entity extraction unit 125b is a functional unit that extracts entities from morphological data that has been morphologically analyzed by the morphological analysis unit 124 based on the learning model 114 based on machine learning. Since the learning model 114 used for extraction by the second entity extraction unit 125b is generated by performing machine learning based on past L/C data and P/O data, the first entity extraction unit 125a and In comparison, there is a possibility that the accuracy may be lowered in terms of extracting item data such as products and model numbers that are newly traded targets, and trade targets whose product names and model numbers have changed. However, since machine learning is performed based on past L/C data and P/O data, it is possible to prevent extraction based on an incomplete rule-based model 113 due to user input errors. can.

判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bとの抽出結果に基づいて、抽出結果が妥当であるか否かを判定する機能部である。 The determination unit 126 is a functional unit that determines whether or not the extraction results are valid based on the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b.

具体的に、判定部126は、第1エンティティ抽出部125aにより抽出されたエンティティと、第2エンティティ抽出部125bにより抽出されたエンティティと、が一致しているか否かを判定し、一致していると判定した場合、抽出されたエンティティを妥当と判定する。 Specifically, the determining unit 126 determines whether or not the entity extracted by the first entity extracting unit 125a and the entity extracted by the second entity extracting unit 125b match. , the extracted entity is determined to be valid.

判定部126は、第1エンティティ抽出部125aにより抽出されたエンティティと、第2エンティティ抽出部125bにより抽出されたエンティティと、が一致していないと判定した場合、それぞれの抽出結果をセマンティック解析部122に出力する。セマンティック解析部122は、第1エンティティ抽出部125aと第2エンティティ抽出部125bのそれぞれの抽出結果を貿易オントロジ115と照合し、抽出結果の確からしさを示す総スコア値を算出し、判定部126に出力する。セマンティック解析部122による総スコア値の算出方法については後述する。判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bのそれぞれの抽出結果のうち、スコア値の高い抽出結果を妥当と判定する。 If the determination unit 126 determines that the entity extracted by the first entity extraction unit 125a and the entity extracted by the second entity extraction unit 125b do not match, the determination unit 126 sends the respective extraction results to the semantic analysis unit 122. output to The semantic analysis unit 122 compares the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b with the trade ontology 115, calculates the total score value indicating the likelihood of the extraction result, and sends it to the determination unit 126. Output. A method of calculating the total score value by the semantic analysis unit 122 will be described later. The determination unit 126 determines that an extraction result with a high score value among the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b is appropriate.

さらに、第1エンティティ抽出部125aと第2エンティティ抽出部125bのいずれか一方のみによりエンティティが抽出された場合、抽出結果をセマンティック解析部122に出力する。セマンティック解析部122は、抽出結果を貿易オントロジ115と照合して、総スコア値を算出し、判定部126に出力する。判定部126は、総スコア値が予め定められた閾値以上であれば、抽出結果を妥当と判定する。総スコア値が閾値を下回った場合、抽出ルールと閾値を緩和して、第1エンティティ抽出部125aと第2エンティティ抽出部125bに再度抽出させ、判定を行う。なお、閾値は、ユーザによる入力にて任意に設定可能であればよい。 Furthermore, when an entity is extracted by only one of the first entity extraction unit 125 a and the second entity extraction unit 125 b, the extraction result is output to the semantic analysis unit 122 . The semantic analysis unit 122 collates the extraction result with the trade ontology 115 to calculate a total score value and outputs it to the determination unit 126 . If the total score value is equal to or greater than a predetermined threshold value, the determination unit 126 determines that the extraction result is valid. When the total score value falls below the threshold, the extraction rule and threshold are relaxed, and the first entity extraction unit 125a and the second entity extraction unit 125b are allowed to re-extract for determination. Note that the threshold may be arbitrarily set by the user's input.

セマンティック解析部122は、エンティティ抽出部121により抽出されたエンティティに意味付けをする機能部である。具体的に、セマンティック解析部122は、エンティティ抽出部121により抽出されたエンティティを貿易オントロジ115のクラスに割り当てる処理を行う。エンティティを貿易オントロジ115のクラスに割り当てるルールは、深層学習などにより、予め正解データを学習したモデルにより実現される。例えば、セマンティック解析部122では、抽出されたエンティティ「ABC」を図5に示す貿易オントロジ115に入力することで、当該エンティティ「ABC」が「Name」に割り当てられるなどといったように、抽出したエンティティが貿易オントロジ115のいずれかのクラスに割り当てられる(分類される)。これにより、エンティティに意味が付与されることになる。 The semantic analysis unit 122 is a functional unit that gives meaning to entities extracted by the entity extraction unit 121 . Specifically, the semantic analysis unit 122 performs a process of assigning entities extracted by the entity extraction unit 121 to classes of the trade ontology 115 . Rules for assigning entities to classes in the trade ontology 115 are realized by a model that has learned correct data in advance by deep learning or the like. For example, in the semantic analysis unit 122, by inputting the extracted entity "ABC" into the trade ontology 115 shown in FIG. 5, the extracted entity is assigned to "Name". Assigned (classified) to one of the classes in the trade ontology 115 . This gives meaning to the entity.

また、セマンティック解析部122は、エンティティを貿易オントロジ115のクラスに割り当てる際、エンティティ抽出部121による抽出結果の確からしさを示す総スコア値を算出する機能を有している。貿易オントロジ115の各クラスには、クラスごとのスコア値が予め定義されている。セマンティック解析部122は、抽出結果に含まれる全てのエンティティを各クラスに分類するとともに、分類したクラスのスコア値を積算して、総スコア値を算出する。 The semantic analysis unit 122 also has a function of calculating a total score value indicating the likelihood of the extraction result by the entity extraction unit 121 when allocating an entity to a class of the trade ontology 115 . Each class of the trade ontology 115 has a predefined score value for each class. The semantic analysis unit 122 classifies all entities included in the extraction results into classes, and integrates the score values of the classified classes to calculate a total score value.

出力部123は、セマンティック解析部122により意味付けされたエンティティを、マスタフォーマット112内の対応する分類名に書き込むことにより、構造化データを生成する。 The output unit 123 generates structured data by writing the entities assigned meanings by the semantic analysis unit 122 to the corresponding classification names in the master format 112 .

これら各機能部が協働して、意味解析装置100において、非構造化データから構造化データを生成する機能を実現している。 These functional units cooperate to realize the function of generating structured data from unstructured data in the semantic analysis device 100 .

通信部130は、他の機器とデータ通信を行うためのデバイス(ネットワークカード等)で構成される。意味解析装置100は、通信部130を介して、端末200とデータの送受信を行う。 The communication unit 130 is composed of a device (network card, etc.) for performing data communication with other devices. The semantic analysis device 100 transmits and receives data to and from the terminal 200 via the communication unit 130 .

以上が、意味解析装置100の構成である。次に、本実施の形態における端末200の構成について説明する。端末200は、PC等の情報端末機器である。端末200は、図2に示すように、制御部20と、記憶部21と、通信部22と、表示部23と、入力部24と、を備え、意味解析装置100と通信可能に接続されている。 The above is the configuration of the semantic analysis apparatus 100 . Next, the configuration of terminal 200 according to the present embodiment will be described. The terminal 200 is an information terminal device such as a PC. As shown in FIG. 2, terminal 200 includes control unit 20, storage unit 21, communication unit 22, display unit 23, and input unit 24, and is communicably connected to semantic analysis apparatus 100. there is

制御部20は、CPU等で構成される。制御部20は、記憶部21に記憶されたプログラムに従って動作し、プログラムに従った処理を実行する。 The control unit 20 is composed of a CPU and the like. The control unit 20 operates according to a program stored in the storage unit 21 and executes processing according to the program.

記憶部21は、ROM、RAM等で構成され、制御部20のCPUが実行するプログラム及び必要なデータを記憶する。 The storage unit 21 is composed of ROM, RAM, etc., and stores programs executed by the CPU of the control unit 20 and necessary data.

通信部22は、他の機器とデータ通信を行うためのデバイス(ネットワークカード等)で構成される。端末200は、通信部22を介して、意味解析装置100等とデータの送受信を行う。 The communication unit 22 is composed of a device (network card, etc.) for performing data communication with other devices. The terminal 200 transmits and receives data to and from the semantic analysis device 100 and the like via the communication unit 22 .

表示部23は、液晶ディスプレイや有機EL(Electro-Luminescence)等のディスプレイで構成され、意味解析装置100から受信したL/Cデータ等を表示する。 The display unit 23 is configured by a display such as a liquid crystal display or an organic EL (Electro-Luminescence), and displays L/C data or the like received from the semantic analysis apparatus 100 .

入力部24は、キーボード、マウス、タッチパネル等で構成され、L/Cデータ等の入力を受け付ける。 The input unit 24 is composed of a keyboard, mouse, touch panel, etc., and receives inputs such as L/C data.

以上が、端末200の構成である。続いて意味解析装置100の動作について、図を参照して説明する。まず、意味解析システム1の動作としての構造化処理について、図6を参照して説明する。なお、この例では、説明をわかりやすくするため、L/Cデータとして含まれる非構造化データが図6(B)に示すL/Cデータであり、図6(C)に示す構造化データを生成する場合を例に説明する。なお、図6(B)に示すL/Cデータは、銀行間の国際金融取引に関するネットワークシステムであるSWIFT(Society for Worldwide Interbank Financial Telecommunication)により生成されたものである。 The above is the configuration of the terminal 200 . Next, the operation of the semantic analysis device 100 will be described with reference to the drawings. First, structuring processing as an operation of the semantic analysis system 1 will be described with reference to FIG. In this example, in order to make the explanation easier to understand, the unstructured data included as the L/C data is the L/C data shown in FIG. 6(B), and the structured data shown in FIG. 6(C) is A case of generating will be described as an example. The L/C data shown in FIG. 6B is generated by SWIFT (Society for Worldwide Interbank Financial Telecommunications), which is a network system for international financial transactions between banks.

ユーザが端末200を操作し、入力部24にL/Cデータ、P/Oデータを入力すると、当該L/Cデータ、P/Oデータは、意味解析装置100へ送信される。当該構造化処理は、端末200からL/Cデータ、P/Oデータを受信すると実行が開始される。なお、ユーザによる操作により実行が開始されてもよい。また、この例では、過去に取引対象となった商品名(図示する「XXXX」)と型番(「V1」)については、それぞれを正解データとして学習モデル114に学習させているものの、新たな取引対象である商品名「YYYY」および型番「400」については学習モデル114に登録されていないものとする。また、ルールベースモデル113には、いずれも登録されているものとする。すなわち、この例では、第1エンティティ抽出部125aによる抽出結果と第2エンティティ抽出部125bによる抽出結果が異なる場合を例に説明する。 When the user operates terminal 200 and inputs L/C data and P/O data into input unit 24 , the L/C data and P/O data are transmitted to semantic analysis apparatus 100 . Execution of the structuring process is started when L/C data and P/O data are received from the terminal 200 . Execution may be started by a user's operation. In this example, the product name ("XXXX" in the figure) and model number ("V1") that have been traded in the past are learned by the learning model 114 as correct data, respectively. It is assumed that the target product name “YYYY” and model number “400” are not registered in the learning model 114 . It is also assumed that both are registered in the rule base model 113 . That is, in this example, a case where the extraction result by the first entity extraction unit 125a and the extraction result by the second entity extraction unit 125b are different will be described as an example.

図6(A)に示す当該構造化処理を開始すると、エンティティ抽出部121は、L/Cデータから非構造化データを取得する(ステップS11)。上述したように、L/Cデータには、構造化データのL/Cデータと非構造化データのL/Cデータとが含まれており、ステップS11では、当該L/Cデータ内の定められた箇所に記載されている識別情報を判定して非構造化データのL/Cデータを取得する。具体的に、図6(B)に示す「<45A:Description of・・・Services>」は、SWIFTにより付与されたメッセージであり、「45A」が識別情報に該当する。ステップS11では、当該識別情報を確認し、当該識別情報に対応するL/Cデータが構造化データであるか非構造化データであるかを判定する。なお、いずれの識別情報に対応するL/Cデータが非構造化データであるかについては予め定められていればよい。取得した非構造化データは、形態素解析部124に出力される。 When the structuring process shown in FIG. 6A is started, the entity extraction unit 121 acquires unstructured data from the L/C data (step S11). As described above, the L/C data includes L/C data of structured data and L/C data of unstructured data. By determining the identification information described in the portion marked with the unstructured data, the L/C data of the unstructured data is obtained. Specifically, “<45A: Description of Services>” shown in FIG. 6B is a message assigned by SWIFT, and “45A” corresponds to identification information. In step S11, the identification information is confirmed and it is determined whether the L/C data corresponding to the identification information is structured data or unstructured data. Note that it is only necessary to determine in advance whether the L/C data corresponding to which identification information is unstructured data. The acquired unstructured data is output to the morphological analysis unit 124 .

図6(A)に示すステップS11の処理を実行した後、形態素解析部124は、非構造化データを解析し、形態素毎の形態素データに分割する(ステップS12)。なお、上述したように、ステップS12の処理では、分割したそれぞれの形態素データに品詞を付与してもよい。形態素解析部124による解析結果は、第1エンティティ抽出部125aと第2エンティティ抽出部125bに出力される。具体的に、ステップS12の処理では、図6(B)に示すL/Cデータについて、「ANIMAL」、「FEED」、「SUPPLEMENT」、「+」、「YYYY」、「400」、「,」、「QTY」、「:」、「2004」などの形態素データに分割し(図7(A)参照)、第1エンティティ抽出部125aと第2エンティティ抽出部125bに出力する。なお、品詞を付与する場合、例えばそれぞれの形態素データに対して「名詞」、「前置詞」、「その他」などといった品詞を対応付ければよい。 After executing the process of step S11 shown in FIG. 6A, the morphological analysis unit 124 analyzes the unstructured data and divides it into morphological data for each morpheme (step S12). As described above, in the process of step S12, each divided morpheme data may be given a part of speech. The analysis result by the morphological analysis unit 124 is output to the first entity extraction unit 125a and the second entity extraction unit 125b. Specifically, in the process of step S12, for the L/C data shown in FIG. , “QTY”, “:”, and “2004” (see FIG. 7A), and output to the first entity extraction unit 125a and the second entity extraction unit 125b. When giving a part of speech, for example, each morpheme data may be associated with a part of speech such as "noun", "preposition", or "other".

次に、第1エンティティ抽出部125aと第2エンティティ抽出部125bは、形態素解析部124により形態素解析されたデータを受信すると、形態素解析されたデータからエンティティを抽出する処理を行う(ステップS13)。エンティティ抽出処理(ステップS13)の詳細については、後述する。 Next, upon receiving the data morphologically analyzed by the morphological analysis unit 124, the first entity extraction unit 125a and the second entity extraction unit 125b perform processing for extracting entities from the morphologically analyzed data (step S13). Details of the entity extraction process (step S13) will be described later.

セマンティック解析部122は、ステップS13のエンティティ抽出処理により抽出されたエンティティを、深層学習などにより予め正解データを学習したモデルのルールに基づいて、貿易オントロジ115のクラスに割り当てるセマンティック解析処理を行う(ステップS14)。ステップS14の処理の詳細については、後述するエンティティ抽出処理(ステップS13)のステップS107で説明する。セマンティック解析部122により、エンティティが、エンティティの定義を示すクラスに割り当てられることによって、エンティティに意味が付与されることになる。なお、当該ステップS14の処理は、後述する図8のステップS105の処理が実行された場合に実行されればよく、ステップS109やS112の処理が行われた場合には、総スコア値の算出の際に各エンティティが各クラスに割り当てられていることから、当該ステップS14の処理をスキップしてステップS15の処理に移行すればよい。セマンティック解析部122は、ステップS14の処理(図8のステップS109やS112の処理が行われた場合についても同様)により得られる、エンティティとそれに対応する分類を示す解析結果を、記憶部110に記憶させる。また、セマンティック解析部122は、エンティティとそれに対応する分類を示す解析結果を、記憶部110に記憶させた場合、当該解析結果に基づく学習を行い、学習モデル114および貿易オントロジ115の内容を更新する。 The semantic analysis unit 122 performs a semantic analysis process in which the entities extracted by the entity extraction process in step S13 are assigned to classes of the trade ontology 115 based on the rules of the model in which correct data has been learned in advance by deep learning or the like (step S14). Details of the processing in step S14 will be described in step S107 of the entity extraction processing (step S13) described later. The semantic analysis unit 122 assigns meaning to the entity by assigning the entity to a class that indicates the definition of the entity. Note that the processing of step S14 may be executed when the processing of step S105 in FIG. 8 described later is executed. Since each entity is assigned to each class, the process of step S14 may be skipped and the process of step S15 may be performed. The semantic analysis unit 122 stores, in the storage unit 110, the analysis result indicating the entity and its corresponding classification, which is obtained by the processing of step S14 (the same applies when the processing of steps S109 and S112 of FIG. 8 is performed). Let In addition, when the semantic analysis unit 122 stores the analysis result indicating the entity and its corresponding classification in the storage unit 110, it performs learning based on the analysis result, and updates the contents of the learning model 114 and the trade ontology 115. .

次に、出力部123は、セマンティック解析部122により意味付けされたエンティティを、マスタフォーマット112内の対応する分類名に書き込むことにより、図6(C)に示す構造化データを生成して端末200に出力(送信)し(ステップS15)、処理を終了する。 Next, the output unit 123 writes the entity assigned meaning by the semantic analysis unit 122 to the corresponding classification name in the master format 112 to generate the structured data shown in FIG. (step S15), and the process ends.

続いて、図8を参照して、図6のステップS13にて実行されるエンティティ抽出処理(ステップS13)について説明する。 Next, the entity extraction process (step S13) executed in step S13 of FIG. 6 will be described with reference to FIG.

図8に示すエンティティ抽出処理において、第1エンティティ抽出部125aは、形態素解析部124により形態素解析されたデータ(形態素データ)が入力されると、記憶部110に予め記憶されたルールベースモデル113に基づいて、エンティティを抽出する(ステップS101)。第1エンティティ抽出部125aは、エンティティを抽出することができた場合、抽出結果を判定部126へ出力する。具体的に、ステップS101では、図7(A)に示すデータが入力されると、ルールベースモデル113に登録されたデータと合致するデータを抽出する。この例では、上述したように、ルールベースモデル113には取引対象である商品名「YYYY」と「XXXX」と型番「400」と「V1」とのそれぞれが登録されていることから、ステップS101における抽出結果としては、図7(B-1)に示すようにそれぞれの商品名および型番に対応するデータが含まれることとなる。 In the entity extraction process shown in FIG. 8, when data (morphological data) morphologically analyzed by the morphological analysis unit 124 is input, the first entity extraction unit 125a converts the rule base model 113 pre-stored in the storage unit 110 into Based on this, the entity is extracted (step S101). The first entity extraction unit 125a outputs the extraction result to the determination unit 126 when the entity can be extracted. Specifically, in step S101, when the data shown in FIG. 7A is input, data that matches the data registered in the rule base model 113 is extracted. In this example, as described above, the traded product names "YYYY" and "XXXX" and model numbers "400" and "V1" are registered in the rule-based model 113. Therefore, step S101 As the extraction result in , data corresponding to each product name and model number are included as shown in FIG. 7(B-1).

また、ステップS101の処理とは別に、第2エンティティ抽出部125bは、形態素解析部124により形態素解析されたデータが入力されると、記憶部110に予め記憶された学習モデル114に基づいて、エンティティを抽出する(ステップ102)。第2エンティティ抽出部125bは、エンティティを抽出することができた場合、抽出結果を判定部126へ出力する。具体的に、ステップS102では、図7(A)に示すデータが入力されると、学習モデル114に登録されたデータと合致するデータを抽出する。この例では、上述したように、学習モデル114には取引対象である商品名「XXXX」と型番「V1」とが登録されているものの、商品名「YYYY」および型番「400」については登録されていないことから、ステップS102における抽出結果としては、図7(B-2)に示すように商品名「XXXX」と型番「V1」に対応するデータが含まれるものの、商品名「YYYY」および型番「400」に対応するデータについては含まれないこととなる。 In addition to the process of step S101, when the data morphologically analyzed by the morphological analysis unit 124 is input, the second entity extraction unit 125b extracts the entity based on the learning model 114 stored in advance in the storage unit 110. is extracted (step 102). The second entity extraction unit 125b outputs the extraction result to the determination unit 126 when the entity can be extracted. Specifically, in step S102, when the data shown in FIG. 7A is input, data that matches the data registered in the learning model 114 is extracted. In this example, as described above, the learning model 114 registers the product name "XXXX" and the model number "V1" to be traded, but the product name "YYYY" and the model number "400" are not registered. Therefore, the extraction result in step S102 includes data corresponding to the product name "XXXX" and model number "V1" as shown in FIG. 7B-2, but the product name "YYYY" and model number Data corresponding to "400" will not be included.

次に、判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bから抽出結果を受信したか否かを確認する(ステップS103)。判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bの両方から抽出結果を受信したことを確認すると(ステップS103;両方から受信)、第1エンティティ抽出部125aと第2エンティティ抽出部125bの抽出結果が同じであるか否かを比較する(ステップS104)。 Next, the determination unit 126 checks whether or not extraction results have been received from the first entity extraction unit 125a and the second entity extraction unit 125b (step S103). When the determination unit 126 confirms that the extraction results have been received from both the first entity extraction unit 125a and the second entity extraction unit 125b (step S103; received from both), the first entity extraction unit 125a and the second entity extraction unit 125a It is compared whether the extraction result of the part 125b is the same (step S104).

判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bの抽出結果が同じであると判断すると(ステップS104;Yes)、それぞれの抽出結果は妥当であると判定し(ステップS105)、セマンティック解析部122に抽出結果を出力する(ステップS106)。 If the determination unit 126 determines that the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b are the same (step S104; Yes), it determines that each extraction result is valid (step S105). , the extraction result is output to the semantic analysis unit 122 (step S106).

判定部126は、ステップS104において、第1エンティティ抽出部125aと第2エンティティ抽出部125bの抽出結果が異なっていると判断すると(ステップS104;No)、第1エンティティ抽出部125aと第2エンティティ抽出部125bのそれぞれの抽出結果をセマンティック解析部122へ出力する。この例では、図7(B-1)および(B-2)に示すように、第1エンティティ抽出部125aと第2エンティティ抽出部125bの抽出結果が異なることから、それぞれの抽出結果がセマンティック解析部122へ出力されることとなる。セマンティック解析部122は、各抽出結果に含まれるエンティティを貿易オントロジ115と照合して、第1エンティティ抽出部125aと第2エンティティ抽出部125bの各抽出結果の総スコア値を算出する(ステップS107)。 If the determination unit 126 determines in step S104 that the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b are different (step S104; No), the first entity extraction unit 125a and the second entity extraction unit 125a Each extraction result of the unit 125 b is output to the semantic analysis unit 122 . In this example, as shown in FIGS. 7(B-1) and (B-2), since the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b are different, the respective extraction results are semantically analyzed. It will be output to the unit 122 . The semantic analysis unit 122 compares the entities included in each extraction result with the trade ontology 115, and calculates the total score value of each extraction result of the first entity extraction unit 125a and the second entity extraction unit 125b (step S107). .

具体的に、ステップS107では、セマンティック解析部122は、第1エンティティ抽出部125aと第2エンティティ抽出部125bにより抽出された各エンティティを、貿易オントロジ115のクラスに割り当てる処理を行う。例えば、数量を表す文字列である「QTY」の右側にある数字データが「数量」のクラスの「値」であるといった、予め定められたルールに基づいて学習された深層学習モデルを用いて、それぞれのデータをそれぞれのクラスに割り当てる。また、各クラスには、クラス毎にスコア値が定められており、セマンティック解析部122は、エンティティをクラスに割り当てることにより、割り当てたクラスのスコア値を加算する。 Specifically, in step S107, the semantic analysis unit 122 performs a process of assigning each entity extracted by the first entity extraction unit 125a and the second entity extraction unit 125b to a class of the trade ontology 115. For example, using a deep learning model learned based on predetermined rules, such as the numeric data on the right side of "QTY", which is a character string representing quantity, is the "value" of the "quantity" class, Assign each data to each class. A score value is set for each class, and the semantic analysis unit 122 adds the score value of the assigned class by assigning the entity to the class.

例えば、図9に示すように、セマンティック解析部122は、図7(B-1)の抽出結果から、「YYYY」を貿易オントロジ115の「品名」クラスに割り当てて5ptを加算し、「400」を「型番」クラスに割り当てて3pt加算し、「2004」を数量の「値」クラスに割り当てて3pt加算する、といった処理を、抽出した全てのエンティティに行う。セマンティック解析部122は、エンティティを割り当てたクラスのスコア値を全て加算することで、第1エンティティ抽出部125aの抽出結果の総スコア値を算出する。セマンティック解析部122は、同様の処理を、第2エンティティ抽出部125bの抽出結果にも行い、第2エンティティ抽出部125bの抽出結果の総スコア値を算出する。セマンティック解析部122は、算出した第1エンティティ抽出部125aと第2エンティティ抽出部125bの抽出結果に対する総スコア値を判定部126に出力する。この例では、第1エンティティ抽出部125aの抽出結果には、商品名「YYYY」および型番「400」が含まれるが、第2エンティティ抽出部125bの抽出結果には含まれない。よって、総スコア値は、第2エンティティ抽出部125bの抽出結果より、第1エンティティ抽出部125aの抽出結果の方が高いこととなる。 For example, as shown in FIG. 9, the semantic analysis unit 122 assigns "YYYY" to the "product name" class of the trade ontology 115 from the extraction result of FIG. is assigned to the "model number" class and added by 3 points, and "2004" is assigned to the quantity "value" class and added by 3 points. The semantic analysis unit 122 calculates the total score value of the extraction result of the first entity extraction unit 125a by adding all the score values of the classes to which the entities are assigned. The semantic analysis unit 122 performs similar processing on the extraction result of the second entity extraction unit 125b, and calculates the total score value of the extraction result of the second entity extraction unit 125b. The semantic analysis unit 122 outputs the calculated total score value for the extraction results of the first entity extraction unit 125 a and the second entity extraction unit 125 b to the determination unit 126 . In this example, the product name "YYYY" and the model number "400" are included in the extraction result of the first entity extraction unit 125a, but are not included in the extraction result of the second entity extraction unit 125b. Therefore, the total score value of the extraction result of the first entity extraction unit 125a is higher than that of the extraction result of the second entity extraction unit 125b.

図8へ戻り、ステップS107の処理を実行した後、判定部126は、セマンティック解析部122から各抽出結果の総スコア値を受信する。次に、判定部126は、受信した各抽出結果の総スコア値が予め定められた閾値以上か否かを比較し、いずれかの抽出結果の総スコア値が閾値以上であるかを判定する(ステップS108)。判定部126は、いずれかの抽出結果の総スコア値が閾値以上であると判断した場合(ステップS108;Yes)、総スコアが高い抽出結果を妥当であると判定する(ステップS109)。そして、判定部126は、妥当であると判定した抽出結果をセマンティック解析部122に出力する(ステップS106)。この例において、判定部126は、総スコア値が高い第1エンティティ抽出部125aの抽出結果を妥当であると判定し(ステップS109)、第1エンティティ抽出部125aの抽出結果をセマンティック解析部122に出力する(ステップS106)。 Returning to FIG. 8 , after executing the process of step S<b>107 , the determination unit 126 receives the total score value of each extraction result from the semantic analysis unit 122 . Next, the determination unit 126 compares whether the total score value of each extraction result received is equal to or greater than a predetermined threshold, and determines whether the total score value of any extraction result is equal to or greater than the threshold ( step S108). When determining that the total score value of any of the extraction results is equal to or greater than the threshold (step S108; Yes), the determination unit 126 determines that the extraction result with the high total score is appropriate (step S109). Then, the determination unit 126 outputs the extraction result determined to be valid to the semantic analysis unit 122 (step S106). In this example, the determination unit 126 determines that the extraction result of the first entity extraction unit 125a with a high total score value is valid (step S109), and sends the extraction result of the first entity extraction unit 125a to the semantic analysis unit 122. Output (step S106).

ステップS108に戻り、判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bの抽出結果のいずれもが閾値を下回っていると判断した場合(ステップS108;No)、例えば、ルールベースモデル113を更新したり、閾値を下げるなど、抽出ルールと閾値を緩和して(ステップS113)、ステップ101及びステップ102に戻り、再度処理を実行する。 Returning to step S108, when the determination unit 126 determines that both the extraction results of the first entity extraction unit 125a and the second entity extraction unit 125b are below the threshold (step S108; No), for example, the rule base The model 113 is updated, the threshold is lowered, and the extraction rule and threshold are relaxed (step S113), the process returns to steps 101 and 102, and the process is executed again.

ステップS103に戻り、判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bのいずれか一方のみから抽出結果を受信したと判断すると(ステップS103;一方から受信)、受信した抽出結果をセマンティック解析部122へ出力する。セマンティック解析部122は、受信した抽出結果に含まれるエンティティを貿易オントロジ115と照合して、総スコア値を算出する(ステップS110)。総スコア値は、上述したステップS107と同じ方法により算出される。判定部126は、セマンティック解析部122から抽出結果の総スコア値を受信すると、受信した総スコア値が、ユーザにより予め定められた閾値以上であるか否かを判定する(ステップS111)。 Returning to step S103, when the determination unit 126 determines that the extraction result has been received from only one of the first entity extraction unit 125a and the second entity extraction unit 125b (step S103; received from one), the received extraction result to the semantic analysis unit 122 . The semantic analysis unit 122 compares the entities included in the received extraction results with the trade ontology 115 to calculate a total score value (step S110). The total score value is calculated by the same method as in step S107 described above. Upon receiving the total score value of the extraction result from the semantic analysis unit 122, the determination unit 126 determines whether or not the received total score value is equal to or greater than a threshold value predetermined by the user (step S111).

判定部126は、総スコア値が予め定められた閾値以上であると判断すると(ステップS111;Yes)、抽出結果を妥当であると判定し(ステップS112)、抽出結果をセマンティック解析部122に出力する(ステップS106)。 If the determination unit 126 determines that the total score value is equal to or greater than the predetermined threshold value (step S111; Yes), it determines that the extraction result is valid (step S112), and outputs the extraction result to the semantic analysis unit 122. (step S106).

ステップS111において、判定部126は、総スコア値が予め定められた閾値を下回っていると判断すると(ステップS111;No)、抽出ルールと閾値を緩和して(ステップS113)、ステップ101及びステップ102に戻り、再度処理を実行する。 In step S111, when the determination unit 126 determines that the total score value is less than the predetermined threshold (step S111; No), it relaxes the extraction rule and the threshold (step S113), and performs steps 101 and 102. Go back and try again.

ステップS103に戻り、判定部126は、第1エンティティ抽出部125aと第2エンティティ抽出部125bのいずれからも抽出結果を受信しなかったと判断すると(ステップS103;受信せず)、抽出結果なしとして出力し、処理を終了する(ステップS114)。なお、抽出結果なしの場合、図6のステップS14およびS15の処理は実行されず、エラー処理として端末200に対して異常が発生した旨の出力がなされればよい。 Returning to step S103, when the determination unit 126 determines that the extraction result has not been received from either the first entity extraction unit 125a or the second entity extraction unit 125b (step S103; not received), the determination unit 126 outputs no extraction result. and terminates the process (step S114). If there is no extraction result, the processing of steps S14 and S15 in FIG. 6 is not executed, and an output to the effect that an abnormality has occurred is output to the terminal 200 as error processing.

以上により、意味解析装置100は、L/Cデータ内の非構造化データからエンティティを抽出し、貿易オントロジ115に基づいて、抽出したエンティティに意味づけを行うことにより、構造化データを生成することができる。 As described above, the semantic analysis device 100 extracts entities from the unstructured data in the L/C data, assigns meaning to the extracted entities based on the trade ontology 115, and generates structured data. can be done.

(変形例)
以上、本発明の実施の形態を説明したが、本発明は、上記の実施の形態に限定されず、様々な変形及び応用が可能である。例えば、意味解析装置100は、上記実施の形態で示した全ての技術的特徴を備えるものでなくてもよく、従来技術における少なくとも1つの課題を解決できるように、上記実施の形態で説明した一部の構成を備えたものであってもよい。また、下記の変形例それぞれについて、少なくとも一部を組み合わせてもよい。
(Modification)
Although the embodiments of the present invention have been described above, the present invention is not limited to the above embodiments, and various modifications and applications are possible. For example, the semantic analysis device 100 does not have to have all the technical features shown in the above embodiments. It may have a configuration of parts. Moreover, at least a part of each of the following modified examples may be combined.

上記実施の形態では、セマンティック解析部122による図6のステップS14の処理の後に、出力部123がステップS15の処理において構造化データを生成するものとして説明したが、これに限られない。上述した通り、L/Cデータには、構造化データと非構造化データの両方が含まれる。よって、例えば、構造化データに「合計金額」とその金額データが含まれている場合、セマンティック解析部122による解析結果の金額データと、構造化データの金額データと、が一致するか否かを確認する処理を、ステップS15の処理の前に含めてもよい。すなわち、金額データなど、貿易取引において重要な情報については、セマンティック解析部122によるステップS14の処理の正当性を、当該L/Cデータに含まれる構造化データと比較することで検証してもよい。そして、例えばステップS14の処理にて「合計金額」として意味付けられたデータが、当該L/Cデータに含まれる構造化データにより示される合計金額と一致している場合、ステップS15の処理を実行し、一致していない場合には異常が発生したことを、当該異常の内容とともに端末200に出力すればよい。なお、上述の確認する処理は、貿易取引において重要な情報に限られず、セマンティック解析部122による全ての解析結果に対して実行してもよいし、L/C決済に係る情報に、ユーザにより重要度(優先度)を予め定義しておき、重要度が高い情報に対してのみ実行するようにしてもよい。 In the above embodiment, the output unit 123 generates structured data in the process of step S15 after the process of step S14 of FIG. 6 by the semantic analysis unit 122, but the present invention is not limited to this. As mentioned above, L/C data includes both structured and unstructured data. Therefore, for example, when structured data includes "total amount" and its amount data, whether or not the amount data of the analysis result by the semantic analysis unit 122 matches the amount data of the structured data is checked. A confirmation process may be included before the process of step S15. That is, for information important in trade transactions such as amount data, the correctness of the processing of step S14 by the semantic analysis unit 122 may be verified by comparing it with the structured data included in the L/C data. . Then, for example, when the data assigned as "total amount" in the process of step S14 matches the total amount indicated by the structured data included in the L/C data, the process of step S15 is executed. If they do not match, the fact that an abnormality has occurred may be output to the terminal 200 together with the content of the abnormality. Note that the above-described confirmation processing is not limited to important information in trade transactions, and may be executed for all analysis results by the semantic analysis unit 122. Information related to L/C settlement may be checked for information important to the user. A degree (priority) may be defined in advance so that only information with a high degree of importance is executed.

上記実施の形態では、図8のステップS109において、第1エンティティ抽出部125aが抽出した全てのエンティティのスコア値の合計である総スコア値と、第2エンティティ抽出部125bが抽出した全てのエンティティのスコア値の合計である総スコア値とを比較する例(すなわち総スコア値同士を比較する例)を示したが、これは一例である。この他にも、例えば、第1エンティティ抽出部125aが抽出した一のエンティティのスコア値と、当該エンティティに対応する第2エンティティ抽出部125bが抽出した一のエンティティのスコア値とを比較するなど、一のエンティティ毎にスコア値を比較し、スコア値の高いエンティティを妥当性のあるエンティティとして判定してもよい。そして、妥当性のあるエンティティを組合せ、構造化データを生成すればよい。これによれば、それぞれのエンティティについて妥当性が判定されることから、より精度の高い構造化データを生成することができる。 In the above embodiment, in step S109 of FIG. 8, the total score value, which is the sum of the score values of all the entities extracted by the first entity extraction unit 125a, and the total score value of all the entities extracted by the second entity extraction unit 125b Although the example of comparing the total score value, which is the sum of the score values (that is, the example of comparing the total score values), this is just an example. In addition, for example, the score value of one entity extracted by the first entity extraction unit 125a is compared with the score value of one entity extracted by the second entity extraction unit 125b corresponding to the entity. Score values may be compared for each entity, and an entity with a high score value may be determined as a valid entity. Then, combine valid entities to generate structured data. According to this, since validity is determined for each entity, structured data with higher accuracy can be generated.

上記実施の形態では、貿易オントロジ115が、L/Cのオントロジである場合について説明したが、これに限られない。貿易オントロジ115は、L/Cの他、必要書類に対応するオントロジを含んでいてもよい。具体的には、I/V(Invoice)、P/L(Packing List)、S/I(Shipping Instruction)、I/P(Insurance Policy)、B/L(Bill of Lading)、B/E(Bill of Exchange)、S/A(Shipping Application)、A/N(Application for Negotiation of Documentary Bill)などといった必要書類それぞれのオントロジをさらに備え、書類間のクラスの関係性について定めていてもよい。図10は、貿易オントロジ115が、I/VオントロジとL/Cオントロジとを備える場合の一例を示している。図10(A)に示す通り、L/Cオントロジの「Order Detail」クラスとI/Vオントロジの「Goods Detail」クラスとが、クラスが同一の意味であることを示す「sameAs」の関係情報により関係づけられる。これにより、L/Cでは「Order Detail」として分類される情報がI/Vにおいては「Goods Detail」として分類されるといったように、異なる文書間の意味(分類)同士を繋げることができ、図6(C)に示す構造化されたL/Cデータから、図10(B)に示すI/Vデータを作成することができる。なお、この場合、I/V用のマスタフォーマット112が記憶部110に記憶されていればよい。セマンティック解析部122が、L/CオントロジとI/Vオントロジとの関係情報を含む貿易オントロジ115に基づいて、図6(C)に示す「Product Name」の分類である「YYYY」といった構造化されたL/Cデータの情報を、I/Vオントロジの「Goods」クラスの下のクラスである「name」に割り当て、出力部123が、割り当てられた情報をI/Vのマスタフォーマット112に書き込むことにより、I/Vデータを生成する(図10(B)に示す「Goods name」)。これによれば、生成した構造化データから必要書類を容易に生成することができ、L/C決済における手続きを円滑化することができる。なお、L/Cデータは、特許請求の範囲における貿易取引文書データの一例であり、I/Vデータは、特許請求の範囲における貿易必要データの一例である。また、L/Cオントロジは、特許請求の範囲における信用状解析オントロジの一例であり、I/Vオントロジは、特許請求の範囲における必要情報オントロジの一例である。 In the above embodiment, trade ontology 115 is an L/C ontology, but it is not limited to this. Trade ontology 115 may include an ontology corresponding to required documents in addition to L/C. Specifically, I/V (Invoice), P/L (Packing List), S/I (Shipping Instruction), I/P (Insurance Policy), B/L (Bill of Lading), B/E (Bill of Exchange), S/A (Shipping Application), A/N (Application for Negotiation of Documentary Bill), and the like, and may further include ontologies for each required document to define the class relationships between the documents. FIG. 10 shows an example where trade ontology 115 comprises an I/V ontology and an L/C ontology. As shown in FIG. 10(A), the "Order Detail" class of the L/C ontology and the "Goods Detail" class of the I/V ontology have the same meaning according to the relationship information of "sameAs" indicating that the classes have the same meaning. be related. As a result, information classified as "Order Detail" in L/C can be classified as "Goods Detail" in I/V. From the structured L/C data shown in 6(C), the I/V data shown in FIG. 10(B) can be created. In this case, it is sufficient that the I/V master format 112 is stored in the storage unit 110 . Based on the trade ontology 115 including the relationship information between the L/C ontology and the I/V ontology, the semantic analysis unit 122 generates structured data such as "YYYY", which is the classification of the "Product Name" shown in FIG. 6(C). The information of the L / C data obtained is assigned to "name" which is a class under the "Goods" class of the I / V ontology, and the output unit 123 writes the assigned information to the I / V master format 112 generates I/V data (“Goods name” shown in FIG. 10B). According to this, the necessary documents can be easily generated from the generated structured data, and the procedure for L/C settlement can be facilitated. The L/C data is an example of trade transaction document data in the scope of claims, and the I/V data is an example of necessary trade data in the scope of claims. The L/C ontology is an example of a letter of credit analysis ontology in the scope of claims, and the I/V ontology is an example of a necessary information ontology in the scope of claims.

また、貿易オントロジ115は、個別会社(取引者)ごとの貿易取引文書データのフォーマットに対応する個別オントロジと、貿易オントロジ115と個別オントロジのクラスを対応付けるための関係情報と、を含んでも良い。例えば、個別オントロジは、I/V用のオントロジであって、個別会社ごとの分類名により定義されたクラスにより構成される。図11(A)は、貿易オントロジ115が、図10(A)に示すI/Vオントロジに加えて、企業α社及びβ社のI/Vオントロジを含む場合の一例を示す。図11(A)に示す通り、I/Vオントロジの「 Goods Detail」クラスと、α社のI/Vオントロジのクラス名「001」とβ社のI/Vオントロジのクラス名「Product Detail」とが同一であることを示す「sameAs」の関係情報により関係付けられている。これにより、α社のI/Vデータの「001」に分類される情報とβ社のI/Vデータの「Products Detail」に分類される情報は、I/Vオントロジの「Goods Detail」に分類される情報と同じ意味をもつことを定義することができる。これにより、α社とβ社のI/Vデータのフォーマットが異なる場合、図11(B)に示す通り、α社のI/Vデータからβ社のフォーマットに合致するI/Vデータを生成することが可能となる。この場合の個別オントロジおよび関係情報は、書類データ111に記憶された個別会社ごとの過去の貿易取引文書データから機械学習により生成されればよく、α社およびβ社のI/V用のマスタフォーマット112が記憶部110に記憶されていればよい。セマンティック解析部122は、α社のI/Vデータの情報を、関係情報により対応付けられた貿易オントロジ115のI/Vオントロジのクラスに割り当てる。出力部123は、割り当てられた情報を、β社のI/Vのマスタフォーマット112に書き込むことにより、I/Vデータを生成する。このように、会社毎にフォーマットや項目名が異なる必要書類を使用している場合であっても、貿易オントロジ115を介して、ある会社の必要書類データを別の会社のフォーマットに変換した必要書類データを生成することができる。なお、I/Vオントロジは、特許請求の範囲における必要情報基礎オントロジの一例であり、企業α社及びβ社のI/Vオントロジは、特許請求の範囲における必要情報個別オントロジの一例である。 The trade ontology 115 may also include an individual ontology corresponding to the format of trade transaction document data for each individual company (trader), and relationship information for associating the trade ontology 115 with the class of the individual ontology. For example, an individual ontology is an ontology for I/V and is composed of classes defined by a classification name for each individual company. FIG. 11(A) shows an example in which the trade ontology 115 includes I/V ontologies of companies α and β in addition to the I/V ontology shown in FIG. 10(A). As shown in FIG. 11(A), the "Goods Detail" class of the I/V ontology, the class name "001" of the I/V ontology of company α, and the class name of "Product Detail" of the I/V ontology of company β. are related by the relationship information of "sameAs" indicating that the two are the same. As a result, the information classified as "001" in the I/V data of Company α and the information classified as "Products Detail" in the I/V data of Company β are classified as "Goods Detail" in the I/V ontology. can be defined to have the same meaning as the information provided. As a result, when the formats of the I/V data of company α and company β are different, as shown in FIG. 11B, I/V data matching the format of company β is generated from the I/V data of company α. becomes possible. In this case, the individual ontology and related information may be generated by machine learning from the past trade transaction document data for each individual company stored in the document data 111, and the I/V master format for α company and β company 112 is stored in the storage unit 110 . The semantic analysis unit 122 assigns the information of the I/V data of company α to the I/V ontology class of the trade ontology 115 associated with the relationship information. The output unit 123 generates I/V data by writing the assigned information into the I/V master format 112 of the β company. In this way, even if each company uses required documents with different formats and item names, the required documents data of one company can be converted into the format of another company through the trade ontology 115. data can be generated. The I/V ontology is an example of the necessary information basic ontology in the scope of claims, and the I/V ontology of company α and company β is an example of the individual necessary information ontology in the scope of claims.

また、上記実施の形態では、意味解析装置100における出力部123の機能により、セマンティック解析部122で意味付けされたエンティティを、マスタフォーマット112内の対応する分類名に書き込む例、すなわち意味解析装置100にて構造化データを作成する例を示したが、これは一例である。例えば、意味解析装置100では構造化データを生成せず、端末200の側にて生成してもよい。この場合、端末200にマスタフォーマット112を記憶させておき、意味解析装置100は、セマンティック解析部122により意味付けされたエンティティを端末200へ出力(送信)し、端末200の側にて、受信したエンティティを、マスタフォーマット112内の対応する分類名に書き込めばよい。また、端末200は、マスタフォーマット112によらずに、セマンティック解析部122の解析結果に含まれる分類とエンティティとを対応付けて表示することで構造化データを生成してもよい。 In the above embodiment, the function of the output unit 123 in the semantic analysis device 100 writes the entity given meaning by the semantic analysis unit 122 to the corresponding classification name in the master format 112. Although an example of creating structured data was shown in , this is just an example. For example, the structured data may not be generated by the semantic analysis device 100 but may be generated by the terminal 200 side. In this case, the master format 112 is stored in the terminal 200, the semantic analysis device 100 outputs (transmits) the entity given meaning by the semantic analysis unit 122 to the terminal 200, and the terminal 200 receives the entity. Entities can be written to the corresponding taxonomy in master format 112 . Alternatively, terminal 200 may generate structured data by displaying the classifications and entities included in the analysis result of semantic analysis unit 122 in association with each other, regardless of master format 112 .

また、上記実施の形態では、L/Cデータを入力データとして使用し、P/Oデータを正解データとして使用する例を示したが、商品名、型番などのリストが記憶部110に記憶され、セマンティック解析部122が該リストを辞書として参照することにより、P/Oデータを使用しなくても解が導き出せる場合は、P/Oデータを入力しなくてもよい。 Further, in the above embodiment, an example was shown in which L/C data was used as input data and P/O data was used as correct data. If the semantic analysis unit 122 can derive a solution without using the P/O data by referring to the list as a dictionary, the P/O data need not be input.

また、上記実施の形態では、L/Cが英語により記載されている例により説明したが、日本語その他の言語により記載されていてもよい。 Also, in the above embodiment, the L/C is written in English, but it may be written in Japanese or another language.

また、上記実施の形態では、通知銀行と買取銀行が同一である場合について、説明したが、それぞれ別々の銀行であってもよい。 Also, in the above embodiment, the case where the advising bank and the negotiating bank are the same has been described, but they may be different banks.

また、上記実施の形態では、貿易オントロジ115が、1対多の関係を示す木構造で表される場合について説明したが、それに限られず、多対多の関係を示す構造により表されてもよい。 Further, in the above embodiment, the trade ontology 115 is represented by a tree structure showing a one-to-many relationship, but it is not limited to this, and may be represented by a structure showing a many-to-many relationship. .

なお、意味解析装置100及び端末200は、専用の装置によらず、通常のコンピュータを用いて実現可能である。例えば、コンピュータに上述のいずれかを実行するためのプログラムを格納した記録媒体から該プログラムをコンピュータにインストールすることにより、上述の処理を実行する意味解析装置100及び端末200を構成してもよい。また、複数のコンピュータが協働して動作することによって、1つの意味解析装置100又は端末200を構成しても良い。 Note that the semantic analysis apparatus 100 and the terminal 200 can be realized using a normal computer without using a dedicated apparatus. For example, the semantic analysis apparatus 100 and the terminal 200 that execute the above processes may be configured by installing the program in the computer from a recording medium that stores the program for executing any of the above processes. Also, a single semantic analysis apparatus 100 or terminal 200 may be configured by a plurality of computers working together.

また、上述の機能を、OS(Operating System)とアプリケーションとの分担、またはOSとアプリケーションとの協同により実現する場合等には、OS以外の部分のみを媒体に格納してもよい。 Further, when the above-described functions are realized by sharing the responsibility between an OS (Operating System) and an application, or by cooperation between the OS and an application, only parts other than the OS may be stored in the medium.

また、搬送波にプログラムを重畳し、通信ネットワークを介して配信することも可能である。例えば、通信ネットワーク上の掲示板(BBS、Bulletin Board System)に当該プログラムを掲示し、ネットワークを介して当該プログラムを配信してもよい。そして、これらのプログラムを起動し、オペレーティングシステムの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。 It is also possible to superimpose a program on a carrier wave and distribute it via a communication network. For example, the program may be posted on a bulletin board (BBS, Bulletin Board System) on a communication network and distributed via the network. These programs may be activated and executed in the same manner as other application programs under the control of the operating system so that the above processes can be executed.

1 意味解析システム、100 意味解析装置、200 端末、210 ネットワーク、110 記憶部、111 書類データ、112 マスタフォーマット、113 ルールベースモデル、114 学習モデル、115 貿易オントロジ、121 エンティティ抽出部、122 セマンティック解析部、123 出力部、124 形態素解析部、125a 第1エンティティ抽出部、125b 第2エンティティ抽出部、126 判定部、130 通信部、20 制御部、21 記憶部、22 通信部、23 表示部、24 入力部 1 semantic analysis system, 100 semantic analysis device, 200 terminal, 210 network, 110 storage unit, 111 document data, 112 master format, 113 rule base model, 114 learning model, 115 trade ontology, 121 entity extraction unit, 122 semantic analysis unit , 123 output unit, 124 morphological analysis unit, 125a first entity extraction unit, 125b second entity extraction unit, 126 determination unit, 130 communication unit, 20 control unit, 21 storage unit, 22 communication unit, 23 display unit, 24 input Department

Claims (6)

貿易取引文書データを、形態素に分割する形態素解析部と、
ユーザにより予め定められたルールベースモデルに基づいて、前記形態素解析部により分割された形態素から、信用状を用いる決済に必要な情報であるエンティティを抽出する第1エンティティ抽出部と、
過去の貿易取引文書データから学習された学習モデルに基づいて、前記形態素解析部により分割された形態素から、前記エンティティを抽出する第2エンティティ抽出部と、
前記第1エンティティ抽出部による抽出結果と前記第2エンティティ抽出部による抽出結果とが予め定められた基準を満たすか否かを判定する判定部と、
前記判定部により前記基準を満たすと判定された抽出結果に含まれるエンティティが前記信用状を用いる決済におけるいずれの分類に属するかを、予め定められた条件に従って学習された貿易オントロジに基づいて解析するセマンティック解析部と、
前記セマンティック解析部により解析された前記エンティティを、前記分類と対応付けて記憶する記憶部と、
前記分類と対応付けて前記記憶部に記憶された前記エンティティに基づく学習を行い、前記学習モデルおよび前記貿易オントロジの内容を更新する更新部と、
を備える貿易取引電文の意味解析装置。
a morphological analysis unit that divides trade transaction document data into morphemes;
a first entity extraction unit for extracting an entity, which is information necessary for settlement using a letter of credit, from the morphemes divided by the morpheme analysis unit based on a rule-based model predetermined by a user;
a second entity extraction unit that extracts the entity from the morphemes divided by the morphological analysis unit based on a learning model learned from past trade transaction document data;
a determination unit that determines whether or not the extraction result by the first entity extraction unit and the extraction result by the second entity extraction unit satisfy a predetermined criterion;
Analyzing to which classification in settlement using the letter of credit the entity included in the extraction result determined by the determining unit to satisfy the criteria belongs, based on a trade ontology learned according to predetermined conditions. a semantic analysis unit;
a storage unit that stores the entity analyzed by the semantic analysis unit in association with the classification;
an updating unit that performs learning based on the entity stored in the storage unit in association with the classification, and updates the contents of the learning model and the trade ontology;
A semantic analysis device for trade transaction messages.
前記記憶部に記憶された前記エンティティを、前記エンティティに対応付けられた前記分類とともに出力する出力部、をさらに備え、
前記セマンティック解析部は、前記エンティティがいずれの分類に属するかを解析する際に、予め定められたスコア値を付与し、
前記判定部は、
前記第1エンティティ抽出部による抽出結果と前記第2エンティティ抽出部による抽出結果とが一致する場合に、前記基準を満たすと判定し、
前記第1エンティティ抽出部による抽出結果と前記第2エンティティ抽出部による抽出結果とが一致しない場合、前記セマンティック解析部により前記第1エンティティ抽出部による抽出結果に含まれるエンティティと前記第2エンティティ抽出部による抽出結果に含まれるエンティティとを、それぞれ前記貿易オントロジに基づいて解析することで付与されたそれぞれのスコア値のうち、高いスコア値に対応する抽出結果を、前記基準を満たす抽出結果であると判定し、
前記第1エンティティ抽出部と前記第2エンティティ抽出部とのうち、いずれか一方の抽出部からのみ前記抽出結果が抽出された場合、抽出された前記抽出結果に含まれるエンティティを、前記貿易オントロジに基づいて解析することで付与された前記スコア値が予め定められた閾値以上の場合、前記抽出結果を、前記基準を満たす抽出結果であると判定する、
請求項1に記載の貿易取引電文の意味解析装置。
an output unit that outputs the entity stored in the storage unit together with the classification associated with the entity;
The semantic analysis unit assigns a predetermined score value when analyzing which classification the entity belongs to,
The determination unit is
determining that the criterion is satisfied when the extraction result by the first entity extraction unit and the extraction result by the second entity extraction unit match;
When the extraction result by the first entity extraction unit and the extraction result by the second entity extraction unit do not match, the semantic analysis unit extracts entities included in the extraction result by the first entity extraction unit and the second entity extraction unit. Among the score values assigned by analyzing the entities included in the extraction results based on the trade ontology, the extraction results corresponding to the high score values are regarded as the extraction results that satisfy the criteria. judge,
When the extraction result is extracted only from one of the first entity extraction unit and the second entity extraction unit, the entity included in the extracted extraction result is added to the trade ontology If the score value assigned by analyzing based on is equal to or greater than a predetermined threshold value, the extraction result is determined to be an extraction result that satisfies the criterion;
2. The apparatus for semantic analysis of trade transaction messages according to claim 1.
前記貿易オントロジは、前記判定部により前記基準を満たすと判定された抽出結果に含まれるエンティティが、前記信用状を用いる決済におけるいずれの分類に属するかを解析するための学習モデルである信用状解析オントロジと、前記信用状解析オントロジに基づき前記セマンティック解析部により前記信用状を用いる決済におけるいずれの分類に属するかが解析されたエンティティが、前記貿易取引文書データとは異なる貿易必要データにおけるいずれの分類に属するかを解析するための学習モデルである必要情報オントロジと、を含み、
前記セマンティック解析部は、前記記憶部に記憶されたデータに含まれるエンティティが、前記貿易必要データにおけるいずれの分類に属するかを前記必要情報オントロジに基づいて解析し、
前記記憶部は、前記セマンティック解析部により前記必要情報オントロジに基づいて解析されたエンティティを、前記貿易必要データの分類と対応付けて記憶する、
請求項1又は2に記載の貿易取引電文の意味解析装置。
The trade ontology is a letter of credit analysis that is a learning model for analyzing to which classification in settlement using the letter of credit an entity included in the extraction results determined by the determination unit to satisfy the criteria belongs. The ontology and the entity whose classification in the settlement using the letter of credit is analyzed by the semantic analysis unit based on the ontology and the letter of credit analysis ontology is the classification in the trade necessary data different from the trade transaction document data. a necessary information ontology, which is a learning model for analyzing whether it belongs to
The semantic analysis unit analyzes, based on the necessary information ontology, which classification in the trade necessary data the entity included in the data stored in the storage unit belongs to,
The storage unit stores the entity analyzed by the semantic analysis unit based on the necessary information ontology in association with the classification of the trade necessary data.
3. The apparatus for semantic analysis of trade transaction messages according to claim 1 or 2.
前記貿易必要データにおける分類は、取引者毎に異なり、
前記必要情報オントロジは、前記信用状解析オントロジに基づき前記セマンティック解析部により前記信用状を用いる決済におけるいずれの分類に属するかが解析されたエンティティが、前記貿易必要データにおけるいずれの分類に属するかを解析するための学習モデルである必要情報基礎オントロジと、前記セマンティック解析部により前記貿易必要データにおけるいずれの分類に属するかが解析されたエンティティが、前記貿易必要データにおける前記取引者毎に異なるいずれの分類に属するかを解析するための学習モデルである必要情報個別オントロジと、を含み、
前記セマンティック解析部は、前記必要情報基礎オントロジに基づいて解析したエンティティが、前記貿易必要データにおける前記取引者毎に異なるいずれの分類に属するかを前記必要情報個別オントロジに基づいて解析し、
前記記憶部は、前記セマンティック解析部により前記必要情報個別オントロジに基づいて解析されたエンティティを、前記貿易必要データにおける前記取引者毎に異なる分類と対応付けて記憶する、
請求項3に記載の貿易取引電文の意味解析装置。
The classification in the trade necessary data is different for each trader,
The necessary information ontology indicates to which classification in the trade necessary data an entity whose classification in the settlement using the letter of credit is analyzed by the semantic analysis unit based on the letter of credit analysis ontology. The basic ontology of necessary information, which is a learning model for analysis, and the entity whose classification in the trade-required data is analyzed by the semantic analysis unit is different for each trader in the trade-required data. a necessary information individual ontology, which is a learning model for analyzing whether it belongs to a classification,
The semantic analysis unit analyzes, based on the necessary information individual ontology, to which class the entity analyzed based on the necessary information basic ontology belongs to, which differs for each trader in the necessary trade data, and
The storage unit stores the entity analyzed by the semantic analysis unit based on the individual necessary information ontology in association with the classification that differs for each trader in the necessary trade data,
4. The apparatus for semantic analysis of trade transaction messages according to claim 3.
形態素解析部と、第1エンティティ抽出部と、第2エンティティ抽出部と、判定部と、セマンティック解析部と、記憶部と、更新部と、を備える意味解析装置による意味解析方法であって、
前記形態素解析部が、貿易取引文書データを、形態素に分割する形態素解析ステップと、
前記第1エンティティ抽出部が、ユーザにより予め定められたルールベースモデルに基づいて、前記形態素解析ステップにより分割された形態素から、信用状を用いる決済に必要な情報であるエンティティを抽出する第1エンティティ抽出ステップと、
前記第2エンティティ抽出部が、過去の貿易取引文書データから学習された学習モデルに基づいて、前記形態素解析ステップにより分割された形態素から、前記エンティティを抽出する第2エンティティ抽出ステップと、
前記判定部が、前記第1エンティティ抽出ステップによる抽出結果と前記第2エンティティ抽出ステップによる抽出結果とが予め定められた基準を満たすか否かを判定する判定ステップと、
前記セマンティック解析部が、前記判定ステップにより前記基準を満たすと判定された抽出結果に含まれるエンティティが前記信用状を用いる決済におけるいずれの分類に属するかを、予め定められた条件に従って学習された貿易オントロジに基づいて解析するセマンティック解析ステップと、
前記記憶部が、前記セマンティック解析ステップにより解析された前記エンティティを、前記分類と対応付けて記憶する記憶ステップと、
前記更新部が、前記分類と対応付けて前記記憶ステップにより記憶された前記エンティティに基づく学習を行い、前記学習モデルおよび前記貿易オントロジの内容を更新する更新ステップと、
を含む貿易取引電文の意味解析方法。
A semantic analysis method by a semantic analysis device comprising a morphological analysis unit, a first entity extraction unit, a second entity extraction unit, a determination unit, a semantic analysis unit, a storage unit, and an update unit,
a morphological analysis step in which the morphological analysis unit divides the trade transaction document data into morphemes;
The first entity extracting unit, based on a rule-based model predetermined by a user, extracts an entity that is information necessary for payment using a letter of credit from the morphemes divided by the morphological analysis step. an extraction step;
a second entity extraction step in which the second entity extraction unit extracts the entity from the morphemes divided by the morphological analysis step based on a learning model learned from past trade document data;
a determination step in which the determination unit determines whether or not the extraction result of the first entity extraction step and the extraction result of the second entity extraction step satisfy a predetermined criterion;
The semantic analysis unit learns, according to a predetermined condition, to which classification in settlement using the letter of credit the entity included in the extraction result determined to satisfy the criteria in the determination step belongs. a semantic parsing step that parses based on the ontology;
a storage step in which the storage unit stores the entity analyzed by the semantic analysis step in association with the classification;
an updating step in which the updating unit performs learning based on the entities stored in the storing step in association with the classification, and updates the contents of the learning model and the trade ontology;
Semantic analysis method for trade transaction messages including
コンピュータに、
貿易取引文書データを、形態素に分割する形態素解析処理と、
ユーザにより予め定められたルールベースモデルに基づいて、前記形態素解析処理により分割された形態素から、信用状を用いる決済に必要な情報であるエンティティを抽出する第1エンティティ抽出処理と、
過去の貿易取引文書データから学習された学習モデルに基づいて、前記形態素解析処理により分割された形態素から、前記エンティティを抽出する第2エンティティ抽出処理と、
前記第1エンティティ抽出処理による抽出結果と前記第2エンティティ抽出処理による抽出結果とが予め定められた基準を満たすか否かを判定する判定処理と、
前記判定処理により前記基準を満たすと判定された抽出結果に含まれるエンティティが前記信用状を用いる決済におけるいずれの分類に属するかを、予め定められた条件に従って学習された貿易オントロジに基づいて解析するセマンティック解析処理と、
前記セマンティック解析処理により解析された前記エンティティを、前記分類と対応付けて記憶する記憶処理と、
前記分類と対応付けて前記記憶処理により記憶された前記エンティティに基づく学習を行い、前記学習モデルおよび前記貿易オントロジの内容を更新する更新処理と、
を実行させるプログラム。
to the computer,
Morphological analysis processing for dividing trade transaction document data into morphemes;
a first entity extraction process for extracting an entity, which is information necessary for settlement using a letter of credit, from the morphemes divided by the morphological analysis process based on a rule-based model predetermined by a user;
a second entity extraction process for extracting the entity from the morphemes divided by the morphological analysis process based on a learning model learned from past trade transaction document data;
a determination process for determining whether or not the extraction result of the first entity extraction process and the extraction result of the second entity extraction process satisfy a predetermined criterion;
Analyzing to which classification in settlement using the letter of credit the entity included in the extraction results determined by the determination processing to satisfy the criteria belongs, based on a trade ontology learned according to predetermined conditions. a semantic analysis process;
a storage process for storing the entity analyzed by the semantic analysis process in association with the classification;
an update process for performing learning based on the entity stored by the storage process in association with the classification, and updating the contents of the learning model and the trade ontology;
program to run.
JP2019197461A 2019-10-30 2019-10-30 Apparatus for semantic analysis of trade transaction message, semantic analysis method and program Active JP7299822B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019197461A JP7299822B2 (en) 2019-10-30 2019-10-30 Apparatus for semantic analysis of trade transaction message, semantic analysis method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019197461A JP7299822B2 (en) 2019-10-30 2019-10-30 Apparatus for semantic analysis of trade transaction message, semantic analysis method and program

Publications (2)

Publication Number Publication Date
JP2021071866A JP2021071866A (en) 2021-05-06
JP7299822B2 true JP7299822B2 (en) 2023-06-28

Family

ID=75713886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019197461A Active JP7299822B2 (en) 2019-10-30 2019-10-30 Apparatus for semantic analysis of trade transaction message, semantic analysis method and program

Country Status (1)

Country Link
JP (1) JP7299822B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015045953A (en) 2013-08-27 2015-03-12 株式会社三井住友銀行 Forex transaction message distribution system, and forex transaction message distribution program
US20170148093A1 (en) 2015-11-24 2017-05-25 Bank Of America Corporation Executing terms of physical trade documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015045953A (en) 2013-08-27 2015-03-12 株式会社三井住友銀行 Forex transaction message distribution system, and forex transaction message distribution program
US20170148093A1 (en) 2015-11-24 2017-05-25 Bank Of America Corporation Executing terms of physical trade documents

Also Published As

Publication number Publication date
JP2021071866A (en) 2021-05-06

Similar Documents

Publication Publication Date Title
US20210103965A1 (en) Account manager virtual assistant using machine learning techniques
Krishnamoorthy Sentiment analysis of financial news articles using performance indicators
CN110020660B (en) Integrity assessment of unstructured processes using Artificial Intelligence (AI) techniques
US20220398680A1 (en) Machine evaluation of contract terms
Dandala et al. Adverse drug events detection in clinical notes by jointly modeling entities and relations using neural networks
Ravi et al. Fuzzy formal concept analysis based opinion mining for CRM in financial services
US11450129B2 (en) Data extraction and duplicate detection
CN110069623B (en) Abstract text generation method and device, storage medium and computer equipment
CN110909226A (en) Financial document information processing method and device, electronic equipment and storage medium
Bhatia et al. Mining privacy goals from privacy policies using hybridized task recomposition
US10733675B2 (en) Accuracy and speed of automatically processing records in an automated environment
CN103443787A (en) System for identifying textual relationships
US20230038529A1 (en) Self-executing protocol generation from natural language text
Li et al. A policy-based process mining framework: mining business policy texts for discovering process models
Minhas et al. From spin to swindle: Identifying falsification in financial text
US11775737B2 (en) System and method for correction of acquired transaction text fields
US20230236892A1 (en) Apparatus for resource enhacement
Sharaf et al. An efficient hybrid stock trend prediction system during COVID-19 pandemic based on stacked-LSTM and news sentiment analysis
CN114303140A (en) Analysis of intellectual property data related to products and services
Bonfitto et al. Semi-automatic column type inference for CSV table understanding
Albahli et al. A deep learning method DCWR with HANet for stock market prediction using news articles
Khadivizand et al. Towards intelligent feature engineering for risk-based customer segmentation in banking
Geist et al. Leveraging machine learning for software redocumentation—A comprehensive comparison of methods in practice
US7831442B1 (en) System and method for minimizing edits for medical insurance claims processing
JP7299822B2 (en) Apparatus for semantic analysis of trade transaction message, semantic analysis method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230616

R150 Certificate of patent or registration of utility model

Ref document number: 7299822

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350