JP2020129232A - Machine learning device, program, and machine learning method - Google Patents

Machine learning device, program, and machine learning method Download PDF

Info

Publication number
JP2020129232A
JP2020129232A JP2019021083A JP2019021083A JP2020129232A JP 2020129232 A JP2020129232 A JP 2020129232A JP 2019021083 A JP2019021083 A JP 2019021083A JP 2019021083 A JP2019021083 A JP 2019021083A JP 2020129232 A JP2020129232 A JP 2020129232A
Authority
JP
Japan
Prior art keywords
evaluation
sentence
unit
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019021083A
Other languages
Japanese (ja)
Other versions
JP7280705B2 (en
Inventor
近藤 浩史
Hiroshi Kondo
浩史 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Research Institute Ltd
Original Assignee
Japan Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Research Institute Ltd filed Critical Japan Research Institute Ltd
Priority to JP2019021083A priority Critical patent/JP7280705B2/en
Publication of JP2020129232A publication Critical patent/JP2020129232A/en
Application granted granted Critical
Publication of JP7280705B2 publication Critical patent/JP7280705B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a machine learning device, a program, and a machine learning method in which classification accuracy does not decrease even when data to be classified and data to not be classified are mixed in sample data.SOLUTION: A machine learning device comprises: a model construction unit including an evaluation model construction unit that constructs a first learning model, wherein the first learning model determines whether an input sentence is a sentence indicating the evaluation of the evaluation target, the state of the evaluation target, or the reason for the evaluation using one or more explanations, which is included in the evaluation information associated with one or more explanations indicating the evaluation of the evaluation target, and the state of the evaluation target or the reason for the evaluation, as a teacher data; and an index estimation unit including an extraction unit that extracts, from one or more sentences included in text data, the sentence related to the evaluation target using the first learning model constructed by the evaluation model construction unit.SELECTED DRAWING: Figure 1

Description

本発明は、機械学習装置、プログラム及び機械学習方法に関する。 The present invention relates to a machine learning device, a program, and a machine learning method.

学習モデルを利用して、公報に社内分類を付与する分類システムが知られている(例えば、特許文献1)。
[先行技術文献]
[特許文献]
[特許文献1]特開2018−026119号公報
There is known a classification system that assigns an in-house classification to a gazette using a learning model (for example, Patent Document 1).
[Prior Art Document]
[Patent Document]
[Patent Document 1] Japanese Unexamined Patent Application Publication No. 2018-0261119

特許文献1の分類システムにおいては、分類システムに入力されるサンプルデータの種類が予め特定されており、入力されたサンプルデータの全てに社内分類が付与される。そのため、サンプルデータの中に、分類対象となるデータと、分類対象にならないデータが混在している場合には、分類精度が低下する、システムリソースの利用効率が低下するなどの課題がある。 In the classification system of Patent Document 1, the type of sample data input to the classification system is specified in advance, and the in-house classification is assigned to all the input sample data. Therefore, when the data to be classified and the data not to be classified are mixed in the sample data, there are problems such as a decrease in classification accuracy and a decrease in utilization efficiency of system resources.

本発明の第1の態様においては、機械学習装置が提供される。上記の機械学習装置は、例えば、(i)評価対象に関する評価、及び、(ii)評価対象の状態又は評価の理由を示す1以上の説明文が対応付けられた評価情報に含まれる1以上の説明文を教師データとして利用して、入力された文が、評価対象に対する評価、評価対象の状態又は評価の理由を示す文であるか否かを判定するための第1学習モデルを構築する第1モデル構築部を備える。上記の機械学習装置は、例えば、第1モデル構築部が構築した第1学習モデルを用いて、テキストデータに含まれる1以上の文の中から、評価対象に関連する文を抽出する抽出部を備える。 In a first aspect of the invention, a machine learning device is provided. The machine learning device described above includes, for example, (i) an evaluation regarding an evaluation target, and (ii) one or more evaluation information included in the evaluation information associated with one or more explanatory texts indicating the state of the evaluation target or the reason for the evaluation. A first learning model for constructing a first learning model for determining whether or not the input sentence is a sentence indicating an evaluation of an evaluation target, a state of the evaluation target, or a reason for the evaluation, using the explanatory text as teacher data. 1 model building section is provided. The machine learning device described above includes, for example, an extraction unit that extracts a sentence related to an evaluation target from one or more sentences included in the text data using the first learning model constructed by the first model construction unit. Prepare

上記の機械学習装置において、第1学習モデルは、入力された文を、評価対象の状態又は評価の理由を示す文、又は、評価対象の状態又は評価の理由を示す文ではない文の何れかに分類する文章分類器を含んでよい。上記の機械学習装置において、第1学習モデルは、複数の文章分類器を含んでよい。上記の機械学習装置において、複数の文章分類器のそれぞれは、入力された文が、評価対象の状態又は評価の理由を示す文であることの確からしさを示すスコアを出力してよい。上記の機械学習装置において、抽出部は、複数の文章分類器のそれぞれが出力したスコアの合計値が、予め定められた閾値よりも大きい場合に、入力された文を、評価対象に関連する文として抽出してよい。 In the above machine learning device, the first learning model is either a sentence indicating the state of the evaluation target or the reason for the evaluation, or a sentence that is not a state indicating the evaluation target or the reason for the evaluation. It may include a text classifier for classifying into. In the above machine learning device, the first learning model may include a plurality of sentence classifiers. In the above machine learning device, each of the plurality of sentence classifiers may output a score indicating the likelihood that the input sentence is a sentence indicating the state of the evaluation target or the reason for the evaluation. In the above machine learning device, the extraction unit, when the total value of the scores output by each of the plurality of sentence classifiers is larger than a predetermined threshold value, the input sentence, the sentence related to the evaluation target. May be extracted as

上記の機械学習装置において、抽出部は、テキストデータに含まれる1以上の文の少なくとも一部を、第1学習モデルに入力し、第1学習モデルが評価対象の状態又は評価の理由を示す文であると判定した文を、評価対象に関連する文として抽出する第1抽出部を有してよい。上記の機械学習装置において、抽出部は、評価対象に関連するキーワード又はキーフレーズを示す情報を取得する条件取得部を有してよい。上記の機械学習装置において、抽出部は、テキストデータに含まれる1以上の文の中から、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つを、評価対象に関連する文、又は、評価対象に関連する文の候補として抽出する第2抽出部を有してよい。上記の機械学習装置において、第1抽出部は、第2抽出部が評価対象に関連する文の候補として抽出した文を、第1学習モデルに入力してよい。上記の機械学習装置において、第1抽出部は、第1学習モデルが評価対象の状態又は評価の理由を示す文であると判定した文を、評価対象に関連する文として抽出してよい。 In the above machine learning device, the extraction unit inputs at least a part of one or more sentences included in the text data to the first learning model, and the first learning model indicates a state of an evaluation target or a reason for the evaluation. It may have a 1st extraction part which extracts a sentence determined to be as a sentence relevant to an evaluation object. In the above machine learning device, the extraction unit may include a condition acquisition unit that acquires information indicating a keyword or key phrase related to the evaluation target. In the above machine learning device, the extraction unit extracts a sentence including a keyword, a sentence matching a key phrase, a sentence including a word similar to the keyword, and a key phrase from one or more sentences included in the text data. A second extraction unit that extracts at least one of the sentences that match the similar conditions as a sentence related to the evaluation target or a candidate of a sentence related to the evaluation target may be included. In the above machine learning device, the first extraction unit may input a sentence extracted by the second extraction unit as a candidate for a sentence related to the evaluation target into the first learning model. In the above machine learning device, the first extraction unit may extract a sentence that the first learning model has determined to be a sentence indicating a state of an evaluation target or a reason for the evaluation, as a sentence related to the evaluation target.

上記の機械学習装置において、第2抽出部は、連続する2以上の文を含む文章であって、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つを含む文章を、評価対象に関連する文の候補として抽出してよい。上記の機械学習装置は、テキストデータの種類を区別するための種別情報を取得する種別情報取得部を備えてよい。上記の機械学習装置において、第2抽出部は、種別情報により示されるテキストデータの種類に基づいて、テキストデータに含まれる1以上の文の中から、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つを、評価対象に関連する文及び評価対象に関連する文の候補の何れとして抽出するかを決定してよい。 In the above machine learning device, the second extraction unit is a sentence including two or more continuous sentences, including a sentence including a keyword, a sentence matching a key phrase, a sentence including a word similar to the keyword, and a key. A sentence including at least one sentence that matches a condition similar to a phrase may be extracted as a candidate for a sentence related to an evaluation target. The machine learning device may include a type information acquisition unit that acquires type information for distinguishing the types of text data. In the above machine learning device, the second extraction unit may, based on the type of text data indicated by the type information, a sentence including a keyword or a sentence that matches a key phrase from one or more sentences included in the text data. At least one of a sentence including a word similar to a keyword and a sentence matching a condition similar to a key phrase is to be extracted as a sentence related to an evaluation target or a candidate of a sentence related to an evaluation target. You may decide.

上記の機械学習装置は、評価情報を教師データとして利用して、入力された文に、評価対象に関する評価を付与するための第2学習モデルを構築する第2モデル構築部を備えてよい。上記の機械学習装置は、第2モデル構築部が構築した第2学習モデルを用いて、抽出部が抽出した文に、評価対象に関する評価を付与する評価付与部を備えてよい。 The machine learning device described above may include a second model building unit that builds a second learning model for giving an evaluation regarding an evaluation target to an input sentence by using the evaluation information as teacher data. The machine learning device may include an evaluation assigning unit that assigns an evaluation regarding an evaluation target to the sentence extracted by the extracting unit using the second learning model constructed by the second model constructing unit.

上記の機械学習装置は、評価付与部による評価に基づいて、特定の期間における評価対象の状態又は動向を示す指標を算出する指標算出部を備えてよい。上記の機械学習装置は、特定の期間を示す情報を取得する期間情報取得部を備えてよい。上記の機械学習装置は、複数のテキストデータのそれぞれを、複数のテキストデータのそれぞれの内容に関連する時期、複数のテキストデータのそれぞれが記録された時期、又は、複数のテキストデータのそれぞれを含む電子ファイルが作成若しくは更新された時期を示す時期情報と対応づけて取得するテキストデータ取得部を備えてよい。上記の機械学習装置において、抽出部は、複数のテキストデータのうち、当該テキストデータに対応付けられた時期情報により示される時期が特定の期間に含まれるテキストデータに含まれる複数の文の中から、評価対象に関連する文を抽出してよい。上記の機械学習装置において、評価付与部は、抽出部が複数のテキストデータの少なくとも一部から抽出した複数の文に、評価対象に関する評価を付与してよい。上記の機械学習装置において、指標算出部は、評価付与部が複数の文のそれぞれに付与した評価に基づいて、指標を算出してよい。 The above machine learning device may include an index calculation unit that calculates an index indicating the state or trend of the evaluation target in a specific period based on the evaluation by the evaluation giving unit. The machine learning device may include a period information acquisition unit that acquires information indicating a specific period. The machine learning device includes each of the plurality of text data, a time associated with each content of the plurality of text data, a time when each of the plurality of text data was recorded, or a plurality of each of the plurality of text data. A text data acquisition unit may be provided that is associated with time information indicating the time when the electronic file was created or updated. In the above machine learning device, the extraction unit selects, from among a plurality of text data, a plurality of sentences included in the text data in which a time period indicated by time information associated with the text data is included in a specific period. , Sentences relevant to the evaluation target may be extracted. In the above machine learning device, the evaluation giving unit may give the evaluation regarding the evaluation target to the plurality of sentences extracted from at least a part of the plurality of text data by the extraction unit. In the above machine learning device, the index calculation unit may calculate the index based on the evaluation given to each of the plurality of sentences by the evaluation giving unit.

上記の機械学習装置において、テキストデータは、情報提供者の発言若しくはジェスチャにより提示された情報、又は、情報提供者が知覚した情報を含んでよい。上記の機械学習装置は、評価付与部による評価に基づいて、特定の期間における評価対象の状態又は動向を示す指標を算出する指標算出部を備えてよい。上記の機械学習装置は、複数のテキストデータのそれぞれを、複数のテキストデータのそれぞれの情報提供者の属性を示す属性情報と対応づけて取得するテキストデータ取得部を備えてよい。上記の機械学習装置において、評価付与部は、抽出部が複数のテキストデータの少なくとも一部から抽出した複数の文のそれぞれに対して、各文が含まれていたテキストデータに対応する属性情報により示される情報提供者の属性に基づいて、評価対象に関する評価を付与してよい。上記の機械学習装置において、指標算出部は、評価付与部が複数の文のそれぞれに付与した評価に基づいて、指標を算出してよい。 In the above machine learning device, the text data may include information presented by a statement or gesture of the information provider, or information perceived by the information provider. The above machine learning device may include an index calculation unit that calculates an index indicating the state or trend of the evaluation target in a specific period based on the evaluation by the evaluation giving unit. The machine learning device may include a text data acquisition unit that acquires each of the plurality of text data in association with attribute information indicating an attribute of each information provider of the plurality of text data. In the above machine learning device, the evaluation assigning unit uses the attribute information corresponding to the text data containing each sentence for each of the plurality of sentences extracted from at least a part of the plurality of text data by the extracting unit. The evaluation regarding the evaluation target may be given based on the attribute of the information provider shown. In the above machine learning device, the index calculation unit may calculate the index based on the evaluation given to each of the plurality of sentences by the evaluation giving unit.

本発明の第2の態様においては、機械学習方法が提供される。上記の機械学習方法は、例えば、(i)評価対象に関する評価、及び、(ii)評価対象の状態又は評価の理由を示す1以上の説明文が対応付けられた評価情報に含まれる1以上の説明文を教師データとして利用して、入力された文が、評価対象の状態、評価対象に対する評価又は評価の理由を示す文であるか否かを判定するための第1学習モデルを構築する第1モデル構築段階を有する。上記の機械学習方法は、例えば、第1モデル構築段階において構築された第1学習モデルを用いて、テキストデータに含まれる1以上の文の中から、評価対象に関連する文を抽出する抽出段階を有する。 In a second aspect of the invention, a machine learning method is provided. The machine learning method described above includes, for example, (i) an evaluation regarding an evaluation target, and (ii) one or more evaluation information included in the evaluation information associated with one or more explanatory texts indicating the state of the evaluation target or the reason for the evaluation. Constructing a first learning model for determining whether or not the input sentence is a sentence indicating the state of the evaluation target, the evaluation of the evaluation target, or the reason for the evaluation, using the explanatory text as the teacher data. It has one model building stage. The machine learning method is, for example, an extraction step of extracting a sentence related to the evaluation target from one or more sentences included in the text data using the first learning model constructed in the first model construction stage. Have.

本発明の第3の態様においては、プログラムが提供される。上記のプログラムを格納する非一時的コンピュータ可読媒体が提供されてもよい。上記のプログラムは、例えば、コンピュータを、上記の第1の態様に係る機械学習装置として機能させるためのプログラムである。上記のプログラムは、コンピュータに、上記の第2の態様に係る機械学習方法を実行させるためのプログラムであってもよい。 In the third aspect of the present invention, a program is provided. A non-transitory computer-readable medium storing the above program may be provided. The above program is, for example, a program for causing a computer to function as the machine learning device according to the first aspect. The above program may be a program for causing a computer to execute the machine learning method according to the second aspect.

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。 Note that the above summary of the invention does not enumerate all necessary features of the present invention. Further, a sub-combination of these feature groups can also be an invention.

指標推定システム100のシステム構成の一例を概略的に示す。1 schematically shows an example of a system configuration of an index estimation system 100. 格納部126の内部構成の一例を概略的に示す。1 schematically shows an example of the internal configuration of the storage unit 126. データテーブル300の一例を概略的に示す。An example of the data table 300 is schematically shown. データテーブル400の一例を概略的に示す。An example of the data table 400 is schematically shown. モデル構築部144の内部構成の一例を概略的に示す。1 schematically shows an example of the internal configuration of the model construction unit 144. 指標推定部166の内部構成の一例を概略的に示す。An example of the internal configuration of the index estimation unit 166 is schematically shown. 機械学習型抽出部634の内部構成の一例を概略的に示す。An example of the internal configuration of the machine learning type extraction unit 634 is schematically shown. 評価対象抽出部630における情報処理の一例を概略的に示す。An example of information processing in the evaluation target extraction unit 630 is schematically shown. 評価対象抽出部630における情報処理の一例を概略的に示す。An example of information processing in the evaluation target extraction unit 630 is schematically shown. 評価対象抽出部630における情報処理の一例を概略的に示す。An example of information processing in the evaluation target extraction unit 630 is schematically shown. データテーブル1100の一例を概略的に示す。1 schematically shows an example of a data table 1100. コンピュータ3000のシステム構成の一例を概略的に示す。1 schematically shows an example of a system configuration of a computer 3000.

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。 Hereinafter, the present invention will be described through embodiments of the invention, but the following embodiments do not limit the invention according to the claims. In addition, not all of the combinations of features described in the embodiments are essential to the solving means of the invention. In the drawings, the same or similar parts may be denoted by the same reference numerals, and redundant description may be omitted.

[指標推定システム100の概要]
図1は、指標推定システム100のシステム構成の一例を概略的に示す。本実施形態において、指標推定システム100は、(i)各種のSNSに登録された情報、ネットワーク上の各種の掲示板に登録された情報、各種のニュースで報道された情報、景況感に関する各種のアンケートにより収集された情報、顧客等との折衝において得られた情報、営業日報又は業務日報に記載された情報などを取得し、(ii)経済指標の推定値を出力する。これにより、指標推定システム100のユーザは、経済活動の状態又は動向を、政府、中央銀行などの公的機関が公表する経済指標と同等の精度で、当該経済指標の公表時期よりも早い時期に把握することができる。
[Outline of Index Estimation System 100]
FIG. 1 schematically shows an example of the system configuration of the index estimation system 100. In the present embodiment, the index estimation system 100 includes (i) information registered in various SNSs, information registered in various bulletin boards on the network, information reported in various news, and various questionnaires regarding business sentiment. The information collected by the above, the information obtained through negotiations with customers, etc., the information described in the daily business report or the daily business report, and the like are acquired, and (ii) the estimated value of the economic index is output. As a result, the user of the index estimation system 100 can determine the state or trend of economic activity at the same accuracy as the economic index published by a public institution such as the government or central bank, and at an earlier time than the publication time of the economic index. You can figure it out.

政府、中央銀行などの公的機関が公表する経済指標は、例えば、政府、中央銀行などの公的機関が公表する経済活動に関する調査結果(公的な調査結果と称される場合がある。)に記載される。上記の経済指標としては、日本銀行による「企業短期経済観測調査」に記載された各種の指数、内閣府による「景気ウォッチャー調査」に記載された各種の指数、経済産業省による「生産動態統計調査」に記載された各種の指数などが例示される。「企業短期経済観測調査」に記載された指数としては、「業況判断指数」(日銀短観と称される場合がある)が例示される。「景気ウォッチャー調査」に記載された指数としては、「現状判断」が例示される。「生産動態統計調査」に記載された指数としては、各種の「鉱工業指数」が例示される。経済指標の他の例としては、内閣府から公表される景気動向指数がある。 Economic indicators published by governments, central banks, and other public institutions are, for example, survey results (sometimes referred to as public survey results) on economic activities published by governments, central banks, and other public institutions. It is described in. As the above-mentioned economic indicators, the various indices listed in the “Corporate Short-term Economic Observation Survey” by the Bank of Japan, the various indices listed in the “Economic Watcher Survey” by the Cabinet Office, and the “Statistics Survey on Production Dynamics” by the Ministry of Economy, Trade and Industry The various indexes described in “” are exemplified. An example of the index described in the “Short-term corporate economic survey survey” is the “Business Conditions Index” (sometimes referred to as the BOJ Tankan). As the index described in the "Business Watcher Survey," "current situation judgment" is exemplified. As the index described in the “Statistical Survey on Production Dynamics”, various “mining and industrial indexes” are exemplified. Another example of economic indicators is the Business Trend Index published by the Cabinet Office.

本実施形態において、指標推定システム100は、通信部122と、入出力部124と、格納部126と、要求受付部128と、教師データ取得部142と、モデル構築部144と、サンプルデータ取得部162と、テキストデータ生成部164と、指標推定部166とを備える。本実施形態において、指標推定システム100は、通信ネットワーク10を介して、ユーザ端末12、教師データ提供サーバ14、及び、サンプルデータ提供サーバ16の少なくとも1つとの間で情報を送受することができる。 In the present embodiment, the index estimation system 100 includes a communication unit 122, an input/output unit 124, a storage unit 126, a request reception unit 128, a teacher data acquisition unit 142, a model construction unit 144, and a sample data acquisition unit. 162, a text data generation unit 164, and an index estimation unit 166. In the present embodiment, the index estimation system 100 can send and receive information to and from at least one of the user terminal 12, the teacher data providing server 14, and the sample data providing server 16 via the communication network 10.

本実施形態において、通信ネットワーク10は、ユーザ端末12、教師データ提供サーバ14、及び、サンプルデータ提供サーバ16の少なくとも1つと、指標推定システム100との間で、情報を伝達する。通信ネットワーク10は、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路及び有線通信の伝送路の組み合わせであってもよい。 In the present embodiment, the communication network 10 transfers information between the index estimation system 100 and at least one of the user terminal 12, the teacher data providing server 14, and the sample data providing server 16. The communication network 10 may be a wired communication transmission path, a wireless communication transmission path, or a combination of a wireless communication transmission path and a wired communication transmission path.

通信ネットワーク10は、無線通信網、インターネット、P2Pネットワーク、専用回線、VPN、電力線通信回線などを含んでもよい。無線通信網における通信方式は、(i)3G方式、LTE方式、4G方式、5G方式などの移動体通信方式であってもよく、(ii)Bluetooth(登録商標)、Zigbee(登録商標)、NFC(Near Field Communication)のような近距離無線方式、WiFi(登録商標)のような無線LAN方式、WiMAX(登録商標)のような無線MAN方式、無線WAN方式などの無線データ通信方式であってもよい。 The communication network 10 may include a wireless communication network, the Internet, a P2P network, a dedicated line, a VPN, a power line communication line, or the like. The communication system in the wireless communication network may be a mobile communication system such as (i) 3G system, LTE system, 4G system, 5G system, and (ii) Bluetooth (registered trademark), Zigbee (registered trademark), NFC. (Near Field Communication), a short-distance wireless communication method, a wireless LAN method such as WiFi (registered trademark), a wireless MAN method such as WiMAX (registered trademark), a wireless data communication method such as a wireless WAN method. Good.

本実施形態において、ユーザ端末12は、通信ネットワーク10を介して指標推定システム100との間で情報を送受することのできる情報処理端末であればよく、その詳細は特に限定されない。ユーザ端末12は、指標推定システム100のユーザにより、指標推定システム100のユーザインタフェースとして利用され得る。ユーザ端末12としては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。 In the present embodiment, the user terminal 12 may be any information processing terminal that can send and receive information to and from the index estimation system 100 via the communication network 10, and the details thereof are not particularly limited. The user terminal 12 can be used by a user of the index estimation system 100 as a user interface of the index estimation system 100. Examples of the user terminal 12 include a personal computer and a mobile terminal. Examples of the mobile terminal include a mobile phone, a smartphone, a PDA, a tablet, a notebook computer or a laptop computer, and a wearable computer.

本実施形態において、教師データ提供サーバ14は、公的な調査結果のデータを管理する。例えば、教師データ提供サーバ14は、複数の調査のそれぞれについて、当該調査の種類を示す情報と、当該調査の対象期間を示す情報と、当該調査の調査結果のデータとを対応付けて格納する。教師データ提供サーバ14は、指標推定システム100からの要求に応じて、指標推定システム100が要求する調査結果のデータを、指標推定システム100に送信する。 In the present embodiment, the teacher data providing server 14 manages the data of official survey results. For example, the teacher data providing server 14 stores, for each of the plurality of surveys, information indicating the type of the survey, information indicating the target period of the survey, and the survey result data of the survey in association with each other. The teacher data providing server 14 transmits the data of the survey result requested by the index estimation system 100 to the index estimation system 100 in response to the request from the index estimation system 100.

調査の種類の例としては、調査の名称、調査対象の種類、調査の目的、調査におけるヒアリング対象者の属性などが例示される。調査の名称としては、企業短期経済観測調査、景気ウォッチャー調査、生産動態統計調査などが例示される。調査におけるヒアリング対象者の属性としては、年齢、性別、調査対象との関連度合などが例示される。調査対象との関連度合としては、ヒアリング対象者が所属する団体の業種、当該団体の規模、当該団体が活動する地域、当該団体における当該ヒアリング対象者の肩書、当該ヒアリング対象者の職種などが例示される。ヒアリング対象者の肩書としては、所属部署、役職などが例示される。調査対象との関連度合の他の例としては、調査対象に関する予測精度、調査対象に関連する業務又は役職の経験年数などが例示される。 Examples of the type of survey include the name of the survey, the type of survey target, the purpose of the survey, and the attributes of the interviewees in the survey. Examples of the name of the survey include corporate short-term economic observation survey, business watcher survey, and production dynamic statistics survey. Examples of attributes of the interviewee in the survey include age, sex, and degree of association with the survey target. Examples of the degree of relevance to the survey target include the industry of the organization to which the interviewee belongs, the size of the organization, the area in which the organization operates, the title of the interviewee in the organization, the occupation of the interviewee, etc. To be done. The titles of the interviewees include departments, positions, and the like. Other examples of the degree of association with the survey target include the prediction accuracy of the survey target, the number of years of experience in the business or post related to the survey target, and the like.

ヒアリング対象者及び調査対象の関連度合は、連続的な数値により表されてもよく、段階的な区分により表されてもよい。例えば、関連度合は、調査対象に対する予測精度が良好である程、関連度合を表す数値が大きくなるように設定される。関連度合は、調査対象に関連する業務又は役職の経験年数が長い程、関連度合を表す数値が大きくなるように設定されてもよい。関連度合は、役職の階級が上級であるほど、関連度合を表す数値が大きくなるように設定されてもよい。 The degree of association between the interview target person and the survey target may be represented by a continuous numerical value or may be represented by a stepwise division. For example, the degree of association is set such that the better the prediction accuracy with respect to the survey target, the larger the numerical value representing the degree of association. The degree of association may be set such that the longer the number of years of experience in the business or post related to the survey target, the larger the numerical value representing the degree of association. The degree of association may be set such that the higher the rank of the post, the larger the numerical value representing the degree of association.

例えば、調査対象が経済活動である場合、「次の四半期の景気が現在よりも良くなると予想し、実際に、景気が良くなった場合」、「次の四半期の景気が現在よりも良くなると予想したが、実際には景気動向に変化がなかった場合」、「次の四半期の景気が現在よりも良くなると予想したが、実際には景気が悪化した場合」の順に、関連度合を表す数値として大きな値が付与される。「次の四半期の景気が現在よりも良くなると予想し、実際に、景気が良くなった場合」の関連具合は、1以上であってよく、「次の四半期の景気が現在よりも良くなると予想したが、実際には景気動向に変化がなかった場合」及び「次の四半期の景気が現在よりも良くなると予想したが、実際には景気が悪化した場合」の関連具合は1より小さくてもよい。 For example, if the survey target is economic activity, "We expect that the next quarter's economy will be better than the present, and if the economy actually becomes better," "We expect the next quarter's economy to be better than the present However, as a numerical value showing the degree of relation, in the order of ``when there is no actual change in economic trends'' and ``when the economy in the next quarter was expected to be better than the present, but the economy actually deteriorated'' A large value is given. "If we expect the next quarter's economy to be better than it is now, and in fact it's been better," the relevant condition may be 1 or more, and "we expect the next quarter's economy to be better than now. However, even if the degree of relation is less than 1, "if there is no actual change in the economic trend" and "if the economy in the next quarter is expected to be better than the present, but the economy actually deteriorates" Good.

本実施形態において、サンプルデータ提供サーバ16は、指標推定システム100による分析の対象となる各種のデータ(サンプルデータと称される場合がある。)を管理する。サンプルデータは、作成者又は更新者ごとに管理されてもよく、作成者又は更新者及び作成日又は更新日ごとに管理されてもよい。例えば、サンプルデータが営業日報、業務日報などのデータである場合、当該営業日報、業務日報などのデータが保存されるごとに、1つのサンプルデータとして扱われる。サンプルデータが営業日報、業務日報などのデータである場合、当該営業日報、業務日報などを作成又は更新した担当者ごとに、1つのサンプルデータとして扱われてもよい。サンプルデータが営業日報、業務日報などのデータである場合、担当者ごと、且つ、営業日ごとに、1つのサンプルデータとして扱われてもよい。例えば、サンプルデータがSNS上に投稿されたデータである場合、投稿ごとに、1つのサンプルデータとして取り扱われる。 In the present embodiment, the sample data providing server 16 manages various data (sometimes referred to as sample data) to be analyzed by the index estimation system 100. The sample data may be managed for each creator or updater, or for each creator or updater and creation date or update date. For example, when the sample data is data such as a business daily report and a business daily report, each time the data such as the business daily report and the business daily report is saved, it is treated as one sample data. When the sample data is data such as a daily business report and a daily business report, each person in charge who created or updated the daily business report and the daily business report may be treated as one sample data. When the sample data is data such as a daily business report and a daily business report, it may be treated as one sample data for each person in charge and each business day. For example, if the sample data is data posted on the SNS, it is treated as one sample data for each posting.

例えば、サンプルデータ提供サーバ16は、複数のサンプルデータのそれぞれについて、(i)当該サンプルデータの作成時刻又は更新時刻を示す情報、及び、当該サンプルデータの作成者、更新者又は管理者を示す情報の少なくとも一方と、(ii)当該サンプルデータとを対応付けて格納する。サンプルデータ提供サーバ16は、複数のサンプルデータのそれぞれについて、(i)当該サンプルデータの作成時刻又は更新時刻を示す情報、及び、当該サンプルデータの作成者、更新者又は管理者を示す情報の少なくとも一方と、(ii)当該サンプルデータの種類を示す情報と、(iii)当該サンプルデータとを対応付けて格納してもよい。サンプルデータ提供サーバ16は、指標推定システム100からの要求に応じて、指標推定システム100が要求するサンプルデータを、指標推定システム100に送信する。 For example, the sample data providing server 16 (i) information indicating the creation time or update time of the sample data, and information indicating the creator, updater, or administrator of the sample data for each of the plurality of sample data. And (ii) the sample data are stored in association with each other. The sample data providing server 16 at least, for each of the plurality of sample data, (i) at least information indicating the creation time or update time of the sample data, and information indicating the creator, updater, or administrator of the sample data. One side, (ii) information indicating the type of the sample data, and (iii) the sample data may be stored in association with each other. The sample data providing server 16 transmits the sample data requested by the index estimation system 100 to the index estimation system 100 in response to the request from the index estimation system 100.

サンプルデータは、テキストデータであってもよく、音声データであってもよく、画像データであってもよく、任意のアプリケーションプログラム用のデータであってもよい。画像データは、静止画像データであってもよく、動画像データであってもよい。サンプルデータに含まれる情報としては、各種のSNSに登録された情報、各種のニュースで報道された情報、各種のアンケートにより収集された情報、顧客等との折衝において得られた情報、営業日報又は業務日報に記載された情報などが例示される。 The sample data may be text data, audio data, image data, or data for any application program. The image data may be still image data or moving image data. Information included in the sample data includes information registered in various SNS, information reported in various news, information collected by various questionnaires, information obtained through negotiations with customers, daily business reports, or The information described in the daily work report is exemplified.

サンプルデータには、情報提供者の発言若しくはジェスチャにより提示された情報、又は、情報提供者が知覚した情報が含まれてよい。ジェスチャとしては、身振り、手振り、仕草、表情などが例示される。発言、ジェスチャなどに関する情報としては、(i)発言内容又はジェスチャを示す情報、(ii)情報提供者の発言又はジェスチャに関する、上記の担当者による要約又は補足説明を示す情報などが例示される。補足説明としては、上記の発言又はジェスチャの背景、担当者の感想などが例示される。 The sample data may include information presented by a statement or gesture of the information provider, or information perceived by the information provider. Gestures include gestures, gestures, gestures, facial expressions, and the like. Examples of the information regarding the utterance, gesture, and the like include (i) information indicating the content or gesture of the utterance, and (ii) information indicating the summary or supplementary explanation by the person in charge of the utterance or gesture of the information provider. As a supplementary explanation, the background of the above-mentioned statement or gesture, the impression of the person in charge, etc. are exemplified.

例えば、サンプルデータが営業日報、業務日報などのデータである場合、ヒアリング作業の担当者は、ヒアリング対象者の発言、ジェスチャなどに関する情報を営業日報、業務日報などに書き込むことで、当該営業日報、業務日報などを作成又は更新する。この場合のヒアリング対象者は、情報提供者の一例であってよい。例えば、サンプルデータがSNS上に投稿されたデータである場合、投稿者は、自己が知覚した情報を、SNS上に投稿する。この場合の投稿者は、情報提供者の一例であってよい。サンプルデータの種類の詳細は後述される。 For example, when the sample data is data such as a daily business report and a daily business report, the person in charge of the hearing work writes the information about the statements, gestures, etc. of the interviewee into the daily business report, the daily business report, and the like. Create or update daily work reports. The interview target person in this case may be an example of an information provider. For example, when the sample data is data posted on the SNS, the poster posts the information perceived by the user on the SNS. The poster in this case may be an example of an information provider. Details of the types of sample data will be described later.

[指標推定システム100の各部の概要]
本実施形態において、通信部122は、通信ネットワーク10を介して、ユーザ端末12、教師データ提供サーバ14、及び、サンプルデータ提供サーバ16の少なくとも1つとの間で情報を送受する。例えば、通信部122は、ユーザ端末12、教師データ提供サーバ14、及び、サンプルデータ提供サーバ16の少なくとも1つに、各種の要求を送信する。通信部122は、ユーザ端末12、教師データ提供サーバ14、及び、サンプルデータ提供サーバ16の少なくとも1つから、上記の要求に対する応答を受信する。
[Outline of each part of the index estimation system 100]
In the present embodiment, the communication unit 122 exchanges information with at least one of the user terminal 12, the teacher data providing server 14, and the sample data providing server 16 via the communication network 10. For example, the communication unit 122 transmits various requests to at least one of the user terminal 12, the teacher data providing server 14, and the sample data providing server 16. The communication unit 122 receives a response to the above request from at least one of the user terminal 12, the teacher data providing server 14, and the sample data providing server 16.

一実施形態において、通信部122は、ユーザ端末12に対して、指標推定システム100のユーザとのインタラクションを要求する。例えば、通信部122は、ユーザ端末12に、指標推定システム100のユーザに提示される情報を送信する。通信部122は、各種の入力画面の情報を送信してよい。ユーザ端末12は、上記のインタラクションに関する要求に基づいて、通信部122から受け取った情報を、ユーザに提示する。情報の提示態様は特に限定されない。上記の情報は、画像として表示又は投影されてもよく、音声として出力されてもよい。ユーザ端末12は、ユーザに対して情報の入力を要求又は催促してよい。ユーザ端末12は、ユーザが入力した情報を、通信部122に送信してよい。これにより、通信部122は、指標推定システム100のユーザがユーザ端末12に入力した情報を取得することができる。 In one embodiment, the communication unit 122 requests the user terminal 12 to interact with the user of the index estimation system 100. For example, the communication unit 122 transmits the information presented to the user of the index estimation system 100 to the user terminal 12. The communication unit 122 may transmit information of various input screens. The user terminal 12 presents the information received from the communication unit 122 to the user based on the above-mentioned request regarding the interaction. The mode of presenting information is not particularly limited. The above information may be displayed or projected as an image, and may be output as sound. The user terminal 12 may request or urge the user to enter information. The user terminal 12 may transmit the information input by the user to the communication unit 122. Accordingly, the communication unit 122 can acquire the information input to the user terminal 12 by the user of the index estimation system 100.

他の実施形態において、通信部122は、教師データ提供サーバ14に対して、特定の調査結果に関するデータの送信を要求する。これにより、通信部122は、教師データ提供サーバ14から、各種の調査結果のデータを取得することができる。取得された調査結果のデータは、例えば、モデル構築部144における機械学習用の教師データとして用いられる。 In another embodiment, the communication unit 122 requests the teacher data providing server 14 to send data regarding a specific survey result. Thereby, the communication unit 122 can acquire various survey result data from the teacher data providing server 14. The acquired survey result data is used as, for example, machine learning teacher data in the model construction unit 144.

さらに他の実施形態において、通信部122は、サンプルデータ提供サーバ16に対して、特定のサンプルデータの送信を要求する。これにより、通信部122は、サンプルデータ提供サーバ16から、各種のサンプルデータを取得することができる。取得されたサンプルデータは、例えば、指標推定部166における推定処理用の入力データとして用いられる。 In still another embodiment, the communication unit 122 requests the sample data providing server 16 to send specific sample data. Accordingly, the communication unit 122 can acquire various sample data from the sample data providing server 16. The acquired sample data is used as input data for estimation processing in the index estimation unit 166, for example.

本実施形態において、入出力部124は、指標推定システム100のユーザからの情報の入力を受け付ける。入出力部124は、指標推定システム100のユーザに情報を提示する。入出力部124は、指標推定システム100のユーザにより、指標推定システム100のユーザインタフェースとして利用され得る。入出力部124は、キーボード、ポインティングデバイス、タッチパネル、マイク、カメラ、音声入力システム、ジェスチャ入力システムなどの入力装置を有してよい。入出力部124は、表示機器、投影機器、音声出力機器、振動機器などの出力装置を有してよい。 In the present embodiment, the input/output unit 124 receives input of information from the user of the index estimation system 100. The input/output unit 124 presents information to the user of the index estimation system 100. The input/output unit 124 can be used by the user of the index estimation system 100 as a user interface of the index estimation system 100. The input/output unit 124 may include an input device such as a keyboard, a pointing device, a touch panel, a microphone, a camera, a voice input system, and a gesture input system. The input/output unit 124 may include an output device such as a display device, a projection device, a sound output device, and a vibration device.

本実施形態において、格納部126は、各種の情報を格納する。格納部126は、指標推定システム100の情報処理において利用される情報を格納してよい。格納部126は、指標推定システム100の情報処理においせ生成された情報を格納してよい。格納部126の詳細は後述される。 In this embodiment, the storage unit 126 stores various kinds of information. The storage unit 126 may store information used in information processing of the index estimation system 100. The storage unit 126 may store information generated by the information processing of the index estimation system 100. Details of the storage unit 126 will be described later.

本実施形態において、要求受付部128は、指標推定システム100に対する各種の要求を受け付ける。例えば、要求受付部128は、ユーザからの要求であって、指標推定システム100に関する各種の設定を登録するための要求を受け付ける。要求受付部128は、受け付けられた要求を、当該要求の処理に適した要素に転送してよい。 In the present embodiment, the request receiving unit 128 receives various requests to the index estimation system 100. For example, the request receiving unit 128 receives a request from the user for registering various settings related to the index estimation system 100. The request receiving unit 128 may transfer the received request to an element suitable for processing the request.

指標推定システム100に関する設定としては、指標推定システム100が推定する指標の種類に関する設定、指標推定システム100における機械学習に関する各種の設定、指標推定システム100に入力されるサンプルデータに関する各種の設定などが例示される。指標の種類としては、企業短期経済観測調査に記載された各種の指数、景気ウォッチャー調査に記載された各種の指数、生産動態統計調査に記載された各種の指数、景気動向指数などが例示される。機械学習に関する設定としては、機械学習用の教師データに関する設定、学習モデルに関する設定などが例示される。教師データに関する設定としては、データのURI、データ形式などが例示される。サンプルデータに関する設定としては、データのURI、データ形式などが例示される。 Settings related to the index estimation system 100 include settings related to the types of indexes estimated by the index estimation system 100, various settings related to machine learning in the index estimation system 100, and various settings related to sample data input to the index estimation system 100. It is illustrated. Examples of the types of indicators include various indices listed in the Corporate Short-term Economic Observation Survey, various indices listed in the Business Watcher Survey, various indices listed in the Production Statistics Survey, and Business Trend Index. .. Examples of settings related to machine learning include settings related to machine learning teacher data and settings related to learning models. Examples of settings relating to teacher data include a data URI and a data format. Examples of settings related to sample data include a data URI and a data format.

一実施形態において、要求受付部128が、指標推定システム100のユーザからの要求を受け付ける。要求受付部128は、ユーザ端末12又は入出力部124を介して、ユーザからの要求を取得してよい。他の実施形態において、要求受付部128は、ユーザ端末12、教師データ提供サーバ14及びサンプルデータ提供サーバ16の少なくとも1つからの要求を受け付けてよい。 In one embodiment, the request receiving unit 128 receives a request from the user of the index estimation system 100. The request reception unit 128 may acquire a request from the user via the user terminal 12 or the input/output unit 124. In another embodiment, the request receiving unit 128 may receive a request from at least one of the user terminal 12, the teacher data providing server 14, and the sample data providing server 16.

本実施形態において、教師データ取得部142は、教師データ提供サーバ14に対して、特定の調査結果のデータの送信を要求する。調査結果のデータは、例えば、当該調査の種類と、当該調査の対象期間とにより特定される。これにより、教師データ取得部142は、教師データ提供サーバ14から、特定の調査結果のデータを取得することができる。 In the present embodiment, the teacher data acquisition unit 142 requests the teacher data providing server 14 to transmit data of a specific survey result. The data of the survey result is specified by, for example, the type of the survey and the target period of the survey. Thereby, the teacher data acquisition unit 142 can acquire the data of the specific survey result from the teacher data providing server 14.

一実施形態において、教師データ取得部142は、取得された調査結果のデータを、格納部126に格納する。他の実施形態において、教師データ取得部142は、取得された調査結果のデータを、モデル構築部144に出力してよい。 In one embodiment, the teacher data acquisition unit 142 stores the acquired survey result data in the storage unit 126. In another embodiment, the teacher data acquisition unit 142 may output the acquired survey result data to the model construction unit 144.

本実施形態において、モデル構築部144は、教師データ取得部142が取得した調査結果のデータを教師データとして用いて、指標推定部166において利用される学習モデルを構築する。モデル構築部144の詳細は後述される。 In the present embodiment, the model construction unit 144 constructs a learning model used in the index estimation unit 166 by using the survey result data acquired by the teacher data acquisition unit 142 as the teacher data. Details of the model construction unit 144 will be described later.

本実施形態において、サンプルデータ取得部162は、サンプルデータ提供サーバ16に対して、特定のサンプルデータの送信を要求する。これにより、通信部122は、サンプルデータ提供サーバ16から、各種のサンプルデータを取得することができる。サンプルデータ取得部162は、1以上のサンプルデータのそれぞれを、各サンプルデータの内容に関連する時期、各サンプルデータが記録された時期、又は、各サンプルデータを含む電子ファイルが作成若しくは更新された時期を示す情報と対応づけて取得してよい。サンプルデータ取得部162は、1以上のサンプルデータのそれぞれを、各サンプルデータの情報提供者の属性を示す情報と対応付けて取得してもよい。 In the present embodiment, the sample data acquisition unit 162 requests the sample data providing server 16 to transmit specific sample data. Accordingly, the communication unit 122 can acquire various sample data from the sample data providing server 16. The sample data acquisition unit 162 determines that each of the one or more sample data is associated with the content of each sample data, each sample data is recorded, or an electronic file including each sample data is created or updated. It may be acquired in association with the information indicating the time. The sample data acquisition unit 162 may acquire each of the one or more sample data in association with the information indicating the attribute of the information provider of each sample data.

サンプルデータは、例えば、(i)当該サンプルデータの種類と、(ii)当該サンプルデータが作成若しくは更新された時刻、又は、当該時刻に関する範囲(上記の時刻、又は、当該時刻に関する範囲は、時期と称される場合がある。)とにより特定される。サンプルデータの種類は、例えば、当該サンプルデータを管理するサンプルデータ提供サーバ16のURLにより特定される。サンプルデータの種類は、当該種類を識別するための識別情報により特定されてもよい。サンプルデータの種類は、当該サンプルデータの名称、作成者、更新者、及び、情報提供者の少なくとも1つにより特定されてもよい。サンプルデータの種類は、当該サンプルデータの内容を示す情報を提供した情報提供者の属性により特定されてもよい。情報提供者の属性は、年齢、性別、評価対象との関連度合などが例示される。情報提供者の属性の具体例は、上述されたヒアリング対象者の属性の具体例と同様であってよい。 The sample data includes, for example, (i) the type of the sample data, (ii) the time when the sample data is created or updated, or the range related to the time (the above time or the range related to the time is May be referred to as). The type of sample data is specified by, for example, the URL of the sample data providing server 16 that manages the sample data. The type of sample data may be specified by the identification information for identifying the type. The type of sample data may be specified by at least one of the name of the sample data, the creator, the updater, and the information provider. The type of sample data may be specified by the attribute of the information provider who has provided the information indicating the content of the sample data. Examples of the attribute of the information provider include age, sex, and degree of association with the evaluation target. The specific example of the attribute of the information provider may be the same as the specific example of the attribute of the interview target person described above.

サンプルデータが作成又は更新された時期は、当該サンプルデータを格納する電子ファイルに当該サンプルデータが記録された時期であってもよく、当該電子ファイルが作成又は更新された時期であってもよい。なお、サンプルデータが作成又は更新された時期の代わりに、当該サンプルデータの内容に関連する時期が用いられてもよい。例えば、サンプルデータ中に、「2018年の12月の売り上げは、前年比10%増であった」というように、評価対象に関する時期を示す情報が含まれている場合、当該時期が、当該サンプルデータの内容に関連する時期として利用される。 The time when the sample data is created or updated may be the time when the sample data is recorded in the electronic file that stores the sample data, or the time when the electronic file is created or updated. Instead of the time when the sample data is created or updated, the time related to the content of the sample data may be used. For example, when the sample data includes information indicating the period regarding the evaluation target, such as “Sales in December 2018 increased by 10% compared to the previous year”, the relevant period is the sample. It is used as a time related to the content of data.

一実施形態において、サンプルデータ取得部162は、取得されたサンプルデータを、格納部126に格納する。サンプルデータ取得部162は、取得されたサンプルデータを、当該サンプルデータの種類を区別するための情報(種別情報と称される場合がある)と対応付けて、格納部126に格納してもよい。他の実施形態において、サンプルデータ取得部162は、取得されたサンプルデータを、指標推定部166に出力してよい。さらに他の実施形態において、取得されたサンプルデータがテキストデータ以外の形式のデータである場合、又は、取得されたサンプルデータにテキストデータ以外の形式のデータが含まれる場合、サンプルデータ取得部162は、取得されたサンプルデータを、テキストデータ生成部164に出力してよい。 In one embodiment, the sample data acquisition unit 162 stores the acquired sample data in the storage unit 126. The sample data acquisition unit 162 may store the acquired sample data in the storage unit 126 in association with information for distinguishing the type of the sample data (may be referred to as type information). .. In another embodiment, the sample data acquisition unit 162 may output the acquired sample data to the index estimation unit 166. In still another embodiment, when the acquired sample data is data in a format other than text data, or when the acquired sample data includes data in a format other than text data, the sample data acquisition unit 162 The acquired sample data may be output to the text data generation unit 164.

本実施形態において、サンプルデータ取得部162が取得したサンプルデータがテキストデータ以外の形式のデータである場合、又は、当該サンプルデータにテキストデータ以外の形式のデータが含まれる場合、テキストデータ生成部164は、当該テキストデータ以外の形式のデータから、テキストデータを生成する。テキストデータ生成部164は、特定のサンプルデータから生成されたテキストデータを、当該サンプルデータの一部として、格納部126に格納してよい。テキストデータ生成部164は、特定のサンプルデータから生成されたテキストデータを、当該サンプルデータの一部として、指標推定部166に出力してもよい。 In the present embodiment, when the sample data acquired by the sample data acquisition unit 162 is data in a format other than text data, or when the sample data includes data in a format other than text data, the text data generation unit 164 Generates text data from data in a format other than the text data. The text data generation unit 164 may store the text data generated from the specific sample data in the storage unit 126 as a part of the sample data. The text data generation unit 164 may output the text data generated from the specific sample data to the index estimation unit 166 as a part of the sample data.

一実施形態において、テキストデータ生成部164は、サンプルデータに含まれる音声データに対して、音声認識処理を実行することで、当該音声データに含まれる人間の音声を記録したテキストデータを生成する。他の実施形態において、テキストデータ生成部164は、サンプルデータに含まれる画像データに対して、画像認識処理を実行することで、当該画像データに含まれる文字又は手話を記録したテキストデータを生成する。 In one embodiment, the text data generation unit 164 generates the text data in which the human voice included in the voice data is recorded by performing the voice recognition process on the voice data included in the sample data. In another embodiment, the text data generation unit 164 performs text recognition processing on the image data included in the sample data to generate text data in which characters or sign language included in the image data are recorded. ..

本実施形態において、指標推定部166は、サンプルデータ取得部162が取得したサンプルデータを用いて、ユーザにより指定された種類の指標の推定値を出力する。出力される指標の種類は、例えば、ユーザによる設定又は初期設定に基づいて決定される。 In this embodiment, the index estimation unit 166 uses the sample data acquired by the sample data acquisition unit 162 to output the estimated value of the index of the type designated by the user. The type of the index to be output is determined based on, for example, the setting by the user or the initial setting.

具体的には、まず、指標推定部166は、サンプルデータ取得部162が取得した複数のサンプルデータの中から、ユーザにより指定された期間に作成又は更新された複数のサンプルデータを抽出する。次に、指標推定部166は、抽出された複数のサンプルデータのそれぞれを1以上の文に分割することで、分析対象となる複数の文を得る。次に、指標推定部166は、分析対象となる複数の文の中から、経済活動に関連する可能性の高い文を、評価対象となる文として抽出する。 Specifically, first, the index estimation unit 166 extracts a plurality of sample data created or updated in the period designated by the user from the plurality of sample data acquired by the sample data acquisition unit 162. Next, the index estimation unit 166 obtains a plurality of sentences to be analyzed by dividing each of the extracted plurality of sample data into one or more sentences. Next, the index estimation unit 166 extracts a sentence having a high possibility of being associated with economic activity as a sentence to be evaluated from the plurality of sentences to be analyzed.

次に、指標推定部166は、評価対象となる文のそれぞれについて、当該文により示される経済活動の状態又は動向の程度を評価して、当該評価に対応するスコア(評価スコアと称される場合がある。)を付与する。次に、指標推定部166は、評価対象となる文のそれぞれに付与された評価スコアを、ユーザにより指定された指標の種類に応じて適切に処理することで、当該指標を算出する。 Next, the index estimating unit 166 evaluates, for each of the sentences to be evaluated, the degree of the state or trend of the economic activity indicated by the sentence, and a score corresponding to the evaluation (in the case of an evaluation score). There is). Next, the index estimation unit 166 calculates the index by appropriately processing the evaluation score given to each sentence to be evaluated according to the type of the index specified by the user.

本実施形態によれば、指標推定システム100は、各種のSNSに登録された情報、各種のニュースで報道された情報、各種のアンケートにより収集された情報、顧客等との折衝において得られた情報(折衝記録に記載された情報と称される場合がある)、営業日報又は業務日報に記載された情報などのビックデータを利用して、評価対象の評価に関連する指標を算出することができる。指標推定部166の詳細は後述される。 According to the present embodiment, the index estimation system 100 uses the information registered in various SNSs, the information reported in various news, the information collected by various questionnaires, and the information obtained in negotiations with customers and the like. It is possible to calculate the index related to the evaluation of the evaluation target by using big data such as the information described in the business daily report or the business daily report (sometimes referred to as the information described in the negotiation record). .. Details of the index estimation unit 166 will be described later.

本実施形態においては、指標推定システム100が、経済活動を評価対象とし、経済活動の状態又は動向を示す指標として各種の経済指標の推定値を出力する場合を例として、指標推定システム100の詳細が説明された。しかしながら、指標推定システム100の評価対象は、経済活動に限定されない。他の実施形態において、指標推定システム100は、個人、団体若しくは法人、商品若しくはサービス、又は、地域若しくはランドマークの人気度又は知名度を評価対象としてもよい。 In the present embodiment, details of the index estimation system 100 will be described as an example in which the index estimation system 100 targets an economic activity as an evaluation target and outputs estimated values of various economic indexes as an index indicating a state or trend of the economic activity. Was explained. However, the evaluation target of the index estimation system 100 is not limited to economic activity. In another embodiment, the index estimation system 100 may evaluate the popularity or popularity of an individual, a group or a corporation, a product or a service, or a region or a landmark.

また、本実施形態においては、指標推定システム100が、政府、中央銀行などの公的機関が公表する経済活動に関する調査結果を教師データとして利用する場合を例として、指標推定システム100の詳細が説明される。しかしながら、指標推定システム100は本実施形態に限定されない。他の実施形態において、指標推定システム100は、民間の調査機関による調査結果を教師データとして利用してもよい。 Further, in the present embodiment, the details of the index estimation system 100 will be described by taking as an example the case where the index estimation system 100 uses, as teacher data, a survey result regarding economic activities published by a public institution such as a government or a central bank. To be done. However, the index estimation system 100 is not limited to this embodiment. In another embodiment, the index estimation system 100 may use a survey result by a private research institution as teacher data.

指標推定システム100は、機械学習装置の一例であってよい。通信部122は、条件取得部、種別情報取得部、期間情報取得部、テキストデータ取得部の一例であってよい。入出力部124は、条件取得部、種別情報取得部、期間情報取得部、テキストデータ取得部の一例であってよい。要求受付部128は、条件取得部、種別情報取得部、期間情報取得部、テキストデータ取得部の一例であってよい。モデル構築部144は、第1モデル構築部、及び、第2モデル構築部の一例であってよい。サンプルデータ取得部162は、種別情報取得部、及び、テキストデータ取得部の一例であってよい。テキストデータ生成部164は、種別情報取得部、及び、テキストデータ取得部の一例であってよい。指標推定部166は、抽出部、指数算出部の一例であってよい。 The index estimation system 100 may be an example of a machine learning device. The communication unit 122 may be an example of a condition acquisition unit, a type information acquisition unit, a period information acquisition unit, and a text data acquisition unit. The input/output unit 124 may be an example of a condition acquisition unit, a type information acquisition unit, a period information acquisition unit, and a text data acquisition unit. The request reception unit 128 may be an example of a condition acquisition unit, a type information acquisition unit, a period information acquisition unit, and a text data acquisition unit. The model building unit 144 may be an example of a first model building unit and a second model building unit. The sample data acquisition unit 162 may be an example of a type information acquisition unit and a text data acquisition unit. The text data generation unit 164 may be an example of a type information acquisition unit and a text data acquisition unit. The index estimation unit 166 may be an example of an extraction unit or an index calculation unit.

景況感は、経済活動に関する評価の一例であってよい。経済活動は、評価対象の一例であってよい。調査対象は、評価対象の一例であってよい。公的な調査結果は、評価情報の一例であってよい。サンプルデータは、テキストデータの一例であってよい。経済指標は、指標の一例であってよい。ヒアリング対象者は、情報提供者の一例であってよい。 Business confidence may be an example of an evaluation regarding economic activity. Economic activity may be an example of an evaluation target. The survey target may be an example of an evaluation target. The official survey result may be an example of evaluation information. The sample data may be an example of text data. The economic index may be an example of the index. The interview target person may be an example of an information provider.

[指標推定システム100の各部の具体的な構成]
指標推定システム100の各部は、ハードウエアにより実現されてもよく、ソフトウエアにより実現されてもよく、ハードウエアとソフトウエアとの組み合わせにより実現されてもよい。指標推定システム100の構成要素の少なくとも一部がソフトウエアにより実現される場合、当該ソフトウエアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したプログラムを起動することにより実現されてよい。
[Specific Configuration of Each Part of Index Estimation System 100]
Each unit of the index estimation system 100 may be implemented by hardware, software, or a combination of hardware and software. When at least a part of the constituent elements of the index estimation system 100 is realized by software, the constituent element realized by the software is a program that defines an operation related to the constituent element in an information processing device having a general configuration. May be implemented by activating.

プログラムは、CD−ROM、DVD−ROM、メモリ、ハードディスクなどのコンピュータ読み取り可能な媒体に記憶されていてもよく、ネットワークに接続された記憶装置に記憶されていてもよい。プログラムは、コンピュータ読み取り可能な媒体又はネットワークに接続された記憶装置から、指標推定システム100の少なくとも一部を構成するコンピュータにインストールされてよい。プログラムが実行されることにより、コンピュータが、指標推定システム100の各部の少なくとも一部として機能してもよい。 The program may be stored in a computer-readable medium such as a CD-ROM, a DVD-ROM, a memory, or a hard disk, or may be stored in a storage device connected to the network. The program may be installed in a computer forming at least a part of the index estimation system 100 from a computer-readable medium or a storage device connected to a network. By executing the program, the computer may function as at least a part of each unit of the index estimation system 100.

コンピュータを指標推定システム100の各部の少なくとも一部として機能させるプログラムは、指標推定システム100の各部の動作を規定したモジュールを備えてよい。これらのプログラム又はモジュールは、データ処理装置、入力装置、出力装置、記憶装置等に働きかけて、コンピュータを指標推定システム100の各部として機能させたり、コンピュータに指標推定システム100の各部における情報処理方法を実行させたりする。 The program that causes the computer to function as at least a part of each unit of the index estimation system 100 may include a module that defines the operation of each unit of the index estimation system 100. These programs or modules work on a data processing device, an input device, an output device, a storage device, or the like to cause a computer to function as each unit of the index estimation system 100, or to cause a computer to perform an information processing method in each unit of the index estimation system 100. Let it run.

プログラムに記述された情報処理は、当該プログラムがコンピュータに読込まれることにより、当該プログラムに関連するソフトウエアと、指標推定システム100の各種のハードウエア資源とが協働した具体的手段として機能する。そして、上記の具体的手段が、本実施形態におけるコンピュータの使用目的に応じた情報の演算又は加工を実現することにより、当該使用目的に応じた指標推定システム100が構築される。 The information processing described in the program functions as a specific means in which the software related to the program and various hardware resources of the index estimation system 100 cooperate with each other when the program is read by the computer. .. Then, the above-mentioned specific means realizes calculation or processing of information according to the purpose of use of the computer in the present embodiment, whereby the index estimation system 100 according to the purpose of use is constructed.

上記のプログラムは、コンピュータに、機械学習方法を実行させるためのプログラムであってよい。上記の機械学習方法は、例えば、(i)評価対象に関する評価、及び、(ii)評価対象の状態又は評価の理由を示す1以上の説明文が対応付けられた評価情報に含まれる1以上の説明文を教師データとして利用して、入力された文が、評価対象の状態、評価対象に対する評価又は評価の理由を示す文であるか否かを判定するための第1学習モデルを構築する第1モデル構築段階を有する。上記の機械学習方法は、例えば、第1モデル構築段階において構築された第1学習モデルを用いて、テキストデータに含まれる1以上の文の中から、評価対象に関連する文を抽出する抽出段階を有する。 The above program may be a program for causing a computer to execute a machine learning method. The machine learning method described above includes, for example, (i) an evaluation regarding an evaluation target, and (ii) one or more evaluation information included in the evaluation information associated with one or more explanatory texts indicating the state of the evaluation target or the reason for the evaluation. Constructing a first learning model for determining whether or not the input sentence is a sentence indicating the state of the evaluation target, the evaluation of the evaluation target, or the reason for the evaluation, using the explanatory text as the teacher data. It has one model building stage. The machine learning method is, for example, an extraction step of extracting a sentence related to the evaluation target from one or more sentences included in the text data using the first learning model constructed in the first model construction stage. Have.

図2は、格納部126の内部構成の一例を概略的に示す。本実施形態において、格納部126は、設定情報格納部222と、サンプルデータ格納部226と、教師データ格納部224と、モデル情報格納部228とを備える。 FIG. 2 schematically shows an example of the internal configuration of the storage unit 126. In the present embodiment, the storage unit 126 includes a setting information storage unit 222, a sample data storage unit 226, a teacher data storage unit 224, and a model information storage unit 228.

本実施形態において、設定情報格納部222は、要求受付部128が受け付けた、指標推定システム100に関する設定を示す情報を格納する。上記の設定としては、指標推定システム100が推定する指標の種類に関する設定、指標推定システム100における機械学習に関する各種の設定、指標推定システム100に入力されるサンプルデータに関する各種の設定などが例示される。 In the present embodiment, the setting information storage unit 222 stores the information indicating the setting related to the index estimation system 100 accepted by the request accepting unit 128. Examples of the above settings include settings related to the type of index estimated by the index estimation system 100, various settings related to machine learning in the index estimation system 100, and various settings related to sample data input to the index estimation system 100. ..

本実施形態において、教師データ格納部224は、教師データ取得部142が取得した各種のデータを、モデル構築部144のモデル構築処理において利用される教師データとして格納する。教師データ格納部224は、例えば、複数の教師データのそれぞれについて、当該データの識別情報と、当該データの種類を示す情報及び当該データの対象期間を示す情報の少なくとも一方と、当該データとを対応付けて格納してよい。 In the present embodiment, the teacher data storage unit 224 stores various data acquired by the teacher data acquisition unit 142 as teacher data used in the model building process of the model building unit 144. For example, the teacher data storage unit 224 associates, for each of the plurality of teacher data, identification information of the data, at least one of information indicating the type of the data and information indicating the target period of the data, and the data. It may be attached and stored.

データの種類は、当該データの内容を示す情報を提供した情報提供者の属性であってよい。教師データが各種の調査結果のデータである場合、情報提供者としては、当該調査におけるヒアリング対象者が例示される。上記のデータが特定の調査結果のデータである場合、データの種類の具体例は、上述された調査の種類の具体例と同様であってよい。 The data type may be an attribute of the information provider who has provided the information indicating the content of the data. When the teacher data is data of various survey results, the information provider is exemplified by the interview target person in the survey. When the above-mentioned data is data of a specific survey result, the specific example of the data type may be the same as the specific example of the survey type described above.

本実施形態において、サンプルデータ格納部226は、サンプルデータ取得部162が取得したサンプルデータを格納する。サンプルデータ格納部226は、複数のサンプルデータのそれぞれについて、(i)当該サンプルデータの識別情報と、(ii)当該サンプルデータの種類を示す情報、当該サンプルデータの作成時刻又は更新時刻を示す情報、及び、当該サンプルデータの作成者、更新者又は管理者を示す情報の少なくとも1つと、(iii)当該サンプルデータとを対応付けて格納してよい。サンプルデータ格納部226は、複数のサンプルデータのそれぞれについて、当該サンプルデータとともに、又は、当該サンプルデータに代えて、テキストデータ生成部164が生成したテキストデータを格納してよい。 In the present embodiment, the sample data storage unit 226 stores the sample data acquired by the sample data acquisition unit 162. The sample data storage unit 226, for each of the plurality of sample data, (i) identification information of the sample data, (ii) information indicating the type of the sample data, and information indicating the creation time or update time of the sample data. , And at least one piece of information indicating the creator, updater, or administrator of the sample data and (iii) the sample data may be stored in association with each other. The sample data storage unit 226 may store the text data generated by the text data generation unit 164 for each of the plurality of sample data together with or instead of the sample data.

本実施形態において、モデル情報格納部228は、モデル構築部144が構築した学習モデルに関する各種の情報を格納する。例えば、モデル情報格納部228は、複数の学習モデルのそれぞれについて、当該モデルの識別情報と、当該モデルのアルゴリズムを示す情報と、当該モデルのパラメータの値を示す情報とを対応付けて格納する。モデル情報格納部228は、複数の学習モデルのそれぞれについて、当該モデルに関する他の情報を格納してもよい。 In the present embodiment, the model information storage unit 228 stores various kinds of information regarding the learning model constructed by the model construction unit 144. For example, the model information storage unit 228 stores, for each of the plurality of learning models, identification information of the model, information indicating the algorithm of the model, and information indicating the value of the parameter of the model in association with each other. The model information storage unit 228 may store, for each of the plurality of learning models, other information regarding the model.

図3は、データテーブル300の一例を概略的に示す。データテーブル300は、教師データ格納部224に格納された教師データの一例であってよい。データテーブル300は、特定の期間を対象期間とする景気ウォッチャー調査の一例であってよい。 FIG. 3 schematically shows an example of the data table 300. The data table 300 may be an example of teacher data stored in the teacher data storage unit 224. The data table 300 may be an example of a business watcher survey that covers a specific period.

景気ウォッチャー調査は、地域の景気に関連の深い動きを観察できる立場にある人々(ヒアリング対象者と称される場合がある。)の協力を得て、地域ごとに景気動向を的確かつ迅速に把握し、景気動向判断の基礎資料とすることを目的として実施される。景気ウォッチャー調査における調査項目としては、(i)景気の現状に対する判断、(ii)現状に対する判断の理由、(iii)上記の理由に関する追加説明、及び、具体的状況の説明、(iv)景気の先行きに対する判断、(v)先行きに対する判断の理由などが例示される。 The Economic Watcher Survey, with the cooperation of those who are in a position to observe deep movements related to the local economy (sometimes referred to as interviewees), can accurately and quickly grasp the economic trends in each region. However, it will be carried out with the purpose of using it as a basic material for determining economic trends. Survey items in the economic watcher survey include (i) judgment of the current economic situation, (ii) reason for judgment of the current situation, (iii) additional explanation on the above reason, and explanation of concrete situation, (iv) economic situation Examples include the judgment regarding the future and (v) the reason for the judgment regarding the future.

本実施形態において、データテーブル300は、経済活動の分野を示す情報312と、調査対象となる地域を示す情報314と、ヒアリング対象者の業種及び職種を示す情報316と、景気の現状判断を示す情報322と、判断の理由を示す情報324と、追加説明及び具体的状況の説明を示す情報326とを対応付けて格納する。データテーブル300の各行は、評価情報の一例であってよい。経済活動の分野を示す情報312、調査対象となる地域を示す情報314、及び、ヒアリング対象者の業種及び職種を示す情報316のそれぞれは、調査の種類の一例であってよい。景気の現状判断を示す情報322は、評価対象に関する評価の一例であってよい。判断の理由を示す情報324は、評価の理由を示す説明文の一例であってよい。追加説明及び具体的状況の説明を示す情報326は、評価対象の状態を示す説明文の一例であってよい。 In the present embodiment, the data table 300 indicates information 312 indicating the field of economic activity, information 314 indicating the area to be surveyed, information 316 indicating the type and occupation of the interviewee, and the current economic situation judgment. The information 322, the information 324 indicating the reason for the determination, and the information 326 indicating the additional explanation and the explanation of the specific situation are stored in association with each other. Each row of the data table 300 may be an example of evaluation information. Each of the information 312 indicating the field of economic activity, the information 314 indicating the area to be surveyed, and the information 316 indicating the type of business and occupation of the interviewee may be an example of the type of survey. The information 322 indicating the current economic situation determination may be an example of an evaluation regarding an evaluation target. The information 324 indicating the reason for the determination may be an example of an explanatory note indicating the reason for the evaluation. The information 326 indicating the additional explanation and the explanation of the specific situation may be an example of the explanation sentence indicating the state of the evaluation target.

なお、データテーブル300のデータ構造は本実施形態に限定されない。他の実施形態において、データテーブル300は、経済活動の分野を示す情報312、調査対象となる地域を示す情報314、及び、ヒアリング対象者の業種及び職種を示す情報316、判断の理由を示す情報324の少なくとも1つを備えなくてもよい。さらに他の実施形態において、データテーブル300は、データテーブル300の各行を識別するための識別情報を格納するための列、調査の種類を示す情報を格納するための列、及び、調査が実施された時期を示す情報を格納するための列の少なくとも1つをさらに備えてもよい。 The data structure of the data table 300 is not limited to this embodiment. In another embodiment, the data table 300 includes information 312 indicating the field of economic activity, information 314 indicating the area to be surveyed, information 316 indicating the type and type of job of the interviewee, and information indicating the reason for the judgment. At least one of 324 may not be provided. In yet another embodiment, the data table 300 includes a column for storing identification information for identifying each row of the data table 300, a column for storing information indicating the type of survey, and a survey. It may further comprise at least one of the columns for storing information indicating the time of day.

図4は、データテーブル400の一例を概略的に示す。データテーブル400は、サンプルデータ格納部226に格納されたサンプルデータの一例であってよい。本実施形態においては、サンプルデータとして、企業の営業担当者が、顧客との会話、折衝などの内容を記録した営業日報が入力された場合を例として、データテーブル400の詳細が説明される。しかしながら、サンプルデータが本実施形態に限定されないことに留意されたい。本実施形態において、上記の顧客は、ヒアリング対象者の一例であってよい。 FIG. 4 schematically shows an example of the data table 400. The data table 400 may be an example of the sample data stored in the sample data storage unit 226. In the present embodiment, the details of the data table 400 will be described by taking as an example the case where a sales person in charge of a company inputs a daily business report recording the contents of conversations with customers, negotiations, etc. as sample data. However, it should be noted that the sample data is not limited to this embodiment. In the present embodiment, the customer may be an example of a hearing target person.

本実施形態において、データテーブル400の各行(レコードと称される場合がある。)には、単一の文の情報が格納される。例えば、単一のサンプルデータに複数の文が含まれる場合、データテーブル400は、当該サンプルデータに関する情報を、複数のレコードに分割して格納する。複数のレコードのそれぞれには、上記の複数の文のそれぞれに関する情報が格納される。 In the present embodiment, each row (may be referred to as a record) of the data table 400 stores information of a single sentence. For example, when a single sample data includes a plurality of sentences, the data table 400 stores the information about the sample data by dividing it into a plurality of records. In each of the plurality of records, information regarding each of the plurality of sentences is stored.

本実施形態において、データテーブル400は、サンプルID412と、センテンスID414と、各文の記録時刻を示す情報416と、各文の内容を示す情報418と、データの種類を示す情報420とを対応づけて格納する。サンプルID412は、複数のサンプルデータのそれぞれを識別することのできる情報であればよく、その詳細は特に限定されない。センテンスID414は、複数の文のそれぞれを識別することのできる情報であればよく、その詳細は特に限定されない。 In the present embodiment, the data table 400 associates a sample ID 412, a sentence ID 414, information 416 indicating the recording time of each sentence, information 418 indicating the content of each sentence, and information 420 indicating the type of data. To store. The sample ID 412 may be any information that can identify each of the plurality of sample data, and the details thereof are not particularly limited. The sentence ID 414 may be any information as long as it can identify each of a plurality of sentences, and the details thereof are not particularly limited.

記録時刻を示す情報416は、複数の文のそれぞれが作成又は更新された時刻を示す。内容を示す情報418は、複数の文のそれぞれの内容を示す。データの種類を示す情報420は、複数の文のそれぞれの種類を示す。文の種類としては、当該文が含まれていたサンプルデータの種類、当該文の内容を示す情報を提供した情報提供者の属性などが例示される。サンプルデータが営業日報、業務日報又は折衝記録に関するテキストデータである場合、情報提供者としては、ヒアリング対象となった顧客などが例示される。 The information 416 indicating the recording time indicates the time when each of the plurality of sentences was created or updated. The information 418 indicating the content indicates the content of each of the plurality of sentences. The information 420 indicating the type of data indicates each type of a plurality of sentences. Examples of the type of sentence include the type of sample data in which the sentence was included, the attribute of the information provider who provided the information indicating the content of the sentence, and the like. When the sample data is text data related to a daily business report, a daily business report, or a negotiation record, the information provider is exemplified by a customer or the like who is a hearing target.

図4に示された例によれば、データの種類を示す情報420として、情報提供者の属性を示す情報が格納されている。上記の属性は、例えば、サンプルデータ取得部162が、営業日報の文章又は各文を解析することにより、各文に付与される。上記の属性は、営業担当者が、営業日報の文章又は各文に対応する属性を入出力部124に入力することにより、各文に付与されてもよい。 According to the example shown in FIG. 4, as the information 420 indicating the type of data, information indicating the attribute of the information provider is stored. The above-mentioned attribute is given to each sentence, for example, when the sample data acquisition unit 162 analyzes the sentence of the daily business report or each sentence. The above-mentioned attribute may be given to each sentence by the sales staff inputting the sentence of the daily business report or the attribute corresponding to each sentence to the input/output unit 124.

なお、データテーブル400のデータ構造は本実施形態に限定されない。他の実施形態において、複数の文のそれぞれについて、データテーブル400は、サンプルID412と、センテンスID414と、内容を示す情報418とを対応付けて格納する第1のデータテーブルと、複数のサンプルデータのそれぞれについて、サンプルID412と、記録時刻を示す情報416とを対応付けて格納する第2のデータテーブルとに分割されていてもよい。 The data structure of the data table 400 is not limited to this embodiment. In another embodiment, for each of the plurality of sentences, the data table 400 includes a first data table that stores the sample ID 412, the sentence ID 414, and the information 418 indicating the content in association with each other, and the plurality of sample data. Each of them may be divided into a second data table that stores the sample ID 412 and the information 416 indicating the recording time in association with each other.

図5は、モデル構築部144の内部構成の一例を概略的に示す。本実施形態において、モデル構築部144は、抽出用モデル構築部522と、評価用モデル構築部524とを備える。 FIG. 5 schematically shows an example of the internal configuration of the model construction unit 144. In the present embodiment, the model construction unit 144 includes an extraction model construction unit 522 and an evaluation model construction unit 524.

上述のとおり、モデル構築部144は、指標推定部166において利用される各種の学習モデルを構築する。上述のとおり、指標推定部166は、分析対象となる複数の文の中から、経済活動に関連する可能性の高い文を、評価対象となる文として抽出する。また、指標推定部166は、評価対象となる文のそれぞれについて、当該文により示される経済活動の状態又は動向の程度を評価して、当該評価に対応するスコアを付与する。 As described above, the model construction unit 144 constructs various learning models used in the index estimation unit 166. As described above, the index estimation unit 166 extracts a sentence having a high possibility of being associated with economic activity as a sentence to be evaluated from a plurality of sentences to be analyzed. In addition, the index estimation unit 166 evaluates, for each sentence to be evaluated, the degree of the state or trend of the economic activity indicated by the sentence, and gives a score corresponding to the evaluation.

本実施形態において、抽出用モデル構築部522は、上記の分析対象となる複数の文の中から、評価対象となる文を抽出するための学習モデルを構築する。具体的には、抽出用モデル構築部522は、(i)評価対象に関する評価、及び、(ii)評価対象の状態又は評価の理由を示す1以上の説明文が対応付けられた評価情報に含まれる1以上の説明文を教師データとして利用して、入力された文が、評価対象の状態、評価対象に対する評価又は評価の理由を示す文であるか否かを判定するための学習モデルを構築する。 In the present embodiment, the extraction model construction unit 522 constructs a learning model for extracting a sentence to be evaluated from a plurality of sentences to be analyzed. Specifically, the extraction model construction unit 522 includes (i) the evaluation regarding the evaluation target, and (ii) the evaluation information associated with one or more explanatory sentences indicating the state of the evaluation target or the reason for the evaluation. Construct a learning model for determining whether or not the input sentence is a sentence indicating the state of the evaluation target, the evaluation of the evaluation target, or the reason for the evaluation, by using one or more explanatory sentences that are used as teacher data. To do.

例えば、抽出用モデル構築部522は、データテーブル300を構成する複数のレコードの追加説明及び具体的状況の説明を示す情報326を教師データとして利用して、入力された文が、(i)経済活動に対する評価、(ii)経済活動の状態、又は、(iii)当該評価の理由を示す文であるか否かを判定するための学習モデルを構築する。上記の学習モデルによれば、当該学習モデルに入力された複数の文のそれぞれは、追加説明及び具体的状況の説明を示す情報326に含まれる文に類似する文と、追加説明及び具体的状況の説明を示す情報326に含まれる文に類似しない文とに分類される。そして、追加説明及び具体的状況の説明を示す情報326に含まれる文に類似する文は、(i)経済活動に対する評価、(ii)経済活動の状態、又は、(iii)当該評価の理由を示す文であると判定される。 For example, the extraction model construction unit 522 uses the information 326 indicating the additional description and the specific situation of the plurality of records constituting the data table 300 as teacher data, and the input sentence is (i) economic. Build a learning model to determine whether it is an evaluation of an activity, (ii) a state of economic activity, or (iii) a statement showing the reason for the evaluation. According to the above learning model, each of the plurality of sentences input to the learning model is similar to the sentence included in the information 326 indicating the additional explanation and the specific situation, and the additional explanation and the specific situation. The sentence is classified as a sentence that is not similar to the sentence included in the information 326 indicating the description. Then, a sentence similar to the sentence included in the information 326 indicating the additional explanation and the explanation of the specific situation indicates (i) evaluation of economic activity, (ii) state of economic activity, or (iii) reason for the evaluation. It is determined that the sentence is the one shown.

上記の学習モデルの種類は、特に限定されない。学習モデルの種類としては、ニューラルネットワークモデル(NNと略称される場合がある)、畳み込みニューラルネットワーク(CNNと略称される場合がある。)、ロジスティック回帰モデル(LRと略称される場合がある)、シンプルワードエンベッディングモデル(SWEMと略称される場合がある)、ロングショートタームメモリモデル(LSTMと略称される場合がある)、Bidirectional LTSMなどが例示される。 The type of learning model described above is not particularly limited. The types of learning models include a neural network model (sometimes abbreviated as NN), a convolutional neural network (sometimes abbreviated as CNN), a logistic regression model (sometimes abbreviated as LR), Examples include a simple word embedding model (sometimes abbreviated as SWEM), a long short term memory model (sometimes abbreviated as LSTM), and a Bidirectional LTSM.

上記の学習モデルは、入力された文を、「(i)経済活動に対する評価、(ii)経済活動の状態、又は、(iii)当該評価の理由を示す第1の文」、又は、「第1の文ではない第2の文」の何れかに分類する文章分類器を含んでよい。上記の学習モデルは、「評価対象の状態又は評価の理由を示す文」、又は、「評価対象の状態又は評価の理由を示す文ではない文」の何れかに分類する文章分類器を含んでもよい。文章分類器は、センテンスエンベッディングの生成器と、分類器とのペアにより構成されてよい。上記の学習モデルは、複数の文章分類器を含んでよい。 The above learning model converts the input sentence into “(i) evaluation of economic activity, (ii) state of economic activity, or (iii) first sentence indicating reason for the evaluation” or “first A sentence classifier that classifies the sentence into any of the "second sentences other than the first sentence" may be included. The above learning model may include a sentence classifier that classifies into either “statement of evaluation target or sentence indicating evaluation reason” or “statement not of evaluation target state or evaluation reason”. Good. The sentence classifier may include a sentence embedding generator and a classifier pair. The learning model described above may include a plurality of sentence classifiers.

抽出用モデル構築部522は、サンプルデータの種類に応じた学習モデルを構築してもよい。抽出用モデル構築部522は、サンプルデータの種類に応じて、利用される学習モデルの種類を決定してよい。抽出用モデル構築部522は、サンプルデータの種類に応じて、利用される学習モデルの種類の数を決定してよい。抽出用モデル構築部522は、サンプルデータの種類に応じて、利用される学習モデルの組み合わせを決定してもよい。サンプルデータは、学習モデルの入力データの一例であってよい。入力データの他の例としては、サンプルデータに含まれる1以上の文のデータが挙げられる。 The extraction model construction unit 522 may construct a learning model according to the type of sample data. The extraction model construction unit 522 may determine the type of learning model to be used according to the type of sample data. The extraction model construction unit 522 may determine the number of types of learning models to be used according to the type of sample data. The extraction model construction unit 522 may determine a combination of learning models to be used according to the type of sample data. The sample data may be an example of input data of the learning model. Another example of the input data is data of one or more sentences included in the sample data.

抽出用モデル構築部522は、サンプルデータに含まれる1以上の文のそれぞれと、各文の種類を示す情報とが対応付けられた情報を教師データとして用いて、上記の学習モデルを構築してもよい。これにより、例えば、各文に関する情報提供者の属性に応じた判定結果を出力する学習モデルが構築される。 The extraction model construction unit 522 constructs the above learning model by using, as teacher data, information in which one or more sentences included in the sample data are associated with information indicating the type of each sentence. Good. Thereby, for example, a learning model that outputs the determination result according to the attribute of the information provider regarding each sentence is constructed.

本実施形態において、評価用モデル構築部524は、上記の評価対象となる文のそれぞれに、評価スコアを付与するための学習モデルを構築する。具体的には、評価情報を教師データとして利用して、入力された文に評価スコアを付与するための学習モデルを構築する。 In the present embodiment, the evaluation model construction unit 524 constructs a learning model for giving an evaluation score to each of the sentences to be evaluated. Specifically, the evaluation information is used as teacher data to construct a learning model for giving an evaluation score to the input sentence.

例えば、評価用モデル構築部524は、データテーブル300を構成する複数のレコードの景気の現状判断を示す情報322と、追加説明及び具体的状況の説明を示す情報326とを教師データとして利用して、入力された文に評価スコアを付与するための学習モデルを構築する。 For example, the evaluation model construction unit 524 uses, as teacher data, the information 322 indicating the current business condition judgment of a plurality of records that form the data table 300 and the information 326 indicating the additional explanation and the concrete situation. , Build a learning model for giving an evaluation score to the input sentence.

上記の学習モデルの種類は、特に限定されない。上記の学習モデルは、畳み込みニューラルネットワークを利用した回帰モデルであってよい。 The type of learning model described above is not particularly limited. The learning model described above may be a regression model using a convolutional neural network.

データテーブル300において、景気の現状判断が段階的な区分により示されている場合、評価用モデル構築部524は、各区分に対応するスコアを決定してよい。これにより、各文に付与する評価スコアを連続的な数値で表現することができる。例えば、景気の現状判断が、「良くなる」、「やや良くなる」、「変わらない」、「やや悪くなる」及び「悪くなる」という5段階評価で表されている場合、評価用モデル構築部524は、「良くなる」という評価に2というスコアを付与する。同様に、評価用モデル構築部524は、「やや良くなる」、「変わらない」、「やや悪くなる」及び「悪くなる」という評価のそれぞれに、1、0、−1及び−2というスコアを付与する。これにより、評価用モデル構築部524が構築した学習モデルは、入力された文の評価スコアとして、−2から2までの範囲で任意の数値を付与する。 In the data table 300, when the judgment of the current state of the economy is shown by stepwise division, the evaluation model construction unit 524 may determine the score corresponding to each division. Thereby, the evaluation score given to each sentence can be expressed by a continuous numerical value. For example, if the current state of the economy is represented by a five-level evaluation of “becoming better”, “becoming slightly better”, “not changing”, “becoming slightly worse” and “being worse”, the evaluation model building unit 524 gives a score of 2 to the evaluation of “improving”. Similarly, the evaluation model construction unit 524 assigns scores of 1, 0, -1, and -2 to the evaluations of "slightly improved", "unchanged", "slightly worse", and "worse", respectively. Give. As a result, the learning model constructed by the evaluation model constructing unit 524 gives an arbitrary numerical value within the range of −2 to 2 as the evaluation score of the input sentence.

抽出用モデル構築部522は、第2モデル構築部の一例であってよい。評価用モデル構築部524は、第1モデル構築部の一例であってよい。 The extraction model construction unit 522 may be an example of the second model construction unit. The evaluation model construction unit 524 may be an example of the first model construction unit.

図6は、指標推定部166の内部構成の一例を概略的に示す。本実施形態において、指標推定部166は、種別判定部620と、評価対象抽出部630と、評価部640と、指標生成部650とを備える。本実施形態において、評価対象抽出部630は、キーワード型抽出部632と、機械学習型抽出部634とを有する。 FIG. 6 schematically shows an example of the internal configuration of the index estimation unit 166. In the present embodiment, the index estimation unit 166 includes a type determination unit 620, an evaluation target extraction unit 630, an evaluation unit 640, and an index generation unit 650. In the present embodiment, the evaluation target extraction unit 630 includes a keyword type extraction unit 632 and a machine learning type extraction unit 634.

種別判定部620は、分析対象として指標推定部166に入力されたサンプルデータの種類を判定する。例えば、種別判定部620は、格納部126を参照して、入力されたサンプルデータの種別情報を取得し、当該種別情報に基づいて、サンプルデータの種類を判定する。種別判定部620は、入力されたサンプルデータの内容を解析して、当該サンプルデータの種類を判定してもよい。 The type determination unit 620 determines the type of sample data input to the index estimation unit 166 as an analysis target. For example, the type determination unit 620 refers to the storage unit 126, acquires the type information of the input sample data, and determines the type of sample data based on the type information. The type determination unit 620 may analyze the content of the input sample data and determine the type of the sample data.

種別判定部620は、判定結果を示す情報を、例えば、評価対象抽出部630に出力する。種別判定部620は、判定結果を示す情報を、評価部640に出力してもよい。一実施形態において、種別判定部620は、サンプルデータごとに、当該サンプルデータの種類を示す情報を、評価対象抽出部630及び評価部640の少なくとも一方に出力する。他の実施形態において、種別判定部620は、サンプルデータに含まれる1以上の文のそれぞれについて、当該文の種類を示す情報を、評価対象抽出部630及び評価部640の少なくとも一方に出力する。 The type determination unit 620 outputs information indicating the determination result to, for example, the evaluation target extraction unit 630. The type determination unit 620 may output information indicating the determination result to the evaluation unit 640. In one embodiment, the type determination unit 620 outputs, for each sample data, information indicating the type of the sample data to at least one of the evaluation target extraction unit 630 and the evaluation unit 640. In another embodiment, the type determination unit 620 outputs, for each of one or more sentences included in the sample data, information indicating the type of the sentence to at least one of the evaluation target extraction unit 630 and the evaluation unit 640.

種別判定部620は、入力されたサンプルデータの種類に関する判定結果を利用して、単一のサンプルデータを構成する1又は複数の文のそれぞれに対して、当該文の種類を示す情報を付与してもよい。種別判定部620は、各文の種類を示す情報を、サンプルデータ格納部226に格納してよい。例えば、種別判定部620は、各文の種類を示す情報を、データテーブル400に格納する。 The type determination unit 620 uses the determination result regarding the type of the input sample data, and adds information indicating the type of the sentence to each of one or a plurality of sentences forming the single sample data. May be. The type determination unit 620 may store information indicating the type of each sentence in the sample data storage unit 226. For example, the type determination unit 620 stores information indicating the type of each sentence in the data table 400.

一実施形態において、種別判定部620は、単一のサンプルデータと、単一の種類とを対応付ける。例えば、種別判定部620は、単一のサンプルデータを構成する1又は複数の文のそれぞれに対して、当該文の種類を示す情報として、同一の情報を付与する。例えば、サンプルデータの種類を示す情報により、当該サンプルデータが特定のSNSに投稿された情報であることが示される場合、種別判定部620は、当該サンプルデータに含まれる全ての文に対して、当該文が特定のSNSに投稿された情報であることを示す情報を付与する。 In one embodiment, the type determination unit 620 associates a single sample data with a single type. For example, the type determination unit 620 gives the same information to each of one or a plurality of sentences that form a single sample data as information indicating the type of the sentence. For example, when the information indicating the type of sample data indicates that the sample data is information posted to a specific SNS, the type determination unit 620 determines that all the sentences included in the sample data include Information indicating that the sentence is information posted to a specific SNS is added.

他の実施形態において、種別判定部620は、単一のサンプルデータと、複数の種類とを対応付ける。例えば、種別判定部620は、単一のサンプルデータを構成する複数の文のうち、第1の群に属する1以上の文、及び、第2の群に属する1以上の文のそれぞれに対して、各群に属する文の種類を示す情報として、異なる情報を付与する。例えば、サンプルデータの種類を示す情報により、当該サンプルデータが折衝記録、営業日報又は業務日報に記録された情報であることが示される場合、種別判定部620は、第1のヒアリング対象者から得られた情報に関する文章に含まれる文には、第1のヒアリング対象者の属性を示す情報を付与し、第2のヒアリング対象者から得られた情報に関する文章に含まれる文には、第2のヒアリング対象者の属性を示す情報を付与する。 In another embodiment, the type determination unit 620 associates a single sample data with a plurality of types. For example, the type determination unit 620 determines, for each of one or more sentences belonging to the first group and one or more sentences belonging to the second group, among a plurality of sentences forming a single sample data. , Different information is added as information indicating the type of sentence belonging to each group. For example, when the information indicating the type of sample data indicates that the sample data is information recorded in a negotiation record, a daily business report, or a daily business report, the type determination unit 620 obtains from the first interview target person. The sentence included in the sentence related to the obtained information is given the information indicating the attribute of the first interviewee, and the sentence included in the sentence related to the information obtained from the second interviewee is set to the second sentence. Information indicating the attributes of the interviewee is added.

本実施形態において、評価対象抽出部630は、設定情報格納部222を参照して、分析対象となる期間に関する設定情報を取得する。評価対象抽出部630は、サンプルデータ格納部226を参照して、分析対象となる期間に合致する時期に作成又は更新されたサンプルデータ(分析対象となるサンプルデータと称される場合がある)を取得する。評価対象抽出部630は、分析対象となる複数のサンプルデータのそれぞれに関するテキストデータを、各サンプルデータの内容に関連する時期、各サンプルデータが記録された時期、又は、各サンプルデータを含む電子ファイルが作成若しくは更新された時期を示す情報と対応づけて取得する。評価対象抽出部630は、分析対象となる複数のサンプルデータのそれぞれに関するテキストデータを、各サンプルデータの情報提供者の属性を示す情報と対応付けて取得してもよい。その後、評価対象抽出部630は、抽出用モデル構築部522が構築した学習モデルを用いて、上記のサンプルデータに含まれる1以上の文の中から、経済活動に関連する文を抽出する。 In the present embodiment, the evaluation target extraction unit 630 refers to the setting information storage unit 222 and acquires the setting information regarding the period to be analyzed. The evaluation target extraction unit 630 refers to the sample data storage unit 226 to extract the sample data created or updated at a time that matches the period to be analyzed (sometimes referred to as sample data to be analyzed). get. The evaluation target extraction unit 630 outputs the text data relating to each of the plurality of sample data to be analyzed, the time associated with the content of each sample data, the time each sample data was recorded, or an electronic file containing each sample data. Is acquired in association with the information indicating the time when was created or updated. The evaluation target extraction unit 630 may acquire the text data related to each of the plurality of sample data to be analyzed in association with the information indicating the attribute of the information provider of each sample data. After that, the evaluation target extraction unit 630 uses the learning model constructed by the extraction model construction unit 522 to extract a sentence related to economic activity from one or more sentences included in the sample data.

本実施形態において、評価対象抽出部630は、少なくとも、機械学習型抽出部634を利用して、サンプルデータに含まれる1以上の文の中から、経済活動に関連する文を抽出する。評価対象抽出部630は、抽出された文を、評価部640に出力する。 In the present embodiment, the evaluation target extraction unit 630 uses at least the machine learning type extraction unit 634 to extract a sentence related to economic activity from one or more sentences included in the sample data. The evaluation target extraction unit 630 outputs the extracted sentence to the evaluation unit 640.

評価対象抽出部630は、キーワード型抽出部632及び機械学習型抽出部634を利用して、サンプルデータに含まれる1以上の文の中から、経済活動に関連する文を抽出してもよい。評価対象抽出部630は、サンプルデータの種類に基づいて、キーワード型抽出部632を用いた抽出処理と、機械学習型抽出部634を用いた抽出処理との組み合わせ方を決定してよい。 The evaluation target extraction unit 630 may use the keyword type extraction unit 632 and the machine learning type extraction unit 634 to extract a sentence related to economic activity from one or more sentences included in the sample data. The evaluation target extraction unit 630 may determine how to combine the extraction process using the keyword type extraction unit 632 and the extraction process using the machine learning type extraction unit 634 based on the type of sample data.

本実施形態において、キーワード型抽出部632は、サンプルデータに含まれる1以上の文の中から、予め定められたキーワード又はキーフレーズに関する条件に合致する文を抽出する。例えば、キーワード型抽出部632は、サンプルデータに含まれる1以上の文の中から、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つ(キーワードなどに合致する文と称される場合がある。)を、経済活動に関連する文、又は、経済活動に関連する文の候補として抽出する。 In the present embodiment, the keyword type extraction unit 632 extracts, from one or more sentences included in the sample data, a sentence that matches a predetermined keyword or key phrase-related condition. For example, the keyword type extraction unit 632 is similar to the key phrase, the sentence including the keyword, the sentence matching the key phrase, the sentence including the word similar to the keyword, and the key phrase from the one or more sentences included in the sample data. At least one of the sentences that match the condition (may be referred to as a sentence that matches the keyword, etc.) is extracted as a sentence related to economic activity or a candidate for a sentence related to economic activity.

キーワード型抽出部632は、設定情報格納部222を参照して、キーワード又はキーフレーズに関する条件を示す設定情報を取得してよい。キーワード又はキーフレーズに関する設定情報は、キーワードを示す情報、及び、キーフレーズを示す情報の少なくとも一方を含む。キーワード又はキーフレーズに関する設定情報は、キーワードに類似する単語を含む文を抽出するか否かを示す情報、及び、キーフレーズに類似する条件に合致する文を抽出するか否かを示す情報の少なくとも一方を含んでもよい。 The keyword type extraction unit 632 may refer to the setting information storage unit 222 to acquire the setting information indicating the condition regarding the keyword or the key phrase. The setting information regarding the keyword or the key phrase includes at least one of the information indicating the keyword and the information indicating the key phrase. The setting information regarding the keyword or the key phrase is at least information indicating whether to extract a sentence including a word similar to the keyword and information indicating whether to extract a sentence matching a condition similar to the key phrase. One may be included.

キーワード型抽出部632は、種別判定部620の判定結果に基づいて、抽出処理の条件を決定してもよい。これにより、入力されるデータの種類に応じた、適切な条件が設定される。一実施形態において、キーワード型抽出部632は、種別判定部620の判定結果に基づいて、キーワードに類似する単語を決定してよい。キーワード型抽出部632は、種別判定部620の判定結果に基づいて、キーワードに類似する単語の個数を決定してもよい。他の実施形態において、キーワード型抽出部632は、種別判定部620の判定結果に基づいて、キーフレーズに類似する条件を決定してよい。キーワード型抽出部632は、種別判定部620の判定結果に基づいて、キーフレーズに類似する条件の個数を決定してもよい。 The keyword type extraction unit 632 may determine the extraction processing condition based on the determination result of the type determination unit 620. As a result, appropriate conditions are set according to the type of input data. In one embodiment, the keyword type extraction unit 632 may determine a word similar to the keyword based on the determination result of the type determination unit 620. The keyword type extraction unit 632 may determine the number of words similar to the keyword based on the determination result of the type determination unit 620. In another embodiment, the keyword type extraction unit 632 may determine the condition similar to the key phrase based on the determination result of the type determination unit 620. The keyword type extraction unit 632 may determine the number of conditions similar to the key phrase based on the determination result of the type determination unit 620.

キーワード型抽出部632は、種別判定部620の判定結果に基づいて、サンプルデータに含まれる1以上の文の中から、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つを、(i)経済活動に関連する文として抽出するか、又は、(ii)経済活動に関連する文の候補として抽出するかを決定してもよい。例えば、経済活動に関連する文として抽出された文は、評価部640に出力される。一方、経済活動に関連する文の候補として抽出された文は、機械学習型抽出部634に出力される。 The keyword type extraction unit 632 includes a sentence including a keyword, a sentence that matches a key phrase, and a word similar to the keyword from one or more sentences included in the sample data based on the determination result of the type determination unit 620. At least one of the sentence and a sentence that matches the condition similar to the key phrase is extracted as (i) a sentence related to economic activity or (ii) extracted as a candidate for a sentence related to economic activity. May be determined. For example, a sentence extracted as a sentence related to economic activity is output to the evaluation unit 640. On the other hand, the sentence extracted as the candidate of the sentence related to the economic activity is output to the machine learning type extraction unit 634.

キーワードなどに合致する文だけでなく、キーワードなどに合致する文の近傍に配された1以上の文も、その他の文と比較して、経済活動に関連する文である可能性が高い。そこで、キーワード型抽出部632は、連続する2以上の文を含む文章であって、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つを含む文章を、経済活動に関連する文の候補として抽出してもよい。 It is highly possible that not only the sentence that matches the keyword or the like but also one or more sentences arranged near the sentence that matches the keyword or the like are sentences related to economic activity, as compared with the other sentences. Therefore, the keyword-type extraction unit 632 is a sentence including two or more consecutive sentences, including a sentence including a keyword, a sentence matching a key phrase, a sentence including a word similar to the keyword, and a sentence similar to the key phrase. A sentence including at least one of the sentences that match the condition may be extracted as a candidate for a sentence related to economic activity.

この場合において、キーワード型抽出部632は、種別判定部620の判定結果に基づいて、上記の文章に含まれる文の個数を決定してもよい。一実施形態において、上記の文の個数は、サンプルデータに含まれるノイズが多いほど、上記の文の個数が少なくなるように設定されてよい。ここで、ノイズとは、経済活動に関連しない文を示す。これにより、評価部640に出力される1以上の文にノイズが混入することが抑制され得る。他の実施形態において、上記の文の個数は、サンプルデータに含まれるノイズが多いほど、上記の文の個数が多くなるように設定されてもよい。これにより、経済活動に関連する文の抽出漏れが抑制され得る。 In this case, the keyword type extraction unit 632 may determine the number of sentences included in the above sentence based on the determination result of the type determination unit 620. In one embodiment, the number of sentences may be set such that the more noise included in the sample data, the smaller the number of sentences. Here, noise means a sentence that is not related to economic activity. As a result, it is possible to prevent noise from being mixed into one or more sentences output to the evaluation unit 640. In another embodiment, the number of sentences may be set such that the more noise included in the sample data, the greater the number of sentences is. Thereby, omission of extraction of sentences related to economic activity can be suppressed.

本実施形態において、機械学習型抽出部634は、抽出用モデル構築部522が構築した学習モデルを利用して、サンプルデータに含まれる1以上の文の中から、経済活動に関連する文を抽出する。具体的には、機械学習型抽出部634は、サンプルデータに含まれる1以上の文の少なくとも一部を学習モデルに入力し、当該学習モデルが、経済活動の状態を示す文又は経済活動に関する評価の理由を示す文であると判定した文を、経済活動に関連する文として抽出する。 In the present embodiment, the machine learning type extraction unit 634 uses the learning model constructed by the extraction model construction unit 522 to extract a sentence related to economic activity from one or more sentences included in the sample data. To do. Specifically, the machine learning type extraction unit 634 inputs at least a part of one or more sentences included in the sample data into the learning model, and the learning model evaluates the sentence indicating the state of economic activity or the economic activity. The sentence that is determined to be the reason for is extracted as a sentence related to economic activity.

一実施形態において、機械学習型抽出部634は、分析対象となるサンプルデータの全てを、学習モデルに入力する。他の実施形態において、機械学習型抽出部634は、キーワード型抽出部632が経済活動に関連する文の候補として抽出した文を、学習モデルに入力する。さらに他の実施形態において、機械学習型抽出部634は、分析対象となるサンプルデータのうち、キーワード型抽出部632により抽出されなかった文を、学習モデルに入力する。 In one embodiment, the machine learning type extraction unit 634 inputs all of the sample data to be analyzed into the learning model. In another embodiment, the machine learning type extraction unit 634 inputs a sentence extracted by the keyword type extraction unit 632 as a candidate of a sentence related to economic activity into the learning model. In still another embodiment, the machine learning type extraction unit 634 inputs, into the learning model, sentences that are not extracted by the keyword type extraction unit 632 in the sample data to be analyzed.

本実施形態において、評価部640は、評価対象抽出部630が抽出した文に、評価スコアを付与する。評価部640は、評価用モデル構築部524が構築した学習モデルを用いて、評価対象抽出部630が抽出した文に、評価スコアを付与してよい。例えば、評価部640は、評価用モデル構築部524が構築した学習モデルに、評価対象抽出部630が抽出した1以上の文のそれぞれを入力する。評価部640は、学習モデルの出力を、各文の評価スコアとして決定する。 In the present embodiment, the evaluation unit 640 gives an evaluation score to the sentence extracted by the evaluation target extraction unit 630. The evaluation unit 640 may give an evaluation score to the sentence extracted by the evaluation target extraction unit 630 using the learning model constructed by the evaluation model construction unit 524. For example, the evaluation unit 640 inputs each of the one or more sentences extracted by the evaluation target extraction unit 630 into the learning model constructed by the evaluation model construction unit 524. The evaluation unit 640 determines the output of the learning model as the evaluation score of each sentence.

評価部640は、種別判定部620の判定結果を利用して、評価対象抽出部630が抽出した文に評価スコアを付与してもよい。例えば、評価部640は、評価用モデル構築部524が構築した学習モデルに、評価対象抽出部630が抽出した1以上の文のそれぞれと、各文に関する種別判定部620の判定結果とを入力する。評価部640は、学習モデルの出力を、各文の評価スコアとして決定する。 The evaluation unit 640 may use the determination result of the type determination unit 620 to add an evaluation score to the sentence extracted by the evaluation target extraction unit 630. For example, the evaluation unit 640 inputs each of the one or more sentences extracted by the evaluation target extraction unit 630 and the determination result of the type determination unit 620 regarding each sentence into the learning model constructed by the evaluation model construction unit 524. .. The evaluation unit 640 determines the output of the learning model as the evaluation score of each sentence.

上述されたとおり、各文のデータの種類は、例えば、各文が含まれていたサンプルデータのURI、当該サンプルデータの作成者又は更新者、当該サンプルデータに関する情報提供者の属性などに基づき決定される。評価部640は、種別判定部620の判定結果として、例えば、情報提供者の属性を利用する。これにより、評価部640は、評価対象抽出部630が抽出した複数の文のそれぞれに対して、各文に関する情報提供者の属性に基づいて、評価対象に関する評価を付与することができる。 As described above, the data type of each sentence is determined based on, for example, the URI of the sample data including each sentence, the creator or updater of the sample data, the attribute of the information provider regarding the sample data, and the like. To be done. The evaluation unit 640 uses, for example, the attribute of the information provider as the determination result of the type determination unit 620. As a result, the evaluation unit 640 can give an evaluation regarding the evaluation target to each of the plurality of sentences extracted by the evaluation target extraction unit 630 based on the attribute of the information provider regarding each sentence.

評価部640は、情報提供者の評価対象に対する造詣が深い程、当該情報提供者により提供された情報が、指標生成部650により生成される指標に与える影響が大きくなるように、評価スコアを付与してよい。例えば、指標生成部650が、日銀短観の代替となり得る指標を生成する場合、不特定多数のユーザが利用することのできるSNS上に、匿名の投稿者により投稿された情報よりも、企業の経営者により提供された情報の方が、情報源として相応しい。そこで、例えば、公的な調査のヒアリング対象者の属性と、情報提供者の属性との類似度合が予め定められた基準よりも大きい場合、評価部640は、学習モデルの出力値が所定値より大きいときには、学習モデルの出力値よりも大きな値を評価スコアとして決定し、学習モデルの出力値が所定値より小さいときには、学習モデルの出力値よりも小さな値を評価スコアとして決定する。 The evaluation unit 640 assigns an evaluation score such that the more knowledge the information provider has about the evaluation target, the greater the influence that the information provided by the information provider has on the index generated by the index generation unit 650. You can do it. For example, when the index generation unit 650 generates an index that can be a substitute for the Bank of Japan Tankan, the management of the company is better than the information posted by anonymous posters on the SNS that can be used by an unspecified number of users. The information provided by the person is more suitable as a source of information. Therefore, for example, when the degree of similarity between the attribute of the hearing target of the public survey and the attribute of the information provider is larger than a predetermined standard, the evaluation unit 640 determines that the output value of the learning model is greater than the predetermined value. When it is larger, a value larger than the output value of the learning model is determined as the evaluation score, and when the output value of the learning model is smaller than the predetermined value, a value smaller than the output value of the learning model is determined as the evaluation score.

これにより、評価スコアの決定において、例えば、各文に関する情報提供者の属性が考慮され得る。教師データとして用いられる景気ウォッチャー調査、生産動態統計調査などにおいては、ヒアリング対象者として、特定の属性を有する個人、団体又は法人が選択される。そのため、教師データとして用いられた調査のヒアリング対象者と、評価対象として入力された各文に関する情報提供者の属性とが合致又は類似する場合に、当該類似の度合を考慮した評価スコアが付与されることにより、指標生成部650により生成される指標の信頼性が向上する。 Thereby, in the determination of the evaluation score, for example, the attribute of the information provider regarding each sentence can be considered. In the economic watcher survey, production dynamic statistics survey, etc. used as teacher data, individuals, groups, or corporations having specific attributes are selected as interviewees. Therefore, when the interview target of the survey used as teacher data matches or is similar to the attribute of the information provider regarding each sentence input as the evaluation target, an evaluation score considering the degree of similarity is given. By doing so, the reliability of the index generated by the index generation unit 650 is improved.

評価部640は、種別判定部620の判定結果を利用して、評価用モデル構築部524が構築した学習モデルが出力したスコアを補正することで、評価対象抽出部630が抽出した文に、評価スコアを付与してもよい。例えば、まず、評価部640は、評価用モデル構築部524が構築した学習モデルに、評価対象抽出部630が抽出した1以上の文のそれぞれを入力する。評価部640は、学習モデルの出力を、各文の評価スコアの暫定値として決定する。次に、評価部640は、例えば、学習モデルの出力に、各文のデータの種類に応じた補正係数を乗じて得られた値を、各文の評価スコアとして決定する。 The evaluation unit 640 uses the determination result of the type determination unit 620 to correct the score output by the learning model constructed by the evaluation model construction unit 524, so that the sentence extracted by the evaluation target extraction unit 630 is evaluated. You may give a score. For example, first, the evaluation unit 640 inputs each of the one or more sentences extracted by the evaluation target extraction unit 630 into the learning model constructed by the evaluation model construction unit 524. The evaluation unit 640 determines the output of the learning model as a provisional value of the evaluation score of each sentence. Next, the evaluation unit 640 determines, for example, a value obtained by multiplying the output of the learning model by a correction coefficient according to the type of data of each sentence as the evaluation score of each sentence.

評価部640は、種別判定部620の判定結果として、例えば、情報提供者の属性を利用する。これにより、評価部640は、評価対象抽出部630が抽出した複数の文のそれぞれに対して、各文に関する情報提供者の属性に基づいて、評価対象に関する評価を付与することができる。 The evaluation unit 640 uses, for example, the attribute of the information provider as the determination result of the type determination unit 620. As a result, the evaluation unit 640 can give an evaluation regarding the evaluation target to each of the plurality of sentences extracted by the evaluation target extraction unit 630 based on the attribute of the information provider regarding each sentence.

例えば、補正係数の値を、上記の情報提供者及び評価対象の関連度合が大きいほど、当該補正係数の値が大きくなるように設定することで、指標生成部650により生成される指標の精度が向上し得る。例えば、補正係数の値を、上記の情報提供者による過去の景気予測の精度が高いほど、当該補正係数の値が大きくなるように設定することで、指標生成部650により生成される経済指標の精度が向上し得る。 For example, the accuracy of the index generated by the index generation unit 650 is set by setting the value of the correction coefficient such that the value of the correction coefficient increases as the degree of association between the information provider and the evaluation target increases. Can improve. For example, by setting the value of the correction coefficient such that the higher the accuracy of the past business forecast by the information provider is, the larger the value of the correction coefficient is, the value of the economic index generated by the index generation unit 650 is calculated. The accuracy can be improved.

本実施形態において、指標生成部650は、評価対象抽出部630が抽出した複数の文のそれぞれに付与された評価スコアに基づいて、分析対象期間における経済活動の状態を示す指標を算出する。指標の算出方法は、指標の種類に応じて適切に決定される。これにより、指標推定システム100は、分析対象期間における指標の推定値を出力することができる。 In the present embodiment, the index generation unit 650 calculates an index indicating the state of economic activity in the analysis target period, based on the evaluation score given to each of the plurality of sentences extracted by the evaluation target extraction unit 630. The index calculation method is appropriately determined according to the type of index. Thereby, the index estimation system 100 can output the estimated value of the index in the analysis target period.

一実施形態において、指標生成部650は、評価対象抽出部630が抽出した複数の文のそれぞれに付与された評価スコアを集計することで、指標を算出する。他の実施形態において、指標生成部650は、評価対象抽出部630が抽出した複数の文のそれぞれに付与された評価スコアの統計値を用いて、指標を算出する。統計値としては、平均値、中央値、四分位数、分散などが例示される。さらに他の実施形態において、指標生成部650は、評価対象抽出部630が抽出した複数の文のそれぞれに付与された評価スコア及びその統計値の少なくとも一方を、予め定められた数式に代入する、又は、予め定められたアルゴリズムに基づいて処理することで、指標を算出する。指標生成部650は、種別判定部620の判定結果を利用して、上記の数式又はアルゴリズムのパラメータを決定してもよい。指標生成部650は、情報提供者の属性を利用して、上記の数式又はアルゴリズムのパラメータを決定してもよい。 In one embodiment, the index generation unit 650 calculates the index by totaling the evaluation scores given to each of the plurality of sentences extracted by the evaluation target extraction unit 630. In another embodiment, the index generation unit 650 calculates the index by using the statistical value of the evaluation score given to each of the plurality of sentences extracted by the evaluation target extraction unit 630. Examples of statistical values include average value, median value, quartile, variance, and the like. In still another embodiment, the index generation unit 650 substitutes at least one of the evaluation score and its statistical value given to each of the plurality of sentences extracted by the evaluation target extraction unit 630, into a predetermined mathematical expression, Alternatively, the index is calculated by processing based on a predetermined algorithm. The index generation unit 650 may use the determination result of the type determination unit 620 to determine the parameters of the above formula or algorithm. The index generation unit 650 may determine the parameters of the above formula or algorithm using the attribute of the information provider.

指標生成部650は、算出された指標を正規化してもよい。一実施形態において、指標生成部650は、分析対象期間よりも長い期間における指標の最大値及び最小値を利用して、当該指標を正規化する。他の実施形態において、指標生成部650は、評価スコアが付与された文の個数を利用して、指標を正規化してもよい。 The index generation unit 650 may normalize the calculated index. In one embodiment, the index generation unit 650 normalizes the index by using the maximum value and the minimum value of the index in a period longer than the analysis target period. In another embodiment, the index generation unit 650 may normalize the index by using the number of sentences to which the evaluation score is attached.

種別判定部620は、種別情報取得部の一例であってよい。評価対象抽出部630は、期間情報取得部、及び、抽出部の一例であってよい。キーワード型抽出部632は、条件取得部、及び、第2抽出部の一例であってよい。機械学習型抽出部634は、第1抽出部の一例であってよい。評価部640は、評価付与部の一例であってよい。指標生成部650は、指標算出部の一例であってよい。 The type determination unit 620 may be an example of a type information acquisition unit. The evaluation target extraction unit 630 may be an example of a period information acquisition unit and an extraction unit. The keyword type extraction unit 632 may be an example of the condition acquisition unit and the second extraction unit. The machine learning type extraction unit 634 may be an example of the first extraction unit. The evaluation unit 640 may be an example of the evaluation giving unit. The index generation unit 650 may be an example of the index calculation unit.

図7は、機械学習型抽出部634の内部構成の一例を概略的に示す。本実施形態において、機械学習型抽出部634は、学習モデル720と、判定部740とを備える。本実施形態において、学習モデル720は、文章分類器722と、文章分類器724と、文章分類器726と、文章分類器728とを有する。 FIG. 7 schematically shows an example of the internal configuration of the machine learning type extraction unit 634. In the present embodiment, the machine learning type extraction unit 634 includes a learning model 720 and a determination unit 740. In the present embodiment, the learning model 720 includes a sentence classifier 722, a sentence classifier 724, a sentence classifier 726, and a sentence classifier 728.

本実施形態において、学習モデル720に含まれる、文章分類器722、文章分類器724、文章分類器726及び文章分類器728のそれぞれは、入力された文が、経済活動の状態又は経済活動に関する評価の理由を示す文であることの確からしさを示すスコアを、判定部740に出力する。判定部740は、文章分類器722、文章分類器724、文章分類器726及び文章分類器728のそれぞれが出力したスコアの合計値が、予め定められた閾値よりも大きい場合に、入力された文を、経済活動に関連する文として抽出する。 In the present embodiment, each of the sentence classifier 722, the sentence classifier 724, the sentence classifier 726, and the sentence classifier 728 included in the learning model 720 evaluates the input sentence regarding the state of economic activity or economic activity. The score indicating the likelihood of being a sentence indicating the reason is output to the determination unit 740. The determination unit 740 receives the input sentence when the total value of the scores output by each of the sentence classifier 722, the sentence classifier 724, the sentence classifier 726, and the sentence classifier 728 is larger than a predetermined threshold value. Is extracted as a sentence related to economic activity.

本実施形態において、文章分類器722は、センテンスエンベディングの生成器としてTF−IDFモデルを利用し、分類器としてLRモデルを利用する。本実施形態において、文章分類器724は、センテンスエンベディングの生成器としてLSTMモデルを利用し、分類器としてNNモデルを利用する。本実施形態において、文章分類器726は、センテンスエンベディングの生成器としてCNNモデルを利用し、分類器としてNNモデルを利用する。本実施形態において、文章分類器728は、センテンスエンベディングの生成器としてSWEMモデルを利用し、分類器としてLRモデルを利用する。 In the present embodiment, the sentence classifier 722 uses the TF-IDF model as the sentence embedding generator and the LR model as the classifier. In the present embodiment, the text classifier 724 uses the LSTM model as the sentence embedding generator and the NN model as the classifier. In the present embodiment, the sentence classifier 726 uses the CNN model as the sentence embedding generator and the NN model as the classifier. In the present embodiment, the sentence classifier 728 uses the SWEM model as the sentence embedding generator and the LR model as the classifier.

学習モデル720の構成は、種別判定部620の判定結果に基づいて決定されてよい。例えば、学習モデル720を構成する文章分類器に用いられるモデルの種類は、種別判定部620の判定結果に基づいて決定される。学習モデル720を構成する文章分類器に用いられるモデルの組み合わせは、種別判定部620の判定結果に基づいて決定されてよい。学習モデル720を構成する文章分類器の個数は、種別判定部620の判定結果に基づいて決定されてよい。 The configuration of the learning model 720 may be determined based on the determination result of the type determination unit 620. For example, the type of model used for the sentence classifier that constitutes the learning model 720 is determined based on the determination result of the type determination unit 620. The combination of models used for the sentence classifier configuring the learning model 720 may be determined based on the determination result of the type determination unit 620. The number of sentence classifiers forming the learning model 720 may be determined based on the determination result of the type determination unit 620.

図8、図9及び図10を用いて、評価対象抽出部630が、キーワード型抽出部632及び機械学習型抽出部634を利用して、サンプルデータに含まれる1以上の文の中から、経済活動に関連する文を抽出する情報処理の概要が説明される。図8は、評価対象抽出部630における情報処理の一例を概略的に示す。図9は、評価対象抽出部630における情報処理の他の例を概略的に示す。図10は、評価対象抽出部630における情報処理のさらに他の例を概略的に示す。 Using FIG. 8, FIG. 9, and FIG. 10, the evaluation target extraction unit 630 uses the keyword type extraction unit 632 and the machine learning type extraction unit 634 to select an economy from one or more sentences included in the sample data. An outline of information processing for extracting sentences related to activities is explained. FIG. 8 schematically shows an example of information processing in the evaluation target extraction unit 630. FIG. 9 schematically shows another example of information processing in the evaluation target extraction unit 630. FIG. 10 schematically shows still another example of information processing in the evaluation target extraction unit 630.

なお、評価対象抽出部630における情報処理はこれらの実施形態に限定されない。他の実施形態において、評価対象抽出部630は、機械学習型抽出部634のみを利用して、サンプルデータに含まれる1以上の文の中から、経済活動に関連する文を抽出する。 The information processing in the evaluation target extraction unit 630 is not limited to these embodiments. In another embodiment, the evaluation target extraction unit 630 uses only the machine learning type extraction unit 634 to extract a sentence related to economic activity from one or more sentences included in the sample data.

図8に示された実施形態によれば、分析対象となるサンプルデータの全てが、まず、キーワード型抽出部632に入力される。本実施形態によれば、キーワード型抽出部632により抽出された全ての文が、機械学習型抽出部634に入力される。一方、キーワード型抽出部632により抽出されなかった文は、機械学習型抽出部634に入力されない。 According to the embodiment shown in FIG. 8, all the sample data to be analyzed are first input to the keyword type extraction unit 632. According to this embodiment, all the sentences extracted by the keyword type extraction unit 632 are input to the machine learning type extraction unit 634. On the other hand, sentences not extracted by the keyword type extraction unit 632 are not input to the machine learning type extraction unit 634.

図9に示された実施形態によれば、分析対象となるサンプルデータの全てが、まず、キーワード型抽出部632に入力される。本実施形態によれば、キーワード型抽出部632により抽出されなかった文が、機械学習型抽出部634に入力される。一方、キーワード型抽出部632により抽出された文は、機械学習型抽出部634に入力されることなく、評価部640に出力される。 According to the embodiment shown in FIG. 9, all the sample data to be analyzed are first input to the keyword type extraction unit 632. According to the present embodiment, sentences that have not been extracted by the keyword type extraction unit 632 are input to the machine learning type extraction unit 634. On the other hand, the sentence extracted by the keyword type extraction unit 632 is output to the evaluation unit 640 without being input to the machine learning type extraction unit 634.

図10に示された実施形態によれば、分析対象となるサンプルデータの全てが、まず、キーワード型抽出部632に入力される。本実施形態によれば、キーワード型抽出部632により抽出された文の一部は、機械学習型抽出部634に入力されることなく、評価部640に出力される。一方、キーワード型抽出部632により抽出された文の残りの部分は、機械学習型抽出部634に入力される。 According to the embodiment shown in FIG. 10, all the sample data to be analyzed are first input to the keyword type extraction unit 632. According to this embodiment, a part of the sentence extracted by the keyword type extraction unit 632 is output to the evaluation unit 640 without being input to the machine learning type extraction unit 634. On the other hand, the rest of the sentence extracted by the keyword type extraction unit 632 is input to the machine learning type extraction unit 634.

例えば、キーワード型抽出部632は、連続する2以上の文を含む文章であって、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文の少なくとも1つを含む文章を、経済活動に関連する文の候補として抽出する場合を考える。この場合において、キーワードを含む文、キーフレーズに合致する文、キーワードに類似する単語を含む文、及び、キーフレーズに類似する条件に合致する文は、経済活動に関連する文である可能性が比較的高い。そこで、これらの文は、機械学習型抽出部634に入力されることなく、評価部640に出力される。一方、キーワード型抽出部632が抽出した残りの文は、経済活動に関連する文である可能性が比較的低い。そこで、これらの文は、機械学習型抽出部634に入力される。 For example, the keyword-type extraction unit 632 is a sentence including two or more consecutive sentences, and includes a sentence including a keyword, a sentence matching a key phrase, a sentence including a word similar to the keyword, and a sentence similar to the key phrase. Consider a case where a sentence including at least one of the sentences that match the condition is extracted as a candidate for a sentence related to economic activity. In this case, a sentence including a keyword, a sentence matching a key phrase, a sentence including a word similar to a keyword, and a sentence matching a condition similar to a key phrase may be a sentence related to economic activity. Relatively high. Therefore, these sentences are output to the evaluation unit 640 without being input to the machine learning type extraction unit 634. On the other hand, the remaining sentences extracted by the keyword type extraction unit 632 are relatively unlikely to be sentences related to economic activities. Therefore, these sentences are input to the machine learning type extraction unit 634.

図11は、データテーブル1100の一例を概略的に示す。本実施形態において、データテーブル1100の各行は、評価部640の評価結果の一例であってよい。本実施形態において、データテーブル1100は、サンプルID1112と、センテンスID1114と、記録時刻を示す情報1116と、評価スコアを示す情報1118とを示す。サンプルID1112、センテンスID1114、及び、記録時刻を示す情報1116のそれぞれは、サンプルID412、センテンスID414及び記録時刻を示す情報416と同様の構成を有してよい。評価スコアを示す情報1118は、評価部640により付与された評価スコアを示す。 FIG. 11 schematically shows an example of the data table 1100. In the present embodiment, each row of the data table 1100 may be an example of the evaluation result of the evaluation unit 640. In the present embodiment, the data table 1100 shows a sample ID 1112, a sentence ID 1114, information 1116 indicating a recording time, and information 1118 indicating an evaluation score. Each of the sample ID 1112, the sentence ID 1114, and the information 1116 indicating the recording time may have the same configuration as the sample ID 412, the sentence ID 414, and the information 416 indicating the recording time. The information 1118 indicating the evaluation score indicates the evaluation score given by the evaluation unit 640.

図12は、本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ3000の一例を示す。例えば、指標推定システム100は、コンピュータ3000により実現される。 FIG. 12 illustrates an example computer 3000 in which aspects of the invention may be embodied in whole or in part. For example, the index estimation system 100 is realized by the computer 3000.

コンピュータ3000にインストールされたプログラムは、コンピュータ3000に、本発明の実施形態に係る装置に関連付けられるオペレーション又は当該装置の1又は複数の「部」として機能させ、又は当該オペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ3000に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ3000に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU3012によって実行されてよい。 The program installed in the computer 3000 causes the computer 3000 to function as an operation associated with an apparatus according to an embodiment of the present invention or one or more “units” of the apparatus, or the operation or the one or more “parts”. Parts” and/or cause computer 3000 to perform processes or stages of processes according to embodiments of the present invention. Such programs may be executed by CPU 3012 to cause computer 3000 to perform certain operations associated with some or all of the blocks in the flowcharts and block diagrams described herein.

本実施形態によるコンピュータ3000は、CPU3012、RAM3014、グラフィックコントローラ3016、及びディスプレイデバイス3018を含み、それらはホストコントローラ3010によって相互に接続されている。コンピュータ3000はまた、通信インターフェース3022、ハードディスクドライブ3024、DVD−ROMドライブ3026、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ3020を介してホストコントローラ3010に接続されている。コンピュータはまた、ROM3030及びキーボード3042のようなレガシの入出力ユニットを含み、それらは入出力チップ3040を介して入出力コントローラ3020に接続されている。 The computer 3000 according to the present embodiment includes a CPU 3012, a RAM 3014, a graphic controller 3016, and a display device 3018, which are interconnected by a host controller 3010. The computer 3000 also includes input/output units such as a communication interface 3022, a hard disk drive 3024, a DVD-ROM drive 3026, and an IC card drive, which are connected to the host controller 3010 via the input/output controller 3020. The computer also includes legacy input/output units such as ROM 3030 and keyboard 3042, which are connected to input/output controller 3020 via input/output chip 3040.

CPU3012は、ROM3030及びRAM3014内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ3016は、RAM3014内に提供されるフレームバッファ等又はそれ自体の中に、CPU3012によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス3018上に表示されるようにする。 The CPU 3012 operates according to programs stored in the ROM 3030 and the RAM 3014, and thereby controls each unit. The graphic controller 3016 obtains image data generated by the CPU 3012 in a frame buffer or the like provided in the RAM 3014 or itself, and causes the image data to be displayed on the display device 3018.

通信インターフェース3022は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ3024は、コンピュータ3000内のCPU3012によって使用されるプログラム及びデータを格納する。DVD−ROMドライブ3026は、プログラム又はデータをDVD−ROM3001から読み取り、ハードディスクドライブ3024にRAM3014を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。 The communication interface 3022 communicates with other electronic devices via the network. The hard disk drive 3024 stores programs and data used by the CPU 3012 in the computer 3000. The DVD-ROM drive 3026 reads a program or data from the DVD-ROM 3001 and provides the hard disk drive 3024 with the program or data via the RAM 3014. The IC card drive reads programs and data from the IC card and/or writes programs and data to the IC card.

ROM3030はその中に、アクティブ化時にコンピュータ3000によって実行されるブートプログラム等、及び/又はコンピュータ3000のハードウエアに依存するプログラムを格納する。入出力チップ3040はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ3020に接続してよい。 The ROM 3030 stores therein a boot program executed by the computer 3000 at the time of activation, and/or a program dependent on the hardware of the computer 3000. The input/output chip 3040 may also connect various input/output units to the input/output controller 3020 via parallel ports, serial ports, keyboard ports, mouse ports, and the like.

プログラムが、DVD−ROM3001又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもあるハードディスクドライブ3024、RAM3014、又はROM3030にインストールされ、CPU3012によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ3000に読み取られ、プログラムと、上記様々なタイプのハードウエアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ3000の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。 The program is provided by a computer-readable storage medium such as a DVD-ROM 3001 or an IC card. The program is read from the computer-readable storage medium, installed in the hard disk drive 3024, the RAM 3014, or the ROM 3030, which is also an example of the computer-readable storage medium, and executed by the CPU 3012. The information processing described in these programs is read by the computer 3000 and brings about the cooperation between the programs and the various types of hardware resources described above. An apparatus or method may be configured by implementing the operation or processing of information according to the use of the computer 3000.

例えば、通信がコンピュータ3000及び外部デバイス間で実行される場合、CPU3012は、RAM3014にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース3022に対し、通信処理を命令してよい。通信インターフェース3022は、CPU3012の制御の下、RAM3014、ハードディスクドライブ3024、DVD−ROM3001、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。 For example, when communication is performed between the computer 3000 and an external device, the CPU 3012 executes the communication program loaded in the RAM 3014, and performs the communication process on the communication interface 3022 based on the process described in the communication program. You may order. The communication interface 3022 reads the transmission data stored in the transmission buffer area provided in the recording medium such as the RAM 3014, the hard disk drive 3024, the DVD-ROM 3001, or the IC card under the control of the CPU 3012, and the read transmission is performed. The data is transmitted to the network, or the received data received from the network is written in a reception buffer area or the like provided on the recording medium.

また、CPU3012は、ハードディスクドライブ3024、DVD−ROMドライブ3026(DVD−ROM3001)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM3014に読み取られるようにし、RAM3014上のデータに対し様々なタイプの処理を実行してよい。CPU3012は次に、処理されたデータを外部記録媒体にライトバックしてよい。 Further, the CPU 3012 causes the RAM 3014 to read all or necessary portions of files or databases stored in an external recording medium such as a hard disk drive 3024, a DVD-ROM drive 3026 (DVD-ROM 3001), and an IC card. Various types of processing may be performed on the data in RAM 3014. The CPU 3012 may then write back the processed data to an external recording medium.

様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU3012は、RAM3014から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM3014に対しライトバックする。また、CPU3012は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU3012は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。 Various types of information such as various types of programs, data, tables, and databases may be stored on the recording medium and processed. The CPU 3012 may retrieve various types of operations, information processing, conditional judgment, conditional branching, unconditional branching, and information retrieval from the data read from the RAM 3014, which are described in various places in this disclosure and are specified by the instruction sequence of the program. Various types of processing may be performed, including /replacement, etc., and the result is written back to RAM 3014. Further, the CPU 3012 may search for information in files, databases, etc. in the recording medium. For example, when a plurality of entries each having the attribute value of the first attribute associated with the attribute value of the second attribute are stored in the recording medium, the CPU 3012 selects the first entry from the plurality of entries. Search the entry whose attribute value of the attribute of the specified attribute matches the specified condition, read the attribute value of the second attribute stored in the entry, and set it as the first attribute that satisfies the predetermined condition. The attribute value of the associated second attribute may be obtained.

上で説明したプログラム又はソフトウエアモジュールは、コンピュータ3000上又はコンピュータ3000近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それにより、上記のプログラムを、ネットワークを介してコンピュータ3000に提供する。 The programs or software modules described above may be stored on a computer-readable storage medium on or near computer 3000. Further, a recording medium such as a hard disk or a RAM provided in a server system connected to a dedicated communication network or the Internet can be used as a computer-readable storage medium, whereby the above program can be executed via the network. Provide to the computer 3000.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 Although the present invention has been described above using the embodiment, the technical scope of the present invention is not limited to the scope described in the above embodiment. It is apparent to those skilled in the art that various changes or improvements can be added to the above-described embodiment. It is apparent from the scope of the claims that the embodiments added with such changes or improvements can be included in the technical scope of the present invention.

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。 The execution order of each process such as operation, procedure, step, and step in the devices, systems, programs, and methods shown in the claims, the specification, and the drawings is "preceding" or "prior to". It should be noted that the output of the previous process can be realized in any order unless the output of the previous process is used in the subsequent process. The operation flow in the claims, the description, and the drawings is described by using “first,” “next,” and the like for the sake of convenience, but it is essential to carry out in this order. Not a thing.

10 通信ネットワーク、12 ユーザ端末、14 教師データ提供サーバ、16 サンプルデータ提供サーバ、100 指標推定システム、122 通信部、124 入出力部、126 格納部、128 要求受付部、142 教師データ取得部、144 モデル構築部、162 サンプルデータ取得部、164 テキストデータ生成部、166 指標推定部、222 設定情報格納部、224 教師データ格納部、226 サンプルデータ格納部、228 モデル情報格納部、300 データテーブル、312 情報、314 情報、316 情報、322 情報、324 情報、326 情報、400 データテーブル、412 サンプルID、414 センテンスID、416 情報、418 情報、420 情報、522 抽出用モデル構築部、524 評価用モデル構築部、620 種別判定部、630 評価対象抽出部、632 キーワード型抽出部、634 機械学習型抽出部、640 評価部、650 指標生成部、720 学習モデル、722 文章分類器、724 文章分類器、726 文章分類器、728 文章分類器、740 判定部、1100 データテーブル、1112 サンプルID、1114 センテンスID、1116 情報、1118 情報、3000 コンピュータ、3001 DVD−ROM、3010 ホストコントローラ、3012 CPU、3014 RAM、3016 グラフィックコントローラ、3018 ディスプレイデバイス、3020 入出力コントローラ、3022 通信インターフェース、3024 ハードディスクドライブ、3026 DVD−ROMドライブ、3030 ROM、3040 入出力チップ、3042 キーボード 10 communication network, 12 user terminal, 14 teacher data providing server, 16 sample data providing server, 100 index estimation system, 122 communication unit, 124 input/output unit, 126 storage unit, 128 request reception unit, 142 teacher data acquisition unit, 144 Model building unit, 162 sample data acquisition unit, 164 text data generation unit, 166 index estimation unit, 222 setting information storage unit, 224 teacher data storage unit, 226 sample data storage unit, 228 model information storage unit, 300 data table, 312 Information, 314 information, 316 information, 322 information, 324 information, 326 information, 400 data table, 412 sample ID, 414 sentence ID, 416 information, 418 information, 420 information, 522 extraction model construction unit, 524 evaluation model construction Unit, 620 type determination unit, 630 evaluation target extraction unit, 632 keyword type extraction unit, 634 machine learning type extraction unit, 640 evaluation unit, 650 index generation unit, 720 learning model, 722 sentence classifier, 724 sentence classifier, 726 Text classifier, 728 Text classifier, 740 Judgment unit, 1100 data table, 1112 sample ID, 1114 sentence ID, 1116 information, 1118 information, 3000 computer, 3001 DVD-ROM, 3010 host controller, 3012 CPU, 3014 RAM, 3016 Graphic controller, 3018 display device, 3020 input/output controller, 3022 communication interface, 3024 hard disk drive, 3026 DVD-ROM drive, 3030 ROM, 3040 input/output chip, 3042 keyboard

Claims (12)

(i)評価対象に関する評価、及び、(ii)前記評価対象の状態又は前記評価の理由を示す1以上の説明文が対応付けられた評価情報に含まれる前記1以上の説明文を教師データとして利用して、入力された文が、前記評価対象に対する評価、前記評価対象の状態又は前記評価の理由を示す文であるか否かを判定するための第1学習モデルを構築する第1モデル構築部と、
前記第1モデル構築部が構築した前記第1学習モデルを用いて、テキストデータに含まれる1以上の文の中から、前記評価対象に関連する文を抽出する抽出部と、
を備える、機械学習装置。
(I) evaluation regarding the evaluation target, and (ii) the one or more explanation sentences included in the evaluation information associated with one or more explanation sentences indicating the state of the evaluation subject or the reason for the evaluation, as teacher data. A first model construction for constructing a first learning model for determining whether or not the input sentence is a sentence indicating an evaluation of the evaluation target, a state of the evaluation target, or a reason for the evaluation Department,
An extraction unit that extracts a sentence related to the evaluation target from one or more sentences included in the text data using the first learning model constructed by the first model constructing unit;
A machine learning device.
前記第1学習モデルは、前記入力された文を、前記評価対象の状態又は前記評価の理由を示す文、又は、前記評価対象の状態又は前記評価の理由を示す文ではない文の何れかに分類する文章分類器を含む、
請求項1に記載の機械学習装置。
The first learning model changes the input sentence into either a sentence indicating the state of the evaluation target or the reason for the evaluation, or a sentence that is not the state of the evaluation target or a sentence indicating the reason for the evaluation. Including a sentence classifier to classify,
The machine learning device according to claim 1.
前記抽出部は、
前記テキストデータに含まれる前記1以上の文の少なくとも一部を、前記第1学習モデルに入力し、前記第1学習モデルが前記評価対象の状態又は前記評価の理由を示す文であると判定した文を、前記評価対象に関連する文として抽出する第1抽出部、
を有する、
請求項1又は請求項2に記載の機械学習装置。
The extraction unit is
At least a part of the one or more sentences included in the text data is input to the first learning model, and it is determined that the first learning model is a sentence indicating the state of the evaluation target or the reason for the evaluation. A first extraction unit that extracts a sentence as a sentence related to the evaluation target;
Have
The machine learning device according to claim 1 or 2.
前記抽出部は、
前記評価対象に関連するキーワード又はキーフレーズを示す情報を取得する条件取得部と、
前記テキストデータに含まれる前記1以上の文の中から、前記キーワードを含む文、前記キーフレーズに合致する文、前記キーワードに類似する単語を含む文、及び、前記キーフレーズに類似する条件に合致する文の少なくとも1つを、前記評価対象に関連する文、又は、前記評価対象に関連する文の候補として抽出する第2抽出部と、
を有する、
請求項3に記載の機械学習装置。
The extraction unit is
A condition acquisition unit for acquiring information indicating a keyword or key phrase related to the evaluation target,
From the one or more sentences included in the text data, a sentence including the keyword, a sentence matching the key phrase, a sentence including a word similar to the keyword, and a condition similar to the key phrase. A second extraction unit that extracts at least one of the sentences to be performed as a sentence related to the evaluation target or a candidate for a sentence related to the evaluation target,
Have
The machine learning device according to claim 3.
前記第1抽出部は、
前記第2抽出部が前記評価対象に関連する文の候補として抽出した文を、前記第1学習モデルに入力し、
前記第1学習モデルが前記評価対象の状態又は前記評価の理由を示す文であると判定した文を、前記評価対象に関連する文として抽出する、
請求項4に記載の機械学習装置。
The first extraction unit,
The sentence extracted by the second extracting unit as a candidate of the sentence related to the evaluation target is input to the first learning model,
A sentence determined to be a sentence indicating the state of the evaluation target or the reason for the evaluation is extracted as a sentence related to the evaluation target.
The machine learning device according to claim 4.
前記第2抽出部は、連続する2以上の文を含む文章であって、前記キーワードを含む文、前記キーフレーズに合致する文、前記キーワードに類似する単語を含む文、及び、前記キーフレーズに類似する条件に合致する文の少なくとも1つを含む文章を、前記評価対象に関連する文の候補として抽出する、
請求項4又は請求項5に記載の機械学習装置。
The second extraction unit is a sentence including two or more consecutive sentences, including a sentence including the keyword, a sentence matching the key phrase, a sentence including a word similar to the keyword, and the key phrase. Extracting a sentence including at least one of the sentences that match a similar condition as a candidate of a sentence related to the evaluation target;
The machine learning device according to claim 4 or 5.
前記テキストデータの種類を区別するための種別情報を取得する種別情報取得部をさらに備え、
前記第2抽出部は、前記種別情報により示される前記テキストデータの前記種類に基づいて、前記テキストデータに含まれる前記1以上の文の中から、前記キーワードを含む文、前記キーフレーズに合致する文、前記キーワードに類似する単語を含む文、及び、前記キーフレーズに類似する条件に合致する文の少なくとも1つを、前記評価対象に関連する文及び前記評価対象に関連する文の候補の何れとして抽出するかを決定する、
請求項4から請求項6までの何れか一項に記載の機械学習装置。
Further comprising a type information acquisition unit for acquiring type information for distinguishing the type of the text data,
The second extraction unit matches a sentence including the keyword and the key phrase from the one or more sentences included in the text data based on the type of the text data indicated by the type information. At least one of a sentence, a sentence including a word similar to the keyword, and a sentence matching a condition similar to the key phrase is one of a sentence related to the evaluation target and a candidate of a sentence related to the evaluation target. Decide whether to extract as,
The machine learning device according to any one of claims 4 to 6.
前記評価情報を教師データとして利用して、入力された文に、前記評価対象に関する評価を付与するための第2学習モデルを構築する第2モデル構築部と、
前記第2モデル構築部が構築した前記第2学習モデルを用いて、前記抽出部が抽出した文に、前記評価対象に関する評価を付与する評価付与部と、
をさらに備える、
請求項1から請求項7までの何れか一項に記載の機械学習装置。
A second model constructing unit that constructs a second learning model for giving an evaluation regarding the evaluation target to the input sentence by using the evaluation information as teacher data;
An evaluation assigning unit that assigns an evaluation regarding the evaluation target to the sentence extracted by the extracting unit using the second learning model constructed by the second model constructing unit;
Further comprising,
The machine learning device according to any one of claims 1 to 7.
前記評価付与部による評価に基づいて、特定の期間における前記評価対象の状態又は動向を示す指標を算出する指標算出部と、
前記特定の期間を示す情報を取得する期間情報取得部と、
複数の前記テキストデータのそれぞれを、前記複数のテキストデータのそれぞれの内容に関連する時期、前記複数のテキストデータのそれぞれが記録された時期、又は、前記複数のテキストデータのそれぞれを含む電子ファイルが作成若しくは更新された時期を示す時期情報と対応づけて取得するテキストデータ取得部と、
をさらに備え、
前記抽出部は、前記複数のテキストデータのうち、当該テキストデータに対応付けられた時期情報により示される時期が前記特定の期間に含まれるテキストデータに含まれる複数の文の中から、前記評価対象に関連する文を抽出し、
前記評価付与部は、前記抽出部が前記複数のテキストデータの少なくとも一部から抽出した複数の文に、前記評価対象に関する評価を付与し、
前記指標算出部は、前記評価付与部が前記複数の文のそれぞれに付与した評価に基づいて、前記指標を算出する、
請求項8に記載の機械学習装置。
Based on the evaluation by the evaluation giving unit, an index calculation unit that calculates an index indicating the state or trend of the evaluation target in a specific period,
A period information acquisition unit that acquires information indicating the specific period,
Each of the plurality of text data, a time relating to the content of each of the plurality of text data, a time when each of the plurality of text data was recorded, or an electronic file including each of the plurality of text data, A text data acquisition unit that is acquired in association with time information indicating the time of creation or update,
Further equipped with,
Of the plurality of text data, the extraction unit selects the evaluation target from among a plurality of sentences included in the text data in which the time indicated by the time information associated with the text data is included in the specific period. Extract sentences related to
The evaluation giving unit gives a plurality of sentences extracted from at least a part of the plurality of text data by the extracting unit, and gives an evaluation regarding the evaluation target,
The index calculation unit calculates the index based on the evaluation given to each of the plurality of sentences by the evaluation giving unit,
The machine learning device according to claim 8.
前記テキストデータは、情報提供者の発言若しくはジェスチャにより提示された情報、又は、前記情報提供者が知覚した情報を含み、
前記機械学習装置は、
前記評価付与部による評価に基づいて、特定の期間における前記評価対象の状態又は動向を示す指標を算出する指標算出部と、
複数の前記テキストデータのそれぞれを、前記複数のテキストデータのそれぞれの情報提供者の属性を示す属性情報と対応づけて取得するテキストデータ取得部と、
をさらに備え、
前記評価付与部は、前記抽出部が前記複数のテキストデータの少なくとも一部から抽出した複数の文のそれぞれに対して、各文が含まれていたテキストデータに対応する前記属性情報により示される情報提供者の属性に基づいて、前記評価対象に関する評価を付与し、
前記指標算出部は、前記評価付与部が前記複数の文のそれぞれに付与した評価に基づいて、前記指標を算出する、
請求項8に記載の機械学習装置。
The text data includes information presented by a statement or gesture of the information provider, or information perceived by the information provider,
The machine learning device,
Based on the evaluation by the evaluation giving unit, an index calculation unit that calculates an index indicating the state or trend of the evaluation target in a specific period,
A text data acquisition unit that acquires each of the plurality of text data in association with attribute information indicating an attribute of each information provider of the plurality of text data,
Further equipped with,
The evaluation giving unit, for each of the plurality of sentences extracted from at least a part of the plurality of text data by the extraction unit, information indicated by the attribute information corresponding to the text data including each sentence. Based on the attributes of the provider, give an evaluation about the evaluation target,
The index calculation unit calculates the index based on the evaluation given to each of the plurality of sentences by the evaluation giving unit,
The machine learning device according to claim 8.
コンピュータを、請求項1から請求項10までの何れか一項に記載の機械学習装置として機能させるための、プログラム。 A program for causing a computer to function as the machine learning device according to any one of claims 1 to 10. (i)評価対象に関する評価、及び、(ii)前記評価対象の状態又は前記評価の理由を示す1以上の説明文が対応付けられた評価情報に含まれる前記1以上の説明文を教師データとして利用して、入力された文が、前記評価対象の状態、前記評価対象に対する評価又は前記評価の理由を示す文であるか否かを判定するための第1学習モデルを構築する第1モデル構築段階と、
前記第1モデル構築段階において構築された前記第1学習モデルを用いて、テキストデータに含まれる1以上の文の中から、前記評価対象に関連する文を抽出する抽出段階と、
を有する、機械学習方法。
(I) evaluation regarding the evaluation target, and (ii) the one or more explanation sentences included in the evaluation information associated with one or more explanation sentences indicating the state of the evaluation subject or the reason for the evaluation, as teacher data. First model construction for constructing a first learning model for determining whether or not the input sentence is a sentence indicating the state of the evaluation target, the evaluation for the evaluation target, or the reason for the evaluation Stages,
An extraction step of extracting a sentence related to the evaluation target from one or more sentences included in the text data using the first learning model constructed in the first model constructing stage;
A machine learning method.
JP2019021083A 2019-02-07 2019-02-07 Machine learning device, program and machine learning method Active JP7280705B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019021083A JP7280705B2 (en) 2019-02-07 2019-02-07 Machine learning device, program and machine learning method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019021083A JP7280705B2 (en) 2019-02-07 2019-02-07 Machine learning device, program and machine learning method

Publications (2)

Publication Number Publication Date
JP2020129232A true JP2020129232A (en) 2020-08-27
JP7280705B2 JP7280705B2 (en) 2023-05-24

Family

ID=72174588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019021083A Active JP7280705B2 (en) 2019-02-07 2019-02-07 Machine learning device, program and machine learning method

Country Status (1)

Country Link
JP (1) JP7280705B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312846A (en) * 2021-06-02 2021-08-27 江苏邦鼎科技有限公司 Intelligent detection method and system based on mixed technological process
CN114493019A (en) * 2022-01-29 2022-05-13 建信金融科技有限责任公司 Method and device for determining sending mode
WO2022240558A1 (en) * 2021-05-10 2022-11-17 Nec Laboratories America, Inc. Keyphrase generation for text search with optimal indexing regularization via reinforcement learning
CN117131152A (en) * 2023-10-26 2023-11-28 海易科技(北京)有限公司 Information storage method, apparatus, electronic device, and computer readable medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011118797A (en) * 2009-12-07 2011-06-16 Kddi Corp Mobile cgm analysis system, method, and program
WO2011090036A1 (en) * 2010-01-19 2011-07-28 日本電気株式会社 Trend information retrieval device, trend information retrieval method and recording medium
CN103559207A (en) * 2013-10-10 2014-02-05 江苏名通信息科技有限公司 Financial behavior analyzing system based on social media calculation
JP2015172856A (en) * 2014-03-12 2015-10-01 株式会社ゼンリンデータコム Information collection evaluation device, information collection evaluation method and information collection evaluation program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011118797A (en) * 2009-12-07 2011-06-16 Kddi Corp Mobile cgm analysis system, method, and program
WO2011090036A1 (en) * 2010-01-19 2011-07-28 日本電気株式会社 Trend information retrieval device, trend information retrieval method and recording medium
CN103559207A (en) * 2013-10-10 2014-02-05 江苏名通信息科技有限公司 Financial behavior analyzing system based on social media calculation
JP2015172856A (en) * 2014-03-12 2015-10-01 株式会社ゼンリンデータコム Information collection evaluation device, information collection evaluation method and information collection evaluation program

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
佐藤史仁ほか: "テキストマイニングによる有価証券報告書からの因果関係文の抽出", 人工知能学会研究会資料 SIG−FIN−020 [ONLINE], JPN6022047685, 14 March 2018 (2018-03-14), pages 1 - 5, ISSN: 0004920093 *
小林和正ほか: "アナリストレポートからのアナリスト予想根拠情報の抽出と極性付与", 人工知能学会研究会資料 SIG−FIN−019 [ONLINE], JPN6022047683, 11 October 2017 (2017-10-11), pages 1 - 6, ISSN: 0004920094 *
酒井浩之ほか: "深層学習と拡張手がかり表現による業績要因文への極性付与", 人工知能学研究会資料 SIG−FIN−018 [ONLINE], JPN6022047682, 6 March 2017 (2017-03-06), pages 1 - 6, ISSN: 0004920095 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022240558A1 (en) * 2021-05-10 2022-11-17 Nec Laboratories America, Inc. Keyphrase generation for text search with optimal indexing regularization via reinforcement learning
CN113312846A (en) * 2021-06-02 2021-08-27 江苏邦鼎科技有限公司 Intelligent detection method and system based on mixed technological process
CN114493019A (en) * 2022-01-29 2022-05-13 建信金融科技有限责任公司 Method and device for determining sending mode
CN117131152A (en) * 2023-10-26 2023-11-28 海易科技(北京)有限公司 Information storage method, apparatus, electronic device, and computer readable medium
CN117131152B (en) * 2023-10-26 2024-02-02 海易科技(北京)有限公司 Information storage method, apparatus, electronic device, and computer readable medium

Also Published As

Publication number Publication date
JP7280705B2 (en) 2023-05-24

Similar Documents

Publication Publication Date Title
CA3129745C (en) Neural network system for text classification
CN107506402B (en) Search result sorting method, device, equipment and computer readable storage medium
JP7280705B2 (en) Machine learning device, program and machine learning method
US11500524B2 (en) Automatic generation of preferred views for personal content collections
US10192457B2 (en) Enhancing knowledge bases using rich social media
US11023503B2 (en) Suggesting text in an electronic document
Liu et al. Harnessing global expertise: A comparative study of expertise profiling methods for online communities
US11182540B2 (en) Passively suggesting text in an electronic document
Gao [Retracted] Research and Implementation of Intelligent Evaluation System of Teaching Quality in Universities Based on Artificial Intelligence Neural Network Model
US20200250212A1 (en) Methods and Systems for Searching, Reviewing and Organizing Data Using Hierarchical Agglomerative Clustering
CN113627797B (en) Method, device, computer equipment and storage medium for generating staff member portrait
US20130346401A1 (en) Topical affinity badges in information retrieval
Rhyn et al. A machine learning approach for classifying textual data in crowdsourcing
Rehan et al. Employees reviews classification and evaluation (ERCE) model using supervised machine learning approaches
US10289624B2 (en) Topic and term search analytics
Bitto et al. Sentiment analysis from Bangladeshi food delivery startup based on user reviews using machine learning and deep learning
US9058328B2 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
US10229212B2 (en) Identifying Abandonment Using Gesture Movement
US20240070188A1 (en) System and method for searching media or data based on contextual weighted keywords
Procter et al. Enabling social media research through citizen social science
JP6178480B1 (en) DATA ANALYSIS SYSTEM, ITS CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM
CN110737749B (en) Entrepreneurship plan evaluation method, entrepreneurship plan evaluation device, computer equipment and storage medium
JP6026036B1 (en) DATA ANALYSIS SYSTEM, ITS CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM
Marusenko et al. Mathematical methods for attributing literary works when solving the “Corneille–Molière” problem
JP2022020147A (en) Device, method and program for assisting in creating plan document relating to nursing care

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230512

R150 Certificate of patent or registration of utility model

Ref document number: 7280705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150