JP5075962B2 - Attention target prediction device - Google Patents

Attention target prediction device Download PDF

Info

Publication number
JP5075962B2
JP5075962B2 JP2010225864A JP2010225864A JP5075962B2 JP 5075962 B2 JP5075962 B2 JP 5075962B2 JP 2010225864 A JP2010225864 A JP 2010225864A JP 2010225864 A JP2010225864 A JP 2010225864A JP 5075962 B2 JP5075962 B2 JP 5075962B2
Authority
JP
Japan
Prior art keywords
target
time
numerical
data collection
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010225864A
Other languages
Japanese (ja)
Other versions
JP2012079227A (en
Inventor
茂明 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2010225864A priority Critical patent/JP5075962B2/en
Publication of JP2012079227A publication Critical patent/JP2012079227A/en
Application granted granted Critical
Publication of JP5075962B2 publication Critical patent/JP5075962B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明の実施形態は、複数の対象の中から注目すべき対象を予測する注目対象予測装置に関する。   Embodiments described herein relate generally to a target object prediction apparatus that predicts a target object from among a plurality of targets.

一般的に、複数の対象の中から次期において注目すべき対象を選別しなければならない場合がある。   In general, it may be necessary to select a target to be noticed in the next period from a plurality of targets.

例えば証券市場においては、多くの銘柄の中から注目すべき銘柄を選別して銘柄売買に関する意思決定をしなければならない。また、例えばプラント監視においては、多くのプラントの中から故障等の可能性があるプラントを選別してプラントの保守計画を作成する必要がある。   For example, in the securities market, it is necessary to make a decision on buying and selling a brand by selecting a brand to be noticed from many brands. For example, in plant monitoring, it is necessary to select a plant having a possibility of failure or the like from many plants and create a maintenance plan for the plant.

特開2002−269357号公報JP 2002-269357 A 特開2007−087354号公報JP 2007-087354 A

しかしながら、多数の対象に対する情報が多数存在する中で、当該多数の対象の中から注目すべき対象を選別することは非常に困難である。したがって、多数の対象の中から自動的に注目すべき対象を予測して、当該注目すべき対象を提示できるような装置(注目対象予測装置)が望まれている。   However, it is very difficult to select a target to be noticed from the large number of objects in a large amount of information for the large number of objects. Therefore, an apparatus (attention target prediction apparatus) that can automatically predict a target to be noticed from a large number of objects and present the target to be noticed is desired.

また、このような注目対象予測装置を利用する利用者にとっては、多数の対象の中から注目すべき対象を容易かつ簡便に選別できることが望ましい。   Further, it is desirable for a user who uses such a target-of-interest prediction apparatus to easily and easily select a target to be noted from a large number of targets.

そこで、本発明が解決しようとする課題は、多数の対象の中から注目すべき対象を利用者が容易かつ簡便に選別することが可能な注目対象予測装置を提供することにある。   Therefore, a problem to be solved by the present invention is to provide an attention target prediction device that allows a user to easily and easily select a target to be noticed from among a large number of objects.

実施形態によれば、複数の対象の中から注目すべき対象を予測する注目対象予測装置が提供される。   According to the embodiment, an attention object prediction device that predicts an object to be noticed from among a plurality of objects is provided.

実施形態に係る注目対象予測装置は、対象表現格納手段と、第1のデータ収集手段と、第1の評価値算出手段と、第2のデータ収集手段と、変化率算出手段と、第3のデータ収集手段と、第2の評価値算出手段と、注目度算出手段と、提示手段とを具備する。   An attention target prediction apparatus according to the embodiment includes a target expression storage unit, a first data collection unit, a first evaluation value calculation unit, a second data collection unit, a change rate calculation unit, and a third Data collection means, second evaluation value calculation means, attention level calculation means, and presentation means are provided.

対象表現格納手段は、前記対象毎に、当該対象に関連する文字列を格納する。   The object expression storage means stores a character string related to the object for each object.

第1のデータ収集手段は、予め定められた複数の期間内における文字列を含むテキスト情報を収集し、当該収集されたテキスト情報を時系列順に含む時系列テキストデータを取得する。 The first data collection unit collects text information including character strings within a plurality of predetermined periods, and acquires time-series text data including the collected text information in time-series order.

第1の評価値算出手段は、前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第1のデータ収集手段によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、前記対象毎に前記時系列順の評価値を算出する。   The first evaluation value calculation means includes a character string related to the target stored in the target expression storage means for each target and time series text data acquired by the first data collection means. Based on the text information in the sequence order, the evaluation value in the time series order is calculated for each target.

第2のデータ収集手段は、前記対象毎に、前記予め定められた複数の期間内における当該対象に関する数値を含む数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得する。 The second data collection means collects, for each target, numerical information including numerical values related to the target within the predetermined plurality of periods, and acquires time-series numerical data including the numerical information in time series order. .

変化率算出手段は、前記対象毎に前記第2のデータ収集手段によって取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、前記対象毎に前記時系列順の変化率を算出する。   The rate-of-change calculating means is configured to calculate the time for each target based on numerical values included in numerical information before and after the time series in the time-series order included in the time-series numerical data acquired by the second data collecting means for each target. The rate of change in sequence order is calculated.

第3のデータ収集手段は、前記予め定められた複数の期間後における文字列を含むテキスト情報を収集する。 Third data collection means collects the text information including a text string after a plurality of periods said predetermined.

第2の評価値算出手段は、前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第3のデータ収集手段によって収集されたテキスト情報に含まれる文字列に基づいて、前記対象毎に評価値を算出する。   The second evaluation value calculating means applies a character string related to the object stored in the object expression storing means for each object and a character string included in the text information collected by the third data collecting means. Based on this, an evaluation value is calculated for each object.

注目度算出手段は、前記対象毎に前記第1の評価値算出手段によって算出された前記時系列順の評価値、前記対象毎に前記変化率算出手段によって算出された前記時系列順の変化率および前記対象毎に前記第2の評価値算出手段によって算出された評価値を用いて、前記対象毎の注目度を算出する。   The degree-of-attention calculation means includes the evaluation values in the time series order calculated by the first evaluation value calculation means for each target, and the change rates in the time series order calculated by the change rate calculation means for each target. The attention level for each target is calculated using the evaluation value calculated by the second evaluation value calculation means for each target.

提示手段は、前記注目度算出手段によって算出された前記対象毎の注目度を提示する。   The presenting means presents the attention level for each target calculated by the attention level calculation means.

実施形態に係る注目対象予測装置のハードウェア構成を示すブロック図。The block diagram which shows the hardware constitutions of the attention object prediction apparatus which concerns on embodiment. 図1に示す注目対象予測装置30の主として機能構成を示すブロック図。The block diagram which mainly shows a function structure of the attention object prediction apparatus 30 shown in FIG. 図2に示す対象表現格納部22のデータ構造の一例を示す図。The figure which shows an example of the data structure of the object expression storage part 22 shown in FIG. 本実施形態に係る注目対象予測装置30の処理手順を示すフローチャート。The flowchart which shows the process sequence of the attention object prediction apparatus 30 which concerns on this embodiment. 時系列予測モデル更新処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of a time series prediction model update process. テキスト解析処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of a text analysis process. 対象数値解析処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of object numerical analysis process. 学習データ期間内におけるテキスト情報を時系列順に含む時系列テキストデータの一例を示す図。The figure which shows an example of the time series text data which contains the text information in a learning data period in time series order. 対象表現評価部32の内部に格納された対象「A社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "A company" stored in the object expression evaluation part 32 inside. 対象表現評価部32の内部に格納された対象「B社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the target expression evaluation value of the time series order of the object "B company" stored in the inside of the target expression evaluation part 32. FIG. 対象表現評価部32の内部に格納された対象「C社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "C company" stored in the object expression evaluation part 32 inside. 対象表現評価部32の内部に格納された対象「D社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "Company D" stored in the object expression evaluation part 32 inside. 対象「A社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "A company" in time series order. 対象「B社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "B company" in time series order. 対象「C社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data which contains the numerical information collected about object "C company" in time series order. 対象「D社」について収集された数値情報を時系列順に含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "D company" in time series order. 対象数値変化率評価部33の内部に格納された対象「A社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the target "A company" stored in the inside of the target numerical value change rate evaluation part 33 in the time series order. 対象数値変化率評価部33の内部に格納された対象「B社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the target "company B" stored in the inside of the target numerical value change rate evaluation part 33 in the time series order. 対象数値変化率評価部33の内部に格納された対象「C社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the target "Company C" stored in the inside of the target numerical value change rate evaluation part 33 in the time series order. 対象数値変化率評価部33の内部に格納された対象「D社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the target "Company D" stored in the inside of the target numerical value change rate evaluation part 33 in the time series order. 時系列予測モデル生成部34によって生成された時系列予測モデルの一例を示す図。The figure which shows an example of the time series prediction model produced | generated by the time series prediction model production | generation part. 対象表現評価部32によって算出された対象「A社」の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of object "A company" calculated by the object expression evaluation part 32. FIG. 対象表現評価部32によって算出された対象「B社」の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of object "B company" calculated by the object expression evaluation part 32. FIG. 対象表現評価部32によって算出された対象「C社」の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of object "Company C" calculated by the object expression evaluation part 32. FIG. 対象表現評価部32によって算出された対象「D社」の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of object "Company D" calculated by the object expression evaluation part 32. FIG. 更新後の対象「A社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "A company" after an update. 更新後の対象「B社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "B company" after an update. 更新後の対象「C社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "C company" after an update. 更新後の対象「D社」の時系列順の対象表現評価値の一例を示す図。The figure which shows an example of the object expression evaluation value of the time series order of object "D company" after an update. 対象「A社」について収集された数値情報を含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "A company." 対象「B社」について収集された数値情報を含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "B company." 対象「C社」について収集された数値情報を含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "C company." 対象「D社」について収集された数値情報を含む時系列数値データの一例を示す図。The figure which shows an example of the time series numerical data containing the numerical information collected about object "D company." 対象数値変化率評価部33によって算出された対象「A社」の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the object "Company A" calculated by the target numerical value change rate evaluation part 33. 対象数値変化率評価部33によって算出された対象「B社」の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the object "Company B" calculated by the target numerical value change rate evaluation part 33. 対象数値変化率評価部33によって算出された対象「C社」の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the object "Company C" calculated by the target numerical value change rate evaluation part 33. 対象数値変化率評価部33によって算出された対象「D社」の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical value change rate of the object "Company D" calculated by the target numerical value change rate evaluation part 33. 更新後の対象「A社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the object numerical value change rate of the time series order of object "A company" after an update. 更新後の対象「B社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the object numerical value change rate of the time series order of the object "B company" after an update. 更新後の対象「C社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the object numerical value change rate of the time series order of the object "C company" after an update. 更新後の対象「D社」の時系列順の対象数値変化率の一例を示す図。The figure which shows an example of the target numerical change rate of the target "Company D" after an update in the time series order. 対象ランキング処理の処理手順を示すフローチャート。The flowchart which shows the process sequence of object ranking process. 対象注目度算出部35によって算出された対象「A社」、「B社」、「C社」および「D社」の各々の注目度の一例を示す図。The figure which shows an example of each attention degree of object "A company", "B company", "C company", and "D company" calculated by the object attention degree calculation part 35. FIG. 対象ランキング表示部36によって表示される対象毎の注目度のランキング結果の一例を示す図。The figure which shows an example of the ranking result of the attention degree for every object displayed by the object ranking display part 36. FIG. パラメータの更新後に対象ランキング表示部36によって表示される対象毎の注目度のランキング結果の一例を示す図。The figure which shows an example of the ranking result of the attention degree for every object displayed by the object ranking display part 36 after the parameter update.

以下、図面を参照して、実施形態について説明する。   Hereinafter, embodiments will be described with reference to the drawings.

図1は、本実施形態に係る注目対象予測装置のハードウェア構成を示すブロック図である。図1に示すように、コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。この外部記憶装置20は、コンピュータ10によって実行されるプログラム21を格納する。コンピュータ10および外部記憶装置20は、注目対象予測装置30を構成する。   FIG. 1 is a block diagram illustrating a hardware configuration of the attention target prediction apparatus according to the present embodiment. As shown in FIG. 1, the computer 10 is connected to an external storage device 20 such as a hard disk drive (HDD). The external storage device 20 stores a program 21 executed by the computer 10. The computer 10 and the external storage device 20 constitute an attention target prediction device 30.

この注目対象予測装置30は、例えば証券市場等における複数の対象の中から注目すべき対象を予測する機能を有する。なお、この場合における対象としては例えば企業等が含まれる。   This attention object prediction device 30 has a function of predicting an object to be noticed from among a plurality of objects in, for example, a securities market. In this case, examples of the target include companies.

図2は、図1に示す注目対象予測装置30の主として機能構成を示すブロック図である。図2に示すように、注目対象予測装置30は、データ収集部31、対象表現評価部32、対象数値変化率評価部33、時系列予測モデル生成部34、対象注目度算出部35および対象ランキング表示部36を含む。本実施形態において、これらの各部31〜36は、図1に示すコンピュータ10が外部記憶装置20に格納されているプログラム21を実行することにより実現されるものとする。このプログラム21は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム21が、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。   FIG. 2 is a block diagram mainly showing a functional configuration of the attention target prediction apparatus 30 shown in FIG. As illustrated in FIG. 2, the attention target prediction device 30 includes a data collection unit 31, a target expression evaluation unit 32, a target numerical change rate evaluation unit 33, a time series prediction model generation unit 34, a target attention level calculation unit 35, and a target ranking. A display unit 36 is included. In the present embodiment, these units 31 to 36 are realized by the computer 10 illustrated in FIG. 1 executing the program 21 stored in the external storage device 20. This program 21 can be stored in advance in a computer-readable storage medium and distributed. Further, this program 21 may be downloaded to the computer 10 via, for example, a network.

また、注目対象予測装置30は、対象表現格納部22を含む。本実施形態において、対象表現格納部22は、例えば図1に示す外部記憶装置20に格納される。   The attention target prediction device 30 includes a target expression storage unit 22. In the present embodiment, the target expression storage unit 22 is stored in, for example, the external storage device 20 illustrated in FIG.

対象表現格納部22には、上記した対象毎に、当該対象に関連する文字列(以下、対象表現と表記)が格納される。この対象表現には、当該対象(企業)の名称、略称、愛称および当該企業が保有するブランド名等が含まれる。   For each target described above, the target expression storage unit 22 stores a character string related to the target (hereinafter referred to as target expression). This object expression includes the name (abbreviation), nickname, and brand name of the object (company).

データ収集部31は、予め定められた期間(以下、学習データ収集期間と表記)内における文字列を含むテキスト情報を収集し、当該テキスト情報を時系列順に含む時系列テキストデータを取得する。なお、データ収集部31によって収集されるテキスト情報には、例えばWebサイト等から発信されるニュースのヘッドライン等が含まれる。   The data collection unit 31 collects text information including a character string within a predetermined period (hereinafter referred to as a learning data collection period), and acquires time-series text data including the text information in time-series order. The text information collected by the data collection unit 31 includes, for example, a headline of news transmitted from a website or the like.

また、データ収集部31は、対象毎に、上記した学習データ収集期間内における当該対象に関する数値を含む数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得する。データ収集部31によって収集される数値情報には、対象(企業)の株価等が含まれる。なお、データ収集部31は、数値情報を例えばWebサイト等から収集する。   In addition, the data collection unit 31 collects numerical information including numerical values related to the target within the learning data collection period described above for each target, and acquires time-series numerical data including the numerical information in time series order. The numerical information collected by the data collection unit 31 includes the stock price of the target (company). The data collection unit 31 collects numerical information from, for example, a website.

更に、データ収集部31は、上記した学習データ収集期間後から現在までの期間(以下、予測データ収集期間と表記)内における文字列を含むテキスト情報を収集する。   Furthermore, the data collection unit 31 collects text information including character strings within a period from the learning data collection period to the present (hereinafter referred to as a predicted data collection period).

対象表現評価部32は、対象毎に対象表現格納部22に格納されている対象表現(当該対象に関連する文字列)およびデータ収集部31によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、当該対象毎に時系列順の評価値を算出する。   The target expression evaluation unit 32 includes, for each target, the target expression (character string related to the target) stored in the target expression storage unit 22 and the time series order included in the time series text data acquired by the data collection unit 31. Based on the text information, an evaluation value in time series order is calculated for each target.

また、対象表現評価部32は、対象毎に対象表現格納部22に格納されている対象表現およびデータ収集部31によって上記した予測データ収集期間内に収集されたテキスト情報に基づいて、当該対象毎に評価値を算出する。   Further, the target expression evaluation unit 32 sets the target expression for each target based on the target expression stored in the target expression storage unit 22 for each target and the text information collected by the data collection unit 31 within the prediction data collection period. The evaluation value is calculated.

対象数値変化率評価部33は、対象毎にデータ収集部31によって取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、当該対象毎に当該時系列順の変化率を算出する。   The target numerical change rate evaluation unit 33 sets the time series for each target based on the numerical values included in the numerical information before and after in the time series order included in the time series numerical data acquired by the data collection unit 31 for each target. Calculate the rate of change in order.

時系列予測モデル生成部34は、対象毎に対象表現評価部32によって算出された時系列順の評価値および当該対象毎に対象数値変化率評価部33によって算出された時系列順の変化率に基づいて、後述する時系列予測モデルを生成する。時系列予測モデル生成部34によって生成された時系列予測モデルは、対象毎の注目度を算出する際に用いられる。なお、時系列予測モデル生成部34によって生成された時系列予測モデルは、例えば当該時系列予測モデル生成部34内部に格納される。   The time-series prediction model generation unit 34 sets the time-series order evaluation values calculated by the target expression evaluation unit 32 for each target and the time-series order change rates calculated by the target numerical value change rate evaluation unit 33 for each target. Based on this, a time series prediction model to be described later is generated. The time series prediction model generated by the time series prediction model generation unit 34 is used when calculating the degree of attention for each target. The time series prediction model generated by the time series prediction model generation unit 34 is stored in the time series prediction model generation unit 34, for example.

対象注目度算出部35は、対象毎の注目度を算出する。対象注目度算出部35は、対象毎に対象表現評価部32によって算出された時系列順の評価値、対象毎に対象数値変化率評価部33によって算出された時系列順の変化率および対象毎に対象表現評価部32によって算出された評価値を用いて、当該対象毎の注目度を算出する。具体的には、対象注目度算出部35は、時系列予測モデル生成部34内部に格納された時系列予測モデル(時系列予測モデル生成部34によって生成された時系列予測モデル)、対象毎に対象表現評価部32によって算出された評価値および複数の予め定められたパラメータを用いて、対象毎の注目度を算出する。   The target attention level calculation unit 35 calculates the attention level for each target. The target attention level calculation unit 35 calculates the evaluation value in time series order calculated by the target expression evaluation unit 32 for each target, the change rate in time series order calculated by the target numerical value change rate evaluation unit 33 for each target, and for each target. The degree of attention for each target is calculated using the evaluation value calculated by the target expression evaluation unit 32. Specifically, the target attention level calculation unit 35 is a time-series prediction model stored in the time-series prediction model generation unit 34 (a time-series prediction model generated by the time-series prediction model generation unit 34), for each target. The degree of attention for each target is calculated using the evaluation value calculated by the target expression evaluation unit 32 and a plurality of predetermined parameters.

対象ランキング表示部36は、対象注目度算出部35によって算出された対象毎の注目度を提示する。具体的には、対象ランキング表示部36は、複数の対象を対象注目度算出部35によって算出された注目度順に並び替え、当該複数の対象をランキング形式で表示する。   The target ranking display unit 36 presents the attention level for each target calculated by the target attention level calculation unit 35. Specifically, the target ranking display unit 36 rearranges the plurality of targets in the order of the attention degrees calculated by the target attention level calculation unit 35, and displays the plurality of targets in a ranking format.

図3は、図2に示す対象表現格納部22のデータ構造の一例を示す。図3に示すように、対象表現格納部22には、対象と当該対象に関連する文字列(対象表現)とが対応づけて格納されている。ここでは、対象として「A社」、「B社」、「C社」および「D社」が存在するものとする。   FIG. 3 shows an example of the data structure of the target expression storage unit 22 shown in FIG. As shown in FIG. 3, the target expression storage unit 22 stores a target and a character string (target expression) related to the target in association with each other. Here, it is assumed that “Company A”, “Company B”, “Company C”, and “Company D” exist as targets.

図3に示す例では、対象表現格納部22には、対象「A社」と対象表現「A社」、「X1ブランド」および「X2ブランド」とが対応づけて格納されている。これによれば、対象「A社」に関連する文字列が「A社」、「X1ブランド」および「X2ブランド」であることが示されている。   In the example illustrated in FIG. 3, the target expression storage unit 22 stores the target “Company A” and the target expressions “Company A”, “X1 brand”, and “X2 brand” in association with each other. This indicates that the character strings related to the target “Company A” are “Company A”, “X1 brand”, and “X2 brand”.

また、対象表現格納部22には、対象「B社」と対象表現「B社」、「B1社」および「Yブランド」とが対応づけて格納されている。これによれば、対象「B社」に関連する文字列が「B社」、「B1社」および「Yブランド」であることが示されている。   The target expression storage unit 22 stores the target “B company” and the target expressions “B company”, “B1 company”, and “Y brand” in association with each other. According to this, it is indicated that the character strings related to the target “Company B” are “Company B”, “Company B1”, and “Y brand”.

また、対象表現格納部22には、対象「C社」と対象表現「C社」および「Zブランド」とが対応づけて格納されている。これによれば、対象「C社」に関連する文字列が「C社」および「Zブランド」であることが示されている。   The target expression storage unit 22 stores the target “Company C” and the target expressions “C company” and “Z brand” in association with each other. This indicates that the character strings related to the target “C company” are “C company” and “Z brand”.

また、対象表現格納部22には、対象「D社」と対象表現「D社」および「D1社」とが対応づけて格納されている。これによれば、対象「D社」に関連する文字列が「D社」および「D1社」であることが示されている。   The target expression storage unit 22 stores the target “Company D” and the target expressions “Company D” and “D1 company” in association with each other. According to this, it is indicated that the character strings related to the target “Company D” are “Company D” and “Company D1”.

次に、図4のフローチャートを参照して、本実施形態に係る注目対象予測装置30の処理手順について説明する。   Next, with reference to the flowchart of FIG. 4, the processing procedure of the attention object prediction apparatus 30 which concerns on this embodiment is demonstrated.

まず、注目対象予測装置30の初期化が実行される(ステップS1)。ここでは、データ収集部31は、テキスト情報(ニュースのヘッドライン)を収集する例えばWebサイトの設定、数値情報(対象の株価)を収集する例えばWebサイトの設定、当該収集の単位時間(データ収集単位時間)および当該収集の最大回数(データ収集最大回数)の設定を行う。   First, initialization of the attention object prediction device 30 is executed (step S1). Here, the data collection unit 31 sets, for example, a website for collecting text information (news headlines), sets, for example, a website for collecting numerical information (target stock price), and a unit time for the collection (data collection). (Unit time) and the maximum number of times of collection (maximum number of data collection) are set.

なお、これらの設定項目の値は、予めファイル等に記載しておいてもよいし、利用者によってインタフェースを通じて入力(設定)されても構わない。   Note that the values of these setting items may be described in a file or the like in advance, or may be input (set) by a user through an interface.

データ収集部31は、利用者の操作に応じてモードを設定する(ステップS2)。このとき、利用者は、例えば学習モード、予測モードおよび終了モードのいずれか1つを選択することができる。学習モードは、テキスト情報および数値情報を収集し、上記した時系列予測モデルを生成するためのモードである。予測モードは、複数の対象の中から注目すべき対象を予測し、当該注目すべき対象を提示するためのモードである。また、終了モードは、注目対象予測装置30の動作(処理)を終了するためのモードである。   The data collection unit 31 sets a mode according to the user's operation (step S2). At this time, the user can select any one of the learning mode, the prediction mode, and the end mode, for example. The learning mode is a mode for collecting text information and numerical information and generating the above-described time series prediction model. The prediction mode is a mode for predicting a target to be noticed from a plurality of targets and presenting the target to be noticed. The end mode is a mode for ending the operation (processing) of the target prediction device 30.

ステップS2においては、例えば利用者からのモードの選択を一定時間待ち、当該一定時間が経過しても当該利用者によってモードが選択されない場合には、学習モードが自動的に設定されてもよい。   In step S2, for example, the mode selection from the user is waited for a certain time, and if the mode is not selected by the user even after the certain time has elapsed, the learning mode may be automatically set.

なお、後述するようにデータ収集部31によって設定されたモードに応じて注目対象予測装置30の動作は異なる。   Note that, as will be described later, the operation of the target object prediction device 30 differs depending on the mode set by the data collection unit 31.

次に、データ収集部31は、学習モードが設定されたか否かを判定する(ステップS3)。学習モードが設定されたと判定された場合(ステップS3のYES)、後述する時系列予測モデル更新処理が実行される(ステップS4)。なお、この時系列予測モデル更新処理は、データ収集部31、対象表現評価部32、対象数値変化率評価部33および時系列予測モデル生成部34によって実行される。ステップS4の処理が実行されると、上記したステップS2に戻って処理が繰り返される。   Next, the data collection unit 31 determines whether or not the learning mode is set (step S3). When it is determined that the learning mode is set (YES in step S3), a time series prediction model update process described later is executed (step S4). The time series prediction model update process is executed by the data collection unit 31, the target expression evaluation unit 32, the target numerical change rate evaluation unit 33, and the time series prediction model generation unit 34. If the process of step S4 is performed, it will return to above-mentioned step S2 and a process will be repeated.

なお、上記したようにステップS2において利用者からのモードの選択がされないような場合には学習モードが設定されるため、明示的に利用者によって予測モードまたは終了モードが選択されない限り、時系列予測モデル更新処理が繰り返されることになる。この場合、時系列予測モデル更新処理は、例えば上記した注目対象予測装置30の初期化処理において設定されたデータ収集単位時間の間隔で繰り返される。   Note that, as described above, when the mode is not selected by the user in step S2, the learning mode is set. Therefore, unless the prediction mode or the end mode is explicitly selected by the user, the time series prediction is performed. The model update process is repeated. In this case, the time-series prediction model update process is repeated, for example, at intervals of the data collection unit time set in the initialization process of the attention target prediction device 30 described above.

一方、学習モードが設定されていないと判定された場合(ステップS3のNO)、データ収集部31は、予測モードが設定されたか否かを判定する(ステップS5)。   On the other hand, when it is determined that the learning mode is not set (NO in step S3), the data collection unit 31 determines whether the prediction mode is set (step S5).

予測モードが設定されたと判定された場合(ステップS5のYES)、後述する対象ランキング処理が実行される(ステップS6)。なお、この対象ランキング処理は、データ収集部31、対象表現評価部32、対象注目度算出部35および対象ランキング表示部36によって実行される。ステップS6の処理が実行されると、上記したステップS2に戻って処理が繰り返される。   When it is determined that the prediction mode is set (YES in step S5), a target ranking process described later is executed (step S6). The target ranking process is executed by the data collection unit 31, the target expression evaluation unit 32, the target attention level calculation unit 35, and the target ranking display unit 36. If the process of step S6 is performed, it will return to above-mentioned step S2 and a process will be repeated.

一方、予測モードが設定されていないと判定された場合(ステップS5のNO)、つまり、終了モードが設定された場合、注目対象予測装置30の動作(処理)は終了される。   On the other hand, when it is determined that the prediction mode is not set (NO in step S5), that is, when the end mode is set, the operation (process) of the attention target prediction device 30 is ended.

次に、図5のフローチャートを参照して、上述した時系列予測モデル更新処理(図4に示すステップS4の処理)の処理手順について説明する。なお、時系列予測モデル更新処理は、上述したように学習モードが設定された場合に実行される処理である。   Next, a processing procedure of the above-described time series prediction model update process (the process of step S4 shown in FIG. 4) will be described with reference to the flowchart of FIG. The time series prediction model update process is a process executed when the learning mode is set as described above.

まず、データ収集部31は、学習データ収集期間を設定する(ステップS11)。例えば以前に時系列予測モデル更新処理が実行されていない場合、つまり、今回の時系列予測モデル更新処理が1回目である場合には、注目対象予測装置30の初期化処理(図4に示すステップS1の処理)において設定されたデータ収集単位時間にデータ収集最大回数から1を減算した値を掛けた時間(つまり、「データ収集単位時間*(データ収集最大回数−1)」)を現在から遡った時点(の直後)から現在までの期間を学習データ収集期間として設定する。具体的には、データ収集単位時間として1日が設定されており、データ収集最大回数として5回が設定されており、現在の日付が「2010/1/8」である場合には、現在の日付「2010/1/8」から「1日*(5−1)」の時間を現在から遡った時点から現在までの期間、つまり、「2010/1/4〜2010/1/8」までの5日分(つまり、データ収集単位時間のデータ収集最大回数分)の期間が学習データ収集期間として設定される。   First, the data collection unit 31 sets a learning data collection period (step S11). For example, when the time series prediction model update process has not been executed before, that is, when the current time series prediction model update process is the first time, the initialization process of the target prediction device 30 (steps shown in FIG. 4) The time obtained by multiplying the data collection unit time set in S1) by the value obtained by subtracting 1 from the maximum number of data collections (ie, “data collection unit time * (maximum number of data collections−1)”) is traced back from the present. The period from the point in time (immediately after) to the present is set as the learning data collection period. Specifically, 1 day is set as the data collection unit time, 5 times is set as the maximum number of data collection, and the current date is “2010/1/8”, the current date The period from the date “2010/1/8” to the time “1 day * (5-1)” from the present to the present, that is, “2010/1/4 to 2010/1/8” A period of five days (that is, the maximum number of data collection times of the data collection unit time) is set as the learning data collection period.

一方、以前に時系列予測モデル更新処理が実行されている場合、つまり、今回の時系列予測モデル更新処理が2回目以降である場合には、データ収集部31は、前回の時系列予測モデル更新処理において設定された学習データ収集期間後(つまり、当該時系列予測モデル更新処理の終了後)から現在までの期間(つまり、1データ収集単位時間分の期間)を学習データ収集期間として設定する。具体的には、前回の時系列予測モデル更新処理において設定された学習データ収集期間が「2010/1/4〜2010/1/8」であり、現在の日付が「2010/1/9」である場合には、「2010/1/9」の1日分(つまり、1データ収集単位時間分)の期間が学習データ収集期間として設定される。   On the other hand, when the time series prediction model update process has been executed previously, that is, when the current time series prediction model update process is the second time or later, the data collection unit 31 updates the previous time series prediction model update process. A period from the learning data collection period set in the process (that is, after the end of the time series prediction model update process) to the present (that is, a period of one data collection unit time) is set as the learning data collection period. Specifically, the learning data collection period set in the previous time series prediction model update process is “2010/1/4 to 2010/1/8”, and the current date is “2010/1/9”. In some cases, a period of one day of “2010/1/9” (that is, one data collection unit time) is set as the learning data collection period.

つまり、今回の時系列予測モデル更新処理が1回目である場合には学習データ収集期間として1データ収集単位時間より長い期間(データ収集単位時間のデータ収集最大回数分の期間)が設定され、今回の時系列予測モデル更新処理が2回目以降である場合には学習データ収集期間として1データ収集単位時間が設定される。   That is, when the current time series prediction model update process is the first time, a period longer than one data collection unit time (a period corresponding to the maximum number of data collections of the data collection unit time) is set as the learning data collection period. If the time series prediction model update process is the second or later, one data collection unit time is set as the learning data collection period.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される(ステップS12)。このテキスト解析処理においては、データ収集部31によって設定された学習データ収集期間内における時系列テキストデータが取得され、当該取得された時系列テキストデータに基づいて対象毎の評価値(以下、対象表現評価値と表記)が算出される。   Next, text analysis processing is executed based on the learning data collection period set by the data collection unit 31 (step S12). In this text analysis process, time-series text data within a learning data collection period set by the data collection unit 31 is acquired, and an evaluation value for each target (hereinafter referred to as target expression) based on the acquired time-series text data. Evaluation value and notation) are calculated.

なお、データ収集部31によって設定された学習データ収集期間が1データ収集単位時間より長い場合(つまり、今回の時系列予測モデル更新処理が1回目である場合)、テキスト解析処理においては、当該学習データ収集期間内におけるデータ収集単位時間毎の対象表現評価値(つまり、時系列順の対象表現評価値)が対象毎に算出される。一方、データ収集部31によって設定された学習データ収集期間が1データ収集単位時間である場合(つまり、今回の時系列予測モデル更新処理が2回目以降である場合)、テキスト解析処理においては、当該学習データ収集期間内における1データ収集単位時間分の対象表現評価値が対象毎に算出される。なお、テキスト解析処理の詳細については後述する。   When the learning data collection period set by the data collection unit 31 is longer than one data collection unit time (that is, when the current time series prediction model update process is the first time), in the text analysis process, A target expression evaluation value for each data collection unit time within the data collection period (that is, a target expression evaluation value in time series order) is calculated for each target. On the other hand, when the learning data collection period set by the data collection unit 31 is one data collection unit time (that is, when the current time series prediction model update process is the second or later), in the text analysis process, A target expression evaluation value for one data collection unit time within the learning data collection period is calculated for each target. Details of the text analysis process will be described later.

テキスト解析処理が実行されると、対象表現評価部32は、当該テキスト解析処理において算出された対象毎の対象表現評価値に基づいて、当該対象毎の時系列順の対象表現評価値を更新する(ステップS13)。なお、対象毎の時系列順の対象表現評価値は、例えば対象表現評価部32の内部に格納される。   When the text analysis process is executed, the target expression evaluation unit 32 updates the target expression evaluation value in time series order for each target based on the target expression evaluation value for each target calculated in the text analysis process. (Step S13). Note that the target expression evaluation value in time series order for each target is stored in the target expression evaluation unit 32, for example.

なお、上記したように学習データ収集期間が1データ収集単位時間より長い場合、ステップS13においては、テキスト解析処理において算出された対象毎の時系列順の対象表現評価値(つまり、学習データ収集期間内におけるデータ収集単位時間毎の対象表現評価値)がそのまま格納される。一方、学習データ収集期間が1データ収集単位時間である場合、ステップS13においては、前回の時系列予測モデル更新処理において既に格納されている対象毎の時系列順の対象表現評価値において最も古い日付(時間帯)の対象表現評価値が削除され、テキスト解析処理において算出された対象表現評価値(つまり、1収集単位時間分の対象表現評価値)が当該時系列順の対象表現評価値の最後に格納される。つまり、対象表現評価部32の内部には、データ収集最大回数と同じ数の対象表現評価値が対象毎に格納される。   As described above, when the learning data collection period is longer than one data collection unit time, in step S13, the target expression evaluation values in the chronological order for each target calculated in the text analysis process (that is, the learning data collection period). The object expression evaluation value for each data collection unit time) is stored as it is. On the other hand, when the learning data collection period is one data collection unit time, in step S13, the oldest date in the target expression evaluation value in time series order for each target already stored in the previous time series prediction model update process The target expression evaluation value of (time zone) is deleted, and the target expression evaluation value calculated in the text analysis process (that is, the target expression evaluation value for one collection unit time) is the last of the target expression evaluation values in the time series order Stored in That is, the same number of target expression evaluation values as the maximum number of data collections are stored for each target in the target expression evaluation unit 32.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、対象数値解析処理が実行される(ステップS14)。この対象数値解析処理においては、データ収集部31によって設定された学習データ収集期間内における時系列数値データが取得され、当該取得された時系列数値データに基づいて対象毎の変化率(以下、対象数値変化率と表記)が算出される。   Next, the target numerical analysis process is executed based on the learning data collection period set by the data collection unit 31 (step S14). In this target numerical analysis process, time-series numerical data within the learning data collection period set by the data collection unit 31 is acquired, and the rate of change for each target (hereinafter referred to as target) based on the acquired time-series numerical data. Numerical value change rate).

なお、上記したテキスト解析処理と同様に、データ収集部31によって設定された学習データ収集期間が1データ収集単位時間より長い場合、対象数値解析処理においては、当該学習データ収集期間内におけるデータ収集単位時間毎の対象数値変化率(つまり、時系列順の対象数値変化率)が対象毎に算出される。一方、データ収集部31によって設定された学習データ収集期間が1データ収集単位時間である場合、対象数値解析処理においては、当該学習データ収集期間内における1データ収集単位時間分の対象数値変化率が対象毎に算出される。なお、対象数値解析処理の詳細については後述する。   As in the text analysis process described above, when the learning data collection period set by the data collection unit 31 is longer than one data collection unit time, in the target numerical analysis process, the data collection unit within the learning data collection period The target numerical change rate for each time (that is, the target numerical change rate in time series order) is calculated for each target. On the other hand, when the learning data collection period set by the data collection unit 31 is one data collection unit time, in the target numerical analysis process, the target numerical value change rate for one data collection unit time within the learning data collection period is Calculated for each subject. Details of the target numerical analysis process will be described later.

対象数値解析処理が実行されると、対象表現評価部32は、当該対象数値解析処理において算出された対象毎の対象数値変化率に基づいて、当該対象毎の時系列順の対象数値変化率を更新する(ステップS15)。なお、対象毎の時系列順の対象数値変化率は、例えば対象数値変化率評価部33の内部に格納される。   When the target numerical value analysis process is executed, the target expression evaluation unit 32 calculates the target numerical value change rate in time series order for each target based on the target numerical value change rate for each target calculated in the target numerical value analysis process. Update (step S15). Note that the target numerical value change rate in time series order for each target is stored in the target numerical value change rate evaluation unit 33, for example.

なお、上記したように学習データ収集期間が1データ収集単位時間より長い場合、ステップS15においては、対象数値解析処理において算出された対象毎の時系列順の対象数値変化率(つまり、学習データ収集期間内におけるデータ収集単位時間毎の対象数値変化率)がそのまま格納される。一方、学習データ収集期間が1データ収集単位時間である場合、ステップS15においては、前回の時系列予測モデル更新処理において既に格納されている対象毎の時系列順の対象数値変化率において最も古い日付(時間帯)の対象数値変化率が削除され、対象数値解析処理において算出された対象数値変化率(つまり、1収集単位時間分の対象表現評価値)が当該時系列順の対象数値変化率の最後に格納される。   As described above, when the learning data collection period is longer than one data collection unit time, in step S15, the target numerical value change rate in chronological order for each target calculated in the target numerical value analysis processing (that is, learning data collection) The target numerical value change rate for each data collection unit time within the period) is stored as it is. On the other hand, when the learning data collection period is one data collection unit time, in step S15, the oldest date in the target numerical change rate in time series order for each target already stored in the previous time series prediction model update process The target numerical change rate in (time zone) is deleted, and the target numerical change rate calculated in the target numerical analysis process (that is, the target expression evaluation value for one collection unit time) is the target numerical change rate in the time series order. Stored last.

なお、後述するように対象数値変化率は時系列数値データに含まれる時系列順の数値情報における前後の数値情報に含まれる数値に基づいて算出されるため、対象数値変化率評価部33の内部には、上記した対象表現評価部32の内部に格納される対象毎の対象表現評価値の数(つまり、データ収集最大回数)より1つ少ない数の対象数値変化率が対象毎に格納される。   As will be described later, the target numerical change rate is calculated based on the numerical values included in the numerical information before and after the numerical information in the time series order included in the time-series numerical data. The target numerical value change rate, which is one less than the number of target expression evaluation values for each target (that is, the maximum number of data collection times) stored in the target expression evaluation unit 32, is stored for each target. .

次に、時系列予測モデル生成部34は、テキスト解析処理において算出された対象毎の時系列順の対象表現評価値(対象表現評価部32の内部に格納された対象表現評価値)および対象数値解析処理において算出された対象毎の時系列順の対象数値変化率(対象数値変化率評価部33の内部に格納された対象数値変化率)に基づいて、時系列予測モデルを生成する(ステップS16)。この場合、時系列予測モデル生成部34は、例えば予め用意されている式(1)を用いて時系列予測モデルを生成する。

Figure 0005075962
Next, the time-series prediction model generation unit 34 calculates the target expression evaluation value (target expression evaluation value stored in the target expression evaluation unit 32) and the target numerical value in time series order for each target calculated in the text analysis process. A time series prediction model is generated based on the target numerical rate of change in time series order for each target calculated in the analysis process (target numerical rate of change stored in the target numerical rate change rate evaluation unit 33) (step S16). ). In this case, the time series prediction model generation unit 34 generates a time series prediction model using, for example, a formula (1) prepared in advance.
Figure 0005075962

式(1)において、pは、上記した注目対象予測装置30の初期化処理において設定されたデータ収集最大回数から1を減算した値(つまり、「データ収集最大回数−1」)を表す。また、tは、対象を表す。更に、iは、上記した対象表現評価値および対象数値変化率の時系列順において最も古い日付(最初の日付)を1とした場合における各日付を表す。

Figure 0005075962
In Expression (1), p represents a value obtained by subtracting 1 from the maximum number of data collections set in the initialization process of the target object prediction device 30 (that is, “maximum number of data collections−1”). T represents a target. Further, i represents each date when the oldest date (first date) is set to 1 in the time series order of the target expression evaluation value and the target numerical value change rate.
Figure 0005075962

また、式(1)において、αは、減衰率を表しており、過去の結果をどの程度反映するかを示すパラメータである。αは、[0,1]の範囲の値をとり、この値が大きい程、過去の結果を反映することになる。なお、α=0の場合には「0の0乗は1」とみなす。   In Expression (1), α represents an attenuation rate and is a parameter indicating how much past results are reflected. α takes a value in the range [0, 1], and the larger this value, the more the past result is reflected. When α = 0, it is regarded that “0 to the 0th power is 1.”

一方、式(1)において、βは、表現重視度を表しており、対象tを評価するにあたって、対象表現評価値を対象数値変化率と比べてどの程度重視するかを表すパラメータである。βは、[0,1]の範囲の値をとり、この値が大きい程、対象表現評価値を重視することになる。   On the other hand, in Expression (1), β represents the degree of importance of expression, and is a parameter representing how much importance is given to the target expression evaluation value compared to the target numerical value change rate when evaluating the target t. β takes a value in the range of [0, 1], and the larger this value, the more important the target expression evaluation value.

上記したように時系列予測モデルは、対象毎の時系列順の対象表現評価値および対象毎の時系列順の対象数値変化率を用いて式(1)により生成される。つまり、時系列予測モデルには、式(1)において上記したパラメータ(αおよびβ)の具体的な値の組に対して対象毎に算出された値の各々が含まれる。   As described above, the time series prediction model is generated by Expression (1) using the target expression evaluation value in the time series order for each target and the target numerical value change rate in the time series order for each target. That is, the time series prediction model includes each value calculated for each target with respect to a specific set of parameters (α and β) described in Equation (1).

ステップS16において生成された時系列予測モデルは、例えば時系列予測モデル生成部34の内部に格納される。このように時系列予測モデル更新処理が実行される度に時系列予測モデルが更新される。   The time series prediction model generated in step S16 is stored in the time series prediction model generation unit 34, for example. In this way, the time series prediction model is updated each time the time series prediction model update process is executed.

なお、上記したように時系列予測モデル更新処理が実行された場合、例えば当該時系列予測モデル更新処理において設定された学習データ収集期間が注目対象予測装置30内において設定される。   When the time series prediction model update process is executed as described above, for example, the learning data collection period set in the time series prediction model update process is set in the attention target prediction apparatus 30.

次に、図6のフローチャートを参照して、上述したテキスト解析処理(図5に示すステップS12の処理)の処理手順について説明する。このテキスト解析処理は、データ収集部31および対象表現評価部32によって実行される。   Next, the processing procedure of the above-described text analysis process (the process of step S12 shown in FIG. 5) will be described with reference to the flowchart of FIG. This text analysis process is executed by the data collection unit 31 and the target expression evaluation unit 32.

まず、データ収集部31は、図5に示すステップS11において設定された学習データ収集期間内における文字列を含むテキスト情報を収集する(ステップS21)。この場合、データ収集部31は、上記した注目対象予測装置30の初期化処理において設定されたWebサイト(テキスト情報を収集するWebサイト)にアクセスし、例えば学習データ収集期間内の日付が付与されているテキスト情報を収集(ダウンロード)する。このデータ収集部31によって収集されるテキスト情報に付与されている日付は、当該テキスト情報(例えば、ニュースのヘッドライン)が発信された日付を表す。なお、注目対象予測装置30の初期化処理において複数のWebサイトが設定された場合には、当該各Webサイトからテキスト情報が収集される。   First, the data collection unit 31 collects text information including character strings within the learning data collection period set in step S11 shown in FIG. 5 (step S21). In this case, the data collection unit 31 accesses the website (website for collecting text information) set in the initialization process of the attention target prediction apparatus 30 described above, and is given a date within the learning data collection period, for example. Collect (download) text information. The date given to the text information collected by the data collection unit 31 represents the date on which the text information (for example, news headline) was transmitted. In addition, when a plurality of websites are set in the initialization process of the attention target prediction device 30, text information is collected from each website.

データ収集部31は、収集されたテキスト情報を当該テキスト情報に付与されている日付順(つまり、時系列順)に整列して、当該テキスト情報を時系列順に含む時系列テキストデータを取得する。   The data collection unit 31 arranges the collected text information in the date order (that is, time series order) given to the text information, and acquires time series text data including the text information in time series order.

データ収集部31は、取得された時系列テキストデータを対象表現評価部32に渡す。なお、対象表現評価部32に渡された時系列テキストデータは、例えば対象表現評価部32の内部に格納される。   The data collection unit 31 passes the acquired time series text data to the target expression evaluation unit 32. Note that the time-series text data passed to the target expression evaluation unit 32 is stored in the target expression evaluation unit 32, for example.

以下、対象表現評価部32は、データ収集部31から渡された時系列テキストデータに含まれる時系列順のテキスト情報の各々についてステップS22〜S24の処理を実行する。   Hereinafter, the target expression evaluation unit 32 performs the processing of steps S22 to S24 for each piece of text information in time series order included in the time series text data passed from the data collection unit 31.

対象表現評価部32は、データ収集部31から渡された時系列テキストデータから、当該時系列テキストデータに含まれる時系列順のテキスト情報のうちの1つを取り出す(ステップS22)。   The target expression evaluation unit 32 extracts one of the time-series text information included in the time-series text data from the time-series text data passed from the data collection unit 31 (step S22).

対象表現評価部32は、取り出されたテキスト情報が対象表現格納部22に格納されている対象表現(対象に関連する文字列)を含むか否かを判定する(ステップS23)。このステップS23においては、対象表現格納部22に格納されている対象表現の各々について処理が実行される。   The target expression evaluation unit 32 determines whether or not the extracted text information includes the target expression (character string related to the target) stored in the target expression storage unit 22 (step S23). In step S <b> 23, processing is executed for each target expression stored in the target expression storage unit 22.

テキスト情報が対象表現を含むと判定された場合(ステップS23のYES)、対象表現評価部32は、当該テキスト情報に付与されている日付における、対象表現格納部22において当該対象表現に対応づけられている対象のスコア(件数)に1を加算する(ステップS24)。   When it is determined that the text information includes the target expression (YES in step S23), the target expression evaluation unit 32 is associated with the target expression in the target expression storage unit 22 on the date given to the text information. 1 is added to the score (number of cases) of the target (step S24).

一方、テキスト情報が対象表現を含まないと判定された場合(ステップS23のNO)、ステップS24の処理は実行されない。   On the other hand, when it is determined that the text information does not include the target expression (NO in step S23), the process in step S24 is not executed.

次に、対象表現評価部32は、データ収集部31から渡された時系列テキストデータに含まれる全てのテキスト情報について上記したステップS22〜S24の処理が実行されたか否かを判定する(ステップS25)。   Next, the target expression evaluation unit 32 determines whether or not the processing in steps S22 to S24 described above has been executed for all text information included in the time-series text data passed from the data collection unit 31 (step S25). ).

全てのテキスト情報について処理が実行されていないと判定された場合(ステップS25のNO)、上記したステップS22に戻って処理が繰り返される。この場合、ステップS22〜S24の処理が実行されていないテキスト情報がステップS22において取り出される。このようにテキスト情報の各々についてステップS22〜S24の処理が繰り返されることによって、学習データ収集期間内の各日付における対象毎のスコアを得ることができる。   When it is determined that the processing has not been executed for all text information (NO in step S25), the process returns to the above-described step S22 and is repeated. In this case, text information for which the processing of steps S22 to S24 has not been executed is extracted in step S22. As described above, by repeating the processing of steps S22 to S24 for each piece of text information, it is possible to obtain a score for each object on each date within the learning data collection period.

一方、全てのテキスト情報について処理が実行されたと判定された場合(ステップS25のYES)、対象表現評価部32は、学習データ収集期間内の各日付における対象毎の対象表現評価値を算出する(ステップS26)。

Figure 0005075962
On the other hand, when it is determined that the processing has been executed for all the text information (YES in step S25), the target expression evaluation unit 32 calculates a target expression evaluation value for each target on each date within the learning data collection period ( Step S26).
Figure 0005075962

対象表現評価部32によって学習データ収集期間内の各日付における対象毎の対象表現評価値の全てが算出されると、テキスト解析処理は終了される。   When all of the target expression evaluation values for each target on each date within the learning data collection period are calculated by the target expression evaluation unit 32, the text analysis process ends.

対象表現評価部32によって算出された学習データ収集期間内の各日付における対象毎の対象表現評価値は、対象毎、かつ、時系列順(日付順)に整列されて、上記したように対象表現評価部32の内部に格納される。

Figure 0005075962
The target expression evaluation values for each target on each date within the learning data collection period calculated by the target expression evaluation unit 32 are aligned for each target and in chronological order (date order), as described above. It is stored inside the evaluation unit 32.
Figure 0005075962

上記した図6に示すステップS23の処理においては単にテキスト情報が対象表現を含むか否かを判定するものとして説明したが、例えば自然言語処理技術に基づいて当該テキスト情報から固有名詞を抽出し、当該固有名詞の中に対象表現と一致するものが存在するか否かが判定される構成であっても構わない。また、対象表現に文字区切りの情報または品詞等の情報を付与して登録しておき、例えばテキスト情報の形態素解析結果と比較することにより、テキスト情報に対象表現が含まれるか否かが判定される構成であっても構わない。   In the process of step S23 shown in FIG. 6 described above, it has been described as simply determining whether or not the text information includes the target expression. For example, a proper noun is extracted from the text information based on natural language processing technology, The proper noun may be configured to determine whether or not there is a thing that matches the target expression. Further, it is determined whether or not the textual information includes the textual expression by adding information such as character delimiter information or part of speech to the textual expression and comparing it with the morphological analysis result of the text information, for example. It may be a configuration.

また、ステップS24においては単に対象表現を含むテキスト情報の数をスコアとしてカウントしているが、例えばテキスト情報に付随する時刻またはサイトに関する情報等を利用したテキスト情報の重みを考慮して、当該重みを加味した値をスコアとしても構わない。   Further, in step S24, the number of text information including the target expression is simply counted as a score. For example, the weight of the text information using the time associated with the text information or information on the site is taken into consideration. A value that takes into account may be used as the score.

次に、図7のフローチャートを参照して、上述した対象数値解析処理(図5に示すステップS14の処理)の処理手順について説明する。この対象数値解析処理は、データ収集部31および対象数値変化率評価部33によって実行される。   Next, the procedure of the target numerical value analysis process (the process of step S14 shown in FIG. 5) will be described with reference to the flowchart of FIG. This target numerical value analysis process is executed by the data collection unit 31 and the target numerical value change rate evaluation unit 33.

まず、データ収集部31は、図5に示すステップS11において設定された学習データ収集期間内における対象に関する数値を含む数値情報を当該対象毎に収集する(ステップS31)。この場合、データ収集部31は、注目対象予測装置30の初期化処理において設定されたWebサイト(数値情報を収集するWebサイト)にアクセスし、例えば学習データ収集期間内の日付が付与されている数値情報を収集(ダウンロード)する。このデータ収集部31によって収集される数値情報に付与されている日付は、当該数値情報(例えば、対象の株価)が発信された日付を表す。なお、注目対象予測装置30の初期化処理において複数のWebサイトが設定された場合には、当該各Webサイトからテキスト情報が収集される。   First, the data collection unit 31 collects, for each target, numerical information including numerical values related to the target within the learning data collection period set in step S11 shown in FIG. 5 (step S31). In this case, the data collection unit 31 accesses a website (website that collects numerical information) set in the initialization process of the target prediction device 30, and is given a date within the learning data collection period, for example. Collect (download) numerical information. The date given to the numerical information collected by the data collection unit 31 represents the date when the numerical information (for example, the target stock price) is transmitted. In addition, when a plurality of websites are set in the initialization process of the attention target prediction device 30, text information is collected from each website.

データ収集部31は、対象毎に収集された数値情報を当該数値情報に付与されている日付順(つまり、時系列順)に整列して、当該数値情報を時系列順に含む対象毎の時系列数値データを取得する。   The data collection unit 31 arranges the numerical information collected for each target in the date order (that is, the time series order) given to the numerical information, and the time series for each target includes the numerical information in the time series order. Get numeric data.

データ収集部31は、取得された対象毎の時系列数値データを対象数値変化率評価部33に渡す。なお、対象数値変化率評価部33に渡された対象毎の時系列数値データは、例えば対象数値変化率評価部33の内部に格納される。また、ここで説明している対象数値解析処理は上記したように時系列予測モデル更新処理において実行されるが、今回の時系列予測モデル更新処理が2回目以降である場合には、前回の時系列予測モデル更新処理における対象数値解析処理のステップS31において対象毎に収集された数値情報を時系列順に含む時系列数値データ(以下、前回の時系列数値データと表記)が対象数値変化率評価部33の内部に格納されているものとする。   The data collection unit 31 passes the acquired time-series numerical data for each target to the target numerical value change rate evaluation unit 33. The time-series numerical data for each target passed to the target numerical value change rate evaluation unit 33 is stored, for example, inside the target numerical value change rate evaluation unit 33. In addition, the target numerical analysis process described here is executed in the time series prediction model update process as described above. However, if the current time series prediction model update process is the second time or later, Time series numerical data (hereinafter referred to as previous time series numerical data) including numerical information collected for each target in step S31 of the target numerical analysis process in the series prediction model update process is a target numerical change rate evaluation unit. It is assumed that it is stored inside 33.

以下、対象数値変化率評価部33は、データ収集部31から渡された対象毎の時系列数値データの各々についてステップS32〜S36の処理を実行する。   Hereinafter, the target numerical value change rate evaluation unit 33 performs the processing of steps S32 to S36 for each time-series numerical data for each target passed from the data collection unit 31.

対象数値変化率評価部33は、データ収集部31から渡された対象毎の時系列数値データのうちの1つ対象の時系列数値データを取り出す(ステップS32)。   The target numerical value change rate evaluation unit 33 extracts time-series numerical data of one target from the time-series numerical data for each target passed from the data collection unit 31 (step S32).

次に、対象数値変化率評価部33は、取り出された時系列数値データに時系列順に含まれる数値情報の各々についてステップS33〜S35の処理を実行する。なお、対象数値変化率評価部33は、取り出された時系列数値データに含まれる数値情報を例えば時系列順に処理する。   Next, the target numerical change rate evaluation unit 33 performs the processes of steps S33 to S35 for each piece of numerical information included in the extracted time-series numerical data in time-series order. The target numerical change rate evaluation unit 33 processes numerical information included in the extracted time-series numerical data, for example, in time-series order.

対象数値変化率評価部33は、ステップS32において取り出された時系列数値データから、当該時系列数値データに含まれる時系列順の数値情報のうちの1つを取り出す(ステップS33)。   The target numerical change rate evaluation unit 33 extracts one of the time-series numerical information included in the time-series numerical data from the time-series numerical data extracted in step S32 (step S33).

対象数値変化率評価部33は、対象数値変化率評価部33の内部に格納されている時系列数値データに基づいて、ステップS33において取り出された数値情報の前に数値情報があるか否かを判定する(ステップS34)。ここで、ステップS33において取り出された数値情報がステップS32において取り出された時系列数値データに含まれる数値情報の時系列順における最初の数値情報であっても、上記したように前回の時系列数値データが残存している場合には、ステップS33において取り出された数値情報の前に数値情報があると判定される。   The target numerical change rate evaluation unit 33 determines whether there is numerical information before the numerical information extracted in step S33 based on the time-series numerical data stored in the target numerical change rate evaluation unit 33. Determination is made (step S34). Here, even if the numerical information extracted in step S33 is the first numerical information in the time-series order of the numerical information included in the time-series numerical data extracted in step S32, as described above, the previous time-series numerical value is obtained. When data remains, it is determined that there is numerical information before the numerical information extracted in step S33.

ステップS33において取り出された数値情報の前に数値情報があると判定された場合、対象数値変化率評価部33は、当該取り出された数値情報および時系列順において当該数値情報の直前の数値情報(以下、直前数値情報と表記)に基づいて、当該直前数値情報に付与されている日付におけるステップS32において時系列数値データが取り出された対象の対象数値変化率を算出する(ステップS35)。

Figure 0005075962
When it is determined in step S33 that there is numerical information before the extracted numerical information, the target numerical change rate evaluation unit 33 determines the numerical information immediately before the numerical information ( Hereinafter, based on the previous numerical value information), the target numerical value change rate of the target from which the time-series numerical data is extracted in step S32 on the date given to the previous numerical value information is calculated (step S35).
Figure 0005075962

次に、対象数値変化率評価部33は、ステップS32において取り出された時系列数値データに含まれる全ての数値情報について上記したステップS33〜S35の処理が実行されたか否かを判定する(ステップS36)。   Next, the target numerical change rate evaluation unit 33 determines whether or not the above-described processing of steps S33 to S35 has been executed for all numerical information included in the time-series numerical data extracted in step S32 (step S36). ).

ステップS32において取り出された時系列数値データに含まれる全ての数値情報について処理が実行されていないと判定された場合(ステップS36のNO)、上記したステップS33に戻って処理が繰り返される。この場合、ステップS33〜S35の処理が実行されていない数値情報がステップS33において取り出される。   When it is determined in step S32 that processing has not been executed for all numerical information included in the time-series numerical data extracted in step S32 (NO in step S36), the process returns to step S33 described above and is repeated. In this case, numerical information for which the processing of steps S33 to S35 has not been executed is extracted in step S33.

ここで、上記したようにステップS32において取り出された時系列数値データに含まれる全ての数値情報についてステップS33〜S35の処理が繰り返されると、学習データ収集期間内の各日付における当該ステップS32において時系列数値データが取り出された対象の対象数値変化率が算出される。このように算出された学習データ収集期間内の各日付における対象の対象数値変化率は、当該日付順(時系列順)に整列されて、対象数値変化率評価部33の内部に格納される。

Figure 0005075962
Here, when the processing of steps S33 to S35 is repeated for all the numerical information included in the time-series numerical data extracted in step S32 as described above, the time in step S32 on each date within the learning data collection period. The target numerical value change rate of the target from which the series numerical data is extracted is calculated. The target numerical change rates of the target on each date within the learning data collection period calculated as described above are stored in the target numerical change rate evaluation unit 33 in the order of the date (time-series order).
Figure 0005075962

一方、ステップS32において取り出された時系列数値データに含まれる全ての数値情報について処理が実行されたと判定された場合(ステップS36のYES)、対象数値変化率評価部33は、データ収集部31から渡された対象毎の時系列数値データの全てについてステップS32〜S36の処理が実行されたか否かを判定する(ステップS37)。   On the other hand, when it is determined that the processing has been executed for all the numerical information included in the time-series numerical data extracted in step S32 (YES in step S36), the target numerical change rate evaluation unit 33 reads from the data collection unit 31. It is determined whether or not the processing in steps S32 to S36 has been executed for all of the time-series numerical data for each passed target (step S37).

対象毎の時系列数値データの全てについて処理が実行されていないと判定された場合(ステップS37のNO)、上記したステップS32に戻って処理が繰り返される。この場合、ステップS32〜S36の処理が実行されていない対象の時系列数値データがステップS32において取り出される。   When it is determined that the process has not been executed for all the time-series numerical data for each target (NO in step S37), the process returns to the above-described step S32 and is repeated. In this case, target time-series numerical data for which the processing of steps S32 to S36 has not been executed is extracted in step S32.

一方、対象毎に時系列数値データの全てについて処理が実行されたと判定された場合(ステップS37のYES)、対象数値解析処理は終了される。   On the other hand, when it is determined that the processing has been executed for all of the time-series numerical data for each target (YES in step S37), the target numerical analysis process is ended.

このように対象数値解析処理が実行されることによって、対象毎に時系列順の対象数値変化率が算出される。なお、対象数値解析処理において算出された対象数値変化率は、上記したように対象数値変化率評価部33の内部に格納される。   By executing the target numerical value analysis process in this way, the target numerical value change rate in time series order is calculated for each target. The target numerical value change rate calculated in the target numerical value analysis process is stored in the target numerical value change rate evaluation unit 33 as described above.

次に、図8〜図41を参照して、上述した時系列予測モデル更新処理について具体的に説明する。ここでは、複数の対象(企業)には、A社、B社、C社、D社等が含まれるものとする。   Next, the time series prediction model update process described above will be specifically described with reference to FIGS. Here, it is assumed that the plurality of targets (enterprises) include A company, B company, C company, D company, and the like.

なお、注目対象予測装置30の初期化処理において設定されたデータ収集単位時間は1日であり、データ収集最大回数は5回であるものとする。また、対象表現格納部22は、前述した図3に示すデータ構造を有するものとする。   It is assumed that the data collection unit time set in the initialization process of the target prediction device 30 is one day, and the maximum number of data collection is five. Further, it is assumed that the target expression storage unit 22 has the data structure shown in FIG.

時系列予測モデル更新処理においては、まず、学習データ収集期間がデータ収集部31によって設定される。ここでは、今回の時系列予測モデル更新処理が1回目であるものとする。ここで、現在の日付が「2010/1/8」である場合には、上記したデータ収集単位時間(1日)およびデータ収集最大回数(5回)により、「2010/1/4〜2010/1/8」が学習データ収集期間として設定される。   In the time series prediction model update process, first, a learning data collection period is set by the data collection unit 31. Here, it is assumed that the current time-series prediction model update process is the first time. Here, when the current date is “2010/1/8”, the data collection unit time (1 day) and the maximum number of data collections (5 times) indicate that “2010/1/4 to 2010 / “1/8” is set as the learning data collection period.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される。   Next, text analysis processing is executed based on the learning data collection period set by the data collection unit 31.

テキスト解析処理においては、まず、学習データ収集期間内におけるテキスト情報がデータ収集部31によって収集される。データ収集部31は、注目対象予測装置30の初期化処理において設定されたWebサイトから、例えばニュースのヘッドラインをテキスト情報として収集する。これにより、データ収集部31は、収集されたテキスト情報を時系列順に含む時系列テキストデータを取得する。   In the text analysis process, first, text information within the learning data collection period is collected by the data collection unit 31. The data collection unit 31 collects, for example, news headlines as text information from the website set in the initialization process of the attention target prediction device 30. Thereby, the data collection unit 31 acquires time series text data including the collected text information in time series order.

ここで、図8は、データ収集部31によって収集された学習データ収集期間「2010/1/4〜2010/1/8」内におけるテキスト情報(ニュースのヘッドライン)を時系列順に含む時系列テキストデータの一例を示す。   Here, FIG. 8 is a time series text including text information (news headlines) in the learning data collection period “2010/1/4 to 2010/1/8” collected by the data collection unit 31 in time series. An example of data is shown.

なお、図8に示すように、時系列テキストデータに含まれるテキスト情報には、例えば日付、時刻および発信サイト(を示す情報)が付与されている。   As shown in FIG. 8, the text information included in the time-series text data is given, for example, date, time, and transmission site (information indicating).

具体的には、例えばテキスト情報「B1社新製品を発表」には、日付「2010/1/4」、時刻「8:00」および発信サイト「zサイト」が付与されている。これによれば、テキスト情報「B1社新製品を発表」が「2010/1/4」の「8:00」に「zサイト」から発信されたことが示されている。   Specifically, for example, the date “2010/4”, the time “8:00”, and the transmission site “z site” are assigned to the text information “B1 company announces new product”. This shows that the text information “B1 company announces new product” was sent from “z site” at “8:00” of “2010/4”.

次に、対象表現評価部32は、データ収集部31によって取得された時系列テキストデータから、当該時系列テキストデータに含まれる時系列順のテキスト情報のうちの1つを取り出す。ここでは、図8に示す時系列テキストデータに含まれる時系列順のテキスト情報のうち、テキスト情報「B1社新製品を発表」が取り出されたものとする。   Next, the target expression evaluation unit 32 extracts one of the time-series text information included in the time-series text data from the time-series text data acquired by the data collection unit 31. Here, it is assumed that text information “B1 company announces new product” is extracted from the time-series text information included in the time-series text data shown in FIG.

対象表現評価部32は、取り出されたテキスト情報が対象表現格納部22に格納されている対象表現を含むか否かを判定する。ここで、図3に示す対象表現格納部22を参照すると、テキスト情報「B1社新製品を発表」には、対象「B社」に対応づけて対象表現格納部22に格納されている対象表現「B1社」が含まれている。   The target expression evaluation unit 32 determines whether or not the extracted text information includes the target expression stored in the target expression storage unit 22. Here, referring to the target expression storage unit 22 shown in FIG. 3, the text information “B1 company announces new product” is stored in the target expression storage unit 22 in association with the target “B company”. “B1 company” is included.

この場合、対象表現評価部32は、テキスト情報「B1社新製品を発表」に付与されている日付「2010/1/4」における、対象表現「B1社」に対応づけられている対象「B社」のスコアに1を加算する。   In this case, the target expression evaluation unit 32 sets the target “B1” associated with the target expression “B1 company” on the date “2010/4” given to the text information “B1 company announces new product”. 1 is added to the score of “Company”.

ここでは、図8に示す時系列テキストデータに含まれるテキスト情報「B1社新製品を発表」について説明したが、他のテキスト情報についても同様である。   Here, the text information “B1 company announces new product” included in the time-series text data shown in FIG. 8 has been described, but the same applies to other text information.

上記したように図8に示す時系列テキストデータに含まれるテキスト情報の全てについて処理が実行されると、対象表現評価部32は、学習データ収集期間内の各日付における対象毎の対象表現評価値を算出する。なお、対象表現評価値は、学習データ収集期間内の各日付における対象毎のスコアおよび上記した式(2)を用いて算出される。   As described above, when the processing is executed for all the text information included in the time-series text data illustrated in FIG. 8, the target expression evaluation unit 32 sets the target expression evaluation value for each target on each date within the learning data collection period. Is calculated. The target expression evaluation value is calculated using the score for each target on each date within the learning data collection period and the above-described equation (2).

ここで、例えば日付「2010/1/4」における対象「B社」の対象表現評価値の算出について具体的に説明する。この日付「2010/1/4」における対象「B社」の対象表現評価値は、上記した式(2)により、日付「2010/1/4」における全ての対象のスコアの合計に対する日付「2010/1/4」における対象「B社」のスコアの割合として算出される。   Here, for example, calculation of the target expression evaluation value of the target “Company B” on the date “2010/4” will be specifically described. The target expression evaluation value of the target “Company B” on this date “2010/4” is calculated based on the date “2010” with respect to the sum of the scores of all targets on the date “2010/4” according to the above formula (2). / 1/4 ”is calculated as the ratio of the score of the target“ Company B ”.

ここでは、日付「2010/1/4」における対象「B社」の対象表現評価値の算出について説明したが、他の対象表現評価値についても同様に算出される。   Here, the calculation of the target expression evaluation value of the target “Company B” on the date “2010/4” has been described, but other target expression evaluation values are calculated in the same manner.

上記したように今回の時系列予測モデル更新処理は1回目であるので、このように学習データ収集期間内の各日付における対象毎の対象表現評価値が算出されると、当該算出された対象表現評価値は、対象毎、かつ、時系列順(日付順)に整列されて、そのまま対象表現評価部32の内部に格納される。   As described above, since the current time-series prediction model update process is the first time, when the target expression evaluation value for each target on each date in the learning data collection period is calculated in this way, the calculated target expression The evaluation values are stored in the target expression evaluation unit 32 as they are, arranged for each target and in time series order (date order).

ここで、図9〜図12は、対象表現評価部32の内部に格納された対象毎の時系列順の対象表現評価値の一例を示す。   Here, FIGS. 9 to 12 show examples of the target expression evaluation values in order of time series for each target stored in the target expression evaluation unit 32.

図9は、複数の対象のうちの対象「A社」の時系列順の対象表現評価値の一例を示す。図10は、複数の対象のうちの対象「B社」の時系列順の対象表現評価値の一例を示す。図11は、複数の対象のうちの対象「C社」の時系列順の対象表現評価値の一例を示す。図12は、複数の対象のうちの対象「D社」の時系列順の対象表現評価値の一例を示す。   FIG. 9 shows an example of the target expression evaluation value in the time series order of the target “Company A” among a plurality of targets. FIG. 10 shows an example of the target expression evaluation value in the time series order of the target “Company B” among a plurality of targets. FIG. 11 shows an example of the target expression evaluation value in the time series order of the target “Company C” among a plurality of targets. FIG. 12 shows an example of the target expression evaluation value in the time series order of the target “Company D” among a plurality of targets.

なお、図9〜図12に示すように、各対象の時系列順の対象表現評価値には、上記した学習データ収集期間「2010/1/4〜2010/1/8」内の各日付が付与された対象表現評価値が含まれる。   As shown in FIGS. 9 to 12, each date within the learning data collection period “2010/1/4 to 2010/1/8” is included in the target expression evaluation value in the time series order of each target. The assigned object expression evaluation value is included.

ここでは、対象「A社」、「B社」、「C社」および「D社」の時系列順の対象表現評価値について説明したが、対象表現評価部32の内部には、これら以外の対象の時系列順の対象表現評価値についても同様に格納されている。   Here, the target expression evaluation values in the chronological order of the targets “Company A”, “Company B”, “Company C”, and “Company D” have been described. The target expression evaluation values in the target time series order are also stored in the same manner.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、対象数値解析処理が実行される。   Next, the target numerical analysis process is executed based on the learning data collection period set by the data collection unit 31.

対象数値解析処理においては、まず、対象毎に学習データ収集期間内における当該対象に関する数値を含む数値情報がデータ収集部31によって収集される。データ収集部31は、注目対象予測装置30の初期化処理において設定されたWebサイトから、例えば対象(企業)毎の株価を数値情報として収集する。これにより、データ収集部31は、収集された数値情報を時系列順に含む時系列数値データを取得する。   In the target numerical analysis processing, first, numerical data including numerical values related to the target within the learning data collection period is collected by the data collection unit 31 for each target. The data collection unit 31 collects, for example, the stock price of each target (company) as numerical information from the website set in the initialization process of the attention target prediction device 30. Thereby, the data collection part 31 acquires time series numerical data including the collected numerical information in time series order.

ここで、図13〜図16は、データ収集部31によって対象毎に収集された学習データ収集期間「2010/1/4〜2010/1/8」内における数値情報(対象の株価)を時系列順に含む時系列数値データの一例を示す。   Here, FIGS. 13 to 16 show time-series numerical information (target stock prices) within the learning data collection period “2010/1/4 to 2010/1/8” collected by the data collection unit 31 for each target. An example of the time series numerical data included in order is shown.

図13は、複数の対象のうちの対象「A社」について収集された数値情報(A社の株価)を時系列順に含む時系列数値データの一例を示す。図14は、複数の対象のうちの対象「B社」について収集された数値情報(B社の株価)を時系列順に含む時系列数値データの一例を示す。図15は、複数の対象のうちの対象「C社」について収集された数値情報(C社の株価)を時系列順に含む時系列数値データの一例を示す。図16は、複数の対象のうちの対象「D社」について収集された数値情報(D社の株価)を時系列順に含む時系列数値データの一例を示す。   FIG. 13 shows an example of time-series numerical data including numerical information (company A's stock price) collected for a target “Company A” among a plurality of targets in time-series order. FIG. 14 shows an example of time-series numerical data including numerical information (stock price of company B) collected for a target “Company B” among a plurality of targets in time-series order. FIG. 15 shows an example of time-series numerical data including numerical information (stock price of company C) collected for a target “Company C” among a plurality of targets in time-series order. FIG. 16 shows an example of time-series numerical data including numerical information (stock price of company D) collected for a target “Company D” out of a plurality of targets in time-series order.

なお、図13〜図16に示すように、時系列数値データに含まれる数値情報には、日付(を示す情報)が付与されている。   Note that, as shown in FIGS. 13 to 16, date (information indicating) is given to the numerical information included in the time-series numerical data.

具体的には、例えば図13に示す時系列数値データに含まれる数値情報「1020」には、日付「2010/1/4」が付与されている。これによれば、数値情報「1020」は、日付「2010/1/4」のA社の株価であることが示されている。   Specifically, for example, the date “2010/4” is assigned to the numerical information “1020” included in the time-series numerical data shown in FIG. According to this, it is indicated that the numerical information “1020” is the stock price of the company A on the date “2010/1/4”.

ここで、対象数値変化率評価部33は、データ収集部31によって取得された対象毎の時系列数値データのうちの1つの対象の時系列数値データを取り出す。ここでは、上記した図13に示す対象「A社」の時系列数値データが取り出されたものとする。   Here, the target numerical value change rate evaluation unit 33 extracts time-series numerical data of one target from the time-series numerical data for each target acquired by the data collection unit 31. Here, it is assumed that the time-series numerical data of the target “Company A” shown in FIG. 13 is extracted.

次に、対象数値変化率評価部33は、取り出された対象「A社」の時系列数値データから、当該時系列数値データに含まれる時系列順の数値情報のうちの1つを取り出す。ここでは、図13に示す対象「A社」の時系列数値データに含まれる時系列順の数値情報のうちの数値情報「1020」が取り出されたものとする。   Next, the target numerical change rate evaluation unit 33 extracts one of the time-series numerical information included in the time-series numerical data from the extracted time-series numerical data of the target “Company A”. Here, it is assumed that the numerical information “1020” is extracted from the numerical information in time series order included in the time series numerical data of the target “Company A” shown in FIG.

ここで、上記したように今回の時系列予測モデル更新処理は1回目であるため、対象数値変化率評価部33によって取り出された数値情報「1020」の前には数値情報がない。   Here, since the current time-series prediction model update process is the first time as described above, there is no numerical information before the numerical information “1020” extracted by the target numerical change rate evaluation unit 33.

また、対象「A社」の時系列数値データに含まれる全ての数値情報について処理がされていないため、対象数値変化率評価部33は、例えば時系列順において数値情報「1020」の次の数値情報「1000」を対象「A社」の時系列数値データから取り出す。   In addition, since all the numerical information included in the time series numerical data of the target “Company A” has not been processed, the target numerical change rate evaluation unit 33, for example, the numerical value next to the numerical information “1020” in time series order. The information “1000” is extracted from the time series numerical data of the target “Company A”.

ここで取り出された数値情報「1000」の前には数値情報「1020」がある。したがって、対象数値変化率評価部33は、取り出された数値情報「1000」および直前数値情報である数値情報「1020」と上記した式(3)とを用いて、当該数値情報「1020」に付与されている日付「2010/1/4」における対象「A社」の対象数値変化率を算出する。この場合、日付「2010/1/4」における対象「A社」の対象数値変化率は、式(3)により|1000−1020|/1020≒0.02となる。   The numerical information “1020” precedes the numerical information “1000” extracted here. Therefore, the target numerical value change rate evaluation unit 33 uses the extracted numerical information “1000”, the numerical information “1020” that is the previous numerical information, and the numerical information “1020” to be assigned to the numerical information “1020”. The target numerical value change rate of the target “Company A” on the date “2010/4” is calculated. In this case, the target numerical value change rate of the target “Company A” on the date “2010/4” is | 1000−1020 | /1020≈0.02 according to Equation (3).

ここでは、日付「2010/1/4」における対象「A社」の対象数値変化率の算出について説明したが、他の対象数値変化率についても同様に算出される。   Here, calculation of the target numerical value change rate of the target “Company A” on the date “2010/4” has been described, but other target numerical value change rates are calculated in the same manner.

上記したように今回の時系列予測モデル更新処理は1回目であるので、このように学習データ収集期間内の各日付における対象毎の対象数値変化率が算出されると、当該算出された対象数値変化率は、対象語と、かつ、時系列順(日付順)に整列されて、そのまま対象数値変化率評価部33の内部に格納される。   As described above, since this time series prediction model update process is the first time, when the target numerical value change rate for each target in each date within the learning data collection period is calculated in this way, the calculated target numerical value is calculated. The rate of change is aligned with the target word and in chronological order (date order) and stored as it is in the target numerical value change rate evaluation unit 33.

ここで、図17〜図20は、対象数値変化率評価部33の内部に格納された対象毎の時系列順の対象数値変化率の一例を示す。   Here, FIG. 17 to FIG. 20 show an example of the target numerical value change rate in order of time series for each target stored in the target numerical value change rate evaluation unit 33.

図17は、複数の対象のうちの対象「A社」の時系列順の対象数値変化率の一例を示す。図18は、複数の対象のうちの対象「B社」の時系列順の対象数値変化率の一例を示す。図19は、複数の対象のうちの対象「C社」の時系列順の対象数値変化率の一例を示す。図20は、複数の対象のうちの対象「D社」の時系列順の対象数値変化率の一例を示す。   FIG. 17 shows an example of the target numerical value change rate in the time series order of the target “Company A” among a plurality of targets. FIG. 18 shows an example of the target numerical value change rate in the time series order of the target “Company B” among a plurality of targets. FIG. 19 shows an example of the target numerical value change rate in the time series order of the target “Company C” among a plurality of targets. FIG. 20 shows an example of the target numerical value change rate in the time series order of the target “Company D” among a plurality of targets.

なお、図17〜図20に示すように、各対象の時系列順の対象数値変化率には、上記した学習データ収集期間「2010/1/4〜2010/1/8」内の各日付が付与された対象数値変化率が含まれる。   As shown in FIG. 17 to FIG. 20, each date within the learning data collection period “2010/1/4 to 2010/1/8” is included in the target numerical value change rate in the time series order of each target. The assigned target numerical rate of change is included.

具体的には、例えば図17に示す対象「A社」の時系列順の対象数値変化率には、日付「2010/1/4」が付与された対象数値変化率「0.02」が含まれている。なお、この日付「2010/1/4」は、対象数値変化率「0.02」の算出の際に用いられた直前数値情報(図13に示す数値情報「1020」)に付与されている日付である。   Specifically, for example, the target numerical value change rate in the chronological order of the target “Company A” illustrated in FIG. 17 includes the target numerical value change rate “0.02” to which the date “2010/1/4” is assigned. It is. The date “2010/4” is the date given to the immediately preceding numerical information (numerical information “1020” shown in FIG. 13) used when calculating the target numerical value change rate “0.02”. It is.

また、日付「2010/1/8」は上記した学習データ収集期間「2010/1/4〜2010/1/8」内であるが、当該日付「2010/1/8」が付与される対象数値変化率は、日付「2010/1/9」の数値情報が収集された後に算出されるため、図17〜図20に示すように空欄となっている。   The date “2010/1/8” is within the learning data collection period “2010/1/4 to 2010/1/8”, but the target numerical value to which the date “2010/1/8” is given. Since the change rate is calculated after the numerical information of the date “2010/1/9” is collected, it is blank as shown in FIGS.

ここでは、対象「A社」、「B社」、「C社」および「D社」の時系列順の対象数値変化率について説明したが、対象数値変化率評価部33の内部には、これら以外の対象の時系列順の対象数値変化率についても同様に格納されている。   Here, the target numerical change rates of the target “Company A”, “B Company”, “C Company”, and “Company D” are described in time series order. The target numerical value change rates in the time series order of other targets are also stored in the same manner.

次に、時系列予測モデル生成部34は、対象表現評価部32の内部に格納された対象毎の時系列順の対象表現評価値(例えば、図9〜図12)および対象数値変化率評価部33の内部に格納された対象毎の時系列順の対象数値変化率(例えば、図17〜図20)に基づいて、時系列予測モデルを生成する。この場合、時系列予測モデル生成部34は、上記した式(1)を用いて時系列予測モデルを生成する。   Next, the time-series prediction model generation unit 34 includes a target expression evaluation value (for example, FIG. 9 to FIG. 12) and a target numerical value change rate evaluation unit for each target stored in the target expression evaluation unit 32. A time series prediction model is generated based on the target numerical change rate (for example, FIG. 17 to FIG. 20) in the order of time series for each target stored inside 33. In this case, the time series prediction model generation unit 34 generates a time series prediction model using the above equation (1).

ここで、例えば対象「A社」について時系列予測モデルが生成される場合について具体的に説明する。この場合、式(1)における対象tは、対象「A社」である。また、データ収集最大回数は5回であるため、pは、4(データ収集最大回数−1)である。また、i=1は、日付「2010/1/4」を表す。以下同様に、i=2は日付「2010/1/5」を表し、i=3は日付「2010/1/6」を表し、i=4は日付「2010/1/7」を表し、i=5は日付「2010/1/8」を表す。

Figure 0005075962
Here, for example, a case where a time series prediction model is generated for the target “Company A” will be specifically described. In this case, the target t in the formula (1) is the target “Company A”. In addition, since the maximum number of data collection times is 5, p is 4 (maximum number of data collection times-1). I = 1 represents the date “2010/4”. Similarly, i = 2 represents the date “2010/1/5”, i = 3 represents the date “2010/1/6”, i = 4 represents the date “2010/1/7”, and i = 5 represents the date “2010/1/8”.
Figure 0005075962

図21は、時系列予測モデル生成部34によって生成された時系列予測モデルの一例を示す。   FIG. 21 shows an example of a time series prediction model generated by the time series prediction model generation unit 34.

なお、上述したように時系列予測モデルには、式(1)においてパラメータ(αおよびβ)の具体的な値の組に対して対象毎に算出された値が含まれる。   As described above, the time series prediction model includes values calculated for each target with respect to a specific set of parameters (α and β) in Equation (1).

図21に示す例では、パラメータαが0.00、0.25、0.50、0.75、1.00の各値であり、パラメータβが0.25、0.50、0.75の各値である場合に、当該パラメータαおよびβのそれぞれの組に対して式(1)により対象毎に算出された値を含む時系列予測モデルが示されている。   In the example shown in FIG. 21, the parameter α is 0.00, 0.25, 0.50, 0.75, and 1.00, and the parameter β is 0.25, 0.50, and 0.75. In the case of each value, a time-series prediction model including values calculated for each target by Expression (1) for each set of the parameters α and β is shown.

上記したように時系列予測モデル生成部34によって時系列予測モデルが生成されると、時系列予測モデル更新処理は終了される。なお、時系列予測モデル生成部34によって生成された時系列予測モデルは、当該時系列予測モデル生成部34の内部に格納される。   As described above, when the time series prediction model is generated by the time series prediction model generation unit 34, the time series prediction model update process is ended. The time series prediction model generated by the time series prediction model generation unit 34 is stored inside the time series prediction model generation unit 34.

ここで、上記した図4において説明したように時系列予測モデル更新処理が終了された場合であって、利用者の操作に応じて予測モードまたは終了モードが設定されない場合(つまり、学習モードが設定された場合)には、再び時系列予測モデル更新処理(つまり、2回目の時系列予測モデル更新処理)が実行される。この場合、時系列予測モデル更新処理は、前回の時系列予測モデル更新処理において設定された学習データ収集期間から1データ収集単位時間が経過した後に実行される。   Here, as described above with reference to FIG. 4, when the time-series prediction model update process is ended, and the prediction mode or the end mode is not set according to the user's operation (that is, the learning mode is set). In the case where the time series prediction model is updated, the time series prediction model update process (that is, the second time series prediction model update process) is executed again. In this case, the time series prediction model update process is executed after one data collection unit time has elapsed from the learning data collection period set in the previous time series prediction model update process.

以下、上記説明した1回目の時系列予測モデル更新処理(以下、前回の時系列予測モデル更新処理と表記)が実行された後に、再び時系列予測モデル更新処理(つまり、2回目の時系列予測モデル更新処理)が実行される場合について具体的に説明する。なお、現在の日付は、「2010/1/9」であるものとする。   Hereinafter, after the first time series prediction model update process described above (hereinafter referred to as the previous time series prediction model update process) is executed, the time series prediction model update process (that is, the second time series prediction model update process) is executed again. The case where the model update process is executed will be specifically described. It is assumed that the current date is “2010/1/9”.

まず、データ収集部31は、学習データ収集期間を設定する。ここでは、今回の時系列予測モデル更新処理が2回目であり、現在の日付は「2010/1/9」であるため、前回の時系列予測モデル更新処理において設定された学習データ収集期間の直後から現在の日付まで、つまり、「2010/1/9(〜2010/1/9)」が学習データ収集期間として設定される。なお、前回の時系列予測モデル更新処理が実行された際に、例えば当該前回の時系列予測モデル更新処理において設定された学習データ収集期間「2010/1/4〜2010/1/8」(学習モードにおける前のデータ収集日)は設定されているものとする。   First, the data collection unit 31 sets a learning data collection period. Here, since the current time series prediction model update process is the second time and the current date is “2010/1/9”, immediately after the learning data collection period set in the previous time series prediction model update process. To the current date, that is, “2010/1/9 (˜2010 / 1/9)” is set as the learning data collection period. When the previous time-series prediction model update process is executed, for example, the learning data collection period “2010/1/4 to 2010/1/8” set in the previous time-series prediction model update process (learning It is assumed that the previous data collection date in the mode is set.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される。   Next, text analysis processing is executed based on the learning data collection period set by the data collection unit 31.

テキスト解析処理においては、まず、学習データ収集期間内におけるテキスト情報がデータ収集部31によって収集される。ここでは、学習データ収集期間が「2010/1/9」であるため、「2010/1/9」分のニュースのヘッドラインがテキスト情報として収集される。これにより、データ収集部31は、収集されたテキスト情報を含む時系列テキストデータを取得する。ここでデータ収集部31によって取得された時系列テキストデータには、日付「2010/1/9」が付与されているテキスト情報のみが含まれる。   In the text analysis process, first, text information within the learning data collection period is collected by the data collection unit 31. Here, since the learning data collection period is “2010/1/9”, news headlines for “2010/1/9” are collected as text information. Thereby, the data collection part 31 acquires the time series text data containing the collected text information. Here, the time-series text data acquired by the data collection unit 31 includes only text information assigned with the date “2010/1/9”.

以下、対象表現評価部32は、データ収集部31によって取得された時系列テキストデータに含まれるテキスト情報および対象表現格納部22に格納されている対象表現を用いて、上記した式(2)により学習データ収集期間内の日付(ここでは、日付「2010/1/9」)における対象毎の対象表現評価値を算出する。対象表現評価値の算出については、前述した通りであるため、その詳しい説明を省略する。   Hereinafter, the target expression evaluation unit 32 uses the text information included in the time-series text data acquired by the data collection unit 31 and the target expression stored in the target expression storage unit 22 according to the above equation (2). A target expression evaluation value for each target on a date within the learning data collection period (here, date “2010/1/9”) is calculated. Since the calculation of the target expression evaluation value is as described above, detailed description thereof is omitted.

ここで、図22〜図25は、対象表現評価部32によって算出された日付「2010/1/9」における対象毎の対象表現評価値の一例を示す。   Here, FIG. 22 to FIG. 25 show an example of the target expression evaluation value for each target on the date “2010/1/9” calculated by the target expression evaluation unit 32.

図22は、複数の対象のうちの対象「A社」の対象表現評価値の一例を示す。図23は、複数の対象のうちの対象「B社」の対象表現評価値の一例を示す。図24は、複数の対象のうちの対象「C社」の対象表現評価値の一例を示す。図25は、複数の対象のうちの対象「D社」の対象表現評価値の一例を示す。   FIG. 22 shows an example of the target expression evaluation value of the target “Company A” among a plurality of targets. FIG. 23 shows an example of the target expression evaluation value of the target “Company B” among a plurality of targets. FIG. 24 shows an example of the target expression evaluation value of the target “Company C” among a plurality of targets. FIG. 25 shows an example of a target expression evaluation value of a target “Company D” among a plurality of targets.

なお、図22〜図25に示すように、各対象の対象表現評価値には、上記した学習データ収集期間「2010/1/9」内の日付(つまり、「2010/1/9」)が付与されている。   As shown in FIGS. 22 to 25, the target expression evaluation value of each target includes the date (that is, “2010/1/9”) within the learning data collection period “2010/1/9” described above. Has been granted.

次に、上記した図22〜図25に示す各対象の対象表現評価値は対象表現評価部32の内部に格納されることによって、当該各対象の時系列順の対象表現評価値が更新される。   Next, the target expression evaluation value of each target shown in FIGS. 22 to 25 is stored in the target expression evaluation unit 32, thereby updating the target expression evaluation value in time series order of each target. .

ここで、例えば対象「A社」の時系列順の対象表現評価値の更新について具体的に説明する。この場合、上述した図9に示す対象「A社」の時系列順の対象表現評価値のうち、最も古い日付が付与されている対象表現評価値「0.01」が対象表現評価部32の内部から削除される。更に、図22に示す対象「A社」の対象表現評価値「0.40」が対象表現評価部32の内部に格納される。これによって、図9に示す対象「A社」の時系列順の対象表現評価値は、図26に示す対象「A社」の時系列順の対象表現評価値に更新される。   Here, for example, the update of the target expression evaluation value in the time series order of the target “Company A” will be specifically described. In this case, among the target expression evaluation values in the time series order of the target “Company A” shown in FIG. 9 described above, the target expression evaluation value “0.01” assigned the oldest date is the target expression evaluation unit 32. Deleted from inside. Further, the target expression evaluation value “0.40” of the target “Company A” shown in FIG. 22 is stored in the target expression evaluation unit 32. Accordingly, the target expression evaluation value in the time series order of the target “Company A” shown in FIG. 9 is updated to the target expression evaluation value in the time series order of the target “Company A” shown in FIG.

同様に、図10に示す対象「B社」の時系列順の対象表現評価値は、図27に示す対象「B社」の時系列順の対象表現評価値に更新される。また、図11に示す対象「C社」の時系列順の対象表現評価値は、図28に示す対象「C社」の時系列順の対象表現評価値に更新される。図12に示す対象「D社」の時系列順の対象表現評価値は、図29に示す対象「D社」の時系列順の対象表現評価値に更新される。   Similarly, the target expression evaluation value in the time series order of the target “company B” shown in FIG. 10 is updated to the target expression evaluation value in the time series order of the target “company B” shown in FIG. Further, the target expression evaluation value in the time series order of the target “Company C” shown in FIG. 11 is updated to the target expression evaluation value in the time series order of the target “Company C” shown in FIG. The target expression evaluation value in the time series order of the object “Company D” shown in FIG. 12 is updated to the target expression evaluation value in the time series order of the object “D company” shown in FIG.

ここでは、対象「A社」、「B社」、「C社」および「D社」について説明したが、これら以外の対象の対象表現評価値についても同様に更新される。   Here, the target “Company A”, “Company B”, “Company C”, and “Company D” have been described, but the target expression evaluation values of other targets are similarly updated.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、対象数値解析処理が実行される。   Next, the target numerical analysis process is executed based on the learning data collection period set by the data collection unit 31.

対象数値解析処理においては、まず、学習データ収集期間内における数値情報がデータ収集部31によって収集される。ここでは、学習データ収集期間が「2010/1/9」であるため、データ収集部31は、「2010/1/9」の対象(企業)毎の株価を数値情報として収集する。これにより、データ収集部31は、収集された数値情報を含む時系列数値データを取得する。ここでデータ収集部31によって取得された時系列数値データには、日付「2010/1/9」が付与されている数値情報のみが含まれる。   In the target numerical analysis process, first, numerical information within the learning data collection period is collected by the data collection unit 31. Here, since the learning data collection period is “2010/1/9”, the data collection unit 31 collects the stock price for each target (company) of “2010/1/9” as numerical information. Thereby, the data collection unit 31 acquires time-series numerical data including the collected numerical information. Here, the time-series numerical data acquired by the data collecting unit 31 includes only numerical information to which the date “2010/1/9” is assigned.

ここで、図30〜図33は、データ収集部31によって対象毎に収集された学習データ収集期間「2010/1/9」内における数値情報(対象の株価)を含む時系列数値データの一例を示す。   Here, FIG. 30 to FIG. 33 are examples of time-series numerical data including numerical information (target stock price) within the learning data collection period “2010/1/9” collected for each target by the data collecting unit 31. Show.

図30は、複数の対象のうちの対象「A社」について収集された日付「2010/1/9」の数値情報(A社の株価)を含む時系列数値データの一例を示す。図31は、複数の対象のうちの対象「B社」について収集された日付「2010/1/9」の数値情報(B社の株価)を含む時系列数値データの一例を示す。図32は、複数の対象のうちの対象「C社」について収集された日付「2010/1/9」の数値情報(C社の株価)を含む時系列数値データの一例を示す。図33は、複数の対象のうちの対象「D社」について収集された日付「2010/1/9」の数値情報(D社の株価)を含む時系列数値データの一例を示す。   FIG. 30 shows an example of time-series numerical data including numerical information (stock price of Company A) on the date “2010/1/9” collected for the target “Company A” among a plurality of targets. FIG. 31 shows an example of time-series numerical data including numerical information (stock price of B company) on the date “2010/1/9” collected for the target “Company B” among a plurality of targets. FIG. 32 shows an example of time-series numerical data including numerical information (stock price of company C) on the date “2010/1/9” collected for the object “company C” among a plurality of objects. FIG. 33 shows an example of time-series numerical data including numerical information (stock price of company D) on the date “2010/1/9” collected for the object “company D” among a plurality of objects.

なお、図30〜図33に示す時系列数値データに含まれる数値情報には、上記した学習データ収集期間「2010/1/9」内の日付「2010/1/9」が付与されている。   It should be noted that the date “2010/1/9” within the learning data collection period “2010/1/9” is given to the numerical information included in the time-series numerical data shown in FIGS.

次に、対象数値変化率評価部33は、データ収集部31によって取得された対象毎の時系列数値データに含まれる数値情報および当該数値情報の直前の数値情報(直前数値情報)を用いて、上記した式(3)により対象毎の対象数値変化率を算出する。   Next, the target numerical change rate evaluation unit 33 uses the numerical information included in the time-series numerical data for each target acquired by the data collection unit 31 and the numerical information immediately before the numerical information (immediate numerical information). The target numerical value change rate for each target is calculated by the above equation (3).

例えば対象「A社」の対象数値変化率は、図30に示す対象「A社」の日付「2010/1/9」の数値情報「550」および当該数値情報「550」の直前の数値情報(ここでは、図13に示す対象「A社」の日付「2010/1/8」の数値情報「750」)を用いて、式(3)により算出される。   For example, the target numerical change rate of the target “Company A” is the numerical information “550” of the date “2010/1/9” of the target “Company A” and the numerical information immediately before the numerical information “550” shown in FIG. Here, the numerical value information “750” of the date “2010/1/8” of the target “Company A” shown in FIG.

ここでは、対象「A社」について説明したが、対象「B社」、「C社」および「D社」等の他の対象についても同様に対象数値変化率が算出される。   Here, the target “Company A” has been described, but the target numerical change rate is similarly calculated for other targets such as the targets “Company B”, “Company C”, and “Company D”.

ここで、図34〜図37は、対象数値変化率評価部33によって算出された対象毎の対象数値変化率の一例を示す。   Here, FIG. 34 to FIG. 37 show an example of the target numerical value change rate for each target calculated by the target numerical value change rate evaluation unit 33.

図34は、複数の対象のうちの対象「A社」の対象数値変化率の一例を示す。図35は、複数の対象のうちの対象「B社」の対象数値変化率の一例を示す。図36は、複数の対象のうちの対象「C社」の対象数値変化率の一例を示す。図37は、複数の対象のうちの対象「D社」の対象数値変化率の一例を示す。   FIG. 34 shows an example of the target numerical value change rate of the target “Company A” among a plurality of targets. FIG. 35 shows an example of the target numerical value change rate of the target “Company B” among a plurality of targets. FIG. 36 shows an example of the target numerical value change rate of the target “Company C” among a plurality of targets. FIG. 37 shows an example of the target numerical value change rate of the target “Company D” among a plurality of targets.

なお、図34〜図37に示すように、各対象の対象数値変化率には、当該対象数値変化率の算出に用いられた直前の数値情報に付与されている日付(ここでは、日付「2010/1/8」)が付与されている。   As shown in FIGS. 34 to 37, the target numerical value change rate of each target includes the date (here, the date “2010” given to the immediately preceding numerical information used for calculation of the target numerical value change rate. / 1/8 ").

次に、上記した図34〜図37に示す各対象の対象数値変化率は対象数値変化率評価部33の内部に格納されることによって、当該各対象の時系列順の対象数値変化率が更新される。   Next, the target numerical change rate of each target shown in FIGS. 34 to 37 is stored in the target numerical change rate evaluation unit 33, so that the target numerical change rate of each target in chronological order is updated. Is done.

ここで、例えば対象「A社」の時系列順の対象数値変化率の更新について具体的に説明する。この場合、上述した図17に示す対象「A社」の時系列順の対象数値変化率のうち、最も古い日付が付与されている対象数値変化率「0.02」が対象数値変化率評価部33の内部から削除される。更に、図34に示す対象「A社」の対象数値変化率「0.27」が対象数値変化率評価部33の内部に格納される。なお、この対象「A社」の対象数値変化率「0.27」には、日付「2010/1/8」が付与される。これによって、図17に示す対象「A社」の時系列順の対象数値変化率は、図38に示す対象「A社」の時系列順の対象数値変化率に更新される。なお、日付「2010/1/9」が付与される対象数値変化率は、日付「2010/1/10」の数値情報が収集された後に算出されるため図38に示すように空欄となっている。   Here, for example, the update of the target numerical value change rate in the time series order of the target “Company A” will be specifically described. In this case, the target numerical value change rate “0.02” to which the oldest date is assigned among the target numerical value change rates of the target “Company A” shown in FIG. 33 is deleted from the inside. Further, the target numerical value change rate “0.27” of the target “Company A” shown in FIG. 34 is stored in the target numerical value change rate evaluation unit 33. The date “2010/1/8” is assigned to the target numerical value change rate “0.27” of the target “Company A”. Accordingly, the target numerical value change rate in the time series order of the target “Company A” shown in FIG. 17 is updated to the target numerical value change rate in the time series order of the target “Company A” shown in FIG. Note that the target numerical value change rate to which the date “2010/1/9” is assigned is calculated after the numerical information of the date “2010/1/10” is collected, and is blank as shown in FIG. Yes.

同様に、図18に示す対象「B社」の時系列順の対象数値変化率は、図39に示す対象「B社」の時系列順の対象数値変化率に更新される。また、図19に示す対象「C社」の時系列順の対象数値変化率は、図40に示す対象「C社」の時系列順の対象数値変化率に更新される。図20に示す対象「D社」の時系列順の対象数値変化率は、図41に示す対象「D社」の時系列順の対象数値変化率に更新される。   Similarly, the target numerical value change rate in the time series order of the target “Company B” shown in FIG. 18 is updated to the target numerical value change rate in the time series order of the target “Company B” shown in FIG. Further, the target numerical value change rate in the time series order of the target “Company C” shown in FIG. 19 is updated to the target numerical value change rate in the time series order of the target “Company C” shown in FIG. The target numerical value change rate in the time series order of the target “Company D” shown in FIG. 20 is updated to the target numerical value change rate in the time series order of the target “Company D” shown in FIG.

ここでは、対象「A社」、「B社」、「C社」および「D社」について説明したが、これら以外の対象の対象数値変化率についても同様に更新される。   Here, the target “Company A”, “Company B”, “Company C”, and “Company D” have been described, but the target numerical value change rates of other targets are similarly updated.

次に、時系列予測モデル生成部34は、対象表現評価部32の内部に格納された対象毎の時系列順の対象表現評価値(例えば、図26〜図29)および対象数値変化率評価部33の内部に格納された対象毎の時系列順の対象数値変化率(例えば、図38〜図41)を用いて、上記した式(1)により時系列予測モデルを生成する。なお、時系列予測モデルの生成処理については、前述した通りであるため、その詳しい説明を省略する。   Next, the time-series prediction model generation unit 34 includes a target expression evaluation value (for example, FIGS. 26 to 29) and a target numerical value change rate evaluation unit for each target stored in the target expression evaluation unit 32. A time series prediction model is generated by the above-described equation (1) using the target numerical value change rate (for example, FIG. 38 to FIG. 41) in the time series order for each target stored in the inside 33. Note that the time series prediction model generation processing is as described above, and thus detailed description thereof is omitted.

時系列予測モデル生成部34によって生成された時系列予測モデルは、当該時系列予測モデル生成部34の内部に格納される(つまり、上書きされる)。これによって、時系列予測モデル更新処理においては、時系列予測モデルが更新される。   The time series prediction model generated by the time series prediction model generation unit 34 is stored (that is, overwritten) inside the time series prediction model generation unit 34. Thereby, in the time series prediction model update process, the time series prediction model is updated.

次に、図42のフローチャートを参照して、上述した対象ランキング処理(図4に示すステップS6の処理)の処理手順について説明する。なお、対象ランキング処理は、上述したように予測モードが設定された場合に実行される処理である。   Next, a processing procedure of the above-described target ranking process (the process of step S6 shown in FIG. 4) will be described with reference to the flowchart of FIG. The target ranking process is a process executed when the prediction mode is set as described above.

まず、データ収集部31は、学習モードにおける前のデータ収集日(時系列予測モデル更新処理において設定された学習データ収集期間)が設定されているか否か、つまり、時系列予測モデル更新処理が実行されたことによって時系列予測モデルが生成されているか否かを判定する(ステップS41)。   First, the data collection unit 31 determines whether or not the previous data collection date (the learning data collection period set in the time series prediction model update process) is set in the learning mode, that is, the time series prediction model update process is executed. Whether or not a time series prediction model has been generated is determined (step S41).

学習モードにおける前のデータ収集日が設定されていると判定された場合(ステップS41のYES)、データ収集部31は、予測データ収集期間を設定する(ステップS42)。この場合、データ収集部31は、学習モードにおける前のデータ収集日の直後(つまり、時系列予測モデル更新処理において設定された学習データ収集期間後)から現在の日付までを、予測データ収集期間として設定する。なお、対象ランキング処理は上記した学習モードが設定された場合に実行される時系列予測モデル更新処理の間に実行されるため、データ収集部31によって設定される予測データ収集期間は、注目対象予測装置30の初期化処理において設定されたデータ収集単位時間より短くなるが、当該期間を1単位とみなすものとする。   When it is determined that the previous data collection date in the learning mode is set (YES in step S41), the data collection unit 31 sets a predicted data collection period (step S42). In this case, the data collection unit 31 sets the period from immediately after the previous data collection date in the learning mode (that is, after the learning data collection period set in the time series prediction model update process) to the current date as the prediction data collection period. Set. Since the target ranking process is executed during the time series prediction model update process executed when the learning mode is set, the prediction data collection period set by the data collection unit 31 is the target prediction Although it is shorter than the data collection unit time set in the initialization process of the apparatus 30, the period is assumed to be one unit.

次に、データ収集部31によって設定された学習データ収集期間に基づいて、テキスト解析処理が実行される(ステップS43)。なお、このテキスト解析処理は、前述した学習データ収集期間を予測データ収集期間とした場合の図5に示すステップS12の処理(図6に示す処理)と同様であるため、その詳しい説明を省略する。つまり、ステップS43のテキスト解析処理によれば、予測データ収集期間内の日付における対象毎の対象表現評価値(1データ収集単位時間分の対象表現評価値)が算出される。   Next, text analysis processing is executed based on the learning data collection period set by the data collection unit 31 (step S43). The text analysis process is the same as the process in step S12 shown in FIG. 5 (the process shown in FIG. 6) when the learning data collection period is the predicted data collection period, and detailed description thereof is omitted. . That is, according to the text analysis processing in step S43, the target expression evaluation value (target expression evaluation value for one data collection unit time) for each target on the date within the predicted data collection period is calculated.

対象注目度算出部35は、ステップS43のテキスト解析処理によって算出された対象毎の対象表現評価値および時系列予測モデル生成部34の内部に格納されている時系列予測モデル(上述した時系列予測モデル更新処理において生成された時系列予測モデル)に基づいて、対象毎の注目度を算出する。   The target attention level calculation unit 35 includes a target expression evaluation value for each target calculated by the text analysis processing in step S43 and a time series prediction model stored in the time series prediction model generation unit 34 (the time series prediction described above). Based on the time-series prediction model generated in the model update process), the degree of attention for each target is calculated.

換言すれば、対象注目度算出部35は、ステップS43のテキスト解析処理によって算出された対象毎の対象表現評価値に時系列予測モデルを適用することにより、当該対象の次期における注目度を算出する。   In other words, the target attention level calculation unit 35 calculates the attention level in the next period of the target by applying the time series prediction model to the target expression evaluation value for each target calculated by the text analysis processing in step S43. .

この場合、対象注目度算出部35は、例えば予め用意されている式(4)を用いて対象毎の注目度を算出する。

Figure 0005075962
In this case, the target attention level calculation unit 35 calculates the attention level for each target using, for example, a formula (4) prepared in advance.
Figure 0005075962

ここで、時系列予測モデル生成部34の内部に上述した図21に示す時系列予測モデルが格納されており、ステップS43のテキスト解析処理によって例えば上述した図22に示す対象「A社」の対象表現評価値「0.40」が算出された場合を想定する。この場合において、パラメータα(減衰率)として0.25、パラメータβ(表現重視度)として0.50が利用者によって指定されているとすると、対象「A社」の注目度として0.461191(=0.40+0.25*0.244763)が算出される。なお、この対象「A社」の注目度の算出に用いられた値「0.244763」は、図21に示す時系列予測モデルに含まれるα=0.25およびβ=0.50である場合に上述した式(1)により算出された値である。   Here, the time series prediction model shown in FIG. 21 described above is stored in the time series prediction model generation unit 34, and the object “company A” shown in FIG. Assume that the expression evaluation value “0.40” is calculated. In this case, if 0.25 is specified as the parameter α (attenuation rate) and 0.50 is specified as the parameter β (expression importance level) by the user, the attention level of the target “Company A” is 0.461191 ( = 0.40 + 0.25 * 0.244763) is calculated. Note that the value “0.244763” used for calculating the degree of attention of the target “Company A” is α = 0.25 and β = 0.50 included in the time series prediction model shown in FIG. Is a value calculated by the above-described equation (1).

ここでは、対象「A社」の注目度について説明したが、他の対象「B社」、「C社」および「D社」等についても同様に注目度が算出される。なお、対象注目度算出部35によって対象毎に算出される注目度は、値が大きい程、当該対象が次期において注目されることを表す。   Here, the attention level of the target “Company A” has been described, but the attention levels are similarly calculated for the other targets “Company B”, “C Company”, “D Company”, and the like. Note that the attention level calculated for each target by the target attention level calculation unit 35 indicates that the larger the value, the higher the target will be in the next term.

ここで、図43は、対象注目度算出部35によって算出された対象「A社」、「B社」、「C社」および「D社」の各々の注目度の一例を示す。   Here, FIG. 43 shows an example of the respective attention degrees of the targets “Company A”, “Company B”, “Company C”, and “Company D” calculated by the target attention degree calculation unit 35.

図43に示す例では、対象「A社」の注目度は、0.461191である。この対象「A社」の注目度「0.461191」は、上記したようにα=0.25およびβ=0.50が利用者によって指定されている場合であって、上述した図22に示す対象「A社」の対象表現評価値「0.40」に図21に示す時系列予測モデルが適用された場合に算出された注目度である。   In the example shown in FIG. 43, the degree of attention of the target “Company A” is 0.461191. The degree of attention “0.461191” of the target “Company A” is a case where α = 0.25 and β = 0.50 are designated by the user as described above, and are shown in FIG. The degree of attention calculated when the time series prediction model shown in FIG. 21 is applied to the target expression evaluation value “0.40” of the target “Company A”.

また、対象「B社」の注目度は、0.005530である。この対象「B社」の注目度「0.005530」は、上記したようにα=0.25およびβ=0.50が利用者によって指定されている場合であって、上述した図23に示す対象「B社」の対象表現評価値「0.00」に図21に示す時系列予測モデルが適用された場合に算出された注目度である。   The degree of attention of the target “Company B” is 0.005530. The degree of attention “0.005530” of the target “Company B” is a case where α = 0.25 and β = 0.50 are designated by the user as described above, and are shown in FIG. 23 described above. The degree of attention calculated when the time series prediction model shown in FIG. 21 is applied to the target expression evaluation value “0.00” of the target “Company B”.

また、対象「C社」の注目度は、0.171399である。この対象「C社」の注目度「0.171399」は、上記したようにα=0.25およびβ=0.50が利用者によって指定されている場合であって、上述した図24に示す対象「C社」の対象表現評価値「0.15」に図21に示す時系列予測モデルが適用された場合に算出された注目度である。   The degree of attention of the target “Company C” is 0.171399. The degree of attention “0.1711399” of the object “Company C” is a case where α = 0.25 and β = 0.50 are designated by the user as described above, and are shown in FIG. 24 described above. This is the degree of attention calculated when the time series prediction model shown in FIG. 21 is applied to the target expression evaluation value “0.15” of the target “Company C”.

また、対象「D社」の注目度は、0.022962である。この対象「D社」の注目度「0.022962」は、上記したようにα=0.25およびβ=0.50が利用者によって指定されている場合であって、上述した図25に示す対象「D社」の対象表現評価値「0.02」に図21に示す時系列予測モデルが適用された場合に算出された注目度である。   Further, the degree of attention of the target “Company D” is 0.0229296. The degree of attention “0.022962” of the target “Company D” is a case where α = 0.25 and β = 0.50 are designated by the user as described above, and are shown in FIG. 25 described above. The degree of attention calculated when the time series prediction model shown in FIG. 21 is applied to the target expression evaluation value “0.02” of the target “Company D”.

図43においては、対象「A社」、「B社」、「C社」および「D社」以外の対象の注目度については省略されている。   In FIG. 43, the attention levels of the objects other than the objects “Company A”, “Company B”, “Company C”, and “Company D” are omitted.

再び図42に戻ると、対象ランキング表示部36は、対象注目度算出部35によって対象毎に算出された注目度(の大きさ)に基づいて、当該対象を当該注目度順に並べ替える(ステップS45)。   Returning to FIG. 42 again, the target ranking display unit 36 rearranges the targets in order of the attention level based on the attention level (size) calculated for each target by the target attention level calculation unit 35 (step S45). ).

対象ランキング表示部36は、対象が注目度順に並べ替えられた結果(つまり、対象毎の注目度のランキング結果)を利用者に対して提示(表示)する(ステップS46)。   The target ranking display unit 36 presents (displays) to the user the result of rearranging the targets in order of attention (that is, the ranking result of the attention level for each target) (step S46).

ここで、図44は、対象ランキング表示部36によって表示される対象毎の注目度のランキング結果の一例を示す。図44においては、対象「A社」、「B社」、「C社」および「D社」以外の対象については省略されている。   Here, FIG. 44 shows an example of the ranking result of the attention level for each target displayed by the target ranking display unit 36. In FIG. 44, objects other than the targets “Company A”, “Company B”, “Company C”, and “Company D” are omitted.

図44に示すように、対象毎の注目度のランキング結果においては、上記した図43に示す注目度が大きい順に対象がランキング形式で表示される。   As shown in FIG. 44, in the ranking result of the attention level for each target, the targets are displayed in the ranking format in descending order of the attention level shown in FIG.

図44に示す例では、対象「A社」、「C社」、「D社」および「B社」の順で当該対象が注目度とともに表示されている。   In the example shown in FIG. 44, the objects “A company”, “C company”, “D company”, and “B company” are displayed together with the degree of attention in this order.

なお、図44においては対象「A社」、「B社」、「C社」および「D社」の全てについて表示されるものとして説明したが、例えば注目度が上位n(nは1以上の整数)の対象のみが表示される構成であっても構わない。   In FIG. 44, it has been described that all of the targets “Company A”, “Company B”, “Company C”, and “Company D” are displayed. For example, the top n (n is 1 or more) Only a target of (integer) may be displayed.

ここで、図44に示すように対象毎の注目度のランキング結果が表示されると、利用者は、当該注目度の算出に用いられたパラメータ(αおよびβ)の更新(変更)を指示することができる。この場合、利用者は、更新後のパラメータの値を指定することができる。   Here, as shown in FIG. 44, when the ranking result of the attention level for each target is displayed, the user gives an instruction to update (change) the parameters (α and β) used to calculate the attention level. be able to. In this case, the user can specify the updated parameter value.

次に、このような利用者の指示に応じてパラメータの更新がされたか否かが判定される(ステップS47)。   Next, it is determined whether or not the parameter has been updated in accordance with such a user instruction (step S47).

パラメータの更新がされたと判定された場合(ステップS47のYES)、ステップS44に戻って処理が繰り返される。この場合、対象注目度算出部35は、利用者によって指定されたパラメータの値に基づいて、対象毎の注目度を再び算出する。このように再び対象毎の注目度が算出された後、上記したステップS45およびS46の処理が実行される。   If it is determined that the parameter has been updated (YES in step S47), the process returns to step S44 and the process is repeated. In this case, the target attention level calculation unit 35 calculates the attention level for each target again based on the value of the parameter specified by the user. After the attention level for each target is calculated again in this way, the processes of steps S45 and S46 described above are executed.

ここで、図45は、パラメータの更新後に対象ランキング表示部36によって表示される対象毎の注目度のランキング結果の一例を示す。なお、図45に示す対象毎の注目度は、パラメータαが0.25から1.00に更新され、パラメータβが0.50から0.25に更新された場合に算出された注目度である。   Here, FIG. 45 shows an example of the ranking result of the attention level for each target displayed by the target ranking display unit 36 after the parameter is updated. Note that the degree of attention for each target shown in FIG. 45 is the degree of attention calculated when the parameter α is updated from 0.25 to 1.00 and the parameter β is updated from 0.50 to 0.25. .

このように、利用者の指示に応じてパラメータが更新されることにより、減衰率(α)および表現重視度(β)の様々な値の組の場合における対象毎の注目度のランキング結果を利用者に提示することができる。   In this way, by updating the parameters according to the user's instructions, the ranking result of the attention level for each target in the case of a set of various values of the attenuation rate (α) and the expression importance level (β) is used. Can be presented to the person.

上記したように本実施形態においては、利用者の操作に応じて学習モードが設定された場合には、学習データ収集期間(予め定められた期間)内におけるテキスト情報を収集し、当該収集されたテキスト情報を時系列順に含む時系列テキストデータを取得し、対象毎に対象表現格納部22に格納されている対象表現(対象に関連する文字列)および当該取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、当該対象毎に時系列順の対象表現評価値を算出し、対象毎に学習データ収集期間(予め定められた期間)内における数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得し、対象毎に取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、対象毎に時系列順の対象数値変化率を算出する。また、本実施形態においては、利用者の操作に応じて予測モードが設定された場合には、予測データ収集期間(学習データ収集期間後から現在までの期間)内におけるテキスト情報を収集し、対象毎に対象表現格納部22に格納されている対象表現および当該収集されたテキスト情報に基づいて、当該対象毎に対象表現評価値を算出し、当該対象毎に算出された時系列順の対象表現評価値、当該対象毎に算出された時系列順の対象数値変化率および当該対象毎に算出された対象表現評価値を用いて、対象毎の注目度を算出し、当該算出された対象毎の注目度を利用者に提示する。   As described above, in the present embodiment, when the learning mode is set according to the user's operation, the text information is collected within the learning data collection period (predetermined period), and the collected information is collected. Time-series text data including text information in time-series order is acquired and included in the target expression (character string related to the target) stored in the target expression storage unit 22 for each target and the acquired time-series text data. Based on the text information in time series order, calculate the target expression evaluation value in time series order for each target, collect numerical information in the learning data collection period (predetermined period) for each target, Based on the numerical values included in the numerical information before and after in the time series order included in the time series numerical data included in the time series numerical data acquired for each target To calculate the target numerical value rate of change in chronological order for each elephant. In the present embodiment, when the prediction mode is set according to the user's operation, text information is collected within the prediction data collection period (the period from the learning data collection period to the present), and the target A target expression evaluation value is calculated for each target based on the target expression stored in the target expression storage unit 22 and the collected text information for each target, and the target expressions in time series order calculated for each target Using the evaluation value, the target numerical rate of change in time series calculated for each target, and the target expression evaluation value calculated for each target, the degree of attention for each target is calculated, Present attention to the user.

これにより、本実施形態においては、複数の対象の中から注目すべき対象を予測し、当該注目すべき対象を利用者に提示することができるため、利用者は、多数の対象の中から注目すべき対象を容易かつ簡便に選別することが可能となる。   As a result, in the present embodiment, a target to be noted can be predicted from a plurality of targets, and the target to be noticed can be presented to the user. It is possible to easily and easily select the target to be performed.

つまり、本実施形態においては、現時点までにおける対象に対応する数値情報の変化を参照するだけでなく、数値情報の変化に影響を与える対象表現(対象に関連する文字列)の出現頻度(上述した当該対象のスコア)を参照することにより、例えば専門家等による知識を前提とすることなく、複数の情報源の情報に基づいた注目すべき対象の選別を支援することができる。   In other words, in the present embodiment, not only the change of numerical information corresponding to the target up to the present time but also the appearance frequency of the target expression (character string related to the target) that affects the change of the numerical information (described above) By referring to the target score), for example, it is possible to support selection of a target to be noticed based on information from a plurality of information sources without assuming knowledge by an expert or the like.

具体的には、本実施形態において、例えばニュースのヘッドラインをテキスト情報とし、企業の株価を数値情報とすることで、利用者は、証券市場において多数の企業(銘柄)の中から注目すべき銘柄を容易かつ簡便に選別することができる。なお、本実施形態は、例えばプラント監視の分野等にも適用することができる。具体的には、プラント監視の分野における保守員によって記録される日報をテキスト情報とし、プラントから収集される計測データを数値情報とすることで、利用者は、多数のプラントの中から注目すべきプラント(例えば、故障等の可能性があるプラント)を選別することができる。   Specifically, in this embodiment, for example, by using news headlines as text information and company stock prices as numerical information, the user should pay attention from a large number of companies (brands) in the securities market. Brands can be easily and conveniently selected. The present embodiment can also be applied to the field of plant monitoring, for example. Specifically, by using daily information recorded by maintenance personnel in the field of plant monitoring as text information and measurement data collected from the plant as numerical information, users should pay attention from a large number of plants. Plants (for example, plants with a possibility of failure, etc.) can be selected.

また、本実施形態においては、学習モードが設定された場合に、対象毎に算出された時系列順の対象表現評価値および対象毎に算出された時系列順の変化率に基づいて時系列予測モデルを生成しておくことで、予測モードが設定された場合における対象毎の注目度の算出に必要な処理量を軽減することができる。   Further, in the present embodiment, when the learning mode is set, the time series prediction is performed based on the target expression evaluation value in the time series order calculated for each target and the rate of change in the time series order calculated for each target. By generating the model, it is possible to reduce the processing amount necessary for calculating the attention level for each target when the prediction mode is set.

なお、本実施形態においては、各対象に対して1種類の数値情報(例えば、株価)しか存在しないものとして説明したが、当該各対象に対して複数の数値情報があり、当該複数の数値情報から算出される複数の対象毎の時系列順の対象数値変化率から時系列予測モデルが生成されても構わない。すなわち、本実施形態における対象(企業)の株価の数値情報に、例えば株価の出来高の数値情報を加えて時系列予測モデルが生成されても構わない。   In the present embodiment, it has been described that only one type of numerical information (for example, a stock price) exists for each target. However, there is a plurality of numerical information for each target, and the plurality of numerical information. A time series prediction model may be generated from a target numerical change rate in a time series order for each of a plurality of objects calculated from the above. That is, the time series prediction model may be generated by adding, for example, numerical information of the volume of the stock price to the numerical information of the stock price of the target (company) in the present embodiment.

また、本実施形態においては、データ収集部31がテキスト情報を提供するWebサイトおよび数値情報を提供するWebサイトから各データを収集するものとして説明したが、例えばネットワーク環境でつながっている他の情報システム等からデータが収集されても構わない。   In the present embodiment, the data collection unit 31 has been described as collecting each data from a website that provides text information and a website that provides numerical information. However, for example, other information connected in a network environment Data may be collected from the system or the like.

また、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組合せてもよい。   Further, the present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Moreover, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

10…コンピュータ、20…外部記憶装置、22…対象表現格納部、30…注目対象予測装置、31…データ収集部、32…対象表現評価部、33…対象数値変化率評価部、34…時系列予測モデル生成部、35…対象注目度算出部、36…対象ランキング表示部。   DESCRIPTION OF SYMBOLS 10 ... Computer, 20 ... External storage device, 22 ... Object expression storage part, 30 ... Attention object prediction apparatus, 31 ... Data collection part, 32 ... Object expression evaluation part, 33 ... Object numerical value change rate evaluation part, 34 ... Time series Prediction model generation unit, 35 ... target attention degree calculation unit, 36 ... target ranking display unit.

Claims (4)

複数の対象の中から注目すべき対象を予測する注目対象予測装置において、
前記対象毎に、当該対象に関連する文字列を格納する対象表現格納手段と、
予め定められた複数の期間内における文字列を含むテキスト情報を収集し、当該収集されたテキスト情報を時系列順に含む時系列テキストデータを取得する第1のデータ収集手段と、
前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第1のデータ収集手段によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に基づいて、前記対象毎に前記時系列順の評価値を算出する第1の評価値算出手段と、
前記対象毎に、前記予め定められた複数の期間内における当該対象に関する数値を含む数値情報を収集し、当該数値情報を時系列順に含む時系列数値データを取得する第2のデータ収集手段と、
前記対象毎に前記第2のデータ収集手段によって取得された時系列数値データに含まれる時系列順における前後の数値情報に含まれる数値に基づいて、前記対象毎に前記時系列順の変化率を算出する変化率算出手段と、
前記予め定められた複数の期間後における文字列を含むテキスト情報を収集する第3のデータ収集手段と、
前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列および前記第3のデータ収集手段によって収集されたテキスト情報に含まれる文字列に基づいて、前記対象毎に評価値を算出する第2の評価値算出手段と、
前記対象毎に前記第1の評価値算出手段によって算出された前記時系列順の評価値、前記対象毎に前記変化率算出手段によって算出された前記時系列順の変化率および前記対象毎に前記第2の評価値算出手段によって算出された評価値を用いて、前記対象毎の注目度を算出する注目度算出手段と、
前記注目度算出手段によって算出された前記対象毎の注目度を提示する提示手段と
を具備する注目対象予測装置。
In a target object prediction device that predicts a target object of interest from a plurality of targets,
For each target, target expression storage means for storing a character string related to the target;
First data collection means for collecting text information including character strings within a plurality of predetermined periods, and acquiring time-series text data including the collected text information in time-series order;
Based on the character string related to the target stored in the target expression storage unit for each target and the time-series text information included in the time-series text data acquired by the first data collection unit, First evaluation value calculating means for calculating evaluation values in the time series order for each of the objects;
Second data collection means for collecting, for each target, numerical information including numerical values related to the target in the plurality of predetermined periods, and acquiring time-series numerical data including the numerical information in time-series order;
Based on the numerical values included in the numerical information before and after the time-series order included in the time-series numerical data acquired by the second data collection unit for each target, the rate of change in the time-series order for each target A change rate calculating means for calculating;
Third data collection means for collecting text information including character strings after the plurality of predetermined periods;
An evaluation value for each target based on a character string related to the target stored in the target expression storage unit for each target and a character string included in the text information collected by the third data collection unit Second evaluation value calculating means for calculating
The evaluation value in the time series order calculated by the first evaluation value calculating unit for each target, the change rate in the time series order calculated by the change rate calculating unit for each target, and the target value for each target Attention level calculation means for calculating the attention level for each target using the evaluation value calculated by the second evaluation value calculation means;
An attention target prediction apparatus comprising: presentation means for presenting the attention level for each target calculated by the attention level calculation means.
前記第1の評価値算出手段は、前記第1のデータ収集手段によって取得された時系列テキストデータに含まれる時系列順のテキスト情報に前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列が含まれているかを判定し、当該対象に関連する文字列が含まれている当該テキスト情報の数に応じて当該対象の当該時系列順の評価値を算出し、
前記第2の評価値算出手段は、前記第3のデータ収集手段によって収集されたテキスト情報に前記対象毎に前記対象表現格納手段に格納されている当該対象に関連する文字列が含まれているかを判定し、当該対象に関連する文字列が含まれている当該テキスト情報の数に応じて当該対象の評価値を算出する
請求項1記載の注目対象予測装置。
The first evaluation value calculation means is stored in the object expression storage means for each object in the text information in time series order included in the time series text data acquired by the first data collection means. It is determined whether a character string related to the target is included, and the evaluation value in the time series order of the target is calculated according to the number of the text information including the character string related to the target,
Whether the second evaluation value calculation means includes text information related to the object stored in the object expression storage means for each object in the text information collected by the third data collection means The attention object prediction apparatus according to claim 1, wherein the evaluation value of the target is calculated according to the number of the text information including the character string related to the target.
前記対象毎に前記第1の評価値算出手段によって算出された前記時系列順の評価値および前記対象毎に前記変化率算出手段によって算出された前記時系列順の変化率に基づいて、前記対象毎の注目度を算出するために用いられる時系列予測モデルを生成する時系列予測モデル生成手段を更に具備し、
前記注目度算出手段は、前記対象毎に前記第2の評価値算出手段によって算出された評価値および前記時系列予測モデル格納手段に格納された時系列予測モデルを用いて、前記対象毎の注目度を算出する
請求項1記載の注目対象予測装置。
Based on the evaluation value in the time series order calculated by the first evaluation value calculation unit for each target and the change rate in the time series order calculated by the change rate calculation unit for each target Further comprising a time-series prediction model generating means for generating a time-series prediction model used for calculating the degree of attention for each;
The attention level calculation means uses the evaluation value calculated by the second evaluation value calculation means for each target and the time series prediction model stored in the time series prediction model storage means, and receives attention for each target. The attention object prediction device according to claim 1 which calculates a degree.
前記注目度算出手段は、複数の予め定められたパラメータを用いて、当該パラメータ毎に前記対象毎の注目度を算出し、
前記提示手段は、利用者によって指定されたパラメータを用いて算出された前記対象毎の注目度を提示する
請求項1記載の注目対象予測装置。
The degree-of-attention calculation means uses a plurality of predetermined parameters to calculate the degree of attention for each target for each parameter,
The attention object prediction apparatus according to claim 1, wherein the presenting means presents a degree of attention for each object calculated using a parameter designated by a user.
JP2010225864A 2010-10-05 2010-10-05 Attention target prediction device Active JP5075962B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010225864A JP5075962B2 (en) 2010-10-05 2010-10-05 Attention target prediction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010225864A JP5075962B2 (en) 2010-10-05 2010-10-05 Attention target prediction device

Publications (2)

Publication Number Publication Date
JP2012079227A JP2012079227A (en) 2012-04-19
JP5075962B2 true JP5075962B2 (en) 2012-11-21

Family

ID=46239357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010225864A Active JP5075962B2 (en) 2010-10-05 2010-10-05 Attention target prediction device

Country Status (1)

Country Link
JP (1) JP5075962B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6550822B2 (en) * 2015-03-20 2019-07-31 日本電気株式会社 Information processing resource management device, information processing resource management method, and information processing resource management program
WO2021060968A1 (en) * 2019-09-27 2021-04-01 Mimos Berhad System and method for providing stock market recommendation
CN111126288B (en) * 2019-12-25 2022-08-09 南京甄视智能科技有限公司 Target object attention calculation method, target object attention calculation device, storage medium and server

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162639A (en) * 2001-11-28 2003-06-06 Fujitsu Ltd Stock name selection supporting device
JP2005092508A (en) * 2003-09-17 2005-04-07 Nec Corp Data processor
JP2005100221A (en) * 2003-09-26 2005-04-14 Nomura Research Institute Ltd Investment judgement support information providing device and method

Also Published As

Publication number Publication date
JP2012079227A (en) 2012-04-19

Similar Documents

Publication Publication Date Title
Wang et al. A tutorial on RxODE: simulating differential equation pharmacometric models in R
US8666771B2 (en) Healthcare system planning tool
WO2015122362A1 (en) Causal network generating system and causal relation data structure
JP2010067240A (en) System for automatically generating and growing avatar image
JP2006004307A (en) Business assessment support method
US20170300819A1 (en) Time-Series Prediction Apparatus and Time-Series Prediction Method
JP6437376B2 (en) Decision support system and decision support method
JP5075962B2 (en) Attention target prediction device
JP7272873B2 (en) PLANNING SUPPORT DEVICE AND PLANNING SUPPORT METHOD
JP5432941B2 (en) Emergency response work support apparatus and emergency response work support method
JPWO2003017137A1 (en) User profile management device and recommendation device
JP7487866B2 (en) Loan management system, method, and program
JP2012113492A (en) Guidance sentence creation support system and method
JP6647543B1 (en) Information processing apparatus, information processing method and program
Wade et al. Fifty-year forecasts of daily smoking prevalence: can Australia reach 5% by 2030?
JP2015187773A (en) Data analysis device, data analysis program, and data analysis method
Tamási et al. Individual participant data meta-analysis with mixed-effects transformation models
WO2016072474A1 (en) Information processing device, method, and program
JP6592221B1 (en) Future prediction simulation apparatus, method, and computer program
CN110968291B (en) Method and device for adjusting function menu of application program based on optimal tree
Youn et al. Modeling the Economic Impact of Interventions for Older Populations with Multimorbidity: A Method of Linking Multiple Single-Disease Models
JP2003108750A (en) Method for diagnosing medical administration, method for optimizing medical administration and program therefor
JP6216600B2 (en) Introducer candidate extraction system
JP4372639B2 (en) Performance target processing method, performance target processing system, and server device
JP5949764B2 (en) Configuration management apparatus, configuration management method, and program recording medium for storing configuration management program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120827

R150 Certificate of patent or registration of utility model

Ref document number: 5075962

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350