JP2011141833A - 株価予測装置、方法及びプログラム - Google Patents
株価予測装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2011141833A JP2011141833A JP2010003167A JP2010003167A JP2011141833A JP 2011141833 A JP2011141833 A JP 2011141833A JP 2010003167 A JP2010003167 A JP 2010003167A JP 2010003167 A JP2010003167 A JP 2010003167A JP 2011141833 A JP2011141833 A JP 2011141833A
- Authority
- JP
- Japan
- Prior art keywords
- company name
- stock price
- word
- company
- stock
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000011156 evaluation Methods 0.000 claims abstract description 52
- 238000004364 calculation method Methods 0.000 claims description 42
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 37
- 238000004458 analytical method Methods 0.000 description 32
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000013523 data management Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000009418 renovation Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Landscapes
- Crushing And Pulverization Processes (AREA)
- Crushing And Grinding (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【課題】高精度な株価予測を行う技術を提供する。
【解決手段】株価予測装置は、単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出する手段と、これに応じて株式銘柄を示す企業名とこの企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体との関連性の高さを示す関連度をそれぞれ取得する手段と、この関連度と上記企業名又は上記関連語の印象を示す値とが反映される評価値を算出する手段と、当該企業名又は当該関連語を含むコンテンツが提供されてから所定期間後の株価変動値を取得し、これと企業名又はその関連語に対応する評価値とを用いてそのコンテンツ提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出する手段と、当該企業名に関する、上記予測係数と上記評価値とを用いて、当該企業名で示される株式銘柄の株価を予測する手段と、を備える。
【選択図】図1
【解決手段】株価予測装置は、単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出する手段と、これに応じて株式銘柄を示す企業名とこの企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体との関連性の高さを示す関連度をそれぞれ取得する手段と、この関連度と上記企業名又は上記関連語の印象を示す値とが反映される評価値を算出する手段と、当該企業名又は当該関連語を含むコンテンツが提供されてから所定期間後の株価変動値を取得し、これと企業名又はその関連語に対応する評価値とを用いてそのコンテンツ提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出する手段と、当該企業名に関する、上記予測係数と上記評価値とを用いて、当該企業名で示される株式銘柄の株価を予測する手段と、を備える。
【選択図】図1
Description
本発明は、株価を予測する技術に関する。
現在、インターネット上において多くのオンライン株取引サービスが提供されており、だれでも簡単に株式投資をすることができる。また、実際に取引をしないまでも、各登録ユーザに株価予測をさせるSNS(Social Networking Service)を提供するサイト等も
存在する。
存在する。
ところで、投資家が投資判断を行う際に利用する分析手法として、テクニカル分析やファンダメンタル分析と呼ばれる手法が知られている。テクニカル分析では過去の相場の動きが分析され、ファンダメンタル分析では企業の財務情報等が分析される。
しかしながら、現状のような情報社会では、上述したテクニカル分析やファンダメンタル分析で利用されるような専門的な情報のみでなく、各企業に関する、商品やサービスの評判、ブランドイメージ、スキャンダル、トレンド等といった間接的な情報が株価に反映される場合がある。ところが、現状、このような間接的な情報を利用した株価予測を行う手法は存在しない。
また、上述のような専門的な情報は、ベテラン投資家にとっては有益であるが、初心者の投資家にとっては有効活用することは難しい。よって、初心者投資家は、適切な投資判断をすることが困難である。また、これから投資家になろうとするユーザは例え興味があったとしても簡単に株式投資を始めづらいのが現状である。
本発明の目的は、このような問題点に鑑み、高精度な株価予測を行う技術を提供することにある。
本発明の態様では、上述した課題を解決するために、それぞれ以下の構成を採用する。
本態様は、株価予測装置に関する。本態様に係る株価予測装置は、ネットワーク上に提供される様々なコンテンツを収集する収集手段と、この収集された各コンテンツに含まれる単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出する抽出手段と、この抽出された単語及び単語の組み合わせ並びにコンテンツ数に応じて、株式銘柄を示す企業名と、この企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体と、の関連性の高さを示す関連度を、各企業名に対する各関連語又は各企業名についてそれぞれ取得する関連度取得手段と、この関連度取得手段により取得された関連度と上記企業名又は上記関連語の印象を示す値とが反映される評価値を当該企業名又は各企業名に対する各関連語についてそれぞれ算出する算出手段と、当該企業名又は当該関連語を含むコンテンツが上記ネットワーク上に提供されてから所定期間後の株価変動値を取得し、この株価変動値と、その企業名又はその関連語に
対応する評価値と、を用いて、そのコンテンツ提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出する係数算出手段と、当該企業名に関する、上記係数算出手段で算出された予測係数と上記算出手段で算出された評価値とを用いて、当該企業名で示される株式銘柄の株価を予測する予測手段と、を備える。
対応する評価値と、を用いて、そのコンテンツ提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出する係数算出手段と、当該企業名に関する、上記係数算出手段で算出された予測係数と上記算出手段で算出された評価値とを用いて、当該企業名で示される株式銘柄の株価を予測する予測手段と、を備える。
本態様では、ネットワーク上に提供される様々なコンテンツから得られる情報を用いて、株価が予測される。本態様ではコンテンツの内容を限定するものではないため、広範な情報を反映させた株価予測を実現し、ひいては、精度の高い株価予測を行うことができる。
また、本態様では、株式銘柄を示す企業名と関連語との関連性の高さを示す関連度やその関連語や企業名の印象を示す値を利用することにより、広範で大量な情報を単に利用しているのではなく、評価値という重みを各情報に付すことで有効な情報を適切に利用しながら株価予測が行われる。更に、実際の株価変動値を用いることで各情報の株価変動への影響度をフィードバックさせ、株価予測に用いている。
従って、本実施形態によれば、広範で大量の情報を株価への影響度を加味しつつ予測株価に反映させているため、高精度の株価予測を実現することができる。
本態様に係る株価予測装置において好ましくは、上記関連度取得手段が、当該企業名のコンテンツ単位での出現確率及び上記関連語のコンテンツ単位での出現確率に対する、当該企業名と当該関連語との組み合わせのコンテンツ単位での共起確率の割合が反映された値を、当該企業名と当該関連語との組み合わせの関連度として算出する。
また、本態様に係る株価予測装置において好ましくは、上記係数算出手段が、上記株価変動値と上記評価値との乗算値を、同一コンテンツ提供元からのコンテンツに記載された当該企業名及び当該企業名に対する関連語の数で平均を取った値と、その企業名及び企業名に対する関連語の数に応じて決まる重み値と、を用いて、そのコンテンツ提供元の前記企業名に対する予測係数を算出する。
このように、単語の組み合わせの数に応じて決まる重み値をも用いて予測係数が算出されるため、偶然性を排除した高精度の株価予測を行うことができる。
なお、本発明の別態様としては、以上の何れかの構成を実現する方法であってもよいし、プログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記憶媒体であってもよい。
本発明によれば、高精度な株価予測を行う技術を提供することができる。
以下、本発明を実施するための形態としての株価予測システムについて具体例を挙げ説明する。なお、以下に挙げた形態は例示であり、本発明は以下の形態に限定されない。
〔システム構成〕
まず、本実施形態における株価予測システム及びそれに関連するシステムの全体構成について図1を用いて説明する。図1は、株価予測システム及びこれに関連するシステムの全体構成を示す図である。
まず、本実施形態における株価予測システム及びそれに関連するシステムの全体構成について図1を用いて説明する。図1は、株価予測システム及びこれに関連するシステムの全体構成を示す図である。
株価予測システム8は、コンテンツサーバ5、投資ユーザ端末3等とネットワーク1を介して接続する。株価予測システム8は、ネットワーク1を介してアクセスする投資ユーザ端末3に株価予測サービスを提供する。株価予測システム8は、内部ネットワーク(図示せず)で相互に接続される、フロントサーバ9、関連情報サーバ10、評判情報サーバ30、予測サーバ50等を有する。ネットワーク1及び株価予測システム8の内部ネットワークは、インターネット等の公衆ネットワークであってもよいし、LAN(Local Area
Network)やWAN(Wide Area Network)等の社内ネットワークであってもよい。本発
明は、このようなネットワークを限定するものではなく、ネットワーク上を流れるプロトコルを限定するものでもない。
Network)やWAN(Wide Area Network)等の社内ネットワークであってもよい。本発
明は、このようなネットワークを限定するものではなく、ネットワーク上を流れるプロトコルを限定するものでもない。
コンテンツサーバ5は、ネットワーク1に接続される、様々な情報コンテンツを提供する一般的なサーバ群である。コンテンツサーバ5は、例えば、WEBサーバ、ファイルサーバ等として実現される。コンテンツサーバ5には、各種ニュース情報を提供するニュースサーバ、ブログサーバ、様々な法人や個人が立ち上げたWEBサーバ等が含まれる。
コンテンツサーバ5からは、上述のテクニカル分析やファンダメンタル分析で利用されるような株取引に関する専門的な情報のみでなく、その他、様々な情報が提供される。この様々な情報の中には、報道機関が提供する情報に加えて、当然、口コミと呼ばれるような一般ユーザが提供する情報も含まれる。なお、本発明は、このようなコンテンツサーバ5から提供される情報を限定するものではなく、ネットワーク1上に提供される何らかの情報であればよい。
投資ユーザ端末3は、例えば、PC(Personal Computer)、携帯電話等のユーザ端末
である。投資ユーザ端末3は、株価予測システム8にアクセスしデータを受け得る一般的な通信機能、提供されたデータに基づく画面を表示及び操作することができる一般的なユーザインタフェース機能等を有するものであればよく、本発明は投資ユーザ端末3のハードウェア構成及び機能構成を限定するものではない。
である。投資ユーザ端末3は、株価予測システム8にアクセスしデータを受け得る一般的な通信機能、提供されたデータに基づく画面を表示及び操作することができる一般的なユーザインタフェース機能等を有するものであればよく、本発明は投資ユーザ端末3のハードウェア構成及び機能構成を限定するものではない。
〔装置構成〕
以下、本実施形態における株価予測システム8を構成する各サーバ9、10、30及び50の装置構成についてそれぞれ説明する。なお、本実施形態では、各サーバ9、10、30及び50がそれぞれ別装置として実現される例を示すが、1つのサーバ装置として実現されてもよいし、複数のサーバ装置として実現されてもよい。
以下、本実施形態における株価予測システム8を構成する各サーバ9、10、30及び50の装置構成についてそれぞれ説明する。なお、本実施形態では、各サーバ9、10、30及び50がそれぞれ別装置として実現される例を示すが、1つのサーバ装置として実現されてもよいし、複数のサーバ装置として実現されてもよい。
〈フロントサーバ〉
フロントサーバ9は、投資ユーザ端末3と株価予測システム8との間のインタフェース
として動作する一般的なサーバ装置である。フロントサーバ9は、投資ユーザを管理し、管理される正当ユーザにより利用される投資ユーザ端末3からのアクセスに対して、株価予測結果を表示する画面等を提供する。投資ユーザ端末3と株価予測システム8との間のインタフェースは、例えばWEBシステムが利用される。
フロントサーバ9は、投資ユーザ端末3と株価予測システム8との間のインタフェース
として動作する一般的なサーバ装置である。フロントサーバ9は、投資ユーザを管理し、管理される正当ユーザにより利用される投資ユーザ端末3からのアクセスに対して、株価予測結果を表示する画面等を提供する。投資ユーザ端末3と株価予測システム8との間のインタフェースは、例えばWEBシステムが利用される。
フロントサーバ9は、予測サーバ50により予測された株価情報を正当ユーザが利用する投資ユーザ端末3に提供する。この提供方法は、電子メールであってもよいし、WEBページであってもよいし、その他の手法であってもよい。本発明は、予測された株価情報の提供手法を限定するものではない。
〈関連情報サーバ〉
図2は、関連情報サーバ10の構成を示す概念図である。
図2は、関連情報サーバ10の構成を示す概念図である。
関連情報サーバ10は、ハードウェア構成として、図2に示されるように、バス12で接続される、通信部11、記憶部13、制御部20等を有する。記憶部13は、例えばハードディスクであり、制御部20で実行される処理で利用される各種情報を記憶する。制御部20は、CPU(Central Processing Unit)等の1又は複数のプロセッサ、このプ
ロセッサの処理に利用される周辺回路(ROM(Read Only Memory)、RAM(Radom Access Memory)、インタフェース回路等)を有する。
ロセッサの処理に利用される周辺回路(ROM(Read Only Memory)、RAM(Radom Access Memory)、インタフェース回路等)を有する。
通信部11は、ネットワーク1及び株価予測システム8の内部ネットワーク(図示せず)に接続され、評判情報サーバ30及び予測サーバ50との通信、コンテンツサーバ3との通信等を実現する。本発明は、関連情報サーバ10の通信形態を限定するものではなく、例えば、IP(Internet Protocol)パケットにより実現される。関連情報サーバ10
は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されるようにしてもよい。本発明は、関連情報サーバ10のハードウェア構成を限定するものではない。
は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されるようにしてもよい。本発明は、関連情報サーバ10のハードウェア構成を限定するものではない。
関連情報サーバ10は、記憶部13に記憶されるアプリケーションプログラムが制御部20により実行されることにより、図2に示す各処理ブロックを実現する。このような処理ブロックとして、関連情報サーバ10は、データ管理部21、記事収集部22、解析部23、単語処理部24、重み算出部25等を有する。これら処理ブロックにより参照されるデータベースとして、記憶部13には、企業テーブル16、株価テーブル17及び関連語テーブル18が格納される。以下、これら関連情報サーバ10の各処理ブロックについてそれぞれ説明する。
データ管理部21は、企業テーブル16、株価テーブル17、又は、関連語テーブル18のデータを管理する。具体的には、データ管理部21は、通信部11を介して他のサーバ、即ち、評判情報サーバ30及び予測サーバ50から要求を受けた場合に、その要求の対象となるデータを企業テーブル16、株価テーブル17、又は、関連語テーブル18から抽出し、抽出されたデータを要求元に送る。
記事収集部22は、所定の周期で動作し、各コンテンツサーバ5から更新されたコンテンツを含む文書をそれぞれ収集する。収集される文書は例えばWEBページである。記事収集部22は、収集された文書を記憶部13のバッファ(図示せず)に一時記憶し、この収集された文書についての解析処理指示を解析部23に通知する。
更に、記事収集部22は、所定のコンテンツサーバ5から日毎の株価情報を収集する。記事収集部22は、企業テーブル16に格納されている各企業(各銘柄)についての株価情報を収集する。記事収集部22は、収集された株価情報を日付と共に株価テーブル17
に格納する。
に格納する。
図3は、企業テーブル16の例を示す図である。図4は、株価テーブル17の例を示す図である。図3に示すように、企業テーブル16には、株価予測の対象となる企業名(銘柄名)とその企業が属するグループ(カテゴリ)名が格納される。このグループには、例えば、日経業種分類が利用される。このグループ分類は、新たな所定の分類を用いるようにしてもよい。企業テーブル16は、予め、システム管理者等により設定されてもよいし、所定のコンテンツサーバ5で提供される銘柄一覧から取得されたレコードにより自動更新されるようにしてもよい。株価テーブル17には、図4に示すように、企業テーブル16に格納される各企業についてそれぞれ日付と株価が日毎に格納される。
解析部23は、記事収集部22で収集された全文書に対して形態素解析を実行する。解析部23は、形態素解析の実行結果として、各文書に含まれる単語情報をそれぞれ単語処理部24へ送る。
単語処理部24は、解析部23から送られる単語情報を用いることにより、各単語の文書単位での出現回数をカウントする。文書単位での出現回数とは、1文書に同一単語が複数含まれていた場合その単語の出現回数は1加算されることを意味する。更に、単語処理部24は、同一文書内での任意の2単語の組み合わせの出現回数もカウントする。例えば、文書1を形態素解析することにより「インターネット」、「モバイル」、「新サービス」の3つの単語が得られた場合、「インターネット」と「モバイル」、「インターネット」と「新サービス」、「モバイル」と「新サービス」の3つの組み合わせについて、各組み合わせの出現回数が1加算される。
単語処理部24は、記事収集部22で収集された全文書に対して、各単語の出現回数及び各組み合わせの出現回数をカウントし終わると、各出現回数をそれぞれ文書数で割ることにより、各単語の出現確率値、各組み合わせの共起確率値をそれぞれ算出する。単語処理部24は、各単語情報、算出された各出現確率値などをそれぞれ重み算出部25へ送る。
重み算出部25は、単語処理部24から送られる単語情報のうち、企業テーブル16に格納されている企業名(銘柄名)を示す単語(図3の例における「インターネット」、「デパート」)を抽出する。更に、重み算出部25は、各組み合わせに関する情報から、この企業名を示す単語との組み合わせを抽出し、この組み合わせに含まれる他方の単語をその企業に対する関連語に決定する。重み算出部25は、抽出された各関連語の各企業名との関連度の高さを重み値としてそれぞれ算出する。この重み値には、共起尺度、即ち、共に出現する頻度の情報が利用される。重み値の計算には、以下の数1に示す式が利用される(文献(Church, Kenneth, William Gale, Patrick Hanks, and Donald Hindle、 Using statistics in lexical analysis、 In Uri Zernik (ed.)、 US、 Lexical Acquisition: Exploiting On-Line Resources to Build a Lexicon、 1991、 pp. 115-164)参照)
。
。
れる。この企業名を示す単語の重み値は最大値(1)に設定される。重み算出部25は、算出された重み値I(x、y)を関連語テーブル18に格納する。このとき、重み算出部25は、企業名xと関連語yとの組み合わせのレコードが既に関連語テーブル18に格納されている場合には、そのレコードの重み値フィールドをその算出された値で更新する。
図5は、関連語テーブルの例を示す図である。関連語テーブル18には、各企業に対する関連語とその関連語の重み値とがそれぞれ格納される。なお、図5の例では、企業名を示す単語も関連語として格納される。
このように、関連情報サーバ10は、コンテンツサーバ5から収集された文書に応じて、周期的に、各企業についての関連語情報とその企業と関連語との重み値とをそれぞれ更新する(関連語テーブル18の更新)。
〈評判情報サーバ〉
図6は、評判情報サーバ30の構成を示す概念図である。
図6は、評判情報サーバ30の構成を示す概念図である。
評判情報サーバ30は、ハードウェア構成として、図6に示されるように、バス32で接続される、通信部31、記憶部33、制御部40等を有する。記憶部33は、例えばハードディスクであり、制御部40で実行される処理で利用される各種情報を記憶する。制御部40は、CPU等の1又は複数のプロセッサ、このプロセッサの処理に利用される周辺回路(ROM、RAM、インタフェース回路等)を有する。
通信部31は、ネットワーク1及び株価予測システム8の内部ネットワーク(図示せず)に接続され、関連情報サーバ10及び予測サーバ50との通信等を実現する。本発明は、評判情報サーバ30の通信形態を限定するものではない。評判情報サーバ30は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されるようにしてもよい。本発明は、評判情報サーバ30のハードウェア構成を限定するものではない。
評判情報サーバ30は、記憶部33に記憶されるアプリケーションプログラムが制御部40により実行されることにより、図6に示す各処理ブロックを実現する。このような処理ブロックとして、評判情報サーバ30は、データ管理部41、記事収集部42、解析部43、単語処理部44、評価値算出部45、株価変動算出部46等を有する。これら処理ブロックにより参照されるデータベースとして、記憶部33には、評判情報テーブル38が格納される。以下、これら評判情報サーバ30の各処理ブロックについてそれぞれ説明する。
データ管理部41は、評判情報テーブル38を管理し、更に他のサーバから得る必要のあるデータについては他のサーバにそのデータの送信を要求する。具体的には、データ管理部41は、通信部31を介して関連情報サーバ10に所定のデータを要求し、この要求に応じて関連情報サーバ10から送られるデータを所望の処理ブロックに送る。また、データ管理部41は、予測サーバ50から要求を受けた場合に、その要求されるデータを評判情報テーブル38から抽出し、抽出されたデータを要求元の予測サーバ50に送る。
記事収集部42は、上述した関連情報サーバ10の記事収集部22と同様の文書を収集する。このとき、記事収集部42は、各文書について提供元情報及び更新日情報も併せてそれぞれ取得する。提供元情報には、例えば、その文書を提供するコンテンツサーバ5のURL(Uniform Resource Locator)が利用される。提供元情報として、その文書の著者、所有会社等が利用されてもよい。更新日情報としてその文書のファイルのタイムスタンプが利用されるようにしてもよい。
記事収集部42は、収集された文書を記憶部33のバッファ(図示せず)に一時記憶し、この収集された文書についての解析処理を解析部23に要求する。なお、評判情報サーバ30の記事収集部42は、関連情報サーバ10の記事収集部22により収集された文書データを関連情報サーバ10から取得するようにしてもよい。
解析部43は、記事収集部42で収集された全文書に対して形態素解析を実行する。解析部43は、形態素解析の実行結果として、各文書に含まれる単語情報をそれぞれ単語処理部44へ送る。
単語処理部44は、解析部43から送られる単語情報から、関連情報サーバ10の関連語テーブル18に格納される関連語及び企業名を示す単語を探し出し、この関連語又は企業名を示す単語を含む文書を特定する。単語処理部44は、このように特定された文書の提供元情報及び更新日情報と共に、その関連語及び企業名を示す単語を各企業名(各銘柄名)と関連付けて評判情報テーブル38にそれぞれ格納する。単語処理部44は、評判情報テーブル38を更新すると、その旨を評価値算出部45に通知する。
図7は、評判情報テーブル38の例を示す図である。図7に示すように、評判情報テーブル38には、提供元情報、企業グループ名、企業名、関連語、評価値、更新日、株価変動等が格納される。評判情報テーブル38の各レコードは、或る文書に含まれていた或る企業名を示す単語又は或る関連語についての情報に相当する。提供元情報はその関連語又は企業名を示す単語を含む文書の提供元情報であり、更新日はその関連語又は企業名を示す単語を含む文書の更新日情報であり、企業グループ名は、企業テーブル16に格納される情報である。
評価値は、各企業(銘柄)に対する、企業名を示す単語又は関連語に関する値であって、企業名との関連度合の大きさとその単語の印象(ネガティブ又はポジティブ)とを合わせた値である。よって、企業名Aと共に頻繁に利用される単語(関連語)Bであってネガティブな印象を与えることの多い単語Bと、企業名Aとの組み合わせに係る評価値は、負に大きい値となる。逆に、企業名Aと共に頻繁に利用される単語(関連語)Cであってポジティブな印象を与えることの多い単語Cと、企業名Aとの組み合わせに係る評価値は、正に大きい値となる。この評価値は、評価値算出部45により更新される。
株価変動は、或る関連語又は或る企業名を示す単語を含む文書の更新日から所定閾値(T日)後までの間における、その単語に対応する企業名の株価の変動情報である。言い換えれば、変動情報は、その企業名を示す単語又は関連語の公開が株価に与える影響度を示す情報である。株価変動は、株価変動算出部46により更新される。
評価値算出部45は、評判情報テーブル38が更新されたことを通知されると、その更新された各レコードの評価値をそれぞれ算出する。具体的には、評価値算出部45は、対象レコードに含まれる企業名(銘柄名)と企業名を示す単語又は関連語との組み合わせに対応する重み値を関連情報サーバ10に要求する。評価値算出部45は、この要求に応じて関連語テーブル18から抽出され関連情報サーバ10から送られる重み値を取得する。
また、評価値算出部45は、対象レコードに含まれる関連語又は企業名を示す単語の印象情報(ネガティブかポジティブかの情報)を既存の手法を用いて取得する。この既存の手法には、例えば、バズ分析等と呼ばれるマーケティング分析で利用される評価表現辞書(ニフティ(登録商標)株式会社)を用いた手法、特開2007−219880号公報に記載される手法等が存在する。評価値算出部45は、関連語又は企業名を示す単語の印象情報をその単語がネガティブを示す場合には−1に設定し、その単語がポジティブを示す
場合には+1に設定する。評価値算出部45は、この印象情報と同レコードについて取得された重み値とを乗算し、その乗算結果を評価値とする。評価値算出部45は、算出した評価値を評判情報テーブル38の該当レコードに反映する。
場合には+1に設定する。評価値算出部45は、この印象情報と同レコードについて取得された重み値とを乗算し、その乗算結果を評価値とする。評価値算出部45は、算出した評価値を評判情報テーブル38の該当レコードに反映する。
株価変動算出部46は、評判情報テーブル38の株価変動フィールドを更新する。具体的には、株価変動算出部46は、評判情報テーブル38の中から、現在日付が更新日フィールドの日付から所定閾値(T日)後となるレコードを抽出する。株価変動算出部46は、抽出されたレコードの企業名で示される銘柄についての、T日前から現在日付までの間の株価情報を関連情報サーバ10に要求する。株価変動算出部46は、株価テーブル17から抽出され関連情報サーバ10から送られる株価情報に応じて、T日前から現在日付までの間の株価の変動値を算出する。この変動値は、株価の変動量をT日で除算した値となる。株価変動算出部46は、算出された変動値を評判情報テーブル38の該当レコードに反映する。
〈予測サーバ〉
図8は、予測サーバ50の構成を示す概念図である。
図8は、予測サーバ50の構成を示す概念図である。
予測サーバ50は、ハードウェア構成として、図8に示されるように、バス52で接続される、通信部51、記憶部53、制御部60等を有する。記憶部53は、例えばハードディスクであり、制御部60で実行される処理で利用される各種情報を記憶する。制御部60は、CPU等の1又は複数のプロセッサ、このプロセッサの処理に利用される周辺回路(ROM、RAM、インタフェース回路等)を有する。
通信部51は、ネットワーク1及び株価予測システム8の内部ネットワーク(図示せず)に接続され、関連情報サーバ10及び評判情報サーバ30との通信等を実現する。本発明は、予測サーバ50の通信形態を限定するものではない。予測サーバ50は、PC等のような汎用コンピュータで構築されてもよいし、専用コンピュータで構築されるようにしてもよい。本発明は、予測サーバ50のハードウェア構成を限定するものではない。
予測サーバ50は、記憶部53に記憶されるアプリケーションプログラムが制御部60により実行されることにより、図8に示す各処理ブロックを実現する。このような処理ブロックとして、予測サーバ50は、予測係数算出部62、株価予測部63等を有する。これら処理ブロックにより参照されるデータベースとして、記憶部53には、予測株価テーブル56、予測係数テーブル58が格納される。以下、これら予測サーバ50の各処理ブロックについてそれぞれ説明する。
予測係数算出部62は、所定の周期で予測係数テーブル58を更新する。具体的には、予測係数算出部62は、評判情報サーバ30から、評判情報テーブル38における更新日が上記所定閾値(T日)前に設定されているレコードを取得する。予測係数算出部62は、取得されたレコードに含まれる情報を用いて、各提供元の各企業に対する予測係数をそれぞれ算出する。この予測係数は、或る提供元から提供された文書に或る企業についての言及が存在した場合の株価への影響具合を示す。予測係数算出部62は、以下の数2で示される式を用いて各提供元の各企業に対する予測係数をそれぞれ算出する。
を示し、siは、集合Sacの特定レコードiの株価変動を示す。
この数2の式の右辺の第1項は、或る提供元と或る企業との組み合わせについて評価値と株価変動との乗算値の平均を算出する。ここで、評価値は、上述したように、企業名との関連度合の大きさと印象とを合わせた値であり、株価変動は、上述したように、企業名又は関連語が公表されてからT日後までの株価変動を示す。つまり、第1項で算出される値は、或る提供元から提供された文書に或る企業についての言及(関連語を用いた言及も含む)が存在した場合の株価への影響具合を示す。
第1項で算出される値が正に大きい場合には、その提供元のその企業に対する言及と株価とが正に相関する、即ち、その提供元はその企業の株価に大きく影響を与える文書を提供するものであることを示す。逆に、第1項で算出される値が負に大きい場合には、その提供元のその企業に対する言及と株価とが負に相関する、即ち、その提供元はその企業の株価に逆に大きく影響を与える文書を提供するものであることを示す。更に、第1項で算出される値が0に近似する場合には、その提供元のその企業に対する言及と株価との相関が小さい、即ち、その提供元から提供される文書はその起業の株価には影響されないことを示す。
ところで、第1項で算出される相関値は、サンプルであるレコード数が少ない場合は偶発的な相関関係も含む可能性が高い。そこで、数2に示す式の左辺の第2項により、当該レコード数が少ない場合にはその相関値が低く抑えられる。即ち、数2に示す式の左辺の第2項は、第1項で算出される値に対する重み関数を示す。
図9は、この重み関数を示すグラフである。図9に示すように、この重み関数は、0から1の間の値を取り、評判情報テーブル38の該当レコード集合のレコード数|Sac|に応じて取り得る値が変化する関数である。この重み関数は、レコード数0のときに0を取り、レコード数の増加に伴って大きくなり、一定数を越すと緩やかに1に近づく値を取る。第2項のαは、1への近づき方を定義する重み関数のパラメータであり、100又は100に近似する値が設定されると好適である。
更に、予測係数算出部62は、取得されたレコードに含まれる情報を用いて、各提供元の各企業グループに対する予測係数についてもそれぞれ算出する。この算出方法は、以下の数3に示すように、上述と同様であるが、扱うレコードが異なる。この場合、上記SacがSagに置き換えられる。Sagは、情報テーブル38における提供元情報が提供元aであり企業グループ名がグループcであるレコードのうちの更新日が上記所定閾値(T日)前に設定されているレコードの集合を示す。よって、この数3の式の右辺の第1項は、或る提供元と或る企業グループとの組み合わせについて評価値と株価変動との乗算値の平均を算出する。
株価予測部63は、定周期、投資ユーザ端末3からの要求をフロントサーバ9を介して受信したとき等に、関連情報サーバ10の株価テーブル17、評判情報サーバ30の評判情報テーブル38、及び上述の予測係数テーブル58に格納される各情報を用いて、株価予測を行う。株価予測部63は、当日から所定閾値(T日)後までの間の株価を予測する。株価予測部63は、予測された株価、実際の株価と予測株価との差分をそれぞれ予測株価テーブル56に格納する。
図11は、予測株価テーブル56の例を示す図である。予測株価テーブル56には、株価テーブル17から取得された企業名及び株価、株価予測部63により予測された株価、及び、株価テーブル17から取得された株価(実際の株価)と予測株価との差分が格納される。
以下、株価予測部63による具体的な株価予測手法について説明する。株価予測部63は、評判情報テーブル38における更新日が予測したい株価の日から上記所定閾値(T日)前の日に設定されているレコードを取得する。株価予測部63は、評判情報テーブル38から取得された各企業のレコードの情報に基づいて、各企業の予測される株価の傾きを算出し、この傾きを現在の株価に掛け合わせることにより予測株価を算出する。株価予測部63は、以下の数4で示す式を用いて予測株価を算出する。
企業cの現在の株価を示し、Scは、評判情報テーブル38から取得された企業cのレコ
ードの集合を示す。|Sc|はそのレコード数を示す。eiは、集合Scの特定レコードi
の評価値を示す。pjは、予測係数テーブル58における、集合Scの特定レコードiの提供元情報及び企業名と同じ提供元情報及び企業名が格納されるレコードjの予測係数を示す。
〔動作例〕
実施例1における株価予測システム8では、関連情報サーバ10及び評判情報サーバ30が、所定の周期で、ネットワーク1上で様々なコンテンツサーバ5から提供される様々なコンテンツを収集する。収集されるコンテンツには、株取引に関する専門的な情報、各企業の商品情報やサービス情報やスキャンダル情報等のような報道機関から提供される情報、株取引に関係のない一般ユーザによる様々な書き込み情報(口コミ)等が含まれる。
実施例1における株価予測システム8では、関連情報サーバ10及び評判情報サーバ30が、所定の周期で、ネットワーク1上で様々なコンテンツサーバ5から提供される様々なコンテンツを収集する。収集されるコンテンツには、株取引に関する専門的な情報、各企業の商品情報やサービス情報やスキャンダル情報等のような報道機関から提供される情報、株取引に関係のない一般ユーザによる様々な書き込み情報(口コミ)等が含まれる。
関連情報サーバ10は、株取引可能な各企業の企業名及び属する企業グループ名を企業テーブル16で管理する。また、関連情報サーバ10は、当該各企業についての株価情報を株価テーブル17で管理する。
関連情報サーバ10は、上述のように複数コンテンツが収集されると、これら収集されたコンテンツを解析することにより、各コンテンツに含まれる単語及び単語の組み合わせを抽出する。そして、各コンテンツに含まれる各単語の出現確率値、各単語の各組み合わせの共起確率値が文書(ファイル)毎にそれぞれ集計される。関連情報サーバ10は、抽出された単語の組み合わせのうち企業名(銘柄名)を含む組み合わせを抽出し、抽出された各組み合わせの関連度を重み値としてそれぞれ算出する。企業名とそれと共にコンテンツに含まれていた単語(関連語)との組み合わせの共起確率値に対する、企業名の出現確率と当該関連語の出現確率との割合がその組み合わせの重み値として算出される。関連情報サーバ10は、企業名と関連語との各組み合わせについてそれぞれそのように算出された重み値を関連語テーブル18で管理する。
評判情報サーバ30は、関連情報サーバ10と同様に収集されたコンテンツのうちの関連語テーブル18で管理される関連語(又は企業名を示す単語)を含むコンテンツから得られる情報に基づいて、そのコンテンツの提供元及びそのコンテンツの更新日(生成日)毎に、企業名を示す単語及び関連語に関する情報を各企業(各銘柄)についてそれぞれ評判情報テーブル38で管理する。このとき、評判情報サーバ30は、各企業(各銘柄)についての、企業名を示す単語及び関連語についての評価値をそれぞれ算出する。評価値は、関連情報サーバ10で算出された、各企業(各銘柄)についての、各企業名を示す単語及び関連語の重み値に、その各単語の印象を示す値(ネガティブ−1、又は、ポジティブ+1)を乗算した値に設定される。即ち、評価値は、企業名と関連語(企業名を示す単語を含む)との関連度の高さとその企業名を示す単語又は関連語の印象とが掛け合わされた情報となる。このように算出された評価値はその組み合わせに対応付けられて評判情報テーブル38で管理される。
評判情報サーバ30は、このように取得される提供元及び更新日毎の企業名を示す単語及び関連語についてその企業の株価への影響度を見るために、その単語が公開された日(更新日)から所定期間(T日)後までのその企業の株価変動を取得する。これにより、評判情報テーブル38の株価変動フィールドは、企業名を示す単語又は関連語の更新日から所定閾値(T日)後に順次更新される。図12は、企業名を示す単語又は関連語が取得されてから予測株価が得られるまでの処理イメージを示す概念図である。
予測サーバ50は、評判情報テーブル38における更新日が所定閾値(T日)前に設定されているレコードに含まれる情報を用いて、或る提供元から提供された文書(コンテンツ)に或る企業についての言及(企業名を示す単語又は関連語)が存在した場合の株価への影響具合を各提供元の各企業に対する予測係数としてそれぞれ算出する。この予測係数は、各提供元についてのT日前の各企業に対する言及に関する評価値とその言及に応じたT日前から現在までの株価変動値とから算出され、予測係数テーブル58により管理される。
予測サーバ50は、当日から所定閾値(T日)後までの間の株価を予測する。図12に
は、当日(現在)の株価を予測する場合の概念が示されている。予測サーバ50は、当日の株価を予測する場合、評判情報テーブル38における更新日が上記所定閾値(T日)前の日に設定されているレコードを取得する。予測サーバ50は、このレコードに含まれる評価値とそのレコードと提供元及び企業名が同じ予測係数テーブル58のレコードの予測係数とを用いてその企業の株価を予測する。
は、当日(現在)の株価を予測する場合の概念が示されている。予測サーバ50は、当日の株価を予測する場合、評判情報テーブル38における更新日が上記所定閾値(T日)前の日に設定されているレコードを取得する。予測サーバ50は、このレコードに含まれる評価値とそのレコードと提供元及び企業名が同じ予測係数テーブル58のレコードの予測係数とを用いてその企業の株価を予測する。
このように本実施形態における株価予測システム8では、株価予測に関する直接的、専門的な記述のみでなく、企業の業績及び商品、スキャンダルなどの間接的な情報、更に、株取引とは直接には関係しない一般ユーザの口コミ情報などの周辺情報が用いられることにより、株価が予測される。
これにより、本実施形態によれば、テクニカル分析やファンダメンタル分析で利用されるような専門的な情報のみでなく、評判、ブランドイメージ、トレンド等のような広範な情報を反映させた株価予測を実現することができる。
更に、本実施形態では、広範な情報を扱うにあたり、株価の値動きに影響度の高い情報を提供する提供元とそうでない提供元とが企業毎及び企業グループ毎にそれぞれ管理され、影響度の高い情報を提供する提供元からの情報をより大きく株価に反映するように株価が予測される。
これにより、本実施形態によれば、広範で適切な情報を使った株価予測が行われるため、予測精度を高めることができる。
また、本実施形態では、株価の値動きに全く逆の効果を奏する提供元(予測係数が負に大きい提供元)をも特定し、この情報も予測株価に反映させることができる。更に、各情報と株価の値動きとの関係において偶然性を省いた株価予測を行うため、予測精度を高めることができる。
〔フロントサーバ9から提供される情報〕
フロントサーバ9は、予測サーバ50の予測株価テーブル56の内容を投資ユーザ端末3に提供するようにしてもよい。予測株価テーブル56には、各企業(銘柄)についての予測株価や、実際の株価と予測株価との差分が格納されている。よって、フロントサーバ9は、当該差分が正に大きい、即ち、最も高利益が期待できる企業情報を投資ユーザ端末3に提供するようにしてもよい。また、フロントサーバ9は、投資ユーザが既に購入している株式情報を保持し、この株式購入済み企業についての予測株価と実際の株価との差分が負に所定量大きくなった場合に、その旨の通知を投資ユーザ端末3に送るようにしてもよい。
フロントサーバ9は、予測サーバ50の予測株価テーブル56の内容を投資ユーザ端末3に提供するようにしてもよい。予測株価テーブル56には、各企業(銘柄)についての予測株価や、実際の株価と予測株価との差分が格納されている。よって、フロントサーバ9は、当該差分が正に大きい、即ち、最も高利益が期待できる企業情報を投資ユーザ端末3に提供するようにしてもよい。また、フロントサーバ9は、投資ユーザが既に購入している株式情報を保持し、この株式購入済み企業についての予測株価と実際の株価との差分が負に所定量大きくなった場合に、その旨の通知を投資ユーザ端末3に送るようにしてもよい。
また、フロントサーバ9は、予測された株価のみでなく、予測係数テーブル58の内容を投資ユーザ端末3に提供するようにしてもよい。この内容には、各提供元の各企業及び各企業グループに対する予測係数がそれぞれ含まれる。この予測係数は、上述したように、或る提供元から提供された文書に或る企業についての言及が存在した場合の株価への影響具合を示す。よって、予測係数テーブル58の内容を提供される投資ユーザは、或る企業の株価に大きく影響する文書を提供する提供元を特定することができる。具体的には、投資ユーザは、或る企業に対する予測係数が正又は負に大きい提供元を特定すればよい。
これにより、投資ユーザは、このように特定された提供元からの或る企業への言及の存在をチェックすることで、株価変動を自身で予測することが可能となる。例えば、企業cに対する予測係数が正に大きい提供元aからのその企業cに対するポジティブな言及があった場合には、その企業cの株価が増加する可能性が高くなる。逆に、企業cに対する予
測係数が負に大きい提供元aからのその企業cに対するポジティブな言及があった場合には、その企業cの株価が減少する可能性が高くなる。つまり、予測係数テーブル58の内容を提供することにより、投資ユーザは、所望の企業の株価に影響を大きく与える提供元を発見することができるようになる。
測係数が負に大きい提供元aからのその企業cに対するポジティブな言及があった場合には、その企業cの株価が減少する可能性が高くなる。つまり、予測係数テーブル58の内容を提供することにより、投資ユーザは、所望の企業の株価に影響を大きく与える提供元を発見することができるようになる。
〔変形例〕
上述の実施形態では、株価を予測するための数4で示される式において、評判情報テーブル38における更新日が上記所定閾値(T日)前に設定されているレコードScが用い
られていた。即ち、予測日(当日)からT日前に或る提供元から提供された或る企業に対する言及の評価値と、この評価値とその言及に応じた株価変動(T日前から予測日までの間の株価変動)との関係から求められた予測係数と、が用いられることにより、株価予測が行われた。しかしながら、本実施形態はこのようにT日前の1日分のレコードのみを対象とすることに限定されるものではなく、T日前までの1週間分、1か月分、半年分、1年分等といった或る程度の日数分のレコードScを対象として株価予測するようにしても
よい。
上述の実施形態では、株価を予測するための数4で示される式において、評判情報テーブル38における更新日が上記所定閾値(T日)前に設定されているレコードScが用い
られていた。即ち、予測日(当日)からT日前に或る提供元から提供された或る企業に対する言及の評価値と、この評価値とその言及に応じた株価変動(T日前から予測日までの間の株価変動)との関係から求められた予測係数と、が用いられることにより、株価予測が行われた。しかしながら、本実施形態はこのようにT日前の1日分のレコードのみを対象とすることに限定されるものではなく、T日前までの1週間分、1か月分、半年分、1年分等といった或る程度の日数分のレコードScを対象として株価予測するようにしても
よい。
また、上述の実施形態で用いられる所定閾値(T日)は、シミュレーション等により決定される固定値とされてもよいし、本実施形態における株価予測システム8の管理者等に変更可能な値とされてもよい。この所定閾値は、予測係数を決める上で何日前の情報(提供元からの言及)を用いるかに関わるが、このような情報は株価に長期的に影響する場合もあれば短期的に影響する場合もある。そこで、それぞれ期間の異なる複数の閾値を設け、各閾値を用いてそれぞれ予測係数を算出し、これらの予測係数を組み合わせて株価予測を行うようにしてもよい。
ところで、上述の実施形態では、予測係数の算出時及び株価予測時には、評判情報テーブル38に所定閾値(T日)前のレコードが存在することを前提として説明されていた。ところが、新規に上場した企業等の場合には、評判情報テーブル38に対象レコードが存在しない場合がある。このような企業に対する予測係数は0に設定され、予測される株価は実際の株価に設定されるようにしてもよい。
また、そのような企業に対する予測係数はヌル(NULL)に設定されてもよい。予測係数がNULLに設定されている企業の株価を予測する場合には、その企業が属する企業グループに関するレコードを評判情報テーブル38から取得して上記数4の式に用いるようにしてもよい。この場合、上記Scは、評判情報テーブル38から取得された企業グル
ープcのレコードの集合を示す。
ープcのレコードの集合を示す。
また、株価予測部63は、評判情報テーブル38及び予測係数テーブル58における所望の提供元のみに関するレコードに絞って、株価予測を行うようにしてもよい。この場合には、評判情報テーブル38における所望の提供元に関するレコードのみによりレコード集合Scを生成するようにすればよい。このようにすれば、所望の提供元の言及のみを用
いた株価予測をすることができる。
いた株価予測をすることができる。
1 ネットワーク
3 投資ユーザ端末
5 コンテンツサーバ
8 株価予測システム
9 フロントサーバ
10 関連情報サーバ
11、31、51 通信部
13、33、53 記憶部
16 企業テーブル
17 株価テーブル
18 関連語テーブル
20、40、60 制御部
21、41 データ管理部
22、42 記事収集部
23、43 解析部
24、44 単語処理部
25 重み算出部
30 評判情報サーバ
38 評判情報テーブル
45 評価値算出部
46 株価変動算出部
50 予測サーバ
62 予測係数算出部
63 株価予測部
56 予測株価テーブル
58 予測係数テーブル
3 投資ユーザ端末
5 コンテンツサーバ
8 株価予測システム
9 フロントサーバ
10 関連情報サーバ
11、31、51 通信部
13、33、53 記憶部
16 企業テーブル
17 株価テーブル
18 関連語テーブル
20、40、60 制御部
21、41 データ管理部
22、42 記事収集部
23、43 解析部
24、44 単語処理部
25 重み算出部
30 評判情報サーバ
38 評判情報テーブル
45 評価値算出部
46 株価変動算出部
50 予測サーバ
62 予測係数算出部
63 株価予測部
56 予測株価テーブル
58 予測係数テーブル
Claims (5)
- ネットワーク上に提供される様々なコンテンツを収集する収集手段と、
前記収集された各コンテンツに含まれる単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出する抽出手段と、
前記抽出された単語及び単語の組み合わせ並びにコンテンツ数に応じて、株式銘柄を示す企業名と、この企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体と、の関連性の高さを示す関連度を、各企業名に対する各関連語又は各企業名についてそれぞれ取得する関連度取得手段と、
前記関連度取得手段により取得された関連度と前記企業名又は前記関連語の印象を示す値とが反映される評価値を各企業名又は各企業名に対する各関連語についてそれぞれ算出する算出手段と、
前記企業名又は前記関連語を含むコンテンツが前記ネットワーク上に提供されてから所定期間後の株価変動値を取得し、この株価変動値と、その企業名又はその関連語に対応する評価値と、を用いて、そのコンテンツ提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出する係数算出手段と、
前記企業名に関する、前記係数算出手段で算出された予測係数と前記算出手段で算出された評価値とを用いて、前記企業名で示される株式銘柄の株価を予測する予測手段と、
を備えることを特徴とする株価予測装置。 - 前記関連度取得手段は、前記企業名のコンテンツ単位での出現確率及び前記関連語のコンテンツ単位での出現確率に対する、前記企業名と前記関連語との組み合わせのコンテンツ単位での共起確率の割合が反映された値を、前記企業名と前記関連語との組み合わせの関連度として算出する、
ことを特徴とする請求項1に記載の株価予測装置。 - 前記係数算出手段は、前記株価変動値と前記評価値との乗算値を、同一コンテンツ提供元からのコンテンツに記載された前記企業名及びその企業名に対する関連語の数で平均を取った値と、その企業名及びその企業名に対する関連語の数に応じて決まる重み値と、を用いて、そのコンテンツ提供元の前記企業名に対する予測係数を算出する、
ことを特徴とする請求項1又は2に記載の株価予測装置。 - コンピュータが、
ネットワーク上に提供される様々なコンテンツを収集するステップと、
前記収集された各コンテンツに含まれる単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出するステップと、
前記抽出された単語及び単語の組み合わせ並びにコンテンツ数に応じて、株式銘柄を示す企業名と、この企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体と、の関連性の高さを示す関連度を、各企業名の各関連語又は各企業名についてそれぞれ取得するステップと、
前記取得された関連度と前記企業名又は前記関連語の印象を示す値とが反映される評価値を各企業名又は各企業名に対する各関連語についてそれぞれ算出するステップと、
前記企業名又は前記関連語を含むコンテンツが前記ネットワーク上に提供されてから所定期間後の株価変動値を取得するステップと、
前記取得された株価変動値と、その株価変動の対象となる企業名又はその関連語に対応する評価値と、を用いて、前記コンテンツの提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出するステップと、
前記企業名に関する、前記算出された予測係数と評価値とを用いて、前記企業名で示される株式銘柄の株価を予測するステップと、
を実行することを特徴とする株価予測方法。 - コンピュータに、
ネットワーク上に提供される様々なコンテンツを収集するステップと、
前記収集された各コンテンツに含まれる単語及び同一コンテンツに含まれる少なくとも2つの単語の組み合わせを各コンテンツからそれぞれ抽出するステップと、
前記抽出された単語及び単語の組み合わせ並びにコンテンツ数に応じて、株式銘柄を示す企業名と、この企業名との単語の組み合わせにおける他方の単語である関連語又はその企業名自体と、の関連性の高さを示す関連度を、各企業名の各関連語又は各企業名についてそれぞれ取得するステップと、
前記取得された関連度と前記企業名又は前記関連語の印象を示す値とが反映される評価値を各企業名又は各企業名に対する各関連語についてそれぞれ算出するステップと、
前記企業名又は前記関連語を含むコンテンツが前記ネットワーク上に提供されてから所定期間後の株価変動値を取得するステップと、
前記取得された株価変動値と、その株価変動の対象となる企業名又はその関連語に対応する評価値と、を用いて、前記コンテンツの提供元のその企業名で示される株式銘柄に対する株価への影響度を予測係数として算出するステップと、
前記企業名に関する、前記算出された予測係数と評価値とを用いて、前記企業名で示される株式銘柄の株価を予測するステップと、
を実行させることを特徴とする株価予測プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010003167A JP2011141833A (ja) | 2010-01-08 | 2010-01-08 | 株価予測装置、方法及びプログラム |
CN 201020216683 CN201720105U (zh) | 2010-01-08 | 2010-05-28 | 粉碎转子及使用该粉碎转子的粉碎机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010003167A JP2011141833A (ja) | 2010-01-08 | 2010-01-08 | 株価予測装置、方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011141833A true JP2011141833A (ja) | 2011-07-21 |
Family
ID=43488381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010003167A Pending JP2011141833A (ja) | 2010-01-08 | 2010-01-08 | 株価予測装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2011141833A (ja) |
CN (1) | CN201720105U (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013179346A1 (ja) * | 2012-05-31 | 2013-12-05 | 株式会社 東芝 | 知見抽出装置、知見更新装置、及びプログラム |
KR101511709B1 (ko) | 2013-12-26 | 2015-04-13 | 주식회사 코스콤 | 소셜 데이터의 분석을 통한 종합주가 관련지수 예측 방법 및 이를 적용한 종합주가 관련지수 예측 시스템 |
KR101531970B1 (ko) * | 2013-12-26 | 2015-06-26 | 주식회사 코스콤 | 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 주가 예측 방법 및 이를 적용한 주가 예측 시스템 |
JP5960887B1 (ja) * | 2015-07-02 | 2016-08-02 | ヤフー株式会社 | 算出装置、算出方法及び算出プログラム |
JP2016197332A (ja) * | 2015-04-03 | 2016-11-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 情報処理システム、情報処理方法、およびコンピュータプログラム |
JP2017016652A (ja) * | 2016-06-23 | 2017-01-19 | ヤフー株式会社 | 算出装置、算出方法及び算出プログラム |
JP2017054554A (ja) * | 2016-12-20 | 2017-03-16 | ヤフー株式会社 | 算出装置、算出方法及び算出プログラム |
KR20180066726A (ko) * | 2016-12-09 | 2018-06-19 | 동국대학교 산학협력단 | 주가 예측 장치 및 방법 |
CN110390408A (zh) * | 2018-04-16 | 2019-10-29 | 北京京东尚科信息技术有限公司 | 交易对象预测方法和装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103599831A (zh) * | 2013-10-18 | 2014-02-26 | 苏州韩博厨房电器科技有限公司 | 一种二次研磨机构 |
CN107552204B (zh) * | 2017-09-28 | 2024-04-30 | 天津西敦粉漆科技有限公司 | 一种空气分级磨粉碎装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09305656A (ja) * | 1996-05-08 | 1997-11-28 | Roehm Properties Bv | 相場取引機能付き端末装置 |
JP2003162639A (ja) * | 2001-11-28 | 2003-06-06 | Fujitsu Ltd | 銘柄選択支援装置 |
JP2004252971A (ja) * | 2003-01-30 | 2004-09-09 | Daiwa Securities Group Inc | 企業情報提供システム、方法及びプログラム、クライアントシステムの制御方法 |
JP2005100221A (ja) * | 2003-09-26 | 2005-04-14 | Nomura Research Institute Ltd | 投資判断支援情報提供装置および方法 |
-
2010
- 2010-01-08 JP JP2010003167A patent/JP2011141833A/ja active Pending
- 2010-05-28 CN CN 201020216683 patent/CN201720105U/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09305656A (ja) * | 1996-05-08 | 1997-11-28 | Roehm Properties Bv | 相場取引機能付き端末装置 |
JP2003162639A (ja) * | 2001-11-28 | 2003-06-06 | Fujitsu Ltd | 銘柄選択支援装置 |
JP2004252971A (ja) * | 2003-01-30 | 2004-09-09 | Daiwa Securities Group Inc | 企業情報提供システム、方法及びプログラム、クライアントシステムの制御方法 |
JP2005100221A (ja) * | 2003-09-26 | 2005-04-14 | Nomura Research Institute Ltd | 投資判断支援情報提供装置および方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103582881B (zh) * | 2012-05-31 | 2017-05-03 | 株式会社东芝 | 见解抽出装置、见解更新装置及程序 |
CN103582881A (zh) * | 2012-05-31 | 2014-02-12 | 株式会社东芝 | 见解抽出装置、见解更新装置及程序 |
JP5559352B2 (ja) * | 2012-05-31 | 2014-07-23 | 株式会社東芝 | 知見抽出装置、知見更新装置、及びプログラム |
EP2857985A4 (en) * | 2012-05-31 | 2016-08-03 | Toshiba Kk | KNOWLEDGE EXTRACTION DEVICE, KNOWLEDGE UPGRADING DEVICE AND PROGRAM |
WO2013179346A1 (ja) * | 2012-05-31 | 2013-12-05 | 株式会社 東芝 | 知見抽出装置、知見更新装置、及びプログラム |
US10002122B2 (en) | 2012-05-31 | 2018-06-19 | Kabushiki Kaisha Toshiba | Forming knowledge information based on a predetermined threshold of a concept and a predetermined threshold of a target word extracted from a document |
KR101511709B1 (ko) | 2013-12-26 | 2015-04-13 | 주식회사 코스콤 | 소셜 데이터의 분석을 통한 종합주가 관련지수 예측 방법 및 이를 적용한 종합주가 관련지수 예측 시스템 |
KR101531970B1 (ko) * | 2013-12-26 | 2015-06-26 | 주식회사 코스콤 | 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 주가 예측 방법 및 이를 적용한 주가 예측 시스템 |
JP2016197332A (ja) * | 2015-04-03 | 2016-11-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 情報処理システム、情報処理方法、およびコンピュータプログラム |
JP5960887B1 (ja) * | 2015-07-02 | 2016-08-02 | ヤフー株式会社 | 算出装置、算出方法及び算出プログラム |
JP2017016652A (ja) * | 2016-06-23 | 2017-01-19 | ヤフー株式会社 | 算出装置、算出方法及び算出プログラム |
KR20180066726A (ko) * | 2016-12-09 | 2018-06-19 | 동국대학교 산학협력단 | 주가 예측 장치 및 방법 |
KR101949794B1 (ko) * | 2016-12-09 | 2019-02-19 | 동국대학교 산학협력단 | 주가 예측 장치 및 방법 |
JP2017054554A (ja) * | 2016-12-20 | 2017-03-16 | ヤフー株式会社 | 算出装置、算出方法及び算出プログラム |
CN110390408A (zh) * | 2018-04-16 | 2019-10-29 | 北京京东尚科信息技术有限公司 | 交易对象预测方法和装置 |
CN110390408B (zh) * | 2018-04-16 | 2024-03-05 | 北京京东尚科信息技术有限公司 | 交易对象预测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN201720105U (zh) | 2011-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011141833A (ja) | 株価予測装置、方法及びプログラム | |
CA2992563C (en) | Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system | |
TWI601088B (zh) | Topic management network public opinion evaluation management system and method | |
US9576251B2 (en) | Method and system for processing web activity data | |
CN104834731B (zh) | 一种自媒体信息的推荐方法及装置 | |
JP5960887B1 (ja) | 算出装置、算出方法及び算出プログラム | |
Yin et al. | A straw shows which way the wind blows: ranking potentially popular items from early votes | |
JP2011520193A (ja) | 最もクリックされた次オブジェクトを有する検索結果 | |
CN104254851A (zh) | 用于向用户推荐内容的方法和系统 | |
JP2013069279A (ja) | 情報の管理及びネットワーク化 | |
WO2013073377A1 (ja) | 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム | |
JP2013125468A (ja) | 広告配信装置 | |
EP1738524A1 (en) | Method and system for generating a population representative of a set of users of a communication network | |
JP5507622B2 (ja) | 広告課金額決定装置、広告課金額決定方法およびプログラム | |
JP2019212345A (ja) | インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体 | |
Hiron et al. | Species contributions to single biodiversity values under-estimate whole community contribution to a wider range of values to society | |
Yin et al. | Measuring pair-wise social influence in microblog | |
US20110029377A1 (en) | System and method for forecasting an inventory of online advertisement impressions by sampling in a map-reduce framework | |
Kaiser et al. | Magazine “companion websites” and the demand for newsstand sales and subscriptions | |
US20160034915A1 (en) | Document performance indicators based on referral context | |
US10394804B1 (en) | Method and system for increasing internet traffic to a question and answer customer support system | |
Ozgun et al. | Saved by the news? COVID-19 in German news and its relationship with regional mobility behaviour | |
KR20120136503A (ko) | 광고 시스템 및 광고 성과 평가 방법 | |
JP2017167829A (ja) | 検出装置、検出方法及び検出プログラム | |
Karpagam et al. | Scientific measures and tools for research literature output |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140114 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140603 |