JP6247775B2 - 時系列予測装置、及び時系列予測方法 - Google Patents

時系列予測装置、及び時系列予測方法 Download PDF

Info

Publication number
JP6247775B2
JP6247775B2 JP2016554971A JP2016554971A JP6247775B2 JP 6247775 B2 JP6247775 B2 JP 6247775B2 JP 2016554971 A JP2016554971 A JP 2016554971A JP 2016554971 A JP2016554971 A JP 2016554971A JP 6247775 B2 JP6247775 B2 JP 6247775B2
Authority
JP
Japan
Prior art keywords
time
time series
prediction
data
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016554971A
Other languages
English (en)
Other versions
JPWO2016063341A1 (ja
Inventor
裕 早矢仕
裕 早矢仕
直史 冨田
直史 冨田
石黒 正雄
正雄 石黒
和重 廣井
和重 廣井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2016063341A1 publication Critical patent/JPWO2016063341A1/ja
Application granted granted Critical
Publication of JP6247775B2 publication Critical patent/JP6247775B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、時系列予測装置、及び時系列予測方法に関する。
特許文献1には「第1のデータ収集手段は、予め定められた期間内の時系列テキストデータを取得する。第1の評価値算出手段は、時系列テキストデータに基づいて対象毎に時系列順の評価値を算出する。第2のデータ収集手段は、予め定められた期間内の時系列数値データを取得する。変化率算出手段は、時系列数値データに基づいて対象毎に時系列順の変化率を算出する。第3のデータ収集手段は、予め定められた期間後のテキスト情報を収集する。第2の評価値算出手段は、収集されたテキスト情報に基づいて対象毎に評価値を算出する。注目度算出手段は、対象毎に算出された時系列順の評価値、時系列順の変化率および評価値を用いて対象毎の注目度を算出する。提示手段は、対象毎の注目度を提示する。」と記載されている。
特開2012−79227号公報
近年、政府統計、ニュース記事、SNS(Social Networking Service)での発言等、社会動向に関する多様な時系列データが公開されており、これらの時系列データを活用して、社会動向に関する事象の時間的な推移を予測する技術が提案されている。こうした技術に基づいて社会動向を予測し、その結果をマーケティング等の事業企画の立案に活用することで、社会動向の変化に合致した収益性の高い事業を立ち上げることが可能となる。
社会動向に関する事象の推移予測は、例えば、社会動向に関する多様な時系列データを入力として、予測対象とする事象に関する時系列データの推移を予測することにより実現できる。例えば、「外国人の増加」という事象の推移を予測するには、政府統計、ニュース記事、SNSにおける発言といった「外国人の増加」に関する時系列データを用いて「外国人の人数」の推移を予測する予測モデルを構築すればよい。尚、社会動向の変化を予測対象とする際は、複数の事象が相互に関連して社会動向の変化が発生していることから、予測対象とする事象に関する時系列データの推移を高い精度で予測するには、事象間の因果関係を考慮することが重要である。
ここで特許文献1に開示されている技術では、事象間の因果関係を一定とみなし、過去に得られたデータに基づき予測モデルを構築している。そのため、予測モデルを構築した後に事象間の因果関係が変化した場合は予測精度が低下してしまう。
本発明は、事象間の因果関係の推移を踏まえて、高い精度で事象の推移を予測することが可能な、時系列予測装置、及び時系列予測方法を提供することを目的とする。
上記目的を達成するための本発明のうちの一つは、事象に関する時系列データの推移を予測する情報処理装置であって、予測対象である事象を含む複数の事象の夫々に関連する時系列データ、及び前記事象間の因果関係に関連する時系列データに基づき、前記事象間の因果関係の強さを示す指標である関連度を算出する関連度算出部と、前記関連度に基づき、前記事象に関連する時系列データの推移を予測する推移予測部と、を備えることとする。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄、及び図面により明らかにされる。
本発明によれば、事象間の因果関係の推移を踏まえて、高い精度で事象の推移を予測することができる。
因果関係を有する複数の事象の一例である。 時系列予測装置10のハードウェア構成を示す図である。 時系列予測装置10が備える機能(ソフトウェア構成)及び管理するデータを説明するデータフロー図である。 因果関係データ121の一例である。 時系列テキストデータ1221の一例である。 時系列数値データ1222の一例である。 時系列データ収集処理S700を説明するフローチャートである。 関連度データ123の一例である。 関連度算出処理S900を説明するフローチャートである。 第1特徴量算出処理S902を説明するフローチャートである。 第1特徴量の算出に用いる式の一例である。 第2特徴量算出処理S903を説明するフローチャートである。 推移指標データ124の一例である。 推移予測処理S1400を説明するフローチャートである。 推移指標を用いて構築される予測モデルの一例である。 時系列データ122を用いて構築される予測モデルの一例である。 関連度に基づき予測結果を統合する式の一例である。 予測結果表示処理S1800を説明するフローチャートである。 設定画面1900の一例である。 予測結果表示画面2000の一例である。
以下、一実施形態について図面とともに詳述する。
以下に説明する時系列予測装置は、予測対象である事象を含む複数の事象の夫々に関連する時系列データ、及び事象間の因果関係に関連する時系列データを収集し、収集した時系列データを用いて事象間の因果関係の強さを示す指標である関連度を算出する。そして時系列予測装置は、算出した関連度に基づき事象間の因果関係の影響を考慮しつつ、予測対象となる事象に関連する時系列データの推移を予測する。
図1に因果関係を有する複数の事象の一例を示している。同図において、「景気」、「収入」、「安心感」の文言が記載された各円は、個々の事象に対応したノード2(node)を表しており、また各ノード2を結ぶエッジ3(edge:辺)は事象間の因果関係を表わしている。時系列予測装置は、これらの事象や因果関係に関連する時系列データをインターネットから収集し、収集した時系列データを用い、事象間の因果関係の強さを関連度として算出する。例えば、図1において、予測対象である事象(子ノード)が「安心感」である場合、時系列予測装置は、例えば、SNS(Social Networking Service)データ、ニュースデータ、平均個人収入、収入額が生活に及ぼす影響度といった時系列データをインターネットから収集し、親ノードである「収入」との間の因果関係の強さを事象間の関連度として算出する。
時系列予測装置は、上記関連度を、例えば、事象間の因果関係に関連する時系列データにおける、事象に関連する用語(キーワード)の共起頻度(共起:collocation)を用いて算出する。また時系列予測装置は、上記推移予測を、例えば、上記予測対象である事象と因果関係を有する事象に関連する時系列データに基づき、予測対象である事象に関連する時系列データの推移を予測するための複数の予測モデルを構築し、算出した関連度に応じて各予測モデルに重み付けして予測モデルの夫々の予測結果を統合することにより行う。
このように、時系列予測装置は、事象間の因果関係の推移(例えば、消費税増税等の要因に伴う因果関係の変化)を関連度の推移として捉え、関連度を用いて時系列データの推移を予測するので、例えば、社会動向に関する時系列データの推移を高い精度で予測することができる。そしてこのようにして得られた予測の結果を例えばマーケティング等の事業企画の立案に活用することで、社会動向の変化に合致した収益性の高い事業の立ち上げに役立てることができる。
図2に時系列予測装置のハードウェア構成を示している。時系列予測装置10は、情報処理装置(コンピュータ)であり、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、及び通信装置16を備える。これらはバス等の通信手段を介して通信可能に接続されている。
プロセッサ11は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)を用いて構成されている。主記憶装置12は、プログラムやデータを記憶する装置であり、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、NVRAM(Non Volatile RAM)等である。補助記憶装置13は、ハードディスクドライブ、SSD(Solid State Drive)、光学式記憶装置等である。補助記憶装置13に格納されているプログラムやデータは、随時、主記憶装置12にロードされる。
入力装置14は、ユーザから情報や指示の入力を受け付けるユーザインタフェースであり、例えば、キーボード、マウス、タッチパネル等である。出力装置15は、ユーザに情報を提供するユーザインタフェースであり、例えば、グラフィックカード、液晶モニタ等である。通信装置16は、インターネット50を介して他の装置と通信する通信インタフェースであり、例えば、NIC(Network Interface Card)や無線LANインタフェースである。
図3は時系列予測装置10が備える機能(ソフトウェア構成)及び管理するデータを説明するデータフロー図である。同図に示すように、時系列予測装置10は、時系列データ収集部111、関連度算出部112、推移予測部113、及び予測結果表示部114の各機能を備える。これらの機能は、プロセッサ11が、主記憶装置12に格納されているプログラムを読み出して実行することにより実現される。
また同図に示すように、時系列予測装置10は、因果関係データ121、時系列データ122(時系列テキストデータ1221、時系列数値データ1222)、関連度データ123、及び推移指標データ124を記憶している。これらのデータは、例えば、時系列予測装置10において機能するDBMS(DataBase Management System)によって管理される。
同図に示す機能のうち、時系列データ収集部111は、事象及び事象間の因果関係に関するデータである因果関係データ121を参照し、インターネット50を介して時系列テキストデータ1221及び時系列数値データ1222を収集する。尚、因果関係データ121は、例えば、時系列予測装置10のユーザ等によって予め作成される。
図4に因果関係データ121の一例を示している。同図に示すように、因果関係データ121は、事象に関する情報であるノード情報データ301と、事象間の因果関係に関する情報である因果関係情報データ302とを含む。
同図において、ノード情報データ301のノードID303は、個々の事象(ノード)を区別する識別子(以下、ノードIDと称する。)である。ノード名304は、当該事象の名称である。関連キーワード305は、当該事象に関連する用語の集合である。ノード関連データ名306は、当該事象に関連するデータ(以下、ノード関連データと称する。)の名称である。ノード関連データ種類307は、当該ノード関連データの種類である。ノード関連データ取得先308は、当該ノード関連データの取得先を示す情報である。尚、ノード関連データ種類307は、例えば「数値データ」や「テキストデータ」である。ノード関連データ取得先308は、例えば、ノード関連データがアップロードされているURL(Uniform Resource Locator)を示す「http://○○○.jp」や、ノード関連データを取得するためのAPI(Application Programming Interface)を示す「API △△△」である。
同図において、因果関係情報データ302の因果関係ID309は、個々の因果関係を区別する識別子である。親ノードID310は、当該因果関係を構成する2つの事象(ノード)のうち親ノードのIDであり、子ノードID311は、当該因果関係を構成する2つの事象(ノード)のうち子ノードのIDである。因果関係関連データ名312は、当該因果関係に関連するデータ(以下、因果関係関連データと称する。)の名称である。因果関係関連データ種類313は、当該因果関係関連データの種類である。因果関係関連データ取得先314は、当該因果関係関連データの取得先を示す情報である。
図5に時系列データ収集部111が収集する時系列テキストデータ1221の一例を示している。同図におけるデータ名401は、ノード情報データ301のノード関連データ名306、もしくは因果関係情報データ302の因果関係関連データ名312に対応している。同図には、データ名401が夫々「SNSデータ」及び「ニュースデータ」である、2つの時系列テキストデータ1221を例示している。関連ノードID402は、当該時系列テキストデータ1221に関連する事象のノードID303である。関連因果関係ID403は、当該時系列テキストデータ1221に関連する因果関係情報データ302の因果関係ID309である。テキストデータ本体404は、時系列テキストデータ1221の本体であり、時間4041及びテキスト4042の各項目を有する。例えば、時系列テキストデータ1221がマイクロブログである場合、時間4041はマイクロブログに記事が投稿された時間(日時)であり、テキスト4042はマイクロブログの記事の本文である。
図6に時系列データ収集部111が生成する時系列数値データ1222の一例を示している。尚、時系列数値データ1222を構成する要素のうち、図5と同じ符号を付した要素については図5と同様であるので重複した説明を省略する。同図にはデータ名401が夫々「平均個人収入」及び「収入額が生活に及ぼす影響度」である2つの時系列数値データ1222を例示している。数値データ本体501は、時系列数値データ1222の本体であり、時間5011及び数値5012の各項目を有する。例えば、データ名401が「平均個人収入」の時系列数値データ1222の時間5011は、情報(例えば、平均年収額)を取得した年度であり、数値5012は取得した情報(例えば、平均年収額)である。
図7は、図3に示した時系列データ収集部111が行う処理(以下、時系列データ収集処理S700と称する。)を説明するフローチャートである。以下、同図とともに時系列データ収集処理S700について説明する。
まず時系列データ収集部111は、因果関係データ121から、ノード情報データ301のノード(ノードID303で特定されるレコード)の一つ、もしくは因果関係情報データ302の因果関係(因果関係ID309で特定されるレコード)の一つを選択する(S701)。
続いて、時系列データ収集部111は、インターネット50を介して、S701で選択したノードのノード関連データ取得先308もしくはS701で選択した因果関係の因果関係関連データ取得先314にアクセスし、時系列データ122を取得する(S702)。
続いて、時系列データ収集部111は、S701で選択したノードのノード関連データ種類307、もしくはS701で選択した因果関係の因果関係関連データ種類313が、数値データであるか否かを判定する(S703)。S701で選択したノード関連データ種類307、もしくはS701で選択した因果関係関連データ種類313が数値データである場合(S703:Y)、時系列データ収集部111は、S702で取得した時系列データ122を時系列数値データ1222として記憶する(S704)。S701で選択したノード関連データ種類307、もしくはS701で選択した因果関係関連データ種類313が数値データでない場合(S703:N)、時系列データ収集部111は、S702で取得した時系列データ122を時系列テキストデータ1221として記憶する(S705)。
時系列データ収集部111は、以上の処理を繰り返すことにより、選択したノードもしくは因果関係に関連する全てのデータを取得する(S706)。
また時系列データ収集部111は、因果関係データ121の全てのレコード(全てのノード及び全ての因果関係)についての処理が完了するまで以上の処理を繰り返す(S707)。
図3に戻り説明を続ける。関連度算出部112は、因果関係データ121、並びに時系列データ122(時系列テキストデータ1221、時系列数値データ1222)を参照しつつ、ノード間の因果関係の強さを表すデータである関連度データ123を生成する。
図8に関連度データ123の一例を示している。関連度データ123の関連因果関係ID701は、因果関係データ121の因果関係情報データ302の因果関係ID309に対応している。関連度データ本体702は、時間7021及び関連度7022の各項目を有する。時間7021は、関連度7022に対応した時間であり、関連度7022は、各時間7021における因果関係の強さを示す指標(関連度)である。
図9は、関連度算出部112が行う処理(以下、関連度算出処理S900と称する。)を説明するフローチャートである。以下、同図とともに関連度算出処理S900について説明する。
関連度算出部112は、まず因果関係情報データ302の因果関係(ノードID303で特定されるレコード)を一つ選択する(S901)。
続いて、関連度算出部112は、選択した因果関係に関連する時系列テキストデータ1221及び選択した因果関係に関連するノード情報データ301を用いて、因果関係の強さを示す指標である第1特徴量を算出する(S902)。
図10は、第1特徴量を算出する処理(以下、第1特徴量算出処理S902と称する。)を説明するフローチャートである。以下、同図とともに第1特徴量算出処理S902について説明する。
まず関連度算出部112は、時系列テキストデータ1221の関連因果関係ID403を参照し、S901で選択した因果関係に関連する時系列テキストデータ1221を取得する(S1001)。例えば、S901で図4に示す因果関係ID309が「#A」である因果関係を選択した場合、関連度算出部112は、時系列テキストデータ1221から関連因果関係ID403に「#A」を含む時系列テキストデータ1221(図5ではデータ名401が「SNSデータ」の時系列テキストデータ1221)を取得する。
続いて、関連度算出部112は、因果関係の親ノード及び子ノードの関連キーワードを取得する(S1002)。例えば、S901で図4に示す因果関係ID309が「#A」である因果関係を選択した場合、親ノードID310は「#1」、子ノードID311は「#2」であるので、関連度算出部112は、ノード情報データ301から、親ノードの関連キーワード305として「収入、給与」を、子ノードの関連キーワード305として「将来、安心」を取得する。
続いて、関連度算出部112は、予め定められた方法により、因果関係の強さを示す指標である第1特徴量を算出する(S1003)。
図11に第1特徴量の算出に用いる式の一例を示す。関連度算出部112は、取得した時系列テキストデータ1221における一定期間での親ノードの関連キーワード305と子ノードの関連キーワード305の共起頻度に基づき第1特徴量を算出する。尚、共起頻度の算出に用いる分析期間は、例えば、時系列予測装置10のユーザが、後述する設定画面1900を介して指定する。関連度の算出に際し、関連度算出部112は、現在時刻から分析単位だけ過去に遡った分の時系列テキストデータ1221を用いる。例えば、現在時間が「2014年3月30日」であり、分析単位の指定が「30日」である場合、関連度算出部112は「2014年3月1日」〜「2014年3月30日」の期間の時系列テキストデータ1221を用いて関連度を算出する。
図11における値cは、例えば、図4に示す因果関係ID309が「#A」の因果関係を対象とした場合、過去30日間において、親ノードの関連キーワード305である「収入、給与」のいずれかを含み、かつ、子ノードの関連キーワード305である「将来、安心」のいずれかを含む時系列テキストデータ1221の件数となる。また図11の算出式における値nは、過去30日間における、子ノードの関連キーワード305である「将来、安心」のいずれかを含む時系列テキストデータ1221の件数となる。図11の算出式における値bは、関連度が「0」となることを防ぐためのスムージングパラメータであり、例えば、時系列予測装置10の利用者が予め設定する。
例えば、現在の時間が「2014年3月30日」、分析単位が「30日」、スムージングパラメータの値bが「0.01」、時系列データが図5のデータ名401が「SNSデータ」、「2014年3月1日」〜「2014年3月30日」の期間においてキーワード「収入、給与」のいずれかを含み、かつ「将来、安心」のいずれかを含むデータ件数が40件、キーワード「将来、安心」のいずれかを含むデータ件数が100件である場合、図4に示す因果関係ID309が「#A」である因果関係における第1特徴量は(40/100)+0.01=0.41と求められる。
尚、S901で選択した因果関係に関連する時系列テキストデータ1221が存在しない場合、関連度算出部112は、第1特徴量を、例えば、b(スムージングパラメータ)とする。また対象とする因果関係に関連する時系列テキストデータ1221が複数存在する場合、関連度算出部112は、例えば、図11の式により時系列テキストデータ1221毎に特徴量を求め、全ての時系列テキストデータ1221について求めた特徴量の平均値を第1特徴量とする。また関連度算出部112が、時系列テキストデータ1221毎に異なる重みを設定し、図11で示す式により求めた時系列テキストデータ1221毎の特徴量に重み付けをして求めた平均値を第1特徴量とするようにしてもよい。
図9に戻り、続いて関連度算出部112は、因果関係に関連する時系列数値データ1222を用いて因果関係の強さを示す指標である第2特徴量を求める(S903)。
図12は第2特徴量を算出する処理(以下、第2特徴量算出処理S903と称する。)を説明するフローチャートである。以下、同図とともに第2特徴量算出処理S903について説明する。
まず関連度算出部112は、時系列数値データ1222における関連因果関係ID403を参照し、因果関係に関連する時系列数値データ1222を取得する(S1201)。例えば、S901で図4に示す因果関係ID309が「#A」である因果関係を選択した場合、図6に示す時系列数値データ1222から、関連因果関係ID403に「#A」を含む時系列数値データ1222である「収入額が生活に及ぼす影響度」を取得する。
続いて、関連度算出部112は、第2特徴量を求める(S1202)。第2特徴量は、例えば、時系列数値データ1222の過去1年間における数値の平均を、予め定められた値で除すことにより求める。例えば、現在時間が「2014年4月1日」であり、S901において図4の因果関係ID309が「#A」である因果関係を選択した場合、図6に示す「収入額が生活に及ぼす影響度」のうち、2013年の数値5012である「39」を予め定めた値である「100」で除した値である「0.39」を第2特徴量として求める。
尚、S901で選択した因果関係に関連する時系列数値データ1222が存在しない場合、関連度算出部112は、第2特徴量を、例えば「0」とする。またS901で因果関係に関連する時系列数値データ1222が複数選択される場合、関連度算出部112は、例えば、時系列数値データ1222毎に特徴量を算出し、全データの平均値を第2特徴量とする。また関連度算出部112が、時系列数値データ1222毎に異なる重みを設定し、時系列数値データ1222毎に算出した特徴量に重み付けをして求めた平均値を第2特徴量とするようにしてもよい。
図9に戻り、続いて関連度算出部112は、以上のようにして求めた第1特徴量及び第2特徴量を用いて関連度を算出する(S904)。関連度算出部112は、例えば、第1特徴量と第2特徴量の平均値を関連度とする。例えば、S901で図4に示す因果関係ID309が「#A」である因果関係を選択した場合、第1特徴量は「0.41」、第2特徴量は「0.39」となり、関連度算出部112は、(0.41+0.39)/2=0.40を関連度とする。
以上の処理を関連度算出部112が各因果関係について繰り返し行うことで、因果関係データ121に含まれる全ての因果関係について関連度を算出する(S905)。
再び図3に戻り説明を続ける。推移予測部113は、因果関係データ121、関連度データ123、及び推移指標データ124に格納されているデータを用いて事象の推移に関する指標である推移指標の推移を予測し、予測結果として推移指標データ124を生成する。
図13に推移指標データ124の一例を示している。推移指標データ124のノードID1201は、推移指標本体1203に対応する因果関係データ121のノードID303に対応している。推移指標名1202は、推移指標の名称である。推移指標本体1203は、推移指標の本体であり、時間12031及び指標値12032の各項目を有し、時間ごとの推移指標の大きさを示す。
図14は、推移予測部113が行う処理(以下、推移予測処理S1400と称する。)を説明するフローチャートである。以下、同図とともに推移予測処理S1400について説明する。
推移予測部113は、まず推移指標の予測順序を決定する(S1401)。推移予測部113は、例えば、時系列予測装置10のユーザが予め設定した予測順序を読み込むことにより推移指標の予測順序を決定する。例えば、図1の事象の例では、推移予測部113は、予測順序を、「景気」→「収入」→「安心感」などとする。
続いて、推移予測部113は、S1401で決定した予測順序に従って推移指標を一つ選択する(S1402)。
続いて、推移予測部113は、選択した推移指標のノードID1201を取得し、親ノードのノードIDのリストを作成する(S1403)。親ノードのノードIDのリストの作成は、因果関係情報データ302から、子ノードID311がノードID1201である因果関係の親ノードID310を取得することにより行う。例えば、S1402において、図13の推移指標データ124における「将来に対する安心度」を推移指標した選択されている場合、推移予測部113は、図4の因果関係情報データ302のうち、推移指標データ124のノードID1201「#2」を子ノードID311に含む、因果関係ID309が「#A」の因果関係の親ノードID310「#1」を取得し、これを親ノードのノードIDリストに登録する。
続いて、推移予測部113は、S1403で取得した親ノードの推移指標を用いて、S1402で選択した推移指標の推移予測に用いる予測モデルを構築する(S1404)。尚、親ノードに対応する推移指標が複数存在する場合には、1つの親ノードに対応する推移指標と、S1402で選択した推移指標との予測モデルを複数構築する。
図15に推移指標を用いて構築される予測モデルの一例を示す。例えば、S1402において図13に示す推移指標のうち「将来に対する安心度」を選択した場合、推移予測部113は、ノードID310が「#1」であるノードに対応する推移指標である「平均個人収入」を用いて「将来に対する安心度」を予測するモデルを構築する。
図14に戻り、続いて、推移予測部113は、S1402において選択した推移指標に対応するノードに関連する時系列データを用い、S1402において選択した推移指標の推移を予測する予測モデルを構築する(S1405)。まず推移予測部113は、図5に示す時系列テキストデータ1221及び図6に示す時系列数値データ1222の関連ノードID402を参照し、S1402において選択した推移指標に対応するノードに関連する時系列データ122を取得する。そして推移予測部113は、取得した時系列データ122を用いて、1402において選択した推移指標の推移を予測する予測モデルを構築する。
図16に時系列データ122を用いて構築される予測モデルの一例を示す。例えば、S1402において図13に示す推移指標のうち「将来に対する安心度」を選択した場合、推移予測部113は、ノードID402が「#2」である、図5の「SNSデータ」を取得する。ここで「SNSデータ」は時系列テキストデータ1221であるので、推移予測部113は、「SNSデータ」において、分析単位である「30日」の間隔で、ノードの関連キーワード305である「将来、安心」のいずれかを含むデータの件数を集計することにより予測モデルを構築する。
図14に戻り、続いて推移予測部113は、ノード間の関連度を用いて各予測モデルの予測結果に重み付けを行って複数の予測結果を統合する(S1406)。ここで重み付けはノード間の関連度が大きいほど重みが大きくなるように行う。これにより関連度が大きい親ノードに基づく予測結果が重視されるように予測が行われる。具体的には、例えば、推移予測部113は、図17に示す式に基づき、S1404及びS1405において算出した予測モデルによる予測結果について予測結果を統合する。
推移予測部113は、以上の操作を全てのノードに対して行うことで、各ノードに対する推移指標の推移を予測する(S1407)。
図2に戻り説明を続ける。同図に示す予測結果表示部114は、ユーザから分析のための設定情報を受け付ける。そして予測結果表示部114は、受け付けた設定情報と、因果関係データ121、関連度データ123、及び推移指標データ124とに基づき、前述した関連度算出処理S900及び推移予測処理S1400を起動し、その結果を表示する画面を生成して結果を出力装置15に表示する。
図18は予測結果表示部114が行う処理(以下、予測結果表示処理S1800と称する。)を説明するフローチャートである。以下、同図とともに予測結果表示処理S1800について説明する。
予測結果表示部114は、まず図19に示す設定画面1900を表示してユーザから設定情報を受け付ける(S1801)。ユーザは設定画面1900の分析単位1902にデータの分析単位(30日等)を指定する。またユーザは分析期間1903に分析に用いるデータの期間を指定する。またユーザは因果関係データ名1904に分析に用いる因果関係データ121の名称を指定する。
図18に戻り、続いて、予測結果表示部114は、S1801で受け付けた設定情報に基づき、関連度算出部112による関連度算出処理S900、及び推移予測部113による推移予測処理S1400を起動する(S1802)。
続いて、予測結果表示部114は、推移予測処理S1400の結果を記載した画面(以下、予測結果表示画面2000と称する。)を生成して表示する。
図20に予測結果表示画面2000の一例を示す。同図に示すように、予測結果表示画面2000は、予測結果表示領域2002及び因果関係関連情報表示領域2003を有する。
予測結果表示部114は、因果関係データ121及び関連度データ123を参照し、因果関係の構造を表現したグラフを生成する。例えば、同図に示すように、予測結果表示部114は、ノード情報データ301及び因果関係情報データ302に基づき、ノード2004〜2006及び有向辺2007〜2008からなるグラフを予測結果表示領域2002に表示する。
また予測結果表示部114は、関連度データ123の関連度データ本体702を予測結果表示領域2002に関連度推移グラフ2009として表示する。同図に示すように、予測結果表示部114は、関連因果関係ID701に基づき、有向辺2007,2008と関連度推移グラフ2009とを対応付けて表示する。尚、有向辺2007,2008は、関連度の大きさに応じて線の太さを変更する等、関連度に応じて表示態様を変えるようにしてもよい。また符号2012で示すように関連度に大きな変化があった場合に変化点を強調表示(丸で囲む等)するようにしてもよい。
このように時系列予測装置10のユーザは、予測結果表示領域2002の表示内容から、事象間の因果関係の強さが時間とともにどのように変化しているかを容易に把握することができる。同図に示す例では、ユーザは、「収入」から「安心感」への関連度が増加しており「安心感」に対して「収入」が与える影響が大きくなっていることを容易に把握することができる。
図18に戻り、続いて予測結果表示部114は、推移指標データ1202の推移指標名1202及び推移指標本体1203を参照し、推移指標の推移の予測を表すグラフ(以下、推移予測グラフと称する。)を生成して表示する(S1804)。例えば、図20に示すように、予測結果表示部114は、推移指標名1202及び推移指標本体1203を推移予測グラフ2010として表示する。これによりユーザは事象の推移を直感的に把握することができる。
予測結果表示部114は、因果関係の一つを対象として、指定された時間における因果関係に関する情報を因果関係関連情報表示領域2003に表示する(S1805)。ユーザは、情報の表示対象とする因果関係及び時間を、因果関係関連情報表示領域2003の因果関係指定欄2013に指定することができる。尚、関連度推移グラフ2009の変化点2012をユーザが選択することにより、変化点2012に対応する因果関係及び時間が自動的に情報の表示対象となるようにしてもよい。
予測結果表示部114は、指定された時間において、親ノードの関連キーワード305及び子ノードの関連キーワード305の双方を含む時系列データ122を抽出し、抽出した時系列データ122に含まれている用語を因果関係関連語表示部2014に出現頻度の降順に表示する。これによりユーザは、関連度の大きさが時間とともに変化している場合、表示されている用語を参照することで因果関係の変化の原因についての知見を得ることができる。例えば、図20の例では、関連度推移グラフ2009から、親ノードの「収入」と子ノードの「安心感」との関連度が増加していることが把握できるが、因果関係関連語表示部2014に出現頻度の降順に、「消費税」、「制度」、「増加」といった用語が表示されていることから、ユーザは、消費税増加等の制度改正によって「収入」が「安心感」に与える影響が大きくなったことを知見することができる。
以上に説明したように、本実施形態の時系列予測装置10によれば、事象間の因果関係の推移を関連度の推移として捉え、関連度を用いて時系列データの推移を予測するので、例えば、社会動向に関する時系列データの推移を高い精度で予測することができる。そしてこのようにして得られた予測の結果は、例えば、マーケティング等の事業企画の立案に活用することで社会動向の変化に合致した収益性の高い事業の立ち上げに役立てることができる。
尚、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
上記の各構成、機能、処理部、処理手段等は、それらの一部または全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD等の記録装置や、ICカード、SDカード、DVD等の記録媒体に置くことができる。
制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
10 時系列予測装置、 50 インターネット、 111 時系列データ収集部、 112 関連度算出部、 113 推移予測部、 114 予測結果表示部、 121 因果関係データ、 1221 時系列テキストデータ、 1222 時系列数値データ、 123 関連度データ、 124 推移指標データ、 301 ノード情報データ、 302 因果関係情報データ、 S700 時系列データ収集処理、 S900 関連度算出処理、 S902 第1特徴量算出処理、 S903 第2特徴量算出処理、 S1400 推移予測処理、 S1800 予測結果表示処理、 1900 設定画面

Claims (14)

  1. 事象に関する時系列データの推移を予測する情報処理装置であって、
    予測対象である事象を含む複数の事象の夫々に関連する時系列データ、及び前記事象間の因果関係に関連する時系列データに基づき、前記事象間の因果関係の強さを示す指標である関連度を算出する関連度算出部と、
    前記関連度に基づき、前記事象に関連する時系列データの推移を予測する推移予測部と
    を備える時系列予測装置。
  2. 請求項1に記載の時系列予測装置であって、
    前記関連度算出部は、前記事象間の因果関係に関連する時系列データにおける、前記事象に関連する用語の共起頻度を用いて前記関連度を算出する
    時系列予測装置。
  3. 請求項1に記載の時系列予測装置であって、
    前記推移予測部は、前記予測対象である事象と因果関係を有する事象に関連する時系列データに基づき、前記予測対象である事象に関連する時系列データの推移を予測する複数の予測モデルを構築し、
    前記関連度に応じて前記各予測モデルに重み付けを行うことにより前記予測モデルの夫々の予測結果を統合する
    時系列予測装置。
  4. 請求項1乃至3のいずれか一項に記載の時系列予測装置であって、
    前記時系列データの時間推移を示すグラフを生成する
    時系列予測装置。
  5. 請求項4に記載の時系列予測装置であって、
    前記関連度の時間推移を示すグラフを生成する
    時系列予測装置。
  6. 請求項1乃至3のいずれか一項に記載の時系列予測装置であって、
    前記事象間の因果関係に関連する時系列データのうち、前記事象の夫々に関連する用語の双方を含んだ時系列データを抽出し、抽出した前記時系列データに含まれている用語の出現頻度を示す情報を生成する
    時系列予測装置。
  7. 請求項1に記載の時系列予測装置であって、
    予測対象である事象を含む複数の事象の夫々に関連する時系列データ、及び前記事象間の因果関係に関連する時系列データをインターネットを介して取得する時系列データ収集部をさらに備える
    時系列予測装置。
  8. 事象に関する時系列データの推移を予測する情報処理装置を用いて行われる時系列予測方法であって、
    情報処理装置が、
    予測対象である事象を含む複数の事象の夫々に関連する時系列データ、及び前記事象間の因果関係に関連する時系列データに基づき、前記事象間の因果関係の強さを示す指標である関連度を算出するステップと、
    前記関連度に基づき、前記事象に関連する時系列データの推移を予測するステップと
    を含む、時系列予測方法。
  9. 請求項8に記載の時系列予測方法であって、
    前記情報処理装置が、前記事象間の因果関係に関連する時系列データにおける、前記事象に関連する用語の共起頻度を用いて前記関連度を算出するステップを更に含む
    時系列予測方法。
  10. 請求項8に記載の時系列予測方法であって、
    前記情報処理装置が、
    前記予測対象である事象と因果関係を有する事象に関連する時系列データに基づき、前記予測対象である事象に関連する時系列データの推移を予測する複数の予測モデルを構築するステップと、
    前記関連度に応じて前記各予測モデルに重み付けを行うことにより前記予測モデルの夫々の予測結果を統合するステップと
    を更に含む、時系列予測方法。
  11. 請求項8乃至10のいずれか一項に記載の時系列予測方法であって、
    前記情報処理装置が、前記時系列データの時間推移を示すグラフを生成するステップを更に含む
    時系列予測方法。
  12. 請求項11に記載の時系列予測方法であって、
    前記情報処理装置が、前記関連度の時間推移を示すグラフを生成するステップを更に含む
    時系列予測方法。
  13. 請求項8乃至10のいずれか一項に記載の時系列予測方法であって、
    前記情報処理装置が、前記事象間の因果関係に関連する時系列データのうち、前記事象の夫々に関連する用語の双方を含んだ時系列データを抽出し、抽出した前記時系列データに含まれている用語の出現頻度を示す情報を生成するステップを更に含む
    時系列予測方法。
  14. 請求項8に記載の時系列予測方法であって、
    前記情報処理装置が、予測対象である事象を含む複数の事象の夫々に関連する時系列データ、及び前記事象間の因果関係に関連する時系列データをインターネットを介して取得するステップを更に含む
    時系列予測方法。
JP2016554971A 2014-10-21 2014-10-21 時系列予測装置、及び時系列予測方法 Active JP6247775B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/077916 WO2016063341A1 (ja) 2014-10-21 2014-10-21 時系列予測装置、及び時系列予測方法

Publications (2)

Publication Number Publication Date
JPWO2016063341A1 JPWO2016063341A1 (ja) 2017-05-18
JP6247775B2 true JP6247775B2 (ja) 2017-12-13

Family

ID=55760416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016554971A Active JP6247775B2 (ja) 2014-10-21 2014-10-21 時系列予測装置、及び時系列予測方法

Country Status (4)

Country Link
US (1) US20170300819A1 (ja)
JP (1) JP6247775B2 (ja)
CN (1) CN106796618A (ja)
WO (1) WO2016063341A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6735219B2 (ja) * 2016-12-05 2020-08-05 株式会社日立製作所 予測システム及び予測方法
CN109271488B (zh) * 2018-10-08 2021-08-27 广东工业大学 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
JP7304698B2 (ja) * 2019-01-08 2023-07-07 株式会社日立製作所 水需要予測方法およびシステム
JP7247021B2 (ja) * 2019-05-28 2023-03-28 株式会社日立製作所 情報処理装置、予測判別システム、および予測判別方法
JP7235329B2 (ja) * 2020-06-04 2023-03-08 株式会社xenodata lab. 経済指標推定システムおよびそのプログラム
JP7246736B2 (ja) * 2020-06-04 2023-03-28 株式会社xenodata lab. 指標推定システムおよびそのプログラム
CN112579866B (zh) * 2020-12-09 2023-06-20 成都中科大旗软件股份有限公司 一种基于时间热度指数分析事件发展趋势的方法
CN115495498B (zh) * 2022-09-23 2023-06-16 共青科技职业学院 数据关联方法、系统、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250085A (ja) * 1998-03-02 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 事象推移予測方法および事象推移予測プログラムを記録した記録媒体
JP2008234618A (ja) * 2007-02-23 2008-10-02 Oki Electric Ind Co Ltd 知識抽出装置、知識抽出方法およびコンピュータプログラム
JP2010122825A (ja) * 2008-11-18 2010-06-03 Osaka Prefecture Univ データ予測装置、データ予測方法、データ予測プログラム

Also Published As

Publication number Publication date
CN106796618A (zh) 2017-05-31
US20170300819A1 (en) 2017-10-19
WO2016063341A1 (ja) 2016-04-28
JPWO2016063341A1 (ja) 2017-05-18

Similar Documents

Publication Publication Date Title
JP6247775B2 (ja) 時系列予測装置、及び時系列予測方法
CN107918600B (zh) 报表开发系统及方法、存储介质和电子设备
US10643135B2 (en) Linkage prediction through similarity analysis
Arias et al. Forecasting with twitter data
US20140189536A1 (en) Social media impact assessment
Feldkamp et al. Knowledge discovery in manufacturing simulations
CN104572797A (zh) 基于主题模型的个性化服务推荐系统和方法
CN102456071A (zh) 文件管理装置以及文件管理方法
WO2014107441A2 (en) Social media impact assessment
JP2018055424A (ja) 推計モデル構築システム、推計モデル構築方法及びプログラム
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
Nochetto et al. Convergence rates for the classical, thin and fractional elliptic obstacle problems
JP2012103759A (ja) 図書館蔵書検索システム、レコメンド情報提供方法及びプログラム
Sarirah Husin et al. Process mining approach to analyze user navigation behavior of a news website
JP6285284B2 (ja) 意見活用支援装置、及び意見活用支援方法
Erbach-Schoenberg et al. A model of spatially constrained social network dynamics
Rouhani et al. What do we know about the big data researches? A systematic review from 2011 to 2017
CN103971191A (zh) 工作线程管理方法和设备
Mitchell Assessing the value of metadata in information services
Isken et al. Queueing inspired feature engineering to improve and simplify patient flow simulation metamodels
US20190163736A1 (en) Identifying attributes associated with an entity using natural language processing
JP6325132B2 (ja) データ収集装置、及びデータ収集方法
EP3500942A1 (en) Identifying attributes associated with an entity using natural language processing
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
Dunaiski Analysing ranking algorithms and publication trends on scholarly citation networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171117

R150 Certificate of patent or registration of utility model

Ref document number: 6247775

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150