JP6230725B2 - 因果関係分析装置、及び因果関係分析方法 - Google Patents
因果関係分析装置、及び因果関係分析方法 Download PDFInfo
- Publication number
- JP6230725B2 JP6230725B2 JP2016562150A JP2016562150A JP6230725B2 JP 6230725 B2 JP6230725 B2 JP 6230725B2 JP 2016562150 A JP2016562150 A JP 2016562150A JP 2016562150 A JP2016562150 A JP 2016562150A JP 6230725 B2 JP6230725 B2 JP 6230725B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- causal relationship
- series data
- nodes
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Description
本発明は、因果関係分析装置、及び因果関係分析方法に関する。
特許文献1には、「複数の事象間の因果関係を示す構造データと、因果関係のある任意の2つの事象間について当該任意の2つの事象間の因果関係の強さを示す情報を含む、時系列な第1の因果モデルと第2の因果モデルを生成し、第1の事象と因果関係のある各事象について、第1及び第2の因果モデル間で、第1の事象との因果関係の強さの変化量及び当該各事象の起こる確率の変化量を算出し、第1の事象と因果関係のある事象のうち因果関係の強さの変化量が予め定められた閾値以上である事象と第1の事象との因果関係の強さの変化、及び第1の事象と因果関係のある事象のうち確率の変化量が予め定められた閾値以上である事象の変化を、第1及び第2の因果モデル間での第1の事象の変化の要因として特定する。」と記載されている。
近年、データ分析技術の進展に伴い、政府が公開する統計情報等のオープンデータやニュース記事、SNS(Social Networking Service)の発言等を活用して複雑化する社会動向や業界動向や個人の価値観等の時系列な変化を分析し、マーケティング等への積極的な研究や活用が進められている。しかし社会動向や業界動向、個人の価値観は様々な要素が複雑に絡み合い変化するため、ある注目対象の要素の時系列データの変化に着目したとき、その変化の真の要因となる要素を見つけることは必ずしも容易でない。
時間の経過とともに変動するシステムの挙動に着目して時系列な変化の要因を分析する手法としてシステムダイナミクス(System Dynamics)が知られている。システムダイナミクスでは、システムの変動に影響を及ぼす要素(ノード)を特定し、そのノード間の因果関係をモデル化する。そして作成したモデルに基づきシミュレーションを実施することにより、時間経過に伴って変化するシステムの特性を分析する。
システムダイナミクスでは、ノード間の因果関係モデル化する際に因果ループ図を用いる。因果ループ図は、各ノードと因果関係を表す矢印で構成される。矢印には、一方が増加(または減少)すれば他方も増加(または減少)するという「正の相関」を表現するものと、一方が増加(または減少)すれば他方は減少(または増加)するという「負の相関」を表現するものがある。因果ループ図を用いることで、効果が現れるまでに時間が掛かるようなノードについても表現することができる。そのため、因果ループ図は時間経過に伴って変化する要素の特性をモデル化するのに適している。
ここで上記特許文献1では、第1の事象と因果関係のある事象のうち因果関係の強さの変化量が予め定められた閾値以上である事象と第1の事象との因果関係の強さの変化、及び第1の事象と因果関係のある事象のうち確率の変化量が予め定められた閾値以上である事象の変化を、第1及び第2の因果モデル間での第1の事象の変化の要因として特定している。
しかし特許文献1では、事象毎の時系列データの変化の時間差を考慮した分析を行っていないため、例えば、過去に事象Aで起こった変化が、現在の事象Bに及ぼす影響については分析することができない。また因果関係の強さの変化量が閾値以下である場合、変化量の符号が正(負)から負(正)に転じたときの変化については、その要因となるノードを検出することができない。また因果関係モデルを構成しているノード群がループを構成している場合、即ちある結果ノードの変化の要因を、その結果ノードと因果関係にあるノードを遡って(原因ノードを順に辿って)探索した際、上記結果ノードに回帰するような場合の取り扱いについて特許文献1ではとくに言及していない。
本発明はこのような背景に鑑みてなされたもので、システムダイナミクスを社会変動や業界動向、個人の価値観等の時系列な変化の要因分析に応用して因果関係モデルを作成し、因果関係モデルを構成するノードの時系列データの変化に対するノード間の影響を分析することが可能な、因果関係分析装置、及び因果関係分析方法を提供することを目的とする。
上記目的を達成するための本発明の因果関係分析装置は、因果関係モデルを構成するノードの時系列データの変化の要因を分析する情報処理装置であって、因果関係モデルを構成するノード間の因果関係を示すデータ、及び前記因果関係モデルを構成する各ノードの時系列データを記憶し、因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、前記ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、前記注目ノードの時系列データの変化に影響を与えたノードを特定する。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄、及び図面により明らかにされる。
本発明によれば、因果関係モデルを構成するノードの時系列データの変化に対するノード間の影響を分析することができる。
以下、実施形態について図面を参照しつつ詳細に説明する。
図1に一実施形態として説明する因果関係分析システム1の概略的な構成を示している。同図に示すように、因果関係分析システム1は、因果関係分析装置10及びサーバ装置20を含む。因果関係分析装置10とサーバ装置20は、通信ネットワーク5を介して通信可能に接続されている。通信ネットワーク5は、例えば、インターネットや専用回線等である。
サーバ装置20は、例えば、SNSサーバ(SNS:Social Network Service)、オープンデータサーバ、Webサーバ等であり、通信ネットワーク5を介してアクセスしてくる他の装置に対して情報(データ)を提供する。
因果関係分析装置10は、通信ネットワーク5を介してサーバ装置20にアクセスし、サーバ装置20から情報を取得する。因果関係分析装置10は、取得した情報を用い、システムダイナミクス(System Dynamics)を社会動向、業界動向、個人の価値観等の変化等の調査に応用して構築した因果関係モデル(因果ループ図(CLD:Causal Loop Diagram))について、上記因果関係モデルを構成するノードの時系列データの変化の要因を分析する。
因果関係分析装置10は、因果関係モデルを構成するノード間の因果関係を示すデータ、及び因果関係モデルを構成する各ノードの時系列データを記憶する。因果関係分析装置10は、上記時系列データを、例えば、通信ネットワーク5を介して取得される情報に基づき生成する。
因果関係分析装置10は、生成した時系列データを用い、因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、注目ノードの時系列データの変化に影響を与えたノードを特定する。より具体的には、例えば、因果関係分析装置10は、ノード間の因果関係を順に遡ることにより、より過去の時点に生じた変局点をその時系列データに有するノードとして最後に特定されたノードを、注目ノードの時系列データの変化に影響を与えたノードとして特定する。
尚、因果関係分析装置10は、上記特定に際し、ノード間の結びつきの強さを示す指標である関連度を適宜併用する。例えば、因果関係分析装置10は、最後に特定されたノードと注目ノードとの関連度が予め設定された強さ以上である場合に、最後に確認されたノードを注目ノードに影響を与えたノードとして特定する。
上記変局点は、例えば、(1)時系列データの変化率の傾きの符号が反転した点、(2)時系列データの変化率の傾きの絶対値が予め設定された閾値以上変化した点、(3)時系列データの変化率の傾きの符号が反転しかつ変化率の傾きの絶対値が予め設定された閾値以上変化した点等である。このような点を変局点とすることで、注目ノードの時系列データの変化に影響を与えたノードを精度よく特定することができる。
尚、因果関係分析装置10は、ノード間の因果関係を順に辿ることによりループが検出された場合、ループを構成しているノードの原因ノードである、ループを構成していない他のノードについても探索の対象に含める。このように因果関係分析装置10は、ループの存在を検出するとともに、ループ外に探索範囲を広げるので、注目ノードの時系列データの変化に影響を与えたノードを漏れなく確実に特定することができる。
図1に示すように、因果関係分析装置10は、プロセッサ101、記憶装置102、入力装置103、出力装置104、及び通信装置105を備えた情報処理装置(コンピュータ)によって実現される。プロセッサ101は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)を用いて構成されている。記憶装置102は、プログラムやデータを記憶する装置であり、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、NVRAM(Non Volatile RAM)、ハードディスクドライブ、SSD(Solid State Drive)、光学式記憶装置等である。入力装置103は、ユーザから情報や指示の入力を受け付けるユーザインタフェースであり、例えば、キーボード、マウス、タッチパネル等である。出力装置104は、ユーザに情報を提供するユーザインタフェースであり、例えば、グラフィックカード、液晶モニタ等である。通信装置105は、通信ネットワーク5を介して他の装置と通信する通信インタフェースであり、例えば、NIC(Network Interface Card)や無線LANインタフェースである。プロセッサ101、記憶装置102、入力装置103、出力装置104、及び通信装置105はバス等の通信手段を介して通信可能に接続されている。
図2は因果関係分析装置10が備える機能及び因果関係分析装置10が管理するデータを説明するデータフロー図である。因果関係分析装置10は、時系列データ生成部206、因果関係分析部207、及び分析結果出力部208の各機能を備える。これらの機能は、プロセッサ101が、記憶装置102に格納されているプログラムを読み出して実行することにより実現される。同図に示す各機能は、因果関係分析装置10の機能の理解を容易にするために便宜的に設定したものに過ぎず、各機能の分類の仕方や名称はここに示した態様に限定されない。これらの機能は、例えば、ハードウェア(ASIC(Application Specific Integrated Circuit)等)によって実現されるものであってもよい。また例えば、これらの機能の複数が一つのハードウェアによって実現される構成としてもよい。また例えば、これらの機能が複数のハードウェアによって分散もしくは協調して実現される構成としてもよい。
同図に示すように、因果関係分析装置10は、因果関係モデルデータ201、自然言語辞書202(類義語辞書や共起語辞書等)、ソーシャルメディアデータ203、オープンデータ204、及び時系列データ205を管理する。因果関係分析装置10は、これらのデータを、例えば、DBMS(DataBase Management System)が提供するデータベースのテーブルとして管理する。
因果関係モデルデータ201は、例えば、社会動向、業界動向、個人の価値観等の変化等に関して因果関係モデルで記述されたノード間の関係を表わすデータである。
図3に因果関係モデルデータ201によって表現される因果関係モデル(因果ループ図)の一例を示している。同図において、ノード301は、例えば、社会動向Aを構成するノードを示す。リンク302は、ノード間に因果関係があることを示しており、矢印の始点は「原因ノード」に接続し、矢印の終点は「結果ノード」に接続している。実線で示すリンク302は、当該リンク302が接続する始点のノードと終点のノードとの間に「正の相関」があることを示しており、点線で示すリンク302は、当該リンク302が接続する始点のノードと終点のノードとの間に「負の相関」があることを示している。
ループ303は、あるノードを起点としてノード間の因果関係を順に遡った(原因ノードを順に辿った)結果、上記起点ノードに戻る構造である。この例では、ノードAの原因ノードがノードDであり、ノードDの原因ノードがノードCであり、ノードCの原因ノードがノードBであり、ノードBの原因ノードがノードAであることから、ノードAを起点としてノードAに戻るループが形成されている。
図4に図3に示した因果関係モデル(因果ループ図)に対応する因果関係モデルデータ201を示している。同図に示すように、因果関係モデルデータ201は、ノードID401、ノード名称402、原因ノードID403、原因ノード間関係404、原因ノード間関連度405、結果ノードID406、結果ノード間関係407、及び結果ノード間関連度408の各項目を有する複数のレコードで構成されている。
このうちノードID401には、因果関係モデルを構成するノードの識別子(文字列、数値等)が設定される。またノード名称402には、ノードの名称を示す情報(文字列等)が設定され、例えば、ノードの内容を示す情報が設定される。
原因ノードID403には、ノードID401で特定されるノードを結果ノードとしたときに原因ノードに相当するノードのノードIDが設定される。原因ノード間関係404には、ノードID401で特定されるノードと、原因ノードID403で特定されるノードとの関係(「正の相関」又は「負の相関」)を示す情報が設定される。本実施形態では、ノードID401で特定されるノードと原因ノードID403で特定されるノードとの間に「正の相関」がある場合は「1」が、ノードID401で特定されるノードと原因ノードID403で特定されるノードとの間に「負の相関」がある場合は「0」が設定されるものとする。
原因ノード間関連度405には、ノードID401で特定されるノードと、原因ノードID403で特定されるノードとの結びつきの強さを示す指標である関連度(以下、原因ノード間関連度とも称する。)が設定される。因果関係分析部207は、例えば、ノードID401で特定されるノードに関連するソーシャルメディアデータ203(又はオープンデータ204)に含まれる用語(キーワード)と、原因ノードID403で特定されるノードに関連するソーシャルメディアデータ203(又はオープンデータ204)に含まれる用語(キーワード)との間の共起頻度に基づき関連度を求める。例えば、因果関係分析部207は、ノードID401を「ノードA」、原因ノードID403を「ノードD」としたとき、原因ノードID403の「キーワードa」及び「キーワードb」に合致するソーシャルメディアデータ203の件数を分母とし、また原因ノードID403の「キーワードa」「キーワードb」に加えて、更にノードID401の「キーワードd」を含むソーシャルメディアデータ203の件数を分子として求められる比率に基づき関連度を求める。尚、原因ノード間関連度は、ノードID401で特定されるノードの時系列データ205と原因ノードID403で特定されるノードの時系列データ205との相関から求めてもよい(その場合、時系列データ205に適宜、評価値の正規化や横軸の時間ずれの補正を施してもよい)。
結果ノードID406には、ノードID401で特定されるノードを原因ノードとしたときの結果ノードに相当するノードのノードIDが設定される。結果ノード間関係407には、ノードID401で特定されるノードと、結果ノードID406で特定されるノードと関係(「正の相関」又は「負の相関」)を示す情報が設定される。本実施形態では、ノードID401で特定されるノードと結果ノードID406で特定されるノードとの間に「正の相関」がある場合は「1」が、ノードID401で特定されるノードと結果ノードID406で特定されるノードとの間に「負の相関」がある場合は「0」が設定されるものとする。
結果ノード間関連度408には、ノードID401で特定されるノードと、結果ノードID406で特定されるノードとの結びつきの強さを示す指標である関連度(以下、結果ノード間関連度とも称する。)が設定される。因果関係分析部207は、例えば、前述した原因ノード間関連度と同様の方法により結果ノード間関連度を求める。尚、結果ノード間関連度は、ノードID401で特定されるノードの時系列データ205と結果ノードID406で特定されるノードの時系列データ205との相関から求めてもよい(その場合、時系列データ205に適宜、評価値の正規化や横軸の時間ずれの補正を施してもよい)。
図5にサーバ装置20から取得されるソーシャルメディアデータ203の一例を示す。同図に示すように、ソーシャルメディアデータ203は、発言者ID501、発言ID502、発言日時503、及び発言内容504の各項目を有する複数のレコードで構成される。尚、ソーシャルメディアデータ203は、例えば、ソーシャルネットワーキングサービス、ブログ、掲示板等によって提供されるデータである。
発言者ID501には、当該ソーシャルメディアデータ203の発言者を特定する情報(文字列、数値等)が設定され、例えば、ユーザ名が設定される。発言ID502には、各発言(レコード)を識別する情報(文字列、数値等)が設定される。発言日時503には、ソーシャルメディアにおいて当該レコードの発言が掲載(投稿)された日時を示す情報(文字列、数値等)が設定される。発言内容504には、ソーシャルメディアに掲載(投稿)された発言の内容を示す情報(文字列、数値等)が設定される。
図6にサーバ装置20から取得されるオープンデータ204の一例を示す。同図に示すように、オープンデータ204は、リストID601、タイトル602、及びリンク情報603の各項目を有する複数のレコードで構成されている。
オープンデータ204は、例えば、官公庁、公共機関、企業、研究機関が公開する公的な情報である。またオープンデータ204は、例えば、TVなどの媒体により公開され、ニュース、気象情報など公共性、信頼性の高い情報である。またオープンデータ204は、例えば、公開日時、公開元などの公開者の属性情報を含む。またオープンデータ204は、例えば、「誰が」、「何を」、「いつ」、「どこで」、「なぜ」、「どのように」等の情報を含む。またオープンデータ204は、例えば、俗語および意図的な誤入力・誤変換などを用いていない情報を含む。
リストID601には、オープンデータ204の各レコードの識別子(文字列、数値等)が設定される。タイトル602には、当該レコードのオープンデータ204のタイトルに相当する情報(文字列、数値等)が設定される。リンク情報603は、当該レコードのオープンデータ204の所在を示す情報(例えば、URL(Uniform Resource Locator)が設定される。
図7はソーシャルメディアデータ203又はオープンデータ204を用いて生成される時系列データ205の一例である。同図に示すように、時系列データ205は、ノードID701、ノード名称702、時間703、実データ704、及びネガポジ比率705の各項目を有する複数のレコードで構成される。
ノードID701には、ノードの識別子(文字列、数値等)が設定される。ノードID701に設定される識別子は、因果関係モデルデータ201のノードID401と共通である。ノード名称702には、ノードの名称を示す情報(文字列等)が設定され、例えば、ノードの具体的な内容を示す情報が設定される。ノード名称702に設定される情報は因果関係モデルデータ201のノード名称402と共通である。
時間703には、実データ704に対応する時間(例えば実データ704が発生した時間)を示す情報が設定される。時間703は、時系列データ205をグラフで表現した場合に横軸の情報として用いられる。時間703には、例えば、実データ704が取得された時間が設定される。同図では時間703に年次を設定した場合を示しているが、時間703には、例えば、月次や日付等を設定することもできる。時間703の期間や刻み幅はソーシャルメディアデータ203やオープンデータ204に含まれるデータをそのまま用いてもよいし、それらのデータをユーザ等が適宜加工してもよい。
実データ704には、時系列データ205の内容(大きさを示す数値等)が設定される。例えば、実データ704には、ソーシャルメディアデータ203やオープンデータ204に含まれている評価値や評価値を加工した値(比率等)が設定される。実データ704は、時系列データ205をグラフで表現した場合に縦軸の情報として用いられる。
ネガポジ比率705には、当該レコードに対応するソーシャルメディアデータ203全体における、当該レコードに対応するノードの内容(例えばノード名称702の内容)についてのネガティブ(否定的)な内容のソーシャルメディアデータ203の件数とポジティブ(肯定的)な内容のソーシャルメディアデータ203の件数との比率(以下、ネガポジ比率とも称する。)が設定される。尚、因果関係分析装置10は、ソーシャルメディアデータ203がノードの内容に対してネガティブな内容であるかポジティブな内容であるかを、例えば、ソーシャルメディアデータ203の内容、当該レコードのノードの内容、及び自然言語辞書202を対照することにより判定する。ネガポジ比率705は、時系列データ205をグラフで表現した場合に縦軸の情報として用いられる。
続いて、因果関係分析装置10が行う処理について説明する。尚、以下の説明において、符号の先頭に付している「S」の文字は処理ステップの略字である。
<時系列データ生成処理>
図8は、時系列データ生成部206が行う処理(以下、時系列データ生成処理S800と称する。)を説明するフローチャートである。以下、同図とともに時系列データ生成処理S800について説明する。時系列データ生成処理S800は随時実行される。
図8は、時系列データ生成部206が行う処理(以下、時系列データ生成処理S800と称する。)を説明するフローチャートである。以下、同図とともに時系列データ生成処理S800について説明する。時系列データ生成処理S800は随時実行される。
まず時系列データ生成部206は、因果関係モデルデータ201のノード(レコード、ノードID401)を一つ選択する(S801)。
続いて、時系列データ生成部206は、選択したノードのノード名称402に基づき、時系列データ205の生成に用いるキーワードを生成する。例えば、ノード名称402に「ノードA」という文字列が設定されていた場合、時系列データ生成部206は、当該文字列に基づき「キーワードa」、「キーワードb」を生成する。キーワードは、ノード名称402から抽出される単語をそのまま用いて生成してもよいし、ノード名称402から抽出される単語と自然言語辞書202とを対照することにより取得される類義語や共起語等を用いて生成してもよい(S802)。
続いて、時系列データ生成部206は、S802で生成したキーワードに合致するオープンデータ204が存在するか否かを判定する(S803)。生成したキーワードに合致するオープンデータ204が存在する場合には(S803:YES)、S804に進む。生成したキーワードに合致するオープンデータ204が存在しない場合には(S803:NO)、S805に進む。
S804では、時系列データ生成部206は、S802で生成したキーワードを用いてオープンデータ204を取得し、取得したオープンデータ204を用いて時系列データ205を生成する。その後はS806に進む。
一方、S805では、時系列データ生成部206は、S802で生成したキーワードを用いてソーシャルメディアデータ203を取得し、取得したソーシャルメディアデータ203を用いて時系列データ205を生成する。この場合、時系列データ205の縦軸となるデータは、実データ704としてもよいし、ネガポジ比率705としてもよい。その後はS806に進む。
S806では、時系列データ生成部206は、S801にて全てのノードを選択済か否かを判定する。全てのノードを選択済である場合(S806:YES)、時系列データ生成部206は時系列データ生成処理S800を終了する。未選択のノードが残存する場合(S806:NO)、時系列データ生成部206はS801で未選択のノードを一つ選択してS802からの処理を実行する。
以上の時系列データ生成処理S800が実行されることにより、ソーシャルメディアデータ203又はオープンデータ204に基づく時系列データ205が生成される。
<因果関係分析処理>
図9は因果関係分析部207が行う処理(以下、因果関係分析処理S900と称する。)を説明するフローチャートである。因果関係分析処理S900が実行されることにより、因果関係モデルにおける注目ノードの時系列データ205の変化に影響を与えたノード(以下、要因ノードとも称する。)を特定することができる。以下、同図とともに因果関係分析処理S900について説明する。因果関係分析処理S900は、時系列データ生成処理が実行された後に実行される。
図9は因果関係分析部207が行う処理(以下、因果関係分析処理S900と称する。)を説明するフローチャートである。因果関係分析処理S900が実行されることにより、因果関係モデルにおける注目ノードの時系列データ205の変化に影響を与えたノード(以下、要因ノードとも称する。)を特定することができる。以下、同図とともに因果関係分析処理S900について説明する。因果関係分析処理S900は、時系列データ生成処理が実行された後に実行される。
まず因果関係分析部207は、因果関係モデル(因果ループ図)の各ノード(因果関係モデルデータ201の各ノード(レコード、ノードID401))の関連度(原因ノード間関連度405、結果ノード間関連度408)を算出する(S901)。
続いて、因果関係分析部207は、因果関係モデル(因果ループ図)の各ノード(因果関係モデルデータ201の各ノード(レコード、ノードID401))について時系列データ205の変化率を算出する。例えば、因果関係分析部207は、前年度の評価値と今年度の評価値の差分に基づき、各年毎の時系列データ205の変化率を算出する(S902)。
続いて、因果関係分析部207は、因果関係モデル(因果ループ図)を構成している各ノードについて、その時系列データ205に変局点を有するノードが存在するか否かを判定する(S903)。そのようなノードが存在する場合(S903:YES)、因果関係分析部207は、S904からの処理を行う。一方、そのようなノードが存在しない場合(S903:NO)、因果関係分析部207は、因果関係分析処理S900を終了する。
S904では、因果関係分析部207は、その時系列データ205に変局点を有するノードの中から、注目ノードとするノードを一つ選択する(S904)。上記選択は、例えば、その時系列データ205に変局点を有するノードの中から、変局点の発生時点の前後で原因ノード間関係404又は結果ノード間関係407が崩れているノード(例えば、正の相関から負の相関に変化している、もしくはその逆の変化が生じているノード等)を選択することにより行う。また例えば、上記選択はユーザが行うようにしてもよい。
続いて、因果関係分析部207は、注目ノードの原因ノードの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有しているか否かを判定する(S905)。注目ノードの原因ノードの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有している場合(S905:YES)、処理はS906に進む。一方、注目ノードの原因ノードの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有していない場合(S905:NO)、処理はS907に進む。
S906では、因果関係分析部207は、S905の条件に合致したノード(その時系列データ205が注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有していると判定されたノード)を末端ノードとして設定する。尚、S905の条件に合致するノードが複数存在する場合、因果関係分析部207は、例えば、原因ノード間関連度405の値が最大の原因ノードを選択する。その後、処理はS908に進む。
S907では、因果関係分析部207は、末端ノード(S905で条件に合致するノードが存在しなかった場合は注目ノード。それ以外はS906で設定された末端ノード)を注目ノードの時系列データ205の変化に影響を与えたノード、即ち要因ノードと判定し、因果関係分析処理S900を終了する。尚、S907において、因果関係分析部207が末端ノードを検出したノードを要因ノードと判定する際、末端ノードと注目ノードとの関連度が予め設定された強さ以上であることも条件として末端ノードを要因ノードと判定するようにしてもよい。
S908では、因果関係分析部207は、因果関係モデルデータ201に基づき注目ノードを起点として因果関係のあるノードを順に遡る(原因ノードを順に辿る)ことにより注目ノードを含むループの有無を判定する。そして因果関係分析部207は、ループが検出された場合は、そのループ中に、その時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在するか否かを判定する。ループが存在し、かつ、そのループ中にその時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在する場合(S908:YES)、処理はS909に進む。
一方、ループが存在しないか、もしくは、その時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在しない場合(S908:NO)、処理はS907に進む。S907では、因果関係分析部207は、末端ノードを要因ノードと判定して処理を終了する。
S909では、因果関係分析部207は、S908で検出されたノードを末端ノードとして設定する。
S910では、因果関係分析部207は、S908で検出されたループを構成しているノードの因果関係を遡る(原因ノードを順に辿る)ことにより、S908で検出されたループに含まれるノードの原因ノード(ループ外のノード)でその時系列データ205に末端ノードの時系列データ205が生じた時刻t3よりも過去に生じた変局点を有するものが存在するか否かを判定する。そのようなノードが存在する場合(S910:YES)、処理はS911に進む。一方、そのようなノードが存在しない場合(S910:NO)、処理はS912に進む。
S911では、因果関係分析部207は、S910で検出したノードを要因ノードと判定し、因果関係分析処理S900を終了する。尚、S911において、因果関係分析部207がS910で検出したノードを要因ノードと判定する際、S910で検出したノードと注目ノードとの関連度が予め設定された強さ以上であることも条件として、S910で検出したノードを要因ノードと判定するようにしてもよい。
一方、S912では、因果関係分析部207は、S909で末端ノードとして設定したノードを要因ノードと判定し、因果関係分析処理S900を終了する。尚、S912において、因果関係分析部207が末端ノードを要因ノードと判定する際、末端ノードと注目ノードとの関連度が予め設定された強さ以上であることも条件として、末端ノードを要因ノードと判定するようにしてもよい。
以上に説明した因果関係分析処理S900によれば、注目ノードの時系列データ205に影響を与えた要因ノードを特定することができる。
尚、上記因果関係分析処理S900によっても要因ノードを特定することができない場合、例えば、因果関係分析部207が、注目ノードに関連する文字情報(例えば、ソーシャルメディアデータ203やオープンデータ204)を構成する用語から、注目ノードと因果関係を有するノードに関連する文字情報(例えば、ソーシャルメディアデータ203やオープンデータ204)を構成する用語を除去し、除去後の注目ノードに関連する文字情報のうち、注目ノードについてのキーワード(例えば注目ノードのノード名称702から生成されるキーワード)と共起する用語を出力するようにしてもよい。これによりユーザに要因ノードを特定するための手掛かりとなる情報を提供することができる。
<処理例>
続いて、因果関係モデルが図3の内容であり、S904にてノード名称402が「ノードA」のノードを注目ノードとして選択した場合について、因果関係分析処理S900の具体的な処理例を示す。
続いて、因果関係モデルが図3の内容であり、S904にてノード名称402が「ノードA」のノードを注目ノードとして選択した場合について、因果関係分析処理S900の具体的な処理例を示す。
まずS905において、因果関係分析部207は、注目ノード「ノードA」の原因ノードである「ノードD」又は「ノードG」を特定し、これらの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有しているか否かを判定する。ここでは、因果関係分析部207は、「ノードD」の時系列データ205が、時刻t1よりも過去に生じた変局点を有していると判定し(S905:YES)、S906において、因果関係分析部207は、「ノードD」を末端ノードに設定する。
続いて、S908において、因果関係分析部207は、注目ノードである「ノードA」を起点として因果関係のあるノードを順に遡ることにより「ノードA」を含むループ303を検出する。そして因果関係分析部207は、ループ303中に、その時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在するか否かを判定する。ここでは、因果関係分析部207は、その時系列データ205に時刻t2よりも過去の時刻t3に生じた変局点を有するノードである「ノードC」を検出するものとする。
S909では、因果関係分析部207は、S908で検出された「ノードC」を末端ノードとして設定する。
S910では、因果関係分析部207は、S908で検出されたループを構成するノードの因果関係を遡ることにより、S908で検出されたループに含まれるノードの原因ノード(ループ外のノード)で、その時系列データ205に末端ノードの時系列データ205が生じた時刻t3よりも過去に生じた変局点を有するものが存在するか否かを判定する。ここではそのようなノードは検出されないものとし、処理はS912に進む。
S912では、因果関係分析部207は、S909で末端ノードに設定された「ノードC」を要因ノードと判定する。
以上に説明したように、本実施形態の因果関係分析システム1によれば、因果関係モデルを構成するノードの時系列データ205の変化に対するノード間の影響を分析することができる。このため、例えば、過去に事象Aで起こった変化が、現在の事象Bに及ぼす影響を分析することができる。また因果関係分析装置10は、変局点が生じた時刻を判断基準としてノードを探索するので要因ノードを精度よく特定することができる。また因果関係分析装置10は、ループを考慮しつつ要因ノードを探索するので、要因ノードを漏れなく確実に探索することができる。
<画面例>
図10は分析結果出力部208が出力装置104に出力(表示)する画面(以下、分析結果表示画面1000と称する。)の一例である。同図に示すように、分析結果表示画面1000は、因果関係モデル表示欄1010、時系列データ(注目ノード)表示欄1020、及び時系列データ(検出ノード)表示欄1030を有している。また因果関係モデル表示欄1010には、変局点検出時期表示欄1011が設けられている。
図10は分析結果出力部208が出力装置104に出力(表示)する画面(以下、分析結果表示画面1000と称する。)の一例である。同図に示すように、分析結果表示画面1000は、因果関係モデル表示欄1010、時系列データ(注目ノード)表示欄1020、及び時系列データ(検出ノード)表示欄1030を有している。また因果関係モデル表示欄1010には、変局点検出時期表示欄1011が設けられている。
因果関係モデル表示欄1010には、分析対象とされた因果関係モデルの因果ループ図が表示される。また表示される因果ループ図には、注目ノードを強調して示す図案(同図では実線円の中に記号「!」が描かれた図案)、要因ノードを強調して示す図案(同図では実線円の中に記号「※」が描かれた図案)、及びその時系列データ205に変局点を有するノードを強調して示す図案(同図では破線円の中に記号「!」が描かれた図案)が表示される。また変局点検出時期表示欄1011には、注目ノードの時系列データ205の変局点が生じた時刻が表示される。
ユーザは、因果関係モデル表示欄1010を参照することにより、注目ノード及び要因ノードを容易に把握することができる。また因果関係モデル表示欄1010を参照することにより、その時系列データ205に変局点を有するノードを容易に把握することができ、ユーザは、注目ノードの候補となるノードを容易に把握することができる。またユーザは、変局点検出時期表示欄1011を参照することで、注目ノードの時系列データ205の変局点が生じた時刻(どの変局点を起点として要因ノードを探索しているのか)を容易に把握することができる。尚、因果関係モデル表示欄1010に表示されているノードをユーザがユーザインタフェースを操作して指定することにより分析対象とする注目ノードを指定できるようにしてもよい。
時系列データ(注目ノード)表示欄1020には、注目ノードに対応する時系列データ205の変局点が表示される。ユーザは、時系列データ(注目ノード)表示欄1020を参照することで、注目ノードの時系列データ205を容易に確認することができる。尚、因果関係モデル表示欄1010の表示内容との対応を容易にとることができるよう、時系列データ(注目ノード)表示欄1020には、注目ノードを強調する図案(同図では実線円の中に「!」が表示されている図案)が表示される。
時系列データ(検出ノード)表示欄1030には、注目ノードを起点として原因ノードを遡ることにより検出されたノードの時系列データ205並びに各時系列データ205において変局点が生じた時刻が表示される。また時系列データ(検出ノード)表示欄1030には、要因ノードとして特定されたノードの時系列データ205が強調表示される(同図では太枠線と強調図案(同図では実線円の中に記号「※」が描かれた図案によって強調されている。)。ユーザは、時系列データ(注目ノード)表示欄1020及び時系列データ(検出ノード)表示欄1030を参照することにより、注目ノードの時系列データ205と要因ノードの時系列データ205の関係を視覚的に把握することができる。
ところで、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
上記の各構成、機能、処理部、処理手段等は、それらの一部または全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサが夫々の機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD等の記録装置や、ICカード、SDカード、DVD等の記録媒体に置くことができる。
制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
1 因果関係分析システム、5 通信ネットワーク、10 因果関係分析装置、20 サーバ装置、101 プロセッサ、102 記憶装置、103 入力装置、104 出力装置、105 通信装置、201 因果関係モデルデータ、202 自然言語辞書、203 ソーシャルメディアデータ、204 オープンデータ、205 時系列データ、206 時系列データ生成部、207 因果関係分析部、208 分析結果出力部、S800 時系列データ生成処理、S900 因果関係分析処理、1000 分析結果表示画面、1010 因果関係モデル表示欄、1020 時系列データ(注目ノード)表示欄、1030 時系列データ(検出ノード)表示欄
Claims (15)
- 因果関係モデルを構成するノードの時系列データの変化の要因を分析する情報処理装置であって、
因果関係モデルを構成するノード間の因果関係を示すデータ、及び前記因果関係モデルを構成する各ノードの時系列データを記憶し、
因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、前記ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、前記注目ノードの時系列データの変化に影響を与えたノードを特定する
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記変局点は、時系列データの変化率の傾きの符号が反転した点、時系列データの変化率の傾きの絶対値が閾値以上変化した点、及び、時系列データの変化率の傾きの符号が反転しかつ前記変化率の傾きの絶対値が閾値以上変化した点、のうちの少なくともいずれかである
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記ノード間の因果関係を順に辿ることによりループが検出された場合、前記ループを構成しているノードの原因ノードである、前記ループを構成していない他のノードを前記探索の対象に含める
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記ノード間の因果関係を順に遡ることにより、より過去の時点に生じた変局点をその時系列データに有するノードとして最後に特定されたノードを、前記注目ノードの時系列データの変化に影響を与えたノードとして特定する
因果関係分析装置。 - 請求項4に記載の因果関係分析装置であって、
前記ノード間の結びつきの強さを示す指標である関連度を記憶し、
前記最後に特定されたノードと前記注目ノードとの前記関連度が予め設定された強さ以上である場合に、前記最後に特定されたノードを前記注目ノードに影響を与えたノードとして特定する
因果関係分析装置。 - 請求項5に記載の因果関係分析装置であって、
前記因果関係モデルを構成するノードに関連する文字情報を記憶し、
前記関連度を、前記最後に特定されたノードの前記文字情報に含まれる用語と、前記注目ノードの前記文字情報に含まれる用語との共起頻度に基づき求める
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記因果関係モデルを構成するノードに関連する文字情報を記憶し、
前記探索により前記注目ノードの時系列データの変化に影響を与えたノードを特定することができない場合、前記注目ノードに関連する文字情報を構成する用語から、前記注目ノードと因果関係を有するノードに関連する文字情報を構成する用語を除去し、前記除去後の前記注目ノードに関連する文字情報のうち前記注目ノードについてのキーワードと共起する用語を出力する
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記時系列データを、オープンデータ及びソーシャルメディアデータのうちの少なくともいずれかに基づき生成する
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記注目ノードの時系列データの変化に影響を与えたノードとして特定したノードを示す情報、前記注目ノードの前記時系列データの変化を示す情報、及び前記注目ノードの時系列データの変化に影響を与えたノードの前記前記時系列データの変化を示す情報、を含む画面を生成する
因果関係分析装置。 - 因果関係モデルを構成するノードの時系列データの変化の要因を分析する方法であって、
情報処理装置が、
因果関係モデルを構成するノード間の因果関係を示すデータ、及び前記因果関係モデルを構成する各ノードの時系列データを記憶するステップ、
因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、前記ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、前記注目ノードの時系列データの変化に影響を与えたノードを特定するステップ
を含む、因果関係分析方法。 - 請求項10に記載の因果関係分析方法であって、
前記変局点は、時系列データの変化率の傾きの符号が反転した点、時系列データの変化率の傾きの絶対値が閾値以上変化した点、及び、時系列データの変化率の傾きの符号が反転しかつ前記変化率の傾きの絶対値が閾値以上変化した点、のうちの少なくともいずれかである
因果関係分析方法。 - 請求項10に記載の因果関係分析方法であって、
前記情報処理装置は、前記ノード間の因果関係を順に辿ることによりループが検出された場合、前記ループを構成しているノードの原因ノードである、前記ループを構成していない他のノードを前記探索の対象に含める
因果関係分析方法。 - 請求項10に記載の因果関係分析方法であって、
前記情報処理装置は、前記ノード間の因果関係を順に遡ることにより、より過去の時点に生じた変局点をその時系列データに有するノードとして最後に特定されたノードを、前記注目ノードの時系列データの変化に影響を与えたノードとして特定する
因果関係分析方法。 - 請求項13に記載の因果関係分析方法であって、
前記情報処理装置が、
前記ノード間の結びつきの強さを示す指標である関連度を記憶するステップと、
前記最後に特定されたノードと前記注目ノードとの前記関連度が予め設定された強さ以上である場合に、前記最後に特定されたノードを前記注目ノードに影響を与えたノードとして特定するステップと
を更に含む、因果関係分析方法。 - 請求項14に記載の因果関係分析方法であって、
前記情報処理装置が、
前記因果関係モデルを構成するノードに関連する文字情報を記憶するステップと、
前記関連度を、前記最後に特定されたノードの前記文字情報に含まれる用語と、前記注目ノードの前記文字情報に含まれる用語との共起頻度に基づき求めるステップと
を更に含む、因果関係分析方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/082062 WO2016088230A1 (ja) | 2014-12-04 | 2014-12-04 | 因果関係分析装置、及び因果関係分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016088230A1 JPWO2016088230A1 (ja) | 2017-06-15 |
JP6230725B2 true JP6230725B2 (ja) | 2017-11-15 |
Family
ID=56091203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016562150A Expired - Fee Related JP6230725B2 (ja) | 2014-12-04 | 2014-12-04 | 因果関係分析装置、及び因果関係分析方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6230725B2 (ja) |
WO (1) | WO2016088230A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6511192B2 (ja) * | 2016-07-19 | 2019-05-15 | 株式会社日立製作所 | 議論支援システム、議論支援方法、及び議論支援プログラム |
JP7081155B2 (ja) * | 2018-01-04 | 2022-06-07 | 富士通株式会社 | 選択プログラム、選択方法、及び選択装置 |
JP6906477B2 (ja) * | 2018-05-22 | 2021-07-21 | 株式会社日立製作所 | データ処理装置およびデータ処理方法 |
JP7259874B2 (ja) * | 2019-02-06 | 2023-04-18 | 日本電気株式会社 | 情報可視化装置、情報可視化方法、及びプログラム |
US11544422B2 (en) * | 2019-09-16 | 2023-01-03 | Palo Alto Research Center Incorporated | Machine learning based systems and methods for real time, model based diagnosis |
JP2023178988A (ja) * | 2022-06-07 | 2023-12-19 | 株式会社日立製作所 | 因果処理装置、および、因果処理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001001206A2 (en) * | 1999-06-30 | 2001-01-04 | Strategic Simulation Systems, Inc. | System dynamics model builder and simulator |
JP2012113537A (ja) * | 2010-11-25 | 2012-06-14 | Hitachi Ltd | 潜在リスク抽出方法およびシステム |
US9355170B2 (en) * | 2012-11-27 | 2016-05-31 | Hewlett Packard Enterprise Development Lp | Causal topic miner |
-
2014
- 2014-12-04 WO PCT/JP2014/082062 patent/WO2016088230A1/ja active Application Filing
- 2014-12-04 JP JP2016562150A patent/JP6230725B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPWO2016088230A1 (ja) | 2017-06-15 |
WO2016088230A1 (ja) | 2016-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6230725B2 (ja) | 因果関係分析装置、及び因果関係分析方法 | |
Rathan et al. | Consumer insight mining: aspect based Twitter opinion mining of mobile phone reviews | |
US10546005B2 (en) | Perspective data analysis and management | |
US10891322B2 (en) | Automatic conversation creator for news | |
US10558754B2 (en) | Method and system for automating training of named entity recognition in natural language processing | |
US8370278B2 (en) | Ontological categorization of question concepts from document summaries | |
US9189565B2 (en) | Managing tag clouds | |
US20130263019A1 (en) | Analyzing social media | |
US10387568B1 (en) | Extracting keywords from a document | |
JP6404106B2 (ja) | コンテント及び関係距離に基づいて人々をつなげるコンピューティング装置及び方法 | |
US20210209500A1 (en) | Building a complementary model for aggregating topics from textual content | |
US20230076387A1 (en) | Systems and methods for providing a comment-centered news reader | |
US10073839B2 (en) | Electronically based thesaurus querying documents while leveraging context sensitivity | |
US20150269691A1 (en) | Legal reasoning graphs and usage thereof | |
CN107077640B (zh) | 经由经验归属来分析、资格化和摄取非结构化数据源的系统和处理 | |
US20170228378A1 (en) | Extracting topics from customer review search queries | |
US10614100B2 (en) | Semantic merge of arguments | |
US10042913B2 (en) | Perspective data analysis and management | |
JP6522446B2 (ja) | ラベル付与装置、方法およびプログラム | |
Riadsolh et al. | Cloud-Based Sentiment Analysis for Measuring Customer Satisfaction in the Moroccan Banking Sector Using Na? ve Bayes and Stanford NLP | |
US10387472B2 (en) | Expert stance classification using computerized text analytics | |
US20160078341A1 (en) | Building a Domain Knowledge and Term Identity Using Crowd Sourcing | |
JP2016162357A (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
JP6154072B2 (ja) | 情報分析システム、情報分析方法及び情報分析プログラム | |
JP2021092957A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6230725 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |