JP2020024689A - 因果関係抽出システムおよび因果関係抽出プログラム - Google Patents

因果関係抽出システムおよび因果関係抽出プログラム Download PDF

Info

Publication number
JP2020024689A
JP2020024689A JP2019135001A JP2019135001A JP2020024689A JP 2020024689 A JP2020024689 A JP 2020024689A JP 2019135001 A JP2019135001 A JP 2019135001A JP 2019135001 A JP2019135001 A JP 2019135001A JP 2020024689 A JP2020024689 A JP 2020024689A
Authority
JP
Japan
Prior art keywords
node
event
economic
performance
causal relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019135001A
Other languages
English (en)
Other versions
JP6723673B2 (ja
Inventor
洋二郎 関
Yojiro Seki
洋二郎 関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xenodata Lab Co Ltd
Original Assignee
Xenodata Lab Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xenodata Lab Co Ltd filed Critical Xenodata Lab Co Ltd
Publication of JP2020024689A publication Critical patent/JP2020024689A/ja
Application granted granted Critical
Publication of JP6723673B2 publication Critical patent/JP6723673B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】経済事象と企業業績との因果関係の抽出をコンピュータ処理によって効率的に自動化する。【解決手段】ニュース分析部5aは、ニュースの内容を分析して経済事象を抽出すると共に、経済事象のダイジェストを生成する。決算分析部5bは、決済関連資料の内容を分析して経済事象および企業業績を抽出すると共に、これらのダイジェストを生成する。ノード登録部5cは、抽出された経済事象および企業業績について、同一ダイジェストのものが登録されていないことを条件として、これらのダイジェストを付加したノードを因果関係データベース3に登録する。因果関係登録部5dは、ニュースより抽出された異なる特定の経済事象同士の因果関係、および、決算関連資料より抽出された特定の企業業績および特定の経済事象の因果関係に基づいて、ノード間の接続を因果関係データベース3に登録する。【選択図】図10

Description

本発明は、経済事象と企業業績との因果関係を抽出する因果関係抽出システムおよび因果関係抽出プログラムに関する。
例えば、特許文献1には、大量のニュース記事などのコンテンツを投資に有効に活用するために、大量のテキストデータに基づく情報を用いて注目銘柄の検索を可能とする銘柄選択支援装置が開示されている。具体的には、まず、ニュース記事が保持されたニュース記事セット手段からキーワードに関連したニュース記事が読み出される。つぎに、キーワードと関連度の高い銘柄が検索され、関連度の高いものから順次抽出される。そして、ユーザから与えられたキーワードと関連度の高い銘柄に関するものがニュース記事セット手段を検索することによって抽出され、この抽出されたニュース記事がユーザに提供される。
また、非特許文献1には、テキストデータから経済事象および金融事象の連鎖を因果関係として抽出する、ベクトル表現を用いた因果関係連鎖の抽出手法が開示されている。具体的には、まず、決済短信のテキストを参照して、因果関係を示す手掛かり表現(因果関係表現)が抽出される。この表現抽出に関して、因果関係が存在する構文パターンを列挙しておき、手掛かり表現を用いることによって、単文、複文、重文に関係なく因果関係表現が抽出される。そして、抽出された因果関係ノードの中から市場の情勢や企業の業績を記した因果関係ノードが手動で選択され、因果関係連鎖の終端ノードとする。つぎに、新聞のテキストを参照して、上記終端ノードを終端とする因果関係連鎖への追加候補の因果関係ノードが抽出される。因果関係の抽出は、決済短信のテキストと同様の手法を用いて行われ、終端ノードよりも過去のもので、基本的に、終端ノードを基準とした探索期間以内のものが因果関係連鎖の追加候補となる。最後に、因果関係ノード間の類似度を計算して、因果関係連鎖を拡張し、因果関係連鎖への追加候補ノードが抽出され、これによって、因果関係連鎖が構築される。
特開2003−162639号公報 西村他,「ベクトル表現を用いた因果関係連鎖の抽出」,[online],2018年3月20日、第20回 人工知能学会 金融情報学研究会(SIG−FIN),日本,人工知能学会,[2019年2月15日検索],インターネット<URL:http://sigfin.org/?plugin=attach&refer=020-09&openfile=SIG-FIN-020-09.pdf>
いうまでもなく、経済活動に影響を及ぼす経済事象は、株価などの企業業績にも大きな影響を及ぼす。そのため、機関投資家、証券会社、個人投資家などのユーザにとって、このような経済事象は大きな関心事であり、多くのユーザは、ある経済事象が企業の業績にどのような影響を与えるかを常に予測しているところである。しかしながら、世の中では様々な経済事象が常時大量に発生していることから、膨大な数のニュースを読み込んで、経済事象が企業業績に与える影響を分析することは、ユーザにとって多大な負担となる。
この点、非特許文献1には、経済・金融事象を数値ベクトルで表現し、経済・金融事象間の因果関係を自動的に構築する手法について述べられているものの、因果関係構築における事象間の類似判定はIDFやコサイン類似度など一般的な方法によって行われており、経済・金融事象における因果関係構築のための工夫については何ら記載されていない。
本発明は、かかる事情に鑑みてなされたものであり、その目的は、経済事象と企業業績との因果関係の抽出をコンピュータ処理によって効率的に自動化することである。
かかる課題を解決すべく、第1の発明は、因果関係データベースと、ニュース分析部と、決算分析部と、ノード登録部と、因果関係登録部とを有し、経済事象と企業業績との相関性を因果関係として抽出する因果関係抽出システムを提供する。因果関係データベースは、経済事象のダイジェストが付加された複数の事象ノードと、企業業績のダイジェストが付加された複数の業績ノードと、特定の経済事象の対に関するノード間の接続と、特定の経済事象および特定の企業業績の対に関するノード間の接続とを保持する。ニュース分析部は、ニュースの内容を分析して経済事象を抽出すると共に、経済事象のダイジェストを生成する。決算分析部は、決済関連資料の内容を分析して経済事象および企業業績を抽出すると共に、経済事象のダイジェストおよび企業業績のダイジェストを生成する。ノード登録部は、抽出された経済事象について、同一ダイジェストの事象ノードが登録されていないことを条件として、経済事象のダイジェストを付加した事象ノードを因果関係データベースに登録する。それとともに、ノード登録部は、抽出された企業業績について、同一ダイジェストの業績ノードが登録されていないことを条件として、企業業績のダイジェストを付加した業績ノードを因果関係データベースに登録する。因果関係登録部は、ニュースより抽出された異なる特定の経済事象同士の因果関係に基づいて、この経済事象の対に関するノード間の接続を因果関係データベースに登録する。それとともに、因果関係登録部は、決算関連資料より抽出された特定の企業業績および特定の経済事象の因果関係に基づいて、この経済事象およびこの企業業績の対に関するノード間の接続を因果関係データベースに登録する。ここで、経済事象のダイジェストは、経済事象の内容を予め定められた複数の項目に区分することによって構造化されており、これらの項目は、経済事象の定量または傾向を表す項目と、その変動方向を表す項目とを有する。また、企業業績のダイジェストは、企業業績の内容を予め定められた複数の項目に区分することによって構造化されており、これらの項目は、勘定科目を表す項目と、その変動方向を表す項目とを有する。
ここで、第1の発明において、上記ノード登録部は、同一ダイジェストとみなす表現パターンを複数登録した名寄せ辞書を参照して、抽出された経済事象および抽出された企業業績について、同一ダイジェストの事象ノードおよび同一ダイジェストの業績ノードが因果関係データベースに登録されているか否かを判断することが好ましい。
第1の発明において、上記因果関係登録部は、因果関係データベースに登録されており、かつ、事象ノードおよび業績ノードとして接続関係にある一連の登録済ノードについて、変動方向を反転させた上でコピーすることによって、因果関係データベースに予測事象ノードおよび予測業績ノードとして登録してもよい。この場合、上記因果関係登録部は、反転関係にある表現のセットを複数登録した反転辞書を参照して、登録済ノードにおける変動方向の反転に相当する表現が存在することを条件として、予測事象ノードおよび予測業績ノードとして登録することが好ましい。
第2の発明は、以下のステップをコンピュータに実行させることによって、経済事象と企業業績との相関性を因果関係として抽出する因果関係抽出プログラムを提供する。第1のステップでは、ニュースの内容を分析して経済事象を抽出すると共に、経済事象のダイジェストを生成する。第2のステップでは、決済関連資料の内容を分析して経済事象および企業業績を抽出すると共に、経済事象のダイジェストおよび企業業績のダイジェストを生成する。第3のステップでは、抽出された経済事象について、同一ダイジェストの事象ノードが登録されていないことを条件として、経済事象のダイジェストを付加した事象ノードを因果関係データベースに登録する。第4のステップでは、抽出された企業業績について、同一ダイジェストの業績ノードが登録されていないことを条件として、企業業績のダイジェストを付加した業績ノードを因果関係データベースに登録する。第5のステップでは、ニュースより抽出された異なる特定の経済事象同士の因果関係に基づいて、これらの経済事象の対に関するノード間の接続を因果関係データベースに登録する。第6のステップでは、決算関連資料より抽出された特定の企業業績および特定の経済事象の因果関係に基づいて、この経済事象およびこの企業業績の対に関するノード間の接続を因果関係データベースに登録する。ここで、経済事象のダイジェストは、経済事象の内容を予め定められた複数の項目に区分することによって構造化されており、これらの項目は、経済事象の定量または傾向を表す項目と、その変動方向を表す項目とを有する。また、企業業績のダイジェストは、企業業績の内容を予め定められた複数の項目に区分することによって構造化されており、これらの項目は、勘定科目を表す項目と、その変動方向を表す項目とを有する。
ここで、第2の発明において、上記第3および上記第4のステップは、同一ダイジェストとみなす表現パターンを複数登録した名寄せ辞書を参照して、抽出された経済事象および抽出された企業業績について、同一ダイジェストの事象ノードおよび同一ダイジェストの業績ノードが因果関係データベースに登録されているか否かを判断するステップを有することが好ましい。
第2の発明において、上記第6のステップは、因果関係データベースに登録されており、かつ、事象ノードおよび業績ノードとして接続関係にある一連の登録済ノードについて、変動方向を反転させた上でコピーすることによって、因果関係データベースに予測事象ノードおよび予測業績ノードとして登録してもよい。この場合、上記第6のステップは、反転関係にある表現のセットを複数登録した反転辞書を参照して、登録済ノードにおける変動方向の反転に相当する表現が存在することを条件として、予測事象ノードおよび予測業績ノードとして登録することが好ましい。
本発明によれば、経済事象および企業業績について、因果関係データベースに登録する際の内容の同一性判断も含めて、情報の冗長性を排したダイジェストベースで因果関係の抽出処理を行う。経済事象のダイジェストは、ニュースの記載特性を考慮した上で、経済事象を端的に特徴化した形で構造化されており、経済事象の定量または傾向を表す項目と、その変動方向を表す項目とを有する。また、企業業績のダイジェストは、決算関連資料の記載特性を考慮した上で、企業業績を端的に特徴化した形で構造化されており、勘定科目を表す項目と、その変動方向を表す項目とを有する。これにより、経済事象と企業業績との間における因果関係の抽出をコンピュータ処理によって効率的に自動化することが可能になる。
本実施形態に係るサービスモデルの概念図 ニュース分析における表示画面の一例を示す図 ニュース分析における相関グラフの一例を示す図 相関グラフ表示装置のブロック図 因果関係データベースの概念図 利益影響要因分析における相関グラフの一例を示す図 相関グラフ生成システムのブロック図 ニュースデータベースの構成を示す図 決算関連データベースの構成を示す図 因果関係抽出システムのブロック図 テキスト構造解析を用いた因果関係の抽出の説明図 機械学習を用いた因果関係の抽出手法の説明図 ニュースから抽出される経済事象を示す図 ニュースから抽出される事象ノードを示す図 ニュースから抽出される事象ノード間の因果関係を示す図 決算関連資料から抽出される事象ノードと業績ノードとの間の因果関係を示す図 新規ニュースの反転時における相関グラフの説明図 予測事象ノードおよび予測業績ノードの生成処理の説明図
図1は、本実施形態に係るサービスモデルの概念図である。本サービスの運営主体またはその委託を受けた者が管理する分析サーバは、ニュース会社などの外部より配信されたニュースを取得する。この分析サーバは、証券取引所や企業などの外部より配信された決算関連資料、すなわち、決算短信、有価証券報告書などの開示資料も取得し、これらを分析する。そして、分析サーバは、後述するニュース分析や利益影響要因分析などを含む様々なサービスを、機関投資家、証券会社、個人投資家などのユーザに提供する。分析サーバが提供する特徴的なサービスとして、経済事象と企業業績との相関性を可視化した相関グラフを提供することが挙げられる。なお、本明細書において、「経済事象」とは、経済活動に影響を及し得る事象を広く包含する概念であって、狭義の経済事象のみならず、経済に影響を及ぼすような自然事象、例えば、冷夏、大地震、大洪水なども含む概念で用いられる。
図2は、ニュース分析における表示画面の一例を示す図である。この表示画面1は、ユーザが操作するクライアントが備える表示装置に表示される。表示画面1は、それぞれが表示画面1の一部として異なる領域に設けられた、検索候補表示領域1aと、相関グラフ表示領域1bと、ニュース本文表示領域1cと、影響企業表示領域1dとを有する。検索候補表示領域1aには、ユーザが選択可能な検索候補群がリスト表示される。表示される検索候補群はサービスの内容によって異なるが、ニュース分析の場合、様々なニュースのタイトルが一覧表示される。相関グラフ表示領域1bには、表示された検索候補群(ニュース群)の中から、ユーザによって検索対象(ニュース)が選択された場合、これに応じた相関グラフが表示される。ニュース本文表示領域1cには、ユーザによって選択されたニュースの本文が表示される。影響企業表示領域1dには、ユーザによって選択されたニュースに示された経済事象によって影響を受け得る企業の一覧がリスト表示される。
図3は、ニュース分析における相関グラフの一例を示す図である。この相関グラフは、経済事象と企業業績との相関性を可視化したものである。相関グラフは、少なくとも一つの経済事象のノードと、少なくとも一つの業績ノードとを含んでいる。相関グラフは、その構造として、分岐を有するツリー状の場合もあるが、単なる列状の場合もある。以下の説明では、「インド銅工場閉鎖」や「インド銅製品生産量の減少」といった経済事象に関するノードを「事象ノード」といい、「○○ペイントの営業減益」や「△△自動車の営業減益」といった企業業績に関するノードを「業績ノード」という。
相関グラフにおいて、特定のノード同士(一対のノード)は有向辺で結ばれている。この有向辺は、これによって結ばれたノード間に因果関係があることを示しており、有向辺の起点が「要因」、その終点が「結果」をそれぞれ意味する。一対の事象ノードが有向辺で結ばれている場合、起点側の事象ノードに相当する経済事象が要因となって、終点側の事象ノードに相当する経済事象が結果的に生じたことを意味する。また、事象ノードと業績ノードとが有向辺で結ばれている場合、起点側の事象ノードに相当する経済事象が要因となって、終点側の業績ノードに相当する企業業績が結果的に生じたことを意味する。なお、本明細書において、「有向辺」とは、要因側と結果側とをユーザが識別可能なシンボルを広く包含する概念であって、典型的には、要因側から結果側に至る矢印が想定されるが、それ以外に、要因側を底辺、結果側を頂点とした三角形、要因側に「要因」、結果側に「結果」と表記した線分などであってもよい。
同図の例は、ユーザによって「インド銅工場閉鎖」が検索対象として選択されたケースを示している。この場合、検索対象である「インド銅工場閉鎖」が最上位ノードとなり、これと直接的または間接的な因果関係を有する他の経済事象や企業業績がこれよりも下位のノードとして示される。すなわち、「インド銅工場閉鎖」という経済事象については、これが直接的な要因になって、「インド銅製品生産量の減少」という経済事象(結果)が生じている。また、「インド銅製品生産量の減少」が要因となって、「インド自動車生産量の減少」および「インド銅輸入量の増加」という2つの経済事象(結果)が生じている。これら2つの経済事象は、直近の「インド銅製品生産量の減少」を直接的な要因とするが、これと因果関係を有する最上位の「インド銅工場閉鎖」が間接的な要因となって引き起こされたものである。さらに、「インド自動車生産量の減少」については、これが直接的な要因となって「○○ペイントの営業減益」および「△△自動車の営業減益」という2つの企業業績(結果)が生じている。これも、「インド自動車生産量の減少」と因果関係を有する最上位の「インド銅工場閉鎖」が間接的な要因となって引き起こされたものである。
このことから、「インド銅工場閉鎖」については、この経済事象が要因となって、「○○ペイントの営業減益」、「△△自動車の営業減益」、「□□マテリアルの営業増益」および「××電線の営業増益」といった各企業業績の変動が引き起こされていることが理解できる。このように、検索対象として特定のニュースが選択された場合、相関グラフによって、この特定のニュースによって示された経済事象と直接的または間接的な因果関係を有する一連の経済事象が可視化されると共に、これと直接的または間接的な因果関係を有する企業業績も可視化される。
なお、同図の例では、相関グラフの最下位ノードに複数の企業業績が並んでいるが、これは一例であって、ケースによっては、最上位ノードや中間ノードから企業業績が派生することもある。ただし、企業業績を示す業績ノードは、基本的に、相関グラフにおける各分岐の終端ノードとなる。また、業績ノードは、企業の事業ドメイン毎に割り当てられた複数のノードを有していてもよい。例えば、「□□マテリアル」という企業について、「セメント事業」、「金属事業」、「アルミ事業」および「電子材料事業」といった複数の業績ノードに細分化されているといった如くである。また、相関グラフに表示すべき業績ノードの数が所定数以上の場合、影響度の高い企業から優先的に表示してもよい。この影響度の度合いは、文章中における表現の強弱、特定表現の出現頻度、統計分析などを駆使して定量的に判定することが好ましい。また、検索対象を起点とした相関グラフの表示段数は、システムとして予め設定されていてもよいし、ユーザが任意に設定できるようにしてもよい。さらに、検索候補表示領域1aには、ユーザの選択や指定によって、特定の企業に関するニュースだけを表示するようにしてもよい。
図4は、本実施形態に係る相関グラフ表示装置のブロック図である。本実施形態において、この相関グラフ表示装置10は、ブラウザを備えるクライアント側において構築される。この相関グラフ表示装置10は、上述した検索候補表示領域1aや相関グラフ表示領域1bなどを表示する表示装置の他に、表示切替部2を備える。この表示切替部2は、検索候補表示領域1aに表示された検索候補群に対するユーザの選択を受け付け、ユーザによって選択された検索対象に応じた相関グラフを相関グラフ表示領域1bに表示させる。相関グラフの構築に際しては、分析サーバ側が備える因果関係データベース3が参照される。そのために、表示切替部2は、分析サーバに対して、検索対象に関する検索依頼を送信すると共に、検索結果(相関グラフ)を分析サーバより受信する。なお、このような表示切替部2は、クライアントにインストールされたウェブブラウザの一機能として実現することができる。
図5は、因果関係データベース3の概念図である。因果関係データベース3は、相関グラフを構築するために必要な情報を保持しており、具体的には、複数の事象ノードと、複数の業績ノードと、特定の事象ノードの対に関するノード間の接続と、特定の事象ノードおよび特定の業績ノードの対に関するノード間の接続とを保持する。因果関係データベース3に保持されている各ノードには、ノード固有の識別情報(ノードID)が付与されており、このノードIDによって個々のノードが管理される。上述したように、ノードには、経済事象に相当する事象ノードと、企業業績に相当する業績ノードとが存在するが、両者を区別するために、事象ノードのノードIDを「a1」〜「a7」で示し、業績ノードのノードIDを「b1」〜「b3」で示す。また、一対の経済事象の間に因果関係がある場合、要因および結果を識別可能な形(相関グラフの有向辺に相当)で、これらに相当する一対の事象ノード間の接続が保持されている。さらに、ある経済事象とある企業業績との間に因果関係がある場合、前者に相当する事象ノードと、後者に相当する業績ノードとの間の接続も保持されている。なお、後述するように、因果関係データベース3は、それぞれのノードに関するノード情報(ダイジェスト)も保持している。
表示切替部2は、ユーザの操作による検索対象の変更に伴い、相関グラフ表示領域1bに表示すべき相関グラフを切り替える。すなわち、検索候補表示領域1aにおいて、検索候補群として表示されたニュース群の中から検索対象として第1のニュースが選択された場合、第1の相関グラフが表示される。第1の相関グラフは、検索対象となる第1のニュースに対応する第1の経済事象を最上位ノードとし、第1の経済事象と相関を有する他の経済事象および企業業績を下位ノードとする。また、第1のニュースとは異なる第2のニュースが検索対象として選択された場合、第1の相関グラフとは異なる第2の相関グラフが表示される。第2の相関グラフは、検索対象となる第2のニュースに対応する第2の経済事象を最上位ノードとし、第2の経済事象と相関を有する他の経済事象および企業業績を下位ノードとする。
つぎに、利益影響要因分析について説明する。利益影響要因分析の場合、ニュース分析とは異なり、検索候補表示領域1aには、ユーザが選択可能な企業業績群がリスト表示される。検索候補群(企業業績群)の中から、ユーザによって検索対象(企業業績)が選択された場合、相関グラフ表示領域1bには、これに応じた相関グラフが表示される。
図6は、利益影響要因分析における相関グラフの一例を示す図である。同図の例は、検索対象として「□□マテリアルの営業増益」が選択された場合を示している。この場合、「□□マテリアルの営業増益」が最下位ノードとなり、この企業業績の直接的または間接的な要因となる経済事象が上位ノードとして表示される。この相関グラフから、検索対象である「□□マテリアルの営業増益」という企業業績は、「日本銅製品生産・輸出量の増加」を直接的な要因とし、「インド銅製品輸入量の増加」、「インド銅製品生産量の減少」および「インド銅工場閉鎖」を間接的な要因としていることが理解できる。このように、検索対象として特定の企業業績が選択された場合、相関グラフによって、この特定の企業業績と直接的または間接的な因果関係を有する一連の経済事象が可視化される。
利益影響要因分析も、上述したニュース分析と同様、表示切替部2は、ユーザの操作による検索対象の変更に伴い、相関グラフ表示領域1bに表示すべき相関グラフを切り替える。すなわち、検索候補表示領域1aにおいて、検索候補群として表示された企業業績群の中から検索対象として第1の企業業績が選択された場合、第3の相関グラフが表示される。第3の相関グラフは、第1の企業業績を最下位ノードとし、第1の企業業績と相関を有する経済事象を上位ノードとする。また、第1の企業業績とは異なる第2の企業業績が選択された場合、第3の相関グラフとは異なる第4の相関グラフが表示される。第4の相関グラフは、第2の企業業績を最下位ノードとし、第2の企業業績と相関を有する経済事象を上位ノードとする。
なお、因果関係データベース3の検索について、ニュース分析と利益影響要因分析とでは、接続関係の辿り方が逆になる。ニュース分析の場合、有向辺の向きどおり、要因(上位)から結果(下位)に向かって接続関係を辿ることになる。これに対し、利益影響要因分析の場合、有向辺の向きとは逆に、結果(下位)から要因(上位)を辿ることになる。
図7は、上述した相関グラフ表示装置10に相関グラフを提供する相関グラフ生成システムの機能的なブロック図である。本実施形態において、相関グラフ生成システム20は、分析サーバ側において構築される。なお、この生成システム20は、コンピュータをブロック4〜6として機能・動作させるコンピュータプログラム(相関グラフ生成プログラム)を分析サーバにインストールすることによって等価的に実現することも可能である。
相関グラフ生成システム20は、上述した因果関係データベース3の他に、相関グラフ生成部4と、因果関係抽出システム5と、ニュースデータベース7と、決算関連データベース8とを有する。
相関グラフ生成部4は、クライアント側からの検索依頼(検索対象の指示を含む。)に基づいて、検索対象に係る事象/業績ノードを検索キーとして因果関係データベース3を検索する。これにより、検索キーと直接的および間接的に接続された少なくとも一つのノードが、ノード間の接続関係も含めて抽出される。そして、相関グラフ生成部4は、因果関係データベース3の検索結果に基づいて相関グラフを生成する。この相関グラフは、検索キーとなるノードと、因果関係データベース3の検索結果として抽出された少なくとも一つのノードとを含む。また、相関グラフの有向辺は、因果関係データベース3の検索結果として抽出されたノード間の接続関係に基づき形成される。
ニュース分析の場合、ユーザによって選択された特定のニュースに対応する事象ノードを検索キーとして因果関係データベース3が検索され、この検索結果に基づいて、特定のニュースに対応する事象ノードと、これと直接的または間接的に接続された他の事象ノードおよび業績ノードとを含む相関グラフが生成される。一方、利益影響要因分析の場合、ユーザによって選択された特定の企業業績に対応する業績ノードを検索キーとして因果関係データベース3が検索され、この検索結果に基づいて、特定の企業業績に対応する業績ノードと、これと直接的または間接的に接続された事象ノードとを含む相関グラフが生成される。相関グラフ生成部4によって生成された相関グラフは、検索依頼に対する検索結果としてクライアント側に送信される。
図8は、ニュースデータベース7の構成を示す図である。ニュースデータベース7は、外部より取得された多数のニュースを保持する。このデータベース7は、「ニュースID」、「ニュース情報」および「ノードID」によって構成されたレコードを多数保持している。「ニュースID」は、個々のニュースを識別するための固有の識別情報である。このニュースIDは、外部から取得されたニュースをニュースデータベース7に登録する際、その都度採番される。「ニュース情報」は、ニュースの内容そのものであり、ニュースのタイトル、本文、その他の付帯情報(日付等)を含む。「ノードID」は、このニュースより抽出された経済事象に対応する事象ノードのノードIDを示す。ノードIDについては、例えば、ニュースID=「N002」〜「N004」のように、1つのニュースにおいて複数のノードIDが記述されることがある。これは、1つのニュースから複数の経済事象が抽出され、これらに対応する事象ノードのそれぞれが因果関係データベース3に登録されていることを意味する。逆に、ニュースID=「N001」,「N002」のように、複数のニュースについて、1つのノードID(=「a1」)が重複して記述されることもある。これは、それぞれのニュースから経済事象が個別に抽出されたものの、同一の経済事象であると判断された結果、1つの事象ノードa1のみが因果関係データベース3に登録されていることを意味する。
図9は、決算関連データベース8の構成を示す図である。決算関連データベース8は、外部より取得された多数の決算関連資料を保持する。このデータベース8は、「決算ID」、「決算関連情報」および「ノードID」によって構成されたレコードを多数保持している。「決算ID」は、個々の決算関連資料を識別するための固有の識別情報である。この決算IDは、外部から取得された決算関連資料を決算関連データベース8に登録する際、その都度採番される。「決算関連情報」は、決算関連資料の内容そのものである。「ノードID」は、この決算関連資料より抽出された経済事象に対応する事象ノードのノードID(例えばa2)、および、抽出された企業業績に対応する業績ノードのノードID(例えばb1)を示す。例えば、決算ID=「K001」については、この決算関連資料から抽出された経済事象が「a2」の事象ノードとして存在し、企業業績が「b1」の業績ノードとして存在することを意味する。
図10は、因果関係抽出システム5の機能的なブロック図である。この因果関係抽出システム5は、ニュースデータベース7より読み出されたニュースと、決算関連データベース8より読み出された決算関連資料とを分析して、経済事象と企業業績との相関性を因果関係として抽出し、因果関係データベース3に必要な情報を登録する。因果関係抽出システム5は、ニュース分析部5aと、決算分析部5bと、ノード登録部5cと、因果関係登録部5dとを有する。なお、本実施形態において、因果関係抽出システム5は、分析サーバ側において構築されるが、コンピュータをブロック5a〜5dとして機能・動作させるコンピュータプログラム(因果関係抽出プログラム)を分析サーバにインストールすることによって等価的に実現することも可能である。
ニュース分析部5aは、ニュースデータベース7に格納されているニュースを読み出し、このニュースの内容を分析することによって経済事象を抽出すると共に、この経済事象のダイジェストを生成する。経済事象のダイジェストは、経済事象の内容を予め定められた複数の項目に区分することによって構造化されており、冗長性を排した形で経済事象の特徴(特徴量)を端的に表している。本実施形態では、ニュースの記載特性を考慮した上でその内容を端的に特徴化すべく、経済事象のダイジェストを規定する複数の項目として、「地域(area)」、「名前(item)」、「要素(element)」および「変動(predicate)」を用いる。ここで、「地域(area)」は、「東南アジア」や「日本」のように、経済事象が発生した地域名を表す項目である。「名前(item)」は、「清涼飲料水」や「原油」のように、経済事象の名前を表す項目である。「要素(element)」は、「価格」、「販売量」、「需要」、「税率」、「景気」、「市況」、「貿易摩擦」、「経営状態」、「規制」のように、経済事象の定量または傾向を表す項目である。「変動(predicate)」は、「下落」、「減少」、「増加」、「激化」、「悪化」、「強化」のように、経済事象(「要素」)の変動方向を表す項目である。例えば、「インド銅製品の輸入量の増加」という経済事象については、「地域」=インド、「名前」=銅製品、「要素」=輸入量、「変動」=増加としたダイジェストが生成される。ただし、これらの4項目のうち、経済事象を特徴付けるものとして最も重要なものは、「要素(element)」および「変動(predicate)」、すなわち、「何」が「どうした」(例えば「価格」が「下落」した)である。したがって、「要素(element)」および「変動(predicate)」は必要不可欠であるが、「地域(area)」および「名前(item)」については必要に応じて適宜採用すればよく、あるいは、これら以外の別の項目を追加してもよい。また、経済事象の内容によって、「地域(area)」、「名前(item)」、「要素(element)」および「変動(predicate)」のすべてが明確に存在するとは限らない。そこで、経済事象のダイジェストのパターンとして、上記4項目よりも少ない項目数によるダイジェスト化を許容してもよい。
ノード登録部5cは、抽出された経済事象について、因果関係データベース3に同一内容の経済事象が登録されていないことを条件(重複登録の排除)に、ノードIDを採番した上で、新規な事象ノードとして因果関係データベース3に登録される。経済事象が同一であるか否かの判断は、表記ゆれなどを考慮した上で判断する必要がある。そこで、同一とみなす表現のパターンが多数登録された名寄せ辞書を参照して、表現を標準化した上で同一性が判断される(データのクレンジング)。例えば、「原油価格の上昇」、「オイルプライスアップ」、「原油高」といった経済事象は、「名前」=原油、「要素」=価格、「変動」=上昇に標準化された結果、同一であると判断される。なお、例えば、名寄せ辞書を参照して、「消費減税」を含むダイジェストと、「消費税」および「増税」を含むダイジェストとは同一であるといった判断を行えば、項目数が異なるダイジェスト間における同一性の判断が可能になる。
因果関係データベース3には、事象ノードのノード情報として、名寄せ辞書によって表現が標準化されたダイジェストが登録される。この点は、決算関連資料から抽出される企業業績のダイジェストについても同様である。
決算分析部5bは、決算関連データベース8に格納されている決算関連資料を読み出し、この決算関連資料の内容を分析することによって、経済事象および企業業績を抽出する。ノード登録部5cは、抽出された経済事象および企業業績について、因果関係データベース3に同一内容の経済事業や同一内容の企業業績が登録されていないことを条件に、新規な事象ノードおよび新規な業績ノードとして因果関係データベース3に登録する。また、決算分析部5bは、抽出された経済事象および企業業績について、経済事象のダイジェストおよび企業業績のダイジェストを生成する。経済事象のダイジェストは、ニュースの場合と同様である。また、企業業績のダイジェストは、企業業績の内容を予め定められた複数の項目に区分することによって構造化されており、冗長性を排した形で企業業績の特徴(特徴量)を端的に表している。本実施形態では、決算関連資料の記載特性を考慮した上でその内容を端的に特徴化すべく、企業業績のダイジェストを規定する複数の項目として、「勘定科目」と、「変動」とを用いる。「勘定科目」は、勘定科目を表す項目であり、「変動」は、勘定科目の変動方向を表す項目である。ニュースの場合と同様、決算関連資料より抽出された経済事象および企業業績は、因果関係データベース3に同一のものが登録されていないことを条件に、ノードIDを採番した上で、因果関係データベース3に登録される。
因果関係データベース3に登録された経済事象のダイジェストおよび企業業績のダイジェストは、相関グラフにおけるノード情報として用いられる。すなわち、因果関係データベース3より読み出された経済事象のダイジェストは、相関グラフにおける事象ノードのノード情報として個別に付加される。また、因果関係データベース3より読み出された企業業績のダイジェストは、相関グラフにおける業績ノードのノード情報として個別に付加される。
因果関係登録部5dは、ニュースデータベース7に格納されているニュースを読み出し、異なる経済事象同士の因果関係を抽出する。基本的に、1つのニュースに複数の経済事象が含まれており、かつ、一対の経済事象が原因と結果の関係にあると判断された場合、因果関係が認められる。具体的には、まず、1つの経済事象は、上述したような構造化されたダイジェストをベースとして特定される。1つのニュースに2つ以上のダイジェストが抽出された場合、ニュースの文章表現に基づいて、一対のダイジェストに因果関係が認められるセットが抽出される。例えば、「・・・今年日本では記録的冷夏により、清涼飲料水販売量が下落し、・・・」というニュースがあった場合、「により」という語句から、「記録的冷夏」および「清涼飲料水が下落」という一対の経済事象に因果関係があると判断される。なお、極端に日時が異なる経済事象同士の結び付きを禁止するために、因果関係の有無の判断にあたっては時間的な情報を考慮してもよい。
また、特定の語句を手掛かりとした単純な手法以外に、以下に示す手法を採用すれば、経済事象間の因果関係をより精度良く抽出することができる。図11は、第1の手法としてテキスト構造解析を用いた因果関係の抽出手法の説明図である。文章中の文を識別するために、便宜上、個々の文に段落番号1〜5が付与されている。第1の手法では、2つの要因が、文章全体の構造において原因と結果の段落に位置しているかが判定される。具体的には、テキスト構造解析によって節や文、段落間の関係が推定され、その関係が原因結果であるものについて、その中に含まれている「名前」、「要素」および「変動」が因果関係の候補となる。これは、特定の語句を手掛かりとした手法を、より広範囲に体系化したものである。
図12は、第2の手法として機械学習を用いた因果関係の抽出手法の説明図である。第2の手法では、予め学習データ(因果関係の有無が明らかな既知の2つの要因の集合)について、それぞれを要因ベクトルに変換する。要因ベクトルとは数値列であって、例えばword2vecと呼ばれる技術を用いて、「名前」、「要素」および「変動」の語を個別にベクトル化したものを連結することによって得られる。そして、学習データを機械学習して学習済のデータベースを用意する。機械学習手法としては、サポートベクターマシン(SVM)やランダムフォレストなどのように、2クラス分類手法を用いることができる。「地域」、「名前」、「要素」および「変動」の対から要因ベクトルを計算し、この要因ベクトルを学習済のモデルに入力することによって因果関係の有無を判断することができる。
第3の手法では、前処理として文書要約技術によってニュースの要約文を生成し、この要約文に対して、上記第1の手法や第2の手法を適用する。要約には抽出型と抽象型とが存在する。抽出型は、元の語句を用いて要約するタイプであり、文の冗長な構造が排除されるので、上述した「名前」、「要素」および「変動」の検出性能を改善できる可能性がある。一方、抽象型は、元にない語句を要約文中に生成するタイプであり、元の文からは直接得ることができない「名前」、「要素」および「変動」および因果関係が得られる可能性が期待できる。
また、因果関係登録部5dは、決算関連データベース8に格納されている決算関連資料を読み出し、この決算関連資料に企業業績(勘定科目およびその変動)に影響を及した要因となる経済事象が含まれていると判断した場合、この決算関連情報に対応する企業業績のノードと、影響要因に対応する事象ノードとの間の接続関係を因果関係データベース3に登録する。企業業績と経済事象との因果関係を抽出する手法としては、上述した経済事象間の因果関係と同様の抽出手法を用いてもよいが、本出願人が既に取得した日本特許第6155409号の抽出手法を用いることが好ましい。同特許公報には、決算関連資料を分析して、会計上の事象の要因を抽出する手法が開示されている。具体的には、まず、決算関連資料に含まれる文章を分解した文のそれぞれについて形態素解析を行い、文の形態素列が生成される。つぎに、形態素列を構成する形態素またはその組み合わせに対して、少なくとも科目および金額を分類する属性毎に固有の属性ラベルが付与される。そして、属性ラベルによって抽象化された形態素列と、要因パターンと比較し、形態素列が要因パターンと一致するか否かが判定される。最後に、要因パターンと一致した形態素列について、要因パターンによって指定された部分を要因として抽出し、この抽出された要因が形態素列における科目および金額情報に紐付けられる。
一対の経済事象における因果関係は、要因に対応する事象ノードと、結果に対応する事象ノードとの間が接続されていることを示す形で因果関係データベース3に登録される。また、経済事象および企業業績の対における因果関係は、要因に対応する事象ノードと、結果に対応する業績ノードとの間が接続されていることを示す形で因果関係データベース6に登録される。
以下、図13〜16を参照しつつ、相関グラフ生成システム20における処理の流れを具体的に説明する。まず、ニュース分析部5aによって、ニュースが個別に分析され、それぞれのニュースにおける経済事象が抽出される。図13に示すように、ニュース「N001」から経済事象1、ニュース「N002」から経済事象2〜3、ニュース「N003」から経済事象4〜6、ニュース「N004」から経済事象8〜9、ニュース「N005」から経済事象10〜12がそれぞれ抽出される。
つぎに、重複登録を禁止するという条件の下、ノード登録部5cによって、ニュースから抽出された経済事象が新規な事象ノードとして因果関係データベース3に登録される。図14に示すように、ニュース「N001」から抽出された経済事象1は未登録なので、新規な事象ノード「a1」として登録される。ニュース「N002」については、2つの経済事象2〜3が抽出されているが、経済事象2は既に登録された経済事象1と同一である。したがって、経済事象2については、経済事象1に対応する事象ノード「a1」が割り当てられ、経済事象3についてのみ、新規な事象ノード「a2」として登録される。ニュース「N003」については、3つの経済事象4〜6が抽出されているが、経済事象4は既に登録された経済事象1と同一である。したがって、経済事象4については、経済事象1に対応する事象ノード「a1」が割り当てられ、経済事象5〜6についてのみ、新規な事象ノード「a3」〜「a4」として登録される。ニュース「N004」については、2つの経済事象7〜8が抽出されているが、経済事象7は既に登録された経済事象6と同一である。したがって、経済事象7については、経済事象6に対応する事象ノード「a4」が割り当てられ、経済事象8についてのみ、新規な事象ノード「a5」として登録される。ニュース「N005」については、3つの経済事象9〜11が抽出されているが、経済事象9は既に登録された経済事象5と同一である。したがって、経済事象9については、経済事象5に対応する事象ノード「a3」が割り当てられ、経済事象10〜11についてのみ、新規な事象ノード「a6」〜「a7」として登録される。
つぎに、因果関係登録部5dによって、ニュースから経済事象間の因果関係が抽出され、要因および結果を識別可能な接続関係として因果関係データベース3に登録される。図15に示すように、ニュース「N002」から、経済事象2(要因)および経済事象3(結果)の間の因果関係が抽出される。これにより、経済事象2に対応する事象ノード「a1」を始点とし、経済事象3に対応する事象ノード「a2」を終点とする接続が登録される。ニュース「N003」から、経済事象4(要因)および経済事象5(結果)の間の因果関係と、経済事象5(要因)および経済事象6(結果)の間の因果関係とが抽出される。これにより、前者については、経済事象4に対応する事象ノード「a1」を始点とし、経済事象4に対応する事象ノード「a3」を終点とする接続が登録される。また、後者については、経済事象5に対応する事象ノード「a3」を始点とし、経済事象6に対応する事象ノード「a4」を終点とする接続が登録される。ニュース「N004」から、経済事象7(要因)および経済事象8(結果)の間の因果関係が抽出される。これにより、経済事象7に対応する事象ノード「a4」を始点とし、経済事象8に対応する事象ノード「a5」を終点とする登録される。ニュース「N005」から、経済事象9(要因)および経済事象10(結果)の間の因果関係と、経済事象10(要因)および経済事象11(結果)の間の因果関係とが抽出される。これにより、前者については、経済事象9に対応する事象ノード「a3」を始点とし、経済事象10に対応する事象ノード「a6」を終点とする接続が登録される。また、後者については、経済事象10に対応する事象ノード「a6」と始点とし、経済事象11に対応する事象ノード「a7」を終点とする接続が登録される。
そして、因果関係抽出部5dによって、決算関連資料から事象ノードと業績ノードとの間の因果関係が抽出され、要因および結果を識別可能な接続関係として因果関係データベース3に登録される。図16に示すように、決算関連資料「K001」から、ある経済事象(要因)とある企業業績(結果)との間の因果関係が抽出され、前者は事象ノード「a2」の経済事象と同一であり、後者は未登録であるとする。これにより、企業業績に対応する新規な業績ノード「b1」が登録されると共に、事象ノード「a2」を始点とし、業績ノード「b1」を終点とする接続が登録される。決算関連資料「K001」から、ある経済事象(要因)とある企業業績(結果)との間の因果関係が抽出され、前者は事象ノード「a4」の経済事象と同一であり、後者は未登録であるとする。これにより、企業業績に対応する新規な業績ノード「b2」が登録されると共に、事象ノード「a4」を始点とし、業績ノード「b2」を終点とする接続が登録される。決算関連資料「K003」から、ある経済事象(要因)とある企業業績(結果)との間の因果関係が抽出され、前者は事象ノード「a5」の経済事象と同一であり、後者は未登録であるとする。これにより、企業業績に対応する新規な業績ノード「b3」が登録されると共に、事象ノード「a5」を始点とし、業績ノード「b3」を終点とする接続が登録される。
以上のような一連の処理により、因果関係データベース3の保持内容として、例えば、図5に示したような因果関係が構築される。
最後に、相関グラフの拡張例として、経済事象と企業業績との因果関係を予測した予測相関グラフについて説明する。図17の上段は、上述した抽出処理によって生成された相関グラフの一例を示している。すなわち、「日本」における「記録的冷夏」の「減少」という事象ノードa11をルートとして、「日本」における「清涼飲料水販売量」の「減少」(事象ノードa12)、「日本」における「アルミ需要」の「減少」(事象ノードa13)、「日本」における「アルミ価格」の「減少」(事象ノードa14)を経て、業績ノードb10、すなわち、アルミを原料に製品を製造する特定企業(○○マテリアル)が「営業増益」に至ったことを示している。
ここで、仮想的なケースとして、事象ノードa11の変動方向が「減少」から「増大」に反転したケースについて考える。この場合、上記相関グラフから、事象ノードa11以降の事象ノードa12〜a14および業績ノードb10の変動方向も反転することが予想される。すなわち、「日本」における「記録的冷夏」の「増大」という予測事象ノードa51をルートとして、「日本」における「清涼飲料水販売量」の「増大」(予測事象ノードa52)、「日本」における「アルミ需要」の「増大」(予測事象ノードa53)、「日本」における「アルミ価格」の「上昇」(予測事象ノードa54)を経て、最終的に、予測業績ノードb50、すなわち、アルミを原料に製品を製造する特定企業(○○マテリアル)が「営業減益」になるであろうことが合理的に予想される。このように、経済事象や企業業績として実際に発生していなくても、実際の発生したものに基づき反転事象や反転業績として予測し、予測相関グラフとして可視化すれば、ユーザにとって有用な情報となる。
図18は、予測事象ノードおよび予測業績ノードの生成処理の説明図である。まず、因果関係登録部5dは、因果関係データベース3に登録されており、かつ、事象ノードおよび業績ノードとして接続関係にある一連の登録済ノードa11〜a14,b10について、新たなノードID=a51〜a54,b50を採番した上で、因果関係データベース3に予測ノード(予測事象ノードおよび予測業績ノード)として登録する。予測ノードは、これに対応する登録済ノードの変動方向を反転(例えば、「減少」→「増大」)させた上で、接続関係も含めてコピーしたものである。これにより、図17の下段に示した予測相関グラフが生成される。
ここで、予測ノードの登録に際しては、反転関係にある表現のセットを複数登録した反転辞書が参照され、登録済ノードにおける変動方向の反転に相当する表現(例えば、「減少」に対する「増大」)が存在することが条件とされる。したがって、反転表現が存在しない登録済ノードについては、これに対応する予測ノードは登録されない。例えば、登録済ノードa13について、反転表現が存在しないと判断された場合、予測ノードa53は登録されない。その結果、互いに接続された2つの予測ノードa51,a52と、互いに接続された2つの予測ノードa54,b50とが分断された形で登録されることになる。
このように、本実施形態によれば、相関グラフを通じて経済事象と企業業績との相関性が可視化され、企業業績の変動要因を容易に把握できるので、ユーザの利便性を高めることができる。
また、本実施形態によれば、ユーザは、検索候補表示領域1aに表示された検索候補群に対する選択だけで、煩雑な操作を要することなく、所望の相関グラフを簡単に取得できる。それとともに、検索対象の変更によって、相関グラフを簡単に切り替えることができる。その際、ニュース分析および利益影響要因分析といった異なる分析サービスを提供すれば、ユーザの利便性を更に高めることができる。
また、本実施形態によれば、相関グラフを構成するノードのノード情報として、経済事象や企業業績のダイジェストを表示することで、ユーザの利便性を一層高めることができる。
さらに、本実施形態によれば、経済事象および企業業績について、因果関係データベース3に登録する際の内容の同一性の判断も含めて、情報の冗長性を排したダイジェストベースで因果関係の抽出処理を行う。経済事象のダイジェストは、ニュースの記載特性を考慮した上で、経済事象を端的に特徴化した形で構造化されており、経済事象の定量または傾向を表す項目と、その変動方向を表す項目とを有する。また、企業業績のダイジェストは、決算関連資料の記載特性を考慮した上で、企業業績を端的に特徴化した形で構造化されており、勘定科目を表す項目と、その変動方向を表す項目とを有する。これにより、経済事象と企業業績との間における因果関係の抽出をコンピュータ処理によって効率的に自動化することが可能になる。
1 表示画面
1a 検索候補表示領域
1b 相関グラフ表示領域
1c ニュース本文表示領域
1d 影響企業表示領域
2 表示切替部
3 因果関係データベース
4 相関グラフ生成部
5 因果関係抽出システム
5a ニュース分析部
5b 決算分析部
5c ノード登録部
5d 因果関係登録部
7 ニュースデータベース
8 決算関連データベース
10 相関グラフ表示装置
20 相関グラフ生成システム

第2の発明において、因果関係データベースに登録されており、かつ、事象ノードおよび業績ノードとして接続関係にある一連の登録済ノードについて、変動方向を反転させた上でコピーすることによって、因果関係データベースに予測事象ノードおよび予測業績ノードとして登録する第7のステップを設けてもよい。この場合、上記第7のステップは、反転関係にある表現のセットを複数登録した反転辞書を参照して、登録済ノードにおける変動方向の反転に相当する表現が存在することを条件として、予測事象ノードおよび予測業績ノードとして登録することが好ましい。
ノード登録部5cは、抽出された経済事象について、因果関係データベース3に同一内容の経済事象が登録されていないことを条件(重複登録の排除)に、ノードIDを採番した上で、新規な事象ノードとして因果関係データベース3に登録される。経済事象が同一であるか否かの判断は、表記ゆれなどを考慮した上で判断する必要がある。そこで、同一とみなす表現のパターンが多数登録された名寄せ辞書を参照して、表現を標準化した上で同一性が判断される(データのクレンジング)。例えば、「原油価格の上昇」、「オイルプライスアップ」、「原油高」といった経済事象は、「名前」=原油、「要素」=価格、「変動」=上昇に標準化された結果、同一であると判断される。なお、例えば、名寄せ辞書を参照して、「消費増税」を含むダイジェストと、「消費税」および「増大」を含むダイジェストとは同一であるといった判断を行えば、項目数が異なるダイジェスト間における同一性の判断が可能になる。

Claims (8)

  1. 経済事象と企業業績との因果関係を抽出する因果関係抽出システムにおいて、
    経済事象のダイジェストが付加された複数の事象ノードと、企業業績のダイジェストが付加された複数の業績ノードと、特定の経済事象の対に関するノード間の接続と、特定の経済事象および特定の企業業績の対に関するノード間の接続とを保持する因果関係データベースと、
    ニュースの内容を分析して経済事象を抽出すると共に、経済事象のダイジェストを生成するニュース分析部と、
    決済関連資料の内容を分析して経済事象および企業業績を抽出すると共に、経済事象のダイジェストおよび企業業績のダイジェストを生成する決算分析部と、
    前記抽出された経済事象について、同一ダイジェストの事象ノードが登録されていないことを条件として、経済事象のダイジェストを付加した事象ノードを前記因果関係データベースに登録すると共に、前記抽出された企業業績について、同一ダイジェストの業績ノードが登録されていないことを条件として、企業業績のダイジェストを付加した業績ノードを前記因果関係データベースに登録するノード登録部と、
    ニュースより抽出された異なる特定の経済事象同士の因果関係に基づいて、当該経済事象の対に関するノード間の接続を前記因果関係データベースに登録すると共に、決算関連資料より抽出された特定の企業業績および特定の経済事象の因果関係に基づいて、当該経済事象および当該企業業績の対に関するノード間の接続を前記因果関係データベースに登録する因果関係登録部とを有し、
    前記経済事象のダイジェストは、経済事象の内容を予め定められた複数の項目に区分することによって構造化されており、当該複数の項目は、経済事象の定量または傾向を表す項目と、その変動方向を表す項目とを有し、
    前記企業業績のダイジェストは、企業業績の内容を予め定められた複数の項目に区分することによって構造化されており、当該複数の項目は、勘定科目を表す項目と、その変動方向を表す項目とを有することを特徴とする因果関係抽出システム。
  2. 前記ノード登録部は、同一ダイジェストとみなす表現パターンを複数登録した名寄せ辞書を参照して、前記抽出された経済事象および前記抽出された企業業績について、同一ダイジェスト事象ノードおよび同一ダイジェストの業績ノードが前記因果関係データベースに登録されているか否かを判断することを特徴とする請求項1に記載された因果関係抽出システム。
  3. 前記因果関係登録部は、前記因果関係データベースに登録されており、かつ、事象ノードおよび業績ノードとして接続関係にある一連の登録済ノードについて、前記変動方向を反転させた上でコピーすることによって、前記因果関係データベースに予測事象ノードおよび予測業績ノードとして登録することを特徴とする請求項1に記載された因果関係抽出システム。
  4. 前記因果関係登録部は、反転関係にある表現のセットを複数登録した反転辞書を参照して、前記登録済ノードにおける変動方向の反転に相当する表現が存在することを条件として、前記予測事象ノードおよび前記予測業績ノードとして登録することを特徴とする請求項3に記載された因果関係抽出システム。
  5. 経済事象と企業業績との因果関係を抽出する因果関係抽出プログラムにおいて、
    ニュースの内容を分析して経済事象を抽出すると共に、経済事象のダイジェストを生成する第1のステップと、
    決済関連資料の内容を分析して経済事象および企業業績を抽出すると共に、経済事象のダイジェストおよび企業業績のダイジェストを生成する第2のステップと、
    前記抽出された経済事象について、同一ダイジェストの事象ノードが登録されていないことを条件として、経済事象のダイジェストを付加した事象ノードを前記因果関係データベースに登録する第3のステップと、
    前記抽出された企業業績について、同一ダイジェストの業績ノードが登録されていないことを条件として、企業業績のダイジェストを付加した業績ノードを前記因果関係データベースに登録する第4のステップと、
    ニュースより抽出された異なる特定の経済事象同士の因果関係に基づいて、当該経済事象の対に関するノード間の接続を前記因果関係データベースに登録する第5のステップと、
    決算関連資料より抽出された特定の企業業績および特定の経済事象の因果関係に基づいて、当該経済事象および当該企業業績の対に関するノード間の接続を前記因果関係データベースに登録する第6のステップと
    を有する処理をコンピュータに実行させ、
    前記経済事象のダイジェストは、経済事象の内容を予め定められた複数の項目に区分することによって構造化されており、当該複数の項目は、経済事象の定量または傾向を表す項目と、その変動方向を表す項目とを有し、
    前記企業業績のダイジェストは、企業業績の内容を予め定められた複数の項目に区分することによって構造化されており、当該複数の項目は、勘定科目を表す項目と、その変動方向を表す項目とを有することを特徴とする因果関係抽出プログラム。
  6. 前記第3および第4のステップは、同一ダイジェストとみなす表現パターンを複数登録した名寄せ辞書を参照して、前記抽出された経済事象および前記抽出された企業業績について、同一ダイジェストの事象ノードおよび同一ダイジェストの業績ノードが前記因果関係データベースに登録されているか否かを判断するステップを有することを特徴とする請求項5に記載された因果関係抽出プログラム。
  7. 前記第6のステップは、前記因果関係データベースに登録されており、かつ、事象ノードおよび業績ノードとして接続関係にある一連の登録済ノードについて、前記変動方向を反転させた上でコピーすることによって、前記因果関係データベースに予測事象ノードおよび予測業績ノードとして登録するステップを有することを特徴とする請求項5に記載された因果関係抽出プログラム。
  8. 前記第6のステップは、反転関係にある表現のセットを複数登録した反転辞書を参照して、前記登録済ノードにおける変動方向の反転に相当する表現が存在することを条件として、前記予測事象ノードおよび前記予測業績ノードとして登録することを特徴とする請求項7に記載された因果関係抽出プログラム。

JP2019135001A 2018-07-26 2019-07-23 因果関係抽出システムおよび因果関係抽出プログラム Active JP6723673B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018140100 2018-07-26
JP2018140100 2018-07-26

Publications (2)

Publication Number Publication Date
JP2020024689A true JP2020024689A (ja) 2020-02-13
JP6723673B2 JP6723673B2 (ja) 2020-07-15

Family

ID=69618814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019135001A Active JP6723673B2 (ja) 2018-07-26 2019-07-23 因果関係抽出システムおよび因果関係抽出プログラム

Country Status (1)

Country Link
JP (1) JP6723673B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021128628A (ja) * 2020-02-14 2021-09-02 株式会社メガ・テクノロジー 安全情報管理システムおよびその方法
JP2021189994A (ja) * 2020-06-04 2021-12-13 株式会社xenodata lab. 指標推定システムおよびそのプログラム
JP2021189995A (ja) * 2020-06-04 2021-12-13 株式会社xenodata lab. 経済指標推定システムおよびそのプログラム
DE102021212260A1 (de) 2020-11-27 2022-06-02 Robert Bosch Gesellschaft mit beschränkter Haftung Datenanalysevorrichtung und Datenanalyseverfahren
WO2023112335A1 (ja) * 2021-12-17 2023-06-22 日本電信電話株式会社 戦略立案支援装置、通信システム、戦略立案支援方法、及びプログラム
JP7488207B2 (ja) 2021-02-18 2024-05-21 株式会社日立製作所 将来事象推定システム、および将来事象推定方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123795A (ja) * 2009-12-14 2011-06-23 Nomura Research Institute Ltd 株価影響企業検知システム及びプログラム
JP2017194727A (ja) * 2016-04-18 2017-10-26 株式会社日立製作所 因果関係抽出装置、因果関係抽出方法及び因果関係抽出プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011123795A (ja) * 2009-12-14 2011-06-23 Nomura Research Institute Ltd 株価影響企業検知システム及びプログラム
JP2017194727A (ja) * 2016-04-18 2017-10-26 株式会社日立製作所 因果関係抽出装置、因果関係抽出方法及び因果関係抽出プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西村他: "ベクトル表現を用いた因果関係連鎖の抽出", 第20回 人工知能学会 金融情報学研究会(SIG−FIN), JPN6019005875, 20 March 2018 (2018-03-20), JP, ISSN: 0004282007 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021128628A (ja) * 2020-02-14 2021-09-02 株式会社メガ・テクノロジー 安全情報管理システムおよびその方法
JP7359345B2 (ja) 2020-02-14 2023-10-11 株式会社メガ・テクノロジー 安全情報管理システムおよびその方法
JP2021189994A (ja) * 2020-06-04 2021-12-13 株式会社xenodata lab. 指標推定システムおよびそのプログラム
JP2021189995A (ja) * 2020-06-04 2021-12-13 株式会社xenodata lab. 経済指標推定システムおよびそのプログラム
JP7235329B2 (ja) 2020-06-04 2023-03-08 株式会社xenodata lab. 経済指標推定システムおよびそのプログラム
JP7246736B2 (ja) 2020-06-04 2023-03-28 株式会社xenodata lab. 指標推定システムおよびそのプログラム
DE102021212260A1 (de) 2020-11-27 2022-06-02 Robert Bosch Gesellschaft mit beschränkter Haftung Datenanalysevorrichtung und Datenanalyseverfahren
JP7488207B2 (ja) 2021-02-18 2024-05-21 株式会社日立製作所 将来事象推定システム、および将来事象推定方法
WO2023112335A1 (ja) * 2021-12-17 2023-06-22 日本電信電話株式会社 戦略立案支援装置、通信システム、戦略立案支援方法、及びプログラム

Also Published As

Publication number Publication date
JP6723673B2 (ja) 2020-07-15

Similar Documents

Publication Publication Date Title
JP6723673B2 (ja) 因果関係抽出システムおよび因果関係抽出プログラム
Cheng et al. Knowledge graph-based event embedding framework for financial quantitative investments
Xie et al. Semantic frames to predict stock price movement
US20190347282A1 (en) Technology incident management platform
Wu et al. Flame: A probabilistic model combining aspect based opinion mining and collaborative filtering
AU2023206202A1 (en) Risk identification and risk register generation system and engine
Alkubaisi et al. Stock market classification model using sentiment analysis on twitter based on hybrid naive bayes classifiers.
Chowdhury et al. News analytics and sentiment analysis to predict stock price trends
JP5471673B2 (ja) 文書分類装置、プログラムおよび記憶媒体
CN111666413B (zh) 基于评论者可信赖度回归预测的商品评论推荐方法
JP2007011604A (ja) 不具合診断システム及びプログラム
Chkoniya Challenges in decoding consumer behavior with data science
Sharma et al. A study of tree based machine learning techniques for restaurant reviews
Addepalli et al. A proposed framework for measuring customer satisfaction and product recommendation for ecommerce
CN112632964B (zh) 基于nlp的行业政策信息处理方法、装置、设备及介质
JP2016197332A (ja) 情報処理システム、情報処理方法、およびコンピュータプログラム
Singh et al. Issue and challenges of online user generated reviews across social media and e-commerce website
Hantoro et al. A Implementation of Text Mining In Sentiment Analysis of Shopee Indonesia Using SVM
Sakhare et al. E-commerce Product Price Monitoring and Comparison using Sentiment Analysis
Bodaghi et al. A financial anomaly prediction approach using semantic space of news flow on twitter
Narayana Royal et al. Detection of Fake Reviews on Products Using Machine Learning
Fang et al. A collaborative trend prediction method using the crowdsourced wisdom of web search engines
Pınar et al. The Impact of the COVID-19 Outbreak on Customer Purchasing Behavior in the E-commerce Sector Project
Rabo et al. Comparing Text Similarity Functions For Outlier Detection: In a Dataset with Small Collections of Titles
Tumu et al. Context based sentiment analysis approach using n-gram and word vectorization methods

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190723

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190731

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190731

AA64 Notification of invalidation of claim of internal priority (with term)

Free format text: JAPANESE INTERMEDIATE CODE: A241764

Effective date: 20190807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191001

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20191021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200623

R150 Certificate of patent or registration of utility model

Ref document number: 6723673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250