JP2009116869A - エンティティ関係マイニング装置および方法 - Google Patents

エンティティ関係マイニング装置および方法 Download PDF

Info

Publication number
JP2009116869A
JP2009116869A JP2008273950A JP2008273950A JP2009116869A JP 2009116869 A JP2009116869 A JP 2009116869A JP 2008273950 A JP2008273950 A JP 2008273950A JP 2008273950 A JP2008273950 A JP 2008273950A JP 2009116869 A JP2009116869 A JP 2009116869A
Authority
JP
Japan
Prior art keywords
entity
time
relationship
series
entity relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008273950A
Other languages
English (en)
Other versions
JP4795417B2 (ja
Inventor
Liqin Xu
キュ リキン
Changjian Hu
ホウ チャンジェン
Toshikazu Fukushima
トシカズ フクシマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2009116869A publication Critical patent/JP2009116869A/ja
Application granted granted Critical
Publication of JP4795417B2 publication Critical patent/JP4795417B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】様々な関係への言及を含む可能性のあるニュース、ブログ、業界レポート、業界紙(誌)等の様々な形態のテキストから、時系列的な関係やイベントを抽出するための関係マイニング装置およびデータマイニング方法を提供する。
【解決手段】企業ビジネスマイニングモジュール2により、インターネット等の媒体で発信された大量テキスト情報1から様々なエンティティ関係インスタンスを自動的に抽出し、抽出したインスタンスに基づいて、様々なカテゴリのエンティティの時系列関係、関係スコア、およびエンティティ重要度をマイニングし、ビジネスイベントを検出する。
【選択図】図2

Description

本発明は、データマイニング分野に関し、特に、様々な関係への言及を含む可能性のあるニュース、ブログ、業界レポート、業界紙(誌)等の様々な形態のテキストから、データマイニングによって時系列的な関係やイベントを抽出するためのエンティティ関係マイニング装置および方法に関する。本発明は、さらに、時系列的なビジネス関係やビジネスイベントを抽出するためのデータマイニングを行うために、企業ビジネス関係の分野に適用することができる。
グローバル化の急速な進展に伴い、企業間で形成されるビジネス関係はかつてないほど複雑になっている。また、企業の成長速度もかつてないほどに高まっており、その過程においては、他企業とのビジネス関係が決定的な役割を果たしている。
一方、情報化の進展を背景に、インターネット等の媒体を介して膨大な量のビジネスニュースが発信されている。これらのビジネスニュースには企業間のビジネス関係に関する情報が多く含まれており、これまでに蓄積されてきたビジネスニュースには、あらゆる業種のビジネス関係情報が殆ど網羅されていると言っても過言ではない。これらの情報は、ビジネス情報の時系列プロセスを形成する。ビジネスコンサルティング業の会社が、この情報を取得し、その情報から時系列ビジネス情報プロセスを構築して、企業コンサルタント等のユーザにとって有益なビジネスイベント(例えば、企業間のビジネス関係モード、急成長企業のビジネス関係形成モード、産業チェーンにおける主要企業のビジネス関係形成モードなど)を抽出できれば、それはきわめて有望な技術となる。
膨大な量のニュースから、このようなビジネス関係、時系列ビジネス関係形成プロセス、およびビジネスイベントを抽出するにはどうしたらよいのだろうか。現在の情報量は人手で対応できるレベルをはるかに超えているため、手動で追跡と分析を行うことは不可能である。
唯一可能性があるのは、自動プログラム装置によって抽出を実行する方法である。こうした装置によって、大量なニュースを追跡してビジネス関係を抽出し、企業のビジネス関係とビジネスイベントを時系列的に整理して提示する、という問題が解決される。
特願2006−195535号 E Keogh & S Kasetty「On the Need for Time Series Data Mining Benchmarks:A Survey and Empirical Demonstration,Data Mining and Knowled.ged.iscovery(時系列データマイニングのベンチマークの必要性について:調査と経験的な証明、データマイニング、およびナレッジディスカバリ)」7(4)、2003
現在まで、上記の問題を完全に解決できる技術は存在せず、部分的な問題に対する解決策を提供する技術しかなかった。例えば、特許文献1(特願2006−195535号)では、テキスト形態のニュースからビジネス関係インスタンスを抽出するための技術が提案されている。各ビジネス関係インスタンスは、1つのニュースに含まれる1つの企業間ビジネス関係を示す「スナップショット」である。しかし、この特許では、これらのインスタンスに対して、時系列データのマイニングとビジネスイベントのマイニングをさらに実行する方法は提案されていない。
参考文献1の非特許文献1(E Keogh & S Kasetty「On the Need for Time Series Data Mining Benchmarks:A Survey and Empirical Demonstration,Data Mining and Knowled.ged.iscovery(時系列データマイニングのベンチマークの必要性について:調査と経験的な証明、データマイニング、およびナレッジディスカバリ)」7(4)、2003)では、多数の時系列データマイニング技術が要約されている。しかし、ビジネスイベントをマイニングする技術や、ビジネス関係がメッシュ構造の時系列データの場合に処理を実行する技術は提案されていない。
本発明は、主に、様々な関係への言及を含む可能性のあるニュース、ブログ、業界レポート、業界紙(誌)等の様々な形態のテキストから、時系列的な関係やイベントを抽出するためのデータマイニングに関する。本発明によれば、インターネット等の媒体で発信された上記のような大量テキストから様々なエンティティ関係インスタンスを自動的に抽出し、抽出したインスタンスに基づいて、エンティティの時系列関係をマイニングによって発見することができる。また、全カテゴリに及ぶエンティティを対象にエンティティ関係スコアおよび重要度のマイニングを実行し、そこから重要なイベントを抽出することもできる。さらに、本発明によれば、計算によって上記で抽出した時系列関係から企業エンティティおよびビジネス関係を取得し、ファイブフォース分析(Porter)を実行することも可能である。最後に、視覚化モジュールによって最終ユーザに結果を提示することもできる。
上記の目的を実現するため、本発明は、エンティティ関係マイニング装置であって、エンティティ関係インスタンスを読み取って時系列スコア化エンティティ関係を生成する時系列エンティティ関係抽出手段を備えることを特徴とする、エンティティ関係マイニング装置を提供する。
時系列エンティティ関係抽出手段は、生成した時系列スコア化エンティティ関係に基づいて、時系列・包括的エンティティ関係スコアをさらに生成するのが望ましい。
エンティティ関係マイニング装置は、時系列エンティティ関係抽出手段が生成した時系列包括的エンティティ関係スコアを読み取って時系列エンティティ重要度を生成する、時系列エンティティ重要度抽出手段をさらに備えるのが望ましい。
エンティティ関係マイニング装置は、時系列エンティティ関係抽出手段が生成した時系列エンティティ関係と時系列包括的エンティティ関係スコアとを読み取ってイベントを生成する、イベント検出手段をさらに備えるのが望ましい。
エンティティ関係マイニング装置は、時系列エンティティ関係抽出手段と時系列エンティティ重要度抽出手段がそれぞれ生成した、時系列エンティティ関係と、時系列包括的エンティティ関係スコアと、時系列エンティティ重要度とを読み取ってイベントを生成する、イベント検出手段をさらに備えるのが望ましい。
エンティティ関係マイニング装置は、テキスト情報データを読み取ってエンティティ関係インスタンスを生成する、関係インスタンス抽出手段をさらに備えるのが望ましい。
時系列エンティティ関係抽出手段は、最終的には、所定の期間内におけるすべての継続的エンティティ間関係がスコアを有するように、所定の期間内にエンティティ関係が発生しなかった場合にエンティティ関係の補間によってエンティティ関係のスコアを計算する、時系列補間手段を備えるのが望ましい。
エンティティは企業であり、関係はビジネス関係であるのが望ましい。また、エンティティ関係マイニング装置は、時系列エンティティ関係と時系列エンティティ重要度とに基づいて時系列フォースデータ(競争要因データ)を生成する、時系列ファイブフォース分析手段をさらに備えるのがより望ましい。
エンティティは製品、人、または国家であり、関係は製品間の関係、人間関係、または国家間の関係であるのが望ましい。
エンティティ関係マイニング装置は、時系列エンティティ関係、時系列包括的エンティティ関係スコア、時系列エンティティ重要度、および時系列フォースデータの少なくとも1つに基づいて視覚化インタフェースを生成する、視覚化手段をさらに備えるのが望ましい。
上記の目的を実現するため、本発明は、エンティティ関係マイニング方法であって、エンティティ関係インスタンスを読み取って時系列スコア化エンティティ関係を生成する時系列エンティティ関係抽出ステップを含むことを特徴とする、エンティティ関係マイニング方法を提供する。
時系列エンティティ関係抽出ステップにおいて、生成した時系列スコア化エンティティ関係に基づいて、時系列包括的エンティティ関係スコアを生成するのが望ましい。
エンティティ関係マイニング方法は、時系列エンティティ関係抽出ステップで生成した時系列包括的エンティティ関係スコアを読み取って時系列エンティティ重要度を生成する、時系列エンティティ重要度抽出ステップをさらに含むのが望ましい。
エンティティ関係マイニング方法は、時系列エンティティ関係抽出ステップで生成された時系列エンティティ関係と時系列包括的エンティティ関係スコアとを読み取ってイベントを生成する、イベント検出ステップをさらに含むのが望ましい。
エンティティ関係マイニング方法は、時系列エンティティ関係抽出ステップと時系列エンティティ重要度抽出ステップでそれぞれ生成された、時系列エンティティ関係と、時系列包括的エンティティ関係スコアと、時系列エンティティ重要度とを読み取ってイベントを生成する、イベント検出ステップをさらに含むのが望ましい。
エンティティ関係マイニング方法は、テキスト情報データを読み取ってエンティティ関係インスタンスを生成する、関係インスタンス抽出ステップをさらに含むのが望ましい。
時系列エンティティ関係抽出ステップは、最終的には、所定の期間内におけるすべての継続的エンティティ間関係がスコアを有するように、所定の期間内にエンティティ関係が発生しなかった場合にエンティティ関係の補間によってエンティティ関係のスコアを計算する、時系列補間サブステップを含むのが望ましい。
エンティティは企業であり、関係はビジネス関係であるのが望ましい。また、エンティティ関係マイニング方法は、時系列エンティティ関係と時系列エンティティ重要度とに基づいて時系列フォースデータ(競争要因データ)を生成する、時系列ファイブフォース分析ステップをさらに含むのがより望ましい。
エンティティは製品、人、または国家であり、関係は製品間の関係、人間関係、または国家間の関係であるのが望ましい。
エンティティ関係マイニング方法は、時系列エンティティ関係、時系列包括的エンティティ関係スコア、時系列エンティティ重要度、および時系列フォースデータの少なくとも1つに基づいて視覚化インタフェースを生成する、視覚化ステップをさらに含むのが望ましい。
本発明によれば、大量な情報からエンティティ関係を抽出して、時系列データマイニングを自動的に実行するという問題、大量な時系列エンティティ関係を追跡して、最終的に有効なイベントを発見するという問題、大量な時系列エンティティ関係に基づいてファイブフォースに関する分析を取得するという問題、および上記で発見されたエンティティ情報を視覚的に提示するという問題が、効果的に解決される。
以下では、図面を参照して、本発明の好適な実施例を説明する。本発明の理解に混乱をきたさないよう、本発明の説明には無用な詳細および機能については省略する。さらに、以下の説明では、エンティティの一例として企業、および関係の一例としてビジネス関係を用いて、本発明による関係マイニング装置および方法を詳細に説明する。ただし、本発明のエンティティは企業に限定されず、自然人、国家、製品等のエンティティであってもよいことに留意されたい。同様に、本発明の関係はビジネス関係に限定されず、人間関係や国家間の関係のような他の社会的関係にも適用できる。
(企業をエンティティとする場合のシステムの説明)
図1は、企業ビジネス関係マイニングシステムを示すブロック図である。参照番号1は、データベースに格納されたテキスト情報データを示し、このデータは、ビジネス関係への言及を含む可能性のあるニュース、ブログ、業界レポート、業界紙(誌)等の様々な形態のテキストか、またはテキストに変換できる他の形態のデータソースである。参照番号2は、本発明によるエンティティ関係マイニング装置を示す。このエンティティ関係マイニング装置は、テキスト情報データ1を読み取って企業ビジネス関係のマイニングを行い、最終的に様々な提示形態の関係データを生成して、企業ビジネス関係データベース3に格納する。視覚化モジュール4は、企業ビジネス関係データベース3内のデータを読み取って視覚化インタフェースを生成する。この場合、視覚化インタフェースを生成する機能を実現するために、視覚化モジュール4をエンティティ関係マイニング装置2の内部または外部のいずれに設置してもよい。
(企業ビジネス関係マイニング装置)
図2は、本発明の第1の実施例による企業ビジネス関係マイニングモジュール2を示すブロック図およびデータフローチャートである。本実施例においては、企業ビジネス関係マイニングモジュール2は以下の4つのサブモジュールに分割することができる。1つ目は、テキスト情報データ1を読み取って企業ビジネス関係インスタンス31を生成するための、ビジネス関係インスタンス抽出サブモジュール21である。このモジュールは任意のモジュールであり、本実施例の説明で示すものとは異なる方法で実装することも可能である。2つ目は、ビジネス関係インスタンス抽出サブモジュール21が生成した企業ビジネス関係インスタンス31を読み取って、時系列スコア化企業ビジネス関係32と時系列包括的企業ビジネス関係スコア33とを生成するための、時系列企業関係抽出サブモジュール22である。3つ目は、時系列企業関係抽出サブモジュール22が生成した時系列包括的企業ビジネス関係スコア33を読み取って、時系列企業ビジネス重要度34を生成するための、時系列企業ビジネス重要度抽出サブモジュール23である。4つ目は、時系列企業関係抽出サブモジュール22および時系列企業ビジネス重要度抽出サブモジュール23がそれぞれ生成した時系列スコア化企業ビジネス関係32と、時系列包括的企業ビジネス関係スコア33と、時系列企業ビジネス重要度34とを読み取って、ビジネスイベント35を生成するための、ビジネスイベント検出サブモジュール24である。
テキスト情報1は、コンテンツ、発行時刻、任意のソース(取得先のウェブサイトなど)で構成される。テキスト情報1のデータ構造は、以下のとおりである。

Figure 2009116869

企業関係インスタンス31とは、テキスト情報1で言及される2つの企業間のビジネス関係であり、そのデータ構造は以下のとおりである。
Figure 2009116869

関係タイプとは、競争、協力、株式保有、供給、法人設立、買収などである。以下の式では、RI(A,B,X,t’)は企業関係インスタンスを表し、ここでは、日付t’におけるA社とB社間のビジネス関係インスタンスXを意味する。
時系列スコア化企業ビジネス関係32とは、ある期間において2つの企業間に何らかの時系列的ビジネス関係とそのスコアが存在することを意味する。ここで、スコアとは、当該時間単位にこの関係が存在することに関する信頼度である。具体的には、2つの企業の両方が、この期間内の各時間単位(ここでは1カ月)において、このビジネス関係と対応するスコアを有する。スコアが高いほど、関係の信頼度は高くなる。スコアが0の場合は、その関係が存在しないことを意味する。表3に、このデータ構造の例を示す。
Figure 2009116869

時間単位tにおけるA社とB社間のビジネス関係Xのスコアは、sA,B,X(t)を使用して表す。
表4に、与えられた期間が2000年3月〜2007年9月の場合の2つの例を示す。
Figure 2009116869

時系列包括的企業ビジネス関係スコア33とは、ある期間中に2つの企業間に時系列包括的ビジネス関係スコアが存在し、かつ、それから導出されたこの期間中の総ビジネス関係スコアも存在することを意味する。総ビジネス関係スコアとは、時系列関係スコアの平均である。このデータ構造の例を以下に示す。
Figure 2009116869

時間tにおけるA社とB社間のビジネス関係スコアはsA,B(t)を使用して表し、A社とB社間の総ビジネス関係スコアはsA,Bを使用して表す。表6に一例を示す。
Figure 2009116869

時系列企業ビジネス重要度34とは、所定の期間内における企業の時系列ビジネス重要度を意味する。ビジネス重要度とは、企業が属する業種と実業界全体における企業の重要度を意味する。そのデータ構造を以下に示す。
Figure 2009116869

時間tにおけるA社のビジネス重要度はsA,B(t)を使用して表す。
ビジネスイベント35とは、上記データから抽出可能な、ユーザまたは他企業にとって有効でかつ発見的な意味を有するイベントを意味する。ビジネスイベントは、単純イベントまたは複合イベントに分類することができる。単純イベントとは、企業間に発生するイベント的ビジネス関係であり、時系列スコア化企業ビジネス関係32から直接取得することができる。例えば、2000年1月にA社がB社を買収した、というような情報がこれに該当する。複合イベントとは、ユーザまたは他企業にとって発見的な意味を有する、業界分析の観点から抽出される高レベルなイベントを意味する。これらのイベントは直接抽出することはできず、時系列スコア化企業ビジネス関係32と、時系列包括的企業ビジネス関係スコア33と、時系列企業ビジネス重要度34とを分析することによって初めて抽出可能となる。例えば、1998年1月〜2001年1月にA社は業界の中核的な企業であった、1999年1月〜2000年1月にB社は急成長した、2004年1月〜2005年1月にC社は不振であった、1999年3月〜2000年1月にA社とB社が急成長した、2004年3月〜2005年1月にC社とD社の関係が悪化した、などの情報がこれに該当する。
ビジネス関係インスタンス抽出サブモジュール21
ビジネス関係インスタンス抽出サブモジュール21は、日本国特許第2006−195535号等の従来技術に基づいて実装することができる。
時系列企業関係抽出サブモジュール22
図5は、時系列企業関係抽出サブモジュール22を示すブロック図およびデータフローチャートである。
企業ビジネス関係インスタンス強さ計算手段221は、各企業ビジネス関係インスタンスRI(A,B,X,t’)に基づいて、ある時間単位tにおけるA、B、Xの企業ビジネス関係の強さSI(A,B,X,t’)を計算する。
企業ビジネス関係インスタンスA、B、Xは、この時間単位tの間に複数回発生する可能性もある。例えば、このインスタンスが異なるニュースサイトで取り上げられたり、tの間に複数回指摘されたりする場合がこれに該当する。時間単位tにおける企業ビジネス関係インスタンス数はCtを使用して表す。したがって、SI(A,B,X,t)は以下の式で計算できる。
Figure 2009116869
ここで、niは対応するi番目のインスタンス、ms(ni)はこのインスタンスのニュースの照合スコアである。また、「強さ」とは、時間単位tにおける全インスタンスのスコアの合計である。
時系列補間手段222は、最終的には、所定の期間内におけるすべての継続的な企業間関係がスコアを有するように、所定の期間内に企業ビジネス関係インスタンスが発生しなかった企業関係のスコアを補間により計算する。継続的な企業関係とは、関係が1度限りのイベント的な関係ではなく、一定期間にわたって継続することを意味する。例えば、競争、協力、株式保有、供給はすべて継続的なビジネス関係である。例えば、2000年6月にはA社とB社の間に競争関係がなく、この関係が2000年1月より前に発生したような場合には、この関係の直前のスコアを使用して、2000年6月のスコアが補間により計算される。以下に、補間の実行方法の例を示す。
ここで、2企業間の関係RIが、最初にt0に発生し、最後にtmに発生すると想定する。
tにおける企業関係の強さを計算するため、tの直前に発生したインスタンスがtに発生し、tの直後に発生したインスタンスがtlに発生すると想定する。
Figure 2009116869
上記の例では、関係のスコアは時間の経過に伴って指数関数的に減少または増大するが、当該技術に精通する当業者にはよく知られているように、この変動は、一定時間、直線的な減少または増大となる可能性が高い。
イベント的ビジネス関係/矛盾処理手段223は、イベント的なビジネス関係を処理する。イベント的なビジネス関係とは、継続的なビジネス関係ではない、1度限りのイベントを意味する。例えば、法人設立と買収はイベント的なビジネス関係であり、競争、協力、株式保有、供給はすべて継続的なビジネス関係である。このプロセスは、関係自体のスコアの処理と、矛盾の処理と、影響を受ける他の関係の処理とで構成される。以下に、この処理方法の例を示す。
最初に、矛盾の問題を取り上げる。矛盾の解決手法は以下のとおりである。
時間矛盾処理:イベント的な関係は、理論的には1度だけ発生するはずである。しかし、インターネット上の情報は完全に信頼できるものではないため、矛盾が生じる可能性がある。矛盾がある場合、すなわちRI(A,B,X,t1)とRI(A,B,X,t2)(t1<t2)が同時に発生した場合には、調整後の企業関係の強さは以下のようになる。
sA,B,X(t1)=siA,B,X(t1)+siA,B,X(t2)
sA,B,X(t2)=0
方向矛盾処理:方向矛盾処理は、買収のような方向性のあるイベント的関係を処理する。このような関係においては、2企業間の正しい方向は1つしか存在しない。RI(A,B,X,t1)とRI(A,B,X,t2)(t1<t2)が同時に存在しており、以下が成り立つ場合には、
Figure 2009116869
次のような式となる。
sA,B,X(t1)=siA,B,X(t1)
sA,B,X(t2)=0
成り立たない場合には、次のような式となる。
sA,B,X(t1)=0
sA,B,X(t2)=sA,B,X(t2)
次に、他のビジネス関係への影響が処理される。Xが法人設立または買収の関係で、かつ、sA,B,X(t1)>TH(THは予め決定されたしきい値)の場合には、A社とB社はt1後に買収により1つの会社となるのであり、A社とB社の間で維持される継続的な関係はない。法人設立後、A社(またはB社)と他企業との間における関係スコアは以下のように調整される。
sA’,C,X(t)=sA,C,X(t)+sB,C,X(t)
上記の処理が完了した後、イベント的ビジネス関係/矛盾処理手段223は時系列スコア化企業ビジネス関係32を出力する。
時系列包括的企業ビジネス関係スコア計算手段224は、2企業間の時系列包括的ビジネス関係スコアと平均総ビジネス関係スコアを計算する。具体的には、これらの関係スコアの加重平均が計算され、以下の式で表される時系列包括的ビジネス関係スコアが取得される。
sA,B(t)=Σw(X)・sA,B,X(t)
ここで、w(X)は個々の関係の重みである。この重みは経験値とするか、または統計的手法によって得ることができる。統計的手法の例としては、1つの関係が1つの業界で発生する確率を計算し、それを重みとして使用する方法が挙げられる。この場合は、その後、総ビジネス関係スコアが、一定期間における平均として算出される。時系列包括的企業ビジネス関係スコア計算手段224は、上記の処理の後、時系列包括的企業ビジネス関係スコア33を出力する。
(時系列企業ビジネス重要度抽出サブモジュール23)
図6は、時系列企業ビジネス重要度抽出サブモジュール23を示すブロック図およびデータフローチャートである。
グラフ作成手段231は、各時間単位に関する企業のグラフを作成する。このグラフでは、企業は頂点で表され、各2企業間の包括的ビジネス関係スコア33は頂点を結ぶ辺で表される。そのため、ここでは、重み付きの無向グラフが生成される。
グラフノード重要度計算手段232は、ページランク手法やHITSアルゴリズムなどのグラフノード重要度計算手法を用いて各ノード(企業)の重要度を計算し、時系列企業ビジネス重要度34を出力する。
図7は、時系列企業ビジネス重要度抽出サブモジュール23を示すもう1つのブロック図およびデータフローチャートである。
グラフ作成手段231は、各時間単位に関する企業のグラフを作成する。このグラフでは、企業は頂点で表され、各2企業間の包括的ビジネス関係スコア33は頂点を結ぶ辺で表される。そのため、ここでは、重み付きの無向グラフが生成される。
グラフノード結合度計算手段233は、各ノード(企業)への結合数の合計や、各ノードへの結合の重みの合計といった従来のグラフノード結合度計算手法を用いて、各ノードの重要度を計算し、時系列企業ビジネス重要度34を出力する。
(ビジネスイベント検出サブモジュール24)
図8は、ビジネスイベント検出サブモジュール24を示すブロック図およびデータフローチャートである。
ルールベースイベント抽出手段242は、予め定義されたルール241を使用してすべての入力データを検出し、予め定義されたルール241に一致するビジネスイベントを出力する。予め定義されたルール241は、手動で事前定義してもよい。ルールの例としては、次のようなものが挙げられる。
・単純イベントを時系列スコア化企業ビジネス関係32から直接抽出する。さらなる判定が必要な買収イベントについては、A社がB社を買収する場合と、A社がB社の1部門を買収する場合の2つのケースがある。これら2つのケースは、以下の基準に基づいて判定できる。
§A社がB社を買収する際には、A社の重要度が、(1)B社の重要度よりもはるかに高いか、または(2)B社の重要度よりも高く、B社の重要度が以後継続的に減少した場合に、A社がB社を買収するに至る。
§上記の条件が満たされなかった場合、A社がB社の一部門を買収する。
・A社のビジネス重要度が
Figure 2009116869

の場合には、A社はt0〜t1の期間中において主要企業である。
・A社について、
Figure 2009116869
が成り立つ場合には、Aはt0〜t1の期間中に急速に成長したと判断できる。
・A社について、
Figure 2009116869
が成り立つ場合には、Aはt0〜t1の期間中に何らかの問題を抱えていると判断できる。
・A社およびB社について、
Figure 2009116869
が成り立つ場合には、A社とB社の関係はt0〜t1の期間中に急速に進展したと判断できる。
・A社およびB社について、
Figure 2009116869
が成り立つ場合には、A社とB社の関係はt0〜t1の期間中に悪化したと判断できる。
図9は、ビジネスイベント検出サブモジュール24を示すブロック図およびデータフローチャートである。
図8と比較して、図9では、補助情報243(企業の売上高や利益などの開示された企業情報を事前に収集したもの)と、企業外部スコア計算手段244が追加されている。企業外部スコア計算手段244は、例えば単純加算や加重加算などの使用可能な任意のスコア計算を補助情報243に対して行って、企業の外部スコアを取得する。
ここで、ルールベースイベント抽出手段242が使用するルールには、図8を参照して説明した、事前定義されたルール241に加えて、補助情報243を使用して企業外部スコア計算手段244が取得した企業外部スコアに関する情報を含めてもよい。以下にその例を示す。
・A社のビジネス重要度が
Figure 2009116869
で、A社の外部スコアがしきい値よりも高い場合には、A社はt0〜t1の期間中において主要企業であると判断できる。
・A社について、
Figure 2009116869
が成り立ち、かつt1におけるA社の外部スコアがしきい値よりも高い場合には、A社はt0〜t1の期間中に急速に成長したと判断できる。
・A社について、
Figure 2009116869
が成り立ち、かつt1におけるA社の外部スコアがしきい値よりも低い場合には、A社はt0〜t1の期間中に何らかの問題を抱えていると判断できる。
(*具体例(時系列企業関係抽出サブモジュール22、時系列企業ビジネス重要度抽出サブモジュール23、およびビジネスイベント検出サブモジュール24の具体的な出力結果))
以下では、時系列企業関係抽出サブモジュール22、時系列企業ビジネス重要度抽出サブモジュール23、およびビジネスイベント検出サブモジュール24の具体的な出力結果の例を示す。
以下の例では、企業関係の時間単位を1カ月間とし、2007.1.1〜2007.7.31(2007年1月1日〜2007年7月31日)における4企業(A社、B社、C社、D社)に関する出力結果を示す。
時系列企業関係抽出サブモジュール22は、ニュースから以下の企業関係インスタンス31を取得する。
Figure 2009116869

Figure 2009116869
企業ビジネス関係インスタンス強さ計算手段221によって得られたインスタンスの強さは、以下のとおりである。ここで、照合スコアの値は1.0とした。
Figure 2009116869
Figure 2009116869
時系列補間手段222によって得られた補間済み企業関係は、以下のとおりである。ここで、λ=0.223144である。
Figure 2009116869
Figure 2009116869
Figure 2009116869
Figure 2009116869
イベント的ビジネス関係/矛盾処理手段223によって出力された時系列スコア化企業ビジネス関係32は以下のとおりである。
Figure 2009116869
Figure 2009116869
Figure 2009116869
Figure 2009116869
時系列包括的企業ビジネス関係スコア計算手段224によって得られた時系列包括的企業ビジネス関係スコア33は、以下のとおりである。ここでは、個々の継続的な関係の重みの値は1、イベント的関係(買収、法人設立)の重みの値は0とした。
Figure 2009116869
Figure 2009116869
時系列企業ビジネス重要度抽出サブモジュール23(図6)によって計算された時系列企業ビジネス重要度34は、以下のとおりである。
Figure 2009116869
Figure 2009116869
ビジネスイベント検出サブモジュール24は、以下のイベントを取得する。
2007.5にA社がC社を買収した。
2007.5後にA社とD社の関係が急速に進展した。
2007.6後にD社が急速に成長した。
図3は、本発明の第2の実施例による企業ビジネス関係マイニングモジュール2を示すもう1つのブロック図およびデータフローチャートである。図2と比較すると、時系列企業ビジネス重要度抽出サブモジュール23がない点が異なる。そのため、時系列企業ビジネス重要度34は生成されない。したがって、ビジネスイベント検出サブモジュール24内のルールは、時系列企業ビジネス重要度34に関連するどの部分とも一致しない。
図4は、本発明の第3の実施例による企業ビジネス関係マイニングモジュール2を示すブロック図およびデータフローチャートである。図2と比較して、図4では、時系列ファイブフォース分析サブモジュール25が追加されている点が異なる。時系列ファイブフォース分析サブモジュール25は時系列フォースデータ36を生成する。
ファイブフォース分析は、Michael E. Porter(「Competitive Strategy(競争の戦略)」、Free Press、1980)が提唱したもので、「新規参入の脅威」、「供給企業の交渉力」、「競争企業間の敵対関係」、「買い手の交渉力」、「代替品の脅威」という5つのフォース(競争要因)から成る。このファイブフォース分析で、企業の競争力を大幅に向上させることができる。ファイブフォースは経時変化するため、時系列フォースデータ36が企業ビジネス関係データベース3に格納される。時系列ファイブフォース分析サブモジュール25は、時系列スコア化企業ビジネス関係32と時系列企業ビジネス重要度34とに基づいて、時系列フォースデータ36を計算する。
図10は、時系列ファイブフォース分析サブモジュール25を示すブロック図およびデータフローチャートである。
時系列ファイブフォース分析サブモジュール25は6つの手段を備えており、そのうち業種分割手段251は、所定の業種に基づいて、入力時系列スコア化企業ビジネス関係32と時系列企業ビジネス重要度34とを分割して、この個別の業種(すなわち、所定の業種)に関する時系列企業ビジネス関係32とビジネス重要度34とを出力する。業種分割手段251は、様々な方法によって上記の分割を実行することができる。その1つは、既知の企業リストを使用して、時系列スコア化企業ビジネス関係32と時系列企業ビジネス重要度34とをフィルタリングする方法である。もう1つは、ユーザによって与えられた企業リストを使用して、フィルタリングを実行する方法である。そしてさらに、業種に対してグラフベースのクラスタリングを実行して、個々の業種に関する入力を取得する方法もある。参照番号252〜256は、それぞれ5種類のファイブフォース計算手段を示す。
新規参入脅威分析手段252は、以下のように動作する。
すなわち、t0以前にビジネス重要度が0(すなわち、存在していなかったか、この業界に参入していなかった企業)で、かつ、t0〜t0+Δtの間にビジネス重要度が0より大きい企業を選択することにより、t0時点における新規参入の脅威を計算する。この企業数が、新規参入脅威スコアとなる。また、これらの企業のビジネス重要度スコアを算出することもできる。
供給企業交渉力分析手段253は、以下のように動作する。
すなわち、t0時点おけるすべての供給関係を取得し、この業種の供給関係スコアを合算して、供給企業の交渉力を生成することにより、t0時点における供給企業の交渉力を計算する。
買い手交渉力分析手段254は、以下のように動作する。
すなわち、t0時点おけるすべての供給関係を取得し、この業種の買い手の供給関係スコアを合算して、買い手の交渉力を生成することにより、t0時点における買い手の交渉力を計算する。
競争企業間敵対関係分析手段255は、以下のように動作する。
すなわち、t0時点おけるすべての競争関係を取得し、結果として累積スコアを計算することにより、t0時点おける競争企業間の敵対関係を計算する。
代替品脅威分析手段256は、以下のように動作する。
第1のスキーム:まず、t0時点おける代替品の脅威を計算する。このシステムに製品情報はないため、代替品脅威分析の結果を得ることは不可能である。ここでは、代替品の脅威の代わりに、将来の競争動向を使用する。将来の競争動向は製品情報に関連せず、その代わりに、将来企業が遭遇する可能性のある競争全般を示す。よって、t0時点には存在せず、t0〜t0+Δtに存在していたすべての競争関係を選択し、スコアを累計して結果とする。
第2のスキーム:この業種の複数種の製品に対応する下位業種を手動で選択し、t0時点における1製品の下位業種と他の製品の下位業種との競争関係を選択し、スコアを累計して結果とする。
(視覚化モジュール)
視覚化モジュール4は、本発明により抽出された企業ビジネス関係を、ユーザインタラクションのためのビジネス関係提示ビューとして描画するために備えられる。このビュー上で、ユーザはビジネス関係に対して各種操作(取り込みとロケーションの特定、ビジネス関係の時間間隔における変動の確認、検出されたイベントの同期表示、および各種ビューにおける固有の関係の構築)を実行することができる。視覚化モジュールは任意のモジュールである。視覚化に関するスキームは本発明で説明するスキームに限定されず、従来のスキームを使って実現することも可能である。
図11は、視覚化モジュール4を示すブロック図およびデータフローチャートである。
データバッファ領域+データロード+データ前処理手段41は、システムが目的のデータ情報を迅速に抽出できるように、データベース内にデータを高速でロードし、時系列情報に基づいて、所定のバッファ領域にブロック単位でそれを格納するために備えられる。データバッファ領域+データロード+データ前処理手段41への入力情報は、企業ビジネス関係データベース3内のすべての情報である。出力情報は、実際のユーザとのインタラクティブイベントの解析によって異なるが、主に以下の3種類のデータの組み合わせとなる。
1)時系列企業ビジネス重要度34
2)時系列スコア化企業ビジネス関係32
3)ビジネスイベント35
システム初期化設定手段42は基本ビュータスクを生成し、ユーザインタラクティブイベント解析手段48は一連のビュータスクを生成する。ビュータスク実行手段43は、主に、以下の2つの動作を実行する。1つ目は、オリジナルデータの記述のロケーションを特定する動作である。これにより、データバッファ領域+データロード+データ前処理手段41がデータのこの部分を解析して、関連データの情報を抽出することが可能になる。もう1つは、タスク(抽出されたデータに基づいて基本グラフを生成する、どのグラフ追加情報計算アルゴリズムを使用するか、どのビューレンダリング方法を使用するか、など)に対応して実行される、一連のアルゴリズム呼び出しフローである。ビュータスク実行手段43は、関連のビュータスクを実行し、フローの方向を決定するためのビュータスクエンジンである。
基本グラフ生成手段44は、基本ノード情報と結合線情報を生成するために備えられる。図12および13は、基本グラフの生成例である。ノードと結合線を構築する方法には、少なくとも2通りがある。第1の方法(図12)では、ノードは企業情報、結合線情報は企業ビジネス関係エンティティである。ノードのサイズは企業の重要度に対応し、結合線の幅または長さパラメータは企業ビジネス関係のスコアに対応し、ラインの色はビジネス関係のタイプに対応する。第2の方法(図13)では、ビジネス関係の開始がノードとして使用される。また、結合線は、企業参照ラインとイベント開始関連付けラインとに分類することができる。イベント開始関連付けラインの色は、ビジネス関係に対応する。
グラフ追加情報計算手段45は、ビューのレイアウトをプランニングするために備えられ、主に以下の動作を実行する。すなわち、1)ノード位置情報の計算:個々のノードのレイアウトと結合線のレイアウトを交差や重複が生じないように決定し、最終的には、個々のノード/結合線の3次元座標を取得する。2)ロケーション情報の計算:すべての関連付けビューに含まれるノードおよび結合線のロケーション情報を計算し、結果を<オブジェクト、ビュー、位置>の形式で出力して、テーブル構造に格納する。3)関連付け情報の計算:ノードとその結合線に関して、他の関連付けられた背景データ情報(例:ある時点にノードで発生したイベントに関する情報)を計算する。結合線は、その時点に発生したニュースなどに関する情報に対応する。4)レベル情報の計算:企業ビジネス関係に基づくレベルの分割。5)パーティション情報の計算:どのノードおよび結合線がビュー内のどのグループに属するかを計算する。その結果は、グラフ、イベント関連付けエンティティリスト、または時間間隔関連付けエンティティリストのクラスタなどにマップすることができる。6)事前ロード情報の計算:あるレベルおよびあるパーティションエンティティグループに対応するビューに事前ロードするデータ記述を計算する。この情報をもとに、ユーザ経験の向上を目的としたデータモジュールの事前ロードが開始される。
ビューレンダリングエンジン46は、基本グラフ生成手段44とグラフ追加情報計算手段によってそれぞれ生成されたビューキャッシュとグラフの追加情報とに基づいて、対応するビューをレンダリングおよび生成し、ビュータスクに対する解析結果に基づいて、ユーザイベント情報をビューの該当領域にマップする。
インタフェース提示手段47は、ビューレンダリングエンジン46の結果を画面に出力し、マウスイベントとキーボードイベントを照合して、ビューの該当する領域にマップする。
エンティティが自然人の場合には、人と人との間の人間関係が存在する。このタイプの関係は継続的関係であり、友人、同僚、夫婦、直系親族、傍系親族、敵対者、上司/部下間の監督のほか、結婚、出産、離婚のようなイベント的な関係もこれに該当する。また、これらの関係にかかわる人の間には重要度も存在するはずである。人の重要度は、社会におけるその人の影響力に基づいて決定することもできる。当該技術に精通する当業者であれば、エンティティが人の場合でも上記の方法とマイニング装置を使って関係のマイニングを実行できることは、上記の企業ビジネス関係に関する実施例から明らかである。
本発明の方法は、国際関係にも適用することができる。国際関係のタイプは継続的な関係であり、同盟関係、友好関係、敵対関係のほか、宣戦布告、外交関係の中断、併合といったイベント的関係もこれに該当する。これに対応する国家の重要度は、世界情勢における影響力である。また、本発明の方法は、エンティティが製品の場合にも適用できる。この場合、製品間の関係は継続的な関係であり、帰属や競争のほか、代替やアップグレードといったイベント的な関係もこれに該当する。これに対応する製品の重要度は、市場占有率に基づいて決定してもよい。このように、本発明の実施例(企業、ビジネス関係)を読めば、当業者は、企業とビジネス関係以外のエンティティおよび関係にも、本発明を同様の方法で適用することが可能となる。
以上、本発明についてその好適な実施例を参照して説明してきたが、本発明には、その精神と範囲から逸脱することなく、様々な変更、置換、追加を行うことが可能なことは当業者には明らかであろう。したがって、本発明の範囲は上記の実施例に限定されず、付記した請求項によってのみ定義される。
本発明の上記およびその他の目的、特徴、および利点は、図面を参照しながら、その好適な実施例について述べた以下の説明を読むことにより、さらに明らかになるであろう。
企業ビジネス関係マイニングシステムを示すブロック図である。 本発明の第1の実施例による企業ビジネス関係マイニングモジュール2を示すブロック図およびデータフローチャートである。 本発明の第2の実施例による企業ビジネス関係マイニングモジュール2を示すブロック図およびデータフローチャートである。 本発明の第3の実施例による企業ビジネス関係マイニングモジュール2を示すブロック図およびデータフローチャートである。 時系列企業関係抽出サブモジュール22を示すブロック図およびデータフローチャートである。 時系列企業ビジネス重要度抽出サブモジュール23を示すブロック図およびデータフローチャートである。 時系列企業ビジネス重要度抽出サブモジュール23を示すもう1つのブロック図およびデータフローチャートである。 ビジネスイベント検出サブモジュール24を示すブロック図およびデータフローチャートである。 ビジネスイベント検出サブモジュール24を示すもう1つのブロック図およびデータフローチャートである。 時系列ファイブフォース分析サブモジュール25を示すブロック図およびデータフローチャートである。 視覚化モジュール4を示すブロック図およびデータフローチャートである。 基本グラフの生成例である。 基本グラフの生成例である。
符号の説明
1:テキスト情報
2:企業ビジネス関係マイニングモジュール
3:企業ビジネス関係データベース
4:視覚化モジュール
21:ビジネス関係インスタンスの抽出
22:時系列企業関係の抽出
23:時系列企業ビジネス重要度の抽出
24:ビジネスイベントの検出
31:企業ビジネス関係インスタンス
32:時系列スコア化企業ビジネス関係
33:時系列包括的企業ビジネス関係のスコア
34:時系列企業のビジネス重要度
35:ビジネスイベント
25:時系列ファイブフォース分析
36:時系列フォース
221:企業ビジネス関係インスタンス強さの計算
222:時系列補間
223:イベント的ビジネス関係/矛盾処理
224:時系列包括的企業ビジネス関係スコアの計算
231:グラフの作成
232:グラフノード重要度の計算
233:グラフノード結合度の計算
241:事前定義されたルール
242:ルールベースイベントの抽出
243:入力:補助情報
244:企業外部スコアの計算
251:業種分割
252:新規参入脅威分析
253:供給企業交渉力分析
254:買い手交渉力分析
255:競争企業間敵対関係分析
256:代替品脅威分析
41:データバッファ領域
42:システムの初期化設定
43:ビュータスクの実行
44:基本グラフの生成
45:グラフ追加情報の計算
46:ビューレンダリングエンジン
47:インタフェースの提示
48:ユーザインタラクティブイベントの解析
49:グラフデータプール

Claims (52)

  1. エンティティ関係マイニング装置であって、
    エンティティ関係インスタンスを読み取って時系列スコア化エンティティ関係を生成する時系列エンティティ関係抽出手段を備えることを特徴とする、エンティティ関係マイニング装置。
  2. 前記時系列エンティティ関係抽出手段は、生成した時系列スコア化エンティティ関係に基づいて、時系列・包括的エンティティ関係スコアをさらに生成することを特徴とする請求項1に記載のエンティティ関係マイニング装置。
  3. 前記時系列エンティティ関係抽出手段が生成した時系列・包括的エンティティ関係スコアを読み取って時系列エンティティ重要度を生成する時系列エンティティ重要度抽出手段をさらに備えることを特徴とする請求項2に記載のエンティティ関係マイニング装置。
  4. 前記時系列エンティティ関係抽出手段が生成した時系列エンティティ関係と時系列・包括的エンティティ関係スコアとを読み取ってイベントを生成するイベント検出手段をさらに備えることを特徴とする請求項2に記載のエンティティ関係マイニング装置。
  5. 前記時系列エンティティ関係抽出手段と前記時系列エンティティ重要度抽出手段がそれぞれ生成した、時系列エンティティ関係と、時系列包括的エンティティ関係スコアと、時系列エンティティ重要度とを読み取ってイベントを生成するイベント検出手段をさらに備えることを特徴とする請求項3に記載のエンティティ関係マイニング装置。
  6. テキスト情報データを読み取ってエンティティ関係インスタンスを生成する関係インスタンス抽出手段をさらに備えることを特徴とする請求項1から請求項5の何れかに記載のエンティティ関係マイニング装置。
  7. 前記時系列エンティティ関係抽出手段が、
    最終的には、所定の期間内におけるすべての継続的エンティティ間関係がスコアを有するように、所定の期間内にエンティティ関係が発生しなかった場合にエンティティ関係の補間によってエンティティ関係のスコアを計算する、時系列補間手段を備えることを特徴とする請求項1から請求項6の何れかに記載のエンティティ関係マイニング装置。
  8. 前記時系列補間手段が、
    各エンティティ関係インスタンスに従って、対応するタイムユニット、すなわちエンティティ関係のスコア内のエンティティ関係の強さを計算するためのエンティティ関係インスタンス強さ計算手段と、
    時系列スコア化エンティティ関係を取得するためにイベント的関係を処理するためのイベント的ビジネス関係/矛盾処理手段の少なくとも一方を備えることを特徴とする請求項7に記載のエンティティ関係マイニング装置。
  9. エンティティ関係が発生する隣接する2時点間の期間の間、前記時系列補間手段は、スコアが一定期間直線的にあるいは指数関数的に減少あるいは増加する方法でエンティティ関係というスコアについて補間を行なうことを特徴とする請求項7又は請求項8に記載のエンティティ関係マイニング装置。
  10. 前記時系列エンティティ重要度抽出手段が、
    各時間単位におけるエンティティに関する無向グラフを作成するグラフ作成手段と、
    グラフノード重要度計算方法を利用して、各ノードの重要度、すなわちエンティティ重要度を計算するグラフノード重要度計算手段を備え、
    無向グラフにおいて、頂点はそれぞれのエンティティであり、また、頂点を接続する辺は、2つのエンティティの間の包括的なエンティティ関係スコアである重みを有する、
    ことを特徴とする請求項3に記載のエンティティ関係マイニング装置。
  11. 前記グラフノード重要度計算方法が、ページランク手法あるいはHITSアルゴリズムであることを特徴とする特徴とする請求項10に記載のエンティティ関係マイニング装置。
  12. 前記時系列エンティティ重要度抽出手段が、
    各時間単位におけるエンティティに関する無向グラフを作成するグラフ作成手段と、
    グラフノード結合度計算方法を利用して、各ノードの重要度、すなわちエンティティ重要度を計算するグラフノード結合度計算手段を備え、
    無向グラフにおいて、頂点はそれぞれのエンティティであり、また、頂点を接続する辺は、2つのエンティティの間の包括的なエンティティ関係スコアである重みを有する、
    ことを特徴とする請求項3に記載のエンティティ関係マイニング装置。
  13. 前記グラフノード結合度計算方法が、各ノードへの結合数の合計あるいは各ノードへの結合の重みの合計の計算であることを特徴とする請求項12に記載のエンティティ関係マイニング装置。
  14. 前記イベント検出手段が、
    時系列エンティティ関係および時系列・包括的エンティティ関係スコアに関連付けられた予め定義されたルールを利用することにより、入力データを全て検出し、予め定義されたルールに一致するイベントを出力するルールベースイベント抽出手段を備えることを請求項4に記載のエンティティ関係マイニング装置。
  15. 前記イベント検出手段が、
    エンティティについて外部のスコアを取得するために補助情報についてスコア計算を行なうエンティティ外部スコア計算手段と、
    エンティティについて、時系列エンティティ関係、時系列・包括的エンティティ関係スコアおよび外部スコアに関連付けられた予め定義されたルールを利用することにより、入力データをすべて検出し、前記予め定義されたルールと一致するイベントを出力するルールベースイベント抽出手段を備えることを請求項4に記載のエンティティ関係マイニング装置。
  16. 前記イベント検出手段が、
    時系列エンティティ関係、時系列・包括的エンティティ関係スコアおよび時系列エンティティ重要度に関連付けられた予め定義されたルールを利用することにより、入力データをすべて検出し、前記予め定義されたルールと一致するイベントを出力するルールベースイベント抽出手段を備えることを請求項5に記載のエンティティ関係マイニング装置。
  17. 前記イベント検出手段が、
    エンティティについて外部のスコアを取得するために補助情報についてスコア計算を行なうエンティティ外部スコア計算手段と、
    エンティティについて、時系列エンティティ関係、時系列・包括的エンティティ関係スコア、時系列エンティティ重要度および外部スコアに関連付けられた予め定義されたルールを利用することにより、入力データをすべて検出し、前記予め定義されたルールと一致するイベントを出力するルールベースイベント抽出手段を備えることを特徴とする請求項5に記載のエンティティ関係マイニング装置。
  18. 買収イベントについて、前記ルールベースイベント抽出手段は、2つのエンティティの間の完全な買収あるいは部分的な買収が、買収の際の2つのエンティティのエンティティ重要性及び/又は買収後の2つのエンティティのエンティティ重要性における変化に基づいて生じるかどうかを判定することを特徴とする請求項16又は請求項17に記載のエンティティ関係マイニング装置。
  19. 前記エンティティは企業であり、関係はビジネス関係であることを特徴とする請求項1から請求項18の何れかに記載のエンティティ関係マイニング装置。
  20. 時系列エンティティ関係と時系列エンティティ重要度とに基づいて時系列フォースデータを生成する、時系列ファイブフォース分析手段をさらに備えることを特徴とする請求項19に記載のエンティティ関係マイニング装置。
  21. 前記時系列ファイブフォース分析手段が、
    各業種について、時系列エンティティ関係および重要性を出力するために必要な業種に基づいて、入力された時系列エンティティ関係および時系列エンティティ重要度を分割する業種分割手段を備え、
    時間tにおける新規参入の脅威を計算する新規参入脅威分析手段、
    時間tにおける供給者の交渉力を計算する供給者交渉力分析手段、
    時間tにおける買い手の交渉力を計算する買い手交渉力分析手段、
    時間tにおける敵対関係を計算する敵対関係分析手段、
    時間tにおける代替品の脅威を計算する代替品脅威分析手段の
    少なくとも1つのを備えることを特徴とする請求項20に記載のエンティティ関係マイニング装置。
  22. 前記代替品脅威分析手段は、時間tにおける代替品の脅威を計算する代わりに、将来の競争動向を解析することにより、将来の可能性のある万能の競争相手を取得することを特徴とする請求項21に記載のエンティティ関係マイニング装置。
  23. 前記エンティティは、製品、人、または国家であり、前記関係は製品間の関係、人間関係、または国家間の関係であることを特徴とする請求項1から請求項18の何れかに記載のエンティティ関係マイニング装置。
  24. 時系列エンティティ関係、時系列包括的エンティティ関係スコア、時系列エンティティ重要度、および時系列フォースデータの少なくとも1つに基づいて視覚化インタフェースを生成する、視覚化手段をさらに備えることを特徴とする請求項1から請求項23の何れかに記載のエンティティ関係マイニング装置。
  25. 前記視覚化手段は、ノードと結合線とで視覚化されたインタフェースを生成し、
    ノードはそれぞれエンティティを表わし、ノードの間の結合線はタイプおよびエンティティ関係のスコアを表わす、
    ノードのサイズはエンティティの重要性に対応し、結合線の幅あるいは長さパラメータはエンティティ関係のスコアに対応し、結合線の色はエンティティ関係のタイプに対応することを特徴とする請求項24に記載のエンティティ関係マイニング装置。
  26. 前記視覚化手段は、ノードと結合線とで視覚化されたインタフェースを生成し、
    関係の開始はノードとして利用され、結合線はエンティティ参照ラインとイベント開始関連付けラインに分類され、前記イベント開始関連付けラインの色はエンティティ関係のタイプに対応することを特徴とする請求項24に記載のエンティティ関係マイニング装置。
  27. エンティティ関係マイニング方法であって、
    エンティティ関係インスタンスを読み取って時系列スコア化エンティティ関係を生成する時系列エンティティ関係抽出ステップを有することを特徴とする、エンティティ関係マイニング方法。
  28. 前記時系列エンティティ関係抽出ステップにおいて、生成した時系列スコア化エンティティ関係に基づいて、時系列・包括的エンティティ関係スコアをさらに生成することを特徴とする請求項27に記載のエンティティ関係マイニング方法。
  29. 前記時系列エンティティ関係抽出ステップで生成した時系列・包括的エンティティ関係スコアを読み取って時系列エンティティ重要度を生成する時系列エンティティ重要度抽出ステップをさらに含むことを特徴とする請求項28に記載のエンティティ関係マイニング方法。
  30. 前記時系列エンティティ関係抽出ステップで生成した時系列エンティティ関係と時系列・包括的エンティティ関係スコアとを読み取ってイベントを生成するイベント検出ステップをさらに含むことを特徴とする請求項28に記載のエンティティ関係マイニング方法。
  31. 前記時系列エンティティ関係抽出ステップと前記時系列エンティティ重要度抽出ステップでそれぞれ生成した、時系列エンティティ関係と、時系列包括的エンティティ関係スコアと、時系列エンティティ重要度とを読み取ってイベントを生成するイベント検出ステップをさらに含むことを特徴とする請求項29に記載のエンティティ関係マイニング方法。
  32. テキスト情報データを読み取ってエンティティ関係インスタンスを生成する関係インスタンス抽出ステップをさらに含むことを特徴とする請求項27から請求項31の何れかに記載のエンティティ関係マイニング方法。
  33. 前記時系列エンティティ関係抽出ステップが、
    最終的には、所定の期間内におけるすべての継続的エンティティ間関係がスコアを有するように、所定の期間内にエンティティ関係が発生しなかった場合にエンティティ関係の補間によってエンティティ関係のスコアを計算する、時系列補間ステップを含むことを特徴とする請求項27から請求項32の何れかに記載のエンティティ関係マイニング方法。
  34. 前記時系列補間ステップが、
    各エンティティ関係インスタンスに従って、対応するタイムユニット、すなわちエンティティ関係のスコア内のエンティティ関係の強さを計算するためのエンティティ関係インスタンス強さ計算ステップと、
    時系列スコア化エンティティ関係を取得するためにイベント的関係を処理するためのイベント的ビジネス関係/矛盾処理ステップの少なくとも一方を含むことを特徴とする請求項33に記載のエンティティ関係マイニング方法。
  35. エンティティ関係が発生する隣接する2時点間の期間の間、前記時系列補間ステップにおいて、スコアが一定期間直線的にあるいは指数関数的に減少あるいは増加する方法でエンティティ関係というスコアについて補間を行なうことを特徴とする請求項33又は請求項34に記載のエンティティ関係マイニング方法。
  36. 前記時系列エンティティ重要度抽出ステップが、
    各時間単位におけるエンティティに関する無向グラフを作成するグラフ作成ステップと、
    グラフノード重要度計算方法を利用して、各ノードの重要度、すなわちエンティティ重要度を計算するグラフノード重要度計算ステップを含み、
    無向グラフにおいて、頂点はそれぞれのエンティティであり、また、頂点を接続する辺は、2つのエンティティの間の包括的なエンティティ関係スコアである重みを有する、
    ことを特徴とする請求項29に記載のエンティティ関係マイニング方法。
  37. 前記グラフノード重要度計算方法が、ページランク手法あるいはHITSアルゴリズムであることを特徴とする特徴とする請求項36に記載のエンティティ関係マイニング方法。
  38. 前記時系列エンティティ重要度抽出ステップが、
    各時間単位におけるエンティティに関する無向グラフを作成するグラフ作成ステップと、
    グラフノード結合度計算方法を利用して、各ノードの重要度、すなわちエンティティ重要度を計算するグラフノード結合度計算ステップを含み、
    無向グラフにおいて、頂点はそれぞれのエンティティであり、また、頂点を接続する辺は、2つのエンティティの間の包括的なエンティティ関係スコアである重みを有する、
    ことを特徴とする請求項29に記載のエンティティ関係マイニング方法。
  39. 前記グラフノード結合度計算方法が、各ノードへの結合数の合計あるいは各ノードへの結合の重みの合計の計算であることを特徴とする請求項38に記載のエンティティ関係マイニング方法。
  40. 前記イベント検出ステップが、
    時系列エンティティ関係および時系列・包括的エンティティ関係スコアに関連付けられた予め定義されたルールを利用することにより、入力データを全て検出し、予め定義されたルールに一致するイベントを出力するルールベースイベント抽出ステップを含むことを請求項30に記載のエンティティ関係マイニング方法。
  41. 前記イベント検出ステップが、
    エンティティについて外部のスコアを取得するために補助情報についてスコア計算を行なうエンティティ外部スコア計算ステップと、
    エンティティについて、時系列エンティティ関係、時系列・包括的エンティティ関係スコアおよび外部スコアに関連付けられた予め定義されたルールを利用することにより、入力データをすべて検出し、前記予め定義されたルールと一致するイベントを出力するルールベースイベント抽出ステップを含むことを請求項30に記載のエンティティ関係マイニング方法。
  42. 前記イベント検出ステップが、
    時系列エンティティ関係、時系列・包括的エンティティ関係スコアおよび時系列エンティティ重要度に関連付けられた予め定義されたルールを利用することにより、入力データをすべて検出し、前記予め定義されたルールと一致するイベントを出力するルールベースイベント抽出ステップを含むことを請求項31に記載のエンティティ関係マイニング方法。
  43. 前記イベント検出ステップが、
    エンティティについて外部のスコアを取得するために補助情報についてスコア計算を行なうエンティティ外部スコア計算ステップと、
    エンティティについて、時系列エンティティ関係、時系列・包括的エンティティ関係スコア、時系列エンティティ重要度および外部スコアに関連付けられた予め定義されたルールを利用することにより、入力データをすべて検出し、前記予め定義されたルールと一致するイベントを出力するルールベースイベント抽出ステップを含むことを特徴とする請求項31に記載のエンティティ関係マイニング方法。
  44. 買収イベントについて、前記ルールベースイベント抽出ステップにおいて、2つのエンティティの間の完全な買収あるいは部分的な買収が、買収の際の2つのエンティティのエンティティ重要性及び/又は買収後の2つのエンティティのエンティティ重要性における変化に基づいて生じるかどうかを判定することを特徴とする請求項42又は請求項43に記載のエンティティ関係マイニング方法。
  45. 前記エンティティは企業であり、関係はビジネス関係であることを特徴とする請求項27から請求項44の何れかに記載のエンティティ関係マイニング方法。
  46. 時系列エンティティ関係と時系列エンティティ重要度とに基づいて時系列フォースデータを生成する、時系列ファイブフォース分析ステップをさらに含むことを特徴とする請求項45に記載のエンティティ関係マイニング方法。
  47. 前記時系列ファイブフォース分析ステップが、
    各業種について、時系列エンティティ関係および重要性を出力するために必要な業種に基づいて、入力された時系列エンティティ関係および時系列エンティティ重要度を分割する業種分割ステップを含み、
    時間tにおける新規参入の脅威を計算する新規参入脅威分析ステップ、
    時間tにおける供給者の交渉力を計算する供給者交渉力分析ステップ、
    時間tにおける買い手の交渉力を計算する買い手交渉力分析ステップ、
    時間tにおける敵対関係を計算する敵対関係分析ステップ、
    時間tにおける代替品の脅威を計算する代替品脅威分析ステップの
    少なくとも1つのを含むことを特徴とする請求項46に記載のエンティティ関係マイニング方法。
  48. 前記代替品脅威分析ステップにおいて、時間tにおける代替品の脅威を計算する代わりに、将来の競争動向を解析することにより、将来の可能性のある万能の競争相手を取得することを特徴とする請求項47に記載のエンティティ関係マイニング方法。
  49. 前記エンティティは、製品、人、または国家であり、前記関係は製品間の関係、人間関係、または国家間の関係であることを特徴とする請求項27から請求項44の何れかに記載のエンティティ関係マイニング方法。
  50. 時系列エンティティ関係、時系列包括的エンティティ関係スコア、時系列エンティティ重要度、および時系列フォースデータの少なくとも1つに基づいて視覚化インタフェースを生成する、視覚化ステップをさらに含むことを特徴とする請求項27から請求項49の何れかに記載のエンティティ関係マイニング方法。
  51. 前記視覚化ステップにおいて、ノードと結合線とで視覚化されたインタフェースを生成し、
    ノードはそれぞれエンティティを表わし、ノードの間の結合線はタイプおよびエンティティ関係のスコアを表わす、
    ノードのサイズはエンティティの重要性に対応し、結合線の幅あるいは長さパラメータはエンティティ関係のスコアに対応し、結合線の色はエンティティ関係のタイプに対応することを特徴とする請求項50に記載のエンティティ関係マイニング方法。
  52. 前記視覚化ステップにおいて、ノードと結合線とで視覚化されたインタフェースを生成し、
    関係の開始はノードとして利用され、結合線はエンティティ参照ラインとイベント開始関連付けラインに分類され、前記イベント開始関連付けラインの色はエンティティ関係のタイプに対応することを特徴とする請求項50に記載のエンティティ関係マイニング方法。
JP2008273950A 2007-10-31 2008-10-24 エンティティ関係マイニング装置および方法 Expired - Fee Related JP4795417B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2007101679749A CN101425065B (zh) 2007-10-31 2007-10-31 实体关系挖掘设备和方法
CN200710167974.9 2007-10-31

Publications (2)

Publication Number Publication Date
JP2009116869A true JP2009116869A (ja) 2009-05-28
JP4795417B2 JP4795417B2 (ja) 2011-10-19

Family

ID=40584172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008273950A Expired - Fee Related JP4795417B2 (ja) 2007-10-31 2008-10-24 エンティティ関係マイニング装置および方法

Country Status (3)

Country Link
US (1) US20090112825A1 (ja)
JP (1) JP4795417B2 (ja)
CN (1) CN101425065B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513826A (ja) * 2011-02-28 2014-06-05 エイチエスビーシー ホールディングス ピーエルシー コンピュータシステム、データベース及びそれらの使用
JP2015219901A (ja) * 2014-05-19 2015-12-07 ムジグマ・ビジネス・ソリューションズ・ピーブイティー・リミテッド 事業問題ネットワーキングシステムおよびツール
JP2017058866A (ja) * 2015-09-15 2017-03-23 株式会社東芝 情報抽出装置、情報抽出方法および情報抽出プログラム
JP2017204054A (ja) * 2016-05-10 2017-11-16 コニカミノルタ株式会社 相性算出装置、相性算出方法、およびコンピュータプログラム

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130117272A1 (en) * 2011-11-03 2013-05-09 Microsoft Corporation Systems and methods for handling attributes and intervals of big data
JP5899946B2 (ja) * 2012-01-17 2016-04-06 富士通株式会社 分割装置、分割方法、および分割プログラム
US11106724B2 (en) * 2012-03-28 2021-08-31 Nec Corporation Matching result display device, matching result display method, program, and recording medium
CN103365912B (zh) * 2012-04-06 2016-12-14 富士通株式会社 对实体关系模式进行聚类、提取的方法和设备
US20150012530A1 (en) * 2013-07-05 2015-01-08 Accenture Global Services Limited Determining an emergent identity over time
CN105468605B (zh) * 2014-08-25 2019-04-12 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN104182535B (zh) * 2014-08-29 2017-05-24 苏州大学 一种人物关系抽取方法和装置
CN105989143B (zh) * 2015-02-28 2019-09-03 科大讯飞股份有限公司 网络实体热度分析方法及系统
CN104657750B (zh) * 2015-03-23 2018-04-27 苏州大学张家港工业技术研究院 一种用于人物关系抽取的方法和装置
CN105138636B (zh) * 2015-08-21 2018-07-24 浪潮软件集团有限公司 一种实体关系的图形构建方法及装置
CN105389470A (zh) * 2015-11-18 2016-03-09 福建工程学院 一种中医针灸领域实体关系自动抽取的实现方法
CA3007844C (en) * 2015-12-11 2021-06-22 Servicenow, Inc. Computer network threat assessment
CN105677726A (zh) * 2015-12-29 2016-06-15 上海律巢网络科技有限公司 一种数据检索及结果呈现方法与系统
CN106991090B (zh) * 2016-01-20 2020-12-11 北京国双科技有限公司 舆情事件实体的分析方法及装置
CN107180030B (zh) * 2016-03-09 2020-11-17 创新先进技术有限公司 一种网络上的关系数据生成方法及装置
CN107610693B (zh) * 2016-07-11 2021-01-29 科大讯飞股份有限公司 文本语料库的构建方法和装置
CN108052501A (zh) * 2017-12-13 2018-05-18 北京数洋智慧科技有限公司 一种基于人工智能的实体关系对识别方法及系统
CN111274812B (zh) * 2018-12-03 2023-04-18 阿里巴巴集团控股有限公司 一种人物关系识别方法、设备及存储介质
CN110378569A (zh) * 2019-06-19 2019-10-25 平安国际智慧城市科技股份有限公司 产业关系链构建方法、装置、设备及存储介质
CN112241458B (zh) * 2020-10-13 2022-10-28 北京百分点科技集团股份有限公司 文本的知识结构化处理方法、装置、设备和可读存储介质
CN113191118B (zh) * 2021-05-08 2023-07-18 山东省计算中心(国家超级计算济南中心) 一种基于序列标注的文本关系抽取方法
CN113793227B (zh) * 2021-09-16 2023-10-31 中国电子科技集团公司第二十八研究所 一种用于社交网络事件的类人智能感知与预测方法
CN114818734B (zh) * 2022-05-25 2023-10-31 清华大学 基于目标-属性-关系的对抗场景语义分析方法以及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527092A (ja) * 1991-07-17 1993-02-05 Hitachi Plant Eng & Constr Co Ltd 放射性金属廃棄物の除染方法
JPH1125169A (ja) * 1997-06-30 1999-01-29 Toshiba Corp 相関関係抽出方法
JP2005128887A (ja) * 2003-10-24 2005-05-19 Toshiba Corp 時系列活動データ分析装置、方法及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001306998A (ja) * 2000-04-18 2001-11-02 Toshiba Corp 時系列分析方法
US6859785B2 (en) * 2001-01-11 2005-02-22 Case Strategy Llp Diagnostic method and apparatus for business growth strategy
US7251613B2 (en) * 2001-09-05 2007-07-31 David Flores System and method for generating a multi-layered strategy description including integrated implementation requirements
US20030046125A1 (en) * 2001-09-05 2003-03-06 Nextstrat, Inc. System and method for enterprise strategy management
US7716170B2 (en) * 2002-01-08 2010-05-11 Wafik Farag Holistic dynamic information management platform for end-users to interact with and share all information categories, including data, functions, and results, in collaborative secure venue
US7346529B2 (en) * 2002-05-07 2008-03-18 David R. Flores Method for developing an enterprise alignment framework hierarchy by compiling and relating sets of strategic business elements
US8010460B2 (en) * 2004-09-02 2011-08-30 Linkedin Corporation Method and system for reputation evaluation of online users in a social networking scheme
JP4922644B2 (ja) * 2006-03-29 2012-04-25 株式会社 日立東日本ソリューションズ 時系列分析プログラム、時系列分析システム、およびそれに用いられる時系列分析装置
US7657493B2 (en) * 2006-09-28 2010-02-02 Microsoft Corporation Recommendation system that identifies a valuable user action by mining data supplied by a plurality of users to find a correlation that suggests one or more actions for notification
US7930197B2 (en) * 2006-09-28 2011-04-19 Microsoft Corporation Personal data mining
US7849104B2 (en) * 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US10762080B2 (en) * 2007-08-14 2020-09-01 John Nicholas and Kristin Gross Trust Temporal document sorter and method
US8156002B2 (en) * 2007-10-10 2012-04-10 Yahoo! Inc. Contextual ad matching strategies that incorporate author feedback

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527092A (ja) * 1991-07-17 1993-02-05 Hitachi Plant Eng & Constr Co Ltd 放射性金属廃棄物の除染方法
JPH1125169A (ja) * 1997-06-30 1999-01-29 Toshiba Corp 相関関係抽出方法
JP2005128887A (ja) * 2003-10-24 2005-05-19 Toshiba Corp 時系列活動データ分析装置、方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513826A (ja) * 2011-02-28 2014-06-05 エイチエスビーシー ホールディングス ピーエルシー コンピュータシステム、データベース及びそれらの使用
JP2015219901A (ja) * 2014-05-19 2015-12-07 ムジグマ・ビジネス・ソリューションズ・ピーブイティー・リミテッド 事業問題ネットワーキングシステムおよびツール
JP2017058866A (ja) * 2015-09-15 2017-03-23 株式会社東芝 情報抽出装置、情報抽出方法および情報抽出プログラム
JP2017204054A (ja) * 2016-05-10 2017-11-16 コニカミノルタ株式会社 相性算出装置、相性算出方法、およびコンピュータプログラム

Also Published As

Publication number Publication date
US20090112825A1 (en) 2009-04-30
CN101425065B (zh) 2013-01-09
JP4795417B2 (ja) 2011-10-19
CN101425065A (zh) 2009-05-06

Similar Documents

Publication Publication Date Title
JP4795417B2 (ja) エンティティ関係マイニング装置および方法
Chen et al. Construction automation: Research areas, industry concerns and suggestions for advancement
Ismail et al. An appraisal into the potential application of big data in the construction industry
Ivanov et al. Handbook of ripple effects in the supply chain
Ahmed A review on using opportunities of augmented reality and virtual reality in construction project management
Chlebus et al. A new approach on implementing TPM in a mine—A case study
García-Acosta et al. Ergoecology: fundamentals of a new multidisciplinary field
JP4473893B2 (ja) 作業項目抽出装置、作業項目抽出方法、および、作業項目抽出プログラム
US20140317089A1 (en) Context aware dynamic sentiment analysis
Takano et al. A branch-and-bound method to minimize the makespan in a permutation flow shop with blocking and setup times
Sarno et al. Decision mining for multi choice workflow patterns
Patil Applications of artificial intelligence in construction management
Soleimani-Damaneh An enumerative algorithm for solving nonconvex dynamic DEA models
JP5898584B2 (ja) 六面体メッシュ生成装置
JP5772599B2 (ja) テキストマイニングシステム、テキストマイニング方法および記録媒体
Lemasson et al. Challenges of evidence-informed offshore decommissioning: an environmental perspective
Tatarnikova et al. A conceptual model for geodata processing for sustainable forest management
Chamberlain et al. Applications of visual magnitude in forest planning: A case study
Bergstrom et al. Balancing socio-ecological risks, politics, and identity: Sustainability in Minnesota’s copper-nickel-precious metal mining debate
Svalestuen et al. Ethics of the Design Phase–a Descriptive Approach
Kwon et al. ARIMAX and ARX Models with social media information to predict unemployment rate
Besseris Robust quality controlling: SPC with box plots and runs test
JP6318019B2 (ja) 計画業務支援方法およびシステム
Thomé et al. Industrial engineering and operations management
Sloane Threading Innovation, Regulation, and the Mitigation of AI Harm: Examining Ethics in National AI Strategies

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110725

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110727

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees