JP2009116870A - 時系列関係グラフに基づくエンティティ分類装置および方法 - Google Patents

時系列関係グラフに基づくエンティティ分類装置および方法 Download PDF

Info

Publication number
JP2009116870A
JP2009116870A JP2008274581A JP2008274581A JP2009116870A JP 2009116870 A JP2009116870 A JP 2009116870A JP 2008274581 A JP2008274581 A JP 2008274581A JP 2008274581 A JP2008274581 A JP 2008274581A JP 2009116870 A JP2009116870 A JP 2009116870A
Authority
JP
Japan
Prior art keywords
time
category
entity
relationship
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008274581A
Other languages
English (en)
Other versions
JP5128437B2 (ja
Inventor
Liqin Xu
キュ リキン
Changjian Hu
ホウ チャンジェン
Toshikazu Fukushima
トシカズ フクシマ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2009116870A publication Critical patent/JP2009116870A/ja
Application granted granted Critical
Publication of JP5128437B2 publication Critical patent/JP5128437B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

【課題】 時系列関係グラフに基づくエンティティ分類装置および方法を提供する。
【解決手段】 所定の期間内の各時系列関係グラフにおいては、ノードはエンティティを表し、ノード間のリンクは、対応する時間単位におけるエンティティ関係を表す。本発明の時系列関係グラフに基づくエンティティ分類装置は、各時系列関係グラフ内のノードを分類して、時間系列の対応する時間に関するノードカテゴリ結果を生成する時系列関係グラフ分類手段と、時系列関係グラフ分類手段によって生成された、時間系列の対応する時間単位に関するすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理手段とを備える。
【選択図】 図1

Description

本発明は、データマイニング分野に関し、特に、時系列関係マイニングに関する。本発明によれば、時系列関係グラフに基づくエンティティ分類装置および方法が提供される。
グローバル化の急速な進展に伴い、企業間で形成されるビジネス関係はかつてないほど複雑になっている。また、企業の成長速度もかつてないほどに高まっており、その過程においては、他企業とのビジネス関係が決定的な役割を果たしている。
一方、情報化の進展を背景に、インターネット等の媒体を介して膨大な量のビジネスニュースが発信されている。これらのビジネスニュースには企業間のビジネス関係に関する情報が多く含まれており、これまでに蓄積されてきたビジネスニュースには、あらゆる産業のビジネス関係情報がすべて網羅されていると言っても過言ではない。これらの情報は、ビジネス情報の時系列プロセスを形成する。ビジネスコンサルティング業の会社が、この時系列プロセスから情報を取得し、その情報から時系列ビジネス情報プロセスを構築して、企業コンサルタント等のユーザにとって有益な産業および下位産業区分の関係やそれに対応するビジネスイベントを抽出できれば、それはきわめて有望な技術となる。
ビジネス関係によって形成されるネットワークは、時間の経過に伴って変動する。変動するネットワークに関して時系列モデルが構築されると、その後には、このモデルから産業構造(構成産業数、各産業を構成する下位産業区分、および各産業と各下位産業区分の代表的な企業)をいかに特定するかという問題が生じる。
また、時系列関係グラフが与えられ、それをもとにビジネス関係を一般化して社会的関係などの一般的関係を得たい場合には、ノードが属するカテゴリを特定する方法、カテゴリをサブカテゴリに分割する方法、各カテゴリおよび各サブカテゴリの代表的な組織を特定する方法が問題となる。
既存の方法には、非特許文献1(C.H.Ding,X.He,H.Zha,M.Gu,and H.D.Simon,A min−max cut algorithm for graph partitioning and data clustering(グラフパーティショニングおよびデータクラスタリングのためのmin−max cutアルゴリズム),Proceedings of IEEE ICDM 2001,pp.107―114,2001)や、非特許文献2(J.Shi and J.Malik,Normalized cut and image segmentation(normalized cutおよび画像分割),IEEE Trans.on Pattern Analysis and Machine Intelligence,22(8):888―905,August 2000)などのような、結合グラフベースの関係を分類するための技術がある。しかし、これらの技術は単純グラフにしか適用できず、時間依存性のビジネス関係について作成されたグラフを分類する方法はない。
さらに、ビジネスイベントの検出においては、特許文献1(特願2005―352817号)に開示されているような、時間系列に基づいて重要なノードを検出する技術がある。しかし、時系列グラフを産業別に分類した後にイベントを検出する技術はない。
特願2005―352817号 米国特許出願第IA078650号 C.H.Ding,X.He,H.Zha,M.Gu,and H.D.Simon,A min−max cut algorithm for graph partitioning and data clustering(グラフパーティショニングおよびデータクラスタリングのためのmin−max cutアルゴリズム),Proceedings of IEEE ICDM 2001,pp.107―114,2001 J.Shi and J.Malik,Normalized cut and image segmentation(normalized cutおよび画像分割),IEEE Trans.on Pattern Analysis and Machine Intelligence,22(8):888―905,August 2000
上述したように、ビジネス関係によって形成されるネットワークは、時間の経過に伴って変動する。変動するネットワークに関して時系列モデルが構築されると、その後には、このモデルから産業構造(構成産業数、各産業を構成する下位産業区分、および各産業と各下位産業区分の代表的な企業)をいかに特定するかという問題が生じる。
また、時系列関係グラフが与えられ、それをもとにビジネス関係を一般化して社会的関係などの一般的関係を得たい場合には、ノードが属するカテゴリを特定する方法、カテゴリをサブカテゴリに分割する方法、各カテゴリおよび各サブカテゴリの代表的な組織を特定する方法が問題となる。
非特許文献1や非特許文献2などのような、結合グラフベースの関係を分類するための技術は、単純グラフにしか適用できず、時間依存性のビジネス関係について作成されたグラフを分類する方法は存在しない。
さらに、ビジネスイベントの検出においては、特許文献1に開示されているような、時間系列に基づいて重要なノードを検出する技術があるが、時系列グラフを産業別に分類した後にイベントを検出する技術は存在しない。
本発明は、時間依存関係に関する時系列関係グラフを作成し、この時系列関係グラフに対してグラフパーティションベースの分類を実行した後に、後処理を実行して、最終的に分類されたノードと対応する関係を取得する。
また、本発明をビジネス分野に適用した場合には、分類済みのノードと関係に基づいて、ビジネス分野の企業と関係がさらに産業別に分割され、これらの個別産業のビジネスイベントを検出することにより、ビジネスイベントが最終的に取得される。
本発明は、上記の目的を達成するために、所定の期間内の各時系列関係グラフにおいて、ノードがエンティティを表し、ノード間のリンクが対応する時間単位におけるエンティティ関係を表す、時系列関係グラフに基づくエンティティ分類装置を提供し、当該時系列関係グラフに基づくエンティティ分類装置は、各時系列関係グラフ内のノードを分類して、時間系列の対応する時間単位毎にノードカテゴリ結果を生成する時系列関係グラフ分類手段と、時系列関係グラフ分類手段によって生成された時間系列の対応する時間単位毎のすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理手段とを備える。
時系列関係グラフに基づくエンティティ分類装置は、入力された関係インスタンスを処理して、対応する時系列関係グラフを生成する時系列関係グラフ生成手段をさらに備えるのが望ましい。
時系列関係グラフ生成手段は、関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して時系列関係を取得する時系列関係生成手段と、時系列関係生成手段によって生成されたエンティティ間の各種タイプの時系列関係を同期化して、各2つのエンティティにおける時系列包括的関係を取得する関係同期化手段と、所定の期間の各時間単位毎に1つの関係グラフを作成して、時系列関係グラフを形成する時系列関係グラフ作成手段とを備えるのが望ましい。
時系列関係グラフ分類手段は、階層的分類方法を使用して、各時間単位毎に時系列関係グラフ内のノードに対してカテゴリ化を行うのが望ましい。
カテゴリ結果後処理手段は、時系列関係グラフ分類手段によって生成された時間系列内の対応する時間単位毎のすべてのノードカテゴリ結果に含まれる各カテゴリをマッピングして、併合ノードカテゴリ構造を取得する、カテゴリ結果マッピング手段と、併合ノードカテゴリ構造の各カテゴリに関して、カテゴリ結果マッピング手段によって生成された併合ノードカテゴリ構造に基づいて、当該構造内での各ノードの出現回数と、各ノードと各ノードカテゴリ結果とのマッピング関係の出現回数とを計数する、ノード出現計数手段と、ノード出現計数手段の計数結果に基づいて、各ノードを、併合ノードカテゴリ構造の対応するカテゴリに割り当てる、ノード分類手段とを備えるのが望ましい。
カテゴリ結果後処理手段は併合ノードカテゴリ結果をさらに生成すると共に、時系列関係グラフに基づくエンティティ分類装置は、併合ノードカテゴリ結果に基づいて、エンティティ関係に対してイベント検出を実行し、イベント結果を出力する、イベント検出手段をさらに備えるのが望ましい。
エンティティは企業であり、関係はビジネス関係であり、カテゴリは産業であるのが望ましい。
本発明は、上記の目的を達成するために、ノードがエンティティを表し、ノード間のリンクが対応する時間単位におけるエンティティ関係を表す、所定の期間に関する各時系列関係グラフに基づくエンティティ分類方法を提供し、当該時系列関係グラフに基づくエンティティ分類方法は、各時系列関係グラフ内のノードを分類して、時間系列の対応する時間単位毎にノードカテゴリ結果を生成する時系列関係グラフ分類ステップと、時系列関係グラフ分類ステップで生成された時間系列の対応する時間単位毎のすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理ステップとを備える。
時系列関係グラフに基づくエンティティ分類方法は、入力された関係インスタンスを処理して、対応する時系列関係グラフを生成する時系列関係グラフ生成ステップをさらに備えるのが望ましい。
時系列関係グラフ生成ステップは、関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して、時系列関係を取得する時系列関係生成サブステップと、時系列関係生成サブステップで生成されたエンティティ間の各種タイプの時系列関係を同期化して、各2つのエンティティにおける時系列包括的関係を取得する関係同期化サブステップと、所定の期間の各時間単位毎に1つの関係グラフを作成して、時系列関係グラフを形成する時系列関係グラフ作成サブステップとを備えるのが望ましい。
時系列関係グラフ分類ステップでは、階層的分類方法を使用して、各時間単位毎に時系列関係グラフ内のノードに対して分類(カテゴリ化)が実行されるのが望ましい。
カテゴリ結果後処理ステップは、時系列関係グラフ分類ステップで生成された時間系列内の対応する時間単位毎にすべてのノードカテゴリ結果に含まれる各カテゴリをマッピングして、併合ノードカテゴリ構造を取得する、カテゴリ結果マッピングサブステップと、併合ノードカテゴリ構造の各カテゴリに関して、カテゴリ結果マッピングサブステップで生成された併合ノードカテゴリ構造に基づいて、当該構造内での各ノードの出現回数と、各ノードと各ノードカテゴリ結果とのマッピング関係の出現回数とを計数する、ノード出現計数サブステップと、ノード出現計数サブステップでの計数結果に基づいて、各ノードを、併合ノードカテゴリ構造の対応するカテゴリに割り当てる、ノード分類サブステップとを備えるのが望ましい。
カテゴリ結果後処理ステップでは、併合ノードカテゴリ結果がさらに生成されると共に、時系列関係グラフに基づくエンティティ分類方法は、併合ノードカテゴリ結果に基づいて、エンティティ関係に対してイベント検出を実行し、イベント結果を出力する、イベント検出ステップをさらに備えるのが望ましい。
28
エンティティは企業であり、関係はビジネス関係であり、カテゴリは産業であるのが望ましい。
本発明によれば、以下の技術的問題が効率的に解決される。
時間依存関係インスタンスから時系列関係を作成し、ノードを分類する問題。および、時系列ビジネス関係とその分類結果に基づいて、ビジネスイベント検出を実行する問題。
以下では、図面を参照して、本発明の好適な実施例を説明する。本発明の理解に混乱をきたさないよう、本発明の説明には無用な詳細および機能については省略する。さらに、以下の説明では、エンティティの一例として企業、および関係の一例としてビジネス関係を用いて、本発明による時系列関係グラフに基づくエンティティ分類装置および方法を詳細に説明する。ただし、本発明のエンティティは企業に限定されず、自然人、国家、製品等のエンティティであってもよいことに留意されたい。同様に、本発明の関係はビジネス関係に限定されず、人間関係や国家間の関係のような他の社会的関係にも適用できる。
(システム概要)
図1は、本発明の第1の実施例による、時系列関係を分類および分析するシステムを示す全体ブロック図である。参照番号1は、入力された関係インスタンスを表す。時系列関係グラフ生成モジュール2は、入力された関係インスタンス1を処理して、対応する時系列関係グラフを生成する。時系列関係グラフ分類モジュール3は、時系列関係グラフ生成モジュール2によって生成された時系列関係グラフを分類して、時間系列の各時間単位に関するカテゴリ結果を生成する。カテゴリ結果後処理モジュール4は、時系列関係グラフ分類モジュール3によって生成されたカテゴリ結果を後処理して、時系列包括的カテゴリ結果を生成し、分類済みノードおよび関係を最終的に生成する。
(モジュールの詳細な説明)
関係インスタンス1は、2つのエンティティ間に関係があることを意味し、以下のデータ構造を有する。
Figure 2009116870
例えば、ビジネス分野においては、エンティティは企業を表し、関係タイプには競争、協力、株式保有、供給、法人設立、買収などがある。以下の式では、関係インスタンスはRI(A,B,X,t’)を使用して表されている。これは、時点t’にエンティティAとエンティティBの間に関係インスタンスXがあることを意味する。
図3に、時系列関係グラフ生成モジュール2のブロック図とデータフローチャートを示す。
具体的には、時系列関係生成手段21は、関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して、時系列関係を取得する。これらのステップは、米国特許出願明細書第IA078650号で説明されるビジネス関係マイニング機および方法などの既存の方法によって実装できる。ただし、ビジネス関係は本発明に関連する関係の一例にすぎず、本発明の範囲を限定することを意図するものではないことに留意されたい。最後に、様々なタイプのスコア付き時系列エンティティ関係が取得される。これはすなわち、所定の時間単位には、2つのエンティティ間にあるタイプの時系列関係とそのスコアが存在することを意味し、ここでのスコアとは、当該時間単位にこの関係が存在することに関する信頼度である。表2に、そのデータ構造の例を示す。
Figure 2009116870
sA,B,X(t)は、時間単位tにおける、エンティティAとエンティティB間のビジネス関係Xのスコアを表す。
例えば、図4および図6は、時系列関係生成手段21によって生成された詳細な時系列関係を示し、このうち図4は時点t1における詳細な関係を示し、図6は時点t2における詳細な関係を示す。具体的には、図4には、時点t1にエンティティAとエンティティB間に「協力」と「競争」の関係があり、時点t1にエンティティAとエンティティC間に「協力」と「競争」の関係があり、時点t1にエンティティAとエンティティD間に「競争」の関係があり、時点t1にエンティティBとエンティティD間に「競争」の関係があり、時点t1にエンティティCとエンティティD間に「競争」の関係があることが示されている。また、図6には、時点t2にエンティティAとエンティティB間に「協力」と「競争」の関係があり、時点t2にエンティティAとエンティティC間に「競争」の関係があり、時点t2にエンティティAとエンティティD間に「競争」の関係があり、時点t2にエンティティBとエンティティD間に「競争」の関係があり、時点t2にエンティティCとエンティティD間に「協力」と「競争」の関係があることが示されている。.
関係同期化手段22は、様々なタイプの時系列エンティティ関係を同期化して、各2つのエンティティ間の時系列包括的関係を取得する。sA,B(t)は、2つのエンティティ間の包括的関係を表すために使用される。この包括的関係に方向性はないため、sA,B(t)=
sB,A(t)となる。例えば、企業間の包括的関係は、企業間の交流の親密度を表す。2つの企業間の親密度が高いほど、同じ産業または下位産業区分に属する可能性が高くなる。包括的関係は、いくつかの加算方法または加重加算方法を用いて、様々なタイプの関係を累計することによって計算することができる。計算式は以下のとおりである。
Figure 2009116870
ここで、fX()は関係Xに対応する任意の単調増加関数もしくは単調減少関数であり、g()は最終スコアを標準化または正規化するための任意の単調増加関数である。
上記の関数の例を以下に示す。
Figure 2009116870
ここで、w(X)は個々の関係の重みである。この重みは経験値とするか、または統計的手法によって得ることができる。統計的手法の例としては、1つの関係が発生する確率を計算し、それを重みとして使用する方法が挙げられる。
以下に、もう一つの例を示す。
Figure 2009116870
時系列関係グラフ作成手段23は、時間系列内の各時間単位に関する関係グラフを作成する。グラフのノードはエンティティであり、ノード間のリンクは各2つのエンティティ間の時系列包括的関係を表し、個々のリンクの重みは各2つのエンティティ間の時系列包括的関係のスコアである。そのためここでは、各時間単位に対して、重み付きの無向グラフが生成される。
図5および図7に、関係同期化手段22と時系列関係グラフ作成手段23によって生成された時系列関係グラフを示す。このうち、図5は時点t1における包括的関係グラフを示し、図7は時点t2における包括的関係グラフを示す。
時系列関係グラフ分類モジュール3は、階層的分類方法を使用して、各時間単位に関する時系列関係グラフ内のノードに対してカテゴリ化(分類)を実行する。ここでは、例えば、既存のグラフベースの分類方法を用いて、各時間単位のグラフに対してグラフ2分割ベースのカテゴリ化を実行してもよい。既存の方法には、参考文献1、非特許文献1(C.H.Ding,X.He,H.Zha,M.Gu,and H.D.Simon,A min−max cut algorithm for graph partitioning and data clustering(グラフパーティショニングおよびデータクラスタリングのためのmin−max cutアルゴリズム),Proceedings of IEEE ICDM 2001,pp.107―114,2001)や、参考文献2、非特許文献2(J.Shi and J.Malik,Normalized cut and image segmentation(normalized cutおよび画像分割),IEEE Trans.on Pattern Analysis and Machine Intelligence,22(8):888―905,August 2000)などがある。カテゴリ結果は、複数階層から成る2分割構造である。図8に、カテゴリ結果の例を示す。
図8のカテゴリ結果では、最も精細なカテゴリ結果は4つのカテゴリから成る。すなわち、AとBとCは1つのカテゴリに属し、DとEはもう1つのカテゴリに属し、FとGはそれぞれさらに別のカテゴリに属している。上位階層のカテゴリ結果は3つのカテゴリから成る。すなわち、AとBとCは1つのカテゴリに属し、DとEとFはもう1つのカテゴリに属し、Gはさらに別のカテゴリに属している。例えば、ビジネス関係に関して言えば、より精細なカテゴリは下位産業区分を表し、上位階層のカテゴリは産業を表す。
図9および図10はそれぞれ、図5に対応する時点t1のカテゴリ結果と、図7に対応する時点t2のカテゴリ結果とを示す。具体的には、図9には、時点t1において、エンティティA、B、Cはサブカテゴリ2に属し、エンティティDはサブカテゴリ3に属し、エンティティA〜Dはすべてカテゴリ1に属することが示されている。一方、図9では、時点t2において、エンティティA、Bはサブカテゴリ2に属し、エンティティC、Dはサブカテゴリ3に属し、エンティティA〜Dはすべてカテゴリ1に属することが示されている。
カテゴリ結果後処理モジュール4は、時系列関係グラフ分類モジュール3によって生成された時系列カテゴリ結果を後処理する。この後処理では、所定期間内のすべての時間単位を対象にカテゴリ結果が包括的に処理され、所定の期間に関するカテゴリ結果が取得される。
図11に、カテゴリ結果後処理モジュール4を示すブロック図およびデータフローチャートを示す。
所定期間内の1つの時間単位は図3に示すようなカテゴリ結果を有するので、全体では計n個のカテゴリ結果が存在する。カテゴリ結果後処理モジュール4は、これらn個のカテゴリ結果を併合して、1つの包括的カテゴリ結果を取得する。
カテゴリ結果マッピング手段41は、Kuhn−Munkresアルゴリズム(L.Lovasz and M.Plummer,Matching Theory(照合理論))などを使用して、n個のカテゴリグラフの各カテゴリをマッピングし、n個のグラフを併合したカテゴリ構造を最終的に取得する。
ノード出現計数手段42は、カテゴリ結果マッピング手段41によって生成されたカテゴリ構造に基づいて、併合カテゴリ構造内での各ノードの出現回数と、各ノードと各カテゴリグラフとのマッピング関係の出現回数とを計数する。
ノード分類手段43は、ノード出現計数手段42の計数結果に基づいて、各ノードを、併合カテゴリ構造の対応するカテゴリに割り当てる。
図12に、図9および図10に対応する併合後の包括的カテゴリ結果を示す。図12を参照すると、併合後の包括的カテゴリ結果は、t1+t2の期間中には、エンティティA、Bがサブカテゴリ2−1に属し、エンティティCがサブカテゴリ2−2に属し、エンティティA、B、Cはすべてサブカテゴリ2に属すること、エンティティDはサブカテゴリ3に属すること、そして、エンティティA〜Dはすべてカテゴリ1に属することが示されている。
(ビジネス関係の分類と分析)
図2は、時系列ビジネス関係を分類および分析するシステムを示す全体ブロック図である。図2には、本発明がビジネス関係に適用された場合の例が示されている。図2のシステムは、図1に示す時系列関係を分類および分析するための一般的なシステムと比較すると、ビジネス関係の分類および分析にのみ適用される点が異なる。モジュール1〜4は図1と同一なので、煩雑化を避けるため説明を省略する。参照番号6は、カテゴリ結果に基づいて時系列ビジネス関係に対してビジネスイベント検出を実行し、最終的にビジネスイベント結果7を出力する、産業ベースのビジネスイベント検出モジュールを表す。
ビジネスイベント7とは、ユーザまたは他企業にとって発見的な意味を有する、産業分析の観点から抽出される高レベルなイベントを意味する。例えば、1998年1月〜2001年1月にA社は産業の中核的な企業であったことや、1999年1月〜2000年1月にB社は急成長したことは、これらのイベントに該当する。
図13は、産業ベースのビジネスイベント検出サブモジュール6を示すブロック図およびデータフローチャートである。
産業分類手段61は、すべての関係およびノードを時間単位ごとに産業について分割し、産業細分分割しきい値に従って時系列カテゴリ結果を選択し、時系列関係グラフ内のすべてのノードとリンクをカテゴリ(各産業)ごとに分類することにより、すべての企業とビジネス関係を個々の産業に分類する。
企業重要度計算手段62は、各時間単位内の各産業を対象に、その産業の各企業の重要度を計算する。この計算は、Page Rank法やHITSアルゴリズムのような既存のアルゴリズムや、その他の適用可能な方法を使用して実行することができる。
ビジネスイベント検出手段63は、各時間単位内の各産業を対象に、その産業の企業とビジネス関係のみを選択し、ビジネスイベントと企業重要度を同時に検出する。
図14に、ビジネスイベント検出手段63を示すブロック図およびデータフローチャートを示す。ビジネスイベント検出手段63への入力には、産業分類手段61によって生成された時系列企業産業カテゴリおよび時系列企業ビジネス関係カテゴリ、企業重要度計算手段62によって生成された各産業における時系列企業ビジネス重要度などが含まれる。産業選択サブ手段631は、産業分類手段61によって生成された時系列企業産業カテゴリと時系列企業ビジネス関係カテゴリから、指定された産業の企業とビジネス関係を選択する。ルールベースイベント抽出サブ手段633は、予め定義されたルール632に従ってすべての入力データを検出し、ルールに一致するビジネスイベントを出力する。予め定義されたルール632は、手動で予め定義されたしてもよい。予め定義されたルール632の例としては、次のようなものが挙げられる。
sA(t)は、時間tにおける、ある産業に属するA社の重要度を表すために使用される。
・ある産業に属するA社のビジネス重要度が
Figure 2009116870

の場合には、A社はt0〜t1の期間中においてその産業の主要企業であると判断できる。
・ある産業に属するA社について、
Figure 2009116870

が成り立つ場合には、A社はt0〜t1の期間中に急速に成長したと判断できる。
・ある産業に属するA社について、
Figure 2009116870
が成り立つ場合には、A社はt0〜t1の期間中に何らかの問題を抱えていると判断できる。
・ある産業に属するA社およびB社について、
Figure 2009116870

が成り立つ場合には、A社とB社の関係はt0〜t1の期間中に急速に進展したと判断できる。
・ある産業に属するA社およびB社について、
Figure 2009116870

が成り立つ場合には、A社とB社の関係はt0〜t1の期間中に悪化したと判断できる。
以上、本発明についてその好適な実施例を参照して説明してきたが、本発明には、その精神と範囲から逸脱することなく、様々な変更、置換、追加を行うことが可能なことは当業者には明らかであろう。したがって、本発明の範囲は上記の実施例に限定されず、付記した請求項によってのみ定義される。
(付録)
*米国特許出願明細書第IA078650号の関連の内容(当該出願明細書の図3およびその説明。参照番号を区別するため、番号に(”)を付加する)
時系列企業関係抽出サブモジュール22”
図15は、時系列企業関係抽出サブモジュール22”を示すブロック図およびデータフローチャートである。
企業ビジネス関係インスタンス強さ計算手段221”は、各企業ビジネス関係インスタンスRI(A,B,X,t’)に基づいて、ある時間単位tにおけるA、B、Xの企業ビジネス関係の強さSI(A,B,X,t)を計算する。
企業ビジネス関係インスタンスA、B、Xは、この時間単位tの間に複数回発生する可能性もある。例えば、このインスタンスが異なるニュースサイトで取り上げられたり、tの間に複数回指摘されたりする場合がこれに該当する。時間単位tにおける企業ビジネス関係インスタンス数は、Ctを使用して表す。したがって、SI(A,B,X,t)は以下の式で計算できる。
Figure 2009116870
ここで、niは対応するi番目のインスタンス、ms(ni)はこのインスタンスのニュースの照合スコアである。また、「強さ」とは、時間単位tにおける全インスタンスのスコアの合計である。
時系列補間手段222”は、最終的には、所定の期間内におけるすべての継続的な企業間関係がスコアを有するように、所定の期間内に企業ビジネス関係インスタンスが発生しなかった企業関係のスコアを補間により計算する。継続的な企業関係とは、関係が1度限りのイベント的な関係ではなく、一定期間にわたって継続することを意味する。例えば、競争、協力、株式保有、供給はすべて継続的なビジネス関係である。例えば、2000年6月にはA社とB社の間に競争関係がなく、この関係が2000年1月より前に発生したような場合には、この関係の直前のスコアを使用して、2000年6月のスコアが補間により計算される。以下に、補間の実行方法の例を示す。
ここで、2企業間の関係RIが、最初にt0に発生し、最後にtmに発生すると想定する。
tにおける企業関係の強さを計算するため、tの直前に発生したインスタンスがtkに発生し、tの直後に発生したインスタンスがtlに発生すると想定する。
Figure 2009116870
上記の例では、関係のスコアは時間の経過に伴って幾何級数的に減少または増大するが、当該技術に精通する当業者にはよく知られているように、この変動は、一定期間における線形の減少または増大となる可能性が高い。
イベント的ビジネス関係/矛盾処理手段223”は、イベント的なビジネス関係を処理する。イベント的なビジネス関係とは、継続的なビジネス関係ではない、1度限りのイベントを意味する。例えば、法人設立と買収はイベント的なビジネス関係であり、競争、協力、株式保有、供給はすべて継続的なビジネス関係である。このプロセスは、関係自体のスコアの処理と、矛盾の処理と、影響を受ける他の関係の処理とで構成される。以下に、この処理方法の例を示す。
最初に、矛盾の問題を取り上げる。矛盾の解決手法は以下のとおりである。
時間矛盾処理:イベント的な関係は、理論的には1度だけ発生するはずである。しかし、インターネット上の情報は完全に信頼できるものではないため、矛盾が生じる可能性がある。矛盾がある場合、すなわちRI(A,B,X,t1)とRI(A,B,X,t2)(t1
<t2)が同時に発生した場合には、調整後の企業関係の強さは以下のようになる。
sA,B,X(t1)=siA,B,X(t1)+siA,B,X(t2)
sA,B,X(t2)=0
方向矛盾処理:方向矛盾処理は、買収のような方向性のあるイベント的関係を処理する。このような関係においては、2企業間の正しい方向は1つしか存在しない。RI(A,B,X,t1)とRI(A,B,X,t2)(t1<t2)が同時に存在しており、以下が成り立つ場合には、
Figure 2009116870
次のような式となる。
sA,B,X(t1)=sA,B,X(t1)
sA,B,X(t2)=0
成り立たない場合には、次のような式となる。
sA,B,X(t1)=0
sA,B,X(t2)=sA,B,X(t2)
次に、他のビジネス関係への影響が処理される。Xが法人設立または買収の関係で、かつ、sA,B,X(t1)>TH(THは予め決定されたしきい値)の場合には、A社とB社はt1後に新設合併により1つの会社になるため、A社とB社の間で維持される継続的な関係はない。法人設立後、A社(またはB社)と他企業との間における関係スコアは以下のように調整される。
sA’,C,X(t)=sA,C,X(t)+sB,C,X(t)
上記の処理が完了した後、イベント的ビジネス関係/矛盾処理手段223”は時系列スコア化企業ビジネス関係32”を出力する。
時系列包括的企業ビジネス関係スコア計算手段224”は、2企業間の時系列包括的ビジネス関係スコアと平均総ビジネス関係スコアを計算する。(米国特許出願明細書第IA078649号の発明においては、時系列包括的ビジネス関係スコアを計算する必要はなく、時系列包括的エンティティ関係の計算は、関係同期化手段22によって実行される)。具体的には、これらの関係スコアの加重平均が計算され、以下の式で表される時系列包括的ビジネス関係スコアが取得される。
sA,B(t)=Σw(X)・sA,B,X(t)
ここで、w(X)は個々の関係の重みである。この重みは経験値とするか、または統計的手法によって得ることができる。統計的手法の例としては、1つの関係が1つの業界で発生する確率を計算し、それを重みとして使用する方法が挙げられる。この場合は、その後、総ビジネス関係スコアが、一定期間における平均として算出される。時系列包括的企業ビジネス関係スコア計算手段224”は、上記の処理の後、時系列包括的企業ビジネス関係スコア33”を出力する。
本発明の上記およびその他の目的、特徴、および利点は、図面を参照しながら、その好適な実施例について述べた以下の説明を読むことにより、さらに明らかになるであろう。
時系列関係を分類および分析するシステムを示す全体ブロック図である。 時系列ビジネス関係を分類および分析するシステムを示す全体ブロック図である。 時系列関係グラフ生成モジュール2を示すブロック図およびデータフローチャートである。 処理中に時系列関係生成手段21によって生成された、詳細な時系列関係および時系列包括的関係グラフ(以下、時系列包括的関係グラフを「時系列関係グラフ」という)を示し、このうち、図4および図5はそれぞれ、時点t1における詳細な時系列関係と包括的関係グラフとを示し、 処理中に時系列関係生成手段21によって生成された、詳細な時系列関係および時系列包括的関係グラフ(以下、時系列包括的関係グラフを「時系列関係グラフ」という)を示し、このうち、図4および図5はそれぞれ、時点t1における詳細な時系列関係と包括的関係グラフとを示し、 処理中に時系列関係生成手段21によって生成された、詳細な時系列関係および時系列包括的関係グラフ(以下、時系列包括的関係グラフを「時系列関係グラフ」という)を示し、このうち、図6および図7はそれぞれ、時点t2における詳細な時系列関係と包括的関係グラフとを示す。 処理中に時系列関係生成手段21によって生成された、詳細な時系列関係および時系列包括的関係グラフ(以下、時系列包括的関係グラフを「時系列関係グラフ」という)を示し、このうち、図6および図7はそれぞれ、時点t2における詳細な時系列関係と包括的関係グラフとを示す。 カテゴリ結果の例を示す。 図5に対応する時点t1のカテゴリ結果と、図7に対応する時点t2のカテゴリ結果とを示す。 図5に対応する時点t1のカテゴリ結果と、図7に対応する時点t2のカテゴリ結果とを示す。 カテゴリ後処理モジュール4を示すブロック図およびデータフローチャートである。 図9および図10に対応する併合カテゴリ結果を示す。 産業ベースのビジネスイベント検出モジュール6を示すブロック図およびデータフローチャートである。 ビジネスイベント検出手段63を示すブロック図およびデータフローチャートである。 特許文献2(米国特許出願第IA078650号)の図3の時系列企業関係抽出サブモジュール22”を示すブロック図およびデータフローチャートである。
符号の説明
1:関係インスタンス
2:時系列関係グラフの生成
3:時系列関係グラフのカテゴリ化
4:カテゴリ結果の後処理
5:分類済みノードと全関係
6:産業ベースのビジネスイベントの検出
7:ビジネスイベント
631:産業の選択
632:予め定義されたルール
633:ルールベースイベントの抽出
22”:入力:企業ビジネス関係インスタンス
221”:企業ビジネス関係インスタンス強さの計算
222”:時系列補間
223”:イベント的ビジネス関係/矛盾処理
224”:時系列包括的企業ビジネス関係スコアの計算

Claims (28)

  1. 時系列関係グラフに基づくエンティティ分類装置であって、
    所定の期間内の各時系列関係グラフにおいて、ノードがエンティティを表し、ノード間のリンクが対応する時間単位におけるエンティティ関係を表し、
    各時系列関係グラフ内のノードを分類して、時間系列の対応する時間単位毎にノードカテゴリ結果を生成する時系列関係グラフ分類部と、
    前記時系列関係グラフ分類部によって生成された時間系列の対応する時間単位毎のすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理部と
    を備えることを特徴とするエンティティ分類装置。
  2. 入力された関係インスタンスを処理して、対応する時系列関係グラフを生成する時系列関係グラフ生成部をさらに備えることを特徴とする請求項1に記載のエンティティ分類装置。
  3. 前記時系列関係グラフ生成部が、
    関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して時系列関係を取得する時系列関係生成手段と、
    前記時系列関係生成手段によって生成されたエンティティ間の各種タイプの時系列関係を同期化して、各2つのエンティティにおける時系列包括的関係を取得する関係同期化手段と、
    所定の期間の各時間単位内において1つの関係グラフを作成して、時系列関係グラフを形成する時系列関係グラフ作成手段と
    を含むことを特徴とする請求項2に記載のエンティティ分類装置。
  4. 前記関係同期化手段によって生成された2つのエンティティの間の前記時系列包括的関係は方向性がないことを特徴とする請求項3に記載のエンティティ分類装置。
  5. 前記関係グラフが、前記時系列関係グラフ作成手段によって作成され、前記ノードはエンティティを表わし、前記ノード間のリンクは2つのエンティティ間の時系列包括的関係を表わし、各リンクの重みは2つのエンティティ間の時系列包括的関係のスコアを表わすことを特徴とする請求項3又は請求項4に記載のエンティティ分類装置。
  6. 前記時系列関係グラフ生成手段は、各時間単位毎に重み付きの1つの無向グラフを生成することを特徴とする請求項3から請求項5の何れかに記載のエンティティ分類装置。
  7. 前記時系列関係グラフ分類手段は、階層的分類方法を使用して、各時間単位毎に時系列関係グラフ内のノードを分類することを特徴とする請求項1に記載のエンティティ分類装置。
  8. 前記カテゴリ結果後処理部が、
    前記時系列関係グラフ分類手段によって生成された時間系列内の対応する時間単位毎にすべてのノードカテゴリ結果に含まれる各カテゴリをマッピングして、併合ノードカテゴリ構造を取得するカテゴリ結果マッピング手段と、
    併合ノードカテゴリ構造の各カテゴリに関して、前記カテゴリ結果マッピング手段によって生成された併合ノードカテゴリ構造に基づいて、当該構造内での各ノードの出現回数と、各ノードと各ノードカテゴリ結果とのマッピング関係の出現回数とを計数するノード出現計数手段と、
    前記ノード出現計数手段の計数結果に基づいて、各ノードを、併合ノードカテゴリ構造の対応するカテゴリに割り当てるノード分類手段と
    を含むことを特徴とする請求項1に記載のエンティティ分類装置。
  9. 前記カテゴリ結果マッピング手段が、Kuhn−Munkresアルゴリズムを利用してカテゴリのマッピングを行なうことを特徴とする請求項8に記載のエンティティ分類装置。
  10. 前記カテゴリ結果後処理部が、さらに併合ノードカテゴリ結果を生成すると共に、
    併合ノードカテゴリ結果に基づいて、エンティティ関係に対してイベント検出を実行し、イベント結果を出力するイベント検出部をさらに備えることを特徴とする請求項1から請求項9の何れかに記載のエンティティ分類装置。
  11. 前記イベント検出部が、
    各時間単位毎にカテゴリについてすべてのエンティティおよび関係を分割し、所定のカテゴリ細分しきい値に従って、時間系列における対応する時間単位毎にノードカテゴリ結果を選択し、すべてのエンティティおよび関係をそれぞれのカテゴリに分類するために、選択したカテゴリ結果のカテゴリ毎に、時系列関係グラフにおけるすべてのノードおよびリンクを分類するカテゴリ分類手段と、
    各時間単位内の各カテゴリ毎に、各エンティティの時系列エンティティ重要度を計算するエンティティ重要度計算手段と、
    各時間単位内の各カテゴリ毎に、現在のカテゴリのエンティティと関係を選択し、時系列エンティティ重要度と同時にイベントを検知するイベント検出手段と
    を含むことを特徴とする請求項10に記載のエンティティ分類装置。
  12. 前記エンティティ重要度計算手段は、Page Rank法あるいはHITSアルゴリズムを利用することにより、前記エンティティ重要性を計算することを特徴とする請求項11に記載のエンティティ分類装置。
  13. 前記イベント検出手段が、
    前記カテゴリ分類手段によって生成された、時系列エンティティおよび時系列関係から指定されたカテゴリのエンティティおよび関係を選択するカテゴリ選択サブ手段と、
    予め定義されたルール、前記カテゴリ選択サブ手段の選択結果、前記エンティティ重要度計算手段によって生成された各カテゴリ内の各エンティティの時系列エンティティ重要度に基づいて、予め定義されたルールと一致するイベントを検知して出力するルールベースイベント抽出サブ手段とを含むことを特徴とする請求項11又は請求項12に記載のエンティティ分類装置。
  14. 前記エンティティは企業であり、前記関係はビジネス関係であり、前記カテゴリは産業であることを特徴とする請求項1から請求項13の何れかに記載のエンティティ分類装置。
  15. 時系列関係グラフに基づくエンティティ分類方法であって、
    所定の期間内の各時系列関係グラフにおいて、ノードがエンティティを表し、ノード間のリンクが対応する時間単位におけるエンティティ関係を表し、
    各時系列関係グラフ内のノードを分類して、時間系列の対応する時間単位毎にノードカテゴリ結果を生成する時系列関係グラフ分類ステップと、
    時系列関係グラフ分類ステップで生成された時間系列の対応する時間単位毎のすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理ステップと
    を含むことを特徴とするエンティティ分類方法。
  16. 入力された関係インスタンスを処理して、対応する時系列関係グラフを生成する時系列関係グラフ生成ステップをさらに含むことを特徴とする請求項15に記載のエンティティ分類方法。
  17. 前記時系列関係グラフ生成ステップは、
    関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して、時系列関係を取得する時系列関係生成サブステップと、
    前記時系列関係生成サブステップで生成されたエンティティ間の各種タイプの時系列関係を同期化して、各2つのエンティティにおける時系列包括的関係を取得する関係同期化サブステップと、
    所定の期間の各時間単位に関して1つの関係グラフを作成して、時系列関係グラフを形成する時系列関係グラフ作成サブステップと
    を含むことを特徴とする請求項16に記載のエンティティ分類方法。
  18. 前記関係同期化サブステップで生成された2つのエンティティの間の前記時系列包括的関係は方向性がないことを特徴とする請求項17に記載のエンティティ分類方法。
  19. 前記関係グラフが、前記時系列関係グラフ作成手段によって作成され、前記ノードはエンティティを表わし、前記ノード間のリンクは2つのエンティティ間の時系列包括的関係を表わし、各リンクの重みは2つのエンティティ間の時系列包括的関係のスコアを表わすことを特徴とする請求項17又は請求項18に記載のエンティティ分類方法。
  20. 前記時系列関係グラフ生成ステップで、各時間単位毎に重み付きの1つの無向グラフを生成することを特徴とする請求項17から請求項19の何れかに記載のエンティティ分類方法。
  21. 前記時系列関係グラフ分類ステップで、階層的分類方法を使用して、各時間単位毎に時系列関係グラフ内のノードを分類することを特徴とする請求項15に記載のエンティティ分類方法。
  22. 前記カテゴリ結果後処理ステップは、
    時系列関係グラフ分類ステップで生成された時間系列内の対応する時間単位毎にすべてのノードカテゴリ結果に含まれる各カテゴリをマッピングして、併合ノードカテゴリ構造を取得するカテゴリ結果マッピングサブステップと、
    併合ノードカテゴリ構造の各カテゴリに関して、カテゴリ結果マッピングサブステップで生成された併合ノードカテゴリ構造に基づいて、当該構造内での各ノードの出現回数と、各ノードと各ノードカテゴリ結果とのマッピング関係の出現回数とを計数するノード出現計数サブステップと、
    前記ノード出現計数サブステップでの計数結果に基づいて、各ノードを、併合ノードカテゴリ構造の対応するカテゴリに割り当てるノード分類サブステップと
    を含むことを特徴とする請求項15に記載のエンティティ分類方法。
  23. 前記カテゴリ結果マッピングサブステップで、Kuhn−Munkresアルゴリズムを利用してカテゴリのマッピングを行なうことを特徴とする請求項22に記載のエンティティ分類方法。
  24. カテゴリ結果後処理ステップで、併合ノードカテゴリ結果がさらに生成すると共に、
    併合ノードカテゴリ結果に基づいて、エンティティ関係に対してイベント検出を実行し、イベント結果を出力するイベント検出ステップをさらに含むことを特徴とする請求項15から請求項23の何れかに記載のエンティティ分類方法。
  25. 前記イベント検出ステップが、
    各時間単位毎にカテゴリについてすべてのエンティティおよび関係を分割し、所定のカテゴリ細分しきい値に従って、時間系列における対応する時間単位毎にノードカテゴリ結果を選択し、すべてのエンティティおよび関係をそれぞれのカテゴリに分類するために、選択したカテゴリ結果のカテゴリ毎に、時系列関係グラフにおけるすべてのノードおよびリンクを分類するカテゴリ分類サブステップと、
    各時間単位内の各カテゴリ毎に、各エンティティの時系列エンティティ重要度を計算するエンティティ重要度計算サブステップと、
    各時間単位内の各カテゴリ毎に、現在のカテゴリのエンティティと関係を選択し、時系列エンティティ重要度と同時にイベントを検知するイベント検出サブステップと
    を含むことを特徴とする請求項24に記載のエンティティ分類方法。
  26. 前記エンティティ重要度計算サブステップで、Page Rank法あるいはHITSアルゴリズムを利用することにより、前記エンティティ重要性を計算することを特徴とする請求項25に記載のエンティティ分類方法。
  27. 前記イベント検出サブステップが、
    前記カテゴリ分類手段によって生成された、時系列エンティティおよび時系列関係から指定されたカテゴリのエンティティおよび関係を選択するカテゴリ選択サブステップと、
    予め定義されたルール、前記カテゴリ選択サブステップの選択結果、前記エンティティ重要度計算サブステップによって生成された各カテゴリ内の各エンティティの時系列エンティティ重要度に基づいて、予め定義されたルールと一致するイベントを検知して出力するルールベースイベント抽出サブステップとを含むことを特徴とする請求項25又は請求項26に記載のエンティティ分類方法。
  28. 前記エンティティは企業であり、前記関係はビジネス関係であり、前記カテゴリは産業であることを特徴とする請求項15から請求項27の何れかに記載のエンティティ分類方法。
JP2008274581A 2007-11-02 2008-10-24 時系列関係グラフに基づくエンティティ分類装置および方法 Expired - Fee Related JP5128437B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710169206.7 2007-11-02
CN200710169206.7A CN101425066A (zh) 2007-11-02 2007-11-02 基于时序关系图的实体分类设备和方法

Publications (2)

Publication Number Publication Date
JP2009116870A true JP2009116870A (ja) 2009-05-28
JP5128437B2 JP5128437B2 (ja) 2013-01-23

Family

ID=40589266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008274581A Expired - Fee Related JP5128437B2 (ja) 2007-11-02 2008-10-24 時系列関係グラフに基づくエンティティ分類装置および方法

Country Status (3)

Country Link
US (1) US20090119336A1 (ja)
JP (1) JP5128437B2 (ja)
CN (1) CN101425066A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020013413A (ja) * 2018-07-19 2020-01-23 株式会社日立製作所 判断支援装置および判断支援方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853739B (zh) * 2012-11-29 2018-04-17 中国移动通信集团公司 动态社会关系网络社区演化识别以及稳定社区提取方法
CN104714953A (zh) * 2013-12-12 2015-06-17 日本电气株式会社 时序数据的模体识别方法和装置
JP6915542B2 (ja) * 2015-09-30 2021-08-04 日本電気株式会社 情報処理装置、通知システム、情報送信方法及びプログラム
CN106940697B (zh) * 2016-01-04 2020-08-04 阿里巴巴集团控股有限公司 一种时序数据可视化方法及设备
CN108696418B (zh) * 2017-04-06 2020-07-28 腾讯科技(深圳)有限公司 一种社交网络中隐私保护方法及装置
CN111934903B (zh) * 2020-06-28 2023-12-12 上海伽易信息技术有限公司 一种基于时序演化基因的Docker容器故障智能预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003056449A2 (en) * 2001-12-21 2003-07-10 Xmlcities, Inc. Extensible stylesheet designs using meta-tag and/or associated meta-tag information
US7624081B2 (en) * 2006-03-28 2009-11-24 Microsoft Corporation Predicting community members based on evolution of heterogeneous networks using a best community classifier and a multi-class community classifier
US20090006431A1 (en) * 2007-06-29 2009-01-01 International Business Machines Corporation System and method for tracking database disclosures

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020013413A (ja) * 2018-07-19 2020-01-23 株式会社日立製作所 判断支援装置および判断支援方法
JP7065718B2 (ja) 2018-07-19 2022-05-12 株式会社日立製作所 判断支援装置および判断支援方法

Also Published As

Publication number Publication date
US20090119336A1 (en) 2009-05-07
CN101425066A (zh) 2009-05-06
JP5128437B2 (ja) 2013-01-23

Similar Documents

Publication Publication Date Title
US10217027B2 (en) Recognition training apparatus, recognition training method, and storage medium
Mu et al. Classification under streaming emerging new classes: A solution using completely-random trees
JP5128437B2 (ja) 時系列関係グラフに基づくエンティティ分類装置および方法
EP2945071B1 (en) Index generating device and method, and search device and search method
TW202029079A (zh) 異常群體識別方法及裝置
JP5845630B2 (ja) 情報処理装置、情報処理方法、並びにプログラム
Arnaiz-González et al. Fusion of instance selection methods in regression tasks
Nandurge et al. Analyzing road accident data using machine learning paradigms
CN105426356A (zh) 一种目标信息识别方法和装置
JP2009099124A (ja) データ構築方法とシステム
WO2020140620A1 (zh) 基于智能决策的文本分类方法、装置、服务器及存储介质
CN110674865B (zh) 面向软件缺陷类分布不平衡的规则学习分类器集成方法
da Costa et al. Using dynamical systems tools to detect concept drift in data streams
US20170140301A1 (en) Identifying social business characteristic user
US20230051564A1 (en) Digital Image Ordering using Object Position and Aesthetics
Maulana et al. Logistic model tree and decision tree J48 algorithms for predicting the length of study period
de Sousa et al. Concept drift detection and localization in process mining: An integrated and efficient approach enabled by trace clustering
CN105678626B (zh) 重叠社区挖掘方法与装置
JP5391637B2 (ja) データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
CN105279524A (zh) 基于无权超图分割的高维数据聚类方法
CN110019563B (zh) 一种基于多维数据的肖像建模方法和装置
CN104572623B (zh) 一种在线lda模型的高效数据总结分析方法
CN111488400B (zh) 数据分类方法、装置和计算机可读存储介质
CN113360350A (zh) 定位网络设备根因告警的方法、装置、设备和存储介质
CN115660695A (zh) 客服人员标签画像构建方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121031

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151109

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees