JP2009116870A - 時系列関係グラフに基づくエンティティ分類装置および方法 - Google Patents
時系列関係グラフに基づくエンティティ分類装置および方法 Download PDFInfo
- Publication number
- JP2009116870A JP2009116870A JP2008274581A JP2008274581A JP2009116870A JP 2009116870 A JP2009116870 A JP 2009116870A JP 2008274581 A JP2008274581 A JP 2008274581A JP 2008274581 A JP2008274581 A JP 2008274581A JP 2009116870 A JP2009116870 A JP 2009116870A
- Authority
- JP
- Japan
- Prior art keywords
- time
- category
- entity
- relationship
- series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Abstract
【解決手段】 所定の期間内の各時系列関係グラフにおいては、ノードはエンティティを表し、ノード間のリンクは、対応する時間単位におけるエンティティ関係を表す。本発明の時系列関係グラフに基づくエンティティ分類装置は、各時系列関係グラフ内のノードを分類して、時間系列の対応する時間に関するノードカテゴリ結果を生成する時系列関係グラフ分類手段と、時系列関係グラフ分類手段によって生成された、時間系列の対応する時間単位に関するすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理手段とを備える。
【選択図】 図1
Description
エンティティは企業であり、関係はビジネス関係であり、カテゴリは産業であるのが望ましい。
時間依存関係インスタンスから時系列関係を作成し、ノードを分類する問題。および、時系列ビジネス関係とその分類結果に基づいて、ビジネスイベント検出を実行する問題。
図1は、本発明の第1の実施例による、時系列関係を分類および分析するシステムを示す全体ブロック図である。参照番号1は、入力された関係インスタンスを表す。時系列関係グラフ生成モジュール2は、入力された関係インスタンス1を処理して、対応する時系列関係グラフを生成する。時系列関係グラフ分類モジュール3は、時系列関係グラフ生成モジュール2によって生成された時系列関係グラフを分類して、時間系列の各時間単位に関するカテゴリ結果を生成する。カテゴリ結果後処理モジュール4は、時系列関係グラフ分類モジュール3によって生成されたカテゴリ結果を後処理して、時系列包括的カテゴリ結果を生成し、分類済みノードおよび関係を最終的に生成する。
sB,A(t)となる。例えば、企業間の包括的関係は、企業間の交流の親密度を表す。2つの企業間の親密度が高いほど、同じ産業または下位産業区分に属する可能性が高くなる。包括的関係は、いくつかの加算方法または加重加算方法を用いて、様々なタイプの関係を累計することによって計算することができる。計算式は以下のとおりである。
図5および図7に、関係同期化手段22と時系列関係グラフ作成手段23によって生成された時系列関係グラフを示す。このうち、図5は時点t1における包括的関係グラフを示し、図7は時点t2における包括的関係グラフを示す。
図2は、時系列ビジネス関係を分類および分析するシステムを示す全体ブロック図である。図2には、本発明がビジネス関係に適用された場合の例が示されている。図2のシステムは、図1に示す時系列関係を分類および分析するための一般的なシステムと比較すると、ビジネス関係の分類および分析にのみ適用される点が異なる。モジュール1〜4は図1と同一なので、煩雑化を避けるため説明を省略する。参照番号6は、カテゴリ結果に基づいて時系列ビジネス関係に対してビジネスイベント検出を実行し、最終的にビジネスイベント結果7を出力する、産業ベースのビジネスイベント検出モジュールを表す。
*米国特許出願明細書第IA078650号の関連の内容(当該出願明細書の図3およびその説明。参照番号を区別するため、番号に(”)を付加する)
図15は、時系列企業関係抽出サブモジュール22”を示すブロック図およびデータフローチャートである。
<t2)が同時に発生した場合には、調整後の企業関係の強さは以下のようになる。
sA,B,X(t1)=siA,B,X(t1)+siA,B,X(t2)
sA,B,X(t2)=0
sA,B,X(t1)=sA,B,X(t1)
sA,B,X(t2)=0
成り立たない場合には、次のような式となる。
sA,B,X(t1)=0
sA,B,X(t2)=sA,B,X(t2)
sA’,C,X(t)=sA,C,X(t)+sB,C,X(t)
sA,B(t)=Σw(X)・sA,B,X(t)
ここで、w(X)は個々の関係の重みである。この重みは経験値とするか、または統計的手法によって得ることができる。統計的手法の例としては、1つの関係が1つの業界で発生する確率を計算し、それを重みとして使用する方法が挙げられる。この場合は、その後、総ビジネス関係スコアが、一定期間における平均として算出される。時系列包括的企業ビジネス関係スコア計算手段224”は、上記の処理の後、時系列包括的企業ビジネス関係スコア33”を出力する。
2:時系列関係グラフの生成
3:時系列関係グラフのカテゴリ化
4:カテゴリ結果の後処理
5:分類済みノードと全関係
6:産業ベースのビジネスイベントの検出
7:ビジネスイベント
631:産業の選択
632:予め定義されたルール
633:ルールベースイベントの抽出
22”:入力:企業ビジネス関係インスタンス
221”:企業ビジネス関係インスタンス強さの計算
222”:時系列補間
223”:イベント的ビジネス関係/矛盾処理
224”:時系列包括的企業ビジネス関係スコアの計算
Claims (28)
- 時系列関係グラフに基づくエンティティ分類装置であって、
所定の期間内の各時系列関係グラフにおいて、ノードがエンティティを表し、ノード間のリンクが対応する時間単位におけるエンティティ関係を表し、
各時系列関係グラフ内のノードを分類して、時間系列の対応する時間単位毎にノードカテゴリ結果を生成する時系列関係グラフ分類部と、
前記時系列関係グラフ分類部によって生成された時間系列の対応する時間単位毎のすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理部と
を備えることを特徴とするエンティティ分類装置。 - 入力された関係インスタンスを処理して、対応する時系列関係グラフを生成する時系列関係グラフ生成部をさらに備えることを特徴とする請求項1に記載のエンティティ分類装置。
- 前記時系列関係グラフ生成部が、
関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して時系列関係を取得する時系列関係生成手段と、
前記時系列関係生成手段によって生成されたエンティティ間の各種タイプの時系列関係を同期化して、各2つのエンティティにおける時系列包括的関係を取得する関係同期化手段と、
所定の期間の各時間単位内において1つの関係グラフを作成して、時系列関係グラフを形成する時系列関係グラフ作成手段と
を含むことを特徴とする請求項2に記載のエンティティ分類装置。 - 前記関係同期化手段によって生成された2つのエンティティの間の前記時系列包括的関係は方向性がないことを特徴とする請求項3に記載のエンティティ分類装置。
- 前記関係グラフが、前記時系列関係グラフ作成手段によって作成され、前記ノードはエンティティを表わし、前記ノード間のリンクは2つのエンティティ間の時系列包括的関係を表わし、各リンクの重みは2つのエンティティ間の時系列包括的関係のスコアを表わすことを特徴とする請求項3又は請求項4に記載のエンティティ分類装置。
- 前記時系列関係グラフ生成手段は、各時間単位毎に重み付きの1つの無向グラフを生成することを特徴とする請求項3から請求項5の何れかに記載のエンティティ分類装置。
- 前記時系列関係グラフ分類手段は、階層的分類方法を使用して、各時間単位毎に時系列関係グラフ内のノードを分類することを特徴とする請求項1に記載のエンティティ分類装置。
- 前記カテゴリ結果後処理部が、
前記時系列関係グラフ分類手段によって生成された時間系列内の対応する時間単位毎にすべてのノードカテゴリ結果に含まれる各カテゴリをマッピングして、併合ノードカテゴリ構造を取得するカテゴリ結果マッピング手段と、
併合ノードカテゴリ構造の各カテゴリに関して、前記カテゴリ結果マッピング手段によって生成された併合ノードカテゴリ構造に基づいて、当該構造内での各ノードの出現回数と、各ノードと各ノードカテゴリ結果とのマッピング関係の出現回数とを計数するノード出現計数手段と、
前記ノード出現計数手段の計数結果に基づいて、各ノードを、併合ノードカテゴリ構造の対応するカテゴリに割り当てるノード分類手段と
を含むことを特徴とする請求項1に記載のエンティティ分類装置。 - 前記カテゴリ結果マッピング手段が、Kuhn−Munkresアルゴリズムを利用してカテゴリのマッピングを行なうことを特徴とする請求項8に記載のエンティティ分類装置。
- 前記カテゴリ結果後処理部が、さらに併合ノードカテゴリ結果を生成すると共に、
併合ノードカテゴリ結果に基づいて、エンティティ関係に対してイベント検出を実行し、イベント結果を出力するイベント検出部をさらに備えることを特徴とする請求項1から請求項9の何れかに記載のエンティティ分類装置。 - 前記イベント検出部が、
各時間単位毎にカテゴリについてすべてのエンティティおよび関係を分割し、所定のカテゴリ細分しきい値に従って、時間系列における対応する時間単位毎にノードカテゴリ結果を選択し、すべてのエンティティおよび関係をそれぞれのカテゴリに分類するために、選択したカテゴリ結果のカテゴリ毎に、時系列関係グラフにおけるすべてのノードおよびリンクを分類するカテゴリ分類手段と、
各時間単位内の各カテゴリ毎に、各エンティティの時系列エンティティ重要度を計算するエンティティ重要度計算手段と、
各時間単位内の各カテゴリ毎に、現在のカテゴリのエンティティと関係を選択し、時系列エンティティ重要度と同時にイベントを検知するイベント検出手段と
を含むことを特徴とする請求項10に記載のエンティティ分類装置。 - 前記エンティティ重要度計算手段は、Page Rank法あるいはHITSアルゴリズムを利用することにより、前記エンティティ重要性を計算することを特徴とする請求項11に記載のエンティティ分類装置。
- 前記イベント検出手段が、
前記カテゴリ分類手段によって生成された、時系列エンティティおよび時系列関係から指定されたカテゴリのエンティティおよび関係を選択するカテゴリ選択サブ手段と、
予め定義されたルール、前記カテゴリ選択サブ手段の選択結果、前記エンティティ重要度計算手段によって生成された各カテゴリ内の各エンティティの時系列エンティティ重要度に基づいて、予め定義されたルールと一致するイベントを検知して出力するルールベースイベント抽出サブ手段とを含むことを特徴とする請求項11又は請求項12に記載のエンティティ分類装置。 - 前記エンティティは企業であり、前記関係はビジネス関係であり、前記カテゴリは産業であることを特徴とする請求項1から請求項13の何れかに記載のエンティティ分類装置。
- 時系列関係グラフに基づくエンティティ分類方法であって、
所定の期間内の各時系列関係グラフにおいて、ノードがエンティティを表し、ノード間のリンクが対応する時間単位におけるエンティティ関係を表し、
各時系列関係グラフ内のノードを分類して、時間系列の対応する時間単位毎にノードカテゴリ結果を生成する時系列関係グラフ分類ステップと、
時系列関係グラフ分類ステップで生成された時間系列の対応する時間単位毎のすべてのノードカテゴリ結果を後処理して、最終的な分類済みノードを生成するカテゴリ結果後処理ステップと
を含むことを特徴とするエンティティ分類方法。 - 入力された関係インスタンスを処理して、対応する時系列関係グラフを生成する時系列関係グラフ生成ステップをさらに含むことを特徴とする請求項15に記載のエンティティ分類方法。
- 前記時系列関係グラフ生成ステップは、
関係インスタンスのスコアを計算し、内部矛盾を解決し、欠落した時点に対して補間を実行して、時系列関係を取得する時系列関係生成サブステップと、
前記時系列関係生成サブステップで生成されたエンティティ間の各種タイプの時系列関係を同期化して、各2つのエンティティにおける時系列包括的関係を取得する関係同期化サブステップと、
所定の期間の各時間単位に関して1つの関係グラフを作成して、時系列関係グラフを形成する時系列関係グラフ作成サブステップと
を含むことを特徴とする請求項16に記載のエンティティ分類方法。 - 前記関係同期化サブステップで生成された2つのエンティティの間の前記時系列包括的関係は方向性がないことを特徴とする請求項17に記載のエンティティ分類方法。
- 前記関係グラフが、前記時系列関係グラフ作成手段によって作成され、前記ノードはエンティティを表わし、前記ノード間のリンクは2つのエンティティ間の時系列包括的関係を表わし、各リンクの重みは2つのエンティティ間の時系列包括的関係のスコアを表わすことを特徴とする請求項17又は請求項18に記載のエンティティ分類方法。
- 前記時系列関係グラフ生成ステップで、各時間単位毎に重み付きの1つの無向グラフを生成することを特徴とする請求項17から請求項19の何れかに記載のエンティティ分類方法。
- 前記時系列関係グラフ分類ステップで、階層的分類方法を使用して、各時間単位毎に時系列関係グラフ内のノードを分類することを特徴とする請求項15に記載のエンティティ分類方法。
- 前記カテゴリ結果後処理ステップは、
時系列関係グラフ分類ステップで生成された時間系列内の対応する時間単位毎にすべてのノードカテゴリ結果に含まれる各カテゴリをマッピングして、併合ノードカテゴリ構造を取得するカテゴリ結果マッピングサブステップと、
併合ノードカテゴリ構造の各カテゴリに関して、カテゴリ結果マッピングサブステップで生成された併合ノードカテゴリ構造に基づいて、当該構造内での各ノードの出現回数と、各ノードと各ノードカテゴリ結果とのマッピング関係の出現回数とを計数するノード出現計数サブステップと、
前記ノード出現計数サブステップでの計数結果に基づいて、各ノードを、併合ノードカテゴリ構造の対応するカテゴリに割り当てるノード分類サブステップと
を含むことを特徴とする請求項15に記載のエンティティ分類方法。 - 前記カテゴリ結果マッピングサブステップで、Kuhn−Munkresアルゴリズムを利用してカテゴリのマッピングを行なうことを特徴とする請求項22に記載のエンティティ分類方法。
- カテゴリ結果後処理ステップで、併合ノードカテゴリ結果がさらに生成すると共に、
併合ノードカテゴリ結果に基づいて、エンティティ関係に対してイベント検出を実行し、イベント結果を出力するイベント検出ステップをさらに含むことを特徴とする請求項15から請求項23の何れかに記載のエンティティ分類方法。 - 前記イベント検出ステップが、
各時間単位毎にカテゴリについてすべてのエンティティおよび関係を分割し、所定のカテゴリ細分しきい値に従って、時間系列における対応する時間単位毎にノードカテゴリ結果を選択し、すべてのエンティティおよび関係をそれぞれのカテゴリに分類するために、選択したカテゴリ結果のカテゴリ毎に、時系列関係グラフにおけるすべてのノードおよびリンクを分類するカテゴリ分類サブステップと、
各時間単位内の各カテゴリ毎に、各エンティティの時系列エンティティ重要度を計算するエンティティ重要度計算サブステップと、
各時間単位内の各カテゴリ毎に、現在のカテゴリのエンティティと関係を選択し、時系列エンティティ重要度と同時にイベントを検知するイベント検出サブステップと
を含むことを特徴とする請求項24に記載のエンティティ分類方法。 - 前記エンティティ重要度計算サブステップで、Page Rank法あるいはHITSアルゴリズムを利用することにより、前記エンティティ重要性を計算することを特徴とする請求項25に記載のエンティティ分類方法。
- 前記イベント検出サブステップが、
前記カテゴリ分類手段によって生成された、時系列エンティティおよび時系列関係から指定されたカテゴリのエンティティおよび関係を選択するカテゴリ選択サブステップと、
予め定義されたルール、前記カテゴリ選択サブステップの選択結果、前記エンティティ重要度計算サブステップによって生成された各カテゴリ内の各エンティティの時系列エンティティ重要度に基づいて、予め定義されたルールと一致するイベントを検知して出力するルールベースイベント抽出サブステップとを含むことを特徴とする請求項25又は請求項26に記載のエンティティ分類方法。 - 前記エンティティは企業であり、前記関係はビジネス関係であり、前記カテゴリは産業であることを特徴とする請求項15から請求項27の何れかに記載のエンティティ分類方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710169206.7 | 2007-11-02 | ||
CN200710169206.7A CN101425066A (zh) | 2007-11-02 | 2007-11-02 | 基于时序关系图的实体分类设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009116870A true JP2009116870A (ja) | 2009-05-28 |
JP5128437B2 JP5128437B2 (ja) | 2013-01-23 |
Family
ID=40589266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008274581A Expired - Fee Related JP5128437B2 (ja) | 2007-11-02 | 2008-10-24 | 時系列関係グラフに基づくエンティティ分類装置および方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20090119336A1 (ja) |
JP (1) | JP5128437B2 (ja) |
CN (1) | CN101425066A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013413A (ja) * | 2018-07-19 | 2020-01-23 | 株式会社日立製作所 | 判断支援装置および判断支援方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853739B (zh) * | 2012-11-29 | 2018-04-17 | 中国移动通信集团公司 | 动态社会关系网络社区演化识别以及稳定社区提取方法 |
CN104714953A (zh) * | 2013-12-12 | 2015-06-17 | 日本电气株式会社 | 时序数据的模体识别方法和装置 |
JP6915542B2 (ja) * | 2015-09-30 | 2021-08-04 | 日本電気株式会社 | 情報処理装置、通知システム、情報送信方法及びプログラム |
CN106940697B (zh) * | 2016-01-04 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 一种时序数据可视化方法及设备 |
CN108696418B (zh) * | 2017-04-06 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 一种社交网络中隐私保护方法及装置 |
CN111934903B (zh) * | 2020-06-28 | 2023-12-12 | 上海伽易信息技术有限公司 | 一种基于时序演化基因的Docker容器故障智能预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003056449A2 (en) * | 2001-12-21 | 2003-07-10 | Xmlcities, Inc. | Extensible stylesheet designs using meta-tag and/or associated meta-tag information |
US7624081B2 (en) * | 2006-03-28 | 2009-11-24 | Microsoft Corporation | Predicting community members based on evolution of heterogeneous networks using a best community classifier and a multi-class community classifier |
US20090006431A1 (en) * | 2007-06-29 | 2009-01-01 | International Business Machines Corporation | System and method for tracking database disclosures |
-
2007
- 2007-11-02 CN CN200710169206.7A patent/CN101425066A/zh active Pending
-
2008
- 2008-10-24 JP JP2008274581A patent/JP5128437B2/ja not_active Expired - Fee Related
- 2008-10-30 US US12/261,820 patent/US20090119336A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013413A (ja) * | 2018-07-19 | 2020-01-23 | 株式会社日立製作所 | 判断支援装置および判断支援方法 |
JP7065718B2 (ja) | 2018-07-19 | 2022-05-12 | 株式会社日立製作所 | 判断支援装置および判断支援方法 |
Also Published As
Publication number | Publication date |
---|---|
US20090119336A1 (en) | 2009-05-07 |
CN101425066A (zh) | 2009-05-06 |
JP5128437B2 (ja) | 2013-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10217027B2 (en) | Recognition training apparatus, recognition training method, and storage medium | |
Mu et al. | Classification under streaming emerging new classes: A solution using completely-random trees | |
JP5128437B2 (ja) | 時系列関係グラフに基づくエンティティ分類装置および方法 | |
EP2945071B1 (en) | Index generating device and method, and search device and search method | |
TW202029079A (zh) | 異常群體識別方法及裝置 | |
JP5845630B2 (ja) | 情報処理装置、情報処理方法、並びにプログラム | |
Arnaiz-González et al. | Fusion of instance selection methods in regression tasks | |
Nandurge et al. | Analyzing road accident data using machine learning paradigms | |
CN105426356A (zh) | 一种目标信息识别方法和装置 | |
JP2009099124A (ja) | データ構築方法とシステム | |
WO2020140620A1 (zh) | 基于智能决策的文本分类方法、装置、服务器及存储介质 | |
CN110674865B (zh) | 面向软件缺陷类分布不平衡的规则学习分类器集成方法 | |
da Costa et al. | Using dynamical systems tools to detect concept drift in data streams | |
US20170140301A1 (en) | Identifying social business characteristic user | |
US20230051564A1 (en) | Digital Image Ordering using Object Position and Aesthetics | |
Maulana et al. | Logistic model tree and decision tree J48 algorithms for predicting the length of study period | |
de Sousa et al. | Concept drift detection and localization in process mining: An integrated and efficient approach enabled by trace clustering | |
CN105678626B (zh) | 重叠社区挖掘方法与装置 | |
JP5391637B2 (ja) | データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム | |
CN105279524A (zh) | 基于无权超图分割的高维数据聚类方法 | |
CN110019563B (zh) | 一种基于多维数据的肖像建模方法和装置 | |
CN104572623B (zh) | 一种在线lda模型的高效数据总结分析方法 | |
CN111488400B (zh) | 数据分类方法、装置和计算机可读存储介质 | |
CN113360350A (zh) | 定位网络设备根因告警的方法、装置、设备和存储介质 | |
CN115660695A (zh) | 客服人员标签画像构建方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121026 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121031 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151109 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |