JP2012198873A - データセットからの情報取得方法およびシステム - Google Patents
データセットからの情報取得方法およびシステム Download PDFInfo
- Publication number
- JP2012198873A JP2012198873A JP2011262268A JP2011262268A JP2012198873A JP 2012198873 A JP2012198873 A JP 2012198873A JP 2011262268 A JP2011262268 A JP 2011262268A JP 2011262268 A JP2011262268 A JP 2011262268A JP 2012198873 A JP2012198873 A JP 2012198873A
- Authority
- JP
- Japan
- Prior art keywords
- subgraph
- inference
- subgraphs
- nodes
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 この情報取得方法は、データを表すノードとノード間の関係を表すエッジとで構成される、データセットを表すグラフをクラスタ化して、複数のサブグラフを取得するステップと、サブグラフ範囲内にある取得された複数のサブグラフのうち少なくとも1つに対して推論を実行するステップとを含む。この方法によれば、グラフのクラスタ化は、事前定義されたモデルを必要としない無監視方式で実行されるため、柔軟性と適応性がきわめて高い。さらに、クラスタ化によって得られる各サブグラフ内のノード数とノード間関係数は少ないため、推論の規模を容易に制御できるので、推論の効率が向上する。
【選択図】 図2
Description
ここで、Gはグラフ全体、Sはサブグラフ、G\SはサブグラフSを除去した後のグラフGの残余部分を示す。また、c(S、G\S)はサブグラフSと残余部分G\S間のカットサイズ、すなわち、SとG\S間のエッジ数を示す。deg(S)はサブグラフSの度数、すなわち、そのサブグラフ内のエッジ数である。サブグラフは伝導度Φ(S)に基づいてランク付けすることができ、この場合は、サブグラフの伝導度が小さい(すなわち、独立度が高い)ほど高い順序になり、サブグラフの伝導度が大きい(すなわち、独立度が低い)ほど低い順序になる。
ここで、式(1)と同様に、Sはサブグラフ、G\SはSを除去した後のグラフGの残余部分を示す。また、deg(S)とc(S,G\S)はそれぞれ、サブグラフSの度数、およびサブグラフSと残余部分G\S間のカットサイズをそれぞれ示す。相対密度を採用する場合は、サブグラフは相対密度が高いほど高い順位になり、相対密度が低いほど低い順位になる。
データセットから情報を取得する方法であって、
データを表すノードとノード間の関係を表すエッジとで構成される、データセットを表すグラフをクラスタ化して、複数のサブグラフを取得するステップと、
サブグラフ範囲内にある取得された複数のサブグラフのうち少なくとも1つに対して推論を実行するステップと
を含むことを特徴とする方法。
各サブグラフの重要度に基づいて、取得された複数のサブグラフをランク付けするステップをさらに含み、
前記推論を複数のサブグラフの順位に基づいて実行することを特徴とする付記1に記載の方法。
前記重要度は、サブグラフの密度、サブグラフの独立度、およびサブグラフの階層レベルのうち1つ以上によって測定されることを特徴とする付記2に記載の方法。
1つのサブグラフ内での推論から結果が得られなかった場合に、他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張して推論を実行するステップをさらに含むことを特徴とする付記1に記載の方法。
他のサブグラフ内の当該サブグラフにリンクされたノードは、サブグラフの順位、サブグラフ内に欠けているノード関係タイプ、ノード間関係の優先順位のうち1つに基づいて選択されることを特徴とする付記4に記載の方法。
他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張した推論からの結果の取得に応じて、当該サブグラフと他のサブグラフをマージして新たなサブグラフを形成するステップと、
前記新たなサブグラフ内で推論を実行するステップとをさらに含むことを特徴とする付記4に記載の方法。
後続の使用のために新たなサブグラフを保存するステップをさらに含むことを特徴とする付記6に記載の方法。
データセットから情報を取得するシステムであって、
データを表すノードとノード間の関係を表すエッジとで構成される、データセットを表すグラフをクラスタ化して、複数のサブグラフを取得するように構成されたクラスタ化手段と、
サブグラフ範囲内にある取得された複数のサブグラフのうち少なくとも1つに対して推論を実行するように構成された推論手段と
を備えることを特徴とするシステム。
個々のサブグラフの重要度に基づいて、取得された複数のサブグラフをランク付けするように構成されたランク付け手段をさらに備え、
前記推論手段は、複数のサブグラフの順位に基づいて推論を実行するように構成されることを特徴とする付記8に記載のシステム。
前記重要度は、サブグラフの密度、サブグラフの独立度、およびサブグラフの階層レベルのうち1つ以上によって測定されることを特徴とする付記9に記載のシステム。
前記推論手段は、1つのサブグラフ内での推論から結果が得られなかった場合に、他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張して推論を実行するように構成されることを特徴とする付記8に記載のシステム。
前記推論手段は、他のサブグラフ内の当該サブグラフにリンクされたノードを、サブグラフの順位、サブグラフ内に欠けているノード関係タイプ、ノード間関係の優先順位のうち1つに基づいて選択するように構成されることを特徴とする付記11に記載のシステム。
他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張した推論からの結果の取得に応じて、当該サブグラフと他のサブグラフをマージして新たなサブグラフを形成するように構成されたマージ手段をさらに備え、
前記推論手段は、新たなサブグラフ内で推論を実行するように構成されることを特徴とする付記11に記載のシステム。
後続の使用のために新たなサブグラフを保存するように構成された保存手段をさらに備えることを特徴とする付記13に記載のシステム。
601:クラスタ化手段
602:推論手段
603:ランク付け手段
604:マージ手段
605:保存手段
Claims (10)
- データセットから情報を取得する方法であって、
データを表すノードとノード間の関係を表すエッジとで構成される、データセットを表すグラフをクラスタ化して、複数のサブグラフを取得するステップと、
サブグラフ範囲内にある取得された複数のサブグラフのうち少なくとも1つに対して推論を実行するステップと
を含むことを特徴とする方法。 - 各サブグラフの重要度に基づいて、取得された複数のサブグラフをランク付けするステップをさらに含み、
前記推論を複数のサブグラフの順位に基づいて実行することを特徴とする請求項1に記載の方法。 - 前記重要度は、サブグラフの密度、サブグラフの独立度、およびサブグラフの階層レベルのうち1つ以上によって測定されることを特徴とする請求項2に記載の方法。
- 1つのサブグラフ内での推論から結果が得られなかった場合に、他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張して推論を実行するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 他のサブグラフ内の当該サブグラフにリンクされたノードは、サブグラフの順位、サブグラフ内に欠けているノード関係タイプ、ノード間関係の優先順位のうち1つに基づいて選択されることを特徴とする請求項4に記載の方法。
- 他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張した推論からの結果の取得に応じて、当該サブグラフと他のサブグラフをマージして新たなサブグラフを形成するステップと、
前記新たなサブグラフ内で推論を実行するステップとをさらに含むことを特徴とする請求項4に記載の方法。 - 後続の使用のために新たなサブグラフを保存するステップをさらに含むことを特徴とする請求項6に記載の方法。
- データセットから情報を取得するシステムであって、
データを表すノードとノード間の関係を表すエッジとで構成される、データセットを表すグラフをクラスタ化して、複数のサブグラフを取得するように構成されたクラスタ化手段と、
サブグラフ範囲内にある取得された複数のサブグラフのうち少なくとも1つに対して推論を実行するように構成された推論手段と
を備えることを特徴とするシステム。 - 個々のサブグラフの重要度に基づいて、取得された複数のサブグラフをランク付けするように構成されたランク付け手段をさらに備え、
前記推論手段は、複数のサブグラフの順位に基づいて推論を実行するように構成されることを特徴とする請求項8に記載のシステム。 - 前記推論手段は、1つのサブグラフ内での推論から結果が得られなかった場合に、他のサブグラフ内の、当該サブグラフにリンクされたノードに拡張して推論を実行するように構成されることを特徴とする請求項8に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110077432.9 | 2011-03-22 | ||
CN201110077432.9A CN102693246B (zh) | 2011-03-22 | 2011-03-22 | 一种用于从数据集获取信息的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012198873A true JP2012198873A (ja) | 2012-10-18 |
Family
ID=46858703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011262268A Pending JP2012198873A (ja) | 2011-03-22 | 2011-11-30 | データセットからの情報取得方法およびシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2012198873A (ja) |
CN (1) | CN102693246B (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015011709A (ja) * | 2013-07-01 | 2015-01-19 | パロ・アルト・リサーチ・センター・インコーポレーテッドPalo Alto Research Center Incorporated | 明示的に表されたグラフで並列探索を行うシステムおよび方法 |
KR20150125511A (ko) * | 2014-04-30 | 2015-11-09 | 한국과학기술원 | 그래프 압축 처리 방법 및 장치 |
JP2017509043A (ja) * | 2013-12-30 | 2017-03-30 | 華為技術有限公司Huawei Technologies Co.,Ltd. | グラフデータクエリ方法および装置 |
JP2019200724A (ja) * | 2018-05-18 | 2019-11-21 | ヤフー株式会社 | 演算装置、および検索方法 |
CN114928545A (zh) * | 2022-03-31 | 2022-08-19 | 中国电子科技集团公司第十五研究所 | 一种基于Spark的大规模流量数据关键节点计算方法 |
CN115511086A (zh) * | 2022-11-03 | 2022-12-23 | 上海人工智能创新中心 | 一种针对超大模型的分布式推理部署系统 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343241B (zh) * | 2015-07-24 | 2022-12-09 | 创新先进技术有限公司 | 一种图数据更新方法、装置及系统 |
CN105468702B (zh) * | 2015-11-18 | 2019-03-22 | 中国科学院计算机网络信息中心 | 一种大规模rdf数据关联路径发现方法 |
CN107807900B (zh) * | 2017-11-14 | 2021-02-19 | 浙江亿邦通信科技股份有限公司 | 数据处理系统及服务器 |
CN108959584B (zh) * | 2018-07-09 | 2023-02-10 | 清华大学 | 一种基于社区结构的处理图数据的方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS647228A (en) * | 1987-06-30 | 1989-01-11 | Fujitsu Ltd | System for searching and processing multi-hierarchization |
JPH09171466A (ja) * | 1995-12-19 | 1997-06-30 | Adoin Kenkyusho:Kk | 多階層オブジェクトモデル構築方法及び知的情報処理装置の問題解決方法と知的情報処理装置 |
JP2009258794A (ja) * | 2008-04-11 | 2009-11-05 | Fujitsu Ltd | 情報検索プログラム、情報検索装置、および情報検索方法 |
JP2010517137A (ja) * | 2007-01-17 | 2010-05-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース管理システム内のデータ及び関連付けられたオントロジの問い合わせ |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6615211B2 (en) * | 2001-03-19 | 2003-09-02 | International Business Machines Corporation | System and methods for using continuous optimization for ordering categorical data sets |
US7502765B2 (en) * | 2005-12-21 | 2009-03-10 | International Business Machines Corporation | Method for organizing semi-structured data into a taxonomy, based on tag-separated clustering |
CN101571870A (zh) * | 2009-06-09 | 2009-11-04 | 北京航空航天大学 | 一种基于概念聚类的用户兴趣建模方法 |
-
2011
- 2011-03-22 CN CN201110077432.9A patent/CN102693246B/zh not_active Expired - Fee Related
- 2011-11-30 JP JP2011262268A patent/JP2012198873A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS647228A (en) * | 1987-06-30 | 1989-01-11 | Fujitsu Ltd | System for searching and processing multi-hierarchization |
JPH09171466A (ja) * | 1995-12-19 | 1997-06-30 | Adoin Kenkyusho:Kk | 多階層オブジェクトモデル構築方法及び知的情報処理装置の問題解決方法と知的情報処理装置 |
JP2010517137A (ja) * | 2007-01-17 | 2010-05-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース管理システム内のデータ及び関連付けられたオントロジの問い合わせ |
JP2009258794A (ja) * | 2008-04-11 | 2009-11-05 | Fujitsu Ltd | 情報検索プログラム、情報検索装置、および情報検索方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015011709A (ja) * | 2013-07-01 | 2015-01-19 | パロ・アルト・リサーチ・センター・インコーポレーテッドPalo Alto Research Center Incorporated | 明示的に表されたグラフで並列探索を行うシステムおよび方法 |
JP2017509043A (ja) * | 2013-12-30 | 2017-03-30 | 華為技術有限公司Huawei Technologies Co.,Ltd. | グラフデータクエリ方法および装置 |
US10068033B2 (en) | 2013-12-30 | 2018-09-04 | Huawei Technologies Co., Ltd. | Graph data query method and apparatus |
KR20150125511A (ko) * | 2014-04-30 | 2015-11-09 | 한국과학기술원 | 그래프 압축 처리 방법 및 장치 |
KR101660584B1 (ko) | 2014-04-30 | 2016-09-27 | 한국과학기술원 | 그래프 압축 처리 방법 및 장치 |
JP2019200724A (ja) * | 2018-05-18 | 2019-11-21 | ヤフー株式会社 | 演算装置、および検索方法 |
CN114928545A (zh) * | 2022-03-31 | 2022-08-19 | 中国电子科技集团公司第十五研究所 | 一种基于Spark的大规模流量数据关键节点计算方法 |
CN114928545B (zh) * | 2022-03-31 | 2024-02-06 | 中国电子科技集团公司第十五研究所 | 一种基于Spark的大规模流量数据关键节点计算方法 |
CN115511086A (zh) * | 2022-11-03 | 2022-12-23 | 上海人工智能创新中心 | 一种针对超大模型的分布式推理部署系统 |
CN115511086B (zh) * | 2022-11-03 | 2024-05-24 | 上海人工智能创新中心 | 一种针对超大模型的分布式推理部署系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102693246A (zh) | 2012-09-26 |
CN102693246B (zh) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012198873A (ja) | データセットからの情報取得方法およびシステム | |
US11763175B2 (en) | Systems and methods for semantic inference and reasoning | |
Fan et al. | Functional dependencies for graphs | |
US9449115B2 (en) | Method, controller, program and data storage system for performing reconciliation processing | |
US20190163675A1 (en) | Identification of Relevant Data Events by Use of Clustering | |
US9858280B2 (en) | System, apparatus, program and method for data aggregation | |
US20170068748A1 (en) | Hybrid data storage system and method and program for storing hybrid data | |
US9612892B2 (en) | Creating a correlation rule defining a relationship between event types | |
US20130097138A1 (en) | Discovering representative composite ci patterns in an it system | |
US20220058222A1 (en) | Method and apparatus of processing information, method and apparatus of recommending information, electronic device, and storage medium | |
US8972557B2 (en) | Topic-based community index generation apparatus and method and topic-based community searching apparatus and method | |
Zhang et al. | Finding critical users in social communities: The collapsed core and truss problems | |
JP2016100005A (ja) | リコンサイル方法、プロセッサ及び記憶媒体 | |
Gionis et al. | Bump hunting in the dark: Local discrepancy maximization on graphs | |
TW202026920A (zh) | 用於基於模型之系統工程中變更控制之計算加速器架構 | |
Fani et al. | Temporally like-minded user community identification through neural embeddings | |
Mondal et al. | Casqd: continuous detection of activity-based subgraph pattern queries on dynamic graphs | |
US8392393B2 (en) | Graph searching | |
Yang et al. | Delta: indexing and querying multi-labeled graphs | |
Wu et al. | Community detection with topological structure and attributes in information networks | |
US11468065B2 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable recording medium | |
Rodríguez-González et al. | Frequent similar pattern mining using non Boolean similarity functions | |
JP2020004057A (ja) | 選定プログラム、選定方法および選定装置 | |
US9818078B1 (en) | Converting a non-workflow program to a workflow program using workflow inferencing | |
Leng et al. | BRDPHHC: a balance RDF data partitioning algorithm based on hybrid hierarchical clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130513 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140218 |