JP6822509B2 - データ処理方法および電子機器 - Google Patents
データ処理方法および電子機器 Download PDFInfo
- Publication number
- JP6822509B2 JP6822509B2 JP2019063338A JP2019063338A JP6822509B2 JP 6822509 B2 JP6822509 B2 JP 6822509B2 JP 2019063338 A JP2019063338 A JP 2019063338A JP 2019063338 A JP2019063338 A JP 2019063338A JP 6822509 B2 JP6822509 B2 JP 6822509B2
- Authority
- JP
- Japan
- Prior art keywords
- variables
- variable
- determining
- independence
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
ここで、行列Bはpxp個の要素を含むp次の行列で、各要素は要素の位置に対応する2つの変数間に直接の因果関係があるかどうかを表す。具体的には、行列B中の変数βjiは、p個の変数のうちのj番目の変数とi番目の変数との間の直接の因果関係を表す。たとえば、行列B中の変数βjiは、変数iが変数jの直接の原因であるかどうかを表す。具体的に言えば|βji|>0の場合、変数iは変数jの直接の原因です。2つの変数の異なる順序は異なる因果関係を表すことに留意されたい。したがって、βjiとβijは異なる因果関係を表す。言い換えれば、行列Bで表される有向グラフにおけるエッジの方向が異なる。また、行列Bの対角部分は、各要素とそれ自体との因果関係を表す。特定の要素同士の間に因果関係はないので、対角部分の要素の値は0に設定する必要がある。
ここで、βjは行列Bのj行目の列、xjはj番目の変数の観測データ、x−jはj番目の変数以外の変数の観測データ、
はL2−Norm演算、
はL1−Norm演算を表す。
ここで、制約は、グラフ構造Gが有向巡回グラフを含まないようにすることである。言い換えれば、グラフ構造Gは有向非巡回グラフであるべきである。
Claims (21)
- 複数の変数の観測データのセットに基づいて、前記複数の変数間の因果関係を表すモデルを取得することと、
前記モデルに基づいて、前記複数の変数の中で直接の因果関係を有する第1および第2の変数を決定することと、
前記第1および第2の変数が互いに独立しているかどうかを決定することと、
前記第1および第2の変数が互いに独立していることに応答して、前記モデルから前記第1および第2の変数との間の前記直接の因果関係を削除することと、
を備えるデータ処理方法。 - 前記第1および第2の変数が互いに独立しているかどうかを決定することは、
前記観測データのセットに基づいて、前記第1および第2の変数との間の関連度を決定することと、
前記関連度が閾値の範囲内にあることに応答して、前記第1および第2の変数が互いに独立していると決定すること、
を備える請求項1に記載の方法。 - 前記第1および第2の変数が互いに独立しているかどうかを決定することは、
前記複数の変数から、前記第1の変数に関連する第1の関連変数のセットと前記第2の変数に関連する第2の関連変数のセットとを決定することと、
前記観測データのセットに基づいて、前記第1および第2の変数との間の関連度を、前記第1および第2の関連変数のセットの和集合を条件として決定することと、
前記関連度が閾値の範囲内にあることに応答して、前記第1および第2の変数が互いに独立していると決定することと、
を備える請求項1に記載の方法。 - 前記第1および第2の関連変数のセットを決定することは、
前記観測データのセットに基づいて、前記第1および第2の関連変数としてマルコフブランケット学習技術を使用して、前記第1の変数についてのマルコフブランケットセットおよび前記第2の変数についてのマルコフブランケットセットを決定すること、
を備える請求項3に記載の方法。 - 前記モデルは、ノードが前記複数の変数を表しエッジが直接の因果関係を表す有向非巡回グラフであり、
前記第1および第2の関連変数のセットを決定することは、
前記有向非巡回グラフ内の前記第1の変数を表す第1のノードに対するペアレントノードおよびスパウズノードのセットを、前記第1の関連変数のセットとして決定することと、
前記有向非巡回グラフ内の前記第2の変数を表す第2のノードに対するペアレントノードおよびスパウズノードのセットを、前記第2の関連変数のセットとして決定することと、
を備える請求項3に記載の方法。 - 前記第1および第2の変数との間の前記関連度を決定することは、
前記第1の変数のタイプと前記第2の変数のタイプとに基づいて独立性決定方法を選択することと、
前記選択された独立性決定方法を用いて前記第1および第2の変数との間の前記関連度を決定することと、
を備える請求項2に記載の方法。 - 前記独立性決定方法を選択することは、
前記第1および第2の変数の両方が離散変数であることに応答して、離散独立性決定方法を選択することと、
前記第1および第2の変数の両方が連続変数であることに応答して、連続独立性決定方法を選択することと、
前記第1および第2の変数の一方が離散変数であり、他方が連続変数であることに応答して、ハイブリッド検出の独立性決定方法を選択することと、
を備える請求項6に記載の方法。 - 前記第1および第2の変数との間の前記関連度を、前記第1および第2の関連変数のセットの和集合を条件として決定することは、
前記和集合内の前記第1の変数のタイプ、前記第2の変数のタイプ、および条件付き変数のタイプに基づいて、独立性決定方法を選択することと、
前記和集合を条件として、前記選択された独立性決定方法を用いて、前記第1および第2の変数との間の関連度を決定することと、
を備える請求項3に記載の方法。 - 前記独立性決定方法を選択することは、
前記第1の変数、前記第2の変数、および前記条件付き変数がすべて離散変数であることに応答して、離散独立性決定方法を選択することと、
前記第1の変数、前記第2の変数、および前記条件付き変数がすべて連続変数であることに応答して、連続独立性決定方法を選択することと、
離散変数および連続変数の両方が、前記第1の変数、前記第2の変数、および前記条件付き変数の間に存在することに応答して、ハイブリッド検出の独立性決定方法を選択することと、
を備える請求項8に記載の方法。 - 前記モデルを取得することは、
スコアベースの因果関係ベイジアンネットワークを使用して前記モデルを取得すること、
を備える請求項1に記載の方法。 - プロセッサと、
前記プロセッサによって実行されると、電子機器に以下の動作を実行させる命令を記憶するメモリと、
を備え、
複数の変数の観測データのセットに基づいて、前記複数の変数間の因果関係を表すモデルを取得し、
前記モデルに基づいて、前記複数の変数の中で直接の因果関係を有する第1および第2の変数を決定し、
前記第1および第2の変数が互いに独立しているかどうかを決定し、
前記第1および第2の変数が互いに独立していることに応答して、前記モデルから前記第1および第2の変数との間の前記直接の因果関係を削除する、
電子機器。 - 前記第1および第2の変数が互いに独立しているかどうかを決定することは、
前記観測データのセットに基づいて、前記第1および第2の変数との間の関連度を決定することと、
前記関連度が閾値の範囲内にあることに応答して、前記第1および第2の変数が互いに独立していると決定すること、
を備える請求項11に記載の電子機器。 - 前記第1および第2の変数が互いに独立しているかどうかを決定することは、
前記複数の変数から、前記第1の変数に関連する第1の関連変数のセットと前記第2の変数に関連する第2の関連変数のセットとを決定することと、
前記観測データのセットに基づいて、前記第1および第2の変数との間の関連度を、前記第1および第2の関連変数のセットの和集合を条件として決定することと、
前記関連度が閾値の範囲内にあることに応答して、前記第1および第2の変数が互いに独立していると決定することと、
を備える請求項11に記載の電子機器。 - 前記第1および第2の関連変数のセットを決定することは、
前記観測データのセットに基づいて、前記第1および第2の関連変数としてマルコフブランケット学習技術を使用して、前記第1の変数についてのマルコフブランケットセットおよび前記第2の変数についてのマルコフブランケットセットを決定すること、
を備える請求項13に記載の電子機器。 - 前記モデルは、ノードが前記複数の変数を表しエッジが直接の因果関係を表す有向非巡回グラフであり、
前記第1および第2の関連変数のセットを決定することは、
前記有向非巡回グラフ内の前記第1の変数を表す第1のノードに対するペアレントノードおよびスパウズノードのセットを、前記第1の関連変数のセットとして決定することと、
前記有向非巡回グラフ内の前記第2の変数を表す第2のノードに対するペアレントノードおよびスパウズノードのセットを、前記第2の関連変数のセットとして決定することと、
を備える請求項13に記載の電子機器。 - 前記第1および第2の変数との間の前記関連度を決定することは、
前記第1の変数のタイプと前記第2の変数のタイプとに基づいて独立性決定方法を選択することと、
前記選択された独立性決定方法を用いて前記第1および第2の変数との間の前記関連度を決定することと、
を備える請求項12に記載の電子機器。 - 前記独立性決定方法を選択することは、
前記第1および第2の変数の両方が離散変数であることに応答して、離散独立性決定方法を選択することと、
前記第1および第2の変数の両方が連続変数であることに応答して、連続独立性決定方法を選択することと、
前記第1および第2の変数の一方が離散変数であり、他方が連続変数であることに応答して、ハイブリッド検出の独立性決定方法を選択することと、
を備える請求項16に記載の電子機器。 - 前記第1および第2の変数との間の前記関連度を、前記第1および第2の関連変数のセットの和集合を条件として決定することは、
前記和集合内の前記第1の変数のタイプ、前記第2の変数のタイプ、および条件付き変数のタイプに基づいて、独立性決定方法を選択することと、
前記和集合を条件として、前記選択された独立性決定方法を用いて、前記第1および第2の変数との間の関連度を決定することと、
を備える請求項13に記載の電子機器。 - 前記独立性決定方法を選択することは、
前記第1の変数、前記第2の変数、および前記条件付き変数がすべて離散変数であることに応答して、離散独立性決定方法を選択することと、
前記第1の変数、前記第2の変数、および前記条件付き変数がすべて連続変数であることに応答して、連続独立性決定方法を選択することと、
離散変数および連続変数の両方が、前記第1の変数、前記第2の変数、および前記条件付き変数の間に存在することに応答して、ハイブリッド検出の独立性決定方法を選択することと、
を備える請求項18に記載の電子機器。 - 前記モデルを取得することは、
スコアベースの因果関係ベイジアンネットワークを使用して前記モデルを取得すること、
を備える請求項11に記載の電子機器。 - コンピュータ実行可能命令が記憶され、前記コンピュータ実行可能命令が実行されると、請求項1乃至10のいずれかに記載の方法をコンピュータに実行させる、
コンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021001314A JP7392668B2 (ja) | 2018-03-29 | 2021-01-07 | データ処理方法および電子機器 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810269835.5A CN110555047B (zh) | 2018-03-29 | 2018-03-29 | 数据处理方法和电子设备 |
CN201810269835.5 | 2018-03-29 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021001314A Division JP7392668B2 (ja) | 2018-03-29 | 2021-01-07 | データ処理方法および電子機器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019204499A JP2019204499A (ja) | 2019-11-28 |
JP6822509B2 true JP6822509B2 (ja) | 2021-01-27 |
Family
ID=68055005
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019063338A Active JP6822509B2 (ja) | 2018-03-29 | 2019-03-28 | データ処理方法および電子機器 |
JP2021001314A Active JP7392668B2 (ja) | 2018-03-29 | 2021-01-07 | データ処理方法および電子機器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021001314A Active JP7392668B2 (ja) | 2018-03-29 | 2021-01-07 | データ処理方法および電子機器 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11461344B2 (ja) |
JP (2) | JP6822509B2 (ja) |
CN (1) | CN110555047B (ja) |
WO (1) | WO2019185039A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021061055A (ja) * | 2018-03-29 | 2021-04-15 | 日本電気株式会社 | データ処理方法および電子機器 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11189371B2 (en) * | 2019-04-30 | 2021-11-30 | International Business Machines Corporation | Systems and methods for adjusting medical treatment to reduce likelihood of prescription cascade |
CN111506440B (zh) * | 2020-04-14 | 2022-11-04 | 上海春魁信息技术有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN113554449A (zh) * | 2020-04-23 | 2021-10-26 | 阿里巴巴集团控股有限公司 | 商品变量预测方法、设备以及计算机可读介质 |
CN113761073A (zh) * | 2020-06-03 | 2021-12-07 | 日本电气株式会社 | 用于信息处理的方法、装置、设备和存储介质 |
CN111985677B (zh) * | 2020-06-30 | 2024-06-21 | 联想(北京)有限公司 | 一种因果链路分析方法、设备及计算机可读存储介质 |
CN113887008A (zh) * | 2020-07-01 | 2022-01-04 | 日本电气株式会社 | 信息处理方法、电子设备和计算机存储介质 |
CN112116433A (zh) * | 2020-09-30 | 2020-12-22 | 拉扎斯网络科技(上海)有限公司 | 订单归因方法及装置 |
WO2022149372A1 (ja) * | 2021-01-08 | 2022-07-14 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
US20220261156A1 (en) * | 2021-02-18 | 2022-08-18 | EMC IP Holding Company LLC | Stochastic risk scoring with counterfactual analysis for storage capacity |
DE112021007856T5 (de) * | 2021-06-21 | 2024-04-25 | Mitsubishi Electric Corporation | Vorrichtung für maschinelles Lernen, Vorrichtung zum Vorhersagen eines Schweregrades und Verfahren für maschinelles Lernen |
US20240354182A1 (en) * | 2021-09-06 | 2024-10-24 | Nec Corporation | Causality search apparatus, causality search method, and computer-readable recording medium |
CN113806452B (zh) * | 2021-09-17 | 2022-10-25 | 北京百度网讯科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
US11892989B2 (en) * | 2022-03-28 | 2024-02-06 | Bank Of America Corporation | System and method for predictive structuring of electronic data |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7117185B1 (en) * | 2002-05-15 | 2006-10-03 | Vanderbilt University | Method, system, and apparatus for casual discovery and variable selection for classification |
US7320002B2 (en) * | 2004-03-25 | 2008-01-15 | Microsoft Corporation | Using tables to learn trees |
US20060059112A1 (en) * | 2004-08-25 | 2006-03-16 | Jie Cheng | Machine learning with robust estimation, bayesian classification and model stacking |
US7720267B2 (en) * | 2005-07-15 | 2010-05-18 | Siemens Medical Solutions Usa, Inc. | Method and apparatus for classifying tissue using image data |
JP2007207101A (ja) * | 2006-02-03 | 2007-08-16 | Infocom Corp | グラフ生成方法、グラフ生成プログラム並びにデータマイニングシステム |
JP5854274B2 (ja) * | 2012-03-28 | 2016-02-09 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2014228991A (ja) | 2013-05-21 | 2014-12-08 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP6354192B2 (ja) | 2014-02-14 | 2018-07-11 | オムロン株式会社 | 因果ネットワーク生成システム |
US10042037B2 (en) * | 2014-02-20 | 2018-08-07 | Nestwave Sas | System and method for estimating time of arrival (TOA) |
WO2015195485A1 (en) * | 2014-06-16 | 2015-12-23 | Eric Burton Baum | System, apparatus and method for supporting formal verification of informal inference on a computer |
NZ730197A (en) * | 2014-09-11 | 2022-07-01 | Berg Llc | Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data |
CN104537418A (zh) * | 2014-12-11 | 2015-04-22 | 广东工业大学 | 一种自底向上的高维数据因果网络学习方法 |
US9355132B1 (en) * | 2015-09-30 | 2016-05-31 | Semmle Limited | Tiered arrays |
US20170308836A1 (en) * | 2016-04-22 | 2017-10-26 | Accenture Global Solutions Limited | Hierarchical visualization for decision review systems |
CN106874589A (zh) * | 2017-02-10 | 2017-06-20 | 泉州装备制造研究所 | 一种基于数据驱动的报警根源寻找方法 |
CN107563596A (zh) * | 2017-08-03 | 2018-01-09 | 清华大学 | 一种基于贝叶斯因果网络的评价指标均衡态分析方法 |
CN110555047B (zh) * | 2018-03-29 | 2024-03-15 | 日本电气株式会社 | 数据处理方法和电子设备 |
-
2018
- 2018-03-29 CN CN201810269835.5A patent/CN110555047B/zh active Active
-
2019
- 2019-03-28 US US16/368,382 patent/US11461344B2/en active Active
- 2019-03-28 JP JP2019063338A patent/JP6822509B2/ja active Active
- 2019-03-29 WO PCT/CN2019/080524 patent/WO2019185039A1/zh active Application Filing
-
2021
- 2021-01-07 JP JP2021001314A patent/JP7392668B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021061055A (ja) * | 2018-03-29 | 2021-04-15 | 日本電気株式会社 | データ処理方法および電子機器 |
JP7392668B2 (ja) | 2018-03-29 | 2023-12-06 | 日本電気株式会社 | データ処理方法および電子機器 |
Also Published As
Publication number | Publication date |
---|---|
JP2021061055A (ja) | 2021-04-15 |
WO2019185039A1 (zh) | 2019-10-03 |
US11461344B2 (en) | 2022-10-04 |
JP2019204499A (ja) | 2019-11-28 |
JP7392668B2 (ja) | 2023-12-06 |
CN110555047B (zh) | 2024-03-15 |
CN110555047A (zh) | 2019-12-10 |
US20190303368A1 (en) | 2019-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6822509B2 (ja) | データ処理方法および電子機器 | |
CN113302634B (zh) | 学习和预测关键短语以及生成预测的系统、介质和方法 | |
US10009363B2 (en) | Selecting representative metrics datasets for efficient detection of anomalous data | |
US10846643B2 (en) | Method and system for predicting task completion of a time period based on task completion rates and data trend of prior time periods in view of attributes of tasks using machine learning models | |
Lima et al. | Domain knowledge integration in data mining using decision tables: case studies in churn prediction | |
US20180121535A1 (en) | Multiple record linkage algorithm selector | |
WO2019047790A1 (zh) | 生成机器学习样本的组合特征的方法及系统 | |
US11809455B2 (en) | Automatically generating user segments | |
Kaur et al. | An empirical study of software entropy based bug prediction using machine learning | |
US9324026B2 (en) | Hierarchical latent variable model estimation device, hierarchical latent variable model estimation method, supply amount prediction device, supply amount prediction method, and recording medium | |
WO2022011553A1 (en) | Feature interaction via edge search | |
US20240220546A1 (en) | Method and Apparatus for Classifying Blockchain Address | |
JP7173234B2 (ja) | 情報処理に用いられる方法、装置、デバイス及び記憶媒体 | |
JP7528515B2 (ja) | データ処理方法、装置、及び媒体 | |
JP5555238B2 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム | |
CN116738081A (zh) | 一种前端组件绑定方法、装置及存储介质 | |
CN113362097B (zh) | 一种用户确定方法和装置 | |
US20220215291A1 (en) | Method and device for use in data processing, and medium | |
US20210026850A1 (en) | Method, system, and storage medium for processing data set | |
US20170199911A1 (en) | Method and Query Processing Server for Optimizing Query Execution | |
Ur Rehman et al. | Efficient infill sampling for unconstrained robust optimization problems | |
US20240005146A1 (en) | Extraction of high-value sequential patterns using reinforcement learning techniques | |
US20220414540A1 (en) | Method, device and medium for data processing | |
JP7439923B2 (ja) | 学習方法、学習装置及びプログラム | |
Chih et al. | An efficient approach to implement dynamic batch means estimators in simulation output analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6822509 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |