JP2024016198A - データ処理方法、装置及び媒体 - Google Patents

データ処理方法、装置及び媒体 Download PDF

Info

Publication number
JP2024016198A
JP2024016198A JP2023190772A JP2023190772A JP2024016198A JP 2024016198 A JP2024016198 A JP 2024016198A JP 2023190772 A JP2023190772 A JP 2023190772A JP 2023190772 A JP2023190772 A JP 2023190772A JP 2024016198 A JP2024016198 A JP 2024016198A
Authority
JP
Japan
Prior art keywords
elements
sequence
causality
candidate
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023190772A
Other languages
English (en)
Inventor
ウェンジュアン ウェイ
Wenjuan Wei
チュンチェン リウ
chun cheng Liu
ルーイエ ツゥイ
Lvye Cui
ルー フェン
Lu Feng
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2023190772A priority Critical patent/JP2024016198A/ja
Publication of JP2024016198A publication Critical patent/JP2024016198A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】多くの要素の間の因果関係を迅速かつ正確に発見し、該因果関係に基づいて目標要素の観測値に影響することができるデータ処理方法、装置及びコンピュータ可読記憶媒体を提供する。【解決手段】データ処理方法は、複数の要素に関する観測サンプル集合を取得するステップ310を含む。該観測サンプル集合における1つの観測サンプルは、複数の要素の対応する観測値を含む。方法はまた、観測サンプル集合に基づいて、複数の要素の間に存在する依存関係集合を決定するステップ320を含む。依存関係集合における1つの依存関係は、複数の要素における互いに関連する1つの要素ペアを指示する。方法はさらに、依存関係集合に基づいて、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示する複数の要素の因果関係シーケンスを決定するステップ330を含む。【選択図】図3

Description

本開示の実施形態は、機械学習の分野に関し、さらに具体的には、データ処理方法、装置及びコンピュータ可読記憶媒体に関する。
情報技術の飛躍的な発展に伴い、データの規模が急速に大きくなっている。機械学習は、このような背景及びトレンドでますます広く注目されている。中でも、因果発見は、現実の生活において、例えば、サプライチェーン、医療健康及びリテールなどの分野において幅広く適用されている。ここでは、上記の因果発見とは、複数の要素に関するサンプルデータから複数の要素の間に存在する因果関係を発見することである。例えば、リテールの分野では、因果発見の結果は、各種の販売戦略を立てることを補助するために用いられ、医療健康の分野では、因果発見の結果は、患者についての治療方案などを作成することを補助するために用いられる。
しかしながら、技術の発展に伴い、単一のシステムにおいて因果関係が存在する可能性のある様々な要素の数は著しく増加している。また、異なるシステム間の連動にも注目されることが多い。これは、因果関係を発見しようとする要素の数が数百から千以上になる可能性のあることを招く。この場合、多くの要素の間に存在する因果関係を迅速かつ正確に発見することは、ますます重要なものとなっている。
本開示の実施形態は、データ処理方法、装置及びコンピュータ可読記憶媒体を提供する。
本開示の第1の態様において、データ処理方法が提供される。該方法は、複数の要素に関する観測サンプル集合を取得することであって、該観測サンプル集合における各観測サンプルは、複数の要素の対応する観測値を含むことと、該観測サンプル集合に基づいて、複数の要素の間に存在する依存関係集合を決定することであって、該依存関係集合における1つの依存関係は、複数の要素における互いに関連する1つの要素ペアを指示することと、該依存関係集合に基づいて、複数の要素の因果関係シーケンスを決定することであって、該因果関係シーケンスは、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示することと、を含む。
本開示の第2の態様において、データ処理装置が提供される。該装置は、少なくとも1つのプロセッシングユニット及び少なくとも1つのメモリを含む。少なくとも1つのメモリは、少なくとも1つのプロセッシングユニットに結合され、少なくとも1つのプロセッシングユニットが実行する指令を記憶する。指令が少なくとも1つのプロセッシングユニットにより実行される場合、該装置に以下の動作を実行させ、動作は、複数の要素に関する観測サンプル集合を取得することであって、該観測サンプル集合における各観測サンプルは、複数の要素の対応する観測値を含むことと、該観測サンプル集合に基づいて、複数の要素の間に存在する依存関係集合を決定することであって、該依存関係集合における1つの依存関係は、複数の要素における互いに関連する1つの要素ペアを指示することと、該依存関係集合に基づいて、複数の要素の因果関係シーケンスを決定することであって、該因果関係シーケンスは、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示することと、を含む。
本開示の第3の態様において、コンピュータ可読記憶媒体が提供され、該コンピュータ可読記憶媒体は、デバイスにより実行される場合、該デバイスに本開示の第1の態様に記載の方法を実行させる機器実行可能な指令を記憶している。
発明の概要を提供することは、簡略した形態で一連の概念を紹介するためであり、これらは、以下の具体的な実施形態においてさらに詳細に説明される。発明の概要は、本開示の肝心となる特徴又は必須な特徴を示す意図も、本開示の範囲を限定する意図もない。本開示のその他の特徴は、以下の説明により容易に理解できるはずである。
以下の開示内容及び特許請求の範囲から、本発明の目的、利点及び他の特徴はより明らかになる。ここでは、例を示す目的を基にして、図面を参照しながら、好ましい実施形態についての制限的ではない記述を示す。
本開示の実施形態に係る、データ処理用の例示的なシステムを示すブロック図である。 本開示の実施形態に係る、データ処理用の例示的なシステムを示すブロック図である。
本開示の実施形態に係る、複数の要素の間の因果関係を決定するための模式図である。
本開示の実施形態に係る、例示的な方法を示すフローチャートである。
本開示の実施形態に係る、例示的な方法を示すフローチャートである。
本開示の実施形態に係る、例示的な方法を示すフローチャートである。
本開示の実施形態に係る、例示的な方法を示すフローチャートである。
本開示の実施形態を実施できる例示的な装置を模式的に示すブロック図である。
各図面において、同一又は対応する符号は同一又は対応する部分を示す。
以下、図面を参照しながら、本開示の実施形態をさらに詳細に説明する。本開示は、図面により本開示のいくつかの実施形態を示しているが、様々な形態により実施可能であり、ここで説明する実施形態に限定されるように解釈されるべきでない。逆にこれらの実施形態を提供することは本開示をより徹底的、かつ完全に理解するためであることを理解すべきである。本開示の図面及び実施形態は例示的なものにすぎず、本開示の保護範囲を限定するためのものではないと理解すべきである。
本開示の実施形態の記述において、用語「含む」及びそれに類似する用語は、開放式であり、即ち「…を含むが、これらに限定されない」と解釈されるべきである。用語「…に基づいて」は、「少なくとも部分的に基づく」と解釈される。用語「1つの実施形態」又は「該実施形態」は、「少なくとも1つの実施形態」と解釈されるべきである。用語「第1」、「第2」などは、異なる又は同一なオブジェクトを指してもよい。以下では、他の明示的及び非明示的な定義も含まれる場合がある。
本開示の実施形態において、用語「因果構造」(causalstructure)とは、通常、システムにおける各要素の間の因果関係を記述する構造を指し、本明細書において、「因果関係シーケンス」とも呼ばれる。用語「要素」は「変量」とも呼ばれる。用語「観測サンプル」は、直接的に観測可能な複数の要素の1組の観測値を指し、直接的に観測可能な要素は「観測変数」とも呼ばれる。
上記のように、実際の生活において、多くの観測変数の間に存在する因果関係を迅速かつ正確に発見することは望まれている。
顧客サービスの分野において、どの要素が顧客の通信キャリアについての満足度に影響するかを決定するために、顧客の消費行為データ(例えば、顧客のレベル、毎月に使用したネットの通信量、無料の通信量の比率、毎月に使用したネットの通信量の総額など)、満足度調査データ及びキャリア戦略データを大量に収集してもよい。収集した各タイプのデータは、1種の要素(又は変数)の観測値とも呼ばれる。これらの要素の間に存在する因果関係を発見することで、顧客満足度に影響する1つ又は複数の要素を決定することができる。さらに、当該1つ又は複数の要素の観測値を変更し、或いは当該1つ又は複数の要素について対応する戦略を立てることで、顧客の通信キャリアについての満足度を向上させることができる。
健康の分野において、患者の血圧に影響する要素を決定するために、例えば、心拍数、心拍出量、アレルギー指数、総末梢血管抵抗、カテコールアミンの放出、血圧など、患者の一連の生理的な指標(即ち、一連の要素の観測値)を大量に収集してもよい。これらの生理的な指標の間に存在する因果関係を発見することで、患者の血圧に影響する生理的な指標(即ち、要素)を決定することができる。さらに、当該生理的な指標に影響し、或いは当該生理的な指標について対応する戦略を立てることで、患者の血圧を安定に保つことができる。
商品販売の分野において、目標商品(例えば、傘)の売上げに影響する要素を決定するために、外部要素データ(例えば、天気、季節、温度、日付、店舗の大きさなど)、当該商品の販売データ(例えば、当該商品の売上げ、当該商品の価格など)、及び1つ又は複数の関連商品(例えば、アイスクリーム)の販売データなどを収集してもよい。収集した各タイプのデータを1種の要素の観測値とする。これらの要素の間に存在する因果関係を発見することで、目標商品の売上げに影響する1つ又は複数の要素を決定することができる。さらに、当該1つ又は複数の要素の観測値を変更し、或いは当該1つ又は複数の要素について対応する戦略を立てることで、目標商品の売上げを増加させることができる。
ソフトウェア開発の分野において、故障率及び/又はソフトウェアの開発周期に影響する要素を決定するために、ソフトウェア開発の各種の要素の情報を収集してもよく、例えば、ソフトウェア開発の全体情報(例えば、開発周期、開発に投入されたリソースなど)及びソフトウェア開発の各々の段階の情報を含むが、これらに限定されない。ソフトウェア開発の各々の段階の情報は、例えばアーキテクチャ段階の情報(例えば、ソフトウェアアーキテクチャ方法、ソフトウェアアーキテクチャ階層の数など)、コーディング段階の情報(例えば、コード長、関数の数、プログラミング言語、モジュールの数など)、テスト段階の情報(例えば、ユニットテストの正確率又は故障率、ブラックボックステストの正確率又は故障率、ホワイトボックステストの正確率又は故障率など)、ソフトウェアの発行後の稼働段階の情報(例えば、稼働段階の正確率又は故障率など)を含んでもよい。収集した各タイプのデータを1種の要素の観測値とする。これらの要素の間に存在する因果関係を発見することで、ソフトウェアの開発周期及び/又は故障率に影響する1つ又は複数の要素を決定することができる。さらに、当該1つ又は複数の要素の観測値を変更し、或いは当該1つ又は複数の要素について対応する戦略を立てることで、ソフトウェアの開発周期及び/又は故障率を低下することができる。
いくつかの従来の解決手段は、主に、少ない要素(例えば、100個以下の要素)を有するシステムについて、制約に基づく方法又はスコアに基づく方法で変数空間全体を検索して可能な因果関係を発見する。例えば、制約に基づく方法では、一般的に、複数の要素に条件付き独立性の検定を行うことで、それらの因果構造を発見する。しかしながら、検索する必要がある要素の数が多い場合に、条件付き独立性の検定の結果が不確実になる。また、因果構造の発見は、常に、何らかの要素を含まないから全ての他の要素を含むまでの条件集合を利用して任意の2つの要素の間の依存関係を検定する必要があるため、膨大な計算オーバーヘッドをもたらす。スコアに基づく方法では、一般的に、因果構造とサンプルデータとの間のマッチング度を判定するスコアを最適化することで因果構造を発見する。しかしながら、検索空間が指数関数以上の速度で増加するため、これらの解決手段は、常に、多くの要素(例えば、数百から千以上になる)についての因果構造(「高次元因果構造」とも呼ばれる)の発見に適用しにくい。
本開示の実施形態によれば、データ処理のための解決手段を提供する。該解決手段は、高次元因果構造の発見を迅速かつ正確に実現することができるため、上記問題及び/又は他の潜在的な問題を解決することができる。以下、上記例示的なシーンに合わせて本開示の各実施形態を詳細に説明する。これは単に説明することを目的とし、如何なる形態で本発明の範囲を制限するためではないと理解すべきである。
図1Aは、本開示の実施形態に係る、データ処理用のシステム100を示す例示的なブロック図である。システム100は、例えば、複数の要素の間の因果関係を発見することができる。図1Aに示すシステム100は、本開示の実施形態における1種の例を実現するものに過ぎず、本開示の範囲を制限するためのものではないと理解すべきである。本開示の実施形態は、他のシステム又はアーキテクチャにも同様に適用される。
図1Aに示すように、システム100は、因果関係決定装置120を含んでもよい。因果関係決定装置120は、複数の要素に関する観測サンプル集合110を受信するとともに、その中から複数の要素の間の因果関係を指示する因果関係シーケンス130を決定することができる。好ましくは、いくつかの実施形態において、システム100は、さらに複数の要素に関する観測サンプル集合110を採集するための観測サンプル採集装置(図1Aにおいて未図示)を含んでもよい。観測サンプル採集装置は、観測サンプル集合110を取得するように、複数の要素の観測値をリアルタイムに採集し、或いは、定期的に又は不定期的に採集することができる。いくつかの実施形態において、観測サンプル採集装置は、それぞれ異なるタイプの要素の観測値を採集するための1つ又は複数の採集ユニットを含んでもよい。
観測サンプル集合110は、1つ又は複数の目標要素に関する複数の要素の観測サンプルを含んでもよい。観測サンプル集合110は、例えば、X={x,x,...,x}∈RN×Dとして示されてよく、ただし、Nは観測サンプル集合110における観測サンプルの総数を示し、Dは要素の総数を示し、観測サンプル集合110における各々の観測サンプルはD個の要素を有する1組の観測値を含む。本明細書において、D個の要素を有する集合は、V={v,v,...,v}として示され、かつv(ただし、1≦i≦D)は、D個の要素におけるi番目の要素を示す。ベクトルx∈R(ただし、1≦i≦D)は、i番目の要素のN個の観測値を示す。例えば、xi,n(ただし、1≦i≦D、かつ1≦n≦N)は、i番目の要素のn番目の観測値を示す。
上記通信キャリアの顧客満足度に関するシーンを例とする場合に、例えば目標要素は「顧客満足度」であり、要素集合Vは、顧客属性に関連する要素(例えば、顧客レベル、顧客番号など)、顧客行為に関する要素(例えば、毎月に使用したネットの通信量、無料の通信量の比率、毎月に使用したネットの通信量の総額など)、顧客のフィードバックに関連する要素(例えば、クレーム数、顧客満足度)及び顧客について立てた戦略要素(例えば、パケットオーバーの提示回数、タイミングなど)における1種又は複数種などを含んでもよい。要素である「顧客レベル」(即ち、v)を例とする場合に、ベクトルxは、N人の顧客のレベルからなり、かつxi,nは、N人の顧客におけるn人目の顧客のレベルを示してもよい。要素である「毎月に使用したネットの通信量」(即ち、v)を例とする場合に、ベクトルxは、N人の顧客が毎月に使用したネットの通信量からなり、かつxi,nは、N人の顧客におけるn人目の顧客が毎月に使用したネットの通信量を示してもよい。因果関係シーケンス130は、例えば、顧客レベル、毎月に使用したネットの通信量、無料の通信量の比率、毎月に使用したネットの通信量の総額、顧客満足度などの要素の間の因果関係を指示し、例えば、目標要素である「顧客満足度」の原因がどの要素であるかを指示することができる。
上記患者の血圧に関連するシーンを例とする場合に、例えば、目標要素は「血圧」であり、要素集合Vは、心拍数、心拍出量、アレルギー指数、総末梢血管抵抗、カテコールアミンの放出、血圧などを含んでもよい。要素である「心拍数」(即ち、v)を例とする場合に、ベクトルxは、N人の患者の心拍数からなり、かつxi,nは、N人の患者におけるn人目の患者の心拍数を示してもよい。要素である「心拍出量」(即ち、v)を例とする場合に、ベクトルxは、N人の患者の心拍出量からなり、かつxi,nは、N人の患者におけるn人目の患者の心拍出量を示してもよい。因果関係シーケンス130は、例えば、心拍数、心拍出量、アレルギー指数、総末梢血管抵抗、カテコールアミンの放出、血圧などの要素の間の因果関係を指示し、例えば、目標要素である「血圧」の原因がどの要素であるかを指示することができる。
上記商品販売のシーンを例とする場合に、例えば、目標要素は「目標商品の売上げ」であり、要素集合Vは、外部要素(例えば、天気、季節、温度、日付、店舗の大きさなど)、目標商品(例えば、傘)の販売行為に関する要素(例えば、目標商品の売上げ、目標商品の価格など)、1つ又は複数の関連商品(例えば、アイスクリーム)の販売行為に関する要素(例えば、関連商品の売上げ、関連商品の価格など)及び目標商品についての販売戦略要素(例えば、プロモーションの回数、頻度など)における1種又は複数種を含んでもよい。要素である「温度」(即ち、v)を例とする場合に、ベクトルxは、N日の温度からなり、かつxi,nはn日目の温度を示してもよい。要素である「目標商品の売上げ」(即ち、v)を例とする場合に、ベクトルxは、N日の傘の売上げからなり、かつxi,nは、n日目の傘の売上げを示してもよい。因果関係シーケンス130は、例えば、天気、季節、温度、日付、店舗の大きさ、目標商品の売上げ、目標商品の価格、関連商品の売上げ、関連商品の価格などの要素の間の因果関係を指示し、例えば、目標要素である「目標商品の売上げ」の原因がどの要素であるかを指示することができる。
上記ソフトウェア開発のシーンを例とする場合に、例えば、目標要素は、「ソフトウェアの開発周期」又は「ソフトウェアの稼働段階の故障率」であり、要素集合Vは、ソフトウェア開発の全体要素(例えば、開発周期、開発に投入されたリソースなど)及びソフトウェア開発の各々の段階の要素における1種又は複数種を含んでもよい。ソフトウェア開発の各々の段階の要素は、例えばアーキテクチャ段階の要素(例えば、ソフトウェアアーキテクチャ方法、ソフトウェアアーキテクチャ階層の数など)、コーディング段階の要素(例えば、コード長、関数の数、プログラミング言語、モジュールの数など)、テスト段階の要素(例えば、ユニットテストの正確率又は故障率、ブラックボックステストの正確率又は故障率、ホワイトボックステストの正確率又は故障率など)、ソフトウェアの発行後の稼働段階の要素(例えば、稼働段階の正確率、稼働段階の故障率など)を含んでもよい。要素である「開発周期」(即ち、v)を例とする場合に、ベクトルxは、N個のソフトウェア製品の開発周期からなり、かつxi,nは、n個目のソフトウェア製品の開発周期を示してもよい。要素である「コード長」(即ち、v)を例とする場合に、ベクトルxは、N個のソフトウェア製品のコード長からなり、かつxi,nは、n個目のソフトウェア製品のコード長を示す。因果関係シーケンス130は、例えば、ソフトウェアの開発周期、開発に投入されたリソース、アーキテクチャ方法、アーキテクチャ階層の数、コード長、関数の数、プログラミング言語、モジュールの数、ユニットテストの正確率又は故障率、ブラックボックステストの正確率又は故障率、ホワイトボックステストの正確率又は故障率、稼働段階の正確率、稼働段階の故障率などの要素の間の因果関係を指示する。例えば、目標要素である「開発周期」の原因がどの要素であるか、目標要素である「稼働段階の故障率」の原因がどの要素であるかを指示することができる。
図1Aに示すように、因果関係決定装置120は、例えば、依存関係決定ユニット121及び因果関係決定ユニット122を含んでもよい。いくつかの実施形態において、依存関係決定ユニット121は、観測サンプル集合110に基づいて複数の要素の間に存在する依存関係集合を決定することができる。該依存関係集合における各依存関係は、複数の要素における互いに関連する1つの対応する要素ペアを指示する。いくつかの実施形態において、因果関係決定ユニット122は、依存関係決定ユニット121により決定された依存関係集合に基づいて、要素関係シーケンス130を決定することができる。要素関係シーケンス130は、依存関係が存在する要素ペアの間の因果関係を指示することができる(即ち、一方の要素が他方の要素の原因である)。
システム100に含まれるこれらの装置及び/又は装置におけるユニットは、例示的なものにすぎず、本開示の範囲を制限するためのものではないと理解すべきである。システム100は、さらに、示されない付加的な装置及び/又はユニットを含んでもよいと理解すべきである。例えば、いくつかの実施形態において、システム100は、さらに、因果関係シーケンス130の態様を表すための因果関係表現装置(未図示)を含んでもよい。
いくつかの実施形態において、因果関係表現装置は、視覚や聴覚などの異なる形態で因果関係シーケンス130の態様を表現することができる。例えば、因果関係表現装置は、グラフ、マップ、テキストなどの形態で因果関係シーケンス130を表現することができる。いくつの実施形態において、因果関係表現装置は、因果関係シーケンス130の全ての態様、即ち、全ての要素の間の因果関係を表現することができる。代替的に、いくつかの実施形態において、因果関係表現装置は、因果関係シーケンス130の一部の態様のみを表現し、例えば、1つ又は複数の目標要素に関連する因果関係のみを表現することができる。いくつかの実施形態において、目標要素の原因が複数の要素を含む場合に、因果関係表現装置は、さらに、複数の要素の対応する重要程度を表現し、例えば、異なる色及び/又は異なる重要程度を示す数値などの形態で複数の要素の対応する重要程度を表現することができる。本開示の実施形態は、その態様について制限されない。
図1Bは、本開示の実施形態に係る、データ処理用のシステム105を示す例示的なブロック図である。システム105は、例えば、図1Aに示すような因果関係シーケンス130を適用し、最適化することができる。図1Bに示すシステム105は、本開示の実施形態における1種の例を実現するものに過ぎず、本開示の範囲を制限するためのものではないと理解すべきである。本開示の実施形態は、他のシステム又はアーキテクチャにも同様に適用される。
図1Bに示すように、システム105は、観測サンプル影響装置140を含んでもよい。観測サンプル影響装置140は、因果関係シーケンス130に基づいて、複数の要素から目標要素の原因となる少なくとも1つの要素を決定することができる。観測サンプル影響装置140は、少なくとも1つの要素の観測値を変更することで目標要素の観測値に影響することにより、変更後の観測サンプル集合150を取得することができる。変更後の観測サンプル集合150における少なくとも1つの観測サンプルは、少なくとも1つの要素の変更後の観測値を含む。
上記通信キャリアの顧客満足度に関するシーンを例とする場合に、目標要素は、例えば、「顧客満足度」であり、因果関係シーケンス130は、例えば、目標要素である「顧客満足度」の原因がどの要素(例えば、パケットを使い切る前の提示、お得なパケットなど)であるかを指示することができる。観測サンプル影響装置140は、例えば、これらの要素の観測値に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、パケットを使い切る前に顧客についてより多くの提示を提供し、顧客についてより多くのお得なパケットを提供する)ことで、顧客の通信キャリアについての満足度を向上させることができる。
上記患者の血圧に関連するシーンを例とする場合に、目標要素は、例えば、「血圧」であり、因果関係シーケンス130は、例えば、目標要素である「血圧」の原因がどの生理的な指標であるかを指示することができる。観測サンプル影響装置140は、例えば、これらの生理的な指標に影響し、変更し、及び/又はこれらの生理的な指標について対応する戦略を立てることで、患者の血圧を安定に保つことができる。
上記商品販売のシーンを例とする場合に、目標要素は、例えば、「傘の売上げ」であり、因果関係シーケンス130は、例えば、目標要素である「傘の売上げ」の原因がどの要素(例えば、天気、販売される傘の数など)であるかを指示することができる。観測サンプル影響装置140は、例えば、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、雨が降るときに販売に供される傘の数を増やす)ことで、目標商品である傘の売上げを増加させることができる。
上記ソフトウェア開発のシーンを例とする場合に、目標要素は例えば「開発周期」であり、因果関係シーケンス130は、例えば、目標要素である「開発周期」の原因がどの要素(例えば、アーキテクチャ階層の数、プログラミング言語など)であるかを指示することができる。観測サンプル影響装置140は、例えば、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、ソフトウェアアーキテクチャの複雑度を低下し、よりフレンドリーなプログラミング言語を使用するなど)ことで、ソフトウェア開発の周期を短縮することができる。また、例えば、目標要素は「稼働段階のソフトウェアの故障率」であってもよく、因果関係シーケンス130は、例えば、目標要素である「稼働段階のソフトウェアの故障率」の原因がどの要素(例えば、コード長、モジュールの数など)であるかを指示することができる。観測サンプル影響装置140は、例えば、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、コード長を短くし、モジュールの数を減少するなど)ことで、稼働段階のソフトウェアの故障率を低下させることができる。
図1Bに示すように、システム105は、因果関係最適化装置160を含んでもよい。因果関係最適化装置160は、変更後の観測サンプル集合150に基づいて、因果関係シーケンス130を最適化することができるため、因果関係シーケンス130の正確性を高める。いくつかの実施形態において、因果関係最適化装置160は、変更後の観測サンプル集合150に基づいて、複数の要素の間の因果関係(例えば、因果関係決定装置120の実行過程に類似すること)を改めて発見することができるため、最適化後の因果関係シーケンスを取得する。この形態によれば、本開示の実施形態は、因果発見の正確性及びロバスト性を一層向上させることができる。
図1Aに示す因果関係決定装置120、図1Bに示す観測サンプル影響装置140及び因果関係最適化装置160は、互いに分離されることが示されているが、これは説明を目的とすることにすぎず、本開示の範囲を限定するためではないと理解すべきである。いくつかの実施形態において、図1Aに示す因果関係決定装置120、図1Bに示す観測サンプル影響装置140及び因果関係最適化装置160は、同一の物理装置或いは複数の異なる物理装置で実現されることができる。いくつかの実施形態において、図1Aに示す因果関係決定装置120と図1Bに示す因果関係最適化装置160は、同一の装置として実現することができる。本開示の実施形態は、その態様について制限されない。
図2は、本開示の実施形態に係る、複数の要素の間の因果関係を決定するための模式図である。簡略化のため、かつ説明の便宜上、図2において、観測サンプル集合110に係る要素(即ち、観測変数)の数(即ち、D)が5であると仮定する。図2に示すように、観測サンプル集合110は、要素v、v、v、v及びvについての複数の観測サンプルを含む。依存関係決定ユニット121は、観測サンプル集合110に基づいて、要素v、v、v、v及びvの間に存在する依存関係集合を決定することができ、スケルトン図210として示される。例えば、依存関係集合210は、要素vとvが互いに関連し、要素vとvが互いに関連し、要素v3とv4が互いに関連し、かつ要素vとvが互いに関連することを指示する。因果関係決定ユニット122は、依存関係集合210に基づいて、要素v、v、v、v及びvの因果関係シーケンスを決定することができ、例えば、有向非巡回グラフ130として示される。例えば、因果関係シーケンス130は、要素vが要素vの原因であり(例えば、エッジv→vで示される)、要素vが要素vの原因であり(例えば、エッジv→vで示される)、要素vが要素vの原因であり(例えば、エッジv→vで示される)、かつ要素vが要素vの原因である(例えば、エッジv→vで示される)ことを指示する。
図3は、本開示の実施形態に係る、複数の要素の間の因果関係を決定するための方法300のフローチャートである。例えば、方法300は、図1Aに示す因果関係決定装置120により実行されてもよい。方法300は、さらに、示されない付加的な動作を含んでもよく、及び/又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。
ブロック310において、因果関係決定装置120は、複数の要素に関する観測サンプル集合(例えば、図1A及び図2に示す観測サンプル集合110)を取得する。観測サンプル集合における1つの観測サンプルは、複数の要素の対応する観測値を含む。
ブロック320において、因果関係決定装置120(例えば、依存関係決定ユニット121)は、観測サンプル集合に基づいて複数の要素の間に存在する依存関係集合を決定する(例えば、図2に示すスケルトン図210)。依存関係集合における1つの依存関係は、複数の要素における互いに関連する1つの要素ペアを指示する。
いくつかの実施形態において、依存関係集合を決定するために、因果関係決定装置120は、複数の要素における任意の2つの要素の対応する観測値に基づいて、これらの2つの要素の間の相関係数を推定することができる。例えば、相関係数は、Spearman相関係数又はKendall相関係数のうちのいずれか1つであってもよい。推定された2つずつの要素の相関係数に基づいて、因果関係決定装置120は、相関係数行列Sを確立することができる。例えば、要素の総数がDであると仮定すると、Sは、D×Dの行列である。行列Sにおけるj行目k列目の要素がSjkであると仮定すると、Sjkは、以下のように決定される。
Figure 2024016198000002
ここで、
Figure 2024016198000003
は、D個の要素におけるj番目の要素とk番目の要素とのSpearman相関係数を示し、
Figure 2024016198000004
は、D個の要素におけるj番目の要素とk番目の要素とのKendallの相関係数を示す。Spearman相関係数及びKendall相関係数の計算は、当業者に知られており、ここでは説明を省略する。また、任意の既知又は将来開発の方法又は手段を利用して2つの要素の間の相関係数を計算することができ、Spearman相関係数及びKendall相関係数に限定されるものではない。Spearman相関係数及びKendall相関係数は、相関係数の例に過ぎず、本開示の範囲を限定することを意図していないと理解すべきである。
いくつかの実施形態において、因果関係決定装置120は、推定された相関係数行列Sに基づいて、依存関係集合(即ち、スケルトン図210)を決定するための目標関数(本明細書において、「第1の目標関数」とも呼ばれる)を確立することができる。因果関係決定装置120は、第1の目標関数を最小化することで、依存関係集合を決定することができる。いくつかの実施形態において、例えば、因果関係決定装置120は、グラフィカルLassoアルゴリズムに基づいて、要素の間の対応する依存関係を示す精度行列Ωを学習することができる。例えば、Ωは、以下のように決定される。
Figure 2024016198000005
ここで、
Figure 2024016198000006
は、予め定義されている係数である。決定された行列Ωにおいて、j行目k列目の要素
Figure 2024016198000007
が0であれば、D個の要素におけるj番目の要素とk番目の要素とが関連しないことを示し、要素
Figure 2024016198000008
が0でなければ、D個の要素におけるj番目の要素とk番目の要素とが互いに関連する(必ずしも因果関係を有するとは限らない)ことを示す。行列Mで依存関係集合を示すと仮定すると、行列Mにおける要素
Figure 2024016198000009
である。この形態によれば、因果関係決定装置120は、観測サンプル集合に基づいて、複数の要素の間の依存関係集合を決定することができ、図2におけるスケルトン図210に示すとおりである。以下では、「依存関係集合」と「スケルトン図」は、交換可能に使用される。
代替的に、いくつかの実施形態において、因果関係決定装置120は、複数の要素に条件付き独立性の検定を行うことで、依存関係集合Mを決定することができる。条件付き独立性の検定は、所定の条件集合において、2つの要素が互いに独立しているか否かを決定することができる。従来の条件付き独立性の検定において、2つの要素が独立しているか否かを判断する場合に、全ての他の要素の任意の組み合わせを上記条件集合とする必要がある。要素の数(即ち、D)が多い場合に、計算オーバーヘッドが非常に大きい。条件集合に多くの他の要素が含まれる場合に、上記2つの要素は、互いに独立していると決定されやすい。高次元因果構造の発見を迅速かつ正確に実現するために、いくつかの実施形態において、複数の要素に条件付き独立性の検定を行うことで、依存関係集合を決定する場合に、因果関係決定装置120は、条件集合における他の要素の数を1に制限することができる。この形態によれば、条件付き独立性の検定の計算オーバーヘッドを低減するだけでなく、互いに独立していると判定された要素ペアの数を低減することができるため、後続の因果関係シーケンスの発見に役立つ。
この形態によれば、依存関係集合を決定することで、本開示の実施形態は、検索対象の変数空間の大きさを減少させることにより、多くの要素の間の因果関係を迅速に発見することができる。
ブロック330において、因果関係決定装置120(例えば、因果関係決定ユニット122)は、依存関係集合に基づいて、複数の要素の因果関係シーケンスを決定する。因果関係シーケンスは、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示することができる。
いくつかの実施形態において、因果関係シーケンスを決定するために、因果関係決定装置120は、依存関係集合により指示された複数の互いに関連する要素ペアについて、互いに関連する各要素ペアにおける一方の要素から他方の要素への影響を決定することができる。いくつかの実施形態において、各要素ペアにおける一方の要素から他方の要素への影響を決定するために、因果関係決定装置120は、所定の分布(例えば、ガウス分布又は他の分布)に基づいて、第2の目標関数を確立して、第2の目標関数を最小化することで、各要素ペアにおける一方の要素から他方の要素への影響を決定することができる。第2の目標関数は、例えば、以下の2つの要素に基づいて確立することができる。第1、発見された因果構造が観測データサンプルについて、良好なデータフィッティング度を持つようにし、第2、発見された因果構造が依然として疎であるようにする。
いくつかの実施形態において、要素の総数がDであると仮定し、複数の要素ペアのそれぞれについて決定された影響を行列Bで示すと、Bは、以下のように決定される。
Figure 2024016198000010
ここで、X={x,x,...,x}∈RN×Dは、観測サンプル集合を示し、Nは、Xにおける観測サンプルの総数を示し、Dは、要素の総数を示す。ベクトルx∈R(ただし、1≦i≦D)は、i番目の要素(即ち、要素v)のN個の観測値を示す。xi,n(ただし、1≦i≦D、かつ1≦n≦N)は、i番目の要素(即ち、要素v)のn番目の観測値を示す。ベクトル
Figure 2024016198000011
は、要素vについての各要素の対応する影響を示す。例えば、
Figure 2024016198000012
であれば、要素vが要素vの直接的原因である可能性があることを示し、
Figure 2024016198000013
であれば、要素vが要素vに影響しないことを示すため、要素vの直接的原因である可能性がない。
Figure 2024016198000014
は、行列Bにおける非ゼロ元素の総数を示し、因果構造の分散度についての推定であり、かつ
Figure 2024016198000015
である。制約条件
Figure 2024016198000016
は、決定しようとする因果構造が有向非巡回グラフであることを示し、かつ制約条件
Figure 2024016198000017
は、決定しようとする因果構造が以前に決定されたスケルトン図M(例えば、図2に示すスケルトン図210)のサブ集合であることを示す。
いくつかの実施形態において、因果関係決定装置120は、複数の要素ペアについて決定された対応する影響と観測サンプル集合に基づいて、因果関係シーケンス130を決定することができる。例えば、図4は、本開示の実施形態に係る、因果関係シーケンスを決定するための方法400のフローチャートである。方法400は、図1Aに示す因果関係決定装置120によって実行されてもよい。方法400は、さらに、示されない付加的な動作を含んでもよく、及び/又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。
ブロック410において、因果関係決定装置120は、履歴因果関係シーケンスと履歴因果関係のスコアを取得することができる。ここでは、履歴因果関係シーケンスをQで示し、履歴因果関係のスコアをf(Q)で示すと仮定する。
いくつかの実施形態において、初期状況で、因果関係決定装置120は、履歴因果関係シーケンスを空シーケンスに初期化することができ、即ちQ={}である。因果関係決定装置120は、空シーケンスに対応する初期因果関係のスコアを履歴因果関係のスコアとして決定することができ、即ち、
Figure 2024016198000018
上記式(4)において、因果関係シーケンスが有向非巡回グラフG={V,E}で示されると仮定し、ただし、Vは、グラフGにおける全てのノード(例えば、スケルトン図210におけるエッジを有する全てのノード)の集合を示し、Eは、グラフGにおける全てのエッジの集合を示す。例えば、図2に示す例では、V={v,v,v,v,v}である。
Figure 2024016198000019
は、Vにおけるノード集合U以外の全てのノードを示す(即ち、
Figure 2024016198000020
は、Vにおける
Figure 2024016198000021
以外の全てのノードを示す)。
Figure 2024016198000022
は、
Figure 2024016198000023
のサポート集合を示し、即ち、ノード
Figure 2024016198000024
の親ノード(即ち、要素
Figure 2024016198000025
の潜在的原因を示すノード)の集合である。制約条件
Figure 2024016198000026
は、集合
Figure 2024016198000027
が集合
Figure 2024016198000028
と集合
Figure 2024016198000029
との集合のサブ集合を示し、集合
Figure 2024016198000030
は、スケルトン図M(例えば、スケルトン図210)においてノード
Figure 2024016198000031
とエッジを有するノードの集合を示す。例えば、図2に示す例では、f(Q)=f({})=SBIC(v|v)+SBIC(v|(v,v))+SBIC(v|(v,v))+SBIC(v|(v,v))+SBIC(v|v)である。
ブロック420において、因果関係決定装置120は、履歴因果関係シーケンスQと依存関係集合(例えば、スケルトン図210)により指示された複数の要素ペアに基づいて、因果関係シーケンスに追加する可能性がある1つ又は複数の候補要素を決定する。いくつかの実施形態において、1つ又は複数の候補要素は、候補ノード集合V\Qに対応する全ての要素を含んでもよく、候補ノード集合V\Qは、ノード集合Vにおける、Qに含まれるノード以外の全てのノードを示す。
1つ又は複数の候補要素が存在しなければ(即ち、集合V\Qが空である)、ブロック470において、因果関係決定装置120は、履歴因果関係シーケンスQを、決定された因果関係シーケンス130として出力することができる。
1つ又は複数の候補要素が存在すれば、ブロック440において、因果関係決定装置120は、1つ又は複数の候補要素に対応する1つ又は複数の候補因果関係のスコアを決定することができる。例えば、候補ノード集合V\Qにおける各候補ノード
Figure 2024016198000032
(即ち、
Figure 2024016198000033
)について、それに対応する候補因果関係シーケンス
Figure 2024016198000034
であり、かつ該候補因果関係シーケンスのスコアが
Figure 2024016198000035
である。
ブロック450において、因果関係決定装置120は、決定された1つ又は複数の候補因果関係のスコアに基づいて、1つ又は複数の候補要素から因果関係シーケンスに追加しようとする候補要素を選択することができる。
いくつかの実施形態において、因果関係決定装置120は、1つ又は複数の候補因果関係のスコアから最小の候補因果関係のスコアを決定し、最小の候補因果関係のスコアに関連する候補要素を選択することで、因果関係シーケンス130に追加することができる。
付加的又は代替的に、いくつかの実施形態において、因果関係シーケンスをより迅速に決定するために、因果関係決定装置120は、決定待ちの因果関係シーケンスに関連する制約条件を取得することができる。
いくつかの実施形態において、因果関係決定装置120は、該制約条件を指示するエキスパート情報を取得し、取得されたエキスパート情報に基づいて該制約条件を決定することができる。図2に示す例を例とする場合に、エキスパート情報は、例えば、ノードvがノードvの前にあることを指示することができ、即ち、ノードvに対応する要素がノードvに対応する要素の原因である可能性があるが、ノードvに対応する要素がノードvに対応する要素の原因である可能性がない。
付加的又は代替的に、いくつかの実施形態において、因果関係決定装置120は、履歴因果関係シーケンスとスケルトン図210に指示された複数の互いに関連する要素ペアに基づいて、制約条件を決定することができる。例えば、図2に示す例において、現在のQは、ノードvに対応する要素がノードvに対応する要素の原因であると仮定する(即ち、因果関係シーケンス130にエッジv→vが存在する)。また、スケルトン図Mに基づいて、ノードv及びvが互いに関連し、ノードv及びvが互いに関連し、要素v及びvが互いに関連し、要素v及びvが互いに関連することを決定することができる。したがって、ノードv、v及びvは、強連結ノード集合を構成し、ノードv及びvは、強連結ノード集合を構成する。この場合、例えば、因果関係決定装置120は、ノード集合{v,v}がノード集合{v,v,v}の前にあることを決定することができる。即ち、ノード集合{v,v}におけるあるノードは、ノード集合{v,v,v}におけるあるノードの原因である可能性があるが、ノード集合{v,v,v}における任意のノードは、ノード集合{v,v}におけるあるノードの原因である可能性がない。
いくつかの実施形態において、決定待ちの因果関係シーケンスに関連する制約条件を取得することに応答して、因果関係決定装置120は、選択された候補要素の追加が取得された制約条件に合致するように、1つ又は複数の候補要素から因果関係シーケンスに追加しようとする候補要素を選択することができる。例えば、最小の候補因果関係のスコアに関連する候補要素の追加が該制約条件に違反する場合に、因果関係決定装置120は、他方の候補要素(例えば、次に小さい候補因果関係のスコアに関連する候補要素)を選択することにより、因果関係シーケンス130に追加することができる。
この形態によれば、制約条件を利用することで、因果関係シーケンスの決定過程において、候補要素の数を制限することにより、因果関係シーケンスをより迅速に決定することができる。
ブロック460において、候補要素が選択されることに応答して、因果関係決定装置120は、履歴因果関係シーケンスQと履歴因果関係のスコアf(Q)を更新することができる。例えば、因果関係決定装置120は、履歴因果関係シーケンスQの代わりに、選択された候補要素に対応する候補因果関係シーケンスQ’を利用し、履歴因果関係のスコアf(Q)の代わりに、候補因果関係シーケンスQ’に対応するスコアf(Q’)を利用することができる。
いくつかの実施形態において、因果関係決定装置120は、全ての可能な候補要素が検索されるまで、方法400におけるブロック410-460を繰り返して実行することができる(即ち、ブロック470までに実行する)。
図5は、本開示の実施形態に係る、目標要素の観測値に影響するための方法500のフローチャートである。例えば、方法500は、図1Bに示す観測サンプル影響装置140により実行されてもよい。いくつかの実施形態において、方法500は、方法300の後に実行されてもよい。方法500は、さらに、示されない付加的な動作を含んでもよく、及び/又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。
ブロック510において、観測サンプル影響装置140は、因果関係シーケンスに基づいて、目標要素の原因となる少なくとも1つの要素を複数の要素から決定する。次に、ブロック520において、観測サンプル影響装置140は、少なくとも1つの要素の観測値を変更することで、目標要素の観測値に影響する。いくつかの実施形態において、例えば、観測サンプル影響装置140は、少なくとも1つの要素に影響し、変更し、及び/又は少なくとも1つの要素について対応する戦略を立てることで、目標要素の観測値に影響することができる。
上記通信キャリアの顧客満足度に関するシーンを例とする場合に、目標要素は、例えば、「顧客満足度」である。観測サンプル影響装置140は、因果関係シーケンス130に基づいて、目標要素である「顧客満足度」の原因がどの要素(例えば、パケットを使い切る前の提示、お得なパケットなど)であるかを決定することができる。観測サンプル影響装置140は、さらに、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、パケットを使い切る前に顧客についてより多くの提示を提供し、顧客についてより多くのお得なパケットを提供する)ことで、顧客の通信キャリアについての満足度を向上させることができる。
上記患者の血圧に関連するシーンを例とする場合に、目標要素は、例えば、「血圧」である。観測サンプル影響装置140は、因果関係シーケンス130に基づいて、目標要素である「血圧」の原因がどの生理的な指標であるかを決定することができる。観測サンプル影響装置140は、さらに、これらの生理的な指標に影響し、変更し、及び/又はこれらの生理的な指標について対応する戦略を立てることで、患者の血圧を安定に保つことができる。
上記商品販売のシーンを例とする場合に、目標要素は、例えば、「傘の売上げ」である。観測サンプル影響装置140は、因果関係シーケンス130に基づいて、目標要素である「傘の売上げ」の原因がどの要素(例えば、天気、販売される傘の数など)であるかを決定することができる。観測サンプル影響装置140は、さらに、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、雨が降るときに販売に供される傘の数を増やす)ことで、目標商品である傘の売上げを増加させることができる。
上記ソフトウェア開発のシーンを例とする場合に、目標要素は、例えば、「開発周期」である。観測サンプル影響装置140は、因果関係シーケンス130に基づいて、目標要素である「開発周期」の原因がどの要素(例えば、アーキテクチャ階層の数、プログラミング言語など)であるかを決定することができる。観測サンプル影響装置140は、さらに、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、ソフトウェアアーキテクチャの複雑度を低下し、よりフレンドリーなプログラミング言語を使用するなど)ことで、ソフトウェア開発の周期を短縮することができる。また、例えば、目標要素は、「稼働段階のソフトウェアの故障率」であってもよい。観測サンプル影響装置140は、因果関係シーケンス130に基づいて、目標要素である「稼働段階のソフトウェアの故障率」の原因がどの要素(例えば、コード長、モジュールの数など)であるかを決定することができる。観測サンプル影響装置140は、さらに、これらの要素に影響し、変更し、及び/又はこれらの要素について対応する戦略を立てる(例えば、コード長を短くし、モジュールの数を減少するなど)ことで、稼働段階のソフトウェアの故障率を低下させることができる。
図6は、本開示の実施形態に係る、因果関係を最適化するための方法600のフローチャートである。例えば、方法600は、図1Bに示す因果関係最適化装置160により実行されてもよい。いくつかの実施形態において、方法600は、方法500の後に実行されてもよい。方法600は、さらに、示されない付加的な動作を含んでもよく、及び/又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。
ブロック610において、因果関係最適化装置160は、複数の要素に関する変更後の観測サンプル集合を取得する。いくつかの実施形態において、変更後の観測サンプル集合における少なくとも1つの観測サンプルは、少なくとも1つの要素(例えば、少なくとも1つの要素が目標要素の原因である)の変更後の観測値を含んでもよい。次に、ブロック620において、因果関係最適化装置160は、変更後の観測サンプル集合に基づいて、因果関係シーケンスを最適化することができる。いくつかの実施形態において、例えば、因果関係最適化装置160は、変更後の観測サンプル集合150に基づいて、複数の要素の間の因果関係(例えば、因果関係決定装置120の実行過程に類似すること)を改めて発見することができるため、最適化後の因果関係シーケンスを取得する。この形態によれば、本開示の実施形態は、因果発見の正確性及びロバスト性を一層向上させることができる。
図7は、本開示の実施形態を実施するのに適した例示的デバイス700の概略ブロック図である。例えば、図1Aに示す因果関係決定装置120、図1Bに示す観測サンプル影響装置140及び/又は因果関係最適化装置160は、デバイス700により実施されてもよい。図に示すように、デバイス700は、リードオンリーメモリ(ROM)702に記憶されたコンピュータプログラム指令又は記憶ユニット708からランダムアクセスメモリ(RAM)703にロードされたコンピュータプログラム指令に基づいて、様々な適切な動作及び処理を実行することができる中央プロセッシングユニット(CPU)701を含む。RAM703には、デバイス700の操作に必要な様々なプログラム及びデータがさらに記憶されてよい。CPU701、ROM702、及びRAM703は、バス704を介して互いに接続されている。入力/出力(I/O)インタフェース705もバス704に接続されている。
キーボード、マウスなどの入力ユニット706と、様々なタイプのディスプレイ、スピーカなどの出力ユニット707と、磁気ディスク、光ディスクなどの記憶ユニット708と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット709とを含むデバイス700における複数のコンポーネントは、I/Oインタフェース705に接続されている。通信ユニット709は、デバイス700がインターネットなどのコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して他のデバイスと情報/データを交換することを許可する。
プロセッシングユニット701は、例えば、方法300、400、500及び/又は600である上記各々の過程及び処理を実行するように構成されている。例えば、いくつかの実施形態において、方法300、400、500及び/又は方法600は、記憶ユニット708のような機器読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてよい。いくつかの実施形態において、コンピュータプログラムの一部又は全ては、ROM702及び/又は通信ユニット709を介してデバイス700にロード及び/又はインストールされてよい。コンピュータプログラムがRAM703にロードされてCPU701により実行される場合、前述の方法300、400、500及び/又は方法600の1つ又は複数のステップを実行することができる。
本開示は、システム、方法及び/又はコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、本開示の様々な態様を実行するためのコンピュータ読み取り可能なプログラム指令が格納されているコンピュータ可読記憶媒体を含んでよい。
コンピュータ可読記憶媒体は、指令実行装置によって使用される指令を保持して記憶することができる物理装置であってもよい。コンピュータ可読記憶媒体は、例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置又は前述の任意の適切な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的リスト)は、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピー(登録商標)ディスク、指令が記憶されたパンチカード又は凹溝内の凸構造、及び前述の任意の適切な組み合わせなどの機器的符号化装置を含む。ここで使用されるコンピュータ可読記憶媒体は、無線電波や自由に伝播される他の電磁波、導波管や他の伝播媒体を介して伝播される電磁波(例えば、光ファイバーケーブルを介した光パルス)、又はワイヤを介して伝送される電子信号などの、一時的な信号自身として解釈されてはならない。
ここで説明されるコンピュータ読み取り可能なプログラム指令は、コンピュータ可読記憶媒体から様々な計算/処理デバイスにダウンロードするか、又はネットワーク、例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又は無線ネットワークを介して外部コンピュータ又は外部記憶装置にダウンロードすることができる。ネットワークは、銅の伝送ケーブル、光伝送ファイバー、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ及び/又はエッジサーバを含んでよい。各計算/処理デバイスにおけるネットワークアダプターカード又はネットワークインタフェースは、ネットワークからコンピュータ読み取り可能なプログラム指令を受信し、各計算/処理デバイスにおけるコンピュータ可読記憶媒体に記憶するために、該コンピュータ読み取り可能なプログラム指令を転送する。
本開示の操作を実行するためのコンピュータプログラム指令は、アセンブリ指令、命令セットアーキテクチャ(ISA)指令、機器指令、機器依存指令、マイクロコード、ファームウェア指令、状態設定データ、或いは1種又は複数種のプログラミング言語の任意の組み合わせで書かれたソースコード又はターゲットコードであってもよく、前記プログラミング言語は、Smalltalk、C++などのオブジェクト指向プログラミング言語、及び「C」言語又は類似のプログラミング言語などの従来の手続き型プログラミング言語を含む。コンピュータ読み取り可能なプログラム指令は、ユーザのコンピュータで完全に又は部分的に実行されてもよく、1つの独立したソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータで、部分的にリモートコンピュータで実行されてもよく、完全にリモートコンピュータ又はサーバで実行されてもよい。リモートコンピュータに関する場合、リモートコンピュータは、任意の種類のネットワーク(ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む)を通じてユーザのコンピュータに接続されてもよく、(例えば、インターネットサービスプロバイダを利用してインターネットを通じて)外部コンピュータに接続されてもよい。いくつかの実施形態において、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)又はプログラマブルロジックアレイ(PLA)を含む電子回路は、本開示の態様を実行するために、コンピュータ読み取り可能なプログラム指令の状態情報を利用して電子回路をカスタマイズすることにより、コンピュータ読み取り可能なプログラム指令を実行してよい。
ここで、本開示の実施形態に係る方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照して本開示の各態様を説明する。フローチャート及び/又はブロック図の各ブロック及びフローチャート及び/又はブロック図における各ブロックの組み合わせの全ては、コンピュータ読み取り可能なプログラム指令によって実行され得ることを理解されたい。
これらのコンピュータ読み取り可能なプログラム指令は、汎用コンピュータ、専用コンピュータ又は他のプログラム可能なデータ処理装置のプロセッシングユニットに提供することができ、それによりマシンを作成して、これらの指令がコンピュータ又は他のプログラム可能なデータ処理装置のプロセッシングユニットによって実行されるときに、フローチャート及び/又はブロック図における1つ又は複数のブロックで規定した機能/動作を実現する装置を作成するようにする。これらのコンピュータ読み取り可能なプログラム指令をコンピュータ可読記憶媒体に記憶してもよく、これらの指令は、コンピュータ、プログラム可能なデータ処理装置及び/又は他のデバイスが決定方式で動作するようにし、それにより、指令が記憶されたコンピュータ読み取り可能な媒体は、フローチャート及び/又はブロック図における1つ又は複数のブロックで規定した機能/動作を実現する各態様の指令を含む、製品を含む。
コンピュータ読み取り可能なプログラム指令をコンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイスにローディングして、一連の操作ステップをコンピュータ、他のプログラム可能なデータ処理装置又は他のデバイスで実行することができるようにし、コンピュータによって実現されるプロセスを作成し、それにより、コンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイスで実行される指令がフローチャート及び/又はブロック図における1つ又は複数のブロックで規定した機能/動作を実現することができるようにする。
図面におけるフローチャート及びブロック図は、本開示の複数の実施形態に係るシステム、方法及びコンピュータプログラム製品の実現可能な実装アーキテクチャ、機能及び動作を示す。これに関して、フローチャート又はブロック図における各ブロックは、1つのモジュール、プログラムセグメント又は指令の一部を表すことができ、前記モジュール、プログラムセグメント又は指令の一部は、規定された論理機能を実現するための1つ又は複数の実行可能な指令を含む。いくつかの代替的な実現において、ブロックで表示された機能は、図面で表示された順序と異なる順序で発生することができる。例えば、連続して示された2つのブロックは、実際には、基本的に並行して実行される場合や、逆の順序で実行される場合があり、これは、関連する機能によって決定される。ブロック図及び/又はフローチャートにおける各ブロック、及びブロック図及び/又はフローチャートにおけるブロックの組み合わせは、規定された機能又は動作を実行する専用のハードウェアに基づくシステムによって実現されてもよく、専用のハードウェアとコンピュータ指令の組み合わせによって実現されてもよいことにも留意されたい。
以上、本開示の各実施形態を説明したが、以上の説明は、網羅的ではなく、例示的なものに過ぎず、開示された各実施形態に限定されない。当業者にとって、説明された各実施形態の範囲及び思想から逸脱することなく、多くの修正及び変更は明らかである。本明細書で使用される用語の選択は、各実施形態の原理、実際の応用又は市場における技術への改善を最もよく説明するか、当業者が本明細書で開示された各実施形態を理解することができるようにすることを意図する。

Claims (14)

  1. 複数の要素に関する観測サンプル集合を取得することであって、前記観測サンプル集合における1つの観測サンプルは、前記複数の要素の対応する観測値を含むことと、
    前記観測サンプル集合に基づいて、前記複数の要素の間に存在する依存関係集合を決定することであって、前記依存関係集合における1つの依存関係は、前記複数の要素における互いに関連する1つの要素ペアを指示することと、
    前記依存関係集合に基づいて、前記複数の要素の因果関係シーケンスを決定することであって、前記因果関係シーケンスは、互いに関連する前記要素ペアにおける一方の要素が他方の要素の原因であることを指示することと、を含み、
    前記依存関係集合を決定することは、
    前記複数の要素における任意の2つの要素について、前記観測サンプル集合における前記2つの要素の対応する観測値に基づいて、前記2つの要素の間の相関係数を推定することと、
    前記推定した結果に基づいて、前記依存関係集合を決定するための第1の目標関数を確立することと、
    前記第1の目標関数を最小化することで、前記依存関係集合を決定することと、を含む
    データ処理装置が実行するデータ処理方法。
  2. 前記複数の要素は、目標要素を含み、前記方法は、
    前記因果関係シーケンスに基づいて、前記複数の要素から前記目標要素の原因となる少なくとも1つの要素を決定することと、
    前記少なくとも1つの要素の観測値を変更することで、前記目標要素の観測値に影響することと、をさらに含む請求項1に記載の方法。
  3. 前記複数の要素に関する変更後の観測サンプル集合を取得することであって、前記変更後の観測サンプル集合における少なくとも1つの観測サンプルは、前記少なくとも1つの要素の変更後の観測値を含むことと、
    前記変更後の観測サンプル集合に基づいて、前記因果関係シーケンスを最適化することと、をさらに含む請求項2に記載の方法。
  4. 前記因果関係シーケンスを決定することは、
    前記依存関係集合によって指示された複数の互いに関連する要素ペアについて、各要素ペアにおける一方の要素から他方の要素への影響を決定することと、
    複数の要素ペアについて決定された対応する影響及び前記観測サンプル集合に基づいて、前記因果関係シーケンスを決定することと、を含む請求項1に記載の方法。
  5. 各要素ペアにおける一方の要素から他方の要素への影響を決定することは、
    所定の分布に基づいて、前記複数の要素ペアについて前記対応する影響を決定するための第2の目標関数を確立することと、
    前記第2の目標関数を最小化することで、各要素ペアにおける一方の要素から他方の要素への影響を決定することと、を含む請求項4に記載の方法。
  6. 前記因果関係シーケンスを決定することは、
    履歴因果関係シーケンス及び前記履歴因果関係シーケンスに対応する履歴因果関係のスコアを取得する操作と、
    前記履歴因果関係シーケンス及び前記複数の要素ペアに基づいて、前記因果関係シーケンスに追加する可能性がある1つ又は複数の候補要素を決定する操作と、
    前記1つ又は複数の候補要素が存在することに応答し、前記履歴因果関係のスコア、前記複数の要素ペアについて決定された前記対応する影響及び前記観測サンプル集合に基づいて、前記1つ又は複数の候補要素に対応する1つ又は複数の候補因果関係のスコアを決定する操作と、
    前記1つ又は複数の候補因果関係のスコアに基づいて、前記1つ又は複数の候補要素から前記因果関係シーケンスに追加しようとする候補要素を選択する操作と、
    選択された前記候補要素に基づいて、前記履歴因果関係シーケンス及び前記履歴因果関係のスコアを更新する操作と、を少なくとも1回繰り返して実行することを含む、請求項4に記載の方法。
  7. 前記1つ又は複数の候補要素が存在しないことに応答し、前記履歴因果関係シーケンスを前記因果関係シーケンスとして決定することをさらに含む、請求項6に記載の方法。
  8. 前記履歴因果関係シーケンス及び前記履歴因果関係のスコアを取得することは、
    前記履歴因果関係シーケンスを空シーケンスに初期化することと、
    前記空シーケンスに対応する初期因果関係のスコアを前記履歴因果関係のスコアとして決定することと、を含む請求項6に記載の方法。
  9. 前記1つ又は複数の候補要素から前記候補要素を選択することは、
    前記1つ又は複数の候補因果関係のスコアから最小の候補因果関係のスコアを決定することと、
    前記1つ又は複数の候補要素から前記最小の候補因果関係のスコアに関連する前記候補要素を選択することと、を含む請求項6に記載の方法。
  10. 前記1つ又は複数の候補要素から前記候補要素を選択することは、
    決定待ちの前記因果関係シーケンスに関連する制約条件を取得することと、
    前記候補要素の前記追加が前記制約条件に合致するように、前記1つ又は複数の候補要素から前記因果関係シーケンスに追加しようとする前記候補要素を選択することと、を含む請求項6に記載の方法。
  11. 前記制約条件を取得することは、
    前記制約条件を指示する情報を取得することと、
    前記情報に基づいて前記制約条件を決定することと、を含む請求項10に記載の方法。
  12. 前記制約条件を取得することは、
    前記履歴因果関係シーケンス及び前記複数の要素ペアに基づいて、前記制約条件を決定することを含む、請求項10に記載の方法。
  13. 少なくとも1つのプロセッシングユニットと、
    前記少なくとも1つのプロセッシングユニットに結合され、前記少なくとも1つのプロセッシングユニットが実行する指令を記憶する少なくとも1つのメモリと、を含むデータ処理装置であって、
    前記指令が前記少なくとも1つのプロセッシングユニットにより実行される場合、前記装置に請求項1~12のいずれか1項に記載の方法を実行させるデータ処理装置。
  14. デバイスにより実行される場合、前記デバイスに請求項1~12のいずれか1項に記載の方法を実行させる機器実行可能なコンピュータプログラム。
JP2023190772A 2019-04-24 2023-11-08 データ処理方法、装置及び媒体 Pending JP2024016198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023190772A JP2024016198A (ja) 2019-04-24 2023-11-08 データ処理方法、装置及び媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/CN2019/084049 WO2020215237A1 (zh) 2019-04-24 2019-04-24 用于数据处理的方法、装置和介质
JP2021563019A JP2022537009A (ja) 2019-04-24 2019-04-24 データ処理方法、装置及びプログラム
JP2023190772A JP2024016198A (ja) 2019-04-24 2023-11-08 データ処理方法、装置及び媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021563019A Division JP2022537009A (ja) 2019-04-24 2019-04-24 データ処理方法、装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2024016198A true JP2024016198A (ja) 2024-02-06

Family

ID=72941072

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021563019A Pending JP2022537009A (ja) 2019-04-24 2019-04-24 データ処理方法、装置及びプログラム
JP2023190772A Pending JP2024016198A (ja) 2019-04-24 2023-11-08 データ処理方法、装置及び媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021563019A Pending JP2022537009A (ja) 2019-04-24 2019-04-24 データ処理方法、装置及びプログラム

Country Status (3)

Country Link
US (1) US20220215291A1 (ja)
JP (2) JP2022537009A (ja)
WO (1) WO2020215237A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114912935A (zh) * 2021-02-09 2022-08-16 日本电气株式会社 数据处理方法、装置和计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5082511B2 (ja) * 2007-03-07 2012-11-28 オムロン株式会社 因果構造決定装置、因果構造決定装置の制御方法、および因果構造決定装置の制御プログラム
CN101436057A (zh) * 2008-12-18 2009-05-20 浙江大学 数控机床热误差贝叶斯网络补偿方法
CN103020423B (zh) * 2012-11-21 2016-01-13 华中科技大学 基于copula函数获取风电场出力相关特性的方法
US10289751B2 (en) * 2013-03-15 2019-05-14 Konstantinos (Constantin) F. Aliferis Data analysis computer system and method employing local to global causal discovery
CN107491898A (zh) * 2017-09-01 2017-12-19 中国电建集团成都勘测设计研究院有限公司 用于梯级水电站风险分析的贝叶斯网络模型及构建方法

Also Published As

Publication number Publication date
JP2022537009A (ja) 2022-08-23
US20220215291A1 (en) 2022-07-07
WO2020215237A1 (zh) 2020-10-29

Similar Documents

Publication Publication Date Title
US20210342699A1 (en) Cooperative execution of a genetic algorithm with an efficient training algorithm for data-driven model creation
CN110018869B (zh) 通过强化学习向用户展示页面的方法及装置
JP7052016B2 (ja) 訓練データを更新するための方法、システム、およびコンピュータ・プログラム
US20210133612A1 (en) Graph data structure for using inter-feature dependencies in machine-learning
US20200311556A1 (en) Process and System Including an Optimization Engine With Evolutionary Surrogate-Assisted Prescriptions
US20220122010A1 (en) Long-short field memory networks
CA2944652C (en) Inference model for traveler classification
JP2024016198A (ja) データ処理方法、装置及び媒体
JP2019204499A (ja) データ処理方法および電子機器
JP7294369B2 (ja) 情報処理に用いられる方法、装置、電子機器及びプログラム
US20210157819A1 (en) Determining a collection of data visualizations
CN111368973A (zh) 用于训练超网络的方法和装置
CN107368418A (zh) 一种遍历测试的方法、装置和介质
US20220114607A1 (en) Method, apparatus and computer readable storage medium for data processing
JP2020181578A (ja) データ処理方法、装置、及び媒体
JP2015114988A (ja) 処理装置、処理方法、およびプログラム
Murphy Software for graphical models: A review
US20220113951A1 (en) Linking Stages in Process Flows with Machine Learning
US11989656B2 (en) Search space exploration for deep learning
US11475324B2 (en) Dynamic recommendation system for correlated metrics and key performance indicators
JP2022028611A (ja) 情報処理に用いられる方法、装置、デバイス及び記憶媒体
JP2015114987A (ja) 処理装置、処理方法、およびプログラム
US20210034926A1 (en) Feedback driven decision support in partially observable settings
CN112133420A (zh) 数据处理方法、装置和计算机可读存储介质
CN111767290A (zh) 用于更新用户画像的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231207