JP2024016198A

JP2024016198A - データ処理方法、装置及び媒体

Info

Publication number: JP2024016198A
Application number: JP2023190772A
Authority: JP
Inventors: ウェンジュアンウェイ; Wenjuan Wei; チュンチェンリウ; chun cheng Liu; ルーイエツゥイ; Lvye Cui; ルーフェン; Lu Feng
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2019-04-24
Filing date: 2023-11-08
Publication date: 2024-02-06
Also published as: JP2022537009A; US20220215291A1; WO2020215237A1

Abstract

【課題】多くの要素の間の因果関係を迅速かつ正確に発見し、該因果関係に基づいて目標要素の観測値に影響することができるデータ処理方法、装置及びコンピュータ可読記憶媒体を提供する。【解決手段】データ処理方法は、複数の要素に関する観測サンプル集合を取得するステップ３１０を含む。該観測サンプル集合における１つの観測サンプルは、複数の要素の対応する観測値を含む。方法はまた、観測サンプル集合に基づいて、複数の要素の間に存在する依存関係集合を決定するステップ３２０を含む。依存関係集合における１つの依存関係は、複数の要素における互いに関連する１つの要素ペアを指示する。方法はさらに、依存関係集合に基づいて、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示する複数の要素の因果関係シーケンスを決定するステップ３３０を含む。【選択図】図３

Description

本開示の実施形態は、機械学習の分野に関し、さらに具体的には、データ処理方法、装置及びコンピュータ可読記憶媒体に関する。

情報技術の飛躍的な発展に伴い、データの規模が急速に大きくなっている。機械学習は、このような背景及びトレンドでますます広く注目されている。中でも、因果発見は、現実の生活において、例えば、サプライチェーン、医療健康及びリテールなどの分野において幅広く適用されている。ここでは、上記の因果発見とは、複数の要素に関するサンプルデータから複数の要素の間に存在する因果関係を発見することである。例えば、リテールの分野では、因果発見の結果は、各種の販売戦略を立てることを補助するために用いられ、医療健康の分野では、因果発見の結果は、患者についての治療方案などを作成することを補助するために用いられる。

しかしながら、技術の発展に伴い、単一のシステムにおいて因果関係が存在する可能性のある様々な要素の数は著しく増加している。また、異なるシステム間の連動にも注目されることが多い。これは、因果関係を発見しようとする要素の数が数百から千以上になる可能性のあることを招く。この場合、多くの要素の間に存在する因果関係を迅速かつ正確に発見することは、ますます重要なものとなっている。

本開示の実施形態は、データ処理方法、装置及びコンピュータ可読記憶媒体を提供する。

本開示の第１の態様において、データ処理方法が提供される。該方法は、複数の要素に関する観測サンプル集合を取得することであって、該観測サンプル集合における各観測サンプルは、複数の要素の対応する観測値を含むことと、該観測サンプル集合に基づいて、複数の要素の間に存在する依存関係集合を決定することであって、該依存関係集合における１つの依存関係は、複数の要素における互いに関連する１つの要素ペアを指示することと、該依存関係集合に基づいて、複数の要素の因果関係シーケンスを決定することであって、該因果関係シーケンスは、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示することと、を含む。

本開示の第２の態様において、データ処理装置が提供される。該装置は、少なくとも１つのプロセッシングユニット及び少なくとも１つのメモリを含む。少なくとも１つのメモリは、少なくとも１つのプロセッシングユニットに結合され、少なくとも１つのプロセッシングユニットが実行する指令を記憶する。指令が少なくとも１つのプロセッシングユニットにより実行される場合、該装置に以下の動作を実行させ、動作は、複数の要素に関する観測サンプル集合を取得することであって、該観測サンプル集合における各観測サンプルは、複数の要素の対応する観測値を含むことと、該観測サンプル集合に基づいて、複数の要素の間に存在する依存関係集合を決定することであって、該依存関係集合における１つの依存関係は、複数の要素における互いに関連する１つの要素ペアを指示することと、該依存関係集合に基づいて、複数の要素の因果関係シーケンスを決定することであって、該因果関係シーケンスは、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示することと、を含む。

本開示の第３の態様において、コンピュータ可読記憶媒体が提供され、該コンピュータ可読記憶媒体は、デバイスにより実行される場合、該デバイスに本開示の第１の態様に記載の方法を実行させる機器実行可能な指令を記憶している。

発明の概要を提供することは、簡略した形態で一連の概念を紹介するためであり、これらは、以下の具体的な実施形態においてさらに詳細に説明される。発明の概要は、本開示の肝心となる特徴又は必須な特徴を示す意図も、本開示の範囲を限定する意図もない。本開示のその他の特徴は、以下の説明により容易に理解できるはずである。

以下の開示内容及び特許請求の範囲から、本発明の目的、利点及び他の特徴はより明らかになる。ここでは、例を示す目的を基にして、図面を参照しながら、好ましい実施形態についての制限的ではない記述を示す。

本開示の実施形態に係る、データ処理用の例示的なシステムを示すブロック図である。本開示の実施形態に係る、データ処理用の例示的なシステムを示すブロック図である。

本開示の実施形態に係る、複数の要素の間の因果関係を決定するための模式図である。

本開示の実施形態に係る、例示的な方法を示すフローチャートである。

本開示の実施形態を実施できる例示的な装置を模式的に示すブロック図である。

各図面において、同一又は対応する符号は同一又は対応する部分を示す。

以下、図面を参照しながら、本開示の実施形態をさらに詳細に説明する。本開示は、図面により本開示のいくつかの実施形態を示しているが、様々な形態により実施可能であり、ここで説明する実施形態に限定されるように解釈されるべきでない。逆にこれらの実施形態を提供することは本開示をより徹底的、かつ完全に理解するためであることを理解すべきである。本開示の図面及び実施形態は例示的なものにすぎず、本開示の保護範囲を限定するためのものではないと理解すべきである。

本開示の実施形態の記述において、用語「含む」及びそれに類似する用語は、開放式であり、即ち「…を含むが、これらに限定されない」と解釈されるべきである。用語「…に基づいて」は、「少なくとも部分的に基づく」と解釈される。用語「１つの実施形態」又は「該実施形態」は、「少なくとも１つの実施形態」と解釈されるべきである。用語「第１」、「第２」などは、異なる又は同一なオブジェクトを指してもよい。以下では、他の明示的及び非明示的な定義も含まれる場合がある。

本開示の実施形態において、用語「因果構造」（ｃａｕｓａｌｓｔｒｕｃｔｕｒｅ）とは、通常、システムにおける各要素の間の因果関係を記述する構造を指し、本明細書において、「因果関係シーケンス」とも呼ばれる。用語「要素」は「変量」とも呼ばれる。用語「観測サンプル」は、直接的に観測可能な複数の要素の１組の観測値を指し、直接的に観測可能な要素は「観測変数」とも呼ばれる。

上記のように、実際の生活において、多くの観測変数の間に存在する因果関係を迅速かつ正確に発見することは望まれている。

顧客サービスの分野において、どの要素が顧客の通信キャリアについての満足度に影響するかを決定するために、顧客の消費行為データ（例えば、顧客のレベル、毎月に使用したネットの通信量、無料の通信量の比率、毎月に使用したネットの通信量の総額など）、満足度調査データ及びキャリア戦略データを大量に収集してもよい。収集した各タイプのデータは、１種の要素（又は変数）の観測値とも呼ばれる。これらの要素の間に存在する因果関係を発見することで、顧客満足度に影響する１つ又は複数の要素を決定することができる。さらに、当該１つ又は複数の要素の観測値を変更し、或いは当該１つ又は複数の要素について対応する戦略を立てることで、顧客の通信キャリアについての満足度を向上させることができる。

健康の分野において、患者の血圧に影響する要素を決定するために、例えば、心拍数、心拍出量、アレルギー指数、総末梢血管抵抗、カテコールアミンの放出、血圧など、患者の一連の生理的な指標（即ち、一連の要素の観測値）を大量に収集してもよい。これらの生理的な指標の間に存在する因果関係を発見することで、患者の血圧に影響する生理的な指標（即ち、要素）を決定することができる。さらに、当該生理的な指標に影響し、或いは当該生理的な指標について対応する戦略を立てることで、患者の血圧を安定に保つことができる。

商品販売の分野において、目標商品（例えば、傘）の売上げに影響する要素を決定するために、外部要素データ（例えば、天気、季節、温度、日付、店舗の大きさなど）、当該商品の販売データ（例えば、当該商品の売上げ、当該商品の価格など）、及び１つ又は複数の関連商品（例えば、アイスクリーム）の販売データなどを収集してもよい。収集した各タイプのデータを１種の要素の観測値とする。これらの要素の間に存在する因果関係を発見することで、目標商品の売上げに影響する１つ又は複数の要素を決定することができる。さらに、当該１つ又は複数の要素の観測値を変更し、或いは当該１つ又は複数の要素について対応する戦略を立てることで、目標商品の売上げを増加させることができる。

ソフトウェア開発の分野において、故障率及び／又はソフトウェアの開発周期に影響する要素を決定するために、ソフトウェア開発の各種の要素の情報を収集してもよく、例えば、ソフトウェア開発の全体情報（例えば、開発周期、開発に投入されたリソースなど）及びソフトウェア開発の各々の段階の情報を含むが、これらに限定されない。ソフトウェア開発の各々の段階の情報は、例えばアーキテクチャ段階の情報（例えば、ソフトウェアアーキテクチャ方法、ソフトウェアアーキテクチャ階層の数など）、コーディング段階の情報（例えば、コード長、関数の数、プログラミング言語、モジュールの数など）、テスト段階の情報（例えば、ユニットテストの正確率又は故障率、ブラックボックステストの正確率又は故障率、ホワイトボックステストの正確率又は故障率など）、ソフトウェアの発行後の稼働段階の情報（例えば、稼働段階の正確率又は故障率など）を含んでもよい。収集した各タイプのデータを１種の要素の観測値とする。これらの要素の間に存在する因果関係を発見することで、ソフトウェアの開発周期及び／又は故障率に影響する１つ又は複数の要素を決定することができる。さらに、当該１つ又は複数の要素の観測値を変更し、或いは当該１つ又は複数の要素について対応する戦略を立てることで、ソフトウェアの開発周期及び／又は故障率を低下することができる。

いくつかの従来の解決手段は、主に、少ない要素（例えば、１００個以下の要素）を有するシステムについて、制約に基づく方法又はスコアに基づく方法で変数空間全体を検索して可能な因果関係を発見する。例えば、制約に基づく方法では、一般的に、複数の要素に条件付き独立性の検定を行うことで、それらの因果構造を発見する。しかしながら、検索する必要がある要素の数が多い場合に、条件付き独立性の検定の結果が不確実になる。また、因果構造の発見は、常に、何らかの要素を含まないから全ての他の要素を含むまでの条件集合を利用して任意の２つの要素の間の依存関係を検定する必要があるため、膨大な計算オーバーヘッドをもたらす。スコアに基づく方法では、一般的に、因果構造とサンプルデータとの間のマッチング度を判定するスコアを最適化することで因果構造を発見する。しかしながら、検索空間が指数関数以上の速度で増加するため、これらの解決手段は、常に、多くの要素（例えば、数百から千以上になる）についての因果構造（「高次元因果構造」とも呼ばれる）の発見に適用しにくい。

本開示の実施形態によれば、データ処理のための解決手段を提供する。該解決手段は、高次元因果構造の発見を迅速かつ正確に実現することができるため、上記問題及び／又は他の潜在的な問題を解決することができる。以下、上記例示的なシーンに合わせて本開示の各実施形態を詳細に説明する。これは単に説明することを目的とし、如何なる形態で本発明の範囲を制限するためではないと理解すべきである。

図１Ａは、本開示の実施形態に係る、データ処理用のシステム１００を示す例示的なブロック図である。システム１００は、例えば、複数の要素の間の因果関係を発見することができる。図１Ａに示すシステム１００は、本開示の実施形態における１種の例を実現するものに過ぎず、本開示の範囲を制限するためのものではないと理解すべきである。本開示の実施形態は、他のシステム又はアーキテクチャにも同様に適用される。

図１Ａに示すように、システム１００は、因果関係決定装置１２０を含んでもよい。因果関係決定装置１２０は、複数の要素に関する観測サンプル集合１１０を受信するとともに、その中から複数の要素の間の因果関係を指示する因果関係シーケンス１３０を決定することができる。好ましくは、いくつかの実施形態において、システム１００は、さらに複数の要素に関する観測サンプル集合１１０を採集するための観測サンプル採集装置（図１Ａにおいて未図示）を含んでもよい。観測サンプル採集装置は、観測サンプル集合１１０を取得するように、複数の要素の観測値をリアルタイムに採集し、或いは、定期的に又は不定期的に採集することができる。いくつかの実施形態において、観測サンプル採集装置は、それぞれ異なるタイプの要素の観測値を採集するための１つ又は複数の採集ユニットを含んでもよい。

観測サンプル集合１１０は、１つ又は複数の目標要素に関する複数の要素の観測サンプルを含んでもよい。観測サンプル集合１１０は、例えば、Ｘ＝｛ｘ_１，ｘ_２，．．．，ｘ_Ｄ｝∈Ｒ^Ｎ×Ｄとして示されてよく、ただし、Ｎは観測サンプル集合１１０における観測サンプルの総数を示し、Ｄは要素の総数を示し、観測サンプル集合１１０における各々の観測サンプルはＤ個の要素を有する１組の観測値を含む。本明細書において、Ｄ個の要素を有する集合は、Ｖ＝｛ｖ_１，ｖ_２，．．．，ｖ_Ｄ｝として示され、かつｖ_ｉ（ただし、１≦ｉ≦Ｄ）は、Ｄ個の要素におけるｉ番目の要素を示す。ベクトルｘ_ｉ∈Ｒ^Ｎ（ただし、１≦ｉ≦Ｄ）は、ｉ番目の要素のＮ個の観測値を示す。例えば、ｘ_ｉ，ｎ（ただし、１≦ｉ≦Ｄ、かつ１≦ｎ≦Ｎ）は、ｉ番目の要素のｎ番目の観測値を示す。

上記通信キャリアの顧客満足度に関するシーンを例とする場合に、例えば目標要素は「顧客満足度」であり、要素集合Ｖは、顧客属性に関連する要素（例えば、顧客レベル、顧客番号など）、顧客行為に関する要素（例えば、毎月に使用したネットの通信量、無料の通信量の比率、毎月に使用したネットの通信量の総額など）、顧客のフィードバックに関連する要素（例えば、クレーム数、顧客満足度）及び顧客について立てた戦略要素（例えば、パケットオーバーの提示回数、タイミングなど）における１種又は複数種などを含んでもよい。要素である「顧客レベル」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ人の顧客のレベルからなり、かつｘ_ｉ，ｎは、Ｎ人の顧客におけるｎ人目の顧客のレベルを示してもよい。要素である「毎月に使用したネットの通信量」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ人の顧客が毎月に使用したネットの通信量からなり、かつｘ_ｉ，ｎは、Ｎ人の顧客におけるｎ人目の顧客が毎月に使用したネットの通信量を示してもよい。因果関係シーケンス１３０は、例えば、顧客レベル、毎月に使用したネットの通信量、無料の通信量の比率、毎月に使用したネットの通信量の総額、顧客満足度などの要素の間の因果関係を指示し、例えば、目標要素である「顧客満足度」の原因がどの要素であるかを指示することができる。

上記患者の血圧に関連するシーンを例とする場合に、例えば、目標要素は「血圧」であり、要素集合Ｖは、心拍数、心拍出量、アレルギー指数、総末梢血管抵抗、カテコールアミンの放出、血圧などを含んでもよい。要素である「心拍数」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ人の患者の心拍数からなり、かつｘ_ｉ，ｎは、Ｎ人の患者におけるｎ人目の患者の心拍数を示してもよい。要素である「心拍出量」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ人の患者の心拍出量からなり、かつｘ_ｉ，ｎは、Ｎ人の患者におけるｎ人目の患者の心拍出量を示してもよい。因果関係シーケンス１３０は、例えば、心拍数、心拍出量、アレルギー指数、総末梢血管抵抗、カテコールアミンの放出、血圧などの要素の間の因果関係を指示し、例えば、目標要素である「血圧」の原因がどの要素であるかを指示することができる。

上記商品販売のシーンを例とする場合に、例えば、目標要素は「目標商品の売上げ」であり、要素集合Ｖは、外部要素（例えば、天気、季節、温度、日付、店舗の大きさなど）、目標商品（例えば、傘）の販売行為に関する要素（例えば、目標商品の売上げ、目標商品の価格など）、１つ又は複数の関連商品（例えば、アイスクリーム）の販売行為に関する要素（例えば、関連商品の売上げ、関連商品の価格など）及び目標商品についての販売戦略要素（例えば、プロモーションの回数、頻度など）における１種又は複数種を含んでもよい。要素である「温度」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ日の温度からなり、かつｘ_ｉ，ｎはｎ日目の温度を示してもよい。要素である「目標商品の売上げ」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ日の傘の売上げからなり、かつｘ_ｉ，ｎは、ｎ日目の傘の売上げを示してもよい。因果関係シーケンス１３０は、例えば、天気、季節、温度、日付、店舗の大きさ、目標商品の売上げ、目標商品の価格、関連商品の売上げ、関連商品の価格などの要素の間の因果関係を指示し、例えば、目標要素である「目標商品の売上げ」の原因がどの要素であるかを指示することができる。

上記ソフトウェア開発のシーンを例とする場合に、例えば、目標要素は、「ソフトウェアの開発周期」又は「ソフトウェアの稼働段階の故障率」であり、要素集合Ｖは、ソフトウェア開発の全体要素（例えば、開発周期、開発に投入されたリソースなど）及びソフトウェア開発の各々の段階の要素における１種又は複数種を含んでもよい。ソフトウェア開発の各々の段階の要素は、例えばアーキテクチャ段階の要素（例えば、ソフトウェアアーキテクチャ方法、ソフトウェアアーキテクチャ階層の数など）、コーディング段階の要素（例えば、コード長、関数の数、プログラミング言語、モジュールの数など）、テスト段階の要素（例えば、ユニットテストの正確率又は故障率、ブラックボックステストの正確率又は故障率、ホワイトボックステストの正確率又は故障率など）、ソフトウェアの発行後の稼働段階の要素（例えば、稼働段階の正確率、稼働段階の故障率など）を含んでもよい。要素である「開発周期」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ個のソフトウェア製品の開発周期からなり、かつｘ_ｉ，ｎは、ｎ個目のソフトウェア製品の開発周期を示してもよい。要素である「コード長」（即ち、ｖ_ｉ）を例とする場合に、ベクトルｘ_ｉは、Ｎ個のソフトウェア製品のコード長からなり、かつｘ_ｉ，ｎは、ｎ個目のソフトウェア製品のコード長を示す。因果関係シーケンス１３０は、例えば、ソフトウェアの開発周期、開発に投入されたリソース、アーキテクチャ方法、アーキテクチャ階層の数、コード長、関数の数、プログラミング言語、モジュールの数、ユニットテストの正確率又は故障率、ブラックボックステストの正確率又は故障率、ホワイトボックステストの正確率又は故障率、稼働段階の正確率、稼働段階の故障率などの要素の間の因果関係を指示する。例えば、目標要素である「開発周期」の原因がどの要素であるか、目標要素である「稼働段階の故障率」の原因がどの要素であるかを指示することができる。

図１Ａに示すように、因果関係決定装置１２０は、例えば、依存関係決定ユニット１２１及び因果関係決定ユニット１２２を含んでもよい。いくつかの実施形態において、依存関係決定ユニット１２１は、観測サンプル集合１１０に基づいて複数の要素の間に存在する依存関係集合を決定することができる。該依存関係集合における各依存関係は、複数の要素における互いに関連する１つの対応する要素ペアを指示する。いくつかの実施形態において、因果関係決定ユニット１２２は、依存関係決定ユニット１２１により決定された依存関係集合に基づいて、要素関係シーケンス１３０を決定することができる。要素関係シーケンス１３０は、依存関係が存在する要素ペアの間の因果関係を指示することができる（即ち、一方の要素が他方の要素の原因である）。

システム１００に含まれるこれらの装置及び／又は装置におけるユニットは、例示的なものにすぎず、本開示の範囲を制限するためのものではないと理解すべきである。システム１００は、さらに、示されない付加的な装置及び／又はユニットを含んでもよいと理解すべきである。例えば、いくつかの実施形態において、システム１００は、さらに、因果関係シーケンス１３０の態様を表すための因果関係表現装置（未図示）を含んでもよい。

いくつかの実施形態において、因果関係表現装置は、視覚や聴覚などの異なる形態で因果関係シーケンス１３０の態様を表現することができる。例えば、因果関係表現装置は、グラフ、マップ、テキストなどの形態で因果関係シーケンス１３０を表現することができる。いくつの実施形態において、因果関係表現装置は、因果関係シーケンス１３０の全ての態様、即ち、全ての要素の間の因果関係を表現することができる。代替的に、いくつかの実施形態において、因果関係表現装置は、因果関係シーケンス１３０の一部の態様のみを表現し、例えば、１つ又は複数の目標要素に関連する因果関係のみを表現することができる。いくつかの実施形態において、目標要素の原因が複数の要素を含む場合に、因果関係表現装置は、さらに、複数の要素の対応する重要程度を表現し、例えば、異なる色及び／又は異なる重要程度を示す数値などの形態で複数の要素の対応する重要程度を表現することができる。本開示の実施形態は、その態様について制限されない。

図１Ｂは、本開示の実施形態に係る、データ処理用のシステム１０５を示す例示的なブロック図である。システム１０５は、例えば、図１Ａに示すような因果関係シーケンス１３０を適用し、最適化することができる。図１Ｂに示すシステム１０５は、本開示の実施形態における１種の例を実現するものに過ぎず、本開示の範囲を制限するためのものではないと理解すべきである。本開示の実施形態は、他のシステム又はアーキテクチャにも同様に適用される。

図１Ｂに示すように、システム１０５は、観測サンプル影響装置１４０を含んでもよい。観測サンプル影響装置１４０は、因果関係シーケンス１３０に基づいて、複数の要素から目標要素の原因となる少なくとも１つの要素を決定することができる。観測サンプル影響装置１４０は、少なくとも１つの要素の観測値を変更することで目標要素の観測値に影響することにより、変更後の観測サンプル集合１５０を取得することができる。変更後の観測サンプル集合１５０における少なくとも１つの観測サンプルは、少なくとも１つの要素の変更後の観測値を含む。

上記通信キャリアの顧客満足度に関するシーンを例とする場合に、目標要素は、例えば、「顧客満足度」であり、因果関係シーケンス１３０は、例えば、目標要素である「顧客満足度」の原因がどの要素（例えば、パケットを使い切る前の提示、お得なパケットなど）であるかを指示することができる。観測サンプル影響装置１４０は、例えば、これらの要素の観測値に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、パケットを使い切る前に顧客についてより多くの提示を提供し、顧客についてより多くのお得なパケットを提供する）ことで、顧客の通信キャリアについての満足度を向上させることができる。

上記患者の血圧に関連するシーンを例とする場合に、目標要素は、例えば、「血圧」であり、因果関係シーケンス１３０は、例えば、目標要素である「血圧」の原因がどの生理的な指標であるかを指示することができる。観測サンプル影響装置１４０は、例えば、これらの生理的な指標に影響し、変更し、及び／又はこれらの生理的な指標について対応する戦略を立てることで、患者の血圧を安定に保つことができる。

上記商品販売のシーンを例とする場合に、目標要素は、例えば、「傘の売上げ」であり、因果関係シーケンス１３０は、例えば、目標要素である「傘の売上げ」の原因がどの要素（例えば、天気、販売される傘の数など）であるかを指示することができる。観測サンプル影響装置１４０は、例えば、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、雨が降るときに販売に供される傘の数を増やす）ことで、目標商品である傘の売上げを増加させることができる。

上記ソフトウェア開発のシーンを例とする場合に、目標要素は例えば「開発周期」であり、因果関係シーケンス１３０は、例えば、目標要素である「開発周期」の原因がどの要素（例えば、アーキテクチャ階層の数、プログラミング言語など）であるかを指示することができる。観測サンプル影響装置１４０は、例えば、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、ソフトウェアアーキテクチャの複雑度を低下し、よりフレンドリーなプログラミング言語を使用するなど）ことで、ソフトウェア開発の周期を短縮することができる。また、例えば、目標要素は「稼働段階のソフトウェアの故障率」であってもよく、因果関係シーケンス１３０は、例えば、目標要素である「稼働段階のソフトウェアの故障率」の原因がどの要素（例えば、コード長、モジュールの数など）であるかを指示することができる。観測サンプル影響装置１４０は、例えば、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、コード長を短くし、モジュールの数を減少するなど）ことで、稼働段階のソフトウェアの故障率を低下させることができる。

図１Ｂに示すように、システム１０５は、因果関係最適化装置１６０を含んでもよい。因果関係最適化装置１６０は、変更後の観測サンプル集合１５０に基づいて、因果関係シーケンス１３０を最適化することができるため、因果関係シーケンス１３０の正確性を高める。いくつかの実施形態において、因果関係最適化装置１６０は、変更後の観測サンプル集合１５０に基づいて、複数の要素の間の因果関係（例えば、因果関係決定装置１２０の実行過程に類似すること）を改めて発見することができるため、最適化後の因果関係シーケンスを取得する。この形態によれば、本開示の実施形態は、因果発見の正確性及びロバスト性を一層向上させることができる。

図１Ａに示す因果関係決定装置１２０、図１Ｂに示す観測サンプル影響装置１４０及び因果関係最適化装置１６０は、互いに分離されることが示されているが、これは説明を目的とすることにすぎず、本開示の範囲を限定するためではないと理解すべきである。いくつかの実施形態において、図１Ａに示す因果関係決定装置１２０、図１Ｂに示す観測サンプル影響装置１４０及び因果関係最適化装置１６０は、同一の物理装置或いは複数の異なる物理装置で実現されることができる。いくつかの実施形態において、図１Ａに示す因果関係決定装置１２０と図１Ｂに示す因果関係最適化装置１６０は、同一の装置として実現することができる。本開示の実施形態は、その態様について制限されない。

図２は、本開示の実施形態に係る、複数の要素の間の因果関係を決定するための模式図である。簡略化のため、かつ説明の便宜上、図２において、観測サンプル集合１１０に係る要素（即ち、観測変数）の数（即ち、Ｄ）が５であると仮定する。図２に示すように、観測サンプル集合１１０は、要素ｖ_１、ｖ_２、ｖ_３、ｖ_４及びｖ_５についての複数の観測サンプルを含む。依存関係決定ユニット１２１は、観測サンプル集合１１０に基づいて、要素ｖ_１、ｖ_２、ｖ_３、ｖ_４及びｖ_５の間に存在する依存関係集合を決定することができ、スケルトン図２１０として示される。例えば、依存関係集合２１０は、要素ｖ_１とｖ_２が互いに関連し、要素ｖ_２とｖ_４が互いに関連し、要素ｖ３とｖ４が互いに関連し、かつ要素ｖ_３とｖ_５が互いに関連することを指示する。因果関係決定ユニット１２２は、依存関係集合２１０に基づいて、要素ｖ_１、ｖ_２、ｖ_３、ｖ_４及びｖ_５の因果関係シーケンスを決定することができ、例えば、有向非巡回グラフ１３０として示される。例えば、因果関係シーケンス１３０は、要素ｖ_２が要素ｖ_１の原因であり（例えば、エッジｖ_２→ｖ_１で示される）、要素ｖ_２が要素ｖ_４の原因であり（例えば、エッジｖ_２→ｖ_４で示される）、要素ｖ_３が要素ｖ_４の原因であり（例えば、エッジｖ_３→ｖ_４で示される）、かつ要素ｖ_３が要素ｖ_５の原因である（例えば、エッジｖ_３→ｖ_５で示される）ことを指示する。

図３は、本開示の実施形態に係る、複数の要素の間の因果関係を決定するための方法３００のフローチャートである。例えば、方法３００は、図１Ａに示す因果関係決定装置１２０により実行されてもよい。方法３００は、さらに、示されない付加的な動作を含んでもよく、及び／又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。

ブロック３１０において、因果関係決定装置１２０は、複数の要素に関する観測サンプル集合（例えば、図１Ａ及び図２に示す観測サンプル集合１１０）を取得する。観測サンプル集合における１つの観測サンプルは、複数の要素の対応する観測値を含む。

ブロック３２０において、因果関係決定装置１２０（例えば、依存関係決定ユニット１２１）は、観測サンプル集合に基づいて複数の要素の間に存在する依存関係集合を決定する（例えば、図２に示すスケルトン図２１０）。依存関係集合における１つの依存関係は、複数の要素における互いに関連する１つの要素ペアを指示する。

いくつかの実施形態において、依存関係集合を決定するために、因果関係決定装置１２０は、複数の要素における任意の２つの要素の対応する観測値に基づいて、これらの２つの要素の間の相関係数を推定することができる。例えば、相関係数は、Ｓｐｅａｒｍａｎ相関係数又はＫｅｎｄａｌｌ相関係数のうちのいずれか１つであってもよい。推定された２つずつの要素の相関係数に基づいて、因果関係決定装置１２０は、相関係数行列Ｓを確立することができる。例えば、要素の総数がＤであると仮定すると、Ｓは、Ｄ×Ｄの行列である。行列Ｓにおけるｊ行目ｋ列目の要素がＳ_ｊｋであると仮定すると、Ｓ_ｊｋは、以下のように決定される。

ここで、

は、Ｄ個の要素におけるｊ番目の要素とｋ番目の要素とのＳｐｅａｒｍａｎ相関係数を示し、

は、Ｄ個の要素におけるｊ番目の要素とｋ番目の要素とのＫｅｎｄａｌｌの相関係数を示す。Ｓｐｅａｒｍａｎ相関係数及びＫｅｎｄａｌｌ相関係数の計算は、当業者に知られており、ここでは説明を省略する。また、任意の既知又は将来開発の方法又は手段を利用して２つの要素の間の相関係数を計算することができ、Ｓｐｅａｒｍａｎ相関係数及びＫｅｎｄａｌｌ相関係数に限定されるものではない。Ｓｐｅａｒｍａｎ相関係数及びＫｅｎｄａｌｌ相関係数は、相関係数の例に過ぎず、本開示の範囲を限定することを意図していないと理解すべきである。

いくつかの実施形態において、因果関係決定装置１２０は、推定された相関係数行列Ｓに基づいて、依存関係集合（即ち、スケルトン図２１０）を決定するための目標関数（本明細書において、「第１の目標関数」とも呼ばれる）を確立することができる。因果関係決定装置１２０は、第１の目標関数を最小化することで、依存関係集合を決定することができる。いくつかの実施形態において、例えば、因果関係決定装置１２０は、グラフィカルＬａｓｓｏアルゴリズムに基づいて、要素の間の対応する依存関係を示す精度行列Ωを学習することができる。例えば、Ωは、以下のように決定される。

ここで、

は、予め定義されている係数である。決定された行列Ωにおいて、ｊ行目ｋ列目の要素

が０であれば、Ｄ個の要素におけるｊ番目の要素とｋ番目の要素とが関連しないことを示し、要素

が０でなければ、Ｄ個の要素におけるｊ番目の要素とｋ番目の要素とが互いに関連する（必ずしも因果関係を有するとは限らない）ことを示す。行列Ｍで依存関係集合を示すと仮定すると、行列Ｍにおける要素

である。この形態によれば、因果関係決定装置１２０は、観測サンプル集合に基づいて、複数の要素の間の依存関係集合を決定することができ、図２におけるスケルトン図２１０に示すとおりである。以下では、「依存関係集合」と「スケルトン図」は、交換可能に使用される。

代替的に、いくつかの実施形態において、因果関係決定装置１２０は、複数の要素に条件付き独立性の検定を行うことで、依存関係集合Ｍを決定することができる。条件付き独立性の検定は、所定の条件集合において、２つの要素が互いに独立しているか否かを決定することができる。従来の条件付き独立性の検定において、２つの要素が独立しているか否かを判断する場合に、全ての他の要素の任意の組み合わせを上記条件集合とする必要がある。要素の数（即ち、Ｄ）が多い場合に、計算オーバーヘッドが非常に大きい。条件集合に多くの他の要素が含まれる場合に、上記２つの要素は、互いに独立していると決定されやすい。高次元因果構造の発見を迅速かつ正確に実現するために、いくつかの実施形態において、複数の要素に条件付き独立性の検定を行うことで、依存関係集合を決定する場合に、因果関係決定装置１２０は、条件集合における他の要素の数を１に制限することができる。この形態によれば、条件付き独立性の検定の計算オーバーヘッドを低減するだけでなく、互いに独立していると判定された要素ペアの数を低減することができるため、後続の因果関係シーケンスの発見に役立つ。

この形態によれば、依存関係集合を決定することで、本開示の実施形態は、検索対象の変数空間の大きさを減少させることにより、多くの要素の間の因果関係を迅速に発見することができる。

ブロック３３０において、因果関係決定装置１２０（例えば、因果関係決定ユニット１２２）は、依存関係集合に基づいて、複数の要素の因果関係シーケンスを決定する。因果関係シーケンスは、互いに関連する要素ペアにおける一方の要素が他方の要素の原因であることを指示することができる。

いくつかの実施形態において、因果関係シーケンスを決定するために、因果関係決定装置１２０は、依存関係集合により指示された複数の互いに関連する要素ペアについて、互いに関連する各要素ペアにおける一方の要素から他方の要素への影響を決定することができる。いくつかの実施形態において、各要素ペアにおける一方の要素から他方の要素への影響を決定するために、因果関係決定装置１２０は、所定の分布（例えば、ガウス分布又は他の分布）に基づいて、第２の目標関数を確立して、第２の目標関数を最小化することで、各要素ペアにおける一方の要素から他方の要素への影響を決定することができる。第２の目標関数は、例えば、以下の２つの要素に基づいて確立することができる。第１、発見された因果構造が観測データサンプルについて、良好なデータフィッティング度を持つようにし、第２、発見された因果構造が依然として疎であるようにする。

いくつかの実施形態において、要素の総数がＤであると仮定し、複数の要素ペアのそれぞれについて決定された影響を行列Ｂで示すと、Ｂは、以下のように決定される。

ここで、Ｘ＝｛ｘ_１，ｘ_２，．．．，ｘ_Ｄ｝∈Ｒ^Ｎ×Ｄは、観測サンプル集合を示し、Ｎは、Ｘにおける観測サンプルの総数を示し、Ｄは、要素の総数を示す。ベクトルｘ_ｉ∈Ｒ^Ｎ（ただし、１≦ｉ≦Ｄ）は、ｉ番目の要素（即ち、要素ｖ_ｉ）のＮ個の観測値を示す。ｘ_ｉ，ｎ（ただし、１≦ｉ≦Ｄ、かつ１≦ｎ≦Ｎ）は、ｉ番目の要素（即ち、要素ｖ_ｉ）のｎ番目の観測値を示す。ベクトル

は、要素ｖ_ｉについての各要素の対応する影響を示す。例えば、

であれば、要素ｖ_ｊが要素ｖ_ｉの直接的原因である可能性があることを示し、

であれば、要素ｖ_ｊが要素ｖ_ｉに影響しないことを示すため、要素ｖ_ｉの直接的原因である可能性がない。

は、行列Ｂにおける非ゼロ元素の総数を示し、因果構造の分散度についての推定であり、かつ

である。制約条件

は、決定しようとする因果構造が有向非巡回グラフであることを示し、かつ制約条件

は、決定しようとする因果構造が以前に決定されたスケルトン図Ｍ（例えば、図２に示すスケルトン図２１０）のサブ集合であることを示す。

いくつかの実施形態において、因果関係決定装置１２０は、複数の要素ペアについて決定された対応する影響と観測サンプル集合に基づいて、因果関係シーケンス１３０を決定することができる。例えば、図４は、本開示の実施形態に係る、因果関係シーケンスを決定するための方法４００のフローチャートである。方法４００は、図１Ａに示す因果関係決定装置１２０によって実行されてもよい。方法４００は、さらに、示されない付加的な動作を含んでもよく、及び／又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。

ブロック４１０において、因果関係決定装置１２０は、履歴因果関係シーケンスと履歴因果関係のスコアを取得することができる。ここでは、履歴因果関係シーケンスをＱ_Ｓで示し、履歴因果関係のスコアをｆ（Ｑ_Ｓ）で示すと仮定する。

いくつかの実施形態において、初期状況で、因果関係決定装置１２０は、履歴因果関係シーケンスを空シーケンスに初期化することができ、即ちＱ_Ｓ＝｛｝である。因果関係決定装置１２０は、空シーケンスに対応する初期因果関係のスコアを履歴因果関係のスコアとして決定することができ、即ち、

上記式（４）において、因果関係シーケンスが有向非巡回グラフＧ＝｛Ｖ，Ｅ｝で示されると仮定し、ただし、Ｖは、グラフＧにおける全てのノード（例えば、スケルトン図２１０におけるエッジを有する全てのノード）の集合を示し、Ｅは、グラフＧにおける全てのエッジの集合を示す。例えば、図２に示す例では、Ｖ＝｛ｖ_１，ｖ_２，ｖ_３，ｖ_４，ｖ_５｝である。

は、Ｖにおけるノード集合Ｕ以外の全てのノードを示す（即ち、

は、Ｖにおける

以外の全てのノードを示す）。

は、

のサポート集合を示し、即ち、ノード

の親ノード（即ち、要素

の潜在的原因を示すノード）の集合である。制約条件

は、集合

が集合

と集合

との集合のサブ集合を示し、集合

は、スケルトン図Ｍ（例えば、スケルトン図２１０）においてノード

とエッジを有するノードの集合を示す。例えば、図２に示す例では、ｆ（Ｑ_Ｓ）＝ｆ（｛｝）＝ＳＢＩＣ（ｖ_１｜ｖ_２）＋ＳＢＩＣ（ｖ_２｜（ｖ_１，ｖ_４））＋ＳＢＩＣ（ｖ_３｜（ｖ_４，ｖ_５））＋ＳＢＩＣ（ｖ_４｜（ｖ_２，ｖ_３））＋ＳＢＩＣ（ｖ_５｜ｖ_３）である。

ブロック４２０において、因果関係決定装置１２０は、履歴因果関係シーケンスＱ_Ｓと依存関係集合（例えば、スケルトン図２１０）により指示された複数の要素ペアに基づいて、因果関係シーケンスに追加する可能性がある１つ又は複数の候補要素を決定する。いくつかの実施形態において、１つ又は複数の候補要素は、候補ノード集合Ｖ＼Ｑ_Ｓに対応する全ての要素を含んでもよく、候補ノード集合Ｖ＼Ｑ_Ｓは、ノード集合Ｖにおける、Ｑ_Ｓに含まれるノード以外の全てのノードを示す。

１つ又は複数の候補要素が存在しなければ（即ち、集合Ｖ＼Ｑ_Ｓが空である）、ブロック４７０において、因果関係決定装置１２０は、履歴因果関係シーケンスＱ_Ｓを、決定された因果関係シーケンス１３０として出力することができる。

１つ又は複数の候補要素が存在すれば、ブロック４４０において、因果関係決定装置１２０は、１つ又は複数の候補要素に対応する１つ又は複数の候補因果関係のスコアを決定することができる。例えば、候補ノード集合Ｖ＼Ｑ_Ｓにおける各候補ノード

（即ち、

）について、それに対応する候補因果関係シーケンス

であり、かつ該候補因果関係シーケンスのスコアが

である。

ブロック４５０において、因果関係決定装置１２０は、決定された１つ又は複数の候補因果関係のスコアに基づいて、１つ又は複数の候補要素から因果関係シーケンスに追加しようとする候補要素を選択することができる。

いくつかの実施形態において、因果関係決定装置１２０は、１つ又は複数の候補因果関係のスコアから最小の候補因果関係のスコアを決定し、最小の候補因果関係のスコアに関連する候補要素を選択することで、因果関係シーケンス１３０に追加することができる。

付加的又は代替的に、いくつかの実施形態において、因果関係シーケンスをより迅速に決定するために、因果関係決定装置１２０は、決定待ちの因果関係シーケンスに関連する制約条件を取得することができる。

いくつかの実施形態において、因果関係決定装置１２０は、該制約条件を指示するエキスパート情報を取得し、取得されたエキスパート情報に基づいて該制約条件を決定することができる。図２に示す例を例とする場合に、エキスパート情報は、例えば、ノードｖ_３がノードｖ_４の前にあることを指示することができ、即ち、ノードｖ_３に対応する要素がノードｖ_４に対応する要素の原因である可能性があるが、ノードｖ_４に対応する要素がノードｖ_３に対応する要素の原因である可能性がない。

付加的又は代替的に、いくつかの実施形態において、因果関係決定装置１２０は、履歴因果関係シーケンスとスケルトン図２１０に指示された複数の互いに関連する要素ペアに基づいて、制約条件を決定することができる。例えば、図２に示す例において、現在のＱ_Ｓは、ノードｖ_３に対応する要素がノードｖ_４に対応する要素の原因であると仮定する（即ち、因果関係シーケンス１３０にエッジｖ_３→ｖ_４が存在する）。また、スケルトン図Ｍに基づいて、ノードｖ_１及びｖ_２が互いに関連し、ノードｖ_２及びｖ_４が互いに関連し、要素ｖ_３及びｖ_４が互いに関連し、要素ｖ_３及びｖ_５が互いに関連することを決定することができる。したがって、ノードｖ_１、ｖ_２及びｖ_４は、強連結ノード集合を構成し、ノードｖ_３及びｖ_５は、強連結ノード集合を構成する。この場合、例えば、因果関係決定装置１２０は、ノード集合｛ｖ_３，ｖ_５｝がノード集合｛ｖ_１，ｖ_２，ｖ_４｝の前にあることを決定することができる。即ち、ノード集合｛ｖ_３，ｖ_５｝におけるあるノードは、ノード集合｛ｖ_１，ｖ_２，ｖ_４｝におけるあるノードの原因である可能性があるが、ノード集合｛ｖ_１，ｖ_２，ｖ_４｝における任意のノードは、ノード集合｛ｖ_３，ｖ_５｝におけるあるノードの原因である可能性がない。

いくつかの実施形態において、決定待ちの因果関係シーケンスに関連する制約条件を取得することに応答して、因果関係決定装置１２０は、選択された候補要素の追加が取得された制約条件に合致するように、１つ又は複数の候補要素から因果関係シーケンスに追加しようとする候補要素を選択することができる。例えば、最小の候補因果関係のスコアに関連する候補要素の追加が該制約条件に違反する場合に、因果関係決定装置１２０は、他方の候補要素（例えば、次に小さい候補因果関係のスコアに関連する候補要素）を選択することにより、因果関係シーケンス１３０に追加することができる。

この形態によれば、制約条件を利用することで、因果関係シーケンスの決定過程において、候補要素の数を制限することにより、因果関係シーケンスをより迅速に決定することができる。

ブロック４６０において、候補要素が選択されることに応答して、因果関係決定装置１２０は、履歴因果関係シーケンスＱ_Ｓと履歴因果関係のスコアｆ（Ｑ_Ｓ）を更新することができる。例えば、因果関係決定装置１２０は、履歴因果関係シーケンスＱ_Ｓの代わりに、選択された候補要素に対応する候補因果関係シーケンスＱ_Ｓ’を利用し、履歴因果関係のスコアｆ（Ｑ_Ｓ）の代わりに、候補因果関係シーケンスＱ_Ｓ’に対応するスコアｆ（Ｑ_Ｓ’）を利用することができる。

いくつかの実施形態において、因果関係決定装置１２０は、全ての可能な候補要素が検索されるまで、方法４００におけるブロック４１０－４６０を繰り返して実行することができる（即ち、ブロック４７０までに実行する）。

図５は、本開示の実施形態に係る、目標要素の観測値に影響するための方法５００のフローチャートである。例えば、方法５００は、図１Ｂに示す観測サンプル影響装置１４０により実行されてもよい。いくつかの実施形態において、方法５００は、方法３００の後に実行されてもよい。方法５００は、さらに、示されない付加的な動作を含んでもよく、及び／又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。

ブロック５１０において、観測サンプル影響装置１４０は、因果関係シーケンスに基づいて、目標要素の原因となる少なくとも１つの要素を複数の要素から決定する。次に、ブロック５２０において、観測サンプル影響装置１４０は、少なくとも１つの要素の観測値を変更することで、目標要素の観測値に影響する。いくつかの実施形態において、例えば、観測サンプル影響装置１４０は、少なくとも１つの要素に影響し、変更し、及び／又は少なくとも１つの要素について対応する戦略を立てることで、目標要素の観測値に影響することができる。

上記通信キャリアの顧客満足度に関するシーンを例とする場合に、目標要素は、例えば、「顧客満足度」である。観測サンプル影響装置１４０は、因果関係シーケンス１３０に基づいて、目標要素である「顧客満足度」の原因がどの要素（例えば、パケットを使い切る前の提示、お得なパケットなど）であるかを決定することができる。観測サンプル影響装置１４０は、さらに、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、パケットを使い切る前に顧客についてより多くの提示を提供し、顧客についてより多くのお得なパケットを提供する）ことで、顧客の通信キャリアについての満足度を向上させることができる。

上記患者の血圧に関連するシーンを例とする場合に、目標要素は、例えば、「血圧」である。観測サンプル影響装置１４０は、因果関係シーケンス１３０に基づいて、目標要素である「血圧」の原因がどの生理的な指標であるかを決定することができる。観測サンプル影響装置１４０は、さらに、これらの生理的な指標に影響し、変更し、及び／又はこれらの生理的な指標について対応する戦略を立てることで、患者の血圧を安定に保つことができる。

上記商品販売のシーンを例とする場合に、目標要素は、例えば、「傘の売上げ」である。観測サンプル影響装置１４０は、因果関係シーケンス１３０に基づいて、目標要素である「傘の売上げ」の原因がどの要素（例えば、天気、販売される傘の数など）であるかを決定することができる。観測サンプル影響装置１４０は、さらに、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、雨が降るときに販売に供される傘の数を増やす）ことで、目標商品である傘の売上げを増加させることができる。

上記ソフトウェア開発のシーンを例とする場合に、目標要素は、例えば、「開発周期」である。観測サンプル影響装置１４０は、因果関係シーケンス１３０に基づいて、目標要素である「開発周期」の原因がどの要素（例えば、アーキテクチャ階層の数、プログラミング言語など）であるかを決定することができる。観測サンプル影響装置１４０は、さらに、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、ソフトウェアアーキテクチャの複雑度を低下し、よりフレンドリーなプログラミング言語を使用するなど）ことで、ソフトウェア開発の周期を短縮することができる。また、例えば、目標要素は、「稼働段階のソフトウェアの故障率」であってもよい。観測サンプル影響装置１４０は、因果関係シーケンス１３０に基づいて、目標要素である「稼働段階のソフトウェアの故障率」の原因がどの要素（例えば、コード長、モジュールの数など）であるかを決定することができる。観測サンプル影響装置１４０は、さらに、これらの要素に影響し、変更し、及び／又はこれらの要素について対応する戦略を立てる（例えば、コード長を短くし、モジュールの数を減少するなど）ことで、稼働段階のソフトウェアの故障率を低下させることができる。

図６は、本開示の実施形態に係る、因果関係を最適化するための方法６００のフローチャートである。例えば、方法６００は、図１Ｂに示す因果関係最適化装置１６０により実行されてもよい。いくつかの実施形態において、方法６００は、方法５００の後に実行されてもよい。方法６００は、さらに、示されない付加的な動作を含んでもよく、及び／又は示されているいくつかの動作を省略してもよいと理解すべきである。本開示の範囲は、その態様について制限されない。

ブロック６１０において、因果関係最適化装置１６０は、複数の要素に関する変更後の観測サンプル集合を取得する。いくつかの実施形態において、変更後の観測サンプル集合における少なくとも１つの観測サンプルは、少なくとも１つの要素（例えば、少なくとも１つの要素が目標要素の原因である）の変更後の観測値を含んでもよい。次に、ブロック６２０において、因果関係最適化装置１６０は、変更後の観測サンプル集合に基づいて、因果関係シーケンスを最適化することができる。いくつかの実施形態において、例えば、因果関係最適化装置１６０は、変更後の観測サンプル集合１５０に基づいて、複数の要素の間の因果関係（例えば、因果関係決定装置１２０の実行過程に類似すること）を改めて発見することができるため、最適化後の因果関係シーケンスを取得する。この形態によれば、本開示の実施形態は、因果発見の正確性及びロバスト性を一層向上させることができる。

図７は、本開示の実施形態を実施するのに適した例示的デバイス７００の概略ブロック図である。例えば、図１Ａに示す因果関係決定装置１２０、図１Ｂに示す観測サンプル影響装置１４０及び／又は因果関係最適化装置１６０は、デバイス７００により実施されてもよい。図に示すように、デバイス７００は、リードオンリーメモリ（ＲＯＭ）７０２に記憶されたコンピュータプログラム指令又は記憶ユニット７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたコンピュータプログラム指令に基づいて、様々な適切な動作及び処理を実行することができる中央プロセッシングユニット（ＣＰＵ）７０１を含む。ＲＡＭ７０３には、デバイス７００の操作に必要な様々なプログラム及びデータがさらに記憶されてよい。ＣＰＵ７０１、ＲＯＭ７０２、及びＲＡＭ７０３は、バス７０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インタフェース７０５もバス７０４に接続されている。

キーボード、マウスなどの入力ユニット７０６と、様々なタイプのディスプレイ、スピーカなどの出力ユニット７０７と、磁気ディスク、光ディスクなどの記憶ユニット７０８と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット７０９とを含むデバイス７００における複数のコンポーネントは、Ｉ／Ｏインタフェース７０５に接続されている。通信ユニット７０９は、デバイス７００がインターネットなどのコンピュータネットワーク及び／又は様々な電気通信ネットワークを介して他のデバイスと情報／データを交換することを許可する。

プロセッシングユニット７０１は、例えば、方法３００、４００、５００及び／又は６００である上記各々の過程及び処理を実行するように構成されている。例えば、いくつかの実施形態において、方法３００、４００、５００及び／又は方法６００は、記憶ユニット７０８のような機器読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてよい。いくつかの実施形態において、コンピュータプログラムの一部又は全ては、ＲＯＭ７０２及び／又は通信ユニット７０９を介してデバイス７００にロード及び／又はインストールされてよい。コンピュータプログラムがＲＡＭ７０３にロードされてＣＰＵ７０１により実行される場合、前述の方法３００、４００、５００及び／又は方法６００の１つ又は複数のステップを実行することができる。

本開示は、システム、方法及び／又はコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、本開示の様々な態様を実行するためのコンピュータ読み取り可能なプログラム指令が格納されているコンピュータ可読記憶媒体を含んでよい。

コンピュータ可読記憶媒体は、指令実行装置によって使用される指令を保持して記憶することができる物理装置であってもよい。コンピュータ可読記憶媒体は、例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置又は前述の任意の適切な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例（非網羅的リスト）は、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリスティック、フロッピー（登録商標）ディスク、指令が記憶されたパンチカード又は凹溝内の凸構造、及び前述の任意の適切な組み合わせなどの機器的符号化装置を含む。ここで使用されるコンピュータ可読記憶媒体は、無線電波や自由に伝播される他の電磁波、導波管や他の伝播媒体を介して伝播される電磁波（例えば、光ファイバーケーブルを介した光パルス）、又はワイヤを介して伝送される電子信号などの、一時的な信号自身として解釈されてはならない。

ここで説明されるコンピュータ読み取り可能なプログラム指令は、コンピュータ可読記憶媒体から様々な計算／処理デバイスにダウンロードするか、又はネットワーク、例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク及び／又は無線ネットワークを介して外部コンピュータ又は外部記憶装置にダウンロードすることができる。ネットワークは、銅の伝送ケーブル、光伝送ファイバー、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ及び／又はエッジサーバを含んでよい。各計算／処理デバイスにおけるネットワークアダプターカード又はネットワークインタフェースは、ネットワークからコンピュータ読み取り可能なプログラム指令を受信し、各計算／処理デバイスにおけるコンピュータ可読記憶媒体に記憶するために、該コンピュータ読み取り可能なプログラム指令を転送する。

本開示の操作を実行するためのコンピュータプログラム指令は、アセンブリ指令、命令セットアーキテクチャ（ＩＳＡ）指令、機器指令、機器依存指令、マイクロコード、ファームウェア指令、状態設定データ、或いは１種又は複数種のプログラミング言語の任意の組み合わせで書かれたソースコード又はターゲットコードであってもよく、前記プログラミング言語は、Ｓｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語、及び「Ｃ」言語又は類似のプログラミング言語などの従来の手続き型プログラミング言語を含む。コンピュータ読み取り可能なプログラム指令は、ユーザのコンピュータで完全に又は部分的に実行されてもよく、１つの独立したソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータで、部分的にリモートコンピュータで実行されてもよく、完全にリモートコンピュータ又はサーバで実行されてもよい。リモートコンピュータに関する場合、リモートコンピュータは、任意の種類のネットワーク（ローカルエリアネットワーク（ＬＡＮ）又はワイドエリアネットワーク（ＷＡＮ）を含む）を通じてユーザのコンピュータに接続されてもよく、（例えば、インターネットサービスプロバイダを利用してインターネットを通じて）外部コンピュータに接続されてもよい。いくつかの実施形態において、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）又はプログラマブルロジックアレイ（ＰＬＡ）を含む電子回路は、本開示の態様を実行するために、コンピュータ読み取り可能なプログラム指令の状態情報を利用して電子回路をカスタマイズすることにより、コンピュータ読み取り可能なプログラム指令を実行してよい。

ここで、本開示の実施形態に係る方法、装置（システム）及びコンピュータプログラム製品のフローチャート及び／又はブロック図を参照して本開示の各態様を説明する。フローチャート及び／又はブロック図の各ブロック及びフローチャート及び／又はブロック図における各ブロックの組み合わせの全ては、コンピュータ読み取り可能なプログラム指令によって実行され得ることを理解されたい。

これらのコンピュータ読み取り可能なプログラム指令は、汎用コンピュータ、専用コンピュータ又は他のプログラム可能なデータ処理装置のプロセッシングユニットに提供することができ、それによりマシンを作成して、これらの指令がコンピュータ又は他のプログラム可能なデータ処理装置のプロセッシングユニットによって実行されるときに、フローチャート及び／又はブロック図における１つ又は複数のブロックで規定した機能／動作を実現する装置を作成するようにする。これらのコンピュータ読み取り可能なプログラム指令をコンピュータ可読記憶媒体に記憶してもよく、これらの指令は、コンピュータ、プログラム可能なデータ処理装置及び／又は他のデバイスが決定方式で動作するようにし、それにより、指令が記憶されたコンピュータ読み取り可能な媒体は、フローチャート及び／又はブロック図における１つ又は複数のブロックで規定した機能／動作を実現する各態様の指令を含む、製品を含む。

コンピュータ読み取り可能なプログラム指令をコンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイスにローディングして、一連の操作ステップをコンピュータ、他のプログラム可能なデータ処理装置又は他のデバイスで実行することができるようにし、コンピュータによって実現されるプロセスを作成し、それにより、コンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイスで実行される指令がフローチャート及び／又はブロック図における１つ又は複数のブロックで規定した機能／動作を実現することができるようにする。

図面におけるフローチャート及びブロック図は、本開示の複数の実施形態に係るシステム、方法及びコンピュータプログラム製品の実現可能な実装アーキテクチャ、機能及び動作を示す。これに関して、フローチャート又はブロック図における各ブロックは、１つのモジュール、プログラムセグメント又は指令の一部を表すことができ、前記モジュール、プログラムセグメント又は指令の一部は、規定された論理機能を実現するための１つ又は複数の実行可能な指令を含む。いくつかの代替的な実現において、ブロックで表示された機能は、図面で表示された順序と異なる順序で発生することができる。例えば、連続して示された２つのブロックは、実際には、基本的に並行して実行される場合や、逆の順序で実行される場合があり、これは、関連する機能によって決定される。ブロック図及び／又はフローチャートにおける各ブロック、及びブロック図及び／又はフローチャートにおけるブロックの組み合わせは、規定された機能又は動作を実行する専用のハードウェアに基づくシステムによって実現されてもよく、専用のハードウェアとコンピュータ指令の組み合わせによって実現されてもよいことにも留意されたい。

以上、本開示の各実施形態を説明したが、以上の説明は、網羅的ではなく、例示的なものに過ぎず、開示された各実施形態に限定されない。当業者にとって、説明された各実施形態の範囲及び思想から逸脱することなく、多くの修正及び変更は明らかである。本明細書で使用される用語の選択は、各実施形態の原理、実際の応用又は市場における技術への改善を最もよく説明するか、当業者が本明細書で開示された各実施形態を理解することができるようにすることを意図する。

Claims

複数の要素に関する観測サンプル集合を取得することであって、前記観測サンプル集合における１つの観測サンプルは、前記複数の要素の対応する観測値を含むことと、
前記観測サンプル集合に基づいて、前記複数の要素の間に存在する依存関係集合を決定することであって、前記依存関係集合における１つの依存関係は、前記複数の要素における互いに関連する１つの要素ペアを指示することと、
前記依存関係集合に基づいて、前記複数の要素の因果関係シーケンスを決定することであって、前記因果関係シーケンスは、互いに関連する前記要素ペアにおける一方の要素が他方の要素の原因であることを指示することと、を含み、
前記依存関係集合を決定することは、
前記複数の要素における任意の２つの要素について、前記観測サンプル集合における前記２つの要素の対応する観測値に基づいて、前記２つの要素の間の相関係数を推定することと、
前記推定した結果に基づいて、前記依存関係集合を決定するための第１の目標関数を確立することと、
前記第１の目標関数を最小化することで、前記依存関係集合を決定することと、を含む
データ処理装置が実行するデータ処理方法。
前記複数の要素は、目標要素を含み、前記方法は、
前記因果関係シーケンスに基づいて、前記複数の要素から前記目標要素の原因となる少なくとも１つの要素を決定することと、
前記少なくとも１つの要素の観測値を変更することで、前記目標要素の観測値に影響することと、をさらに含む請求項１に記載の方法。
前記複数の要素に関する変更後の観測サンプル集合を取得することであって、前記変更後の観測サンプル集合における少なくとも１つの観測サンプルは、前記少なくとも１つの要素の変更後の観測値を含むことと、
前記変更後の観測サンプル集合に基づいて、前記因果関係シーケンスを最適化することと、をさらに含む請求項２に記載の方法。
前記因果関係シーケンスを決定することは、
前記依存関係集合によって指示された複数の互いに関連する要素ペアについて、各要素ペアにおける一方の要素から他方の要素への影響を決定することと、
複数の要素ペアについて決定された対応する影響及び前記観測サンプル集合に基づいて、前記因果関係シーケンスを決定することと、を含む請求項１に記載の方法。
各要素ペアにおける一方の要素から他方の要素への影響を決定することは、
所定の分布に基づいて、前記複数の要素ペアについて前記対応する影響を決定するための第２の目標関数を確立することと、
前記第２の目標関数を最小化することで、各要素ペアにおける一方の要素から他方の要素への影響を決定することと、を含む請求項４に記載の方法。
前記因果関係シーケンスを決定することは、
履歴因果関係シーケンス及び前記履歴因果関係シーケンスに対応する履歴因果関係のスコアを取得する操作と、
前記履歴因果関係シーケンス及び前記複数の要素ペアに基づいて、前記因果関係シーケンスに追加する可能性がある１つ又は複数の候補要素を決定する操作と、
前記１つ又は複数の候補要素が存在することに応答し、前記履歴因果関係のスコア、前記複数の要素ペアについて決定された前記対応する影響及び前記観測サンプル集合に基づいて、前記１つ又は複数の候補要素に対応する１つ又は複数の候補因果関係のスコアを決定する操作と、
前記１つ又は複数の候補因果関係のスコアに基づいて、前記１つ又は複数の候補要素から前記因果関係シーケンスに追加しようとする候補要素を選択する操作と、
選択された前記候補要素に基づいて、前記履歴因果関係シーケンス及び前記履歴因果関係のスコアを更新する操作と、を少なくとも１回繰り返して実行することを含む、請求項４に記載の方法。
前記１つ又は複数の候補要素が存在しないことに応答し、前記履歴因果関係シーケンスを前記因果関係シーケンスとして決定することをさらに含む、請求項６に記載の方法。
前記履歴因果関係シーケンス及び前記履歴因果関係のスコアを取得することは、
前記履歴因果関係シーケンスを空シーケンスに初期化することと、
前記空シーケンスに対応する初期因果関係のスコアを前記履歴因果関係のスコアとして決定することと、を含む請求項６に記載の方法。
前記１つ又は複数の候補要素から前記候補要素を選択することは、
前記１つ又は複数の候補因果関係のスコアから最小の候補因果関係のスコアを決定することと、
前記１つ又は複数の候補要素から前記最小の候補因果関係のスコアに関連する前記候補要素を選択することと、を含む請求項６に記載の方法。
前記１つ又は複数の候補要素から前記候補要素を選択することは、
決定待ちの前記因果関係シーケンスに関連する制約条件を取得することと、
前記候補要素の前記追加が前記制約条件に合致するように、前記１つ又は複数の候補要素から前記因果関係シーケンスに追加しようとする前記候補要素を選択することと、を含む請求項６に記載の方法。
前記制約条件を取得することは、
前記制約条件を指示する情報を取得することと、
前記情報に基づいて前記制約条件を決定することと、を含む請求項１０に記載の方法。
前記制約条件を取得することは、
前記履歴因果関係シーケンス及び前記複数の要素ペアに基づいて、前記制約条件を決定することを含む、請求項１０に記載の方法。
少なくとも１つのプロセッシングユニットと、
前記少なくとも１つのプロセッシングユニットに結合され、前記少なくとも１つのプロセッシングユニットが実行する指令を記憶する少なくとも１つのメモリと、を含むデータ処理装置であって、
前記指令が前記少なくとも１つのプロセッシングユニットにより実行される場合、前記装置に請求項１～１２のいずれか１項に記載の方法を実行させるデータ処理装置。
デバイスにより実行される場合、前記デバイスに請求項１～１２のいずれか１項に記載の方法を実行させる機器実行可能なコンピュータプログラム。