JP7355115B2 - 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品 - Google Patents

操作結果を予測する方法、電子機器、及びコンピュータプログラム製品 Download PDF

Info

Publication number
JP7355115B2
JP7355115B2 JP2021562849A JP2021562849A JP7355115B2 JP 7355115 B2 JP7355115 B2 JP 7355115B2 JP 2021562849 A JP2021562849 A JP 2021562849A JP 2021562849 A JP2021562849 A JP 2021562849A JP 7355115 B2 JP7355115 B2 JP 7355115B2
Authority
JP
Japan
Prior art keywords
observation
probability
result
determining
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021562849A
Other languages
English (en)
Other versions
JP2022536825A (ja
Inventor
チュンチェン リウ
ウェイ リー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2022536825A publication Critical patent/JP2022536825A/ja
Application granted granted Critical
Publication of JP7355115B2 publication Critical patent/JP7355115B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示の実施形態は、機械トレーニングの分野に関し、より具体的には、操作結果を予測する方法、電子機器、及びコンピュータプログラム製品に関する。
情報技術の急速な発展に伴い、データ規模も急激に増大している。このような背景や傾向の中で、機械トレーニングはますます広く注目されている。中でも、因果関係の推論は、医療・健康、教育、雇用、エコロジー等の各分野で基本的な問題となっている。このような因果推論の問題は、一般的に反事実の問題と呼ばれ、例えば、「この患者は、新薬を服用していたら、より長く生きられただろうか?」又は、「この学生は、教育訓練プログラムに参加していたら、より高いスコアが得られただろうか?」といった問題である。
各個体の因果効果(treatment effect)を予測する上での主な課題は、割り当てられた特定の処置に対して、事実の結果しか観測できず、対応する反事実の結果を観測することができず、反事実の結果がなければ真の因果効果を決定することが難しいということである。このため、観測されたデータから因果効果をより正確に予測する手法が求められている。
本開示の実施形態では、操作結果を予測するための解決手段を提供する。
本開示の第1の態様では、操作結果を予測する方法を提供する。該方法は、第1観測対象セットに第1操作が実行された第1観測結果セットを含む第1観測データセットに基づき、第1予測モデルを決定することを含む。第1予測モデルは、目標対象に第1操作が実行される場合の第1潜在結果を予測するためのものである。該方法はさらに、第1操作が実行された第1観測対象セットと、第1操作と異なる第2操作が実行された第2観測対象セットとに基づき、第1確率モデルを決定することを含む。第1確率モデルは、目標対象に第1操作及び第2操作が実行される確率を対応付けて決定するためのものである。該方法はさらに、第1観測データセットと、第1確率モデルとに基づき、第2予測モデルを決定することを含む。第2予測モデルは、第2観測対象セットに第1操作が実行される場合の結果を推定することにより、目標対象に第1操作が実行される場合の第2潜在結果を予測する。該方法はさらに、目標対象に第1操作が実行される場合の第1最終結果を予測するために、少なくとも第1予測モデル、第2予測モデル及び第1確率モデルを含む第1組合せを決定することを含む。
本開示の第2の態様では、操作結果を予測する方法を提供する。該方法は、目標対象に対し操作セットのうち1つの操作が実行されると決定したことに応じて、目標対象に対し第1操作が実行される場合の第1潜在結果を予測することを含む。該方法はさらに、目標対象に第1操作が実行される第1確率、及び、操作セットのうちの第2操作が目標対象に実行される第2確率を決定することと、を含む。第2操作は第1操作と異なる。該方法はさらに、第2操作が実行された観測対象に第1操作が実行される場合の結果を推定することにより、目標対象に第1操作が実行される場合の第2潜在結果を予測することを含む。該方法はさらに、第1潜在結果と、第2潜在結果と、第1確率と、第2確率とに少なくとも基づき、目標対象に第1操作が実行される場合の第1最終結果を予測することを含む。
本開示の第3の態様では、電子機器を提供する。該電子機器は、プロセッサと、プロセッサに結合され命令が記憶されているメモリとを備え、命令がプロセッサにより実行される場合、動作を実行する。該動作は、第1観測対象セットに第1操作が実行された第1観測結果セットを含む第1観測データセットに基づき、第1予測モデルを決定することと、第1操作が実行された1観測対象セットと、第1操作と異なる第2操作が実行された第2観測対象セットとに基づき、第1確率モデルを決定することと、第1観測データセットと、第1確率モデルとに基づき、第2予測モデルを決定することと、、目標対象に第1操作が実行される場合の第1最終結果を予測するために、少なくとも第1予測モデル、第2予測モデル及び第1確率モデルを含む第1組合せを決定することと、を含む。第1予測モデルは、目標対象に第1操作が実行される場合の第1潜在結果を予測するためのものであり、第1確率モデルは、目標対象に第1操作及び第2操作が実行される確率を対応付けて決定するためのものであり、第2予測モデルは、第2観測対象セットに第1操作が実行される場合の結果を推定することにより、目標対象に第1操作が実行される場合の第2潜在結果を予測する。
本開示の第4の態様では、電子機器を提供する。該電子機器は、プロセッサと、プロセッサに結合され命令が記憶されているメモリとを備え、命令がプロセッサにより実行された場合、動作を実行する。該動作は、目標対象に対し操作セットのうちの1つの操作が実行されると決定したことに応じて、目標対象に対し第1操作が実行される場合の第1潜在結果を予測することと、目標対象に第1操作が実行される第1確率、及び、操作セットのうちの第1操作と異なる第2操作が目標対象に実行される第2確率を決定することと、第2操作が実行された観測対象に第1操作が実行される場合の結果を推定することにより、目標対象に第1操作が実行される場合の第2潜在結果を予測することと、第1潜在結果と、第2潜在結果と、第1確率と、第2確率とに少なくとも基づき、目標対象に第1操作が実行される場合の第1最終結果を予測することと、を含む。
本開示の第5の態様では、コンピュータプログラム製品を提供する。コンピュータプログラム製品はコンピュータ可読媒体に有形記憶され、マシンが実行可能な命令が含まれる。マシンが実行可能な命令は、実行されると、第1の態様にかかる方法をマシンに実行させる。
本開示の第6の態様では、コンピュータプログラム製品を提供する。コンピュータプログラム製品はコンピュータ可読媒体に有形記憶され、マシンが実行可能な命令が含まれる。マシンが実行可能な命令は、実行されると、第2の態様にかかる方法をマシンに実行させる。
発明の概要部分は、概念に対する選択を簡略化して提示するためのものである。以下の実施形態において、これらについてさらに説明を行う。発明の概要部分の記述は、本開示の重要又は主要な特徴を示すことを意図したものではなく、本開示の範囲を限定することも意図していない。
図面と結び付けて、本開示の例示的な実施形態をさらに詳細に説明することにより、本開示の上記及び他の目的、特徴及び利点をさらに明らかにする。本開示の例示的な実施形態において、同一の参照符号は基本的に、同一部材を示す。図面の説明は以下のとおりである。
本開示の複数の実施形態を実現可能な例示的環境の模式図である。
本開示の実施形態にかかる、モデルを得るプロセスのフローチャートである。
本開示の実施形態にかかる、第2予測モデルを決定するためのプロセスのフローチャートである。
本開示の実施形態にかかる、操作結果を予測するプロセスのフローチャートである。
本開示の実施形態を実施可能な例示的デバイスのブロック図である。
以下、図面に示されたいくつかの例示的実施形態を参照して、本開示の原理を説明する。図面には本開示の好ましい実施形態が表されているが、理解すべき点として、これらの実施形態は、当業者が本開示をより適切に理解し実現できるようにするためのものにすぎず、本開示の範囲を何らかの形で限定するものではない。
本明細書で使用される用語「含む」及びその変形は、「…を含むが、これらに限定されない」という開放的な「含む」を表す。特に明記されていない限り、用語「又は」は、「及び/又は」を表す。用語「…に基づいて」は、「少なくとも部分的に基づいて」を表す。用語「1つの例示的実施形態」及び「1つの実施形態」は、「少なくとも1つの例示的実施形態」を表す。用語「他の実施形態」は、「少なくとも1つの他の実施形態」を表す。用語「第1」、「第2」等は、異なるか又は同一の対象を示すことができる。以下の文中ではさらに、その他の明確な定義及び暗黙の定義が含まれる可能性がある。
本開示の実施形態において、「処置割当メカニズム」という用語は、個体の特徴により決まるものであり、観測実験で研究される各個体に割り当てられる処置レベル(例えば、薬又は偽薬)を決定する潜在的な戦略を指す。本文では、処置はTを用いて表され、tの値を取る。例えば、2つの処置レベルしかない場合はt=0,1である。
本開示の実施形態では、「潜在結果」という用語は、指定された処置レベルtに個体を割り当てた場合の個体の結果を指し、Yで表す。例えば、2つの処置レベルt=0,1の場合、各個体には2つの潜在的結果Y及びYが存在する。3つの処置レベルt=0,1,2の場合、各個体には3つの潜在的結果Y、Y及びYが存在する。
本開示の実施形態では、「反事実」という用語は、可能性のある仮説的な結果を構築するために、過去に発生した事実を否定して、再度、特徴づけることを指す。例えば、介入群(treated group)(T=1)における個体の場合、潜在結果Yは観測された事実の結果であり、Yは観測されていない反事実の結果である。しかし、制御群(T=0)における個体の場合は、Yは観測された事実の結果であり、Yは観測されていない反事実の結果である。
Figure 0007355115000001
本開示の実施形態では、「共変量シフト」(covariate shift)という用語は、2つの異なる観測グループ(例えば、介入群と対照群)に存在する入力特性(共変量)の分布の変化を指す。この問題は、観測研究で頻繁に発生し、いわゆる「処置選択バイアス」問題につながる。
上述したように、実際に多くのシナリオでは、ある処置を個体が受けた結果と、異なる処置を個体が受けた結果の差異とを予測し、すなわち個体因果効果(ITE)を予測することにより、計算装置に自動的に意思決定を行わせ、又は人々の意思決定を支援して、ある個体に処置を実行するかどうか、又はある個体に複数の処置のうちどの処置を実行するかを決定できることが望まれている。例えば、ある薬又は治療法が患者の症状に及ぼす可能性のある影響を予測し、医師が治療計画を立てる際の自動化や支援を行うことが期待されている。また、トレーニングコースが学生の成績をどの程度向上させるかを予測し、又は広告宣伝が消費者の最終的な購買行動に与える影響を予測すること等も望まれている。このような予測をするためには、反事実の情報を知る必要がある。
反事実の情報を推定する1つ可能な方法は、ランダム化比較試験を行うことである。しかし、これらの試験は高価で時間がかかり、得られないことも多い。そのため、観測研究に基づいて予測を行う必要がある。観測研究では、介入群と対照群のデータの分布が未知であり、通常は異なる。このことは、観測データからITEを推定する際の「処置選択バイアス」の問題につながる。
従来、ITEを推定する方法は、回帰モデルをトレーニングすること、又はサンプルに再度重み付けを行って反事実の結果を推定することに焦点を当てており、最近傍探索、傾向スコア・マッチング(propensity score matching)、傾向スコア再度重み付け(propensity score reweighting)、並びにベイズ加法回帰木(BART)及びCausal Forestのようなツリー/フォレストベースの方法がある。ITE推定に関する最近の他の研究には、表現トレーニング法やガウスプロセスが含まれる。
表現トレーニング法では、まず表現トレーニング用のディープニューラルネットワーク(deep neural network)を構築して、特徴空間を表現空間にマッピングし、介入群と対照群の分布を新しい表現空間に移す必要がある。そして、他の2つの表現ベースのディープニューラルネットワークを用いて介入サンプルと対照サンプルの間で事実の結果を予測する際の誤差損失を、事実の結果の損失として求める。表現によって誘導された介入分布と対照分布との間の距離の尺度は、積分確率法(IPM:Integral Probability Metric)の距離として得られる。最後に、事実の結果の誤差損失とIPM距離の加重和を最小化する。
以上のITE推定方法にはいくつかの問題がある。従来の結果回帰法では、一般的に「処置選択バイアス」の問題が考慮されておらず、一方、再度重み付け法(Re-weighting method)では、有限サンプルの高い分散(High Variance)の影響を受ける可能性がある。表現トレーニング法は、無限のデータでも偏りがあり、処置レベルが2つだけの設定にしか適用できないため、処置レベルが多数存在する可能性のある実際の操作では使用が制限されてしまう。ガウスプロセスはサンプル数に対してO(N)という好ましくない計算量を持つことが知られており、この方法を大規模な観測研究に適用することは容易ではない。
本開示の実施形態によれば、操作結果を予測する解決手段が提供される。この解決手段では、まず、観測データに基づいて事実の結果のモデルと傾向スコアモデルを確立し、次に、事実の結果のモデルと傾向スコアモデルに基づいて反事実の結果のモデルを決定し、最後に、事実と反事実の結果のモデルの加重平均によって処置結果とITEを予測する。本開示の解決手段は、観測データの共変量シフトを補正し、推定される処置結果及びITEの精度を向上させるだけでなく、複数の処置レベルを有するシナリオにも拡張することができ、大規模な観測研究に容易に適用することができる。
以下、図面を参照しながら本開示の実施形態について具体的に説明する。
図1は、本開示の複数の実施形態を実現可能な例示的環境100の模式図を示す。該例示的環境100において、計算装置102は観測データセット101に基づきモデル103を生成する。該モデル103は、目標対象107に1つ又は複数の操作を実行した場合の最終結果と、個体因果効果ITEとを予測するためのものである。モデル103は、後で詳述する予測モデル及び確率モデル104を含むことができる。また、モデル103は、操作結果を予測するためにこれらのモデルの出力をどのように組み合わせるかを限定することができる。モデル103はさらにITE表現105を含むことができる。ITE表現105は、予測モデル及び確率モデル104の出力を組み合わせることにより、目標対象107に対して1つの操作を実行した場合の最終結果と、別の操作を実行した場合の最終結果との差異を予測する。本明細書では、こうした差異は目標対象107に対するITEとみなすことができる。
第1観測データセット110は、第1観測対象セット111に第1操作を実行した第1観測結果セット112を含み、第2観測データセット120は、第2観測対象セット121に第2操作を実行した第2観測結果セット122を含む。いくつかの実施形態において、観測データセット101はさらに第3観測データセット130を含むことができる。第3観測データセット130は、第3観測対象セット131に第3操作を実行した第3観測結果セット132を含む。本明細書の第1操作、第2操作及び第3操作は、互いに異なる。また、第1観測対象セット111、第2観測対象セット121及び第3観測対象セット131は、互いに異なる。ここで説明する第1操作、第2操作及び選択可能な第3操作は、対象に施す異なる処置であるとみなすことができる。以下の説明では、処置及び操作は、互いに互換的に使用することができる。
図1には第1観測データセット110、第2観測データセット120及び選択可能な第3観測データセット130のみが示されているが、理解すべき点として、本開示の実施形態は、処置レベルがもっと多い状況に適用することができるため、観測データセット101には、それぞれの対象に異なる操作が実行された観測データのセットがもっと多く含まれてもよい。
観測データセット101は、各研究対象に対する操作又は処置(T)、観測結果(Y)及び対象の特徴情報(X)を含む。2つの異なる処置がある場合、Tは二次元である。議論しやすいために、T=1で第1操作を表し(例えば、干渉群)、T=2で第2操作を表す(例えば、対照群)。第3操作がある場合、T=3で第3操作を表す。第1観測結果セット112及び第2観測結果セット122は、Yで表すことができる。また、Yは離散的であってもよいし、連続的であってもよい。第1観測対象セット111及び第2観測対象セット121はその特徴Xで表すことができ、特徴Xは、離散的又は連続的であり得る多数の前処理された変数を含むことができる。観測データセット101は、各分野の多数の観測研究から得られることができる。
計算装置106は、計算装置102が生成したモデル103及び目標対象107の特徴Xを取得し、モデル103に基づき予測結果108を提供することができる。予測結果108は、目標対象107に対しある操作を実行した場合の結果についての予測を含むことができ、さらに、目標対象107に対し2つの異なる操作を実行した場合の結果の差異についての予測、すなわちITEについての予測を含むことができる。
例を挙げると、医学研究において、操作又は処置Tは、患者にアスピリンを投与したかどうかを示し、結果Yは、患者の頭痛がなくなったかどうかを示す。特徴Xは、患者の年齢、性別、血圧等の情報を含むことができる。第1観測データセット110は、アスピリンを投与された複数の患者の特徴X、及び薬の投与後に頭痛がなくなったかどうかを含むことができる。第2観測データセット120は、アスピリンを投与されなかった複数の患者の特徴X、及び頭痛がなくなったかどうかを含むことができる。このような観測データに基づき、計算装置102はモデル103を生成することができる。また、計算装置106はモデル103を用いて、目標対象107がアスピリンを投与された場合と投与されなかった場合頭痛をなくせるかどうかを予測することができる。さらに、目標対象107がアスピリン治療を受けるべきかどうかを決定するために、又はそうした決定を支援するために、目標対象107に対するアスピリンの処置効果を予測することができる。
別の例として、操作又は処置Tは、消費者に製品を推奨したかどうかを示し、結果Yは、消費者が製品を購入したかどうかを示すことができる。また、特性Xは、消費者の収入、購入履歴等の情報を含むことができる。このシナリオでは、第1観測データセット110は、製品が推奨された消費者の特徴、及びその消費者が該製品を購入したかどうかを含むことができる。第2観測データセット120は、製品が推奨されなかった消費者の特徴、及びその消費者が該製品を購入したかどうかを含むことができる。同様に、計算装置106は、生成されたモデル103を用いて、目標対象107に対する製品宣伝の効果を予測し、それによって、目標対象107に製品宣伝を行うかどうかを決定するか、又はそうした決定を支援することができる。
本開示の実施形態で提供する解決手段をより明確に理解するために、図2を参照して本開示の実施形態をさらに説明する。図2は、本開示の実施形態にかかる、モデルを得るプロセス200のフローチャートを示す。プロセス200は、図1の計算装置102により実施することができる。説明の便宜上、図1と結びつけてプロセス200を説明し、T=1で第1操作を表し、T=2で第2操作を表し、T=tで任意の操作を表す。
ブロック210において、計算装置102は第1観測データセット110に基づき、第1予測モデルを決定する。第1観測データセット110は、第1観測対象セット111に第1操作を実行した第1観測結果セット112を含む。第1予測モデルは、目標対象107に第1操作を実行した場合の第1潜在結果を予測するためのものである。本明細書の第1予測モデルは、第1操作についての事実結果予測モデルと称されてもよい。
第1予測モデルは、任意の適切な方法、例えばニューラルネットワークによって決定することができる。いくつかの実施形態において、計算装置102は、第1観測対象セット111と第1観測結果セット112とに基づき、第1予測モデルを決定するための第1目標関数を確立することができ、さらに、第1目標関数を最小化することにより、第1予測モデルのモデルパラメータを決定することができる。
例えば、計算装置102は、ディープニューラルネットワークをトレーニングして、第1観測対象セット111(例えば、T=1の観測対象)における各観測対象の特徴Xについて対応する観測結果Yをモデル化して、所与のT=1及び特徴Xの状況でのYの条件付き期待値、すなわちE(Y|X,T=1)を得ることができる。ニューラルネットワークモデルが完全にトレーニングされた後、確立された第1予測モデル、すなわち第1操作についての事実結果のモデルは、式(1)のように示すことができる。
E(Y|X,T=1) (1)
いくつかの実施形態において、計算装置102はさらに第2観測データセット120に基づき、第2操作についての事実結果予測モデルを決定することができる。該モデルは本明細書では第4予測モデルとも称される。第4予測モデルは、目標対象107に第2操作を実行した場合の潜在結果を予測するためのものである。
第1予測モデルの決定と同様に、計算装置102はニューラルネットワークを用いて第4予測モデルを決定することができる。例えば、計算装置102はディープニューラルネットワークをトレーニングして、第2観測対象セット121(例えば、T=2)における各観測対象の特徴Xについて対応する観測結果Yをモデル化して、所与のT=2及び特徴Xの状況でのYの条件付き期待値、すなわちE(Y|X,T=2)を得ることができる。ニューラルネットワークモデルが完全にトレーニングされた後、確立された第4予測モデル、すなわち第2操作についての事実結果のモデルは、式(2)のように示すことができる。
E(Y|X,T=2) (2)
実際の操作では、ディープニューラルネットワークをトレーニングする際の計算量を減らすために、隠れ層の数を1又は2と設定し、全ての隠れ層の次元数を同じで且つ特徴量Xの次元より大きくし、学習率を候補セット{1.0,0.1,0.01,0.001,0.0001}とし、正則化パラメータを候補セット{0,1e-4,1e-2}とし、バッチサイズを64とし、繰り返し回数を10000とすることができる。そして機械学習アルゴリズムでよく用いられるトレーニング/テストの分割技術を用いて、候補セットから最適なパラメータを選択することができる。
理解すべき点として、以上のニューラルネットワークに関するトレーニング方法は概略的なもので本開示の範囲を限定する意図はない。さらに理解すべき点として、いかなるT=tの状況に対しても同様に、式(3)に示すように、観測されたデータに基づき、第tの操作についての事実結果予測モデルを決定することができる。
E(Y|X,T=t) (3)
また、他の方法で、任意の操作tについての事実結果予測モデルを決定してもよい。例えば、特徴Xの表現を学習し、特徴Xの表現空間でニューラルネットワークによる学習を行うことにより、操作tについての事実結果予測モデルを決定することができる。
ブロック220において、計算装置102は、第1操作が実行された第1観測対象セット111と、第1操作と異なる第2操作が実行された第2観測対象セット121とに基づき、第1確率モデルを決定する。該第1確率モデルは、目標対象107に第1操作及び第2操作が実行される確率を対応付けて決定するためのものである。
第3操作が存在する実施形態では、計算装置102は第1観測対象セット111と、第2観測対象セット121と、第3操作が実行された第3観測対象セット131とに基づき、第2確率モデルを決定することができる。該第2確率モデルは、目標対象107に第3操作が実行される確率を決定するためのものである。
Figure 0007355115000002
確率モデルの1つ実現形式として、傾向スコアモデルが挙げられる。計算装置102は、ディープニューラルネットワークを用い、特徴X(観測データセット101における各観測対象セット)について、処置又は操作Tをモデル化することにより、確率モデルを得ることができる。例えば、計算装置102は、ディープニューラルネットワークをトレーニングし、観測対象の特徴Xについて対応する操作Tをモデル化し、所与の特徴Xの状況で個体対象に第t操作が実行される条件付き確率を、確率モデル、すなわち式(4)として得ることができる。
Figure 0007355115000003
Figure 0007355115000004
この深層ニューラルネットワークを実際の応用においてトレーニングさせる場合、Tの値が離散的であるため、交差エントロピー損失を損失関数とし、隠れ層の数を1又は2とし、全ての隠れ層の次元数を特徴量Xの次元より大きく、学習率を候補セット{0.8,0.1,0.05,0.005,0.001}とし、正則化パラメータを0とし、バッチサイズを64とし、繰り返し回数を10000とすることができる。上述した事実結果予測モデルのためのディープニューラルネットワークのトレーニングと同様に、計算装置102はトレーニング/テストの分割技術を用いて、候補セットから最適なハイパーパラメータ(hyper parameter)を選択してもよい。
ブロック230において、計算装置102は第1観測データセット110と、ブロック220で決定された第1確率モデルとに基づき、第2予測モデルを決定する。第2予測モデルは、第2観測対象セット121に第1操作を実行した場合の結果を推定することにより、目標対象107に第1操作を実行した場合の潜在結果を予測する。
第3操作が存在する実施形態では、計算装置102はさらに、第1観測データセット110と、第1確率モデルと、第2確率モデルとに基づき、第3予測モデルを決定することができる。第3予測モデルは、第3観測対象セット131に第1操作を実行した場合の結果を推定することにより、目標対象107に第1操作を実行した場合の第3潜在結果を予測する。本明細書で説明する第2予測モデル及び第3予測モデルは、第1操作についての反事実結果予測モデルとみなすことができる。
この点について、図3は、本開示の実施形態にかかる、第2予測モデルを決定するためのプロセス300のフローチャートを示す。さらに図3と結びつけて、反事実の結果のモデルを決定する一般的なプロセスについて説明する。いくつかの実施形態において、プロセス300は、図2におけるブロック230の実施形式とみなすことができ、例えば図1に示す計算装置102によって実行することができる。理解すべき点として、プロセス300はさらに、図示されていない付加的ステップを含むことができ、且つ/又は示されたステップを省略することができる。本開示の範囲は、この点において制限されない。
ブロック310において、計算装置102は、ブロック220で決定された第1確率モデルと、第1観測対象セット111の数と、第2観測対象セット121の数とに基づき、サンプル重みを決定する。該サンプル重みは、第1観測対象セット111の分布に対する、第2観測対象セット121の分布の偏りを補正するためのものである。ここで決定されるサンプル重みは、重点サンプリング(importance sampling)の重みとみなすことができ、上述の共変量シフトの問題を補正するために使用され、また、その後の結果の予測にも使用される。
Figure 0007355115000005
Figure 0007355115000006
Figure 0007355115000007
続いて、計算装置102は決定されたサンプル重み(例えば、式(7))及び第1観測データセット110に基づき、第2予測モデル、すなわち第1操作についての反事実結果予測モデルを決定することができる。例えば、計算装置102は、移行学習技術を採用して第2予測モデルを決定してもよい。
ブロック320において、計算装置102はサンプル重みと、第1観測対象セット111と、第1観測結果セット112とに基づき、第2予測モデルを決定するための第2目標関数を確立する。
Figure 0007355115000008
Figure 0007355115000009
Figure 0007355115000010
以上、第1操作についての反事実結果予測モデル、すなわち第2予測モデル、及び可能な第3予測モデルを決定するプロセスを説明した。いくつかの実施形態において、計算装置102はさらに、同様に任意の第t操作(例えば、第2操作)について反事実結果予測モデルを決定してもよい。説明の便宜上、本明細書では第2操作についての反事実結果予測モデルを第5予測モデルと称する。例えば、計算装置102は、第2観測データセット120と、ブロック220で決定された第1確率モデルとに基づき、第5予測モデルを決定することができる。第5予測モデルは、第1観測対象セット111に第2操作を実行した場合の結果を推定することにより、目標対象107に第2操作を実行した場合の潜在結果を予測する。
Figure 0007355115000011
Figure 0007355115000012
対応するブロック320で説明したのと同様に、計算装置102は次に、サンプル重みと、第2観測対象セット121と、第2観測結果セット122とに基づき、第5予測モデルを決定するための目標関数を確立する。
Figure 0007355115000013
Figure 0007355115000014
第3操作が存在する実施形態では、さらに、第3操作が実行された第3観測対象セット131の第2操作についての反事実結果予測モデルを、式(13’)に示すように決定することができる。
Figure 0007355115000015
Figure 0007355115000016
Figure 0007355115000017
引き続き図2を参照すると、ブロック240において、計算装置102は、目標対象107に第1操作を実行した場合の第1最終結果を予測するために、少なくとも第1予測モデル、第2予測モデル及び第1確率モデルを含む第1組合せを決定する。例えば、計算装置102は式(1)、(4)及び(9)を用いて第1組合せを決定することができる。例えば、計算装置102は、所定の関係に基づき各予測モデル及び確率モデルの出力を組み合わせることができる。
まとめると、任意の第t操作に対し、特徴Xを有する目標対象107に該第t操作を実行した場合の最終結果は、次の式により予測することができる。
Figure 0007355115000018
目標対象107に第1操作を実行した場合の最終結果を予測するための第1組合せについて、上述の式(15)を次のように具体化することができる。
Figure 0007355115000019
2つの処置レベル(例えば、1及び2)しかない場合、第1組合せは次のように具体化することができる。
Figure 0007355115000020
また、3つの処置レベル(例えば、1、2及び3)がある場合、第1組合せは次のように具体化することができる。
Figure 0007355115000021
この方法により、計算装置102は、目標対象107に第1操作を実行した場合の最終結果を予測するための第1組合せを生成する。計算装置102は、計算装置106が予測結果及びITEを決定するために、上述した事実結果予測モデル、反事実結果予測モデル及び確率モデルをモデル103の一部分として提供することができる。
いくつかの実施形態において、計算装置102は、目標対象107に対して任意の第t操作を実行した場合の最終結果を予測するための組合せを生成することができる。例えば、計算装置102は、目標対象107に第2操作を実行した場合の第2最終結果を予測するために、上述した第4予測モデル、第5予測モデル及び確率モデルに基づいて第2組合せを決定することができる。
目標対象107に第2操作を実行した場合の最終結果を予測するための第2組合せについて、上述の式(15)を次のように具体化することができる。
Figure 0007355115000022
2つの処置レベルしかない場合、計算装置102は式(2)、(4)及び(13)を用いて第2組合せを決定することができる。式(17)と同様に、この場合、第2組合せを次のように具体化することができる。
Figure 0007355115000023
計算装置102は、上述の方法で決定された、目標対象107に第t操作を実行した場合の最終結果を予測するための組合せ、すなわち
Figure 0007355115000024
を提供し、ある操作又は処置が目標対象107に実行された場合の結果を予測することができる。いくつかの状況では、目標対象107に対し異なる処置又は操作が実行された場合の差異を予測することも期待されており、すなわちITEを予測することも期待されている。
いくつかの実施形態において、計算装置102は、目標対象107に第1操作を実行した場合の第1最終結果と、目標対象107に第2操作を実行した場合の第2最終結果との差異を予測するために、前記第1組合せと前記第2組合せとに基づき、差異表現を決定することができる。差異表現は、例えば、図1に示すITE表現105である。
Figure 0007355115000025
計算装置102は、予測モデル、確率モデル104及びITE表現105を含むがこれらに限定されないモデル103を、例えば計算装置106に提供することができる。モデル103に基づき、計算装置106は、目標対象107について、操作又は処置の結果及び個体因果効果のうちの少なくとも1つを予測することができる。例えば、計算装置106は、患者について、ある治療を行った場合と、該治療を行わなかった場合との差異を予測し、自動的に意思決定を行うか、又は医師若しくは患者の意思決定を支援することができる。
以上、本開示による、予測操作結果及びITEを得るためのモデルを説明した。該モデルは、処置結果及びITEを推定する精度を高めるだけでなく、複数の処置レベルを伴うシナリオにも拡張することができる。また、この解決手段は、大規模な観測研究にも容易に適用することができる。
図4は、本開示の実施形態にかかる、操作結果を予測するプロセス400のフローチャートを示す。プロセス400は、図1の計算装置106により実施することができる。説明の便宜上、図1と結び付けてプロセス400を説明する。
ブロック410において、計算装置106は、目標対象107に対し操作セットのうちの1つの操作を実行するかどうかを決定する。例えば、計算装置106は、目標対象107に関する特徴Xの入力(Xの値x)を受信すると、目標対象107に対し、ある操作が実行されようとしていると認識することができる。理解すべき点として、第1操作及び第2操作を説明する場合、複数の処置レベルを有する状況での任意の2つの操作を指すことができ、2つの処置レベルのみを有する状況に限定されない。
ブロック410において、目標対象107に対し操作セットのうちの1つの操作が実行されると決定した場合、プロセスはブロック420に進む。ブロック420において、計算装置106は、目標対象107に対し第1操作(t)を実行した場合の第1潜在結果を予測する。計算装置106は、上述したブロック210に関し説明した第1予測モデルを得て、該第1予測モデルに基づき第1潜在結果を予測することができる。例えば、式(3)を用いて、第1潜在結果E(Y|X=x,T=t)を得る。
Figure 0007355115000026
Figure 0007355115000027
ブロック450において、計算装置106は第1潜在結果と、第2潜在結果と、第1確率と、第2確率とに少なくとも基づき、目標対象107に第1操作を実行した場合の第1最終結果を予測する。例えば、計算装置106はブロック420、430及び440での計算を用いて、第1最終結果を決定することができる。例えば、2つの処置レベルを有する状況での第1最終結果は、次のように表すことができる。
Figure 0007355115000028
第3操作が存在する実施形態では、計算装置106は第1潜在結果と、第2潜在結果と、第3潜在結果と、第1確率と、第2確率と、第3確率とに基づき、第1最終結果を予測することができる。例えば、3つの処置レベルを有する状況での第1最終結果は、次のように表すことができる。
Figure 0007355115000029
いくつかの実施形態において、計算装置106は、目標対象107に第2操作を実行した場合の第4潜在結果を予測してもよい。これは例えば、上述した第4予測モデルに基づく。また、計算装置106は、第1操作が実行された観測対象に第2操作を実行した場合の結果を推定することにより、目標対象107に第2操作を実行した場合の第5潜在結果を予測することができる。これは例えば、上述した第5予測モデルに基づく。また、計算装置106はさらに第4潜在結果と、第5潜在結果と、対応する確率とに基づき、目標対象107に第2操作を実行した場合の第2最終結果を予測することができる。例えば、2つの処置レベルを有する状況での第2最終結果は、次のように表すことができる。
Figure 0007355115000030
3つの処置レベルを有する状況での第2最終結果は、次のように表すことができる。
Figure 0007355115000031
いくつかの実施形態において、計算装置106は、目標対象107に第1操作を実行した場合の第1最終結果と、目標対象107に第2操作を実行した場合の第2最終結果との差異を予測することができる。すなわち、第2操作に対する第1操作のITEを予測することができる。例えば、計算装置106は、ITE表現105に基づき、目標対象107について、第2操作tに対する第1操作tのITEを計算することができる。
Figure 0007355115000032
いくつかの実施形態において、計算装置106は(例えば、ユーザに対して)、予測した第1最終結果、第2最終結果及びITEのうちの少なくとも1つ(例えば、図1に示す予測結果108)を提供して、目標対象107に第1操作を実行するか第2操作を実行するか等をユーザが決定するのを支援することができる。
いくつかの実施形態において、計算装置106は、決定された差異(例えば、ITE)に基づき、第1操作及び第2操作の中から、目標対象107に実行する目標操作を決定することができる。計算装置106は、決定された差異に基づき目標操作を簡単に選択することができる。例えば、決定された差異により、ITEがプラスの効果又はポジティブな効果であると示された場合、計算装置106は、目標対象107に第1操作を実行すると決定することができる。計算装置106はさらに、他の要因を結合させて目標操作を選択することができる。例えば、第1操作と第2操作とのコストの差(例えば、時間コスト費用コスト)を結合させることができる。例を挙げると、ITEとコスト差の比が閾値の比より大きい場合、計算装置106は、目標対象107に第1操作を実行すると決定することができる。
プロセス200及びプロセス400は、2つの計算装置で実施されるものとして説明したが、理解すべき点として、本明細書で説明したプロセスは同一計算装置で実施してもよいし、分散式のコンピュータシステムで実施してもよい。本開示の範囲は、この点において制限されない。
以下、1つの具体的な例を説明する。ここで用いられるデータセットは、乳児健康開発プログラム(IHDP)に基づいた半シミュレーション研究からのものである。IHDPのデータは、実際のランダム化試験で得られた処置と特徴を有し、質の高い保育と家庭訪問が将来の認知テストのスコアに与える影響を研究したものである。該試験では、シミュレーション結果を用いることにより、真の因果効果を明らかにした。観測研究は、試験データから、介入群のサブセットを除外して行われた。データセットは747名の個体(介入群139名、対照群608名)で構成され、それぞれの個体は、子どもと母親の特徴を測った25の共変量で表される。
処置は、質の高い保育と、訓練を受けた提供者から家庭訪問を早産児が受けていたかどうかを表す。連続的な結果は、乳児の将来の認知テストのスコアを表す。この25の特徴には、子どもに関する測定値ー出生時の体重、頭囲、未熟児の出生週数、性別、双子の状態、現在の状態の測定値ー及び母親の出産時の年齢、婚姻状況、教育水準が含まれる。合計で、6つの連続共変量及び19のバイナリ共変量がある。
ブロック210に関し上述したステップにおいて、乳児の25の特徴が与えられた状況での1人の早産児について予測される将来の認知テストのスコアが得られる。
ブロック220に関し上述したステップでは、乳児の25の特徴に基づき、1人の早産児に関し質の高い保育と家庭訪問を受ける潜在確率の予測を得る。
ブロック230に関し上述したステップでは、質の高い保育と家庭訪問を受けた乳児に対し、こうした保育サービスを受けなかったと仮定した状況で予測される将来の認知テストのスコアを得る。また、質の高い保育と家庭訪問を受けなかった乳児に対し、このような保育サービスを受けたと仮定した状況で予測される将来の認知テストのスコアを得る。
最後に、以上のステップに基づき、早産児の将来の認知テストのスコアに対する、質の高い保育と、訓練を受けた提供者による家庭訪問の因果効果の推定を得ることができる。
上述した従来の方法、表現トレーニング法及び本開示の方法を用いて、上述のIHDPデータをトレーニングしITEを予測した。その結果、本開示の方法は非均一効果の推定精度(HEPE)及び二乗平均平方根誤差の面で、いずれも、従来の方法及び表現トレーニング法よりも優れていることが分かった。
以下、具体的な実施形態と結び付けて本開示の解決手段の実施について説明する。
医療分野では、同一の症状について、医師又は患者自身が複数の治療法又は方式から選択しなければならないことがある。例えば、ある薬を投与するかどうか、複数の薬の中から一つを選ぶか、又は複数の物理療法(赤外線療法、磁気療法等)の中から一つを選ぶか等、選択を行う必要がある。以下、説明を簡単にするために、治療法A、B、C等で表すこととする。治療法の選択は通常、医師の個人的な経験に基づいて行われるが、これは主観的な判断と経験に大きく依存している。医療機関では、同一症状の患者が、それぞれA、B、Cの治療を受けているという治療状況が一般的である(以下、観測データと称する)。
観測データは、過去の個々の患者の各種特徴、例えば年齢、体重、血圧、及び、症状に関する各検査データ等を含むことができる。また、これらの個々の患者の治療後の治療効果、例えば症状が消失したかどうか、治療後の生理学的パラメータ等を含むことができる。このような観測データを用いて、現在治療を受けようとしている対象患者に対するこれらの治療法の治療効果や、異なる治療法での効果の差異(例えばITE)を予測し、その対象患者の治療法を決定することが期待されている。しかし、このような観測データでは通常、上述の共変量シフトの問題が存在する。例えば、異なる治療法の間のコスト差により、個々の患者の経済状態の面で観測データに偏りが生じる可能性がある。このような共変量の偏り問題が考慮されなければ、得られる予測は客観的で正確なものにはならない。
本開示で提供される解決手段を用いて、共変量シフトに起因する問題を解決することができ、治療法A、B、Cについての対象患者の治療効果と、任意の2つの治療法の効果の差異を正確に予測することができる。予測された治療効果及び/又は効果の差異は、医師又は患者に提供し治療法の選択を支援することができる。追加で又は選択的に、計算装置は、上述したように、所定のルールに基づいて、自動的に治療法を決定してもよい。したがって、この方法により、患者にとってより適切で効果的な治療法の選択が可能になる。
教育分野では、学生が、具体的に設定された同種の複数のコース(例えば、「聞く」、「話す」、「読む」、「書く」の比率が異なる英語コース)から選択し、又は、教育機関が学生に対しより適したコースを推薦しなければならない場合がある。教育機関は通常、この方面の観測データを保有している。観測データは、以前にD、E、F等のコースを受講した学生の特徴、例えば年齢、性別、同様のコースの受講歴、家庭の経済状況等の情報や、対応するコースを受講した後の個々の学生のパフォーマンス、例えば試験の成績、受賞歴等を含むことができる。
このような観測データを用いて、現在コース選択中の学生の意思決定を支援し、又は、より適切なコースを学生に推薦することが期待されている。前述したように、観測データには通常、共変量シフトが存在するため、従来の予測方法では学生に正確かつ客観的にコースを推薦することができない。
本開示で提供される上記の解決手段を用いれば、共変量シフトの問題を解決することができ、コースD、E、Fについての対象学生のトレーニング効果、任意の2つのコース間の効果の差異を正確に予測することができる。予測されたトレーニング効果及び/又は効果の差異は、学生に提供して、コース選択を支援することができる。追加で又は選択的に、計算装置は上述のように、所定のルールに基づいて、より適切なコースを学生に推薦してもよい。例えば、コースDとEのITEがプラス又はポジティブな効果を示す場合、コースDを対象の学生に推薦することができる。したがって、この方法により、学生のためにより適切で有益なコースを選択することが可能になる。
図5は、本開示の実施形態を実施可能な例示的デバイス500のブロック模式図を示す。図に示すように、デバイス500は、中央処理ユニット(CPU)501を備える。CPU501は、リードオンリーメモリ(ROM)502に記憶されたコンピュータプログラムの命令、又は記憶ユニット508からランダムアクセスメモリ(RAM)503にロードされたコンピュータプログラムの命令に基づき、各種の適切な動作及び処理を実行することができる。RAM503にはさらに、デバイス500の操作に必要な各種プログラム及びデータを記憶することができる。CPU501、ROM502及びRAM503はバス504を介して互いに接続されている。入力/出力(I/O)ポート505もバス504に接続されている。
デバイス500における複数の部材は、I/Oポート505に接続されている。複数の部材には、キーボード、マウス等の入力ユニット506、様々な種類のディスプレイ、スピーカ等の出力ユニット507、磁気ディスク、光ディスク等の記憶ユニット508、及びネットワークインタフェースカード、モデム、無線通信送受信機等の通信ユニット509が含まれる。通信ユニット509によって、デバイス500は、インターネットのようなコンピュータネットワーク及び/又は各種電信ネットワークを介して、他のデバイスと情報/データを交換することができる。
中央処理ユニット501は、上述した各方法及び処理、例えばプロセス200、300、400のうちのいずれか1つを実行する。例えば、いくつかの実施形態において、プロセス200、300及び400は、コンピュータソフトウェアプログラム又はコンピュータプログラム製品として実現可能であり、記憶ユニット508のようなマシンで読み取り可能な媒体に、有形記憶されている。いくつかの実施形態において、コンピュータプログラムの一部又は全部は、ROM502及び/又は通信ユニット509を経由してデバイス500にロード及び/又はインストールすることができる。コンピュータプログラムがRAM503にロードされCPU501により実行されると、上述したプロセス200、300、400のうちのいずれか1つの1つ又は複数のステップを実行することができる。選択的に、その他の実施形態において、その他任意の適切な方法(例えば、ファームウェアを利用)によって、CPU501がプロセス200、300、400のうちのいずれか1つを実行するように設定してもよい。
本開示のいくつかの実施形態によれば、コンピュータ可読媒体が提供される。コンピュータ可読媒体には、コンピュータプログラムが記憶されており、該プログラムは、デバイスにより実行された場合、本開示の方法を実現する。
当業者が理解すべき点として、上述した本開示の方法の各ステップは、汎用の演算装置により実現することができ、それらを単一の演算装置に集中させるか、又は複数の演算装置からなるネットワークに分散させることができる。オプションとして、本開示の方法の各ステップは、演算装置が実行可能なプログラムコードを用いて実施することができるため、それらを記憶装置に記憶して演算装置により実行するか、それらを個別に各集積回路モジュールとして形成するか、又は、それらのうちの複数のモジュール若しくはステップを、単一の集積回路モジュールとして形成して実施することができる。このように、本開示は、何らかの特定のハードウェア及びソフトウェアの結合に限定されない。
理解すべき点として、上述の詳細な説明において、デバイスの複数の装置又はサブ的な装置に言及したが、こうした分割はあくまで例示的で非強制的なものである。実際には、本開示の実施形態に基づき、上述した2つ又はより多くの装置の特徴及び機能を、1つの装置において具現化することができる。逆に、上述した1つの装置の特徴及び機能を、複数の装置で具現化するようにさらに分割することができる。
以上で述べた内容は、本開示の好ましい実施形態にすぎず、本開示を限定するものではない。当業者にとって、本開示には各種の修正及び変更が存在し得る。本開示の精神及び原則において行われるあらゆる補正、等価置換、改良等は、いずれも本開示の保護範囲内に含まれるべきである。

Claims (12)

  1. コンピュータが、目標対象に操作が実行される場合の操作結果を予測する方法であって、
    複数の特徴情報によって表現される複数の観測対象に対して、第1操作が実行された第1観測対象セットを抽出することと、
    前記複数の観測対象に対して、前記第1操作と異なる第2操作が実行された第2観測対象セットを抽出することと、
    前記第1観測対象セットと、前記第1観測対象セット前記第1操作が実行された結果である第1観測結果セットを含む第1観測データセットに基づき、第1予測モデルを決定することと、
    前記複数の観測対象を表現する前記複数の特徴情報に対して、前記第1操作が実行される条件付き確率、及び、前記第2操作が実行される条件付き確率を含む第1確率モデルを決定することと、
    前記第1観測データセットと、前記第1確率モデルとに基づき、第2予測モデルを決定することと、
    少なくとも前記第1予測モデル、前記第2予測モデル及び前記第1確率モデルを含む第1組合せを決定し、前記複数の特徴情報によって表現される前記目標対象に前記第1操作が実行される場合の第1最終結果を前記第1組合せに基づいて予測すことと
    を含み、
    前記第1予測モデルは、前記目標対象に前記第1操作が実行される場合の第1潜在結果を予測するためのものであり、
    前記第1確率モデルは、前記目標対象に前記第1操作が実行される確率及び前記第2操作が実行される確率を対応付けて決定するためのものであり、
    前記第2予測モデルは、前記第2観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第2潜在結果を予測
    前記第2予測モデルを決定することは、
    前記第1確率モデルと、前記第1観測対象セットの数と、前記第2観測対象セットの数とに基づき、第1サンプル重みを決定することと、
    前記第1サンプル重みと、前記第1観測データセットとに基づき、前記第2予測モデルを決定することと
    を含み、
    前記第1サンプル重みは、前記第1観測対象セットの分布に対する、前記第2観測対象セットの分布の偏りを補正するためのものである、
    操作結果を予測する方法。
  2. 前記複数の観測対象に対して、前記第1操作及び前記第2操作と異なる第3操作が実行された第3観測対象セットを抽出することと、
    前記第1観測対象セット、前記第2観測対象セット及び記第3観測対象セットに基づき、前記複数の観測対象を表現する前記複数の特徴情報に対して、前記第3操作が実行される条件付き確率を含む第2確率モデルを決定することと、
    前記第1観測データセットと、前記第1確率モデルと、前記第2確率モデルとに基づき、第3予測モデルを決定することと
    をさらに含み、
    前記第2確率モデルは、前記目標対象に前記第3操作が実行される確率を決定するためのものであり、
    前記第3予測モデルは、前記第3観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第3潜在結果を予測し、
    前記第3予測モデルを決定することは、
    前記第2確率モデルと、前記第1観測対象セットの数と、前記第3観測対象セットの数とに基づき、第2サンプル重みを決定することと、
    前記第2サンプル重みと、前記第1観測データセットとに基づき、前記第3予測モデルを決定することと
    を含み、
    前記第1組合せに基づいて予測することは、前記第1予測モデル、前記第2予測モデル、前記第3予測モデル、前記第1確率モデル及び前記第2確率モデルの出力を組み合わせて第1組合せを決定することを含む、
    請求項1に記載の方法。
  3. 前記第1予測モデルを決定することは、
    前記第1観測対象セットと、前記第1観測結果セットとに基づき、前記第1予測モデルを決定するための第1目標関数を確立することと、
    前記第1目標関数を最小化することにより、前記第1予測モデルのモデルパラメータを決定することと
    を含む、
    請求項1に記載の方法。
  4. 第2観測データセットに基づき、第4予測モデルを決定することと、
    前記第2観測データセットと、前記第1確率モデルとに基づき、第5予測モデルを決定することと、
    少なくとも前記第4予測モデル、前記第5予測モデル及び前記第1確率モデルを含む第2組合せを決定し、前記複数の特徴情報によって表現される前記目標対象に前記第2操作が実行される場合の第2最終結果を前記第2組合せに基づいて予測することと
    をさらに含み、
    前記第2観測データセットは、前記第2観測対象セットと、前記第2観測対象セットに前記第2操作が実行された結果である第2観測結果セットを含み、
    前記第4予測モデルは、前記目標対象に前記第2操作が実行される場合の第4潜在結果を予測するためのものであり、
    前記第5予測モデルは、前記第1観測対象セットに前記第2操作が実行される場合の結果を推定することにより、前記目標対象に前記第2操作が実行される場合の第5潜在結果を予測
    前記第5予測モデルを決定することは、
    前記第1確率モデルと、前記第1観測対象セットの数と、前記第2観測対象セットの数とに基づき、第3サンプル重みを決定することと、
    前記第3サンプル重みと、前記第2観測データセットとに基づき、前記第5予測モデルを決定することと
    を含み、
    前記第3サンプル重みは、前記第2観測対象セットの分布に対する、前記第1観測対象セットの分布の偏りを補正するためのものである、
    請求項1に記載の方法。
  5. コンピュータが、目標対象に操作が実行される場合の操作結果を予測する方法であって、
    目標対象に対し操作セットのうちの1つの操作が実行されると決定したことに応じて、前記目標対象に対し前記操作セットのうちの第1操作が実行される場合の第1潜在結果を予測することと、
    前記目標対象に前記第1操作が実行される第1確率、及び、前記操作セットのうちの前記第1操作と異なる第2操作が前記目標対象に実行される第2確率を決定することと、
    前記第2操作が実行された第2観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第2潜在結果を予測することと、
    前記第1潜在結果と、前記第2潜在結果と、前記第1確率と、前記第2確率とに少なくとも基づき、前記目標対象に前記第1操作が実行される場合の第1最終結果を予測することと、
    を含
    前記第1潜在結果を予測することは、
    複数の特徴情報によって表現される複数の観測対象に対して、前記第1操作が実行された第1観測対象セットを抽出することと、
    前記第1観測対象セットと、前記第1観測対象セットに前記第1操作が実行された結果である第1観測結果セットとを含む第1観測データセットに基づき、第1予測モデルを決定することと、
    前記第1予測モデルに基づき、前記第1潜在結果を予測することと
    を含み、
    前記第1確率及び前記第2確率を決定することは、
    前記複数の特徴情報によって表現される前記複数の観測対象に対して、前記第2操作が実行された第2観測対象セットを抽出することと、
    前記複数の観測対象を表現する前記複数の特徴情報に対して、前記第1操作が実行される条件付き確率である前記第1確率、及び、前記第2操作が実行される条件付き確率である前記第2確率を含む第1確率モデルを得ることと
    を含み、
    前記第2潜在結果を予測することは、
    前記第1観測データセットと、前記第1確率モデルと、に基づき決定される第2予測モデルを得ることと、
    前記第2予測モデルに基づき、前記第2潜在結果を予測することと
    を含み、
    前記第1確率モデルは、前記目標対象に前記第1操作及び前記第2操作が実行される確率を対応付けて決定するためのものであり、
    前記第2予測モデルは、前記第2観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第2潜在結果を予測するものであり、
    前記第1最終結果を予測することは、
    前記第1潜在結果に前記第1確率を乗じた値と、前記第2潜在結果に前記第2確率を乗じた値と、の合計を算出することを含む、
    操作結果を予測する方法。
  6. 前記操作セットはさらに、前記第1操作及び前記第2操作と異なる第3操作を含み、
    前記方法は、
    前記目標対象に前記第3操作が実行される第3確率を決定することと、
    前記第3操作が実行された第3観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第3潜在結果を予測することと
    をさらに含み、
    前記第3確率を決定することは、
    前記複数の特徴情報によって表現される前記複数の観測対象に対して、前記第3操作が実行された第3観測対象セットを抽出することと、
    前記第1観測対象セット、前記第2観測対象セット及び前記第3観測対象セットに基づき、前記複数の観測対象を表現する前記複数の特徴情報に対して、前記第3操作が実行される条件付き確率を含む第2確率モデルを得ることと、
    前記第2確率モデルに基づき、前記第3確率を決定することと
    を含み、
    前記第3潜在結果を予測することは、
    前記第1観測データセットと、前記第1確率モデルと、前記第2確率モデルとに基づき決定される第3予測モデルを得ることと、
    前記第3予測モデルに基づき、前記第3潜在結果を予測することと
    を含み、
    前記第2確率モデルは、前記目標対象に前記第3操作が実行される確率を決定するためのものであり、
    前記第3予測モデルは、前記第3観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第3潜在結果を予測するものであり、
    前記第1最終結果を予測することは、
    前記第1潜在結果に前記第1確率を乗じた値と、前記第2潜在結果に前記第2確率を乗じた値と、前記第3潜在結果に前記第3確率を乗じた値と、の合計を算出することを含む、
    請求項に記載の方法。
  7. 前記目標対象に前記第2操作が実行される場合の第4潜在結果を予測することと、
    前記第1操作が実行された前記第1観測対象セットに前記第2操作が実行される場合の結果を推定することにより、前記目標対象に前記第2操作が実行される場合の第5潜在結果を予測することと、
    前記第4潜在結果と、前記第5潜在結果と、前記第1確率と、前記第2確率とに少なくとも基づき、前記目標対象に前記第2操作が実行される場合の第2最終結果を予測することと
    をさらに含
    前記第4潜在結果を予測することは、
    前記第2観測対象セットと前記第2観測対象セットに前記第2操作が実行された第2観測結果セットとを含む第2観測データセットに基づき決定される第4予測モデルを得ることと、
    前記第4予測モデルに基づき、前記第4潜在結果を予測することと
    を含み、
    前記第5潜在結果を予測することは、
    前記第2観測データセットと、前記第1確率モデルとに基づき決定される第5予測モデルを得ることと、
    前記第5予測モデルに基づき、前記第5潜在結果を予測することと
    を含み、
    前記第2最終結果を予測することは、
    前記第4潜在結果に前記第2確率を乗じた値と、前記第5潜在結果に前記第1確率を乗じた値と、の合計を算出することを含む、
    請求項に記載の方法。
  8. 前記目標対象に前記第1操作が実行される場合の前記第1最終結果と、前記目標対象に前記第2操作が実行される場合の前記第2最終結果との差異を予測することをさらに含む、
    請求項に記載の方法。
  9. プロセッサと、
    プロセッサに結合され命令が記憶されているメモリと
    を備え、
    前記命令がプロセッサにより実行される場合、動作を行い、
    前記動作は、
    複数の特徴情報によって表現される複数の観測対象に対して、第1操作が実行された第1観測対象セットを抽出することと、
    前記複数の観測対象に対して、前記第1操作と異なる第2操作が実行された第2観測対象セットを抽出することと、
    前記第1観測対象セットと、前記第1観測対象セット前記第1操作が実行された結果である第1観測結果セットを含む第1観測データセットに基づき、第1予測モデルを決定することと、
    前記複数の観測対象を表現する前記複数の特徴情報に対して、前記第1操作が実行される条件付き確率、及び、前記第2操作が実行される条件付き確率を含む第1確率モデルを決定することと、
    前記第1観測データセットと、前記第1確率モデルとに基づき、第2予測モデルを決定することと、
    少なくとも前記第1予測モデル、前記第2予測モデル及び前記第1確率モデルを含む第1組合せを決定し、前記複数の特徴情報によって表現される目標対象に前記第1操作が実行される場合の第1最終結果を前記第1組合せに基づいて予測することと
    を含み、
    前記第1予測モデルは、前記目標対象に前記第1操作が実行される場合の第1潜在結果を予測するためのものであり、
    前記第1確率モデルは、前記目標対象に前記第1操作が実行される確率及び前記第2操作が実行される確率を対応付けて決定するためのものであり、
    前記第2予測モデルは、前記第2観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第2潜在結果を予測
    前記第2予測モデルを決定することは、
    前記第1確率モデルと、前記第1観測対象セットの数と、前記第2観測対象セットの数とに基づき、第1サンプル重みを決定することと、
    前記第1サンプル重みと、前記第1観測データセットとに基づき、前記第2予測モデルを決定することと
    を含み、
    前記第1サンプル重みは、前記第1観測対象セットの分布に対する、前記第2観測対象セットの分布の偏りを補正するためのものである、
    電子機器。
  10. プロセッサと、
    プロセッサに結合され命令が記憶されているメモリと
    を備え、
    前記命令がプロセッサにより実行される場合、動作を行い、
    前記動作は、
    目標対象に対し操作セットのうちの1つの操作が実行されると決定したことに応じて、前記目標対象に対し前記操作セットのうちの第1操作が実行される場合の第1潜在結果を予測することと、
    前記目標対象に前記第1操作が実行される第1確率、及び、前記操作セットのうちの前記第1操作と異なる第2操作が前記目標対象に実行される第2確率を決定することと、
    前記第2操作が実行された第2観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第2潜在結果を予測することと、
    前記第1潜在結果と、前記第2潜在結果と、前記第1確率と、前記第2確率とに少なくとも基づき、前記目標対象に前記第1操作が実行される場合の第1最終結果を予測することと
    を備え、
    前記第1潜在結果を予測することは、
    複数の特徴情報によって表現される複数の観測対象に対して、前記第1操作が実行された第1観測対象セットを抽出することと、
    前記第1観測対象セットと、前記第1観測対象セットに前記第1操作が実行された結果である第1観測結果セットとを含む第1観測データセットに基づき、第1予測モデルを決定することと、
    前記第1予測モデルに基づき、前記第1潜在結果を予測することと
    を含み、
    前記第1確率及び前記第2確率を決定することは、
    前記複数の特徴情報によって表現される前記複数の観測対象に対して、前記第2操作が実行された第2観測対象セットを抽出することと、
    前記複数の観測対象を表現する前記複数の特徴情報に対して、前記第1操作が実行される条件付き確率である前記第1確率、及び、前記第2操作が実行される条件付き確率である前記第2確率を含む第1確率モデルを得ることと
    を含み、
    前記第2潜在結果を予測することは、
    前記第1観測データセットと、前記第1確率モデルと、に基づき決定される第2予測モデルを得ることと、
    前記第2予測モデルに基づき、前記第2潜在結果を予測することと
    を含み、
    前記第1確率モデルは、前記目標対象に前記第1操作及び前記第2操作が実行される確率を対応付けて決定するためのものであり、
    前記第2予測モデルは、前記第2観測対象セットに前記第1操作が実行される場合の結果を推定することにより、前記目標対象に前記第1操作が実行される場合の第2潜在結果を予測するものであり、
    前記第1最終結果を予測することは、
    前記第1潜在結果に前記第1確率を乗じた値と、前記第2潜在結果に前記第2確率を乗じた値と、の合計を算出することを含む、
    電子機器。
  11. コンピュータ可読媒体に有形記憶され、前記コンピュータに読み込まれて実行されると請求項1~のいずれか1項に記載の方法を前記コンピュータに実行させる、前記コンピュータが実行可能な命令が含まれる
    コンピュータプログラム製品。
  12. コンピュータ可読媒体に有形記憶され、前記コンピュータに読み込まれて実行されると請求項のいずれか1項に記載の方法を前記コンピュータに実行させる、前記コンピュータが実行可能な命令が含まれる
    コンピュータプログラム製品。
JP2021562849A 2019-04-23 2019-04-23 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品 Active JP7355115B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/083905 WO2020215209A1 (zh) 2019-04-23 2019-04-23 预测操作结果的方法、电子设备和计算机程序产品

Publications (2)

Publication Number Publication Date
JP2022536825A JP2022536825A (ja) 2022-08-19
JP7355115B2 true JP7355115B2 (ja) 2023-10-03

Family

ID=72941281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021562849A Active JP7355115B2 (ja) 2019-04-23 2019-04-23 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品

Country Status (3)

Country Link
US (1) US20220222554A1 (ja)
JP (1) JP7355115B2 (ja)
WO (1) WO2020215209A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220129794A1 (en) * 2020-10-27 2022-04-28 Accenture Global Solutions Limited Generation of counterfactual explanations using artificial intelligence and machine learning techniques
JP2024017703A (ja) * 2022-07-28 2024-02-08 株式会社日立製作所 情報処理装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007041705A (ja) 2005-08-01 2007-02-15 National Institute Of Advanced Industrial & Technology 事業者の温暖化対策計画策定方法
US20110137847A1 (en) 2009-12-01 2011-06-09 Fair Isaac Corporation Causal modeling for estimating outcomes associated with decision alternatives
WO2011095999A1 (en) 2010-02-05 2011-08-11 Decode Genetics Ehf Genetic variants for predicting risk of breast cancer
US20110289036A1 (en) 2008-10-15 2011-11-24 Alexander Stojadinovic Clinical Decision Model
JP2015082259A (ja) 2013-10-23 2015-04-27 本田技研工業株式会社 時系列データ予測装置、時系列データ予測方法、及びプログラム
JP2015132863A (ja) 2012-04-27 2015-07-23 住友林業株式会社 生産活動と生産地の保全を統合した排出権創出方法
US20160300036A1 (en) 2013-10-28 2016-10-13 New York University Methods, computer-accessible medium and systems to model disease progression using biomedical data from multiple patients
JP2017524183A (ja) 2014-06-30 2017-08-24 アマゾン・テクノロジーズ・インコーポレーテッド 機械学習サービス
WO2018225227A1 (ja) 2017-06-08 2018-12-13 富士通株式会社 情報処理方法、情報処理装置及び情報処理コンピュータプログラム
JP2019059348A (ja) 2017-09-27 2019-04-18 株式会社日立製作所 運行情報処理装置およびその処理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6482844B2 (ja) * 2014-12-11 2019-03-13 株式会社メガチップス 状態推定装置、プログラムおよび集積回路
CN108734499B (zh) * 2017-04-25 2022-03-11 腾讯科技(深圳)有限公司 推广信息效果分析方法及装置、计算机可读介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007041705A (ja) 2005-08-01 2007-02-15 National Institute Of Advanced Industrial & Technology 事業者の温暖化対策計画策定方法
US20110289036A1 (en) 2008-10-15 2011-11-24 Alexander Stojadinovic Clinical Decision Model
US20110137847A1 (en) 2009-12-01 2011-06-09 Fair Isaac Corporation Causal modeling for estimating outcomes associated with decision alternatives
WO2011095999A1 (en) 2010-02-05 2011-08-11 Decode Genetics Ehf Genetic variants for predicting risk of breast cancer
JP2015132863A (ja) 2012-04-27 2015-07-23 住友林業株式会社 生産活動と生産地の保全を統合した排出権創出方法
JP2015082259A (ja) 2013-10-23 2015-04-27 本田技研工業株式会社 時系列データ予測装置、時系列データ予測方法、及びプログラム
US20160300036A1 (en) 2013-10-28 2016-10-13 New York University Methods, computer-accessible medium and systems to model disease progression using biomedical data from multiple patients
JP2017524183A (ja) 2014-06-30 2017-08-24 アマゾン・テクノロジーズ・インコーポレーテッド 機械学習サービス
WO2018225227A1 (ja) 2017-06-08 2018-12-13 富士通株式会社 情報処理方法、情報処理装置及び情報処理コンピュータプログラム
JP2019059348A (ja) 2017-09-27 2019-04-18 株式会社日立製作所 運行情報処理装置およびその処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黒木 学,Bounds on the Causal Effects in Studies with a Latent Response Variable,2007年度人工知能学会全国大会(第21回)論文集 [CD-ROM],社団法人人工知能学会,2007年06月18日,3D8-2,ISSN: 1347-9881

Also Published As

Publication number Publication date
WO2020215209A1 (zh) 2020-10-29
US20220222554A1 (en) 2022-07-14
JP2022536825A (ja) 2022-08-19

Similar Documents

Publication Publication Date Title
Atan et al. Deep-treat: Learning optimal personalized treatments from observational data using neural networks
Liu et al. Robust hybrid learning for estimating personalized dynamic treatment regimens
JP2022544859A (ja) 生成モデルを用いてデータを補完するためのシステムおよび方法
US20220157413A1 (en) Systems and Methods for Designing Augmented Randomized Trials
JP7355115B2 (ja) 操作結果を予測する方法、電子機器、及びコンピュータプログラム製品
Li et al. Joint modeling quality of life and survival using a terminal decline model in palliative care studies
Hong et al. Semi‐supervised validation of multiple surrogate outcomes with application to electronic medical records phenotyping
US20220344009A1 (en) Systems and Methods for Designing Efficient Randomized Trials Using Semiparametric Efficient Estimators for Power and Sample Size Calculation
Collier et al. A tutorial on artificial neural networks in propensity score analysis
Khawaled et al. Npbdreg: Uncertainty assessment in diffeomorphic brain mri registration using a non-parametric bayesian deep-learning based approach
Li et al. Reinforcement learning in possibly nonstationary environments
Hu et al. Off-policy evaluation in partially observed Markov decision processes under sequential ignorability
Tesei et al. Learning end-to-end patient representations through self-supervised covariate balancing for causal treatment effect estimation
Li et al. Regularized multiple mediation analysis
Wingbermühle et al. Development and internal validation of prognostic models for recovery in patients with non-specific neck pain presenting in primary care
Samuels et al. Bagged one‐to‐one matching for efficient and robust treatment effect estimation
Wang et al. Semiparametric model averaging prediction: a Bayesian approach
Li et al. MVIRA: A model based on Missing Value Imputation and Reliability Assessment for mortality risk prediction
Steward et al. Risk‐adjusted monitoring of healthcare quality: model selection and change‐point estimation
CN113469203A (zh) 评估操作结果的方法、电子设备和计算机程序产品
Zhang et al. Doubly robust estimation of optimal dynamic treatment regimes with multicategory treatments and survival outcomes
US20230352125A1 (en) Systems and Methods for Adjusting Randomized Experiment Parameters for Prognostic Models
Carroll Strategies for imputing missing covariate values in observational data
Bo et al. A Meta-Learner Framework to Estimate Individualized Treatment Effects for Survival Outcomes
Xu et al. VAP: Online Data Valuation and Pricing for Machine Learning Models in Mobile Health

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220421

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R151 Written notification of patent or utility model registration

Ref document number: 7355115

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151