WO2022270163A1

WO2022270163A1 - 計算機システム及び介入効果予測方法

Info

Publication number: WO2022270163A1
Application number: PCT/JP2022/019713
Authority: WO
Inventors: 昌宏荻野; 佩菲朱; 子盛黎
Original assignee: 株式会社日立製作所
Priority date: 2021-06-25
Filing date: 2022-05-09
Publication date: 2022-12-29
Also published as: JP2023004225A

Abstract

計算機システムは、機械学習により生成され、人の状態を表す複数の因子の値からなるベクトルを特徴量空間に写像することによって特徴量を生成する第１モデルと、特徴量から人に対する複数の介入の効果の予測値を出力する第２モデルと、を管理する。第１モデルは、前記機械学習で用いる複数の学習データの前記特徴量空間における分布の差異が小さくなるように、前記複数の学習データを前記特徴量空間に写像する。計算機システムは、複数の因子の値を含む入力データを受け付け、入力データを第１モデルに入力することによって、入力データの特徴量を生成し、入力データの特徴量を第２モデルに入力することによって、複数の介入の効果の予測値を算出する。

Description

計算機システム及び介入効果予測方法

参照による取り込み

　本出願は、２０２１年６月２５日に出願された日本特許出願第２０２１－１０５７８６号の優先権を主張し、その内容を参照することにより、本出願に取り込む。

　本発明は、人への介入の効果を予測するシステム及び方法に関する。

　医療及びマーケティング等の様々な分野において、人に対して行った介入（治療及び施策等）の効果を推定する手法としてランダム化比較試験等の因果推論が知られている。

　ランダム化比較試験は、大規模な実験が必要となり、コストが高いという課題がある。そこで、既存のデータを用いて、因果推論を行う技術の開発が望まれている。これに対して、特許文献１に記載の技術が知られている。

　特許文献１には「介入効果推測システム１０は、複数人の被験者データを集合させた集団データを回帰分析した集団分析結果を保持する集団用処理部２４と、集団分析結果を用いて、ユーザ用に準備された回帰モデルとしてユーザ用の回帰モデルにおける回帰係数の初期値と、ベイズ推定に用いる最初の事前分布とを設定し、ユーザの被験者データを取得すると、その被験者データの尤度を用いたベイズ推定によって、回帰係数を更新する個人用処理部２５とを備え、個人用処理部２５は、この個人用処理部２５により回帰係数が更新されたユーザ用の回帰モデルに基づいて、ユーザに対する介入の効果を推測する。」ことが記載されている。

特開２０１８－００５７０７号公報

Fredrik D. Johansson, Uri Shalit, David Sontag、"Learning Representations for Counterfactual Inference"、２０１６年、［online］、［令和３年６月１４日検索］、インターネット〈URL：https://arxiv.org/abs/1605.03661v1〉

　特許文献１に記載の技術では、選択バイアスが考慮されていない。これに対して、非特許文献１に記載の技術が知られている。非特許文献１には、ｄｉｓｃｒｅｐａｎｃｙ　ｄｉｓｔａｎｃｅを用いて、グループの分布の偏り、すなわち、交絡バイアスを調整している（例えば、非特許文献１の図１を参照）。

　ｄｉｓｃｒｅｐａｎｃｙ　ｄｉｓｔａｎｃｅは、二つの分布の距離として与えられており、複数の介入への適用が困難であるという課題がある。また、非特許文献１の技術では交絡バイアスの低減効果が小さいという課題がある。

　本発明は、従来の課題を解消し、高い精度で人に対する複数介入の効果を予測するシステム及び方法を提供する。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、人への複数の介入の効果を予測する計算機システムであって、プロセッサ及び前記プロセッサに接続される記憶装置を有する、少なくとも一つの計算機を備え、機械学習により生成され、前記人の状態を表す複数の因子の値からなるベクトルを特徴量空間に写像することによって特徴量を生成する第１モデルと、前記特徴量から前記人に対する前記複数の介入の効果の予測値を出力する第２モデルと、を管理し、前記第１モデルは、前記機械学習で用いる複数の学習データの前記特徴量空間における分布の差異が小さくなるように、前記複数の学習データを前記特徴量空間に写像し、前記計算機システムは、前記複数の因子の値を含む入力データを受け付け、前記入力データを前記第１モデルに入力することによって、前記入力データの前記特徴量を生成し、前記入力データの前記特徴量を前記第２モデルに入力することによって、前記複数の介入の効果の予測値を算出する。

　本発明によれば、高い精度で人に対する複数介入の効果を予測できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

実施例１のシステムの構成例を示す図である。実施例１の計算機のソフトウェア構成の一例を示す図である。実施例１の学習データＤＢの一例を示す図である。実施例１の学習部の機能構成の一例を示す図である。実施例１の学習部が実行する学習処理の一例を説明するフローチャートである。実施例１の予測部が実行する予測処理の一例を説明するフローチャートである。実施例１の予測部が出力する予測介入結果の一例を示す図である。実施例１の予測部が出力する予測介入結果の一例を示す図である。

　以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

　以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。

　本明細書等における「第１」、「第２」、「第３」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。

　図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。

　図１は、実施例１のシステムの構成例を示す図である。

　システムは、計算機１００、情報端末１１０、及び外部記憶装置１１１から構成される。計算機１００、情報端末１１０、及び外部記憶装置１１１は、ネットワーク１０９を介して互いに接続される。ネットワーク１０９は、例えば、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）及びＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）等であり、接続方式は有線及び無線のいずれでもよい。

　計算機１００は、介入効果を予測するモデルを生成するための学習処理を実行し、また、当該モデルを用いてユーザデータ（入力データ）に対する介入効果を予測する。計算機１００は、ＣＰＵ１０１、主記憶装置１０２、副記憶装置１０３、ネットワークアダプタ１０４、入力装置１０５、及び出力装置１０６を有する。各ハードウェア要素は内部バス１０８を介して互いに接続される。

　ＣＰＵ１０１は、主記憶装置１０２に格納されるプログラムを実行する。ＣＰＵ１０１がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部（モジュール）として動作する。以下の説明では、機能部を主語に処理を説明する場合、ＣＰＵ１０１が当該機能部を実現するプログラムを実行していることを示す。

　主記憶装置１０２は、ＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）であり、ＣＰＵ１０１が実行するプログラム及びプログラムが使用するデータを格納する。主記憶装置１０２は、また、ワークエリアとしても使用される。

　副記憶装置１０３は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）及びＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等であり、データを永続的に格納する。主記憶装置１０２に格納されるプログラム及びデータは、副記憶装置１０３に格納されてもよい。この場合、ＣＰＵ１０１が副記憶装置１０３からプログラム及び情報を読み出し、主記憶装置１０２にロードする。

　ネットワークアダプタ１０４は、ネットワーク１０９を介して外部装置と接続するためのインタフェースである。

　入力装置１０５は、キーボード、マウス、タッチパネル等であり、計算機１００に入力を行うための装置である。

　出力装置１０６は、ディスプレイ及びプリンタ等であり、計算機１００の処理結果等を出力するための装置である。

　なお、計算機１００のハードウェア構成は一例であってこれに限定されない。例えば、計算機１００は、入力装置１０５及び出力装置１０６を有していなくてもよい。

　情報端末１１０は、計算機１００に対する各種操作を行う端末である。例えば、情報端末１１０は、学習データの登録、モデルの登録、及びユーザデータの入力等を行う。情報端末１１０のハードウェア構成は計算機１００と同一である。

　外部記憶装置１１１は、各種情報を格納する。外部記憶装置１１１は、例えば、外付けのＨＤＤ又はストレージシステムである。

　図２は、実施例１の計算機１００のソフトウェア構成の一例を示す図である。

　計算機１００は、学習部２００及び予測部２０１を有し、また、学習データＤＢ２１０及びモデルＤＢ２１１を有する。なお、学習データＤＢ２１０及びモデルＤＢ２１１は、外部記憶装置１１１に格納されていてもよい。

　学習データＤＢ２１０は、学習処理に使用する学習データを格納するデータベースである。学習データＤＢ２１０については図３を用いて説明する。モデルＤＢ２１１は、各種モデルの情報を格納するデータベースである。

　学習部２００は、学習データＤＢ２１０に格納される学習データ及びモデルＤＢ２１１に格納されるモデルを用いて学習処理を実行する。予測部２０１は、モデルＤＢ２１１に格納されるモデルを用いて、ユーザデータ２２０に対する介入効果を予測し、予測介入結果２２１として出力する。

　図３は、実施例１の学習データＤＢ２１０の一例を示す図である。

　学習データＤＢ２１０は、ＩＤ３０１、要因３０２、介入種類３０３、及び効果３０４を含むエントリを格納する。一つのエントリが一つの学習データに対応する。なお、エントリに含まれるフィールドは前述したものに限定されない。前述したフィールドのいずれかを含まなくてもよいし、また、他のフィールドを含んでもよい。

　ＩＤ３０１は、学習データを一意に識別する識別情報を格納するフィールドである。本実施例のＩＤ３０１には識別番号が格納される。

　要因３０２は、介入を受ける人の状態及び特性等の要因の値を格納するフィールドである。要因は、例えば、年齢、性別、及び身長等である。本実施例では、要因３０２に含める要因の種類及び数に限定されない。

　介入種類３０３は、学習データに対応する人に対して行った介入の種類を示す情報を格納するフィールドである。

　効果３０４は、介入による効果を示す指標の値を格納するフィールドである。

　ユーザデータ２２０は、学習データから介入種類３０３及び効果３０４を除いたデータである。

　図４は、実施例１の学習部２００の機能構成の一例を示す図である。

　学習部２００は、特徴量生成部４００、識別器４０１、及び予測器４０２を含む。

　特徴量生成部４００は、要因ｘ_ｉを任意の次元の特徴量空間に写像することによって特徴量Ｇ_ｉを生成する。特徴量生成部４００は、ニューラルネットワーク等のモデルとして定義される。ここで、要因ｘ_ｉは、識別情報がｉである人の要因を表すｎ次元ベクトルである。要因ｘ_ｉは学習データの要因３０２に対応し、ｎは要因３０２のフィールド数を表す。

　識別器４０１は、特徴量Ｇ_ｉから人に対して行われた介入ｔ’_ｉを識別する。識別器４０１は、ニューラルネットワーク等のモデルとして定義される。ここで、介入ｔ’_ｉは識別情報がｉである人に対して行われた介入の予測値を表すｋ次元ベクトルである。ｋは介入の種類を表す。

　学習部２００は、複数の人の介入ｔ’_ｉ及び介入ｔ_ｉを用いて、介入ｔ’_ｉ及び介入ｔ_ｉの誤差を評価するｉｍｂａｌａｎｃｅ　ｌｏｓｓ関数を算出する。ここで、介入ｔ_ｉは識別情報がｉである人に対して行われた介入を表す。介入ｔ_ｉは、学習データの介入種類３０３に格納される介入の種類に対応する数値ｊである。例えば、介入の種類が「Ａ」の場合、数値ｊは「１」、介入の種類が「Ｂ」の場合、数値ｊは「２」となる。

　ｉｍｂａｌａｎｃｅ　ｌｏｓｓ関数は式（１）で定義される。

　αは０より大きい定数を表す。ｇ（ｘ_ｉ）は特徴量Ｇ_ｉを表す。ｄ（ｇ（ｘ_ｉ），ｔ_ｉ）は識別器４０１の出力、すなわち、介入ｔ’_ｉを表す。

　予測器４０２は、特徴量Ｇ_ｉから予測介入効果ｙ_ｉを算出する。予測器４０２は、ニューラルネットワーク等のモデルとして定義される。ここで、予測介入効果ｙ_ｉは識別情報がｉである人の各介入の効果の予測を表すｋ次元のベクトルである。

　学習部２００は、各人の特徴量Ｇ_ｉを用いて重みω（ｔ_ｉ＝ｊ，ｇ（ｘ_ｉ））を算出する。ここで、ｇ（ｘ_ｉ）は特徴量Ｇ_ｉを表す。

　重みω（ｔ_ｉ＝ｊ，ｇ（ｘ_ｉ））は式（２）で定義される。

　Ｐｒ（ｊ）はデータセット全体において介入ｔ_ｉがｊである確率値を表す。

　また、学習部２００は、複数の人の予測介入効果ｙ_ｉ及び重みω（ｔ_ｉ＝ｊ，ｇ（ｘ_ｉ））を用いて、効果ｙ^Ｆ _ｉと予測介入効果ｙ_ｉとの誤差を評価するＦａｃｔｕａｌ　ｌｏｓｓ関数を算出する。ここで、効果ｙ^Ｆ _ｉは識別情報がｉである人に対して行われた介入の効果を表す。効果ｙ^Ｆ _ｉは効果３０４の値である。

　Ｆａｃｔｕａｌ　ｌｏｓｓ関数は式（３）で定義される。

　学習部２００は、式（４）に示すような、Ｆａｃｔｕａｌ　ｌｏｓｓ関数及びｉｍｂａｌａｎｃｅ　ｌｏｓｓ関数から定義されるｌｏｓｓ関数に基づいて、特徴量生成部４００、識別器４０１、予測器４０２を更新する。重みω（ｔ_ｉ＝ｊ，ｇ（ｘ_ｉ））を乗算することによって、交絡因子の影響を削減できる。

　本実施例では、特徴量生成部４００及び識別器４０１はＧＡＮ（Ｇｅｎｅｒａｔｉｖｅ　Ａｄｖｅｒｓａｒｉａｌ　Ｎｅｔｗｏｒｋ）を利用した学習を行っている。特徴量生成部４００は、識別器４０１が特徴量から人に行われた介入の種別が識別できないように更新される。当該更新は、介入の相違による、要因ｘ_ｉの写像先の空間（特徴量空間）におけるｇ（ｘ_ｉ）の分布の差異（偏り）を小さく調整することを意味する。したがって、特徴量生成部４００が生成する特徴量は、交絡因子の影響が除外された特徴量となっている。

　ＧＡＮを利用して、特徴量空間のｇ（ｘ_ｉ）の分布の差異を小さく調整することによって、選択バイアスを低減し、また、非特許文献１より交絡バイアスを低くできる。また、人の特徴量を反映した重みを乗算したＦａｃｔｕａｌ　ｌｏｓｓ関数を用いることによって交絡バイアスをさらに解消できる。したがって、介入効果を精度よく予測できる。

　なお、重みを含まないｌｏｓｓ関数を用いて学習が行われてもよい。

　図５は、実施例１の学習部２００が実行する学習処理の一例を説明するフローチャートである。

　学習部２００は、情報端末１１０又は入力装置１０５を介して学習実行指示を受け付けた場合、学習処理を実行する。

　学習部２００は、モデルＤＢ２１１から、特徴量生成部４００、識別器４０１、及び予測器４０２のモデルを取得する（ステップＳ１０１）。

　学習部２００は、学習データＤＢ２１０から学習データを取得する（ステップＳ１０２）。ここでは、複数の学習データから構成される学習データセットが取得されるものとする。

　学習部２００は、特徴量生成部４００に、学習データセットの各学習データの要因ｘ_ｉを入力することによって特徴量ｇ（ｘ_ｉ）を生成する（ステップＳ１０３）。

　学習部２００は、識別器４０１に特徴量ｇ（ｘ_ｉ）を入力して得られた介入ｔ_ｉと、人の介入ｔ’_ｉとを用いてｉｍｂａｌａｎｃｅ　ｌｏｓｓ関数を算出する（ステップＳ１０４）。

　学習部２００は、特徴量ｇ（ｘ_ｉ）を用いて、重みω（ｔ_ｉ，ｇ（ｘ_ｉ））を算出する（ステップＳ１０５）。

　学習部２００は、予測器４０２に、特徴量ｇ（ｘ_ｉ）を入力することによって予測介入効果ｙ_ｉを算出する（ステップＳ１０６）。

　学習部２００は、重みω（ｔ_ｉ，ｇ（ｘ_ｉ））、学習データの効果３０４、及び予測介入効果ｙ_ｉを用いて、Ｆａｃｔｕａｌ　ｌｏｓｓ関数を算出する（ステップＳ１０７）。

　学習部２００は、式（４）のｌｏｓｓ関数を算出し、当該関数を用いて、特徴量生成部４００、識別器４０１、及び予測器４０２を更新する（ステップＳ１０８）。このとき、学習部２００は、更新結果をモデルＤＢ２１１に格納する。

　学習部２００は、学習を終了するか否かを判定する（ステップＳ１０９）。例えば、更新回数が閾値より大きい場合、学習部２００は学習を終了すると判定する。また、学習部２００は、評価用のユーザデータ２２０の予測介入効果の予測精度が閾値より高い場合、学習部２００は学習を終了すると判定する。

　学習を終了しないと判定された場合、学習部２００は、ステップＳ１０２に戻り、同様の処理を実行する。

　学習を終了すると判定された場合、学習部２００は学習処理を終了する。

　図６は、実施例１の予測部２０１が実行する予測処理の一例を説明するフローチャートである。図７及び図８は、実施例１の予測部２０１が出力する予測介入結果２２１の一例を示す図である。

　予測部２０１は、情報端末１１０又は入力装置１０５を介して、ユーザデータ２２０を含む予測実行指示を受け付けた場合、予測処理を実行する。

　予測部２０１は、モデルＤＢ２１１から、特徴量生成部４００及び予測器４０２のモデルを取得する（ステップＳ２０１）。

　予測部２０１は、特徴量生成部４００に、ユーザデータ２２０の要因ｘ_ｉを入力することによって特徴量ｇ（ｘ_ｉ）を生成する（ステップＳ２０２）。

　予測部２０１は、予測器４０２に、特徴量ｇ（ｘ_ｉ）を入力することによって予測介入効果ｙ_ｉを算出する（ステップＳ２０３）。

　予測部２０１は、予測介入効果ｙ_ｉを含む予測介入結果２２１を生成し、出力する（ステップＳ２０４）。その後、予測部２０１は予測処理を終了する。

　予測介入結果２２１は、ＩＤ７０１及び介入効果７０２を含む。ＩＤ７０１は、ユーザデータに含まれる、ユーザの識別情報を格納するフィールドである。介入効果７０２は、各介入に対する効果の予測値を格納するフィールド群である。

　なお、ユーザデータ２２０の時系列データを予測部２０１に入力することによって、図８に示すような介入効果の予測値の時系列データを出力することができる。

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

　また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｐｙｔｈｏｎ、Ｊａｖａ等の広範囲のプログラム又はスクリプト言語で実装できる。

　さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

　上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

Claims

　人への複数の介入の効果を予測する計算機システムであって、
　プロセッサ及び前記プロセッサに接続される記憶装置を有する、少なくとも一つの計算機を備え、
　機械学習により生成され、前記人の状態を表す複数の因子の値からなるベクトルを特徴量空間に写像することによって特徴量を生成する第１モデルと、前記特徴量から前記人に対する前記複数の介入の効果の予測値を出力する第２モデルと、を管理し、
　前記第１モデルは、前記機械学習で用いる複数の学習データの前記特徴量空間における分布の差異が小さくなるように、前記複数の学習データを前記特徴量空間に写像し、
　前記計算機システムは、
　前記複数の因子の値を含む入力データを受け付け、
　前記入力データを前記第１モデルに入力することによって、前記入力データの前記特徴量を生成し、
　前記入力データの前記特徴量を前記第２モデルに入力することによって、前記複数の介入の効果の予測値を算出することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記特徴量から前記人が受けた介入の種別を識別する第３モデルを管理し、
　前記人の識別情報と、前記人の前記複数の因子の値と、前記人が受けた介入の種別と、前記介入の効果値と、を含む学習データを受け付ける処理と、
　前記学習データを前記第１モデルに入力することによって、前記学習データの前記特徴量を算出する処理と、
　前記学習データの前記特徴量を前記第２モデルに入力することによって、前記複数の介入の効果の予測値を算出する処理と、
　前記学習データの前記特徴量を前記第３モデルに入力して得られた前記介入の種別、前記学習データに含まれる前記介入の種別、前記複数の介入の効果の予測値、及び前記学習データに含まれる前記効果値から損失関数を算出する処理と、
　前記損失関数を用いて、前記第１モデル、前記第２モデル、及び前記第３モデルを更新する処理と、
　を含む前記機械学習を実行することを特徴とする計算機システム。
　請求項２に記載の計算機システムであって、
　前記機械学習は、
　前記学習データの前記特徴量から重みを算出する処理と、
　前記学習データの前記特徴量を前記第３モデルに入力して得られた前記介入の種別、前記学習データに含まれる前記介入の種別、前記複数の介入の効果の予測値、前記学習データに含まれる前記効果値、及び前記重みから前記損失関数を算出する処理と、を含むことを特徴とする計算機システム。
　計算機システムが実行する人への複数の介入の効果を予測する介入効果予測方法であって、
　前記計算機システムは、
　プロセッサ及び前記プロセッサに接続される記憶装置を有する、少なくとも一つの計算機を含み、
　機械学習により生成され、前記人の状態を表す複数の因子の値からなるベクトルを特徴量空間に写像することによって特徴量を生成する第１モデルと、前記特徴量から前記人に対する前記複数の介入の効果の予測値を出力する第２モデルと、を管理し、
　前記第１モデルは、前記機械学習で用いる複数の学習データの前記特徴量空間における分布の差異が小さくなるように、前記複数の学習データを前記特徴量空間に写像し、
　前記複数の因子の値を含む入力データを受け付け、
　前記介入効果予測方法は、
　前記少なくとも一つの計算機が、前記入力データを前記第１モデルに入力することによって、前記入力データの前記特徴量を生成するステップと、
　前記少なくとも一つの計算機が、前記入力データの前記特徴量を前記第２モデルに入力することによって、前記複数の介入の効果の予測値を算出するステップと、を含むことを特徴とする介入効果予測方法。
　請求項４に記載の介入効果予測方法であって、
　前記計算機システムは、前記特徴量から前記人が受けた介入の種別を識別する第３モデルを管理し、
　前記介入効果予測方法は、
　前記少なくとも一つの計算機が、前記人の識別情報と、前記人の前記複数の因子の値と、前記人が受けた介入の種別と、前記介入の効果値と、を含む学習データを受け付ける第１のステップと、
　前記少なくとも一つの計算機が、前記学習データを前記第１モデルに入力することによって、前記学習データの前記特徴量を算出する第２のステップと、
　前記少なくとも一つの計算機が、前記学習データの前記特徴量を前記第２モデルに入力することによって、前記複数の介入の効果の予測値を算出する第３のステップと、
　前記少なくとも一つの計算機が、前記学習データの前記特徴量を前記第３モデルに入力して得られた前記介入の種別、前記学習データに含まれる前記介入の種別、前記複数の介入の効果の予測値、及び前記学習データに含まれる前記効果値から損失関数を算出する第４のステップと、
　前記少なくとも一つの計算機が、前記損失関数を用いて、前記第１モデル、前記第２モデル、及び前記第３モデルを更新する第５のステップと、
　を含むことを特徴とする介入効果予測方法。
　請求項５に記載の介入効果予測方法であって、
　前記第２のステップは、前記少なくとも一つの計算機が、前記学習データの前記特徴量から重みを算出するステップを含み、
　前記第４のステップは、前記少なくとも一つの計算機が、前記学習データの前記特徴量を前記第３モデルに入力して得られた前記介入の種別、前記学習データに含まれる前記介入の種別、前記複数の介入の効果の予測値、前記学習データに含まれる前記効果値、及び前記重みから前記損失関数を算出するステップを含むことを特徴とする介入効果予測方法。