WO2018211617A1

WO2018211617A1 - 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム

Info

Publication number: WO2018211617A1
Application number: PCT/JP2017/018484
Authority: WO
Inventors: 顕大矢部
Original assignee: 日本電気株式会社
Priority date: 2017-05-17
Filing date: 2017-05-17
Publication date: 2018-11-22
Also published as: US20200167680A1; JPWO2018211617A1; JP6954347B2

Abstract

第一受付部８１は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。第二受付部８２は、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける。出力部８３は、第一受付部８１が受け付けた入力と、第二受付部８２が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する。

Description

実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム

　本発明は、操作に基づいて行われる実験の計画を最適化する実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラムに関する。

　製薬や農業の分野では、各種組み合わせの最適性を実験によって求めることが一般に行われている。例えば、農業の分野では、肥料の組み合わせが、植物の生育度合いに影響を及ぼすことが考えられる。また、製薬の分野では、効果があるとされる薬の調合が、各疾患の治療に影響を及ぼすことが考えられる。

　なお、製薬や農業の分野では、複数の未知の要因により一つの組み合わせから必ずしも１００％の結果を得られるわけではない。そのため、対象とする組み合わせを実現する行為が想定する結果に影響を及ぼす確率（影響度合い）は、同じ操作を複数回実験することにより導出される。以下、ある結果を導出するために行われる各行為のことを、操作と記す。例えば、上述の例では、肥料の量の選択や、薬の調合の有無などが操作として挙げられる。

　多くの実験を行うことで、結果に影響を及ぼす確率の算出精度は向上する。しかし、操作の組み合わせが増大すると、それに応じて実験を行う回数も増大する。そのため、候補となる組み合わせの数を低減できることが好ましい。

　例えば、特許文献１には、取り扱う設計パラメータや製品機能の数が多く、設計パラメータや製品機能間に相互作用が存在する製品開発において、手戻りなく効率的に数多くの設計パラメータを決定する方法が記載されている。特許文献１に記載された方法では、設計パラメータ間の相互関係を構造化したモデルを準備し、構造化処理後のモデルから取得される設計パラメータグループ情報ごとに大実験を割り付け、大実験計画情報を出力する。この大実験計画情報には、設計パラメータグループ毎に割り付けられた大実験ＩＤ、実験順序、該当する設計パラメータ一覧、先行実験とのインターフェイスパラメータ、実験水準数およびその水準値が含まれる。

特開２００６－３４４２００号公報

　以下、影響度合いを導出する方法を具体例を用いて説明する。ここでは、説明を単純にするために、１つの操作によって１つの結果を得ることを想定する。インシュリンの投与の有無を表す操作をｘ∈｛０，１｝（ただし、ｘ＝０の場合にインシュリンを投与せず、ｘ＝１の場合にインシュリンを投与する。）で表す。また、操作による結果として、血糖値が高いか低いかを表す結果をｕ∈｛０，１｝（ただし、ｕ＝０の場合に血糖値が高い、ｕ＝１の場合に血糖値が低い、とする。）で表す。

　図１１は、想定される結果の例を示す説明図である。図１１に例示する結果が、本来得られるはずの結果であったとしても、この結果は実際には分からない。そこで、上述する操作を複数回行って、得られた実験結果から図１１に例示する結果を推定することになる。

　例えば、インシュリンを投与しなかった実験（ｘ＝０）を１００回行ったときに、血糖値が高いという結果（ｕ＝０）が７２回、血糖値が低いという結果（ｕ＝１）が２８回、それぞれ得られたとする。この実験結果により、図１１に例示する表に近い結果が推定される。インシュリンを投与した実験（ｘ＝１）についても同様である。以上が、効果を測定することの意味である。

　このように一つの操作の効果を測定するのは簡単である。しかし、複数の操作が互いに影響し合って効果を生じる場合、最適な操作を発見する問題を解かなければならない場合も存在する。

　図１２は、操作と結果との因果関係を示すグラフの例を示す説明図である。図１２においてｘ_１～ｘ_３が、窒素系肥料各三種を投与するか否かという操作を表し、ｘ_４～ｘ_６が、リン系肥料各三種を投与するか否かという操作を表し、ｘ_７～ｘ_９が、カリウム系肥料各三種を投与するか否かという操作を表しているとする。また、ｕ_１～ｕ_３が、それぞれ、窒素、リンおよびカリウムの土壌量を表しているとする。また、ｙが、植物が良く生育したか否かを表しているとする。このような設定において、最適な肥料の投与戦略を求めたいとする。

　まず、それぞれの肥料間には、相互作用がある。例えば、ｘ_１～ｘ_３では、どれか一つが投与されていれば十分という相互作用がある、ｘ_１とｘ_４は、共に投与されているときに相乗効果が働くという相互作用がある、などである。仮に、全ての操作に相互作用が存在する場合、特許文献１に記載された方法では、実験設定を省略することができない。そのため、例えば、ある操作が２種類の候補を含むとし、その操作がｎ種類考えられる場合、実験の種類が指数的に増加する（この場合、Ｏ（２^ｎ））ため、行われる実験回数も指数のオーダで増加する。したがって、少ない実験回数で最適な戦略を求めるには、実験計画を最適に行うことが重要になる。

　ここで、窒素の土壌量が測定できる場合、ｘ_１～ｘ_３が窒素の土壌量に与える作用と、窒素の土壌量が生育に与える作用とを分割して考えることが可能である。図１２に示す例では、効率的な分割方法は半ば自明であるが、操作と観測値とが一般的な因果グラフで与えられた場合、その分割方法は自明ではない。

　また、特許文献１に記載された方法では、相互作用が少ない設計パラメータグループを抽出し、その設計パラメータグループに基づいた実験計画を作成する。しかし、前述のような、すべての操作に相互作用が存在する場合には、実験回数削減のために効果を発揮しない。因果関係が存在するパラメータについては、相互作用の有無にかかわらず実験計画を作成できることが好ましい。

　そこで、本発明は、背後に存在する因果関係を考慮して実験計画を最適化できる実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラムを提供することを目的とする。

　本発明による実験計画最適化装置は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、第一受付部が受け付けた入力と、第二受付部が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力部とを備えたことを特徴とする。

　本発明による実験計画最適化方法は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付け、受け付けたグラフと、程度を示す情報または実験結果とに基づいて、複数の実験の操作を行うべき順序を出力することを特徴とする。

　本発明による実験計画最適化プログラムは、コンピュータに、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、第一受付処理で受け付けた入力と、第二受付処理で受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力処理を実行させることを特徴とする。　

　本発明によれば、背後に存在する因果関係を考慮して実験計画を最適化できるという技術的効果を奏する。

本発明による実験計画最適化装置の一実施形態を示すブロック図である。操作と結果との因果関係を示すグラフの例を示す説明図である。操作と結果との因果関係を示すグラフの他の例を示す説明図である。実験結果の例を示す説明図である。操作と結果との因果関係を示すグラフの他の例を示す説明図である。実験計画最適化装置の動作例を示すフローチャートである。実験計画の例を示す説明図である。実験回数の例を示す説明図である。本発明による情報処理システムの概要を示すブロック図である。少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。想定される結果の例を示す説明図である。操作と結果との因果関係を示すグラフの例を示す説明図である。

　以下、本発明の実施形態を図面を参照して説明する。図１は、本発明による実験計画最適化装置の一実施形態を示すブロック図である。本実施形態の実験計画最適化装置１００は、第一受付部１０と、第二受付部２０と、実験内容決定部３０と、出力部４０と、記憶部５０とを備えている。なお、第一受付部１０と第二受付部２０とは、一つの受付部によって実現されていてもよい。

　記憶部５０は、第一受付部１０が受け付けた情報および第二受付部２０が受け付けた情報を記憶する。

　第一受付部１０は、実験で行われる操作およびその操作によって観測される結果（以下、観測値と記すこともある。）、並びに、操作と結果との因果関係を含む情報を入力として受け付ける。なお、ある１つ以上の結果に基づいてさらに別の結果が得られる場合、この因果関係は、その結果同士の因果関係も含む。ここで入力される操作は、最終的な出力を特定するために有効な操作である。また、観測される結果は、操作の影響により観測され得る値（観測値）と言うこともできる。

　過去の知見から、ある結果に影響を及ぼし得る操作の特定は可能である。そこで、本発明では、ある操作によって結果に影響を及ぼす因果関係が既知であるものとする。また、本発明では、その因果関係が有向非巡回グラフ（ＤＡＧ：Directed acyclic graph）で表されているものとする。以下の説明では、有向非巡回グラフのことを単にグラフと記す。

　図２は、操作と結果との因果関係を示すグラフの例を示す説明図である。図２に例示するノードｘが操作を表し、ノードｕが結果を表す。また、操作と結果とを結ぶ矢印が、操作と結果との因果関係を表す。上述する図１１に示す例では、ｘが「インシュリンを投与するかしないか」を表す操作に対応し、ｕが「血糖値が高いか低いか」を表す結果に対応する。

　図３は、操作と結果との因果関係を示すグラフの他の例を示す説明図である。なお、図３に例示する因果関係を示すグラフは、図１２に例示する因果関係を示すグラフと同様である。図３に例示するノードｘ_１～ｘ_９が操作を表し、ノードｕ_１～ｕ_３が結果（中間結果）を表し、ノードｙが最終結果を示す。図３に示す例では、ｉ番目の薬の投与の有無を表す操作をｘ_ｉ∈｛０，１｝（ただし、ｘ_ｉ＝０の場合に薬を投与せず、ｘ_ｉ＝１の場合に薬を投与する。）で表す。また、ｊ番目の測定値（例えば、血圧、血糖値など）が所定の基準よりも良いか否かを表す結果をｕ_ｊ∈｛０，１｝（ただし、ｕ_ｊ＝０の場合に結果が悪い、ｕ_ｊ＝１の場合に結果が良い、とする。）で表す。また、健康になったか否かを表す最終結果をｙ∈｛０，１｝（ただし、ｙ＝０の場合に最終結果が悪い、ｙ＝１の場合に最終結果が良い、とする。）で表す。

　図３に示す例では、各ｘ_ｉが決定されると、対応する確率的な観測が得られることを示す。言い換えると、各観測値が、矢印の元のノードの値（操作）に影響を受けることを示す。また、図３に例示するように、入力されるグラフの因果関係は、操作と結果との因果関係だけでなく、結果同士の因果関係を含んでいてもよい。

　そこで、本実施形態の第一受付部１０は、実験の操作を示す複数のノードおよび操作の結果を示す複数のノード、並びに、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。

　第二受付部２０は、上述する因果関係（すなわち、実験の操作と操作の結果との因果関係）の程度を示す情報を入力として受け付ける。因果関係の程度を示す情報とは、具体的には、ある操作を行った場合に得られる結果の確率である。以下の説明では、この因果関係の程度を示す情報のことを、因果関係を示す確率または単に確率と記す。

　例えば、図１１に示す例において、インシュリンを投与した（ｘ＝１）場合に血糖値が低い（ｕ＝０）という因果関係を示す確率は、図１１に例示する表から、０．２であると言える。

　また、第二受付部２０は、因果関係を示す確率そのものではなく、因果関係の程度（因果関係を示す確率）を推定可能な過去の実験結果を入力として受け付けてもよい。因果関係の程度を推定可能な過去の実験結果とは、個々の実験結果または実験結果の一部の集計値である。

　図４は、実験結果の例を示す説明図である。図４に示す例は、インシュリンの投与の有無についての血糖値を示す実験結果の例を示す。例えば、図４に示す被験者番号１０００１の被験者にインシュリンを投与しなかった（インシュリン投与＝０）場合、血糖値が１５０で血糖値が高い（０）と判定されたことを示す。

　例えば、図４に示すように、「インシュリンを投与しない実験（ｘ＝０）を１００回行ったときに、血糖値が高いという結果（ｕ＝０）が７２回、血糖値が低いという結果（ｕ＝１）が２８回である」という実験結果が得られているとする。この実験結果を利用することで、インシュリンを投与しなかった（ｘ＝０）場合に血糖値が高い（ｕ＝０）という因果関係を示す確率が、７２／１００＝０．７２と算出できる。第二受付部２０は、このように、因果関係の程度を推定可能な過去の実験結果を入力として受け付けてもよい。

　実験内容決定部３０は、第一受付部１０への入力および第二受付部２０への入力に基づいて、次にすべき実験の操作の内容（具体的には、実験の操作を行うべき順序）を決定する。実験内容決定部３０が決定する実験の内容は、具体的には、操作の組み合わせ及び実験回数である。

　実験内容決定部３０は、結果のノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作方法（以下、介入方法と記す場合もある）を特定する。

　以下、具体例を用いて、実験内容を決定する方法を説明する。図５は、操作と結果との因果関係を示すグラフの他の例を示す説明図である。図５に例示するノードｘ_１～ｘ_６が操作を表し、ノードｕ_１～ｕ_３が結果（中間結果）を表し、ノードｙが最終結果を示す。なお、ノードｙも結果を示すノードであることから、ｙ＝ｕ_４として説明する。

　図５に示す例では、ｉ番目の薬の肥料の使用の有無を表す操作をｘ_ｉ∈｛０，１｝（ただし、ｘ_ｉ＝０の場合に肥料を使用せず、ｘ_ｉ＝１の場合に肥料を使用する。）で表す。また、ｊ番目の生育状態（例えば、葉の大きさ、植物の高さなど）が所定の基準よりも良いか否かを表す結果をｕ_ｊ∈｛０，１｝（ただし、ｕ_ｊ＝０の場合に結果が悪い、ｕ_ｊ＝１の場合に結果が良い、とする。）で表す。また、実りの量を示す最終結果をｙ∈｛０，１｝（ただし、ｙ＝０の場合に最終結果が悪い、ｙ＝１の場合に最終結果が良い、とする。）で表す。

　図５に示す例でも、各ｘ_ｉが決定されると、対応する確率的な観測が得られる。さらに、図５に示す例では、ｕ_３について、操作ｘ_４およびｘ_６だけでなく、ｕ_２に依存して対応する確率的な観測が得られる。なお、ｕ_ｉに入るエッジは、ｘ_１，ｘ_２，…，ｘ_６，…ｕ_１，ｘ_２，ｘ_３からのエッジになるように並び替えられている。

　本具体例では、Ｔ回の実験が可能であるとする。また、図５に示す例では、各ノードの取り得る値が２値であることから、各結果のノードｉで推定する必要がある因果関係の強さを表す条件付確率の種類数をＣ_ｉとすると、Ｃ_ｉ＝２^{ｄｅｇ（ｕｉ）}である。ただし、ｄｅｇ（ｕ_ｉ）は、ノードｕ_ｉへの入り次数（入る矢印の数）を表す。したがって、図５に例示するノードで想定される実験の種類数の総数Ｃは、Ｃ＝Σ_ｉＣ_ｉである。

　また、本具体例では、各結果のノードで行われる実験回数は、全体で行われる実験の種類に対する各ノードにおける条件付確率を推定するために行われる実験の種類の割合で決定される。すなわち、各結果のノードｉで行われる実験の回数をＴ_ｉとすると、Ｔ_ｉ＝Ｔ・（Ｃ_ｉ／Ｃ）である。

　まず、結果が操作にのみ依存する結果のノードｕ_１がグラフから選択されたとする。この場合、実験内容決定部３０は、結果に影響する操作の組み合わせを特定する。ノードｕ_１の場合、結果に影響するノードはｘ_１，ｘ_２，ｘ_３であり、それぞれ、｛０，１｝の２種類の値をとる。そこで、実験内容決定部３０は、（ｘ_１，ｘ_２，ｘ_３）＝（０，０，０），（０，０，１），（０，１，０），…，（１，１，１）を実現するために最も可能性の高い介入方法を特定する。この場合には、操作に応じて｛０，１｝の値が決定するため、そのまま操作が行われればよい。

　この場合、実験内容決定部３０は、ノードｕ_１についてＣ_１＝２^３種類の実験を行うと決定する。また、各種類の実験が均等に行われる場合、実験内容決定部３０は、各種類の実験をそれぞれ、Ｔ_１／Ｃ_１回行うと決定する。実験内容決定部３０は、ノードｕ_１について、（ｘ_１，ｘ_２，ｘ_３）＝（０，０，０），（０，０，１），（０，１，０），…，（１，１，１）を実験の操作を行うべき順序として出力する。ノードｕ_２についても同様である。

　次に、結果が操作だけでなく他の結果にも依存する結果のノードｕ_３がグラフから選択されたとする。ノードｕ_３の場合、実験内容決定部３０は、結果に影響するノードはｘ_４，ｘ_６，ｕ_２であり、それぞれ、｛０，１｝の２種類の値をとる。そこで、実験内容決定部３０は、（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０），（０，０，１），（０，１，０），…，（１，１，１）を実現するために最も可能性の高い操作方法を特定する。

　具体的には、実験内容決定部３０は、結果のノードが依存する操作のノードを特定する。結果のノードｕ_２が依存する操作のノードは、ｘ_３，ｘ_５，ｘ_６である。この場合、実験内容決定部３０は、結果のノードｕ_２が依存する操作のノードを、ｘ_３，ｘ_５，ｘ_６と特定する。実験内容決定部３０は、特定したノードを用いて、結果に影響する操作の組み合わせを実現するために最も可能性の高い介入方法を特定する。

　なお、ノードｕ_２については、ノードｕ_１に対する方法と同様に、ｘ_３，ｘ_５，ｘ_６が与えられた場合の実現確率が、具体的な実験結果により算出される。例えば、ｘ_６＝０を想定した操作について、ｕ_２＝１になる実現確率が、以下のように算出されて推定されるとする。

　Ｐ（ｕ_２＝１｜（ｘ_３，ｘ_５，ｘ_６））＝（０，０，０））＝０．４
　Ｐ（ｕ_２＝１｜（ｘ_３，ｘ_５，ｘ_６））＝（０，１，０））＝０．５
　Ｐ（ｕ_２＝１｜（ｘ_３，ｘ_５，ｘ_６））＝（１，０，０））＝０．６
　Ｐ（ｕ_２＝１｜（ｘ_３，ｘ_５，ｘ_６））＝（１，１，０））＝０．３

　ｕ_２は、２値の値をとることが想定されているため、上記結果から、以下の結果も計算される。

　Ｐ（ｕ_２＝０｜（ｘ_３，ｘ_５，ｘ_６））＝（０，０，０））＝０．６
　Ｐ（ｕ_２＝０｜（ｘ_３，ｘ_５，ｘ_６））＝（０，１，０））＝０．５
　Ｐ（ｕ_２＝０｜（ｘ_３，ｘ_５，ｘ_６））＝（１，０，０））＝０．４
　Ｐ（ｕ_２＝０｜（ｘ_３，ｘ_５，ｘ_６））＝（１，１，０））＝０．７

　このとき、ｕ_２が０になる確率が最も高いのは、（ｘ_３，ｘ_５，ｘ_６）＝（１，１，０）の場合で０．７である。また、ｘ_４の値は、１または０に確率１で特定される。したがって、（ｘ_３，ｘ_４，ｘ_５，ｘ_６）＝（１，０，１，０）の操作により、（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０）になる確率が０．７と推定される。言い換えると、上記操作によって、７０％の確率で適切なサンプルが取れるとも言える。

　そこで、実験内容決定部３０は、ノードｕ_３について（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０）の実験を行う場合には、（ｘ_３，ｘ_４，ｘ_５，ｘ_６）＝（１，０，１，０）の操作を行うと決定する。実験の種類についても同様である。なお、実現確率が低いものは、そもそも発生する確率が低いものであるため、最終結果への影響が小さいものと言える。

　上記内容について、より詳細に説明する。図５に例示するｕ_１を推定する場合、ｘ_１～ｘ_３を直接操作できるため、条件を１００％の確率で達成できる。すなわち、条件付き確率Ｐ（ｕ_１＝１｜ｘ_１，ｘ_２，ｘ_３）の推定を効率的に行うことが可能である。一方、ｕ_３を推定する場合、狙った実験を高々７０％の確率でしか行うことが出来ないため、推定の効率は低下する。

　しかし、最終的な目標は、ｙ＝１を達成する確率が最も高い操作を発見することである。この点に注目する。（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０）という事象は、どのような操作の組合せに対しても、高々７０％の確率でしか起こらない。よって、事象が起こる確率が低い場合には、その事象に対応する条件付き確率の推定精度が低くても、最終的な目標（ｙ＝１）を達成する確率の推定に大きな影響を与えない。以上のことからも、順次実験を行ってパラメータを推定することが正当化される。

　また、各種類の実験が均等に行われる場合、実験内容決定部３０は、ノードｕ_１と同様、それぞれの介入（各種類の実験）をそれぞれ、Ｔ_３／Ｃ_３回行うと決定する。言い換えると、この内容に基づいて、実験者は、その組み合わせで肥料を使用し、観測する実験を行うことになる。

　例えば、この実験によりＰ（ｕ_３＝１｜（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０））を推定するとする。例えば、ノードｕ_３全体でＴ_３回の実験を行うと決定された場合、ノードｕ_３で行われる実験の種類は８種類のため、（ｘ_３，ｘ_４，ｘ_５，ｘ_６）＝（１，０，１，０）の実験がＴ_３／８回割り当てられる。そして、この実験により、（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０）になった回数で、（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０）かつｕ_３＝１になった回数を割ることで、Ｐ（ｕ_３＝１｜（ｘ_４，ｘ_６，ｕ_２）＝（０，０，０））が推定される。

　このように、全てのノードに関して親ノードの状態が与えられたときの確率（条件付き確率）が推定できれば、ｙ＝１を実現する確率が最も高い操作方法（介入方法）を特定することが可能になる。ｘ_１，…，ｘ_６が与えられたときのｙ＝１になる確率は、以下の式１によって算出される。

　このように、結果のノードが操作のノードだけでなく他の結果のノードにも依存する場合、先に他の結果のノードの確率が算出される必要がある。そこで、実験内容決定部３０は、操作のノードにのみ依存する結果のノードを先に（優先的に）実験すべきと決定する。

　このような実験過程を経た場合、例えば、特許文献１に記載された方法では、Ｏ（２^６）回の実験を必要とするが、本実施形態の実験計画最適化装置１００では、Ｏ（２^３＊４）回の実験で済む。一般的に言えば、網羅的にＯ（２^ｎ）回の実験が必要な場合において、本実施形態の実験計画最適化装置１００による実験計画では、Ｏ（｜Ｖ｜２^{｛ｍａｘｉｎｄｅｇ｝}）回の実験ですむ。ただし、｜Ｖ｜は頂点数であり、ｍａｘｉｎｄｅｇは最大入り次数（単一頂点に入る枝数の最大）である。これは、ｍａｘｉｎｄｅｇが定数で抑えられるグラフに対しては、実験操作の回数が頂点数に対して線形で抑えられることを意味する。Ｏ（２^ｎ）は、ｎに対して指数のオーダであることから、この因果グラフを効果的に用いた実験計画により大きく実験回数を減らすことができると言える。

　なお、上記の実験操作において、各ノードは２値をとるものとしたが、これは多値の場合にも容易に拡張できる。また、上記の操作では、実験回数を分割し、ｉ番目のノードの条件付確率の推定にＴ_ｉサンプルを用いるとした。しかし、このＴ_ｉサンプルの実験を行っている間にも、例えばｉ＋１番目の頂点に関してもデータを取得することができ、推定も可能である。特に、ｕ_１を推定しているときに、ｘ_４～ｘ_６は値が指定されていないが、ｘ_４～ｘ_６についてもランダムな操作を行って、ｕ_２，ｕ_３を測定することにより、実験の効率を高めることができる。

　以上、具体例に対する操作手順を記述した。以下、一般のグラフに対するアルゴリズムを記述する。まず、入力としてグラフＧ＝（Ｖ，Ｅ）が与えられる。ここで、Ｖは、頂点集合であり、Ｅは有向枝の集合である。グラフは、ＤＡＧであり、操作できる頂点集合Ｘ（Ｖの部分集合）には枝が入っていないとする。グラフと総実験回数とが与えられたとき、前述のように各頂点に対してＣ_ｉおよびＴ_ｉを計算できる。

　以下の手順を繰り返す。すでに条件付確率の推定が行われた頂点集合をＳとおく。実験を始める前の初期状態において、Ｓ＝Ｘである。次に、入ってくる枝が、Ｓからのみである頂点がＳの外に必ず存在する。そのような頂点のうち一つを選択し、ｕとする。この頂点に対して、以下の実験操作を行い、条件付き確率を推定して、この頂点をＳに加える。なお、前述の例では、初期状態においてｕ_１およびｕ_２が選択可能であり、ｕ_２の推定が終わるとｕ_３が選択可能になり、ｕ_１，ｕ_２およびｕ_３の推定が終わるとｕ_４が選択可能になる。

　実験操作は、以下の通りである。仮定から、ｕの親ノードｖ_１，…，ｖ_ｋはＳに含まれる。よって、Ｘに対して操作を行った場合の条件付き確率Ｐ（ｖ_１，…，ｖ_ｋ｜ｘ_１，…，ｘ_ｎ）を、上記式１と同様の計算方法により計算できる。よって、（ｖ_１，…，ｖ_ｋ）の各｛０，１｝^ｋの組合せに対し、それを達成する確率がもっとも高いｘ_１，…，ｘ_ｎに対する実験操作を計算できる。この操作を、Ｔ_ｉ／Ｃ_ｉ回行い、各組合せＷ⊂｛０，１｝^ｋに対して条件付確率Ｐ（ｕ｜（ｖ_１，…，ｖ_ｋ）＝Ｗ）を推定する。これにより、ｕに関する条件付き確率の推定が完了する。

　出力部４０は、実験内容決定部３０が決定した実験内容（具体的には、複数の実験の操作を行うべき順序）を出力する。

　記憶部５０は、例えば、磁気ディスク装置により実現される。また、第一受付部１０と、第二受付部２０と、実験内容決定部３０と、出力部４０とは、プログラム（実験計画最適化プログラム）に従って動作するコンピュータのＣＰＵによって実現される。例えば、プログラムは、記憶部５０に記憶され、ＣＰＵは、そのプログラムを読み込み、プログラムに従って、第一受付部１０、第二受付部２０、実験内容決定部３０および出力部４０として動作してもよい。また、実験計画最適化装置の機能がＳａａＳ（Software as a Service ）形式で提供されてもよい。

　また、第一受付部１０と、第二受付部２０と、実験内容決定部３０と、出力部４０とは、それぞれが専用のハードウェアで実現されていてもよい。第一受付部１０と、第二受付部２０と、実験内容決定部３０と、出力部４０とは、それぞれが汎用または専用の回路（circuitry ）により実現されていてもよい。ここで、汎用または専用の回路（circuitry ）は、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

　次に、本実施形態の実験計画最適化装置の動作を説明する。図６は、本実施形態の実験計画最適化装置の動作例を示すフローチャートである。

　まず、第一受付部１０は、実験の操作および操作の結果を示すノード並びにこれらの因果関係を示すエッジを含むグラフを入力として受け付ける（ステップＳ１１）。実験内容決定部３０は、入力されたグラフのうち、実験の操作を示すノードにのみ依存するノードが存在するか否か判断する（ステップＳ１２）。実験の操作を示すノードにのみ依存するノードが存在する場合（ステップＳ１２におけるＹｅｓ）、実験内容決定部３０は、このノードが依存する操作に関する実験を行うと決定する（ステップＳ１３）。そして、出力部４０は、決定した実験の操作を出力する（ステップＳ１４）。その後、ステップＳ１２以降の処理が繰り返される。また、第二受付部２０は、出力した実験に基づく実験結果を入力として逐次受け付ける。

　一方、実験の操作を示すノードにのみ依存するノードが存在しない場合（ステップＳ１２におけるＮｏ）、実験内容決定部３０は、操作の結果を示すノードに依存しているノードが存在するか否か判断する（ステップＳ１５）。操作の結果を示すノードに依存しているノードが存在する場合（ステップＳ１５におけるＹｅｓ）、第二受付部２０は、結果を示すノードとの因果関係を示す確率、または、過去の実験結果を入力する（ステップＳ１６）。

　実験内容決定部３０は、入力された確率または実験結果に基づいて、入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する（ステップＳ１７）。そして、出力部４０は、特定された操作を出力する（ステップＳ１８）。その後、ステップＳ１５以降の処理が繰り返される。また、第二受付部２０は、出力した実験に基づく実験結果を入力として逐次受け付ける。

　一方、操作の結果を示すノードに依存しているノードが存在しない場合（ステップＳ１５におけるＹｅｓ）、処理を終了する。

　以上のように、本実施形態では、第一受付部１０が、実験の操作を示す複数のノード、操作の結果を示す複数のノード、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。また、第二受付部２０が、実験の操作と操作の結果との因果関係の程度を示す情報、または因果関係の強さを推定可能な過去の実験結果を入力として受け付ける。そして、実験内容決定部３０および出力部４０が、第一受付部１０が受け付けた入力と、第二受付部２０が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する。よって、背後に存在する因果関係を考慮して実験計画を最適化できる。

　例えば、操作による途中の結果や、操作と結果との因果関係を考慮せず、操作と最終結果のみを考慮して実験計画を作成することも可能である。図７は、実験計画の例を示す説明図である。例えば、図７に例示する各操作ｘ_ｉが２値の値を取る場合、実験の操作の種類の組合せだけでも、２^ｉになるため、実験回数は指数的（Ｏ（２^ｎ）：ｎは例えば、薬の種類）に増加してしまう。

　一方、本実施形態では、例えば、図３に例示するようなグラフ構造および因果関係を考慮して実験計画を作成する。図８は、実験回数の例を示す説明図である。例えば、図８におけるＬ１の部分について、ｘ_１，ｘ_２，ｘ_３を操作して、ｕ_１への依存関係を実験する。この実験回数は、Ｏ（２^ｋ）＝Ｏ（１）である（ここでは、ｋ＝３）。Ｌ２の部分およびＬ３の部分についても同様である。図８のＬ４の部分について、ｕ_１，ｕ_２，ｕ_３を操作するかのようなｘ_１～ｘ_９の組も特定できる。そこで、特定した組による操作によって、ｙを推定する。以上のことから、ノード数を｜Ｖ｜とすると、Ｏ（｜Ｖ｜）で実験できることが分かる。すなわち、本実施形態の実験計画最適化装置により、実験回数を抑制することが可能になる。

　次に、本発明の概要を説明する。図９は、本発明による情報処理システムの概要を示すブロック図である。本発明による実験計画最適化装置８０は、実験の操作を示す複数のノード（例えば、ノードｘ_ｉ）、操作の結果を示す複数のノード（例えば、ノードｕ_ｊ）、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部８１（例えば、第一受付部１０）と、実験の操作と操作の結果との因果関係の程度を示す情報（例えば、確率）、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部８２（例えば、第二受付部２０）と、第一受付部８１が受け付けた入力と、第二受付部８２が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力部８３（例えば、実験内容決定部３０および出力部４０）とを備えている。

　そのような構成により、背後に存在する因果関係を考慮して実験計画を最適化できる。

　また、出力部８３は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定してもよい。

　また、出力部８３は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、その取り得る値の実現確率が最も高くなる操作を特定してもよい。

　また、出力部８３は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力してもよい。

　また、出力部８３は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、その実験の種類ごとの実験回数を決定してもよい。

　また、出力部８３は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定してもよい。

　図１０は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ１０００は、ＣＰＵ１００１、主記憶装置１００２、補助記憶装置１００３、インタフェース１００４を備える。

　上述の実験計画最適化装置は、コンピュータ１０００に実装される。そして、上述した各処理部の動作は、プログラム（実験計画最適化プログラム）の形式で補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、当該プログラムに従って上記処理を実行する。

　なお、少なくとも１つの実施形態において、補助記憶装置１００３は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００が当該プログラムを主記憶装置１００２に展開し、上記処理を実行しても良い。

　また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置１００３に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であっても良い。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、前記第一受付部が受け付けた入力と、前記第二受付部が受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力部とを備えたことを特徴とする実験計画最適化装置。

（付記２）出力部は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記１記載の実験計画最適化装置。

（付記３）出力部は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、当該取り得る値の実現確率が最も高くなる操作を特定する付記２記載の実験計画最適化装置。

（付記４）出力部は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力する付記１から付記３のうちのいずれか１つに記載の実験計画最適化装置。

（付記５）出力部は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、当該実験の種類ごとの実験回数を決定する付記１から付記４のうちのいずれか１つに記載の実験計画最適化装置。

（付記６）出力部は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定する付記１から付記５のうちのいずれか１つに記載の実験計画最適化装置。

（付記７）実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付け、受け付けたグラフと、前記程度を示す情報または前記実験結果とに基づいて、複数の前記実験の操作を行うべき順序を出力することを特徴とする実験計画最適化方法。

（付記８）結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記７記載の実験計画最適化方法。

（付記９）コンピュータに、実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、前記第一受付処理で受け付けた入力と、前記第二受付処理で受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力処理を実行させるための実験計画最適化プログラム。

（付記１０）コンピュータに、出力処理で、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記９記載の実験計画最適化プログラム。

　１０　第一受付部
　２０　第二受付部
　３０　実験内容決定部
　４０　出力部
　５０　記憶部
　１００　実験計画最適化装置

Claims

　実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、
　前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、
　前記第一受付部が受け付けた入力と、前記第二受付部が受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力部とを備えた
　ことを特徴とする実験計画最適化装置。
　出力部は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
　請求項１記載の実験計画最適化装置。
　出力部は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、当該取り得る値の実現確率が最も高くなる操作を特定する
　請求項２記載の実験計画最適化装置。
　出力部は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力する
　請求項１から請求項３のうちのいずれか１項に記載の実験計画最適化装置。
　出力部は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、当該実験の種類ごとの実験回数を決定する
　請求項１から請求項４のうちのいずれか１項に記載の実験計画最適化装置。
　出力部は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定する
　請求項１から請求項５のうちのいずれか１項に記載の実験計画最適化装置。
　実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、
　前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付け、
　受け付けたグラフと、前記程度を示す情報または前記実験結果とに基づいて、複数の前記実験の操作を行うべき順序を出力する
　ことを特徴とする実験計画最適化方法。
　結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
　請求項７記載の実験計画最適化方法。
　コンピュータに、
　実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、
　前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、
　前記第一受付処理で受け付けた入力と、前記第二受付処理で受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力処理
　を実行させるための実験計画最適化プログラム。
　コンピュータに、
　出力処理で、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
　請求項９記載の実験計画最適化プログラム。