JPWO2018211617A1 - 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム - Google Patents

実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム Download PDF

Info

Publication number
JPWO2018211617A1
JPWO2018211617A1 JP2019518659A JP2019518659A JPWO2018211617A1 JP WO2018211617 A1 JPWO2018211617 A1 JP WO2018211617A1 JP 2019518659 A JP2019518659 A JP 2019518659A JP 2019518659 A JP2019518659 A JP 2019518659A JP WO2018211617 A1 JPWO2018211617 A1 JP WO2018211617A1
Authority
JP
Japan
Prior art keywords
experiment
result
indicating
causal relationship
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019518659A
Other languages
English (en)
Other versions
JP6954347B2 (ja
Inventor
顕大 矢部
顕大 矢部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018211617A1 publication Critical patent/JPWO2018211617A1/ja
Application granted granted Critical
Publication of JP6954347B2 publication Critical patent/JP6954347B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Strategic Management (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

第一受付部81は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。第二受付部82は、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける。出力部83は、第一受付部81が受け付けた入力と、第二受付部82が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する。

Description

本発明は、操作に基づいて行われる実験の計画を最適化する実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラムに関する。
製薬や農業の分野では、各種組み合わせの最適性を実験によって求めることが一般に行われている。例えば、農業の分野では、肥料の組み合わせが、植物の生育度合いに影響を及ぼすことが考えられる。また、製薬の分野では、効果があるとされる薬の調合が、各疾患の治療に影響を及ぼすことが考えられる。
なお、製薬や農業の分野では、複数の未知の要因により一つの組み合わせから必ずしも100%の結果を得られるわけではない。そのため、対象とする組み合わせを実現する行為が想定する結果に影響を及ぼす確率(影響度合い)は、同じ操作を複数回実験することにより導出される。以下、ある結果を導出するために行われる各行為のことを、操作と記す。例えば、上述の例では、肥料の量の選択や、薬の調合の有無などが操作として挙げられる。
多くの実験を行うことで、結果に影響を及ぼす確率の算出精度は向上する。しかし、操作の組み合わせが増大すると、それに応じて実験を行う回数も増大する。そのため、候補となる組み合わせの数を低減できることが好ましい。
例えば、特許文献1には、取り扱う設計パラメータや製品機能の数が多く、設計パラメータや製品機能間に相互作用が存在する製品開発において、手戻りなく効率的に数多くの設計パラメータを決定する方法が記載されている。特許文献1に記載された方法では、設計パラメータ間の相互関係を構造化したモデルを準備し、構造化処理後のモデルから取得される設計パラメータグループ情報ごとに大実験を割り付け、大実験計画情報を出力する。この大実験計画情報には、設計パラメータグループ毎に割り付けられた大実験ID 、実験順序、該当する設計パラメータ一覧、先行実験とのインターフェイスパラメータ、実験水準数およびその水準値が含まれる。
特開2006−344200号公報
以下、影響度合いを導出する方法を具体例を用いて説明する。ここでは、説明を単純にするために、1つの操作によって1つの結果を得ることを想定する。インシュリンの投与の有無を表す操作をx∈{0,1}(ただし、x=0の場合にインシュリンを投与せず、x=1の場合にインシュリンを投与する。)で表す。また、操作による結果として、血糖値が高いか低いかを表す結果をu∈{0,1}(ただし、u=0の場合に血糖値が高い、u=1の場合に血糖値が低い、とする。)で表す。
図11は、想定される結果の例を示す説明図である。図11に例示する結果が、本来得られるはずの結果であったとしても、この結果は実際には分からない。そこで、上述する操作を複数回行って、得られた実験結果から図11に例示する結果を推定することになる。
例えば、インシュリンを投与しなかった実験(x=0)を100回行ったときに、血糖値が高いという結果(u=0)が72回、血糖値が低いという結果(u=1)が28回、それぞれ得られたとする。この実験結果により、図11に例示する表に近い結果が推定される。インシュリンを投与した実験(x=1)についても同様である。以上が、効果を測定することの意味である。
このように一つの操作の効果を測定するのは簡単である。しかし、複数の操作が互いに影響し合って効果を生じる場合、最適な操作を発見する問題を解かなければならない場合も存在する。
図12は、操作と結果との因果関係を示すグラフの例を示す説明図である。図12においてx〜xが、窒素系肥料各三種を投与するか否かという操作を表し、x〜xが、リン系肥料各三種を投与するか否かという操作を表し、x〜xが、カリウム系肥料各三種を投与するか否かという操作を表しているとする。また、u〜uが、それぞれ、窒素、リンおよびカリウムの土壌量を表しているとする。また、yが、植物が良く生育したか否かを表しているとする。このような設定において、最適な肥料の投与戦略を求めたいとする。
まず、それぞれの肥料間には、相互作用がある。例えば、x〜xでは、どれか一つが投与されていれば十分という相互作用がある、xとxは、共に投与されているときに相乗効果が働くという相互作用がある、などである。仮に、全ての操作に相互作用が存在する場合、特許文献1に記載された方法では、実験設定を省略することができない。そのため、例えば、ある操作が2種類の候補を含むとし、その操作がn種類考えられる場合、実験の種類が指数的に増加する(この場合、O(2))ため、行われる実験回数も指数のオーダで増加する。したがって、少ない実験回数で最適な戦略を求めるには、実験計画を最適に行うことが重要になる。
ここで、窒素の土壌量が測定できる場合、x〜xが窒素の土壌量に与える作用と、窒素の土壌量が生育に与える作用とを分割して考えることが可能である。図12に示す例では、効率的な分割方法は半ば自明であるが、操作と観測値とが一般的な因果グラフで与えられた場合、その分割方法は自明ではない。
また、特許文献1に記載された方法では、相互作用が少ない設計パラメータグループを抽出し、その設計パラメータグループに基づいた実験計画を作成する。しかし、前述のような、すべての操作に相互作用が存在する場合には、実験回数削減のために効果を発揮しない。因果関係が存在するパラメータについては、相互作用の有無にかかわらず実験計画を作成できることが好ましい。
そこで、本発明は、背後に存在する因果関係を考慮して実験計画を最適化できる実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラムを提供することを目的とする。
本発明による実験計画最適化装置は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、第一受付部が受け付けた入力と、第二受付部が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力部とを備えたことを特徴とする。
本発明による実験計画最適化方法は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付け、受け付けたグラフと、程度を示す情報または実験結果とに基づいて、複数の実験の操作を行うべき順序を出力することを特徴とする。
本発明による実験計画最適化プログラムは、コンピュータに、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、第一受付処理で受け付けた入力と、第二受付処理で受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力処理を実行させることを特徴とする。
本発明によれば、背後に存在する因果関係を考慮して実験計画を最適化できるという技術的効果を奏する。
本発明による実験計画最適化装置の一実施形態を示すブロック図である。 操作と結果との因果関係を示すグラフの例を示す説明図である。 操作と結果との因果関係を示すグラフの他の例を示す説明図である。 実験結果の例を示す説明図である。 操作と結果との因果関係を示すグラフの他の例を示す説明図である。 実験計画最適化装置の動作例を示すフローチャートである。 実験計画の例を示す説明図である。 実験回数の例を示す説明図である。 本発明による情報処理システムの概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。 想定される結果の例を示す説明図である。 操作と結果との因果関係を示すグラフの例を示す説明図である。
以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による実験計画最適化装置の一実施形態を示すブロック図である。本実施形態の実験計画最適化装置100は、第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40と、記憶部50とを備えている。なお、第一受付部10と第二受付部20とは、一つの受付部によって実現されていてもよい。
記憶部50は、第一受付部10が受け付けた情報および第二受付部20が受け付けた情報を記憶する。
第一受付部10は、実験で行われる操作およびその操作によって観測される結果(以下、観測値と記すこともある。)、並びに、操作と結果との因果関係を含む情報を入力として受け付ける。なお、ある1つ以上の結果に基づいてさらに別の結果が得られる場合、この因果関係は、その結果同士の因果関係も含む。ここで入力される操作は、最終的な出力を特定するために有効な操作である。また、観測される結果は、操作の影響により観測され得る値(観測値)と言うこともできる。
過去の知見から、ある結果に影響を及ぼし得る操作の特定は可能である。そこで、本発明では、ある操作によって結果に影響を及ぼす因果関係が既知であるものとする。また、本発明では、その因果関係が有向非巡回グラフ(DAG:Directed acyclic graph)で表されているものとする。以下の説明では、有向非巡回グラフのことを単にグラフと記す。
図2は、操作と結果との因果関係を示すグラフの例を示す説明図である。図2に例示するノードxが操作を表し、ノードuが結果を表す。また、操作と結果とを結ぶ矢印が、操作と結果との因果関係を表す。上述する図11に示す例では、xが「インシュリンを投与するかしないか」を表す操作に対応し、uが「血糖値が高いか低いか」を表す結果に対応する。
図3は、操作と結果との因果関係を示すグラフの他の例を示す説明図である。なお、図3に例示する因果関係を示すグラフは、図12に例示する因果関係を示すグラフと同様である。図3に例示するノードx〜xが操作を表し、ノードu〜uが結果(中間結果)を表し、ノードyが最終結果を示す。図3に示す例では、i番目の薬の投与の有無を表す操作をx∈{0,1}(ただし、x=0の場合に薬を投与せず、x=1の場合に薬を投与する。)で表す。また、j番目の測定値(例えば、血圧、血糖値など)が所定の基準よりも良いか否かを表す結果をu∈{0,1}(ただし、u=0の場合に結果が悪い、u=1の場合に結果が良い、とする。)で表す。また、健康になったか否かを表す最終結果をy∈{0,1}(ただし、y=0の場合に最終結果が悪い、y=1の場合に最終結果が良い、とする。)で表す。
図3に示す例では、各xが決定されると、対応する確率的な観測が得られることを示す。言い換えると、各観測値が、矢印の元のノードの値(操作)に影響を受けることを示す。また、図3に例示するように、入力されるグラフの因果関係は、操作と結果との因果関係だけでなく、結果同士の因果関係を含んでいてもよい。
そこで、本実施形態の第一受付部10は、実験の操作を示す複数のノードおよび操作の結果を示す複数のノード、並びに、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。
第二受付部20は、上述する因果関係(すなわち、実験の操作と操作の結果との因果関係)の程度を示す情報を入力として受け付ける。因果関係の程度を示す情報とは、具体的には、ある操作を行った場合に得られる結果の確率である。以下の説明では、この因果関係の程度を示す情報のことを、因果関係を示す確率または単に確率と記す。
例えば、図11に示す例において、インシュリンを投与した(x=1)場合に血糖値が低い(u=0)という因果関係を示す確率は、図11に例示する表から、0.2であると言える。
また、第二受付部20は、因果関係を示す確率そのものではなく、因果関係の程度(因果関係を示す確率)を推定可能な過去の実験結果を入力として受け付けてもよい。因果関係の程度を推定可能な過去の実験結果とは、個々の実験結果または実験結果の一部の集計値である。
図4は、実験結果の例を示す説明図である。図4に示す例は、インシュリンの投与の有無についての血糖値を示す実験結果の例を示す。例えば、図4に示す被験者番号10001の被験者にインシュリンを投与しなかった(インシュリン投与=0)場合、血糖値が150で血糖値が高い(0)と判定されたことを示す。
例えば、図4に示すように、「インシュリンを投与しない実験(x=0)を100回行ったときに、血糖値が高いという結果(u=0)が72回、血糖値が低いという結果(u=1)が28回である」という実験結果が得られているとする。この実験結果を利用することで、インシュリンを投与しなかった(x=0)場合に血糖値が高い(u=0)という因果関係を示す確率が、72/100=0.72と算出できる。第二受付部20は、このように、因果関係の程度を推定可能な過去の実験結果を入力として受け付けてもよい。
実験内容決定部30は、第一受付部10への入力および第二受付部20への入力に基づいて、次にすべき実験の操作の内容(具体的には、実験の操作を行うべき順序)を決定する。実験内容決定部30が決定する実験の内容は、具体的には、操作の組み合わせ及び実験回数である。
実験内容決定部30は、結果のノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作方法(以下、介入方法と記す場合もある)を特定する。
以下、具体例を用いて、実験内容を決定する方法を説明する。図5は、操作と結果との因果関係を示すグラフの他の例を示す説明図である。図5に例示するノードx〜xが操作を表し、ノードu〜uが結果(中間結果)を表し、ノードyが最終結果を示す。なお、ノードyも結果を示すノードであることから、y=uとして説明する。
図5に示す例では、i番目の薬の肥料の使用の有無を表す操作をx∈{0,1}(ただし、x=0の場合に肥料を使用せず、x=1の場合に肥料を使用する。)で表す。また、j番目の生育状態(例えば、葉の大きさ、植物の高さなど)が所定の基準よりも良いか否かを表す結果をu∈{0,1}(ただし、u=0の場合に結果が悪い、u=1の場合に結果が良い、とする。)で表す。また、実りの量を示す最終結果をy∈{0,1}(ただし、y=0の場合に最終結果が悪い、y=1の場合に最終結果が良い、とする。)で表す。
図5に示す例でも、各xが決定されると、対応する確率的な観測が得られる。さらに、図5に示す例では、uについて、操作xおよびxだけでなく、uに依存して対応する確率的な観測が得られる。なお、uに入るエッジは、x,x,…,x,…u,x,xからのエッジになるように並び替えられている。
本具体例では、T回の実験が可能であるとする。また、図5に示す例では、各ノードの取り得る値が2値であることから、各結果のノードiで推定する必要がある因果関係の強さを表す条件付確率の種類数をCとすると、C=2deg(ui)である。ただし、deg(u)は、ノードuへの入り次数(入る矢印の数)を表す。したがって、図5に例示するノードで想定される実験の種類数の総数Cは、C=Σである。
また、本具体例では、各結果のノードで行われる実験回数は、全体で行われる実験の種類に対する各ノードにおける条件付確率を推定するために行われる実験の種類の割合で決定される。すなわち、各結果のノードiで行われる実験の回数をTとすると、T=T・(C/C)である。
まず、結果が操作にのみ依存する結果のノードuがグラフから選択されたとする。この場合、実験内容決定部30は、結果に影響する操作の組み合わせを特定する。ノードuの場合、結果に影響するノードはx,x,xであり、それぞれ、{0,1}の2種類の値をとる。そこで、実験内容決定部30は、(x,x,x)=(0,0,0),(0,0,1),(0,1,0),…,(1,1,1)を実現するために最も可能性の高い介入方法を特定する。この場合には、操作に応じて{0,1}の値が決定するため、そのまま操作が行われればよい。
この場合、実験内容決定部30は、ノードuについてC=2種類の実験を行うと決定する。また、各種類の実験が均等に行われる場合、実験内容決定部30は、各種類の実験をそれぞれ、T/C回行うと決定する。実験内容決定部30は、ノードuについて、(x,x,x)=(0,0,0),(0,0,1),(0,1,0),…,(1,1,1)を実験の操作を行うべき順序として出力する。ノードuについても同様である。
次に、結果が操作だけでなく他の結果にも依存する結果のノードuがグラフから選択されたとする。ノードuの場合、実験内容決定部30は、結果に影響するノードはx,x,uであり、それぞれ、{0,1}の2種類の値をとる。そこで、実験内容決定部30は、(x,x,u)=(0,0,0),(0,0,1),(0,1,0),…,(1,1,1)を実現するために最も可能性の高い操作方法を特定する。
具体的には、実験内容決定部30は、結果のノードが依存する操作のノードを特定する。結果のノードuが依存する操作のノードは、x,x,xである。この場合、実験内容決定部30は、結果のノードuが依存する操作のノードを、x,x,xと特定する。実験内容決定部30は、特定したノードを用いて、結果に影響する操作の組み合わせを実現するために最も可能性の高い介入方法を特定する。
なお、ノードuについては、ノードuに対する方法と同様に、x,x,xが与えられた場合の実現確率が、具体的な実験結果により算出される。例えば、x=0を想定した操作について、u=1になる実現確率が、以下のように算出されて推定されるとする。
P(u=1|(x,x,x))=(0,0,0))=0.4
P(u=1|(x,x,x))=(0,1,0))=0.5
P(u=1|(x,x,x))=(1,0,0))=0.6
P(u=1|(x,x,x))=(1,1,0))=0.3
は、2値の値をとることが想定されているため、上記結果から、以下の結果も計算される。
P(u=0|(x,x,x))=(0,0,0))=0.6
P(u=0|(x,x,x))=(0,1,0))=0.5
P(u=0|(x,x,x))=(1,0,0))=0.4
P(u=0|(x,x,x))=(1,1,0))=0.7
このとき、uが0になる確率が最も高いのは、(x,x,x)=(1,1,0)の場合で0.7である。また、xの値は、1または0に確率1で特定される。したがって、(x,x,x,x)=(1,0,1,0)の操作により、(x,x,u)=(0,0,0)になる確率が0.7と推定される。言い換えると、上記操作によって、70%の確率で適切なサンプルが取れるとも言える。
そこで、実験内容決定部30は、ノードuについて(x,x,u)=(0,0,0)の実験を行う場合には、(x,x,x,x)=(1,0,1,0)の操作を行うと決定する。実験の種類についても同様である。なお、実現確率が低いものは、そもそも発生する確率が低いものであるため、最終結果への影響が小さいものと言える。
上記内容について、より詳細に説明する。図5に例示するuを推定する場合、x〜xを直接操作できるため、条件を100%の確率で達成できる。すなわち、条件付き確率P(u=1|x,x,x)の推定を効率的に行うことが可能である。一方、uを推定する場合、狙った実験を高々70%の確率でしか行うことが出来ないため、推定の効率は低下する。
しかし、最終的な目標は、y=1を達成する確率が最も高い操作を発見することである。この点に注目する。(x,x,u)=(0,0,0)という事象は、どのような操作の組合せに対しても、高々70%の確率でしか起こらない。よって、事象が起こる確率が低い場合には、その事象に対応する条件付き確率の推定精度が低くても、最終的な目標(y=1)を達成する確率の推定に大きな影響を与えない。以上のことからも、順次実験を行ってパラメータを推定することが正当化される。
また、各種類の実験が均等に行われる場合、実験内容決定部30は、ノードuと同様、それぞれの介入(各種類の実験)をそれぞれ、T/C回行うと決定する。言い換えると、この内容に基づいて、実験者は、その組み合わせで肥料を使用し、観測する実験を行うことになる。
例えば、この実験によりP(u=1|(x,x,u)=(0,0,0))を推定するとする。例えば、ノードu全体でT回の実験を行うと決定された場合、ノードuで行われる実験の種類は8種類のため、(x,x,x,x)=(1,0,1,0)の実験がT/8回割り当てられる。そして、この実験により、(x,x,u)=(0,0,0)になった回数で、(x,x,u)=(0,0,0)かつu=1になった回数を割ることで、P(u=1|(x,x,u)=(0,0,0))が推定される。
このように、全てのノードに関して親ノードの状態が与えられたときの確率(条件付き確率)が推定できれば、y=1を実現する確率が最も高い操作方法(介入方法)を特定することが可能になる。x,…,xが与えられたときのy=1になる確率は、以下の式1によって算出される。
Figure 2018211617
このように、結果のノードが操作のノードだけでなく他の結果のノードにも依存する場合、先に他の結果のノードの確率が算出される必要がある。そこで、実験内容決定部30は、操作のノードにのみ依存する結果のノードを先に(優先的に)実験すべきと決定する。
このような実験過程を経た場合、例えば、特許文献1に記載された方法では、O(2)回の実験を必要とするが、本実施形態の実験計画最適化装置100では、O(2*4)回の実験で済む。一般的に言えば、網羅的にO(2)回の実験が必要な場合において、本実施形態の実験計画最適化装置100による実験計画では、O(|V|2{maxindeg})回の実験ですむ。ただし、|V|は頂点数であり、maxindegは最大入り次数(単一頂点に入る枝数の最大)である。これは、maxindegが定数で抑えられるグラフに対しては、実験操作の回数が頂点数に対して線形で抑えられることを意味する。O(2)は、nに対して指数のオーダであることから、この因果グラフを効果的に用いた実験計画により大きく実験回数を減らすことができると言える。
なお、上記の実験操作において、各ノードは2値をとるものとしたが、これは多値の場合にも容易に拡張できる。また、上記の操作では、実験回数を分割し、i番目のノードの条件付確率の推定にTサンプルを用いるとした。しかし、このTサンプルの実験を行っている間にも、例えばi+1番目の頂点に関してもデータを取得することができ、推定も可能である。特に、uを推定しているときに、x〜xは値が指定されていないが、x〜xについてもランダムな操作を行って、u,uを測定することにより、実験の効率を高めることができる。
以上、具体例に対する操作手順を記述した。以下、一般のグラフに対するアルゴリズムを記述する。まず、入力としてグラフG=(V,E)が与えられる。ここで、Vは、頂点集合であり、Eは有向枝の集合である。グラフは、DAGであり、操作できる頂点集合X(Vの部分集合)には枝が入っていないとする。グラフと総実験回数とが与えられたとき、前述のように各頂点に対してCおよびTを計算できる。
以下の手順を繰り返す。すでに条件付確率の推定が行われた頂点集合をSとおく。実験を始める前の初期状態において、S=Xである。次に、入ってくる枝が、Sからのみである頂点がSの外に必ず存在する。そのような頂点のうち一つを選択し、uとする。この頂点に対して、以下の実験操作を行い、条件付き確率を推定して、この頂点をSに加える。なお、前述の例では、初期状態においてuおよびuが選択可能であり、uの推定が終わるとuが選択可能になり、u,uおよびuの推定が終わるとuが選択可能になる。
実験操作は、以下の通りである。仮定から、uの親ノードv,…,vはSに含まれる。よって、Xに対して操作を行った場合の条件付き確率P(v,…,v|x,…,x)を、上記式1と同様の計算方法により計算できる。よって、(v,…,v)の各{0,1}の組合せに対し、それを達成する確率がもっとも高いx,…,xに対する実験操作を計算できる。この操作を、T/C回行い、各組合せW⊂{0,1}に対して条件付確率P(u|(v,…,v)=W)を推定する。これにより、uに関する条件付き確率の推定が完了する。
出力部40は、実験内容決定部30が決定した実験内容(具体的には、複数の実験の操作を行うべき順序)を出力する。
記憶部50は、例えば、磁気ディスク装置により実現される。また、第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40とは、プログラム(実験計画最適化プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、記憶部50に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、第一受付部10、第二受付部20、実験内容決定部30および出力部40として動作してもよい。また、実験計画最適化装置の機能がSaaS(Software as a Service )形式で提供されてもよい。
また、第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40とは、それぞれが専用のハードウェアで実現されていてもよい。第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40とは、それぞれが汎用または専用の回路(circuitry )により実現されていてもよい。ここで、汎用または専用の回路(circuitry )は、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本実施形態の実験計画最適化装置の動作を説明する。図6は、本実施形態の実験計画最適化装置の動作例を示すフローチャートである。
まず、第一受付部10は、実験の操作および操作の結果を示すノード並びにこれらの因果関係を示すエッジを含むグラフを入力として受け付ける(ステップS11)。実験内容決定部30は、入力されたグラフのうち、実験の操作を示すノードにのみ依存するノードが存在するか否か判断する(ステップS12)。実験の操作を示すノードにのみ依存するノードが存在する場合(ステップS12におけるYes)、実験内容決定部30は、このノードが依存する操作に関する実験を行うと決定する(ステップS13)。そして、出力部40は、決定した実験の操作を出力する(ステップS14)。その後、ステップS12以降の処理が繰り返される。また、第二受付部20は、出力した実験に基づく実験結果を入力として逐次受け付ける。
一方、実験の操作を示すノードにのみ依存するノードが存在しない場合(ステップS12におけるNo)、実験内容決定部30は、操作の結果を示すノードに依存しているノードが存在するか否か判断する(ステップS15)。操作の結果を示すノードに依存しているノードが存在する場合(ステップS15におけるYes)、第二受付部20は、結果を示すノードとの因果関係を示す確率、または、過去の実験結果を入力する(ステップS16)。
実験内容決定部30は、入力された確率または実験結果に基づいて、入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する(ステップS17)。そして、出力部40は、特定された操作を出力する(ステップS18)。その後、ステップS15以降の処理が繰り返される。また、第二受付部20は、出力した実験に基づく実験結果を入力として逐次受け付ける。
一方、操作の結果を示すノードに依存しているノードが存在しない場合(ステップS15におけるYes)、処理を終了する。
以上のように、本実施形態では、第一受付部10が、実験の操作を示す複数のノード、操作の結果を示す複数のノード、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。また、第二受付部20が、実験の操作と操作の結果との因果関係の程度を示す情報、または因果関係の強さを推定可能な過去の実験結果を入力として受け付ける。そして、実験内容決定部30および出力部40が、第一受付部10が受け付けた入力と、第二受付部20が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する。よって、背後に存在する因果関係を考慮して実験計画を最適化できる。
例えば、操作による途中の結果や、操作と結果との因果関係を考慮せず、操作と最終結果のみを考慮して実験計画を作成することも可能である。図7は、実験計画の例を示す説明図である。例えば、図7に例示する各操作xが2値の値を取る場合、実験の操作の種類の組合せだけでも、2になるため、実験回数は指数的(O(2):nは例えば、薬の種類)に増加してしまう。
一方、本実施形態では、例えば、図3に例示するようなグラフ構造および因果関係を考慮して実験計画を作成する。図8は、実験回数の例を示す説明図である。例えば、図8におけるL1の部分について、x,x,xを操作して、uへの依存関係を実験する。この実験回数は、O(2)=O(1)である(ここでは、k=3)。L2の部分およびL3の部分についても同様である。図8のL4の部分について、u,u,uを操作するかのようなx〜xの組も特定できる。そこで、特定した組による操作によって、yを推定する。以上のことから、ノード数を|V|とすると、O(|V|)で実験できることが分かる。すなわち、本実施形態の実験計画最適化装置により、実験回数を抑制することが可能になる。
次に、本発明の概要を説明する。図9は、本発明による情報処理システムの概要を示すブロック図である。本発明による実験計画最適化装置80は、実験の操作を示す複数のノード(例えば、ノードx)、操作の結果を示す複数のノード(例えば、ノードu)、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部81(例えば、第一受付部10)と、実験の操作と操作の結果との因果関係の程度を示す情報(例えば、確率)、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部82(例えば、第二受付部20)と、第一受付部81が受け付けた入力と、第二受付部82が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力部83(例えば、実験内容決定部30および出力部40)とを備えている。
そのような構成により、背後に存在する因果関係を考慮して実験計画を最適化できる。
また、出力部83は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定してもよい。
また、出力部83は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、その取り得る値の実現確率が最も高くなる操作を特定してもよい。
また、出力部83は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力してもよい。
また、出力部83は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、その実験の種類ごとの実験回数を決定してもよい。
また、出力部83は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定してもよい。
図10は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、CPU1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
上述の実験計画最適化装置は、コンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(実験計画最適化プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行しても良い。
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、前記第一受付部が受け付けた入力と、前記第二受付部が受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力部とを備えたことを特徴とする実験計画最適化装置。
(付記2)出力部は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記1記載の実験計画最適化装置。
(付記3)出力部は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、当該取り得る値の実現確率が最も高くなる操作を特定する付記2記載の実験計画最適化装置。
(付記4)出力部は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力する付記1から付記3のうちのいずれか1つに記載の実験計画最適化装置。
(付記5)出力部は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、当該実験の種類ごとの実験回数を決定する付記1から付記4のうちのいずれか1つに記載の実験計画最適化装置。
(付記6)出力部は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定する付記1から付記5のうちのいずれか1つに記載の実験計画最適化装置。
(付記7)実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付け、受け付けたグラフと、前記程度を示す情報または前記実験結果とに基づいて、複数の前記実験の操作を行うべき順序を出力することを特徴とする実験計画最適化方法。
(付記8)結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記7記載の実験計画最適化方法。
(付記9)コンピュータに、実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、前記第一受付処理で受け付けた入力と、前記第二受付処理で受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力処理を実行させるための実験計画最適化プログラム。
(付記10)コンピュータに、出力処理で、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記9記載の実験計画最適化プログラム。
10 第一受付部
20 第二受付部
30 実験内容決定部
40 出力部
50 記憶部
100 実験計画最適化装置

Claims (10)

  1. 実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、
    前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、
    前記第一受付部が受け付けた入力と、前記第二受付部が受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力部とを備えた
    ことを特徴とする実験計画最適化装置。
  2. 出力部は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
    請求項1記載の実験計画最適化装置。
  3. 出力部は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、当該取り得る値の実現確率が最も高くなる操作を特定する
    請求項2記載の実験計画最適化装置。
  4. 出力部は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力する
    請求項1から請求項3のうちのいずれか1項に記載の実験計画最適化装置。
  5. 出力部は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、当該実験の種類ごとの実験回数を決定する
    請求項1から請求項4のうちのいずれか1項に記載の実験計画最適化装置。
  6. 出力部は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定する
    請求項1から請求項5のうちのいずれか1項に記載の実験計画最適化装置。
  7. 実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、
    前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付け、
    受け付けたグラフと、前記程度を示す情報または前記実験結果とに基づいて、複数の前記実験の操作を行うべき順序を出力する
    ことを特徴とする実験計画最適化方法。
  8. 結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
    請求項7記載の実験計画最適化方法。
  9. コンピュータに、
    実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、
    前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、
    前記第一受付処理で受け付けた入力と、前記第二受付処理で受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力処理
    を実行させるための実験計画最適化プログラム。
  10. コンピュータに、
    出力処理で、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
    請求項9記載の実験計画最適化プログラム。
JP2019518659A 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム Active JP6954347B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/018484 WO2018211617A1 (ja) 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム

Publications (2)

Publication Number Publication Date
JPWO2018211617A1 true JPWO2018211617A1 (ja) 2020-03-19
JP6954347B2 JP6954347B2 (ja) 2021-10-27

Family

ID=64274472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019518659A Active JP6954347B2 (ja) 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム

Country Status (3)

Country Link
US (1) US20200167680A1 (ja)
JP (1) JP6954347B2 (ja)
WO (1) WO2018211617A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220067762A1 (en) * 2020-08-26 2022-03-03 Coupang Corp. System and method for predicting an optimal stop point during an experiment test

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3195031B2 (ja) * 1992-02-28 2001-08-06 株式会社日立製作所 テスト仕様生成方法及び半導体装置検査装置及び半導体装置検査方法
JP2002093674A (ja) * 2000-07-13 2002-03-29 Seiko Epson Corp プロセスシミュレーションパラメータの最適条件決定方法及び最適条件支援装置
JP3959980B2 (ja) * 2001-04-26 2007-08-15 三菱ふそうトラック・バス株式会社 実験計画法に基づくデータ解析方法および装置並びに実験計画法に基づくデータ解析プログラムおよび同プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4528237B2 (ja) * 2005-05-12 2010-08-18 株式会社日立製作所 製品設計パラメータ決定支援システム

Also Published As

Publication number Publication date
WO2018211617A1 (ja) 2018-11-22
US20200167680A1 (en) 2020-05-28
JP6954347B2 (ja) 2021-10-27

Similar Documents

Publication Publication Date Title
US10572822B2 (en) Modular memoization, tracking and train-data management of feature extraction
CN107430611B (zh) 过滤数据沿袭图
US8583649B2 (en) Method and system for clustering data points
US10943181B2 (en) Just in time classifier training
CN106327340B (zh) 一种金融网络的异常节点集合侦测方法及装置
Christian et al. Heuristic solution approaches to the pharmaceutical R&D pipeline management problem
CN110689395B (zh) 用于推送信息的方法和装置
JP2017021772A (ja) コピュラ理論に基づく特徴選択
KR20150084892A (ko) 동적 그래프 퍼포먼스 모니터링
US20190065963A1 (en) Optimal solution search method, optimal solution search program, and optimal solution search apparatus
Blum et al. Construct, merge, solve and adapt: application to the repetition-free longest common subsequence problem
US10366331B2 (en) Interactive method to reduce the amount of tradeoff information required from decision makers in multi-attribute decision making under uncertainty
US20150317283A1 (en) Correlation coefficient calculation method, computer-readable recording medium, and correlation coefficient calculation device
US11636175B2 (en) Selection of Pauli strings for Variational Quantum Eigensolver
JPWO2019123703A1 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
JP6954347B2 (ja) 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム
JPWO2016132550A1 (ja) 抽出プログラム、抽出装置および抽出方法
CN109597819B (zh) 用于更新数据库的方法和装置
WO2018154662A1 (ja) 価格最適化システム、価格最適化方法および価格最適化プログラム
CN109597702B (zh) 消息总线异常的根因分析方法、装置、设备及存储介质
KR20170062235A (ko) 서비스 처리 시스템 및 방법
Abreu et al. A constraint programming-based iterated greedy algorithm for the open shop with sequence-dependent processing times and makespan minimization
CN117763024A (zh) 一种数据分片抽取方法及装置
CN111861519A (zh) 用于数据处理的方法、装置和介质
US20200342331A1 (en) Classification tree generation method, classification tree generation device, and classification tree generation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210913

R150 Certificate of patent or registration of utility model

Ref document number: 6954347

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150