WO2018211617A1 - 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム - Google Patents

実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム Download PDF

Info

Publication number
WO2018211617A1
WO2018211617A1 PCT/JP2017/018484 JP2017018484W WO2018211617A1 WO 2018211617 A1 WO2018211617 A1 WO 2018211617A1 JP 2017018484 W JP2017018484 W JP 2017018484W WO 2018211617 A1 WO2018211617 A1 WO 2018211617A1
Authority
WO
WIPO (PCT)
Prior art keywords
experiment
result
indicating
node
causal relationship
Prior art date
Application number
PCT/JP2017/018484
Other languages
English (en)
French (fr)
Inventor
顕大 矢部
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2019518659A priority Critical patent/JP6954347B2/ja
Priority to PCT/JP2017/018484 priority patent/WO2018211617A1/ja
Priority to US16/612,928 priority patent/US20200167680A1/en
Publication of WO2018211617A1 publication Critical patent/WO2018211617A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Definitions

  • the present invention relates to an experiment plan optimization device, an experiment plan optimization method, and an experiment plan optimization program for optimizing a plan of an experiment performed based on an operation.
  • the combination of fertilizers may affect the degree of plant growth.
  • the preparation of drugs that are considered to be effective may affect the treatment of each disease.
  • Patent Document 1 discloses a method for efficiently determining many design parameters without rework in product development in which there are a large number of design parameters and product functions to be handled and there is an interaction between the design parameters and product functions.
  • a model in which the mutual relationship between design parameters is structured is prepared, a large experiment is assigned for each design parameter group information acquired from the model after the structuring process, and large experiment plan information is obtained. Is output.
  • the large experiment plan information includes a large experiment ID ⁇ assigned to each design parameter group, an experiment order, a list of corresponding design parameters, an interface parameter with a preceding experiment, the number of experiment levels, and a level value thereof.
  • FIG. 11 is an explanatory diagram showing an example of an assumed result. Even if the result illustrated in FIG. 11 is supposed to be obtained, this result is not actually known. Therefore, the above-described operation is performed a plurality of times, and the result illustrated in FIG. 11 is estimated from the obtained experimental result.
  • FIG. 12 is an explanatory diagram illustrating an example of a graph indicating a causal relationship between an operation and a result.
  • Figure x 1 ⁇ x 3 in 12 represents an operation of whether the administration of nitrogen-based fertilizer each three kinds
  • x 4 ⁇ x 6 is represents the operation of whether to administer the phosphorus-based fertilizer each three kinds
  • x It is assumed that 7 to x 9 represent an operation of whether or not three kinds of potassium fertilizers are to be administered.
  • u 1 to u 3 represent the amounts of nitrogen, phosphorus, and potassium, respectively.
  • y represents whether or not the plant has grown well. In such a setting, an optimal fertilizer administration strategy is desired.
  • the efficient dividing method is self-evident, but when the operation and the observed value are given by a general causal graph, the dividing method is not self-evident.
  • an object of the present invention is to provide an experiment plan optimization apparatus, an experiment plan optimization method, and an experiment plan optimization program that can optimize an experiment plan in consideration of the causal relationship existing behind.
  • the experiment design optimization apparatus receives, as an input, a graph including a plurality of nodes indicating the operation of the experiment, a plurality of nodes indicating the result of the operation, and an edge indicating the causal relationship between the operation of the experiment and the result of the operation.
  • a first receiving unit for receiving a second receiving unit for receiving, as input, information indicating the degree of the causal relationship between the operation of the experiment and the result of the experiment, or past experimental results capable of estimating the strength of the causal relationship;
  • an output unit that outputs an order in which a plurality of experiments should be performed based on an input received by one receiving unit and information received by a second receiving unit.
  • the experiment design optimization method receives, as an input, a graph including a plurality of nodes indicating the operation of the experiment, a plurality of nodes indicating the result of the operation, and an edge indicating the causal relationship between the operation of the experiment and the result of the operation.
  • An experiment design optimization program includes a computer including a plurality of nodes indicating an operation of an experiment, a plurality of nodes indicating the result of the operation, and an edge indicating a causal relationship between the operation of the experiment and the result of the operation.
  • First acceptance processing that accepts as an input
  • second acceptance processing that accepts information indicating the degree of the causal relationship between the operation of the experiment and the result of the experiment, or past experimental results that can estimate the strength of the causal relationship as input
  • an output process for outputting the order in which a plurality of experiments should be performed is executed based on the input received in the first reception process and the information received in the second reception process.
  • FIG. 1 is a block diagram showing an embodiment of an experimental design optimization apparatus according to the present invention.
  • the experiment plan optimization apparatus 100 includes a first reception unit 10, a second reception unit 20, an experiment content determination unit 30, an output unit 40, and a storage unit 50.
  • the 1st reception part 10 and the 2nd reception part 20 may be implement
  • the storage unit 50 stores the information received by the first receiving unit 10 and the information received by the second receiving unit 20.
  • the first accepting unit 10 accepts, as inputs, information including an operation performed in an experiment, a result observed by the operation (hereinafter, sometimes referred to as an observation value), and a causal relationship between the operation and the result. In addition, when another result is obtained based on a certain one or more result, this causal relationship also includes the causal relationship between the results.
  • the operation input here is an operation effective for specifying the final output.
  • the observed result can also be said to be a value (observed value) that can be observed due to the influence of the operation.
  • DAG directed acyclic graph
  • FIG. 2 is an explanatory diagram showing an example of a graph showing a causal relationship between an operation and a result.
  • a node x illustrated in FIG. 2 represents an operation, and a node u represents a result.
  • An arrow connecting the operation and the result represents a causal relationship between the operation and the result.
  • x corresponds to an operation indicating whether or not insulin is administered
  • u corresponds to a result indicating whether the blood glucose level is high or low.
  • FIG. 3 is an explanatory diagram illustrating another example of a graph showing a causal relationship between an operation and a result. 3 is the same as the graph showing the causal relationship illustrated in FIG.
  • Nodes x 1 to x 9 illustrated in FIG. 3 represent operations, nodes u 1 to u 3 represent results (intermediate results), and node y represents a final result.
  • each observation value is affected by the value (operation) of the original node of the arrow.
  • the causal relationship of the input graph may include not only the causal relationship between the operation and the result but also the causal relationship between the results.
  • the first reception unit 10 of the present embodiment includes a plurality of nodes indicating the operation of the experiment, a plurality of nodes indicating the result of the operation, and an edge indicating the causal relationship between the operation of the experiment and the result of the operation. Is accepted as input.
  • the second reception unit 20 receives as input information indicating the degree of the above-described causal relationship (that is, the causal relationship between the operation of the experiment and the result of the operation).
  • the information indicating the degree of the causal relationship is specifically the probability of the result obtained when a certain operation is performed.
  • information indicating the degree of the causal relationship is referred to as a probability indicating the causal relationship or simply a probability.
  • the second receiving unit 20 may receive, as an input, past experimental results that can estimate the degree of the causal relationship (probability indicating the causal relationship) instead of the probability that indicates the causal relationship itself.
  • the past experimental result capable of estimating the degree of the causal relationship is an individual experimental result or a total value of a part of the experimental result.
  • FIG. 4 is an explanatory diagram showing an example of experimental results.
  • the second reception unit 20 may receive a past experimental result that can estimate the degree of the causal relationship as an input.
  • the experiment content determination unit 30 is the content of the next operation to be performed (specifically, the order in which the operation of the experiment is to be performed) ). Specifically, the experiment content determined by the experiment content determination unit 30 is a combination of operations and the number of experiments.
  • the experiment content determination unit 30 specifies the most likely operation method (hereinafter also referred to as an intervention method) in order to realize a combination of values input to the result node.
  • FIG. 5 is an explanatory diagram illustrating another example of a graph showing a causal relationship between an operation and a result.
  • a corresponding probabilistic observation is obtained. Furthermore, in the example shown in FIG. 5, the corresponding probabilistic observation is obtained for u 3 depending not only on the operations x 4 and x 6 but also on u 2 . Note that the edges entering u i are rearranged to be edges from x 1 , x 2 ,..., X 6 ,... U 1 , x 2 , x 3 .
  • the experiment content determination unit 30 identifies combinations of operations that affect the results.
  • the experiment content determination unit 30 specifies an operation node on which the result node depends.
  • the nodes of the operation on which the resulting node u 2 depends are x 3 , x 5 and x 6 .
  • the experiment content determination unit 30 identifies the operation nodes on which the result node u 2 depends as x 3 , x 5 , and x 6 .
  • the experiment content determination unit 30 uses the identified node to identify the most likely intervention method for realizing a combination of operations that affect the result.
  • the experiment content determination unit 30 determines that each intervention (each type of experiment) is performed T 3 / C 3 times, similarly to the node u 1 . In other words, based on this content, the experimenter will perform an observation experiment using the fertilizer in combination.
  • the experiment content determination unit 30 determines that the result node that depends only on the operation node should be tested first (preferentially).
  • each node takes a binary value, but this can easily be extended to a multivalued case.
  • the number of experiments is divided, and Ti samples are used to estimate the conditional probability of the i-th node.
  • data can be acquired and estimated for the i + 1 th vertex, for example.
  • u 1 when u 1 is estimated, values of x 4 to x 6 are not specified, but a random operation is performed on x 4 to x 6 to measure u 2 and u 3. , Can increase the efficiency of the experiment.
  • a graph G (V, E) is given as an input.
  • V is a vertex set
  • E is a set of directed edges.
  • the graph is a DAG, and it is assumed that there is no branch in the operable vertex set X (subset of V).
  • C i and T i can be calculated for each vertex as described above.
  • the experimental operation is as follows. From the assumption, u's parent nodes v 1 ,..., V k are included in S. Therefore, the conditional probability P (v 1 ,..., V k
  • the output unit 40 outputs the experiment content determined by the experiment content determination unit 30 (specifically, the order in which a plurality of experiments should be performed).
  • the storage unit 50 is realized by, for example, a magnetic disk device.
  • the 1st reception part 10, the 2nd reception part 20, the experiment content determination part 30, and the output part 40 are implement
  • the program may be stored in the storage unit 50, and the CPU may read the program and operate as the first reception unit 10, the second reception unit 20, the experiment content determination unit 30, and the output unit 40 according to the program.
  • the function of the experiment plan optimization apparatus may be provided in SaaS (Software as a Service) format.
  • each of the first reception unit 10, the second reception unit 20, the experiment content determination unit 30, and the output unit 40 may be realized by dedicated hardware.
  • the first reception unit 10, the second reception unit 20, the experiment content determination unit 30, and the output unit 40 may each be realized by a general-purpose or dedicated circuit (circuitry IV).
  • the general-purpose or dedicated circuit may be configured by a single chip or may be configured by a plurality of chips connected via a bus.
  • the plurality of information processing devices and circuits may be centrally arranged or distributedly arranged. May be.
  • the information processing apparatus, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client and server system and a cloud computing system.
  • FIG. 6 is a flowchart showing an operation example of the experiment plan optimization apparatus of the present embodiment.
  • the first accepting unit 10 accepts, as an input, a graph including an experiment operation and a node indicating the result of the operation and an edge indicating the causal relationship between them (step S11).
  • the experiment content determination unit 30 determines whether there is a node that depends only on the node indicating the operation of the experiment in the input graph (step S12). When there is a node that depends only on the node indicating the operation of the experiment (Yes in step S12), the experiment content determination unit 30 determines to perform an experiment related to the operation on which the node depends (step S13). And the output part 40 outputs operation of the determined experiment (step S14). Thereafter, the processing after step S12 is repeated. Moreover, the 2nd reception part 20 receives sequentially the experimental result based on the output experiment as an input.
  • the experiment content determination unit 30 determines whether there is a node that depends on the node indicating the result of the operation. (Step S15).
  • the second receiving unit 20 inputs the probability indicating the causal relationship with the node indicating the result, or the past experimental result. (Step S16).
  • the experiment content determination unit 30 identifies the most likely operation in order to realize a combination of input values based on the input probability or the experimental result (step S17). Then, the output unit 40 outputs the specified operation (step S18). Thereafter, the processing after step S15 is repeated. Moreover, the 2nd reception part 20 receives sequentially the experimental result based on the output experiment as an input.
  • step S15 when there is no node depending on the node indicating the result of the operation (Yes in step S15), the process is terminated.
  • the first reception unit 10 includes a plurality of nodes indicating the operation of the experiment, a plurality of nodes indicating the result of the operation, and an edge indicating the causal relationship between the operation of the experiment and the result of the operation. Accept including graph as input.
  • the 2nd reception part 20 receives the past experimental result which can estimate the intensity
  • FIG. 7 is an explanatory diagram showing an example of an experiment plan.
  • each operation x i illustrated in FIG. 7 takes a binary value, even if only a combination of the types of operation of the experiment is 2 i , the number of experiments is exponential (O (2 n ): n is For example, the number of drugs increases.
  • FIG. 8 is an explanatory diagram showing an example of the number of experiments.
  • x 1 , x 2 , and x 3 are manipulated for the portion L 1 in FIG. 8, and the dependency on u 1 is experimented.
  • k 3
  • a set of x 1 to x 9 as if u 1 , u 2 , u 3 are operated can also be specified. Therefore, y is estimated by an operation with the specified set. From the above, it can be seen that the experiment can be performed with O (
  • FIG. 9 is a block diagram showing an outline of an information processing system according to the present invention.
  • the experiment plan optimizing apparatus 80 according to the present invention includes a plurality of nodes (for example, node x i ) indicating the operation of the experiment, a plurality of nodes (for example, node u j ) indicating the result of the operation, and the operation and operation of the experiment.
  • Information indicating the degree of the causal relationship between the first accepting unit 81 (for example, the first accepting unit 10) that receives a graph including an edge indicating the causal relationship with the result of the experiment as an input, and the operation of the experiment and the result of the operation (for example, , Probability), or a second reception unit 82 (for example, the second reception unit 20) that accepts past experimental results that can be used to estimate the strength of the causal relationship, and an input that is received by the first reception unit 81;
  • an output unit 83 for example, the experiment content determining unit 30 and the output unit 40 that outputs the order in which a plurality of experiments should be performed is provided.
  • the output unit 83 may specify the operation with the highest possibility in order to realize a combination of values input to the node indicating the result.
  • the output unit 83 may calculate the realization probability of the value that can be taken by the node indicating the result based on the past experimental result, and may specify the operation with the highest realization probability of the possible value.
  • the output unit 83 may output a plurality of nodes depending only on the node indicating the operation of the experiment as nodes that can be experimented in parallel.
  • the output unit 83 may determine the number of experiments for each type of experiment according to the number of types of experiments specified for each node indicating the result with respect to the total number of experiments determined in advance.
  • the output unit 83 may determine to preferentially experiment with a result node that depends only on the operation node.
  • FIG. 10 is a schematic block diagram showing a configuration of a computer according to at least one embodiment.
  • the computer 1000 includes a CPU 1001, a main storage device 1002, an auxiliary storage device 1003, and an interface 1004.
  • experiment plan optimization apparatus is mounted on the computer 1000.
  • the operation of each processing unit described above is stored in the auxiliary storage device 1003 in the form of a program (experiment plan optimization program).
  • the CPU 1001 reads out the program from the auxiliary storage device 1003, expands it in the main storage device 1002, and executes the above processing according to the program.
  • the auxiliary storage device 1003 is an example of a tangible medium that is not temporary.
  • Other examples of the non-temporary tangible medium include a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, and a semiconductor memory connected via the interface 1004.
  • this program is distributed to the computer 1000 via a communication line, the computer 1000 that has received the distribution may develop the program in the main storage device 1002 and execute the above processing.
  • the program may be for realizing a part of the functions described above. Further, the program may be a so-called difference file (difference program) that realizes the above-described function in combination with another program already stored in the auxiliary storage device 1003.
  • difference file difference program
  • the output unit calculates the realization probability of a value that can be taken by the node indicating the result based on the past experimental result, and identifies an operation that provides the highest realization probability of the possible value.
  • Experimental design optimization device calculates the realization probability of a value that can be taken by the node indicating the result based on the past experimental result, and identifies an operation that provides the highest realization probability of the possible value.
  • An output part outputs the some node which depends only on the node which shows operation of experiment as a node which can be experimented in parallel, The experiment plan as described in any one of Additional remark 1 to Additional remark 3 Optimization device.
  • the output unit determines the number of experiments for each type of the experiment according to the number of types of experiments specified for each node indicating the result with respect to the predetermined total number of experiments.
  • the experimental design optimization device according to any one of the above.
  • Appendix 7 Accepting as input a plurality of nodes indicating an operation of an experiment, a plurality of nodes indicating the result of the operation, and an edge indicating a causal relationship between the operation of the experiment and the result of the operation, Information indicating the degree of the causal relationship between the operation of the experiment and the result of the operation, or the past experimental result capable of estimating the strength of the causal relationship is accepted as an input, the received graph, and the information indicating the degree or the An experiment design optimization method characterized by outputting a sequence in which a plurality of operations of the experiment are to be performed based on an experiment result.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Mathematical Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

第一受付部81は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。第二受付部82は、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける。出力部83は、第一受付部81が受け付けた入力と、第二受付部82が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する。

Description

実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム
 本発明は、操作に基づいて行われる実験の計画を最適化する実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラムに関する。
 製薬や農業の分野では、各種組み合わせの最適性を実験によって求めることが一般に行われている。例えば、農業の分野では、肥料の組み合わせが、植物の生育度合いに影響を及ぼすことが考えられる。また、製薬の分野では、効果があるとされる薬の調合が、各疾患の治療に影響を及ぼすことが考えられる。
 なお、製薬や農業の分野では、複数の未知の要因により一つの組み合わせから必ずしも100%の結果を得られるわけではない。そのため、対象とする組み合わせを実現する行為が想定する結果に影響を及ぼす確率(影響度合い)は、同じ操作を複数回実験することにより導出される。以下、ある結果を導出するために行われる各行為のことを、操作と記す。例えば、上述の例では、肥料の量の選択や、薬の調合の有無などが操作として挙げられる。
 多くの実験を行うことで、結果に影響を及ぼす確率の算出精度は向上する。しかし、操作の組み合わせが増大すると、それに応じて実験を行う回数も増大する。そのため、候補となる組み合わせの数を低減できることが好ましい。
 例えば、特許文献1には、取り扱う設計パラメータや製品機能の数が多く、設計パラメータや製品機能間に相互作用が存在する製品開発において、手戻りなく効率的に数多くの設計パラメータを決定する方法が記載されている。特許文献1に記載された方法では、設計パラメータ間の相互関係を構造化したモデルを準備し、構造化処理後のモデルから取得される設計パラメータグループ情報ごとに大実験を割り付け、大実験計画情報を出力する。この大実験計画情報には、設計パラメータグループ毎に割り付けられた大実験ID 、実験順序、該当する設計パラメータ一覧、先行実験とのインターフェイスパラメータ、実験水準数およびその水準値が含まれる。
特開2006-344200号公報
 以下、影響度合いを導出する方法を具体例を用いて説明する。ここでは、説明を単純にするために、1つの操作によって1つの結果を得ることを想定する。インシュリンの投与の有無を表す操作をx∈{0,1}(ただし、x=0の場合にインシュリンを投与せず、x=1の場合にインシュリンを投与する。)で表す。また、操作による結果として、血糖値が高いか低いかを表す結果をu∈{0,1}(ただし、u=0の場合に血糖値が高い、u=1の場合に血糖値が低い、とする。)で表す。
 図11は、想定される結果の例を示す説明図である。図11に例示する結果が、本来得られるはずの結果であったとしても、この結果は実際には分からない。そこで、上述する操作を複数回行って、得られた実験結果から図11に例示する結果を推定することになる。
 例えば、インシュリンを投与しなかった実験(x=0)を100回行ったときに、血糖値が高いという結果(u=0)が72回、血糖値が低いという結果(u=1)が28回、それぞれ得られたとする。この実験結果により、図11に例示する表に近い結果が推定される。インシュリンを投与した実験(x=1)についても同様である。以上が、効果を測定することの意味である。
 このように一つの操作の効果を測定するのは簡単である。しかし、複数の操作が互いに影響し合って効果を生じる場合、最適な操作を発見する問題を解かなければならない場合も存在する。
 図12は、操作と結果との因果関係を示すグラフの例を示す説明図である。図12においてx~xが、窒素系肥料各三種を投与するか否かという操作を表し、x~xが、リン系肥料各三種を投与するか否かという操作を表し、x~xが、カリウム系肥料各三種を投与するか否かという操作を表しているとする。また、u~uが、それぞれ、窒素、リンおよびカリウムの土壌量を表しているとする。また、yが、植物が良く生育したか否かを表しているとする。このような設定において、最適な肥料の投与戦略を求めたいとする。
 まず、それぞれの肥料間には、相互作用がある。例えば、x~xでは、どれか一つが投与されていれば十分という相互作用がある、xとxは、共に投与されているときに相乗効果が働くという相互作用がある、などである。仮に、全ての操作に相互作用が存在する場合、特許文献1に記載された方法では、実験設定を省略することができない。そのため、例えば、ある操作が2種類の候補を含むとし、その操作がn種類考えられる場合、実験の種類が指数的に増加する(この場合、O(2))ため、行われる実験回数も指数のオーダで増加する。したがって、少ない実験回数で最適な戦略を求めるには、実験計画を最適に行うことが重要になる。
 ここで、窒素の土壌量が測定できる場合、x~xが窒素の土壌量に与える作用と、窒素の土壌量が生育に与える作用とを分割して考えることが可能である。図12に示す例では、効率的な分割方法は半ば自明であるが、操作と観測値とが一般的な因果グラフで与えられた場合、その分割方法は自明ではない。
 また、特許文献1に記載された方法では、相互作用が少ない設計パラメータグループを抽出し、その設計パラメータグループに基づいた実験計画を作成する。しかし、前述のような、すべての操作に相互作用が存在する場合には、実験回数削減のために効果を発揮しない。因果関係が存在するパラメータについては、相互作用の有無にかかわらず実験計画を作成できることが好ましい。
 そこで、本発明は、背後に存在する因果関係を考慮して実験計画を最適化できる実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラムを提供することを目的とする。
 本発明による実験計画最適化装置は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、第一受付部が受け付けた入力と、第二受付部が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力部とを備えたことを特徴とする。
 本発明による実験計画最適化方法は、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付け、受け付けたグラフと、程度を示す情報または実験結果とに基づいて、複数の実験の操作を行うべき順序を出力することを特徴とする。
 本発明による実験計画最適化プログラムは、コンピュータに、実験の操作を示す複数のノード、操作の結果を示す複数のノード、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、実験の操作と操作の結果との因果関係の程度を示す情報、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、第一受付処理で受け付けた入力と、第二受付処理で受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力処理を実行させることを特徴とする。 
 本発明によれば、背後に存在する因果関係を考慮して実験計画を最適化できるという技術的効果を奏する。
本発明による実験計画最適化装置の一実施形態を示すブロック図である。 操作と結果との因果関係を示すグラフの例を示す説明図である。 操作と結果との因果関係を示すグラフの他の例を示す説明図である。 実験結果の例を示す説明図である。 操作と結果との因果関係を示すグラフの他の例を示す説明図である。 実験計画最適化装置の動作例を示すフローチャートである。 実験計画の例を示す説明図である。 実験回数の例を示す説明図である。 本発明による情報処理システムの概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。 想定される結果の例を示す説明図である。 操作と結果との因果関係を示すグラフの例を示す説明図である。
 以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による実験計画最適化装置の一実施形態を示すブロック図である。本実施形態の実験計画最適化装置100は、第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40と、記憶部50とを備えている。なお、第一受付部10と第二受付部20とは、一つの受付部によって実現されていてもよい。
 記憶部50は、第一受付部10が受け付けた情報および第二受付部20が受け付けた情報を記憶する。
 第一受付部10は、実験で行われる操作およびその操作によって観測される結果(以下、観測値と記すこともある。)、並びに、操作と結果との因果関係を含む情報を入力として受け付ける。なお、ある1つ以上の結果に基づいてさらに別の結果が得られる場合、この因果関係は、その結果同士の因果関係も含む。ここで入力される操作は、最終的な出力を特定するために有効な操作である。また、観測される結果は、操作の影響により観測され得る値(観測値)と言うこともできる。
 過去の知見から、ある結果に影響を及ぼし得る操作の特定は可能である。そこで、本発明では、ある操作によって結果に影響を及ぼす因果関係が既知であるものとする。また、本発明では、その因果関係が有向非巡回グラフ(DAG:Directed acyclic graph)で表されているものとする。以下の説明では、有向非巡回グラフのことを単にグラフと記す。
 図2は、操作と結果との因果関係を示すグラフの例を示す説明図である。図2に例示するノードxが操作を表し、ノードuが結果を表す。また、操作と結果とを結ぶ矢印が、操作と結果との因果関係を表す。上述する図11に示す例では、xが「インシュリンを投与するかしないか」を表す操作に対応し、uが「血糖値が高いか低いか」を表す結果に対応する。
 図3は、操作と結果との因果関係を示すグラフの他の例を示す説明図である。なお、図3に例示する因果関係を示すグラフは、図12に例示する因果関係を示すグラフと同様である。図3に例示するノードx~xが操作を表し、ノードu~uが結果(中間結果)を表し、ノードyが最終結果を示す。図3に示す例では、i番目の薬の投与の有無を表す操作をx∈{0,1}(ただし、x=0の場合に薬を投与せず、x=1の場合に薬を投与する。)で表す。また、j番目の測定値(例えば、血圧、血糖値など)が所定の基準よりも良いか否かを表す結果をu∈{0,1}(ただし、u=0の場合に結果が悪い、u=1の場合に結果が良い、とする。)で表す。また、健康になったか否かを表す最終結果をy∈{0,1}(ただし、y=0の場合に最終結果が悪い、y=1の場合に最終結果が良い、とする。)で表す。
 図3に示す例では、各xが決定されると、対応する確率的な観測が得られることを示す。言い換えると、各観測値が、矢印の元のノードの値(操作)に影響を受けることを示す。また、図3に例示するように、入力されるグラフの因果関係は、操作と結果との因果関係だけでなく、結果同士の因果関係を含んでいてもよい。
 そこで、本実施形態の第一受付部10は、実験の操作を示す複数のノードおよび操作の結果を示す複数のノード、並びに、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。
 第二受付部20は、上述する因果関係(すなわち、実験の操作と操作の結果との因果関係)の程度を示す情報を入力として受け付ける。因果関係の程度を示す情報とは、具体的には、ある操作を行った場合に得られる結果の確率である。以下の説明では、この因果関係の程度を示す情報のことを、因果関係を示す確率または単に確率と記す。
 例えば、図11に示す例において、インシュリンを投与した(x=1)場合に血糖値が低い(u=0)という因果関係を示す確率は、図11に例示する表から、0.2であると言える。
 また、第二受付部20は、因果関係を示す確率そのものではなく、因果関係の程度(因果関係を示す確率)を推定可能な過去の実験結果を入力として受け付けてもよい。因果関係の程度を推定可能な過去の実験結果とは、個々の実験結果または実験結果の一部の集計値である。
 図4は、実験結果の例を示す説明図である。図4に示す例は、インシュリンの投与の有無についての血糖値を示す実験結果の例を示す。例えば、図4に示す被験者番号10001の被験者にインシュリンを投与しなかった(インシュリン投与=0)場合、血糖値が150で血糖値が高い(0)と判定されたことを示す。
 例えば、図4に示すように、「インシュリンを投与しない実験(x=0)を100回行ったときに、血糖値が高いという結果(u=0)が72回、血糖値が低いという結果(u=1)が28回である」という実験結果が得られているとする。この実験結果を利用することで、インシュリンを投与しなかった(x=0)場合に血糖値が高い(u=0)という因果関係を示す確率が、72/100=0.72と算出できる。第二受付部20は、このように、因果関係の程度を推定可能な過去の実験結果を入力として受け付けてもよい。
 実験内容決定部30は、第一受付部10への入力および第二受付部20への入力に基づいて、次にすべき実験の操作の内容(具体的には、実験の操作を行うべき順序)を決定する。実験内容決定部30が決定する実験の内容は、具体的には、操作の組み合わせ及び実験回数である。
 実験内容決定部30は、結果のノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作方法(以下、介入方法と記す場合もある)を特定する。
 以下、具体例を用いて、実験内容を決定する方法を説明する。図5は、操作と結果との因果関係を示すグラフの他の例を示す説明図である。図5に例示するノードx~xが操作を表し、ノードu~uが結果(中間結果)を表し、ノードyが最終結果を示す。なお、ノードyも結果を示すノードであることから、y=uとして説明する。
 図5に示す例では、i番目の薬の肥料の使用の有無を表す操作をx∈{0,1}(ただし、x=0の場合に肥料を使用せず、x=1の場合に肥料を使用する。)で表す。また、j番目の生育状態(例えば、葉の大きさ、植物の高さなど)が所定の基準よりも良いか否かを表す結果をu∈{0,1}(ただし、u=0の場合に結果が悪い、u=1の場合に結果が良い、とする。)で表す。また、実りの量を示す最終結果をy∈{0,1}(ただし、y=0の場合に最終結果が悪い、y=1の場合に最終結果が良い、とする。)で表す。
 図5に示す例でも、各xが決定されると、対応する確率的な観測が得られる。さらに、図5に示す例では、uについて、操作xおよびxだけでなく、uに依存して対応する確率的な観測が得られる。なお、uに入るエッジは、x,x,…,x,…u,x,xからのエッジになるように並び替えられている。
 本具体例では、T回の実験が可能であるとする。また、図5に示す例では、各ノードの取り得る値が2値であることから、各結果のノードiで推定する必要がある因果関係の強さを表す条件付確率の種類数をCとすると、C=2deg(ui)である。ただし、deg(u)は、ノードuへの入り次数(入る矢印の数)を表す。したがって、図5に例示するノードで想定される実験の種類数の総数Cは、C=Σである。
 また、本具体例では、各結果のノードで行われる実験回数は、全体で行われる実験の種類に対する各ノードにおける条件付確率を推定するために行われる実験の種類の割合で決定される。すなわち、各結果のノードiで行われる実験の回数をTとすると、T=T・(C/C)である。
 まず、結果が操作にのみ依存する結果のノードuがグラフから選択されたとする。この場合、実験内容決定部30は、結果に影響する操作の組み合わせを特定する。ノードuの場合、結果に影響するノードはx,x,xであり、それぞれ、{0,1}の2種類の値をとる。そこで、実験内容決定部30は、(x,x,x)=(0,0,0),(0,0,1),(0,1,0),…,(1,1,1)を実現するために最も可能性の高い介入方法を特定する。この場合には、操作に応じて{0,1}の値が決定するため、そのまま操作が行われればよい。
 この場合、実験内容決定部30は、ノードuについてC=2種類の実験を行うと決定する。また、各種類の実験が均等に行われる場合、実験内容決定部30は、各種類の実験をそれぞれ、T/C回行うと決定する。実験内容決定部30は、ノードuについて、(x,x,x)=(0,0,0),(0,0,1),(0,1,0),…,(1,1,1)を実験の操作を行うべき順序として出力する。ノードuについても同様である。
 次に、結果が操作だけでなく他の結果にも依存する結果のノードuがグラフから選択されたとする。ノードuの場合、実験内容決定部30は、結果に影響するノードはx,x,uであり、それぞれ、{0,1}の2種類の値をとる。そこで、実験内容決定部30は、(x,x,u)=(0,0,0),(0,0,1),(0,1,0),…,(1,1,1)を実現するために最も可能性の高い操作方法を特定する。
 具体的には、実験内容決定部30は、結果のノードが依存する操作のノードを特定する。結果のノードuが依存する操作のノードは、x,x,xである。この場合、実験内容決定部30は、結果のノードuが依存する操作のノードを、x,x,xと特定する。実験内容決定部30は、特定したノードを用いて、結果に影響する操作の組み合わせを実現するために最も可能性の高い介入方法を特定する。
 なお、ノードuについては、ノードuに対する方法と同様に、x,x,xが与えられた場合の実現確率が、具体的な実験結果により算出される。例えば、x=0を想定した操作について、u=1になる実現確率が、以下のように算出されて推定されるとする。
 P(u=1|(x,x,x))=(0,0,0))=0.4
 P(u=1|(x,x,x))=(0,1,0))=0.5
 P(u=1|(x,x,x))=(1,0,0))=0.6
 P(u=1|(x,x,x))=(1,1,0))=0.3
 uは、2値の値をとることが想定されているため、上記結果から、以下の結果も計算される。
 P(u=0|(x,x,x))=(0,0,0))=0.6
 P(u=0|(x,x,x))=(0,1,0))=0.5
 P(u=0|(x,x,x))=(1,0,0))=0.4
 P(u=0|(x,x,x))=(1,1,0))=0.7
 このとき、uが0になる確率が最も高いのは、(x,x,x)=(1,1,0)の場合で0.7である。また、xの値は、1または0に確率1で特定される。したがって、(x,x,x,x)=(1,0,1,0)の操作により、(x,x,u)=(0,0,0)になる確率が0.7と推定される。言い換えると、上記操作によって、70%の確率で適切なサンプルが取れるとも言える。
 そこで、実験内容決定部30は、ノードuについて(x,x,u)=(0,0,0)の実験を行う場合には、(x,x,x,x)=(1,0,1,0)の操作を行うと決定する。実験の種類についても同様である。なお、実現確率が低いものは、そもそも発生する確率が低いものであるため、最終結果への影響が小さいものと言える。
 上記内容について、より詳細に説明する。図5に例示するuを推定する場合、x~xを直接操作できるため、条件を100%の確率で達成できる。すなわち、条件付き確率P(u=1|x,x,x)の推定を効率的に行うことが可能である。一方、uを推定する場合、狙った実験を高々70%の確率でしか行うことが出来ないため、推定の効率は低下する。
 しかし、最終的な目標は、y=1を達成する確率が最も高い操作を発見することである。この点に注目する。(x,x,u)=(0,0,0)という事象は、どのような操作の組合せに対しても、高々70%の確率でしか起こらない。よって、事象が起こる確率が低い場合には、その事象に対応する条件付き確率の推定精度が低くても、最終的な目標(y=1)を達成する確率の推定に大きな影響を与えない。以上のことからも、順次実験を行ってパラメータを推定することが正当化される。
 また、各種類の実験が均等に行われる場合、実験内容決定部30は、ノードuと同様、それぞれの介入(各種類の実験)をそれぞれ、T/C回行うと決定する。言い換えると、この内容に基づいて、実験者は、その組み合わせで肥料を使用し、観測する実験を行うことになる。
 例えば、この実験によりP(u=1|(x,x,u)=(0,0,0))を推定するとする。例えば、ノードu全体でT回の実験を行うと決定された場合、ノードuで行われる実験の種類は8種類のため、(x,x,x,x)=(1,0,1,0)の実験がT/8回割り当てられる。そして、この実験により、(x,x,u)=(0,0,0)になった回数で、(x,x,u)=(0,0,0)かつu=1になった回数を割ることで、P(u=1|(x,x,u)=(0,0,0))が推定される。
 このように、全てのノードに関して親ノードの状態が与えられたときの確率(条件付き確率)が推定できれば、y=1を実現する確率が最も高い操作方法(介入方法)を特定することが可能になる。x,…,xが与えられたときのy=1になる確率は、以下の式1によって算出される。
Figure JPOXMLDOC01-appb-M000001
 このように、結果のノードが操作のノードだけでなく他の結果のノードにも依存する場合、先に他の結果のノードの確率が算出される必要がある。そこで、実験内容決定部30は、操作のノードにのみ依存する結果のノードを先に(優先的に)実験すべきと決定する。
 このような実験過程を経た場合、例えば、特許文献1に記載された方法では、O(2)回の実験を必要とするが、本実施形態の実験計画最適化装置100では、O(2*4)回の実験で済む。一般的に言えば、網羅的にO(2)回の実験が必要な場合において、本実施形態の実験計画最適化装置100による実験計画では、O(|V|2{maxindeg})回の実験ですむ。ただし、|V|は頂点数であり、maxindegは最大入り次数(単一頂点に入る枝数の最大)である。これは、maxindegが定数で抑えられるグラフに対しては、実験操作の回数が頂点数に対して線形で抑えられることを意味する。O(2)は、nに対して指数のオーダであることから、この因果グラフを効果的に用いた実験計画により大きく実験回数を減らすことができると言える。
 なお、上記の実験操作において、各ノードは2値をとるものとしたが、これは多値の場合にも容易に拡張できる。また、上記の操作では、実験回数を分割し、i番目のノードの条件付確率の推定にTサンプルを用いるとした。しかし、このTサンプルの実験を行っている間にも、例えばi+1番目の頂点に関してもデータを取得することができ、推定も可能である。特に、uを推定しているときに、x~xは値が指定されていないが、x~xについてもランダムな操作を行って、u,uを測定することにより、実験の効率を高めることができる。
 以上、具体例に対する操作手順を記述した。以下、一般のグラフに対するアルゴリズムを記述する。まず、入力としてグラフG=(V,E)が与えられる。ここで、Vは、頂点集合であり、Eは有向枝の集合である。グラフは、DAGであり、操作できる頂点集合X(Vの部分集合)には枝が入っていないとする。グラフと総実験回数とが与えられたとき、前述のように各頂点に対してCおよびTを計算できる。
 以下の手順を繰り返す。すでに条件付確率の推定が行われた頂点集合をSとおく。実験を始める前の初期状態において、S=Xである。次に、入ってくる枝が、Sからのみである頂点がSの外に必ず存在する。そのような頂点のうち一つを選択し、uとする。この頂点に対して、以下の実験操作を行い、条件付き確率を推定して、この頂点をSに加える。なお、前述の例では、初期状態においてuおよびuが選択可能であり、uの推定が終わるとuが選択可能になり、u,uおよびuの推定が終わるとuが選択可能になる。
 実験操作は、以下の通りである。仮定から、uの親ノードv,…,vはSに含まれる。よって、Xに対して操作を行った場合の条件付き確率P(v,…,v|x,…,x)を、上記式1と同様の計算方法により計算できる。よって、(v,…,v)の各{0,1}の組合せに対し、それを達成する確率がもっとも高いx,…,xに対する実験操作を計算できる。この操作を、T/C回行い、各組合せW⊂{0,1}に対して条件付確率P(u|(v,…,v)=W)を推定する。これにより、uに関する条件付き確率の推定が完了する。
 出力部40は、実験内容決定部30が決定した実験内容(具体的には、複数の実験の操作を行うべき順序)を出力する。
 記憶部50は、例えば、磁気ディスク装置により実現される。また、第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40とは、プログラム(実験計画最適化プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、記憶部50に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、第一受付部10、第二受付部20、実験内容決定部30および出力部40として動作してもよい。また、実験計画最適化装置の機能がSaaS(Software as a Service )形式で提供されてもよい。
 また、第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40とは、それぞれが専用のハードウェアで実現されていてもよい。第一受付部10と、第二受付部20と、実験内容決定部30と、出力部40とは、それぞれが汎用または専用の回路(circuitry )により実現されていてもよい。ここで、汎用または専用の回路(circuitry )は、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
 次に、本実施形態の実験計画最適化装置の動作を説明する。図6は、本実施形態の実験計画最適化装置の動作例を示すフローチャートである。
 まず、第一受付部10は、実験の操作および操作の結果を示すノード並びにこれらの因果関係を示すエッジを含むグラフを入力として受け付ける(ステップS11)。実験内容決定部30は、入力されたグラフのうち、実験の操作を示すノードにのみ依存するノードが存在するか否か判断する(ステップS12)。実験の操作を示すノードにのみ依存するノードが存在する場合(ステップS12におけるYes)、実験内容決定部30は、このノードが依存する操作に関する実験を行うと決定する(ステップS13)。そして、出力部40は、決定した実験の操作を出力する(ステップS14)。その後、ステップS12以降の処理が繰り返される。また、第二受付部20は、出力した実験に基づく実験結果を入力として逐次受け付ける。
 一方、実験の操作を示すノードにのみ依存するノードが存在しない場合(ステップS12におけるNo)、実験内容決定部30は、操作の結果を示すノードに依存しているノードが存在するか否か判断する(ステップS15)。操作の結果を示すノードに依存しているノードが存在する場合(ステップS15におけるYes)、第二受付部20は、結果を示すノードとの因果関係を示す確率、または、過去の実験結果を入力する(ステップS16)。
 実験内容決定部30は、入力された確率または実験結果に基づいて、入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する(ステップS17)。そして、出力部40は、特定された操作を出力する(ステップS18)。その後、ステップS15以降の処理が繰り返される。また、第二受付部20は、出力した実験に基づく実験結果を入力として逐次受け付ける。
 一方、操作の結果を示すノードに依存しているノードが存在しない場合(ステップS15におけるYes)、処理を終了する。
 以上のように、本実施形態では、第一受付部10が、実験の操作を示す複数のノード、操作の結果を示す複数のノード、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける。また、第二受付部20が、実験の操作と操作の結果との因果関係の程度を示す情報、または因果関係の強さを推定可能な過去の実験結果を入力として受け付ける。そして、実験内容決定部30および出力部40が、第一受付部10が受け付けた入力と、第二受付部20が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する。よって、背後に存在する因果関係を考慮して実験計画を最適化できる。
 例えば、操作による途中の結果や、操作と結果との因果関係を考慮せず、操作と最終結果のみを考慮して実験計画を作成することも可能である。図7は、実験計画の例を示す説明図である。例えば、図7に例示する各操作xが2値の値を取る場合、実験の操作の種類の組合せだけでも、2になるため、実験回数は指数的(O(2):nは例えば、薬の種類)に増加してしまう。
 一方、本実施形態では、例えば、図3に例示するようなグラフ構造および因果関係を考慮して実験計画を作成する。図8は、実験回数の例を示す説明図である。例えば、図8におけるL1の部分について、x,x,xを操作して、uへの依存関係を実験する。この実験回数は、O(2)=O(1)である(ここでは、k=3)。L2の部分およびL3の部分についても同様である。図8のL4の部分について、u,u,uを操作するかのようなx~xの組も特定できる。そこで、特定した組による操作によって、yを推定する。以上のことから、ノード数を|V|とすると、O(|V|)で実験できることが分かる。すなわち、本実施形態の実験計画最適化装置により、実験回数を抑制することが可能になる。
 次に、本発明の概要を説明する。図9は、本発明による情報処理システムの概要を示すブロック図である。本発明による実験計画最適化装置80は、実験の操作を示す複数のノード(例えば、ノードx)、操作の結果を示す複数のノード(例えば、ノードu)、および、実験の操作と操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部81(例えば、第一受付部10)と、実験の操作と操作の結果との因果関係の程度を示す情報(例えば、確率)、またはその因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部82(例えば、第二受付部20)と、第一受付部81が受け付けた入力と、第二受付部82が受け付けた情報とに基づいて、複数の実験の操作を行うべき順序を出力する出力部83(例えば、実験内容決定部30および出力部40)とを備えている。
 そのような構成により、背後に存在する因果関係を考慮して実験計画を最適化できる。
 また、出力部83は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定してもよい。
 また、出力部83は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、その取り得る値の実現確率が最も高くなる操作を特定してもよい。
 また、出力部83は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力してもよい。
 また、出力部83は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、その実験の種類ごとの実験回数を決定してもよい。
 また、出力部83は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定してもよい。
 図10は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、CPU1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
 上述の実験計画最適化装置は、コンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(実験計画最適化プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
 なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行しても良い。
 また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
 上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、前記第一受付部が受け付けた入力と、前記第二受付部が受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力部とを備えたことを特徴とする実験計画最適化装置。
(付記2)出力部は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記1記載の実験計画最適化装置。
(付記3)出力部は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、当該取り得る値の実現確率が最も高くなる操作を特定する付記2記載の実験計画最適化装置。
(付記4)出力部は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力する付記1から付記3のうちのいずれか1つに記載の実験計画最適化装置。
(付記5)出力部は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、当該実験の種類ごとの実験回数を決定する付記1から付記4のうちのいずれか1つに記載の実験計画最適化装置。
(付記6)出力部は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定する付記1から付記5のうちのいずれか1つに記載の実験計画最適化装置。
(付記7)実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付け、受け付けたグラフと、前記程度を示す情報または前記実験結果とに基づいて、複数の前記実験の操作を行うべき順序を出力することを特徴とする実験計画最適化方法。
(付記8)結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記7記載の実験計画最適化方法。
(付記9)コンピュータに、実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、前記第一受付処理で受け付けた入力と、前記第二受付処理で受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力処理を実行させるための実験計画最適化プログラム。
(付記10)コンピュータに、出力処理で、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する付記9記載の実験計画最適化プログラム。
 10 第一受付部
 20 第二受付部
 30 実験内容決定部
 40 出力部
 50 記憶部
 100 実験計画最適化装置

Claims (10)

  1.  実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付部と、
     前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付部と、
     前記第一受付部が受け付けた入力と、前記第二受付部が受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力部とを備えた
     ことを特徴とする実験計画最適化装置。
  2.  出力部は、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
     請求項1記載の実験計画最適化装置。
  3.  出力部は、過去の実験結果に基づいて、結果を示すノードが取り得る値の実現確率を算出し、当該取り得る値の実現確率が最も高くなる操作を特定する
     請求項2記載の実験計画最適化装置。
  4.  出力部は、実験の操作を示すノードにのみ依存する複数のノードを、並行して実験可能なノードとして出力する
     請求項1から請求項3のうちのいずれか1項に記載の実験計画最適化装置。
  5.  出力部は、予め定める全実験回数に対し、結果を示すノードごとに特定される実験の種類数に応じて、当該実験の種類ごとの実験回数を決定する
     請求項1から請求項4のうちのいずれか1項に記載の実験計画最適化装置。
  6.  出力部は、操作のノードにのみ依存する結果のノードを優先的に実験すると決定する
     請求項1から請求項5のうちのいずれか1項に記載の実験計画最適化装置。
  7.  実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付け、
     前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付け、
     受け付けたグラフと、前記程度を示す情報または前記実験結果とに基づいて、複数の前記実験の操作を行うべき順序を出力する
     ことを特徴とする実験計画最適化方法。
  8.  結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
     請求項7記載の実験計画最適化方法。
  9.  コンピュータに、
     実験の操作を示す複数のノード、前記操作の結果を示す複数のノード、および、前記実験の操作と前記操作の結果との因果関係を示すエッジを含むグラフを入力として受け付ける第一受付処理と、
     前記実験の操作と前記操作の結果との因果関係の程度を示す情報、または当該因果関係の強さを推定可能な過去の実験結果を入力として受け付ける第二受付処理、および、
     前記第一受付処理で受け付けた入力と、前記第二受付処理で受け付けた情報とに基づいて、複数の前記実験の操作を行うべき順序を出力する出力処理
     を実行させるための実験計画最適化プログラム。
  10.  コンピュータに、
     出力処理で、結果を示すノードに対して入力される値の組み合わせを実現するために、最も可能性の高い操作を特定する
     請求項9記載の実験計画最適化プログラム。
PCT/JP2017/018484 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム WO2018211617A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019518659A JP6954347B2 (ja) 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム
PCT/JP2017/018484 WO2018211617A1 (ja) 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム
US16/612,928 US20200167680A1 (en) 2017-05-17 2017-05-17 Experimental design optimization device, experimental design optimization method, and experimental design optimization program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/018484 WO2018211617A1 (ja) 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム

Publications (1)

Publication Number Publication Date
WO2018211617A1 true WO2018211617A1 (ja) 2018-11-22

Family

ID=64274472

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/018484 WO2018211617A1 (ja) 2017-05-17 2017-05-17 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム

Country Status (3)

Country Link
US (1) US20200167680A1 (ja)
JP (1) JP6954347B2 (ja)
WO (1) WO2018211617A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220029793A (ko) * 2020-08-26 2022-03-08 쿠팡 주식회사 실험 테스트 중 최적의 스탑 포인트를 예측하는 시스템 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05240745A (ja) * 1992-02-28 1993-09-17 Hitachi Ltd テスト仕様生成方式
JP2002093674A (ja) * 2000-07-13 2002-03-29 Seiko Epson Corp プロセスシミュレーションパラメータの最適条件決定方法及び最適条件支援装置
JP2002322938A (ja) * 2001-04-26 2002-11-08 Mitsubishi Motors Corp 実験計画法に基づくデータ解析方法および装置並びに実験計画法に基づくデータ解析プログラムおよび同プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006344200A (ja) * 2005-05-12 2006-12-21 Hitachi Ltd 製品設計パラメータ決定方法およびその支援システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05240745A (ja) * 1992-02-28 1993-09-17 Hitachi Ltd テスト仕様生成方式
JP2002093674A (ja) * 2000-07-13 2002-03-29 Seiko Epson Corp プロセスシミュレーションパラメータの最適条件決定方法及び最適条件支援装置
JP2002322938A (ja) * 2001-04-26 2002-11-08 Mitsubishi Motors Corp 実験計画法に基づくデータ解析方法および装置並びに実験計画法に基づくデータ解析プログラムおよび同プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006344200A (ja) * 2005-05-12 2006-12-21 Hitachi Ltd 製品設計パラメータ決定方法およびその支援システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220029793A (ko) * 2020-08-26 2022-03-08 쿠팡 주식회사 실험 테스트 중 최적의 스탑 포인트를 예측하는 시스템 및 방법
KR102385928B1 (ko) 2020-08-26 2022-06-23 쿠팡 주식회사 실험 테스트 중 최적의 스탑 포인트를 예측하는 시스템 및 방법

Also Published As

Publication number Publication date
US20200167680A1 (en) 2020-05-28
JPWO2018211617A1 (ja) 2020-03-19
JP6954347B2 (ja) 2021-10-27

Similar Documents

Publication Publication Date Title
Foss et al. kamila: clustering mixed-type data in R and Hadoop
Chakraborty et al. Inference for optimal dynamic treatment regimes using an adaptive m-out-of-n bootstrap scheme
US10572822B2 (en) Modular memoization, tracking and train-data management of feature extraction
US20180137415A1 (en) Predictive analytic methods and systems
Morris et al. Combining fractional polynomial model building with multiple imputation
CN107251021B (zh) 过滤数据沿袭图
US20180225581A1 (en) Prediction system, method, and program
US11288580B2 (en) Optimal solution search method, optimal solution search program, and optimal solution search apparatus
Hagen et al. TreeSim GM: Simulating phylogenetic trees under general Bellman–Harris models with lineage‐specific shifts of speciation and extinction in R
US20190012573A1 (en) Co-clustering system, method and program
JP2019056983A (ja) 学習データ選択プログラム、学習データ選択方法、および、学習データ選択装置
Giuzio Genetic algorithm versus classical methods in sparse index tracking
Kordi et al. Exact algorithms for duplication-transfer-loss reconciliation with non-binary gene trees
CN110689395A (zh) 用于推送信息的方法和装置
US10366331B2 (en) Interactive method to reduce the amount of tradeoff information required from decision makers in multi-attribute decision making under uncertainty
Zadorozhnyi et al. Analytical and numerical methods of calibration for preferential attachment randon graphs
Ma Measuring microbiome diversity and similarity with Hill numbers
Rao et al. Using historical vital statistics to predict the distribution of under-five mortality by cause
de Oliveira et al. An ant colony hyperheuristic approach for matrix bandwidth reduction
Keshavarzi et al. Machine learning algorithms, bull genetic information, and imbalanced datasets used in abortion incidence prediction models for Iranian Holstein dairy cattle
Pesonen et al. ABC of the future
WO2018211617A1 (ja) 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム
d’Aloisio et al. Debiaser for Multiple Variables to enhance fairness in classification tasks
Zou et al. A new parallel algorithm for computing formal concepts based on two parallel stages
CN109597819B (zh) 用于更新数据库的方法和装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17909822

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019518659

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17909822

Country of ref document: EP

Kind code of ref document: A1