WO2019003441A1 - 予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置 - Google Patents

予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置 Download PDF

Info

Publication number
WO2019003441A1
WO2019003441A1 PCT/JP2017/024229 JP2017024229W WO2019003441A1 WO 2019003441 A1 WO2019003441 A1 WO 2019003441A1 JP 2017024229 W JP2017024229 W JP 2017024229W WO 2019003441 A1 WO2019003441 A1 WO 2019003441A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
model
observation
function
gene
Prior art date
Application number
PCT/JP2017/024229
Other languages
English (en)
French (fr)
Inventor
峰斗 佐藤
壮一郎 荒木
藤山 健一郎
哲理 有山
たん 東
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to EP17915679.9A priority Critical patent/EP3648109A4/en
Priority to US16/620,706 priority patent/US11557372B2/en
Priority to PCT/JP2017/024229 priority patent/WO2019003441A1/ja
Priority to JP2019526116A priority patent/JP6908111B2/ja
Publication of WO2019003441A1 publication Critical patent/WO2019003441A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to a prediction apparatus and the like that predicts an event that occurs in an analysis target.
  • Patent Document 1 discloses a simulation apparatus that numerically simulates a phenomenon occurring in the real world using a computer.
  • the simulation apparatus predicts a state regarding the analysis target based on model information representing a state regarding the analysis target, and updates the model based on the predicted state and observation information observed regarding the analysis target.
  • Patent Document 2 discloses a method of predicting values of variables relating to agricultural products.
  • one of the objects of the present invention is to provide a prediction device or the like capable of simulating an analysis object more accurately.
  • the prediction device is Based on first model information representing the relationship between sequence information representing a gene sequence possessed by a living organism to be analyzed and functional information representing a function expressible by the gene sequence, the function for the gene sequence possessed by the analysis object First model processing means for creating information; The analysis by the first model processing means, the functional information on the living body, environment information representing an environment around the living body, and second model information representing a relation between observation information observed on the living body And second model processing means for generating prediction information representing the observation information predicted for the analysis object based on the function information generated for the gene sequence regarding the object.
  • the prediction method is A gene possessed by an analysis target based on first model information representing the relationship between sequence information representing a gene sequence possessed by a living organism to be analyzed and function information representing a function expressible by the gene sequence by an information processing apparatus Creating the functional information on the array, the functional information on the living body, environmental information representing an environment around the living body, and second model information representing a relationship between observation information observed on the living body
  • the prediction information representing the observation information predicted for the analysis target is generated based on the function information generated for the gene sequence regarding the analysis target.
  • the prediction program is Based on first model information representing the relationship between sequence information representing a gene sequence possessed by a living organism to be analyzed and functional information representing a function expressible by the gene sequence, the function for the gene sequence possessed by the analysis object A first model processing function that creates information; The analysis by the first model processing function, second model information representing a relation between the functional information on the living body, environment information representing an environment around the living body, and observation information observed on the living body And causing a computer to realize a second model processing function of generating prediction information representing the observation information predicted for the analysis object based on the function information generated for the gene sequence regarding the object.
  • the object is also realized by a computer readable recording medium for recording the program.
  • model information that represents the relationship between input information that is input to an analysis target and output information that is output from the analysis target.
  • the model information is, for example, information in which a physically valid relationship between the input information and the output information is expressed using a partial differential equation.
  • a system of linear equations is created by discretizing the partial differential equation, and a state of the analysis target is calculated by calculating a solution of the system of linear equations. Ru.
  • the inventor of the present application has found that, when the analysis target is a living body such as a plant, divergence easily occurs between observation information (events) observed for the analysis target and an event predicted by simulation. Furthermore, even if one of the factors causing such divergence is the same kind of living body to be analyzed, the inventor of the present invention can simulate even though the gene sequences possessed by the individual analysis targets are different. Found that such differences in gene sequences are not expressed in model information. In addition, although the inventor of the present application has a situation in which the growth state differs depending on the environment in which the living body is grown, even in the case where different living bodies have the same gene sequence, the situation in the model information Found a problem that was not expressed. The inventors of the present application have found a problem in such a situation and came to derive means for solving the problem.
  • the parameter represents a storage area in a storage device (storage unit).
  • the process of setting a value to a parameter represents a process of storing data in a storage area represented by the parameter.
  • the value of a variable (parameter) is also referred to as "value of variable (parameter)” or “variable (parameter) value”.
  • the value of the parameter represents the value stored in the storage area represented by the parameter.
  • the parameter value A may be simply referred to as "parameter A”.
  • conditional probability P in which the random variable T is D is expressed as shown in Formula A.
  • P (T D
  • S C) ... (Formula A).
  • S SC) ... (Formula B).
  • equation B can be expressed as shown in equation C: P (TD
  • analysis target Information observed with respect to the analysis target is expressed as “observation information” using a sensor or the like. Information predicted by simulating an analysis target is referred to as "prediction information”. Further, in the case where an analysis object such as a plant is identified based on a gene sequence, each analysis object is referred to as an “individual”.
  • the prediction device 101 includes a gene model processing unit 102, a crop model processing unit 103, and an updating unit 104.
  • the prediction device 101 further includes a gene model information storage unit 105, a crop model information storage unit 106, a function information storage unit 107, an observation information storage unit 108, an environment information storage unit 109, and a reference information storage unit 110.
  • the relationship information storage unit 111 may be included.
  • the analysis target is assumed to be a plant (a crop) grown in a field.
  • the analysis target is not limited to a plant, and may be a living body.
  • the process target of the prediction apparatus 101 is not limited to crop model information.
  • more generalized crop model information may be referred to as "second model information”.
  • the crop model processing unit may be referred to as a "second model processing unit”.
  • the crop model information storage unit may be referred to as a "second model information storage unit”.
  • the environmental information storage unit 109 stores environmental information on the environment around the plant.
  • the environmental information is, for example, information indicating the amount of precipitation in a field, the amount of water contained in the soil in the field, the amount of nitrogen contained in the soil, the temperature in the field, and the sunshine duration in the field.
  • the environmental information may be, for example, information representing the amount of irrigation implemented in the field.
  • the environment information may include information different from the above-described example.
  • the environmental information may be environmental information on the environment around the individual.
  • the observation information storage unit 108 stores observation information Y observed for plants.
  • the observation information is, for example, a leaf area index for a plant, the size of the plant, the number of leaves, the size of leaves, and the size of a crop.
  • the observation information may be observation information observed for an individual.
  • the observation information may be information acquired using a sensor or the like, or may be information calculated based on the observed information.
  • the observation information is not limited to the example described above.
  • the functional information C crop is information that represents the amount of water absorbed by the plant from the root Good.
  • gene model information is sequence information x gene relating to a plant, and environmental information relating to the environment around the plant, and information representing the relationship between the functional information C crop .
  • the functional information C crop may be information registered in a general nucleic acid sequence database, or may be information obtained by observing an individual having a gene sequence.
  • the function information C crop may include not only one information but also a plurality of pieces of information. Gene model information and function information C crop are not limited to the examples described above.
  • gene model information (hereinafter also referred to as "first model information") representing the relationship between the sequence information x gene representing the gene sequence possessed by the plant and the functional information C crop.
  • the gene model information may be information representing a relationship between sequence information x gene related to a plant, environmental information representing an environment around the plant, and functional information C crop relating to the plant.
  • the gene model information may further be information to which a plant identifier representing the plant (hereinafter, the identifier is represented as "ID”) is associated. For example, functional information on a certain plant can be determined by applying the gene model information to a gene sequence possessed by an individual and environmental information representing the environment surrounding the individual.
  • first environmental information ⁇ env environmental information input to gene model information
  • the gene model information will be described with reference to a specific example.
  • sequence information x gene represents a gene sequence that affects the degree of root tension.
  • sequence information x gene represents a gene sequence that affects the degree of root tension.
  • an individual grown in the field has a gene sequence that stretches the roots a lot, as the individual grows, it spreads more roots to soil than an individual who does not have the gene sequence.
  • there is a slight rain in the field An individual having a gene sequence that stretches many roots grows large because it can absorb sufficient water even if it is light rain.
  • an individual who does not have a gene sequence that stretches many roots can not grow large because it can not absorb sufficient water in the case of slight rain.
  • the functional information C crop is, for example, information representing the water absorption capacity of the individual.
  • the functional information C crop may be information representing stress resistance and the like of the individual.
  • the first environmental information ⁇ env is the amount of precipitation in the field.
  • the size of the individual is determined according to the function expressed by the sequence information x gene possessed by the individual, and the first environmental information ⁇ env concerning the environment around the individual, etc. Ru.
  • the crop model information storage unit 106 includes functional information C crop on plants, environmental information on the environment around the plants, and observation information Y (or the observation information) actually observed on the plants (or individuals).
  • Crop model information (an example of “second model information”) representing the association with the prediction information regarding
  • observation information and prediction information are collectively referred to as observation information.
  • the environmental information input to the crop model information is referred to as “second environmental information ⁇ 2 env ” for convenience of explanation. Further, the second environmental information ⁇ 2 env and the first environmental information ⁇ env are collectively referred to as “environmental information”.
  • the second environmental information ⁇ 2 env may be information of the same type as the first environmental information ⁇ env or may be different types of information.
  • the crop model information will be described with reference to a specific example.
  • the functional information C crop relating to a plant is information representing the water absorbing ability of the plant.
  • observation information Y presupposes that it is a normalized difference vegetation index (NDVI: Normalized Difference Vegetation Index) regarding the said plant.
  • NDVI Normalized Difference Vegetation Index
  • the vegetation index can be calculated, for example, based on an image captured at an angle of view looking into a field from a flying object such as a satellite or a drone. For example, a camera of such an aircraft captures such an image while the aircraft is flying over the field.
  • the vegetation index is calculated according to the process shown in Formula 1 based on the reflectance R of the visible region red observed around the field and the reflectance IR of the near infrared region.
  • NDVI (IR ⁇ R) ⁇ (IR + R) (Equation 1), However, NDVI indicates that the larger the positive value, the denser the vegetation.
  • the plants for example, germinate in spring and grow and grow more leaves. Plant growth stops in summer, and as a result of blooming, the Vegetation Index (exemplified in Equation 1) decreases. Eventually, the fruit (ie, the crop) begins to grow, and in the fall the color of the leaves changes (or begins to fall off). Then, the degree to which the vegetation index (exemplified in Formula 1) decreases is steep.
  • the second environmental information ⁇ 2 env is information such as sunshine duration in the field, temperature around the field, and the like.
  • the crop model information is related to the sunshine duration, the ambient temperature around the field, and the water absorbing ability of the plant (an example of the functional information C crop ) and the vegetation index (an example of the observation information Y) It is a model that expresses sex.
  • the association information storage unit 111 stores association information in which sequence information x gene and observation information Y observed for an individual having a gene sequence represented by the sequence information x gene are associated with each other.
  • the relevance information may be information in which sequence information x gene is associated with prediction information on which observation information Y related to an individual having a gene sequence represented by the sequence information x gene is predicted.
  • the relevance information may be information in which observation information Y observed for an individual and sequence information x gene representing a gene sequence estimated for the individual are associated.
  • observation information and prediction information are collectively referred to as observation information.
  • the relevance information is not limited to the example described above.
  • the reference information storage unit 110 stores reference information representing selection criteria, which is a basis for selecting specific relevance information among the relevance information stored in the relevance information storage unit 111.
  • the reference information is, for example, a standard on stability such as a narrow range of deviation from observation information Y, a standard on tolerance such as a small deviation between observation information Y and prediction information, or observation information Y
  • the standard is that the range of is within the standard range.
  • the reference information is, for example, a reference that the degree of similarity with the observed observation information Y satisfies a predetermined condition. In this case, the reference information is a reference for selecting observation information similar to the observed information Y.
  • FIG. 2 is a flowchart showing the flow of processing in the prediction device 101 according to the first embodiment.
  • the gene model processing unit 102 receives a plant ID representing a plant to be analyzed.
  • the gene model processing unit 102 determines whether or not gene model information on the plant represented by the plant ID is stored in the gene model information storage unit 105 (step S101).
  • the gene model information includes a sequence information x gene representing a gene sequence possessed by a plant individual, a first environmental information ⁇ env representing an environment around the individual, and a functional information C crop relating to the individual It is information that represents sex.
  • the gene model processing unit 102 When the gene model information on the plant represented by the plant ID is not stored in the gene model information storage unit 105 (NO in step S101), the gene model processing unit 102 includes the sequence information, the environment information, and the function (or reads the function information C crop that said event) information about is associated from the function information storage unit 107 (step S102). The gene model processing unit 102 creates gene model information based on the read function information C crop (step S103).
  • the process in which the gene model processing unit 102 creates gene model information is, for example, a process of statistically determining the relationship between the known sequence information x gene and the known function information C crop , or It is a process which determines the value of the parameter contained in (or Formula 3) based on known sequence information x gene and known function information C crop .
  • the process of creating gene model information is not limited to the example described above.
  • the gene model processing unit 102 When the gene model information on the plant represented by the plant ID is stored in the gene model information storage unit 105 (YES in step S101), the gene model processing unit 102 performs the gene model information on the gene model information storage unit. Read from 105.
  • the gene model processing unit 102 externally receives sequence information x gene representing a gene sequence possessed by a plant, and first environmental information ⁇ env regarding the environment around the plant.
  • the gene model processing unit 102 applies a predetermined process exemplified by the gene model information f gp (formula 2) to the sequence information x gene and the first environment information ⁇ env regarding the surrounding environment.
  • functional information C crop concerning the plant is created (step S104).
  • the predetermined process is, for example, a process of predicting a target variable for a certain explanatory variable using model information created in accordance with a supervised learning method.
  • the explanatory variables are sequence information x gene on the plant and first environmental information ⁇ env on the environment around the plant.
  • the target variable is functional information C crop related to the plant.
  • the gene model processing unit 102 receives the first environment information ⁇ env received using the sequence information on the plant, the environment information, and the function information using the gene model information created as training data, and the sequence information x Create functional information C crop for gene and
  • the predetermined process is not limited to the supervised learning method, and may be a semi-supervised learning method, a statistical method such as Bayesian estimation, or a simulation method based on model information as described later with reference to Equations 4 to 7. It may be Further, the gene model information may include information (parameter ⁇ in Equation 3) representing an error that occurs when the above-described relevance is expressed using model information. Moreover, gene model information may include parameters different from the parameters (sequence information x gene etc.) described above. The predetermined process is not limited to the example described above.
  • gene model information f gp may be model information including a parameter ⁇ ⁇ as exemplified in Formula 3.
  • the parameter ⁇ is information representing the influence on an event that occurs in an analysis target such as a plant.
  • the parameter ⁇ is a parameter that represents the correction amount when expressing the gene model information (exemplified in the equation 2).
  • the sequence information x gene does not necessarily have to represent the gene sequence possessed by a plant, and may be presumed information on the gene sequence.
  • the estimated information is estimated information on gene sequence.
  • the first environmental information ⁇ env represents environmental information.
  • the parameter ⁇ is, for example, function information calculated according to crop model information (described later with reference to Equation 4 or Equation 6) based on observation information Y, and gene model information (exemplified in Equation 2 or Equation 3) Indicates the difference from the functional information calculated according to The sequence information x gene and the first environmental information ⁇ env can also be considered to determine the information according to a certain probability distribution. Therefore, the parameter ⁇ (ie, the parameter representing the correction) can be determined probabilistically, and the information can also be represented using the probability.
  • the gene model processing unit 102 may store the function information C crop generated in step S104 in the function information storage unit 107.
  • the gene model processing unit 102 inputs the created function information C crop into the crop model processing unit 103.
  • the crop model processing unit 103 receives the functional information C crop from the gene model processing unit 102.
  • the crop model processing unit 103 receives the plant ID from the external device or the gene model processing unit 102.
  • the crop model processing unit 103 receives second environment information ⁇ 2 env regarding the environment around the plant represented by the plant ID from an external device such as a soil sensor or a moisture sensor.
  • the crop model processing unit 103 reads crop model information on the plant represented by the plant ID from the crop model information storage unit 106.
  • the crop model processing unit 103 applies the processing (exemplified in Formula 4) represented by the crop model information g growth to the received functional information C crop and the second environment information ⁇ 2 env .
  • the crop model processing unit 103 calculates the state information x pheno representing the state of the crop at a certain timing t, and predicts the observation information Y at the certain timing t based on the calculated state information x pheno (that is, , Create prediction information) (step S105).
  • x pheno t g growth (x phen t-1 , C crop , ⁇ 2 env ) (Equation 4).
  • crop model information g growth is information in which state information x pheno at a plurality of timings is associated using function information C crop and second environment information ⁇ 2 env .
  • the state information x Pheno t at the timing t the state information x pheno t-1 at the timing (t-1) is associated.
  • the state information x Pheno t-1 at the timing (t-1) based on a second environmental information .theta.2 env, in the function information C crop, the state information at the timing t it is possible to predict the x pheno t.
  • the observation model information h is information indicating the status information Xpheno t at a certain timing t, the relationship between the observation information Y t in the certain timing.
  • the observation model information h exemplified in Formula 5 is information indicating the status information x Pheno t at the timing t, the relationship between the observation information Y t at the timing t.
  • the observation model information h is the identity function (i.e., function to calculate the state information x Pheno t as the observation information Y t) may be a model information represented using.
  • the observation model information h illustrated in Formula 5 even in a situation where the vegetation of an individual, the weight of the individual, the number of the individual, and the degree of maturity of the individual can be acquired as the state information x pheno May be information associated with only observation information observed at timing t.
  • the observation model information h exemplified in Equation 5 relates only the vegetation of the individuals and the number of individuals.
  • the information may be
  • Observation information Y may be obtained.
  • the crop model information g growth may include, for example, a system noise v t that represents uncertainty in time change (time evolution) related to the state information x pheno .
  • System noise v t represents system noise at timing t.
  • observation model information h may include, for example, observation noise w t that represents uncertainty regarding crop model information, as shown in Equation 7.
  • the observation noise w t representing the uncertainty is, for example, a difference (or an error, a noise) included in information observed by an observation device such as a soil sensor or a moisture sensor, or the observation model information h itself Is information that represents the difference (or error, noise) contained in.
  • the observation noise w t represents the observation noise at timing t.
  • x pheno t g growth (x phen t-1 , C crop t , ⁇ 2 env t , v t ) (6)
  • Y t h (x pheno t , w t) ⁇ ( Equation 7).
  • the system noise v t and the observation noise w t are, for example, values generated according to a Gaussian distribution having an average of 0 and a predetermined dispersion.
  • the crop model information g growth exemplified in the equation 6 and the observation model information h exemplified in the equation 7 may be collectively referred to as a “state space model”. As described later, the state space model exemplified in Equation 6 and Equation 7 is updated based on, for example, the state information x phenot at timing t and the observation information Y t .
  • the difference between the observation information (that is, prediction information) calculated based on a plurality of mutually different sets with respect to the timing t and the observation information actually observed is calculated.
  • the set includes information such as function information C crop t and second environment information ⁇ 2 env t .
  • the differences i.e., system noise and observation noise
  • the crop model information may include parameters different from the above-described parameters (function information C crop etc.).
  • the gene model information f gp (exemplified in the formula 2 or the formula 3) and the crop model information g growth (exemplified in the formula 4) are, for example, a relation between a state regarding an analysis object and observation information observed regarding the analysis object It may be created based on information such as a partial differential equation representing a gender.
  • the partial differential equation may not necessarily be a single equation, but may be a plurality of equations.
  • the partial differential equation is discretized according to, for example, a discretization method such as a finite element method. As a result, simultaneous linear equations are created.
  • the genetic model information f gp (exemplified in Formula 2 or Formula 3) and the crop model information g growth (exemplified in Formula 4) are processes for calculating the solution of the simultaneous linear equations according to a solution procedure such as an iterative method, for example.
  • a solution procedure such as an iterative method, for example.
  • Equation 8 The value of the predicted probabilities shown in Equation 8, for example, the function information C crop Formula 3 (or formula 2) is calculated in accordance with the process shown in, further wherein the state information x Pheno t for the calculated feature information C crop
  • the process calculated according to 6 (or equation 4) can be determined according to an ensemble simulation that is repeatedly performed for a plurality of sets.
  • the ensemble simulation for example, the function information C crop, selected according to the normal (Gaussian) distribution with respect to the value of the selected function information C crop, Formula 6 (or Formula 4) to predict the state information x Pheno t accordance ( That is, there is an analytical method of creating prediction information regarding the observation information.
  • Ccrop calculated according to the process illustrated in Equation 3 (or Equation 2) is calculated as an average, and a predetermined dispersion is calculated according to Equation 6 (or Equation 4) with respect to the calculated value.
  • An ensemble an ensemble member is created by adding a random number having N as noise.
  • An ensemble set (exemplified in equation 9) is created by creating an ensemble (an ensemble member) for each of a plurality of random numbers having the predetermined variance.
  • state information x pheno t and state information x according to the process shown in equation 4 (or equation 6) for the ensemble members included in the created ensemble set, respectively.
  • prediction information about the observation information Y on pheno t there is also a method to create.
  • Equation 9 k (k represents a natural number such that 1 ⁇ k ⁇ N) indicates one ensemble member.
  • N represents the number of ensemble members included in the ensemble set.
  • C crop, k t represents functional information included in an ensemble calculated based on C crop t .
  • the crop model processing unit 103 independently (or in parallel) predicts the state information x pheno, k t-1 , the function information C crop, k t , and the second environment information ⁇ 2 env, k t. calculating a state quantity x Pheno t crop is (thus creating a predicted information relating to the observation information Y) can.
  • the crop model processing unit 103 uses, for example, the formula 7 (or, for each ensemble member included in the N ensemble sets (exemplified in the formula 9) for the function information C crop t and the second environment information ⁇ 2 env t There is a method of predicting observation information Y according to equation 5).
  • the crop model processing unit 103 can create different second environment information ⁇ 2 env t , for example, by processing such as adding system noise having a predetermined variance.
  • the updating unit 104 determines whether or not there is newly observed observation information (step S106). If there is newly observed observation information (YES in step S106), the updating unit 104 follows the predetermined updating process (described later), and based on the observation information, the gene model information and the crop model information It updates (step S107). The updating unit 104 conforms to the sequence information conforming to the observation information or the observation information based on the updated gene model information and crop model information according to a predetermined factor estimation process (described later). Some functional information may be estimated.
  • the predetermined factor estimation process will be described in detail.
  • the gene model information shown in equation 3 is model information including uncertainty
  • the probability of being functional information C crop t as shown in equation 10 when observation information Y t at timing t is given. a, it can be expressed as a posteriori probability of the observation information Y t.
  • the processing procedure according to Expression 10 can be realized by the processing procedure for obtaining the function information C crop t based on the observation information Y t in the processing regarding the model information shown in Expressions 4 to 7.
  • the updating unit 104 also has a function of updating the second environmental information ⁇ 2 env t which is different from the actually observed observation information Y (that is, determining the posterior distribution p ( ⁇ 2 env t
  • Predetermined factor estimation processing for estimating sequence information x gene is roughly classified into a forward problem approach and an inverse problem approach.
  • the forward problem approach is a procedure for searching for sequence information x gene that is close to given observation information Y t , and there is, for example, a processing procedure such as a genetic algorithm.
  • a processing procedure such as a genetic algorithm.
  • a plurality of patterns in which sequence information x gene appears are input in advance, and of the patterns, observation information Y t (or information similar to observation information Y t )
  • Sequence information is a procedure for filtering x gene .
  • the inverse problem approach can be realized, for example, according to predetermined processing procedures such as sequential Bayesian filtering, data assimilation processing, Markov chain Monte Carlo method, and the like.
  • the predetermined factor estimation process is not limited to the above-described processing procedure.
  • the posterior distribution of each piece of function information C crop t determined based on the observation information Y t is a value with higher accuracy, and the likelihood of expressing the likelihood of the function information C crop t calculated according to the gene model information is calculated. May be used for updating.
  • Updating unit 104 receives the status information x Pheno t about prediction information predicted for observation information Y t by crop model processing unit 103.
  • the update unit 104 further receives observation information Y t actually observed regarding the plant. Updating unit 104, based on the observation information Y and observation noise w, and calculates a likelihood indicating the likelihood of the state quantities x Pheno t crop is a prediction information, based on the calculated likelihood, Formula 4 (or, The crop model information g growth illustrated in equation 6) is updated.
  • Updating unit 104 when executing the processing according to the data assimilation process, calculates an error for each ensemble members included in the ensemble collection, crop the prediction information under the system noise v state quantities x Pheno t Calculate the probability distribution of
  • the update unit 104 updates the crop model information g growth by creating crop model information including the posterior distribution of each function information C crop obtained based on the observation information Y and the second environmental information ⁇ 2 env .
  • system noise can be defined as v ( ⁇ ) using, for example, a parameter ⁇ (hyperparameter), and similarly, the posterior distribution can be obtained based on the observation information Y.
  • crop model information including system noise according to observation information Y can be created similarly, and crop model information ggrowth can be updated.
  • the update unit 104 creates information in which the updated crop model information (that is, information on the plant represented by the plant ID) and the plant ID are associated, and stores the created information in the crop model information storage unit 106. .
  • the update unit 104 specifies the relationship information including the information matching (or similar to) the observation information Y t
  • the sequence information x gene contained in the related information may be presented.
  • the updating unit 104 uses the genes possessed by the individual according to the forward problem approach or the reverse problem approach as described above. Estimate the sequence.
  • the update unit 104 may create association information in which the sequence information x gene representing the estimated gene sequence and the observation information Y t are associated, and may store the association information in the association information storage unit 111.
  • the timing of the sequence information x gene (or observation information Y t ) calculated by the updating unit 104 is represented as “t” (t is a natural number). Further, it is assumed that observation information Y t + s (s is a natural number) observed after the timing t is stored in the observation information storage unit 108 in real time, for example. However, the timing at which the observation information is stored does not necessarily have to be real time.
  • the updating unit 104 uses observation information Y t + s at a timing “t + s” (s is a natural number) after the timing t, gene model information (exemplified in Formula 2 or Formula 3), and crop model information (exemplified in Formula 4) And calculate the estimated value of the gene sequence “x gene t + s + 1 ” at the timing “t + s + 1” (s is a natural number). This process will be described in detail.
  • the updating unit 104 specifies the sequence information x gene (factor information) in the case of the observation information Y t + s by executing the above-described forward problem approach or the same process as the reverse problem approach. That is, when it is observation information Yt + s , the update unit 104 calculates the probability (equation 11) that the sequence information is sequence information xgenet + s + 1 according to the crop model information and the gene model information.
  • the updating unit 104 reads the relevance information from the relevance information storage unit 111, and reads the reference information from the reference information storage unit 110.
  • the updating unit 104 is, for the observation information Y t + s and the calculated sequence information x gene t + s + 1 , among the read relevance information, relevance information (or values) satisfying the selection criteria represented by the read reference information. Identify For convenience of explanation, this process is referred to as "specific process".
  • the selection criterion is the criterion relating to the stability as described above, for example, the updating unit 104 determines that the range of the observation information Y t + s is the criterion of the relevance information stored in the relevance information storage unit 111. Identify relevance information that meets the selection criteria of being within range.
  • the updating unit 104 sets a set Rc estimated as sequence information x gene t + s + 1 based on the reference information and the relevance information in accordance with the above-described identification process.
  • the updating unit 104 calculates array information x gene t + s + 1 related to the observation information Y t + s based on the set Rc thus set and the estimated value calculated using the model information.
  • the probability shown in Equation 12 can be calculated, for example, by analyzing the appearance frequency of the sequence information included in the specified relevance information.
  • the information may be sequence information and observation information estimated based on the sequence information.
  • the updating unit 104 may estimate, as sequence information x gene t + s + 1 , the sequence information that is the largest value among the probabilities calculated according to Equation 12.
  • the updating unit 104 estimates the array information x gene t + 1 based on the observation information Y t in the process related to the timing t.
  • the prediction device 101 predicts observation information Y t based on the estimated sequence information x gene t + 1 (that is, creates prediction information regarding the observation information).
  • the updating unit 104 estimates the array information x gene t + 2 based on the created observation information Y t + 1 . Therefore, the updating unit 104 estimates the array information based on the observation information received at each timing. That is, the updating unit 104 estimates the gene sequence possessed by the analysis target based on the history of observation information on the analysis target.
  • FIG. 3 is a block diagram showing a configuration of the gene estimation device 151 according to the first embodiment of the present invention.
  • the gene estimation device 151 includes a prediction device 152 and an output unit 153.
  • the prediction device 152 can be realized, for example, using the same function as that of the prediction device 101 (or the prediction device 201 described later with reference to FIG. 4).
  • the gene estimation device 151 is communicably connected to a flying object such as the drone 154 or the artificial satellite 155. As described above with reference to FIG. 2, the flying object such as the drone 154 or the artificial satellite 155 has a sensor observing a field where plants (or individuals) are grown.
  • the flying object such as the drone 154 or the artificial satellite 155 transmits observation information (or environment information) observed by a sensor or the like to the gene estimation device 151 via the communication network.
  • the gene estimation device 151 receives the observation information (or the environment information), and inputs the information to the prediction device 152.
  • the prediction device 152 performs, for example, sequence information 156 representing a gene sequence of a plant (or an individual) by performing the processing described in each embodiment of the present invention.
  • the prediction device 152 inputs the generated array information 156 to the output unit 153.
  • the output unit 153 receives the array information 156 (for example, the probability illustrated in Equation 11), and outputs the array information 156 having the largest probability among the array information 156. That is, the output unit 153 receives the array information 156 (for example, the probability illustrated in Equation 11), and outputs at least a part of the array information 156 of the array information 156. Therefore, the gene estimation device 151 can estimate the gene sequence based on the observation information transmitted by the flying object such as the drone 154 or the artificial satellite 155.
  • an error occurs between an event predicted by simulation and an event acquired by a sensor or the like.
  • the inventors of the present invention have found that it is one of the causes of the error that the gene sequence possessed by the individual is not expressed in the model information that is the basis of the simulation. Therefore, the inventor of the present invention introduces functional information Ccrop representing an event generated in relation to sequence information x gene representing a gene sequence into model information, and via the functional information Ccrop , sequence information x gene and observation information Expressed the relationship with Y. That is, the prediction device 101 according to the first embodiment observes according to model information (exemplified in Formulas 2 to 7) representing the relationship between the sequence information x gene and the observation information Y via the function information C crop. Predict information (ie, create prediction information about the observation information). Therefore, since the array information x gene is reflected as one factor in the prediction information by the prediction device 101, the prediction device 101 can simulate the analysis target more accurately.
  • observation information observed regarding the living body can be acquired in a short period of time by a gene sequence possessed by the living body.
  • the reason is that the prediction device 101 executes a simulation based on the gene sequence possessed by the analysis target.
  • the observation of the living body is based on the gene arrangement possessed by the living body. Observed information can be obtained in a short period of time.
  • the gene sequence possessed by the analysis target can be estimated based on observation information Y representing an event actually observed regarding the analysis target.
  • the reason is that the prediction device 101 identifies sequence information representing a gene sequence that is a factor that generates observation information Y by performing processing according to the forward problem approach or the reverse problem approach. .
  • the harvest efficiency in the environment represented by the environmental information can be improved.
  • observation information that is, prediction information
  • the prediction device 101 predicts observation information when the plant (or the individual) grows based on the plant (or individual) sequence information and the environmental information (that is, creates prediction information)
  • the user can identify a plant (or an individual) suitable for the environmental information before growing the plant.
  • the prediction apparatus 101 even if sequence information on a plant (or an individual) is not obtained in advance, to improve the harvesting efficiency in the environment represented by the environmental information Can.
  • the reason is that the prediction device 101 can identify the plant (or individual) suitable for the environment represented by the environmental information, based on the prediction information on the plant (or individual) and the sequence information. .
  • FIG. 4 is a block diagram showing a configuration of the prediction device 201 according to the second embodiment of the present invention.
  • the prediction device 201 includes a first model processing unit 202 and a second model processing unit 203.
  • the prediction device 201 may further include a first model information storage unit 204 and a second model information storage unit 205.
  • the analysis target is assumed to be a plant (a crop) grown in a field.
  • the analysis target is not limited to a plant, and may be a living body.
  • first model information indicating the relationship between the sequence information representing a gene sequence and the function information on the function that can be expressed by the gene sequence.
  • the first model information may be environmental information representing an environment around a living body having the gene sequence, information representing the relationship between the sequence information, and the functional information.
  • the second model information storage unit 205 as described with reference to FIG. 1, the second model information (for example, a crop) in which the association in the state of the living body at a plurality of timings is represented via the function information. Model information is stored.
  • FIG. 5 is a flowchart showing the flow of processing in the prediction device 201 according to the second embodiment.
  • the first model processing unit 202 receives sequence information representing a gene sequence possessed by an analysis target such as a plant (or an individual).
  • the first model processing unit 202 reads the first model information (exemplified in Equation 2 or Equation 3) stored in the first model information storage unit 204.
  • the first model processing unit 202 applies the process indicated by the first model information to the received array information to create function information on an analysis target (step S201).
  • the first model processing unit 202 inputs the created function information to the second model processing unit 203.
  • the process in step S201 is, for example, the same process as the process described with reference to step S104 in FIG.
  • the second model processing unit 203 receives the function information and information indicating the state to be analyzed (hereinafter referred to as “first state”) at the first timing.
  • the second model processing unit 203 receives environmental information on the environment around the analysis target from the external device.
  • the second model processing unit 203 reads second model information (for example, crop model information exemplified in Equation 4 or Equation 6) stored in the second model information storage unit 205.
  • the second model processing unit 203 applies the processing indicated by the second model information to the function information and the first information to obtain an analysis target state at a second timing (hereinafter, “second state”).
  • Information representative of) is calculated (step S202).
  • the process in step S201 is, for example, the same process as the process described with reference to step S105 in FIG.
  • the first model information storage unit 204 can be realized using the same function as that of the gene model information storage unit 105 (FIG. 1) according to the first embodiment.
  • the second model information storage unit 205 can be realized using the same function as that of the crop model information storage unit 106 (FIG. 1) according to the first embodiment.
  • the first model processing unit 202 can be realized using the same function as that of the gene model processing unit 102 (FIG. 1) according to the first embodiment.
  • the second model processing unit 203 can be realized using the same function as that of the crop model processing unit 103 (FIG. 1) according to the first embodiment. Therefore, the prediction device 201 can be realized using the same function as that of the prediction device 101 (FIG. 1) according to the first embodiment.
  • the prediction device 201 can simulate the analysis target more accurately.
  • the reason is that a parameter contained in model information representing an event that may be expressed with respect to a gene sequence possessed by an analysis target such as a plant is predicted, and an event occurring for the plant is calculated based on the predicted parameter. It is because it simulates. The reason will be described in detail.
  • the inventor of the present application has described that one of the causes of the error generated in the simulation is model information in which a gene sequence possessed by a plant (or an individual) is the basis of the simulation. Found that it was not expressed. Therefore, the inventor of the present invention introduces functional information Ccrop representing an event generated in relation to sequence information x gene representing a gene sequence into model information, and via the functional information Ccrop , sequence information x gene and state information Expressed the relationship with x pheno . That is, the prediction device 201 according to the second embodiment follows model information etc. (exemplified in Formulas 2 to 7) representing the relationship between the sequence information x gene and the state information x pheno via the function information C crop. , And calculate a second state regarding the analysis target. Therefore, since the array information x gene is reflected as one factor in the second state by the prediction device 201, the prediction device 201 can simulate the analysis target more accurately.
  • model information etc. (exemplified in Formulas 2 to 7) representing the relationship between the sequence information
  • FIG. 6 is a block diagram schematically showing a hardware configuration example of a computing device capable of realizing the prediction device or the gene estimation device according to each embodiment of the present invention.
  • the calculation processing unit 20 includes a central processing unit (Central_Processing_Unit, hereinafter referred to as “CPU”) 21, a memory 22, a disk 23, a non-volatile recording medium 24, and a communication interface (hereinafter referred to as “communication IF”) 27. Have.
  • the calculation processing device 20 may be connectable to the input device 25 and the output device 26.
  • the calculation processing device 20 can transmit and receive information to and from other calculation processing devices and communication devices via the communication IF 27.
  • the non-volatile recording medium 24 is, for example, a compact disc (Compact_Disc) or a digital versatile disc (Digital_Versatile_Disc) that can be read by a computer.
  • the non-volatile storage medium 24 may be a universal serial bus memory (USB memory), a solid state drive (Solid_State_Drive) or the like.
  • the non-volatile recording medium 24 holds such a program and enables portability without supplying power.
  • the non-volatile recording medium 24 is not limited to the medium described above. Also, instead of the non-volatile recording medium 24, the program may be carried via the communication IF 27 and the communication network.
  • the CPU 21 copies a software program (computer program: hereinafter simply referred to as “program”) stored in the disk 23 to the memory 22 when executing it, and executes arithmetic processing.
  • the CPU 21 reads from the memory 22 data required for program execution. When the display is necessary, the CPU 21 displays the output result on the output device 26. When the program is input from the outside, the CPU 21 reads the program from the input device 25.
  • the CPU 21 interprets and executes the prediction program (FIG. 2 or FIG. 5) in the memory 22 corresponding to the function (process) represented by each unit shown in FIG. 1, FIG. 3 or FIG. 4 described above.
  • the CPU 21 sequentially executes the processing described in each embodiment of the present invention described above.
  • each embodiment of the present invention can be achieved by such a prediction program.
  • the embodiments of the present invention can also be realized by a computer readable non-volatile recording medium in which such a prediction program is recorded.
  • Prediction apparatus 102 Gene model processing unit 103 Crop model processing unit 104 Update unit 105 Gene model information storage unit 106 Crop model information storage unit 107 Function information storage unit 108 Observation information storage unit 109 Environment information storage unit 110 Reference information storage unit 111 Related Characteristic information storage unit 151 Gene estimation device 152 Prediction device 153 Output unit 154 Drone 155 Satellite 156 Array information 201 Prediction device 202 First model processing unit 203 Second model processing unit 204 First model information storage unit 205 Second model information storage Part 20 Calculation processing unit 21 CPU 22 Memory 23 Disk 24 Nonvolatile Storage Medium 25 Input Device 26 Output Device 27 Communication IF

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

解析対象をより正確にシミュレーションすることが可能な予測装置等が提供される。予測装置201は、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての該機能情報を作成する第1モデル処理部202と、該生体に関する該機能情報、該生体の周囲の環境を表す環境情報、及び、該生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、該第1モデル処理手段によって該解析対象に関する該遺伝子配列について作成された該機能情報とに基づき、該解析対象について予測された該観測情報を表す予測情報を作成する第2モデル処理部203とを有する。

Description

予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置
 本発明は、解析対象に生じる事象に関して予測する予測装置等に関する。
 特許文献1には、実世界で起きている現象を、コンピュータを用いて数値的にシミュレーションするシミュレーション装置が開示されている。該シミュレーション装置は、解析対象に関する状態を表すモデル情報に基づき該解析対象に関する状態を予測し、予測した状態と、該解析対象に関して観測された観測情報とに基づき該モデルを更新する。
 特許文献2には、農作物に関する変数の値等を予測する方法が開示されている。
国際公開第2016/194379号 国際公開第2001/18177号
 しかし、特許文献1乃至特許文献2に開示されたいずれの装置を用いたとしても、必ずしも、予測結果が正しいとは限らない。この理由は、解析対象の状態等をシミュレーションする基であるモデル情報が必ずしも正確であるとは限らないからである。すなわち、該モデル情報が誤差を含んでいることが多いので、必ずしも、該モデル情報に基づくシミュレーションの結果は、正確であるとは限らない。
 そこで、本発明の目的の1つは、解析対象をより正確にシミュレーションすることが可能な予測装置等を提供することである。
 本発明の1つの態様として、予測装置は、
 解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理手段と、
 前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記第1モデル処理手段によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理手段と
 を備える。
 また、本発明の他の態様として、予測方法は、
 情報処理装置によって、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成し、前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する。
 また、本発明の他の態様として、予測プログラムは、
 解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理機能と、
 前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記第1モデル処理機能によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理機能と
 をコンピュータに実現させる。
 さらに、同目的は、係るプログラムを記録するコンピュータが読み取り可能な記録媒体によっても実現される。
 本発明に係る予測装置等によれば、解析対象をより正確にシミュレーションすることができる。
本発明の第1の実施形態に係る予測装置が有する構成を示すブロック図である。 第1の実施形態に係る予測装置における処理の流れを示すフローチャートである。 本発明の第1の実施形態に係る遺伝子推定装置が有する構成を示すブロック図である。 本発明の第2の実施形態に係る予測装置が有する構成を示すブロック図である。 第2の実施形態に係る予測装置における処理の流れを示すフローチャートである。 本発明の各実施形態に係る予測装置、または、係る遺伝子推定装置を実現可能な計算処理装置のハードウェア構成例を概略的に示すブロック図である。
 まず、本発明の理解を容易にするため、本発明が解決しようとする課題を詳細に説明する。
 解析対象に対する入力である入力情報と、該解析対象が出力する出力情報との間の関連性を表すモデル情報に基づき、該解析対象に関する数値シミュレーションが実行される。該モデル情報は、たとえば、該入力情報と、該出力情報との間に物理的に成り立つ関連性が、偏微分方程式を用いて表された情報である。情報処理装置を用いてシミュレーションする場合には、当該偏微分方程式が離散化されることによって連立一次方程式が作成され、該連立一次方程式の解を算出することによって、該解析対象の状態が算出される。
 しかし、一般に、解析対象に生じる事象(たとえば、動き、状態の変化)を、モデル情報を用いて表す場合に誤差が生じ、生じた誤差によってシミュレーションした結果が実際に観測される観測情報から乖離してしまうことがある。たとえば、解析対象が植物等の生体である場合に、解析対象に関して実際に観測される観測情報と、該観測情報に関する予測結果を表す予測情報(すなわち、観測情報について予測された結果を表す情報)との間に乖離が生じてしまう。
 本願発明者は、解析対象が植物等の生体である場合に、該解析対象に関して観測された観測情報(事象)と、シミュレーションによって予測された事象との間に乖離が生じやすいことを見出した。さらに、本願発明者は、このような乖離が生じる要因の1つが同種の生体が解析対象であったとしても、個々の解析対象が有している遺伝子配列が異なっているにも関わらず、シミュレーションにおいては、そのような遺伝子配列の違いがモデル情報において表現されていないことであることを見出した。また、本願発明者は、異なる生体が同じ遺伝子配列を有している場合であっても該生体が生育される環境に応じて生育状態が異なる状況が生じているものの、モデル情報においては当該状況が表現されていないという課題を見出した。本願発明者は、このような状況に課題を見出すとともに、係る課題を解決する手段を導出するに至った。
 次に、本発明の各実施形態にて用いる用語について説明する。
 パラメタは、記憶装置(記憶部)における、ある記憶領域を表すとする。パラメタに値を設定する処理は、該パラメタが表す記憶領域にデータを格納する処理を表す。また、変数(パラメタ)に関する値を、「変数(パラメタ)の値」、または、「変数(パラメタ)値」とも表す。パラメタの値は、該パラメタが表す記憶領域に格納されている値を表す。説明の便宜上、パラメタの値Aを、単に、「パラメタA」と表すこともある。
 また、確率変数(random variables)Sの値(value)がCである場合に、確率変数TがDである条件付き確率(conditional probability)Pを式Aに示すように表す、
 P(T=D|S=C)・・・(式A)。
 また、誤解を生じない限り、確率変数の値を、該確率変数の添え字を用いて表すこととする。この場合には、式Aを、式Bに示すように表すことができる、
 P(T=TD|S=SC)・・・(式B)。
 さらに、説明の便宜上、誤解を生じない限り、確率変数S、及び、確率変数Tを省略して表すこととする。この場合には、式Bを、式Cに示すように表すことができる、
 P(TD|SC)・・・(式C)。
 以降においては、シミュレーション対象を「解析対象」と表す。センサ等を用いて、解析対象に関して観測される情報を「観測情報」と表す。解析対象をシミュレーションすることによって予測された情報を「予測情報」と表す。また、植物等の解析対象を遺伝子配列に基づき識別する場合には、各解析対象を「個体」と表す。
 以降、上述したような課題を解決可能な、本発明を実施する実施形態について、図面を参照しながら詳細に説明する。
 <第1の実施形態>
 図1を参照しながら、本発明の第1の実施形態に係る予測装置101が有する構成について詳細に説明する。図1は、本発明の第1の実施形態に係る予測装置101が有する構成を示すブロック図である。
 第1の実施形態に係る予測装置101は、遺伝子モデル処理部102と、作物モデル処理部103と、更新部104とを有する。予測装置101は、さらに、遺伝子モデル情報記憶部105と、作物モデル情報記憶部106と、機能情報記憶部107と、観測情報記憶部108と、環境情報記憶部109と、基準情報記憶部110と、関連性情報記憶部111とを有していてもよい。
 以降の説明においては、説明の便宜上、解析対象は、圃場にて生育されている植物(作物)であるとする。しかし、解析対象は、植物に限定されず、生体であればよい。同様に、説明の便宜上、作物モデル情報、作物モデル処理部103、及び、作物モデル情報記憶部106を用いて説明するが、予測装置101の処理対象は、作物モデル情報に限定されない。以降の説明においては、より一般化された作物モデル情報を、「第2モデル情報」と表すこともある。同様に、作物モデル処理部を、「第2モデル処理部」と表すこともある。作物モデル情報記憶部を、「第2モデル情報記憶部」と表すこともある。
 環境情報記憶部109には、植物周囲の環境に関する環境情報が格納されている。該環境情報は、たとえば、圃場における降水量、該圃場における土壌に含まれている水分量、土壌に含まれている窒素量、圃場における気温、圃場における日照時間を表す情報である。環境情報は、たとえば、圃場にて実施された灌漑量を表す情報であってもよい。環境情報は、上述した例と異なる情報が含まれていてもよい。環境情報は、個体周囲の環境に関する環境情報であってもよい。
 観測情報記憶部108には、植物に関して観測された観測情報Yが格納されている。観測情報は、たとえば、植物に関する葉面積指標、該植物の大きさ、葉の枚数、葉の大きさ、作物の大きさである。観測情報は、個体に関して観測された観測情報であってもよい。観測情報は、センサ等を用いて取得された情報であってもよいし、観測された情報に基づき算出された情報であってもよい。観測情報は、上述した例に限定されない。
 機能情報記憶部107には、植物(または、個体)が有している遺伝子配列によって発現しうる機能、または、該機能が発現することによって生じる事象を表す機能情報Ccropが格納されている。すなわち、機能情報Ccropは、遺伝子配列によって発現しうる機能に関する情報である。機能情報Ccropは、当該遺伝子配列を表す配列情報と、該機能(または、該事象)を表す情報とが関連付けされた情報であってもよい。機能情報Ccropは、当該配列情報と、該機能(または、該事象)を表す情報と、該機能(または、該事象)が生じた場合における該植物(または、個体)に関する環境情報とが関連付けされた情報であってもよい。
 機能情報Ccropは、該機能自体を表す情報であってもよいし、該機能によって生じる事象を表す情報であってもよい。機能情報Ccropは、たとえば、個体がある遺伝子配列を有している場合に、土壌に根を広く張る状態(たとえば、根が広がっている範囲の体積)を表す情報であってもよいし、根を張ることに起因して生じる事象(たとえば、水の吸収速度)を表す情報であってもよい。機能情報Ccropは、植物の大きさ、作物ができるまでの期間、作物の色、作物の大きさ等を表す情報であってもよい。機能情報Ccropは、該機能を発現した植物が、植物周囲の環境に応じて実現する状態を表す情報であってもよい。たとえば、根が広く張っている植物が生育されている土壌に、ある降水量の雨が降った場合に、機能情報Ccropは、該植物が根から吸収する水分量を表す情報であってもよい。この場合に、遺伝子モデル情報は、植物に関する配列情報xgene、及び、該植物周囲の環境に関する環境情報と、該機能情報Ccropとの関連性を表す情報である。機能情報Ccropは、一般的な核酸配列データベースに登録されている情報であってもよいし、遺伝子配列を有している個体を観測することによって得られた情報であってもよい。機能情報Ccropは、必ずしも、1つの情報だけでなく、複数の情報を含んでいてもよい。遺伝子モデル情報、及び、機能情報Ccropは、上述した例に限定されない。
 遺伝子モデル情報記憶部105には、植物が有している遺伝子配列を表す配列情報xgeneと、該機能情報Ccropとの関連性を表す遺伝子モデル情報(以降、「第1モデル情報」とも表す)が格納されている。遺伝子モデル情報は、植物に関する配列情報xgeneと、該植物周囲の環境を表す環境情報と、該植物に関する機能情報Ccropとの関連性を表す情報であってもよい。遺伝子モデル情報は、さらに、該植物を表す植物識別子(以降、識別子を「ID」と表す)が関連付けされている情報であってもよい。たとえば、ある個体が有している遺伝子配列と、該個体周囲の環境を表す環境情報とに、当該遺伝子モデル情報を適用することによって、該ある植物に関する機能情報を求めることができる。
 以降の説明においては、説明の便宜上、遺伝子モデル情報に入力される環境情報を、「第1環境情報θenv」と表す。
 具体例を参照しながら、遺伝子モデル情報について説明する。
 説明の便宜上、配列情報xgeneが根の張り具合に影響を与える遺伝子配列を表すとする。圃場にて生育されている個体が根を多く張る遺伝子配列を有している場合に、該個体は、成長するにつれて、該遺伝子配列を有していない個体よりも多くの根を土壌に張る。ここで、圃場にて少雨な状況が生じているとする。根を多く張る遺伝子配列を有している個体は、少雨であっても、十分な水分を吸収することができるので大きく成長する。これに対して、根を多く張る遺伝子配列を有していない個体は、少雨の場合に、十分な水分を吸収することができないので、大きく成長することができない。この場合に、機能情報Ccropは、たとえば、該個体の吸水能力を表す情報である。機能情報Ccropは、該個体の耐ストレス性等を表す情報であってもよい。第1環境情報θenvは、圃場における降水量である。個体の大きさ(機能情報Ccropの一例)は、該個体が有している配列情報xgeneによって発現する機能、及び、該個体周囲の環境に関する第1環境情報θenv等に応じて決定される。
 作物モデル情報記憶部106には、植物に関する機能情報Ccrop、及び、該植物周囲の環境に関する環境情報と、該植物(または、個体)に関して実際に観測される観測情報Y(または、該観測情報に関する予測情報)との関連性を表す作物モデル情報(「第2モデル情報」の一例)が格納されている。以降、説明の便宜上、作物モデル情報を説明する場合に、観測情報、及び、予測情報を総称して観測情報と表す。
 以降の説明においては、説明の便宜上、作物モデル情報に入力される環境情報を、「第2環境情報θ2env」と表す。また、第2環境情報θ2env、及び、第1環境情報θenvを総称して「環境情報」と表す。
 第2環境情報θ2envは、第1環境情報θenvと同種の情報であってもよいし、異なる種類の情報であってもよい。具体例を参照しながら、作物モデル情報について説明する。
 説明の便宜上、植物に関する機能情報Ccropは、該植物の吸水能力を表す情報であるとする。また、観測情報Yは、当該植物に関する正規化差植生指数(NDVI:Normalized Difference Vegetation Index)であるとする。
 植生指数は、たとえば、人工衛星、ドローン等の飛行体から、圃場を見込む画角にて撮像された画像に基づき算出することができる。たとえば、係る飛行体が有するカメラは、該飛行体が圃場の上空を飛行中に、このような画像を撮影する。たとえば、該植生指数は、圃場付近について観測された可視域赤の反射率Rと、近赤外域の反射率IRとに基づき、式1に示す処理に従い算出される。
 NDVI=(IR-R)÷(IR+R)・・・(式1)、
 ただし、NDVIは、正の大きな値であるほど植生が濃いことを表す。
 植物は、たとえば、春に発芽してから成長するとともに、より多くの葉を茂らせる。夏になると植物の成長が止まり、花が咲く結果、植生指数(式1に例示)は、低下していく。やがて、果実(すなわち、作物)が実り始め、秋になると葉の色が変わる(または、落葉し始める)。すると、植生指数(式1に例示)が低下する程度は急になる。この例において、第2環境情報θ2envは、圃場における日照時間、該圃場周囲の気温等の情報である。したがって、この例において、作物モデル情報は、日照時間、圃場周囲の気温、及び、植物の吸水能力(機能情報Ccropの一例)と、該植物に関する植生指数(観測情報Yの一例)との関連性を表すモデルである。
 関連性情報記憶部111には、配列情報xgeneと、該配列情報xgeneが表す遺伝子配列を有している個体に関して観測された観測情報Yとが関連付けされた関連性情報が格納されている。関連性情報は、配列情報xgeneと、該配列情報xgeneが表す遺伝子配列を有している個体に関する観測情報Yが予測された予測情報とが関連付けされた情報であってもよい。または、関連性情報は、個体に関して観測された観測情報Yと、該個体について推定された遺伝子配列を表す配列情報xgeneとが関連付けされた情報であってもよい。以降の説明において関連性情報を説明する場合に、観測情報、及び、予測情報を総称して観測情報と表す。関連性情報は、上述した例に限定されない。
 基準情報記憶部110には、関連性情報記憶部111に格納されている関連性情報のうち、特定の関連性情報を選択する場合の基である選択基準を表す基準情報が格納されている。該基準情報は、たとえば、観測情報Yからのずれの範囲が狭い等の安定性に関する基準、観測情報Yと、予測情報との乖離が小さい等の耐性(トレランス)に関する基準、あるいは、観測情報Yの範囲が基準の範囲内であるという基準等である。基準情報は、たとえば、観測された観測情報Yとの類似度が所定の条件を満たしているという基準である。この場合に、該基準情報は、観測された観測情報Yに類似している観測情報を選択する基準である。
 次に、図2を参照しながら、本発明の第1の実施形態に係る予測装置101における処理について詳細に説明する。図2は、第1の実施形態に係る予測装置101における処理の流れを示すフローチャートである。
 遺伝子モデル処理部102は、解析対象である植物を表す植物IDを受け取る。
 次に、遺伝子モデル処理部102は、遺伝子モデル情報記憶部105に、植物IDが表す植物に関する遺伝子モデル情報が格納されているか否かを判定する(ステップS101)。遺伝子モデル情報は、植物の個体が有している遺伝子配列を表す配列情報xgeneと、該個体周囲の環境を表す第1環境情報θenvと、該個体に関する機能情報Ccropとの間の関連性を表す情報である。
 該植物IDが表す植物に関する遺伝子モデル情報が遺伝子モデル情報記憶部105に格納されていない場合に(ステップS101にてNO)、遺伝子モデル処理部102は、配列情報、環境情報、及び、機能(または、該事象)に関する情報が関連付けされた機能情報Ccropを機能情報記憶部107から読み取る(ステップS102)。遺伝子モデル処理部102は、読み取った機能情報Ccropに基づき、遺伝子モデル情報を作成する(ステップS103)。遺伝子モデル処理部102が遺伝子モデル情報を作成する処理は、たとえば、既知の配列情報xgeneと、既知の機能情報Ccropと間に成り立つ関連性を統計的に求める処理、または、後述する式2(または、式3)に含まれているパラメタの値を、既知の配列情報xgeneと、既知の機能情報Ccropとに基づき決定する処理である。遺伝子モデル情報を作成する処理は、上述した例に限定されない。
 該植物IDが表す植物に関する遺伝子モデル情報が遺伝子モデル情報記憶部105に格納されている場合に(ステップS101にてYES)、遺伝子モデル処理部102は、該遺伝子モデル情報を、遺伝子モデル情報記憶部105から読み取る。
 遺伝子モデル処理部102は、植物が有している遺伝子配列を表す配列情報xgeneと、該植物の周囲の環境に関する第1環境情報θenvとを外部から受け取る。遺伝子モデル処理部102は、該配列情報xgeneと、該周囲の環境に関する第1環境情報θenvとに対して、該遺伝子モデル情報fgp(式2)に例示される所定の処理を適用することによって、該植物に関する機能情報Ccropを作成する(ステップS104)。
 Ccrop=fgp(xgene,θenv)・・・(式2)。
 所定の処理は、たとえば、教師付き学習法に従い作成されたモデル情報を用いて、ある説明変数に対する目的変数を予測する処理である。この場合に、説明変数は、植物に関する配列情報xgeneと、該植物の周囲の環境に関する第1環境情報θenvとである。目的変数は、該植物に関する機能情報Ccropである。遺伝子モデル処理部102は、該植物に関する配列情報と、環境情報と、機能情報とを、訓練データとして作成された遺伝子モデル情報を用いて、受け取った第1環境情報θenvと、該配列情報xgeneとに対する機能情報Ccropを作成する。
 所定の処理は、教師付き学習法に限定されず、半教師付き学習法、ベイズ推定等の統計的な手法、または、式4乃至式7を参照しながら後述するようなモデル情報に基づくシミュレーション手法であってもよい。また、遺伝子モデル情報は、上述した関連性がモデル情報を用いて表現された場合に生じる誤差を表す情報(式3におけるパラメタη)を含んでいてもよい。また、遺伝子モデル情報は、上述したパラメタ(配列情報xgene等)と異なるパラメタを含んでいてもよい。所定の処理は、上述した例に限定されない。
 また、遺伝子モデル情報fgpは、式3に例示されるように、パラメタηを含むモデル情報であってもよい。
 Ccrop=fgp(xgene,θenv,η)・・・(式3)。
 ただし、パラメタηは、植物等の解析対象に生じる事象に対する影響を表す情報である。言い換えると、パラメタηは、遺伝子モデル情報(式2に例示)を表現した場合における補正量を表すパラメタである。配列情報xgeneは、必ずしも、植物が有している遺伝子配列を表していなくともよく、遺伝子配列に関する推定情報であってもよい。該推定情報は、遺伝子配列に関する推定情報である。また、第1環境情報θenvは、環境情報を表す。パラメタηは、たとえば、観測情報Yに基づき、作物モデル情報(式4、または、式6を参照しながら後述する)に従い算出される機能情報と、遺伝子モデル情報(式2または式3に例示)に従い算出される機能情報との差異を表す。配列情報xgene、及び、第1環境情報θenvは、ある確率分布に従い当該情報が決定されるとも考えることができる。したがって、パラメタη(すなわち、補正を表すパラメタ)は、確率的にその情報が決定され、当該情報を、確率を用いて表すこともできる。
 遺伝子モデル処理部102は、ステップS104にて作成した機能情報Ccropを、機能情報記憶部107に格納してもよい。遺伝子モデル処理部102は、作成した機能情報Ccropを作物モデル処理部103に入力する。
 作物モデル処理部103は、遺伝子モデル処理部102から該機能情報Ccropを受け取る。作物モデル処理部103は、植物IDを外部装置、または、遺伝子モデル処理部102から受け取る。作物モデル処理部103は、該植物IDが表す植物の周囲の環境に関する第2環境情報θ2envを、土壌センサ、水分センサ等の外部装置から受け取る。作物モデル処理部103は、該植物IDが表す植物に関する作物モデル情報を作物モデル情報記憶部106から読み取る。作物モデル処理部103は、受け取った該機能情報Ccrop、及び、第2環境情報θ2envに対して、作物モデル情報ggrowthが表す処理(式4に例示)を適用する。この処理によって、作物モデル処理部103は、あるタイミングtにおける作物の状態を表す状態情報xphenoを算出し、算出した状態情報xphenoに基づき、該あるタイミングtにおける観測情報Yを予測する(すなわち、予測情報を作成する)(ステップS105)。
 xpheno =ggrowth(xpheno t-1,Ccrop,θ2env)・・・(式4)。
 Y=h(xpheno )・・・(式5)。
 式4に例示されているように、作物モデル情報ggrowthは、複数のタイミングにおける状態情報xphenoが、機能情報Ccrop、及び、第2環境情報θ2envを用いて関連付けされた情報である。式4に例示された例においては、タイミングtにおける状態情報xpheno と、タイミング(t-1)における状態情報xpheno t-1とが関連付けされている。たとえば、式4に示された処理に従えば、タイミング(t-1)における状態情報xpheno t-1と、第2環境情報θ2envと、機能情報Ccropとに基づき、タイミングtにおける状態情報xpheno を予測することができる。
 式5に示されているように、観測モデル情報hは、あるタイミングtにおける状態情報xpheno と、該あるタイミングにおける観測情報Yとの間の関連性を表す情報である。たとえば、式5に例示された観測モデル情報hは、タイミングtにおける状態情報xpheno と、タイミングtにおける観測情報Yとの間の関連性を表す情報である。たとえば、観測モデル情報hは、恒等関数(すなわち、観測情報Yとして状態情報xpheno を算出する関数)を用いて表されるモデル情報であってもよい。この場合に、観測モデル情報hは、「Y=xpheno 」なる関連性を表す情報である。
 以降、観測モデル情報hを、「第3モデル情報」とも表す。
 状態情報xphenoとして、個体の植生、該個体の重さ、該個体の個数、及び、該個体の成熟度を取得することができる状況であっても、式5に例示される観測モデル情報hは、タイミングtにて観測された観測情報のみが関連付けされた情報であってもよい。たとえば、タイミングtにて個体の植生、及び、個体の個数のみが観測される場合に、式5に例示される観測モデル情報hは、該個体の植生、及び、該個体の個数のみが関連付けされた情報であってもよい。
 また、ある生体に関する作物モデル情報が複数の地域(または、地点)に関して異なっている場合に、各作物モデル情報に従い算出される観測情報の平均値(または、重み付け平均値)を算出することによって、観測情報Yが求められてもよい。
 式6に示されているように、作物モデル情報ggrowthは、たとえば、状態情報xphenoに関する時間変化(時間発展)における不確実性を表すシステムノイズvを含んでいてもよい。システムノイズvは、タイミングtにおけるシステムノイズを表す。同様に、観測モデル情報hは、式7に示されているように、たとえば、作物モデル情報に関する不確実性を表す観測ノイズwを含んでいてもよい。該不確実性を表す観測ノイズwは、たとえば、土壌センサ、水分センサ等の観測装置によって観測された情報に含まれている差異(または、誤差、ノイズ)、または、該観測モデル情報h自体に含まれている差異(または、誤差、ノイズ)を表す情報である。観測ノイズwは、タイミングtにおける観測ノイズを表す。
 xpheno =ggrowth(xpheno t-1,Ccrop ,θ2env ,v)・・・(式6)、
 Y=h(xpheno ,w)・・・(式7)。
 ただし、システムノイズv、及び、観測ノイズwは、たとえば、平均が0であり、所定の分散を有するガウス分布に従い生じた値であるとする。
 以降の説明においては、式6に例示された作物モデル情報ggrowth、及び、式7に例示された観測モデル情報hを総称して、「状態空間モデル」と呼ぶこともある。後述するように、式6、及び、式7に例示された状態空間モデルは、たとえば、タイミングtにおける状態情報xpheno と、観測情報Yとに基づき更新される。
 また、式6、及び、式7に例示されているように、各モデル情報における情報、及び、ノイズは、時間に応じて変化する情報であってもよい。具体的には、Ccrop は、タイミングtにおける機能情報Ccropである。θ2env は、タイミングtにおける第2環境情報θ2envである。
 式6及び式7に例示されている状態空間モデルを更新する処理手法として、たとえば、データ同化処理に従った処理手法がある。データ同化処理においては、タイミングtに関して、相互に異なる複数のセットに基づき算出される観測情報(すなわち、予測情報)と、実際に観測される観測情報との間の差異が算出される。該セットは、機能情報Ccrop 、及び、第2環境情報θ2env 等の情報を含んでいる。複数のセットが、ある乱数を用いて作成される情報を含んでいる場合には、該差異(すなわち、システムノイズ、及び、観測ノイズ)は、ある確率分布に従い生じているとも考えることができる。以降、1つのセットを「アンサンブル」と表し、相互に異なる複数のセットを「アンサンブル集合」と表すこともある。また、作物モデル情報は、上述したパラメタ(機能情報Ccrop等)と異なるパラメタを含んでいてもよい。
 遺伝子モデル情報fgp(式2または式3に例示)、及び、作物モデル情報ggrowth(式4に例示)は、たとえば、解析対象に関する状態と、該解析対象に関して観測された観測情報との関連性を表す偏微分方程式等の情報に基づき作成されてもよい。偏微分方程式は、必ずしも、1つの式でなく、複数の式であってもよい。該偏微分方程式が、たとえば、有限要素法等の離散化手法に従い離散化される。この結果、連立一次方程式が作成される。遺伝子モデル情報fgp(式2または式3に例示)、及び、作物モデル情報ggrowth(式4に例示)は、たとえば、反復法等の求解手順に従い、該連立一次方程式の解を算出する処理手順を概念的に表す。
 タイミングtにおける機能情報Ccrop が生じる場合に状態情報xpheno が生じる確率は、式8に示されるように、機能情報Ccrop と第2環境情報θ2env とが生じた場合における予測確率として表すことができる。
   p(xpheno |xpheno t-1,Ccrop ,θ2env )・・・(式8)。
 式8に示す予測確率の値は、たとえば、機能情報Ccropを式3(または、式2)に示された処理に従い算出し、さらに、算出した機能情報Ccropに対する状態情報xpheno を式6(または、式4)に従い算出する処理を、複数のセットに関して繰り返し実行するアンサンブルシミュレーションに従い求めることができる。
 アンサンブルシミュレーションには、たとえば、機能情報Ccropを、正規(ガウス)分布に従って選択し、選択した機能情報Ccropの値に関して、式6(または、式4)に従い状態情報xpheno を予測する(すなわち、該観測情報に関する予測情報を作成する)解析的な手法がある。あるいは、アンサンブルシミュレーションにおいては、式3(または、式2)に例示された処理に従い算出されたCcropを平均として算出し、算出した値に対して式6(または、式4)に従い所定の分散を有する乱数をノイズとして加えることによってアンサンブル(アンサンブルメンバ)が作成される。当該所定の分散を有する複数の乱数に対して、それぞれ、アンサンブル(アンサンブルメンバ)を作成することによって、アンサンブル集合(式9に例示)が作成される。該アンサンブルシミュレーションには、作成されたアンサンブル集合に含まれているアンサンブルメンバに対して、それぞれ、式4(または、式6)に示された処理に従い状態情報xpheno 、及び、該状態情報xpheno に関する観測情報Yに関する予測情報が作成する手法もある。
 {xpheno,k t-1、Ccrop,k 、θ2env,k }・・・(式9)、
 ただし、k(kは、1≦k≦Nなる自然数を表す)は、1つのアンサンブルメンバを指し示す。Nは、アンサンブル集合に含まれているアンサンブルメンバの個数を表す。たとえば、Ccrop,k は、Ccrop に基づき算出されたアンサンブルに含まれている機能情報を表す。
 アンサンブルシミュレーションにおいて、作物モデル処理部103は、状態情報xpheno,k t-1、及び機能情報Ccrop,k 、第2環境情報θ2env,k について、独立(または、並列)に予測情報である作物の状態量xpheno を算出する(したがって、該観測情報Yに関する予測情報を作成する)ことができる。作物モデル処理部103は、たとえば、機能情報Ccrop や、第2環境情報θ2env に関するN個のアンサンブル集合(式9に例示)に含まれている各アンサンブルメンバについて、式7(または、式5)に従い観測情報Yを予測する手法がある。作物モデル処理部103は、異なる第2環境情報θ2env を、たとえば、所定の分散を有するシステムノイズを加える等の処理によって作成することができる。
 更新部104は、新たに観測された観測情報があるか否かを判定する(ステップS106)。新たに観測された観測情報がある場合に(ステップS106にてYES)、更新部104は、所定の更新処理(後述する)に従い、該観測情報に基づき、遺伝子モデル情報、及び、作物モデル情報を更新する(ステップS107)。更新部104は、所定の要因推定処理(後述する)に従い、更新した遺伝子モデル情報、及び、作物モデル情報に基づき、該観測情報に適合している配列情報、または、該観測情報に適合している機能情報を推定してもよい。
 所定の要因推定処理について詳細に説明する。
 式3に示された遺伝子モデル情報が不確実性を含むモデル情報であるので、タイミングtにおける観測情報Yを与えた場合に、機能情報Ccrop である確率は、式10に示されるように、観測情報Yの事後確率として表すことができる。
 p(Ccrop |Y)・・・(式10)。
 式10に従う処理手順は、式4乃至式7に示されたモデル情報に関する処理において、観測情報Yに基づき、機能情報Ccrop を求める処理手順によって実現することができる。また、更新部104は、異なる第2環境情報θ2env に関しても、たとえば、実際に観測された観測情報Yによって更新する(すなわち、事後分布p(θ2env |Y)を求める)機能を有していてもよい。
 配列情報xgeneを推定する所定の要因推定処理には、大別して、順問題的アプローチと、逆問題的アプローチとがある。該順問題的アプローチは、与えられた観測情報Yに近くなる配列情報xgeneを探索する手順であり、たとえば、遺伝的アルゴリズム等の処理手順がある。逆問題的アプローチは、たとえば、配列情報xgeneが出現するパターンを、複数個、予め入力しておき、該パターンのうち、観測情報Y(または、観測情報Yに類似している情報)を与える配列情報xgeneをフィルタリングする手順である。逆問題的アプローチは、たとえば、逐次ベイズフィルタリング、データ同化処理、マルコフ連鎖モンテカルロ法等の所定の処理手順に従い実現することができる。該所定の要因推定処理は、上述した処理手順に限定されない。
 次に、所定の更新処理について詳細に説明する。
 更新部104は、観測情報Yに基づき求められた各機能情報Ccrop (すなわち、式10に示された事後確率)と、遺伝子モデル情報(式2または式3に例示)に従い算出された機能情報Ccrop との差異を算出する。更新部104は、該差異を用いて、式3に例示された遺伝子モデル情報を更新する。更新部104は、更新後の遺伝子モデル情報(すなわち、植物IDが表す植物に関する情報)と、当該植物IDとが関連付けされた情報を作成し、作成した情報を遺伝子モデル情報記憶部105に格納する。尚、観測情報Yに基づき求められた各機能情報Ccrop に関する事後分布をより確度の高い値とし、遺伝子モデル情報に従い算出された機能情報Ccrop の確からしさを表す尤度を算出して更新に用いてもよい。
 更新部104は、作物モデル処理部103によって観測情報Yに関して予測された予測情報に関する状態情報xpheno を受け取る。更新部104は、さらに、植物に関して実際に観測された観測情報Yを受け取る。更新部104は、観測情報Yと観測ノイズwとに基づき、予測情報である作物の状態量xpheno の確からしさを表す尤度を算出し、算出した尤度に基づき、式4(または、式6)に例示されている作物モデル情報ggrowthを更新する。更新部104は、データ同化処理に従い処理を実行する場合に、アンサンブル集合に含まれている各アンサンブルメンバについて誤差を算出し、システムノイズvの下での予測情報である作物の状態量xpheno の確率分布を算出する。更新部104は、観測情報Yに基づき求められた各機能情報Ccropや第2環境情報θ2envの事後分布を含む作物モデル情報を作成することによって、作物モデル情報ggrowthを更新する。もしくは、システムノイズを、たとえば、パラメタρ(ハイパーパラメタ)を用いてv(ρ)と定義し、同様に、観測情報Yに基づき事後分布を求めることができる。これにより、同様に観測情報Yに従うシステムノイズを含む作物モデル情報を作成し、作物モデル情報ggrowthを更新することができる。更新部104は、更新後の作物モデル情報(すなわち、植物IDが表す植物に関する情報)と、当該植物IDとが関連付けされた情報を作成し、作成した情報を作物モデル情報記憶部106に格納する。
 更新部104は、上述したような所定の更新処理に従い処理を実行した後に、観測情報Yと一致している(または、類似している)情報を含んでいる関連性情報を特定し、特定した該関連性情報に含まれている配列情報xgeneを提示してもよい。この場合に、更新部104は、個体(または、植物)に関して観測された観測情報Yに基づき、上述したような順問題的アプローチ、または、逆問題的アプローチに従い、該個体が有している遺伝子配列を推定する。更新部104は、推定した該遺伝子配列を表す配列情報xgeneと、該観測情報Yとが関連付けされた関連性情報を作成し、関連性情報記憶部111に格納してもよい。
 配列情報xgeneを推定する処理について、後述する式11、及び、式12を参照しながら詳細に説明する。
 説明の便宜上、更新部104が算出した配列情報xgene(または、観測情報Y)のタイミングを「t」(tは、自然数)と表す。また、観測情報記憶部108には、該タイミングtより後に観測された観測情報Yt+s(sは、自然数)が、たとえば、リアルタイムに格納されるとする。しかし、必ずしも、観測情報が格納されるタイミングは、リアルタイムでなくともよい。
 更新部104は、タイミングtよりも後のタイミング「t+s」(sは、自然数)における観測情報Yt+sと、遺伝子モデル情報(式2または式3に例示)と、作物モデル情報(式4に例示)とに基づき、タイミング「t+s+1」(sは、自然数)における遺伝子配列「xgene t+s+1」の推定値を算出する。この処理について、詳細に説明する。
 更新部104は、上述したような順問題的アプローチ、または、逆問題的アプローチと同様な処理を実行することによって、観測情報Yt+sである場合の配列情報xgene(要因情報)を特定する。すなわち、更新部104は、観測情報Yt+sである場合に、配列情報が配列情報xgene t+s+1である確率(式11)を、作物モデル情報と、遺伝子モデル情報とに従い算出する。
  p(xgene t+s+1|Yt+s)・・・(式11)。
 次に、更新部104は、関連性情報記憶部111から関連性情報を読み取り、基準情報記憶部110から基準情報を読み取る。更新部104は、観測情報Yt+sと、算出した配列情報xgene t+s+1とについて、読み取った該関連性情報のうち、読み取った基準情報が表す選択基準を満たしている関連性情報(または、値)を特定する。説明の便宜上、この処理を「特定処理」と表す。選択基準が、上述したような安定性に関する基準である場合に、更新部104は、たとえば、関連性情報記憶部111に格納されている関連性情報のうち、観測情報Yt+sの範囲が基準の範囲内であるという選択基準を満たしている関連性情報を特定する。
 更新部104は、特定した関連性情報に含まれている観測情報(説明の便宜上、該観測情報の集合を「集合Rc」と表す)と、観測情報Yt+sとについて、該特定処理と同様な処理を実行することによって、該関連性情報記憶部111に関する配列情報xgene t+s+1を算出する。この場合に、更新部104は、観測情報Yt+sと、集合Rcが与えられた場合の、配列情報xgene t+s+1の条件付き確率(式12)を算出する。
  p(xgene t+s+1|Yt+s、Rc)・・・(式12)。
 したがって、更新部104は、上述した特定処理に従い、該基準情報と、該関連性情報とに基づき、配列情報xgene t+s+1として推定される集合Rcを設定する。更新部104は、設定した集合Rcと、モデル情報を用いて算出された推定値とに基づき、観測情報Yt+sに関する配列情報xgene t+s+1を算出する。
 式12に示された確率は、たとえば、特定した該関連性情報に含まれている配列情報の出現頻度を解析することによって、算出することができる。あるいは、配列情報と、該配列情報に基づき推定された観測情報とが関連付けされた情報であってもよい。
 更新部104は、式12に従い算出した確率のうち、最も大きな値である配列情報を、配列情報xgene t+s+1として推定してもよい。
 更新部104は、タイミングtに関する処理にて、観測情報Yに基づき配列情報xgene t+1を推定する。予測装置101は、推定した配列情報xgene t+1に基づき観測情報Yを予測する(すなわち、該観測情報に関する予測情報を作成する)。次に、更新部104は、作成した観測情報Yt+1に基づき、配列情報xgene t+2を推定する。したがって、更新部104は、各タイミングにて受け取った観測情報に基づき、配列情報を推定する。すなわち、更新部104は、解析対象に関する観測情報の履歴に基づき、該解析対象が有している遺伝子配列を推定する。
 尚、本発明の各実施形態に示す予測装置は、図3に例示されているように、遺伝子推定装置151に含まれていてもよい。図3は、本発明の第1の実施形態に係る遺伝子推定装置151が有する構成を示すブロック図である。
 第1の実施形態に係る遺伝子推定装置151は、予測装置152と、出力部153とを有する。予測装置152は、たとえば、予測装置101(または、図4を参照しながら後述する予測装置201)が有している機能と同様な機能を用いて実現することができる。遺伝子推定装置151は、ドローン154、または、人工衛星155等の飛行体と通信接続されている。図2を参照しながら上述したように、ドローン154、または、人工衛星155等の飛行体は、植物(または、個体)が生育されている圃場を観測しているセンサを有する。ドローン154、または、人工衛星155等の飛行体は、センサ等によって観測された観測情報(または、環境情報)を、通信ネットワークを介して遺伝子推定装置151に送信する。遺伝子推定装置151は、該観測情報(または、該環境情報)を受信し、これらの情報を予測装置152に入力する。予測装置152は、本発明の各実施形態に示す処理を実行することによって、たとえば、植物(または、個体)の遺伝子配列を表す配列情報156を作成する。予測装置152は、作成した配列情報156を、出力部153に入力する。出力部153は、配列情報156(たとえば、式11に例示された確率)を受け取り、該配列情報156のうち、最も確率が大きな配列情報156を出力する。すなわち、出力部153は、配列情報156(たとえば、式11に例示された確率)を受け取り、該配列情報156のうち、少なくとも一部の配列情報156を出力する。したがって、遺伝子推定装置151は、ドローン154、または、人工衛星155等の飛行体が送信した観測情報に基づき、遺伝子配列を推定することができる。
 次に、本発明の第1の実施形態に係る予測装置101に関する効果について説明する。
 第1の実施形態に係る予測装置101によれば、解析対象をより正確にシミュレーションすることができる。この理由は、植物等の解析対象が有している遺伝子配列について発現する可能性がある事象を表すモデルのパラメタを予測し、予測したパラメタに基づき、該植物に関して生じる事象をシミュレーションするからである。この理由について詳細に説明する。
 本実施形態にて課題に関して上述したように、シミュレーションによって予測された事象と、センサ等によって取得された事象との間には誤差が生じる。個体が有している遺伝子配列が当該シミュレーションの基であるモデル情報には表現されていないことが、該誤差の要因の1つであることを、本願発明者は見出した。そこで、本願発明者は、遺伝子配列を表す配列情報xgeneに関係して生じる事象を表す機能情報Ccropをモデル情報に導入し、該機能情報Ccropを介して、配列情報xgeneと観測情報Yとの関連性を表現した。つまり、第1の実施形態に係る予測装置101は、機能情報Ccropを介して、配列情報xgeneと観測情報Yとの関連性を表すモデル情報(式2乃至式7に例示)に従い、観測情報を予測する(すなわち、該観測情報に関する予測情報を作成する)。したがって、予測装置101によって予測情報には、配列情報xgeneが1つの要因として反映されているので、予測装置101によれば、解析対象をより正確にシミュレーションすることができる。
 さらに、第1の実施形態に係る予測装置101によれば、生体が有している遺伝子配列によって当該生体に関して観測される観測情報を、短期間に取得することができる。この理由は、解析対象が有している遺伝子配列に基づくシミュレーションを、予測装置101が実行するからである。一般に、解析対象を実際に生育している期間に比べ、当該解析対象に生じる事象に関するシミュレーションに要する期間が短いので、予測装置101によれば、生体が有している遺伝子配列によって当該生体に関して観測される観測情報を、短期間に取得することができる。
 さらに、第1の実施形態に係る予測装置101によれば、解析対象に関して実際に観測された事象を表す観測情報Yに基づき、該解析対象が有している遺伝子配列を推定することができる。この理由は、予測装置101が、順問題的アプローチ、または、逆問題的アプローチに従った処理を実行することによって、観測情報Yを生じる要因である遺伝子配列を表す配列情報を特定するからである。
 また、環境情報(第1環境情報、または、第2環境情報)があらかじめ得られている場合には、第1の実施形態に係る予測装置101によれば、該環境情報が表す環境における収穫効率を向上することができる。この理由は、予測装置101が植物(または、個体)に関して予測した観測情報(すなわち、予測情報)に基づき、該植物の生育に関する情報を取得することができるからである。すなわち、予測装置101が、植物(または、個体)配列情報と、環境情報とに基づき、該植物(または、該個体)が成長した場合における観測情報を予測するので(すなわち、予測情報を作成する)、利用者は、該予測情報に基づき、該環境情報に適した植物(または、個体)を、該植物を生育する以前に特定することができる。
 また、植物(または、個体)に関する配列情報があらかじめ得られていない場合であっても、第1の実施形態に係る予測装置101によれば、環境情報が表す環境にて収穫効率を向上することができる。この理由は、予測装置101が植物(または、個体)に関する予測情報、及び、配列情報に基づき、利用者は、該環境情報が表す環境に適した植物(または、個体)を特定することができる。
 <第2の実施形態>
 次に、本発明の第2の実施形態について説明する。
 図4を参照しながら、本発明の第2の実施形態に係る予測装置201が有する構成について詳細に説明する。図4は、本発明の第2の実施形態に係る予測装置201が有する構成を示すブロック図である。
 第2の実施形態に係る予測装置201は、第1モデル処理部202と、第2モデル処理部203とを有する。予測装置201は、さらに、第1モデル情報記憶部204と、第2モデル情報記憶部205とを有していてもよい。
 以降の説明においては、説明の便宜上、解析対象は、圃場にて生育されている植物(作物)であるとする。しかし、解析対象は、植物に限定されず、生体であればよい。
 第1モデル情報記憶部204には、図1を参照しながら説明したような、遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能に関する機能情報との関連性を表す第1モデル情報(たとえば、「遺伝子モデル情報」)が格納されている。第1モデル情報は、当該遺伝子配列を有している生体の周囲の環境を表す環境情報と、該配列情報と、該機能情報との関連性を表す情報であってもよい。第2モデル情報記憶部205は、図1を参照しながら説明したような、複数のタイミングにおける該生体の状態における関連性が、該機能情報を介して表された第2モデル情報(たとえば、作物モデル情報)が格納されている。
 次に、図5を参照しながら、本発明の第2の実施形態に係る予測装置201における処理について詳細に説明する。図5は、第2の実施形態に係る予測装置201における処理の流れを示すフローチャートである。
 第1モデル処理部202は、植物(または、個体)等の解析対象が有する遺伝子配列を表す配列情報を受け取る。第1モデル処理部202は、第1モデル情報記憶部204に格納されている第1モデル情報(式2、または、式3に例示)を読み取る。第1モデル処理部202は、受け取った該配列情報に、該第1モデル情報が示す処理を適用することによって、解析対象に関する機能情報を作成する(ステップS201)。第1モデル処理部202は、作成した機能情報を第2モデル処理部203に入力する。ステップS201における処理は、たとえば、図2におけるステップS104を参照しながら説明したような処理と同様な処理である。
 次に、第2モデル処理部203は、該機能情報、及び、第1タイミングにおける該解析対象の状態(以降、「第1状態」と表す)を表す情報を受け取る。第2モデル処理部203は、解析対象の周囲の環境に関する環境情報を外部装置から受け取る。第2モデル処理部203は、第2モデル情報記憶部205に格納されている第2モデル情報(たとえば、式4、または、式6に例示された作物モデル情報)を読み取る。第2モデル処理部203は、該機能情報と、該第1情報とに、該第2モデル情報が示す処理を適用することによって、第2タイミングにおける解析対象の状態(以降、「第2状態」と表す)を表す情報を算出する(ステップS202)。ステップS201における処理は、たとえば、図2におけるステップS105を参照しながら説明したような処理と同様な処理である。
 第1モデル情報記憶部204は、第1の実施形態に係る遺伝子モデル情報記憶部105(図1)が有している機能と同様な機能を用いて実現することができる。第2モデル情報記憶部205は、第1の実施形態に係る作物モデル情報記憶部106(図1)が有している機能と同様な機能を用いて実現することができる。第1モデル処理部202は、第1の実施形態に係る遺伝子モデル処理部102(図1)が有している機能と同様な機能を用いて実現することができる。第2モデル処理部203は、第1の実施形態に係る作物モデル処理部103(図1)が有している機能と同様な機能を用いて実現することができる。したがって、予測装置201は、第1の実施形態に係る予測装置101(図1)が有している機能と同様な機能を用いて実現することができる。
 次に、本発明の第2の実施形態に係る予測装置201に関する効果について説明する。
 本実施形態に係る予測装置201によれば、解析対象をより正確にシミュレーションすることができる。この理由は、植物等の解析対象が有している遺伝子配列について発現する可能性がある事象を表すモデル情報に含まれているパラメタを予測し、予測したパラメタに基づき、該植物に関して生じる事象をシミュレーションするからである。この理由について詳細に説明する。
 本実施形態にて課題に関して上述したように、本願発明者は、シミュレーションにて生じる誤差の要因の1つが、植物(または、個体)が有している遺伝子配列が当該シミュレーションの基であるモデル情報には表現されていないことを見出した。そこで、本願発明者は、遺伝子配列を表す配列情報xgeneに関係して生じる事象を表す機能情報Ccropをモデル情報に導入し、該機能情報Ccropを介して、配列情報xgeneと状態情報xphenoとの関連性を表現した。つまり、第2の実施形態に係る予測装置201は、機能情報Ccropを介して、配列情報xgeneと状態情報xphenoとの関連性を表すモデル情報等(式2乃至式7に例示)に従い、解析対象に関する第2状態を算出する。したがって、予測装置201によって第2状態には、配列情報xgeneが1つの要因として反映されているので、予測装置201によれば、解析対象をより正確にシミュレーションすることができる。
 (ハードウェア構成例)
 上述した本発明の各実施形態に係る予測装置、または、遺伝子推定装置を、1つの計算処理装置(情報処理装置、コンピュータ)を用いて実現するハードウェア資源の構成例について説明する。但し、係る予測装置、または、係る遺伝子推定装置は、物理的または機能的に少なくとも2つの計算処理装置を用いて実現されてもよい。また、係る予測装置、または、係る遺伝子推定装置は、専用の装置として実現されてもよい。
 図6は、本発明の各実施形態に係る予測装置、または、係る遺伝子推定装置を実現可能な計算処理装置のハードウェア構成例を概略的に示すブロック図である。計算処理装置20は、中央処理演算装置(Central_Processing_Unit、以降「CPU」と表す)21、メモリ22、ディスク23、不揮発性記録媒体24、及び、通信インターフェース(以降、「通信IF」と表す)27を有する。計算処理装置20は、入力装置25、出力装置26に接続可能であってもよい。計算処理装置20は、通信IF27を介して、他の計算処理装置、及び、通信装置と情報を送受信することができる。
 不揮発性記録媒体24は、コンピュータが読み取り可能な、たとえば、コンパクトディスク(Compact_Disc)、デジタルバーサタイルディスク(Digital_Versatile_Disc)である。また、不揮発性記録媒体24は、ユニバーサルシリアルバスメモリ(USBメモリ)、ソリッドステートドライブ(Solid_State_Drive)等であってもよい。不揮発性記録媒体24は、電源を供給しなくても係るプログラムを保持し、持ち運びを可能にする。不揮発性記録媒体24は、上述した媒体に限定されない。また、不揮発性記録媒体24の代わりに、通信IF27、及び、通信ネットワークを介して係るプログラムを持ち運びしてもよい。
 すなわち、CPU21は、ディスク23に格納されているソフトウェア・プログラム(コンピュータ・プログラム:以下、単に「プログラム」と称する)を、実行する際にメモリ22にコピーし、演算処理を実行する。CPU21は、プログラム実行に必要なデータをメモリ22から読み取る。表示が必要な場合に、CPU21は、出力装置26に出力結果を表示する。外部からプログラムを入力する場合に、CPU21は、入力装置25からプログラムを読み取る。CPU21は、上述した図1、図3、または、図4に示す各部が表す機能(処理)に対応するところのメモリ22にある予測プログラム(図2、または、図5)を解釈し実行する。CPU21は、上述した本発明の各実施形態において説明した処理を順次実行する。
 すなわち、このような場合に、本発明の各実施形態は、係る予測プログラムによっても成し得ると捉えることができる。さらに、係る予測プログラムが記録されたコンピュータが読み取り可能な不揮発性の記録媒体によっても、本発明の各実施形態は成し得ると捉えることができる。
 以上、上述した実施形態を模範的な例として本発明を説明した。しかし、本発明は、上述した実施形態には限定されない。すなわち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
 101  予測装置
 102  遺伝子モデル処理部
 103  作物モデル処理部
 104  更新部
 105  遺伝子モデル情報記憶部
 106  作物モデル情報記憶部
 107  機能情報記憶部
 108  観測情報記憶部
 109  環境情報記憶部
 110  基準情報記憶部
 111  関連性情報記憶部
 151  遺伝子推定装置
 152  予測装置
 153  出力部
 154  ドローン
 155  人工衛星
 156  配列情報
 201  予測装置
 202  第1モデル処理部
 203  第2モデル処理部
 204  第1モデル情報記憶部
 205  第2モデル情報記憶部
 20  計算処理装置
 21  CPU
 22  メモリ
 23  ディスク
 24  不揮発性記録媒体
 25  入力装置
 26  出力装置
 27  通信IF

Claims (10)

  1.  解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理手段と、
     前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記第1モデル処理手段によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理手段と
     を備える予測装置。
  2.  更新手段
     をさらに備え、
     前記第2モデル処理手段は、前記生体の状態と、前記生体に関して観測される観測情報との間における関連性を表す第3モデル情報に従い、前記解析対象についての前記観測情報が予測された情報を表す予測情報を作成し、
     前記更新手段は、前記解析対象について観測された観測情報と、前記予測情報との差異に基づき、前記第2モデル情報を更新する
     請求項1に記載の予測装置。
  3.  前記更新手段は、更新した後の前記第2モデル情報を用いて、前記予測情報を作成する場合における前記機能情報を推定し、推定された前記機能情報と、前記第1モデル情報に基づき前記第1モデル処理手段が作成した前記機能情報との差異に基づき、前記第1モデル情報を更新する
     請求項2に記載の予測装置。
  4.  前記更新手段は、前記生体についての前記配列情報と、前記生体に関して観測された観測情報とが関連付けされた関連性情報に基づき、前記解析対象についての前記観測情報に関連付けされた前記配列情報を特定する
     請求項2または請求項3に記載の予測装置。
  5.  前記更新手段は、前記関連性情報のうち、前記解析対象についての前記観測情報との類似度が所定の条件を満たしている関連性情報を特定し、特定した前記関連性情報に含まれている前記配列情報を特定する
     請求項4に記載の予測装置。
  6.  前記更新手段は、前記解析対象について特定した前記配列情報と、前記解析対象についての当該観測情報とが関連付けされた前記関連性情報を作成する
     請求項4または請求項5に記載の予測装置。
  7.  請求項4乃至請求項6のいずれかに記載の予測装置と、
     前記更新手段によって特定された前記配列情報のうち、少なくとも一部の配列情報を出力する出力手段と
     を備える遺伝子推定装置。
  8.  情報処理装置によって、解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成し、前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する予測方法。
  9.  解析対象となりうる生体が有する遺伝子配列を表す配列情報と、該遺伝子配列によって発現しうる機能を表す機能情報との関連性を表す第1モデル情報に基づき、解析対象が有する遺伝子配列についての前記機能情報を作成する第1モデル処理機能と、
     前記生体に関する前記機能情報、前記生体の周囲の環境を表す環境情報、及び、前記生体に関して観測される観測情報の間における関連性を表す第2モデル情報と、前記第1モデル処理機能によって前記解析対象に関する前記遺伝子配列について作成された前記機能情報とに基づき、前記解析対象について予測された前記観測情報を表す予測情報を作成する第2モデル処理機能と
     をコンピュータに実現させる予測プログラムが記録された記録媒体。
  10.  更新機能
     をさらにコンピュータに実現させ、
     前記第2モデル処理機能において、前記生体の状態と、前記生体に関して観測される観測情報との間における関連性を表す第3モデル情報に従い、前記解析対象についての前記観測情報が予測された情報を表す予測情報を作成し、
     前記更新機能において、前記解析対象について観測された観測情報と、前記予測情報との差異に基づき、前記第2モデル情報を更新する
     請求項9に記載の予測プログラムが記録された記録媒体。
PCT/JP2017/024229 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置 WO2019003441A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP17915679.9A EP3648109A4 (en) 2017-06-30 2017-06-30 PREDICTION DEVICE, PREDICTION METHOD, INFORMATION MEDIUM STORED WITH PREDICTION PROGRAM, AND GENETIC INFERENCE DEVICE
US16/620,706 US11557372B2 (en) 2017-06-30 2017-06-30 Prediction device, gene estimation device, prediction method, and non-transitory recording medium
PCT/JP2017/024229 WO2019003441A1 (ja) 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置
JP2019526116A JP6908111B2 (ja) 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/024229 WO2019003441A1 (ja) 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置

Publications (1)

Publication Number Publication Date
WO2019003441A1 true WO2019003441A1 (ja) 2019-01-03

Family

ID=64741259

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/024229 WO2019003441A1 (ja) 2017-06-30 2017-06-30 予測装置、予測方法、予測プログラムが記録された記録媒体、及び、遺伝子推定装置

Country Status (4)

Country Link
US (1) US11557372B2 (ja)
EP (1) EP3648109A4 (ja)
JP (1) JP6908111B2 (ja)
WO (1) WO2019003441A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4074932A1 (fr) 2021-04-15 2022-10-19 Schneider Electric Industries SAS Coffret électrique et méthode de fabrication d'un tel coffret électrique

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6908111B2 (ja) * 2017-06-30 2021-07-21 日本電気株式会社 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置
CN116598005B (zh) * 2023-07-17 2023-10-03 中日友好医院(中日友好临床医学研究所) 基于宿主序列信息的下呼吸道感染概率预测系统及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001018177A1 (en) 1999-09-07 2001-03-15 Tissueinformatics, Inc. Method and system for non-random selection of plant and tissue products
JP2005309877A (ja) * 2004-04-22 2005-11-04 National Institute Of Advanced Industrial & Technology 機能性生体分子の配列解析方法
JP2010222300A (ja) * 2009-03-24 2010-10-07 Nagoya Univ 機能性ペプチドを表すルールの抽出法、機能性ペプチドの設計法及び調製法、ポリペプチド又はポリペプチド含有組成物の評価法、並びに機能性ペプチド
WO2016031174A1 (ja) * 2014-08-27 2016-03-03 日本電気株式会社 シミュレーション装置、シミュレーション方法、および、記憶媒体
WO2016194379A1 (ja) 2015-06-02 2016-12-08 日本電気株式会社 シミュレーション装置、シミュレーション方法及びプログラムを記憶する記録媒体

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19909146A1 (de) 1999-03-03 2000-09-28 Mohamed A Marahiel Verfahren zur gezielten biologischen Synthese von Peptiden
ES2331228T3 (es) 2000-02-09 2009-12-28 Basf Se Nuevo gen de elongasa y proceso para la preparacion de acidos grasos poliinsaturados.
WO2004086949A2 (en) * 2003-03-25 2004-10-14 John Wayne Cancer Institute Dna markers for management of cancer
JP4791737B2 (ja) 2005-02-25 2011-10-12 大日本住友製薬株式会社 機能性核酸配列解析方法
JP2011518174A (ja) * 2008-04-18 2011-06-23 シェノゲン ファーマ グループ リミテッド エストロゲン受容体に関連する疾患を処置するための化合物及び方法
KR101325736B1 (ko) * 2010-10-27 2013-11-08 삼성에스디에스 주식회사 바이오 마커 추출 장치 및 방법
US20150184247A1 (en) * 2012-04-20 2015-07-02 Memorial Sloan-Kettering Cancer Center Gene expression profiles associated with metastatic breast cancer
JP6251730B2 (ja) * 2012-04-26 2017-12-20 ザ・ユニバーシティ・オブ・シカゴThe University Of Chicago 黄色ブドウ球菌(staphylococcusaureus)疾患の間にコアグラーゼ活性を中和する抗体に関連した組成物および方法
US20180060482A1 (en) * 2016-08-31 2018-03-01 Intermountain Invention Management, Llc Interpreting genomic results and providing targeted treatment options in cancer patients
US10440911B2 (en) * 2016-09-16 2019-10-15 Wisconsin Alumni Research Foundation Targeted modification of maize roots to enhance abiotic stress tolerance
JP6908111B2 (ja) * 2017-06-30 2021-07-21 日本電気株式会社 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置
US11712026B2 (en) * 2017-10-18 2023-08-01 The Jackson Laboratory Murine-MHC-deficient HLA-transgenic nod-mouse models for T1D therapy development
WO2019191123A1 (en) * 2018-03-26 2019-10-03 The Trustees Of Princeton University Methods for predicting genomic variation effects on gene transcription

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001018177A1 (en) 1999-09-07 2001-03-15 Tissueinformatics, Inc. Method and system for non-random selection of plant and tissue products
JP2005309877A (ja) * 2004-04-22 2005-11-04 National Institute Of Advanced Industrial & Technology 機能性生体分子の配列解析方法
JP2010222300A (ja) * 2009-03-24 2010-10-07 Nagoya Univ 機能性ペプチドを表すルールの抽出法、機能性ペプチドの設計法及び調製法、ポリペプチド又はポリペプチド含有組成物の評価法、並びに機能性ペプチド
WO2016031174A1 (ja) * 2014-08-27 2016-03-03 日本電気株式会社 シミュレーション装置、シミュレーション方法、および、記憶媒体
WO2016194379A1 (ja) 2015-06-02 2016-12-08 日本電気株式会社 シミュレーション装置、シミュレーション方法及びプログラムを記憶する記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3648109A4

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4074932A1 (fr) 2021-04-15 2022-10-19 Schneider Electric Industries SAS Coffret électrique et méthode de fabrication d'un tel coffret électrique
FR3122044A1 (fr) 2021-04-15 2022-10-21 Schneider Electric Industries Sas Coffret électrique et méthode de fabrication d’un tel coffret électrique

Also Published As

Publication number Publication date
JPWO2019003441A1 (ja) 2020-03-26
JP6908111B2 (ja) 2021-07-21
US20210142865A1 (en) 2021-05-13
EP3648109A1 (en) 2020-05-06
EP3648109A4 (en) 2020-06-24
US11557372B2 (en) 2023-01-17

Similar Documents

Publication Publication Date Title
Obsie et al. Wild blueberry yield prediction using a combination of computer simulation and machine learning algorithms
Zúñiga et al. Parameter estimation for crop growth model using evolutionary and bio-inspired algorithms
JP6908111B2 (ja) 予測装置、予測方法、予測プログラム、及び、遺伝子推定装置
Van Oijen et al. Toward a Bayesian procedure for using process-based models in plant breeding, with application to ideotype design
Ramsey et al. An approximate Bayesian algorithm for training fuzzy cognitive map models of forest responses to deer control in a New Zealand adaptive management experiment
Medina-Ruíz et al. Mathematical modeling on tomato plants: A review
CN114662742A (zh) 大田灌溉施肥制度动态决策方法及装置
Khan et al. An ecophysiological model analysis of yield differences within a set of contrasting cultivars and an F1 segregating population of potato (Solanum tuberosum L.) grown under diverse environments
Jönsson et al. Enhanced science–stakeholder communication to improve ecosystem model performances for climate change impact assessments
Confalonieri CoSMo: A simple approach for reproducing plant community dynamics using a single instance of generic crop simulators
David et al. Digital twins for cyber-biophysical systems: challenges and lessons learned
Mamann et al. Diffuse system simulating wheat productivity by nitrogen and temperature in the use of biopolymers
Baey et al. Mixed-effects estimation in dynamic models of plant growth for the assessment of inter-individual variability
JP7208503B2 (ja) 機械学習プログラム、機械学習方法および機械学習装置
Droutsas et al. Integration of machine learning into process-based modelling to improve simulation of complex crop responses
Sundaramoorthi et al. Machine-learning-based simulation for estimating parameters in portfolio optimization: empirical application to soybean variety selection
Campos et al. A smart decision framework for the prediction of thrips incidence in organic banana crops
KR20200070736A (ko) 작물수확량 예측방법 및 이를 구현하는 작물수확량 예측장치
EP3477493A1 (en) Machine learning system
JP7024733B2 (ja) 情報処理装置、情報処理方法、及び、情報処理プログラム
Priya et al. Attention based Peephole LSTM model for Soybean crop yield prediction
Ahmad et al. Understanding the Agricultural Systems Modeling: A Review
JP7405177B2 (ja) 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法
Kang Plant growth models and methodologies adapted to their parameterization for the analysis of phenotypes
Muraro et al. Inference of the genetic network regulating lateral root initiation in Arabidopsis thaliana

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2019526116

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2017915679

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017915679

Country of ref document: EP

Effective date: 20200130