WO2021106046A1 - 成熟予測システム - Google Patents

成熟予測システム Download PDF

Info

Publication number
WO2021106046A1
WO2021106046A1 PCT/JP2019/046009 JP2019046009W WO2021106046A1 WO 2021106046 A1 WO2021106046 A1 WO 2021106046A1 JP 2019046009 W JP2019046009 W JP 2019046009W WO 2021106046 A1 WO2021106046 A1 WO 2021106046A1
Authority
WO
WIPO (PCT)
Prior art keywords
model
prediction
information
maturity
input
Prior art date
Application number
PCT/JP2019/046009
Other languages
English (en)
French (fr)
Inventor
清水 健太郎
建▲強▼ 孫
才覚 爲重
潤 瀬々
絵理 山▲埼▼
Original Assignee
公立大学法人横浜市立大学
チューリッヒ大学
株式会社ヒューマノーム研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 公立大学法人横浜市立大学, チューリッヒ大学, 株式会社ヒューマノーム研究所 filed Critical 公立大学法人横浜市立大学
Priority to PCT/JP2019/046009 priority Critical patent/WO2021106046A1/ja
Publication of WO2021106046A1 publication Critical patent/WO2021106046A1/ja

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G7/00Botany in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Definitions

  • the present invention relates to a system for predicting plant maturity from meteorological information.
  • Non-Patent Document 1 As described in Non-Patent Document 1, as a method for predicting flowering based on meteorological information, a 600-degree formula for predicting flowering of Yoshino cherry tree based on the daily maximum temperature is known. However, this prediction formula was limited to the flowering of Yoshino cherry tree and was not versatile.
  • Non-Patent Document 2 there is a method of predicting the yield of corn, soybean, rice, and wheat by utilizing short-term climate change. However, there was a problem with prediction accuracy.
  • Patent Document 1 discloses a system for predicting the amount of pollen scattered at a destination point from weather information and pollen source information.
  • pollen sources vegetable data of sugi forests, etc.
  • destinations which poses a problem in terms of convenience.
  • An object of the present invention is to provide a plant maturation prediction system that improves the above points.
  • a plant maturity prediction system The first model that inputs meteorological information and outputs the prediction of intermediate state information, which is biological information related to the maturation of the target plant, A second model that inputs the intermediate state information and outputs the maturity prediction of the target plant is provided. Meteorological information is input to the maturity prediction system, The maturity prediction system The weather information is input to the first model, The prediction of the intermediate state information of the target plant output from the first model is input to the second model, and the prediction is input to the second model. Based on the maturity prediction output from the second model, the maturity prediction of the target plant is output. A maturity prediction system characterized by this.
  • (Structure 2) The maturity prediction according to configuration 1, further comprising a prediction model generation unit that inputs the weather information, the intermediate state information, and the maturity information of the target plant and generates the first model and the second model by machine learning. system.
  • the maturity prediction system of the present invention it is possible to carry out maturity prediction with improved prediction accuracy.
  • FIG. 1 It is a schematic block diagram which shows the maturity prediction system of the embodiment which concerns on this invention. It is a conceptual diagram comparing the conventional method and the method in an embodiment regarding maturity prediction. It is a figure which shows an example of the intermediate information in an embodiment. It is a figure which shows an example of the meteorological information in an embodiment. This is an example of the result when the Lasso regression is performed in relation to the meteorological information and flowering in the embodiment. It is a flow chart which shows the overall operation of the flowering prediction in an embodiment.
  • FIG. 1 is a schematic configuration diagram showing a portion related to the present invention according to an embodiment of the present invention.
  • the maturity prediction system 100 is a system that predicts the maturity of a target plant from the input meteorological information, and includes a prediction unit 110 and a prediction model generation unit 120.
  • the prediction unit 110 predicts intermediate information such as the expression level of genes related to the maturation of the target plant from the input meteorological information. Furthermore, the maturity of the target plant is predicted from the predicted intermediate information. Details will be described later.
  • the prediction model generation unit 120 uses the first model, which is a prediction model of intermediate information of the target plant, and the second model, which is a maturity prediction model of the target plant, based on the intermediate information by learning by inputting the weather information. Generate.
  • the maturity prediction system 100 is configured as a system including a storage unit for storing a program in which the functions of each configuration are described and a computer including a processor for executing the program.
  • FIG. 2 is a diagram illustrating the concept of the conventional method, the maturity prediction model of the target plant in the present invention, and the prediction method.
  • the term "maturation of the target plant” means a phenotypic event such as heading, flowering, and fruit maturation, and in the present embodiment, it will be described below as meaning flowering.
  • the left column of FIG. 2 shows an example of creating a linear model of meteorological information and flowering using LASSO (Least Absolute Shrinkage and Selection Operator), which is one of the conventional methods.
  • LASSO Least Absolute Shrinkage and Selection Operator
  • a conceptual diagram of this method is shown in the right column of FIG.
  • the prediction phase the weather information of the period for which maturity is to be predicted is input to the model 1, and the output of the model 1, that is, the predicted value of the intermediate state is input to the model 2 to obtain the prediction of flowering.
  • the target plant will be described by taking Macaranga ius of the Euphorbiaceae family as an example. However, it is not necessary to limit the target plant to Macaranga ius, and this method can be applied to any plant. Hereinafter, each information in the present embodiment will be specifically described.
  • the intermediate state information in the present embodiment refers to the expression level of the flowering-related gene, the amount of protein, the ratio of the presence or absence of methylation at each base, and the amount of the compound.
  • the expression level of flowering-related genes can be obtained from RNA.
  • FIG. 3 is a graph showing the relationship between the flowering rate and the year and month in the acquired sample of the target plant and the timing of RNA acquisition. In this embodiment, 20 individuals were observed every week, and samples for 80 weeks were obtained. In addition, RNA was obtained for 3 of the above 20 individuals. Note that B1, B2, and B6 in the figure are the names of the collected trees, and indicate from which tree and when the sample was obtained.
  • ⁇ Weather information> In addition, regarding the meteorological information in the present embodiment, daily rainfall (hereinafter, also simply referred to as “rainfall”), daily minimum, maximum, average temperature (hereinafter, simply referred to as “temperature”), and daily.
  • the amount of sunshine (hereinafter, also simply referred to as “the amount of sunshine”) was used.
  • FIG. 4 data on the expression level, rainfall amount, temperature, and sunshine amount of flowering-related genes in the B1 tree are shown in order from the top.
  • the period of the gray band corresponds to the time when the target plant is in bloom.
  • ⁇ Create model 1> The method of creating a model (model 1) for estimating the weather information and the information in the intermediate state in the present embodiment will be described below.
  • Model 1 is created using the weather information around the time of flowering and the information of the intermediate state. Specifically, from the timing when it is determined that the flower has bloomed (the period of the gray band in FIG. 4), the weather information for the past 90 days (average value at 5-day intervals, that is, 18 data for each variable) is used. , The regression model is created using Lasso represented by the following equation 1 with the expression level of the flowering-related gene as the objective variable and the weather information as the explanatory variable. The regression model is created for each type of flowering-related gene.
  • y is the objective variable
  • x is the explanatory variable
  • is the regression coefficient
  • is the regularization parameter
  • Model 1 is calculated by obtaining the optimum ⁇ value for the regression model represented by the ⁇ function with the expression level of the flowering-related gene as the objective variable and meteorological information (54 variables) calculated in this way. To do.
  • the optimum value of ⁇ is calculated by cross-validation.
  • FIG. 5 shows the relationship between each variable and the coefficient in the model 1 created from the data shown in FIG. Regarding the prediction target of this embodiment, it can be confirmed that the estimation of the intermediate state is particularly strongly influenced by the amount of rainfall.
  • the meteorological information is input to the model 1 for estimating the relationship between the meteorological information and the intermediate state, and the result is input to the model 2 for estimating the relationship between the intermediate state and the flowering. To do. In this way, flowering is predicted from meteorological information using a two-step estimation model. In the following, a method for creating model 2 for estimating the relationship between the intermediate state and flowering will be described.
  • the expression level of the flowering-related gene used when creating the model 1 is used as input data for creating the model 2.
  • the binary recording of "whether or not it has blossomed" for each sample described in FIG. 3 is used. Therefore, in the present embodiment, a generalized linear model is created by using the explanatory variables as the expression levels of the flowering-related genes and the objective variable as the flowering information (binomial distribution).
  • the optimum parameters are determined by maximum likelihood estimation. Then, a generalized linear model in which the optimum parameters are substituted is generated as model 2.
  • the estimation result of whether or not the flowering is blooming is output by the two-step prediction using only the meteorological information. Can be done.
  • step 600 information necessary for creating models 1 and 2 such as weather information and intermediate information is input to the maturity prediction system 100.
  • the input information is input to the prediction model generation unit 120.
  • the input at this time may be configured to input information specified by an input unit (not shown) or the like.
  • the model 1 is created by LASSO and the model 2 is created by a generalized linear model from the input weather information and intermediate information.
  • step 610 which is the prediction phase.
  • step 610 the meteorological information of the flowering prediction target period is input to the maturity prediction system 100.
  • the input weather information is input to the prediction unit 110 and input to the model 1 prepared in step 600.
  • the predicted value of the expression level of the flowering-related gene is output, and the process proceeds to step 620.
  • the number of days of weather information to be input varies depending on the period of the prediction target, but in the present embodiment, the weather information of the past 90 days of the predicted flowering date is input.
  • step 620 the predicted value of the expression level of the flowering-related gene output from the model 1 is input to the model 2. Then, the result of flowering prediction is output or recorded, and the process ends.
  • the flowering prediction result output here is configured to output a single-day flowering prediction corresponding to the weather information input in step 610.
  • it may be configured to input meteorological information of 90 days or more and collectively output flowering predictions for the corresponding period. For example, by inputting the weather forecast information for 120 days from the current date, it is possible to predict the flowering of 3 to 4 months ahead.
  • it may be configured to output a flowering prediction according to an input from an input unit (not shown) (forecast for a single day on a specified day, forecast for a period), or for the first time.
  • the date predicted to bloom may be output as the "predicted flowering date”.
  • the flowering prediction correct answer rate is 0 when a model is created using LASTO to predict the relationship between meteorological data and flowering information as in the conventional method, and flowering is predicted by one-step prediction. It was 402. On the other hand, the correct answer rate when the method of this embodiment was used was 0.807. As described above, according to the maturity prediction system 100 of the present embodiment, it was possible to obtain a flowering prediction result in which the prediction accuracy was significantly improved as compared with the conventional method.
  • the model 1 including the model 1 that outputs the prediction of the intermediate state of the target plant from the meteorological information and the model 2 that outputs the maturity prediction from the intermediate state of the model 1 It is configured to perform two-step prediction that predicts maturity by using the output as the input of model 2. Therefore, as described above, it is possible to obtain a maturity prediction system with improved prediction accuracy as compared with the conventional method. Further, since the maturity prediction can be performed only by inputting the weather information, a highly convenient maturity prediction system can be obtained. Further, since the models 1 and 2 for the intermediate state are created, it is not necessary to acquire and input the information of the intermediate state when predicting the maturity, and a more convenient maturation system can be obtained. Further, if the weather information, the intermediate state, and the maturity result can be obtained, the prediction target is not particularly limited, so that a highly versatile maturity prediction system can be obtained.
  • the prediction model generation unit 120 creates each model using sparse modeling, it is possible to create a model that is effective even when the number of training samples is small. is there. Further, since the model 1 is created by the Lasso and the model 2 is created by the generalized linear model, it is possible to obtain the effect of knowing when and what kind of weather information is important for prediction.
  • the maturity prediction system 100 of the present embodiment is configured to create models 1 and 2 for predicting intermediate state information and perform two-step prediction. Therefore, it is not necessary to acquire and input the intermediate state information when predicting flowering, and it is particularly suitable when it is difficult to acquire the intermediate state information.
  • the prediction unit 110 performs prediction using the model 1 and the model 2 created by the prediction model generation unit 120 is described as an example, but it is separately described by other than the prediction model generation unit 120. It may be configured to make predictions using the generated models 1 and 2.
  • the model 1 and the model 2 created outside the maturity prediction system 100 may be configured to be installed in the maturity prediction system 100 using a recording medium or the like.
  • the prediction model generation unit 120 creates the model 1 using LASSO and the model 2 is created by the generalized linear model has been described, but any model creation method may be used.
  • the information for predicting maturity is a combination of rainfall, minimum temperature, maximum temperature, average temperature, and amount of sunshine, and the information in the intermediate state is the expression level of flowering-related genes. Any information may be used without limitation.
  • the above-mentioned means and functions are realized by a computer (including a CPU, an information processing device, and various terminals) reading and executing a predetermined program.
  • the program may be provided in a form recorded on a computer-readable recording medium, or may be provided from a storage device such as a hard disk inside or outside the maturity prediction system 100 via a communication means or the like.
  • the web service may be configured to execute the above-mentioned means and functions and receive only the execution result on the user terminal side. Further, each of these configurations may be configured in hardware by a dedicated circuit or the like.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental Sciences (AREA)
  • Ecology (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Botany (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Economics (AREA)
  • Forests & Forestry (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

簡便性、汎用性、予測精度を向上させた成熟予測システムを提供する。 気象情報を入力とし対象植物の中間状態の予測を出力とする第1モデルと、前記中間状態の情報を入力とし前記対象植物の成熟予測を出力とする第2モデルと、を作成し、成熟予測時期の気象情報が前記第1モデルに入力され、前記第1モデルから出力された前記成熟予測時期における前記対象植物の中間状態の予測が前記第2モデルに入力されることにより、前記成熟予測時期における前記対象植物の成熟予測が出力されることを特徴とする、植物の成熟予測システム。

Description

成熟予測システム
 この発明は、気象情報から植物の成熟を予測するシステムに関するものである。
 農業において、出穂、開花、果実の成熟といった作物・植物の成熟に関するタイミングを知ることは、人員の配置、作物流通のタイミング等を図るために重要である。例えば、スギ等を対象とすれば花粉アレルギー患者発生のタイミングを知ることができ、医師や治療薬の配置を最適化することが可能となる。
 非特許文献1に記載のように、気象情報に基づき開花を予測する手法として、日々の最高気温に基づきソメイヨシノの開花を予測する600度式が知られている。しかし、この予測式はソメイヨシノの開花に限定されたものであり、汎用性がなかった。
 また、非特許文献2に記載のように、短期気象変動を利用し、トウモロコシ、ダイズ、コメ、コムギについて収量予測を行う方法がある。しかし、予測精度に問題があった。
 更に、特許文献1には、気象情報と花粉発生源の情報から、目的地点における花粉の飛散量を予測するシステムが開示されている。しかし、目的地点の情報とは別に、花粉発生源の情報(スギ林の植生データ等)を取得する必要があり、簡便性の点で課題があった。
特開2012-098189号公報
http://www.env.go.jp/air/report/h16-04/mat02j.pdf(2019年3月8日検索) http://www.naro.affrc.go.jp/publicity_report/press/laboratory/niaes/120985.html(2019年3月8日検索)
 上述の通り、従来の植物の成熟予測は、予測精度の観点から課題があった。本発明は、上記の点を改善した植物の成熟予測システムを提供することを目的とする。
  (構成1)
 植物の成熟予測システムであって、
 気象情報を入力とし、対象植物の成熟に関する生体情報である中間状態情報の予測を出力とする第1モデルと、
 前記中間状態情報を入力とし前記対象植物の成熟予測を出力とする第2モデルと、を備え、
 気象情報が前記成熟予測システムに入力され、
 前記成熟予測システムが、
  前記気象情報を前記第1モデルに入力し、
  前記第1モデルから出力された前記対象植物の中間状態情報の予測を前記第2モデルに入力し、
  前記第2モデルから出力された成熟予測に基づき、前記対象植物の成熟予測を出力する、
 ことを特徴とする、成熟予測システム。
  (構成2)
 前記気象情報、前記中間状態情報、及び前記対象植物の成熟情報を入力し、機械学習により前記第1モデル及び前記第2モデルを生成する、予測モデル生成部を備える、構成1に記載の成熟予測システム。
  (構成3)
 前記機械学習がスパースモデリングである、構成2に記載の成熟予測システム。
  (構成4)
 前記第1モデルがLASSOにより生成された線形モデルであり、前記第2モデルがGLMである、構成2または3に記載の成熟予測システム。
  (構成5)
 前記気象情報が、降雨量、最低気温、最高気温、平均気温、日照量のいずれか又は組み合わせである、構成1から4のいずれかに記載の成熟予測システム。
  (構成6)
 前記中間状態情報が、遺伝子発現量、タンパク質量、メチル化量、及び化合物量のいずれか又は組み合わせである、構成1から5のいずれかに記載の成熟予測システム。
 本発明の成熟予測システムによれば、予測精度が改善された成熟予測を実施することが可能である。
本発明に係る実施形態の成熟予測システムを示す概略構成図である。 成熟予測に関する、従来手法と実施形態における手法とを比較した概念図である。 実施形態における中間情報の一例を示す図である。 実施形態における気象情報の一例を示す図である。 実施形態における気象情報と開花の関連においてLASSO回帰を実施した場合の結果の一例である。 実施形態における開花予測の全体的な動作を示すフロー図である。
 以下、この発明を実施するための形態について、添付の図面にしたがって説明する。なお、以下の実施形態は、本発明を具体化する際の一形態であって、本発明をその範囲内に限定するものではない。
<実施形態>
 図1はこの発明の実施形態による本発明に関する部分を示す概略構成図である。
 成熟予測システム100は入力された気象情報から、対象植物の成熟予測を行うシステムであり、予測部110と、予測モデル生成部120を備える。
 予測部110は、入力された気象情報から、対象植物の成熟に関連する遺伝子の発現量等の中間情報を予測する。更に、予測された中間情報から対象植物の成熟を予測する。詳細については後述する。
 また、予測モデル生成部120は、気象情報を入力として学習を行うことにより対象植物の中間情報の予測モデルである第1モデルと、中間情報に基づく対象植物の成熟予測モデルである第2モデルを生成する。
 成熟予測システム100は、各構成の機能が記載されたプログラムを格納する記憶部、及びそのプログラムを実行するプロセッサ等を備えるコンピュータを含むシステムとして構成されている。
 以下、本発明における成熟予測の方法と、従来手法について、図2に基づき説明する。
 図2は従来手法及び、本発明における対象植物の成熟予測モデル及び、予測方法の概念を説明した図である。
 なお、「対象植物の成熟」とは、出穂、開花、果実の成熟等の表現型のイベントのことを意味し、本実施形態においては、開花を意味するものとして以下説明を行う。
 従来より、マレーシアなどの熱帯アジアにおいて、特定の種の植物がある時期に一斉に開花する現象が知られている。
 この一斉開花は2年連続で発生したり、数年発生しない場合もある等、その間隔が不定期であり、一斉開花のトリガーとなる条件が不明であった。特に、気温や日照時間の変化の少ない熱帯においてはどのような気象条件がトリガーとなるのかを掴むことが難しかった。
 このように因果関係が不明確である事象のモデルを作成する場合、特定の変数と開花の関係を学習することにより、開花モデルを作成することが従来より行われている。
 図2の左列には従来手法の1つである、LASSO(Least Absolute Shrinkage and Selection Operator)を用いて、気象情報と開花の線形モデルを作成する例を示している。しかし、上述のように従来手法による開花モデルは予測精度の点で課題があった。
 図2の右列に本手法の概念図を示している。
 本実施形態においては、まず学習フェーズとして開花関連遺伝子の発現量といった対象植物の「中間状態」に着目し、まず気象情報と中間状態との関係に基づきモデル1を作成し、次に中間状態と開花の関係に基づきモデル2を作成することとした。
 次に予測フェーズとし、モデル1に成熟を予測したい期間の気象情報を入力し、モデル1の出力、即ち中間状態の予測値をモデル2に入力することにより開花の予測を得る。
 本実施形態の手法によれば、気象情報のみから開花の予測を行うことができ、従来手法に比して大幅に精度が向上した開花予測を得ることができる。
 以下、本実施形態においては対象植物をトウダイグサ科のオオバギを例にして説明する。ただし、対象植物をオオバギに限定する必要はなく、どのような植物であっても本手法を適用することが可能である。
 以下、本実施形態における各情報について具体的に説明する。
<中間状態>
 本実施形態における中間状態情報とは、開花関連遺伝子の発現量、タンパク質量、各塩基におけるメチル化の有無の比率、及び化合物の量を指す。例えば開花関連遺伝子の発現量はRNAから取得することができる。
 図3には対象植物の取得サンプルにおける開花率と年月との関係及びRNA取得のタイミングがグラフに示されている。本実施形態においては、20個体について1週ごとに観測を行い、80週分のサンプルを取得した。また、上記20個体のうち、3個体についてRNAを取得した。
 なお図中のB1、B2、B6は採取した木の名称であり、どの木からいつサンプルを取得したかを表す。
<気象情報>
 また、本実施形態における気象情報については、日毎の降雨量(以下においては単に「降雨量」とも称する)、日毎の最低、最高、平均気温(以下においては単に「気温」とも称する)及び、日毎の日照量(以下においては単に「日照量」とも称する)を用いた。図4においては上段から順にB1の木における開花関連遺伝子の発現量、降雨量、気温、日照量のデータを示している。グレーの帯の期間が対象植物が開花している時期に該当する。
<モデル1作成>
 以下に、本実施形態における気象情報と、中間状態の情報と、を推定するモデル(モデル1)の作成手法について記載する。
 開花した時期周辺の気象情報と、中間状態の情報と、を使用し、モデル1を作成する。具体的には、開花したと判定されたタイミング(図4におけるグレーの帯の期間)から、過去90日間の気象情報(5日間隔での平均値、即ち各変数ごとに18データ)を用いて、開花関連遺伝子の発現量を目的変数、気象情報を説明変数として、以下の数1にて表されるLASSOを用いて回帰モデルを作成する。
 なお、回帰モデルの作成は開花関連遺伝子の種類毎に作成される。
Figure JPOXMLDOC01-appb-M000001




 上記数1においてyは目的変数、xは説明変数、βは回帰係数、λは正則化パラメータである。
 このように算出された、開花関連遺伝子の発現量を目的変数、気象情報(54変数)としたλの関数により表される回帰モデルについて、最適なλの値を求めることにより、モデル1を算出する。本実施形態では、クロスバリデーションにより最適なλの値を算出する。
 図5には、図4に記載されたデータから作成したモデル1における、各変数と係数の関係について示している。
 本実施形態の予測対象については、中間状態の推定について、特に降雨量からの影響が強いことが確認できる。
<モデル2作成>
 上述のように、本実施形態においては、気象情報を、気象情報と中間状態との関係を推定するモデル1に入力し、その結果を、中間状態と開花との関係を推定するモデル2に入力する。このように2段階の推定モデルにより、気象情報から開花の予測を行う。
 以下では、中間状態と開花との関係を推定するモデル2の作成手法について記載する。
 本実施形態においては、モデル1の作成の際に使用した開花関連遺伝子の発現量をモデル2作成のための入力データとして使用する。なお、モデル2の出力データとしては、図3にて記載された各サンプルごとの「開花したかどうか」の2値の記録を使用する。
 そのため、本実施形態においては、説明変数を開花関連遺伝子のそれぞれの発現量、目的変数を開花情報(2項分布)として、一般化線形モデル(generalized linear model)を作成する。また、最尤推定により最適パラメータを決定する。
 そして最適パラメータを代入した一般化線形モデルをモデル2として生成する。
 以上のように、本実施形態においては、上記のように算出されたモデル1とモデル2を用いて、気象情報のみを用いた2段階予測によって、開花しているかどうかの推定結果を出力することができる。
<動作>
 次に、図6のフロー図を参照しつつ、実施形態における成熟予測システム100の処理動作について説明する。
 まず、モデル作成フェーズについて説明する。
 ステップ600において、成熟予測システム100に気象情報や中間情報等、モデル1及び2の作成に必要な情報が入力される。入力された情報は予測モデル生成部120へと入力される。なお、この際の入力は入力部(不図示)等により指定された情報を入力するように構成されていてもよい。
 上述のように、本実施形態においては、入力された気象情報及び中間情報の情報から、モデル1はLASSOにより作成され、モデル2は一般化線形モデルにより作成される。
 そして、モデル1及び2の作成が完了したら予測フェーズであるステップ610へと移行する。
 続くステップ610において、開花予測対象期間の気象情報が成熟予測システム100に入力される。入力された気象情報は予測部110に入力され、ステップ600において準備されたモデル1に入力される。そして、開花関連遺伝子の発現量の予測値が出力され、ステップ620へと移行する。
 気象情報を何日分を入力するか等については、予測対象の期間によって変動するが、本実施形態においては開花予測日の過去90日分の気象情報が入力される。
 続くステップ620において、モデル1から出力された開花関連遺伝子の発現量の予測値がモデル2に入力される。そして開花予測の結果が出力または記録され、処理を終了する。
 なお、ここでの開花予測の結果出力については、ステップ610にて入力された気象情報に対応した単日の開花予測を出力されるように構成されている。
 また、90日以上の気象情報を入力し、対応する期間の開花予測をまとめて出力するように構成されていてもよい。
 例えば、現在日から120日分の気象予報情報を入力とすることで、3ヶ月~4か月先の開花について予測することができる。
 このような動作を行う場合、入力部(不図示)からの入力(指定日単日の予想、期間での予想)に応じた開花予測を出力されるように構成されていてもよいし、初めて開花すると予測された日を、「開花予測日」として出力されるように構成されていてもよい。
 なお、図2に示すように、従来手法と同様に気象データと開花情報の関係をLASSOを用いてモデルを作成し、1段階の予測により開花予測を行った場合の開花予測正答率は0.402であった。一方、本実施形態の手法を用いた場合の正答率は0.807であった。
 このように、本実施形態の成熟予測システム100によれば、従来手法に比して大幅に予測精度が向上した開花予測結果を得ることができた。
<効果>
 以上のように、本実施形態の成熟予測システム100によれば、気象情報から対象植物の中間状態の予測を出力するモデル1と、中間状態から成熟予測を出力するモデル2を備え、モデル1の出力をモデル2の入力にすることで成熟予測を行う2段階予測を行うように構成されている。
 そのため、上述のように従来手法と比して予測精度の改善された成熟予測システムを得ることができる。
 また、気象情報の入力のみから成熟予測を行うことができるため、簡便性の高い成熟予測システムを得ることができる。
 また、中間状態についてのモデル1及び2を作成するため、成熟予測を行う際に中間状態の情報を取得、入力する必要がなく、より簡便性の高い成熟システムを得ることができる。
 また、気象情報、中間状態、成熟結果について得ることができれば予測対象については特に限定されないため、汎用性の高い成熟予測システムを得ることができる。
 また、本実施形態の成熟予測システム100は、予測モデル生成部120がスパースモデリングを使用して各モデルを作成するため、学習サンプルの数が少ない場合にも有効なモデルを作成することが可能である。
 また、LASSOによりモデル1を作成し、一般化線形モデルによりモデル2を作成しているため、いつの、どのような気象情報が予測に重要であるかが分かるという効果を得られる。
 また、本実施形態における中間状態の情報取得のためにはRNAを取得する必要がある。そのためには対象の植物(の一部)を採取し、試薬等を使用し、情報を取得する必要がある。そのため、中間状態の情報の取得は、工程的、金額的コストがかかる。また、対象植物の種の保存等の観点からも、中間状態の情報については、取得できるデータの数が少なくなることが多い。
 しかし、上記の通り、本実施形態の成熟予測システム100は中間状態情報について予測するモデル1及び2を作成し、2段階の予測を行うように構成されている。そのため、開花の予測を行う場合には中間状態情報を取得、入力する必要がなく、中間状態の情報が取得困難である場合に特に好適である。
<その他の構成>
 本実施形態においては、予測部110が、予測モデル生成部120にて作成されたモデル1及びモデル2を使用して予測を行う場合を例として記載したが、予測モデル生成部120以外にて別途生成されたモデル1及び2を使用して予測を行うように構成されていてもよい。例えば、成熟予測システム100の外部にて作成されたモデル1及びモデル2を記録媒体等を用いて成熟予測システム100にインストールされるように構成されていてもよい。
 本実施形態では予測モデル生成部120がLASSOを使用してモデル1を作成し、一般化線形モデルにてモデル2を作成する例を説明したが、任意のモデル作成手法を使用してもよい。
 また、本実施形態においては成熟予測のための情報を、降雨量、最低気温、最高気温、平均気温、日照量の組み合わせとし、中間状態の情報を、開花関連遺伝子発現量としたが、これらに限られるものではなく、どのような情報を用いてもよい。
 なお、本実施形態では、成熟予測システム100がコンピュータを含むシステムにより実行される例を説明した。そのため、上述した手段、機能はコンピュータ(CPU、情報処理装置、各種端末を含む)が所定のプログラムを読み込んで実行することによって実現される。プログラムはコンピュータで読み取り可能な記録媒体に記録された形態で提供されてもよいし、成熟予測システム100の内部及び外部のハードディスク等の記憶装置から、通信手段等を介して提供されてもよい。また、ウェブサービスとして上述した手段、機能を実行し、実行結果のみをユーザ端末側で受け取るように構成されていてもよい。
 また、これらの構成は、それぞれ専用回路等でハード的に構成されるものであってもよい。
 以上、実施形態を参照して本発明を説明したが、本発明は上述した実施形態に限定されるものではない。本発明の構成及び動作については、本発明の趣旨を逸脱しない範囲において、当業者が理解しうる様々な変更を行うことができる。
100…成熟予測システム
110…予測部
120…予測モデル生成部

Claims (6)

  1.  植物の成熟予測システムであって、
     気象情報を入力とし、対象植物の成熟に関する生体情報である中間状態情報の予測を出力とする第1モデルと、
     前記中間状態情報を入力とし、前記対象植物の成熟予測を出力とする第2モデルと、を備え、
     気象情報が前記成熟予測システムに入力され、
     前記成熟予測システムが、
      前記気象情報を前記第1モデルに入力し、
      前記第1モデルから出力された前記対象植物の中間状態情報の予測を前記第2モデルに入力し、
      前記第2モデルから出力された成熟予測に基づき、前記対象植物の成熟予測を出力する、
     ことを特徴とする、成熟予測システム。
  2.  前記気象情報、前記中間状態情報、及び前記対象植物の成熟情報を入力し、機械学習により前記第1モデル及び前記第2モデルを生成する、予測モデル生成部を備える、請求項1に記載の成熟予測システム。
  3.  前記機械学習がスパースモデリングである、請求項2に記載の成熟予測システム。
  4.  前記第1モデルがLASSOにより生成された線形モデルであり、前記第2モデルがGLMである、請求項2または3に記載の成熟予測システム。
  5.  前記気象情報が、降雨量、最低気温、最高気温、平均気温、日照量のいずれか又は組み合わせである、請求項1から4のいずれかに記載の成熟予測システム。
  6.  前記中間状態情報が、遺伝子発現量、タンパク質量、メチル化量、及び化合物量のいずれか又は組み合わせである、請求項1から5のいずれかに記載の成熟予測システム。
PCT/JP2019/046009 2019-11-25 2019-11-25 成熟予測システム WO2021106046A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/046009 WO2021106046A1 (ja) 2019-11-25 2019-11-25 成熟予測システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/046009 WO2021106046A1 (ja) 2019-11-25 2019-11-25 成熟予測システム

Publications (1)

Publication Number Publication Date
WO2021106046A1 true WO2021106046A1 (ja) 2021-06-03

Family

ID=76130153

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/046009 WO2021106046A1 (ja) 2019-11-25 2019-11-25 成熟予測システム

Country Status (1)

Country Link
WO (1) WO2021106046A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018151196A1 (ja) * 2017-02-16 2018-08-23 Necソリューションイノベータ株式会社 作物生育の推定装置、作物生育の推定方法、プログラム、および記録媒体
US20190050510A1 (en) * 2017-08-10 2019-02-14 Clearag, Inc. Development of complex agricultural simulation models from limited datasets
JP2019170359A (ja) * 2018-03-28 2019-10-10 国立大学法人名古屋大学 植物栽培結果予測システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018151196A1 (ja) * 2017-02-16 2018-08-23 Necソリューションイノベータ株式会社 作物生育の推定装置、作物生育の推定方法、プログラム、および記録媒体
US20190050510A1 (en) * 2017-08-10 2019-02-14 Clearag, Inc. Development of complex agricultural simulation models from limited datasets
JP2019170359A (ja) * 2018-03-28 2019-10-10 国立大学法人名古屋大学 植物栽培結果予測システム

Similar Documents

Publication Publication Date Title
Rabosky et al. Explosive evolutionary radiations: decreasing speciation or increasing extinction through time?
Montesinos-López et al. Genomic Bayesian functional regression models with interactions for predicting wheat grain yield using hyper-spectral image data
Heslot et al. Integrating environmental covariates and crop modeling into the genomic selection framework to predict genotype by environment interactions
Bailey et al. climwin: An R toolbox for climate window analysis
Yin et al. Coupling estimated effects of QTLs for physiological traits to a crop growth model: predicting yield variation among recombinant inbred lines in barley
Biondi et al. DENDROCLIM2002: A C++ program for statistical calibration of climate signals in tree-ring chronologies
Rincent et al. Optimization of multi-environment trials for genomic selection based on crop models
Zhao et al. A non-stationary model for functional mapping of complex traits
Nandram et al. A hierarchical Bayesian model for forecasting state-level corn yield
Malosetti et al. QTL methodology for response curves on the basis of non-linear mixed models, with an illustration to senescence in potato
Potvin et al. The relative roles of cultural drift and acoustic adaptation in shaping syllable repertoires of island bird populations change with time since colonization
Umlauf et al. bamlss: A Lego toolbox for flexible Bayesian regression (and beyond)
Noorunnahar et al. A tree based eXtreme Gradient Boosting (XGBoost) machine learning model to forecast the annual rice production in Bangladesh
Lara-Romero et al. Individual spatial aggregation correlates with between-population variation in fine-scale genetic structure of Silene ciliata (Caryophyllaceae)
JP2017163956A (ja) 予測方法、予測プログラム、及び、予測装置
JP7163881B2 (ja) 作物特性予測システム、作物特性予測方法、及び作物特性予測プログラム
Fall et al. A quantitative dynamic simulation of Bremia lactucae airborne conidia concentration above a lettuce canopy
Oyebanji et al. Impact of climate change on the spatial distribution of endemic legume species of the Guineo-Congolian forest, Africa
González-Domínguez et al. Plant disease models and forecasting: changes in principles and applications over the last 50 years
JPWO2016111240A1 (ja) 情報処理システム、変化点検出方法、およびプログラム
Eisenlohr Challenges in data analysis: pitfalls and suggestions for a statistical routine in vegetation ecology
Roth et al. Image-based phenomic prediction can provide valuable decision support in wheat breeding
CN108763673B (zh) 基于lasso回归的土地利用变化驱动力筛选方法和装置
WO2021106046A1 (ja) 成熟予測システム
Poudel et al. A hierarchical Bayesian approach to dynamic ordinary differential equations modeling for repeated measures data on wheat growth

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19954053

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19954053

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP