JP2017051118A - Apparatus and method for generating characteristic estimation model and apparatus and method for estimating characteristics of analysis object - Google Patents

Apparatus and method for generating characteristic estimation model and apparatus and method for estimating characteristics of analysis object Download PDF

Info

Publication number
JP2017051118A
JP2017051118A JP2015176416A JP2015176416A JP2017051118A JP 2017051118 A JP2017051118 A JP 2017051118A JP 2015176416 A JP2015176416 A JP 2015176416A JP 2015176416 A JP2015176416 A JP 2015176416A JP 2017051118 A JP2017051118 A JP 2017051118A
Authority
JP
Japan
Prior art keywords
characteristic
characteristic estimation
variable
estimation model
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015176416A
Other languages
Japanese (ja)
Other versions
JP6570929B2 (en
Inventor
井澤 毅
Takeshi Izawa
毅 井澤
麻衣子 深田
Maiko Fukada
麻衣子 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Agriculture and Food Research Organization
Original Assignee
National Agriculture and Food Research Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Agriculture and Food Research Organization filed Critical National Agriculture and Food Research Organization
Priority to JP2015176416A priority Critical patent/JP6570929B2/en
Publication of JP2017051118A publication Critical patent/JP2017051118A/en
Application granted granted Critical
Publication of JP6570929B2 publication Critical patent/JP6570929B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an apparatus for generating a characteristic estimation model capable of exhaustively extracting explanatory variables for target variables and also provide an apparatus for estimating characteristics, the apparatus automatically estimating the growth situation of a crop using the generated model.SOLUTION: The present invention provides an apparatus 100 for generating a characteristic estimation model, the apparatus including an analysis data-updating unit 150 that generates data obtained by excluding genetic information used for generating a characteristic estimation model from analysis data and provides the data as update data. The generation of a characteristic estimation model is repeated up to the number of repetitions defined by using the update data. For each generation of the model, a characteristic-related gene extraction unit 140 extracts a gene related to the characteristics and records the gene. A characteristic estimation apparatus 300 uses a model generated in the apparatus 100 for generating a characteristic estimation model to quantitatively estimate a characteristic variable from an input state variable. A state diagnosis unit 320 diagnoses the growth information of a crop using a characteristic variable estimated by the characteristic estimation unit 310.SELECTED DRAWING: Figure 1

Description

本発明は、解析対象の特性変数及び状態情報に基づいて、解析対象の特性推定モデルを生成する、解析対象の特性推定モデル生成装置および方法、解析対象の特性推定装置および方法に関する。特に、イネ等作物の遺伝子発現情報から、作物の特性である形質を推定するのに好適な特性推定モデル生成装置および方法、解析対象の特性推定装置および方法に関する。   The present invention relates to an analysis target characteristic estimation model generation apparatus and method, and an analysis target characteristic estimation apparatus and method, which generate an analysis target characteristic estimation model based on an analysis target characteristic variable and state information. In particular, the present invention relates to a characteristic estimation model generation apparatus and method suitable for estimating a trait that is a characteristic of a crop from gene expression information of a crop such as rice, and a characteristic estimation apparatus and method to be analyzed.

近年、PCなどの処理装置の高性能化が著しい。そのため、自然界に発生する現象のように複雑な系を、大量のデータを用いた統計解析によってモデル化する技術開発が盛んである。このような統計解析手法としてよく用いられる手法がLASSO回帰などといった、正則化項を有する回帰分析である。
しかし、正則化項を有する回帰分析は、与えられたデータから最も良いモデルを生成することに終始する。そのため、結果に一意性がなく、モデル生成の際に目的変数に対する説明変数を網羅的に抽出することができないという課題があった。
In recent years, the performance of processing apparatuses such as PCs has been greatly improved. For this reason, technological development for modeling a complex system such as a phenomenon occurring in the natural world by statistical analysis using a large amount of data has been active. A technique often used as such a statistical analysis technique is a regression analysis having a regularization term such as LASSO regression.
However, regression analysis with regularization terms is all about generating the best model from the given data. For this reason, there is a problem that the results are not unique, and it is not possible to exhaustively extract explanatory variables for the objective variable when generating the model.

また、上記のようなモデル化が望まれている分野の一つが農業である。
作物の生育度を定量的に測定し、生育診断や土壌診断を行って、栽培管理を行う技術が近年開発されている。具体的には、作物の生育度等を定量的に測定、もしくは予測を行い、的確な施肥時期や施肥量を決定することで科学的、計画的に作物の栽培、収穫を行うものである。
Moreover, agriculture is one of the fields in which modeling as described above is desired.
In recent years, a technique for performing cultivation management by quantitatively measuring the degree of growth of crops, performing growth diagnosis and soil diagnosis has been developed. Specifically, cultivation and harvesting of crops are carried out scientifically and systematically by quantitatively measuring or predicting the degree of growth of crops, etc., and determining the exact fertilization time and amount.

科学的、計画的な作物の栽培、収穫の実現に特に重要な要素は、施肥である。施肥のタイミングは、作物の収量と品質管理に大きく影響を与える。
一般的には、施肥の量を増やすことで、収量を上げることができるが、コストが増加してしまう。さらに、過剰な施肥は、収穫対象部位に多くのタンパク質、すなわち窒素を溜めることとなり、品質が低下してしまう。また、肥料の中にはリン酸が含まれる。過剰な施肥により、例えば水田中に飽和したリン酸が、河川や海などに流出することは深刻な水質汚染にもつながるといった問題も発生する。
従って、作物の生育状況に合わせて、適切な量およびタイミングでの施肥が、作物の収量と品質を上げるためには重要である。
Fertilization is a particularly important factor in the cultivation and harvesting of scientific and planned crops. The timing of fertilization has a major impact on crop yield and quality control.
In general, increasing the amount of fertilizer can increase the yield, but increases the cost. Furthermore, excessive fertilization will accumulate a large amount of protein, that is, nitrogen, in the harvest target site, and the quality will deteriorate. In addition, the fertilizer contains phosphoric acid. Due to excessive fertilization, for example, the phosphoric acid saturated in the paddy field flows out into rivers, seas, etc., leading to serious water pollution.
Therefore, fertilization with an appropriate amount and timing according to the growing situation of the crop is important for increasing the yield and quality of the crop.

従って、科学的、計画的な作物の栽培、収穫の実現のためには、施肥の適切な管理が重要である。そのためには、農作物の生育状況をより正確に、短時間に把握することが重要である。
従来は、作物の生育状況を、葉の色などの作物の外観より得られる情報から判断していた。しかし、作物の外観は温度や日照時間、水質など様々な要素の影響を受けるため、外観から定量的に作物の生育状況を判断することは難しい。
Therefore, appropriate management of fertilization is important for the cultivation and harvesting of scientific and planned crops. For that purpose, it is important to grasp the growing situation of the crop more accurately and in a short time.
Conventionally, the growth status of a crop has been judged from information obtained from the appearance of the crop, such as the color of leaves. However, since the appearance of crops is affected by various factors such as temperature, sunshine duration, and water quality, it is difficult to quantitatively judge the crop growth status from the appearance.

このような課題に対応するために、作物の葉の葉緑素量と、遅延発光量とを測定することで、水分量が足りているかどうかの指標である渇水ストレスの状況を判断する方法が特許文献1に開示されている。   In order to cope with such a problem, a method for determining a drought stress situation, which is an index of whether or not the amount of water is sufficient, is measured by measuring the amount of chlorophyll and the amount of delayed luminescence in a crop. 1 is disclosed.

しかし、葉緑素値は外乱の影響を受けやすいため、個体差が大きい。そのため、葉緑素量を使用することで生育状況の判定結果が不安定になるという課題があり、葉緑素量を用いることなく、生育状況を定量的に判断する手法が望まれていた。   However, the chlorophyll value is susceptible to disturbances, so there are large individual differences. For this reason, there is a problem that the determination result of the growth state becomes unstable by using the amount of chlorophyll, and a method for quantitatively determining the growth state without using the amount of chlorophyll has been desired.

葉緑素量を用いることなく定量的に生育状況を判断する従来技術として、トウモロコシの遺伝子発現情報を解析することで、施肥の有無に応答する遺伝子をかどうかを判断する推定モデルを生成する技術が非特許文献1に開示されている。   As a conventional technique for quantitatively determining the growth status without using chlorophyll content, there is no technique for generating an estimation model for determining whether a gene responds to the presence or absence of fertilization by analyzing gene expression information in maize. It is disclosed in Patent Document 1.

非特許文献1の技術を実施することで、測定対象のトウモロコシに発現した遺伝子情報が、施肥の有無に応答するかどうかを判断することはできる。しかし、推定モデルを生成するためには、施肥の有無に応答する遺伝子の絞り込みのための実験を行う必要があり、非常に煩雑であった。また、この技術によると、葉内に窒素がどの程度溜まっているかを表す、窒素含有量を推定するモデルを作成することはできる。しかし、窒素含有量以外の農業形質を網羅的に推定することができないという課題があった。   By implementing the technique of Non-Patent Document 1, it is possible to determine whether or not the gene information expressed in the measurement target corn responds to the presence or absence of fertilization. However, in order to generate an estimation model, it is necessary to conduct experiments for narrowing down genes that respond to the presence or absence of fertilization, which is very complicated. Also, according to this technique, it is possible to create a model for estimating the nitrogen content that expresses how much nitrogen is accumulated in the leaves. However, there was a problem that agricultural traits other than nitrogen content could not be comprehensively estimated.

さらに、上記のような遺伝子解析は、専門の知識を有する技術者によって行われることが多く、生育状況の判断のために煩雑な手間および時間が必要となる。そのため、生育状況を短時間で、自動的に判断する技術が望まれている。   Furthermore, the gene analysis as described above is often performed by an engineer having specialized knowledge, and complicated labor and time are required for determining the growth status. Therefore, a technique for automatically determining the growth status in a short time is desired.

特開2013−183702号公報JP 2013-183702 A

Yang XS1, Wu J, Ziegler TE, Yang X, Zayed A, Rajani MS, Zhou D, Basra AS, Schachtman DP, Peng M, Armstrong CL, Caldo RA, Morrell JA, Lacy M, Staub JM (2011) Gene expression biomarkers provide sensitive indicators of in planta nitrogen status in maize. Plant Physiology December 2011, Vol. 157, pp. 1841-1852Yang XS1, Wu J, Ziegler TE, Yang X, Zayed A, Rajani MS, Zhou D, Basra AS, Schachtman DP, Peng M, Armstrong CL, Caldo RA, Morrell JA, Lacy M, Staub JM (2011) Gene expression biomarkers provide sensitive indicators of in planta nitrogen status in maize.Plant Physiology December 2011, Vol. 157, pp. 1841-1852

本発明は上記事情に鑑み、解析対象の特性を推定するモデル生成において、目的変数に対する説明変数を網羅的に抽出可能なモデル生成装置および、生成されたモデルを用いて作物の生育状況を自動的に推定する装置を得ることを目的とする。   In view of the above circumstances, in the present invention, in model generation for estimating the characteristics of an analysis target, a model generation apparatus capable of exhaustively extracting explanatory variables for objective variables, and the growth status of crops automatically using the generated model An object of the present invention is to obtain an apparatus for estimating the above.

(構成1)
解析対象の状態を表す状態変数と、前記解析対象の特性を表す特性変数から、前記特性変数を前記状態変数により推定するモデルを生成する特性推定モデル生成装置であって、
前記解析対象の状態変数と、前記解析対象の特性変数が入力され、解析用データとして出力する、データ出力部と、
前記解析用データのうち、前記特性変数を目的変数とし、前記状態変数を説明変数として、正則化項を有する回帰分析を行うことで、前記目的変数と前記説明変数との関係を表す回帰モデルを生成する、回帰分析部と、
前記回帰モデルと前記解析用データを用いて、事前に設定された検証回数まで交差検証を行い、前記回帰モデルのうち最適な正則化項を有するモデルを、特性推定モデルとして生成する特性推定モデル生成部と、
前記特性推定モデルにおいて選択された説明変数に対応するデータを、前記解析用データから除外したデータを、更新データとして生成し、次回の特性推定モデル生成時の解析用データとして前記データ出力部へと出力する、解析用データ更新部と、
を備え、
事前に設定された繰り返し回数まで、前記解析用データの更新と、前記更新データを用いた特性推定モデルの生成と、を繰り返すことを特徴とする特性推定モデル生成装置。
(Configuration 1)
A characteristic estimation model generation device that generates a model that estimates the characteristic variable from the state variable that represents the state of the analysis target and the characteristic variable that represents the characteristic of the analysis target.
A data output unit that receives the state variable to be analyzed and the characteristic variable to be analyzed and outputs as analysis data;
Of the analysis data, the regression variable representing the relationship between the objective variable and the explanatory variable is obtained by performing a regression analysis having a regularization term using the characteristic variable as an objective variable and the state variable as an explanatory variable. A regression analysis unit to generate,
Using the regression model and the analysis data, cross-validation is performed up to a preset number of verifications, and a model having an optimal regularization term among the regression models is generated as a characteristic estimation model generation. And
Data corresponding to the explanatory variable selected in the characteristic estimation model, data excluded from the analysis data, is generated as update data, and is sent to the data output unit as analysis data at the next generation of the characteristic estimation model. An analysis data update unit to output,
With
A characteristic estimation model generation apparatus that repeats updating of the analysis data and generation of a characteristic estimation model using the update data up to a preset number of repetitions.

(構成2)
前記特性推定モデル生成部において交差検証を行う毎に生成される、前記回帰モデルについて、全てのモデルにおいて選択されている説明変数を、前記解析対象の特性に関連する状態情報である特性関連状態情報として抽出する、特性関連状態情報抽出部を更に備える構成1に記載の特性推定モデル生成装置。
(Configuration 2)
About the regression model generated every time cross-validation is performed in the characteristic estimation model generation unit, the explanatory variables selected in all models are characteristic-related state information that is state information related to the characteristic to be analyzed The characteristic estimation model production | generation apparatus of the structure 1 further provided with the characteristic relevant state information extraction part extracted as follows.

(構成3)
前記回帰分析は、LASSO回帰、Ridge回帰もしくは、Elastic-netである構成1又は2に記載の特性推定モデル生成装置。
(Configuration 3)
The characteristic estimation model generation device according to Configuration 1 or 2, wherein the regression analysis is LASSO regression, Ridge regression, or Elastic-net.

(構成4)
前記解析対象は生物であり、前記状態変数は遺伝子発現情報であり、前記特性変数は形質情報である、構成1から3の何れかに記載の特性推定モデル生成装置。
(Configuration 4)
The characteristic estimation model generation device according to any one of configurations 1 to 3, wherein the analysis target is a living organism, the state variable is gene expression information, and the characteristic variable is trait information.

(構成5)
前記生物は作物である、構成4に記載の特性推定モデル生成装置。
(Configuration 5)
The characteristic estimation model generation device according to Configuration 4, wherein the organism is a crop.

(構成6)
前記作物はイネ科作物である、構成5に記載の特性推定モデル生成装置。
(Configuration 6)
The characteristic estimation model generation device according to Configuration 5, wherein the crop is a gramineous crop.

(構成7)
前記イネ科作物はイネである、構成6に記載の特性推定モデル生成装置。
(Configuration 7)
The characteristic estimation model generation device according to configuration 6, wherein the gramineous crop is rice.

(構成8)
前記形質情報は、移植日からの日数を表す移植日後日数、サンプリング日から開花までに要する日数を表す開花日または、観測対象の乾燥重量当たりの窒素含量を表す窒素含量である構成5から7の何れかに記載の特性推定モデル生成装置。
(Configuration 8)
The trait information is the number of days after the transplantation date representing the number of days from the date of transplantation, the flowering date representing the number of days required from the sampling date to flowering, or the nitrogen content representing the nitrogen content per dry weight of the observation target. The characteristic estimation model generation apparatus according to any one of the above.

(構成9)
前記解析対象の前記特性を推定する、特性推定装置であって、
構成1から8の何れかに記載の特性推定モデル生成装置によって生成した前記特性推定モデルに、前記解析対象の状態変数が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定部を有することを特徴とする、特性推定装置。
(Configuration 9)
A characteristic estimation device for estimating the characteristic of the analysis target,
A characteristic estimation that is an estimation result of the characteristic of the analysis target when the state variable of the analysis target is input to the characteristic estimation model generated by the characteristic estimation model generation device according to any one of configurations 1 to 8 A characteristic estimation apparatus comprising a characteristic estimation unit for outputting information.

(構成10)
前記解析対象の前記特性を推定する、特性推定装置であって、
構成4から8の何れかに記載の特性推定モデル生成装置によって生成した前記特性推定モデルに、前記生物の遺伝子発現情報が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定部を有し、
前記生物の前記遺伝子発現情報は、前記特性関連状態情報抽出部にて抽出された、前記特性関連状態情報に対応する遺伝子より転写されるmRNA量から測定されることを特徴とする特性推定装置。
(Configuration 10)
A characteristic estimation device for estimating the characteristic of the analysis target,
Characteristic estimation that is an estimation result of the characteristics of the analysis target by inputting gene expression information of the organism to the characteristic estimation model generated by the characteristic estimation model generation device according to any one of configurations 4 to 8 A characteristic estimation unit for outputting information;
The gene expression information of the organism is measured from the amount of mRNA transcribed from a gene corresponding to the property-related state information extracted by the property-related state information extraction unit.

(構成11)
前記mRNAの発現量が、定量RT−PCR法により測定される、構成10に記載の特性推定装置。
(Configuration 11)
The characteristic estimation apparatus according to Configuration 10, wherein the expression level of the mRNA is measured by a quantitative RT-PCR method.

(構成12)
前記定量RT−PCR法は、リアルタイムRT−PCR法である、構成11に記載の特性推定装置。
(Configuration 12)
The characteristic estimation apparatus according to Configuration 11, wherein the quantitative RT-PCR method is a real-time RT-PCR method.

(構成13)
前記定量RT−PCR法が、マルチプレックスRT−PCR法である、構成11に記載の特性推定装置。
(Configuration 13)
The characteristic estimation apparatus according to Configuration 11, wherein the quantitative RT-PCR method is a multiplex RT-PCR method.

(構成14)
前記特性推定情報を用いて、前記生物の状態を診断する、状態診断部を更に備える、構成10から13の何れかに記載の特性推定装置。
(Configuration 14)
The characteristic estimation apparatus according to any one of configurations 10 to 13, further comprising a state diagnosis unit that diagnoses the state of the organism using the characteristic estimation information.

(構成15)
解析対象の状態を表す状態変数と、前記解析対象の特性を表す特性変数から、前記特性変数を前記状態変数により推定するモデルを生成する特性推定モデル生成方法であって、
前記解析対象の状態変数と、前記解析対象の特性変数を、解析用データとし、
前記解析用データのうち、前記特性変数を目的変数とし、前記状態変数を説明変数として、正則化項を有する回帰分析を行うことで、前記目的変数と前記説明変数との関係を表す回帰モデルを生成する、回帰分析ステップと、
前記回帰モデルと前記解析用データを用いて、事前に設定された検証回数まで交差検証を行い、前記回帰モデルのうち最適な正則化項を有するモデルを、特性推定モデルとして生成する特性推定モデル生成ステップと、
前記特性推定モデルにおいて選択された説明変数に対応するデータを、前記解析用データから除外したデータを、更新データとして生成し、次回の特性推定モデル生成時の解析用データとして更新する、解析用データ更新ステップと、
を備え、
事前に設定された繰り返し回数まで、前記解析用データの更新と、前記更新データを用いた特性推定モデルの生成と、を繰り返すことを特徴とする特性推定モデル生成方法。
(Configuration 15)
A characteristic estimation model generation method for generating a model for estimating the characteristic variable from the state variable representing the state of the analysis target and the characteristic variable representing the characteristic of the analysis target by the state variable,
The state variable to be analyzed and the characteristic variable to be analyzed are data for analysis,
Of the analysis data, the regression variable representing the relationship between the objective variable and the explanatory variable is obtained by performing a regression analysis having a regularization term using the characteristic variable as an objective variable and the state variable as an explanatory variable. A regression analysis step to generate,
Using the regression model and the analysis data, cross-validation is performed up to a preset number of verifications, and a model having an optimal regularization term among the regression models is generated as a characteristic estimation model generation. Steps,
Data for analysis corresponding to the explanatory variable selected in the characteristic estimation model is generated as update data, data that is excluded from the analysis data, and is updated as analysis data for the next generation of the characteristic estimation model An update step;
With
A characteristic estimation model generation method characterized by repeating the updating of the analysis data and the generation of a characteristic estimation model using the update data up to a preset number of repetitions.

(構成16)
前記特性推定モデル生成ステップにおいて交差検証を行う毎に生成される、前記回帰モデルについて、全てのモデルにおいて選択されている説明変数を、前記解析対象の特性に関連する状態情報である特性関連状態情報として抽出する、特性関連状態情報抽出ステップを更に備える構成15に記載の特性推定モデル生成方法。
(Configuration 16)
About the regression model generated every time cross-validation is performed in the characteristic estimation model generation step, the explanatory variables selected in all models are characteristic-related state information that is state information related to the characteristic to be analyzed The characteristic estimation model generation method according to configuration 15, further comprising a characteristic-related state information extraction step that is extracted as follows.

(構成17)
前記回帰分析は、LASSO回帰、Ridge回帰もしくは、Elastic-netである構成15又は16に記載の特性推定モデル生成方法。
(Configuration 17)
The characteristic estimation model generation method according to Configuration 15 or 16, wherein the regression analysis is LASSO regression, Ridge regression, or Elastic-net.

(構成18)
前記解析対象は生物であり、前記状態変数は遺伝子発現情報であり、前記特性変数は形質情報である、構成15から17の何れかに記載の特性推定モデル生成方法。
(Configuration 18)
The characteristic estimation model generation method according to any one of configurations 15 to 17, wherein the analysis target is a living organism, the state variable is gene expression information, and the characteristic variable is trait information.

(構成19)
前記生物は作物である、構成18に記載の特性推定モデル生成方法。
(Configuration 19)
The characteristic estimation model generation method according to configuration 18, wherein the organism is a crop.

(構成20)
前記作物はイネ科作物である、構成19に記載の特性推定モデル生成方法。
(Configuration 20)
The characteristic estimation model generation method according to Configuration 19, wherein the crop is a gramineous crop.

(構成21)
前記イネ科作物はイネである、構成20に記載の特性推定モデル生成方法。
(Configuration 21)
The characteristic estimation model generation method according to configuration 20, wherein the gramineous crop is rice.

(構成22)
前記形質情報は、移植日からの日数を表す移植日後日数、開花までに要する日数を表す開花日または、観測対象の乾燥重量当たりの窒素含量を表す窒素含量である構成19から21の何れかに記載の特性推定モデル生成方法。
(Configuration 22)
The trait information is any one of configurations 19 to 21 which is the number of days after the transplantation date indicating the number of days from the date of transplantation, the flowering date indicating the number of days required for flowering, or the nitrogen content indicating the nitrogen content per dry weight of the observation target The characteristic estimation model generation method described.

(構成23)
前記解析対象の前記特性を推定する、特性推定方法であって、
構成15から22の何れかに記載の特性推定モデル生成方法によって生成した前記特性推定モデルに、前記解析対象の状態変数が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定ステップを有することを特徴とする、特性推定方法。
(Configuration 23)
A property estimation method for estimating the property of the analysis target,
A characteristic estimation that is an estimation result of the characteristic of the analysis target by inputting the state variable of the analysis target into the characteristic estimation model generated by the characteristic estimation model generation method according to any one of the configurations 15 to 22 A characteristic estimation method comprising a characteristic estimation step in which information is output.

(構成24)
前記解析対象の前記特性を推定する、特性推定方法であって、
構成18から22の何れかに記載の特性推定モデル生成方法によって生成した前記特性推定モデルに、前記生物の遺伝子発現情報が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定ステップを有し、
前記生物の前記遺伝子発現情報は、前記特性関連状態情報抽出ステップにて抽出された、前記特性関連状態情報に対応する遺伝子より転写されるmRNA量から測定されることを特徴とする特性推定方法。
(Configuration 24)
A property estimation method for estimating the property of the analysis target,
A characteristic estimation, which is an estimation result of the characteristic of the analysis target, when gene expression information of the organism is input to the characteristic estimation model generated by the characteristic estimation model generation method according to any one of configurations 18 to 22. A characteristic estimation step in which information is output;
The gene estimation information of the organism is measured from the amount of mRNA transcribed from the gene corresponding to the property-related state information extracted in the property-related state information extraction step.

(構成25)
前記mRNAの発現量が、定量RT−PCR法により測定される、構成24に記載の特性推定方法。
(Configuration 25)
25. The characteristic estimation method according to Configuration 24, wherein the mRNA expression level is measured by a quantitative RT-PCR method.

(構成26)
前記定量RT−PCR法は、リアルタイムRT−PCR法である、構成25に記載の特性推定方法。
(Configuration 26)
The characteristic estimation method according to Configuration 25, wherein the quantitative RT-PCR method is a real-time RT-PCR method.

(構成27)
前記定量RT−PCR法が、マルチプレックスRT−PCR法である、構成25に記載の特性推定方法。
(Configuration 27)
The characteristic estimation method according to Configuration 25, wherein the quantitative RT-PCR method is a multiplex RT-PCR method.

(構成28)
前記特性推定情報を用いて、前記生物の状態を診断する、状態診断ステップを更に備える、構成24から27の何れかに記載の特性推定方法。
(Configuration 28)
The characteristic estimation method according to any one of configurations 24 to 27, further comprising a state diagnosis step of diagnosing the state of the organism using the characteristic estimation information.

この発明によれば、解析対象の特性変数に関連する状態変数を網羅的に抽出可能な特性推定モデル生成装置を得ることができるという効果がある。更に、生成されたモデルを用いて、作物の生育状況を自動的に推定する装置を得ることができるという効果がある。   According to the present invention, there is an effect that it is possible to obtain a characteristic estimation model generation apparatus capable of exhaustively extracting state variables related to characteristic variables to be analyzed. Furthermore, there is an effect that an apparatus for automatically estimating the growth state of a crop can be obtained using the generated model.

この発明の実施の形態における特性推定モデル生成装置を示す構成図である。It is a block diagram which shows the characteristic estimation model production | generation apparatus in embodiment of this invention. この発明の実施の形態における特性推定モデル生成装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the characteristic estimation model production | generation apparatus in embodiment of this invention. この発明の実施の形態における特性推定装置を示す構成図である。It is a block diagram which shows the characteristic estimation apparatus in embodiment of this invention. この発明の実施の形態における特性推定装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the characteristic estimation apparatus in embodiment of this invention. 横軸を移植日後日数、縦軸を乾燥重量あたりの窒素含量として、225の解析用データと、解析用データから作成した特性推定モデルを用いて特性を推定した結果を表す図である。It is a figure showing the result of having estimated the characteristic using the characteristic estimation model created from the analytical data of 225, and the analytical data by making the horizontal axis the number of days after transplantation and the vertical axis the nitrogen content per dry weight. 図6は、解析対象をイネとして、移植日後日数、開花日、窒素含量について、それぞれ実際の圃場から採取した497サンプル、428サンプル、224を解析用データとして、繰り返し回数毎に生成された特性推定モデルの精度を平均二乗誤差により評価している。FIG. 6 shows the estimation of characteristics generated for each number of iterations, using rice as an analysis target, and 497 samples, 428 samples, and 224 sampled from actual fields for the number of days after transplanting, date of flowering, and nitrogen content, respectively. The accuracy of the model is evaluated by the mean square error. 図7は、繰り返し回数を10とし、その他は図6と同様の条件にした場合の、繰り返し回数毎に特性関連状態情報抽出部140に記録された特性変数の数を示したものである。FIG. 7 shows the number of characteristic variables recorded in the characteristic related state information extraction unit 140 for each number of repetitions when the number of repetitions is 10 and the other conditions are the same as in FIG. 図8は、移植日後日数について、交差検証を10回繰り返した場合に同じ説明変数が何回選ばれたかを表した図である。FIG. 8 is a diagram showing how many times the same explanatory variable is selected when cross-validation is repeated 10 times for the number of days after transplantation. 図9は、開花日について、交差検証を10回繰り返した場合に同じ説明変数が何回選ばれたかを表した図である。FIG. 9 is a diagram showing how many times the same explanatory variable is selected when the cross-validation is repeated 10 times for the flowering date. 図10は、窒素含量について、交差検証を10回繰り返した場合に同じ説明変数が何回選ばれたかを表した図である。FIG. 10 is a diagram showing how many times the same explanatory variable is selected when the cross-validation is repeated 10 times for the nitrogen content.

実施の形態
図1はこの発明の実施の形態による特性推定モデル生成装置の構成を示すブロック図である。実施の形態に係る特性推定モデル生成装置の構成について図を参照しながら説明する。
Embodiment FIG. 1 is a block diagram showing a configuration of a characteristic estimation model generation apparatus according to an embodiment of the present invention. The configuration of the characteristic estimation model generation device according to the embodiment will be described with reference to the drawings.

なお、本実施の形態において解析対象とは、イネである。
状態変数とは、イネの遺伝子発現情報であり、
特性変数とは、イネの性質や特徴を表現する情報である形質情報を表し、具体的には、イネの葉の乾燥重量あたりの葉内窒素含量、サンプリング日から何日後に穂が出るかを表す開花日および、田植えから何日経過したかを表す田植え後日数である。
In the present embodiment, the analysis target is rice.
A state variable is rice gene expression information.
Characteristic variables represent trait information, which is information that expresses the nature and characteristics of rice. Specifically, the nitrogen content in leaves per dry weight of rice leaves, and how many days after the sampling date the ears will appear. It represents the flowering date and the number of days after planting that represents how many days have passed since the planting.

図1において、特性推定モデル生成装置100は、データ出力部110と、回帰分析部120と、特性推定モデル生成部130と、特性関連状態情報抽出部140と、解析用データ更新部150と、を備え、解析対象の特性変数と遺伝子発現情報から、解析対象の特性変数推定モデルを生成する装置である。   In FIG. 1, a characteristic estimation model generation apparatus 100 includes a data output unit 110, a regression analysis unit 120, a characteristic estimation model generation unit 130, a characteristic related state information extraction unit 140, and an analysis data update unit 150. It is an apparatus for generating a characteristic variable estimation model to be analyzed from a characteristic variable to be analyzed and gene expression information.

データ出力部110には、図示しないインターフェース等を介して、特性推定モデル作成のためのデータとして、解析対象の特性変数および状態変数が入力され、それらを解析用データとして回帰分析部120へ出力する。   The data output unit 110 receives characteristic variables and state variables to be analyzed as data for creating a characteristic estimation model via an interface (not shown) or the like, and outputs them to the regression analysis unit 120 as analysis data. .

回帰分析部120はデータ出力部110から解析用データが入力される。そして、解析用データに対して、正則化項を有する回帰分析を行う。具体的には、解析用データのうち、特性変数を目的変数(従属変数)、状態変数のそれぞれを説明変数として、正則化項を有する回帰モデルを生成する。   The regression analysis unit 120 receives analysis data from the data output unit 110. Then, regression analysis having a regularization term is performed on the analysis data. Specifically, a regression model having a regularization term is generated using characteristic variables as objective variables (dependent variables) and state variables as explanatory variables in the analysis data.

以下に回帰分析部120にて用いる回帰分析について説明する。   The regression analysis used in the regression analysis unit 120 will be described below.

本実施の形態では、回帰分析部120において、LASSO回帰(Least Absolute Shrinkage and Selection Operator)を用いる。LASSO回帰による回帰モデルの算出式は、以下の数1にて表される。   In the present embodiment, the regression analysis unit 120 uses LASSO regression (Least Absolute Shrinkage and Selection Operator). The calculation formula of the regression model by LASSO regression is expressed by the following formula 1.

Figure 2017051118
yは目的変数、xは説明変数、βは回帰係数、γは正則化パラメータである。
Figure 2017051118
y is an objective variable, x is an explanatory variable, β is a regression coefficient, and γ is a regularization parameter.

入力された解析用データを数1に代入し、Sの値を最少化する係数βを算出することで回帰モデルを生成する。すなわち、Sに関する最少化問題を解く。なお、この最少化問題は、Sに関する凸最適化問題を解くことで、解を一意に求めることができる。   A regression model is generated by substituting the input analytical data into Equation 1 and calculating a coefficient β that minimizes the value of S. That is, it solves the minimization problem for S. The minimization problem can be uniquely obtained by solving the convex optimization problem for S.

求められた最適解は、特性変数を目的変数、状態変数を説明変数とした、γの関数により表される回帰モデルである。   The obtained optimal solution is a regression model represented by a function of γ, with characteristic variables as objective variables and state variables as explanatory variables.

特性推定モデル生成部130では、回帰分析部にて生成した回帰モデルにおけるγの最適値を求め、任意の特性変数と、状態変数の関係式である、特性推定モデルを生成する。   The characteristic estimation model generation unit 130 obtains an optimum value of γ in the regression model generated by the regression analysis unit, and generates a characteristic estimation model that is a relational expression between an arbitrary characteristic variable and a state variable.

以下に特性推定モデル生成部130における特性推定モデルの生成方法について説明する。   Hereinafter, a method for generating a characteristic estimation model in the characteristic estimation model generation unit 130 will be described.

特性推定モデル生成部130においては、回帰分析部120にて生成された回帰モデルにおける最適なγの値を求めるために、交差検証を行う。   The characteristic estimation model generation unit 130 performs cross-validation in order to obtain an optimal value of γ in the regression model generated by the regression analysis unit 120.

本実施の形態においては交差検証の手法としてk-fold cross-validationを用いる。k-fold cross-validationにおいては、検証回数を表すkの値を事前に設定する。そして、全ての解析用データを、k個の標本群に分割し、そのうちの1つをテストデータとし、残るk−1個を訓練データとする。すなわち、解析用データから、k通りのテストデータと訓練データの組み合わせが作成される。   In this embodiment, k-fold cross-validation is used as a cross-validation technique. In k-fold cross-validation, a value of k representing the number of verifications is set in advance. Then, all analysis data is divided into k sample groups, one of which is used as test data, and the remaining k-1 is used as training data. That is, k combinations of test data and training data are created from the analysis data.

そして、1つの訓練データを数1に代入し、γの関数としての回帰モデルを求め、記録する。そのモデルに対してテストデータを当てはめ、γの値を逐次的に代入し、目的変数についての平均二乗誤差を求める。これをk通りのテストデータおよび訓練データの組み合わせについて繰り返す。   Then, one training data is substituted into Equation 1, and a regression model as a function of γ is obtained and recorded. Test data is applied to the model, and the value of γ is sequentially substituted to find the mean square error for the objective variable. This is repeated for k combinations of test data and training data.

このようにすることで、あるγの値において、平均二乗誤差がk通り計算される。これらを加算平均したものを、あるγにおける平均二乗誤差の値とする。更に、あるγにおける標準誤差を算出する。   Thus, k mean square errors are calculated for a certain value of γ. The average of these values is taken as the value of the mean square error at a certain γ. Further, a standard error at a certain γ is calculated.

そして、このように算出した平均二乗誤差の最小値と、その時のγを求める。次に、one standard error ruleに基づき、最適なγの値を選択する。すなわち、そのγにおける標準誤差の範囲内に存在する最大のγをγの最適値として選択する。   Then, the minimum value of the mean square error calculated in this way and γ at that time are obtained. Next, an optimal value of γ is selected based on one standard error rule. That is, the maximum γ existing within the standard error range for γ is selected as the optimum value of γ.

最後に、このようにして求めたγの最適値と解析用データを用いて、数1に従い回帰モデルを求めることで、特性推定モデルを生成し、記録する。   Finally, a characteristic estimation model is generated and recorded by obtaining a regression model according to Equation 1 using the optimum value of γ thus obtained and analysis data.

なお、本実施の形態においては、k=10とする。また、kの値は事前に設定しておくようにしてもよいし、図示しないインターフェースを介して入力されるようにしてもよい。   In the present embodiment, k = 10. The value of k may be set in advance or may be input via an interface (not shown).

特性関連状態情報抽出部140は、特性推定モデル生成部130にて生成された複数の回帰モデルを用いて、ある特性に関連する状態変数を、抽出し、記録する。   The characteristic-related state information extraction unit 140 extracts and records a state variable related to a certain characteristic using the plurality of regression models generated by the characteristic estimation model generation unit 130.

まず、特性推定モデル生成部130において訓練データを数1に代入することで算出した回帰モデルを、交差検証が行われる毎に記録してゆく。すなわち、k個の回帰モデルが記録される。
そして、記録したk個の回帰モデルを比較する。このk個のモデル全てにおいて選択された状態変数、すなわち、β≠0となる説明変数は、ある特性に関する状態変数である可能性が高いものとして抽出する。
このようにして抽出された、状態変数を、特性関連状態情報として、記録してゆく。
First, the regression model calculated by substituting the training data into Equation 1 in the characteristic estimation model generation unit 130 is recorded every time cross-validation is performed. That is, k regression models are recorded.
Then, the k regression models recorded are compared. The state variables selected in all k models, that is, explanatory variables satisfying β ≠ 0 are extracted as those that are highly likely to be state variables related to a certain characteristic.
The state variables extracted in this way are recorded as characteristic related state information.

解析用データ更新部150は、次回の特性推定モデル生成の際に用いる解析用データである、更新データを生成する。そして、更新データをデータ出力部110へと出力し、解析用データを更新する。   The analysis data update unit 150 generates update data, which is analysis data used when generating the next characteristic estimation model. Then, the update data is output to the data output unit 110, and the analysis data is updated.

更新用データの作成にあたり、特性推定モデル生成部130にて生成された特性推定モデルのうち、係数βが0ではない説明変数に関するデータについて、解析データから除外する。   In creating the update data, data relating to the explanatory variable whose coefficient β is not 0 among the characteristic estimation model generated by the characteristic estimation model generation unit 130 is excluded from the analysis data.

つまり、次回の特性推定モデルの生成においては、前回の特性推定モデルの生成に使用した状態変数を使用しない。   That is, in the next generation of the characteristic estimation model, the state variables used for generating the previous characteristic estimation model are not used.

このようにして作成した更新用データを用いて新たに特性推定モデルを生成することで、前回の特性推定モデルの生成には利用されることがなかった状態変数のみを用いて特性推定モデルを生成することができる。   By generating a new property estimation model using the update data created in this way, a property estimation model is generated using only state variables that were not used to generate the previous property estimation model. can do.

また、事前に設定した繰り返し回数まで、解析データの更新と特性推定モデルの生成を繰り返すことにより、任意の特性変数に関連する状態変数を網羅的に用いて、複数の特性推定モデルを生成することとなる。   In addition, by repeatedly updating analysis data and generating characteristic estimation models up to a preset number of iterations, it is possible to generate multiple characteristic estimation models using all state variables related to any characteristic variable. It becomes.

なお、本実施の形態においては、繰り返し回数=5とする。また、繰り返し回数の値は事前に設定しておくようにしてもよいし、図示しないインターフェース等を介して入力されるようにしてもよい。   In the present embodiment, the number of repetitions is set to 5. Further, the value of the number of repetitions may be set in advance or may be input via an interface (not shown) or the like.

図2は本実施の形態における特性推定モデル生成装置100の概略動作を示すフローチャートであり、特性推定モデル生成装置100は以下のように動作する。   FIG. 2 is a flowchart showing a schematic operation of the characteristic estimation model generation apparatus 100 according to the present embodiment. The characteristic estimation model generation apparatus 100 operates as follows.

まず、図示しない入力部によって、特性変数、状態変数、検証回数および繰り返し回数が入力され、特性変数と状態変数を解析データとする(S201)。   First, a characteristic variable, a state variable, the number of verifications, and the number of repetitions are input by an input unit (not shown), and the characteristic variable and the state variable are set as analysis data (S201).

次に、解析データをk個の標本群へと分割し、i番目の標本群をテストデータとし、残りの標本群を訓練データとする。なお、iの初期値は1である。また、標本群への分割は、各々の標本群の有する標本数が均等になるようにする(S202)。   Next, the analysis data is divided into k sample groups, the i-th sample group is used as test data, and the remaining sample groups are used as training data. The initial value of i is 1. Further, the division into the sample groups is performed so that the number of samples of each sample group becomes equal (S202).

訓練データを用いて、回帰分析部120にて回帰モデルを求めi、jの値とともに記録する(S203)。   Using the training data, the regression analysis unit 120 obtains a regression model and records it together with the values of i and j (S203).

次に、特性推定モデル生成部130において、S203にて求めた回帰モデルへテストデータを入力し、各γにおける平均二乗誤差と標準誤差を計算する(S204)。   Next, the characteristic estimation model generation unit 130 inputs test data to the regression model obtained in S203, and calculates a mean square error and a standard error at each γ (S204).

ここでiの値をチェックし、iの値が検証回数と等しくない場合(S205におけるNOの場合)、iの値に1を加算し、S202へと戻る。iの値が検証回数と等しい場合(S205におけるYESの場合)S206へと移行する。   Here, the value of i is checked. If the value of i is not equal to the number of verifications (NO in S205), 1 is added to the value of i, and the process returns to S202. When the value of i is equal to the number of verifications (YES in S205), the process proceeds to S206.

S205においてiの値が検証回数と等しい場合、特性推定モデル生成部130において、各γの値における平均二乗誤差の値について加算平均を算出し、one standard error ruleに基づいて最適なγの値を決定する(S206)。   When the value of i is equal to the number of verifications in S205, the characteristic estimation model generation unit 130 calculates an addition average for the mean square error value in each γ value, and calculates the optimum γ value based on one standard error rule. Determine (S206).

次に、特性推定モデル生成部130において、S206にて求めた最適なγの値および、解析データの全てを用いて、回帰分析部120にて特性推定モデルを求め、記録する(S207)。   Next, in the characteristic estimation model generation unit 130, the regression analysis unit 120 obtains and records a characteristic estimation model using all of the optimum γ value obtained in S206 and the analysis data (S207).

S203にて記録した複数の回帰モデルのうち、現在のjの値と共に記録されている回帰モデル全てについて、比較を行う。比較をした全てのモデルにおいて係数が0ではない説明変数を抽出し、特性関連状態情報として記録する(S208)。
ここで記録された特性関連状態情報は、上記全てのモデルにおいて、特性変数を表す状態変数として選択されているため、特定の特性変数に関連する状態変数である可能性が高い。
Of the plurality of regression models recorded in S203, all regression models recorded together with the current value of j are compared. An explanatory variable whose coefficient is not 0 in all the models compared is extracted and recorded as characteristic related state information (S208).
Since the characteristic-related state information recorded here is selected as a state variable representing the characteristic variable in all the models, there is a high possibility that the characteristic-related state information is a state variable related to a specific characteristic variable.

S208にて特性関連状態情報を記録した後、S207にて記録された特性推定モデルにおいて、係数が0ではない説明変数に関するデータを解析用データから除外した、更新データを解析用データ更新部150にて生成する(S209)。   After recording the characteristic-related state information in S208, the update data obtained by excluding the data related to the explanatory variable whose coefficient is not 0 from the analysis data in the characteristic estimation model recorded in S207 is sent to the analysis data update unit 150. (S209).

ここでjの値をチェックし、jの値が繰り返し回数と等しくない場合(S210におけるNOの場合)、jの値に1を加算し、解析データをS209にて生成した更新データへと変更し、iの値を初期値(i=1)に設定し、S202へと戻る。jの値が繰り返し回数と等しい場合(S210におけるYESの場合)動作を終了する。   Here, the value of j is checked. If the value of j is not equal to the number of repetitions (in the case of NO in S210), 1 is added to the value of j, and the analysis data is changed to the update data generated in S209. , I is set to an initial value (i = 1), and the process returns to S202. If the value of j is equal to the number of repetitions (YES in S210), the operation is terminated.

上記のように、解析データを更新して、特性推定モデルの生成および特性関連状態情報の抽出を繰り返すことで、任意の特性変数に関連する特性関連状態情報を網羅的に抽出しつつ、特性を推定するモデルを複数生成することができる。   As described above, the analysis data is updated, and the generation of the characteristic estimation model and the extraction of the characteristic related state information are repeated. A plurality of models to be estimated can be generated.

図3はこの発明の実施の形態における特性推定装置の構成を示すブロック図である。本実施の形態に係る特性推定装置の構成について図を参照しながら説明する。   FIG. 3 is a block diagram showing the configuration of the characteristic estimation apparatus according to the embodiment of the present invention. The configuration of the characteristic estimation apparatus according to the present embodiment will be described with reference to the drawings.

図3において、特性推定装置300は、特性推定部310と、状態診断部320と、を備え、入力された状態変数から、特性推定情報および、状態診断結果を出力する装置である。   In FIG. 3, a characteristic estimation apparatus 300 includes a characteristic estimation unit 310 and a state diagnosis unit 320, and outputs characteristic estimation information and a state diagnosis result from input state variables.

特性推定部310には、特性推定モデル生成装置100にて生成された、種々の特性に関する推定モデルが記録されており、解析対象の状態情報が入力される。入力された状態情報を、記録された特性推定モデルへと代入することにより、種々の特性に関する推定情報が出力される。ここで、推定情報とは、特性推定モデルから出力された推定値そのものを表す。   In the characteristic estimation unit 310, estimation models related to various characteristics generated by the characteristic estimation model generation apparatus 100 are recorded, and state information to be analyzed is input. By substituting the input state information into the recorded characteristic estimation model, estimation information regarding various characteristics is output. Here, the estimation information represents the estimation value itself output from the characteristic estimation model.

なお、推定情報は、図示されない表示部などに表示されるようにしてもよく、推定情報の出力値をそのまま表示してもよいし、閾値を定め、閾値に比較して多い、少ないなどといった概念的な表現による表示にしてもよい。また、推定情報を全て出力するようにしてもよいし、特性推定装置300の動作開始時に推定を所望する特性について、図示しない入力部によりユーザーが指定するようにしてもよい。   Note that the estimation information may be displayed on a display unit (not shown), the output value of the estimation information may be displayed as it is, or a threshold value is set and the concept is such that it is more or less than the threshold value. It may be displayed in a typical expression. Further, all of the estimation information may be output, or the user may specify the characteristic desired to be estimated at the start of the operation of the characteristic estimation apparatus 300 by an input unit (not shown).

ここで、特性推定装置300における状態情報について説明する。   Here, the state information in the characteristic estimation apparatus 300 will be described.

本実施の形態において、状態情報とはイネの遺伝子発現情報である。イネの遺伝子発現情報とは、具体的には、イネを構成する遺伝子に対応するmRNAの発現量を表す。イネを構成する全ての遺伝子数は32000個を超えると推定されている。従って、本実施例における状態情報とは、この全ての遺伝子に対応するmRNAの発現量を表す。
しかし、状態情報については、上記32000個全ての遺伝子に対応するmRNAの発現量を測定し、入力することは、短時間でイネの生育状況を判断したいという観点から考えると、手間や特性推定の計算コストなどの観点から、現実的ではない。また、すべてのmRNAの発現情報が生育診断に関する情報を有しているわけではない。
そのため、特性推定装置300において用いる状態変数は、特性関連状態情報抽出部140にて抽出された状態変数を用いる。
In the present embodiment, the state information is rice gene expression information. The rice gene expression information specifically represents the expression level of mRNA corresponding to the genes constituting rice. The number of all genes constituting rice is estimated to exceed 32,000. Therefore, the state information in this example represents the expression level of mRNA corresponding to all these genes.
However, for state information, measuring and inputting the expression level of mRNA corresponding to all 32,000 genes described above is a matter of time and characteristic estimation from the viewpoint of determining the growth status of rice in a short time. From the viewpoint of calculation cost, it is not realistic. Further, not all mRNA expression information has information on growth diagnosis.
Therefore, the state variable used in the characteristic estimation apparatus 300 uses the state variable extracted by the characteristic related state information extraction unit 140.

特性推定対象となるイネの、遺伝子発現量の測定は、定量RT―PCR法を用いて測定することができる。   The gene expression level of rice as a characteristic estimation target can be measured using a quantitative RT-PCR method.

なお、定量RT―PCR法としては、通常のRT−PCR法のほか、リアルタイムRT―PCR法や、マルチプレックスRT―PCR法など任意の手法を用いることができる。また、RT―PCR法だけではなく、LAMP法などの他の遺伝子増幅手法を用いても良い。   As the quantitative RT-PCR method, an arbitrary method such as a real-time RT-PCR method or a multiplex RT-PCR method can be used in addition to a normal RT-PCR method. In addition to the RT-PCR method, other gene amplification methods such as the LAMP method may be used.

状態診断部320は、特性推定部310にて出力した特性推定情報が入力され、特性推定情報に従って、解析対象の現在の状態を診断し、状態診断結果を出力する。   The state diagnosis unit 320 receives the property estimation information output from the property estimation unit 310, diagnoses the current state of the analysis target according to the property estimation information, and outputs a state diagnosis result.

状態診断結果とは、イネの田植えからの日数を表す移植日後日数、サンプリング日から開花までに要する日数を表す開花日または、観測対象の乾燥重量当たりの窒素含量を表す窒素含量などの特性推定情報を用いて、イネの生育状況を表したものである。
生育状況に加えて更に、事前に理想的な生育データを入力しておき、理想的な生育データとのずれを計算し、ずれの程度に従い、いつ、どの程度肥料を与えるべきかなどといった行動指針を、図示しない表示部に示すようにしてもよい。
The condition diagnosis results are characteristic estimation information such as the number of days after transplanting that represents the number of days since rice planting, the flowering date that represents the number of days required from the sampling date to flowering, or the nitrogen content that represents the nitrogen content per dry weight of the observation target. Is used to represent the growth status of rice.
In addition to the growth situation, input ideal growth data in advance, calculate the deviation from the ideal growth data, and follow the behavior guidelines such as when and how much fertilizer should be given according to the degree of deviation May be shown on a display unit (not shown).

図4は本実施の形態における特性推定装置300の概略動作を示すフローチャートであり、特性推定装置300は以下のように動作する。   FIG. 4 is a flowchart showing a schematic operation of the characteristic estimation apparatus 300 in the present embodiment. The characteristic estimation apparatus 300 operates as follows.

まず、特性の推定対象となるイネを用意し、当該イネにおける、特性関連状態情報抽出部140にて抽出された遺伝子の発現量を測定する。(S401)。   First, rice to be estimated for characteristics is prepared, and the expression level of the gene extracted by the characteristic-related state information extraction unit 140 in the rice is measured. (S401).

次に、特性推定モデル生成装置100にて生成された、推定を希望する特性に関する特性推定モデルへ上記測定結果を代入する(S402)。   Next, the measurement result is substituted into the characteristic estimation model for the characteristic desired to be estimated, which is generated by the characteristic estimation model generation apparatus 100 (S402).

特性推定モデルにおける特性推定結果を、特性推定情報として出力する(S403)。   The characteristic estimation result in the characteristic estimation model is output as characteristic estimation information (S403).

特性推定モデルにおける特性推定結果を用いて、イネの生育情報を診断し、出力する(S404)。   Rice growth information is diagnosed and output using the characteristic estimation result in the characteristic estimation model (S404).

以上より、本実施の形態によれば、以下のような効果を奏する。   As mentioned above, according to this Embodiment, there exist the following effects.

特性推定モデル生成装置100は、特性推定モデル生成部130において、解析対象の特性変数と特性変数から、特性変数を従属変数、特性変数を説明変数とする特性推定モデルを生成するように構成したので、任意の特性変数を量的に推定するモデルを生成することができるという効果を奏する。   The characteristic estimation model generation apparatus 100 is configured to generate a characteristic estimation model in which the characteristic variable is a dependent variable and the characteristic variable is an explanatory variable from the characteristic variable and characteristic variable to be analyzed in the characteristic estimation model generation unit 130. There is an effect that a model for quantitatively estimating an arbitrary characteristic variable can be generated.

さらに、特性推定モデル生成装置100は、解析用データ更新部150において、特性推定モデル生成に用いた遺伝子情報を解析用データから除外したデータを更新データとして生成する。そして、更新データを用いて事前に設定された繰り返し回数まで特性推定モデルの生成を繰り返し、特性推定モデルの生成毎に、特性に関連する遺伝子を特性関連遺伝子抽出部140にて抽出し記録するように構成されているので、任意の特性変数に関連する遺伝子情報を網羅的に抽出することができるという効果を奏する。   Furthermore, in the characteristic estimation model generation apparatus 100, the analysis data update unit 150 generates, as update data, data obtained by excluding gene information used for characteristic estimation model generation from the analysis data. Then, the generation of the characteristic estimation model is repeated up to a preset number of times using the update data, and the characteristic-related gene extraction unit 140 extracts and records the gene related to the characteristic every time the characteristic estimation model is generated. Therefore, there is an effect that gene information related to an arbitrary characteristic variable can be exhaustively extracted.

特性推定装置300は、特性推定部310において、特性推定モデル生成装置100にて生成したモデルを用いて、入力された状態変数から特性変数を量的に推定する。また、状態診断部320は、特性推定部310にて推定した特性変数を用いて、作物の生育情報を診断する。特性推定装置300は上記のように構成されているので、専門的な技術者の手を介することなく、解析対象の生育状況を自動的に推定することができるという効果を奏する。更に、解析対象の生育状況を自動的に推定することによる、生育診断や土壌診断による栽培管理の高度化という効果も奏する。   In the characteristic estimation apparatus 300, the characteristic estimation unit 310 quantitatively estimates the characteristic variable from the input state variable using the model generated by the characteristic estimation model generation apparatus 100. Further, the state diagnosis unit 320 uses the characteristic variable estimated by the characteristic estimation unit 310 to diagnose crop growth information. Since the characteristic estimation apparatus 300 is configured as described above, there is an effect that the growth state of the analysis target can be automatically estimated without the intervention of a professional engineer. Furthermore, there is also an effect that the cultivation management by the growth diagnosis and the soil diagnosis is advanced by automatically estimating the growth state of the analysis target.

なお、本実施の形態において解析対象はイネについて説明したが、本発明はこれに限定されるものではなく、正則化項を有する回帰分析によって推定モデルを生成可能な解析対象であればよい。   In the present embodiment, rice has been described as an analysis target. However, the present invention is not limited to this, and any analysis target can be used as long as an estimation model can be generated by regression analysis having a regularization term.

また、特性変数についても、乾燥重量あたりの葉内窒素含量、田植えから何日後に穂が出るかを表す開花日および、田植えから何日経過したかを表す田植え後日数について説明したが、葉内リン含量、穂の大きさやその重量など、更には、正則化項を有する回帰分析によって推定モデルを生成可能な解析対象を構成する特性変数であればよい。   In addition, regarding the characteristic variables, the nitrogen content in the leaf per dry weight, the flowering date indicating how many days after the rice planting, and the number of days after rice planting indicating how many days have passed since the rice planting were explained. It may be a characteristic variable that constitutes an analysis target that can generate an estimation model by regression analysis having a regularization term, such as phosphorus content, ear size and weight.

本実施の形態における特性推定モデル生成装置100および特性推定装置300は、数値演算、数値の入力、その結果の記録、出力等が可能であればよく、具体的には、CPU、メモリ、表示部、入出力インタフェース等を備えるコンピュータや、専用のハードウェアを使用することができる。   The characteristic estimation model generation device 100 and the characteristic estimation device 300 according to the present embodiment are only required to be able to perform numerical computation, input numerical values, and record and output the results. Specifically, a CPU, a memory, and a display unit A computer having an input / output interface or the like, or dedicated hardware can be used.

なお、本実施の形態においては、回帰分析部120にて用いる回帰分析手法として、LASSO回帰を用いたが、Ridge回帰やErastic-Netなどの正則化項を有する回帰分析手法であってもよい。また、特性推定モデル生成部130および、特性関連遺伝子抽出部140において用いる交差検証方法について、本実施の形態においては、K-fold cross-validationを用いたが、leave-one-out cross-validationなど、他の交差検証方法を用いてもよい。   In this embodiment, LASSO regression is used as a regression analysis method used in the regression analysis unit 120, but a regression analysis method having a regularization term such as Ridge regression or Elastic-Net may be used. In addition, in the present embodiment, K-fold cross-validation is used for the cross-validation method used in the characteristic estimation model generation unit 130 and the characteristic-related gene extraction unit 140, but leave-one-out cross-validation, etc. Other cross-validation methods may be used.

また、本実施の形態において、LASSO回帰によるモデル作成、最適なγの決定については統計解析ソフト「R」を用いて行った。   In the present embodiment, model creation by LASSO regression and determination of optimal γ were performed using statistical analysis software “R”.

図5は、解析対象をイネとして、解析用データを実際の圃場から採取した224サンプルとした場合の、本実施の形態における特性推定モデル生成装置100にて生成されたモデルの再現度を示したものである。なお、検証回数は10、繰り返し回数は1としている。
図5上段図は、解析対象であるイネについて、横軸を移植日後日数、縦軸を乾燥重量あたりの窒素含量として、解析用データ224サンプルについてプロットしたものである。マーカーの種類は、イネが採取された場所に対応している。
次に、前記解析用データにおける遺伝子発現情報を状態変数、移植日後日数、乾燥重量あたりの窒素含量を特性変数として、本実施の形態における特性推定モデル生成装置100にて特性推定モデル作成する。
図5の下段図は、このようにして作成した移植日後日数と、乾燥重量あたりの窒素含量についての特性推定モデルへ上記解析用データを代入した結果をプロットしたものである。
FIG. 5 shows the reproducibility of the model generated by the characteristic estimation model generation device 100 in the present embodiment when the analysis target is rice and the analysis data is 224 samples collected from an actual field. Is. The number of verifications is 10 and the number of repetitions is 1.
The upper part of FIG. 5 is a plot of 224 samples for analysis, with the horizontal axis representing the number of days after transplantation and the vertical axis representing the nitrogen content per dry weight, for the rice to be analyzed. The type of marker corresponds to the place where the rice was collected.
Next, a characteristic estimation model is created by the characteristic estimation model generation apparatus 100 in the present embodiment using the gene expression information in the analysis data as a state variable, the number of days after transplantation, and the nitrogen content per dry weight as a characteristic variable.
The lower diagram of FIG. 5 is a plot of the result of substituting the data for analysis into the characteristic estimation model for the number of days after transplantation and the nitrogen content per dry weight.

図6は、解析対象をイネとして、移植日後日数、開花日日数、窒素含量について、それぞれ実際の圃場から採取した497サンプル、428サンプル、224を解析用データとして、本実施の形態における特性推定モデル生成装置100にて特性推定モデルを生成した場合に、各サンプルとの平均二乗誤差によりモデルの精度を評価したものである。なお、検証回数は10、繰り返し回数は5としている。図6における1stModel、2ndModel…は繰り返し回数毎に生成されたモデルについての評価を示している。   FIG. 6 shows a characteristic estimation model according to the present embodiment, using rice as an analysis target, the days after transplanting, the days of flowering, and the nitrogen content, using 497 samples, 428 samples, and 224 collected from an actual field as analysis data. When the characteristic estimation model is generated by the generation device 100, the accuracy of the model is evaluated by the mean square error with each sample. The number of verifications is 10 and the number of repetitions is 5. In FIG. 6, 1stModel, 2ndModel,... Indicate the evaluation of the model generated for each repetition count.

図7は、繰り返し回数を10とし、その他の条件は図6と同様の条件にした場合の、繰り返し回数毎に特性関連状態情報抽出部140に記録された特性変数、すなわち遺伝子の数を示したものである。
窒素含量を例にとると、イネを構成するとされる32000個の遺伝子から、窒素含量に関わる可能性が高い遺伝子を582個にまで絞り込めていることがわかる。
FIG. 7 shows the number of characteristic variables, that is, the number of genes recorded in the characteristic-related state information extraction unit 140 for each number of repetitions when the number of repetitions is 10 and the other conditions are the same as in FIG. Is.
Taking the nitrogen content as an example, it can be seen that the genes that have a high possibility of being related to the nitrogen content are narrowed down to 582 from the 32,000 genes that constitute rice.

図8は移植日後日数、図9は開花日、図10は乾燥重量あたりの窒素含量について解析対象をイネとした場合の、安定性分布を表したものである。
安定性分布の縦軸は、特性関連状態情報抽出部140において説明変数を抽出する過程において、モデルの生成を検証回数繰り返した際に、全てのモデルを比較し、説明変数の選択された回数とその個数である。
安定性分布の横軸は、繰り返し回数である。
繰り返し回数が増加するにつれて、検証回数分全てのモデルにおいて選択される説明変数が減少してゆくことがわかる。
図8、9、10において、検証回数は全て10回である。繰り返し回数はそれぞれ15回、25回、15回である。また、解析データについては、それぞれ実際の圃場から採取したイネ939サンプル、819サンプル、302サンプルである。
FIG. 8 shows the number of days after transplanting, FIG. 9 shows the flowering date, and FIG. 10 shows the stability distribution when the analysis target is the nitrogen content per dry weight.
The vertical axis of the stability distribution shows the number of times the explanatory variable is selected by comparing all the models when the generation of the model is repeated the number of verifications in the process of extracting the explanatory variable in the characteristic related state information extracting unit 140. That number.
The horizontal axis of the stability distribution is the number of repetitions.
It can be seen that as the number of iterations increases, the explanatory variables selected in all models decrease by the number of verifications.
In FIGS. 8, 9, and 10, the number of verifications is 10 times. The number of repetitions is 15, 25 and 15 respectively. The analysis data are rice 939 samples, 819 samples, and 302 samples collected from actual fields, respectively.

以上、実施の形態を参照して本発明を説明したが、本発明は上述した実施の形態に限定されるものではない。本発明の構成及び動作については、本発明の趣旨を逸脱しない範囲において、当業者が理解しうる様々な変更を行うことができる。   Although the present invention has been described with reference to the embodiment, the present invention is not limited to the above-described embodiment. Various changes that can be understood by those skilled in the art can be made to the configuration and operation of the present invention without departing from the spirit of the present invention.

100…特性推定モデル生成装置
110…データ出力部
120…回帰分析部
130…特性推定モデル生成部
140…特性関連情報抽出部
150…解析用データ更新部
300…特性推定装置
310…特性推定部
320…状態診断部
DESCRIPTION OF SYMBOLS 100 ... Characteristic estimation model generation apparatus 110 ... Data output part 120 ... Regression analysis part 130 ... Characteristic estimation model generation part 140 ... Characteristic related information extraction part 150 ... Analysis data update part 300 ... Characteristic estimation apparatus 310 ... Characteristic estimation part 320 ... Condition diagnosis section

Claims (28)

解析対象の状態を表す状態変数と、前記解析対象の特性を表す特性変数から、前記特性変数を前記状態変数により推定するモデルを生成する特性推定モデル生成装置であって、
前記解析対象の状態変数と、前記解析対象の特性変数が入力され、解析用データとして出力する、データ出力部と、
前記解析用データのうち、前記特性変数を目的変数とし、前記状態変数を説明変数として、正則化項を有する回帰分析を行うことで、前記目的変数と前記説明変数との関係を表す回帰モデルを生成する、回帰分析部と、
前記回帰モデルと前記解析用データを用いて、事前に設定された検証回数まで交差検証を行い、前記回帰モデルのうち最適な正則化項を有するモデルを、特性推定モデルとして生成する特性推定モデル生成部と、
前記特性推定モデルにおいて選択された説明変数に対応するデータを、前記解析用データから除外したデータを、更新データとして生成し、次回の特性推定モデル生成時の解析用データとして前記データ出力部へと出力する、解析用データ更新部と、
を備え、
事前に設定された繰り返し回数まで、前記解析用データの更新と、前記更新データを用いた特性推定モデルの生成と、を繰り返すことを特徴とする特性推定モデル生成装置。
A characteristic estimation model generation device that generates a model that estimates the characteristic variable from the state variable that represents the state of the analysis target and the characteristic variable that represents the characteristic of the analysis target.
A data output unit that receives the state variable to be analyzed and the characteristic variable to be analyzed and outputs as analysis data;
Of the analysis data, the regression variable representing the relationship between the objective variable and the explanatory variable is obtained by performing a regression analysis having a regularization term using the characteristic variable as an objective variable and the state variable as an explanatory variable. A regression analysis unit to generate,
Using the regression model and the analysis data, cross-validation is performed up to a preset number of verifications, and a model having an optimal regularization term among the regression models is generated as a characteristic estimation model generation. And
Data corresponding to the explanatory variable selected in the characteristic estimation model, data excluded from the analysis data, is generated as update data, and is sent to the data output unit as analysis data at the next generation of the characteristic estimation model. An analysis data update unit to output,
With
A characteristic estimation model generation apparatus that repeats updating of the analysis data and generation of a characteristic estimation model using the update data up to a preset number of repetitions.
前記特性推定モデル生成部において交差検証を行う毎に生成される、前記回帰モデルについて、全てのモデルにおいて選択されている説明変数を、前記解析対象の特性に関連する状態情報である特性関連状態情報として抽出する、特性関連状態情報抽出部を更に備える請求項1に記載の特性推定モデル生成装置。   About the regression model generated every time cross-validation is performed in the characteristic estimation model generation unit, the explanatory variables selected in all models are characteristic-related state information that is state information related to the characteristic to be analyzed The characteristic estimation model production | generation apparatus of Claim 1 further equipped with the characteristic relevant state information extraction part extracted as. 前記回帰分析は、LASSO回帰、Ridge回帰もしくは、Elastic-netである請求項1又は2に記載の特性推定モデル生成装置。   The characteristic estimation model generation device according to claim 1, wherein the regression analysis is LASSO regression, Ridge regression, or Elastic-net. 前記解析対象は生物であり、前記状態変数は遺伝子発現情報であり、前記特性変数は形質情報である、請求項1から3の何れかに記載の特性推定モデル生成装置。   The characteristic estimation model generation apparatus according to claim 1, wherein the analysis target is a living organism, the state variable is gene expression information, and the characteristic variable is trait information. 前記生物は作物である、請求項4に記載の特性推定モデル生成装置。   The characteristic estimation model generation device according to claim 4, wherein the organism is a crop. 前記作物はイネ科作物である、請求項5に記載の特性推定モデル生成装置。   The characteristic estimation model generation device according to claim 5, wherein the crop is a gramineous crop. 前記イネ科作物はイネである、請求項6に記載の特性推定モデル生成装置。   The characteristic estimation model generation apparatus according to claim 6, wherein the gramineous crop is rice. 前記形質情報は、移植日からの日数を表す移植日後日数、開花までに要する日数を表す開花日または、観測対象の乾燥重量当たりの窒素含量を表す窒素含量である請求項5から7の何れかに記載の特性推定モデル生成装置。   The trait information is the number of days after the date of transplantation representing the number of days from the date of transplantation, the date of flowering representing the number of days required for flowering, or the nitrogen content representing the nitrogen content per dry weight of the observation target. The characteristic estimation model generation device described in 1. 前記解析対象の前記特性を推定する、特性推定装置であって、
請求項1から8の何れかに記載の特性推定モデル生成装置によって生成した前記特性推定モデルに、前記解析対象の状態変数が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定部を有することを特徴とする、特性推定装置。
A characteristic estimation device for estimating the characteristic of the analysis target,
A characteristic that is an estimation result of the characteristic of the analysis target when the state variable of the analysis target is input to the characteristic estimation model generated by the characteristic estimation model generation device according to claim 1. A characteristic estimation apparatus, comprising: a characteristic estimation unit that outputs estimation information.
前記解析対象の前記特性を推定する、特性推定装置であって、
請求項4から8の何れかに記載の特性推定モデル生成装置によって生成した前記特性推定モデルに、前記生物の遺伝子発現情報が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定部を有し、
前記生物の前記遺伝子発現情報は、前記特性関連状態情報抽出部にて抽出された、前記特性関連状態情報に対応する遺伝子より転写されるmRNA量から測定されることを特徴とする特性推定装置。
A characteristic estimation device for estimating the characteristic of the analysis target,
A characteristic that is an estimation result of the characteristic of the analysis target by inputting gene expression information of the organism into the characteristic estimation model generated by the characteristic estimation model generation device according to claim 4. A characteristic estimation unit that outputs estimation information;
The gene expression information of the organism is measured from the amount of mRNA transcribed from a gene corresponding to the property-related state information extracted by the property-related state information extraction unit.
前記mRNAの発現量が、定量RT−PCR法により測定される、請求項10に記載の特性推定装置。   The characteristic estimation apparatus according to claim 10, wherein the expression level of the mRNA is measured by a quantitative RT-PCR method. 前記定量RT−PCR法は、リアルタイムRT−PCR法である、請求項11に記載の特性推定装置。   The characteristic estimation apparatus according to claim 11, wherein the quantitative RT-PCR method is a real-time RT-PCR method. 前記定量RT−PCR法が、マルチプレックスRT−PCR法である、請求項11に記載の特性推定装置。   The characteristic estimation apparatus according to claim 11, wherein the quantitative RT-PCR method is a multiplex RT-PCR method. 前記特性推定情報を用いて、前記生物の状態を診断する、状態診断部を更に備える、請求項10から13の何れかに記載の特性推定装置。   The characteristic estimation apparatus according to claim 10, further comprising a state diagnosis unit that diagnoses the state of the living organism using the characteristic estimation information. 解析対象の状態を表す状態変数と、前記解析対象の特性を表す特性変数から、前記特性変数を前記状態変数により推定するモデルを生成する特性推定モデル生成方法であって、
前記解析対象の状態変数と、前記解析対象の特性変数を、解析用データとし、
前記解析用データのうち、前記特性変数を目的変数とし、前記状態変数を説明変数として、正則化項を有する回帰分析を行うことで、前記目的変数と前記説明変数との関係を表す回帰モデルを生成する、回帰分析ステップと、
前記回帰モデルと前記解析用データを用いて、事前に設定された検証回数まで交差検証を行い、前記回帰モデルのうち最適な正則化項を有するモデルを、特性推定モデルとして生成する特性推定モデル生成ステップと、
前記特性推定モデルにおいて選択された説明変数に対応するデータを、前記解析用データから除外したデータを、更新データとして生成し、次回の特性推定モデル生成時の解析用データとして更新する、解析用データ更新ステップと、
を備え、
事前に設定された繰り返し回数まで、前記解析用データの更新と、前記更新データを用いた特性推定モデルの生成と、を繰り返すことを特徴とする特性推定モデル生成方法。
A characteristic estimation model generation method for generating a model for estimating the characteristic variable from the state variable representing the state of the analysis target and the characteristic variable representing the characteristic of the analysis target by the state variable,
The state variable to be analyzed and the characteristic variable to be analyzed are data for analysis,
Of the analysis data, the regression variable representing the relationship between the objective variable and the explanatory variable is obtained by performing a regression analysis having a regularization term using the characteristic variable as an objective variable and the state variable as an explanatory variable. A regression analysis step to generate,
Using the regression model and the analysis data, cross-validation is performed up to a preset number of verifications, and a model having an optimal regularization term among the regression models is generated as a characteristic estimation model generation. Steps,
Data for analysis corresponding to the explanatory variable selected in the characteristic estimation model is generated as update data, data that is excluded from the analysis data, and is updated as analysis data for the next generation of the characteristic estimation model An update step;
With
A characteristic estimation model generation method characterized by repeating the updating of the analysis data and the generation of a characteristic estimation model using the update data up to a preset number of repetitions.
前記特性推定モデル生成ステップにおいて交差検証を行う毎に生成される、前記回帰モデルについて、全てのモデルにおいて選択されている説明変数を、前記解析対象の特性に関連する状態情報である特性関連状態情報として抽出する、特性関連状態情報抽出ステップを更に備える請求項15に記載の特性推定モデル生成方法。   About the regression model generated every time cross-validation is performed in the characteristic estimation model generation step, the explanatory variables selected in all the models are characteristic related state information that is state information related to the characteristics to be analyzed. The characteristic estimation model generation method according to claim 15, further comprising a characteristic-related state information extraction step that is extracted as follows. 前記回帰分析は、LASSO回帰、Ridge回帰もしくは、Elastic-netである請求項15又は16に記載の特性推定モデル生成方法。   The characteristic estimation model generation method according to claim 15 or 16, wherein the regression analysis is LASSO regression, Ridge regression, or Elastic-net. 前記解析対象は生物であり、前記状態変数は遺伝子発現情報であり、前記特性変数は形質情報である、請求項15から17の何れかに記載の特性推定モデル生成方法。   The characteristic estimation model generation method according to claim 15, wherein the analysis target is an organism, the state variable is gene expression information, and the characteristic variable is trait information. 前記生物は作物である、請求項18に記載の特性推定モデル生成方法。   The characteristic estimation model generation method according to claim 18, wherein the organism is a crop. 前記作物はイネ科作物である、請求項19に記載の特性推定モデル生成方法。   The characteristic estimation model generation method according to claim 19, wherein the crop is a gramineous crop. 前記イネ科作物はイネである、請求項20に記載の特性推定モデル生成方法。   21. The characteristic estimation model generation method according to claim 20, wherein the gramineous crop is rice. 前記形質情報は、移植日からの日数を表す移植日後日数、開花までに要する日数を表す開花日または、観測対象の乾燥重量当たりの窒素含量を表す窒素含量である請求項19から21の何れかに記載の特性推定モデル生成方法。   The trait information is the number of days after the transplantation date representing the number of days from the date of transplantation, the flowering date representing the number of days required for flowering, or the nitrogen content representing the nitrogen content per dry weight of the observation target. The characteristic estimation model generation method described in 1. 前記解析対象の前記特性を推定する、特性推定方法であって、
請求項15から22の何れかに記載の特性推定モデル生成方法によって生成した前記特性推定モデルに、前記解析対象の状態変数が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定ステップを有することを特徴とする、特性推定方法。
A property estimation method for estimating the property of the analysis target,
A characteristic, which is an estimation result of the characteristic of the analysis target, by inputting the state variable of the analysis target to the characteristic estimation model generated by the characteristic estimation model generation method according to any one of claims 15 to 22. A characteristic estimation method comprising a characteristic estimation step in which estimation information is output.
前記解析対象の前記特性を推定する、特性推定方法であって、
請求項18から22の何れかに記載の特性推定モデル生成方法によって生成した前記特性推定モデルに、前記生物の遺伝子発現情報が入力されることで、前記解析対象の特性の推定結果である、特性推定情報が出力される、特性推定ステップを有し、
前記生物の前記遺伝子発現情報は、前記特性関連状態情報抽出ステップにて抽出された、前記特性関連状態情報に対応する遺伝子より転写されるmRNA量から測定されることを特徴とする特性推定方法。
A property estimation method for estimating the property of the analysis target,
23. A characteristic that is an estimation result of the characteristic of the analysis target by inputting gene expression information of the organism to the characteristic estimation model generated by the characteristic estimation model generation method according to claim 18. A characteristic estimation step in which estimation information is output;
The gene estimation information of the organism is measured from the amount of mRNA transcribed from the gene corresponding to the property-related state information extracted in the property-related state information extraction step.
前記mRNAの発現量が、定量RT−PCR法により測定される、請求項24に記載の特性推定方法。   The characteristic estimation method according to claim 24, wherein the expression level of the mRNA is measured by a quantitative RT-PCR method. 前記定量RT−PCR法は、リアルタイムRT−PCR法である、請求項25に記載の特性推定方法。   The characteristic estimation method according to claim 25, wherein the quantitative RT-PCR method is a real-time RT-PCR method. 前記定量RT−PCR法が、マルチプレックスRT−PCR法である、請求項25に記載の特性推定方法。   The characteristic estimation method according to claim 25, wherein the quantitative RT-PCR method is a multiplex RT-PCR method. 前記特性推定情報を用いて、前記生物の状態を診断する、状態診断ステップを更に備える、請求項24から27の何れかに記載の特性推定方法。   The characteristic estimation method according to claim 24, further comprising a state diagnosis step of diagnosing the state of the organism using the characteristic estimation information.
JP2015176416A 2015-09-08 2015-09-08 Characteristic estimation model generation apparatus and method, analysis target characteristic estimation apparatus and method Expired - Fee Related JP6570929B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015176416A JP6570929B2 (en) 2015-09-08 2015-09-08 Characteristic estimation model generation apparatus and method, analysis target characteristic estimation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015176416A JP6570929B2 (en) 2015-09-08 2015-09-08 Characteristic estimation model generation apparatus and method, analysis target characteristic estimation apparatus and method

Publications (2)

Publication Number Publication Date
JP2017051118A true JP2017051118A (en) 2017-03-16
JP6570929B2 JP6570929B2 (en) 2019-09-04

Family

ID=58316110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015176416A Expired - Fee Related JP6570929B2 (en) 2015-09-08 2015-09-08 Characteristic estimation model generation apparatus and method, analysis target characteristic estimation apparatus and method

Country Status (1)

Country Link
JP (1) JP6570929B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200054619A (en) * 2018-11-12 2020-05-20 한국과학기술연구원 Apparatus for managing growth of plants based on mass of fruits, and method thereof
JP2020149196A (en) * 2019-03-12 2020-09-17 国立研究開発法人情報通信研究機構 Personality prediction device and training data collection device

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10300665A (en) * 1997-04-21 1998-11-13 Satake Eng Co Ltd Method for measuring specified component of rice plant
JP2003085548A (en) * 2001-09-07 2003-03-20 Canon Inc Data processing device, method of processing image of data processing device, image processing system, memory medium, and program
JP2008161157A (en) * 2006-12-29 2008-07-17 Pasuko:Kk Crop growing condition analyzing method, crop growing condition analyzing device, crop growing condition analyzing program
JP2012152151A (en) * 2011-01-27 2012-08-16 Osaka Prefecture Univ Plant factory for molecular diagnosis and molecular diagnostic method
JP2013150622A (en) * 2005-11-26 2013-08-08 Natera Inc System and method for cleaning genetic data and using data to make predictions
JP2013534818A (en) * 2010-06-14 2013-09-09 アベリストウィス ユニバーシティ Method for producing stress-tolerant plant or precursor thereof
JP2013183702A (en) * 2012-03-08 2013-09-19 Hamamatsu Photonics Kk Method for diagnosing growing state of plant and device used for the same
WO2014079874A1 (en) * 2012-11-20 2014-05-30 Phadia Ab Prognostic method for individuals with prostate cancer
JP2016139336A (en) * 2015-01-28 2016-08-04 一般財団法人電力中央研究所 Prediction device, prediction method, and prediction program

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10300665A (en) * 1997-04-21 1998-11-13 Satake Eng Co Ltd Method for measuring specified component of rice plant
JP2003085548A (en) * 2001-09-07 2003-03-20 Canon Inc Data processing device, method of processing image of data processing device, image processing system, memory medium, and program
JP2013150622A (en) * 2005-11-26 2013-08-08 Natera Inc System and method for cleaning genetic data and using data to make predictions
JP2008161157A (en) * 2006-12-29 2008-07-17 Pasuko:Kk Crop growing condition analyzing method, crop growing condition analyzing device, crop growing condition analyzing program
JP2013534818A (en) * 2010-06-14 2013-09-09 アベリストウィス ユニバーシティ Method for producing stress-tolerant plant or precursor thereof
JP2012152151A (en) * 2011-01-27 2012-08-16 Osaka Prefecture Univ Plant factory for molecular diagnosis and molecular diagnostic method
JP2013183702A (en) * 2012-03-08 2013-09-19 Hamamatsu Photonics Kk Method for diagnosing growing state of plant and device used for the same
WO2014079874A1 (en) * 2012-11-20 2014-05-30 Phadia Ab Prognostic method for individuals with prostate cancer
JP2016508026A (en) * 2012-11-20 2016-03-17 ファディア・アクチボラゲットPhadia AB Prognostic method for individuals with prostate cancer
JP2016139336A (en) * 2015-01-28 2016-08-04 一般財団法人電力中央研究所 Prediction device, prediction method, and prediction program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200054619A (en) * 2018-11-12 2020-05-20 한국과학기술연구원 Apparatus for managing growth of plants based on mass of fruits, and method thereof
KR102264035B1 (en) * 2018-11-12 2021-06-14 한국과학기술연구원 Apparatus for managing growth of plants based on mass of fruits, and method thereof
JP2020149196A (en) * 2019-03-12 2020-09-17 国立研究開発法人情報通信研究機構 Personality prediction device and training data collection device

Also Published As

Publication number Publication date
JP6570929B2 (en) 2019-09-04

Similar Documents

Publication Publication Date Title
Falk et al. Computer vision and machine learning enabled soybean root phenotyping pipeline
US11533862B2 (en) Method and system for selecting a plant variety
Bogard et al. Predictions of heading date in bread wheat (Triticum aestivum L.) using QTL-based parameters of an ecophysiological model
Bannayan et al. Using pattern recognition for estimating cultivar coefficients of a crop simulation model
EP3550498A1 (en) Information processing device and information processing system
Cournede et al. Some parameter estimation issues in functional-structural plant modelling
Jiang et al. Three-dimensional time-lapse analysis reveals multiscale relationships in maize root systems with contrasting architectures
Fritsche‐Neto et al. Phenomics
CN107105624A (en) improved molecular breeding method
Gouache et al. Bridging the gap between ideotype and genotype: challenges and prospects for modelling as exemplified by the case of adapting wheat (Triticum aestivum L.) phenology to climate change in France
Viaud et al. Leaf segmentation and tracking in Arabidopsis thaliana combined to an organ-scale plant model for genotypic differentiation
JP6570929B2 (en) Characteristic estimation model generation apparatus and method, analysis target characteristic estimation apparatus and method
Thorp et al. Comparison of evapotranspiration methods in the DSSAT Cropping System Model: II. Algorithm performance
Thorp et al. Comparison of evapotranspiration methods in the DSSAT Cropping System Model: I. Global sensitivity analysis
Kang et al. SUNLAB: a functional–structural model for genotypic and phenotypic characterization of the sunflower crop
US9107355B2 (en) Real-time process for targeting trait phenotyping of plant breeding experiments
Sarzaeim et al. CLIM4OMICS: a geospatially comprehensive climate and multi-OMICS database for Maize phenotype predictability in the US and Canada
AU2011235120B2 (en) Environmental monitoring
JPWO2019003441A1 (en) Prediction device, prediction method, prediction program, and gene estimation device
CN110807561A (en) Bayesian network-based corn pest and disease early warning analysis method
Sexton et al. Global sensitivity analysis of key parameters in a process-based sugarcane growth model: a Bayesian approach
Thorburn et al. Cropping systems modeling in AgMIP: a new protocol-driven approach for regional integrated assessments
CN111223002B (en) Corn area dry matter yield or silage yield evaluation method and system
JP6744524B2 (en) Paddy rice growth evaluation method and device
Zhang et al. An aboveground biomass partitioning coefficient model for rapeseed (Brassica napus L.)

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20160428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180524

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180524

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20180524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190807

R150 Certificate of patent or registration of utility model

Ref document number: 6570929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees