JP2023090795A - Method of predicting soybean yield - Google Patents

Method of predicting soybean yield Download PDF

Info

Publication number
JP2023090795A
JP2023090795A JP2023070854A JP2023070854A JP2023090795A JP 2023090795 A JP2023090795 A JP 2023090795A JP 2023070854 A JP2023070854 A JP 2023070854A JP 2023070854 A JP2023070854 A JP 2023070854A JP 2023090795 A JP2023090795 A JP 2023090795A
Authority
JP
Japan
Prior art keywords
model
data
yield
components
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023070854A
Other languages
Japanese (ja)
Inventor
輝久 藤松
Teruhisa Fujimatsu
圭二 遠藤
Keiji Endo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kao Corp
Original Assignee
Kao Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kao Corp filed Critical Kao Corp
Publication of JP2023090795A publication Critical patent/JP2023090795A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Abstract

To provide a method of predicting soybean yield at an early stage with high accuracy.SOLUTION: In a method of predicting soybean yield, analysis data on one or more components is obtained from a leaf sample collected from soybean, and the soybean yield is predicted by using a correlation between the data and the soybean yield.SELECTED DRAWING: None

Description

本発明はダイズの収量を早期に予測する方法に関する。 The present invention relates to a method for early prediction of soybean yield.

ダイズは、重要な穀物であり、日本を始め世界中で広く食されている。また他の代表的
な穀物である米、麦、トウモロコシと異なり、タンパク質及び脂質の割合が高く栄養価も
豊富である。そのため飼料や油脂原料としても重要であり、収量を増加させる技術の開発
が行われている。
ダイズの生育期間は、品種や栽培条件によって若干異なるが、通常、播種から収穫まで
4-5か月という長期間を要する。よって、ダイズの収量を増加させる技術の開発におい
て、収量評価を行うには栽培に多くの時間を必要とする。更に、日本のような季節・気候
条件では、収穫まで4-5か月を要するダイズの栽培は年に1回が一般的である。屋外栽
培での収量評価が年に1度しかできず収量増加技術の開発の障害となっていることから、
早期に収量を予測する方法が求められてきた。また、実際の生産場面において、早期に収
量を予測することができれば、生産者は安定した収量確保のために費用コストのかかる追
加技術を投入すべきかどうかの判断を容易に下すことができる。
Soybean is an important cereal and is widely eaten in Japan and around the world. In addition, unlike other representative grains such as rice, wheat and corn, it has a high protein and lipid ratio and is rich in nutritional value. Therefore, it is also important as a feed and oil material, and techniques for increasing the yield are being developed.
The growing period of soybean varies slightly depending on the variety and cultivation conditions, but it usually takes a long period of 4 to 5 months from sowing to harvest. Therefore, in the development of techniques for increasing the yield of soybeans, much time is required for cultivation in order to evaluate the yield. Furthermore, in the seasonal and climatic conditions of Japan, soybeans, which require 4-5 months to harvest, are generally cultivated once a year. Yield evaluation in outdoor cultivation can only be done once a year, which is an obstacle to the development of yield-increasing technology.
A method for predicting yield at an early stage has been sought. Also, in the actual production scene, if the yield can be predicted at an early stage, the producer can easily decide whether to introduce costly additional technology to secure a stable yield.

これまでにも生育中の植物体の発育状態と収量との相関性を利用した早期に収量性を評
価する方法が種々検討されている。例えば、非特許文献1ではダイズの播種後40日程度
に測定した主茎長と収量との相関(r=0.51)を利用する方法、非特許文献2では、
播種後60-70日程度に測定した地上部の乾燥重量と収量との相関(r=0.66)を
利用する方法が開示されている。また、非特許文献3及び4では、画像診断技術を用いて
、圃場においてNDVI(正規化植生指標)やLAI(葉面積指数)及び群落分光反射率
を測定し、生育や収量性を評価する試みが開示されている。
Various methods have been studied so far for evaluating the yield property at an early stage using the correlation between the growth state of the growing plant body and the yield. For example, in Non-Patent Document 1, a method using the correlation between the main stem length and the yield (r = 0.51) measured about 40 days after sowing soybeans, and in Non-Patent Document 2,
A method is disclosed that utilizes the correlation (r=0.66) between the dry weight of above-ground parts measured about 60-70 days after sowing and the yield. In addition, in Non-Patent Documents 3 and 4, using diagnostic imaging technology, NDVI (Normalized Vegetation Index), LAI (Leaf Area Index) and canopy spectral reflectance are measured in the field, and an attempt to evaluate growth and yield. is disclosed.

しかしながら、非特許文献1の方法は、比較的早期に収量を予測できる可能性がある一
方で相関性が十分でなく、また非特許文献2の方法では相関性は向上するものの予測時期
が栽培開始から2か月以上であり生育期間の半分が経過すること、及び地上部乾燥重を測
定するため侵襲的であり、個体毎の予測因子と収量とを対応させたい場合の評価には向い
ていない。非特許文献3及び4の方法は非破壊で簡易的な測定であるといえるが、予測時
期が開花期、すなわち播種後50日前後以降になること、また精度の面でも十分とは言え
ない。
However, the method of Non-Patent Document 1 has the possibility of predicting the yield relatively early, but the correlation is not sufficient, and the method of Non-Patent Document 2 improves the correlation, but the prediction time is the start of cultivation. It takes more than 2 months and half of the growth period has passed since the beginning of the experiment, and it is invasive to measure the above-ground dry weight. . The methods of Non-Patent Documents 3 and 4 can be said to be non-destructive and simple measurements.

このほかイネにおいて、播種後15日程度の地上部から抽出される代謝物をGC-MS
により網羅的に測定し、それらのデータを用いてハイブリッドライス収量予測モデルを作
成したことが報告されているが(非特許文献5)、この報告では、通常の予測モデル構築
の際に行われるクロスバリデーションというモデルの予測性評価が行われておらず、検証
が十分とは云えない。また、侵襲的であり、個体毎の予測因子と収量とを対応させたい場
合の評価には向いていない。
In addition, in rice, metabolites extracted from the aerial part about 15 days after seeding were analyzed by GC-MS.
It has been reported that a hybrid rice yield prediction model was created using these data by comprehensively measuring the data (Non-Patent Document 5). Predictive evaluation of the model called validation has not been performed, and verification cannot be said to be sufficient. In addition, it is invasive and not suitable for evaluation when it is desired to match predictive factors and yields for each individual.

藤田与一ら、平成21年度「関東東海北陸農業」研究成果情報、「重粘度地帯におけるダイズ「エンレイ」の多収事例に基づく収量構成要素と生育指標」、http://www.naro.affrc.go.jp/org/narc/seika/kanto21/12/21_12_04.htmlYoichi Fujita et al., 2009 ``Kanto Tokai Hokuriku Agriculture'' research results information, ``Yield components and growth indicators based on high-yield cases of soybean ``Enrei'' in heavy viscosity areas, http://www.naro.affrc .go.jp/org/narc/seika/kanto21/12/21_12_04.html 井上健一、高橋正樹、第229回日本作物学会講演会要旨集、2010、p50、「物質生産と窒素の蓄積から見たダイズの多収生育相」Kenichi Inoue, Masaki Takahashi, Abstracts of the 229th Annual Meeting of the Crop Science Society of Japan, 2010, p50, "High Yield Growth Phase of Soybean Seen from Substance Production and Nitrogen Accumulation" 長南友也ら、第245回日本作物学会講演会要旨集、2018、p83、「ダイズの簡易的な開花前生育診断技術」Tomoya Osanami et al., Abstracts of the 245th Annual Meeting of the Crop Science Society of Japan, 2018, p83, "Simple pre-flowering growth diagnosis technology for soybean" 渡邊智也ら、第245回日本作物学会講演会要旨集、2018、p84、「非破壊計測と畳み込みニューラルネットワークを利用したダイズの収量評価」Tomoya Watanabe et al., Abstracts of the 245th Annual Meeting of the Crop Science Society of Japan, 2018, p84, "Yield evaluation of soybean using non-destructive measurement and convolutional neural network" Dan,Z.et al., Scientific Reports,2016,6,21732Dan, Z. et al., Scientific Reports, 2016, 6, 21732

本発明は、ダイズの収量を早期に精度よく予測する方法を提供することに関する。 The present invention relates to providing a method for early and accurate prediction of soybean yield.

本発明者らは、ダイズの収量性評価について種々検討した結果、葉中に含まれる代謝物
にはその存在量が収量と相関する成分があること、そして、播種後1か月程度という早期
に展開葉を1枚採取し、葉中に含まれる成分を分析し、解析することで最終的な収量を個
体レベルで評価できることを見出した。
As a result of various studies on the yield evaluation of soybeans, the present inventors found that metabolites contained in leaves have components whose abundance correlates with yield, and that as early as about one month after sowing It was found that the final yield can be evaluated at the individual level by collecting one expanded leaf and analyzing the components contained in the leaf.

すなわち、本発明は、ダイズから採取された葉サンプルから1以上の成分の分析データ
を取得し、当該データとダイズ収量との相関性を利用してダイズの収量を予測する、ダイ
ズの収量予測方法、を提供する。
That is, the present invention provides a soybean yield prediction method, which obtains analytical data of one or more components from a leaf sample collected from soybean, and predicts the soybean yield using the correlation between the data and the soybean yield. ,I will provide a.

本発明の方法によれば、ダイズの収量を早期に予測できる。これにより、例えば、収量
確保のための追加技術投入の判断が容易となるほか、収量増加技術の開発の大幅な効率化
を図ることができる。
According to the method of the present invention, soybean yield can be predicted early. As a result, for example, it becomes easier to decide whether to introduce additional technologies to secure yields, and it is possible to significantly improve the efficiency of the development of yield-increasing technologies.

全125データを用いて構築されたOPLSモデルによる収量の予測値と実測値との関係を示す図。FIG. 10 is a diagram showing the relationship between yield prediction values and actual yield values based on an OPLS model constructed using all 125 data. 全125データを用いて構築された機械学習モデルによる収量の予測値と実測値との関係を示す図。FIG. 10 is a diagram showing the relationship between the yield prediction value and the actual measurement value by a machine learning model constructed using all 125 data. 学習用データ及び検証用データ各々の予測値と実測値との関係を示す図。全125個のデータマトリックスをランダムに2群(学習用と検証用)に分割し、一方の63個のマトリクスデータを学習用、残り62個のマトリクスデータを検証用として用いた。The figure which shows the relationship between each predicted value and measured value of data for learning and data for verification. All 125 data matrices were randomly divided into two groups (for learning and for verification), one of the 63 matrix data was used for learning and the remaining 62 matrix data were used for verification. 図1のモデルにおけるVIP値11位以下全ての成分の分析データ、21位以下全ての成分の分析データ、31位以下全ての成分の分析データ・・・及び351位以下全ての成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Analysis data of all components below VIP value 11th in the model in Figure 1, analysis data of all components below 21st, analysis data of all components below 31st, and analysis data of all components below 351st FIG. 10 is a diagram showing the R 2 (indicated as R2Y in the figure) and Q 2 (indicated as Q2 in the figure) values of each model constructed by the OPLS method. 図1のモデルにおけるVIP値上位1位から10位までの成分の分析データの内、任意の2個の組み合わせ(45通り)についてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Of the analysis data of the top 1 to 10 VIP value components in the model in Figure 1, each model constructed by the OPLS method for any two combinations (45 ways) R ) and Q 2 (indicated as Q2 in the figure) values. 図1のモデルにおけるVIP値上位1位と2位、11位と12位、21位と22位、・・・及び201位と202位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st and 2nd, 11th and 12th, 21st and 22nd, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 図1のモデルにおけるVIP値上位1位と2位と3位、11位と12位と13位、21位と22位と23位、・・・及び221位と222位と223位の成分の分析データを用いてOPLS法により構築した各々モデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。The components of the top 1st, 2nd and 3rd, 11th, 12th and 13th, 21st, 22nd and 23rd, . FIG. 4 is a diagram showing the R 2 (indicated as R2Y in the figure) and Q 2 (indicated as Q2 in the figure) values of each model constructed by the OPLS method using analytical data. 図1のモデルにおけるVIP値上位1位と2位と3位と4位、11位と12位と13位と14位、21位と22位と23位と24位、・・・及び221位と222位と223位と224位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。VIP value top 1st, 2nd, 3rd and 4th, 11th, 12th, 13th and 14th, 21st, 22nd, 23rd and 24th, . and the R 2 (indicated as R2Y in the figure) and Q 2 (indicated as Q2 in the figure) values of each model constructed by the OPLS method using the analytical data of the components at positions 222, 223 and 224. illustration. 図1のモデルにおけるVIP値上位1位~5位、11位~15位、21位~25位、・・・及び251位~255位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st to 5th, 11th to 15th, 21st to 25th, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 図1のモデルにおけるVIP値上位1位~6位、11位~16位、21位~26位、・・・及び281位~286位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st to 6th, 11th to 16th, 21st to 26th, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 図1のモデルにおけるVIP値上位1位~7位、11位~17位、21位~27位、・・・及び281位~287位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st to 7th, 11th to 17th, 21st to 27th, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 図1のモデルにおけるVIP値上位1位~8位、11位~18位、21位~28位、・・・及び281位~288位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st to 8th, 11th to 18th, 21st to 28th, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 図1のモデルにおけるVIP値上位1位~9位、11位~19位、21位~29位、・・・及び281位~289位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st to 9th, 11th to 19th, 21st to 29th, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 図1のモデルにおけるVIP値上位1位~10位、11位~20位、21位~30位、・・・及び281位~290位の成分の分析データを用いてOPLS法により構築した各々のモデルのR(図中ではR2Yと表示)値及びQ(図中ではQ2と表示)値を示す図。Each constructed by the OPLS method using the analysis data of the top 1st to 10th, 11th to 20th, 21st to 30th, . A diagram showing the R 2 (labeled as R2Y in the figure) and Q 2 (labeled as Q2 in the figure) values of the model. 1データ当り100個の成分の分析データを用いて構築されたOPLSモデル(モデルA)による収量の予測値と実測値との関係を示す図。The figure which shows the relationship between the predicted value of a yield by the OPLS model (model A) constructed using the analysis data of 100 components per 1 data, and an actual value. 試験区1~10のモデルAを用いた収量予測の結果(試験区1との差)を示す図。FIG. 10 is a diagram showing the results of yield prediction using model A for test plots 1 to 10 (difference from test plot 1). MIX堆肥施用区におけるモデルAを用いた圃場予測収量を示す図。The figure which shows the field prediction yield using the model A in the MIX manure application plot. MIX堆肥施用における圃場収量を示す図。The figure which shows the field yield in MIX compost application. 播種後2週間及び8週間でのモデルAを用いた予測収量と実測収量の比較を示す図。Figure 2 shows a comparison of predicted yield using Model A and observed yield at 2 weeks and 8 weeks after sowing. 圃場データ(1データ当り431個の成分の分析データ)を用いて構築されたOPLSモデルによる収量の予測値と実測値との関係を示す図。The figure which shows the relationship between the predicted value of a yield by the OPLS model constructed|assembled using field data (analysis data of 431 components per 1 data), and an actual value.

本発明において、ダイズとは、マメ科の一年草である大豆(学名 Glycine max)を意味
する。その品種はフクユタカ、エンレイ、里のほほえみ、湯上がり娘、リュウホウ、スズ
ユタカ等、多岐にわたるが、本発明においてはそれに限定されるものではない。
In the present invention, soybean means soybean (scientific name: Glycine max) which is an annual plant of the legume family. The varieties include Fukuyutaka, Enrei, Sato no Hohoemi, Yuagari Musume, Ryuho, Suzuyutaka, etc., but the present invention is not limited to them.

ダイズの出芽から落葉までの生育ステージは、VC:初生葉展開期(播種後7日前後)
、R1-2:開花期(播種後50日前後)、R3-4:着莢期(播種後70日前後)、R
5-6:子実肥大期(播種後90日前後)に分けられる(Fehr, W.R., Caviness, C.E.,
1977. Stages of soybean development. Cooperative Extension Service, Agriculture
and Home Economics Experiment Station, Iowa State University, Ames, Iowa)。本発
明において、サンプルとして使用されるダイズの葉の採取時期は、葉が採取可能な初生葉
展開期(VC)から子実肥大期(R5-6)までの間に行われればよく、好ましくは初生
葉展開期~R3-4期、より好ましくは播種後14日~R3-4期、より好ましくは播種
後21日~R1-2期、更に好ましくは播種後28日~R1-2期のダイズが挙げられる
。尚、上記各生育ステージにおける前後の日数幅は10日間以内が好適である。
或いは、ダイズの葉の採取時期は、播種後7日以上、好ましくは14日目以上、より好
ましくは21日目以上、更に好ましくは28日以上で、且つ好ましくは播種後50日より
前、より好ましくは播種後40日より前、更に好ましくは35日目より前であり得る。ま
た、播種後7~50日目、好ましくは14~40日目、より好ましくは28~35日目で
あり得る。例えば、播種後30日±3~5日目のダイズから葉を採取するのが好適である
The growth stage from germination to defoliation of soybean is VC: primary leaf development stage (around 7 days after sowing)
, R1-2: flowering period (around 50 days after sowing), R3-4: seeding period (around 70 days after sowing), R
5-6: Divided into seed enlargement stage (around 90 days after sowing) (Fehr, WR, Caviness, CE,
1977. Stages of soybean development.
and Home Economics Experiment Station, Iowa State University, Ames, Iowa). In the present invention, the soybean leaves used as samples may be collected from the primary leaf development stage (VC) when the leaves can be collected to the grain hypertrophy stage (R5-6), preferably Primary leaf development stage to R3-4 stage, more preferably 14 days after sowing to R3-4 stage, more preferably 21 days after sowing to R1-2 stage, still more preferably 28 days after sowing to R1-2 stage is mentioned. The number of days before and after each growth stage is preferably within 10 days.
Alternatively, soybean leaves are harvested 7 days or more after sowing, preferably 14 days or more, more preferably 21 days or more, still more preferably 28 days or more, and preferably before 50 days after sowing. Preferably before 40 days after seeding, more preferably before 35 days. It may also be 7 to 50 days after seeding, preferably 14 to 40 days, more preferably 28 to 35 days. For example, it is suitable to harvest leaves from soybeans 30 days ± 3-5 days after sowing.

葉の採取部位は、特に限定されないが、例えば、最上位に展開する本葉の1又は2葉齢
分古い本葉を構成する複葉3枚の内、中央の複葉を採取することが挙げられる。
The part from which the leaf is collected is not particularly limited, but for example, the central compound leaf of the three compound leaves that constitute the true leaf that is one or two leaf years older than the uppermost true leaf can be collected.

本発明において、取得される成分の分析データとしては、高速液体クロマトグラフィー
(HPLC)、ガスクロマトグラフィー(GC)、イオンクロマトグラフィー、質量分析
(MS)、近赤外分光分析(NIR)、フーリエ変換赤外分光分析(FT-IR)、核磁
気共鳴分析(NMR)、フーリエ変換核磁気共鳴分析(FT-NMR)、誘導結合プラズ
マ質量分析計(ICP-MS)、液体クロマトグラフと質量分析とを組合せたLC/MS
等の機器分析手段を用いて分析・測定されたデータが挙げられるが、好ましくは質量分析
データであり、より好ましくはLC/MSによる質量分析データである。
質量分析データとしては、精密質量(「m/z値」)、イオン強度、保持時間等が挙げ
られるが、好ましくは精密質量の情報である。
In the present invention, the analytical data of the components to be obtained include high performance liquid chromatography (HPLC), gas chromatography (GC), ion chromatography, mass spectrometry (MS), near infrared spectroscopy (NIR), Fourier transform Infrared spectroscopy (FT-IR), nuclear magnetic resonance spectroscopy (NMR), Fourier transform nuclear magnetic resonance spectroscopy (FT-NMR), inductively coupled plasma mass spectrometer (ICP-MS), liquid chromatograph and mass spectrometry Combined LC/MS
Data analyzed and measured using instrumental analysis means such as are preferably mass spectrometric data, more preferably mass spectrometric data by LC/MS.
The mass spectrometry data includes accurate mass (“m/z value”), ion intensity, retention time, etc., but is preferably accurate mass information.

葉サンプルを、上記機器分析手段に適用するためには、分析手段に応じて適宜前処理さ
れるが、通常、採取した葉はアルミホイルで包み直ちに液体窒素中で凍結して代謝反応を
停止させ、凍結乾燥にかけて乾燥した後、抽出操作に供される。
抽出は、凍結乾燥した葉サンプルを、ビーズ粉砕機等を用いて粉砕した後、抽出溶媒を
添加して撹拌することにより行われる。ここで用いられる抽出溶媒としては、メタノール
、エタノール、ブタノール、アセトニトリル、クロロホルム、酢酸エチル、ヘキサン、ア
セトン、イソプロパノール、水等及びそれらを混合したものが挙げられる。分析手段とし
てLC/MSを用いる場合には、内部標準物質を添加した80v/v%メタノール水溶液
等が好適に使用される。
In order to apply the leaf sample to the instrumental analysis method, it is appropriately pretreated according to the analysis method. Usually, the collected leaves are wrapped in aluminum foil and immediately frozen in liquid nitrogen to stop the metabolic reaction. , dried by freeze-drying, and then subjected to extraction operations.
Extraction is performed by pulverizing a freeze-dried leaf sample using a bead pulverizer or the like, then adding an extraction solvent and stirring. Extraction solvents used here include methanol, ethanol, butanol, acetonitrile, chloroform, ethyl acetate, hexane, acetone, isopropanol, water, and mixtures thereof. When LC/MS is used as an analysis means, an 80 v/v % aqueous solution of methanol containing an internal standard is preferably used.

本発明において、分析される葉中の成分としては、LC/MSによって分離検出される
ダイズの代謝物質が挙げられる。好ましくは、質量分析により提供される精密質量(m/
z)が139~1156である成分が挙げられる。より好ましくは、質量分析により提供
される精密質量(m/z値)で規定された、下記表1a~1cに記載された431成分が
挙げられる。尚、LC/MSによる分離検出の過程において、代謝物質から部分分解物及
びアダクト(M+H、M+Na等)の異なる分子イオンピークが生じる場合、検出される
部分分解物は、元の代謝物質とは別の成分とする。
In the present invention, the components in the leaves to be analyzed include soybean metabolites separated and detected by LC/MS. Preferably, the exact mass provided by mass spectrometry (m/
Components where z) is from 139 to 1156 are included. More preferably, the 431 components described in Tables 1a to 1c below, defined by accurate mass (m/z value) provided by mass spectrometry, are included. In the process of separation and detection by LC/MS, when different molecular ion peaks of partial degradation products and adducts (M + H, M + Na, etc.) are generated from metabolites, the detected partial degradation products are different from the original metabolites. be a component of


Figure 2023090795000001
Figure 2023090795000001

Figure 2023090795000002
Figure 2023090795000002

Figure 2023090795000003
Figure 2023090795000003

当該431成分はダイズの代謝物質から選択抽出されたものであり、その選択方法は詳
細には実施例に示すとおりであるが、概略すると、1)2015年~2017年にかけて
、土壌、品種、肥料を変えたダイズ125株を栽培し、2)それぞれ播種後1ヶ月前後に
葉を1枚採取し、3)80v/v%メタノール水溶液を用いて成分抽出を行った後、4)
LC/MS分析を行って分子イオン情報(精密質量, m/z)とフラグメントに由来する
構造情報を取得し、5)成分由来ピークを抽出し、次いで各ピークを各サンプル間で整列
化させるアラインメント処理、同位体ピークの除去、サンプル間のピーク強度補正、ノイ
ズの除去、を行って431成分の分析データを取得する、というものである。尚、サンプ
ル間のピーク強度補正の方法は特に限定されないが、pooled QC法や内部標準物
質を用いた補正が挙げられる。pooled QC法は、同一バッチ内の全てのサンプル
から一定量を混合したpooled QCと呼ばれるサンプルを作製し、各サンプルの合
間に一定の頻度(5~9回に1回程度)でpooled QCの分析を実施することによ
り、「各サンプルを分析していた際にQCサンプルを分析していたと仮定するとそれぞれ
のピーク強度はどうなるか」という推定値を計算し、その値で補正するという処理を行っ
て各サンプル間の感度の補正を行うものである。内部標準物質を用いた補正は、各サンプ
ルに同量添加した内部標準物質(リドカイン、10-カンファースルホン酸など)のピー
ク面積の値で補正するという処理を行って各サンプル間の感度の補正を行うものである。
なお、データの補正方法が収量との相関性及び予測モデルの性能に大きく影響することは
ない。
The 431 components were selectively extracted from soybean metabolites, and the selection method is shown in detail in the examples. Cultivate 125 soybean strains with different strains, 2) collect one leaf about 1 month after sowing, 3) extract components using 80 v / v% methanol aqueous solution, 4)
LC/MS analysis was performed to obtain molecular ion information (accurate mass, m/z) and structural information derived from fragments, 5) component derived peaks were extracted, and then alignments were performed to align each peak across each sample. Processing, isotope peak removal, inter-sample peak intensity correction, and noise removal are performed to obtain analytical data for 431 components. The method for peak intensity correction between samples is not particularly limited, but examples thereof include the pooled QC method and correction using an internal standard substance. In the pooled QC method, a sample called pooled QC is prepared by mixing a constant amount from all samples in the same batch, and pooled QC is analyzed at a constant frequency (about once every 5 to 9 times) between each sample. By performing the process of calculating the estimated value of ``what will happen to each peak intensity assuming that the QC sample was analyzed when each sample was analyzed'' and correcting it with that value This is to correct the sensitivity between each sample. Correction using an internal standard substance was performed by correcting the peak area value of an internal standard substance (lidocaine, 10-camphorsulfonic acid, etc.) added in the same amount to each sample, thereby correcting the sensitivity between samples. It is something to do.
The data correction method does not significantly affect the correlation with yield and the performance of the prediction model.

また、取得した125個の葉中431成分の分析データと対応する収量データとの相関
解析を行った結果(各成分の分析データのピーク面積と収量との単相関係数r及び無相関
の検定によりp値を算出)、一定の成分は収量と有意に相関することが示された(後記表
3a~3f参照)。
In addition, the results of correlation analysis between the analytical data of 431 components in the obtained 125 leaves and the corresponding yield data (the single correlation coefficient r between the peak area of the analytical data of each component and the yield and the test of uncorrelation p-values were calculated by ), and certain components were shown to be significantly correlated with yield (see Tables 3a-3f below).

したがって、431成分のうち、本発明における分析対象成分としては、収量との相関
が有意(p<0.05)かつ相関係数の絶対値|r|>0.51である成分、すなわち成分
No.13、14、17、20、21、22、23、28、35、36、37、39、4
1、42、44、47、48、51、52、54、57、58、68、71、73、80
、85、86、90、91、96、98、99、100、107、108、110、12
2、125、131、134、135、137、139、142、149、150、15
3、157、159、160、161、171、174、176、179、181、18
2、188、202、208、209、214、215、217、218、228、23
0、235、244、245、246、247、249、251、252、253、26
1、264、268、275、278、279、280、282、283、284、28
8、294、296、298、299、305、308、310、313、317、32
5、327、329、330、341、347、353、355、356、363、36
7、369、370、384、389、395、421、422、423、428及び4
31から選ばれる1種以上を含むのが好ましい。なお、上記成分は、後述のVIP値が全
て1.16以上であり、1.30以上であれば、相関係数の絶対値|r|>0.51であっ
た。
Therefore, among the 431 components, as the component to be analyzed in the present invention, the component that has a significant correlation with the yield (p < 0.05) and the absolute value of the correlation coefficient |r|> 0.51, that is, component No. . 13, 14, 17, 20, 21, 22, 23, 28, 35, 36, 37, 39, 4
1, 42, 44, 47, 48, 51, 52, 54, 57, 58, 68, 71, 73, 80
, 85, 86, 90, 91, 96, 98, 99, 100, 107, 108, 110, 12
2, 125, 131, 134, 135, 137, 139, 142, 149, 150, 15
3, 157, 159, 160, 161, 171, 174, 176, 179, 181, 18
2, 188, 202, 208, 209, 214, 215, 217, 218, 228, 23
0, 235, 244, 245, 246, 247, 249, 251, 252, 253, 26
1, 264, 268, 275, 278, 279, 280, 282, 283, 284, 28
8, 294, 296, 298, 299, 305, 308, 310, 313, 317, 32
5, 327, 329, 330, 341, 347, 353, 355, 356, 363, 36
7, 369, 370, 384, 389, 395, 421, 422, 423, 428 and 4
It preferably contains one or more selected from 31. All of the above components had a VIP value of 1.16 or more, which will be described later. If the VIP value was 1.30 or more, the absolute value of the correlation coefficient |r|>0.51.

更に431成分のうち、本発明における分析対象成分としては、収量との相関が有意(
p<0.05)かつ相関係数の絶対値|r|>0.63である成分、すなわち成分No.1
4、22、23、36、37、41、42、51、52、68、90、122、139、
149、159、214、228、230、235、247、249、252、253、
268、275、278、284、288、298、305、308、313、317、
329、347、363、395、421、422及び428から選ばれる1種以上を含
むのがより好ましい。なお、上記成分は、後述のVIP値が全て1.522以上であり、
1.62以上であれば、相関係数の絶対値|r|>0.63であった。
Furthermore, among the 431 components, as the component to be analyzed in the present invention, the correlation with the yield is significant (
p<0.05) and the absolute value of the correlation coefficient |r|>0.63, that is, component No. 1
4, 22, 23, 36, 37, 41, 42, 51, 52, 68, 90, 122, 139,
149, 159, 214, 228, 230, 235, 247, 249, 252, 253,
268, 275, 278, 284, 288, 298, 305, 308, 313, 317,
More preferably, it contains one or more selected from 329, 347, 363, 395, 421, 422 and 428. All the above components have a VIP value of 1.522 or more, which will be described later.
If it is 1.62 or more, the absolute value of the correlation coefficient |r|>0.63.

更に431成分のうち、本発明における分析対象成分としては、収量との相関が有意(
p<0.05)かつ相関係数の絶対値|r|>0.66である成分、すなわち成分No.1
4、23、36、37、41、51、68、90、122、149、214、230、2
35、247、249、252、275、284、298、305、308、313、3
17、347、363、421、422及び428から選ばれる1種以上を含むのがより
好ましい。なお、上記成分は、後述のVIP値が全て1.59以上であり、1.652以
上であれば、相関係数の絶対値|r|>0.66であった。
Furthermore, among the 431 components, as the component to be analyzed in the present invention, the correlation with the yield is significant (
p<0.05) and the absolute value of the correlation coefficient |r|>0.66, that is, component No. 1
4, 23, 36, 37, 41, 51, 68, 90, 122, 149, 214, 230, 2
35, 247, 249, 252, 275, 284, 298, 305, 308, 313, 3
More preferably, one or more selected from 17, 347, 363, 421, 422 and 428 are included. All of the above components had a VIP value of 1.59 or more, which will be described later, and if the VIP value was 1.652 or more, the absolute value of the correlation coefficient |r|>0.66.

表1a~1cでは、431の成分を質量分析により得られる精密質量で規定しているが
、これらの精密質量データから化合物の組成式を推定することができる。また、分析時に
同時に取得しているMS/MSデータからは、化合物の部分構造情報が得られる。よって
、組成式と部分構造情報から、対象の成分を推定することができ、更に試薬との比較が可
能なものについては同定することができる。
In Tables 1a to 1c, 431 components are defined by accurate mass obtained by mass spectrometry, and the compositional formula of the compound can be estimated from these accurate mass data. Moreover, partial structural information of the compound can be obtained from the MS/MS data acquired at the same time as the analysis. Therefore, from the compositional formula and the partial structure information, the target component can be estimated, and those that can be compared with the reagent can be identified.

例えば、431成分のうち、解析の結果同定されたものとしては以下が挙げられる。成
分No.10は4-クマル酸、成分No.68、90、122及び308は同一成分であり
、その組成式がC212211で示され、アグリコンの組成式がC1512
デヒドロフラボノールにグルコースが結合したモノグルコシド体、成分No.92はプル
ニン(ナリンゲニン7-O-グルコシド)、成分No.119は組成式C1510
であるフラボノイド、成分No.139はその組成式がC212212で示され、ア
グリコンの組成式がC1512であるデヒドロフラボノールにグルコースが結合し
たモノグルコシド体、成分No.277はその組成式がC263010で示される組
成式C1510のフラボノイドのプレニル化体、成分No.295は組成式C15
10のフラボノールにグルコースとラムノースが結合したジグリコシド体、成分N
o.296及び成分No.395は同一成分であり、その組成式がC334019で示
され、アグリコンの組成式がC1510のフラボノールにグルコース1個とラムノ
ース2個が結合したトリグリコシド体、成分No.302は組成式C213610
示されゲラニオールにグルコースとアラビノースが結合したジグリコシド体、成分No.
429はソヤサポニンβgと推定した。また試薬との一致から、成分No.76はダイゼ
イン、成分No.89はゲニステイン、成分No.276はゲニスチン、成分No.399
はマロニルゲニスチン、そして成分No.421及び成分No.422は同一成分でソヤサ
ポニンBbであると同定された。
For example, among the 431 components, those identified as a result of analysis include the following. Component No. 10 is 4-coumaric acid, Component Nos. 68, 90, 122 and 308 are the same component, the composition formula of which is C 21 H 22 O 11 , and the composition formula of the aglycon is C 15 H 12 O. Monoglucoside in which glucose is bound to the dehydroflavonol of No. 6 , Component No. 92 is prunin (naringenin 7-O-glucoside), Component No. 119 has the compositional formula C 15 H 10 O 6
The flavonoid, Component No. 139, has a composition formula of C 21 H 22 O 12 , and a monoglucoside in which glucose is bound to dehydroflavonol whose aglycone composition formula is C 15 H 12 O 7 , Component No. 277 is a prenylated flavonoid of the composition formula C 15 H 10 O 5 whose composition formula is C 26 H 30 O 10 , component No. 295 is a composition formula C 15
Diglycoside in which glucose and rhamnose are bound to the flavonol of H 10 O 6 , Component N
No. 296 and component No. 395 are the same component, the composition formula of which is shown by C 33 H 40 O 19 , and the composition formula of the aglycon is C 15 H 10 O 6 flavonol with one glucose and two rhamnose. The bound triglycoside, component No. 302 is a diglycoside, component No. 302, represented by the compositional formula C 21 H 36 O 10 , in which glucose and arabinose are bound to geraniol.
429 was presumed to be soyasaponin βg. Also, from the coincidence with the reagent, component No. 76 is daidzein, component No. 89 is genistein, component No. 276 is genistin, and component No. 399.
was identified as malonylgenistin, and component No. 421 and component No. 422 are the same component and are soyasaponin Bb.

このうち、本発明における分析対象成分として、好ましくは収量との相関が有意(p<
0.05)かつ相関係数の絶対値|r|>0.51である成分、例えばソヤサポニンBb;
組成式がC212211で示され、アグリコンの組成式がC1512のデヒド
ロフラボノールにグルコースが結合したモノグルコシド体;組成式がC334019
で示され、アグリコンの組成式がC1510のフラボノールにグルコース1個とラ
ムノース2個が結合したトリグリコシド体;組成式がC212212で示され、アグ
リコンの組成式がC1512であるデヒドロフラボノールにグルコースが結合した
モノグルコシド体等が挙げられる。
Among these, as the component to be analyzed in the present invention, preferably the correlation with the yield is significant (p <
0.05) and the absolute value of the correlation coefficient |r|>0.51, such as soyasaponin Bb;
A monoglucoside in which glucose is bound to dehydroflavonol having a composition formula of C 21 H 22 O 11 and an aglycone composition formula of C 15 H 12 O 6 ; a composition formula of C 33 H 40 O 19
A triglycoside in which one glucose and two rhamnose are bound to a flavonol of C 15 H 10 O 6 ; Examples include monoglucosides in which glucose is bound to dehydroflavonol, which is C 15 H 12 O 7 .

ダイズの収量の予測手段は、上記431の成分、好ましくは収量との相関が有意(p<
0.05)かつ相関係数の絶対値|r|>0.51である成分、より好ましくは有意(p<
0.05)かつ相関係数の絶対値|r|>0.63である成分、更に好ましくは有意(p<
0.05)かつ相関係数の絶対値|r|>0.66である成分の存在量、例えば相関係数が
-0.777である精密質量m/z473.1087のピーク面積を予測したいサンプル
についても測定し、既知の収量とピーク面積との相関関係から収量値を推定することがで
きる。
The soybean yield prediction means is that the above 431 components, preferably the correlation with yield is significant (p <
0.05) and the absolute value of the correlation coefficient |r|>0.51, more preferably significant (p<
0.05) and the absolute value of the correlation coefficient |r|>0.63, more preferably significant (p<
0.05) and the absolute value of the correlation coefficient |r|>0.66, e.g. is also measured and the yield value can be estimated from the correlation between known yield and peak area.

また、上記431成分の分析データから複数を使用し、多変量解析手法を用いて構築さ
れた収量予測モデルと照合することにより、収量を予測することができる。
すなわち、播種から所定期間経過後のダイズの葉を採取し、分析サンプルを得、該分析
サンプルを機器分析に供して機器分析データを得、該機器分析データを、収量予測モデル
と照合することにより、当該ダイズの収量を予測することができる。
In addition, the yield can be predicted by using a plurality of analytical data of the above 431 components and comparing them with a yield prediction model constructed using a multivariate analysis method.
That is, by collecting soybean leaves after a predetermined period of time from sowing, obtaining an analysis sample, subjecting the analysis sample to instrumental analysis to obtain instrumental analysis data, and comparing the instrumental analysis data with a yield prediction model , the yield of the soybean can be predicted.

収量予測モデルは、説明変数に各精密質量をもった補正済みの成分の分析データのピー
ク面積値を、また目的変数に収量値を用いた回帰分析を行うことにより構築できる。回帰
分析法としては、例えば主成分回帰分析、PLS(Partial least squares projection t
o latent structures)回帰分析、OPLS(Orthogonal projections to latent struct
ures)回帰分析、一般化線形回帰分析の他、バギング、サポートベクターマシン、ランダ
ムフォレスト、ニューラルネットワーク回帰分析等の機械学習・回帰分析手法等の多変量
回帰分析手法が挙げられる。このうち、PLS法、PLS法の改良版であるOPLS法、
或いは機械学習・回帰分析手法を用いるのが好ましい。OPLS法は、PLS法に比べ予
測性は同じだが、解釈のための視覚化がより容易になる点が今回のような目的においては
優れている。PLS法及びOPLS法は、共に高次元のデータから情報を集約し少数の潜
在変数に置き換え、その潜在変数を用いて目的変数を表現する方法である。潜在変数の数
を適切に選ぶことが重要であり、潜在変数の数を決めるのによく利用されるのがクロスバ
リデーション(交差検証)である。すなわち、モデル構築用データをいくつかのグループ
に分割し、あるグループをモデル検証に、その他のグループをモデル構築に用いて予測誤
差を見積り、この作業を、グループを入れ替えながら繰り返して、予測誤差の合計が最小
となる潜在変数の数が選ばれる。
The yield prediction model can be constructed by performing regression analysis using the peak area values of the corrected analytical data of the components having each accurate mass as the explanatory variables and the yield values as the objective variables. As a regression analysis method, for example, principal component regression analysis, PLS (Partial least squares projection t
o latent structures) regression analysis, OPLS (Orthogonal projections to latent struct
ures) regression analysis, generalized linear regression analysis, bagging, support vector machine, random forest, neural network regression analysis and other machine learning/regression analysis techniques, and other multivariate regression analysis techniques. Among these, the PLS method, the OPLS method which is an improved version of the PLS method,
Alternatively, it is preferable to use machine learning/regression analysis techniques. The OPLS method has the same predictability as the PLS method, but is superior for purposes such as the present in that it is easier to visualize for interpretation. Both the PLS method and the OPLS method are methods of aggregating information from high-dimensional data, replacing it with a small number of latent variables, and using the latent variables to express objective variables. It is important to select an appropriate number of latent variables, and cross-validation is often used to determine the number of latent variables. That is, divide the model building data into several groups, use some groups for model validation and other groups for model building to estimate the forecast error, and repeat this process while switching groups to obtain the forecast error. The number of latent variables with the smallest sum is chosen.

予測モデルの評価は、主に2つの指標で判断される。1つは予測精度を表すR、もう
1つは予測性を表すQである。Rは予測モデル構築に使用したデータの実測値とモデ
ルで計算した予測値との相関係数の2乗であり、1に近いほど予測精度が高いことを示し
ている。一方、Qは、上記クロスバリデーションの結果であり、実測値と、繰り返し実
施したモデル検証の結果である予測値との相関係数の2乗を表している。本発明のダイズ
収量予測モデルにおいては、Q>0.50をモデル評価の基準とするのがこの好ましい
。なお、常にR>Qとなるため、Q>0.50は同時にR>0.50を満たすこ
ととなる。
以下に、上記431成分の全て又はその一部の分析データのピーク面積値と、子実収量
を用いた種々のダイズ収量予測モデルを作成しその精度を検証した結果を示す。このうち
OPLSモデルについてはQ>0.50となるモデルは好ましく使用できる。
Evaluation of the prediction model is mainly judged by two indexes. One is R 2 representing prediction accuracy and the other is Q 2 representing predictability. R2 is the square of the correlation coefficient between the measured values of the data used to construct the prediction model and the predicted values calculated by the model, and the closer to 1, the higher the prediction accuracy. On the other hand, Q2 is the result of the above cross-validation, and represents the square of the correlation coefficient between the measured value and the predicted value, which is the result of repeated model verification. In the soybean yield prediction model of the present invention, it is preferable to use Q 2 >0.50 as a criterion for model evaluation. Since R 2 >Q 2 is always satisfied, Q 2 >0.50 simultaneously satisfies R 2 >0.50.
Below, various soybean yield prediction models were created using the peak area values of the analysis data of all or part of the above 431 components and the grain yield, and the results of verifying their accuracy are shown. Of these, the OPLS model can preferably use the model that satisfies Q 2 >0.50.

(1)431個の全ての成分情報を用いた収量予測モデルの構築
1データ当り431個の成分の分析データのピーク面積値と収量値を持つ全125個の
データマトリックスからOPLSモデル(図1)を構築した。なお、構築の際は、各成分
の分析データのピーク面積値及び収量データはオートスケーリングにより平均0、分散1
に変換した。R=0.87、Q=0.78であり、高い予測性能を持つモデルといえ
る。
上記モデルではVIP(Variable Importance in the P
rojection, 投影における変数重要性)値とよばれる各成分に与えられるモデル
性能への寄与度が算出される。
VIP値は、下記式1により求められる。
(1) Construction of yield prediction model using all 431 component information OPLS model from all 125 data matrices with peak area values and yield values of analytical data of 431 components per data (Fig. 1) built. In addition, when constructing, the peak area value and yield data of the analysis data of each component are autoscaled to an average of 0 and a variance of 1
converted to With R 2 =0.87 and Q 2 =0.78, the model can be said to have high prediction performance.
VIP (Variable Importance in the P
The contribution to model performance given to each component, called projection (variable importance in projection) value, is calculated.
The VIP value is obtained by Equation 1 below.

Figure 2023090795000004
Figure 2023090795000004

VIP値はその値が大きいほどモデルへの寄与度が大きく、相関係数の絶対値とも相関
する。VIP値のリストを後記表4a~4fに示す。
The larger the VIP value, the greater the degree of contribution to the model, and the absolute value of the correlation coefficient is also correlated. A list of VIP values is shown in Tables 4a-4f below.

(2)(1)のモデルから算出されたVIP値の上位97個の成分の分析データを用いて
構築された機械学習モデル
解析ツールとして、Visual Mining Studio(以降、VMSと表記、
(株)NTTデータ数理システム)を使用した。
(2-1)1データ当たりVIP値上位97個の成分の分析データのピーク面積値と収
量値を持ち、全125個のデータマトリックスを学習データとしてVMSにとりこみモデ
ル(ランダムフォレスト)(図2)を構築した。Rは0.92であった。
(2) Visual Mining Studio (hereinafter referred to as VMS,
NTT Data Mathematical Systems Co., Ltd.) was used.
(2-1) A model (random forest) that has the peak area value and yield value of the analysis data of the 97 components with the highest VIP values per data, and incorporates all 125 data matrices into VMS as learning data (Fig. 2) built. R2 was 0.92.

(2-2)1データ当たりVIP値上位97個の成分の分析データのピーク面積値と収
量値を持ち、全125個のデータマトリックスをランダムに2群(学習用と検証用)に分
割し、一方の63個のマトリクスデータを学習用として用いてVMSでモデル(ニューラ
ルネットワーク)(図3)を構築した。Rは0.83であった。なお、検証用データに
おけるRは0.58であり、良好な予測性能を持つモデルといえる。
(2-2) Each data has peak area values and yield values of the analysis data of the 97 components with the highest VIP values, and all 125 data matrices are randomly divided into two groups (for learning and for verification), Using one of the 63 matrix data for learning, a model (neural network) (Fig. 3) was constructed by VMS. R2 was 0.83. R2 in the verification data is 0.58, and it can be said that the model has good prediction performance.

(3)(1)のモデルから算出されたVIP値を指標としたモデル構築(2個以上の成分
の分析データを用いたモデル)
(3-1)VIP値が下位の成分の分析データを用いたモデル
VIP値11位以下全ての成分の分析データ、21位以下全ての成分の分析データ、3
1位以下全ての成分の分析データ・・・及び351位以下全ての成分の分析データを用い
てOPLS法によりモデル(図4)を構築した。
>0.50を満たすのは11位以下全ての成分の分析データ~251位以下全ての
成分の分析データを用いたモデルである。VIP値261位以下の成分の分析データ全て
を用いてもQ>0.50とはならない。
(3) Building a model using the VIP value calculated from the model in (1) as an index (model using analysis data of two or more components)
(3-1) Model using analysis data of components with lower VIP values Analysis data of all components below VIP value 11th, Analysis data of all components below 21st, 3
A model (FIG. 4) was constructed by the OPLS method using the analysis data of all components below the 1st position and the analysis data of all the components below the 351st position.
A model that satisfies Q 2 >0.50 is a model that uses analytical data of all components from 11th to 251st. Q 2 >0.50 is not obtained even if all analytical data of components with VIP values of 261st and lower are used.

(3-2)VIP値上位10位までの成分の分析データを2個用いたモデル
VIP値上位1位から10位までの成分の分析データの内、任意の2個の組み合わせ(
45通り)についてOPLS法によりモデル(図5)を構築した。
いずれのモデルにおいてもQ>0.50となる。
(3-2) Model using two pieces of analysis data of components with the top 10 VIP values Any combination of two of the analysis data of components with the top 1 to 10 VIP values (
45 patterns) were constructed by the OPLS method (Fig. 5).
Q 2 >0.50 in any model.

(3-3)VIP値を基に連続する2個の成分の分析データを用いたモデル
VIP値上位1位と2位、11位と12位、21位と22位、・・・及び201位と2
02位の成分の分析データを用いてOPLS法によりモデル(図6)を構築した。
VIP値30位以上の中から選ばれる任意の2個の成分の分析データを用いて作成した
モデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-3) Model using analysis data of two consecutive components based on VIP value VIP value top 1st and 2nd, 11th and 12th, 21st and 22nd, … and 201st and 2
A model (FIG. 6) was constructed by the OPLS method using the analytical data of the 02-position component.
If the model is created using the analytical data of any two components selected from the top 30 VIP values, the value of Q 2 is often Q 2 >0.50.

(3-4)VIP値を基に連続する3個の成分の分析データを用いたモデル
VIP値上位1位と2位と3位、11位と12位と13位、21位と22位と23位、
・・・及び221位と222位と223位の成分の分析データを用いてOPLS法により
モデル(図7)を構築した。
VIP値70位以上の中から選ばれる任意の3個の成分の分析データを用いて作成した
モデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-4) Model using analysis data of three consecutive components based on VIP value VIP value top 1st, 2nd and 3rd, 11th, 12th and 13th, 21st and 22nd 23rd place,
A model (Fig. 7) was constructed by the OPLS method using the analysis data of the components at positions 221, 222 and 223.
If the model is created using the analytical data of any three components selected from VIP values of 70 or higher, the value of Q 2 is often Q 2 >0.50.

(3-5)VIP値を基に連続する4個の成分の分析データを用いたモデル
VIP値上位1位と2位と3位と4位、11位と12位と13位と14位、21位と2
2位と23位と24位、・・・及び221位と222位と223位と224位の成分の分
析データを用いてOPLS法によりモデル(図8)を構築した。
VIP値100位以上の中から選ばれる任意の4個の成分の分析データを用いて作成し
たモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-5) Model using analysis data of four consecutive components based on VIP value VIP value top 1st, 2nd, 3rd and 4th, 11th, 12th, 13th and 14th, 21st and 2nd place
A model (FIG. 8) was constructed by the OPLS method using analytical data for components at positions 2, 23, 24, .
If the model is created using the analysis data of any four components selected from the top 100 VIP values, the value of Q 2 is often Q 2 >0.50.

(3-6)VIP値を基に連続する5個の成分の分析データを用いたモデル
VIP値上位1位~5位、11位~15位、21位~25位、・・・及び251位~2
55位の成分の分析データを用いてOPLS法によりモデル(図9)を構築した。
VIP値100位以上の中から選ばれる任意の5個の成分の分析データを用いて作成し
たモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-6) Model using analysis data of five consecutive components based on VIP value VIP value top 1st to 5th, 11th to 15th, 21st to 25th, … and 251st ~2
A model (Fig. 9) was constructed by the OPLS method using the analytical data of the 55th component.
If the model is created using the analysis data of any five components selected from the top 100 VIP values, the value of Q 2 is often Q 2 >0.50.

(3-7)VIP値を基に連続する6個の成分の分析データを用いたモデル
VIP値上位1位~6位、11位~16位、21位~26位、・・・及び281位~2
86位の成分の分析データを用いてOPLS法によりモデル(図10)を構築した。
VIP値130位以上の中から選ばれる任意の6個の成分の分析データを用いて作成し
たモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-7) Model using analysis data of 6 consecutive components based on VIP value VIP value top 1st to 6th, 11th to 16th, 21st to 26th, … and 281st ~2
A model (Fig. 10) was constructed by the OPLS method using the analytical data of the 86th component.
If the model is created using the analysis data of arbitrary six components selected from VIP values 130 or higher, the value of Q 2 is often Q 2 >0.50.

(3-8)VIP値を基に連続する7個の成分の分析データを用いたモデル
VIP値上位1位~7位、11位~17位、21位~27位、・・・及び281位~2
87位の成分の分析データを用いてOPLS法によりモデル(図11)を構築した。
VIP値140位以上の中から選ばれる任意の7個の成分の分析データを用いて作成し
たモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-8) Model using analysis data of 7 consecutive components based on VIP value VIP value top 1st to 7th, 11th to 17th, 21st to 27th, … and 281st ~2
A model (FIG. 11) was constructed by the OPLS method using the analytical data of the 87th component.
If the model is created using the analysis data of any seven components selected from VIP values of 140 or higher, the value of Q 2 is often Q 2 >0.50.

(3-9)VIP値を基に連続する8個の成分の分析データを用いたモデル
VIP値上位1位~8位、11位~18位、21位~28位、・・・及び281位~2
88位の成分の分析データを用いてOPLS法によりモデル(図12)を構築した。
VIP値140位以上の中から選ばれる任意の8個の成分の分析データを用いて作成し
たモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-9) Model using analysis data of 8 consecutive components based on VIP value VIP value top 1st to 8th, 11th to 18th, 21st to 28th, … and 281st ~2
A model (FIG. 12) was constructed by the OPLS method using the analytical data of the 88th component.
If the model is created using the analysis data of arbitrary eight components selected from VIP values of 140 or higher, the value of Q 2 is often Q 2 >0.50.

(3-10)VIP値を基に連続する9個の成分の分析データを用いたモデル
VIP値上位1位~9位、11位~19位、21位~29位、・・・及び281位~2
89位の成分の分析データを用いてOPLS法によりモデル(図13)を構築した。
VIP値140位以上の中から選ばれる任意の9個の成分の分析データを用いて作成し
たモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-10) Model using analysis data of 9 consecutive components based on VIP value VIP value top 1st to 9th, 11th to 19th, 21st to 29th, … and 281st ~2
A model (FIG. 13) was constructed by the OPLS method using the analytical data of the 89th component.
If the model is created using the analytical data of 9 arbitrary components selected from the 140th or higher VIP value, the value of Q 2 is often Q 2 >0.50.

(3-11)VIP値を基に連続する10個の成分の分析データを用いたモデル
VIP値上位1位~10位、11位~20位、21位~30位、・・・及び281位~
290位の成分の分析データを用いてOPLS法によりモデルを構築(図14)した。
VIP値160位以上の中から選ばれる任意の10個の成分の分析データを用いて作成
したモデルであれば、Qの値がQ>0.50となるモデルが多い。
(3-11) Model using analysis data of 10 consecutive components based on VIP value VIP value top 1st to 10th, 11th to 20th, 21st to 30th, … and 281st ~
A model was constructed by the OPLS method using the analysis data of the 290th component (Fig. 14).
If the model is created using the analysis data of any 10 components selected from VIP values 160 or higher, the value of Q 2 is often Q 2 >0.50.

予測に用いる成分数は、簡便に予測を行う場合には、成分数が少ない方が好適であり、
例えば、10個以下であり、好ましくは5個以下、より好ましくは3個以下、最も好まし
くは1個である。また、精度を高めたい場合には、成分数が多い方が好適であり、例えば
、11個以上、好ましくは20個以上、より好ましくは50個以上、より好ましくは90
個以上、最も好ましくは97個である。少ない成分数にて予測する場合は、VIP値上位
の成分又は相関係数のより高い成分を予測に用いることが好ましい。
The number of components used for prediction is preferably as small as possible for easy prediction,
For example, it is 10 or less, preferably 5 or less, more preferably 3 or less, and most preferably 1. In order to improve the accuracy, the number of components is preferably large, for example, 11 or more, preferably 20 or more, more preferably 50 or more, more preferably 90
1 or more, most preferably 97. When prediction is performed using a small number of components, it is preferable to use components with higher VIP values or components with higher correlation coefficients for prediction.

(4)431個から選抜された一部の成分情報を用いた収量予測モデルの構築
表3a~fの全431個の成分ピークを用いる他に、その中から選抜された成分ピーク
を用いることによっても精度の高い予測モデルを構築することができる。
例えば、表3a~fの全431個の成分ピークの内、ピークの形状やサンプル間の平均
的な検出強度等を考慮した301個の成分のピークデータを選抜し、この成分ピークを適
宜補正して同様にOPLSモデルを構築し、更に構築されたモデルのVIP値を算出して
(後記表6a~6d)、その上位100成分(下記)の分析データを用いて予測モデルを
構築すると、予測精度を示すR=0.82、予測性を示すQ=0.78である精度の
高いモデルが構築できる(後記実施例では予測モデルAと称する、図15)。
<予測モデルAにおけるVIP値の上位100位の成分番号>
7、15、17、20、21、22、23、35、37、39、42、44、51、5
4、57、58、68、71、73、80、85、86、90、93、95、108、1
16、122、131、139、149、153、157、158、160、161、1
65、171、176、179、187、208、214、223、227、233、2
37、245、252、253、261、278、279、282、283、284、2
94、298、299、300、304、305、308、309、310、313、3
16、317、318、320、325、327、328、329、330、331、3
52、353、355、356、357、358、359、362、363、367、3
80、381、385、388、389、390、392、395、396、399、4
21、422、428、431。
(4) Building a yield prediction model using some component information selected from 431 In addition to using all 431 component peaks in Tables 3a to f, by using component peaks selected from them It is also possible to construct a highly accurate prediction model.
For example, among all 431 component peaks in Tables 3a to f, peak data of 301 components are selected in consideration of peak shape, average detection intensity between samples, etc., and this component peak is corrected as appropriate. Similarly, construct an OPLS model, calculate the VIP value of the constructed model (Tables 6a to 6d below), and construct a prediction model using the analysis data of the top 100 components (below). A highly accurate model with R 2 =0.82 indicating predictability and Q 2 =0.78 indicating predictability can be constructed (referred to as prediction model A in the examples below, FIG. 15).
<Top 100 VIP value component numbers in prediction model A>
7, 15, 17, 20, 21, 22, 23, 35, 37, 39, 42, 44, 51, 5
4, 57, 58, 68, 71, 73, 80, 85, 86, 90, 93, 95, 108, 1
16, 122, 131, 139, 149, 153, 157, 158, 160, 161, 1
65, 171, 176, 179, 187, 208, 214, 223, 227, 233, 2
37, 245, 252, 253, 261, 278, 279, 282, 283, 284, 2
94, 298, 299, 300, 304, 305, 308, 309, 310, 313, 3
16, 317, 318, 320, 325, 327, 328, 329, 330, 331, 3
52, 353, 355, 356, 357, 358, 359, 362, 363, 367, 3
80, 381, 385, 388, 389, 390, 392, 395, 396, 399, 4
21, 422, 428, 431.

本発明の態様及び好ましい実施態様を以下に示す。
<1>ダイズから採取された葉サンプルから1以上の成分の分析データを取得し、当該
データとダイズ収量との相関性を利用してダイズの収量を予測する、ダイズの収量予測方
法。
<2>前記1以上の成分の分析データをpooled QC法により補正する、<1>
に記載の方法。
<3>前記1以上の成分の分析データを内部標準物質により補正する、<1>に記載の
方法。
<4>前記成分が、質量分析により提供される精密質量(m/z)が139~1156
である成分から選ばれる1種以上である、<1>~<3>のいずれかに記載の方法。
<5>前記成分が、質量分析により提供される精密質量(m/z)で規定された、前記
表1a~1cに記載の成分から選ばれる1種以上である、<1>~<3>のいずれかに記
載の方法。
<6>成分が、前記表1a~1cに記載の成分No.13、14、17、20、21、
22、23、28、35、36、37、39、41、42、44、47、48、51、5
2、54、57、58、68、71、73、80、85、86、90、91、96、98
、99、100、107、108、110、122、125、131、134、135、
137、139、142、149、150、153、157、159、160、161、
171、174、176、179、181、182、188、202、208、209、
214、215、217、218、228、230、235、244、245、246、
247、249、251、252、253、261、264、268、275、278、
279、280、282、283、284、288、294、296、298、299、
305、308、310、313、317、325、327、329、330、341、
347、353、355、356、363、367、369、370、384、389、
395、421、422、423、428及び431から選ばれる1種以上である<5>
に記載の方法。
<7>成分が、前記表1a~1cに記載の成分No.14、22、23、36、37、
41、42、51、52、68、90、122、139、149、159、214、22
8、230、235、247、249、252、253、268、275、278、28
4、288、298、305、308、313、317、329、347、363、39
5、421、422及び428から選ばれる1種以上である<5>に記載の方法。
<8>成分が、前記表1a~1cに記載の成分No.14、23、36、37、41、
51、68、90、122、149、214、230、235、247、249、252
、275、284、298、305、308、313、317、347、363、421
、422及び428から選ばれる1種以上である<5>に記載の方法。
<9>成分が、ソヤサポニンBb;組成式がC212211で示され、アグリコン
の組成式がC1512のデヒドロフラボノールにグルコースが結合したモノグルコ
シド体;組成式がC334019で示され、アグリコンの組成式がC1510
のフラボノールにグルコース1個とラムノース2個が結合したトリグリコシド体;及び組
成式がC212212で示され、アグリコンの組成式がC1512であるデヒ
ドロフラボノールにグルコースが結合したモノグルコシド体から選ばれる1種以上を含む
、<5>に記載の方法。
<10>葉サンプルが、初生葉展開期から子実肥大期のダイズから採取される、<1>
~<9>のいずれかに記載の方法。
<11>葉サンプルが、初生葉展開期から開花期までのダイズから採取される、<1>
~<9>のいずれかに記載の方法。
<12>分析データが、質量分析データである<1>~<11>のいずれかに記載の方
法。
<13>葉サンプルから取得された成分の分析データを、前記表1a~1cに記載の成
分の分析データを用いて構築された収量予測モデルと照合する工程を含む、<5>~<1
2>のいずれかに記載の方法。
<14>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位10個の中から少なくとも2個を用いる、<
13>に記載の方法。
<15>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位22個の中から少なくとも2個を用いる、<
13>に記載の方法。
<16>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位63個の中から少なくとも3個を用いる、<
13>に記載の方法。
<17>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位94個の中から少なくとも4個を用いる、<
13>に記載の方法。
<18>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位95個の中から少なくとも5個を用いる、<
13>に記載の方法。
<19>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位126個の中から少なくとも6個を用いる、
<13>に記載の方法。
<20>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位137個の中から少なくとも7個を用いる、
<13>に記載の方法。
<21>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位138個の中から少なくとも8個を用いる、
<13>に記載の方法。
<22>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位139個の中から少なくとも9個を用いる、
<13>に記載の方法。
<23>収量予測モデルが、前記表1a~1cに記載の成分情報を用いて構築された収
量予測モデルから算出されたVIP値の上位160個の中から少なくとも10個を用いる
、<13>に記載の方法。
<24>VIP値が、前記表1a~1cに記載の成分全ての成分情報を用いて構築され
た収量予測モデルによって算出される、<14>~<23>のいずれかに記載の方法。
<25>葉サンプルから取得された成分の分析データを、前記表A1a~1cに記載の
成分から選抜された後記表A6a~A6dに記載の成分の分析データを用いて構築された
収量予測モデルと照合する工程を含む、<5>に記載の方法。
<26>葉サンプルから取得された成分の分析データを、前記表A1a~1cに記載の
成分から選抜された下記の100成分の分析データを用いて構築された収量予測モデルと
照合する工程を含む、<5>に記載の方法、
成分No.7、15、17、20、21、22、23、35、37、39、42、44
、51、54、57、58、68、71、73、80、85、86、90、93、95、
108、116、122、131、139、149、153、157、158、160、
161、165、171、176、179、187、208、214、223、227、
233、237、245、252、253、261、278、279、282、283、
284、294、298、299、300、304、305、308、309、310、
313、316、317、318、320、325、327、328、329、330、
331、352、353、355、356、357、358、359、362、363、
367、380、381、385、388、389、390、392、395、396、
399、421、422、428、431。
<27>葉サンプルが、初生葉展開期から子実肥大期のダイズから採取される、<25
>又は<26>に記載の方法。
<28>葉サンプルが、初生葉展開期から開花期までのダイズから採取される、<25
>又は<26>に記載の方法。
<29>分析データが、質量分析データである<25>~<28>のいずれかに記載の
方法。
<30>収量予測モデルが、OPLS法を用いて構築されたモデルである<13>~<
29>のいずれかに記載の方法。
<31>収量予測モデルが、機械学習・回帰分析手法を用いて構築されたモデルである
<13>~<29>のいずれかに記載の方法。
<32>精密質量が小数点以下4桁以上の精度にて測定されたものである<4>~<3
1>のいずれかに記載の方法。
Aspects and preferred embodiments of the present invention are presented below.
<1> A method for predicting soybean yield, comprising obtaining analysis data of one or more components from a leaf sample collected from soybean, and predicting soybean yield using the correlation between the data and soybean yield.
<2> Correct the analysis data of the one or more components by pooled QC method, <1>
The method described in .
<3> The method according to <1>, wherein the analysis data of the one or more components are corrected with an internal standard substance.
<4> The component has an accurate mass (m/z) of 139 to 1156 provided by mass spectrometry
The method according to any one of <1> to <3>, which is one or more selected from the following components.
<5> The component is one or more selected from the components listed in Tables 1a to 1c, defined by accurate mass (m/z) provided by mass spectrometry, <1> to <3> The method according to any one of
The <6> component is the component No. described in Tables 1a to 1c. 13, 14, 17, 20, 21,
22, 23, 28, 35, 36, 37, 39, 41, 42, 44, 47, 48, 51, 5
2, 54, 57, 58, 68, 71, 73, 80, 85, 86, 90, 91, 96, 98
, 99, 100, 107, 108, 110, 122, 125, 131, 134, 135,
137, 139, 142, 149, 150, 153, 157, 159, 160, 161,
171, 174, 176, 179, 181, 182, 188, 202, 208, 209,
214, 215, 217, 218, 228, 230, 235, 244, 245, 246,
247, 249, 251, 252, 253, 261, 264, 268, 275, 278,
279, 280, 282, 283, 284, 288, 294, 296, 298, 299,
305, 308, 310, 313, 317, 325, 327, 329, 330, 341,
347, 353, 355, 356, 363, 367, 369, 370, 384, 389,
<5> which is one or more selected from 395, 421, 422, 423, 428 and 431
The method described in .
The <7> component is the component No. described in Tables 1a to 1c. 14, 22, 23, 36, 37,
41, 42, 51, 52, 68, 90, 122, 139, 149, 159, 214, 22
8, 230, 235, 247, 249, 252, 253, 268, 275, 278, 28
4, 288, 298, 305, 308, 313, 317, 329, 347, 363, 39
5, 421, 422 and 428. The method according to <5>.
The <8> component is the component No. described in Tables 1a to 1c. 14, 23, 36, 37, 41,
51, 68, 90, 122, 149, 214, 230, 235, 247, 249, 252
, 275, 284, 298, 305, 308, 313, 317, 347, 363, 421
, 422 and 428. The method according to <5>.
The <9> component is soyasaponin Bb; a monoglucoside body having a composition formula of C 21 H 22 O 11 , in which glucose is bound to dehydroflavonol whose aglycone has a composition formula of C 15 H 12 O 6 ; H 40 O 19 and the compositional formula of the aglycone is C 15 H 10 O 6
a triglycoside in which one glucose and two rhamnose are bound to the flavonol of ; The method according to <5>, which contains one or more selected from monoglucoside forms.
<10> A leaf sample is collected from the soybean from the primary leaf development stage to the seed enlargement stage, <1>
The method according to any one of ~<9>.
<11> A leaf sample is taken from the soybean from the primary leaf development stage to the flowering stage, <1>
The method according to any one of ~ <9>.
<12> The method according to any one of <1> to <11>, wherein the analysis data is mass spectrometry data.
<13><5> to <1, including the step of matching the analysis data of the components obtained from the leaf sample with the yield prediction model constructed using the analysis data of the components described in Tables 1a to 1c.
2>.
<14> The yield prediction model uses at least two of the top 10 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c above.
13>.
<15> The yield prediction model uses at least two of the top 22 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c above.
13>.
<16> The yield prediction model uses at least 3 of the top 63 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c above, <
13>.
<17> The yield prediction model uses at least 4 of the top 94 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c above.
13>.
<18> The yield prediction model uses at least 5 of the top 95 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c above, <
13>.
<19> The yield prediction model uses at least 6 out of the top 126 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c.
The method according to <13>.
<20> The yield prediction model uses at least 7 out of the top 137 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c.
The method according to <13>.
<21> The yield prediction model uses at least 8 of the top 138 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c.
The method according to <13>.
<22> The yield prediction model uses at least 9 of the top 139 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c.
The method according to <13>.
<23> The yield prediction model uses at least 10 of the top 160 VIP values calculated from the yield prediction model constructed using the component information listed in Tables 1a to 1c above, <13> described method.
<24> The method according to any one of <14> to <23>, wherein the VIP value is calculated by a yield prediction model constructed using the ingredient information of all the ingredients listed in Tables 1a to 1c.
<25> A yield prediction model constructed using the analysis data of the components obtained from the leaf sample and the analysis data of the components listed in Tables A6a to A6d below selected from the components listed in Tables A1a to 1c above. The method according to <5>, including the step of collating.
<26> Including the step of collating the analysis data of the components obtained from the leaf sample with the yield prediction model constructed using the analysis data of the following 100 components selected from the components listed in Tables A1a to 1c above. , the method described in <5>,
Ingredient no. 7, 15, 17, 20, 21, 22, 23, 35, 37, 39, 42, 44
, 51, 54, 57, 58, 68, 71, 73, 80, 85, 86, 90, 93, 95,
108, 116, 122, 131, 139, 149, 153, 157, 158, 160,
161, 165, 171, 176, 179, 187, 208, 214, 223, 227,
233, 237, 245, 252, 253, 261, 278, 279, 282, 283,
284, 294, 298, 299, 300, 304, 305, 308, 309, 310,
313, 316, 317, 318, 320, 325, 327, 328, 329, 330,
331, 352, 353, 355, 356, 357, 358, 359, 362, 363,
367, 380, 381, 385, 388, 389, 390, 392, 395, 396,
399, 421, 422, 428, 431.
<27> Leaf samples are taken from soybeans from the stage of primary leaf development to the stage of seed enlargement, <25
> or the method according to <26>.
<28> Leaf samples are taken from the soybean from the stage of primary leaf development to the flowering stage, <25
> or the method according to <26>.
<29> The method according to any one of <25> to <28>, wherein the analytical data is mass spectrometry data.
<30> The yield prediction model is a model constructed using the OPLS method <13> ~ <
29>.
<31> The method according to any one of <13> to <29>, wherein the yield prediction model is a model constructed using machine learning/regression analysis techniques.
<32> Accurate mass is measured with an accuracy of 4 digits or more after the decimal point <4> to <3
1>.

1.各栽培試験
2015年から2017年に実施した屋外ポット栽培試験データについて詳述する。試
験は全部で4試験実施した。
1)2015年ポット試験(1):
栃木県内にてポット栽培を実施した。土壌は国内の圃場土を用い、窒素:リン酸:カリ
ウム=3:6:6(Kg/10a)となるように施肥を行い、土壌を耕耘機で耕耘した。
土壌はこの耕耘後の土壌を用いた。ポットには1/2000aワグネルポットを用い、上
記土壌を1ポットあたり約8L詰め、15ポットを準備した。2015年6月25日に3
粒播きで各ポット内2カ所に播種した(1ポットあたり6粒使用)。なお、品種は、「里
のほほえみ」を用いた。初生葉展開期に1ヵ所につき1本に間引きし、各ポット2株立て
とした。収穫は11月9日に実施した(播種後137日)。なお、収量予測用には5ポッ
ト10株を用いた。
1. Each cultivation test
The outdoor pot cultivation test data conducted from 2015 to 2017 will be described in detail. A total of 4 tests were performed.
1) 2015 pot trial (1):
Pot cultivation was carried out in Tochigi prefecture. Domestic field soil was used as the soil, and fertilization was performed so that nitrogen:phosphoric acid:potassium=3:6:6 (Kg/10a), and the soil was cultivated with a power tiller.
As the soil, this tilled soil was used. 1/2000a Wagner pots were used as pots, and 15 pots were prepared by packing about 8 L of the above soil per pot. June 25, 2015 3
Seeds were seeded at two locations in each pot by grain sowing (6 grains were used per pot). The cultivar used was 'Sato no Hohoemi'. At the stage of primary leaf development, one plant was thinned out at each site, and two plants were placed in each pot. Harvesting was carried out on November 9 (137 days after sowing). Note that 10 strains in 5 pots were used for yield prediction.

2)2015年ポット試験(2):
和歌山県内にてポット栽培を実施した。土壌は国内内の圃場土を用い、窒素:リン酸:
カリウム=1:6:6、3:6:6及び10:6:6(Kg/10a)となるように施肥
を行い、耕耘後の土壌を用いた(窒素量のみ異なる3種の施肥条件を設定した)。ポット
には1/2000aワグネルポットを用い、上記土壌を1ポットあたり約8L詰め、各施肥条件
でそれぞれ15ポット計45ポットを準備した。2015年7月1日に3粒播きで各ポッ
ト内2カ所に播種した(各ポット6粒使用)。なお、品種は、「フクユタカ」を用いた。
初生葉展開期に1ヵ所につき1本に間引きし、各ポット2株立てとした。収穫は、11月
11日に実施した(播種後133日)。なお、収量予測用には各5ポット10株を用いる
計画だったが、1株が欠株したため、計29株を用いた。
2) 2015 pot trial (2):
Pot cultivation was carried out in Wakayama prefecture. The soil uses domestic field soil, nitrogen: phosphoric acid:
Fertilization was performed so that potassium = 1: 6: 6, 3: 6: 6 and 10: 6: 6 (Kg / 10 a), and the soil after tillage was used (three types of fertilization conditions differing only in nitrogen content). set). 1/2000a Wagner pots were used as pots, and about 8 L of the above soil was packed in each pot, and 15 pots in total of 45 pots were prepared for each fertilization condition. On July 1, 2015, 3 grains were sown at 2 locations in each pot (6 grains were used in each pot). "Fukuyutaka" was used as the variety.
At the stage of primary leaf development, one plant was thinned out at each site, and two plants were placed in each pot. Harvest was performed on November 11 (133 days after sowing). It was planned to use 10 strains in each of the 5 pots for yield prediction, but a total of 29 strains were used because one strain was missing.

3)2016年ポット試験:
栃木県内にてポット栽培を実施した。土壌は国内の圃場土を用い、試験を実施した。ポ
ットには1/2000aワグネルポットを用い、上記土壌を1ポットあたり約8L詰めと
し、75ポットを準備した。数日間静置後、2015年同様に播種を行った。播種は、2
016年7月1日に行い、11月15日に収穫を行った。なお、品種は「里のほほえみ」
を用いた。また、収量予測用には23ポット46株を用いた。
3) 2016 pot test:
Pot cultivation was carried out in Tochigi Prefecture. The test was conducted using field soil from Japan as the soil. 1/2000a Wagner pots were used as pots, and 75 pots were prepared by packing about 8 L of the above soil per pot. After standing for several days, seeding was performed in the same manner as in 2015. Sowing is 2
It was done on July 1, 016 and harvested on November 15th. In addition, the variety is "Sato no Hohoemi"
was used. For yield prediction, 46 strains in 23 pots were used.

4)2017年ポット試験:
栃木県内にてポット栽培を実施した。土壌は、国内圃場の土を用い、そこへ肥料として
苦土石灰(協和)を125g/m及びリン酸入り油かす(大栄物産)を100g/m
添加した土壌(1×)及び肥料を添加した土壌と未添加土壌を半量ずつ混和した土壌(0
.5×)の2種類を用いた。また品種は、「里のほほえみ」、「フクユタカ」、「エンレ
イ」及び「湯上がり娘」の4品種を用いた。ポットには1/2000aワグネルポットを
用い、上記土壌を1ポットあたり約8L詰め、各土壌で5ポットずつ、4品種で計40ポ
ットを準備した。数日間静置後、品種ごとに4粒播きで各ポット内2カ所に播種した(各
ポット8粒使用)。初生葉展開期に1ヵ所につき1本に間引きし、各ポット2株立てとし
た。播種は、2017年7月4日に行い、収穫は10月以降、成熟期に達し収穫適期と判
断した株から順次収穫を行った。
4) 2017 pot test:
Pot cultivation was carried out in Tochigi prefecture. The soil used was soil from a domestic field, and 125 g/m 2 of magnesium lime (Kyowa) and 100 g/m 2 of phosphate-containing oil cake (Daiei Bussan) were added as fertilizers.
Added soil (1 ×) and soil mixed with half the amount of soil with added fertilizer and soil with no added fertilizer (0
. 5×) were used. As for the varieties, four varieties of "Sato no Hohoemi", "Fukuyutaka", "Enrei" and "Yuagari Musume" were used. A 1/2000a Wagner pot was used as the pot, and about 8 L of the above soil was packed in each pot. After being allowed to stand for several days, 4 grains of each variety were sown at 2 locations in each pot (8 grains were used in each pot). At the stage of primary leaf development, one plant was thinned out at each site, and two plants were placed in each pot. Seeding was performed on July 4, 2017, and harvesting was performed sequentially from October onwards, starting from strains that had reached maturity and were judged to be suitable for harvesting.

2.葉のサンプリング
葉のサンプリングは、それぞれの栽培試験において播種後28~32日となる日の日中
に実施した(おおむね10時―15時)。この際のダイズ生育ステージは年度、栽培条件
、品種により若干異なるが概ね葉齢5-7程度であった。ここでいう葉齢は、初生葉を1
とした際に最上位に展開した本葉が下から数えて何枚目かを数えた際の値とした。葉のサ
ンプリングは、最上位に展開する本葉の1又は2葉齢古い本葉を構成する複葉3枚の内、
中央の複葉を採取した。しかしながら、中央の複葉が虫害等著しく損傷を受けている場合
は、別の複葉を採取した。採取した葉はアルミホイルで包み直ちに液体窒素中で凍結し、
代謝反応を停止させた。凍結サンプルは凍結状態を維持したまま実験室へ持ち帰り、凍結
乾燥にかけて乾燥させた。この乾燥したサンプルを後述の抽出操作に供試した。なお、2
015年及び2016年のポット栽培試験では1個体ごとに採取し、収量データは対応す
る個体のものを用いた。一方、2017年ポット栽培試験では1ポット毎、すなわち2個
体毎にまとめてサンプリングを実施し、収量データは2個体の平均値を用いた。
また、葉をサンプリングした際の播種からの日数は以下のとおりである。
*2015年ポット試験(1):2015年7月25日(播種後30日)
*2015年ポット試験(2):2015年7月29日(播種後28日)
*2016年ポット試験:2016年8月2日(播種後32日)
*2017年ポット試験:2017年8月3日(播種後30日)
2. leaf sampling
Sampling of leaves was carried out in the daytime on days 28-32 after seeding in each cultivation test (generally 10:00-15:00). The growth stage of the soybean at this time slightly differed depending on the year, cultivation conditions and variety, but the leaf age was generally about 5-7. The leaf age referred to here is 1
The value was obtained by counting the number of sheets of true leaves that were developed at the top from the bottom. Sampling of leaves is performed on three compound leaves that are 1 or 2 leaves older than the topmost true leaf,
A central compound leaf was collected. However, when the central compound leaf was severely damaged such as by insect damage, another compound leaf was collected. The harvested leaves were wrapped in aluminum foil and immediately frozen in liquid nitrogen.
Stopped the metabolic reaction. Frozen samples were brought to the laboratory in a frozen state and lyophilized to dryness. This dried sample was subjected to the extraction procedure described below. In addition, 2
In the pot cultivation tests in 2015 and 2016, each individual was collected, and the yield data of the corresponding individual was used. On the other hand, in the 2017 pot cultivation test, sampling was performed collectively for each pot, that is, every two individuals, and the average value of the two individuals was used as the yield data.
In addition, the number of days after sowing when sampling leaves is as follows.
* 2015 pot test (1): July 25, 2015 (30 days after sowing)
* 2015 pot test (2): July 29, 2015 (28 days after sowing)
* 2016 pot test: August 2, 2016 (32 days after sowing)
* 2017 pot test: August 3, 2017 (30 days after sowing)

3.最終的な子実収量の測定
栽培試験後の各個体から全子実を回収し、80℃にて2-3日間乾燥させた。収量デー
タはこの乾燥重量(gDW/個体)を用いた。2-2で既述したように2017年の試験
における2個体(1ポット毎)の平均データは1つとしてカウントし、2015-17年
のポット試験データは計125個となった。収量データは表2a~2cに示すように最小
で0.9gDW/個体、最大で42.5gDW/個体であった。
3. Measurement of final grain yield
Whole grains were collected from each plant after the cultivation test and dried at 80° C. for 2 to 3 days. This dry weight (gDW/individual) was used for the yield data. As described in 2-2, the average data of two individuals (per pot) in the 2017 test was counted as one, and the pot test data from 2015 to 2017 totaled 125. Yield data was a minimum of 0.9 gDW/plant and a maximum of 42.5 gDW/plant as shown in Tables 2a-2c.


Figure 2023090795000005
Figure 2023090795000005

Figure 2023090795000006
Figure 2023090795000006

Figure 2023090795000007
Figure 2023090795000007

4.採取した葉の成分の抽出
凍結乾燥した葉サンプルは、スパーテルを用いて手作業にて可能な限り粉砕を行った。
粉砕後、2mLのチューブ(セーフロックチューブ,エッペンドルフ)に10mgを秤量
し、直径5mmのジルコニア製ボール1つをチューブに加えて、ビーズ粉砕機(MM40
0,Retsch)にて25Hzで1分間粉砕した。抽出溶媒は、内部標準としてリドカ
イン(和光純薬工業,♯120-02671)を500ng/mLとなるように加えた8
0v/v%メタノール水溶液を用いた。粉砕後のチューブに調製した抽出溶媒を1mL添
加し、同ビーズ粉砕機にて、20Hzで5分間ホモジナイズ抽出を行った。抽出終了後、
2,000×g程度の卓上遠心機(チビタン)にて、30秒程度遠心し、0.45μmの
親水性PTFEフィルター(DISMIC-13HP 0.45μm syringe f
ilter , ADVANTEC)でろ過し、分析サンプルを得た。
4. Extraction of components from harvested leaves
Freeze-dried leaf samples were manually ground with a spatula as much as possible.
After grinding, 10 mg was weighed into a 2 mL tube (Safe Lock Tube, Eppendorf), one 5 mm diameter zirconia ball was added to the tube, and a bead grinder (MM40
0, Retsch) at 25 Hz for 1 minute. The extraction solvent was 500 ng/mL of lidocaine (Wako Pure Chemical Industries, #120-02671) as an internal standard.
A 0 v/v % methanol aqueous solution was used. 1 mL of the prepared extraction solvent was added to the tube after pulverization, and homogenized extraction was performed at 20 Hz for 5 minutes using the same bead pulverizer. After extraction,
Centrifuge for about 30 seconds in a tabletop centrifuge (Cibitan) at about 2,000 × g, and pass through a 0.45 μm hydrophilic PTFE filter (DISMIC-13HP 0.45 μm syringe f
ilter, ADVANTEC) to obtain an analytical sample.

5.LC/MSによる葉サンプルの分析
葉抽出サンプルの分析は、Agilent社製HPLCシステム(Infinity1
260シリーズ)をフロントとし、AB SCIEX社製Q-TOFMS装置(Trip
leTOF4600)を検出器として用いてLC/MS分析を行った。HPLCにおける
分離カラムには、(株)資生堂社製のコアシェルカラムCapcell core C18
(2.1mm I.D.x100mm,粒子計2.7μm)及びガードカラム(2.1m
m I.D.x5mm, 粒子計2.7μm)を使用し、カラム温度は40℃に設定した。
オートサンプラーは分析中5℃を保持した。分析サンプルは5μLを注入した。溶離液に
はA:0.1v/v%ギ酸水溶液及びB:0.1v/v%ギ酸アセトニトリル溶液を用い
た。グラジエント溶出条件は、0分~0.1分は1v/v%B(99v/v%A)で保持
し、0.1分~13分の間に1v/v%Bから99.5v/v%Bまで溶離液Bの比率を
上昇させ、13.01分~16分まで99.5v/v%Bで保持した。流速は0.5mL
/minとした。
5. Analysis of leaf samples by LC/MS
Analysis of leaf extract samples was performed on an Agilent HPLC system (Infinity1
260 series) on the front and AB SCIEX Q-TOFMS equipment (Trip
LC/MS analysis was performed using leTOF4600) as a detector. As a separation column in HPLC, a core-shell column Capcell core C18 manufactured by Shiseido Co., Ltd.
(2.1 mm ID x 100 mm, particle count 2.7 μm) and a guard column (2.1 m
m I. D. x5 mm, particle size 2.7 μm) was used and the column temperature was set to 40°C.
The autosampler was kept at 5°C during the analysis. 5 μL of analysis sample was injected. As eluents, A: 0.1 v/v % formic acid aqueous solution and B: 0.1 v/v % formic acid acetonitrile solution were used. Gradient elution conditions were held at 1 v/v % B (99 v/v % A) from 0 min to 0.1 min and 1 v/v % B to 99.5 v/v from 0.1 min to 13 min. %B was increased and held at 99.5 v/v %B from 13.01 min to 16 min. Flow rate is 0.5 mL
/min.

質量分析装置条件は、イオン化モードをポジティブモードとし、イオン化法はESIを
用いた。本分析系では、溶出してくるイオンをTOFMSにより0.1秒間スキャンし、
その中の強度の大きいイオンを10個選択し、それぞれを0.05秒間MS/MSにかけ
るというサイクルを繰り返しながら、TOFMSスキャンによる分子イオン情報(精密質
量, m/z)とMS/MSスキャンにより生じるフラグメントに由来する構造情報を取得
した。質量測定範囲はTOFMSがm/z 100-1,250、MS/MSがm/z
50-1,250に設定した。各スキャンのパラメータはTOFMSスキャンについては
、GS1=50、GS2=50、CUR=25、TEM=450、ISVF=5500、
DP=80及びCE=10に設定し、MS/MSスキャンについては、GS1=50、G
S2=50、CUR=25、TEM=450、ISVF=5500、DP=80、CE=
30、CES=15、IRD=30及びIRW=15に設定した。
As for the conditions of the mass spectrometer, the ionization mode was positive mode, and ESI was used as the ionization method. In this analysis system, the eluted ions are scanned by TOFMS for 0.1 second,
While repeating the cycle of selecting 10 ions with high intensity among them and subjecting each to MS/MS for 0.05 seconds, molecular ion information (accurate mass, m/z) by TOFMS scanning and MS/MS scanning Structural information was obtained from the resulting fragments. Mass measurement range is m/z 100-1,250 for TOFMS and m/z for MS/MS
It was set at 50-1,250. The parameters for each scan are GS1=50, GS2=50, CUR=25, TEM=450, ISVF=5500,
Set DP = 80 and CE = 10, for MS/MS scans GS1 = 50, G
S2=50, CUR=25, TEM=450, ISVF=5500, DP=80, CE=
30, CES=15, IRD=30 and IRW=15.

6.データ行列の作成
データ処理は下記の通り行った。まず、MarkerViewTM Software
(AB SCIEX)を用いてピークの抽出を行った。ピーク抽出条件(「peak f
inding option」)は、保持時間0.5分~16分に該当するピークとし、
「Enhance Peak Finding」の項目におけるSubtraction
offsetを20スキャン、Minimum spectral peak wid
thを5ppm、Subtraction multi. Factorを1.2、Mi
nimum RT peak widthを10スキャン、Noise thresho
ldを5に設定し、「More」の項目におけるAssign charge state
にチェックを入れた。その結果、12,444のピーク情報を得た。
6. Create Data Matrix
Data processing was performed as follows. First, the MarkerView Software
Peak extraction was performed using (AB SCIEX). Peak extraction conditions (“peak f
indexing option”) is a peak corresponding to a retention time of 0.5 minutes to 16 minutes,
Subtraction in the item of "Enhance Peak Finding"
20 scans of offset, Minimum spectral peak width
th is 5 ppm, Subtraction multi. Factor is 1.2, Mi
10 scans of nimum RT peak width, Noise threshold
Set ld to 5, Assign charge state in the "More" item
was checked. As a result, 12,444 peak information was obtained.

次に、検出したピークを分析した各サンプル間で整列化させるアラインメント処理を行
った。アラインメントの処理条件(「Alighmment & Filtering」
)は、「Alignment」の項目におけるRetention time tole
ranceを0.20分及びMass toleranceを10.0ppmに設定した
。また「Filtering」の項目におけるIntensity threshold
を10、Retention time filteringにチェックを入れ、Rem
ove peaks in<3サンプルとし、Maximum number of p
eaksを50,000に設定した。「Internal standards」の項目
においてリドカインのピークを用いて保持時間の補正を行った。
Next, an alignment process was performed to align the detected peaks between each analyzed sample. Alignment processing conditions (“Alignment & Filtering”
) is the Retention time tole in the "Alignment" item
The lance was set to 0.20 minutes and the mass tolerance to 10.0 ppm. In addition, the Intensity threshold in the item of "Filtering"
10, check Retention time filtering, Rem
With ove peaks in <3 samples, Maximum number of p
eaks was set to 50,000. The retention time was corrected using the peak of lidocaine in the item of "Internal standards".

次に同位体ピークの除去を行った。同位体ピークはピーク抽出の時点でソフトウェアが
自動で認識し、ピークリスト上で「isotopic」のラベルが付けられているため、
「isotopic」でソートして該当ピークを削除した。その結果、ピークは10,1
12ピークに減少した。
Next, removal of isotopic peaks was performed. Isotopic peaks are automatically recognized by the software at the time of peak extraction and are labeled as "isotopic" in the peak list.
Relevant peaks were deleted by sorting by "isotopic". As a result, the peak is 10,1
reduced to 12 peaks.

次に、サンプル間のピーク強度補正を行った。今回の分析では、サンプルの他に、全て
のサンプルから一定量を混合したpooled QCと呼ばれるサンプルを作製し、9回
に1回の頻度でpooled QCの分析を実施した。これらの全QC分析結果から、「
各サンプルを分析していた際にQCサンプルを分析していたと仮定するとそれぞれのピー
ク強度はどうなるか」という推定値を計算し、その値で補正するという処理を実施し、同
一バッチ内における各サンプル間の感度の補正を行った。なお、本処理は、理研が提供し
ているフリーソフト(LOWESS-Normalization-Tool)を用いた
。最後に、測定した30個のQC分析データを用いて10,112ピークの相対標準偏差
(RSD)を計算し、RSD>30%となるばらつきの大きいピークを除去し、最終的に
431のピークデータ、すなわち431成分の分析データを得た。得られた分析データを
表3a~3fに示す。これらのデータを用いて、以降の解析を行った。
Next, peak intensity correction between samples was performed. In this analysis, in addition to the sample, a sample called pooled QC was prepared by mixing a constant amount from all the samples, and the pooled QC analysis was performed once every nine times. From these full QC analysis results, "
Assuming that QC samples were analyzed when each sample was analyzed, what would happen to each peak intensity? Sensitivity correction was performed between For this processing, free software (LOWESS-Normalization-Tool) provided by RIKEN was used. Finally, the relative standard deviation (RSD) of 10,112 peaks was calculated using the measured 30 QC run data, peaks with high variability with RSD>30% were removed, and finally 431 peak data , that is, analytical data of 431 components were obtained. The analytical data obtained are presented in Tables 3a-3f. Subsequent analysis was performed using these data.


Figure 2023090795000008
Figure 2023090795000008

Figure 2023090795000009
Figure 2023090795000009

Figure 2023090795000010
Figure 2023090795000010

Figure 2023090795000011
Figure 2023090795000011

Figure 2023090795000012
Figure 2023090795000012

Figure 2023090795000013
Figure 2023090795000013

7.相関解析
取得した125個の葉中431成分の分析データと対応する収量データ、すなわち12
5×432のマトリックスデータを用いて相関解析を行った。各成分の分析データと収量
データとの単相関係数r及び無相関の検定によりp値を算出した。結果を表4a~4fに
示す。なお、表中の「成分No.」は431個の成分を質量順に並べた際に質量数が小さ
い方から番号を付けた便宜的なものである。また、分析結果には質量情報とともに保持時
間の情報も含まれるが、特開2016-57219号公報によれば、少数点以下4桁以上
の精密質量数を用いれば、保持時間によらず複数の質量分析用試料間で質量分析データの
比較及び解析が可能であることが示されている。よって、保持時間の情報は除去し、精密
質量情報のみを記載した。
7. Correlation analysis
Analysis data and corresponding yield data for 431 components in 125 leaves obtained, namely 12
Correlation analysis was performed using 5×432 matrix data. The single correlation coefficient r between the analysis data and the yield data of each component and the p-value were calculated by the test of non-correlation. The results are shown in Tables 4a-4f. "Component No." in the table is for the sake of convenience, in which the 431 components are numbered from the smallest mass number when arranged in order of mass. In addition, the analysis results include retention time information as well as mass information, but according to JP-A-2016-57219, if an accurate mass number with four or more decimal places is used, a plurality of data can be obtained regardless of the retention time. It has been shown that mass spectrometry data can be compared and analyzed between mass spectrometry samples. Therefore, retention time information was removed and only accurate mass information was described.


Figure 2023090795000014
Figure 2023090795000014

Figure 2023090795000015
Figure 2023090795000015

Figure 2023090795000016
Figure 2023090795000016

Figure 2023090795000017
Figure 2023090795000017

Figure 2023090795000018
Figure 2023090795000018

Figure 2023090795000019
Figure 2023090795000019

相関解析で得られた結果により、一定の相関係数を持つ成分は収量と有意に相関するこ
とが示された。相関係数の絶対値|r|>0.51となる成分は118個、|r|>0.66
となる成分は28個であることがわかった。
The results obtained in correlation analysis indicated that components with constant correlation coefficients were significantly correlated with yield. There are 118 components with the absolute value of the correlation coefficient |r|>0.51, |r|>0.66
It was found that there are 28 components that result in

8.モデル構築・評価
2つ以上の複数の成分の分析データを用いた収量予測モデルの構築には多変量解析手法
を用い、解析ツールとしてSIMCA ver.14(Umetrics)を用いた。予
測モデルは、説明変数に各精密質量をもった補正済みの成分の分析データのピーク面積値
を、また目的変数に収量値を用いた回帰分析を行った。回帰分析はPLS法の改良版であ
るOPLS法で行った。
8. Model construction/evaluation
A multivariate analysis method is used to construct a yield prediction model using analytical data of two or more components, and SIMCA ver. 14 (Umetrics) was used. For the predictive model, regression analysis was performed using the peak area values of the corrected analytical data of the components having each accurate mass as the explanatory variables and the yield values as the objective variables. Regression analysis was performed by the OPLS method, which is an improved version of the PLS method.

予測モデルの評価方法は、主に2つの指標で判断される。1つは予測精度を表すR
もう1つは予測性を表すQである。Rは予測モデル構築に使用したデータの実測値と
モデルで計算した予測値との相関係数の2乗であり、1に近いほど予測精度が高いことを
示している。一方、Qは、上記クロスバリデーションの結果であり、実測値と繰り返し
実施したモデル検証の結果である予測値との相関係数の2乗を表している。予測の観点か
ら、少なくともQ>0.50であれば、そのモデルは良好な予測性を持つとされている
ことから(Triba, M. N. et al., Mol. BioSyst. 2015, 11, 13-19.)、Q>0.50
をモデル評価の基準とした。なお、常にR>Qとなるため、Q>0.50は同時に
>0.50を満たすこととなる。
The prediction model evaluation method is mainly judged by two indices. One is R 2 representing prediction accuracy,
The other is Q2 , which represents predictability. R2 is the square of the correlation coefficient between the measured values of the data used to construct the prediction model and the predicted values calculated by the model, and the closer to 1, the higher the prediction accuracy. On the other hand, Q2 is the result of the above cross-validation, and represents the square of the correlation coefficient between the measured value and the predicted value, which is the result of repeated model verification. From a prediction point of view, if at least Q 2 >0.50, the model is said to have good predictive power (Triba, MN et al., Mol. BioSyst. 2015, 11, 13-19 .), Q 2 >0.50
was used as the criterion for model evaluation. Since R 2 >Q 2 is always satisfied, Q 2 >0.50 simultaneously satisfies R 2 >0.50.

8-1.431個の成分の全データを用いたモデルの構築・評価
1データ当り431個の成分の分析データのピーク面積値と収量値を持ち、全125個
のデータマトリックスから、収量を予測するOPLSモデルを構築した。構築の際、各成
分の分析データのピーク面積値及び収量データはオートスケーリングにより平均0、分散
1に変換した。モデル構築の結果、予測精度を示すR=0.87、予測性を示すQ
0.78であった。結果を図1に示す。この予測モデルにより、栽培1カ月程度の葉に含
まれる成分組成を用いることで、高い予測性能を持つモデルが構築でき、早期収量予測が
可能であることが示された。
8-1. Construction and evaluation of models using all data of 431 components
An OPLS model was constructed to predict yield from a total of 125 data matrices, with analytical data peak area values and yield values for 431 components per datum. At the time of construction, the peak area value and yield data of analytical data for each component were converted to mean 0 and variance 1 by autoscaling. As a result of model construction, R 2 = 0.87, which indicates prediction accuracy, and Q 2 =, which indicates predictability
was 0.78. The results are shown in FIG. By using this prediction model, it was shown that a model with high prediction performance can be constructed by using the component composition contained in leaves for about one month of cultivation, and early yield prediction is possible.

8-2.VIP値の算出
8-1で構築したモデルではVIP(Variable Importance in
the Projection, 投影における変数重要性)値とよばれる各成分に与え
られるモデル性能への寄与度が与えられる。VIP値はその値が大きいほどモデルへの寄
与度が大きく、相関係数の絶対値とも相関する。VIP値のリストを表5a~5fに示す
8-2. Calculation of VIP value
VIP (Variable Importance in
A contribution to the model performance given to each component called the Projection (Variable Importance in Projection) value is given. The larger the VIP value, the greater the degree of contribution to the model, and the absolute value of the correlation coefficient is also correlated. A list of VIP values is shown in Tables 5a-5f.


Figure 2023090795000020
Figure 2023090795000020

Figure 2023090795000021
Figure 2023090795000021

Figure 2023090795000022
Figure 2023090795000022

Figure 2023090795000023
Figure 2023090795000023

Figure 2023090795000024
Figure 2023090795000024

Figure 2023090795000025
Figure 2023090795000025

8-3.機械学習モデル
予測モデル構築には、OPLS法に限らず、様々な手法にて構築することができる。別
の例として、機械学習を用いた予測モデル構築をおこなった。機械学習は人工知能、すな
わちAIにおける研究課題の1つで、現在、様々な分野での応用が進んでいる。
ここでは、前述の8-1で構築した全データを用いたモデルから算出されたVIP値の
上位97個の成分の分析データを用いて、機械学習によりモデル構築をおこなった。解析
ツールには、Visual Mining Studio(以降、VMSと表記、(株)N
TTデータ数理システム)を用いた。
8-3. machine learning model
Prediction model construction is not limited to the OPLS method, and can be constructed by various methods. As another example, we constructed a prediction model using machine learning. Machine learning is one of the research subjects in artificial intelligence, that is, AI, and is currently being applied to various fields.
Here, a model was constructed by machine learning using the analysis data of the top 97 components of the VIP value calculated from the model using all the data constructed in 8-1 above. The analysis tool includes Visual Mining Studio (hereinafter referred to as VMS, N Co., Ltd.).
TT Data Mathematical System) was used.

8-3-1.全125データを用いたモデル構築
1データ当たりVIP値上位97個の成分の分析データのピーク面積値と収量値を持ち
、全125個のデータマトリックスをVMSにとりこみ学習データとした。モデル構築に
はModel Optimizer機能によりディシジョンツリー、ランダムフォレスト
、ニューラルネットワーク及びサポートベクターマシーンの4種から最適なモデルを探索
した。モデルの計算では各モデルのパラメータを最適化し、また交差検証も実施され、過
学習を起こさないモデルが構築される。その結果、モデルには、ランダムフォレストが選
抜された。実測値と予測値の相関の2乗(R)は0.92と精度の高いモデルが構築さ
れた。結果を図2に示す。
8-3-1. Model construction using all 125 data Each data had peak area values and yield values of analysis data of 97 components with the highest VIP values, and all 125 data matrices were taken into VMS and used as learning data. For model construction, the Model Optimizer function was used to search for the optimum model from four types of decision tree, random forest, neural network, and support vector machine. Model calculation optimizes the parameters of each model, and cross-validation is also performed to construct a model that does not cause overfitting. As a result, random forest was selected as the model. The square of the correlation between the actual value and the predicted value (R 2 ) was 0.92, and a highly accurate model was constructed. The results are shown in FIG.

8-3-2.半数のデータを用いたモデル構築と残り半数での予測検証
1データ当たりVIP値上位97個の成分の分析データのピーク面積値と収量値を持ち
、全125個のデータマトリックスをランダムに2群に分割し、一方の63個のマトリク
スデータを用いてVMSでモデルを構築し、残りの62個のデータで予測検証をおこなっ
た。8-3-1と同様にModel Optimizerでモデル構築を行ったところ、
モデルにはニューラルネットワークが選抜された。モデルに用いた63個のデータにおけ
る実測値と予測値の相関の2乗は0.83であり、モデルに用いなかった62個のデータ
における実測値と予測値の相関の2乗は0.58であった。検証データでの予測値は学習
データよりも精度が低下したが、一定の予測が可能であることが示された。結果を図3に
示す。
8-3-2. Model construction using half of the data and prediction verification with the remaining half Each data has the peak area value and yield value of the analysis data of the 97 components with the highest VIP value, and all 125 data matrices are randomly divided into two groups. It was divided, a model was constructed by VMS using 63 matrix data on one side, and prediction verification was performed on the remaining 62 data. When building a model with Model Optimizer as in 8-3-1,
A neural network was selected as the model. The square of the correlation between the measured values and the predicted values in the 63 data used in the model is 0.83, and the square of the correlation between the measured values and the predicted values in the 62 data not used in the model is 0.58. Met. Although the accuracy of the predicted value with the validation data was lower than that with the training data, it was shown that a certain level of prediction was possible. The results are shown in FIG.

8-4. VIP値を指標としたモデル構築(2個以上の成分の分析データを用いたモデ
ル)
8-1で構築したモデルへの各成分の寄与度であるVIP値のランキング(表4a~4
f)を基に複数の成分でモデルを構築した。特に限定されるわけではないが、モデル性能
の基準を便宜上Q>0.50とした。
8-4. Model construction using VIP value as an index (model using analysis data of two or more components)
ru)
VIP value ranking, which is the contribution of each component to the model constructed in 8-1 (Tables 4a-4
A model was constructed with multiple components based on f). For convenience, Q 2 >0.50 was used as a criterion for model performance, although it is not particularly limited.

8-4-1.VIP値が下位の成分の分析データを用いたモデル
VIP値11位以下全ての成分の分析データ、21位以下全ての成分の分析データ、3
1位以下全ての成分の分析データ・・・及び351位以下全ての成分の分析データを用い
てそれぞれOPLSモデルの構築を行った。その結果、Q>0.5を満たすのは11位
以下全ての成分の分析データ~251位以下全ての成分の分析データを用いたモデルであ
り、VIP値261位以下の成分の分析データ全てを用いてもQ>0.50とはならな
いことがわかった(図4)。
8-4-1. Model using analysis data of components with lower VIP values Analysis data of all components below VIP value 11th, analysis data of all components below 21st, 3
An OPLS model was constructed using the analysis data of all the components below the 1st position and the analysis data of all the components below the 351st position. As a result, the model that satisfies Q 2 > 0.5 is the model using the analysis data of all the components below 11th to the analysis data of all the components below 251st, and all the analysis data of the components below VIP value 261st. (Fig . 4).

8-4-2.VIP値上位10位までの成分の分析データを2個用いたモデル
VIP値上位1位から10位までの成分の分析データの内、任意の2個の組み合わせ(
45通り)についてOPLSモデルの構築を行った。その結果、いずれのモデルにおいて
もQ>0.50を満たすことがわかった。このことからVIP値上位10位までの代謝
物を2個含んでいれば、一定の予測性を持つモデルが構築できることが示された(図5)
8-4-2. Model using two analysis data of the top 10 VIP value components Combination of any two of the analysis data of the top 1 to 10 VIP value components (
45 patterns), an OPLS model was constructed. As a result, it was found that Q 2 >0.50 was satisfied in any model. From this, it was shown that if two metabolites with the top 10 VIP values are included, a model with a certain degree of predictiveness can be constructed (Fig. 5).
.

8-4-3.VIP値を基に連続する2個の成分の分析データを用いたモデル
VIP値上位1位と2位、11位と12位、21位と22位、・・・及び201位と2
02位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果、
31位と32位の2個の成分の分析データを用いた際のモデルで初めてQ>0.50を
満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP値30位
程度以上であればその中から任意の2個の成分の分析データを用いることでQの基準を
概ね満たすが、VIP値30位程度以下の成分の分析データ2個のみでは基準を満たさな
いことが示された(図6)。
8-4-3. Model using analysis data of two consecutive components based on VIP value VIP value top 1st and 2nd, 11th and 12th, 21st and 22nd, ... and 201st and 2nd
Each OPLS model was constructed using the analysis data of the 02nd component. resulting in,
For the first time, the model did not satisfy Q 2 >0.50 when using analytical data for two components at positions 31 and 32. After that, Q2 tended to decrease. From this, if the VIP value is about 30th or higher, the analysis data of any two components from among them can be used to generally satisfy the Q2 criteria, but the analysis data 2 of the component with a VIP value of about 30th It was shown that the criteria were not satisfied with only one (Fig. 6).

8-4-4.VIP値を基に連続する3個の成分の分析データを用いたモデル
VIP値上位1位と2位と3位、11位と12位と13位、21位と22位と23位、
・・・及び221位と222位と223位の成分の分析データを用いてそれぞれOPLS
モデルの構築を行った。その結果、71位と72位と73位の3個の成分の分析データを
用いた際のモデルで初めてQ>0.50を満たさなかった。それ以降Qは低下する傾
向であった。このことから、VIP値70位程度以上であればその中から任意の3個の成
分の分析データを用いることでQの基準を概ね満たすが、VIP値70位程度以下の成
分の分析データ3個のみでは基準を満たさないことが示唆された(図7)。
8-4-4. Model using analysis data of three consecutive components based on VIP value VIP value top 1st, 2nd and 3rd, 11th, 12th and 13th, 21st, 22nd and 23rd,
... and OPLS using the analytical data of the components at positions 221, 222 and 223, respectively
I built the model. As a result, Q 2 >0.50 was not satisfied for the first time in the model using the analytical data of the three components at positions 71, 72 and 73. After that, Q2 tended to decrease. From this, if the VIP value is about 70th or higher, the analysis data of any 3 components from among them can be used to generally meet the criteria of Q2 . It was suggested that the criteria were not satisfied with only one (Fig. 7).

8-4-5.VIP値を基に連続する4個の成分の分析データを用いたモデル
VIP値上位1位と2位と3位と4位、11位と12位と13位と14位、21位と2
2位と23位と24位、・・・及び221位と222位と223位と224位の成分の分
析データを用いてそれぞれOPLSモデルの構築を行った。その結果、101位と102
位と103位と104位の4個の成分の分析データを用いた際のモデルで初めてQ>0
.50を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP
値100位程度以上であればその中から任意の4個の成分の分析データを用いることでQ
の基準を概ね満たすが、VIP値100位程度以下の成分の分析データ4個のみでは基
準を満たさないことが示唆された(図8)。
8-4-5. Model using analysis data of four consecutive components based on VIP value VIP value top 1st, 2nd, 3rd and 4th, 11th, 12th, 13th and 14th, 21st and 2nd
OPLS models were constructed using the analysis data of the components of 2nd, 23rd and 24th, . As a result, 101st and 102nd
Q 2 > 0 for the first time in the model when using the analytical data of four components at positions 103 and 104.
. did not reach 50. After that, Q2 tended to decrease. From this, VIP
If the value is about 100 or more, Q
Although the criteria of 2 are generally satisfied, it was suggested that the criteria were not satisfied with only 4 pieces of analysis data for components with a VIP value of about 100th or lower (Fig. 8).

8-4-6.VIP値を基に連続する5個の成分の分析データを用いたモデル
VIP値上位1位~5位、11位~15位、21位~25位、・・・及び251位~2
55位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果、
101位~105位の5個の成分の分析データを用いた際のモデルで初めてQ>0.5
0を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP値1
00位程度以上であればその中から任意の5個の成分の分析データを用いることでQ
基準を概ね満たすが、VIP値100位程度以下の成分の分析データ5個のみでは基準を
満たさないことが示唆された(図9)。
8-4-6. Model using analysis data of five consecutive components based on VIP value VIP value top 1st to 5th, 11th to 15th, 21st to 25th, … and 251st to 2
An OPLS model was constructed using the analysis data of the 55th component. resulting in,
Q 2 > 0.5 for the first time in the model when using the analytical data of 5 components from 101st to 105th
did not meet 0. After that, Q2 tended to decrease. From this, VIP value 1
If it is about 00th or higher, the criteria for Q2 is generally satisfied by using analysis data of any 5 components from among them, but only 5 analysis data of components with a VIP value of about 100th or less fulfills the criteria. (Fig. 9).

8-4-7.VIP値を基に連続する6個の成分の分析データを用いたモデル
VIP値上位1位~6位、11位~16位、21位~26位、・・・及び281位~2
86位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果、
131位~136位の6個の成分の分析データを用いた際のモデルで初めてQ>0.5
0を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP値1
30位程度以上であればその中から任意の6個の成分の分析データを用いることでQ
基準を概ね満たすが、VIP値130位程度以下の成分の分析データ6個のみでは基準を
満たさないことが示唆された(図10)。
8-4-7. Model using analysis data of 6 consecutive components based on VIP value VIP value top 1st to 6th, 11th to 16th, 21st to 26th, … and 281st to 2
An OPLS model was constructed using the analytical data of the 86th component. resulting in,
Q 2 > 0.5 for the first time in the model when using analytical data of six components from 131st to 136th
did not meet 0. After that, Q2 tended to decrease. From this, VIP value 1
If it is about 30th or higher, the criteria for Q2 can be roughly met by using analysis data for any 6 components from among them, but only 6 analysis data for components with a VIP value of about 130th or lower will meet the criteria. (Fig. 10).

8-4-8.VIP値を基に連続する7個の成分の分析データを用いたモデル
VIP値上位1位~7位、11位~17位、21位~27位、・・・及び281位~2
87位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果、
141位~147位の7個の成分の分析データを用いた際のモデルで初めてQ>0.5
0を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP値1
40位程度以上であればその中から任意の7個の成分の分析データを用いることでQ
基準を概ね満たすが、VIP値140位程度以下の成分の分析データ7個のみでは基準を
満たさないことが示唆された(図11)。
8-4-8. Model using analysis data of 7 consecutive components based on VIP value VIP value top 1st to 7th, 11th to 17th, 21st to 27th, … and 281st to 2
Each OPLS model was constructed using the analysis data of the 87th component. resulting in,
Q 2 > 0.5 for the first time in the model when using the analytical data of seven components from 141st to 147th
did not meet 0. After that, Q2 tended to decrease. From this, VIP value 1
If it is about 40th or higher, the criteria for Q2 is generally met by using analysis data for any 7 components from among them, but only 7 analysis data for components with a VIP value of about 140th or lower satisfies the criteria. (Fig. 11).

8-4-9.VIP値を基に連続する8個の成分の分析データを用いたモデル
VIP値上位1位~8位、11位~18位、21位~28位、・・・及び281位~2
88位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果、
141位~148位の8個の成分の分析データを用いた際のモデルで初めてQ>0.5
0を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP値1
40位程度以上であればその中から任意の8個の成分の分析データを用いることでQ
基準を概ね満たすが、VIP値140位程度以下の成分の分析データ8個のみでは基準を
満たさないことが示唆された(図12)。
8-4-9. Model using analysis data of 8 consecutive components based on VIP value VIP value top 1st to 8th, 11th to 18th, 21st to 28th, … and 281st to 2
Each OPLS model was constructed using the analysis data of the 88th component. resulting in,
Q 2 > 0.5 for the first time in the model when using analytical data of eight components from 141st to 148th
did not meet 0. After that, Q2 tended to decrease. From this, VIP value 1
If it is about 40th or higher, the criteria for Q2 is generally satisfied by using analysis data of any 8 components from among them, but only 8 analysis data of components with a VIP value of about 140th or lower fulfills the criteria. (Fig. 12).

8-4-10.VIP値を基に連続する9個の成分の分析データを用いたモデル
VIP値上位1位~9位、11位~19位、21位~29位、・・・及び281位~2
89位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果、
141位~149位の9個の成分の分析データを用いた際のモデルで初めてQ>0.5
0を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP値1
40位程度以上であればその中から9個の成分の分析データを用いることでQの基準を
概ね満たすが、VIP値140位程度以下の成分の分析データ9個のみでは基準を満たさ
ないことが示唆された(図13)。
8-4-10. Model using analysis data of 9 consecutive components based on VIP value VIP value top 1st to 9th, 11th to 19th, 21st to 29th, … and 281st to 2
Each OPLS model was constructed using the analysis data of the 89th component. resulting in,
Q 2 > 0.5 for the first time in the model when using analytical data of nine components from 141st to 149th
did not meet 0. After that, Q2 tended to decrease. From this, VIP value 1
If it is about 40th or higher, the analysis data of 9 components from among them will be used, and the criteria for Q2 will be mostly met, but the criteria will not be met with only 9 analysis data of components with a VIP value of about 140th or lower. was suggested (Fig. 13).

8-4-11.VIP値を基に連続する10個の成分の分析データを用いたモデル
VIP値上位1位~10位、11位~20位、21位~30位、・・・及び281位~
290位の成分の分析データを用いてそれぞれOPLSモデルの構築を行った。その結果
、161位~170位の10個の成分の分析データを用いた際のモデルで初めてQ>0
.50を満たさなかった。それ以降Qは低下する傾向であった。このことから、VIP
値160位程度以上であればその中から任意の10個の成分の分析データを用いることで
の基準を概ね満たすが、VIP値140位程度以下の成分の分析データ9個のみでは
基準を満たさないことが示唆された(図14)。
8-4-11. Model using analysis data of 10 consecutive components based on VIP value VIP value top 1st to 10th, 11th to 20th, 21st to 30th, ... and 281st
An OPLS model was constructed using the analysis data of the 290th component. As a result, Q 2 > 0 for the first time in the model when using the analytical data of 10 components from 161st to 170th
. did not reach 50. After that, Q2 tended to decrease. From this, VIP
If the value is about 160th or higher, the criteria for Q2 can be roughly met by using analysis data of any 10 components from among them, but if only 9 analysis data of components with a VIP value of about 140th or less are used, the criteria are not met. It was suggested that it does not satisfy (Fig. 14).

8-5.100成分の分析データを用いた予測モデル構築・評価
前記表3a~fの全431個の成分ピークの内、ピークの形状やサンプル間の平均的な
検出強度等を考慮し、301個のピークデータを選抜した。この301個の成分ピークに
対して、前述のpooled QCによるピーク強度の補正に代えて、内部標準として添
加したリドカインのピーク面積に対する各ピーク面積相対値を算出して補正した。補正デ
ータを用いて、前述した解析ツールSIMCAを用いて、前述の8-1に記載の方法と同
様にモデル構築を行った。すなわち1データ当り301個の成分の分析データのピーク面
積値と収量値を持ち、全125個のデータマトリックスから、収量を予測するOPLSモ
デルを構築した。構築したモデルのVIP値を算出し(VIP値のリストを表6a~6d
に示す。)、上位100成分の分析データを用いて更にモデルを構築したところ、予測精
度を示すR=0.82、予測性を示すQ=0.78である精度の高いモデルが構築で
きた(以降、「予測モデルA」と呼ぶ)。結果を図15に示す。
8-5. Prediction model construction and evaluation using analysis data of 100 components
Of the 431 component peaks in Tables 3a to 3f, 301 peak data were selected in consideration of peak shapes, average detection intensity between samples, and the like. For these 301 component peaks, each peak area relative value to the peak area of lidocaine added as an internal standard was calculated and corrected instead of correcting the peak intensity by the above-described pooled QC. Using the corrected data, the analysis tool SIMCA described above was used to construct a model in the same manner as the method described in 8-1 above. That is, an OPLS model for predicting yield was constructed from a total of 125 data matrices, with peak area values and yield values of analytical data for 301 components per data. Calculate the VIP value of the constructed model (list of VIP values in Tables 6a-6d
shown in ), when a model was further constructed using the analysis data of the top 100 components, a highly accurate model was constructed with R 2 = 0.82 indicating prediction accuracy and Q 2 = 0.78 indicating predictability ( hereinafter referred to as "prediction model A"). The results are shown in FIG.


Figure 2023090795000026
Figure 2023090795000026

Figure 2023090795000027
Figure 2023090795000027

Figure 2023090795000028
Figure 2023090795000028

Figure 2023090795000029
Figure 2023090795000029

9.各圃場に最適な施肥や資材の選抜
9-1.資材の選抜方法
2019年3月8日に評価対象とするダイズ生産予定圃場(水田転換畑、水稲-大麦-
大豆の2年3作)から土壌を採取した。同3月18日に採取した圃場土10Lに共通の元
肥としてベストマッチ(湯上がり娘専用600,カネコ種苗株式会社)1gを添加した(
混和された土壌の深さ20cmとして20kg/10a相当,圃場への施用量と同量)。
そこへ、選抜候補となる下記6種類の資材単体又はそれらの組合せを含めて異なる試験区
1~10を設定し、各資材の推奨量を添加し良く混和したのち、1Lずつ8個のポリポッ
トに充填した。各ポリポットに大豆種子(品種:里のほほえみ,山形県産平成30年品、
種子サイズ8.5mm以上)を播種し、1つのバットにポットを2個ずつ配置した上で、
室内の栽培棚(蛍光灯下)にて栽培を開始した。なお、適宜全てのバットに同条件で給水
を行った。
播種後4週間後の4月17日に前述の2に記載の方法と同様に葉のサンプリングを実施
した。各バット2個体からサンプリングした葉を混合し1つのサンプルとし、前述の4及
び5に記載の抽出・分析を行い各サンプルの成分データを取得した。なお、選抜する資材
の候補には以下を用いた。また試験区の詳細については表7に示した。
9. Selecting the best fertilizer and materials for each field
9-1. Material selection method
Soybean production fields to be evaluated on March 8, 2019 (paddy field conversion field, rice - barley -
Soil was collected from soybean crops (three crops in two years). To 10 L of the field soil collected on March 18, 1 g of Best Match (600 for exclusive use of Yugari Musume, Kaneko Seed Co., Ltd.) was added as a common base fertilizer (
Equivalent to 20 kg/10a at a depth of 20 cm of mixed soil, the same amount as applied to the field).
There, set different test plots 1 to 10 including the following 6 types of materials alone or their combinations that are candidates for selection, add the recommended amount of each material and mix well, then 1 L each in 8 poly pots filled. Soybean seeds (variety: Sato no Hohoemi, 2018 product from Yamagata Prefecture,
Seed size 8.5 mm or more) is sown, and two pots are placed in one bat,
Cultivation was started on an indoor cultivation rack (under fluorescent lamps). Water was appropriately supplied to all vats under the same conditions.
Four weeks after seeding, on April 17, leaf sampling was carried out in the same manner as described in 2 above. Leaves sampled from two individual bats were mixed to obtain one sample, and the extraction and analysis described in 4 and 5 above were performed to obtain component data of each sample. In addition, the following was used for the candidate of the material to select. Details of the test plots are shown in Table 7.

・MIX堆肥(川口肥料株式会社)
・天然サポニン粕(埼玉農工幾科販売株式会社)
・大豆油かす(日清オイリオグループ株式会社)
・砂状ようりん(赤城物産株式会社)
・微量要素8(アミノール化学研究所)
・硫安(あかぎ園芸)
・MIX compost (Kawaguchi Fertilizer Co., Ltd.)
・Natural saponin lees (Saitama Noko Ikuka Sales Co., Ltd.)
・Soybean cake (Nissin OilliO Group Inc.)
・Sand-like yorin (Akagi Bussan Co., Ltd.)
・Microelement 8 (Aminol Chemical Laboratory)
・Ammonium sulfate (Akagi gardening)

Figure 2023090795000030
Figure 2023090795000030

取得した成分データを前述のモデルAに取り込み、収量予測を行った結果を図16に示
す。なお、図16には各試験区n=4のデータを用いて、対照区である試験区1との予測
収量差を平均値±標準偏差で示している。MIX堆肥を施用した試験区2(単独施用)及
び9(MIX堆肥を含む他剤との混和)において、対照区に対して収量が高く予測された
。よって、試験区2と試験区9で共通するMIX堆肥を圃場栽培において使用する資材と
して選抜した。
FIG. 16 shows the result of yield prediction by incorporating the acquired component data into the model A described above. In addition, FIG. 16 shows the predicted yield difference from test plot 1, which is the control plot, by using the data of each test plot n=4 as an average value±standard deviation. In test plots 2 (single application) and 9 (mixture with other agents containing MIX compost) in which MIX compost was applied, a higher yield than the control plot was predicted. Therefore, the MIX compost common to test plots 2 and 9 was selected as a material to be used in field cultivation.

9-2.圃場試験での予測値確認及び実測収量結果
選抜した資材(MIX堆肥)の圃場での収量評価試験を、評価対象であるダイズ生産予
定圃場にて同年に実施した。播種日である6月25日の播種前に圃場内3ヵ所(3反復)
に資材を施用した。また比較対照となる未施用区も3反復設定した。なお、1ヵ所あたり
の試験区面積は2mとし、面積に合わせて室内栽培試験と同量の資材を施用した。播種
後1カ月後に当たる7月26日には葉のサンプリングを行い、選抜試験と同様に収量予測
を実施し、圃場試験での収量予測性が室内と同様であるか検討した。なお、葉のサンプリ
ングは各反復内の5個体分を混合したサンプルを2点、3反復で計6点のサンプルを取得
した。その結果を図17に示す。なお、図17には未施用区及びMIX堆肥区のn=6の
データを用いた予測収量の平均値±標準偏差を示している。
圃場試験での予測収量はMIX堆肥施用区で未施用に比べて有意(p<0.05、スチ
ューデントのt検定)に高くなり、選抜試験と同様の結果が確認された。
9-2. Confirmation of predicted values in field tests and actual measurement yield results
A field yield evaluation test of the selected material (MIX compost) was carried out in the same year in a field planned for soybean production, which is the object of evaluation. Before sowing on June 25, the sowing date, three sites in the field (three replicates)
material was applied to In addition, 3 repetitions of non-application plots were set as comparison controls. The test plot area per site was set to 2 m 2 , and the same amount of material as in the indoor cultivation test was applied according to the area. On July 26, one month after seeding, leaves were sampled and yield prediction was performed in the same manner as in the selection test to examine whether the yield predictability in the field test was the same as that in the room. For leaf sampling, 2 samples were obtained by mixing 5 individuals in each repetition, and a total of 6 samples were obtained in 3 repetitions. The results are shown in FIG. In addition, FIG. 17 shows the average value±standard deviation of the predicted yield using the data of n=6 in the unapplied area and the MIX compost area.
The predicted yield in the field test was significantly higher (p<0.05, Student's t-test) in the MIX compost application area than in the non-application area, confirming the same results as in the selection test.

葉のサンプリング以降も栽培を継続し、11月12日に収穫を行った。前述の3に記載
の方法で収量データを取得した。未施用区及びMIX堆肥区の収量値は、各反復内から1
0個体ずつを収穫した全30株の中から、収量の最も大きい2株及び最も小さい2株を除
いた26株の値から算出した。
その結果を図18に示す。なお、図18には未施用区及びMIX堆肥区のn=26のデ
ータを用いた実測収量の平均値±標準偏差を示している。
未施用区では18.7gDW/株であったのに対し、MIX堆肥区では20.7gDW
/株となり、10.7%の増収傾向が観測された。
以上の結果から、本収量予測モデルを用いることにより圃場栽培前の短期間にその年の
その圃場に合った資材を選抜し、その資材の施用により圃場栽培での増収が可能であるこ
とが示された。
Cultivation was continued after leaf sampling, and harvesting was carried out on November 12th. Yield data was obtained by the method described in 3 above. The yield value of the unapplied plot and the MIX compost plot is 1 from within each replicate.
It was calculated from the values of 26 strains excluding 2 strains with the highest yield and 2 strains with the lowest yield among all 30 strains from which 0 individuals were harvested.
The results are shown in FIG. In addition, FIG. 18 shows the average value±standard deviation of the measured yield using the data of n=26 in the unapplied area and the MIX compost area.
While it was 18.7 gDW / strain in the unapplied section, it was 20.7 gDW in the MIX compost section.
/ strain, and a 10.7% increase in revenue was observed.
From the above results, it is shown that by using this yield prediction model, it is possible to select the materials suitable for the field in the short period before field cultivation, and to increase the yield in field cultivation by applying the selected materials. was done.

10.播種後2週及び8週での収量予測可否の検討
上記では播種後1カ月程度で収量予測を実施した。より早期(播種後2週間)又は遅い
時期(播種後8週間)での収量予測性について以下検討した。
本試験は2019年3月から神奈川県内のガラスハウス内でポット栽培にて実施した。
ポットは1/5000aワグネルポットを30個用い、土壌は国内の圃場土を用いて各ポ
ットに4Lを充填した。全30ポットを施肥量の異なる3試験区A、B及びCの10ポッ
トずつ3群に分け、栽培を実施した。なお、肥料にはマグァンプK(ハイポネックス)を
用い、試験区Aでは10g/ポット、試験区Bでは5g/ポット及び試験区Cでは20g
/ポットを播種前に施用した。大豆種子はエンレイを用い、3月14日に播種を行った。
なお、1ポットに2つの種子を播種し、初生葉展開期に1株/ポットとなるように間引き
した。播種の2週間後である4月1日及び8週間後である5月9日に前述の2に記載の方
法と同様に葉のサンプリングを実施し、前述の4及び5に記載の抽出・分析を行い各サン
プルの成分データを取得した。最終的な収穫は、6月27日に行い、前述の3に記載の方
法で株毎の収量データを取得した。なお、播種後から収穫まで適宜潅水を行った。
10. Examination of whether yield prediction is possible at 2 weeks and 8 weeks after sowing
In the above, the yield prediction was performed about one month after seeding. The yield predictability at earlier (2 weeks after sowing) or later (8 weeks after sowing) was examined below.
This test was carried out from March 2019 by pot cultivation in a glass house in Kanagawa Prefecture.
Thirty 1/5000a Wagner pots were used as the pots, and 4 L of soil was filled in each pot using domestic field soil. All 30 pots were divided into 3 groups of 10 pots each of 3 test plots A, B and C with different fertilizer application amounts, and cultivation was carried out. Magump K (Hyponex) was used as fertilizer, 10 g/pot in test area A, 5 g/pot in test area B, and 20 g in test area C.
/ Pots were applied before sowing. Enlays were used as soybean seeds and sown on March 14th.
In addition, two seeds were sown in one pot and thinned out so as to obtain one plant/pot at the initial leaf development stage. On April 1, 2 weeks after seeding and on May 9, 8 weeks after seeding, leaf sampling was performed in the same manner as described in 2 above, and extraction and analysis described in 4 and 5 above. was performed to obtain component data for each sample. The final harvest was performed on June 27, and the yield data for each strain was obtained by the method described in 3 above. In addition, water was appropriately applied after sowing until harvest.

播種後2週間及び8週間時にサンプリングした葉からモデルAを用いて算出した各試験
区の予測収量と収穫時に測定した実測収量を比較した。結果を図19に示す。なお、図1
9には試験区A~Cのn=10のデータを用いて、予測収量及び実測収量の平均値±標準
偏差を示している。
播種後2週間時の予測収量は各試験区間の実測収量の差を反映しており、播種後2週間
においても収量性を評価できることが示された。一方で、播種後8週間においては収穫期
により近いにも関わらず、各試験区間の実測収量の差を反映していなかった。
これらの結果より、播種後2~4週などの生育初期においてより高い精度の予測が可能
であることが本収量予測方法の特徴であることが示された。
The predicted yield of each test plot calculated using model A from leaves sampled two weeks and eight weeks after sowing was compared with the actual yield measured at the time of harvest. The results are shown in FIG. In addition, Fig. 1
9 shows the mean ± standard deviation of predicted yield and measured yield using n = 10 data of test plots A to C.
The predicted yield at 2 weeks after sowing reflects the difference in the measured yield of each test section, and it was shown that the yield property can be evaluated even at 2 weeks after sowing. On the other hand, 8 weeks after sowing did not reflect the difference in the measured yield of each test plot even though it was closer to the harvest time.
From these results, it was shown that the present yield prediction method is characterized by the ability to predict with higher accuracy in the early stage of growth, such as 2 to 4 weeks after sowing.

11.圃場データを用いた収量予測モデル構築
11-1.各圃場試験の概要
11-1-1.2015年圃場試験
栃木県内の生産者圃場(水田転換畑、水稲-大麦-大豆の2年3作)にて栽培を実施し
た。播種前の施肥は、窒素:リン酸:カリウム=2.4:8:8(Kg/10a)となる
ように実施し、更に珪酸石灰肥料を10aあたり40kg加えた。品種は、里のほほえみ
を用いた。2015年6月15日に播種した。後述の通り葉のサンプリングを行い、収穫
は11月1日に実施した(播種後138日)。なお、収量予測用に圃場内3地点から9個
体又は10個体ずつ計29個体の採取を行った。
11. Yield prediction model construction using field data
11-1. Overview of each field trial
11-1-1. Field test in 2015 Cultivation was carried out in the producer's field in Tochigi Prefecture (paddy field conversion field, rice - barley - soybean 2 years 3 crops). Fertilization before seeding was carried out so that nitrogen:phosphate:potassium=2.4:8:8 (Kg/10a), and 40 kg of lime silicate fertilizer was added per 10a. Sato no Hohoemi was used as the cultivar. Seeded on June 15, 2015. Leaves were sampled as described below and harvested on November 1 (138 days after sowing). For yield prediction, a total of 29 individuals of 9 individuals or 10 individuals were collected from 3 points in the field.

11-1-2.2016年圃場試験(1)
宮城県にて栽培を実施した。播種前の施肥は、窒素:リン酸:カリウム=1.5:1.
5:1.5(Kg/10a)となるように実施した。品種は、エンレイを用いた。201
6年6月10日に播種した。後述の通り葉のサンプリングを行い、収穫は11月中旬に実
施した。なお、土壌の外観から圃場をA及びBの2区画に分け、収量予測用に区画A及び
区画Bより、それぞれ12個体ずつ計24個体の採取を行った。
11-1-2. Field test in 2016 (1)
Cultivation was carried out in Miyagi prefecture. Fertilization before sowing was nitrogen:phosphate:potassium=1.5:1.
5:1.5 (Kg/10a). The cultivar used was Enrei. 201
Seeds were sown on June 10, 6. Leaves were sampled as described below and harvested in mid-November. Based on the appearance of the soil, the field was divided into two sections, A and B, and a total of 24 individuals, 12 from each of sections A and B, were collected for yield prediction.

11-1-2.2016年圃場試験(2)
栃木県内の生産者圃場(水田転換畑、水稲-大麦-大豆の2年3作、ただし2015年
圃場試験とは異なる圃場)にて栽培を実施した。播種前の施肥は、2015年と同様に行
った。品種は、里のほほえみを用いた。2016年6月7日に播種した。後述の通り葉の
サンプリングを行い、収穫は11月下旬に実施した(播種後約160-170日)。なお
、収量予測用に圃場内3地点から10個体ずつ計30個体の採取を行う予定であったが、
2016年圃場では、青立ちが多数発生し、収量予測用に収穫できたのが8個体(30個
体中)であった。
11-1-2. Field test in 2016 (2)
Cultivation was carried out in the producer's field in Tochigi Prefecture (paddy field conversion field, paddy rice - barley - soybean 3 crops in 2 years, but different field from the 2015 field test). Fertilization before sowing was performed in the same manner as in 2015. Sato no Hohoemi was used as the cultivar. Seeded on June 7, 2016. Leaves were sampled as described below and harvested in late November (approximately 160-170 days after sowing). In addition, it was planned to collect a total of 30 individuals, 10 individuals each from 3 points in the field, for yield prediction.
In the field in 2016, a large number of green spots occurred, and 8 individuals (out of 30 individuals) could be harvested for yield prediction.

11-1-4.2017年圃場試験
栃木県内の生産者の3つの圃場(T、YS、YM)にて栽培を実施した。播種前の施肥
は、例年通り実施した。品種は、里のほほえみを用いた。播種は、圃場Tでは2017年
6月27日に、圃場YMでは6月29日に、そして圃場YSでは7月7日に実施した。後
述の通り葉のサンプリングを行い、収穫は、圃場Tでは11月28日に、圃場YMでは1
1月2日に、そして圃場YSでは11月2日に実施した。なお、収量予測用に圃場内5地
点から5個体ずつ採取し、5個体分をまとめて1サンプルとした。即ち、各圃場5サンプ
ル(25個体分)の計15サンプル(75個体分)の採取を行った。なお、各圃場の作付
け体系は、圃場Tが水稲-麦-大豆の2年3作、圃場YMでは水稲-水稲-麦-大豆の3
年4作、また圃場YSでは10年以上水稲の単作であった。
11-1-4. Field test in 2017 Cultivation was carried out in three fields (T, YS, YM) of producers in Tochigi Prefecture. Fertilization before seeding was carried out as usual. Sato no Hohoemi was used as the cultivar. Seeding was carried out in field T on June 27, 2017, in field YM on June 29, and in field YS on July 7. Leaves were sampled as described later.
It was carried out on January 2nd and in field YS on November 2nd. For yield prediction, 5 individuals were collected from 5 locations in the field, and the 5 individuals were collectively used as one sample. That is, a total of 15 samples (for 75 individuals) of 5 samples (for 25 individuals) from each field were collected. In addition, the cropping system of each field is as follows: Field T has three crops in two years of paddy rice - wheat - soybeans, and field YM has three crops of rice - paddy rice - wheat - soybeans
There were 4 crops a year, and paddy rice was monocropped for more than 10 years in the field YS.

11-2.葉のサンプリング
前述の2に記載の方法と同様に葉のサンプリングを行った。各圃場試験におけるサンプ
リングした際の播種からの日数及び日程は以下のとおりである。
*2015年圃場試験:2015年7月15日(播種後30日)
*2016年圃場試験(1):2016年7月21日(播種後41日)
*2016年圃場試験(2):2016年7月6日(播種後29日)
*2017年圃場試験_圃場T:2017年7月28日(播種後31日)
*2017年圃場試験_圃場YM:2017年7月31日(播種後32日)
*2017年圃場試験_圃場YS:2017年8月7日(播種後31日)
11-2. leaf sampling
Leaves were sampled in the same manner as described in 2 above. The number of days from sowing and the schedule for sampling in each field test are as follows.
* 2015 field test: July 15, 2015 (30 days after sowing)
* 2016 field test (1): July 21, 2016 (41 days after sowing)
* 2016 field test (2): July 6, 2016 (29 days after sowing)
* 2017 Field Test_Field T: July 28, 2017 (31 days after sowing)
* 2017 Field Test_Field YM: July 31, 2017 (32 days after sowing)
* 2017 Field Test_Field YS: August 7, 2017 (31 days after sowing)

11-3.予測モデル構築
2015-2017年に実施した圃場試験で得られた計76個の葉サンプルについて前
述の4及び5に記載の抽出・分析を行い各サンプルの分析データを取得した。これらのデ
ータは前述の6に記載の解析を行い、ポット試験データと同様に各サンプルに対して43
1成分の分析データを得た。予測モデル構築に用いる実測収量値は各圃場毎(ただし、2
016年圃場試験(1)は区画A及び区画Bに分割)の平均値を用いた。各圃場の平均収
量値は表8に示すように最小で10.27gDW/個体、最大で27.66gDW/個体
であった。
11-3. Predictive model building
A total of 76 leaf samples obtained in the field tests conducted in 2015-2017 were extracted and analyzed as described in 4 and 5 above to obtain analytical data for each sample. These data were analyzed as described in 6 above, and 43
Analytical data for one component was obtained. The measured yield values used to construct the prediction model are for each field (however, 2
016 field test (1) was divided into section A and section B), and the average value was used. As shown in Table 8, the average yield value of each field was 10.27 gDW/plant at minimum and 27.66 gDW/plant at maximum.

Figure 2023090795000031
Figure 2023090795000031

これらの結果から、各圃場毎の収量を予測するOPLSモデルを前述の解析ツールSI
MCAを用いて構築した。モデル構築の結果、予測精度を示すR=0.86、予測性を
示すQ=0.76であった。結果を図20に示す。
この予測モデルにより、栽培1カ月程度の葉に含まれる成分組成を用いることで、圃場
で採取したサンプルにおいても高い予測性能を持つモデルが構築でき、早期収量予測が可
能であることが示された。
Based on these results, the OPLS model that predicts the yield of each field was applied using the aforementioned analysis tool SI
Built using MCA. As a result of model building, R 2 =0.86 indicating prediction accuracy and Q 2 =0.76 indicating predictability. The results are shown in FIG.
Using this prediction model, it was shown that by using the component composition contained in leaves for about one month after cultivation, a model with high prediction performance can be constructed even for samples collected in the field, and early yield prediction is possible. .

Claims (4)

ダイズから採取された葉サンプルから1以上の成分の分析データを取得し、当該データとダイズ収量との相関性を利用してダイズの収量を予測する、ダイズの収量予測方法であって、前記1以上の成分がソヤサポニンBbである、方法。 1. A soybean yield prediction method comprising obtaining analysis data of one or more components from a leaf sample collected from soybean, and predicting the soybean yield using the correlation between the data and the soybean yield, A method, wherein the above component is soyasaponin Bb. 葉サンプルが、初生葉展開期から子実肥大期のダイズから採取される、請求項1に記載の方法。 2. The method of claim 1, wherein the leaf sample is taken from the soybean from the stage of primary leaf development to the stage of grain enlargement. 葉サンプルが、初生葉展開期から開花期までのダイズから採取される、請求項1又は2に記載の方法。 3. The method of claim 1 or 2, wherein the leaf sample is taken from the soybean from the primary leaf development stage to the flowering stage. 分析データが、質量分析データである請求項1~3のいずれか1項に記載の方法。 The method according to any one of claims 1 to 3, wherein the analytical data are mass spectrometric data.
JP2023070854A 2019-04-16 2023-04-24 Method of predicting soybean yield Pending JP2023090795A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019078179 2019-04-16
JP2019078179 2019-04-16
JP2020073359A JP2020174668A (en) 2019-04-16 2020-04-16 Method of predicting soybean yield

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020073359A Division JP2020174668A (en) 2019-04-16 2020-04-16 Method of predicting soybean yield

Publications (1)

Publication Number Publication Date
JP2023090795A true JP2023090795A (en) 2023-06-29

Family

ID=72936183

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020073359A Pending JP2020174668A (en) 2019-04-16 2020-04-16 Method of predicting soybean yield
JP2023070854A Pending JP2023090795A (en) 2019-04-16 2023-04-24 Method of predicting soybean yield

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020073359A Pending JP2020174668A (en) 2019-04-16 2020-04-16 Method of predicting soybean yield

Country Status (1)

Country Link
JP (2) JP2020174668A (en)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5516528A (en) * 1995-01-13 1996-05-14 Wake Forest University Dietary phytoestrogen in estrogen replacement therapy
US5821361A (en) * 1996-06-11 1998-10-13 Protein Technologies International, Inc. Recovery of isoflavones from soy molasses
CA2674602C (en) * 2007-01-09 2017-05-09 Merck Patent Gmbh Lipo-chitooligosaccharide combination compositions for enhanced plant growth and yield
CN101891796A (en) * 2010-08-04 2010-11-24 上海交通大学 Preparation method of high-purity soyasaponin monomers
ES2865728T3 (en) * 2010-11-17 2021-10-15 Pioneer Hi Bred Int Prediction of phenotypes and traits based on the metabolome
CN102768246B (en) * 2011-05-06 2013-12-04 中国科学院大连化学物理研究所 Flavonoid metabolic profiling analysis method based on nanofluidic channel liquid chromatogram/mass spectrum
EP2996463B1 (en) * 2013-05-17 2019-07-17 Bayer CropScience NV Methods and means for determining plant characteristics
CN103323557A (en) * 2013-06-16 2013-09-25 中国科学院成都生物研究所 Method for analyzing isoflavone in soybeans and products thereof
CN106706820B (en) * 2015-11-13 2018-05-25 中国科学院大连化学物理研究所 A kind of bearing calibration of general extensive metabolism group data
JP6786262B2 (en) * 2016-05-23 2020-11-18 キリンホールディングス株式会社 Beer-taste beverage and its manufacturing method
JP2018062492A (en) * 2016-10-14 2018-04-19 株式会社Kri Method for producing phenols from lignin-containing biomass
CN109444314A (en) * 2018-11-28 2019-03-08 中国农业科学院作物科学研究所 The method and application of -1 pyrrolin content of soybean odor characteristic compound 2- acetyl group are quickly analyzed using GC-MS method

Also Published As

Publication number Publication date
JP2020174668A (en) 2020-10-29

Similar Documents

Publication Publication Date Title
Deborde et al. Plant metabolism as studied by NMR spectroscopy
WO2020213672A1 (en) Method of predicting soybean yield
Camin et al. Isotopic and elemental data for tracing the origin of European olive oils
Wang et al. Metabolomics in the context of systems biology: bridging traditional Chinese medicine and molecular pharmacology
Hynson et al. Isotopic evidence of full and partial myco‐heterotrophy in the plant tribe Pyroleae (Ericaceae)
Taiti et al. Correlation between volatile compounds and spiciness in domesticated and wild fresh chili peppers
WO2022080411A1 (en) Method for predicting soybean yield
Mahanta et al. A 1H‐NMR spectroscopic method for the analysis of thermolabile chemical markers from the essential oil of black turmeric (Curcuma caesia) rhizome: application in post‐harvest analysis
Latif et al. Metabolomic approaches for the identification of flavonoids associated with weed suppression in selected Hardseeded annual pasture legumes
Çatav et al. NMR-based metabolomics reveals that plant-derived smoke stimulates root growth via affecting carbohydrate and energy metabolism in maize
Abasolo et al. Deviant near-infrared spectra identifies Corymbia hybrids
Belane et al. Measurement of N 2 fixation in 30 cowpea (Vigna unguiculata L. Walp.) genotypes under field conditions in Ghana, using the 15 N natural abundance technique
Bindereif et al. Complementary use of 1H NMR and multi-element IRMS in association with chemometrics enables effective origin analysis of cocoa beans (Theobroma cacao L.)
Lee et al. LC–MS metabolomics analysis of Stevia rebaudiana Bertoni leaves cultivated in Malaysia in relation to different developmental stages
Tan et al. Invasive Rhus typhina invests more in height growth and traits associated with light acquisition than do native and non-invasive alien shrub species
Bora et al. A sensitive 1H NMR spectroscopic method for the quantification of capsaicin and capsaicinoid: morpho‐chemical characterisation of chili land races from northeast India
Kumar et al. Biplot investigation for essential oil yield and chemical compositions under the Deccan Plateau region of southern India in cultivars of Java citronella (Cymbopogon winterianus Jowitt)
Sauvadet et al. Agroecosystem diversification with legumes or non-legumes improves differently soil fertility according to soil type
JP7244338B2 (en) Soybean yield prediction method
Matsuura et al. Germination stimulant from root exudates of Vigna unguiculata
JP2023090795A (en) Method of predicting soybean yield
Malagoli et al. Variations of elements, pigments, amino acids and secondary metabolites in Vitis vinifera (L.) cv Garganega after 501 biodynamic treatment
Pariyani et al. Untargeted metabolic fingerprinting reveals impact of growth stage and location on composition of sea buckthorn (Hippophaë rhamnoides) leaves
de Resende et al. Use of green manures in increasing inputs of biologically fixed nitrogen to sugar cane
Rozali et al. Identification of amines, amino and organic acids in oil palm (Elaeis guineensis Jacq.) spear leaf using GC-and LC/Q-TOF MS metabolomics platforms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230522