JP2021509212A - 病害の予測・コントロール方法、及びそのシステム - Google Patents

病害の予測・コントロール方法、及びそのシステム Download PDF

Info

Publication number
JP2021509212A
JP2021509212A JP2020543451A JP2020543451A JP2021509212A JP 2021509212 A JP2021509212 A JP 2021509212A JP 2020543451 A JP2020543451 A JP 2020543451A JP 2020543451 A JP2020543451 A JP 2020543451A JP 2021509212 A JP2021509212 A JP 2021509212A
Authority
JP
Japan
Prior art keywords
disease
peptide
data
prediction model
spore germination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020543451A
Other languages
English (en)
Inventor
チェン・ウェンリアン
リー・シャオチン
リン・チアハァン
ウー・チェンフン
リアン・チュンウェイ
リン・ズーシュアン
フアン・ティファニー
チョウ・イーティン
チャン・フェンチャン
チェン・ペンズー
リン・チアシュアン
リウ・ジュンイー
ウー・チェンチュアン
チャン・ティエンイー
ロー・イーチアオ
スー・カイシアン
リー・インシン
グオ・ミンジエ
Original Assignee
国立交通大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立交通大学 filed Critical 国立交通大学
Publication of JP2021509212A publication Critical patent/JP2021509212A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)
  • Cultivation Of Plants (AREA)

Abstract

本開示は、病害発生の確率を予測することと、病原体及び/又は宿主を同定するための適切かつ効果的なコントロール対策を提案することとを含む植物病害のコントロール方法を提供する。本開示はさらに、推奨の管理行為及び他の警告、通知を含む助言サービスを提供する。【選択図】図1

Description

本開示は、病害の予測及びコントロールに関し、特に、病害の発生を予測し、予測された病害の対策により当該病害をコントロールする方法に関する。
真菌等の病原体が原因となる植物病害は、農場の作物や土壌に影響を与え、農業にとって常に問題となっている。真菌病害は植物病害の全体に3分の2を占めている。一般に、真菌病害を解消するために化学農薬を使用するか、農場全体を廃棄してしまう。そのために、植物病害が大きな経済的損失につながる。特に、ここ数年気候の大きな変動が観測されるため、病原体感染の発生を予測し適切なコントロール対策を提案するための害虫や病害モデルの改善又は適用は、農業分野で依然として大きな課題である。
しかしながら、ここ数十年、情報技術の大幅な進歩により、農業を含む様々な分野で問題の解決につながる革新的な方法が提供される。探査又は農薬使用を計画するための支援機能の発展を目的とする作物病害や害虫のモデル作成は、既に適用されている。病害の発生時間と確率、又は病原体の種類と適切な殺虫剤のより一層の予測が求められる。
また、現時点で作物管理に関連する多くの種類の大量の情報を収集し、後続の分析に備え保存しておくことが可能ではあるが、これらの膨大なデータを効率的に利用する必要がある。これらの膨大なデータを整理及び評価し、分析のための最適な方法を見つけるには時間がかかる。したがって、短時間内に膨大なデータを処理して、病原体の脅威に速やかに適切な対策が取れるよう、データによる効率的なモデル作成が必要である。
本開示は、植物病害のコントロールのためのシステムを提供する。また、本開示の目的は、病害発生の確率を予測し、同定された病原体及び/又は作物に適切かつ効果的なコントロール対策を推奨することである。さらに本開示は、植物病害の効果的なコントロール対策を予測するための関連データを含む統合型のデータベースを提供する。さらに本開示は、気象条件及び作物管理の実施を検査して特定の期間に、ある領域内に病害が発生するリスクのモデル作成を行って、当該領域内の病害発生の予測を生成するシステム及び方法を提供する。さらに本開示は、1種以上の管理行為が速やかにとれるように、栽培者、地主、作物顧問、他の責任者に観測対象領域内における病原体の存在の可能性に関する指示を提供する。さらに本開示は、観測対象領域内における病原体の存在のリスクがあるか又はその予測がある場所にいる栽培者、地主、作物顧問、他の責任者に、推奨の管理行為、他の警告、通知を含む助言サービスを提供する。
本開示は、環境情報を検出するように設定された複数のセンサーと、病害データ及び気象データを収集し、当該病害データと当該気象データを組み合わせて複合データを形成し、機械トレーニングプロセス及びテストプロセスにより当該複合データを処理し、複数の病害発生のパターンを同定するように、病害予測モデルを作成するように設定されたプロセッサとを含み、ただし当該病害予測モデルは当該環境情報、当該パターンに基づいて病害発生の確率を算出するように設定される病害のコントロールのためのシステムを提供する。一つの実施形態において、当該病害予測モデルによって収集された気象データは、観測時間、圧力、温度、露点温度、相対湿度、風速、風向、降水量、日照時間、視程、紫外線指数、雲量の少なくとも一方を含む。
一つの実施形態において、当該病害予測モデルの病害データは、当該病害発生の指示に係る陽性ラベル及び陰性ラベルを含む。
一つの実施形態において、当該病害予測モデルのプロセッサは、当該病害データ、当該気象データから特徴を抽出するようにさらに設定され、これらの特徴は機械トレーニングプロセス及びテストプロセスのためにプロセッサによって処理される。一つの実施形態において、当該機械トレーニングプロセス、当該テストプロセスは、畳み込みニューラルネットワーク(convolutional neural network、略称CNN)に関連付ける。
一つの実施形態において、本開示は、モノのインターネット(IoT)技術によって環境情報を当該病害予測モデルに伝送するように設定されたセンサーを有する病害のコントロールのためのシステムを提供する。別の実施形態において、当該環境情報は、相対湿度、温度、降水量、圧力の少なくとも一方を含む。別の実施形態において、当該気象データは5日間、7日間、10日間、14日間、18日間、又は21日間の期間にわたって収集される。一つの実施形態において、当該気象データは14日間の期間以内に収集される。
一つの実施形態において、本開示はさらに、これらのパターンを、病害が起こらないことを示す陰性の出力、又は病害が起こることを示す陽性の出力に分類するように当該病害予測モデルを作成するように当該プロセッサが設定される病害のコントロールのためのシステムを提供する。別の実施形態において、当該病害予測モデルは、当該陰性の出力又は陽性の出力に基づいて警告を発するようにさらに設定される。別の実施形態において、当該プロセッサは、当該環境情報に基づいて胞子発生率を算出するように設定された胞子発生モデルを作成するようにさらに設定される。別の実施形態において、当該胞子発生モデルは、相対湿度及び温度に基づく。別の実施形態において、当該胞子発生モデルが基づく相対湿度、温度は、独立な事象である。
一つの実施形態において、本開示は、当該病害予測モデル及び当該胞子発生モデルによって病害発生の時間を提供するように当該プロセッサが設定された病害のコントロールのためのシステムを提供する。別の実施形態において、当該病害予測モデル又は当該胞子発生モデルは、モノのインターネット(IoT)技術によって当該病害発生の確率又は当該病害発生の時間を散布システムに伝送するように設定される。別の実施形態において、当該胞子発生率は、ボトリティス・シネレア(Botrytis cinerea)の胞子発芽率、ミセリオフトーラ・サーモフィラ(Myce−liophthora thermophila)の胞子発芽率、クロコウジカビ(Aspergillus niger)の胞子発芽率、イネいもち病菌(P. oryzae)の胞子発芽率、ジプロディア・コルチコラ(Diplodia corticola)の胞子発芽率、又はプソイドセルコスポラ(Pseudocercospora)の胞子発芽率である。
一つの実施形態において、本開示はさらに、当該プロセッサが、スコアカード法(Scoring Card Method、略称SCM)によって抗真菌機能を有するペプチドを予測するように設定されたペプチド予測モデルをさらに含む病害のコントロールのためのシステムを提供する。別の実施形態において、当該ペプチド予測モデルは、ペプチドを構成するジペプチドの傾向を決定することによってペプチドのスコアを算出することを含む。別の実施形態において、当該ペプチド予測モデルは、当該ペプチドの配列を分析することによってペプチドのスコアを算出することを含む。別の実施形態において、当該ペプチド予測モデルは、宿主、病原体と対応するペプチドの関係を含む検索システムを含むようにさらに設定される。さらに別の実施形態において、当該病害のコントロールのためのシステムは、当該病害発生の確率に基づいて抗真菌機能を有するペプチドを1つの領域に散布するように設定された散布システムに接続される。
なお、本開示に係る他の形態と特徴は、例示的な方式で本開示の原理を説明する実施形態に関する説明と添付の図面から明らかになるであろう。
図1は、1群のジペプチドとして表示されたペプチドの模式図を示す。 図2は、ペプチド予測モデルにおいて収集及び使用されたデータセットの数量を示す。 図3は、スコアカードによりペプチドスコアを算出する手順を例示的に説明する。 図4は、IGAの実装に係るフローチャートを示す。 図5は、混同行列において適応度の算出のために使用された4つのクラスを示す。 図6は、TPRをy軸としFPRをx軸として描画された適応度の算出のためのROC曲線を示す。 図7は、円グラフ法において、スコアカードの各重みをその適応度に比例して異なる面積のエリアに分けることを示す。 図8は、IGAにおける交叉の手順を示す。 図9は、交叉においてパラメータがどのように決定されるかを示す。 図10は、抗真菌ペプチド予測に基づく、25%の配列同一性を有する抗真菌ペプチドの最終的なROC曲線及びテストデータセットの結果を示す。 図11は、抗真菌ペプチド予測に基づく、25%の配列同一性を有する抗真菌ペプチドの陽性データセット及び陰性データセットのスコア分布を示す。 図12は、ジペプチドスコアの最終的な抗真菌スコアカードを示す。 図13は、各ジペプチドスコアから算出された単一アミノ酸スコアの棒グラフを示す。 図14は、予測モデルによって算出されたジペプチドスコアに基づく陰影づけされたRs−AFP2の3D構造を示す。 図15は、文献の報告に基づいて活性領域に濃い陰影がつけられたRs−AFP2ペプチドの3D構造を示す。 図16は、病害予測モデルに用いられたデータ処理のフローチャートを示す。 図17は、畳み込み層と最大プーリング層と複数の全結合層とを含む病害予測モデルに用いられたCNN方法の概要を示す。 図18は、病害予測モデルの正解率の改善に係るフローチャートを示す。 図19は、病害予測モデル用の独立なテストデータの結果を示す。 図20は、温度に基づくミセリオフトーラ・サーモフィラの胞子発芽率を示す。 図21は、温度に基づくクロコウジカビの胞子発芽率を示す。 図22は、温度に基づくイネいもち病菌の胞子発芽率を示す。 図23は、温度に基づくジプロディア・コルチコラの胞子発芽率を示す。 図24は、相対湿度に基づくクロコウジカビの胞子発芽率を示す。 図25は、相対湿度に基づくプソイドセルコスポラの胞子発芽率を示す。 図26は、一般的な真菌胞子発芽モデルの係数を決定し当該モデルを検証するための実験設計を示す。 図27は、10℃及び100%の相対湿度で9時間において発芽しなかった胞子の写真を示す。 図28は、25℃及び100%の相対湿度で9時間において発芽した胞子の写真を示す。 図29は、100%の固定された相対湿度における10〜30℃の温度範囲での9時間におけるボトリティス・シネレアの胞子発芽率の表を示す。 図30は、100%の固定された相対湿度における10〜30℃の温度範囲での9時間におけるボトリティス・シネレアの胞子発芽率の曲線を示す。 図31は、20℃の固定された温度における70〜100%の範囲の相対湿度でのボトリティス・シネレアの胞子発芽率を示す。 図32は、一般的な胞子発芽モデルの独立な事象の検証結果のまとめを示す。 図33は、23℃及び湿度97%の条件における9時間の胞子発芽実験の写真を示す。 図34は、13℃及び80%の相対湿度の条件で9時間にわたる胞子発芽実験の写真を示す。 図35は、IoTにおける病害発生予測モデルの適用に係る主な構成を示す。
本開示は、異なる病害の発生を予測し当該病害の対策を提供するシステム及び方法を開発するための枠組みである。当該枠組みは、機械学習及びビッグデータ分析を利用しており、ペプチド予測モデルと病害発生予測モデルとを含む。
本開示に係る枠組みにおいて、当該ペプチド予測モデルは、SCMに基づく抗真菌ペプチド予測システムと目的病害の関連データとを含むデータベースを含む。当該病害発生予測モデルは、病害の確率及び発生のタイミングを予測するためにCNN技術によって作成される。当該枠組みの構成要素はIoT技術によって接続され、当該システムは集計されたデータのクラウドコンピューティングによって動作する。
[ペプチド予測モデル]
当該ペプチド予測モデルは、ユーザーが病害のコントロール対策として用いる目的ペプチドを効果的に同定することができる。真菌病害に用いる目的抗真菌ペプチドを予測するために、潜在的な抗真菌ペプチドを評価及び予測する抗真菌予測システムと、宿主、病原体と対応するペプチドの関係を含む検索システムとを含む抗真菌データベースを確立する。したがって、当該抗真菌データベースは、ユーザーのニーズに応じる宿主、病原体及び対応するペプチドの照合を可能にし、抗真菌ペプチドによる新薬の発見と旧薬の転用の両方でその機能を強化できる。
本開示は、人工知能を利用して、さらに最適化して設定されたSCMに基づく抗真菌ペプチド予測システムによって大規模なデータセットの性能を向上させる。本開示の抗真菌ペプチド予測システムは、配列分析だけに基づいてペプチドの抗真菌特性を評価及び予測し、シンプルで、解釈可能でありかつ満足のいく正解率を有するペプチド予測を行う方法を提供する。
当該SCMは、サポートベクターマシン(Support Vector Machine、略称SVM)に基づく非特許文献[1]に記載の方法である。ペプチドの抗真菌属性を予測及び評価するために、機械学習用の生物学的情報の観点からSCMをペプチド予測モデルに導入する。本開示のペプチド予測モデルに用いられるSCMは、当該ペプチドの機能を予測するだけでなく、当該ペプチドの重要なドメインも予測できる。本開示のペプチド予測モデルにおいて、当該SCMは、ジペプチドスコアの算出と、遺伝的アルゴリズムに基づくインテリジェント遺伝的アルゴリズム(IGA)との少なくとも2つの部分を含む。
ペプチド予測モデルは、本明細書で次に説明されるデータセットと、ジペプチドと重みの分析によるペプチドのスコアリングと、インテリジェント遺伝的アルゴリズム(IGA)とによって実装される。
本開示のペプチド予測モデルのデータセットは、陽性データと、陰性データとを含む。当該陽性データは、抗真菌属性を有するペプチドであり、CAMP、PhytAMP等の抗真菌データベースに由来するペプチド、又は技術文献に記載又はPubMed等のパブリックドメインに開示されているペプチドを含んでもよい。当該陰性データは、抗真菌属性を有しないペプチドであり、UniProt等のタンパク質又はペプチド関係のデータベースに抗真菌と注釈されていないペプチドを含んでもよい。トレーニングデータセット、テストデータセットは、陽性データ及び陰性データの配列同一性を低減するように作成され、これらのデータは、各データセットが陽性データと、陰性データとを等量に含むように2つの部分に分けられる。
「ジペプチド」は2つのアミノ酸(AA)からなり、最小の機能単位とみなされる。図1は、1群のジペプチドとして表示されたペプチドを示す。ペプチドの抗真菌特性的予測は、当該ペプチドの配列分析に基づく。より多くの潜在的な抗真菌ジペプチドを含むペプチドは抗真菌ペプチドである可能性が高く、逆もまた同様である。全400個の個別なジペプチドに係るジペプチド傾向は、抗真菌ペプチド及び非抗真菌ペプチドのジペプチド組成に対する統計的識別により得られる。各ペプチドの各ジペプチド頻度と重みを掛け算してスコアを得る。当該ペプチドの当該スコアが導出された閾値より高い場合は、抗真菌ペプチドとして予測される。ペプチドのスコアが高いほど、抗真菌機能を有する確率が高いことが示される。
各ジペプチドの初期の重み値は、陽性データセットに出現する当該ジペプチドの割合から陰性データセットに出現する同割合を引いたものである。さらに、当該重み値はIGAによって最適化される。
重みの選択に選択の方法を用いる。全ての重みの中から、最高の適応度の値を有し、又は選択の方法によって選択される2つの重みを取り出す。当該適応度の値は、初期の傾向スコア及び最適化された傾向スコアとAUCの相関係数の関数として算出され、AUCはROC(Receiver Operating Characteristic、受信者操作特性)曲線下面積である。AUCが1に近づくほど、当該予測モデルの正解率が高いことが示される。
当該ペプチド予測モデルは、交叉選択及び最適化が実装されたIGA(インテリジェント遺伝的アルゴリズム)をさらに含む。本明細書において、交叉選択は、ランダムに選択して交換させる2つの重みである1対のパラメータの交叉選択である。最適化は、非特許文献[2]に記載の従来技術であり、当該選択関数が異なるパラメータセットの数量を低減するように設計された大規模なパラメータの最適化用の進歩性のある方法を含む。
当該ペプチド予測モデルは、当該ペプチド予測における関連データの相関性を含む検索システムを含むようにさらに設定される。これらの関連データは、宿主、病原体、ペプチドを含んでもよい。これらの関連データは、特定の宿主又は特定の病原体に対する潛在的なペプチドの効率的な検索を提供する単一の抗真菌データベースに集約される。また、当該抗真菌データベースは宿主とペプチド又は病原体とペプチドのクロスマッチが可能であり、これによって以前に同定された薬剤の転用が実現できる。
「病害発生モデル」
当該病害発生モデルは、病害発生に係る毎日の確率を提供する。当該病害発生モデルにおいて、畳み込みニューラルネットワーク(Convolutional Neural Network、略称CNN)方法を用いて人間に認識しにくい気象パターンを把握する。さらに、当該病害発生モデルは、IoT技術を用いて警告システム及び自動散布システムに接続させて、当該ペプチド予測モデルによって予測されたペプチドを農場に適用する。
当該病害発生モデルは、過去の真菌病害データ及び気象データを含むデータセットを用いて、ソフトマックス(softmax)関数、モデル損失関数(model cost function)及びオプティマイザを用いたCNN方法に基づいて実装される。さらに、当該病害発生モデルは、本明細書に説明されるIoTシステムに接続される。
本開示に係る病害のコントロールのためのシステムは、少なくとも部分的に真菌病害の発生率に関係する気象条件に基づく。本開示において、相対湿度、温度、気圧及び降水量の4種類の気象条件によって示される気象データを所定の期間にわたって収集する。一つの実施形態において、過去14日間の気象データを収集する。一つの実施形態において、収集した気象データに基づく合計で11の特徴を畳み込みニューラルネットワーク(CNN)に使用して、当該病害発生に係る毎日の確率を算出する。別の実施形態において、CNNに加え、さらに胞子発芽率を算出して胞子発芽の正確な時間の予測を提供する。当該システムの構成要素、例えば、データを収集するセンサー、予測された発生時間に基づいて予測されたペプチドを適用する散布装置等は、IoTを介して接続される。
当該病害発生モデルは、真菌病害データ及び真菌病害が起こった時の気象データの2種類のデータを含む。当該真菌病害データは、政府機関より取得でき、当該気象データは中央気象局より収集できる。当該データの前処理は当該真菌病害データと当該気象データを組み合わせることを含み、対応する気象データのない真菌病害データは削除される。次に、機械トレーニング及びテストを行うためにこれらのデータを標準化する。当該気象データ特徴のパターンを自動的に認識するためにCNNを採用する。CNNによって、当該真菌病害に好まれる気象変化のパターンを認識して把握する。本開示の病害発生モデルにおいて、CNNは、特定の時間における真菌病害の発生に好適な気象変化を同定する。
当該病害発生モデルは、当該CNNの他に、最大プーリング層(max pooling layer)をさらに含む。データがこれらのCNN層を流れた後、データ量が大幅に増加し、追加された当該最大プーリング層は、当該モデルの演算に係る複雑さを低減し当該データの最適な傾向を発見するために役立つ。
当該病害発生モデルは、最大プーリング出力を高次元空間に変換し、陰性(病害が起こらない)及び陽性(病害が起こっている)の2つのクラスに分類する全結合層(full connection layer)をさらに含む。
当該病害発生モデルは、CNNからの出力を病害発生の確率に変換するように、ソフトマックス(softmax)関数をさらに含む。変換される前のネットワークの出力は人間が認識しにくい。当該ソフトマックス(softmax)関数は当該出力を機械にも人間にも理解できる病害発生の確率に変換する。
また、トレーニングの段階で、予測された値と実際の値の差を評価するために、クロスエントロピー(cross−entropy)を用いる。当該病害発生モデルをテストするために用いられた独立なデータは、当該モデルの正解率が83%であることを示す。
当該病害発生モデルは、胞子発芽率を予測するための胞子発芽のモデル作成をさらに含み、したがって、病害発生の予測はより効果的かつ速やかになる。当該胞子発芽のモデル作成は、湿度に基づく胞子発芽率の線形方程式の当てはめと、温度に基づく胞子発芽率の三次方程式の当てはめとを含む。両者を掛け算して一般的な胞子発芽のモデル作成を実現する。当該モデル作成を検証し関連の係数を決定するために胞子発芽実験を実施する。
(実施例)
本開示に係る次なる説明において、本開示の原理と実施の形態を示す例が参照される。本開示の範囲から逸脱することなく本開示、及びその構造的又は機能的な変更を実施するために他の実施形態が用いられる。
実施例1:ペプチド予測モデルの確立
ローカルデータベースより取得された新規なペプチドに加え、CAMP、APD、PhytAMP等のオンラインのパブリックデータベースより陽性(抗真菌)データセットを収集し、タンパク質又はペプチド関係のパブリックデータベースUniProtより、関連の抗真菌特性又は抗菌特性を有しない陰性(抗真菌属性を有しないペプチド)データセットを収集する。
収集したデータセットに、非標準アミノ酸を含むペプチドの削除を含む前処理を行う。次に、抗真菌ペプチドが典型的に10〜100個のアミノ酸の長さであるため、当該データセットのペプチドを10〜100AAの間の長さに限定する。さらに、同一性が25%を超えないように当該ペプチドをフィルタする。次に、等量の陰性データ及び陽性データを選択する。次に、当該陽性データセット及び当該陰性データセットをランダムに分布させ、当該データの3分の1を独立なテストセットとして使用する。
図2は、収集及び使用されたデータセットの数量を示す。合計で375個の陽性データ及び375個の陰性データがあり、当該データセットの3分の2は、トレーニングデータとしてランダムに選択され、当該データセットの3分の1は、独立なテストデータセットである。
簡単に言えば、当該データセット内の各ペプチドに対して、そのジペプチド頻度を算出する。次に、統計的方法を用いて特定の各ジペプチドの初期の重みを付与する。当該ジペプチド頻度行列と重み行列の掛け算を行って、当該ペプチドスコアを導出する。評価されるペプチドは、そのスコアが高いほど、抗真菌機能を有する可能性が大きい。
「ジペプチド頻度」
各ペプチドにおいて、合計で20種類のアミノ酸(AA)が存在し、次式に示すように400種のジペプチド頻度が生じるため、400×1のジペプチド頻度行列が形成される。
Figure 2021509212
次に、各ペプチドに対し、そのペプチド配列に基づいて当該ジペプチド頻度と重みのスコアカード行列を掛け算することによってスコアを付与する。図3は、どのようにスコアカードによってペプチドスコアを算出するかを例示的に説明する。最初に、当該20×20行列を400×1行列に書き換え、次に当該スコアカード行列と掛け算する。次式によって最終的なスコアを得る。ここで、xiはジペプチド頻度であり、wiは対応する重みである。
Figure 2021509212
算出した当該ペプチドのスコアを閾値と比較して、抗真菌ペプチド又は非抗真菌ペプチドとしてのその傾向を予測する。
Figure 2021509212
「重み」
当該ペプチドのスコアリングに使用される初期の重みは、最初に決定する陽性データセットのジペプチド頻度P(ij)、陰性データセットのジペプチド頻度N(ij)を含み、両者は次の方程式により算出される。ここで、nijはij番目のジペプチドの出現回数を、Lp−1は全てのペプチドの長さから各1を引いた後のそれらの和を表す。
Figure 2021509212
Figure 2021509212
次に、陽性データの頻度(P(ij))から陰性データの頻度(N(ij))を引いて各重み(S(ij))を算出する。
Figure 2021509212
このように得た各々の重みを[0,1]に正規化して1000を掛ける。
Figure 2021509212
このように、1組のジペプチド重みS′(ij)を含む初期のスコアカードを得る。
次に、IGAを用いて当該初期のスコアカードを最適化する。図4は、IGAの実装に係るフローチャートを示す。最初に、当該初期のスコアカードとランダムに初期化された別のスコアカードを組み合わせて第1の集団を作成する。次に、各スコアカードの適応度を算出する。当該スコアカードが終了条件を満たすと、トレーニングデータで最適な適応度を有する最終的なスコアカードを返す。最高の正解率を得て当該モデルの過トレーニングを防ぐために、プログラムの終了条件は30世代後に終了することとする。当該終了条件がまだ満たされていない場合は、当該スコアカードを選択ステップに切り替え、これによって交叉ステップに複数対のスコアカードを選択して、新規な子孫スコアカードを作成する。次に、当該新規な子孫スコアカードを突然変異ステップに渡す。突然変異ステップの後、当該新規な子孫を集団に追加し、その適応度によって当該集団をランク付けする。さらに、ランク付けの結果、最大集団(max_population)外に位置するスコアカードを除去する。
さらに、適応度の算出について説明する。最初に、図5に示すように、予測部分(prediction section)及びラベル部分(label section)に分けて、TP(真陽性)、FP(偽陽性)、FN(假陰性)、TN(真陰性)の4つのクラスに分類するように混同行列を算出する。次に、次式のように真陽性率(TPR)、偽陽性率(FPR)を算出する。
Figure 2021509212
Figure 2021509212
次に、図6に示すように、TPRをy軸としFPRをx軸としてROC曲線を描画する。陽性データと陰性データを区別する閾値が異なるため、TP、FP、FN、TNは異なる。結果として、各閾値に異なるTPR及びFPRが得られ、各TPR及びFPRでROC曲線を描画する。重みの適応度を評価するために、ROC曲線下面積(AUC)を算出する。当該ROC曲線のAUCは、非抗真菌ペプチドが抗真菌ペプチドをはるかに超える本実施例のように不均衡なデータセットを有するモデルに適する。
AUC値に加え、初期のスコアカードとテスト対象のスコアカードのアミノ酸のピアソン(Pearson)係数も、適応度の算出に考慮される。各値に異なる重みが付与され、最適なトレーニングパフォーマンスを得るために、AUC値を0.9とし、ピアソン(Pearson)係数を0.1とする。モデルにピアソン(Pearson)係数を用いると過トレーニングは防げる。
次に、当該初期のスコアカードを適化するために、高度な交叉を用いて機械学習用のバリエーションを生成する。各ラウンドにおいて、選択の方法によって2つの重みを選択する。通常の交叉より高度な交叉が最適化されると、突然変異が完了し、新たな重みを当該集団に入れる。
具体的には、当該選択の方法は、全ての重みの中から2つの重みを取り出すことを含み、その一方は最大の適応度の値、即ち最大のAUCを有し、最適な重みである可能性があり、他方は円グラフ法によって選択される。円グラフ法は、当該スコアカードの各重みをその適応度に比例して異なる面積のエリアに分けるように行う。重みの適応度が高いほど、当該重みに大きい面積のエリアが付与される(図7参照)。次に、ランダムに数字を選択し、ランダムに選択された当該数字のエリアのスコアカードを選択する。当該円グラフ法は、選択がランダムに行われるよう保証するために利用される。したがって、絶対的とは言えないが、スコアカードの適応度がより高いほど、選択される可能性は高い。
親が選択された後、IGAを利用して交叉を最適化する。IGAは、交叉選択が最も重要な選択である通常の遺伝的アルゴリズム(GA)に基づく。2つの親が選択された後、交叉は交換用に1対のパラメータを選択し、次に交換されたスコアカードを新規な集団に戻すことを含む(図8参照)。次に、当該集団を所定の範囲内に保つために、比較的低い適応度のスコアカードを削除する。
交叉用の最適なパラメータのセットを選択するために、次に示す目的関数を最大化する。ここで、各x1、x2、x3は、評価される1対のペプチド頻度を表す。
Figure 2021509212
交叉ステップの2つの親のように、各x1、x2、x3に2つの候補を選択する。IGAの機能を最大化するために、最初のステップとして、次のとおりのOAアレイを作成する。
Figure 2021509212
1の値を評価するためにカギとなるのは、x2及びx3の影響を排除することである。図9は、x1の決定に関する一例である。なお、x1の評価を得るために、組み合わせ1及び組み合わせ2が対になり、組み合わせ3と組み合わせ4が対になる。重みSj2の値が重みSj1の値より大きいため、x1のより好適なパラメータは1ではなく2になる。他のパラメータは類似の方法によって選択される。パラメータの数量が十分に大きいのであれば、他のパラメータの影響が限定される。
交叉した後、新規な子孫に突然変異ステップを行う。当該突然変異ステップにおいて、当該プログラムは乱数を選択して突然変異を行うかどうかを決定する。結果がイエスであれば、当該子孫の対立遺伝子をランダムに選択し、乱数を設定する。当該突然変異ステップによって、当該モデルのランダム性が向上する。
突然変異ステップに続いて、新規な子孫を当該集団に加え、次に当該プログラムは当該集団の全てのスコアカードをその適応度の値によって並べ替える。当該集団を並べ替えた後、最後のプロセスとして、フィルタにより当該集団の最大数値外に位置するスコアカードを除去する。
過トレーニングを避けるために、当該プログラムは30世代後に終了する。30世代という終了条件に達すると、トレーニングデータで最適な適応度を有する最終的なスコアカードを返す。
実施例2:25%の配列同一性を有する抗真菌ペプチドによる抗真菌ペプチド予測
実施例1に記載されたステップに従って、25%の配列同一性を有する抗真菌ペプチド(AFP25)の最終的なROC曲線及びテストデータセットの結果を図10に示す。
テスト正解率、即ち、陽性データを陽性として分類し陰性データを陰性として分類する全体的なパフォーマンスは76%である。感度、即ち、陽性データを陽性として分類するパフォーマンスは77%である。特異度、即ち、陰性データを陰性として分類するパフォーマンスは76%である。適切な閾値は354であり、ペプチドスコアが当該値より高い場合は抗真菌ペプチドと見なされる。
陽性データセット及び陰性データセットのスコア分布を図11に示し、当該ジペプチドスコアの最終的な抗真菌スコアカードを図12に示す。各ジペプチドスコアから算出された単一のアミノ酸スコアを図13に示す。スコア結果から、上位3種類のアミノ酸はシステイン(C)、グリシン(G)、リジン(K)であり、スコアが最低の5種類のアミノ酸はアスパラギン酸(D)、グルタミン酸(E)、セリン(S)、トレオニン(T)、バリン(V)であることが示された。植物、哺乳類に用いる多くの抗真菌ペプチド、例えば、チオニン(thionin)、植物ディフェンシン等は、システインを多く含む。また、昆虫の抗真菌ペプチドにも、グリシンを多く含むペプチドがたくさんある。
スコアが最低の5種類のアミノ酸(D、E、S、T、V)のうち、4種類が親水性であり、殆どの親水性のアミノ酸はスコアがより高い(平均スコアは362.73で、閾値の350より大きい)。また、上位5種類のアミノ酸のうち、システインはジスルフィド結合を形成できるスルフィド官能基を含み、リジン(K)、アルギニン(R)は水素結合を形成しやすい。
実施例3:予測された抗真菌ペプチドの活性部位(active site)の同定
スコアカードの結果を示すために、ペプチドをその3D構造におけるジペプチドスコアをカラー表示することによって視覚化する。ジペプチドスコアがより高いペプチドの領域は濃い陰影がつけられ、ジペプチドスコアが低いペプチドの領域は淡い陰影をつけて示される。このように、抗真菌ペプチドの重要な領域は、濃い陰影がつけられた領域によって同定される。
図14は、予測モデルによって算出されたジペプチドスコア基づいて陰影づけされたRs−AFP2の3D構造を示し、Rs−AFP2は植物ディフェンシンファミリーの抗真菌ペプチドであり、そのN末端及び3つβシートは最も濃い陰影がつけられた部分である。SCMに基づくスコアリングシステムによれば、当該2つの領域は、ペプチド配列全体が抗真菌ペプチドであるかどうかを決定する領域である。
図15は、非特許文献[3]のSchaaper氏の報告に基づいて活性領域に濃い陰影がつけられたRs−AFP2ペプチドの3D構造を示す。当該報告によると、主な活性部位は、β2ループとβ3ループの間のAla31からPhe49までであり、しかも当該タンパク質のN末端の部分にも一部活性が確認されている。
したがって、3D構造において視覚化されたスコアカードによって予測された活性部位は、文献で報告された当該抗真菌予測モデルのSCMが抗真菌活性部位を正確に決定する能力を確実に有することを示すものと一致している。
実施例4:病害発生のモデル作成と予測
ニューラルネットワークに基づいて、毎日の気象に関連する病害の発生を予測するモデルを確立する。予測システムには、政府機関より収集された病害データ、及び中央気象局のウェブサイトより取得された当該病害データに対応する気象データの2種類のデータが使用される。次に、当該2種類のデータを組み合わせて、対応する気象データのない病害データは削除する。
最終的なデータは、気象特徴及びラベルを含む。当該気象特徴は14日×11の特徴を有する2次元アレイである。当該11の特徴は、相対湿度、降水量、及び温度と気圧の最大値、最小値と平均値を含む。ラベルは、陰性(病害の発生なし)、陽性(病害発生)の2つのクラスを含む。モデルにおけるデータ処理のフローチャートを図16に示す。
気象条件が胞子発芽、植物の健康状態に影響を与える。畳み込みニューラルネットワーク(CNN)によって気象条件と病害発生の関係を認識することで、病害発生につながる特定の気象パターンを把握する。
図17は、畳み込み層と最大プーリング層と複数の全結合層とを含むモデルに用いられたCNN方法の概要を示す。当該モデルは、過去2週間の気象データを当該モデルの入力として使用し、当該14日間の気象データから気象パターンを認識する。気象特徴がCNN層によって気象変化特徴に変換された後、CNN層より生じたノイズをフィルタするために最大プーリング層を追加する。病害を引き起こす気象パターンは短時間内に変化しないため、最大プーリング関数はフィルタ内の最大値だけを返す。
Figure 2021509212
例えば、入力アレイが[2,5,1,7,0,4]で、最大プーリングフィルタのサイズが2である場合は、フィルタステップ(フィルタが移動する距離)が1である時、最初の最大プーリング出力は最大(2,5)=5、第2の出力は最大(5,1)=5であり、以後については同様である。当該最大プーリング出力が2次元テンソルであるため、次に全結合層に用いるように当該最大プーリング出力を1次元テンソルに平坦化する。
当該最大プーリング層を平坦化した後、当該全結合層が当該最大プーリング結果を分類する。当該全結合層は、当該最大プーリング層の出力を高次元空間に切り替えて、陰性(病害の発生なし)、陽性(病害発生)の2つのクラスに分類する基本的なニューラルネットワーク層である。
なお、当該ネットワークの出力は人間に理解及び使用しにくい数字であるため、ソフトマックス(softmax)関数を利用して当該数字を病害発生の確率に変換する(図18参照)。次に、ソフトマックス(softmax)関数として使用される式を示す。
Figure 2021509212
ここで、σは、ソフトマックス(softmax)関数であり、zは当該ネットワークの最終的な出力であり、Kは出力の総数であり、jはj番目の出力である。
次に、ネットワークの損失関数として、排除分類作業(exclusion classification mission)で優れたパフォーマンスを示すクロスエントロピーを選択する。次に、クロスエントロピーとして用いられる式を示す。
Figure 2021509212
ここで、Hはクロスエントロピー関数であり、y′は実際のラベルであり、yはネットワークの予測出力である。
次に、Adamオプティマイザによって当該ニューラルネットワークのパラメータを最適化し、当該オプティマイザはネットワークを最適化するために最も一般的に使用される手法である。
トレーニング後、独立なテストデータによって当該モデルをテストし、結果を図19に示す。正解率スコアは82.5%に達している。
実施例5:胞子発芽率のモデル作成と予測
実施例4に記載のCNN方法を用いる病害発生の毎日の予測に加え、病害の発生前に胞子発芽が必ず生じるため、胞子発芽率の算出を含めば、より正確なタイミングでの予測が図れる。胞子発芽につながる条件は、実験によって同定及び確認される。
室温と温度は胞子発芽に最も影響を与えることが判明した。異なる真菌種を利用して温度又は湿度に基づく胞子発芽率の一般的なモデルを作成し、当該モデルは他の真菌種にも適合する。
最初に、文献で開示されている胞子発芽データを使用して関数の当てはめを行う。その結果、温度に基づく胞子発芽率は次の三次方程式によって示される。
Figure 2021509212
ここで、xは温度である。
湿度に基づく胞子発芽率は次の線性方程によって示される。
Figure 2021509212
ここで、xは湿度である。
したがって、一般的な胞子発芽率は次式によって示される。
Figure 2021509212
温度に基づくミセリオフトーラ・サーモフィラの胞子発芽率を図20に示し、当てはめを行って次の方程式を得る。
Figure 2021509212
温度に基づくクロコウジカビの胞子発芽率を図21に示し、当てはめを行って次の方程式を得る。
Figure 2021509212
温度に基づくイネいもち病菌の胞子発芽率を図22に示し、当てはめを行って次の方程式を得る。
Figure 2021509212
温度に基づくジプロディア・コルチコラの胞子発芽率を図23に示し、当てはめを行って次の方程式を得る。
Figure 2021509212
したがって、温度に基づく胞子発芽率は三次方程式によって示される。
Figure 2021509212
湿度に基づく胞子発芽率について、相対湿度に基づくクロコウジカビの胞子発芽率を図24に示し、当てはめを行って次の方程式を得る。
Figure 2021509212
相対湿度に基づくプソイドセルコスポラの胞子発芽率を図25に示し、当てはめを行って次の方程式を得る。
Figure 2021509212
したがって、相対湿度に基づく胞子発芽率は線形方程式によって示される。
Figure 2021509212
2つの方程式を独立な事象と見なして、次のとおりに掛け算を行うと一般的な真菌胞子発芽モデルを得る。
Figure 2021509212
したがって、特定の環境における胞子発芽率を算出するには、温度と湿度条件が唯一必要な要因である。
次に、実験を行って、当該一般的な真菌胞子発芽モデルの係数を決定し当該モデルを検証する。当該実験は、図26に示すように、2つの部分に分けられる。最初に、温度が固定され湿度が変化する条件において、温度と湿度が制御されたケースに配置された凹面のガラススライドに、蒸留水を用いて真菌プレートから胞子を除去して調製した胞子懸濁液(2×10粒子/mL)と2%グルコース溶液を等量に混合する。温度は25℃に固定され、テストの湿度条件は80%から100%に5%刻みで変化させる。次に、湿度が固定され温度が変化する条件において、温度と湿度が制御されたケースに配置された凹面のガラススライドに、胞子懸濁液(2×10粒子/mL)と2%グルコース溶液を等量に混合する。湿度は100%に固定され、テストの温度は10〜30℃の範囲に5℃刻みで変化させる。
図27は、10℃及び100%の相対湿度で9時間において発芽しなかった胞子を示す。図28は、25℃及び100%の相対湿度で9時間において発芽した胞子を示す。図29は、100%の固定された相対湿度における10〜30℃の温度範囲で各9時間におけるボトリティス・シネレアの胞子発芽率の表を示し、図30は、これらの発芽率結果に基づいて描画された曲線を示す。
したがって、温度に基づくボトリティス・シネレアの胞子発芽率は次式によって示される。
Figure 2021509212
図31は、20℃の固定された温度における70〜100%の範囲の相対湿度でのボトリティス・シネレアの胞子発芽率を示す。相対湿度100%における胞子発芽率を100%とするために線形変換を行う。
したがって、相対湿度に基づくボトリティス・シネレアの胞子発芽率は次式によって示される。
Figure 2021509212
胞子発芽において温度と相対湿度が独立な事象であることを検証するために、上記のように導出された方程式の結果と実際の胞子発芽の値を比較する。条件は、23℃及び13℃の温度、97%及び80%の相対湿度からランダムに選択される。
図32は、独立な事象についての検証結果のまとめを示す。23℃と相対湿度97%(9時間)の条件で実験を行って得た胞子発芽率は92.45%であり、本明細書に記載の方程式に従って算出された胞子発芽率は86.84%である(図33参照)。13℃と相対湿度80%(9時間)の条件で実験を行って得た胞子発芽率は5.41%であり、同方程式に従って算出された胞子発芽率は6.84%である(図34参照)。
したがって、最終的な胞子発芽モデルは次式によって示される。
Figure 2021509212
ここで、x1は温度であり、x2は相対湿度である。上記の実験結果より、温度と相対湿度が独立な事象であり、当該モデルの当該方程式は正確であることが証明された。
実施例5:IoTにおける病害発生予測モデルの適用
検出温度、湿度等の気象条件センサーは、IoTによって接続され、これらの値を当該予測モデルのプロセッサに伝送する。病害発生に係る毎日の確率を算出する。算出された確率がユーザーによって設定された特定の値を超えた場合は、当該病害が発生する可能性があることを当該ユーザーに通知し、予測された抗真菌ペプチドを散布するよう助言する。当該ユーザーは自動的に散布するかどうかを決定できる。図35は、IoTへの当該適用に係る主な構成を示す。
上記の内容において、本開示のいくつかの実施形態を詳細に説明しているが、当業者が、本開示の教示及びその利点から逸脱することなく特定の実施形態に様々な修飾、変更を行うことができる。これらの修飾、変更は、添付の特許請求の範囲に係る本開示の趣旨と範囲に包含される。
本願に援用された以下の参考文献は、それぞれ参照により組み込まれている。
[1]Huang,H.−L.,Charoenkwan,P.,Kao,T.−F.,Lee,H.−C.,Chang,F.−L.,Huang,W.−L.,Ho,S.−Y.,Shu,L.−S.,Chen,W.−L.,and Ho,S.−Y."Prediction and analysis of protein solubility using a novel scoring card method with dipeptide composition."BMC Bioinformatics,13(Suppl.17),S3(2012). [2]Shinn−Ying Ho,Li−Sun Shu and Jian−Hung Chen,"Intelligent evolutionary algorithms for large parameter optimization problems,"in IEEE Transactions on Evolutionary Computation,vol.8,No.6,pp.522−541,Dec.2004.doi:10.1109/TEVC.2004.835176. [3]W.M.M.Schaaper,G.A.Posthuma,R.H.Meloen,H.H.Plasman,L.Sijtsma,A.Van Amerongen,F.Fant,F.A.M.Borremans,K.Thevissen,and W.F.Broekaert,"Synthetic peptides derived from the β2-β3 loop of Raphanus sativus antifungal protein 2 that mimic the active site."Chemical Biology&Drug Design,vol.57,Issue 5,pp.409−418(2002).

Claims (20)

  1. 環境情報を検出するように設定された複数のセンサーと、
    病害データ及び気象データを収集し、
    前記病害データと前記気象データを組み合わせて複合データを形成し
    機械トレーニング及びテストプロセスより前記複合データを処理し、
    複数の病害発生のパターンを同定するように、病害予測モデルを作成するように設定されたプロセッサとを含み、
    前記病害予測モデルは、前記環境情報、前記パターンに基づいて病害発生の確率を算出するように設定される病害のコントロールシステム。
  2. 前記気象データは、観測時間、圧力、温度、露点温度、相対湿度、風速、風向、降水量、日照時間、視程、紫外線指数、雲量の少なくとも一方を含む請求項1に記載のシステム。
  3. 前記病害データは、前記病害発生の指示に係る陽性ラベル及び陰性ラベルを含む請求項1に記載のシステム。
  4. 前記プロセッサはさらに、前記病害データ、前記気象データから特徴を抽出して前記病害予測モデルを作成するように設定され、前記特徴は機械トレーニングプロセス及びテストプロセスのために前記プロセッサによって処理される請求項1に記載のシステム。
  5. 前記機械トレーニング、前記テストプロセスは畳み込みニューラルネットワーク(CNN)に関連付ける請求項1に記載のシステム。
  6. さらに前記パターンを、病害が起こらないことを示す陰性の出力、又は病害が起こることを示す陽性の出力に分類するように前記病害予測モデルを作成するように前記プロセッサが設定される請求項1に記載のシステム。
  7. 前記病害予測モデルは、前記陽性の出力に基づいて警告を発するように設定される請求項6に記載のシステム。
  8. 前記センサーは、モノのインターネット(IoT)技術によって前記環境情報を前記病害予測モデルに伝送するように設定される請求項1に記載のシステム。
  9. 前記環境情報は、所定の期間における相対湿度、温度、降水量、圧力の少なくとも一方を含む請求項1に記載のシステム。
  10. 前記プロセッサは、胞子発芽率を予測する胞子発芽モデルを作成するようにさらに設定される請求項9に記載のシステム。
  11. 前記胞子発芽率は相対湿度及び温度に基づく請求項10に記載のシステム。
  12. 前記相対湿度、前記温度は、独立な事象である請求項11に記載のシステム。
  13. 前記胞子発芽率は、
    Figure 2021509212
    によって示され、
    ここで、xは温度を指し、xは相対湿度を指す請求項12に記載のシステム。
  14. 前記プロセッサは、前記病害予測モデル及び前記胞子発芽モデルによって病害発生の時間を提供するように設定される請求項10に記載のシステム。
  15. 前記病害予測モデル又は前記胞子発芽モデルは、モノのインターネット(IoT)技術によって前記病害発生の確率又は前記病害発生の時間を散布システムに伝送するように設定される請求項10に記載のシステム。
  16. 前記プロセッサは、スコアカード法(SCM)によって抗真菌機能を有するペプチドを予測するように設定されるペプチド予測モデルをさらに含む請求項1に記載のシステム。
  17. 前記ペプチド予測モデルは、宿主、病原体と対応するペプチドの関係を含む検索システムを含むようにさらに設定される請求項16に記載のシステム。
  18. 前記ペプチド予測モデルは、前記ペプチドを構成するジペプチドの傾向を決定することによってペプチドのスコアを算出することを含む請求項16に記載のシステム。
  19. 前記ペプチド予測モデルは、前記ペプチドの配列を分析することによってペプチドのスコアを算出することを含む請求項16に記載のシステム。
  20. 前記病害発生の確率に基づいて抗真菌機能を有する前記ペプチドを1つの領域に散布するように設定された散布システムに接続される請求項16に記載のシステム。
JP2020543451A 2017-10-27 2018-10-29 病害の予測・コントロール方法、及びそのシステム Pending JP2021509212A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762577764P 2017-10-27 2017-10-27
US62/577,764 2017-10-27
PCT/MY2018/000033 WO2019083351A2 (en) 2017-10-27 2018-10-29 METHOD AND SYSTEM FOR PREDICTING AND MANAGING DISEASE

Publications (1)

Publication Number Publication Date
JP2021509212A true JP2021509212A (ja) 2021-03-18

Family

ID=65955252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020543451A Pending JP2021509212A (ja) 2017-10-27 2018-10-29 病害の予測・コントロール方法、及びそのシステム

Country Status (4)

Country Link
US (1) US20210183513A1 (ja)
JP (1) JP2021509212A (ja)
TW (1) TWI704513B (ja)
WO (1) WO2019083351A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023119869A1 (ja) * 2021-12-24 2023-06-29 東洋製罐グループホールディングス株式会社 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3886571A4 (en) * 2018-11-29 2022-08-24 Germishuys, Dennis Mark PLANT BREEDING
US11591634B1 (en) * 2019-04-03 2023-02-28 The Trustees Of Boston College Forecasting bacterial survival-success and adaptive evolution through multiomics stress-response mapping and machine learning
CN110187074B (zh) * 2019-06-12 2021-07-20 哈尔滨工业大学 一种越野滑雪赛道雪质预测方法
TWI724710B (zh) * 2019-08-16 2021-04-11 財團法人工業技術研究院 建構數位化疾病模組的方法及裝置
CN112633370B (zh) * 2020-12-22 2022-01-14 中国医学科学院北京协和医院 一种针对丝状真菌形态的检测方法、装置、设备及介质
EP4315195A1 (en) * 2021-03-26 2024-02-07 Basf Se Predicting damage caused by fungal infection relating to crop plants of a particular species
TWI831034B (zh) * 2021-07-30 2024-02-01 國立中興大學 稻熱病預警系統及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005176850A (ja) * 2005-01-11 2005-07-07 Nokodai Tlo Kk 情報処理装置および方法、並びに記録媒体
JP2015119646A (ja) * 2013-12-20 2015-07-02 大日本印刷株式会社 病害虫発生推定装置及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI323157B (en) * 2006-05-05 2010-04-11 Tung Hai Biotechnology Corp Method for enhancing the growth of crops, plants, or seeds, and soil renovation
US20170161560A1 (en) * 2014-11-24 2017-06-08 Prospera Technologies, Ltd. System and method for harvest yield prediction
WO2017205957A1 (en) * 2016-06-01 2017-12-07 9087-4405 Quebec Inc. Remote access system and method for plant pathogen management
US9563852B1 (en) * 2016-06-21 2017-02-07 Iteris, Inc. Pest occurrence risk assessment and prediction in neighboring fields, crops and soils using crowd-sourced occurrence data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005176850A (ja) * 2005-01-11 2005-07-07 Nokodai Tlo Kk 情報処理装置および方法、並びに記録媒体
JP2015119646A (ja) * 2013-12-20 2015-07-02 大日本印刷株式会社 病害虫発生推定装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023119869A1 (ja) * 2021-12-24 2023-06-29 東洋製罐グループホールディングス株式会社 情報処理装置、推論装置、機械学習装置、情報処理方法、推論方法、及び、機械学習方法

Also Published As

Publication number Publication date
WO2019083351A2 (en) 2019-05-02
WO2019083351A3 (en) 2019-08-15
TW201931277A (zh) 2019-08-01
US20210183513A1 (en) 2021-06-17
TWI704513B (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
JP2021509212A (ja) 病害の予測・コントロール方法、及びそのシステム
Gokulnath Identifying and classifying plant disease using resilient LF-CNN
Chiu et al. Modelling and forecasting of greenhouse whitefly incidence using time-series and ARIMAX analysis
Ninomiya High-throughput field crop phenotyping: current status and challenges
Mishra et al. Automation and integration of growth monitoring in plants (with disease prediction) and crop prediction
Choudhary et al. Yieldpredict: A crop yield prediction framework for smart farms
Setiadi et al. Implementation of naïve bayes method in food crops planting recommendation
Endait et al. Hybrid model to predict leaf disease prediction using ensembling machine learning approach
CN117114913A (zh) 一种基于大数据的智能化农业数据采集系统
Parez et al. Towards Sustainable Agricultural Systems: A Lightweight Deep Learning Model for Plant Disease Detection.
Xu et al. Peanut leaf disease identification with deep learning algorithms
Selvakumar et al. Automated mango leaf infection classification using weighted and deep features with optimized recurrent neural network concept
Ji et al. Development and evaluation of a model that predicts grapevine anthracnose caused by Elsinoë ampelina
Aversano et al. Water stress classification using Convolutional Deep Neural Networks.
Brar et al. A smart approach to coconut leaf spot disease classification using computer vision and deep learning technique
Bazinas et al. Yield estimation in vineyards using intervals’ numbers techniques
CN115510991A (zh) 一种基于1dcnn-lstm多源信息融合模型的日光温室蚜虫预警方法
S Subramani et al. Classification learning assisted biosensor data analysis for preemptive plant disease detection
Banerjee et al. Hybrid CNN & Random Forest Model for Effective Turmeric Leaf Disease Diagnosis
Kumar et al. Plant leaf diseases severity estimation using fine-tuned CNN models
N. Govaichelvan et al. Machine learning for major food crops breeding: Applications, challenges, and ways forward
YILDIZ et al. Classification of Diseases in Tomato Leaves Using Deep Learning Methods
Pabitha et al. A digital footprint in enhancing agricultural practices with improved production using machine learning
Rajasekhar et al. Design an optimization based ensemble machine learning framework for detecting rice leaf diseases
Suryavanshi et al. Advanced ABS Disease Recognition in Lemon-A Multi-Level Approach Using CNN and Random Forest Ensemble

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20200424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201208

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20201218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20201218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220616