JP7522936B2 - グラフニューラルネットワークに基づく遺伝子表現型予測 - Google Patents

グラフニューラルネットワークに基づく遺伝子表現型予測 Download PDF

Info

Publication number
JP7522936B2
JP7522936B2 JP2023543455A JP2023543455A JP7522936B2 JP 7522936 B2 JP7522936 B2 JP 7522936B2 JP 2023543455 A JP2023543455 A JP 2023543455A JP 2023543455 A JP2023543455 A JP 2023543455A JP 7522936 B2 JP7522936 B2 JP 7522936B2
Authority
JP
Japan
Prior art keywords
node
neural network
graph neural
phenotype
genetic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023543455A
Other languages
English (en)
Other versions
JP2024524795A (ja
Inventor
依依 章
翠玲 呉
曉剛 徐
軍 王
蕭縁 李
舒敏 虞
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Publication of JP2024524795A publication Critical patent/JP2024524795A/ja
Application granted granted Critical
Publication of JP7522936B2 publication Critical patent/JP7522936B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、知能計算育種分野に関し、特に、グラフニューラルネットワークに基づく遺伝子表現型予測及び対応するグラフニューラルネットワークの訓練に関する。
人類文明の発展過程に伴い、作物育種は主に、経験に基づく農業者の主観的判断、作物育種学科の確立、分子選抜育種という3つの歴史的段階を経てきた。現在、ビッグデータ人工知能などの学科の発展と、遺伝子編集、合成生物学などのゲノム指向の精密改良技術の確立に伴い、作物育種は知能育種という新たな時代を迎えた。
高脂質・高タンパク質の植物である大豆は、食料生産の重要な構成部分である。大豆をいかにして高収量に選抜・育種するかは、現在、農学者が取り組んでいる問題である。ゲノミックセレクション(Genomic Selection)の提案は遺伝子育種に1つの方向を提供し、既存の代表的な方法として、最良線形不偏予測(Best Linear Unbiased Prediction、BLUP)、ゲノミック最良線形不偏予測(Genomic Best Linear Unbiased Prediction、GBLUP)、リッジ回帰最良線形不偏予測(Ridge Regression Best Linear Unbiased Prediction、RR-BLUP)、ラッソ回帰(Least Absolute Shrinkage and Selection Operator、LASSO)などがある。しかし、これらの方法の性能は、育種において期待される性能にはまだ程遠いものである。
深層学習の発展に伴い、研究者は深層学習を育種分野への応用を試み始めた。例えば、西北農林科技大学のチームが提案した深層学習に基づく遺伝子表現型予測(DeepGS)アルゴリズムでは、畳み込みニューラルネットワークを構築することにより、小麦の表現型形質を予測でき、従来のゲノミックセレクションの性能を超えた。しかし、既存の深層学習に基づくゲノミックセレクションのほとんどは、単純な畳み込みニューラルネットワークを使用しており、遺伝子に関する事前知識が利用されていない。
グラフニューラルネットワークは、事前知識グラフに基づいて訓練することができ、大きな効果を得ることができる。グラフニューラルネットワークは、スペクトルに基づく方法と空間領域に基づく方法に分けられ、グラフニューラルネットワーク(Graph Neural Network、GNN)、グラフ畳み込みネットワーク(Graph Convolutional Network、GCN)、グラフアテンションネットワーク(Graph Attention Network、GAT)などの方法を含む。まだ関連する研究の初期段階にある、育種に関する知識とグラフニューラルネットワークを組み合わせることは、今後の知能育種の大きな傾向である。
従来技術の不足を解決し、遺伝子表現型予測の性能を高める目的を実現するために、本発明に用いられる技術的解決策は以下の通りである。
本発明の実施形態は、遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法を提供し、前記遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法は、特定の生物種について、前記生物種の遺伝子座と表現型との相関性に基づいて、多層ネットワークを含むグラフニューラルネットワークを構築するステップであって、前記グラフニューラルネットワークの各層のネットワークにおいて、ノードは遺伝子座を表し、エッジは2つの遺伝子座が同じ表現型と相関していることを表し、エッジの重みは遺伝子座の間の関連度を反映するために用いられるステップと、前記生物種の複数のサンプルの遺伝子データ及び表現型データを訓練データとして収集するステップと、前記訓練データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記遺伝子データに対応する遺伝子座及び遺伝子型表現を得るステップと、符号化された前記遺伝子データを前記グラフニューラルネットワークに入力して、前記グラフニューラルネットワークの各層のネットワークを順次通過させるステップであって、前記グラフニューラルネットワークの各層のネットワークは、長さ3の1次元畳み込みカーネルを用い、畳み込みカーネルが近傍間で共有されるステップと、前記グラフニューラルネットワークの最終層のネットワークにおける各ノードの出力結果に基づいて、多層パーセプトロンを用いて前記遺伝子データに対応する表現型分類結果を得るステップと、前記遺伝子データに対応する前記表現型分類結果及び前記遺伝子型表現に基づいて、損失関数を用いて前記グラフニューラルネットワーク及び/又は前記多層パーセプトロンのモデルパラメータを教師あり訓練するステップと、を含む。
さらに、前記遺伝子座検出の確率値に基づいて前記遺伝子データを符号化することは、遺伝子座検出に基づく遺伝子型が0/0、0/1、1/1である確率値PLを、それぞれ以下の式に従って、各前記遺伝子型を支持する確率Pに換算することと、
各前記遺伝子座について、得られた該遺伝子座の確率Pで、該遺伝子座に対応する遺伝子型表現として3次元ベクトル[a,b,c]を構成することであって、前記a、b、cは、それぞれ該遺伝子座の遺伝子型が0/0、0/1、1/1である確率を表すことと、検出されなかった遺伝子座について、その遺伝子型表現をベクトル[0,0,0]で表すことと、を含む。
さらに、前記遺伝子データが前記グラフニューラルネットワークの各層のネットワークを順次通過する際に、均一サンプリングを用いてノード近傍選択を行い、近傍ノードの重み及び畳み込みカーネルパラメータによって各ノードを更新することができる。具体的には、前記グラフニューラルネットワークの現在の層における各ノードcについて、前記ノードcの1次近傍ノードからm個の候補ノードを構築するステップであって、mは0より大きい整数であるステップと、前記ノードcのm個の候補ノードから、前記ノードcの近傍ノードとして置換せずにn個のノードをサンプリングし、かつmがnより小さい場合、全てのm個の候補ノードを前記ノードcの近傍ノードとしてサンプリングするステップと、前記ノードcの全ての近傍ノードの情報を集約して、前記ノードcの近傍情報
を取得するステップと、前記ノードcの前記近傍情報
と前記ノードcの情報hを結合して得られる情報に対して畳み込み及び活性化操作を行い、前記グラフニューラルネットワークの現在の層のネットワークにおける前記ノードcの出力情報
を取得し、
を前記グラフニューラルネットワークにおける次の層のネットワークへの入力とするステップと、を含むことができる。
ここで、前記ノードcの全ての近傍ノードの情報を集約する式は、
となり、
ここで、hはノードcのi番目の近傍ノードの情報を表し、wはノードcのi番目の近傍ノードの重みを表す。
前記畳み込み及び活性化操作を行う具体的な式は、
となり、
ここで、
は現在の層のネットワークにおけるノードcの出力情報、すなわち次の層ネットワークの入力を表し、σは活性化関数を表し、Wは畳み込みカーネルパラメータを表し、hは現在の層のネットワークに入力された前記ノードcの情報を表す。
さらに、前記グラフニューラルネットワークの最終層のネットワークにおける各ノードの出力結果に基づいて、多層パーセプトロンを用いて前記遺伝子データに対応する表現型分類結果を得るステップは、前記グラフニューラルネットワークの最終層のネットワークにおける全てのノードから出力される3次元のベクトルを結合して、結合後のベクトルを得るステップと、前記結合後のベクトルを前記多層パーセプトロンに入力し、前記多層パーセプトロンから出力される分類結果を得、前記分類結果を前記遺伝子データに対応する表現型分類結果とするステップと、を含む。
さらに、前記遺伝子データに対応する前記表現型分類結果及び前記遺伝子型表現に基づいて、損失関数を用いて前記グラフニューラルネットワーク及び/又は前記多層パーセプトロンのモデルパラメータを教師あり訓練するステップは、具体的には、s個の表現型をそれぞれクラスとしてk個の区間に均等に分けて、s×k次元の遺伝子型表現真値ベクトルを得るステップであって、s×k次元は前記表現型分類結果の次元と一致するステップと、損失関数を用いて、前記表現型分類結果及び前記表現型の遺伝子型表現真値ベクトルに基づいて、マルチ表現型教師あり訓練を行うステップと、を含むことができる。
前記損失関数は、焦点損失関数Focal Lossであってもよく、前記表現型分類結果及び前記表現型の遺伝子型表現真値ベクトルに基づいて分類損失を計算する式は、
となり、
ここで、px,yは、特徴マップの横座標xと縦座標yにおける前記表現型分類結果の信頼度を表し、
は、当該位置における前記表現型の遺伝子型表現真値ベクトルの真のクラスラベルを表し、1は正のサンプルを表し、0は負のサンプルを表し、γは0より大きい値であり、αは[0,1]の間の小数であり、γとαはいずれも訓練に関与しない固定値である。
本発明の実施形態は、グラフニューラルネットワークに基づく遺伝子表現型予測方法を提供し、前記グラフニューラルネットワークに基づく遺伝子表現型予測方法は、分類対象の遺伝子データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記分類対象の遺伝子データに対応する遺伝子座及び遺伝子型表現を得るステップと、符号化された前記分類対象の遺伝子データを、訓練されたグラフニューラルネットワーク及び多層パーセプトロンに入力し、前記分類対象の遺伝子データに対応する表現型結果を得るステップと、を含む。ここで、前記グラフニューラルネットワーク及び前記多層パーセプトロンは、前記方法により訓練された、前記分類対象の遺伝子データが属する生物種に対する遺伝子表現型予測ネットワークである。
本発明の実施形態は、前記遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法を実現するための、遺伝子表現型予測のためのグラフニューラルネットワークの訓練装置を提供し、前記遺伝子表現型予測のためのグラフニューラルネットワークの訓練装置は、グラフニューラルネットワーク構築モジュールと、データ取得モジュールと、プリコーディングモジュールと、遺伝子データ入力モジュールと、分類モジュールとを含む。前記グラフニューラルネットワーク構築モジュールは、遺伝子座と表現型との相関性に基づいて、遺伝子に対してグラフニューラルネットワークを構築し、ノードは遺伝子座を表し、エッジは2つの遺伝子座が同じ表現型と相関していることを表し、エッジの重みは遺伝子座の間の関連度を反映するために用いられる。前記データ取得モジュールは、サンプルの遺伝子データを収集し、サンプルに対応する表現型データを取得し、グラフニューラルネットワークの訓練と検証のための訓練セットと検証セットの分割を行う。前記プリコーディングモジュールは、訓練データについて、遺伝子座検出に基づいて遺伝子データをプレコーディングし、遺伝子座及び対応する遺伝子型を得る。前記遺伝子データ入力モジュールは、符号化された遺伝子データを構築されたグラフニューラルネットワークに入力し、各層のネットワークは、長さ3の1次元畳み込みカーネルを用い、畳み込みカーネルが近傍間で共有される。前記分類モジュールは、各ノードの出力結果を結合し、結合後の結果を多層パーセプトロンに入力し、表現型分類結果を出力し、損失関数に基づいてモデルを教師あり訓練する。
本発明の実施形態は、前記グラフニューラルネットワークに基づく遺伝子表現型予測方法を実現するための、グラフニューラルネットワークに基づく遺伝子表現型予測装置を提供し、前記グラフニューラルネットワークに基づく遺伝子表現型予測装置は、分類対象の遺伝子データをプリコーディングモジュールによって符号化した後、遺伝子データ入力モジュールを通過させ、訓練された分類モジュールに入力し、分類対象の遺伝子データに対応する表現型結果を得る。
本発明の利点及び有益な効果は、まず、遺伝子表現型の間の相関性の事前知識を利用して遺伝子グラフニューラルネットワークを構築し、相関性の弱い遺伝子座を除去することにより、入力遺伝子の次元を効果的に削減し、それによって次元削減及びノイズ除去の目的を達成する。また、表現型を複数の区間に分けて分類予測を行うことにより、訓練の難易度を効果的に低減させ、モデルアルゴリズムの安定性を向上させることができ、かつ複数の表現型の同時訓練・予測が可能である。本発明が提供する技術的解決策は、rrBLUPのような従来のゲノミックセレクションと比較して、ピアソン相関係数(Pearson Correlation Coefficient)の20~30%の向上を含む、個々の表現型の予測においてより優れた性能を有する。
本発明の一実施形態による遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法のフローチャートである。 本発明の一実施形態によるグラフニューラルネットワークに基づく遺伝子表現型予測方法のフローチャートである。 本発明の一実施形態によるグラフニューラルネットワークに基づく遺伝子表現型分類認識のための簡略化されたモデルアーキテクチャ図である。 本発明の一実施形態による遺伝子表現型予測のためのグラフニューラルネットワークの訓練デバイスの構造概略図である。
以下、添付図面と合わせて本発明の具体的な実施形態について詳細に説明する。本明細書で説明される具体的な実施形態は、本発明を例示及び説明するためだけのものであり、本発明を限定することを意図するものではないことを理解されたい。
図1に示すように、本発明の一実施形態によれば、遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法を提供する。方法は、以下のステップS110~ステップS160を含んでもよい。
ステップS110において、特定の生物種について、前記生物種の遺伝子座と表現型との相関性に基づいて、多層ネットワークを含むグラフニューラルネットワークを構築する。構築されたグラフニューラルネットワークの各層のネットワークにおいて、ノードは遺伝子座を表し、エッジは2つの遺伝子座が同じ表現型と相関していることを表し、エッジの重みは遺伝子座の間の関連度を反映するために用いられる。
本発明の一実施形態では、以下の表1に示す大豆の遺伝子座と表現型との相関性情報に基づいて、大豆遺伝子のグラフニューラルネットワークを構築することができる。ここで、遺伝子座は39個あり、2つの遺伝子座が同じ表現型と相関する回数が多いほど、エッジの重みが高くなる。したがって、エッジの重みは、遺伝子座の間の関連度を反映することができる。
ステップS120において、前記生物種の複数のサンプルの遺伝子データ及び表現型データを訓練データとして収集する。ここで、訓練データを、訓練セットと検証セットに分割することができ、それぞれグラフニューラルネットワークを訓練と検証するために用いられる。
本発明の一実施形態では、3000大豆サンプルの遺伝子データ、すなわち一塩基多型(Single Nucleotide Polymorphisms、SNP)遺伝子座情報が収集され、訓練及び検証する時に表1に係る39個の遺伝子座の情報のみを使用する。収集される各大豆サンプルに対応するs種の表現型データは、草丈、分枝の数、豆粒の数、及び茎の数を含み、すなわちs=4である。上記のデータは、4:1の割合で複数の訓練セットと少なくとも1つの検証セットにランダムに分割することができる。
ステップS130において、前記訓練データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記遺伝子データに対応する遺伝子座及び遺伝子型表現を得る。
本発明の一実施形態によれば、遺伝子座検出の確率値PLに基づいて入力された遺伝子データを符号化し、遺伝子座検出に基づく遺伝子型が0/0、0/1、1/1である確率値PLを、それぞれ以下の式に従って、各前記遺伝子型を支持する確率Pに換算する。
ここで、ある遺伝子座について、得られた確率Pで、該遺伝子座に対応する遺伝子型表現として3次元ベクトル[a,b,c]を構成することができ、前記a、b、cは、それぞれ該遺伝子座の遺伝子型が0/0、0/1、1/1である確率を表す。検出されなかった遺伝子座について、その遺伝子型表現をベクトル[0,0,0]で表すことができる。
ステップS140において、符号化された前記遺伝子データを構築されたグラフニューラルネットワークに入力して、前記グラフニューラルネットワークの各層のネットワークを順次通過させる。ここで、前記グラフニューラルネットワークの各層のネットワークは、長さ3の1次元畳み込みカーネルを用い、畳み込みカーネルが近傍間で共有される。
本発明の一実施形態では、39×3次元の符号化された遺伝子データを構築されたグラフニューラルネットワークに入力する。前記グラフニューラルネットワークは、8つのネットワーク層を有するグラフニューラルネットワークであってよく、各層のネットワークは、長さ3の1次元畳み込みカーネルを3つ用い、畳み込みカーネルが近傍間で共有される。
グラフニューラルネットワークの各層において、均一サンプリングを用いてノード近傍選択を行い、近傍ノードの重み及び畳み込みカーネルパラメータによって各ノードを更新することができ、具体的には、以下のステップS141~ステップS144を含むことができる。
ステップS141において、グラフニューラルネットワークにおいて、現在の層における各ノードについて、そのノードの1次近傍ノードからm個の候補ノードを構築する。ここで、mは0より大きい整数である。
ステップS142において、中心ノードであるノードcについて、ノードcのm個の候補ノードから、ノードcの近傍ノードとしてn個のノードを非復元抽出(sampling without replacement)する。mがnより小さい場合、すなわち候補ノードがn個未満である場合、全ての候補ノードを近傍ノードとしてサンプリングする。本実施形態では、n=4とする。
ステップS143において、ノードcの全ての近傍ノードの情報を集約して、ノードcの近傍情報
を取得する。
具体的には、集約する式は以下のように表すことができる。
ここで、hはノードcのi番目の近傍ノードの情報を表し、wはノードcのi番目の近傍ノードの重みを表す。
本発明の一実施形態では、nが4に等しい場合、ノードcの集約近傍情報
は、以下のように計算することができる。
ステップS144において、ノードcの集約近傍情報
とノードcの情報hを結合して、結合後の情報に対して畳み込み及び活性化操作を行い、グラフニューラルネットワークの現在の層の出力情報
を取得する。
具体的には、以下のような式となる。
ここで、
は現在の層のネットワークにおけるノードcの出力情報、すなわち次の層ネットワークの入力を表し、σは活性化関数を表し、Wは畳み込みカーネルパラメータを表し、CONCATは結合操作を表し、hは現在の層のネットワークに入力されたノードcの情報を表す。
ステップS150において、前記グラフニューラルネットワークの最終層のネットワークにおける各ノードの出力結果に基づいて、多層パーセプトロンを用いて前記遺伝子データに対応する表現型分類結果を得る。
ステップS160において、前記遺伝子データに対応する表現型分類結果及び遺伝子型表現に基づいて、損失関数を用いて前記グラフニューラルネットワーク及び/又は前記多層パーセプトロンのモデルパラメータを教師あり訓練する。ここで、損失関数は、主に、前記表現型分類結果及び前記遺伝子型表現に基づいて損失値を計算するために用いられる。
本発明の一実施形態では、上記ステップS150は、具体的には、次のステップS151を含んでいてよい。
ステップS151において、グラフニューラルネットワークの最終層のネットワークにおける全てのノードから出力される3次元のベクトルを結合し、結合後のベクトルを多層パーセプトロンに入力し、多層パーセプトロンから出力される分類結果を得、前記分類結果を表現型分類結果とする。
本発明の一実施形態では、全ての39個のノードから出力される3次元の確率ベクトルを結合して、39×3=117次元の結合確率ベクトルを出力する。そして、この結合確率ベクトルを2層の全結合ネットワークに入力して、分類結果が得られる。ここで、全結合ネットワークの第1層は、117次元の結合確率ベクトルが入力され、80次元の中間確率ベクトルを出力する。次に、全結合ネットワークの第2層は、80次元の中間確率ベクトルが入力され、20次元の最終確率ベクトルを出力し、20次元の最終確率ベクトルを前記表現型分類結果とする。
本発明の一実施形態では、上記ステップS160は、具体的には、次のステップS161~ステップS162を含んでいてよい。
ステップS161において、s個の表現型をそれぞれクラスとしてk個の区間に均等に分けて、s×k次元の遺伝子型表現真値ベクトル(以下、単に真値ベクトルともいう)を得る。
本発明の一実施形態では、4つの表現型をそれぞれクラスとして5つの区間に均等に分けると、真値ベクトルの次元は4×5=20となる。このように、真値ベクトルの次元は、多層パーセプトロンが出力する表現型分類結果の次元に対応する。一例として、草丈を、区間に従って極低、低、正常、高、極高という5つのクラスに均等に分けることができる。その他の表現型も同様に分類することができ、ここでは説明を省略する。
ステップS162において、損失関数を用いて、前記表現型分類結果及び表現型の真値ベクトルに基づいて、マルチ表現型教師あり訓練を行う。
本発明の一実施形態によれば、教師あり訓練における損失関数は、焦点損失関数Focal Lossとすることができ、分類損失を計算する式は、次のとおりであってよい。
ここで、px,yは、特徴マップの横座標xと縦座標yにおける前記表現型分類結果の信頼度を表し、
は、当該位置における前記表現型の真値ベクトルの真のクラスラベルを表し、1は正のサンプルを表し、0は負のサンプルを表し、γは0より大きい値であり、αは[0,1]の間の小数であり、γとαはいずれも訓練に関与しない固定値である。本発明の一実施形態では、αを0.1、γを2とする場合に、訓練効果が最も優れる。例えば、オプティマイザ(Optimizer)として確率的勾配降下法(Stochastic Gradient Descent,SGD)を使用して、4つのグラフィックスプロセッシングユニット(Graphics Processing Unit,GPU)で訓練を行うことができ、バッチサイズ(batch size)を16、訓練ステップ数を50k、初期学習率を0.01とし、訓練ステップ数が20kステップと40kステップに達すると初期学習率を10分の1にしてもよい。
本発明の一実施形態によれば、グラフニューラルネットワークに基づく遺伝子表現型予測方法をさらに提供する。図2に示すように、該遺伝子表現型予測方法は、以下のステップS210~ステップS220を含んでもよい。
ステップS210において、分類対象の遺伝子データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記分類対象の遺伝子データに対応する遺伝子座及び遺伝子型表現を得る。ここで、ステップS210の処理は、上記ステップS130の処理とほぼ同じであり、具体的には上記を参照できるため、ここでは説明を省略する。
ステップS220において、符号化された前記分類対象の遺伝子データを、訓練されたグラフニューラルネットワーク及び多層パーセプトロンに入力し、前記分類対象の遺伝子データに対応する表現型結果を得る。ここで、前記グラフニューラルネットワーク及び前記多層パーセプトロンは、前記訓練方法により得られた、前記分類対象の遺伝子データが属する生物種に対する遺伝子表現型予測ネットワークであってもよく、ここでは具体的な訓練方法を詳細に説明しない。
簡略化されたグラフニューラルネットワークを例にとると、分類対象の遺伝子データに対応する生物種が5つの遺伝子座を持つと仮定すると、グラフニューラルネットワークの各層のネットワークには5つのノードが含まれる。図3に示すように、入力された分類対象の遺伝子データが、多層のグラフニューラルネットワーク310によって畳み込み及び活性化操作を行われた後、グラフニューラルネットワークの出力が、多層パーセプトロン320に入力され、多層パーセプトロン320によって前記遺伝子データの最終的な分類結果が出力される。
この部分の実施形態は、上述した方法の実施形態と同様であり、ここでは説明を省略する。
本発明の一実施形態によれば、前記遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法を実現するための、遺伝子表現型予測のためのグラフニューラルネットワークの訓練装置をさらに提供し、前記遺伝子表現型予測のためのグラフニューラルネットワークの訓練装置は、グラフニューラルネットワーク構築モジュールと、データ取得モジュールと、プリコーディングモジュールと、遺伝子データ入力モジュールと、分類モジュールとを含む。グラフニューラルネットワーク構築モジュールは、特定の生物種について、前記生物種の遺伝子座と表現型との相関性に基づいて、多層ネットワークを含むグラフニューラルネットワークを構築する。前記グラフニューラルネットワークの各層のネットワークにおいて、ノードは遺伝子座を表し、エッジは2つの遺伝子座が同じ表現型と相関していることを表し、エッジの重みは遺伝子座の間の関連度を反映するために用いられる。データ取得モジュールは、前記生物種の複数のサンプルの遺伝子データ及び表現型データを訓練データとして収集する。プリコーディングモジュールは、前記訓練データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記遺伝子データに対応する遺伝子座及び遺伝子型表現を得る。遺伝子データ入力モジュールは、符号化された前記遺伝子データを前記グラフニューラルネットワークに入力して、前記グラフニューラルネットワークの各層のネットワークを順次通過させる。前記グラフニューラルネットワークの各層のネットワークは、長さ3の1次元畳み込みカーネルを用い、畳み込みカーネルが近傍間で共有される。分類モジュールは、前記グラフニューラルネットワークの最終層のネットワークにおける各ノードの出力結果に基づいて、多層パーセプトロンを用いて前記遺伝子データに対応する表現型分類結果を得て、前記表現型分類結果に基づいて、損失関数を用いて前記グラフニューラルネットワーク及び/又は前記多層パーセプトロンのモデルパラメータを教師あり訓練する。
この部分の実施形態は、上述した方法の実施形態と同様であり、ここでは説明を省略する。
本発明の一実施形態によれば、前記グラフニューラルネットワークに基づく遺伝子表現型予測方法を実現するための、グラフニューラルネットワークに基づく遺伝子表現型予測装置をさらに提供し、前記グラフニューラルネットワークに基づく遺伝子表現型予測装置は、前記プレコーディングモジュール、及び前記訓練方法及び/又は訓練装置によって訓練して得られた遺伝子表現型予測ネットワークを含むことができる。具体的には、分類対象の遺伝子データがプリコーディングモジュールによって符号化された後、符号化された前記分類対象の遺伝子データを、訓練されたグラフニューラルネットワーク及び多層パーセプトロンに入力し、分類対象の遺伝子データに対応する表現型結果を得る。前記グラフニューラルネットワーク及び前記多層パーセプトロンは、前記訓練方法及び/又は訓練装置により訓練された、前記分類対象の遺伝子データが属する生物種に対する遺伝子表現型予測ネットワークである。
この部分の実施形態は、上述した方法の実施形態と同様であり、ここでは説明を省略する。
前記グラフニューラルネットワークに基づく遺伝子表現型予測方法の実施形態に対応して、本発明は、グラフニューラルネットワークに基づく遺伝子表現型予測デバイスの実施形態をさらに提供する。
図4を参照すると、本発明の実施形態は、メモリ(具体的には不揮発性メモリ430及び/又は内部メモリ440を含み得る)と1つ以上のプロセッサ410とを含むグラフニューラルネットワークに基づく遺伝子表現型予測デバイスを提供する。ここで、メモリ430、440には実行可能なコードが格納され、前記1つ以上のプロセッサ410が前記実行可能なコードを実行するとき、上記実施形態におけるグラフニューラルネットワークに基づく遺伝子表現型予測方法を実施する。図4に示すように、該デバイスは、前記プロセッサ410と前記メモリ430、440とを接続するための内部バス420をさらに含む。また、該デバイスは、外部と通信するためのネットワークインタフェース450を含んでもよい。
本発明のグラフニューラルネットワークに基づく遺伝子表現型予測デバイスの実施形態は、データ処理能力を有する任意のデバイスに適用することができ、データ処理能力を有する任意のデバイスは、コンピュータなどのデバイス又は装置であってもよい。装置の実施形態は、ソフトウェアによって実現されてもよく、ハードウェアによって実現されてもよく、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。ソフトウェアによって実現されることを例にとると、論理的な意味での装置として、不揮発性メモリに対応するコンピュータプログラム命令を、それが配置されているデータ処理能力を有する任意のデバイスのプロセッサを介して内部メモリに読み込んで実行することによって形成される。ハードウェアレベルでは、図4に示すように、本発明のグラフニューラルネットワークに基づく遺伝子表現型予測デバイスが配置されるデータ処理能力を有する任意のデバイスのハードウェア構造図であり、図4に示すプロセッサ、内部メモリ、ネットワークインタフェース、及び不揮発性メモリに加えて、実施形態において装置が配置されるデータ処理能力を有する任意のデバイスは、通常、該データ処理能力を有する任意のデバイスの実際の機能に応じて、他のハードウェアを含むことができ、ここでは説明を省略する。
上述した装置における各ユニットの機能及び役割の実現過程は、上述した方法の対応するステップの実現過程を参照できるため、ここでは説明を省略する。
装置の実施形態については、方法の実施形態にほぼ対応しているため、関連する部分は方法の実施形態の一部の説明を参照すればよい。上述した装置の実施形態は、単なる例示的なものであり、前記分離コンポーネントとして説明されたユニットは、物理的に分離されてもよく、又は物理的に分離されなくてもよく、ユニットとして表示されたコンポーネントは、物理的なユニットであってもよく、又は物理的なユニットでなくてもよく、即ち、一箇所に位置してもよく、又は複数のネットワークユニットに分散されてもよい。実際の要求に応じて、その一部又は全部のユニットを選択して、本発明の解決策の目的を実現することができる。当業者であれば、創造的な労力をかけずに理解し、実施することができる。
本発明の実施形態は、プログラムが格納されたコンピュータ可読記憶媒体を提供し、当該プログラムがプロセッサによって実行されると、上述の実施形態におけるグラフニューラルネットワークに基づく遺伝子表現型予測方法を実現する。
前記コンピュータ読み取り可能な記憶媒体は、ハードディスクや内部メモリなどの前述したいずれかの実施形態に記載のデータ処理能力を有する任意のデバイスの内部記憶ユニットであってもよい。また、前記コンピュータ読み取り可能な記憶媒体は、前記デバイスに装備されたプラグインハードディスク、スマートメディアカード(Smart Media(登録商標) Card、SMC)、SDカード、フラッシュカード(Flash Card)などのデータ処理能力を有する任意外部記憶デバイスであってもよい。さらに、前記コンピュータ読み取り可能な記憶媒体は、データ処理能力を有する任意のデバイスの内部記憶ユニットと外部記憶デバイスの両方からなることもできる。前記コンピュータ読み取り可能な記憶媒体は、前記コンピュータプログラム及び前記データ処理能力を有する任意のデバイスに必要な他のプログラム及びデータを記憶するために用いられ、また、出力された又は出力予定のデータを一時的に記憶するために用いられてもよい。
上述の実施形態は、本発明の技術的解決策を説明するためのものであり、それに限定されるものではない。前述の実施形態を参照して本発明を詳細に説明したが、当業者であれば理解されるように、前述の実施形態に記載された技術的解決策を修正したり、その技術的特徴の一部又は全部に対して等価の置換を行ったりすることができ、これらの修正又は置換は、対応する技術的解決策の本質を本発明の実施形態の技術的解決策の範囲から逸脱させるものではない。

Claims (10)

  1. 特定の生物種について、前記生物種の遺伝子座と表現型との相関性に基づいて、多層ネットワークを含むグラフニューラルネットワークを構築するステップであって、前記グラフニューラルネットワークの各層のネットワークにおいて、ノードは遺伝子座を表し、エッジは2つの遺伝子座が同じ表現型と相関していることを表し、エッジの重みは遺伝子座の間の関連度を反映するために用いられるステップと、
    前記生物種の複数のサンプルの遺伝子データ及び表現型データを訓練データとして収集するステップと、
    前記訓練データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記遺伝子データに対応する遺伝子座及び遺伝子型表現を得るステップと、
    符号化された前記遺伝子データを前記グラフニューラルネットワークに入力して、前記グラフニューラルネットワークの各層のネットワークを順次通過させるステップであって、前記グラフニューラルネットワークの各層のネットワークは、長さ3の1次元畳み込みカーネルを用い、畳み込みカーネルが近傍間で共有されるステップと、
    前記グラフニューラルネットワークの最終層のネットワークにおける各ノードの出力結果に基づいて、多層パーセプトロンを用いて前記遺伝子データに対応する表現型分類結果を得るステップと、
    前記遺伝子データに対応する前記表現型分類結果及び前記遺伝子型表現に基づいて、損失関数を用いて前記グラフニューラルネットワーク及び/又は前記多層パーセプトロンのモデルパラメータを教師あり訓練するステップと、を含む
    ことを特徴とする遺伝子表現型予測のためのグラフニューラルネットワークの訓練方法。
  2. 前記遺伝子座検出の確率値に基づいて前記遺伝子データを符号化することは、
    遺伝子座検出に基づく遺伝子型が0/0、0/1、1/1である確率値PLを、それぞれ以下の式に従って、各前記遺伝子型を支持する確率Pに換算することと、
    各前記遺伝子座について、得られた該遺伝子座の確率Pで、該遺伝子座に対応する遺伝子型表現として3次元ベクトル[a,b,c]を構成することであって、前記a、b、cは、それぞれ該遺伝子座の遺伝子型が0/0、0/1、1/1である確率を表すことと、
    検出されなかった遺伝子座について、その遺伝子型表現をベクトル[0,0,0]で表すことと、を含む
    ことを特徴とする請求項1に記載の方法。
  3. 前記遺伝子データが前記グラフニューラルネットワークの各層のネットワークを順次通過する際に、均一サンプリングを用いてノード近傍選択を行い、近傍ノードの重み及び畳み込みカーネルパラメータによって各ノードを更新する
    ことを特徴とする請求項1に記載の方法。
  4. 前記均一サンプリングを用いてノード近傍選択を行い、近傍ノードの重み及び畳み込みカーネルパラメータによって各ノードを更新することは、
    前記グラフニューラルネットワークの現在の層における各ノードcについて、
    前記ノードcの1次近傍ノードからm個の候補ノードを構築するステップであって、mは0より大きい整数であるステップと、
    前記ノードcのm個の候補ノードから、前記ノードcの近傍ノードとしてn個のノードを非復元抽出し、かつmがnより小さい場合、全てのm個の候補ノードを前記ノードcの近傍ノードとしてサンプリングするステップと、
    前記ノードcの全ての近傍ノードの情報を集約して、前記ノードcの近傍情報
    を取得するステップと、
    前記ノードcの前記近傍情報
    と前記ノードcの情報hを結合して得られる情報に対して畳み込み及び活性化操作を行い、前記グラフニューラルネットワークの現在の層のネットワークにおける前記ノードcの出力情報
    を取得し、
    を前記グラフニューラルネットワークにおける次の層のネットワークへの入力とするステップと、を含み、
    ここで、前記ノードcの全ての近傍ノードの情報を集約する式は、
    となり、
    ここで、hはノードcのi番目の近傍ノードの情報を表し、wはノードcのi番目の近傍ノードの重みを表し、
    前記畳み込み及び活性化操作を行う具体的な式は、
    となり、
    ここで、
    は前記グラフニューラルネットワークの現在の層のネットワークにおける前記ノードcの出力情報を表し、σは活性化関数を表し、Wは畳み込みカーネルパラメータを表し、hは前記グラフニューラルネットワークの現在の層のネットワークに入力された前記ノードcの情報を表す
    ことを特徴とする請求項3に記載の方法。
  5. 前記グラフニューラルネットワークの最終層のネットワークにおける各ノードの出力結果に基づいて、多層パーセプトロンを用いて前記遺伝子データに対応する表現型分類結果を得るステップは、
    前記グラフニューラルネットワークの最終層のネットワークにおける全てのノードから出力される3次元のベクトルを結合して、結合後のベクトルを得るステップと、
    前記結合後のベクトルを前記多層パーセプトロンに入力し、前記多層パーセプトロンから出力される分類結果を得、前記分類結果を前記遺伝子データに対応する表現型分類結果とするステップと、を含む
    ことを特徴とする請求項1に記載の方法。
  6. 前記遺伝子データに対応する前記表現型分類結果及び前記遺伝子型表現に基づいて、損失関数を用いて前記グラフニューラルネットワーク及び/又は前記多層パーセプトロンのモデルパラメータを教師あり訓練するステップは、
    s個の表現型をそれぞれクラスとしてk個の区間に均等に分けて、s×k次元の遺伝子型表現真値ベクトルを得るステップであって、s×k次元は前記表現型分類結果の次元と一致するステップと、
    損失関数を用いて、前記表現型分類結果及び前記表現型の遺伝子型表現真値ベクトルに基づいて、マルチ表現型教師あり訓練を行うステップと、を含む
    ことを特徴とする請求項5に記載の方法。
  7. 前記損失関数は、焦点損失Focal Loss関数であり、前記表現型分類結果及び前記表現型の遺伝子型表現真値ベクトルに基づいて分類損失を計算する式は、
    となり、
    ここで、px,yは、特徴マップの横座標xと縦座標yにおける前記表現型分類結果の信頼度を表し、
    は、特徴マップの横座標xと縦座標yにおける前記表現型の遺伝子型表現真値ベクトルの真のクラスラベルを表し、1は正のサンプルを表し、0は負のサンプルを表し、γは0より大きい値であり、αは[0,1]の間の小数であり、γとαはいずれも訓練に関与しない固定値である
    ことを特徴とする請求項6に記載の方法。
  8. 分類対象の遺伝子データについて、遺伝子座検出の確率値に基づいて前記遺伝子データを符号化し、前記分類対象の遺伝子データに対応する遺伝子座及び遺伝子型表現を得るステップと、
    符号化された前記分類対象の遺伝子データを、訓練されたグラフニューラルネットワーク及び多層パーセプトロンに入力し、前記分類対象の遺伝子データに対応する表現型結果を得るステップであって、前記グラフニューラルネットワーク及び前記多層パーセプトロンは、前記請求項1~7のいずれか1項に記載の方法により訓練された、前記分類対象の遺伝子データが属する生物種に対する遺伝子表現型予測ネットワークであるステップと、を含む
    ことを特徴とするグラフニューラルネットワークに基づく遺伝子表現型予測方法。
  9. プロセッサとメモリとを含むデバイスであって、前記メモリにはプログラムが格納されており、当該プログラムが前記プロセッサによって実行されると、請求項1~7のいずれか1項に記載の方法のステップが実施される
    ことを特徴とする遺伝子表現型予測のためのグラフニューラルネットワークの訓練デバイス。
  10. プロセッサとメモリとを含むデバイスであって、前記メモリにはプログラムが格納されており、当該プログラムが前記プロセッサによって実行されると、請求項8に記載の方法のステップが実施される
    ことを特徴とするグラフニューラルネットワークに基づく遺伝子表現型予測デバイス。
JP2023543455A 2022-10-11 2023-05-19 グラフニューラルネットワークに基づく遺伝子表現型予測 Active JP7522936B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202211238697.7A CN115331732B (zh) 2022-10-11 2022-10-11 基于图神经网络的基因表型训练、预测方法及装置
CN202211238697.7 2022-10-11
PCT/CN2023/095224 WO2023217290A1 (zh) 2022-10-11 2023-05-19 基于图神经网络的基因表型预测

Publications (2)

Publication Number Publication Date
JP2024524795A JP2024524795A (ja) 2024-07-09
JP7522936B2 true JP7522936B2 (ja) 2024-07-25

Family

ID=83915021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023543455A Active JP7522936B2 (ja) 2022-10-11 2023-05-19 グラフニューラルネットワークに基づく遺伝子表現型予測

Country Status (3)

Country Link
JP (1) JP7522936B2 (ja)
CN (1) CN115331732B (ja)
WO (1) WO2023217290A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115331732B (zh) * 2022-10-11 2023-03-28 之江实验室 基于图神经网络的基因表型训练、预测方法及装置
WO2024138387A1 (zh) * 2022-12-27 2024-07-04 深圳华大生命科学研究院 批次效应去除模型的训练方法及去除方法、装置
CN116072214B (zh) * 2023-03-06 2023-07-11 之江实验室 基于基因显著性增强的表型智能预测、训练方法及装置
CN116580767B (zh) * 2023-04-26 2024-03-12 之江实验室 一种基于自监督与Transformer的基因表型预测方法和系统
CN117198406B (zh) * 2023-09-21 2024-06-11 亦康(北京)医药科技有限公司 一种特征筛选方法、系统、电子设备及介质
CN116959561B (zh) * 2023-09-21 2023-12-19 北京科技大学 一种基于神经网络模型的基因相互作用预测方法和装置
CN116992919B (zh) * 2023-09-28 2023-12-19 之江实验室 一种基于多组学的植物表型预测方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096327A (zh) 2016-06-07 2016-11-09 广州麦仑信息科技有限公司 基于Torch监督式深度学习的基因性状识别方法
CN113593635A (zh) 2021-08-06 2021-11-02 上海市农业科学院 一种玉米表型预测方法及系统
CN114333986A (zh) 2021-09-06 2022-04-12 腾讯科技(深圳)有限公司 模型训练、药物筛选和亲和力预测的方法与装置
JP2022117452A (ja) 2021-01-29 2022-08-10 富士通株式会社 ネットワークモチーフ解析を使用したグラフベース予測の説明

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5438644A (en) * 1991-09-09 1995-08-01 University Of Florida Translation of a neural network into a rule-based expert system
CN108388768A (zh) * 2018-02-08 2018-08-10 南京恺尔生物科技有限公司 利用生物知识搭建的神经网络模型的生物特性预测方法
AU2019403566A1 (en) * 2018-12-21 2021-08-12 TeselaGen Biotechnology Inc. Method, apparatus, and computer-readable medium for efficiently optimizing a phenotype with a specialized prediction model
CN110010201A (zh) * 2019-04-16 2019-07-12 山东农业大学 一种rna选择性剪接位点识别方法及系统
CN114765063A (zh) * 2021-01-12 2022-07-19 上海交通大学 基于图神经网络表征的蛋白质与核酸结合位点预测方法
US20220301658A1 (en) * 2021-03-19 2022-09-22 X Development Llc Machine learning driven gene discovery and gene editing in plants
CN114360654A (zh) * 2022-01-05 2022-04-15 重庆邮电大学 一种基于基因表达的图神经网络数据集构建方法
CN114649097A (zh) * 2022-03-04 2022-06-21 广州中医药大学(广州中医药研究院) 一种基于图神经网络及组学信息的药物功效预测方法
CN114637923B (zh) * 2022-05-19 2022-09-02 之江实验室 基于层次注意力图神经网络的数据信息推荐方法和装置
CN114783524B (zh) * 2022-06-17 2022-09-30 之江实验室 基于自适应重采样深度编码器网络的通路异常检测系统
CN115331732B (zh) * 2022-10-11 2023-03-28 之江实验室 基于图神经网络的基因表型训练、预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096327A (zh) 2016-06-07 2016-11-09 广州麦仑信息科技有限公司 基于Torch监督式深度学习的基因性状识别方法
JP2022117452A (ja) 2021-01-29 2022-08-10 富士通株式会社 ネットワークモチーフ解析を使用したグラフベース予測の説明
CN113593635A (zh) 2021-08-06 2021-11-02 上海市农业科学院 一种玉米表型预测方法及系统
CN114333986A (zh) 2021-09-06 2022-04-12 腾讯科技(深圳)有限公司 模型训练、药物筛选和亲和力预测的方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIU, Yang et al.,"Phenotype Prediction and Genome-Wide Association Study Using Deep Convolutional Neural Network of Soybean",Frontiers in Genetics [online],2019年,Vol. 10,pp. 1-10,[retrieved on 2024.06.13], Retrieved from the Internet: <URL: https://www.frontiersin.org/journals/genetics/articles/10.3389/fgene.2019.01091/full>,<DOI: 10.3389/fgene.2019.01091>

Also Published As

Publication number Publication date
CN115331732B (zh) 2023-03-28
CN115331732A (zh) 2022-11-11
WO2023217290A1 (zh) 2023-11-16
JP2024524795A (ja) 2024-07-09

Similar Documents

Publication Publication Date Title
JP7522936B2 (ja) グラフニューラルネットワークに基づく遺伝子表現型予測
CN111785329B (zh) 基于对抗自动编码器的单细胞rna测序聚类方法
CN111798921A (zh) 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置
EP4118229A1 (en) Multi-modal methods and systems
CN112966114A (zh) 基于对称图卷积神经网络的文献分类方法和装置
CN112116957A (zh) 基于小样本的疾病亚型预测方法、系统、装置及介质
CN110110753A (zh) 基于精英花授粉算法和ReliefF的有效混合特征选择方法
Huang et al. Harnessing deep learning for population genetic inference
Bhardwaj et al. Computational biology in the lens of CNN
CN117611974B (zh) 基于多种群交替进化神经结构搜索的图像识别方法及系统
CN117672360B (zh) 基于迁移学习的基因组选择方法、装置、设备及介质
Dubey et al. An efficient adaptive feature selection with deep learning model-based paddy plant leaf disease classification
CN116956993A (zh) 一种构建图集成模型的方法、装置及存储介质
Louati et al. Design and compression study for convolutional neural networks based on evolutionary optimization for thoracic X-Ray image classification
CN114596913B (zh) 基于深度中心点模型的蛋白质折叠识别方法及系统
CN115423076A (zh) 基于两步式框架的有向超图链式预测方法
CN118296442B (zh) 多组学癌症亚型分类方法、系统、设备、介质及程序产品
CN113495986A (zh) 数据处理的方法与装置
CN117831636B (zh) 利用融合模型实施基因组选择的方法、装置、设备及介质
CN117995283B (zh) 一种单样本宏基因组聚类方法、系统、终端及存储介质
Li et al. Surrogate-Assisted Evolution of Convolutional Neural Networks by Collaboratively Optimizing the Basic Blocks and Topologies
CN114512188B (zh) 基于改进蛋白质序列位置特异性矩阵的dna结合蛋白识别方法
CN116992098B (zh) 引文网络数据处理方法及系统
CN117152568B (zh) 深度集成模型的生成方法、装置和计算机设备
Ding Machine learning for biological networks

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230719

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20231122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240712

R150 Certificate of patent or registration of utility model

Ref document number: 7522936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150