JP2022518283A - 予測方法及び装置、電子機器並びに記憶媒体 - Google Patents

予測方法及び装置、電子機器並びに記憶媒体 Download PDF

Info

Publication number
JP2022518283A
JP2022518283A JP2021543171A JP2021543171A JP2022518283A JP 2022518283 A JP2022518283 A JP 2022518283A JP 2021543171 A JP2021543171 A JP 2021543171A JP 2021543171 A JP2021543171 A JP 2021543171A JP 2022518283 A JP2022518283 A JP 2022518283A
Authority
JP
Japan
Prior art keywords
matrix
feature
test substance
substance
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021543171A
Other languages
English (en)
Inventor
▲劉▼▲橋▼
胡志▲強▼
Original Assignee
ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド filed Critical ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド
Publication of JP2022518283A publication Critical patent/JP2022518283A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Evolutionary Computation (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本願の実施例は、予測方法及び装置、電子機器並びに記憶媒体に関する。前記方法は、被検物質の分子構造に基づいて、被検物質の物質特徴を決定することと、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得ることと、前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応結果を予測することと、を含む。物質特徴により予測を行う場合、試験結果の精度及び試験結果の取得効率を向上させることができる。

Description

(関連出願の相互参照)
本願は、2019年11月18日に提出された出願番号201911125921.Xの中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本願に組み込まれる。
本願の実施例は、コンピュータ技術分野に関し、予測方法及び装置、電子機器並びに記憶媒体に関する。
薬物治療効果の不確実性及び癌患者の不均一性のため、薬物が癌細胞に対して抑制作用を果たすかどうかを試験することは、非常に重要である。
関連技術において、一般的には、手動で抽出された薬物特徴(例えば、分子フィンガープリント)と癌細胞の単一オミクスデータから抽出された癌細胞特徴に基づいて機械学習を行い、該癌細胞に対する薬物の抑制効果を得る。手動で抽出された薬物特徴は一般的には疎であるため、最終的に得られた抑制効果の正確度が低くて、且つ演算プロセスの効率が低い。
本願の実施例は、予測方法及び装置、電子機器並びに記憶媒体を提供する。
本願の実施例の一態様によれば、予測方法を提供する。前記方法は、
被検物質の分子構造に基づいて、被検物質の物質特徴を決定することと、
ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得ることと、
前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応結果を予測することと、を含む。
可能な実現形態において、前記被検物質の分子構造に基づいて、被検物質の物質特徴を決定することは、
前記被検物質の分子構造に基づいて、前記被検物質の構造特徴マップを構築することであって、前記構造特徴マップは、少なくとも2つのノード及び各ノード間の結線を含み、前記ノードは、前記分子構造における原子を表し、前記結線は、前記分子構造における原子結合を表す、ことと、
前記構造特徴マップに基づいて、前記被検物質の前記物質特徴を決定することと、を含む。
これにより、被検物質の構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。抽出された物質特徴は、より密である。更に、該物質特徴により予測を行う場合、試験結果の精度及び試験結果の取得効率を向上させることができる。
可能な実現形態において、前記構造特徴マップに基づいて、前記被検物質の前記物質特徴を決定することは、
前記構造特徴マップに基づいて、前記被検物質の第1隣接行列及び第1特徴行列を得ることであって、前記第1隣接行列は、前記被検物質の各原子間の近隣関係を表し、前記第1特徴行列は、前記被検物質の各原子の属性データを表す、ことと、
前記第1隣接行列及び前記第1特徴行列に基づいて、前記被検物質の前記物質特徴を得ることと、を含む。
これにより、第1隣接行列及び第1特徴行列で、被検物質の構造特徴を表すことができる。更に、第1隣接行列及び第1特徴行列に対してグラフ畳み込み処理を行うことで、被検物質の物質特徴を抽出することができる。
可能な実現形態において、前記第1隣接行列及び前記第1特徴行列に基づいて、前記被検物質の物質特徴を得ることは、
所定の入力次元及び前記第1隣接行列の次元に基づいて、前記第1隣接行列の補足行列を構築し、前記所定の入力次元及び前記第1特徴行列の次元に基づいて、前記第1特徴行列の補足行列を構築することと、
前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2特徴行列を得ることと、
前記第2隣接行列及び前記第2特徴行列をグラフ畳み込み処理し、前記被検物質の前記物質特徴を得ることと、を含む。
従って、本願の実施例で提供される試験方法は、任意のサイズ、構造の物質及びターゲットカテゴリの病変細胞に対する反応試験に適用可能であり、高い拡張能力を持つ。
可能な実現形態において、前記第2隣接行列において、前記第1隣接行列と前記第1隣接行列の補足行列とは、隣接関係を持たない。被検物質の原子と補足行列における原子とは、如何なる隣接関係を持たないため、被検物質の分子構造に影響を与えることがなく、更に、被検物質の試験結果に影響を与えることがない。
可能な実現形態において、前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2特徴行列を得ることは、
前記第1隣接行列及び前記第1隣接行列の補足行列に基づいて、第1接続行列を構築することと、
前記第1接続行列を介して、前記第1隣接行列と前記第1隣接行列の補足行列を接続し、次元が前記所定の次元である前記第2隣接行列を得ることと、
前記第1特徴行列と前記第1特徴行列の補足行列を接続し、次元が前記所定の入力次元である前記第2特徴行列を得ることと、を含む。
これにより、被検物質の物質特徴を、試験要件を満たす入力データとなるように構成することができる。また、被検物質の分子構造に影響を与えることがなく、更に、被検物質の試験結果に影響を与えることもない。
可能な実現形態において、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得ることは、
前記病変細胞の遺伝子突然変異に対して特徴抽出を行い、前記病変細胞のゲノム特徴を得ることと、
前記病変細胞の遺伝子発現に対して特徴抽出を行い、前記病変細胞のトランスクリプトーム特徴を得ることと、
前記病変細胞のデオキシリボ核酸(DeoxyriboNucleic Acid:DNA)メチル化データに対して特徴抽出を行い、前記病変細胞のエピゲノム特徴を得ることと、のうちの少なくとも1つを含む。
これにより、病変細胞の複数種の細胞特徴をマルチモーダルで学習し、十分な細胞特徴に基づいて反応予測を行い、予測結果の正確度を向上させることができる。
可能な実現形態において、前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応結果を予測することは、
前記物質特徴及び前記少なくとも1つの細胞特徴に対して特徴結合を行い、結合した組み合わせ特徴を得ることと、
前記組み合わせ特徴に対して畳み込み処理を行い、予測した、前記病変細胞に対する前記被検物質の反応結果を得ることと、を含む。
これにおり、被検物質の分子構造に基づいて、被検物質の、より密な物質特徴を抽出する。また、少なくとも1つの細胞特徴を結合することで、試験結果の精度及び試験結果の演算効率を向上させることができる。
可能な実現形態において、前記細胞特徴は、ゲノム特徴、トランスクリプトーム特徴及びエピゲノム特徴を含み、前記物質特徴及び前記少なくとも1つの細胞特徴に対して特徴結合を行い、結合した組み合わせ特徴を得ることは、
前記物質特徴と、前記ゲノム特徴、前記トランスクリプトーム特徴及び前記エピゲノム特徴のうちの少なくとも1つと、を特徴結合し、結合した組み合わせ特徴を得ることを含む。
これにより、病変細胞の複数種の細胞特徴をマルチモーダルで学習し、十分な細胞特徴に基づいて反応予測を行い、予測結果の正確度を向上させることができる。
可能な実現形態において、前記方法は、ニューラルネットワークにより実現し、前記方法は、所定の訓練集合により、前記ニューラルネットワークを訓練することであって、前記訓練集合は、複数組のサンプルデータを含み、各組のサンプルデータは、サンプル物質の構造特徴マップ、サンプル病変細胞の遺伝子突然変異、サンプル病変細胞の遺伝子発現、サンプル病変細胞のDNAメチル化データ、及び前記サンプル病変細胞に対するサンプル物質のアノテーション反応結果を含む、ことを更に含む。
可能な実現形態において、前記ニューラルネットワークは、第1特徴抽出ネットワーク、第2特徴抽出ネットワーク及び予測ネットワークを含み、所定の訓練集合により、前記ニューラルネットワークを訓練することは、
前記第1特徴抽出ネットワークにより、前記サンプル物質の構造特徴マップに対して特徴抽出を行い、前記サンプル物質のサンプル物質特徴を得ることと、
前記第2特徴抽出ネットワークにより、前記サンプル病変細胞の遺伝子突然変異に対応するサンプルゲノム特徴、前記サンプル病変細胞の遺伝子発現に対応するサンプルトランスクリプトーム特徴及び前記サンプル病変細胞のDNAメチル化データに対応するサンプルエピゲノム特徴をそれぞれ抽出することと、
前記予測ネットワークにより、結合したサンプル物質特徴、サンプルゲノム特徴、サンプルトランスクリプトーム特徴及びサンプルエピゲノム特徴に対して畳み込み処理を行い、前記サンプル病変細胞に対するサンプル物質の反応結果を得ることと、
前記反応結果及び前記アノテーション反応結果に基づいて、前記ニューラルネットワークの予測損失を決定することと、
前記予測損失に基づいて、前記ニューラルネットワークを訓練することと、を含む。
これにより、上記予測方法を実現させるためのニューラルネットワークを訓練することができる。被検物質の構造特徴マップに基づいて被検物質の物質特徴を抽出することができる。抽出した物質特徴はより密である。従って、該物質特徴により予測を行う時、試験結果の精度及び試験結果の取得効率を向上させることができる。
本願の一態様によれば、予測装置を提供する。前記予測装置は、
被検物質の分子構造に基づいて、被検物質の物質特徴を決定するように構成される第1決定部と、
ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得るように構成される抽出部と、
前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応予測結果を決定するように構成される第2決定部と、を備える。
本願の実施例の一態様によれば、電子機器を提供する。前記電子機器は、プロセッサと、プロセッサによる実行可能な命令を記憶するように構成されるメモリと、を備え、前記プロセッサは、前記メモリに記憶された命令を呼び出して、上記方法を実行するように構成される。
本願の実施例の一態様によれば、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体には、コンピュータプログラム命令が記憶されており、前記コンピュータプログラム命令がプロセッサにより実行されるときに、前記プロセッサに上記方法を実現させる。
これにより、被検物質の分子構造に基づいて、被検物質の構造特徴マップを構築し、更に、該構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。また、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出した後、被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴に基づいて、病変細胞に対する被検物質の反応結果を予測することができる。本願の実施例で提供される予測方法及び装置、電子機器並びに記憶媒体によれば、被検物質の構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。物質特徴の手動抽出に比べて、抽出した物質特徴はより密である。これにより、反応試験結果の精度及び試験結果の取得効率を向上させることができる。
上記の一般的な説明及び後述する細部に関する説明は、例示及び説明のためのものに過ぎず、本願を限定するものではないことが理解されるべきである。本願の他の特徴及び態様は、下記の図面に基づく例示的な実施例の詳細な説明を参照すれば明らかになる。
本願の実施例による予測方法を示すフローチャートである。 本願の実施例による行列を示す概略図である。 本願の実施例による予測方法を示すフローチャートである。 本願の実施例による予測装置の構造を示す概略図である。 本願の実施例による電子機器の構造を示す概略図である。 本願の実施例による電子機器の構造を示す概略図である。
ここで添付した図面は、明細書に引き入れて本明細書の一部分を構成し、本願に適合する実施例を示し、かつ、明細書とともに本願の技術的解決手段を解釈することに用いられる。
以下、図面を参照しながら本願の種々の例示的な実施例、特徴及び態様を詳しく説明する。図面における同一の符号は、同一または類似する機能を有する要素を示す。図面は、実施例の種々の態様を示しているが、特別な説明がない限り、必ずしも比率どおりの図面ではない。
ここで使用した「例示的」という用語は「例、実施例として用いられるか、または説明のためのものである」ことを意味する。ここで、「例示的なもの」として説明される如何なる実施例は、他の実施例より好適または有利であると必ずしも解釈されるべきではない。
本明細書において、用語「及び/又は」は、関連対象の関連関係を説明するためのものであり、3通りの関係が存在することを表す。例えば、A及び/又はBは、Aのみが存在すること、AとBが同時に存在すること、Bのみが存在するという3つの場合を表す。また、本明細書において、用語「少なくとも1つ」は、複数のうちのいずれか1つ又は複数のうちの少なくとも2つの任意の組み合わせを表す。例えば、A、B、Cのうちの少なくとも1つを含むことは、A、B及びCからなる集合から選ばれるいずれか1つ又は複数の要素を含むことを表す。
なお、本願をより良く説明するために、以下の具体的な実施形態において具体的な細部を多く記載した。当業者は、これら具体的な詳細に関わらず、本開示は同様に実施可能であると理解すべきである。本発明の主旨を明確にするために、一部の実例において、当業者に熟知されている方法、手段、素子及び回路については詳しく説明しないことにする。
図1は、本願の実施例による予測方法を示すフローチャートである。該予測方法は、端末装置又は他の処理機器により実行されてもよい。ここで、端末装置は、ユーザ装置(User Equipment:UE)、携帯機器、ユーザ端末、端末、セルラ電話、コードレス電話、パーソナルデジタルアシスタント(Personal Digital Assistant:PDA)、ハンドヘルドデバイス、コンピューティングデバイス、車載機器、ウェアブル機器などであってもよい。他の処理機器は、サーバ又はクラウドサーバ等であってもよい。幾つかの可能な実現形態において、該予測方法は、プロセッサによりメモリに記憶されているコンピュータ可読命令を呼び出すことで実現することができる。
図1に示すように、前記予測方法は、以下を含んでもよい。
S11において、被検物質の分子構造に基づいて、被検物質の物質特徴を決定する。
例えば、被検物質は、薬物のような、分子構造を有する物質であってもよい。被検物質の分子構造は、複数の原子及び複数原子間の原子結合により構成される。該被検物質の分子構造に基づいて、被検物質の物質特徴を抽出することができる。
可能な実現形態において、被検物質の分子構造に基づいて、被検物質の物質特徴を決定することは、
被検物質の分子構造に基づいて、前記被検物質の構造特徴マップを構築することであって、前記構造特徴マップは、少なくとも2つのノード及び各ノード間の結線を含み、前記ノードは、前記分子構造における原子を表し、前記結線は、前記分子構造における原子結合を表す、ことと、
前記構造特徴マップに基づいて、前記被検物質の前記物質特徴を決定することと、を含む。
例えば、被検物質の分子構造に基づいて、被検物質の構造特徴マップを構築することができる。被検物質の分子構造は、少なくとも2つの原子及び少なくとも2つの原子間の原子結合で構成されるため、被検物質の構造特徴マップに、少なくとも2つのノード及び各ノード間の結線が含まれてもよい。ここで、ノードは、分子構造における原子を表すことができ、ノード間の結線は、原子間の原子結合を表すことができる。
被検物質の構造特徴マップにより特徴抽出を行い、被検物質の物質特徴を得ることができる。例示的に、構造特徴マップに対して特徴抽出を行うための畳み込みニューラルネットワークを事前訓練する。該畳み込みニューラルネットワークにより、被検物質の構造特徴マップに対して特徴抽出を行い、被検物質の物質特徴を得ることができる。これにより、被検物質の構造特徴マップに基づいて、被検物質の物質特徴を抽出することができると共に、物質特徴の手動抽出に比べて、抽出した物質特徴もより密である。更に、該物質特徴により予測を行う時、試験結果の精度及び試験結果の取得効率を向上させることができる。
S12において、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得る。
例えば、ターゲットカテゴリは、癌又は任意の他のカテゴリの病変であってもよく、本願は、これを限定するものではない。例示的に、現在、Aタイプの癌に対する治療薬物Bが開発されており、Aタイプの癌の癌細胞に対する薬物Bの反応を試験する必要がある。従って、薬物Bは、被検物質であり、Aタイプの癌の癌細胞は、ターゲットカテゴリの病変細胞である。
例示的に、病変細胞に対して特徴抽出を行うための畳み込みニューラルネットワークを事前訓練することができる。該畳み込みニューラルネットワークにより、病変細胞に対して細胞特徴抽出を行い、該病変細胞の少なくとも1つの細胞特徴を得ることができる。例えば、病変細胞のゲノム特徴、トランスクリプトーム特徴及びエピゲノム特徴のうちの少なくとも1つの特徴を抽出する。
S13において、物質特徴及び少なくとも1つの細胞特徴に基づいて、病変細胞に対する被検物質の反応結果を予測する。
被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴を得た後、被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴に基づいて予測操作を行い、予測した、前記病変細胞に対する被検物質の反応結果を得ることができる。
例示的に、物質特徴及び少なくとも1つの細胞特徴に基づいて反応予測を行うための畳み込みニューラルネットワークを事前訓練することができる。該畳み込みニューラルネットワークにより、被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴に対して予測操作を行い、予測した、病変細胞に対する被検物質の反応結果を得る。
可能な実現形態において、物質特徴及び少なくとも1つの細胞特徴に基づいて、病変細胞に対する被検物質の反応結果を予測することは、
物質特徴及び少なくとも1つの細胞特徴に対して特徴結合を行い、組み合わせ特徴を得ることと、
組み合わせ特徴に対して畳み込み処理を行い、予測した、病変細胞に対する被検物質の反応結果を得ることと、を含む。
例えば、被検物質の物質特徴と少なくとも1つの細胞特徴を直接的に結合した後、組み合わせ特徴を得ることができる。該組み合わせ特徴は、物質特徴+細胞特徴として表されてもよい。事前訓練された、反応試験のための畳み込みニューラルネットワークにより、該組み合わせ特徴に対して畳み込み処理を行う。該畳み込みニューラルネットワークの出力は、0~1である確率値であってもよい。該確率値は、該被検物質が該病変細胞に対して抑制作用を果たす確率を表す。
これにより、被検物質の分子構造に基づいて、被検物質の物質特徴を決定することができる。また、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出した後、被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴に基づいて、病変細胞に対する被検物質の反応結果を予測することができる。本願の実施例で提供される予測方法によれば、被検物質の構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。また、物質特徴の手動抽出に比べて、抽出した物質特徴はより密である。抽出した物質特徴を用いて反応結果を予測する場合、反応結果の試験精度及び試験結果の取得効率を向上させることができる。
可能な実現形態において、構造特徴マップに基づいて、被検物質の物質特徴を決定することは、
構造特徴マップに基づいて、被検物質の第1隣接行列及び第1特徴行列を得ることであって、第1隣接行列は、被検物質の各原子間の近隣関係を表し、第1特徴行列は、被検物質の各原子の属性データを表す、ことと、
被検物質の第1隣接行列及び第1特徴行列に基づいて、被検物質の物質特徴を得ることと、を含む。
例えば、構造特徴マップに基づいて、被検物質の各原子の隣接原子を抽出し、各原子の隣接原子で第1隣接行列を構成することができる。該第1隣接行列の各行は、被検物質の各原子と他の原子との近隣関係を表す。ここで、該近隣関係は、接続関係を表す。例えば、第1隣接行列の第1行は、該被検物質の1つ目の原子と他の原子とは接続関係を持つかどうかを表す。接続関係を持つ場合、第1隣接行列において、1で表され、接続関係を持たない場合、0で表される。構造特徴マップに基づいて、被検物質の各原子を抽出し、各原子の属性データを取得することができる。例えば、データベースから、各原子の属性データをクエリする。該属性データは、原子タイプ、原子のヘテロ化程度などの化学的性質を含んでもよいが、これらに限定されない。各原子の属性データで第1特徴行列を構成することができる。該第1特徴行列の各行は、被検物質の各原子の属性データを表す。第1隣接行列及び第1特徴行列に対してグラフ畳み込み処理を行うことで、被検物質の物質特徴を抽出することができる。
第1隣接行列及び第1特徴行列に対するグラフ畳み込み処理は、下記式(1-1)及び式(1-2)により実現することができる。
Figure 2022518283000002
ただし、
Figure 2022518283000003
の度行列を表す。Hは、第1層グラフ畳み込みの畳み込み結果を表す。
Figure 2022518283000004
は、正規化した度行列Dを表す。度行列Dの対角線は、各原子の隣接原子の数(該原子と結合したものは、隣接原子である)を表す。
Figure 2022518283000005
は、正規化した第1隣接行列を表し、Xは、第1特徴行列を表し、
Figure 2022518283000006
は、第1層グラフ畳み込みのフィルタパラメータを表す。
Figure 2022518283000007
は、第l+1層グラフ畳み込みの畳み込み結果を表し、
Figure 2022518283000008
は、第1層グラフ畳み込みの畳み込み結果を表し、
Figure 2022518283000009
は、第1層グラフ畳み込みのフィルタパラメータを表し、
Figure 2022518283000010
は、非線形活性化関数を表す。
これにより、第1隣接行列及び第1特徴行列で被検物質の構造特徴を表すことができる。更に、第1隣接行列及び第1特徴行列に対してグラフ畳み込み処理を行うことで、被検物質の物質特徴を抽出することができる。
可能な実現形態において、前記第1隣接行列及び前記第1特徴行列に基づいて、前記被検物質の物質特徴を得ることは、
所定の入力次元及び前記第1隣接行列の次元に基づいて、前記第1隣接行列の補足行列を構築し、所定の入力次元及び前記第1特徴行列の次元に基づいて、前記第1特徴行列の補足行列を構築することと、
前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が所定の入力次元である第2特徴行列を得ることと、
前記第2隣接行列及び前記第2特徴行列をグラフ畳み込み処理し、前記被検物質の物質特徴を得ることと、を含む。
例えば、上記所定の入力次元は、所定の入力データの次元であってもよい。例えば、所定の入力次元は、100と設定されてもよい。第1隣接行列を得た後、第1隣接行列の次元に基づいて、第1隣接行列の補足行列の次元を決定し、更に、該次元の第1隣接行列の補足行列を構築する必要がある。例えば、所定の入力次元と第1隣接行列の次元との差が第1隣接行列の補足行列の次元であると決定する。例示的に、所定の入力次元が100と設定され、第1隣接行列の次元が20*20であり、第1特徴行列の次元が20*75である場合、第1隣接行列の補足行列の次元が80*80であり、第1特徴行列の補足行列の次元が80*25であると決定することができる。
第1隣接行列の補足行列は、ゼロ行列と設定されてもよく、又は任意の近隣関係を持つ隣接行列としてランダムサンプリングされてもよい。第1特徴行列を得た後、第1特徴行列の次元に基づいて第1特徴行列の補足行列の次元を決定し、該次元の第1特徴行列の補足行列を更に構築する必要がある。例えば、所定の入力次元と第1特徴行列の次元との差が第1特徴行列の補足行列の次元であると決定し、第1特徴行列における一般的な原子をランダムに選択し、選択した原子により、第1特徴行列の補足行列を構築する。
第1隣接行列の補足行列を構築した後、第1隣接行列と第1隣接行列の補足行列をスプライシング処理し、第2隣接行列を得ることができる。該第2隣接行列の次元は、所定の入力次元*所定の入力次元である。第1特徴行列の補足行列を構築した後、第1特徴行列と第1特徴行列の補足行列をスプライシング処理し、第2特徴行列を得ることができる。該第2特徴行列の次元は、所定の入力次元*原子特徴次元である。例示的に、所定の入力次元が100と設定され、原子特徴次元が75である場合、第2隣接行列の次元が100*100であり、第2特徴行列の次元が100*75であると決定することができる。
第2隣接行列及び第2特徴行列に対するグラフ畳み込み処理は、下記式(1-3)、式(1-4)及び式(1-5)により実現することができる。
Figure 2022518283000011
ただし、
Figure 2022518283000012
の度行列を表し、
Figure 2022518283000013
の度行列を表す。
Figure 2022518283000014
は、第1層の畳み込み結果における最初のn(被検物質の原子数)行を表し、
Figure 2022518283000015
は、第1層の畳み込み結果における
Figure 2022518283000016
以外の行を表し、
Figure 2022518283000017
は、第1接続行列を表し、
Figure 2022518283000018
はそれぞれ、第1接続行列
Figure 2022518283000019
の行及び列の2つ度行列を表し、Xは、第1特徴行列を表し、
Figure 2022518283000020
は、第1特徴行列の補足行列を表し、
Figure 2022518283000021
は、正規化した第1隣接行列の補足行列を表し、
Figure 2022518283000022
は、正規化した第1隣接行列の補足行列の度行列を表し、
Figure 2022518283000023
は、非線形活性化関数を表し、
Figure 2022518283000024
は、第1層グラフ畳み込みのフィルタパラメータを表し、
Figure 2022518283000025
は、第1層グラフ畳み込みのフィルタパラメータを表す。第1接続行列がゼロであり、つまり、第1隣接行列と前記第1隣接行列の補足行列とは隣接関係を持たない場合、式(1-3)、(1-4)を簡略化することで、式(1-5)を得ることができる。
従って、本願の実施例で提供される試験方法は、任意のサイズ、構造の物質及びターゲットカテゴリの病変細胞に対する反応試験に適用可能であり、高い拡張能力を持つ。
可能な実現形態において、前記第2隣接行列において、前記第1隣接行列と前記第1隣接行列の補足行列とは、隣接関係を持たない。ここで、行列同士が隣接関係を持たないことは、1つの行列に含まれる原子と、もう1つの行列に含まれる原子とが、如何なる接続関係も持たないことを指す。
第1隣接行列と第1隣接行列の補足行列をスプライシングすることで得られた第2隣接行列において、第1隣接行列と第1隣接行列の補足行列とは、隣接関係を持たない。つまり、被検物質の原子と補足行列における原子とは、如何なる接続関係も持たない。これにより、第1隣接行列の補足行列及び第1隣接行列で、所定の入力次元の第2隣接行列を構成することができる。第1特徴行列の補足行列及び第1特徴行列で、所定の入力次元の第2特徴行列を構成することができる。被検物質の原子と補足行列における原子とは如何なる隣接関係も持たないため、被検物質の分子構造に影響を与えることがなく、更に、被検物質の試験結果に影響を与えることがない。
可能な実現形態において、前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が所定の入力次元である第2特徴行列を得ることは、
前記第1隣接行列及び前記第1隣接行列の補足行列に基づいて、第1接続行列を構築することであって、前記第1接続行列における要素は、いずれも所定値である、ことと、
前記第1接続行列を介して、前記第1隣接行列と前記第1隣接行列の補足行列を接続し、次元が所定の次元である第2隣接行列を得ることと、
前記第1特徴行列と前記第1特徴行列の補足行列を接続し、次元が所定の入力次元である第2特徴行列を得ることと、を含む。
例えば、構造要素がいずれも0である第1接続行列を構築することができる。該第1接続行列、第1隣接行列及び第1隣接行列の補足行列は、第2隣接行列を構成する。第2隣接行列において、該第1接続行列は、第1隣接行列と第1隣接行列の補足行列を接続する。これにより、第1隣接行列と第1隣接行列の補足行列に、隣接関係を持たせない。例示的に、図2は、本願の実施例で提供される行列を示す概略図である。図2に示す次元が100*100である第2隣接行列において、次元が20*20である第1隣接行列は、該第2隣接行列の左上に位置し、次元が80*80である第1隣接行列の補足行列は、該第2隣接行列の右下に位置し、第1隣接行列の下方及び第1隣接行列の補足行列の左側に位置するものは、次元が20*80である第1接続行列である。第1隣接行列の右側及び第1隣接行列の補足行列の上方に位置するものは、次元が80*20である第1接続行列である。
上記図2に示したものは、第1接続行列を介して第1隣接行列と第1隣接行列の補足行列を接続する場合の一例だけであることに留意されたい。実際に、第1隣接行列と第1隣接行列の補足行列に隣接関係を持たせない如何なる接続形態であってもよい。例えば、次元が20*20である第1隣接行列は、第2隣接行列の右下に位置し、次元が80*80である第1隣接行列の補足行列は、該第2隣接行列の左上に位置する。第1隣接行列の上方及び第1隣接行列の補足行列の右側に位置するものは、次元が80*20である第1接続行列である。第1隣接行列の左側及び第1隣接行列の補足行列の下方に位置するものは、次元が20*80である第1接続行列である。本願は、第1接続行列を介して第1隣接行列と第1隣接行列の補足行列を接続する形態を具体的に限定しない。
なお、第1隣接行列と第1隣接行列の補足行列の接続形態に応じて、第1特徴行列と第1特徴行列の補足行列の接続形態を決定することができる。例えば、図2における第1隣接行列と第1隣接行列の補足行列の接続形態によれば、第1特徴行列と第1特徴行列の補足行列の接続形態は、第1特徴行列が上方に位置し、第1特徴行列の補足行列が下方に位置するという形態であってもよい。
第1隣接行列と第1隣接行列の補足行列の接続形態は、第1隣接行列が第2隣接行列の右下に位置し、第1隣接行列の補足行列が第2隣接行列の左上に位置するという形態である場合、第2特徴行列における第1特徴行列は、下方に位置し、第1特徴行列の補足行列は、上方に位置する。
これにより、被検物質の物質特徴を、試験要件を満たす入力データとなるように構成することができる。また、被検物質の分子構造に影響を与えることがなく、更に、被検物質の反応試験結果に影響を与えることもない。
可能な実現形態において、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得ることは、
前記病変細胞の遺伝子突然変異に対して特徴抽出を行い、前記病変細胞のゲノム特徴を得ることと、
前記病変細胞の遺伝子発現に対して特徴抽出を行い、前記病変細胞のトランスクリプトーム特徴を得ることと、
前記病変細胞のデオキシリボ核酸(DeoxyriboNucleic Acid:DNA)メチル化データに対して特徴抽出を行い、前記病変細胞のエピゲノム特徴を得ることと、のうちの少なくとも1つを含む。
例えば、ターゲットカテゴリの病変細胞を決定した後、該病変細胞の遺伝子突然変異、遺伝子発現及びDNAメチル化データを取得することができる。該取得プロセスは、関連技術を利用して抽出することであってもよく、又は、データベースから直接的にクエリすることであってもよい。本願は、ここで、該プロセスを詳しく説明しない。
例示的に、病変細胞の遺伝子突然変異、遺伝子発現及びDNAメチル化データを、所定次元のベクトルとなるように予め前処理することができる。例えば、病変細胞の遺伝子突然変異を、34673次元のベクトルとなるように前処理し、病変細胞の遺伝子発現を、697次元のベクトルとなるように前処理し、病変細胞のDNAメチル化データを、808次元のベクトルとなるように前処理する。ゲノム特徴を抽出するための畳み込みニューラルネットワークを予め訓練し、該畳み込みニューラルネットワークにより、前処理した病変細胞の遺伝子突然変異に対して特徴抽出を行い、該病変細胞のゲノム特徴を得ることができる。トランスクリプトーム特徴を抽出するための畳み込みニューラルネットワークを予め訓練し、該畳み込みニューラルネットワークにより、前処理した病変細胞の遺伝子発現に対して特徴抽出を行い、該病変細胞のトランスクリプトーム特徴を得ることができる。エピゲノム特徴を抽出するための畳み込みニューラルネットワークを予め訓練し、該畳み込みニューラルネットワークにより、前処理したDNAメチル化データに対して特徴抽出を行い、該病変細胞のエピゲノム特徴を得ることができる。ここで、ゲノム特徴の次元、トランスクリプトーム特徴の次元及びエピゲノム特徴の次元は、物質特徴の次元と同じである。可能な実現形態において、細胞特徴を抽出するための畳み込みニューラルネットワークは、マルチモダリティサブニューラルネットワークである。
可能な実現形態において、前記細胞特徴は、ゲノム特徴、トランスクリプトーム特徴及びエピゲノム特徴を含み、前記物質特徴及び前記少なくとも1つの細胞特徴に対して特徴結合を行い、結合した組み合わせ特徴を得ることは、
前記物質特徴と、前記ゲノム特徴、前記トランスクリプトーム特徴及び前記エピゲノム特徴のうちの少なくとも1つと、を特徴結合し、結合した組み合わせ特徴を得ることを含む。
例示的に、被検物質の物質特徴を、ゲノム特徴、前記トランスクリプトーム特徴、前記エピゲノム特徴と特徴結合することで、組み合わせ特徴を得ることができる。該組み合わせ特徴は、物質特徴+ゲノム特徴+トランスクリプトーム特徴+エピゲノム特徴で表されてもよい。該組み合わせ特徴に対して畳み込み処理を行うことで、病変細胞に対する被検物質の反応予測結果を得ることができる。
これにより、病変細胞の複数種の細胞特徴をマルチモーダルで学習し、十分な細胞特徴に基づいて反応結果の予測を行い、予測結果の正確度を向上させることができる。
当業者に本願の実施例をより好適に理解させるために、以下、図3に示す例により、本願の実施例を説明する。
図3は、本願の実施例による予測方法を示すフローチャートである。図3に示すように、被検物質は、薬物であり、病変細胞は、癌細胞である。被検薬物の分子構造に基づいて、被検薬物の構造特徴マップを構築する。物質特徴抽出ネットワークにより、該構造特徴マップに対して特徴抽出を行い、被検薬物の物質特徴を得る。癌細胞の遺伝子突然変異、遺伝子発現及びDNAメチル化データを取得し、細胞特徴抽出ネットワークにより、細胞特徴抽出を行う。ここで、細胞特徴抽出ネットワークは、ゲノム特徴抽出ネットワーク、トランスクリプトーム特徴抽出ネットワーク及びエピゲノム特徴抽出ネットワークを含む。ゲノム特徴抽出ネットワークにより、遺伝子突然変異に対して特徴抽出を行い、癌細胞のゲノム特徴を得ることができる。トランスクリプトーム特徴抽出ネットワークにより、遺伝子発現に対して特徴抽出を行い、癌細胞のトランスクリプトーム特徴を得ることができる。エピゲノム特徴抽出ネットワークにより、DNAメチル化データに対して特徴抽出を行い、癌細胞のエピゲノム特徴を得ることができる。被検薬物の物質特徴に対してプーリング処理を行った後、プーリング処理された物質特徴と、ゲノム特徴、トランスクリプトーム特徴及びエピゲノム特徴と、に対して、結合処理を行い、組み合わせ特徴を得て、組み合わせ特徴に対して畳み込み処理を行い、予測した、該癌細胞に対する被検薬物の反応結果(該反応結果は、該被検薬物が該癌細胞に対して敏感であるか、それとも抑制作用を果たすかを表す)を得る。
可能な実現形態において、前記方法は、ニューラルネットワークにより実現し、前記方法は、所定の訓練集合により、前記ニューラルネットワークを訓練することであって、前記訓練集合は、複数組のサンプルデータを含み、各組のサンプルデータは、サンプル物質の構造特徴マップ、サンプル病変細胞の遺伝子突然変異、サンプル病変細胞の遺伝子発現、サンプル病変細胞のDNAメチル化データ、及び前記サンプル病変細胞に対するサンプル物質のアノテーション反応結果を含む、ことを更に含む。
可能な実現形態において、前記ニューラルネットワークは、同一性グラフ畳み込みニューラルネットワークである。
可能な実現形態において、前記ニューラルネットワークは、第1特徴抽出ネットワーク、第2特徴抽出ネットワーク及び予測ネットワークを含み、所定の訓練集合により、前記ニューラルネットワークを訓練することは、
前記第1特徴抽出ネットワークにより、前記サンプル物質の構造特徴マップに対して特徴抽出を行い、前記サンプル物質のサンプル物質特徴を得ることと、
前記第2特徴抽出ネットワークにより、前記サンプル病変細胞の遺伝子突然変異に対応するサンプルゲノム特徴、前記サンプル病変細胞の遺伝子発現に対応するサンプルトランスクリプトーム特徴及び前記サンプル病変細胞のDNAメチル化データに対応するサンプルエピゲノム特徴をそれぞれ抽出することと、
前記予測ネットワークにより、結合したサンプル物質特徴、サンプルゲノム特徴、サンプルトランスクリプトーム特徴及びサンプルエピゲノム特徴に対して畳み込み処理を行い、前記サンプル病変細胞に対するサンプル物質の反応結果を予測することと、
前記反応予測結果及び前記アノテーション反応結果に基づいて、前記ニューラルネットワークの予測損失を決定することと、
前記予測損失に基づいて、前記ニューラルネットワークを訓練することと、を含む。
例えば、第1特徴抽出ネットワークにより、サンプル物質の構造特徴マップに対して特徴抽出を行い、サンプル物質のサンプル物質特徴を得ることができる。第2特徴抽出ネットワークは、第1サブネットワーク、第2サブネットワーク及び第3サブネットワークを含んでもよい。第1サブネットワークにより、サンプル病変細胞の遺伝子突然変異に対して特徴抽出を行い、サンプルゲノム特徴を得ることができる。第2サブネットワークにより、サンプル病変細胞の遺伝子発現に対して特徴抽出を行い、サンプルトランスクリプトーム特徴を得ることができる。第3サブネットワークにより、サンプル病変細胞のDNAメチル化データに対して特徴抽出を行い、サンプルエピゲノム特徴を得ることができる。サンプル物質特徴、サンプルゲノム特徴、サンプルトランスクリプトーム特徴及びサンプルエピゲノム特徴を結合し、組み合わせサンプル特徴を得る。予測ネットワークにより、組み合わせサンプル特徴に対して畳み込み処理を行い、サンプル病変細胞に対するサンプル物質の反応結果を得る。反応結果及びアノテーション反応結果に基づいて、ニューラルネットワークの予測損失を決定する。該予測損失に基づいて、ニューラルネットワークのネットワークパラメータを調整する。ニューラルネットワークの予測損失を、訓練要件を満たすようにする。例えば、ニューラルネットワークの予測損失を訓練閾値未満であるようにする。
本願の実施例で提供される上記各方法の実施例は、原理や論理から逸脱しない限り、互いに組み合わせることで組み合わせた実施例を構成することができ、紙数に限りがあるため、本願において逐一説明しないことが理解されるべきである。具体的な実施形態の上記方法において、各ステップの具体的な実行順番はその機能及び考えられる内在的論理により決まることは、当業者であれば理解すべきである。
なお、本願の実施例は、予測装置、電子機器、コンピュータ可読記憶媒体及びプログラムを更に提供する。上記はいずれも、本願の実施例で提供されるいずれか1つの予測方法を実現させるためのものである。対応する技術的解決手段及び説明は、方法に関連する記述を参照されたい。ここで、詳細な説明を省略する。
図4は、本願の実施例による予測装置の構造を示す概略図である。図4に示すように、前記予測装置は、
被検物質の分子構造に基づいて、被検物質の物質特徴を決定するように構成される第1決定部401と、
ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得るように構成される抽出部402と、
前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応結果を予測するように構成される第2決定部403と、を備える。
これにより、被検物質の分子構造に基づいて、被検物質の構造特徴マップを構築し、更に、該構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。また、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出した後、被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴に基づいて、病変細胞に対する被検物質の反応結果を予測することができる。本願の実施例で提供される予測装置によれば、被検物質の構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。物質特徴の手動抽出に比べて、抽出した物質特徴はより密である。これにより、反応試験結果の精度及び試験結果の取得効率を向上させることができる。
可能な実現形態において、前記第1決定部401は、
被検物質の分子構造に基づいて、前記被検物質の構造特徴マップを構築するように構成され、前記構造特徴マップは、少なくとも2つのノード及び各ノード間の結線を含み、前記ノードは、前記分子構造における原子を表し、前記結線は、前記分子構造における原子結合を表し、
前記第1決定部401は、前記構造特徴マップに基づいて、前記被検物質の物質特徴を決定するように構成される。
可能な実現形態において、前記第1決定部401は更に、
前記構造特徴マップに基づいて、前記被検物質の第1隣接行列及び第1特徴行列を得るように構成され、前記第1隣接行列は、前記被検物質の各原子間の近隣関係を表し、前記第1特徴行列は、前記被検物質の各原子の属性データを表し、
前記第1決定部401は更に、前記第1隣接行列及び前記第1特徴行列に基づいて、前記被検物質の前記物質特徴を得るように構成される。
可能な実現形態において、前記第1決定部401は更に、
所定の入力次元及び前記第1隣接行列の次元に基づいて、前記第1隣接行列の補足行列を構築し、前記所定の入力次元及び前記第1特徴行列の次元に基づいて、前記第1特徴行列の補足行列を構築し、
前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2特徴行列を得て、
前記第2隣接行列及び前記第2特徴行列をグラフ畳み込み処理し、前記被検物質の前記物質特徴を得るように構成される。
可能な実現形態において、前記第2隣接行列において、前記第1隣接行列と前記第1隣接行列の補足行列とは、隣接関係を持たない。
可能な実現形態において、前記第1決定部401は更に、
前記第1隣接行列及び前記第1隣接行列の補足行列に基づいて、第1接続行列を構築し、
前記第1接続行列を介して、前記第1隣接行列と前記第1隣接行列の補足行列を接続し、次元が前記所定の次元である前記第2隣接行列を得て、
前記第1特徴行列と前記第1特徴行列の補足行列を接続し、次元が前記所定の入力次元である前記第2特徴行列を得るように構成される。
可能な実現形態において、前記抽出部402は、
前記病変細胞の遺伝子突然変異に対して特徴抽出を行い、前記病変細胞のゲノム特徴を得ることと、
前記病変細胞の遺伝子発現に対して特徴抽出を行い、前記病変細胞のトランスクリプトーム特徴を得ることと、
前記病変細胞のDNAメチル化データに対して特徴抽出を行い、前記病変細胞のエピゲノム特徴を得ることと、のうちの少なくとも1つを実行するように構成される。
可能な実現形態において、前記第2決定部403は、
前記物質特徴及び前記少なくとも1つの細胞特徴に対して特徴結合を行い、結合した組み合わせ特徴を得て、
前記組み合わせ特徴に対して畳み込み処理を行い、前記病変細胞に対する前記被検物質の反応結果を得るように構成される。
可能な実現形態において、前記細胞特徴は、ゲノム特徴、トランスクリプトーム特徴及びエピゲノム特徴を含み、前記第2決定部403は更に、
前記物質特徴と、前記ゲノム特徴、前記トランスクリプトーム特徴及び前記エピゲノム特徴のうちの少なくとも1つと、を特徴結合し、結合した組み合わせ特徴を得るように構成される。
可能な実現形態において、前記装置は、ニューラルネットワークにより実現し、前記装置は、
所定の訓練集合により、前記ニューラルネットワークを訓練するように構成される訓練部であって、前記訓練集合は、複数組のサンプルデータを含み、各組のサンプルデータは、サンプル物質の構造特徴マップ、サンプル病変細胞の遺伝子突然変異、サンプル病変細胞の遺伝子発現、サンプル病変細胞のDNAメチル化データ、及び前記サンプル病変細胞に対するサンプル物質のアノテーション反応結果を含む、訓練部を更に備える。
可能な実現形態において、前記ニューラルネットワークは、第1特徴抽出ネットワーク、第2特徴抽出ネットワーク及び予測ネットワークを含み、前記訓練部は更に、
前記第1特徴抽出ネットワークにより、前記サンプル物質の構造特徴マップに対して特徴抽出を行い、前記サンプル物質のサンプル物質特徴を得て、
前記第2特徴抽出ネットワークにより、前記サンプル病変細胞の遺伝子突然変異に対応するサンプルゲノム特徴、前記サンプル病変細胞の遺伝子発現に対応するサンプルトランスクリプトーム特徴及び前記サンプル病変細胞のDNAメチル化データに対応するサンプルエピゲノム特徴をそれぞれ抽出し、
前記予測ネットワークにより、結合したサンプル物質特徴、サンプルゲノム特徴、サンプルトランスクリプトーム特徴及びサンプルエピゲノム特徴に対して畳み込み処理を行い、前記サンプル病変細胞に対するサンプル物質の反応結果を得て、
前記反応結果及び前記アノテーション反応結果に基づいて、前記ニューラルネットワークの予測損失を決定し、
前記予測損失に基づいて、前記ニューラルネットワークを訓練するように構成される。
幾つかの実施例において、本願の実施例で提供される装置における機能及びモジュールは、上記方法実施例に記載の方法を実行するために用いられ、具体的な実現形態は上記方法実施例の説明を参照されたい。簡潔化のために、ここで詳細な説明を省略する。
本願の実施例及び他の実施例において、「部」とは、一部の回路、一部のプロセッサ、一部のプログラム又はソフトウェア等であってもよく、勿論、ユニットであってもよく、モジュールや非モジュール化のものであってもよい。
本願の実施例はコンピュータ可読記憶媒体を更に提供する。該コンピュータ可読記憶媒体にはコンピュータプログラム命令が記憶されており、前記コンピュータプログラム命令がプロセッサにより実行される時、上記方法を実現させる。コンピュータ可読記憶媒体は不揮発性コンピュータ可読記憶媒体であってもよい。
本願の実施例は電子機器を更に提供する。該電子機器は、プロセッサと、プロセッサによる実行可能な命令を記憶するように構成されるメモリと、を備え、前記プロセッサは、前記メモリに記憶されている命令を呼び出して、上記方法を実行するように構成される。
本願の実施例は、コンピュータプログラム製品を更に提供する。前記コンピュータプログラム製品は、コンピュータ可読コードを含み、コンピュータ可読コードが機器で実行される時、機器におけるプロセッサは、上記いずれか1つの実施例で提供される予測方法を実現させる命令を実行する。
本願の実施例は、もう1つのコンピュータプログラム製品を更に提供する。前記コンピュータプログラム製品は、コンピュータ可読命令を記憶するように構成され、命令が実行される時、コンピュータに上記いずれか1つの実施例で提供される予測方法の操作を実行させる。
電子機器は、端末、サーバ又は他の形態の機器として提供されてもよい。
図5は、本願の実施例による電子機器の構造を示す概略図である。例えば、電子機器800は、携帯電話、コンピュータ、デジタル放送端末、メッセージング装置、ゲームコンソール、タブレットデバイス、医療機器、フィットネス機器、パーソナルデジタルアシスタントなどの端末であってもよい。
図5を参照すると、電子機器800は、処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インタフェース812、センサコンポーネント814及び通信コンポーネント816のうちの1つ又は複数を備えてもよい。
処理コンポーネント802は一般的には、電子機器800の全体操作を制御する。例えば、表示、通話呼、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理コンポーネント802は、指令を実行するための1つ又は複数のプロセッサ820を備えてもよい。それにより上記方法の全て又は一部のステップを実行する。なお、処理コンポーネント802は、他のユニットとのインタラクションのために、1つ又は複数のモジュールを備えてもよい。例えば、処理コンポーネント802はマルチメディアモジュールを備えることで、マルチメディアコンポーネント808と処理コンポーネント802とのインタラクションに寄与する。
メモリ804は、各種のデータを記憶することで電子機器800における操作をサポートするように構成される。これらのデータの例として、電子機器800上で操作れる如何なるアプリケーション又は方法の命令、連絡先データ、電話帳データ、メッセージ、イメージ、ビデオ等を含む。メモリ804は任意のタイプの揮発性または不揮発性記憶装置、あるいはこれらの組み合わせにより実現される。例えば、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能なプログラマブル読み出し専用メモリ(EEPROM)、電気的に消去可能なプログラマブル読出し専用メモリ(EPROM)、プログラマブル読出し専用メモリ(PROM)、読出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気もしくは光ディスクを含む。
電源コンポーネント806は電子機器800の様々なユニットに電力を提供する。電源コンポーネント806は、電源管理システム、1つ又は複数の電源、及び電子機器800のための電力生成、管理、分配に関連する他のユニットを備えてもよい。
マルチメディアコンポーネント808は、上記電子機器800とユーザとの間に出力インタフェースを提供するためのスクリーンを備える。幾つかの実施例において、スクリーンは、液晶ディスプレイ(LCD)及びタッチパネル(TP)を含む。スクリーンは、タッチパネルを含むと、タッチパネルとして実現され、ユーザからの入力信号を受信する。タッチパネルは、タッチ、スライド及びパネル上のジェスチャを感知する1つ又は複数のタッチセンサを備える。上記タッチセンサは、タッチ又はスライド動作の境界を感知するだけでなく、上記タッチ又はスライド操作に関連する持続時間及び圧力を検出することもできる。幾つかの実施例において、マルチメディアコンポーネント808は、フロントカメラ及び/又はリアカメラを備える。電子機器800が、撮影モード又はビデオモードのような操作モードであれば、フロントカメラ及び/又はリアカメラは外部からのマルチメディアデータを受信することができる。各フロントカメラ及びリアカメラは固定した光学レンズシステム又は焦点及び光学ズーム能力を持つものであってもよい。
オーディオコンポーネント810は、オーディオ信号を出力及び/又は入力するように構成される。例えば、オーディオコンポーネント810は、マイクロホン(MIC)を備える。電子機器800が、通話モード、記録モード及び音声識別モードのような操作モードであれば、マイクロホンは、外部からのオーディオ信号を受信するように構成される。受信したオーディオ信号を更にメモリ804に記憶するか、又は通信コンポーネント816を経由して送信することができる。幾つかの実施例において、オーディオコンポーネント810は、オーディオ信号を出力するように構成されるスピーカーを更に備える。
I/Oインタフェース812は、処理コンポーネント802と周辺インタフェースモジュールとの間のインタフェースを提供する。上記周辺インタフェースモジュールは、キーボード、クリックホイール、ボタン等であってもよい。これらのボタンは、ホームボダン、ボリュームボタン、スタートボタン及びロックボタンを含むが、これらに限定されない。
センサコンポーネント814は、1つ又は複数のセンサを備え、電子機器800のために様々な状態の評価を行うように構成される。例えば、センサコンポーネント814は、電子機器800のオン/オフ状態、ユニットの相対的な位置決めを検出することができる。例えば、上記ユニットが電子機器800のディスプレイ及びキーパッドである。センサコンポーネント814は電子機器800又は電子機器800における1つのユニットの位置の変化、ユーザと電子機器800との接触の有無、電子機器800の方位又は加速/減速及び電子機器800の温度の変動を検出することもできる。センサコンポーネント814は近接センサを備えてもよく、いかなる物理的接触もない場合に周囲の物体の存在を検出するように構成される。センサコンポーネント814は、CMOS又はCCD画像センサのような光センサを備えてもよく、結像に適用されるように構成される。幾つかの実施例において、該センサコンポーネント814は、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサを備えてもよい。
通信コンポーネント816は、電子機器800と他の機器との有線又は無線方式の通信に寄与するように構成される。電子機器800は、WiFi、2G又は3G、又はそれらの組み合わせのような通信規格に基づいた無線ネットワークにアクセスできる。一例示的な実施例において、通信コンポーネント816は放送チャネルを経由して外部放送チャネル管理システムからの放送信号又は放送関連する情報を受信する。一例示的な実施例において、上記通信コンポーネント816は、近接場通信(NFC)モジュールを更に備えることで近距離通信を促進する。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術及び他の技術に基づいて実現される。
例示的な実施例において、電子機器800は、1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理機器(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又は他の電子素子により実現され、上記方法を実行するように構成されてもよい。
例示的な実施例において、コンピュータプログラム命令を記憶したメモリ804のような不揮発性コンピュータ可読記憶媒体を更に提供する。上記コンピュータプログラム命令は、電子機器800のプロセッサ820により実行され上記方法を完了する。
図6は、本願の実施例による電子機器の構造を示す概略図である。例えば、電子機器1900は、サーバとして提供されてもよい。図6を参照すると、電子機器1900は、処理コンポーネント1922を備える。それは、1つ又は複数のプロセッサ、及びメモリ1932で表されるメモリリソースを更に備える。該メモリリースは、アプリケーションプログラムのような、処理コンポーネント1922により実行される命令を記憶するためのものである。メモリ1932に記憶されているアプリケーションプログラムは、それぞれ一組の命令に対応する1つ又は1つ以上のモジュールを含んでもよい。なお、処理コンポーネント1922は、命令を実行して、上記予測方法を実行するように構成される。
電子機器1900は、電子機器1900の電源管理を実行するように構成される電源コンポーネント1926と、電子機器1900をネットワークに接続するように構成される有線又は無線ネットワークインタフェース1950と、入力出力(I/O)インタフェース1958と、を更に備えてもよい。電子機器1900は、Windows(登録商標) ServerTM、Mac OS XTM、Unix(登録商標), Linux(登録商標)、FreeBSDTM又は類似したものなどの、メモリ1932に記憶されているオペレーティングシステムを実行することができる。
例示的な実施例において、例えば、コンピュータプログラム命令を含むメモリ1932のような不揮発性コンピュータ可読記憶媒体を更に提供する。上記コンピュータプログラム命令は、電子機器1900の処理コンポーネント1922により実行されて上記方法を完了する。
本願は、システム、方法及び/又はコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、コンピュータ可読記憶媒体を備えてもよく、プロセッサに本願の各態様を実現させるためのコンピュータ可読プログラム命令がそれに記憶されている。
コンピュータ可読記憶媒体は、命令実行装置に用いられる命令を保持又は記憶することができる有形装置であってもよい。コンピュータ可読記憶媒体は、例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置又は上記の任意の組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的なリスト)は、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、デジタル多目的ディスク(DVD)、メモリスティック、フレキシブルディスク、命令が記憶されているパンチカード又は凹溝内における突起構造のような機械的符号化装置、及び上記任意の適切な組み合わせを含む。ここで用いられるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を通って伝搬する電磁波(例えば、光ファイバケーブルを通過する光パルス)、または、電線を通して伝送される電気信号などの、一時的な信号それ自体であると解釈されるべきではない。
ここで説明されるコンピュータ可読プログラム命令を、コンピュータ可読記憶媒体から各コンピューティング/処理装置にダウンロードすることができるか、又は、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又は無線ネットワークのようなネットワークを経由して外部コンピュータ又は外部記憶装置にダウンロードすることができる。ネットワークは、伝送用銅線ケーブル、光ファイバー伝送、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイコンピュータ及び/又はエッジサーバを含んでもよい。各コンピューティング/処理装置におけるネットワークインターフェースカード又はネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、該コンピュータ可読プログラム命令を転送し、各コンピューティング/処理装置におけるコンピュータ可読記憶媒体に記憶する。
本願の操作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又は1つ又は複数のプログラミング言語で記述されたソースコード又はターゲットコードであってもよい。前記プログラミング言語は、Smalltalk、C++などのようなオブジェクト指向プログラミング言語と、「C」プログラミング言語又は類似したプログラミング言語などの従来の手続型プログラミング言語とを含む。コンピュータ可読プログラム命令は、ユーザコンピュータ上で完全に実行してもよいし、ユーザコンピュータ上で部分的に実行してもよいし、独立したソフトウェアパッケージとして実行してもよいし、ユーザコンピュータ上で部分的に実行してリモートコンピュータ上で部分的に実行してもよいし、又はリモートコンピュータ又はサーバ上で完全に実行してもよい。リモートコンピュータの場合に、リモートコンピュータは、任意の種類のネットワーク(ローカルエリアネットワーク(LAN)やワイドエリアネットワーク(WAN)を含む)を通じてユーザのコンピュータに接続するか、または、外部のコンピュータに接続することができる(例えばインターネットサービスプロバイダを用いてインターネットを通じて接続する)。幾つかの実施例において、コンピュータ可読プログラム命令の状態情報を利用して、プログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)又はプログラマブル論理アレイ(PLA)のような電子回路をカスタマイズする。該電子回路は、コンピュータ可読プログラム命令を実行することで、本願の各態様を実現させることができる。
ここで、本願の実施例の方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照しながら、本願の各態様を説明する。フローチャート及び/又はブロック図の各ブロック及びフローチャート及び/又はブロック図における各ブロックの組み合わせは、いずれもコンピュータ可読プログラム命令により実現できる。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータまたはその他プログラマブルデータ処理装置のプロセッサに提供でき、それによって機器を生み出し、これら命令はコンピュータまたはその他プログラマブルデータ処理装置のプロセッサにより実行される時、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能/操作を実現する装置を生み出した。これらのコンピュータ可読プログラム命令をコンピュータ可読記憶媒体に記憶してもよい。これらの命令によれば、コンピュータ、プログラマブルデータ処理装置及び/又は他の装置は特定の方式で動作する。従って、命令が記憶されているコンピュータ可読記憶媒体は、フローチャート及び/又はブロック図おける1つ又は複数のブロック中で規定している機能/操作を実現する各態様の命令を含む製品を備える。
コンピュータ可読プログラム命令をコンピュータ、他のプログラマブルデータ処理装置又は他の装置にロードしてもよい。これにより、コンピュータ、他のプログラマブルデータ処理装置又は他の装置で一連の操作の工程を実行して、コンピュータで実施されるプロセスを生成する。従って、コンピュータ、他のプログラマブルデータ処理装置又は他の装置で実行される命令により、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能/操作を実現させる。
図面におけるフローチャート及びブック図は、本願の複数の実施例によるシステム、方法及びコンピュータプログラム製品の実現可能なアーキテクチャ、機能および操作を例示するものである。この点で、フローチャート又はブロック図における各ブロックは、1つのモジュール、プログラムセグメント又は命令の一部を表すことができる。前記モジュール、、プログラムセグメント又は命令の一部は、1つまたは複数の所定の論理機能を実現するための実行可能な命令を含む。いくつかの取り替えとしての実現中に、ブロックに表記される機能は図面中に表記される順序と異なる順序で発生することができる。例えば、二つの連続するブロックは実際には基本的に並行して実行でき、場合によっては反対の順序で実行することもでき、これは関係する機能から確定する。ブロック図及び/又はフローチャートにおける各ブロック、及びブロック図及び/又はフローチャートにおけるブロックの組み合わせは、所定の機能又は操作を実行するための専用ハードウェアベースシステムにより実現するか、又は専用ハードウェアとコンピュータ命令の組み合わせにより実現することができる。
該コンピュータプログラム製品は具体的には、ハードウェア、ソフトウェア又はその組み合わせにより実現してもよい。任意選択的な実施例において、前記コンピュータプログラム製品は、コンピュータ記憶媒体として具現化され、もう1つの任意選択的な実施例において、コンピュータプログラム製品は、例えば、ソフトウェア開発キット(Software Development Kit:SDK)などのようなソフトウェア製品として具現化される。
以上は本発明の各実施例を説明したが、前記説明は例示的なものであり、網羅するものではなく、且つ開示した各実施例に限定されない。説明した各実施例の範囲と趣旨から脱逸しない場合、当業者にとって、多くの修正及び変更は容易に想到しえるものである。本明細書に用いられる用語の選択は、各実施例の原理、実際の応用、或いは市場における技術の改善を最もよく解釈すること、或いは他の当業者が本明細書に開示された各実施例を理解できることを目的とする。
本願の実施例は、被検物質の分子構造に基づいて、被検物質の特徴を決定し、また、ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出した後、被検物質の物質特徴及び病変細胞の少なくとも1つの細胞特徴に基づいて、病変細胞に対する被検物質の反応結果を予測する。本願の実施例で提供される予測方法及び装置、電子機器並びに記憶媒体によれば、被検物質の構造特徴マップに基づいて、被検物質の物質特徴を抽出することができる。物質特徴の手動抽出に比べて、抽出した物質特徴はより密である。これにより、反応試験結果の精度及び試験結果の取得効率を向上させることができる。

Claims (11)

  1. 被検物質の分子構造に基づいて、被検物質の物質特徴を決定することと、
    ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得ることと、
    前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応結果を予測することと、を含む、予測方法。
  2. 前記被検物質の分子構造に基づいて、被検物質の物質特徴を決定することは、
    前記被検物質の分子構造に基づいて、前記被検物質の構造特徴マップを構築することであって、前記構造特徴マップは、少なくとも2つのノード及び各ノード間の結線を含み、前記ノードは、前記分子構造における原子を表し、前記結線は、前記分子構造における原子結合を表す、ことと、
    前記構造特徴マップに基づいて、前記被検物質の前記物質特徴を決定することと、を含む
    請求項1に記載の方法。
  3. 前記構造特徴マップに基づいて、前記被検物質の前記物質特徴を決定することは、
    前記構造特徴マップに基づいて、前記被検物質の第1隣接行列及び第1特徴行列を得ることであって、前記第1隣接行列は、前記被検物質の各原子間の近隣関係を表し、前記第1特徴行列は、前記被検物質の各原子の属性データを表す、ことと、
    前記第1隣接行列及び前記第1特徴行列に基づいて、前記被検物質の前記物質特徴を得ることと、を含む
    請求項2に記載の方法。
  4. 前記第1隣接行列及び前記第1特徴行列に基づいて、前記被検物質の前記物質特徴を得ることは、
    所定の入力次元及び前記第1隣接行列の次元に基づいて、前記第1隣接行列の補足行列を構築し、前記所定の入力次元及び前記第1特徴行列の次元に基づいて、前記第1特徴行列の補足行列を構築することと、
    前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2特徴行列を得ることと、
    前記第2隣接行列及び前記第2特徴行列をグラフ畳み込み処理し、前記被検物質の前記物質特徴を得ることと、を含む
    請求項3に記載の方法。
  5. 前記第2隣接行列において、前記第1隣接行列と前記第1隣接行列の補足行列とは、隣接関係を持たない
    請求項4に記載の方法。
  6. 前記第1隣接行列及び前記第1隣接行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2隣接行列を得、前記第1特徴行列及び前記第1特徴行列の補足行列をスプライシング処理し、次元が前記所定の入力次元である第2特徴行列を得ることは、
    前記第1隣接行列及び前記第1隣接行列の補足行列に基づいて、第1接続行列を構築するであって、前記第1接続行列における要素はいずれも所定値である、ことと、
    前記第1接続行列を介して、前記第1隣接行列と前記第1隣接行列の補足行列を接続し、次元が前記所定の次元である前記第2隣接行列を得ることと、
    前記第1特徴行列と前記第1特徴行列の補足行列を接続し、次元が前記所定の入力次元である前記第2特徴行列を得ることと、を含む
    請求項4又は5に記載の方法。
  7. 前記ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得ることは、
    前記病変細胞の遺伝子突然変異に対して特徴抽出を行い、前記病変細胞のゲノム特徴を得ることと、
    前記病変細胞の遺伝子発現に対して特徴抽出を行い、前記病変細胞のトランスクリプトーム特徴を得ることと、
    前記病変細胞のデオキシリボ核酸(DeoxyriboNucleic Acid:DNA)メチル化データに対して特徴抽出を行い、前記病変細胞のエピゲノム特徴を得ることと、のうちの少なくとも1つを含む
    請求項1から5のうちいずれか一項に記載の方法。
  8. 被検物質の分子構造に基づいて、被検物質の物質特徴を決定するように構成される第1決定部と、
    ターゲットカテゴリの病変細胞の少なくとも1つの細胞特徴を抽出し、前記病変細胞の少なくとも1つの細胞特徴を得るように構成される抽出部と、
    前記物質特徴及び前記少なくとも1つの細胞特徴に基づいて、前記病変細胞に対する前記被検物質の反応予測結果を決定するように構成される第2決定部と、を備える、予測装置。
  9. プロセッサと、
    プロセッサによる実行可能な命令を記憶するように構成されるメモリと、を備え、
    前記プロセッサは、前記メモリに記憶された命令を呼び出して、請求項1から7のうちいずれか一項に記載の方法を実行するように構成される、電子機器。
  10. プロセッサにより実行されるときに、前記プロセッサに、請求項1から7のうちいずれか一項に記載の方法を実現させるためのコンピュータプログラム命令を記憶した、コンピュータ可読記憶媒体。
  11. 電子機器で実行されるときに、前記電子機器におけるプロセッサに、請求項1から7のうちいずれか一項に記載の方法を実行させるためのコンピュータ可読コードを含む、コンピュータプログラム。
JP2021543171A 2019-11-18 2020-07-22 予測方法及び装置、電子機器並びに記憶媒体 Pending JP2022518283A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201911125921.X 2019-11-18
CN201911125921.XA CN110867254A (zh) 2019-11-18 2019-11-18 预测方法及装置、电子设备和存储介质
PCT/CN2020/103633 WO2021098256A1 (zh) 2019-11-18 2020-07-22 一种预测方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
JP2022518283A true JP2022518283A (ja) 2022-03-14

Family

ID=69654942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021543171A Pending JP2022518283A (ja) 2019-11-18 2020-07-22 予測方法及び装置、電子機器並びに記憶媒体

Country Status (5)

Country Link
US (1) US20220285038A1 (ja)
JP (1) JP2022518283A (ja)
CN (1) CN110867254A (ja)
TW (1) TWI771803B (ja)
WO (1) WO2021098256A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110867254A (zh) * 2019-11-18 2020-03-06 北京市商汤科技开发有限公司 预测方法及装置、电子设备和存储介质
US20210287137A1 (en) * 2020-03-13 2021-09-16 Korea University Research And Business Foundation System for predicting optical properties of molecules based on machine learning and method thereof
CN111986740B (zh) * 2020-09-03 2024-05-14 深圳赛安特技术服务有限公司 化合物分类方法及相关设备
CN112768089B (zh) * 2021-04-09 2021-06-22 至本医疗科技(上海)有限公司 用于预测药物敏感状态的方法、设备和存储介质
CN113241130B (zh) * 2021-06-08 2022-04-22 西南交通大学 一种基于图卷积网络的分子结构预测方法
CN113707214B (zh) * 2021-08-31 2024-05-24 平安科技(深圳)有限公司 代谢物标记方法、装置、计算机设备及存储介质
CN117524346A (zh) * 2023-11-20 2024-02-06 东北林业大学 一种多视图癌症药物反应预测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018124293A1 (ja) * 2016-12-28 2018-07-05 国立研究開発法人医薬基盤・健康・栄養研究所 トランスクリプトームによる医薬成分の特徴分析法および分類
JP2018527647A (ja) * 2015-06-22 2018-09-20 カウンシル, インコーポレイテッド 遺伝子配列バリアントの病原性を予測する方法
CN108959841A (zh) * 2018-04-16 2018-12-07 华南农业大学 一种基于dbn算法的药物靶向蛋白作用预测方法
CN109033738A (zh) * 2018-07-09 2018-12-18 湖南大学 一种基于深度学习的药物活性预测方法
CN110289050A (zh) * 2019-05-30 2019-09-27 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010003020A1 (en) * 2008-07-01 2010-01-07 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for assessment of clinical infertility
JP6671348B2 (ja) * 2014-05-05 2020-03-25 アトムワイズ,インコーポレイテッド 結合親和性予測システム及び方法
US9984201B2 (en) * 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status
EP3268870A4 (en) * 2015-03-11 2018-12-05 Ayasdi, Inc. Systems and methods for predicting outcomes using a prediction learning model
US20190050530A1 (en) * 2016-02-09 2019-02-14 Toma Biosciences, Inc. Systems and Methods for Analyzing Nucleic Acids
CN110232978B (zh) * 2019-06-14 2022-05-17 西安电子科技大学 基于多维网络的癌症细胞系治疗药物预测方法
CN110867254A (zh) * 2019-11-18 2020-03-06 北京市商汤科技开发有限公司 预测方法及装置、电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018527647A (ja) * 2015-06-22 2018-09-20 カウンシル, インコーポレイテッド 遺伝子配列バリアントの病原性を予測する方法
WO2018124293A1 (ja) * 2016-12-28 2018-07-05 国立研究開発法人医薬基盤・健康・栄養研究所 トランスクリプトームによる医薬成分の特徴分析法および分類
CN108959841A (zh) * 2018-04-16 2018-12-07 华南农业大学 一种基于dbn算法的药物靶向蛋白作用预测方法
CN109033738A (zh) * 2018-07-09 2018-12-18 湖南大学 一种基于深度学习的药物活性预测方法
CN110289050A (zh) * 2019-05-30 2019-09-27 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法

Also Published As

Publication number Publication date
TWI771803B (zh) 2022-07-21
WO2021098256A1 (zh) 2021-05-27
US20220285038A1 (en) 2022-09-08
CN110867254A (zh) 2020-03-06
TW202133183A (zh) 2021-09-01

Similar Documents

Publication Publication Date Title
JP2022518283A (ja) 予測方法及び装置、電子機器並びに記憶媒体
JP6916970B2 (ja) ビデオ処理方法及び装置、電子機器並びに記憶媒体
TWI781359B (zh) 人臉和人手關聯檢測方法及裝置、電子設備和電腦可讀儲存媒體
KR102365890B1 (ko) 신경망의 훈련 방법, 장치 및 저장 매체
CN109919300B (zh) 神经网络训练方法及装置以及图像处理方法及装置
JP2022501686A (ja) 生体検出方法及び装置、電子機器並びに記憶媒体
JP2022540072A (ja) 位置姿勢決定方法及び装置、電子機器並びに記憶媒体
JP2022512023A (ja) バッチ正規化データの処理方法及び装置、電子機器及び記憶媒体
JP2022520120A (ja) 顔画像認識方法及び装置、電気機器並びに記憶媒体
CN110659690B (zh) 神经网络的构建方法及装置、电子设备和存储介质
JP2021518961A (ja) 画像生成方法および装置、電子機器並びに記憶媒体
CN110458218B (zh) 图像分类方法及装置、分类网络训练方法及装置
JP2021529398A (ja) ビデオ処理方法及び装置、電子機器並びに記憶媒体
JP2021512378A (ja) アンカー決定方法及び装置、電子機器並びに記憶媒体
JP2022523243A (ja) 画像処理方法及び装置、電子機器並びに記憶媒体
CN109522937B (zh) 图像处理方法及装置、电子设备和存储介质
CN111553464B (zh) 基于超网络的图像处理方法、装置及智能设备
CN111582383B (zh) 属性识别方法及装置、电子设备和存储介质
KR20200143478A (ko) 네트워크 최적화 방법 및 장치, 이미지 처리 방법 및 장치, 및 기억 매체
CN112001364A (zh) 图像识别方法及装置、电子设备和存储介质
CN111242303A (zh) 网络训练方法及装置、图像处理方法及装置
CN112085097A (zh) 图像处理方法及装置、电子设备和存储介质
CN110633715B (zh) 图像处理方法、网络训练方法及装置、和电子设备
CN112598676B (zh) 图像分割方法及装置、电子设备和存储介质
JP2022524707A (ja) 病理学的スライス画像の表示方法及び装置、電子機器並びに記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230419