JP7227405B2 - 薬物分類方法と装置、端末デバイス及び記憶媒体 - Google Patents

薬物分類方法と装置、端末デバイス及び記憶媒体 Download PDF

Info

Publication number
JP7227405B2
JP7227405B2 JP2021576126A JP2021576126A JP7227405B2 JP 7227405 B2 JP7227405 B2 JP 7227405B2 JP 2021576126 A JP2021576126 A JP 2021576126A JP 2021576126 A JP2021576126 A JP 2021576126A JP 7227405 B2 JP7227405 B2 JP 7227405B2
Authority
JP
Japan
Prior art keywords
atom
feature vector
atoms
drug
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021576126A
Other languages
English (en)
Other versions
JP2022538823A (ja
Inventor
ワン,ジュン
リ,ペンヨン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Publication of JP2022538823A publication Critical patent/JP2022538823A/ja
Application granted granted Critical
Publication of JP7227405B2 publication Critical patent/JP7227405B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本出願は、発明の名称を「薬物分類方法と装置、端末デバイス及び記憶媒体」とする、2020年9月27日に出願された中国特許出願第202011035837.1号の優先権を主張し、そのすべての内容が参照として本出願に組み込まれる。
本発明はデータ処理の分野に関し、特に薬物分類方法と装置、端末デバイス及び記憶媒体に関する。
薬物開発プロセスは資本集約度が高く、リスクが高く、サイクルが長いという特徴があり、資本、人的、物的資源に多大な投資を必要とする。発明者は、従来の機械学習方法がある程度で薬物開発を補助することができるが、分子記述子を特徴入力とする必要があり、異なる分子記述子の選択が機械学習モデルの性能への影響が大きいため、従来の機械学習方法の多数が煩雑で時間のかかる特徴エンジニアリング(eature engineering)を必要とすることを意識した。発明者は研究プロセスにおいて、近年登場している深層学習方法が薬物の元の構造から特徴を直接に抽出することができるため、特徴エンジニアリングを回避して開発サイクルを短縮できるが、既存の深層学習方法に基づいて抽出された薬物分子の特徴を薬物分類の予測に用いられる場合、その予測精度を高める必要があることを発見した。
本発明の実施形態は、薬物分類の精度を高めることができる薬物分類方法と装置、端末デバイス及び記憶媒体を提供する。
第一様態において、本発明の実施形態は薬物分類方法を提供した。当該方法は、
検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されており、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得することと、
仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することと、
隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定することと、
検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することとを含む。
第二様態において、本発明の実施形態は薬物分類装置を提供した。当該装置は、
原子属性特徴ベクトル取得モジュール、第一特徴処理モジュール、特徴学習モジュール、及び薬物分類モジュールを含み、
原子属性特徴ベクトル取得モジュールは、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得するように構成されており、検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されており、
第一特徴処理モジュールは、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、且つ、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築するように構成されており、
特徴学習モジュールは、隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定するように構成されており、
薬物分類モジュールは、検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力するように構成されている。
第三様態において、本発明の実施形態は端末デバイスを提供した。当該端末デバイスは、相互に接続されたプロセッサとメモリを含む。当該メモリは、プログラム命令を含むコンピュータプログラムを格納するように構成されており、当該プロセッサは、上記プログラム命令を呼び出して、
検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されており、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得することと、
仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することと、
隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列とを確定することと、
検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することと、
を実行するように構成されている。
第四様態において、本発明の実施形態はコンピュータ可読記憶媒体を提供した。当該コンピュータ可読記憶媒体は、プログラム命令を含むコンピュータプログラムを格納している。当該プログラム命令は、プロセッサに実行されると、当該プロセッサに、
検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得することと、検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されており、
仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することと、
隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定することと、
検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することと、
を実行させるように構成されている。
本発明の実施形態を採用すると、薬物分類の精度を高めることができる。
本発明の実施形態の技術方案を明確に説明するために、以下、実施形態の説明に必要な図面を簡単に紹介する。明らかに、説明される図面は本発明のいくつかの実施形態にすぎず、当業者にとって、創造的な努力なしに、これらの図面によって他の図面を得ることができる。
図1は、本発明の実施形態に係わる薬物分類方法を示すフローチャートである。 図2は、本発明の実施形態に係わる検出しようとする薬物分子の分子構造を示す概略図である。 図3は、本発明の実施形態に係わる薬物分類方法を示す他のフローチャートである。 図4は、本発明の実施形態に係わる薬物分類装置の構造を示す概略図である。 図5は、本発明の実施形態に係わる薬物分類装置の他の構造を示す概略図である。 図6は、本発明の実施形態に係わる端末デバイスの構造を示す概略図である。
以下、本発明の実施形態の図面を参照しながら本発明の実施形態の技術方案を明晰に、全面的に説明する。明らかに、説明される実施形態は、本発明の一部の実施形態だけのものであり、全ての実施形態ではない。本発明に記載された実施形態に基づいて、当業者が創造的な努力なしに得ることができるすべての別の実施形態は、皆本発明の保護範囲に属する。
本発明の技術方案は、人工知能、デジタル医療、スマートシティ、ブロックチェーン、及び/又はビッグデータ技術分野に応用されることができる。例えば、具体的に、ニューラルネットワーク(neural network)技術に係り、薬物分類の精度を高め、スマート医療を実現することができる。選択的に、本発明に係わるデータ(例えば、特徴ベクトル及び/又は薬物種類など)はデータベースに格納されることができるか、又はブロックチェーンに格納されることができるが、本発明はそれらに限定されない。
例えば、本発明の実施形態に係わる薬物分類方法は、医療分野に適用されることができる。本発明の実施形態における方法によれば、薬物分子を構成するn個の原子と仮想原子との隣接行列と原子属性特徴行列を構築することによって、構築された隣接行列と原子属性特徴行列をグラフニューラルネットワーク(graph neural network)に入力して特徴を学習して、グラフニューラルネットワークのメッセージ転送特性(message transfer characteristics)に基づいて、n個の原子と仮想原子に対応する転送特徴行列(transfer feature matrix)を確定する。それから、転送特徴行列に含まれる転送特徴ベクトル(transfer feature vector)に基づいて、薬物分子に対応する分子特徴ベクトルを確定することができる。さらに、薬物分子の分子特徴ベクトルに基づいて薬物種類を確定することができる。本発明の実施形態を採用すると、薬物分類の精度を高めることができる。
以下、図1~図6を参照しながら、本発明の実施形態に係わる方法及び関連装置をそれぞれ詳しく説明する。
図1を参照すると、図1は、本発明の実施形態に係わる薬物分類方法を示すフローチャートである。本発明の実施形態に係わる方法は以下のステップS101~S104を含むことができる。
S101、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得する。
いくつかの実行可能な実施形態において、ある特定の薬物又は複数の薬物の分類を実現するために、まず分類しようとする薬物の薬物分子(表現しやすさのため、検出しようとする薬物分子と略称)における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルっとを取得する。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されており、nは整数である。n個の原子と仮想原子とのうちの任意の一つの原子の属性特徴ベクトルは、任意の一つの原子の属性特徴によって確定される。任意の一つの原子の属性特徴は原子の種類、化学結合の数、形式電荷、原子キラリティー(atomic chirality)、水素原子に接続された数、原子軌道、及び芳香族性のうちの一つ又は複数を含むが、これらに限定されない。仮想原子は薬物分子構造以外の原子と理解されることができる。即ち、仮想原子は検出しようとする薬物分子を構成する実際の原子ではなく、仮想原子はただn個の原子のそれぞれに接続されている原子に過ぎない。例えば、図2を参照すると、図2は、本発明の実施形態に係わる検出しようとする薬物分子の分子構造を示す概略図である。図2に示されたように、検出しようとする薬物分子は5つの原子(即ちn=5)を含む。それぞれは原子1、原子2、原子3、原子4と原子5である。原子1は原子2に接続されており、原子2はさらに原子3と原子5にそれぞれ接続し、原子3は原子4に接続されており、原子4はさらに原子5に接続されている。仮想原子は図2に示された原子6であり、図2から見ると、原子6は検出しようとする薬物分子における5つの原子に接続されている。
S102、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築する。
いくつかの実行可能な実施形態において、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて、隣接行列を構築することができる。また、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することができる。例えば、図2を参照すると、図2における仮想原子と5つの原子のそれぞれとの接続関係、及び5つの原子の間の接続関係に基づいて、隣接行列Aを構築して取得することができる。
Figure 0007227405000001
隣接行列Aの行は、上から順に、原子1、原子2、原子3、原子4、原子5、仮想原子6を表す。隣接行列の列は、左から順に、原子1、原子2、原子3、原子4、原子5、仮想原子6を表す。各原子の属性特徴はF1、F2、F3、…、Fmを含むと仮設すると、各原子の属性特徴に対応する属性特徴ベクトルに基づいて、原子属性特徴行列Fを構築することができる。
Figure 0007227405000002
原子属性特徴行列Fの行は、上から順に、原子1、原子2、原子3、原子4、原子5、仮想原子6を表す。原子属性特徴行列Fの列は、左から順に、各原子の属性特徴F1、F2、F3…Fmに対応する特徴ベクトルx、x、x、…、xを表す。換言すると、原子属性特徴行列の各行は、検出しようとする薬物分子における一つの原子の属性特徴ベクトルに対応する。上記n個の原子と仮想原子とのうちの任意の一つの原子の属性特徴ベクトルは任意の一つの原子の属性特徴によって確定されることは理解されるべきである。任意の一つの原子の属性特徴は原子の種類、化学結合の数、形式電荷、原子キラリティー、水素原子に接続された数、原子軌道、及び芳香族性などのうちの一つ又は複数を含むが、本発明はこれらに限定されない。
S103、隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定する。
いくつかの実行可能な実施形態において、上記ステップに基づいて構築された隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定することができる。グラフニューラルネットワークはグラフのノード間のメッセージ転送を介してグラフの依存関係を取得することができる接続モデルであることは理解されるべきである。換言すると、グラフニューラルネットワークモデルは、隣接するノードからの情報を集めることで、あるノードの表示を更新することができる。
S104、検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定して、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力する。
いくつかの実行可能な実施形態において、n個の原子と仮想原子との転送特徴行列が確定された後、検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定することができる。転送特徴行列は(n+1)個の転送特徴ベクトルを含む。各原子は一つの転送特徴ベクトルに対応する。
検出しようとする薬物分子に対応する分子特徴ベクトルは、転送特徴行列における仮想原子に対応する転送特徴ベクトルであることができる。換言すると、転送特徴行列における仮想原子に対応する転送特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定することができる。選択的に、転送特徴行列におけるn個の原子に対応するn個の転送特徴ベクトルに基づいて、第一分子特徴ベクトルを確定することができる。転送特徴行列における仮想原子に対応する転送特徴ベクトルに基づいて、第二分子特徴ベクトルを確定することができる。それから、第一分子特徴ベクトルと第二分子特徴ベクトルに基づいて、検出しようとする薬物分子に対応する分子特徴ベクトルを確定する。例えば、転送特徴行列におけるn個の原子に対応するn個の転送特徴ベクトルの合計を第一分子特徴ベクトルとして確定することができ、且つ転送特徴行列における仮想原子に対応する転送特徴ベクトルを第二分子特徴ベクトルとして確定することができる。第一分子特徴ベクトルと第二分子特徴ベクトルとに対して重み付き加算処理を行って、第三分子特徴ベクトルを取得することができる。第三分子特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定することができる。上記重み付き加算処理を行うとき、第一分子特徴ベクトルに対応する第一重みパラメータと第二分子特徴ベクトルに対応する第二重みパラメータの合計は1であり、且つ第一重みパラメータは第二重みパラメータより小さいことは理解されるべきである。重みパラメータの具体的な値は実際のアプリケーションシナリオに基づいて確定されることができるが、ここでは限定されない。
さらに、分子特徴ベクトルを分類器に入力して、分類器に基づいて検出しようとする薬物分子の薬物種類を出力することができる。本発明では、訓練データ集合を取得して、訓練データ集合に含まれる各薬物分子訓練サンプルに基づいてグラフニューラルネットワークと分類器を訓練することによって、収束条件を満たすグラフニューラルネットワークと分類器を取得する。訓練データ集合は複数の薬物分子訓練サンプルを含む。各薬物分子訓練サンプルは、少なくとも一つのサンプル薬物分子に対応する隣接行列、原子属性特徴行列、及び少なくとも一つのサンプル薬物分子における各サンプル薬物分子の薬物種類ラベルを含む。薬物分類ラベルは第一ラベルと第二ラベルを含むことができることは理解されるべきである。換言すると、本発明の薬物分類は薬物の二項分類(binary classification)であることができる。第一ラベルは当該薬物がある病気を治療できることを示し、第二ラベルは当該薬物がある病気を治療できないことを示す。例えば、新型コロナウイルス感染症(novel corona virus disease 2019、COVID-19)を治療する潜在的な薬物を発見するために、COVID-19を抑制する既存の潜在的な薬物は訓練データ集合として使用されてもよく、訓練されたモデルはDrugBankデータベース(10971種類の薬物を含む)から、COVID-19を治療する他の潜在的な薬物分子を選別するために用いられてもよい。換言すると、分子特徴ベクトルを分類器に入力して、分類器の出力結果に基づいて当該検出しようとする薬物分子の薬物種類を確定して、当該薬物分子がCOVID-19を治療する臨床試験に用いられることができるかどうかを判断する。上記分類器はフィードフォワードニューラルネットワーク(feed forward neural network)などを含むことができるが、これらに限定されない。
本発明の実施形態において、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルを取得して、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて、隣接行列を構築することができる。n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することができる。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されている。隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定することができる。検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定することができる。分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することができる。本発明の実施形態を採用すると、薬物分類の精度を高めることができる。
図3を参照すると、図3は、本発明の実施形態に係わる薬物分類方法を示す他のフローチャートである。本発明の実施形態に係わる薬物分類方法は、以下のステップS201~S205に係わる実施形態で実現されることができる。
S201、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得する。
上記ステップS201の具体的な実現方式については、図1に対応する実施形態におけるステップS101への説明を参照することができる。ここでは繰り返さない。
S202、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築する。
上記ステップS202の具体的な実現方式については、図1に対応する実施形態におけるステップS102への説明を参照することができる。ここでは繰り返さない。
S203、検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得して、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築する。
いくつかの実行可能な実施形態において、検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得して、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築することができる。n個の原子の間の化学結合及び仮想原子とn個の原子のそれぞれを接続する化学結合のうちの任意の一つの化学結合の属性特徴ベクトルは、任意の一つの化学結合の属性特徴によって確定される。例えば、各化学結合の属性特徴はT1、T2、T3、…、Tbを含むと仮設すると、各化学結合の属性特徴に対応する属性特徴ベクトルに基づいて、化学結合属性特徴行列Tを構築することができる。
Figure 0007227405000003
化学結合属性特徴行列の行は化学結合を表す。化学結合属性特徴行列の列は化学結合の属性特徴を表す。換言すると、化学結合属性特徴行列の各行は、検出しようとする薬物分子における一つの化学結合に対応する属性特徴ベクトルに対応する。任意の一つの化学結合に対応する属性特徴ベクトルは、当該化学結合の属性特徴によって確定される。任意の一つの化学結合の属性特徴は化学結合の種類、共役特徴(conjugate feature)、環状結合特徴(cyclic bond feature)、及び分子の立体化学特徴(molecular stereochemistry feature)などのうちの一つ又は複数を含むが、本発明はこれらに限定されない。
S204、化学結合属性特徴行列、隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定する。
いくつかの実行可能な実施形態において、化学結合属性特徴行列、隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定することができる。グラフニューラルネットワークはグラフのノード間のメッセージ転送を介してグラフの依存関係を取得することができる接続モデルであることは理解されるべきである。換言すると、グラフニューラルネットワークモデルは、隣接するノードからの情報を集めることで、あるノードの表示を更新することができる。同時に、薬物分子における各原子の間の化学結合は異なる情報を携帯することができる。そのため、隣接行列、原子属性特徴行列と化学結合属性特徴行列に基づいて、各原子の特徴表現をより良く学習することができる。
S205、検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力する。
いくつかの実行可能な実施形態において、n個の原子と仮想原子との転送特徴行列が確定された後、検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定することができる。転送特徴行列は(n+1)個の転送特徴ベクトルを含む。各原子は一つの転送特徴ベクトルに対応する。
検出しようとする薬物分子に対応する分子特徴ベクトルは、転送特徴行列における仮想原子に対応する転送特徴ベクトルであることができる。換言すると、転送特徴行列における仮想原子に対応する転送特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定することができる。選択的に、転送特徴行列におけるn個の原子に対応するn個の転送特徴ベクトルに基づいて、第一分子特徴ベクトルを確定することができる。転送特徴行列における仮想原子に対応する転送特徴ベクトルに基づいて、第二分子特徴ベクトルを確定することができる。それから、第一分子特徴ベクトルと第二分子特徴ベクトルに基づいて、検出しようとする薬物分子に対応する分子特徴ベクトルを確定する。例えば、転送特徴行列におけるn個の原子に対応するn個の転送特徴ベクトルの合計を第一分子特徴ベクトルとして確定することができ、且つ転送特徴行列における仮想原子に対応する転送特徴ベクトルを第二分子特徴ベクトルとして確定することができる。第一分子特徴ベクトルと第二分子特徴ベクトルとに対して重み付き加算処理を行って、第三分子特徴ベクトルを取得することができる。第三分子特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定することができる。上記重み付き加算処理を行うとき、第一分子特徴ベクトルに対応する第一重みパラメータと第二分子特徴ベクトルに対応する第二重みパラメータの合計は1であり、且つ第一重みパラメータは第二重みパラメータより小さいことは理解されるべきである。重みパラメータの具体的な値は実際のアプリケーションシナリオに基づいて確定されることができるが、ここでは限定されない。
さらに、分子特徴ベクトルを分類器に入力して、分類器に基づいて検出しようとする薬物分子の薬物種類を出力することができる。本発明では、訓練データ集合を取得して、訓練データ集合に含まれる各薬物分子訓練サンプルに基づいてグラフニューラルネットワークと分類器を訓練することによって、収束条件を満たすグラフニューラルネットワークと分類器を取得する。訓練データ集合は複数の薬物分子訓練サンプルを含む。各薬物分子訓練サンプルは、少なくとも一つのサンプル薬物分子に対応する隣接行列、原子属性特徴行列と化学結合属性特徴行列、及び少なくとも一つのサンプル薬物分子における各サンプル薬物分子の薬物種類ラベルを含む。薬物分類ラベルは第一ラベルと第二ラベルを含むことができることは理解されるべきである。換言すると、本発明の薬物分類は薬物の二項分類であることができる。第一ラベルは当該薬物がある病気を治療できることを示し、第二ラベルは当該薬物がある病気を治療できないことを示す。例えば、新型コロナウイルス感染症(novel corona virus disease 2019、COVID-19)を治療する潜在的な薬物を発見するために、COVID-19を抑制する既存の潜在的な薬物を訓練データ集合としてモデルパラメータの学習を行って、訓練されたモデルはDrugBankデータベース(10971種類の薬物を含む)から、COVID-19を治療する他の潜在的な薬物分子を選別するために用いられることができる。換言すると、分子特徴ベクトルを分類器に入力して、分類器の出力結果に基づいて当該検出しようとする薬物分子の薬物種類を確定して、当該薬物分子がCOVID-19を治療する臨床試験に用いられることができるかどうかを判断する。上記分類器はフィードフォワードニューラルネットワークなどを含むことができるが、本発明はこれらに限定されない。
本発明の実施形態において、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルを取得して、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて、隣接行列を構築することができる。n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することができる。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されている。検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得して、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築することができる。化学結合属性特徴行、列隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定する。検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定することができる。分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することができる。本発明の実施形態を採用すると、薬物分類の精度を高めることができる。
図4を参照すると、図4は、本発明の実施形態に係わる薬物分類装置の構造を示す概略図である。本発明の実施形態に係わる薬物分類装置は、原子属性特徴ベクトル取得モジュール31、第一特徴処理モジュール32、特徴学習モジュール33、及び薬物分類モジュール34を含む。
原子属性特徴ベクトル取得モジュール31は、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得するように構成されている。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されている。
第一特徴処理モジュール32は、仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築するように構成されている。
特徴学習モジュール33は、隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定するように構成されている。
薬物分類モジュール34は、検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力するように構成されている。
図5を参照すると、図5は、本発明の実施形態に係わる薬物分類装置の他の構造を示す概略図である。
いくつかの実行可能な実施形態において、n個の原子と仮想原子とのうちの任意の一つの原子の属性特徴ベクトルは、任意の一つの原子の属性特徴によって確定される。任意の一つの原子の属性特徴は原子の種類、化学結合の数、形式電荷、原子キラリティー、水素原子に接続された数、原子軌道、及び芳香族性のうちの一つ又は複数を含む。
いくつかの実行可能な実施形態において、上記装置は、化学結合属性特徴ベクトル取得モジュール35と第二特徴処理モジュール36をさらに含む。
化学結合属性特徴ベクトル取得モジュール35は、検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得するように構成されている。
第二特徴処理モジュール36は、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築するように構成されている。
前記特徴学習モジュール33は、化学結合属性特徴行列、隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定するように構成されている。
いくつかの実行可能な実施形態において、n個の原子の間の化学結合及び仮想原子とn個の原子のそれぞれを接続する化学結合のうちの任意の一つの化学結合の属性特徴ベクトルは、任意の一つの化学結合の属性特徴によって確定される。任意の一つの化学結合の属性特徴は化学結合の種類、共役特徴、環状結合特徴、及び分子の立体化学特徴のうちの一つ又は複数を含む。
いくつかの実行可能な実施形態において、上記装置はモデル訓練モジュール37をさらに含む。
モデル訓練モジュール37は、複数の薬物分子訓練サンプルを含む訓練データ集合を取得するように構成されている。各薬物分子訓練サンプルは、少なくとも一つのサンプル薬物分子及び少なくとも一つのサンプル薬物分子における各サンプル薬物分子の薬物種類ラベルを含む。
モデル訓練モジュール37は、各薬物分子訓練サンプルに基づいてグラフニューラルネットワークと分類器を訓練することによって、収束条件を満たすグラフニューラルネットワークと分類器を取得するように構成されている。
いくつかの実行可能な実施形態において、薬物分類モジュール34は、第一分子特徴ベクトル確定ユニット341と第一薬物種類確定ユニット342を含む。第一分子特徴ベクトル確定ユニット341は、転送特徴行列における仮想原子に対応する転送特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定するように構成されている。
いくつかの実行可能な実施形態において、
薬物分類モジュール34は第二分子特徴ベクトル確定ユニット343と第二薬物種類確定ユニット344をさらに含む。第二分子特徴ベクトル確定ユニット343は、
転送特徴行列におけるn個の原子に対応するn個の転送特徴ベクトルを取得し、
n個の転送特徴ベクトルの合計を第一分子特徴ベクトルとして確定し、且つ転送特徴行列における仮想原子に対応する転送特徴ベクトルを第二分子特徴ベクトルとして確定し、
第一分子特徴ベクトルと第二分子特徴ベクトルとに対して重み付き加算を行って第三分子特徴ベクトルを取得し、且つ第三分子特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定するように構成されている。
各原子は一つの転送特徴ベクトルに対応する。
本発明の実施形態において、薬物分類装置は、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得する。仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて、隣接行列を構築する。n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することができる。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されている。検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得して、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築することができる。化学結合属性特徴行列、隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定する。検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定することができる。分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することができる。本発明の実施形態を採用すると、薬物分類の精度を高めることができる。
を参照すると、図は、本発明の実施形態に係わる端末デバイスの構造を示す概略図である。図に示されたように、本発明の実施形態における端末デバイスは、一つ又は複数のプロセッサ401、メモリ402、及びトランシーバ403を含むことができる。プロセッサ401とメモリ402は接続されており、例えば、バス404によって接続される。メモリ402は、プログラム命令を含むコンピュータプログラムを格納するように構成されている。プロセッサ401は、メモリ402に格納されるプログラム命令を呼び出して、以下の操作を実行するように構成されている。
検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得する。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されている。
仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて隣接行列を構築し、n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築する。
隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定する。
検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定し、且つ分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力する。
いくつかの実行可能な実施形態において、n個の原子と仮想原子とのうちの任意の一つの原子の属性特徴ベクトルは、任意の一つの原子の属性特徴によって確定される。任意の一つの原子の属性特徴は原子の種類、化学結合の数、形式電荷、原子キラリティー、水素原子に接続された数、原子軌道、及び芳香族性のうちの一つ又は複数を含むが、これらに限定されない。
いくつかの実行可能な実施形態において、上記プロセッサ401は、
検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得して、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築するように構成されている。
上記プロセッサ401はさらに、
化学結合属性特徴行列、隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定するように構成されている。
いくつかの実行可能な実施形態において、n個の原子の間の化学結合及び仮想原子とn個の原子のそれぞれを接続する化学結合のうちの任意の一つの化学結合の属性特徴ベクトルは、任意の一つの化学結合の属性特徴によって確定される。任意の一つの化学結合の属性特徴は化学結合の種類、共役特徴、環状結合特徴、及び分子の立体化学特徴のうちの一つ又は複数を含む。
いくつかの実行可能な実施形態において、上記プロセッサ401は、複数の薬物分子訓練サンプルを含む訓練データ集合を取得するように構成されている。各薬物分子訓練サンプルは、少なくとも一つのサンプル薬物分子及び少なくとも一つのサンプル薬物分子における各サンプル薬物分子の薬物種類ラベルを含む。
上記プロセッサ401は、各薬物分子訓練サンプルに基づいてグラフニューラルネットワークと分類器を訓練することによって、収束条件を満たすグラフニューラルネットワークと分類器を取得するように構成されている。
いくつかの実行可能な実施形態において、上記プロセッサ401は、転送特徴行列における仮想原子に対応する転送特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定するように構成されている。
いくつかの実行可能な実施形態において、上記プロセッサ401は、
転送特徴行列におけるn個の原子に対応するn個の転送特徴ベクトルを取得し、
n個の転送特徴ベクトルの合計を第一分子特徴ベクトルとして確定し、且つ転送特徴行列における仮想原子に対応する転送特徴ベクトルを第二分子特徴ベクトルとして確定し、
第一分子特徴ベクトルと第二分子特徴ベクトルとに対して重み付き加算を行って第三分子特徴ベクトルを取得し、且つ第三分子特徴ベクトルを検出しようとする薬物分子に対応する分子特徴ベクトルとして確定するように構成されている。
各原子は一つの転送特徴ベクトルに対応する。
いくつかの実行可能な実施形態において、プロセッサ401は、中央処理装置(Central Processing Unit,CPU)であることができる。当該プロセッサは、他の汎用プロセッサ、デジタル信号プロセッサ(Digital Signal Processor,DSP)、特定用途向け集積回路(Application Specific Integrated Circuit,ASIC)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array,FPGA)又は他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなどであることができる。汎用プロセッサは、マイクロプロセッサ又は従来の任意のプロセッサなどであることができる。メモリ402は、読み取り専用メモリ(Read-Only Memory,ROM)とランダムアクセスメモリ(Random Access Memory,RAM)を含むことができ、且つプロセッサ401に命令とデータを提供するように構成されている。メモリ402の一部は、不揮発性ランダムアクセスメモリをさらに含むことができる。例えば、メモリ402は、デバイスのタイプに関する情報を格納することができる。
具体的な実施形態において、上記端末デバイスは、端末デバイスに内蔵される各機能モジュールによって、上記図1~図3の各ステップに係わる実現方式を実行することができる。具体的な内容については、上記各ステップに係わる実現方式を参照することができる。ここでは繰り返さない。
本発明の実施形態において、端末デバイスは、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得する。仮想原子とn個の原子のそれぞれとの接続関係、及びn個の原子の間の接続関係に基づいて、隣接行列を構築する。n個の原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することができる。検出しようとする薬物分子はn個の原子を含み、仮想原子はn個の原子のそれぞれに接続されている。検出しようとする薬物分子における各原子を接続する化学結合に対応する属性特徴ベクトル、及び仮想原子とn個の原子のそれぞれを接続する化学結合に対応する属性特徴ベクトルを取得して、各原子の化学結合に対応する属性特徴ベクトルと仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築することができる。化学結合属性特徴行列、隣接行列及び原子属性特徴行列をグラフニューラルネットワークに入力して、グラフニューラルネットワークを介してn個の原子と仮想原子との転送特徴行列を確定する。検出しようとする薬物分子に対応する分子特徴ベクトルを転送特徴行列に基づいて確定することができる。分子特徴ベクトルを分類器に入力して、分類器を介して検出しようとする薬物分子の薬物種類を出力することができる。本発明の実施形態を採用すると、薬物分類の精度を高めることができる。
本発明の実施形態は、コンピュータ可読記憶媒体をさらに提供する。当該コンピュータ可読記憶媒体には、コンピュータプログラムが格納されている。コンピュータプログラムは、プログラム命令を含む。当該命令は、プロセッサに実行されると、図1から図3までの各ステップに係わる薬物分類方法を実行するために用いられる。具体的な内容は、上記各ステップに係わる実施形態を参照できる。ここでは繰り返さない。
選択的に、本発明に係わる記憶媒体、例えば、コンピュータ可読記憶媒体は、揮発性のものであることができ、又は不揮発のものであることができる。
上記コンピュータ可読記憶媒体は、上記した任意の一つの実施形態に係わる薬物分類装置、又は上記端末デバイスの内部記憶ユニット、例えば電子デバイスのハードディスク又はメモリであることができる。当該コンピュータ可読記憶媒体は当該電子デバイスの外部記憶装置、例えば、当該電子デバイスに配置されるプラグイン式のハードディスク、スマートメディアカード(smart media card,SMC)、セキュアデジタル(secure digital,SD)カード、フラッシュカード(flash card)などであることができる。さらに、当該コンピュータ可読記憶媒体は、当該電子デバイスの内部記憶ユニットと外部記憶装置両方を含むことができる。当該コンピュータ可読記憶媒体は、当該コンピュータプログラムと、及び当該電子デバイスに必要な他のプログラムとデータとを格納するように構成されている。当該コンピュータ可読記憶媒体はさらに、既に出力したデータ又は出力しようとするデータを暫く格納するように構成されている。
本発明の請求項と明細書及び図面における「第一」「第二」「第三」「第四」などの用語は特定のシーケンスの説明のためではなく、異なる対象を区別するために用いられる。また、「含む」、「備える」又は他のいかなるバリアントなどの用語は、非排他的な含みをカバーすることを意図する。例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又は装置は、リストされたステップ又はユニットに限定しなく、選択的に、リストされていない他のステップ又はユニットをさらに含み、又は選択的に、プロセス、方法、製品又は装置の固有の他のステップ又はユニットをさらに含むことができる。
本明細書に言及びされる「実施形態」は、実施形態と結びついて説明される特定の特徴、構造、又は特性は本発明の少なくとも一つの実施形態に含まれることができることを意味する。明細書のいかなるところに現れる当該言葉は必ずしも同じ実施形態を示すとは限らず、他の実施形態と対立する独立の実施形態又は選択可能な実施形態でもない。当業者は、本明細書に記載される実施形態は他の実施形態と組み合わせることができることを明示的又は暗示的に理解すべきである。本発明の明細書と請求項に使われる用語「及び/又は」は、リストされた関連内容の一つ又は複数の任意の組み合わせ及び全ての可能な組み合わせを示し、また、それらの組み合わせを含む。本発明に開示された実施形態に基づいて記載される各例示のユニット及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、又は両者の組み合わせにより実現され得ることは、当業者にとって明らかである。ハードウェアとソフトウェアの互換性を明確に示すために、上記説明では、各実施形態の構成とステップを機能に基づいて一般的に説明した。それらの機能は、ハードウェアにより実行されるか又はソフトウェアにより実行されるかについて、技術方案の特定の応用又は設計の制限条件などによって決められる。当業者は、特定応用ごとに異なる方法を使用して記載される機能を実現することができるが、それらの実現は、本発明の範囲を超えると見なされるべきではない。
本発明の実施形態に係わる方法及び関連装置は、本発明の実施形態に係わる方法のフローチャート及び/又は構造を示す概略図を参照しながら説明される。具体的には、方法のフローチャート及び/又は構造を示す概略図における各プロセス及び/又はブロック、及びフローチャート及び/又はブロック図におけるプロセス及び/又はブロックの組み合わせはコンピュータプログラム命令によって実現される。それらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、組み込みプロセッサ又は他のプログラム可能なデータ処理装置(programmable data processing device)のプロセッサに提供されることで、機械を生成する。これで、コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサによって実行される命令は、フローチャートの一つのプロセス又は複数のプロセス、及び/又は構造を示す概略図の一つのブロック又は複数のブロックにおいて指定される機能を実現するに用いられる装置を生じる。それらのコンピュータプログラム命令は、コンピュータ又は他のプログラム可能なデータ処理装置に特定の方法で実行するように指示することができるコンピュータ可読記憶媒体に格納されることができる。それによって、当該コンピュータ可読記憶媒体に格納される命令は命令装置を含む製造品を生成する。当該命令装置は、フローチャートの一つのプロセス又は複数のプロセス、及び/又は構造を示す概略図の一つのブロック又は複数のブロックにおいて指定される機能を実現する。それらのコンピュータプログラム命令は、コンピュータ又は他のプログラマブルなデータ処理装置にロードされることができ、コンピュータ又は他のプログラマブルな装置で一連の操作ステップを実行して、コンピュータが実現するプロセスを生成する。これで、コンピュータ又は他のプログラマブルな装置で実行される命令は、フローチャートの一つのプロセス又は複数のプロセス、及び/又は構造を示す概略図の一つのブロック又は複数のブロックにおいて指定される機能を実現するに用いられるステップを提供する。


Claims (10)

  1. 端末デバイスに適用される薬物分類方法であって、
    検出しようとする薬物分子はn個の原子を含み、仮想原子は前記n個の原子のそれぞれに接続されており、前記端末デバイスの原子属性特徴ベクトル取得モジュールによって、前記検出しようとする薬物分子における各原子の属性特徴ベクトルと前記仮想原子の属性特徴ベクトルとを取得することと、
    前記端末デバイスの第一特徴処理モジュールによって、前記仮想原子と前記n個の原子のそれぞれとの接続関係、及び前記n個の原子の間の接続関係に基づいて隣接行列を構築し、前記n個の原子の属性特徴ベクトルと前記仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築することと、
    前記端末デバイスの特徴学習モジュールによって、前記隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、前記グラフニューラルネットワークを介して前記n個の原子と前記仮想原子との転送特徴行列を確定することと、
    前記端末デバイスの薬物分類モジュールによって、前記検出しようとする薬物分子に対応する分子特徴ベクトルを前記転送特徴行列に基づいて確定し、且つ前記分子特徴ベクトルを分類器に入力して、前記分類器を介して前記検出しようとする薬物分子の薬物種類を出力することとを含む、
    ことを特徴とする薬物分類方法。
  2. 前記n個の原子と前記仮想原子とのうちの任意の一つの原子の属性特徴ベクトルは、前記任意の一つの原子の属性特徴によって確定され、前記任意の一つの原子の属性特徴は原子の種類、化学結合の数、形式電荷、原子キラリティー、水素原子に接続された数、原子軌道、及び芳香族性のうちの一つ又は複数を含む、
    ことを特徴とする請求項1に記載の方法。
  3. 前記端末デバイスの化学結合属性特徴ベクトル取得モジュールによって、検出しようとする薬物分子における各原子をつなぐ化学結合に対応する属性特徴ベクトル、及び前記仮想原子と前記n個の原子のそれぞれとの両方を接続する化学結合に対応する属性特徴ベクトルを取得することと、
    前記端末デバイスの第二特徴処理モジュールによって、前記各原子の化学結合に対応する属性特徴ベクトルと前記仮想原子の化学結合に対応する属性特徴ベクトルとに基づいて、化学結合属性特徴行列を構築することとをさらに含み、
    前記端末デバイスの特徴学習モジュールによって、前記隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、前記グラフニューラルネットワークを介して前記n個の原子と前記仮想原子との転送特徴行列を確定することは、
    前記特徴学習モジュールによって、前記化学結合属性特徴行列、前記隣接行列、及び前記原子属性特徴行列をグラフニューラルネットワークに入力して、前記グラフニューラルネットワークを介して前記n個の原子と前記仮想原子との転送特徴行列を確定することを含む、
    ことを特徴とする請求項1に記載の方法。
  4. 前記n個の原子の間の化学結合及び前記仮想原子と前記n個の原子のそれぞれとをつなぐ化学結合のうちの任意の一つの化学結合の属性特徴ベクトルは、前記任意の一つの化学結合の属性特徴によって確定され、前記任意の一つの化学結合の属性特徴は、化学結合の種類、共役特徴、環状結合特徴、及び分子の立体化学特徴のうちの一つ又は複数を含む、
    ことを特徴とする請求項3に記載の方法。
  5. 検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得する前に、前記方法は、
    前記端末デバイスのモデル訓練モジュールによって、複数の薬物分子訓練サンプルを含む訓練データ集合を取得することと、
    前記モデル訓練モジュールによって、各薬物分子訓練サンプルに基づいて前記グラフニューラルネットワークと前記分類器を訓練することによって、収束条件を満たす前記グラフニューラルネットワークと前記分類器を取得することとを更に含み、
    各薬物分子訓練サンプルは、少なくとも一つのサンプル薬物分子及び前記少なくとも一つのサンプル薬物分子における各サンプル薬物分子の薬物種類ラベルを含む、
    ことを特徴とする請求項1~4のいずれか一項に記載の方法。
  6. 前記端末デバイスの薬物分類モジュールによって、前記検出しようとする薬物分子に対応する分子特徴ベクトルを前記転送特徴行列に基づいて確定することは、
    前記薬物分類モジュールに含まれる第一分子特徴ベクトル確定ユニットによって、前記転送特徴行列における前記仮想原子に対応する転送特徴ベクトルを、前記検出しようとする薬物分子に対応する分子特徴ベクトルとして確定することを含む、
    ことを特徴とする請求項1~4のいずれか一項に記載の方法。
  7. 前記端末デバイスの薬物分類モジュールによって、前記検出しようとする薬物分子に対応する分子特徴ベクトルを前記転送特徴行列に基づいて確定することは、
    前記薬物分類モジュールに含まれる第二分子特徴ベクトル確定ユニットによって、前記転送特徴行列における前記n個の原子に対応するn個の転送特徴ベクトルを取得することと、
    前記第二分子特徴ベクトル確定ユニットによって、前記n個の転送特徴ベクトルの合計を第一分子特徴ベクトルとして確定し、且つ前記転送特徴行列における前記仮想原子に対応する転送特徴ベクトルを第二分子特徴ベクトルとして確定することと、
    前記第二分子特徴ベクトル確定ユニットによって、前記第一分子特徴ベクトルと前記第二分子特徴ベクトルとに対して重み付き加算を行って第三分子特徴ベクトルを取得し、且つ前記第三分子特徴ベクトルを前記検出しようとする薬物分子に対応する分子特徴ベクトルとして確定することとを含み、
    前記n個の原子のそれぞれは一つの転送特徴ベクトルに対応する、
    ことを特徴とする請求項1~4のいずれか一項に記載の方法。
  8. 薬物分類装置であって、
    原子属性特徴ベクトル取得モジュール、第一特徴処理モジュール、特徴学習モジュール、及び薬物分類モジュールを含み、
    前記原子属性特徴ベクトル取得モジュールは、検出しようとする薬物分子における各原子の属性特徴ベクトルと仮想原子の属性特徴ベクトルとを取得するように構成されており、前記検出しようとする薬物分子はn個の原子を含み、且つ、前記仮想原子は前記n個の原子のそれぞれに接続されており、
    前記第一特徴処理モジュールは、前記仮想原子と前記n個の原子のそれぞれとの接続関係、及び前記n個の原子の間の接続関係に基づいて隣接行列を構築し、且つ、前記n個の原子の属性特徴ベクトルと前記仮想原子の属性特徴ベクトルとに基づいて、原子属性特徴行列を構築するように構成されており、
    特徴学習モジュールは、前記隣接行列と原子属性特徴行列とをグラフニューラルネットワークに入力して、前記グラフニューラルネットワークを介して前記n個の原子と前記仮想原子との転送特徴行列を確定するように構成されており、
    薬物分類モジュールは、前記検出しようとする薬物分子に対応する分子特徴ベクトルを前記転送特徴行列に基づいて確定し、且つ、前記分子特徴ベクトルを分類器に入力して、前記分類器を介して前記検出しようとする薬物分子の薬物種類を出力するように構成されている、
    ことを特徴とする薬物分類装置。
  9. 端末デバイスであって、相互に接続されたプロセッサとメモリを含み、
    前記メモリは、プログラム命令を含むコンピュータプログラムを格納するように構成されており、前記プロセッサは、前記プログラム命令を呼び出して、請求項1~7のいずれか一項に記載の方法を実行するように構成されている、
    ことを特徴とする端末デバイス。
  10. コンピュータプログラムを格納したコンピュータ可読記憶媒体であって、前記コンピュータプログラムはプログラム命令を含み、前記プログラム命令は、プロセッサに実行されると、前記プロセッサに、請求項1~7のいずれか一項に記載の方法を実行させるように構成されている、
    ことを特徴とするコンピュータ可読記憶媒体。
JP2021576126A 2020-09-27 2020-10-29 薬物分類方法と装置、端末デバイス及び記憶媒体 Active JP7227405B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011035837.1 2020-09-27
CN202011035837.1A CN111933225B (zh) 2020-09-27 2020-09-27 药物分类方法、装置、终端设备以及存储介质
PCT/CN2020/124690 WO2021159744A1 (zh) 2020-09-27 2020-10-29 药物分类方法、装置、终端设备以及存储介质

Publications (2)

Publication Number Publication Date
JP2022538823A JP2022538823A (ja) 2022-09-06
JP7227405B2 true JP7227405B2 (ja) 2023-02-21

Family

ID=73334832

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576126A Active JP7227405B2 (ja) 2020-09-27 2020-10-29 薬物分類方法と装置、端末デバイス及び記憶媒体

Country Status (4)

Country Link
US (1) US20220101954A1 (ja)
JP (1) JP7227405B2 (ja)
CN (1) CN111933225B (ja)
WO (1) WO2021159744A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113035298B (zh) * 2021-04-02 2023-06-20 南京信息工程大学 递归生成大阶数行限制覆盖阵列的药物临床试验设计方法
CN113707236B (zh) * 2021-08-30 2024-05-14 平安科技(深圳)有限公司 基于图神经网络的药物小分子性质预测方法、装置及设备
WO2023123021A1 (zh) * 2021-12-29 2023-07-06 深圳晶泰科技有限公司 获取分子特征描述的方法、装置及存储介质
CN114358202B (zh) * 2022-01-11 2024-10-15 平安科技(深圳)有限公司 基于药物分子图像分类的信息推送方法及装置
CN115171807B (zh) * 2022-09-07 2022-12-06 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170061276A1 (en) 2015-09-01 2017-03-02 Google Inc. Neural network for processing graph data
CN110020671A (zh) 2019-03-08 2019-07-16 西北大学 基于双通道cnn-lstm网络的药物关系分类模型构建及分类方法
CN110767271A (zh) 2019-10-15 2020-02-07 腾讯科技(深圳)有限公司 化合物性质预测方法、装置、计算机设备及可读存储介质
CN111243682A (zh) 2020-01-10 2020-06-05 京东方科技集团股份有限公司 药物的毒性预测方法及装置、介质和设备
CN111462833A (zh) 2019-01-20 2020-07-28 深圳智药信息科技有限公司 一种虚拟药物筛选方法、装置、计算设备及存储介质
JP2021515234A (ja) 2018-03-05 2021-06-17 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 薬物発見および分子シミュレーションへの適用を伴う空間グラフ畳み込みのためのシステムおよび方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062551A (zh) * 2017-06-28 2018-05-22 浙江大学 一种基于邻接矩阵的图特征提取系统、图分类系统和方法
CN109033738B (zh) * 2018-07-09 2022-01-11 湖南大学 一种基于深度学习的药物活性预测方法
CN110289050B (zh) * 2019-05-30 2023-06-16 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN111046664A (zh) * 2019-11-26 2020-04-21 哈尔滨工业大学(深圳) 基于多粒度的图卷积神经网络的假新闻检测方法及系统
CN111210878A (zh) * 2020-01-06 2020-05-29 湖南大学 一种基于深度学习的药物预测方法
CN111524557B (zh) * 2020-04-24 2024-04-05 腾讯科技(深圳)有限公司 基于人工智能的逆合成预测方法、装置、设备及存储介质
CN111581488B (zh) * 2020-05-14 2023-08-04 上海商汤智能科技有限公司 一种数据处理方法及装置、电子设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170061276A1 (en) 2015-09-01 2017-03-02 Google Inc. Neural network for processing graph data
JP2021515234A (ja) 2018-03-05 2021-06-17 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 薬物発見および分子シミュレーションへの適用を伴う空間グラフ畳み込みのためのシステムおよび方法
CN111462833A (zh) 2019-01-20 2020-07-28 深圳智药信息科技有限公司 一种虚拟药物筛选方法、装置、计算设备及存储介质
CN110020671A (zh) 2019-03-08 2019-07-16 西北大学 基于双通道cnn-lstm网络的药物关系分类模型构建及分类方法
CN110767271A (zh) 2019-10-15 2020-02-07 腾讯科技(深圳)有限公司 化合物性质预测方法、装置、计算机设备及可读存储介质
CN111243682A (zh) 2020-01-10 2020-06-05 京东方科技集团股份有限公司 药物的毒性预测方法及装置、介质和设备

Also Published As

Publication number Publication date
CN111933225A (zh) 2020-11-13
JP2022538823A (ja) 2022-09-06
CN111933225B (zh) 2021-01-05
WO2021159744A1 (zh) 2021-08-19
US20220101954A1 (en) 2022-03-31

Similar Documents

Publication Publication Date Title
JP7227405B2 (ja) 薬物分類方法と装置、端末デバイス及び記憶媒体
CN104067282B (zh) 状态机晶格中的计数器操作
Neyshabur et al. NETAL: a new graph-based method for global alignment of protein–protein interaction networks
US11176462B1 (en) System and method for prediction of protein-ligand interactions and their bioactivity
Scornavacca et al. Representing a set of reconciliations in a compact way
Górecki et al. Maximum likelihood models and algorithms for gene tree evolution with duplications and losses
CN112328674A (zh) 跨数据格式的模型转化加速方法及装置
Alhazov et al. Matter and anti-matter in membrane systems
WO2023231720A1 (zh) 药物疾病关联预测方法、装置、电子设备和可读存储介质
Zhang Clusters, trees, and phylogenetic network classes
Jansen et al. FPT algorithms to compute the elimination distance to bipartite graphs and more
CN114626503A (zh) 模型的训练方法、目标检测方法、装置、电子设备及介质
Lin et al. Computing the diffusion state distance on graphs via algebraic multigrid and random projections
Hutchinson et al. Constructing canonical strategies for parallel implementation of isogeny based cryptography
Ekim et al. Polarity of chordal graphs
Peng et al. Enumerating consistent sub-graphs of directed acyclic graphs: an insight into biomedical ontologies
Perrin et al. Recursive module extraction using Louvain and PageRank
CN117133382A (zh) 一种药物分子间作用预测模型的训练方法及装置
CN110010251B (zh) 一种中药社团信息生成方法、系统、装置和存储介质
Wang et al. BIMLR: a method for constructing rooted phylogenetic networks from rooted phylogenetic trees
US20180046762A1 (en) Comprehension Normalization Method For Networks
CN109784406A (zh) 一种用户画像方法、装置、可读存储介质及终端设备
Min et al. Sequence-based deep learning frameworks on enhancer-promoter interactions prediction
Shojaie et al. How different are estimated genetic networks of cancer subtypes?
CN112862008A (zh) 偏好预测模型的训练方法及用户偏好的预测方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230209

R150 Certificate of patent or registration of utility model

Ref document number: 7227405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150