CN113241128B - 基于分子空间位置编码注意力神经网络模型的分子性质预测方法 - Google Patents

基于分子空间位置编码注意力神经网络模型的分子性质预测方法 Download PDF

Info

Publication number
CN113241128B
CN113241128B CN202110473289.9A CN202110473289A CN113241128B CN 113241128 B CN113241128 B CN 113241128B CN 202110473289 A CN202110473289 A CN 202110473289A CN 113241128 B CN113241128 B CN 113241128B
Authority
CN
China
Prior art keywords
molecular
substructure
molecule
atom
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110473289.9A
Other languages
English (en)
Other versions
CN113241128A (zh
Inventor
饶国政
薛力源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tju Binhai Industrial Research Institute Co ltd
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202110473289.9A priority Critical patent/CN113241128B/zh
Publication of CN113241128A publication Critical patent/CN113241128A/zh
Application granted granted Critical
Publication of CN113241128B publication Critical patent/CN113241128B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分子空间位置编码注意力神经网络模型的分子性质预测方法。该方法通过机器学习技术将分子的3D构象中的空间位置进行编码,更好的表示分子中不同位置对于子结构造成的影响以更好表征分子同时利用注意力机制的神经网络结构和门控循环网络(GRU)用来预测其化学性质。本发明充分利用了分子子结构的拓朴关系,在公开数据集上进行实验,有效提高了分子水溶性毒性亲水性等性质预测的效果,为药物分子预测提供了新的方法。

Description

基于分子空间位置编码注意力神经网络模型的分子性质预测 方法
技术领域
本发明涉及化学信息学、机器学习/人工智能领域,具体为一种基于空间位 置编码并使用化学信息学、机器学习/人工智能的手段来预测未知分子性质的理 论方法。
背景技术
药物研发过程具有资金密度大、风险高、周期长的特点,需要投入大量的 资金、人力、物力。在药物开发领域,虽然很多潜在药物分子在动物模型中进 行了大量研究,但仍然存在30%以上的候选药物分子在实际应用中因该分子其 他各种内禀性质不符合要求而失败,说明分子性质预测工作有重要价值,可用 于更好地预测早期的分子特性,可大大降低后期工艺失败的负荷,节省大量资 源和时间即加速中间步骤,从而降低成本。
近30年来,医药开发领域的研究者们试图将机器学习引入药物化学研究中, 以解决药物开发过程中的问题。近10年来,深度学习方法在语音识别、计算机 视觉、自然语言处理、数据挖掘等不同领域取得了显著的成就。医药化工领域 的研究人员也在尝试将新的深度学习方法应用到药物研发过程中,降低药物研 发成本,深度学习方法不同于传统的机器学习方法。它可在大量的标签化数据 的监督下自动学习数据的表示方式,从而实现数据特征的自动提取,深度学习 方法的核心是利用神经网络模块自动学习分子结构或描述符中保留了大量原始 结构信息的分子结构或描述符的低维密集表示向量,通过对分子结构的描述符 进行自动学习,从而实现对分子特征的自动提取。深度学习中使用了多种类型 的分子表示形式,通过SMILES(简化的分子输入行输入系统),它按照指定的 语法将分子编码为有意义的序列;通过预先定义的化学指纹通过one-hot向量的 形式表示分子的不同的子结构,但太过稀疏。与指纹和SMILES相比,图形表 示可保留分子结构和拓扑信息。而将分子机构同样可看作一个自然语言处理的 问题,此时以RNN为代表的序列建模方法可用于分子性质的预测。
虽然基于图的深度学习方法在预测分子特性方面取得了良好的结果,但是仍 然需要解决一些问题。传统图卷积网络中,图结构信息由邻接矩阵表示,矩阵 大小在训练过程中是固定的。但不同分子中的原子数是不同的。因此,如何选 择合适基体尺寸是一项艰巨任务。如RNN,长短期记忆(LSTM)和门控循环 单元(GRU)类的循环神经网络具有处理不同大小序列的出色能力。其次,将 图将原子直接作为图的基本单元不利于保持分子化学信息,现有大多图网络是 以分子为节点进行训练,这往往忽视了分子子结构之间内部信息,目前基于序 列,将化学分子视为句子向量通过类似于自然语言处理的方法,无法很好区分不同分子或同一个分子处于不同位置的相同子结构的表示,这一点降低了模型 的性能。
发明内容
本发明的目的是提出一种基于分子空间位置编码注意力神经网络模型的分 子性质预测分子性质预测方法,使用基于空间位置编码并使用化学信息学、机 器学习/人工智能的手段,预测未知分子的各种性质。
为实现上述目的,本发明采用以下技术方案:
一种分子性质预测方法,包括以下步骤:
通过设计的预测模型实现,该预测模型包括双向门控网络层、多头注意力 层;预测时,将含有空间位置编码的分子信息输入到双向门控网络层,捕获分 子的双向信息,进行两层属性预测;多头注意力层负责接收双向门控网络层的 输出,通过多头注意力计算,得到各个子结构的特征信息;最后由输出层接收 所输出的各个子结构的特征信息,输出分子性质的最终预测结果。
其中,通过嵌入层形成含有空间位置编码的分子信息,所述嵌入层通过获 取多级连续分子表示实现,采用NLP的方式,将每个分子看作一个句子,将分 子切分成许多词向量,借鉴word2vec的思想,首先预训练一个由大量无监督分 子子结构的嵌入矩阵同,使用ZINC15数据库作为化合物来源来组成化合物的主 体,首先要对分子识别预先定义好的官能团以及环状结构,防止被分成多个子 结构,然后对其他的部分利用连通性来切分,每个子结构都可以获得一个嵌入 向量,该向量初始标识符使用了摩根算法,包含了子结构内部原子的化学信息;
将每个原子的经Rdkit软件处理的三维坐标通过PCA降维成一维后嵌入, 然后根据降维后的数值作为每个原子在分子中的位置一同嵌入向量,该向量表 示分子中子结构的属性;
实现了节点嵌入层,采用了skip-gram的方法将子结构词汇表映射到嵌入矩 阵中,基于数据库中大量无标记的化学分子子结构之间的连通性来训练嵌入矩 阵,进而生成一组低维稠密的向量初步表示子结构;
利用以获取到的每个原子的空间位置信息,将子结构中含有的原子坐标相 加求平均,可以获得子结构的三维坐标,将其逐个映射到子结构嵌入空间;
完成嵌入层,传入模型预测层中;
将含有空间位置编码的分子信息输入到模型中进行预测;
预测模型由两部分组成分别是双向门控网络层和多头注意力层;
将含有空间位置编码的分子信息输入到双向门控网络层,一项对应于GRU 模型结构中的两个输出,可以捕获分子的双向信息;
多头注意力层负责接收双向门控网络层的输出,通过多头注意力层计算, 得到各个子结构的特征信息;
输出层,负责输出分子性质的最终预测结果。
本发明不同于其他忽视了分子子结构之间的内部信息或无法很好区分不同 分子或同一个分子处于不同位置的相同的子结构的表示,未能捕捉到功能组成 分相似的分子之间的差异,导致分子结构建模不足。
本发明在原有分子二维拓朴结构信息基础上增加三维空间位置信息,输出 分子性质的预测结果,对于任意类型的分子结构和任意的计算策略都可以做出 预测,比一般的经验方法、回归分析方法更加精确。
附图说明
图1是基于分子空间位置编码注意力神经网络模型的整体架构图;
图2是Bi-Gru层的模型结构图;
图3是Multi-Head Attention层的Scaled Dot-Product Attention模型结构图;
图4是Multi-Head Attention层的模型结构图
图5是在公开数据集EOSL上使用含有空间位置编码信息的分子性质预测 模型输出的RMSE值。
具体实施方式
下面结合附图对本发明作进一步的描述。
本发明该方法通过机器学习技术将分子的3D构象中的空间位置进行编码, 更好的表示分子中不同位置对于子结构造成的影响以更好表征分子同时利用注 意力机制的神经网络结构和门控循环网络(GRU)用来预测其化学性质。
本发明基于分子空间位置编码注意力神经网络模型,是将分子空间位置信息 和拓扑信息结合起来的的机器学习模型,如图1所示,模型由3个部分组成: 嵌入层,预测模型层,输出层。
本发明基于分子结构决定性质这一化学基本基础,将分子中的空间位置信 息结合化学信息学和机器学习/人工智能作为分子性质预测方法。接收分子结构 和其他性质作为输入,输出分子性质的预测结果,对任意类型的分子结构和任 意的计算策略都可做出预测,比一般经验方法、回归分析方法更加精确。
一、嵌入层,获取多级连续分子表示。
首先,受NLP的启发,将每个分子作为一个句子,并将分子拆分成步长长 度为2的子结构;其中,步长指的是最长的相邻原子数,每个原子根据Morgan 算法获得对应标识符对其进行向量表示。
因为该模型是基于顺序的,所以需要考虑子结构顺序,因此设定子结构顺 序。首先,分子中连接性最大的原子需要作为中心原子,其中连接性是指原子 连接的非氢键数,如果有多个原子具有相同数量的非氢键,则采用键价最多的 原子,如果仍然相同,最接近分子中心的原子被作为中心原子。用中心原子的 坐标作为该子结构的坐标,每个原子的空间坐标来自RDKit,分子中心位置通过 对每个原子的空间位置取平均;其次,中央原子用于获取步长为2内有关其邻 居原子的信息并通过摩根算法计算出子结构的类似独热的向量表示。
其次,递归形成其他子结构。
借鉴word2vec的思想,预训练一个由大量无监督分子子结构的嵌入矩阵。 使用ZINC15数据库作为化合物来源来组成化合物的主体。向量的初始标识符使 用摩根算法来表示子结构内原子的化学信息,使用skip-gram方法将子结构词汇 映射到嵌入矩阵中,嵌入矩阵根据数据库中大量未标记的化学分子的子结构之 间的连通性进行训练,从而生成一组低维密集向量,用于初步表示子结构。
接下来,进行空间位置信息嵌入工作。
与自然语言中的句子不同,分子由没有顺序的子结构组成。因此,有效定 义子结构的顺序对于确保输入表示保持原始分子结构的足够语义至关重要。
本发明使用空间位置信息嵌入,作为分子中子结构的顺序;然后将每个子 结构的基础嵌入和空间位置嵌入,作为分类器的输入表示。
利用Rdkit获取了每个原子的坐标信息,并通过对子结构中的原子坐标平 均,以获取子结构的三维坐标,并逐个映射到子结构嵌入空间。
优选的,本发明使用Rdkit提供的分子3D构象获得三维坐标。
长度为n的分子smiles表示看作输入序列,t表示子结构的坐标。
Figure RE-GDA0003153651370000061
表 示与第th位置坐标对应的矢量,d表示矢量的维度,维度数与嵌入在子结构中 的维度数相同方便之后相加。
Figure RE-GDA0003153651370000062
是为每个坐标生成空间位置矢量的函数, 定义如下:
Figure RE-GDA0003153651370000063
th表示第t个子结构的空间坐标,而其频率wk按以下公式计算:
Figure BDA0003046198420000064
位置嵌入向量是一个包含每个频率的正弦和余弦对的向量,如下:
Figure BDA0003046198420000065
最后,对于分子里的每个子结构wt,计算其对应的子结构嵌入ψ(wt),
Figure BDA0003046198420000066
二、模型预测层
如图2所示的双向门控网络层模型体系结构是双向的,因此进行标准的两层 属性预测。一项对应于Gru模型结构中的两个输出,可捕获分子双向信息。若 输入序列有n个嵌入向量,则有2n个输出。每个单向层Gru计算如下:
rt=σ(Wrxt+br+W′rh(t-1))+br)
zt=σ(Wzxt+bz+W′zh(t-1))+b′z)
pt=tanh(Wpxt+bp+rt(W′ph(t-1)+b′p)
ht=(1-zt)pt+zth(t-1)
其中,xt是在序列的时间步t处的输入,h(t-1)是时间步t-1处的隐状态。rt,zt和pt分别是reset,update和new gates。Wr,Wr和Wp是输入xt的参数。br,bz,bp是 输入xt的偏差。W′r,W′z和W′p是输入h(t-1)的参数。b′r,b′z和b′p是输入h(t-1)的偏置。
本发明模型由两个堆叠的Bi-GRU组成,每层计算如下:
Figure BDA0003046198420000071
其中,
Figure RE-GDA0003153651370000072
是层1在时间步t处的隐藏状态。
Figure RE-GDA0003153651370000073
是层1是在时间步t-1处的隐 藏状态。
Figure RE-GDA0003153651370000074
Figure RE-GDA0003153651370000075
是层1的参数。
Figure RE-GDA0003153651370000076
是层l-1在位置t处的隐藏状态。
接着,将向量输出到多头注意力层(Multi-Head Attention),分子是结构 化数据,其中不同子结构可能对特性有各种贡献,求和和平均运算无法捕获此 特征。注意机制解决了有关权衡输入的不同部分以做出决策的问题。
本发明实施例,引进了多头注意力层更好的区分不同位置的结构很相似的 子结构的应赋权重,这增强了模型的泛化能力。多头注意力层(Multi-Head Attention)负责接收Bi-Gru层的输出。通过多头注意力层计算,得到各个子 结构特征信息,多头注意力层结构如图3-图4所示。
本发明模型中,多头注意力层(Multi-Head Attention)首先需要将输入的Q, K,V三个向量进行线性变换再进行计算。
由于采用多头机制,Scaled Dot-Product Attention部分计算需要进行多次。“头”数意味着计算的次数,只是每一头的计算下Q,K,V线性投影不同, 多头注意力使得模型能够在不同的位置共同关注来自不同表示子空间的信息。 以第i个头为例:
Figure BDA0003046198420000081
Figure BDA0003046198420000082
Figure BDA0003046198420000083
最后得到的这一头的结果便是:
Figure BDA0003046198420000084
h次运算过后,将这h次的Mi拼接:
M=Concar(M1,M2,…,Mh)
这样,最后得到的就是分子向量,接入全连接层进行预测。
三、输出层
输出层根据回归或是分类任务的不同选则softmax或logistic Sigmoid函数,并且不同的数据集需要不同的超参数。
图5显示在Lip数据集上,基于分子空间位置编码注意力神经网络模型的 RMSE是0.704比最新的模型的结果0.728要好4%。
本发明所采用的基于分子空间位置编码注意力神经网络模型具有很强的通 用性,可轻松的应用在其他分子性质预测任务上如药物分子的毒性,药物分子 的水溶性的预测等等。
尽管上面结合附图对本发明的功能及工作过程进行了描述,但本发明并不局 限于上述的具体功能和工作过程,上述的具体实施方式仅仅是示意性的,而不 是限制性的。
本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要 求所保护的范围情况下,还可以做出很多形式,这些均属于本发明的保护之内。

Claims (4)

1.一种分子性质预测方法,其特征在于,通过设计的预测模型实现,该预测模型包括双向门控网络层、多头注意力层;预测时,将含有空间位置编码的分子信息输入到双向门控网络层,捕获分子的双向信息,进行两层属性预测;多头注意力层负责接收双向门控网络层的输出,通过多头注意力计算,得到各个子结构的特征信息;最后由输出层接收所输出的各个子结构的特征信息,输出分子性质的最终预测结果;
通过嵌入层形成含有空间位置编码的分子信息,所述嵌入层通过获取多级连续分子表示实现:
首先,受NLP的启发,将每个分子作为一个句子,并将分子拆分成步长长度为2的子结构;
所述子结构设置顺序:将分子中连接性最大的原子作为中心原子,用中心原子的坐标作为该子结构的坐标,每个原子的空间坐标来自RDKit,分子中心位置通过对每个原子的空间位置取平均求取;中心原子用于获取步长为2内相邻原子的信息并通过摩根算法计算出子结构的独热的向量表示;
所述连接性指原子连接的非氢键数,若有多个原子具有相同数量的非氢键,则采用键价最多的原子,若仍然相同,最接近分子中心的原子被作为中心原子;
其次,递归形成其它子结构:
预训练一个由大量无监督分子子结构的嵌入矩阵,使用ZINC15数据库作为化合物来源来组成化合物的主体:首先对分子识别预先定义好的官能团以及环状结构,防止被分成多个子结构,然后对其它部分利用连通性切分,每个子结构获得一个嵌入向量;该嵌入向量初始标识符使用摩根算法,包含子结构内部原子的化学信息;将每个原子的经Rdkit处理的三维坐标通过PCA降维成一维,然后根据降维后的数值作为每个原子在分子中的位置一同嵌入向量,表示分子中子结构的属性;
采用skip-gram方法将子结构词汇表映射到嵌入矩阵中,基于数据库中大量无标记的化学分子子结构之间的连通性来训练嵌入矩阵,生成一组低维稠密的向量初步表示子结构;
利用以获取到的每个原子的空间位置信息,将子结构中含有的原子坐标相加求平均,可以获得子结构的三维坐标,将其逐个映射到子结构嵌入空间,完成嵌入。
2.根据权利要求1所述分子性质预测方法,其特征在于,将含有空间位置编码的分子信息输入到模型中预测前,利用Rdkit获取每个原子坐标信息,并通过对子结构中的原子坐标平均,以获取子结构的三维坐标,并逐个映射到子结构嵌入空间。
3.根据权利要求2所述分子性质预测方法,其特征在于,使用Rdkit提供的分子3D构象获得每个原子的三维坐标。
4.根据权利要求1所述分子性质预测方法,其特征在于,所述输出层根据回归或是分类任务的不同选则softmax或logistic Sigmoid函数,且不同的数据集需要不同的超参数。
CN202110473289.9A 2021-04-29 2021-04-29 基于分子空间位置编码注意力神经网络模型的分子性质预测方法 Active CN113241128B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110473289.9A CN113241128B (zh) 2021-04-29 2021-04-29 基于分子空间位置编码注意力神经网络模型的分子性质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110473289.9A CN113241128B (zh) 2021-04-29 2021-04-29 基于分子空间位置编码注意力神经网络模型的分子性质预测方法

Publications (2)

Publication Number Publication Date
CN113241128A CN113241128A (zh) 2021-08-10
CN113241128B true CN113241128B (zh) 2022-05-13

Family

ID=77131544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110473289.9A Active CN113241128B (zh) 2021-04-29 2021-04-29 基于分子空间位置编码注意力神经网络模型的分子性质预测方法

Country Status (1)

Country Link
CN (1) CN113241128B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707236B (zh) * 2021-08-30 2024-05-14 平安科技(深圳)有限公司 基于图神经网络的药物小分子性质预测方法、装置及设备
CN113470761B (zh) * 2021-09-03 2022-02-25 季华实验室 发光材料性质预测方法、系统、电子设备和存储介质
CN114093435A (zh) * 2021-10-21 2022-02-25 深圳阿尔法分子科技有限责任公司 一种基于深度学习的化学分子相关水溶性预测方法
WO2023065220A1 (zh) * 2021-10-21 2023-04-27 深圳阿尔法分子科技有限责任公司 一种基于深度学习的化学分子相关水溶性预测方法
CN113990415A (zh) * 2021-12-30 2022-01-28 南京师范大学 一种基于神经网络的三维催化材料催化特性筛选系统
CN114822718B (zh) * 2022-03-25 2024-04-09 云南大学 基于图神经网络的人体口服生物利用度预测方法
CN115512789A (zh) * 2022-09-21 2022-12-23 北京有竹居网络技术有限公司 分子表示方法及电子设备
CN116106461B (zh) * 2022-11-03 2024-02-06 西湖大学 一种基于深层图网络的预测液相色谱保留时间的方法和装置
CN116825234B (zh) * 2023-08-30 2023-11-07 江西农业大学 一种多模态信息融合的药物分子活性预测方法及电子设备
CN117524353B (zh) * 2023-11-23 2024-05-10 大连理工大学 一种基于多维度分子信息的分子大模型、构建方法及应用

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492227A (zh) * 2018-11-16 2019-03-19 大连理工大学 一种基于多头注意力机制和动态迭代的机器阅读理解方法
CN111078889A (zh) * 2019-12-20 2020-04-28 大连理工大学 一种基于多种实体注意力和改进预训练语言模型的药物间关系抽取方法
CN111710375A (zh) * 2020-05-13 2020-09-25 中国科学院计算机网络信息中心 一种分子性质预测方法及系统
CN111755078A (zh) * 2020-07-30 2020-10-09 腾讯科技(深圳)有限公司 药物分子属性确定方法、装置及存储介质
CN112151127A (zh) * 2020-09-04 2020-12-29 牛张明 基于分子语义向量的无监督学习药物虚拟筛选方法和系统
CN112289372A (zh) * 2020-12-15 2021-01-29 武汉华美生物工程有限公司 一种基于深度学习的蛋白质结构设计方法及装置
CN112435720A (zh) * 2020-12-04 2021-03-02 上海蠡图信息科技有限公司 一种基于自注意力机制与多药物特征组合的预测方法
CN112487820A (zh) * 2021-02-05 2021-03-12 南京邮电大学 一种中文医疗命名实体识别方法
CN112542211A (zh) * 2020-12-18 2021-03-23 中国石油大学(华东) 基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
CN112582020A (zh) * 2020-12-18 2021-03-30 中国石油大学(华东) 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472031B (zh) * 2018-11-09 2021-05-04 电子科技大学 一种基于双记忆注意力的方面级别情感分类模型及方法
CN110459274B (zh) * 2019-08-01 2022-08-26 南京邮电大学 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用
CN111640470A (zh) * 2020-05-27 2020-09-08 牛张明 基于句法模式识别的药物小分子毒性预测的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492227A (zh) * 2018-11-16 2019-03-19 大连理工大学 一种基于多头注意力机制和动态迭代的机器阅读理解方法
CN111078889A (zh) * 2019-12-20 2020-04-28 大连理工大学 一种基于多种实体注意力和改进预训练语言模型的药物间关系抽取方法
CN111710375A (zh) * 2020-05-13 2020-09-25 中国科学院计算机网络信息中心 一种分子性质预测方法及系统
CN111755078A (zh) * 2020-07-30 2020-10-09 腾讯科技(深圳)有限公司 药物分子属性确定方法、装置及存储介质
CN112151127A (zh) * 2020-09-04 2020-12-29 牛张明 基于分子语义向量的无监督学习药物虚拟筛选方法和系统
CN112435720A (zh) * 2020-12-04 2021-03-02 上海蠡图信息科技有限公司 一种基于自注意力机制与多药物特征组合的预测方法
CN112289372A (zh) * 2020-12-15 2021-01-29 武汉华美生物工程有限公司 一种基于深度学习的蛋白质结构设计方法及装置
CN112542211A (zh) * 2020-12-18 2021-03-23 中国石油大学(华东) 基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
CN112582020A (zh) * 2020-12-18 2021-03-30 中国石油大学(华东) 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
CN112487820A (zh) * 2021-02-05 2021-03-12 南京邮电大学 一种中文医疗命名实体识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Gated Graph Recursive Neural Networks for Molecular Property Prediction;Hiroyuki Shindo 等;《arXiv:1909.002591[cs.LG]》;20190831;正文第1-10页 *
基于深度学习的药物性质预测算法研究;范益世;《中国优秀博硕士学位论文全文数据库(硕士)医药卫生科技辑》;20200615;正文第1-50页 *

Also Published As

Publication number Publication date
CN113241128A (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN113241128B (zh) 基于分子空间位置编码注意力神经网络模型的分子性质预测方法
Plappert et al. Learning a bidirectional mapping between human whole-body motion and natural language using deep recurrent neural networks
US20240144092A1 (en) Generative machine learning systems for drug design
WO2021164772A1 (zh) 训练跨模态检索模型的方法、跨模态检索的方法和相关装置
US20210390397A1 (en) Method, machine-readable medium and system to parameterize semantic concepts in a multi-dimensional vector space and to perform classification, predictive, and other machine learning and ai algorithms thereon
CN111312329B (zh) 基于深度卷积自动编码器的转录因子结合位点预测的方法
Bengoetxea et al. Inexact graph matching by means of estimation of distribution algorithms
CN110046671A (zh) 一种基于胶囊网络的文本分类方法
CN111814658B (zh) 基于语义的场景语义结构图检索方法
Shin et al. Incremental deep learning for robust object detection in unknown cluttered environments
CN115145551A (zh) 一种面向机器学习应用低代码开发的智能辅助系统
CN115240786A (zh) 反应物分子的预测方法、训练方法、装置以及电子设备
CN113159067A (zh) 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置
CN112086144A (zh) 分子生成方法、装置、电子设备及存储介质
CN116721221A (zh) 基于多模态的三维内容生成方法、装置、设备及存储介质
CN112199884A (zh) 物品分子生成方法、装置、设备及存储介质
CN114881032A (zh) 基于多任务学习的层次类别命名实体识别模型设计方法
Strickert et al. Unsupervised recursive sequence processing
CN111309849B (zh) 一种基于联合学习模型的细粒度数值信息抽取方法
CN112738647A (zh) 一种基于多层级编码-解码器的视频描述方法及系统
CN116975743A (zh) 行业信息分类方法、装置、计算机设备和存储介质
CN116434347A (zh) 一种基于掩码图自编码器的骨架序列识别方法及系统
CN113779244B (zh) 文档情感分类方法、装置、存储介质以及电子设备
Segen Learning structural descriptions of shape
CN108921911B (zh) 结构化图片自动转换为源代码的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220627

Address after: 300461 room 214, building 3, No. 48, Jialingjiang Road, Lingang Economic Zone, Binhai New Area, Tianjin

Patentee after: TJU BINHAI INDUSTRIAL RESEARCH INSTITUTE CO.,LTD.

Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92

Patentee before: Tianjin University

TR01 Transfer of patent right
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210810

Assignee: Tianjin Jianjing Engineering Management Co.,Ltd.

Assignor: TJU BINHAI INDUSTRIAL RESEARCH INSTITUTE CO.,LTD.

Contract record no.: X2022120000067

Denomination of invention: Molecular Property Prediction Method Based on Attention Neural Network Model of Molecular Spatial Position Coding

Granted publication date: 20220513

License type: Common License

Record date: 20221222

EE01 Entry into force of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Tianjin Jianjing Engineering Management Co.,Ltd.

Assignor: TJU BINHAI INDUSTRIAL RESEARCH INSTITUTE CO.,LTD.

Contract record no.: X2022120000067

Date of cancellation: 20231017

EC01 Cancellation of recordation of patent licensing contract
OL01 Intention to license declared