CN111429977B - 一种新的基于图结构注意力的分子相似性搜索算法 - Google Patents

一种新的基于图结构注意力的分子相似性搜索算法 Download PDF

Info

Publication number
CN111429977B
CN111429977B CN201910839118.6A CN201910839118A CN111429977B CN 111429977 B CN111429977 B CN 111429977B CN 201910839118 A CN201910839118 A CN 201910839118A CN 111429977 B CN111429977 B CN 111429977B
Authority
CN
China
Prior art keywords
molecular
similarity
attention
molecules
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910839118.6A
Other languages
English (en)
Other versions
CN111429977A (zh
Inventor
魏志强
李臻
王爽
乔木
张树刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Marine Science And Technology Center
Ocean University of China
Original Assignee
Ocean University of China
Qingdao National Laboratory for Marine Science and Technology Development Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China, Qingdao National Laboratory for Marine Science and Technology Development Center filed Critical Ocean University of China
Priority to CN201910839118.6A priority Critical patent/CN111429977B/zh
Publication of CN111429977A publication Critical patent/CN111429977A/zh
Application granted granted Critical
Publication of CN111429977B publication Critical patent/CN111429977B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种新的基于图结构注意力的分子相似性搜索算法,包括如下步骤:步骤1、使用相似分子作为预训练数据,通过图卷积神经网络将相似分子表达为分子图的格式,在图卷积神经网络中引入了注意力机制,将分子图转换为特征向量;步骤2、通过训练得到公式中的参数,得到相似性计算公式;步骤3、采用步骤1的方法,将新的分子表达为新分子图的格式,并将新的分子图转换为新的特征向量,通过相似性计算公式进行相似性计算,得到相似性得分,借此,本发明具有在保证了搜索广泛性的同时,提高了分子相似性计算的准确度的优点。

Description

一种新的基于图结构注意力的分子相似性搜索算法
技术领域
本发明属于分子相似性搜索领域,特别涉及一种新的基于图结构注意力的分子相似性搜索算法。
背景技术
目前,随着信息技术的快速发展,计算机在药物发掘领域中信息化手段扮演的角色越来越重要。近年来人工智能的发展,为药物发掘工作带来了更多的可能性。分子相似性搜索是药物小分子发掘工程中一项重要的技术,它为许多现有的虚拟筛选技术奠定了理论基础,在发掘药物小分子的过程中,通过已知小分子搜索相似性的小分子是一种常用的筛选手段。
在化学分析中,基于相似性的物化性质分析、相似相溶原理等等都是以
“具有相似结构的化合物一般也具有相似的物理化学性质”为基础。分子相似性作为化学信息学中的最重要的主题之一,是指两个分子或化合物在结构上的相似程度。基于计算机模拟的筛选方法在很大程度上可以归结于对小分子理化特征和结构信息的提取、分析和比较。进行筛选操作的基础便是首先将化合物分子转换成为一种机器可以识别的表示形式。现有的许多相似度计算方法并非直接作用于分子的原始表示形式,而是首先需要将化合物分子的理化特性与结构信息用分子描述符的形式表示出来,因为只有这样才能使用物理或者数学模型对分子的特征进行评价和比较。目前,在药学研究领域每年都会有数量庞大的不同分子描述符被报道。
在计算化学领域,相似系数法是比较常用的一种方法,利用相似系数如先行代码,最大相似邻接关系法,股本距离等计算分子相似程度。现在常用的谷本距离是先将分子用分子指纹的方式表达出来,在计算分子指纹的谷本系数。分子指纹常用的如ECFP4是二进制格式的2D分子结构的表征。通过分子指纹之间的重叠来计算分子之间的结构相似性,2D指纹方法由于其计算效率和有效性而成为基于2D相似性的虚拟筛选的选择方法,广泛使用的谷本系数公式。
但是,现有技术的第一个主要缺点是分子指纹种类很多,两个数据集的分子指纹不能拿来直接用,给实验计算造成了一定难度,限制了大批量计算时的计算速度。
从搜索方法来看,现在的分子检索方法都是基于相似结构的搜索方法,在搜索分子时,需要保留查询分子所需要的生物活性,作为搜索模板,但去除其中的缺点。但是由于分子数据库中的数据量十分巨大,一个分子需要进行指数大小的增量实验,这就使运算时间大大增加,限制了使用形状识别方法的速度。由于我们想要覆盖更大的搜索空间,尽可能地覆盖生物相关的化学空间,提高寻找到可能分子的可能性。因此,尽可能快的筛选分子数据库是非常重要的。
发明内容
本发明提出一种新的基于图结构注意力的分子相似性搜索算法,能够在保证了搜索广泛性的同时,提高了分子相似性计算的准确度。
本发明的技术方案是这样实现的:一种新的基于图结构注意力的分子相似性搜索算法,包括如下步骤:
步骤1、使用相似分子作为预训练数据,通过图卷积神经网络将相似分子表达为分子图的格式,在图卷积神经网络中引入了注意力机制,将分子图转换为特征向量;
步骤2、通过训练得到公式中的参数,得到相似性计算公式;
步骤3、采用步骤1的方法,将新的分子表达为新分子图的格式,并将新的分子图转换为新的特征向量,通过相似性计算公式进行相似性计算,得到相似性得分。
作为一种优选的实施方式,图卷积神经网络将卷积核设置为:
H(l+1)=σ(AH(l)W(l))
H(l+1):表示节点在第1层的特征表达;
σ():表示激活函数;
A:表示邻接矩阵;
W(l):表示第1层的卷积权重。
作为一种优选的实施方式,特征向量使用余弦相似性计算分子的相似度,并将其结果作为训练数据,通过训练得到所述相似性计算公式,其余弦相似性计算的公式为:
其中,A,B代表两个相似分子提取出的特征向量,Ai,Bi分别代表两个向量中的各分量。
作为一种优选的实施方式,在相似性计算公式中引入分子指纹的计算结果,其公式为:
其中,k是相似策略的编号,wk是策略k的权重,simk是第k个策略计算的相似度结果。
作为一种优选的实施方式,引入分子指纹的计算结果后,采用梯度下降算法,优化得出E最小的权向量,计算过程为:
w←w+Δw
实际计算中:
其中η为学习效率,控制梯度下降的步长,梯度下降最快按照比例修改向量w中的每一个分量来实现,E为训练值和假设预测值之间的平方和,是关于权重向量w的函数。
作为一种优选的实施方式,步骤2中训练之前,需要确定神经网格的输入以及正负样本,将下载得到的分子转变为使用相同smiles格式的分子数据,之后将smiles格式的分子转为分子图,采用相同的标准,同时保留分子的理化性质存储在数据库中,作为测定的验证信息使用,使用rdkit中的股本距离方法,对分子的分子指纹进行计算,得到的得分作为训练时的训练数据,验证分子相似程度以及算法的效果。
作为一种优选的实施方式,步骤3中设定相似性得分的阈值为0.8。
采用了上述技术方案后,本发明的有益效果是:
1、本专利使用的方法较传统的方法相比,由于使用的分子描述符是图结构的分子数据,可以将不同分子数据库的数据转化为同一种通用的结构,这样在搜索时就可以使用多个数据库的数据,保证了搜索的广泛性。
2、另外,在计算方法上看,本专利使用的计算方法使用分子性质的相似程度来训练算法,提高了分子相似性计算的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的构成框图;
图2为异戊烷和新戊烷的结构示意图;
图3为节点特征示意图;
图4为multi-head attention的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1至图4所示,一种新的基于图结构注意力的分子相似性搜索算法的中心是相似性计算公式,它通过使用相似分子作为预训练数据,训练得到公式中的参数。使用训练得到的公式对输入的分子图进行相似性计算,得到两个分子相似性得分。
使用现有的方法将分子图转为特征向量,在本方法内对现有的算法进行改造,在转换过程中引入了注意力机制,将原子间的互相作用记录在特征向量中。本算法的核心是对图卷积技术的充分利用,由于化学分子图的特殊性,使用一般常用的卷积神经网络效果不佳,所以使用图卷积及神经网络处理就有天然的优势。
由于分子的数据特征,并不是简单的二维结构,在计算机应用是并不能简单的使用卷积神经网络来处理分子数据。而对于分子数据的特殊性,将分子数据看为一个图结构数据,能很好的处理这个问题。
每个节点都有自己的特征信息。比如在化合物分子图中,顶点对应化合物的原子,边对应于化学键,顶点用相应原子的种类标记,边用键的类型标记。原子的电荷数、种类、分子量等信息都能够被用来计算化学性质,而不同的原子都被存储在本节点中。对于特定的任务,允许忽略任何标签。
图谱中的每个节点都具有分子的结构信息。对于在计算化学里,作为一种用来处理分子数据的描述符,想要保证计算的准确性就必须要考虑到分子同分异构、手性等特性,所以必须要保存完整的结构信息。而分子图的定义能够区分结构异构体,例如具有相同分子式但非同构图的化合物如异戊烷和新戊烷,如图2所示,虽然在分子式上看两者一样,但是在图结构上看是完全不一样的。
图卷积神经网络(Graph Convolutional Network)是一种能对图数据进行深度学习的方法。将卷积核设置为:
H(l+1)=σ(AH(l)W(l))
H(l+1)表示节点在第l层的特征表达,其中σ()表示激活函数,A表示邻接矩阵,W(l)表示第l层的卷积权重。例如,现假设原子2的邻接原子由1,3和4号,则结点状态的更新式如下:
在图卷卷积神经网络中,第一步是将分子表达为分子图的格式,将分子中对化学性质起重要作用的原子、官能团、侧链等用节点表示,将节点特征信息保存在节点中,经过变换后发送给邻居节点,对节点的特征信息进行抽取变换。然后节点将邻居节点的特征信息收集到一起,融合节点的局部结构信息,进行信息融合。在对收集到信息进行提取,一般经过几层的特征提取,就可以提取到整个分子的特征表达。
该卷积过程意味着所用的原子特征将和相同的卷积权重相乘,相加后作为激活函数的输入,而激活函数的输出则表示当前节点的新状态信息。这样做的优点在于:
1、卷积核的权重参数比较少;
2、更新式中,用拉普拉斯矩阵进行变换,计算复杂度为O(n);
3、卷积核具有很好的空间定位性,特别的,设K为卷积核的感知域,也就是说每次卷积会将中心定点K-hop邻点上的feature进行加权求和,权系数α_k;
4、训练是端对端训练,可以同时对节点特征和结构信息进行学习,适用性更广。
另外,分子图学习策略上,为了使图卷积神经网络解决不同大小输入的问题,首先从图中选择一个固定的节点序列,确定图的中心原子,再对序列中的每个节点,收集固定大小的邻域集合,以不同的半径汇集周围邻接节点的信息,在对当前的邻域进行规范化,作为卷积层的输入,覆盖图的大部分信息,再将得到的向量输入进下一层做进一步的处理。
人类视觉系统在识别物体时,通过快速扫描全局图像,获取需要重点关注的目标区域,就是我们通常所说的焦点,通过的重点区域投入更更多的注意力资源,获得更多的信息,在长久的自然进化中,人类的注意力机制极大地提高了人类对视觉信息处理的速度和准确性。深度学习中的注意力机制就是借鉴了人类选择性视觉注意力机制,也是从众多信息中选择需要重点关注的信息,并进行相应的处理。
为了使模型可以学习分子中各个原子间的关系,在图卷积中引入注意力机制,与一般的图卷积不同,使用注意力机制替代了图卷积中固定的标准化操作。如图3所示对第n层节点特征做更新并得到n+1层节点特征,首先对n层节点嵌入进行先行变换,之后计算节点间的原始注意力分数。拼接两个节点的嵌入结果,并对拼接好的嵌入加入一个科学系的权重向量做点积,通过激活函数引入注意力。最后通过softmax操作得到注意力权重。与此相同,之后再对邻接节点的所有节点的特征做基于注意力的加权求和。
如图4所示,我们发现multi-head attention非常有益于稳定self-attention的学习过程,可参考论文Attention is all you need,即,该层的操作被独立复制k次(每个replica有不同的参数),并且输出是按特征聚集的(通常通过连接或添加)。
其中,是由第k个replica得出的注意力系数,Wk是第k个replica线性变换的权重矩阵,通过前面几节的设置,这完全指定了GAT层。
本发明中引入了注意力机制,主要用于增强模型对分子中原子间的性质,使用注意力机制代替了图卷积中固定的标准化操作,首先对分子中的原子节点采用自注意力模型,通过只允许节点i关注邻域节点来学习图结构,之后再使用softmax函数对这些系数进行归一化,以便在不同邻域之间进行选择,此外,由于multi-head attention对于稳定自注意力模型的学习的帮助十分大,即特定层的操作被独立复制k次,最后的输出是按特征聚集的。
当引入注意力机制到图卷积模型之后,可以通过新的注意力图卷积层自动学习不用邻居节点的重要性,可以加快模型的训练速度,提高准确性。
在训练之前,需要确定神经网络的输入以及正负样本。首先,由于小分子数据库的种类多种多样,描述分子时采用的数据结构会有些许不同,为了保证训练的一致性,需要对分子数据进行相应的处理。将下载得到的分子转变为使用相同smiles格式的分子数据,之后将smiles格式的分子转为分子图,采用相同的标准,同时保留分子的理化性质存储在数据库中,作为测定的验证信息使用,使用rdkit中的股本距离方法,对分子的分子指纹进行计算,得到的得分作为训练时的训练数据,验证分子相似程度以及算法的效果。
使用训练的得到的分子图特征向量,再使用余弦相似性计算分子的相似度。余弦相似性是指通过计算两个向量的夹角来度量它们之间的相似性。余弦值的范围从-1到1,两个向量夹角为0°时余弦值为1,夹角为90°时余弦值为0,方向完全相反时余弦值为-1,通常情况下,余弦相似度用于正空间上,得到的值通常在0到1之间,公式为:
其中,A,B代表两个分子经模型提取出的特征向量,Ai,Bi分别代表两个向量中的各分量。
之后,将余弦相似性的结果作为训练数据,训练得到相似度计算公式模型,在模型中引入分子指纹的计算结果,提高计算准确性。公式如下:
其中,k是相似策略的编号,wk是策略k的权重,simk是第k个策略计算的相似度结果。
引入分子指纹的计算结果后,采用梯度下降算法,优化得出E最小的权向量,计算过程为::
w←w+Δw
实际计算中,
其中η为学习效率,控制梯度下降的步长,梯度下降最快按照比例修改向量w中的每一个分量来实现,E为训练值和假设预测值之间的平方和,是关于权重向量w的函数。
为了验证算法的可行性,使用100对已经验证过的分子对进行验证,该数据集来自2014年,Pedro Franco等人发表在《Journal of Cheminformatics》上的论文,作者邀请了143名专家,从DrugBank中挑选了100对分子,请专家判断是否两个分子式相似的,然后统计结果,同时在表中记录两个分子使用ECFP4指纹计算的Tanimoto系数。最终经过模型的处理,便可以得到两个分子相似的分数。为了确保最终得到分数是准确的,本发明将阈值设置为0.8,也就是当分子相似性打分值大于0.8时,就确认其属于相似,反之不属于。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,包括如下步骤:
步骤1、使用相似分子作为预训练数据,通过图卷积神经网络将相似分子表达为分子图的格式,在图卷积神经网络中引入了注意力机制,将分子图转换为特征向量;
步骤2、通过训练得到公式中的参数,得到相似性计算公式;
步骤3、采用步骤1的方法,将新的分子表达为新分子图的格式,并将新的分子图转换为新的特征向量,通过相似性计算公式进行相似性计算,得到相似性得分;
所述步骤1中图卷积神经网络将卷积核设置为:
H(l+1)=σ(AH(l)W(l))
H(l+1):表示节点在第1层的特征表达;
σ():表示激活函数;
A:表示邻接矩阵;
W(l):表示第1层的卷积权重;
在相似性计算公式中引入分子指纹的计算结果,其公式为:
其中,k是相似策略的编号,wk是策略k的权重,simk是第k个策略计算的相似度结果;
首先对n层节点嵌入进行先行变换,之后计算节点间的原始注意力分数,拼接两个节点的嵌入结果,并对拼接好的嵌入权重向量做点积,通过激活函数引入注意力,最后通过softmax操作得到注意力权重,输出公式为:
其中,是由第k个replica得出的注意力系数,Wk是第k个replica线性变换的权重矩阵,通过前面几节的设置,这完全指定了GAT层。
2.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述特征向量使用余弦相似性计算分子的相似度,并将其结果作为训练数据,通过训练得到所述相似性计算公式,其余弦相似性计算的公式为:
其中,A,B代表两个相似分子提取出的特征向量,Ai,Bi分别代表两个向量中的各分量。
3.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述引入分子指纹的计算结果后,采用梯度下降算法,优化得出E最小的权向量,计算过程为:
w←w+Δw
实际计算中:
其中η为学习效率,控制梯度下降的步长,梯度下降最快按照比例修改向量w中的每一个分量来实现,E为训练值和假设预测值之间的平方和,是关于权重向量w的函数。
4.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述步骤2中训练之前,需要确定神经网格的输入以及正负样本,将下载得到的分子转变为使用相同smiles格式的分子数据,之后将smiles格式的分子转为分子图,采用相同的标准,同时保留分子的理化性质存储在数据库中,作为测定的验证信息使用,使用rdkit中的股本距离方法,对分子的分子指纹进行计算,得到的得分作为训练时的训练数据,验证分子相似程度以及算法的效果。
5.根据权利要求1所述的一种新的基于图结构注意力的分子相似性搜索算法,其特征在于,所述步骤3中设定相似性得分的阈值为0.8。
CN201910839118.6A 2019-09-05 2019-09-05 一种新的基于图结构注意力的分子相似性搜索算法 Active CN111429977B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910839118.6A CN111429977B (zh) 2019-09-05 2019-09-05 一种新的基于图结构注意力的分子相似性搜索算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910839118.6A CN111429977B (zh) 2019-09-05 2019-09-05 一种新的基于图结构注意力的分子相似性搜索算法

Publications (2)

Publication Number Publication Date
CN111429977A CN111429977A (zh) 2020-07-17
CN111429977B true CN111429977B (zh) 2024-02-13

Family

ID=71546803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910839118.6A Active CN111429977B (zh) 2019-09-05 2019-09-05 一种新的基于图结构注意力的分子相似性搜索算法

Country Status (1)

Country Link
CN (1) CN111429977B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916143B (zh) * 2020-07-27 2023-07-28 西安电子科技大学 基于多样子结构特征融合的分子活性预测方法
CN111755078B (zh) * 2020-07-30 2022-09-23 腾讯科技(深圳)有限公司 药物分子属性确定方法、装置及存储介质
CN111949792B (zh) * 2020-08-13 2022-05-31 电子科技大学 一种基于深度学习的药物关系抽取方法
CN112132223B (zh) * 2020-09-27 2024-02-27 腾讯科技(深圳)有限公司 图池化方法、装置、设备以及存储介质
CN114417986A (zh) * 2022-01-11 2022-04-29 平安科技(深圳)有限公司 基于人工智能的药物特征信息确定方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016142285A1 (en) * 2015-03-06 2016-09-15 Thomson Licensing Method and apparatus for image search using sparsifying analysis operators
CN106649423A (zh) * 2016-06-23 2017-05-10 新乡学院 一种基于内容相关度的检索模型计算方法
CN106709277A (zh) * 2016-11-21 2017-05-24 南京邮电大学 基于文本挖掘的g蛋白偶联受体药物靶标分子的向量生成方法
CN107709576A (zh) * 2015-04-13 2018-02-16 优比欧迈公司 用于神经系统健康问题的微生物组来源的诊断和治疗的方法及系统
CN108205613A (zh) * 2017-12-11 2018-06-26 华南理工大学 一种化合物分子间相似度的计算方法及系统与它们的应用
CN108875298A (zh) * 2018-06-07 2018-11-23 北京计算科学研究中心 基于分子形状匹配的药物筛选方法
CN109389055A (zh) * 2018-09-21 2019-02-26 西安电子科技大学 基于混合卷积和注意力机制的视频分类方法
CN109712678A (zh) * 2018-12-12 2019-05-03 中国人民解放军军事科学院军事医学研究院 关系预测方法、装置及电子设备
CN109791797A (zh) * 2016-12-05 2019-05-21 智慧芽信息科技(苏州)有限公司 在大数据库中根据化学结构相似性搜索和显示可用信息的系统、装置和方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016142285A1 (en) * 2015-03-06 2016-09-15 Thomson Licensing Method and apparatus for image search using sparsifying analysis operators
CN107709576A (zh) * 2015-04-13 2018-02-16 优比欧迈公司 用于神经系统健康问题的微生物组来源的诊断和治疗的方法及系统
CN106649423A (zh) * 2016-06-23 2017-05-10 新乡学院 一种基于内容相关度的检索模型计算方法
CN106709277A (zh) * 2016-11-21 2017-05-24 南京邮电大学 基于文本挖掘的g蛋白偶联受体药物靶标分子的向量生成方法
CN109791797A (zh) * 2016-12-05 2019-05-21 智慧芽信息科技(苏州)有限公司 在大数据库中根据化学结构相似性搜索和显示可用信息的系统、装置和方法
CN108205613A (zh) * 2017-12-11 2018-06-26 华南理工大学 一种化合物分子间相似度的计算方法及系统与它们的应用
CN108875298A (zh) * 2018-06-07 2018-11-23 北京计算科学研究中心 基于分子形状匹配的药物筛选方法
CN109389055A (zh) * 2018-09-21 2019-02-26 西安电子科技大学 基于混合卷积和注意力机制的视频分类方法
CN109712678A (zh) * 2018-12-12 2019-05-03 中国人民解放军军事科学院军事医学研究院 关系预测方法、装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种改进的图像场景识别算法;申龙斌,李臻,魏志强,刘昊;中国海洋大学学报;全文 *

Also Published As

Publication number Publication date
CN111429977A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN111429977B (zh) 一种新的基于图结构注意力的分子相似性搜索算法
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN110070909B (zh) 一种基于深度学习的融合多特征的蛋白质功能预测方法
CN111931505A (zh) 一种基于子图嵌入的跨语言实体对齐方法
CN112733866A (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN108765383A (zh) 基于深度迁移学习的视频描述方法
CN110941734A (zh) 基于稀疏图结构的深度无监督图像检索方法
CN113571125A (zh) 基于多层网络与图编码的药物靶点相互作用预测方法
CN114925238B (zh) 一种基于联邦学习的视频片段检索方法及系统
CN110993037A (zh) 一种基于多视图分类模型的蛋白质活性预测装置
CN115148302A (zh) 一种基于图神经网络与多任务学习的化合物性质预测方法
CN114999565A (zh) 一种基于表示学习和图神经网络的药物靶标亲和力预测方法
CN115995293A (zh) 一种环状rna和疾病关联预测方法
CN114022687B (zh) 一种基于增强学习的图像描述对抗生成方法
CN118155746A (zh) 一种预测分子性质的双通道对比模型
Termritthikun et al. Evolutionary neural architecture search based on efficient CNN models population for image classification
CN109784404A (zh) 一种融合标签信息的多标签分类原型系统及方法
CN117828024A (zh) 一种插件检索方法、装置、存储介质及设备
CN109492770A (zh) 一种基于个性化关系排序的属性网络嵌入方法
CN116883746A (zh) 一种基于分区池化超图神经网络的图节点分类方法
CN116978464A (zh) 数据处理方法、装置、设备以及介质
CN116646001A (zh) 基于联合式跨域注意力模型预测药物靶标结合性的方法
WO2023148684A1 (en) Local steps in latent space and descriptors-based molecules filtering for conditional molecular generation
CN115905493A (zh) 一种基于共享编码和协同注意力的知识图谱问答方法
CN115862767A (zh) 基于图学习的抗lrrk2小分子药物预测和筛选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 238 Songling Road, Laoshan District, Qingdao City, Shandong Province

Patentee after: OCEAN University OF CHINA

Country or region after: China

Patentee after: Qingdao Marine Science and Technology Center

Address before: 266100 Shandong Province, Qingdao city Laoshan District Songling Road No. 238

Patentee before: OCEAN University OF CHINA

Country or region before: China

Patentee before: QINGDAO NATIONAL LABORATORY FOR MARINE SCIENCE AND TECHNOLOGY DEVELOPMENT CENTER

CP03 Change of name, title or address