CN112382347B - 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法 - Google Patents

基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法 Download PDF

Info

Publication number
CN112382347B
CN112382347B CN202011290851.6A CN202011290851A CN112382347B CN 112382347 B CN112382347 B CN 112382347B CN 202011290851 A CN202011290851 A CN 202011290851A CN 112382347 B CN112382347 B CN 112382347B
Authority
CN
China
Prior art keywords
target protein
drug combination
neural network
molecular fingerprint
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011290851.6A
Other languages
English (en)
Other versions
CN112382347A (zh
Inventor
於东军
庄驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202011290851.6A priority Critical patent/CN112382347B/zh
Publication of CN112382347A publication Critical patent/CN112382347A/zh
Application granted granted Critical
Publication of CN112382347B publication Critical patent/CN112382347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提出了一种基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,首先使用ChemoPy工具包进行药物化合物分子指纹特征计算,然后利用PSI‑BLAST和PSI‑PRED软件对癌细胞系的多治疗靶点蛋白进行特征抽取;在此基础上,将药物化合物分子指纹特征和癌细胞系的多治疗靶点蛋白特征输入两阶段深度卷积神经网络,以多分类交叉熵损失函数作为目标进行网络训练及预测。本发明提高了协同抗癌药物组合的预测精度,加快了协同抗癌药物组合的识别速度。

Description

基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法
技术领域
本发明属于生物信息学药物疾病作用分析技术,具体为一种基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法。
背景技术
药物协同作用是指药物组合作用时疗效超出各成分药单独作用时的疗效之和。随着人类对于癌症等重大疾病的致病因素及治疗途径的进一步认知,组合用药方法正以其副作用低、疗效持久的特点成为癌症治疗中的主流用药方式。药物组合的相互作用根据疗效可划分为加性作用、拮抗作用、协同作用。识别药物与药物之间的相互作用,特别是协同作用,对于最大限度地发挥药物治疗效果具有重要意义。
传统的临床分析等湿实验方法借助药理学相似性分析、临床副作用分析等数据进行协同药物组合的手动筛查。该方法具有成本高昂、实验周期长的重大缺陷,面对数以万计的新型小分子化合物显得力不从心。
迄今为止,国内外的研究者提出了各种协同药物组合的自动化预测方法,这些方法从原理上可以大致分为两类:基于系统生物学的方法和基于机器学习的方法。
基于系统生物学的协同药物组合预测方法主要是采用数学建模的方法结合系统生物学知识,对细胞内的网络状态和结构进行建模并预测协同药物组合。具体而言,可依据药物化合物的药理学相似性对药物进行打分,并结合药物的部分剂量-反应数据,进行组合作用曲线的拟合。根据拟合出的组合作用曲线,判断该药物组合方式是否具有协同作用。如目前常用的协同作用得分软件TIMMA-R,通常就是采用系统生物学方法,利用Loewe可加性对协同药物组合得分进行计算的。但是,基于系统生物学的协同作用预测方法需要事先通过实验方式了解大量关于细胞及药物作用关系的先验信息,而且先验信息的丰富程度极大地影响着该方法的预测精确度。因此基于系统生物学的协同作用预测方法的泛化性有待提高。
近年来,机器学习、深度学习技术的发展,给生物信息学领域带来了巨大的变革。基于矩阵分解、深度神经网络等方法的计算模型被应用于协同药物组合发现领域并取得了丰硕成果。芬兰的研究人员采用基于矩阵分解的机器学习方法,实现了针对癌症、疟疾、埃博拉等多个重大疾病的协同药物组合的高精度预测模型;基于矩阵分解的方法的预测性能同样严重依赖于先验数据集的丰富程度,而且易受到噪声干扰;若数据集中存在少量数据异常点,则基于矩阵分解的方法的预测性能将会显著降低。中国的研究人员采用基于深度神经网络的方法,结合门控循环单元及卷积单元进行协同作用预测,该方法实现了对于药物与疾病间作用关系的准确分析,但门控循环单元的引入带来了模型复杂度的显著提升,预测非常耗时。
发明内容
本发明的目的在于提出了一种基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法。
实现本发明目的的技术方案为:一种基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,具体步骤为:
步骤1:计算药物化合物的分子指纹特征;
步骤2:查询与癌细胞系相关的治疗靶点基因的治疗靶点蛋白序列,根据各治疗靶点蛋白序列获得蛋白序列的位置特异性得分矩阵和蛋白质二级结构得分,并将位置特异性得分矩阵和蛋白质二级结构得分串联得到癌细胞系的多靶点蛋白特征;
步骤3:将多靶点蛋白特征输入深度卷积神经网络进行训练,所述深度卷积神经网络包括第一阶段的卷积神经网络、第二阶段的深度神经网络以及Softmax分类层,所述第一阶段的卷积神经网络对多靶点蛋白特征进行卷积运算,卷积运算的输出和药物化合物的分子指纹特征进行串联后输入第二阶段的深度神经网络进行预测识别;
步骤4:对于未知作用关系的药物组合及癌细胞系,依据步骤1、2分别提取药物化合物的分子指纹特征和癌细胞系的多靶点蛋白特征;将药物化合物的分子指纹特征和癌细胞系的多靶点蛋白特征分别输入训练好的深度神经网络,获得药物组合对于给定癌细胞系的协同作用预测结果。
优选地,使用ChemoPy工具包结合药物化合物的SMILE分子表达式计算分子指纹特征。
优选地,所述卷积神经网络包括若干个串联的卷积网络块,每个卷积网络块由2个卷积层与1个池化层组成。
优选地,所述卷积网络块的个数为5个,每个卷积网络块的卷积输出通道数分别为16、32、64、128、128。
优选地,所述卷积层采用3×3的小卷积核进行卷积运算,所述池化层采用2×2的小池化核进行池化运算。
优选地,所述深度神经网络由分别含有4096、1024、256个节点的全连接层构成。
优选地,所述Softmax分类层采用多分类交叉熵损失函数,具体为:
Figure BDA0002783753420000031
公式中,N表示样本总数;K表示总体类别数目;yi,k表示第i个样本是否属于第k类,属于为1,不属于为0;pi,k表示第i个样本属于第k类的概率值。
本发明与现有方法相比,其显著优点在于:
(1)提高了协同抗癌药物组合的预测精度:本发明使用分子指纹特征及多治疗靶点蛋白特征作为药物及癌细胞系的量化表达,以多分类交叉熵损失函数为目标训练两阶段深度卷积神经网络,使得模型可以自动从癌细胞系及药物化合物的组成中学习到复杂的作用关系,提高了协同抗癌药物组合的预测精度;
(2)加快了协同抗癌药物组合的识别速度:本发明采用的深度卷积神经网络虽然训练耗时,但是利用训练好的网络模型权重进行预测则非常方便快捷;若采用GPU进行计算加速,预测速度还会进一步增加,极大地提升了协同抗癌药物组合的识别效率。
附图说明
图1为深度卷积神经网络的网络结构示意图。
图2为本发明的具体实现流程示意图。
具体实施方式
为了更好的了解本发明的技术内容,下面结合附图对本发明作进一步的说明。
图2给出了基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法的具体实现流程示意图。结合图2给出本发明的具体过程:首先使用ChemoPy工具包进行药物化合物分子指纹特征计算,然后利用PSI-BLAST和PSI-PRED软件对癌细胞系的多治疗靶点蛋白进行特征抽取;在此基础上,将药物化合物分子指纹特征和癌细胞系的多治疗靶点蛋白特征输入两阶段深度卷积神经网络,以多分类交叉熵损失函数作为目标进行网络训练及预测。下面结合附图所示,更加具体地描述过程。
步骤1:药物特征提取,使用ChemoPy工具包结合药物化合物的SMILE分子表达式计算分子指纹特征,得到药物化合物的特征表达向量,维度为1×1024;
步骤2:癌细胞系特征提取,对于癌细胞系,在Cell Model Passports数据库中查询与之相关的治疗靶点基因,并在Uniprot数据库中查询各治疗靶点基因表达的治疗靶点蛋白序列,将各治疗靶点蛋白序列输入到PSI-BLAST和PSI-PRED软件中,得到蛋白序列的位置特异性得分矩阵PSSM和蛋白质二级结构得分PSS,并将位置特异性得分矩阵和蛋白质二级结构得分串联得到癌细胞系的多靶点蛋白特征MTPF,维度为115×1279×1;
步骤3:将多靶点蛋白特征输入深度卷积神经网络使用随机梯度下降算法进行充分训练,选取最优模型保存。
先将步骤2中的多靶点蛋白特征使用深度卷积神经网络进行卷积运算,对癌细胞系多靶点蛋白特征MTPF进行降维,得到维度为3×39×128的精炼特征输出;然后将卷积网络块的输出和药物化合物的分子指纹特征进行串联,经由全连接层进行预测识别;网络以多分类交叉熵损失作为目标函数。
公式(1)表示二分类交叉熵损失函数,公式(2)表示多分类交叉熵损失函数。由于数据集的不平衡性,很容易出现少数类样本被多数类样本淹没的情况,也就是网络将全部的测试样本都预测为负类样本,从而失去预测意义。二分类交叉熵损失函数意味着待测样本只能属于正类或负类,分属于两类的概率和严格等于1,这就限制了网络对于样本归属类别的表达能力;而多分类交叉熵损失函数将原问题视为多标签分类问题,允许一个样本同属于两种类别,分属于两类的概率和不严格等于1;例如,某样本预测为负类的概率可能为0.51,预测为正类的概率可能为0.52,可见网络对于样本属于少数类的可能性也做出了充分的表达。最终样本的标签,由具有较大概率的类别决定。
Figure BDA0002783753420000051
Figure BDA0002783753420000052
公式中,N表示样本总数;K表示总体类别数目;yi,k表示第i个样本是否属于第k类,属于为1,不属于为0;pi,k表示第i个样本属于第k类的概率值。
如图1所示,进一步的实施例中,所述深度卷积网络框架具体包括:
输入层:输入层读取维度为115×1279×1的数据作为输入矩阵进行进一步运算,其中115代表预先设置的每种癌细胞系的靶点蛋白数目,1279代表固定的蛋白序列长度,超出该长度的靶点蛋白序列予以截断,不足该长度的蛋白序列以0填充,1代表数据通道数;
第一阶段的卷积神经网络:所述卷积神经网络包括若干个串联的卷积网络块。每个卷积网络块由2个卷积层与1个池化层组成,卷积层的作用在于对输入数据提取潜在的空间结构信息,池化层的作用在于对数据进行降维。为了减少计算量,本发明采用3×3的小卷积核进行卷积运算,采用2×2的小池化核进行池化运算。两层带有3×3卷积核的卷积层的堆叠,可以达到5×5的大卷积核的感受野效果,同时具有更小的计算量;而带有2×2池化核的池化层,可以将输入数据维度降为原来的一半,显著减少数据冗余,提升特征有效性。为了达到深度卷积神经网络性能和速度的最佳平衡,本发明方法采用5个卷积网络块串联为整个网络,每个卷积网络块的卷积输出通道数分别为16、32、64、128、128。
第二阶段的深度神经网络:第一阶段的卷积神经网络,会将原始的高维度多靶点蛋白特征降低为原本维度的1/256;在此基础上,将卷积神经网络的输出平展为一维向量,并与药物化合物分子指纹特征进行串联,然后输入全连接层进行深度神经网络的构建;本发明采用分别含有4096、1024、256个节点的全连接层构建第二阶段的深度神经网络。
Softmax分类层:该层采用多分类交叉熵损失函数取代二分类交叉熵损失函数,对本发明的协同作用二分类问题进行预测。由于实际数据中的样本分布不平衡性,多数类样本会显著影响少数类的预测性能。多分类交叉熵损失函数有助于解决样本分布不平衡带来的影响。
步骤4:协同药物组合预测,对于未知作用关系的药物组合及癌细胞系,依据步骤1、2分别提取药物化合物的分子指纹特征和癌细胞系的多靶点蛋白特征;加载步骤3中训练好的深度神经网络参数,将药物化合物的分子指纹特征和癌细胞系的多靶点蛋白特征分别输入网络,网络的输出即为该药物组合对于给定癌细胞系的协同作用预测结果。
本发明利用化合物分子指纹特征及癌细胞系的多治疗靶点蛋白特征,结合两阶段深度卷积神经网络及多分类交叉熵损失函数进行协同药物组合预测,具有相似化学组成结构的药物化合物在功能上也具有相似性,通过分析已知治疗靶点及药物化合物间的关系,有助于预测药物组合的协同作用。本发明充分挖掘了药物化合物和特定类型的癌细胞系间复杂的作用关系,提高了协同药物组合预测的精度和效率。
为了更加准确地识别协同药物组合,使得整个预测过程可以端到端地从药物化合物及疾病治疗靶点中学习到协同的药物组合信息,同时为了保证提取的特征具有良好的鉴别性,本发明使用分子指纹及癌细胞系的多治疗靶点蛋白特征,结合两阶段深度卷积神经网络及多分类交叉熵损失函数来预测具有协同作用的药物组合。
综上所述,本发明结合高效的化合物分子指纹特征及癌细胞系的多治疗靶点蛋白信息,充分挖掘了药物与治疗靶点间的交互关系,而且速度明显快于其他方法,识别正确率显著提高。

Claims (7)

1.一种基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,具体步骤为:
步骤1:计算药物化合物的分子指纹特征;
步骤2:查询与癌细胞系相关的治疗靶点基因的治疗靶点蛋白序列,根据各治疗靶点蛋白序列获得蛋白序列的位置特异性得分矩阵和蛋白质二级结构得分,并将位置特异性得分矩阵和蛋白质二级结构得分串联得到癌细胞系的多靶点蛋白特征;
步骤3:将多靶点蛋白特征输入深度卷积神经网络进行训练,所述深度卷积神经网络包括第一阶段的卷积神经网络、第二阶段的深度神经网络以及Softmax分类层,所述第一阶段的卷积神经网络对多靶点蛋白特征进行卷积运算,卷积运算的输出和药物化合物的分子指纹特征进行串联后输入第二阶段的深度神经网络进行预测识别;
步骤4:对于未知作用关系的药物组合及癌细胞系,依据步骤1、2分别提取药物化合物的分子指纹特征和癌细胞系的多靶点蛋白特征;将药物化合物的分子指纹特征和癌细胞系的多靶点蛋白特征分别输入训练好的深度神经网络,获得药物组合对于给定癌细胞系的协同作用预测结果。
2.根据权利要求1所述的基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,使用ChemoPy工具包结合药物化合物的SMILE分子表达式计算分子指纹特征。
3.根据权利要求1所述的基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,所述卷积神经网络包括若干个串联的卷积网络块,每个卷积网络块由2个卷积层与1个池化层组成。
4.根据权利要求3所述的基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,所述卷积网络块的个数为5个,每个卷积网络块的卷积输出通道数分别为16、32、64、128、128。
5.根据权利要求3所述的基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,所述卷积层采用3×3的小卷积核进行卷积运算,所述池化层采用2×2的小池化核进行池化运算。
6.根据权利要求1所述的基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,所述深度神经网络由分别含有4096、1024、256个节点的全连接层构成。
7.根据权利要求1所述的基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法,其特征在于,所述Softmax分类层采用多分类交叉熵损失函数,具体为:
Figure FDA0002783753410000021
公式中,N表示样本总数;K表示总体类别数目;yi,k表示第i个样本是否属于第k类,属于为1,不属于为0;pi,k表示第i个样本属于第k类的概率值。
CN202011290851.6A 2020-11-17 2020-11-17 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法 Active CN112382347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011290851.6A CN112382347B (zh) 2020-11-17 2020-11-17 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011290851.6A CN112382347B (zh) 2020-11-17 2020-11-17 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法

Publications (2)

Publication Number Publication Date
CN112382347A CN112382347A (zh) 2021-02-19
CN112382347B true CN112382347B (zh) 2022-09-06

Family

ID=74584099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011290851.6A Active CN112382347B (zh) 2020-11-17 2020-11-17 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法

Country Status (1)

Country Link
CN (1) CN112382347B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927766B (zh) * 2021-03-29 2022-11-01 天士力国际基因网络药物创新中心有限公司 一种疾病组合药物筛选的方法
CN113450870B (zh) * 2021-06-11 2024-05-14 北京大学 一种药物与靶点蛋白的匹配方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658989A (zh) * 2018-11-14 2019-04-19 国网新疆电力有限公司信息通信公司 基于深度学习的类药化合物毒性预测方法
CN110289050A (zh) * 2019-05-30 2019-09-27 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN110689965A (zh) * 2019-10-10 2020-01-14 电子科技大学 一种基于深度学习的药物靶点亲和力预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658989A (zh) * 2018-11-14 2019-04-19 国网新疆电力有限公司信息通信公司 基于深度学习的类药化合物毒性预测方法
CN110289050A (zh) * 2019-05-30 2019-09-27 湖南大学 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN110689965A (zh) * 2019-10-10 2020-01-14 电子科技大学 一种基于深度学习的药物靶点亲和力预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Predicting drug-target interactions from drug structure and protein sequence using novel convolutional neural networks;ShanShan Hu等;《BMC Bioinformatics》;20181104;第1-12页 *
药物-靶标相互作用与亲和力的预测研究;张程林;《中国优秀硕士论文全文数据库》;20200715;第10-23页 *

Also Published As

Publication number Publication date
CN112382347A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN107577924B (zh) 一种基于深度学习的长链非编码rna亚细胞位置预测方法
Maulik et al. Simulated annealing based automatic fuzzy clustering combined with ANN classification for analyzing microarray data
CN112382347B (zh) 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法
CN116092598B (zh) 基于流形正则化非负矩阵分解的抗病毒药物筛选方法
CN111370073B (zh) 一种基于深度学习的药物互作规则预测方法
Malebary et al. Identification of Antimicrobial Peptides Using Chou's 5 Step Rule.
CN112599187B (zh) 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
CN114091603A (zh) 一种空间转录组细胞聚类、分析方法
Alkaragole et al. Comparison of data mining techniques for predicting diabetes or prediabetes by risk factors
Chen Long sequence feature extraction based on deep learning neural network for protein secondary structure prediction
Babu et al. A comparative study of gene selection methods for cancer classification using microarray data
CN113223609B (zh) 基于异质信息网络的药物靶标相互作用预测方法
Morovvat et al. An ensemble of filters and wrappers for microarray data classification
CN113178234A (zh) 一种基于神经网络和连接图算法的化合物功能预测方法
CN110534153B (zh) 基于深度学习的靶标预测系统及其方法
CN114999566B (zh) 基于词向量表征和注意力机制的药物重定位方法及系统
CN115810397A (zh) 一种藤梨根有效成分靶点分子预测模型的构建方法
Bhadra et al. Unsupervised feature selection using an integrated strategy of hierarchical clustering with singular value decomposition: an integrative biomarker discovery method with application to acute myeloid leukemia
Moulavi et al. Combining gene expression and interaction network data to improve kidney lesion score prediction
CN114662657A (zh) 一种多项式树突神经网络及其预测方法
Chowdhury et al. Cell type identification from single-cell transcriptomic data via gene embedding
Bagyamani et al. Biological significance of gene expression data using similarity based biclustering algorithm
Sridhar et al. Interrelating N-gram based protein sequences using LSTMs with parallel capsule routing
Sun et al. An enhanced LRMC method for drug repositioning via gcn-based HIN embedding
Wang et al. A review on predicting subcellular localization of lncRNA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant