CN106909807A - 一种基于多元数据预测药物靶向蛋白互作的预测方法 - Google Patents
一种基于多元数据预测药物靶向蛋白互作的预测方法 Download PDFInfo
- Publication number
- CN106909807A CN106909807A CN201710078030.8A CN201710078030A CN106909807A CN 106909807 A CN106909807 A CN 106909807A CN 201710078030 A CN201710078030 A CN 201710078030A CN 106909807 A CN106909807 A CN 106909807A
- Authority
- CN
- China
- Prior art keywords
- protein
- interaction
- drug
- database
- protein interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 83
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 83
- 239000003814 drug Substances 0.000 title claims abstract description 48
- 230000003993 interaction Effects 0.000 title claims abstract description 46
- 229940079593 drug Drugs 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000008685 targeting Effects 0.000 title claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 230000006916 protein interaction Effects 0.000 claims description 84
- 150000001413 amino acids Chemical class 0.000 claims description 19
- 150000001875 compounds Chemical class 0.000 claims description 17
- 239000003446 ligand Substances 0.000 claims description 12
- 239000003596 drug target Substances 0.000 claims description 8
- 102000038037 druggable proteins Human genes 0.000 claims description 7
- 108091007999 druggable proteins Proteins 0.000 claims description 7
- 230000037361 pathway Effects 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 3
- 125000000539 amino acid group Chemical group 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 abstract description 2
- 230000004850 protein–protein interaction Effects 0.000 abstract description 2
- 238000011160 research Methods 0.000 abstract description 2
- 238000012706 support-vector machine Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 102000050257 X-Linked Inhibitor of Apoptosis Human genes 0.000 description 3
- 108700031544 X-Linked Inhibitor of Apoptosis Proteins 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006907 apoptotic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 229940088872 Apoptosis inhibitor Drugs 0.000 description 1
- 102000004039 Caspase-9 Human genes 0.000 description 1
- 108090000566 Caspase-9 Proteins 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 239000000158 apoptosis inhibitor Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- -1 number of atoms (Na) Chemical class 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
一种基于多元数据预测药物靶向蛋白互作(Protein‑Protein Interaction,PPI)的预测方法。本方法以药物是否靶向蛋白互作为研究对象,开发了一种利用蛋白质的结构、功能和氨基酸序列等十一类特征预测药物靶向蛋白互作的集成分类器算法,该预测方法可应用于对蛋白之间是否存在相互作用以及药物与蛋白质的互作靶点是否发生在蛋白结合界面(PPI interface)上进行预测。
Description
技术领域
本发明涉及一种在机器学习与生物信息学知识背景下,预测药物靶向蛋白互作的预测方法,尤其是涉及一种基于多元数据预测药物靶向蛋白互作的预测方法。
背景技术
蛋白互作(Protein Protein Interaction,PPI)在生命活动中起着核心作用,研究证明蛋白互作是有药物靶向的,研究蛋白互作为药物靶点发现和药物设计提供了重要的理论基础。例如细胞内的细胞凋亡抑制剂XIAP的数量一旦多于正常值,细胞就不会正常的凋亡,继而会引起肿瘤和癌症。而XIAP是与一种激活细胞内的凋亡酶caspase-9互作才能抑制细胞凋亡,因此,抑制XIAP和caspase的互作可以达到治疗肿瘤和癌症的目的。
目前预测药物靶向蛋白互作的算法主要有以下三种:
1.基于蛋白质结构进行预测的算法,如Bock J R,Gough D A.(2001)Predictingprotein--protein interactions from primary structure.Bioinformatics,17(5):455-60.等,这一类方法主要利用蛋白质化合物的结构特征,如溶剂可及面积、氨基酸之间距离、残疾深度等,结合机器学习和统计学方法进行预测。
2.基于蛋白质序列进行预测的算法,如Chen XW,Jeong JC.(2009)Sequence-based prediction of protein interaction sites with an integrativemethod.Bioinformatics,25:585–91等,这类方法根据蛋白互作界面的氨基酸序列信息提取特征,对结合位点进行预测。
3.基于机器学习的多种特征的集成分类器进行预测的算法,如Deng,L.,Guan,J.,Dong,Q.et al.(2009)Prediction of protein-protein interaction sites using anensemble method.Bioinformatics,10:426等,这类方法结合自助重采样技术,基于融合分类器策略,克服不平衡问题,有效的利用理化性质、进化保守性评分、序列熵、位置特异性评分矩阵、溶剂可及面积特征等特征,进行特征组合,可以改善预测性能。
上述这些方法存在如下缺点,一是数据种类较少,即只考虑利用一种或两种数据进行拟合,预测效果不够精确。二是利用的特征数目有限,预测精度不够。二是在计算过程中,结合机器学习的预测方法没有采取有效的特征选择,导致样本包含大量冗余信息,不能取得准确的预测效果。
发明内容
为了克服现有预测药物靶向蛋白互作预测方法的缺陷,得到更为准确的预测效果,本发明提供一种基于蛋白多元数据,包括蛋白互作面和药物-蛋白互作位点等信息,预测药物靶向蛋白互作的预测方法。该预测方法可为将来设计靶向蛋白互作的新型药物提供指导。
本发明需要保护的技术方案概括为:
提取蛋白互作数据库、蛋白互作面数据库、药物-蛋白互作位点数据库、蛋白-配体复合物数据库和蛋白-蛋白复合物数据库,进而整理成正负样本,基于SVM和贪婪算法进行特征选择,最终构建集成分类器来预测药物靶向蛋白互作。
基于以上的方法原理,本发明方法步骤如下:
步骤1.输入一个药物和两个蛋白。
步骤2.判断步骤1所提供的药物和两个蛋白是否存在相互作用。具体内容为,通过整理蛋白互作数据库(为现有技术)包含的所有非冗余蛋白互作,提取蛋白互作数据库,从而对两个蛋白之间是否存在蛋白互作进行预测。如果“是”,则执行步骤3,否则确定为两个蛋白不存在相互作用。
步骤3.判断药物靶点是否位于蛋白互作面。具体内容为,通过提取PDB数据库(为现有技术)中蛋白互作面数据,整理出蛋白互作面数据库。通过提取蛋白互作、蛋白结构等数据库中药物-蛋白互作位点数据,整理出药物-蛋白互作位点数据库。从而对蛋白药物靶点是否位于蛋白互作面上进行预测。如果“是”,则执行步骤6,否则执行步骤4。
步骤4.判断药物和蛋白互作复合物是否相关。具体内容为,以蛋白结构数据库(为现有技术)为基础,整理出非冗余蛋白-配体复合物数据库,从而对药物和蛋白互作的复合物是否相关进行预测。如果“是”,则执行步骤6,否则执行步骤5。
步骤5.判断药物-蛋白复合物和蛋白-蛋白复合物是否相关。具体内容为,以蛋白互作、蛋白结构、配体靶向等数据库(为现有技术)为基础,整理出蛋白-蛋白复合物数据库,从而对药物-蛋白复合物和蛋白-蛋白复合物是否相关进行预测。如果“是”,则执行步骤6,否则退出。
步骤6.形成正负样本。具体内容为,根据步骤3-5中整理出的结果数据,确定正负样本,其中没有药物靶向的蛋白互作与药物对为负样本,有药物靶向的蛋白互作与靶向蛋白互作的药物对为正样本。
步骤7.基于SVM和贪婪算法的特征选择。具体内容为,对步骤6中样本,提取蛋白结构、功能和序列等十一类特征即:氨基酸频率(Amino acid frequency)、组合氨基酸频率、氨基酸理化性质、蛋白质结构信息、氨基酸残基温度、互作蛋白比率、互作蛋白和药物比率、互作蛋白和药物靶蛋白比率、可靶向的互作蛋白、基于ppi的蛋白互作的可药性、以及基于pathway的蛋白互作的可药性,基于SVM(为现有技术)和十折交叉验证方法(为现有技术),结合贪婪算法(为现有技术)对每一类特征进行特征选择。
步骤8.集成分类器构建。具体内容为,基于步骤7中每一类特征的特征选择结果和子模型,应用多数表决(majority voting)结合策略,构建集成分类器。(为本发明的创新点)
步骤9.预测药物靶向蛋白互作。具体内容为,根据步骤8构建的集成分类器进行相应预测,预测药物是否靶向蛋白互作。如果“是”,则确定为药物靶向蛋白互作,否则确定为药物未靶向蛋白互作。
本发明的有益效果是,提供了一种高准确率的基于多元数据预测药物靶向蛋白互作的预测方法,不仅结合了蛋白质相关的多元数据,而且考虑了蛋白互作面的信息,从而提高了预测模型的鲁棒性和准确性。同时对两个蛋白质是否有相互作用,药物靶向蛋白互作是否位于在对应蛋白互作面上给予预测。
附图说明
图1为本发明流程示意图
图2为实施例步骤6流程示意图
图3是本发明的5个实例预测结果
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图和实施例,对本发明进行详细的说明。
附图1是本发明的实施流程,如图所示,本发明结合蛋白相关多元数据对药物靶向蛋白互作进行预测。同时对蛋白间是否存在相互作用,药物靶向蛋白互作及药物靶向是否位于对应蛋白互作面上给予预测。
具体的实施步骤包含:
步骤1,整理蛋白互作数据库包含的所有非冗余蛋白互作共233461对,可用来预测蛋白之间是否存在蛋白互作。
步骤2,结合蛋白结构数据库提供的44747条蛋白互作面数据和3797条药物-蛋白互作数据,求出蛋白互作面和药物-蛋白互作位点有交集的数据,可预测蛋白互作药物靶点是否位于蛋白互作面上。
步骤3,结合蛋白结构和配体靶向数据库中提供的蛋白-配体复合物信息,整理出10656条蛋白-配体复合物信息,可预测药物和蛋白互作复合物的关系复合物。
步骤4,结合蛋白互作、蛋白结构、配体靶向数据库中提供的蛋白-蛋白复合物信息,整理出11001条蛋白-蛋白复合物信息,应用实施步骤3中数据库,整理出10656条蛋白-配体复合物信息,可预测蛋白-配体复合物和蛋白-蛋白复合物的关系。
步骤5,应用实施步骤1-4中靶向蛋白互作的药物与有药物靶向的蛋白互作作为正样本,没有药物靶向的蛋白互作与药物作为负样本。由此共得到8265个正样本和8265个负样本。
步骤6,根据实施步骤5中的样本,按如下步骤执行:
步骤6.1提取十一个特征
1)对蛋白互作对的两个蛋白序列,提取氨基酸,统计氨基酸频率,得共20*2=40个特征,每个特征即为相应氨基酸频率。
2)对蛋白互作对的两个蛋白序列,提取氨基酸对,统计氨基酸对频率,得共202*2=800个特征,每个特征即为相应氨基酸对频率。
3)基于20种氨基酸,提取每种氨基酸的10种理化性质即number of atoms(Na),number of electrostatic charge(Nec),number of potential hydrogen bonds(Nphb),hydrophobicity(Hdrpo),hydrophilicity(Hdrpi),propensity(Prop),isoelectricpoint(Isoep),mass(Mass),expected number of contacts withinsphere(Enc),electron-ion interaction potential(Eiip)。提取每个样本的蛋白互作面相应理化属性值构建特征向量,得共10*2=20个特征。
4)基于每个样本PDB文件,利用PSAIA(Protein Structure And InteractionAnalyser)软件计算蛋白互作面序列的49×2=98个单体及化合物状态的蛋白结构特征。其中相对信息(Relative change)利用公式(1)进行计算。
5)对每一个样本,从相应PDB文件中提取蛋白互作面序列中每一个氨基酸温度信息,共1*2=2个特征。
6)基于样本中涉及到的两个蛋白质,利用公式(2)求出互作蛋白比
其中N(Pi)表示取与蛋白质Pi有相互作用关系的蛋白质集合。
7)基于样本中涉及到的两个蛋白质,利用公式(3)求出互作蛋白和药物比
其中表示取能与蛋白质Pi相互作用关系的药物集合。
8)基于样本中涉及到的两个蛋白质,利用公式(4)求出互作蛋白和药物靶蛋白比
其中表示取能与蛋白质Pi相互作用关系的所有药物的靶蛋白集合。
9)对每一个药物和蛋白互作样本,根据蛋白互作数据库,计算所有样本中的药物与该蛋白互作中的蛋白是否靶向,用1表示有靶向,0表示无靶向,称之为可靶向的互作蛋白特征,得共两倍所有样本中的药物个数个特征。
10)对每一个药物和蛋白互作样本,根据蛋白互作数据库,计算该样本中的药物的所有靶蛋白与该蛋白互作中的蛋白是否有相互作用,用1表示有相互作用,0表示无相互作用,称之为基于ppi的蛋白互作的可药性,得共两倍所有样本中的药物的靶蛋白个数个特征。
11)对每一个药物和蛋白互作样本,根据蛋白互作数据库,计算该样本中的药物的所有靶蛋白与该蛋白互作中的蛋白是否在同一个pathway,用1表示有相互作用,0表示无相互作用,称之为基于pathway的蛋白互作的可药性,得共两倍所有样本中的药物的靶蛋白个数个特征。
步骤6.2特征选择
基于实施步骤6.1中得出的样本和特征,以SVM和贪婪算法思想为基础进行特征选择,过程如下:
(1)首先对所有的特征利用公式(5)进行归一化。
其中,表示第j类的第i个特征,表示这个特征在所有样本上面的平均值,表示这个特征的标准差。
(2)将三个一维特征互作蛋白比、互作蛋白和药物比和互作蛋白和药物靶蛋白比放入另外八类特征中,即对另八类特征分别追加组合的三维特征。
(3)对这八类特征用Signal-to-Noise Ratio(SNR)来确定每一类的初始特征,如公式(6)
其中,和分别表示第j类的第i个特征的正样本和负样本的均值,同理,和分别表示第j类的第i个特征的正样本和负样本的标准差,选取SNRji值最大的特征作为第j类的初始特征。
(4)以SVM算法为基础结合贪婪算法思想,在确定每一类特征初始特征基础上,结合十折交叉验证,依次遍历剩余特征,与初始特征构成二维特征向量,计算平均F1值,并提取当平均F1达到最大值时的特征组合。重复上述过程依次加入特征,直至测试集上平均F1不再增大。至此,对这一类特征来说,特征选择完成,得到最优的特征组合、由这些特征训练的SVM模型与最优F1。F1值计算如公式(7)所示。
其中TP、FP、TN、FN分别表示真阳、假阳、真阴、假阴的样本数量。
步骤7,基于实施步骤6中得到的八类特征的特征选择结果、最大F1值F1k,k∈{1,2,3,4,5,6,7,8}和SVM模型svmk,k∈{1,2,3,4,5,6,7,8},采用多数表决结合策略,构建集成分类器如公式(8)所示,预测药物靶向蛋白互作。
其中F1k表示八类特征中每一类特征的最优F1值,svmk表示的是实施步骤6中得到的每一类特征的SVM模型,表示的是PPIj基于药物作用在第k类特征上取得的特征。因采用多数表决策略,所以门限值设为0.6,即r(Drug,PPIj)大于等于0.6,则Drug破坏了PPIj。
Claims (2)
1.一种基于多元数据预测药物靶向蛋白互作的预测方法,其特征是,提取蛋白互作数据库、蛋白互作面数据库、药物-蛋白互作位点数据库、蛋白-配体复合物数据库和蛋白-蛋白复合物数据库,进而整理成正负样本,基于SVM和贪婪算法进行特征选择,最终构建集成分类器来预测药物靶向蛋白互作。
2.如权利要求1所述的方法,其特征是,包括如下步骤:
步骤1.输入一个药物和两个蛋白。
步骤2.判断步骤1所提供的药物和两个蛋白是否存在相互作用。具体内容为,通过整理蛋白互作数据库(为现有技术)包含的所有非冗余蛋白互作,提取蛋白互作数据库,从而对两个蛋白之间是否存在蛋白互作进行预测。如果“是”,则执行步骤3,否则确定为两个蛋白不存在相互作用。
步骤3.判断药物靶点是否位于蛋白互作面。具体内容为,通过提取PDB数据库(为现有技术)中蛋白互作面数据,整理出蛋白互作面数据库。通过提取蛋白互作、蛋白结构等数据库中药物-蛋白互作位点数据,整理出药物-蛋白互作位点数据库。从而对蛋白药物靶点是否位于蛋白互作面上进行预测。如果“是”,则执行步骤6,否则执行步骤4。
步骤4.判断药物和蛋白互作复合物是否相关。具体内容为,以蛋白结构数据库(为现有技术)为基础,整理出非冗余蛋白-配体复合物数据库,从而对药物和蛋白互作的复合物是否相关进行预测。如果“是”,则执行步骤6,否则执行步骤5。
步骤5.判断药物-蛋白复合物和蛋白-蛋白复合物是否相关。具体内容为,以蛋白互作、蛋白结构、配体靶向等数据库(为现有技术)为基础,整理出蛋白-蛋白复合物数据库,从而对药物-蛋白复合物和蛋白-蛋白复合物是否相关进行预测。如果“是”,则执行步骤6,否则退出。
步骤6.形成正负样本。具体内容为,根据步骤3-5中整理出的结果数据,确定正负样本,其中没有药物靶向的蛋白互作与药物对为负样本,有药物靶向的蛋白互作与靶向蛋白互作的药物对为正样本。
步骤7.基于SVM和贪婪算法的特征选择。具体内容为,对步骤6中样本,提取蛋白结构、功能和序列等十一类特征即:氨基酸频率(Amino acid frequency)、组合氨基酸频率、氨基酸理化性质、蛋白质结构信息、氨基酸残基温度、互作蛋白比率、互作蛋白和药物比率、互作蛋白和药物靶蛋白比率、可靶向的互作蛋白、基于ppi的蛋白互作的可药性、以及基于pathway的蛋白互作的可药性,基于SVM(为现有技术)和十折交叉验证方法(为现有技术),结合贪婪算法(为现有技术)对每一类特征进行特征选择。
步骤8.集成分类器构建。具体内容为,基于步骤7中每一类特征的特征选择结果和子模型,应用多数表决(majority voting)结合策略,构建集成分类器。(为本发明的创新点)
步骤9.预测药物靶向蛋白互作。具体内容为,根据步骤8构建的集成分类器进行相应预测,预测药物是否靶向蛋白互作。如果“是”,则确定为药物靶向蛋白互作,否则确定为药物未靶向蛋白互作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710078030.8A CN106909807B (zh) | 2017-02-14 | 2017-02-14 | 一种基于多元数据预测药物靶向蛋白互作的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710078030.8A CN106909807B (zh) | 2017-02-14 | 2017-02-14 | 一种基于多元数据预测药物靶向蛋白互作的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106909807A true CN106909807A (zh) | 2017-06-30 |
CN106909807B CN106909807B (zh) | 2019-02-01 |
Family
ID=59207556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710078030.8A Active CN106909807B (zh) | 2017-02-14 | 2017-02-14 | 一种基于多元数据预测药物靶向蛋白互作的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106909807B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798215A (zh) * | 2017-11-15 | 2018-03-13 | 扬州大学 | 基于ppi网络层次结构预测功能模块及作用的方法 |
CN108595909A (zh) * | 2018-03-29 | 2018-09-28 | 山东师范大学 | 基于集成分类器的ta蛋白靶向预测方法 |
CN108647489A (zh) * | 2018-05-15 | 2018-10-12 | 华中农业大学 | 一种筛选疾病药物靶标和靶标组合的方法及系统 |
CN110010199A (zh) * | 2019-03-27 | 2019-07-12 | 华中师范大学 | 一种分析识别蛋白质特异性药物结合口袋的方法 |
CN110544506A (zh) * | 2019-08-27 | 2019-12-06 | 上海源兹生物科技有限公司 | 基于蛋白互作网络的靶点PPIs可药性预测方法及装置 |
CN113035270A (zh) * | 2019-12-24 | 2021-06-25 | 邵阳学院 | 一种基于信息熵的计算预测组蛋白赖氨酸丁酰化修饰的方法 |
CN113361752A (zh) * | 2021-05-21 | 2021-09-07 | 浙江工业大学 | 一种基于多视角学习的蛋白质溶剂可及性预测方法 |
WO2021208993A1 (zh) * | 2020-04-17 | 2021-10-21 | 中国科学院上海药物研究所 | 一种用于预测药物靶标的信息处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239751A (zh) * | 2014-09-05 | 2014-12-24 | 南京理工大学 | 基于后处理学习的g蛋白偶联受体-药物交互作用预测方法 |
CN105138866A (zh) * | 2015-08-12 | 2015-12-09 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于蛋白质相互作用网络和网络拓扑结构特征识别蛋白质功能的方法 |
CN105160206A (zh) * | 2015-10-08 | 2015-12-16 | 中国科学院数学与系统科学研究院 | 一种预测药物的蛋白质相互作用靶点的方法和系统 |
US20160232309A1 (en) * | 2015-02-10 | 2016-08-11 | Gachon University Of Industry-Academic Cooperation Foundation | Apparatus and method for assessing effects of drugs based on networks |
CN106202993A (zh) * | 2016-07-12 | 2016-12-07 | 王亚帝 | 利用mRNA表达谱与竞争性内源RNA表达谱联合筛选蒽环类药物心脏毒性基因的方法 |
-
2017
- 2017-02-14 CN CN201710078030.8A patent/CN106909807B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239751A (zh) * | 2014-09-05 | 2014-12-24 | 南京理工大学 | 基于后处理学习的g蛋白偶联受体-药物交互作用预测方法 |
US20160232309A1 (en) * | 2015-02-10 | 2016-08-11 | Gachon University Of Industry-Academic Cooperation Foundation | Apparatus and method for assessing effects of drugs based on networks |
CN105138866A (zh) * | 2015-08-12 | 2015-12-09 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于蛋白质相互作用网络和网络拓扑结构特征识别蛋白质功能的方法 |
CN105160206A (zh) * | 2015-10-08 | 2015-12-16 | 中国科学院数学与系统科学研究院 | 一种预测药物的蛋白质相互作用靶点的方法和系统 |
CN106202993A (zh) * | 2016-07-12 | 2016-12-07 | 王亚帝 | 利用mRNA表达谱与竞争性内源RNA表达谱联合筛选蒽环类药物心脏毒性基因的方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798215A (zh) * | 2017-11-15 | 2018-03-13 | 扬州大学 | 基于ppi网络层次结构预测功能模块及作用的方法 |
CN107798215B (zh) * | 2017-11-15 | 2021-07-23 | 扬州大学 | 基于ppi网络层次结构预测功能模块及作用的方法 |
CN108595909A (zh) * | 2018-03-29 | 2018-09-28 | 山东师范大学 | 基于集成分类器的ta蛋白靶向预测方法 |
CN108647489A (zh) * | 2018-05-15 | 2018-10-12 | 华中农业大学 | 一种筛选疾病药物靶标和靶标组合的方法及系统 |
CN110010199A (zh) * | 2019-03-27 | 2019-07-12 | 华中师范大学 | 一种分析识别蛋白质特异性药物结合口袋的方法 |
CN110010199B (zh) * | 2019-03-27 | 2021-01-01 | 华中师范大学 | 一种分析识别蛋白质特异性药物结合口袋的方法 |
CN110544506B (zh) * | 2019-08-27 | 2022-02-11 | 上海源兹生物科技有限公司 | 基于蛋白互作网络的靶点PPIs可药性预测方法及装置 |
CN110544506A (zh) * | 2019-08-27 | 2019-12-06 | 上海源兹生物科技有限公司 | 基于蛋白互作网络的靶点PPIs可药性预测方法及装置 |
CN113035270A (zh) * | 2019-12-24 | 2021-06-25 | 邵阳学院 | 一种基于信息熵的计算预测组蛋白赖氨酸丁酰化修饰的方法 |
CN113035270B (zh) * | 2019-12-24 | 2022-07-19 | 邵阳学院 | 一种基于信息熵的计算预测组蛋白赖氨酸丁酰化修饰的方法 |
WO2021208993A1 (zh) * | 2020-04-17 | 2021-10-21 | 中国科学院上海药物研究所 | 一种用于预测药物靶标的信息处理方法及装置 |
CN113361752A (zh) * | 2021-05-21 | 2021-09-07 | 浙江工业大学 | 一种基于多视角学习的蛋白质溶剂可及性预测方法 |
CN113361752B (zh) * | 2021-05-21 | 2022-07-26 | 浙江工业大学 | 一种基于多视角学习的蛋白质溶剂可及性预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106909807B (zh) | 2019-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106909807B (zh) | 一种基于多元数据预测药物靶向蛋白互作的预测方法 | |
Qiao et al. | Protein-protein interface hot spots prediction based on a hybrid feature selection strategy | |
Lin et al. | SeqNLS: nuclear localization signal prediction based on frequent pattern mining and linear motif scoring | |
Eckert et al. | Molecular similarity analysis in virtual screening: foundations, limitations and novel approaches | |
Lin et al. | Efficient classification of hot spots and hub protein interfaces by recursive feature elimination and gradient boosting | |
Singhal et al. | A domain-based approach to predict protein-protein interactions | |
Akbar et al. | cACP-2LFS: classification of anticancer peptides using sequential discriminative model of KSAAP and two-level feature selection approach | |
MacCallum | Striped sheets and protein contact prediction | |
Karpenko et al. | Prediction of MHC class II binders using the ant colony search strategy | |
Hu et al. | Learning multimodal networks from heterogeneous data for prediction of lncRNA–miRNA interactions | |
US20060106545A1 (en) | Methods of clustering proteins | |
Lin et al. | Prediction of hot regions in PPIs based on improved local community structure detecting | |
Xue et al. | Predicting residue–residue contact maps by a two‐layer, integrated neural‐network method | |
Yang et al. | RBRDetector: Improved prediction of binding residues on RNA‐binding protein structures using complementary feature‐and template‐based strategies | |
Xing et al. | A statistical method for constructing transcriptional regulatory networks using gene expression and sequence data | |
Sobhan et al. | Explainable machine learning to identify patient-specific biomarkers for lung cancer | |
Dholaniya et al. | Effect of various sequence descriptors in predicting human proteinprotein interactions using ANN-based prediction models | |
Fang et al. | Discover protein sequence signatures from protein-protein interaction data | |
Chua et al. | A unified scoring scheme for detecting essential proteins in protein interaction networks | |
Lu et al. | Novel Scheme for Essential Proteins Identification Based on Improved Multicriteria Decision Making | |
Govindan et al. | New feature vector for apoptosis protein subcellular localization prediction | |
Andreopoulos et al. | Triangle network motifs predict complexes by complementing high-error interactomes with structural information | |
Li et al. | Decision tree‐based identification of important molecular fragments for protein‐ligand binding | |
Du et al. | A novel feature extraction scheme for prediction of protein–protein interaction sites | |
Mei et al. | Unbalance Data Processing Strategy for Protein Interaction Sites Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |