CN111613275A - 一种基于rmsd多特征的药物分子动力学结果分析方法 - Google Patents

一种基于rmsd多特征的药物分子动力学结果分析方法 Download PDF

Info

Publication number
CN111613275A
CN111613275A CN202010454509.9A CN202010454509A CN111613275A CN 111613275 A CN111613275 A CN 111613275A CN 202010454509 A CN202010454509 A CN 202010454509A CN 111613275 A CN111613275 A CN 111613275A
Authority
CN
China
Prior art keywords
rmsd
energy
image
molecular dynamics
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010454509.9A
Other languages
English (en)
Other versions
CN111613275B (zh
Inventor
刘昊
张志雨
徐锡明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202010454509.9A priority Critical patent/CN111613275B/zh
Publication of CN111613275A publication Critical patent/CN111613275A/zh
Application granted granted Critical
Publication of CN111613275B publication Critical patent/CN111613275B/zh
Priority to JP2021079240A priority patent/JP7104441B2/ja
Priority to US17/315,335 priority patent/US20210375399A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及一种基于rmsd多特征的药物分子动力学结果分析方法,属于药物分子动力学技术领域,所述方法包括以下步骤:1)分子动力学RMSD图像特征分析及提取;2)使用分子力学/泊松‑玻尔兹曼表面积法计算结合自由能及能量分解;3)SVM分类训练。本发明方法通过RMSD图像、分子力学/泊松‑玻尔兹曼表面积法,使得药物分子动力学更加高效,精确。

Description

一种基于rmsd多特征的药物分子动力学结果分析方法
技术领域
本发明属于药物分子动力学技术领域,具体地涉及一种基于rmsd多特征的药物分子动力学结果分析方法。
背景技术
分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,在由分子分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。
分子动力学模拟已经成为研究分子构象变化、功能解析的强有力工具和必不可少的研究手段,被广泛用于药物设计、生命科学、化学工程、物理科学、药物研发、材料科学等领域。该方法在很大程度上可以对实验进行预测、指导和解释,并且将计算模拟与实验的结合已经成为目前主要的研究手段。
药物化学最重要是要有有前途的先导化合物,而先导化合物的来源两大支柱之一就是虚拟筛选技术,作为虚拟筛选技术串连技术的最终一步,动力学有着可以选择最有前途分子进行合成的作用,提高靶酶先导化合物的阳性成功率;另外动力学还可以对已知的化合物进行研究,获得进一步改造的空间;在生物化学领域,更多的蛋白性质可以被探索,这样动态设计药物分子先导成为可能。
结合自由能计算本质上是处理考察体系从一个热力学态到另一个热力学态发生的能量变化,这可以指其本身的变化(化合价变化)或者是周围环境的变化(从真空到溶剂,或者是从溶剂到配位环境的变化),其能够总能量的角度表征键合的强弱情况,一般而言,负的越多,表征键合越强,破坏一个键合所需要的能量也就越大。另外,如果结合自由能为正数的话,表明键合不能自发形成。计算结合自由能不仅可以评估实验测定的配体与受体亲和能,还可以作为药物设计的参考。迄今为止,许多结合自由能计算方法已经广泛使用。主要包括三类:(1)经典自由能计算方法:热力学积分法和自由能微扰法都属于经典方法。它的理论基础十分严格,几乎适用于任意体系。但是它需要长时间的采样,且计算量过大,所以只能应用在简单的情况中。(2)基于经验方程的方法:此法将结合自由能分解为几个能量项,然后使用统计方法参照训练集而得到经验公式。优点是采样时间短,计算量小,缺点是过度依赖训练集,而且不能考虑柔性和溶剂化效应,不具有普遍适用性。(3)经验的自由能计算方法:主要包括线性相互作用能(LIE)方法和MM-PB/GBSA方法。这类方法独特优势就是可以计算一个配体和一个受体结合过程中的结合自由能。
分子力学/泊松-玻尔兹曼表面积法(Molecular Mechanics/Poisson-BoltzmannSurface Area)用于生物大分子体系,包括DNA的构象变化、蛋白-蛋白、蛋白 -DNA、蛋白-小分子的相互作用,该方法将结合自由能拆成了动力学项、溶剂效应项、熵变,多项分别计算。其中动力学项又包含三项Eint、EedW和Eelec,其中int指键、键角及二面角。溶剂效应项又可分为极性项和非极性项,一般可使用Adaptive Poisson-Boltzmann Solver(APBS)program来计算。熵变,最麻烦也是算的最不准的一项。已有的方法如常用的正则模分析法(normal mode analysis),还可采用quasi-harmonic analysis的方法。
支持向量机(Support Vector Machine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀疏性和稳健性的分类器。SVM可以通过核方法进行非线性分类,是常见的核学习方法之一
目前分子动力学虚拟筛选方法,虽然速度有了很大的提升,但是仍存在很多不足。
1.在对分子动力学结果进行分析时,一般采用计算化合物结合物结合自由能的方法,但这种方法忽略了化合物在结构上的特征,并不能全面的反映靶点与化合物的整体结合程度,具有一定的片面性。
2.现有的对结果进行评价分类的方法大都采用根据积累的经验采用人工方法进行分类,处理效率较低并且人工判断的方法具有一定的主观片面性,在结果分类方面存在较大误差。
发明内容
针对现有技术存在的不足,本发明提供一种基于rmsd多特征的药物分子动力学结果分析方法,通过RMSD图像、分子力学/泊松-玻尔兹曼表面积法,使得药物分子动力学更加高效,精确。
为了解决上述技术问题,本发明采用的技术方案是:
一种基于rmsd多特征的药物分子动力学结果分析方法,包括以下步骤:
1)分子动力学RMSD图像特征分析及提取;
2)使用分子力学/泊松-玻尔兹曼表面积法计算结合自由能及能量分解;
3)SVM分类训练。
进一步的,步骤1)的具体操作是:对RMSD图像进行整体特征分析,计算每一帧化合物结构与原始结构之间的RMSD(均方根误差)值,然后计算整个分子动力学过程中RMSD的平均值以及方差作为特征,之后将RMSD整体折线进行快速傅里叶变换,将时间域上的图像转化到频率域并进行频谱分析,提取结果中排名靠前的低频项的系数作为特征之一;
进一步的,步骤2)的具体操作是:利用MD轨迹导成单个的文件,设置电荷数量,水的介电常数一般设成80,蛋白因的介电常数设置为4,分别计算分子力学能量、极性溶剂化能、非极性溶剂化能,合并成为化合物结合自由能;之后将结合自由能进行分解,计算出化合物中每一个氨基酸残基对应的能量并找出对总能量贡献大的排名靠前的自由能对应的残基,然后计算阳性化合物在活性位点的氨基酸的能量变化的关联性。
进一步的,步骤3)的具体操作是:对RMSD图像进行预处理,去掉那些由于计算过程中断或其他原因产生的明显无效的图像,然后将RMSD图像进行归一化处理并利用抽样技术将数据集分为训练集和测试集,之后将每一个图像进行标注,动力学结果较好标注为1,较差标注为-1。
进一步将RMSD图像的整体平均值及方差、RMSD图像平稳时间段的均值、低频项前十项系数、残基相似度处理好的特征数据进行向量化组成一个特征向量,使用Sigmoid函数作为核函数并选择初始参数C和r使用训练集对分类器模型进行训练,使用测试集对模型分类精度进行测试并不断调整参数提高精度。
本发明与现有技术相比的有益效果:
(1)本发明中提出了一组基于rmsd统计数据的特征提取方案,较全面的分析结果的各种特征。
(2)本发明在融合了机器学习的方法,使用SVM方法对动力学结果进行分类筛选,保证了药物分子动力学结果分析的精准度。
(3)本发明在保持较高的筛选准确率的同时提高了对阳性小分子的筛选效率,优化了分子动力学结果分析的流程。
附图说明
图1为提取RMSD图像特征;
图2为将特征放入分类器模型后的网络结构图。
具体实施方式
下面将结合本发明的具体实施例对本发明作进一步的说明,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
一种基于rmsd多特征的药物分子动力学结果分析方法,所述的方法具体如下:
1)分子动力学RMSD图像特征分析及提取
使用分子动力学软件对5V6A靶点(中东呼吸综合征冠状病毒蛋白酶 -MERS-CoV)与DrugBank药物分子数据库进行分子动力学模拟,对接结果使用gnuplot绘制动力学过程中RSMD变化图像(RMSD图像如图1所示),对 RMSD图像进行整体特征分析,计算每一帧化合物结构与原始结构之间的 RMSD(均方根误差)值,然后计算整个分子动力学过程中RMSD的平均值(如图一均值为0.152026)以及方差(如图1方差为0.001309)作为特征,之后将RMSD整体折线进行快速傅里叶变换,将时间域上的图像转化到频率域并进行频谱分析,提取结果中排名靠前的低频项的系数(如图1多项式的前五个系数分别为: 0.000018,-0.000508,0.005309,-0.023626,0.047714)作为特征之一。
2)使用分子力学/泊松-玻尔兹曼表面积法计算结合自由能及能量分解
利用MD轨迹导成单个的文件,设置电荷数量,水的介电常数一般设成 80,蛋白因的介电常数设置为4,分别计算分子力学能量、极性溶剂化能、非极性溶剂化能,合并成为化合物结合自由能。之后使用MmPbSaDecomp.py脚本将结合自由能进行分解,计算出化合物中每一个氨基酸残基对应的能量并找出对总能量贡献大的排名靠前的自由能对应的残基(如表1所示),然后计算阳性化合物在活性位点的氨基酸的能量变化的关联性(关联关系如表1所示)。
3)SVM分类训练
对RMSD图像进行预处理,然后将RMSD图像进行归一化处理并利用抽样技术将数据集分为训练集和测试集,之后将每一个图像进行标注,动力学结果较好标注为1,较差标注为-1。进一步将RMSD图像的整体平均值及方差、 RMSD图像平稳时间段的均值、低频项前十项系数、残基相似度等处理好的特征数据进行向量化组成一个特征向量,使用Sigmoid函数作为核函数并选择初始参数C和r使用训练集对分类器模型进行训练(网络结构图如图2所示),使用测试集对模型分类精度进行测试并不断调整参数提高精度,通过实验证明分类准确率为80%左右。(准确率实验数据如表2所示)。
表1
Figure BDA0002508848940000061
计算公式:Σ((残基能量-yx能量)/yx能量)*25%
ID 判断结果 能量相似度 是否正确
42581 1 91.25 正确
43391 1 89.75 正确
43392 1 78.25 错误
43393 1 91.25 正确
43395 1 94.25 正确
43397 0 88.00 错误
44486 0 75.25 正确
44620 0 71.50 正确
44664 1 91.50 正确
45732 1 91.75 正确

Claims (5)

1.一种基于rmsd多特征的药物分子动力学结果分析方法,其特征在于所述方法包括以下步骤:
1)分子动力学RMSD图像特征分析及提取;
2)使用分子力学/泊松-玻尔兹曼表面积法计算结合自由能及能量分解;
3)SVM分类训练。
2.根据权利要求1所述的一种基于rmsd多特征的药物分子动力学结果分析方法,所述步骤1)的具体操作是:对RMSD图像进行整体特征分析,计算每一帧化合物结构与原始结构之间的均方根误差值,以下简称RMSD,然后计算整个分子动力学过程中RMSD的平均值以及方差作为特征,之后将RMSD整体折线进行快速傅里叶变换,将时间域上的图像转化到频率域并进行频谱分析,提取结果中排名靠前的低频项的系数作为特征之一。
3.根据权利要求1所述的一种基于rmsd多特征的药物分子动力学结果分析方法,所述步骤2)的具体操作是:利用MD轨迹导成单个的文件,设置电荷数量,水的介电常数一般设成80,蛋白因的介电常数设置为4,分别计算分子力学能量、极性溶剂化能、非极性溶剂化能,合并成为化合物结合自由能;之后将结合自由能进行分解,计算出化合物中每一个氨基酸残基对应的能量并找出对总能量贡献大的排名靠前的自由能对应的残基,然后计算阳性化合物在活性位点的氨基酸的能量变化的关联性。
4.根据权利要求1所述的一种基于rmsd多特征的药物分子动力学结果分析方法,所述步骤3)的具体操作是:对RMSD图像进行预处理,去掉那些由于计算过程中断或其他原因产生的明显无效的图像,然后将RMSD图像进行归一化处理并利用抽样技术将数据集分为训练集和测试集,之后将每一个图像进行标注,动力学结果较好标注为1,较差标注为-1。
5.根据权利要求1所述的一种基于rmsd多特征的药物分子动力学结果分析方法,将RMSD图像的整体平均值及方差、RMSD图像平稳时间段的均值、低频项前十项系数、残基相似度处理好的特征数据进行向量化组成一个特征向量,使用Sigmoid函数作为核函数并选择初始参数C和r使用训练集对分类器模型进行训练,使用测试集对模型分类精度进行测试并不断调整参数提高精度。
CN202010454509.9A 2020-05-26 2020-05-26 一种基于rmsd多特征的药物分子动力学结果分析方法 Active CN111613275B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010454509.9A CN111613275B (zh) 2020-05-26 2020-05-26 一种基于rmsd多特征的药物分子动力学结果分析方法
JP2021079240A JP7104441B2 (ja) 2020-05-26 2021-05-07 rmsdマルチ特徴に基づく薬物分子動力学結果の分析方法
US17/315,335 US20210375399A1 (en) 2020-05-26 2021-05-09 Method for analysis of drug molecular dynamics results based on root-mean-square deviation multiple features

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010454509.9A CN111613275B (zh) 2020-05-26 2020-05-26 一种基于rmsd多特征的药物分子动力学结果分析方法

Publications (2)

Publication Number Publication Date
CN111613275A true CN111613275A (zh) 2020-09-01
CN111613275B CN111613275B (zh) 2021-03-16

Family

ID=72204924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010454509.9A Active CN111613275B (zh) 2020-05-26 2020-05-26 一种基于rmsd多特征的药物分子动力学结果分析方法

Country Status (3)

Country Link
US (1) US20210375399A1 (zh)
JP (1) JP7104441B2 (zh)
CN (1) CN111613275B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114927161A (zh) * 2022-05-16 2022-08-19 抖音视界(北京)有限公司 分子分析的方法、装置、电子设备和计算机存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024043270A (ja) 2022-09-16 2024-03-29 横河電機株式会社 溶解性評価装置、溶解性評価方法及び溶解性評価プログラム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101855392A (zh) * 2007-11-12 2010-10-06 电子虚拟生物科技株式会社 虚拟筛选装置及虚拟筛选方法
CN102798708A (zh) * 2012-08-23 2012-11-28 中国科学院长春应用化学研究所 一种检测配体与靶标结合特异性的方法及药物筛选方法
CN103014880A (zh) * 2012-12-20 2013-04-03 天津大学 基于蛋白a亲和模型构建免疫球蛋白g的新型亲和配基多肽库及设计方法的应用
CN103049677A (zh) * 2011-10-17 2013-04-17 同济大学 一种处理小分子和蛋白质相互作用的计算方法
CN103122486A (zh) * 2011-11-04 2013-05-29 加利福尼亚大学董事会 肽微阵列及使用方法
CN103951731A (zh) * 2014-04-15 2014-07-30 天津大学 胶原蛋白-整联蛋白α2β1相互作用的多肽抑制剂及筛选方法
WO2016135627A1 (es) * 2015-02-26 2016-09-01 Universidad De Los Andes Péptidos derivados de ompa de e. coli y procedimiento de identificación y obtención de los mismos.
CN107209813A (zh) * 2014-11-25 2017-09-26 国家信息及自动化研究院 用于分子结构的输入集合的相互作用参数
CN107531759A (zh) * 2015-02-13 2018-01-02 新加坡科技研究局 非膜破坏性p53活化装订肽
CN109979541A (zh) * 2019-03-20 2019-07-05 四川大学 基于胶囊网络的药物分子药代动力学性质和毒性预测方法
CN110945023A (zh) * 2017-07-31 2020-03-31 豪夫迈·罗氏有限公司 基于三维结构的人源化方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4388224B2 (ja) * 2000-12-19 2009-12-24 新日本製鐵株式会社 分子材料の解析装置、分子材料の解析方法及び記憶媒体
JP5211458B2 (ja) * 2006-09-27 2013-06-12 日本電気株式会社 化合物の仮想スクリーニング方法および装置
JP5211486B2 (ja) * 2007-01-19 2013-06-12 日本電気株式会社 化合物の仮想スクリーニング方法及び装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101855392A (zh) * 2007-11-12 2010-10-06 电子虚拟生物科技株式会社 虚拟筛选装置及虚拟筛选方法
CN103049677A (zh) * 2011-10-17 2013-04-17 同济大学 一种处理小分子和蛋白质相互作用的计算方法
CN103122486A (zh) * 2011-11-04 2013-05-29 加利福尼亚大学董事会 肽微阵列及使用方法
CN102798708A (zh) * 2012-08-23 2012-11-28 中国科学院长春应用化学研究所 一种检测配体与靶标结合特异性的方法及药物筛选方法
CN103014880A (zh) * 2012-12-20 2013-04-03 天津大学 基于蛋白a亲和模型构建免疫球蛋白g的新型亲和配基多肽库及设计方法的应用
CN103951731A (zh) * 2014-04-15 2014-07-30 天津大学 胶原蛋白-整联蛋白α2β1相互作用的多肽抑制剂及筛选方法
CN107209813A (zh) * 2014-11-25 2017-09-26 国家信息及自动化研究院 用于分子结构的输入集合的相互作用参数
CN107531759A (zh) * 2015-02-13 2018-01-02 新加坡科技研究局 非膜破坏性p53活化装订肽
WO2016135627A1 (es) * 2015-02-26 2016-09-01 Universidad De Los Andes Péptidos derivados de ompa de e. coli y procedimiento de identificación y obtención de los mismos.
CN110945023A (zh) * 2017-07-31 2020-03-31 豪夫迈·罗氏有限公司 基于三维结构的人源化方法
CN109979541A (zh) * 2019-03-20 2019-07-05 四川大学 基于胶囊网络的药物分子药代动力学性质和毒性预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KUAN-CHUNG CHEN等: "Stroke prevention by traditional Chinese medicine? A genetic algorithm,support vector machine and molecular dynamics approach", 《SOFT MATTER》 *
康文渊等: "分子动力学模拟残基突变对芳香烃受体配体结合区的影响", 《化学通报》 *
瞿思颖等: "凝血因子Xa的S4口袋部分关键残基对利伐沙班结合的不同作用机制", 《高等学校化学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114927161A (zh) * 2022-05-16 2022-08-19 抖音视界(北京)有限公司 分子分析的方法、装置、电子设备和计算机存储介质
CN114927161B (zh) * 2022-05-16 2024-06-04 抖音视界有限公司 分子分析的方法、装置、电子设备和计算机存储介质

Also Published As

Publication number Publication date
JP7104441B2 (ja) 2022-07-21
US20210375399A1 (en) 2021-12-02
JP2021190110A (ja) 2021-12-13
CN111613275B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
Meng et al. scAAGA: Single cell data analysis framework using asymmetric autoencoder with gene attention
Chen et al. iTIS-PseTNC: a sequence-based predictor for identifying translation initiation site in human genes using pseudo trinucleotide composition
Chen et al. Comprehensive survey of model compression and speed up for vision transformers
CN111613275B (zh) 一种基于rmsd多特征的药物分子动力学结果分析方法
CN106055928B (zh) 一种宏基因组重叠群的分类方法
CN107194207A (zh) 基于粒度支持向量机集成的蛋白质配体绑定位点预测方法
Vitalii et al. Classification of multifractal time series by decision tree methods
CN112331257A (zh) 一种基于图卷积神经网络的病毒-宿主相互作用预测方法
Gomez-Blanco et al. Hierarchical autoclassification of cryo-EM samples and macromolecular energy landscape determination
Enyoh et al. Automated Classification of Undegraded and Aged Polyethylene Terephthalate Microplastics from ATR-FTIR Spectroscopy using Machine Learning Algorithms
Patel et al. Protein secondary structure prediction using support vector machines (SVMs)
CN114093420A (zh) 一种基于XGBoost的DNA重组位点预测方法
CN113823356A (zh) 一种甲基化位点识别方法及装置
Sun et al. The wood slice cell image identification algorithm based on singular value decomposition
CN112382342A (zh) 一种基于集成特征选择的癌症甲基化数据分类方法
Tong et al. A neural network-based production process modeling and variable importance analysis approach in corn to sugar factory
Dong et al. Protein remote homology detection based on binary profiles
Li et al. HEp-2 cells staining patterns classification via wavelet scattering network and random forest
CN112926603A (zh) 乐谱识别方法、装置、设备及存储介质
Kuhn Data sets and miscellaneous functions in the caret package
Söylemez et al. Novel Antimicrobial Peptide Design Using Motif Match Score Representation
Rashid et al. An adaptive feature reduction algorithm for cancer classification using wavelet decomposition of serum proteomic and DNA microarray data
Touchanti et al. A 2-stages feature selection framework for colon cancer classification using SVM
CN117689724A (zh) 一种基于弱监督学习的蛋白质亚细胞定位方法
CN113517035B (zh) 表面活性剂的构效关系研究方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant