CN113284566A - 一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法 - Google Patents

一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法 Download PDF

Info

Publication number
CN113284566A
CN113284566A CN202110682474.9A CN202110682474A CN113284566A CN 113284566 A CN113284566 A CN 113284566A CN 202110682474 A CN202110682474 A CN 202110682474A CN 113284566 A CN113284566 A CN 113284566A
Authority
CN
China
Prior art keywords
model
inhibitor
activity
fructose
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110682474.9A
Other languages
English (en)
Other versions
CN113284566B (zh
Inventor
倪同上
赵梓屹
杨佳龙
冀洪祥
孙婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao University
Original Assignee
Qingdao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao University filed Critical Qingdao University
Priority to CN202110682474.9A priority Critical patent/CN113284566B/zh
Publication of CN113284566A publication Critical patent/CN113284566A/zh
Application granted granted Critical
Publication of CN113284566B publication Critical patent/CN113284566B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明属于药物活性预测方法技术领域,涉及一种基于定量构效关系模型实现预测果糖‑1,6‑双磷酸酶抑制剂的抑制活性的方法,具体步骤为样本集的收集、样本集的处理和优化、抑制剂分子描述符集的建立、数据集划分、启发式算法建立QSAR线性模型、梯度提升回归算法建立QSAR非线性模型、对两个模型结果进行比较分析;在抑制剂开发初期,通过计算机输入抑制剂分子结构,基于HM和GBR方法完成对其抑制浓度的预测,对比两个模型结果以解决单一线性模型预测精度不够的问题,有效减少后期抑制剂开发的风险,降低研发成本;通过对建立的两种模型进行验证,证实了模型的可靠性;同时也为GBR算法在计算机辅助药物设计领域的应用开创了先河。

Description

一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑 制剂的抑制活性的方法
技术领域:
本发明属于药物活性预测方法技术领域,具体涉及一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,根据抑制剂分子结构以及物理化学性质先后建立线性模型和非线性模型,并对抑制剂的抑制活性进行预测,解决了单一线性模型预测精度不够的问题,能够有效减少后期抑制剂开发的风险,降低研发成本。
背景技术:
以高血糖症为特征的糖尿病(DM)是一种慢性代谢性疾病,其发病率在国际上正在上升。它会对肾脏,血管,眼睛,神经和心脏造成严重伤害,此外,糖尿病与早产,超重和胎儿先天发育不良密切相关,对婴儿和孕妇的安全产生了威胁。根据世界卫生组织糖尿病网页的统计数显示,目前全世界大约有6%的人口患有各种类型的糖尿病。由于发病原因不同,糖尿病可分为1型糖尿病(T1DM)和2型糖尿病(T2DM),T2DM占所有糖尿病的90%。T2DM的主要特征是胰岛素抵抗,它能够导致持续性高血糖,很多患者的预期寿命将减少10年以上。预期寿命减少的原因复杂多样,其中包括:肢体截肢率增加约20倍,缺血性心脏病和中风的风险更高与健康人相比,根据先前的研究,大多数抗糖尿病药物的药理机制是增加胰岛素的分泌或避免胰岛素抵抗,但是这些疗法常常会产生多种副作用,如严重的低血糖症,体重增加,内分泌失调等。为了减少常规糖尿病药物引起的并发症,糖尿病新型药物的研究在国际科学界备受关注。因此,开发新的糖尿病药物具有重要的医学意义。
糖异生(GNG)是在肝脏和肾脏中提供葡萄糖的主要内源性途径,在T2DM发病中占有重要地位。果糖-1,6-双磷酸酶(FBPase)催化从1,6-双磷酸果糖到6-磷酸果糖的不可逆反应,在糖异生途径中占据重要地位。FBPase具有两种同工酶,分别存在于肝脏和肌肉。根据先前的研究,它不仅参与能量代谢和维持血糖稳态,而且还与线粒体内的蛋白质和核蛋白相互作用。,FBPase是影响糖异生途径的十分具有研究潜力的靶标。N-芳基磺酰基-吲哚-2-羧酰胺衍生物作为果糖-1,6-双磷酸酶的抑制剂具有重要的研究价值。
计算机辅助药物设计(CADD)是一种通过计算机计算、推演生物分子与药物之间的关系来设计和优化先导化合物的方法,定量构效关系(QSAR)是计算机辅助药物设计中一种广泛使用的方法,该方法通过数学统计模型描述分子结构和分子的某种生物活性之间的定量关系,从而可以预测新化合物的生物活性。申请人查阅资料发现,目前还没有关于基于GBR的QSAR模型应用到N-芳基磺酰基-吲哚-2-羧酰胺衍生物上,为了研究N-芳基磺酰基-吲哚-2-羧酰胺衍生物的抑制作用,申请人分别应用线性方法和非线性方法建立QSAR模型,为进一步研究T2DM带来了美好的前景。
发明内容:
本发明的目的是为了克服现有技术的缺点,提供一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,根据抑制剂化合物的分子结构以及物理化学性质等预测其IC50的数值大小,进而预测其对果糖-1,6-双磷酸酶的抑制活性。
为了实现上述目的,本发明提供一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,具体步骤如下:
S1、样本集的收集:
收集FBPase酶抑制剂分子的结构以及相对应的抑制活性;
S2、样本集的处理和优化:
对样本集的每个抑制剂分子进行结构优化;对抑制活性数据通过开平方运算的方法进行归一化处理以减少量纲对数据的影响;
S3、抑制剂分子描述符集的建立:
将优化之后的FBPase酶抑制剂分子结构输入CODESSA软件,计算并筛选出与其对应的分子描述符值,筛选后每个抑制剂分子包括两个描述符:MERICA和MNRISA,MERICA为C原子的最小电反应指数,MNRISA为S原子的最小核反应指数;
S4、数据集划分:
将抑制剂分子随机按照1:3的比例分为验证集和训练集,训练集用于构建模型,验证集用于初步验证模型的预测能力;
S5、启发式算法建立QSAR线性模型:
根据步骤S4中的训练集,建立抑制剂分子结构和抑制活性之间的关系模型,即用步骤S3得到的抑制剂描述符为自变量,抑制剂活性为因变量,运用CODESSA软件中的启发式算法得到QSAR线性模型;
S6、梯度提升回归算法建立QSAR非线性模型:
将所有分子描述符的数据和归一化处理后的抑制活性数据导入到梯度提升回归算法模块中并重新划分训练集和测试集,得到最终的非线性回归模型;
S7、对两个模型结果进行比较分析。
进一步的,步骤S1中,FBPase酶的抑制剂为N-芳基磺酰基-吲哚-2-羧酰胺衍生物,具体为:从公开文献中共收集84种N-芳基磺酰基-吲哚-2-羧酰胺衍生物分子结构以及对应的抑制活性,抑制活性用IC50来衡量。
进一步的,步骤S2的具体步骤为:先用ChemDraw Ultra 8.0软件将每个抑制剂的2D结构绘制出来,并保存为分子式,然后将分子式输入到HyperChem Professional软件中,通过MM+和半经验方法对分子结构进行预优化,得到mol,mno,hin和zmt的4种格式的文件;此外,将zmt格式的文件导入到MOPAC程序中进一步优化。
进一步的,步骤S3的具体步骤为:将mno和zmt文件地址导入Excel表格中并将Excel数据导入到应用程序CODESSA中,生成描述符共610个,然后通过模型交叉验证系数R2cv、决定系数R2、标准偏差平方S2来选择描述符个数,当描述符个数大于两个时,统计学指标改变并不明显,当描述符个数从一个变成两个时,统计学指标改变显著,因此选择两个描述符。
进一步的,步骤S5得到的线性模型训练集的回归方程如下:
sqrt(IC50)=0.21012+232230MERICA+119710MNRISA,R2=0.856;R2 CV=0.839。
进一步的,步骤S6得到的非线性模型训练集的R2=0.943。
进一步的,计算步骤S5和步骤S6两个模型的统计评估指标R2、R2 CV和S2,通过分析评估指标对抑制剂分子活性进行预测。
本发明与现有技术相比,具有如下优点:使用计算机辅助药物设计的方法对药物活性进行预测,节约了大量的研究经费和时间成本,先后建立两种模型,说明了药物的结构与活性之间不仅是简单的线性关系,同时把GBR算法应用于药物设计领域,GBR算法能够优化不同的损失函数并提供一些超参数调整选项,从而使函数更具有灵活性,因此,基于GBR算法生成的模型通常具有很高的预测准确能力;同时,导入GBR模型的分类值和数值通常无需任何数据预处理就可以很好地应用;由于GBR算法利用多个学习者的线性组合来获得预测精度,因此具有出色的泛化能力,避免了单个学习者能力有限而导致的预测效果差的问题。在抑制剂开发初期,通过计算机输入抑制剂分子结构,基于HM和GBR方法完成对其抑制浓度的预测,对比两个模型的结果以此解决单一线性模型预测精度不够的问题,能够有效减少后期抑制剂开发的风险,降低研发成本;通过对建立的两种模型进行验证,证实了模型的可靠性;同时也为GBR算法在计算机辅助药物设计领域的应用开创了先河。
附图说明:
图1为本发明涉及的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法中筛选描述符时描述符个数对建立模型统计学指标的影响曲线示意图。
图2为本发明涉及的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法中通过HM建立的QSAR模型实验值和预测值的散点示意图。
图3为本发明涉及的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法中通过GBR建立的QSAR模型的训练集和测试集的拟合曲线示意图。
具体实施方式:
下面通过具体实施例并结合附图对本发明作进一步说明。
实施例1:
本实施例涉及一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,具体步骤如下:
S1、样本集的收集:
收集FBPase酶抑制剂分子的结构以及相对应的抑制活性;其FBPase酶的抑制剂为N-芳基磺酰基-吲哚-2-羧酰胺衍生物;具体为:从公开文献中共收集84种N-芳基磺酰基-吲哚-2-羧酰胺衍生物分子结构以及对应的抑制活性,抑制活性用IC50来衡量;收集抑制剂的标准为:排除没有具体IC50数值而只能给出范围的化合物;
S2、样本集的处理和优化:
对样本集的每个抑制剂分子进行结构优化,先用ChemDraw Ultra 8.0软件将每个抑制剂的2D结构绘制出来,并保存为分子式,然后将分子式输入到HyperChemProfessional软件中,通过MM+和半经验方法对分子结构进行预优化,得到mol,mno,hin和zmt的4种格式的文件;此外,将zmt格式的文件导入到MOPAC程序中进一步优化;MOPAC程序作为一个通用的、半经验的分子轨道程序,通常用于研究涉及分子、离子和线性聚合物的化学反应;
对IC50数据通过开平方运算的方法进行归一化处理以减少量纲对数据的影响;
S3、抑制剂分子描述符集的建立:
将优化之后的FBPase酶抑制剂分子结构输入CODESSA软件,计算并通过半经验算法筛选出与其对应的分子描述符值,筛选后每个抑制剂分子包括两个描述符;具体为:将mno和zmt文件地址导入Excel表格中并将Excel数据导入到应用程序CODESSA中,生成描述符共610个,描述符的特征丰富,例如几何描述符,结构描述符,拓扑描述符和量子描述符等,最终筛选得到每个分子的两个描述符:C原子的最小电反应指数(MERICA)以及S原子的最小核反应指数(MNRISA),二者分别为化合物的电子力学指标和量子力学指标;
描述符通过模型交叉验证系数R2cv、决定系数R2、标准偏差平方S2来选择描述符个数,描述符个数对建立模型统计学指标的影响结果见图1,从图1可以看出,当描述符个数大于两个时,统计学指标改变并不明显,当描述符个数从一个变成两个时,统计学指标改变显著,因此选择两个描述符;
S4、数据集划分:
将84种抑制剂分子(N-芳基磺酰基-吲哚-2-羧酰胺衍生物)随机按照1:3的比例分为验证集和训练集,训练集用于构建模型,验证集用于初步验证模型的预测能力;
S5、启发式算法建立QSAR线性模型:
根据步骤S4中的训练集,建立抑制剂分子结构和抑制活性之间的关系模型,即用步骤S3得到的抑制剂描述符为自变量,FBPase酶抑制剂N-芳基磺酰基-吲哚-2-羧酰胺衍生物的IC50为因变量,运用CODESSA软件中的启发式算法得到QSAR线性模型,获得训练集回归方程如下:
sqrt(IC50)=0.21012+232230MERICA+119710MNRISA
N=84(分子数)R2=0.856(决定系数)R2 CV=0.839(测试集中的决定系数)
S2=0.105(标准偏差平方)
Sqrt:square root的缩写
运用启发式算法建立的模型为线性模型,具有较高的可解释性;运用启发式算法没有软件限制,建模容易,速度快;运用启发式算法(HM)建立的线性模型,其拟合结果的R2为0.856,证明了描述符和IC50之间的关系可能不仅仅是线性关系,因此继续进一步建立非线性模型;
S6、梯度提升回归算法建立QSAR非线性模型:
将所有分子描述符的数据和归一化处理后的活性指标(IC50)导入到梯度提升回归算法模块中并重新划分训练集和测试集,得到最终的非线性回归模型;梯度提升回归算法(GBR)在单个预测模型的基础上建立了多个监督式机器学习模型,得到每个单独的模型预测结果,然后该集合简单地对预测值求平均;梯度提升回归算法的主要思想是按顺序向集合中添加新模型,在每个特定的迭代中,针对到目前为止已学习的整个集成的错误,训练一个新的弱基础学习器模型,当迭代足够次数之后,模型结果达到全局最优;模型的训练集和测试集的拟合结果在说明书附图图3中呈现;最后得到模型的统计学(其中包含了训练集、测试集以及全集)指标结果如下表所示:
表1通过梯度回归算法建立的QSAR模型结果
Figure BDA0003114619010000051
表中的EVS为可解释方差;MAE为平均绝对误差;MSE为均方误差;
GBR算法经过270万次迭代获得了0.943的良好结果,其中MSE测量了样本与模型的预测值之间的偏差程度;MAE代表预测值与观察值之间绝对误差的平均值;EVS用于测量预测值的残差与实际值和样本的实际值之间的分散程度的相似性;较低的MAE和MSE表示较好的拟合模型,较高的EVS通常表示较理想的结果;通过梯度提升回归算法建立的QSAR模型的训练集和测试集的拟合曲线参考图3;GBR算法用python语言编写,是一种流行的机器学习算法,已被证明在各个领域都获得了成功;
S7、对两个模型结果进行比较分析:
为了直观地比较步骤S5和步骤S6两个模型的结果,计算两个模型的新统计评估指标,如表2所示;显然,GBR中的训练集的R2,R2 CV与HM中的相同指标相比要高得多,而GBR中的训练集的S2与HM相比较小;结果表明非线性模型GBR表现出更好的预测效果。
表2通过HM和GBR建立的两种模型训练集结果的比较
R<sup>2</sup> R<sup>2</sup><sub>CV</sub> S<sup>2</sup>
HM 0.856 0.839 0.1045
GBR 0.943 0.925 0.0457
表3 84种抑制剂分子结构以及建立的两种QSAR模型的活性预测值
Figure BDA0003114619010000061
Figure BDA0003114619010000071
Figure BDA0003114619010000081
Figure BDA0003114619010000091
Figure BDA0003114619010000101
Figure BDA0003114619010000111
Figure BDA0003114619010000121
Figure BDA0003114619010000131
Figure BDA0003114619010000141
Figure BDA0003114619010000151
本技术方案先后通过HyperChem Professional软件和MOPAC软件对抑制剂分子结构进行了几何优化,并用CODESSA软件进行了描述符的筛选;先后通过启发式算法(HM)以及梯度提升回归(GBR)建立了果糖-1,6-双磷酸酶抑制剂的线性模型和非线性模型;结果表明GBR模型具有很好的拟合效果,也证明了在QSAR领域实施GBR新算法的可行性。线性模型的R2结果为0.856,非线性模型的R2结果为0.943,非线性模型具有出色的统计学意义。本技术方案为新的糖尿病药物的设计提供了巨大的可能性。

Claims (7)

1.一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,具体步骤如下:
S1、样本集的收集:
收集FBPase酶抑制剂分子的结构以及相对应的抑制活性;
S2、样本集的处理和优化:
对样本集的每个抑制剂分子进行结构优化;对抑制活性数据通过开平方运算的方法进行归一化处理以减少量纲对数据的影响;
S3、抑制剂分子描述符集的建立:
将优化之后的FBPase酶抑制剂分子结构输入CODESSA软件,计算并筛选出与其对应的分子描述符值,筛选后每个抑制剂分子包括两个描述符:MERICA和MNRISA,MERICA为C原子的最小电反应指数,MNRISA为S原子的最小核反应指数;
S4、数据集划分:
将抑制剂分子随机按照1:3的比例分为验证集和训练集,训练集用于构建模型,验证集用于初步验证模型的预测能力;
S5、启发式算法建立QSAR线性模型:
根据步骤S4中的训练集,建立抑制剂分子结构和抑制活性之间的关系模型,即用步骤S3得到的抑制剂描述符为自变量,抑制剂活性为因变量,运用CODESSA软件中的启发式算法得到QSAR线性模型;
S6、梯度提升回归算法建立QSAR非线性模型:
将所有分子描述符的数据和归一化处理后的抑制活性数据导入到梯度提升回归算法模块中并重新划分训练集和测试集,得到最终的非线性回归模型;
S7、对两个模型结果进行比较分析。
2.根据权利要求1所述的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,步骤S1中,FBPase酶的抑制剂为N-芳基磺酰基-吲哚-2-羧酰胺衍生物,具体为:从公开文献中共收集84种N-芳基磺酰基-吲哚-2-羧酰胺衍生物分子结构以及对应的抑制活性,抑制活性用IC50来衡量。
3.根据权利要求1所述的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,步骤S2的具体步骤为:先用ChemDraw Ultra 8.0软件将每个抑制剂的2D结构绘制出来,并保存为分子式,然后将分子式输入到HyperChemProfessional软件中,通过MM+和半经验方法对分子结构进行预优化,得到mol,mno,hin和zmt的4种格式的文件;此外,将zmt格式的文件导入到MOPAC程序中进一步优化。
4.根据权利要求1所述的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,步骤S3的具体步骤为:将mno和zmt文件地址导入Excel表格中并将Excel数据导入到应用程序CODESSA中,生成描述符共610个,然后通过模型交叉验证系数R2cv、决定系数R2、标准偏差平方S2来选择描述符个数,当描述符个数大于两个时,统计学指标改变并不明显,当描述符个数从一个变成两个时,统计学指标改变显著,因此选择两个描述符。
5.根据权利要求1所述的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,步骤S5得到的线性模型训练集的回归方程如下:
sqrt(IC50)=0.21012+232230MERICA+119710MNRISA,R2=0.856;R2 CV=0.839。
6.根据权利要求1所述的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,步骤S6得到的非线性模型训练集的R2=0.943。
7.根据权利要求1所述的基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法,其特征在于,计算步骤S5和步骤S6两个模型的统计评估指标R2、R2 CV和S2,通过分析评估指标对抑制剂分子活性进行预测。
CN202110682474.9A 2021-06-15 2021-06-15 一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法 Active CN113284566B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110682474.9A CN113284566B (zh) 2021-06-15 2021-06-15 一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110682474.9A CN113284566B (zh) 2021-06-15 2021-06-15 一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法

Publications (2)

Publication Number Publication Date
CN113284566A true CN113284566A (zh) 2021-08-20
CN113284566B CN113284566B (zh) 2023-07-14

Family

ID=77285072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110682474.9A Active CN113284566B (zh) 2021-06-15 2021-06-15 一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法

Country Status (1)

Country Link
CN (1) CN113284566B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114360661A (zh) * 2022-01-06 2022-04-15 中国人民解放军国防科技大学 基于群体智能优化模型的分子结构预测方法及相关设备
CN114496112A (zh) * 2022-01-21 2022-05-13 内蒙古工业大学 一种基于多目标优化的抗乳腺癌药物成分智能量化方法
CN114783506A (zh) * 2022-03-17 2022-07-22 大连理工大学 一种预测抑制剂对冠状病毒主蛋白酶的半抑制浓度的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010045510A2 (en) * 2008-10-15 2010-04-22 Ohio Norther University A model for glutamate racemase inhibitors and glutamate racemase antibacterial agents
CN104866710A (zh) * 2015-05-08 2015-08-26 西北师范大学 一种简化偏最小二乘预测细胞色素p450酶cyp1a2抑制剂的抑制浓度的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010045510A2 (en) * 2008-10-15 2010-04-22 Ohio Norther University A model for glutamate racemase inhibitors and glutamate racemase antibacterial agents
CN104866710A (zh) * 2015-05-08 2015-08-26 西北师范大学 一种简化偏最小二乘预测细胞色素p450酶cyp1a2抑制剂的抑制浓度的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
舒茂;王远强;林勇;林治华;: "基于定量构效关系预测血管紧张素转化酶抑制剂活性", 重庆工学院学报(自然科学版), no. 11 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114360661A (zh) * 2022-01-06 2022-04-15 中国人民解放军国防科技大学 基于群体智能优化模型的分子结构预测方法及相关设备
CN114360661B (zh) * 2022-01-06 2022-11-22 中国人民解放军国防科技大学 基于群体智能优化模型的分子结构预测方法及相关设备
CN114496112A (zh) * 2022-01-21 2022-05-13 内蒙古工业大学 一种基于多目标优化的抗乳腺癌药物成分智能量化方法
CN114496112B (zh) * 2022-01-21 2023-10-31 内蒙古工业大学 一种基于多目标优化的抗乳腺癌药物成分智能量化方法
CN114783506A (zh) * 2022-03-17 2022-07-22 大连理工大学 一种预测抑制剂对冠状病毒主蛋白酶的半抑制浓度的方法

Also Published As

Publication number Publication date
CN113284566B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN113284566B (zh) 一种基于定量构效关系模型实现预测果糖-1,6-双磷酸酶抑制剂的抑制活性的方法
Perakakis et al. Omics, big data and machine learning as tools to propel understanding of biological mechanisms and to discover novel diagnostics and therapeutics
Chetty et al. Role of attributes selection in classification of Chronic Kidney Disease patients
Rinaudo et al. Biosigner: a new method for the discovery of significant molecular signatures from omics data
Xia et al. Translational biomarker discovery in clinical metabolomics: an introductory tutorial
Li et al. Model population analysis for variable selection
Fonville et al. The evolution of partial least squares models and related chemometric approaches in metabonomics and metabolic phenotyping
JP6138768B2 (ja) ネットワークに基づく生物学的活性評価のためのシステムおよび方法
CN104915560A (zh) 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法
CN112435714A (zh) 一种肿瘤免疫亚型分类方法及系统
WO2006084196A2 (en) Method for defining virtual patient populations
CN109872776A (zh) 一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法及其应用
Liu et al. Predicting breast cancer recurrence and metastasis risk by integrating color and texture features of histopathological images and machine learning technologies
Sun et al. Combining bootstrap and uninformative variable elimination: Chemometric identification of metabonomic biomarkers by nonparametric analysis of discriminant partial least squares
CN105512454A (zh) 基于功能核磁共振的抑郁症患者自杀风险客观评估模型
CN113484511B (zh) 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用
CN104978474B (zh) 一种基于分子网络的药效评价方法及系统
Liu et al. Function-on-scalar quantile regression with application to mass spectrometry proteomics data
Li et al. COLMARq: a web server for 2D NMR peak picking and quantitative comparative analysis of cohorts of metabolomics samples
Qin et al. MLP-based regression prediction model for compound bioactivity
Xu et al. Diagnosis of Parkinson's Disease via the Metabolic Fingerprint in Saliva by Deep Learning
Qu et al. FAM171B as a novel biomarker mediates tissue immune microenvironment in pulmonary arterial hypertension
Labory et al. Benchmarking feature selection and feature extraction methods to improve the performances of machine-learning algorithms for patient classification using metabolomics biomedical data
CN108108589B (zh) 基于网络指标差异分析的食管鳞癌标记物的识别方法
CN116364179A (zh) 结直肠癌预后标志物筛选系统及方法、结直肠癌预后风险评估系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant