CN113160902A - 一种预测化学反应产物对映选择性的方法 - Google Patents

一种预测化学反应产物对映选择性的方法 Download PDF

Info

Publication number
CN113160902A
CN113160902A CN202110381811.0A CN202110381811A CN113160902A CN 113160902 A CN113160902 A CN 113160902A CN 202110381811 A CN202110381811 A CN 202110381811A CN 113160902 A CN113160902 A CN 113160902A
Authority
CN
China
Prior art keywords
reaction
enantioselectivity
molecular
predicting
chemical reaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110381811.0A
Other languages
English (en)
Other versions
CN113160902B (zh
Inventor
罗一
祝雪峰
温馨
赵雅男
王天航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Petrochina Co Ltd
Original Assignee
Dalian University of Technology
Petrochina Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology, Petrochina Co Ltd filed Critical Dalian University of Technology
Priority to CN202110381811.0A priority Critical patent/CN113160902B/zh
Publication of CN113160902A publication Critical patent/CN113160902A/zh
Application granted granted Critical
Publication of CN113160902B publication Critical patent/CN113160902B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Catalysts (AREA)

Abstract

本发明提供了一种预测化学反应产物对映选择性的方法,具体涉及一种通过八叉树卷积神经网络模型和分子表面静电势相结合,预测化学反应产物对映选择性的方法,在已知反应底物和催化剂分子结构的基础上,仅通过计算各分子结构点云和各点对应的表面静电势值,结合八叉树卷积神经网络模型,就能快速、高效地预测化学反应产物对映选择性。该方法通过计算分子结构的3D点云和其对应的表面静电势,同时体现分子的立体效应和电子效应,易于理解和应用。模型具有良好的预测能力,能够有效地预测应用域内有机反应的产率和对映选择性,这对发展制备手性化合物的新催化反应具有重要的意义。

Description

一种预测化学反应产物对映选择性的方法
技术领域
本发明属于化学研究技术领域,涉及一种预测化学反应产物对映选择性的方法,特别涉及一种基于八叉树卷积神经网络模型和分子表面静电势预测化学反应产物对映选择性的方法。
背景技术
手性化合物因为其具有特殊性质,在医药、光学以及特殊材料等新型领域中有非常广泛的应用。因此,如何高效制备单一对映体的有机化合物分子,不仅是科研领域的一个重要课题,同时也具有重要的应用价值。目前,获得高光学活性的手性分子主要有三种方法:外消旋化合物拆分、手性源合成法以及不对称催化合成法。其中,不对称催化合成法只需要少量的手性催化剂即可将大量前手性底物转化为手性产物,具有手性增值、经济、易实现工业化的优点,是获得光学活性手性物质最直接和高效的途径,也是最具挑战性的合成方法。新型高效手性催化剂的设计是实现不对称催化合成的关键技术,虽然在过去的几十年里,手性催化研究已经取得了较大进展,但是仍主要面临手性催化剂选择性和催化效率不够高等难题,达不到工业生产的要求。当前,实验上针对手性催化剂的研究主要是通过传统的试错法,然而这种方法容易浪费大量的时间和人力成本,妨碍了新型高效催化体系的研发。另一方面,还可以通过理论计算的手段,对拟研制催化剂进行性能预估,从而筛选出具有应用潜力的高效催化剂。但这种性能预估通常要事先计算催化剂分子结构、过渡态、反应热等数据,也相当耗时。因此,利用基于大数据的机器学习方法,并结合化合物分子的三维空间特征,探究不对称催化反应的活性与选择性规律,可更直观、迅速的判断不对称催化反应效率,为设计高效手性催化剂提供科学基础和实验依据。
近年来,随着计算机性能和化学信息学的不断发展,机器学习的方法已经在物理、材料、化学等各个领域展现出巨大的发展潜力,受到各界科研人员的高度重视。然而,利用机器学习方法解决化学问题时,首先需要面对的问题是描述符的选择,目前已报道的有多种常用化学描述符,例如分子指纹、SMILE编码以及通过DFT计算所得的各种化学参数如振动频率、化学位移等。若要全面考虑分子的各项特征,需要计算提供大量的描述符,此过程耗时费力,而且这些描述符都是将化合物分子的信息转化为二维数据传递给机器学习模型,没有考虑到化合物真实的三维立体空间效应。为了解决上述问题,本发明尝试通过基于八叉树的卷积神经网络模型和分子表面静电势结合预测化学反应产物对映选择性的方法。分子表面静电势能够同时描述分子的三维立体效应和电子效应,而基于八叉树的卷积神经网络对识别和分析三维形状特征非常高效,因此我们结合基于八叉树的卷积神经网络和分子表面静电势,可以实现对不同催化剂作用下得到的产物对映选择性进行高效快速的预测。
发明内容
本发明的目的是提供一种预测化学反应产物对映选择性的方法,其基于八叉树的卷积神经网络模型和分子表面静电势的结合,能够实现在较短时间内对化学反应产物的对映选择性的预测,精准筛选出对映选择性较高的催化剂体系,从而避免盲目合成新型手性催化剂,为手性催化剂的设计提供一种理论方法。
为了实现上述目的,本发明采用以下技术方案:
一种预测化学反应产物对映选择性的方法,其基于八叉树的卷积神经网络模型和分子表面静电势来预测化学反应产物对映选择性。所述的方法利用计算机构建大量反应底物和催化剂的分子结构模型,采用第一性原理对分子表面静电势进行计算,作为化学描述符,并采用机器学习模型对底物和催化剂分子组成的化学反应体系的对映选择性进行预测,实现对映选择性的高通量评估。
所述的预测化学反应产物对映选择性的方法包括以下步骤:
步骤1、筛选反应底物和催化剂,对反应底物和催化剂进行模型构建、通过DFT(密度泛函理论)几何优化,得到相对于其初始3D分子结构的热力学稳定3D结构。
1.1)获取已有实验文献,针对实验文献中同一反应类型,筛选该反应类型中涉及的催化剂和反应底物;
1.2)通过Gaussian16软件构建步骤1.1)中筛选的反应类型的催化剂和反应底物的初始3D分子结构;
1.3)采用DFT(密度泛函理论)几何优化方法优化步骤1.2)中所筛选反应类型的催化剂和反应底物的初始3D分子结构,得到各催化剂和反应底物相对于其初始3D分子结构的热力学稳定3D分子结构。
进一步地,在步骤1.1)中,所述的反应类型为胺化反应。
步骤2、采用Multiwfn+VMD软件,对步骤1)中经优化后的各催化剂和反应底物的热力学稳定的3D分子结构进行分子表面静电势计算,得到各催化剂和反应底物的热力学稳定3D分子结构的文本文件,文本文件均包含催化剂或反应底物的点云坐标(X,Y,Z)和与点云坐标相对应的分子表面静电势值(ESP);其中,分子表面静电势值作为电子效应描述符,点云坐标作为立体效应描述符,采用文本文件中四维向量形式(X,Y,Z,ESP)作为输入数据集。进一步地,本方法中,结合结构表面散点分子表面的静电势值(ESP)和其对应的点云坐标(X,Y,Z),能够同时体现出各催化剂和反应底物的电子和立体特征。
步骤3、将各反应的中涉及的催化剂和反应底物的热力学稳定3D分子结构的文本文件,以及该反应的ee值组合,并按照步骤1)中的实验文献中各反应的ee值分布顺序进行排列,以归纳步骤2)中的输入数据集,建立反应数据库。
在一些具体的实施方案中,根据体系的需求,为了提高预测的准确度,可以适当额外添加少量的分子描述符M,添加的分子描述符M选自前线分子轨道能、NPA电荷、核磁位移、红外振动频率、LUMO轨道、NBO电荷或及其任意组合。此时,四维向量数据表示为(X,Y,Z,M)。
步骤4、将步骤3)获得的反应数据库中数据的60-80%作为训练集,20-40%作为测试集;优选地,反应数据库中数据的70%作为训练集,30%作为测试集。
步骤5、使用步骤4)中获得的训练集数据,采用机器学习算法,建立化学反应产物对映选择性的预测模型,保存训练所得到的最优预测模型。
在一些具体的实施方案中,所述的化学反应产物对映选择性的预测模型为基于八叉树的卷积神经网络模型。所述的基于八叉树的卷积神经网络模型不需要进行任何的数据降维处理,能够处理三维数据集,提取描述符特征。
更进一步地,八叉树的卷积神经网络模型为专利CN108805261A(申请号201710297300.4,申请日2017年04月28日)中所公开的八叉树的卷积神经网络模型。
在一些具体的实施方案中,在步骤5)中,所述的训练通过Python进行。
步骤6、采用步骤5)中训练好的预测模型,对步骤4)中获得的测试集数据进行化学反应产物的对映选择性预测,预测过程中,选择步骤1)中实验文献的ee值作为响应变量,根据步骤2)中获得的分子表面静电势值(ESP)作为描述符,将通过步骤5获得的最优预测模型的预测结果和步骤1)中实验文献的实验结果进行拟合,记录拟合的确定系数(R2)和均方根误差(RMSE),R2(测试集)值越大(<1,且验证后不存在过拟合情况),证明拟合效果越好。
在一些具体的实施方案中,在步骤6)中,所述的预测通过Python进行。
步骤7、重复多次步骤4-6,统计每次的确定系数(R2)和均方根误差(RMSE),并对多次结果取平均值。
本发明的效果和益处在于:
1)采用分子表面静电势作为描述符既能描述分子的三维立体特征,又能描述分子的电子特征,需要通过理论计算的其它描述符相对较少,节约计算资源,结果准确可靠;
2)利用基于八叉树的卷积神经网络能够直接学习分子的三维特征,无需额外通过主成分分析等手段对描述符进行降维处理,保证了分子特征的完整性。
附图说明
图1为本发明实施例中提供的预测化学反应产物对映选择性的方法的流程图。
图2为采用本发明实施例中提供的预测化学反应产物对映选择性方法的预测结果和实验结果拟合图。
具体实施方式
以下结合附图和技术方案,进一步说明本发明的具体实施方式。
实施例
预测化学反应产物对映选择性的方法,包括:
1)收集文献已发表的手性磷酸催化N-酰基亚胺的硫醇加成反应实验数据(Prediction of higher-selectivity catalysts by computer-driven workflow andmachine learning.Science,2019,363,247),一共975个化学反应,涉及手性磷酸催化剂39个,反应底物10个;
2)对包含底物和催化剂的49个化合物进行分子结构的建模,采用Gaussian16软件中的B3LYP/6-31G*理论方法进行优化,之后计算分子表面静电势(为了预测结果更加准确,实施例中还计算了硫醇的前线分子轨道能级(LUMO)作为描述符),并采用生成包含分子表面结构点云的坐标文件;
3)随机将计算得到的数据集中70%划分为训练集,30%划分为测试集,并将训练集用于机器学习模型的训练;
4)通过多次调整模型参数训练,得到理想的机器学习模型,并将模型保存;
5)用训练好的模型对测试集进行产物对映选择性的预测,并记录预测的结果;
6)将预测的结果与实验已报道的结果进行拟合,计算拟合的确定系数R2和均方根误差RMSE,并重复多次上述3-6过程,对多次得到的确定系数和均方根误差取平均值。
7)最终,经过多次预测,得到拟合确定系数均值为0.93,均方根误差均值为0.06,说明模型具有较高的预测精度。
以上示例性实施方式所呈现的描述仅用以说明本发明的技术方案,并不想要成为毫无遗漏的,也不想要把本发明限制为所描述的精确形式。显然,本领域的普通技术人员根据上述教导做出很多改变和变化都是可能的。选择示例性实施方式并进行描述是为了解释本发明的特定原理及其实际应用,从而使得本领域的其它技术人员便于理解、实现并利用本发明的各种示例性实施方式及其各种选择形式和修改形式。本发明的保护范围意在由所附权利要求书及其等效形式所限定。

Claims (7)

1.一种预测化学反应产物对映选择性的方法,其特征在于,所述的预测化学反应产物对映选择性的方法包括以下步骤:
步骤1、筛选反应底物和催化剂,对反应底物和催化剂进行模型构建、通过密度泛函理论几何优化,得到相对于其初始3D分子结构的热力学稳定3D结构;
步骤2、采用Multiwfn+VMD软件,对步骤1)中经优化后的各催化剂和反应底物的热力学稳定的3D分子结构进行分子表面静电势计算,得到各催化剂和反应底物的热力学稳定的3D分子结构的文本文件,文本文件均包含催化剂或反应底物的点云坐标和与点云坐标相对应的分子表面静电势值;其中,分子表面静电势值作为电子效应描述符,点云坐标作为立体效应描述符,采用文本文件中三维形式数据作为输入数据集;
步骤3、将各反应中涉及的催化剂和反应底物热力学稳定的3D分子结构文本文件,以及该反应的ee值组合,并按照步骤1)中的实验文献中的各反应的ee值的分布顺序进行排列,以归纳步骤2)中的输入数据集,建立反应数据库;
步骤4、将步骤3)获得的反应数据库中数据的60-80%作为训练集,20-40%作为测试集;
步骤5、使用步骤4)中获得的训练集数据,采用机器学习算法,建立化学反应产物对映选择性的预测模型,保存训练所得到的最优预测模型;
步骤6、采用步骤5)中训练好的预测模型,对步骤4)中获得的测试集数据进行化学反应产物的对映选择性预测,预测过程中,选择步骤1)中实验文献的ee值作为响应变量,根据步骤2)中获得的分子表面静电势值作为描述符,将通过步骤5)获得的最优预测模型的预测结果和步骤1)中实验文献中的实验结果进行拟合,记录拟合的确定系数和均方根误差。
2.根据权利要求1所述的预测化学反应产物对映选择性的方法,其特征在于,步骤1)具体包括以下步骤:
1.1)获取已有实验文献,针对实验文献中同一反应类型,筛选该反应类型中涉及的催化剂和反应底物;
1.2)通过Gaussian16软件构建步骤1.1)中筛选反应类型的催化剂和反应底物初始3D分子结构;
1.3)采用密度泛函理论几何优化方法优化步骤1.2)中所筛选反应类型的催化剂和反应底物的初始3D分子结构,得到各催化剂和反应底物相对于其初始3D分子结构的热力学稳定结构。
3.根据权利要求2所述的预测化学反应产物对映选择性的方法,其特征在于,在步骤1.1)中,所述的反应类型为胺化反应。
4.根据权利要求1-3中任一项所述的预测化学反应产物对映选择性的方法,其特征在于,在步骤2)中,添加分子描述符M,所述的分子描述符M选自前线分子轨道能、NPA电荷、核磁位移、红外振动频率、LUMO轨道、NBO电荷或及其任意组合。
5.根据权利要求1-3中任一项所述的预测化学反应产物对映选择性的方法,其特征在于,所述的化学反应产物对映选择性的预测模型为基于八叉树的卷积神经网络模型。
6.根据权利要求4所述的预测化学反应产物对映选择性的方法,其特征在于,所述的化学反应产物对映选择性的预测模型为基于八叉树的卷积神经网络模型。
7.根据权利要求1所述的预测化学反应产物对映选择性的方法,其特征在于,所述的预测化学反应产物对映选择性的方法在步骤6)后,还包括以下步骤:
步骤7、重复步骤4)至步骤6),统计每次重复所确定系数和均方根误差,并对结果取平均值。
CN202110381811.0A 2021-04-09 2021-04-09 一种预测化学反应产物对映选择性的方法 Active CN113160902B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110381811.0A CN113160902B (zh) 2021-04-09 2021-04-09 一种预测化学反应产物对映选择性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110381811.0A CN113160902B (zh) 2021-04-09 2021-04-09 一种预测化学反应产物对映选择性的方法

Publications (2)

Publication Number Publication Date
CN113160902A true CN113160902A (zh) 2021-07-23
CN113160902B CN113160902B (zh) 2024-05-10

Family

ID=76889298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110381811.0A Active CN113160902B (zh) 2021-04-09 2021-04-09 一种预测化学反应产物对映选择性的方法

Country Status (1)

Country Link
CN (1) CN113160902B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114496111A (zh) * 2022-01-28 2022-05-13 厦门大学 一种基于机器学习快速预测核磁共振化学位移的方法
CN114783506A (zh) * 2022-03-17 2022-07-22 大连理工大学 一种预测抑制剂对冠状病毒主蛋白酶的半抑制浓度的方法
CN114974450A (zh) * 2022-06-28 2022-08-30 苏州沃时数字科技有限公司 基于机器学习与自动化试验装置的操作步骤的生成方法
CN115171807A (zh) * 2022-09-07 2022-10-11 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统
WO2023133678A1 (zh) * 2022-01-11 2023-07-20 上海药明康德新药开发有限公司 一种预测化学反应的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805261A (zh) * 2017-04-28 2018-11-13 微软技术许可有限责任公司 基于八叉树的卷积神经网络
CN111613276A (zh) * 2020-05-12 2020-09-01 中南大学 一种基于量子化学参数构建定量构效关系预测微塑料吸附有机物的方法
CN112086141A (zh) * 2020-09-09 2020-12-15 扬州大学 基于定量结构性质关系预测有机污染物pa-水分配系数的方法
CN112185458A (zh) * 2020-10-23 2021-01-05 深圳晶泰科技有限公司 基于卷积神经网络预测蛋白和配体分子结合自由能的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805261A (zh) * 2017-04-28 2018-11-13 微软技术许可有限责任公司 基于八叉树的卷积神经网络
CN111613276A (zh) * 2020-05-12 2020-09-01 中南大学 一种基于量子化学参数构建定量构效关系预测微塑料吸附有机物的方法
CN112086141A (zh) * 2020-09-09 2020-12-15 扬州大学 基于定量结构性质关系预测有机污染物pa-水分配系数的方法
CN112185458A (zh) * 2020-10-23 2021-01-05 深圳晶泰科技有限公司 基于卷积神经网络预测蛋白和配体分子结合自由能的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘晓菊等: "DFT方法研究无水AlCl3催化剂对二茂铁乙酰化反应的影响", 《工业催化》, vol. 28, no. 6, pages 32 - 34 *
唐海飞等: "莲心碱定量分子表面分析及反应位点预测", 《山西卫生健康职业学院学报》, vol. 30, no. 6, pages 7 - 9 *
曹继鹏等: "1-(2-羟乙基)-3-甲基咪唑溴化盐的合成及其催化性能研究", 《西安石油大学学报(自然科学版)》, vol. 33, no. 3, pages 75 - 78 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023133678A1 (zh) * 2022-01-11 2023-07-20 上海药明康德新药开发有限公司 一种预测化学反应的方法
CN114496111A (zh) * 2022-01-28 2022-05-13 厦门大学 一种基于机器学习快速预测核磁共振化学位移的方法
CN114783506A (zh) * 2022-03-17 2022-07-22 大连理工大学 一种预测抑制剂对冠状病毒主蛋白酶的半抑制浓度的方法
CN114974450A (zh) * 2022-06-28 2022-08-30 苏州沃时数字科技有限公司 基于机器学习与自动化试验装置的操作步骤的生成方法
CN115171807A (zh) * 2022-09-07 2022-10-11 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统
CN115171807B (zh) * 2022-09-07 2022-12-06 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统

Also Published As

Publication number Publication date
CN113160902B (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
CN113160902B (zh) 一种预测化学反应产物对映选择性的方法
Foscato et al. Automated in silico design of homogeneous catalysts
Medford et al. Extracting knowledge from data through catalysis informatics
Simm et al. Context-driven exploration of complex chemical reaction networks
Durham et al. PREDICTD parallel epigenomics data imputation with cloud-based tensor decomposition
Chen et al. Atomic energies from a convolutional neural network
dos Passos Gomes et al. Navigating through the maze of homogeneous catalyst design with machine learning
Rinehart et al. Dreams, false starts, dead ends, and redemption: a chronicle of the evolution of a chemoinformatic workflow for the optimization of enantioselective catalysts
Sharma et al. DeepFeature: feature selection in nonimage data using convolutional neural network
Gensch et al. Design and application of a screening set for monophosphine ligands in cross-coupling
CN112149881B (zh) 一种基于卷积神经网络的dna绑定残基预测方法
Isakov et al. HPC I/O throughput bottleneck analysis with explainable local models
Mills et al. Exploring potential energy surfaces using reinforcement machine learning
Harada et al. Structural dissimilarity sampling with dynamically self‐guiding selection
de Oliveira et al. Towards optimizing the execution of spark scientific workflows using machine learning‐based parameter tuning
CN113362905B (zh) 一种基于深度学习的不对称催化反应对映选择性预测方法
Zankov et al. Multi-instance learning approach to the modeling of enantioselectivity of conformationally flexible organic catalysts
Wang et al. Molecular generation strategy and optimization based on A2C reinforcement learning in de novo drug design
CN112837740B (zh) 一种基于结构特征的dna绑定残基预测方法
Smith et al. A parallel disassembly method for green product design
Rinehart et al. Leveraging machine learning for enantioselective catalysis: From dream to reality
Al-Janabi et al. Synthesis biometric materials based on cooperative among (DSA, WOA and gSpan-FBR) to water treatment
Liu et al. Parallel pattern-based systems for computational biology: A case study
Demir et al. SE (3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive Molecular Property Prediction
CN111052252A (zh) 用于对生化环境建模的异构方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant