CN115204370A - 反应产物预测模型参数调整方法、应用方法、装置及设备 - Google Patents
反应产物预测模型参数调整方法、应用方法、装置及设备 Download PDFInfo
- Publication number
- CN115204370A CN115204370A CN202210826462.3A CN202210826462A CN115204370A CN 115204370 A CN115204370 A CN 115204370A CN 202210826462 A CN202210826462 A CN 202210826462A CN 115204370 A CN115204370 A CN 115204370A
- Authority
- CN
- China
- Prior art keywords
- sample
- reaction
- reaction product
- reactant
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种反应产物预测模型参数调整方法、应用方法、装置及设备,相关实施例可应用于人工智能等各种场景,用于降低预测成本和提高预测精度。该方法包括:通过第一辅助网络构造正样本反应物集合和负样本反应物集合,基于正样本反应物集合和负样本反应物集合计算反应预测损失值,通过第二辅助网络构造正样本反应组集合和负样本反应组集合,基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签,计算原子预测损失值,基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
Description
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种反应产物预测模型参数调整方法、应用方法、装置及设备。
背景技术
有机化学反应产物预测任务对于计算化学以及制药等领域都有着极为重要的意义。
而传统的有机化学反应预测方法依赖于常见的反应模板来预测可能的生成物结构,但有机化学反应种类繁多,新的反应随着化学研究的日益精深层出不穷,导致反应模板难以覆盖所有的反应类型并且无法使用在新出现的反应类型上,因此,随着深度学习技术的发展,使用深度学习技术从有机化学反应数据中学习到潜在反应规律就显得尤为重要。
但是,目前使用的对有机化学反应数据进行深度学习的技术通常是依赖于大量的人工标签来实现对预测模型的训练任务,而人工标签数据往往非常昂贵的,且随着化学反应数据的数据量增大,需要大量的人工标注来支持,会耗费大量的人力成本和时间成本,从而导致有机化学反应产物预测任务的成本高昂。
发明内容
本申请实施例提供了一种反应产物预测模型参数调整方法、应用方法、装置及设备,用于通过具有自监督性质的第一辅助网络、第二辅助网络以及第三辅助网络,从对样本反应数据集合的数据本身特性来挖掘和构造正负样本集合以及原子标签等,以实现对样本反应数据集合的数据的自动标注,而不依赖于人工标注,从而可以降低反应产物预测任务的成本,并且,通过自监督辅助任务,增加对多个分子之间的关系学习,增强与反应产物预测任务的相关性,提高反应产物预测模型对反应产物的预测精度。
本申请实施例一方面提供了一种反应产物预测模型参数调整方法,包括:
将样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,样本反应数据集合包括多个反应数组,每个反应数组包括样本反应物和样本反应产物;
将样本反应物向量输入至第一辅助网络,通过第一辅助网络构造正样本反应物集合和负样本反应物集合;
基于正样本反应物集合和负样本反应物集合计算反应预测损失值;
将样本反应物向量和样本反应产物向量输入至第二辅助网络,通过第二辅助网络构造正样本反应组集合和负样本反应组集合;
基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值;
将样本反应物向量和样本反应产物向量输入至第三辅助网络,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签;
基于预测概率值以及原子标签计算原子预测损失值;
基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
本申请另一方面提供了一种反应产物预测模型的应用方法,包括:
将待测反应物输入至上述目标反应产物预测模型,通过目标反应产物预测模型输出邻接矩阵的预测变化概率;
基于邻接矩阵的预测变化概率计算邻接矩阵的预测变化量;
基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵,确定目标反应产物。
本申请另一方面提供了一种反应产物预测模型参数调整装置,包括:
获取单元,用于将样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,样本反应数据集合包括多个反应数组,每个反应数组包括样本反应物和样本反应产物;
获取单元,还用于将样本反应物向量输入至第一辅助网络,通过第一辅助网络构造正样本反应物集合和负样本反应物集合;
处理单元,用于基于正样本反应物集合和负样本反应物集合计算反应预测损失值;
获取单元,用于将样本反应物向量和样本反应产物向量输入至第二辅助网络,通过第二辅助网络构造正样本反应组集合和负样本反应组集合;
处理单元,还用于基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值;
获取单元,用于将样本反应物向量和样本反应产物向量输入至第三辅助网络,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签;
处理单元,还用于基于预测概率值以及原子标签计算原子预测损失值;
确定单元,用于基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,
处理单元,还用于对样本反应数据集合进行数据增广处理,得到样本复合反应数据集合;
处理单元,还用于将样本反应数据集合以及样本复合反应数据集合汇总为扩展样本反应数据集合;
获取单元具体可以用于:将扩展样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对扩展样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,获取单元具体可以用于:
从同一反应数组中采样任意两个样本反应物向量,作为正样本反应物组合,以汇总到正样本反应物集合;
从不同反应数组中采样任意两个样本反应物向量,作为负样本反应物组合,以汇总到负样本反应物集合。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,获取单元具体可以用于:
将所有反应数组对应的样本反应物向量和样本反应产物向量,作为正样本反应组集合;
将样本反应物向量和样本反应产物向量进行错配,得到负样本反应组集合。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,获取单元具体可以用于:
通过第三辅助网络对样本反应物进行预测,得到样本反应物中的原子存在于主产物中的预测概率值;
基于将样本反应物向量和样本反应产物向量,进行样本反应物和样本产物中的原子比对,得到原子比对结果;
基于原子比对结果确定原子标签。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,获取单元具体可以用于:
针对于每个反应数组,将样本反应物的每个分子内部的信息在原子之间进行交互,得到样本反应物交互信息;
基于样本反应物交互信息在不同样本反应物之间进行交互,得到样本反应物向量;
针对于每个反应数组,将样本反应产物的每个分子内部的信息在原子之间进行交互,得到样本反应产物交互信息;
基于样本反应产物交互信息在不同样本反应物之间进行交互,得到样本反应产物向量。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:
从样本反应数据集合中随机选取两个反应数组;
将选取得到的两个反应数组中的样本反应物进行组合,得到样本复合反应物;
将选取得到的两个反应数组中的样本反应产物进行组合,得到样本复合反应产物;
基于样本复合反应物以及样本复合反应产物,得到复合反应数组,以获取到样本复合反应数据集合。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,确定单元具体可以用于:
获取重构损失值以及散度损失值;
基于重构损失值、散度损失值、反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,确定单元具体可以用于:
对样本反应物向量以及样本反应产物向量采用注意力机制,得到第一隐向量;
基于第一隐向量和样本反应物向量计算得到第二隐向量;
将第二隐向量输入至反应产物预测模型的解码网络,通过解码网络输出邻接矩阵的样本预测变化概率;
基于样本预测变化概率,确定样本预测反应产物邻接矩阵;
基于样本反应产物的反应产物邻接矩阵和样本预测反应产物邻接矩阵进行损失计算,得到重构损失值以及散度损失值。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,确定单元具体可以用于:
基于样本预测变化概率计算邻接矩阵的样本预测变化量;
基于邻接矩阵的样本预测变化量以及样本反应物的邻接矩阵,计算样本预测反应产物邻接矩阵。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,确定单元具体可以用于:
基于反应预测损失值对第一辅助网络进行参数调整,得到第一子模型;
基于反应关系预测损失值对第二辅助网络进行参数调整,得到第二子模型;
基于原子预测损失值对第三辅助网络进行参数调整,得到第三子模型;
将第一子模型、第二子模型以及第三子模型迁移至反应产物预测模型,得到目标反应产物预测模型。
本申请另一方面提供了一种反应产物预测模型的应用装置,包括:
获取单元,用于将待测反应物输入至目标反应产物预测模型,通过目标反应产物预测模型输出邻接矩阵的预测变化概率;
处理单元,用于基于邻接矩阵的预测变化概率计算邻接矩阵的预测变化量;
确定单元,用于基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵,确定目标反应产物。
在一种可能的设计中,本申请实施例另一方面的一种实现方式中,确定单元具体可以用于:
基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵计算预测反应产物邻接矩阵;
对预测反应产物邻接矩阵进行对称化处理,得到目标反应产物邻接矩阵;
基于目标反应产物邻接矩阵,确定目标反应产物。
本申请另一方面提供了一种计算机设备,包括:存储器、处理器以及总线系统;
其中,存储器用于存储程序;
处理器用于执行存储器中的程序时实现如上述各方面的方法;
总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。
本申请的另一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
从以上技术方案可以看出,本申请实施例具有以下有益效果:
通过获取到样本反应物向量以及样本反应产物向量,并通过第一辅助网络构造正样本反应物集合和负样本反应物集合,基于正样本反应物集合和负样本反应物集合计算反应预测损失值,同时,通过第二辅助网络构造正样本反应组集合和负样本反应组集合,并基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值,以及通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签,并基于预测概率值以及原子标签计算原子预测损失值,然后,可以基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,以获取到目标反应产物预测模型。通过上述方式,能够基于具有自监督性质的第一辅助网络、第二辅助网络以及第三辅助网络,从对样本反应数据集合的数据本身特性来挖掘和构造正负样本集合以及原子标签等,以实现对样本反应数据集合的数据的自动标注,而不依赖于人工标注,从而可以降低反应产物预测任务的成本,并且,通过第一辅助网络帮助反应产物预测模型能够更好地学习到反应物之间的距离关系,使得反应产物预测模型具有预测反应物是否可以发生反应的能力,以及通过第二辅助网络帮助反应产物预测模型能够更好地学习到反应物与产物之间的距离关系,使得反应产物预测模型具有预测反应物和产物之间的对应关系的能力,以及通过第三辅助网络帮助反应产物预测模型能够更好地学习到反应物的原子和原子之间的键位关系在反应过程中发生的变化,使得反应产物预测模型具有预测原子发生反应之后是否仍然在主产物的能力,从而能够基于这些辅助网络的辅助学习,提高反应产物预测模型对反应产物的预测精度。
附图说明
图1是本申请实施例中反应数据控制系统的一个架构示意图;
图2是本申请实施例中反应产物预测模型参数调整方法的一个实施例流程图;
图3是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图4是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图5是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图6是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图7是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图8是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图9是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图10是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图11是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图12是本申请实施例中反应产物预测模型参数调整方法的另一个实施例流程图;
图13是本申请实施例中反应产物预测模型的应用方法的一个实施例流程图;
图14是本申请实施例中反应产物预测模型的应用方法的另一个实施例流程图;
图15是本申请实施例中反应产物预测模型参数调整方法的一个辅助网络示意图;
图16是本申请实施例中反应产物预测模型参数调整方法的一个反应产物预测模型原理框架示意图;
图17是本申请实施例中反应产物预测模型参数调整装置的一个实施例示意图;
图18是本申请实施例中反应产物预测模型的应用装置的一个实施例示意图;
图19是本申请实施例中计算机设备的一个实施例示意图。
具体实施方式
本申请实施例提供了一种反应产物预测模型参数调整方法、应用方法、装置及设备,用于通过具有自监督性质的第一辅助网络、第二辅助网络以及第三辅助网络,从对样本反应数据集合的数据本身特性来挖掘和构造正负样本集合以及原子标签等,以实现对样本反应数据集合的数据的自动标注,而不依赖于人工标注,从而可以降低反应产物预测任务的成本,并且,通过自监督辅助任务,增加对多个分子之间的关系学习,增强与反应产物预测任务的相关性,提高反应产物预测模型对反应产物的预测精度。
本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于理解,先对本申请实施例涉及到的一些术语或概念进行解释。
1、转换器(Transformer)
转换器(Transformer)是由编码部分encoder和解码部分decoder组成的,能够使用自注意力机制,不采用循环神经网络(Recurrent Neural Network,RNN)和长短期记忆网络(Long Short-Term Memory,LSTM)的顺序结构,使得模型可以并行化训练,而且能够拥有全局信息。
2、对比学习(Contrastive Learning)
对比学习是一种自监督学习方法,用于在没有标签的情况下,通过让模型学习哪些数据点相似或不同来学习数据集的一般特征。
3、图神经网络(Graph Neural Networks)
图神经网络包括图卷积网络(Graph Convolutional Networks)、图注意力网络(Graph Attention Networks)、图自编码机(Graph Auto-encoder)、图生成网络(GraphGenerative Networks)、图时空网络(Graph Spatial-Temporal Networks),相比较于神经网络最基本的网络结构全连接层(MLP),特征矩阵乘以权重矩阵,图神经网络多了一个邻接矩阵。
4、辅助任务(Auxiliary Task)
辅助任务是在强化学习中,使用辅助任务来帮助主任务的学习是重要的一类方法。主任务在学习中,由于奖励的稀疏性和任务的困难,可以使用辅助任务帮助学习特征表示。
可以理解的是,在本申请的具体实施方式中,涉及到样本反应数据集合等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
可以理解的是,如本申请所公开的反应产物预测模型参数调整方法,还涉及人工智能(Artificial Intelligence,AI)技术,下面进一步地对人工智能技术进行介绍。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其次,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
其次,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
应理解的是,本申请提供的反应产物预测模型参数调整方法可应用于各种场景,包括但不限于人工智能、云技术、计算化学、制药等,用于通过训练强有力的反应产物预测模型,完成对反应产物预测任务的优化,以应用于如药物逆合成验证、科学规律挖掘、研发制药等场景。
为了解决上述问题,本申请提出了一种反应产物预测模型参数调整方法,该方法应用于图1所示的反应数据控制系统,请参阅图1,图1为本申请实施例中反应数据控制系统的一个架构示意图,如图1所示,服务器通过获取与终端设备提供的样本反应数据集合,获取到样本反应物向量以及样本反应产物向量,并通过第一辅助网络构造正样本反应物集合和负样本反应物集合,基于正样本反应物集合和负样本反应物集合计算反应预测损失值,同时,通过第二辅助网络构造正样本反应组集合和负样本反应组集合,并基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值,以及通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签,并基于预测概率值以及原子标签计算原子预测损失值,然后,可以基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,以获取到目标反应产物预测模型。通过上述方式,能够基于具有自监督性质的第一辅助网络、第二辅助网络以及第三辅助网络,从对样本反应数据集合的数据本身特性来挖掘和构造正负样本集合以及原子标签等,以实现对样本反应数据集合的数据的自动标注,而不依赖于人工标注,从而可以降低反应产物预测任务的成本,并且,通过第一辅助网络帮助反应产物预测模型能够更好地学习到反应物之间的距离关系,使得反应产物预测模型具有预测反应物是否可以发生反应的能力,以及通过第二辅助网络帮助反应产物预测模型能够更好地学习到反应物与产物之间的距离关系,使得反应产物预测模型具有预测反应物和产物之间的对应关系的能力,以及通过第三辅助网络帮助反应产物预测模型能够更好地学习到反应物的原子和原子之间的键位关系在反应过程中发生的变化,使得反应产物预测模型具有预测原子发生反应之后是否仍然在主产物的能力,从而能够基于这些辅助网络的辅助学习,提高反应产物预测模型对反应产物的预测精度。
可以理解的是,图1中仅示出了一种终端设备,在实际场景中可以由更多种类的终端设备参与到数据处理的过程中,终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等,具体数量和种类因实际场景而定,具体此处不做限定。另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,特别是在多模型训练交互的场景中,服务器的数量因实际场景而定,具体此处不做限定。
需要注意的是,本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdelivery network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,终端设备以及服务器可以连接组成区块链网络,本申请在此不做限制。
结合上述介绍,下面将对本申请中反应产物预测模型参数调整方法进行介绍,请参阅图2,本申请实施例中反应产物预测模型参数调整方法一个实施例包括:
在步骤S101中,将样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,样本反应数据集合包括多个反应数组,每个反应数组包括样本反应物和样本反应产物;
可以理解的是,样本反应数据集合包括多个反应数组,每个反应数组可以表示为(Gr,Gp),每个反应数组用于表示一个有机化学反应数据R1+R2+...→P1+P2+...,Gr代表一系列样本反应物,Gp代表一系列生成物,即样本反应产物。
其中,分子图G=(V,E)中的V代表原子集合并且集合大小是原子个数|V|=N,每一个原子v∈V都关联着一个原子特征,包括原子的种类、带电性、芳香性等。代表边的集合,每一条边都关联一个键位种类,包括单键、双键、三键、芳香键等。有机化学反应预测的目标就是,给定反应物,预测生成物。
进一步地,由于有机化学反应中的原子对应原则(atom-mapping principle),反应物和生成物中的原子一一对应,所以反应前后主要是原子之间连接的变化,即邻接矩阵A的变化,涉及到的原子并没有发生变化。因此,预测生成物(即反应产物)只需要预测其对应的邻接矩阵,即可还原整个生成物的结构。其中,本实施例使用的邻接矩阵不同于普通邻接矩阵。又由于预测邻接矩阵A的变化即ΔA比直接预测产物A的更容易,故本实施例可以将有机化学反应预测问题转变成建模概率分布P(ΔA|Gr)。
由此,为了后续更好地建模概率分布P(ΔA|Gr),将首先获取样本反应数据集合,并将样本反应数据集合输入至反应产物预测模型中,再通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,以获取到样本反应物向量以及样本反应产物向量。
其中,反应产物预测模型具体可以表现为如图16所示意的满足电子转移守恒的VAE架构,还可以表现为其他的模型,例如,流模型(flow-based model)、极大似然训练(maximum likelihood training)、deep VAE等等,此处不作具体限制。
进一步地,如果反应产物预测模型使用如图16所示意的满足电子转移守恒的VAE架构,则可以通过如图16所示意的图神经网络GNN和转换器Transformer,对样本反应数据集合中的每个反应数组进行向量转化,以获取到样本反应物向量以及样本反应产物向量。
在步骤S102中,将样本反应物向量输入至第一辅助网络,通过第一辅助网络构造正样本反应物集合和负样本反应物集合;
在本实施例中,由于在建模的过程中对于反应产物的预测都是假定给定的反应物一定可以发生反应,但在实际场景中,并非所以的反应物都会发生反应,因此,一个正确的反应产物预测模型,应该具备分辨反应物是否可以发生反应的能力,又由于在embedding空间,不能发生反应的分子之间应相距较远,能发生反应的分子之间应相距较近,故本实施例通过构造一个用于预测反应物是否可以发生反应的辅助任务,即第一辅助网络,来构造正样本反应物集合和负样本反应物集合,以帮助反应产物预测模型学习分子之间的距离,从而可以学习到分辨反应物是否可以发生反应的能力,以增强分子表示的泛化能力。由此,在获取到样本反应物向量之后,将样本反应物向量输入至第一辅助网络,通过第一辅助网络构造得到正样本反应物集合和负样本反应物集合。
具体地,将样本反应物向量输入至如图15所示意的任务Task1即第一辅助网络中,从同一反应数组如R11+R12+R13→P11中采样任意两个样本反应物向量,作为正样本反应物组合,如R11+R12、R11+R13以及R12+R13等,从而可以汇总到正样本反应物集合positive;
进一步地,可以从不同反应数组如R11+R12+R13→P11和R21+R22+R23→P21中采样任意两个样本反应物向量,作为负样本反应物组合,如R11+R22、R12+R23以及R21+R13等,从而汇总到负样本反应物集合negative。
在步骤S103中,基于正样本反应物集合和负样本反应物集合计算反应预测损失值;
在本实施例中,反应预测损失值用于表示反应产物预测模型分辨反应物是否可以发生反应的能力。
具体地,在获取到正样本反应物集合和负样本反应物集合之后,可以采用如下损失函数公式(1)计算反应预测损失值:
其中,Dpos表示正样本反应物集合,Dneg表示负样本反应物集合,(i,j)分别用于表示从对应的样本反应物集合中采样到的正样本反应物组合或负样本反应物组合,ε和γ是两个边缘超参数(margin hyperparameter),hi和hj样本反应物i和j的样本反应物向量embedding,可以理解的是,上述损失函数公式(1)的第一项可以用于减小正样本分子之间的embedding距离,第二项可以用于增大负样本分子之间的embedding距离。
在步骤S104中,将样本反应物向量和样本反应产物向量输入至第二辅助网络,通过第二辅助网络构造正样本反应组集合和负样本反应组集合;
在本实施例中,由于候选产物的排序ranking是一个重要信息,可以让反应产物预测模型接收到关于不同候选产物的可能性评分,故本实施例通过构造一个用于预测反应物和产物是否是正确的对应关系的辅助任务,即第二辅助网络,来帮助反应产物预测模型学习反应物与反应产物之间的关系,从而可以学习到分辨反应物与反应产物是否是正确关系的能力,以增强分子表示的泛化能力。由此,在获取到样本反应物向量和样本反应产物向量之后,将样本反应物向量和样本反应产物向量输入至第二辅助网络,通过第二辅助网络构造得到正样本反应组集合和负样本反应组集合。
具体地,将样本反应物向量和样本反应产物向量输入至如图15所示意的任务Task2即第二辅助网络中,将所有反应数组对应的样本反应物向量和样本反应产物向量,例如,一组反应数组中R11+R12+R13→P11,反应物R11+R12+R13与反应产物P11是正确关系的,即可作为正样本反应组集合。
进一步地,可以通过错配反应物和反应产物构造负样本反应组集合,让具有错误关系反应物和反应产物之间的匹配分数更低,例如,一组反应数组中R11+R12+R13→P11,反应物R11+R12+R13与反应产物P11是正确关系的,以及,另一组反应数组中R21+R22+R23→P21,反应物R21+R22+R23与反应产物P21是正确关系的,通过错配反应物和反应产物,可以得到如R11+R12+R13→P21以及R21+R22+R23→P11等反应物和反应产物之间关系错误的负样本反应组集合。
将样本反应物向量和样本反应产物向量进行错配,得到负样本反应组集合。
在步骤S105中,基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值;
在本实施例中,反应关系预测损失值用于表示反应产物预测模型分辨反应物与反应产物之间是否是正确关系的能力。
具体地,在获取到正样本反应组集合和负样本反应组集合之后,可以采用如下损失函数公式(2)计算反应关系预测损失值:
其中,Gθ是反应物网络,是反应产物网络,Gθ和有同样的架构不同的参数,并且两个网络都满足置换不变性。hr是反应物原子对应的特征向量embedding,hp是反应产物原子对应的特征向量embedding,ε和γ是两个边缘超参数(margin hyperparameter)。该函数的第一项是用于将同一个反应数组即正样本反应组集合中的样本反应物向量与样本反应产物向量距离拉近,第二项将错配的反应数组即负样本反应组集合中的样本反应物向量与样本反应产物向量推远。可以理解的是,由于模型训练期间可以是在线构造任务,所以目标函数的样本大小可以设置为B。
在步骤S106中,将样本反应物向量和样本反应产物向量输入至第三辅助网络,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签;
在本实施例中,由于海量数据集例如公开数据集USPTO-480K中的反应数据经常会忽略掉副产物,容易增加对反应产物的预测误差,因此,本实施例可以在建模的过程中增加能够用于预测原子是否在主产物中与预测反应中心是不等价的第三辅助网络,可以在一定程度上补充了部分副产物的信息,从而提高对反应产物的预测能力。由此,在获取到样本反应物向量和样本反应产物向量之后,将样本反应物向量和样本反应产物向量输入至第三辅助网络,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签。
具体地,将样本反应物向量和样本反应产物向量输入至如图15所示意的任务Task3即第三辅助网络中,通过第三辅助网络对样本反应物进行预测,以获取到样本反应物中的原子存在于主产物中的预测概率值,同时,基于将样本反应物向量和样本反应产物向量,将样本反应物的原子和样本产物中的原子进行比对,得到原子比对结果,并基于原子比对结果确定原子标签。
在步骤S107中,基于预测概率值以及原子标签计算原子预测损失值;
在本实施例中,原子预测损失值用于表示反应产物预测模型分辨原子发生反应之后是否仍在主产物中的能力。
具体地,在获取到预测概率值和原子标签之后,可以采用如下损失函数公式(3)计算原子预测损失值:
其中,yj∈{0,1}代表j原子的原子标签,表示该原子是否发生反应之后仍然在主产物中,sj∈[0,1]代表模型基于原子embedding的预测概率值。
在步骤S108中,基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
具体地,当获取到反应预测损失值、反应关系预测损失值以及原子预测损失值时,一方面,可以采用多任务学习的训练方式,将反应预测损失值、反应关系预测损失值以及原子预测损失值等目标函数以加权的方式直接加入到总目标函数之中,然后,基于总目标函数值对反应产物预测模型进行参数调整,具体可以是采用反向传播的迭代方式进行参数调整,还可以其他方式,此处不作具体限制,以获取到目标反应产物预测模型。
另一方面,本实施例还可以采用预训练策略,分别基于反应预测损失值、反应关系预测损失值以及原子预测损失值对第一辅助网络、第二辅助网络、第三辅助网络进行预训练,然后,预训练好的网络迁移到反应产物预测模型,以获取到目标反应产物预测模型。
在本申请实施例中,提供了一种反应产物预测模型参数调整方法,通过上述方式,能够基于具有自监督性质的第一辅助网络、第二辅助网络以及第三辅助网络,从对样本反应数据集合的数据本身特性来挖掘和构造正负样本集合以及原子标签等,以实现对样本反应数据集合的数据的自动标注,而不依赖于人工标注,从而可以降低反应产物预测任务的成本,并且,通过第一辅助网络帮助反应产物预测模型能够更好地学习到反应物之间的距离关系,使得反应产物预测模型具有预测反应物是否可以发生反应的能力,以及通过第二辅助网络帮助反应产物预测模型能够更好地学习到反应物与产物之间的距离关系,使得反应产物预测模型具有预测反应物和产物之间的对应关系的能力,以及通过第三辅助网络帮助反应产物预测模型能够更好地学习到反应物的原子和原子之间的键位关系在反应过程中发生的变化,使得反应产物预测模型具有预测原子发生反应之后是否仍然在主产物的能力,从而能够基于这些辅助网络的辅助学习,提高反应产物预测模型对反应产物的预测精度。
可选地,在上述图2对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图3所示,步骤S101将样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量之前,该方法还包括:步骤S301至步骤S302;步骤S101包括:步骤S303;
在步骤S301中,对样本反应数据集合进行数据增广处理,得到样本复合反应数据集合;
在步骤S302中,将样本反应数据集合以及样本复合反应数据集合汇总为扩展样本反应数据集合;
在步骤S303中,将扩展样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对扩展样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量。
在本实施例中,由于一般的反应产物预测模型虽然可以对如一个反应物或两三个反应物等简单的化学反应进行预测,但是,对于多个反应物或复杂的化学反应难以预测,因此,本实施例通过在建模的过程中对样本反应数据集合进行数据增广的方式,获取样本复合反应数据集合,并将样本反应数据集合以及样本复合反应数据集合汇总为扩展样本反应数据集合,然后,将扩展样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对扩展样本反应数据集合中的每个反应数组进行向量转化,以获取到样本反应物向量以及样本反应产物向量,不仅可以扩充样本反应数据集合,还能够在一定程度上增强样本反应数据集合的复杂度,以帮助反应产物预测模型学习到能够对复杂的化学反应进行预测的能力,从而可以在一定程度上提高预测反应产物的准确性。
具体地,如图15所示意的任务Task4所示,对样本反应数据集合进行数据增广处理,具体可以是通过从样本反应数据集合中随机选取两个反应数组,将选取得到的两个反应数组中的样本反应物进行组合,以获取到样本复合反应物,并将选取得到的两个反应数组中的样本反应产物进行组合,以获取到样本复合反应产物,然后,基于样本复合反应物以及样本复合反应产物,得到复合反应数组,以获取到样本复合反应数据集合,还可以是采用其他增广方式,此处不作具体限制。例如,将一组反应数组中R11+R12+R13→P11中的反应物R11+R12+R13以及反应产物P11,与另一组反应数组中R21+R22+R23→P21中的反应物R21+R22+R23与反应产物P21进行组合,可以得到一个复合反应数组如R11+R12+R13+R21+R22+R23→P11+P21。
进一步地,将获取到的样本反应数据集合融合至样本复合反应数据集合中形成扩展样本反应数据集合,以方便后续利用扩展样本反应数据集合对反应产物预测模型进行训练,以帮助反应产物预测模型学习到能够对复杂的化学反应进行预测的能力,即将扩展样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对扩展样本反应数据集合中的每个反应数组进行向量转化,以获取到样本反应物向量以及样本反应产物向量,以使后续可以基于样本反应物向量以及样本反应产物向量结合上述第一辅助网络、第二辅助网络以及第三辅助网络对反应产物预测模型进行训练。
可选地,在上述图2或图3对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图4所示,步骤S102将样本反应物向量输入至第一辅助网络,通过第一辅助网络构造正样本反应物集合和负样本反应物集合,包括:
在步骤S401中,从同一反应数组中采样任意两个样本反应物向量,作为正样本反应物组合,以汇总到正样本反应物集合;
在步骤S402中,从不同反应数组中采样任意两个样本反应物向量,作为负样本反应物组合,以汇总到负样本反应物集合。
具体地,由于在embedding空间中,不能发生反应的分子之间应相距较远,能发生反应的分子之间应相距较近,因此,在获取到每个反应数组对应的样本反应物向量之后,根据化学反应数据,例如其中,以及等用于表示样本反应物,以及等用于表示样本反应产物,通过两两反应物构造反应物组合数据。
进一步地,如图15所示,为了表示方便,本实施例给定一个批次的反应数据B,构造两个空间,其中,一个是正样本空间即正样本反应物集合,一个是负样本空间即负样本反应物集合。将样本反应物向量输入至如图15所示意的任务Task1即第一辅助网络中,对正样本反应物集合Dpos是根据化学数据B中给定的反应数据构造的,即从同一反应数组中采样任意两个样本反应物向量进行组合,假设每一个反应有R个反应物,那么可以得到R(R-1)种正样本反应物组合的搭配。负样本反应物集合Dneg可以通过错配两个来自不同反应数组中的样本反应物即可得到,即从不同反应数组中采样任意两个样本反应物向量进行组合。
例如,如图15所示,从同一反应数组如R11+R12+R13→P11中采样任意两个样本反应物向量,作为正样本反应物组合,如R11+R12、R11+R13以及R12+R13等,从而可以汇总到正样本反应物集合positive;
进一步地,可以从不同反应数组如R11+R12+R13→P11和R21+R22+R23→P21中采样任意两个样本反应物向量,作为负样本反应物组合,如R11+R22、R12+R23以及R21+R13等,从而汇总到负样本反应物集合negative。
可选地,在上述图2或图3对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图5所示,步骤S104将样本反应物向量和样本反应产物向量输入至第二辅助网络,通过第二辅助网络构造正样本反应组集合和负样本反应组集合,包括:
在步骤S501中,将所有反应数组对应的样本反应物向量和样本反应产物向量,作为正样本反应组集合;
在步骤S502中,将样本反应物向量和样本反应产物向量进行错配,得到负样本反应组集合。
具体地,可以通过给定一个批次的化学反应数据B={R1→P1,R2→P2,...},并将该批次中给定的反应物如R1与反应产物P1的组合作为正样本反应组即R1→P1,即可以将化学反应数据B作为正样本反应组集合,具体可以是将样本反应物向量和样本反应产物向量输入至如图15所示意的任务Task2即第二辅助网络中,将所有反应数组对应的样本反应物向量和样本反应产物向量,例如,一组反应数组中R11+R12+R13→P11,反应物R11+R12+R13与反应产物P11是正确关系的,即可作为正样本反应组集合中的一个正样本。
进一步地,负样本反应组集合则通过错配化学反应数据B={R1→P1,R2→P2,...}中的反应物和反应产物的组合来构造,及将样本反应物向量和样本反应产物向量进行错配,以获取到负样本反应组集合,使得具有错误关系反应物和反应产物之间的匹配分数更低,例如,图15所示,一组反应数组中R11+R12+R13→P11,反应物R11+R12+R13与反应产物P11是正确关系的,以及,另一组反应数组中R21+R22+R23→P21,反应物R21+R22+R23与反应产物P21是正确关系的,通过错配反应物和反应产物,可以得到如R11+R12+R13→P21以及R21+R22+R23→P11等反应物和反应产物之间关系错误的负样本反应组集合。
可选地,在上述图2或图3对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图6所示,步骤S106将样本反应物向量和样本反应产物向量输入至第三辅助网络,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签,包括:
在步骤S601中,通过第三辅助网络对样本反应物进行预测,得到样本反应物中的原子存在于主产物中的预测概率值;
在步骤S602中,基于将样本反应物向量和样本反应产物向量,进行样本反应物和样本产物中的原子比对,得到原子比对结果;
在步骤S603中,基于原子比对结果确定原子标签。
在本实施例中,由于预测原子是否在主产物中与预测反应中心是不等价的两个任务,其中,预测反应中心只能知道哪些键位会断键,仍然无法知道该键位相连的两个原子哪一个会出现在副产物之中,所以能够用于预测原子是否在主产物中的第三网络可以让反应产物预测模型学习到原子在反应中的相对重要性,由此,可以通过第三辅助网络对样本反应物进行预测,以获取得到样本反应物中的原子存在于主产物中的预测概率值,同时,基于将样本反应物向量和样本反应产物向量,对样本反应物的原子和样本产物中的原子进行比对,可以获取到相应的原子比对结果,然后,可以基于原子比对结果确定原子标签。
具体地,通过第三辅助网络对样本反应物进行预测,得到样本反应物中的原子存在于主产物中的预测概率值,具体可以是将预测原子是否在主产物中的任务当成已知信息作为掩码矩阵masking matrix遮盖副产物信息,使得反应产物预测模型只能够关注到主产物的信息,而实际上该掩码矩阵masking matrix,也是反应产物预测模型应该预测的内容。
进一步地,原子标签ground-truth标签的获取方式具体可以是基于将样本反应物向量和样本反应产物向量,对样本反应物的原子和样本产物中的原子进行比对,然后,可以将与反应产物相比反应物丢掉的原子标记为0,而仍然在反应产物中的原子标记为1,还可以采用其他标签方式,此处不作具体限制。
可选地,在上述图2或图3对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图7所示,步骤S101将样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,包括:
在步骤S701中,针对于每个反应数组,将样本反应物的每个分子内部的信息在原子之间进行交互,得到样本反应物交互信息;
在步骤S702中,基于样本反应物交互信息在不同样本反应物之间进行交互,得到样本反应物向量;
在步骤S703中,针对于每个反应数组,将样本反应产物的每个分子内部的信息在原子之间进行交互,得到样本反应产物交互信息;
在步骤S704中,基于样本反应产物交互信息在不同样本反应物之间进行交互,得到样本反应产物向量。
具体地,当反应产物预测模型使用的是如图16所示的电子转移守恒的VAE架构时,本实施例对样本反应数据集合中的每个反应数组进行向量转化的编码网络由图神经网络GNN和转换器Transformer组合而成。
其中,Transformer是由编码部分encoder和解码部分decoder组成的,能够使用自注意力机制,不采用循环神经网络RNN和长短期记忆网络LSTM的顺序结构,使得模型可以并行化训练,而且能够拥有全局信息。
其中,图神经网络GNN包括图卷积网络、图注意力网络、图自编码机、图生成网络、图时空网络等,相比较于神经网络最基本的网络结构全连接层(MLP),特征矩阵乘以权重矩阵,图神经网络多了一个邻接矩阵。
由此,可以采用如下公式(4)先通过GNN让每个分子内部的信息在原子之间进行交互,即针对于每个反应数组,将样本反应物的每个分子内部的信息在原子之间进行交互,以获取到样本反应物交互信息,然后,再通过Transformer让信息在不同反应物之间进行交互,即基于样本反应物交互信息在不同样本反应物之间进行交互,以获取到样本反应物向量:
hR=Transformer(GNN(GR)) (4);
其中,hR用于表示样本反应物向量,GR用于表示样本反应物。
同理,可以采用如下公式(5)先通过GNN让每个分子内部的信息在原子之间进行交互,即针对于每个反应数组,将样本反应产物的每个分子内部的信息在原子之间进行交互,以获取到样本反应产物交互信息,然后,再通过Transformer让信息在不同反应产物之间进行交互,即基于样本反应产物交互信息在不同样本反应产物之间进行交互,以获取到样本反应产物向量:
hP=Transformer(GNN(GP)) (5);
其中,hP用于表示样本反应产物向量,GP用于表示样本反应产物。
可选地,在上述图3对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图8所示,步骤S301对样本反应数据集合进行数据增广处理,得到样本复合反应数据集合,包括:
在步骤S801中,从样本反应数据集合中随机选取两个反应数组;
在步骤S802中,将选取得到的两个反应数组中的样本反应物进行组合,得到样本复合反应物;
在步骤S803中,将选取得到的两个反应数组中的样本反应产物进行组合,得到样本复合反应产物;
在步骤S804中,基于样本复合反应物以及样本复合反应产物,得到复合反应数组,以获取到样本复合反应数据集合。
在本实施例中,对样本反应数据集合进行数据增广处理,可以是从样本反应数据集合中随机选取两个反应数组,将选取得到的两个反应数组中的样本反应物进行组合,以获取到样本复合反应物,同时,将选取得到的两个反应数组中的样本反应产物进行组合,以获取到样本复合反应产物,然后,基于样本复合反应物以及样本复合反应产物,得到复合反应数组,以获取到样本复合反应数据集合,虽然该数据增广方式并不能组合得到完全准确的化学反应,例如,新的反应物组合之间,发生反应的不再是A和B、E和F,有可能是A和E、B和F,也有可能是其他的组合方式,或者,即使依然是A和B、E和F发生反应,有可能只是中间产物,可以进一步反应得到最终产物,即通过随机组合的数据增广方式得到的新反应不一定准确,但仍然可以增强反应产物预测模型的泛化能力,而且在常用的USPTO-480K数据之中也常存在错误的反应数据(比如ground-truth产物给的是中间产物而不是最终产物),所以,通过上述数据增广方式得到新反应组合中不准确的地方对反应产物预测模型的预测准确率影响不大,故可以将数据增广后得到的样本复合反应数据集合添加至原本的样本反应数据集合中,以扩展得到扩展样本反应数据集合,并应用于后续反应产物预测模型参数调整,以增强反应产物预测模型的鲁棒性以及泛化性能,并且对于更大的数据集同样有很强的扩展性,进行不依赖人工标注的监督任务。
具体地,如图15所示意的任务Task4所示,对样本反应数据集合进行数据增广处理,具体可以是通过从样本反应数据集合中随机选取两个反应数组,将选取得到的两个反应数组中的样本反应物进行组合,以获取到样本复合反应物,并将选取得到的两个反应数组中的样本反应产物进行组合,以获取到样本复合反应产物,然后,基于样本复合反应物以及样本复合反应产物,得到复合反应数组,以获取到样本复合反应数据集合,还可以是采用其他增广方式,此处不作具体限制。例如,将一组反应数组中R11+R12+R13→P11中的反应物R11+R12+R13以及反应产物P11,与另一组反应数组中R21+R22+R23→P21中的反应物R21+R22+R23与反应产物P21进行组合,可以得到一个复合反应数组如R11+R12+R13+R21+R22+R23→P11+P21。
可选地,在上述图2对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图9所示,步骤S108基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型,包括:
在步骤S901中,获取重构损失值以及散度损失值;
在步骤S902中,基于重构损失值、散度损失值、反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
具体地,当反应产物预测模型使用的是如图16所示的电子转移守恒的VAE架构时,本实施例可以采用多任务学习的训练方式,可以基于VAE架构,获取到重构损失值以及散度损失值。
进一步地,可以基于如下所示总目标函数式(6),将重构损失值、散度损失值、反应预测损失值、反应关系预测损失值以及原子预测损失值等目标函数以加权的方式直接加入到总目标函数之中,以获取到总目标函数值:
Ltatal=Lreconstruct+αLKL+βLA+λLB+θLC (6);
其中,Ltatal表示总目标函数值,Lreconstruct表示重构损失值、LKL表示散度损失值、LA表示反应预测损失值、LB表示反应关系预测损失值以及LC表示原子预测损失值,α、β、λ、θ为根据实际应用需求设置的权重参数,此处不作具体限制。
进一步地,可以基于总目标函数值对反应产物预测模型进行参数调整,具体可以是采用反向传播的迭代方式进行参数调整,还可以其他方式,此处不作具体限制,以获取到目标反应产物预测模型。
可选地,在上述图9对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图10所示,步骤S901获取重构损失值以及散度损失值,包括:
在步骤S1001中,对样本反应物向量以及样本反应产物向量采用注意力机制,得到第一隐向量;
在步骤S1002中,基于第一隐向量和样本反应物向量计算得到第二隐向量;
在步骤S1003中,将第二隐向量输入至反应产物预测模型的解码网络,通过解码网络输出邻接矩阵的样本预测变化概率;
在步骤S1004中,基于样本预测变化概率,确定样本预测反应产物邻接矩阵;
在步骤S1005中,基于样本反应产物的反应产物邻接矩阵和样本预测反应产物邻接矩阵进行损失计算,得到重构损失值以及散度损失值。
具体地,如图16所示,对样本反应物向量以及样本反应产物向量采用注意力机制,即可以通过将反应物embedding和产物embedding过一层交叉注意力机制(crossattention),其中,交叉注意力可以基于如下式(7)、(8)以及(9)直接通过转换器解码器Transformer Decoder来实现,以获取到高斯分布的参数向量μ和logσ,同时,通过重参数技巧(reparameterization)得到符合高斯分布的第一隐向量:
hz=Mean(TransformerDecoder(hR,hP)) (7);
μ=WμReLU(hz)+bμ (8);
logσ=WσReLU(hz)+bσ (9);
其中,hz表示第一隐向量,Wμ、bμ、Wσ、bσ表示模型参数。
进一步地,基于第一隐向量和样本反应物向量计算得到第二隐向量,具体可以是基于如下公式(10)将第一隐向量和样本反应物向量相加并过一层Transformer得到一个新的隐向量,即第二隐向量hL:
hL=Transformer(hR+hz) (10);
进一步地,如图16所示,将第二隐向量输入至反应产物预测模型的解码网络,通过解码网络将第二隐向量hL解码,其中,解码网络decoder主要由两个分别的自注意力机制构成,一个自注意力机制输出注意力矩阵作为两个原子之间共享电子增加的概率,另一个自注意力机制则输出注意力矩阵作为两个原子之间共享电子减少的概率。由于电子的转移是守恒的,所以利用自注意力机制的权重矩阵特性建模该性质,具体解码操作包括如下公式(11)、(12),以获取到邻接矩阵的样本预测变化概率:
W+d=SelfAttention(hL) (11);
W-d=SelfAttention(hL) (12);
其中,W+d表示一种样本预测变化概率,即每一对原子之间电子增加的概率矩阵,W-d表示另样本预测变化概率,即每一对原子之间电子减少的概率矩阵。
进一步地,基于样本预测变化概率计算样本预测反应产物邻接矩阵,具体可以是基于样本预测变化概率计算邻接矩阵的样本预测变化量,并基于邻接矩阵的样本预测变化量以及样本反应物的邻接矩阵,计算样本预测反应产物邻接矩阵,然后,基于样本反应产物的反应产物邻接矩阵和样本预测反应产物邻接矩阵进行交叉熵损失计算,以获取到重构损失值以及散度损失值。
需要说明的是,本实施例中的邻接矩阵中的每一个数值并不只是0或者1(0代表对应的原子对之间无连接,1代表对应的原子对之间有连接),而是0,1,2,3四个数值,分别代表无连接、单键连接、双键连接和三键连接。芳香键连接表示为1,相连的原子标记为芳香原子以便与单键连接区分。
可选地,在上述图10对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图11所示,步骤S1004基于样本预测变化概率,确定样本预测反应产物邻接矩阵,包括:
在步骤S1101中,基于样本预测变化概率计算邻接矩阵的样本预测变化量;
在步骤S1102中,基于邻接矩阵的样本预测变化量以及样本反应物的邻接矩阵,计算样本预测反应产物邻接矩阵。
具体地,在获取到样本预测变化概率之后,可以采用如下公式(13)基于样本预测变化概率计算邻接矩阵的样本预测变化量,即基于每一对原子之间电子增加的概率矩阵W+d与每一对原子之间电子减少的概率矩阵W-d相减,并乘以4就得到了每一对原子之间预测的样本预测变化量ΔA:
ΔA=(W+d-W-d)×4 (13);
其中,4表示的是每一对原子之间最大变化量。
进一步地,采用如下公式(14)基于邻接矩阵的样本预测变化量以及样本反应物的邻接矩阵,计算样本预测反应产物邻接矩阵:
AP=AR+ΔA (14);
其中,AP表示样本预测反应产物邻接矩阵,AR表示样本反应物的邻接矩阵。
进一步地,邻接矩阵必须是对称的,因此可以采用如下公式(15)将样本预测反应产物邻接矩阵对称化:
可选地,在上述图2对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整方法另一个可选实施例中,如图12所示,步骤S108基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型,包括:
在步骤S1201中,基于反应预测损失值对第一辅助网络进行参数调整,得到第一子模型;
在步骤S1202中,基于反应关系预测损失值对第二辅助网络进行参数调整,得到第二子模型;
在步骤S1203中,基于原子预测损失值对第三辅助网络进行参数调整,得到第三子模型;
在步骤S1204中,将第一子模型、第二子模型以及第三子模型迁移至反应产物预测模型,得到目标反应产物预测模型。
具体地,本实施例还可以采用预训练策略,分别基于反应预测损失值、反应关系预测损失值以及原子预测损失值对第一辅助网络、第二辅助网络、第三辅助网络进行预训练,即基于反应预测损失值对第一辅助网络进行参数调整,以获取到第一子模型,并基于反应关系预测损失值对第二辅助网络进行参数调整,以获取到第二子模型,并基于原子预测损失值对第三辅助网络进行参数调整,以获取到第三子模型,然后,将第一子模型、第二子模型以及第三子模型迁移至反应产物预测模型中,具体可以是将第一子模型、第二子模型以及第三子模型的骨架网络迁移到反应产物预测模型上,然后骨架网络输出embedding的层后面接入反应产物预测的decoder网络层,以获取到目标反应产物预测模型。
下面将对本申请中反应产物预测模型的应用方法进行介绍,请参阅图13,本申请实施例中反应产物预测模型的应用方法一个实施例包括:
在步骤S1301中,将待测反应物输入至目标反应产物预测模型,通过目标反应产物预测模型输出邻接矩阵的预测变化概率;
在步骤S1302中,基于邻接矩阵的预测变化概率计算邻接矩阵的预测变化量;
在步骤S1303中,基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵,确定目标反应产物。
在本实施例中,在获取到待测反应物之后,可以将待测反应物输入至目标反应产物预测模型,通过目标反应产物预测模型输出邻接矩阵的预测变化概率,并基于邻接矩阵的预测变化概率计算邻接矩阵的预测变化量,然后,可以基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵,确定目标反应产物,以使后续可以基于获取到的目标反应产物应用于科学制药或药物验证等场景。
可以理解的是,目标反应产物预测模型可以作为药物逆合成的有效验证工具,提高新药物合成路径的研究效率;目标反应产物预测模型可以揭示一些隐藏的科学规律,提供新的科学知识;目标反应产物预测模型可以提供比专家更精准的预测,不仅在已知模板均不能使用的情况下依然可以预测出可靠的候选产物,并且能够预测出新反应,以大大提高新药物的研发效率等。
具体地,将待测反应物输入至目标反应产物预测模型,通过目标反应产物预测模型输出邻接矩阵的预测变化概率,即基于每一对原子之间电子增加的概率矩阵W+d以及每一对原子之间电子减少的概率矩阵W-d,然后,可以采用上述公式(13)计算邻接矩阵的预测变化量ΔA。
可选地,在上述图13对应的实施例的基础上,本申请实施例提供的反应产物预测模型的应用方法另一个可选实施例中,如图14所示,步骤S1303基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵,确定目标反应产物,包括:
在步骤S1401中,基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵计算预测反应产物邻接矩阵;
在步骤S1402中,对预测反应产物邻接矩阵进行对称化处理,得到目标反应产物邻接矩阵;
在步骤S1403中,基于目标反应产物邻接矩阵,确定目标反应产物。
具体地,可以采用上述公式(14)基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵计算预测反应产物邻接矩阵,其中,AP表示预测反应产物邻接矩阵,AR表示待测反应物的邻接矩阵。
进一步地,由于邻接矩阵必须是对称的,因此可以采用上述公式(15)对预测反应产物邻接矩阵进行对称化处理,以获取到目标反应产物邻接矩阵,然后,可以基于目标反应产物邻接矩阵AP,推算出目标反应产物。
下面对本申请中的反应产物预测模型参数调整装置进行详细描述,请参阅图17,图17为本申请实施例中反应产物预测模型参数调整装置的一个实施例示意图,反应产物预测模型参数调整装置20包括:
获取单元201,用于将样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,样本反应数据集合包括多个反应数组,每个反应数组包括样本反应物和样本反应产物;
获取单元201,还用于将样本反应物向量输入至第一辅助网络,通过第一辅助网络构造正样本反应物集合和负样本反应物集合;
处理单元202,用于基于正样本反应物集合和负样本反应物集合计算反应预测损失值;
获取单元201,用于将样本反应物向量和样本反应产物向量输入至第二辅助网络,通过第二辅助网络构造正样本反应组集合和负样本反应组集合;
处理单元202,还用于基于正样本反应组集合和负样本反应组集合计算反应关系预测损失值;
获取单元201,用于将样本反应物向量和样本反应产物向量输入至第三辅助网络,通过第三辅助网络获取样本反应物中的原子存在于主产物中的预测概率值以及原子标签;
处理单元202,还用于基于预测概率值以及原子标签计算原子预测损失值;
确定单元203,用于基于反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,
处理单元202,还用于对样本反应数据集合进行数据增广处理,得到样本复合反应数据集合;
处理单元202,还用于将样本反应数据集合以及样本复合反应数据集合汇总为扩展样本反应数据集合;
获取单元201具体可以用于:将扩展样本反应数据集合输入至反应产物预测模型,通过反应产物预测模型的编码网络对扩展样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,获取单元201具体可以用于:
从同一反应数组中采样任意两个样本反应物向量,作为正样本反应物组合,以汇总到正样本反应物集合;
从不同反应数组中采样任意两个样本反应物向量,作为负样本反应物组合,以汇总到负样本反应物集合。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,获取单元201具体可以用于:
将所有反应数组对应的样本反应物向量和样本反应产物向量,作为正样本反应组集合;
将样本反应物向量和样本反应产物向量进行错配,得到负样本反应组集合。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,获取单元201具体可以用于:
通过第三辅助网络对样本反应物进行预测,得到样本反应物中的原子存在于主产物中的预测概率值;
基于将样本反应物向量和样本反应产物向量,进行样本反应物和样本产物中的原子比对,得到原子比对结果;
基于原子比对结果确定原子标签。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,获取单元201具体可以用于:
针对于每个反应数组,将样本反应物的每个分子内部的信息在原子之间进行交互,得到样本反应物交互信息;
基于样本反应物交互信息在不同样本反应物之间进行交互,得到样本反应物向量;
针对于每个反应数组,将样本反应产物的每个分子内部的信息在原子之间进行交互,得到样本反应产物交互信息;
基于样本反应产物交互信息在不同样本反应物之间进行交互,得到样本反应产物向量。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,处理单元202具体可以用于:
从样本反应数据集合中随机选取两个反应数组;
将选取得到的两个反应数组中的样本反应物进行组合,得到样本复合反应物;
将选取得到的两个反应数组中的样本反应产物进行组合,得到样本复合反应产物;
基于样本复合反应物以及样本复合反应产物,得到复合反应数组,以获取到样本复合反应数据集合。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,确定单元203具体可以用于:
获取重构损失值以及散度损失值;
基于重构损失值、散度损失值、反应预测损失值、反应关系预测损失值以及原子预测损失值对反应产物预测模型进行参数调整,得到目标反应产物预测模型。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,确定单元203具体可以用于:
对样本反应物向量以及样本反应产物向量采用注意力机制,得到第一隐向量;
基于第一隐向量和样本反应物向量计算得到第二隐向量;
将第二隐向量输入至反应产物预测模型的解码网络,通过解码网络输出邻接矩阵的样本预测变化概率;
基于样本预测变化概率,确定样本预测反应产物邻接矩阵;
基于样本反应产物的反应产物邻接矩阵和样本预测反应产物邻接矩阵进行损失计算,得到重构损失值以及散度损失值。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,确定单元203具体可以用于:
基于样本预测变化概率计算邻接矩阵的样本预测变化量;
基于邻接矩阵的样本预测变化量以及样本反应物的邻接矩阵,计算样本预测反应产物邻接矩阵。
可选地,在上述图17对应的实施例的基础上,本申请实施例提供的反应产物预测模型参数调整装置的另一实施例中,确定单元203具体可以用于:
基于反应预测损失值对第一辅助网络进行参数调整,得到第一子模型;
基于反应关系预测损失值对第二辅助网络进行参数调整,得到第二子模型;
基于原子预测损失值对第三辅助网络进行参数调整,得到第三子模型;
将第一子模型、第二子模型以及第三子模型迁移至反应产物预测模型,得到目标反应产物预测模型。
下面对本申请中的反应产物预测模型的应用装置进行详细描述,请参阅图18,图18为本申请实施例中反应产物预测模型的应用装置的一个实施例示意图,反应产物预测模型的应用装置30包括:
获取单元301,用于将待测反应物输入至目标反应产物预测模型,通过目标反应产物预测模型输出邻接矩阵的预测变化概率;
处理单元302,用于基于邻接矩阵的预测变化概率计算邻接矩阵的预测变化量;
确定单元303,用于基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵,确定目标反应产物。
可选地,在上述图18对应的实施例的基础上,本申请实施例提供的反应产物预测模型的应用装置的另一实施例中,确定单元303具体可以用于:
基于邻接矩阵的预测变化量以及待测反应物的邻接矩阵计算预测反应产物邻接矩阵;
对预测反应产物邻接矩阵进行对称化处理,得到目标反应产物邻接矩阵;
基于目标反应产物邻接矩阵,确定目标反应产物。
本申请另一方面提供了另一种计算机设备示意图,如图19所示,图19是本申请实施例提供的一种计算机设备结构示意图,该计算机设备300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)310(例如,一个或一个以上处理器)和存储器320,一个或一个以上存储应用程序331或数据332的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器320和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备300中的一系列指令操作。更进一步地,中央处理器310可以设置为与存储介质330通信,在计算机设备300上执行存储介质330中的一系列指令操作。
计算机设备300还可以包括一个或一个以上电源340,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口360,和/或,一个或一个以上操作系统333,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述计算机设备300还用于执行如图2至图13对应的实施例中的步骤,以及图14对应的实施例中的步骤。
本申请的另一方面提供了一种计算机可读存储介质,其上存储有计算机程序,当计算机程序被处理器执行时实现如图2至图13所示实施例描述的方法中的步骤,以及图14所示实施例描述的方法中的步骤。
本申请的另一方面提供了一种包含计算机程序的计算机程序产品,当计算机程序被处理器执行时实现如图2至图13所示实施例描述的方法中的步骤,以及图14所示实施例描述的方法中的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (18)
1.一种反应产物预测模型参数调整方法,其特征在于,包括:
将样本反应数据集合输入至反应产物预测模型,通过所述反应产物预测模型的编码网络对所述样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,所述样本反应数据集合包括多个所述反应数组,每个所述反应数组包括样本反应物和样本反应产物;
将所述样本反应物向量输入至第一辅助网络,通过所述第一辅助网络构造正样本反应物集合和负样本反应物集合;
基于所述正样本反应物集合和所述负样本反应物集合计算反应预测损失值;
将所述样本反应物向量和所述样本反应产物向量输入至第二辅助网络,通过所述第二辅助网络构造正样本反应组集合和负样本反应组集合;
基于所述正样本反应组集合和所述负样本反应组集合计算反应关系预测损失值;
将所述样本反应物向量和所述样本反应产物向量输入至第三辅助网络,通过所述第三辅助网络获取所述样本反应物中的原子存在于主产物中的预测概率值以及原子标签;
基于所述预测概率值以及所述原子标签计算原子预测损失值;
基于所述反应预测损失值、所述反应关系预测损失值以及所述原子预测损失值对所述反应产物预测模型进行参数调整,得到目标反应产物预测模型。
2.根据权利要求1所述的方法,其特征在于,所述将样本反应数据集合输入至反应产物预测模型,通过所述反应产物预测模型的编码网络对所述样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量之前,所述方法还包括:
对所述样本反应数据集合进行数据增广处理,得到样本复合反应数据集合;
将所述样本反应数据集合以及所述样本复合反应数据集合汇总为扩展样本反应数据集合;
所述将样本反应数据集合输入至反应产物预测模型,通过所述反应产物预测模型的编码网络对所述样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,包括:
将所述扩展样本反应数据集合输入至所述反应产物预测模型,通过所述反应产物预测模型的编码网络对所述扩展样本反应数据集合中的每个反应数组进行向量转化,得到所述样本反应物向量以及所述样本反应产物向量。
3.根据权利要求1或2任一项所述的方法,其特征在于,所述将所述样本反应物向量输入至第一辅助网络,通过所述第一辅助网络构造正样本反应物集合和负样本反应物集合,包括:
从同一反应数组中采样任意两个所述样本反应物向量,作为正样本反应物组合,以汇总到所述正样本反应物集合;
从不同反应数组中采样任意两个所述样本反应物向量,作为负样本反应物组合,以汇总到所述负样本反应物集合。
4.根据权利要求1或2任一项所述的方法,其特征在于,所述将所述样本反应物向量和所述样本反应产物向量输入至第二辅助网络,通过所述第二辅助网络构造正样本反应组集合和负样本反应组集合,包括:
将所有反应数组对应的所述样本反应物向量和所述样本反应产物向量,作为所述正样本反应组集合;
将所述样本反应物向量和所述样本反应产物向量进行错配,得到所述负样本反应组集合。
5.根据权利要求1或2中任一项所述的方法,其特征在于,所述将所述样本反应物向量和所述样本反应产物向量输入至第三辅助网络,通过所述第三辅助网络获取所述样本反应物中的原子存在于主产物中的预测概率值以及原子标签,包括:
通过所述第三辅助网络对所述样本反应物进行预测,得到所述样本反应物中的原子存在于主产物中的预测概率值;
基于将所述样本反应物向量和所述样本反应产物向量,进行所述样本反应物和所述样本产物中的原子比对,得到原子比对结果;
基于所述原子比对结果确定所述原子标签。
6.根据权利要求1或2中任一项所述的方法,其特征在于,所述将样本反应数据集合输入至反应产物预测模型,通过所述反应产物预测模型的编码网络对所述样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,包括:
针对于每个所述反应数组,将所述样本反应物的每个分子内部的信息在原子之间进行交互,得到样本反应物交互信息;
基于所述样本反应物交互信息在不同所述样本反应物之间进行交互,得到所述样本反应物向量;
针对于每个所述反应数组,将所述样本反应产物的每个分子内部的信息在原子之间进行交互,得到样本反应产物交互信息;
基于所述样本反应产物交互信息在不同所述样本反应物之间进行交互,得到所述样本反应产物向量。
7.根据权利要求2所述的方法,其特征在于,所述对所述样本反应数据集合进行数据增广处理,得到样本复合反应数据集合,包括:
从所述样本反应数据集合中随机选取两个反应数组;
将选取得到的所述两个反应数组中的样本反应物进行组合,得到样本复合反应物;
将选取得到的所述两个反应数组中的样本反应产物进行组合,得到样本复合反应产物;
基于所述样本复合反应物以及所述样本复合反应产物,得到复合反应数组,以获取到所述样本复合反应数据集合。
8.根据权利要求1所述的方法,其特征在于,所述基于所述反应预测损失值、所述反应关系预测损失值以及所述原子预测损失值对所述反应产物预测模型进行参数调整,得到目标反应产物预测模型,包括:
获取重构损失值以及散度损失值;
基于所述重构损失值、所述散度损失值、所述反应预测损失值、所述反应关系预测损失值以及所述原子预测损失值对所述反应产物预测模型进行参数调整,得到所述目标反应产物预测模型。
9.根据权利要求8所述的方法,其特征在于,所述获取重构损失值以及散度损失值,包括:
对所述样本反应物向量以及所述样本反应产物向量采用注意力机制,得到第一隐向量;
基于所述第一隐向量和所述样本反应物向量计算得到第二隐向量;
将所述第二隐向量输入至所述反应产物预测模型的解码网络,通过所述解码网络输出邻接矩阵的样本预测变化概率;
基于所述样本预测变化概率,确定样本预测反应产物邻接矩阵;
基于所述样本反应产物的反应产物邻接矩阵和所述样本预测反应产物邻接矩阵进行损失计算,得到所述重构损失值以及所述散度损失值。
10.根据权利要求9所述的方法,其特征在于,所述基于所述样本预测变化概率,确定样本预测反应产物邻接矩阵,包括:
基于所述样本预测变化概率计算所述邻接矩阵的样本预测变化量;
基于所述邻接矩阵的样本预测变化量以及所述样本反应物的邻接矩阵,计算所述样本预测反应产物邻接矩阵。
11.根据权利要求1所述的方法,其特征在于,所述基于所述反应预测损失值、所述反应关系预测损失值以及所述原子预测损失值对所述反应产物预测模型进行参数调整,得到目标反应产物预测模型,包括:
基于所述反应预测损失值对所述第一辅助网络进行参数调整,得到第一子模型;
基于所述反应关系预测损失值对所述第二辅助网络进行参数调整,得到第二子模型;
基于所述原子预测损失值对所述第三辅助网络进行参数调整,得到第三子模型;
将所述第一子模型、所述第二子模型以及所述第三子模型迁移至所述反应产物预测模型,得到所述目标反应产物预测模型。
12.一种反应产物预测模型的应用方法,其特征在于,包括:
将待测反应物输入至权利要求1至11中任一项所述的目标反应产物预测模型,通过所述目标反应产物预测模型输出邻接矩阵的预测变化概率;
基于所述邻接矩阵的预测变化概率计算所述邻接矩阵的预测变化量;
基于所述邻接矩阵的预测变化量以及所述待测反应物的邻接矩阵,确定目标反应产物。
13.根据权利要求12所述的方法,其特征在于,所述基于所述邻接矩阵的预测变化量以及所述待测反应物的邻接矩阵,确定目标反应产物,包括:
基于所述邻接矩阵的预测变化量以及所述待测反应物的邻接矩阵计算预测反应产物邻接矩阵;
对所述预测反应产物邻接矩阵进行对称化处理,得到目标反应产物邻接矩阵;
基于所述目标反应产物邻接矩阵,确定所述目标反应产物。
14.一种反应产物预测模型参数调整装置,其特征在于,包括:
获取单元,用于将样本反应数据集合输入至反应产物预测模型,通过所述反应产物预测模型的编码网络对所述样本反应数据集合中的每个反应数组进行向量转化,得到样本反应物向量以及样本反应产物向量,所述样本反应数据集合包括多个所述反应数组,每个所述反应数组包括样本反应物和样本反应产物;
所述获取单元,还用于将所述样本反应物向量输入至第一辅助网络,通过所述第一辅助网络构造正样本反应物集合和负样本反应物集合;
处理单元,用于基于所述正样本反应物集合和所述负样本反应物集合计算反应预测损失值;
所述获取单元,用于将所述样本反应物向量和所述样本反应产物向量输入至第二辅助网络,通过所述第二辅助网络构造正样本反应组集合和负样本反应组集合;
所述处理单元,还用于基于所述正样本反应组集合和所述负样本反应组集合计算反应关系预测损失值;
所述获取单元,用于将所述样本反应物向量和所述样本反应产物向量输入至第三辅助网络,通过所述第三辅助网络获取所述样本反应物中的原子存在于主产物中的预测概率值以及原子标签;
所述处理单元,还用于基于所述预测概率值以及所述原子标签计算原子预测损失值;
确定单元,用于基于所述反应预测损失值、所述反应关系预测损失值以及所述原子预测损失值对所述反应产物预测模型进行参数调整,得到目标反应产物预测模型。
15.一种反应产物预测模型的应用装置,其特征在于,包括:
获取单元,用于将待测反应物输入至目标反应产物预测模型,通过所述目标反应产物预测模型输出邻接矩阵的预测变化概率;
处理单元,用于基于所述邻接矩阵的预测变化概率计算所述邻接矩阵的预测变化量;
确定单元,用于基于所述邻接矩阵的预测变化量以及所述待测反应物的邻接矩阵,确定目标反应产物。
16.一种计算机设备,包括存储器、处理器以及总线系统,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤,以及实现权利要求12至13中任一项所述的方法的步骤;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤,以及实现权利要求12至13中任一项所述的方法的步骤。
18.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤,以及实现权利要求12至13中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210826462.3A CN115204370A (zh) | 2022-07-14 | 2022-07-14 | 反应产物预测模型参数调整方法、应用方法、装置及设备 |
PCT/CN2023/089401 WO2024011983A1 (zh) | 2022-07-14 | 2023-04-20 | 反应产物预测模型的训练方法、应用方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210826462.3A CN115204370A (zh) | 2022-07-14 | 2022-07-14 | 反应产物预测模型参数调整方法、应用方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204370A true CN115204370A (zh) | 2022-10-18 |
Family
ID=83579369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210826462.3A Pending CN115204370A (zh) | 2022-07-14 | 2022-07-14 | 反应产物预测模型参数调整方法、应用方法、装置及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115204370A (zh) |
WO (1) | WO2024011983A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024011983A1 (zh) * | 2022-07-14 | 2024-01-18 | 腾讯科技(深圳)有限公司 | 反应产物预测模型的训练方法、应用方法、装置及设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950596A (zh) * | 2020-07-15 | 2020-11-17 | 华为技术有限公司 | 一种用于神经网络的训练方法以及相关设备 |
US20220036182A1 (en) * | 2020-07-29 | 2022-02-03 | Samsung Electronics Co., Ltd. | Method and apparatus for synthesizing target products by using neural networks |
CN114464267A (zh) * | 2021-08-27 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 模型训练与生成物预测的方法及装置 |
CN113838536B (zh) * | 2021-09-13 | 2022-06-10 | 烟台国工智能科技有限公司 | 翻译模型构建方法、产物预测模型构建方法及预测方法 |
CN115204370A (zh) * | 2022-07-14 | 2022-10-18 | 腾讯科技(深圳)有限公司 | 反应产物预测模型参数调整方法、应用方法、装置及设备 |
-
2022
- 2022-07-14 CN CN202210826462.3A patent/CN115204370A/zh active Pending
-
2023
- 2023-04-20 WO PCT/CN2023/089401 patent/WO2024011983A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024011983A1 (zh) * | 2022-07-14 | 2024-01-18 | 腾讯科技(深圳)有限公司 | 反应产物预测模型的训练方法、应用方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2024011983A1 (zh) | 2024-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11526673B2 (en) | Named entity disambiguation using entity distance in a knowledge graph | |
US11587646B2 (en) | Method for simultaneous characterization and expansion of reference libraries for small molecule identification | |
EP3924893A1 (en) | Incremental training of machine learning tools | |
CN112988979B (zh) | 实体识别方法、装置、计算机可读介质及电子设备 | |
CN110674279A (zh) | 基于人工智能的问答处理方法、装置、设备及存储介质 | |
CN113254716B (zh) | 视频片段检索方法、装置、电子设备和可读存储介质 | |
Mao et al. | Prediction of RNA secondary structure with pseudoknots using coupled deep neural networks | |
Khare et al. | A scalable sparse Cholesky based approach for learning high-dimensional covariance matrices in ordered data | |
Popovic et al. | Fast model‐based ordination with copulas | |
CN115204370A (zh) | 反应产物预测模型参数调整方法、应用方法、装置及设备 | |
Martinez-Gil | A comparative study of ensemble techniques based on genetic programming: A case study in semantic similarity assessment | |
Ma et al. | Multi-view clustering based on view-attention driven | |
Zhu et al. | Associative learning mechanism for drug‐target interaction prediction | |
Yuan et al. | Deep learning from a statistical perspective | |
Tenzer et al. | Testing independence under biased sampling | |
CN117076993A (zh) | 基于云原生的多智能体博弈决策系统及方法 | |
CN115083537A (zh) | 分子骨架跃迁的处理方法、装置、介质及电子设备 | |
US20230237337A1 (en) | Large model emulation by knowledge distillation based nas | |
Tong et al. | Reinforcement learning-based denoising network for sequential recommendation | |
Zhu et al. | A hybrid model for nonlinear regression with missing data using quasilinear kernel | |
CN112818658B (zh) | 文本对分类模型的训练方法、分类方法、设备及存储介质 | |
Van der Aalst et al. | Analysis of Images, Social Networks and Texts: 8th International Conference, AIST 2019, Kazan, Russia, July 17–19, 2019, Revised Selected Papers | |
Wang et al. | GNN-Dom: an unsupervised method for protein domain partition via protein contact map | |
Moolayil et al. | Keras in action | |
Tan et al. | Prediction of drug–protein interaction based on dual channel neural networks with attention mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40077123 Country of ref document: HK |