CN116453710B

CN116453710B - 一种药物副作用预测方法、装置、电子设备及存储介质

Info

Publication number: CN116453710B
Application number: CN202310702073.4A
Authority: CN
Inventors: 唐厂; 金子潇; 郑晓; 李显巨
Original assignee: China University of Geosciences
Current assignee: China University of Geosciences
Priority date: 2023-06-14
Filing date: 2023-06-14
Publication date: 2023-09-22
Anticipated expiration: 2043-06-14
Also published as: CN116453710A

Abstract

本发明提供一种药物副作用预测方法、装置、电子设备及存储介质，涉及生物信息学技术领域。方法包括：根据待预测药物的分子式，确定原子特征矩阵和原子邻接矩阵，根据药物副作用集合，确定节点特征矩阵和节点邻接矩阵；根据原子邻接矩阵，确定第一原子特征矩阵，根据节点邻接矩阵，确定第一节点特征矩阵；根据原子特征与药物副作用之间的影响关系，确定第二原子特征矩阵和第二节点特征矩阵；融合第一原子特征矩阵和第二原子特征矩阵，确定预测原子特征矩阵，融合第一节点特征矩阵和第二节点特征矩阵，确定预测节点特征矩阵；根据预测原子特征矩阵和节点特征矩阵，确定待预测药物的预测矩阵。本发明可以提高了药物副作用预测的准确率。

Description

一种药物副作用预测方法、装置、电子设备及存储介质

技术领域

本发明涉及生物信息学技术领域，具体而言，涉及一种药物副作用预测方法、装置、电子设备及存储介质。

背景技术

随着机器学习领域的快速发展，越来越多的基于机器学习算法的药物副作用预测技术，应用于药物的开发过程中，并利用药物副作用预测技术预测药物副作用的频率，以评价药物的安全性和有效性，进而可以帮助研究人员更早发现药物可能导致的不良反应，使药物开发过程更加高效安全，还可以帮助药物监测机构对上市的药物进行监测。

目前，常用的药物预测技术包括通过满足KKT互补条件收敛的非负矩阵分解预测频率分数预测药物副作用的频率和通过多视图数据模型预测药物副作用的频率。但第一种预测技术不适用于冷启动实验场景，进而导致在冷启动试验场景下预测准确率较低，第二种容易产生虚假的药物副作用关联，进而导致预测准确率较低。综上所述，现有的药物副作用的预测技术预测准确率较低。

发明内容

为解决上述问题，本发明提供一种药物副作用预测方法、装置、电子设备及存储介质。

根据本发明的第一方面，提供一种药物副作用预测方法，所述方法包括：

根据待预测药物的分子式，确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，其中，所述原子特征矩阵由原子特征向量构成，所述原子特征向量用于表示原子的化学特性，所述原子邻接矩阵用于表示不同原子之间的连接关系，所述节点特征矩阵由节点特征向量构成，所述节点特征向量用于表示节点的节点特征，所述节点邻接矩阵用于表示不同节点之间的连接关系；

根据所述原子邻接矩阵，对各个所述原子的所述原子特征向量进行更新，确定第一原子特征矩阵，以及根据所述节点邻接矩阵，对各个所述节点的所述节点特征向量进行更新，确定第一节点特征矩阵；

根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵；

融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵；

根据所述预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，以利用所述预测矩阵对所述待预测药物的药物副作用进行预测。

可选地，所述根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，包括：

遍历所述药物副作用集合，确定所述药物副作用集合中的全部节点组，其中，所述节点组由两个所述节点组成；

根据频率分数矩阵确定各个所述节点组的相似度；

根据近邻算法，确定所述相似度是否符合预设条件；

若符合，则连接所述相似度对应的所述节点组中的所述节点，以确定所述节点邻接矩阵。

可选地，所述根据所述原子邻接矩阵，对各个所述原子的所述原子特征向量进行更新，确定第一原子特征矩阵，包括：

根据所述原子邻接矩阵，确定待更新原子的邻接原子集合；

分别计算各个邻接原子对所述待更新原子的重要性值；

基于多头注意力算法，利用全部所述重要性值，确定所述待更新原子的第一原子特征向量；

基于GAT算法，利用所述第一原子特征向量，确定第二原子特征向量；

遍历所述原子特征矩阵，确定各个所述原子的所述第二原子特征向量，以对各个所述原子的所述原子特征向量进行更新，确定所述第一原子特征矩阵。

可选地，所述根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵，包括：

通过全连层将所述原子特征矩阵和所述节点特征矩阵映射至同一向量空间，得到第一映射原子特征矩阵和第一映射节点特征矩阵；

拼接所述第一映射原子特征矩阵和所述第一映射节点特征矩阵，生成映射药物特征矩阵；

基于编码器-解码器更新所述映射药物特征矩阵，生成第一映射药物特征矩阵；

拆分所述第一映射药物特征矩阵，确定所述第二原子特征矩阵和所述第二节点特征矩阵。

可选地，所述融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵，包括：

根据预设权重值融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定所述预测原子特征矩阵；

根据所述预设权重值融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定所述预测节点特征矩阵。

可选地，所述根据所述预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，包括：

基于矩阵内积算法，利用所述预测原子特征矩阵和所述节点特征矩阵，确定所述待预测药物的所述预测矩阵。

可选地，所述方法还包括：

基于预设损失函数更新所述预测矩阵，确定第一预测矩阵，以利用所述第一预测矩阵对所述待预测药物的药物副作用的进行预测。

根据本发明的第二方面，提供一种药物副作用预测装置，所述药物副作用预测装置包括：

确定模块，用于根据待预测药物的分子式，确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，其中，所述原子特征矩阵由原子特征向量构成，所述原子特征向量用于表示原子的化学特性，所述原子邻接矩阵用于表示不同原子之间的连接关系，所述节点特征矩阵由节点特征向量构成，所述节点特征向量用于表示节点的节点特征，所述节点邻接矩阵用于表示不同节点之间的连接关系；

第一更新模块，用于根据所述原子邻接矩阵，对各个所述原子的所述原子特征向量进行更新，确定第一原子特征矩阵，以及根据所述节点邻接矩阵，对各个所述节点的所述节点特征向量进行更新，确定第一节点特征矩阵；

第二更新模块，用于根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵；

融合模块，用于融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵；

预测模块，用于根据所述预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，以利用所述预测矩阵对所述待预测药物的药物副作用进行预测。

根据本发明的第三方面，提供一种电子设备，所述电子设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时基于第一方面所述的药物副作用预测方法。

根据本发明的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现第一方面所述的药物副作用预测方法。

本发明提供的技术方案可以包括以下有益效果：

本发明提供的药物副作用预测方法，首先根据待预测药物的分子式，确定待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据预先获取的药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，进一步地，通过原子邻接矩阵，对各个原子的原子特征向量进行更新，可以更加准确地确定各个原子的特征，通过节点邻接矩阵，对各个节点的节点特征向量进行更新，确定第一节点特征矩阵，进而可以更加准确地确定各个节点的特征，同时，通过原子特征与药物副作用之间的影响关系，分别对原子特征矩阵和节点特征矩阵进行更新，可以准确地掌握原子与药物副作用之间的影响关系，从而可以确定药物副作用被引起的原因，进一步地将第一原子特征矩阵和第二原子特征矩阵和第一节点特征矩阵和第二节点特征矩阵分别进行融合，可以进一步地掌握原子特征与药物副作用之间的影响关系，最后利用预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，并利用所述预测矩阵对所述待预测药物的药物副作用的进行预测，可以充分的利用原子特征、节点特征和原子特征与药物副作用之前的影响关系，对药物副作用进行预测，提高了药物副作用预测的准确率。

附图说明

图1为本发明实施例提供的一种药物副作用预测方法流程图；

图2为本发明另一实施例提供的一种药物副作用预测方法流程图；

图3为本发明另一实施例提供的一种药物副作用预测装置示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

在本发明使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本发明范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

第一方面，本发明实施例提供的一种药物副作用预测方法，如图1所示，该方法包括：

S101，根据待预测药物的分子式，确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵。

本实施例中，首先获取待预测药物的分子式，并可以根据分子式绘制待预测药物分子式的无向图，在无向图中，每个点可以用于表示原子，边可以用于表示原子与原子之间的化学键，进而可以获取每个原子的原子特征，并以原子特征向量的方式进行表达，以确定原子特征矩阵，同时，获取各个原子之间的连接关系，以确定原子邻接矩阵。

本实施例中，在确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵的同时，根据预先读取的药物副作用集合，获取药物副作用集合中每个节点的节点特征和各个节点之间的连接关系，以确定节点特征矩阵和节点邻接矩阵。其中，本实施例中，原子特征矩阵由原子特征向量构成，原子特征向量用于表示原子的化学特性，原子邻接矩阵用于表示不同原子之间的连接关系，节点用于表示药物副作用，节点特征矩阵由节点特征向量构成，节点特征向量用于表示节点的节点特征，所述节点邻接矩阵用于表示不同节点之间的连接关系。

在一个示例中，本实施例中的原子特征可以包括原子元素类型，原子杂化类型，原子的度，原子连接的氢原子个数（原子所连接其他原子的个数），原子隐式化合价，原子显式化合价，原子形式电荷，原子是否在芳香烃内等。

在一个示例中，原子特征矩阵可以表示为，其中，表示第u个原子的原子特征向量。

S102，根据所述原子邻接矩阵，对各个所述原子的原子特征向量进行更新，确定第一原子特征矩阵，以及根据所述节点邻接矩阵，对各个所述节点的节点特征向量进行更新，确定第一节点特征矩阵。

本实施例中，在执行S101之后，利用原子邻接矩阵中各个原子之间的连接关系，依次对原子特征矩阵中各个原子的原子特征向量进行更新，以根据原子之间的连接关系，进一步地准确掌握原子的原子特征，从而可以利用更新后的原子特征向量，确定第一原子特征矩阵。

本实施例中，利用节点邻接矩阵中各个节点之间的连接关系，依次对节点特征矩阵中各个节点的节点特征向量进行更新，以根据节点之间的连接关系，进一步地准确掌握节点的节点特征，从而可以利用更新后的节点特征向量，确定第一节点特征矩阵。

在一个示例中，原子特征矩阵和第一原子特征矩阵具有不同的维度，节点特征矩阵和第一节点特征矩阵具有不同维度，第一原子特征矩阵和第一节点特征矩阵的维度相同。

在一个示例中，第一原子特征矩阵和第一节点特征矩阵的维度可以为256。

S103，根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵。

本实施例中，在执行S102的同时，根据原子特征与药物副作用之间的影响关系，即不同的原子对不同的药物副作用的影响的大小程度，分别对原子特征矩阵和节点特征矩阵进行更新，从而确定第二原子特征矩阵和第二节点特征矩阵，以准确地确定待预测药物中各个原子和不同的药物副作用之间的关联关系。

在一个示例中，第二原子特征矩阵和第二节点特征矩阵的维度，与第一原子特征矩阵和第一节点特征矩阵的维度相同。

S104，融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵。

本实施例中，在执行S102和S103之后，将第一原子特征矩阵和第二原子特征矩阵进行融合，以确定预测原子特征矩阵，同时，将第一节点特征矩阵和第二节点特征矩阵进行融合，以确定预测节点特征矩阵。

S105，根据所述预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，以利用所述预测矩阵对所述待预测药物的药物副作用的进行预测。

本实施例中，在执行S104分别得到预测原子特征矩阵和预测节点特征矩阵之后，则利用测原子特征矩阵和预测节点特征矩阵确定预测矩阵，进而可以利用预测矩阵对所述待预测药物的药物副作用的进行预测。

在一个示例中，可以通过矩阵内积算法，利用所述预测原子特征矩阵和所述节点特征矩阵，确定所述待预测药物的所述预测矩阵，进而可以利用预测矩阵对所述待预测药物的药物副作用的进行预测。

本发明实施例提供的药物副作用预测方法，首先根据待预测药物的分子式，确定待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据预先获取的药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，进一步地，通过原子邻接矩阵，对各个原子的原子特征向量进行更新，可以更加准确的确定各个原子的特征，通过节点邻接矩阵，对各个节点的节点特征向量进行更新，确定第一节点特征矩阵，进而可以更加准确的确定各个节点的特征，同时，通过原子特征与药物副作用之间的影响关系，分别对原子特征矩阵和节点特征矩阵进行更新，可以准确地掌握原子与药物副作用之间的影响关系，进一步地将第一原子特征矩阵和第二原子特征矩阵和第一节点特征矩阵和第二节点特征矩阵分别进行融合，可以进一步地掌握原子特征与药物副作用之间的影响关系，最后利用预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，并利用所述预测矩阵对所述待预测药物的药物副作用的进行预测，可以充分的利用原子特征、节点特征和原子特征与药物副作用之前的影响关系，对药物副作用进行预测，提高了药物副作用预测的准确率。

进一步地，在执行步骤S101中的根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵时，可以包括以下步骤：

S1021，遍历所述药物副作用集合，确定所述药物副作用集合中的全部节点组。

本实施例中，在获取到药物副作用集合时，则遍历药物副作用集合中各个节点，将任意两个节点组成节点组，从而获取药物副作用集合对应的全部节点组，其中，每个节点表示一个药物副作用。

S1022，根据频率分数矩阵确定各个所述节点组的相似度。

本实施例中，在执行S1021之后，在确定药物副作用集合对应的全部节点组之后，根据频率分数矩阵P确定各个节点组的相似度，即节点组中两个节点之间的相似度。并采用第一公式计算节点组的相似度，具体公式如下所示：

；

其中，表示相似度，/>表示节点组中的第一节点的节点名称，/>表示节点组中的第二节点的节点名称，/>表示频率分布矩阵中第一节点的频率，/>表示频率分布矩阵中第二节点的频率，/>表示转置，/>表示计算向量的模。

具体地，本实施例中的药物副作用集合来自于SIDER数据库的4.1版本，通过分别读取SIDER数据库各个副作用的频率构建频率分数矩阵P。

S1023，根据近邻算法，确定所述相似度是否符合预设条件。

本实施例中，在执行S1022之后，在得到各个节点组的相似度之后，则利用预设的近邻算法，例如使用KNN算法，依次确定各个节点组的相似度是否符合条件。预设条件具体如下：

；

其中，为第/>个节点，/>为第/>个节点，/>表示第/>个节点的前K个邻居节点。

S1024，若符合，则连接所述相似度对应的所述节点组中的节点，以确定所述节点邻接矩阵。

本实施例中，在执行S1023执行，在判断节点组的相似度符合预设条件时，即为/>的前K个邻居节点时，则连接节点组中的/>和/>，在判断节点组的相似度不符合预设条件时，则不连接节点组中的节点，遍历全部节点组，从而可以得到节点邻接矩阵，其中，R为实数矩阵，v药物副作用的总数量。

进一步地，在执行S102中的根据所述原子邻接矩阵，对各个所述原子的原子特征向量进行更新，确定第一原子特征矩阵时，可以包括以下步骤：

S1021，根据所述原子邻接矩阵，确定待更新原子的邻接原子集合。

本实施例中，在更新原子特征向量时，首选根据原子邻接矩阵表示的各个原子之间连接关系，确定与待更新原子相邻的邻接原子，以确定待更新原子的邻接原子集合。

在一个示例中，待更新原子以进行表示，邻接原子集合以/>进行表示，邻接原子以/>进行表示，其中，/>。

S1022，分别计算各个邻接原子对所述待更新原子的重要性值。

本实施例中，在确定待更新原子的邻接原子集合后，则分别计算各个邻接原子相对于待更新原子的重要性值，其中，重要性值用于表示待更新原子与邻接原子之间的关联性，其中，重要性值与关联性之间呈正相关。具体计算方法如第二公式至第四公式所示。

第二公式为：

；

其中，为第一重要性值，/>为权重矩阵，且/>，/>为待更新原子的原子特征向量的维度，/>为待更新原子更新后的原子特征向量的维度，/>为/>的映射，且/>，/>为待更新原子的原子特征向量，/>为邻接原子的原子特征向量。

第三公式为：

；

其中，为归一化的注意力权重，/>为归一化指数函数。

第四公式为：

；

其中，为重要性值，/>为激活函数，可以为/>激活函数。

S1023，基于多头注意力算法，利用全部所述重要性值，确定所述待更新原子的第一原子特征向量。

本实施例中，具体使用第五公式确定第一原子特征向量，第五公式为：

；

其中，为待更新原子的第一原子特征向量，/>为多头注意力算法的头数，t为表示第t个头。

S1024，基于GAT算法，利用所述第一原子特征向量，确定第二原子特征向量。

本实施例中，在执行S1023后，将第一原子特征向量输入至GAT算法中，即可以得到待更新原子的第二原子特征向量，其中，第二原子特征向量的维度可以为256。

S1025，遍历所述原子特征矩阵，确定各个所述原子的所述第二原子特征向量，以对各个所述原子的原子特征向量进行更新，确定所述第一原子特征矩阵。

本实施例中，在得到待更新原子的第二原子特征向量之后，则遍历原子特征矩阵，依次计算各个原子的第二原子特征向量，并将各个原子的第二原子特征向量进行整理，确定第一原子特征矩阵。

本实施例中，在执行S102中根据所述节点邻接矩阵，对各个所述节点的节点特征向量进行更新，确定第一节点特征矩阵时，采用与S1021-S1025相同的方法确定各个节点的第二节点特征向量，从而确定第一节点特征矩阵，在此不在赘述。

进一步地，在执行S103时，可以包括以下步骤：

S1031，通过全连层将所述原子特征矩阵和所述节点特征矩阵映射至同一向量空间，得到第一映射原子特征矩阵和第一映射节点特征矩阵。

本实施例中，首先通过全连层对原子特征矩阵和节点特征矩阵进行映射，已告知同一向量空间内，并通过下列方式进行表示：

；

其中，为原子特征矩阵，/>为第一映射原子特征矩阵，/>为节点特征矩阵，第一映射节点特征矩阵，/>为激活函数，用于将线性结果转换为非线性，/>和/>为权重矩阵，/>和/>为偏差。

S1032，拼接所述第一映射原子特征矩阵和所述第一映射节点特征矩阵，生成映射药物特征矩阵。

本实施例中，再同一向量空间内将第一映射原子特征矩阵和第一映射节点特征矩阵进行拼接，生成药物特征矩阵，其中，药物特征矩阵具体表示为：

；

其中，表示药物特征矩阵，其中，/>，/>表示第/>个原子的映射原子特征向量，/>表示第/>个节点的节点特征向量。

S1033，基于编码器-解码器更新所述映射药物特征矩阵，生成第一映射药物特征矩阵。

本实施例中，在执行S1032得到药物特征矩阵之后，首先利用编码器-解码器输入药物特征矩阵，以根据药物特征矩阵生成查询向量、键向量/>和值向量/>，其中，、/>、/>，/>为第一注意力矩阵权重，/>为第二注意力矩阵权重，/>为第三注意力矩阵权重。

进一步的根据第六公式和第七公式分别对第一注意力矩阵、第二注意力矩阵和第三注意力矩阵进行更新。

第六公式具体为：

；

其中，为注意力矩阵，/>为计算系数。

第七公式具体为：

。

进一步地，简化第七公式的运算，可以得到第八公式，第八公式具体如下：

；

其中，为第一映射药物特征矩阵，其中，/>为第二映射原子特征矩阵，/>为第二映射节点特征矩阵，/>表示第二映射原子特征矩阵的查询向量，/>表示第二映射原子特征矩阵的键向量的转置，/>表示第二映射原子特征矩阵的值向量，表示第二映射节点特征矩阵的查询向量，/>表示第二映射节点特征矩阵的键向量的转置，/>表示第二映射节点特征矩阵的值向量。

S1034，拆分所述第一映射药物特征矩阵，确定所述第二原子特征矩阵和所述第二节点特征矩阵。

本实施例中，在得到第一映射药物特征矩阵矩阵之后，首先残差连接，即将原子特征矩阵和第二映射原子特征矩阵相加，同时将节点特征矩阵和第二映射节点特征矩阵相加。

进一步地，分别对第二映射原子特征矩阵和第二映射节点特征矩阵进行归一化处理，具体使用第九公式和第十公式进行归一化处理。

第九公式具体为：

。

其中，为/>的均值，/>为/>的标准差，/>为一个很小的常数（例如）以防止分母为零，/>可学习的缩放因子和/>为可学习的位移因子，与的维度相同。

第十公式具体为：

。

其中，为/>的均值，/>为/>的标准差，/>为一个很小的常数（例如为）以防止分母为零，/>可学习的缩放因子和/>为可学习的位移因子，与/>的维度相同。

进一步地，利用第十一公式和第十二公式分别确定预拆分第二映射原子特征矩阵和预拆分第二节点特征矩阵。

第十一公式具体为：

；

其中，表示预拆分第二映射原子特征矩阵，/>表示/>层的前馈神经网络，其中，每个层都有一个隐藏层维度为256，/>和/>为可学习的权重，/>和/>为偏差。

第十二公式具体为：

；

其中，表示预拆分第二映射节点特征矩阵，/>和/>为可学习的权重，和/>为偏差。

重复进行残差连接和归一化处理，直至重复执行至预设次数，并在达到预设次数后进行拆分第一映射药物特征矩阵，分别确定第二原子特征矩阵和第二节点特征矩阵。

具体地，第二原子特征矩阵可以表示为下列形式：

；

其中，为第二原子特征矩阵，/>为第/>个原子的第二原子特征向量。

具体地，第二节点特征矩阵可以表示为下列形式：

；

其中，为第二节点特征矩阵，/>为第/>个节点的第二节点特征向量。

进一步地，在执行S104时，可以包括以下步骤：

S1041，根据预设权重值融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定所述预测原子特征矩阵。

本实施例中，具体采用第十三公式融合第一原子特征矩阵和第二原子特征矩阵，具体公式如下：

；

其中，为预测原子特征矩阵中原子的预测原子特征向量，/>为第一原子特征向量，其中，/>。

S1042，根据所述预设权重值融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定所述预测节点特征矩阵。

本实施例中，具体采用第十四公式融合第一节点特征矩阵和第二节点特征矩阵，具体公式如下：

；/>

其中，为预测节点特征矩阵中节点的预测节点特征向量，/>为第一节点特征向量，其中，/>。

在一个示例中，在执行S1042之前，还可以使用全局最大池化操作，保留各个原子最重要的特征，进而可以对原子的特征进行过滤，去除冗余特征和噪声特征，以提高融合效率。

进一步地，本发明实施例还可以包括以下步骤：

S106，基于预设损失函数更新所述预测矩阵，确定第一预测矩阵，以利用所述第一预测矩阵对所述待预测药物的药物副作用的进行预测。

本实施例中，具体采用第九公式对确定第一预测矩阵，第九公式具体如下：

；

其中，表示预测矩阵，/>表示频率分数矩阵，/>表示/>范数的平方，/>用来定位频率分数矩阵/>中已知频率的位置，/>用于定位频率分数矩阵/>中未观测频率的位置,/>表示数值位置均为1的矩阵，/>为调节权重，用于调整已知频率与未观测到频率之间对模型预测的重要程度，/>为控制变量。

进一步地，本发明另一实施例提供一种药物副作用预测方法，具体步骤如图2所示，包括：

首先获取待预测药物的分子式，并利用分子式绘制待预测药物的无向图，进而在无向图中获取各个原子的原子特征，并根据原子特征确定对应的原子特征向量，以利用原子特征向量构建原子特征矩阵，同时，根据无向图中不同原子之前的连接关系，构建待预测药物的原子邻接矩阵。

获取药物副作用集合，并根据副作用集合中各个节点的特征，确定各个节点对应的节点特征向量，以构建节点特征矩阵，同时，将药物副作用集合中任意两个节点进行自由组合，获取药物副作用集合对应的全部节点组，进而利用第一公式分别计算各个节点组中两个节点之间的相似度，进一步地，利用近邻算法，确定相似度是否符合预设条件，并在相似度符合预设条件时，连接全部符合预设条件的节点组，从而确定药物副作用集合中不同节点之间的连接关系，从而构建节点邻接矩阵。

在获取原子特征矩阵、原子邻接矩阵、节点特征矩阵和节点邻接矩阵之后，根据原子邻接矩阵分别确定各个原子的邻接原子集合，并利用第二公式，分别计算邻接原子集合中各个邻接原子相当于原子的第一重要性值，进一步地，利用第三公式对分别对各个第一重要性值进行归一化处理，进一步地，利用第四公式，确定各个原子的重要性值，从而利用第五公式和每个原子所对应的全部重要性值，确定各个原子的第一原子特征向量，进一步地，利用GAT算法，分别确定第一原子特征向量对应的第二原子特征向量，以利用第二原子特征向量更新初始的原子特征向量，以确定第一原子特征矩阵。

同时，基于与确定第一原子特征矩阵相同的方法，分别确定节点特征矩阵中各个节点的第二节点特征向量，以利用第二节点特征向量更新初始的节点特征向量，以确定第一节点特征矩阵。

在确定第一原子特征矩阵和第一节点特征矩阵的同时，利用全连层将原子特征矩阵和节点特征矩阵分别映射到同一向量空间内，确定第一映射原子特征矩阵和第一映射原子特征矩阵，进一步地，将第一映射原子特征矩阵和第一映射特征矩阵进行拼接，以确定药物特征矩阵，进一步地，将药物特征矩阵作为编码器-解码器的输入，以输出第一映射药物特征矩阵，其中，第一映射药物特征矩阵由第二映射原子特征矩阵和第二映射节点特征矩阵组成，进一步地，进行残差连接，即将原子特征矩阵和第二映射原子特征矩阵相加，同时将节点特征矩阵和第二映射节点特征矩阵相加，进一步地，利用第六公式对第二映射原子特征矩阵进行归一化处理、利用第七公式对第二映射节点特征矩阵进行归一化处理，进一步地，使用前馈神经网络分别对第二映射原子特征矩阵和第二映射节点特征矩阵进行处理，分别得到预拆分第二映射原子特征矩阵和预拆分第二映射节点特征矩阵，进一步地，重复进行残差连接和归一化处理，直至重复执行至预设次数，并在达到预设次数后进行拆分第一映射药物特征矩阵，分别确定第二原子特征矩阵和第二节点特征矩阵。

在确定第一原子特征矩阵、第二原子特征矩阵、第一节点特征矩阵和第二节点特征矩阵之后，融合第一原子特征矩阵和第二原子特征矩阵，以生成预测原子特征矩阵，同时融合第一节点特征矩阵和第二节点特征矩阵，以生成预测节点特征矩阵。

基于矩阵内积算法，利用所述预测原子特征矩阵和所述节点特征矩阵，确定预测矩阵，进一步地，基于预设损失函数更新所述预测矩阵，确定第一预测矩阵，以利用所述第一预测矩阵对所述待预测药物的药物副作用的进行预测。

进一步地，本发明另一实施例提供一种药物副作用预测装置，如图3所示，所述药物副作用预测装置包括：

确定模块301，用于根据待预测药物的分子式，确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，其中，所述原子特征矩阵由原子特征向量构成，所述原子特征向量用于表示原子的化学特性，所述原子邻接矩阵用于表示不同原子之间的连接关系，所述节点特征矩阵由节点特征向量构成，所述节点特征向量用于表示节点的节点特征，所述节点邻接矩阵用于表示不同节点之间的连接关系。

第一更新模块302，用于根据所述原子邻接矩阵，对各个所述原子的原子特征向量进行更新，确定第一原子特征矩阵，以及根据所述节点邻接矩阵，对各个所述节点的节点特征向量进行更新，确定第一节点特征矩阵。

第二更新模块303，用于根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵。

融合模块304，用于融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵。

预测模块305，用于根据所述预测原子特征矩阵和所述节点特征矩阵，确定待预测药物的预测矩阵，以利用所述预测矩阵对所述待预测药物的药物副作用的进行预测。

本发明另一实施例提供一种电子设备，所述电子设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时基于本发明实施例所述的药物副作用预测方法。

本发明另一实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明实施例所述的药物副作用预测方法。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

此外，存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)，存储器包括至少一个存储芯片。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，电子设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

Claims

1.一种药物副作用预测方法，其特征在于，包括：

步骤S101，根据待预测药物的分子式，确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，其中，所述原子特征矩阵由原子特征向量构成，所述原子特征向量用于表示原子的化学特性，所述原子邻接矩阵用于表示不同原子之间的连接关系，所述节点特征矩阵由节点特征向量构成，所述节点特征向量用于表示节点的节点特征，所述节点邻接矩阵用于表示不同节点之间的连接关系；

步骤S102a，根据所述原子邻接矩阵，对各个所述原子的所述原子特征向量进行更新，确定第一原子特征矩阵，包括：

步骤S1021，根据所述原子邻接矩阵，确定待更新原子的邻接原子集合；

步骤S1022，分别计算各个邻接原子对所述待更新原子的重要性值；

步骤S1023，基于多头注意力算法，利用全部所述重要性值，根据第五公式确定所述待更新原子的第一原子特征向量；

其中，所述第五公式为：

其中，为待更新原子的第一原子特征向量，T为多头注意力算法的头数，t为表示第t个头，/>为激活函数，/>为邻接原子的原子特征向量，/>为归一化的注意力权重，/>为权重矩阵，/>为待更新原子，/>为邻接原子集合，/>为邻接原子，且，/>；

步骤S1024，基于GAT算法，利用所述第一原子特征向量，确定第二原子特征向量；

步骤S1025，遍历所述原子特征矩阵，确定各个所述原子的所述第二原子特征向量，以对各个所述原子的所述原子特征向量进行更新，确定所述第一原子特征矩阵；

步骤S102b，根据所述节点邻接矩阵，基于与步骤S1021-S1025相同的方法，对各个所述节点的所述节点特征向量进行更新，确定第一节点特征矩阵；

步骤S103，根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵，包括：

步骤S1031，通过全连层将所述原子特征矩阵和所述节点特征矩阵映射至同一向量空间，得到第一映射原子特征矩阵和第一映射节点特征矩阵；

步骤S1032，拼接所述第一映射原子特征矩阵和所述第一映射节点特征矩阵，生成映射药物特征矩阵；

步骤S1033，基于编码器-解码器更新所述映射药物特征矩阵，生成第一映射药物特征矩阵，包括：

步骤A1，根据所述映射药物特征矩阵生成查询向量、键向量/>和值向量/>，其中，，/>为第一注意力矩阵权重，/>为第二注意力矩阵权重，/>为第三注意力矩阵权重；

步骤A2，根据第六公式和第七公式分别对所述第一注意力矩阵、所述第二注意力矩阵和所述第三注意力矩阵进行更新，并根据第八公式得到第一映射药物特征矩阵，

其中，所述第六公式为：

；

其中，为注意力矩阵，/>为计算系数；

所述第七公式为：

；

所述第八公式为：

；

其中，为第一映射药物特征矩阵，其中，/>为第二映射原子特征矩阵，/>为第二映射节点特征矩阵，/>表示第二映射原子特征矩阵的查询向量，/>表示第二映射原子特征矩阵的键向量的转置，/>表示第二映射原子特征矩阵的值向量，/>表示第二映射节点特征矩阵的查询向量，/>表示第二映射节点特征矩阵的键向量的转置，/>表示第二映射节点特征矩阵的值向量；

步骤S1034，拆分所述第一映射药物特征矩阵，确定所述第二原子特征矩阵和所述第二节点特征矩阵，包括；

步骤T1，将所述原子特征矩阵和所述第二映射原子特征矩阵相加，并将所述节点特征矩阵和所述第二映射节点特征矩阵相加，并根据连接后的所述第二映射原子特征矩阵和所述第二映射节点特征矩阵，通过第九公式和第十公式进行归一化处理，得到归一化处理后的所述第二映射原子特征矩阵和所述第二映射节点特征矩阵；

步骤T2，根据归一化处理后的所述第二映射原子特征矩阵和所述第二映射节点特征矩阵，通过第十一公式和第十二公式分别确定预拆分第二映射原子特征矩阵和预拆分第二节点特征矩阵；

其中，所述第九公式具体为：

；

其中，为/>的均值，/>为/>的标准差，/>为一个很小的常数以防止分母为零，/>可学习的缩放因子和/>为可学习的位移因子，与/>的维度相同；

所述第十公式具体为：

；

所述第十一公式具体为：

；

其中，表示预拆分第二映射原子特征矩阵，/>表示n层的前馈神经网络，其中，每个层都有一个隐藏层维度为256，/>和/>为可学习的权重，/>和/>为偏差；

所述第十二公式具体为：

；

其中，表示预拆分第二映射节点特征矩阵，/>和/>为可学习的权重，/>和为偏差；

重复步骤T1-T2，直至达到预设次数后，拆分所述第一映射药物特征矩阵，得到所述第二原子特征矩阵和所述第二节点特征矩阵；

步骤S104，融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵，包括：

步骤S1041，根据预设权重值融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定所述预测原子特征矩阵；

步骤S1042，根据所述预设权重值融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定所述预测节点特征矩阵；

步骤S105，根据所述预测原子特征矩阵和所述预测节点特征矩阵，确定待预测药物的预测矩阵，以利用所述预测矩阵对所述待预测药物的药物副作用进行预测。

2.根据权利要求1所述的药物副作用预测方法，其特征在于，所述根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，包括：

根据频率分数矩阵确定各个所述节点组的相似度；

根据近邻算法，确定所述相似度是否符合预设条件；

3.根据权利要求1所述的药物副作用预测方法，其特征在于，所述根据所述预测原子特征矩阵和所述预测节点特征矩阵，确定待预测药物的预测矩阵，包括：

基于矩阵内积算法，利用所述预测原子特征矩阵和所述预测节点特征矩阵，确定所述待预测药物的所述预测矩阵。

4.根据权利要求1所述的药物副作用预测方法，其特征在于，还包括：

5.一种药物副作用预测装置，其特征在于，所述药物副作用预测装置包括：

确定模块用于：步骤S101，根据待预测药物的分子式，确定所述待预测药物对应的原子特征矩阵和原子邻接矩阵，以及根据药物副作用集合，确定所述药物副作用集合对应的节点特征矩阵和节点邻接矩阵，其中，所述原子特征矩阵由原子特征向量构成，所述原子特征向量用于表示原子的化学特性，所述原子邻接矩阵用于表示不同原子之间的连接关系，所述节点特征矩阵由节点特征向量构成，所述节点特征向量用于表示节点的节点特征，所述节点邻接矩阵用于表示不同节点之间的连接关系；

第一更新模块用于：步骤S102a，根据所述原子邻接矩阵，对各个所述原子的所述原子特征向量进行更新，确定第一原子特征矩阵，包括：

步骤S1023，基于多头注意力算法，利用全部所述重要性值，根据第五公式确定所述待更新原子的第一原子特征向量，其中，所述第五公式为：

第二更新模块用于：步骤S103，根据原子特征与药物副作用之间的影响关系，分别对所述原子特征矩阵和所述节点特征矩阵进行更新，确定第二原子特征矩阵和第二节点特征矩阵，包括：

其中，所述第六公式为：

；

其中，为注意力矩阵，/>为计算系数；

所述第七公式为：

；

所述第八公式为：

；

其中，为第一映射药物特征矩阵，其中，/>为第二映射原子特征矩阵，为第二映射节点特征矩阵，/>表示第二映射原子特征矩阵的查询向量，/>表示第二映射原子特征矩阵的键向量的转置，/>表示第二映射原子特征矩阵的值向量，/>表示第二映射节点特征矩阵的查询向量，/>表示第二映射节点特征矩阵的键向量的转置，表示第二映射节点特征矩阵的值向量；

其中，所述第九公式具体为：

;

第十公式具体为：

;

其中，为/>的均值，/>为/>的标准差，/>为一个很小的常数以防止分母为零，/>可学习的缩放因子和/>为可学习的位移因子，与/>的维度相同;

所述第十一公式具体为：

；

所述第十二公式具体为：

；

融合模块用于：步骤S104，融合所述第一原子特征矩阵和所述第二原子特征矩阵，确定预测原子特征矩阵，以及融合所述第一节点特征矩阵和所述第二节点特征矩阵，确定预测节点特征矩阵，包括：

预测模块用于：步骤S105，根据所述预测原子特征矩阵和所述预测节点特征矩阵，确定待预测药物的预测矩阵，以利用所述预测矩阵对所述待预测药物的药物副作用进行预测。

6.一种电子设备，其特征在于，所述电子设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时基于权利要求1至4中任一项所述的药物副作用预测方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至4中任一项所述的药物副作用预测方法。