CN111933225A

CN111933225A - 药物分类方法、装置、终端设备以及存储介质

Info

Publication number: CN111933225A
Application number: CN202011035837.1A
Authority: CN
Inventors: 王俊; 李朋勇
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Chuangke Technology (Beijing) Co.,Ltd.
Priority date: 2020-09-27
Filing date: 2020-09-27
Publication date: 2020-11-13
Anticipated expiration: 2040-09-27
Also published as: JP7227405B2; CN111933225B; JP2022538823A; US20220101954A1; WO2021159744A1

Abstract

本申请实施例公开了一种药物分类方法、装置、终端设备以及存储介质，该方法适用于数字医疗。该方法包括：获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量。根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵，并根据n个原子和虚拟原子的属性特征向量构建原子属性特征矩阵。将邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。根据传递特征矩阵确定待检测药物分子对应的分子特征向量，将分子特征向量输入分类器以通过分类器输出待检测药物分子的药物类别。采用本申请实施例，可提高对药物分类的准确度。

Description

药物分类方法、装置、终端设备以及存储介质

技术领域

本申请涉及数据处理领域，尤其涉及一种药物分类方法、装置、终端设备以及存储介质。

背景技术

药物开发过程存在资本密度高、风险大、周期长的特点，需要投入大量的资金、人力与物力。传统的机器学习方法虽然可以在一定程度上辅助药物开发，但需要分子描述符作为特征输入，而不同的分子描述符的选择对机器学习模型的性能影响较大，因此传统的机器学习方法大多需要进行繁复、耗时的特征工程。近年新兴的深度学习方法，能够从药物的原始结构中直接提取特征，从而绕开特征工程，缩短开发周期。但是基于现有的深度学习方法所提取的药物分子的特征用于预测药物分类时，其预测精度仍有待提高。

发明内容

本申请实施例提供一种药物分类方法、装置、终端设备以及存储介质，可提高对药物分类的准确性。

第一方面，本申请实施例提供了一种药物分类方法，该方法包括：

获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，其中，所述待检测药物分子包括n个原子，所述虚拟原子连接所述n个原子中的每个原子；

根据所述虚拟原子与所述n个原子中每个原子的连接关系，以及所述n个原子中各原子间的连接关系构建邻接矩阵，并根据所述n个原子和所述虚拟原子的属性特征向量构建原子属性特征矩阵；

将所述邻接矩阵和原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵；

根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量，将所述分子特征向量输入分类器以通过所述分类器输出所述待检测药物分子的药物类别。

结合第一方面，在一种可能的实施方式中，所述n个原子和所述虚拟原子中任一原子的属性特征向量由所述任一原子的属性特征确定，所述任一原子的属性特征包括原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性中的一个或者多个。

结合第一方面，在一种可能的实施方式中，所述方法还包括：

获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接所述虚拟原子和所述n个原子中每个原子的化学键对应的属性特征向量；

根据所述各原子的化学键对应的属性特征向量和所述虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵；

所述将所述邻接矩阵和原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵包括：

将所述化学键属性特征矩阵连同所述邻接矩阵和所述原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵。

结合第一方面，在一种可能的实施方式中，所述n个原子间的化学键和连接所述虚拟原子和所述n个原子中每个原子的化学键中任一化学键的属性特征向量由所述任一化学键的属性特征确定，所述任一化学键的属性特征包括化学键类型、共轭特征、环键特征和分子立体化学特征中的一个或者多个。

结合第一方面，在一种可能的实施方式中，所述获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量之前，所述方法还包括：

获取训练数据集，所述训练数据集中包括多个药物分子训练样本，其中，一个药物分子训练样本中包括至少一个样本药物分子以及所述至少一个样本药物分子中每个样本药物分子的药物类别标签；

根据各个药物分子训练样本训练所述图神经网络和所述分类器，以得到满足收敛条件的所述图神经网络和所述分类器。

结合第一方面，在一种可能的实施方式中，所述根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量，包括：

将所述传递特征矩阵中所述虚拟原子对应的传递特征向量确定为所述待检测药物分子对应的分子特征向量。

获取所述传递特征矩阵中所述n个原子对应的n个传递特征向量，其中，一个原子对应的一个传递特征向量；

将所述n个传递特征向量之和确定为第一分子特征向量，以及将所述传递特征矩阵中所述虚拟原子对应的传递特征向量确定为第二分子特征向量；

对所述第一分子特征向量和所述第二分子特征向量进行加权求和以得到第三分子特征向量，将所述第三分子特征向量确定为所述待检测药物分子对应的分子特征向量。

第二方面，本申请实施例提供了一种药物分类装置，该装置包括：

原子属性特征向量获取模块，用于获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，其中，所述待检测药物分子包括n个原子，所述虚拟原子连接所述n个原子中的每个原子；

第一特征处理模块，用于根据所述虚拟原子与所述n个原子中每个原子的连接关系，以及所述n个原子中各原子间的连接关系构建邻接矩阵，并根据所述n个原子和所述虚拟原子的属性特征向量构建原子属性特征矩阵；

特征学习模块，用于将所述邻接矩阵和原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵；

药物分类模块，用于根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量，将所述分子特征向量输入分类器以通过所述分类器输出所述待检测药物分子的药物类别。

结合第二方面，在一种可能的实施方式中，所述n个原子和所述虚拟原子中任一原子的属性特征向量由所述任一原子的属性特征确定，所述任一原子的属性特征包括原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性中的一个或者多个。

结合第二方面，在一种可能的实施方式中，所述装置还包括：

化学键属性特征向量获取模块，用于获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接所述虚拟原子和所述n个原子中每个原子的化学键对应的属性特征向量；

第二特征处理模块，用于根据所述各原子的化学键对应的属性特征向量和所述虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵；

所述特征学习模块具体用于：

结合第二方面，在一种可能的实施方式中，所述n个原子间的化学键和连接所述虚拟原子和所述n个原子中每个原子的化学键中任一化学键的属性特征向量由所述任一化学键的属性特征确定，所述任一化学键的属性特征包括化学键类型、共轭特征、环键特征和分子立体化学特征中的一个或者多个。

结合第二方面，在一种可能的实施方式中，所述装置还包括模型训练模块，所述模型训练模块用于：

结合第二方面，在一种可能的实施方式中，所述药物分类模块包括第一分子特征向量确定单元和第一药物类别确定单元，所述第一分子特征向量确定单元具体用于：

结合第二方面，在一种可能的实施方式中，所述药物分类模块还包括第二分子特征向量确定单元和第二药物类别确定单元，所述第二分子特征向量确定单元具体用于：

第三方面，本申请实施例提供了一种终端设备，该终端设备包括处理器和存储器，该处理器和存储器相互连接。该存储器用于存储支持该终端设备执行上述第一方面和/或第一方面任一种可能的实现方式提供的方法的计算机程序，该计算机程序包括程序指令，该处理器被配置用于调用上述程序指令，执行上述第一方面和/或第一方面任一种可能的实施方式所提供的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令当被处理器执行时使该处理器执行上述第一方面和/或第一方面任一种可能的实施方式所提供的方法。

在本申请实施例，通过获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，可根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵。根据n个原子和虚拟原子的属性特征向量可构建原子属性特征矩阵。其中，待检测药物分子包括n个原子，虚拟原子连接n个原子中的每个原子。通过将邻接矩阵和原子属性特征矩阵输入图神经网络，可通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。其中，根据传递特征矩阵可确定出待检测药物分子对应的分子特征向量，通过将分子特征向量输入分类器，可通过分类器输出待检测药物分子的药物类别。采用本申请实施例，可提高对药物分类的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的药物分类方法的一流程示意图；

图2是本申请实施例提供的待检测药物分子的分子结构示意图；

图3是本申请实施例提供的药物分类方法的另一流程示意图；

图4是本申请实施例提供的药物分类装置的一结构示意图；

图5是本申请实施例提供的药物分类装置的另一结构示意图；

图6是本申请实施例提供的终端设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的药物分类方法，可适用于医疗应用领域。本申请实施例中的方法，通过构建包括组成药物分子的n个原子和虚拟原子的邻接矩阵和原子属性特征矩阵，并将构建的邻接矩阵和原子属性特征矩阵输入图神经网络进行特征学习，可基于图神经网络的消息传递特性，确定出n个原子和虚拟原子对应的传递特征矩阵。进而，根据传递特征矩阵中包括传递特征向量可确定出药物分子对应的分子特征向量，进而可根据药物分子特征向量确定出药物类别。采样本申请实施例，可提高对药物的分类准确度。

下面将结合图1至图6分别对本申请实施例提供的方法及相关装置分别进行详细说明。

参见图1，图1为本申请实施例提供的药物分类方法的一流程示意图。本申请实施例提供的方法可以包括如下步骤S101至S104：

S101、获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量。

在一些可行的实施方式中，为实现对某种药物或多种药物的分类，可首先获取待分类药物的药物分子（为方便描述，可简称待检测药物分子）中各原子的属性特征向量和虚拟原子的属性特征向量。其中，待检测药物分子包括n个原子，虚拟原子连接n个原子中的每个原子，n为整数。应当理解的是，n个原子和虚拟原子中任一原子的属性特征向量由任一原子的属性特征确定，其中，任一原子的属性特征包括但不限于原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性中的一个或者多个。其中，虚拟原子可理解为药物分子结构之外的原子，即虚拟原子并非实际组成待检测药物分子的原子，虚拟原子只是与n个原子中每个原子具备连接关系的原子。例如，请参见图2，图2是本申请实施例提供的待检测药物分子的分子结构示意图。如图2所示，待检测药物分子包括5个原子（即n=5），其分别为原子1、原子2、原子3、原子4和原子5。其中，原子1与原子2具有连接关系，原子2还与原子3和原子5分别具有连接关系，原子3与原子4具有连接关系，原子4与原子5之间也具有连接关系。其中，虚拟原子为如图2所示的原子6，由图2可知，原子6与待检测药物分子中的5个原子皆具有连接关系。

S102、根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵，并根据n个原子和虚拟原子的属性特征向量构建原子属性特征矩阵。

在一些可行的实施方式中，根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系可构建邻接矩阵。以及，根据n个原子和虚拟原子的属性特征向量可构建原子属性特征矩阵。例如，请一并参见图2，根据图2中虚拟原子与5个原子中每个原子的连接关系，以及5个原子中

各原子间的连接关系，可构建得到邻接矩阵A：

；

其中，邻接矩阵A中的行从上到下依次表示原子1，原子2，原子3，原子4，原子5和虚拟原子6，邻接矩阵中的列从左到右依次也表示原子1，原子2，原子3，原子4，原子5和虚拟原子6。假设每个原子的属性特征包括F1，F2，F3，…，Fm，则根据每个原子的属性特征对应的属性特征向量可构建原子属性特征矩阵F：

；

其中，原子属性特征矩阵F中的行从上到下依次表示原子1，原子2，原子3，原子4，原子5和虚拟原子6，原子属性特征矩阵中的列从左往右依次表示每个原子的属性特征F1、F2、F3…Fm对应的特征向量x₁，x₂，x₃，…，x_m。也就是说，原子属性特征矩阵中每一行对应待检测药物分子中一个原子的属性特征向量。应当理解的是，上述n个原子和虚拟原子中任一原子的属性特征向量由任一原子的属性特征确定。其中，任一原子的属性特征包括原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性等中的一个或者多个，在此不做限制。

S103、将邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。

在一些可行的实施方式中，通过将基于上述步骤构建的邻接矩阵和原子属性特征矩阵输入图神经网络，可通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。应当理解的是，图神经网络是一种连接模型，它可以通过图中节点之间的消息传递来捕捉图的依赖关系。也就是说，图神经网络模型可通过聚合来自其相邻节点的信息来更新某个节点的表示。

S104、根据传递特征矩阵确定待检测药物分子对应的分子特征向量，将分子特征向量输入分类器以通过分类器输出待检测药物分子的药物类别。

在一些可行的实施方式中，当确定出n个原子和虚拟原子的传递特征矩阵后，可根据传递特征矩阵确定出待检测药物分子对应的分子特征向量。其中，传递特征矩阵中包括（n+1）个传递特性向量，一个原子对应的一个传递特征向量。

其中，待检测药物分子对应的分子特征向量可以为传递特征矩阵中虚拟原子对应的传递特征向量。也就是说，可将传递特征矩阵中虚拟原子对应的传递特征向量确定为待检测药物分子对应的分子特征向量。可选的，还可以根据传递特征矩阵中n个原子对应的n个传递特征向量确定出第一分子特征向量，根据递特征矩阵中虚拟原子对应的传递特征向量确定出第二分子特征向量，进而，根据第一特征分子向量和第二分子特征向量确定出待检测药物分子对应的分子特征向量。例如，可将传递特征矩阵中n个原子对应的n个传递特征向量之和确定为第一分子特征向量，以及将传递特征矩阵中虚拟原子对应的传递特征向量确定为第二分子特征向量。通过对第一分子特征向量和第二分子特征向量进行加权求和，可得到第三分子特征向量，进而可将第三分子特征向量确定为待检测药物分子对应的分子特征向量。应当理解的是，上述加权求和时，第一分子特征向量对应的第一权重参数与第二分子特征向量对应的第二权重参数之和等于1，且第一权重参数小于第二权重参数，权重参数的具体取值可根据实际应用场景确定，在此不做限制。

进一步地，通过将分子特征向量输入分类器，可基于分类器输出待检测药物分子的药物类别。应当理解的是，本申请可通过获取训练数据集，根据训练数据集中包括的各个药物分子训练样本训练图神经网络和分类器，以得到满足收敛条件的图神经网络和分类器。其中，训练数据集中包括多个药物分子训练样本，一个药物分子训练样本中包括至少一个样本药物分子对应的邻接矩阵，原子属性特征矩阵，以及至少一个样本药物分子中每个样本药物分子的药物类别标签。应当理解的是，药物分类标签可包括第一标签和第二标签，也就是说，本申请中的药物分类可以是药物的二分类，其中第一标签用于标识该药物可用于治疗某种疾病，第二标签用于标识该药物不可用于治疗某种疾病。例如，为了实现新型冠状病毒潜在治疗药物发现，我们可基于已有的新型冠状病毒的潜在抑制药物作为训练数据集，进而将训练好的模型在DrugBank数据库（包括10971种药物）中去筛选其他潜在的治疗新冠肺炎的药物分子。也就是说，通过将分子特征向量输入分类器，可根据分类器的输出结果确定该待检测药物分子的药物类别，进而判断该药物分子是否可以用于治疗冠状病毒的临床试验。其中，上述分类器可包括前馈神经网络等，在此不做限制。

在本申请实施例中，通过获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，可根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵。根据n个原子和虚拟原子的属性特征向量可构建原子属性特征矩阵。其中，待检测药物分子包括n个原子，虚拟原子连接n个原子中的每个原子。通过将邻接矩阵和原子属性特征矩阵输入图神经网络，可通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。其中，根据传递特征矩阵可确定出待检测药物分子对应的分子特征向量，通过将分子特征向量输入分类器，可通过分类器输出待检测药物分子的药物类别。采用本申请实施例，可提高对药物分类的准确度。

参见图3，图3是本申请实施例提供的药物分类方法的另一流程示意图。本申请实施例提供的药物分类方法还可通过如下步骤S201至S205提供的实现方式进行说明：

S201、获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量。

其中，上述步骤S201的具体实现方式可以参见图1对应的实施例中对步骤S101的描述，这里不再进行赘述。

S202、根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵，并根据n个原子和虚拟原子的属性特征向量构建原子属性特征矩阵。

其中，上述步骤S202的具体实现方式可以参见图1对应的实施例中对步骤S102的描述，这里不再进行赘述。

S203、获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接虚拟原子和n个原子中每个原子的化学键对应的属性特征向量，根据各原子的化学键对应的属性特征向量和虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵。

在一些可行的实施方式中，通过获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接虚拟原子和n个原子中每个原子的化学键对应的属性特征向量，可根据各原子的化学键对应的属性特征向量和虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵。其中，n个原子间的化学键和连接虚拟原子和n个原子中每个原子的化学键中任一化学键的属性特征向量由任一化学键的属性特征确定。例如，假设每个化学键的属性特征包括T1，T2，T3，…，Tb，则根据每个化学键的属性特征对应的属性特征向量可构建化学键属性特征矩阵T：

；

其中，化学键属性特征矩阵中的行表示化学键，化学键属性特征矩阵中的列表示化学键的属性特征。也就是说，化学键属性特征矩阵中每一行对应待检测药物分子中一个化学键对应的属性特征向量。其中，任一化学键对应的属性特征向量由该化学键的属性特征确定。不难理解的是，任一化学键的属性特征包括化学键类型、共轭特征、环键特征和分子立体化学特征等中的一个或者多个，在此不做限制。

S204、将化学键属性特征矩阵连同邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。

在一些可行的实施方式中，通过将化学键属性特征矩阵连同邻接矩阵和原子属性特征矩阵输入图神经网络，可通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。应当理解的是，图神经网络是一种连接模型，它可以通过图中节点之间的消息传递来捕捉图的依赖关系。也就是说，图神经网络模型可通过聚合来自其相邻节点的信息来更新某个节点的表示。与此同时，由于药物分子中每个原子间的化学键也可以携带不同的信息，因此，基于邻接矩阵、原子属性特征矩阵和化学键属性特征矩阵可更好地学习到各原子的特征表示。

S205、根据传递特征矩阵确定待检测药物分子对应的分子特征向量，将分子特征向量输入分类器以通过分类器输出待检测药物分子的药物类别。

在一些可行的实施方式中，当确定出n个原子和虚拟原子的传递特征矩阵后，可根据传递特征矩阵确定出待检测药物分子对应的分子特征向量，其中，传递特征矩阵中包括（n+1）个传递特性向量，一个原子对应的一个传递特征向量。

进一步地，通过将分子特征向量输入分类器，可基于分类器输出待检测药物分子的药物类别。应当理解的是，本申请可通过获取训练数据集，根据训练数据集中包括的各个药物分子训练样本训练图神经网络和分类器，以得到满足收敛条件的图神经网络和分类器。其中，训练数据集中包括多个药物分子训练样本，一个药物分子训练样本中包括至少一个样本药物分子对应的邻接矩阵，原子属性特征矩阵和化学键属性特征矩阵，以及至少一个样本药物分子中每个样本药物分子的药物类别标签。应当理解的是，药物分类标签可包括第一标签和第二标签，也就是说，本申请中的药物分类可以是药物的二分类，其中第一标签用于标识该药物可用于治疗某种疾病，第二标签用于标识该药物不可用于治疗某种疾病。例如，为了实现新型冠状病毒潜在治疗药物发现，我们可基于已有的新型冠状病毒的潜在抑制药物作为训练数据集进行模型参数的学习，进而将训练好的模型在DrugBank数据库（包括10971种药物）中去筛选其他潜在的治疗新冠肺炎的药物分子。也就是说，通过将分子特征向量输入分类器，可根据分类器的输出结果确定该待检测药物分子的药物类别，进而判断该药物分子是否可以用于治疗冠状病毒的临床试验。其中，上述分类器可包括前馈神经网络等，在此不做限制。

在本申请实施例中，通过获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，可根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵。根据n个原子和虚拟原子的属性特征向量可构建原子属性特征矩阵。其中，待检测药物分子包括n个原子，虚拟原子连接n个原子中的每个原子。通过获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接虚拟原子和n个原子中每个原子的化学键对应的属性特征向量，可根据各原子的化学键对应的属性特征向量和虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵。将化学键属性特征矩阵连同邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。其中，根据传递特征矩阵可确定出待检测药物分子对应的分子特征向量，通过将分子特征向量输入分类器，可通过分类器输出待检测药物分子的药物类别。采用本申请实施例，可提高对药物分类的准确度。

参见图4，图4是本申请实施例提供的药物分类装置的一结构示意图。本申请实施例提供的药物分类装置包括：

原子属性特征向量获取模块31，用于获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，其中，所述待检测药物分子包括n个原子，所述虚拟原子连接所述n个原子中的每个原子；

第一特征处理模块32，用于根据所述虚拟原子与所述n个原子中每个原子的连接关系，以及所述n个原子中各原子间的连接关系构建邻接矩阵，并根据所述n个原子和所述虚拟原子的属性特征向量构建原子属性特征矩阵；

特征学习模块33，用于将所述邻接矩阵和原子属性特征矩阵输入图神经网络以通过所述图神经网络确定出所述n个原子和所述虚拟原子的传递特征矩阵；

药物分类模块34，用于根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量，将所述分子特征向量输入分类器以通过所述分类器输出所述待检测药物分子的药物类别。

请一并参见图5，图5是本申请实施例提供的药物分类装置的另一结构示意图。

在一些可行的实施方式中，所述n个原子和所述虚拟原子中任一原子的属性特征向量由所述任一原子的属性特征确定，所述任一原子的属性特征包括原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性中的一个或者多个。

在一些可行的实施方式中，所述装置还包括：

化学键属性特征向量获取模块35，用于获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接所述虚拟原子和所述n个原子中每个原子的化学键对应的属性特征向量；

第二特征处理模块36，用于根据所述各原子的化学键对应的属性特征向量和所述虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵；

所述特征学习模块33具体用于：

在一些可行的实施方式中，所述n个原子间的化学键和连接所述虚拟原子和所述n个原子中每个原子的化学键中任一化学键的属性特征向量由所述任一化学键的属性特征确定，所述任一化学键的属性特征包括化学键类型、共轭特征、环键特征和分子立体化学特征中的一个或者多个。

在一些可行的实施方式中，所述装置还包括模型训练模块37，所述模型训练模块37用于：

在一些可行的实施方式中，所述药物分类模块34包括第一分子特征向量确定单元341和第一药物类别确定单元342，所述第一分子特征向量确定单元341具体用于：

在一些可行的实施方式中，所述药物分类模块34还包括第二分子特征向量确定单元343和第二药物类别确定单元344，所述第二分子特征向量确定单元343具体用于：

在本申请实施例中，药物分类装置可基于获取的待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵。根据n个原子和虚拟原子的属性特征向量可构建原子属性特征矩阵。其中，待检测药物分子包括n个原子，虚拟原子连接n个原子中的每个原子。通过获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接虚拟原子和n个原子中每个原子的化学键对应的属性特征向量，可根据各原子的化学键对应的属性特征向量和虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵。将化学键属性特征矩阵连同邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。其中，根据传递特征矩阵可确定出待检测药物分子对应的分子特征向量，通过将分子特征向量输入分类器，可通过分类器输出待检测药物分子的药物类别。采用本申请实施例，可提高对药物分类的准确度。

参见图6，图6是本申请实施例提供的终端设备的结构示意图。如图6所示，本实施例中的终端设备可以包括：一个或多个处理器401和存储器402。上述处理器401和存储器402通过总线403连接。存储器402用于存储计算机程序，该计算机程序包括程序指令，处理器401 用于执行存储器402存储的程序指令，执行如下操作：

在一些可行的实施方式中，上述处理器401用于：

上述处理器401还用于：

在一些可行的实施方式中，上述处理器401用于：

应当理解，在一些可行的实施方式中，上述处理器401可以是中央处理单元(central processing unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路 (application specific integratedcircuit，ASIC)、现成可编程门阵列 (field programmable gate array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。该存储器402可以包括只读存储器和随机存取存储器，并向处理器401 提供指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。例如，存储器402还可以存储设备类型的信息。

具体实现中，上述终端设备可通过其内置的各个功能模块执行如上述图1至图3中各个步骤所提供的实现方式，具体可参见上述各个步骤所提供的实现方式，在此不再赘述。

在本申请实施例中，终端设备可基于获取的待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量，根据虚拟原子与n个原子中每个原子的连接关系，以及n个原子中各原子间的连接关系构建邻接矩阵。根据n个原子和虚拟原子的属性特征向量可构建原子属性特征矩阵。其中，待检测药物分子包括n个原子，虚拟原子连接n个原子中的每个原子。通过获取待检测药物分子中连接各原子的化学键对应的属性特征向量，以及连接虚拟原子和n个原子中每个原子的化学键对应的属性特征向量，可根据各原子的化学键对应的属性特征向量和虚拟原子的化学键对应的属性特征向量构建化学键属性特征矩阵。将化学键属性特征矩阵连同邻接矩阵和原子属性特征矩阵输入图神经网络以通过图神经网络确定出n个原子和虚拟原子的传递特征矩阵。其中，根据传递特征矩阵可确定出待检测药物分子对应的分子特征向量，通过将分子特征向量输入分类器，可通过分类器输出待检测药物分子的药物类别。采用本申请实施例，可提高对药物分类的准确度。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令被处理器执行时实现图1至图3中各个步骤所提供的药物分类方法，具体可参见上述各个步骤所提供的实现方式，在此不再赘述。

上述计算机可读存储介质可以是前述任一实施例提供的药物分类装置或者上述终端设备的内部存储单元，例如电子设备的硬盘或内存。该计算机可读存储介质也可以是该电子设备的外部存储设备，例如该电子设备上配备的插接式硬盘，智能存储卡（smartmedia card, SMC），安全数字（secure digital, SD）卡，闪存卡（flash card）等。进一步地，该计算机可读存储介质还可以既包括该电子设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该电子设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本申请的权利要求书和说明书及附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。在本申请说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的，具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。

Claims

1.一种药物分类方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述n个原子和所述虚拟原子中任一原子的属性特征向量由所述任一原子的属性特征确定，所述任一原子的属性特征包括原子类型、化学键个数、形式电荷、原子手性、连接氢原子个数、原子轨道、芳香性中的一个或者多个。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述n个原子间的化学键和连接所述虚拟原子和所述n个原子中每个原子的化学键中任一化学键的属性特征向量由所述任一化学键的属性特征确定，所述任一化学键的属性特征包括化学键类型、共轭特征、环键特征和分子立体化学特征中的一个或者多个。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述获取待检测药物分子中各原子的属性特征向量和虚拟原子的属性特征向量之前，所述方法还包括：

6.根据权利要求1-4任一项所述的方法，其特征在于，所述根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量，包括：

7.根据权利要求1-4任一项所述的方法，其特征在于，所述根据所述传递特征矩阵确定所述待检测药物分子对应的分子特征向量，包括：

8.一种药物分类装置，其特征在于，所述装置包括：

9.一种终端设备，其特征在于，包括处理器和存储器，所述处理器和存储器相互连接；

所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。