CN114358202A

CN114358202A - 基于药物分子图像分类的信息推送方法及装置

Info

Publication number: CN114358202A
Application number: CN202210028280.1A
Authority: CN
Inventors: 王俊
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2022-01-11
Filing date: 2022-01-11
Publication date: 2022-04-15
Also published as: WO2023134060A1

Abstract

本发明公开了一种基于药物分子图像分类的信息推送方法及装置，涉及智能医疗技术领域，主要目的在于解决现有基于药物分子结构进行信息推送效率较低的问题。包括：获取目标药物的药物分子结构图像数据；基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果；基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。主要用于基于药物分子图像分类的信息推送。

Description

基于药物分子图像分类的信息推送方法及装置

技术领域

本发明涉及一种智能医疗技术领域，特别是涉及一种基于药物分子图像分类的信息推送方法及装置。

背景技术

近年来，智能医疗技术的应用领域已经从临床治疗逐步向药物研发方向发展，越来越多的人工智能技术涉足于药物对不同病症的适用情况的分析，从而准确找到适用于临床治疗的药物。尤其是针对药物的分子结构进行研究，从而基于药物特征来确定适合患者的治疗方案或者病症的治疗，向用户进行推送。

目前，现有基于药物分子结构的研究均是采用物理实验方式来确定药物特征，从而进行人为识别病症进行推送，但是，药物分子结构识别过程较慢，导致无法适用于智能医疗中进行相关信息的推送，从而使得基于药物特征匹配病症在智能医疗中的使用效率较低，因此，亟需一种基于药物分子图像分类的信息推送方法来解决上述问题。

发明内容

有鉴于此，本发明提供一种基于药物分子图像分类的信息推送方法及装置，主要目的在于解决现有基于药物分子结构进行信息推送效率较低的问题。

依据本发明一个方面，提供了一种基于药物分子图像分类的信息推送方法，包括：

获取目标药物的药物分子结构图像数据；

基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果，所述图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的，其中，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理；

基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；

若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

进一步地，所述基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果之前，所述方法还包括：

获取药物分子结构图像训练样本数据，并构建图卷积网络；

对所述药物分子结构图像训练样本数据进行特征扰动处理，得到作为扰动伪特征的药物分子结构图像训练样本数据，作为负样本数据，并将未特征扰动处理的所述药物分子结构图像训练样本数据作为正样本数据；

基于所述正样本数据、所述负样本数据分别与图节点构建数据对，并基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型。

进一步地，所述基于所述正样本数据、所述负样本数据分别与图节点构建数据对包括：

按照预设比例筛选所述药物分子结构图像数据的图节点，得到多尺度的所述药物分子结构图像数据；

将所述正样本数据与多尺度的所述药物分子结构图像数据的图节点组合构建第一数据对，并将所述负样本数据与多尺度的所述图卷积神经网络的图节点组合构建第二数据对，其中，所述第一数据对的标签为1，所述第二数据对的标签为0。

进一步地，所述基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型之前，所述方法还包括：

基于判别器结合所述正样本数据、所述负样本数据的样本个数构建损失函数；

所述基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型包括：

在基于所述第一数据对、所述第二数据对对图卷积网络进行模型训练时，所述第二数据对对所述图节点的特征矩阵进行打乱处理，并基于所述损失函数对打乱处理后的所述图卷积网络进行学习评估；

若所述学习评估符合预设模型训练精度，则完成所述图卷积网络的模型训练，得到图像分类模型。

进一步地，所述基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息之前，所述方法还包括：

获取至少一种药物的分子组成成分数据，基于分子化学键、分子化学性质信息、病症对抗属性构建所述目标药物的药物分子特征分布序列；

所述基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息包括：

将所述药物分子分类结果与所述药物分子特征分布序列进行分子与原子化学键逐一项对比，从所述药物分子特征分布序列中确定化学键相似度最大的分子化学性质信息、病症对抗属性为所述目标药物的药物特征信息。

进一步地，所述基于所述药物特征信息与目标病症的病症特征信息进行匹配之后，所述方法还包括：

获取药物知识图谱，所述药物知识图谱中存储有不同药物特征信息存在的关联组合内容以及不同药物特征信息之间关联组合对应的风险信息；

从所述药物知识图谱中查找与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

进一步地，所述方法还包括：

若所述药物特征信息与目标病症的病症特征信息不匹配，则输出所述药物分子分类结果，以指示对所述药物分子分类结果进行人工匹配。

依据本发明另一个方面，提供了一种基于药物分子图像分类的信息推送装置，包括：

获取模块，用于获取目标药物的药物分子结构图像数据；

处理模块，用于基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果，所述图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的，其中，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理；

解析模块，用于基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；

输出模块，用于若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

进一步地，所述装置还包括：训练模块，

所述获取模块，用于获取药物分子结构图像训练样本数据，并构建图卷积网络；

所述处理模块，用于对所述药物分子结构图像训练样本数据进行特征扰动处理，得到作为扰动伪特征的药物分子结构图像训练样本数据，作为负样本数据，并将未特征扰动处理的所述药物分子结构图像训练样本数据作为正样本数据；

所述训练模块，用于基于所述正样本数据、所述负样本数据分别与图节点构建数据对，并基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型。

进一步地，所述构建模块包括：

筛选单元，用于按照预设比例筛选所述药物分子结构图像数据的图节点，得到多尺度的所述药物分子结构图像数据；

构建单元，用于将所述正样本数据与多尺度的所述药物分子结构图像数据的图节点组合构建第一数据对，并将所述负样本数据与多尺度的所述图卷积神经网络的图节点组合构建第二数据对，其中，所述第一数据对的标签为1，所述第二数据对的标签为0。

进一步地，

所述构建模块，还用于基于判别器结合所述正样本数据、所述负样本数据的样本个数构建损失函数；

所述所述训练模块包括：

处理单元，用于在基于所述第一数据对、所述第二数据对对图卷积网络进行模型训练时，所述第二数据对对所述图节点的特征矩阵进行打乱处理，并基于所述损失函数对打乱处理后的所述图卷积网络进行学习评估；

训练单元，用于若所述学习评估符合预设模型训练精度，则完成所述图卷积网络的模型训练，得到图像分类模型。

进一步地，

所述获取模块，还用于获取至少一种药物的分子组成成分数据，基于分子化学键、分子化学性质信息、病症对抗属性构建所述目标药物的药物分子特征分布序列；

所述解析模块，具体用于将所述药物分子分类结果与所述药物分子特征分布序列进行分子与原子化学键逐一项对比，从所述药物分子特征分布序列中确定化学键相似度最大的分子化学性质信息、病症对抗属性为所述目标药物的药物特征信息。

进一步地，所述装置还包括：查找模块，

所述获取模块，还用于获取药物知识图谱，所述药物知识图谱中存储有不同药物特征信息存在的关联组合内容以及不同药物特征信息之间关联组合对应的风险信息；

所述查找模块，用于从所述药物知识图谱中查找与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

进一步地，所述输出模块，还用于若所述药物特征信息与目标病症的病症特征信息不匹配，则输出所述药物分子分类结果，以指示对所述药物分子分类结果进行人工匹配。

根据本发明的又一方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如上述基于药物分子图像分类的信息推送方法对应的操作。

根据本发明的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述基于药物分子图像分类的信息推送方法对应的操作。

借由上述技术方案，本发明实施例提供的技术方案至少具有下列优点：

本发明提供了一种基于药物分子图像分类的信息推送方法及装置，与现有技术相比，本发明实施例通过获取目标药物的药物分子结构图像数据；基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果，所述图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的，其中，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理；基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息，实现了基于智能人工算法进行药物特征的识别目的，以通过药物特征与病症的匹配来进行信息推送，大大提高了基于药物特征匹配病症在智能医疗中的使用效率较，从而提高了在智能医疗系统中的信息推送效率以及准确性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种基于药物分子图像分类的信息推送方法流程图；

图2示出了本发明实施例提供的另一种基于药物分子图像分类的信息推送方法流程图；

图3示出了本发明实施例提供的一种多尺度图卷积神经网络结构示意图；

图4示出了本发明实施例提供的一种基于药物分子图像分类的信息推送装置组成框图；

图5示出了本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

基于此，在一个实施例中，如图1所示，提供了一种基于药物分子图像分类的信息推送方法，以该方法应用于服务器等计算机设备为例进行说明，其中，服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器，如智能医疗系统、数字医疗平台等。上述方法包括以下步骤：

101、获取目标药物的药物分子结构图像数据。

本发明实施例中，执行主体可以是带有信息推送功能的智能管理系统，例如，智能医疗系统、数据医疗平台等。示例性的，当前执行主体为智能医疗系统，目标药物为适用于待进行与药物特征进行匹配的相关信息的推送的药物，对应的，目标药物的药物分子结构图像数据为使用图结构表示目标药物的分子，其中，药物分子结构图像数据中的图像内容为目标药物分子的原子-化学键结构，从图像内容中可以抽象得到以节点-边形式的空间特征、原子序数、电荷数等分子结构的特征内容，从而可以基于对图像数据的分类，得到对药物分子结构的一种分类实现方法，即通过图神经网络可以通过传递节点和边的信息等特定，捕捉图的局部关系自动学习图属性，从而高效的进行图分类任务。

需要说明的是，本发明实施例中的药物分子结构图像数据为作为当前执行主体的智能医疗系统基于制作分子结构图的计算机软件生成目标药物的药物分子结构图像数据后进行加载得到的，此时，操作人员可以基于已经存储于当前智能医疗系统中的药物数据库获取与目标药物匹配的药物分子结构图像数据，也可以通过分子结构制作应用程序进行制作，并以智能医疗系统中的指定文件格式进行获取，本发明实施例不做具体限定。

102、基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果。

本发明实施例中，由于图神经网络是深度学习在图结构数据上的一个分支，待进行图神经网络分类的图像数据对应的图网络结构包含图节点和边，其中，图节点包含了实体信息，如化合物中的原子，边包含实体间的关系信息，如化合物图像数据中原子间的化学键，为了针对药物分子结构图像数据进行分类，以得到药物分子分类结果进行药物特征信息的匹配，预先进行模型训练得到图像分类模型，以对药物分子结构图数据进行分类处理，得到药物分子分类结果。其中，由于药物分子结构图像数据是进行图神经网络的分类，对应得到的药物分子分类结果即为表示不同原子-化学键的分类结果，以便基于药物分子分类结果确定药物分子特征。

需要说明的是，为了提高图像分类模型的模型处理精度，并针对无法获取大量标签数据，如很难获取海量的分子数据，因此，本发明实施例中，构建正、负样本数据，作为监督学习的训练样本，有效地学习样本数据中的潜在特征以及信息。其中，在自监督学习中，自监督对比学习就是对于任意两个数据点，若越相似，即属于同一类，则其图表示就会越接近，因此，本发明实施例从样本数据中构造出不同的样本来作为模型输入参数，即通过引导预训练模型在隐式表示空间对正、负样本数据进行判别来学习输入数据中的特征。从输入数据中构造出正、负样本数据时，让预训练模型在隐式表示空间对正、负样本数据进行判别，通过从无标记的输入数据中构建预训练任务，即监督信号，来实现泛化能力强、对比准确的目的，因此，图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的。具体的，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理，即负样本数据的作用是保持图像数据中图像网络连接结构不变，将节点的特征矩阵按行进行打乱，从而实现预训练模型在隐式表示空间对正、负样本数据进行判别来提高特征的学习准确性，例如，原始的5个节点，每个节点有32维特征，把原本的1、2、3、4、5的行序号，打乱为3、5、4、2、1，此时，网络的拓扑结构虽然没有变，但是每个位置上的节点的特征已经发生改变，由此构建了节点属性破坏后的负样本。

103、基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配。

本发明实施例中，为了实现标准统一的特征匹配，并自动简化复杂的人为特征匹配的实验性操作，基于药物分子特征分布序列解析药物分子分类结果所对应的药物特征信息，以进行与目病症的病症特征的匹配。其中，药物分子特征分布序列中存储有包含不同分子化学键、分子化学性质信息、病症对抗属性的分子组成成分数据所对应的不同原子-化学键之间的对应关系，从而可以在基于102步骤中得到的药物分子分类结果从药物分子特征分布序列中匹配到对应的分子化学键、分子化学性质信息、病症对抗属性，作为药物特征信息。例如，药物分子分类结果包括a原子-化学键1、d原子-化学键3，h原子-化学键3，基于药物分子特征分布序列解析a原子-化学键1、d原子-化学键3，h原子-化学键3所对应的分子化学键、分子化学性质信息、病症对抗属性，其中，病症对抗属性为已知的目标药物分子与病症之间具有对抗性的属性，如是否对肺纤维细胞具有对抗性，以作为肺癌的治疗药物。

另外，当确定药物特征信息后，由于药物特征信息包括分子化学键、分子化学性质信息、病症对抗属性，因此，为了实现智能的信息推送，基于已经匹配到的药物特征信息与目标病症的病症特征信息进行匹配。其中，目标病症为需要与目标药物进行配对判断是否具有对抗性的病症，本发明实施例中的对抗性即为药物是否具有治疗病症的功能，因此，为了实现智能性的药物与病症的信息推送，将得到的药物特征信息可以与至少一个目标病症的病症特征信息进行匹配。当前智能医疗系统可以直接获取操作者(如医生、或医药科研人员)所录入的病症特征信息，此时，病症特征信息包括但不限于病症对人体所产生的不同生物学或化学上的特征内容，例如，病症特征信息为白细胞值高于a，则与分子化学键、分子化学性质信息、病症对抗属性进行匹配。

104、若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

本发明实施例中，若药物特征信息与病症特征信息匹配，则说明目标药物与目标病症具有对抗性，此药物可以用于对此病症的治疗，因此，通过输出与药物特征信息匹配的药物特征组合信息、药物特征风险信息。其中，药物特征组合信息为目标药物可以组合使用的其他药物所具有的特征信息，所述药物特征风险信息为目标药物的分子化学键、分子化学性质信息、病症对抗属性所产生的人体使用风险内容，从而实现智能医疗系统的智能信息推送。

在一个本发明实施例中，为了进一步限定及说明，如图2所示，步骤101基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果之前，所述方法还包括：

201、获取药物分子结构图像训练样本数据，并构建图卷积网络；

202、对所述药物分子结构图像训练样本数据进行特征扰动处理，得到作为扰动伪特征的药物分子结构图像训练样本数据，作为负样本数据，并将未特征扰动处理的所述药物分子结构图像训练样本数据作为正样本数据；

203、基于所述正样本数据、所述负样本数据分别与图节点构建数据对，并基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型。

本发明实施例中，为了实现对图像数据进行分类，因此，针对图像数据的特定，构建图卷积网络，并获取作为对图卷积网络进行训练的训练样本，即药物分子结构图像训练样本数据。其中，正样本数据与负样本数据均是基于药物分子结构图像训练样本数据中进行构造的，具体的，由于所述负样本数据的数据对是对网络连接结构不变时的图节点的特征矩阵进行打乱处理，即对药物分子结构图像训练样本数据进行特征扰动处理，得到作为扰动伪特征的药物分子结构图像训练样本数据，作为负样本数据，例如，负样本数据为保持图的网络连接结构不变，将药物分子结构图像训练样本数据中图节点的特征矩阵按行进行打乱，比如例如，原始的5个节点，每个节点有32维特征，把原本的1、2、3、4、5的行序号，打乱为3、5、4、2、1，此时，网络的拓扑结构虽然没有变，但是每个位置上的节点的特征已经发生改变，由此构建了节点属性破坏后的负样本。对应的，正样本数据即为将未特征扰动处理的所述药物分子结构图像训练样本数据直接作为正样本数据，此时正样本数据与负样本数据的个数总和作为训练样本数据的个数，例如，正样本数据的个数为M，负样本数据的个数为N，则M+N等于药物分子结构图像训练样本数据的样本总个数，本发明实施例中对N、M不做具体限定。

需要说明的是，为了提高图卷积网络对特征的对比准确性，在节点-全局图的对比基础上，通过池化的方法，按照一定的比例丢弃节点，构建多尺度的图卷积网络。例如，原始1000节点的图，通过按0.9，0.8，0.7的比例依次形成不同尺度的图像数据，从而可以在不同的尺度上构建节点-全图的对比学习目标，此时多个尺度的图像数据代表不同粒度的全图的信息，可以获得更加丰富的对比学习效果。其中，每池化一次缩小一次数据量，图像数据就通过减少节点数目来来完成一层一层的抽取，经过池化后，保留了网络认为有用的节点，从而提高了特征对比的效果。此时，本发明实施例中，通过构建数据对的形式来减少节点数目，即基于正样本数据、负样本数据分别与图节点构建数据对，以基于数据对对所述图卷积网络进行模型训练，得到图像分类模型。

在一个本发明实施例中，为了进一步限定及说明，步骤203基于所述正样本数据、所述负样本数据分别与图节点构建数据对包括：按照预设比例筛选所述药物分子结构图像数据的图节点，得到多尺度的所述药物分子结构图像数据；将所述正样本数据与多尺度的所述药物分子结构图像数据的图节点组合构建第一数据对，并将所述负样本数据与多尺度的所述图卷积神经网络的图节点组合构建第二数据对，其中，所述第一数据对的标签为1，所述第二数据对的标签为0。

具体的，数据对的表现形式为：某节点-全图，因此，第一数据对的标签为1代表原始的图像数据中的节点及该图像数据组成的数据对；当对节点顺序进行扰动打乱后，不同的节点对应的特征就不再是原始的特征了，比如节点1的特征X1可能是原来的节点5的特征X5，而节点5的特征可能是节点9的特征X9，这个节点顺序扰动后的图像数据中，此时扰动后的任一节点和原始全图像数据组成的数据对就是负样本，即其第二数据对的标签为0。为了按照预设比例筛选药物分子结构图像数据的图节点，得到多尺度的药物分子结构图像数据，其中，预设比例筛选即为按预设比例丢弃节点的方式来筛选药物分子结构图像数据的图节点，可以构建图节点和不同粒度的全图像数据的对比学习，形成丰富的多尺度的数据对。

在一个本发明实施例中，为了进一步限定及说明，步骤204基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型之前，所述方法还包括：基于判别器结合所述正样本数据、所述负样本数据的样本个数构建损失函数。

由于图卷积神经网络的模型学习主要过程是通过迭代对图像数据中的图节点的邻居信息进行聚合和更新，因此，在一次迭代中，每一个图节点通过聚合邻居节点的特征及自己在上一层的特征来更新自己的信息，通常也会对聚合后的信息进行非线性变换，并通过堆叠多层网络，每个图节点可以获取到相应跳数内的邻居节点信息。此时，基于判别器结合正样本数据、负样本数据的样本个数构建损失函数，依次来对模型的训练进行判别，具体的，损失函数为：

其中，s为使用读取函数从原始图像数据的特征隐含表示中获得的全图的总结表示，此处采用mean均值的计算方式，即所有节点的特征表示取平均，作为全图summary的特征表示，即s，N和M分别表示正样本数据和负样本数据的个数，优选为N＝M，h表示当前图节点的隐含层嵌入，也就是该图节点的特征向量，如一个768维的向量，D为一个判别器，用来使用全局表示来分别对正样本数据和负样本数据进行模型训练打分，通过给正样本数据尽可能打高分，并给负样本数据打低分来进行图像数据的表示向量的学习。

另外，由于s表示由所有图节点组成的全图像数据的嵌入，也就是全图像数据的平均特征向量，如有100个图节点，s是100个图节点的平均的768维的向量，标准全图像数据的特征信息；X表示涂节点的特征向量，如在分子图的场景下，对于一个由多个原子节点和化学键为边组成的分子图，X表示原子节点的特征，A表示图像数据的邻接矩阵，即表示哪些图节点是相连的，哪些图节点是没有相连，从而能够表征图像数据的拓扑信息。如下表1所示，X表示图节点的特征向量，例如，在分子图的场景下，对于一个由多个原子节点和化学键为边组成的分子图，x表示原子节点的特征，包括如下特征等。

表1：原子的节点初始特征向量

对应的，步骤204基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型包括：在基于所述第一数据对、所述第二数据对对图卷积网络进行模型训练时，所述第二数据对对所述图节点的特征矩阵进行打乱处理，并基于所述损失函数对打乱处理后的所述图卷积网络进行学习评估；若所述学习评估符合预设模型训练精度，则完成所述图卷积网络的模型训练，得到图像分类模型。

作为对图卷积网络进行模型训练过程，具体为：

1、利用原始的药物分子结构图像训练样本，对每个样本，应用一个特征扰动的处理，获得每个图像数据样本对应的扰动假图样本，每个原始图节点和原始全图像数据形成的数据对，其标签为1，作为正样本数据的第一数据对，每个原始图节点和扰动后的假图像数据形成的数据对，其标签为0，作为负样本数据的第二数据对；

2、通过按比例丢弃节点的方式，构建多个尺度的图像数据，构建图节点和不同粒度的全图像数据的对比学习，形成丰富的多尺度的数据对；

3、在训练过程中，随机抽取一定大小批次的处理样本数据，该批次中会包含正样本数据和负样本数据分别对应的数据对，输入到图卷积神经网络中对比学习训练鉴别正负，其中，图神经网络的训练学习目标是让模型学习区分某个数据对是原始的图节点-全图像数据，还是特征扰动后的图节点-扰动的全图像数据，以此学会对图数据的理解和表达；

4、基于损失函数来判断是否迭代完成对图卷积神经网络的模型训练，以便完成训练过程，得到图像分类模型，即学习评估符合预设模型训练精度。

需要说明的是，如图3所示，图像数据的表示步骤为：1、先进行特征或者随机初始化的实体变量特征，进行聚合操作(aggregate)，即将邻居图节点的信息聚合到本图节点，之后就是对自己的信息和聚合的信息进行操作，来更新自己的特征；2、每个图节点获知了自己的特征和来自其他图节点的信息。对于一个分子图来说，一个分子就是一个图像数据，分子图表达学习会将所有的图节点的特征进行累加或者其他的求和操作，从而得到整个分子图的向量特征。

在一个本发明实施例中，为了进一步限定及说明，步骤103基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息之前，所述方法还包括：获取至少一种药物的分子组成成分数据，基于分子化学键、分子化学性质信息、病症对抗属性构建所述目标药物的药物分子特征分布序列。

为了基于得到的药物分子分类结果进行有效且准确的信息推送，在基于药物分子特征分布序列进行解析药物特征之前，需要构建药物分子特征分布序列。其中，获取至少一种药物的分子组成成分数据，此时，由于是为了建立药物分子特征分布序列，则获取的分子组成成分数据仅仅包括分子化学键、分子化学性质信息、病症对抗性数据即可，以便构建至少一种药物的药物分子特征分布序列。其中，分子化学键为药物分子中所有原子的化学键，分子化学性质信息为包含特有分子组成结构所对应的化学性质，例如，苯酚环所对应的化学性质、苯甲基所对应的化学性质等内容，病症对抗属性为不同药物分子与不同病症之间是否存在治疗或者减缓等医疗效果的属性，例如，药物分子s对高血压患者的血粘稠度具有缓解作用，即具有对抗性。

需要说明的是，由于本发明实施例中是要对目标药物进行相关信息的推送，而目标药物大概率为未进行实验或者需要长期实验进行验证的，而构建的药物分子特征分布序列中的至少一个药物均是已经完成验证的药物，因此，本发明实施例中是基于已经分析分子组成成分数据的药物分子特征分布序列与药物分子分类结果进行对比，从而得到药物特征信息。

对应的，步骤103基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息包括：将所述药物分子分类结果与所述药物分子特征分布序列进行分子与原子化学键逐一项对比，从所述药物分子特征分布序列中确定化学键相似度最大的分子化学性质信息、病症对抗属性为所述目标药物的药物特征信息。

为了实现具体的药物分子特征分布序列与药物分子分类结果的比较，且由于药物分子分类结果即为表示不同原子-化学键的分类结果，因此，通过化学键的信息分类进行逐一对比，并计算相似度，以将相似度最大值所对应在药物分子特征分布序列中的相似度最大值所对应的分子化学性质信息、病症对抗属性为目标药物的药物特征信息。

在一个本发明实施例中，为了进一步限定及说明，步骤基于所述药物特征信息与目标病症的病症特征信息进行匹配之后，所述方法还包括：获取药物知识图谱；从所述药物知识图谱中查找与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

为了作为一种快速且智能的医疗信息的推荐方法，在确定药物特征信息与目标病症的病症特征信息匹配后，说明目标药物与目标病症具有对抗性，即此目标药物对治疗目标病症具有治疗或抑制、缓解等作用，因此，为了提高操作者的信息处理效率，获取药物知识图谱，以便获取与药物特征信息匹配的药物特征组合信息以及药物特征风险信息。其中，所述药物知识图谱中存储有不同药物特征信息存在的关联组合内容以及不同药物特征信息之间关联组合对应的风险信息，药物特征组合信息为目标药物可以组合使用的其他药物所具有的特征信息，例如，药物1的特征信息为s，药物2的特征信息为e，则组合后，药物1与药物2的特征信息可以为s+e，也可以为f；药物特征风险信息为目标药物的分子化学键、分子化学性质信息、病症对抗属性所产生的人体使用风险内容，例如，针对药物2中的化学性质信息d，使用的风险内容为红细胞减少等，本发明实施例不做具体限定。

需要说明的是，为了提高匹配效率，当前智能医疗系统中预先存储或者生成有不同药物所对应的药物特征组合信息以及药物特征风险信息以便在当前本发明实施例中，直接调取药物知识图谱进行药物特征组合信息、药物特征风险信息的匹配。

在一个本发明实施例中，为了进一步限定及说明，方法还包括：若所述药物特征信息与目标病症的病症特征信息不匹配，则输出所述药物分子分类结果，以指示对所述药物分子分类结果进行人工匹配。

在一个具体的实时场景中，为了避免因药物特征信息与目标病症的病症特征信息不匹配时，操作人员仍可以进行药物分子分类结果的获取，在不匹配时，直接将药物分子分类结果进行输出，以便进行人工实验或者匹配，例如，直接显示包含化学分子键的药物分子分类结果，本发明实施例不做具体限定。

本发明实施例提供了一种基于药物分子图像分类的信息推送方法，与现有技术相比，本发明实施例通过获取目标药物的药物分子结构图像数据；基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果，所述图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的，其中，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理；基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息，实现了基于智能人工算法进行药物特征的识别目的，以通过药物特征与病症的匹配来进行信息推送，大大提高了基于药物特征匹配病症在智能医疗中的使用效率较，从而提高了在智能医疗系统中的信息推送效率以及准确性。

进一步的，作为对上述图1所示方法的实现，本发明实施例提供了一种基于药物分子图像分类的信息推送装置，如图4所示，该装置包括：

获取模块31，用于获取目标药物的药物分子结构图像数据；

处理模块32，用于基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果，所述图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的，其中，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理；

解析模块33，用于基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；

输出模块34，用于若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息。

进一步地，所述装置还包括：训练模块，

所述训练模块，用于基于所述正样本数据、所述负样本数据分别与图节点构建数据对，并基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型，其中，所述负样本数据的数据对对网络连接结构不变时的图节点的特征矩阵进行打乱处理。

进一步地，所述构建模块包括：

进一步地，

所述所述训练模块包括：

进一步地，

进一步地，所述装置还包括：查找模块，

本发明实施例提供了一种基于药物分子图像分类的信息推送装置，与现有技术相比，本发明实施例通过获取目标药物的药物分子结构图像数据；基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果，所述图像分类模型为基于训练样本构建正样本数据、负样本数据进行模型训练得到的，其中，所述负样本数据用于在模型训练过程中网络连接结构不变时对图节点的特征矩阵进行打乱处理；基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；若所述药物特征信息与目标病症的病症特征信息匹配，则输出与所述药物特征信息匹配的药物特征组合信息、药物特征风险信息，实现了基于智能人工算法进行药物特征的识别目的，以通过药物特征与病症的匹配来进行信息推送，大大提高了基于药物特征匹配病症在智能医疗中的使用效率较，从而提高了在智能医疗系统中的信息推送效率以及准确性。

根据本发明一个实施例提供了一种存储介质，所述存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于药物分子图像分类的信息推送方法。

图5示出了根据本发明一个实施例提供的一种计算机设备的结构示意图，本发明具体实施例并不对计算机设备的具体实现做限定。

如图5所示，该计算机设备可以包括：处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。

其中：处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。

通信接口404，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器402，用于执行程序410，具体可以执行上述基于药物分子图像分类的信息推送方法实施例中的相关步骤。

具体地，程序410可以包括程序代码，该程序代码包括计算机操作指令。

处理器402可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器406，用于存放程序410。存储器406可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序410具体可以用于使得处理器402执行以下操作：

获取目标药物的药物分子结构图像数据；

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种基于药物分子图像分类的信息推送方法，其特征在于，包括：

获取目标药物的药物分子结构图像数据；

2.根据权利要求1所述的方法，其特征在于，所述基于训练后的图像分类模型对所述药物分子结构图像数据进行分类处理，得到药物分子分类结果之前，所述方法还包括：

获取药物分子结构图像训练样本数据，并构建图卷积网络；

3.根据权利要求2所述的方法，其特征在于，所述基于所述正样本数据、所述负样本数据分别与图节点构建数据对包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述数据对对所述图卷积网络进行模型训练，得到图像分类模型之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述药物特征信息与目标病症的病症特征信息进行匹配之后，所述方法还包括：

7.根据权利要求1-6任一项所述的方法，其特征在于，所述方法还包括：

8.一种基于药物分子图像分类的信息推送装置，其特征在于，包括：

获取模块，用于获取目标药物的药物分子结构图像数据；

匹配模块，用于基于药物分子特征分布序列解析所述药物分子分类结果的药物特征信息，并基于所述药物特征信息与目标病症的病症特征信息进行匹配；

9.一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于药物分子图像分类的信息推送方法对应的操作。

10.一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于药物分子图像分类的信息推送方法对应的操作。