CN114496302A

CN114496302A - 药物适应症的预测方法及相关设备

Info

Publication number: CN114496302A
Application number: CN202111646615.8A
Authority: CN
Inventors: 陈丹; 王志芳; 罗泽漩
Original assignee: Shenzhen Intellifusion Technologies Co Ltd
Current assignee: Shenzhen Intellifusion Technologies Co Ltd
Priority date: 2021-12-29
Filing date: 2021-12-29
Publication date: 2022-05-13

Abstract

本发明实施例提供一种药物适应症的预测方法，包括：获取目标药物的第一描述信息，并通过预设的第一语义提取网络对第一描述信息的进行语义提取，以得到第一描述信息对应的第一语义特征；获取不同适应症的第二描述信息，并通过预设的第二语义提取网络对第二描述信息进行语义提取，以得到第二描述信息对应的第二语义特征；以第二语义特征对第一语义特征进行修正，得到第一描述文本的对照特征；通过对照特征，对第一描述信息的适应症进行预测，得到目标药物的适应症预测结果。可以对药物的适应症进行预测，提高药物与适应症之间的挖掘效率，从而缩小临床前试验方向，提高临床前试验方向的准确性。

Description

药物适应症的预测方法及相关设备

技术领域

本发明涉及智慧医疗领域，尤其涉及一种药物适应症的预测方法及相关设备。

背景技术

新药物的研发一直面临研发周期长以及研发成本高的问题，对于新药物的也需要选择适应症方向进行长期的临床实验，另外，对于现有药物来说，也存在着开发新适应症的可能性，比如“阿司匹林”最初是一种解热镇痛药，但后来发现其对血小板聚集有抑制作用，能阻止血栓形成，使得“阿司匹林”又被用于作为预防短暂脑缺血发作、心肌梗死、人工心脏瓣膜和静脉瘘或其他手术后血栓的形成的药物，因此，不管是对于新药物或者是现有药物，挖掘对应的适应症，都极为重要，现有适应症的挖掘多是基于临床实验，需要较多的对象，适应症的挖掘效率低。

发明内容

本发明实施例提供一种药物适应症的预测方法及相关设备，可以根据药物的第一描述信息以及不同适应症的第二描述信息之间的隐性关联来挖掘药物与不同适应症之间的隐含关系，从而对药物的适应症进行预测，提高药物与适应症之间的挖掘效率，从而缩小临床前试验方向，提高临床前试验方向的准确性。

第一方面，本发明实施例提供一种药物适应症的预测方法，所述方法包括：

获取目标药物的第一描述信息，并通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，所述第一描述信息包括所述目标药物的全局信息描述；

获取不同适应症的第二描述信息，并通过预设的第二语义提取网络对所述第二描述信息进行语义提取，以得到所述第二描述信息对应的第二语义特征，所述第二描述信息包括所述适应症的症状描述；

以所述第二语义特征对所述第一语义特征进行修正，得到所述第一描述文本的对照特征；

通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述目标药物的适应症预测结果。

可选的，所述通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，包括：

通过预设的编码网络对所述第一描述信息进行编码处理，得到所述第一描述信息的编码特征；

通过预设的第一语义提取网络对所述编码特征的进行语义提取，得到所述编码特征对应的第一语义特征。

可选的，所述目标药物的全局信息描述包括目标药物的组分描述、新药物的分子结构描述以及目标药物的制程描述，所述通过预设的编码网络对所述第一描述信息进行编码处理，得到所述第一描述信息的编码特征，包括：

将所述第一描述信息按描述类型进行划分，得到基于组分描述的第一描述子信息、基于分子结构描述的第二描述子信息以及基于制程描述的第三描述子信息；

通过预设的第一编码网络对所述第一描述子信息进行编码处理，得到所述第一描述子信息的第一子编码特征，以及通过预设的第二编码网络对所述第二描述子信息进行编码处理，得到所述第二描述子信息的第二子编码特征，以及通过预设的第三编码网络对所述第三描述子信息进行编码处理，得到所述第三描述子信息的第三子编码特征；

对所述第一子编码特征、所述第二子编码特征以及所述第三子编码特征进行线性变换并融合，得到所述第一描述信息的编码特征。

可选的，所述第一描述子信息为文本描述信息，所述预设的第一编码网络包括词向量编码网络以及第一时序网络，所述通过预设的第一编码网络对所述第一描述子信息进行编码处理，得到所述第一描述子信息的第一子编码特征，包括：

通过所述词向量编码网络对所述第一描述子信息进行词向量编码处理，得到所述第一描述子信息的词向量；

通过所述第一时序网络对所述词向量进行第一时序编码处理，得到所述第一描述子信息的第一子编码特征。

可选的，所述第二描述子信息为图结构描述信息，所述预设的第二编码网络包括图卷积网络，所述通过预设的第二编码网络对所述第二描述子信息进行编码处理，得到所述第二描述子信息的第二子编码特征，包括：

通过所述图卷积网络对所述第二描述子信息进行卷积处理，得到所述第二描述子信息的第二子编码特征。

可选的，所述第三描述子信息为流程图信息，所述预设的第三编码网络包括第二时序网络，所述通过预设的第三编码网络对所述第三描述子信息进行编码处理，得到所述第三描述子信息的第三子编码特征，包括：

通过所述第二时序网络对所述第三描述子信息进行第二时序编码处理，得到所述第三描述子信息的第三子编码特征。

可选的，所述通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述药物的适应症预测结果，包括：

将所述第一描述信息的编码特征输入到预设的解码网络中，以所述对照特征为状态参数，对所述编码特征进行解码处理，得到所述药物的适应症预测结果。

第二方面，本发明实施例提供一种药物适应症的预测装置，所述装置包括：

第一获取模块，用于获取目标药物的第一描述信息，并通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，所述第一描述信息包括所述目标药物的全局信息描述；

第二获取模块，用于获取不同适应症的第二描述信息，并通过预设的第二语义提取网络对所述第二描述信息进行语义提取，以得到所述第二描述信息对应的第二语义特征，所述第二描述信息包括所述适应症的症状描述；

修正模块，用于以所述第二语义特征对所述第一语义特征进行修正，得到所述第一描述文本的对照特征；

预测模块，用于通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述目标药物的适应症预测结果。

第三方面，本发明实施例提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明实施例提供的药物适应症的预测方法中的步骤。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现发明实施例提供的药物适应症的预测方法中的步骤。

本发明实施例中，获取药物的第一描述信息，并通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，所述第一描述信息包括所述药物的全局信息描述；获取不同适应症的第二描述信息，并通过预设的第一语义提取网络对所述第二描述信息进行语义提取，以得到所述第二描述信息对应的第二语义特征，所述第二描述信息包括所述适应症的症状描述；以所述第二语义特征对所述第一语义特征进行修正，得到所述第一描述文本的对照特征；通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述药物的适应症预测结果。根据药物的第一描述信息以及不同适应症的第二描述信息之间的隐性关联来挖掘药物与不同适应症之间的隐含关系，从而对药物的适应症进行预测，提高药物与适应症之间的挖掘效率，从而缩小临床前试验方向，提高临床前试验方向的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种药物适应症的预测方法的流程图；

图2是本发明实施例提供的一种药物适应症的预测装置的结构示意图；

图3是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，图1是本发明实施例提供的一种药物适应症的预测方法的流程图，如图1所示，该药物适应症的预测方法包括以下步骤：

101、获取目标药物的第一描述信息，并通过预设的第一语义提取网络对第一描述信息的进行语义提取，以得到第一描述信息对应的第一语义特征。

在本发明实施例中，上述目标药物可以是新药物，也可以现有药物，上述第一描述信息包括目标药物的全局信息描述，上述全局信息描述可以理解为从多个维度对该目标药物进行描述，比如，可以是目标药物的性状、组分、分子结构、制备流程等多个维度的信息来构成的全局信息。

上述预设的第一语义提取网络可以理解为是经过训练所得到的第一语义提取网络，第一语义提取网络用于提取第一描述信息的第一语义特征。上述第一语义特征用于表征上述第一描述信息所隐含的全局语义，

具体的，可以通过预设的编码网络对第一描述信息进行编码处理，得到第一描述信息的编码特征；通过预设的第一语义提取网络对编码特征的进行语义提取，得到编码特征对应的第一语义特征。

进一步的，上述编码特征为对第一描述信息进行编码处理可以是将第一描述信息编码为计算机可处理的数字信息，比如将文本信息、图像信息等编码为数字信息以使计算机对编码后的数字信息进行计算处理。

通过对第一描述信息进行编码处理，可以使得多个维度的第一描述信息通过统一的维度来进行计算，便于计算机对第一描述信息进行处理。

上述第一语义提取网络可以包括第一隐含特征提取网络以及第三时序网络。隐含特征提取网络可以基于ResNet结构的神经网络，具体可以是基于45层ResNet结构的神经网络，隐含特征提取网络用于将第一描述信息的编码特征中的全局语义到提取到隐含空间，从而得到全局语义的高级隐含特征。第三时序网络可以是基于递归神经网络的时序网络，可以将第二时序网络构建为长短时记忆网络的结构，这样，第二时序网络可以在语义层面提取到更准确的时序信息。

更具体的，上述目标药物的全局信息描述可以包括目标药物的组分描述、新药物的分子结构描述以及目标药物的制程描述，其中，组分描述、分子结构描述以及制程描述分别为不同的描述类型，可以将第一描述信息按描述类型进行划分，得到基于组分描述的第一描述子信息、基于分子结构描述的第二描述子信息以及基于制程描述的第三描述子信息；通过预设的第一编码网络对第一描述子信息进行编码处理，得到第一描述子信息的第一子编码特征，以及通过预设的第二编码网络对第二描述子信息进行编码处理，得到第二描述子信息的第二子编码特征，以及通过预设的第三编码网络对第三描述子信息进行编码处理，得到第三描述子信息的第三子编码特征；对第一子编码特征、第二子编码特征以及第三子编码特征进行线性变换并融合，得到第一描述信息的编码特征。

基于组分描述的第一描述子信息包括组成成分和各成分含量，比如“复方阿司匹林”的组分描述包括阿司匹林、苯甲酸和水杨酸的含量。上述的组分描述是一段文本信息，通过文字或字母符号来进行表达。上述第一编码网络可以理解为对第一描述子信息进行编码处理的编码网络，具体的，上述第一编码网络可以理解为对文本信息进行编码处理的编码网络。

基于分子结构描述的第二描述子信息可以是主要成分的分子结构，分子结构可以通过原子、官能团和键等的连接来进行表达。上述第二编码网络可以理解为对第二描述子信息进行编码处理的编码网络，具体的，上述第二编码网络可以理解为对结构信息进行编码处理的编码网络。在一种可能的实施例中，上述分子结构可以用图结构进行表达，原子或者官能团可以作为图结构中的节点，键则可以作为图结构中的连接边。

基于制程描述的第三描述子信息可以是目标药物的制备流程，制备流程可以包括步骤时序和步骤内容，可以通过流程图来进行表达。上述第三编码网络可以理解为对第三描述子信息进行编码处理的编码网络，具体的，上述第三编码网络可以理解为对时序和内容信息进行编码处理的编码网络。在一种可能的实施例中，流程图可以通过第三编码网络提取出按步骤时序进行排序的文字内容来进行编码处理。

更具体的，上述第一描述子信息为文本描述信息，预设的第一编码网络包括词向量编码网络以及第一时序网络，在通过预设的第一编码网络对第一描述子信息进行编码处理，得到第一描述子信息的第一子编码特征的步骤中，可以通过词向量编码网络对第一描述子信息进行词向量编码处理，得到第一描述子信息的词向量；通过第一时序网络对词向量进行第一时序编码处理，得到第一描述子信息的第一子编码特征。

上述词向量编码网络可以是基于词嵌入算法进行构建的卷积神经网络，通过词向量编码网络，可以将文本描述信息编码为第一描述子信息的词向量，举例来说，对于“我和我妈妈”，可以通过词向量编码网络将“我”、“和”、“我”、“妈妈”提取为(h0，h1，h2，h3)这样的四个向量。

上述第一时序网络可以是基于递归神经网络的网络，比如循环神经网络或者长短时记忆网络，本发明实施例优选为双向长短时记忆网络，这样，第一时序信息提取网络可以提取正向时序信息和反向时序信息，从而提取到更准确的时序信息，使得第一编码特征具有更准确的时序特征。举例来说，对于“我和我妈妈”，可以通过词向量编码网络将“我”、“和”、“我”、“妈妈”提取为(h0，h1，h2，h3)这样的四个向量，通过正向的长短时记忆网络将通过(h0，h1，h2，h3)提取为(k3，k2，k1，k0)，反向的长短时记忆网络将(h0，h1，h2，h3)提取为(r3，r2，r1，r0)这样的四个向量，由于(k3，k2，k1，k0)中的四个向量已经考虑到时序依赖，基于长短时记忆网络的特性，向量k3中包括了对于k2，k1，k0的依赖，而(r3，r2，r1，r0)中的四个向量也考虑到了时序依赖，向量r3中包括了对r2，r1，r0的依赖，可以用(k3，r3)来表示正向时序信息和反向时序信息的向量拼接，从而可以从第一描述信息中提取到更准确的时序信息。

上述词向量编码网络可以单独训练，也可以是采用现有的词向量编码网络，上述第一时序网络可以通过有监督训练得到。构建完成基于递归神经网络的第一时序网络后，构建的第一数据集，通过第一数据集与词向量编码网络对第一时序网络进行训练，得到训练好的第一时序网络。

第一数据集包括样本药物基于组分描述的样本文本与样本药物的第一适应症文本标签，可以为第一时序网络构建一个初步的第一解码网络，在词向量编码网络提取出样本文本的词向量后，将样本文本的词向量输入到第一时序网络中，得到具有时序属性的第一子编码特征，将具有时序属性的第一子编码特征通过该第一解码网络进行解码，输出对应的第一解码结果，计算将第一解码结果与第一适应症文本标签之间的误差，以最小化第一解码结果与第一适应症文本标签之间的误差损失为目标，对与构建好的第一时序网络进行训练，迭代到第一时序网络收敛或者达到预设的迭代次数为止，得到训练好的第一时序网络。这样，可以使得第一编码网络能够对第一描述信息与不同适应症之间的隐性关系进行编码，从而使得药物适应症的预测更准确。

更具体的，第二描述子信息为图结构描述信息，预设的第二编码网络包括图卷积网络，通过图卷积网络对第二描述子信息进行卷积处理，得到第二描述子信息的第二子编码特征。上述图卷积网络(GCN，Graph Convolutional Networks)是一种用于处理图结构的卷积神经网络，可以结合节点自身及邻居的特征对节点和连接边进行分析，主要可以应用于节点的分类，链路预测，推荐等任务，图卷积网络也可以是基于GAT(Graph AttentionNetworks)的图卷积网络。

上述图卷积网络可以单独训练，也可以与第一时序网络联合训练。构建完成图卷积网络后，构建的第二数据集，通过第二数据集对图卷积网络进行训练，得到训练好的第一时序网络。通过第一数据集、第二数据集对图卷积网络与第一时序网络联合训练。

单独训练图卷积网络时，第二数据集包括样本药物基于分子结构的样本图结构与样本药物的第二适应症文本标签，可以为图卷积网络构建一个初步的第二解码网络，将样本图结构的词向量输入到图卷积网络中，得到第二子编码特征，将第二子编码特征通过该第二解码网络进行解码，输出对应的第二解码结果，计算将第二解码结果与第二适应症文本标签之间的误差，以最小化第二解码结果与第二适应症文本标签之间的误差损失为目标，对构建好的图卷积网络进行训练，迭代到图卷积网络收敛或者达到预设的迭代次数为止，得到训练好的图卷积网络。这样，可以使得第二编码网络能够对第二描述信息与不同适应症之间的隐性关系进行编码，进一步使得药物适应症的预测更准确。

在进行联合训练时，第三适应症文本标签为第一适应症文本标签与第二适应症文本标签的交集，在词向量编码网络提取出样本文本的词向量后，将样本文本的词向量输入到第一时序网络中，得到具有时序属性的第一子编码特征，将第一子编码特征与第二子编码特征进行拼接融合，得到第一融合特征，可以构建一个初步的第三解码网络，将第一融合特征通过该第三解码网络进行解码，输出对应的第三解码结果，计算将第三解码结果与第三适应症文本标签之间的误差，以最小化第三解码结果与第三适应症文本标签之间的误差损失为目标，对构建好的图卷积网络和第一时序网络进行训练，迭代到图卷积网络和第一时序网络收敛或者达到预设的迭代次数为止，得到训练好的图卷积网络和第一时序网络。这样，通过联合训练，将两种不同类型的描述信息进行拟合，进一步使得药物适应症的预测更准确。

在一种可能的实施例中，可以在每执行n次联合训练后，对图卷积网络和第一时序网络分别执行一次单独训练，n大于或者等于1。这样，通过单独训练使得图卷积网络和第一时序网络梯度下降速度更快，从而可以加快对图卷积网络和第一时序网络的联合训练。

更具体的，第三描述子信息为流程图信息，预设的第三编码网络包括第二时序网络，在通过预设的第三编码网络对第三描述子信息进行编码处理，得到第三描述子信息的第三子编码特征的步骤中，可以通过第二时序网络对第三描述子信息进行第二时序编码处理，得到第三描述子信息的第三子编码特征。上述第二时序网络可以与上述第一时序网络在结构上相同，但上述第二时序网络与上述第一时序网络在参数上是不同的，因为使用的数据集是不同的。

上述第二时序网络可以通过有监督训练得到。构建完成基于递归神经网络的第二时序网络后，构建的第三数据集，通过第三数据集对第二时序网络进行训练，得到训练好的第一时序网络。

第三数据集包括样本药物基于制程描述的样本流程图与样本药物的第四适应症文本标签，可以为第二时序网络构建一个初步的第四解码网络，将样本流程图输入到第二时序网络中，得到具有时序属性的第三子编码特征，将具有时序属性的第三子编码特征通过该第四解码网络进行解码，输出对应的第四解码结果，计算将第四解码结果与第四适应症文本标签之间的误差，以最小化第四解码结果与第四适应症文本标签之间的误差损失为目标，对与构建好的第二时序网络进行训练，迭代到第二时序网络收敛或者达到预设的迭代次数为止，得到训练好的第二时序网络。这样，可以使得第三编码网络能够对第三描述信息与不同适应症之间的隐性关系进行编码，从而使得药物适应症的预测更准确。

在一种可能的实施例，上述第二时序网络可以与上述图卷积网络进行联合训练，也可以与上述第一时序网络进行联合训练，还可以同时与上述图卷积网络和第一时序网络进行联合训练，联合训练过程中，输入为各自对应的数据集，通过第五适应症文本标签进行误差计算，第五适应症文本标签为对应的数据集中适应症文本标签的并集，比如，基于组分描述的样本文本A对应的第一适应症文本标签为a1，a2，基于分子结构的样本图结构B对应的第二适应症文本标为b1，b2，b3，基于制程描述的样本流程图C对应的第四适应症文本标签c1，c2，则第五适应症文本标签为a1，a2，b1，b2，b3，c1，c2，这样，通过联合训练，将两种不同类型的描述信息进行拟合，进一步使得药物适应症的预测更准确。

在一种可能的实施例中，可以在每执行n次联合训练后，对参与联合训练的网络分别执行一次单独训练，n大于或者等于1。这样，通过单独训练使得参与联合训练的网络梯度下降速度更快，从而可以加快联合训练的速度。

102、获取不同适应症的第二描述信息，并通过预设的第二语义提取网络对第二描述信息进行语义提取，以得到第二描述信息对应的第二语义特征。

在本发明实施例中，第二描述信息包括适应症的症状描述，比如适应症为“感冒”，症状描述为“感冒引发的发热、头痛、恶心、部分心血管病人血压增加”。

上述第二语义提取网络可以是基于任意一种语言模型进行构建，比如可以基于skip-gram的模型来构建的语义提取网络。可以通过预设的第四数据集对第二语义提取网络进行预训练，得到预训练好的第二语义提取网络。可以根据预先获取各种适应症的症状描述文本作为样本语料，根据样本语料构建第四数据集来训练第二语义提取网络。样本语料可以从网络渠道进行获取，也可以是工作人员进行上传。可以通过第四数据集单独对第二语义提取网络进行的训练。第二语义提取网络用于对第一语义模型中的语义信息进行语义校正，从而使语义模型得到更准确度的语义信息。

103、以第二语义特征对第一语义特征进行修正，得到第一描述文本的对照特征。

在本发明实施例中，将第二语义特征对第一语义特征进行修正，可以使得第一描述文本的语义更加符合适应症描述的语义规律，从而得到更准确的适应症预测结果。

举例来说，词汇表是一种转换工具，将某个类型的状态信息映射为另一个类型的状态信息，比如对于“阿司匹林片”的适应症“适用于抑制血小板聚集，减少动脉粥样硬化患者的心肌梗塞，暂时性脑缺血或中风发生率”，在正常情况下的隐含向量为(H1，H2，H3，H4，H5，H6，…)，假设(H4，H5)表征“中风”，然而由于第一语义模型在处理过程中难免会出现机器误差，因此，可以会提取到隐含向量为(H1，H2，H3，H5，H4，H6，…)，而(H5，H4)表征“风中”，通过第二语义模型可以记忆(H4，H5)为“中风”，由于是通过适应症的描述信息进行提取到的语义特征，因此，(H4，H5)所占的权重要高于(H5，H4)，因此，通过第二语义特征对第一语义修改，可以将隐含向量(H1，H2，H3，H5，H4，H6，…)修正为(H1，H2，H3，H4，H5，H6，…)，从而得到更准确的对照特征。

104、通过对照特征，对第一描述信息的适应症进行预测，得到目标药物的适应症预测结果。

在本发明实施例中，可以将第一描述信息输入预测模型中进行预测，预测模型可以是基于transform的编码器－解码器结构，通过将对照特征作为解码器的解码参数，使得解码器不需要再进行训练，只需要通过第五数据集对编码器－解码器进行训练，同时只调整编码器的参数即可。第五数据集中包括第一描述信息的样本和第基于适应症的标签。

在一种可能的实施例中，可以将第一描述信息的编码特征输入到预设的解码网络中，预先获取基于卷积神经网络的分类模型构建解码网络，从预先获取到的分类模型中提取出分类部分的网络来构建上述解码网络，并在构建的解码模型中添加注意机制。解码网络可以采用Bahdanau注意机制进行校正，解码网络由一个单层注意GRU网络组成，包含512个隐藏单元和512个注意单元。优选的，可以使用单向解码器。可以通过线性函数变换维数，利用对照特征对GRU网络的状态进行初始化，将对照特征为状态参数作为解码网络的状态参数，避免解码网络使用零状态初始化或随机初始化，使得解码网络无需要初始化过程，在提高解码速度的同时，可以采用对照特征为指导，可以产生连贯且语义有效的适应症预测结果。

需要说明的是，本发明实施例提供的药物适应症的预测方法可以应用于可以进行药物适应症的预测的智能手机、电脑、服务器等设备。

可选的，请参见图2，图2是本发明实施例提供的一种药物适应症的预测装置的结构示意图，如图2所示，所述装置包括：

第一获取模块201，用于获取目标药物的第一描述信息，并通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，所述第一描述信息包括所述目标药物的全局信息描述；

第二获取模块202，用于获取不同适应症的第二描述信息，并通过预设的第二语义提取网络对所述第二描述信息进行语义提取，以得到所述第二描述信息对应的第二语义特征，所述第二描述信息包括所述适应症的症状描述；

修正模块203，用于以所述第二语义特征对所述第一语义特征进行修正，得到所述第一描述文本的对照特征；

预测模块204，用于通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述目标药物的适应症预测结果。

可选的，第一获取模块201，包括：

处理子模块，用于通过预设的编码网络对所述第一描述信息进行编码处理，得到所述第一描述信息的编码特征；

提取子模块，用于通过预设的第一语义提取网络对所述编码特征的进行语义提取，得到所述编码特征对应的第一语义特征。

可选的，处理子模块，包括：

划分单元，用于将所述第一描述信息按描述类型进行划分，得到基于组分描述的第一描述子信息、基于分子结构描述的第二描述子信息以及基于制程描述的第三描述子信息；

编码单元，用于通过预设的第一编码网络对所述第一描述子信息进行编码处理，得到所述第一描述子信息的第一子编码特征，以及通过预设的第二编码网络对所述第二描述子信息进行编码处理，得到所述第二描述子信息的第二子编码特征，以及通过预设的第三编码网络对所述第三描述子信息进行编码处理，得到所述第三描述子信息的第三子编码特征；

融合单元，用于对所述第一子编码特征、所述第二子编码特征以及所述第三子编码特征进行线性变换并融合，得到所述第一描述信息的编码特征。

可选的，编码单元，包括：

第一编码子单元，用于第一通过所述词向量编码网络对所述第一描述子信息进行词向量编码处理，得到所述第一描述子信息的词向量；

第二编码子单元，用于通过所述第一时序网络对所述词向量进行第一时序编码处理，得到所述第一描述子信息的第一子编码特征。

可选的，编码单元，包括：

卷积子单元，用于通过所述图卷积网络对所述第二描述子信息进行卷积处理，得到所述第二描述子信息的第二子编码特征。

可选的，编码单元，包括：

第三编码子单元，用于通过所述第二时序网络对所述第三描述子信息进行第二时序编码处理，得到所述第三描述子信息的第三子编码特征。

可选的，预测模块204，包括：

解码子模块，用于将所述第一描述信息的编码特征输入到预设的解码网络中，以所述对照特征为状态参数，对所述编码特征进行解码处理，得到所述药物的适应症预测结果。

需要说明的是，本发明实施例提供的药物适应症的预测装置可以应用于可以进行药物适应症的预测的智能手机、电脑、服务器等设备。

本发明实施例提供的药物适应症的预测装置能够实现上述方法实施例中药物适应症的预测方法实现的各个过程，且可以达到相同的有益效果。为避免重复，这里不再赘述。

参见图3，图3是本发明实施例提供的一种电子设备的结构示意图，如图3所示，包括：存储器302、处理器301及存储在所述存储器302上并可在所述处理器301上运行的药物适应症的预测方法的计算机程序，其中：

处理器301用于调用存储器302存储的计算机程序，执行如下步骤：

可选的，处理器301执行的所述通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，包括：

可选的，处理器301执行的所述目标药物的全局信息描述包括目标药物的组分描述、新药物的分子结构描述以及目标药物的制程描述，所述通过预设的编码网络对所述第一描述信息进行编码处理，得到所述第一描述信息的编码特征，包括：

可选的，处理器301执行的所述第一描述子信息为文本描述信息，所述预设的第一编码网络包括词向量编码网络以及第一时序网络，所述通过预设的第一编码网络对所述第一描述子信息进行编码处理，得到所述第一描述子信息的第一子编码特征，包括：

可选的，处理器301执行的所述第二描述子信息为图结构描述信息，所述预设的第二编码网络包括图卷积网络，所述通过预设的第二编码网络对所述第二描述子信息进行编码处理，得到所述第二描述子信息的第二子编码特征，包括：

可选的，处理器301执行的所述第三描述子信息为流程图信息，所述预设的第三编码网络包括第二时序网络，所述通过预设的第三编码网络对所述第三描述子信息进行编码处理，得到所述第三描述子信息的第三子编码特征，包括：

可选的，处理器301执行的所述通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述药物的适应症预测结果，包括：

本发明实施例提供的电子设备能够实现上述方法实施例中药物适应症的预测方法实现的各个过程，且可以达到相同的有益效果。为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现本发明实施例提供的药物适应症的预测方法或应用端药物适应症的预测方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存取存储器(Random AccessMemory，简称RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种药物适应症的预测方法，用于药物的适应症预测，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，所述通过预设的第一语义提取网络对所述第一描述信息的进行语义提取，以得到所述第一描述信息对应的第一语义特征，包括：

3.如权利要求2所述的方法，其特征在于，所述目标药物的全局信息描述包括目标药物的组分描述、新药物的分子结构描述以及目标药物的制程描述，所述通过预设的编码网络对所述第一描述信息进行编码处理，得到所述第一描述信息的编码特征，包括：

4.如权利要求3所述的方法，其特征在于，所述第一描述子信息为文本描述信息，所述预设的第一编码网络包括词向量编码网络以及第一时序网络，所述通过预设的第一编码网络对所述第一描述子信息进行编码处理，得到所述第一描述子信息的第一子编码特征，包括：

5.如权利要求3所述的方法，其特征在于，所述第二描述子信息为图结构描述信息，所述预设的第二编码网络包括图卷积网络，所述通过预设的第二编码网络对所述第二描述子信息进行编码处理，得到所述第二描述子信息的第二子编码特征，包括：

6.如权利要求3所述的方法，其特征在于，所述第三描述子信息为流程图信息，所述预设的第三编码网络包括第二时序网络，所述通过预设的第三编码网络对所述第三描述子信息进行编码处理，得到所述第三描述子信息的第三子编码特征，包括：

7.如权利要求2所述的方法，其特征在于，所述通过所述对照特征，对所述第一描述信息的适应症进行预测，得到所述药物的适应症预测结果，包括：

8.一种药物适应症的预测装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的药物适应症的预测方法中的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的药物适应症的预测方法中的步骤。