CN112016309B

CN112016309B - 抽取药物组合方法、设备、装置及存储介质

Info

Publication number: CN112016309B
Application number: CN202010921913.2A
Authority: CN
Inventors: 顾大中; 张圣
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2024-03-08
Anticipated expiration: 2040-09-04
Also published as: WO2021159752A1; CN112016309A

Abstract

本发明涉及大数据处理，提供一种抽取药物组合方法、设备、装置及计算机可读存储介质，包括：对抽取语句进行分词处理，得到词语分词，其中，抽取语句包括至少两种药物指称；通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率；将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。本发明能够解决现有技术中手工编写规则，提取药物组合关系的覆盖率和准确率低，具有局限性等问题。

Description

抽取药物组合方法、设备、装置及存储介质

技术领域

本发明涉及大数据处理，尤其涉及一种抽取药物组合方法、设备、装置及计算机可读存储介质。

背景技术

在医学文献中药物信息是一种重要信息，在医学文献分析系统中一般都会用NER(命名体识别)技术抽取出文中出现的药物，然后再用其他技术基于抽取出的药物再做进一步的高层信息抽取，比如提取“给哪些患者用了什么药”，“给哪种动物做了什么药物试验”等信息。“药物组合”信息也是高层信息之一。“药物组合抽取”需要判断文中提到的药物中，哪些药在一起给病人使用的，哪些药仅仅只是同时在文献中提到，但药物之间其实没什么关系。

药物组合信息在很多医学场景下很有用。比如化疗：常用的化疗药物就几十种，医生基本都知道。但是化疗药物常常是2、3种药物按一定顺序给病人使用，病人的病情不同，组合方式也不同，千变万化。因此医生在阅读文献时，最关心的是给病人使用了哪些药物组合，而不仅仅是文献中提到了哪些药物。

“药物组合抽取”详细来说就是“给定一个句子，给定句子中两个药物指称，判断这两个药物指称是否有联合用药的关系”。多于3种以上药物之间的关系，可以通过药物两两之间的关系进行推理。例如：“A药和B药联合用药，B药和C药联合用药，则认为A、B、C一起联合用药”。当然也可以更严格：“A药和B药联合用药，B药和C药联合用药，A药与C药联合用药，才可以认为A、B、C一起联合用药”。推理规则可以根据实际需求自行制定，这里不再赘述。由于可以根据药物两两关系得到多种药物之间的关系，因此只解决“两个药物之间，联合用药关系的抽取”即可。

传统的抽取药物组合的方法为：利用“依存分析”、“词性分析”等传统技术，手工编写规则，提取药物组合关系。这种方法需要耗费大量时间进行手工编写规则，工作效率低；同时由于规则编写者不可能阅读大量数据(百万级)，这些规则往往只能覆盖到有限的情况。很多情况无法处理，覆盖率和准确率达不到要求，具有一定的局限性。

发明内容

基于上述现有技术中存在的问题，本发明提供一种抽取药物组合方法、装置及计算机可读存储介质，其主要目的在于，通过对抽取语句进行分词处理，通过预设联合用药分析神经网络模型对词语分词依次进行语义信息、药物指称的位置信息和分类信息特征向量化处理、对向量化特征拼接处理和根据拼接特征向量的联合用药概率计算处理，输出联合用药概率，再将联合用药概率与预设联合用药门限值比对，输出抽取语句中药物指称间的联合用药关系，提高药物组合抽取的准确率和召回率；解决了现有技术中手工编写规则，提取药物组合关系的覆盖率和准确率低，具有局限性等问题。

第一方面，为实现上述目的，本发明提供一种抽取药物组合方法，该方法包括：

对抽取语句进行分词处理，得到词语分词，其中，所述抽取语句包括至少两种药物指称；

通过预设联合用药分析神经网络模型对所述词语分词中的两种药物指称进行联合用药概率计算处理，输出所述药物指称间的联合用药概率；其中，

所述预设联合用药分析神经网络模型包括：用于对所述词语分词的语义信息和药物指称的位置信息进行特征向量化处理的PCNN特征提取层、用于对所述词语分词的药物指称的分类信息进行特征向量化处理的药物分类编码层、用于将向量化特征进行拼接处理的信息拼接层和用于对所述信息拼接层得到的拼接特征向量进行联合用药概率计算处理的全连接层；

将所述联合用药概率与预设联合用药门限值进行比对，输出所述抽取语句中药物指称间的联合用药关系。

第二方面，为实现上述目的，本发明还提供一种电子设备，该电子设备包括：存储器、处理器，所述存储器中存储有抽取药物组合程序，所述抽取药物组合程序被所述处理器执行时实现如下步骤：

第三方面，为实现上述目的，本发明还提供一种抽取药物组合装置，所述装置包括：

分词单元，用于对抽取语句进行分词处理，得到词语分词，其中，抽取语句包括至少两种药物指称；

联合用药概率输出单元，用于通过预设联合用药分析神经网络模型对所述词语分词中的两种药物指称进行联合用药概率计算处理，输出所述药物指称间的联合用药概率；其中，

联合用药关系输出单元，用于将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

第四方面，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有抽取药物组合程序，所述抽取药物组合程序被处理器执行时，实现如上所述的抽取药物组合方法中的任意步骤。

本发明提出的抽取药物组合方法、装置及计算机可读存储介质，通过对抽取语句进行分词处理，得到词语分词，利用预设联合用药分析神经网络模型对词语依次进行语义信息、药物指称的位置信息和分类信息特征向量化处理、对向量化特征拼接处理和根据拼接特征向量的联合用药概率计算处理，输出联合用药概率，再将联合用药概率与预设联合用药门限值比对，输出抽取语句中药物指称间的联合用药关系，将药物分类信息应用在了药物组合抽取中，增加了可以利用的信息，提高了药物组合抽取的准确率和召回率；解决了现有技术中手工编写规则，提取药物组合关系的覆盖率和准确率低，具有局限性等问题。

附图说明

图1为本发明抽取药物组合方法较佳实施例的流程图；

图2为本发明抽取药物组合方法较佳实施例的应用环境示意图；

图3为图2中抽取药物组合程序较佳实施例的模块示意图。

图4为本发明抽取药物组合方法对应的系统逻辑图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种抽取药物组合方法。参照图1所示，为本发明抽取药物组合方法较佳实施例的流程图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，抽取药物组合方法包括：步骤S110-步骤S130。

步骤S110，对抽取语句进行分词处理，得到词语分词，其中，抽取语句包括至少两种药物指称。

具体的，抽取药物组合即从含有至少两种药物指称的语句中抽取药物指称，分析出药物指称间的联合用药关系。实际应用中，确定抽取语句中两种药物指称之间的联合用药关系即可推测出多种药物指称间的联合用药关系，例如，当A药品能够与B药品合用，B药品能够与C药品合用，A药品能够与C药品合用，便可以确定A药品、B药品、C药品可以联合使用。也就是根据药物两两关系能够得到多种药物之间的关系，只需要判断“两个药物之间，联合用药关系”便可确定出多种药物的组合关系。因此，只需对抽取语句中的任意两个药物指称进行联合用药关系分析即可。

例如，在某篇医学杂志中出现的一个语句为“第一组病人服用了A药片剂，又服用了B药口服液，治好了某种疾病”，在另外一篇杂质上出现了另外一个语句“我今天去药店买了C药，同时也买了D药”则上述的两个语句都可作为抽取语句进行处理。

其中，药物指称指的是药品的名称，例如，双黄连口服液、双黄连片剂、双黄连冲剂，则上述药品均为双黄连药品，只是剂型不同，则药物指称指的是双黄连。

将抽取语句进行分词处理，得到词语分词，其中的分词处理为常规分词处理技术即可。

步骤S120，通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率；其中，

预设联合用药分析神经网络模型包括：用于对词语分词的语义信息和药物指称的位置信息进行特征向量化处理的PCNN特征提取层、用于对词语分词的药物指称的分类信息进行特征向量化处理的药物分类编码层、用于将向量化特征进行拼接处理的信息拼接层和用于对信息拼接层得到的拼接特征向量进行联合用药概率计算处理的全连接层。

具体的，通预设联合用药分析神经网络模型，便于对词语分词中的药物指称分词和语义分词进行分析处理。其中，药物分类编码层、PCNN特征提取层为并列层，当获取到词语分词时，药物分类编码层根据药物指称分词对两种药物按照预设药物分类编码规则进行编码，得到分类编码向量；PCNN特征提取层进行特征信息提取，得到两种药物指称的位置向量和语义向量，然后通过信息拼接层将药物分类编码层得到的两种药物分类编码向量和PCNN特征提取层提取到的两种药物指称的位置向量和语义向量进行拼接，得到拼接信息向量，信息拼接层将拼接特征向量传递给全连接层，通过全连接层对拼接特征向量进行运算，最后得到抽取语句中出现的两种药物指称的联合用药概率并将联合用药概率输出即可。

作为本发明的一个优选方案，预设联合用药分析神经网络模型存储于区块链中，通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率，包括：

通过PCNN特征提取层对词语分词中的语义分词和药物指称分词进行特征向量化处理，得到语义特征向量和药物指称的位置向量，同时通过药物分类编码层，按照预设药物分类编码规则，对词语分词中的药物指称分词进行分类编码向量化处理，得到药物指称的分类编码向量；

通过信息拼接层将语义特征向量、药物指称的位置向量和药物指称的分类编码向量进行拼接处理，得到拼接特征向量；

通过全连接层对拼接特征向量进行联合用药概率计算处理并输出药物指称间的联合用药概率。

具体的，PCNN特征提取层是特征提取的主要部分，提取了词语分词中的语义信息和两个药物指称的位置信息。药物分类编码层是辅助部分，提取了药物指称的分类信息。PCNN是一个比较成熟的网络结构，按照现有的PCNN网络结构进行搭建即可，在此可以将其作为一个“黑箱”，不对其内部结构赘述。

PCNN特征提取层可接受3个输入：药物指称分词1、药物指称分词2和两个药物指称分子之间的语义分词；该网络一方面可以像普通的CNN一样自动提取句子的语义特征，另一方面，该网络特别的对两个药物指称的位置信息做了处理，在语义特征中强调了两个药物指称间的位置关系。因此特别适合用于关系抽取。该网络的输出是一个特征向量，假设该向量为500维(在实际使用中，通过试验确定该向量的维度，一般该向量为50-1000维)。

信息拼接层的功能是对特征的整合，对药物分类编码层输出的两个药物指称的分类编码向量和PCNN特征提取层输出的特征向量简单地拼接在一起，来实现特征信息的整合。即将3个向量拼接为一个拼接特征向量。

全连接层的功能在于对特征的分类，本层根据上一层输出的拼接特征向量进行联合用药概率计算处理，得到两种药物指称的联合用药概率，本层的结构是一个全连接层，全连接层是深度学习中常用的对特征向量进行分类的方法。全连接层的输入是一个特征向量，输出是一个分类概率向量，维度和类别数量一致。

作为本发明的一个优选方案，通过药物分类编码层，按照预设药物分类编码规则，对药物指称分词进行分类编码向量化处理，得到药物指称的分类编码向量，包括：

根据药物指称分词，从预设药品信息库中获取与药物指称分词对应的第一药品类别编码，其中，预设药品信息库储存有药物指称以及与药物指称对应的第一药品类别编码；

按照预设的每位编码向量转化规则，将第一药品类别编码的每一位编码转化为M维向量；

将第一药品类别编码的每位编码的M维向量按照编码的位次进行拼接，得到第二药品类别编码向量；

按照预设的第二药品类别编码向量位数规则，将第二药品类别编码向量处理为N维向量，其中，N维向量为药品信息库中的位数最多的第一药品类别编码对应的第二药品类别编码向量；

将N维向量作为药物指称分词对应的药物指称的分类编码向量。

具体的，预设药品信息库优选ATC药品信息库，ATC药品信息库是一个层级式的药品信息库，里面包含了大量的常见药物。其中每个药物都有一个编码，一般称为ATC code即第一药品类别编码。ATC code的长度是可变的，最短的为1位，最长的为7位。例如“卡托普利”的ATC code为“C09AA01”，“肾素-抑制药”的ATC code为“C09XA”。

ATC code的每一位都有一定的含义，体现了药物的分类信息。如果一个ATC code1是另一个ATC code 2的前缀，则说明ATC code 1是ATC code 2的类别。例如“卡托普利-C09AA01”和“血管紧张素转化酶抑制抑制药,单方-C09AA”。

因此ATC code本身体现了药物的分类信息，如果将ATC code转化为数值量，就可以将药物分类信息用于计算。

作为本发明的一个优选方案，预设的每位编码向量转化规则包括：

将第一药品类别编码中的每位编码的预设可能性取值字符的数量作为第一药品类别编码的每位编码转化向量的维数，得到M维初始编码向量；其中，第一药品类别编码中的每位编码均匹配有带有位次关系的预设可能性取值字符，M为正整数；

针对第一药品类别编码中的每位编码，将该位编码的实际字符在预设可能性取值字符中的位次，作为M维初始编码向量的更改值，其中，M维初始编码向量的每位分向量均为0；

将M维初始编码向量与M维初始编码向量的更改值对应位置的分向量改为1，得到该位编码的M维向量。

具体的，例如第一药品类别编码中的每位编码的预设可能性取值字符为0-9、A-Z中的一个字符，因此每位有36种可能的取值，即将36作为的每位编码转化向量的维数，得到36维初始编码向量，即36个0分向量，将该位编码的实际字符在预设可能性取值字符中的位次，作为36维初始编码向量的更改值，将36维初始编码向量与36维初始编码向量的更改值对应位置的分向量改为1，得到该位编码的36维向量，例如，该位编码的实际字符为“0”，则转化为100…00”；该位编码的实际字符为“5”，则转化为“00000100…00”，该位编码的实际字符为“A”转化为“0000000000100…00”。

作为本发明的一个优选方案，预设的第二药品类别编码向量位数规则包括：

当第二药品类别编码向量的维度为N维时，将N维向量作为药物指称分词对应的药物指称的分类编码向量，N为正整数；

当第二药品类别编码向量的维度不足N维时，在第二药品类别编码向量后面补充0至维度为N维，将补充至N维的第二药品类别编码向量作为药物指称分词对应的药物指称的分类编码向量。

具体的，由于N维向量为药品信息库中的位数最多的第一药品类别编码对应的第二药品类别编码向量，例如ATC药品信息库中的位数最多的第一药品类别编码为7位，对于7位的第一药品类别编码，其向量表示就是将每一位的向量按顺序拼接起来，形成一个36*7＝252维的向量。对于不足7位的第一药品类别编码，例如5位的第一药品类别编码。先将其5位表示的向量拼接起来，然后在向量的最后补0，使其变为252维的向量。这样就将每个第一药品类别编码转化为了可计算的向量，即药物分类编码向量。

作为本发明的一个优选方案，按照预设药物分类编码规则，通过药物分类编码层对药物指称分词进行分类编码向量化处理，得到药物指称的分类编码向量，还包括：

当药物指称分词为未储存在预设药品信息库中的词语时，将N维全0向量作为该药物指称分词的药物指称的分类编码向量。

具体的，药物分类编码层比较简单，就是将药物指称转化为药物分类编码向量，可以通过一个简单的查询表实现。需要注意的是，如果药物指称不在预设药品信息库中，需要给该药物分配一个特殊的分类编码，例如，药物指称分词不在ATC药品信息库中，则用一个252维的全0向量即可。

步骤S130，将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

具体的，将从预设联合用药分析神经网络模型中输出的药物指称的联合用药概率与预设的联合用药门限值进行比较，比较的结果分为两种，一种是大于等于预设联合用药门限值，另一种是小于预设联合用药门限值；其中，预设联合用药门限值为根据实际应用情况进行设定的值。通过药物指称的联合用药概率与预设联合用药门限值的比对结果进行联合用药分析，从而得出两种药物之间的联合用药关系。

作为本发明的一个优选方案，将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系，包括：

当联合用药概率大于等于预设联合用药门限值时，输出抽取语句中药物指称间为联合用药关系；

当联合用药概率小于预设联合用药门限值时，输出抽取语句中药物指称间为非联合用药关系。

具体的，将药物指称的联合用药概率与预设合用门限值进行比较，例如，预设联合用药门限值为80％，则，当药物指称的联合用药概率大于等于80％时，输出抽取语句中药物指称间为联合用药关系；当药物指称的联合用药概率小于80％时，输出抽取语句中药物指称间为非联合用药关系。

本发明提供的抽取药物组合方法，应用于一种电子设备1。参照图2所示，为本发明抽取药物组合方法较佳实施例的应用环境示意图。

在本实施例中，电子设备1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。

该电子设备1包括：处理器12、存储器11、网络接口13及通信总线14。

存储器11包括至少一种类型的可读存储介质。至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡及卡型存储器11等的非易失性存储介质。在一些实施例中，可读存储介质可以是电子设备1的内部存储单元，例如该电子设备1的硬盘。在另一些实施例中，可读存储介质也可以是电子设备1的外部存储器11，例如电子设备1上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(FlashCard)等。

在本实施例中，存储器11的可读存储介质通常用于存储安装于电子设备1的抽取药物组合程序10等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行抽取药物组合程序10等。

网络接口13可选地可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该电子设备1与其它电子设备之间建立通信连接。

通信总线14用于实现上述这些组件之间的连接通信。

图2仅示出了具有组件11-14的电子设备1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，该电子设备1还可以包括摄像装置，摄像装置既可以是电子设备1的一部分，也可以独立于电子设备1。在一些实施例中，电子设备1为智能手机、平板电脑、便携计算机等具有摄像头的终端设备，则摄像装置即为电子设备1的摄像头。在其他实施例中，电子设备1可以为服务器，摄像装置独立于该电子设备1、与该电子设备1通过有线或者无线网络连接。例如，该摄像装置安装于特定场所，如办公场所、监控区域，对进入该特定场所的目标进行实时拍摄得到实时图像，通过网络将拍摄得到的实时图像传输至处理器12。

可选地，该电子设备1还可以包括用户接口，用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的设备、语音输出装置比如音响、耳机等，可选地用户接口还可以包括标准的有线接口、无线接口。

可选地，该电子设备1还可以包括显示器，显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode，OLED)触摸器等。显示器用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

可选地，该电子设备1还包括触摸传感器。该触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外，这里的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且，触摸传感器不仅包括接触式的触摸传感器，也可包括接近式的触摸传感器等。此外，触摸传感器可以为单个传感器，也可为例如阵列布置的多个传感器。

此外，该电子设备1的显示器的面积可以与所述触摸传感器的面积相同，也可以不同。可选地，将显示器与所述触摸传感器层叠设置，以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。

可选地，该电子设备1还可以包括射频(Radio Frequency，RF)电路，传感器、音频电路等等，在此不再赘述。

在图2所示的设备实施例中，作为一种计算机存储介质的存储器11中可以包括操作系统以及抽取药物组合程序10；处理器12执行存储器11中存储的抽取药物组合程序10时实现如下步骤：

步骤S110、对抽取语句进行分词处理，得到词语分词，其中，抽取语句包括至少两种药物指称；

步骤S120、通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率；其中，

预设联合用药分析神经网络模型包括：用于对词语分词的语义信息和药物指称的位置信息进行特征向量化处理的PCNN特征提取层、用于对词语分词的药物指称的分类信息进行特征向量化处理的药物分类编码层、用于将向量化特征进行拼接处理的信息拼接层和用于对信息拼接层得到的拼接特征向量进行联合用药概率计算处理的全连接层；

步骤S130、将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

按照预设的第二药品类别编码向量位数规则，将第二药品类别编码向量处理为N维向量，其中，N维向量为所述药品信息库中的位数最多的第一药品类别编码对应的第二药品类别编码向量；

在其他实施例中，抽取药物组合程序10还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由处理器12执行，以完成本发明。

本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图3所示，为图2中抽取药物组合程序10较佳实施例的程序模块图。所述抽取药物组合程序10可以被分割为：分词模块110、联合用药概率输出模块120、联合用药关系输出模块130。

所述模块110-130所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

分词模块110，用于对抽取语句进行分词处理，得到词语分词，其中，抽取语句至少包括两种药物指称。

联合用药概率输出模块120，用于通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率；其中，

联合用药关系输出模块130，用于将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

如图4所示，此外，与上述方法相对应，本发明的实施例还提出一种抽取药物组合装置400，包括：分词单元410、联合用药概率输出单元420、联合用药关系输出单元430，其中，分词单元410、联合用药概率输出单元420、联合用药关系输出单元430的实现功能与实施例中抽取药物组合方法的步骤一一对应。

分词单元410、用于对抽取语句进行分词处理，得到词语分词，其中，抽取语句至少包括两种药物指称。

联合用药概率输出单元420、用于通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率；其中，

联合用药关系输出单元430、用于将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质中存储有抽取药物组合程序，所述抽取药物组合程序被处理器执行时实现如下操作：

对抽取语句进行分词处理，得到词语分词，其中，抽取语句包括至少两种药物指称；

通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率；其中，

将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

优选地，预设联合用药分析神经网络模型存储于区块链中，通过预设联合用药分析神经网络模型对词语分词中的两种药物指称进行联合用药概率计算处理，输出药物指称间的联合用药概率，包括：

优选地，通过药物分类编码层，按照预设药物分类编码规则，对药物指称分词进行分类编码向量化处理，得到药物指称的分类编码向量，包括：

优选地，预设的每位编码向量转化规则包括：

优选地，预设的第二药品类别编码向量位数规则包括：

优选地，按照预设药物分类编码规则，通过药物分类编码层对药物指称分词进行分类编码向量化处理，得到药物指称的分类编码向量，还包括：

优选地，将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系，包括：

本发明之计算机可读存储介质的具体实施方式与上述抽取药物组合方法、电子装置的具体实施方式大致相同，在此不再赘述。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种抽取药物组合方法，应用于电子装置，其特征在于，所述方法包括：

在所述通过预设联合用药分析神经网络模型对所述词语分词中的两种药物指称进行联合用药概率计算处理，输出所述药物指称间的联合用药概率的过程中，通过所述药物分类编码层，按照预设药物分类编码规则，对所述词语分词中的药物指称分词进行分类编码向量化处理，得到所述药物指称的分类编码向量；其中，得到所述药物指称的分类编码向量的步骤包括：

根据所述药物指称分词，从预设药品信息库中获取与所述药物指称分词对应的第一药品类别编码，其中，所述预设药品信息库储存有药物指称以及与所述药物指称对应的第一药品类别编码；

按照预设的每位编码向量转化规则，将所述第一药品类别编码的每一位编码转化为M维向量；

将所述第一药品类别编码的每位编码的M维向量按照编码的位次进行拼接，得到第二药品类别编码向量；

按照预设的第二药品类别编码向量位数规则，将所述第二药品类别编码向量处理为N维向量，其中，所述N维向量为所述药品信息库中的位数最多的第一药品类别编码对应的第二药品类别编码向量；

将所述N维向量作为所述药物指称分词对应的药物指称的分类编码向量；

所述预设的每位编码向量转化规则包括：

将所述第一药品类别编码中的每位编码的预设可能性取值字符的数量作为所述第一药品类别编码的每位编码转化向量的维数，得到M维初始编码向量；其中，所述第一药品类别编码中的每位编码均匹配有带有位次关系的预设可能性取值字符，M为正整数；

针对所述第一药品类别编码中的每位编码，将该位编码的实际字符在所述预设可能性取值字符中的位次，作为所述M维初始编码向量的更改值，其中，所述M维初始编码向量的每位分向量均为0；

将所述M维初始编码向量与所述M维初始编码向量的更改值对应位置的分向量改为1，得到该位编码的M维向量；

2.根据权利要求1所述的抽取药物组合方法，其特征在于，所述预设联合用药分析神经网络模型存储于区块链中，所述通过预设联合用药分析神经网络模型对所述词语分词中的两种药物指称进行联合用药概率计算处理，输出所述药物指称间的联合用药概率，包括：

通过所述PCNN特征提取层对所述词语分词中的语义分词和药物指称分词进行特征向量化处理，得到语义特征向量和药物指称的位置向量，同时通过所述药物分类编码层，按照预设药物分类编码规则，对所述词语分词中的药物指称分词进行分类编码向量化处理，得到所述药物指称的分类编码向量；

通过所述信息拼接层将所述语义特征向量、所述药物指称的位置向量和所述药物指称的分类编码向量进行拼接处理，得到拼接特征向量；

通过所述全连接层对所述拼接特征向量进行联合用药概率计算处理并输出所述药物指称间的联合用药概率。

3.根据权利要求1所述的抽取药物组合方法，其特征在于，所述预设的第二药品类别编码向量位数规则包括：

当所述第二药品类别编码向量的维度为N维时，将所述N维向量作为所述药物指称分词对应的药物指称的分类编码向量，N为正整数；

当所述第二药品类别编码向量的维度不足N维时，在所述第二药品类别编码向量后面补充0至维度为N维，将补充至N维的第二药品类别编码向量作为所述药物指称分词对应的药物指称的分类编码向量。

4.根据权利要求1所述的抽取药物组合方法，其特征在于，按照预设药物分类编码规则，通过所述药物分类编码层对所述药物指称分词进行分类编码向量化处理，得到药物指称的分类编码向量，还包括：

当所述药物指称分词为未储存在所述预设药品信息库中的词语时，将N维全0向量作为该药物指称分词的药物指称的分类编码向量。

5.根据权利要求1所述的抽取药物组合方法，其特征在于，将所述联合用药概率与预设联合用药门限值进行比对，输出所述抽取语句中药物指称间的联合用药关系，包括：

当所述联合用药概率大于等于所述预设联合用药门限值时，输出所述抽取语句中药物指称间为联合用药关系；

当所述联合用药概率小于所述预设联合用药门限值时，输出所述抽取语句中药物指称间为非联合用药关系。

6.一种电子设备，其特征在于，该电子设备包括：存储器、处理器，所述存储器中存储有抽取药物组合程序，所述抽取药物组合程序被所述处理器执行如权利要求1-5任意一项所述的抽取药物组合方法的步骤。

7.一种抽取药物组合装置，其特征在于，所述装置包括：

所述预设的每位编码向量转化规则包括：

将所述M维初始编码向量与所述M维初始编码向量的更改值对应位置的分向量改为1，得到该位编码的M维向量；联合用药关系输出单元，用于将联合用药概率与预设联合用药门限值进行比对，输出抽取语句中药物指称间的联合用药关系。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有抽取药物组合程序，所述抽取药物组合程序被处理器执行时，实现如权利要求1至5中任一项所述的抽取药物组合方法的步骤。