WO2021151302A1

WO2021151302A1 - 基于机器学习的药品质控分析方法、装置、设备及介质

Info

Publication number: WO2021151302A1
Application number: PCT/CN2020/119063
Authority: WO
Inventors: 李彦轩; 孙行智
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-16
Filing date: 2020-09-29
Publication date: 2021-08-05
Also published as: CN111833984B; CN111833984A

Abstract

一种基于机器学习的药品质控分析方法、装置、设备及介质，涉及信息技术领域，主要在于能够能够扩展机器学习模型的特征空间，引入了疾病属性特征和药品属性特征，从而提高了模型的质控分析精度。其中方法包括：确定所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；确定所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。涉及人工智能中的机器学习技术，适用于药品的质控分析，同时适用于智慧医疗领域，从而可进一步推动智慧城市的建设。另外，还涉及区块链技术。

Description

基于机器学习的药品质控分析方法、装置、设备及介质

本申请要求于2020年7月16日提交中国专利局、申请号为CN202010685223.1、名称为“基于机器学习的药品质控分析方法、装置、设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息技术领域，尤其是涉及一种基于机器学习的药品质控分析方法、装置、设备及介质。

背景技术

在患者的诊疗过程中，患者的用药通常由主治医师根据其诊断和检查结果给出，为了确保医生所开药品的合理性，可以通过机器学习的方式对医生所开处方中的药品进行质量监控，避免由于不合理用药导致患者治疗结果不佳或者给患者造成额外的药品开支。

目前，通常使用医生所开处方中的疾病名称和药品名称对药品进行质量监控。发明人意识到这种仅依赖疾病名称和药品名称进行质量监控的方式，机器学习模型的特征空间较为局限，在质量监控过程中模型无法获取更多的特征信息，进而导致模型的质控精度较低，无法有效的判断医生用药的合理性。

发明内容

根据本申请的第一个方面，提供一种基于机器学习的药品质控分析方法，包括：

获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；

将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；

将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；

根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。

根据本申请的第二个方面，提供一种基于机器学习的药品质控分析装置，包括：

获取单元，用于获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；

第一提取单元，用于将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；

第二提取单元，用于将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；

确定单元，用于根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。

根据本申请的第三个方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现以下步骤：

根据本申请的第四个方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1示出了本申请实施例提供的一种基于机器学习的药品质控分析方法流程图；

图2示出了本申请实施例提供的另一种基于机器学习的药品质控分析方法流程图；

图3示出了本申请实施例提供的另一种基于机器学习的药品质控分析方法流程图；

图4示出了本申请实施例提供的用于药品质控分析的模型结构示意图；

图5示出了本申请实施例提供的另一种基于机器学习的药品质控分析装置的结构示意图；

图6示出了本申请实施例提供的一种计算机设备的实体结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

目前，这种仅依赖疾病名称和药品名称进行质量监控的方式，机器学习模型的特征空间较为局限，在质量监控过程中模型无法获取更多的特征信息，进而导致模型的质控精度较低，无法有效的判断医生用药的合理性。

为了解决上述问题，本申请实施例提供了一种基于机器学习的药品质控分析方法，如图1所示，所述方法包括：

101、获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息。

其中，疾病标识信息和药品标识信息可以为标准化的疾病名称和标准化的药品名称，疾病属性信息包括疾病的发病率(高、中、低)，疾病所属的科室以及疾病的发病部位等疾病特征，药品属性信息包括ATC编码指定的药品类别、药品主要成分等药品特征，本申请实施例主要应用于药品的质控分析，本申请实施例的执行主体为能够对患者病历中药品进行质控分析的装置或设备，与此同时，本实施例还涉及区块链技术，可将患者病历中的疾病标识信息和药品标识信息存储与区块链中，对于本申请实施例，当需要对患者病历中的药品进行质控分析时，选择待分析的患者病历，点击质控分析按钮，触发药品质控分析指令，服务器接收到药品质控分析指令后，对该指令中携带的待分析的患者病历进行质控分析，具体地，首先获取待分析的患者病历中记载的疾病名称和药品名称，由于患者病历中记载的疾病名称和药品名称可能为某疾病或者药品的别名，不是标准化名称，不便于对其进行质控分析，因此需要对获取的疾病名称和药品名称进行标准化处理，得到标准化的疾病名称和标准化的药品名称。

进一步地，根据获取的患者病历中的疾病标识信息和药品标识信息，分别查询预设结构化疾病属性表和预设结构化药品属性表，确定疾病标识信息对应的疾病属性信息和药品标识信息对应的药品属性信息，其中，疾病标识信息和药品标识信息为文本形式，疾病属性信息和药品属性信息为结构化数据，预设结构化疾病属性表和预设结构化药品属性表可以存储与区块链中，本申请实施例通过引入疾病属性信息和药品属性信息，扩展了质控分析过程中机器学习模型的特征空间，增加质控分析过程中的信息维度，提高了模型的质控分析精度，确保质控分析结果的准确性。

102、将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量。

对于本申请实施例，为了提取疾病标识信息和药品标识信息共同对应的标识特征向量，将获取的疾病标识信息和药品标识信息输入至预设标识特征提取模型进行特征提取，得到该疾病标识信息和药品标识信息共同对应的标识特征向量，其中，由于疾病标识信息和药品标识信息为文本形式，为了能够对疾病标识信息和药品标识信息进行处理，预设标识特征提取模型可以为但不局限于预设文本卷积神经网络模型，该预设文本卷积神经网络模型由嵌入层、卷积层、池化层、拼接层和输出层组成，疾病标识信息和药品标识信息为文本形式的一维数据，该预设文本卷积神经网络模型能够对输入的文本形式的一维数据进行一维卷积，提取疾病标识信息和药品标识信息共同对应的标识特征向量，以便根据提取的标识特征向量对患者病历中的药品进行质控分析。

103、将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量。

其中，预设属性特征提取模型可以为第一预设DNN神经网络模型，该第一预设DNN神经网络模型能够处理结构化数据，对于本申请实施例，将结构化的疾病属性信息和药品属性信息输入至第一预设DNN神经网络模型进行特征提取，该第一预设DNN神经网络模型包含两层隐藏层，用于提取疾病属性信息和药品属性信息共同对应的属性特征向量，第二层隐藏层会输出提取的属性特征向量，以便与标识特征向量相结合，确定患者用药的合理性。由此能够扩展机器学习模型的特征空间，提升模型的质控分析精度，与此同时，本申请实施例通过采用预设文本卷积神经网络模型对文本形式的药品标识信息和疾病标识信息进行特征提取，以及采用第一预设DNN神经网络模型对结构化的药品属性信息和疾病属性信息进行特征提取，解决了同时处理结构化数据和非结构化数据的问题，提高了模型对数据的可兼容性。

104、根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。

其中，该药品的质控分析结果包括患者用药异常和患者用药正常两种结果，对于本申请实施例，为了根据标识特征向量和属性特征向量确定患者病历中药品的质控分析结果，将提取的标识特征向量和属性特征向量相结合，具体可以将标识特征向量和属性特征向量合并，根据合并后的向量确定患者病历中药品的质控分析结果，为了确保质控分析结果的准确性，需要对质控分析结果进行验证，所述方法还包括：利用预设异常检测规则对所述疾病标识信息和所述药品标识信息进行异常检测，得到异常检测结果；根据所述异常检测结果验证所述质控分析结果的准确性，其中，该预设异常检测规则为根据历史异常检测结果提取的规则，例如，根据历史异常检测结果，确定疾病A，不能使用药品B，由此能够获取多条异常检测规则，利用预设异常检测规则对患者病历中的疾病标识信息和药品标识信息进行异常检测，得到异常检测结果，以便根据该异常检测结果验证质控分析结果的准确性，如果该质控分析结果为用药异常，且患者病历中的疾病标识信息和药品标识信息符合预设异常检测规则，则确定该质控分析结果无误，患者用药确实存在异常，此外，如果该质控分析结果为患者用药正常，且患者病历中的疾病标识信息和药品标识信息符合该预设异常检测规则，则确定该质控分析结果有误，患者用药有可能存在异常；若患者病历中的疾病标识信息和药品标识信息不符合该预设异常检测规则，则确定该质控分析结果无误，患者用药确实正常，由此通过利用该预设异常检测规则能够对该质控分析结果进行验证，确保质控分析结果的准确性。

本申请实施例提供的一种基于机器学习的药品质控分析方法，与目前使用医生所开处方中的疾病名称和药品名称对药品进行质量监控的方式相比，本申请能够获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；并将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；同时将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；最终根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果，由此在使用疾病标识信息和药品标识信息的基础上，引入疾病属性信息和药品属性信息，扩展了机器学习模型的特征空间，使机器学习模型能够获取更多的特征信息，提高了模型的质控分析精度，此外，本申请通过采用预设标识特征提取模型对文本形式的药品标识信息和疾病标识信息进行特征提取，以及采用预设属性特征提取模型对结构化的药品属性信息和疾病属性信息进行特征提取，解决了同时处理结构化数据和非结构化数据的问题，提高了模型对数据的可兼容性。

进一步的，为了更好的说明上述质控分析结果的确定过程，作为对上述实施例的细化和扩展，本申请实施例提供了另一种基于机器学习的药品质控分析方法，如图2所示，所述方法包括：

201、获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息。

对于本申请实施例，为了确定疾病标识信息对应的疾病属性信息和药品标识信息对应的药品属性信息，步骤201具体包括：根据所述疾病标识信息查询预设结构化疾病属性表，确定所述疾病标识信息对应的疾病属性信息；根据所述药品标识信息查询预设结构化药品属性表，确定所述药品标识信息对应的药品属性信息。其中，所述预设结构化疾病属性表中存储有不同疾病标识信息及其对应的疾病属性信息，所述预设结构化药品属性表中存储有不同药品标识信息及其对应的药品属性信息。

具体地，当服务器接收到药品质控分析指令时，对该质控分析指令中携带的待分析的患者病历进行质控分析，首先获取患者病历中记载的疾病名称和药品名称，由于该疾病名称和药品名称可能是某种疾病或者药品的别名，并不是标准化名称，为了便于对患者病历中记载的所有疾病名称和药品名称进行统一处理，需要对获取的疾病名称和药品名称进行标准化处理，具体地，可以根据获取的疾病名称和药品名称，分别查询预设疾病名称库和预设药品名称库，确定患者病历中所记载疾病和药品的标准化名称，即疾病标识信息和药品标识信息，其中，预设疾病名称库中存储有不同疾病的标准化名称及其对应的别名，预设药品名称库中存储有不同药品的标准化名称及其对应的别名，由此通过该预设疾病名称库和预设药品名称库，能够对患者病历中记载的疾病名称和药品名称进行标准化处理，得到文本形式的标准化的疾病名称和标准化的药品名称。

进一步地，为了获取疾病标识信息对应的疾病属性信息和药品标识信息对应的药品属性信息，根据该疾病标识信息查询预设结构化疾病属性表，确定该疾病标识信息对应的结构化疾病属性信息，同理根据该药品标识信息查询预设结构化药品属性表，确定该药品标识信息对应的结构化药品属性信息，由此能够在使用疾病名称和药品名称的基础上，引入疾病属性信息和药品属性信息，扩展了机器学习模型的特征空间，使机器学习模型能够获取更多的特征信息，提高模型的质控分析精度。

202、将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量。

对于本申请实施例，疾病标识信息和药品标识信息为文本形式的一维数据，为了能够对文本形式的疾病标识信息和药品标识信息进行质控分析，预设标识特征提取模型可以为预设文本卷积神经网络模型，该预设文本卷积神经网络由嵌入层、卷积层、池化层、拼接层和输出层组成，具体地，若疾病标识信息和药品标识信息中标准化疾病名称和标准化药品名称共有m种，则某一标准化疾病名称或药品名称的独热向量表示为长度为m、与该名称对应位置值为1且其余位置值为0的一条向量。在经过嵌入层的映射后，该向量则会转化成长度为n且n远小于m的嵌入向量。相比于独热向量的0-1表示，该向量的每个位置的值都为一个连续的小数。卷积层主要用多个不同大小的卷积核对输入该层的嵌入向量做卷积运算，其公式如下所示：

c _i＝f(w·x _i:i+h-1+b)

其中，ci表示以输入嵌入向量的第i行为起点卷积核进行卷积运算的结果，f表示卷积运算，w表示卷积核中的参数，Xi:i+h-1表示以输入嵌入向量的第i到i+h-1行(h为卷积核的大小)，b为运算的偏置项，即在该步骤中卷积核会选取标准化疾病名称或标准化药品名称中长度为h的一部分参与运算，其意义就在于提取这部分中各名称间的相互关系。

进一步地，在卷积层输出多个向量ci之后，池化层会将这部分向量进行拼接并进行池化操作，拼接和池化操作的公式分别如下所示：

c＝[c ₁,c ₂,…,c _n-h+1]

在该步操作中，由于取了向量c的最大值，所以池化层可获得卷积层各个输出值中的值最大，此外，由于一个文本卷积神经网络模型中一般会有多个卷积核及其对应的池化层，所以拼接层会将其得到的多个

向量进行拼接，即将获得的信息进行整合，输出层的公式如下所示：

y＝softmax(w·x+b)

在线性运算的基础上使用softmax激活函数引入非线性因子获得最终各类别的概率作为输出，但在本申请中仅选取池化层的输出作为标识特征向量，用来表示预设文本卷积神经网络模型从文本形式的标准化疾病名称和标准化药品名称中获取到的信息和隐含特征。

203、将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量。

对于本申请实施例，在引入疾病属性信息和药品属性信息之后，利用预设属性特征提取模型对疾病属性信息和药品属性信息进行特征提取，该预设属性特征提取模型可以为第一预设DNN神经网络模型，利用第一预设DNN神经网络模型提取疾病属性信息和药品属性信息共同对应的属性特征向量的具体过程与步骤103相同，在此不再赘述。

204、将所述标识特征向量和所述属性特征向量进行合并，得到合并后的特征向量。

对于本申请实施例，为了利用标识特征向量和属性特征向量对患者病历中的药品进行质控分析，利用拼接层concatenate将提取的标识特征向量和属性特征向量进行拼接，由此能够将文本形式的标准化疾病名称和标准化药品名称共同对应的隐含特征与结构化的疾病属性信息和药品属性信息共同对应的隐含特征相融合，得到拼接后的特征向量，以便根据该拼接后的特征向量进行质控分析。

205、将合并后的特征向量输入至预设质控分析模型进行质控分析，得到所述患者病历中药品的质控分析结果。

进一步地，为了确定患者病历中药品的质控分析结果，将拼接后的特征输入至预设质控分析模型进行分析，得到该患者病历中药品的质控分析结果，即该患者病历中是否存在用药异常的情况，其中，预设质控分析模型可以为第二预设DNN神经网络模型，第二预设DNN神经网络模型的输出层与预设文本卷积神经网络模型中的输出层相同，其对拼接后的特征向量进行计算，得到患者病历中用药是否异常的结论。由此，通过引入疾病属性信息和药品属性信息，扩展了模型的特征空间，提高了模型的质控分析精度，此外，本申请实施例通过采用预设标识特征提取模型、预设属性特征提取模型和预设质控分析模型，解决了同时处理结构化数据和非机构化数据的问题，提高了模型对数据的可兼容性。

进一步地，在利用上述方法对患者病历中药品进行质控分析之前，需要构建预设标识特征提取模型、预设属性特征提取模型和预设质控分析模型，具体地，将上述三个模型作为一个整体进行训练，获取各个历史患者病历中的历史疾病标识信息和历史药品标识信息，以及所述各个历史患者病历对应的质控分析结果，之后分别确定所述历史疾病标识信息对应的历史疾病属性信息和所述历史药品标识信息对应的历史药品属性信息，将所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为样本训练集，利用预设神经网络算法对样本训练集进行训练，构建构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型。如图3中的虚线框所示，将三个模型作为共同的任务一进行使用，即通过调用任务一，引入了结构化的疾病属性信息和药品属性信息，扩展了质控分析模型的特征空间，增加了药品质控分析的信息维度，从而提高了质控分析结果的准确性。

进一步地，由于任务一中的模型是针对有限的数据进行训练得到，即任务一模型能够分析的疾病和药品的种类有限，若患者电子病历中出现的疾病和药品种类不在任务一种模型的训练集内，会导致任务一无法支持患者病历中的疾病和药品种类，从而无法对该患者病历中的药品进行质控分析，为了克服上述缺陷，如图3中的实线框所示，本申请实施例可调用任务二，利用疾病属性信息和药品属性信息分析推导该电子病历中用药是否异常，例如，任务一中的模型虽然不支持某种疾病或者药品，但是该种疾病和药品对应的疾病属性信息和药品属性信息可能与训练集中支持的疾病和药品种类对应的疾病属性和药品属性相似，由此本申请实施例可以利用训练集中已有的疾病属性信息和药品属性信息分析推导患者用药的合理性。

由此针对上述内容，为了将任务一与任务二相结合对药品进行质控分析，所述方法还包括：若所述预设标识特征提取模型不支持所述疾病标识信息或所述药品标识信息，则将所述疾病属性信息和所述药品属性信息输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量，并根据所述属性特征向量确定所述患者病历中药品的质控分析结果；若所述预设标识特征提取模型支持所述疾病标识信息和所述药品标识信息，则触发所述将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量的步骤。

具体判断预设标识特征提取模型是否支持疾病标识信息或者药品标识信息时，若待分析患者病历中的疾病标识信息或者药品标识信息不为样本训练集中已有的疾病标识信息和药品标识信息，或者将待分析患者病历中的疾病标识信息和药品标识信息输入至预设标识特征提取模型，同时将疾病属性信息和药品属性信息输入至预设属性特征提取模型后，预设质控分析模型无法输出质控分析结果，则确定预设标识特征提取模型不支持该疾病标识信息或药品标识信息；若疾病标识信息或者药品标识信息为样本训练集中已有的疾病标识信息和药品标识信息，或者将待分析患者病历中的疾病标识信息和药品标识信息输入至预设标识特征提取模型，同时将疾病属性信息和药品属性信息输入至预设属性特征提取模型后，预设质控分析模型能够输出质控分析结果，确定预设标识特征提取模型支持该疾病标识信息和药品标识信息。

对于本申请实施例，在对任务一和任务二中的模型进行训练时，将所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病特征信息、所述历史药品属性信息和所述质控分析结果作为第一样本训练集；将所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第二样本训练集；利用预设神经网络算法对所述第一样本训练集进行训练，构建所述预设标识特征提取模型、所述初步属性特征提取模型和所述预设质控分析模型；根据所述第二样本训练集对所述初步属性特征提取模型进行训练，构建所述预设属性特征提取模型。

由此可知，在上述训练过程中，第一预设DNN神经网络模型共训练两次，并将两次训练之后的参数作为最终的参数进行应用，因此第一预设神经网络模型不仅在任务一种能够提取属性特征向量，还能够根据提取的属性特征向量确定患者病历中药品的质控结果，即第一预设DNN神经网络模型既能够支持任务一，同时也能够支持任务二，本申请实施例将任务二作为任务一的子任务，这样当输入的疾病标识信息和药品标识信息在任务一模型支持的范围内时，则采用任务一种的模型进行质控分析，使用疾病标识信息和药品标识信息，以及疾病属性信息和药品属性信息两部分内容；而当任务一的模型不支持疾病标识信息或药品标识信息时，则调用任务二完成质控分析，只输入疾病属性信息和药品属性信息，由此模型的分析范围和扩展性都可得到提高，该模型不仅能够对支持的数据进行精确分析，还能够在不支持数据时，利用疾病属性信息和药品属性信息进行精确分析。

本申请实施例提供的另一种基于机器学习的药品质控分析方法，与目前使用医生所开处方中的疾病名称和药品名称对药品进行质量监控的方式相比，本申请在使用疾病名称和药品名称的基础上，引入疾病属性信息和药品属性信息，通过提取疾病名称和药品名称共同对应的标识特征向量，以及疾病属性信息和药品属性信息共同对应的属性特征向量，并将提取的标识特征向量和属性特征向量相结合，扩展了机器学习模型的特征空间，使机器学习模型能够获取更多的特征信息，提高了模型的质控分析精度，此外，本申请通过采用预设标识特征提取模型、预设属性特征提取模型和预设质控分析模型，解决了同时处理结构化数据和非结构化数据的问题，提高了模型对数据的可兼容性，与此同时，本申请采集多任务相结合的质控分析，当任务一模型不支持疾病标识信息或药品标识信息时，调用任务二模型，利用疾病属性信息和药品属性信息分析推导患者用药的合理性，由此该模型不仅能够对支持的数据进行精确分析，还能够利用疾病属性信息和药品属性信息对不支持的数据进行精确分析，提高了模型的分析范围和扩展性。

进一步地，作为图1的具体实现，本申请实施例提供了一种基于机器学习的药品质控分析装置，如图4所示，所述装置包括：获取单元31、第一提取单元32、第二提取单元33和确定单元33。

所述获取单元31，可以用于获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息。所述获取单元31是本装置中获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息的主要功能模块。

所述第一提取单元32，可以用于将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量。所述第一提取单元32是本装置中将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量的主要功能模块，也是核心模块。

所述第二提取单元33，可以用于将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量。所述第二提取单元33是本装置中将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量的主要功能模块，也是核心模块。

所述确定单元34，可以用于根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。所述确定单元34是本装置中根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果的主要功能模块，也是核心模块。

对于本申请实施例，如图5所示，为了利用标识特征向量和属性特征向量进行质控分析，所述确定单元34，包括：合并模块341和分析模块342。

所述合并模块341，可以用于将所述标识特征向量和所述属性特征向量进行合并，得到合并后的特征向量。

所述分析模块342，可以用于将合并后的特征向量输入至预设质控分析模型进行质控分析，得到所述患者病历中药品的质控分析结果。

进一步地，为了调用多任务对患者病历中的药品进行质控分析，所述装置还包括：输出单元35。

所述输出单元35，可以用于若所述预设标识特征提取模型不支持所述疾病标识信息或所述药品标识信息，则将所述疾病属性信息和所述药品属性信息输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量，并根据所述属性特征向量确定所述患者病历中药品的质控分析结果。

所述第一提取单元32，还可以用于若所述预设标识特征提取模型支持所述疾病标识信息和所述药品标识信息，则触发所述将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量的步骤。

进一步地，为了获取疾病标识信息对应的疾病属性信息和药品标识信息对应的药品属性信息，所述获取单元31，包括：第一确定模块311和第二确定模块312。

所述第一确定模块311，可以用于根据所述疾病标识信息查询预设结构化疾病属性表，确定所述疾病标识信息对应的疾病属性信息，所述预设结构化疾病属性表中存储有不同疾病标识信息及其对应的疾病属性信息。

所述第二确定模块312，可以用于根据所述药品标识信息查询预设结构化药品属性表，确定所述药品标识信息对应的药品属性信息，所述预设结构化药品属性表中存储有不同药品标识信息及其对应的药品属性信息。

进一步地，为了构建预设标识特征提取模型、预设属性特征提取和预设质控分析模型，所述装置还包括：构建单元36。

所述获取单元31，还可以用于获取各个历史患者病历中的历史疾病标识信息和历史药品标识信息，以及所述各个历史患者病历对应的质控分析结果。

所述确定单元34，还可以用于分别确定所述历史疾病标识信息对应的历史疾病属性信息和所述历史药品标识信息对应的历史药品属性信息。

所述确定单元34，还可以用于根据所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果，确定样本训练集。

所述构建单元36，可以用于利用预设神经网络算法对所述样本训练集进行训练，构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型。。

进一步地，为了构建任务一和任务二中的模型，所述构建单元36，包括：训练模块361和构建模块362。

所述确定单元34，具体可以用于将所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第一样本训练集；将所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第二样本训练集。

所述训练模块361，可以用于利用预设神经网络算法对所述第一样本训练集进行训练，构建所述预设标识特征提取模型、所述初步属性特征提取模型和所述预设质控分析模型。

所述构建模块362，可以用于根据所述第二样本训练集对所述初步属性特征提取模型进行训练，构建所述预设属性特征提取模型。

进一步地，为了对质控分析结果进行验证，所述装置还包括：检测单元37和验证单元38。

所述检测单元37，可以用于利用预设异常检测规则对所述疾病标识信息和所述药品标识信息进行异常检测，得到异常检测结果。

所述验证单元38，可以用于根据所述异常检测结果验证所述质控分析结果的准确性。

需要说明的是，本申请实施例提供的一种基于机器学习的药品质控分析装置所涉及各功能模块的其他相应描述，可以参考图1所示方法的对应描述，在此不再赘述。

基于上述如图1所示方法，相应的，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质可以是易失性，也可以是非易失性，其上存储有计算机程序，该程序被处理器执行时实现以下步骤：获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。

基于上述如图1所示方法和如图4所示装置的实施例，本申请实施例还提供了一种计算机设备的实体结构图，如图6所示，该计算机设备包括：处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序，其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤：获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。

通过本申请的技术方案，本申请在使用疾病名称和药品名称的基础上，引入疾病属性信息和药品属性信息，通过提取疾病名称和药品名称共同对应的标识特征向量，以及疾病属性信息和药品属性信息共同对应的属性特征向量，并将提取的标识特征向量和属性特征向量相结合，扩展了机器学习模型的特征空间，使机器学习模型能够获取更多的特征信息，提高了模型的质控分析精度，此外，本申请通过采用预设标识特征提取模型、预设属性特征提取模型和预设质控分析模型，解决了同时处理结构化数据和非结构化数据的问题，提高了模型对数据的可兼容性，与此同时，本申请采集多任务相结合的质控分析，当任务一模型不支持疾病标识信息或药品标识信息时，调用任务二模型，利用疾病属性信息和药品属性信息分析推导患者用药的合理性，由此该模型不仅能够对支持的数据进行精确分析，还能够利用疾病属性信息和药品属性信息对不支持的数据进行精确分析，提高了模型的分析范围和扩展性。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种基于机器学习的药品质控分析方法，其中，包括：

获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；

将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；

将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；

根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。
根据权利要求1所述的方法，其中，所述根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果，包括：

将所述标识特征向量和所述属性特征向量进行合并，得到合并后的特征向量；

将合并后的特征向量输入至预设质控分析模型进行质控分析，得到所述患者病历中药品的质控分析结果。
根据权利要求1所述的方法，其中，在所述分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息之后，所述方法还包括：

若所述预设标识特征提取模型不支持所述疾病标识信息或所述药品标识信息，则将所述疾病属性信息和所述药品属性信息输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量，并根据所述属性特征向量确定所述患者病历中药品的质控分析结果；

若所述预设标识特征提取模型支持所述疾病标识信息和所述药品标识信息，则触发所述将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量的步骤。
根据权利要求1所述的方法，其中，所述分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息，包括：

根据所述疾病标识信息查询预设结构化疾病属性表，确定所述疾病标识信息对应的疾病属性信息，所述预设结构化疾病属性表中存储有不同疾病标识信息及其对应的疾病属性信息；

根据所述药品标识信息查询预设结构化药品属性表，确定所述药品标识信息对应的药品属性信息，所述预设结构化药品属性表中存储有不同药品标识信息及其对应的药品属性信息。
根据权利要求2所述的方法，其中，在所述获取患者病历中的疾病标识信息和药品标识信息之前，所述方法还包括：

获取各个历史患者病历中的历史疾病标识信息和历史药品标识信息，以及所述各个历史患者病历对应的质控分析结果；

分别确定所述历史疾病标识信息对应的历史疾病属性信息和所述历史药品标识信息对应的历史药品属性信息；

根据所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果，确定样本训练集；

利用预设神经网络算法对所述样本训练集进行训练，构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型。
根据权利要求5所述的方法，其中，所述样本训练集包括第一样本训练集和第二样本训练集，所述根据所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果，确定样本训练集，包括：

将所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第一样本训练集；

将所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第二样本训练集；

所述利用预设神经网络算法对所述样本训练集进行训练，构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型，包括：

利用预设神经网络算法对所述第一样本训练集进行训练，构建所述预设标识特征提取模型、所述初步属性特征提取模型和所述预设质控分析模型；

根据所述第二样本训练集对所述初步属性特征提取模型进行训练，构建所述预设属性特征提取模型。
根据权利要求1-6任一项所述的方法，其中，在所述根据所述第一特征向量和所述第二特征向量确定所述患者病历中药品的质控分析结果之后，所述方法还包括：

利用预设异常检测规则对所述疾病标识信息和所述药品标识信息进行异常检测，得到异常检测结果；

根据所述异常检测结果验证所述质控分析结果的准确性。
一种基于机器学习的药品质控分析装置，其中，包括：

获取单元，用于获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；

第一提取单元，用于将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；

第二提取单元，用于将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；

确定单元，用于根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；

将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；

将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；

根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。
根据权利要求9所述的计算机设备，其中，所述根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果，包括：

将所述标识特征向量和所述属性特征向量进行合并，得到合并后的特征向量；

将合并后的特征向量输入至预设质控分析模型进行质控分析，得到所述患者病历中药品的质控分析结果。
根据权利要求9所述的计算机设备，其中，在所述分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息之后，所述计算机程序被处理器执行时还实现如下步骤：

若所述预设标识特征提取模型不支持所述疾病标识信息或所述药品标识信息，则将所述疾病属性信息和所述药品属性信息输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量，并根据所述属性特征向量确定所述患者病历中药品的质控分析结果；

若所述预设标识特征提取模型支持所述疾病标识信息和所述药品标识信息，则触发所述将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量的步骤。
根据权利要求9所述的计算机设备，其中，所述分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息，包括：

根据所述疾病标识信息查询预设结构化疾病属性表，确定所述疾病标识信息对应的疾病属性信息，所述预设结构化疾病属性表中存储有不同疾病标识信息及其对应的疾病属性信息；

根据所述药品标识信息查询预设结构化药品属性表，确定所述药品标识信息对应的药品属性信息，所述预设结构化药品属性表中存储有不同药品标识信息及其对应的药品属性信息。
根据权利要求10所述的计算机设备，其中，在所述获取患者病历中的疾病标识信息和药品标识信息之前，所述计算机程序被处理器执行时还实现如下步骤：

获取各个历史患者病历中的历史疾病标识信息和历史药品标识信息，以及所述各个历史患者病历对应的质控分析结果；

分别确定所述历史疾病标识信息对应的历史疾病属性信息和所述历史药品标识信息对应的历史药品属性信息；

根据所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果，确定样本训练集；

利用预设神经网络算法对所述样本训练集进行训练，构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型。
根据权利要求12所述的计算机设备，其中，所述样本训练集包括第一样本训练集和第二样本训练集，所述根据所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果，确定样本训练集，包括：

将所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第一样本训练集；

将所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果作为第二样本训练集；

所述利用预设神经网络算法对所述样本训练集进行训练，构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型，包括：

利用预设神经网络算法对所述第一样本训练集进行训练，构建所述预设标识特征提取模型、所述初步属性特征提取模型和所述预设质控分析模型；

根据所述第二样本训练集对所述初步属性特征提取模型进行训练，构建所述预设属性特征提取模型。
根据权利要求9-14任一项所述的计算机设备，其中，在所述根据所述第一特征向量和所述第二特征向量确定所述患者病历中药品的质控分析结果之后，所述计算机程序被处理器执行时还实现如下步骤：

利用预设异常检测规则对所述疾病标识信息和所述药品标识信息进行异常检测，得到异常检测结果；

根据所述异常检测结果验证所述质控分析结果的准确性。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

获取患者病历中的疾病标识信息和药品标识信息，并分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息；

将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量；

将所述疾病属性信息和所述药品属性信息特征输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量；

根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果。
根据权利要求16所述的计算机可读存储介质，其中，所述根据所述标识特征向量和所述属性特征向量确定所述患者病历中药品的质控分析结果，包括：

将所述标识特征向量和所述属性特征向量进行合并，得到合并后的特征向量；

将合并后的特征向量输入至预设质控分析模型进行质控分析，得到所述患者病历中药品的质控分析结果。
根据权利要求16所述的计算机可读存储介质，其中，在所述分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息之后，所述计算机程序被处理器执行时还实现如下步骤：

若所述预设标识特征提取模型不支持所述疾病标识信息或所述药品标识信息，则将所述疾病属性信息和所述药品属性信息输入至预设属性特征提取模型进行特征提取，得到所述疾病属性信息和所述药品属性信息共同对应的属性特征向量，并根据所述属性特征向量确定所述患者病历中药品的质控分析结果；

若所述预设标识特征提取模型支持所述疾病标识信息和所述药品标识信息，则触发所述将所述疾病标识信息和所述药品标识信息输入至预设标识特征提取模型进行特征提取，得到所述疾病标识信息和所述药品标识信息共同对应的标识特征向量的步骤。
根据权利要求16所述的计算机可读存储介质，其中，所述分别确定所述疾病标识信息对应的疾病属性信息和所述药品标识信息对应的药品属性信息，包括：

根据所述疾病标识信息查询预设结构化疾病属性表，确定所述疾病标识信息对应的疾病属性信息，所述预设结构化疾病属性表中存储有不同疾病标识信息及其对应的疾病属性信息；

根据所述药品标识信息查询预设结构化药品属性表，确定所述药品标识信息对应的药品属性信息，所述预设结构化药品属性表中存储有不同药品标识信息及其对应的药品属性信息。
根据权利要求17所述的计算机可读存储介质，其中，在所述获取患者病历中的疾病标识信息和药品标识信息之前，所述计算机程序被处理器执行时还实现如下步骤：

获取各个历史患者病历中的历史疾病标识信息和历史药品标识信息，以及所述各个历史患者病历对应的质控分析结果；

分别确定所述历史疾病标识信息对应的历史疾病属性信息和所述历史药品标识信息对应的历史药品属性信息；

根据所述历史疾病标识信息、所述历史药品标识信息、所述历史疾病属性信息、所述历史药品属性信息和所述质控分析结果，确定样本训练集；

利用预设神经网络算法对所述样本训练集进行训练，构建所述预设标识特征提取模型、所述预设属性特征提取模型和所述预设质控分析模型。