WO2022062353A1

WO2022062353A1 - 医疗数据处理方法、装置、计算机设备和存储介质

Info

Publication number: WO2022062353A1
Application number: PCT/CN2021/084350
Authority: WO
Inventors: 陈思彤; 王垂新; 赵建双
Original assignee: 康键信息技术（深圳）有限公司
Priority date: 2020-09-23
Filing date: 2021-03-31
Publication date: 2022-03-31
Also published as: CN112151141A

Abstract

一种医疗数据处理方法、装置、计算机设备和存储介质，涉及大数据技术领域，所述方法包括：获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识（S202）；基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量（S204）；根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标（S206）；获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品（S208）。所述方法能够提升药品推荐的智能化水平。此外，还涉及区块链技术，医疗数据、所述医学实体向量空间以及各相关性指标均可存储于区块链中。

Description

医疗数据处理方法、装置、计算机设备和存储介质

本申请要求于2020年9月23日提交中国专利局、申请号为CN2020110096383，发明名称为“医疗数据处理方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及大数据技术领域，特别是涉及一种医疗数据处理方法、装置、计算机设备和存储介质。

背景技术

随着线的上问诊系统的发展，根据医生的线上问诊结果自动进行药品的推荐是现阶段医疗领域技术发展的趋向。

传统方式中，在医生给出诊断结果后，通常是通过历史开药数据的统计结果向患者推荐对应的药品，例如，针对诊断结果中确定的目标疾病，向用户推荐历史开药数据中对应该目标疾病的药品。

但是，在该种方式中，发明人意识到推荐的药品通常为历史开药数据中对应该目标疾病的所有的药品，还需要医生重新人工进行筛选后再进行推荐，从而使得药品推荐过程不够智能化，处理效率较低。

发明内容

一种医疗数据处理方法，所述方法包括：

获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识；

基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量；

根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标；

获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。

一种医疗数据处理装置，所述装置包括：

待处理医疗数据获取模块，用于获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识；

查询模块，用于基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量；

相关性指标确定模块，拥有根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标；

目标药品确定模块，用于获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

本申请可以提升药品推荐的准确性。

附图说明

图1为一个实施例中医疗数据处理方法的应用场景图；

图2为一个实施例中医疗数据处理方法的流程示意图；

图3为另一个实施例中医疗数据处理方法的流程示意图；

图4为一个实施例中医疗数据处理装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的医疗数据处理方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。医生通过终端102输入待处理医疗数据，并发送至服务器104，待处理医疗数据包括目标疾病的疾病标识。服务器104在获取到待处理医疗数据后，可以基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量。进一步，服务器104根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标，然后获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种医疗数据处理方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S202，获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识。

其中，待处理医疗数据是指医生进行问诊后所生成的数据，例如，可以是线上问诊结果数据等。在本实施例中，医疗数据中可以包括问诊的目标疾病以及对应该目标疾病的症状等。

在本实施例中，待处理医疗数据还可以包括对应目标疾病的疾病标识，例如，疾病名称或者是线上问诊系统中对应该目标疾病的唯一疾病ID(Identity document)等标识，如糖尿病对应唯一标识ID为TNB01等。

在本实施例中，待处理医疗数据可以是医生基于自身诊断经验直接输入至线上问诊系统的数据，或者也可以是在线上问诊系统中筛选对应的疾病症状后线上问诊系统根据大数据统计的结果或者是预先配置的结果自动得到的医疗数据。

具体地，当待处理医疗数据为线上问诊系统基于大数据统计的结果或者是预先配置的结果自动生成时，线上问诊系统可以在生成最终医疗数据之前，先发送结果确认请求至终端，以请求医生确定待处理医疗数据是否有误，并在医生确定无误后输出。

步骤S204，基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量。

其中，知识图谱是指包括疾病、症状、药品以及三者之间对应关系的图谱，知识图谱关联了不同的疾病、对应的症状以及开具过的对应的药品之间的对应关系。

标准向量空间包括多个对应疾病、药品的特征向量，各特征向量体现了疾病与药品之间的关系。具体地，标准向量空间可以是指医学实体向量空间。

在本实施例中，服务器可以预先构建医学实体向量空间，并根据诊断结果中对应的疾病标识，从医学实体向量空间中查找到对应目标疾病的疾病特征向量以及对应的初始药品的药品特征向量。

在本实施例中，服务器查到对应目标疾病的初始药品可以是多个，例如，对于糖尿病，查找到对应的药品特征向量可以包括药瓶A、药品B以及药品C等多个初始药品的药品特征向量。

步骤S206，根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标。

其中，相关性指标是指药品与疾病之间关联关系的指标，指标值越高，药品与疾病之间越相关，药品越适用于该疾病。

在本实施例中，服务器在获取到疾病特征向量以及所述多个初始药品的药品特征向量，可以通过Cosine相似度计算等方式，分别计算目标疾病的疾病特征向量以及多个初始药品的药品特征向量的相关性指标。具体地，Cosine计算公式可以如下公式(1)所示：

其中，E _疾病表示疾病特征向量，E _药品表示各初始药品的药品特征向量，S表示相关性指标。

步骤S208，获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。

其中，预设条件为预先设置的最终相关性指标的筛选条件，例如，指标值最高或者最低等条件。

在本实施例中，服务器可以对计算得到的多个初始药品对应的相关性指标进行排序，并从排序后的相关性指标中确定指标值最高的初始药品为对应目标疾病的目标药品，并推荐至终端，以通过终端反馈至医生。

在本实施例中，服务器最终推荐至终端的目标药品也可以是多个，例如，对应同一目标疾病配合使用的多个目标药品等。

具体地，服务器还可以计算各初始药品之间的相关性，然后推荐存在强相关性的多个初始药品至终端。

上述医疗数据处理方法中，通过获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识，然后基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量，进一步根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标，并获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。从而，使得目标药品基于预先构建的医学实体向量空间得到的特征向量计算得到的相关性确定，相比于直接根据统计结果进行药品的推荐，减少了人工的参与量，提升了药品推荐的智能化水平，进而可以提升数据处理的效率。并且，由于医学实体向量空间基于疾病、症状以及药品之间对应关系的知识图谱生成，可以使得构建的医学实体向量空间体现了疾病、症状以及药品之间的关联信息，进而基于医学实体向量空间得到的特征向量进行药品推荐的时候，可以提升药品推荐的准确性。

在其中一个实施例中，标准向量空间的生成方式可以包括：获取对应疾病、症状以及药品之间关联关系的知识图谱；通过图神经网络模型对知识图谱进行特征提取，得到对应知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各疾病特征向量以及各药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。

在本实施例中，服务器可以获取与疾病、症状以及药品相关的数据，并基于获取的数据生成知识图谱。

在本实施例中，服务器在得到知识图谱后，可以通过多关系图神经网络模型进行知识图谱上的疾病、药品、症状之间对应关系的提取，例如，分别提取出各疾病对应的症状以及药品之间的特征数据，并基于提取到的特征数据生成对应各疾病以及各药品的特征向量，即生成医学实体向量空间。

在本实施例中，图神经网络模型可以基于人工智能预先训练完成的模型。具体地，服务器可以以线上问答系统数据库中存储的历史问诊数据作为训练集数据，并生成训练集知识图谱。

进一步，服务器对知识图谱进行标注，得到标注后的训练集知识图谱。

进一步，服务器将通过训练集知识图谱输入构建的初始图神经网络模型中，并进行特征的提取以及生成对应的特征向量，以对初始图神经网络模型进行训练。

在本实施例中，在图神经网络模型的训练过程中，服务器可以将得到的医学实体向量空间中各特征向量确定的疾病、症状以及药品之间的对应关系与训练集数据中疾病、症状以及药品之间的对应关系进行比较，并进行损失值的计算。

在本实施例中，服务器可以通过定义二元交叉熵损失函数进行模型损失值的计算，二元交叉熵损失函数公式如公式(2)所示：

其中，y表示输入模型的数据，

表示模型输出的结果。

在本实施例中，服务器可以基于计算得到的损失值对初始图神经网络模型的模型参数进行更新，并对初始图神经网络模型进行迭代处理，以得到训练完成的图神经网络模型。

上述实施例中，获取疾病、症状以及药品之间对应关系的知识图谱，然后通过图神经网络模型进行特征的提取，并构建医学实体向量空间，从而，图神经网络模型可以将非量化的图谱数据进行量化处理，便于后续相似性的计算，可以提升数据处理的效率。

在其中一个实施例中，获取对应疾病、症状以及药品之间关联关系的知识图谱，可以包括：获取预设的医疗问诊数据；从线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据；对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据；基于标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。

其中，医疗问诊数据是指医生以及病人用户的线上问诊数据，可以包括问诊对话以及医生基于线上问诊最终生成的问诊处方。

在本实施例中，服务器可以从线上问诊系统的历史数据中获取线上问诊数据，然后根据预设的关键词从线上问诊数据中提取出目标数据，例如根据预设的疾病名称、疾病症状以及药品名称等，提取出包含疾病、症状以及药品的目标数据。

进一步，服务器可以对提取的目标数据进行标准化数据，例如，对疾病名称、药品名称以及数据之间的格式等进行标准化数据，生成标准化数据后的目标数据。

在本实施例中，服务器在得到标准化的目标数据后，可以基于标准化的目标数据，建立各疾病、对应的各症状以及对应的各药品之间对应关系的知识图谱。

上述实施例中，通过获取医疗问诊数据并构建知识图谱，使得知识图谱的构建基于实际的问诊数据生成，可以使得知识图谱的构建具备实践依据，提升构建的知识图谱的准确性。

在其中一个实施例中，对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据，可以包括：获取医学标准数据库；基于预设关键字，从初始目标数据中提取出待转换的待转换数据；通过医学标准数据库对待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。

其中，医学标准化数据库是指基于行业标准出创建的数据库，数据库中记载了各疾病的标准名称以及医生在实际应用的所用的通用名称之间的对应关系，以及药品的标准名称以及医生在实际应用的所用的通用名称之间的对应关系。例如，对于医生常用的药品名称“安莫西林”或“安默西林”，其标准药品名称为“阿莫西林”等，则医学标准化数据库可以存储有标准药品名称“阿莫西林”与非标准名称“安莫西林”或“安默西林”之间的对应关系。

在本实施例中，服务器可以根据医疗标准数据库对目标数据中对应的关键字进行标准转换，以得到标准化后的目标数据。

在本实施例中，对于某些关键字，在医疗标准数据库中可能不存在对应的标准数据或者不存在对应的关系，则可以通过人工手动的方式进行判定并进行关系的建立，关联对应的标准化数据。例如，当医疗标准数据库中存在对应的标准化数据时，则服务器可以基于接收的关联指示，将非标准化的关键字添加至对应标准化数据后，从而建立对应关系。当医疗标准数据库中不存在对应的标准化数据时，则服务器可以接收终端发送的标准化数据添加指令，以添加对应的标准化数据，并将对应的关键字添加至对应的标准化数据后，建立对应关系。

上述实施例中，通过基于获取的医疗标准数据库，并进行关键字的转换，从而得到标准化的目标数据，从而可以使得目标数据基于医疗标准数据库转换生成，使得标准化处理后的目标数据按照同一标准生成，提升后续知识图谱建立的准确性，进而提升目标药品推荐的准确性。

在其中一个实施例中，根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标之后，还可以包括：获取对应目标疾病的开药数据；根据开药数据，确定对应各初始药品的权重指标；基于各初始药品的权重指标以及相关性指标，得到对应各初始药品的最终相关性指标。

在本实施例中，服务器可以获取医生的对该目标疾病的开药数据，例如开药处方等，并根据获取的该开药数据，生成对应各初始药品的权重指标。

进一步，服务器可以根据各初始药品的权重指标以及相关性指标，得到对应各初始药品的最终相关性指标。

在本实施例中，服务器也可以将各初始药品的权重指标以及对应各初始药品的相关性指标进行相乘处理，生成对应各初始药品的最终相关性指标。

在本实施例中，获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品，可以包括：获取满足预设条件的最终相关性指标所对应的初始药品为对应目标疾病的目标药品。

如前所述，预设条件为预先设置的最终相关性指标的筛选条件，例如，指标值最高或者最低等条件。

具体地，服务器可以根据确定的最终相关性指标，从多个初始药品中确定指标值最高的一个或者多个初始药品为对应目标疾病的目标药品，并推荐至终端。

在本实施例中，继续参考图3，服务器可以根据计算的最终相关性指标，对多个初始药品进行排序，得到排序后的多个初始药品。然后服务器从排序后的各初始药品中筛选出对应目标疾病的目标药品。

上述实施例中，通过结合开药数据，并生成对应的权重指标，然后基于相关性指标以及权重指标，生成对应各初始药品的最终相关性指标并进行目标药品的确定以及推荐，从而可以使得药品的推荐结合实际的开药数据，可以提升药品推荐的准确性。

在其中一个实施例中，上述方法还可以包括：获取对数据库的更新数据，更新数据中包括目标疾病与各药品之间的对应关系；根据更新数据，检测是否存在对应目标疾病的新增药品；当检测到存在对应目标疾病的新增药品时，则对更新数据中目标疾病与新增药品之间的对应关系的出现频次进行统计，并在出现频次大于预设阈值时，基于目标疾病与新增药品之间的对应关系，对知识图谱进行更新。

其中，更新数据是指获取的线上实时开药数据。在本实施例中，服务器在获取到线上实时开药数据时，通过获取的线上实时开药数据，对数据库进行更新，例如，对某一疾病所使用的药品进行更新。

具体地，根据更新数据对数据库进行更新可以是指增加、删除或者是更改等，例如，对于某一疾病，增加新的药品，或者删除已经对应存在的药品，或者是更改已经对应存在的药品等。

在本实施例中，服务器也可以根据获取的更新数据，以进行实时检测，确定是否存在对应目标疾病的新增药品。

本领域技术人员可以理解的是，此处所述新增药品是指在已有开药历史中，未对应于该目标疾病的药品，即该新增药品未用于治疗该目标疾病。

在本实施例中，当服务器检测到更新数据中存在对应该目标疾病的新增药品时，则可以对该新增药品对应于该目标疾病的出现频次进行统计，例如，实时统计该新增药品应用于该目标疾病的次数。

进一步，服务器可以基于预设阈值对该新增药品对该出现频次进行判定，以确定对于该目标疾病该新增药品的用药方式是否达到统计学意义。

在本实施例中，当服务器确定目标疾病与新增药品之间的对应关系的出现频次大于预设阈值时，即确定该新增药品用于该目标疾病并非偶然原因时，则服务器可以确定该新增药品为治疗该目标疾病的新的药品，继续参考图3，服务器可以基于目标疾病与新增药品之间的对应关系，对知识图谱进行更新。

在本实施例中，服务器也可以对知识图谱中各药品以及对应的各疾病之间的关联关系进行实时统计，当确定某一药品长时间未用于治疗某一疾病时，也可以对知识图谱进行更新，使得得到的知识图谱更加准确。

上述实施例中，通过结合更新数据，对知识图谱进行更新，从而使得知识图谱集合线上实时开药数据生成，提升知识图谱的准确性，进而可以提升目标药品确定的准确性，以提升推荐的准确性。

在其中一个实施例中，上述方法还可以包括：将医疗数据、医学实体向量空间以及各相关性指标中的至少一个上传至区块链，并存储至区块链的节点中。

其中，区块链是指分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Block chain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。

具体地，区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

在本实施例中，服务器可以将医疗数据、医学实体向量空间以及各相关性指标中的一个或者多个数据上传并存储于区块链的节点中，以保证数据的私密性和安全性。

上述实施例中，通过将医疗数据、医学实体向量空间以及各相关性指标中至少一个上传至区块链并存储于区块链的节点中，从而可以保障存储至区块链节点中数据的私密性，可以提升数据的安全性。

应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种医疗数据处理装置，包括：待处理医疗数据获取模块100、查询模块200、相关性指标确定模块300和目标药品确定模块400，其中：

待处理医疗数据获取模块100，用于获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识。

查询模块200，用于基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量。

相关性指标确定模块300，拥有根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标。

目标药品确定模块400，用于获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。

在其中一个实施例中，上述装置还可以包括：

标准向量空间生成模块，用于生成标准向量空间的生成。

在本实例中，标准向量空间生成模块可以包括：

知识图谱获取子模块，用于获取对应疾病、症状以及药品之间关联关系的知识图谱。

特征提取子模块，用于通过图神经网络模型对知识图谱进行特征提取，得到对应知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各疾病特征向量以及各药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。

在其中一个实施例中，知识图谱获取子模块可以包括：

医疗问诊数据获取单元，用于获取预设的医疗问诊数据。

数据提取单元，用于从线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据。

标准化预处理单元，用于对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据。

知识图谱建立单元，用于基于标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。

在其中一个实施例中，标准化预处理单元可以包括：

医学标准数据库获取子单元，用于获取医学标准数据库。

待转换数据提取子单元，用于基于预设关键字，从初始目标数据中提取出待转换的待转换数据。

标准化预处理转换子单元，用于通过医学标准数据库对待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。

在其中一个实施例中，上述装置还可以包括：

开药数据获取模块，用于相关性指标确定模块300根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标之后，获取对应目标疾病的开药数据。

权重指标确定模块，用于根据开药数据，确定对应各初始药品的权重指标。

最终相关性指标确定模块，用于基于各初始药品的权重指标以及相关性指标，得到对应各初始药品的最终相关性指标。

在本实施例中，目标药品确定模块400用于获取满足预设条件的最终相关性指标所对应的初始药品为对应目标疾病的目标药品。

在其中一个实施例中，上述装置还可以包括：

更细数据获取模块，用于获取对数据库的更新数据，更新数据中包括目标疾病与各药品之间的对应关系。

检测模块，用于根据更新数据，检测是否存在对应目标疾病的新增药品。

知识图谱更新模块，用于当检测到存在对应目标疾病的新增药品时，则对更新数据中目标疾病与新增药品之间的对应关系的出现频次进行统计，并在出现频次大于预设阈值时，基于目标疾病与新增药品之间的对应关系，对知识图谱进行更新。

在其中一个实施例中，上述装置还可以包括：

存储模块，用于将医疗数据、医学实体向量空间以及各相关性指标中的至少一个上传至区块链，并存储至区块链的节点中。

关于医疗数据处理装置的具体限定可以参见上文中对于医疗数据处理方法的限定，在此不再赘述。上述医疗数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医疗数据、医学实体向量空间以及各相关性指标等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医疗数据处理方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识；基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量；根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标；获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。

在其中一个实施例中，处理器执行计算机程序时实现标准向量空间的生成方式可以包括：获取对应疾病、症状以及药品之间关联关系的知识图谱；通过图神经网络模型对知识图谱进行特征提取，得到对应知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各疾病特征向量以及各药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。

在其中一个实施例中，处理器执行计算机程序时实现获取对应疾病、症状以及药品之间关联关系的知识图谱，可以包括：获取预设的医疗问诊数据；从线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据；对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据；基于标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。

在其中一个实施例中，处理器执行计算机程序时实现对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据，可以包括：获取医学标准数据库；基于预设关键字，从初始目标数据中提取出待转换的待转换数据；通过医学标准数据库对待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。

在其中一个实施例中，处理器执行计算机程序时实现根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标之后，还可以实现以下步骤包括：获取对应目标疾病的开药数据；根据开药数据，确定对应各初始药品的权重指标；基于各初始药品的权重指标以及相关性指标，得到对应各初始药品的最终相关性指标。

在本实施例中，处理器执行计算机程序时实现获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品，可以包括：获取满足预设条件的最终相关性指标所对应的初始药品为对应目标疾病的目标药品。

在其中一个实施例中，处理器执行计算机程序时还可以实现以下步骤：获取对数据库的更新数据，更新数据中包括目标疾病与各药品之间的对应关系；根据更新数据，检测是否存在对应目标疾病的新增药品；当检测到存在对应目标疾病的新增药品时，则对更新数据中目标疾病与新增药品之间的对应关系的出现频次进行统计，并在出现频次大于预设阈值时，基于目标疾病与新增药品之间的对应关系，对知识图谱进行更新。

在其中一个实施例中，处理器执行计算机程序时还可以实现以下步骤：将医疗数据、医学实体向量空间以及各相关性指标中的至少一个上传至区块链，并存储至区块链的节点中。

在一个实施例中，提供了一种计算机可读存储介质，计算机可读存储介质可以是易失性的，也可以是非易失性的，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识；基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量；根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标；获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。

在其中一个实施例中，计算机程序被处理器执行时实现标准向量空间的生成方式可以包括：获取对应疾病、症状以及药品之间关联关系的知识图谱；通过图神经网络模型对知识图谱进行特征提取，得到对应知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各疾病特征向量以及各药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。

在其中一个实施例中，计算机程序被处理器执行时实现获取对应疾病、症状以及药品之间关联关系的知识图谱，可以包括：获取预设的医疗问诊数据；从线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据；对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据；基于标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。

在其中一个实施例中，计算机程序被处理器执行时实现对初始目标数据进行标准化预处理，得到标准化预处理后的目标数据，可以包括：获取医学标准数据库；基于预设关键字，从初始目标数据中提取出待转换的待转换数据；通过医学标准数据库对待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。

在其中一个实施例中，计算机程序被处理器执行时实现根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标之后，还可以实现以下步骤包括：获取对应目标疾病的开药数据；根据开药数据，确定对应各初始药品的权重指标；基于各初始药品的权重指标以及相关性指标，得到对应各初始药品的最终相关性指标。

在本实施例中，计算机程序被处理器执行时实现获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品，可以包括：获取满足预设条件的最终相关性指标所对应的初始药品为对应目标疾病的目标药品。

在其中一个实施例中，计算机程序被处理器执行时还可以实现以下步骤：获取对数据库的更新数据，更新数据中包括目标疾病与各药品之间的对应关系；根据更新数据，检测是否存在对应目标疾病的新增药品；当检测到存在对应目标疾病的新增药品时，则对更新数据中目标疾病与新增药品之间的对应关系的出现频次进行统计，并在出现频次大于预设阈值时，基于目标疾病与新增药品之间的对应关系，对知识图谱进行更新。

在其中一个实施例中，计算机程序被处理器执行时还可以实现以下步骤：将医疗数据、医学实体向量空间以及各相关性指标中的至少一个上传至区块链，并存储至区块链的节点中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种医疗数据处理方法，其中，所述方法包括：

获取待处理医疗数据，所述待处理医疗数据包括目标疾病的疾病标识；

基于所述疾病标识，对标准向量空间进行查询，确定对应所述目标疾病的疾病特征向量以及对应所述目标疾病的多个初始药品的药品特征向量，所述标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，所述标准向量空间包括对应所述知识图谱中各疾病以及各药品的特征向量；

根据所述疾病特征向量以及对应的多个药品特征向量，确定所述目标疾病与各所述初始药品的相关性指标；

获取满足预设条件的相关性指标所对应的初始药品为对应所述目标疾病的目标药品。
根据权利要求1所述的方法，其中，所述标准向量空间的生成方式包括：

获取对应疾病、症状以及药品之间关联关系的知识图谱；

通过图神经网络模型对所述知识图谱进行特征提取，得到对应所述知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各所述疾病特征向量以及各所述药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。
根据权利要求2所述的方法，其中，所述获取对应疾病、症状以及药品之间关联关系的知识图谱，包括：

获取预设的医疗问诊数据；

从所述线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据；

对所述初始目标数据进行标准化预处理，得到标准化预处理后的目标数据；

基于所述标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。
根据权利要求3所述的方法，其中，所述对所述初始目标数据进行标准化预处理，得到标准化预处理后的目标数据，包括：

获取医学标准数据库；

基于预设关键字，从所述初始目标数据中提取出待转换的待转换数据；

通过所述医学标准数据库对所述待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。
根据权利要求1至4任一项所述的方法，其中，所述根据所述疾病特征向量以及对应的多个药品特征向量，确定所述目标疾病与各所述初始药品的相关性指标之后，还包括：

获取对应所述目标疾病的开药数据；

根据所述开药数据，确定对应各所述初始药品的权重指标；

基于各所述初始药品的权重指标以及相关性指标，得到对应各所述初始药品的最终相关性指标；

所述获取满足预设条件的相关性指标所对应的初始药品为对应所述目标疾病的目标药品，包括：

获取满足预设条件的最终相关性指标所对应的初始药品为对应所述目标疾病的目标药品。
根据权利要求1至4任一项所述的方法，其中，还包括：

获取对数据库的更新数据，所述更新数据中包括目标疾病与各药品之间的对应关系；

根据所述更新数据，检测是否存在对应所述目标疾病的新增药品；

当检测到存在对应所述目标疾病的新增药品时，则对所述更新数据中所述目标疾病与所述新增药品之间的对应关系的出现频次进行统计，并在所述出现频次大于预设阈值时，基于所述目标疾病与所述新增药品之间的对应关系，对所述知识图谱进行更新。
根据权利要求1至4任一项所述的方法，其中，所述方法还包括：

将所述医疗数据、所述医学实体向量空间以及各所述相关性指标中的至少一个上传至区块链，并存储至区块链的节点中。
一种医疗数据处理装置，其中，所述装置包括：

待处理医疗数据获取模块，用于获取待处理医疗数据，所述待处理医疗数据包括目标疾病的疾病标识；

查询模块，用于基于所述疾病标识，对标准向量空间进行查询，确定对应所述目标疾病的疾病特征向量以及对应所述目标疾病的多个初始药品的药品特征向量，所述标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，所述标准向量空间包括对应所述知识图谱中各疾病以及各药品的特征向量；

相关性指标确定模块，拥有根据所述疾病特征向量以及对应的多个药品特征向量，确定所述目标疾病与各所述初始药品的相关性指标；

目标药品确定模块，用于获取满足预设条件的相关性指标所对应的初始药品为对应所述目标疾病的目标药品。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现如下步骤：

获取待处理医疗数据，待处理医疗数据包括目标疾病的疾病标识；

基于疾病标识，对标准向量空间进行查询，确定对应目标疾病的疾病特征向量以及对应目标疾病的多个初始药品的药品特征向量，标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，标准向量空间包括对应知识图谱中各疾病以及各药品的特征向量；

根据疾病特征向量以及对应的多个药品特征向量，确定目标疾病与各初始药品的相关性指标；

获取满足预设条件的相关性指标所对应的初始药品为对应目标疾病的目标药品。
根据权利要求9所述的计算机设备，其中，所述标准向量空间的生成方式包括：

获取对应疾病、症状以及药品之间关联关系的知识图谱；

通过图神经网络模型对所述知识图谱进行特征提取，得到对应所述知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各所述疾病特征向量以及各所述药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。
根据权利要求10所述的计算机设备，其中，所述获取对应疾病、症状以及药品之间关联关系的知识图谱，包括：

获取预设的医疗问诊数据；

从所述线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据；

对所述初始目标数据进行标准化预处理，得到标准化预处理后的目标数据；

基于所述标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。
根据权利要求11所述的计算机设备，其中，所述对所述初始目标数据进行标准化预处理，得到标准化预处理后的目标数据，包括：

获取医学标准数据库；

基于预设关键字，从所述初始目标数据中提取出待转换的待转换数据；

通过所述医学标准数据库对所述待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。
根据权利要求9至12任一项所述的计算机设备，其中，所述根据所述疾病特征向量以及对应的多个药品特征向量，确定所述目标疾病与各所述初始药品的相关性指标之后，所述处理器执行所述计算机程序时还实现如下步骤：

获取对应所述目标疾病的开药数据；

根据所述开药数据，确定对应各所述初始药品的权重指标；

基于各所述初始药品的权重指标以及相关性指标，得到对应各所述初始药品的最终相关性指标；

所述获取满足预设条件的相关性指标所对应的初始药品为对应所述目标疾病的目标药品，包括：

获取满足预设条件的最终相关性指标所对应的初始药品为对应所述目标疾病的目标药品。
根据权利要求9至12任一项所述的计算机设备，其中，所述处理器执行所述计算机程序时还实现如下步骤：

获取对数据库的更新数据，所述更新数据中包括目标疾病与各药品之间的对应关系；

根据所述更新数据，检测是否存在对应所述目标疾病的新增药品；

当检测到存在对应所述目标疾病的新增药品时，则对所述更新数据中所述目标疾病与所述新增药品之间的对应关系的出现频次进行统计，并在所述出现频次大于预设阈值时，基于所述目标疾病与所述新增药品之间的对应关系，对所述知识图谱进行更新。
根据权利要求9至12任一项所述的计算机设备，其中，所述处理器执行所述计算机程序时还实现如下步骤：

将所述医疗数据、所述医学实体向量空间以及各所述相关性指标中的至少一个上传至区块链，并存储至区块链的节点中。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

获取待处理医疗数据，所述待处理医疗数据包括目标疾病的疾病标识；

基于所述疾病标识，对标准向量空间进行查询，确定对应所述目标疾病的疾病特征向量以及对应所述目标疾病的多个初始药品的药品特征向量，所述标准向量空间基于疾病、症状以及药品之间关联关系的知识图谱生成，所述标准向量空间包括对应所述知识图谱中各疾病以及各药品的特征向量；

根据所述疾病特征向量以及对应的多个药品特征向量，确定所述目标疾病与各所述初始药品的相关性指标；

获取满足预设条件的相关性指标所对应的初始药品为对应所述目标疾病的目标药品。
根据权利要求16所述的计算机可读存储介质，其中，所述标准向量空间的生成方式包括：

获取对应疾病、症状以及药品之间关联关系的知识图谱；

通过图神经网络模型对所述知识图谱进行特征提取，得到对应所述知识图谱中各疾病的疾病特征向量以及对应各药品的药品特征向量，各所述疾病特征向量以及各所述药品特征向量中包括对应的疾病、症状以及药品之间的关联关系。
根据权利要求17所述的计算机可读存储介质，其中，所述获取对应疾病、症状以及药品之间关联关系的知识图谱，包括：

获取预设的医疗问诊数据；

从所述线上医疗问诊数据中提取出与疾病、症状以及药品相关的初始目标数据；

对所述初始目标数据进行标准化预处理，得到标准化预处理后的目标数据；

基于所述标准化预处理后的目标数据，建立疾病、症状以及药品之间关联关系的知识图谱。
根据权利要求18所述的计算机可读存储介质，其中，所述对所述初始目标数据进行标准化预处理，得到标准化预处理后的目标数据，包括：

获取医学标准数据库；

基于预设关键字，从所述初始目标数据中提取出待转换的待转换数据；

通过所述医学标准数据库对所述待转换数据进行标准化预处理转换，得到标准化预处理后的目标数据。
根据权利要求16至19任一项所述的计算机可读存储介质，其中，所述根据所述疾病特征向量以及对应的多个药品特征向量，确定所述目标疾病与各所述初始药品的相关性指标之后，所述计算机程序被处理器执行时还实现如下步骤：

获取对应所述目标疾病的开药数据；

根据所述开药数据，确定对应各所述初始药品的权重指标；

基于各所述初始药品的权重指标以及相关性指标，得到对应各所述初始药品的最终相关性指标；

所述获取满足预设条件的相关性指标所对应的初始药品为对应所述目标疾病的目标药品，包括：

获取满足预设条件的最终相关性指标所对应的初始药品为对应所述目标疾病的目标药品。