CN116936058A

CN116936058A - 一种基于深度学习及知识图谱的智能导诊方法及系统

Info

Publication number: CN116936058A
Application number: CN202311183936.8A
Authority: CN
Inventors: 姚尧; 李宇欣
Original assignee: Health Hope (beijing) Technology Co ltd
Current assignee: Health Hope (beijing) Technology Co ltd
Priority date: 2023-09-14
Filing date: 2023-09-14
Publication date: 2023-10-24

Abstract

本发明提供一种基于深度学习及知识图谱的智能导诊方法及系统，涉及医疗技术领域，包括获取用户的症状描述信息，并将所述症状描述信息转换为症状描述向量，基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体；将所述症状描述向量与所述医疗知识实体进行向量融合，确定融合向量，基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心；确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，对多个相似度计算结果按照从高到低的顺序进行排序，将相似度最高的科室作为目标科室，并在所述用户确定在所述目标科室挂号后，生成所述目标科室的路径导航和/或位置信息。

Description

一种基于深度学习及知识图谱的智能导诊方法及系统

技术领域

本发明涉及医疗技术领域，尤其涉及一种基于深度学习及知识图谱的智能导诊方法及系统。

背景技术

随着我国经济发展水平的不断提高，人们对医疗服务的要求也越来越高。传统的医疗服务已经不能满足人们快节奏的生活需求，因此医院的信息化建设至关重要。现代化医院应该采取先进的管理观念，结合先进的计算机技术，以提高病人的就诊体验和减轻医务人员的工作量，让医院能够更加专注于医疗服务质量的提升，从而更好地服务于社会。

对于大型综合性医院而言，医院都以专科为诊疗单元进行日常的诊疗工作。然而现状是，广大民众的医疗基本知识相对匮乏，导致很多患者在就诊时，往往不知道对应的挂号科室，继而导致医院挂号排队现象严重。虽然部分医院设置了专门的导诊服务，但数量有限且工作负荷较大，因而催生了二次排队现象。为此，有必要设计并实现一套智能导诊系统，以减少病人的窗口等待时间，缓解医院的三长一短现象。

发明内容

本发明实施例提供一种基于深度学习及知识图谱的智能导诊方法及系统，至少能够解决现有技术中的部分问题。

本发明实施例的第一方面，

提供一种基于深度学习及知识图谱的智能导诊方法，包括：

一种基于深度学习及知识图谱的智能导诊方法，其特征在于，包括：

获取用户的症状描述信息，并将所述症状描述信息转换为症状描述向量，基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体；

将所述症状描述向量与所述医疗知识实体进行向量融合，确定融合向量，基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心；

确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，对多个相似度计算结果按照从高到低的顺序进行排序，将相似度最高的科室作为目标科室，并在所述用户确定在所述目标科室挂号后，生成所述目标科室的路径导航和/或位置信息。

在一种可选的实施方式中，

所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括：

根据用户输入的症状描述向量，计算与导诊图谱中所有症状节点的相似度，选择与所述症状描述向量最相似的症状节点作为起始点；

从最相似的症状节点开始，通过所述导诊图谱中的边进行遍历，根据当前症状节点，查找与之关联的边，根据导诊策略，可以选择一个或多个边进行推进；

在导诊路径中，继续查找与当前节点关联的下一个节点，然后继续遍历与下一个节点相关的边，使用递归或循环来实现遍历导诊图谱，直到满足终止条件，确定与所述症状描述向量相匹配的医疗知识实体。

在一种可选的实施方式中，

所述方法还包括构建导诊图谱：

收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据，使用自然语言处理技术，将医学数据中的实体信息提取出来；

根据医学知识，建立疾病、症状和治疗方法之间的关系，并将三者之间的关系表示为图谱的边，用于连接不同的实体节点；

为每个实体添加属性，使用图数据库将实体、关系和属性构建成一个导诊图谱。

在一种可选的实施方式中，

所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心包括：

随机选择K个症状描述的相似度向量作为初始聚类中心，其中K为预设的聚类数目；

对每个相似度向量，计算其与各个聚类中心的距离，将其分配到距离最近的聚类中心所对应的簇；

对每个簇，迭代计算簇内所有相似度向量的平均值，将该平均值作为新的聚类中心，直到聚类中心不再发生变化或达到预设的迭代次数，确定多个聚类中心。

在一种可选的实施方式中，

所述确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，对多个相似度计算结果按照从高到低的顺序进行排序，将相似度最高的科室作为目标科室，并在所述用户确定在所述目标科室挂号后，生成所述目标科室的路径导航和/或位置信息包括：

将所述医疗知识实体中多个科室进行向量化，并对所述聚类中心和所述向量化后的科室进行向量对齐，保持向量维度一致；

通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，将每个聚类中心与所有科室的相似度结果按照从高到低排序；

根据排序后的相似度结果，选择相似度最高的科室作为目标科室，根据用户选择的目标科室，获取该科室的位置信息，通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。

本发明实施例的第二方面，

提供一种基于深度学习及知识图谱的智能导诊系统，包括：

第一单元，用于获取用户的症状描述信息，并将所述症状描述信息转换为症状描述向量，基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体；

第二单元，用于将所述症状描述向量与所述医疗知识实体进行向量融合，确定融合向量，基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心；

第三单元，用于确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，对多个相似度计算结果按照从高到低的顺序进行排序，将相似度最高的科室作为目标科室，并在所述用户确定在所述目标科室挂号后，生成所述目标科室的路径导航和/或位置信息。

在一种可选的实施方式中，

所述系统还包括第四单元，所述第四单元用于构建导诊图谱：

在一种可选的实施方式中，

所述第三单元还用于：

本发明实施例的第三方面，

提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为调用所述存储器存储的指令，以执行前述所述的方法。

本发明实施例的第四方面，

提供一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现前述所述的方法。

本发明实施例的有益效果可以参考具体实施方式中技术特征对应的有益效果，在此不再赘述。

附图说明

图1为本发明实施例基于深度学习及知识图谱的智能导诊方法的流程示意图；

图2为本发明实施例基于深度学习及知识图谱的智能导诊系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本发明实施例基于深度学习及知识图谱的智能导诊方法的流程示意图，如图1所示，所述方法包括：

S101. 获取用户的症状描述信息，并将所述症状描述信息转换为症状描述向量，基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体。

在一种可选的实施方式中，

用户通过界面输入症状描述，这可能是自然语言文本，如"头痛、咳嗽，发热"等。首先，需要对用户输入进行预处理，包括分词、去除停用词和标点等，以获得更有意义的文本表示。

将预处理后的用户症状描述文本转换为向量表示，可以使用预训练的词向量模型（如Word2Vec、GloVe）来获取词向量，然后通过平均或加权平均等方式将词向量组合成整体的症状描述向量。

构建医疗导诊知识图谱，其中包括疾病、症状、治疗方法等实体以及它们之间的关系，每个实体可以有相关属性，如疾病的症状列表、治疗方法等。图谱可以使用图数据库管理，如Neo4j等。计算用户输入的症状描述向量与导诊图谱中症状描述向量的相似度，可以使用余弦相似度等度量方法来衡量症状描述的相似性，找出与用户输入症状描述向量最相似的症状节点。

基于相似度计算的结果，找出与用户输入最相似的症状节点。然后，从该节点出发，通过图谱的边进行导诊，根据与症状相关的关系，遍历图谱中的相应边，找到可能的疾病、治疗方法等关联节点。将导诊结果呈现给用户，列出与输入症状最相似的症状、关联的疾病、治疗方法等。同时，解释导诊的依据，可以展示症状描述向量的相似度计算结果，以及图谱中的关系路径。

在一种可选的实施方式中，

根据用户输入的症状描述向量，计算与导诊图谱中所有症状节点的相似度，选择与用户输入最相似的症状节点作为起始点；从最相似的症状节点开始，通过图谱中的边进行遍历。这些边可以表示症状与疾病、症状与治疗方法等关联关系。

根据当前症状节点，查找与之关联的边，即可能的疾病、治疗方法等。根据导诊策略，可以选择一个或多个边进行推进。例如，如果一个症状与多个疾病关联，可以选择与最可能的疾病关联的边。

在导诊路径中，继续查找与当前节点关联的下一个节点，然后继续遍历与下一个节点相关的边，可以使用递归或循环来实现遍历图谱的过程，直到满足终止条件，例如达到预定的路径深度或找到了足够多的关联节点。

在遍历过程中，收集与症状节点相关的关联节点，包括可能的疾病、治疗方法等。可以使用数据结构（如列表、集合）来保存这些关联节点。根据遍历得到的关联节点，生成导诊结果，可以是一份建议的疾病列表、推荐的治疗方法等。将结果展示给用户，同时解释路径中的推理过程和依据。

在一种可选的实施方式中，所述方法还包括构建导诊图谱：

收集来自医学文献、临床实践、医疗数据库等的医学数据，这可以包括疾病名称、症状描述、治疗方法、药物信息等，确保数据来源可靠、准确，并进行数据清洗和标准化。

使用自然语言处理技术，将医学文本中的实体信息提取出来，如疾病名称、症状描述、治疗方法等，涉及命名实体识别（NER）和关系抽取等技术，可以使用预训练的模型或领域专门的工具。

根据医学知识，建立疾病、症状和治疗方法之间的关系，例如，某个疾病可能有一组特定的症状，某个治疗方法可以用于多个疾病等。这些关系可以表示为图谱中的边，连接不同的实体节点。

为每个实体添加属性和特性，这有助于更详细地描述实体，例如，疾病实体可以包括症状列表、发病机制、就诊建议等，这些属性可以作为导诊过程中的依据。

使用图数据库（如Neo4j）或其他图谱建模工具，将实体、关系和属性构建成一个知识图谱，图数据库能够高效地存储和查询图谱数据，支持复杂的图查询操作。

S102. 将所述症状描述向量与所述医疗知识实体进行向量融合，确定融合向量，基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心。

示例性地，对于导诊图谱中的每个医疗知识实体（例如疾病、症状、治疗方法等），都可以使用相同的向量化方法将其表示为向量，这可以使用词向量模型（如Word2Vec、GloVe）来将实体描述转换为向量表示。确保症状描述向量和医疗知识实体向量具有相同的维度，以便进行向量融合，可以通过将向量进行标准化，使其具有相同的尺度和范围。

选择适合的向量融合方法，以将症状描述向量与医疗知识实体向量进行结合，一种常用的方法是将这两个向量进行加权平均，其中权重可以根据具体情况进行调整，例如，可以给症状描述向量更高的权重，以突出用户提供的症状信息。

执行向量融合操作，将标准化后的症状描述向量和医疗知识实体向量进行加权平均或其他融合操作，融合后的向量将成为一个综合的特征，包含了症状描述和医疗知识的信息。

使用融合后的向量计算与医疗知识实体向量之间的相似度，可以使用余弦相似度或其他相似度度量来衡量融合向量与医疗知识实体的相似程度，基于相似度计算的结果，找出与用户输入最相似的医疗知识实体。

示例性地，对用户输入的症状描述进行预处理和向量化，同时对导诊图谱中的医疗知识实体（如疾病、症状、治疗方法）也进行向量化，使用相同的向量化方法，确保维度一致。将症状描述向量和知识实体向量融合，可以使用加权平均、拼接、元素相乘等方式进行融合；选择合适的融合方式以确保融合向量综合了用户输入的症状信息和医疗知识。

计算融合后的向量与导诊图谱中每个症状描述向量的相似度，可以使用余弦相似度或其他相似度度量方法，得到一个相似度列表。选择一个合适的聚类算法来将相似度列表中的症状描述进行聚类，常见的聚类算法包括K-Means、层次聚类等，可以根据应用需求和数据特点选择合适的算法，本申请的聚类算法可以包括K-Means聚类算法。

在一种可选的实施方式中，所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心包括：

示例性地，将相似度列表作为输入数据，其中每个数据点对应一个症状描述的相似度向量，确定聚类数目，即预计的导诊类别数量。随机选择K个症状描述的相似度向量作为初始聚类中心，其中K为预设的聚类数目。

使用K-Means算法进行迭代优化，迭代的过程包括以下步骤：

a.分配：对每个相似度向量，计算其与各个聚类中心的距离，将其分配到距离最近的聚类中心所对应的簇。

b.更新聚类中心：对每个簇，计算簇内所有相似度向量的平均值，将该平均值作为新的聚类中心。

c.重复上述两个步骤，直到聚类中心不再发生显著变化或达到预设的迭代次数。

完成迭代后，每个簇的聚类中心已经确定，相似度列表中的症状描述被分配到不同的簇，每个簇代表一个导诊类别。

将簇中的症状描述关联到相应的疾病或治疗方法，生成导诊结果，将结果展示给用户，同时提供解释和依据。

S103. 确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，对多个相似度计算结果按照从高到低的顺序进行排序，将相似度最高的科室作为目标科室，并在所述用户确定在所述目标科室挂号后，生成所述目标科室的路径导航和/或位置信息。

在一种可选的实施方式中，

对医疗知识图谱中的每个科室进行向量化，将科室描述转换为向量表示，使用相同的向量化方法，确保维度一致。对每个聚类中心，分别计算其与各个科室描述向量之间的相似度。可以使用余弦相似度等度量方法。

对于每个聚类，选择与其聚类中心相似度最高的科室，作为该聚类所关联的科室。根据确定的最相关科室，将导诊结果关联到相应的医疗科室，每个聚类对应一个关联的科室，从而将导诊结果与特定领域的医生和医疗知识关联起来。

收集医疗知识图谱中的科室描述和导诊聚类的结果，获取科室的位置信息，例如科室所在楼层、楼栋等；对每个科室的描述进行向量化，得到科室描述向量，获取每个聚类的聚类中心向量，对每个聚类中心向量与所有科室描述向量进行相似度计算，例如余弦相似度，将每个聚类中心与所有科室的相似度结果按照从高到低排序，得到相似度最高的科室排在前面。

根据排序后的相似度结果，选择相似度最高的科室作为目标科室，用户在系统中选择了目标科室进行挂号，根据用户选择的目标科室，获取该科室的位置信息，例如楼层和楼栋，利用定位技术、地图数据等，生成用户从当前位置到目标科室的路径导航和位置信息，将路径导航和位置信息展示给用户，帮助用户准确到达目标科室，收集用户反馈和使用数据，不断优化相似度计算、目标科室的确定以及路径导航和位置信息的生成方法，以提高系统效果和用户体验。

假设用户描述了头痛、咳嗽等症状，通过导诊系统得到了与症状最相关的导诊聚类。根据聚类结果，系统将计算聚类中心与医疗知识实体中多个科室的相似度，排序后找到相似度最高的科室，例如“呼吸科”。用户确认在“呼吸科”挂号后，系统根据楼层和楼栋信息，生成路径导航和位置信息，帮助用户准确到达“呼吸科”。

本发明实施例的第二方面，

提供一种基于深度学习及知识图谱的智能导诊系统，图2为本发明实施例基于深度学习及知识图谱的智能导诊系统的结构示意图，包括：

在一种可选的实施方式中，

所述第三单元还用于：

本发明实施例的第三方面，

提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

本发明实施例的第四方面，

本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本发明的各个方面的计算机可读程序指令。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于深度学习及知识图谱的智能导诊方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括构建导诊图谱：

4.根据权利要求1所述的方法，其特征在于，所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类，确定聚类中心包括：

5.根据权利要求1所述的方法，其特征在于，所述确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果，对多个相似度计算结果按照从高到低的顺序进行排序，将相似度最高的科室作为目标科室，并在所述用户确定在所述目标科室挂号后，生成所述目标科室的路径导航和/或位置信息包括：

6.一种基于深度学习及知识图谱的智能导诊系统，其特征在于，包括：

7.根据权利要求6所述的系统，其特征在于，所述第一单元还用于：

8.根据权利要求6所述的系统，其特征在于，所述系统还包括第四单元，所述第四单元用于构建导诊图谱：

9.根据权利要求6所述的系统，其特征在于，所述第二单元还用于：

10.根据权利要求6所述的系统，其特征在于，所述第三单元还用于：