CN116936058A - 一种基于深度学习及知识图谱的智能导诊方法及系统 - Google Patents
一种基于深度学习及知识图谱的智能导诊方法及系统 Download PDFInfo
- Publication number
- CN116936058A CN116936058A CN202311183936.8A CN202311183936A CN116936058A CN 116936058 A CN116936058 A CN 116936058A CN 202311183936 A CN202311183936 A CN 202311183936A CN 116936058 A CN116936058 A CN 116936058A
- Authority
- CN
- China
- Prior art keywords
- similarity
- vector
- symptom
- department
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 208000024891 symptom Diseases 0.000 claims abstract description 158
- 239000013598 vector Substances 0.000 claims abstract description 155
- 230000004927 fusion Effects 0.000 claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 238000012163 sequencing technique Methods 0.000 claims abstract description 16
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 201000010099 disease Diseases 0.000 claims description 25
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 25
- 238000005516 engineering process Methods 0.000 claims description 16
- 238000003058 natural language processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 2
- 206010019233 Headaches Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 231100000869 headache Toxicity 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供一种基于深度学习及知识图谱的智能导诊方法及系统,涉及医疗技术领域,包括获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体;将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心;确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
Description
技术领域
本发明涉及医疗技术领域,尤其涉及一种基于深度学习及知识图谱的智能导诊方法及系统。
背景技术
随着我国经济发展水平的不断提高,人们对医疗服务的要求也越来越高。传统的医疗服务已经不能满足人们快节奏的生活需求,因此医院的信息化建设至关重要。现代化医院应该采取先进的管理观念,结合先进的计算机技术,以提高病人的就诊体验和减轻医务人员的工作量,让医院能够更加专注于医疗服务质量的提升,从而更好地服务于社会。
对于大型综合性医院而言,医院都以专科为诊疗单元进行日常的诊疗工作。然而现状是,广大民众的医疗基本知识相对匮乏,导致很多患者在就诊时,往往不知道对应的挂号科室,继而导致医院挂号排队现象严重。虽然部分医院设置了专门的导诊服务,但数量有限且工作负荷较大,因而催生了二次排队现象。为此,有必要设计并实现一套智能导诊系统,以减少病人的窗口等待时间,缓解医院的三长一短现象。
发明内容
本发明实施例提供一种基于深度学习及知识图谱的智能导诊方法及系统,至少能够解决现有技术中的部分问题。
本发明实施例的第一方面,
提供一种基于深度学习及知识图谱的智能导诊方法,包括:
一种基于深度学习及知识图谱的智能导诊方法,其特征在于,包括:
获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体;
将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心;
确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
在一种可选的实施方式中,
所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括:
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与所述症状描述向量最相似的症状节点作为起始点;
从最相似的症状节点开始,通过所述导诊图谱中的边进行遍历,根据当前症状节点,查找与之关联的边,根据导诊策略,可以选择一个或多个边进行推进;
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,使用递归或循环来实现遍历导诊图谱,直到满足终止条件,确定与所述症状描述向量相匹配的医疗知识实体。
在一种可选的实施方式中,
所述方法还包括构建导诊图谱:
收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据,使用自然语言处理技术,将医学数据中的实体信息提取出来;
根据医学知识,建立疾病、症状和治疗方法之间的关系,并将三者之间的关系表示为图谱的边,用于连接不同的实体节点;
为每个实体添加属性,使用图数据库将实体、关系和属性构建成一个导诊图谱。
在一种可选的实施方式中,
所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心包括:
随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目;
对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇;
对每个簇,迭代计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心,直到聚类中心不再发生变化或达到预设的迭代次数,确定多个聚类中心。
在一种可选的实施方式中,
所述确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息包括:
将所述医疗知识实体中多个科室进行向量化,并对所述聚类中心和所述向量化后的科室进行向量对齐,保持向量维度一致;
通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,将每个聚类中心与所有科室的相似度结果按照从高到低排序;
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,根据用户选择的目标科室,获取该科室的位置信息,通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。
本发明实施例的第二方面,
提供一种基于深度学习及知识图谱的智能导诊系统,包括:
第一单元,用于获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体;
第二单元,用于将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心;
第三单元,用于确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
在一种可选的实施方式中,
所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括:
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与所述症状描述向量最相似的症状节点作为起始点;
从最相似的症状节点开始,通过所述导诊图谱中的边进行遍历,根据当前症状节点,查找与之关联的边,根据导诊策略,可以选择一个或多个边进行推进;
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,使用递归或循环来实现遍历导诊图谱,直到满足终止条件,确定与所述症状描述向量相匹配的医疗知识实体。
在一种可选的实施方式中,
所述系统还包括第四单元,所述第四单元用于构建导诊图谱:
收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据,使用自然语言处理技术,将医学数据中的实体信息提取出来;
根据医学知识,建立疾病、症状和治疗方法之间的关系,并将三者之间的关系表示为图谱的边,用于连接不同的实体节点;
为每个实体添加属性,使用图数据库将实体、关系和属性构建成一个导诊图谱。
在一种可选的实施方式中,
所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心包括:
随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目;
对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇;
对每个簇,迭代计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心,直到聚类中心不再发生变化或达到预设的迭代次数,确定多个聚类中心。
在一种可选的实施方式中,
所述第三单元还用于:
将所述医疗知识实体中多个科室进行向量化,并对所述聚类中心和所述向量化后的科室进行向量对齐,保持向量维度一致;
通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,将每个聚类中心与所有科室的相似度结果按照从高到低排序;
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,根据用户选择的目标科室,获取该科室的位置信息,通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明实施例的有益效果可以参考具体实施方式中技术特征对应的有益效果,在此不再赘述。
附图说明
图1为本发明实施例基于深度学习及知识图谱的智能导诊方法的流程示意图;
图2为本发明实施例基于深度学习及知识图谱的智能导诊系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例基于深度学习及知识图谱的智能导诊方法的流程示意图,如图1所示,所述方法包括:
S101. 获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体。
在一种可选的实施方式中,
用户通过界面输入症状描述,这可能是自然语言文本,如"头痛、咳嗽,发热"等。首先,需要对用户输入进行预处理,包括分词、去除停用词和标点等,以获得更有意义的文本表示。
将预处理后的用户症状描述文本转换为向量表示,可以使用预训练的词向量模型(如Word2Vec、GloVe)来获取词向量,然后通过平均或加权平均等方式将词向量组合成整体的症状描述向量。
构建医疗导诊知识图谱,其中包括疾病、症状、治疗方法等实体以及它们之间的关系,每个实体可以有相关属性,如疾病的症状列表、治疗方法等。图谱可以使用图数据库管理,如Neo4j等。计算用户输入的症状描述向量与导诊图谱中症状描述向量的相似度,可以使用余弦相似度等度量方法来衡量症状描述的相似性,找出与用户输入症状描述向量最相似的症状节点。
基于相似度计算的结果,找出与用户输入最相似的症状节点。然后,从该节点出发,通过图谱的边进行导诊,根据与症状相关的关系,遍历图谱中的相应边,找到可能的疾病、治疗方法等关联节点。将导诊结果呈现给用户,列出与输入症状最相似的症状、关联的疾病、治疗方法等。同时,解释导诊的依据,可以展示症状描述向量的相似度计算结果,以及图谱中的关系路径。
在一种可选的实施方式中,
所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括:
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与所述症状描述向量最相似的症状节点作为起始点;
从最相似的症状节点开始,通过所述导诊图谱中的边进行遍历,根据当前症状节点,查找与之关联的边,根据导诊策略,可以选择一个或多个边进行推进;
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,使用递归或循环来实现遍历导诊图谱,直到满足终止条件,确定与所述症状描述向量相匹配的医疗知识实体。
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与用户输入最相似的症状节点作为起始点;从最相似的症状节点开始,通过图谱中的边进行遍历。这些边可以表示症状与疾病、症状与治疗方法等关联关系。
根据当前症状节点,查找与之关联的边,即可能的疾病、治疗方法等。根据导诊策略,可以选择一个或多个边进行推进。例如,如果一个症状与多个疾病关联,可以选择与最可能的疾病关联的边。
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,可以使用递归或循环来实现遍历图谱的过程,直到满足终止条件,例如达到预定的路径深度或找到了足够多的关联节点。
在遍历过程中,收集与症状节点相关的关联节点,包括可能的疾病、治疗方法等。可以使用数据结构(如列表、集合)来保存这些关联节点。根据遍历得到的关联节点,生成导诊结果,可以是一份建议的疾病列表、推荐的治疗方法等。将结果展示给用户,同时解释路径中的推理过程和依据。
在一种可选的实施方式中,所述方法还包括构建导诊图谱:
收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据,使用自然语言处理技术,将医学数据中的实体信息提取出来;
根据医学知识,建立疾病、症状和治疗方法之间的关系,并将三者之间的关系表示为图谱的边,用于连接不同的实体节点;
为每个实体添加属性,使用图数据库将实体、关系和属性构建成一个导诊图谱。
收集来自医学文献、临床实践、医疗数据库等的医学数据,这可以包括疾病名称、症状描述、治疗方法、药物信息等,确保数据来源可靠、准确,并进行数据清洗和标准化。
使用自然语言处理技术,将医学文本中的实体信息提取出来,如疾病名称、症状描述、治疗方法等,涉及命名实体识别(NER)和关系抽取等技术,可以使用预训练的模型或领域专门的工具。
根据医学知识,建立疾病、症状和治疗方法之间的关系,例如,某个疾病可能有一组特定的症状,某个治疗方法可以用于多个疾病等。这些关系可以表示为图谱中的边,连接不同的实体节点。
为每个实体添加属性和特性,这有助于更详细地描述实体,例如,疾病实体可以包括症状列表、发病机制、就诊建议等,这些属性可以作为导诊过程中的依据。
使用图数据库(如Neo4j)或其他图谱建模工具,将实体、关系和属性构建成一个知识图谱,图数据库能够高效地存储和查询图谱数据,支持复杂的图查询操作。
S102. 将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心。
示例性地,对于导诊图谱中的每个医疗知识实体(例如疾病、症状、治疗方法等),都可以使用相同的向量化方法将其表示为向量,这可以使用词向量模型(如Word2Vec、GloVe)来将实体描述转换为向量表示。确保症状描述向量和医疗知识实体向量具有相同的维度,以便进行向量融合,可以通过将向量进行标准化,使其具有相同的尺度和范围。
选择适合的向量融合方法,以将症状描述向量与医疗知识实体向量进行结合,一种常用的方法是将这两个向量进行加权平均,其中权重可以根据具体情况进行调整,例如,可以给症状描述向量更高的权重,以突出用户提供的症状信息。
执行向量融合操作,将标准化后的症状描述向量和医疗知识实体向量进行加权平均或其他融合操作,融合后的向量将成为一个综合的特征,包含了症状描述和医疗知识的信息。
使用融合后的向量计算与医疗知识实体向量之间的相似度,可以使用余弦相似度或其他相似度度量来衡量融合向量与医疗知识实体的相似程度,基于相似度计算的结果,找出与用户输入最相似的医疗知识实体。
示例性地,对用户输入的症状描述进行预处理和向量化,同时对导诊图谱中的医疗知识实体(如疾病、症状、治疗方法)也进行向量化,使用相同的向量化方法,确保维度一致。将症状描述向量和知识实体向量融合,可以使用加权平均、拼接、元素相乘等方式进行融合;选择合适的融合方式以确保融合向量综合了用户输入的症状信息和医疗知识。
计算融合后的向量与导诊图谱中每个症状描述向量的相似度,可以使用余弦相似度或其他相似度度量方法,得到一个相似度列表。选择一个合适的聚类算法来将相似度列表中的症状描述进行聚类,常见的聚类算法包括K-Means、层次聚类等,可以根据应用需求和数据特点选择合适的算法,本申请的聚类算法可以包括K-Means聚类算法。
在一种可选的实施方式中,所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心包括:
随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目;
对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇;
对每个簇,迭代计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心,直到聚类中心不再发生变化或达到预设的迭代次数,确定多个聚类中心。
示例性地,将相似度列表作为输入数据,其中每个数据点对应一个症状描述的相似度向量,确定聚类数目,即预计的导诊类别数量。随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目。
使用K-Means算法进行迭代优化,迭代的过程包括以下步骤:
a.分配:对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇。
b.更新聚类中心:对每个簇,计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心。
c.重复上述两个步骤,直到聚类中心不再发生显著变化或达到预设的迭代次数。
完成迭代后,每个簇的聚类中心已经确定,相似度列表中的症状描述被分配到不同的簇,每个簇代表一个导诊类别。
将簇中的症状描述关联到相应的疾病或治疗方法,生成导诊结果,将结果展示给用户,同时提供解释和依据。
S103. 确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
在一种可选的实施方式中,
所述确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息包括:
将所述医疗知识实体中多个科室进行向量化,并对所述聚类中心和所述向量化后的科室进行向量对齐,保持向量维度一致;
通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,将每个聚类中心与所有科室的相似度结果按照从高到低排序;
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,根据用户选择的目标科室,获取该科室的位置信息,通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。
对医疗知识图谱中的每个科室进行向量化,将科室描述转换为向量表示,使用相同的向量化方法,确保维度一致。对每个聚类中心,分别计算其与各个科室描述向量之间的相似度。可以使用余弦相似度等度量方法。
对于每个聚类,选择与其聚类中心相似度最高的科室,作为该聚类所关联的科室。根据确定的最相关科室,将导诊结果关联到相应的医疗科室,每个聚类对应一个关联的科室,从而将导诊结果与特定领域的医生和医疗知识关联起来。
收集医疗知识图谱中的科室描述和导诊聚类的结果,获取科室的位置信息,例如科室所在楼层、楼栋等;对每个科室的描述进行向量化,得到科室描述向量,获取每个聚类的聚类中心向量,对每个聚类中心向量与所有科室描述向量进行相似度计算,例如余弦相似度,将每个聚类中心与所有科室的相似度结果按照从高到低排序,得到相似度最高的科室排在前面。
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,用户在系统中选择了目标科室进行挂号,根据用户选择的目标科室,获取该科室的位置信息,例如楼层和楼栋,利用定位技术、地图数据等,生成用户从当前位置到目标科室的路径导航和位置信息,将路径导航和位置信息展示给用户,帮助用户准确到达目标科室,收集用户反馈和使用数据,不断优化相似度计算、目标科室的确定以及路径导航和位置信息的生成方法,以提高系统效果和用户体验。
假设用户描述了头痛、咳嗽等症状,通过导诊系统得到了与症状最相关的导诊聚类。根据聚类结果,系统将计算聚类中心与医疗知识实体中多个科室的相似度,排序后找到相似度最高的科室,例如“呼吸科”。用户确认在“呼吸科”挂号后,系统根据楼层和楼栋信息,生成路径导航和位置信息,帮助用户准确到达“呼吸科”。
本发明实施例的第二方面,
提供一种基于深度学习及知识图谱的智能导诊系统,图2为本发明实施例基于深度学习及知识图谱的智能导诊系统的结构示意图,包括:
第一单元,用于获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体;
第二单元,用于将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心;
第三单元,用于确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
在一种可选的实施方式中,
所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括:
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与所述症状描述向量最相似的症状节点作为起始点;
从最相似的症状节点开始,通过所述导诊图谱中的边进行遍历,根据当前症状节点,查找与之关联的边,根据导诊策略,可以选择一个或多个边进行推进;
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,使用递归或循环来实现遍历导诊图谱,直到满足终止条件,确定与所述症状描述向量相匹配的医疗知识实体。
在一种可选的实施方式中,
所述系统还包括第四单元,所述第四单元用于构建导诊图谱:
收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据,使用自然语言处理技术,将医学数据中的实体信息提取出来;
根据医学知识,建立疾病、症状和治疗方法之间的关系,并将三者之间的关系表示为图谱的边,用于连接不同的实体节点;
为每个实体添加属性,使用图数据库将实体、关系和属性构建成一个导诊图谱。
在一种可选的实施方式中,
所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心包括:
随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目;
对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇;
对每个簇,迭代计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心,直到聚类中心不再发生变化或达到预设的迭代次数,确定多个聚类中心。
在一种可选的实施方式中,
所述第三单元还用于:
将所述医疗知识实体中多个科室进行向量化,并对所述聚类中心和所述向量化后的科室进行向量对齐,保持向量维度一致;
通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,将每个聚类中心与所有科室的相似度结果按照从高到低排序;
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,根据用户选择的目标科室,获取该科室的位置信息,通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于深度学习及知识图谱的智能导诊方法,其特征在于,包括:
获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体;
将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心;
确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体包括:
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与所述症状描述向量最相似的症状节点作为起始点;
从最相似的症状节点开始,通过所述导诊图谱中的边进行遍历,根据当前症状节点,查找与之关联的边,根据导诊策略,可以选择一个或多个边进行推进;
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,使用递归或循环来实现遍历导诊图谱,直到满足终止条件,确定与所述症状描述向量相匹配的医疗知识实体。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括构建导诊图谱:
收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据,使用自然语言处理技术,将医学数据中的实体信息提取出来;
根据医学知识,建立疾病、症状和治疗方法之间的关系,并将三者之间的关系表示为图谱的边,用于连接不同的实体节点;
为每个实体添加属性,使用图数据库将实体、关系和属性构建成一个导诊图谱。
4.根据权利要求1所述的方法,其特征在于,所述基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心包括:
随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目;
对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇;
对每个簇,迭代计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心,直到聚类中心不再发生变化或达到预设的迭代次数,确定多个聚类中心。
5.根据权利要求1所述的方法,其特征在于,所述确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息包括:
将所述医疗知识实体中多个科室进行向量化,并对所述聚类中心和所述向量化后的科室进行向量对齐,保持向量维度一致;
通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,将每个聚类中心与所有科室的相似度结果按照从高到低排序;
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,根据用户选择的目标科室,获取该科室的位置信息,通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。
6.一种基于深度学习及知识图谱的智能导诊系统,其特征在于,包括:
第一单元,用于获取用户的症状描述信息,并将所述症状描述信息转换为症状描述向量,基于预设的导诊图谱确定与所述症状描述向量相匹配的医疗知识实体;
第二单元,用于将所述症状描述向量与所述医疗知识实体进行向量融合,确定融合向量,基于所述融合向量通过聚类算法对所述症状描述信息进行聚类,确定聚类中心;
第三单元,用于确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,对多个相似度计算结果按照从高到低的顺序进行排序,将相似度最高的科室作为目标科室,并在所述用户确定在所述目标科室挂号后,生成所述目标科室的路径导航和/或位置信息。
7.根据权利要求6所述的系统,其特征在于,所述第一单元还用于:
根据用户输入的症状描述向量,计算与导诊图谱中所有症状节点的相似度,选择与所述症状描述向量最相似的症状节点作为起始点;
从最相似的症状节点开始,通过所述导诊图谱中的边进行遍历,根据当前症状节点,查找与之关联的边,根据导诊策略,可以选择一个或多个边进行推进;
在导诊路径中,继续查找与当前节点关联的下一个节点,然后继续遍历与下一个节点相关的边,使用递归或循环来实现遍历导诊图谱,直到满足终止条件,确定与所述症状描述向量相匹配的医疗知识实体。
8.根据权利要求6所述的系统,其特征在于,所述系统还包括第四单元,所述第四单元用于构建导诊图谱:
收集来自医学文献、临床实践、医疗数据库中至少一个来源的医学数据,使用自然语言处理技术,将医学数据中的实体信息提取出来;
根据医学知识,建立疾病、症状和治疗方法之间的关系,并将三者之间的关系表示为图谱的边,用于连接不同的实体节点;
为每个实体添加属性,使用图数据库将实体、关系和属性构建成一个导诊图谱。
9.根据权利要求6所述的系统,其特征在于,所述第二单元还用于:
随机选择K个症状描述的相似度向量作为初始聚类中心,其中K为预设的聚类数目;
对每个相似度向量,计算其与各个聚类中心的距离,将其分配到距离最近的聚类中心所对应的簇;
对每个簇,迭代计算簇内所有相似度向量的平均值,将该平均值作为新的聚类中心,直到聚类中心不再发生变化或达到预设的迭代次数,确定多个聚类中心。
10.根据权利要求6所述的系统,其特征在于,所述第三单元还用于:
将所述医疗知识实体中多个科室进行向量化,并对所述聚类中心和所述向量化后的科室进行向量对齐,保持向量维度一致;
通过余弦相似度算法确定所述聚类中心与所述医疗知识实体中多个科室的相似度结果,将每个聚类中心与所有科室的相似度结果按照从高到低排序;
根据排序后的相似度结果,选择相似度最高的科室作为目标科室,根据用户选择的目标科室,获取该科室的位置信息,通过定位技术结合室内地图数据生成用户从当前位置到目标科室的路径导航和位置信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311183936.8A CN116936058A (zh) | 2023-09-14 | 2023-09-14 | 一种基于深度学习及知识图谱的智能导诊方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311183936.8A CN116936058A (zh) | 2023-09-14 | 2023-09-14 | 一种基于深度学习及知识图谱的智能导诊方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116936058A true CN116936058A (zh) | 2023-10-24 |
Family
ID=88388136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311183936.8A Pending CN116936058A (zh) | 2023-09-14 | 2023-09-14 | 一种基于深度学习及知识图谱的智能导诊方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116936058A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118155817A (zh) * | 2024-04-26 | 2024-06-07 | 旭辉卓越健康信息科技有限公司 | 一种基于gpt模型的科室和专家推荐方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107403068A (zh) * | 2017-07-31 | 2017-11-28 | 合肥工业大学 | 融合临床思维的智能辅助问诊方法及系统 |
CN109492107A (zh) * | 2018-11-21 | 2019-03-19 | 上海依智医疗技术有限公司 | 一种导诊的方法及装置 |
CN109522413A (zh) * | 2018-11-21 | 2019-03-26 | 上海依智医疗技术有限公司 | 一种导诊医学术语库的构建方法及装置 |
CN113609233A (zh) * | 2021-02-02 | 2021-11-05 | 腾讯科技(深圳)有限公司 | 一种实体对象编码方法、装置、电子设备和存储介质 |
CN113707304A (zh) * | 2021-08-30 | 2021-11-26 | 平安国际智慧城市科技股份有限公司 | 分诊数据处理方法、装置、设备及存储介质 |
CN113870998A (zh) * | 2021-09-29 | 2021-12-31 | 北京百度网讯科技有限公司 | 问诊方法、装置、电子设备和存储介质 |
CN115688760A (zh) * | 2022-11-11 | 2023-02-03 | 深圳市蒲睿科技有限公司 | 一种智能化导诊方法、装置、设备及存储介质 |
CN115858886A (zh) * | 2022-12-12 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及可读存储介质 |
-
2023
- 2023-09-14 CN CN202311183936.8A patent/CN116936058A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107403068A (zh) * | 2017-07-31 | 2017-11-28 | 合肥工业大学 | 融合临床思维的智能辅助问诊方法及系统 |
CN109492107A (zh) * | 2018-11-21 | 2019-03-19 | 上海依智医疗技术有限公司 | 一种导诊的方法及装置 |
CN109522413A (zh) * | 2018-11-21 | 2019-03-26 | 上海依智医疗技术有限公司 | 一种导诊医学术语库的构建方法及装置 |
CN113609233A (zh) * | 2021-02-02 | 2021-11-05 | 腾讯科技(深圳)有限公司 | 一种实体对象编码方法、装置、电子设备和存储介质 |
CN113707304A (zh) * | 2021-08-30 | 2021-11-26 | 平安国际智慧城市科技股份有限公司 | 分诊数据处理方法、装置、设备及存储介质 |
CN113870998A (zh) * | 2021-09-29 | 2021-12-31 | 北京百度网讯科技有限公司 | 问诊方法、装置、电子设备和存储介质 |
CN115688760A (zh) * | 2022-11-11 | 2023-02-03 | 深圳市蒲睿科技有限公司 | 一种智能化导诊方法、装置、设备及存储介质 |
CN115858886A (zh) * | 2022-12-12 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118155817A (zh) * | 2024-04-26 | 2024-06-07 | 旭辉卓越健康信息科技有限公司 | 一种基于gpt模型的科室和专家推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choe et al. | Content-based image retrieval by using deep learning for interstitial lung disease diagnosis with chest CT | |
CN108614885B (zh) | 基于医学信息的知识图谱分析方法及装置 | |
CN107145744B (zh) | 医学知识图谱的构建方法、装置及辅助诊断方法 | |
CN108461151B (zh) | 一种知识图谱的逻辑增强方法及装置 | |
CN111292848B (zh) | 一种基于贝叶斯估计的医疗知识图谱辅助推理方法 | |
WO2022116430A1 (zh) | 基于大数据挖掘的模型部署方法、装置、设备及存储介质 | |
US11670420B2 (en) | Drawing conclusions from free form texts with deep reinforcement learning | |
CN110459320A (zh) | 一种基于知识图谱的辅助诊疗系统 | |
CN110246572B (zh) | 一种基于词向量的医疗分诊方法及系统 | |
CN116364299B (zh) | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 | |
CN111768869B (zh) | 面向智能问答系统的医学指南图谱化构建搜索系统及方法 | |
CN110111905B (zh) | 一种医疗知识图谱的构建系统和构建方法 | |
CN116936058A (zh) | 一种基于深度学习及知识图谱的智能导诊方法及系统 | |
CN111274332A (zh) | 一种基于知识图谱的专利智能检索方法及系统 | |
CN114611735A (zh) | 就医的互联网挂号方法、装置、设备及存储介质 | |
WO2021169203A1 (zh) | 基于多层级结构相似度的单基因病名称推荐方法和系统 | |
CN112507138A (zh) | 专病知识图谱构建方法及装置、介质及电子设备 | |
CN114330267A (zh) | 一种基于语义学关联的结构化报告模板的设计方法 | |
CN111651579A (zh) | 信息查询方法、装置、计算机设备和存储介质 | |
Chen | Parameterized spatial SQL translation for geographic question answering | |
CN113254609B (zh) | 一种基于负样本多样性的问答模型集成方法 | |
CN110675938A (zh) | 一种针灸医学数据处理系统及方法、信息数据处理终端 | |
CN112071431B (zh) | 基于深度学习和知识图谱的临床路径自动生成方法及系统 | |
CN117594206A (zh) | 基于医疗互联平台的患者一体化分诊系统及方法 | |
CN117577253A (zh) | 基于大数据的医疗临床数据质量分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20231024 |
|
RJ01 | Rejection of invention patent application after publication |