CN117238437A - 基于知识图谱的病情诊断辅助方法及系统 - Google Patents

基于知识图谱的病情诊断辅助方法及系统 Download PDF

Info

Publication number
CN117238437A
CN117238437A CN202311273965.3A CN202311273965A CN117238437A CN 117238437 A CN117238437 A CN 117238437A CN 202311273965 A CN202311273965 A CN 202311273965A CN 117238437 A CN117238437 A CN 117238437A
Authority
CN
China
Prior art keywords
determining
information
medical
entity
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311273965.3A
Other languages
English (en)
Inventor
叶放
周静汶
张晓龙
冯哲
李柳
周仲瑛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Chinese Medicine
Original Assignee
Nanjing University of Chinese Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Chinese Medicine filed Critical Nanjing University of Chinese Medicine
Priority to CN202311273965.3A priority Critical patent/CN117238437A/zh
Publication of CN117238437A publication Critical patent/CN117238437A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种基于知识图谱的病情诊断辅助方法及系统,涉及病情诊断辅助技术,包括:获取待分析语句,根据预设的知识抽取模块,确定文义信息,结合注意力分配机制,得到标签序列,结合预先引入的全局特征,确定医学实体,根据预设的初始医学图谱,确定第一实体节点,根据初始医学图谱得到连接边,基于连接边和动态权重分配算法确定第一融合图谱,对第一实体节点进行更新,得到第二实体节点,根据第二实体节点,连接边和第一融合图谱进行医学知识融合,得到融合知识图谱,基于患者基本信息和用药历史信息,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。

Description

基于知识图谱的病情诊断辅助方法及系统
技术领域
本发明涉及病情诊断辅助技术,尤其涉及一种基于知识图谱的病情诊断辅助方法及系统。
背景技术
随着人口不断增加,临床医生每天都会接触到大量不同的病人,工作压力大,难免会在患者诊治过程中有疏忽。因此,在医生的诊疗过程中利用推荐算法为医生提供用药参考,在一定程度上可以减轻医生的诊疗负担,提高医生的工作效率,减少用药错误事件发生。
在现有技术中,CN108877901A,一种中医诊断系统公开了一种中医诊断系统,包括诊断系统模块、辅助中医诊断系统模块和其它管理模块,所述诊断系统的输出端并联连接有望模块、闻模块、问模块、切模块;所述望模块、闻模块、问模块、切模块的输出端连接综合分析模块;所述辅助中医诊断系统模块的输出端连接有数据库。本中医诊断系统在使用时,利用影像信息,硬件诊断设备和计算机辅助诊断将数据进行统计分析,加上辅助中医诊断系统模块汇总信息,最终将诊断信息汇总至综合分析模块处进行综合分析,转到确诊模块得出确诊结果,利用传统技艺和现代科技设备及方法,提高诊断效率,诊断的结果更加可靠;整体解决难诊、减少误诊的发生和提高了诊断效率。
CN116364278A,基于中医大数据分析的人工智能辅助诊断方法及系统公开了基于中医大数据分析的人工智能辅助诊断方法及系统,涉及中医数据分析技术领域,包括数据上传模块、模型创建模块、数据分类模块以及数据监测模块;所述模型创建模块用于基于AI深度学习算法分析得到特征诊断模型,其中模型创建模块分析的数据来源为大数据开源库中存储的数据;所述数据上传模块用于管理人员上传待识别的中医数据至云端服务器;所述数据分类模块用于对云端服务器中缓存的中医数据进行识别优值分析,生成中医数据的识别优先表;所述云端服务器用于根据识别优先表依次将待识别的中医数据传输至辅助诊断模块进行特征诊断,得到中医诊断数据;使得识别优值高的中医数据优先进行辅助诊断,提高辅助诊断效率。
当前中医发展的关键问题是中医后备人才奇缺,核心在于缺少传承名医经验、培养高水平中医人才的具体有效实施方法。现有的中医诊疗方法往往是传统“师带徒”一对一带教模式,难以形成规模化的传承教育新模式,临床疗效有待提高。
发明内容
本发明实施例提供一种基于知识图谱的病情诊断辅助方法及系统,用于在诊疗过程中为医生提供用药参考。
本发明实施例的第一方面,提供一种基于知识图谱的病情诊断辅助方法,包括:
获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体;
根据所述医学实体和预设的初始医学图谱,确定第一实体节点,根据所述第一实体节点和所述初始医学图谱得到连接边,基于所述连接边和预设的动态权重分配算法确定第一融合图谱,对所述第一实体节点进行更新,得到第二实体节点,根据所述第二实体节点,连接边和所述第一融合图谱进行医学知识融合,得到融合知识图谱;
基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将所述第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。
在一种可选的实施方式中,
获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体包括:
所述知识抽取模块包括文义识别模块和约束模块;
所述文义识别模块中的词嵌入单元将所述待分析语句中每个词转换为向量,根据所述向量,通过双向识别单元,确定当前向量对应的词的上下文信息;
根据所述上下文信息,所述双向识别单元通过输入门对所述上下文信息进行筛选,确定输入信息;
根据所述输入信息,通过遗忘门确定当前双向识别单元内需要丢弃的信息,确定保留信息;
根据所述保留信息,通过输出门确定需要输出的信息,生成输出序列;
对所述输出序列的每个位置,根据注意力分配机制,生成注意力权重参数,根据所述注意力权重参数对所述输出序列进行加权计算,得到标签序列;
所述约束模型根据所述标签序列,设置约束条件,确定所述约束模型的目标函数;
根据所述预先引入的全局特征,确定所述全局特征的权重值,根据所述权重值将所述全局特征与预设的局部特征加入至所述目标函数,得到改进的目标函数;
根据所述改进的目标函数,确定所述医学实体;
其中,所述全局特征包括标签特征的统计属性,标签之间的关联和标签的先验概率。
在一种可选的实施方式中,
所述预设的全局特征如下表达式所示:
其中,y表示标签序列,x表示输入信息,N表示序列长度,K表示全局特征函数的数量,fk表示第k个全局特征函数,wk表示第k个全局特征函数的权重;
所述改进的目标函数如下表达式所示:
其中,exp表示指数函数,Score(y,x)表示约束模型的得分函数,通常是局部特征的加权和,y1表示所有可能的标签序列,λk表示与第k个全局特征相关联的权重参数。
在一种可选的实施方式中,
根据所述医学实体和预设的初始医学图谱,进行医学知识融合,得到融合知识图谱包括:
将所述医学实体作为新的医学实体节点,嵌入至所述初始医学图谱,记为第一实体节点;
将所述第一实体节点与其他医学实体节点进行连接,生成连接边,根据动态权重分配算法为所述连接边分配权重,生成第一医学图谱;
根据所述连接边,确定所述第一医学图谱中对应的第一实体节点,根据自适应学习算法更新第一实体节点信息,得到第二实体节点;
基于所述第二实体节点,所述连接边和所述第一医学图谱,通过融合算法确定所述融合知识图谱。
在一种可选的实施方式中,
根据动态权重分配算法为所述连接边分配权重包括:
计算所述连接边的置信度和重要性,得到置信度分数和重要性分数;
对所述置信度分数和重要性分数,进行归一化操作,得到归一化数值;
根据所述归一化数值对每个连接边分配权重。
在一种可选的实施方式中,
根据所述归一化数值对每个连接边分配权重如下公式所示:
其中,Wr表示连接边r的权重,k表示控制权重分布形状的参数,ρ1表示置信度分数归一化后的值,ρ2表示重要性分数归一化后的值,c表示阈值参数。
在一种可选的实施方式中,
根据所述连接边,确定所述第一医学图谱中对应的第一实体节点,根据自适应学习算法更新所述第一实体节点信息,得到第二实体节点包括:
获取所述连接边信息,确定与所述连接边相关的第一实体节点,生成第一节点集合;
对于所述第一节点集合内的每一个节点,根据所述连接边的信息和节点历史关系信息,结合损失函数,确定对应的更新向量;
根据所述更新向量,计算所述第一节点的梯度值,结合所述梯度值确定所述第二实体节点。
在一种可选的实施方式中,
基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定推荐用药结果包括:
所述用药推荐模型包括输入整合模块和特征交互模块;
获取所述患者基本信息和用药历史信息,结合所述融合知识图谱,通过所述用药推荐模型中的输入整合模块,确定所述第一输出特征:
所述输入整合模块提取所述患者基本信息和用药历史信息文本中的输入特征,根据所述输入特征,确定输入特征的均值和方差;
根据所述均值和方差,对输出值进行标准化操作,得到标准化输出特征;
根据所述标准化输出特征,进行平移和缩放操作,并应用激活函数,得到所述第一输出特征;
特征交互模块根据所述患者基本信息和用药历史信息,结合所述融合知识图谱,确定第二输出特征;
所述特征交互模块根据所述输入特征,确定所述输入特征的二阶交互关系和线性关系;
对所述线性关系分配对应的线性权重系数,并根据所述线性权重系数得到线性输出结果;
对所述二阶交互关系,计算每一对特征组合的间互相,将全部特征组合的交互项相加,得到交互输出结果;
将所述线性输出结果和所述交互输出结果相加,得到所述第二输出特征
将所述第一输出特征和所述第二输出特征进行非线性结合,得到所述推荐用药结果。
本发明实施例的第二方面,提供了一种基于知识图谱的病情诊断辅助系统,包括:
第一单元,用于获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体;
第二单元,用于根据所述医学实体和预设的初始医学图谱,确定第一实体节点,根据所述第一实体节点和所述初始医学图谱得到连接边,基于所述连接边和预设的动态权重分配算法确定第一融合图谱,对所述第一实体节点进行更新,得到第二实体节点,根据所述第二实体节点,连接边和所述第一融合图谱进行医学知识融合,得到融合知识图谱;
第三单元,用于基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将所述第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本申请的技术方案围绕大样本名医验案,以病机辨识经验知识模块研究为核心,通过宏观与微观、辨证与辨病相结合,实现从整体到局部、从宏观到微观,既全面又细致,既规范又灵活,真实地刻画出病机辨识信息表征模块系统,使得名医临床思维与大数据分析技术充分融合,这一基于名医临床“真实世界”的实际应用研究成果,可供临床中医比对学习,提高临床疗效。既能够突出中医传承特色,又能够创新中医新理论,培养一批原汁原味“真中医”的中医后备人才。
本申请的技术方案在传统工作的基础上,采用智能技术支持的机器学习与模式识别技术,创建病机辨治重大慢性疾病经验知识元模块网络学习决策支持系统,实现名医临床经验及思维过程等知识要素“真实世界”的构建,并实现同步比对学习应用,基于“人机结合,以人为主”对名医病机辨治经验知识元模块进行数据挖掘及深度研读、名医定性访谈。
附图说明
图1为本发明实施例一种基于知识图谱的病情诊断辅助方法的流程示意图;
图2为本发明实施例一种基于知识图谱的病情诊断辅助系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例一种基于知识图谱的病情诊断辅助方法的流程示意图,如图1所示,所述方法包括:
S1.获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体;
随着技术的不断迭代发展,文本信息量呈指数级增长,在这些文本信息中蕴含了大量有价值的信息,为了快速获取大规模文本数据中的有用信息,需要进行知识抽取;
如何从多源异构的数据源中抽取实体,是本环节需要解决的关键问题。
医学实体,通常指医学领域中的各种重要实体或概念,通常与疾病、症状、药物、医学专业术语等,精确地抽取和理解这些医学实体对于医学研究、临床决策、医学文献分析和医疗信息系统等方面都至关重要。
属性抽取,和医学实体抽取相同,是知识抽取的重要组成部分,指从多元数据集中提取某一实体的相关属性信息,这些属性可以是描述性信息,如大小,颜色,形状等,也可以是实体的关系,行为和性质等。
在一种可选的实施方式中,
获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体包括:
所述知识抽取模块包括文义识别模块和约束模块;
所述文义识别模块中的词嵌入单元将所述待分析语句中每个词转换为向量,根据所述向量,通过双向识别单元,确定当前向量对应的词的上下文信息;
文义识别模块,是自然语言处理中的一个关键组件,旨在理解文本中的语义和意义,而不仅仅是对文本的表面形式进行处理,文义识别的目标是捕捉文本中的含义、上下文和关系,以便更深入地理解和分析文本数据。
双向识别单元是一种深度学习中的模型组件,通常用于处理序列数据,以捕获序列中每个元素的上下文信息。双向识别单元的核心思想是同时考虑序列中每个元素的过去和未来上下文,从而更全面地理解序列数据。
加载所选的预训练词嵌入模型,获取所述待分析语句,对待分析的语句进行文本预处理,包括分词、去除标点符号、转换为小写等操作;
对于每个词,查询预训练的词嵌入模型以获取对应的词向量,其中该词向量通常是固定维度的实数向量;
为了确定每个词的上下文信息,使用双向循环神经网络处理文本,通过从左到右和从右到左的方式,对每个词进行处理,从而捕捉其上下文信息。
根据所述上下文信息,所述双向识别单元通过输入门对所述上下文信息进行筛选,确定输入信息;
根据文本中的每个词,获取其上下文信息,对于每个词的上下文信息,计算输入门的值,其中,输入门是一个在0到1之间的值,用于控制上下文信息的保留或丢弃。
使用输入门的值来加权上下文信息。具体地,将输入门的值与上下文信息相乘,以缩小或放大上下文信息的权重。
对于每个词,根据筛选后的上下文信息,对这些信息进行整合,以获取句子或文本的最终含义。
根据所述输入信息,通过遗忘门确定当前双向识别单元内需要丢弃的信息,确定保留信息;
获取所述输入信息,将所述输入数据中的每个元素进行编码,对于每个时间步,计算遗忘门的值,遗忘门是一个在0到1之间的值,用于控制当前时间步需要保留的信息;
使用遗忘门的值加权当前时间步的信息和前一时间步的信息,以确定需要保留的信息和需要丢弃的信息的权重;
根据所述保留信息,通过输出门确定需要输出的信息,生成输出序列;
获取所述保留信息,计算所述输出门的值,用于控制当前时间步需要输出的信息为多少;
使用输出门的值加权当前时间步的保留信息,得到输出门输出信息,并使用该输出信息生成下一个词语或字符;
重复上述操作,直至生成完整的输出序列;
对所述输出序列的每个位置,根据注意力分配机制,生成注意力权重参数,根据所述注意力权重参数对所述输出序列进行加权计算,得到标签序列;
接在所述输出序列,根据所述输出序列的位置,初始化注意力权重参数,使用点积注意力、加性注意力或多头注意力计算该位置与输入序列中各个位置之间的注意力分数,
对计算得到的注意力分数应用激活函数确保分数归一化到0到1之间,并且加和为1;
将输入序列的每个位置与对应的注意力分数相乘,然后对所有位置求和计算输出序列的每个位置的加权和;
根据计算得到的加权和,生成标签序列。
所述约束模型根据所述标签序列,设置约束条件,确定所述约束模型的目标函数;
获取标签序列,约束模型根据任务要求将所述标签序列转化为约束条件,以确保标签序列的连续性;
基于约束条件,定义约束模型的目标函数,所述目标函数旨在满足约束条件的同时,最大化或最小化某个性能指标;
通过数值优化方法,如梯度下降,线性规划等技术,确定满足约束条件的最佳标签序列;
根据所述预先引入的全局特征,确定所述全局特征的权重值,根据所述权重值将所述全局特征与预设的局部特征加入至所述目标函数,得到改进的目标函数;
全局特征是指在整个数据集或数据样本中都具有一致性或共性的特征。这些特征通常对整体数据分布和趋势产生影响;
局部特征是指在数据集或数据样本的局部区域或子集中具有显著性或独特性的特征,局部特征通常与数据的特定子集或子群相关联。
加载目标函数,以及预设的全局特征和局部特征,对所述局部特征和全局特征进行预处理,如缺失值处理,标准化,编码等操作;
根据领域知识,特征选择算法等,确定所述全局特征的权重值;
将全局特征的权重值通过线性组合,加权求和等方式应用于目标函数,得到所述改进的目标函数;
根据所述改进的目标函数,确定所述医学实体;
其中,所述全局特征包括标签特征的统计属性,标签之间的关联和标签的先验概率。
在一种可选的实施方式中,
所述预设的全局特征如下表达式所示:
其中,y表示标签序列,x表示输入信息,N表示序列长度,K表示全局特征函数的数量,fk表示第k个全局特征函数,wk表示第k个全局特征函数的权重;
在本函数中,使用全局特征模型,根据任务和数据选择合适的全局特征函数和权重,可以改善序列标注任务的性能,同时,使用通过全局特征可以帮助模型适应不同类型的序列标注任务,全局特征还能帮助模型捕捉序列中的全局结构和依赖关系。
所述改进的目标函数如下表达式所示:
其中,exp表示指数函数,Score(y,x)表示约束模型的得分函数,通常是局部特征的加权和,y1表示所有可能的标签序列,λk表示与第k个全局特征相关联的权重参数。
改进的目标函数根据任务需求自定义全局特征函数和相关权重参数,使模型可以适应不同类型的序列标注任务,使用归一化对数概率帮助模型更好地选择标签序列,考虑了所有可能的标签序列而不是仅考虑最优序列,提高了标签的准确性。
该步骤利用知识抽取模块自动识别文本中的医学实体减轻了医生的工作负担,通过确定文义信息和应用注意力机制,更好地理解医学文本的语境,保证医学实体被最大限度的标记和识别。
S2.根据所述医学实体和预设的初始医学图谱,确定第一实体节点,根据所述第一实体节点和所述初始医学图谱得到连接边,基于所述连接边和预设的动态权重分配算法确定第一融合图谱,对所述第一实体节点进行更新,得到第二实体节点,根据所述第二实体节点,连接边和所述第一融合图谱进行医学知识融合,得到融合知识图谱;
所述初始医学图谱是根据现实世界中医学书籍和名医诊断案例等知识进行构建的,包括病例,病理,历史病历和药物特征,药物的作用关系等;
所述连接边表示各医学实体节点间的联系,可以表示不同病症间的相同点,或药物对于不同病症的作用等信息的综合表述;
所述动态权重分配算法是一种在不同情境下或不同数据条件下自动调整权重的算法,以适应不同的需求和优化目标;
所述实体节点是将所述医学实体加入至图谱后医学实体的表现形式;
通过知识抽取得到的数据需要经过知识融合这一环节,这是由于这些数据中或内容不全、内容重复,甚至内容错误,数据间的关系是缺乏层次性和逻辑性。知识融合通过引入第三方库可以整合相同知识、补齐缺失的知识、消除知识间的矛盾和歧义,从而保证知识的质量。
融合医学实体和实例是该步骤的目标,将多个来源的数据中关于同一个医学实体或概念的描述进行融合,从而形成大规模的医学知识图谱。
在一种可选的实施方式中,
根据所述医学实体和预设的初始医学图谱,进行医学知识融合,得到融合知识图谱包括:
将所述医学实体作为新的医学实体节点,嵌入至所述初始医学图谱,记为第一实体节点;
获取初始医学图谱,该图谱包含预先输入医学实体,医学实体间的关系、属性和链接信息;
获取上一步骤中得到的医学实体,为这些医学实体定义属性和与其他预输入的实体间的关系;
利用图嵌入技术将新的医学实体节点嵌入至初始医学图谱中,确定所述第一实体节点;
其中图嵌入技术是将节点映射到低维度向量空间的方法,以保留节点之间的关系;
将所述第一实体节点与其他医学实体节点进行连接,生成连接边,根据动态权重分配算法为所述连接边分配权重,生成第一医学图谱;
对第一实体节点与其他医学实体节点之间建立连接边,选择适当的动态权重分配算法为每个连接边定义权重,该权重根据连接边的类型、实体之间的关联度、历史数据或其他相关信息来确定;
所述动态权重分配算法是基于反馈信息、实体属性的相似度、时间序列数据或其他上下文信息的算法。
根据连接边和分配的权重,生成第一医学图谱。这个图谱可以是一个图数据结构,其中节点表示医学实体,边表示连接关系,权重表示边的重要性。
根据所述连接边,确定所述第一医学图谱中对应的第一实体节点,根据自适应学习算法更新第一实体节点信息,得到第二实体节点;
遍历第一医学图谱中的连接边,确定连接到第一实体节点的其他医学实体节点;
利用选定的自适应学习算法,根据连接边的权重和相关实体节点的信息,通过特征的加权组合、梯度更新或其他方式,更新第一实体节点的特征向量;
基于更新后的第一实体节点信息,生成第二实体节点。
基于所述第二实体节点,所述连接边和所述第一医学图谱,通过融合算法确定所述融合知识图谱;
获取所述第一医学图谱和所述第二实体节点;
确定所述融合算法,将第二实体节点融合到第一医学图谱中,该融合算法可以是图融算法,知识图谱融合算法,图卷积网络等,具体的选择标准根据任务的需要和具体数据库确定;
根据选择的融合算法,将第二实体节点添加到第一医学图谱中、更新连接边权重、合并节点信息,生成融合知识图谱;
在一种可选的实施方式中,
根据动态权重分配算法为所述连接边分配权重包括:
计算所述连接边的置信度和重要性,得到置信度分数和重要性分数;
所述置信度是用于衡量假设、规则或关联性的可信程度,通常用于关联规则挖掘和数据挖掘等领域;
置信度分数用于衡量连接边的可信度或准确性,表示连接边所代表的关系或关联的信任程度,较高的置信度分数意味着连接边更可信;
重要性分数用于衡量连接边在整个知识图谱中的重要性或影响力,重要性分数表示连接边在知识图谱中的地位;
获取连接边的相关数据,基于机器学习模型或统计方法,计算置信度和重要性;
对于每个连接边,基于连接边的属性、历史数据和其他相关信息,根据所选的计算方法计算置信度分数和重要性分数;
对所述置信度分数和重要性分数,进行归一化操作,得到归一化数值;
对于计算出的置信度分数和重要性分数,确定他们的最大值和最小值,以确定归一化范围;
根据确定的范围,根据归一化公式计算所述归一化数值;
根据所述归一化数值对每个连接边分配权重。
获取每个连接边的归一化数值;
根据归一化数值,选择权重分配策略,通常包括线性权重分配,指数权重分配和自定义权重分配等;
根据选择的权重分配策略,将权重分配给每个连接边。
在一种可选的实施方式中,
根据所述归一化数值对每个连接边分配权重如下公式所示:
其中,Wr表示连接边r的权重,k表示控制权重分布形状的参数,ρ1表示置信度分数归一化后的值,ρ2表示重要性分数归一化后的值,c表示阈值参数。
通过使用该公式,可以更好地捕捉连接边重要性与置信度和重要性分数间的复杂关系,同时通过控制权重分布形状的参数,可以适应不同任务和数据的分布,同时根据具体的归一化数值,获得不同的权重,能够更好地反应每个连接边的特性。
在一种可选的实施方式中,
根据所述连接边,确定所述第一医学图谱中对应的第一实体节点,根据自适应学习算法更新所述第一实体节点信息,得到第二实体节点包括:
获取连接边信息,确定与所述连接边相关的第一实体节点,生成第一节点集合;
获取连接边的信息,包括连接边的类型、连接的起始和结束节点、连接边的属性、权重等;
遍历连接边信息,通过查看连接边的起始节点或结束节点确定每个连接边所连接的第一实体节点;
基于确定的第一实体节点,生成第一节点集合。这个集合包含了与连接边相关的第一实体节点;
对于所述第一节点集合内的每一个节点,根据所述连接边的信息和节点历史关系信息,结合损失函数,确定对应的更新向量;
遍历第一节点集合,对于每一个节点,获取与当前节点相关的连接边信息,包括连接边的类型、属性、权重,该节点与其他节点之间的历史关系信息;
所述历史关系信息包括该节点之前的连接边、属性或状态信息;
根据任务和需求,定义一个损失函数,用于衡量节点更新质量的目标函数;
为当前节点初始化一个更新向量,通常可以将其初始化为零向量或根据任务要求进行其他初始化;
使用迭代优化算法(如梯度下降、随机梯度下降等),根据损失函数和连接边信息,通过反复计算梯度来最小化损失函数,以获得最佳的节点更新向量;
更新向量通常是一个向量,它描述了如何更新节点的属性或状态,以最小化损失函数。
将计算得到的更新向量应用于当前节点,以更新其属性或状态,该更新可以为增量式更新或替换性更新;
检查迭代优化算法是否满足终止条件,如达到最大迭代次数、损失函数收敛等。如果满足条件,停止迭代。
根据所述更新向量,计算所述第一节点的梯度值,结合所述梯度值确定所述第二实体节点。
使用已经计算得到的第一节点的更新向量和损失函数,计算第一节点的梯度值。
其中,梯度值表示了损失函数关于第一节点的变化率,通常使用梯度下降或其他优化算法来计算。
根据计算得到的梯度值,结合连接边信息和节点历史关系信息,确定第二实体节点,可以基于不同的策略来确定第二实体节点,如选择梯度值最大的节点或根据任务需求选择合适的节点;
重复上述步骤,计算和确定第一节点集合内每个节点的梯度值和对应的第二实体节点。
通过该步骤,系统可以根据连接边的重要性,调整知识图谱中不同部分的权重,可以更好地反应医学知识的分布,通过知识图谱更新,系统可以根据当前的医学知识和任务需求,动态更新知识图谱中的节点信息,根据医学知识融合可以更准确地表示医学知识,综上,该步骤能够帮助医生和患者更好地理解疾病和治疗方案,提高病情诊断的准确性和效率。
S3.基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将所述第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。
临床医生的用药选择是一个综合的决策过程,不仅是对患者特征和药物特征的匹配,同时也是结合患者历史病情信息综合考量的结果。
所述患者基本信息包括接收输入患者的个人信息、现病史信息等,还包括患者对自己主观感觉到的不适症状的叙述;
用药历史信息具体为患者过去使用过的所有药物,包括药物的名称、剂量、用法和用药频率,以及是否对某些药物存在过敏反应或不良反应的历史;
非线性结合是一种将多个元素或数据以非线性方式组合在一起的过程,可以用于多种目的,包括特征工程、模型建设和数据分析。
在一种可选的实施方式中,
基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定推荐用药结果包括:
所述用药推荐模型包括输入整合模块和特征交互模块;
获取所述患者基本信息和用药历史信息,结合所述融合知识图谱,通过所述用药推荐模型中的输入整合模块,确定所述第一输出特征:
获取患者的基本信息,包括姓名、年龄、性别、病史等。同时,获取用药历史信息,包括已使用的药物名称、剂量、用法、用药时间等;
利用融合知识图谱,执行查询操作,以获取与患者基本信息和用药历史相关的医学知识;
将患者基本信息、用药历史信息和从知识图谱中获取的医学知识整合到一个数据结构中;
使用用药推荐模型中的输入整合模块,将整合后的数据传递给模型;
在用药推荐模型中,根据整合的数据和模型的训练,确定第一输出特征;
将确定的第一输出特征保存下来,以备后续的病情诊断、药物推荐或其他医疗决策任务使用;
所述输入整合模块提取所述患者基本信息和用药历史信息文本中的输入特征,根据所述输入特征,确定输入特征的均值和方差;
从患者基本信息和用药历史信息文本中提取文本数据;
使用自然语言处理(NLP)技术或文本特征提取方法,从文本数据中提取有用的特征;
将提取的文本特征合并到一个整体的输入特征向量中,该特征向量包括来自基本信息和用药历史信息的多个特征,每个特征对应一个文本提取特征;
使用构建好的输入特征向量,计算输入特征的均值和方差。这可以通过简单地计算向量中所有值的均值和方差来完成;
根据所述均值和方差,对输出值进行标准化操作,得到标准化输出特征;
其中标准化值等于原始值和均值的差值与方差的平方根的比值,其中原始值是特征序列中的每个值;
根据所述标准化输出特征,进行平移和缩放操作,并应用激活函数,得到所述第一输出特征;
特征交互模块根据所述患者基本信息和用药历史信息,结合所述融合知识图谱,确定第二输出特征;
患者的基本信息和用药历史信息,对于基本信息和用药历史信息,执行特征工程操作,该操作包括文本特征提取、数值特征提取、独热编码、词嵌入等,以将信息转换为可用于建模的特征表示;
在特征交互模块中,将不同来源的特征进行交互和组合;
使用组合后的特征向量作为输入,建立机器学习模型或深度学习模型来预测第二输出特征,该第二输出特征是与患者的疾病风险、治疗建议、药物推荐等相关的信息。
所述特征交互模块根据所述输入特征,确定所述输入特征的二阶交互关系和线性关系;
从数据源中获取已经准备好的输入特征,对输入特征进行进一步的特征工程,包括数据清洗、缺失值填充、特征缩放等;
通过线性回归或线性模型,使用普通最小二乘法(OLS)等线性回归技术,学习特征之间的线性关系;
使用多项式特征或交叉特征,捕获输入特征之间的非线性关系;
对所述线性关系分配对应的线性权重系数,并根据所述线性权重系数得到线性输出结果;
对每个特征选择适合任务的线性回归模型,使用训练数据对线性回归模型进行训练,确定最佳的权重系数;
使用训练得到的权重系数和测试或新数据中的特征值,通过线性回归模型计算线性输出结果;
对所述二阶交互关系,计算每一对特征组合的间互相,将全部特征组合的交互项相加,得到交互输出结果;
遍历所有的特征组合,对每一对特征计算其交互项;
将所有交互项相加以得到交互输出结果,如果存在更高阶的交互项,将它们添加到交互输出结果中;
将所述线性输出结果和所述交互输出结果相加,得到所述第二输出特征;
将所述第一输出特征和所述第二输出特征进行非线性结合,得到所述推荐用药结果。
图为本发明实施例一种基于知识图谱的病情诊断辅助系统的结构示意图,如图2所示,所述系统包括:
第一单元,用于获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体;
第二单元,用于根据所述医学实体和预设的初始医学图谱,确定第一实体节点,根据所述第一实体节点和所述初始医学图谱得到连接边,基于所述连接边和预设的动态权重分配算法确定第一融合图谱,对所述第一实体节点进行更新,得到第二实体节点,根据所述第二实体节点,连接边和所述第一融合图谱进行医学知识融合,得到融合知识图谱;
第三单元,用于基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将所述第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于知识图谱的病情诊断辅助方法,其特征在于,包括:
获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体;
根据所述医学实体和预设的初始医学图谱,确定第一实体节点,根据所述第一实体节点和所述初始医学图谱得到连接边,基于所述连接边和预设的动态权重分配算法确定第一融合图谱,对所述第一实体节点进行更新,得到第二实体节点,根据所述第二实体节点,连接边和所述第一融合图谱进行医学知识融合,得到融合知识图谱;
基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将所述第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。
2.根据权利要求1所述的方法,其特征在于,获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体包括:
所述知识抽取模块包括文义识别模块和约束模块;
所述文义识别模块中的词嵌入单元将所述待分析语句中每个词转换为向量,根据所述向量,通过双向识别单元,确定当前向量对应的词的上下文信息;
根据所述上下文信息,所述双向识别单元通过输入门对所述上下文信息进行筛选,确定输入信息;
根据所述输入信息,通过遗忘门确定当前双向识别单元内需要丢弃的信息,确定保留信息;
根据所述保留信息,通过输出门确定需要输出的信息,生成输出序列;
对所述输出序列的每个位置,根据注意力分配机制,生成注意力权重参数,根据所述注意力权重参数对所述输出序列进行加权计算,得到标签序列;
所述约束模型根据所述标签序列,设置约束条件,确定所述约束模型的目标函数;
根据所述预先引入的全局特征,确定所述全局特征的权重值,根据所述权重值将所述全局特征与预设的局部特征加入至所述目标函数,得到改进的目标函数;
根据所述改进的目标函数,确定所述医学实体;
其中,所述全局特征包括标签特征的统计属性,标签之间的关联和标签的先验概率。
3.根据权利要求2所述的方法,其特征在于,所述预设的全局特征如下表达式所示:
其中,y表示标签序列,x表示输入信息,N表示序列长度,K表示全局特征函数的数量,fk表示第k个全局特征函数,wk表示第k个全局特征函数的权重;
所述改进的目标函数如下表达式所示:
其中,exp表示指数函数,Score(y,x)表示约束模型的得分函数,通常是局部特征的加权和,y1表示所有可能的标签序列,λk表示与第k个全局特征相关联的权重参数。
4.根据权利要求1所述的方法,其特征在于,根据所述医学实体和预设的初始医学图谱,进行医学知识融合,得到融合知识图谱包括:
将所述医学实体作为新的医学实体节点,嵌入至所述初始医学图谱,记为第一实体节点;
将所述第一实体节点与其他医学实体节点进行连接,生成连接边,根据动态权重分配算法为所述连接边分配权重,生成第一医学图谱;
根据所述连接边,确定所述第一医学图谱中对应的第一实体节点,根据自适应学习算法更新第一实体节点信息,得到第二实体节点;
基于所述第二实体节点,所述连接边和所述第一医学图谱,通过融合算法确定所述融合知识图谱。
5.根据权利要求4所述的方法,其特征在于,根据动态权重分配算法为所述连接边分配权重包括:
计算所述连接边的置信度和重要性,得到置信度分数和重要性分数;
对所述置信度分数和重要性分数,进行归一化操作,得到归一化数值;
根据所述归一化数值对每个连接边分配权重。
6.根据权利要求5所述的方法,其特征在于,根据所述归一化数值对每个连接边分配权重如下公式所示:
其中,Wr表示连接边r的权重,k表示控制权重分布形状的参数,ρ1表示置信度分数归一化后的值,ρ2表示重要性分数归一化后的值,c表示阈值参数。
7.根据权利要求4所述的方法,其特征在于,根据所述连接边,确定所述第一医学图谱中对应的第一实体节点,根据自适应学习算法更新所述第一实体节点信息,得到第二实体节点包括:
获取所述连接边信息,确定与所述连接边相关的第一实体节点,生成第一节点集合;
对于所述第一节点集合内的每一个节点,根据所述连接边的信息和节点历史关系信息,结合损失函数,确定对应的更新向量;
根据所述更新向量,计算所述第一节点的梯度值,结合所述梯度值确定所述第二实体节点。
8.根据权利要求1所述的方法,其特征在于,基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定推荐用药结果包括:
所述用药推荐模型包括输入整合模块和特征交互模块;
获取所述患者基本信息和用药历史信息,结合所述融合知识图谱,通过所述用药推荐模型中的输入整合模块,确定所述第一输出特征:
所述输入整合模块提取所述患者基本信息和用药历史信息文本中的输入特征,根据所述输入特征,确定输入特征的均值和方差;
根据所述均值和方差,对输出值进行标准化操作,得到标准化输出特征;
根据所述标准化输出特征,进行平移和缩放操作,并应用激活函数,得到所述第一输出特征;
特征交互模块根据所述患者基本信息和用药历史信息,结合所述融合知识图谱,确定第二输出特征;
所述特征交互模块根据所述输入特征,确定所述输入特征的二阶交互关系和线性关系;
对所述线性关系分配对应的线性权重系数,并根据所述线性权重系数得到线性输出结果;
对所述二阶交互关系,计算每一对特征组合的间互相,将全部特征组合的交互项相加,得到交互输出结果;
将所述线性输出结果和所述交互输出结果相加,得到所述第二输出特征
将所述第一输出特征和所述第二输出特征进行非线性结合,得到所述推荐用药结果。
9.一种基于知识图谱的病情诊断辅助系统,其特征在于,包括:
第一单元,用于获取待分析语句,根据预设的知识抽取模块,确定文义信息,根据所述文义信息,结合注意力分配机制,得到标签序列,根据所述标签序列,结合预先引入的全局特征,确定医学实体;
第二单元,用于根据所述医学实体和预设的初始医学图谱,确定第一实体节点,根据所述第一实体节点和所述初始医学图谱得到连接边,基于所述连接边和预设的动态权重分配算法确定第一融合图谱,对所述第一实体节点进行更新,得到第二实体节点,根据所述第二实体节点,连接边和所述第一融合图谱进行医学知识融合,得到融合知识图谱;
第三单元,用于基于患者基本信息和用药历史信息,结合所述融合知识图谱,结合预设的用药推荐模型,确定第一输出特征和第二输出特征,将所述第一输出特征和第二输出特征进行非线性结合,确定推荐用药结果。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至8中任意一项所述的方法。
CN202311273965.3A 2023-09-28 2023-09-28 基于知识图谱的病情诊断辅助方法及系统 Pending CN117238437A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311273965.3A CN117238437A (zh) 2023-09-28 2023-09-28 基于知识图谱的病情诊断辅助方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311273965.3A CN117238437A (zh) 2023-09-28 2023-09-28 基于知识图谱的病情诊断辅助方法及系统

Publications (1)

Publication Number Publication Date
CN117238437A true CN117238437A (zh) 2023-12-15

Family

ID=89085899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311273965.3A Pending CN117238437A (zh) 2023-09-28 2023-09-28 基于知识图谱的病情诊断辅助方法及系统

Country Status (1)

Country Link
CN (1) CN117238437A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558393A (zh) * 2024-01-12 2024-02-13 成都市龙泉驿区中医医院 基于人工智能的肛肠患者信息整理方法及系统
CN118016316A (zh) * 2024-04-10 2024-05-10 健数(长春)科技有限公司 知识图谱结合血常规检验数据的疾病筛率提升方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558393A (zh) * 2024-01-12 2024-02-13 成都市龙泉驿区中医医院 基于人工智能的肛肠患者信息整理方法及系统
CN117558393B (zh) * 2024-01-12 2024-03-19 成都市龙泉驿区中医医院 基于人工智能的肛肠患者信息整理方法及系统
CN118016316A (zh) * 2024-04-10 2024-05-10 健数(长春)科技有限公司 知识图谱结合血常规检验数据的疾病筛率提升方法和系统
CN118016316B (zh) * 2024-04-10 2024-06-04 健数(长春)科技有限公司 知识图谱结合血常规检验数据的疾病筛率提升方法和系统

Similar Documents

Publication Publication Date Title
US20210034813A1 (en) Neural network model with evidence extraction
CN111753543A (zh) 药物推荐方法、装置、电子设备及存储介质
CN112149414B (zh) 文本相似度确定方法、装置、设备及存储介质
CN117238437A (zh) 基于知识图谱的病情诊断辅助方法及系统
JP7357614B2 (ja) 機械支援対話システム、ならびに病状問診装置およびその方法
EP3910527A2 (en) Medical data verification method, apparatus and electronic device
US20200311610A1 (en) Rule-based feature engineering, model creation and hosting
CN113707307A (zh) 病情分析方法、装置、电子设备及存储介质
WO2021164388A1 (zh) 分诊融合模型训练方法、分诊方法、装置、设备及介质
CN113707339B (zh) 一种多源异质数据库间概念对齐与内容互译方法及系统
CN116994694B (zh) 基于信息提取的患者病历数据筛选方法、装置和介质
CN116383413B (zh) 基于医疗数据提取的知识图谱更新方法和系统
CN110517767A (zh) 辅助诊断方法、装置、电子设备及存储介质
CN114708952B (zh) 一种图像标注方法、装置、存储介质和电子设备
Gargiulo et al. A clustering based methodology to support the translation of medical specifications to software models
CN117854665A (zh) 儿科患者电子健康记录系统
Jia et al. DKDR: An approach of knowledge graph and deep reinforcement learning for disease diagnosis
CN117637175A (zh) 基于多级语义的大模型医疗训练数据生成方法和系统
CN113722507A (zh) 基于知识图谱的住院费用预测方法、装置及计算机设备
CN110633363A (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法
US20240203569A1 (en) Intelligent triage method and device, storage medium and electronic device
Permanasari et al. A web-based decision support system of patient time prediction using iterative dichotomiser 3 algorithm
CN114398497A (zh) 一种信息生成方法、装置、设备及存储介质
Jasim et al. Developing a software for diagnosing heart disease via data mining techniques
Gupta A MACHINE LEARNING BASESD HEALTHCARE DIAGNOSTIC MODEL

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination