CN112820400A - 基于医疗知识图谱知识推理的疾病诊断方法、装置、设备 - Google Patents

基于医疗知识图谱知识推理的疾病诊断方法、装置、设备 Download PDF

Info

Publication number
CN112820400A
CN112820400A CN202110113829.2A CN202110113829A CN112820400A CN 112820400 A CN112820400 A CN 112820400A CN 202110113829 A CN202110113829 A CN 202110113829A CN 112820400 A CN112820400 A CN 112820400A
Authority
CN
China
Prior art keywords
probability
disease
user
medical
symptom
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110113829.2A
Other languages
English (en)
Other versions
CN112820400B (zh
Inventor
王华珍
许泽
刘晓聪
何霆
李弼程
缑锦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN202110113829.2A priority Critical patent/CN112820400B/zh
Publication of CN112820400A publication Critical patent/CN112820400A/zh
Application granted granted Critical
Publication of CN112820400B publication Critical patent/CN112820400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于医疗知识图谱知识推理的疾病诊断方法、装置及设备,方法包括:获取用户
Figure DDA0002919873040000011
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure DDA0002919873040000012
的用户症状集;根据所述用户症状集,计算所述用户
Figure DDA0002919873040000013
存在事件
Figure DDA0002919873040000014
的第一概率
Figure DDA0002919873040000015
根据所述第一概率
Figure DDA0002919873040000016
计算用户S与di病共现的第二概率
Figure DDA0002919873040000017
根据所述第一概率
Figure DDA0002919873040000018
与第二概率
Figure DDA0002919873040000019
计算用户
Figure DDA00029198730400000110
患di病的第三概率
Figure DDA00029198730400000111
基于动态阈值以及所述第三概率,输出用户
Figure DDA00029198730400000112
的最终疾病诊断结果。本发明既可以作为医生诊断的辅助工具,提高医生的工作效率,也可以用于患者的初步自查,还可以服务于高层次人工智能医疗应用,例如医疗问答系统、医疗辅助诊断、私人人工智能健康助理等。

Description

基于医疗知识图谱知识推理的疾病诊断方法、装置、设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于医疗知识图谱知识推理的疾病诊断方法、装置、设备。
背景技术
随着互联网的飞速发展,越来越多的人通过网络来获取医学知识。人们使用自然语言咨询相关医学知识、描述自己的病情等,从而得到精确且简短的回答。医疗领域问答系统的研究具有重要意义,其不仅可为医生提供决策支持,而且可为患者提供准确有效的健康服务,帮助他们参与自己的健康决策。医疗领域问答系统的核心是疾病诊断模型。随着医疗数据的不断积累,现代医疗信息系统一般通过收集大量数据信息,使用深度学习、统计学习等方法来构建诊断决策模型。但由于医学数据呈现知识分布稀疏,数据噪声大,语义维度高等特点,通过大数据统计分析构建医学诊断模型难度较大且可靠度较低。
知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。知识图谱是人工智能技术的重要分支,在搜索引擎构建、自然语言处理、智能情景分析等领域发挥着重要作用。在医学领域中,知识图谱能够将病历文书、文献资料、电子病历等非结构文本数据进行数据结构化,进而可以更高效地整合临床实践数据为后续更广泛的智慧医疗应用提供可靠的数据依托。
知识图谱的知识推理在挖掘结构化数据潜在价值方面得到关注。知识推理是从已知的事实出发进行分析综合和决策,以及通过运用已掌握的知识发现隐藏在其中的事实或者归纳出新的事实的过程,是通过某种策略由已知推未知的判断。从技术实现的角度看,实现知识图谱推理的方法有两大类型。第一种是基于规则和逻辑的推理方法,即给出全面的规则和本体约束获得知识推理结果,这种方法本质上是知识的逻辑推理。第二种类型是基于神经网络的方法,即利用神经网络的学习能力把知识图谱进行分布式表示,进而利用知识的向量表示特征实现知识的推理。通过神经网络得到的模型一般不具有解释性,呈现黑箱特征。而医学诊断对知识推理的可解释性要求很高,并不适合使用后者方法进行知识推理。
发明内容
有鉴于此,本发明的目的在于提供一种基于医疗知识图谱知识推理的疾病诊断方法、装置、设备,以解决上述问题。
本发明实施例提供了一种基于医疗知识图谱知识推理的疾病诊断方法,其包括:
获取用户
Figure BDA0002919873020000021
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure BDA0002919873020000022
的用户症状集;
根据所述用户症状集,计算所述用户
Figure BDA0002919873020000031
存在事件
Figure BDA0002919873020000032
的第一概率
Figure BDA0002919873020000033
其中,医疗知识图谱G存储有包含各种疾病的集合D={d1,d2,d3,…,dn},d1,d2,d3,…,dn为各种疾病;事件
Figure BDA0002919873020000034
为集合Di中的疾病同时发生且D-Di中的疾病均不发生;
根据所述第一概率
Figure BDA0002919873020000035
计算用户S与
Figure BDA0002919873020000036
病共现的第二概率
Figure BDA0002919873020000037
根据所述第一概率
Figure BDA0002919873020000038
与第二概率
Figure BDA0002919873020000039
计算用户
Figure BDA00029198730200000310
Figure BDA00029198730200000311
病的第三概率
Figure BDA00029198730200000312
基于动态阈值以及所述第三概率,输出用户
Figure BDA00029198730200000313
的最终疾病诊断结果。
优选地,获取用户
Figure BDA00029198730200000314
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure BDA00029198730200000315
的用户症状集,具体为:
根据所述交互内容获取用户
Figure BDA00029198730200000316
的显现症状集;
根据所述显现症状集在医疗知识图谱G中检索出用户的未显现症状集;其中,医疗知识图谱G存储有包含各种症状的症状集合S={s1,s2,s3,…,sm};未显现症状集是用户症状对应的疾病所关联的症状中不包含用户显现症状的集合;
根据所述显现症状集以及所述未显现症状集生成所述用户症状集。
优选地,所述第一概率
Figure BDA00029198730200000317
其中,Di为2D中任意一个,即
Figure BDA00029198730200000318
优选地,所述第二概率
Figure BDA00029198730200000319
通过如下公式获得:
Figure BDA0002919873020000041
其中,对
Figure BDA0002919873020000042
按全概率公式展开时,由于
Figure BDA0002919873020000043
不是互斥事件,并不能构成完备事件组,所以设集合
Figure BDA0002919873020000044
使得
Figure BDA0002919873020000045
中疾病构成完备事件组;
Figure BDA0002919873020000046
为完备事件组
Figure BDA0002919873020000047
发生的概率,
Figure BDA0002919873020000048
为完备事件组
Figure BDA0002919873020000049
在用户为
Figure BDA00029198730200000410
下的概率。
优选地,所述第三概率
Figure BDA00029198730200000411
通过如下公式获得:
Figure BDA00029198730200000412
优选地,所述基于动态阈值以及所述第三概率,输出用户
Figure BDA00029198730200000413
的最终疾病诊断结果具体包括:
将用户可能患得的各个疾病按照其对应的第三概率进行降序排列,从而获得概率大于0的降序疾病概率列表Or,即Or=[疾病1:概率1,疾病2:概率2,……]。
设定阈值λ,比较降序疾病概率列表的各个疾病的概率和所设阈值λ,并将概率大于等于所设定的阈值的疾病构建成选中疾病列表Ore输出;将概率小于所设定的阈值的疾病构建成未选中疾病列表Orne用于下一步的筛选;
计算未显现的症状si发生的第四概率
Figure BDA00029198730200000414
Figure BDA00029198730200000415
其中,
Figure BDA00029198730200000416
是症状si在完备事件组
Figure BDA00029198730200000417
的条件下发生的概率;
选取最大概率对应的未显现症状作为最有可能出现的显现症状对用户进行询问;若该显现症状出现,则把该显现症状加入到用户
Figure BDA0002919873020000051
的显现症状集中,重新计算降序疾病概率列表,进而计算不确定度的增量ΔI:
Figure BDA0002919873020000052
其中,
Figure BDA0002919873020000053
表示疾病
Figure BDA0002919873020000054
在交互前后发生概率的增量;
计算动态调整阈值λ′=λ-Δλ=λ-ΔI,选取未选中疾病列表Orne中概率大于当前阈值的疾病构建成交互疾病列表Orei
汇总选中疾病列表Ore和交互疾病列表Orei,形成最终疾病诊断结果列表Oree作为最终疾病诊断结果。
本发明实施例还提供了一种基于医疗知识图谱知识推理的疾病诊断装置,其包括:
交互模块,用于获取用户
Figure BDA0002919873020000055
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure BDA0002919873020000056
的用户症状集;
第一概率计算模块,用于根据所述用户症状集,计算所述用户
Figure BDA0002919873020000057
存在事件
Figure BDA0002919873020000058
的第一概率
Figure BDA0002919873020000059
其中,医疗知识图谱G存储有包含各种疾病的集合D={d1,d2,d3,…,dn},d1,d2,d3,…,dn为各种疾病;事件
Figure BDA00029198730200000510
为集合Di中的疾病同时发生且D-Di中的疾病均不发生;
第二概率计算模块,用于根据所述第一概率
Figure BDA00029198730200000511
计算用户S与
Figure BDA00029198730200000512
病共现的第二概率
Figure BDA00029198730200000513
第三概率计算模块,用于根据所述第一概率
Figure BDA0002919873020000061
与第二概率
Figure BDA0002919873020000062
计算用户
Figure BDA0002919873020000063
Figure BDA0002919873020000064
病的第三概率
Figure BDA0002919873020000065
诊断结果输出模块,用于基于动态阈值以及所述第三概率,输出用户
Figure BDA0002919873020000066
的最终疾病诊断结果。
本发明实施例还提供了一种基于医疗知识图谱知识推理的疾病诊断设备,其包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上述的基于医疗知识图谱知识推理的疾病诊断方法。
综上所述,本实施例通过构建了面向疾病诊断的基于因果推导的知识图谱知识推理模型,其可以根据与用户的交互内容,基于因果推导和知识图谱来推断出用户可能患有的疾病。本发明既可以作为医生诊断的辅助工具,提高医生的工作效率,也可以用于患者的初步自查,还可以服务于高层次人工智能医疗应用,例如医疗问答系统、医疗辅助诊断、私人人工智能健康助理等。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一实施例提供的基于医疗知识图谱知识推理的疾病诊断方法的流程示意图。
图2为本发明实施例中的医疗知识图谱G的部分节点和关系图。
图3为本发明实施例所采用的电子病历的数据示意图。
图4为本发明第二实施例提供的基于医疗知识图谱知识推理的疾病诊断装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明第一实施例提供了一种基于医疗知识图谱知识推理的疾病诊断方法,其可由基于医疗知识图谱知识推理的疾病诊断设备(以下简称疾病诊断设备)来执行,特别的,由所述疾病诊断设备内的一个或者多个处理器来执行,以实现如下步骤:
S101,获取用户
Figure BDA0002919873020000071
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure BDA0002919873020000072
的用户症状集。
具体的,在本实施例中,用户可通过语音或者文字输入等方式来实现与疾病诊断设备内安装的医疗问答系统进行交互,医疗问答系统根据与用户的交互内容进行关键词提取,从而获取用户
Figure BDA0002919873020000081
的显现症状集。
再进一步的,疾病诊断设备还可根据所述显现症状集在医疗知识图谱G中检索出用户的未显现症状集。
其中,在本实施例中,所述医疗知识图谱G存储有包含各种症状的症状集合S={s1,s2,s3,…,sm};未显现症状集是用户症状对应的疾病所关联的症状中不包含用户显现症状的集合。
在本实施例中,在将所述显现症状集和未显现症状集合并后,即可以获得所述用户症状集。
例如,通过医疗问答系统与用户交互,获取到用户
Figure BDA0002919873020000082
的显现症状集为{“咳嗽”、“呼吸困难”、“高热”、“发绀”}。疾病诊断设备根据显现症状集在医疗知识图谱G中检索出用户的未显现症状集={“恶心”},则获得用户症状集={“咳嗽”、“呼吸困难”、“高热”、“发绀”、“恶心”}。
S102,根据所述用户症状集,计算所述用户
Figure BDA0002919873020000083
存在事件
Figure BDA0002919873020000084
的第一概率
Figure BDA0002919873020000085
在本实施例中,所述医疗知识图谱G还存储有包含各种疾病的疾病集合D={d1,d2,d3,…,dn},其中,d1,d2,d3,…,dn为各种疾病。
在本实施例中,事件
Figure BDA0002919873020000086
为集合Di中的疾病同时发生且D-Di中的疾病均不发生,Di为疾病集合D的子集,Di为2D中任意一个,即Di∈{D0,D1,…,D2n-1}。
在本实施例中,例如,自建的医疗知识图谱G中包含7958种疾病和5747种症状,其部分节点和关系如附图2所示。因此医疗知识图谱G中所有疾病的集合D={d1,d2,d3,…,dn}中n=7958;则,
Figure BDA0002919873020000091
S103,根据所述第一概率
Figure BDA0002919873020000092
计算用户S与
Figure BDA0002919873020000093
病共现的第二概率
Figure BDA0002919873020000094
其中:
Figure BDA0002919873020000095
由于对
Figure BDA0002919873020000096
按全概率公式展开时,由于
Figure BDA0002919873020000097
不是互斥事件,并不能构成完备事件组,所以设集合
Figure BDA0002919873020000098
使得
Figure BDA0002919873020000099
中疾病构成完备事件组。
Figure BDA00029198730200000910
为完备事件组
Figure BDA00029198730200000911
发生的概率,
Figure BDA00029198730200000912
为完备事件组
Figure BDA00029198730200000913
在用户为
Figure BDA00029198730200000914
下的概率。
在本实施例中,例如,完备事件组
Figure BDA00029198730200000915
含有145种疾病,则计算出用户与各疾病的共现概率的集合
Figure BDA00029198730200000916
S104,根据所述第一概率
Figure BDA00029198730200000917
与第二概率
Figure BDA00029198730200000918
计算用户
Figure BDA00029198730200000919
Figure BDA00029198730200000920
病的第三概率
Figure BDA00029198730200000921
其中,
Figure BDA00029198730200000922
以上述的数据为例,则可计算用户为
Figure BDA00029198730200000923
条件下患各疾病的概率的集合
Figure BDA00029198730200000924
S105,基于动态阈值以及所述第三概率,输出用户
Figure BDA00029198730200000925
的最终疾病诊断结果。
具体地,步骤S105包括:
S1051,将用户可能患得的各个疾病按照其对应的第三概率进行降序排列,从而获得概率大于0的降序疾病概率列表Or,即Or=[疾病1:概率1,疾病2:概率2,……]。
例如:Or=[“水痘肺炎”:1,“老年人急性呼吸窘迫综合征”:0.333333333333]
S1052,设定阈值λ,比较降序疾病概率列表的各个疾病的概率和所设阈值λ,并将概率大于等于所设定的阈值的疾病构建成选中疾病列表Ore输出;将概率小于所设定的阈值的疾病构建成未选中疾病列表Orne用于下一步的筛选。
例如,设定输出阈值λ为0.5,获得选中疾病列表Ore=[“水痘肺炎”:1],获得未选中疾病列表:Orne=[“老年人急性呼吸窘迫综合征”:0.333333333333]。
S1053,计算未显现的症状si发生的第四概率
Figure BDA0002919873020000101
Figure BDA0002919873020000102
其中,
Figure BDA0002919873020000103
是症状si在完备事件组
Figure BDA0002919873020000104
的条件下发生的概率。
S1054,选取最大概率对应的未显现症状作为最有可能出现的显现症状对用户进行询问;若该显现症状出现,则把该显现症状加入到用户
Figure BDA0002919873020000105
的显现症状集中,重新计算降序疾病概率列表,进而计算不确定度的增量ΔI:
Figure BDA0002919873020000106
其中,
Figure BDA0002919873020000107
表示疾病
Figure BDA0002919873020000108
在交互前后发生概率的增量。
例如,把未显现的症状“恶心”加入到用户
Figure BDA0002919873020000111
的用户症状集中,重复上述步骤计算出新的降序疾病概率列表Or=[“水痘肺炎”:1,“老年人急性呼吸窘迫综合征”:0.333333333333],进而计算不确定度的增量ΔI=0.2037。
S1055,计算动态调整阈值λ′=λ-Δλ=λ-ΔI,选取未选中疾病列表Orne中概率大于当前阈值的疾病构建成交互疾病列表Orei
其中,计算动态调整阈值λ′=λ-ΔI=0.2963,选取未选中疾病列表Orne中概率大于当前阈值λ′的疾病构建成交互疾病列表Orei=[“老年人急性呼吸窘迫综合征”:0.333333333333]。
S1056,汇总选中疾病列表Ore和交互疾病列表Orei,形成最终疾病诊断结果列表Oree作为最终疾病诊断结果。
其中,汇总选中疾病列表Ore和交互疾病列表Orei,形成最终疾病诊断结果列表:Oree=[“水痘肺炎”:1,“老年人急性呼吸窘迫综合征”:0.333333333333]作为最终的疾病诊断结果。
为为验证本发明实施例的的准确性,本发明收集来自某三甲医院144,170条真实有效的电子病历样本,其中某份电子病历数据如图3所示。经过数据处理后得到100,508条有效电子病历数据进行测试。将电子病历的症状作为模型输入,电子病历的诊断结果作为真实标记。将本实施例诊断出的概率最高的疾病和真实标记中的诊断疾病进行比较,若一致则可认为辅助诊断结果正确。设Ir为模型诊断正确的实例的集合,I为测试集所有实例的集合,则准确率(Accuracy)定义为:
Figure BDA0002919873020000121
将被本实施例诊断正确的实例的数量82,537除以测试集所有实例的数量100,508,得到准确率为82.12%,在性能良好且可用的范畴。上述结果表明,本实施例的性能良好,具有较高的临床实用性。
综上所述,本实施例通过构建了面向疾病诊断的基于因果推导的知识图谱知识推理模型,其可以根据与用户的交互内容,基于因果推导和知识图谱来推断出用户可能患有的疾病。本发明既可以作为医生诊断的辅助工具,提高医生的工作效率,也可以用于患者的初步自查,还可以服务于高层次人工智能医疗应用,例如医疗问答系统、医疗辅助诊断、私人人工智能健康助理等。
请参阅图4,本发明第二实施例还提供了一种基于医疗知识图谱知识推理的疾病诊断装置,其包括:
交互模块210,用于获取用户S与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure BDA0002919873020000122
的用户症状集;
第一概率计算模块220,用于根据所述用户症状集,计算所述用户
Figure BDA0002919873020000123
存在事件
Figure BDA0002919873020000124
的第一概率
Figure BDA0002919873020000125
其中,医疗知识图谱G所有疾病的集合为D={d1,d2,d3,…,dn},d1,d2,d3,…,dn为各种疾病;事件
Figure BDA0002919873020000126
为集合Di中的疾病同时发生且D-Di中的疾病均不发生;
第二概率计算模块230,用于根据所述第一概率
Figure BDA0002919873020000127
计算用户S与
Figure BDA0002919873020000128
病共现的第二概率
Figure BDA0002919873020000129
第三概率计算模块240,用于根据所述第一概率
Figure BDA00029198730200001210
与第二概率
Figure BDA00029198730200001211
计算用户
Figure BDA0002919873020000131
Figure BDA0002919873020000132
病的第三概率
Figure BDA0002919873020000133
诊断结果输出模块250,用于基于动态阈值以及所述第三概率,输出用户
Figure BDA0002919873020000134
的最终疾病诊断结果。
本发明第三实施例还提供了一种基于医疗知识图谱知识推理的疾病诊断设备,其包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上述的基于医疗知识图谱知识推理的疾病诊断方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于医疗知识图谱知识推理的疾病诊断方法,其特征在于,包括:
获取用户
Figure FDA0002919873010000011
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure FDA0002919873010000012
的用户症状集;
根据所述用户症状集,计算所述用户
Figure FDA0002919873010000013
存在事件
Figure FDA0002919873010000014
的第一概率
Figure FDA0002919873010000015
其中,医疗知识图谱G存储有包含各种疾病的集合D={d1,d2,d3,…,dn},d1,d2,d3,…,dn为各种疾病;事件
Figure FDA0002919873010000016
为集合Di中的疾病同时发生且D-Di中的疾病均不发生;
根据所述第一概率
Figure FDA0002919873010000017
计算用户S与
Figure FDA00029198730100000117
病共现的第二概率
Figure FDA0002919873010000018
根据所述第一概率
Figure FDA0002919873010000019
与第二概率
Figure FDA00029198730100000110
计算用户
Figure FDA00029198730100000111
患di病的第三概率
Figure FDA00029198730100000112
基于动态阈值以及所述第三概率,输出用户
Figure FDA00029198730100000113
的最终疾病诊断结果。
2.根据权利要求1所述的基于医疗知识图谱知识推理的疾病诊断方法,其特征在于,获取用户
Figure FDA00029198730100000114
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure FDA00029198730100000115
的用户症状集,具体为:
根据所述交互内容获取用户
Figure FDA00029198730100000116
的显现症状集;
根据所述显现症状集在医疗知识图谱G中检索出用户的未显现症状集;其中,医疗知识图谱G存储有包含各种症状的症状集合S={s1,s2,s3,…,sm};未显现症状集是用户症状对应的疾病所关联的症状中不包含用户显现症状的集合;
根据所述显现症状集以及所述未显现症状集生成所述用户症状集。
3.根据权利要求1所述的基于医疗知识图谱知识推理的疾病诊断方法,其特征在于,所述第一概率
Figure FDA0002919873010000021
其中,Di为2D中任意一个,即
Figure FDA0002919873010000022
4.根据权利要求3所述的基于医疗知识图谱知识推理的疾病诊断方法,其特征在于,所述第二概率
Figure FDA0002919873010000023
通过如下公式获得:
Figure FDA0002919873010000024
其中,对
Figure FDA0002919873010000025
按全概率公式展开时,由于
Figure FDA00029198730100000215
不是互斥事件,并不能构成完备事件组,所以设集合
Figure FDA0002919873010000026
使得
Figure FDA0002919873010000027
中疾病构成完备事件组;
Figure FDA0002919873010000028
为完备事件组
Figure FDA0002919873010000029
发生的概率,
Figure FDA00029198730100000210
为完备事件组
Figure FDA00029198730100000211
在用户为
Figure FDA00029198730100000212
下的概率。
5.根据权利要求4所述的基于医疗知识图谱知识推理的疾病诊断方法,其特征在于,所述第三概率
Figure FDA00029198730100000213
通过如下公式获得:
Figure FDA00029198730100000214
6.根据权利要求5所述的基于医疗知识图谱知识推理的疾病诊断方法,其特征在于,所述基于动态阈值以及所述第三概率,输出用户
Figure FDA0002919873010000039
的最终疾病诊断结果具体包括:
将用户可能患得的各个疾病按照其对应的第三概率进行降序排列,从而获得概率大于0的降序疾病概率列表Or,即
Or=[疾病1:概率1,疾病2:概率2,……]。
设定阈值λ,比较降序疾病概率列表的各个疾病的概率和所设阈值λ,并将概率大于等于所设定的阈值的疾病构建成选中疾病列表Ore输出;将概率小于所设定的阈值的疾病构建成未选中疾病列表Orne用于下一步的筛选;
计算未显现的症状si发生的第四概率
Figure FDA0002919873010000031
Figure FDA0002919873010000032
其中,
Figure FDA0002919873010000033
是症状si在完备事件组
Figure FDA0002919873010000034
的条件下发生的概率;
选取最大概率对应的未显现症状作为最有可能出现的显现症状对用户进行询问;若该显现症状出现,则把该显现症状加入到用户
Figure FDA0002919873010000035
的显现症状集中,重新计算降序疾病概率列表,进而计算不确定度的增量ΔI:
Figure FDA0002919873010000036
其中,
Figure FDA0002919873010000037
表示疾病
Figure FDA0002919873010000038
在交互前后发生概率的增量;
计算动态调整阈值λ′=λ-Δλ=λ-ΔI,选取未选中疾病列表Orne中概率大于当前阈值的疾病构建成交互疾病列表Orei
汇总选中疾病列表Ore和交互疾病列表Orei,形成最终疾病诊断结果列表Oree作为最终疾病诊断结果。
7.一种基于医疗知识图谱知识推理的疾病诊断装置,其特征在于,包括:
交互模块,用于获取用户
Figure FDA0002919873010000041
与医疗问答系统的交互内容,并基于所述交互内容获取到用户
Figure FDA0002919873010000042
的用户症状集;
第一概率计算模块,用于根据所述用户症状集,计算所述用户
Figure FDA0002919873010000043
存在事件
Figure FDA0002919873010000044
的第一概率
Figure FDA0002919873010000045
其中,医疗知识图谱G存储有包含各种疾病的集合D={d1,d2,d3,…,dn},d1,d2,d3,…,dm为各种疾病;事件
Figure FDA0002919873010000046
为集合Di中的疾病同时发生且D-Di中的疾病均不发生;
第二概率计算模块,用于根据所述第一概率
Figure FDA0002919873010000047
计算用户S与
Figure FDA0002919873010000048
病共现的第二概率
Figure FDA0002919873010000049
第三概率计算模块,用于根据所述第一概率
Figure FDA00029198730100000410
与第二概率
Figure FDA00029198730100000411
计算用户
Figure FDA00029198730100000412
Figure FDA00029198730100000413
病的第三概率
Figure FDA00029198730100000414
诊断结果输出模块,用于基于动态阈值以及所述第三概率,输出用户
Figure FDA00029198730100000415
的最终疾病诊断结果。
8.一种基于医疗知识图谱知识推理的疾病诊断设备,其特征在于,包括存储器以及处理器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如权利要求1至6任意一项所述的基于医疗知识图谱知识推理的疾病诊断方法。
CN202110113829.2A 2021-01-27 2021-01-27 基于医疗知识图谱知识推理的疾病诊断装置、设备 Active CN112820400B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110113829.2A CN112820400B (zh) 2021-01-27 2021-01-27 基于医疗知识图谱知识推理的疾病诊断装置、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110113829.2A CN112820400B (zh) 2021-01-27 2021-01-27 基于医疗知识图谱知识推理的疾病诊断装置、设备

Publications (2)

Publication Number Publication Date
CN112820400A true CN112820400A (zh) 2021-05-18
CN112820400B CN112820400B (zh) 2022-07-05

Family

ID=75859728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110113829.2A Active CN112820400B (zh) 2021-01-27 2021-01-27 基于医疗知识图谱知识推理的疾病诊断装置、设备

Country Status (1)

Country Link
CN (1) CN112820400B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409936A (zh) * 2021-06-16 2021-09-17 北京欧应信息技术有限公司 用于辅助疾病推理的系统及存储介质
CN114093506A (zh) * 2021-11-19 2022-02-25 北京欧应信息技术有限公司 用于辅助疾病推理的系统及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012842A1 (en) * 2007-04-25 2009-01-08 Counsyl, Inc., A Delaware Corporation Methods and Systems of Automatic Ontology Population
CN108986871A (zh) * 2018-08-27 2018-12-11 东北大学 一种智慧医疗知识图谱的构建方法
CN109817329A (zh) * 2019-01-21 2019-05-28 暗物智能科技(广州)有限公司 一种医疗问诊对话系统以及应用于该系统的强化学习方法
CN109887596A (zh) * 2019-02-18 2019-06-14 广州天鹏计算机科技有限公司 基于知识图谱的慢阻肺疾病诊断方法、装置和计算机设备
US20190311814A1 (en) * 2018-04-06 2019-10-10 Curai, Inc. Systems and methods for responding to healthcare inquiries
CN110362690A (zh) * 2019-07-04 2019-10-22 北京爱医生智慧医疗科技有限公司 一种医学知识图谱构建方法及装置
CN110391021A (zh) * 2019-07-04 2019-10-29 北京爱医生智慧医疗科技有限公司 一种基于医学知识图谱的疾病推理系统
CN110504028A (zh) * 2019-08-22 2019-11-26 上海软中信息系统咨询有限公司 一种疾病问诊方法、装置、系统、计算机设备和存储介质
CN111292848A (zh) * 2019-12-31 2020-06-16 同方知网(北京)技术有限公司 一种基于贝叶斯估计的医疗知识图谱辅助推理方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012842A1 (en) * 2007-04-25 2009-01-08 Counsyl, Inc., A Delaware Corporation Methods and Systems of Automatic Ontology Population
US20190311814A1 (en) * 2018-04-06 2019-10-10 Curai, Inc. Systems and methods for responding to healthcare inquiries
CN108986871A (zh) * 2018-08-27 2018-12-11 东北大学 一种智慧医疗知识图谱的构建方法
CN109817329A (zh) * 2019-01-21 2019-05-28 暗物智能科技(广州)有限公司 一种医疗问诊对话系统以及应用于该系统的强化学习方法
CN109887596A (zh) * 2019-02-18 2019-06-14 广州天鹏计算机科技有限公司 基于知识图谱的慢阻肺疾病诊断方法、装置和计算机设备
CN110362690A (zh) * 2019-07-04 2019-10-22 北京爱医生智慧医疗科技有限公司 一种医学知识图谱构建方法及装置
CN110391021A (zh) * 2019-07-04 2019-10-29 北京爱医生智慧医疗科技有限公司 一种基于医学知识图谱的疾病推理系统
CN110504028A (zh) * 2019-08-22 2019-11-26 上海软中信息系统咨询有限公司 一种疾病问诊方法、装置、系统、计算机设备和存储介质
CN111292848A (zh) * 2019-12-31 2020-06-16 同方知网(北京)技术有限公司 一种基于贝叶斯估计的医疗知识图谱辅助推理方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
GENG, SC 等: "Clinical Diagnosis Expert System Based on Dynamic Uncertain Causality Graph", 《2014 IEEE 7TH JOINT INTERNATIONAL INFORMATION TECHNOLOGY AND ARTIFICIAL INTELLIGENCE CONFERENCE (ITAIC)》 *
ZHANG, QIN: "Dynamic Uncertain Causality Graph for Knowledge Representation and Probabilistic Reasoning: Directed Cyclic Graph and Joint Probability Distribution", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
倪萍 等: "采用C-F模型的中医本体诊断推理与实现", 《现代图书情报技术》 *
张利萍 等: "基于病情自述和知识图谱的疾病辅助诊断", 《计算机应用与软件》 *
郭景: "专家系统中不精确推理模型", 《小型微型计算机系统》 *
金雅妮 等: "医学检验知识的图谱构建与应用", 《福建电脑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409936A (zh) * 2021-06-16 2021-09-17 北京欧应信息技术有限公司 用于辅助疾病推理的系统及存储介质
CN113409936B (zh) * 2021-06-16 2022-08-05 北京欧应信息技术有限公司 用于辅助疾病推理的系统及存储介质
CN114093506A (zh) * 2021-11-19 2022-02-25 北京欧应信息技术有限公司 用于辅助疾病推理的系统及存储介质

Also Published As

Publication number Publication date
CN112820400B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
García et al. Data preprocessing in data mining
Wang et al. A self-learning expert system for diagnosis in traditional Chinese medicine
US20210233658A1 (en) Identifying Relevant Medical Data for Facilitating Accurate Medical Diagnosis
CN109036577B (zh) 糖尿病并发症分析方法及装置
Cooper A simple constraint-based algorithm for efficiently mining observational databases for causal relationships
CN109102886B (zh) 多推理模式融合的老年病推理诊断系统
WO2023029506A1 (zh) 病情分析方法、装置、电子设备及存储介质
Dooshima et al. A predictive model for the risk of mental illness in Nigeria using data mining
CN112820400B (zh) 基于医疗知识图谱知识推理的疾病诊断装置、设备
CN112149414A (zh) 文本相似度确定方法、装置、设备及存储介质
Hasan et al. A survey on causal discovery methods for temporal and non-temporal data
Pokharel et al. Representing EHRs with temporal tree and sequential pattern mining for similarity computing
Zhang et al. Exploring unsupervised multivariate time series representation learning for chronic disease diagnosis
CN114141379A (zh) 基于知识图谱的睡眠障碍归因分析方法、装置和系统
CN107085655B (zh) 基于属性的约束概念格的中医数据处理方法及系统
EP3499386A1 (en) Apparatus, program, and method for storing and processing graph data
Han et al. GA-GWNN: Detecting anomalies of online learners by granular computing and graph wavelet convolutional neural network
Yazid et al. A new similarity measure based on Bayesian Network signature correspondence for brain tumors cases retrieval
Didelez et al. A Comparative Analysis of Graphical Interaction and Logistic Regression Modelling: Self‐care and Coping with a Chronic Illness in Later Life
Fan et al. Bayesian models for heterogeneous personalized health data
Ou et al. Dynamic knowledge validation and verification for CBR teledermatology system
Yang et al. Medical assistant diagnosis method based on graph neural network and attention mechanism
Guillén et al. A machine learning approach for identifying subtypes of autism
Kayaalp Learning dynamic Bayesian network structures from data
Zhou New Techniques for Learning Parameters in Bayesian Networks.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant