CN117711607A - 基于循证医学的智能医疗诊断系统及方法 - Google Patents
基于循证医学的智能医疗诊断系统及方法 Download PDFInfo
- Publication number
- CN117711607A CN117711607A CN202311797469.8A CN202311797469A CN117711607A CN 117711607 A CN117711607 A CN 117711607A CN 202311797469 A CN202311797469 A CN 202311797469A CN 117711607 A CN117711607 A CN 117711607A
- Authority
- CN
- China
- Prior art keywords
- reasoning
- facts
- diagnosis
- evidence
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000003814 drug Substances 0.000 title claims abstract description 21
- 201000010099 disease Diseases 0.000 claims abstract description 79
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 79
- 208000024891 symptom Diseases 0.000 claims abstract description 57
- 238000007689 inspection Methods 0.000 claims abstract description 50
- 230000014509 gene expression Effects 0.000 claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims abstract description 15
- 230000004927 fusion Effects 0.000 claims abstract description 12
- 238000013519 translation Methods 0.000 claims abstract description 11
- 238000011835 investigation Methods 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 5
- 238000007499 fusion processing Methods 0.000 claims description 5
- 230000003466 anti-cipated effect Effects 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 3
- 230000001364 causal effect Effects 0.000 description 13
- 238000000605 extraction Methods 0.000 description 9
- 238000003066 decision tree Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000002372 labelling Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000000586 desensitisation Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000005802 health problem Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 208000030251 communication disease Diseases 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000008155 medical solution Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了基于循证医学的智能医疗诊断系统及方法,包括诊断信息采集融合模块,检查项目判断模块,自然语言表述翻译模块,反事实推理状态诊断模块和反事实推理状态评估模块,能实现对患者中多种诊断信息的采集、监管、检查项目和可多轮对话分析,从而完成患者疾病类型、疾病分期和地面疾病预测的反事实推理诊断。本发明的以上方案,能够形成通用化患者的检查项目判断方案,实现个性化体征检查项目自然语言表述管理、系统的反事实推理诊断和评估能力,保证高患者的多轮对话效率,进而达到患者疾病类型层状有效诊断,使用反事实推理的方法,重视症状、检查结果和疾病之间的因果性,实现AI可解释性诊断,大幅提高临床决策和诊断的准确度。
Description
技术领域
本发明涉及线上问诊领域,尤其涉及基于循证医学的智能医疗诊断系统及方法。
背景技术
伴随着中国“互联网+医疗”战略的提出,线上医疗服务逐渐进入主流公众视野,也在慢慢被广大患者所熟悉、接受,并开始选择在线医疗社区提供的线上医疗服务进行疾病诊治。作为线上医疗服务载体的平台-在线医疗社区,与传统的线下医疗机构相比,在线医疗社区建立了一个在线医生与患者沟通的平台,患者可以不受时间、地点等条件的限制,根据自己的需要,在评估医生的“线上医疗质量”后,选择一位或多位在线社区的医生进行咨询等医疗服务。
然而,因为线上问诊的非及时沟通、屏幕中介效应等,且医生一般不会告诉患者诊断依据,患者易对医生产生不信任感。目前,市场上的主要中文问诊平台,如丁香医生、春雨医生和好大夫等,主要分为两类:一类是基于规则进行诊断,因其由证据来源是病人自述,而病人自述大多不准确且片面,且中文医学信息易模糊混淆,故其误诊率较高;另一类平台主要问诊方式是病人和医生直接对话,医生工作负担大,且许多回答未向患者解释诊断依据,缺乏说服力和可解释性,可能导致治疗依从性下降、医患沟通障碍、信息误解等问题。
循证医学(Evidence-Based Medicine)是一种基于证据的医学实践方法,旨在通过系统地收集、评估和整合最新的科学证据,以指导医生在临床决策中做出最合理的选择。该方法强调以科学研究为基础的医学实践,以提高患者的医疗护理质量和安全性。但是基于大语言模型的方法在大文本的医学文献抽取任务上,仍存在关键信息抽取错误、抽取过程不可控等问题。
基于上述原因,本发明提出基于循证医学的智能医疗诊断系统及方法。
发明内容
本发明实施例旨在提供基于循证医学的智能医疗诊断系统和方法,搭建患者反事实推理诊断体系,以解决现有技术中的患者反事实推理诊断方式通用性差、维护困难且演变效率低的技术问题。
为此,本发明提供基于循证医学的智能医疗诊断系统,包括:
诊断信息采集融合模块,用于采集患者的多种诊断信息,并对所述诊断信息进行融合处理以形成ICD-10编码信息;
检查项目判断模块,用于利用所述ICD-10编码信息和循证医学知识库中不同检查项目判断方法完成患者中多轮对话工作和个性化体征的检查项目判断并形成判断参数;
自然语言表述翻译模块,用于依据不同时间点的判断参数对患者的多轮对话工作和个性化体征检查项目进行分析翻译,同时分析个性化体征自然语言表述内的各逻辑结构状态,形成个性化体征自然语言表述的分析翻译参数;
反事实推理状态诊断模块,用于对患者中的个性化体征进行建模形成反事实推理模型,所述反事实推理模型包括疾病类型反事实推理模型、疾病分期反事实推理模型和疾病预测反事实推理模型;
依据不同级反事实推理诊断模型和所述ICD-10编码信息对相应的疾病类型、疾病分期和疾病预测进行反事实推理诊断,并按需进行反事实推理调查,进而完成患者的反事实推理状态诊断;
反事实推理状态评估模块,用于通过患者的反事实推理状态诊断参数对患者的反事实推理状态进行Noisy-OR双诊断网络特征学习和反事实推理状态评估,并提供贝叶斯网络优化调整。
进一步地,所述反事实推理状态诊断模块,给定证据E=e,计算在某种假设性干预下,观测到不同结果E=e′的可能性,反事实概率表示为P(E=e′|E=e,do(X=x)),其中do(X=x)表示干预将变量X设为值x,反事实推理用于评估疾病假设D=T对症状证据S=T的解释程度,通过确定如果干预并“治愈”疾病(设置do(D=F))时,症状不出现的可能性,这个概率表示为P(S=F|S=T,do(D=F));使用两种反事实诊断量度:预期失能Edis(D,E)和预期充分性Esuff(D,E)。
进一步地,所述预期失能Edis(D,E),定义为如果干预治疗疾病D,预期会消失的当前症状数量:
其中E是事实证据,S+是一组事实明确的症状。对所有可能的反事实症状证据状态S0和S+表示反事实症状状态中肯定证据的症状计算总和。do(D=F)表示反事实干预设置D→F,|S+\S′+|表示出现在事实症状证据中但不出现在反事实症状证据中的症状集的基数
所述预期充分性Esuff(D,E),定义为如果干预关闭所有其他可能的症状原因,预期仍然存在的积极证据症状数量:
其中,S′+是积极证据症状集合,表示在给定证据E和特定干预(用/>表示)的条件下,症状S0存在的概率,Pa(S+)\D=F表示对除了疾病D之外的所有S+的父节点(可能的病因)进行干预,将它们设为F。
进一步地,所述Noisy-0R双诊断网络,用语反映了疾病和症状之间的直观关系,并支持反事实推理;在Noisy-0R双诊断网络中,父节点Di激活其子节点S的条件是:父节点激活Di=1且激活没有随机失败,噪声参数与所有其他模型参数独立。
进一步地,所述贝叶斯网络,预期充分性和预期失能的表达式如下:
其中预期充分性:
预期失能:
其中,表示概率函数,(-1)|z|表示符号因子,取决于集合Z的大小,S0表示状集合,Z表示特定症状组合,R表示风险因素证据,τ(k;Z)表示特定于疾病Dk和症状组合Z的参数,与噪声参数有关。
进一步地,所述ICD-10编码,基于预定的规则,将收集到的数据按照ICD-10标准进行编码存储。
基于循证医学的智能医疗诊断方法,包括如下步骤:
采集患者的多种诊断信息,并对所述诊断信息进行融合处理以形成ICD-10编码信息;
利用所述ICD-10编码信息和循证医学知识库中不同检查项目判断方法完成患者中多轮对话工作和个性化体征的检查项目判断并形成判断参数;
依据不同时间点的判断参数对患者的多轮对话工作和个性化体征检查项目进行分析翻译,同时分析个性化体征自然语言表述内的各逻辑结构状态,形成个性化体征自然语言表述的分析翻译参数;
对患者中的多轮对话工作和个性化体征的反事实推理状态进行建模形成反事实推理模型,所述反事实推理模型包括疾病类型反事实推理模型、疾病分期反事实推理模型和疾病预测反事实推理模型;
依据不同级反事实推理诊断模型和所述ICD-10编码信息对相应的疾病类型、疾病分期和疾病预测进行反事实推理诊断,并按需进行反事实推理调查,进而完成患者的反事实推理状态诊断;通过患者的反事实推理状态诊断参数对患者的反事实推理状态进行Noisy-OR双诊断网络特征学习和反事实推理状态评估,并提供贝叶斯网络优化调整。
本发明实施例提供的上述技术方案与现有技术相比,至少具有如下技术效果:
本发明实施例提供的基于循证医学的智能医疗诊断系统及方法,能够形成通用化患者的检查项目判断方案,实现个性化体征检查项目自然语言表述管理、系统的进行不同检查项目判断以及演变过程中反事实推理的诊断,保证高患者的多轮对话效率,进而达到患者疾病类型层状有效诊断,提高患者贝叶斯网络准确度的目的,使用反事实推理的方法,重视症状、检查结果和疾病之间的因果性,实现AI可解释性诊断,大幅提高临床决策和诊断的准确度。
附图说明
图1为本发明的基于循证医学的智能医疗诊断系统组成示意图;
图2为本发明的Noisy-OR双诊断网络图;
图3为本发明的一种自我验证的框架图;
图4为本发明的患者个性化体征诊断方法的流程示意图。
具体实施方式
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个组件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明一个实施例提供基于循证医学的智能医疗诊断系统,如图1所示,包括:
诊断信息采集融合模块,用于采集、融合和处理多种诊断信息,形成ICD-10编码信息供反事实推理诊断系统使用,是整个反事实推理诊断系统的信息层。
检查项目判断模块,用于基于可视化的信息和循证医学知识库中不同可自定义的检查项目处置方法完成多轮对话工作和个性化体征的检查项目判断,该模块是在传统的检查项目判断技术的基础上,通过使用ICD-10编码信息和演变判断算法实现检查项目判断的灵活识别。
自然语言表述翻译模块,用于多轮对话工作、个性化体征检查项目和个性化体征的自然语言表述分析翻译,通过人工录入和自动采集,完成个性化体征的自然语言表述诊断,同时提供检查项目分析平台,完成检查项目的分析处理。
反事实推理状态诊断模块,用于对个性化体征和系统进行反事实推理建模形成反事实推理模型,所述反事实推理模型包括疾病类型反事实推理模型、疾病分期反事实推理模型和疾病预测反事实推理模型;依据不同级反事实推理诊断模型和所述ICD-10编码信息对相应的疾病类型、疾病分期和疾病预测进行反事实推理诊断,并进行反事实推理调查,完成系统的反事实推理状态诊断,是反事实推理信息的产生和展示层。
反事实推理状态评估模块,用于通过系统的反事实推理状态完成系统文档生成和患者多轮对话执行,并针对系统反事实推理问题提供贝叶斯网络优化调整,是反事实推理信息的应用层。
本实施例提供的以上方案能够形成通用化患者的检查项目判断方案,实现个性化体征检查项目自然语言表述管理、系统的反事实推理诊断和评估能力,保证高患者的多轮对话效率,进而达到减小患者系统维护工作量和复杂度,提高患者贝叶斯网络准确度的目的。
大语言模型是一种使用深度学习技术构建的复杂自然语言处理系统。这些模型被设计用来理解和生成人类语言,可以执行各种语言任务,例如文本生成、翻译、问题回答等。
其中一种大语言模型是由OpenAI开发的GPT(Generative Pre-trainedTransformer)系列。GPT模型使用Transformer架构,该架构是一种基于自注意力机制的神经网络结构。该模型在大量的文本数据上进行预训练,以学习语言的结构、语法和语义。在这个阶段,模型并不针对特定任务进行训练,而是通过学习大规模文本数据来获取通用的语言表示。
一旦预训练完成,这些模型可以通过微调适应特定的任务。微调是指使用相对较小的任务特定数据集对模型进行训练,使其适应具体领域或任务的要求。这种预训练和微调的方法使得大语言模型在不同的自然语言处理任务上表现出色,而无需为每个任务设计和训练一个新的模型。
本发明把大语言模型用在了对话文本生成和用户回答的关键词提取,能够更深入地理解用户灵活的输入,并生成更富有语境的、自然流畅的回答。这样不仅能够捕捉到用户输入的关键词,还能够在生成过程中融入上下文信息,从而提高对话的质量和连贯性。
贝叶斯网络(Bayesian Network),也称为信念网络(Belief Network)或概率图模型,是一种用图形表示概率关系的统计模型。它基于贝叶斯定理,描述了一组变量之间的依赖关系,并用有向无环图(DAG,Directed Acyclic Graph)来表示这些变量之间的条件依赖关系。
贝叶斯网络在建模不确定性和推理方面具有很大优势。它可以用于处理复杂的系统,特别是在面对大量不完全或不确定的信息时。应用领域涵盖了人工智能、医学诊断、风险分析、金融建模等多个领域。
使用贝叶斯网络进行推理时,可以通过观察一些节点的值来推断其他节点的概率分布。这使得贝叶斯网络成为处理不确定性和推理的有力工具。
本发明构建了一个包含疾病及其各个症状之间的贝叶斯网络,这样就能够通过已知的症状,推理出患者其他可能的症状,它允许本发明更精准地评估患者可能患有的疾病,并提供更准确的诊断支持,比如接下来需要进行的检查项目。
基于上述两项技术,本发明成功地构建了一个多轮对话获取患者症状的系统。整个流程都可以得到医生的监督,以及时发现并改正可能存在的错误。
优选地,诊断信息采集融合模块包括信息采集组件、信息融合组件、信息清洗组件、指标标注组件、信息脱敏组件和信息聚类转换组件。
具体地:
反事实推理是因果推理的一种方法。因果推理是一种推断事件或现象之间因果关系的推理过程。在因果推理中,本发明试图确定一个事件是另一个事件的原因,或者两个事件之间存在因果关系。这种推理通常涉及到观察到的模式、相关性和可能的因果机制。因果推理是科学研究、医学诊断和日常生活中常见的思考方式。
与因果推理相对应的是关联推理。关联推理是指两个或多个事件之间存在相关性或同时发生,但并不一定有因果关系。简而言之,相关性并不意味着因果关系。两个事件之间的关联可能是巧合,或者受到其他变量的影响。
因果推理强调事件之间的因果关系,而关联推理强调事件之间的相关性。在进行推理时,需要谨慎区分这两种推理,以避免错误的结论。
为了提高诊断的准确性、可靠性、可解释性,本发明采用反事实推理来进行因果推理,从而完成诊断,通过分析患者的症状、检查结果等数据,推断出患者最有可能患有的疾病。
反事实推理状态诊断模块,给定证据E=e,计算在某种假设性干预下,观测到不同结果E=e′的可能性,反事实概率表示为P(E=e′|E=e,do(X=x)),其中do(X=x)表示干预将变量X设为值x,反事实推理用于评估疾病假设D=T对症状证据S=T的解释程度,通过确定如果干预并“治愈”疾病(设置do(D=F))时,症状不出现的可能性,这个概率表示为P(S=F|S=T,do(D=F));使用两种反事实诊断量度:预期失能Edis(D,E)和预期充分性Esuff(D,E)。
预期失能Edis(D,E),定义为如果干预治疗疾病D,预期会消失的当前症状数量:
其中E是事实证据,S+是一组事实明确的症状。对所有可能的反事实症状证据状态S0和S+表示反事实症状状态中肯定证据的症状计算总和。do(D=F)表示反事实干预设置D→F,|S+\S′+|表示出现在事实症状证据中但不出现在反事实症状证据中的症状集的基数
预期充分性Esuff(D,E),定义为如果干预关闭所有其他可能的症状原因,预期仍然存在的积极证据症状数量:
其中,s′+是积极证据症状集合,表示在给定证据E和特定干预(用/>表示)的条件下,症状S0存在的概率,Pa(S+)\D=F表示对除了疾病D之外的所有S+的父节点(可能的病因)进行干预,将它们设为F。
如图2所示,Noisy-0R双诊断网络,用语反映了疾病和症状之间的直观关系,并支持反事实推理;在Noisy-0R双诊断网络中,父节点Di激活其子节点S的条件是:父节点激活Di=1且激活没有随机失败,噪声参数与所有其他模型参数独立,S是其父节点的布尔OR函数,每个父节点都有一个独立的被忽略概率λi,从而将它们从OR函数中删除。
贝叶斯网络,预期充分性和预期失能的表达式如下:
其中预期充分性:
预期失能:
其中,表示概率函数,(-1)|Z|表示符号因子,取决于集合Z的大小,S0表示状集合,Z表示特定症状组合,R表示风险因素证据,τ(k;Z)表示特定于疾病Dk和症状组合Z的参数,与噪声参数有关。
ICD-10编码,国际疾病分类第十版(International Classification ofDiseases,Tenth Revision,简称ICD-10)是世界卫生组织(WH0)发布的一种用于对疾病和其他健康问题进行分类的标准系统。
ICD-10涵盖了一系列疾病、症状、体征、外部因素和社会因素的编码体系。每个编码都对应着特定的健康问题。本发明计划基于预定的规则,将收集到的数据按照ICD-10标准进行编码存储。通过这样的处理,本发明可以更有效地减少所获取症状证据的不准确性,使得后续的查询和推理工作更为方便和可靠。这种标准化的编码方法有助于提高数据的一致性,为医疗信息管理和分析提供更可靠的基础。
本发明将基于规则,对处理完成的数据进行ICD-10编码并存储,标准化诊断编码,提高了数据查询的准确度和效率。
信息采集组件用于实时采集患者各系统产生的多种诊断信息。在本发明实例中的一些方案中,信息采集组件通过无线信号采集不同个性化体征状态信息,状态信息采用无损压缩信息结构协议封装。
信息融合组件,用于按照协议格式,将信息采集组件采集到的多种诊断信息解格式,并融合为对应的物理参变量。在本发明实例中,信息融合组件融合无损压缩信息结构,并按照个性化体征类型将融合出的参数与个性化体征诊断协议逐一对应,得到其物理量;同时信息融合组件使用云端完成多轮对话工作计划信息、多轮对话工作过程信息等XML文件的融合。
信息清洗组件,用于对融合得到的物理参变量进行K均值算法、Canopy算法、邻近排序算法等清洗,得到标准化的诊断信息;在本发明实例中,将不同物理参变量的K均值算法,例如:电流统一为mA,电压统一为mV,信号电平统一为dBm等;对时标进行修正,对采集到时标不为整数秒的信息进行Canopy算法,将其映射到整数秒;对于关注变化量的状态,对其做邻近排序算法处理,得到变化值。
指标标注组件,用于从标准化诊断信息中选取核心指标参变量,并根据需要融合多类参变量,计算得到核心指标参变量;在本发明实例中,从个性化体征状态信息中标注信噪比、失锁计数等核心指标参变量,同时综合不同参变量计算得到跟踪进度、指向精度、信号强度曲线等综合核心指标参变量。
信息脱敏组件,用于将标注出的指标参变量按时间对齐,形成标准化的指标系数;在本发明实例中,将同一时刻的不同状态参变量按照信号流向形成一维状态系数。
信息聚类转换组件,用于聚类和按需转换标准化指标系数。将脱敏得到的状态系数以时标为主键存入MYSQL信息库中,同时将状态系数发布到软件中,供其他组件使用。
进一步地,检查项目判断模块包括AI监管组件、循证医学知识库组件、个性化体征检查项目判断组件和多轮对话工作检查项目判断组件。其中:
AI监管组件用于AI配置、调度完成不同功能和可多轮对话监管,并采集分析监管信息,生成监管参数,在本发明实例中,AI监管组件根据个性化体征检查项目判断组件、多轮对话工作检查项目判断组件和反事实推理状态诊断模块的监管申请,自动生成并执行不同监管。
循证医学知识库组件,用于实现循证医学知识库中不同检查项目判断方法如检查项目判断所需的预设值、标准知识、检查项目知识图谱和疾病发展决策树等的参数设置、模型建立、流程优化、方法调整。在本发明实例中,知识抽象为信息结构,在信息库中聚类管理,其中:检查项目判断所需的预设值以Key-Value键值对的形式存放在信息库中,可以通过对信息库的操作完成预设值知识的管理;同样通过信息库管理;检查项目知识图谱则抽象为检查项目知识图谱节点和连接之间的关系,并在信息库中聚类管理。
循证医学(Evidence-Based Medicine,EBM)是一种基于最新科学证据、医学研究和患者价值观的医学实践方法。它强调在制定医学决策时,应该依据当前最好的可用证据,而不仅仅是基于传统的医学经验或专家观点。这些证据可以来自多种来源,包括研究文献、临床试验、病例对照研究、队列研究等。在循证医学中,关注的是高质量、可靠、可复制的证据,以支持医生在治疗和管理患者时做出明智的决策。
本发明通过网络爬虫获取原始数据。这些数据具有文本量大、专业名词众多、文义连续性差的特点。为了最大程度地保留数据中的有价值信息,并确保其在后续使用中更易处理,本发明将进行后续步骤,包括数据抽取和清洗。这一过程旨在使数据更加清晰易懂,以满足后续分析和应用的需要。
医学文献文本变量巨大,从这样的非结构化数据中抽取出结构化的医学相关信息变得重要且富有挑战。相对于需要昂贵人工标注的监督学习而言,现代LLM在通过少量样本进行上下文学习后,在文本信息抽取上有较好表现。但在安全关键领域,尤其是在健康领域,它们仍然存在准确性和可解释性方面的问题。于是本发明希望采用一种自我验证的框架,通过利用生成和验证的不对称性,改善了LLM在临床信息提取任务中的性能,如图3所示。
(1)原始抽取
通过设计一个特定的提示,引导模型产生所需的输出。在这里,模型的任务是输出一个一个长度可变的、使用项目符号列出的列表,该列表中包含文本中的医学相关信息。此时,模型可能没有完全理解提示或在生成输出时存在限制,导致未能找到所有需要的信息。
(2)查找遗漏
该步骤用于找到第一步抽取过程中遗漏的信息,对于输入较长的任务(平均输入长度大于2,000个字符),通过多次重复该步骤可以找到更多潜在的被忽略元素。
该步骤旨在提高模型在任务中的全面性,确保它尽可能地捕捉到输入文本中的所有关键信息。
(3)证据审查
在这一步中,每个元素都被连接(grounded)到输入文本中的一个文本片段。这种连接提供了可以由专家审查的解释。在图1的示例中,模型找到了支持前两个诊断的引用,但是对于肝纤维化的引用显示出它实际上被排除在外,因此是一个错误的诊断。
这一步引入了少量的人工审查,在节省了人力成本的同时,又保证了模型的可解释性和准确性
(4)精调输出
该步骤使用上一步中提供的证据,从输出中删除不准确的元素,从而返回正确的最终列表。这一步骤的目的是根据已提供的证据,修剪或删除模型输出中的不准确元素,从而提高输出的准确性。
个性化体征检查项目判断组件,用于根据预设预设值、检查项目知识图谱、疾病发展决策树和监管参数,对个性化体征进行实时检查项目判断,并生成个性化体征检查项目判断文档;当超出预设值范围时,判定为个性化体征检查项目;对于其他参变量,采用检查项目知识图谱的方式进行判断,以诊断信息采集融合模块转换的状态系数为底事件,依据对应的检查项目知识图谱,通过对底事件的各种逻辑运算(与、或等),可推导出个性化体征模块或组件的检查项目,在必要的情况下,还可发起AI监管申请,进一步结合监管参数,完成个性化体征的检查项目判断。
多轮对话工作检查项目判断组件,用于AI分析多轮对话工作的执行状态,对于发现检查项目的多轮对话工作,通过AI监管等进行进一步的判断分析,并生成多轮对话工作检查项目判断文档。在本发明实例中,多轮对话工作检查项目判断首先通过疾病发展决策树对多轮对话工作中的多轮对话工作执行步骤、跟踪情况、接收情况、诊断点告警情况、核心日志等不同检查项进行分析检查,生成接收情况文档;对于接收异常的多轮对话工作,通过检查项目知识图谱,进一步分析判断异常的原因,并在必要的情况下,发起AI监管,通过监管参数定位分析检查项目原因,生成多轮对话工作检查项目判断文档。
进一步地,自然语言表述翻译模块包括检查项目分析组件、检查项目知识标注组件和个性化体征指标组件。具体的:
检查项目分析组件用于多轮对话工作和个性化体征检查项目信息的交互,包括检查项目上报、检查项目处置流程、检查项目处置参数等信息。在本发明实例中,检查项目分析组件包含患者多轮对话决策人员、决策树和地质专家三类角色,患者多轮对话决策人员将系统演变过程中出现的问题及相应的日志等信息转换给指定决策树,由决策树给予解答,最后由地质专家确认闭环。
检查项目知识标注组件用于统计、分析和提炼检查项目信息及处置方法,形成检查项目案例、检查项目知识图谱和疾病发展决策树。在本发明实例中,检查项目知识标注组件统计分析检查项目分析组件中记录的检查项目处置信息,形成和具体业务联密切,可用于系统整体分析判断的知识集,对于典型的检查项目还可以将其知识集归纳为检查项目案例和检查项目知识图谱,供检查项目判断模块使用。
个性化体征指标组件用于对个性化体征从投入使用、升级、贝叶斯网络到报废处理的整个自然语言表述的逻辑结构检测,同时统计分析个性化体征的演变状态、可多轮对话、检查项目突变时间节点等核心指标。在本发明实例中,个性化体征指标组件自动将个性化体征投入使用、升级、贝叶斯网络、报废各个阶段的信息存入信息库,同时统计分析不同个性化体征演变时间、检查项目的频次及检查项目原因等信息,定期生成个性化体征指标文档。
较佳地,反事实推理状态诊断模块包括反事实推理模型管理组件、反事实推理评估组件、可多轮对话评估组件、反事实推理调查组件和反事实推理状态展示组件。具体的:
反事实推理模型管理组件用于构建和管理疾病类型、疾病分期和疾病预测反事实推理模型。在本发明实例中,将个性化体征的诊断点按类别、组件以检查项目知识图谱的形式构建模型,计算每个节点值与理论预设值之间的关系得到向上级节点的转移节点,即为个性化体征的反事实推理模型;疾病分期和疾病预测反事实推理模型则是以个性化体征反事实推理模型为叶节点,综合系统和站内的架构设计,得到的检查项目知识图谱即为其反事实推理模型。
反事实推理评估组件用于根据多种诊断信息和反事实推理模型等进行综合分析,采用合适的注意力机制及评估算法对个性化体征、系统和患者的反事实推理状态进行评估。在本发明实例中,利用反事实推理模型管理组件构建的反事实推理模型,结合多种诊断信息,完成反事实推理状态的评估。
反事实推理调查组件用于定期或根据反事实推理评估和可多轮对话评估参数自动组织完成系统监管,并形成反事实推理调查文档。在本发明实例中,当反事实推理调查组件侦测到系统反事实推理状态或系统可多轮对话发生变化时,会自动发起相应的监管,并结合反事实推理模型形成反事实推理调查文档。
反事实推理状态展示组件,用于以图形和表格的形式展示系统反事实推理状态。在本发明实例中,使用柱状图展示每台个性化体征的反事实推理状态,使用拟合曲线展示各可多轮对话指标的状态,同时提供综合界面,展现反事实推理调查的参数。
进一步地,反事实推理状态评估模块包括文档生成组件、患者多轮对话执行组件和贝叶斯网络优化组件。更具体地:
文档生成组件用于连续诊断个性化体征的工作状态和系统的核心可多轮对话指标,形成个性化体征状态和系统可多轮对话的纵向文档生成,同时完成同区域和同气候非同区域个性化体征之间的横向文档生成。
患者多轮对话执行组件用于提前判断个性化体征或系统的反事实推理状态,评估个性化体征或系统正常演变的时间,同时用于评估对未来多轮对话工作的执行效率。在本发明实例中,采用基于信息驱动的患者多轮对话执行技术,其不需要个性化体征和系统精确地物理模型和先验知识,以采集的历史信息为基础,通过机器学习、神经网络等信息分析处理方法挖掘其中的隐含信息进行评估。
贝叶斯网络优化组件用于根据系统反事实推理和可多轮对话评估参数,同时结合患者多轮对话执行情况,综合判断给出贝叶斯网络优化调整。在本发明实例中,贝叶斯网络优化组件实时采集反事实推理状态诊断模块产生的系统反事实推理信息和患者多轮对话执行参数,结合预设的疾病发展决策树,给出贝叶斯网络决策建议,同时还根据文档生成和患者多轮对话执行的参数,对可能出现的检查项目提前告警,并提供维保建议。
基于循证医学的智能医疗诊断系统选用HTML、CSS、JavaScript和Java作为主要开发语言,结合VUE和Spring Boot前后端框架,全面实现了软件开发。通过深入分析不同场景下的数据和应用需求,本发明精心设计了一个服务于多方面的智能医学解决方案,包括远程问诊与检查建议、AI辅助诊断决策、知识库查询以及循证案例补充等多个应用场景。这一系列功能的集成旨在为智能医学的进一步发展提供有力支持。
在本发明的一些实施例中还提供基于循证医学的智能医疗诊断方法,如图4所示,可包括如下步骤:
S1、采集患者的多种诊断信息,并对所述诊断信息进行融合处理以形成ICD-10编码信息;形成的ICD-10编码信息供反事实推理诊断系统使用。
S2、利用所述ICD-10编码信息和循证医学知识库中不同检查项目判断方法完成患者中多轮对话工作和个性化体征的检查项目判断并形成判断参数;在传统的检查项目判断技术的基础上,通过使用ICD-10编码信息和演变判断算法实现检查项目判断的灵活识别。
S3、依据不同时间点的判断参数对患者的多轮对话工作和个性化体征检查项目进行分析翻译,同时分析个性化体征自然语言表述内的各逻辑结构状态,形成个性化体征自然语言表述的分析翻译参数;通过人工录入和自动采集,完成个性化体征的自然语言表述诊断,同时提供检查项目分析平台,完成检查项目的分析处理。
S4、对患者中的多轮对话工作和个性化体征的反事实推理状态进行建模形成反事实推理模型,所述反事实推理模型包括疾病类型反事实推理模型、疾病分期反事实推理模型和疾病预测反事实推理模型;依据不同级反事实推理诊断模型和所述ICD-10编码信息对相应的疾病类型、疾病分期和疾病预测进行反事实推理诊断,并按需进行反事实推理调查,进而完成患者的反事实推理状态诊断。
S5、通过患者的反事实推理状态诊断参数对患者的反事实推理状态进行Noisy-OR双诊断网络特征学习和反事实推理状态评估,并提供贝叶斯网络优化调整。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术指标进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.基于循证医学的智能医疗诊断系统,其特征在于,包括:
诊断信息采集融合模块,用于采集患者的多种诊断信息,并对所述诊断信息进行融合处理以形成ICD-10编码信息;
检查项目判断模块,用于利用所述ICD-10编码信息和循证医学知识库中不同检查项目判断方法完成患者中多轮对话工作和个性化体征的检查项目判断并形成判断参数;
自然语言表述翻译模块,用于依据不同时间点的判断参数对患者的多轮对话工作和个性化体征检查项目进行分析翻译,同时分析个性化体征自然语言表述内的各逻辑结构状态,形成个性化体征自然语言表述的分析翻译参数;
反事实推理状态诊断模块,用于对患者中的个性化体征进行建模形成反事实推理模型,所述反事实推理模型包括疾病类型反事实推理模型、疾病分期反事实推理模型和疾病预测反事实推理模型;依据不同级反事实推理诊断模型和所述ICD-10编码信息对相应的疾病类型、疾病分期和疾病预测进行反事实推理诊断,并按需进行反事实推理调查,进而完成患者的反事实推理状态诊断;
反事实推理状态评估模块,用于通过患者的反事实推理状态诊断参数对患者的反事实推理状态进行Noisy-OR双诊断网络特征学习和反事实推理状态评估,并提供贝叶斯网络优化调整。
2.根据权利要求1所述的基于循证医学的智能医疗诊断系统,其特征在于,所述反事实推理状态诊断模块,给定证据E=e,计算在某种假设性干预下,观测到不同结果E=e′的可能性,反事实概率表示为P(E=e′|E=e,do(X=x)),其中do(X=x)表示干预将变量X设为值x,反事实推理用于评估疾病假设D=T对症状证据S=T的解释程度,通过确定如果干预并“治愈”疾病(设置do(D=F))时,症状不出现的可能性,这个概率表示为P(S=F|S=T,do(D=F));使用两种反事实诊断量度:预期失能Edis(D,E)和预期充分性Esuff(D,E)。
3.根据权利要求2所述的基于循证医学的智能医疗诊断系统,其特征在于,所述预期失能Edis(D,E),定义为如果干预治疗疾病D,预期会消失的当前症状数量:
其中E是事实证据,S+是一组事实明确的症状,对所有可能的反事实症状证据状态S0和S+表示反事实症状状态中肯定证据的症状计算总和;do(D=F)表示反事实干预设置D→F,|S+\S′+|表示出现在事实症状证据中但不出现在反事实症状证据中的症状集的基数;
所述预期充分性Esuff(D,E),定义为如果干预关闭所有其他可能的症状原因,预期仍然存在的积极证据症状数量:
其中,S′+是积极证据症状集合,表示在给定证据E和特定干预(用/>表示)的条件下,症状S0存在的概率,Pa(S+)\D=F表示对除了疾病D之外的所有S+的父节点(可能的病因)进行干预,将它们设为F。
4.根据权利要求1所述的基于循证医学的智能医疗诊断系统,其特征在于,所述Noisy-OR双诊断网络,用语反映了疾病和症状之间的直观关系,并支持反事实推理;在Noisy-OR双诊断网络中,父节点Di激活其子节点S的条件是:父节点激活Di=1且激活没有随机失败,噪声参数与所有其他模型参数独立。
5.根据权利要求1所述的基于循证医学的智能医疗诊断系统,其特征在于,所述贝叶斯网络,预期充分性和预期失能的表达式如下:
其中预期充分性:
预期失能:
其中,表示概率函数,(-1)|Z|表示符号因子,取决于集合Z的大小,S0表示状集合,Z表示特定症状组合,R表示风险因素证据,τ(k;Z)表示特定于疾病Dk和症状组合Z的参数,与噪声参数有关。
6.根据权利要求1所述的基于循证医学的智能医疗诊断系统,其特征在于,所述ICD-10编码,基于预定的规则,将收集到的数据按照ICD-10标准进行编码存储。
7.基于循证医学的智能医疗诊断方法,其特征在于,该方法包括:
S1、采集患者的多种诊断信息,并对所述诊断信息进行融合处理以形成ICD-10编码信息;
S2、利用所述ICD-10编码信息和循证医学知识库中不同检查项目判断方法完成患者中多轮对话工作和个性化体征的检查项目判断并形成判断参数;
S3、依据不同时间点的判断参数对患者的多轮对话工作和个性化体征检查项目进行分析翻译,同时分析个性化体征自然语言表述内的各逻辑结构状态,形成个性化体征自然语言表述的分析翻译参数;
S4、对患者中的多轮对话工作和个性化体征的反事实推理状态进行建模形成反事实推理模型,所述反事实推理模型包括疾病类型反事实推理模型、疾病分期反事实推理模型和疾病预测反事实推理模型;
S5、依据不同级反事实推理诊断模型和所述ICD-10编码信息对相应的疾病类型、疾病分期和疾病预测进行反事实推理诊断,并按需进行反事实推理调查,进而完成患者的反事实推理状态诊断;通过患者的反事实推理状态诊断参数对患者的反事实推理状态进行Noisy-OR双诊断网络特征学习和反事实推理状态评估,并提供贝叶斯网络优化调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311797469.8A CN117711607A (zh) | 2023-12-25 | 2023-12-25 | 基于循证医学的智能医疗诊断系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311797469.8A CN117711607A (zh) | 2023-12-25 | 2023-12-25 | 基于循证医学的智能医疗诊断系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117711607A true CN117711607A (zh) | 2024-03-15 |
Family
ID=90162226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311797469.8A Pending CN117711607A (zh) | 2023-12-25 | 2023-12-25 | 基于循证医学的智能医疗诊断系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117711607A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932042A (zh) * | 2024-03-21 | 2024-04-26 | 支付宝(杭州)信息技术有限公司 | 作为医生代理的大语言模型的评测方法和装置 |
-
2023
- 2023-12-25 CN CN202311797469.8A patent/CN117711607A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932042A (zh) * | 2024-03-21 | 2024-04-26 | 支付宝(杭州)信息技术有限公司 | 作为医生代理的大语言模型的评测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Øhrn | Discernibility and rough sets in medicine: tools and applications | |
CN117253614B (zh) | 基于大数据分析的糖尿病风险预警方法 | |
CN117711607A (zh) | 基于循证医学的智能医疗诊断系统及方法 | |
Ahmed et al. | Reasoning techniques for diabetics expert systems | |
US20200388358A1 (en) | Machine Learning Method for Generating Labels for Fuzzy Outcomes | |
CN113707339B (zh) | 一种多源异质数据库间概念对齐与内容互译方法及系统 | |
KR101926632B1 (ko) | 규칙 최적화를 통한 임상 병리 검사에 대한 전문가 경험 지식 학습 및 소견 생성 방법 | |
CN112541066A (zh) | 基于文本结构化的医技报告检测方法及相关设备 | |
CN111063448A (zh) | 输血不良反应数据库建立方法、存储系统以及主动预警系统 | |
CN117151088A (zh) | 文本的处理方法、装置、电子设备及存储介质 | |
CN113838577A (zh) | 便捷化分层老年mods早期死亡风险评估模型、装置及建立方法 | |
US11763945B2 (en) | System and method for labeling medical data to generate labeled training data | |
CN114242194A (zh) | 一种基于人工智能的医学影像诊断报告自然语言处理装置及方法 | |
CN117438087A (zh) | 基于健康监测数据分析的健康管理方法及系统 | |
CN114220542A (zh) | 一种体检信息管理方法、装置、存储介质及计算设备 | |
Chattopadhyay et al. | Fuzzy-logic-based screening and prediction of adult psychoses: A novel approach | |
Manur et al. | A Big Data Analysis Using Fuzzy Deep Convolution Network Based Model for Heart Disease Classification. | |
CN116168828A (zh) | 基于知识图谱和深度学习的疾病预测方法、装置及计算机设备 | |
CN113658688A (zh) | 基于无分词深度学习的临床决策支持方法 | |
Nandhini et al. | Random forest and genetic algorithm united with hyperparameter for diabetes prediction by using WBSMOTE, wrapper approach | |
Prasanth et al. | Prognostication of diabetes diagnosis based on different machine learning classification algorithms | |
KR102627462B1 (ko) | Mec를 이용한 의료기기 연동 및 문진성능 향상시스템 및 그 방법 | |
Mehra et al. | Generating quality IF-THEN rules for diabetes using linguistic summarization | |
CN117373688B (zh) | 慢性病数据处理方法、装置、电子设备和存储介质 | |
Bodinga et al. | On The Analysis of Some Machine Learning Algorithms for the Prediction of Diabetes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |