CN116682524B - 病历质控方法、装置、电子设备及存储介质 - Google Patents
病历质控方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116682524B CN116682524B CN202310871613.1A CN202310871613A CN116682524B CN 116682524 B CN116682524 B CN 116682524B CN 202310871613 A CN202310871613 A CN 202310871613A CN 116682524 B CN116682524 B CN 116682524B
- Authority
- CN
- China
- Prior art keywords
- medical record
- quality control
- model
- record quality
- instruction data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003908 quality control method Methods 0.000 title claims abstract description 401
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 230000002787 reinforcement Effects 0.000 claims description 7
- 230000007812 deficiency Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种病历质控方法、装置、电子设备及存储介质,该方法包括:获取第一指令数据,第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调。基于第一指令数据,对大模型进行微调,微调后得到病历质控模型。获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果。其中,第一病历质控规则在病历质控规则范围内。该方法利用大模型更好的理解病历质控规则的语义信息,能够灵活地执行质控规则,使得质控规则不再僵化地对应固有的质控结果,同时避免了非医学专业的开发人员对于医学知识的欠缺导致的质控结果质量较低的情况,保证了病历质控结果的质量。
Description
技术领域
本发明涉及医疗管理技术领域,特别是涉及一种病历质控方法、装置、电子设备及存储介质。
背景技术
在医疗质量管理中,病历质量的管理和控制是较为重要的组成部分。病历是记录病人疾病发生、发展以及诊疗过程的关键档案,是医务人员对患者入院、检查、诊断以及治疗等医疗活动进行了解的关键参考指标,同时也是解决医疗纠纷的有力证据以及临床医学研究的关键素材。病历中记录的信息需要准确地反映病历的病症、治疗经过和健康状况,而不准确或者不完整的病历信息会导致误诊误治,威胁病人的健康与安全。因此,为了监督病历的质量,质控管理功能的建设也变得越来越重要。
目前,传统的病历质控方法最初是通过定期进行病历评估和质控来发现病历中存在的问题,并制定相关有效的改进策略,促使医生改进病历书写的规范和质量,实现医疗服务质量的提高。现在则主要通过自定义规则来实现病历质控,通过制定一系列临床规则和标准来评价病历质量,这种方式中的自定义规则容易被临床接受和实施,且易于电子化表达,常用于病历质评的初期建设。但是,病历质控规则多是由专业临床知识的医学人员定义,并由开发者实现,但开发者通常缺乏专业的医学背景,较难保证质控结果的准确性。另外,自定义规则输入直接决定了质控结果的输出,较为僵化且不易更新,较难很好地适应临床实践的多变的病历文本。
综上所述,现有的病历质控方法较难保证质控结果的质量。
发明内容
基于此,有必要针对上述技术问题,提供一种能够保证病历质控结果质量的病历质控方法、装置、电子设备及存储介质。
本发明提供了一种病历质控方法,所述方法包括:
获取第一指令数据,所述第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型;
获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果;
其中,所述第一病历质控规则在所述病历质控规则范围内。
在其中一个实施例中,所述获取第一指令数据,包括:
获取专业临床经验的医学确定执行的所述病历质控规则范围中病历质控规则的第一文本数据;
将所述第一文本数据转换为第一指令,所述第一指令用于结合第一质控结果获取所述第一指令数据;
获取所述第一质控结果,并结合所述第一指令,获取所述第一指令数据;
其中,所述第一质控结果为基于给定病历人工输入的质控结果。
在其中一个实施例中,所述基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型,包括:
基于多个所述第一指令数据,获取多任务指令数据,所述多任务指令数据用于构建所述大模型学习病历质控规则的知识图谱;
基于所述大模型,获取开源指令数据,并将所述开源指令数据写入到所述多任务指令数据中;
其中,所述开源指令数据写入到所述多任务指令数据后,所述多任务指令数据的占比稳定在第一阈值。
在其中一个实施例中,所述基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型,还包括:
通过低秩自适应对所述大模型进行微调,以生成监督微调模型和奖励模型,所述监督微调模型用于基于质控规则和病历文本获取第一病历质控结果,所述奖励模型用于基于所述质控规则、病历文本以及第一病历质控结果评价所述第一病历质控结果的质量;
通过所述低秩自适应和PPO强化学习算法对所述大模型进行微调,以对所述监督微调模型进行进一步微调,进一步微调后的所述监督微调模型用于提高所述第一病历质控结果的质量。
在其中一个实施例中,所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,包括:
调用所述监督微调模型对所述第一病历文本和第一病历质控规则进行预测,以获取第二病历质控结果;
调用所述奖励模型基于所述第一病历文本、第一病历质控规则以及第二病历质控结果,判断所述第二病历质控结果的质量是否达到第二阈值;若是,则
输出所述第二病历质控结果。
在其中一个实施例中,所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,还包括:
调用进一步微调后的所述监督微调模型对所述第一病历文本和第一病历质控规则进行预测,以获取第三病历质控结果;
输出所述第三病历质控结果;
其中,所述第三病历质控结果的质量达到所述第二阈值。
在其中一个实施例中,所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,还包括:
基于所述第一病历文本,从所述第一病历质控规则中抽取第一文本字段;
将所述第一文本字段和所述第一病历质控规则输入至所述监督微调模型,以预测所述第一病历质控规则基于所述第一病历文本的病历质控结果。
本发明还提供了一种病历质控装置,所述装置包括:
第一获取模块,用于获取第一指令数据,所述第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
模型微调模块,用于基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型;
质控结果预测模块,用于获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果;
其中,所述第一病历质控规则在所述病历质控规则范围内。
本发明还提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的病历质控方法。
本发明还提供了一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的病历质控方法。
上述病历质控方法、装置、电子设备及存储介质,通过获取具有病历规则范围的指令数据,并基于该指令数据对开源的大模型进行微调,以得到相应的病历质控模型。随后,获取当前时刻的病历文本以及病历质控规则,并调用病历质控模型基于当前时刻的病历文本预测病历质控规则的病历质控结果。该方法利用大模型更好的理解病历质控规则的语义信息,能够灵活地执行质控规则,使得质控规则不再僵化地对应固有的质控结果,同时避免了非医学专业的开发人员对于医学知识的欠缺导致的质控结果质量较低的情况,保证了病历质控结果的质量。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的病历质控方法流程示意图之一;
图2为本发明提供的具体实施例中病历质控方法的流程示意图;
图3为本发明提供的病历质控方法流程示意图之二;
图4为本发明提供的病历质控方法流程示意图之三;
图5为本发明提供的病历质控方法流程示意图之四;
图6为本发明提供的病历质控方法流程示意图之五;
图7为本发明提供的病历质控方法流程示意图之六;
图8为本发明提供的病历质控方法流程示意图之七;
图9为本发明提供的病历质控装置结构示意图;
图10为本发明提供的计算机设备的内部结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图10描述本发明提供的病历质控方法、装置、电子设备及存储介质。
如图1所示,在一个实施例中,一种病历质控方法,包括以下步骤:
步骤S110,获取第一指令数据,第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调。
具体的,结合图2所示,准备病历质控规则相关的指令数据,即第一指令数据,该指令数据中具有专业临床静的医学确定需要执行的病历质控规则范围及其定义,用于对大模型进行微调。
其中,大模型,即大型语言模型(英文缩写为LLM,全称为Large Language Model)。
步骤S120,基于第一指令数据,对大模型进行微调,微调后得到病历质控模型。
具体的,服务器基于步骤S110中得到的指令数据,通过该指令数据对大模型进行微调,以微调大模型在病历质控训练数据的质控结果,使得具有专业临床经验的医学确定需要执行的病历质控规则及其定义纳入大模型的知识范畴,使得大模型能够通过自身的语义理解特性充分理解和学习大量质控规则文本中的具体含义,进而生成能够灵活执行病历质控规则的病历质控模型,即模型M。
步骤S130,获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果。
具体的,在病历质控模型生成后的实际应用阶段,服务器获取当前时刻给定患者病历文本U以及病历质控规则R,使用步骤S120中生成的病历质控模型,即模型M,基于给定患者病历文本U预测病历质控规则R的病历质控结果。
其中,第一时刻为任一输入病历文本的时刻,包括当前时刻,第一病历文本为任一时刻对应的给定患者病历文本U,第一病历质控规则即为该时刻给定患者病历文本U对应的病历质控规则R。
上述病历质控方法,通过获取具有病历规则范围的指令数据,并基于该指令数据对开源的大模型进行微调,以得到相应的病历质控模型。随后,获取当前时刻的病历文本以及病历质控规则,并调用病历质控模型基于当前时刻的病历文本预测病历质控规则的病历质控结果。该方法利用大模型更好的理解病历质控规则的语义信息,能够灵活地执行质控规则,使得质控规则不再僵化地对应固有的质控结果,同时避免了非医学专业的开发人员对于医学知识的欠缺导致的质控结果质量较低的情况,保证了病历质控结果的质量。
如图3所示,在一个实施例中,本发明提供的病历质控方法,获取第一指令数据,具体包括以下步骤:
步骤S112,获取专业临床经验的医学确定执行的病历质控规则范围中病历质控规则的第一文本数据。
具体的,在获取第一指令数据的过程中,需要获取专业临床经验的医学确定执行的病历质控规则范围中所有病历质控规则涉及到的文本数据,即第一文本数据。
步骤S114,将第一文本数据转换为第一指令,第一指令用于结合第一质控结果获取第一指令数据。
具体的,将病历质控规则及其文本数据转换为适当的指令,即第一指令,以结合人工书写的质控答案获取第一指令数据。
步骤S116,获取第一质控结果,并结合第一指令,获取第一指令数据。
具体的,服务器获取人工书写的质控答案,即第一质控结果,并结合步骤S112中得到的第一指令,获取第一指令数据。
需要说明的是,第一质控结果为人工根据给定病历所书写的质控答案。
如图4所示,在一个实施例中,本发明提供的病历质控方法,基于第一指令数据,对大模型进行微调,微调后得到病历质控模型,具体包括以下步骤:
步骤S122,基于多个第一指令数据,获取多任务指令数据,多任务指令数据用于构建大模型学习病历质控规则的知识图谱。
具体的,服务器基于多个第一指令数据,构建多任务指令数据,以减少模型学习病历质控能力时发生模型其他能力遗忘的现象,进而构建出适应大模型学习病历质控规则的知识图谱,以保存大模型学习不同病历质控规则的内容。
步骤S124,基于大模型,获取开源指令数据,并将开源指令数据写入到多任务指令数据中。
具体的,服务器在大模型中获取开源指令数据,并将开源指令数据混合到病历质控任务中去。
其中,多任务指令数据包括病历质控任务,当开源指令数据混合到病历质控任务中后,可保持病历质控任务占比约为20%,即第一阈值。
如图5所示,在一个实施例中,本发明提供的病历质控方法,基于第一指令数据,对大模型进行微调,微调后得到病历质控模型,具体还包括以下步骤:
步骤S126,通过低秩自适应对大模型进行微调,以生成监督微调模型和奖励模型,监督微调模型用于基于质控规则和病历文本获取第一病历质控结果,奖励模型用于基于质控规则、病历文本以及第一病历质控结果评价第一病历质控结果的质量。
其中,低秩自适应(LoRA),用于将大模型权重冻结,并将可训练的秩分解矩阵注入Transformer架构的每一层,大大减少了下游任务的可训练参数数量。具体来说,它将原始矩阵分解为两个矩阵的乘积,其中一个矩阵的秩比另一个矩阵的秩低。只需要运用低秩矩阵来进行运算,可以减少模型参数数量,提高训练吞吐量,保证模型质量,且不会增加推理延迟。监督微调模型为SFT(Supervised Fine-Tuning Model)监督模型,为有监督的微调模型。奖励模型,即reward模型,用于给SFT模型的输出结果进行打分,来评价质控结果质量的高低。
具体的,使用LoRA对大模型进行微调,生成SFT监督模型,对于给定的(文书字段、质控规则)输入,SFT模型能够给出相应的质控答案。
步骤S128,通过低秩自适应和PPO强化学习算法对大模型进行微调,以对监督微调模型进行进一步微调,进一步微调后的监督微调模型用于提高第一病历质控结果的质量。
具体的,服务器通过LoRA以及PPO强化学习算法对大模型进行微调,以进一步微调SFT模型,进一步微调后的SFT模型对于给定的(文字字段、质控规则),能够确保模型给出的质控答案质量较高。
如图6所示,在一个实施例中,本发明提供的病历质控方法,获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果,具体包括以下步骤:
步骤S132,调用监督微调模型对第一病历文本和第一病历质控规则进行预测,以获取第二病历质控结果。
具体的,在实际应用阶段,服务器可以调用大模型中的SFT模型对当前时刻的病历文本及其对应的病历质控规则进行预测,以获取相应的病历质控结果。
步骤S134,调用奖励模型基于第一病历文本、第一病历质控规则以及第二病历质控结果,判断第二病历质控结果的质量是否达到第二阈值。
具体的,服务器再调用reward模型基于当前时刻的病历文本、病历质控规则以及步骤S132中得到的第二病历质控结果,判断reward模型对第二病历质控结果的打分是否达到第二阈值。
步骤S136,输出第二病历质控结果。
具体的,当步骤S134中的判断结果显示reward模型对第二病历质控结果的打分达到了第二阈值,则说明第二病历质控结果的质量较好,服务器则会输出该第二病历质控结果,在一定程度上对病历质控结果的质量进行了把控,保证了输出的病历质控结果的质量。
如图7所示,在一个实施例中,本发明提供的病历质控方法,获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果,具体还包括以下步骤:
步骤S131,调用进一步微调后的监督微调模型对第一病历文本和第一病历质控规则进行预测,以获取第三病历质控结果。
具体的,在实际应用中,服务器调用进一步微调后的SFT监督模型对当前时刻的病历文本和病历质控规则进行预测,以获取对应的第三病历质控结果。
步骤S133,输出第三病历质控结果。
具体的,由于进一步微调后的SFT模型加入了PPO强化学习算法,保证了第三病历质控结果的质量,因此reward模型对第三病历质控结果的打分达到了第二阈值,服务器则会直接输出步骤S132中得到的第三病历质控结果。
如图8所示,在一个实施例中,本发明提供的病历质控方法,获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果,具体还包括以下步骤:
步骤S810,基于第一病历文本,从第一病历质控规则中抽取第一文本字段。
具体的,服务器基于当前时刻的患者病历文本U,从病历文本U的病历信息中抽取病历质控规则R中涉及到的文书字段F。
其中,第一病历文本为患者病历文本U,第一病历质控规则为病历质控规则R,第一文本字段为文书字段F。
步骤S820,将第一文本字段和第一病历质控规则输入至监督微调模型,以预测第一病历质控规则基于第一病历文本的病历质控结果。
具体的,构建SFT模型的输入(F,R),预测病历质控规则R基于患者病历文本U的质控结果。
下面对本发明提供的病历质控装置进行描述,下文描述的病历质控装置与上文描述的病历质控方法可相互对应参照。
如图9所示,在一个实施例中,一种病历质控装置,包括第一获取模块910、模型微调模块920以及质控结果预测模块930。
第一获取模块910用于获取第一指令数据,第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调。
模型微调模块920用于基于第一指令数据,对大模型进行微调,微调后得到病历质控模型。
质控结果预测模块930用于获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果。
其中,第一病历质控规则在所述病历质控规则范围内。
在本实施例中,本发明提供的病历质控装置,第一获取模块具体用于:
获取专业临床经验的医学确定执行的病历质控规则范围中病历质控规则的第一文本数据。
将第一文本数据转换为第一指令,第一指令用于结合第一质控结果获取第一指令数据。
获取第一质控结果,并结合第一指令,获取第一指令数据;
其中,第一质控结果为基于给定病历人工输入的质控结果。
在本实施例中,本发明提供的病历质控装置,模型微调模块具体用于:
基于多个第一指令数据,获取多任务指令数据,多任务指令数据用于构建大模型学习病历质控规则的知识图谱。
基于大模型,获取开源指令数据,并将开源指令数据写入到多任务指令数据中。
其中,开源指令数据写入到多任务指令数据后,多任务指令数据的占比稳定在第一阈值。
在本实施例中,本发明提供的病历质控装置,模型微调模块具体还用于:
通过低秩自适应对大模型进行微调,以生成监督微调模型和奖励模型,监督微调模型用于基于质控规则和病历文本获取第一病历质控结果,奖励模型用于基于质控规则、病历文本以及第一病历质控结果评价第一病历质控结果的质量。
通过低秩自适应和PPO强化学习算法对大模型进行微调,以对监督微调模型进行进一步微调,进一步微调后的监督微调模型用于提高第一病历质控结果的质量。
在本实施例中,本发明提供的病历质控装置,质控结果预测模块具体用于:
调用监督微调模型对第一病历文本和第一病历质控规则进行预测,以获取第二病历质控结果。
调用奖励模型基于第一病历文本、第一病历质控规则以及第二病历质控结果,判断第二病历质控结果的质量是否达到第二阈值。若是,则
输出第二病历质控结果。
在本实施例中,本发明提供的病历质控装置,质控结果预测模块具体还用于:
调用进一步微调后的监督微调模型对第一病历文本和第一病历质控规则进行预测,以获取第三病历质控结果。
输出第三病历质控结果。
其中,第三病历质控结果的质量达到第二阈值。
在本实施例中,本发明提供的病历质控装置,质控结果预测模块具体还用于:
基于第一病历文本,从第一病历质控规则中抽取第一文本字段。
将第一文本字段和第一病历质控规则输入至监督微调模型,以预测第一病历质控规则基于第一病历文本的病历质控结果。
图10示例了一种电子设备的实体结构示意图,该电子设备可以是智能终端,其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现病历质控方法,该方法包括:
获取第一指令数据,第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
基于第一指令数据,对大模型进行微调,微调后得到病历质控模型;
获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果;
其中,第一病历质控规则在病历质控规则范围内。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
另一方面,本发明还提供了一种计算机存储介质,存储有计算机程序,计算机程序被处理器执行时实现病历质控方法,该方法包括:
获取第一指令数据,第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
基于第一指令数据,对大模型进行微调,微调后得到病历质控模型;
获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果;
其中,第一病历质控规则在病历质控规则范围内。
又一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令时实现病历质控方法,该方法包括:
获取第一指令数据,第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
基于第一指令数据,对大模型进行微调,微调后得到病历质控模型;
获取第一时刻的第一病历文本以及第一病历质控规则,并调用病历质控模型基于第一病历文本预测第一病历质控规则的病历质控结果;
其中,第一病历质控规则在病历质控规则范围内。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。
作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (6)
1.一种病历质控方法,其特征在于,所述方法包括:
获取第一指令数据,所述第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型;
获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果;
其中,所述第一病历质控规则在所述病历质控规则范围内;
所述基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型,包括:
基于多个所述第一指令数据,获取多任务指令数据,所述多任务指令数据用于构建所述大模型学习病历质控规则的知识图谱;
基于所述大模型,获取开源指令数据,并将所述开源指令数据写入到所述多任务指令数据中;
其中,所述开源指令数据写入到所述多任务指令数据后,所述多任务指令数据的占比稳定在第一阈值;
所述基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型,还包括:
通过低秩自适应对所述大模型进行微调,以生成监督微调模型和奖励模型,所述监督微调模型用于基于质控规则和病历文本获取第一病历质控结果,所述奖励模型用于基于所述质控规则、病历文本以及第一病历质控结果评价所述第一病历质控结果的质量;
通过所述低秩自适应和PPO强化学习算法对所述大模型进行微调,以对所述监督微调模型进行进一步微调,进一步微调后的所述监督微调模型用于提高所述第一病历质控结果的质量;
所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,包括:
调用所述监督微调模型对所述第一病历文本和第一病历质控规则进行预测,以获取第二病历质控结果;
调用所述奖励模型基于所述第一病历文本、第一病历质控规则以及第二病历质控结果,判断所述第二病历质控结果的质量是否达到第二阈值;若是,则
输出所述第二病历质控结果;
所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,还包括:
调用进一步微调后的所述监督微调模型对所述第一病历文本和第一病历质控规则进行预测,以获取第三病历质控结果;
输出所述第三病历质控结果;
其中,所述第三病历质控结果的质量达到所述第二阈值。
2.根据权利要求1所述的病历质控方法,其特征在于,所述获取第一指令数据,包括:
获取专业临床经验的医学确定执行的所述病历质控规则范围中病历质控规则的第一文本数据;
将所述第一文本数据转换为第一指令,所述第一指令用于结合第一质控结果获取所述第一指令数据;
获取所述第一质控结果,并结合所述第一指令,获取所述第一指令数据;
其中,所述第一质控结果为基于给定病历人工输入的质控结果。
3.根据权利要求1至2任一项所述的病历质控方法,其特征在于,所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,还包括:
基于所述第一病历文本,从所述第一病历质控规则中抽取第一文本字段;
将所述第一文本字段和所述第一病历质控规则输入至所述监督微调模型,以预测所述第一病历质控规则基于所述第一病历文本的病历质控结果。
4.一种病历质控装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一指令数据,所述第一指令数据具有病历质控规则范围,用于对开源的大模型进行微调;
模型微调模块,用于基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型;
质控结果预测模块,用于获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果;
其中,所述第一病历质控规则在所述病历质控规则范围内;
所述基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型,包括:
基于多个所述第一指令数据,获取多任务指令数据,所述多任务指令数据用于构建所述大模型学习病历质控规则的知识图谱;
基于所述大模型,获取开源指令数据,并将所述开源指令数据写入到所述多任务指令数据中;
其中,所述开源指令数据写入到所述多任务指令数据后,所述多任务指令数据的占比稳定在第一阈值;
所述基于所述第一指令数据,对所述大模型进行微调,微调后得到病历质控模型,还包括:
通过低秩自适应对所述大模型进行微调,以生成监督微调模型和奖励模型,所述监督微调模型用于基于质控规则和病历文本获取第一病历质控结果,所述奖励模型用于基于所述质控规则、病历文本以及第一病历质控结果评价所述第一病历质控结果的质量;
通过所述低秩自适应和PPO强化学习算法对所述大模型进行微调,以对所述监督微调模型进行进一步微调,进一步微调后的所述监督微调模型用于提高所述第一病历质控结果的质量;
所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,包括:
调用所述监督微调模型对所述第一病历文本和第一病历质控规则进行预测,以获取第二病历质控结果;
调用所述奖励模型基于所述第一病历文本、第一病历质控规则以及第二病历质控结果,判断所述第二病历质控结果的质量是否达到第二阈值;若是,则
输出所述第二病历质控结果;
所述获取第一时刻的第一病历文本以及第一病历质控规则,并调用所述病历质控模型基于所述第一病历文本预测所述第一病历质控规则的病历质控结果,还包括:
调用进一步微调后的所述监督微调模型对所述第一病历文本和第一病历质控规则进行预测,以获取第三病历质控结果;
输出所述第三病历质控结果;
其中,所述第三病历质控结果的质量达到所述第二阈值。
5.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述的方法的步骤。
6.一种计算机存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310871613.1A CN116682524B (zh) | 2023-07-17 | 2023-07-17 | 病历质控方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310871613.1A CN116682524B (zh) | 2023-07-17 | 2023-07-17 | 病历质控方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116682524A CN116682524A (zh) | 2023-09-01 |
CN116682524B true CN116682524B (zh) | 2024-02-02 |
Family
ID=87791115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310871613.1A Active CN116682524B (zh) | 2023-07-17 | 2023-07-17 | 病历质控方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116682524B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913450B (zh) * | 2023-09-07 | 2023-12-19 | 北京左医科技有限公司 | 一种实时生成病历的方法及装置 |
CN117648397A (zh) * | 2023-11-07 | 2024-03-05 | 中译语通科技股份有限公司 | 篇章事件抽取方法、系统、设备及存储介质 |
CN117995346A (zh) * | 2024-04-07 | 2024-05-07 | 北京惠每云科技有限公司 | 病历质控优化方法、装置、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682397A (zh) * | 2016-12-09 | 2017-05-17 | 江西中科九峰智慧医疗科技有限公司 | 一种基于知识的电子病历质控方法 |
CN111667894A (zh) * | 2020-06-03 | 2020-09-15 | 长沙瀚云信息科技有限公司 | 基于rete算法规则引擎的医院电子病历质量监控和管理系统 |
CN113361230A (zh) * | 2021-05-27 | 2021-09-07 | 重庆南鹏人工智能科技研究院有限公司 | 一种基于临床诊疗指南进行电子病历诊疗质控的方法 |
CN113838546A (zh) * | 2021-09-24 | 2021-12-24 | 山东众阳健康科技集团有限公司 | 一种基于内涵质控的病历管理方法及系统 |
CN114240160A (zh) * | 2021-12-17 | 2022-03-25 | 挂号网(杭州)科技有限公司 | 电子病历的质控方法、装置、电子设备及存储介质 |
WO2022153486A1 (ja) * | 2021-01-15 | 2022-07-21 | 富士通株式会社 | ルール更新プログラム、ルール更新方法及びルール更新装置 |
CN114913953A (zh) * | 2022-07-19 | 2022-08-16 | 北京惠每云科技有限公司 | 医学实体关系的识别方法、装置、电子设备及存储介质 |
-
2023
- 2023-07-17 CN CN202310871613.1A patent/CN116682524B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682397A (zh) * | 2016-12-09 | 2017-05-17 | 江西中科九峰智慧医疗科技有限公司 | 一种基于知识的电子病历质控方法 |
CN111667894A (zh) * | 2020-06-03 | 2020-09-15 | 长沙瀚云信息科技有限公司 | 基于rete算法规则引擎的医院电子病历质量监控和管理系统 |
WO2022153486A1 (ja) * | 2021-01-15 | 2022-07-21 | 富士通株式会社 | ルール更新プログラム、ルール更新方法及びルール更新装置 |
CN113361230A (zh) * | 2021-05-27 | 2021-09-07 | 重庆南鹏人工智能科技研究院有限公司 | 一种基于临床诊疗指南进行电子病历诊疗质控的方法 |
CN113838546A (zh) * | 2021-09-24 | 2021-12-24 | 山东众阳健康科技集团有限公司 | 一种基于内涵质控的病历管理方法及系统 |
CN114240160A (zh) * | 2021-12-17 | 2022-03-25 | 挂号网(杭州)科技有限公司 | 电子病历的质控方法、装置、电子设备及存储介质 |
CN114913953A (zh) * | 2022-07-19 | 2022-08-16 | 北京惠每云科技有限公司 | 医学实体关系的识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116682524A (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116682524B (zh) | 病历质控方法、装置、电子设备及存储介质 | |
Brunori et al. | Upward and downward bias when measuring inequality of opportunity | |
US11527325B2 (en) | Analysis apparatus and analysis method | |
Garner et al. | Introducing Therioepistemology: the study of how knowledge is gained from animal research | |
US20210249138A1 (en) | Disease risk prediction device, disease risk prediction method, and disease risk prediction program | |
US20210233191A1 (en) | Method, apparatus and computer program for operating a machine learning framework with active learning technique | |
Dias et al. | Linear regression model with histogram‐valued variables | |
Singh et al. | Generalizability challenges of mortality risk prediction models: A retrospective analysis on a multi-center database | |
US20220044809A1 (en) | Systems and methods for using deep learning to generate acuity scores for critically ill or injured patients | |
BR112020020904A2 (pt) | sistema de diagnóstico e método para o processamento de dados um veículo automotor | |
Hernández-Camacho et al. | The use of surrogate data in demographic population viability analysis: a case study of California sea lions | |
Watkins | Reevaluating the grandmother hypothesis | |
Bauman et al. | Reproductive Viability Analysis (RVA) as a new tool for ex situ population management | |
Hermans et al. | Novel approaches to assess the quality of fertility data stored in dairy herd management software | |
Cuparić et al. | New characterization-based exponentiality tests for randomly censored data | |
Schofield et al. | Machine-learning based prediction of Cushing’s syndrome in dogs attending UK primary-care veterinary practice | |
Abbona et al. | Towards modelling beef cattle management with Genetic Programming | |
Butterworth | A response to Sherley: FISHERIES/2020/JUL/SWG-PEL/53REV | |
WO2023086033A2 (en) | Methods and systems for asset management | |
KR102306953B1 (ko) | 음성인식 기반 진료 지원 방법 | |
Montagna et al. | Augmenting BDI Agency with a Cognitive Service: Architecture and Validation in Healthcare Domain | |
Ballard et al. | Fitting Computational Models to Data: A Tutorial | |
CN111354466B (zh) | 确定精液标准值的方法、装置、计算机设备和存储介质 | |
Danielson et al. | NERD and norms: framework and experiments | |
KUMAR et al. | Comparison of penalized and multiple linear regression for prediction of milk yield in crossbred cattle |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |