CN117809798B

CN117809798B - 基于大模型的检验报告解读方法、系统、设备及介质

Info

Publication number: CN117809798B
Application number: CN202410233518.3A
Authority: CN
Inventors: 武永康; 陆小琴; 雷玉倩
Original assignee: Jintang First People's Hospital
Current assignee: Jintang First People's Hospital
Priority date: 2024-03-01
Filing date: 2024-03-01
Publication date: 2024-04-26
Anticipated expiration: 2044-03-01
Also published as: CN117809798A

Abstract

本发明公开了一种基于大模型的检验报告解读方法、系统、设备及介质，涉及检验报告自动解读，其目的在于提高检验报告解读的准确性和可靠性，其包括：通过爬虫程序从网络上收集相关的医学知识数据，并利用收集的医学知识数据对报告解析大语言模型进行自监督学习；对报告解析大语言模型进行健康建议微调，使报告解析大语言模型具备根据报告解读结论输出健康建议的能力；获取待解读的检验报告数据，并将检验报告数据输入报告解析大语言模型进行解析，并输出报告解读结论、健康建议。本方法提高检验报告的解读准确性和可靠性，被检测者可根据健康建议进行后续健康调理。

Description

基于大模型的检验报告解读方法、系统、设备及介质

技术领域

本发明属于人工智能技术领域，涉及检验报告的智能解读，尤其涉及一种基于大模型的检验报告解读方法、系统、设备及介质。

背景技术

随着生活水平的提高，人们对健康状况的关注也是越来越高。无论是人们日常的健康体检，还是在就医诊断过程中，都会涉及各种各样的检测，同时也会产生各种检测报告、检验报告（以下统称为检验报告）。尤其是在临床中，患者对自身的健康状况有了足够了解，对检验报告中的各项数据也有了清晰的认识、了解，那患者配合诊断、治疗的可能性就会大大提高，对患者后续的健康管理也非常重要。然而，由于报告的解读过于专业，普通人对报告中的专业术语不理解。所以，现有技术中，被测者在领取到检测报告后，通常是将报告给到医生，然后由医生进行指导、解读、解释并给出相应健康建议。由于现在医疗资源较为欠缺，医生基本不可能做到面面俱到，对每位患者详细解读、解释其检验报告，为此，就亟需一种检验报告的智能解读方法、解读系统，以便普通人员能够根据解读的结果了解自身的健康状况、知晓如何配合医生的诊疗、甚至是后续的自我健康管理。

现有的报告智能解读方法，大多是从对接的医疗信息系统中获取检查报告，然后大模型根据患者针对报告提出的问题进行分析，得到关键词，患者问答系统根据关键词匹配相应的回答以及诊断建议，然后大模型再根据问答以及诊断建议进行分析后，生成解答并提供给患者。

如，申请号为202310472245.3的发明专利申请就公开了一种体检报告解读方法、装置、存储介质以及电子设备，其方法包括：获取待解读的体检报告；针对所述体检报告的类型采用与所述体检报告的类型相对应的数据提取方法，获取与所述体检报告对应的若干结构化体检数据；采用预设算法模型对各所述结构化体检数据进行数据处理，得到与所述体检报告对应的各医疗分析数据；至少基于目标医疗分析数据以及与所述目标医疗分析数据对应的预置数据等级划分方式，生成反映健康趋势的体检报告解读图示。本解读方法可以更精确的直观的展示用户的体检结果，反映用户的健康状况。

再如，申请号为202310956340.0的发明专利申请就公开了一种基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统，其包括流程挖掘数据引擎、流程挖掘图表组件、任务编排引擎、大语言模型和自然语言接口；流程挖掘数据引擎：流程挖掘数据引擎是该系统的核心组件，用于接收和处理流程挖掘的原始数据；流程挖掘数据引擎从各种数据源中提取数据，并进行预处理和清洗，以准备后续的分析工作；数据源包括日志文件、数据库、传感器，该引擎支持数据抽取、转换和加载、数据清洗和特征提取，以确保数据的质量和准确性；流程挖掘图表组件：流程挖掘图表组件用于将经过专题数据计算后的结果可视化呈现。流程挖掘图表组件生成各种类型的图表，以展示不同维度的流程挖掘数据，图表为柱状图、折线图、饼图；这些图表能够直观地揭示数据之间的关联和趋势，帮助用户更好地理解和分析数据；任务编排引擎：任务编排引擎是协调系统中各个组件的关键部分；任务编排引擎根据用户需求和输入提示，与大语言模型进行交互，并协调生成最终的智能分析报告；任务编排引擎负责将用户的问题和需求转化为适合大语言模型处理的输入格式，并管理模型的调用和结果的解析；大语言模型：大语言模型是系统中的智能分析核心，它基于强大的自然语言处理和文本生成能力，可以根据输入提示推理生成结论和报告；通过与任务编排引擎的协作，大语言模型能够利用流程挖掘数据、专题数据计算结果以及可视化图表等信息，生成描述、分析和解读流程挖掘模型的智能报告；自然语言接口：系统提供自然语言接口，使系统具备以自然语言方式进行交互的能力，用户可以通过简单的自然语言指令与系统进行交互；用户可以提出问题、输入指令或请求特定类型的报告，系统将根据用户的输入进行解析和生成对应的分析报告，使得用户与系统之间的交互更加直观和便捷。

如上述的基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统，现有的智能分析报告大多仅是采用大语言模型对报告进行解读，或者根据患者的提问结合报告进行解答。但是，基于大语言模型分析得来的文本数据，尚不能直接使用，或者使用后对报告的解读准确性较低、可靠性也更低，有必要提供一种解读准确性与可靠性更高的检验报告解读方法；此外，现有的解读方法仅是解读报告中的内容，并不能根据报告给出相应的健康建议。

发明内容

本发明的目的在于：为了提高检验报告解读的准确性和可靠性，提供一种基于大模型的检验报告解读方法、系统、设备及介质，通过在构建和微调大语言模型后，使模型能够掌握专业知识，形成专家智库，模型可根据被测者的检验数据进行解读、生成对应的健康建议，让被测者能够读懂自己的检验报告，知晓后续的健康建议。

本发明为了实现上述目的具体采用以下技术方案：

一种基于大模型的检验报告解读方法，包括以下步骤：

步骤S1，构建专家知识库；

通过爬虫程序从网络上收集医学知识数据，并利用收集的医学知识数据对报告解析大语言模型进行自监督学习；

步骤S2，使用前微调；

对报告解析大语言模型进行健康建议微调，使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力；

步骤S3，报告解析；

获取待解读的检验报告数据，并将检验报告数据输入报告解析大语言模型进行解析，并输出报告解读结论、健康建议。

进一步地，步骤S1中，报告解析大语言模型进行自监督学习时，具体步骤为：

步骤S1-1，输出特征向量；

使用报告解析大语言模型作为分析器，对检验报告样本数据进行分词处理，输出特征向量；

步骤S1-2，预测特征向量；

对于每条样本数据，将每条样本数据的特征向量逐个输入到报告解析大语言模型中，报告解析大语言模型根据输入的特征向量去预测后面的特征向量，并且计算同一条样本数据的两个特征向量的向量误差；

步骤S1-3，更新参数；

根据向量误差，更新大语言模型的参数；

步骤S1-4，重复至模型收敛；

重复步骤S1-2到步骤S1-3，直至报告解析大语言模型收敛。

进一步地，步骤S2中，在进行健康建议微调时，具体步骤为：

步骤S2-1-1，设计多个表示不同任务的人工编写指令，根据每条人工编写指令编写对应的（输入）和/或（输出），并将这些数据（指令，输入，输出）、（指令、输出）作为种子池；

步骤S2-1-2，从种子池中随机抽取n条人工编写指令，并输入至报告解析大语言模型，报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的（输入，输出）；

其中，指令类型包括分类指令、非分类指令；

步骤S2-1-3，选择m条人工编写指令、p条模型生成指令，并将选择出来的指令输入至报告解析大语言模型，报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的（输入，输出）；

步骤S2-1-4，判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标；若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍，则将该指令对应的数据（指令，输入，输出）、（指令、输出）添加进种子池，并更新种子池；

步骤S2-1-5，重复步骤S2-1-3、步骤S2-1-4，直至种子池中所有指令数量达到10000条；

步骤S2-1-6，根据报告解析大语言模型输出的报告解读结论，报告解析大语言模型匹配种子池中数据（指令，输入，输出）中的（输入），并输出与该（输入）对应的（输出），该（输出）即为健康建议。

进一步地，步骤S2，在对报告解析大语言模型进行健康建议微调之后，再对报告解析大语言模型进行专家反馈微调。

更进一步地，在进行专家反馈微调时，具体步骤为：

步骤S2-2-1，获取样本数据；

获取检验报告样本数据及报告解读结论；

步骤S2-2-2，构建奖励模型；

奖励模型包括奖励大语言模型、输出层，奖励大语言模型通过复制报告解析大语言模型得到；

步骤S2-2-3，训练奖励模型；

采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练，得到成熟的奖励模型；

步骤S2-2-4，优化模型；

使用PPO算法并根据奖励值优化报告解析大语言模型中的参数，优化过程中固定输出层的参数，仅更新奖励大语言模型、报告解析大语言模型的参数。

更进一步地，步骤S2-2-3中，在训练奖励模型时，损失函数为：

，其中，/>表示输入的问题，表示回答的序号，/>表示选择结果的序号，/>表示奖励模型，/>表示数据集，/>表示第i个回答，/>表示回答的集合，/>表示选择结果的集合，/>表示第j个选择结果，/>表示选择该回答能够得到的奖励权重，/>表示回答的文本内容，/>表示第i个回答所能得到的奖励权重，/>表示第i个回答的文本内容，/>表示奖励模型。

进一步地，步骤S2-2-4中，在优化模型时，使用KL散度作为奖励值的惩罚项，设专家反馈微调前报告解析大语言模型输出为，奖励大语言模型的输出为/>，则奖励值表示为：/>，其中，/>表示惩罚权重，/>表示KL散度，/>表示奖励模型输出。

一种基于大模型的检验报告解读系统，包括以下步骤：

专家知识库构建模块，用于通过爬虫程序从网络上收集医学知识数据，并利用收集的医学知识数据对报告解析大语言模型进行自监督学习；

使用前微调模块，用于对报告解析大语言模型进行健康建议微调，使报告解析大语言模型具备根据报告解读结论输出健康建议的能力；

报告解析模块，用于获取待解读的检验报告数据，并将检验报告数据输入报告解析大语言模型进行解析，并输出报告解读结论、健康建议。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述方法的步骤。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行上述方法的步骤。

本发明的有益效果如下：

1、本发明中，通过爬虫技术获取了相关的医学知识数据，形成了专家知识库，并且报告解析大语言模型可根据爬取的医学知识进行自监督学习，从而使报告解析大语言模型能够掌握相关的医学知识，并将其用于对待检验报告进行解析，从而可大大提高检验报告的解读准确性与可靠性；由于该报告解析大语言模型经过了使用前的微调，使得该报告解析大语言模型不仅可以输出解读结论，其还可以根据检验报告、解读结论生成健康建议，被检测人员可根据健康建议进行后续的健康调理，改善自身健康环境；此外，由于在爬取医学知识数据时，可以对爬取的数据进行归类，归类时，可以按照疾病类型进行分类，也可以按照医学报告类型进行分类，这样无论是做普通的体检检测，还是疑似某个疾病的检测，报告解析大语言模型能够给出更为准确、专业的解读结论、以及健康建议。

2、本发明中，引入基于专家反馈的模型微调（专家反馈微调），专家反馈中的专业知识信息质量普遍较高，差异性较小；专家的反馈参考价值极大，在微调时能够有效地提升专业知识的学习质量。

附图说明

图1是本发明的流程示意图；

图2是本发明中自监督学习的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

因此，基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

本实施例提供一种基于大模型的检验报告解读方法，其可以适用于健康体检的检测报告的解读，也可以适用于某个疾病诊疗过程中的检测报告的解读。如图1所示，其包括以下步骤：

步骤S1，构建专家知识库；

通过爬虫程序从网络上收集医学知识数据，并利用收集的医学知识数据对报告解析大语言模型进行自监督学习。

报告解析大语言模型为现有的开源的大语言模型，此为现有技术。

在构建专家知识库之前，需要明确其构建的目标和范围，比如检验指标信息、指标含义和健康建议等信息。

资料收集是知识库建立的一个关键步骤。本实施例的检验报告解读方法，其适用于绝大多数的报告的解读，包括但不限于常规的健康体检的检验报告（比如血常规检验报告、尿常规检验报告、肝功能检验报告、心电图检验报告、心肌酶谱检验报告等）、（疑似）特定疾病的检验报告（比如与心脏病相关的心电图检验报告、心脏彩超检验报告、超声心动图检验报告、冠脉造影检验报告等，当然还可以是其他疾病的相关检验报告，此处就不一一例举）。主要健康体检、主要疾病的相关的医学知识可通过爬虫程序从网络上进行收集，将爬取的数据用于模型的学习，也可以直接将某本书籍、某篇文章给到模型进行学习。收集的信息包括中英文两种语言，以解决报告解析大语言模型通常存在的对中文解析能力较差的问题。爬虫程序将按照预先设置好的关键字去获取对应的文本，然后将找到的相关文本储存在数据库当中。

报告解析大语言模型进行自监督学习时，如图2所示，具体步骤为：

步骤S1-1，输出特征向量；

步骤S1-2，预测特征向量；

步骤S1-3，更新参数；

根据向量误差，更新大语言模型的参数；

步骤S1-4，重复至模型收敛；

重复步骤S1-2到步骤S1-3，直至报告解析大语言模型收敛。

步骤S2，使用前微调；

对报告解析大语言模型进行健康建议微调，使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力。

进行使用前微调的目的是对于训练好的报告解析大语言模型进行优化，以使报告解析大语言模型能够输出更加具有可读性、并且能够回答患者输入的一些问题、根据报告解读结论提供健康建议。

在进行健康建议微调时，具体步骤为：

步骤S2-1-2，从种子池中随机抽取8条人工编写指令，并输入至报告解析大语言模型，报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的（输入，输出）；

其中，指令类型包括分类指令、非分类指令；

步骤S2-1-3，选择6条人工编写指令、2条模型生成指令（该模型生成指令来自于步骤S2-1-2中报告解析大语言模型输出的模型生成指令），并将选择出来的指令输入至报告解析大语言模型，报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的（输入，输出）。

在给定指令之后，生成对应的（输入，输出）时还有两种策略：一种是先生成输入，后生成输出，即输入优先策略；另一种是先生成输出，后生成输入，即输出优先策略。之所以会有输出优先的方式，是因为输入优先的方式在生成输入时，偏向于只生成一个标签，尤其是指令对应着分类任务时，其输入里面偏向于只生成一个类别。输出优先就是为了一定程度上缓解该问题。

（1）输入优先

在种子池中随机抽取 k 条数据，输入给报告解析大语言模型，让报告解析大语言模型为最后的指令生成相应的实例，即（输入，输出）。

（2）输出优先

对于分类任务，如果先生成文本，后生成标签，报告解析大语言模型会偏向于生成比较单一的结果。所以对于分类任务，是先生成随机的标签，然后再生成该标签对应的文本。具体操作是在种子池中随机抽取k条在之前的步骤中已经标记为分类的数据输入给报告解析大语言模型，让报告解析大语言模型为最后的指令生成相应的实例，即（输入，输出）。

步骤S2-1-4，判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标；若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍，则将该指令对应的数据（指令，输入，输出）、（指令、输出）添加进种子池，并更新种子池。

该步骤可排除一些无法被语言模型处理的指令，比如涉及图像、图片、图形的指令；在给指令生成实例时，会过滤掉输入相同但是输出不同的实例。

因为报告解读系统专业知识要求较高，现有的报告解读系统存在两个问题：一、大数据方法收集到的数据质量差异性较大，对应模型微调可能产生负面的影响，不利于专业知识的定向学习。二、在后续基于人类反馈微调的过程中，普通用户（比如说患者）产生的反馈缺乏专业知识上的参考价值，无法通过反馈学习提升模型学习到的专业知识的质量。基于这两个原因，在本实施例的报告解读方法中，引入基于专家反馈的模型微调是非常有利于解决上述两个问题的。对于问题一，专家反馈中的专业知识信息质量普遍较高，差异性较小。对于问题二，专家的反馈参考价值极大，在微调时能够有效地提升专业知识的学习质量。

因此，本实施例在对报告解析大语言模型进行健康建议微调之后，再对报告解析大语言模型进行专家反馈微调。在进行专家反馈微调时，具体步骤为：

步骤S2-2-1，获取样本数据；

获取检验报告样本数据及报告解读结论。检验报告样本数据及报告解读结论可来自于各大医院。

针对给出的检验报告样本数据，通过当前模型生成或者从数据库中其它专家给出的专业化的解读中挑选4个结果，且保证其中至少有2个是模型生成的结果，然后由专家选择他认为其中较好的2个结果。由此获取的数据记为，其中x为输入的问题，/>为模型生成或者选出的回答，/>，其中/>是结果的文本，，结果为专家解读则值为a，为模型生成则值为1-a，a是一个超参数。b为专家选择的两个结果，/>。收集的数据集记为S。

步骤S2-2-2，构建奖励模型；

奖励模型包括奖励大语言模型、输出层，奖励大语言模型通过复制报告解析大语言模型得到。即，该奖励模型的结构就是在复制的报告解析大语言模型上额外增加一个输出层。

步骤S2-2-3，训练奖励模型；

采用步骤S2-2-1获取的检验报告样本数据及报告解读结论对步骤S2-2-2构建的奖励模型进行训练，得到成熟的奖励模型。

训练时，仅修改奖励模型的输出层的参数，奖励模型记为。奖励值的产生策略为：如果专家选择了模型生成的结果，则给予较高的奖励，反之则给予较低的奖励。通过这个策略来鼓励模型生成更加接近专家解读结果的输出。奖励模型使用的损失函数为：

，其中，/>表示输入的问题，/>表示回答的序号，/>表示选择结果的序号，/>表示奖励模型，/>表示数据集，/>表示第i个回答，/>表示回答的集合，/>表示选择结果的集合，/>表示第j个选择结果，/>表示选择该回答能够得到的奖励权重，/>表示回答的文本内容，/>表示第i个回答所能得到的奖励权重，/>表示第i个回答的文本内容，/>表示奖励模型。

步骤S2-2-4，优化模型；

其中，该PPO算法为现有的算法，可参照“Proximal Policy Optimization(PPO,Schul-man et al. (2017) )”。

为了使此阶段产生的结果不偏离最初预训练好的模型太远，在优化模型时，使用KL散度作为奖励值的惩罚项，设专家反馈微调前报告解析大语言模型输出为，奖励大语言模型的输出为/>，则奖励值表示为：/>，其中，/>表示惩罚权重，/>表示KL散度，/>表示奖励模型输出。

步骤S3，报告解析；

因为检验报告的类型有多种，比如数据库导入的数据和患者自己上传的照片等数据，所以有必要在使用LLM接口对报告进行解析之前预先对数据进行预处理，以达到更好的解析效果。

检验报告数据预处理方式：

1. 将报告数据按照文件名，内容进行分类。

2. 针对分类好的各类文件单独实现对应的LLM接口调研程序，以引导大模型能够更好地去处理该类别的数据。

另外，还根据对健康建议的满意度，对种子池里面的数据进行打分，并剔除掉得分低的数据，不断对报告解析大语言模型进行微调和改进，以提高报告解析大语言模型对报告的解读准确性、健康建议的合理性和准确性。

另外，在爬取医学知识数据时，可以对爬取的数据进行归类，归类时，可以按照疾病类型进行分类，也可以按照医学报告类型进行分类，这样无论是做常规的健康体检的检验报告，还是某个疑似疾病的检测，报告解析大语言模型都能够给出更为准确、专业的解读结论、以及健康建议。

实施例2

本实施例提供一种基于大模型的检验报告解读系统，其可以适用于健康体检的检测报告的解读，也可以适用于某个疾病诊疗过程中的检测报告的解读。如图1所示，其包括以下步骤：

专家知识库构建模块，用于通过爬虫程序从网络上收集医学知识数据，并利用收集的医学知识数据对报告解析大语言模型进行自监督学习。

步骤S1-1，输出特征向量；

步骤S1-2，预测特征向量；

步骤S1-3，更新参数；

根据向量误差，更新大语言模型的参数；

步骤S1-4，重复至模型收敛；

重复步骤S1-2到步骤S1-3，直至报告解析大语言模型收敛。

使用前微调模块，用于对报告解析大语言模型进行健康建议微调，使报告解析大语言模型具备根据报告解读结论输出健康建议的能力。

在进行健康建议微调时，具体步骤为：

其中，指令类型包括分类指令、非分类指令；

（1）输入优先

（2）输出优先

步骤S2-2-1，获取样本数据；

步骤S2-2-2，构建奖励模型；

步骤S2-2-3，训练奖励模型；

训练时，仅修改奖励模型的输出层的参数，奖励模型记为。奖励值的产生策略为：如果专家选择了模型生成的结果，则给与较高的奖励，反之则给予较低的奖励。通过这个策略来鼓励模型生成更加接近专家解读结果的输出。奖励模型使用的损失函数为：

步骤S2-2-4，优化模型；

为了使此阶段产生的结果不偏离最初预训练好的模型太远，在优化模型时，使用KL散度作为奖励值的惩罚项，设专家反馈微调前报告解析大语言模型输出为，奖励大语言模型的输出为/>，则奖励值表示为：/>，其中，/>表示惩罚权重，/>表示KL散度，/>表示奖励模型输出。/>

检验报告数据预处理方式：

1. 将报告数据按照文件名，内容进行分类。

实施例3

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行基于大模型的检验报告解读方法的步骤。

其中，所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器可以是所述计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，所述存储器也可以是所述计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(SmartMediaCard，SMC)，安全数字(SecureDigital，SD)卡，闪存卡(FlashCard)等。当然，所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设备。本实施例中，所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软件，例如所述基于大模型的检验报告解读方法的程序代码等。此外，所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器在一些实施例中可以是中央处理器(CentralProcessingUnit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述计算机设备的总体操作。本实施例中，所述处理器用于运行所述存储器中存储的程序代码或者处理数据，例如运行所述基于大模型的检验报告解读方法的程序代码。

实施例4

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行基于大模型的检验报告解读方法的步骤。

其中，所述计算机可读存储介质存储有界面显示程序，所述界面显示程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于大模型的检验报告解读方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器或者网络设备等)执行本申请实施例所述基于大模型的检验报告解读方法。

Claims

1.一种基于大模型的检验报告解读方法，其特征在于，包括以下步骤：

步骤S1，构建专家知识库；

步骤S2，使用前微调；

步骤S3，报告解析；

获取待解读的检验报告数据，并将检验报告数据输入报告解析大语言模型进行解析，并输出报告解读结论、健康建议；

步骤S1中，报告解析大语言模型进行自监督学习时，具体步骤为：

步骤S1-1，输出特征向量；

步骤S1-2，预测特征向量；

步骤S1-3，更新参数；

根据向量误差，更新大语言模型的参数；

步骤S1-4，重复至模型收敛；

重复步骤S1-2到步骤S1-3，直至报告解析大语言模型收敛；

步骤S2中，在进行健康建议微调时，具体步骤为：

步骤S2-1-1，设计多个表示不同任务的人工编写指令，根据每条人工编写指令编写对应的“输入”和/或“输出”，并将这些数据“指令，输入，输出”、“指令、输出”作为种子池；

步骤S2-1-2，从种子池中随机抽取n条人工编写指令，并输入至报告解析大语言模型，报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的“输入，输出”；

其中，指令类型包括分类指令、非分类指令；

步骤S2-1-3，选择m条人工编写指令、p条模型生成指令，并将选择出来的指令输入至报告解析大语言模型，报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的“输入，输出”；

步骤S2-1-4，判断步骤S2-1-3输出的模型生成指令的ROUGE-L指标；若模型生成指令的ROUGE-L指标小于种子池中的指令的ROUGE-L指标的0.7倍，则将该指令对应的数据“指令，输入，输出”、“指令、输出”添加进种子池，并更新种子池；

步骤S2-1-6，根据报告解析大语言模型输出的报告解读结论，报告解析大语言模型匹配种子池中数据“指令，输入，输出”中的“输入”，并输出与该“输入”对应的“输出”，该“输出”即为健康建议；

步骤S2，在对报告解析大语言模型进行健康建议微调之后，再对报告解析大语言模型进行专家反馈微调；

在进行专家反馈微调时，具体步骤为：

步骤S2-2-1，获取样本数据；

获取检验报告样本数据及报告解读结论；

步骤S2-2-2，构建奖励模型；

步骤S2-2-3，训练奖励模型；

步骤S2-2-4，优化模型；

使用PPO算法并根据奖励值优化报告解析大语言模型中的参数，优化过程中固定输出层的参数，仅更新奖励大语言模型、报告解析大语言模型的参数；

步骤S2-2-3中，在训练奖励模型时，损失函数为：，其中，/>表示输入的问题，/>表示回答的序号，/>表示选择结果的序号，/>表示奖励模型，/>表示数据集，/>表示第i个回答，表示回答的集合，/>表示选择结果的集合，/>表示第j个选择结果，/>表示选择该回答能够得到的奖励权重，/>表示回答的文本内容，/>表示第i个回答所能得到的奖励权重，/>表示第i个回答的文本内容，/>表示奖励模型；

步骤S2-2-4中，在优化模型时，使用KL散度作为奖励值的惩罚项，设专家反馈微调前报告解析大语言模型输出为，奖励大语言模型的输出为/>，则奖励值表示为：，其中，/>表示惩罚权重，/>表示KL散度，/>表示奖励模型输出。

2.一种基于大模型的检验报告解读系统，其特征在于，包括以下步骤：

使用前微调模块，用于对报告解析大语言模型进行健康建议微调，使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力；

报告解析模块，用于获取待解读的检验报告数据，并将检验报告数据输入报告解析大语言模型进行解析，并输出报告解读结论、健康建议；

专家知识库构建模块中，报告解析大语言模型进行自监督学习时，具体步骤为：

步骤S1-1，输出特征向量；

步骤S1-2，预测特征向量；

步骤S1-3，更新参数；

根据向量误差，更新大语言模型的参数；

步骤S1-4，重复至模型收敛；

重复步骤S1-2到步骤S1-3，直至报告解析大语言模型收敛；

使用前微调模块中，在进行健康建议微调时，具体步骤为：

其中，指令类型包括分类指令、非分类指令；

使用前微调模块中，在对报告解析大语言模型进行健康建议微调之后，再对报告解析大语言模型进行专家反馈微调；

在进行专家反馈微调时，具体步骤为：

步骤S2-2-1，获取样本数据；

获取检验报告样本数据及报告解读结论；

步骤S2-2-2，构建奖励模型；

步骤S2-2-3，训练奖励模型；

步骤S2-2-4，优化模型；

步骤S2-2-3中，在训练奖励模型时，损失函数为：，其中，/>表示输入的问题，表示回答的序号，/>表示选择结果的序号，/>表示奖励模型，/>表示数据集，/>表示第i个回答，/>表示回答的集合，/>表示选择结果的集合，/>表示第j个选择结果，/>表示选择该回答能够得到的奖励权重，/>表示回答的文本内容，/>表示第i个回答所能得到的奖励权重，/>表示第i个回答的文本内容，/>表示奖励模型；

3.一种计算机设备，其特征在于：包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1所述方法的步骤。

4.一种计算机可读存储介质，其特征在于：存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1所述方法的步骤。