CN117690545A

CN117690545A - 一种基于大模型的治疗方案生成方法及装置

Info

Publication number: CN117690545A
Application number: CN202311702178.6A
Authority: CN
Inventors: 李宇欣; 韩敏
Original assignee: Health Hope (beijing) Technology Co ltd
Current assignee: Health Hope (beijing) Technology Co ltd
Priority date: 2023-12-12
Filing date: 2023-12-12
Publication date: 2024-03-12

Abstract

本发明公开了一种基于大模型的治疗方案生成方法及装置，涉及计算辅助医疗技术领域，方法包括：对患者病症信息进行向量化处理；从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量，并获取参考病例向量对应的参考病例文本信息；按照提示词模版将患者病症信息和参考病例文本信息组合为提示词；将提示词输入至训练好的大模型中，得到患者病症对应的治疗方案。本发明将大模型与病例知识库结合，能够获得更加精准、有效、高质量的输入提示词，通过大量样本的微调训练，使大模型更加适用于输出治疗方案这一特定领域，也保证了模型输出结果的准确性。

Description

一种基于大模型的治疗方案生成方法及装置

技术领域

本发明涉及计算机辅助医疗技术领域，特别涉及一种基于大模型的治疗方案生成方法及装置。

背景技术

在疾病治疗过程中，可供医生选择的药物种类繁多，医生要得到准确对应的药物或剂量，需要查询大量的历史病例，通过对历史病例进行研究分析才能得到合适的用药决策或治疗方案，整个过程中需要耗费较长的时间，准确性不高且效率低下。近年来，为了解决上述技术问题，计算机辅助治疗方案生成方法逐渐在医疗领域得到快速推广。

现有技术中通过计算机进行相似症状的治疗方案辅助生成往往通过以下三种方式：

方式一：信息化系统表单查询的方式。通过用户给定的格式化信息，例如基本信息、症状、饮食、工作信息、过往病史等，直接通过信息化系统表单的方式查询数据库进行精准匹配，推荐匹配结果。例如CN115394393A。

方式二：关键词检索的方式。通过对用户输入的信息进行分词，根据不同分词的权重进行全文检索，例如常见的TF-IDF、BM25等。例如CN112116978A。

方式三：词槽+知识图谱方式。通过对用户输入的信息进行命名体识别词槽提取，根据提取结果进行实体关系映射，形成知识图谱，最后进行知识图谱查询。例如，CN116631643A、CN113450892A等。

然而，方式一操作过于繁琐，由于个人基本信息、饮食、工作环境、经历、过往病史都不一样，推荐倚重参数也不一样，不能充分利用所有因素，会出现匹配不到或匹配不准情况。方式二经常发生关键词提取不准确或关键词权重设置不合理，导致检索结果不理想，并且多通过文本相似度的方式进行推荐，没有考虑文本语义和整个上下文。方式三实现复杂度高，需要先设计顶层概念模型，再需要处理病例数据、个人信息、饮食、工作环境、经理、过往病史等数据，贯入到知识图谱中，才能进行图谱推荐，工作量大，特别是病例数据都是非结构化文字，需要人工整理、清洗成结构化数据，审核后才能入图谱，提取的信息比较零散，查询的结果比较片面。

因此，急需提供一种能够克服上述种种缺陷的计算机辅助治疗方案生成方法和装置。

发明内容

鉴于现有技术中的上述缺陷或不足，本发明提供了一种基于大模型的治疗方案生成方法及装置，以全部或部分的解决上述存在的技术问题。

本发明的一个方面，提供了一种基于大模型的治疗方案生成方法，包括：

对患者病症信息进行向量化处理；

将患者病症向量与病例查询向量库中的参考病例向量进行相似度匹配，从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量，并获取所述参考病例向量对应的参考病例文本信息，所述参考病例文本信息包括参考病症信息和参考治疗方案信息；

按照提示词模版将所述患者病症信息和所述参考病例文本信息组合为提示词；

将提示词输入至训练好的大模型中，得到患者病症对应的治疗方案。

进一步的，还包括病例查询向量库生成步骤：

将收集到的病例数据处理为文本信息，对所述文本信息进行分词处理，生成词汇表；

将单个病例按照词汇表中的分词获取对应的向量表示，计算全部分词对应的向量的平均值或加权平均值，得到单个病例文本的完整向量表示，将每个病例的完整向量表示存储至向量库，以构成病例查询向量库。

进一步的，还包括大模型微调步骤：

将收集到的病例数据中的病症数据作为训练样本中的提示词，

将收集到的病例数据中的治疗方案数据作为训练样本中的响应结果，

通过LoRA模式进行大模型的微调训练，得到训练好的大模型。

进一步的，对所述文本信息进行分词处理，生成词汇表的步骤还包括：过滤无效词并弃用停用词，按分词长度从小到大进行排序。

进一步的，所述将收集到的病例数据处理为文本信息的步骤，包括：对收集到的病例数据进行OCR处理和脚本处理，得到文本信息。

本发明的另一方面，还提供了一种基于大模型的治疗方案生成装置，包括：

向量化模块，被配置为对患者病症信息进行向量化处理；

相似度匹配模块，被配置为将患者病症向量与病例查询向量库中的参考病例向量进行相似度匹配，从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量，并获取所述参考病例向量对应的参考病例文本信息，所述参考病例文本信息包括参考病症信息和参考治疗方案信息；

提示词获取模块，被配置为按照提示词模版将所述患者病症信息和所述参考病例文本信息组合为提示词；

治疗方案生成模块，被配置为将提示词输入至训练好的大模型中，得到患者病症对应的治疗方案。

进一步的，还包括：

病例查询向量库生成模块，被配置为将收集到的病例数据处理为文本信息，对所述文本信息进行分词处理，生成词汇表；将单个病例按照词汇表中的分词获取对应的向量表示，计算全部分词对应的向量的平均值或加权平均值，得到单个病例文本的完整向量表示，将每个病例的完整向量表示存储至向量库，以构成病例查询向量库。

进一步的，还包括：

大模型微调模块，被配置为将收集到的病例数据中的病症数据作为训练样本中的提示词，将收集到的病例数据中的治疗方案数据作为训练样本中的响应结果，通过LoRA模式进行大模型的微调训练，得到训练好的大模型。

进一步的，所述病例查询向量库生成模块被进一步配置为：过滤无效词并弃用停用词，按分词长度从小到大进行排序。

进一步的，所述病例查询向量库生成模块被进一步配置为：对收集到的病例数据进行OCR处理和脚本处理，得到文本信息。

本发明提供的基于大模型的治疗方案生成方法及装置，将大模型与病例知识库结合，能够获得更加精准、有效、高质量的输入提示词，通过大量样本的微调训练，使大模型更加适用于输出治疗方案这一特定领域，同时保证了模型输出结果的准确性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请一个实施例提供的基于大模型的治疗方案生成系统的构建流程图；

图2是本申请一个实施例提供的基于大模型的治疗方案生成方法的基本流程图；

图3是本申请一个实施例提供的基于大模型的治疗方案生成装置的结构示意图；

图4是本申请一个实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，尽管在本发明实施例中可能采用术语第一、第二、第三等来描述获取模块，但这些获取模块不应限于这些术语。这些术语仅用来将获取模块彼此区分开。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

需要注意的是，本发明实施例所描述的“上”、“下”、“左”、“右”等方位词是以附图所示的角度来进行描述的，不应理解为对本发明实施例的限定。此外在上下文中，还需要理解的是，当提到一个元件被形成在另一个元件“上”或“下”时，其不仅能够直接形成在另一个元件“上”或者“下”，也可以通过中间元件间接形成在另一元件“上”或者“下”。

图1是基于大模型的治疗方案生成方案的构建流程图。从图1可以看出，本发明的技术方案包括大模型微调、病例查询向量库构建、提示词构建和大模型推荐相似病例的治疗方案等四个部分。

其中，大模型微调是指在已经预训练好的大型语言模型基础上，使用特定的数据集进一步的训练，以使大模型适应特定任务或领域。其根本原理在于机器学习模型只能够代表它所接收到的数据集的逻辑和理解，而对于其没有获得的数据样本，其并不能很好地识别/理解，且对于大模型而言，也无法很好地回答特定场景下的问题。例如，一个通用大模型涵盖了许多语言信息，并能够进行流畅的对话，但是如果需要医药方面能够很好地回答患者问题的应用，就需要为这个通用大模型提供很多新的数据以供学习和理解。例如：布洛芬到底能否和感冒药同时吃？为了确定模型可以回答正确，就需要对基础模型进行微调。本发明通过将病例数据加入至大模型进行训练，得到针对医疗领域病例问答的专业治疗LLM模型。

其中，病例查询向量库的建立是为了将知识文档放入至知识库中，从而为后续自动生成提示词提供参考基础。

其中，提示词构建是为了根据输入的用户病症和病例查询向量库自动构建提示词，微调完毕的LLM大模型会根据生成的提示词，自动输出响应结果。

上述四个部分在下面介绍图2所示的基于大模型的治疗方案生成方法时会进行详细的说明。

图2示出了一种基于大模型的治疗方案生成方法，包括如下步骤：

步骤S101，对患者病症信息进行向量化处理。

具体的，本实施例的大模型是根据输入的患者病症信息输出对应的治疗方案，例如用药方案。患者病症信息为文本信息，例如：“我以前有慢性咽炎，现在感觉经常咳嗦，咽部不适，有异物感，总感到咽部有咽不下又吐不出的东西，经常咳嗽和干呕”。首先，对患者病症信息进行分词、去停用词、过滤无效词等操作，得到关键词“慢性咽炎、咳嗦、咽部不适、异物感、咳嗦、干呕”。然后，进行embedding向量化，将中文汉字的逻辑问题，转换为数字、向量矩阵的数学问题。例如，将分词后得到的关键词“慢性、咽炎、咳嗦、咽部、不适、异物感、咳嗦、干呕”，通过词汇表找到，“咽炎”在第“300页，第3个词”，“异物感”在词汇表的第“234页，第6个词”，“咳嗦”在词汇表的第“233页，第2个词”，那么病症信息转成向量就是[300,3]，[234,6]，[233,2]，这样就将中文汉字问题，转换成为了数学统计问题。

步骤S102，将患者病症向量与病例查询向量库中的参考病例向量进行相似度匹配，从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量，并获取所述参考病例向量对应的参考病例文本信息，所述参考病例文本信息包括参考病症信息和参考治疗方案信息。

具体的，病例数据库通过如下步骤生成：

步骤S201，将收集到的病例数据处理为文本信息，对所述文本信息进行分词处理，生成词汇表。例如，收集到的病例数据包括但不限于PDF文件、EXCEL、网页、数据库等，对这些病例数据进行OCR识别、脚本处理生成纯文本文件。对纯文本文件进行分词、过滤无效词、停用词等处理，按分词后得到的单词或短语长度从小到大进行排序，生成最终词汇表。

步骤S202将单个病例按照词汇表中的分词获取对应的向量表示，计算全部分词对应的向量的平均值或加权平均值，得到单个病例文本的完整向量表示，将每个病例的完整向量表示存储至向量库，以构成病例查询向量库。

构建病例查询向量库后，将患者病症向量与知识库病例向量进行相似度匹配，例如：进行余弦相似度匹配，找到相似度最好的参考病例向量，并返回该参考病例向量对应的参考病例文本信息，参考病例文本信息包括参考病症信息和参考治疗方案信息。这相当于从病例查询向量库中找一个与患者病症最为相似的参考病例，这个参考病例包括病症信息和治疗方案信息，因此这个与患者病症最为相似的参考病例可以作为提示词的一部分，以供大模型按照该参考病例的样子对患者病例输出治疗方案。

可替代的，病例查询向量库中的病例向量包括病症向量和治疗方案向量，用患者病症向量与病例查询向量库中的病症向量进行相似度匹配，得到匹配的病症向量，再找到病症向量对应的治疗方案向量，所述病症向量和治疗方案向量构成了参考病例向量，最后获取该参考病例向量对应的原始文本信息。

步骤S103，按照提示词模版将所述患者病症信息和所述参考病例文本信息组合为提示词。

示例一，提示词模版可以是如下形式：

“请参考以下病例回答：......患者病症信息；

参考病例：

病症：......病症信息；

治疗方案：......治疗方案信息。”

示例二，组合的提示词为如下形式：

“请参考以下病例回答：早上起来头晕、头疼的症状一般怎么治疗啊？

参考病例：

病症：张三，男，52岁，清晨间歇性头晕，头疼。

治疗方案：监控血压，不要熬夜，改善生活方式，稳定情绪。”

步骤S104，将提示词输入至训练好的大模型中，得到患者的治疗方案。

将步骤S103中构造的上述提示词输入至微调训练好的大模型中，该大模型可以采用微调后的GLM语言模型。GLM语言模型按照参考病例的形式，输出患者病症对应的治疗方案。

其中，GLM大模型的微调步骤通过如下方式实现：

步骤S301，将收集到的病例数据中的病症数据作为训练样本中的提示词；

步骤S302，将收集到的病例数据中的治疗方案数据作为训练样本中的响应结果；

步骤S303，通过LoRA模式进行GLM大模型的微调训练，得到训练好的GLM大模型。

本实施例提供的基于大模型的治疗方案生成方法，将大模型与病例知识库结合，能够获得更加精准、有效、高质量的输入提示词，通过大量样本的微调训练，使大模型更加适用于输出治疗方案这一特定领域，也保证了模型输出结果的准确性。

参见图3，本发明的另一实施例还提供了一种基于大模型的治疗方案生成装置200，包括，向量化模块201、相似度匹配模块202、提示词获取模块203和治疗方案生成模块204。该治疗方案生成装置200能够执行方法实施例中的治疗方案生成方法。

具体的，治疗方案生成装置200包括：

向量化模块201，被配置为对患者病症信息进行向量化处理；

相似度匹配模块202，被配置为将患者病症向量与病例查询向量库中的参考病例向量进行相似度匹配，从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量，并获取所述参考病例向量对应的参考病例文本信息，所述参考病例文本信息包括参考病症信息和参考治疗方案信息；

提示词获取模块203，被配置为按照提示词模版将所述患者病症信息和所述参考病例文本信息组合为提示词；

治疗方案生成模块204，被配置为将提示词输入至训练好的大模型中，得到患者病症对应的治疗方案。

进一步的，还包括病例查询向量库生成模块，被配置为将收集到的病例数据处理为文本信息，对所述文本信息进行分词处理，生成词汇表；将单个病例按照词汇表中的分词获取对应的向量表示，计算全部分词对应的向量的平均值或加权平均值，得到单个病例文本的完整向量表示，将每个病例的完整向量表示存储至向量库，以构成病例查询向量库。

进一步的，还包括大模型微调模块，被配置为将收集到的病例数据中的病症数据作为训练样本中的提示词，将收集到的病例数据中的治疗方案数据作为训练样本中的响应结果，通过LoRA模式进行大模型的微调训练，得到训练好的大模型。

进一步的，所述病例查询向量库生成模块被进一步配置为过滤无效词并弃用停用词，按分词长度从小到大进行排序。

进一步的，所述病例查询向量库生成模块被进一步配置为对收集到的病例数据进行OCR处理和脚本处理，得到文本信息。

需要说明的是，本实施例提供的治疗方案生成装置200对应的可用于执行各方法实施例的技术方案，其实现原理和技术效果与方法类似，此处不再赘述。

参见图4，本发明的另一实施例还提供了一种用于实现上述治疗方案生成方法的电子设备300。本实施例中的电子设备300可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)以及诸如台式计算机等固定终端。图4示出的电子设备300仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301，其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理以实现如本发明描述的各实施例的方法。在RAM 303中，还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。

通常，以下装置可以连接至I/O接口305：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307；包括例如磁带、硬盘等的存储装置308；以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备300，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代的实施或具备更多或更少的装置。

特别的，根据本发明的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码，从而实现如上描述的方法。在这样的实施例中，该计算机程序可以通过通信装置309从网络上被下载和安装，或者从存储装置308被安装，或者从ROM302被安装。在该计算机程序被处理装置301执行时，执行本发明实施例的方法中限定的上述功能。

以上描述仅为本发明的较佳实施例。本领域技术人员应当理解，本发明中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种基于大模型的治疗方案生成方法，其特征在于，包括：

对患者病症信息进行向量化处理；

2.根据权利要求1所述的一种基于大模型的治疗方案生成方法，其特征在于，还包括病例查询向量库生成步骤：

3.根据权利要求1所述的一种基于大模型的治疗方案生成方法，其特征在于，还包括大模型微调步骤：

通过LoRA模式进行大模型的微调训练，得到训练好的大模型。

4.根据权利要求2所述的一种基于大模型的治疗方案生成方法，其特征在于，对所述文本信息进行分词处理，生成词汇表的步骤还包括：过滤无效词并弃用停用词，按分词长度从小到大进行排序。

5.根据权利要求2所述的一种基于大模型的治疗方案生成方法，其特征在于，所述将收集到的病例数据处理为文本信息的步骤，包括：对收集到的病例数据进行OCR处理和脚本处理，得到文本信息。

6.一种基于大模型的治疗方案生成装置，其特征在于，包括：

向量化模块，被配置为对患者病症信息进行向量化处理；

7.根据权利要求6所述的一种基于大模型的治疗方案生成装置，其特征在于，还包括：

8.根据权利要求6所述的一种基于大模型的治疗方案生成装置，其特征在于，还包括：

9.根据权利要求7所述的一种基于大模型的治疗方案生成装置，其特征在于，所述病例查询向量库生成模块被进一步配置为：过滤无效词并弃用停用词，按分词长度从小到大进行排序。

10.根据权利要求7所述的一种基于大模型的治疗方案生成装置，其特征在于，所述病例查询向量库生成模块被进一步配置为：对收集到的病例数据进行OCR处理和脚本处理，得到文本信息。