CN117954134B - 一种基于大语言模型的患者健康监测和干预系统 - Google Patents
一种基于大语言模型的患者健康监测和干预系统 Download PDFInfo
- Publication number
- CN117954134B CN117954134B CN202410348447.1A CN202410348447A CN117954134B CN 117954134 B CN117954134 B CN 117954134B CN 202410348447 A CN202410348447 A CN 202410348447A CN 117954134 B CN117954134 B CN 117954134B
- Authority
- CN
- China
- Prior art keywords
- module
- language model
- patient
- user
- large language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000036541 health Effects 0.000 title claims abstract description 38
- 238000012544 monitoring process Methods 0.000 title claims abstract description 24
- 230000003993 interaction Effects 0.000 claims abstract description 34
- 238000011156 evaluation Methods 0.000 claims abstract description 25
- 230000006399 behavior Effects 0.000 claims abstract description 22
- 230000004044 response Effects 0.000 claims abstract description 16
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 230000010485 coping Effects 0.000 claims abstract description 11
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 20
- 230000007246 mechanism Effects 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 4
- 208000020401 Depressive disease Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 208000029078 coronary artery disease Diseases 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种基于大语言模型的患者健康监测和干预系统,该系统包括用户交互模块、数据库模块、用户行为识别模块、应对策略选择模块和优化模块,用户交互模块用于收集患者描述,并调用和匹配存储在所述的数据库模块中的电子病历系统中的患者信息;用户行为识别模块用于对收集的数据进行清洗和归一化处理;应对策略选择模块用于将得到的数据与知识库进行匹配,综合评估患者的健康状态,将匹配后的结果应用大语言模型的解码器转换为自然语言,并将评估结果及应答发送到用户交互模块,由用户交互模块给予用户反馈,辅助主治医师评价患者情况;主治医师就评估结果及应答进行评价,评价结果将输入优化模块,帮助大语言模型进一步提高性能。
Description
技术领域
本发明涉及智能医疗技术领域,具体涉及一种基于大语言模型的患者健康监测和干预系统。
背景技术
抑郁障碍在躯体疾病患者中很常见,大约22%至33%的躯体疾病住院患者、15%至30%的急性冠心病患者、20%的冠心病和充血性心力衰竭患者以及9%至27%的糖尿病患者患有抑郁障碍。而积极治疗抑郁症状对改善躯体疾病有效。从临床角度出发,抑郁障碍危险因素的早期识别及尽早施加干预措施对于改善患者预后有非常重要的意义。当下,临床对于患者的精神障碍早期识别依旧主要依赖人工评估及评分系统。目前临床常用的评分手段包括一般健康问卷及贝克抑郁量表等,虽然在临床上的应用已经很成熟,但是依旧不能消除报告偏移,受访者会有意无意地低估或高估部分信息。而临床干预方面,需要有专业的心理学从业人员对患者进行咨询以及疏导,并依据指南进行药物应用的指导。这一套评估及干预系统对于人力的需求都很大,而目前专业人员依旧短缺,很难填补其间的需求空白。研究表明,目前,急救医疗服务体系中医护人员对于健康相关知识及评分工具的掌握仍有不少提升空间,非心理学专业的医护人员仍不具备提供高质量健康评估及咨询服务的能力。
现有技术中评分系统的设计基本基于相对静态的规则和算法,这限制了其处理复杂和非典型病例的能力。这些系统通常无法适应快速变化的医疗环境,或是识别和处理那些不符合常规模式的病例。当下临床常用的评分手段及健康咨询服务对于人力的需求都很大,而目前专业人员依旧短缺。在机器学习方面,已经出现了可以评估患者健康状态的算法,但对于患者的个性化优化、多维度综合评估患者健康状态、大量数据的本地运算优化等问题仍未得到较好的解决。
存在以上问题或缺陷的原因主要包括:一方面缺乏能够有效学习、处理自然语言模型的工具,另一方面也没有可以同患者进行专业水平交互的工具。
发明内容
本发明旨在提供一种基于大语言模型的患者健康监测和干预系统,所要解决的技术问题至少包括如何处理更大量、更复杂的患者情况,降低对专科专业人员的依赖,降低选择偏移,提供更客观、全面的评价体系。
为了实现上述目的,本发明提供一种基于大语言模型的患者健康监测和干预系统,包括用户交互模块、数据库模块、用户行为识别模块、应对策略选择模块和优化模块,
所述的用户交互模块用于收集患者描述,并调用和匹配存储在所述的数据库模块中的电子病历系统中的患者信息;
所述的用户行为识别模块用于对用户交互模块收集的数据进行清洗和归一化处理;
所述的应对策略选择模块用于将所述的用户行为识别模块处理得到的数据与知识库进行匹配,综合评估患者的健康状态,将匹配后的结果应用大语言模型的解码器转换为自然语言,并将评估结果及应答发送到所述的用户交互模块,由所述的用户交互模块给予用户反馈,辅助主治医师评价患者情况;主治医师就评估结果及应答进行评价,评价结果将输入所述的优化模块,由所述的优化模块帮助大语言模型进一步提高性能。
优选地,所述的清洗和归一化处理具体包括:
首先将用户同系统的对话按照以下形式存储:
;
对话内容以以下形式模拟:
;
为了构建训练、验证及测试集,每个样本表示为,其中是表征用户行为特征的标签;当用户的话语中有多个句子时,每个句子都相应地映射到一个标签;为了简化分类任务,将长句子重组及标签化,构成短句及对应标签的配对形式;给用户的表述按序标号,将患者的输入按以下形式表示:
x i =[Dc;[SEP];si] (3)
x i 表示的是输入到大语言模型的数据,这个数据经过了某种特定的编码或处理,具体来说,x i 是由 D c 、一个特殊的分隔符“[SEP]”和 s i 组合而成的向量。这里的 D c 表示的是上下文数据,比如对话历史或者相关的信息序列,而 s i 表示的是当前的输入句子或者用户的表达。
D client 则是数据集的名称,在这个上下文中,它包含了成对的数据点 (x i ,Y i ),其中x i 是上文提到的输入到大语言模型的数据,而 Y i 是与 x i 相对应的标签或输出。这个数据集是用于训练或评估健康诊断系统的;
应用大语言模型的编码器,将预处理后的数据转为高维向量,编码器由多个变压器层(Transformer层)组成,每个变压器层包括多头自注意力机制和前馈神经网络,以便捕捉输入数据中的复杂模式和依赖关系。
优选地,所述的大语言模型的解码器由多个Transformer层组成,每个Transformer层包括多头自注意力机制和前馈神经网络,Transformer层后包含了一个线性层和一个激活函数层;
受咨询者的回复通过以下形式进行模拟:
其中代表最优回答;应答策略的选择需要考虑匹配的特定标签及语言及文本中隐含的信息,因此应用密集检索的策略从而最大限度利用文本信息;建立对话检索库,,将对话检索库分为两部分,即对话历史及最优回答,配对组成,对话历史字符串表示为;当要新的对话历史时,利用嵌入模型并应用密集检索来查找具有最小距离的样本;样本之间的距离通过如下形式表示:
。
优选地,所述的基于大语言模型的患者健康监测和干预系统利用自然语言处理技术来自动解读和整理病历记录和患者描述,减少对医护人员手动输入数据的依赖,自动化的数据处理也减少了人为错误的可能性。
优选地,所述的基于大语言模型的患者健康监测和干预系统还具有自学能力,能够持续学习和适应新的医疗情况和数据,优化自身算法,提高准确性和适应新挑战的能力。
优选地,所述的用户交互模块还用于将输入的信息以位置编码的形式转为高维向量。
优选地,所述的数据库模块还用于将患者的病历记录和检查结果信息以数据库编码成高维向量存储。
优选地,所述的用户行为识别模块还用于使用大语言模型多头注意力机制整合上下文语义,匹配相关特征标签。
优选地,所述的应对策略选择模块还用于使用密集检索的策略,查找具有最小距离的样本,生成最优反馈,将反馈结果提供给用户交互模块。
优选地,基于大语言模型的编码器对原始数据进行清洗及归一化,将预处理后的数据转换为高维向量;编码器由多层Transformer堆叠而成,每层包含多头自注意力机制和前馈神经网络,能够整合上下文语义;解码器生成的结果经过主治医生的评估后,反馈至优化模块进一步优化大语言模型的算法。
优选地,所述的大语言模型具有泛用性,通过改变预训练的数据及更换数据库完成转换;应用在分诊的应用场景时,采用开源医学知识库及门诊病历进行预训练,数据库对接开源医学知识库,调整提示词即可;应用在法律领域时,将数据库对接开源的法典信息及法案。
优选地,当使用者实时输入当下心理状态时,所述的基于大语言模型的患者健康监测和干预系统根据患者姓名和病人ID匹配病历信息,将病历信息转化为高维向量进行进一步处理;通过多头自注意力机制和前馈神经网络算法,匹配最优输出,实时输出反馈完成交互。
优选地,所述的基于大语言模型的患者健康监测和干预系统能够将多个数据源的数据统一集中到一个中央数据库中,通过院内局域网提供服务。
与现有技术相比,本发明的有益效果是:
本发明所述的基于大语言模型的患者健康监测和干预系统通过用户交互模块收集患者描述,同时调用电子病历系统中的患者信息,用户行为识别模块将获得的信息自动处理为大语言模型可以识别的数据,并综合分析用户心理特征及意图,获得的数据由应对策略选择模块进行分析,利用大语言模型强大的理解及数据处理能力,生成针对患者当下情况的个性化应对策略,向用户进行反馈,同时将分析结果呈递给主治医师,而利用数据优化模块,系统可以自学,提高大语言模型的性能,辅助医生进行干预及相关治疗。
本发明所述的基于大语言模型的患者健康监测和干预系统的核心是一个先进的大语言模型,大语言模型基于transformer架构,它是一种神经网络架构,能够通过自然语言交互完成多种任务,具备了多场景、多用途、跨学科的任务处理能力,可以通过一些列算法和深度学习技术处理多维数据、对患者进行多模态的评估。与传统评分方式相比,这种方法的显著优势在于其能够处理更大量、更复杂的患者情况,降低了对专科专业人员的依赖,还可以降低选择偏移,是更客观、全面的评价体系。
此外,该系统利用自然语言处理(NLP)技术来自动解读和整理病历记录和患者描述,减少了对医护人员手动输入数据的依赖,自动化的数据处理也意味着减少了人为错误的可能性。
系统还具有自学能力,可以持续学习和适应新的医疗情况和数据,优化自身算法,提高了准确性和适应新挑战的能力。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的具体实施方式一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明所述的基于大语言模型的患者健康监测和干预系统的结构示意图。
图2是基于Transformer 结构的编码器和解码器的结构示意图。
具体实施方式
在下文中更详细地描述了本发明以有助于对本发明的理解。
如图1所示,本发明所述的基于大语言模型的患者健康监测和干预系统包括用户交互模块、数据库模块、用户行为识别模块、应对策略选择模块和优化模块,
所述的用户交互模块用于收集患者描述,并调用和匹配存储在所述的数据库模块中的电子病历系统中的患者信息;
所述的用户行为识别模块用于对用户交互模块收集的数据进行清洗和归一化处理;
所述的应对策略选择模块用于将所述的用户行为识别模块处理得到的数据与知识库进行匹配,综合评估患者的健康状态,将匹配后的结果应用大语言模型的解码器转换为自然语言,并将评估结果及应答发送到所述的用户交互模块,由所述的用户交互模块给予用户反馈,辅助主治医师评价患者情况;主治医师就评估结果及应答进行评价,评价结果将输入所述的优化模块,由所述的优化模块帮助大语言模型进一步提高性能。
优选地,所述的清洗和归一化处理具体包括:
首先将用户同系统的对话按照以下形式存储:
;
对话内容可以以以下形式模拟:
;
为了构建训练、验证及测试集,每个样本表示为,其中是表征用户行为特征的标签。在现实中,用户的话语中可能有多个句子,每个句子都相应地映射到一个标签。为了简化分类任务,我们将长句子重组及标签化,构成短句及对应标签的配对形式。特别地,给用户的表述按序标号,可以将患者的输入按以下形式表示:
xi=[Dc;[SEP];si] (3)
x i 表示的是输入到大语言模型的数据,这个数据经过了某种特定的编码或处理。具体来说,x i 是由 D c 、一个特殊的分隔符“[SEP]”和 s i 组合而成的向量。这里的 D c 表示的是上下文数据,比如对话历史或者相关的信息序列,而 s i 表示的是当前的输入句子或者用户的表达。
D client 则是提到的数据集的名称,在这个上下文中,它包含了成对的数据点 (x i ,Y i ),其中 x i 是上文提到的输入数据,而 Y i 是与 x i 相对应的标签或输出。这个数据集是用于训练或评估健康诊断系统的。
应用大语言模型的编码器,将预处理后的数据转为高维向量,编码器由多个变压器层(Transformer层)组成,每个变压器层(Transformer层)包括多头自注意力机制和前馈神经网络,以便捕捉输入数据中的复杂模式和依赖关系。
优选地,所述的大语言模型的解码器由多个Transformer层组成,每个Transformer层包括多头自注意力机制和前馈神经网络,Transformer层后包含了一个线性层和一个激活函数层;
受咨询者的回复可以通过以下形式进行模拟:
其中代表最优回答。再次强调,应答策略的选择需要考虑匹配的特定标签及语言及文本中隐含的信息,因此应用密集检索的策略可以最大限度利用文本信息。建立对话检索库,,将对话检索库分为两部分,即对话历史及最优回答,配对组成,对话历史字符串可以表示为;当我们要新的对话历史时,可以利用嵌入模型并应用密集检索来查找具有最小距离的样本。样本之间的距离通过如下形式表示:
。
本发明所述的基于大语言模型的患者健康监测和干预系统的核心是一个先进的大语言模型,大语言模型基于transformer架构,它是一种神经网络架构,能够通过自然语言交互完成多种任务,具备了多场景、多用途、跨学科的任务处理能力,可以通过一些列算法和深度学习技术处理多维数据、对患者进行多模态的评估。与传统评分方式相比,这种方法的显著优势在于其能够处理更大量、更复杂的患者情况,降低对专科专业人员的依赖,还可以降低选择偏移,是更客观、全面的评价体系。
此外,该系统利用自然语言处理(NLP)技术来自动解读和整理病历记录和患者描述,减少了对医护人员手动输入数据的依赖,自动化的数据处理也意味着减少了人为错误的可能性。
系统还具有自学能力,可以持续学习和适应新的医疗情况和数据,优化自身算法,提高了准确性和适应新挑战的能力。
本发明的大语言模型基于Transformer架构,完全通过注意力机制完成对源语言序列和目标语言序列全局依赖的建模。基于 Transformer 结构的编码器和解码器结构如图2所示,它们均由若干个基本的 Transformer 块(Block)组成,N×表示进行了 N 次堆叠。每个 Transformer 块都接收一个向量序列,输出。
注意力层使用多头注意力(Multi-Head Attention)机制整合上下文语义,位置感知前馈层通过全连接层对输入文本序列中的每个单词表示进行更复杂的变换。
在一个优选实施例中,本发明所述的基于大语言模型的患者健康监测和干预系统的核心是基于Transformer架构的大语言模型,包括用户交互模块、数据库模块、用户行为识别模块、应对策略选择模块、优化模块。
用户交互模块:将输入的信息以位置编码的形式转为高维向量。
数据库模块:将患者的病历记录、检查结果等信息以数据库编码成高维向量存储。
用户行为识别模块:使用大语言模型多头注意力机制整合上下文语义,匹配相关特征标签。
应对策略选择模块:使用密集检索的策略,查找具有最小距离的样本,生成最优反馈,将反馈结果提供给用户交互模块。
优化模块:动态学习和适应机制,提升准确性和适应能力。
基于大语言模型的编码器对原始数据进行清洗及归一化,将预处理后的数据转换为高维向量。编码器由多层Transformer堆叠而成,每层包含多头自注意力机制和前馈神经网络,可以整合上下文语义。解码器生成的结果可以经过主治医生的评估,反馈至优化模块进一步优化模型的算法。
除应用于健康检测及干预外,大语言模型还具有一定的泛用性,可以通过改变预训练的数据及更换数据库完成转换。应用在分诊的应用场景,可以用开源医学知识库及门诊病历进行预训练,数据库对接开源医学知识库,调整提示词即可。应用在法律领域,可以将数据库对接开源的法典信息及法案。
使用者实时输入当下心理状态等,并根据患者姓名、病人ID等匹配病历信息,将信息转化为高维向量进行进一步处理。通过多头自注意力机制和前馈神经网络等算法,匹配最优输出,实时输出反馈完成交互。
因使用多头自注意力机制和前馈神经网络,大语言模型可以很好地理解上下文。密集检索策略的应用能够保证输出的最优选择。
本发明所述的基于大语言模型的患者健康监测和干预系统能够将多个数据源的数据统一集中到一个中央数据库中,通过院内局域网提供服务。
大语言模型更新数据库对接后,可针对新的应用场景选择合适的预训练数据进行训练,具备可扩展性和可维护性。
本发明还提供一种基于大语言模型的患者健康监测和干预系统的监测和干预方法,包括以下步骤:
101、收集患者描述,将输入的信息以位置编码的形式转为高维向量,并调用和匹配电子病历系统中的患者信息;
102、对收集的数据进行清洗和归一化处理:
首先将用户同系统的对话按照以下形式存储:
;
对话内容以以下形式模拟:
;
为了构建训练、验证及测试集,每个样本表示为,其中是表征用户行为特征的标签;当用户的话语中有多个句子时,每个句子都相应地映射到一个标签;为了简化分类任务,将长句子重组及标签化,构成短句及对应标签的配对形式;给用户的表述按序标号,将患者的输入按以下形式表示:
xi=[Dc;[SEP];si] (3)
x i 表示的是输入到大语言模型的数据,这个数据经过了某种特定的编码或处理。具体来说,x i 是由 D c 、一个特殊的分隔符“[SEP]”和 s i 组合而成的向量。这里的 D c 表示的是上下文数据,比如对话历史或者相关的信息序列,而 s i 表示的是当前的输入句子或者用户的表达。
D client 则是提到的数据集的名称,在这个上下文中,它包含了成对的数据点 (x i ,Y i ),其中 x i 是上文提到的输入数据,而 Y i 是与 x i 相对应的标签或输出。这个数据集是用于训练或评估健康诊断系统的。
应用大语言模型的编码器,将预处理后的数据转为高维向量,编码器由多个变压器层(Transformer层)组成,每个Transformer(变压器层)层包括多头自注意力机制和前馈神经网络,以便捕捉输入数据中的复杂模式和依赖关系。
103、将所述的用户行为识别模块处理得到的数据与知识库进行匹配,综合评估患者的健康状态,将匹配后的结果应用大语言模型的解码器转换为自然语言,并将评估结果及应答发送到所述的用户交互模块,由所述的用户交互模块给予用户反馈,辅助主治医师评价患者情况;主治医师就评估结果及应答进行评价,评价结果将输入所述的优化模块,由所述的优化模块帮助大语言模型进一步提高性能;
所述的大语言模型的解码器由多个Transformer层组成,每个Transformer层包括多头自注意力机制和前馈神经网络,Transformer层后包含了一个线性层和一个激活函数层;
受咨询者的回复通过以下形式进行模拟:
其中代表最优回答;应答策略的选择需要考虑匹配的特定标签及语言及文本中隐含的信息,因此应用密集检索的策略能够最大限度地利用文本信息;建立对话检索库,,将对话检索库分为两部分,即对话历史及最优回答,配对组成,对话历史字符串表示为;当要新的对话历史时,利用嵌入模型并应用密集检索来查找具有最小距离的样本;样本之间的距离通过如下形式表示:
。
以上描述了本发明优选实施方式,然其并非用以限定本发明。本领域技术人员对在此公开的实施方案可进行并不偏离本发明范畴和精神的改进和变化。
Claims (4)
1.一种基于大语言模型的患者健康监测和干预系统,其特征在于,所述的基于大语言模型的患者健康监测和干预系统包括用户交互模块、数据库模块、用户行为识别模块、应对策略选择模块和优化模块,
所述的用户交互模块用于收集患者描述,并调用和匹配存储在所述的数据库模块中的电子病历系统中的患者信息;
所述的用户行为识别模块用于对用户交互模块收集的数据进行清洗和归一化处理,具体包括:
所述的用户行为识别模块整合上下文语义,匹配相关特征标签;应用大语言模型的编码器,将清洗和归一化处理后的数据转为高维向量,编码器由多个变压器层层组成,每个变压器包括多头自注意力机制和前馈神经网络,以便捕捉输入数据中的复杂模式和依赖关系;
首先将用户同系统的对话按照以下形式存储:
;
对话内容以以下形式模拟:
;
为了构建训练、验证及测试集,每个样本表示为,其中是表征用户行为特征的标签;当用户的话语中有多个句子时,每个句子都相应地映射到一个标签;为了简化分类任务,将长句子重组及标签化,构成短句及对应标签的配对形式;给用户的表述按序标号,将患者的输入按以下形式表示:
x i =[D d ;[SEP];s i ] (3)
x i 表示的是输入到大语言模型的数据,这个数据经过了编码;具体来说,x i 是由D d 、一个分隔符“[SEP]”和s i 组合而成的向量;其中Dd表示的是上下文数据,而s i 表示的是当前的输入句子;
D client 表示数据集的名称,包含了成对的数据点 (x i ,Y i ),其中Y i 是与x i 相对应的表征用户行为的标签;
所述的应对策略选择模块用于将所述的用户行为识别模块处理得到的数据与知识库进行匹配,综合评估患者的健康状态,将匹配后的结果应用大语言模型的解码器转换为自然语言,并将评估结果及应答发送到所述的用户交互模块,由所述的用户交互模块给予用户反馈,辅助主治医师评价患者情况;主治医师就评估结果及应答进行评价,评价结果将输入所述的优化模块,所述的优化模块具备动态学习和适应机制,利用所述优化模块,系统可以自学,持续学习和适应新的医疗情况和数据;
所述的应对策略选择模块还用于使用密集检索的策略,查找具有最小距离的样本,生成最优反馈,将反馈结果提供给用户交互模块;
大语言模型的解码器生成的结果经过主治医生的评估后,反馈至优化模块进一步优化大语言模型的算法;
所述的大语言模型的解码器由多个变压器层组成,每个变压器层包括多头自注意力机制和前馈神经网络,变压器层后包含了一个线性层和一个激活函数层;
受咨询者的回复通过以下形式进行模拟:
;
其中代表最优回答;应答策略的选择需要考虑匹配的特定标签及语言及文本中隐含的信息,因此应用密集检索的策略从而最大限度利用文本信息;建立对话检索库,,将对话检索库分为两部分,即对话历史DLS及最优回答,配对组成{DLS,Rg};对话历史字符串表示为;当需要新的对话历史时,利用嵌入模型并应用密集检索来查找具有最小距离的样本;样本之间的距离通过如下形式表示:
。
2.根据权利要求1所述的基于大语言模型的患者健康监测和干预系统,其特征在于,所述的基于大语言模型的患者健康监测和干预系统利用自然语言处理技术来自动解读和整理病历记录和患者描述。
3.根据权利要求1所述的基于大语言模型的患者健康监测和干预系统,其特征在于,所述的用户交互模块还用于将输入的信息以位置编码的形式转为高维向量。
4.根据权利要求1所述的基于大语言模型的患者健康监测和干预系统,其特征在于,所述的数据库模块还用于将患者的病历记录和检查结果信息以数据库编码成高维向量存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410348447.1A CN117954134B (zh) | 2024-03-26 | 2024-03-26 | 一种基于大语言模型的患者健康监测和干预系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410348447.1A CN117954134B (zh) | 2024-03-26 | 2024-03-26 | 一种基于大语言模型的患者健康监测和干预系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117954134A CN117954134A (zh) | 2024-04-30 |
CN117954134B true CN117954134B (zh) | 2024-07-09 |
Family
ID=90803295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410348447.1A Active CN117954134B (zh) | 2024-03-26 | 2024-03-26 | 一种基于大语言模型的患者健康监测和干预系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117954134B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118553412A (zh) * | 2024-07-30 | 2024-08-27 | 北京大学 | 心理咨询对话生成方法、装置、设备及存储介质 |
CN118675677A (zh) * | 2024-08-20 | 2024-09-20 | 营动智能技术(山东)有限公司 | 一种基于ai的心脑血管疾病病人数据管理系统及方法 |
CN118690330A (zh) * | 2024-08-22 | 2024-09-24 | 小小神经元(杭州)医疗科技有限公司 | 基于大语言模型的神经发育障碍行为干预系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117033394A (zh) * | 2023-10-08 | 2023-11-10 | 卓世科技(海南)有限公司 | 一种大语言模型驱动的向量数据库构建方法及系统 |
CN117690581A (zh) * | 2023-12-13 | 2024-03-12 | 江苏济远医疗科技有限公司 | 一种基于大语言模型的疾病问诊过程辅助信息生成方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200043579A1 (en) * | 2018-08-06 | 2020-02-06 | David McEwing | Diagnositic and treatmetnt tool and method for electronic recording and indexing patient encounters for allowing instant search of patient history |
US11768831B2 (en) * | 2021-05-10 | 2023-09-26 | Servicenow, Inc. | Systems and methods for translating natural language queries into a constrained domain-specific language |
CN117577262A (zh) * | 2023-10-27 | 2024-02-20 | 中国人民解放军总医院第一医学中心 | 一种基于大语言模型技术的智能动态血压管理方法与系统 |
CN117476215A (zh) * | 2023-11-17 | 2024-01-30 | 上海触脉数字医疗科技有限公司 | 一种基于ai的医疗辅助判别方法及判别系统 |
-
2024
- 2024-03-26 CN CN202410348447.1A patent/CN117954134B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117033394A (zh) * | 2023-10-08 | 2023-11-10 | 卓世科技(海南)有限公司 | 一种大语言模型驱动的向量数据库构建方法及系统 |
CN117690581A (zh) * | 2023-12-13 | 2024-03-12 | 江苏济远医疗科技有限公司 | 一种基于大语言模型的疾病问诊过程辅助信息生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117954134A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117954134B (zh) | 一种基于大语言模型的患者健康监测和干预系统 | |
US11610678B2 (en) | Medical diagnostic aid and method | |
CN110838368B (zh) | 一种基于中医临床知识图谱的主动问诊机器人 | |
CN106326640A (zh) | 一种医疗语音控制系统及其控制方法 | |
US20200118683A1 (en) | Medical diagnostic aid and method | |
WO2021139231A1 (zh) | 基于神经网络模型的分诊方法、装置和计算机设备 | |
CN118098585A (zh) | 一种基于数据驱动与大模型的医学ai助理实现方法及系统 | |
CN113223735A (zh) | 基于对话表征的分诊方法、装置、设备及存储介质 | |
Biswas et al. | Enhancing Clinical Documentation with Synthetic Data: Leveraging Generative Models for Improved Accuracy | |
CN117033568A (zh) | 一种医学数据指标解读方法、装置、存储介质及设备 | |
CN117690581A (zh) | 一种基于大语言模型的疾病问诊过程辅助信息生成方法 | |
CN118296121A (zh) | 一种基于大语言模型的医学术语标准化辅助诊断方法 | |
CN117497141A (zh) | 一种针对患者的心理干预智能交互系统以及方法 | |
CN117194604B (zh) | 一种智慧医疗病患问诊语料库构建方法 | |
CN117877660A (zh) | 基于语音识别的医学报告获取方法及系统 | |
CN117457162A (zh) | 基于多编码器和多模态信息融合的急诊分诊方法及系统 | |
CN117497178A (zh) | 一种基于知识图谱的常见病辅助决策方法 | |
CN116959754A (zh) | 基于意图槽的结构化访谈录音转录文本的特征提取方法 | |
CN116759077A (zh) | 一种基于智能体的医疗对话意图识别方法 | |
CN116798655A (zh) | 基于选择性多特征融合的对话式问诊症状识别方法及装置 | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
CN116168828A (zh) | 基于知识图谱和深度学习的疾病预测方法、装置及计算机设备 | |
CN112669961A (zh) | 一种基于大数据推理的智能分诊方法 | |
Dao et al. | Patient Similarity using Electronic Health Records and Self-supervised Learning | |
CN116913527B (zh) | 一种基于多轮对话框架的高血压评测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |