CN117558460B - 基于小样本学习和大语言模型的慢性病管理方法及系统 - Google Patents
基于小样本学习和大语言模型的慢性病管理方法及系统 Download PDFInfo
- Publication number
- CN117558460B CN117558460B CN202410042372.4A CN202410042372A CN117558460B CN 117558460 B CN117558460 B CN 117558460B CN 202410042372 A CN202410042372 A CN 202410042372A CN 117558460 B CN117558460 B CN 117558460B
- Authority
- CN
- China
- Prior art keywords
- patient
- chronic disease
- function
- algorithm
- small sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000017667 Chronic Disease Diseases 0.000 title claims abstract description 98
- 238000007726 management method Methods 0.000 title claims abstract description 38
- 230000006870 function Effects 0.000 claims abstract description 92
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 91
- 238000011282 treatment Methods 0.000 claims abstract description 50
- 238000005457 optimization Methods 0.000 claims abstract description 49
- 238000012502 risk assessment Methods 0.000 claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 20
- 230000001684 chronic effect Effects 0.000 claims abstract description 7
- 230000001225 therapeutic effect Effects 0.000 claims description 29
- 238000011269 treatment regimen Methods 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 14
- 230000007246 mechanism Effects 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 9
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 claims description 4
- 229910052760 oxygen Inorganic materials 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 2
- 238000013139 quantization Methods 0.000 claims 1
- 230000001960 triggered effect Effects 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 17
- 206010020772 Hypertension Diseases 0.000 description 13
- 239000008280 blood Substances 0.000 description 10
- 210000004369 blood Anatomy 0.000 description 10
- 229940079593 drug Drugs 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 208000019622 heart disease Diseases 0.000 description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 230000036772 blood pressure Effects 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011369 optimal treatment Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 235000005911 diet Nutrition 0.000 description 3
- 230000037213 diet Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 108010074051 C-Reactive Protein Proteins 0.000 description 2
- 102100032752 C-reactive protein Human genes 0.000 description 2
- 102000015779 HDL Lipoproteins Human genes 0.000 description 2
- 108010010234 HDL Lipoproteins Proteins 0.000 description 2
- 102000007330 LDL Lipoproteins Human genes 0.000 description 2
- 108010007622 LDL Lipoproteins Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- DDRJAANPRJIHGJ-UHFFFAOYSA-N creatinine Chemical compound CN1CC(=O)NC1=N DDRJAANPRJIHGJ-UHFFFAOYSA-N 0.000 description 2
- 235000006694 eating habits Nutrition 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 229940127208 glucose-lowering drug Drugs 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 1
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 229920004934 Dacron® Polymers 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- PNNCWTXUWKENPE-UHFFFAOYSA-N [N].NC(N)=O Chemical compound [N].NC(N)=O PNNCWTXUWKENPE-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000011256 aggressive treatment Methods 0.000 description 1
- 239000003472 antidiabetic agent Substances 0.000 description 1
- 239000002220 antihypertensive agent Substances 0.000 description 1
- 229940127088 antihypertensive drug Drugs 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 230000005189 cardiac health Effects 0.000 description 1
- 238000007675 cardiac surgery Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 229940109239 creatinine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000035487 diastolic blood pressure Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005182 global health Effects 0.000 description 1
- 229940126904 hypoglycaemic agent Drugs 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000005020 polyethylene terephthalate Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000036387 respiratory rate Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000035488 systolic blood pressure Effects 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种基于小样本学习和大语言模型的慢性病管理方法及系统,属于医疗技术和人工智能技术领域。该方法首先使用小样本学习算法将具有多维生理指标的患者分为多个子群。然后,通过运用大语言模型,从包含医疗历史、病史和患者自述的文本信息中提取关键信息。这两种信息通过一个慢性病风险评估函数结合在一起,生成一个风险评估向量,该向量包含针对各种慢性病的风险评估。最后,基于这个风险评估向量和可用的治疗措施,一个多维优化算法被用于生成最优的个性化治疗方案向量。该方法综合利用多种数据源和先进算法,旨在提供更全面、准确和个性化的慢性病管理方案。
Description
技术领域
本发明涉及医疗技术和人工智能技术领域,特别涉及一种基于小样本学习和大语言模型的慢性病管理方法及系统。
背景技术
慢性病,如糖尿病、高血压、心血管疾病等,对全球健康造成严重威胁。传统的慢性病管理多依赖于医生的经验和患者的个案状况,而这种方法在数据量增大、疾病种类复杂化的背景下显得效率低下和准确度不高。近年来,人工智能和机器学习在医疗健康方面有广泛的应用,但大多数现有的模型需要大量的数据进行训练,而在现实世界中,对于多数慢性病,尤其是罕见病,往往难以获得充分的数据样本。
此外,传统的慢性病管理方法通常倾向于单一疾病的治疗和管理,忽略了患者可能患有多种慢性病的情况。这种情况下,单一疾病的治疗方案可能与其他疾病的治疗方案相冲突,从而降低治疗效果或增加副作用的风险。
同时,现有的慢性病管理方案通常没有有效地利用患者的历史医疗数据,如医疗历史、病史和患者自述等文本信息,这些信息对于患者个性化治疗方案的制定具有重要的参考价值。
因此,开发一种新的慢性病协同管理方法及系统成为医疗领域迫切的任务。
发明内容
本申请提供一种基于小样本学习和大语言模型的慢性病管理方法及系统,以提高慢性病管理的效率和准确性。
本申请提供一种基于小样本学习和大语言模型的慢性病管理方法,包括:
应用小样本学习算法,通过患者分群函数C(D) = S(D;θ1),将具有多维生理指标D的患者分为多个子群,其中,S表示小样本学习算法,θ1是所述小样本学习算法的参数;
利用大语言模型,通过文本信息抽取函数T (X) = L(X;θ2),从包括医疗历史、病史和患者自述的文本信息X中提取关键信息,其中,L是大语言模型,θ2是所述大语言模型的参数;
结合所述患者分群函数C(D)和文本信息抽取函数T(X),通过患者慢性病的风险评估向量,计算患者针对各种慢性病的风险,其中,是第i种慢性病的权重系数;和分别是针对第i种慢性病的分群信息和文本信息,n是患者慢性病的总数量;
将所述风险评估向量R以及可用治疗措施M1,M2,…,Mk作为多维优化算法O的输入,得到最优的个性化治疗方案向量,其中,是所述多维优化算法的参数,k是可用治疗措施的总数量。
可选地,所述分群信息Ci的量化通过计算患者的数据与第i种慢性病相关的原型之间的距离来完成,所述距离通过欧氏距离来计算。
可选地,所述文本信息Ti的量化通过对患者的文本信息进行主题分类、关键词提取或情感分析来完成,从而得到与第i 种慢性病相关的可量化参数,所述可量化参数包括关键词出现的频率和权重。
可选地,多维优化算法O的目标函数Q定义为:
其中,和是用于平衡风险和治疗成本的权重因子,是针对风险评估向量的Sigmoid激活函数,是一个介于0和1之间的数,用于调节成本函数的敏感度,其中,所述目标函数进一步受到如下约束:
其中,是第i种慢性病的治疗方案的疗效,是一个预设的疗效阈值,δ是一个正数,用于放大或缩小疗效的影响。
可选地,多维优化算法O的实现采用一种基于自适应梯度下降的优化框架,所述优化框架利用梯度信息来动态调整权重因子和,在所述优化框架中,权重因子的更新通过以下方程进行:
其中,是学习率,是目标函数Q相对于的偏导数,是目标函数Q相对于的偏导数;所述优化框架进一步包括一个动态学习率调整机制,所述动态学习率调整机制通过观察目标函数Q的变化率来自动调整学习率。
可选地,疗效阈值θ是根据历史治疗数据和/或专家评估来设定的。
可选地,疗效阈值θ根据患者个体差异进行动态调整,所述患者个体差异包括患者的年龄、性别、病史和生活习惯。
可选地,所述动态学习率调整机制进一步包括:在观察到目标函数Q的变化率小于预定阈值ε且连续s次迭代后,自动触发学习率的重新初始化。
可选地,所述小样本学习算法S是基于原型网络的算法,其中参数θ1包括原型生成规则、距离度量标准以及分类阈值;
所述原型生成规则用于从每个慢性病类别的样本中生成一个原型;
所述距离度量标准,用于度量一个样本与原型之间的距离;
所述分类阈值,用于决定样本归属于目标原型的阈值。
本申请提供一种基于小样本学习和大语言模型的慢性病管理系统,所述系统用于实现一种基于小样本学习和大语言模型的慢性病管理方法,所述系统包括:
分类单元,用于应用小样本学习算法,通过患者分群函数C(D) = S(D;θ1),将具有多维生理指标D的患者分为多个子群,其中,S表示小样本学习算法,θ1是所述小样本学习算法的参数;
抽取单元,用于利用大语言模型,通过文本信息抽取函数T (X) = L(X;θ2),从包括医疗历史、病史和患者自述的文本信息X中提取关键信息,其中,L是大语言模型,θ2是所述大语言模型的参数;
结合单元,用于结合所述患者分群函数C(D)和文本信息抽取函数T(X),通过患者慢性病的风险评估向量,计算患者针对各种慢性病的风险,其中,是第i种慢性病的权重系数;和分别是针对第i种慢性病的分群信息和文本信息;
输出单元,用于将所述风险评估向量R以及可用治疗措施M1,M2,…,Mk作为多维优化算法O的输入,得到最优的个性化治疗方案向量,其中,是所述多维优化算法的参数,k是可用治疗措施的总数量。
本申请提供的技术方案有如下有益的效果:
(1)通过应用小样本学习算法进行患者分群,能更精确地识别不同患者群体的需求和特征。这有助于医疗机构或专业人士根据患者的具体情况进行更加个性化的管理。
(2)本方法还引入了大语言模型,用于文本信息的抽取和解析,这包括但不限于医疗历史、病史和患者自述。这一点增强了数据整合能力,允许在一个统一的框架内同时考虑生理指标和文本信息。
(3)本申请中提出的多维优化算法可以基于患者的风险评估向量以及可用的治疗措施,输出最优的个性化治疗方案。这不仅提高了治疗的效果,还有助于有效分配医疗资源。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请第一实施例提供的一种基于小样本学习和大语言模型的慢性病管理方法的流程图。
图2是本申请第一实施例提供的一种通过患者分群函数和文本信息抽取函数获得治疗方案的流程框图。
图3是本申请第一实施例提供的一种获取最优的个性化治疗方案的实例流程图。
图4是本申请第二实施例提供的一种基于小样本学习和大语言模型的慢性病管理系统实施例的示意图。
图5是本申请第一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”、“一”或者“该”等类似词语也不表示数量限制,而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
需要说明的是,本发明中使用的“上”、“下”、“左”、“右”“前”“后”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本申请第一实施例提供一种基于小样本学习和大语言模型的慢性病管理方法。请参看图1,该图为本申请第一实施例的示意图。以下结合图1对本申请第一实施例提供一种基于小样本学习和大语言模型的慢性病管理方法进行详细说明。
步骤S101:应用小样本学习算法,通过患者分群函数C(D) = S(D;θ1),将具有多维生理指标D的患者分为多个子群,其中,S表示小样本学习算法,θ1是小样本学习算法的参数。
本步骤的主要任务是通过患者分群函数,将具有多维生理指标 D 的患者分为多个子群。
小样本学习算法S,是一种针对小样本数据进行有效学习的算法。在医疗场景中,由于病例通常是高度个性化和稀有的,传统的机器学习算法可能无法有效地从少量样本中进行学习。因此,使用小样本学习算法 S 在这里是至关重要的。
多维生理指标D,是从患者身上收集的生理数据。如图2所示,这些指标可以包括但不限于:
血糖水平:用于评估糖尿病或糖尿病风险。
血压:包括收缩压和舒张压,用于评估高血压风险。
胆固醇水平:包括总胆固醇、低密度脂蛋白(LDL)和高密度脂蛋白(HDL)。
体重和身体质量指数(BMI):用于评估肥胖或营养不良。
肝功能指标:例如谷丙转氨酶(ALT)和谷草转氨酶(AST)。
肾功能指标:例如血肌酐和尿素氮。
炎症指标:例如C反应蛋白(CRP)。
心电图或心率:用于评估心脏健康。
呼吸频率和血氧饱和度:用于评估呼吸系统状态。
这些多维数据作为小样本学习算法S 的输入。
分群函数C(D),该函数通过应用小样本学习算法 S 生成输出,即将具有类似生理指标D 的患者归为同一子群。这些子群可以用于进一步的风险评估或个性化治疗。
算法参数θ1,是小样本学习算法S 的调优参数。这些参数可能包括学习率、正则化项或其他针对具体算法优化的参数。θ1 的设定会影响分群函数 C(D) 的效果和准确性。
本实施例中,可以选择使用原型网络(Prototypical Networks)作为小样本学习算法S。原型网络是一种基于原型的分类算法,尤其适用于小样本学习场景。
此时,对于患者分群函数 C(D) = S(D;θ1),S(D;θ1) 代表原型网络算法,其中D是患者的多维生理指标(例如血压、血糖、心率等),θ1是该算法的参数。
θ1可以包括以下几个主要部分:
(1)原型生成规则:如何从每个类别的样本中生成一个原型。
(2)距离度量标准:如何度量一个样本与原型之间的距离,常用的有欧几里得距离或余弦相似度。
(3)分类阈值:决定样本归属于哪个原型(即哪个患者子群)的阈值。
具体使用步骤包括:
(1)使用小样本训练集来学习每一种慢性病的“原型”(Prototype),这个原型在多维生理指标空间中是一个点,可以视为该类慢性病患者在生理指标上的平均或中心。
(2)对于一个新的患者(具有一组生理指标 D),该算法会计算这个新患者与各个原型之间的距离,并根据距离进行分类,从而将该患者分到一个特定的子群。
通过上述方式,原型网络能够根据每个患者的多维生理指标 D,将其有效地分类到一个相应的慢性病患者子群中。这样不仅能进行更精细化的患者管理,还能作为后续风险评估和个性化治疗方案生成的基础。本领域技术人员可以依据上述说明,实现基于原型网络的小样本学习算法S。
步骤S101的输出是一个分群结果,即将新进来的患者根据其多维生理指标(例如血压、血糖等)分到一个已存在的慢性病子群中。这个子群代表了患者在生理指标上的相似性,并因此可能在病症或治疗反应上有相似的特点。
具体来说,如果考虑一个简单的例子,有两种慢性病:糖尿病和高血压。每种病都有一个原型,这个原型是在多维生理指标空间中的一个点。例如:
糖尿病原型:血糖 = 210,血压 = 85
高血压原型:血糖 = 150,血压 = 125
当一个新患者进来,假设其血糖是180,血压是100。算法会计算这个新患者与上述两个原型之间的距离(例如使用欧几里得距离)。假设计算结果显示该患者与糖尿病原型的距离较近,那么输出就是这个患者被分到糖尿病这个子群。
这样的输出有助于进一步的风险评估和个性化治疗方案的生成。
步骤S102:利用大语言模型,通过文本信息抽取函数T (X) = L(X;θ2),从包括医疗历史、病史和患者自述的文本信息X中提取关键信息,其中,L是大语言模型,θ2是该模型的参数。
步骤S102旨在使用大语言模型来从患者的文本信息中提取关键信息,以便进行后续的风险评估或治疗计划生成。在此步骤中,文本信息抽取函数 T (X) = L(X;θ2)作为核心算法进行操作。
首先,定义"L"为一个大语言模型,这种模型通常是预先训练好的,例如国内的华为盘古、阿里巴巴的通义千问、科大讯飞的星火、百度的文心一言以及国外的ChatGPT,Bard等等。这些模型在自然语言处理领域有广泛的应用,包括但不限于文本生成、文本分类和文本摘要等。
其次,关于参数θ2,这是大语言模型的一组超参数,包括模型结构、学习率、批量大小等。这些超参数通常在模型训练阶段进行优化。
文本信息X通常包括患者的医疗历史、病史和患者自述等。这些文本信息可以从电子病历、诊断报告或者患者的自述问卷中获得。
下面是一个实施步骤的详细说明:
(1)数据预处理:对输入的文本信息X进行标准化处理,例如去除多余的空格、标点符号以及进行词干提取等,以便模型能更准确地进行文本分析。
(2)模型输入:将预处理后的文本信息X输入到大语言模型L中。
(3)参数设置:根据预先设定或优化后的模型超参数θ2,配置大语言模型L。
(4)文本抽取:模型会对输入的文本进行解析,并根据模型的算法逻辑,从文本信息中提取关键信息。这些关键信息可能包括但不限于:病症名称、药物反应、既往治疗效果等。
(5)输出结果:将提取的关键信息作为输出,通常这些信息会用于后续的风险评估或者治疗计划生成。
本领域的技术人员可以根据这些步骤和详细描述,选择合适的大语言模型和相应的超参数,以实施这一步骤。
步骤S103:结合患者分群函数C(D)和文本信息抽取函数T(X),通过患者慢性病的风险评估向量,计算患者针对各种慢性病的风险,其中,是第i种慢性病的权重系数;和分别是针对第i种慢性病的分群信息和文本信息,n是患者慢性病的总数量。
在步骤S1033中,主要目标是通过结合前两步(即步骤S101和步骤S102)获得的信息来计算患者对各种慢性病的风险评估向量R。该向量表示为,其中每一项Ri由如下数学表达式给出:。
在实施步骤之初,需要先确定各种慢性病(如高血压、糖尿病等)和对应的权重系数。权重系数可由专家或通过数据分析确定。
步骤S103的输入是C(D)和T(X),其中C(D)由步骤S101生成,代表根据多维生理指标D分成的患者子群信息。T(X)由步骤S102生成,表示从医疗历史、病史和患者自述的文本信息X中抽取的关键信息。
从上述步骤中得到的C(D)和T(X)需要进一步针对第i种慢性病进行筛选或加权,生成针对该慢性病的分群信息和文本信息。
使用数学表达式来计算针对第i种慢性病的风险。在这一步中,和将被乘以相应的权重系数。
最终,将针对各种慢性病的风险评估整合成一个风险评估向量,n是慢性病的总数。
在计算完毕后,可能需要进行数据验证和校准。这可以通过比较与已知案例或医学研究进行。
这里需要指出,在实际操作中,分群信息 和文本信息 应该转换成可量化的形式以进行数学计算。通常,这样的转换会通过一定的映射函数或编码算法完成。以下为该过程的详细说明:
量化分群信息Ci:
分群信息通常由一系列生理或临床指标组成。这些指标在原型网络中通常被用来生成一个“原型”或者聚类的中心点。因此,每一个患者的数据可以通过与这个“原型”或中心点的距离来量化。比如说,如果使用欧氏距离,那么Ci 可以是一个代表患者与第i 种慢性病原型之间欧氏距离的数值。
量化文本信息Ti:
文本信息抽取通常涉及从非结构化数据中获取结构化或半结构化的信息。这些文本信息可能会通过大语言模型进行主题分类、关键词提取或者情感分析等,最终获得一个或多个可量化的参数。例如,如果关注慢性病的自我管理能力,可能会从患者自述中提取与药物依从性、饮食和运动等相关的关键词,并将这些关键词出现的频率、权重或相关性分数作为Ti。
下面深入分析量化文本信息这一步骤如何在一个患者慢性病管理系统中实施。特别地,这涉及到如何从患者的非结构化医疗文本中,例如医疗历史、病史和患者自述,提取出与慢性病相关的关键信息,并最终将这些信息转换为一个或多个可量化的参数(记为Ti)。
首先,一个大语言模型,比如GPT-3,可以被预训练或者定制训练以满足特定医疗场景的需要。在这个应用场景里,该模型可能已经被训练过,使其能够准确地理解和分类与慢性病相关的医疗术语和表达方式。
接下来,通过这个大语言模型,可以从患者的非结构化医疗文本中执行一系列信息抽取任务:
例如,文本中可能有多个与患者健康相关的主题,如“药物依从性”、“饮食习惯”或“运动频率”。模型可以为这些主题分配一个分类标签,并据此产生一个与每个主题相关的可量化指数,如主题出现的频率或重要性得分。
模型进一步能够识别出与这些主题相关的关键词或短语。例如,在“药物依从性”的文本段落中,可能会提取出“遗漏”、“按时”、“剂量”等关键词。
除了主题和关键词,模型还可以评估文本中表达的情感或观点。例如,与“运动频率”相关的文本可能包含“不愿意”、“乐意”等词,这些词语可以用于量化患者对运动的态度。
最后,这些提取出的信息可以被量化为一个或多个数值或得分。例如,关于“药物依从性”的关键词“遗漏”和“按时”出现的频率可以分别被量化为0.2和0.8,这两个数值最终可以用于计算Ti。
以下是一个实际应用的例子:
假设需要评估一个患者对于三种慢性病(糖尿病、高血压和心脏病)的风险。
假设通过小样本学习算法,已经根据患者的多维生理指标(如血糖水平、血压和胆固醇水平)将患者分为不同的子群。这里,Ci是患者针对每一种慢性病(糖尿病、高血压、心脏病)的分群信息,例如C1=0.7, C2=0.4, C3=0.9。
通过一个大语言模型从患者的医疗历史、病史和自述中提取了关键信息。例如,通过模型得知该患者有家族糖尿病史、高血压病史,但没有心脏病。这里的Ti是患者针对每一种慢性病(糖尿病、高血压、心脏病)的文本信息,例如T1=0.8, T2=0.6, T3=0.2。
接下来,需要确定每种慢性病的权重系数。假设根据一些外部数据或专家意见,确定ω1=0.5, ω2=0.3, ω3=0.2。
最后,使用给定的公式计算患者针对各种慢性病的风险评估向量R。例如,R1=ω1×(C1×T1) = 0.5×(0.7×0.8) = 0.28, R2=0.3×(0.4×0.6) = 0.072, R3=0.2×(0.9×0.2) = 0.036。
因此,该患者对于糖尿病、高血压和心脏病的风险评估向量R=[0.28, 0.072,0.036]。
总结起来,通过上述步骤,大语言模型能够从患者的非结构化医疗文本中提取出与慢性病管理相关的关键信息,并将这些信息量化为一组可用于进一步分析或决策的参数。
步骤S104:将风险评估函数R以及可用治疗措施M1,M2,…,Mk作为多维优化算法O的输入,得到最优的个性化治疗方案P,其中,,其中,是该多维优化算法的参数,k是可用治疗措施的总数量。
在本申请中,步骤S104具有重要的实用价值,因为它通过多维优化算法O来生成最优的个性化治疗方案P。该步骤具体可按以下流程实施:
(1)确定风险评估函数R
首先,按照先前的步骤计算出了风险评估函数R。这是一个多维向量,描述了患者针对各种慢性病的风险。
(2)确定可用的治疗措施M1,M2,...,Mk
接下来,建立一个包含可用治疗措施的列表,例如药物治疗、手术、生活方式改变等。每种治疗措施都应具体明确。
(3)选择多维优化算法O及其参数θ3
在这一步中,需要选择一个适用的多维优化算法O,并为其设定参数θ3。这可能包括学习率、收敛准则等。多维优化算法可以是梯度下降、遗传算法或者线性规划等。
(4)执行多维优化
输入风险评估函数R和可用治疗措施M1, M2,...,Mk到算法O中。算法将通过在多维空间中搜索来找到能最大化或最小化某个目标函数(如总治疗成本、预期生存期等)的治疗方案。
(5)输出最优个性化治疗方案P
算法的输出将是一个最优的个性化治疗方案P。这个方案是一个多维向量,其中每个分量Pi代表针对一种慢性病的最优治疗方法。
参数θ3在优化过程中可能起到关键作用。它可以控制算法的收敛速度、解的精度等。因此,在实施前,应仔细选择这些参数以确保算法的有效性和准确性。
更进一步地,多维优化算法O的目标函数Q定义为:
其中,和是用于平衡风险和治疗成本的权重因子,是针对风险评估向量的Sigmoid激活函数,是一个介于0和1之间的数,用于调节成本函数的敏感度,其中,该目标函数进一步受到如下约束:
其中,是第i种慢性病的治疗方案的疗效,是一个预设的疗效阈值,δ是一个正数,用于放大或缩小疗效的影响。
该函数Q用于找到最优的个性化治疗方案向量P。目标函数Q结合了两个主要因素:患者针对各种慢性病的风险(通过风险评估向量Ri表达)和治疗成本(通过可用治疗措施Mj表达)。
首先,权重因子和被引入目标函数,以平衡患者风险和治疗成本。这些权重因子可以由专业人员根据历史数据和临床经验进行初始设置。
接着,对每个风险评估向量Ri,使用Sigmoid激活函数σ进行转换,以将其限制在0到1之间,然后应用反正切函数tan-1以进一步将其标准化。
成本函数cost(Mj)可以是任何能够量化治疗措施成本的函数。特定数,一个在0和1之间的值,用于调节成本函数的敏感度。
另外,目标函数Q受到一组约束条件的影响,这些条件考虑了治疗方案Pi的疗效Efficacy(Pi),预设的疗效阈值θ和正数δ,后者用于放大或缩小疗效的影响。
疗效阈值θ不是一个固定不变的量,而是可以根据患者个体差异进行适当的调整。患者个体差异在这里特指患者的年龄、性别、病史和生活习惯等因素。
年龄因素:年龄会影响患者对特定治疗方案的反应和恢复能力。例如,年轻患者可能更容易适应强烈的治疗,而老年患者可能需要更温和的治疗方案。因此,年龄因素被考虑在疗效阈值θ的动态调整中。
性别因素:不同性别的患者可能对某些治疗方法有不同的反应。例如,一些药物可能对男性和女性有不同的效果和副作用。在这种情况下,性别因素将被纳入疗效阈值θ的调整计算。
病史:病史是评估患者疗效阈值θ的重要依据之一。具体地,如果患者有与特定慢性病有关的既往病史,那么疗效阈值θ可能会相应地进行调整。例如,如果患者有糖尿病家族史,他们可能对糖尿病的治疗有更高的疗效阈值要求。
生活习惯:患者的生活习惯,如饮食、运动、作息等,也可能影响治疗的有效性。例如,良好的作息和饮食习惯可能增加治疗方案的成功率,从而可能降低疗效阈值θ。
通过综合这些个体差异因素,允许系统更精细化地调整疗效阈值θ,使其更贴近患者个体的实际需求和情况,从而实现更个性化的治疗方案。这一特性不仅提高了治疗的有效性,也增加了患者对治疗方案的接受度。
疗效阈值θ的设定方式还可以借助于历史治疗数据和/或专家评估。
历史治疗数据:这一方面意味着疗效阈值θ不是任意设置的,而是基于以往同类型或类似慢性病患者的治疗效果来进行设定。历史治疗数据包括但不限于药物剂量、治疗时间、副作用频率以及治疗成功或失败的统计数据。通过分析这些数据,可以得出一个或多个模型或算法,用于预测患者可能对特定治疗方案的反应。因此,疗效阈值θ在这种情况下是一个经过深思熟虑和数据支持的量。
专家评估:除了历史治疗数据外,专家评估也作为设定疗效阈值θ的关键因素。这里的“专家”通常是具有多年经验和高度专业知识的医生或研究人员。他们根据自己的经验和对患者病情的深入了解,对疗效阈值θ进行定性或定量的评估。专家评估可能包括患者的症状严重程度、潜在并发症风险以及预期的治疗效果等多个方面。
设定疗效阈值θ的过程可能是迭代和动态的,即它可能会在治疗过程中多次进行调整。例如,在初始阶段,可能更多地依赖历史治疗数据来设定一个预设的疗效阈值。然后,在治疗过程中,根据专家的持续评估和患者的反应,进行必要的调整。
这种基于历史治疗数据和/或专家评估来设定疗效阈值θ的方法有几个显著优点。首先,它使得治疗方案更为科学和个性化,因为它考虑了患者历史和专家经验。其次,这种方法也增加了疗效阈值的准确性和可靠性,因为它是基于实际数据和专业知识,而非随意或一般化的标准。最后,这种方法也提供了一种动态调整机制,允许在治疗过程中根据新的数据和评估来优化疗效阈值θ。
这一特点不仅提高了慢性病管理方法的有效性和准确性,还为实现更为个性化和人性化的患者治疗提供了强有力的支持。
通过上述目标函数和约束条件,技术人员可以使用如梯度下降或模拟退火等优化算法来求解最优的个性化治疗方案。
更进一步地,多维优化算法O的实现采用一种基于自适应梯度下降的优化框架,该框架利用梯度信息来动态调整权重因子和,在该优化框架中,权重因子的更新通过以下方程进行:
其中,是学习率,是目标函数Q相对于的偏导数,是目标函数Q相对于的偏导数;该优化框架进一步包括一个动态学习率调整机制,该机制通过观察目标函数Q的变化率来自动调整学习率。
首先,该框架利用梯度信息来动态调整权重因子和。具体来说,权重因子的更新是通过目标函数Q相对于和的偏导数来实现的,以及一个预设或可调的学习率。
在每次迭代中,计算目标函数Q相对于和的偏导数和。然后,使用这些偏导数和学习率来更新权重因子。
更进一步,这个优化框架包括一个动态学习率调整机制。该机制观察目标函数Q的变化率,并据此自动调整学习率。这样,如果目标函数Q的下降速度减缓,学习率可能会相应地减小,以确保算法的稳定性和收敛性。
更进一步地,所述动态学习率调整机制进一步包括:在观察到目标函数Q的变化率小于预定阈值ε连续s次迭代后,自动触发学习率的重新初始化。
在多维优化算法O的实现框架内,动态学习率调整机制被进一步细化。具体来说,该细化部分提供了一个可以称作“停滞检测模块”的组件,该模块的主要功能是监视目标函数Q的变化率。
当目标函数Q的变化率小于预定阈值ε并持续这样的状态达到s次迭代时,停滞检测模块会自动触发学习率的重新初始化。这里的“变化率小于预定阈值ε”是一种数学判断条件,通常通过观察两个或更多连续迭代间目标函数Q的数值变化来评估。
阈值ε是一个正数,可由开发者或算法设计者设定,用于界定何时应视目标函数Q的变化为不明显或停滞。换言之,当目标函数Q的变化小于ε,算法可能会被认为处于一个低效的状态或陷入局部最优解。
参数s是另一个可配置的正整数,代表观察窗口的大小。当目标函数Q的变化率在s次连续迭代内都小于阈值ε时,停滞检测模块就会触发。
自动触发学习率的重新初始化是一个策略性的决策。这通常涉及将学习率设定回到一个预定的初始值或者通过某种预定算法来动态地重新计算。重新初始化的目的是摆脱可能的局部最优解,以便算法能够更好地探索解空间,从而可能找到一个更好的全局最优解。
通过引入停滞检测模块和动态学习率调整机制,该权利要求增加了算法对不同优化环境和挑战的适应性。
如图3所示,以下针对步骤S104提供一个具体的例子。
假设有三种慢性病需要关注:糖尿病、高血压和心脏病。风险评估函数R给出了一个三维向量,例如0.8,0.5,0.2,其中第一个分量表示糖尿病的风险,第二个分量表示高血压的风险,第三个分量表示心脏病的风险。
接着,列举出可用的治疗措施:M1是使用降糖药物,M2是使用降压药物,M3是进行心脏手术,M4是生活方式调整,如饮食和运动。
对于多维优化算法O,可以选择使用梯度下降算法,并设定学习率作为参数θ3,该参数值设为0.01。
现在,将风险评估函数R和治疗措施M1, M2, ..., Mk输入到多维优化算法O中。算法的目标可以是最小化总治疗成本,同时最大化患者的预期生存期。
通过算法运行,输出的最优个性化治疗方案P可能为:"M1+M4","M2","M4"。
这意味着针对糖尿病,最优的治疗方案是使用降糖药物并进行生活方式调整;针对高血压,最优的治疗方案是使用降压药物;针对心脏病,最优的治疗方案是生活方式调整。
在这个例子中,多维优化算法根据预设的目标函数和限制条件,为每一种慢性病推荐了一个最优的治疗方案。
通过以上说明,本领域的技术人员应该能够清晰地理解和实施步骤S104,以生成最优的个性化治疗方案。
在上述的实施例中,提供了一种基于小样本学习和大语言模型的慢性病管理方法,与之相对应的,本申请还提供一种基于小样本学习和大语言模型的慢性病管理系统。请参看图4,其为本申请的一种基于小样本学习和大语言模型的慢性病管理系统实施例的示意图。由于本实施例,即第二实施例,基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
本申请第二实施例提供一种基于小样本学习和大语言模型的慢性病管理系统,该系统用于实现上述一种基于小样本学习和大语言模型的慢性病管理方法,如图4所示,该装置包括:
分类单元201,用于应用小样本学习算法,通过患者分群函数C(D) = S(D;θ1),将具有多维生理指标D的患者分为多个子群,其中,S表示小样本学习算法,θ1是该算法的参数;
抽取单元202,用于利用大语言模型,通过文本信息抽取函数T (X) = L(X;θ2),从包括医疗历史、病史和患者自述的文本信息X中提取关键信息,其中,L是大语言模型,θ2是该模型的参数;
结合单元203,用于结合所述函数C(D)和T(X),通过患者慢性病风险评估向量,其中,计算患者针对各种慢性病的风险,是第i种慢性病的权重系数;和分别是针对第i种慢性病的分群信息和文本信息;
输出单元204,用于基于所述风险评估向量R,使用一个多维优化算法O,该算法接受患者的风险评估向量R,以及可用治疗措施M1,M2,…,Mk作为输入,输出最优的个性化治疗方案向量,其中,是该多维优化算法的参数。
图5是本发明实施例提供的一种电子设备500的结构示意图,该电子设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)501和一个或一个以上的存储器502,其中,所述存储器502中存储有至少一条指令,所述至少一条指令由所述处理器501加载并执行以实现上述中文文本拼写检查方法的步骤。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述中文文本拼写检查方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
Claims (8)
1.一种基于小样本学习和大语言模型的慢性病管理方法,其特征在于,所述方法包括:
应用小样本学习算法,通过患者分群函数C(D) = S(D;θ 1),将具有多维生理指标D的患者分为多个子群,其中,S表示小样本学习算法,θ 1是所述小样本学习算法的参数;
利用大语言模型,通过文本信息抽取函数T (X) = L(X;θ 2),从包括医疗历史、病史和患者自述的文本信息X中提取关键信息,其中,L是大语言模型,θ 2是所述大语言模型的参数;
结合所述患者分群函数C(D)和文本信息抽取函数T(X),通过患者慢性病的风险评估向量,计算患者针对各种慢性病的风险,其中,是第i种慢性病的权重系数;和分别是针对第i种慢性病的分群信息和文本信息,n是患者慢性病的总数量;
将所述风险评估向量R以及可用治疗措施M1,M2,…,Mk作为多维优化算法O的输入,得到最优的个性化治疗方案向量,其中,是所述多维优化算法O的参数,k是可用治疗措施的总数量;
其中,多维优化算法O的目标函数Q定义为:
;
其中,和是用于平衡风险和治疗成本的权重因子,是针对风险评估向量的Sigmoid激活函数,是一个介于0和1之间的数,用于调节成本函数的敏感度,cost(Mj)为成本函数,其中,所述目标函数进一步受到如下约束:
;
其中,是第i种慢性病的治疗方案的疗效,是一个预设的疗效阈值,δ是一个正数,用于放大或缩小疗效的影响;
其中,多维优化算法O的实现采用一种基于自适应梯度下降的优化框架,所述优化框架利用梯度信息来动态调整权重因子γ和τ,在所述优化框架中,权重因子的更新通过以下方程进行:
;
;
其中,是学习率,是目标函数Q相对于的偏导数,是目标函数Q相对于的偏导数;所述优化框架进一步包括一个动态学习率调整机制,所述动态学习率调整机制通过观察目标函数Q的变化率来自动调整学习率α。
2.根据权利要求1所述的慢性病管理方法,其特征在于,所述分群信息Ci的量化通过计算患者的数据与第i种慢性病相关的原型之间的距离来完成,所述距离通过欧氏距离来计算,所述小样本学习算法使用原型网络,其中,每种慢性病都有一个原型,所述原型是在多维生理指标空间中的一个点。
3.根据权利要求1所述的慢性病管理方法,其特征在于,所述文本信息T i 的量化通过对患者的文本信息进行主题分类、关键词提取或情感分析来完成,从而得到与第i种慢性病相关的可量化参数,所述可量化参数包括关键词出现的频率和权重。
4.根据权利要求1所述的慢性病管理方法,其特征在于,疗效阈值θ是根据历史治疗数据和/或专家评估来设定的。
5.根据权利要求1所述的慢性病管理方法,其特征在于,疗效阈值θ根据患者个体差异进行动态调整,所述患者个体差异包括患者的年龄、性别、病史和生活习惯。
6.根据权利要求1所述的慢性病管理方法,其特征在于,所述动态学习率调整机制进一步包括:在观察到目标函数Q的变化率小于预定阈值ε且连续s次迭代后,自动触发学习率α的重新初始化。
7.根据权利要求1所述的慢性病管理方法,其特征在于,所述小样本学习算法S是基于原型网络的算法,其中参数θ1包括原型生成规则、距离度量标准以及分类阈值;
所述原型生成规则用于从每个慢性病类别的样本中生成一个原型;
所述距离度量标准,用于度量一个样本与原型之间的距离;
所述分类阈值,用于决定样本归属于目标原型的阈值。
8.一种基于小样本学习和大语言模型的慢性病管理系统,所述系统用于实现一种基于小样本学习和大语言模型的慢性病管理方法,其特征在于,所述系统包括:
分类单元,用于应用小样本学习算法,通过患者分群函数C(D) = S(D;θ 1),将具有多维生理指标D的患者分为多个子群,其中,S表示小样本学习算法,θ 1是所述小样本学习算法的参数;
抽取单元,用于利用大语言模型,通过文本信息抽取函数T (X) = L(X;θ 2),从包括医疗历史、病史和患者自述的文本信息X中提取关键信息,其中,L是大语言模型,θ 2是所述大语言模型的参数;
结合单元,用于结合所述患者分群函数C(D)和文本信息抽取函数T(X),通过患者慢性病的风险评估向量,计算患者针对各种慢性病的风险,其中,是第i种慢性病的权重系数;和分别是针对第i种慢性病的分群信息和文本信息;
输出单元,用于将所述风险评估向量R以及可用治疗措施M1,M2,…,Mk作为多维优化算法O的输入,得到最优的个性化治疗方案向量,其中,是所述多维优化算法O的参数,k是可用治疗措施的总数量;
其中,多维优化算法O的目标函数Q定义为:
;
其中,和是用于平衡风险和治疗成本的权重因子,是针对风险评估向量的Sigmoid激活函数,是一个介于0和1之间的数,用于调节成本函数的敏感度,cost(Mj)为成本函数,其中,所述目标函数进一步受到如下约束:
;
其中,是第i种慢性病的治疗方案的疗效,是一个预设的疗效阈值,δ是一个正数,用于放大或缩小疗效的影响;
其中,多维优化算法O的实现采用一种基于自适应梯度下降的优化框架,所述优化框架利用梯度信息来动态调整权重因子γ和τ,在所述优化框架中,权重因子的更新通过以下方程进行:
;
;
其中,是学习率,是目标函数Q相对于的偏导数,是目标函数Q相对于的偏导数;所述优化框架进一步包括一个动态学习率调整机制,所述动态学习率调整机制通过观察目标函数Q的变化率来自动调整学习率α。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410042372.4A CN117558460B (zh) | 2024-01-11 | 2024-01-11 | 基于小样本学习和大语言模型的慢性病管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410042372.4A CN117558460B (zh) | 2024-01-11 | 2024-01-11 | 基于小样本学习和大语言模型的慢性病管理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117558460A CN117558460A (zh) | 2024-02-13 |
CN117558460B true CN117558460B (zh) | 2024-04-05 |
Family
ID=89813278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410042372.4A Active CN117558460B (zh) | 2024-01-11 | 2024-01-11 | 基于小样本学习和大语言模型的慢性病管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117558460B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118039163B (zh) * | 2024-04-07 | 2024-06-25 | 北京惠每云科技有限公司 | 基于大模型和蚁群算法的临床风险管理方法及装置 |
CN118133969B (zh) * | 2024-05-06 | 2024-07-09 | 卓世未来(天津)科技有限公司 | 一种大语言模型推理加速方法及系统 |
CN118395456A (zh) * | 2024-06-24 | 2024-07-26 | 合肥天帷信息安全技术有限公司 | 等保测评风险分析方法、系统及计算机可读存储介质 |
CN118448049B (zh) * | 2024-07-08 | 2024-08-27 | 恺恩泰(南京)科技有限公司 | 基于不同慢性疾病的分组分配管理系统及方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011124385A1 (en) * | 2010-04-07 | 2011-10-13 | Novadiscovery | Computer based system for predicting treatment outcomes |
CN111105877A (zh) * | 2019-12-24 | 2020-05-05 | 郑州科技学院 | 基于深度置信网络的慢性病精确干预方法及系统 |
CN111696660A (zh) * | 2020-05-13 | 2020-09-22 | 平安科技(深圳)有限公司 | 基于人工智能的患者分群方法、装置、设备及存储介质 |
CN111696675A (zh) * | 2020-05-22 | 2020-09-22 | 平安国际智慧城市科技股份有限公司 | 基于物联网数据的用户数据分类方法、装置及计算机设备 |
CN112614591A (zh) * | 2020-12-13 | 2021-04-06 | 云南省第一人民医院 | 用于养老院老年患者的老年综合征筛查评估及干预的方法 |
CN112951430A (zh) * | 2021-03-29 | 2021-06-11 | 阿斯利康投资(中国)有限公司 | 多种慢性疾病联合管理设备和计算机可读存储介质 |
CN113077905A (zh) * | 2021-03-23 | 2021-07-06 | 大连医科大学附属第一医院 | 一种肿瘤患者多种类心脏毒性评估方法 |
CN114694852A (zh) * | 2022-04-13 | 2022-07-01 | 武汉科瓴智能科技有限公司 | 一种慢性疾病分析方法及系统 |
CN115083555A (zh) * | 2022-08-22 | 2022-09-20 | 四川省医学科学院·四川省人民医院 | 一种社区慢性病辅助决策系统 |
CN115527678A (zh) * | 2022-10-24 | 2022-12-27 | 中国人民解放军总医院 | 融合病历文本的Nomogram ICU老年疾病风险评分模型、装置、及其建立方法 |
CN116564521A (zh) * | 2023-05-11 | 2023-08-08 | 青岛市市北区镇江路街道社区卫生服务中心 | 一种慢性病风险评估模型建立方法、介质及系统 |
CN116682557A (zh) * | 2023-06-05 | 2023-09-01 | 东南大学 | 一种基于小样本深度学习的慢性病并发症早期风险预警方法 |
CN117116490A (zh) * | 2023-08-04 | 2023-11-24 | 杭州劲膳美健康管理有限公司 | 心血管病评估模型构建方法、膳食食疗及健康管理系统 |
-
2024
- 2024-01-11 CN CN202410042372.4A patent/CN117558460B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011124385A1 (en) * | 2010-04-07 | 2011-10-13 | Novadiscovery | Computer based system for predicting treatment outcomes |
CN111105877A (zh) * | 2019-12-24 | 2020-05-05 | 郑州科技学院 | 基于深度置信网络的慢性病精确干预方法及系统 |
CN111696660A (zh) * | 2020-05-13 | 2020-09-22 | 平安科技(深圳)有限公司 | 基于人工智能的患者分群方法、装置、设备及存储介质 |
CN111696675A (zh) * | 2020-05-22 | 2020-09-22 | 平安国际智慧城市科技股份有限公司 | 基于物联网数据的用户数据分类方法、装置及计算机设备 |
CN112614591A (zh) * | 2020-12-13 | 2021-04-06 | 云南省第一人民医院 | 用于养老院老年患者的老年综合征筛查评估及干预的方法 |
CN113077905A (zh) * | 2021-03-23 | 2021-07-06 | 大连医科大学附属第一医院 | 一种肿瘤患者多种类心脏毒性评估方法 |
CN112951430A (zh) * | 2021-03-29 | 2021-06-11 | 阿斯利康投资(中国)有限公司 | 多种慢性疾病联合管理设备和计算机可读存储介质 |
CN114694852A (zh) * | 2022-04-13 | 2022-07-01 | 武汉科瓴智能科技有限公司 | 一种慢性疾病分析方法及系统 |
CN115083555A (zh) * | 2022-08-22 | 2022-09-20 | 四川省医学科学院·四川省人民医院 | 一种社区慢性病辅助决策系统 |
CN115527678A (zh) * | 2022-10-24 | 2022-12-27 | 中国人民解放军总医院 | 融合病历文本的Nomogram ICU老年疾病风险评分模型、装置、及其建立方法 |
CN116564521A (zh) * | 2023-05-11 | 2023-08-08 | 青岛市市北区镇江路街道社区卫生服务中心 | 一种慢性病风险评估模型建立方法、介质及系统 |
CN116682557A (zh) * | 2023-06-05 | 2023-09-01 | 东南大学 | 一种基于小样本深度学习的慢性病并发症早期风险预警方法 |
CN117116490A (zh) * | 2023-08-04 | 2023-11-24 | 杭州劲膳美健康管理有限公司 | 心血管病评估模型构建方法、膳食食疗及健康管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117558460A (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117558460B (zh) | 基于小样本学习和大语言模型的慢性病管理方法及系统 | |
US20210342212A1 (en) | Method and system for identifying root causes | |
US10431338B2 (en) | System and method for weighting manageable patient attributes during criteria evaluations for treatment | |
WO2023029506A1 (zh) | 病情分析方法、装置、电子设备及存储介质 | |
Hong et al. | State of the art of machine learning–enabled clinical decision support in intensive care units: literature review | |
US20210241916A1 (en) | Forecasting and explaining user health metrics | |
US20240289641A1 (en) | Systems and Methods for Processing Data Using Interference and Analytics Engines | |
Ying et al. | Classification of exacerbation frequency in the COPDGene cohort using deep learning with deep belief networks | |
US12020818B1 (en) | Cross care matrix based care giving intelligence | |
RU2752792C1 (ru) | Система для поддержки принятия врачебных решений | |
CN112542242A (zh) | 数据转换/症状评分 | |
CN108231146A (zh) | 一种基于深度学习的医疗记录模型构建方法、系统及装置 | |
US20220167929A1 (en) | Methods and systems for determining the physical status of a subject | |
CN113707323A (zh) | 基于机器学习的疾病预测方法、装置、设备及介质 | |
Davazdahemami et al. | A deep learning approach for predicting early bounce-backs to the emergency departments | |
Fernandes et al. | Classification of the disposition of patients hospitalized with COVID-19: reading discharge summaries using natural language processing | |
Luo et al. | Knowledge grounded conversational symptom detection with graph memory networks | |
Ying et al. | Gold classification of COPDGene cohort based on deep learning | |
US12106195B2 (en) | Method of and system for identifying and enumerating cross-body degradations | |
CN115938593A (zh) | 病历信息的处理方法、装置、设备及计算机可读存储介质 | |
Almushayqih et al. | Analysis of patient data to explore cardiovascular risk factors | |
CN114238558A (zh) | 一种电子病历的质检方法、装置、存储介质及设备 | |
CN113057588A (zh) | 一种病症预警方法、装置、设备及介质 | |
Zhang et al. | Pneumonia Detection Method based on Convolutional Neural Network | |
WO2022134252A1 (zh) | 一种基因关联程度确定方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |