CN117690604A - 一种基于大语言模型的糖尿病健康宣教和用药推荐系统 - Google Patents

一种基于大语言模型的糖尿病健康宣教和用药推荐系统 Download PDF

Info

Publication number
CN117690604A
CN117690604A CN202311680812.0A CN202311680812A CN117690604A CN 117690604 A CN117690604 A CN 117690604A CN 202311680812 A CN202311680812 A CN 202311680812A CN 117690604 A CN117690604 A CN 117690604A
Authority
CN
China
Prior art keywords
health
diabetes
ventilating
teaching
medication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311680812.0A
Other languages
English (en)
Inventor
吴健
张铠
杜邦
徐红霞
刘伟泽
陈启源
邵谦
王越
廖杰远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202311680812.0A priority Critical patent/CN117690604A/zh
Publication of CN117690604A publication Critical patent/CN117690604A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Software Systems (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于大语言模型的糖尿病健康宣教和用药推荐系统,包括文本交互模块,咨询文本的输入和健康宣教文本和用药推荐文本的输出;意图识别模块,对咨询文本进行意图识别;健康宣教模块,启用健康宣教知识库以及提示模版并生成健康宣教提示后发送至模型调用模块;用药推荐模块,启用糖尿病用药推荐知识库和推荐提示模版并生成用药推荐提示后发送至模型调用模块;模型调用模块,基于健康宣教提示或用药推荐提示调用大语言模型生成健康宣教文本或药推荐文本并返回。该系统提高医疗服务的效率并节约宝贵的医疗资源;增强了健康宣教的互动性;提供更加精确和针对性的用药推荐,从而确保患者得到最适合其情况的药物建议。

Description

一种基于大语言模型的糖尿病健康宣教和用药推荐系统
技术领域
本发明属于涉及糖尿病健康宣教和用药推荐以及大语言模型的人工智能技术领域,具体涉及一种基于大语言模型的糖尿病健康宣教和用药推荐系统。
背景技术
糖尿病是全球高发慢性病中患病人数增长最快的疾病,是导致心血管疾病、失明、肾衰竭以及截肢等重大疾病的主要病因之一。糖尿病已成为严重危害健康并给社会带来沉重经济负担的重大公共卫生问题,防治工作迫在眉睫。
这种疾病要求患者长期进行血糖控制和健康管理,其中包括定期监测糖化血红蛋白和血糖水平。有效控制糖尿病需要通过个性化管理对患者及时给予药物和非药物综合治疗,不仅需要清楚告知患者其临床治疗手段,指导其科学健康的饮食与生活方式,还需向患者提供相应的知识、技能、工具和科技手段辅助其配合治疗。糖尿病患者需要接受持续的健康教育和恰当的药物治疗建议。然而,在传统的健康教育和临床治疗如药物推荐、饮食控制等领域,存在着几个显著的局限性:
1.传统的健康教育和药物推荐主要依赖于医生的面对面咨询,这种方法不仅耗费大量的医疗资源和医生工作时间,而且在患者数量众多时,因医疗资源限制,医疗系统难以持续给予患者个性化的关注和建议。
2.目前绝大多数传统的糖尿病健康教育材料,如纸质宣传册和教育视频等资料,缺乏针对性与交互性。此外,这些材料往往无法根据患者的个体差异和特定需求进行调整,缺乏个性化和定制化。不能个性化地给予患者有效的建议,导致患者体验不佳,进而影响疾病教育的成效。
3.现有的糖尿病线下咨询服务大多需要付费,包括交通、食宿费用在内,想要获得更好的医疗咨询建议往往耗时耗力,这对于经常需要医疗咨询的糖尿病患者来说是一笔不小的开支。
4.现有的健康教育和用药推荐系统往往基于有限的数据库进行简单查询,难以提供全面和个性化的服务,在处理复杂病史和患者并发症等方面时,这些系统的推荐常常缺乏针对性和深度。
5.对于那些医疗资源较为薄弱的地区,糖尿病患者可能面临着地区医疗资源等限制,健康教育和药物推荐质量不高的问题,其中药物安全性和准确性难以得到有效保障。
因此,寻找更高效、更便捷、更具有针对性的糖尿病健康教育和药物推荐方法变得至关重要。这要求开发能够提供个性化、易于理解和访问的健康信息系统,同时还要确保药物推荐的精准性和安全性。通过整合先进的技术,如人工智能和移动健康应用程序,可以大幅提升糖尿病患者的教育体验和治疗效果,这不仅能够提高患者的治疗及生活质量,还有助于减轻我国公共卫生系统的压力。
发明内容
鉴于上述问题,本发明提出了一种基于大语言模型的糖尿病健康宣教和用药推荐系统。旨在实现在线可交互的,安全准确的以及个性化的糖尿病健康宣教和用药推荐。
为实现上述发明目的,本发明实施例提供的一种基于大语言模型的糖尿病健康宣教和用药推荐系统,包括:
文本交互模块,用于咨询文本的输入和健康宣教文本和用药推荐文本的输出;
意图识别模块,用于基于文本分类模型对咨询文本进行意图识别;
健康宣教模块,用于根据意图识别结果启用糖尿病健康宣教知识库以及健康宣教提示模版并生成健康宣教提示,发送健康宣教提示至模型调用模块;
用药推荐模块,用于基于意图识别结果启用糖尿病用药推荐知识库和糖尿病用药推荐提示模版并生成用药推荐提示,发送用药推荐提示至模型调用模块;
模型调用模块,用于基于健康宣教提示调用大语言模型生成健康宣教文本并返回至文本交互模块,还用于基于用药推荐提示生成用药推荐文本并返回至文本交互模块。
优选地,所述文本分类模型通过对BERT模型进行训练得到。
优选地,当意图识别结果为问询糖尿病相关资讯意图时,意图识别模块会调用健康宣教模块;
当意图识别结果为问询糖尿病用药推荐意图时,意图识别模块会调用用药推荐模块;
当意图识别结果不为上述问询糖尿病相关资讯意图或问询糖尿病用药推荐意图,则会在文本交互处模块引导用户输入符合意图的咨询文本。
优选地,所述糖尿病健康宣教知识库和糖尿病用药推荐知识库为本地存储的向量数据库,用于存储向量化的对话文本知识。
优选地,在健康宣教模块中,启用糖尿病健康宣教知识库以及健康宣教提示模版并生成健康宣教提示,包括:
将意图识别结果对应的问询糖尿病相关资讯意图进行向量化表示得到第一向量,计算糖尿病健康宣教知识库中相关健康宣教知识对应向量与第一向量的第一相似度,依据第一相似度筛选匹配的健康宣教知识,并将健康宣教知识插入健康宣教提示模版生成健康宣教提示;
所述用药推荐模块中,启用糖尿病用药推荐知识库和糖尿病用药推荐提示模版并生成用药推荐提示,包括:
将意图识别结果对应的问询糖尿病用药推荐意图进行向量化表示得到第二向量,计算糖尿病用药推荐知识库中相关用药推荐知识对应向量与第二向量的第二相似度,依据第二相似度筛选匹配的用药推荐知识,并将用药推荐知识插入用药推荐提示模版生成用药推荐提示。
优选地,所述用药推荐模块还用于:基于文本交互模块通过问答方式收集用户信息,通过将用户信息与用药推荐决策树进行匹配来产生糖尿病用药推荐信息;
其中,用户信息包括性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间;
用药推荐决策树基于糖尿病相关指南、文献和药典构建,其分支特征包括性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间,最终决策树的叶子节点上的用药推荐方案来自于糖尿病相关指南、文献和药典根据性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间这些因素总结和归纳出的治疗方案,涉及到的治疗药物不涉及任何药品名称,而是药物大类的名称。
优选地,所述用药推荐模块还用于:获取对基于用户信息与用药推荐决策树匹配得到的糖尿病用药推荐信息进行的评价和建议,并将评价和建议与糖尿病用药推荐知识库中用药推荐知识进行匹配,基于匹配结果生成另一用药推荐提示并传输至模型调用模块;
所述模型调用模块调用大语言模型基于另一用药推荐提示生成新糖尿病用药推荐信息,实现为用户修改和调整糖尿病用药推荐信息。
优选地,所述大语言模型通过以下方式构建:
获取企业历史至今各系统糖尿病相关的数据并进行预处理得到文本数据,利用ChatGPT对文本数据进行模拟问答对话的构造,用于创建训练大语言模型用的问答对话数据;
采用开源的中文大语言模型Chinese-Alpaca作为底座,使用预处理后的文本数据和问答对话数据对Chinese-Alpaca进行大语言模型训练,训练时采用微调FineTuning和LoRA相结合的方法。
优选地,系统还包括:根据业务场景对大语言模型进行调整优化,此时采用微调FineTuning和LoRA相结合的方法对大语言模型进行参数调整,和/或采用Few-Shot和prompt-tuning方法对知识库和提示进行调整;
在Few-Shot方法中,向大语言模型提供少量标注的示例,作为大语言模型的输入的一部分,来指导模型执行特定任务;
在prompt-tuning方法中,通过优化提示来引导大语言模型为特定任务生成期望的输出。
优选地,系统还包括登录模块,用于实现用户对糖尿病健康宣教和用药推荐系统的登陆和登出,
与现有技术相比,本发明具有的有益效果至少包括:
1、高效性与资源节约:使用本发明系统后用户不需要和医生面对面进行咨询,可以减少对医生时间的依赖,提供自动化、智能化的健康宣教和用药推荐,从而显著提高医疗服务的效率并节约宝贵的医疗资源。
2、交互性与用户体验:与传统的纸质材料和视频相比,本发明系统可以进行实时交互,提供立即的回复和建议,极大地提高了用户的体验感。这种互动性可能会增加用户遵循健康建议的可能性,从而提高健康宣教的效果。
3、个性化服务:本发明系统能够根据用户的具体情况和需求提供个性化的宣教和用药推荐,确保每位用户都得到了与其病情、生活方式和偏好相匹配的建议。
4、精确与针对性:本发明系统内的大语言模型通过深度分析用户的病史和并发症,提供更加精确和针对性的用药推荐,从而确保用户得到最适合其情况的药物建议。
5、普及性与质量保证:在医疗资源薄弱的地区,本发明系统可以作为一个质量稳定、安全和准确的健康宣教和用药推荐来源。这确保了即使在资源有限的地区,用户也可以获得高标准的医疗建议。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的基于大语言模型的糖尿病健康宣教和用药推荐系统的结构示意图;
图2是本发明实施例提供的基于大语言模型的糖尿病健康宣教和用药推荐系统中用户信息采集的面板示意图;
图3是本发明实施例提供的依据糖尿病相关指南、文献和药典构建的用药推荐决策树;
图4是本发明实施例提供的基于大语言模型的糖尿病健康宣教和用药推荐方法的流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
如图1所示,本发明实施例提供的一种基于大语言模型的糖尿病健康宣教和用药推荐系统包括登录模块、文本交互模块、意图识别模块、健康宣教模块、用药推荐模块以及模型调用模块,其中,登录模块用于用户对糖尿病健康宣教和用药推荐系统的登陆和登出,即具有登录功能和登出功能。
文本交互模块为用户与系统交互的界面,用于实现与用户进行文本交互,具体包括咨询文本的输入和健康宣教文本和用药推荐文本的输出。
意图识别模块内置有文本分类模型,用于识别通过文本交互模块用户输入咨询文本的意图,并根据意图识别结果调用健康宣教模块或者用药推荐模块。当当意图识别结果为问询糖尿病相关资讯意图时,意图识别模块会调用健康宣教模块;当意图识别结果为问询糖尿病用药推荐意图时,意图识别模块会调用用药推荐模块;当意图识别结果不为上述问询糖尿病相关资讯意图或问询糖尿病用药推荐意图,则会在文本交互处模块引导用户输入符合意图的咨询文本。其中,文本分类模型通过对BERT模型进行训练得到。
健康宣教模块连接模型调用模块,用于基于意图识别结果启用糖尿病健康宣教知识库以及糖尿病健康宣教模版prompt并生成健康宣教提示,发送健康宣教提示至模型调用模块以实现糖尿病的健康宣教文本的输出。糖尿病健康宣教模块调用模型调用模块时会启用糖尿病健康宣教知识库。其中,糖尿病健康宣教知识库为本地存储的向量数据库,用于存储向量化的关于糖尿病健康宣教的对话文本知识。
具体地,将意图识别结果对应的问询糖尿病相关资讯意图进行向量化表示得到第一向量,计算糖尿病健康宣教知识库中相关健康宣教知识对应向量与第一向量的第一相似度,依据第一相似度筛选匹配的健康宣教知识,并将健康宣教知识插入健康宣教提示模版生成健康宣教提示。
用药推荐模块同样连接模型调用模块,用于基于意图识别结果启用糖尿病用药推荐知识库和糖尿病用药推荐提示模版并生成用药推荐提示,发送用药推荐提示至模型调用模块以实现糖尿病的用药推荐文本的输出。糖尿病用药推荐模块调用模型调用模块时会启用糖尿病用药推荐知识库其中,糖尿病用药推荐知识库同样为本地存储的向量数据库,用于存储向量化的关于糖尿病用药推荐的对话文本知识。
具体地,将意图识别结果对应的问询糖尿病用药推荐意图进行向量化表示得到第二向量,计算糖尿病用药推荐知识库中相关用药推荐知识对应向量与第二向量的第二相似度,依据第二相似度筛选匹配的用药推荐知识,并将用药推荐知识插入用药推荐提示模版生成用药推荐提示。
用药推荐模块还用于:如图2所示,基于文本交互模块处于用药推荐场景时通过问答方式收集用户信息,其中,用户信息包括性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间。然后通过将用户信息与用药推荐决策树进行匹配来产生标准的、符合糖尿病指南的糖尿病用药推荐信息。其中,推荐的药物是药物的大类总称,不涉及某个药物品牌信息,药物的剂量和药物的价格。
如图3所示,用药推荐决策树基于糖尿病相关指南、文献和药典构建,用药推荐决策树的分支特征包括性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间。最终决策树的叶子节点上的用药推荐方案来自于糖尿病相关指南、文献和药典根据性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间这些因素总结和归纳出的治疗方案,涉及到的治疗药物不涉及任何药品名称,而是药物大类的名称。
用药推荐模块还用于:获取对基于用户信息与用药推荐决策树匹配得到的糖尿病用药推荐信息进行的评价和建议,并将评价和建议与糖尿病用药推荐知识库中用药推荐知识进行匹配,基于匹配结果生成另一用药推荐提示并传输至模型调用模块。
模型调用模块,其内置大语言模型,辅助糖尿病健康宣教模块和糖尿病用药推荐模块实现各模块相应的功能,具体用于基于健康宣教提示调用大语言模型生成健康宣教文本并返回至文本交互模块;还用于基于用药推荐提示生成用药推荐文本并返回至文本交互模块;还用于基于另一用药推荐提示生成新糖尿病用药推荐信息,实现为用户修改和调整糖尿病用药推荐信息。
上述基于大语言模型的糖尿病健康宣教和用药推荐系统的运行过程包括:
用户通过登陆模块进入系统,在文本交互模块通过文本输入形式与系统进行交互,用户在文本交互模块输入的咨询文本会传递到调用意图识别模块,意图识别模块对咨询文本进行意图识别,如果意图识别结果为糖尿病健康宣教,则调用健康宣教模块,健康宣教模块会将咨询文本向量化后与模块内的糖尿病健康宣教知识库进行相似度计算,计算后筛选的匹配知识会通过健康宣教提示模版构造健康宣教提示,并将健康宣教提示传递给模型调用模块,让模型调用模块的大语言模型进行回复生成,最后将生成的健康宣教文本返回至文本交互模块,至此单轮会话结束。
如果意图识别结果为糖尿病用药推荐,则调用用药推荐模块,该用药推荐模块通过填写信息的方式获取用户性别、年龄、身高、体重、BMI、血糖、肾功能、肝功能以及糖尿病确诊时间信息。将获取到的用户信息与该模块内的用药推荐决策树进行匹配,给出符合用药推荐决策树最终叶子节点的用药推荐方案。并将用药推荐方案传递至文本交互模块,用户可以对该用药推荐方案进行评价和提出自己的评价和建议,也可以结束会话。如果用户对用药推荐方案有评价和建议,用户可以在文本交互模块输入评价和建议文本,用药推荐模块会将评价和建议文本向量化后与模块内的用药推荐知识库进行相似度计算,计算后筛选的匹配知识会通过用药推荐提示模版构造用药推荐提示,并将用药推荐提示传递给模型调用模块,让模型调用模块的大语言模型进行回复的生成,最后将生成的用药推荐文本返回至文本交互模块,至此单轮会话结束。
如果识别文本的意图不符合以上两个意图,意图识别模块会在文本交互处模块引导用户输入符合意图的信息,至此单轮会话结束。
实施例还提供了上述基于大语言模型的糖尿病健康宣教和用药推荐系统的构建方法,如图4所示,包括以下步骤:
步骤1,数据采集:大语言模型用于糖尿病健康宣教和用药推荐,因此糖尿病相关的信息都需要采集并让大语言模型进行学习,这样大语言模型才能对糖尿病的健康宣教和用药推荐有正确的、官方的回答输出。
本阶段采集的数据包括:获取企业历史至今各系统糖尿病相关的数据,包括且不限于医患对话数据,开药信息数据,患者个人信息数据和医学领域涉及糖尿病的医学刊物,指南和文献数据。企业历史数据作为真实数据具有一定程度的可靠性和真实性,反映了医患的真实场景信息;而医学领域涉及糖尿病的医学刊物,指南和文献数据是官方的,标准的和权威的,反映了当前国内最具有权威性的,认可度最高的糖尿病信息。
步骤2,数据预处理:在训练大语言模型时,数据预处理的目的是在于对数据进行数据清洗、数据标准化、数据构造以及数据标注。
数据清洗是为了确保模型接收的是高质量的数据,需要删除或修正错误、重复或不相关的数据。针对当前数据,请糖尿病领域专家和医生以人工的手段对数据进行检查和审阅,对于异常的,错误的和不相关的数据进行剔除,缺失的数据进行补全。
数据标准化是指将数据转换为一致的格式或结构便于模型学习。针对当前数据,将数据全部保存成JSON格式。
针对数据构造,大语言模型训练使用的数据需要是问答对话数据,因为这能使大语言模型理解人类交流的方式和模式,这有助于模型更好地与用户进行互动、回答问题和参与对话。同时还能使模型更好的理解上下文信息,因为对话中通常包含上下文信息,在真实的对话中,人们经常依赖于先前的话语来解释后续的意思。此外对话数据还能使模型更可能在真实的对话场景中表现得像一个人类参与者。更重要的是,问答对话数据可能包含更多的错误、打字错误、语法不规范等。训练模型处理这些不规范的输入可以增强其鲁棒性。总的来说,问答对话数据为大语言模型提供了一个丰富、多样化和实用的训练环境,使其更能够理解和生成人类对话的复杂性和多样性。
对于训练模型用的问答对话数据的获取,一部分来源于真实的问答对话数据,另一部分是通过目前已经公开的ChatGPT,对目前现有的文本数据包括糖尿病的医学刊物,指南和文献,进行模拟问答对话构造,然后再请糖尿病领域专家和医生以人工的手段对这些对话数据进行校对后形成。
此外,如图3所示,请糖尿病领域专家和医生根据糖尿病的医学刊物,指南和文献内糖尿病的官方治疗指南方案构建糖尿病治疗方案的用药推荐决策树。
针对数据标注,文本数据需要进行标注,请糖尿病领域专家和医生以人工的手段对文本数据进行标注和校对。
步骤3,模型训练:采用基于大语言模型的已公开的开源项目LangChain进行环境的部署,该开源框架可以动态接入各种场景和模态的大语言模型,采用已公开的开源的中文大语言模型Chinese-Alpaca作为大语言模型底座,使用完成数据预处理后的文本数据和问答对话数据对Chinese-Alpaca进行大语言模型训练。
获取到已公开的开源大语言模型Chinese-Alpaca,并通过FineTuning和LoRA相结合的方法对大语言模型Chinese-Alpaca进行训练。两者相结合的“指令微调”的模型训练方法,旨在使预训练的大语言模型Chinese-Alpaca能够更好地响应明确的文本指令。
在预训练的大语言模型内Chinese-Alpaca的Transformer的前馈网络中增加LoRA层,对这些LoRA层进行随机初始化,同时将之前构造好的问答对话数据作为训练数据准备训练。对Chinese-Alpaca模型进行巡礼,具体先将冻结预训练的大语言模型Chinese-Alpaca的权重,只训练LoRA层,然后让模型仅使用LoRA层去学习构造好的问答对话数据,训练权重。经过一定的迭代后,解冻模型的其他部分,并与LoRA层一起进行模型的微调。训练结束后得到最终的大语言模型。在完成模型训练后,当用户提供与微调数据集中类似的文本信息时,大语言模型将利用LoRA层的权重和其他可能已解冻的部分来生成合适的输出。
LoRA层在这里的作用是充当一个额外的记忆或适应模块,帮助大语言模型快速适应给定的指令数据集,而不需要大幅度修改原始的预训练权重。这使得模型能够在保留原始知识的同时,更加灵活地对特定指令进行微调。
此外,还对意图识别的文本分类模型进行训练。采用的模型是已公开的开源的文本分类模型BERT。训练模型使用的数据是请糖尿病领域专家和医生以人工的手段对文本数据进行标注和校对后的数据。数据包含三个类别,分别是健康宣教相关,用药推荐相关和无关信息,分类标签是(0,1,2)。然后加载预训练的BERT模型,使用处理好的文本数据进行模型训练,最终得到一个三分类的意图识别模型。
步骤4,业务场景搭建:根据不同的场景,构建不同数据内容的知识库,设计不同结构和文本的提示,编写不同场景的接口代码。并通过结合训练后的大语言模型能够实现符合场景的交互。
关于知识库,使用的是FAISS向量数据库。针对糖尿病健康宣教和糖尿病用药推荐两个模块分别创建知识库。创建方案如下:将某个模块的问答对话数据进行问题文本和回答文本的拆分并分成两列,然后通过嵌入embedding的方式将文本转化成词向量存入对应模块的知识库内。
关于提示,根据场景进行结构的构造,而的构造也是基于知识库产生。当问题文本传输过来时,问题文本会被嵌入表示从而向量化,然后向量化的问题文本与对应模块内的知识库的问题列进行相似度计算,找出相似度最高且相似度在90%以上的1-3个问题文本,找到问题文本对应的回答文本,将回答文本提取出来进行提示的构造,如果在健康宣教模块内,构造如下:
用户问题:“请问我得了糖尿病,我能吃榴莲吗?”;
健康宣教知识库内相似问题1:“糖尿病可以吃热带水果,类似榴莲,波罗蜜吗?”;
健康宣教知识库内相似问题1回复:“榴莲含有较高的糖分和热量,对于糖尿病患者,摄入过多的糖和热量可能会导致血糖升高。因此,糖尿病患者如果选择食用榴莲,应该限制摄入量,并密切监测血糖变化。”;
健康宣知识库内相似问题2:“如果我有糖尿病,我能吃榴莲吗?”;
健康宣知识库内相似问题2回复:“榴莲含有较高的糖分和热量。对于糖尿病患者,摄入过多的糖和热量可能会导致血糖升高。如果你有糖尿病并想要吃榴莲,以下是一些建议:1、限制摄入量:如果决定食用榴莲,应限制摄入量。2、监测血糖:食用后,密切监测血糖变化,确保血糖处于控制范围内。3、咨询医生:最重要的是,你应该咨询医生或营养师以获取针对你个人情况的专业建议。”;
最终输入大语言模型的宣教提示如下:“如果你作为一位糖尿病领域的专家,请问我得了糖尿病,我能吃榴莲吗?回答需要专业和清晰,目前已知信息如下:1、“榴莲含有较高的糖分和热量,对于糖尿病患者,摄入过多的糖和热量可能会导致血糖升高。因此,糖尿病患者如果选择食用榴莲,应该限制摄入量,并密切监测血糖变化。”;2、“榴莲含有较高的糖分和热量。对于糖尿病患者,摄入过多的糖和热量可能会导致血糖升高。如果你有糖尿病并想要吃榴莲,以下是一些建议:1、限制摄入量:如果决定食用榴莲,应限制摄入量。2、监测血糖:食用后,密切监测血糖变化,确保血糖处于控制范围内。3、咨询医生:最重要的是,你应该咨询医生或营养师以获取针对你个人情况的专业建议。”。”
健康宣教模块和用药推荐模块均有对应的知识库和提示模板,用于实现不同模块的功能。
步骤5,业务场景调整优化:对于大语言模型的效果的调整和优化体现在两个方向,方向一是对模型本身进行调整,采用步骤3中的FineTuning和LoRA相结合的方法,这方法需要从数据层面进行调整和优化,通过让大语言模型学习新的,准确的数据从而提升大语言模型的性能;方向二是通过对知识库和提示进行调整,简单的说就是场景上进行调整,使用的是Few-Shot和prompt-tuning方法。
在Few-Shot方法中,向大语言模型提供少量标注的示例,作为大语言模型的输入的一部分,来指导模型如何执行特定任务。在prompt-tuning方法中,通过优化提示来引导大语言模型为特定任务生成期望的输出。两种方法都是在不进行大语言模型训练的情况下利用大型预训练模型的能力,与直接微调模型权重的方向一相比方向二效率更高。两个方向的优化和调整方案都能在一定程度上提升回答正确性。
上述糖尿病健康宣教和用药推荐系统能够提高医疗服务的效率并节约宝贵的医疗资源;增强了健康宣教的互动性,从而提高健康宣教的效果;提供更加精确和针对性的用药推荐,从而确保患者得到最适合其情况的药物建议;确保了即使在资源有限的地区,患者也可以获得高标准的医疗建议。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,包括:
文本交互模块,用于咨询文本的输入和健康宣教文本和用药推荐文本的输出;
意图识别模块,用于基于文本分类模型对咨询文本进行意图识别;
健康宣教模块,用于根据意图识别结果启用糖尿病健康宣教知识库以及健康宣教提示模版并生成健康宣教提示,发送健康宣教提示至模型调用模块;
用药推荐模块,用于基于意图识别结果启用糖尿病用药推荐知识库和糖尿病用药推荐提示模版并生成用药推荐提示,发送用药推荐提示至模型调用模块;
模型调用模块,用于基于健康宣教提示调用大语言模型生成健康宣教文本并返回至文本交互模块,还用于基于用药推荐提示生成用药推荐文本并返回至文本交互模块。
2.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,所述文本分类模型通过对BERT模型进行训练得到。
3.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,当意图识别结果为问询糖尿病相关资讯意图时,意图识别模块会调用健康宣教模块;
当意图识别结果为问询糖尿病用药推荐意图时,意图识别模块会调用用药推荐模块;
当意图识别结果不为上述问询糖尿病相关资讯意图或问询糖尿病用药推荐意图,则会在文本交互处模块引导用户输入符合意图的咨询文本。
4.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,所述糖尿病健康宣教知识库和糖尿病用药推荐知识库为本地存储的向量数据库,用于存储向量化的对话文本知识。
5.根据权利要求4所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,在健康宣教模块中,启用糖尿病健康宣教知识库以及健康宣教提示模版并生成健康宣教提示,包括:
将意图识别结果对应的问询糖尿病相关资讯意图进行向量化表示得到第一向量,计算糖尿病健康宣教知识库中相关健康宣教知识对应向量与第一向量的第一相似度,依据第一相似度筛选匹配的健康宣教知识,并将健康宣教知识插入健康宣教提示模版生成健康宣教提示;
所述用药推荐模块中,启用糖尿病用药推荐知识库和糖尿病用药推荐提示模版并生成用药推荐提示,包括:
将意图识别结果对应的问询糖尿病用药推荐意图进行向量化表示得到第二向量,计算糖尿病用药推荐知识库中相关用药推荐知识对应向量与第二向量的第二相似度,依据第二相似度筛选匹配的用药推荐知识,并将用药推荐知识插入用药推荐提示模版生成用药推荐提示。
6.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,所述用药推荐模块还用于:基于文本交互模块通过问答方式收集用户信息,通过将用户信息与用药推荐决策树进行匹配来产生糖尿病用药推荐信息;
其中,用户信息包括性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间;
用药推荐决策树基于糖尿病相关指南、文献和药典构建,其分支特征包括性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间,最终决策树的叶子节点上的用药推荐方案来自于糖尿病相关指南、文献和药典,且根据性别,年龄,身高,体重,BMI,血糖,肾功能,肝功能,糖尿病确诊时间这些因素总结和归纳出的治疗方案。
7.根据权利要求6所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,所述用药推荐模块还用于:获取对基于用户信息与用药推荐决策树匹配得到的糖尿病用药推荐信息进行的评价和建议,并将评价和建议与糖尿病用药推荐知识库中用药推荐知识进行匹配,基于匹配结果生成另一用药推荐提示并传输至模型调用模块;
所述模型调用模块调用大语言模型基于另一用药推荐提示生成新糖尿病用药推荐信息,实现为用户修改和调整糖尿病用药推荐信息。
8.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,所述大语言模型通过以下方式构建:
获取企业历史至今各系统糖尿病相关的数据并进行预处理得到文本数据,利用ChatGPT对文本数据进行模拟问答对话的构造,用于创建训练大语言模型用的问答对话数据;
采用开源的中文大语言模型Chinese-Alpaca作为底座,使用预处理后的文本数据和问答对话数据对Chinese-Alpaca进行大语言模型训练,训练时采用微调FineTuning和LoRA相结合的方法。
9.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,还包括:根据业务场景对大语言模型进行调整优化,此时采用微调FineTuning和LoRA相结合的方法对大语言模型进行参数调整,和/或采用Few-Shot和prompt-tuning方法对知识库和提示进行调整;
在Few-Shot方法中,向大语言模型提供少量标注的示例,作为大语言模型的输入的一部分,来指导模型执行特定任务;
在prompt-tuning方法中,通过优化提示来引导大语言模型为特定任务生成期望的输出。
10.根据权利要求1所述的基于大语言模型的糖尿病健康宣教和用药推荐系统,其特征在于,还包括登录模块,用于实现用户对糖尿病健康宣教和用药推荐系统的登陆和登出。
CN202311680812.0A 2023-12-08 2023-12-08 一种基于大语言模型的糖尿病健康宣教和用药推荐系统 Pending CN117690604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311680812.0A CN117690604A (zh) 2023-12-08 2023-12-08 一种基于大语言模型的糖尿病健康宣教和用药推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311680812.0A CN117690604A (zh) 2023-12-08 2023-12-08 一种基于大语言模型的糖尿病健康宣教和用药推荐系统

Publications (1)

Publication Number Publication Date
CN117690604A true CN117690604A (zh) 2024-03-12

Family

ID=90129550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311680812.0A Pending CN117690604A (zh) 2023-12-08 2023-12-08 一种基于大语言模型的糖尿病健康宣教和用药推荐系统

Country Status (1)

Country Link
CN (1) CN117690604A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118230897A (zh) * 2024-05-24 2024-06-21 杭州中宝科技有限公司 一种药品信息生成方法及终端

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180055680A (ko) * 2016-11-16 2018-05-25 한국과학기술원 사용자 대화 의도 추출 기능 구비 채트봇을 활용한 헬스케어 지침 제공 방법 및 이를 위한 장치
CN111986809A (zh) * 2020-08-10 2020-11-24 武汉麦咚健康科技有限公司 一种用于医生辅助判断的高血压药物推荐系统和方法
CN112164460A (zh) * 2020-10-19 2021-01-01 科技谷(厦门)信息技术有限公司 一种基于医疗知识图谱的智能疾病辅助诊断系统
CN112863630A (zh) * 2021-01-20 2021-05-28 中国科学院自动化研究所 基于数据和知识的个性化精准医疗问答系统
CN113764112A (zh) * 2021-09-16 2021-12-07 山东大学第二医院 一种在线医疗问答方法
CN116821318A (zh) * 2023-08-29 2023-09-29 中船奥蓝托无锡软件技术有限公司 基于大语言模型的业务知识推荐方法、装置及存储介质
CN117033608A (zh) * 2023-09-28 2023-11-10 中国电子科技集团公司第十研究所 一种基于大语言模型的知识图谱生成式问答方法及系统
CN117056493A (zh) * 2023-09-07 2023-11-14 四川大学 基于病历知识图谱的大语言模型医疗问答系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180055680A (ko) * 2016-11-16 2018-05-25 한국과학기술원 사용자 대화 의도 추출 기능 구비 채트봇을 활용한 헬스케어 지침 제공 방법 및 이를 위한 장치
CN111986809A (zh) * 2020-08-10 2020-11-24 武汉麦咚健康科技有限公司 一种用于医生辅助判断的高血压药物推荐系统和方法
CN112164460A (zh) * 2020-10-19 2021-01-01 科技谷(厦门)信息技术有限公司 一种基于医疗知识图谱的智能疾病辅助诊断系统
CN112863630A (zh) * 2021-01-20 2021-05-28 中国科学院自动化研究所 基于数据和知识的个性化精准医疗问答系统
CN113764112A (zh) * 2021-09-16 2021-12-07 山东大学第二医院 一种在线医疗问答方法
CN116821318A (zh) * 2023-08-29 2023-09-29 中船奥蓝托无锡软件技术有限公司 基于大语言模型的业务知识推荐方法、装置及存储介质
CN117056493A (zh) * 2023-09-07 2023-11-14 四川大学 基于病历知识图谱的大语言模型医疗问答系统
CN117033608A (zh) * 2023-09-28 2023-11-10 中国电子科技集团公司第十研究所 一种基于大语言模型的知识图谱生成式问答方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118230897A (zh) * 2024-05-24 2024-06-21 杭州中宝科技有限公司 一种药品信息生成方法及终端

Similar Documents

Publication Publication Date Title
US20200097814A1 (en) Method and system for enabling interactive dialogue session between user and virtual medical assistant
CN113873935A (zh) 个性化数字化治疗方法和装置
CN110993093B (zh) 基于深度学习的眼科预问诊方法与装置
CN111125309A (zh) 自然语言处理方法、装置及计算设备、存储介质
CN110675951A (zh) 智能化的疾病诊断方法及装置、计算机设备与可读介质
CN112507696B (zh) 基于全局注意力意图识别的人机交互导诊方法与系统
CN113724882B (zh) 基于问诊会话构建用户画像的方法、装置、设备和介质
CN117690604A (zh) 一种基于大语言模型的糖尿病健康宣教和用药推荐系统
CN111933291A (zh) 医疗信息推荐装置、方法、系统、设备及可读存储介质
CN115982335B (zh) 一种主动式ai医疗问答系统、方法、设备及存储介质
WO2022174161A1 (en) Systems and methods for psychotherapy using artificial intelligence
CN117497141A (zh) 一种针对患者的心理干预智能交互系统以及方法
Kolanu et al. A diabetic diet suggester and appointment scheduler chatbot using artificial intelligence and cloud
Liao et al. Medical data inquiry using a question answering model
CN117912707A (zh) 一种智能医疗助手的实现方法及相关装置
Nelson Expanding the role of connectionism in SLA theory
Imrie et al. Redefining digital health interfaces with large language models
CN117766160A (zh) 基于预训练语言模型的医学问答文本质量评估系统及方法
Nefdt Biolinguistics and biological systems: a complex systems analysis of language
Sakurai et al. VICA, a visual counseling agent for emotional distress
Griol et al. A multimodal conversational coach for active ageing based on sentient computing and m‐health
McShane et al. Knowledge engineering in the long game of artificial intelligence: The case of speech acts
Yasavur et al. Modeling brief alcohol intervention dialogue with MDPs for delivery by ECAs
Griol et al. Towards emotionally sensitive conversational interfaces for e-therapy
CN114090789A (zh) 基于知识图谱的中医养生智能多轮交互系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination