CN117709441A - 通过逐步迁移领域训练专业医疗大模型的方法 - Google Patents

通过逐步迁移领域训练专业医疗大模型的方法 Download PDF

Info

Publication number
CN117709441A
CN117709441A CN202410167626.5A CN202410167626A CN117709441A CN 117709441 A CN117709441 A CN 117709441A CN 202410167626 A CN202410167626 A CN 202410167626A CN 117709441 A CN117709441 A CN 117709441A
Authority
CN
China
Prior art keywords
medical
model
training
field
professional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410167626.5A
Other languages
English (en)
Other versions
CN117709441B (zh
Inventor
王中海
詹忆冰
陶大鹏
张冲
林旭
刘伟锋
刘宝弟
李艳鸿
周博豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan United Visual Technology Co ltd
Original Assignee
Yunnan United Visual Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan United Visual Technology Co ltd filed Critical Yunnan United Visual Technology Co ltd
Priority to CN202410167626.5A priority Critical patent/CN117709441B/zh
Publication of CN117709441A publication Critical patent/CN117709441A/zh
Application granted granted Critical
Publication of CN117709441B publication Critical patent/CN117709441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及通过逐步迁移领域训练专业医疗大模型的方法,属于数据处理技术领域。本发明包括步骤:将预训练模型迁移至通用医疗领域,包括:获取通用医疗数据、训练预训练大模型得到通用医疗领域大模型;训练时,使用通用医学指令数据对大模型进行有监督微调;将通用医疗领域大模型迁移至麻醉专业领域,包括:获取专业医疗数据、训练通用医疗领域大模型,获得麻醉专业大模型;训练时,在通用医疗大模型的基础上继续进行有监督微调,对于专业的医疗指令数据使用全微调的方式去训练。本发明训练了一个专业的麻醉大语言大模型,提高了医疗领域预训练模型的性能。

Description

通过逐步迁移领域训练专业医疗大模型的方法
技术领域
本发明涉及通过逐步迁移领域训练专业医疗大模型的方法,属于数据处理技术领域。
背景技术
随着大数据和人工智能技术的不断发展,预训练的大语言模型已经在自然语言处理领域取得了显著的成就,但是将预训练的大语言模型适应新的领域,如临床应用、麻醉学、放射学等,仍然是一个有挑战性但非常有潜力的任务。当前许多方法是直接在预训练大语言模型的基础上通过有监督的指令微调获得专业的医学领域大语言模型,通过使用专业医学指令数据赋予预训练大语言模型专业的医学能力,这种方法固然是有效的,但是也存在一些问题:专业医学领域指令数据的稀缺无法赋予模型全面的医学能力、大语言模型对医学术语的理解能力有所欠缺等。医学的术语和概念通常非常复杂,需要深入的领域专业知识才能正确理解,同时医学领域的问题也多种多样,大语言模型需要更全面的医学能力来应对这些问题,因此,有必要采取可行的措施提高模型的性能来解决这些问题。
发明内容
为了解决上述提到的问题,本发明提供了通过逐步迁移领域训练专业医疗大模型的方法,通过将预训练大模型迁移至通用医疗领域再迁移至麻醉专业领域的方式训练了一个专业的麻醉大语言大模型,提高了医疗领域预训练模型的性能。
本发明的技术方案是:通过逐步迁移领域训练专业医疗大模型的方法,所述方法的具体步骤如下:
Step1、将预训练模型迁移至通用医疗领域;包括:
Step1.1、获取通用医疗数据;
Step1.2、训练预训练大模型,得到通用医疗领域大模型;训练时,使用通用医学指令数据对大模型进行有监督微调;
Step2、将通用医疗领域大模型迁移至麻醉专业领域;包括:
Step2.1、获取专业医疗数据;
Step2.2、训练通用医疗领域大模型,获得麻醉专业大模型;训练时,在通用医疗大模型的基础上继续进行有监督微调,对于专业的医疗指令数据使用全微调的方式去训练。
进一步地,所述Step1.1中,获取通用医疗数据包括:
首先,收集大规模的医学领域数据,包括医学文本、病例报告、医学文章、医疗问答;医学领域数据的来源包括:
(1)通过爬取医疗网站的医疗问答、医学文章、药物说明书获取相关的医学领域数据;
(2)通过爬取医学论文获得更加专业的医学领域数据;
(3)收集已经开源的医学数据集;
(4)从医院获取包括病历报告、检查报告、诊断报告的专业医疗数据;
(5)由现有的商业大模型通过self Instruction生成医疗数据;
(6)将现有的英文医疗数据集翻译为中文医疗数据集。
进一步地,所述Step1.2中,训练预训练大模型,得到通用医疗领域大模型,具体步骤如下:
Step1.2.1、选定llama-7B为基础模型,选择参数高效微调的方式lora微调技术将基础模型快速微调到通用医疗领域;如式(1)所示;将lora应用到llama模型的每一个线性层当中,获得更多的可训练参数和自适应能力;
(1)
其中,代表的是原模型参数,B是 一个d×r维度的矩阵,A是一个r×k维度的矩阵;BA就是一个d×k维度的矩阵,和原模型的 矩阵维度一样,B和A是额外添加的模块,保证原模型参数固定,B和A的模型参数更新;x是一 个d维的输入向量,h是一个k维的输出向量;
Step1.2.2、使用收集到的纯文本医疗数据,包括病历报告、检查报告、医学文章、医学考试、医学问答;对基础模型进行二次增量预训练,快速为模型注入医学知识,将模型迁入医学领域;
Step1.2.3、遵从Chinese_LLaMA_Alpaca的方法对llama_7B模型的词表进行扩充;在将预训练模型迁移至通用医学领域时,扩充后选择二次增量预训练+有监督指令微调方式,或直接进行有监督指令微调,选择使用通用医疗指令数据进行有监督微调将模型迁移至通用医疗领域。
进一步地,所述Step2.1中,获取专业医疗数据包括:
通过将现有的专业医疗文本通过商业大模型转换为专业的医疗指令数据,或者通过设计模板将结构化的医疗数据转换为专业的医疗指令数据集,或者从通用医疗指令数据集中获取;
制定了与麻醉相关的关键字字典,通过匹配的方式获取到在通用医疗指令数据集中与麻醉相关的数据,同时使用商业大模型以self instruction的方式生成专业的麻醉指令数据集;真实的麻醉指令数据和生成的麻醉指令数据共同组合成专业麻醉指令数据集。
进一步地,所述Step2.2中,训练通用医疗领域大模型,获得麻醉专业大模型具体包括如下:
将经过通用医疗数据训练的lora模块合并到原模型通用医疗领域大模型上获得最终的通用医疗大模型,使用全微调的方式去训练通用医疗大模型获得最终的麻醉专业大模型。
本发明的有益效果是:
1、解决了现有的方法使得预训练大模型在理解和处理专业术语方面存在限制,稀少的专业指令数据集也会使得模型的医学能力有所欠缺的问题;
2、针对像医学领域中的麻醉学、放射学、临床医学等特定领域,直接使用医疗专业指令数据微调预训练大模型存在难以理解专业医学术语和医学概念的限制。提高大模型在专业医学领域的性能主要考虑了两个方面:一方面是提高医学指令数据的质量和多样性,另一方面是使用足够的通用医疗指令数据微调模型,以便让模型能够更好的理解和处理医学问题;
3、在专业医疗指令数据集本就稀少的情况下,使用通用医疗指令数据将模型迁移至医疗领域:使用通用医学文本对预训练大语言模型进行增量预训练或者使用通用医学指令数据对预训练大语言模型进行有监督微调;
4、在通用医疗大模型的基础上使用专业医疗指令数据继续进行有监督微调,将通用医疗大模型从通用医学领域迁移到专业医学领域。通用医疗数据一方面促进预训练大模型对医疗专业术语的理解和处理能力,一方面在专业医疗指令数据集稀少的情况下,补全预训练大模型的医学能力,使得医疗大模型能够应对更多的情况;
5、提出了一个通过逐步迁移应用领域训练专业医疗大语言模型的方式;
6、通过将预训练大模型迁移至通用医疗领域再迁移至麻醉专业领域的方式训练了一个专业的麻醉大语言大模型。
附图说明
图1为本发明预训练大模型到通用医疗领域再到专业医疗领域的整体训练框架;
图2为本发明中麻醉大语言模型的训练流程图。
具体实施方式
实施例1:如图1-图2所示,通过逐步迁移领域训练专业医疗大模型的方法,所述方法的具体步骤如下:
Step1、将预训练模型迁移至通用医疗领域;包括:
Step1.1、获取通用医疗数据,包括:
首先,收集大规模的医学领域数据,包括医学文本、病例报告、医学文章、医疗问答;医学领域数据的来源包括:
(1)通过爬取医疗网站的医疗问答、医学文章、药物说明书获取相关的医学领域数据;
(2)通过爬取医学论文获得更加专业的医学领域数据;
(3)收集已经开源的医学数据集;
(4)从医院获取包括病历报告、检查报告、诊断报告的专业医疗数据;
(5)由现有的商业大模型通过self Instruction生成医疗数据;
(6)将现有的英文医疗数据集翻译为中文医疗数据集。
Step1.2、训练预训练大模型,得到通用医疗领域大模型;训练时,使用通用医学指令数据对大模型进行有监督微调;所述Step1.2具体步骤如下:
Step1.2.1、选定llama-7B为基础模型,选择参数高效微调的方式lora微调技术将基础模型快速微调到通用医疗领域;如式(1)所示;lora微调技术是固定模型的全部参数,添加额外的参数模块来实现快速微调,只需要少量的参数就可以实现对全部参数的微调。将lora应用到llama模型的每一个线性层当中,获得更多的可训练参数和自适应能力;
(1)
其中,代表的是原模型参数,B是 一个d×r维度的矩阵,A是一个r×k维度的矩阵;BA就是一个d×k维度的矩阵,和原模型的 矩阵维度一样,B和A是额外添加的模块,保证原模型参数固定,B和A的模型参数更新;x是一 个d维的输入向量,h是一个k维的输出向量;
Step1.2.2、使用收集到的纯文本医疗数据,包括病历报告、检查报告、医学文章、医学考试、医学问答;对基础模型进行二次增量预训练,快速为模型注入医学知识,将模型迁入医学领域;
Step1.2.3、通用医疗指令数据赋予大模型通用医疗知识和处理各种问题的能力;相比于被通用领域包裹的专业医疗大模型,被通用医疗领域包裹的专业医疗大模型可以应对更多的医疗情况。选择llama_7B作为基础模型,因为llama模型包含的中文词汇相对较少,所以遵从Chinese_LLaMA_Alpaca的方法对llama_7B模型的词表进行扩充;在将预训练模型迁移至通用医学领域时,扩充后选择二次增量预训练+有监督指令微调方式,或直接进行有监督指令微调,选择使用通用医疗指令数据进行有监督微调将模型迁移至通用医疗领域。
Step2、将通用医疗领域大模型迁移至麻醉专业领域;包括:
Step2.1、获取专业医疗数据,包括:
通过将现有的专业医疗文本通过商业大模型转换为专业的医疗指令数据,或者通过设计模板将结构化的医疗数据转换为专业的医疗指令数据集,或者从通用医疗指令数据集中获取;
制定了与麻醉相关的关键字字典,通过匹配的方式获取到在通用医疗指令数据集中与麻醉相关的数据,同时使用商业大模型以self instruction的方式生成专业的麻醉指令数据集;真实的麻醉指令数据和生成的麻醉指令数据共同组合成专业麻醉指令数据集。
本发明收集足够的通用医疗指令数据和通用医疗文本数据,对于通用医疗指令数据集尽可能的保证数据的质量和多样性。通用医疗指令数据中依然包含麻醉专业领域数据,可以从其中提取出来放入麻醉专业指令数据集中继续训练,防止灾难性遗忘。
Step2.2、训练通用医疗领域大模型,获得麻醉专业大模型;训练时,在通用医疗大模型的基础上继续进行有监督微调,对于专业的医疗指令数据使用全微调的方式去训练。所述Step2.2中,训练通用医疗领域大模型,获得麻醉专业大模型具体包括如下:
将经过通用医疗数据训练的lora模块合并到原模型通用医疗领域大模型上获得最终的通用医疗大模型,专业医疗指令数据集的数量一般较少,为了更充分的学习到专业的麻醉知识,使用全微调的方式去训练通用医疗大模型获得最终的麻醉专业大模型。
如图2所示,本发明收集了大量的通用医疗指令数据,对扩充后的llama模型进行指令微调;因为llama扩充的embedding并未得到更新,所以先固定模型的其他参数,放开embeding和Im_head层,使用部分通用医疗指令数据对参数进行微调,后续将lora应用到每一个线性层进行快速微调获得在通用医疗领域的大模型。
对于例子:
Human:局部麻醉药物过敏反应的治疗要点有哪些?
Hypnos:局部麻醉药物过敏反应的治疗要点主要有: 1.停用局部麻醉药物,停止外界刺激。2.使用抗组胺药物。使用H1受体抗组胺及H2受体抗组胺抑制过敏反应。3.使用糖皮质激素,使用糖皮质激素如地塞米松控制炎症反应等;
其中,Human代表的是输入到模型的人类指令(问题),Hypnos是训练好的大模型(针对问题进行的回答)。这个模型能够进行单轮问答。这里的问题来源于一本麻醉书籍,下面是训练好的模型的回答,输入到模型的范式是(Human: 问题 \n Hypnos: )这个并不固定,看自己训练怎么设置。
本发明通过以上的方式,将预训练的大语言模型迁移至通用医疗领域,再迁移至麻醉专业领域。通用医疗数据可以对麻醉医疗数据进行补充,以应对更多样的问题,同时能够促进模型对医学专业术语的理解。
本发明这种逐步迁移模型到不同领域的方式可以训练出更完善的专业领域大模型,赋予大模型专业领域知识,又具备足够的通用领域知识。可以为后续开发放射学大语言模型、临床医学大语言模型等奠定基础;本发明的这种方法构建了专属于麻醉领域的大语言模型;
为了验证本发明的效果,验证通用医疗数据对模型的影响,将直接使用麻醉指令数据微调获得的麻醉专业领域大模型和逐步迁移获得的麻醉专业领域大模型进行比较。为了能够衡量麻醉大语言模型的能力,从真实的麻醉问答数据集中抽取一部分组成麻醉测试集,使用自动评估指标BLEU、GLUE、ROUGE、Distinct去评估模型推理的得分,BLEU计算生成句子和参考句子之间的k-gram重叠,以测量相似性。ROUGE-N评估N语法重叠,ROUGE-L测量单词匹配的最长公共子序列。GLEU自动评估句子级别的流利度。Distinct-1/2通过确定不同的n-gram计数来帮助评估生成的响应的文本多样性。然而,由于潜在参考答案的多样性,这些基于参考的指标可能不适合医疗QA场景,但能够在一定程度上可以表达出性能的优劣。
如表1所示,其中llama是使用专业麻醉指令数据集微调llama原模型获得的,Llama_expand是经过Chinese_LLaMA_Alpaca的方法扩展后的模型,使用麻醉专业指令数据进行微调获得。Llama_expand(final)是扩展词表后,使用通用医疗指令数据进行微调,然后使用麻醉专业指令数据继续微调;可以从表中看到,经过通用医疗指令数据微调的模型在麻醉测试集获得了更高的自动评估得分,通用医疗数据可以促进大语言模型对医学术语的理解能力,同时可以弥补专业医疗数据在某些医学方面的欠缺。
表1为模型在麻醉测试集上的自动评估得分
本发明将大模型从通用领域迁移到通用医疗领域,收集医学的文本数据和指令数据,通过增量预训练的方式让大模型学会大量的医学知识,同时增强大模型对医学术语的理解能力;使用通用医学指令数据对大模型进行有监督微调使;将模型迁移到通用医学领域,可以使用PEFT中的lora微调,通过固定模型的参数附加额外的参数模块达到加速微调的目的。在赋予模型通用医疗对话能力时,使用高质量的通用医学指令数据,以避免通用医疗指令数据中的杂质数据对后续专业医疗指令数据的训练产生影响;
将大模型从通用医疗领域迁移到专业医疗领域,获取富有大量专业医学知识的指令数据,在通用医疗大模型的基础上继续进行有监督微调,医学专业指令数据集一般较少,同时为了更充分的学习到专业的医学知识,对于专业的医疗指令数据使用全微调的方式去训练。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (5)

1.通过逐步迁移领域训练专业医疗大模型的方法,其特征在于:所述方法的具体步骤如下:
Step1、将预训练模型迁移至通用医疗领域;包括:
Step1.1、获取通用医疗数据;
Step1.2、训练预训练大模型,得到通用医疗领域大模型;训练时,使用通用医学指令数据对大模型进行有监督微调;
Step2、将通用医疗领域大模型迁移至麻醉专业领域;包括:
Step2.1、获取专业医疗数据;
Step2.2、训练通用医疗领域大模型,获得麻醉专业大模型;训练时,在通用医疗大模型的基础上继续进行有监督微调,对于专业的医疗指令数据使用全微调的方式去训练。
2.根据权利要求1所述的通过逐步迁移领域训练专业医疗大模型的方法,其特征在于:所述Step1.1中,获取通用医疗数据包括:
首先,收集大规模的医学领域数据,包括医学文本、病例报告、医学文章、医疗问答;医学领域数据的来源包括:
(1)通过爬取医疗网站的医疗问答、医学文章、药物说明书获取相关的医学领域数据;
(2)通过爬取医学论文获得更加专业的医学领域数据;
(3)收集已经开源的医学数据集;
(4)从医院获取包括病历报告、检查报告、诊断报告的专业医疗数据;
(5)由现有的商业大模型通过self Instruction生成医疗数据;
(6)将现有的英文医疗数据集翻译为中文医疗数据集。
3.根据权利要求1所述的通过逐步迁移领域训练专业医疗大模型的方法,其特征在于:所述Step1.2中,训练预训练大模型,得到通用医疗领域大模型,具体步骤如下:
Step1.2.1、选定llama-7B为基础模型,选择参数高效微调的方式lora微调技术将基础模型快速微调到通用医疗领域;如式(1)所示;将lora应用到llama模型的每一个线性层当中,获得更多的可训练参数和自适应能力;
(1);
其中,;/>代表的是原模型参数,B是一个d×r维度的矩阵,A是一个r×k维度的矩阵;BA就是一个d×k维度的矩阵,和原模型的矩阵维度一样,B和A是额外添加的模块,保证原模型参数固定,B和A的模型参数更新;x是一个d维的输入向量,h是一个k维的输出向量;
Step1.2.2、使用收集到的纯文本医疗数据,包括病历报告、检查报告、医学文章、医学考试、医学问答;对基础模型进行二次增量预训练,快速为模型注入医学知识,将模型迁入医学领域;
Step1.2.3、遵从Chinese_LLaMA_Alpaca的方法对llama_7B模型的词表进行扩充;在将预训练模型迁移至通用医学领域时,扩充后选择二次增量预训练+有监督指令微调方式,或直接进行有监督指令微调,选择使用通用医疗指令数据进行有监督微调将模型迁移至通用医疗领域。
4.根据权利要求1所述的通过逐步迁移领域训练专业医疗大模型的方法,其特征在于:所述Step2.1中,获取专业医疗数据包括:
通过将现有的专业医疗文本通过商业大模型转换为专业的医疗指令数据,或者通过设计模板将结构化的医疗数据转换为专业的医疗指令数据集,或者从通用医疗指令数据集中获取;
制定了与麻醉相关的关键字字典,通过匹配的方式获取到在通用医疗指令数据集中与麻醉相关的数据,同时使用商业大模型以self instruction的方式生成专业的麻醉指令数据集;真实的麻醉指令数据和生成的麻醉指令数据共同组合成专业麻醉指令数据集。
5.根据权利要求1所述的通过逐步迁移领域训练专业医疗大模型的方法,其特征在于:所述Step2.2中,训练通用医疗领域大模型,获得麻醉专业大模型具体包括如下:
将经过通用医疗数据训练的lora模块合并到原模型通用医疗领域大模型上获得最终的通用医疗大模型,使用全微调的方式去训练通用医疗大模型获得最终的麻醉专业大模型。
CN202410167626.5A 2024-02-06 2024-02-06 通过逐步迁移领域训练专业医疗大模型的方法 Active CN117709441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410167626.5A CN117709441B (zh) 2024-02-06 2024-02-06 通过逐步迁移领域训练专业医疗大模型的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410167626.5A CN117709441B (zh) 2024-02-06 2024-02-06 通过逐步迁移领域训练专业医疗大模型的方法

Publications (2)

Publication Number Publication Date
CN117709441A true CN117709441A (zh) 2024-03-15
CN117709441B CN117709441B (zh) 2024-05-03

Family

ID=90157447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410167626.5A Active CN117709441B (zh) 2024-02-06 2024-02-06 通过逐步迁移领域训练专业医疗大模型的方法

Country Status (1)

Country Link
CN (1) CN117709441B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117809798A (zh) * 2024-03-01 2024-04-02 金堂县第一人民医院 基于大模型的检验报告解读方法、系统、设备及介质

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160228034A1 (en) * 2011-11-30 2016-08-11 Rush University Medical Center System and methods for identification of implanted medical devices and/or detection of retained surgical foreign objects from medical images
CN110348008A (zh) * 2019-06-17 2019-10-18 五邑大学 基于预训练模型和微调技术的医疗文本命名实体识别方法
CN110740762A (zh) * 2017-05-30 2020-01-31 株式会社Adeka 移植用脱细胞化材料制造方法及由包含该材料的生物相容性材料组成的移植片组成物
WO2021262905A2 (en) * 2020-06-23 2021-12-30 Brainbox Solutions, Inc. Multimodality systems and methods for detection, prognosis, and monitoring of neurological injury and disease
US20220328189A1 (en) * 2021-04-09 2022-10-13 Arizona Board Of Regents On Behalf Of Arizona State University Systems, methods, and apparatuses for implementing advancements towards annotation efficient deep learning in computer-aided diagnosis
CN116383364A (zh) * 2023-05-26 2023-07-04 华南理工大学 一种基于医生反馈与强化学习的医疗问答回复方法及系统
CN116631562A (zh) * 2023-07-24 2023-08-22 北京惠每云科技有限公司 一种生成电子病历出院记录的方法、装置及电子设备
CN116881413A (zh) * 2023-06-28 2023-10-13 山东新一代信息产业技术研究院有限公司 基于中文医学知识的智能医疗问答方法
CN116910105A (zh) * 2023-09-12 2023-10-20 成都瑞华康源科技有限公司 一种基于预训练大模型的医疗信息查询系统及方法
CN117038095A (zh) * 2023-08-15 2023-11-10 中国科学技术大学 基于向量数据库的麻醉知识检索方法、设备和存储介质
CN117077786A (zh) * 2023-07-07 2023-11-17 南京邮电大学 一种基于知识图谱的数据知识双驱动智能医疗对话系统和方法
CN117094334A (zh) * 2023-08-21 2023-11-21 腾讯科技(深圳)有限公司 基于大型语言模型的数据处理方法、装置和设备
CN117095827A (zh) * 2023-08-15 2023-11-21 中国科学技术大学 麻醉大模型训练方法和设备
CN117151245A (zh) * 2023-09-12 2023-12-01 中国人民解放军国防科技大学 基于通识大模型和迁移学习的私有知识内容生成方法
CN117370525A (zh) * 2023-10-20 2024-01-09 厦门狄耐克物联智慧科技有限公司 一种基于微调大模型的智能导诊方法
US20240020537A1 (en) * 2022-07-15 2024-01-18 Groq, Inc. Methodology to generate efficient models and architectures for deep learning
CN117493504A (zh) * 2023-09-28 2024-02-02 之江实验室 一种基于生成式预训练语言模型的医疗事件抽取方法
CN117497115A (zh) * 2023-10-25 2024-02-02 上海交通大学医学院附属瑞金医院 医疗信息摘要自动生成方法、系统、终端及介质

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160228034A1 (en) * 2011-11-30 2016-08-11 Rush University Medical Center System and methods for identification of implanted medical devices and/or detection of retained surgical foreign objects from medical images
CN110740762A (zh) * 2017-05-30 2020-01-31 株式会社Adeka 移植用脱细胞化材料制造方法及由包含该材料的生物相容性材料组成的移植片组成物
CN110348008A (zh) * 2019-06-17 2019-10-18 五邑大学 基于预训练模型和微调技术的医疗文本命名实体识别方法
WO2021262905A2 (en) * 2020-06-23 2021-12-30 Brainbox Solutions, Inc. Multimodality systems and methods for detection, prognosis, and monitoring of neurological injury and disease
US20220328189A1 (en) * 2021-04-09 2022-10-13 Arizona Board Of Regents On Behalf Of Arizona State University Systems, methods, and apparatuses for implementing advancements towards annotation efficient deep learning in computer-aided diagnosis
US20240020537A1 (en) * 2022-07-15 2024-01-18 Groq, Inc. Methodology to generate efficient models and architectures for deep learning
CN116383364A (zh) * 2023-05-26 2023-07-04 华南理工大学 一种基于医生反馈与强化学习的医疗问答回复方法及系统
CN116881413A (zh) * 2023-06-28 2023-10-13 山东新一代信息产业技术研究院有限公司 基于中文医学知识的智能医疗问答方法
CN117077786A (zh) * 2023-07-07 2023-11-17 南京邮电大学 一种基于知识图谱的数据知识双驱动智能医疗对话系统和方法
CN116631562A (zh) * 2023-07-24 2023-08-22 北京惠每云科技有限公司 一种生成电子病历出院记录的方法、装置及电子设备
CN117095827A (zh) * 2023-08-15 2023-11-21 中国科学技术大学 麻醉大模型训练方法和设备
CN117038095A (zh) * 2023-08-15 2023-11-10 中国科学技术大学 基于向量数据库的麻醉知识检索方法、设备和存储介质
CN117094334A (zh) * 2023-08-21 2023-11-21 腾讯科技(深圳)有限公司 基于大型语言模型的数据处理方法、装置和设备
CN117151245A (zh) * 2023-09-12 2023-12-01 中国人民解放军国防科技大学 基于通识大模型和迁移学习的私有知识内容生成方法
CN116910105A (zh) * 2023-09-12 2023-10-20 成都瑞华康源科技有限公司 一种基于预训练大模型的医疗信息查询系统及方法
CN117493504A (zh) * 2023-09-28 2024-02-02 之江实验室 一种基于生成式预训练语言模型的医疗事件抽取方法
CN117370525A (zh) * 2023-10-20 2024-01-09 厦门狄耐克物联智慧科技有限公司 一种基于微调大模型的智能导诊方法
CN117497115A (zh) * 2023-10-25 2024-02-02 上海交通大学医学院附属瑞金医院 医疗信息摘要自动生成方法、系统、终端及介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DANIEL Y Z LIM 等: "Large language models in anaesthesiology: use of ChatGPT for American Society of Anesthesiologists physical status classification", 《BR J ANAESTH》, vol. 131, no. 03, 30 September 2023 (2023-09-30), pages 73 - 75 *
ZHONGHAI WANG 等: "Towards Training A Chinese Large Language Model for Anesthesiology", 《ARXIV:2403.02742》, 5 March 2024 (2024-03-05), pages 1 - 9 *
姜胜耀 等: "基于大模型的多阶段出院小结质控方法研究", 《中国卫生信息管理杂志》, vol. 20, no. 06, 20 December 2023 (2023-12-20), pages 888 - 896 *
肖仰华 等: "大规模生成式语言模型在医疗领域的应用:机遇与挑战", 《医学信息学杂志》, vol. 44, no. 09, 25 September 2023 (2023-09-25), pages 1 - 11 *
陈依萍 等: "基于大模型的电子病历与CDA标准模式映射方法研究", 《中国卫生信息管理杂志》, vol. 20, no. 06, 20 December 2023 (2023-12-20), pages 867 - 874 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117809798A (zh) * 2024-03-01 2024-04-02 金堂县第一人民医院 基于大模型的检验报告解读方法、系统、设备及介质
CN117809798B (zh) * 2024-03-01 2024-04-26 金堂县第一人民医院 基于大模型的检验报告解读方法、系统、设备及介质

Also Published As

Publication number Publication date
CN117709441B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
CN117709441B (zh) 通过逐步迁移领域训练专业医疗大模型的方法
Xiong et al. Doctorglm: Fine-tuning your chinese doctor is not a herculean task
Ali et al. Performance of ChatGPT and GPT-4 on neurosurgery written board examinations
DE202017106363U1 (de) Neuronale Antwort-auf-Frage-Netze
KR102424085B1 (ko) 기계-보조 대화 시스템 및 의학적 상태 문의 장치 및 방법
CN112016295B (zh) 症状数据处理方法、装置、计算机设备及存储介质
US20220092441A1 (en) Training method and apparatus, dialogue processing method and system, and medium
CN109614480B (zh) 一种基于生成式对抗网络的自动摘要的生成方法及装置
Liu et al. Augmented LSTM framework to construct medical self-diagnosis android
CN117076640A (zh) 一种中文推理任务模型构建方法、装置、设备及介质
Wu et al. A comparative study of open-source large language models, gpt-4 and claude 2: Multiple-choice test taking in nephrology
Lau Language skills in classical chinese text comprehension
Gustilo et al. Explaining L2 Writing performance through a chain of predictors: A SEM approach
Guo et al. Computer-Assisted Interpreting Tools: Status Quo and Future Trends
CN117649949A (zh) 基于强化学习的临床思维数据生成系统及方法
Kinoshita et al. ChatGPT’s performance on JSA-certified anesthesiologist exam
Christop et al. Amusebot: Towards making the most out of a task-oriented dialogue system
Abraham et al. Assessment for learning: a needs analysis study using formative assessment to evaluate the need for curriculum reform in basic sciences
CN115062628A (zh) 一种基于知识图谱的医患交流对话自动模拟方法
DE102023202711A1 (de) System und verfahren mit entitätstypklarstellung für feinkörnigen faktenwissenabruf
Wu et al. A medical diagnostic assistant based on llm
Khandait et al. Automatic question generation through word vector synchronization using lamma
Xia et al. Generating Questions Based on Semi-Automated and End-to-End Neural Network.
Ran et al. Recommendation algorithm based business english writing training strategy
Wang et al. Biomedical Named Entity Recognition Based on MCBERT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant