CN114297374A - 病历分类模型的处理方法、装置、计算机设备及存储介质 - Google Patents

病历分类模型的处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114297374A
CN114297374A CN202110932738.1A CN202110932738A CN114297374A CN 114297374 A CN114297374 A CN 114297374A CN 202110932738 A CN202110932738 A CN 202110932738A CN 114297374 A CN114297374 A CN 114297374A
Authority
CN
China
Prior art keywords
medical record
classification model
sample
category
record classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110932738.1A
Other languages
English (en)
Inventor
安志成
张云燕
杨奕凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110932738.1A priority Critical patent/CN114297374A/zh
Publication of CN114297374A publication Critical patent/CN114297374A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种病历分类模型的处理方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取第一病历分类模型,将属于新增类别的第一样本病历和属于第二类别的第二样本病历构成第一样本病历集,基于第一样本病历集,对第一病历分类模型进行训练;将第一样本病历集中目标数量的第一样本病历,以及第一样本病历集中的第二样本病历,构成第二样本病历集;基于第二样本病历集,对第一病历分类模型再次进行训练。本申请实施例提供了一种病历分类模型的训练方式,基于训练后的病历分类模型对病历进行分类管理。并且,基于该训练方式来训练病历分类模型,提升了第一病历分类模型的准确性。

Description

病历分类模型的处理方法、装置、计算机设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种病历分类模型的处理方法、装置、计算机设备及存储介质。
背景技术
在医疗场景下,病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医疗活动过程的记录。由于病历的数量和种类较多,且随着时间的推移,病历的种类逐渐增多,因此,目前亟需一种管理病历的方式,以此来实现对病历的有效管理。
发明内容
本申请实施例提供了一种病历分类模型的处理方法、装置、计算机设备及存储介质,能够提高病历分类模型的准确性。所述技术方案如下:
一方面,提供了一种病历分类模型的处理方法,所述方法包括:
获取第一病历分类模型,所述第一病历分类模型是对第二病历分类模型进行调整得到的,其中所述第一病历分类模型包含第一类别,所述第二病历分类模型包含第二类别,所述第一类别包括所述第二类别和新增类别;
将属于所述新增类别的第一样本病历和属于所述第二类别的第二样本病历构成第一样本病历集,所述第二样本病历是从训练所述第二病历分类模型的样本病历中选取的,且属于同一种所述第二类别的所述第二样本病历的数量为目标数量;基于所述第一样本病历集,对所述第一病历分类模型进行训练;
将所述第一样本病历集中所述目标数量的所述第一样本病历,以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集;
基于所述第二样本病历集,对所述第一病历分类模型再次进行训练。
在一种可能实现方式中,所述基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练,包括:
基于每个所述第一词语在相同的所述第一类别上的所述样本标签与所述第一预测标签之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述基于所述第一病历分类模型,获取第四样本病历中每个第二词语的第二预测信息,包括:
对于每个所述第二词语,基于所述第一病历分类模型,获取所述第二词语与每种所述第一类别之间的第三相似度;
基于所述第一病历分类模型及每种所述第一类别对应的第三相似度,分别对每个所述第三相似度进行归一化处理,得到所述第二词语的多个所述第二预测标签,将所述多个第二预测标签构成所述第二词语的所述第二预测信息。
在另一种可能实现方式中,所述方法还包括:
创建与基于所述第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型;
对于每个所述第二词语,基于所述第三病历分类模型,获取所述第二词语与每种所述第一类别之间的第四相似度;
所述基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练,包括:
基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,以及每个所述第二词语的第二差异信息,对所述第一病历分类模型进行训练,所述第二差异信息包括多个第二相似度差异,每个所述第二相似度差异包括对应的第二词语在一种所述第一类别上的所述第三相似度与所述第四相似度之间的差异。
在另一种可能实现方式中,所述第一病历分类模型包括所述第一类别的权重特征;所述基于所述第一病历分类模型,获取所述第二词语与每种所述第一类别之间的第三相似度,包括:
基于所述第一病历分类模型,获取所述第二词语的第三词语特征,获取所述第三词语特征与每种所述第一类别的所述权重特征之间的第三相似度。
在另一种可能实现方式中,所述方法还包括:
创建与基于所述第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型;
对于每个所述第二词语,基于所述第三病历分类模型,获取所述第二词语的第四词语特征;
所述基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练,包括:
基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,以及每个所述第二词语的所述第三词语特征与所述第四词语特征之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述基于所述第二样本病历集,对所述第一病历分类模型再次进行训练之后,所述方法还包括:
基于所述第一病历分类模型,获取目标病历包含的每个目标词语所属的第一类别;
基于每个所述目标词语所属的第一类别,确定所述目标病历所属的第一类别。
在另一种可能实现方式中,所述将所述第一样本病历集中所述目标数量的所述第一样本病历,以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集,包括:
获取每个所述第一样本病历的病历特征,以及所述第一样本病历集中所述第一样本病历的特征中心;
基于每个所述第一样本病历的病历特征与所述特征中心之间的距离,从所述第一样本病历集中选取所述目标数量的所述第一样本病历,其中选取的所述第一样本病历对应的距离,小于所述第一样本病历集中其余所述第一样本病历对应的距离;
将选取的所述第一样本病历以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集。
在另一种可能实现方式中,所述获取每个所述第一样本病历的病历特征,以及所述第一样本病历集中所述第一样本病历的特征中心,包括:
对于每个所述第一样本病历,基于所述第一病历分类模型,获取所述第一样本病历中每个第三词语的词语特征;
基于所述第一样本病历中每个所述第三词语的词语特征,获取所述第一样本病历的病历特征;
基于每个所述第一样本病历的病历特征,获取所述特征中心。
另一方面,提供了一种病历分类模型的处理装置,所述装置包括:
获取模块,用于获取第一病历分类模型,所述第一病历分类模型是对第二病历分类模型进行调整得到的,其中所述第一病历分类模型包含第一类别,所述第二病历分类模型包含第二类别,所述第一类别包括所述第二类别和新增类别;
训练模块,用于将属于所述新增类别的第一样本病历和属于所述第二类别的第二样本病历构成第一样本病历集,所述第二样本病历是从训练所述第二病历分类模型的样本病历中选取的,且属于同一种所述第二类别的所述第二样本病历的数量为目标数量;基于所述第一样本病历集,对所述第一病历分类模型进行训练;
构成模块,用于将所述第一样本病历集中所述目标数量的所述第一样本病历,以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集;
所述训练模块,还用于基于所述第二样本病历集,对所述第一病历分类模型再次进行训练。
在一种可能实现方式中,所述第一样本病历集包括每个样本病历包含的每个词语的标注信息,所述标注信息包括多个样本标签,每个样本标签指示对应的词语是否属于一种所述第一类别;所述训练模块,包括:
获取单元,用于基于所述第一病历分类模型,获取第三样本病历中每个第一词语的第一预测信息,所述第一预测信息包括多个第一预测标签,每个所述第一预测标签指示对应的第一词语属于一种所述第一类别的可能性,所述第三样本病历为所述第一样本病历集中的任一样本病历;
训练单元,用于基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述获取单元,用于对于每个所述第一词语,基于所述第一病历分类模型,获取所述第一词语与每种所述第一类别之间的第一相似度;基于所述第一病历分类模型及每种所述第一类别对应的第一相似度,分别对每个所述第一相似度进行归一化处理,得到所述第一词语的多个所述第一预测标签,将所述多个第一预测标签构成所述第一词语的所述第一预测信息。
在另一种可能实现方式中,所述训练单元,用于基于每个所述第一词语在相同的所述第一类别上的所述样本标签与所述第一预测标签之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述获取模块,还用于对于每个所述第一词语,基于所述第二病历分类模型,获取所述第一词语与每种所述第二类别之间的第二相似度;
所述训练单元,用于基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,以及每个所述第一词语的第一差异信息,对所述第一病历分类模型进行训练,所述第一差异信息包括多个第一相似度差异,每个所述第一相似度差异包括对应的第一词语在一种所述第二类别上的所述第一相似度与所述第二相似度之间的差异。
在另一种可能实现方式中,所述第一病历分类模型包括所述第一类别的权重特征;所述获取单元,用于基于所述第一病历分类模型,获取所述第一词语的第一词语特征,获取所述第一词语特征与每种所述第一类别的所述权重特征之间的第一相似度。
在另一种可能实现方式中,所述获取模块,还用于对于每个所述第一词语,基于所述第二病历分类模型,获取所述第一词语的第二词语特征;
所述训练单元,用于基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,以及每个所述第一词语的所述第一词语特征与所述第二词语特征之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述第二样本病历集包括每个样本病历包含的每个词语的标注信息,所述标注信息包括多个样本标签,每个所述样本标签指示对应的词语是否属于一种所述第一类别;所述训练模块,包括:
获取单元,用于基于所述第一病历分类模型,获取第四样本病历中每个第二词语的第二预测信息,所述第二预测信息包括多个第二预测标签,每个所述第二预测标签指示对应的第二词语属于一种所述第一类别的可能性,所述第四样本病历为所述第二样本病历集中的任一样本病历;
训练单元,用于基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述获取单元,用于对于每个所述第二词语,基于所述第一病历分类模型,获取所述第二词语与每种所述第一类别之间的第三相似度;基于所述第一病历分类模型及每种所述第一类别对应的第三相似度,分别对每个所述第三相似度进行归一化处理,得到所述第二词语的多个所述第二预测标签,将所述多个第二预测标签构成所述第二词语的所述第二预测信息。
在另一种可能实现方式中,所述装置还包括:
创建模块,用于创建与基于所述第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型;
所述获取模块,还用于对于每个所述第二词语,基于所述第三病历分类模型,获取所述第二词语与每种所述第一类别之间的第四相似度;
所述训练单元,用于基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,以及每个所述第二词语的第二差异信息,对所述第一病历分类模型进行训练,所述第二差异信息包括多个第二相似度差异,每个所述第二相似度差异包括对应的第二词语在一种所述第一类别上的所述第三相似度与所述第四相似度之间的差异。
在另一种可能实现方式中,所述第一病历分类模型包括所述第一类别的权重特征;所述获取单元,用于基于所述第一病历分类模型,获取所述第二词语的第三词语特征,获取所述第三词语特征与每种所述第一类别的所述权重特征之间的第三相似度。
在另一种可能实现方式中,所述装置还包括:
创建模块,用于创建与基于所述第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型;
所述获取模块,还用于对于每个所述第二词语,基于所述第三病历分类模型,获取所述第二词语的第四词语特征;
所述训练单元,用于基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,以及每个所述第二词语的所述第三词语特征与所述第四词语特征之间的差异,对所述第一病历分类模型进行训练。
在另一种可能实现方式中,所述构成模块,用于获取每个所述第一样本病历的病历特征,以及所述第一样本病历集中所述第一样本病历的特征中心;基于每个所述第一样本病历的病历特征与所述特征中心之间的距离,从所述第一样本病历集中选取所述目标数量的所述第一样本病历,其中选取的所述第一样本病历对应的距离,小于所述第一样本病历集中其余所述第一样本病历对应的距离;将选取的所述第一样本病历以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集。
在另一种可能实现方式中,所述构成模块,用于对于每个所述第一样本病历,基于所述第一病历分类模型,获取所述第一样本病历中每个第三词语的词语特征;基于所述第一样本病历中每个所述第三词语的词语特征,获取所述第一样本病历的病历特征;基于每个所述第一样本病历的病历特征,获取所述特征中心。
在另一种可能实现方式中,所述装置还包括:
所述获取模块,还用于基于所述第一病历分类模型,获取目标病历包含的每个目标词语所属的类别;
确定模块,用于基于每个所述目标词语所属的类别,确定所述目标病历所属的类别。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的病历分类模型的处理方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的病历分类模型的处理方法中所执行的操作。
再一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行所述计算机程序代码,使得所述计算机设备实现如上述方面所述的病历分类模型的处理方法中所执行的操作。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例提供的方法、装置、计算机设备及存储介质,提供了一种病历分类模型的训练方式,基于训练后的病历分类模型对病历进行分类管理。并且,在训练第一病历分类模型的过程中,仅获取之前训练第二病历分类模型的样本病历中的目标数量的第二样本病历即可,基于获取到的第二样本病历及属于新增类别的第一样本病历,对第一病历分类模型进行训练,以提升第一病历分类模型的准确性,无需基于之前训练第二病历分类模型的所有样本病历来训练第一病历分类模型,从而节省了计算量。之后,对第一样本病历集进行调整,以使得到的第二样本病历集中属于不同第一类别的样本病历的数量均衡,基于第二样本病历集对第一病历分类模型再次进行训练,削弱了属于不同第一类别的样本病历的数量差异过大所带来的影响,进一步提升第一病历分类模型的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的结构示意图;
图2是本申请实施例提供的一种病历分类模型的处理方法的流程图;
图3是本申请实施例提供的一种病历分类模型的处理方法的流程图;
图4是本申请实施例提供的一种基于第一样本病历集训练第一病历分类模型的流程图;
图5是本申请实施例提供的一种病历分类模型的处理方法的流程图;
图6是本申请实施例提供的一种病历分类模型的准确率随着类别变化的示意图图;
图7是本申请实施例提供的一种对病历进行分类的流程图;
图8是本申请实施例提供的一种病历分类模型的处理装置的结构示意图;
图9是本申请实施例提供的一种病历分类模型的处理装置的结构示意图;
图10是本申请实施例提供的一种终端的结构示意图;
图11是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请所使用的术语“第一”、“第二”、“第三”、“第四”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,能够将第一相似度称为第二相似度,且类似地,可将第二相似度称为第一相似度。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个样本标签包括3个样本标签,而每个是指这3个样本标签中的每一个样本标签,任一是指这3个样本标签中的任意一个,能够是第一个样本标签,或者是第二个样本标签,或者是第三个样本标签。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
本申请实施例提供的方案,基于人工智能的机器学习技术,能够训练病历分类模型,后续利用训练后的病历分类模型,能够对病历进行分类,从而实现对病历的分类管理。
本申请实施例提供的病历分类模型的处理方法,由计算机设备执行。可选地,该计算机设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链系统。
图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。
服务器102能够基于样本病历训练第一病历分类模型,将训练后的第一病历分类模型进行存储,例如,将训练后的第一病历分类存储在该服务器中或其他设备中,以便后续调用。终端101用于向服务器102发送病历分类请求,服务器102用于接收终端101发送的病历分类请求,基于该第一病历分类模型,对病历分类请求携带的病历进行分类,基于病历所属的类别对病历进行管理。
图2是本申请实施例提供的一种病历分类模型的处理方法的流程图,该方法由计算机设备执行,如图2所示,该方法包括:
201、计算机设备获取第一病历分类模型,该第一病历分类模型是对第二病历分类模型进行调整得到的。
其中第一病历分类模型包含第一类别,也即是利用第一病历分类模型,能够将病历划分成多个第一类别。第二病历分类模型包含第二类别,也即是利用第二病历分类模型,能够将病历划分成多个第二类别。而且,第一类别包括第二类别和新增类别,第二类别与新增类别不同,也即是第一病历分类模型可划分的类别,比第二病历分类模型可划分的类别要多。
第一类别用于指示病历所属的类别,例如,第一类别包括消化内科类别、呼吸科类别、神经内科类别等,第二类别包括消化内科类、呼吸科类别等,新增类别为神经内科类别。在本申请实施例中,第二病历分类模型为当前已训练完成的模型,用于对病历进行分类。该第二病历分类模型包含第二类别,基于该第二病历分类模型能够对任一病历进行分类,以确定该病历所属的第二类别。第一病历分类模型为当前待训练的模型,该第一病历分类模型是对第二病历分类模型进行调整得到的,即该第一病历分类模型是在第二病历分类模型的基础上,对第二病历分类模型增加该新增类别得到的,后续基于训练后的第一病历分类模型能够对任一病历进行分类,以确定该病历所属的第一类别。
202、计算机设备将属于新增类别的第一样本病历和属于第二类别的第二样本病历构成第一样本病历集,第二样本病历是从训练第二病历分类模型的样本病历中选取的,且属于同一种第二类别的第二样本病历的数量为目标数量;基于第一样本病历集,对第一病历分类模型进行训练。
在本申请实施例中,第二病历分类模型是基于属于第二类别的样本病历训练得到的,从训练第二病历分类模型的样本病历中,选取属于每种第二类别的目标数量的第二样本病历,将选取的第二样本病历与属于新增类别的第一样本病历构成第一样本病历集,以使第一样本病历集包括属于每种第一类别的样本病历,以便后续基于第一样本病历集对第一病历分类模型进行训练。
通过第一样本病历集对第一病历分类模型进行训练,以使训练后的第一病历分类模型能够增强对不同第一类别的区分能力,使得训练后的第一病历分类模型能够确定病历所属的第一类别,从而保证训练后的第一病历分类模型的准确性。
203、计算机设备将第一样本病历集中目标数量的第一样本病历,以及第一样本病历集中的第二样本病历,构成第二样本病历集。
在本申请实施例中,由于第一样本病历集中属于不同第一类别的样本病历的数量之间可能存在差异,基于第一样本病历集训练后的第一病历分类模型的准确性可能较差,例如,第一样本病历集中属于新增类别的第一样本病历的数量大于目标数量,由于第一样本病历集中的样本病历的数量不均衡,可能会导致第一病历分类模型的准确性低,因此,对第一样本病历集进行调整,以使得到的第二样本病历集中属于不同的第一类别的样本病历的数量相等,即第二样本病历集中属于不同第一类别的样本病历的数量均衡。
204、计算机设备基于第二样本病历集,对第一病历分类模型再次进行训练。
由于第二样本病历集中属于不同第一类别的样本病历的数量均衡,基于第二样本病历集对第一病历分类模型再次进行训练,以削弱由于样本病历的数量不均衡而带来的影响,使得第一病历分类模型在对病历进行分类时,将该病历分配给任一种第一类别的可能性均衡,从而提升第一病历分类模型的准确性。
本申请实施例提供的方法,提供了一种病历分类模型的训练方式,基于训练后的病历分类模型对病历进行分类管理。并且,在训练第一病历分类模型的过程中,仅获取之前训练第二病历分类模型的样本病历中的目标数量的第二样本病历即可,基于获取到的第二样本病历及属于新增类别的第一样本病历,对第一病历分类模型进行训练,以提升第一病历分类模型的准确性,无需基于之前训练第二病历分类模型的所有样本病历来训练第一病历分类模型,从而节省了计算量。之后,对第一样本病历集进行调整,以使得到的第二样本病历集中属于不同第一类别的样本病历的数量均衡,基于第二样本病历集对第一病历分类模型再次进行训练,削弱了属于不同第一类别的样本病历的数量差异过大所带来的影响,进一步提升第一病历分类模型的准确性。
在图2所示实施例的基础上,在第一病历分类模型的两个训练阶段中,分别获取词语的相似度差异,结合词语的预测信息与标注信息之间的差异,以及能够表示相似度差异的差异信息进行训练,训练过程详见下述实施例。
图3是本申请实施例提供的一种病历分类模型的处理方法的流程图,该方法由计算机设备执行,如图3所示,该方法包括:
301、计算机设备获取第一病历分类模型,第一病历分类模型是对第二病历分类模型进行调整得到的,其中第一病历分类模型包含第一类别,第二病历分类模型包含第二类别,第一类别包括第二类别和新增类别。
在本申请实施例中,第二病历分类模型为已训练完成的模型,该第二病历分类模型包含第二类别,第一病历分类模型为当前待训练的模型,该第二病历分类模型包含第一类别,第一类别包括第二类别和新增类别,即对已训练完成的第二病历分类模型进行调整,在第二病历分类模型中增加该新增类别,得到该第一病历分类模型。
在一种可能实现方式中,病历用于描述患者的症状、病程发展、治疗过程等。在本申请实施例中,属于不同第一类别的病历所描述的症状、疾病、治疗过程不同。例如,多个第一类别包括:消化内科类别、呼吸科类别、神经内科类别等,属于消化内科类别的病历所描述的症状,与属于呼吸科类别的病历所描述的症状不同。
在一种可能实现方式中,第一病历分类模型包括每种第一类别的权重特征,第二病历分类模型包括每种第二类别的权重特征。
由于该第一病历分类模型是对第二病历分类模型进行调整得到的,在第一病历分类模型中,任一第二类别在第一病历分类模型中对应的权重特征,与该第二类别在第二病历分类模型中对应的权重特征相同。即在对第二病历分类模型进行调整时,仅是在第二病历分类模型中增加该新增类别,并为该新增类别确定权重特征,该第二病历分类模型中每种第二类别的权重特征保持不变,调整后即可得到第一病历分类模型。之后,基于样本病历集对第一病历分类模型进行训练,以调整每种第一类别的权重特征或者第一病历分类模型中的其他模型参数。
302、计算机设备将属于新增类别的第一样本病历和属于第二类别的第二样本病历构成第一样本病历集,第二样本病历是从训练第二病历分类模型的样本病历中选取的,且属于同一种第二类别的第二样本病历的数量为目标数量。
其中,目标数量为任意的数量。在第一样本病历集中,属于新增类别的第一样本病历的数量与目标数量可能不同。
在本申请实施例中,第一样本病历集中的每个样本病历包含词语,第一样本病历集包括每个样本病历包含的每个词语的标注信息,标注信息包括多个样本标签,每个样本标签指示对应的词语是否属于一种第一类别。例如,对于任一样本病历,该样本病历包括5个词语,该第一病历分类模型包括4种第一类别,即每个词语的标注信息包括4个样本标签,第一个样本标签指示对应的词语是否属于第一种类别,第二个样本标签指示对应的词语是否属于第二种类别,以此类推,基于该词语的标注信息对应的多个样本标签,即可确定该词语是否属于每种第一类别。可选地,每个词语的标注信息是由人工标注得到的。
在一种可能实现方式中,该步骤302包括:获取属于新增类别的第一样本病历,从目标存储区中获取存储的属于第二类别的第二样本病历,将获取到的第一样本病历及第二样本病历,构成第一样本病历集。
其中,目标存储区用于存储训练病历分类模型的样本病历,例如,该目标存储区为病历分类模型的记忆区。在目标存储区中存储有之前训练病历分类模型时所用到的样本病历,且目标存储区中存储的属于每种类别的样本病历的数量均为目标数量。在本申请实施例中,在训练一个新的病历分类模型后,将训练新的病历分类模型的样本病历存储于该目标存储区中,以便后续基于目标存储区中存储的样本病历,再训练其他的病历分类模型。
例如,在训练第一个病历分类模型后,从训练第一个病历分类模型的样本病历中,选取属于每种类别的目标数量的样本病历存储在该目标存储区中;之后,如果需要为第一个病历分类模型新增一个类别,则对第一个病历分类模型进行调整得到第二个病历分类模型,基于目标存储区中存储的样本病历及属于新增类别的样本病历对第二个病历分类模型进行训练,之后,将属于新增类别的目标数量的样本病历存储到目标存储区中,以此类别,在病历分类模型中增添类别后,基于目标存储区中存储的样本病历及属于新增类别的样本病历,对增添类别后的病历分类模型进行训练,之后,在将属于新增类别的目标数量的样本病历存储到目标存储区中。
303、计算机设备对于第三样本病历中每个第一词语,基于第一病历分类模型,获取第一词语与每种第一类别之间的第一相似度。
其中,第三样本病历为第一样本病历集中的任一样本病历,该第三样本病历包括至少一个第一词语,第一词语与任一种第一类别之间的第一相似度用于表示第一词语与第一类别之间的相似程度,能够体现出该第一词语属于该第一类别的可能性。
对于第三样本病历中的任一词语,将该词语输入至该第一病历分类模型,得到该第一词语与每种第一类别之间的第一相似度,按照上述方式,将第三样本病历中的每个第一词语输入该第一病历分类模型,即可得到第三样本病历中的每个第一词语与每种第一类别之间的第一相似度。
在一种可能实现方式中,第一病历分类模型包括每种第一类别的权重特征,该步骤303包括:对于每个第一词语,基于第一病历分类模型,对第一词语进行特征提取,得到该第一词语的词语特征,获取该词语特征与每种第一类别的权重特征之间的第一相似度。
其中,获取词语特征与每种第一类别的权重特征之间的第一相似度时,能够采用余弦相似度,或其他相似度等。
可选地,获取第一词语的词语特征的过程,包括:基于第一病历分类模型中的特征提取子模型,对第一词语进行特征提取,得到该第一词语的词语特征。其中,该特征提取子模型用于提取词语的词语特征,例如,该特征提取子模型为BERT((Bidirectional EncoderRepresentations from Transformers,一种语言表示模型)或其他网络模型。
可选地,基于第一病历分类模型获取该词语特征与每种第一类别的权重特征之间的第一相似度的过程,包括:基于第一病历分类模型,分别对第一词语的词语特征及每种第一类别的权重特征进行正则化处理,得到处理后的词语特征及每种第一类别处理后的权重特征,获取处理后的词语特征与每种第一类别处理后的权重特征之间的第一相似度。
其中,对权重特征或词语特征进行正则化处理时,采用二范数或其他方式进行正则化处理。通过对词语特征及权重特征进行正则化处理,以避免后续训练第一病历分类模型出现过拟合的情况,从而保证后续训练的第一病历分类模型的准确性。
可选地,基于第一病历分类模型中的余弦正则化线性层,分别对第一词语的词语特征及每种第一类别的权重特征进行正则化处理,得到处理后的词语特征及每种第一类别处理后的权重特征。
例如,词语特征为词语特征向量,获取该词语特征向量的向量长度,确定词语特征向量中的每个特征值与该向量长度的比值,将得到的多个比值构成该词语特征向量正则化处理后的词语特征向量。
可选地,对词语特征向量进行正则化处理的过程,满足以下关系:
Figure BDA0003211653700000151
其中,v表示任一第一词语的词语特征向量,
Figure BDA0003211653700000161
表示正则化处理后的词语特征向量。
304、计算机设备基于第一病历分类模型及每种第一类别对应的第一相似度,分别对每个第一相似度进行归一化处理,得到第一词语的多个第一预测标签,将多个第一预测标签构成第一词语的第一预测信息。
其中,每个第一预测标签指示对应的第一词语属于一种第一类别的可能性。在确定第一词语与每种第一类别之间的第一相似度后,通过对每种第一类别对应的第一相似度进行归一化处理,即可得到第一词语的第一预测信息,按照上述步骤303-304,即可获取到第三样本病历中的每个第一词语的第一预测信息。通过获取第一词语与每种第一类别之间的第一相似度,并对第一词语与每种第一类别之间的第一相似度进行归一化处理,以保证后续基于第一预测标签来训练第一病历分类模型时,使得第一病历分类模型区域收敛,从而保证训练的第一病历分类模型的准确性。
在一种可能实现方式中,第一预测标签为第一预测概率,该步骤304包括:基于第一病历分类模型、每种第一类别对应的第一相似度及调整参数,分别对每个第一相似度进行归一化处理,得到第一词语的多个第一预测概率。
其中,第一病历分类模型包括该调整参数,该调整参数用于调整多个第一预测概率的分布情况。在获取第一词语的第一预测概率时,通过引入调整参数,能够调整第一预测概率的分布情况,以保证得到的第一预测概率的准确性。
在一种可能实现方式中,第一预测标签为第一预测概率,该步骤304满足以下关系:
Figure BDA0003211653700000162
其中,x表示第三样本病历中的任一第一词语,i表示第一病历分类模型包含的第一类别的序号,pi(x)表示即为第i种第一类别对应的第一预测标签,也即是第一词语x属于第i种第一类别的概率,η表示调整参数,θi表示第i种第一类别的权重特征;f(x)表示第一词语x的词语特征;
Figure BDA0003211653700000163
表示第i种第一类别正则化处理后的权重特征,
Figure BDA0003211653700000164
表示正则化处理后的第一词语x的词语特征,
Figure BDA0003211653700000165
表示第一词语x与第i种第一类别之间的第一相似度;exp(·)标识e的幂函数;j为第一病历分类模型包含的第一类别的序号。
需要说明的是,本申请实施例是以第一词语与每种第一类别之间的第一相似度来获取第一词语的第一预测信息的,而在另一实施例中,无需执行步骤303-304,能够采取其他方式,基于第一病历分类模型,获取第三样本病历中每个第一词语的第一预测信息。
305、计算机设备对于每个第一词语,基于第二病历分类模型,获取第一词语与每种第二类别之间的第二相似度。
其中,第一词语与任一种第二类别之间的第二相似度用于表示第一词语与第二类别之间的相似程度,能够体现出该第一词语属于该第二类别的可能性。该步骤与上述步骤303同理,在此不再赘述。
306、计算机设备基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一差异信息,对第一病历分类模型进行训练,第一差异信息包括多个第一相似度差异,每个第一相似度差异包括对应的第一词语在一种第二类别上的第一相似度与第二相似度之间的差异。
在本申请实施例中,对于第三样本病历中的每个第一词语,该第一词语对应有第一预测信息及标注信息,该第一预测信息是基于第一病历分类模型预测到的,该标注信息是标注得到的,该第一词语的第一预测信息与该第一词语的标注信息之间的差异,能够反映出第一病历分类模型的准确性。
对于第三样本病历中的任一第一词语,基于第一病历分类模型能够确定出该第一词语与每种第一类别之间的相似度,第一类别包括第二类别和新增类别,因此,从第一词语与每种第一类别之间的相似度中,能够确定出第一词语与每种第二类别之间的第一相似度,基于第二病历分类模型能够确定出该第一词语与每种第二类别之间的第二相似度,在相同的任一第二类别上,该第一词语对应的第一相似度与第二相似度之间的差异,即为一个第一相似度差异,基于该第一词语在多个第二类别上的第一相似度和第二相似度,即可确定多个第一相似度差异,构成该第一词语的第一差异信息。按照上述方式,即可得到第三样本病历中每个第一词语的第一差异信息。
由于每个第一相似度差异能够反映出第一病历分类模型与第二病历分类模型之间的差异,基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一差异信息,对第一病历分类模型进行训练,既考虑到了当前第一病历分类模型的准确性,也能够保证第一病历分类模型保留第二病历分类模型的分类能力,即保留了第一病历分类模型在第二类别上的分类能力,从而提升了第一病历分类模型的准确性。
在一种可能实现方式中,该步骤306包括:基于每个第一词语在相同的第一类别上的样本标签与第一预测标签之间的差异,以及每个第一词语的第一差异信息,对第一病历分类模型进行训练。
在本申请实施例中,对于任一第一词语,该第一词语的第一预测信息包括多个第一预测标签,该第一词语的标注信息包括多个标注标签,在确定第一词语的第一预测信息与标注信息之间的差异时,确定该第一词语的第一预测信息与标注信息中,相同的第一类别上的样本标签与预测标签之间的差异,即能够确定多个差异,该第一词语对应有多个差异,将每个词语对应的多个差异,及每个第一词语的第一差异信息,对第一病历分类模型进行训练,以提升第一病历分类模型的准确性。
在一种可能实现方式中,该步骤306包括:基于每个第一词语的第一预测信息与标注信息之间的差异,确定第一损失值,基于每个第一词语的第一差异信息,确定第二损失值,基于第一损失值与第二损失值之和,对第一病历分类模型进行训练。
在本申请实施例中,第一损失值相当于分类交叉熵损失,第二损失值相当于模型蒸馏损失,基于该模型蒸馏损失训练第一病历分类模型,使得第一病历分类模型能够保留第二病历分类模型对第二类别的分类能力,即保留原来的第二病历分类模型的知识的作用,即实现了对第二病历分类模型进行蒸馏的效果。
可选地,第一损失值、第二损失值、第一损失值与第二损失值之和满足以下关系:
Figure BDA0003211653700000181
Figure BDA0003211653700000182
L1=Lce(x1)+Ldis(x1)
其中,x1表示第三样本病历中的任一第一词语;Lce(x1)表示第一损失值;i表示第一病历分类模型包含的第一类别的序号;yi表示第一词语x1在第i种类别上的样本标签,pi表示第一词语x1在第i种类别上的预测标签,J表示第一病历分类模型包含的第一类别的总数;Ldis(x1)表示第二损失值;
Figure BDA0003211653700000183
表示对第一病历分类模型中第j种第二类别的权重特征进行正则化处理后的权重特征,
Figure BDA0003211653700000191
表示对基于第一病历分类模型获取到的第一词语x1的词语特征进行正则化处理后的词语特征,
Figure BDA0003211653700000192
表示第一词语x1与第j种第二类别之间的第一相似度;
Figure BDA0003211653700000193
表示对第二病历分类模型中第j种第二类别的权重特征进行正则化处理后的权重特征,
Figure BDA0003211653700000194
表示对基于第二病历分类模型获取到的第一词语x1的词语特征进行正则化处理后的词语特征,
Figure BDA0003211653700000195
表示第一词语x1与第j种第二类别之间的第二相似度;J0表示第二病历分类模型包含的第二类别的总数;L1表示第一损失值Lce(x1)与第二损失值Ldis(x1)之和。
如图4所示,基于第一样本病历集对第一病历分类模型进行训练的过程中,第一样本病历集中的第二样本病历是从目标存储区中获取到的,获取到的第二样本病历即为记忆的样本病历。对于第一样本病历集中的第三样本病历,基于该第二病历分类模型401,对第三样本病历中的第一词语进行特征提取,得到每个第一词语的词语特征,基于第二病历分类模型401中的余弦正则化线性层,获取正则化处理后的词语特征及每个第二类别的权重特征,获取每种第二类别对应的第二相似度。基于该第一病历分类模型402,对第三样本病历中的第一词语进行特征提取,得到每个第一词语的词语特征,基于第一病历分类模型402中的余弦正则化线性层,获取正则化处理后的词语特征及每个第二类别的权重特征,获取每种第二类别对应的第一相似度,并获取每个第一词语的第一预测信息,该第一预测信息包括多个第一预测概率,每个第一预测概率指示对应的第一词语属于一种第一类别的可能性;基于每个第一词语在同一第二类别上的第一相似度与第二相似度,确定模型蒸馏损失,基于每个第一词语的第一预测信息与标注信息之间的差异,确定分类交叉熵损失,基于模型蒸馏损失及分类交叉熵损失来训练第一病历分类模型402。
需要说明的是,本申请实施例仅是以第一样本病历集中的一个第三样本病历为例来说明的,而在另一实施例中,基于一个第三样本病历来训练第一病历分类模型的过程为一次迭代,基于第一样本病历集中的多个第三样本病历,对第一病历分类模型进行多次迭代训练。
需要说明的是,本申请实施例是利用第二病历分类模型来对第一病历分类模型进行训练的,而在另一实施例中,无需执行步骤305-306,能够采取其他方式,基于每个第一词语的第一预测信息与标注信息之间的差异,对第一病历分类模型进行训练。
需要说明的是,本申请实施例是先获取每个第一词语的第一预测信息,并利用第二病历分类模型来获取每个第一词语的第一差异信息,基于第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一差异信息来对第一病历分类模型进行训练的,而在另一实施例中,无需执行步骤303-306,能够采取其他方式,基于第一样本病历集,对第一病历分类模型进行训练。
307、计算机设备将第一样本病历集中目标数量的第一样本病历,以及第一样本病历集中的第二样本病历,构成第二样本病历集。
在本申请实施例中,第二样本病历集包括每个样本病历包含的每个词语的标注信息,标注信息包括多个样本标签,每个样本标签指示对应的词语是否属于一种第一类别。
在一种可能实现方式中,在步骤306之后,该方法还包括:将第一样本病历集中目标数量的第一样本病历存储于目标存储区中,将目标存储区中存储的样本病历构成第二样本病历集。
其中,目标存储区中存储的属于不同类别的样本病历的数量均为目标数量。在本申请实施例中,再将第一样本病历存储于该目标存储区之前,该目标存储区包括属于每种第二类别的第二样本病历,且属于同一种第二类别的第二样本病历的目标数量为目标数量,在将目标数量的第一样本病历存储于目标存储区后,该目标存储区包括每种第一类别的样本病历,且属于同一种第一类别的样本病历的目标数量为目标数量。
在一种可能实现方式中,该步骤307包括以下两种方式:
第一种方式:计算机设备从第一样本病历集中随机选取目标数量的第一样本病历,将选取的第一样本病历,以及第一样本病历集中的第二样本病历,构成第二样本病历集。
第二种方式包括以下步骤1-步骤3:
步骤1、计算机设备获取每个第一样本病历的病历特征,以及第一样本病历集中第一样本病历的特征中心。
其中,病历特征用于表征对应的样本病历,特征中心为第一样本病历集中多个第一样本病历的病历特征的特征中心,该特征中心能够表示属于该新增类别的样本病历所共有的特征。例如,第一样本病历的病历特征以特征向量的形式表示,该特征中心也以特征向量的形式表示。
在一种可能实现方式中,步骤1包括:对于每个第一样本病历,基于第一病历分类模型,获取该第一样本病历中每个第三词语的词语特征,基于该第一样本病历中每个第三词语的词语特征,获取第一样本病历的病历特征,基于第一样本病历集中多个第一样本病历的病历特征,获取该特征中心。
其中,第三词语的词语特征用于表征第三词语。获取第一样本病历的病历特征的方式包括:将第一样本病历中每个第三词语的词语特征之和,确定为第一样本病历的病历特征;或者,将第一样本病历中的第三词语的词语特征的平均词语特征,确定为第一样本病历的病历特征。基于每个第一样本病历的病历特征来获取特征中心的方式包括:将第一样本病历集中每个第一样本病历的病历特征之和,确定为特征中心;或者,将第一样本病历集中多个第一样本病历的病历特征的平均病历特征,确定为第一样本病历的病历特征。
步骤2、计算机设备基于每个第一样本病历的病历特征与特征中心之间的距离,从第一样本病历集中选取目标数量的第一样本病历,其中选取的第一样本病历对应的距离,小于第一样本病历集中其余第一样本病历对应的距离。
其中,任一第一样本病历的病历特征与特征中心之间的距离,能够反映出该第一样本病历符合该新增类别的程度,距离越大,表示对应的第一样本病历越不符合该新增类别,距离度越小,表示对应的第一样本病历越符合该新增类别。在确定第一样本病历集中所有第一样本病历对应的特征中心后,基于每个第一样本病历的病历特征与特征中心之间的距离,能够从第一样本病历集中选取出最能代表新增类别的样本病历。
步骤3、计算机设备将选取的第一样本病历以及第一样本病历集中的第二样本病历,构成第二样本病历集。
通过从第一样本病历集中选取最能代表新增类别的目标数量的第一样本病历,将选取的第一样本病历以及第一样本病历集中的第二样本病历,构成第二样本病历集,使得第二样本病历集中的每个样本病历能够代表对应的类别,以保证第二样本病历集中的样本病历的准确性。
308、计算机设备对于第四样本病历中每个第二词语,基于第一病历分类模型,获取第二词语与每种第一类别之间的第三相似度。
其中,第四样本病历为第二样本病历集中的任一样本病历,该第四样本病历包括至少一个第二词语,第二词语与任一种第一类别之间的第一相似度用于表示第二词语与第一类别之间的相似程度,能够体现出该第二词语属于该第一类别的可能性。该步骤与上述步骤303同理,在此不再赘述。
309、计算机设备基于第一病历分类模型及每种第一类别对应的第三相似度,分别对每个第三相似度进行归一化处理,得到第二词语的多个第二预测标签,将多个第二预测标签构成第二词语的第二预测信息。
其中,每个第二预测标签指示对应的第二词语属于一种第一类别的可能性。该步骤与上述步骤304同理,在此不再赘述。
需要说明的是,本申请实施例是以第二词语与每种第一类别之间的第三相似度来获取第二词语的第二预测信息的,进行说明的,而在另一实施例中,无需执行步骤308-309,能够采取其他方式,基于第一病历分类模型,获取第四样本病历中每个第二词语的第二预测信息。
310、计算机设备创建与基于第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型。
在本申请实施例中,创建的第三病历分类模型,与基于第一样本病历集训练后的第一病历分类模型相同,之后,利用第三病历模型对第一病历分类模型进行再次训练,且在训练第一病历分类模型的过程中,第三病历分类模型保持不变。
311、计算机设备对于每个第二词语,基于第三病历分类模型,获取第二词语与每种第一类别之间的第四相似度。
该步骤与上述步骤303同理,在此不再赘述。
312、计算机设备基于每个第二词语的第二预测信息与标注信息之间的差异,以及每个第二词语的第二差异信息,对第一病历分类模型进行训练,第二差异信息包括多个第二相似度差异,每个第二相似度差异包括对应的第二词语在一种第一类别上的第三相似度与第四相似度之间的差异。
在一种可能实现方式中,该步骤312包括:基于每个第二词语的第二预测信息与标注信息之间的差异,确定第三损失值,基于每个第二词语的第二差异信息,确定第四损失值,基于第三损失值与第四损失值之和,对第一病历分类模型进行训练。
可选地,第三损失值、第四损失值、第三损失值与第四损失值之和满足以下关系:
Figure BDA0003211653700000231
Figure BDA0003211653700000232
L2=Lce(x2)+Ldis(x2)
其中,x2表示第四样本病历中的任一第二词语;Lce(x2)表示第三损失值;i表示第一病历分类模型包含的第一类别的序号;yi表示第二词语x2在第i种类别上的样本标签,pi表示第二词语x2在第i种类别上的预测标签,J表示第一病历分类模型包含的第一类别的总数;Ldis(x2)表示第四损失值;
Figure BDA0003211653700000233
表示对第一病历分类模型中第j种第一类别的权重特征进行正则化处理后的权重特征,
Figure BDA0003211653700000234
表示对基于第一病历分类模型获取到的第二词语x2的词语特征进行正则化处理后的词语特征,
Figure BDA0003211653700000235
表示第二词语x2与第j种第一类别之间的第三相似度;
Figure BDA0003211653700000236
表示对第三病历分类模型中第j种第一类别的权重特征进行正则化处理后的权重特征,
Figure BDA0003211653700000237
表示对基于第三病历分类模型获取到的第二词语x2的词语特征进行正则化处理后的词语特征;
Figure BDA0003211653700000238
表示第二词语x2与第j种第一类别之间的第四相似度;L2表示第三损失值Lce(x2)与第四损失值Ldis(x2)之和。
在本申请实施例中,基于第一病历集对第一病历分类模型训练的过程,为第一个训练阶段,基于第二样本病历集对第一病历分类模型再次训练的过程,为第二个训练阶段。为了减小第二个训练阶段对第一个训练阶段训练后的第一病历分类模型产生的影响,在第二个训练阶段的过程中,在确定第三损失值和第四损失值时,采用较小的学习率,以达到对第一病理分类模型进行微调的效果,从而保证第一病历分类模型的准确性。
需要说明的是,本申请实施例仅是以第二样本病历集中的一个第四样本病历为例来说明的,而在另一实施例中,基于一个第四样本病历来训练第一病历分类模型的过程为一次迭代,基于第二样本病历集中的多个第四样本病历,对第一病历分类模型进行多次迭代训练。
需要说明的是,本申请实施例是利用第三病历分类模型来对第一病历分类模型进行训练的,而在另一实施例中,无需执行步骤310-312,能够采取其他方式,基于每个第二词语的第二预测信息与标注信息之间的差异,对第一病历分类模型进行训练。
需要说明的是,本申请实施例是先获取每个第二词语的第二预测信息,并利用第三病历分类模型来获取每个第二词语的第二差异信息,基于第二词语的第二预测信息与标注信息之间的差异,以及每个第二词语的第二差异信息来对第一病历分类模型进行训练的,而在另一实施例中,无需执行步骤308-312,能够采取其他方式,基于第二样本病历集,对第一病历分类模型再次进行训练。
本申请实施例提供的方法,提供了一种病历分类模型的训练方式,基于训练后的病历分类模型对病历进行分类管理。并且,在训练第一病历分类模型的过程中,仅获取之前训练第二病历分类模型的样本病历中的目标数量的第二样本病历即可,基于获取到的第二样本病历及属于新增类别的第一样本病历,对第一病历分类模型进行训练,以提升第一病历分类模型的准确性,无需基于之前训练第二病历分类模型的所有样本病历来训练第一病历分类模型,从而节省了计算量。之后,对第一样本病历集进行调整,以使得到的第二样本病历集中属于不同第一类别的样本病历的数量均衡,基于第二样本病历集对第一病历分类模型再次进行训练,削弱了属于不同第一类别的样本病历的数量差异过大所带来的影响,进一步提升第一病历分类模型的准确性。
并且,在对第一病历分类模型的第一训练阶段,无需利用训练之前训练第二病历分类模型的所有样本病历来训练第一病历分类模型,从而减少了训练第一病历分类模型过程中的计算量。
并且,在第一病历分类模型的两个训练阶段,分别第二病历分类模型或第三病历分类模型来确定相似度差异,以确定的相似度差异来训练第一病历分类模型,即训练第一病历分类模型的过程中考虑到模型蒸馏损失,使训练的第一病历分类模型保留之前模型已具备的分类能力,并且在此基础上,进一步提升第一病历分类模型的准确性。
并且,在本申请实施例中,在训练一个新的病历分类模型后,将训练新的病历分类模型的样本病历存储于该目标存储区中,以便后续基于目标存储区中存储的样本病历,再训练其他的病历分类模型,并且,目标存储区中存储的属于每种类别的样本病历的数量均为目标数量,无需将之前训练病历分类模型的所有样本病历进行存储,从而节省了存储资源。
在图2所示实施例的基础上,在第一病历分类模型的两个训练阶段中,分别获取词语的词语特征之间的差异,结合词语的预测信息与标注信息之间的差异,以及词语的词语特征之间的差异进行训练,训练过程详见下述实施例。
图5是本申请实施例提供的一种病历分类模型的处理方法的流程图,由计算机设备执行,如图5所示,该方法包括:
501、计算机设备获取第一病历分类模型,第一病历分类模型是对第二病历分类模型进行调整得到的,其中第一病历分类模型包含第一类别,第二病历分类模型包含第二类别,第一类别包括第二类别和新增类别。
该步骤与上述步骤301同理,在此不再赘述。
502、计算机设备将属于新增类别的第一样本病历和属于第二类别的第二样本病历构成第一样本病历集,第二样本病历是从训练第二病历分类模型的样本病历中选取的,且属于同一种第二类别的第二样本病历的数量为目标数量。
该步骤与上述步骤302同理,在此不再赘述。
503、计算机设备对于第三样本病历中每个第一词语,基于第一病历分类模型,获取第一词语的第一词语特征,获取第一词语特征与每种第一类别的权重特征之间的第一相似度。
其中,第一词语特征用于表征对应的第一词语,第一病历分类模型包括第一类别的权重特征,第一词语特征及第一权重特征均能够以任意的形式表示,例如,权重特征以向量的形式表示。第一词语特征与任一种第一类别的权重特征之间的第一相似度用于表示第一词语与第一类别之间的相似程度,能够体现出该第一词语属于该第一类别的可能性。
在一种可能实现方式中,获取第一词语特征的过程,包括:基于第一病历分类模型中的特征提取子模型,对第一词语进行特征提取,得到该第一词语的词语特征。
在一种可能实现方式中,基于第一病历分类模型获取该词语特征与每种第一类别的权重特征之间的第一相似度的过程,包括:基于第一病历分类模型,分别对第一词语的词语特征及每种第一类别的权重特征进行正则化处理,得到处理后的词语特征及每种第一类别处理后的权重特征,获取处理后的词语特征与每种第一类别处理后的权重特征之间的第一相似度。
需要说明的是,本申请实施例是基于第一词语的词语特征与第一类别的权重特征来获取第一相似度的,而在另一实施例中,无需执行步骤503,能够采取其他方式,基于第一病历分类模型,获取第一词语与每种第一类别之间的第一相似度。
504、计算机设备基于第一病历分类模型及每种第一类别对应的第一相似度,分别对每个第一相似度进行归一化处理,得到第一词语的多个第一预测标签,将多个第一预测标签构成第一词语的第一预测信息。
其中,第一预测信息包括多个第一预测标签,每个第一预测标签指示对应的第一词语属于一种第一类别的可能性,第三样本病历为第一样本病历集中的任一样本病历。该步骤与上述步骤304同理,在此不再赘述。
需要说明的是,本申请实施例是以第一词语与每种第一类别之间的第一相似度来获取第一词语的第一预测信息的,,而在另一实施例中,无需执行步骤503-504,能够采取其他方式,基于第一病历分类模型,获取第三样本病历中每个第一词语的第一预测信息。
505、计算机设备对于每个第一词语,基于第二病历分类模型,获取第一词语的第二词语特征。
其中,第二词语特征用于表征第一词语。该步骤与上述步骤503同理,在此不再赘述。
506、计算机设备基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一词语特征与第二词语特征之间的差异,对第一病历分类模型进行训练。
其中,对于任一第一词语,该第一词语的第一词语特征与第二词语特征之间的差异,能够反映出第一病历分类模型与第二病历分类模型之间的差异。
基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一词语特征与第二词语特征之间的差异,对第一病历分类模型进行训练,既考虑到了当前第一病历分类模型的准确性,也能够保证第一病历分类模型保留第二病历分类模型的分类能力,即保留了第一病历分类模型在第二类别上的分类能力,从而提升了第一病历分类模型的准确性。
需要说明的是,本申请实施例是利用第二病历分类模型来对第一病历分类模型进行训练的,而在另一实施例中,无需执行步骤505-506,能够采取其他方式,基于每个第一词语的第一预测信息与标注信息之间的差异,对第一病历分类模型进行训练。
需要说明的是,本申请实施例是基于第一病历分类模型,先获取每个第一词语的第一词语特征,再获取每个第一词语的第一预测信息,并利用第二病历分类模型来获取每个第一词语的第二词语特征,基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一词语特征与第二词语特征之间的差异,对第一病历分类模型进行训练,而在另一实施例中,无需执行步骤503-506,能够采取其他方式,基于第一样本病历集,对第一病历分类模型进行训练。
507、计算机设备将第一样本病历集中目标数量的第一样本病历,以及第一样本病历集中的第二样本病历,构成第二样本病历集。
该步骤与上述步骤307同理,在此不再赘述。
508、计算机设备对于第四样本病历中每个第二词语,基于第一病历分类模型,获取第二词语的第三词语特征,获取第三词语特征与每种第一类别的权重特征之间的第三相似度。
其中,第四样本病历为第二样本病历集中的任一样本病历,该第四样本病历包括至少一个第二词语,第二词语与任一种第一类别之间的第一相似度用于表示第二词语与第一类别之间的相似程度,能够体现出该第二词语属于该第一类别的可能性。该步骤与上述步骤503同理,在此不再赘述。
需要说明的是,本申请实施例是先获取第二词语的第三词语特征,再获取第三相似度的,而在另一实施例中,无需执行步骤508,能够采取其他方式,基于第一病历分类模型,获取第二词语与每种第一类别之间的第三相似度。
509、计算机设备基于第一病历分类模型及每种第一类别对应的第三相似度,分别对每个第三相似度进行归一化处理,得到第二词语的多个第二预测标签,将多个第二预测标签构成第二词语的第二预测信息。
其中,每个第二预测标签指示对应的第二词语属于一种第一类别的可能性,该步骤与上述步骤304同理,在此不再赘述。
需要说明的是,本申请实施例是以第二词语与每种第一类别之间的第三相似度来获取第二词语的第二预测信息的,而在另一实施例中,无需执行步骤508-509,能够采取其他方式,基于第一病历分类模型,获取第四样本病历中每个第二词语的第二预测信息。
510、计算机设备创建与基于第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型。
该步骤与上述步骤310同理,在此不再赘述。
511、计算机设备对于每个第二词语,基于第三病历分类模型,获取第二词语的第四词语特征。
该步骤与上述步骤503同理,在此不再赘述。
512、计算机设备基于每个第二词语的第二预测信息与标注信息之间的差异,以及每个第二词语的第三词语特征与第四词语特征之间的差异,对第一病历分类模型进行训练。
该步骤与上述步骤506同理,在此不再赘述。
需要说明的是,本申请实施例是利用第三病历分类模型来对第一病历分类模型进行训练的,而在另一实施例中,无需执行步骤510-512,能够采取其他方式,基于每个第二词语的第二预测信息与标注信息之间的差异,对第一病历分类模型进行训练。
需要说明的是,本申请实施例是基于第一病历分类模型,先获取每个第二词语的第三词语特征,再获取每个第二词语的第二预测信息,并利用第三病历分类模型来获取每个第二词语的第四词语特征,基于每个第二词语的第二预测信息与标注信息之间的差异,以及每个第二词语的第三词语特征与第四词语特征之间的差异,对第一病历分类模型进行训练,而在另一实施例中,无需执行步骤508-512,能够采取其他方式,基于第二样本病历集,对第一病历分类模型再次进行训练。
需要说明的是,本申请仅是以图3或图5所示的实施例为例来进行说明的。在上述图3或图5所示的实施例中,对第一病历分类模型进行训练的过程分为两个训练阶段,在基于第一样本病历集对第一病历分类模型进行训练为第一个训练阶段,基于第二样本病历集对第一病历分类模型进行训练为第二个训练阶段。在每个训练阶段,图3和图5所示的训练过程能够任意结合,例如,在第一个训练阶段,基于每个第一词语的第一预测信息与标注信息之间的差异、每个第一词语的第一差异信息,以及每个第一词语的第一词语特征与第二词语特征之间的差异,对第一病历分类模型进行训练;在第二个训练阶段,基于每个第二词语的第二预测信息与标注信息之间的差异、每个第二词语的第二差异信息,以及每个第二词语的第三词语特征与第四词语特征之间的差异,对第一病历分类模型进行训练。
本申请实施例提供的一种增量训练病历分类模型的方法,每次训练完成病历分类模型后,将训练该病历分类模型的样本病历中、属于不同类别的目标数量的样本病历进行存储,从而节省了存储资源。在下次获取到新增类别的样本病历后,结合存储的样本病历能够训练出增量的病历分类模型,按照此种方式,能够应用于增量学习的场景下,实现了一种基于连续学习的病历分类模型的训练方法,在病历分类模型增加新增类别时,按照上述方式,能够基于之前已存在的病历分类模型训练一个增量的病历分类模型。
本申请实施例提供的方法,提供了一种病历分类模型的训练方式,基于训练后的病历分类模型对病历进行分类管理。并且,在训练第一病历分类模型的过程中,仅获取之前训练第二病历分类模型的样本病历中的目标数量的第二样本病历即可,基于获取到的第二样本病历及属于新增类别的第一样本病历,对第一病历分类模型进行训练,以提升第一病历分类模型的准确性,无需基于之前训练第二病历分类模型的所有样本病历来训练第一病历分类模型,从而节省了计算量。之后,对第一样本病历集进行调整,以使得到的第二样本病历集中属于不同第一类别的样本病历的数量均衡,基于第二样本病历集对第一病历分类模型再次进行训练,削弱了属于不同第一类别的样本病历的数量差异过大所带来的影响,进一步提升第一病历分类模型的准确性。
并且,在第一病历分类模型的两个训练阶段,分别第二病历分类模型或第三病历分类模型来获取同一个词语的词语特征之间的差异,以词语的词语特征之间的差异来训练第一病历分类模型,即训练第一病历分类模型的过程中考虑到模型蒸馏损失,使训练的第一病历分类模型保留之前模型已具备的分类能力,并且在此基础上,进一步提升第一病历分类模型的准确性。
基于上述图2、图3及图5所示的实施例,在医疗场景下,随着时间的推荐,病历的种类会逐渐增多,采用上述图2、图3及图5所示的实施例,能够实现对医疗场景下的病历分类模型进行训练,且随着病历的种类增多,能够实现对病历分类模型的连续训练,以保证训练后的病历分类模型始终与当前的病历的种类相匹配。在本申请实施例提供的方法中,结合记忆重放与知识蒸馏的方式对病历分类模型进行训练。如图6所示,曲线601为基于本申请实施例提供的方法训练的病历分类模型的准确率,曲线602为基于相关技术提供的方法训练的病历分类模型的准确率,与相关技术提供的模型训练方法相比,基于本申请实施例提供的方法,能够削弱不同类别的样本数量不平衡所带来的影响,能够提高得到的病历分类模型的准确率。
在上述图2、图3及图5所示的实施例的基础上,本申请实施例还提供了一种对病历进行分类的流程,如图7所示,该流程包括:
701、计算机设备基于第一病历分类模型,获取目标病历包含的每个目标词语所属的第一类别。
在一种可能实现方式中,该步骤701包括:对于目标病历包含的每个目标词语,基于第一病历分类模型,获取该目标词语属于每种第一类别的概率,响应于该目标词语对应的多个概率中最大概率大于目标阈值,将该最大概率对应的第一类别确定为该目标词语所属的第一类别。
其中,目标阈值为任意的数值,例如,目标阈值为0.7或0.8等。
可选地,响应于该目标词语对应的多个概率均小于目标阈值,确定该目标词语所属的第一类别为空。
在本申请实施例中,如果任一目标词语对应的多个概率均小于目标阈值,则确定该目标词语与多种第一类别无关,该目标词语为病历中与病历所属的类别无关的词语。
702、计算机设备基于每个目标词语所属的第一类别,确定目标病历所属的第一类别。
在一种可能实现方式中,该步骤702包括以下两种方式:
第一种方式:响应于目标病历包含属于至少一种第一类别的目标词语,确定该目标病历属于该至少一种第一类别。
在本申请实施例中,目标病历能够属于多种第一类别,例如,如果目标病历包括属于呼吸科类别的词语以及属于消化内科类别的词语,则确定目标病历属于呼吸疾病类型,也属于消化内科疾病类型。
第二种方式:确定该目标病历中属于每种第一类别的目标词语的数量,将最大数量对应的第一类别确定为该目标病历所属的第一类别。
例如,目标病历包含10个词语,第一病历分类模型包含3种第一类别,在该目标病历中,属于第一种第一类别的目标词语的数量为3,属于第二种第一类别的目标词语的数量为3,属于第三种第一类别的目标词语的数量为4,即可确定该目标病历属于第三种第一类别。
图8是本申请实施例提供的一种病历分类模型的处理装置的结构示意图,如图8所示,该装置包括:
获取模块801,用于获取第一病历分类模型,第一病历分类模型是对第二病历分类模型进行调整得到的,其中第一病历分类模型包含第一类别,第二病历分类模型包含第二类别,第一类别包括第二类别和新增类别;
训练模块802,用于将属于新增类别的第一样本病历和属于第二类别的第二样本病历构成第一样本病历集,第二样本病历是从训练第二病历分类模型的样本病历中选取的,且属于同一种第二类别的第二样本病历的数量为目标数量;基于第一样本病历集,对第一病历分类模型进行训练;
构成模块803,用于将第一样本病历集中目标数量的第一样本病历,以及第一样本病历集中的第二样本病历,构成第二样本病历集;
训练模块802,还用于基于第二样本病历集,对第一病历分类模型再次进行训练。
在一种可能实现方式中,第一样本病历集包括每个样本病历包含的每个词语的标注信息,标注信息包括多个样本标签,每个样本标签指示对应的词语是否属于一种第一类别;如图9所示,训练模块802,包括:
获取单元8021,用于基于第一病历分类模型,获取第三样本病历中每个第一词语的第一预测信息,第一预测信息包括多个第一预测标签,每个第一预测标签指示对应的第一词语属于一种第一类别的可能性,第三样本病历为第一样本病历集中的任一样本病历;
训练单元8022,用于基于每个第一词语的第一预测信息与标注信息之间的差异,对第一病历分类模型进行训练。
在另一种可能实现方式中,获取单元8021,用于对于每个第一词语,基于第一病历分类模型,获取第一词语与每种第一类别之间的第一相似度;基于第一病历分类模型及每种第一类别对应的第一相似度,分别对每个第一相似度进行归一化处理,得到第一词语的多个第一预测标签,将多个第一预测标签构成第一词语的第一预测信息。
在另一种可能实现方式中,训练单元8022,用于基于每个第一词语在相同的第一类别上的样本标签与第一预测标签之间的差异,对第一病历分类模型进行训练。
在另一种可能实现方式中,装置还包括:
获取模块801,还用于对于每个第一词语,基于第二病历分类模型,获取第一词语与每种第二类别之间的第二相似度;
训练单元8022,用于基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一差异信息,对第一病历分类模型进行训练,第一差异信息包括多个第一相似度差异,每个第一相似度差异包括对应的第一词语在一种第二类别上的第一相似度与第二相似度之间的差异。
在另一种可能实现方式中,第一病历分类模型包括第一类别的权重特征;获取单元8021,用于基于第一病历分类模型,获取第一词语的第一词语特征,获取第一词语特征与每种第一类别的权重特征之间的第一相似度。
在另一种可能实现方式中,装置还包括:
获取模块801,还用于对于每个第一词语,基于第二病历分类模型,获取第一词语的第二词语特征;
训练单元8022,用于基于每个第一词语的第一预测信息与标注信息之间的差异,以及每个第一词语的第一词语特征与第二词语特征之间的差异,对第一病历分类模型进行训练。
在另一种可能实现方式中,第二样本病历集包括每个样本病历包含的每个词语的标注信息,标注信息包括多个样本标签,每个样本标签指示对应的词语是否属于一种第一类别;如图9所示,训练模块802,包括:
获取单元8021,用于基于第一病历分类模型,获取第四样本病历中每个第二词语的第二预测信息,第二预测信息包括多个第二预测标签,每个第二预测标签指示对应的第二词语属于一种第一类别的可能性,第四样本病历为第二样本病历集中的任一样本病历;
训练单元8022,用于基于每个第二词语的第二预测信息与标注信息之间的差异,对第一病历分类模型进行训练。
在另一种可能实现方式中,获取单元8021,用于对于每个第二词语,基于第一病历分类模型,获取第二词语与每种第一类别之间的第三相似度;基于第一病历分类模型及每种第一类别对应的第三相似度,分别对每个第三相似度进行归一化处理,得到第二词语的多个第二预测标签,将多个第二预测标签构成第二词语的第二预测信息。
在另一种可能实现方式中,如图9所示,装置还包括:
创建模块804,用于创建与基于第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型;
获取模块801,还用于对于每个第二词语,基于第三病历分类模型,获取第二词语与每种第一类别之间的第四相似度;
训练单元8022,用于基于每个第二词语的第二预测信息与标注信息之间的差异,以及每个第二词语的第二差异信息,对第一病历分类模型进行训练,第二差异信息包括多个第二相似度差异,每个第二相似度差异包括对应的第二词语在一种第一类别上的第三相似度与第四相似度之间的差异。
在另一种可能实现方式中,第一病历分类模型包括第一类别的权重特征;获取单元8021,用于基于第一病历分类模型,获取第二词语的第三词语特征,获取第三词语特征与每种第一类别的权重特征之间的第三相似度。
在另一种可能实现方式中,如图9所示,装置还包括:
创建模块804,用于创建与基于第一样本病历集训练后的第一病历分类模型相同的第三病历分类模型;
获取模块801,还用于对于每个第二词语,基于第三病历分类模型,获取第二词语的第四词语特征;
训练单元8022,用于基于每个第二词语的第二预测信息与标注信息之间的差异,以及每个第二词语的第三词语特征与第四词语特征之间的差异,对第一病历分类模型进行训练。
在另一种可能实现方式中,构成模块803,用于获取每个第一样本病历的病历特征,以及第一样本病历集中第一样本病历的特征中心;基于每个第一样本病历的病历特征与特征中心之间的距离,从第一样本病历集中选取目标数量的第一样本病历,其中选取的第一样本病历对应的距离,小于第一样本病历集中其余第一样本病历对应的距离;将选取的第一样本病历以及第一样本病历集中的第二样本病历,构成第二样本病历集。
在另一种可能实现方式中,构成模块803,用于对于每个第一样本病历,基于第一病历分类模型,获取第一样本病历中每个第三词语的词语特征;基于第一样本病历中每个第三词语的词语特征,获取第一样本病历的病历特征;基于每个第一样本病历的病历特征,获取特征中心。
在另一种可能实现方式中,如图9所示,装置还包括:
获取模块801,还用于基于第一病历分类模型,获取目标病历包含的每个目标词语所属的类别;
确定模块805,用于基于每个目标词语所属的类别,确定目标病历所属的类别。
需要说明的是:上述实施例提供的病历分类模型的处理装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的病历分类模型的处理装置与病历分类模型的处理方法实施例属于同一构思,其实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的病历分类模型的处理方法中所执行的操作。
可选地,计算机设备提供为终端。图10示出了本申请一个示例性实施例提供的终端1000的结构框图。终端1000包括有:处理器1001和存储器1002。
处理器1001可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1001所执行以实现本申请中方法实施例提供的病历分类模型的处理方法。
在一些实施例中,终端1000还可选包括有:外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地,外围设备包括:射频电路1004、显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
外围设备接口1003可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中,处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上;在一些其他实施例中,处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1004用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1004包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1004还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1005用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时,显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时,显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1005可以为一个,设置在终端1000的前面板;在另一些实施例中,显示屏1005可以为至少两个,分别设置在终端1000的不同表面或呈折叠设计;在另一些实施例中,显示屏1005可以是柔性显示屏,设置在终端1000的弯曲表面上或折叠面上。甚至,显示屏1005还可以设置成非矩形的不规则图形,也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1006用于采集图像或视频。可选地,摄像头组件1006包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1001进行处理,或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1007还可以包括耳机插孔。
定位组件1008用于定位终端1000的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1008可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1009用于为终端1000中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
本领域技术人员可以理解,图10中示出的结构并不构成对终端1000的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
可选地,计算机设备提供为服务器。图11是本申请实施例提供的一种服务器的结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1101和一个或一个以上的存储器1102,其中,存储器1102中存储有至少一条计算机程序,至少一条计算机程序由处理器1101加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的病历分类模型的处理方法中所执行的操作。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备实现如上述实施例的病历分类模型的处理方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种病历分类模型的处理方法,其特征在于,所述方法包括:
获取第一病历分类模型,所述第一病历分类模型是对第二病历分类模型进行调整得到的,其中所述第一病历分类模型包含第一类别,所述第二病历分类模型包含第二类别,所述第一类别包括所述第二类别和新增类别;
将属于所述新增类别的第一样本病历和属于所述第二类别的第二样本病历构成第一样本病历集,所述第二样本病历是从训练所述第二病历分类模型的样本病历中选取的,且属于同一种所述第二类别的所述第二样本病历的数量为目标数量;基于所述第一样本病历集,对所述第一病历分类模型进行训练;
将所述第一样本病历集中所述目标数量的所述第一样本病历,以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集;
基于所述第二样本病历集,对所述第一病历分类模型再次进行训练。
2.根据权利要求1所述的方法,其特征在于,所述第一样本病历集包括每个样本病历包含的每个词语的标注信息,所述标注信息包括多个样本标签,每个样本标签指示对应的词语是否属于一种所述第一类别;所述基于所述第一样本病历集,对所述第一病历分类模型进行训练,包括:
基于所述第一病历分类模型,获取第三样本病历中每个第一词语的第一预测信息,所述第一预测信息包括多个第一预测标签,每个所述第一预测标签指示对应的第一词语属于一种所述第一类别的可能性,所述第三样本病历为所述第一样本病历集中的任一样本病历;
基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一病历分类模型,获取第三样本病历中每个第一词语的第一预测信息,包括:
对于每个所述第一词语,基于所述第一病历分类模型,获取所述第一词语与每种所述第一类别之间的第一相似度;
基于所述第一病历分类模型及每种所述第一类别对应的第一相似度,分别对每个所述第一相似度进行归一化处理,得到所述第一词语的多个所述第一预测标签,将所述多个第一预测标签构成所述第一词语的所述第一预测信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对于每个所述第一词语,基于所述第二病历分类模型,获取所述第一词语与每种所述第二类别之间的第二相似度;
所述基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练,包括:
基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,以及每个所述第一词语的第一差异信息,对所述第一病历分类模型进行训练,所述第一差异信息包括多个第一相似度差异,每个所述第一相似度差异包括对应的第一词语在一种所述第二类别上的所述第一相似度与所述第二相似度之间的差异。
5.根据权利要求3所述的方法,其特征在于,所述第一病历分类模型包括所述第一类别的权重特征;所述基于所述第一病历分类模型,获取所述第一词语与每种所述第一类别之间的第一相似度,包括:
基于所述第一病历分类模型,获取所述第一词语的第一词语特征,获取所述第一词语特征与每种所述第一类别的所述权重特征之间的第一相似度。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
对于每个所述第一词语,基于所述第二病历分类模型,获取所述第一词语的第二词语特征;
所述基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练,包括:
基于每个所述第一词语的所述第一预测信息与所述标注信息之间的差异,以及每个所述第一词语的所述第一词语特征与所述第二词语特征之间的差异,对所述第一病历分类模型进行训练。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述第二样本病历集包括每个样本病历包含的每个词语的标注信息,所述标注信息包括多个样本标签,每个所述样本标签指示对应的词语是否属于一种所述第一类别;所述基于所述第二样本病历集,对所述第一病历分类模型再次进行训练,包括:
基于所述第一病历分类模型,获取第四样本病历中每个第二词语的第二预测信息,所述第二预测信息包括多个第二预测标签,每个所述第二预测标签指示对应的第二词语属于一种所述第一类别的可能性,所述第四样本病历为所述第二样本病历集中的任一样本病历;
基于每个所述第二词语的所述第二预测信息与所述标注信息之间的差异,对所述第一病历分类模型进行训练。
8.一种病历分类模型的处理装置,其特征在于,所述装置包括:
获取模块,用于获取第一病历分类模型,所述第一病历分类模型是对第二病历分类模型进行调整得到的,其中所述第一病历分类模型包含第一类别,所述第二病历分类模型包含第二类别,所述第一类别包括所述第二类别和新增类别;
训练模块,用于将属于所述新增类别的第一样本病历和属于所述第二类别的第二样本病历构成第一样本病历集,所述第二样本病历是从训练所述第二病历分类模型的样本病历中选取的,且属于同一种所述第二类别的所述第二样本病历的数量为目标数量;基于所述第一样本病历集,对所述第一病历分类模型进行训练;
构成模块,用于将所述第一样本病历集中所述目标数量的所述第一样本病历,以及所述第一样本病历集中的所述第二样本病历,构成第二样本病历集;
所述训练模块,还用于基于所述第二样本病历集,对所述第一病历分类模型再次进行训练。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至7任一权利要求所述的病历分类模型的处理方法中所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至7任一权利要求所述的病历分类模型的处理方法中所执行的操作。
CN202110932738.1A 2021-08-13 2021-08-13 病历分类模型的处理方法、装置、计算机设备及存储介质 Pending CN114297374A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110932738.1A CN114297374A (zh) 2021-08-13 2021-08-13 病历分类模型的处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110932738.1A CN114297374A (zh) 2021-08-13 2021-08-13 病历分类模型的处理方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114297374A true CN114297374A (zh) 2022-04-08

Family

ID=80964352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110932738.1A Pending CN114297374A (zh) 2021-08-13 2021-08-13 病历分类模型的处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114297374A (zh)

Similar Documents

Publication Publication Date Title
CN109189950B (zh) 多媒体资源分类方法、装置、计算机设备及存储介质
CN112749728A (zh) 学生模型训练方法、装置、计算机设备及存储介质
CN113515942A (zh) 文本处理方法、装置、计算机设备及存储介质
CN114332530A (zh) 图像分类方法、装置、计算机设备及存储介质
CN112035671B (zh) 状态检测方法、装置、计算机设备及存储介质
CN112989767B (zh) 医学词语标注方法、医学词语映射方法、装置及设备
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN113505256B (zh) 特征提取网络训练方法、图像处理方法及装置
WO2022193973A1 (zh) 图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN113569042A (zh) 文本信息分类方法、装置、计算机设备及存储介质
CN114283299A (zh) 图像聚类方法、装置、计算机设备及存储介质
CN114677350B (zh) 连接点提取方法、装置、计算机设备及存储介质
CN117313830A (zh) 基于知识蒸馏的模型训练方法、装置、设备及介质
CN116775915A (zh) 资源推荐方法、推荐预测模型训练方法、装置及设备
CN113256621B (zh) 图像处理方法、装置、计算机设备及存储介质
CN112287070B (zh) 词语的上下位关系确定方法、装置、计算机设备及介质
CN114281936A (zh) 分类方法、装置、计算机设备及存储介质
CN114328815A (zh) 文本映射模型的处理方法、装置、计算机设备及存储介质
CN114419517B (zh) 视频帧处理方法、装置、计算机设备及存储介质
CN113641799B (zh) 文本处理方法、装置、计算机设备及存储介质
CN114360528B (zh) 语音识别方法、装置、计算机设备及存储介质
CN113762585B (zh) 数据的处理方法、账号类型的识别方法及装置
CN114281937A (zh) 嵌套实体识别模型的训练方法、嵌套实体识别方法及装置
CN114297374A (zh) 病历分类模型的处理方法、装置、计算机设备及存储介质
CN112988984A (zh) 特征获取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination