CN111882005B

CN111882005B - 数据类别确定方法及装置、终端设备、存储介质

Info

Publication number: CN111882005B
Application number: CN202011043332.XA
Authority: CN
Inventors: 姚海申
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2020-12-15
Anticipated expiration: 2040-09-28
Also published as: CN111882005A; WO2021159813A1

Abstract

本申请实施例公开了一种数据类别确定方法及装置、终端设备、存储介质，适用于数字医疗领域。该方法包括：获取第一分类模型，该第一分类模型由第一数据来源的样本数据训练得到，用于确定第一数据来源的任一样本数据的类别，该第一分类模型中至少包括特征提取网络和归一化网络；在第一分类模型的特征提取网络与归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型，该第二分类模型用于对第二数据来源的数据进行分类，第二数据来源与第一数据来源不同；当接收到第二数据来源的目标数据时，将目标数据输入第二分类模型，通过第二分类模型确定目标数据的类别。采用本申请实施例，可以提高分类模型分类的准确度。

Description

数据类别确定方法及装置、终端设备、存储介质

技术领域

本申请涉及数据处理领域，尤其是一种数据类别确定方法及装置、终端设备、存储介质。

背景技术

在人工智能技术中，为了使分类模型训练更有针对性，对分类模型进行训练使用的都是同一数据来源的样本数据。但是由于各个数据来源的样本数据之间存在差异性，已训练好的分类模型并不适用于不同数据来源的数据中。

现有技术是使用不同数据来源的样本数据同时对分类模型进行训练，使得该分类模型可以适用于不同数据来源，比如使用A区域的样本数据和B区域的样本数据同时对分类模型进行训练，训练好的分类模型可以同时适用于A区域和B区域。但是由于同时使用不同数据来源的样本数据对分类模型进行训练时，各数据来源的样本数据数量不平衡，导致该分类模型的精确度不够高，即该分类模型分类的准确度降低。

发明内容

本申请提供了一种数据类别确定方法及装置、终端设备、存储介质，可以提高分类模型分类的准确度，操作简单，适用性高。

第一方面，本申请实施例提供了一种数据类别确定方法，该方法包括：

获取第一分类模型，该第一分类模型由第一数据来源的样本数据训练得到，用于确定该第一数据来源的任一样本数据的类别，该第一分类模型中至少包括特征提取网络和归一化网络；

在该第一分类模型的特征提取网络与归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型，该第二分类模型用于对上述第二数据来源的数据进行分类，上述第二数据来源与上述第一数据来源不同；

当接收到上述第二数据来源的目标数据时，将该目标数据输入上述第二分类模型，通过该第二分类模型确定上述目标数据的类别。

结合第一方面，在第一种可能的实现方式中，上述数据拟合网络中包括加权单元、非线性单元和映射单元；

上述通过上述第二分类模型确定上述目标数据的类别具体实现为：

通过上述第二分类模型中的特征提取网络提取上述目标数据的特征以得到该目标数据的特征向量表示，并通过上述加权单元按照预设权重矩阵对上述特征提取网络输出的特征向量表示进行加权以得到加权后的特征向量表示；

通过上述非线性单元对该加权后的特征向量表示进行非线性化处理以得到非线性特征向量表示，并通过上述映射单元将该非线性特征向量表示映射到类别空间表示以得到该目标数据对应各数据类别的概率，其中，概率最大的数据类别为该目标数据的类别。

换句话说，在本申请中，第二分类模型中的特征提取网络用于提取上述第二数据来源中目标数据的特征，得到该目标数据的特征向量表示，该加权单元用于按照预设权重矩阵对上述特征提取网络输出的特征向量表示进行加权以得到加权后的特征向量表示；该非线性单元用于对上述加权后的特征向量表示进行非线性化处理以得到非线性特征向量表示，该映射单元用于将上述非线性特征向量表示映射到类别空间表示以得到上述目标数据的各类别概率。

结合第一方面第一种可能的实现方式，在第二种可能的实现方式中，上述加权单元与上述映射单元之间的残差连接用于将该映射单元得到的上述目标数据对应各数据类别的概率与预设的各类别概率之间的误差传递至上述加权单元，以使该加权单元基于上述误差更新上述预设权重矩阵。

结合第一方面第一种可能的实现方式或结合第一方面第二种可能的实现方式，在第三种可能的实现方式中，上述特征提取网络包括多头注意力单元和前馈单元；

上述通过上述第二分类模型中的上述特征提取网络提取上述目标数据的特征以得到该目标数据的特征向量表示具体实现为：

通过上述第二分类模型中的上述多头注意力单元按照目标网络参数提取上述目标数据的特征，以得到该目标数据的初始特征向量表示；上述目标网络参数为上述特征提取网络在提取上述第一数据来源的数据特征时使用的网络参数；

通过上述前馈单元将上述多头注意力单元提取到的上述初始特征向量表示进行降维，得到上述目标数据的特征向量表示。

换句话说，在本申请中，上述多头注意力单元用于按照目标网络参数，提取上述目标数据的特征，得到该目标数据的初始特征向量表示；该目标网络参数为上述特征提取网络在提取上述第一数据来源的数据特征时使用的网络参数；

上述前馈单元用于将上述多头注意力单元提取到的上述初始特征向量表示进行降维，得到上述目标数据的特征向量表示。

结合第一方面或结合第一方面上述任一种可能的实现方式，在第四种可能的实现方式中，上述第二数据来源是目标区域，上述第一数据来源是除该目标区域之外的其他任一区域；

上述第一数据来源的样本数据和上述第二数据来源的训练样本数据包括至少两个患者的样本数据，其中患者的样本数据包括症状信息、过敏史信息以及病史信息中的至少一种；

上述目标数据为上述目标区域中目标患者的症状信息、过敏史信息以及病史信息中的至少一种，上述目标数据对应的数据类别为上述目标数据对应的病症类别。

结合第一方面第四种可能的实现方式，在第五种可能的实现方式中，上述通过上述第二分类模型确定上述目标数据的类别之后上述方法还包括：

根据上述目标数据的类别确定针对该目标数据的就诊推荐信息，并向上述目标患者推荐该就诊推荐信息；

其中，该就诊推荐信息包括就诊科室、就诊地点以及就诊医生中的至少一种。

第二方面，本申请实施例提供了一种数据类别确定装置，该装置包括：

获取模块，用于获取第一分类模型，该第一分类模型由第一数据来源的样本数据训练得到，用于确定上述第一数据来源的任一样本数据的类别，该第一分类模型中至少包括特征提取网络和归一化网络；

模型构建模块，用于在上述获取模块获取到的第一分类模型的上述特征提取网络与上述归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型，该第二分类模型用于对上述第二数据来源的数据进行分类，上述第二数据来源与上述第一数据来源不同；

类别确定模块，用于在接收到上述第二数据来源的目标数据的情况下，将该目标数据输入上述模型构建模块构建的第二分类模型，通过该第二分类模型确定该目标数据的类别。

结合第二方面，在第一种可能的实现方式中，上述数据拟合网络包括加权单元、非线性单元和映射单元；

上述加权单元，用于在上述第二分类模型中的特征提取网络提取上述目标数据的特征得到该目标数据的特征向量表示的情况下，按照预设权重矩阵对上述特征提取网络输出的特征向量表示进行加权以得到加权后的特征向量表示；

上述非线性单元，用于对上述加权单元加权后的特征向量表示进行非线性化处理以得到非线性特征向量表示；

上述映射单元，用于将上述非线性单元得到的非线性特征向量表示映射到类别空间表示，以得到上述目标数据对应各数据类别的概率，其中概率最大的数据类别为该目标数据的类别。

结合第二方面第一种可能的实现方式，在第二种可能的实现方式中，上述加权单元与上述映射单元之间的残差连接用于将该映射单元得到的上述目标数据对应的各数据类别的概率与预设的各类别概率之间的误差传递至上述加权单元，以使该加权单元基于上述误差更新上述预设权重矩阵。

结合第二方面第一种可能的实现方式或结合第二方面第二种可能的实现方式，在第三种可能的实现方式中，上述特征提取网络包括多头注意力单元和前馈单元；

该多头注意力单元，用于按照目标网络参数提取上述目标数据的特征，得到上述目标数据的初始特征向量表示；该目标网络参数为上述特征提取网络在提取上述第一数据来源的数据特征时使用的网络参数；

该前馈单元，用于将上述多头注意力单元提取到的上述初始特征向量表示进行降维，得到上述目标数据的特征向量表示。

结合第二方面或结合第二方面上述任一种可能的实现方式，在第四种可能的实现方式中，上述第二数据来源是目标区域，上述第一数据来源是除该目标区域之外的其他任一区域；

上述目标数据为上述目标区域中目标患者的症状信息、过敏史信息以及病史信息中的至少一种，上述目标数据对应的数据类别为该目标数据对应的病症类别。

结合第二方面第四种可能的实现方式，在第五种可能的实现方式中，上述装置还包括推送模块；

该推送模块，用于在根据上述类别确定模块确定的上述目标数据的类别，确定针对上述目标数据的就诊推荐信息的情况下，向上述目标患者推送该就诊推荐信息，其中该就诊推荐信息包括就诊科室、就诊地点以及就诊医生中的至少一种。

第三方面，本申请提供了一种终端设备，包括收发器、处理器和存储器，该收发器和该处理器连接，该处理器和该存储器连接，其中，该存储器用于存储计算机程序，该计算机程序包括程序指令，上述处理器被配置用于调用上述程序指令，执行上述第一方面和/或第一方面任一种可能的实施方式所提供的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，该计算机存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令当被处理器执行时使该处理器执行上述第一方面和/或第一方面任一种可能的实施方式所提供的方法。

本申请实施例中，通过在第一分类模型的特征提取网络与归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本构建第二分类模型。上述数据拟合网络可以在保留上述第一数据来源的数据特征的基础上，学习上述第二数据来源的数据特征，从而使得上述第二分类模型具备对第二数据来源的数据进行分类的能力，上述第一数据来源与上述第二数据来源不同。实施本申请，可以提高分类模型的鲁棒性以及分类准确度，运算量低，操作简单，适用性高。

附图说明

图1为本申请实施例提供的一种数据类别确定方法的流程示意图；

图2为本申请实施例提供的第一分类模型的结构示意图；

图3为本申请实施例提供的第二分类模型的结构示意图；

图4为本申请实施例提供的一种数据类别确定方法的一应用场景图；

图5为本申请实施例提供的一种数据类别确定方法的另一应用场景图；

图6为本申请实施例提供的一种数据类别确定装置的结构示意图；

图7为本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面结合附图来对本申请的技术方案的实施作进一步的详细描述。参见图1至图3。

首先参见图1，图1为本申请实施例提供的一种数据类别确定方法的流程示意图。如图1所示，本申请实施例提供的方法包括如下步骤：

S100、获取第一分类模型。

为方便描述，下面结合图2对该第一分类模型进行介绍。参见图2，图2为本申请实施例提供的第一分类模型的结构示意图。如图2所示，第一分类模型20至少包括特征提取网络201和第一归一化网络202。特征提取网络201包括多头注意力单元2011和第一前馈单元2012。示例性的，第一分类模型20是Transformer模型。

第一分类模型20是由第一数据来源的样本数据训练得到的。在具体实现中，将第一数据来源的样本数据作为第一分类模型20的输入，输入至多头注意力单元2011。多头注意力单元2011基于该样本数据以及多头注意力单元2011的网络参数，得到该样本数据的特征向量表示。示例性的，多头注意力单元2011的网络参数包括键值权重、查询权重以及取值权重等。

在一些可行的实施方式中，将上述第一数据来源的任一样本数据X输入多头注意力单元2011，多头注意力单元2011根据该任一样本数据X与多头注意力单元2011的初始网络参数确定该任一样本数据的初始特征向量表示。具体计算公式如下：

其中

为初始查询权重，Q为查询向量矩阵。

其中

为初始键值权重，K为键值向量矩阵。

其中

为初始取值权重，V为取值向量矩阵。

根据上述公式1、公式2和公式3，得到上述任一样本数据的初始特征向量表示Z为：

其中

为多头注意力单元2011输出矩阵的维度。

将该任一样本数据的初始特征向量表示Z输入至第一前馈单元2012。该任一样本数据的初始特征向量表示Z具体表现为矩阵向量，第一前馈单元2012将该任一样本数据的初始特征向量表示Z乘以第一预设类别向量矩阵，得到该任一样本数据的类别向量表示。

将该任一样本数据的类别向量表示输入至第一归一化网络202，第一归一化网络202对该任一样本数据的类别向量表示进行归一化处理，得到该第一数据来源的样本数据对应各数据类别的概率。根据该第一数据来源的样本数据对应各数据类别的概率，对多头注意力单元2011的初始网络参数进行更新，以得到多头注意力单元2011的目标网络参数，例如查询权重

、键值权重

以及取值权重

，其中多头注意力单元2011的目标网络参数可以使得上述任一样本数据对应各数据类别的概率满足预设条件。可选的，该预设条件可以为上述任一样本数据对应各数据类别的概率与真实类别的近似度在第一预设范围内，该近似度可以用各数据类别的概率与真实类别的交叉熵来衡量；或该预设条件可以为上述任一样本数据的各数据类别的概率的最大值不小于第一预设概率阈值。

在一种可选的实施例中，第一前馈单元2012与多头注意力单元2011之间的残差连接1用于将第一数据来源中任一样本数据对应各数据类别的概率与真实类别之间的误差传递至多头注意力单元2011，以使多头注意力单元2011基于该误差更新多头注意力单元2011的网络参数，防止特征提取网络201发生梯度消失或梯度爆炸。

在一些可行的实施方式中，第一归一化网络202对该第一数据来源的样本数据的类别向量表示进行归一化处理后得到的向量矩阵的维度与预设矩阵类别表示的维度不同，可以通过增加前馈单元来进行矩阵维度的转换，例如增加第二前馈单元203。上述第一数据来源的样本数据对应各数据类别的概率经过第二前馈单元203和第二归一化网络204进行输出。示例性的，第二前馈单元203与第一归一化网络202之间的残差连接2用于防止第二前馈单元203发生梯度消失或梯度爆炸。

S101、在上述第一分类模型的上述特征提取网络与上述归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型。

下面结合图3对上述第二分类模型进行介绍。参见图3，图3为本申请实施例提供的第二分类模型的结构示意图。如图3所示，第二分类模型30包括特征提取网络301和第一归一化网络303，特征提取网络301与上述第一分类模型20的特征提取网络201的网络参数相同，其中特征提取网络301中包括多头注意力单元3011和第一前馈单元3012。与上述结合图2所描述的第一分类模型20不同的是，第二分类模型30在特征提取网络301与第一归一化网络303之间添加第一数据拟合网络302。

基于上述第二数据来源的训练样本数据构建上述第二分类模型30，即使用上述第二数据来源的训练样本数据对第一数据拟合网络302进行训练。其中第二数据来源与第一数据来源不同。第二数据来源的训练样本数据可以是从存储有训练样本数据的服务器中获取的，该训练样本可以具体表现为文本信息和/或语音信息。

在具体实现中，将上述第二数据来源的训练样本数据作为第二分类模型30的输入，输入至多头注意力单元3011。多头注意力单元3011基于该训练样本数据以及多头注意力单元3011的目标网络参数得到该第二数据来源中任一训练样本数据的特征向量表示，例如将查询权重

、键值权重

以及取值权重

代入上述公式1、公式2和公式3，分别得到查询向量矩阵Q、键值向量矩阵K和取值向量矩阵，根据上述公式4得到该第二数据来源中任一训练样本数据的特征向量表示。

将上述任一训练样本数据的特征向量表示输入至第一前馈单元3012，得到该任一训练样本数据降维后的特征向量表示。

将该任一训练样本数据降维后的特征向量表示输入至第一数据拟合网络302，得到该任一训练样本数据对应各数据类别的概率。在一些可行的实施方式中，第一数据拟合网络302包括加权单元3021、非线性单元3022和映射单元3023。加权单元3021中设置有预设权重矩阵，该预设权重矩阵的维度与上述任一训练样本数据降维后的特征向量表示的维度相同。对第一数据拟合网络302的训练即为对加权单元3021中的权重矩阵进行训练。示例性的，通过加权单元3021将上述任一训练样本数据降维后的特征向量表示与上述预设权重矩阵相乘，得到该任一训练样本数据的加权特征向量表示。将该任一训练样本数据的加权特征向量表示输入至非线性单元3022，通过非线性单元3022对该任一训练样本数据的加权特征向量表示进行非线性化处理，得到该任一训练样本的非线性特征向量表示，即该任一训练样本数据的非线性向量表示分布在0和1之间，示例性的，可以由Sigmoid函数、ReLU函数等函数实现。将该任一训练样本的非线性特征向量表示输入至映射单元3023，通过映射单元3023将该非线性特征向量映射到类别空间表示得到上述任一训练样本数据对应各数据类别的概率。具体实现为将上述任一训练样本的非线性特征向量表示乘以第二预设类别向量矩阵，得到该任一训练样本数据对应各数据类别的概率。根据该任一训练样本数据对应各数据类别的概率对上述加权单元3021中的预设权重矩阵进行调整以得到目标权重矩阵。若该目标权重矩阵使得上述任一训练样本数据对应各数据类别的概率满足预设数据拟合条件，则确定第一数据拟合网络302已经训练完成，即第二分类模型30具备对上述第二数据来源的任一数据进行分类的能力。可选的，该预设数据拟合条件可以为上述任一训练样本数据对应各数据类别的概率与真实类别的近似度在第二预设范围内，该近似度可以用各数据类别的概率与真实类别之间的交叉熵来衡量；或该预设数据拟合条件可以为上述任一训练样本数据对应各数据类别的概率的最大值不小于第二预设概率阈值。

若上述任一训练样本数据对应各数据类别的概率不满足上述预设数据拟合条件，则通过调整第一数据拟合网络302的预设权重矩阵改变上述任一训练样本数据的加权特征向量表示，从而改变该任一训练样本数据对应各数据类别的概率，直至该任一训练样本数据对应各数据类别的概率满足上述预设数据拟合条件。

在一种可选的实施例中，映射单元3023与加权单元3021之间的残差连接3，用于将映射单元3023得到的上述任一数据对应各数据类别的概率与预设的各类别概率之间的误差传递至加权单元3021，以使加权单元3021基于该误差更新上述预设权重矩阵，防止第一数据拟合网络302发生梯度消失或梯度爆炸。

在一些可行的实施方式中，第一归一化网络303输出的向量矩阵的维度与预设矩阵类别表示的维度不同，该向量矩阵为对上述任一训练样本数据的非线性特征向量表示进行归一化处理后得到的。可以通过增加前馈单元来进行矩阵维度的转换，例如增加第二前馈单元304。上述第二数据来源的样本数据对应各数据类别的概率经过第一归一化网络303之后，由第二前馈单元304进行输出。

在一种可选的实施例中，第二分类模型30还可以包括多个数据拟合网络，例如在特征提取网络301与第一归一化网络303之间添加第一数据拟合网络302的基础上，还可以在第二前馈单元304与第二归一化网络306之间添加第二数据拟合网络305，第二数据拟合网络305与第一数据拟合网络302相同，均包括加权单元、非线性单元和映射单元。第二数据拟合网络305可以对第一数据拟合网络302的各类别概率进行进一步的调整，具体实现过程可以参考第一数据拟合网络302的描述，此处不作赘述。增加第二数据拟合网络305可以进一步提高第二分类网络的分类准确度。

S102、当接收到上述第二数据来源的目标数据时，将该目标数据输入上述第二分类模型。

在一种可能的实施例中，该目标数据包括目标区域中目标患者的症状信息、过敏史信息、病史信息中的至少一种，则在该可选实施例中，上述第二数据来源是上述目标区域，上述第一数据来源是除该目标区域之外的其他任一区域。上述第一数据来源的样本数据和上述第二数据来源的训练样本数据包括至少两个患者的样本数据，其中患者的样本数据包括症状信息、过敏史信息以及病史信息中的至少一种，上述目标数据对应的数据类别包括多种病症中的至少一种。

S103、通过上述第二分类模型确定上述目标数据的类别。

具体实现中，由步骤S102将上述目标数据输入第二分类模型30，通过第二分类模型30中的特征提取网络301提取该目标数据的特征，以得到该目标数据的特征向量表示。示例性的，特征提取网络301中的多头注意力单元3011基于该目标数据以及多头注意力单元3011的目标网络参数得到该目标数据的初始特征向量表示。将该目标数据的初始特征向量表示输入至特征提取网络301中的第一前馈单元3012，得到该目标数据的特征向量表示。将该目标数据的特征向量表示输入至第一数据拟合网络302，得到该目标数据对应各数据类别的概率。根据该目标数据对应各数据类别的概率确定该目标数据的类别。示例性的，该目标数据对应各数据类别的概率包括：“哮喘”概率为0.6、“肺炎”概率为0.3、“慢阻肺”概率为0.1，则将各数据类别的概率中最大值对应的类别作为该目标数据的类别，即该目标数据的类别为“哮喘”。

在一种可行的实施方式中，将本申请应用于数字医疗场景中，经过步骤S103确定上述目标数据的类别之后，根据该目标数据的类别确定针对该目标数据的就诊推荐信息，并向上述目标患者推送该就诊推荐信息。示例性的，由步骤S103确定上述目标数据的类别为“哮喘”，则可以输出就诊推荐信息“呼吸内科”，以辅助目标患者基于该就诊推荐信息准确挂号。

本申请实施例中，通过在第一分类模型的特征提取网络与归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本构建第二分类模型。上述数据拟合网络可以在保留上述第一数据来源的数据特征的基础上，学习上述第二数据来源的数据特征，从而使得上述第二分类模型具备对第二数据来源的数据进行分类的能力，上述第一数据来源与上述第二数据来源不同。实施本申请，可以提高分类模型分类的准确度，且运算量低，操作简单，适用性高。

在一些可行的实施方式中，上述数据类别的确定方法可以由终端设备或服务器等电子设备执行，终端设备可以为机器人、用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等，上述方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者，可通过服务器执行上述方法。

下面结合图4和图5对本申请实施例可以应用的场景进行示例，应当理解为包括但不限于下面所描述的应用场景。

以本申请应用于数字医疗的场景为例。首先参见图4，图4为本申请实施例提供的一种数据类别确定方法的一应用场景图。如图4所示，将第一数据来源40的样本数据输入第一分类模型41，例如将“喉咙痛”、“喉咙冒火”、“喉咙干痛”等输入第一分类模型41。第一分类模型41中的多头注意力单元基于第一数据来源40的样本数据以及注意力单元的目标网络参数410，得到第一数据来源40的样本数据的特征向量表示411（图4中以黑白色格子对各样本数据的特征向量进行区分）。第一分类模型41中的第一前馈单元根据第一数据来源40的样本数据的特征向量表示411确定该第一数据来源40的样本数据的类别为“咽喉炎症”，由此获取到具备第一数据来源40的样本数据分类能力的第一分类模型41。进一步的，可以基于该第一数据来源40的样本数据的类别为“咽喉炎症”输出就诊推荐信息“耳鼻喉科”、“就诊地方在A栋大楼3层”、“就诊医生为胡医生”等。由于第一分类模型41是基于第一数据来源40的样本数据训练得到的，当将第二数据来源的数据输入第一分类模型41时，得到的样本数据的类别是不准确的。参见图5，图5为本申请实施例提供的一种数据类别确定方法的另一应用场景图。如图5所示，若将第二数据来源50的数据“嗓子疼”输入第一分类模型51，第一分类模型51与图4得到的第一分类模型41具有相同的目标网络参数，即目标网络参数510与目标网络参数410相同，第一分类模型51中的第一前馈单元根据第二数据来源50的数据“嗓子疼”得到的特征向量表示511，确定第二数据来源50的数据的类别为“疼痛”，特征向量表示511与特征向量411不同。进一步的，基于第二数据来源50的数据的类别“疼痛”输出就诊推荐信息“疼痛科”、“就诊地方在B栋大楼2层”、“就诊医生为赖医生”等。然而，第二数据来源50的数据“嗓子疼”的真实类别也应该是“咽喉炎症”，只是第二数据来源50的表述方式与第一数据来源40的表述方法不同，例如我国南方人习惯表述“喉咙痛”，而北方人习惯表述为“嗓子疼”，由此导致针对第一数据来源40训练得到的第一分类模型51并不适用于第二数据来源50，即由第一分类模型51确定得到的第二数据来源50的数据类别是不准确的。在第一分类模型40的特征提取网络与归一化网络之间添加数据拟合网络，并基于第二数据来源50的训练样本数据构建第二分类模型52，第二分类模型52具备对第二数据来源50的任一数据分类的能力。第二分类模型52的具体构建过程可以参考前文结合图1所描述的步骤S101，此处不作赘述。示例性的，将目标数据“嗓子疼”输入第二分类模型52，第二分类模型52与第一分类模型51具有相同的目标网络参数，即目标网络参数520、目标网络参数510及目标网络参数410相同。第二分类模型52中的数据拟合网络根据目标数据“嗓子疼”得到的特征向量表示521，确定该目标数据的类别为“咽喉炎症”。进一步的，基于该目标数据的类别“咽喉炎症”输出就诊推荐信息“耳鼻喉科”、“就诊地方在A栋大楼3层”、“就诊医生为胡医生”等。由此实现了在保留第一数据来源40的数据特征的基础上，学习第二数据来源50的数据特征，从而使得第二分类模型52具备对第二数据来源50的数据进行分类的能力，完成不同数据来源之间的数据迁移，提高分类模型的鲁棒性以及分类准确度，且运算量低，操作简单，适用性高。

在一种可选的实施例中，本申请可以由分诊机器人执行，该分诊机器人上可以设置有摄像头、麦克风和/或扬声器，摄像头可以获取目标患者的身份信息，基于该目标患者的身份信息查找该目标患者的病史和/或就诊历史等。麦克风可以用来接收目标患者的主诉请求，即为本申请的目标数据。扬声器可以用来输出就诊推荐信息等。

参见图6，图6为本申请实施例提供的一种数据类别确定装置的结构示意图。如图6所示，数据类别确定装置60包括：

获取模块600，用于获取第一分类模型，该第一分类模型由第一数据来源的样本数据训练得到，用于确定上述第一数据来源的任一样本数据的类别，该第一分类模型中至少包括特征提取网络和归一化网络；

模型构建模块601，用于在上述获取模块600获取到的第一分类模型的上述特征提取网络与上述归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型，该第二分类模型用于对上述第二数据来源的数据进行分类，上述第二数据来源与上述第一数据来源不同；

类别确定模块602，用于在接收到上述第二数据来源的目标数据的情况下，将该目标数据输入上述模型构建模块601构建的第二分类模型，通过该第二分类模型确定上述目标数据的类别。

在第一些可行的实施方式中，上述数据拟合网络包括加权单元、非线性单元和映射单元；

进一步的，上述加权单元与上述映射单元之间的残差连接用于将该映射单元得到的上述目标数据对应的各数据类别的概率与预设的各类别概率之间的误差传递至上述加权单元，以使该加权单元基于上述误差更新上述预设权重矩阵。

在一种可能的实现方式中，上述特征提取网络包括多头注意力单元和前馈单元；

该多头注意力单元，用于按照目标网络参数，提取上述目标数据的特征，得到上述目标数据的初始特征向量表示；该目标网络参数为上述特征提取网络在提取上述第一数据来源的样本数据的特征时使用的网络参数；

在一种可选的实施例中，上述第二数据来源是目标区域，上述第一数据来源是除该目标区域之外的其他任一区域；

进一步的，上述装置还包括推送模块603，

该推送模块603，用于在根据上述类别确定模块602确定的上述目标数据的类别，确定针对上述目标数据的就诊推荐信息的情况下，向上述目标患者推送该就诊推荐信息，其中该就诊推荐信息包括就诊科室、就诊地点以及就诊医生中的至少一种。

参见图7，图7为本申请实施例提供的一种终端设备的结构示意图。如图7所示，终端设备70可以包括：至少一个收发器700、至少一个处理器701和存储器702。上述处理器701和存储器702通过总线703连接，上述收发器700和处理器701通过总线703连接。收发器701用于接收各样本数据的输入，存储器702用于存储计算机程序，该计算机程序包括程序指令，处理器701用于执行存储器702存储的程序指令，执行如下操作：

在一些可行的实施方式中，处理器701用于：

提取上述目标数据的特征，以得到该目标数据的特征向量表示；

按照预设权重矩阵对上述特征提取网络输出的特征向量表示进行加权以得到加权后的特征向量表示；

对上述加权后的特征向量表示进行非线性化处理以得到非线性特征向量表示，并将上述非线性特征向量表示映射到类别空间表示以得到上述目标数据对应各数据类别的概率，其中概率最大的数据类别为该目标数据的类别。

在一种可能的实现方式中，处理器701用于基于上述目标数据对应各数据类别的概率与预设的各类别概率之间的误差更新上述预设权重矩阵。

可选的，处理器701用于按照目标网络参数，提取上述目标数据的初始特征，得到该目标数据的初始特征向量表示；

将上述多头注意力单元提取到的上述初始特征向量表示进行降维，得到上述目标数据的特征向量表示。

进一步的，处理器701还用于根据上述目标数据的类别确定针对该目标数据的就诊推荐信息，其中该就诊推荐信息包括就诊科室、就诊地点以及就诊医生中的至少一种。

在一些可行的实施方式中，上述处理器701可以是中央处理单元 (centralprocessing unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器 (digitalsignal processor，DSP)、专用集成电路 (application specific integrated circuit，ASIC)、现成可编程门阵列 (field-programmable gate array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器702可以包括只读存储器和随机存取存储器，并向处理器701提供指令和数据。存储器702的一部分还可以包括非易失性随机存取存储器。例如，存储器702还可以存储设备类型的信息。

具体实现中，上述终端设备70可通过其内置的各个功能模块执行如上述图1至图5中各个步骤所提供的实现方式，具体可参见上述各个步骤所提供的实现方式，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令被处理器执行时实现图1至图5中各个步骤所提供的数据类别确定方法，具体可参见上述各个步骤所提供的实现方式，在此不再赘述。

上述计算机可读存储介质可以是前述任一实施例提供的数据类别确定装置或者上述终端设备的内部存储单元，例如电子设备的硬盘或内存。该计算机可读存储介质也可以是该电子设备的外部存储设备，例如该电子设备上配备的插接式硬盘，智能存储卡（smart media card, SMC），安全数字（secure digital, SD）卡，闪存卡（flash card）等。进一步地，该计算机可读存储介质还可以既包括该电子设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该电子设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

需要说明的是，上述术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。

此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

Claims

1.一种数据类别确定方法，其特征在于，所述方法包括：

获取第一分类模型，所述第一分类模型由第一数据来源的样本数据训练得到，用于确定所述第一数据来源的任一样本数据的类别，所述第一分类模型中至少包括特征提取网络和归一化网络；

在所述第一分类模型的所述特征提取网络与所述归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型，所述第二分类模型用于对所述第二数据来源的数据进行分类，所述第二数据来源与所述第一数据来源不同；

当接收到所述第二数据来源的目标数据时，将所述目标数据输入所述第二分类模型，通过所述第二分类模型确定所述目标数据的类别。

2.根据权利要求1所述的方法，其特征在于，所述数据拟合网络中包括加权单元、非线性单元和映射单元；

所述通过所述第二分类模型确定所述目标数据的类别包括：

通过所述第二分类模型中的所述特征提取网络提取所述目标数据的特征以得到所述目标数据的特征向量表示，并通过所述加权单元按照预设权重矩阵对所述特征提取网络输出的特征向量表示进行加权以得到加权后的特征向量表示；

通过所述非线性单元对所述加权后的特征向量表示进行非线性化处理以得到非线性特征向量表示，并通过所述映射单元将所述非线性特征向量表示映射到类别空间表示以得到所述目标数据对应各数据类别的概率，其中概率最大的数据类别为所述目标数据的类别。

3.根据权利要求2所述的方法，其特征在于，所述加权单元与所述映射单元之间的残差连接用于将所述映射单元得到的所述目标数据对应各数据类别的概率与预设的各类别概率之间的误差传递至所述加权单元，以使所述加权单元基于所述误差更新所述预设权重矩阵。

4.根据权利要求2所述的方法，其特征在于，所述特征提取网络包括多头注意力单元和前馈单元；所述通过所述第二分类模型中的所述特征提取网络提取所述目标数据的特征以得到所述目标数据的特征向量表示包括：

通过所述第二分类模型中的所述多头注意力单元按照目标网络参数提取所述目标数据的特征，以得到所述目标数据的初始特征向量表示，所述目标网络参数为所述特征提取网络在提取所述第一数据来源的数据特征时使用的网络参数；

通过所述前馈单元将所述多头注意力单元提取到的所述初始特征向量表示进行降维，得到所述目标数据的特征向量表示。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述第二数据来源是目标区域，所述第一数据来源是除所述目标区域之外的其他任一区域；

所述第一数据来源的样本数据和所述第二数据来源的训练样本数据包括至少两个患者的样本数据，其中患者的样本数据包括症状信息、过敏史信息以及病史信息中的至少一种；

所述目标数据包括所述目标区域中目标患者的症状信息、过敏史信息以及病史信息中的至少一种，所述目标数据对应的数据类别为所述目标数据对应的病症类别。

6.根据权利要求5所述的方法，其特征在于，所述通过所述第二分类模型确定所述目标数据的类别之后所述方法还包括：

根据所述目标数据的类别确定针对所述目标数据的就诊推荐信息，并向所述目标患者推送所述就诊推荐信息；

其中，所述就诊推荐信息包括就诊科室、就诊地点以及就诊医生中的至少一种。

7.一种数据类别确定装置，其特征在于，所述装置包括：

获取模块，用于获取第一分类模型，所述第一分类模型由第一数据来源的样本数据训练得到，用于确定所述第一数据来源的任一样本数据的类别，所述第一分类模型中至少包括特征提取网络和归一化网络；

模型构建模块，用于在所述获取模块获取到的第一分类模型的所述特征提取网络与所述归一化网络之间添加数据拟合网络，并基于第二数据来源的训练样本数据构建第二分类模型，所述第二分类模型用于对所述第二数据来源的数据进行分类；所述第二数据来源与所述第一数据来源不同；

类别确定模块，用于在接收到所述第二数据来源的目标数据的情况下，将所述目标数据输入所述模型构建模块构建的第二分类模型，通过所述第二分类模型确定所述目标数据的类别。

8.根据权利要求7所述的装置，其特征在于，所述数据拟合网络包括加权单元、非线性单元和映射单元；

所述加权单元，用于在所述第二分类模型中的所述特征提取网络提取所述目标数据的特征得到所述目标数据的特征向量表示的情况下，按照预设权重矩阵对所述特征提取网络输出的特征向量表示进行加权以得到加权后的特征向量表示；

所述非线性单元，用于对所述加权单元加权后的特征向量表示进行非线性化处理，以得到非线性特征向量表示；

所述映射单元，用于将所述非线性单元得到的非线性特征向量表示映射到类别空间表示，以得到所述目标数据对应各数据类别的概率，其中概率最大的数据类别为所述目标数据的类别。

9.一种终端设备，其特征在于，包括收发器、处理器和存储器，所述收发器和所述处理器连接，所述处理器和存储器连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-6任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-6任一项所述的方法。