CN116956909A

CN116956909A - 类别识别模型的生成方法及类别识别方法

Info

Publication number: CN116956909A
Application number: CN202211424454.2A
Authority: CN
Inventors: 杨韬
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-11-14
Filing date: 2022-11-14
Publication date: 2023-10-27

Abstract

本公开关于类别识别模型的生成方法及类别识别方法，包括：获取第一训练数据、第二训练数据、基于第一训练数据训练得到的第一类别识别模型和基于第二训练数据训练得到的第二类别识别模型；将第一样本数据输入第二类别识别模型进行对象类别识别，得到第三标签信息；将第二样本数据输入第一类别识别模型进行对象类别识别，得到第四标签信息；对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，得到第五标签信息和第六标签信息；基于第一样本数据、第二样本数据、第五标签信息和第六标签信息对预设识别模型进行训练，得到目标类别识别模型。利用本公开实施例可以减少标注成本，提高模型对多类别的识别效率和识别准确度。

Description

类别识别模型的生成方法及类别识别方法

技术领域

本公开涉及人工智能技术领域，尤其涉及一种类别识别模型的生成方法及类别识别方法。

背景技术

命名实体识别作为一项自然语言处理(NLP，Natural Language Processing)底层技术，在众多产品和应用中都有非常广泛的应用。但很多时候需要识别的实体类别不是一开始就完全定下来的，随着业务的发展会需要实现对新的实体类别的识别。例如，初始的实体识别模型可能只需要识别“人名、地名、机构名”这三个类别。但是一段时间后，可能会需要识别更多的类别，比如需要识别“电影、电视剧、综艺”这些类别。

传统的做法就是针对需要新识别的这些类别，去标注一些语料。在标注的时候，除了标注新的类别，还需要把以前的类别也都标注上，方便训练模型。但这种方法的缺点显而易见，随着增加的新的类别的增多，标注成本会越来越高。因此还有一种方法，就是只标注新的实体类别，然后新类别的训练数据和老类别的训练数据采用多任务模型去学习。具体来说，就是这个模型共享编码层，采用不同的预测模块来预测新类别或者老类别。但这个模型也有个问题，就是随着新类的增多，预测模块会越来越多，模型会越变越大。而且随着类别增多，多任务这种方式会导致实体间增大，会越来越影响所有类别的识别效果。

发明内容

有鉴于上述存在的技术问题，本公开提出了一种类别识别模型的生成方法及类别识别方法。

根据本公开实施例的一方面，提供一种类别识别模型的生成方法，包括：

获取第一训练数据、第二训练数据、基于所述第一训练数据训练得到的第一类别识别模型，以及基于所述第二训练数据训练得到的第二类别识别模型；所述第一训练数据包括第一样本数据和所述第一样本数据在第一对象类别维度对应的第一标签信息，所述第二训练数据包括第二样本数据和所述第二样本数据在第二对象类别维度对应的第二标签信息；

将所述第一样本数据输入至所述第二类别识别模型进行对象类别识别，得到所述第一样本数据在所述第二对象类别维度对应的第三标签信息；

将所述第二样本数据输入至所述第一类别识别模型进行对象类别识别，得到所述第二样本数据在所述第一对象类别维度对应的第四标签信息；

对所述第一标签信息、所述第二标签信息、所述第三标签信息和所述第四标签信息进行标签融合处理，得到所述第一样本数据在所述第一对象类别维度和所述第二对象类别维度对应的第五标签信息，以及所述第二样本数据在所述第一对象类别维度和所述第二对象类别维度对应的第六标签信息；

基于所述第一样本数据、所述第二样本数据、所述第五标签信息和所述第六标签信息，对预设识别模型进行训练，得到目标类别识别模型。

根据本公开实施例的另一方面，提供一种类别识别方法，包括：

获取待识别文本信息；

将所述待识别文本信息输入至目标类别识别模型进行对象类别识别，得到对象类别识别结果；

其中，所述目标类别识别模型为基于上述类别识别模型的生成方法得到的。

根据本公开实施例的另一方面，提供一种类别识别模型的生成装置，包括：

第一数据获取模块，用于获取第一训练数据、第二训练数据、基于所述第一训练数据训练得到的第一类别识别模型，以及基于所述第二训练数据训练得到的第二类别识别模型；所述第一训练数据包括第一样本数据和所述第一样本数据在第一对象类别维度对应的第一标签信息，所述第二训练数据包括第二样本数据和所述第二样本数据在第二对象类别维度对应的第二标签信息；

第一识别模块，用于将所述第一样本数据输入至所述第二类别识别模型进行对象类别识别，得到所述第一样本数据在所述第二对象类别维度对应的第三标签信息；

第二识别模块，用于将所述第二样本数据输入至所述第一类别识别模型进行对象类别识别，得到所述第二样本数据在所述第一对象类别维度对应的第四标签信息；

标签融合处理模块，用于对所述第一标签信息、所述第二标签信息、所述第三标签信息和所述第四标签信息进行标签融合处理，得到所述第一样本数据在所述第一对象类别维度和所述第二对象类别维度对应的第五标签信息，以及所述第二样本数据在所述第一对象类别维度和所述第二对象类别维度对应的第六标签信息；

模型训练模块，用于基于所述第一样本数据、所述第二样本数据、所述第五标签信息和所述第六标签信息，对预设识别模型进行训练，得到目标类别识别模型。

根据本公开实施例的另一方面，提供一种类别识别装置，包括：

信息获取模块，用于获取待识别文本信息；

第三识别模块，用于将所述待识别文本信息输入至目标类别识别模型进行对象类别识别，得到对象类别识别结果；所述目标类别识别模型为基于上述类别识别模型的生成方法得到的。

根据本公开实施例的另一方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现上述类别识别模型的生成方法或上述类别识别方法。

根据本公开实施例的另一方面，提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行上述类别识别模型的生成方法或上述类别识别方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过获取第一对象类别维度对应的第一训练数据、第二对象类别维度对应的第二训练数据、基于第一训练数据训练得到的第一类别识别模型，以及基于第二训练数据训练得到的第二类别识别模型，将第一样本数据输入至第二类别识别模型进行对象类别识别，得到第一样本数据在第二对象类别维度对应的第三标签信息，将第二样本数据输入至第一类别识别模型进行对象类别识别，得到第二样本数据在第一对象类别维度对应的第四标签信息，可以实现第一训练数据中第一样本数据在第二对象类别维度下标签信息的预测，以及第二训练数据中第二样本数据在第一对象类别维度下标签信息的预测，再对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，得到第一样本数据在第一对象类别维度和第二对象类别维度对应的第五标签信息，以及第二样本数据在第一对象类别维度和第二对象类别维度对应的第六标签信息，可以实现两种不同的对象类别维度的标签的融合，极大的减少标注成本，然后，基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，对预设识别模型进行训练，得到在第一对象类别维度和第二对象类别维度对应的目标类别识别模型，可以在减少标注成本的同时，提高目标类别识别模型对多类别的识别效率和识别准确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种应用系统的示意图；

图2是根据一示例性实施例示出的一种类别识别模型的生成方法的流程图；

图3是根据一示例性实施例示出的一种类别识别模型的生成方法的流程示意图；

图4是根据一示例性实施例示出的一种类别识别模型的生成装置的框图；

图5是根据一示例性实施例示出的一种用于生成目标类别识别模型或对象类别识别的电子设备的框图；

图6是根据一示例性实施例示出的另一种用于生成目标类别识别模型或对象类别识别的电子设备的框图。

具体实施方式

以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本申请，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本申请同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本申请的主旨。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

近年来，随着人工智能技术研究和进步，人工智能技术在多个领域得到广泛应用，本申请实施例提供的方案涉及机器学习/深度学习等技术，具体通过如下实施例进行说明：

请参阅图1，图1是根据一示例性实施例示出的一种应用系统的示意图。所述应用系统可以用于本申请的类别识别模型的生成方法或类别识别方法。如图1所示，该应用系统至少可以包括服务器01和终端02。

本申请实施例中，服务器01可以用于生成目标类别识别模型，或者基于目标类别识别模型，对待识别文本信息进行对象类别识别。具体地，上述服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

本申请实施例中，终端02可以用于生成待识别文本信息。上述终端02可以包括智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、车载终端、数字助理、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、智能可穿戴设备等类型的实体设备，也可以包括运行于实体设备中的软体，例如应用程序等。本申请实施例中上述终端02上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。

此外，需要说明的是，图1所示的仅仅是本公开提供的一种应用环境，在实际应用中，还可以包括其他应用环境，例如，基于目标类别识别模型，对待识别文本信息进行对象类别识别的过程，也可以在终端02上实现。

本说明书实施例中，上述终端02以及服务器01可以通过有线或无线通信方式进行直接或间接地连接，本申请对此不作限定。

需要说明的是，以下图中示出的是一种可能的步骤顺序，实际上并不限定必须严格按照此顺序。有些步骤可以在互不依赖的情况下并行执行。

具体地，图2是根据一示例性实施例示出的一种类别识别模型的生成方法的流程图。如图2所示，该类别识别模型的生成方法可以用于终端或服务器等电子设备中，具体可以包括以下步骤：

在步骤S201中，获取第一训练数据、第二训练数据、基于第一训练数据训练得到的第一类别识别模型，以及基于第二训练数据训练得到的第二类别识别模型。

在一个具体的实施例中，第一训练数据可以是指第一对象类别维度对应的训练数据。第一训练数据可以包括第一样本数据和第一样本数据在第一对象类别维度对应的第一标签信息。第一样本数据可以包括多个第一样本子数据。每个第一样本子数据可以包括至少一个文本单元。第一标签信息可以是指在第一对象类别维度下第一样本数据对应的标签信息。第一标签信息可以包括每个第一样本子数据对应的多个第一指示信息。任一第一指示信息可以表征任一第一样本子数据中每个文本单元属于第一对象类别维度中每种对象类别维度的概率。任一第一指示信息可以包括第一对象类别维度中每种对象类别维度对应的第一概率。

在一个具体的实施例中，第一对象类别维度可以是指当前模型可识别的对象类别维度。第一对象类别维度可以包括至少一种实体类别维度和非实体类别维度。其中，实体类别维度可以表征该实体类别维度对应的文本单元属于实体；非实体类别维度可以表征该非实体类别维度对应的文本单元不属于实体。示例性的，以需要识别的类别为“人名”为例，第一对象类别维度可以包括B-人名(即人名中的第一个文本单元)、I-人名(即人名中位于中间的文本单元)、E-人名(即人名中的最后一个文本单元)、S-人名(即单个文本单元的人名)和O(即其他类别)；其中，至少一种实体类别维度可以包括B-人名、I-人名、E-人名和S-人名；非实体类别维度可以为O。具体的，第一对象类别维度可以根据实际需要进行设定。

在一个具体的实施例中，可以从预先设置的样本数据集中获取多个样本子数据，作为第一样本数据，再在第一对象类别维度的基础上，对第一样本数据中的多个样本子数据进行标注处理，可以得到每个样本子数据中的每个文本单元对应的第一指示信息；其中，样本数据集可以包括多个样本子数据。可以理解的是，样本数据集中样本子数据的数量可以大于第一样本数据中样本子数据的数量。

在一个具体的实施例中，第二训练数据可以是指第二对象类别维度对应的训练数据。第二训练数据可以包括第二样本数据和第二样本数据在第二对象类别维度对应的第二标签信息。第二样本数据可以包括多个第二样本子数据。每个第二样本子数据可以包括至少一个文本单元。第二标签信息可以是指在第二对象类别维度下第二样本数据对应的标签信息。第二标签信息可以包括每个第二样本子数据对应的多个第二指示信息。任一第二指示信息可以表征任一第二样本子数据中每个文本单元属于第二对象类别维度中每种对象类别维度的概率。任一第二指示信息可以包括第二对象类别维度中每种对象类别维度对应的第二概率。

在一个具体的实施例中，第二对象类别维度可以是指当前模型需要新增识别的对象类别维度。第二对象类别维度可以包括至少一种实体类别维度和非实体类别维度。具体的，第二对象类别维度可以根据实际需要进行设定。

在一个具体的实施例中，可以从样本数据集中获取多个样本子数据，作为第二样本数据，再在第二对象类别维度的基础上，对第二样本数据中的多个样本子数据进行标注处理，可以得到每个样本子数据中的每个文本单元对应的第二指示信息。可以理解的是，样本数据集中样本子数据的数量可以大于第二样本数据中样本子数据的数量。

在一个具体的实施例中，第一类别识别模型可以用于识别待识别文本信息中是否存在在第一对象类别维度的待识别对象，以及识别该待识别对象的对象类别。第一类别识别模型可以包括编码层和分类层；其中，编码层可以用于对输入模型的文本信息进行编码处理，得到特征信息；分类层可以用于对编码层编码得到的特征信息进行分类处理，得到能够表征输入的文本信息所属的对象类别的指示信息。其中，待识别文本信息可以是指需要识别是否存在待识别对象，以及需要识别该待识别对象的对象类别的文本信息。

在一个具体的实施例中，可以基于第一训练数据，对预设识别模型进行训练，可以得到第一类别识别模型。其中，预设识别模型可以是指待训练的类别识别模型。预设识别模型可以用于识别待识别文本中是否存在待识别对象以及识别该待识别对象的对象类别的模型。预设识别模型可以包括编码层和分类层。具体的，可以先基于第一对象类别维度，设置预设识别模型中分类层的模型参数维度，再对预设识别模型中参数进行初始化，可以得到初始的第一预设识别模型；从第一样本数据中，可以确定第一当前数据，以及第一标签信息中第一当前数据对应的标签信息，其中，第一当前数据可以包括至少一个第一样本子数据；将第一当前数据输入至上述第一预设识别模型中，可以得到第一当前数据对应的对象识别结果，结合上述第一当前数据对应的对象识别结果和第一当前数据对应的标签信息，可以得到第四损失信息；基于上述第四损失信息，对上述第一预设识别模型进行更新，可以得到更新后的第一预设识别模型，基于上述更新后的第一预设识别模型，重复从第一样本数据中，确定上述第一当前数据以及第一当前数据对应的标签信息至上述基于上述第四损失信息，对上述第一预设识别模型进行更新的步骤，直至满足预设收敛条件，将满足预设收敛条件时得到的第一预设识别模型，作为第一类别识别模型。其中，上述预设收敛条件可以包括满足预设迭代次数，或损失信息小于预设损失信息。

在一个具体的实施例中，第二类别识别模型可以用于识别待识别文本信息中是否存在在第二对象类别维度的待识别对象，以及识别该待识别对象的对象类别。第二类别识别模型可以包括编码层和分类层。

在一个具体的实施例中，可以基于第二训练数据，对预设识别模型进行训练，可以得到第二类别识别模型。具体的，可以先基于第二对象类别维度，设置预设识别模型中分类层的模型参数维度，再对预设识别模型中参数进行初始化，可以得到初始的第二预设识别模型；从第二样本数据中，可以确定第二当前数据，以及第二标签信息中第二当前数据对应的标签信息，其中，第二当前数据可以包括至少一个第二样本子数据；将第二当前数据输入至上述第二预设识别模型中，可以得到第二当前数据对应的对象识别结果，结合上述第二当前数据对应的对象识别结果和第二当前数据对应的标签信息，可以得到第五损失信息；基于上述第五损失信息，对上述第二预设识别模型进行更新，可以得到更新后的第二预设识别模型，基于上述更新后的第二预设识别模型，重复从第二样本数据中，确定上述第二当前数据以及第二当前数据对应的标签信息至上述基于上述第五损失信息，对上述第二预设识别模型进行更新的步骤，直至满足预设收敛条件，将满足预设收敛条件时得到的第二预设识别模型，作为第二类别识别模型。

在上述实施例中，通过基于第一训练数据训练得到第一类别识别模型，并基于第二训练数据训练得到第二类别识别模型，可以便于后续通过第一类别识别模型，实现对第二样本数据在第一对象类别维度下的标签信息的预测，以及通过第二类别识别模型，实现对第一样本数据在第二对象类别维度下的标签信息的预测。

在步骤S203中，将第一样本数据输入至第二类别识别模型进行对象类别识别，得到第一样本数据在第二对象类别维度对应的第三标签信息。

在一个具体的实施例中，第三标签信息可以是指第一样本数据通过第二类别识别模型预测得到的在第二对象类别维度下的标签信息。第三标签信息可以包括每个第一样本子数据对应的多个第三指示信息。任一第三指示信息可以表征任一第一样本子数据中每个文本单元属于第二对象类别维度中每种对象类别维度的概率。任一第三指示信息可以包括任一第一样本子数据中每个文本单元对应的多个第三概率。其中，任一第三概率可以是指任一第一样本子数据中每个文本单元属于第二对象类别维度中任一对象类别维度的概率。

在一个具体的实施例中，将第一样本数据中任一第一样本子数据输入至第二类别识别模型中的编码层进行编码处理，可以得到上述任一第一样本子数据中每个文本单元对应的第一特征信息；再将上述第一特征信息输入至第二类别识别模型中的分类层进行分类处理，可以得到任一第一样本子数据中任一文本单元对应的第三指示信息。具体的，上述编码层可以包括分词模块和语义表示模块；将任一第一样本子数据输入至分词模块进行分词处理，可以得到任一第一样本子数据对应的至少一个文本单元，再将上述至少一个文本单元输入至语义表示模块进行语义分析处理，可以得到上述第一特征信息。进一步的，第三指示信息可以通过以下公式得到：

Prob＝softmax(W*V_{token_i}+b)

其中，Prob为第三指示信息；V_{token_i}为第i个文本单元对应的第一特征信息；W和b为分类层中的模型参数；softmax()为归一化指数函数。

在上述实施例中，通过将第一样本数据输入至第二类别识别模型进行对象类别识别，得到第三标签信息，可以实现第一训练数据中第一样本数据在第二对象类别维度下标签信息的预测。

在步骤S205中，将第二样本数据输入至第一类别识别模型进行对象类别识别，得到第二样本数据在第一对象类别维度对应的第四标签信息。

在一个具体的实施例中，第四标签信息可以是指第二样本数据通过第一类别识别模型预测得到的在第一对象类别维度下的标签信息。第四标签信息可以包括每个第二样本子数据对应的多个第四指示信息。任一第四指示信息可以表征任一第二样本子数据中每个文本单元属于第一对象类别维度中每种对象类别维度的概率。任一第四指示信息可以包括任一第二样本子数据中每个文本单元对应的多个第四概率。其中，任一第四概率可以是指任一第二样本子数据中每个文本单元属于第一对象类别维度中任一对象类别维度的概率。

在一个具体的实施例中，将第二样本数据中任一第二样本子数据输入至第一类别识别模型中的编码层进行编码处理，可以得到上述任一第二样本子数据中每个文本单元对应的第二特征信息；再将上述第二特征信息输入至第一类别识别模型中的分类层进行分类处理，可以得到任一第二样本子数据中任一文本单元对应的第四指示信息。具体的，上述编码层的具体编码处理过程和分类层的具体分类处理过程可以参照上述步骤S203，此处不再赘述。

在上述实施例中，通过将第二样本数据输入至第一类别识别模型进行对象类别识别，得到第四标签信息，可以实现第二训练数据中第二样本数据在第一对象类别维度下标签信息的预测。

在步骤S207中，对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，得到第一样本数据在第一对象类别维度和第二对象类别维度对应的第五标签信息，以及第二样本数据在第一对象类别维度和第二对象类别维度对应的第六标签信息。

在一个具体的实施例中，第五标签信息可以是指第一样本数据在第一对象类别维度和第二对象类别维度对应的标签信息。第五标签信息可以是对第一标签信息和第二标签信息融合后的标签信息。可以理解的是，第五标签信息可以表征第一样本数据属于两者合并后的对象类别维度中每种对象类别维度的概率。第五标签信息可以包括任一第一样本子数据中至少一个文本单元各自对应的第五指示信息。任一第五指示信息可以表征任一第一样本子数据中每个文本单元属于第一对象类别维度和第二对象类别维度中每种对象类别维度的概率。任一第五指示信息可以包括任一第一样本子数据中每个文本单元对应的多个第五概率。其中，任一第五概率可以是指任一第一样本子数据中每个文本单元属于第一对象类别维度和第二对象类别维度中任一对象类别维度的概率。

在一个具体的实施例中，第六标签信息可以是指第二样本数据在第一对象类别维度和第二对象类别维度对应的标签信息。第六标签信息可以是对第一标签信息和第二标签信息融合后的标签信息。可以理解的是，第六标签信息可以表征第二样本数据属于两者合并后的对象类别维度中每种对象类别维度的概率。第六标签信息可以包括任一第二样本子数据中至少一个文本单元各自对应的第六指示信息。任一第六指示信息可以表征任一第二样本子数据中每个文本单元属于第一对象类别维度和第二对象类别维度中每种对象类别维度的概率。任一第六指示信息可以包括任一第二样本子数据中每个文本单元对应的多个第六概率。其中，任一第六概率可以是指任一第二样本子数据中每个文本单元属于第一对象类别维度和第二对象类别维度中任一对象类别维度的概率。

在一个具体的实施例中，上述步骤S207可以包括：

基于第一标签信息和第三标签信息进行类别合并处理，得到第五标签信息；

基于第二标签信息和第四标签信息进行类别合并处理，得到第六标签信息。

在一个具体的实施例中，在第一对象类别维度包括非实体类别维度的情况下，上述基于第一标签信息和第三标签信息进行类别合并处理，得到第五标签信息，可以包括：

在任一第一指示信息指示对应的文本单元属于非实体类别维度的情况下，生成第一对象类别维度对应的第一补充指示信息；

基于第一补充指示信息和任一第一指示信息对应的任一第三指示信息，生成任一第一指示信息对应的第五指示信息。

在一个具体的实施例中，第一补充指示信息对应的对象类别维度可以包括非实体类别维度，也可以不包括非实体类别维度。在第一补充指示信息对应的维度包括非实体类别维度的情况下，任一第一补充指示信息可以表征任一第一样本子数据中任一文本单元属于第一对象类别维度(包括非实体类别维度)中每种对象类别维度的概率；在第一补充指示信息对应的维度不包括非实体类别维度的情况下，任一第一补充指示信息可以表征任一第一样本子数据中任一文本单元属于第一对象类别维度中除非实体类别维度之外每种对象类别维度的概率。

在一个具体的实施例中，在任一第一指示信息指示中最大概率对应的对象类别维度为非实体类别维度的情况下，可以确定该第一指示信息指示对应的文本单元属于非实体类别维度，可以生成上述第一补充指示信息。具体的，在第一补充指示信息对应的维度包括非实体类别维度的情况下，生成得到的第一补充指示信息中，第一对象类别维度中每个对象类别维度对应的概率均为0；在第一补充指示信息对应的维度不包括非实体类别维度的情况下，生成得到的第一补充指示信息中，第一对象类别维度中除非实体类别维度之外每种对象类别维度的概率均为0。

在一个具体的实施例中，基于第一补充指示信息、任一第一指示信息对应的任一第三指示信息，以及合并后的对象类别维度，可以生成任一第一指示信息对应的第五指示信息。具体的，可以将第一补充指示信息中除非实体类别维度之外每种维度对应的概率，作为第五指示信息中第一对象类别维度中除非实体类别维度之外每种维度对应的概率；可以将任一第三指示信息中第二对象类别维度中每种维度对应的概率，作为第五指示信息中合并后的对象类别维度中属于第二对象类别维度的维度对应的概率。示例性的，假设第一对象类别维度包括实体类别维度1A、实体类别维度1B和非实体类别维度，第二对象类别维度包括实体类别维度2A、实体类别维度2B、实体类别维度2C、实体类别维度2D和非实体类别维度，第一补充指示信息为{0(对应实体类别维度1A)，0(对应实体类别维度1B)，0(对应非实体类别维度)}，第一指示信息对应的第三指示信息为{0(对应实体类别维度2A)，P₁(对应实体类别维度2B)，P₂(对应实体类别维度2C)，P₃(对应实体类别维度2D)，0(对应非实体类别维度)}，则生成的上述第一指示信息对应的第五指示信息可以为{0(对应实体类别维度1A)，0(对应实体类别维度1B)，0(对应实体类别维度2A)，P₁(对应实体类别维度2B)，P₂(对应实体类别维度2C)，P₃(对应实体类别维度2D)，0(对应非实体类别维度)}。

在一个具体的实施例中，在第一对象类别维度还包括至少一种实体类别维度的情况下，上述方法还可以包括：

在任一第一指示信息指示对应的文本单元属于任一实体类别维度的情况下，生成第二对象类别维度对应的第二补充指示信息；

基于第二补充指示信息和任一第一指示信息，生成任一第一指示信息对应的第五指示信息。

在一个具体的实施例中，第二补充指示信息对应的对象类别维度可以包括非实体类别维度，也可以不包括非实体类别维度。在第二补充指示信息对应的维度包括非实体类别维度的情况下，任一第二补充指示信息可以表征任一第一样本子数据中任一文本单元属于第二对象类别维度(包括非实体类别维度)中每种对象类别维度的概率；在第二补充指示信息对应的维度不包括非实体类别维度的情况下，任一第二补充指示信息可以表征任一第一样本子数据中任一文本单元属于第二对象类别维度中除非实体类别维度之外每种对象类别维度的概率。

在一个具体的实施例中，在任一第一指示信息指示中最大概率对应的对象类别维度为任一实体类别维度的情况下，可以确定该第一指示信息指示对应的文本单元属于任一实体类别维度，可以生成上述第二补充指示信息。具体的，在第二补充指示信息对应的维度包括非实体类别维度的情况下，生成得到的第二补充指示信息中，第二对象类别维度中每个对象类别维度对应的概率均为0；在第二补充指示信息对应的维度不包括非实体类别维度的情况下，生成得到的第二补充指示信息中，第二对象类别维度中除非实体类别维度之外每种对象类别维度的概率均为0。

在一个具体的实施例中，基于第二补充指示信息、任一第一指示信息，以及合并后的对象类别维度，可以生成任一第一指示信息对应的第五指示信息。具体的，可以将第二补充指示信息中除非实体类别维度之外每种维度对应的概率，作为第五指示信息中第二对象类别维度中除非实体类别维度之外每种维度对应的概率；可以将任一第一指示信息中第一对象类别维度中每种维度对应的概率，作为第五指示信息中合并后的对象类别维度中属于第一对象类别维度的维度对应的概率。示例性的，假设假设第一对象类别维度包括实体类别维度1A、实体类别维度1B和非实体类别维度，第二对象类别维度包括实体类别维度2A、实体类别维度2B、实体类别维度2C、实体类别维度2D和非实体类别维度，第一指示信息为{0(对应实体类别维度1A)，1(对应实体类别维度1B)，0(对应非实体类别维度)}，第二补充指示信息为{0(对应实体类别维度2A)，0(对应实体类别维度2B)，0(对应实体类别维度2C)，0(对应实体类别维度2D)，0(对应非实体类别维度)}，生成的上述第一指示信息对应的第五指示信息为{0(对应实体类别维度1A)，1(对应实体类别维度1B)，0(对应实体类别维度2A)，0(对应实体类别维度2B)，0(对应实体类别维度2C)，0(对应实体类别维度2D)，0(对应非实体类别维度)}。

在一个具体的实施例中，在第二对象类别维度包括非实体类别维度的情况下，上述基于第二标签信息和第四标签信息进行类别合并处理，得到第六标签信息，可以包括：

在任一第二指示信息指示对应的文本单元属于非实体类别维度的情况下，生成第二对象类别维度对应的第三补充指示信息；

基于第三补充指示信息和任一第二指示信息对应的任一第四指示信息，生成任一第二指示信息对应的第六指示信息。

在一个具体的实施例中，第三补充指示信息对应的对象类别维度可以包括非实体类别维度，也可以不包括非实体类别维度。在第三补充指示信息对应的维度包括非实体类别维度的情况下，任一第三补充指示信息可以表征任一第二样本子数据中任一文本单元属于第二对象类别维度(包括非实体类别维度)中每种对象类别维度的概率；在第三补充指示信息对应的维度不包括非实体类别维度的情况下，任一第三补充指示信息可以表征任一第二样本子数据中任一文本单元属于第二对象类别维度中除非实体类别维度之外每种对象类别维度的概率。

在一个具体的实施例中，在任一第二指示信息指示中最大概率对应的对象类别维度为非实体类别维度的情况下，可以确定该第二指示信息指示对应的文本单元属于非实体类别维度，可以生成上述第三补充指示信息。具体的，在第三补充指示信息对应的维度包括非实体类别维度的情况下，生成得到的第三补充指示信息中，第二对象类别维度中每个对象类别维度对应的概率均为0；在第三补充指示信息对应的维度不包括非实体类别维度的情况下，生成得到的第三补充指示信息中，第二对象类别维度中除非实体类别维度之外每种对象类别维度的概率均为0。

在一个具体的实施例中，基于第三补充指示信息、任一第二指示信息对应的任一第四指示信息，以及合并后的对象类别维度，可以生成任一第二指示信息对应的第六指示信息。具体的，可以将第三补充指示信息中除非实体类别维度之外每种维度对应的概率，作为第六指示信息中第二对象类别维度中除非实体类别维度之外每种维度对应的概率；可以将任一第四指示信息中第一对象类别维度中每种维度对应的概率，作为第六指示信息中合并后的对象类别维度中属于第一对象类别维度的维度对应的概率。在任一第二指示信息指示对应的文本单元属于非实体类别维度的情况下，具体的生成第六指示信息的过程，可以参照上述基于第二补充指示信息和任一第一指示信息，生成任一第一指示信息对应的第五指示信息的过程，此处不再赘述。

在一个具体的实施例中，在第二对象类别维度还包括至少一种实体类别维度的情况下，上述方法还可以包括：

在任一第二指示信息指示对应的文本单元属于任一实体类别维度的情况下，生成第一对象类别维度对应的第四补充指示信息；

基于第四补充指示信息和任一第二指示信息，生成任一第二指示信息对应的第六指示信息。

在一个具体的实施例中，第四补充指示信息对应的对象类别维度可以包括非实体类别维度，也可以不包括非实体类别维度。在第四补充指示信息对应的维度包括非实体类别维度的情况下，任一第四补充指示信息可以表征任一第二样本子数据中任一文本单元属于第一对象类别维度(包括非实体类别维度)中每种对象类别维度的概率；在第四补充指示信息对应的维度不包括非实体类别维度的情况下，任一第四补充指示信息可以表征任一第二样本子数据中任一文本单元属于第一对象类别维度中除非实体类别维度之外每种对象类别维度的概率。

在一个具体的实施例中，在任一第二指示信息指示中最大概率对应的对象类别维度为任一实体类别维度的情况下，可以确定该第二指示信息指示对应的文本单元属于任一实体类别维度，可以生成上述第四补充指示信息。具体的，在第四补充指示信息对应的维度包括非实体类别维度的情况下，生成得到的第四补充指示信息中，第一对象类别维度中每个对象类别维度对应的概率均为0；在第四补充指示信息对应的维度不包括非实体类别维度的情况下，生成得到的第四补充指示信息中，第一对象类别维度中除非实体类别维度之外每种对象类别维度的概率均为0。

在一个具体的实施例中，基于第四补充指示信息和任一第二指示信息，以及合并后的对象类别维度，可以生成任一第二指示信息对应的第六指示信息。具体的，可以将第四补充指示信息中除非实体类别维度之外每种维度对应的概率，作为第六指示信息中第一对象类别维度中除非实体类别维度之外每种维度对应的概率；可以将任一第二指示信息中第二对象类别维度中每种维度对应的概率，作为第六指示信息中合并后的对象类别维度中属于第二对象类别维度的维度对应的概率。在任一第二指示信息指示对应的文本单元属于任一实体类别维度的情况下，具体的基于第四补充指示信息和任一第二指示信息，生成任一第二指示信息对应的第六指示信息的过程，可以参照上述基于第二补充指示信息和任一第一指示信息，生成任一第一指示信息对应的第五指示信息的过程，此处不再赘述。

在上述实施例中，通过对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，可以实现两种不同的对象类别维度的标签的融合，极大的减少标注成本，进而可以在减少标注成本的同时，提高目标类别识别模型对多类别的识别效率和识别准确度。

在步骤S209中，基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，对预设识别模型进行训练，得到目标类别识别模型。

在一个具体的实施例中，预设识别模型可以是指待训练的类别识别模型。预设识别模型可以用于识别待识别文本中是否存在待识别对象以及识别该待识别对象的对象类别的模型。预设识别模型可以包括编码层和分类层。

在一个具体的实施例中，目标类别识别模型可以是指具有同时识别第一对象类别维度和第二对象类别维度的能力的类别识别模型。可以理解的是，目标类别识别模型的可识别维度可以包括第一对象类别维度和第二对象类别维度。

在一个具体的实施例中，上述步骤S209可以包括：

基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，确定当前样本数据和当前样本数据对应的当前标签信息；

将当前样本数据输入至预设识别模型进行对象类别识别，得到当前对象类别信息；

基于当前对象类别信息和当前标签信息，确定第一损失信息；

基于第一损失信息，对预设识别模型进行更新，得到更新后的预设识别模型，基于更新后的预设识别模型，重复基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，确定当前样本数据和当前样本数据对应的当前标签信息至基于第一损失信息，对预设识别模型进行更新，得到更新后的预设识别模型的步骤，直至满足预设收敛条件；

根据达到预设收敛条件时得到的预设识别模型，确定目标类别识别模型。

在一个具体的实施例中，当前样本数据可以是指当前训练轮次的训练过程中使用的样本数据。其中，当前训练轮次可以是指模型的多轮训练过程中当前时刻所处的训练轮次。当前样本数据可以包括至少一个第一样本子数据和至少一个第二样本子数据中的至少一个。可以理解的是，当前样本数据可以是至少一个第一样本子数据，也可以是至少一个第二样本子数据，或者还可以是至少一个第一样本子数据和至少一个第二样本子数据。当前标签信息可以是指当前样本数据对应的标签信息。当前标签信息可以包括当前样本数据中的样本子数据对应的标签信息。

在一个具体的实施例中，可以从第一样本数据和第二样本数据中，选出至少一个样本子数据，作为当前样本数据，相应的，从第五标签信息和第六标签信息中，确定当前样本数据对应的标签信息，并将当前样本数据对应的标签信息作为当前标签信息。

在一个具体的实施例中，当前对象类别信息可以表征预设识别模型预测的当前样本数据中任一样本子数据的每个文本单元所属的对象类别维度。当前对象类别信息可以包括当前样本数据中每个样本子数据对应的对象类别信息，其中，每个样本子数据对应的对象类别信息可以表征该样本子数据中每个文本单元属于合并后的对象类别维度中任一对象类别维度的概率。

在一个具体的实施例中，在第一个轮次(即首次对预设识别模型更新之前)时，可以先基于合并后的对象类别维度，设置预设识别模型中分类层的模型参数维度，再对预设识别模型中参数进行初始化，可以的得到初始的第三预设识别模型。然后，将当前样本数据中任一样本子数据输入至第三预设识别模型中的编码层进行编码处理，可以得到上述任一样本子数据中每个文本单元对应的第三特征信息；再将上述第三特征信息输入至第三预设识别模型中的分类层进行分类处理，可以得到任一样本子数据对应的对象类别信息，相应的，可以得到当前对象类别信息。具体的，上述编码层的具体编码处理过程和分类层的具体分类处理过程可以参照上述步骤S203，此处不再赘述。

在一个具体的实施例中，第一损失信息可以表征当前对象类别信息与当前标签信息之间的偏差程度。第一损失信息可以用于为预设识别模型的更新提供参考。

在一个具体的实施例中，第一损失信息可以通过以下公式得到：

其中，D(P||Q)为第一损失信息；P(x)为当前对象类别信息中第x个样本子数据对应的对象类别信息；Q(x)为当前标签信息中第x个样本子数据对应的标签信息。

在一个具体的实施例中，基于第一损失信息，可以对上述第三预设识别模型中的模型参数进行更新，可以得到更新后的第三预设识别模型，基于更新后的第三预设识别模型，重复基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，确定当前样本数据和当前样本数据对应的当前标签信息至基于第一损失信息，对第三预设识别模型进行更新的步骤，直至满足预设收敛条件。其中，上述预设收敛条件可以包括满足预设迭代次数，或损失信息小于预设损失信息。具体的，可以基于第一损失信息，确定更新梯度，并基于上述更新梯度，对第三预设识别模型中的模型参数进行更新。可以基于梯度下降的方式，对第三预设识别模型进行训练优化。

在一个具体的实施例中，可以将达到预设收敛条件时得到的第三预设识别模型，作为目标类别识别模型。

在上述实施例中，基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，对预设识别模型进行训练，得到在第一对象类别维度和第二对象类别维度对应的目标类别识别模型，可以在通过标签融合处理以减少标注成本的同时，提高目标类别识别模型对多类别的识别效率和识别准确度。

在一个具体的实施例中，上述基于第一损失信息，对预设识别模型进行更新，得到更新后的预设识别模型之后，上述方法还可以包括：

获取第三样本数据；

将第三样本数据输入至更新后的预设识别模型进行对象类别识别，得到预测标签信息；

从第三样本数据和预测标签信息中，确定第七标签信息和第七标签信息对应的至少一个第三样本子数据；

相应的，上述基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，确定当前样本数据和当前样本数据对应的当前标签信息，可以包括：

从第一样本数据、第二样本数据和至少一个第三样本子数据中，确定当前样本数据；

基于当前样本数据，从第五标签信息、第六标签信息和第七标签信息中，确定当前标签信息。

在一个具体的实施例中，第三样本数据可以包括多个第三样本子数据。具体的，可以从样本数据集中获取至少一个样本子数据，作为第三样本数据。可选的，不同的训练轮次中，第三样本数据可以是一样的样本数据，也可以是不一样的样本数据，本公开不作限定。

在一个具体的实施例中，预测标签信息可以是指通过更新后的预设识别模型对第三样本数据预测得到的标签信息。预测标签信息可以包括第三样本数据中任一第三样本子数据对应的至少一个文本单元各自对应的预测指示信息。其中，任一预测指示信息可以表征任一第三样本子数据中，任一文本单元属于合并后的对象类别维度中任一维度的概率。任一预测指示信息可以包括合并后的对象类别维度中每个对象类别维度对应的预测类别概率。预测类别概率可以是指该预测类别概率对应的文本单元属于任一对象类别维度的概率。

在一个具体的实施例中，将第三样本数据中任一第三样本子数据输入至更新后的预设识别模型中的编码层进行编码处理，可以得到上述任一第三样本子数据中每个文本单元对应的第四特征信息；再将上述第四特征信息输入至上述更新后的预设识别模型中的分类层进行分类处理，可以得到任一第三样本子数据对应的至少一个预测指示信息，相应的，可以得到预测标签信息。

在一个具体的实施例中，第七标签信息可以是指预测标签信息中可以用于当前训练轮次中训练的标签信息。第七标签信息可以为预测标签信息中至少一个满足预设标签条件的标签信息。第七标签信息可以包括至少一个第三样本子数据中的任一文本单元对应的第七指示信息。其中，预设标签条件可以是存在至少一个预测类别概率大于预设概率。

在一个具体的实施例中，从上述预测标签信息中，选出存在至少一个预测类别概率大于预设概率的预测指示信息，可以得到至少一个第七指示信息，并将上述至少一个第七指示信息作为上述第七标签信息。然后，可以从第三样本数据中，确定第七标签信息中每个标签信息对应的第三样本子数据，相应的，可以得到第七标签信息对应的至少一个第三样本子数据。

在一个具体的实施例中，可以从第一样本数据、第二样本数据和至少一个第三样本子数据中，选出至少一个样本子数据，作为当前样本数据。再结合当前样本数据，从第五标签信息、第六标签信息和第七标签信息中，确定当前样本数据中每个样本子数据对应的标签信息，相应的，可以得到当前标签信息。

在一个具体的实施例中，上述基于当前对象类别信息和当前标签信息，确定第一损失信息，可以包括：

从当前对象类别信息中，确定当前样本数据中第一当前样本数据对应的第一对象类别信息和当前样本数据中第二当前样本数据对应的第二对象类别信息；

基于第一对象类别信息和当前标签信息中第一当前样本数据对应的标签信息，确定第二损失信息；

根据第二对象类别信息和当前标签信息中第二当前样本数据对应的标签信息，确定第三损失信息；

基于第二损失信息和第三损失信息，确定第一损失信息。

在一个具体的实施例中，第一当前样本数据可以是指当前样本数据中包含于第一样本数据或第二样本数据的样本数据。第二当前样本数据可以是指当前样本数据中包含于至少一个第三样本子数据的样本数据。

在一个具体的实施例中，第一对象类别信息可以是指当前对象类别信息中第一当前样本数据对应的对象类别信息。第二对象类别信息可以是指当前对象类别信息中第二当前样本数据对应的对象类别信息。

在一个具体的实施例中，可以在从第一样本数据、第二样本数据和至少一个第三样本子数据中，确定当前样本数据的过程中，对确定为当前样本数据中的样本子数据进行数据源标记，从而可以通过上述数据源标记区分当前样本数据中，来源于第一样本数据或第二样本数据的样本子数据，或者是来源于上述至少一个第三样本子数据的样本子数据，相应的，可以确定当前样本数据中的第一当前样本数据和第二当前样本数据。

在一个具体的实施例中，当前标签信息可以包括从第五标签信息和第六标签信息中的至少一个选出的标签信息，也可以包括从第七标签信息中选出的标签信息。当前标签信息中第一当前样本数据对应的标签信息可以是指当前标签信息中从第五标签信息和第六标签信息中的至少一个选出的标签信息。当前标签信息中第二当前样本数据对应的标签信息可以是指当前标签信息中从第七标签信息中选出的标签信息。

在一个具体的实施例中，基于第一当前样本数据和第二当前样本数据，可以从当前对象类别信息中，确定第一当前样本数据对应的第一对象类别信息，以及第二当前样本数据对应的第二对象类别信息。

在一个具体的实施例中，第二损失信息可以表征第一对象类别信息和当前标签信息中第一当前样本数据对应的标签信息之间的偏差程度。具体的，第二损失信息可以通过以下公式得到：

其中，D(P||Q)为第二损失信息；P(x)为第一对象类别信息中第x个样本子数据对应的对象类别信息；Q(x)为当前标签信息中第一当前样本数据对应的标签信息中第x个样本子数据对应的标签信息。

在一个具体的实施例中，第三损失信息可以表征第二对象类别信息和当前标签信息中第二当前样本数据对应的标签信息之间的偏差程度。具体的，第三损失信息的确定过程可以参照上述第二损失信息的确定过程，此处不再赘述。

在一个具体的实施例中，可以对第二损失信息和第三损失信息进行叠加处理，得到第一损失信息。具体的，可以是直接对第二损失信息和第三损失信息进行叠加，得到第一损失信息，也可以是基于第二损失信息、第三损失信息和预设权重信息，确定第一损失信息。其中，第一损失信息可以通过以下公式得到：

Loss_final＝Loss_train+a*Loss_fake

其中，Loss_final为第一损失信息；Loss_train为第二损失信息；a为预设权重信息；Loss_fake为第三损失信息。

在上述实施例中，通过将第三样本数据输入至更新后的预设识别模型进行对象类别识别，得到预测标签信息，从第三样本数据和预测标签信息中，确定第七标签信息和第七标签信息对应的至少一个第三样本子数据，从第一样本数据、第二样本数据和至少一个第三样本子数据中，确定当前样本数据，并基于当前样本数据，从第五标签信息、第六标签信息和第七标签信息中，确定当前标签信息，可以在提高目标类别识别模型对多类别的识别效率和识别准确度的基础上，进一步地减少标注成本，降低模型训练成本。

在上述实施例中，通过获取第一对象类别维度对应的第一训练数据、第二对象类别维度对应的第二训练数据、基于第一训练数据训练得到的第一类别识别模型，以及基于第二训练数据训练得到的第二类别识别模型，将第一样本数据输入至第二类别识别模型进行对象类别识别，得到第一样本数据在第二对象类别维度对应的第三标签信息，将第二样本数据输入至第一类别识别模型进行对象类别识别，得到第二样本数据在第一对象类别维度对应的第四标签信息，可以实现第一训练数据中第一样本数据在第二对象类别维度下标签信息的预测，以及第二训练数据中第二样本数据在第一对象类别维度下标签信息的预测，再对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，得到第一样本数据在第一对象类别维度和第二对象类别维度对应的第五标签信息，以及第二样本数据在第一对象类别维度和第二对象类别维度对应的第六标签信息，可以实现两种不同的对象类别维度的标签的融合，极大的减少标注成本，然后，基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，对预设识别模型进行训练，得到在第一对象类别维度和第二对象类别维度对应的目标类别识别模型，可以在减少标注成本的同时，提高目标类别识别模型对多类别的识别效率和识别准确度。

图3是根据一示例性实施例示出的一种类别识别模型的生成方法的流程示意图。如图3所示，获取第一训练数据和第二训练数据，基于第一训练数据对预设识别模型进行训练，可以得到第一类别识别模型；基于第二训练数据对预设识别模型进行训练，可以得到第二类别识别模型。再将第一样本数据输入至第二类别识别模型进行对象类别识别，可以得到第一样本数据在第二对象类别维度对应的第三标签信息；将第二样本数据输入至第一类别识别模型进行对象类别识别，得到第二样本数据在第一对象类别维度对应的第四标签信息。接着，对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，可以得到第五标签信息和第六标签信息。然后，结合第一样本数据、第二样本数据、第五标签信息和第六标签信息，对预设识别模型进行训练，可以得到目标类别识别模型。

基于上述的类别识别模型的生成方法得到的目标类别识别模型，本公开还提供了一种类别识别方法，该类别识别方法可以用于终端、服务器等电子设备中，可以包括以下步骤：

获取待识别文本信息；

将待识别文本信息输入至基于上述的类别识别模型的生成方法得到的目标类别识别模型进行对象类别识别，得到对象类别识别结果。

图4是根据一示例性实施例示出的一种类别识别模型的生成装置的框图。如图4所示，该装置可以包括：

第一数据获取模块410，可以用于获取第一训练数据、第二训练数据、基于第一训练数据训练得到的第一类别识别模型，以及基于第二训练数据训练得到的第二类别识别模型；第一训练数据包括第一样本数据和第一样本数据在第一对象类别维度对应的第一标签信息，第二训练数据包括第二样本数据和第二样本数据在第二对象类别维度对应的第二标签信息；

第一识别模块420，可以用于将第一样本数据输入至第二类别识别模型进行对象类别识别，得到第一样本数据在第二对象类别维度对应的第三标签信息；

第二识别模块430，可以用于将第二样本数据输入至第一类别识别模型进行对象类别识别，得到第二样本数据在第一对象类别维度对应的第四标签信息；

标签融合处理模块440，可以用于对第一标签信息、第二标签信息、第三标签信息和第四标签信息进行标签融合处理，得到第一样本数据在第一对象类别维度和第二对象类别维度对应的第五标签信息，以及第二样本数据在第一对象类别维度和第二对象类别维度对应的第六标签信息；

模型训练模块450，可以用于基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，对预设识别模型进行训练，得到目标类别识别模型。

在一个具体的实施例中，上述标签融合处理模块440可以包括：

第一类别合并处理模块，可以用于基于第一标签信息和第三标签信息进行类别合并处理，得到第五标签信息；

第二类别合并处理模块，可以用于基于第二标签信息和第四标签信息进行类别合并处理，得到第六标签信息。

在一个具体的实施例中，上述第一类别合并处理模块可以包括：

第一信息生成模块，可以用于在任一第一指示信息指示对应的文本单元属于非实体类别维度的情况下，生成第一对象类别维度对应的第一补充指示信息；

第二信息生成模块，可以用于基于第一补充指示信息和任一第一指示信息对应的任一第三指示信息，生成任一第一指示信息对应的第五指示信息。

在一个具体的实施例中，上述第一类别合并处理模块还可以包括：

第三信息生成模块，可以用于在任一第一指示信息指示对应的文本单元属于任一实体类别维度的情况下，生成第二对象类别维度对应的第二补充指示信息；

第四信息生成模块，可以用于基于第二补充指示信息和任一第一指示信息，生成任一第一指示信息对应的第五指示信息。

在一个具体的实施例中，上述第二类别合并处理模块可以包括：

第五信息生成模块，可以用于在任一第二指示信息指示对应的文本单元属于非实体类别维度的情况下，生成第二对象类别维度对应的第三补充指示信息；

第六信息生成模块，可以用于基于第三补充指示信息和任一第二指示信息对应的任一第四指示信息，生成任一第二指示信息对应的第六指示信息。

在一个具体的实施例中，上述第二类别合并处理模块还可以包括：

第七信息生成模块，可以用于在任一第二指示信息指示对应的文本单元属于任一实体类别维度的情况下，生成第一对象类别维度对应的第四补充指示信息；

第八信息生成模块，可以用于基于第四补充指示信息和任一第二指示信息，生成任一第二指示信息对应的第六指示信息。

在一个具体的实施例中，上述模型训练模块450可以包括：

当前数据确定模块，可以用于基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，确定当前样本数据和当前样本数据对应的当前标签信息；

第四识别模块，可以用于将当前样本数据输入至预设识别模型进行对象类别识别，得到当前对象类别信息；

第一损失确定模块，可以用于基于当前对象类别信息和当前标签信息，确定第一损失信息；

模型更新模块，可以用于基于第一损失信息，对预设识别模型进行更新，得到更新后的预设识别模型，基于更新后的预设识别模型，重复基于第一样本数据、第二样本数据、第五标签信息和第六标签信息，确定当前样本数据和当前样本数据对应的当前标签信息至基于第一损失信息，对预设识别模型进行更新，得到更新后的预设识别模型的步骤，直至满足预设收敛条件；

目标模型确定模块，可以用于根据达到预设收敛条件时得到的预设识别模型，确定目标类别识别模型。

在一个具体的实施例中，上述装置还可以包括：

第二数据获取模块，可以用于获取第三样本数据；

第五识别模块，可以用于将第三样本数据输入至更新后的预设识别模型进行对象类别识别，得到预测标签信息；

数据筛选模块，可以用于从第三样本数据和预测标签信息中，确定第七标签信息和第七标签信息对应的至少一个第三样本子数据，第七标签信息为预测标签信息中至少一个满足预设标签条件的标签信息；

相应的，上述当前数据确定模块可以包括：

当前样本数据确定模块，可以用于从第一样本数据、第二样本数据和至少一个第三样本子数据中，确定当前样本数据；

当前标签信息确定模块，可以用于基于当前样本数据，从第五标签信息、第六标签信息和第七标签信息中，确定当前标签信息。

在一个具体的实施例中，上述第一损失确定模块可以包括：

类别信息确定模块，可以用于从当前对象类别信息中，确定当前样本数据中第一当前样本数据对应的第一对象类别信息和当前样本数据中第二当前样本数据对应的第二对象类别信息，第一当前样本数据包含于第一样本数据和第二样本数据中的至少一个，第二当前样本数据包含于至少一个第三样本子数据；

第二损失确定模块，可以用于基于第一对象类别信息和当前标签信息中第一当前样本数据对应的标签信息，确定第二损失信息；

第三损失确定模块，可以用于根据第二对象类别信息和当前标签信息中第二当前样本数据对应的标签信息，确定第三损失信息；

第四损失确定模块，可以用于基于第二损失信息和第三损失信息，确定第一损失信息。

本公开实施例还提供一种类别识别装置，可以包括：

信息获取模块，可以用于获取待识别文本信息；

第三识别模块，可以用于将待识别文本信息输入至基于上述类别识别模型的生成方法得到的目标类别识别模型进行对象类别识别，得到对象类别识别结果。

关于上述实施例中的装置，其中各个模块和单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是根据一示例性实施例示出的一种用于生成目标类别识别模型或对象类别识别的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图5所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种类别识别模型的生成方法或类别识别方法。

图6是根据一示例性实施例示出的另一种用于生成目标类别识别模型或对象类别识别的电子设备的框图，该电子设备可以是终端，其内部结构图可以如图6所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种类别识别模型的生成方法或类别识别方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该电子设备的输入装置可以是显示屏上覆盖的触摸层，也可以是电子设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图5或图6中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器；其中，该处理器被配置为执行该指令，以实现如本公开实施例中的类别识别模型的生成方法或类别识别方法。

在示例性实施例中，还提供了一种计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的类别识别模型的生成方法或类别识别方法。

在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例中的类别识别模型的生成方法或类别识别方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

可以理解的是，在本申请的具体实施方式中，涉及到用户信息等相关的数据，当本申请以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种类别识别模型的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第一标签信息、所述第二标签信息、所述第三标签信息和所述第四标签信息进行标签融合处理，得到所述第一样本数据在所述第一对象类别维度和所述第二对象类别维度对应的第五标签信息，以及所述第二样本数据在所述第一对象类别维度和所述第二对象类别维度对应的第六标签信息，包括：

基于所述第一标签信息和所述第三标签信息进行类别合并处理，得到所述第五标签信息；

基于所述第二标签信息和所述第四标签信息进行类别合并处理，得到所述第六标签信息。

3.根据权利要求2所述的方法，其特征在于，所述第一样本数据包括多个第一样本子数据，所述第五标签信息包括任一所述第一样本子数据中至少一个文本单元各自对应的第五指示信息，所述第一标签信息包括任一所述第一样本子数据中至少一个文本单元各自对应的第一指示信息，所述第三标签信息包括任一所述第一样本子数据中至少一个文本单元各自对应的第三指示信息，所述第一对象类别维度包括非实体类别维度；所述基于所述第一标签信息和所述第三标签信息进行类别合并处理，得到所述第五标签信息，包括：

在任一所述第一指示信息指示对应的文本单元属于所述非实体类别维度的情况下，生成所述第一对象类别维度对应的第一补充指示信息；

基于所述第一补充指示信息和任一所述第一指示信息对应的任一所述第三指示信息，生成任一所述第一指示信息对应的第五指示信息。

4.根据权利要求3所述的方法，其特征在于，所述第一对象类别维度还包括至少一种实体类别维度；所述方法还包括：

在任一所述第一指示信息指示对应的文本单元属于任一实体类别维度的情况下，生成所述第二对象类别维度对应的第二补充指示信息；

基于所述第二补充指示信息和任一所述第一指示信息，生成任一所述第一指示信息对应的第五指示信息。

5.根据权利要求2所述的方法，其特征在于，所述第二样本数据包括多个第二样本子数据，所述第六标签信息包括任一所述第二样本子数据中至少一个文本单元各自对应的第六指示信息，所述第二标签信息包括任一所述第二样本子数据中至少一个文本单元各自对应的第二指示信息，所述第四标签信息包括任一所述第二样本子数据中至少一个文本单元各自对应的第四指示信息，所述第二对象类别维度包括非实体类别维度；

所述基于所述第二标签信息和所述第四标签信息进行类别合并处理，得到所述第六标签信息，包括：

在任一所述第二指示信息指示对应的文本单元属于所述非实体类别维度的情况下，生成所述第二对象类别维度对应的第三补充指示信息；

基于所述第三补充指示信息和任一所述第二指示信息对应的任一所述第四指示信息，生成任一所述第二指示信息对应的第六指示信息。

6.根据权利要求5所述的方法，其特征在于，所述第二对象类别维度还包括至少一种实体类别维度；所述方法还包括：

在任一所述第二指示信息指示对应的文本单元属于任一实体类别维度的情况下，生成所述第一对象类别维度对应的第四补充指示信息；

基于所述第四补充指示信息和任一所述第二指示信息，生成任一所述第二指示信息对应的第六指示信息。

7.根据权利要求1-6任一所述的方法，其特征在于，所述基于所述第一样本数据、所述第二样本数据、所述第五标签信息和所述第六标签信息，对预设识别模型进行训练，得到目标类别识别模型，包括：

基于所述第一样本数据、所述第二样本数据、所述第五标签信息和所述第六标签信息，确定当前样本数据和所述当前样本数据对应的当前标签信息；

将所述当前样本数据输入至所述预设识别模型进行对象类别识别，得到当前对象类别信息；

基于所述当前对象类别信息和所述当前标签信息，确定第一损失信息；

基于所述第一损失信息，对所述预设识别模型进行更新，得到更新后的预设识别模型，基于所述更新后的预设识别模型，重复所述基于所述第一样本数据、所述第二样本数据、所述第五标签信息和所述第六标签信息，确定当前样本数据和所述当前样本数据对应的当前标签信息至所述基于所述第一损失信息，对所述预设识别模型进行更新，得到更新后的预设识别模型的步骤，直至满足预设收敛条件；

根据达到所述预设收敛条件时得到的预设识别模型，确定所述目标类别识别模型。

8.根据权利要求7所述的方法，其特征在于，所述基于所述第一损失信息，对所述预设识别模型进行更新，得到更新后的预设识别模型之后，所述方法还包括：

获取第三样本数据；

将所述第三样本数据输入至所述更新后的预设识别模型进行对象类别识别，得到预测标签信息；

从所述第三样本数据和所述预测标签信息中，确定第七标签信息和所述第七标签信息对应的至少一个第三样本子数据，所述第七标签信息为所述预测标签信息中至少一个满足预设标签条件的标签信息；

所述基于所述第一样本数据、所述第二样本数据、所述第五标签信息和所述第六标签信息，确定当前样本数据和所述当前样本数据对应的当前标签信息，包括：

从所述第一样本数据、所述第二样本数据和所述至少一个第三样本子数据中，确定所述当前样本数据；

基于所述当前样本数据，从所述第五标签信息、所述第六标签信息和所述第七标签信息中，确定所述当前标签信息。

9.根据权利要求8所述的方法，其特征在于，所述基于所述当前对象类别信息和所述当前标签信息，确定第一损失信息，包括：

从当前对象类别信息中，确定所述当前样本数据中第一当前样本数据对应的第一对象类别信息和所述当前样本数据中第二当前样本数据对应的第二对象类别信息，所述第一当前样本数据包含于所述第一样本数据和所述第二样本数据中的至少一个，所述第二当前样本数据包含于所述至少一个第三样本子数据；

基于所述第一对象类别信息和所述当前标签信息中所述第一当前样本数据对应的标签信息，确定第二损失信息；

根据所述第二对象类别信息和所述当前标签信息中所述第二当前样本数据对应的标签信息，确定第三损失信息；

基于所述第二损失信息和所述第三损失信息，确定所述第一损失信息。

10.一种类别识别方法，其特征在于，所述方法包括：

获取待识别文本信息；

其中，所述目标类别识别模型为基于权利要求1至9任一所述的类别识别模型的生成方法得到的。

11.一种类别识别模型的生成装置，其特征在于，所述装置包括：

12.一种类别识别装置，其特征在于，所述装置包括：

信息获取模块，用于获取待识别文本信息；

第三识别模块，用于将所述待识别文本信息输入至目标类别识别模型进行对象类别识别，得到对象类别识别结果；所述目标类别识别模型为基于权利要求1至9任一所述的类别识别模型的生成方法得到的。

13.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令以实现权利要求1至9中任意一项所述的类别识别模型的生成方法或权利要求10所述的类别识别方法。

14.一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至9中任意一项所述的类别识别模型的生成方法或权利要求10所述的类别识别方法。