CN111125177B

CN111125177B - 生成数据标签的方法、装置、电子设备及可读存储介质

Info

Publication number: CN111125177B
Application number: CN201911368968.9A
Authority: CN
Inventors: 张恒庆
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2019-12-26
Filing date: 2019-12-26
Publication date: 2024-01-16
Anticipated expiration: 2039-12-26
Also published as: CN111125177A

Abstract

本发明实施例提出的生成数据标签的方法、装置、电子设备及可读存储介质，获取发布内容，根据发布内容包含的数据所属的类型，将发布内容中的数据输入与各自所属类型对应的编码器得到对应的内容特征信息，将发布内容全部的内容特征信息输入融合编码器得到融合信息，将发布内容对应的内容特征信息和融合信息输入预设的解码器得到发布内容对应的数据标签。通过本方案可以对发布内容中包含的多种类型的数据进行统一处理，通过融合编码器对多种类型的数据对应的内容特征信息进行了融合编码，与目前单独根据各类型的数据生成发布内容的数据标签相比，本方案考虑了多种类型的数据以及数据之间的相互关系，得到的数据标签更加准确，更加符合用户的需求。

Description

生成数据标签的方法、装置、电子设备及可读存储介质

技术领域

本发明实施例涉及数据处理技术领域，具体涉及一种生成数据标签的方法、装置、电子设备及可读存储介质。

背景技术

目前用户通常会在社交平台上发布一些文本类型和/或图像类型的数据，通常这些文本类型和图像类型的数据统称为发布内容。

一些应用程序为了给用户带来更好的体验，通常会根据用户的发布内容，来为用户推送内容，但是目前的技术通常是根据用户发布的文本类型的数据生成数据标签，进而根据数据标签来为用户推送内容，或者是根据用户发布的图片类型的数据生成数据标签，进而根据数据标签来为用户推送内容。

上述两种方式均是只能根据单一的数据类型生产数据标签，而发布内容通常会包含文字类型的数据和图片类型的数据，通过上述技术推送内容时并没有考虑图片类型的数据和文本类型的数据之间的相互关系，导致采集上述技术针对用户发布的整体发布内容所生成的数据标签不够准确。

上述对问题的发现过程的描述，仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本发明实施例提供了一种生成数据标签的方法、装置、电子设备及可读存储介质。

有鉴于此，第一方面，本发明实施例提供一种生成数据标签的方法，包括：

获取发布内容，所述发布内容包含至少一种类型的数据；

根据所述发布内容中包含的数据的类型，将所述发布内容中各类型的数据分别输入与各类型对应的预设的编码器，得到与所述发布内容对应的分别针对各个类型的内容特征信息；

将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息；

将所述针对各个类型的内容特征信息和所述融合信息输入预设的解码器，得到与所述发布内容对应的数据标签。

在一种可能的实现方式中，所述发布内容包含多种类型的数据；

将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息之前，所述方法还包括：

将所述发布内容对应的针对各个类型的所有内容特征信息拼接成内容特征总信息；

将所述内容特征总信息作为针对各个类型的内容特征信息输入预设的融合编码器得到融合信息。

在一种可能的实现方式中，所述发布内容包含属于文本类型的数据和属于图像类型的数据；

根据所述发布内容中包含的数据的类型，将所述发布内容中各类型的数据分别输入与各类型对应的预设的编码器，得到与所述发布内容对应的分别针对各个类型的内容特征信息，包括：

将所述发布内容中属于文本类型的数据输入预设的与所述文本类型对应的语义编码器，得到与所述发布内容中属于文本类型的数据对应的内容特征信息；

将所述发布内容中属于图像类型的数据输入预设的与所述图像类型对应的图像编码器，得到与所发布内容中属于图像类型的数据对应的内容特征信息。

在一种可能的实现方式中，将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息之前，所述方法还包括：

获取第一样本，所述第一样本包含多个属于不同类型的第一样本数据，所述第一样本数据中携带有表明该样本数据所属的发布内容的标识；

将所述第一样本数据输入所属类型对应的编码器，得到第一样本数据对应的内容特征信息；

将至少两种类型的第一样本数据对应的内容特征信息进行拼接得到一个内容特征总信息；

将所述内容特征总信息输入预设的初始编码器，得到输出数据；

根据所述输出数据判断所述至少两种类型的第一样本数据是否属于同一发布内容，得到判断结果；

根据所述至少两种类型的第一样本数据携带的标识来确定所述判断结果是否正确；

根据所述判断结果的正确率来调节所述初始编码器的参数，以使所述初始编码器的判断结果的正确率大于预设的第一阈值；

将判断结果正确率大于预设的第一阈值的初始编码器作为初始融合编码器。

获取第二样本，所述第二样本包含多个属于不同类型的第二样本数据，所述第二样本数据携带有预设的数据标签；

将所述第二样本数据输入所属类型对应的编码器，得到所述第二样本数据对应的内容特征信息；

将所述第二样本数据对应的内容特征信息输入所述初始融合编码器，得到融合信息；

将所述第二样本数据对应的内容特征信息和所述融合信息输入预设的初始解码器得到所述第二样本数据对应的预测数据标签；

计算所述第二样本数据携带的数据标签和所述预测数据标签的误差值；

根据所述误差值调整所述初始解码器和所述初始融合编码器的参数，直至所述误差值小于预设的第二阈值；

将误差值小于所述第二阈值时对应的初始解码器和所述初始融合编码器分别作为预设的解码器和所述预设的融合编码器。

第二方面，本发明实施例还提供了一种生成数据标签的装置，包括：

获取模块，用于获取发布内容，所述发布内容包含至少一种类型的数据；

第一编码模块，用于根据所述发布内容中包含的数据的类型，将所述发布内容中各类型的数据分别输入与各类型对应的预设的编码器，得到与所述发布内容对应的分别针对各个类型的内容特征信息；

第二编码模块，用于将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息；

解码模块，用于将所述针对各个类型的内容特征信息和所述融合信息输入预设的解码器，得到与所述发布内容对应的数据标签。

在一种可能的实现方式中，若所述发布内容包含多种类型的数据，所述装置还包括拼接模块，具体用于：

将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息之前，将所述发布内容对应的针对各个类型的所有内容特征信息拼接成内容特征总信息，将所述内容特征总信息作为针对各个类型的内容特征信息输入预设的融合编码器得到融合信息。

所述第一编码模块具体用于：

在一种可能的实现方式中，所述装置还包括第一设置模块，具体用于：

在将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息之前，获取第一样本，所述第一样本包含多个属于不同类型的第一样本数据，所述第一样本数据中携带有表明该样本数据所属的发布内容的标识；

将所述第一样本数据输入所属类型对应的编码器，得到各第一样本数据的内容特征信息；

在一种可能的实现方式中，所述装置还包括第二设置模块，具体用于：

在将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息之前，获取第二样本，所述第二样本包含多个属于不同类型的第二样本数据，所述第二样本数据携带有预设的数据标签；

将所述第二样本数据对应的内容特征信息输入所述融合编码器，得到融合信息；

将所述误差值小于所述第二阈值时对应的初始解码器和所述初始融合编码器分别作为预设的解码器和所述预设的融合编码器。

第三方面，本发明实施例还提供了一种电子设备，包括：

处理器、存储器、通信接口和总线；

其中，所述处理器、存储器、通信接口通过所述总线完成相互间的通信；

所述通信接口用于外部设备之间的信息传输；

所述处理器用于调用所述存储器中的程序指令，以执行第一方面所述生成数据标签的方法的步骤。

第四方面，本发明实施例还提供了一种可读存储介质，所述可读存储介质存储计算机指令，所述计算机指令使计算机执行第一方面所述生成数据标签的方法的步骤。

相比现有技术，本发明实施例提出的生成数据标签的方法，获取发布内容，根据发布内容包含的各数据所属的类型，将发布内容中的各数据输入与其所属类型对应的编码器得到各数据对应的内容特征信息，将发布内容对应的内容特征信息输入融合编码器得到融合信息，再将发布内容对应的内容特征信息和融合信息输入预设的解码器得到发布内容对应的数据标签。通过本方案可以对发布内容中包含的多种类型的数据进行统一处理，通过融合编码器对多种类型的数据对应的内容特征信息进行了融合编码，与目前单独根据各类型的数据生成发布内容的数据标签相比，本方案考虑了多种类型的数据以及数据表之间的相互关系，得到的数据标签更加准确，更加符合用户的需求。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种生成数据标签的方法的流程图；

图2为本发明实施例提供的一种设置融合编码器的方法流程图；

图3为本发明实施例提供的一种设置解码器的方法流程图；

图4为本发明实施例提供的一种生成数据标签的装置的框图；

图5为本发明实施例提供的一种电子设备的结构示意图；

图6为本发明实施例提供的一种生成数据标签的方法示意图；

图7为本发明实施例提供的一种初始解码器的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

随着互联网的发展，社交平台成为人们日常生活中不可或缺的一部分，人们通常会在社交平台上发布一些内容，以此来记录自己的生活、心情或发表对某个人或某件事的看法，通常可以通过对用户发布在社交平台上的发布内容进行分析来获取与用户相关的一些数据(例如位置、心情、需求、人物等等)，将这些数据作为数据标签，根据数据标签可以向用户推送相关的内容。

本发明实施例提供一种生成数据标签的方法，如图6所示的示意图，根据用户的发布内容，将发布内容中各类型的数据分别输入到对应编码器中，例如图6所示的发布内容包含图像类型的数据和文本类型的数据，而将图像类型的数据输入预设的图像编码器，将文本类型的数据输入预设的语义编码器，从而得到该发布信息中各类型数据对应的内容特征信息，将所有内容特征信息输入到预设的融合编码器中得到融合信息，最后将所有内容特征信息和融合信息统一输入到预设解码器中，解码器即可输出与上述发布内容对应的数据标签。

下面结合附图对本实施例提供的生成数据标签的方法进行说明。

图1为本发明实施例提供的一种生成数据标签的方法的流程图，如图1所示，该方法包括如下步骤：

S11.获取发布内容，所述发布内容包含至少一种类型的数据。

其中发布内容可以为用户发布在社交平台上的内容，可以包含文本类型的数据、图片类型的数据、视频类型和/或音频类型的数据。

S12.根据所述发布内容中包含的数据的类型，将所述发布内容中各类型的数据分别输入与各类型对应的预设的编码器，得到与所述发布内容对应的分别针对各个类型的内容特征信息。

用户在平台上发布的发布内容通常会包含文字类型的数据和图片类型的数据等多种类型的数据。

在本实施例中，根据发布内容中数据的内容特征信息来确定数据标签，而数据的内容特征信息通过编码器来确定，将数据输入预先设置好的编码器即可得到该数据对应的内容特征信息。

在本实施例中，由于不同类型的数据的内容特征信息的提取方式，所以不同类型的数据对应的编码器也不同，例如针对文本类型的数据其对应的编码器可以为语义编码器，针对图像类型的数据其对应的编码器可以为图像编码器。

在一种可能的实现方式中，将文本类型的数据输入预设的语义编码器，得到该数据的语义特征(例如语义向量)，并将得到的语义特征作为该数据对应的内容特征信息。

在一种可能的实现方式中，将图像类型的数据输入预设的图像编码器，得到该数据的图像特征(例如图像的类别)，并将得到的图像特征作为该数据对应的内容特征信息。

在一种可能的实现方式中，语义编码器可以采用现有的具有语义提取功能的语义编码器，图像编码器可以采用现有的具有图像分类功能的图像编码器。

S13.将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息。

在一种可能的实现方式中，一个发布内容中可能包含有多种类型的数据，这就需要将发布内容的数据输入到多个编码器中进行编码，每个编码器输出一条内容特征信息，多个编码器就会输出多条内容特征信息，例如若发布内容包含文本类型的数据和图像类型的数据，则就会得到分别由语义编码器输出的第一内容特征信息和由图像编码器输出的第二内容特征信息。

在一种可能的实现方式中，融合编码器可以采用现有的能够将不同类型的数据的内容特征信息进行融合的编码器。

S14.将所述针对各个类型的内容特征信息和所述融合信息输入预设的解码器，得到与所述发布内容对应的数据标签。

本发明实施例提出的生成数据标签的方法，获取发布内容，根据发布内容包含的各数据所属的类型，将发布内容中的各数据输入与其所属类型对应的编码器得到各数据对应的内容特征信息，将发布内容对应的内容特征信息输入融合编码器得到融合信息，再将发布内容对应的内容特征信息和融合信息输入预设的解码器得到发布内容对应的数据标签。通过本方案可以对发布内容中包含的多种类型的数据进行统一处理，通过融合编码器对多种类型的数据对应的内容特征信息进行了融合编码，与目前单独根据各类型的数据生成发布内容的数据标签相比，本方案考虑了多种类型的数据以及数据之间的相互关系，得到的数据标签更加准确，更加符合用户的需求。

在一种可能的实现方式中，S11可以通过下述方式获取发布内容：

通过现有的抓取工具(例如Python网络爬虫)，抓取某用户在某平台上发布的内容，并以抓取到的内容作为发布内容。

在本实施例提供的生成数据标签的方法中采用抓取工具抓取发布内容，方便快捷。

在一种可能的实现方式中，与文本类型对应的语义编码器可以通过下述方式设置：

获取文本样本，文本样本中包含多个文本数据，利用所述文本样本采用预设的预训练方法训练文本数据带掩码的语言模型，将训练好的语言模型作为语义编码器。

其中，文本数据可以是通过爬虫工具从网络中的新闻、文章、对话等内容中爬取得到，也可以是从预先建立的文本数据库中直接获取的。采用的预训练方法可以为现有的语言模型训练方法，例如BERT(Bidirectional Encoder RepresentationsfromTransformers)/广义自回归预训练方法(例如XLNet)等，采用预训练方法对语言模型进行训练为现有的成熟技术，具体训练过程本实施例不再赘述。

在本实施例提供的生成数据标签的方法中，通过预训练现有的语言模型来确定语言编码器，不需要再单独构建新的模型，省时省力，而且在训练过程中可以根据自身需求对语言模型的参数进行调整，从而使得到的语义编码器更加符合自身的需求。

在一种可能的实现方式中，与图像类型对应的图像编码器可以通过下述方式设置：

先使用第一图像样本(例如ImageNet数据集中的图像数据)中的图像数据对图像编码框架(例如Xception/VGGNet/Inception等)进行图像分类训练，训练后的图像编码框架可以用来提取图像分类前的隐藏层向量作为图像数据的表示向量，然后将获取的第二图像样本(包含多个图像数据，图像数据携带有图像分类标识)中的图像数据，输入上述训练得到的图像编码框架后得到与图像数据对应的表示向量，将表示向量输入到包含自注意力层和softmax层的初始图像编码器中，映射成预设维度(优先的和文本编码器的维度一致)，表示向量经过该初始图像编码器中的多层自注意力层后得到图像数据对应的图像语义，再经过一层softmax层预测得到图像数据的分类，然后计算预测得到的分类与图像数据携带的分类标识的误差值，根据所述误差值对编码器的参数进行修改，直至所述误差值满足预设需求(例如小于某一值，该值根据需求自行设定)，将训练好的图像编码框架和初始图像编码器作为预设的图像编码器。

在本实施例提供的生成数据标签的方法中，通过对图像编码框架和初始图像编码器进行训练，从而得到图像编码器，在训练过程中可以根据自身需求对参数进行调整，从而使得到的图像编码器更加符合用户自身需求。

在一种可能的实现方式中，融合编码器既可以对单一类型的内容特征信息进行处理，也可以对多种类型的内容特征信息进行统一处理，但是融合编码器一次只能对一条信息进行处理，所以为了避免在需要对多种类型的内容特征信息进行统一处理时，由于不同类型的内容特征信息分别输入到融合编码器导致时间不同步，从而使得融合编码器按照对单一类型的内容特征信息对输入其中的内容特征信息进行分别处理从而导致无法得到完整的融合信息，在发布内容对应有多个类型的数据时，先将所有数据对应的所有内容特征信息拼接为一条内容特征总信息，在将内容特征总信息输入至融合编码器中进行处理，其中在将多条内容特征信息拼接成一条内容特征总信息时，可以利用分隔符(例如空格)将不同类型对应的不同内容特征信息进行分隔，例如将第一内容特征信息和第二内容特征信息进行拼接，得到的内容特征信息的格式可以为“第一内容特征信息第二内容特征信息”或“第二内容特征信息第一内容特征信息”。

在本实施例中提供的生成数据标签的方法中，在同一发布内容中包含多种类型的数据时，先对各类型的数据对应的内容特征信息进行拼接，拼接成一条包含发布内容所有内容特征信息的内容特征总信息，然后将内容特征总信息输入值融合编码器中，避免了由于同一发布内容中各类型数据对应的内容特征信息分别输入到融合编码器中导致的无法得到完整的融合信息的问题。

在一种可能的实现方式中，如图2所示，可以通过下述方式设置融合编码器：

S131.获取第一样本，所述第一样本包含多个属于不同类型的第一样本数据，所述第一样本数据中携带有表明该样本数据所属的发布内容的标识。

在一种可能的实现方式中，第一样本数据中携带的标识，是为了区分样本数据的来源(即其所属的发布内容)，该标识可以是在获取样本数据时数据自身携带的，也可以是后期通过人工或计算机添加的。

根据第一样本数据中携带的上述标识可以判断出两个或更多个第一样本数据是否来自于同一发布内容，例如确定一个文本类型的第一样本数据和一个图像类型的第一样本数据是否来自于同一用户在同一社交平台上发布的同一条动态。

S132.将所述第一样本数据输入所属类型对应的编码器，得到各第一样本数据的内容特征信息。

S133.将至少两种类型的第一样本数据对应的内容特征信息进行拼接得到一个内容特征总信息。

S134.将所述内容特征总信息输入预设的初始编码器，得到输出数据。

在一种可能的实现方式中，初始编码器包括自注意力层，将内容特征总信息输入初始编码器，通过初始编码器的自注意力层充分融合内容特征总信息中包含的各类型的数据对应的内容特征信息(例如文本类型的数据对应的内容特征信息和图像类型的数据对应的内容特征信息)，最后生成和输入的内容特征总信息的长度相同的特征序列作为输出数据。

S135.根据所述输出数据判断所述至少两种类型的第一样本数据是否属于同一发布内容，得到判断结果。

在一种可能的实现方式中，初始编码器包括softmax层，自注意力层输出的特征数据输入到初始编码器的softmax层，softmax层根据特征数据来判断输入到至少两个第一样本数据是否来自同一发布内容，得到判断结果，判断结果可以为表示来自同一发布内容或来自不同发布内容的标识。

S136.根据所述至少两种类型的第一样本数据携带的标识来确定所述判断结果是否正确。

S137.根据所述判断结果的正确率来调节所述初始编码器的参数，以使所述初始编码器的判断结果的正确率大于预设的第一阈值。

S138.将判断结果正确率大于预设的第一阈值的初始编码器作为初始融合编码器。

其中第一阈值为根据需求设定的值，具体取值在本实施例中不做具体限定。

其中得到的初始融合编码器可以作为预设的融合编码器。

在本实施例提供的生成数据标签的方法中，利用各类型对应的编码器输出的内容特征信息对预设的初始编码器进行训练来设置融合编码器，使得训练得到的融合编码器与各类型对应的编码器更加契合，而且在训练过程中用户可以根据自身需求对初始编码器的参数进行调整，从而使得到的融合编码器更加符合用户的需求。

在一种可能的实现方式中，通过将融合编码器输出的融合信息和各类型对应的编码器输出的内容特征信息输入到预设的编码器中从而得到数据标签，为了使得预设的编码器输出的数据标签更加符合用户的需求，如图3所示，可以通过下述方式对编码器进行设置：

S141.获取第二样本，所述第二样本包含多个属于不同类型的第二样本数据，所述第二样本数据携带有预设的数据标签。

其中第二样本数据携带的数据标签可以为人工或计算机添加的，数据标签一般为体现数据的特征(例如文本的语义、图像的类别等)的标签。

S142.将所述第二样本数据输入所属类型对应的编码器，得到所述第二样本数据对应的内容特征信息。

例如，若第二样本数据所属的类型为文本类型，则就将该第二样本数据输入到与文本类型对应的语义编码器，若第二样本数据所属的类型为图像类型，则将该第二样本数据输入到与图像类型对应的图像编码器。

S143.将所述第二样本数据对应的内容特征信息输入所述初始融合编码器，得到融合信息。

每一次训练是可以只采用一个第二样本数据，也可以采用多个第二样本数据。

S144.将所述第二样本数据对应的内容特征信息和融合信息输入预设的初始解码器得到所述样本数据对应的预测数据标签。

解码器需要接收来自不同编码器的不同模态的信息，例如接收来自语义编码器发送的文本类型的数据对应的内容特征信息，接收图像编码器发送的图像类型的数据对应的内容特征信息，和接收融合编码器发送的融合信息，为了避免不同编码器之间的信息的相互干扰，初始解码器中设置有多个多头自注意力(multi-head attention)子层，如图7所示的初始解码器有前馈层(Feed Forward)、三个多头自注意力子层(multi-head attention)和隐藏的多头自注意力子层组成(Masked Multi-head Attention)，两个子层之间通过Add&Norm连接，图7只是一个示例，初始解码器中子层的个数根据需求设定，每个子层分别与一个编码器对应，每个子层接收与其对应的编码器发送的信息，并对接收的信息进行处理，进而使得最终得到的解码器可以利用不同模态的信息生成数据标签。

初始解码器根据接收到的第二样本数据对应的内容特征信息和融合信息计算自注意力，计算自注意力后分别和第二样本数据中各类型数据对应的内容特征信息和融合信息做attention计算来添加不同模态的信息，使得初始解码器不再只能参考一个编码器的输入信息样就使初始解码器在解码时能充分考虑不同的模态信息，从而生成更准确的标签。

S145.计算所述第二样本数据携带的数据标签和所述预测数据标签的误差值。

S146.根据所述误差值调整所述初始解码器和所述初始融合编码器的参数，直至所述误差值小于预设的第二阈值。

其中第二阈值为根据需求设定的值，具体取值在本实施例中不做具体限定。

每次调整了初始解码器和初始融合编码器的参数后，都再次执行S143-S145，直至计算得到的第二样本数据携带的数据标签和所述预测数据标签的误差值小于预设的第二阈值，将此时初始解码器的参数作为第一目标参数，初始融合编码器的参数作为第二目标参数。

S147.将误差值小于所述第二阈值时对应的初始解码器和初始融合编码器分别作为预设的解码器和所述预设的融合编码器。

将所述误差值小于预设的第二阈值时对应的初始解码器的参数作为第一目标参数，将参数为目标参数的初始解码器作为预设的解码器，也就是S14中使用的解码器。

预设的解码器是通过对初始解码器进行训练得到的，所以预设的解码器生成数据标签的原理与上述初始解码器生成数据标签的原理相同，此处不再赘述。

将所述误差值小于预设的第二阈值时对应的初始融合编码器的参数作为第二目标参数，则参数为第二目标参数的初始融合编码器作为预设的融合编码器，也就是S13中使用的融合编码器。

下面举例对上述设置解码器的过程进行说明：

例如第二样本中包含文本类型的第二样本数据和图像类型的第二样本数据，将文本类型的第二样本数据输入到语义编码器得到对应的内容特征信息，为了区分将其称为第一内容特征信息，将图像类型的第二样本数据输入图像编码器得到对应的内容特征信息，称为第二内容特征信息，将第一内容特征信息和第二内容特征信息拼接后输入到初始融合编码器得到融合信息，将第一内容特征信息、第二内容特征信息和融合信息均输入到初始解码器中，初始解码器中包含分别接收各个编码器输出的信息的子层，每个子层接收各自对应的编码器输出的信息(例如与语义编码器对应的子层接收语义编码器输出的第一内容特征信息，与图像编码器对应的子层接收图像编码器输出的第二内容特征信息，与融合编码器对应的子层接收初始融合编码器输出的融合信息等等)，每个子层分别和输入其中的信息做attention计算来添加不同模态的信息，使得解码器不再只能参考一个编码器的输入信息，这样就使解码器解码时能充分考虑不同的模态信息，从而生成更准确的数据标签。

通过上述方式训练解码器，在训练过程中用户可以根据自身需求对解码器的参数进行调整，从而使得到的预设的解码器更加符合用户的需求，而在训练解码器的过程中用到了初始融合编码器，为了保证生成的数据标签更加准确，在训练解码器的过程中，也对初始融合编码器的参数做了进一步的调整，所以如果将没有进行参数调整的初始编码器作为预设的融合编码器可能会使的预设的编码器最终得到的数据标签不够准确，因此将解码器训练后得到的经过参数调整的初始融合编码器作为预设的融合编码器，会使得到的数据标签更加准确。

本发明实施例还提供了一种用于实现上述生成数据标签的方法的生成数据标签的装置，如图4所示，该装置可以包括：

获取模块401，用于获取发布内容，所述发布内容包含至少一种类型的数据；

第一编码模块402，用于根据所述发布内容中包含的数据的类型，将所述发布内容中各类型的数据分别输入与各类型对应的预设的编码器，得到与所述发布内容对应的分别针对各个类型的内容特征信息；

第二编码模块403，用于将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息；

解码模块404，用于将所述针对各个类型的内容特征信息和所述融合信息输入预设的解码器，得到与所述发布内容对应的数据标签。

本发明实施例提出的生成数据标签的装置，利用获取模块获取发布内容，将发布内容输入第一编码器，第一编码器根据发布内容包含的各数据所属的类型，将发布内容中的各数据输入与其所属类型对应的编码器得到各数据对应的内容特征信息，将发布内容对应的内容特征信息输入第二编码器，第二编码器利用预设的融合编码器将发布内容对应的内容特征信息融合成一条融合信息，再将发布内容对应的内容特征信息和融合信息输入解码模块，解码模块利用预设的解码器得到发布内容对应的数据标签。通过本方案可以对发布内容中包含的多种类型的数据进行统一处理，通过融合编码器对多种类型的数据对应的内容特征信息进行了融合编码，与目前单独根据各类型的数据生成发布内容的数据标签相比，本方案考虑了多种类型的数据以及数据之间的相互关系，得到的数据标签更加准确，更加符合用户的需求。

所述第一编码模块402具体用于：

将所述误差值小于所述第二阈值时对应的初始解码器和所述初始融合编码器分别作为所述预设的解码器和所述预设的融合编码器。

采用第二设置模块通过训练的方式设置解码器，在训练过程中用户可以根据自身需求对解码器的参数进行调整，从而使得到的预设的解码器更加符合用户的需求，而在训练解码器的过程中用到了初始融合编码器，为了保证生成的数据标签更加准确，在训练解码器的过程中，也对初始融合编码器的参数做了进一步的调整，所以如果将没有进行参数调整的初始编码器作为预设的融合编码器可能会使的预设的编码器最终得到的数据标签不够准确，因此将解码器训练后得到的经过参数调整的初始融合编码器作为预设的融合编码器，会使得到的数据标签更加准确。

在本申请另一实施例中，还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信；

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现如下步骤：

获取发布内容，所述发布内容包含至少一种类型的数据；

上述电子设备提到的通信总线504可以是外设部件互连标准(PeripheralComponent Interconnect，简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture，简称EISA)总线等。该通信总线504可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口502用于上述电子设备与其他设备之间的通信。

存储器503可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器501可以是通用处理器，包括中央处理器(Central ProcessingUnit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请另一实施例中，还提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有数据处理方法程序，所述数据处理方法程序被处理器执行时实现上述任一所述的数据处理方法的步骤。

本发明实施例在具体实现时，可以参阅上述各个实施例，具有相应的技术效果。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明各个实施例所述的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法或者实施例的某些部分所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种生成数据标签的方法，其特征在于，包括：

获取发布内容，所述发布内容包含至少一种类型的数据；

获取第一样本，所述第一样本包含多个属于不同类型的第一样本数据，所述第一样本数据中携带有表明该样本数据所属的发布内容的标识；将所述第一样本数据输入所属类型对应的编码器，得到第一样本数据对应的内容特征信息；将至少两种类型的第一样本数据对应的内容特征信息进行拼接得到一个内容特征总信息；将所述内容特征总信息输入预设的初始编码器，得到输出数据；根据所述输出数据判断所述至少两种类型的第一样本数据是否属于同一发布内容，得到判断结果；根据所述至少两种类型的第一样本数据携带的标识来确定所述判断结果是否正确；根据所述判断结果的正确率来调节所述初始编码器的参数，以使所述初始编码器的判断结果的正确率大于预设的第一阈值；将判断结果正确率大于预设的第一阈值的初始编码器作为初始融合编码器；

获取第二样本，所述第二样本包含多个属于不同类型的第二样本数据，所述第二样本数据携带有预设的数据标签；将所述第二样本数据输入所属类型对应的编码器，得到所述第二样本数据对应的内容特征信息；将所述第二样本数据对应的内容特征信息输入所述初始融合编码器，得到融合信息；将所述第二样本数据对应的内容特征信息和所述融合信息输入预设的初始解码器得到所述第二样本数据对应的预测数据标签；计算所述第二样本数据携带的数据标签和所述预测数据标签的误差值；根据所述误差值调整所述初始解码器和所述初始融合编码器的参数，直至所述误差值小于预设的第二阈值；将误差值小于所述第二阈值时对应的初始解码器和所述初始融合编码器分别作为预设的解码器和所述预设的融合编码器；

将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息，所述预设的融合编码器为初始融合编码器利用各类型对应的编码器输出的内容特征信息训练得到；

将所述针对各个类型的内容特征信息和所述融合信息输入预设的解码器，得到与所述发布内容对应的数据标签，所述预设的解码器为初始解码器利用各类型的内容特征信合和对应的融合信息训练得到。

2.根据权利要求1所述的方法，其特征在于，若所述发布内容包含多种类型的数据；

3.根据权利要求1所述的方法，其特征在于，所述发布内容包含属于文本类型的数据和属于图像类型的数据；

4.一种生成数据标签的装置，其特征在于，包括：

第一设置模块，用于获取第一样本，所述第一样本包含多个属于不同类型的第一样本数据，所述第一样本数据中携带有表明该样本数据所属的发布内容的标识；将所述第一样本数据输入所属类型对应的编码器，得到第一样本数据对应的内容特征信息；将至少两种类型的第一样本数据对应的内容特征信息进行拼接得到一个内容特征总信息；将所述内容特征总信息输入预设的初始编码器，得到输出数据；根据所述输出数据判断所述至少两种类型的第一样本数据是否属于同一发布内容，得到判断结果；根据所述至少两种类型的第一样本数据携带的标识来确定所述判断结果是否正确；根据所述判断结果的正确率来调节所述初始编码器的参数，以使所述初始编码器的判断结果的正确率大于预设的第一阈值；将判断结果正确率大于预设的第一阈值的初始编码器作为初始融合编码器；

第二设置模块，用于获取第二样本，所述第二样本包含多个属于不同类型的第二样本数据，所述第二样本数据携带有预设的数据标签；将所述第二样本数据输入所属类型对应的编码器，得到所述第二样本数据对应的内容特征信息；将所述第二样本数据对应的内容特征信息输入所述初始融合编码器，得到融合信息；将所述第二样本数据对应的内容特征信息和所述融合信息输入预设的初始解码器得到所述第二样本数据对应的预测数据标签；计算所述第二样本数据携带的数据标签和所述预测数据标签的误差值；根据所述误差值调整所述初始解码器和所述初始融合编码器的参数，直至所述误差值小于预设的第二阈值；将误差值小于所述第二阈值时对应的初始解码器和所述初始融合编码器分别作为预设的解码器和所述预设的融合编码器；

第二编码模块，用于将所述针对各个类型的内容特征信息输入预设的融合编码器得到融合信息，所述预设的融合编码器为初始融合编码器利用各类型对应的编码器输出的内容特征信息训练得到；

解码模块，用于将所述针对各个类型的内容特征信息和所述融合信息输入预设的解码器，得到与所述发布内容对应的数据标签，所述预设的解码器为初始解码器利用各类型的内容特征信合和对应的融合信息训练得到。

5.根据权利要求4所述的装置，其特征在于，若所述发布内容包含多种类型的数据，所述装置还包括拼接模块，具体用于：

6.根据权利要求4所述的装置，其特征在于，所述发布内容包含属于文本类型的数据和属于图像类型的数据；

所述第一编码模块具体用于：

7.一种电子设备，其特征在于，包括：

处理器、存储器、通信接口和总线；

所述通信接口用于外部设备之间的信息传输；

所述处理器用于调用所述存储器中的程序指令，以执行权利要求1-3任一所述生成数据标签的方法的步骤。

8.一种可读存储介质，其特征在于，所述可读存储介质存储计算机指令，所述计算机指令使计算机执行权利要求1-3任一所述生成数据标签的方法的步骤。