CN114639044A

CN114639044A - 标签确定方法、装置、电子设备及存储介质

Info

Publication number: CN114639044A
Application number: CN202210266221.8A
Authority: CN
Inventors: 王霄; 聂礼强; 尉寅伟; 甘甜; 张博威; 戴蒙
Original assignee: Shandong University; Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Shandong University; Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2022-03-17
Filing date: 2022-03-17
Publication date: 2022-06-17

Abstract

本公开关于一种标签确定方法、装置、电子设备及存储介质，涉及多媒体资源处理技术领域。本公开实施例至少解决相关技术中，确定出的标签准确性较低的问题。该方法包括：获取与目标多媒体资源具有社交关系的第一多媒体资源，并确定第一多媒体资源相对于目标多媒体资源的第一共同特征；社交关系用于表征不同多媒体资源的账户之间具有社交行为；确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的目标差异度；在目标差异度小于预设差异度的情况下，确定预设标签归属于目标多媒体资源。本公开实施例能够确使定出的标签更加准确。

Description

标签确定方法、装置、电子设备及存储介质

技术领域

本公开涉及多媒体资源处理技术领域，尤其涉及一种标签确定方法、装置、电子设备及存储介质。

背景技术

标签可以反映出多媒体资源的主题、内容等，对多媒体资源的整理、检索都有着重要作用。例如，在短视频平台中每个短视频都对应有各自的标签，这些标签可以反映出短视频的主题以及账户兴趣等。因此，账户发布一个短视频之后，短视频平台需要为短视频确定合适的标签。

相关技术中，为视频确定标签的技术方案，具体包括：首先采用预设标签标注一定数量的视频，作为已标注视频。提取已标注视频的视频特征，结合已标注视频的标签，得到每个预设标签对应的视频特征，以形成视频标签索引库。在对新视频添加标签时，将新视频的视频特征与视频标签索引库中的视频特征进行对比，确定出与新视频的视频特征相似度最高的视频特征，并将该视频特征对应的标签确定为新视频的标签。但是，上述方法仅依据视频特征之间的相似性为视频打标，考虑因素单一，因此可能导致确定到的视频标签准确性较低。

发明内容

本公开提供一种标签确定方法、装置、电子设备及存储介质，以至少解决相关技术中确定出的标签准确性较低的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种标签确定方法，包括：获取与目标多媒体资源具有社交关系的第一多媒体资源，并确定第一多媒体资源相对于目标多媒体资源的第一共同特征；社交关系用于表征不同多媒体资源的账户之间具有社交行为；确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的目标差异度；在目标差异度小于预设差异度的情况下，确定预设标签归属于目标多媒体资源。

可选的，确定第一多媒体资源相对于目标多媒体资源的第一共同特征，包括：将第一多媒体资源的资源特征以及目标多媒体资源的资源特征，输入预先训练得到的第一模型中，输出第一共同特征；第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

可选的，上述方法还包括：获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签；确定样本标签的标签特征，并将目标样本多媒体资源的资源特征以及第一样本多媒体资源的资源特征作为样本特征，将样本标签的标签特征作为监督信号，对预设的第一神经网络进行训练，得到第一模型。

可选的，获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签，包括：从预构建好的异构图中获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签；异构图包括多个样本多媒体资源、多个样本标签、任意两个样本多媒体资源之间的社交关系以及每个样本多媒体资源与每个样本标签之间的归属关系。

可选的，确定第一多媒体资源相对于目标多媒体资源的第一共同特征，包括：确定各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率，得到各第一多媒体资源对应的相似权重；基于各第一多媒体资源对应的相似权重，对各第一多媒体资源的资源特征加权，得到第一共同特征。

可选的，预设标签的标签特征包括标签共同特征、视频共同特征或者将标签共同特征以及视频共同特征进行融合得到的融合特征；其中，标签共同特征包括与预设标签具有相同类别的同类标签相对于预设标签的共同特征；视频共同特征包括与预设标签具有归属关系的第二多媒体资源相对于预设标签的共同特征。

可选的，确定预设标签的标签特征，包括：获取同类标签，并将同类标签的标签特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出标签共同特征；第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

可选的，确定预设标签的标签特征，包括：获取第二多媒体资源，并将第二多媒体资源的资源特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出视频共同特征；第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

根据本公开实施例的第二方面，提供一种标签确定装置，包括获取单元以及确定单元；获取单元，用于获取与目标多媒体资源具有社交关系的第一多媒体资源；确定单元，用于确定获取单元获取到的第一多媒体资源相对于目标多媒体资源的第一共同特征；社交关系用于表征不同多媒体资源的账户之间具有社交行为；确定单元，还用于确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的目标差异度；确定单元，还用于在目标差异度小于预设差异度的情况下，确定预设标签归属于目标多媒体资源。

可选的，确定单元，具体用于：将第一多媒体资源的资源特征以及目标多媒体资源的资源特征，输入预先训练得到的第一模型中，输出第一共同特征；第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

可选的，获取单元还用于获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签；确定单元还用于确定样本标签的标签特征；标签确定装置还包括训练单元，训练单元用于将目标样本多媒体资源的资源特征以及第一样本多媒体资源的资源特征作为样本特征，将样本标签的标签特征作为监督信号，对预设的第一神经网络进行训练，得到第一模型。

可选的，获取单元，具体用于：从预构建好的异构图中获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签；异构图包括多个样本多媒体资源、多个样本标签、任意两个样本多媒体资源之间的社交关系以及每个样本多媒体资源与每个样本标签之间的归属关系。

可选的，确定单元，具体用于：确定各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率，得到各第一多媒体资源对应的相似权重；基于各第一多媒体资源对应的相似权重，对各第一多媒体资源的资源特征加权，得到第一共同特征。

可选的，确定单元，具体用于：获取同类标签，并将同类标签的标签特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出标签共同特征；第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

可选的，确定单元，具体用于：获取第二多媒体资源，并将第二多媒体资源的资源特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出视频共同特征；第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

根据本公开实施例的第三方面，提供一种电子设备，包括：处理器、用于存储处理器可执行的指令的存储器；其中，处理器被配置为执行指令，以实现如上述第一方面的标签确定方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，计算机可读存储介质上存储有指令，其特征在于，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如上述第一方面的标签确定方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，计算机程序产品包括计算机指令，当计算机指令被处理器执行时，实现如上述第一方面的标签确定方法。

本公开提供的技术方案至少带来以下有益效果：本公开中标签确定装置首先获取与目标多媒体资源具有社交关系的第一多媒体资源，并确定第一多媒体资源相对于目标多媒体资源的第一共同特征。由于社交关系用于表征不同多媒体资源的账户之间具有社交行为，因此目标多媒体资源与第一多媒体资源之间存在着强烈的社交属性，进而可以通过第一多媒体资源相对于目标多媒体资源的第一共同特征来反映这种社交属性，为后续确定目标多媒体资源的标签提供依据。进一步的，标签确定装置确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的目标差异度，以衡量预设标签与目标多媒体资源是否合适。进而在目标差异度小于预设差异度的情况下，标签确定装置确定预设标签归属于目标多媒体资源。相较于现有技术中仅考虑视频特征之间的相似性为视频打标，本公开结合了多媒体资源具有较强社交属性的特点，提取具有社交关系多媒体资源的共同特征，并将该共同特征与标签特征的目标差异度作为依据，确定多媒体资源的标签。这样一来，确定出的标签更加准确。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种视频标签的示意图；

图2是根据一示例性实施例示出的一种标签确定系统的结构示意图；

图3是根据一示例性实施例示出的一种标签确定方法的流程示意图之一；

图4是根据一示例性实施例示出的一种标签确定方法的流程示意图之二；

图5是根据一示例性实施例示出的一种标签确定方法的流程示意图之三；

图6是根据一示例性实施例示出的一种标签确定方法的流程示意图之四；

图7是根据一示例性实施例示出的一种异构图；

图8是根据一示例性实施例示出的一种标签确定方法的流程示意图之五；

图9是根据一示例性实施例示出的一种标签确定方法的流程示意图之六；

图10是根据一示例性实施例示出的一种标签确定模型的结构示意图；

图11是根据一示例性实施例示出的一种标签确定装置的结构示意图；

图12是根据一示例性实施例示出的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

另外，在本公开实施例的描述中，除非另有说明，“/”表示或的意思，例如，A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，在本公开实施例的描述中，“多个”是指两个或多于两个。

在对本公开实施例进行详细地解释说明之前，先对本公开实施例涉及到的一些相关技术进行介绍。

在本公开实施例中多媒体资源包括但不限于视频、音频、图片、文字等。

标签可以反映出多媒体资源的主题、内容等，对多媒体资源的整理、检索都有着重要作用。例如，每个短视频都对应有各自的标签，这些标签可以反映出短视频的主题以及账户兴趣等。

在对短视频确定标签时，现有方法可以从短视频标题中抽取标签。具体的，该方法需要先获取短视频的标题，并将短视频标题进行分割，得到标题对应的词语序列。进一步对词语序列中的每个词语进行词性标注，以生成词语序列对应的词性序列。最后根据词语序列和词性序列生成视频的标签。

现有方法还可以基于知识图谱确定短视频的标签。具体的，该方法基于知识图谱的实体链指技术，根据已知的知识图谱，从目标视频中提取多个备选实体。进一步基于预建立的视频结构化体系、知识图谱以及多个备选实体，获取目标视频对应的目标主实体和/或目标子实体；视频结构化体系中限定有主实体和相关子实体的垂类关系。最后基于主实体和/或目标子实体，为目标视频打标签。

现有方法还可以采用创建视频标签索引库的方式确定短视频的标签。具体的，该方法首先采用预设标签标注一定数量的视频，作为已标注视频。提取已标注视频的视频特征，结合已标注视频的标签，得到每个预设标签对应的视频特征，以形成视频标签索引库。在对新视频添加标签时，将新视频的视频特征与视频标签索引库中的视频特征进行对比，确定出与新视频的视频特征相似度最高的视频特征，并将该视频特征对应的标签确定为新视频的标签。

但是，上述方法仅依据视频特征之间的相似性为视频打标，考虑因素单一，因此可能导致确定到的视频标签准确性较低。而随着互联网的发展，现有多媒体资源的创作通常具有强烈的社交属性。如图1所示，账户B发布了一个关于新款“拔草蛋糕”的短视频，账户B的关注者账户A模仿账户B也创作了一个类似视频，这种现象被称作“行为扩散”。“行为扩散”现象可以导致具体社交关系的视频对应的标签相同，本公开考虑到这一特点，将多媒体资源的社交属性作为辅助，为多媒体资源确定标签，使得确定到的视频标签准确性得到提升。

本公开实施例提供的标签确定方法可以适用于标签确定系统，该标签确定系统用于解决相关技术中确定出的标签准确性较低的问题。图2示出了该标签确定系统的一种结构示意图。如图2所示，标签确定系统10包括标签确定装置11以及电子设备12。标签确定装置11与电子设备12连接。标签确定装置11与电子设备12之间可以采用有线方式连接，也可以采用无线方式连接，本发明实施例对此不作限定。

标签确定装置11用于获取与目标多媒体资源具有社交关系的第一多媒体资源，并确定第一多媒体资源相对于目标多媒体资源的第一共同特征。标签确定装置11还用于确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的差异度。标签确定装置11还用于根据差异度，确定预设标签是否归属于目标多媒体资源。

标签确定装置11可以在各种可以处理多媒体资源的电子设备12中实现。其中，电子设备12可以为多媒体资源分享平台，比如短视频分享平台。该电子设备12至少具备多媒体资源存储装置、传输装置以及多媒体资源播放装置。

在不同的应用场景中，标签确定装置11和电子设备12可以为相互独立的设备，也可以集成于同一设备中，本发明实施例对此不作具体限定。

标签确定装置11和电子设备12集成于同一设备时，标签确定装置11和电子设备12之间的数据传输方式为该设备内部模块之间的数据传输。这种情况下，二者之间的数据传输流程与“标签确定装置11和电子设备12之间相互独立的情况下，二者之间的数据传输流程”相同。

在本公开实施例提供的以下实施例中，本公开实施例以标签确定装置11和电子设备12相互独立设置为例进行说明。

图3是根据一些示例性实施例示出的一种标签确定方法的流程示意图。在一些实施例中，上述标签确定方法可以应用到如图1所示的标签确定装置、电子设备，也可以应用到其他类似设备。

如图3所示，本公开实施例提供的标签确定方法，包括下述S201-S206。

S201、标签确定装置获取与目标多媒体资源具有社交关系的第一多媒体资源。

其中，社交关系用于表征不同多媒体资源的账户之间具有社交行为。

作为一种可能实现的方式，标签确定装置从电子设备中获取与目标多媒体资源具有社交关系的第一多媒体资源。

需要说明的，社交行为包括账户之间的互动操作，例如关注操作(账户A关注了账户B)、点赞操作(账户A为账户B发布的多媒体资源点赞)以及通知操作(账户A@账户B)等。本公开实施例对具体的社交行为不作限定。

示例性的，若目标多媒体资源的账户A关注了账户B以及账户C，则标签确定装置从多媒体资源分享平台中获取账户B的多媒体资源以及账户C的多媒体资源。

S202、标签确定装置确定第一多媒体资源相对于目标多媒体资源的第一共同特征。

作为一种可能实现的方式，标签确定装置将第一多媒体资源的原始数据进行转换处理，得到第一多媒体资源的资源特征，以及将目标多媒体资源的原始数据进行转换处理，得到目标多媒体资源的资源特征；进一步的，标签确定装置将第一多媒体资源的资源特征以及目标多媒体资源的资源特征进行合并，得到第一共同特征。

作为另一种可能实现的方式，标签确定装置根据预先训练好的特征确定模型确定第一多媒体资源相对于目标多媒体资源的第一共同特征。

作为又一种可能实现的方式，标签确定装置根据各第一多媒体资源的资源特征的相似性权重，将各第一多媒体资源的资源特征加权，得到第一共同特征。

此步骤的具体实施方式，可以参照本发明实施例的后续描述，此处不再进行赘述。

S203、标签确定装置确定预设标签的标签特征。

作为一种可能实现的方式，标签确定装置将预设标签输入到预先训练好的特征确定模型中，输出预设标签的标签特征。

需要说明的，预设标签为运维人员预先在标签确定装置中设置的。例如，预设标签可以为运维人员预先收集的历史视频的标签。

可选的，预设标签的标签特征包括标签共同特征、视频共同特征或者将标签共同特征以及视频共同特征进行融合得到的融合特征。

其中，标签共同特征包括与预设标签具有相同类别的同类标签相对于预设标签的共同特征。

视频共同特征包括与预设标签具有归属关系的第二多媒体资源相对于预设标签的共同特征。

S204、标签确定装置确定第一共同特征与预设标签的标签特征的目标差异度。

作为一种可能实现的方式，标签确定装置根据预设的距离公式计算第一共同特征与预设标签的标签特征之间的距离，并将计算得到的距离确定为目标差异度。

需要说明的，距离公式为运维人员预先在标签确定装置中设置的。

S205、标签确定装置判断目标差异度是否小于预设差异度。

作为一种可能实现的方式，标签确定装置将确定到的目标差异度与预设的标准差异度比较，判断目标差异度是否小于预设的标准差异度。

需要说明的，标准差异度为运维人员预先在标签确定装置中设置的。

S206、在目标差异度小于预设差异度的情况下，标签确定装置确定预设标签归属于目标多媒体资源。

作为一种可能实现的方式，若目标差异度小于或者等于预设的标准差异度，标签确定装置则确定预设标签归属于目标多媒体资源；若目标差异度大于预设的标准差异度，标签确定装置则确定预设标签不归属于目标多媒体资源。

在一些实施例中，标签确定装置将目标差异度输入到预设的评分模型中，输出匹配得分。若匹配得分大于预设分值，标签确定装置则确定预设标签归属于目标多媒体资源；若匹配得分小于或者等于预设分值，标签确定装置则确定预设标签不归属于目标多媒体资源。

需要说明的，评分模型为运维人员预先在标签确定装置中设置的，例如，评分模型可以为Sigmoid模型。

示例性的，视频v与标签t的匹配得分s(v，t)＝Sigmoid(h(t)(h(v))^T)，其中，h(t)表示标签特征，h(v)表示视频特征，T表示视频特征的转置。

上述实施例提供的技术方案至少带来以下有益效果：本公开中标签确定装置首先获取与目标多媒体资源具有社交关系的第一多媒体资源，并确定第一多媒体资源相对于目标多媒体资源的第一共同特征。由于社交关系用于表征不同多媒体资源的账户之间具有社交行为，因此目标多媒体资源与第一多媒体资源之间存在着强烈的社交属性，进而可以通过第一多媒体资源相对于目标多媒体资源的第一共同特征来反映这种社交属性，为后续确定目标多媒体资源的标签提供依据。进一步的，标签确定装置确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的目标差异度，以衡量预设标签与目标多媒体资源是否合适。进而标签确定装置根据目标差异度，确定出预设标签是否归属于目标多媒体资源。相较于现有技术中仅考虑视频特征之间的相似性为视频打标，本公开结合了多媒体资源具有较强社交属性的特点，提取具有社交关系多媒体资源的共同特征，并将该共同特征与标签特征的目标差异度作为依据，确定多媒体资源的标签。这样一来，确定出的标签更加准确。

在一种设计中，为了确定第一多媒体资源相对于目标多媒体资源的第一共同特征，如图4所示，本公开实施例提供的上述S202，具体包括下述S2021-S2022：

S2021、标签确定装置确定各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率，得到各第一多媒体资源对应的相似权重。

作为一种可能实现的方式，标签确定装置首先将目标多媒体资源的资源特征以及各第一多媒体资源的资源特征输入预设的权重公式中，确定各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率，得到各第一多媒体资源对应的相似权重。

需要说明的，预设公式为运维人员预设在标签确定装置中设置。

示例性的，标签确定装置首先设置目标多媒体资源v的类型为a_v，任意一个第一多媒体资源s∈N_r(v)的类型为a_s，N_r(v)表示与目标多媒体资源具有社交关系的第一多媒体资源。标签确定装置根据以下预设公式一、公式二、公式三，计算目标多媒体资源v的资源特征h(v)的query向量、第一多媒体资源s的资源特征h(s)的key向量、第一多媒体资源s的资源特征h(s)的value向量：

R^d为社交关系r对应的矩阵，维度为d。

其中，Q、K、V为预设的初始向量，h(v)为目标多媒体资源的资源特征，h(s)为第一多媒体资源的资源特征，

均表示资源特征的线性变换，

表示社交关系r对应的变换矩阵。

进一步的，标签确定装置根据预设公式四，计算各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率：

其中，a_r(v，s)表示第一多媒体资源s对应的相似权重，

表示社交关系r对应的变换矩阵。

S2022、标签确定装置基于各第一多媒体资源对应的相似权重，对各第一多媒体资源的资源特征加权，得到第一共同特征。

作为一种可能实现的方式，标签确定装置基于各第一多媒体资源对应的相似权重，按照预设的加权公式对各第一多媒体资源的资源特征加权，得到第一共同特征。

示例性的，标签确定装置根据预设公式五，计算第一共同特征：

其中，m_r(v)表示第一共同特征，

表示任意一个第一多媒体资源的value向量，a_r(v，s)表示该第一多媒体资源对应的相似权重。

上述实施例提供的技术方案至少带来以下有益效果：标签确定装置确定各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率，得到各第一多媒体资源对应的相似权重，以对各第一多媒体资源的重要性作出评估。进一步标签确定装置基于各第一多媒体资源对应的相似权重，对各第一多媒体资源的资源特征加权，得到的第一共同特征更加准确。

在一种设计中，为了确定第一多媒体资源相对于目标多媒体资源的第一共同特征，如图5所示，本公开实施例提供的上述S202，具体包括下述S2023：

S2023、标签确定装置将第一多媒体资源的资源特征以及目标多媒体资源的资源特征，输入预先训练得到的第一模型中，输出第一共同特征。

其中，第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

在实际应用中，标签确定装置将第一多媒体资源的资源特征以及目标多媒体资源的资源特征，输入预先训练得到的第一模型之后，第一模型中的第一层将计算各第一多媒体资源对应的相似权重，其计算方式可以参考上述S2021。第一模型中的第二层将基于各第一多媒体资源对应的相似权重，对各第一多媒体资源的资源特征加权，其计算方式可以参考上述S2022，最后第一模型输出第一共同特征。

示例性的，目标多媒体资源为视频1，第一多媒体资源为视频2以及视频3。标签确定装置将视频1的视频特征(向量a₁)、视频2的视频特征(向量a₂)以及视频3的视频特征(向量a₃)输入到预先训练得到的第一模型中，输出第一共同特征(向量a_v)。

上述实施例提供的技术方案至少带来以下有益效果：由于第一模型可以根据多个特征之间相似的概率确定多个特征的共同特征，因此标签确定装置将第一多媒体资源的资源特征以及目标多媒体资源的资源特征，输入预先训练得到的第一模型之后，第一模型首先计算第一多媒体资源的资源特征与目标多媒体资源的资源特征之间相似的概率，进一步根据计算出的概率输出第一共同特征。因此，通过第一模型来确定第一共同特征更加方便、准确。

在一种设计中，为了能够训练得到第一模型，如图6所示，本公开实施例提供的标签确定方法，在上述S2023之前还包括下述S301-S303：

S301、标签确定装置获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签。

作为一种可能实现的方式，标签确定装置从目标样本集合中获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签。

需要说明的，目标样本集合中包括预先收集好的第一样本多媒体资源以及目标样本多媒体资源的样本标签。

作为另一种可能实现的方式，标签确定装置从预构建好的异构图中获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签。

其中，异构图包括多个样本多媒体资源、多个样本标签、任意两个样本多媒体资源之间的社交关系、每个样本多媒体资源与每个样本标签之间的归属关系、任意两个标签之间的类别关系。

需要说明的，异构图为运维人员预先构建完成，并存储在标签确定装置中的。

示例性的，如图7所示，示出了一种异构图的表现形式，该异构图可以表示为G(V，E)。其中，V为节点集合，由样本多媒体资源集合V₁和样本标签集合V₂构成。E为边集合，由is_subtopic_of(类别关系)关系集合E₁、has_tag(标签归属关系)关系集合E₂和is_followed_by(社交关系)关系集合E₃构成。is_followed_by关系表示任意两个样本多媒体资源之间的社交关系，由旧多媒体资源指向新多媒体资源，即旧多媒体资源影响新多媒体资源(例如，若账户A关注账户B，则账户B的多媒体资源is_followed_by账户A的多媒体资源)。is_subtopic_of关系表示任意两个标签之间的类别关系(例如，草莓蛋糕与拔草蛋糕均为蛋糕类别)。has_tag关系表示每个样本多媒体资源与每个样本标签之间的归属关系，来自已经标注好的视频-标签数据。

可以理解的，由于异构图中包括多个样本多媒体资源、多个样本标签、任意两个样本多媒体资源之间的社交关系、每个样本多媒体资源与每个样本标签之间的归属关系、任意两个标签之间的类别关系。因此标签确定装置从预构建好的异构图中获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签，更加快捷、方便。

S302、标签确定装置确定样本标签的标签特征。

作为一种可能实现的方式，标签确定装置将样本标签的原始数据转化为向量，并将样本标签的向量作为样本标签的标签特征。

S303、标签确定装置将目标样本多媒体资源的资源特征以及第一样本多媒体资源的资源特征作为样本特征，将样本标签的标签特征作为监督信号，对预设的第一神经网络进行训练，得到第一模型。

作为一种可能实现的方式，标签确定装置将目标样本多媒体资源的资源特征以及第一样本多媒体资源的资源特征作为样本特征，输入预设的第一神经网络，得到第一样本多媒体资源的资源特征相对于目标样本多媒体资源的资源特征的第二共同特征。标签确定装置计算第二共同特征与样本标签的标签特征之间的差异度，在第二共同特征与样本标签的标签特征之间的差异度小于预设阈值的情况下，标签确定装置则训练得到第一模型。在第二共同特征与样本标签的标签特征之间的差异度大于或者等于预设阈值的情况下，标签确定装置则采用新的目标样本多媒体资源，对第一神经网络进行迭代训练，直到得到的第二共同特征与样本标签的标签特征之间的差异度小于预设阈值为止。

在实际应用中，第一神经网络可以为任意的异构图神经网络。例如异构图形注意网络(heterogeneous graph attention network，HGT)、分层注意力网络(hierarchicalattention network，HAN)。

示例性的，在第一神经网络为HGR时，标签确定装置将目标样本多媒体资源作为中心节点、将第一样本多媒体资源作为邻居节点，输入到HGR中。进一步标签确定装置将样本标签的标签特征作为监督信号，对HGR进行训练，直到HGR输出的第二共同特征与样本标签的标签特征之间的差异度小于预设阈值为止。

上述实施例提供的技术方案至少带来以下有益效果：标签确定装置首先获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签；进一步标签确定装置确定样本标签的标签特征，并将目标样本多媒体资源的资源特征以及第一样本多媒体资源的资源特征作为样本特征，将样本标签的标签特征作为监督信号，对预设的第一神经网络进行训练，得到第一模型。这样一来，在后续过程中标签确定装置直接使用第一模型即可确定出多个特征的共同特征。

在一种设计中，为了确定预设标签的标签特征，如图8所示，本公开实施例提供的上述S203，具体包括下述S2031-S2032：

S2031、标签确定装置获取同类标签。

作为一种可能实现的方式，标签确定装置从预构建好的异构图中获取与预设标签具有相同类别的同类标签。

S2032、标签确定装置将同类标签的标签特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出标签共同特征。

在实际应用中，标签确定装置将同类标签的标签特征与预设标签的标签特征输入到预先训练得到的第一模型之后，第一模型中的第一层将计算各同类标签对应的相似权重，其计算方式可以参考上述S2021。第一模型中的第二层将基于各同类标签对应的相似权重，对各同类标签的资源特征加权，其计算方式可以参考上述S2022，最后第一模型输出标签共同特征。

示例性的，预设标签为标签1，同类标签为标签2以及标签3。标签确定装置将标签1的标签特征(向量a1)、标签2的标签特征(向量a2)以及标签3的标签特征(向量a3)输入到预先训练得到的第一模型中，输出标签共同特征(向量a_t)。

需要说明的，此处第一模型的训练过程可以参考上述S301-S303，不同之处在于，标签确定装置将样本标签的标签特征以及样本同类标签的标签特征作为样本特征，将样本标签的标签特征作为监督信号。

示例性的，在第一神经网络为HGR时，标签确定装置将样本标签作为中心节点、将样本同类标签作为邻居节点，输入到HGR中。进一步标签确定装置将样本标签的标签特征作为监督信号，对HGR进行训练，直到HGR输出的预测标签共同特征与样本标签的标签特征之间的差异度小于预设阈值为止。

上述实施例提供的技术方案至少带来以下有益效果：由于第一模型可以根据多个特征之间相似的概率确定多个特征的共同特征，因此标签确定装置将同类标签的标签特征与预设标签的标签特征输入到预先训练得到的第一模型之后，第一模型首先计算预设标签的标签特征与同类标签的标签特征之间相似的概率，进一步根据计算出的概率输出标签共同特征。可见，通过第一模型确定出的标签特征可以反映出与预设标签具体相同类别标签的共同特征，这样一来，使得输出的标签特征更加准确。

在一种设计中，为了确定预设标签的标签特征，如图9所示，本公开实施例提供的上述S203，具体包括下述S2033-S2034：

S2033、标签确定装置获取第二多媒体资源。

作为一种可能实现的方式，标签确定装置从预构建好的异构图中获取与预设标签具有归属关系的第二多媒体资源。

S2034、标签确定装置将第二多媒体资源的资源特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出视频共同特征。

在实际应用中，标签确定装置将第二多媒体资源的资源特征与预设标签的标签特征输入到预先训练得到的第一模型之后，第一模型中的第一层将计算各第二多媒体资源的资源特征对应的相似权重，其计算方式可以参考上述S2021。第一模型中的第二层将基于各第二多媒体资源的资源特征对应的相似权重，对各第二多媒体资源的资源特征的资源特征加权，其计算方式可以参考上述S2022，最后第一模型输出视频共同特征。

示例性的，预设标签为标签1，第二多媒体资源为视频2以及视频3。标签确定装置将标签1的标签特征(向量a1)、视频2的视频特征(向量a2)以及视频3的视频特征(向量a3)输入到预先训练得到的第一模型中，输出视频共同特征(向量a_v)。

需要说明的，此处第一模型的训练过程可以参考上述S301-S303，不同之处在于，标签确定装置将样本标签的标签特征以及第二样本多媒体资源的资源特征作为样本特征，将样本标签的标签特征作为监督信号。

示例性的，在第一神经网络为HGR时，标签确定装置将样本标签作为中心节点、将第二样本多媒体资源作为邻居节点，输入到HGR中。进一步标签确定装置将样本标签的标签特征作为监督信号，对HGR进行训练，直到HGR输出的预测视频共同特征与样本标签的标签特征之间的差异度小于预设阈值为止。

上述实施例提供的技术方案至少带来以下有益效果：由于第一模型可以根据多个特征之间相似的概率确定多个特征的共同特征，因此标签确定装置将第二多媒体资源的资源特征与预设标签的标签特征输入到预先训练得到的第一模型之后，第一模型首先计算预设标签的标签特征与第二多媒体资源的资源特征之间相似的概率，进一步根据计算出的概率输出视频共同特征。可见，通过第一模型确定出的视频特征可以反映出与预设标签具体归属关系的第二多媒体资源相对于预设标签的共同特征，这样一来，使得输出的标签特征更加准确。

在一种设计中，为了确定预设标签的标签特征，标签确定装置将标签共同特征以及视频共同特征进行融合得到的融合特征。

具体的，标签确定装置根据预训练好的第二模型，对标签共同特征以及视频共同特征进行融合得到的融合特征。

在实际应用中，第二模型可以为任意的多模态聚合模型。例如，多模态聚合模型可以使用拼接加线性变换的方式，对标签共同特征以及视频共同特征进行融合：

其中，h(t)表示融合特征，

表示对标签共同特征

进行线性变换，

表示对视频共同特征

进行线性变换。

在一种设计中，为了确定预设标签是否归属于目标多媒体资源，标签确定装置将目标多媒体资源的资源特征、第一多媒体资源的资源特征、预设标签的标签特征输入到预先训练好的标签确定模型中，输出目标多媒体资源与标签，该标签归属于目标多媒体资源。

示例性的，如图10所示，示出了标签确定模型的一种结构示意图。该标签确定模型由三个第一模型、一个第二模型以及一个判断模型组成。其中，三个第一模型分别用于确定第一共同特征h(v)、标签共同特征

以及视频共同特征

第二模型用于将标签共同特征

与视频共同特征

进行融合，得到融合特征h(t)。判断模型用于计算h(v)与h(t)的相似度，并将相似度大于预设阈值的h(v)与h(t)输出。

在一种设计中，为了训练得到标签确定模型，标签确定装置将目标样本多媒体资源的资源特征、第一样本多媒体资源的资源特征、样本标签的标签特征作为样本特征，将样本标签作为监督信号，对预测标签确定模型进行训练。在预测标签与样本标签之间的差异度大于预设阈值的情况下，调整第一模型的参数，对预测标签确定模型进行迭代训练，直到得到的预测标签与与样本标签之间的差异度小于或者等于预设阈值为止。

上述实施例主要从装置(设备)的角度对本公开实施例提供的方案进行了介绍。可以理解的是，为了实现上述方法，装置或设备包含了执行各个方法流程相应的硬件结构和/或软件模块，这些执行各个方法流程相应的硬件结构和/或软件模块可以构成一个物料信息的确定装置。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的算法步骤，本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

本公开实施例可以根据上述方法示例对装置或设备进行功能模块的划分，例如，装置或设备可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本公开实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

图11是根据一示例性实施例示出的标签确定装置的结构示意图。参照图11所示，本公开实施例提供的标签确定装置40，包括获取单元401以及确定单元402。

获取单元401，用于获取与目标多媒体资源具有社交关系的第一多媒体资源。例如，如图2所示，获取单元401可以用于执行S201。

确定单元402，用于确定获取单元获取到的第一多媒体资源相对于目标多媒体资源的第一共同特征。社交关系用于表征不同多媒体资源的账户之间具有社交行为。例如，如图2所示，确定单元402可以用于执行S202。

确定单元402，还用于确定预设标签的标签特征，并确定第一共同特征与预设标签的标签特征的目标差异度。例如，如图2所示，确定单元402可以用于执行S203-S204。

确定单元402，还用于在目标差异度小于预设差异度的情况下，确定预设标签归属于目标多媒体资源。例如，如图2所示，确定单元402可以用于执行S205-S206。

可选的，确定单元402，具体用于：将第一多媒体资源的资源特征以及目标多媒体资源的资源特征，输入预先训练得到的第一模型中，输出第一共同特征。第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

可选的，获取单元401还用于获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签。

确定单元402还用于确定样本标签的标签特征。

可选的，标签确定装置还包括训练单元403，训练单元403用于将目标样本多媒体资源的资源特征以及第一样本多媒体资源的资源特征作为样本特征，将样本标签的标签特征作为监督信号，对预设的第一神经网络进行训练，得到第一模型。

可选的，获取单元401，具体用于：从预构建好的异构图中获取与目标样本多媒体资源具有社交关系的第一样本多媒体资源，以及目标样本多媒体资源的样本标签。异构图包括多个样本多媒体资源、多个样本标签、任意两个样本多媒体资源之间的社交关系以及每个样本多媒体资源与每个样本标签之间的归属关系。

可选的，确定单元402，具体用于：确定各第一多媒体资源的资源特征相对于目标多媒体资源的资源特征相似的概率，得到各第一多媒体资源对应的相似权重。基于各第一多媒体资源对应的相似权重，对各第一多媒体资源的资源特征加权，得到第一共同特征。

可选的，预设标签的标签特征包括标签共同特征、视频共同特征或者将标签共同特征以及视频共同特征进行融合得到的融合特征。其中，标签共同特征包括与预设标签具有相同类别的同类标签相对于预设标签的共同特征。视频共同特征包括与预设标签具有归属关系的第二多媒体资源相对于预设标签的共同特征。

可选的，确定单元402，具体用于：获取同类标签，并将同类标签的标签特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出标签共同特征。第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

可选的，确定单元402，具体用于：获取第二多媒体资源，并将第二多媒体资源的资源特征与预设标签的标签特征输入到预先训练得到的第一模型中，输出视频共同特征。第一模型用于根据多个特征之间相似的概率确定多个特征的共同特征。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图12是本公开提供的一种电子设备的结构示意图。如图12，该电子设备50可以包括至少一个处理器501以及用于存储处理器可执行指令的存储器502其中，处理器501被配置为执行存储器502中的指令，以实现上述实施例中的标签确定方法。

另外，电子设备50还可以包括通信总线503以及至少一个通信接口504。

处理器501可以是一个处理器(central processing units，CPU)，微处理单元，ASIC，或一个或多个用于控制本公开方案程序执行的集成电路。

通信总线503可包括一通路，在上述组件之间传送信息。

通信接口504，使用任何收发器一类的装置，用于与其他设备或通信网络通信，如以太网，无线接入网(radio access network，RAN)，无线局域网(wireless local areanetworks，WLAN)等。

存储器502可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理单元相连接。存储器也可以和处理单元集成在一起。

其中，存储器502用于存储执行本公开方案的指令，并由处理器501来控制执行。处理器501用于执行存储器502中存储的指令，从而实现本公开方法中的功能。

作为一个示例，结合图12，标签确定装置40中的获取单元401、确定单元402、训练单元403实现的功能与图12中的处理器501的功能相同。

在具体实现中，作为一种实施例，处理器501可以包括一个或多个CPU，例如图12中的CPU0和CPU1。

在具体实现中，作为一种实施例，电子设备50可以包括多个处理器，例如图12中的处理器501和处理器507。这些处理器中的每一个可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在具体实现中，作为一种实施例，电子设备50还可以包括输出设备505和输入设备506。输出设备505和处理器501通信，可以以多种方式来显示信息。例如，输出设备505可以是液晶显示器(liquid crystal display，LCD)，发光二级管(light emitting diode，LED)显示设备，阴极射线管(cathode ray tube，CRT)显示设备，或投影仪(projector)等。输入设备506和处理器501通信，可以以多种方式接受用户对象的输入。例如，输入设备506可以是鼠标、键盘、触摸屏设备或传感设备等。

本领域技术人员可以理解，图12中示出的结构并不构成对电子设备50的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

另外，本公开还提供一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如上述实施例所提供的标签确定方法。

另外，本公开还提供一种计算机程序产品，包括计算机指令，当计算机指令在电子设备上运行时，使得电子设备执行如上述实施例所提供的标签确定方法。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

1.一种标签确定方法，其特征在于，包括：

获取与目标多媒体资源具有社交关系的第一多媒体资源，并确定所述第一多媒体资源相对于所述目标多媒体资源的第一共同特征；所述社交关系用于表征不同多媒体资源的账户之间具有社交行为；

确定预设标签的标签特征，并确定所述第一共同特征与所述预设标签的标签特征的目标差异度；

在所述目标差异度小于预设差异度的情况下，确定所述预设标签归属于所述目标多媒体资源。

2.根据权利要求1所述的标签确定方法，其特征在于，所述确定所述第一多媒体资源相对于所述目标多媒体资源的第一共同特征，包括：

将所述第一多媒体资源的资源特征以及所述目标多媒体资源的资源特征，输入预先训练得到的第一模型中，输出所述第一共同特征；所述第一模型用于根据多个特征之间相似的概率确定所述多个特征的共同特征。

3.根据权利要求2所述的标签确定方法，其特征在于，所述方法还包括：

获取与目标样本多媒体资源具有所述社交关系的第一样本多媒体资源，以及所述目标样本多媒体资源的样本标签；

确定样本标签的标签特征，并将所述目标样本多媒体资源的资源特征以及所述第一样本多媒体资源的资源特征作为样本特征，将所述样本标签的标签特征作为监督信号，对预设的第一神经网络进行训练，得到所述第一模型。

4.根据权利要求3所述的标签确定方法，其特征在于，所述获取与目标样本多媒体资源具有所述社交关系的第一样本多媒体资源，以及所述目标样本多媒体资源的样本标签，包括：

从预构建好的异构图中获取与目标样本多媒体资源具有所述社交关系的第一样本多媒体资源，以及所述目标样本多媒体资源的样本标签；所述异构图包括多个样本多媒体资源、多个样本标签、任意两个样本多媒体资源之间的所述社交关系以及每个样本多媒体资源与每个样本标签之间的归属关系。

5.根据权利要求1所述的标签确定方法，其特征在于，所述确定所述第一多媒体资源相对于所述目标多媒体资源的第一共同特征，包括：

确定各所述第一多媒体资源的资源特征相对于所述目标多媒体资源的资源特征相似的概率，得到各所述第一多媒体资源对应的相似权重；

基于各所述第一多媒体资源对应的相似权重，对各所述第一多媒体资源的资源特征加权，得到所述第一共同特征。

6.根据权利要求1-5中任一项所述的标签确定方法，其特征在于，所述预设标签的标签特征包括标签共同特征、视频共同特征或者将所述标签共同特征以及所述视频共同特征进行融合得到的融合特征；

其中，所述标签共同特征包括与所述预设标签具有相同类别的同类标签相对于所述预设标签的共同特征；

所述视频共同特征包括与所述预设标签具有归属关系的第二多媒体资源相对于所述预设标签的共同特征。

7.一种标签确定装置，其特征在于，包括获取单元以及确定单元；

所述获取单元，用于获取与目标多媒体资源具有社交关系的第一多媒体资源；

所述确定单元，用于确定所述获取单元获取到的所述第一多媒体资源相对于所述目标多媒体资源的第一共同特征；所述社交关系用于表征不同多媒体资源的账户之间具有社交行为；

所述确定单元，还用于确定预设标签的标签特征，并确定所述第一共同特征与所述预设标签的标签特征的目标差异度；

所述确定单元，还用于在所述目标差异度小于预设差异度的情况下，确定所述预设标签归属于所述目标多媒体资源。

8.一种电子设备，其特征在于，包括：处理器、用于存储所述处理器可执行的指令的存储器；其中，所述处理器被配置为执行指令，以实现所述权利要求1-6中任一项所述的标签确定方法。

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1-6中任一项所述的标签确定方法。

10.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机指令，当所述计算机指令被处理器执行时，实现如权利要求1-6中任一项所述的标签确定方法。