CN113901244A - 多媒体资源的标签构建方法、装置、电子设备和存储介质 - Google Patents

多媒体资源的标签构建方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113901244A
CN113901244A CN202111188872.1A CN202111188872A CN113901244A CN 113901244 A CN113901244 A CN 113901244A CN 202111188872 A CN202111188872 A CN 202111188872A CN 113901244 A CN113901244 A CN 113901244A
Authority
CN
China
Prior art keywords
information
label
tag
sub
multimedia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111188872.1A
Other languages
English (en)
Inventor
汪敏峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111188872.1A priority Critical patent/CN113901244A/zh
Publication of CN113901244A publication Critical patent/CN113901244A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Abstract

本公开关于一种多媒体资源的标签构建方法、装置、电子设备和存储介质,该方法包括:获取多媒体资源,并对多媒体资源进行内容识别,得到多媒体内容信息。基于多个主标签信息各自对应的子标签信息对多媒体内容信息进行标签构建,得到多个标签构建结果。多个主标签信息间相互独立。根据多媒体资源的标签属性信息,进行多媒体资源的推荐。该方法可以一次性得到多个标签构建结果,从而提高标签构建的效率。该方法从每个主标签信息中确定一个匹配的子标签信息作为目标子标签信息,对多媒体资源进行标签构建,得到的多个标签构建结果相互独立,可以避免重复构建,提高标签构建的准确性。

Description

多媒体资源的标签构建方法、装置、电子设备和存储介质
技术领域
本公开涉及大数据技术领域,尤其涉及多媒体资源的标签构建方法、装置、电子设备和存储介质。
背景技术
随着商业化广告业务的持续发展,广告信息越来越丰富,广告标签可以对广告信息进行标注,从而使得广告系统可以通过广告标签识别出广告信息的属性,在众多的广告信息中得到合适的广告信息,并将合适的广告信息精准投放给用户。
相关技术中,广告标签的来源非常丰富,广告标签数目众多,导致在对广告信息进行标签构建时的效率较低,且容易出现广告标签重复构建的情况,标签构建的准确性低。
发明内容
本公开提供多媒体资源的标签构建方法、装置、电子设备和存储介质,以至少解决相关技术中标签构建效率低,且标签构建准确性低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体资源的标签构建方法,所述方法包括:
获取待构建标签的多媒体资源的内容信息;
基于预设的多个主标签信息各自对应的子标签信息和所述内容信息,对所述多媒体资源进行标签构建,得到多个标签构建结果,每个标签构建结果对应一个目标子标签,所述目标子标签为所述多个主标签信息的每个主标签信息中,与所述多媒体资源对应的子标签信息,所述主标签信息为同一类别的子标签信息对应的类别标签信息,所述子标签信息为每个主标签信息对应的类别下的至少一个标签信息。
作为一个可选的实施例,所述基于预设的多个主标签信息各自对应的子标签信息和所述内容信息,对所述多媒体资源进行标签构建,得到多个标签构建结果包括:
将所述多个主标签信息中每个主标签信息对应的每个子标签信息和所述内容信息进行匹配;
将与所述内容信息匹配的子标签信息作为所述目标子标签;
建立每个主标签信息对应的目标子标签和所述多媒体资源间的标签构建结果。
作为一个可选的实施例,所述方法还包括:
获取多个待处理标签信息,所述待处理标签信息为基于多种标签来源得到的未分类的标签信息;
对所述多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果;
根据所述多个相似度匹配结果,对所述待处理标签信息进行分类,得到多个目标标签信息组,每个目标标签信息组对应一个类别信息;
将所述每个目标标签信息组对应的类别信息作为所述主标签信息;
将所述每个目标标签信息组中的待处理标签信息作为所述主标签信息对应的子标签信息。
作为一个可选的实施例,所述对所述多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果之后,所述方法还包括:
根据多个相似度匹配结果,对所述待处理标签信息进行分类,得到多个第一标签信息组,所述多个第一标签信息组包括同一类别信息对应的至少两个标签信息组,和互不相同的类别信息分别对应的标签信息组;
对所述同一类别信息对应的至少两个标签信息组进行合并,得到至少一个第二标签信息组;
对每个第二标签信息组中的待处理标签信息进行去重处理;
将所述互不相同的类别信息分别对应的标签信息组和去重处理后的第二标签信息组作为所述目标标签信息组。
作为一个可选的实施例,所述方法还包括:
基于所述多个标签构建结果,生成所述多媒体资源的标签属性信息。
作为一个可选的实施例,所述获取待构建标签的多媒体资源的内容信息包括:
基于预设的内容特征提取模型,对所述多媒体资源进行内容特征提取,得到所述内容信息。
作为一个可选的实施例,所述方法还包括:
获取目标对象对应的用户标签信息;
获取待推荐多媒体资源对应的多个待推荐构建结果,所述多个待推荐构建结果为所述待推荐多媒体资源对应的多个标签构建结果;
对比所述用户标签信息和每个待推荐构建结果对应的目标子标签;
在所述用户标签信息与所述待推荐构建结果对应的目标子标签匹配的情况下,向所述目标对象推荐所述待推荐多媒体资源。
根据本公开实施例的第二方面,提供一种多媒体资源的标签构建装置,所述装置包括:
多媒体内容识别模块,被配置为执行获取待构建标签的多媒体资源的内容信息;
标签构建模块,被配置为执行基于预设的多个主标签信息各自对应的子标签信息和所述内容信息,对所述多媒体资源进行标签构建,得到多个标签构建结果,每个标签构建结果对应一个目标子标签,所述目标子标签为所述多个主标签信息的每个主标签信息中,与所述多媒体资源对应的子标签信息,所述主标签信息为同一类别的子标签信息对应的类别标签信息,所述子标签信息为每个主标签信息对应的类别下的至少一个标签信息。
作为一个可选的实施例,所述标签构建模块包括:
子标签匹配单元,被配置为执行将所述多个主标签信息中每个主标签信息对应的每个子标签信息和所述内容信息进行匹配;
目标子标签确定单元,被配置为执行将与所述内容信息匹配的子标签信息作为所述目标子标签;
标签构建结果获取单元,被配置为执行建立每个主标签信息对应的目标子标签和所述多媒体资源间的标签构建结果。
作为一个可选的实施例,所述装置还包括:
待处理标签信息获取模块,被配置为执行获取多个待处理标签信息,所述待处理标签信息为基于多种标签来源得到的未分类的标签信息;
相似度匹配结果获取模块,被配置为执行对所述多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果;
第一分类模块,被配置为执行根据所述多个相似度匹配结果,对所述待处理标签信息进行分类,得到多个目标标签信息组,每个目标标签信息组对应一个类别信息;
主标签信息确定模块,被配置为执行将所述每个目标标签信息组对应的类别信息作为所述主标签信息;
子标签信息确定模块,被配置为执行将所述每个目标标签信息组中的待处理标签信息作为所述主标签信息对应的子标签信息。
作为一个可选的实施例,所述装置还包括:
第二分类模块,被配置为执行根据多个相似度匹配结果,对所述待处理标签信息进行分类,得到多个第一标签信息组,所述多个第一标签信息组包括同一类别信息对应的至少两个标签信息组,和互不相同的类别信息分别对应的标签信息组;
同类别合并模块,被配置为执行对所述同一类别信息对应的至少两个标签信息组进行合并,得到至少一个第二标签信息组;
去重模块,被配置为执行对每个第二标签信息组中的待处理标签信息进行去重处理;
目标标签信息组确定模块,被配置为执行将所述互不相同的类别信息分别对应的标签信息组和去重处理后的第二标签信息组作为所述目标标签信息组。
作为一个可选的实施例,所述装置还包括:
标签属性信息生成模块,被配置为执行基于所述多个标签构建结果,生成所述多媒体资源的标签属性信息。
作为一个可选的实施例,所述多媒体内容识别模块包括:
特征提取单元,被配置为执行基于预设的内容特征提取模型,对所述多媒体资源进行内容特征提取,得到所述内容信息。
作为一个可选的实施例,所述装置还包括:
用户标签信息获取模块,被配置为执行获取目标对象对应的用户标签信息;
标签属性信息获取模块,被配置为执行获取待推荐多媒体资源对应的多个待推荐构建结果,所述多个待推荐构建结果为所述待推荐多媒体资源对应的多个标签构建结果;
对比模块,被配置为执行对比所述用户标签信息和每个待推荐构建结果对应的目标子标签;
推荐模块,被配置为执行在所述用户标签信息与所述待推荐构建结果对应的目标子标签匹配的情况下,向所述目标对象推荐所述待推荐多媒体资源。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述所述的多媒体资源的标签构建方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如上述所述的多媒体资源的标签构建方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述所述的多媒体资源的标签构建方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
获取多媒体资源,并对多媒体资源进行内容识别,得到多媒体内容信息。基于多个主标签信息各自对应的子标签信息对多媒体内容信息进行标签构建,得到多个标签构建结果。多个主标签信息间相互独立。根据多媒体资源的标签属性信息,进行多媒体资源的推荐。该方法可以一次性得到多个标签构建结果,从而提高标签构建的效率。该方法从每个主标签信息中确定一个匹配的子标签信息作为目标子标签信息,对多媒体资源进行标签构建,得到的多个标签构建结果相互独立,可以避免重复构建,提高标签构建的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种多媒体资源的标签构建方法的场景示意图。
图2是根据一示例性实施例示出的一种多媒体资源的标签构建方法的流程图。
图3是根据一示例性实施例示出的一种多媒体资源的标签构建方法中得到主标签信息和子标签信息的流程图。
图4是根据一示例性实施例示出的一种多媒体资源的标签构建方法中主标签信息和子标签信息的示意图。
图5是根据一示例性实施例示出的一种多媒体资源的标签构建方法中进行去重处理的流程图。
图6是根据一示例性实施例示出的一种多媒体资源的标签构建方法中进行标签构建的流程图。
图7是根据一示例性实施例示出的一种多媒体资源的标签构建方法中标签构建时的子标签信息和多媒体内容信息间的匹配结果的示意图。
图8是根据一示例性实施例示出的一种多媒体资源的标签构建方法中进行多媒体资源推荐的流程图。
图9是根据一示例性实施例示出的一种多媒体资源的标签构建装置的框图。
图10是根据一示例性实施例示出的一种服务器侧电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种多媒体资源的标签构建方法的应用场景示意图,该应用场景包括服务器110和客户端120。服务器110获取多媒体资源,并对多媒体资源进行内容识别,得到多媒体内容信息。服务器110基于多个主标签信息各自对应的子标签信息对多媒体内容信息进行标签构建,得到多个标签构建结果,服务器基于多个标签构建结果,生成多媒体资源的标签属性信息。服务器110根据多媒体资源的标签属性信息,对客户端120推荐多媒体资源。
在本公开实施例中,服务器110可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。服务器110可以包括有网络通信单元、处理器和存储器等等。具体的,服务器110可以基于多个主标签信息各自对应的子标签信息对多媒体内容信息进行标签构建,并生成多媒体资源的标签属性信息。
在本公开实施例中,客户端120包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序等。本申请实施例中实体设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、Unix、windows等。基于API(Application Programming Interface,应用程序接口)接收服务器110发送的多媒体资源。
图2是根据一示例性实施例示出的一种多媒体资源的标签构建方法的流程图,如图1所示,该方法用于服务器中,包括以下步骤。
S210.获取待构建标签的多媒体资源的内容信息;
作为一个可选的实施例,多媒体资源可以包括不同表现形式的广告信息,例如图像广告、视频广告、文字广告等。
作为一个可选的实施例,服务器可以获取与多媒体资源相关的数据流,与多媒体资源相关的数据流中包括至少一个多媒体资源,服务器可以获取多媒体标识信息,通过多媒体标识信息,确定数据流中与多媒体标识信息对应的多媒体资源,对与多媒体标识信息对应的多媒体资源进行标签构建。
作为一个可选的实施例,基于预设的内容特征提取模型,对多媒体资源进行内容特征提取,得到多媒体内容信息。内容特征提取模型可以包括图像特征提取模型、语音特征提取模型和文字特征提取模型。
作为一个可选的实施例,根据多媒体资源的类型,可以通过与多媒体资源的类型对应的内容特征提取模型,对多媒体资源进行特征提取。
在多媒体资源为视频信息或图像信息时,可以基于图像识别模型,对视频信息中的关键帧和图像信息进行图像特征提取。在多媒体资源为视频信息时,也可以对视频信息的音轨中的语音信息进行语音特征提取。服务器也可以从多媒体数据流中获取多媒体资源的发布者、简介、主题等与多媒体资源相关联的信息,对多媒体关联的信息进行特征提取。例如,在发布者为某游戏软件时,可以确定该多媒体资源为游戏行业相关的多媒体资源。将对多媒体资源的特征提取结果和对多媒体关联信息的特征提取结果均可以作为多媒体内容信息。
通过对多媒体资源进行内容识别,得到多媒体内容信息,从而在后续步骤后确定与多媒体内容信息对应的目标子标签,建立多媒体资源和目标子标签间的对应关系,提高了标签构建的准确性。
作为一个可选的实施例,请参见图3,该方法还包括:
S310.获取多个待处理标签信息,待处理标签信息为基于多种标签来源得到的未分类的标签信息;
S320.对多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果;
S330.根据多个相似度匹配结果,对待处理标签信息进行分类,得到多个目标标签信息组,每个目标标签信息组对应一个类别信息;
S340.将每个目标标签信息组对应的类别信息作为主标签信息;
S350.将每个目标标签信息组中的待处理标签信息作为主标签信息对应的子标签信息。
作为一个可选的实施例,服务器通过不同的标签来源,可以获取多个待处理标签信息,标签来源可以包括发布者、主题、产品、发布位置、发布需求、发布时间等等。例如通过发布者的相关信息提取到待处理标签信息,通过主题的相关信息提取到待处理标签信息,通过产品的相关信息提取到待处理标签信息。
作为一个可选的实施例,对多个待处理标签信息进行分类,计算多个待处理标签信息中的任两个待处理标签信息间的相似度,得到多个相似度匹配结果。获取相似度大于预设阈值的相似度匹配结果。根据相似度大于预设阈值的相似度匹配结果,对待处理标签信息进行分类,可以得到多个目标标签信息组,每个待处理标签信息组对应同一类别信息。将每个目标标签信息组对应的同一类别信息作为主标签信息,并将每个待处理标签信息组中的待处理标签信息作为主标签信息对应的子标签信息。
请参见图4,如图4所示,每一主标签信息下可以包括多个子标签信息。在进行待处理标签信息的分类时,可以对多个目标标签信息组中的待处理标签信息进行去重处理,使得在完成对待处理标签的分类后,每个主标签信息对应的预设标签信息与其他主标签信息对应的预设标签信息各不相同。
作为一个可选的实施例,待处理标签信息包括待处理标签信息a、待处理标签信息a1、待处理标签信息b1、待处理标签信息b2和待处理标签信息c1。待处理标签信息a和待处理标签信息a1间的相似度大于预设阈值,待处理标签信息b1和待处理标签信息b2间的相似度大于预设阈值,待处理标签信息c1和待处理标签信息a、待处理标签信息a1、待处理标签信息b1、待处理标签信息b2中任一待处理标签信息间的相似度均小于预设阈值。则服务器可以将待处理标签信息a和待处理标签信息a1分为一类,并将对应的类别信息确定为主标签信息A。将待处理标签信息b1和待处理标签信息b2分为一类,并将对应的类别信息确定为主标签信息B。将待处理标签信息c1分为一类,并将对应的类别信息确定位主标签信息C。
作为一个可选的实施例,在对待处理标签信息进行分类时,可以通过人工分类的方式进行分类,也可以通过预先训练好的分类模型对待处理标签信息进行分类。
基于相似度匹配结果,对待处理标签信息进行分类,得到多个目标标签信息组,提高了标签构建的效率。
作为一个可选的实施例,请参见图5,对多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果之后,该方法还包括:
S510.根据多个相似度匹配结果,对待处理标签信息进行分类,得到多个第一标签信息组,多个第一标签信息组包括同一类别信息对应的至少两个标签信息组,和互不相同的类别信息分别对应的标签信息组;
S520.对同一类别信息对应的至少两个标签信息组进行合并,得到至少一个第二标签信息组;
S530.对每个第二标签信息组中的待处理标签信息进行去重处理;
S540.将互不相同的类别信息分别对应的标签信息组和去重处理后的第二标签信息组作为目标标签信息组。
作为一个可选的实施例,根据多个相似度匹配结果,对待处理标签信息进行分类,得到多个第一标签信息组,在这多个第一标签信息组中可能存在类别重复的第一标签信息组,即两个或两个以上的第一标签信息组对应同一类别,因此可以将这多个第一标签信息组分为同一类别信息对应的至少两个标签信息组,和互不相同的类别信息分别对应的标签信息组,其中互不相同的类别信息分别对应的标签信息组即为不存在类别重复的第一标签信息组,每个第一标签信息组对应一个类别。
作为一个可选的实施例,对同一类别信息对应的至少两个标签信息组进行合并,得到至少一个第二标签信息组。例如若第一标签信息组中的标签信息组A和标签信息组B都对应一游戏类别,则将标签信息组A和标签信息组B合并为第二标签信息组C,该第二标签信息组C对应游戏类别。在得到第二标签信息组后,对第二标签信息组中的待处理标签信息进行去重处理,删除待处理标签信息中重复的标签,例如若第一标签信息组中的标签信息组A和标签信息组B都对应一游戏类别,且标签信息组A中有卡牌游戏这一标签,标签信息组B中也有卡牌游戏这一标签,则在合并标签信息组A和标签信息组B得到第二标签信息组C之后,将第二标签信息组C中的待处理标签信息进行去重处理,从两个卡牌游戏的标签删除一个。
第一标签信息组中互不相同的类别信息分别对应的标签信息组和去重处理后的第二标签信息组均为对应一个类别的标签信息组,且各个标签信息组间相互独立,没有重复的类别,也没有重复的标签信息,则可以将在第一标签信息组中互不相同的类别信息分别对应的标签信息组,和去重处理后的第二标签信息组作为目标标签信息组。
将对同一类别信息对应的至少两个标签信息组进行合并和去重处理,可以在进行分类的同时避免待处理标签信息的重复分组,使得目标标签信息组间相互独立,避免多媒体资源的标签构建结果重复,提高了标签构建的准确性。
S220.基于预设的多个主标签信息各自对应的子标签信息和内容信息,对多媒体资源进行标签构建,得到多个标签构建结果,每个标签构建结果对应一个目标子标签,目标子标签为多个主标签信息的每个主标签信息中,与多媒体资源对应的子标签信息,主标签信息为同一类别的子标签信息对应的类别标签信息,子标签信息为每个主标签信息对应的类别下的至少一个标签信息;
作为一个可选的实施例,预设标签信息为携带有主标签信息的标签信息,根据多媒体内容,服务器可以从预设标签信息中得到与多媒体内容对应的目标子标签。在获取了多个目标子标签的情况下,服务器对多媒体资源进行标签构建时可以同时将多个目标子标签与多媒体资源进行构建,并得到每个目标子标签的标签构建结果。每个主标签信息相互独立,即每个主标签信息间不重合,因此,目标子标签属于不同的主标签信息,基于属于不同的主标签信息对应的目标子标签进行标签构建,得到的标签构建结果相互独立。
作为一个可选的实施例,请参见图6,基于预设的多个主标签信息各自对应的子标签信息和内容信息进行标签构建,得到多个标签构建结果包括:
S610.将多个主标签信息中每个主标签信息对应的每个子标签信息和内容信息进行匹配;
S620.将与内容信息匹配的子标签信息作为目标子标签;
S630.建立每个主标签信息对应的目标子标签和多媒体资源间的标签构建结果。
作为一个可选的实施例,请参见图7,将每个主标签信息对应的子标签信息和多媒体内容信息进行匹配,由于在不同的主标签信息下可以有多个子标签信息,因此可以得到多个匹配结果,从这多个匹配结果中确定一个目标子标签,例如在行业主标签信息下可以包括教育行业、游戏行业、出版行业等。多媒体内容信息为某网课软件的广告信息时,在行业主标签信息的各个子标签信息分别对应的匹配结果中,可以确定教育行业为与多媒体内容信息匹配的子标签信息,则将教育行业作为目标子标签。
在与多媒体内容匹配的多个目标子标签中,不同的目标子标签属于不同的主标签信息。将每个目标子标签和多媒体资源进行对应,得到每个目标子标签和多媒体资源间的对应关系,可以对多媒体资源进行标签构建,从而得到每个目标子标签对应的标签构建结果。由于不同的目标子标签属于不同的主标签信息,因此每个标签构建结果相互独立,不会出现重复的标签构建结果。例如,假设目标子标签a属于主标签信息A1,同时目标子标签a也属于主标签信息A2,而目标子标签a和多媒体内容信息匹配,则在进行标签构建时,会从主标签信息A1中得到目标子标签a,并从主标签信息A2中也得到目标子标签a,建立目标子标签a和多媒体资源间的对应关系时,会产生两个与目标子标签a对应的标签构建结果,导致重复构建。而在目标子标签a只属于主标签信息A1,不属于其他主标签信息的情况下,只能从主标签信息A1中得到目标子标签a,因此建立目标子标签a和多媒体资源间的对应关系时,只会得到一个与目标子标签a对应的标签构建结果。
作为一个可选的实施例,在主标签信息下的子标签信息中可以不存在与多媒体内容信息匹配的目标子标签。
通过匹配到的目标子标签进行标签构建,可以一次性得到多个标签构建结果,从而提高了标签构建的效率。
作为一个可选的实施例,该方法还包括:
基于多个标签构建结果,生成多媒体资源的标签属性信息。
作为一个可选的实施例,多媒体资源可以设置有初始属性信息,通过赋值的方式对初始属性信息增加对应的属性内容。将多个标签构建结果赋值到初始属性信息中,可以得到标签属性信息。多个标签构建结果对应一个标签属性信息。
作为一个可选的实施例,请参见图8,该方法还包括:
S810.获取目标对象对应的用户标签信息;
S820.获取待推荐多媒体资源对应的多个待推荐构建结果,多个待推荐构建结果为待推荐多媒体资源对应的多个标签构建结果;
S830.对比用户标签信息和每个待推荐构建结果对应的目标子标签;
S840.在用户标签信息与待推荐构建结果对应的目标子标签匹配的情况下,向目标对象推荐该待推荐多媒体资源。
作为一个可选的实施例,服务器在向客户端推荐多媒体资源时,获取客户端的用户对应的用户标签信息,并获取待推荐多媒体资源的多个待推荐构建结果,若待推荐多媒体资源将多个待推荐构建结果生成了标签输出信息,也可以获取待推荐多媒体资源对应的标签属性信息。对比用户标签信息和每个待推荐构建结果对应的目标子标签,在每个待推荐构建结果对应的目标子标签与用户标签信息匹配的情况下,向客户端发送待推荐多媒体资源。客户端接收待推荐多媒体资源并进行展示。
基于标签属性信息,进行多媒体资源的推荐,可以提高多媒体资源推荐的准确性。
作为一个可选的实施例,该方法可以用于对广告信息进行打标签。服务器获取广告信息,并基于内容特征提取模型,对广告信息进行内容特征提取,得到广告内容信息。在广告信息为视频的情况下,内容特征提取模型可以包括图像特征提取模型和语音特征提取模型,在广告信息为文字的情况下,内容特征提取模型可以包括文字特征提取模型。
服务器中存储有预先分类好的主标签信息和每个主标签对应的子标签信息,每个主标签信息间相互独立,即每个主标签信息对应的子标签信息各不相同。服务器将每个主标签信息对应的子标签信息和广告内容信息进行匹配,得到每个子标签和广告信息间的匹配结果。服务器根据每个子标签和广告信息间的匹配结果,可以确定目标子标签,并建立每个目标子标签和广告信息间的对应关系,得到每个目标子标签对应的标签构建结果。服务器基于多个标签构建结果。服务器基于广告信息的多个标签构建结果,向用户进行广告信息的推荐。服务器可以获取用户的用户标签信息,在用户标签信息和多个标签构建结果中的目标子标签匹配的情况下,将广告信息推送给用户。
本公开提出了一种多媒体资源的标签构建方法,该方法包括:获取多媒体资源,并对多媒体资源进行内容识别,得到多媒体内容信息。基于多个主标签信息各自对应的子标签信息对多媒体内容信息进行标签构建,得到多个标签构建结果。多个主标签信息间相互独立。根据多媒体资源的标签属性信息,进行多媒体资源的推荐。该方法可以一次性得到多个标签构建结果,从而提高标签构建的效率。该方法从每个主标签信息中确定一个匹配的子标签信息作为目标子标签信息,对多媒体资源进行标签构建,得到的多个标签构建结果相互独立,可以避免重复构建,提高标签构建的准确性。
图9是根据一示例性实施例示出的一种多媒体资源的标签构建装置框图。参照图9,该装置包括:
多媒体内容识别模块910,被配置为执行获取待构建标签的多媒体资源的内容信息;
标签构建模块920,被配置为执行基于预设的多个主标签信息各自对应的子标签信息和内容信息,对多媒体资源进行标签构建,得到多个标签构建结果,每个标签构建结果对应一个目标子标签,目标子标签为多个主标签信息的每个主标签信息中,与多媒体资源对应的子标签信息,主标签信息为同一类别的子标签信息对应的类别标签信息,子标签信息为每个主标签信息对应的类别下的至少一个标签信息。
作为一个可选的实施例,标签构建模块920包括:
子标签匹配单元,被配置为执行将多个主标签信息中每个主标签信息对应的每个子标签信息和内容信息进行匹配;
目标子标签确定单元,被配置为执行将与内容信息匹配的子标签信息作为目标子标签;
标签构建结果获取单元,被配置为执行建立每个主标签信息对应的目标子标签和多媒体资源间的标签构建结果。
作为一个可选的实施例,装置还包括:
待处理标签信息获取模块,被配置为执行获取多个待处理标签信息,待处理标签信息为基于多种标签来源得到的未分类的标签信息;
相似度匹配结果获取模块,被配置为执行对多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果;
第一分类模块,被配置为执行根据多个相似度匹配结果,对待处理标签信息进行分类,得到多个目标标签信息组,每个目标标签信息组对应一个类别信息;
主标签信息确定模块,被配置为执行将每个目标标签信息组对应的类别信息作为主标签信息;
子标签信息确定模块,被配置为执行将每个目标标签信息组中的待处理标签信息作为主标签信息对应的子标签信息。
作为一个可选的实施例,装置还包括:
第二分类模块,被配置为执行根据多个相似度匹配结果,对待处理标签信息进行分类,得到多个第一标签信息组,多个第一标签信息组包括同一类别信息对应的至少两个标签信息组,和互不相同的类别信息分别对应的标签信息组;
同类别合并模块,被配置为执行对同一类别信息对应的至少两个标签信息组进行合并,得到至少一个第二标签信息组;
去重模块,被配置为执行对每个第二标签信息组中的待处理标签信息进行去重处理;
目标标签信息组确定模块,被配置为执行将互不相同的类别信息分别对应的标签信息组和去重处理后的第二标签信息组作为目标标签信息组。
作为一个可选的实施例,装置还包括:
标签属性信息生成模块,被配置为执行基于多个标签构建结果,生成多媒体资源的标签属性信息。
作为一个可选的实施例,多媒体内容识别模块包括:
特征提取单元,被配置为执行基于预设的内容特征提取模型,对多媒体资源进行内容特征提取,得到内容信息。
作为一个可选的实施例,装置还包括:
用户标签信息获取模块,被配置为执行获取目标对象对应的用户标签信息;
标签属性信息获取模块,被配置为执行获取待推荐多媒体资源对应的多个待推荐构建结果,多个待推荐构建结果为待推荐多媒体资源对应的多个标签构建结果;
对比模块,被配置为执行对比用户标签信息和每个待推荐构建结果对应的目标子标签;
推荐模块,被配置为执行在用户标签信息与待推荐构建结果对应的目标子标签匹配的情况下,向目标对象推荐待推荐多媒体资源。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图10是根据一示例性实施例示出的一种用于多媒体资源的标签构建的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体资源的标签构建方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器1004,上述指令可由电子设备1000的处理器1020执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述所述的多媒体资源的标签构建方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种多媒体资源的标签构建方法,其特征在于,所述方法包括:
获取待构建标签的多媒体资源的内容信息;
基于预设的多个主标签信息各自对应的子标签信息和所述内容信息,对所述多媒体资源进行标签构建,得到多个标签构建结果,每个标签构建结果对应一个目标子标签,所述目标子标签为所述多个主标签信息的每个主标签信息中,与所述多媒体资源对应的子标签信息,所述主标签信息为同一类别的子标签信息对应的类别标签信息,所述子标签信息为每个主标签信息对应的类别下的至少一个标签信息。
2.根据权利要求1所述的多媒体资源的标签构建方法,其特征在于,所述基于预设的多个主标签信息各自对应的子标签信息和所述内容信息,对所述多媒体资源进行标签构建,得到多个标签构建结果包括:
将所述多个主标签信息中每个主标签信息对应的每个子标签信息和所述内容信息进行匹配;
将与所述内容信息匹配的子标签信息作为所述目标子标签;
建立每个主标签信息对应的目标子标签和所述多媒体资源间的标签构建结果。
3.根据权利要求1所述的多媒体资源的标签构建方法,其特征在于,所述方法还包括:
获取多个待处理标签信息,所述待处理标签信息为基于多种标签来源得到的未分类的标签信息;
对所述多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果;
根据所述多个相似度匹配结果,对所述待处理标签信息进行分类,得到多个目标标签信息组,每个目标标签信息组对应一个类别信息;
将所述每个目标标签信息组对应的类别信息作为所述主标签信息;
将所述每个目标标签信息组中的待处理标签信息作为所述主标签信息对应的子标签信息。
4.根据权利要求3所述的多媒体资源的标签构建方法,其特征在于,所述对所述多个待处理标签信息中的任两个待处理标签信息进行相似度匹配,得到多个相似度匹配结果之后,所述方法还包括:
根据多个相似度匹配结果,对所述待处理标签信息进行分类,得到多个第一标签信息组,所述多个第一标签信息组包括同一类别信息对应的至少两个标签信息组,和互不相同的类别信息分别对应的标签信息组;
对所述同一类别信息对应的至少两个标签信息组进行合并,得到至少一个第二标签信息组;
对每个第二标签信息组中的待处理标签信息进行去重处理;
将所述互不相同的类别信息分别对应的标签信息组和去重处理后的第二标签信息组作为所述目标标签信息组。
5.根据权利要求1所述的多媒体资源的标签构建方法,其特征在于,所述方法还包括:
基于所述多个标签构建结果,生成所述多媒体资源的标签属性信息。
6.根据权利要求1所述的多媒体资源的标签构建方法,其特征在于,所述获取待构建标签的多媒体资源的内容信息包括:
基于预设的内容特征提取模型,对所述多媒体资源进行内容特征提取,得到所述内容信息。
7.根据权利要求1所述的多媒体资源的标签构建方法,其特征在于,所述方法还包括:
获取目标对象对应的用户标签信息;
获取待推荐多媒体资源对应的多个待推荐构建结果,所述多个待推荐构建结果为所述待推荐多媒体资源对应的多个标签构建结果;
对比所述用户标签信息和每个待推荐构建结果对应的目标子标签;
在所述用户标签信息与所述待推荐构建结果对应的目标子标签匹配的情况下,向所述目标对象推荐所述待推荐多媒体资源。
8.一种多媒体资源的标签构建装置,其特征在于,所述装置包括:
多媒体内容识别模块,被配置为执行获取待构建标签的多媒体资源的内容信息;
标签构建模块,被配置为执行基于预设的多个主标签信息各自对应的子标签信息和所述内容信息,对所述多媒体资源进行标签构建,得到多个标签构建结果,每个标签构建结果对应一个目标子标签,所述目标子标签为所述多个主标签信息的每个主标签信息中,与所述多媒体资源对应的子标签信息,所述主标签信息为同一类别的子标签信息对应的类别标签信息,所述子标签信息为每个主标签信息对应的类别下的至少一个标签信息。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的多媒体资源的标签构建方法。
10.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的多媒体资源的标签构建方法。
CN202111188872.1A 2021-10-12 2021-10-12 多媒体资源的标签构建方法、装置、电子设备和存储介质 Pending CN113901244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111188872.1A CN113901244A (zh) 2021-10-12 2021-10-12 多媒体资源的标签构建方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111188872.1A CN113901244A (zh) 2021-10-12 2021-10-12 多媒体资源的标签构建方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113901244A true CN113901244A (zh) 2022-01-07

Family

ID=79191674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111188872.1A Pending CN113901244A (zh) 2021-10-12 2021-10-12 多媒体资源的标签构建方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113901244A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398559A (zh) * 2022-03-24 2022-04-26 北京达佳互联信息技术有限公司 内容项推荐方法、装置、电子设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818120A (zh) * 2021-01-26 2021-05-18 北京智通东方软件科技有限公司 习题标注方法、装置、存储介质及电子设备
CN113204660A (zh) * 2021-03-31 2021-08-03 北京达佳互联信息技术有限公司 多媒体数据处理方法、标签识别方法、装置及电子设备
CN113220872A (zh) * 2021-02-08 2021-08-06 民生科技有限责任公司 一种文档标签生成方法、系统及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818120A (zh) * 2021-01-26 2021-05-18 北京智通东方软件科技有限公司 习题标注方法、装置、存储介质及电子设备
CN113220872A (zh) * 2021-02-08 2021-08-06 民生科技有限责任公司 一种文档标签生成方法、系统及可读存储介质
CN113204660A (zh) * 2021-03-31 2021-08-03 北京达佳互联信息技术有限公司 多媒体数据处理方法、标签识别方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398559A (zh) * 2022-03-24 2022-04-26 北京达佳互联信息技术有限公司 内容项推荐方法、装置、电子设备以及存储介质

Similar Documents

Publication Publication Date Title
US11551424B2 (en) Interaction analysis systems and methods
US20220405607A1 (en) Method for obtaining user portrait and related apparatus
US10650274B2 (en) Image clustering method, image clustering system, and image clustering server
CN110740389B (zh) 视频定位方法、装置、计算机可读介质及电子设备
CN106874314B (zh) 信息推荐的方法和装置
CN112818224B (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN113379449B (zh) 多媒体资源召回方法、装置、电子设备以及存储介质
CN110324676A (zh) 数据处理方法、媒体内容投放方法、装置及存储介质
CN104185041A (zh) 视频交互广告的自动生成方法和系统
US20130191323A1 (en) System and method for identifying the context of multimedia content elements displayed in a web-page
CN114390368B (zh) 直播视频数据的处理方法及装置、设备、可读介质
CN111897950A (zh) 用于生成信息的方法和装置
JP7051190B2 (ja) コンテンツ埋込方法、装置、電子デバイス、記憶媒体、及びプログラム
CN113570416B (zh) 投放内容确定方法、装置、电子设备及存储介质
CN113901244A (zh) 多媒体资源的标签构建方法、装置、电子设备和存储介质
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置
CN115239442A (zh) 一种互联网金融产品推广的方法及系统和存储介质
US9749438B1 (en) Providing a content item for presentation with multiple applications
CN113869099A (zh) 一种图像处理方法、装置、电子设备和存储介质
CN112487164A (zh) 一种人工智能交互方法
CN112884538A (zh) 物品推荐的方法和装置
US10586127B1 (en) Extracting audiovisual features from content elements on online documents
CN113724022B (zh) 关键词确定方法、装置、计算机设备及介质
CN113761281B (zh) 虚拟资源处理方法、装置、介质及电子设备
US11238490B2 (en) Determining performance metrics for delivery of electronic media content items by online publishers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination