发明内容
本公开实施例至少提供一种多媒体内容发布的方案,能够为用户自动提供与多媒体内容相关度较高的话题,节省了用户思考编辑话题的时间,提高了选择话题的准确性。
主要包括以下几个方面:
第一方面,本公开实施例提供了一种多媒体内容发布的方法,所述方法包括:
确定待发布的多媒体内容;
获取与所述多媒体内容匹配的多个候选话题;所述候选话题为话题集中包括的各个话题中,与所述多媒体内容的相关度符合预设条件的话题;
确定所述多个候选话题中被选中的目标话题;
响应多媒体内容发布请求,将包含所述目标话题的多媒体内容发布信息发送至服务端。
在一种可能的实施方式中,获取与所述多媒体内容匹配的多个候选话题之后,确定所述多个候选话题中被选中的目标话题之前,还包括:
在检测到输入到话题输入框中的目标标识符后,将获取的与所述多媒体内容匹配的多个候选话题展示在与所述话题输入框对应的话题选择框内。
在一种可能的实施方式中,确定所述多个候选话题中被选中的目标话题,包括:
响应在所述话题选择框的选取操作,将从所述多个候选话题中选取的目标话题展示在与所述话题选择框对应的所述话题输入框内。
在一种可能的实施方式中,所述方法还包括:
响应针对纵排展示方式的第一触发指令,纵向滚动展示获取的与所述多媒体内容匹配的多个候选话题;或者,
响应针对横排展示方式的第二触发指令,横向滚动展示获取的与所述多媒体内容匹配的多个候选话题。
第二方面,本公开实施例还提供了一种多媒体内容发布的方法,所述方法包括:
获取待发布的多媒体内容;
从预存的话题集中,选取与所述多媒体内容匹配的多个候选话题,并将选取的所述多个候选话题返回给用户端;
接收包含目标话题的多媒体内容发布信息;所述目标话题包含在所述多个候选话题中;
基于所述多媒体内容发布信息,发布所述多媒体内容。
在一种可能的实施方式中,从预存的话题集中,选取与所述多媒体内容匹配的多个候选话题,包括:
利用训练好的相关度模型,确定所述多媒体内容与存储的话题集中的每个话题之间的相关度;
基于所述相关度,从所述话题集中选取多个候选话题。
在一种可能的实施方式中,按照如下步骤训练所述相关度模型:
获取各个历史多媒体内容以及与每个历史多媒体内容对应的用户编辑话题;
针对每个历史多媒体内容,将该历史多媒体内容所对应的用户编辑话题作为该历史多媒体内容对应的正类话题,并将除该历史多媒体内容之外的其它历史多媒体内容对应的用户编辑话题作为该历史多媒体内容对应的负类话题;
将每个历史多媒体内容、该历史多媒体内容对应的正类话题、以及该历史多媒体内容对应的负类话题作为一个训练数据组,基于多个训练数据组对所述待训练的相关度模型进行训练,得到所述相关度模型的模型参数。
在一种可能的实施方式中,基于多个训练数据组对所述待训练的相关度模型进行训练,得到所述相关度模型的模型参数,包括:
针对多个训练数据组中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的各个负类话题之间的第二相关度;
若所述第一相关度与各个第二相关度中的任一第二相关度之间的差值小于预设阈值,则调整所述相关度模型的模型参数,并再次训练所述待训练的相关度模型,直至所述第一相关度与各个第二相关度之间的差值均大于或等于预设阈值,停止训练,得到训练好的所述相关度模型的模型参数。
在一种可能的实施方式中,按照如下步骤确定每个历史多媒体内容对应的负类话题:
针对每个历史多媒体内容,将除该历史多媒体内容之外、与该历史多媒体内容的正类话题之间的话题相似度小于预设阈值的其它历史多媒体内容对应的正类话题作为该历史多媒体内容对应的负类话题。
在一种可能的实施方式中,所述话题相似度包括字词重叠度,按照如下步骤确定所述字词重叠度:
针对待计算字词重叠度的两个话题,将所述两个话题中的每个所述话题进行字词切分处理,得到与每个话题对应的多个话题字词;
将所述两个话题分别对应的多个话题字词进行交集处理,得到处理后的第一话题字词组,以及将所述两个话题分别对应的多个话题字词进行并集处理,得到处理后的第二话题字词组;
确定所述第一话题字词组在所述第二话题字词组中的占比,将确定的所述占比作为所述两个话题之间的字词重叠度。
在一种可能的实施方式中,基于多个训练数据组对所述待训练的相关度模型进行训练,得到所述相关度模型的模型参数,包括:
基于多个训练数据组对所述待训练的相关度模型进行至少一轮训练,每轮训练按照如下步骤执行:
在进行本轮待训练的相关度模型的训练之前,将多个训练数据组随机划分为多个训练数据集;每个训练数据集包括多个训练数据组;
依次遍历多个训练数据集中的每个训练数据集,基于遍历到的训练数据集对所述待训练的相关度模型进行本轮的模型训练,直至遍历完所有的训练数据集,得到本轮训练好的所述相关度模型的模型参数。
在一种可能的实施方式中,基于遍历到的训练数据集对所述待训练的相关度模型进行本轮的模型训练,包括:
针对遍历到的训练数据集中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容的各个负类话题之间的第二相关度;
从各个第二相关度中选取预设采样数量个第二目标相关度;
基于所述第一相关度、以及选取的所述预设采样数量个第二目标相关度调整本轮待训练的所述相关度模型的模型参数。
在一种可能的实施方式中,从各个第二相关度中选取预设采样数量个第二目标相关度,包括:
按照待随机选取的第二目标相关度在预设采样数量个第二目标相关度中的第一预设占比,从各个第二相关度中随机选取与所述第一预设占比对应的第一数量个第二相关度;以及,
按照由大到小的顺序对各个第二相关度进行排名,并按照待顺序选取的第二目标相关度在预设采样数量个第二目标相关度中的第二预设占比,从排名后的所述各个第二相关度中选取出与所述第二预设占比对应的第二数量个第二相关度;所述第二预设占比与所述第一预设占比的和值为1;
基于选取出的所述第一数量个第二相关度以及所述第二数量个第二相关度,确定所述预设采样数量个第二目标相关度。
第三方面,本公开实施例还提供了一种多媒体内容发布的装置,所述装置包括:
内容确定模块,用于确定待发布的多媒体内容;
话题获取模块,用于获取与所述多媒体内容匹配的多个候选话题;所述候选话题为话题集中包括的各个话题中,与所述多媒体内容的相关度符合预设条件的话题;
话题确定模块,用于确定所述多个候选话题中被选中的目标话题;
信息发送模块,用于响应多媒体内容发布请求,将包含所述目标话题的多媒体内容发布信息发送至服务端。
第四方面,本公开实施例还提供了一种多媒体内容发布的装置,所述装置包括:
内容获取模块,用于获取待发布的多媒体内容;
话题选取模块,用于从预存的话题集中,选取与所述多媒体内容匹配的多个候选话题,并将选取的所述多个候选话题返回给用户端;
信息接收模块,用于接收包含目标话题的多媒体内容发布信息;所述目标话题属于所述候选话题;
内容发布模块,用于基于所述多媒体内容发布信息,发布所述多媒体内容。
第五方面,本公开实施例还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面及其各种实施方式、第二方面及其各种实施方式任一项所述的多媒体内容发布的方法的步骤。
第六方面,本公开实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被电子设备运行时,所述电子设备执行如第一方面及其各种实施方式、第二方面及其各种实施方式任一项所述的多媒体内容发布的方法的步骤。
采用上述多媒体内容发布的方案,其在确定待发布的多媒体内容的情况下,可以获取与多媒体内容匹配的多个候选话题,而后,在确定多个候选话题中被选中的目标话题的情况下,即可以响应多媒体内容发布请求,将包含目标话题的多媒体内容发布信息发送至服务端。上述多媒体内容发布的方案能够为用户自动提供与多媒体内容相关度较高的话题,节省了用户思考编辑话题的时间,提高了选择话题的准确性。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
经研究发现,在用户上传自己的多媒体内容时,相关技术中主要依赖于人工方式为上传的多媒体内容编辑话题,费时费力。
基于上述研究,本公开提供了至少一种媒体内容发布的方案,能够为用户自动提供与多媒体内容相关度较高的话题,节省了用户思考编辑话题的时间,提高了选择话题的准确性。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种多媒体内容发布的方法进行详细介绍,本公开实施例所提供的多媒体内容发布的方法的执行主体一般为具有一定计算能力的电子设备,该电子设备例如包括:终端设备或服务端或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该多媒体内容发布的方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为用户端为例对本公开实施例提供的多媒体内容发布的方法加以说明。
实施例一
参见图1所示,为本公开实施例提供的多媒体内容发布的方法的流程图,方法包括步骤S101~S104,其中:
S101、确定待发布的多媒体内容;
S102、获取与多媒体内容匹配的多个候选话题;候选话题为话题集中包括的各个话题中,与多媒体内容的相关度符合预设条件的话题;
S103、确定多个候选话题中被选中的目标话题;
S104、响应多媒体内容发布请求,将包含目标话题的多媒体内容发布信息发送至服务端。
这里,为了便于理解本公开实施例提供的多媒体内容发布的方法,首先对该方法的应用场景进行详细说明。上述多媒体内容发布的方法主要适用于具有多媒体发布需求的应用场景中,通常情况下多媒体内容的有效发布可以为后续的多媒体搜索、浏览等做准备。考虑到相关技术中为待发布的多媒体内容所确定的话题主要依赖于人工编辑,在进行人工话题编辑时,需要用户对多媒体内容进行归纳总结,然而,并不是所有的用户都具备这样的归纳总结能力,因此,用户编辑的话题要么是与待发布的多媒体内容相关度不高,要么直接将话题栏空置,这样,不便于其他用户对发布出的多媒体内容进行理解,更不便于后续对有关多媒体搜索、浏览等应用的实现。
正是为了解决上述问题,本公开实施例才提供了一种多媒体内容发布的方法,能够为用户自动提供多个候选话题,节省了用户思考编辑话题的时间,另外,上述多媒体内容发布的方法为用户提供的候选话题是与待发布的多媒体内容相关度比较高的话题,这样,在用户从候选话题中选取出目标话题之后,即可以发布包含目标话题的多媒体内容发布信息给服务端。
由于候选话题是基于与多媒体内容之间的相关度确定的,因而一定程度上可以为多媒体内容提供更为准确的话题备选,又考虑到目标话题是基于用户的自主选择结果确定的,因而所确定的话题可以是与用户意图强相关的,这一定程度上可以更为准确的表达多媒体内容,以便用户可以更准确的理解多媒体内容,提升发布平台的服务质量。
其中,本公开实施例中的待发布的多媒体内容可以包括用户上传的多媒体内容,这里的多媒体内容可以是图片,还可以视频,还可以是其它多媒体内容形式,考虑到视频搜索的广泛应用,以下多以视频为例进行具体说明。
本公开实施例中,为了便于确定待发布的多媒体内容,可以在用户端的发布页面上设置相应的上传按钮,例如,可以在用户进入发布页面之后,响应针对上传按钮的触发操作,获取用户上传的多媒体内容。
在确定待发布的多媒体内容的情况下,本公开实施例可以获取与多媒体内容匹配的多个候选话题,从而便于用户从中选取出与用户意图直接相关的目标话题。
本公开实施例中的候选话题可以是基于相关度确定的,因为一定程度上可以为多媒体内容提供更为准确的话题备选,又考虑到目标话题是基于用户的自主选择结果确定的,因而所确定的话题可以是与用户意图强相关的,这一定程度上可以更为准确的表达多媒体内容,以便其他用户可以更准确的理解多媒体内容,提升发布平台的服务质量。
在具体应用中,上述候选话题可以是从各种搜索平台获取的各个历史多媒体内容对应的用户编辑话题中筛选出的与待发布的多媒体内容相关度比较高的话题,这里的搜索平台可以是百科搜索平台,还可以是多媒体搜索平台,还可以是其它搜索平台,这里的历史多媒体内容可以是距离当前发布时间最近的一段时间内从上述各个搜索平台的搜索记录中获取的。
需要说明的是,在筛选候选话题的过程中,可以是基于有关相关度的预设条件进行的筛选,这里,可以是从话题集中筛选出的排名在预设名次的话题。在具体应用中,可以将待发布的多媒体内容输入至训练好的相关度模型中实现的。
本公开实施例中,为了便于从候选话题中选取符合用户意图的目标话题,可以先在用户端展示上述候选话题。为了提升用户与发布平台的交互体验,这里可以基于用户端发布页面上设置的目标标识符添加按钮的触发操作,再进行各个候选话题的展示。
其中,在具体应用中,上述各个候选话题的展示可以采用纵排展示方式,也可以采用横排展示方式。这样,针对采用纵排展示方式展示的多个候选话题而言,可以通过触摸用户端屏幕的上下触发指令,纵向滚动展示上述多个候选话题;同理,针对采用横排展示方式展示的多个候选话题而言,可以通过触发用户端屏幕的左右触发指令,横向滚动展示上述各个候选话题。
本公开实施例对于具体采用哪种展示方式,可以结合用户端当前呈现的是横屏画面还是竖屏画面来选取,例如,在用户端呈现的是横屏画面的前提下,由于用户端横向尺寸较大,这时,可以采用横排展示方式,在用户端呈现的是竖屏画面的前提下,由于用户端纵向尺寸较大,这时,可以采用纵排展示方式。
本公开实施例中,在确定各个候选话题之后,可以基于用户的选取操作选取与用户意图相关的目标话题。为了便于用户的选取操作,可以将候选话题展示与目标话题展示划分至不同的展示框内。在具体应用中,可以在发布页面确定检测到输入到话题输入框中的目标标识符后,将获取的与多媒体内容匹配的多个候选话题展示在与话题输入框对应的话题选择框内。这时,响应在话题选择框的选取操作,可以从上述话题选择框中展示的多个候选话题中选取出目标话题,并可以将选取出的目标话题展示在话题输入框内。
在确定出用户所选取的目标话题之后,即可以在响应媒体内容发布请求的前提下,将包含目标话题的多媒体内容发布信息发送给服务端。
其中,上述多媒体内容发布信息可以包括用户上传的多媒体内容,还可以包括为该多媒体内容选取的目标话题,除此之外,还可以包括发布时间、发布位置等信息。
需要说明的是,有关发布位置等涉及用户隐私权限的信息,可以是在获得用户授权之后采集的。
针对发布后的各个多媒体内容,可以在用户向服务端发起搜索请求之后,基于该多媒体内容所包含的目标话题向用户推送与搜索请求对应的多媒体内容,由于这里的目标话题所标识的是相关度较高的多媒体内容,因而一定程度上可以提升多媒体内容的浏览量。
其中,本公开实施例提供的多媒体内容发布的方法可以在用户端的发布页面上设置相应的发布按钮,例如,可以在用户选中目标标题之后,响应针对发布按钮的触发操作,将包含目标标题的多媒体内容发布信息发布出去。
本公开实施例中的多媒体内容发布信息除了可以包括有关多媒体内容,还可以包括其它发布信息,例如,可以是在用户端的发布页面上进行多媒体内容发布时所采用的封面设置信息,还可以是添加位置、多媒体内容来源等标签添加信息,还可以是与发布权限和发布时间等相关的信息,本公开实施例对此不做具体的限制。
接下来可以下面结合图2(a)、图2(b)、图2(c)以及图2(d)所示的用户端界面呈现效果图对本公开实施例提供的上述多媒体内容发布的方法进行示例说明。
如图2(a)所示,用户端所呈现的发布页面上包括有上传按钮(如“+”所示)。用户触发上传按钮之后,可以上传猫咪视频。
这样,服务端即可以基于上传的猫咪视频,确定与待发布的猫咪视频匹配的多个候选话题,如捡到猫、宠物猫、寻猫启事、吸猫、爱猫爱生活。这时,用户端可以基于呈现的发布页面上包括的目标标识符(如“#”所示)添加按钮的触发操作从服务端获取上述候选话题并可以将获取的候选话题对应显示在话题选择框内,多个候选话题的纵排展示方式如图2(b)所示,本公开实施例可以在目标标识符被触发之后,多个候选话题以下拉方式显示在目标标识符的下方,此外,多个候选话题的横排展示方式如图2(c)所示,在目标标识符被触发之后,多个候选话题以横向展开方式显示在目标标识符的下方。
针对用户端当前发布页面显示的各个候选话题,可以执行选取操作,以选取与用户意图最接近的目标话题,即捡到猫、爱猫爱生活,如图2(d)所示,可以显示在话题输入框。
如图2(d)所示,在发布页面上设置有发布按钮,在该发布按钮被触发之后,即可以将上述包含有捡到猫、爱猫爱生活的多媒体内容发布信息发布给服务端。
除此之外,如图2(a)、图2(b)、图2(c)以及图2(d)所示,还可以设置其它多媒体内容发布信息,如地理标签添加信息(如AA城市、BB国际大厦所示)、封面设置信息、发布设置(如谁可以看)等相关信息,在此不再赘述。
接下来从服务端侧,对本公开实施例提供的多媒体内容发布的方法作进一步说明。
实施例二
参见图3所示,为本公开实施例二提供的多媒体内容发布的方法的流程图,方法包括步骤S301~S304,其中:
S301、获取待发布的多媒体内容;
S302、从预存的话题集中,选取与多媒体内容匹配的多个候选话题,并将选取的多个候选话题返回给用户端;
S303、接收包含目标话题的多媒体内容发布信息;目标话题包含在多个候选话题中;
S304、基于多媒体内容发布信息,发布多媒体内容。
上述步骤中,有关多媒体内容、多媒体内容发布信息的相关描述内容参照本公开实施例一的相关描述,在此不再赘述。
为了确定与获取的待发布的多媒体内容匹配的候选话题,本公开实施例可以依赖于存储的话题集与多媒体内容之间的相关度,也即,可以从存储的话题集中选取与多媒体内容相关度比较高的话题作为该多媒体内容的候选话题。
其中,上述话题集可以是基于用户历史搜索数据中的历史多媒体内容对应的用户编辑话题而生成的,有关用户编辑话题参见上述实施例一的相关描述,在此不再赘述。
在为多媒体内容选取了匹配的候选话题之后,即可以将选取的一个或多个候选话题推送给用户端,以便于用户端从中选取出符合自身发布意图的目标话题,并可以发布包含该目标话题的多媒体内容发布信息到服务端。其中,有关目标话题的选取以及多媒体内容发布信息的发布具体参见上述实施例一的相关描述内容,在此不再赘述。
服务端在接收到用户端发送的多媒体内容发布信息之后,即可以基于多媒体内容发布信息,发布多媒体内容。这样,一旦对应的多媒体内容得以发布,由于多媒体内容发布信息中携带符合多媒体内容相关度的目标话题可以作为搜索依据,相对一般发布的多媒体内容而言,其后续被实时搜索到的可能性将大大提升,从而可以提升多媒体内容的曝光度。
本公开实施例中存储的话题集是由若干个话题构成的,这样,在从用户端获取到待发布的多媒体内容之后,即可以确定该多媒体内容与话题集中的各个话题之间的相关度,基于相关度从话题集中选取一个或多个候选话题。如图4所示,可以按照如下步骤从预存的话题集中选取候选话题:
S401、利用训练好的相关度模型,确定多媒体内容与存储的话题集中的每个话题之间的相关度;
S402、基于相关度,从话题集中选取多个候选话题。
这里,本公开实施例中的相关度模型可以是有关话题多分类的模型,在模型训练的过程中,旨在从各个话题中选取出与输入的多媒体内容相关性更高的话题。在相关度模型训练完成之后,即可以确定多媒体内容与存储的话题集中每个话题之间的相关度,这里可以从各个相关度的排名结果中选取相关度在预设名次的话题作为候选话题,例如,可以选取排名在前10名的话题作为候选话题。
本公开实施例中训练相关度模型的训练数据可以是基于本公开提供的多媒体内容发布的方法的具体应用场景所确定的,也即,基于场景应用可以获取到相应的训练数据,进而进行相关度模型的训练,具体包括如下步骤:
步骤一、获取各个历史多媒体内容以及与每个历史多媒体内容对应的用户编辑话题;
步骤二、针对每个历史多媒体内容,将该历史多媒体内容所对应的用户编辑话题作为该历史多媒体内容对应的正类话题,并将除该历史多媒体内容之外的其它历史多媒体内容对应的用户编辑话题作为该历史多媒体内容对应的负类话题;
步骤三、将每个历史多媒体内容、该历史多媒体内容对应的正类话题、以及该历史多媒体内容对应的负类话题作为一个训练数据组,基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数。
这里,首先可以从发布平台获取历史发布的历史多媒体内容及其对应的用户编辑话题,这里的历史多媒体内容与其用户编辑话题相对应。例如,针对“BB新歌”相关的视频,其对应用户编辑话题为“BB新歌”。
上述相关度模型作为一个多分类模型,针对每个历史多媒体内容,可以确定该多媒体内容对应的正类话题以及负类话题,该历史多媒体内容与正类话题的相关度更高,与负类话题的相关度更低。一个历史多媒体内容的正类话题即可以是得到与该历史多媒体内容对应的用户编辑话题,负类话题则可以是其它历史多媒体内容对应的用户编辑话题。
本公开实施例中,将每个历史多媒体内容、该历史多媒体内容的正类话题以及该历史多媒体内容的负类话题作为一个训练数据组即可进行相关度模型的训练,从而得到相关度模型的模型参数。这样,在获取到待发布的多媒体内容之后,即可以基于这一模型参数确定该多媒体内容与话题集中的每个话题之间的相关度。
需要说明的是,在实际进行相关度模型的训练之前,通常需要先进行特征处理,这里,可以分别从多媒体内容中提取出多媒体特征向量以及从话题集中的每个话题中提取出话题特征向量,而后基于多媒体特征向量与话题特征向量之间的向量相关度来确定多媒体内容与话题之间的相关度。
其中,上述提取多媒体特征向量可以是直接从对应的多媒体内容中提取的与多媒体内容相关的特征,如,一个视频的视频场景信息、视频时长信息等特征,还可以是基于预先训练好的多媒体特征提取模型提取得到的。
其中,在提取的多媒体特征向量是有关多媒体内容的特征向量的情况下,这里的多媒体特征提取模型可以是卷积神经网络(Convolutional Neural Networks,CNN)训练得到的,该网络训练的可以是输入的多媒体内容与其各种维度属性之间的关联关系,例如,针对一个视频,可以训练得到256维的多媒体特征向量。
另外,上述话题特征向量可以是针对话题进行编码得到的,这里可以是采用one-hot编码(又称独热编码)得到,还可以采用Word2vec(一种用来产生词向量的词向量表示模型)训练得到,本公开实施例对此不做具体的限制,例如,针对话题集中的每个话题可以提取出256维的话题签特征向量。
本公开实施例在按照上述方法提取出多媒体特征向量以及话题特征向量的情况下,可以基于相关度计算进行相关度模型的训练,也即,可以确定相关度模型的模型参数,具体可以通过如下步骤来实现:
步骤一、针对多个训练数据组中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的各个负类话题之间的第二相关度;
步骤二、若第一相关度与各个第二相关度中的任一第二相关度之间的差值小于预设阈值,则调整相关度模型的模型参数,并再次训练待训练的相关度模型,直至第一相关度与各个第二相关度之间的差值均大于或等于预设阈值,停止训练,得到训练好的相关度模型的模型参数。
这里,考虑到传统多分类模型所采用的损失函数是优化模型使得当前训练样本所属类的得分尽可能大,即极大似然估计方法,该方法针对分类任务所采用的损失函数对不同类之间做了隐式的区分,可以保证不同类之间的可分性,这在传统的分类任务上表现良好。
然而,考虑到本公开实施例所提供的多媒体内容发布的方法在适用到诸如自媒体社交应用等场景的情况下,其产生的话题推荐/分类类别数量巨大,可达万级别。若仍采用传统多分类模式进行处理,由于分类类别数量巨大,上述传统模式虽然可以保证不同类之间的可分性,但无法保证不同类之间有足够的区分度,也没有保证同类之间尽可能紧凑,从而导致无法有效对数量巨大的分类类别进行区别,准确率降低。
正是为了解决这一问题,本公开实施例才提供了一种基于相关度差值确定损失函数以实现模型训练的方案。在训练相关度模型的过程中,可以基于确定的历史多媒体内容与该历史多媒体内容对应的正类话题之间的第一相关度、以及该历史多媒体内容与该历史多媒体内容对应的各个负类话题之间的第二相关度之间的差值来确定损失函数值,若该损失函数值小于预设阈值,则确定需要反向调整相关度模型的模型参数,在调整有关模型参数之后,即可以进行下一次的模型训练,直至在上述两个相关度之间的差值足够大,即大于预设阈值的情况下,停止训练。
可知的是,采用上述模型训练的方法,显式地保证了分类的区分度,即模型能够足够置信地判断出一个历史多媒体内容的正类话题和负类话题,这主要是考虑到只有在足够置信的前提下,模型的损失才更小。这样,学习到的模型参数便能够保证不同类之间拉的足够开,同类之间能更紧凑,从而确保了模型的准确度。
考虑到在进行模型训练的过程中,针对一个训练数据组而言,很容易确定该训练数据组中有关历史多媒体内容的正类话题,那么,为了计算损失函数,需要为此历史多媒体内容找到负类话题及对应的负类得分。而对于一个庞大的训练数据集而言,如果针对一个历史多媒体内容,在每次训练的时候都穷举所有负类,以使得该历史多媒体内容的正类得分均大于所有的(负类的得分+预设阈值),将导致训练速度过慢。
正是为了解决这一问题,本公开实施例才提供了一种基于训练数据组划分近似模拟全局穷举负类的训练方案。这里,可以针对待训练的相关度模型进行多轮训练,在每轮训练之前,均可以将多个训练数据组随机划分为多个训练数据集,这样,依次遍历多个训练数据集中的每个训练数据集,基于遍历到的训练数据集对待训练的相关度模型进行本轮的模型训练,直至遍历完所有的训练数据集,得到本轮训练好的相关度模型的模型参数。
在具体应用中,由于每个训练数据集是由对应的多个训练数据组构成的,因此,针对每个训练数据集进行本轮模型训练的过程中,可以是按照上述相关度差值确定方式进行损失函数值的确定,进而实现本轮的模型训练,具体的训练过程参照上述描述,在此不再赘述。
可知的是,本公开实施例针对每轮训练所对应的多个训练数据集中的每个训练数据集采用的是局部负类采样技巧,也即,针对每个训练数据集而言,一个历史多媒体内容所对应的负类是全局分类中的一部分负类,从而有效避免了全局负类枚举的麻烦,同时,由于每轮模型训练之前,均会对训练数据组进行随机打散,从而确保了针对一个历史多媒体内容在多轮训练过程中所对应负类话题的多样化,这样,随着训练的不断进行,可以近似达到全局枚举的效果。
本公开实施例中,具体可以按照下列步骤实现每轮的模型训练:
步骤一、针对遍历到的训练数据集中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容的各个负类话题之间的第二相关度;
步骤二、从各个第二相关度中选取预设采样数量个第二目标相关度;
步骤三、基于第一相关度、以及选取的预设采样数量个第二目标相关度调整本轮待训练的相关度模型的模型参数。
这里,为了进一步加速模型的训练,针对每轮模型训练而言,可以采样K(对应预设采样数量)个负类。针对一个训练数据集而言,对应的第二相关度的个数等于该训练数据集所包括训练数据组的个数B,在K<<B的情况下,模型计算损失函数值的速度会变快,从而提升了模型训练的效率。
考虑到在模型学习的过程中,总会有容易判别的负类(对应负类得分较低)和难判别的负类(对应负类得分较高),为了兼顾各种负类对模型训练参数的影响,本公开实施例还提供了一种挖掘难判别负类的方案。
这里,在选取K个负类的过程中,一来可以按照待随机选取的第二目标相关度在预设采样数量个第二目标相关度中的第一预设占比,从各个第二相关度中随机选取与第一预设占比对应的第一数量个第二相关度,例如,可以随机选取K/2个第二相关度作为负类,二来可以先按照由大到小的顺序对各个第二相关度进行排名,然后按照待顺序选取的第二目标相关度在预设采样数量个第二目标相关度中的第二预设占比,从排名后的各个第二相关度中选取出与第二预设占比对应的第二数量个第二相关度,例如,可以将排名在前K/2的第二相关度确定为顺序选取的K/2个负类,这样,将选取的两个K/2个负类进行组合,即可以得到采样的K个负类。
为了便于进一步理解上述负类的选取过程,接下来可以以B=10,K=3为例进行说明。若第一预设占比为1/3,第二预设占比为2/3,则对应的第一数量和第二数量分别为1和2,这样,可以随机从10个第二相关度中选取出1个第二目标相关度,还可以在对10个第二相关度进行排名后,顺序选取2个第二目标相关度,选取出的3个第二目标相关度即可以作为采样后的负类。
利用上述选取方法所计算出来的损失函数,不仅确保模型训练能够高效完成,还可以显式地纠正模型的难判别负类的学习,让正类得分也要比那些难学习的负类得分足够大,从而进一步确保模型训练的准确度。
本公开实施例中,考虑到在用户编辑话题集中,存在很多语义相同的话题,比如“#可爱的狗”和“#狗狗好可爱”,这样,在针对一个训练样本组中的历史多媒体内容确定其正类话题为“#可爱的狗”之后,为了避免将“#狗狗好可爱”,采样为负类话题。这里,在确定负类话题的过程中,可以基于话题相似度筛选结果来确定,也即,针对一个每个历史多媒体内容,可以将除该历史多媒体内容之外、与该历史多媒体内容的正类话题之间的话题相似度小于预设阈值的其它历史多媒体内容对应的正类话题作为该历史多媒体内容对应的负类话题。
本公开实施例中的话题相似度可以表征的是两个正类话题之间的相似度。在具体应用中,可以采用基于话题词之间的余弦相似度来确定,还可以基于字词重叠度来确定,还可以基于其它能够表征两个正类话题之间的相似度的其它方式来确定,在此不做具体的限制。
其中,字词重叠度一定程度上可以表征两个话题存在冗余的可能性,字词重叠度越大,存在冗余的可能性也越大,对应采样为负类话题的可能性越低,字词重叠度越小,存在冗余的可能性也越小,对应采样为负类话题的可能性越高。本公开实施例中,可以按照如下步骤确定两个话题之间的字体重叠度:
步骤一、针对待计算字词重叠度的两个话题,将两个话题中的每个话题进行字词切分处理,得到与每个话题对应的多个话题字词;
步骤二、将两个话题分别对应的多个话题字词进行交集处理,得到处理后的第一话题字词组,以及将两个话题分别对应的多个话题字词进行并集处理,得到处理后的第二话题字词组;
步骤三、确定第一话题字词组在第二话题字词组中的占比,将确定的占比作为两个话题之间的字词重叠度。
这里,首先可以针对待计算字词重叠度的两个话题,分别计算对两个进行字词切分处理,得到每个话题对应的多个话题字词,本公开实施例中的字词切分可以是逐字切分,也即一个话题包括多少字,就可以对应切分几份,除此之外,本公开实施例还可以基于词典确定可切分的字词。例如,针对“A国家B地点游行”和“B地点游行”这两个话题而言,“A国家B地点游行”这一话题可以切分为“A国家”、“B地点”、“游行”等三个话题字词,“B地点游行”可以切分为“B地点”、“游行”等两个话题字词。
在确定两个话题中每个话题对应的多个话题字词之后,即可以进行话题字词的交集处理和并集处理,将交集处理所得到的第一话题字词组在并集处理所得到的第二话题字词组的占比,即可以确定为这两个话题之间的字词重叠度。
仍以“A国家B地点游行”和“B地点游行”这两个话题为例,在“A国家B地点游行”这一话题所对应的三个话题字词为“A国家”、“B地点”、“游行”,“B地点游行”这一话题所对应的两个话题字词为“B地点”、“游行”的情况下,取交集结果得到的第一话题字词组为“B地点游行”(对应5个字),取并集结果得到“A国家B地点游行”(对应8个字),此时5/8即可作为上述两个话题的字词重叠度。
本公开实施例可以通过设定字词重叠度的预设阈值(如设置为0.5)实现负类话题的选取。可知,利用上述负类话题的选取方法为训练样本去除了伪负类,从而可以帮助相关度模型减少模棱两可的负类话题,让模型的学习更聚焦,模型的准确度也更高。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与多媒体内容发布的方法对应的多媒体内容发布的装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述多媒体内容发布的方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
实施例三
参照图5所示,为本公开实施例提供的一种多媒体内容发布的装置的示意图,装置包括:内容确定模块501、话题获取模块502、话题确定模块503以及信息发送模块504;其中,
内容确定模块501,用于确定待发布的多媒体内容;
话题获取模块502,用于获取与多媒体内容匹配的多个候选话题;候选话题为话题集中包括的各个话题中,与多媒体内容的相关度符合预设条件的话题;
话题确定模块503,用于确定多个候选话题中被选中的目标话题;
信息发送模块504,用于响应多媒体内容发布请求,将包含目标话题的多媒体内容发布信息发送至服务端。
上述多媒体内容发布的装置能够为用户自动提供多个候选话题,节省了用户思考编辑话题的时间,另外,上述多媒体内容发布的方案为用户提供的候选话题是与待发布的多媒体内容相关度比较高的话题,这样,在用户从候选话题中选取出目标话题之后,即可以发布包含目标话题的多媒体内容发布信息给服务端。由于候选话题是基于与多媒体内容之间的相关度确定的,因而一定程度上可以为多媒体内容提供更为准确的话题备选,又考虑到目标话题是基于用户的自主选择结果确定的,因而所确定的话题可以是与用户意图强相关的,这一定程度上可以更为准确的表达多媒体内容,以便用户可以更准确的理解多媒体内容,提升发布平台的服务质量。
在一种可能的实施方式中,话题确定模块503,具体用于在获取与多媒体内容匹配的多个候选话题之后,确定多个候选话题中被选中的目标话题之前,在检测到输入到话题输入框中的目标标识符后,将获取的与多媒体内容匹配的多个候选话题展示在与话题输入框对应的话题选择框内。
在一种可能的实施方式中,话题确定模块503,用于按照以下步骤确定多个候选话题中被选中的目标话题:
响应在话题选择框的选取操作,将从多个候选话题中选取的目标话题展示在与话题选择框对应的话题输入框内。
在一种可能的实施方式中,装置还包括:
话题展示模块505,用于响应针对纵排展示方式的第一触发指令,纵向滚动展示获取的与多媒体内容匹配的多个候选话题;或者,
响应针对横排展示方式的第二触发指令,横向滚动展示获取的与多媒体内容匹配的多个候选话题。
参照图6所示,为本公开实施例提供的另一种多媒体内容发布的装置示意图,装置包括:内容获取模块601、话题选取模块602、信息接收模块603和内容发布模块604;其中,
内容获取模块601,用于获取待发布的多媒体内容;
话题选取模块602,用于从预存的话题集中,选取与多媒体内容匹配的多个候选话题,并将选取的多个候选话题返回给用户端;
信息接收模块603,用于接收包含目标话题的多媒体内容发布信息;目标话题包含在多个候选话题中;
内容发布模块604,用于基于多媒体内容发布信息,发布多媒体内容。
在一种可能的实施方式中,话题选取模块602,用于按照以下步骤从预存的话题集中,选取与多媒体内容匹配的多个候选话题:
利用训练好的相关度模型,确定多媒体内容与存储的话题集中的每个话题之间的相关度;
基于相关度,从话题集中选取多个候选话题。
在一种可能的实施方式中,上述装置还包括:
模型训练模型,用于:
获取各个历史多媒体内容以及与每个历史多媒体内容对应的用户编辑话题;
针对每个历史多媒体内容,将该历史多媒体内容所对应的用户编辑话题作为该历史多媒体内容对应的正类话题,并将除该历史多媒体内容之外的其它历史多媒体内容对应的用户编辑话题作为该历史多媒体内容对应的负类话题;
将每个历史多媒体内容、该历史多媒体内容对应的正类话题、以及该历史多媒体内容对应的负类话题作为一个训练数据组,基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数。
在一种可能的实施方式中,模型训练模块605,用于按照以下步骤基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数:
针对多个训练数据组中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的各个负类话题之间的第二相关度;
若第一相关度与各个第二相关度中的任一第二相关度之间的差值小于预设阈值,则调整相关度模型的模型参数,并再次训练待训练的相关度模型,直至第一相关度与各个第二相关度之间的差值均大于或等于预设阈值,停止训练,得到训练好的相关度模型的模型参数。
在一种可能的实施方式中,模型训练模块605,用于按照如下步骤确定每个历史多媒体内容对应的负类话题:
针对每个历史多媒体内容,将除该历史多媒体内容之外、与该历史多媒体内容的正类话题之间的话题相似度小于预设阈值的其它历史多媒体内容对应的正类话题作为该历史多媒体内容对应的负类话题。
在一种可能的实施方式中,话题相似度包括字词重叠度,模型训练模块605,用于按照如下步骤确定字词重叠度:
针对待计算字词重叠度的两个话题,将两个话题中的每个话题进行字词切分处理,得到与每个话题对应的多个话题字词;
将两个话题分别对应的多个话题字词进行交集处理,得到处理后的第一话题字词组,以及将两个话题分别对应的多个话题字词进行并集处理,得到处理后的第二话题字词组;
确定第一话题字词组在第二话题字词组中的占比,将确定的占比作为两个话题之间的字词重叠度。
在一种可能的实施方式中,模型训练模块605,用于按照以下步骤基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数:
基于多个训练数据组对待训练的相关度模型进行至少一轮训练,每轮训练按照如下步骤执行:
在进行本轮待训练的相关度模型的训练之前,将多个训练数据组随机划分为多个训练数据集;每个训练数据集包括多个训练数据组;
依次遍历多个训练数据集中的每个训练数据集,基于遍历到的训练数据集对待训练的相关度模型进行本轮的模型训练,直至遍历完所有的训练数据集,得到本轮训练好的相关度模型的模型参数。
在一种可能的实施方式中,模型训练模块605,用于按照以下步骤基于遍历到的训练数据集对待训练的相关度模型进行本轮的模型训练:
针对遍历到的训练数据集中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容的各个负类话题之间的第二相关度;
从各个第二相关度中选取预设采样数量个第二目标相关度;
基于第一相关度、以及选取的预设采样数量个第二目标相关度调整本轮待训练的相关度模型的模型参数。
在一种可能的实施方式中,模型训练模块605,用于按照以下步骤从各个第二相关度中选取预设采样数量个第二目标相关度:
按照待随机选取的第二目标相关度在预设采样数量个第二目标相关度中的第一预设占比,从各个第二相关度中随机选取与第一预设占比对应的第一数量个第二相关度;以及,
按照由大到小的顺序对各个第二相关度进行排名,并按照待顺序选取的第二目标相关度在预设采样数量个第二目标相关度中的第二预设占比,从排名后的各个第二相关度中选取出与第二预设占比对应的第二数量个第二相关度;第二预设占比与第一预设占比的和值为1;
基于选取出的第一数量个第二相关度以及第二数量个第二相关度,确定预设采样数量个第二目标相关度。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
实施例四
本公开实施例还提供了一种电子设备,该电子设备可以是服务端,也可以是用户端。在以用户端作为电子设备时,如图7所示,为本公开实施例提供的电子设备的结构示意图,包括:处理器701、存储器702、和总线703。存储器702存储有处理器701可执行的机器可读指令(如图5所示多媒体内容发布的装置中,内容确定模块501、话题获取模块502、话题确定模块503以及信息发送模块504所对应执行的指令),当电子设备运行时,处理器701与存储器702之间通过总线703通信,机器可读指令被处理器701执行时执行如下处理:
确定待发布的多媒体内容;
获取与多媒体内容匹配的多个候选话题;候选话题为话题集中包括的各个话题中,与多媒体内容的相关度符合预设条件的话题;
确定多个候选话题中被选中的目标话题;
响应多媒体内容发布请求,将包含目标话题的多媒体内容发布信息发送至服务端。
在一种可能的实施方式中,获取与多媒体内容匹配的多个候选话题之后,确定多个候选话题中被选中的目标话题之前,上述处理器701执行的指令还包括:
在检测到输入到话题输入框中的目标标识符后,将获取的与多媒体内容匹配的多个候选话题展示在与话题输入框对应的话题选择框内。
在一种可能的实施方式中,上述处理器701执行的指令中,确定多个候选话题中被选中的目标话题,包括:
响应在话题选择框的选取操作,将从多个候选话题中选取的目标话题展示在与话题选择框对应的话题输入框内。
在一种可能的实施方式中,上述处理器701执行的指令还包括:
响应针对纵排展示方式的第一触发指令,纵向滚动展示获取的与多媒体内容匹配的多个候选话题;或者,
响应针对横排展示方式的第二触发指令,横向滚动展示获取的与多媒体内容匹配的多个候选话题。
在以服务端作为电子设备时,如图8所示,为本公开实施例提供的电子设备的结构示意图,包括:处理器801、存储器802、和总线803。存储器802存储有处理器801可执行的机器可读指令(如图6所示多媒体内容发布的装置中,内容获取模块601、话题选取模块602、信息接收模块603和内容发布模块604所对应执行的指令),当电子设备运行时,处理器801与存储器802之间通过总线803通信,机器可读指令被处理器801执行时执行如下处理:
获取待发布的多媒体内容;
从预存的话题集中,选取与多媒体内容匹配的多个候选话题,并将选取的多个候选话题返回给用户端;
接收包含目标话题的多媒体内容发布信息;目标话题包含在多个候选话题中;
基于多媒体内容发布信息,发布多媒体内容。
在一种可能的实施方式中,上述处理器801执行的指令中,从预存的话题集中,选取与多媒体内容匹配的多个候选话题,包括:
利用训练好的相关度模型,确定多媒体内容与存储的话题集中的每个话题之间的相关度;
基于相关度,从话题集中选取多个候选话题。
在一种可能的实施方式中,上述处理器801执行的指令中,按照如下步骤训练相关度模型:
获取各个历史多媒体内容以及与每个历史多媒体内容对应的用户编辑话题;
针对每个历史多媒体内容,将该历史多媒体内容所对应的用户编辑话题作为该历史多媒体内容对应的正类话题,并将除该历史多媒体内容之外的其它历史多媒体内容对应的用户编辑话题作为该历史多媒体内容对应的负类话题;
将每个历史多媒体内容、该历史多媒体内容对应的正类话题、以及该历史多媒体内容对应的负类话题作为一个训练数据组,基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数。
在一种可能的实施方式中,上述处理器801执行的指令中,基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数,包括:
针对多个训练数据组中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容对应的各个负类话题之间的第二相关度;
若第一相关度与各个第二相关度中的任一第二相关度之间的差值小于预设阈值,则调整相关度模型的模型参数,并再次训练待训练的相关度模型,直至第一相关度与各个第二相关度之间的差值均大于或等于预设阈值,停止训练,得到训练好的相关度模型的模型参数。
在一种可能的实施方式中,上述处理器801执行的指令中,按照如下步骤确定每个历史多媒体内容对应的负类话题:
针对每个历史多媒体内容,将除该历史多媒体内容之外、与该历史多媒体内容的正类话题之间的话题相似度小于预设阈值的其它历史多媒体内容对应的正类话题作为该历史多媒体内容对应的负类话题。
在一种可能的实施方式中,话题相似度包括字词重叠度,上述处理器801执行的指令中,按照如下步骤确定字词重叠度:
针对待计算字词重叠度的两个话题,将两个话题中的每个话题进行字词切分处理,得到与每个话题对应的多个话题字词;
将两个话题分别对应的多个话题字词进行交集处理,得到处理后的第一话题字词组,以及将两个话题分别对应的多个话题字词进行并集处理,得到处理后的第二话题字词组;
确定第一话题字词组在第二话题字词组中的占比,将确定的占比作为两个话题之间的字词重叠度。
在一种可能的实施方式中,上述处理器801执行的指令中,基于多个训练数据组对待训练的相关度模型进行训练,得到相关度模型的模型参数,包括:
基于多个训练数据组对待训练的相关度模型进行至少一轮训练,每轮训练按照如下步骤执行:
在进行本轮待训练的相关度模型的训练之前,将多个训练数据组随机划分为多个训练数据集;每个训练数据集包括多个训练数据组;
依次遍历多个训练数据集中的每个训练数据集,基于遍历到的训练数据集对待训练的相关度模型进行本轮的模型训练,直至遍历完所有的训练数据集,得到本轮训练好的相关度模型的模型参数。
在一种可能的实施方式中,上述处理器801执行的指令中,基于遍历到的训练数据集对待训练的相关度模型进行本轮的模型训练,包括:
针对遍历到的训练数据集中的每个训练数据组,将该训练数据组输入至待训练的相关度模型,确定该训练数据组对应的历史多媒体内容与该历史多媒体内容的正类话题之间的第一相关度,以及该训练数据组对应的历史多媒体内容与该历史多媒体内容的各个负类话题之间的第二相关度;
从各个第二相关度中选取预设采样数量个第二目标相关度;
基于第一相关度、以及选取的预设采样数量个第二目标相关度调整本轮待训练的相关度模型的模型参数。
在一种可能的实施方式中,上述处理器801执行的指令中,从各个第二相关度中选取预设采样数量个第二目标相关度,包括:
按照待随机选取的第二目标相关度在预设采样数量个第二目标相关度中的第一预设占比,从各个第二相关度中随机选取与第一预设占比对应的第一数量个第二相关度;以及,
按照由大到小的顺序对各个第二相关度进行排名,并按照待顺序选取的第二目标相关度在预设采样数量个第二目标相关度中的第二预设占比,从排名后的各个第二相关度中选取出与第二预设占比对应的第二数量个第二相关度;第二预设占比与第一预设占比的和值为1;
基于选取出的第一数量个第二相关度以及第二数量个第二相关度,确定预设采样数量个第二目标相关度。
上述指令的具体执行过程可以参考本公开实施例一和实施例二中所述的多媒体内容发布的方法的步骤,此处不再赘述。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例一和实施例二中所述的多媒体内容发布的方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例所提供的多媒体内容发布的方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例一和实施例二中所述的多媒体内容发布的方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务端,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。