CN113704510B

CN113704510B - 一种媒体内容推荐方法、装置、电子设备及存储介质

Info

Publication number: CN113704510B
Application number: CN202110869630.2A
Authority: CN
Inventors: 廖一桥
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2024-02-06
Anticipated expiration: 2041-07-30
Also published as: CN113704510A

Abstract

本公开关于一种媒体内容推荐方法、装置、电子设备及存储介质，该方法包括：获取目标用户的近期兴趣对象，所述近期兴趣对象表征所述目标用户账户在当前时间之前的预设时长内感兴趣的媒体内容的类别；确定所述目标用户账户对应的全量历史行为信息序列中与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列；通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标；所述兴趣指标用于确定向所述目标用户账户推荐的候选媒体内容。本公开提高了对媒体内容的推荐效率和推荐准确性。

Description

一种媒体内容推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及一种媒体内容推荐方法、装置、电子设备及存储介质。

背景技术

媒体内容推荐系统中通常基于点击率预估模型(ClickThroughRate,CTR)来预估用户对各候选媒体内容的感兴趣程度，进而可以基于该感兴趣程度向该用户推荐感兴趣的候选媒体内容。

由于用户历史行为信息中蕴含着用户的“兴趣点”信息，基于这些“兴趣点”信息可以给用户推荐更感兴趣的内容，因此，相关技术中采用基于检索的用户行为兴趣CTR模型，该模型包括通用搜索单元(GeneralSearchUnit，GSU)和精确搜索单元(ExactSearchUnit，ESU)。然而，相关技术中针对每个候选媒体内容都会对通用搜索单元进行一次请求，以基于该候选媒体内容对用户的全量历史行为序列进行一次搜索，也即在针对一次媒体内推荐请求的响应中，若对应有1000个候选媒体内容，那么需要向GSU单元请求1000次，导致向GSU的请求频次高，降低了预估效率低，进而降低了媒体内容的推荐效率；另外，相关技术中预估的感兴趣程度的准确性也较低，进而降低了媒体内容的推荐准确性。

发明内容

本公开提供一种媒体内容推荐方法、装置、电子设备及存储介质，以至少解决相关技术中基于检索的用户行为兴趣CTR模型进行媒体内容推荐时存在推荐效率低以及准确性差的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种媒体内容推荐方法，包括：

获取目标用户账户对应的近期兴趣对象；所述近期兴趣对象表征所述目标用户账户在当前时间之前的预设时长内感兴趣的媒体内容的类别；

确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列；

通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标；所述兴趣指标用于确定向所述目标用户账户推荐的候选媒体内容。

在一个示例性的实施方式中，获取所述目标用户账户的近期历史行为信息序列，所述近期历史行为信息序列是指在当前时间之前的预设时长内所述目标用户账户针对媒体内容产生的行为信息序列；

根据所述近期历史行为信息序列中各历史行为信息对应的媒体内容，确定所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，所述根据所述近期历史行为信息序列中各历史行为信息对应的媒体内容，确定所述目标用户账户对应的近期兴趣对象，包括：

确定所述近期历史行为信息序列中各历史行为信息对应的媒体内容所属的类目，得到至少一个类目；

确定所述至少一个类目中各类目对应的所述媒体内容的数量；

在所述各类目对应的所述媒体内容的数量满足预设数量分布的情况下，从所述至少一个类目中选取至少一个目标类目；所述目标类目对应的所述媒体内容的数量满足第一预设条件；

将所述至少一个目标类目确定为所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，所述方法还包括：

在所述各类目对应的所述媒体内容的数量不满足预设数量分布的情况下，确定所述近期历史行为信息序列中距离当前时间最近的至少一个目标历史行为信息；

确定所述至少一个目标历史行为信息对应的媒体内容所属的类目，得到至少一个目标类目；

在一个示例性的实施方式中，所述方法还包括：

在所述各类目对应的所述媒体内容的数量不满足预设数量分布的情况下，根据预设类目层级信息确定所述至少一个类目中各类目对应的上一级类目；

将所述各类目对应的上一级类目作为所述至少一个类目，执行所述确定所述至少一个类目中各类目对应的所述媒体内容的数量，直至所述各类目对应的所述媒体内容的数量满足预设数量分布。

确定所述近期历史行为信息序列中各历史行为信息对应的媒体内容，得到至少一个媒体内容；

对所述至少一个媒体内容进行聚类处理，得到至少一个媒体内容簇以及每个所述媒体内容簇对应的簇中心；

确定各所述媒体内容簇中媒体内容的数量；

在所述各所述媒体内容簇中媒体内容的数量满足预设数量分布的情况下，从所述至少一个媒体内容簇中选取至少一个目标媒体内容簇；所述目标媒体内容簇中媒体内容的数量满足第二预设条件；

将所述至少一个目标媒体内容簇对应的目标簇中心确定为所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，所述方法还包括：

在所述各所述媒体内容簇中媒体内容的数量不满足预设数量分布的情况下，根据各所述媒体内容簇对应的簇中心确定平均簇中心；

从所述至少一个媒体内容簇对应的簇中心中，选取距离所述平均簇中心最近的至少一个目标簇中心；

将所述至少一个目标簇中心确定为所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，在所述近期兴趣对象包括多个兴趣对象的情况下，所述确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列，包括：

针对所述多个兴趣对象中的每个兴趣对象，确定所述全量历史行为信息序列中的第一历史行为信息；所述第一历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述兴趣对象匹配过的历史行为信息；

在所述第一历史行为信息对应的媒体内容与所述兴趣对象相匹配时，将所述第一历史行为信息确定为所述兴趣对象对应的目标历史行为信息；

在所述兴趣对象对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中存在未与所述兴趣对象匹配过的历史行为信息时，执行所述确定所述全量历史行为信息序列中的第一历史行为信息的步骤，直至所述兴趣对象对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述兴趣对象对应的目标历史行为信息序列；

根据所述多个兴趣对象中各兴趣对象对应的目标历史行为信息序列，得到所述目标用户账户对应的目标历史行为信息序列。

在一个示例性的实施方式中，所述方法还包括：

在所述兴趣对象对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中不存在未与所述兴趣对象匹配过的历史行为信息时，确定所述兴趣对象对应的目标关联对象；

确定所述全量历史行为信息序列中的第二历史行为信息；所述第二历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述目标关联对象匹配过的历史行为信息；

在所述第二历史行为信息对应的媒体内容与所述目标关联对象相匹配时，将所述第二历史行为信息确定为所述兴趣对象对应的目标历史行为信息；

在所述兴趣对象对应的目标历史行为信息的当前数量未达到所述预设数量阈值，且所述全量历史行为信息序列中存在未与所述目标关联对象匹配过的历史行为信息时，执行所述确定所述全量历史行为信息序列中的第二历史行为信息的步骤，直至所述兴趣对象对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述兴趣对象对应的目标历史行为信息序列。

从所述多个兴趣对象中选取目标兴趣对象；所述目标兴趣对象是所述多个兴趣对象中显著性最高且未被匹配过的兴趣对象；

确定所述全量历史行为信息序列中的第三历史行为信息；所述第三历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述目标兴趣对象匹配过的历史行为信息；

在所述第三历史行为信息对应的媒体内容与所述目标兴趣对象相匹配时，将所述第三历史行为信息确定为所述目标用户账户对应的目标历史行为信息；

在所述目标用户账户对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中存在未与所述目标兴趣对象匹配过的历史行为信息时，执行所述确定所述全量历史行为信息序列中的第三历史行为信息的步骤，直至所述目标用户账户对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述目标用户账户对应的目标历史行为信息序列。

在一个示例性的实施方式中，所述方法还包括：

在所述目标用户账户对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中不存在未与所述目标兴趣对象匹配过的历史行为信息时，执行所述从所述多个兴趣对象中选取目标兴趣对象的步骤，直至所述目标用户账户对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述目标用户账户对应的目标历史行为信息序列。

根据本公开实施例的第二方面，提供一种媒体内容推荐装置，包括：

近期兴趣对象获取单元，被配置为执行获取目标用户账户对应的近期兴趣对象；所述近期兴趣对象表征所述目标用户账户在当前时间之前的预设时长内感兴趣的媒体内容的类别；

目标历史行为序列确定单元，被配置为执行确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列；

兴趣指标确定单元，被配置为执行通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标；所述兴趣指标用于确定向所述目标用户账户推荐的候选媒体内容。

在一个示例性的实施方式中，所述装置还包括：

近期行为序列获取单元，被配置为执行获取所述目标用户账户的近期历史行为信息序列，所述近期历史行为信息序列是指在当前时间之前的预设时长内所述目标用户账户针对媒体内容产生的行为信息序列；

近期兴趣对象确定单元，被配置为执行根据所述近期历史行为信息序列中各历史行为信息对应的媒体内容，确定所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，所述近期兴趣对象确定单元，包括：

类目确定单元，被配置为执行确定所述近期历史行为信息序列中各历史行为信息对应的媒体内容所属的类目，得到至少一个类目；

第一确定单元，被配置为执行确定所述至少一个类目中各类目对应的所述媒体内容的数量；

第一目标类目确定单元，被配置为执行在所述各类目对应的所述媒体内容的数量满足预设数量分布的情况下，从所述至少一个类目中选取至少一个目标类目；所述目标类目对应的所述媒体内容的数量满足第一预设条件；

第一近期兴趣对象确定子单元，被配置为执行将所述至少一个目标类目确定为所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，所述近期兴趣对象确定单元，还包括：

第二确定单元，被配置为执行在所述各类目对应的所述媒体内容的数量不满足预设数量分布的情况下，确定所述近期历史行为信息序列中距离当前时间最近的至少一个目标历史行为信息；

第二目标类目确定单元，被配置为执行确定所述至少一个目标历史行为信息对应的媒体内容所属的类目，得到至少一个目标类目；

第二近期兴趣对象确定子单元，被配置为执行将所述至少一个目标类目确定为所述目标用户账户对应的近期兴趣对象。

上级类目确定单元，被配置为执行在所述各类目对应的所述媒体内容的数量不满足预设数量分布的情况下，根据预设类目层级信息确定所述至少一个类目中各类目对应的上一级类目；

第一循环执行单元，被配置为执行将所述各类目对应的上一级类目作为所述至少一个类目，执行所述确定所述至少一个类目中各类目对应的所述媒体内容的数量，直至所述各类目对应的所述媒体内容的数量满足预设数量分布。

媒体内容确定单元，被配置为执行确定所述近期历史行为信息序列中各历史行为信息对应的媒体内容，得到至少一个媒体内容；

聚类处理单元，被配置为执行对所述至少一个媒体内容进行聚类处理，得到至少一个媒体内容簇以及每个所述媒体内容簇对应的簇中心；

第三确定单元，被配置为执行确定各所述媒体内容簇中媒体内容的数量；

第一选取单元，被配置为执行在所述各所述媒体内容簇中媒体内容的数量满足预设数量分布的情况下，从所述至少一个媒体内容簇中选取至少一个目标媒体内容簇；所述目标媒体内容簇中媒体内容的数量满足第二预设条件；

第三近期兴趣对象确定子单元，被配置为执行将所述至少一个目标媒体内容簇对应的目标簇中心确定为所述目标用户账户对应的近期兴趣对象。

第四确定单元，被配置为执行在所述各所述媒体内容簇中媒体内容的数量不满足预设数量分布的情况下，根据各所述媒体内容簇对应的簇中心确定平均簇中心；

第二选取单元，被配置为执行从所述至少一个媒体内容簇对应的簇中心中，选取距离所述平均簇中心最近的至少一个目标簇中心；

第四近期兴趣对象确定子单元，被配置为执行将所述至少一个目标簇中心确定为所述目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，在所述近期兴趣对象包括多个兴趣对象的情况下，所述目标历史行为序列确定单元，包括：

第五确定单元，被配置为执行针对所述多个兴趣对象中的每个兴趣对象，确定所述全量历史行为信息序列中的第一历史行为信息；所述第一历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述兴趣对象匹配过的历史行为信息；

第六确定单元，被配置为执行在所述第一历史行为信息对应的媒体内容与所述兴趣对象相匹配时，将所述第一历史行为信息确定为所述兴趣对象对应的目标历史行为信息；

第七确定单元，被配置为执行在所述兴趣对象对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中存在未与所述兴趣对象匹配过的历史行为信息时，执行所述确定所述全量历史行为信息序列中的第一历史行为信息的步骤，直至所述兴趣对象对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述兴趣对象对应的目标历史行为信息序列；

第一目标历史行为序列确定子单元，被配置为执行根据所述多个兴趣对象中各兴趣对象对应的目标历史行为信息序列，得到所述目标用户账户对应的目标历史行为信息序列。

在一个示例性的实施方式中，所述目标历史行为序列确定单元，还包括：

目标关联对象确定单元，被配置为执行在所述兴趣对象对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中不存在未与所述兴趣对象匹配过的历史行为信息时，确定所述兴趣对象对应的目标关联对象；

第八确定单元，被配置为执行确定所述全量历史行为信息序列中的第二历史行为信息；所述第二历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述目标关联对象匹配过的历史行为信息；

第九确定单元，被配置为执行在所述第二历史行为信息对应的媒体内容与所述目标关联对象相匹配时，将所述第二历史行为信息确定为所述兴趣对象对应的目标历史行为信息；

第十确定单元，被配置为执行在所述兴趣对象对应的目标历史行为信息的当前数量未达到所述预设数量阈值，且所述全量历史行为信息序列中存在未与所述目标关联对象匹配过的历史行为信息时，执行所述确定所述全量历史行为信息序列中的第二历史行为信息的步骤，直至所述兴趣对象对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述兴趣对象对应的目标历史行为信息序列。

目标兴趣对象确定单元，被配置为执行从所述多个兴趣对象中选取目标兴趣对象；所述目标兴趣对象是所述多个兴趣对象中显著性最高且未被匹配过的兴趣对象；

第十一确定单元，被配置为执行确定所述全量历史行为信息序列中的第三历史行为信息；所述第三历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述目标兴趣对象匹配过的历史行为信息；

第十二确定单元，被配置为执行在所述第三历史行为信息对应的媒体内容与所述目标兴趣对象相匹配时，将所述第三历史行为信息确定为所述目标用户账户对应的目标历史行为信息；

第二目标历史行为序列确定子单元，被配置为执行在所述目标用户账户对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中存在未与所述目标兴趣对象匹配过的历史行为信息时，执行所述确定所述全量历史行为信息序列中的第三历史行为信息的步骤，直至所述目标用户账户对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述目标用户账户对应的目标历史行为信息序列。

第三目标历史行为序列确定子单元，被配置为执行在所述目标用户账户对应的目标历史行为信息的当前数量未达到预设数量阈值，且所述全量历史行为信息序列中不存在未与所述目标兴趣对象匹配过的历史行为信息时，执行所述从所述多个兴趣对象中选取目标兴趣对象的步骤，直至所述目标用户账户对应的目标历史行为信息的当前数量达到预设数量阈值，得到所述目标用户账户对应的目标历史行为信息序列。

根据本公开实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现上述第一方面的媒体内容推荐方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述第一方面的媒体内容推荐方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述第一方面的媒体内容推荐方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开实施例基于目标用户账户的近期兴趣对象搜索该目标用户账户的全量历史行为信息序列得到该目标用户账户对应的目标历史行为信息序列，进而基于该目标历史行为信息序列和已训练的兴趣指标预估模型，确定该目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标，从而即使针对一次媒体内容推荐请求的响应中涉及到多个候选媒体内容，也仅需对GSU单元进行一次请求，大大降低了在兴趣指标预估中对于GSU的请求频次，提高了预估效率，进而提高了媒体内容的推荐效率；另外，由于基于用户账户的近期兴趣对象对全量历史行为信息序列进行搜索，从而提高了兴趣指标预估的准确性，保证了推荐的媒体内容符合用户近期的兴趣，提高了媒体内容推荐的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种媒体内容推荐方法的应用环境示意图；

图2是根据一示例性实施例示出的一种媒体内容推荐方法的流程图；

图3a是根据一示例性实施例示出的根据近期历史行为信息序列中各历史行为信息对应的媒体内容确定目标用户账户对应的近期兴趣对象的一种流程图；

图3b是根据一示例性实施例示出的根据近期历史行为信息序列中各历史行为信息对应的媒体内容确定目标用户账户对应的近期兴趣对象的另一种流程图；

图4是根据一示例性实施例示出的根据近期历史行为信息序列中各历史行为信息对应的媒体内容确定目标用户账户对应的近期兴趣对象的另一种流程图；

图5是根据一示例性实施例示出的得到目标用户账户对应的目标历史行为信息序列的一种流程图；

图6是根据一示例性实施例示出的得到目标用户账户对应的目标历史行为信息序列的另一种流程图；

图7是根据一示例性实施例示出的通过已训练的兴趣指标预估模型，根据目标用户账户对应的目标历史行为信息序列确定目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标的一个示例；

图8是根据一示例性实施例示出的一种媒体内容推荐装置的框图；

图9是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

目前，基于搜索的兴趣模型(Search-Based Interest Model，SIM)采用通用搜索单元(General Search Unit，GSU)和精确搜索单元(Exact Search Unit，ESU)的级联搜索来提取用户兴趣。其中，GSU根据候选项的查询信息从原始长期的序列行为数据中进行搜索，得到与该候选项相关的子用户行为序列；ESU为候选项与子用户行为序列之间的精确关系建模。GSU的实现包括软搜索(soft-search)和硬搜索(hard-search)，其中，hard-search通过候选项和用户行为数据属于相同属性(如类目)来实现用户行为数据的搜索，以找到对预估候选项更重要的用户行为数据，这个过程实质上是个item-to-item的召回过程。

在实现本发明的过程中发明人发现：

一方面，基于候选媒体内容的属性对用户原始长期的序列行为数据进行搜索会大大降低用户兴趣的确定效率，以一个用户一次请求(request)对应有1000个候选媒体内容需要排序为例，按照现有技术中GSU的搜索方式，需要针对每个候选媒体内容都进行一次搜索，也即需要进行1000次GSU搜索，使得SIM中GSU单元的请求频次非常高，降低了对于用户兴趣的确定效率，进而降低了媒体内容的推荐效率；

另一方面，基于候选媒体内容对用户原始序列行为数据进行搜索找到的是与候选媒体内容相同类目的媒体内容所对应的用户历史行为数据，但是这些用户历史行为数据中的媒体内容只能代表该用户过去的兴趣，用户当前的兴趣可能已经发生了变化，也就是说，即使候选媒体内容与用户以前浏览过的媒体内容极其相似，用户也不一定有兴趣再次浏览该媒体内容，从而在用户兴趣变化的情况下，现有技术中的SIM对于用户兴趣的确定准确性低，进而降低了媒体内容的推荐准确性。

基于此，本公开实施例提供一种媒体内容推荐方法，该方法基于目标用户账户的近期兴趣对象搜索该目标用户账户的全量历史行为信息序列得到该目标用户账户对应的目标历史行为信息序列，进而基于该目标用户账户的目标历史行为信息序列和已训练的兴趣指标预估模型，确定该目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标，该兴趣指标用于确定向目标用户账户推荐的候选媒体内容。上述技术方案中对于目标用户账户的目标历史行为信息序列的确定过程类似user-to-item的召回过程，从而即使针对一次媒体内容推荐请求的响应中涉及多个候选媒体内容，也仅需对GSU单元请求一次，大大降低了在兴趣指标预估中对于GSU的请求频次，提高了预估效率即用户兴趣的确定效率，进而提高了媒体内容的推荐效率；另外，由于基于用户账户的近期兴趣对象对全量历史行为信息序列进行搜索，从而使得确定的用户兴趣与用户账户的近期兴趣相符合，而不是很久以前已经变化的兴趣，提高了兴趣指标预估的准确性，进而保证了推荐的媒体内容符合用户近期的兴趣，提高了推荐的准确性。

请参阅图1，其所示为根据一示例性实施例示出的一种媒体内容推荐方法的应用环境示意图，该应用环境包括终端110、服务器120和数据库130，其中，终端110和服务器120之间以及服务器120与数据库130之间可以通过有线网络或者无线网络连接。

终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。终端110中可以安装有提供人机交互功能的客户端软件如应用程序(Application，简称为App)，该应用程序可以是独立的应用程序，也可以是应用程序中的子程序。示例性的，该应用程序可以包括视频类应用程序、直播类应用程序、新闻类应用程序、社交类应用程序等等。终端110的用户可以通过预先注册的用户账户信息登录应用程序，该用户账户信息可以包括账号和密码。

服务器120可以是为终端110中的应用程序提供后台服务的服务器，服务器120可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。

数据库130中存储有用户账户的全量历史行为信息序列，该全量历史行为信息序列包括按照时间先后顺序排列的用户账户的所有历史行为信息，其中，历史行为信息是指该用户账户针对媒体内容产生的行为信息，该媒体内容可以包括视频、图片、广告、新闻等可以在互联网上传播的内容，行为信息可以包括媒体内容的标识信息、媒体内容的生产方标识、针对媒体内容的行为时长以及针对媒体内容的行为时间等。以媒体内容是视频为例，历史行为信息可以包括用户账户观看的视频ID、用户账户观看的视频作者ID、用户账户观看视频的时长、用户账户观看视频距当前时间长度等。

在一个具体的应用场景中，终端110可以响应于媒体内容推荐指令向服务器120发送媒体内容推荐请求，其中媒体内容推荐指令可以是在终端110的用户账户(即目标用户账户)刷新当前页面时基于该刷新操作生成的。

服务器120在接收到媒体内容推荐请求后，可以获取该目标用户账户对应的近期兴趣对象，该近期兴趣对象表征目标用户账户在当前时间之前的预设时长内感兴趣的媒体内容的类别，并基于该近期兴趣对象搜索全量历史行为信息序列以确定与近期兴趣对象相匹配的目标历史行为信息，得到该目标用户账户对应的目标历史行为信息序列。然后，服务器120调用已训练的兴趣指标预估模型，根据该目标用户账户对应的目标历史行为信息序列确定该目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标，进而可以基于各候选媒体内容对应的兴趣指标确定向该目标用户账户推荐的候选媒体内容，并可以将该推荐的候选媒体内容推荐给终端110，以使得终端110展示该推荐的候选媒体内容。

可以理解的，服务器120可以从数据库130分别获取该目标用户账户的近期历史行为信息序列和全量历史行为信息序列，其中，近期历史行为信息序列可以是从全量历史行为信息序列中提取的、在当前时间之前的预设时长内的历史行为信息序列，进而服务器120可以根据近期历史行为信息序列中各历史行为信息对应的媒体内容，确定该目标用户账户的近期兴趣对象。

应理解的，图1所示的应用环境仅为示例，在实际应用中，可以由终端或者服务器独立执行本公开实施例的兴趣概率确定方法，也可以由终端和服务器配合执行本公开实施例的兴趣概率确定方法，本公开实施例对具体的应用环境不作限定。

图2是根据一示例性实施例示出的一种媒体内容推荐方法的流程图，如图2所示，以媒体内容推荐方法用于图1的服务器为例，包括以下步骤：

在步骤S201中，获取目标用户账户对应的近期兴趣对象。

其中，所述近期兴趣对象表征目标用户账户在当前时间之前的预设时长内感兴趣的媒体内容的类别，该预设时长小于该目标用户账户对应的行为时长，目标用户账户对应的行为时长是指目标用户账户针对媒体内容产生第一个行为的时间与当前时间之间的时长。

在一个示例性的实施方式中，还可以包括确定目标用户账户对应的近期兴趣对象的步骤，具体的该步骤可以包括：

获取所述目标用户账户的近期历史行为信息序列；

其中，所述近期历史行为信息序列是指在当前时间之前的预设时长内所述目标用户账户针对媒体内容产生的行为信息序列。

具体的实施中，预设时长可以通过预设序列长度来表征，例如预设序列长度为50，则预设时长可以表征为最近的50个历史行为信息，也即近期历史行为信息序列包括在当前时间之前的最近50个历史行为信息。可以理解的，预设时长还可以通过预设的时间长度来表征，例如预设时长为7天，则近期历史行为信息序列包括在当前时间之前的7天内产生的历史行为信息。

历史行为信息是指目标用户账户针对媒体内容产生的行为信息，该媒体内容可以包括视频、图片、广告、新闻等可以在互联网上传播的内容。行为信息可以包括媒体内容的标识信息、媒体内容的生产方标识、针对媒体内容的行为时长以及针对媒体内容的行为时间等，以媒体内容是视频为例，历史行为信息可以包括目标用户账户观看的视频ID、目标用户账户观看的视频作者ID、目标用户账户观看视频的时长、目标用户账户观看视频距当前时间长度等。

具体的实施中，服务器可以接收目标用户账户对应终端发送的媒体内容推荐请求，并响应于该媒体内容推荐请求获取目标用户账户的近期历史行为信息序列。其中，目标用户账户的媒体内容推荐请求可以是终端响应于目标用户账户在当前页面的刷新操作触发的媒体内容推荐指令生成的请求。

本公开实施例通过获取目标用户账户的近期历史行为信息序列，从而基于该近期历史行为信息序列中各历史行为信息对应的媒体内容，可以准确的确定出该目标用户账户对应的近期兴趣对象。

在一个示例性的实施方式中，近期兴趣对象可以是体现为类目，基于此，上述在根据近期历史行为信息序列中各历史行为信息对应的媒体内容确定该目标用户账户对应的近期兴趣对象时可以采用图3a中的方法，包括以下步骤：

在步骤S301中，确定所述近期历史行为信息序列中各历史行为信息对应的媒体内容所属的类目，得到至少一个类目。

在步骤S303中，确定所述至少一个类目中各类目对应的所述媒体内容的数量。

在步骤S305中，判断各类目对应的所述媒体内容的数量是否满足预设数量分布。

其中，预设数量分布的表征形式可以根据实际需要进行设定，示例性的，预设数量分布可以是各类目对应的媒体内容的数量中最大数量与最小数量的差值大于预设数量阈值，该预设数量阈值也可以根据实际需要进行设定，例如预设数量阈值可以设定为零。在另一个示例中，预设数量分布可以是各类目对应的媒体内容的数量所构成的趋势线的斜率大于预设斜率阈值，该预设斜率阈值可以根据实际需要进行设定。

具体的实施中，可以基于预设数量分布的具体表征形式，根据各类目对应的媒体内容的数量确定实际数量分布，并判断该实际数量分布是否满足预设数量分布，若满足预设数量分布则可以执行步骤S307；反之，若实际数量分布不满足预设数量分布，则可以执行步骤S309至步骤S311。

在步骤S307中，从所述至少一个类目中选取至少一个目标类目，将所述至少一个目标类目确定为所述目标用户账户对应的近期兴趣对象。

其中，所述目标类目对应的所述媒体内容的数量满足第一预设条件。

具体的，第一预设条件可以是数量超过第一数量阈值；在有多个类目的情况下，该第一预设条件还可以是按照数量降序排序在前的预设数量个。以第一预设条件是按照数量降序排列在前的预设数量个为例，可以按照各类目对应的媒体内容的数量对多个类目进行降序排列，选取排序在前的3个类目作为目标类目，从而得到以类目表征的该目标用户账户对应的近期兴趣对象。

本公开实施例通过确定近期历史行为信息序列中各历史行为信息对应的媒体内容所属的类目得到至少一个类目，并确定该至少一个类目中各类目对应的媒体内容的数量，进而在各类目对应的媒体内容的数量满足预设数量分布也即存在比较突出的兴趣时，将从至少一个类目中选取的至少一个目标类目作为近期兴趣对象，提升了近期兴趣对象表征的准确性；另外，由于一些媒体内容可能属于同一个类目，从而基于类目来确定近期兴趣对象还可以减少计算量，提高处理效率。

在步骤S309中，确定所述近期历史行为信息序列中距离当前时间最近的至少一个目标历史行为信息。

具体的，距离当前时间最近的至少一个目标历史行为信息中各历史行为信息对应的媒体内容所属的类目不同。实际应用中，可以按照距离当前时间由近到远的顺序从近期历史行为信息序列中选取预设数量个目标历史行为信息，该预设数量可以根据实际需要进行设定，例如可以是3或者5等。

在步骤S311中，确定所述至少一个目标历史行为信息对应的媒体内容所属的类目得到至少一个目标类目，将所述至少一个目标类目确定为所述目标用户账户对应的近期兴趣对象。

示例性的，可以确定近期历史行为信息序列中距离当前时间最近的3个目标历史行为信息，然后将该3个目标历史行为信息对应的媒体内容所属的类目作为目标类目，从而得到以类目表征的该目标用户账户对应的近期兴趣对象。

本公开实施例通过确定近期历史行为信息序列中各历史行为信息对应的媒体内容所属的类目得到至少一个类目，并确定该至少一个类目中各类目对应的媒体内容的数量，进而在各类目对应的媒体内容的数量不满足预设数量分布也即不存在比较突出的兴趣时，考虑到最接近当前时间的历史行为信息最能反映用户在当前时间下的兴趣，因此进一步基于近期历史行为信息序列中距离当前时间最近的至少一个目标历史行为信息对应的媒体内容所述的类目来确定近期兴趣对象，可以在减少计算量、提升处理效率的同时使得近期兴趣对象能够准确的反映用户在当前时间下的兴趣。

在一个示例性的实施方式中，若步骤S305的判断结果是各类目对应的媒体内容的数量不满足预设数量分布，则还可以采用图3b中所示的方法，结合预设类目层级信息来确定用户账户感兴趣的类目以得到以类目表征的近期兴趣对象，具体如图3b所示包括：

在步骤S313中，在所述各类目对应的所述媒体内容的数量不满足预设数量分布的情况下，根据预设类目层级信息确定所述至少一个类目中各类目对应的上一级类目。

在步骤S315中，将所述各类目对应的上一级类目作为所述至少一个类目，并执行前述步骤S303至步骤S305，直至各类目对应的所述媒体内容的数量满足预设数量分布。

其中，预设类目层级信息可以包括多个类目层级，例如3个类目层级，实际应用中，预设类目层级信息通常为树形结构。在各类目对应的媒体内容的数量不满足预设数量分布的情况下，可以基于预设类目层级信息确定各类目对应的更高层次的类目(即上一级类目)，然后统计更高层次类目对应的媒体内容的数量，并判断更高层次类目对应的媒体内容的数量是否满足预设数量分布，若满足则可以执行前述步骤S307，反之若不满足，则可以继续执行步骤S313至步骤S315，直至更高层次类目对应的媒体内容的数量满足预设数量分布得到至少一个目标类目。

本公开实施例通过确定近期历史行为信息序列中各历史行为信息对应的媒体内容所属的类目得到至少一个类目，并确定该至少一个类目中各类目对应的媒体内容的数量，进而在各类目对应的媒体内容的数量不满足预设数量分布也即不存在突出的兴趣时，结合预设类目层级信息来确定用户账户近期感兴趣的类目，从而可以在减少计算量、提升处理效率的同时灵活的实现以准确的近期感兴趣类目表征用户账户的近期兴趣对象。

在一个示例性的实施方式中，近期兴趣对象可以体现为媒体内容簇的簇中心，基于此，上述在根据近期历史行为信息序列中各历史行为信息对应的媒体内容确定该目标用户账户对应的近期兴趣对象时可以采用图4中方法，包括以下步骤：

在步骤S401中，确定所述近期历史行为信息序列中各历史行为信息对应的媒体内容，得到至少一个媒体内容。

在步骤S403中，对所述至少一个媒体内容进行聚类处理，得到至少一个媒体内容簇以及每个所述媒体内容簇对应的簇中心。

具体的实施中，聚类处理可以采用现有的聚类方法，如K-Means算法等，本公开实施例对此不作具体限定。其中，每个媒体内容簇对应的簇中心可以向量表示。

在步骤S405中，确定各所述媒体内容簇中媒体内容的数量。

具体的，统计每个媒体内容簇中媒体内容的数量，从而得到各媒体内容簇对应的数量。

在步骤S407中，判断各所述媒体内容簇中媒体内容的数量是否满足预设数量分布。

其中，预设数量分布的表征形式可以根据实际需要进行设定，示例性的，预设数量分布可以是各媒体内容簇对应的数量中最大数量与最小数量的差值大于预设数量阈值，该预设数量阈值也可以根据实际需要进行设定，例如预设数量阈值可以设定为零。在另一个示例中，预设数量分布可以是各媒体内容簇对应的数量所构成的趋势线的斜率大于预设斜率阈值，该预设斜率阈值可以根据实际需要进行设定。

具体的实施中，可以基于预设数量分布的具体表征形式，根据各媒体内容簇对应的数量确定实际数量分布，并判断该实际数量分布是否满足预设数量分布，若满足预设数量分布则可以执行步骤S409至步骤S411；反之，若实际数量分布不满足预设数量分布，则可以执行步骤S413至步骤S415。

在步骤S409中，从所述至少一个媒体内容簇中选取至少一个目标媒体内容簇；所述目标媒体内容簇中媒体内容的数量满足第二预设条件。

具体的，第二预设条件可以是数量超过第二数量阈值；在有多个媒体内容簇的情况下，该第二预设条件还可以是按照数量降序排序在前的预设数量个。以第二预设条件是按照数量降序排列在前的预设数量个为例，可以按照各媒体内容簇对应的数量对多个媒体内容簇进行降序排列，选取排序在前的3个媒体内容簇作为目标媒体内容簇。

在步骤S411中，将所述至少一个目标媒体内容簇对应的目标簇中心确定为所述目标用户账户对应的近期兴趣对象。

本公开实施例通过确定近期历史行为信息序列中各历史行为信息对应的媒体内容得到至少一个媒体内容，并对至少一个媒体内容进行聚类处理得到至少一个媒体内容簇以及各媒体内容簇对应的簇中心，进而确定各媒体内容簇中媒体内容的数量，并在各媒体内容簇对应的数量满足预设数量分布也即存在比较突出的兴趣时，将从至少一个媒体内容簇中选取的至少一个目标媒体内容簇的目标簇中心作为近期兴趣对象，可以使得近期兴趣对象包含一些突出兴趣的媒体内容特征，提升了近期兴趣对象表征的准确性。

在步骤S413中，根据各所述媒体内容簇对应的簇中心确定平均簇中心。

在步骤S415中，从所述至少一个媒体内容簇对应的簇中心中，选取距离所述平均簇中心最近的至少一个目标簇中心，将所述至少一个目标簇中心确定为所述目标用户账户对应的近期兴趣对象。

具体的实施中，可以将各簇中心表达为向量得到各簇中心对应的中心向量，然后计算各中心向量的平均向量，以该平均向量作为平均簇中心的表达，进而根据各簇中心对应的中心向量和该平均向量计算各簇中心到平均簇中心的距离，并按照距离由小到大的顺序对各簇中心进行排序，将排序在前的预设数量个簇中心作为目标簇中心，从而得到以簇中心表征的近期兴趣对象，其中，预设数量可以根据实际需要进行设定，例如可以是3个。

本公开实施例通过确定近期历史行为信息序列中各历史行为信息对应的媒体内容得到至少一个媒体内容，并对至少一个媒体内容进行聚类处理得到至少一个媒体内容簇以及各媒体内容簇对应的簇中心，进而确定各媒体内容簇中媒体内容的数量，并在各媒体内容簇对应的数量不满足预设数量分布也即不存在比较突出的兴趣时，考虑到与平均簇中心距离最近的簇中心最能表达用户的近期兴趣，因此进一步基于至少一个媒体内容簇的簇中心与平均簇中心的距离确定作为近期兴趣对象的至少一个目标簇中心，可以在提高对于近期兴趣对象表征的准确性的同时降低计算量、提高处理效率。

在步骤S203中，确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列。

具体的，在近期兴趣对象以用户账户近期感兴趣的类目表征时，与近期兴趣对象相匹配的目标历史行为信息是指该目标历史行为信息对应的媒体内容所属的类目与该近期兴趣对象相一致；在近期兴趣对象以用户账户感兴趣的媒体内容簇的簇中心表征时，与近期兴趣对象相匹配的目标历史行为信息是指该目标历史行为信息对应的媒体内容与该近期兴趣对象之间的距离(比如余弦距离或者欧式距离等)满足预设距离阈值，该预设距离阈值可以根据实际需要进行设定，一般预设距离阈值设定的越小，目标历史行为信息与近期兴趣对象的匹配程度越高。

可以理解的，上述步骤S203基于目标用户账户的近期兴趣对象对该目标用户账户的全量历史行为信息序列进行搜索得到的该目标用户账户对应的目标历史行为信息序列的序列长度要远小于全量历史行为信息序列的序列长度。

需要说明的是，由于目标用户账户的近期兴趣对象在短时间内是相同的，所以在针对一次媒体内容推荐请求的响应中只需要访问一次GSU单元，即将目标用户账户对应的近期兴趣对象输入至GSU单元可以得到表征目标用户账户近期兴趣的该目标用户账户对应的目标历史行为信息序列，该目标用户账户对应的目标历史行为信息序列在后续基于兴趣指标预估模型进行兴趣指标确定时可以由候选媒体内容集合中的候选媒体内容共用。

实际应用中，近期兴趣对象可以包括多个兴趣对象，例如近期兴趣对象包括多个类目或者多个簇中心，基于此，在一个示例性的实施方式中，在基于用户近期兴趣对象进行全量历史行为信息序列的搜索时，可以针对每个兴趣对象进行独立搜索，比如有K个兴趣对象，则针对该K个兴趣对象进行独立搜索，可以得到K个预设序列长度的目标历史行为信息序列，那么可以将该K个预设序列长度的目标历史行为信息序列作为该目标用户账户对应的目标历史行为信息序列。基于此，在目标用户账户的近期兴趣对象包括多个兴趣对象的情况下，如图5所示，上述步骤S203在实施时可以针对多个兴趣对象中的每个兴趣对象执行以下步骤：

在步骤S501中，确定所述全量历史行为信息序列中的第一历史行为信息。

其中，所述第一历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未被匹配过的历史行为信息，此处的未被匹配是指该第一历史行为信息对应的媒体内容未与该兴趣对象匹配过。

在步骤S503中，判断所述第一历史行为信息对应的媒体内容与所述兴趣对象是否相匹配。

具体的，若判断的结果是该第一历史行为信息对应的媒体内容与所述兴趣对象相匹配，则可以执行步骤S505至步骤S507；反之，若判断的结果是该第一历史行为信息对应的媒体内容与所述兴趣对象不匹配，则可以执行步骤S509。

在步骤S505中，将所述第一历史行为信息确定为所述兴趣对象对应的目标历史行为信息。

在步骤S507中，判断所述兴趣对象对应的目标历史行为信息的当前数量是否达到预设数量阈值。

其中，预设数量阈值是预设序列长度的一种表征形式，其可以根据实际需要进行设定，例如可以是50等。

具体的，若判断的结果为所述兴趣对象对应的目标历史行为信息的当前数量未达到预设数量阈值时，则可以执行步骤S509；反之，若判断的结果为所述兴趣对象对应的目标历史行为信息的当前数量达到预设数量阈值，则可以结束针对所述兴趣对象进行的处理，得到该兴趣对象对应的目标历史行为信息序列。

在步骤S509中，判断所述全量历史行为信息序列中是否存在未与所述兴趣对象匹配过的历史行为信息。

具体的，若判断的结果为全量历史行为信息序列中存在未与所述兴趣对象匹配过的历史行为信息，则可以循环执行前述步骤S501至步骤S503；反之，若判断的结果为全量历史行为信息序列中不存在未与所述兴趣对象匹配过的历史行为信息，则可以执行步骤S511至步骤S515。

在步骤S511中，确定所述兴趣对象对应的目标关联对象。

其中，目标关联对象的确定方式与兴趣对象的具体表征形式相对应。在兴趣对象为用户账户感兴趣的类目时，目标关联对象可以是基于预设类目层次信息确定的该兴趣类目的上一级类目；在兴趣对象为用户账户感兴趣的媒体内容簇的簇中心时，目标关联对象可以是剩余媒体内容聚类簇中与该兴趣簇中心距离最近的媒体内容簇的簇中心，其中，剩余媒体聚类簇为基于目标用户账户的近期历史行为信息序列得到的媒体内容簇中除用户账户感兴趣的媒体内容簇之外的媒体内容簇。

在步骤S513中，确定所述全量历史行为信息序列中的第二历史行为信息。

其中，所述第二历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未与所述目标关联对象匹配过的历史行为信息。

在步骤S515中，判断所述第二历史行为信息对应的媒体内容与所述目标关联对象是否相匹配。

具体的，若判断的结果是所述第二历史行为信息对应的媒体内容与所述目标关联对象相匹配，则可以执行步骤S517至步骤S519；反之，若判断的结果是所述第二历史行为信息对应的媒体内容与所述目标关联对象不匹配，则可以执行步骤S521。

在步骤S517中，将所述第二历史行为信息确定为所述兴趣对象对应的目标历史行为信息。

在步骤S519中，判断所述兴趣对象对应的目标历史行为信息的当前数量是否达到所述预设数量阈值。

具体的，若判断的结果为所述兴趣对象对应的目标历史行为信息的当前数量未达到预设数量阈值时，则可以执行步骤S521；反之，若判断的结果为所述兴趣对象对应的目标历史行为信息的当前数量达到预设数量阈值，则可以结束针对所述兴趣对象进行的处理，得到该兴趣对象对应的目标历史行为信息序列。

在步骤S521中，判断所述全量历史行为信息序列中是否存在未与所述目标关联对象匹配过的历史行为信息。

具体的，若判断的结果为全量历史行为信息序列中存在未与所述目标关联对象匹配过的历史行为信息，则可以循环执行前述步骤S513至步骤S515；反之，若判断的结果为全量历史行为信息序列中不存在未与所述目标关联对象匹配过的历史行为信息，则继续执行步骤S511至步骤S515。

本公开实施例在得到各兴趣对象对应的目标历史行为信息序列后，可以执行图5中的步骤S523，根据所述多个兴趣对象中各兴趣对象对应的目标历史行为信息序列，得到所述目标用户账户对应的目标历史行为信息序列。

本公开实施例针对近期兴趣对象中的每个兴趣对象，分别对该目标用户账户的全量历史行为信息序列进行搜索，从而得到每个兴趣对象对应的预设序列长度的目标历史行为信息序列，使得目标用户账户对应的目标历史行为信息序列覆盖每个兴趣对象，确保了对于近期兴趣表达的完整性，进而有利于提高后续对于兴趣指标确定的准确性；

另外，本公开实施例针对每个兴趣对象，若搜索完全量历史行为信息序列仍未得到预设序列长度的目标历史行为信息序列，则进一步基于该兴趣对象对应的目标关联对象对全量历史行为信息序列再次搜索，直至得到该兴趣对象对应的预设序列长度的目标历史行为信息序列，从而使得各兴趣对象对应的目标历史行为信息序列的序列长度都满足预设序列长度，确保了对于各兴趣对象都能准确统一表达，有利于提高后续对于兴趣指标的确定效率和准确性。

在另一个示例性的实施方式中，在目标用户账户的近期兴趣对象包括多个兴趣对象的情况下，在基于用户账户的近期兴趣对象进行全量历史行为信息序列的搜索时，还可以先基于最显著的兴趣对象进行搜索，在不满足序列长度要求时在基于次显著的兴趣对象进行搜索，以此类推，直至得到满足预设序列长度的目标用户账户对应的目标历史行为信息序列。

其中，兴趣对象的显著性可以通过其在近期历史行为信息序列中对应的媒体内容的数量来表征，兴趣对象对应的媒体内容的数量越多，则其显著性越高，反之，则其显著性越低。

基于此，在目标用户账户的近期兴趣对象包括多个兴趣对象的情况下，如图6所示，上述步骤S203在实施时可以包括以下步骤：

在步骤S601中，从所述多个兴趣对象中选取目标兴趣对象。

其中，所述目标兴趣对象是所述多个兴趣对象中显著性最高且未被匹配过的兴趣对象，此处的未被匹配过是指该兴趣对象未与全量历史行为信息序列中的任一历史行为信息对应的媒体内容匹配过。

在步骤S603中，确定所述全量历史行为信息序列中的第三历史行为信息。

其中，所述第三历史行为信息是所述全量历史行为信息序列中距离当前时间最近且未被匹配过的历史行为信息，此处的未被匹配过是指该历史行为信息对应的媒体内容未与该目标兴趣对象匹配过。

在步骤S605中，判断所述第三历史行为信息对应的媒体内容与所述目标兴趣对象是否相匹配。

具体的，若判断的结果是所述第三历史行为信息对应的媒体内容与所述目标兴趣对象相匹配，则可以执行步骤S607；反之，若判断的结果是所述第三历史行为信息对应的媒体内容与所述目标兴趣对象不匹配，则可以执行步骤S611。

在步骤S607中，将所述第三历史行为信息确定为所述目标用户账户对应的目标历史行为信息。

在步骤S609中，判断所述目标用户账户对应的目标历史行为信息的当前数量是否达到预设数量阈值。

具体的，若判断的结果为目标用户账户对应的目标历史行为信息的当前数量未达到预设数量阈值，则可以执行步骤S611；反之，若判断的结果为目标用户账户对应的目标历史行为信息的当前数量达到预设数量阈值，可以结束处理，得到目标用户账户对应的目标历史行为信息序列。

在步骤S611中，判断所述全量历史行为信息序列中是否存在未与所述目标兴趣对象匹配过的历史行为信息。

具体的，若判断的结果为所述全量历史行为信息序列中存在未与所述目标兴趣对象匹配过的历史行为信息，则可以执行步骤S603至步骤S605；反之，若判断的结果为所述全量历史行为信息序列中不存在未与所述目标兴趣对象匹配过的历史行为信息，则可以执行步骤S601至步骤S605。

本公开实施例针对近期用户兴趣对象中多个兴趣对象，按照兴趣对象的显著性由高至低的顺序对目标用户的全量历史行为信息序列进行搜索直至得到预设序列长度的目标用户账户的目标历史行为信息序列，从而可以在确保预设序列长度的同时提高目标历史行为信息序列的兴趣显著性，进而有利于提高后续对于兴趣指标确定的效率和准确性。

在步骤S207中，通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标。

其中，兴趣指标表征目标用户账户对相应候选媒体内容的感兴趣程度，兴趣指标越大，则表明目标用户账户相应候选媒体内容越感兴趣。所述兴趣指标可以用于确定向所述目标用户账户推荐的候选媒体内容。

具体的实施中，兴趣指标预估模型可以是基于注意力(Attention)机制的CTR模型，例如可以是深度兴趣模型DIN(Deep Interest Network)或者DIEN(Deep InterestEvolution Network)等。对于兴趣指标预估模型的训练方式可以参见现有技术中的训练过程，本公开实施例对此不作具体限定。

基于注意力机制的CTR模型可以基于注意力机制对输入的目标用户账户的目标历史行为信息序列进行建模得到对应该行为信息序列的特征表达，其中，基于注意力机制对输入的目标用户账户的目标历史行为信息序列进行建模是指基于Transformer或者多头注意力(Multi-headAttention)对输入的目标用户账户的目标历史行为信息序列进行建模。在具体的实施中，可以使用基于Q(Query)K(Key)V(Value)的Attention方式，将候选媒体内容对应的特征的向量作为Query，将目标用户账户对应的目标历史行为信息序列作为Key和Value，以得到该目标用户账户对应的目标历史行为信息序列的特征表达，将该特征表达通过多层感知器(Multilayer Perceptron，MLP)进行预测即可得到目标用户账户对该候选媒体内容的兴趣指标输出。

在一个具体的实施方式中，兴趣指标预估模型可以如图7所示包括嵌入式向量编码(Embedding)层、多头注意力层、拼接层和MLP层，图7中以{b₁,…,b_i,…,b_k}表示目标用户账户对应的目标历史行为信息序列，以{c₁,…,c_j,…,c_n}表示候选媒体内容集合，其中，k为目标用户账户对应的目标历史行为信息序列的序列长度，b_i表示目标用户账户对应的目标历史行为信息序列中的目标历史行为信息，n为候选媒体内容集合中候选媒体内容的数量，c_j表示候选媒体内容集合中的候选媒体内容。

{b₁,…,b_i,…,b_k}通过嵌入式向量编码层进行嵌入式编码得到{e₁,…,e_i,…,e_k}，其中，e_i为b_i对应的嵌入式向量；候选媒体内容c_j通过嵌入式向量编码层进行嵌入式编码得到e′_j，将{e₁,…,e_i,…,e_k}和e′_j输入到多头注意力层确定{e₁,…,e_i,…,e_k}中每个对应的权重，然后基于该权重和{e₁,…,e_i,…,e_k}进行加权求和得到目标用户账户的近期兴趣表示h_k，通过拼接层将h_k与e′_j进行拼接得到拼接向量，该拼接向量输入到MPL层即可得到输出的目标用户账户对候选媒体内容c_j的兴趣指标。

实际应用中，在确定目标用户账户对候选媒体内容的兴趣指标时还可以考虑目标用户账户关联的其他信息作为兴趣指标预估模型的输入，例如还可以考虑目标用户账户的用户画像等信息，以进一步提高对于兴趣指标确定的准确性。

本公开实施例基于目标用户账户的近期兴趣对象搜索该目标用户账户的全量历史行为信息序列得到该目标用户账户对应的目标历史行为信息序列，进而基于该目标历史行为信息序列和已训练的兴趣指标预估模型，确定该目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标，从而即使针对一次媒体内容推荐请求的响应中涉及多个候选媒体内容，也仅需对GSU单元请求一次，大大降低了在兴趣指标预估中对于GSU的请求频次，提高了预估效率即用户兴趣的确定效率，进而提高了媒体内容的推荐效率；另外，由于基于用户账户的近期兴趣对象对全量历史行为信息序列进行搜索，从而使得确定的用户兴趣与用户账户的近期兴趣相符合，而不是很久以前已经变化的兴趣，提高了兴趣指标预估的准确性，进而保证了推荐的媒体内容符合用户近期的兴趣，提高了推荐的准确性。

在一个示例性的实施方式中，在得到目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标后，可以根据兴趣指标从候选媒体内容集合中选取兴趣指标最高的一个或者多个候选媒体内容，并将该选取的候选媒体内容推荐给该目标用户账户。

图8是根据一示例性实施例示出的一种媒体内容推荐装置的框图。参照图8，该媒体内容推荐装置800包括近期兴趣对象获取单元810、目标历史行为序列确定单元820和兴趣指标确定单元830，其中：

近期兴趣对象获取单元810，被配置为执行获取目标用户账户对应的近期兴趣对象；所述近期兴趣对象表征所述目标用户账户在当前时间之前的预设时长内感兴趣的媒体内容的类别；

目标历史行为序列确定单元820，被配置为执行确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列；

兴趣指标确定单元830，被配置为执行通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标；所述兴趣指标用于确定向所述目标用户账户推荐的候选媒体内容。

在一个示例性的实施方式中，所述装置800还包括：

近期行为序列获取单元，被配置为执行获取所述目标用户账户的近期历史行为信息序列，所述近期历史行为信息序列是指在当前时间之前的预设时长内所述目标用户针对媒体内容产生的行为信息序列；

在一个示例性的实施方式中，在所述近期兴趣对象包括多个兴趣对象的情况下，所述目标历史行为序列确定单元820，包括：

在一个示例性的实施方式中，所述目标历史行为序列确定单元820，还包括：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

在一个示例性的实施方式中，还提供了一种电子设备，包括处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行存储器上所存放的指令时，实现本公开实施例中提供的任意一种媒体内容推荐方法。

该电子设备可以是终端、服务器或者类似的运算装置，以该电子设备是服务器为例，图9是根据一示例性实施例示出的一种用于媒体内容推荐的电子设备的框图，如图9所示，该服务器900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(Central Processing Units，CPU)910(处理器910可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器930，一个或一个以上存储应用程序923或数据922的存储介质920(例如一个或一个以上海量存储设备)。其中，存储器930和存储介质920可以是短暂存储或持久存储。存储在存储介质920的程序可以包括一个或一个以上模块，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器910可以设置为与存储介质920通信，在服务器900上执行存储介质920中的一系列指令操作。服务器900还可以包括一个或一个以上电源960，一个或一个以上有线或无线网络接口950，一个或一个以上输入输出接口940，和/或，一个或一个以上操作系统921，例如WindowsServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

输入输出接口940可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器900的通信供应商提供的无线网络。在一个实例中，输入输出接口940包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口940可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

本领域普通技术人员可以理解，图9所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器900还可包括比图9中所示更多或者更少的组件，或者具有与图9所示不同的配置。

在一个示例性的实施方式中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器930，上述指令可由装置900的处理器910执行以完成上述方法。可选地，计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在一个示例性的实施方式中，还提供了一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现本公开实施例中提供的任意一种媒体内容推荐方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种媒体内容推荐方法，其特征在于，包括：

通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标；所述兴趣指标用于确定向所述目标用户账户推荐的候选媒体内容；

所述通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标，包括：

通过所述兴趣指标预估模型的嵌入式向量编码层对所述目标历史行为信息序列以及所述候选媒体内容分别进行嵌入式编码，得到所述目标历史行为信息序列对应的嵌入式编码向量序列以及所述候选媒体内容对应的嵌入式编码向量；

将所述目标历史行为信息序列对应的嵌入式编码向量序列以及所述候选媒体内容对应的嵌入式编码向量输入至所述兴趣指标预估模型的注意力层，确定所述嵌入式编码向量序列中的每个对应的权重，基于所述嵌入式编码向量序列中的每个对应的权重和所述嵌入式编码向量序列进行加权求和，得到所述目标用户账户的近期兴趣表示；

通过所述兴趣指标预估模型的拼接层将所述目标用户账户的近期兴趣表示和所述候选媒体内容对应的嵌入式编码向量进行拼接，得到拼接向量；将所述拼接向量输入至所述兴趣指标预估模型的多层感知层，得到输出的所述目标用户账户对所述候选媒体内容的兴趣指标。

2.根据权利要求1所述的媒体内容推荐方法，其特征在于，所述方法还包括：

获取所述目标用户账户的近期历史行为信息序列，所述近期历史行为信息序列是指在当前时间之前的预设时长内所述目标用户账户针对媒体内容产生的行为信息序列；

3.根据权利要求2所述的媒体内容推荐方法，其特征在于，所述根据所述近期历史行为信息序列中各历史行为信息对应的媒体内容，确定所述目标用户账户对应的近期兴趣对象，包括：

4.根据权利要求3所述的媒体内容推荐方法，其特征在于，所述方法还包括：

5.根据权利要求3所述的媒体内容推荐方法，其特征在于，所述方法还包括：

6.根据权利要求2所述的媒体内容推荐方法，其特征在于，所述根据所述近期历史行为信息序列中各历史行为信息对应的媒体内容，确定所述目标用户账户对应的近期兴趣对象，包括：

确定各所述媒体内容簇中媒体内容的数量；

7.根据权利要求6所述的媒体内容推荐方法，其特征在于，所述方法还包括：

8.根据权利要求1～7中任一项所述的媒体内容推荐方法，其特征在于，在所述近期兴趣对象包括多个兴趣对象的情况下，所述确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列，包括：

9.根据权利要求8所述的媒体内容推荐方法，其特征在于，所述方法还包括：

10.根据权利要求1～7中任一项所述的媒体内容推荐方法，其特征在于，在所述近期兴趣对象包括多个兴趣对象的情况下，所述确定所述目标用户账户对应的全量历史行为信息序列中，与所述近期兴趣对象相匹配的目标历史行为信息，得到所述目标用户账户对应的目标历史行为信息序列，包括：

11.根据权利要求10所述的媒体内容推荐方法，其特征在于，所述方法还包括：

12.一种媒体内容推荐装置，其特征在于，包括：

兴趣指标确定单元，被配置为执行通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标；所述兴趣指标用于确定向所述目标用户账户推荐的候选媒体内容；

其中，所述通过已训练的兴趣指标预估模型，根据所述目标用户账户对应的目标历史行为信息序列确定所述目标用户账户对候选媒体内容集合中各候选媒体内容的兴趣指标，包括：

13.根据权利要求12所述的媒体内容推荐装置，其特征在于，所述装置还包括：

14.根据权利要求13所述的媒体内容推荐装置，其特征在于，所述近期兴趣对象确定单元，包括：

15.根据权利要求14所述的媒体内容推荐装置，其特征在于，所述近期兴趣对象确定单元，还包括：

16.根据权利要求14所述的媒体内容推荐装置，其特征在于，所述近期兴趣对象确定单元，还包括：

17.根据权利要求13所述的媒体内容推荐装置，其特征在于，所述近期兴趣对象确定单元，包括：

18.根据权利要求17所述的媒体内容推荐装置，其特征在于，所述近期兴趣对象确定单元，还包括：

19.根据权利要求12～18中任一项所述的媒体内容推荐装置，其特征在于，在所述近期兴趣对象包括多个兴趣对象的情况下，所述目标历史行为序列确定单元，包括：

20.根据权利要求19所述的媒体内容推荐装置，其特征在于，所述目标历史行为序列确定单元，还包括：

21.根据权利要求12～18中任一项所述的媒体内容推荐装置，其特征在于，在所述近期兴趣对象包括多个兴趣对象的情况下，所述目标历史行为序列确定单元，包括：

22.根据权利要求21所述的媒体内容推荐装置，其特征在于，所述目标历史行为序列确定单元，还包括：

23.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至11中任一项所述的媒体内容推荐方法。

24.一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至11中任一项所述的媒体内容推荐方法。