CN109511015B - 多媒体资源推荐方法、装置、存储介质及设备 - Google Patents

多媒体资源推荐方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN109511015B
CN109511015B CN201810908843.XA CN201810908843A CN109511015B CN 109511015 B CN109511015 B CN 109511015B CN 201810908843 A CN201810908843 A CN 201810908843A CN 109511015 B CN109511015 B CN 109511015B
Authority
CN
China
Prior art keywords
user
resource
data
resource set
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810908843.XA
Other languages
English (en)
Other versions
CN109511015A (zh
Inventor
袁一帆
卢靓妮
冷冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810908843.XA priority Critical patent/CN109511015B/zh
Publication of CN109511015A publication Critical patent/CN109511015A/zh
Application granted granted Critical
Publication of CN109511015B publication Critical patent/CN109511015B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Abstract

本发明公开了一种多媒体资源推荐方法、装置、存储介质及设备,属于互联网技术领域。方法包括:确定第一用户在第一时间段内播放过的至少一个资源集合,每个资源集合中包括至少一个资源片段;获取与至少一个资源集合匹配的用户数据,用户数据包括第一用户在第一时间段内对每个资源集合的播放行为数据和第一用户的播放行为数据的第一平均数据;基于用户数据生成第一用户的活跃资源列表;基于活跃资源列表,向第一用户进行多媒体资源推荐。本发明生成的活跃资源列表能够真实反映用户对各个资源集合的感兴趣程度,在依据该活跃资源列表进行多媒体资源推荐时推荐精准度高。

Description

多媒体资源推荐方法、装置、存储介质及设备
技术领域
本发明涉及互联网技术领域,特别涉及一种多媒体资源推荐方法、装置、存储介质及设备。
背景技术
随着互联网技术的飞速发展,时下各大网站均致力于如何高效且精准地向用户进行多媒体资源推荐,以提升用户体验。其中,前述多媒体资源既可涵盖综艺节目、电视剧、动漫、纪录片等视频资源,也可涵盖小说、文章等文本资源、以及音频资源。
以视频为例,相关技术在进行视频推荐时,常常基于用户的追剧列表实现,追剧列表中示出了用户当前正在追的剧集,即推荐方式是向用户推荐与当前正在追的剧集相关的一些视频。其中,在获取用户的追剧列表时,时下通常基于以下方式实现:按照最近一次播放时间由近及远的顺序,将用户在一段时间内观看过的剧集进行排序,之后依据排序结果选取部分剧集作为用户当前正在追的剧集。比如,用户最近1个月内观看过3个剧集,剧集A的最近一次播放时间为1天前、剧集B的最近一次播放时间为2天前、剧集C的最近一次播放时间为10天前,则可选择将剧集A和剧集B确定为用户当前正在追的剧集。
针对上述推荐方式,在生成追剧列表时衡量标准主要依据最近一次播放时间,因素较为单一,会存在生成的追剧列表不能真实反映用户当前在追剧集的情况,这会导致后续在依据追剧列表进行多媒体资源推荐时推荐精准度较差。
发明内容
本发明实施例提供了多媒体资源推荐方法、装置、存储介质及设备,能够显著提升多媒体资源的推荐精准度,所述技术方案如下:
一方面,提供了一种多媒体资源推荐方法,所述方法包括:
确定第一用户在第一时间段内播放过的至少一个资源集合,每个所述资源集合中包括至少一个资源片段;
获取与所述至少一个资源集合匹配的用户数据,所述用户数据包括所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据和所述第一用户的播放行为数据的第一平均数据;
基于所述用户数据生成所述第一用户的活跃资源列表,所述活跃资源列表中包括所述至少一个资源集合中处于用户活跃状态的资源集合;
基于所述活跃资源列表,向所述第一用户进行多媒体资源推荐。
另一方面,提供了一种多媒体资源推荐装置,所述装置包括:
确定模块,用于确定第一用户在第一时间段内播放过的至少一个资源集合,每个所述资源集合中包括至少一个资源片段;
获取模块,用于获取与所述至少一个资源集合匹配的用户数据,所述用户数据包括所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据和所述第一用户的播放行为数据的第一平均数据;
生成模块,用于基于所述用户数据生成所述第一用户的活跃资源列表,所述活跃资源列表中包括至少一个资源集合中处于用户活跃状态的资源集合;
推荐模块,用于基于所述活跃资源列表,向第一用户进行多媒体资源推荐。
另一方面,提供了一种存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述的多媒体资源推荐方法。
另一方面,提供了一种多媒体资源推荐设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述的多媒体资源推荐方法。
本发明实施例提供的技术方案带来的有益效果是:
在向一个用户进行多媒体资源推荐时,本发明实施例从该用户针对每个已播放资源集合、该用户针对全部已播放资源集合等多个维度来获取用户数据,之后,基于多维度的用户数据来生成活跃资源列表,由于在生成追剧列表时衡量标准遍及多维度,所以生成的活跃资源列表能够真实反映该用户当前对各个已播放资源集合的感兴趣程度,因此后续在依据该活跃资源列表进行多媒体资源推荐时,会大幅提升推荐精准度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种多媒体资源推荐方法所涉及的实施环境的示意图;
图2是本发明实施例提供的一种显示界面的示意图;
图3是本发明实施例提供的一种多媒体资源推荐方法的流程图;
图4是本发明实施例提供的一种多媒体资源推荐方法的执行流程示意图;
图5是本发明实施例提供的一种多媒体资源推荐装置的结构示意图;
图6是本发明实施例提供的一种多媒体资源推荐设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例进行详细地解释说明之前,先对本发明实施例涉及到的一些名词进行解释说明。
资源集合:其可覆盖电视剧、综艺节目、动漫、系列电影、系列纪录片等视频资源,也可覆盖小说或文章等文本资源,还可覆盖音频资源,本发明实施例对此不进行具体限定。举例来说,一部已完结的电视剧、一部未完结的动画片均可称之为一个资源集合。
其中,一个资源集合通常由多个相关的资源片段组成,相关的含义通常为多个资源片段的主题相关,比如,组成一部电视剧的各个剧集之间便主题相关,例如一部电视剧中的各个剧集均对应“电视剧A”这一主题。
以视频资源为例,一个资源集合也可称之为一个视频专辑,相应地,一个视频专辑由多个相关的视频组成。另外,本发明实施例还为每一个资源集合分别分配了一个可唯一标识其身份的标识,在本文中将这个标识称之为cid。
需要说明的是,对于未完结的资源集合,通常会周期性地进行更新,根据资源集合的类型不同,其更新周期通常也不同。比如电视剧这类资源集合通常一天更新一次,而综艺节目这类资源集合通常一周更新一次。
其中,资源集合在进行一次更新时,既有可能更新一个资源片段,也有可能更新多个资源片段。
资源片段:多个资源片段构成了一个资源集合。
当资源集合针对视频资源时,一个资源片段可能指代一集电视剧或一集综艺节目;当资源集合针对文本资源时,一个资源片段可能指代一个小说章节,本发明实施例对此不进行具体限定。
另外,以资源集合为视频资源为例,组成该资源集合的各个资源片段之间既可以时长相同,也可以时长不同。
追剧行为:通常针对视频资源而言,追剧行为指代用户持续观看资源集合的一种行为。比如,每当一个资源集合中存在新更新的资源片段时,用户便在后续的某个时间段观看该更新的资源片段。
用户画像:可以简单理解为用户的标签,用户画像是真实用户的虚拟代表, 是建立在一系列真实数据之上的用户模型。
即,用户画像是真实用户的虚拟代表,通过对用户的一系列行为或属性进行分析完成用户建模,从而构成能够体现不同用户的个性化的用户画像。其中,本发明实施例构建与用户的追剧行为相关的用户画像。
长视频:在本发明实施例中,将播放时间长度大于指定阈值的视频称之为长视频。其中,指定阈值的取值可为5分钟或10分钟等,本发明实施例对此不进行具体限定。
短视频:在本发明实施例中,将播放时间长度小于上述指定阈值的视频称之为短视频。
播放行为:在本发明实施例中,当资源集合针对视频资源或音频资源时,播放行为即指代用户观看视频或收听音频时所产生的相关行为;当资源集合针对文本资源时,播放行为即指代用户浏览或阅读文本所产生的相关行为。
以视频资源为例,针对一个视频专辑来说,用户对该视频专辑的播放行为包括但不限于:播放了该视频专辑中的多少个视频、每个视频播放了多长时间、最近一次的播放时间、平均每个视频播放了多长时间、用户当前的播放进度(也可称之为追剧进度)、平均每天看了多少个视频和播放行为覆盖的小时数等等。其中,上述播放行为在本文中也称之为播放行为指标。
活跃资源列表:该列表中示出了至少一个处于用户活跃状态的资源集合,其中,用户活跃状态反映了用户对一个资源集合的感兴趣程度或喜好程度。
另外,该列表中还可示出各个资源集合处于用户活跃状态的概率值。其中,概率值越大,表明用户对相应的资源集合越感兴趣,那么用户后续继续播放这个资源集合的可能性也越大。
换一种表达方式,以视频资源为例,上述活跃资源列表也可称之为追剧列表,该追剧列表中示出了用户可能在追的视频专辑,且给出了用户对不同视频专辑的追剧概率。
本发明实施例提出了一种多媒体资源推荐方法,该种推荐方法在向用户进行多媒体资源推荐时,推荐基准是上述提到的用户的活跃资源列表,即基于该活跃资源列表完成向用户进行多媒体资源推荐。以视频资源为例,用户在观看电视剧或综艺节目等时,通常会随着电视剧或综艺节目的更新而产生持续的追剧行为,本发明实施例通过对用户的追剧行为进行统计生成追剧列表,进而基于该追剧列表完成相关的多媒体资源的推荐。
下面对本发明实施例提供的多媒体资源推荐方法所涉及的实施环境进行介绍说明。参见图1,该实施环境中包括终端101和服务器102。
其中,终端101的类型包括但不限于:智能手机、平板电脑、笔记本电脑、台式电脑等固定式或移动式电子设备。另外,为了在终端101上实现多媒体资源播放,终端101上通常还安装有相关应用,相关应用可为视频播放应用、音频播放应用或电子书阅读器等,本发明实施例对此不进行具体限定。
在本发明实施例中,终端101负责通过上述应用收集用户数据,其中,该用户数据记录了用户对已播放的多媒体资源的播放行为;另外,终端101还负责将收集到的用户数据上报给服务器102;示例性地,终端101可以日志的形式向服务器上报用户数据,本发明实施例对此不进行具体限定。
服务器102用于基于终端101收集到的用户数据来为各个用户生成对应的活跃资源列表,进而服务器102再基于各个用户的活跃资源列表来完成向各个用户进行多媒体资源推荐。
需要说明的第一点是,服务器102在推荐多媒体资源时,可基于活跃资源列表采取协同过滤方式完成推荐,本发明实施例对此不进行具体限定。且,服务器102可将推荐的多媒体资源的相关标识信息下发给终端101,进而由终端101基于相关标识信息来展示推荐的多媒体资源。
其中,推荐的多媒体资源的数目可为一个或多个,标识信息可涵盖标题信息、图像信息等,本发明实施例对此不进行具体限定。以推荐视频资源为例,则标识信息可覆盖视频的标题、视频的封面帧或关键帧等。而终端101在进行显示时可通过上述相关应用实现,比如显示诸如图2所示的推荐页面。
需要说明的第二点是,本发明实施例为了使得活跃资源列表能够真实反映用户当前对多媒体资源的感兴趣程度,会基于多维度的用户数据生成活跃资源列表,这样后续在依据活跃资源列表进行多媒体资源推荐时,能够大幅提高推荐精准度。
以一个用户为例,多维度的用户数据主要由下面几种类型的数据构成:
a、该用户一段时间内对播放过的各个资源集合的播放行为数据;
其中,该数据用于描述该用户对每个已播放资源集合的感兴趣程度,记录了该用户在一段时间内对每个已播放资源集合的播放行为。
以视频资源为例,该数据描述了该用户的追剧强度。示例性地,若该视频资源为电视剧,则追剧强度可从用户平均每天看了多少集、每集的平均完成度、播放行为覆盖的小时数以及用户当前的追剧进度和当前的更新进度之间的差值等角度来表达。
b、步骤a中各个资源集合的播放行为数据的平均数据。
该数据用于描述该用户对全部已播放资源集合的一个平均行为水平,即汇总该用户针对全部已播放资源集合的播放行为数据,然后对这些播放行为数据进行平均计算,获得该用户播放行为的一个基准线。
示例性地,假设该用户最近一个月内观看过5部电视剧,每部电视剧每天平均观看的集数分别为1集、2集、3集、4集和5集,那么该用户在该段时间内平均每天观看的集数3,即可用于描述该用户每天观看集数的一个平均水平。
需要说明的是,为了获取上述平均数据,还需先收集同等时间内该用户对全部已播放资源集合的播放行为数据。
另外,通过这项数据也可关注到用户的特殊播放行为。例如针对跳看最后一集再从头开始看这样的模式,本发明实施例能根据用户类似的历史行为,来判断用户还有概率在追该剧。
c、对于每一个已播放资源集合,获取同等时间内除该用户之外播放过该资源集合的其他用户的播放行为数据。
同步骤b中一个用户针对多个资源集合的方式不同,本步骤是一个资源集合针对多个用户,基于本步骤获取到的数据,可用来描述该资源集合在用户侧的平均表现水平。
比如,可汇总全部用户针对该资源集合的播放行为数据,然后对这些播放行为数据进行平均计算,获得该资源集合在用户侧的一个平均播放行为。示例性地,假设1部电视剧最近一个月内5个用户观看过,各自的观看时长分别为1 小时、2小时、3小时、4小时和5小时,那么5个用户的平均观看时长3小时即可用于描述该部电视剧在用户侧的一个平均播放时长。
综上所述,本发明实施例基于上述用户数据能够生成精准的活跃资源列表,进而在基于该活跃资源列表向用户推荐多媒体资源时,也能够保持较高的精准度,其中,关于活跃资源列表的具体生成过程描述以及具体的资源推荐过程描述还请参见下述实施方式。
图3是本发明实施例提供的一种多媒体资源推荐方法的流程图。该方法的交互主体为终端和服务器,该终端可以是图1所示的终端101,该服务器可以是图1所述的服务器102。如图3所示,本发明实施例提供的方法流程包括:
301、服务器确定第一用户在第一时间段内播放过的至少一个资源集合。
在本发明实施例中,第一用户泛指待进行多媒体资源推荐的任意一个用户。举例来说,假设一个视频应用的用户访问量为5千万,则这5千万用户均可作为待推荐对象,其中任意一个对象均可称之为第一用户。
其中,第一时间段的时长可为一个星期、半个月或一个月等,本发明实施例对此不进行具体限定。比如,可确定第一用户最近一个星期、最近半个月或最近一个月内播放过的资源集合。另外,为了确保推荐精准度,上述至少一个资源集合通常指点的是第一用户播放过的全部资源集合。
需要说明的第一点是,服务器通常会以日志的形式收集并存储第一用户对资源集合的播放行为,因此通过获取第一用户在第一时间段内生成的日志,即可获知第一用户在第一时间段内播放过的全部资源集合。
其中,服务器在进行日志收集时,收集粒度可以天为单位或以星期为单位等,本发明实施例对此同样不进行具体限定。
需要说明的第二点是,由于本发明实施例是基于用户对多媒体资源的持续播放行为来进行资源推荐,所以服务器仅需确定第一用户播放过的资源集合,且如前文所述,每一个资源集合中通常包括多个资源片段,即一个资源集合通常是由多个资源片段组成。
302、服务器获取与至少一个资源集合匹配的用户数据,该用户数据至少包括第一用户在第一时间段内对每个资源集合的播放行为数据、第一用户的播放行为数据的第一平均数据和第二用户在第一时间段内对每个资源集合的播放行为数据。
其中,上述第一用户在第一时间段内对每个资源集合的播放行为数据在本文中也简称为第一用户的播放行为数据。
在本发明实施例中,服务器通过对第一用户在第一时间段内的日志进行整理和聚合,便可获知第一用户在这段时间内的播放行为,即获取到与播放过的资源集合匹配的用户数据。其中,用户数据通常由下述三部分构成:
(一)、第一用户在第一时间段内对每个资源集合的播放行为数据。
针对该部分数据,其描述的是第一用户对各个资源集合的感兴趣程度。其中,该部分数据包括但不限于下述几种播放行为指标,即可从下述几个角度来衡量第一用户对各个资源集合的感兴趣程度。
需要说明的是,下述是以一个资源集合为例进行说明,即获取第一用户在第一时间段内对该资源集合的播放行为数据,而第一用户在第一时间段内对该资源集合的播放行为数据至少包括下述步骤a至e中的数据,针对其他资源集合来说,播放行为数据的组成一致。
a、对于该资源集合,获取第一用户在第一时间段内单位时间平均播放的资源片段的数量。
其中,单位时间的取值通常为1天,当然,单位时间的取值还可为3天或7 天等,本发明实施例对此不进行具体限定。
以资源集合为电视剧A为例,假设第一时间段为最近一个月且单位时间为1 天,则本步骤获取的是第一用户在最近一个月内平均每天看电视剧A多少集。另外,若电视剧A已经完结,则第一用户每天观看的集数越多,说明第一用户对电视剧A越感兴趣。
b、获取第一用户在第一时间段内对该资源集合中各个资源片段的平均播放完成度。
针对一个资源片段来说,该资源片段的播放完成度可通过第一用户的播放时长与该资源片段的总时长的比值来描述。
假设一个资源片段的总时长为60分钟,第一用户观看了该资源片段30分钟,则第一用户对该资源片段的播放完成度为50%。
相应地,平均播放完成度则是对该资源集合中包括的全部资源集合的播放完成度进行了均值计算,比如一个资源集合中包括3个资源片段,这3个资源片段的播放完成度分别为40%、50%和60%,则这3个资源片段的平均播放完成度即为50%。
需要说明的是,本发明实施例后续会将每个资源片段的平均播放完成度与第一用户的自身习惯作对比,示例性地,以资源集合为电视剧为例,有的用户喜欢完整地观看一集电视剧,而有些用户喜欢跳着观看电视剧,所以该用户对该电视剧的每集平均播放完成度,还需和该用户对全部观看过的电视剧的每集平均播放完成度作对比,这样更能真实反映用户对这个剧的感兴趣程度。
c、获取第一用户在第一时间段内对该资源集合的播放完成度。
针对一个资源集合来说,该资源集合的播放完成度可通过第一用户播放资源片段数量与该资源集合包括的资源片段总数量的比值来描述。
假设一个电视剧的总集数为50,第一用户观看了其中30集,则第一用户对该资源集合的播放完成度为60%。
d、获取第一用户在第一时间段内播放各个资源片段的耗时。
这个耗时也可称之为播放行为覆盖的时长,其获取方式可为:从日志中提取这个资源集合的播放记录,获取播放记录上记录的播放行为覆盖的小时数。
其中,这个耗时也能反映用户对该资源集合的感兴趣程度。举例来说,假设一个用户看完了2集电视剧,但是分散在4个小时断断续续完成的,而另外一用户2个小时便看完了2集电视剧,则明显2个小时看完2集电视剧的用户更能被这个电视剧所吸引,即对这个电视剧更感兴趣。
e、获取第一用户的当前播放进度与资源集合的当前更新进度之间相差的资源片段数量。
其中,这项数据主要针对更新中的资源集合而言,且当前播放进度与当前更新进度之间相差的数量越少,表明第一用户对该资源集合越感兴趣。
以资源集合为电视剧为例,则对于更新中的电视剧而言,第一用户的追剧进度和剧集更新进度之前的差值更能反应第一用户的追剧强度。
举例来说,假设电视剧A当前更新到了20集,若用户A观看到了第19集,而用户B观看到了第15集,则明显用户A更能被这个电视剧所吸引,即对这个电视剧更感兴趣。
(二)、第一用户的播放行为数据的第一平均数据。
针对第一用户在第一时间段内观看过的全部资源集合,服务器通过将每个资源集合中相同播放行为指标的属性值进行均值计算,即可得到第一平均数据。其中,这里提及的相同播放行为指标的属性值是与第一用户和第一时间段匹配的,即针对的是第一用户在第一时间段内的播放行为。
举例来说,假设第一用户在最近一个月内播放过3个资源集合,以资源集合的播放完成度这一播放行为指标为例,若资源集合1的播放完成度为30%,即针对资源集合1播放完成度这一播放行为指标的属性值为30%,若资源集合2的播放完成度为20%,即针对资源集合1播放完成度这一播放行为指标的属性值为 20%,若资源集合3的播放完成度为40%,即针对资源集合1播放完成度这一播放行为指标的属性值为40%,则该播放行为指标的均值即为30%,说明第一用户在最近一个月内对于每一个已播放资源集合平均观看了30%。
针对其他播放行为指标来说,可采取类似方式来完成均值计算。
综上所述,本步骤获取到的数据用于描述第一用户对第一时间段内全部已播放资源集合的一个平均行为水平,即获得第一用户播放行为的一个基准线。
示例性地,获取这一数据的好处包括:针对同一个电视剧,假设用户A的每集平均播放完成度为40%,但是用户A针对全部资源集合的每集平均播放完成度为30%,用户B的每集平均播放完成度为70%,但是用户B针对全部资源集合的每集平均播放完成度为80%,通过平均行为水平这一基准线明显可以获取用户 A相较于用户B而言对于这个电视剧的兴趣度更高。
在另一个实施例中,服务器还可获取第一用户的用户属性信息,比如年龄、性别、所在地区、职业等,将用户属性信息也作为用户数据一并获取,本发明实施例对此不进行具体限定。
(三)、第二用户在第一时间段内对每个资源集合的播放行为数据。
其中,对于上述至少一个资源集合中的任意一个资源集合,第二用户指代除了第一用户之外播放过该资源集合的用户。举例来说,假设一个资源集合共 10个用户观看过,第一用户占据一个名额,则剩下的9个用户在本发明实施例中均以第二用户进行统称。
需要说明的是,下述是以第二用户播放过的一个资源集合为例进行说明,即获取第二用户在第一时间段内对该资源集合的播放行为数据,而第二用户在第一时间段内对该资源集合的播放行为数据至少包括下述步骤a至e中的数据,针对第二用户播放过的其他资源集合来说,播放行为数据的组成一致。
针对该部分数据,其描述的是第二用户对该资源集合的感兴趣程度。其中,该部分数据包括但不限于下述几种播放行为指标,即可从下述几个角度来衡量第二用户对该资源集合的感兴趣程度。
a、获取第二用户在第一时间段内单位时间平均播放的资源片段的数量。
b、获取第二用户在第一时间段内对该资源集合中各个资源片段的平均播放完成度,
c、获取第二用户在第一时间段内对该资源集合的播放完成度。
d、获取第二用户在第一时间段内播放各个资源片段的耗时。
e、获取第二用户的当前播放进度与资源集合的当前更新进度之间相差的资源片段数量。
对于上述步骤a至e可参考前述第一用户的播放行为数据的描述。
303、服务器基于用户数据生成第一用户的活跃资源列表,该活跃资源列表中包括至少一个资源集合中处于用户活跃状态的资源集合。
其中,基于用户数据生成第一用户的活跃资源列表时,至少包括以下步骤:
303a、对于每个资源集合,将第一用户在第一时间段内对该资源集合的播放行为数据和第二用户在第一时间段内对该资源集合的播放行为数据进行均值计算,得到与该资源集合对应的播放行为数据的第二平均数据。
本步骤获取到的数据用于描述播放过某一资源集合的全部用户对该资源集合的一个平均表现水平。
举例来说,假设资源集合M在最近一个月内被3个用户播放过,以资源集合的播放完成度这一播放行为指标为例,若用户1对该资源集合的播放完成度为30%,用户2对该资源集合的播放完成度为20%,用户3对该资源集合的播放完成度为40%,则对于该资源集合来说,在最近一个月内的人均播放完成度即为30%,说明人均在最近一个月内对资源集合M平均观看了30%。
针对其他播放行为指标来说,可采取类似方式来完成均值计算。
303b、基于第一用户在第一时段内对每个资源集合的播放行为数据、第一平均数据以及第二平均数据,生成第一用户的活跃资源列表。
本发明实施例会对上述数据进行特征预处理,处理为离散化的特征数据,进而基于构建的数据模型来为用户生成活跃资源列表。
针对特征预处理过程,本发明实施例将取值分布在在0~1的数据,例如播放完成度等,离散化为0~9共10个分类。假设一集电视剧的播放完成度为23.4%,则可将其归为第2个分类,比如离散化为取值2,另一集电视剧的播放完成度为 33.4%,则可将其归为第3个分类,比如离散化为取值3等等;对于地区、性别、职业等用户属性信息也可进行离散化。比如性别为男,则置为数值1,性别为女,则置为数值2;另外,各种类型的数据均可进行特征离散化,比如所有取值类别小于10个的数据均进行上述特征离散化,本发明实施例对此不进行具体限定。
另外,在对用户数据进行处理得到离散化的特征数据后,可将离散化的特征数据存储为稀疏向量,并将该稀疏向量输入训练好的目标数据模型中,进而获取用户的活跃资料列表。其中,目标数据模型会输出每个资源集合在目标时长范围内处于用户活跃状态的概率值;之后,通过对获取到的概率值进行排序,便可基于得到的排序结果生成活跃资源列表。
其中,可对输出的概率值进行由大到小的排序,并基于排序在前第一数目位的资源集合来生成活跃资源列表。即,本发明实施例可选择topN的生成列表方式。其中,第一数目即N的取值可为5、10、20、30等,本发明实施例对此不进行具体限定。
在另一个实施方式中,考虑到通常情况下的多媒体资源的更新周期,目标时长范围可能会有多个取值,比如目标时长范围为未来1天或未来1个星期,即服务器预测未来1天或未来1个星期用户对各个已播放资源集合的活跃程度。以视频资源为例,即服务器需要预测用户在未来一段时间内是否继续观看第一时间段内已观看过的各个视频专辑。当然,目标时长范围还可为其他取值,本发明实施例对此不进行具体限定。
下面对目标数据模型的训练过程进行解释说明。
在本发明实施例中,同样是基于与用户关联的历史播放行为数据来进行模型训练。需要说明的是,考虑到不同类型的多媒体资源的更新周期的不同,本发明实施例会训练多个数据模型,即数据模型的个数与更新周期的数量相关,比如更新周期有几种,数据模型便有几个。示例性地,由于时下多媒体资源的更新周期多为天更或周更,因此可训练两个数据模型,其中一个数据模型用来预测用户未来1天内对各个已播放过的资源集合的活跃程度,另一个数据模型用来预测用户未来7天内对各个已播放过的资源集合的活跃程度。
以训练两个数据模型为例,若其中一个数据模型的预测范围为第一时长范围,即目标时长范围为第一时长范围,则训练过程可描述为如下步骤:
303b-1、获取第一训练样本数据。
其中,第一训练样本数据中包括第一用户在第二时间段内播放过的资源集合的用户数据,以及与该资源集合匹配的特征标签信息。
需要说明的第一点是,第二时间段与第一时间段的时间跨度相同,但是具体的日期不同。以第一时长范围为未来1天为例,则第一时间段可为7月2号至7月16号,第二时间段可为7月1号至7月15号,即第二时间段早于第一时间段。
需要说明的第二点是,特征标签信息表示第一用户在第一时长范围内是否播放过对应的资源集合。比如播放过则特征标签信息的取值为1,未播放过则特征标签信息的取值为0。
303b-2、基于第一训练样本数据对初始的数据模型进行训练,得到第一数据模型。
在本发明实施例中,初始的数据模型可为基于梯度提升的决策树模型,本发明实施例对此不进行具体限定。
示例性地,以第一时长范围为未来1天,当前为7月16号为例,则可采用 7月第1天至第15天的用户数据来做特征数据,而在第16天的用户数据中提取特征标签信息,进而基于这些数据来训练数据模型。之后,将7月第2天至第 16天的用户数据输入训练好的数据模型,从而预测未来1天即7月17号用户对各个已播放资源集合的活跃程度。
若另一个数据模型的预测范围为第二时长范围,即目标时长范围为第二时长范围,则训练过程可描述为如下步骤:
303b-3、获取第二训练样本数据。
其中,第二训练样本数据中包括第一用户在第三时间段内播放过的资源集合的用户数据,以及与该资源集合匹配的特征标签信息。
需要说明的第一点是,第二时长范围大于第一时长范围,第三时间段与第二时间段的时间跨度相同,但是具体的日期不同。以第一时长范围为未来1天、第二时长范围为未来1个星期为例,若当前为7月16号,则第二时间段可为7 月1号至7月15号,第三时间段可为6月25号至7月9号,即第二时间段早于第一时间段。
需要说明的第二点是,特征标签信息表示第一用户在第二时长范围内是否播放过对应的资源集合。
303b-4、基于第二训练样本数据对初始的数据模型进行训练,得到第二数据模型。
示例性地,以第二时长范围为未来7天,当前为7月16号为例,则可采用 6月25号至7月9号这15天的用户数据来做特征数据,而在7月10号至7月 16号的用户数据中提取特征标签信息,进而基于这些数据来训练数据模型。之后,将7月第2天至第16天的用户数据输入训练好的数据模型,从而预测未来1天即7月17号至7月23号这段时间内用户对各个已播放资源集合的活跃程度。
在另一个实施方式中,上述第一数据模型和第二数据模型构成了前述的目标数据模型,可将前述的稀疏向量分别输入第一数据模型和第二数据模型,之后,通过对两个数据模型输出的概率值进行汇总并排序,即可得到针对特定用户的活跃资源列表。
304、服务器基于该活跃资源列表,获取待向第一用户推荐的多媒体资源。
在本发明实施例中,如表1所示,活跃资源列表可以第一用户的身份标识作为用户画像的key(键),而以各个资源集合的cid作为value(值),其中,各个资源集合在活跃资源列表中的位置是按照各自对应的概率值确定的,比如最可能处于用户活跃状态的资源集合排在首位。其中,第一用户的身份标识可为第一用户使用的终端的MAC(Medium AccessControl,介质访问控制)地址、也可为第一用户登录相关应用所使用的账号信息,其中相关应用为提供多媒体资源并支持多媒体资源播放的应用,本发明实施例对此不进行具体限定。
表1
Figure GDA0001805270950000141
Figure GDA0001805270950000151
其中,本发明实施例在基于活跃资源列表向第一用户进行多媒体资源推荐时,可针对活跃资源列表中的部分资源集合完成,比如仅针对排在前几位的资源集合完成推荐,示例性地,推荐模式可采取协同过滤,本发明实施例对此不进行具体限定。以协同过滤为例,推荐方式包括但不限于下述两种:
方式一、基于cid相关的协同过滤
针对该种方式,cid相关的含义通常为主题信息相同,可确定与活跃资源列表中排在前第二数目位的资源集合具有相同主题信息的多媒体资源,将这些多媒体资源推荐给第一用户。其中,第二数目的取值可为3或5或10等,本发明实施例对此不进行具体限定。
以电视剧A排在活跃资源列表首位为例,则在进行多媒体资源推荐时,可选择将电视剧A的花絮视频、精彩片段视频、主题曲视频等推荐给第一用户。
方式二、基于共同兴趣的协同过滤
针对该种方式,可确定播放过活跃资源列表中资源集合的第二用户的其他已播放多媒体资源,并向第一用户推荐其他已播放多媒体资源。
举例来说,若用户A和用户B都观看过肖申克的救赎这部影片,则若用户B 还观看了教父这部影片,则服务器认为用户A可能也会对教父这部影片感兴趣,并推荐给用户A。
305、服务器向第一用户的终端发送推荐的多媒体资源。
服务器可将推荐的多媒体资源的相关标识信息下发给第一用户的终端,进而由该基于相关标识信息来展示推荐的多媒体资源。其中,推荐的多媒体资源的数目可为一个或多个,而标识信息可涵盖标题信息、图像信息等,本发明实施例对此不进行具体限定。以推荐视频资源为例,则标识信息可覆盖视频的标题、视频的封面帧或关键帧等。而该终端在进行显示时可通过上述相关应用实现,比如显示诸如图2所示的推荐页面。
综上所述,本发明实施例至少具有下述有益效果:
在向一个用户进行多媒体资源推荐时,本发明实施例从该用户针对每个已播放资源集合、该用户针对全部已播放资源集合、以及播放过相同资源集合的全部用户等多个维度来获取用户数据,之后,基于多维度的用户数据来生成活跃资源列表,由于在生成追剧列表时衡量标准遍及多维度,比如在为一个用户生成活跃资源列表时,还考虑到了多媒体资源的更新周期不同、类型不同等情况,所以生成的活跃资源列表能够真实反映该用户当前对各个已播放资源集合的感兴趣程度,因此后续在依据活跃资源列表进行多媒体资源推荐时,会大幅提升推荐精准度。
即,针对不同类型不同更新周期的资源集合,本发明实施例均能完成对其在未来一段时间内是否处于用户活跃状态的预测,且,本发明实施例还能够给出各个资源集合处于用户活跃状态的概率值,因此可方便比较用户当前最感兴趣的资源集合,即可方便衡量用户对于不同资源集合的热衷程度。
在另一个实施方式中,参见图4所示的整体执行流程图,本发明实施例提供的多媒体资源推荐方法包括:
401、服务器通过日志收集用户对资源集合的播放行为,获取到用户播放行为日志。其中,日志可按天收集,本发明实施例对此不进行具体限定。
402、服务器聚合用户一段时间内对资源集合的播放行为,获取到该用户的用户数据。如前文,该用户数据至少包括用户该段时间内对每个资源集合的播放行为数据、该用户在该段时间内的播放行为数据的平均数据和其他用户在该段时间内对上述资源集合的播放行为数据。
403、服务器对获取到的用户数据进行特征预处理,得到特征数据。
404、服务器将获取到的特征数据输入到训练好的数据模型中,得到每个资源集合在未来一段时间内处于用户活跃状态的概率。
其中,数据模型可基于另一段时间内的特征数据以及相应的特征标签信息来训练,具体训练过程可参见前文相关部分的描述。
405、服务器基于数据模型输出的各个资源集合处于用户活跃状态的概率,为该用户生成活跃资源列表。
406、服务器基于活跃资源列表向用户进行多媒体资源推荐。
结合图4,下面以追剧为例,对上述流程进行举例说明。
1、服务器收集用户对视频专辑的观看行为,获取到用户观看行为日志。
2、对于每个用户,服务器聚合该用户一段时间内对视频专辑的观看行为,获取到该用户的用户数据。
3、服务器对获取到的用户数据进行特征预处理,得到特征数据。
4、服务器将获取到的特征数据输入到训练好的数据模型中,得到该用户在未来一段时间内对各个视频专辑的追剧概率。
5、服务器基于数据模型输出的该用户对各个视频专辑的追剧概率,为该用户生成追剧列表。
6、服务器基于追剧列表向用户进行视频推荐。
其中,推荐的视频既可以为长视频,也可以为短视频,本发明实施例对此不进行具体限定。示例性地,本发明实施例可基于用户观看的长视频,来为用户推荐周边的短视频,即本发明实施例默认用户在追剧过程中,也会愿意消费在追剧集的周边视频。
图5是本发明实施例提供的一种多媒体资源推荐装置的结构示意图。参见图5,该装置包括:
确定模块501,用于确定第一用户在第一时间段内播放过的至少一个资源集合,每个所述资源集合中包括至少一个资源片段;
获取模块502,用于获取与所述至少一个资源集合匹配的用户数据,所述用户数据包括所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据和所述第一用户的播放行为数据的第一平均数据;
生成模块503,用于基于所述用户数据生成所述第一用户的活跃资源列表,所述活跃资源列表中包括至少一个资源集合中处于用户活跃状态的资源集合;
推荐模块504,用于基于所述活跃资源列表,向第一用户进行多媒体资源推荐。
本发明实施例提供的装置,在向一个用户进行多媒体资源推荐时,本发明实施例从该用户针对每个已播放资源集合、该用户针对全部已播放资源集合、等多个维度来获取用户数据,之后,基于多维度的用户数据来生成活跃资源列表,由于在生成追剧列表时衡量标准遍及多维度,所以生成的活跃资源列表能够真实反映该用户当前对各个已播放资源集合的感兴趣程度,因此后续在依据活跃资源列表进行多媒体资源推荐时,会大幅提升推荐精准度。
在另一个实施方式中,对于每个所述资源集合,所述第一用户在所述第一时间段内对所述资源集合的播放行为数据包括:所述第一用户在所述第一时间段内单位时间平均播放的资源片段的数量、所述第一用户在所述第一时间段内对所述资源集合中各个资源片段的平均播放完成度、所述第一用户在所述第一时间段内对所述资源集合的播放完成度、所述第一用户在所述第一时间段内播放所述各个资源片段的耗时和所述第一用户的当前播放进度与所述资源集合的当前更新进度之间相差的资源片段数量。
在另一个实施方式中,所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据中包括多个播放行为指标的属性值,所述第一平均数据包括:每个所述资源集合中相同播放行为指标的属性值的均值,所述相同播放行为指标的属性值与所述第一用户和所述第一时间段匹配。
在另一个实施方式中,所述用户数据还包括第二用户在所述第一时间段内对每个所述资源集合的播放行为数据,对于每个所述资源集合,所述第二用户在所述第一时间段内对所述资源集合的播放行为数据包括:所述第二用户在所述第一时间段内单位时间平均播放的资源片段的数量、所述第二用户在所述第一时间段内对所述资源集合中各个资源片段的平均播放完成度、所述第二用户在所述第一时间段内对所述资源集合的播放完成度、所述第二用户在所述第一时间段内播放所述各个资源片段的耗时和所述第二用户的当前播放进度与所述资源集合的当前更新进度之间相差的资源片段数量。
在另一个实施方式中,所述生成模块,还用于对于每个所述资源集合,将所述第一用户在所述第一时间段内对所述资源集合的播放行为数据和所述第二用户在所述第一时间段内对所述资源集合的播放行为数据进行均值计算,得到与所述资源集合对应的播放行为数据的第二平均数据;基于所述第一用户的播放行为数据、所述第一平均数据以及所述第二平均数据,生成所述活跃资源列表。
在另一个实施方式中,所述生成模块,还用于对所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据、所述第一平均数据以及所述第二平均数据进行特征预处理,得到特征数据;将所述特征数据输入训练好的目标数据模型;获取所述目标数据模型输出的每个所述资源集合在目标时长范围内处于用户活跃状态的概率值;对获取到的概率值进行排序,基于得到的排序结果生成所述活跃资源列表。
在另一个实施方式中,所述目标模型包括第一数据模型,当所述目标时长范围为第一时长范围时,所述装置还包括:
训练模块,用于获取第一训练样本数据,并基于所述第一训练样本数据对初始的数据模型进行训练,得到所述第一数据模型;
其中,所述第一训练样本数据中包括所述第一用户在第二时间段内播放过的第一资源集合的用户数据,以及与所述第一资源集合匹配的特征标签信息;
所述特征标签信息表示所述第一用户在所述第一时长范围内是否播放过对应的资源集合,所述第二时间段早于所述第一时间段。
在另一个实施方式中,所述目标模型包括第二数据模型,当所述目标时长范围为第二时长范围时,所述训练模块,还用于获取第二训练样本数据,基于所述第二训练样本数据对初始的数据模型进行训练,得到所述第二数据模型;
其中,所述第二训练样本数据中包括所述第一用户在第三时间段内播放过的第二资源集合的用户数据,以及与所述第二资源集合匹配的特征标签信息;
所述特征标签信息表示所述第一用户在所述第二时长范围内是否播放过对应的资源集合,所述第二时长范围大于第一时长范围,所述第三时间段早于所述第二时间段。
在另一个实施方式中,所述生成模块,还用于对所述目标数据模型输出的概率值进行由大到小的排序,基于排序在前第一数目位的资源集合生成所述活跃资源列表。
在另一个实施方式中,所述推荐模块,还用于确定播放过所述活跃资源列表中资源集合的第二用户的其他已播放多媒体资源,向所述第一用户推荐所述其他已播放多媒体资源;或,确定与所述活跃资源列表中排在前第二数目位的资源集合具有相同主题信息的目标多媒体资源,向所述第一用户推荐所述目标多媒体资源。
在另一个实施方式中,所述获取模块,还用于获取所述第一用户的用户属性数据,将所述用户属性数据作为与所述至少一个资源集合匹配的用户数据。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例。
需要说明的是:上述实施例提供的多媒体资源推荐装置在推荐多媒体资源时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的多媒体资源推荐装置与多媒体资源推荐方法实施例属于同一构思,其具体实现过程详见方法实施例。
图6是本发明实施例提供的一种多媒体资源推荐设备600的结构示意图,该设备600具体可为服务器,该设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)601 和一个或一个以上的存储器602,其中,所述存储器602中存储有至少一条指令,所述至少一条指令由所述处理器601加载并执行以实现上述方法实施例提供的多媒体资源推荐方法。当然,该设备600还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中的多媒体资源推荐方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、 CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种多媒体资源推荐方法,其特征在于,所述方法包括:
确定第一用户在第一时间段内播放过的至少一个资源集合,每个所述资源集合中包括至少一个资源片段;
获取与所述至少一个资源集合匹配的用户数据,所述用户数据包括所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据、第二用户在所述第一时间段内对每个所述资源集合的播放行为数据和所述第一用户的播放行为数据的第一平均数据,所述第一平均数据用于描述所述第一用户对所述至少一个资源集合的平均播放水平;
对于每个所述资源集合,将所述第一用户在所述第一时间段内对所述资源集合的播放行为数据和所述第二用户在所述第一时间段内对所述资源集合的播放行为数据进行均值计算,得到与所述资源集合对应的播放行为数据的第二平均数据;其中,所述第一用户的播放行为数据和所述第二用户的播放行为数据包括的播放行为指标的类型相同;
对所述第一用户的播放行为数据、所述第一平均数据以及所述第二平均数据进行特征预处理,得到离散化的特征数据;将所述离散化的特征数据存储为稀疏向量,将所述稀疏向量输入训练好的目标数据模型;其中,所述目标数据模型的个数与多媒体资源的更新周期相关;
获取所述目标数据模型输出的每个所述资源集合在目标时长范围内处于用户活跃状态的概率值;对获取到的概率值进行排序,基于得到的排序结果生成所述第一用户的活跃资源列表,所述活跃资源列表中包括所述至少一个资源集合中处于用户活跃状态的资源集合;
基于所述活跃资源列表,向所述第一用户进行多媒体资源推荐;
其中,对于每个所述资源集合,所述第一用户在所述第一时间段内对所述资源集合的播放行为数据包括:所述第一用户在所述第一时间段内单位时间平均播放的资源片段的数量、所述第一用户在所述第一时间段内对所述资源集合中各个资源片段的平均播放完成度、所述第一用户在所述第一时间段内播放所述各个资源片段的耗时和所述第一用户的当前播放进度与所述资源集合的当前更新进度之间相差的资源片段数量,所述耗时指代播放行为覆盖的时长。
2.根据权利要求1所述的方法,其特征在于,对于每个所述资源集合,所述第一用户在所述第一时间段内对所述资源集合的播放行为数据还包括:所述第一用户在所述第一时间段内对所述资源集合的播放完成度。
3.根据权利要求1所述的方法,其特征在于,所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据中包括多个播放行为指标的属性值,所述第一平均数据包括:每个所述资源集合中相同播放行为指标的属性值的均值,所述相同播放行为指标的属性值与所述第一用户和所述第一时间段匹配。
4.根据权利要求1所述的方法,其特征在于,对于每个所述资源集合,所述第二用户在所述第一时间段内对所述资源集合的播放行为数据包括:所述第二用户在所述第一时间段内单位时间平均播放的资源片段的数量、所述第二用户在所述第一时间段内对所述资源集合中各个资源片段的平均播放完成度、所述第二用户在所述第一时间段内对所述资源集合的播放完成度、所述第二用户在所述第一时间段内播放所述各个资源片段的耗时和所述第二用户的当前播放进度与所述资源集合的当前更新进度之间相差的资源片段数量。
5.根据权利要求1所述的方法,其特征在于,所述目标模型包括第一数据模型,当所述目标时长范围为第一时长范围时,所述方法还包括:
获取第一训练样本数据,并基于所述第一训练样本数据对初始的数据模型进行训练,得到所述第一数据模型;
其中,所述第一训练样本数据中包括所述第一用户在第二时间段内播放过的第一资源集合的用户数据,以及与所述第一资源集合匹配的特征标签信息;
所述特征标签信息表示所述第一用户在所述第一时长范围内是否播放过对应的资源集合,所述第二时间段早于所述第一时间段。
6.根据权利要求5所述的方法,其特征在于,所述目标模型包括第二数据模型,当所述目标时长范围为第二时长范围时,所述方法还包括:
获取第二训练样本数据,基于所述第二训练样本数据对所述初始的数据模型进行训练,得到所述第二数据模型;
其中,所述第二训练样本数据中包括所述第一用户在第三时间段内播放过的第二资源集合的用户数据,以及与所述第二资源集合匹配的特征标签信息;
所述特征标签信息表示所述第一用户在所述第二时长范围内是否播放过对应的资源集合,所述第二时长范围大于所述第一时长范围,所述第三时间段早于所述第二时间段。
7.根据权利要求1所述的方法,其特征在于,所述对获取到的概率值进行排序,基于得到的排序结果生成所述第一用户的活跃资源列表,包括:
对所述目标数据模型输出的概率值进行由大到小的排序,基于排序在前第一数目位的资源集合生成所述第一用户的活跃资源列表。
8.根据权利要求1所述的方法,其特征在于,所述基于所述活跃资源列表,向所述第一用户进行多媒体资源推荐,包括:
确定播放过所述活跃资源列表中资源集合的第二用户的其他已播放多媒体资源,向所述第一用户推荐所述其他已播放多媒体资源;
或,确定与所述活跃资源列表中排在前第二数目位的资源集合具有相同主题信息的目标多媒体资源,向所述第一用户推荐所述目标多媒体资源。
9.根据权利要求1所述的方法,其特征在于,所述获取与所述至少一个资源集合匹配的用户数据,包括:
获取所述第一用户的用户属性数据,将所述用户属性数据作为与所述至少一个资源集合匹配的用户数据。
10.一种多媒体资源推荐装置,其特征在于,所述装置包括:
确定模块,用于确定第一用户在第一时间段内播放过的至少一个资源集合,每个所述资源集合中包括至少一个资源片段;
获取模块,用于获取与所述至少一个资源集合匹配的用户数据,所述用户数据包括所述第一用户在所述第一时间段内对每个所述资源集合的播放行为数据、第二用户在所述第一时间段内对每个所述资源集合的播放行为数据和所述第一用户的播放行为数据的第一平均数据,所述第一平均数据用于描述所述第一用户对所述至少一个资源集合的平均播放水平;
生成模块,用于对于每个所述资源集合,将所述第一用户在所述第一时间段内对所述资源集合的播放行为数据和所述第二用户在所述第一时间段内对所述资源集合的播放行为数据进行均值计算,得到与所述资源集合对应的播放行为数据的第二平均数据;其中,所述第一用户的播放行为数据和所述第二用户的播放行为数据包括的播放行为指标的类型相同;对所述第一用户的播放行为数据、所述第一平均数据以及所述第二平均数据进行特征预处理,得到离散化的特征数据;将所述离散化的特征数据存储为稀疏向量,将所述稀疏向量输入训练好的目标数据模型;其中,所述目标数据模型的个数与多媒体资源的更新周期相关;获取所述目标数据模型输出的每个所述资源集合在目标时长范围内处于用户活跃状态的概率值;对获取到的概率值进行排序,基于得到的排序结果生成所述第一用户的活跃资源列表,所述活跃资源列表中包括至少一个资源集合中处于用户活跃状态的资源集合;
推荐模块,用于基于所述活跃资源列表,向所述第一用户进行多媒体资源推荐;
其中,对于每个所述资源集合,所述第一用户在所述第一时间段内对所述资源集合的播放行为数据包括:所述第一用户在所述第一时间段内单位时间平均播放的资源片段的数量、所述第一用户在所述第一时间段内对所述资源集合中各个资源片段的平均播放完成度、所述第一用户在所述第一时间段内播放所述各个资源片段的耗时和所述第一用户的当前播放进度与所述资源集合的当前更新进度之间相差的资源片段数量,所述耗时指代播放行为覆盖的时长。
11.一种存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至9中任一个权利要求所述的多媒体资源推荐方法。
12.一种多媒体资源推荐设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至9中任一个权利要求所述的多媒体资源推荐方法。
CN201810908843.XA 2018-08-10 2018-08-10 多媒体资源推荐方法、装置、存储介质及设备 Active CN109511015B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810908843.XA CN109511015B (zh) 2018-08-10 2018-08-10 多媒体资源推荐方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810908843.XA CN109511015B (zh) 2018-08-10 2018-08-10 多媒体资源推荐方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN109511015A CN109511015A (zh) 2019-03-22
CN109511015B true CN109511015B (zh) 2021-12-14

Family

ID=65745615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810908843.XA Active CN109511015B (zh) 2018-08-10 2018-08-10 多媒体资源推荐方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN109511015B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960761B (zh) * 2019-03-28 2023-03-31 深圳市雅阅科技有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN110460879B (zh) * 2019-08-28 2021-11-26 北京奇艺世纪科技有限公司 一种视频请求调度方法、装置、服务器及存储介质
CN111291264B (zh) * 2020-01-23 2023-06-23 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN113742566B (zh) * 2020-05-29 2024-01-02 北京达佳互联信息技术有限公司 多媒体信息的推荐方法、装置、电子设备和存储介质
CN113609381B (zh) * 2021-07-13 2023-12-12 杭州网易云音乐科技有限公司 作品推荐方法、装置、介质和计算设备
CN113535989A (zh) * 2021-07-22 2021-10-22 北京爱奇艺科技有限公司 多媒体数据的存储方法和装置、电子设备和存储介质
CN113672746B (zh) * 2021-07-27 2024-03-26 北京达佳互联信息技术有限公司 多媒体资源推荐方法、装置、电子设备及存储介质
CN114501151B (zh) * 2022-01-24 2024-02-23 青岛聚看云科技有限公司 一种显示设备及媒资推荐方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102123308A (zh) * 2010-01-06 2011-07-13 索尼公司 信息处理装置、信息处理方法、以及程序
CN103914743A (zh) * 2014-04-21 2014-07-09 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法
CN104506894A (zh) * 2014-12-22 2015-04-08 合一网络技术(北京)有限公司 多媒体资源评估方法及其装置
CN104834657A (zh) * 2014-08-27 2015-08-12 腾讯科技(北京)有限公司 用户行为分析方法及服务器
CN105095431A (zh) * 2015-07-22 2015-11-25 百度在线网络技术(北京)有限公司 根据用户的行为信息推送视频的方法和装置
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106791961A (zh) * 2016-11-24 2017-05-31 武汉斗鱼网络科技有限公司 视频偏好信息处理方法、装置及系统
CN107635143A (zh) * 2017-11-06 2018-01-26 四川长虹电器股份有限公司 基于观看行为预测用户在电视上追剧的方法
CN107659849A (zh) * 2017-11-03 2018-02-02 中广热点云科技有限公司 一种推荐节目的方法及系统
CN107832437A (zh) * 2017-11-16 2018-03-23 北京小米移动软件有限公司 音/视频推送方法、装置、设备及存储介质
WO2018093631A1 (en) * 2016-11-21 2018-05-24 Roku, Inc. Recommending content based on user behavior tracking and analysis

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9817826B2 (en) * 2012-09-27 2017-11-14 Google Inc. System and method for recommending media programs and notifying a user before programs start

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102123308A (zh) * 2010-01-06 2011-07-13 索尼公司 信息处理装置、信息处理方法、以及程序
CN103914743A (zh) * 2014-04-21 2014-07-09 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法
CN104834657A (zh) * 2014-08-27 2015-08-12 腾讯科技(北京)有限公司 用户行为分析方法及服务器
CN104506894A (zh) * 2014-12-22 2015-04-08 合一网络技术(北京)有限公司 多媒体资源评估方法及其装置
CN105095431A (zh) * 2015-07-22 2015-11-25 百度在线网络技术(北京)有限公司 根据用户的行为信息推送视频的方法和装置
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
WO2018093631A1 (en) * 2016-11-21 2018-05-24 Roku, Inc. Recommending content based on user behavior tracking and analysis
CN106791961A (zh) * 2016-11-24 2017-05-31 武汉斗鱼网络科技有限公司 视频偏好信息处理方法、装置及系统
CN107659849A (zh) * 2017-11-03 2018-02-02 中广热点云科技有限公司 一种推荐节目的方法及系统
CN107635143A (zh) * 2017-11-06 2018-01-26 四川长虹电器股份有限公司 基于观看行为预测用户在电视上追剧的方法
CN107832437A (zh) * 2017-11-16 2018-03-23 北京小米移动软件有限公司 音/视频推送方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109511015A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN107888950B (zh) 一种推荐视频的方法和系统
CN108921221B (zh) 用户特征的生成方法、装置、设备及存储介质
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
CN110574387B (zh) 使用机器学习推荐直播流内容
WO2017096877A1 (zh) 一种推荐方法和装置
US11055340B2 (en) System and method for creating synopsis for multimedia content
US9715731B2 (en) Selecting a high valence representative image
US9892109B2 (en) Automatically coding fact check results in a web page
KR102068790B1 (ko) 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체
Tso-Sutter et al. Tag-aware recommender systems by fusion of collaborative filtering algorithms
CN109690529B (zh) 按事件将文档编译到时间线中
US10152479B1 (en) Selecting representative media items based on match information
US10747802B1 (en) Image recommendations for thumbnails for online media items based on user activity
CN109753601B (zh) 推荐信息点击率确定方法、装置及电子设备
CN111126495B (zh) 模型训练方法、信息预测方法、装置、存储介质及设备
CN110941738B (zh) 推荐方法、装置、电子设备及计算机可读存储介质
Hopfgartner et al. Semantic user profiling techniques for personalised multimedia recommendation
CN104486649A (zh) 视频内容评级方法及装置
CN106354867A (zh) 多媒体资源的推荐方法及装置
Wang et al. Bilateral correspondence model for words-and-pictures association in multimedia-rich microblogs
CN110569447B (zh) 一种网络资源的推荐方法、装置及存储介质
CN106445922B (zh) 确定多媒体资源的标题的方法及装置
CN116610858A (zh) 一种信息分发方法、装置、电子设备以及存储介质
CN115129922A (zh) 搜索词生成方法、模型训练方法、介质、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant