发明内容
有鉴于此,本发明提供一种多媒体资源推荐方法,其特征在于,包括:
搜集用户在终端处理多媒体资源时的用户行为数据;
对预定时间段内的所述用户行为数据进行过滤;
将所述过滤后的用户行为数据与有行为发生的多媒体资源圈进行匹配计算,得到所述用户与所述有行为发生的多媒体资源圈的第一匹配值;
根据所述已匹配的多媒体资源圈、多媒体资源圈相似度和/或用户相似度,得到所述用户感兴趣的无行为发生的多媒体资源圈;
根据所述第一匹配值、多媒体资源圈相似度值和/或用户相似度值得到所述无行为发生的多媒体资源圈的第二匹配值;
根据所述无行为发生的多媒体资源圈中推荐的多媒体资源的属性对所述第二匹配值进行调整;
依据所述第一匹配值和所述调整后的第二匹配值对所述用户进行多媒体资源推荐操作。
优选地,其中,所述终端是通信终端、上网终端、音频/视频播放终端。
优选地,其中,所述处理操作包括观看、搜索、收藏、评论、分享。
优选地,其中,所述有行为发生是指所述用户对于所述多媒体资源圈中的多媒体资源已进行所述处理操作。
优选地,其中,所述用户行为数据包括用户cookie、用户ID、所述用户对于所述多媒体资源的处理方式、所处理的所述多媒体资源的类型、所处理的所述多媒体资源的播放情况、所处理的所述多媒体资源的数量、所处理的所述多媒体资源所属的多媒体资源圈中的多媒体资源的总数目。
优选地,其中,依据所述过滤后的用户行为数据判断所述有行为发生的多媒体资源是否属于某个多媒体资源圈,从而得到所述第一匹配值。
优选地,其中,所述多媒体资源的属性是所述多媒体资源的上传日期、更新日期和/或最新评价日期。
优选地,其中,得到多个所述无行为发生的多媒体资源圈,且每个无行为发生的多媒体资源圈对应一个所述第二匹配值。
优选地,其中,将所述第一匹配值和所述多个调整后的第二匹配值进行排序,优先向所述用户推荐匹配值最高的多媒体资源圈中的多媒体资源。
优选地,其中,依据所述用户后续的对于所述排序后的多个多媒体资源圈的处理操作,对所述第一匹配值和/或所述调整后的第二匹配值进行再次调整。
本发明提出的多媒体资源推荐方法,具有以下优点:
1)将用户行为与多媒体资源圈相似度值和/或用户相似度值结合在一起进行多媒体资源推荐,如此被推荐的多媒体资源在保持内容丰富的同时又保证了推荐准确度 ;
2)利用后续用户对于多媒体资源圈的处理操作对调整后匹配值进行再次调整,如此使得被推荐的多媒体资源的准确度得到进一步提升。
当然,实施本发明的任一产品必不一定需要同时达到以上所述的所有技术效果。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
在本发明的实施方式中,多媒体资源圈是指同一类型的多媒体资源所形成的集合。例如,依据多媒体资源的内容,可将多媒体资源分为以下类型:影视型、学习型、游戏型、美食型、保健型和/或社交型等等。影视型的多媒体资源形成的集合便称作影视资源圈、学习型的多媒体资源形成的集合便称作学习资源圈、美食型的多媒体资源形成的集合便称作美食资源圈、以此类推。在本发明的实施例中,多媒体资源可以为例如图片、音频、视频等,本发明并不限制多媒体资源的具体形式。
图1为依据本发明一实施例的多媒体资源推荐方法。如图1所示,该多媒体资源推荐方法包括以下步骤。
步骤101,在步骤101中,搜集用户在终端处理多媒体资源时的用户行为数据。
请注意的是,在本发明的实施例中,终端可以是通信终端、上网终端、音频/视频播放终端,例如可以是PDA、 MID和/或具有音频、视频播放功能的移动电话,还可以是台式电脑、笔记本型电脑、掌上电脑、智能电视、机顶盒等设备等。
用户的处理方式包括观看、搜索、收藏、评论、分享等。用户行为数据包括行为日志。例如,行为日志中包括用户cookie、用户ID等字段;行为日志还可进一步包括用户对于多媒体资源的处理方式(例如,观看、搜索、收藏、评论或分享)、所处理的多媒体资源的类型(例如,是属于影视资源圈还是学习资源圈)。在本发明的一实施例中,若用户对于多媒体资源的处理方式是“观看”时,行为日志还可进一步包括所处理(例如观看)的多媒体资源的播放情况(例如,视频时长、视频被播放的播放时长等)、所处理的多媒体资源的数量(例如,用户观看了1部电影、收听了3首歌曲等)、所处理的多媒体资源所属的多媒体资源圈中的多媒体资源的总数目(例如,影视资源圈中包括6598部电影)等等。
步骤102,在步骤102中,对预定时间段内的用户行为数据进行过滤。
在本发明的实施例中,该预定时间段可以为24小时、36小时、48小时等等,本发明并不限制预定时间段的具体数值。所属技术领域的技术人员应可理解,预定时间段越长,用户行为数据就会越多,多媒体资源列表中的数据也会越多。这将提高多媒体资源推荐的准确度,但相应的也会增加多媒体资源推荐方法的计算复杂度。
对该预定时间段内的用户行为数据进行过滤。在场景1中,用户的行为是在该预定时间段内多次观看同一个多媒体资源,则只计算观看时长最多的一次。例如,用户在24小时内观看“无间道”这部电影3次,第1次观看了40分钟,第2次观看了36分钟,第3次观看了78分钟,则对该用户的观看行为进行过滤,滤除第1次和第2次的观看行为,只保留第3次观看78分钟的观看行为。在场景2中,用户先是在搜索工具中搜索了“无间道”这部电影,然后又观看了该电影,则对该用户的搜索和观看行为进行过滤,滤除搜索行为,只保留观看行为。在场景3中,用户在3个不同搜索工具中搜索了3次“无间道”这部电影,则对该用户的搜索行为进行过滤,滤除第1次和第2次的搜索行为,只保留最后一次的搜索行为。在场景4中,用户先在搜索工具中搜索了“无间道”这部电影,然后将该电影在微信朋友圈进行分享,则对该用户的搜索和分享行为进行过滤,滤除搜索行为,保留分享行为。如本领域技术人员所了解的,可依据设计的需要,灵活改变用户行为数据的过滤准则,所有均等性过滤方式均属于本发明的保护范畴。
对用户行为数据进行过滤处理之后,可以得到过滤后的用户行为数据,并得到在预定时间内的对应过滤后的用户行为数据(例如过滤后的观看、搜索、收藏、评论、分享等行为)所对应的多媒体资源列表。
步骤103,在步骤103中,将过滤后的用户行为数据与有行为发生的多媒体资源圈进行匹配计算,得到用户与有行为发生的多媒体资源圈的第一匹配值。
其中,有行为发生是指该用户对于该多媒体资源圈中的多媒体资源已进行处理操作(例如,观看、搜索、收藏、评论或分享等)。在本发明的一个实施例中,可依据过滤后的用户行为数据判断用户行为数据所对应的多媒体资源是否属于某个多媒体资源圈,从而得到该第一匹配值。例如,在预定时间段内(例如24小时),过滤后的用户行为数据(例如包括用户对于多媒体资源的处理方式)表示用户U观看了视频V1、V2和V3,且过滤后的用户行为数据(例如包括多媒体资源的类型)表明视频V1和V3同属于多媒体资源圈C1,视频V2属于多媒体资源圈C2。依据用户行为数据(例如包括多媒体资源的播放情况)分别计算出视频V1、V2和V3的播放完成率P1、P2、P3,其中,在本发明的实施例中,播放完成率等于播放时长除以视频时长。则在本发明的一个实施例中,用户U与多媒体资源圈C1的匹配值S1可定义为:S1=P1+P3,用户U与多媒体资源圈C2的匹配值S2可定义为S2=P2。又例如,在预定时间段内(例如48小时),过滤后的用户行为数据(例如包括用户对于多媒体资源的处理方式)表示用户U两次搜索视频V1、一次搜索视频V2 ,且过滤后的用户行为数据(例如包括多媒体资源的类型)表明视频V1和V2同属于多媒体资源圈C1,过滤后的用户行为数据(例如包括所处理的多媒体资源所属的多媒体资源圈中的多媒体资源的总数目)表明多媒体资源圈C1共有N部视频。则在本发明的一个实施例中,用户U与多媒体资源圈C1的匹配值S1可定义为:S1=(2+1)/N,其中N为大于或等于1的正整数。
步骤104,在步骤104中,根据已匹配的多媒体资源圈、多媒体资源圈相似度和/或用户相似度,得到用户感兴趣的无行为发生的多媒体资源圈,并根据步骤103中得到的第一匹配值、多媒体资源圈相似度值和/或用户相似度值得到该无行为发生的多媒体资源圈的第二匹配值。其中,无行为发生是指该用户对于该其他多媒体资源圈中的多媒体资源并未产生处理操作(例如,并未观看、搜索、收藏、评论或分享等)。
具体而言,在本发明的一实施例中,可依据预先设定的多媒体资源圈之间的相似度列表,得到已匹配的多媒体资源圈与其他多媒体资源圈的相似度值,并根据步骤103中得到的有行为发生的多媒体资源圈的匹配值和所述多媒体资源圈的相似度值得到无行为发生的其他多媒体资源圈的第二匹配值。在本发明的一个实施例中,例如,在步骤103中,根据已过滤的用户行为数据计算出用户U与多媒体资源圈C1匹配,其匹配值为S1。依据预先设定的多媒体资源圈之间的相似度列表,可得到多媒体资源圈C1与多媒体资源圈C2具有相似度。在本发明的一实施例中,该相似度列表还可包含多个多媒体资源两两之间的相似度值,因此,依据该相似度列表,可得到多媒体资源圈C1与多媒体资源圈C2之间的相似度值Sim1。依据匹配值S1和相似度值Sim1得到多媒体资源圈C2与用户U的匹配值S2。在本发明的一个实施例中,多媒体资源圈C2与用户U的匹配值S2可定义为:S2=S1*Sim1。
在所述实施例中,是利用多媒体资源圈的相似度值来得到无行为发生的其他多媒体资源圈的第二匹配值。在本发明的另一实施例中,可利用两位用户之间的相似度值来得到两位用户中一位用户与无行为发生的多媒体资源圈的第二匹配值,其中,该无行为发生的多媒体资源圈与该两位用户中的另一位用户是有相关度的,即,该另一位用户与该多媒体资源圈是有行为发生的。
具体而言,在本发明的另一实施例中,可依据已过滤的用户行为数据(例如包括用户cookie、用户ID)计算出用户U1对于多媒体资源圈C1的匹配值S1。依据预先设定的用户之间的相似度列表,可知用户U1与用户U2具有相似度。在本发明的一实施例中,该相似度列表还可包含多个用户两两之间的相似度值,因此,依据该相似度列表,可得到用户U1与用户U2之间的相似度值Sim1。依据匹配值S1和相似度值Sim1得到用户U2与多媒体资源圈C1的匹配值S2。在本发明的一个实施例中,用户U2与多媒体资源圈C1的匹配值S2可定义为:S2=S1*Sim1。
在本发明的一实施例中,可进一步结合所述利用多媒体资源圈的相似度值来得到无行为发生的其他多媒体资源圈的匹配值以及利用两位用户之间的相似度值来得到两位用户中一位用户与无行为发生的多媒体资源圈的第二匹配值这两种技术方案。即,根据已匹配的多媒体资源圈、多个多媒体资源圈的相似度和多个用户的相似度,得到用户可能感兴趣的无行为发生的多媒体资源圈,并根据步骤103中得到的匹配值、多媒体资源圈的相似度值和用户的相似度值得到该无行为发生的多媒体资源圈的第二匹配值。
具体而言,在本发明的一实施例中,在步骤103中,根据已过滤的用户行为数据计算出用户U1与多媒体资源圈C1匹配,其匹配值为S1,即U1=C1*S1。依据预先设定的多媒体资源圈之间的相似度列表,可得到多媒体资源圈C1与多媒体资源圈C2具有相似度。在本发明的一实施例中,该相似度列表还可包含多个多媒体资源两两之间的相似度值,因此,依据该相似度列表,可得到多媒体资源圈C1与多媒体资源圈C2之间的相似度值Sim1,即C1=C2*Sim1。因此,用户U1与多媒体资源圈C2的关系为U1=C2*S1*Sim1。进一步的,依据预先设定的用户之间的相似度列表,可知用户U1与用户U2具有相似度。在本发明的一实施例中,该相似度列表还可包含多个用户两两之间的相似度值,因此,依据该相似度列表,可得到用户U1与用户U2之间的相似度值Sim1’,即U1=U2*Sim1’。因此,用户U2与多媒体资源圈C2之间的关系为U2*Sim1’=C2*S1*Sim1,因此用户U2与多媒体资源圈C2的匹配值S2可定义为:S2=S1*Sim1/Sim1’。也就是说,依据匹配值S1、相似度值Sim1、相似度值Sim1’得到多媒体资源圈C2与用户U2的匹配值S2。在本发明的一个实施例中,多媒体资源圈C2与用户U2的匹配值S2可定义为:S2=S1*Sim1/Sim1’。
步骤105,在步骤105中,根据无行为发生的多媒体资源圈中推荐的多媒体资源的属性对步骤104中得到的第二匹配值进行调整,依据第一匹配值和调整后的第二匹配值对用户进行多媒体资源推荐操作。
在本发明的一实施例中,步骤104中依据多媒体资源圈的相似度和/或多个用户的相似度计算出的用户与多媒体资源圈的匹配值为S2,但也许依据已过滤的用户行为数据会发现该用户与该多媒体资源圈的匹配值为S3,在此情形下,则保留S3作为用户与多媒体资源圈的匹配值,而舍去S2。如此处理之后,可得到用户所有感兴趣或者可能感兴趣的多媒体资源圈的一个集合并且具有相应的匹配值。
根据多媒体资源圈推荐的多媒体资源的属性对第二匹配值进行调整,依据第一匹配值和调整后的第二匹配值对用户进行多媒体资源推荐操作。在本发明的一实施例中,多媒体资源的属性可以是该多媒体资源的上传日期、更新日期和/或最新评价日期等等。依据该属性对匹配值进行调整,例如,愈是新上传的多媒体资源对于匹配值的调整力度愈大,愈是早上传的多媒体资源对于匹配值的调整力度愈小。在本发明的一实施例中,在步骤104中计算得到用户U2与多媒体资源圈C2的匹配值为S2,多媒体资源圈C2中推荐视频V1,且视频V1的上传日期据目前的天数为T,则用户U2与多媒体资源圈C2的调整后的匹配值为S2’,S2’可定义为:S2’=S2*(1+1/T)。如此处理之后,可得到用户所有感兴趣或者可能感兴趣的多个多媒体资源圈的一个集合,且该集合中的每个多媒体资源圈都具有相应的调整后的匹配值。将这些调整后的匹配值与步骤103得到的匹配值进行排序,优先向用户推荐匹配值高的多媒体资源圈中的多媒体资源。例如,用户U2与多媒体资源U2的调整后的匹配值为S2’,与多媒体资源U3的调整后的匹配值为S3’,与多媒体资源U4的调整后的匹配值为S4’,则多媒体资源U2、U3和U4则形成多媒体资源集合。若S4’<S2’<S3’,则依据调整后的匹配值S3’优先对用户U2进行多媒体资源圈U3中的多媒体资源的推荐操作。
图1提出的多媒体资源推荐方法,可利用用户与有行为发生的多媒体资源圈的第一匹配值、多媒体资源圈相似度值和/或用户相似度值得到用户与无行为发生的多媒体资源圈的第二匹配值,再根据多媒体资源圈推荐的多媒体资源的属性对用户与无行为发生的多媒体资源圈的第二匹配值进行调整,依据第一匹配值和调整后的第二匹配值对用户进行多媒体资源推荐操作。相较现有的多媒体资源推荐方法,可将用户行为与多媒体资源圈相似度值和/或用户相似度值结合在一起进行多媒体资源推荐,如此被推荐的多媒体资源在保持内容丰富的同时又保证了推荐准确度。
图2为依据本发明另一实施例的多媒体资源推荐方法。如图2所示,该多媒体资源推荐方法与图1所示的多媒体资源推荐方法的不同在于进一步包括步骤206。
步骤206,在步骤206中,依据用户后续的处理操作对步骤205中调整后的第二匹配值以及步骤103得到的第一匹配值进行再次调整。
在本发明的一实施例中,用户后续的处理操作乃用户在线点击行为。其中,在线点击是指用户观看到排序后的多媒体资源圈对应的网页页面的点击行为,此种行为可以通过页面布代码统计日志的方式得到。从日志中可以得到用户点击的多媒体资源圈ID、多媒体资源圈中的多媒体资源的ID,由于在线点击行为本身就是VV日志,因此也可以得到用户观看这个多媒体资源的播放时长等信息。依据用户行为对步骤205中调整后的第二匹配值以及步骤203得到的第一匹配值进行再次调整。例如,用户U2点击多媒体资源圈C3中的视频V1,观看播放完成率为P,在步骤204中,用户U2与多媒体资源圈C3的匹配值原为S3,经过步骤205之后,用户U2与多媒体资源圈C3的匹配值调整为S3’,则再次调整后的匹配值S3’’=S3’+P。又例如,用户U2点击多媒体资源圈C2中的视频V2,观看播放完成率为P,在步骤203中,用户U2与多媒体资源圈C2的匹配值原为S2,则再次调整后的匹配值S2’=S2+P。
图2提出的多媒体资源推荐方法在图1的基础上,利用后续用户对于多媒体资源圈的处理操作对第一匹配值和调整后的第二匹配值进行再次调整,如此使得被推荐的多媒体资源的准确度得到进一步提升。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者系统中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。