CN109246450A - 一种基于隐式信息评分的影视择优推荐系统及方法 - Google Patents

一种基于隐式信息评分的影视择优推荐系统及方法 Download PDF

Info

Publication number
CN109246450A
CN109246450A CN201810882454.4A CN201810882454A CN109246450A CN 109246450 A CN109246450 A CN 109246450A CN 201810882454 A CN201810882454 A CN 201810882454A CN 109246450 A CN109246450 A CN 109246450A
Authority
CN
China
Prior art keywords
user
information
scoring
implicit
preferentially
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810882454.4A
Other languages
English (en)
Other versions
CN109246450B (zh
Inventor
彭俊杰
陈杰
游录金
王瑛涛
陈淦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201810882454.4A priority Critical patent/CN109246450B/zh
Publication of CN109246450A publication Critical patent/CN109246450A/zh
Application granted granted Critical
Publication of CN109246450B publication Critical patent/CN109246450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Computing Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于隐式信息评分的影视择优推荐系统和方法,本系统包括用户使用情况检测模块、择优推荐系统处理模块、用户日志信息采集处理模块、用户日志信息存储模块、隐式信息评分查询/构建/更新模块、隐式信息评分存储模块和推荐结果展示模块等模块;本方法是通过对本系统各模块的介绍,结合基于用户的历史行为日志的分析,提出了基于隐式信息计算用户在不同时段下对不同因素(标签、演员、导演等)的偏好并据此对节目进行隐式评分进而提供推荐。在真实数据集上同被广泛应用于推荐系统的其它算法比较,实验结果表明其平均精度均值较高,具有一定的应用前景和价值,可以较好地应用在在线影视推荐系统或其它类似商品推荐系统中。

Description

一种基于隐式信息评分的影视择优推荐系统及方法
技术领域
本发明涉及一种基于隐式信息评分的影视择优推荐系统及方法。
背景技术
移动互联网的迅猛发展为影视行业的发展注入了新的活力,传统的影视行业也开始向移动在线影视靠拢。随着节目数量的急剧增长,信息过载的问题开始显现:用户在有限的闲暇之余在浩如烟海的节目中找到自己喜爱的节目越来越困难,影视内容提供商想要吸引用户不断点击观看其节目、培养用户消费习惯从而获得收益也越来越困难。在此情况下,节目推荐成为了影视领域常见一种吸引观众,提升影视节目收视率的方法。推荐的效果取决于推荐算法,遗憾的是,现有的推荐方法通常是基于用户的协同过滤推荐算法、基于矩阵分解的协同过滤算法等,其效果强烈依赖于用户对于影视节目的评分。然而在实际的影视在线平台中,显式评分数据是很少的,这使得推荐效果不是很理想。
针对目前存在的这些问题,一些学者将注意力转移到基于基本属性和行为属性的隐式信息评分技术上,希望结合隐式信息评分的现有优势,达到对影视推荐效果的提升。从已经开展的特定垂直领域隐式信息评分应用效果看,隐式信息评分在推荐系统上已经被证明是极有价值的,如在社交网络领域,通过构建隐式信息评分,能够检测和分类用户的反社会行为和社交网络用户的投资水平;在医疗领域,基于用户对药品的评论和相关信息构造隐式信息评分从而可靠地预测用户的年龄和性别等统计属性;在科学研究领域,通过对科研工作者进行隐式信息评分可以挖掘他们的研究兴趣;在农业信息化领域,隐式信息评分可以用来进行农业信息获取和农业产品个性化推荐等等。遗憾的是在影视领域,基于隐式信息评分的影视个性化推荐的相关研究相对比较有限。目前,基于隐式信息评分的主要考虑的是用户基本属性等隐式信息,如其性别、年龄等,没有对用户的兴趣爱好等行为属性进行量化,更没有根据隐式信息评分中的偏好属性对节目进行隐式信息评分,且没有考虑用户在不同时间和空间下的兴趣爱好可能有所不同,没有充分对“冷启动”提供解决方案。
发明内容
本发明的目的是针对目前现有的协同过滤技术存在显式评分严重缺失、未考虑用户在不同时间空间下兴趣爱好的不同和未充分对冷启动提供解决方案等不足而提出的一种基于隐式信息评分的影视择优推荐系统及方法,通过将用户的历史行为日志传入本发明推荐系统并从推荐系统使用本发明方法得到用户可能喜爱的其它在线影视节目列表,从而吸引用户不断观看,满足用户喜好,并提升影视节目收视率和在线影视运营商收益,具有实际的商业价值。
为了达到上述目的,本发明的技术方案如下:
一种基于隐式信息评分的影视择优推荐系统,包括用户使用情况检测模块、择优推荐系统处理模块、用户日志信息采集处理模块、用户日志信息存储模块、隐式信息评分查询/构建/更新模块、隐式信息评分存储模块、推荐结果展示模块;所述用户日志信息存储模块经用户日志信息采集处理模块连接择优推荐系统处理模块,所述隐式信息评分存储模块经过隐式信息评分查询/构建/更新模块连接择优推荐系统处理模块,所述择优推荐系统处理模块分别连接用户使用情况检测模块,用户日志信息采集处理模块,隐式信息评分查询/构建/更新模块和推荐结果展示模块;所述用户使用情况模块用来检测用户的使用环境和使用行为,然后将用户的相关使用环境信息(如用户名、登录设备、登录地点和使用网络情况等)和使用行为信息(如用户名、行为发生时间、行为持续时间、观看的节目信息等)传入择优推荐系统处理模块,该择优推荐系统处理模块向用户日志信息采集处理模块请求用户的用户日志信息,用户日志信息采集处理模块收到来自择优推荐系统处理模块的用户日志信息请求后,从用户日志信息存储模块中取出用户的用户日志信息并进行必要的预处理后返回给择优推荐系统处理模块,随后择优推荐系统处理模块进行影视择优推荐,期间择优推荐系统处理模块会调用隐式信息评分查询/构建/更新模块进行隐式信息评分的查询、构建或者更新,并将推荐结果列表传入到推荐结果展示模块,该推荐结果展示模块将推荐的结果列表展示给用户,让用户自行点击;隐式信息评分的持久化存储由隐式信息评分存储模块管理。
一种基于隐式信息评分的影视择优推荐方法,采用上述的基于隐式信息评分的影视择优推荐系统进行操作,操作步骤如下:
1)用户使用情况检测模块检测到用户的使用环境和使用行为,然后将用户的相关使用环境信息(如用户名、登录设备、登录地点和使用网络情况等)和使用行为信息(如用户名、行为发生时间、行为持续时间、观看的节目信息等)信息传入择优推荐系统处理模块;
2)择优推荐系统处理模块收到用户的相关使用环境信息和使用行为信息后,向用户日志信息采集处理模块请求择优推荐所需的用户日志信息;
3)用户日志信息采集处理模块收到来自择优推荐系统处理模块的用户日志信息请求后,从用户日志信息存储模块中取出用户的用户日志信息并进行必要的预处理(如按日志时间戳排序等)后返回给择优推荐系统处理模块;
4)择优推荐系统处理模块得到所需的用户日志信息后,以用户信息和行为轨迹为参数调用隐式信息评分查询/构建/更新模块以请求隐式信息评分;
5)隐式信息评分查询/构建/更新模块收到择优推荐系统处理模块的请求后,从隐式信息评分存储模块中查询隐式信息评分,并针对用户的不同情况进行隐式信息评分的构建或者更新,如果有更新则将隐式信息评分写回隐式信息评分存储模块,并将隐式信息评分返回给择优推荐系统处理模块;
6)择优推荐系统处理模块得到隐式信息评分后用基于隐式信息评分的择优推荐进行处理得到推荐结果集,并将结果集传输给推荐结果展示模块;
7)推荐结果展示模块根据择优推荐系统处理模块得到的数据提供一个API(Application Programming Interface,应用程序编程接口)给不同的客户端调用,即客户端访问该API后得到以Json形式描述的推荐结果集后对其进行解析并以列表形式展示给用户,供用户随意选择。
所述步骤5)中根据用户信息和行为轨迹,从隐式信息评分存储模块中查询隐式信息评分,并针对用户的不同情况进行隐式信息评分的构建或者更新,如果有更新则将隐式信息评分写回隐式信息评分存储模块,并将隐式信息评分返回给择优推荐系统处理模块,具体步骤如下:
5-1)根据用户信息从隐式信息评分存储模块中查询隐式信息评分,如果查询不到隐式信息评分,则需要根据用户行为轨迹计算隐式信息评分,进行步骤5-2);如果查询到隐式信息评分,则将隐式信息评分返回给择优推荐系统处理模块,进行步骤6);
5-2)将一天划分为若干个时段;
5-3)计算用户在不同时段下的行为轨迹;
5-4)计算用户在不同时段下的观看次数与观看时长;
5-5)计算用户常用的设备和地点;
5-6)计算用户对不同演员、不同标签观看的总时长;
5-7)根据用户行为轨迹中的观看记录,计算用户对不同节目的简单评分,用户u对节目Ci的简单评分的计算公式如下所示:
其中,N3为用户u的观看总次数,s表示用户对节目Ci的所有次简单评分之和。对于第k次观看,为用户u第k次观看时长,为用户u第k次观看的节目,为节目Ci的节目时长,如果则表示第k次观看的是节目Ci,则将此次用户对此节目的观看时长与此节目总时长的比值作为用户u本次对节目Ci的简单评分。
5-8)根据用户对不同节目的简单评分和节目的标签列表、演员列表、导演列表、分类列表和子分类列表,计算用户对此节目中的标签、演员、导演、分类、子分类的位置加权评分;
5-9)对于用户的所有观看记录,将上述各自类型的位置加权评分求和,得到用户对不同标签、演员、导演、分类和子分类的位置加权总评分;用户对属性p(p可能为标签m,导演d,演员a,分类b,子分类e)的位置加权总评分如下所示:
其中,N1为节目总数,对于每一个节目Ci,将用户u对节目Ci的简单评分乘以属性p的位置权重αp即为位置加权评分,用户u对属性p的位置加权总评分为所有满足上述条件的位置加权评分之和。
5-10)对5-9)的各种类型的位置加权总评分进行归一化得到:用户对不同标签的归一化位置加权总评分,用户对不同演员的归一化位置加权总评分,用户对不同导演的归一化位置加权总评分,用户对不同分类的归一化位置加权总评分和用户对不同子分类的归一化位置加权总评分。用户u对属性p(p可能为标签m,导演d,演员a,分类b,子分类e)的归一化位置加权总评分为:
其中{p}代表所有节目中该类属性的元素的并集。
5-11)将上述归一化位置加权总评分作为隐式信息评分中的用户偏好信息、将用户信息作为隐式信息评分中的用户基本属性信息,将隐式信息评分写回隐式信息评分存储模块,并将隐式信息评分返回给择优推荐系统处理模块,进行步骤6)。
所述步骤6)中根据用户的相关使用环境信息、使用行为信息、用户的用户日志信息和用户的隐式信息评分信息计算用户对于其没有观看过的不同节目的隐式信息评分来计算用户对这些节目的偏好并根据隐式信息评分的大小得到初步的推荐结果,再结合用户使用环境信息、当前所处的时段,对推荐结果进行调整,并针对“冷启动”的情况提供了解决方案;主要包含以下几个步骤:
6-1)通过判断用户日志信息的数量是否大于给定阈值判断是否发生“冷启动”现象(即当用户的日志数量小于给定阈值时,推荐系统中只有该用户的少量日志,较难对用户的偏好进行计算),如果是,考虑到人们的兴趣爱好往往受到周围人的影响,通过其登录系统就一定会存在的设备型号和使用地点,得到与其使用相同设备型号或者相同设备品牌、相同使用地点或者接近使用地点的其他用户普遍爱看的节目,将其加入推荐列表,传递给推荐结果展示模块,进行步骤7);反之,进行6-2);
6-2)得到用户没有观看过的节目列表;
6-3)对于6-2)中得到的用户没有观看过的节目列表中的每一个节目,通过隐式信息评分中用户对不同标签的归一化位置加权总评分,用户对不同演员的归一化位置加权总评分,用户对不同导演的归一化位置加权总评分,用户对不同分类的归一化位置加权总评分和用户对不同子分类的归一化位置加权总评分计算用户对此节目的隐式评分;用户u对节目Ci的隐式评分的计算公式如下所示:
其中,为用户u对节目Ci的隐式信息评分;为节目Ci的标签列表,对于其中的每一个标签m,Qum为用户u对标签m的归一化位置加权总评分,α1为标签m在中的位置权重,β1为用户u对标签列表的隐式评分的重要性权重;为节目Ci的演员列表,对于其中的每一个演员a,Qua为用户u对演员a的归一化位置加权总评分,α2为演员a在中的位置权重,β2为用户u对演员列表的隐式评分的重要性权重;为节目Ci的导演列表,对于其中的每一个导演d,Qud为用户u对导演d的归一化位置加权总评分,α3为导演d在中的位置权重,β3为用户u对导演列表的隐式评分的重要性权重;节目Ci的分类列表,对于其中的每一个分类b,Qub为用户u对分类b的归一化位置加权总评分,α3为分类b在中的位置权重,β4为用户u对分类列表的隐式评分的重要性权重;为节目Ci的子分类列表,对于其中的每一个子分类e,Que为用户u对子分类e的归一化位置加权总评分,α4为子分类e在中的位置权重,β5为用户u对子分类列表的隐式评分的重要性权重。
6-4)将6-3)中每个节目按照用户对此节目的隐式评分从大到小排序,并取前若干个节目作为初步推荐列表;
6-5)考虑当前时间所处的时段q,通过用户u的隐式信息评分的基本属性中用户u不同时段下的观看习惯,如根据用户在此时段下的观看时长、观看次数、用户在此时段下观看时间最长的标签等,对基本推荐列表的节目顺序做调整,使得节目时长更符合用户可能空闲时间长度的节目和更符合用户在当前时段下的口味的节目顺序更靠前,将最终的推荐列表传递给推荐结果展示模块,进行步骤7)。
与现有技术相比,本发明具有如下显而易见的突出实质性特点和显著优点:
本发明充分利用隐含在用户日志中的偏好信息,提供了用户对于影视节目的隐式信息评分方法,克服了在显式评分很少甚至完全没有的情况下推荐准确率不高的问题,使得同一资源情况下,收益能够达到最大化,具有实际的商业价值。
附图说明
图1是本发明的系统结构框图。
图2是本发明方法的主程序框图。
图3是本发明设计的实验方案在准确率等指标上与其他算法的效果对比图。
具体实施方式
以下结合附图详述本发明的优选实施例。
如图1所示,一种基于隐式信息评分的影视择优推荐系统,包括用户使用情况检测模块1、择优推荐系统处理模块2、用户日志信息采集处理模块3、用户日志信息存储模块4、隐式信息评分查询/构建/更新模块5、隐式信息评分存储模块6、推荐结果展示模块7;所述用户日志信息存储模块4经用户日志信息采集处理模块3连接择优推荐系统处理模块2,所述隐式信息评分存储模块6经过隐式信息评分查询/构建/更新模块5连接择优推荐系统处理模块2,所述择优推荐系统处理模块2分别连接用户使用情况检测模块1,用户日志信息采集处理模块3,隐式信息评分查询/构建/更新模块5和推荐结果展示模块7;所述用户使用情况模块1用来检测用户的使用环境和使用行为,然后将用户的相关使用环境信息和使用行为信息传入择优推荐系统处理模块2,该择优推荐系统处理模块2向用户日志信息采集处理模块3请求用户的用户日志信息,用户日志信息采集处理模块3收到来自择优推荐系统处理模块2的用户日志信息请求后,从用户日志信息存储模块4中取出用户的用户日志信息并进行必要的预处理后返回给择优推荐系统处理模块2,随后择优推荐系统处理模块2进行影视择优推荐,期间择优推荐系统处理模块2会调用隐式信息评分查询/构建/更新模块5进行隐式信息评分的查询、构建或者更新,并将推荐结果列表传入到推荐结果展示模块7,该推荐结果展示模块7将推荐的结果列表展示给用户,让用户自行点击;隐式信息评分的持久化存储由隐式信息评分存储模块6管理。
如图2所示,一种基于隐式信息评分的影视择优推荐方法,采用上述的基于隐式信息评分的影视择优推荐系统进行操作,操作步骤如下:
1)用户使用情况检测模块1检测到用户的使用环境和使用行为,然后将用户的相关使用环境信息和使用行为信息传入择优推荐系统处理模块2;
2)择优推荐系统处理模块2收到用户的相关使用环境信息和使用行为信息后,向用户日志信息采集处理模块3请求择优推荐所需的用户日志信息;
3)用户日志信息采集处理模块3收到来自择优推荐系统处理模块2的用户日志信息请求后,从用户日志信息存储模块4中取出用户的用户日志信息并进行必要的预处理后返回给择优推荐系统处理模块2;
4)择优推荐系统处理模块2得到所需的用户日志信息后,以用户信息和行为轨迹为参数调用隐式信息评分查询/构建/更新模块5以请求隐式信息评分;
5)隐式信息评分查询/构建/更新模块5收到择优推荐系统处理模块2的请求后,从隐式信息评分存储模块6中查询隐式信息评分,并针对用户的不同情况进行隐式信息评分的构建或者更新,如果有更新则将隐式信息评分写回隐式信息评分存储模块6,并将隐式信息评分返回给择优推荐系统处理模块2;
6)择优推荐系统处理模块2得到隐式信息评分后用基于隐式信息评分的择优推荐进行处理得到推荐结果集,并将结果集传输给推荐结果展示模块7;
7)推荐结果展示模块7根据择优推荐系统处理模块2得到的数据提供一个API给不同的客户端调用,即客户端访问该API后得到以Json形式描述的推荐结果集后对其进行解析并以列表形式展示给用户,供用户随意选择。
所述步骤5)中根据用户信息和行为轨迹,从隐式信息评分存储模块6中查询隐式信息评分,并针对用户的不同情况进行隐式信息评分的构建或者更新,如果有更新则将隐式信息评分写回隐式信息评分存储模块6,并将隐式信息评分返回给择优推荐系统处理模块2,具体步骤如下:
5-1)根据用户信息从隐式信息评分存储模块6中查询隐式信息评分,如果查询不到隐式信息评分,则需要根据用户行为轨迹计算隐式信息评分,进行步骤5-2);如果查询到隐式信息评分,则将隐式信息评分返回给择优推荐系统处理模块2,进行步骤6);
5-2)将一天划分为若干个时段;
5-3)计算用户在不同时段下的行为轨迹;
5-4)计算用户在不同时段下的观看次数与观看时长;
5-5)计算用户常用的设备和地点;
5-6)计算用户对不同演员、不同标签观看的总时长;
5-7)根据用户行为轨迹中的观看记录,计算用户对不同节目的简单评分;
5-8)用户对不同节目的简单评分和节目的标签列表、演员列表、导演列表、分类列表和子分类列表,计算用户对此节目中的标签、演员、导演、分类和子分类的位置加权评分;
5-9)对于用户的所有观看记录,将上述各自类型的位置加权评分求和,得到用户对不同标签、演员、导演、分类和子分类的位置加权总评分;
5-10)对5-9)的各种类型的位置加权总评分进行归一化得到:用户对不同标签的归一化位置加权总评分,用户对不同演员的归一化位置加权总评分,用户对不同导演的归一化位置加权总评分,用户对分类的归一化位置加权总评分和用户对子分类的归一化位置加权总评分;
5-11)将上述归一化位置加权总评分作为隐式信息评分中的用户偏好信息、将用户信息作为隐式信息评分中的用户基本属性信息,将隐式信息评分写回隐式信息评分存储模块6,并将隐式信息评分返回给择优推荐系统处理模块2,进行步骤6)。
所述步骤6)中根据用户的相关使用环境信息、使用行为信息、用户的用户日志信息和用户的隐式信息评分信息计算用户对于其没有观看过的不同节目的隐式评分来计算用户对这些节目的偏好并根据隐式评分的大小得到初步的推荐结果,再结合用户使用环境信息、当前所处的时段,对推荐结果进行调整,并针对“冷启动”的情况提供了解决方案;主要包含以下几个步骤:
6-1)通过判断用户日志信息的数量是否大于给定阈值判断是否发生“冷启动”现象,即当用户的日志数量小于给定阈值时,推荐系统中只有该用户的少量日志,较难对用户的偏好进行计算,如果是,考虑到人们的兴趣爱好往往受到周围人的影响,通过其登录系统就一定会存在的设备型号和使用地点,得到与其同设备型号或者同设备品牌、同使用地点或者接近使用地点的其他用户普遍爱看的节目,将其加入推荐列表,传递给推荐结果展示模块7,进行步骤7);反之,进行6-2);
6-2)得到用户没有观看过的节目列表;
6-3)对于6-2)中得到的用户没有观看过的节目列表中的每一个节目,通过隐式信息评分中用户对不同标签的归一化位置加权总评分,用户对不同演员的归一化位置加权总评分,用户对不同导演的归一化位置加权总评分,用户对不同分类的归一化位置加权总评分和用户对不同子分类的归一化位置加权总评分计算用户对此节目的加权评分;
6-4)将6-3)中每个节目按照用户对此节目的加权评分从大到小排序,并取前若干个节目作为初步推荐列表;
6-5)考虑当前时间所处的时段q,通过用户u的隐式信息评分的基本属性中用户u不同时段下的观看习惯,如根据用户在时段下的观看时长、观看次数、用户在时段下观看时间最长的标签,对基本推荐列表的节目顺序做调整,使得节目时长更符合用户可能空闲时间长度的节目和更符号用户在当前时段下的口味的节目顺序更靠前,将最终的推荐列表传递给推荐结果展示模块7,进行步骤7)。
具体实施时,用户登录在线影视平台,从本发明推荐系统中取出包含他对不同标签、演员、导演、分类、子分类偏好(归一化位置加权总评分)的隐式信息评分,然后对于他没有看过的节目,根据这些偏好和公式(4)计算用户对于这些节目的隐式评分,然后按照隐式评分对这些节目进行排序得到初步的推荐列表;然后再根据隐式信息评分中用户在当前时段下的特殊偏好对初步推荐列表进行调整,例如用户在晚上登录在线影视平台,本发明推荐系统根据用户整体偏好得到的初步推荐列表中第一部为一部爱情片,第二部为一部纪录片,但用户在晚上特别喜欢观看纪录片,则这部纪录片将被调整至第一部的位置。
为了验证此模型的有效性和准确性,本实施例的全部过程都将一天划分为8个时段,将标签列表、演员列表、导演列表、分类列表和子分类列表的重要性权重均设为1。
通过设计3组实验方案分别验证算法的可行性与同类的算法基于用户的协同过滤推荐算法和基于矩阵分解的协同过滤推荐算法在相同的数据集上进行推荐准确率、误差等指标的对比。具体的实验技术方案如下:
方案一:本发明提出的算法的可行性验证。
方案二:本发明提出的算法与基于用户的协同过滤推荐算法关于推荐均值平均精度MAP的对比。
实验方案一的结果记录如下表格1-5所示。
表1某用户的行为轨迹
表2某用户在不同时段下的总观看次数和总观看时长
时段 总观看次数 总观看时长(秒)
1 0 0
2 0 0
3 0 0
4 31 7215
5 9 2421
6 19 1320
7 2 1532
8 10 903
表3某用户使用次数最多的设备型号
设备型号 使用次数
Vivo X20A 16
Vivo Y66 2
表4某用户使用次数最多的地点
地点 使用次数
Baoding,Hebei 16
Tangshan,Hebei 2
表5某用户观看时间最长的标签
标签 总的观看时间
剧情 3h 4min 3s
动作 2h 55min 30s
青春 15min 26s
军事 7min 20s
卡通 3min 5s
喜剧 2min 39s
实验方案二的结果记录如下表格6所示。
随着推荐个数TopN的增加,基于用户的协同过滤算法和基于隐式信息评分的协同过滤算法的MAP值均呈现下降趋势,这是由于MAP值考虑到了推荐节目在推荐列表中的位置,观察AP值的计算过程,随着推荐数量的增加,虽然命中的数量在增多,但由于越靠后总分增加的幅度急剧减小而分母线性增大,因此MAP值呈下降趋势。而在推荐个数TopN相同的情况下,基于隐式信息评分的推荐算法的MAP值远比基于用户的协同过滤算法高,这也表明基于隐式信息评分的加权评分策略能够充分发挥用户偏好的作用,使得与用户最喜爱的标签、演员、导演、分类和子分类等属性最相关的节目能够靠前推荐给用户,此外,还考虑到了用户在不同时段下的表现的不同,从而能取得更大的MAP值。由实验表明,该推荐策略是切实可行的,并且其推荐准确率比传统的基于用户的协同过滤推荐算法要高,如图3所示。
表6方案二的实验结果记录

Claims (4)

1.一种基于隐式信息评分的影视择优推荐系统,其特征在于,包括用户使用情况检测模块(1)、择优推荐系统处理模块(2)、用户日志信息采集处理模块(3)、用户日志信息存储模块(4)、隐式信息评分查询/构建/更新模块(5)、隐式信息评分存储模块(6)、推荐结果展示模块(7);所述用户日志信息存储模块(4)经用户日志信息采集处理模块(3)连接择优推荐系统处理模块(2),所述隐式信息评分存储模块(6)经过隐式信息评分查询/构建/更新模块(5)连接择优推荐系统处理模块(2),所述择优推荐系统处理模块(2)分别连接用户使用情况检测模块(1),用户日志信息采集处理模块(3),隐式信息评分查询/构建/更新模块(5)和推荐结果展示模块(7);所述用户使用情况模块(1)用来检测用户的使用环境和使用行为,然后将用户的相关使用环境信息和使用行为信息传入择优推荐系统处理模块(2),该择优推荐系统处理模块(2)向用户日志信息采集处理模块(3)请求用户的用户日志信息,用户日志信息采集处理模块(3)收到来自择优推荐系统处理模块(2)的用户日志信息请求后,从用户日志信息存储模块(4)中取出用户的用户日志信息并进行必要的预处理后返回给择优推荐系统处理模块(2),随后择优推荐系统处理模块(2)进行影视择优推荐,期间择优推荐系统处理模块(2)会调用隐式信息评分查询/构建/更新模块(5)进行隐式信息评分的查询、构建或者更新,并将推荐结果列表传入到推荐结果展示模块(7),该推荐结果展示模块(7)将推荐的结果列表展示给用户,让用户自行点击;隐式信息评分的持久化存储由隐式信息评分存储模块(6)管理。
2.一种基于隐式信息评分的影视择优推荐方法,采用根据权利要求1所述的基于隐式信息评分的影视择优推荐系统进行操作,其特征在于,操作步骤如下:
1)用户使用情况检测模块(1)检测用户的使用环境和使用行为,然后将用户的相关使用环境信息和使用行为信息传入择优推荐系统处理模块(2);
2)择优推荐系统处理模块(2)收到用户的相关使用环境信息和使用行为信息后,向用户日志信息采集处理模块(3)请求择优推荐所需的用户日志信息;
3)用户日志信息采集处理模块(3)收到来自择优推荐系统处理模块(2)的用户日志信息请求后,从用户日志信息存储模块(4)中取出用户的用户日志信息并进行必要的预处理后返回给择优推荐系统处理模块(2);
4)择优推荐系统处理模块(2)得到所需的用户日志信息后,以用户信息和行为轨迹为参数调用隐式信息评分查询/构建/更新模块(5)以请求隐式信息评分;
5)隐式信息评分查询/构建/更新模块(5)收到择优推荐系统处理模块(2)的请求后,从隐式信息评分存储模块(6)中查询隐式信息评分,并针对用户的不同情况进行隐式信息评分的构建或者更新,如果有更新则将隐式信息评分写回隐式信息评分存储模块(6),并将隐式信息评分返回给择优推荐系统处理模块(2);
6)择优推荐系统处理模块(2)得到隐式信息评分后用基于隐式信息评分的择优推荐进行处理得到推荐结果集,并将结果集传输给推荐结果展示模块(7);
7)推荐结果展示模块(7)根据择优推荐系统处理模块(2)得到的数据提供一个API给不同的客户端调用,即客户端访问该API后得到以Json形式描述的推荐结果集后对其进行解析并以列表形式展示给用户,供用户随意选择。
3.根据权利要求2所述的基于隐式信息评分的影视择优推荐方法,其特征在于:所述步骤5)中根据用户信息和行为轨迹,从隐式信息评分存储模块(6)中查询隐式信息评分,并针对用户的不同情况进行隐式信息评分的构建或者更新,如果有更新则将隐式信息评分写回隐式信息评分存储模块(6),并将隐式信息评分返回给择优推荐系统处理模块(2),具体步骤如下:
5-1)根据用户信息从隐式信息评分存储模块(6)中查询隐式信息评分,如果查询不到隐式信息评分,则需要根据用户行为轨迹计算隐式信息评分,进行步骤5-2);如果查询到隐式信息评分,则将隐式信息评分返回给择优推荐系统处理模块(2),进行步骤6);
5-2)将一天划分为若干个时段;
5-3)计算用户在不同时段下的行为轨迹;
5-4)计算用户在不同时段下的观看次数与观看时长;
5-5)计算用户常用的设备和地点;
5-6)计算用户对不同演员、不同标签观看的总时长;
5-7)根据用户行为轨迹中的观看记录,计算用户对不同节目的简单评分;
5-8)用户对不同节目的简单评分和节目的标签列表、演员列表、导演列表、分类列表和子分类列表,计算用户对此节目中的标签、演员、导演、分类和子分类的位置加权评分;
5-9)对于用户的所有观看记录,将上述各自类型的位置加权评分求和,得到用户对不同标签、演员、导演、分类和子分类的位置加权总评分;
5-10)对5-9)的各种类型的位置加权总评分进行归一化得到:用户对不同标签的归一化位置加权总评分,用户对不同演员的归一化位置加权总评分,用户对不同导演的归一化位置加权总评分,用户对不同分类的归一化位置加权总评分和用户对不同子分类的归一化位置加权总评分;
5-11)将上述归一化位置加权总评分作为隐式信息评分中的用户偏好信息、将用户信息作为隐式信息评分中的用户基本属性信息,将隐式信息评分写回隐式信息评分存储模块(6),并将隐式信息评分返回给择优推荐系统处理模块(2),进行步骤6)。
4.根据权利要求2所述的基于隐式信息评分的影视择优推荐方法,其特征在于:所述步骤6)中根据用户的相关使用环境信息、使用行为信息、用户的用户日志信息和用户的隐式信息评分信息计算用户对于其没有观看过的不同节目的隐式评分来计算用户对这些节目的偏好并根据隐式评分的大小得到初步的推荐结果,再结合用户使用环境信息、当前所处的时段,对推荐结果进行调整,并针对“冷启动”的情况提供了解决方案;主要包含以下几个步骤:
6-1)通过判断用户日志信息的数量是否大于给定阈值判断是否发生“冷启动”现象,即当用户的日志数量小于给定阈值时,推荐系统中只有该用户的少量日志,较难对用户的偏好进行计算,如果是,考虑到人们的兴趣爱好往往受到周围人的影响,通过其登录系统就一定会存在的设备型号和使用地点,得到与其同设备型号或者同设备品牌、同使用地点或者接近使用地点的其他用户普遍爱看的节目,将其加入推荐列表,传递给推荐结果展示模块(7),进行步骤7);反之,进行6-2);
6-2)得到用户没有观看过的节目列表;
6-3)对于6-2)中得到的用户没有观看过的节目列表中的每一个节目,通过隐式信息评分中用户对不同标签的归一化位置加权总评分,用户对不同演员的归一化位置加权总评分,用户对不同导演的归一化位置加权总评分,用户对不同分类的归一化位置加权总评分和用户对不同子分类的归一化位置加权总评分计算用户对此节目的加权评分;
6-4)将6-3)中每个节目按照用户对此节目的加权评分从大到小排序,并取前若干个节目作为初步推荐列表;
6-5)考虑当前时间所处的时段q,通过用户u的隐式信息评分的基本属性中用户u不同时段下的观看习惯,如根据用户在时段下的观看时长、观看次数、用户在时段下观看时间最长的标签,对基本推荐列表的节目顺序做调整,使得节目时长更符合用户可能空闲时间长度的节目和更符号用户在当前时段下的口味的节目顺序更靠前,将最终的推荐列表传递给推荐结果展示模块(7),进行步骤7)。
CN201810882454.4A 2018-08-06 2018-08-06 一种基于隐式信息评分的影视择优推荐方法 Active CN109246450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810882454.4A CN109246450B (zh) 2018-08-06 2018-08-06 一种基于隐式信息评分的影视择优推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810882454.4A CN109246450B (zh) 2018-08-06 2018-08-06 一种基于隐式信息评分的影视择优推荐方法

Publications (2)

Publication Number Publication Date
CN109246450A true CN109246450A (zh) 2019-01-18
CN109246450B CN109246450B (zh) 2021-07-06

Family

ID=65070142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810882454.4A Active CN109246450B (zh) 2018-08-06 2018-08-06 一种基于隐式信息评分的影视择优推荐方法

Country Status (1)

Country Link
CN (1) CN109246450B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109672938A (zh) * 2019-01-07 2019-04-23 河北工业大学 一种iptv节目推荐方法
CN110602533A (zh) * 2019-09-10 2019-12-20 四川长虹电器股份有限公司 分时段分人群的智能电视广告推荐系统及其推荐方法
CN110598047A (zh) * 2019-08-22 2019-12-20 优地网络有限公司 一种影视信息推荐方法、装置、电子设备及存储介质
CN110996177A (zh) * 2019-11-27 2020-04-10 北京爱奇艺智慧娱乐科技有限公司 面向点播影院的视频推荐方法、装置及设备
CN111950733A (zh) * 2019-05-15 2020-11-17 阿里巴巴集团控股有限公司 信息流的排序方法、装置及计算机存储介质
CN112612956A (zh) * 2020-12-23 2021-04-06 陇东学院 一种基于全景视图的艺术设计方法和平台
CN114422859A (zh) * 2020-10-28 2022-04-29 贵州省广播电视信息网络股份有限公司 基于深度学习的有线电视运营商的排序推荐系统及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297853A (zh) * 2013-06-07 2013-09-11 华东师范大学 一种基于多用户上下文识别的iptv节目推荐方法
CN105045931A (zh) * 2015-09-02 2015-11-11 南京邮电大学 一种基于Web挖掘的视频推荐方法和系统
CN105704566A (zh) * 2016-04-25 2016-06-22 浪潮软件集团有限公司 一种基于电视机顶盒的视频推荐系统
CN106028071A (zh) * 2016-05-17 2016-10-12 Tcl集团股份有限公司 一种视频推荐方法及系统
CN106604068A (zh) * 2016-12-30 2017-04-26 中广热点云科技有限公司 一种更新媒体节目的方法及其系统
US20170188102A1 (en) * 2015-12-23 2017-06-29 Le Holdings (Beijing) Co., Ltd. Method and electronic device for video content recommendation
CN107391687A (zh) * 2017-07-24 2017-11-24 华中师范大学 一种面向地方志网站的混合推荐系统
CN107454474A (zh) * 2017-08-17 2017-12-08 四川长虹电器股份有限公司 一种基于协同过滤的电视终端节目个性化推荐方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297853A (zh) * 2013-06-07 2013-09-11 华东师范大学 一种基于多用户上下文识别的iptv节目推荐方法
CN105045931A (zh) * 2015-09-02 2015-11-11 南京邮电大学 一种基于Web挖掘的视频推荐方法和系统
US20170188102A1 (en) * 2015-12-23 2017-06-29 Le Holdings (Beijing) Co., Ltd. Method and electronic device for video content recommendation
CN105704566A (zh) * 2016-04-25 2016-06-22 浪潮软件集团有限公司 一种基于电视机顶盒的视频推荐系统
CN106028071A (zh) * 2016-05-17 2016-10-12 Tcl集团股份有限公司 一种视频推荐方法及系统
CN106604068A (zh) * 2016-12-30 2017-04-26 中广热点云科技有限公司 一种更新媒体节目的方法及其系统
CN107391687A (zh) * 2017-07-24 2017-11-24 华中师范大学 一种面向地方志网站的混合推荐系统
CN107454474A (zh) * 2017-08-17 2017-12-08 四川长虹电器股份有限公司 一种基于协同过滤的电视终端节目个性化推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王义嘉: "基于隐式反馈的视频类推荐系统优化", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
胡光能: "推荐系统中多源信息融合和隐式反馈挖掘的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109672938A (zh) * 2019-01-07 2019-04-23 河北工业大学 一种iptv节目推荐方法
CN111950733A (zh) * 2019-05-15 2020-11-17 阿里巴巴集团控股有限公司 信息流的排序方法、装置及计算机存储介质
CN110598047A (zh) * 2019-08-22 2019-12-20 优地网络有限公司 一种影视信息推荐方法、装置、电子设备及存储介质
CN110602533A (zh) * 2019-09-10 2019-12-20 四川长虹电器股份有限公司 分时段分人群的智能电视广告推荐系统及其推荐方法
CN110996177A (zh) * 2019-11-27 2020-04-10 北京爱奇艺智慧娱乐科技有限公司 面向点播影院的视频推荐方法、装置及设备
CN114422859A (zh) * 2020-10-28 2022-04-29 贵州省广播电视信息网络股份有限公司 基于深度学习的有线电视运营商的排序推荐系统及方法
CN114422859B (zh) * 2020-10-28 2024-01-30 贵州省广播电视信息网络股份有限公司 基于深度学习的有线电视运营商的排序推荐系统及方法
CN112612956A (zh) * 2020-12-23 2021-04-06 陇东学院 一种基于全景视图的艺术设计方法和平台

Also Published As

Publication number Publication date
CN109246450B (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN109246450A (zh) 一种基于隐式信息评分的影视择优推荐系统及方法
CN109241405B (zh) 一种基于知识关联的学习资源协同过滤推荐方法及系统
US9706008B2 (en) Method and system for efficient matching of user profiles with audience segments
US9692843B1 (en) System and method for associating individual household members with television programs viewed
CN105912729B (zh) 基于三维时序动态模型的手机游戏推荐系统
US9044183B1 (en) Intra-video ratings
CN105142028B (zh) 面向三网融合的电视节目内容搜索与推荐方法
US8671095B2 (en) Method for providing search results including relevant location based content
CN103649981B (zh) 用于输送目标内容的方法和装置
KR101947667B1 (ko) 비디오 검색용 시청 시간 클러스터링
CN102999507B (zh) 网络微博名人信息的推荐处理方法和装置
US20090287687A1 (en) System and method for recommending venues and events of interest to a user
CN105608121B (zh) 一种个性化推荐方法及装置
TW201447797A (zh) 內容個人化之多相排序方法和系統
CN104935970A (zh) 进行电视内容推荐的方法及电视客户端
Yazdanfar et al. Link recommender: Collaborative-filtering for recommending urls to twitter users
CN102523511A (zh) 一种网络节目聚合及节目推荐系统和方法
CN108920577A (zh) 电视智能推荐方法
Wakamiya et al. Crowd-powered TV viewing rates: measuring relevancy between tweets and TV programs
CN109508407A (zh) 融合时间与兴趣相似度的电视产品推荐方法
CN114186130A (zh) 一种基于大数据的体育资讯推荐方法
Ha et al. Personalized advertisement system using social relationship based user modeling
Kumar et al. A survey on popular recommender systems
US8949228B2 (en) Identification of new sources for topics
Yang et al. Social-group-based ranking algorithms for cold-start video recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant