CN105704566A - 一种基于电视机顶盒的视频推荐系统 - Google Patents
一种基于电视机顶盒的视频推荐系统 Download PDFInfo
- Publication number
- CN105704566A CN105704566A CN201610258946.7A CN201610258946A CN105704566A CN 105704566 A CN105704566 A CN 105704566A CN 201610258946 A CN201610258946 A CN 201610258946A CN 105704566 A CN105704566 A CN 105704566A
- Authority
- CN
- China
- Prior art keywords
- video
- user
- top box
- set top
- system based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006399 behavior Effects 0.000 claims abstract description 32
- 238000001914 filtration Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000008676 import Effects 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于电视机顶盒的视频推荐系统,包括日志采集系统、推荐引擎,其中日志采集系统收集用户的行为和对推荐引擎的反馈;推荐引擎由分布式计算平台及关系型或NoSql数据库组成,混合使用协同过滤和内容过滤,该推荐引擎是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频推荐给用户。该基于电视机顶盒的视频推荐系统与现有技术相比,通过协同过滤算法和内容过滤算法的方式,实现电视节目的推荐选择,提升数字电视用户的用户体验,实用性强,智能程度高,符合不同电视观众的需求,易于推广。
Description
技术领域
本发明涉及数字电视技术领域,具体地说是一种实用性强、基于电视机顶盒的视频推荐系统。
背景技术
随着技术的进步,目前我国有线数字电视用户将近2亿,而双向数字电视也得到了大跨步的发展,双向指的是除了接受电视台的信号,用户的数据回传给电视台,从而实现诸如电影点播,快进快退,以及延伸出来的诸如电视查询,电视银行等业务,这类业务都是需要双向数据传输才能实现的。双向机顶盒比单向机顶盒复杂很多,也需要双向网络改造的支持,所以成本高很多。
此外,协同过滤推荐(CollaborativeFilteringrecommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。基于物品协同过滤(ItemBaseCF)的基本思想是预先根据所有用户的历史偏好数据计算物品之间的相似性,然后把与用户喜欢的物品相类似的物品推荐给用户。内容过滤的基本思想是给用户推荐和他们之前喜欢的物品在内容上相似的其他物品。
基于此,本发明提出一种基于电视机顶盒的视频推荐系统,通过使用上述两种算法,实现双向数字电视用户的电视推荐,提高用户体验。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、基于电视机顶盒的视频推荐系统。
一种基于电视机顶盒的视频推荐系统,包括日志采集系统、推荐引擎,其中日志采集系统收集用户的行为和对推荐引擎的反馈;推荐引擎由分布式计算平台及关系型或NoSql数据库组成,混合使用协同过滤和内容过滤,该推荐引擎是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频推荐给用户。
所述日志采集系统由机顶盒、服务器端的日志收集系统组成,其中机顶盒上报用户行为记录,服务器端则使用日志收集系统Flume-ng将机顶盒上报的行为日志收集汇总到中心存储HDFS。
机顶盒上报的行为记录是指机顶盒将用户行为信息、用户信息、视频信息以日志文件的形式传给日志采集系统。
行为记录具体包括用户ID、视频ID、视频年代、视频评分、视频类型、视频导演、视频演员、视频地区、视频总时长、用户收看时长、时间戳信息。
服务器端的日志收集系统收集汇总完行为日志后,对所有的行为日志进行过滤、数据清洗,然后汇总到HDFS,使用Spark实现分布式计算算法,计算得出的视频用户喜好信息更新到数据库,并通过机顶盒推荐给用户。
所述分布式计算算法具体为:使用SparkonYarn分布式计算平台,通过物品协同过滤、基于内容过滤算法对用户行为进行分析,得到用户观看矩阵、相似视频矩阵,计算得到推荐结果,其中通过物品协同过滤算法推荐旧的视频资源给机顶盒长期用户,通过内容过滤算法推荐新增用户或新增视频。
当推荐结果计算得出后,该推荐结果导入到关系型数据库、NoSql数据库,然后通过机顶盒查询推荐内容,并将内容展现给用户。
本发明的一种基于电视机顶盒的视频推荐系统,具有以下优点:
本发明提供的一种基于电视机顶盒的视频推荐系统通过协同过滤算法和内容过滤算法的方式,实现电视节目的推荐选择,提升数字电视用户的用户体验,实用性强,智能程度高,符合不同电视观众的需求,易于推广。
附图说明
附图1为本发明的视频推荐系统架构图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
如附图1所示,本发明的一种基于电视机顶盒的视频推荐系统,包括日志采集系统、推荐引擎,其中日志采集系统收集用户的行为和对推荐引擎的反馈;推荐引擎由分布式计算平台及关系型或NoSql数据库组成,混合使用协同过滤和内容过滤,该推荐引擎是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频推荐给用户。
所述日志采集系统由机顶盒、服务器端的日志收集系统组成,其中机顶盒上报用户行为记录,服务器端则使用日志收集系统Flume-ng将机顶盒上报的行为日志收集汇总到中心存储HDFS。
机顶盒上报的行为记录是指机顶盒将用户行为信息、用户信息、视频信息以日志文件的形式传给日志采集系统。
行为记录具体包括用户ID、视频ID、视频年代、视频评分、视频类型、视频导演、视频演员、视频地区、视频总时长、用户收看时长、时间戳信息。
服务器端的日志收集系统收集汇总完行为日志后,对所有的行为日志进行过滤、数据清洗,然后汇总到HDFS,使用Spark实现分布式计算算法,计算得出的视频用户喜好信息更新到数据库,并通过机顶盒推荐给用户。
所述分布式计算算法具体为:使用SparkonYarn分布式计算平台,通过物品协同过滤、基于内容过滤算法对用户行为进行分析,得到用户观看矩阵、相似视频矩阵,计算得到推荐结果,其中通过物品协同过滤算法推荐旧的视频资源给机顶盒长期用户,通过内容过滤算法推荐新增用户或新增视频。
上述两种算法具体解释如下。
协同过滤算法:主要关注“User”与“Item”之间的关联,与具体Item本身的特征没有关系,基于的假设是相似的User会喜欢相似的Item,或者同一个Item下相似的User给出的评分也相似。
基于内容过滤算法:与具体的User不在有关系,只关注Item本身的特征,根据Item获得与之特征相似的Item。
举例说明:
用户u1喜欢的电影是A,B,C;用户u2喜欢的电影是A,C,E,F;用户u3喜欢的电影是B,D;
我们需要解决的问题是:决定对u1是不是应该推荐F这部电影;
基于内容过滤算法:要分析F的特征和u1所喜欢的A、B、C的特征,需要知道的信息是A(战争片),B(战争片),C(剧情片),如果F(战争片),那么F很大程度上可以推荐给u1,这是基于内容的做法,你需要对item进行特征建立和建模。
协同过滤算法:完全可以忽略item的建模,因为这种办法的决策是依赖user和item之间的关系,也就是这里的用户和电影之间的关系。我们不再需要知道ABCF哪些是战争片,哪些是剧情片,我们只需要知道用户u1和u2按照item向量表示,他们的相似度比较高,那么我们可以把u2所喜欢的F这部影片推荐给u1。
当推荐结果计算得出后,该推荐结果导入到关系型数据库、NoSql数据库,然后通过机顶盒查询推荐内容,并将内容展现给用户。
具体实例如附图1所示。
首先搭建Zookeeper集群,用作Hadoop2和Spark的协调服务。
然后需要搭建Hadoop2集群,使用HDFS作为日志文件的分布式存储,使用Yarn作为资源调度框架。
然后需要在各个日志服务器上面搭建Flume-ng用作日志采集,再另找一台节点同样搭建Flume-ng作为中转,进行数据清洗后将日志汇总到HDFS。
然后在Hadoop2的基础上搭建Spark集群,作为分布式计算框架。
用Spark框架编写基于物品协同过滤算法程序以及基于内容过滤程序,部署在Spark集群上进行日至分析。
定期将分析后的数据更新到数据库,客户端可根据用户查询数据库里的视频推荐信息展示到机顶盒上。从而实现双向机顶盒视频推荐。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的一种基于电视机顶盒的视频推荐系统的权利要求书的且任何所述技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。
Claims (7)
1.一种基于电视机顶盒的视频推荐系统,其特征在于,包括日志采集系统、推荐引擎,其中日志采集系统收集用户的行为和对推荐引擎的反馈;推荐引擎由分布式计算平台及关系型或NoSql数据库组成,混合使用协同过滤和内容过滤,该推荐引擎是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频推荐给用户。
2.根据权利要求1所述的一种基于电视机顶盒的视频推荐系统,其特征在于,所述日志采集系统由机顶盒、服务器端的日志收集系统组成,其中机顶盒上报用户行为记录,服务器端则使用日志收集系统Flume-ng将机顶盒上报的行为日志收集汇总到中心存储HDFS。
3.根据权利要求2所述的一种基于电视机顶盒的视频推荐系统,其特征在于,机顶盒上报的行为记录是指机顶盒将用户行为信息、用户信息、视频信息以日志文件的形式传给日志采集系统。
4.根据权利要求3所述的一种基于电视机顶盒的视频推荐系统,其特征在于,行为记录具体包括用户ID、视频ID、视频年代、视频评分、视频类型、视频导演、视频演员、视频地区、视频总时长、用户收看时长、时间戳信息。
5.根据权利要求2所述的一种基于电视机顶盒的视频推荐系统,其特征在于,服务器端的日志收集系统收集汇总完行为日志后,对所有的行为日志进行过滤、数据清洗,然后汇总到HDFS,使用Spark实现分布式计算算法,计算得出的视频用户喜好信息更新到数据库,并通过机顶盒推荐给用户。
6.根据权利要求5所述的一种基于电视机顶盒的视频推荐系统,其特征在于,所述分布式计算算法具体为:使用SparkonYarn分布式计算平台,通过物品协同过滤、基于内容过滤算法对用户行为进行分析,得到用户观看矩阵、相似视频矩阵,计算得到推荐结果,其中通过物品协同过滤算法推荐旧的视频资源给机顶盒长期用户,通过内容过滤算法推荐新增用户或新增视频。
7.根据权利要求6所述的一种基于电视机顶盒的视频推荐系统,其特征在于,当推荐结果计算得出后,该推荐结果导入到关系型数据库、NoSql数据库,然后通过机顶盒查询推荐内容,并将内容展现给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610258946.7A CN105704566A (zh) | 2016-04-25 | 2016-04-25 | 一种基于电视机顶盒的视频推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610258946.7A CN105704566A (zh) | 2016-04-25 | 2016-04-25 | 一种基于电视机顶盒的视频推荐系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105704566A true CN105704566A (zh) | 2016-06-22 |
Family
ID=56217472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610258946.7A Pending CN105704566A (zh) | 2016-04-25 | 2016-04-25 | 一种基于电视机顶盒的视频推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105704566A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021609A (zh) * | 2016-06-24 | 2016-10-12 | 武汉斗鱼网络科技有限公司 | 一种实现网站视频智能推荐的方法及装置 |
CN108449216A (zh) * | 2018-04-09 | 2018-08-24 | 中科微至智能制造科技江苏有限公司 | 一种基于Spark技术的物流分拣数据统计方法 |
CN108491277A (zh) * | 2017-12-28 | 2018-09-04 | 华南师范大学 | 一种中小学生学习资源实时热点协同过滤及推荐的方法 |
CN109005461A (zh) * | 2018-08-01 | 2018-12-14 | 优视科技新加坡有限公司 | 一种视频对象的推荐方法、装置和设备/终端/服务器 |
CN109246450A (zh) * | 2018-08-06 | 2019-01-18 | 上海大学 | 一种基于隐式信息评分的影视择优推荐系统及方法 |
CN113744021A (zh) * | 2021-02-08 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种推荐方法、装置、计算机存储介质及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101819572A (zh) * | 2009-09-15 | 2010-09-01 | 电子科技大学 | 一种用户兴趣模型的建立方法 |
CN103139616A (zh) * | 2013-02-27 | 2013-06-05 | 中山大学 | 基于多用户的数字电视节目的个性化云推荐方法及系统 |
KR20130062442A (ko) * | 2011-11-22 | 2013-06-13 | 주식회사 케이티 | 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템 |
CN103500215A (zh) * | 2013-09-30 | 2014-01-08 | 乐视网信息技术(北京)股份有限公司 | 一种多媒体文件推荐方法及装置 |
CN103577403A (zh) * | 2012-07-19 | 2014-02-12 | 镇江雅迅软件有限责任公司 | 基于云计算技术的推荐系统实现方法 |
CN103716702A (zh) * | 2013-12-17 | 2014-04-09 | 三星电子(中国)研发中心 | 电视节目推荐装置和方法 |
CN103905874A (zh) * | 2012-12-25 | 2014-07-02 | 北京佳视互动科技股份有限公司 | 一种基于带dvb模块的机顶盒、epg信息推荐方法及系统 |
JP2014203392A (ja) * | 2013-04-09 | 2014-10-27 | キヤノン株式会社 | 文書管理装置、文書管理方法、及びプログラム |
CN104378659A (zh) * | 2014-10-31 | 2015-02-25 | 四川长虹电器股份有限公司 | 基于智能电视的个性化推荐方法 |
CN104636494A (zh) * | 2015-03-04 | 2015-05-20 | 浪潮电子信息产业股份有限公司 | 一种基于Spark大数据平台的日志审计倒查系统 |
CN105426392A (zh) * | 2015-10-28 | 2016-03-23 | 浪潮软件集团有限公司 | 一种协同过滤推荐方法及系统 |
-
2016
- 2016-04-25 CN CN201610258946.7A patent/CN105704566A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101819572A (zh) * | 2009-09-15 | 2010-09-01 | 电子科技大学 | 一种用户兴趣模型的建立方法 |
KR20130062442A (ko) * | 2011-11-22 | 2013-06-13 | 주식회사 케이티 | 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템 |
CN103577403A (zh) * | 2012-07-19 | 2014-02-12 | 镇江雅迅软件有限责任公司 | 基于云计算技术的推荐系统实现方法 |
CN103905874A (zh) * | 2012-12-25 | 2014-07-02 | 北京佳视互动科技股份有限公司 | 一种基于带dvb模块的机顶盒、epg信息推荐方法及系统 |
CN103139616A (zh) * | 2013-02-27 | 2013-06-05 | 中山大学 | 基于多用户的数字电视节目的个性化云推荐方法及系统 |
JP2014203392A (ja) * | 2013-04-09 | 2014-10-27 | キヤノン株式会社 | 文書管理装置、文書管理方法、及びプログラム |
CN103500215A (zh) * | 2013-09-30 | 2014-01-08 | 乐视网信息技术(北京)股份有限公司 | 一种多媒体文件推荐方法及装置 |
CN103716702A (zh) * | 2013-12-17 | 2014-04-09 | 三星电子(中国)研发中心 | 电视节目推荐装置和方法 |
CN104378659A (zh) * | 2014-10-31 | 2015-02-25 | 四川长虹电器股份有限公司 | 基于智能电视的个性化推荐方法 |
CN104636494A (zh) * | 2015-03-04 | 2015-05-20 | 浪潮电子信息产业股份有限公司 | 一种基于Spark大数据平台的日志审计倒查系统 |
CN105426392A (zh) * | 2015-10-28 | 2016-03-23 | 浪潮软件集团有限公司 | 一种协同过滤推荐方法及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021609A (zh) * | 2016-06-24 | 2016-10-12 | 武汉斗鱼网络科技有限公司 | 一种实现网站视频智能推荐的方法及装置 |
CN108491277A (zh) * | 2017-12-28 | 2018-09-04 | 华南师范大学 | 一种中小学生学习资源实时热点协同过滤及推荐的方法 |
CN108449216A (zh) * | 2018-04-09 | 2018-08-24 | 中科微至智能制造科技江苏有限公司 | 一种基于Spark技术的物流分拣数据统计方法 |
CN109005461A (zh) * | 2018-08-01 | 2018-12-14 | 优视科技新加坡有限公司 | 一种视频对象的推荐方法、装置和设备/终端/服务器 |
WO2020026009A1 (zh) * | 2018-08-01 | 2020-02-06 | 优视科技新加坡有限公司 | 一种视频对象的推荐方法、装置和设备/终端/服务器 |
CN109246450A (zh) * | 2018-08-06 | 2019-01-18 | 上海大学 | 一种基于隐式信息评分的影视择优推荐系统及方法 |
CN109246450B (zh) * | 2018-08-06 | 2021-07-06 | 上海大学 | 一种基于隐式信息评分的影视择优推荐方法 |
CN113744021A (zh) * | 2021-02-08 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种推荐方法、装置、计算机存储介质及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105704566A (zh) | 一种基于电视机顶盒的视频推荐系统 | |
CN107852252B (zh) | 通过自动内容辨识指纹匹配来检测频道改变 | |
US9848240B2 (en) | Assessing digital content across a communications network | |
CN102811371B (zh) | 智能电视应用程序推荐的方法、系统及装置 | |
US9955231B2 (en) | Relevant video content pushed to a mobile phone | |
CN103986749B (zh) | 资源共享系统和资源共享方法 | |
CN103634687B (zh) | 智能电视中提供视频搜索结果的方法及系统 | |
CN104584571B (zh) | 在机顶盒处产生音频指纹序列 | |
CN107980129A (zh) | 用于重叠的媒体目录的全球推荐系统 | |
Daidj et al. | Towards new coopetition-based business models? The case of Netflix on the French market | |
CN110430471A (zh) | 一种基于瞬时计算的电视推荐方法和系统 | |
CN104394471A (zh) | 一种智能推荐用户喜爱节目的方法 | |
CN103136275A (zh) | 个性化视频推荐系统及方法 | |
WO2012173670A1 (en) | Systems and methods for providing media recommendations | |
CN101482884A (zh) | 一种基于用户偏好评分分布的协作推荐系统 | |
CN105224576A (zh) | 一种影视智能推荐方法 | |
CN108920577A (zh) | 电视智能推荐方法 | |
US20140059579A1 (en) | Systems and methods for projecting viewership data | |
CN108320168B (zh) | 一种数据分析方法及装置 | |
CN105323601A (zh) | 基于多屏用户行为数据的人员属性标识方法 | |
CN103686231A (zh) | 影片的集成管理、失效替换与续播的方法及系统 | |
CN103577593A (zh) | 一种基于微博热门话题的视频聚合方法及系统 | |
CN103905916A (zh) | 一种面向区域的机顶盒P2P-Vod系统及数据预部署方法 | |
Kosterich | Reconfiguring the “hits”: The new portrait of television program success in an era of big data | |
CN105426550A (zh) | 一种基于用户质量模型的协同过滤标签推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160622 |