CN107608989A - 一种分类个性化推荐方法 - Google Patents

一种分类个性化推荐方法 Download PDF

Info

Publication number
CN107608989A
CN107608989A CN201610546769.2A CN201610546769A CN107608989A CN 107608989 A CN107608989 A CN 107608989A CN 201610546769 A CN201610546769 A CN 201610546769A CN 107608989 A CN107608989 A CN 107608989A
Authority
CN
China
Prior art keywords
video display
cluster
classification
candidate
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610546769.2A
Other languages
English (en)
Inventor
王世欣
沈婧
王守军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI STARTEK INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI STARTEK INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI STARTEK INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI STARTEK INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610546769.2A priority Critical patent/CN107608989A/zh
Publication of CN107608989A publication Critical patent/CN107608989A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分类个性化推荐方法,包括以下步骤:获取可供推荐的影视元数据并进行分类;对分类后的进行相似影视检索以获得候选影视;通过排序权重对候选影视进行相似排序;进行用户行为聚类并根据聚类结果生成分类推荐候选影视;对候选影视进行分类排序后获得用于显示的推荐结果;对影片类别的划分,分类别单独计算推荐内容,对用户行为进行聚类建立用户画像,使用聚类获得的用户画像生成推荐结果;基于用户的长期观看历史行为和整个片库,分别提取电影、电视剧、综艺等兴趣特征,分类进行个性化推荐;基于内容推荐,不受用户‑影片关联矩阵稀疏问题影响,具有良好的解释性和推荐效果。

Description

一种分类个性化推荐方法
技术领域
本发明涉及电视视频领域,尤其涉及一种分类个性化推荐方法。
背景技术
推荐系统存在很多推荐算法,不乏像协同过滤一样比较成熟的算法,但在不同的应用场景,基于不同的数据应用时并不能完全满足需求。在使用全网的视频作为推荐内容时,不可避免的遇到了用户-视频关联矩阵稀疏问题。
发明内容
鉴于目前存在的上述不足,本发明提供一种分类个性化推荐方法,能够基于用户的长期观看历史行为和整个片库分类进行个性化推荐。
为达到上述目的,本发明的实施例采用如下技术方案:
一种分类个性化推荐方法,所述分类个性化推荐方法包括以下步骤:
获取可供推荐的影视元数据并进行分类;
对分类后的进行相似影视检索以获得候选影视;
通过排序权重对候选影视进行相似排序;
进行用户行为聚类并根据聚类结果生成分类推荐候选影视;
对候选影视进行分类排序后获得用于显示的推荐结果。
依照本发明的一个方面,所述获取可供推荐的影视元数据包括:获取互联网数据、深度EPG数据和点播元数据,以形成统一影视元数据管理库。
依照本发明的一个方面,所述进行相似影视检索以获得候选影视包括:将每一部影视元数据转换成向量,对向量的元素进行加权,再将影视库的所有影视进行转换,用所有向量构建KD-Tree,遍历所有向量,每个影视使用KD-Tree检索到最相似的k部影视作为候选影视。
依照本发明的一个方面,所述进行用户行为聚类包括:对用户观看过的影片使用聚类算法进行粗聚类。
依照本发明的一个方面,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:从聚类结果的每个簇中提取质心向量v,簇id cid、簇内影片个数cn、最近的观看时间tl,提取出来的信息作为用户画像。遍历获取到的簇质心向量,每个簇用质心向量从构建好的KD-Tree中搜索k个近邻作为候选影片。
依照本发明的一个方面,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:对于每个类型影视的每个簇,将簇的质心向量作为一个影视向量计算相似推荐结果作为该簇的候选结果。
依照本发明的一个方面,所述对候选影视进行排序后获得用于显示的推荐结果包括:每个类别分别对所有簇根据簇内观看记录数量降序排列,填入对应簇的相似推荐结果,即得到推荐结果。
依照本发明的一个方面,所述获取可供推荐的影视元数据并进行分类包括:将影视元数据分成5类,每一个类别根据用户该类别的观看记录计算推荐结果。
依照本发明的一个方面,所述分类的5个类别为:电影,电视剧,纪录片,动漫和综艺。
本发明实施的优点:本发明所述的分类个性化推荐方法包括以下步骤:获取可供推荐的影视元数据并进行分类;对分类后的进行相似影视检索以获得候选影视;通过排序权重对候选影视进行相似排序;进行用户行为聚类并根据聚类结果生成分类推荐候选影视;对候选影视进行分类排序后获得用于显示的推荐结果;对影片类别的划分,分类别单独计算推荐内容,对用户行为进行聚类建立用户画像,使用聚类获得的用户画像生成推荐结果;基于用户的长期观看历史行为(家庭成员用户画像基本保持不变)和整个片库,分别提取电影、电视剧、综艺等兴趣特征,分类进行个性化推荐;基于内容推荐,不受用户-影片关联矩阵稀疏问题影响,具有良好的解释性和推荐效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述的一种分类个性化推荐方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种分类个性化推荐方法,所述分类个性化推荐方法包括以下步骤:
步骤S1:获取可供推荐的影视元数据并进行分类;
在实际应用中,所述获取可供推荐的影视元数据包括:获取互联网数据、深度EPG数据和点播元数据,以形成统一影视元数据管理库。
在实际应用中,可将影视信息分成5类{电影,电视剧,纪录片,动漫,综艺},每一个类别根据用户该类别的观看记录计算推荐结果。
步骤S2:对分类后的进行相似影视检索以获得候选影视;
在实际应用中,所述进行相似影视检索以获得候选影视包括:将每一部影视元数据转换成向量,对向量的元素进行加权,再将影视库的所有影视进行转换,用所有向量构建KD-Tree,遍历所有向量,每个影视使用KD-Tree检索到最相似的k部影视作为候选影视。
将每一步影片转换成向量。例如:
影片id 影片标签 影片地区 上映时间 月播放量
1024 科幻 中国 2008 132000
假设只有科幻、动作两个影片标签;只有中国和国外两个地区标签的情况。
使用函数f(x)=arctan(ln(x+1)*p)来处理播放量,p为控制播放量平滑程度的变量。
使用函数g(t)=(t-1900)/(2016-1900)来处理上映时间。
就可以将这部影片转换为向量:
科幻 动作 中国 国外 上映时间 月播放量
1 0 1 0 0.93 0.95
对向量的元素进行加权,比如我们希望地区拥有比单个标签更高的权重,影片的第一个标签获得额外0.1的权重:
科幻 动作 中国 国外 上映时间 月播放量
1.1 0 2 0 0.93 0.95
将影视库的所有影片进行转换:
科幻 动作 中国 国外 上映时间 月播放量
1.1 0 2 0 0.93 0.95
... ... ... ... ... ...
用所有向量构建KD-Tree,遍历所有向量,每个影片使用KD-Tree检索到最相似的k部影片作为候选影片。
步骤S3:通过排序权重对候选影视进行相似排序;
对于一部影片A的候选影片B
我们使用函数Wb=(1+上映时间*时间权重)*(1+月播放量*播放量权重)*(1+A与B相似度*相似度权重)来作为影片B在影片A的相似推荐列表中的排序权重。计算所有A的候选影片的排序权重并按照排序权重降序排列截断,即得到影片A的相似推荐结果。
步骤S4:进行用户行为聚类并根据聚类结果生成分类推荐候选影视;
在实际应用中,所述进行用户行为聚类包括:对用户观看过的影片使用聚类算法进行粗聚类。为找到用户的兴趣点并在兴趣点上推荐更多影片或将兴趣点影片顺序更靠前显示,我们对用户观看过的影片使用聚类算法进行粗聚类。
在实际应用中,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:从聚类结果的每个簇中提取质心向量v,簇id cid、簇内影片个数cn、最近的观看时间tl,提取出来的信息作为用户画像。遍历获取到的簇质心向量,每个簇用质心向量从构建好的KD-Tree中搜索k个近邻作为候选影片。
在实际应用中,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:对于每个类型影视的每个簇,将簇的质心向量作为一个影视向量计算相似推荐结果作为该簇的候选结果。
步骤S5:对候选影视进行分类排序后获得用于显示的推荐结果。
在实际应用中,所述对候选影视进行排序后获得用于显示的推荐结果包括:每个类别分别对所有簇根据簇内观看记录数量降序排列,填入对应簇的相似推荐结果,即得到推荐结果。
本发明实施的优点:本发明所述的分类个性化推荐方法包括以下步骤:获取可供推荐的影视元数据并进行分类;对分类后的进行相似影视检索以获得候选影视;通过排序权重对候选影视进行相似排序;进行用户行为聚类并根据聚类结果生成分类推荐候选影视;对候选影视进行分类排序后获得用于显示的推荐结果;对影片类别的划分,分类别单独计算推荐内容,对用户行为进行聚类建立用户画像,使用聚类获得的用户画像生成推荐结果;基于用户的长期观看历史行为(家庭成员用户画像基本保持不变)和整个片库,分别提取电影、电视剧、综艺等兴趣特征,分类进行个性化推荐;基于内容推荐,不受用户-影片关联矩阵稀疏问题影响,具有良好的解释性和推荐效果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种分类个性化推荐方法,其特征在于,所述分类个性化推荐方法包括以下步骤:
获取可供推荐的影视元数据并进行分类;
对分类后的进行相似影视检索以获得候选影视;
通过排序权重对候选影视进行相似排序;
进行用户行为聚类并根据聚类结果生成分类推荐候选影视;
对候选影视进行分类排序后获得用于显示的推荐结果。
2.根据权利要求1所述的分类个性化推荐方法,其特征在于,所述获取可供推荐的影视元数据包括:获取互联网数据、深度EPG数据和点播元数据,以形成统一影视元数据管理库。
3.根据权利要求1所述的分类个性化推荐方法,其特征在于,所述进行相似影视检索以获得候选影视包括:将每一部影视元数据转换成向量,对向量的元素进行加权,再将影视库的所有影视进行转换,用所有向量构建KD-Tree或其他有序数据结构表达,遍历所有向量,每个影视使用KD-Tree检索到最相似的k部影视作为候选影视。
4.根据权利要求1所述的分类个性化推荐方法,其特征在于,所述进行用户行为聚类包括:对用户观看过的影片使用聚类算法进行粗聚类。
5.根据权利要求3所述的分类个性化推荐方法,其特征在于,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:从聚类结果的每个簇中提取质心向量v,簇idcid、簇内影片个数cn、最近的观看时间tl,提取出来的信息作为用户画像。遍历获取到的簇质心向量,每个簇用质心向量从构建好的KD-Tree中搜索k个近邻作为候选影片。
6.根据权利要求5所述的分类个性化推荐方法,其特征在于,所述进行用户行为聚类并根据聚类结果生成混合推荐候选影视包括:对于每个类型影视的每个簇,将簇的质心向量作为一个影视向量计算相似推荐结果作为该簇的候选结果。
7.根据权利要求6所述的分类个性化推荐方法,其特征在于,所述对候选影视进行排序后获得用于显示的推荐结果包括:每个类别分别对所有簇根据簇内观看记录数量降序排列,填入对应簇的相似推荐结果,即得到推荐结果。
8.根据权利要求1至7之一所述的分类个性化推荐方法,其特征在于,所述获取可供推荐的影视元数据并进行分类包括:将影视元数据分成5类,每一个类别根据用户该类别的观看记录计算推荐结果。
9.根据权利要求8所述的分类个性化推荐方法,其特征在于,所述分类的5个类别为:电影,电视剧,纪录片,动漫和综艺。
CN201610546769.2A 2016-07-12 2016-07-12 一种分类个性化推荐方法 Pending CN107608989A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610546769.2A CN107608989A (zh) 2016-07-12 2016-07-12 一种分类个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610546769.2A CN107608989A (zh) 2016-07-12 2016-07-12 一种分类个性化推荐方法

Publications (1)

Publication Number Publication Date
CN107608989A true CN107608989A (zh) 2018-01-19

Family

ID=61055423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610546769.2A Pending CN107608989A (zh) 2016-07-12 2016-07-12 一种分类个性化推荐方法

Country Status (1)

Country Link
CN (1) CN107608989A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460631A (zh) * 2018-02-13 2018-08-28 口口相传(北京)网络技术有限公司 多元化信息的混合推送方法及装置
CN109658129A (zh) * 2018-11-22 2019-04-19 北京奇虎科技有限公司 一种用户画像的生成方法及装置
CN109711733A (zh) * 2018-12-28 2019-05-03 上海盛付通电子支付服务有限公司 用于生成聚类模型的方法、电子设备和计算机可读介质
CN112015736A (zh) * 2020-08-21 2020-12-01 广州欢网科技有限责任公司 基于Spark Mllib实现的多功能推荐方法及装置
CN112819533A (zh) * 2021-01-29 2021-05-18 深圳脉腾科技有限公司 信息推送方法、装置、电子设备及存储介质
CN113268645A (zh) * 2021-05-07 2021-08-17 北京三快在线科技有限公司 信息召回方法、模型训练方法、装置、设备及存储介质
CN115130007A (zh) * 2022-08-29 2022-09-30 深圳市亲邻科技有限公司 一种基于用户场景定位的品牌推广方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460631A (zh) * 2018-02-13 2018-08-28 口口相传(北京)网络技术有限公司 多元化信息的混合推送方法及装置
CN109658129A (zh) * 2018-11-22 2019-04-19 北京奇虎科技有限公司 一种用户画像的生成方法及装置
CN109711733A (zh) * 2018-12-28 2019-05-03 上海盛付通电子支付服务有限公司 用于生成聚类模型的方法、电子设备和计算机可读介质
CN112015736A (zh) * 2020-08-21 2020-12-01 广州欢网科技有限责任公司 基于Spark Mllib实现的多功能推荐方法及装置
CN112015736B (zh) * 2020-08-21 2024-04-05 广州欢网科技有限责任公司 基于Spark Mllib实现的多功能推荐方法及装置
CN112819533A (zh) * 2021-01-29 2021-05-18 深圳脉腾科技有限公司 信息推送方法、装置、电子设备及存储介质
CN113268645A (zh) * 2021-05-07 2021-08-17 北京三快在线科技有限公司 信息召回方法、模型训练方法、装置、设备及存储介质
CN115130007A (zh) * 2022-08-29 2022-09-30 深圳市亲邻科技有限公司 一种基于用户场景定位的品牌推广方法及系统

Similar Documents

Publication Publication Date Title
CN107608989A (zh) 一种分类个性化推荐方法
Wu et al. A novel clustering method for static video summarization
CN103902538B (zh) 基于决策树的信息推荐装置及方法
Ahmed et al. Movie recommendation system using clustering and pattern recognition network
CN103544216B (zh) 一种结合图像内容和关键字的信息推荐方法及系统
CN104199896B (zh) 基于特征分类的视频相似度确定及视频推荐方法
JP3568117B2 (ja) ビデオ画像の分割、分類、および要約のための方法およびシステム
CN102254006B (zh) 基于内容的互联网视频检索方法
CN107608990A (zh) 一种直播个性化推荐方法
Takahashi et al. Video summarization for large sports video archives
CN102780920A (zh) 电视节目推荐方法及系统
Gitte et al. Content based video retrieval system
Jeong et al. Ontology-based automatic video annotation technique in smart TV environment
CN108920577A (zh) 电视智能推荐方法
Jeon et al. Hybrid machine learning approach for popularity prediction of newly released contents of online video streaming services
CN109189988A (zh) 一种视频推荐方法
Barthel et al. Navigating a graph of scenes for exploring large video collections
Musto et al. Enhanced semantic tv-show representation for personalized electronic program guides
CN107885852A (zh) 一种基于app使用记录的app推荐方法及系统
Papadopoulos et al. Automatic summarization and annotation of videos with lack of metadata information
CN105100164A (zh) 网络服务推荐方法和装置
EP2943898A1 (en) Method for identifying objects in an audiovisual document and corresponding device
Ghatak et al. Key-frame extraction using threshold technique
JP2009060413A (ja) 動画特徴抽出方法およびシステムならびに動画検索方法およびシステム
CN107608988A (zh) 一种混合个性化推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180119