CN110275986B - 基于协同过滤的视频推荐方法、服务器及计算机存储介质 - Google Patents

基于协同过滤的视频推荐方法、服务器及计算机存储介质 Download PDF

Info

Publication number
CN110275986B
CN110275986B CN201910337908.4A CN201910337908A CN110275986B CN 110275986 B CN110275986 B CN 110275986B CN 201910337908 A CN201910337908 A CN 201910337908A CN 110275986 B CN110275986 B CN 110275986B
Authority
CN
China
Prior art keywords
target user
cluster
user
distance
collaborative filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910337908.4A
Other languages
English (en)
Other versions
CN110275986A (zh
Inventor
李斌
张冬仁
骆宗伟
乐智雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Aotian Technology Co ltd
Original Assignee
Shenzhen Aotian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Aotian Technology Co ltd filed Critical Shenzhen Aotian Technology Co ltd
Priority to CN201910337908.4A priority Critical patent/CN110275986B/zh
Publication of CN110275986A publication Critical patent/CN110275986A/zh
Application granted granted Critical
Publication of CN110275986B publication Critical patent/CN110275986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种基于协同过滤的视频推荐方法,包括:获取目标用户的主聚类簇和候选聚类簇,并获取目标用户与主聚类簇的第一关联度以及目标用户与候选聚类簇的第二关联度;根据第一关联度以及第二关联度生成目标用户的推荐信息。本发明还公开了一种服务器和计算机可读存储介质。本发明解决了用户数据的稀疏性问题,从而提高视频推荐的准确度。

Description

基于协同过滤的视频推荐方法、服务器及计算机存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于协同过滤的视频推荐方法、服务器及计算机存储介质。
背景技术
基于协同过滤的推荐技术是推荐系统中应用最早和最成功的技术之一。协同过滤方法采用最近邻技术,根据用户的历史信息计算用户间距离,根据目标用户的最近邻用户对项目评价预测该用户对此项目的喜好程度。
协同过滤的推荐算法,在应用到实际应用中,由于用户对视频的观看及行为非常稀疏,这样基于用户的行为所得到的用户间的相似性可能不准确,即导致稀疏性问题。对于一些观看较少的视频,即小众的视频被推荐的可能性非常低,被推荐的往往是热门的视频,对推送结果的多样性较差,导致通过该算法推送给用户的视频与热门视频存在很强的重合,用户体验不佳并造成了计算资源的浪费与重复。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于协同过滤的视频推荐方法、服务器和计算机存储介质,旨在解决现有技术中用户行为数据稀疏性的技术问题。
为实现上述目的,本发明提供一种基于协同过滤的视频推荐方法,所述基于协同过滤的视频推荐方法包括如下步骤:
获取目标用户的主聚类簇和候选聚类簇;
获取所述目标用户与所述主聚类簇的第一关联度以及所述目标用户与所述候选聚类簇的第二关联度;
根据所述第一关联度以及所述第二关联度生成所述目标用户的推荐信息。
优选地,所述获取目标用户的主聚类簇和候选聚类簇的步骤包括:
获取用户的历史访问数据,并根据所述历史访问数据对所述用户进行聚类,得到多个聚类簇;
获取所述目标用户与各个所述聚类簇之间的距离;
将与所述目标用户距离满足第一预设条件的聚类簇作为所述目标用户的主聚类簇;
按与所述目标用户距离满足第二预设条件的聚类簇作为所述目标用户的候选聚类簇。
优选地,所述获取所述目标用户与所述主聚类簇的第一关联度以及所述目标用户与所述候选聚类簇的第二关联度的步骤包括:
获取所述目标用户与所述主聚类簇的第一距离;
获取所述目标用户与所述候选聚类簇的第二距离,所述第二距离大于所述第一距离;
根据所述第一距离和所述第二距离得到所述第一关联度和所述第二关联度。
优选地,所述根据所述第一关联度以及所述第二关联度生成所述目标用户的推荐信息的步骤包括:
根据所述主聚类簇的用户的历史访问数据获取所述目标用户对待推荐内容的第一兴趣评分;
根据所述候选类簇的用户的历史访问数据获取所述目标用户对所述待推荐内容的第二兴趣评分;
利用所述第一关联度和所述第二关联度对所述第一兴趣评分和所述第二兴趣评分进行加权运算,得到所述目标用户对所述待推荐内容的兴趣评分;
根据各个所述待推荐内容的兴趣评分选取待推荐视频推荐给所述目标用户。
优选地,所述基于协同过滤的视频推荐方法还包括以下步骤:
判断是否为所述目标用户推荐重复的视频;
若判定为所述目标用户推荐重复的视频,更新所述目标用户的候选聚类簇,并获取更新的候选聚类簇的第三关联度;
基于更新的候选聚类簇和所述第三关联度,为所述目标用户推荐视频。
优选地,所述更新所述目标用户的候选聚类簇的步骤包括:
为所述目标用户增加候选聚类簇;
或者,更换所述目标用户的候选聚类簇。
优选地,其特征在于,所述获取用户的历史访问数据,并根据所述历史访问数据对所述用户进行聚类,得到多个聚类簇的步骤包括:
根据用户的历史访问数据得到所述用户对待推荐视频的评分矩阵;
根据所述评分矩阵对所述用户进行聚类,得到多个聚类簇。
优选地,所述用户的历史访问数据包括视频观看信息、视频浏览信息、视频评论信息。
此外,为实现上述目的,本发明还提供一种服务器,该服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于协同过滤的视频推荐处理程序,所述基于协同过滤的视频推荐处理程序被所述处理器执行时实现如上所述的基于协同过滤的视频推荐方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机存储介质,其特征在于,所述计算机存储介质上存储有基于协同过滤的视频推荐处理程序,所述基于协同过滤的视频推荐处理程序被处理器执行时实现如上所述的基于协同过滤的视频推荐方法的步骤。
本发明实施例提出的一种基于协同过滤的视频推荐方法、服务器和计算机存储介质,本发明通过获取目标用户的主聚类簇和候选聚类簇,并获取目标用户与主聚类簇的第一关联度以及目标用户与候选聚类簇的第二关联度,根据第一关联度以及第二关联度生成目标用户的推荐信息,解决用户数据的稀疏性问题,从而提高视频推荐的准确度。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明基于协同过滤的视频推荐方法第一实施例的流程示意图;
图3为本发明基于协同过滤的视频推荐方法第二实施例的流程示意图;
图4为本发明基于协同过滤的视频推荐方法第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取目标用户的主聚类簇和候选聚类簇,并获取目标用户与主聚类簇的第一关联度以及目标用户与候选聚类簇的第二关联度,根据第一关联度以及第二关联度生成目标用户的推荐信息。
本发明通过获取目标用户的主聚类簇和候选聚类簇,并获取目标用户与主聚类簇的第一关联度以及目标用户与候选聚类簇的第二关联度;根据第一关联度以及第二关联度生成目标用户的推荐信息,解决用户数据的稀疏性问题,从而提高视频推荐的准确度。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端为一种服务器。
如图1所示,该服务器可以包括:处理器1001,例如CPU,通信总线1002,存储器1003。其中,通信总线1002用于实现这些组件之间的连接通信。存储器1003可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1003可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1003中可以包括操作系统和基于协同过滤的视频推荐处理程序。
在图1所示的装置中,处理器1001可以用于调用存储器1003中存储的基于协同过滤的视频推荐处理程序,并执行以下操作:
获取目标用户的主聚类簇和候选聚类簇;
获取所述目标用户与所述主聚类簇的第一关联度以及所述目标用户与所述候选聚类簇的第二关联度;
根据所述第一关联度以及所述第二关联度生成所述目标用户的推荐信息。
进一步地,处理器1001可以调用存储器1003中存储的基于协同过滤的视频推荐程序,还执行以下操作:
获取用户的历史访问数据,并根据所述历史访问数据对所述用户进行聚类,得到多个聚类簇;
获取所述目标用户与各个所述聚类簇之间的距离;
将与所述目标用户距离满足第一预设条件的聚类簇作为所述目标用户的主聚类簇;
按与所述目标用户距离满足第二预设条件的聚类簇作为所述目标用户的候选聚类簇。
进一步地,处理器1001可以调用存储器1003中存储的基于协同过滤的视频推荐程序,还执行以下操作:
获取所述目标用户与所述主聚类簇的第一距离;
获取所述目标用户与所述候选聚类簇的第二距离,所述第二距离大于所述第一距离;
根据所述第一距离和所述第二距离得到所述第一关联度和所述第二关联度。
进一步地,处理器1001可以调用存储器1003中存储的基于协同过滤的视频推荐程序,还执行以下操作:
根据所述主聚类簇的用户的历史访问数据获取所述目标用户对待推荐内容的第一兴趣评分;
根据所述候选类簇的用户的历史访问数据获取所述目标用户对所述待推荐内容的第二兴趣评分;
利用所述第一关联度和所述第二关联度对所述第一兴趣评分和所述第二兴趣评分进行加权运算,得到所述目标用户对所述待推荐内容的兴趣评分;
根据各个所述待推荐内容的兴趣评分选取待推荐视频推荐给所述目标用户。
进一步地,处理器1001可以调用存储器1003中存储的基于协同过滤的视频推荐程序,还执行以下操作:
判断是否为所述目标用户推荐重复的视频;
若判定为所述目标用户推荐重复的视频,更新所述目标用户的候选聚类簇,并获取更新的候选聚类簇的第三关联度;
基于更新的候选聚类簇和所述第三关联度,为所述目标用户推荐视频。
进一步地,处理器1001可以调用存储器1003中存储的基于协同过滤的视频推荐程序,还执行以下操作:
为所述目标用户增加候选聚类簇;
或者,更换所述目标用户的候选聚类簇。
进一步地,处理器1001可以调用存储器1003中存储的基于协同过滤的视频推荐程序,还执行以下操作:
根据用户的历史访问数据得到所述用户对待推荐视频的评分矩阵;
根据所述评分矩阵对所述用户进行聚类,得到多个聚类簇。
参照图2,本发明第一实施例提供一种基于协同过滤的视频推荐的方法,所述方法包括:
步骤S10,获取目标用户的主聚类簇和候选聚类簇;
本发明应用于对用户进行视频推荐,目标用户是指待推荐视频的用户,待推荐视频的用户可以是通过门户网站、APP应用程序或者电视终端发生视频操作行为的用户。在本实施例中,主要基于协同过滤算法实现对用户的视频推荐。协同过滤方法采用近邻技术,根据用户的历史信息计算用户间距离,根据目标用户的近邻用户对项目评价预测该用户对此项目的喜好程度。
传统的协同过滤的推荐算法应用于视频推荐时,由于待推荐的视频总体数目较为庞大,用户对视频的历史访问数据相对于庞大的视频数目而言比较稀疏,基于用户对视频的历史访问数据得到的视频推荐结果并不准确。例如对于一些观看较少的视频,即小众的视频被推荐的可能性非常低,被推荐的往往是热门的视频,对推送结果的多样性较差,导致给用户推荐的视频与热门视频存在很强的重合,浪费推荐系统的处理计算资源。因此,将协同过滤算法结合聚类算法应用于视频推荐,利用某种聚类算法将所有用户划分为不同的群体,即不同的聚类簇,从中确定待推荐视频的目标用户的主聚类簇和候选聚类簇,通过对主聚类簇中的用户和候选聚类簇中的用户的对视频的偏好来为目标用户推荐视频,解决用户数据的稀疏性问题,从而提高视频推荐的准确度。
具体地,可以采用聚类算法依照下述步骤S11~S14确定目标用户的主聚类簇和候选类簇。
步骤S11,获取用户的历史访问数据,并根据所述历史访问数据对所述用户进行聚类,得到多个聚类簇;
在本步骤中,获取所有发生视频操作行为用户的历史访问数据,通过对用户的历史访问数据的预处理得到用户样本数据,并将该样本数据输入到聚类算法模型,得到多个聚类簇。得到的聚类簇中,簇内相似度高,簇间相似度低。其中,聚类算法模型可以采用K-means均值聚类算法、均值漂移聚类算法、基于密度的聚类算法或者凝聚层次聚类算法。
需要说明的是,当选择K-means均值聚类算法时,需要预先设定代表类别数目的K的取值。通过对视频推荐应用场景的相关分析,本实施例中K的优选取值范围是:5≤K≤9,其中,最优取值为K=7。
步骤S12,获取所述目标用户与各个所述聚类簇之间的距离;
在获取目标用户与各个聚类簇之间距离时,可以采用多种距离计算方法计算目标用户与各个聚类簇中心的距离,例如欧式距离法、曼哈顿距离法、切比雪夫距离法、幂距离法或者余弦相似度。
例如第i个聚类簇的聚类中心数据表示为Mi={A1,A2,A3,……,An},其中,A1、A2、A3……An均为特征,n为特征数目,目标用户的数据标识为P={X1,X2,X3,……,Xn},
Figure BDA0002037071300000071
步骤S13,将与所述目标用户距离满足第一预设条件的聚类簇作为所述目标用户的主聚类簇;
当期待选取与目标用户相似度最高的聚类簇作为目标用户的主聚类簇时,第一预设条件可以是将与目标用户距离最近的聚类簇作为目标用户的主聚类簇;当期待选取与目标用户有一定的相似度的聚类簇作为目标用户的主聚类簇时,第一预设条件可以是设定一个距离阈值范围,先获取落入该距离阈值范围的聚类簇,再从中挑选与目标用户距离最近的聚类簇作为目标用户的主聚类簇。
步骤S14,按与所述目标用户距离满足第二预设条件的聚类簇作为所述目标用户的候选聚类簇。
由于目标用户与其所属的主聚类簇相似度较高,其所属的主聚类簇的用户的视频行为特征相似度高,所产生的视频推荐结果可能较为单一,因此在为该目标用户确定候选聚类簇时,可以选择一个或多个候选聚类簇,并且候选聚类簇与目标用户的相似度均要小于主聚类簇与目标用户的相似度,即第二预设条件可以设置为候选聚类簇与目标用户的距离小于主聚类簇与目标用户的距离,也可以设定一个距离阈值范围,该距离范围中最大值也小于主聚类簇与目标用户的距离值,将落入该距离阈值范围的聚类簇作为候选聚类簇。
步骤S20,获取所述目标用户与所述主聚类簇的第一关联度以及所述目标用户与所述候选聚类簇的第二关联度;
在后续根据主聚类簇中的用户视频行为特征和候选聚类簇中的用户视频行为特征去确定目标用户的推荐结果的计算过程中,需要保证主聚类簇的用户的影响大于候选聚类簇的影响,具体可以根据目标用户与主聚类簇的第一关联度、目标用户与主聚类簇的第二关联度来确定其参与计算过程中的权值。
可选地,在本实施例中先获取目标用户与主聚类簇的第一距离,并获取目标用户与候选聚类簇的第二距离,其中第二距离大于所述第一距离,再根据第一距离和第二距离得到第一关联度和所述第二关联度。
下述公式给出了确定了一个主聚类簇和两个候选聚类簇的示例,其中,Pij为目标用户i与主聚类簇j的第一关联度,Pij′为目标用户i与第一候选聚类簇j′的第二关联度,Pij″为目标用户与第二候选聚类簇j″的第二关联度,l(i,uj)为目标用户i与主聚类簇j的聚类中心uj的距离,l(i,uj′)为目标用户i与主聚类簇j′的聚类中心uj′的距离,l(i,uj″)为目标用户i与主聚类簇j″的聚类中心uj″的距离。
Figure BDA0002037071300000081
Figure BDA0002037071300000082
Figure BDA0002037071300000083
步骤S30,根据所述第一关联度以及所述第二关联度生成所述目标用户的推荐信息。
在根据主聚类簇中的用户视频行为特征和候选聚类簇中的用户视频行为特征去确定目标用户的推荐结果的计算过程中,将第一关联度作为主聚类簇中的用户权值,第二关联度作为候选聚类簇中的用户权值参与计算过程,得到目标用户的推荐信息。
可选地,在本实施例中先根据主聚类簇的用户的历史访问数据获取目标用户对待推荐内容的第一兴趣评分,并根据候选类簇的用户的历史访问数据获取目标用户对待推荐内容的第二兴趣评分,再利用第一关联度和第二关联度对第一兴趣评分和第二兴趣评分进行加权运算,得到目标用户对待推荐内容的兴趣评分,最终根据各个待推荐内容的兴趣评分选取待推荐视频推荐给目标用户。
下述公式给出了一种示例:
Figure BDA0002037071300000091
其中,Clusteri,new∈[0,1],|clusterj|代表主聚类簇j中用户个数,|clusterj=>new|代表主聚类簇j中观看过视频ID为new的用户个数,|clusterj′|代表候选聚类簇j′中用户个数,|clusterj′|代表主聚类簇j′中观看过视频ID为new的用户个数,|clusterj″|代表候选聚类簇j′中用户个数,|clusterj″|代表主聚类簇j″中观看过视频ID为new的用户个数。
在本实施例中,通过获取目标用户的主聚类簇和候选聚类簇,并获取目标用户与主聚类簇的第一关联度以及目标用户与候选聚类簇的第二关联度;根据第一关联度以及第二关联度生成目标用户的推荐信息,解决用户数据的稀疏性问题,从而提高视频推荐的准确度。
进一步的,参照图3,本发明第二实施例提供一种基于协同过滤的视频推荐的方法,本实施例包括:
步骤S40,判断是否为所述目标用户推荐重复的视频;
在本步骤中,定时获取在预设周期内为目标用户推荐的多个视频列表,通过比对多个视频列表中的内容确定是否为目标用户推荐重复的视频。
步骤S50,若判定为所述目标用户推荐重复的视频,更新所述目标用户的候选聚类簇,并获取更新的候选聚类簇的第三关联度;
当判断出为目标用户推荐了重复的视频时,表明目标用户当前的候选类簇中的用户行为数据出现了稀疏性问题,需要更新候选类簇,以获得与目标用户的主聚类簇有区别度的用户数据,以解决用户行为数据的稀疏性问题,从而提高目标用户的视频推荐结果的多样性。
具体地,更新候选类簇的方法包括为目标用户增加候选聚类簇和更换目标用户的候选聚类簇。
步骤S60,基于更新的候选聚类簇和所述第三关联度,为所述目标用户推荐视频。
在更新了目标用户的候选聚类簇后,获取目标用户与更新的候选聚类簇的第三关联度,在根据主聚类簇中的用户视频行为特征和更新的候选聚类簇中的用户视频行为特征去确定目标用户的推荐结果的计算过程中,将第一关联度作为主聚类簇中的用户权值,第三关联度作为更新的候选聚类簇中的用户权值参与计算过程,得到目标用户的视频推荐信息。
在本实施例中,通过在判断出为目标用户推荐重复视频时,更新目标用户的候选聚类簇,实质为利用推荐结果的正确与否的反馈来由于对不断变化的用户行为引起的数据稀疏性问题作出及时的调整,保证了基于协同过滤的视频推荐的方法具有实时的准确性。
进一步的,参照图4,本发明基于第一实施例提出第三实施例,提供一种基于协同过滤的视频推荐的方法,本实施例在步骤S11包括:
步骤S1101,根据用户的历史访问数据得到所述用户对待推荐视频的评分矩阵;
用户的历史访问数据中包括用户对视频的观看、收藏、保存、评分、评价等多种行为。通过对用户历史访问数据中行为的分类和统计,形成用户对待推荐视频的评分矩阵,一种示例如下表所示:
表1:
Figure BDA0002037071300000101
Figure BDA0002037071300000111
其中,评分矩阵中的码值含义为:1-观看,2-收藏,3-评分,4-评价;13-观看且评分,14-观看且评价。
步骤S1102,根据所述评分矩阵对所述用户进行聚类,得到多个聚类簇。
在本步骤中,将评分矩阵输入用户聚类模型进行处理,得到用户的多个聚类簇。
在本实施例中,通过根据用户的历史访问数据得到用户对待推荐视频的评分矩阵,并根据评分矩阵对用户进行聚类,得到多个聚类簇,实现了高效准确的用户聚类。
本发明还提供一种服务器,该服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于协同过滤的视频推荐处理程序,所述基于协同过滤的视频推荐处理程序被所述处理器执行时实现所述的基于协同过滤的视频推荐方法的步骤。
此外,本发明实施例还提出一种计算机存储介质,所述计算机存储介质上存储有基于协同过滤的视频推荐处理程序,所述基于协同过滤的视频推荐处理程序被处理器执行时实现所述的基于协同过滤的视频推荐方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种基于协同过滤的视频推荐方法,其特征在于,所述基于协同过滤的视频推荐方法包括以下步骤:
获取用户的历史访问数据,对所述用户的历史访问数据预处理得到用户样本数据,将所述用户样本数据输入聚类算法模型,以得到多个聚类簇;
获取目标用户与各个所述聚类簇之间的距离;
将与所述目标用户的距离满足第一预设条件的聚类簇作为所述目标用户的主聚类簇;其中,当期待选取与所述目标用户相似度最高的聚类簇作为所述目标用户的主聚类簇时,所述第一预设条件为将与所述目标用户的距离最近的聚类簇作为所述目标用户的主聚类簇;当期待选取与所述目标用户有一定的相似度的聚类簇作为所述目标用户的主聚类簇时,所述第一预设条件为设定一个距离阈值范围,先获取落入所述距离阈值范围的聚类簇,再从中挑选与所述目标用户距离最近的聚类簇作为所述目标用户的主聚类簇;
将与所述目标用户的距离满足第二预设条件的聚类簇作为所述目标用户的候选聚类簇,其中,所述第二预设条件为候选聚类簇与所述目标用户的距离小于所述主聚类簇与所述目标用户的距离,或者设定一个距离阈值范围,所述距离阈值范围中最大值小于所述主聚类簇与所述目标用户的距离值,将落入所述距离阈值范围的聚类簇作为候选聚类簇;
获取所述目标用户与所述主聚类簇的第一距离;
获取所述目标用户与所述候选聚类簇的第二距离,所述第二距离大于所述第一距离;
根据所述第一距离和所述第二距离得到第一关联度和第二关联度,所述第一关联度对应所述目标用户与所述主聚类簇,所述第二关联度对应所述目标用户与所述候选聚类簇;
根据所述第一关联度以及所述第二关联度生成所述目标用户的推荐信息。
2.如权利要求1所述的基于协同过滤的视频推荐方法,其特征在于,所述根据所述第一关联度以及所述第二关联度生成所述目标用户的推荐信息的步骤包括:
根据所述主聚类簇的用户的历史访问数据获取所述目标用户对待推荐内容的第一兴趣评分;
根据所述候选聚类簇的用户的历史访问数据获取所述目标用户对所述待推荐内容的第二兴趣评分;
利用所述第一关联度和所述第二关联度对所述第一兴趣评分和所述第二兴趣评分进行加权运算,得到所述目标用户对所述待推荐内容的兴趣评分;
根据各个所述待推荐内容的兴趣评分选取待推荐视频推荐给所述目标用户。
3.如权利要求1所述的基于协同过滤的视频推荐方法,其特征在于,所述基于协同过滤的视频推荐方法还包括以下步骤:
判断是否为所述目标用户推荐重复的视频;
若判定为所述目标用户推荐重复的视频,更新所述目标用户的候选聚类簇,并获取更新的候选聚类簇的第三关联度;
基于更新的候选聚类簇和所述第三关联度,为所述目标用户推荐视频。
4.如权利要求3所述的基于协同过滤的视频推荐方法,其特征在于,所述更新所述目标用户的候选聚类簇的步骤包括:
为所述目标用户增加候选聚类簇;
或者,更换所述目标用户的候选聚类簇。
5.如权利要求1所述的基于协同过滤的视频推荐方法,其特征在于,所述将所述用户样本数据输入聚类算法模型,以得到多个聚类簇的步骤包括:
将所述用户样本数据输入聚类算法模型,以得到所述用户对待推荐视频的评分矩阵;
根据所述评分矩阵对所述用户进行聚类,得到多个聚类簇。
6.如权利要求1所述的基于协同过滤的视频推荐方法,其特征在于,所述用户的历史访问数据包括视频观看信息、视频浏览信息、视频评论信息。
7.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于协同过滤的视频推荐处理程序,所述基于协同过滤的视频推荐处理程序被所述处理器执行时实现如权利要求1至6中任一项所述的基于协同过滤的视频推荐方法的步骤。
8.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有基于协同过滤的视频推荐处理程序,所述基于协同过滤的视频推荐处理程序被处理器执行时实现如权利要求1至6中任一项所述的基于协同过滤的视频推荐方法的步骤。
CN201910337908.4A 2019-04-23 2019-04-23 基于协同过滤的视频推荐方法、服务器及计算机存储介质 Active CN110275986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910337908.4A CN110275986B (zh) 2019-04-23 2019-04-23 基于协同过滤的视频推荐方法、服务器及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910337908.4A CN110275986B (zh) 2019-04-23 2019-04-23 基于协同过滤的视频推荐方法、服务器及计算机存储介质

Publications (2)

Publication Number Publication Date
CN110275986A CN110275986A (zh) 2019-09-24
CN110275986B true CN110275986B (zh) 2022-02-11

Family

ID=67959880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910337908.4A Active CN110275986B (zh) 2019-04-23 2019-04-23 基于协同过滤的视频推荐方法、服务器及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110275986B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468419A (zh) * 2021-06-28 2021-10-01 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886048A (zh) * 2014-03-13 2014-06-25 浙江大学 一种基于聚类的增量数字图书推荐方法
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置
CN109241410A (zh) * 2018-08-15 2019-01-18 腾讯科技(深圳)有限公司 一种文章推荐方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10140372B2 (en) * 2012-09-12 2018-11-27 Gracenote, Inc. User profile based on clustering tiered descriptors
US10776414B2 (en) * 2014-06-20 2020-09-15 Comcast Cable Communications, Llc Dynamic content recommendations
CN104933156A (zh) * 2015-06-25 2015-09-23 西安理工大学 一种基于共享近邻聚类的协同过滤方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886048A (zh) * 2014-03-13 2014-06-25 浙江大学 一种基于聚类的增量数字图书推荐方法
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置
CN109241410A (zh) * 2018-08-15 2019-01-18 腾讯科技(深圳)有限公司 一种文章推荐方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"A Recommendation of Pension Service Based on Trusted Network";Xinxin Dong等;《2017 IEEE International Symposium on Parallel and Distributed Processing with Applications and 2017 IEEE International Conference on Ubiquitous Computing and Communications (ISPA/IUCC)》;20180528;全文 *
"基于异构信息网络聚类的APP推荐算法研究";白双伶;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160715;全文 *

Also Published As

Publication number Publication date
CN110275986A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
CN110321422B (zh) 在线训练模型的方法、推送方法、装置以及设备
CN110012356B (zh) 视频推荐方法、装置和设备及计算机存储介质
CN110162593B (zh) 一种搜索结果处理、相似度模型训练方法及装置
CN109086439B (zh) 信息推荐方法及装置
CN110457581B (zh) 一种资讯推荐方法、装置、电子设备及存储介质
CN106326391B (zh) 多媒体资源推荐方法及装置
WO2017181612A1 (zh) 个性化视频推荐方法及装置
CN111444428A (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN110717099B (zh) 一种推荐影片的方法及终端
CN109753601B (zh) 推荐信息点击率确定方法、装置及电子设备
CN106339507B (zh) 流媒体消息推送方法和装置
CN109509010B (zh) 一种多媒体信息处理方法、终端及存储介质
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN109471978A (zh) 一种电子资源推荐方法及装置
CN114330752A (zh) 排序模型训练方法和排序方法
CN111708942B (zh) 多媒体资源推送方法、装置、服务器及存储介质
CN117216362A (zh) 内容推荐方法、装置、设备、介质和程序产品
CN110472016A (zh) 文章推荐方法、装置、电子设备及存储介质
CN114223012A (zh) 推送对象确定方法、装置、终端设备及存储介质
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
Liu et al. Question popularity analysis and prediction in community question answering services
CN110929169A (zh) 基于改进Canopy聚类协同过滤算法的职位推荐方法
CN105260458A (zh) 一种用于显示装置的视频推荐方法及显示装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant