CN105389590A - 一种视频聚类推荐方法和装置 - Google Patents

一种视频聚类推荐方法和装置 Download PDF

Info

Publication number
CN105389590A
CN105389590A CN201510752233.1A CN201510752233A CN105389590A CN 105389590 A CN105389590 A CN 105389590A CN 201510752233 A CN201510752233 A CN 201510752233A CN 105389590 A CN105389590 A CN 105389590A
Authority
CN
China
Prior art keywords
video
collection class
scoring
set distance
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510752233.1A
Other languages
English (en)
Other versions
CN105389590B (zh
Inventor
冯研
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Corp
Original Assignee
TCL Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Corp filed Critical TCL Corp
Priority to CN201510752233.1A priority Critical patent/CN105389590B/zh
Publication of CN105389590A publication Critical patent/CN105389590A/zh
Application granted granted Critical
Publication of CN105389590B publication Critical patent/CN105389590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种视频聚类推荐方法包括:根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数;按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,进行集合差异度计算;获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,与视频合并为一个视频集合类。本发明进行在聚类时能够有效的避免多次迭代运算,不容易受到异常值影响,大大的提高了分类效率以及聚类质量。

Description

一种视频聚类推荐方法和装置
技术领域
本发明属于视频聚类领域,尤其涉及一种视频聚类推荐方法和装置。
背景技术
随着互联网资源的不断丰富,人们在查看多媒体资源,比如观看视频,或者播放音乐文件时,需要在海量的多媒体资源中进行文件的查找,需要花费较多的时间获取用户喜欢的多媒体数据。
为提高用户获取喜欢的多媒体文件,比如视频数据等,现有的视频推荐方法一般基于聚类技术和协同过滤推荐算法一起,通过聚类技术,将搜索目标对象最近邻居的范围缩小到与目标对象相似性程度最高的几个聚类,可以有效的减少计算量,提高实时响应能力。
现有的K-means等分割聚类算法,需要进行多次迭代运算,计算效率比较低,并且容易受到异常值的影响,导致聚类结果质量不高。
发明内容
本发明的目的在于提供一种视频聚类推荐方法,以解决现有的分割聚类算法,需要进行多次迭代运算,计算效率比较低,并且容易受到异常值的影响,导致聚类结果质量不高的问题。
第一方面,本发明实施例提供了一种视频聚类推荐方法,所述方法包括:
根据所有用户对视频的评分数目,对视频进行排序得到视频集 n为视频个数;
按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算;
获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类,其中,0<i<n+1。
结合第一方面,在第一方面的第一种可能实现方式中,按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算步骤包括:
计算视频与视频的集合差异度
当所述集合差异度小于预设的阈值时,则将视频与视频合并为视频集合类当所述集合差异度大于预设的阈值时,则将视频与视频分别生成新的视频集合类
对于视频将其与比的评分数目较多的视频构成的视频集合类进行集合差异度计算。
结合第一方面,在第一方面的第二种可能实现方式中,计算所述集合差异度的公式为:
其中K为用户对视频集N中的评论个数由多到少所选择的用户数,所述I为视频所属的类别数,所述G为比较的两个视频的共有的视频类别数。
结合第一方面,在第一方面的第三种可能实现方式中,在获取所计算的集合差异度最小值后,所述方法还包括:
如果所述集合差异度最小值大于预设的阈值,则将所述视频生成新的视频集合类
结合第一方面,在第一方面的第四种可能实现方式中,在得到视频集合类后,所述方法还包括:
接收用户输入的目标视频,查找目标视频所属的视频集合类;
查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合;
根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。
结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中,
结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中,所述查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合步骤包括:
统计用户u在所述视频集合类中已评分的视频集合Iu,所述视频集合类为P,则没有被所述用户评分的新视频集合为I'u=P-Iu
根据公式:计算目标视频i与所述新视频集合中的每个视频j的相似度,根据所述相似度选择预定个数视频作为所述目标视频的最近邻视频集合,其中U为用户集合。
结合第一方面的第四种可能实现方式,在第一方面的第六种可能实现方式中,所述根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分步骤包括:
根据公式:计算所述最近邻视频集合中的每个视频的预测评分,其中sim(i,j)为目标视频i与所述新视频集合中的每个视频j的相似度,Ru,j为用户输入的视频的评分矩阵中用户对视频j的评分数据。
第二方面,本发明实施例提供了一种视频聚类推荐装置,所述装置包括:
排序单元,用于根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数;
差异度计算单元,用于按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算;
视频集合类生成单元,用于获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类,其中,0<i<n+1。
结合第二方面,在第二方面的第一种可能实现方式中,所述差异度计算单元包括:
第一计算子单元,用于计算视频与视频的集合差异度
比较子单元,用于当所述集合差异度小于预设的阈值时,则将视频与视频合并为视频集合类当所述集合差异度大于预设的阈值时,则将视频与视频分别生成新的视频集合类
第二计算子单元,用于对于视频将其与比的评分数目较多的视频构成的视频集合类进行集合差异度计算。
结合第二方面,在第二方面的第二种可能实现方式中,所述装置还包括:
视频集合类查找单元,用于接收用户输入的目标视频,查找目标视频所属的视频集合类;
最近邻视频集合计算单元,用于查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合;
预测推荐单元,用于根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。
在本发明中,根据用户对视频的评分数目,选择将评分数目较少的视频,与评分数目相对较多的视频,或者与视频集合类进行集合差异度计算,所述视频集合类由评分数目相对较多的视频构成,当所述差异度计算的最小值小于预设的阈值时,则将选择计算差异度最小值的两个视频,或者视频与视频集合类,合并为一个视频集合类,从而能够有效的避免多次迭代运算,不容易受到异常值影响,大大的提高了分类效率以及聚类质量。
附图说明
图1是本发明第一实施例提供的视频聚类推荐方法的实现流程图;
图2是本发明第二实施例提供的视频聚类推荐方法的又一的实现流程图;
图3是本发明第三实施例提供的视频聚类推荐装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的目的在于提供一种视频聚类推荐方法,以解决现有技术中的视频聚类推荐方法中,在分析数据时存在着以下的缺陷:
1、传统的聚类算法中,在聚类之前,要对聚类数据经过较复杂的数据处理来降低数据的稀疏程度;
2、传统K-means等分割聚类算法需要进行多次的迭代运算,效率比较低下;
3、传统K-means等分割聚类算法容易受到异常值的影响,导致聚类结果质量不高;
为克服上述问题,本发明在高维稀疏数据聚类研究的基础上,利用评分数据稀疏差异度和视频类别构造集合差异度度量公式,用户在用户-视频的评分矩阵上进行视频聚类,在此聚类结果基础上对用户未评分视频进行预测评分,根据评分结果进行视频推荐,从而实现聚类质量和效率高的发明目的。下面结合附图具体进行说明。
实施例一:
图1示出了本发明第一实施例提供的视频聚类推荐方法的实现流程,详述如下:
在步骤S101中,根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数。
具体的,本发明实施例中所述的所有用户,可以为通过网络电视等数据采集平台所得到的该平台的所有用户对视频的评分,或者也可以为多个数据采集平台得到的综合数据。
所述视频的评分数目,是指针对某一视频的评分个数,评分个数越多,则表示该视频的热度越高。作为一种可选的实施方式,所述评分数目可以为对该视频作过评分的用户数目,即对于同一用户,对于同一视频作过多次评分时,比如对于同一视频,在不同的视频平台作过多次评分时,可以去除对同一视频的重复评分。
所述视频排序具体可以为:设视频集中的视频总数为n,依次计算视频V1,V2直至Vn的评分数目,并按照评分数目从高到低进行排序,得到重新排序后的视频集,记作其中,视频的评分数目大于视频的评分数目。
在步骤S102中,按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算。
具体的,本发明实施例中所述评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,具体是指:在对视频进行集合差异度计算时,是从评分数目较高的视频开始,比如从开始,计算的集合差异度,然后计算以及的集合差异度,或者计算与视频集合类的集合差异度,所述视频集合类包括依此类推,直到计算得到与其它视频或者视频构成的视频集合类的集合差异度。
作为本发明一种优的实施方式,所述按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算步骤包括:
计算视频与视频的集合差异度
当所述集合差异度小于预设的阈值时,则将视频与视频合并为视频集合类当所述集合差异度大于预设的阈值时,则将视频与视频分别生成新的视频集合类
对于视频将其与比的评分数目较多的视频构成的视频集合类进行集合差异度计算。
由于这里计算过程包括视频与视频的集合差异度计算,以及视频与视频集合类之间的集合差异度计算,为了统一计算方式,本发明还可以在计算之前,将每一个视频创建一个视频集合类,即在进行视频差异度计算之前,每个视频都是一个视频集合类,那么,在进行集合差异度计算时,则可以统一为视频集合类与视频集合类之间的集合差异度计算。
那么,所述计算视频与视频的集合差异度可以理解为计算视频集合类与视频集合类的集合差异度计算公式可以为如下: S F D ( C 1 0 , C 2 1 ) = K + I K * G .
其中,K为用户对视频集N中的评论个数由多到少所选择的用户数。视频的评分因子K是聚类算法的输入数据。当算法描述视频集合Ci的数据稀疏特征时,计算用户集U内各用户对视频集合Ci有评分的视频数量,按照用户对集合内有评分的视频个数由多到少排列,选择排在最前面的K个用户,即项目评分因子规定的数目,组成用户集合Ui(i=1,2,...,k)。当K设定为25,计算集合差异度是只关注前25名对视频评分最多的用户集合Ui。假设视频集合和视频集合在用户集合Ui中共有的用户为23个,即此时的K=23。
所述I为视频所属的类别数,即视频类别因子I表示的是该视频所属的类别数,例如视频1的类别为【古装、武打、爱情】,则此时I=3,大都数情况下视频的类别数一般为3个左右,有时也会出现2个或4个的情况,例如视频2的类别为【青春、爱情】,当比较的两者的类别数不同时,选择较大的视频类别数值进行计算。
所述G为比较的两个视频的共有的视频类别数。共有的视频类别数G表示两个视频相同的类别数,由于会存在视频类别不同的情况,所以G=G'+1,所述G'为视频类别个数不同时实际的类别数。例如视频1的类别为【古装、武打、爱情】,视频2的类别为【青春、爱情】,则两个视频共有的类别为爱情,则G'=1,则G=2。
如果根据上述数据,则可计算 S F D ( C 1 0 , C 2 1 ) = K + I K * G = 23 + 3 23 * 2 = 0.565.
当视频1和视频2合并之后,将作为一个新的视频集合类,再与其它视频集合类按照上述公式计算集合差异度。
如果小于预设的集合差异度的阈值d,则将视频集合合并,合并后的新视频集合记作如果超过集合差异度阈值d,则将作为两个新的集合类,新的视频集合类记作视频集合类的个数记作m。
对于视频集合计算寻找到i0,使得:
S F D ( C 3 0 , C i 0 1 ) = min i &Element; { 1 , ... , m } S F D ( C 3 0 , C i 1 )
表示初始集合与其他已经聚合过的集合的集合差异度计算结果,寻找到其中与初始集合最小的集合差异度值的视频集合类如果小于集合差异度的阈值d,则将合并,新的视频集合类别仍然记作反之,则将作为一个新的视频集合类,并将视频集合类的个数加1处理,即作
通过上述通过初始集合的合并处理方法,同样用于从而完成对所有视频的合并分类。
其中,对于视频集合类中有多个视频时,则选用多个视频共有的类别作为视频集合类的类别。
在步骤S103中,获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类。
如果计算视频所得到的所有集合差异度,选择所得到的集合差异度的最小值与预设的阈值进行比较,如果最小值的集合差异度小于预设的阈值,则最小集合差异度对应的视频集合类与视频合并为一个视频集合类,如果最小值的集合差异度大于预设的阈值,则将视频作为一个新增的视频集合类。
另外,作为本发明优选的实施方式中,在完成对所有视频的分类后,还可以对视频集合类的优化,对于视频集合类中的视频个数少于预定值,比如1或者2等,则将这种视频集合类去除,得到优化的聚类结果。
本发明根据用户对视频的评分数目,选择将评分数目较少的视频,与评分数目相对较多的视频,或者与视频集合类进行集合差异度计算,所述视频集合类由评分数目相对较多的视频构成,当所述差异度计算的最小值小于预设的阈值时,则将选择计算差异度最小值的两个视频,或者视频与视频集合类,合并为一个视频集合类,从而能够有效的避免多次迭代运算,不容易受到异常值影响,大大的提高了分类效率以及聚类质量。
实施例二:
图2示出了本发明第二实施例提供的视频聚类推荐方法的实现流程,详述如下:
在步骤S201中,根据实施例一所述方法,对视频进行聚类,生成视频集合类。
在步骤S202中,接收用户输入的目标视频,查找目标视频所属的视频集合类。
具体的,本发明实施例中所述用户输入的目标视频,可以为用户搜索的视频,也可以为用户当前正在观看的视频,另外,为了提高视频推荐的准确度,还可以设定观看视频的时长超过一定时长,比如观看视频的时长超过五分钟。
所述查找目标视频所属的视频集合类,可以通过将目标视频与视频集合类进行集合差异度计算,得到集合差异度最小的视频集合类,即为所需要查找的视频集合类。
在步骤S203中,查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合。
具体的,在得到目标视频所属的视频集合类后,根据统计数据,在所述视频集合类中查找目标用户是否进行过评分,其中,所述目标用户为正在使用的目标视频的用户。
当统计得到目标用户评分过的视频后,在所述视频集合类中减去评分过的视频,即可得到没有被用户评分的新视频集合,比如,统计用户u在所述视频集合类中已评分的视频集合Iu,所述视频集合类为P,则没有被所述用户评分的新视频集合为I'u=P-Iu
所述在所述新视频集合中根据相似性计算公式得到最近邻视频集合步骤可包括:
根据公式:计算目标视频i与所述新视频集合中的每个视频j的相似度,根据所述相似度选择预定个数视频作为所述目标视频的最近邻视频集合,其中U为用户集合,Ru,j为目标用户对视频j的评分数据。
进一步的,本发明还可以包括接收用户输入的最近邻视频个数,根据输入的最近邻视频个数,调整相似度的计算量。
在步骤S204中,根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。
具体的,所述根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分步骤包括:
根据公式:计算所述最近邻视频集合中的每个视频的预测评分,其中sim(i,j)为目标视频i与所述新视频集合中的每个视频j的相似度,Ru,j为用户输入的视频的评分矩阵中用户对视频j的评分数据。
重复步骤S203和步骤S204,即可得到目标用户u对所有未评分的视频进行评分数据的预测计算。
得到预测评分数据后,则可以根据要求选择一个预测评分最高的视频进行推荐,或者选择多个预测评分较高的视频推荐给目标用户。
本发明实施例在实施例一的基础上,通过计算目标视频所属的视频集合类,并计算视频集合类中未评分的视频与目标视频的相似度,从而能够高效、准确的推荐视频至目标用户。
实施例三:
图3示出了本发明第三实施例提供的视频聚类推荐装置的结构示意图,详述如下:
本发明实施例所述视频聚类推荐装置,包括:
排序单元301,用于根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数;
差异度计算单元302,用于按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算;
视频集合类生成单元303,用于获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类,其中,0<i<n+1。
优选的,所述差异度计算单元包括:
第一计算子单元,用于计算视频与视频的集合差异度
比较子单元,用于当所述集合差异度小于预设的阈值时,则将视频与视频合并为视频集合类当所述集合差异度大于预设的阈值时,则将视频与视频分别生成新的视频集合类
第二计算子单元,用于对于视频将其与比的评分数目较多的视频构成的视频集合类进行集合差异度计算。
优选的,所述装置还包括:
视频集合类查找单元,用于接收用户输入的目标视频,查找目标视频所属的视频集合类;
最近邻视频集合计算单元,用于查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合;
预测推荐单元,用于根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。
本发明实施例所述视频聚类推荐装置,与实施例一、二所述视频聚类推荐方法对应,在此不作重复赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种视频聚类推荐方法,其特征在于,所述方法包括:
根据所有用户对视频的评分数目,对视频进行排序得到视频集 n为视频个数;
按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算;
获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类,其中,0<i<n+1。
2.根据权利要求1所述方法,其特征在于,所述按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算步骤包括:
计算视频与视频的集合差异度
当所述集合差异度小于预设的阈值时,则将视频与视频合并为视频集合类当所述集合差异度大于预设的阈值时,则将视频与视频分别生成新的视频集合类
对于视频将其与比的评分数目较多的视频构成的视频集合类进行集合差异度计算。
3.根据权利要求1所述方法,其特征在于,计算所述集合差异度的公式为:
其中K为用户对视频集N中的评论个数由多到少所选择的用户数,所述I为视频所属的类别数,所述G为比较的两个视频的共有的视频类别数。
4.根据权利要求1所述方法,其特征在于,在获取所计算的集合差异度最小值后,所述方法还包括:
如果所述集合差异度最小值大于预设的阈值,则将所述视频生成新的视频集合类
5.根据权利要求1所述方法,其特征在于,在得到视频集合类后,所述方法还包括:
接收用户输入的目标视频,查找目标视频所属的视频集合类;
查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合;
根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。
6.根据权利要求5所述方法,其特征在于,所述查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合步骤包括:
统计用户u在所述视频集合类中已评分的视频集合Iu,所述视频集合类为P,则没有被所述用户评分的新视频集合为I'u=P-Iu
根据公式:计算目标视频i与所述新视频集合中的每个视频j的相似度,根据所述相似度选择预定个数视频作为所述目标视频的最近邻视频集合,其中U为用户集合。
7.根据权利要求5所述方法,其特征在于,所述根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分步骤包括:
根据公式:计算所述最近邻视频集合中的每个视频的预测评分,其中sim(i,j)为目标视频i与所述新视频集合中的每个视频j的相似度,Ru,j为用户输入的视频的评分矩阵中用户对视频j的评分数据。
8.一种视频聚类推荐装置,其特征在于,所述装置包括:
排序单元,用于根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数;
差异度计算单元,用于按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算;
视频集合类生成单元,用于获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类,其中,0<i<n+1。
9.根据权利要求8所述装置,其特征在于,所述差异度计算单元包括:
第一计算子单元,用于计算视频与视频的集合差异度
比较子单元,用于当所述集合差异度小于预设的阈值时,则将视频与视频合并为视频集合类当所述集合差异度大于预设的阈值时,则将视频与视频分别生成新的视频集合类
第二计算子单元,用于对于视频将其与比的评分数目较多的视频构成的视频集合类进行集合差异度计算。
10.根据权利要求8所述装置,其特征在于,所述装置还包括:
视频集合类查找单元,用于接收用户输入的目标视频,查找目标视频所属的视频集合类;
最近邻视频集合计算单元,用于查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合;
预测推荐单元,用于根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。
CN201510752233.1A 2015-11-05 2015-11-05 一种视频聚类推荐方法和装置 Active CN105389590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510752233.1A CN105389590B (zh) 2015-11-05 2015-11-05 一种视频聚类推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510752233.1A CN105389590B (zh) 2015-11-05 2015-11-05 一种视频聚类推荐方法和装置

Publications (2)

Publication Number Publication Date
CN105389590A true CN105389590A (zh) 2016-03-09
CN105389590B CN105389590B (zh) 2020-01-14

Family

ID=55421860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510752233.1A Active CN105389590B (zh) 2015-11-05 2015-11-05 一种视频聚类推荐方法和装置

Country Status (1)

Country Link
CN (1) CN105389590B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105812834A (zh) * 2016-05-10 2016-07-27 南京大学 基于聚类信息的视频推荐服务器、推荐方法和预缓存方法
CN106354827A (zh) * 2016-08-31 2017-01-25 Tcl集团股份有限公司 一种媒资数据整合方法及系统
CN107423308A (zh) * 2016-05-24 2017-12-01 华为技术有限公司 主题推荐方法以及装置
CN108055349A (zh) * 2017-12-28 2018-05-18 广州酷狗计算机科技有限公司 推荐k歌音频的方法、装置和系统
CN108984616A (zh) * 2018-06-12 2018-12-11 佛山欧神诺云商科技有限公司 一种基于微信的活动推荐方法
CN109068180A (zh) * 2018-09-28 2018-12-21 武汉斗鱼网络科技有限公司 一种确定视频精选集的方法以及相关设备
CN109284417A (zh) * 2018-08-27 2019-01-29 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质
CN112565903A (zh) * 2019-09-10 2021-03-26 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN114398501A (zh) * 2022-03-25 2022-04-26 腾讯科技(深圳)有限公司 多媒体资源的分组方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088626A (zh) * 2009-12-02 2011-06-08 Tcl集团股份有限公司 一种在线视频推荐方法及视频门户服务系统
CN102780920A (zh) * 2011-07-05 2012-11-14 上海奂讯通信安装工程有限公司 电视节目推荐方法及系统
JP2013029872A (ja) * 2009-10-19 2013-02-07 Nec Corp 情報推薦システム、方法、及び、プログラム
US20130156348A1 (en) * 2011-12-15 2013-06-20 Michal Irani Device, system, and method of visual inference by collaborative composition
CN103488789A (zh) * 2013-10-08 2014-01-01 百度在线网络技术(北京)有限公司 推荐方法、装置和搜索引擎
CN104778205A (zh) * 2015-03-09 2015-07-15 浙江大学 一种基于异构信息网络的移动应用排序和聚类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013029872A (ja) * 2009-10-19 2013-02-07 Nec Corp 情報推薦システム、方法、及び、プログラム
CN102088626A (zh) * 2009-12-02 2011-06-08 Tcl集团股份有限公司 一种在线视频推荐方法及视频门户服务系统
CN102780920A (zh) * 2011-07-05 2012-11-14 上海奂讯通信安装工程有限公司 电视节目推荐方法及系统
US20130156348A1 (en) * 2011-12-15 2013-06-20 Michal Irani Device, system, and method of visual inference by collaborative composition
CN103488789A (zh) * 2013-10-08 2014-01-01 百度在线网络技术(北京)有限公司 推荐方法、装置和搜索引擎
CN104778205A (zh) * 2015-03-09 2015-07-15 浙江大学 一种基于异构信息网络的移动应用排序和聚类方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105812834A (zh) * 2016-05-10 2016-07-27 南京大学 基于聚类信息的视频推荐服务器、推荐方法和预缓存方法
CN105812834B (zh) * 2016-05-10 2019-03-12 南京大学 基于聚类信息的视频推荐服务器、推荐方法和预缓存方法
CN107423308B (zh) * 2016-05-24 2020-07-07 华为技术有限公司 主题推荐方法以及装置
CN107423308A (zh) * 2016-05-24 2017-12-01 华为技术有限公司 主题推荐方法以及装置
US11830033B2 (en) 2016-05-24 2023-11-28 Huawei Technologies Co., Ltd. Theme recommendation method and apparatus
US20190087884A1 (en) 2016-05-24 2019-03-21 Huawei Technologies Co., Ltd. Theme recommendation method and apparatus
CN106354827A (zh) * 2016-08-31 2017-01-25 Tcl集团股份有限公司 一种媒资数据整合方法及系统
CN108055349A (zh) * 2017-12-28 2018-05-18 广州酷狗计算机科技有限公司 推荐k歌音频的方法、装置和系统
CN108055349B (zh) * 2017-12-28 2020-11-13 广州酷狗计算机科技有限公司 推荐k歌音频的方法、装置和系统
CN108984616A (zh) * 2018-06-12 2018-12-11 佛山欧神诺云商科技有限公司 一种基于微信的活动推荐方法
CN109284417A (zh) * 2018-08-27 2019-01-29 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质
CN109284417B (zh) * 2018-08-27 2022-11-22 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质
CN109068180B (zh) * 2018-09-28 2021-02-02 武汉斗鱼网络科技有限公司 一种确定视频精选集的方法以及相关设备
CN109068180A (zh) * 2018-09-28 2018-12-21 武汉斗鱼网络科技有限公司 一种确定视频精选集的方法以及相关设备
CN112565903A (zh) * 2019-09-10 2021-03-26 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN112565903B (zh) * 2019-09-10 2022-11-22 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN114398501A (zh) * 2022-03-25 2022-04-26 腾讯科技(深圳)有限公司 多媒体资源的分组方法、装置、设备及存储介质
CN114398501B (zh) * 2022-03-25 2022-06-28 腾讯科技(深圳)有限公司 多媒体资源的分组方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN105389590B (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN105389590A (zh) 一种视频聚类推荐方法和装置
CN103514304B (zh) 一种项目推荐方法和装置
CN105447730B (zh) 目标用户定向方法及装置
CN106407484B (zh) 一种基于弹幕语义关联的视频标签提取方法
CN104462383B (zh) 一种基于用户多种行为反馈的电影推荐方法
CN105975472A (zh) 一种推荐方法和装置
US9147009B2 (en) Method of temporal bipartite projection
CN105224699A (zh) 一种新闻推荐方法及装置
CN104298787A (zh) 一种基于融合策略的个性化推荐方法及装置
CN105373597A (zh) 基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN105161116B (zh) 多媒体文件高潮片段的确定方法及装置
CN103793476A (zh) 基于网络社区的协同过滤推荐方法
CN103077220A (zh) 一种基于用户群关联度的个性化推荐方法及系统
CN106484777A (zh) 一种多媒体数据处理方法以及装置
CN105354729A (zh) 一种电子商务系统中的商品推荐方法
CN106446189A (zh) 一种资讯推荐方法及系统
CN105430099A (zh) 一种基于位置聚类的协同式Web服务性能预测方法
CN105809275A (zh) 一种物品评分预测方法及装置
CN102135999A (zh) 用户可信度和项目最近邻相结合的互联网推荐方法
CN103294812A (zh) 一种基于混合模型的商品推荐方法
CN105654198A (zh) 具有最优阈值筛选的品牌广告效果优化的方法
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN104751354A (zh) 一种广告人群筛选方法
CN104951460A (zh) 基于关键词聚类的排名参量值确定方法及装置
CN103853789A (zh) 一种用于向用户推荐信息的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant