CN101739419A - 多指标综合权重视频排序系统 - Google Patents
多指标综合权重视频排序系统 Download PDFInfo
- Publication number
- CN101739419A CN101739419A CN200810202202A CN200810202202A CN101739419A CN 101739419 A CN101739419 A CN 101739419A CN 200810202202 A CN200810202202 A CN 200810202202A CN 200810202202 A CN200810202202 A CN 200810202202A CN 101739419 A CN101739419 A CN 101739419A
- Authority
- CN
- China
- Prior art keywords
- video
- index
- score
- weight
- ordering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种多指标综合权重视频排序系统,包括:视频数据库,视频分析处理模块,主观权重确定模块,客观权重计算模块,与所述视频分析处理模块和主观权重确定模块相连接,根据所述视频分析处理模块提供的数据,计算所述主观权重确定模块所确定的排序指标的客观权重;优化决策模块,用于计算每个排序指标的综合权重,指标排序得分计算模块,用于计算每个视频对于指标的排序得分;综合得分计算模块,用于计算该视频的加权得分值,本发明综合考虑了视频多项特征以及用户对视频的反馈,能够对视频进行智能化的灵活排序,以最佳方式将搜索到的视频结果返回给用户。
Description
技术领域
本发明属于视频数据处理领域,特别涉及一种视频排序系统。
背景技术
随着互联网的发展,视频的影响力正在逐步增强,互联网上的视频数量也与日俱增。在海量的视频中,要找到用户需要的某个视频,传统的搜索引擎仅仅根据文本的相似性对视频进行排序,将那些视频描述文本(如视频标题,标签等)与查询文本相似的视频排在前面返回给用户。
这样的排序结果具有以下三个缺点:
1.导致作弊现象比较严重,影响视频搜索的准确性和客观性;
2.影响用户搜索体验,降低对网站的满意度和忠诚度;
3.增加用户点击或搜索次数,加重服务器负担。
鉴于此,一些视频网站采用了一些其他排序方式,如按照播放次数排序,视频的播放次数越多,排名越靠前。或者按照上传时间、视频时长等要素进行排序。这些排序方式从本质上来说,都只采用了一个衡量指标,而忽略了视频的其他丰富特性,导致最后搜索排序的结果不能满足用户的真正需求。
因此,目前的排序技术在视频搜索的表现形式中过于单一,不能准确反映视频的质量和受欢迎程度,难以满足用户的真正搜索需求。
发明内容
为了解决以上问题,本发明提供一种多指标综合权重视频排序系统,通过分析视频的多重内在指标和用户的反馈信息,构建了一套衡量视频质量优劣的指标体系,利用该指标体系对每个视频计算其得分,计算结果作为搜索引擎排序依据。
为实现上述目的,本发明采用如下技术方案:
一种多指标综合权重视频排序系统,包括:
视频数据库,用于保存视频原始信息;
视频分析处理模块,与所述视频数据库相连接,用于对所述视频数据库中的视频原始信息进行分析和处理;
主观权重确定模块,用于设定排序指标j并给出排序指标j的主观权重;
客观权重计算模块,与所述视频分析处理模块和主观权重确定模块相连接,根据所述视频分析处理模块提供的数据,计算所述主观权重确定模块所确定的排序指标j的客观权重;
优化决策模块,与所述客观权重计算模块相连接,用于计算每个排序指标j的综合权重wj,其中,
模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重wj越准确,更能刻画各指标之间的关系,aj、bj,j=1、2、...、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;
指标排序得分计算模块,与所述视频分析处理模块相连接,用于计算每个视频i对于指标j的排序得分zi(j);
综合得分计算模块,与所述优化决策模块和所述指标排序得分计算模块相连接,用于计算该视频的加权得分值fi,其公式为:
本发明能真实客观反映视频的内在特性,真正优秀和受用户欢迎的视频将排名靠前,旨在解决现有视频搜索引擎在排序技术上的不足,使最后排序得分更客观公正。其综合考虑了视频多项特征以及用户对视频的反馈,能够对视频进行智能化的灵活排序,以最佳方式将搜索到的视频结果返回给用户。
为了使本发明的目的、技术方法和优点更清晰明白,下面结合附图,对本发明进一步进行详细解释和说明。
附图说明
图1为本发明多指标综合权重视频排序系统结构示意图。
具体实施方式
如图1所示,一种多指标综合权重视频排序系统,其包括:
视频数据库,用于保存视频原始信息,该视频原始信息可包括视频的播放次数、标题、评论数、上传时间、上传人、被专辑收录次数、均衡度等;
视频分析处理模块,与所述视频数据库相连接,用于对所述视频数据库中的视频原始信息进行分析和处理,例如将视频内容转化成其它处理模块中需要的格式,同时还可对稀疏数据和噪音数据进行处理;
主观权重确定模块,用来确定多个排序指标j,并对这些排序指标j给出主观权重。该主观权重可通过随机调查用户需求,并征求视频业内专家意见,确定多个排序指标j,并给出这些排序指标j主观权重。在本实施例中主要采用了文本匹配程度、日均播放次数、上传时间、被专辑收录次数、上传人重要程度、均衡度等指标作为排序的排序指标j。其中文本匹配程度这一指标由搜索引擎负责度量,在搜索时与本系统计算的排序得分进行整合。可以理解,上述的几个排序指标j只是用来解释本说明,而不是构成本发明对排序指标j选择范围的限制。
客观权重计算模块,与所述视频分析处理模块和主观权重确定模块相连接,根据所述视频分析处理模块提供的数据,计算所述主观权重确定模块所确定的排序指标j的客观权重。其中所述客观权重可通过熵值法计算得到。熵(entropy)是系统状态不确定性(混沌态)的度量,可被用来度量排序指标j包含信息量的大小。熵越大,说明该排序指标j包含的信息越多,该指标对于视频的排序效果就越大,即指标传输的决策信息也就越大,它的权重系数值也就越大。熵值法的优点在于该方法最大程度地利用了评价方案的目标值或属性值来计算各指标的权重系数,因而是较为客观的权重系数赋权方法。
熵值法计算公式如下:
设各指标的客观权重为bj,j=1、2、...、m,则:
其中,为每个指标j的熵;用来刻画所有视频对于指标j的分布;zj(i)为每个指标的标准化(规范化)得分;且当pj(i)=0时,规定pj(i)lnpj(i)=0(i=1、2、...、n;j=1、2、...、m)。
优化决策模块,与所述客观权重计算模块相连接,用于计算每个排序指标j的综合权重wj。根据客观权重和主观权重,建立数学模型,并计算其最优解,该最优解就是每个排序指标j的综合权重wj。如果仅仅根据主观权重进行视频排序,不能真实准确反映指标的重要程度,往往造成排序结果的不准确。因此为了兼顾主观权重的偏好,又充分利用客观权重带来的客观信息,建立如下优化决策模型:
设各项指标的综合权重为wj,其中,
模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重wj越准确,更能刻画各指标之间的关系。其中aj、bj,j=1、2、...、m分别为指标j的主观和客观权重。0<μ<1为偏好系数,反映分析者对主观权重和客观权重的偏好程度,这里取μ=0.5。
通过证明知,当综合权重wi=μai+(1-μ)bi,i=1、2、...、m时,模型F(w)得到唯一最优解,即取得最小值。
指标排序得分计算模块,与所述视频分析处理模块相连接,用来计算每个视频i对于指标j的排序得分zi(j)。本发明中采用的排序指标j有日平均播放次数、上传时间、视频节目拥有人上传视频数量、被专辑收录数、被挖(支持)数、被收藏数、均衡度,其指标j分别记为1、2、3、4、5、6、7。下面就排序得分zi(j)的具体计算方法加以说明。
日平均播放次数得分zi(1):
其中,NP(i)为第i个视频的日均播放数;MAX({x})(下同)用来计算集合{x}的最大值;
为数学变换函数,对数据量过大的进行处理;LOG2(x)是以2为底的对数变换。
上传时间得分zi(2):
其中days(i)为该节目上传时间离现在的天数。该函数是单调递减的分段函数,用来刻画随着已上传天数的增加,视频重要性逐渐降低这一现象。
视频节目拥有人上传视频数量得分zi(3):
其中,NU(i)表示第i个视频的上传人总的上传视频数,该指标的设计原则是创作视频越多的人其创作的视频质量越高,用来鼓励视频创作大户上传更多的节目,特别是原创节目。
被专辑收录数得分zi(4):
其中,NZ(i)表示第i个视频被专辑收录的次数,其被专辑收录次数越多,说明越受欢迎,其排名应该越靠前。
被挖(支持)数得分zi(5):
其中,NW(i)表示第i个视频被挖(支持)次数,其被挖(支持)次数越多,说明越受欢迎,其排名应该越靠前。
被收藏数得分zi(6):
其中,NF(i)表示第i个视频被收藏次数,其被收藏次数越多,说明越受欢迎,其排名应该越靠前。
均衡度得分zi(7):
影响均衡度的因素有挖NW(i)、评论NC(i)、收藏NF(i)、评分数NP(i),节目的均衡度得分指的是各个视频被评论、挖、评分和被收藏次数之间的均衡程度的度量,这四个数字越均衡,说明越能激发用户参与互动的积极性,排序得分越高;反之应该在得分上受到惩罚。该度量指标的引入能够避免用户刻意的在某一项上的作弊行为对节目公正性的影响。均衡度得分zi(7)采用变异系数法来计算,分成以下几步进行:
STEP 1:预处理(无量纲化处理)
通过统计采样计算各个指标的权重,然后初始化NW(i),NC(i),NF(i),NP(i)。本发明中使用的方法是抽样1000个视频,分别计算其挖、评论、收藏、评分的平均数,并以此作为这四个指标的权重,然后针对每个视频,用原始的挖数、评论数、收藏数、评分数分别除以各指标的权重即得到初始化值NW(i),NC(i),NF(i),NP(i)。
STEP 2:计算平均数
STEP 3:计算均方差
STEP 4:计算变异系数V(i)
STEP 5:相对法规范化处理,计算均衡度得分
综合得分计算模块,与所述优化决策模块和所述指标排序得分计算模块相连接,利用所述指标排序得分计算模块计算的每个视频对单个排序指标j的得分值和综合权重wj,计算该视频的加权得分值fi,其公式为:
应当说明的是,本发明中的模块即可以内置于搜索引擎中,也可以独立于搜索引擎外,供搜索引擎调用排序结果,本发明中所使用的客观权重计算方法及均衡度算法,并不局限于所提及的几种,根据需要可以另行更换和调整。另外本发明中使用的综合权重方法也不局限于以上提及的情形。以上所述的算法仅为本发明的较佳实施方法而已,并不用于限制本发明,凡在本发明精神和原则范围之类所做的任何修改、等同替换和改进等,均应包含在本发明的保护之内。
Claims (4)
1.一种多指标综合权重视频排序系统,其特征在于包括:
视频数据库,用于保存视频原始信息;
视频分析处理模块,与所述视频数据库相连接,用于对所述视频数据库中的视频原始信息进行分析和处理;
主观权重确定模块,用于设定排序指标j并给出排序指标j的主观权重;
客观权重计算模块,与所述视频分析处理模块和主观权重确定模块相连接,根据所述视频分析处理模块提供的数据,计算所述主观权重确定模块所确定的排序指标j的客观权重;
优化决策模块,与所述客观权重计算模块相连接,用于计算每个排序指标j的综合权重wj,其中,
模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重wj越准确,更能刻画各指标之间的关系,aj、bj,j=1、2、…、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;
指标排序得分计算模块,与所述视频分析处理模块相连接,用于计算每个视频i对于指标j的排序得分zi(j);
综合得分计算模块,与所述优化决策模块和所述指标排序得分计算模块相连接,用于计算该视频的加权得分值fi,其公式为:
2.根据权利要求1所述的多指标综合权重视频排序系统,其特征在于:
所述μ=0.5,综合权重wi=μai+(1-μ)bi,i=1、2、…、m。
4.根据权利要求3所述的多指标综合权重视频排序系统,其特征在于:
所述指标排序得分计算模块为计算排序指标j:日平均播放次数、上传时间、视频节目拥有人上传视频数量、被专辑收录数、被挖数、被收藏数、均衡度中的多个或全部排序指标,具体计算为:
日平均播放次数得分zi(1):
其中,NP(i)为第i个视频的日均播放数;MAX({x})(下同)用来计算集合{x}的最大值;
为数学变换函数,对数据量过大的进行处理;LOG2(x)是以2为底的对数变换;
上传时间得分zi(2):
其中days(i)为该节目上传时间离现在的天数;
视频节目拥有人上传视频数量得分zi(3):
其中,NU(i)表示第i个视频的上传人总的上传视频数;
被专辑收录数得分zi(4):
其中,NZ(i)表示第i个视频被专辑收录的次数;
被挖数得分zi(5):
其中,NW(i)表示第i个视频被挖次数,其被挖次数越多;
被收藏数得分zi(6):
其中,NF(i)表示第i个视频被收藏次数;
均衡度得分zi(7):
均衡度得分zi(7)是视频被评论、被挖、评分和被收藏次数之间的均衡程度的度量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810202202A CN101739419A (zh) | 2008-11-04 | 2008-11-04 | 多指标综合权重视频排序系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810202202A CN101739419A (zh) | 2008-11-04 | 2008-11-04 | 多指标综合权重视频排序系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101739419A true CN101739419A (zh) | 2010-06-16 |
Family
ID=42462911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810202202A Pending CN101739419A (zh) | 2008-11-04 | 2008-11-04 | 多指标综合权重视频排序系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101739419A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880712A (zh) * | 2012-10-08 | 2013-01-16 | 合一网络技术(北京)有限公司 | 一种用于对搜索的网络视频进行排序的方法和系统 |
WO2015117571A1 (zh) * | 2014-07-23 | 2015-08-13 | 中兴通讯股份有限公司 | 一种节目排序方法及装置 |
CN109714610A (zh) * | 2018-11-23 | 2019-05-03 | 北京森博互动公关策划有限公司 | 自动式视频营销管理系统及方法 |
-
2008
- 2008-11-04 CN CN200810202202A patent/CN101739419A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880712A (zh) * | 2012-10-08 | 2013-01-16 | 合一网络技术(北京)有限公司 | 一种用于对搜索的网络视频进行排序的方法和系统 |
CN102880712B (zh) * | 2012-10-08 | 2015-07-22 | 合一网络技术(北京)有限公司 | 一种用于对搜索的网络视频进行排序的方法和系统 |
WO2015117571A1 (zh) * | 2014-07-23 | 2015-08-13 | 中兴通讯股份有限公司 | 一种节目排序方法及装置 |
CN105323602A (zh) * | 2014-07-23 | 2016-02-10 | 中兴通讯股份有限公司 | 一种节目排序方法及装置 |
CN109714610A (zh) * | 2018-11-23 | 2019-05-03 | 北京森博互动公关策划有限公司 | 自动式视频营销管理系统及方法 |
CN109714610B (zh) * | 2018-11-23 | 2021-07-06 | 北京森博互动公关策划有限公司 | 自动式视频营销管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101739416A (zh) | 多指标综合权重视频排序方法 | |
CN104657496A (zh) | 一种计算信息热度值的方法和设备 | |
CN107122467B (zh) | 一种搜索引擎的检索结果评价方法及装置、计算机可读介质 | |
CN101739418A (zh) | 多指标综合权重音、视频专辑排序方法 | |
CN110222975A (zh) | 一种流失用户分析方法、装置、电子设备及存储介质 | |
CN104834686A (zh) | 一种基于混合语义矩阵的视频推荐方法 | |
CN101556603A (zh) | 一种用于对检索结果重新排序的协同检索方法 | |
CN103699521A (zh) | 文本分析方法及装置 | |
CN101645083A (zh) | 一种基于概念符号的文本领域的获取系统及方法 | |
CN109299380A (zh) | 在线教育平台中基于多维特征的习题个性化推荐方法 | |
CN110263854B (zh) | 直播标签确定方法、装置及存储介质 | |
CN108665148B (zh) | 一种电子资源质量评价方法、装置和存储介质 | |
CN106570080A (zh) | 一种云制造资源服务多层次语义匹配方法 | |
CN101127046A (zh) | 一种对博客文章进行排序的方法及系统 | |
CN111125453A (zh) | 基于子图同构的社交网络中意见领袖角色识别方法及存储介质 | |
CN101739417A (zh) | 多指标综合权重音、视频专辑排序系统 | |
CN108563749B (zh) | 基于多维度信息和知识网络的在线教育系统资源推荐方法 | |
CN103729424A (zh) | 问答社区内回答评价方法和系统 | |
CN110442702A (zh) | 搜索方法、装置、可读存储介质和电子设备 | |
CN102737027B (zh) | 个性化搜索方法及系统 | |
CN101968798A (zh) | 基于在线软约束lda算法的社区推荐方法 | |
CN116739541B (zh) | 一种基于ai技术的智能人才匹配方法及系统 | |
CN101739419A (zh) | 多指标综合权重视频排序系统 | |
CN104572915A (zh) | 一种基于内容环境增强的用户事件相关度计算方法 | |
CN115858731A (zh) | 一种法规库法规匹配方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100616 |