CN101739418A - 多指标综合权重音、视频专辑排序方法 - Google Patents
多指标综合权重音、视频专辑排序方法 Download PDFInfo
- Publication number
- CN101739418A CN101739418A CN200810202201A CN200810202201A CN101739418A CN 101739418 A CN101739418 A CN 101739418A CN 200810202201 A CN200810202201 A CN 200810202201A CN 200810202201 A CN200810202201 A CN 200810202201A CN 101739418 A CN101739418 A CN 101739418A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- audio
- index
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 101150083341 LOG2 gene Proteins 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种多指标综合权重音、视频专辑排序方法,包括:音、视频专辑数据库,音、视频专辑分析处理步骤,主观权重确定步骤,客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标的客观权重;优化决策步骤,用于计算每个排序指标的综合权重,指标排序得分计算步骤,用于计算每个音、视频专辑对于指标的排序得分;综合得分计算步骤,用于计算该音、视频专辑的加权得分值,本发明综合考虑了音、视频专辑多项特征以及用户对音、视频专辑的反馈,能够对音、视频专辑进行智能化的灵活排序,以最佳方式将搜索到的音、视频专辑结果返回给用户。
Description
技术领域
本发明属于音、视频专辑数据处理领域,特别涉及一种音、视频专辑排序系统。
背景技术
随着互联网的发展,视频的影响力正在逐步增强,互联网上的视频数量也与日俱增。为了便于查找和观看,一些视频网站提供了将多个相关视频制作成一个音、视频专辑的形式的方法,用户只要找到这个音、视频专辑,就可以观看该音、视频专辑中的全部视频,而不需要分别另外查找。但是随着音、视频专辑数量的增加,音、视频专辑名称和标签重复的现象不可避免,因此当某个用户需要查找某个音、视频专辑时,结果中往往出现大量的同名音、视频专辑,让用户无从选择。在传统的视频搜索引擎中,对音、视频专辑的排序仅仅根据文本的相似性进行,将那些描述文本(如音、视频专辑标题,标签等)与查询文本相似的音、视频专辑排在前面返回给用户。
这样的排序结果具有以下不足:
1、一些用户为了提高自己制作音、视频专辑的搜索排名,可能会填充一些与该音、视频专辑无关的热门搜索词汇,影响音、视频专辑搜索的准确性和客观性;
2、影响用户搜索体验,降低对网站的满意度和忠诚度;
3、增加用户点击或搜索次数,加重服务器负担。
鉴于此,一些音、视频专辑网站采用了一些其他排序方式,如按照播放次数排序,音、视频专辑的播放次数越多,排名越靠前。或者按照上传时间、音、视频专辑时长等要素进行排序。这些排序方式从本质上来说,都只采用了一个衡量指标,而忽略了音、视频专辑的其他丰富特性,导致最后搜索排序的结果不能满足用户的真正需求。
因此,目前的排序技术在音、视频专辑搜索的表现形式中过于单一,不能准确反映音、视频专辑的质量和受欢迎程度,难以满足用户的真正搜索需求。
发明内容
为了解决以上问题,本发明提供一种多指标综合权重音、视频专辑排序方法,通过分析音、视频专辑的多重内在指标和用户的反馈信息,构建了一套衡量音、视频专辑质量优劣的指标体系,利用该指标体系对每个音、视频专辑计算其得分,计算结果作为搜索引擎排序依据。
为实现上述目的,本发明采用如下技术方案:
一种多指标综合权重音、视频专辑排序方法,包括:
音、视频专辑数据库,用于保存音、视频专辑原始信息;
音、视频专辑分析处理步骤,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理;
主观权重确定步骤,用于设定排序指标j并给出排序指标j的主观权重;
客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重;
优化决策步骤,用于计算每个排序指标j的综合权重wj,其中,
模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重wj越准确,更能刻画各指标之间的关系,aj、bj,j=1、2、...、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;
指标排序得分计算步骤,用于计算每个音、视频专辑i对于指标j的排序得分zi(j);
综合得分计算步骤,用于计算该音、视频专辑的加权得分值fi,其公式为:
本发明能真实客观反映音、视频专辑的内在特性,真正优秀和受用户欢迎的音、视频专辑将排名靠前,旨在解决现有音、视频专辑搜索引擎在排序技术上的不足,使最后排序得分更客观公正。其综合考虑了音、视频专辑多项特征以及用户对音、视频专辑的反馈,能够对音、视频专辑进行智能化的灵活排序,以最佳方式将搜索到的音、视频专辑结果返回给用户。
为了使本发明的目的、技术方法和优点更清晰明白,下面结合附图,对本发明进一步进行详细解释和说明。
附图说明
图1为本发明多指标综合权重音、视频专辑排序方法流程图。
具体实施方式
如图1所示,一种多指标综合权重音、视频专辑排序方法,其包括:
音、视频专辑数据库,用于保存音、视频专辑原始信息,该音、视频专辑原始信息可包括音、视频专辑的播放次数、标题、评论数、更新时间、上传人、评论数、订阅数等;
音、视频专辑分析处理步骤,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理,例如将音、视频专辑内容转化成其它处理步骤中需要的格式,同时还可对稀疏数据和噪音数据进行处理;
主观权重确定步骤,用来确定多个排序指标j,并对这些排序指标j给出主观权重。该主观权重可通过随机调查用户需求,并征求音、视频专辑业内专家意见,确定多个排序指标j,并给出这些排序指标j主观权重。在本实施例中主要采用了文本匹配程度、日均播放次数、更新时间、原创贡献率、订阅数、评论数和均衡度等指标作为排序的评价指标j。其中文本匹配程度这一指标由搜索引擎负责度量,在搜索时与本系统计算的排序得分进行整合。可以理解,上述的几个排序指标j只是用来解释本说明,而不是构成本发明对排序指标j选择范围的限制。
客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重。其中所述客观权重可通过熵值法计算得到。熵(entropy)是系统状态不确定性(混沌态)的度量,可被用来度量排序指标j包含信息量的大小。熵越大,说明该排序指标j包含的信息越多,该指标对于音、视频专辑的排序效果就越大,即指标传输的决策信息也就越大,它的权重系数值也就越大。熵值法的优点在于该方法最大程度地利用了评价方案的目标值或属性值来计算各指标的权重系数,因而是较为客观的权重系数赋权方法。
熵值法计算公式如下:
设各指标的客观权重为bj,j=1、2、...、m,则:
其中,为每个指标j的熵;用来刻画所有音、视频专辑对于指标j的分布;zj(i)为每个指标的标准化(规范化)得分;且当pj(i)=0时,规定pj(i)lnpj(i)=0(i=1、2、...、n;j=1、2、...、m)。
优化决策步骤,与所述客观权重计算步骤相连接,用于计算每个排序指标j的综合权重wj。根据客观权重和主观权重,建立数学模型,并计算其最优解,该最优解就是每个排序指标j的综合权重wj。如果仅仅根据主观权重进行音、视频专辑排序,不能真实准确反映指标的重要程度,往往造成排序结果的不准确。因此为了兼顾主观权重的偏好,又充分利用客观权重带来的客观信息,建立如下优化决策模型:
设各项指标的综合权重为wj,其中,
模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重wj越准确,更能刻画各指标之间的关系。其中aj、bj,j=1、2、...、m分别为指标j的主观和客观权重。0<μ<1为偏好系数,反映分析者对主观权重和客观权重的偏好程度,这里取μ=0.5。
通过证明知,当综合权重wi=μai+(1-μ)bi,i=1、2、...、m时,模型F(w)得到唯一最优解,即取得最小值。
指标排序得分计算步骤,用来计算每个音、视频专辑i对于指标j的排序得分zi(j)。本发明中采用的排序指标j有日平均播放次数、更新时间、原创贡献率、被订阅数、被评论数、均衡度,其指标j分别记为1、2、3、4、5、6。下面就排序得分zi(j)的具体计算方法加以说明。
日平均播放次数得分zi(1):
其中,NP(i)为第i个音、视频专辑的日均播放数;MAX({x})(下同)用来计算集合{x}的最大值;
为数学变换函数,对数据量过大的进行处理;LOG2(x)是以2为底的对数变换。
更新时间得分zi(2):
其中days(i)为该专辑最后更新时间离现在的天数。该函数是单调递减的分段函数,用来刻画随着最后更新天数的增加,音、视频专辑重要性逐渐降低这一现象。
专辑原创贡献率得分zi(3):
其中,NR(i)表示第i个音、视频专辑中的原创视频数目,TOTAL_NR(i)为专辑中的视频总数;专辑中的原创节目越多,该专辑排序越靠前,该指标的设计原则是鼓励用户更多的制作原创专辑。
被订阅数得分zi(4):
其中,NS(i)表示第i个音、视频专辑被订阅的次数,其被订阅次数越多,说明越受欢迎,其排名应该越靠前。
被评论次数得分zi(5):
其中,NC(i)表示第i个音、视频专辑被评论次数,其被评论次数越多,说明该专辑越热门,其排名应该越靠前。
均衡度得分zi(6):
影响专辑均衡度的因素有播放次数NP(i)、评论数NC(i)、订阅数NS(j)、浏览数NV(i),专辑的均衡度得分指的是各个音、视频专辑被播放、评论、订阅和被浏览次数之间的均衡程度的度量,这四个数字越均衡,说明越能激发用户参与互动的积极性,排序得分越高;反之应该在得分上受到惩罚。该度量指标的引入能够避免用户刻意的在某一项上的作弊行为对节目公正性的影响。均衡度得分zi(6)采用变异系数法来计算,分成以下几步进行:
步骤(1):预处理(无量纲化处理)
通过统计采样计算各个指标的权重,然后初始化NP(i),NC(i),NS(i),NV(i)。本发明中使用的方法是抽样1000个音、视频专辑,分别计算其播放、评论、订阅、浏览的平均数,并以此作为这四个指标的权重,然后针对每个音、视频专辑,用原始的播放、评论、订阅、浏览数分别除以各指标的权重即得到初始化值NP(i),NC(i),NS(i),NV(i)。
步骤(2):计算平均数
步骤(3):计算均方差
步骤(4):计算变异系数V(i)
步骤(5):相对法规范化处理,计算均衡度得分
综合得分计算步骤,利用所述指标排序得分计算步骤计算的每个音、视频专辑对单个排序指标j的得分值和综合权重wj,计算该音、视频专辑的加权得分值fi,其公式为:
应当说明的是,本发明中的步骤即可以内置于搜索引擎中,也可以独立于搜索引擎外,供搜索引擎调用排序结果,本发明中所使用的客观权重计算方法及均衡度算法,并不局限于所提及的几种,根据需要可以另行更换和调整。另外本发明中使用的综合权重方法也不局限于以上提及的情形。以上所述的算法仅为本发明的较佳实施方法而已,并不用于限制本发明,凡在本发明精神和原则范围之类所做的任何修改、等同替换和改进等,例如调整其中的步骤顺序,均应包含在本发明的保护之内。
Claims (8)
1.一种多指标综合权重音、视频专辑排序方法,其特征在于包括以下步骤:
1)音、视频专辑分析处理步骤,用于对所述音、视频专辑数据库中的音、视频专辑原始信息进行分析和处理;
2)主观权重确定步骤,用于设定排序指标j并给出排序指标j的主观权重;
3)客观权重计算步骤,根据所述音、视频专辑分析处理步骤提供的数据,计算所述主观权重确定步骤所确定的排序指标j的客观权重;
4)优化决策步骤,用于计算每个排序指标j的综合权重wj,其中,
模型F(w)表示各指标排序得分的权重误差平方和,F(w)越小,反映出权重wj越准确,更能刻画各指标之间的关系,aj、bj,j=1、2、…、m分别为指标j的主观和客观权重;0<μ<1为偏好系数;
5)指标排序得分计算步骤,用于计算每个音、视频专辑i对于指标j的排序得分zi(j);
6)综合得分计算步骤,用于计算该音、视频专辑的加权得分值fi,其公式为:
2.根据权利要求1所述的多指标综合权重音、视频专辑排序方法,其特征在于:
所述步骤4)优化决策步骤中,所述μ=0.5,综合权重wi=μai+(1-μ)bi,i=1、2、…、m。
4.根据权利要求3所述的多指标综合权重音、视频专辑排序方法,其特征在于:
所述步骤5)指标排序得分计算步骤为计算排序指标j:日平均播放次数、专辑更新时间、原创贡献率、被订阅数、被评论数、均衡度中的多个或全部排序指标。
6.根据权利要求4或5所述的多指标综合权重音、视频专辑排序方法,其特征在于:所述原创贡献率得分zi(3)的计算方法为:
其中,NR(i)表示第i个音、视频专辑中的原创视频数目,TOTAL_NR(i)为专辑中的视频总数;
所述被订阅数得分zi(4)的计算方法为:
其中,NS(i)表示第i个音、视频专辑被订阅次数;
所述被评论数得分zi(5)的计算方法为:
其中,NC(i)表示第i个音、视频专辑被评论次数。
7.根据权利要求6所述的多指标综合权重音、视频专辑排序方法,其特征在于:
所述均衡度得分zi(6)的计算方法为:音、视频专辑播放次数NP(i)、评论数NC(i)、订阅数NS(i)、浏览数NV(i)之间的均衡程度的度量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810202201A CN101739418A (zh) | 2008-11-04 | 2008-11-04 | 多指标综合权重音、视频专辑排序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810202201A CN101739418A (zh) | 2008-11-04 | 2008-11-04 | 多指标综合权重音、视频专辑排序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101739418A true CN101739418A (zh) | 2010-06-16 |
Family
ID=42462910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810202201A Pending CN101739418A (zh) | 2008-11-04 | 2008-11-04 | 多指标综合权重音、视频专辑排序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101739418A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591972A (zh) * | 2011-12-31 | 2012-07-18 | 北京百度网讯科技有限公司 | 提供商品搜索结果的方法及设备 |
CN103870467A (zh) * | 2012-12-11 | 2014-06-18 | 上海文广互动电视有限公司 | 影视剧点播评分系统及其方法 |
CN108665148A (zh) * | 2018-04-18 | 2018-10-16 | 腾讯科技(深圳)有限公司 | 一种电子资源质量评价方法、装置和存储介质 |
CN108804647A (zh) * | 2018-06-06 | 2018-11-13 | 北京奇艺世纪科技有限公司 | 一种视频排序的方法及装置 |
CN108959644A (zh) * | 2018-07-27 | 2018-12-07 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN110728966A (zh) * | 2019-09-12 | 2020-01-24 | 上海麦克风文化传媒有限公司 | 一种音频专辑内容质量评价方法及系统 |
CN111651584A (zh) * | 2020-04-17 | 2020-09-11 | 世纪保众(北京)网络科技有限公司 | 一种基于用户行为特征及文章属性的保险文章推荐方法 |
-
2008
- 2008-11-04 CN CN200810202201A patent/CN101739418A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591972A (zh) * | 2011-12-31 | 2012-07-18 | 北京百度网讯科技有限公司 | 提供商品搜索结果的方法及设备 |
CN103870467A (zh) * | 2012-12-11 | 2014-06-18 | 上海文广互动电视有限公司 | 影视剧点播评分系统及其方法 |
CN108665148A (zh) * | 2018-04-18 | 2018-10-16 | 腾讯科技(深圳)有限公司 | 一种电子资源质量评价方法、装置和存储介质 |
CN108665148B (zh) * | 2018-04-18 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 一种电子资源质量评价方法、装置和存储介质 |
CN108804647A (zh) * | 2018-06-06 | 2018-11-13 | 北京奇艺世纪科技有限公司 | 一种视频排序的方法及装置 |
CN108804647B (zh) * | 2018-06-06 | 2021-07-30 | 北京奇艺世纪科技有限公司 | 一种视频排序的方法及装置 |
CN108959644A (zh) * | 2018-07-27 | 2018-12-07 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
US11194822B2 (en) | 2018-07-27 | 2021-12-07 | Tianjin Bytedance Technology Co., Ltd. | Search ranking method and apparatus, electronic device and storage medium |
CN110728966A (zh) * | 2019-09-12 | 2020-01-24 | 上海麦克风文化传媒有限公司 | 一种音频专辑内容质量评价方法及系统 |
CN110728966B (zh) * | 2019-09-12 | 2023-05-23 | 上海麦克风文化传媒有限公司 | 一种音频专辑内容质量评价方法及系统 |
CN111651584A (zh) * | 2020-04-17 | 2020-09-11 | 世纪保众(北京)网络科技有限公司 | 一种基于用户行为特征及文章属性的保险文章推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101739416A (zh) | 多指标综合权重视频排序方法 | |
CN106802915B (zh) | 一种基于用户行为的学术资源推荐方法 | |
CN106528813B (zh) | 一种多媒体推荐方法和装置 | |
CN108628833B (zh) | 原创内容摘要确定方法及装置,原创内容推荐方法及装置 | |
CN101739418A (zh) | 多指标综合权重音、视频专辑排序方法 | |
CN109299380B (zh) | 在线教育平台中基于多维特征的习题个性化推荐方法 | |
CN111125453B (zh) | 基于子图同构的社交网络中意见领袖角色识别方法及存储介质 | |
CN101739417A (zh) | 多指标综合权重音、视频专辑排序系统 | |
Voorhees | The evolution of cranfield | |
WO2011057497A1 (zh) | 一种词汇质量挖掘评价方法及装置 | |
CN103729424A (zh) | 问答社区内回答评价方法和系统 | |
CN107885745A (zh) | 一种歌曲推荐方法及装置 | |
WO2014056369A1 (zh) | 一种用于对搜索的网络视频进行排序的方法和系统 | |
CN108665148B (zh) | 一种电子资源质量评价方法、装置和存储介质 | |
CN101127046A (zh) | 一种对博客文章进行排序的方法及系统 | |
CN108563749B (zh) | 基于多维度信息和知识网络的在线教育系统资源推荐方法 | |
CN108829652A (zh) | 一种基于众包的图片标注系统 | |
CN102637179B (zh) | 词项加权函数确定及基于该函数进行搜索的方法及装置 | |
CN106326497A (zh) | 一种作弊视频用户识别方法及装置 | |
CN111444380A (zh) | 音乐搜索排序方法、装置、设备和存储介质 | |
CN111242660A (zh) | 用户满意度调查方法、装置、设备及计算机可读存储介质 | |
CN114818678A (zh) | 一种科技成果管理方法、平台及电子设备 | |
CN115858731A (zh) | 一种法规库法规匹配方法、装置及系统 | |
CN117352114B (zh) | 一种基于聚类算法的心理测评量表的推荐方法及系统 | |
CN101739419A (zh) | 多指标综合权重视频排序系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100616 |