CN108182290A

CN108182290A - 一种用于社区内容热度排序的估算方法

Info

Publication number: CN108182290A
Application number: CN201810087950.0A
Authority: CN
Inventors: 王玮; 苏常友
Original assignee: Shenzhen Futu Network Technology Co Ltd
Current assignee: Shenzhen Futu Network Technology Co Ltd
Priority date: 2018-01-30
Filing date: 2018-01-30
Publication date: 2018-06-19
Anticipated expiration: 2038-01-30
Also published as: CN108182290B

Abstract

本发明公开了一种用于社区内容热度排序的估算方法，其包括有如下步骤：步骤S1，计算社区内容的浏览分数Visit_scor；步骤S2，计算社区内容的点赞分数Like_score；步骤S3，计算社区内容的评论分数Comment_score；步骤S4，根据步骤S1～步骤S3的结果计算社区内容热度分数。相比现有技术而言，本发明能够更加全面客观的对社区内容热度进行评价，评价过程全程无需人工干预，同时，本发明能对内容热度给出量化评价，速度快、可靠性高，此外，本发明可用于对社区内容进行快速评价排序，从而起到筛选优质受欢迎的内容，并有效规避存在恶意刷赞刷评论的排序结果。

Description

一种用于社区内容热度排序的估算方法

技术领域

本发明涉及互联网社区发布内容热度排序方法，尤其涉及一种用于社区内容热度排序的估算方法。

背景技术

现有技术中，社区内容热度排序基本都依赖于点赞数、评论数等简单参数或者人工介入。可大致分为两类：一种方法是简单参数排序，即根据点赞数、评论数或者访问数等简单参数进行评估，将数量较大的社区内容排序在前，此类方法采用参数较为单一，很容易通过刷赞、刷评论等方式，将质量低下的内容恶意刷高排序，无法保证用户体验。另一种方法是人工主观评价，即利用人工主观评价来判定社区内容是否受欢迎，将人工认定的结果排序在前，此类方法中人工成本很高且耗时长，无法实现全自动评价，同时，这类评价方式主观性较强，且无法量化，当需要比较的结果的数量较多时，比较难度增大，人工评价的耗时会大幅增长，评价的可靠性会相应降低。

发明内容

本发明要解决的技术问题在于，针对现有技术的不足，提供一种能够对社区内容热度给出量化评价，并且评价速度快、可靠性高的用于社区内容热度排序的估算方法。

为解决上述技术问题，本发明采用如下技术方案。

一种用于社区内容热度排序的估算方法，其包括有如下步骤：步骤S1，计算社区内容的浏览分数：其中，C为全部社区内容中每篇社区内容被浏览过的平均人数，m为社区内容被每个人浏览过的平均次数，n为浏览过该篇社区内容的人数，xi是浏览过该篇社区内容的n个人中每个人的浏览次数，i＝1,2…,n；步骤S2，计算社区内容的点赞分数：Like_score＝log_e(like_uv+1)；其中，like_uv为该篇社区内容的点赞人数；步骤S3，计算社区内容的评论分数：

Comment_score＝

(log_e(comment_pv+1))^a*(log_e(comment_uv+1))^β；

其中，comment_pv是该社区内容被评论的次数，comment_uv是评论该社区内容的人数，0＝<α<1，0＝<β<1，并且α<β；步骤S4，根据步骤S1～步骤S3的结果计算社区内容热度分数：

其中，w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。

优选地，所述步骤S4中，默认状态下，w1＝0.2，w2＝0.4，w3＝0.4。

本发明公开的用于社区内容热度排序的估算方法中，其综合了社区内容的浏览次数、浏览人数、评论次数、评论人数、点赞人数等参数对社区内容热度进行综合评估，按照热度分数排序的算法，通过这种排序可以在无人工干预的情况下，全自动地根据多重参数得出更受用户欢迎的内容，进而避免仅通过点赞、评论数量排序而造成低质量的内容排序在前的结果。本发明相比现有技术而言的有益效果在于，本发明能够更加全面客观的对社区内容热度进行评价，评价过程全程无需人工干预，同时，本发明能对内容热度给出量化评价，速度快、可靠性高，此外，本发明可用于对社区内容进行快速评价排序，从而起到筛选优质受欢迎的内容，并有效规避存在恶意刷赞刷评论的排序结果。

具体实施方式

下面结合实施例对本发明作更加详细的描述。

本发明公开了一种用于社区内容热度排序的估算方法，其包括有如下步骤：

步骤S1，计算社区内容的浏览分数：

其中，C为全部社区内容中每篇社区内容被浏览过的平均人数，m为社区内容被每个人浏览过的平均次数，n为浏览过该篇社区内容的人数，xi是浏览过该篇社区内容的n个人中每个人的浏览次数，i＝1,2…,n；

步骤S2，计算社区内容的点赞分数：

Like_score＝log_e(like_uv+1)；

其中，like_uv为该篇社区内容的点赞人数；

步骤S3，计算社区内容的评论分数：

Comment_score＝

(log_e(comment_pv+1))^a*(log_e(comment_uv+1))^β；

其中，comment_pv是该社区内容被评论的次数，comment_uv是评论该社区内容的人数，0＝<α<1，0＝<β<1，并且α<β；

步骤S4，根据步骤S1～步骤S3的结果计算社区内容热度分数：

其中，w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。所述步骤S4中，默认状态下，w1＝0.2，w2＝0.4，w3＝0.4。

本发明公开的用于社区内容热度排序的估算方法，其综合了社区内容的浏览次数、浏览人数、评论次数、评论人数、点赞人数等参数对社区内容热度进行综合评估，按照热度分数排序的算法，通过这种排序可以在无人工干预的情况下，全自动地根据多重参数得出更受用户欢迎的内容，进而避免仅通过点赞、评论数量排序而造成低质量的内容排序在前的结果。

本发明在实际应用过程中，可参考如下实施例：

计算Visit_score的过程中，C是每篇社区内容平均被多少人浏览过，m是社区内容被每个人平均浏览过多少次，n是浏览过该篇社区内容的人数，xi代表的是浏览过该篇社区内容的n个人里每个人浏览的次数，i＝1,2…,n。公式Visit_score的设计借鉴了贝叶斯推断的思想，在不知道每个用户浏览社区内容次数的情况下，先估计一个值，这个值就是C*m，然后不断用新的信息修正，使得它越来越接近新的值。这个公式主要是解决了给一些只有较少人浏览过的社区内容，以相对公平的排名的问题。假设一篇只被2个人浏览过和一篇被200人浏览过的社区内容，如果按正常算平均的方式，被200人浏览过的社区内容肯定要比只被2个人浏览过的社区内容分数高，但只被2个人浏览过的社区内容很有可能只是它的曝光度比较低，很少人能发现到，所以才造成了浏览它的人数比较少，但社区内容的质量不一定低，在没有曝光度数据情况下，为了让被较少人浏览过的社区内容有相对公平一点的分数，就引入了C和m，C和m是在平均情况下，社区内容会被多少人浏览，平均每人浏览多少次，相当于给了一个默认的得分。

计算Like_score的过程中，like_uv是点赞了社区内容的人数，e是自然数，约为2.71828。本实施例中，对点赞人数取了对数，这样点赞人数的增加对得分增加的影响是越来越弱的，加1是为了避免对数的真数为0。

计算Comment_score的过程中，comment_pv是社区内容被评论的次数，comment_uv是评论了该社区内容的人数，e是自然数，约为2.71828，0＝<α<1，0＝<β<1，并且α<β。其中，α<β是为了让comment_pv对Comment_score的影响小于comment_uv对Comment_score的影响。

基于上述计算结果，本实施例对visit_score，like_score，comment_score用sigmoid函数进行整合，将最终得分归一化到0到1之间。其中，w1、w2、w3分别是Visit_score、Like_score、Comment_score的权重系数，默认规定w1＝0.2，w2＝0.4，w3＝0.4，当然这些权重系数是可以通过训练取更合适的值的，这就涉及以后建立相关的模型了。w1*visit_score+w2*like_score+w3*comment_score后面加1，是为了防止e的指数是0的情况。

本发明公开的用于社区内容热度排序的估算方法，其能够全自动评估社区中内容热度，能有效提升社区内容排序结果精度，并避免单个参数造成优质内容下沉、劣质内容排序在上的情况。同时，精准的热门内容排序结果可以直接用于社区、资讯等应用，大幅度减少人工交互，进而提升用户体验。

以上所述只是本发明较佳的实施例，并不用于限制本发明，凡在本发明的技术范围内所做的修改、等同替换或者改进等，均应包含在本发明所保护的范围内。

Claims

1.一种用于社区内容热度排序的估算方法，其特征在于，包括有如下步骤：

步骤S1，计算社区内容的浏览分数：

步骤S2，计算社区内容的点赞分数：

Like_score＝log_e(like_uv+1)；

其中，like_uv为该篇社区内容的点赞人数；

步骤S3，计算社区内容的评论分数：

Comment_score＝

(log_e(comment_pv+1))^a*(log_e(comment_uv+1))^β；

步骤S4，根据步骤S1～步骤S3的结果计算社区内容热度分数：

2.如权利要求1所述的用于社区内容热度排序的估算方法，其特征在于，所述步骤S4中，默认状态下，w1＝0.2，w2＝0.4，w3＝0.4。