CN108182290A - 一种用于社区内容热度排序的估算方法 - Google Patents
一种用于社区内容热度排序的估算方法 Download PDFInfo
- Publication number
- CN108182290A CN108182290A CN201810087950.0A CN201810087950A CN108182290A CN 108182290 A CN108182290 A CN 108182290A CN 201810087950 A CN201810087950 A CN 201810087950A CN 108182290 A CN108182290 A CN 108182290A
- Authority
- CN
- China
- Prior art keywords
- score
- community content
- comment
- community
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 21
- 210000003813 thumb Anatomy 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000012216 screening Methods 0.000 abstract description 2
- 238000012552 review Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于社区内容热度排序的估算方法,其包括有如下步骤:步骤S1,计算社区内容的浏览分数Visit_scor;步骤S2,计算社区内容的点赞分数Like_score;步骤S3,计算社区内容的评论分数Comment_score;步骤S4,根据步骤S1~步骤S3的结果计算社区内容热度分数。相比现有技术而言,本发明能够更加全面客观的对社区内容热度进行评价,评价过程全程无需人工干预,同时,本发明能对内容热度给出量化评价,速度快、可靠性高,此外,本发明可用于对社区内容进行快速评价排序,从而起到筛选优质受欢迎的内容,并有效规避存在恶意刷赞刷评论的排序结果。
Description
技术领域
本发明涉及互联网社区发布内容热度排序方法,尤其涉及一种用于社区内容热度排序的估算方法。
背景技术
现有技术中,社区内容热度排序基本都依赖于点赞数、评论数等简单参数或者人工介入。可大致分为两类:一种方法是简单参数排序,即根据点赞数、评论数或者访问数等简单参数进行评估,将数量较大的社区内容排序在前,此类方法采用参数较为单一,很容易通过刷赞、刷评论等方式,将质量低下的内容恶意刷高排序,无法保证用户体验。另一种方法是人工主观评价,即利用人工主观评价来判定社区内容是否受欢迎,将人工认定的结果排序在前,此类方法中人工成本很高且耗时长,无法实现全自动评价,同时,这类评价方式主观性较强,且无法量化,当需要比较的结果的数量较多时,比较难度增大,人工评价的耗时会大幅增长,评价的可靠性会相应降低。
发明内容
本发明要解决的技术问题在于,针对现有技术的不足,提供一种能够对社区内容热度给出量化评价,并且评价速度快、可靠性高的用于社区内容热度排序的估算方法。
为解决上述技术问题,本发明采用如下技术方案。
一种用于社区内容热度排序的估算方法,其包括有如下步骤:步骤S1,计算社区内容的浏览分数:其中,C为全部社区内容中每篇社区内容被浏览过的平均人数,m为社区内容被每个人浏览过的平均次数,n为浏览过该篇社区内容的人数,xi是浏览过该篇社区内容的n个人中每个人的浏览次数,i=1,2…,n;步骤S2,计算社区内容的点赞分数:Like_score=loge(like_uv+1);其中,like_uv为该篇社区内容的点赞人数;步骤S3,计算社区内容的评论分数:
Comment_score=
(loge(comment_pv+1))a*(loge(comment_uv+1))β;
其中,comment_pv是该社区内容被评论的次数,comment_uv是评论该社区内容的人数,0=<α<1,0=<β<1,并且α<β;步骤S4,根据步骤S1~步骤S3的结果计算社区内容热度分数:
其中,w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。
优选地,所述步骤S4中,默认状态下,w1=0.2,w2=0.4,w3=0.4。
本发明公开的用于社区内容热度排序的估算方法中,其综合了社区内容的浏览次数、浏览人数、评论次数、评论人数、点赞人数等参数对社区内容热度进行综合评估,按照热度分数排序的算法,通过这种排序可以在无人工干预的情况下,全自动地根据多重参数得出更受用户欢迎的内容,进而避免仅通过点赞、评论数量排序而造成低质量的内容排序在前的结果。本发明相比现有技术而言的有益效果在于,本发明能够更加全面客观的对社区内容热度进行评价,评价过程全程无需人工干预,同时,本发明能对内容热度给出量化评价,速度快、可靠性高,此外,本发明可用于对社区内容进行快速评价排序,从而起到筛选优质受欢迎的内容,并有效规避存在恶意刷赞刷评论的排序结果。
具体实施方式
下面结合实施例对本发明作更加详细的描述。
本发明公开了一种用于社区内容热度排序的估算方法,其包括有如下步骤:
步骤S1,计算社区内容的浏览分数:
其中,C为全部社区内容中每篇社区内容被浏览过的平均人数,m为社区内容被每个人浏览过的平均次数,n为浏览过该篇社区内容的人数,xi是浏览过该篇社区内容的n个人中每个人的浏览次数,i=1,2…,n;
步骤S2,计算社区内容的点赞分数:
Like_score=loge(like_uv+1);
其中,like_uv为该篇社区内容的点赞人数;
步骤S3,计算社区内容的评论分数:
Comment_score=
(loge(comment_pv+1))a*(loge(comment_uv+1))β;
其中,comment_pv是该社区内容被评论的次数,comment_uv是评论该社区内容的人数,0=<α<1,0=<β<1,并且α<β;
步骤S4,根据步骤S1~步骤S3的结果计算社区内容热度分数:
其中,w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。所述步骤S4中,默认状态下,w1=0.2,w2=0.4,w3=0.4。
本发明公开的用于社区内容热度排序的估算方法,其综合了社区内容的浏览次数、浏览人数、评论次数、评论人数、点赞人数等参数对社区内容热度进行综合评估,按照热度分数排序的算法,通过这种排序可以在无人工干预的情况下,全自动地根据多重参数得出更受用户欢迎的内容,进而避免仅通过点赞、评论数量排序而造成低质量的内容排序在前的结果。
本发明在实际应用过程中,可参考如下实施例:
计算Visit_score的过程中,C是每篇社区内容平均被多少人浏览过,m是社区内容被每个人平均浏览过多少次,n是浏览过该篇社区内容的人数,xi代表的是浏览过该篇社区内容的n个人里每个人浏览的次数,i=1,2…,n。公式Visit_score的设计借鉴了贝叶斯推断的思想,在不知道每个用户浏览社区内容次数的情况下,先估计一个值,这个值就是C*m,然后不断用新的信息修正,使得它越来越接近新的值。这个公式主要是解决了给一些只有较少人浏览过的社区内容,以相对公平的排名的问题。假设一篇只被2个人浏览过和一篇被200人浏览过的社区内容,如果按正常算平均的方式,被200人浏览过的社区内容肯定要比只被2个人浏览过的社区内容分数高,但只被2个人浏览过的社区内容很有可能只是它的曝光度比较低,很少人能发现到,所以才造成了浏览它的人数比较少,但社区内容的质量不一定低,在没有曝光度数据情况下,为了让被较少人浏览过的社区内容有相对公平一点的分数,就引入了C和m,C和m是在平均情况下,社区内容会被多少人浏览,平均每人浏览多少次,相当于给了一个默认的得分。
计算Like_score的过程中,like_uv是点赞了社区内容的人数,e是自然数,约为2.71828。本实施例中,对点赞人数取了对数,这样点赞人数的增加对得分增加的影响是越来越弱的,加1是为了避免对数的真数为0。
计算Comment_score的过程中,comment_pv是社区内容被评论的次数,comment_uv是评论了该社区内容的人数,e是自然数,约为2.71828,0=<α<1,0=<β<1,并且α<β。其中,α<β是为了让comment_pv对Comment_score的影响小于comment_uv对Comment_score的影响。
基于上述计算结果,本实施例对visit_score,like_score,comment_score用sigmoid函数进行整合,将最终得分归一化到0到1之间。其中,w1、w2、w3分别是Visit_score、Like_score、Comment_score的权重系数,默认规定w1=0.2,w2=0.4,w3=0.4,当然这些权重系数是可以通过训练取更合适的值的,这就涉及以后建立相关的模型了。w1*visit_score+w2*like_score+w3*comment_score后面加1,是为了防止e的指数是0的情况。
本发明公开的用于社区内容热度排序的估算方法,其能够全自动评估社区中内容热度,能有效提升社区内容排序结果精度,并避免单个参数造成优质内容下沉、劣质内容排序在上的情况。同时,精准的热门内容排序结果可以直接用于社区、资讯等应用,大幅度减少人工交互,进而提升用户体验。
以上所述只是本发明较佳的实施例,并不用于限制本发明,凡在本发明的技术范围内所做的修改、等同替换或者改进等,均应包含在本发明所保护的范围内。
Claims (2)
1.一种用于社区内容热度排序的估算方法,其特征在于,包括有如下步骤:
步骤S1,计算社区内容的浏览分数:
其中,C为全部社区内容中每篇社区内容被浏览过的平均人数,m为社区内容被每个人浏览过的平均次数,n为浏览过该篇社区内容的人数,xi是浏览过该篇社区内容的n个人中每个人的浏览次数,i=1,2…,n;
步骤S2,计算社区内容的点赞分数:
Like_score=loge(like_uv+1);
其中,like_uv为该篇社区内容的点赞人数;
步骤S3,计算社区内容的评论分数:
Comment_score=
(loge(comment_pv+1))a*(loge(comment_uv+1))β;
其中,comment_pv是该社区内容被评论的次数,comment_uv是评论该社区内容的人数,0=<α<1,0=<β<1,并且α<β;
步骤S4,根据步骤S1~步骤S3的结果计算社区内容热度分数:
其中,w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。
2.如权利要求1所述的用于社区内容热度排序的估算方法,其特征在于,所述步骤S4中,默认状态下,w1=0.2,w2=0.4,w3=0.4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810087950.0A CN108182290B (zh) | 2018-01-30 | 2018-01-30 | 一种用于社区内容热度排序的估算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810087950.0A CN108182290B (zh) | 2018-01-30 | 2018-01-30 | 一种用于社区内容热度排序的估算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108182290A true CN108182290A (zh) | 2018-06-19 |
CN108182290B CN108182290B (zh) | 2022-03-25 |
Family
ID=62551712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810087950.0A Active CN108182290B (zh) | 2018-01-30 | 2018-01-30 | 一种用于社区内容热度排序的估算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182290B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109189922A (zh) * | 2018-08-07 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 评论评估模型的训练方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070061302A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Location influenced search results |
CN103955547A (zh) * | 2014-05-22 | 2014-07-30 | 厦门市美亚柏科信息股份有限公司 | 发现论坛热帖的方法和系统 |
CN105159898A (zh) * | 2014-06-12 | 2015-12-16 | 北京搜狗科技发展有限公司 | 一种搜索的方法和装置 |
CN105490922A (zh) * | 2015-12-14 | 2016-04-13 | 苏州天平先进数字科技有限公司 | 一种基于用户兴趣的社区系统 |
CN105701097A (zh) * | 2014-11-25 | 2016-06-22 | 四三九九网络股份有限公司 | 一种基于社交网络平台的舆情分析方法及系统 |
CN105989077A (zh) * | 2015-02-09 | 2016-10-05 | 北京字节跳动科技有限公司 | 一种基于推荐的兴趣社区用户引导方法 |
CN106570763A (zh) * | 2016-11-09 | 2017-04-19 | 福建中金在线信息科技有限公司 | 用户影响力评估的方法及系统 |
CN106909618A (zh) * | 2017-01-13 | 2017-06-30 | 广州薏生网络科技有限公司 | 一种健康类自媒体上的文章传播综合影响力的计算方法 |
US20170199906A1 (en) * | 2013-03-08 | 2017-07-13 | Verint Americas Inc. | System and method for content-quality scoring |
CN106980646A (zh) * | 2017-02-27 | 2017-07-25 | 上海大学 | 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法 |
-
2018
- 2018-01-30 CN CN201810087950.0A patent/CN108182290B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070061302A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Location influenced search results |
US20170199906A1 (en) * | 2013-03-08 | 2017-07-13 | Verint Americas Inc. | System and method for content-quality scoring |
CN103955547A (zh) * | 2014-05-22 | 2014-07-30 | 厦门市美亚柏科信息股份有限公司 | 发现论坛热帖的方法和系统 |
CN105159898A (zh) * | 2014-06-12 | 2015-12-16 | 北京搜狗科技发展有限公司 | 一种搜索的方法和装置 |
CN105701097A (zh) * | 2014-11-25 | 2016-06-22 | 四三九九网络股份有限公司 | 一种基于社交网络平台的舆情分析方法及系统 |
CN105989077A (zh) * | 2015-02-09 | 2016-10-05 | 北京字节跳动科技有限公司 | 一种基于推荐的兴趣社区用户引导方法 |
CN105490922A (zh) * | 2015-12-14 | 2016-04-13 | 苏州天平先进数字科技有限公司 | 一种基于用户兴趣的社区系统 |
CN106570763A (zh) * | 2016-11-09 | 2017-04-19 | 福建中金在线信息科技有限公司 | 用户影响力评估的方法及系统 |
CN106909618A (zh) * | 2017-01-13 | 2017-06-30 | 广州薏生网络科技有限公司 | 一种健康类自媒体上的文章传播综合影响力的计算方法 |
CN106980646A (zh) * | 2017-02-27 | 2017-07-25 | 上海大学 | 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法 |
Non-Patent Citations (2)
Title |
---|
JITENDRA KUMAR ET AL.: "Finding Instantaneous Community of Ideologically Similar Users in Social Forums", 《2017 NINTH INTERNATIONAL CONFERENCE ON ADVANCED COMPUTING》 * |
张贺贺: "知乎社区的内容运营策略研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109189922A (zh) * | 2018-08-07 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 评论评估模型的训练方法和装置 |
CN109189922B (zh) * | 2018-08-07 | 2021-06-29 | 创新先进技术有限公司 | 评论评估模型的训练方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108182290B (zh) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Datta et al. | Algorithmic inferencing of aesthetics and emotion in natural images: An exposition | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN102541590B (zh) | 一种软件推荐方法及推荐系统 | |
He et al. | Rethinking Image Aesthetics Assessment: Models, Datasets and Benchmarks. | |
CN102855256B (zh) | 用于确定网站评价信息的方法、装置及设备 | |
CN108304399A (zh) | 网络内容的推荐方法及装置 | |
Thomas et al. | Computer simulations assessing the potential performance benefit of a final increase in training during pre-event taper | |
CN108287857A (zh) | 表情图片推荐方法及装置 | |
CN112200736B (zh) | 基于强化学习的图像处理方法及模型训练方法、装置 | |
CN110162709A (zh) | 一种结合对偶对抗生成网络的鲁棒的个性化排名方法 | |
Wang | Zipf Matrix Factorization: Matrix Factorization with Matthew Effect Reduction | |
CN105701134A (zh) | 电子书快速预览方法及有快速预览阅读模式的电子书 | |
Chan et al. | Varying spread fuzzy regression for affective quality estimation | |
CN110825974B (zh) | 推荐系统内容排序方法及装置 | |
CN108550382A (zh) | 一种运动设备的参数调整方法及服务器 | |
CN108182290A (zh) | 一种用于社区内容热度排序的估算方法 | |
CN108304535A (zh) | 一种社区内容智能排序估算方法 | |
Ling et al. | A subjective study of multi-dimensional aesthetic assessment for mobile game image | |
CN105912549A (zh) | 一种内容推荐方法及其装置 | |
Yu et al. | Exploring folksonomy and cooking procedures to boost cooking recipe recommendation | |
Takeuchi et al. | Using social media to change eating habits without conscious effort | |
Park et al. | A literature review and classification of recommender systems on academic journals | |
James et al. | Relationships between measures of physical fitness change when age-dependent bias is removed in a group of young male soccer players | |
Guan et al. | Preference of online users and personalized recommendations | |
Potter | Putting the collaborator back into collaborative filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |