CN106528525B - 一种识别排行榜作弊的方法和装置 - Google Patents

一种识别排行榜作弊的方法和装置 Download PDF

Info

Publication number
CN106528525B
CN106528525B CN201610873224.2A CN201610873224A CN106528525B CN 106528525 B CN106528525 B CN 106528525B CN 201610873224 A CN201610873224 A CN 201610873224A CN 106528525 B CN106528525 B CN 106528525B
Authority
CN
China
Prior art keywords
display information
information
comment
cheating
ranking list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610873224.2A
Other languages
English (en)
Other versions
CN106528525A (zh
Inventor
周林军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Guangzhou Kugou Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kugou Computer Technology Co Ltd filed Critical Guangzhou Kugou Computer Technology Co Ltd
Priority to CN201610873224.2A priority Critical patent/CN106528525B/zh
Publication of CN106528525A publication Critical patent/CN106528525A/zh
Application granted granted Critical
Publication of CN106528525B publication Critical patent/CN106528525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种识别排行榜作弊的方法和装置,属于计算机技术领域。所述方法包括:获取展示信息排行榜中的第一展示信息的各评论信息;在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息;确定所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息。采用本发明,可以提高识别排行榜作弊的效率。

Description

一种识别排行榜作弊的方法和装置
技术领域
本发明涉及计算机技术领域,特别涉及一种识别视频排行榜作弊的方法和装置。
背景技术
随着视频技术和网络技术的飞速发展,网络视频得到了快速的推广,成为了人们生活中最常用的娱乐方式之一。
一般提供网络视频的网站或应用程序的服务器会提供排行榜的功能,基于每个网络视频的播放数、评论数、分享数、点赞数、送礼数进行评分,并基于分值高低,在网站或应用程序的页面中,对网络视频进行排序展示。用户可以基于网络视频的排序,选择优质的网络视频进行观看。
有些用户会使用某些机器人软件,模拟不同用户进行播放、评论、分享、点赞等操作,进而将网络视频的评分刷高。这样,某些劣质的网络视频就会进入排行榜,甚至位于排行榜的前列,影响排行榜的准确性。一般技术人员会通过人工观看网络视频的方式,逐一确认每个网络视频是否为排行榜作弊的网络视频。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
通过人工观看网络视频的方式比较耗时,识别排行榜作弊的效率较低。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种识别排行榜作弊的方法和装置。所述技术方案如下:
第一方面,提供了一种识别排行榜作弊的方法,所述方法包括:
获取展示信息排行榜中的第一展示信息的各评论信息;
在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息;
确定所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;
根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述获取展示信息排行榜中的第一展示信息的各评论信息,包括:
当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的所述第一展示信息的各评论信息。
这样,可以提高作弊检测的及时性。
可选的,所述在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,包括:
基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
这样,提供了查询差评信息的多种方式。
可选的,所述根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目;
根据所述比例,以及所述被判定为排行榜作弊的展示信息的数目,识别所述第一展示信息是否为排行榜作弊的展示信息。
这样,可以参考历史作弊情况,使识别结果更加准确。
可选的,所述根据所述比例,以及所述被判定为排行榜作弊的展示信息的数目,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
根据所述比例,所述比例对应的第一预设加权系数,所述被判定为排行榜作弊的展示信息的数目,以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定所述第一展示信息的作弊加权值;
根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息。
这样,可以更精确的调节不同因素对作弊可能性的影响,使识别结果更加准确。
可选的,所述根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
如果所述作弊加权值小于预设阈值,则判定所述第一展示信息不是排行榜作弊的展示信息;
如果所述作弊加权值大于或等于预设阈值,则判定所述第一展示信息是排行榜作弊的展示信息。
可选的,所述方法还包括:
如果所述第一展示信息为排行榜作弊的展示信息,则将所述第一展示信息,从所述展示信息排行榜中删除。
这样,将作弊的展示信息剔除,可以使排行榜的准确度更高。
第二方面,提供了一种识别排行榜作弊的装置,所述装置包括:
获取模块,用于获取展示信息排行榜中的第一展示信息的各评论信息;
差评确定模块,用于在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息;
比例确定模块,用于所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;
识别模块,用于根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述获取模块,用于:
当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的所述第一展示信息的各评论信息。
可选的,所述差评确定模块,用于:
基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
可选的,所述识别模块,用于:
确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目;
根据所述比例,以及所述被判定为排行榜作弊的展示信息的数目,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述识别模块,用于:
根据所述比例,所述比例对应的第一预设加权系数,所述被判定为排行榜作弊的展示信息的数目,以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定所述第一展示信息的作弊加权值;
根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述识别模块,用于:
如果所述作弊加权值小于预设阈值,则判定所述第一展示信息不是排行榜作弊的展示信息;
如果所述作弊加权值大于或等于预设阈值,则判定所述第一展示信息是排行榜作弊的展示信息。
可选的,所述装置还包括:
删除模块,用于如果所述第一展示信息为排行榜作弊的展示信息,则将所述第一展示信息,从所述展示信息排行榜中删除。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例中,获取展示信息排行榜中的第一展示信息的各评论信息,在第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例,根据该比例,识别第一展示信息是否为排行榜作弊的展示信息。因为作弊的展示信息的内容一般较为劣质,所以用户的评论中差评会比较多,进而,基于上述处理,可以自动识别排行榜作弊的网络视频,从而,可以提高识别排行榜作弊的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种识别排行榜作弊的方法的流程示意图;
图2是本发明实施例提供的一种识别排行榜作弊的方法的流程示意图;
图3是本发明实施例提供的一种识别排行榜作弊的方法的流程示意图;
图4是本发明实施例提供的一种识别排行榜作弊的装置的结构示意图;
图5是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种识别排行榜作弊的方法,该方法可以由网络侧的服务器实现。其中,该服务器可以是网络视频应用程序的后台服务器,或者视频网站的网站服务器。服务器可以包括处理器、存储器、收发器等部件。处理器,可以为CPU(CentralProcessing Unit,中央处理单元)等,可以用于获取展示信息排行榜中展示信息的评论信息,确定包含至少一个预设的差评相关词的评论信息,确定差评信息在评论信息中的比例,识别排行榜作弊,等处理。存储器,可以为RAM(Random Access Memory,随机存取存储器),Flash(闪存)等,可以用于存储接收到的数据、处理过程所需的数据、处理过程中生成的数据等,如展示信息排行榜、展示信息、评论信息、差评相关词、比例值等。收发器,可以用于与终端进行数据传输,例如将展示信息排行榜发送给终端,可以包括天线、匹配电路、调制解调器等。
如图1所示,该方法的处理流程可以包括如下的步骤:
步骤101,获取展示信息排行榜中的第一展示信息的各评论信息。
其中,展示信息可以是视频信息、音频信息、图片信息、文字信息等等,本实施例以录播的视频信息为例进行方案的详细说明,其它情况与之类似,本实施例不再累述。第一展示信息可以是展示信息排行榜中的任一展示信息。
在实施中,用户可以通过其终端开启网络视频的应用程序,在应用程序中可以显示有大量的网络视频的选项,供用户选择。用户可以选择自己喜欢的网络视频进行播放,而且可以在观看的过程中对网络视频进行评论、分享、点赞,还可以对网络视频的发布账户赠送礼物。服务器则可以对每个网络视频的播放数、评论数、分享数、点赞数、送礼数等进行统计。基于统计数值对每个网络视频进行评分,并基于评分对网络视频进行排名,将排名最前的预设数目(如100)个网络视频设置在展示信息排行榜(即视频排行榜)中。对于展示信息排行榜中的任一展示信息,服务器可以获取该展示信息(即第一展示信息)的所有评论信息。服务器可以对展示信息排行榜中的部分或全部展示信息进行本实施例流程的处理。
可选的,可以为步骤101的处理设置相应的触发条件,触发条件可以多种多样,以下给出了其中几种可行的方式:
方式一,当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息。
在实施中,技术人员可以预先设置作弊检测周期,如1小时,作弊检测周期用于触发对排行榜作弊进行检测。每经过一个作弊检测周期,服务器则可以对展示信息排行榜中的部分或全部展示信息进行本实施例流程的处理。
方式二,当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息。
在实施中,技术人员可以通过控制终端向服务器发送作弊检测指令,服务器接收到作弊检测指令,则可以对展示信息排行榜中的部分或全部展示信息进行本实施例流程的处理。
方式三,当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的第一展示信息的各评论信息。
在实施中,技术人员可以预先设置一个单位时长(如1小时或5小时),用于示信息的播放数、评论数、分享数、点赞数的单位时长统计。服务器可以按照该单位时长对每个展示信息的播放数、评论数、分享数、点赞数进行统计(可以统计这些数值中的一项或多项数值),统计每个单位时长中的播放数、评论数、分享数、点赞数、送礼数。对于任一展示信息(以第一展示信息为例),服务器每统计完一个单位时长,可以将该单位时长内统计的数据与上一个单位时长内统计的数据进行比较,如果某一项数据(如播放数、评论数、分享数或点赞数等)的增长值(即当前单位时长内的数值与上一个单位时长内的数值的差值)超过预设阈值,则可以判定该项数据出现了突增,有可能是某人通过非法程序(如机器人程序)在刷该项数据(如播放数)。此时,服务器可以触发对第一展示信息进行本实施例流程的处理。
步骤102,在第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
其中,差评相关词是用于判定评论信息为差评信息的词语,如垃圾、差劲、难看等。评论信息中如果包含差评相关词,则可以被认为是差评信息。
在实施中,技术人员可以预先在服务器中建立差评相关词库,其中存储有大量技术人员预先设置的差评相关词。服务器在获取第一展示信息的所有评论信息后,对于每个评论信息,可以将其内容与差评相关词库中的各差评相关词进行匹配判断,确定出包含一个或多个差评相关词的评论信息,这样的评论信息可称为差评信息。如果某评论信息不包含任何一个差评相关词,则不认为该评论信息为差评信息。
可选的,进行匹配查询的方式可以多种多样,相应的上述处理可以为:基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
在实施中,模糊匹配的方式可以是,对于差评相关词A,如果A中的每个文字都包含于某评论信息中,则判定该评论信息与差评相关词A匹配,即该评论信息包含差评相关词A。分词匹配的方式可以是,对评论信息进行分词,确定其中包含的所有词语,然后将所有词语分别与差评相关词库中的所有差评相关词进行匹配判定,如果差评相关词B与评论信息中的某个词语相匹配,则确定评论信息与该差评相关词B相匹配,即该评论信息包含差评相关词B。
步骤103,确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例。
在实施中,对于第一展示信息的所有评论信息,服务器可以确定其中包含至少一个预设的差评相关词的评论信息的数目(可称作第一数目)。同时,服务器还可以确定第一展示信息的所有评论信息的总数目(可称作第二数目)。进而,服务器可以计算第一数目与第二数目的比值,即得到包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例。
步骤104,根据该比例,识别第一展示信息是否为排行榜作弊的展示信息。
在实施中,服务器可以基于上述步骤确定的比例,来识别第一展示信息是否为排行榜作弊的展示信息。服务器可以先根据该比例,确定第一展示信息是否为疑似的排行榜作弊的展示信息,如果是,则对第一展示信息进行标记,技术人员看到第一展示信息的标记后,可以通过控制终端对第一展示信息进行播放,观看第一展示信息后,如果技术人员判定第一展示信息为排行榜作弊的展示信息,可以点击确认作弊的按键,服务器则可以确定并记录第一展示信息为排行榜作弊的展示信息。如果技术人员判定第一展示信息不是排行榜作弊的展示信息,可以点击取消作弊的按键,服务器则可以确定并记录第一展示信息不是排行榜作弊的展示信息。
可选的,还可以基于第一展示信息所属的账户的历史作弊情况,来识别第一展示信息是否为排行榜作弊的展示信息,相应的处理可以如图2所示,可以包括如下步骤:
步骤1041,确定发布第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目。
在实施中,服务器可以确定发布第一展示信息的账户,进而确定该账户之前发布的其它展示信息中,有没有排行榜作弊的展示信息,以及排行榜作弊的展示信息的数目。
步骤1042,根据上述比例,以及被判定为排行榜作弊的展示信息的数目,识别第一展示信息是否为排行榜作弊的展示信息。
可选的,可以采用加权分值的方法来识别作弊,相应的,如图3所示,步骤1042的处理可以包括如下步骤:
步骤1042a,根据上述比例,比例对应的第一预设加权系数,被判定为排行榜作弊的展示信息的数目,以及被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定第一展示信息的作弊加权值。
其中,作弊加权值是用于反映展示信息存在排行榜作弊的可能性的参数,作弊加权值越大,则可能性越大,作弊加权值越小,则可能性越小。
在实施中,技术人员可以在服务器预先设置比例对应的加权系数(即第一预设加权系数,可记做a),以及被判定为排行榜作弊的展示信息的数目对应的加权系数(即第二预设加权系数,可记做b)。当服务器确定比例的数值(可记做M),以及被判定为排行榜作弊的展示信息的数目的数值(可记做N)后,可以基于公式P=M*a+N*b,计算作弊加权值P。
步骤1042b,根据第一展示信息的作弊加权值,识别第一展示信息是否为排行榜作弊的展示信息。
在实施例中,该步骤的处理方式可以多种多样,以下给出了几种可行的方式:
方式一,如果作弊加权值小于预设阈值,则判定第一展示信息不是排行榜作弊的展示信息;如果作弊加权值大于或等于预设阈值,则标记所述第一展示信息为疑似的排行榜作弊的展示信息,当接收到第一展示信息的确认作弊指令时,确定并记录第一展示信息是排行榜作弊的展示信息,当接收到第一展示信息的取消作弊指令时,确定第一展示信息不是排行榜作弊的展示信息。
在实施中,技术人员如果发现第一展示信息被标记为疑似的排行榜作弊的展示信息,则可以播放第一展示信息,经过观看,技术人员如果确定第一展示信息是比较优质的展示信息,即不存在排行榜作弊,则可以点击取消作弊的按键,触发取消作弊指令,如果确定第一展示信息是比较劣质的展示信息,即存在排行榜作弊,则可以点击确认作弊的按键,触发确认作弊指令。
方式二,如果作弊加权值小于预设阈值,则判定第一展示信息不是排行榜作弊的展示信息;如果作弊加权值大于或等于预设阈值,则判定第一展示信息是排行榜作弊的展示信息。
这种方式可以由服务器自动判断作弊,不需要人工参与。
可选的,在步骤104之后,还可以进行如下处理:
如果第一展示信息为排行榜作弊的展示信息,则将第一展示信息,从展示信息排行榜中删除。
在实施中,如果服务器根据上述比例,判定第一展示信息为排行榜作弊的展示信息,则可以将第一展示信息,从展示信息排行榜中删除。用户在应用程序中的展示信息排行榜中,则不会在看到第一展示信息。
本发明实施例中,获取展示信息排行榜中的第一展示信息的各评论信息,在第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例,根据该比例,识别第一展示信息是否为排行榜作弊的展示信息。因为作弊的展示信息的内容一般较为劣质,所以用户的评论中差评会比较多,进而,基于上述处理,可以自动识别排行榜作弊的网络视频,从而,可以提高识别排行榜作弊的效率。
基于相同的技术构思,本发明实施例还提供了一种识别排行榜作弊的装置,该装置可以是上述实施例中的服务器,如图4所示,该装置可以包括:
获取模块410,用于获取展示信息排行榜中的第一展示信息的各评论信息;
差评确定模块420,用于在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息;
比例确定模块430,用于所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;
识别模块440,用于根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述获取模块410,用于:
当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息;
当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的所述第一展示信息的各评论信息。
可选的,所述差评确定模块420,用于:
基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
可选的,所述识别模块440,用于:
确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目;
根据所述比例,以及所述被判定为排行榜作弊的展示信息的数目,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述识别模块440,用于:
根据所述比例,所述比例对应的第一预设加权系数,所述被判定为排行榜作弊的展示信息的数目,以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定所述第一展示信息的作弊加权值;
根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述识别模块440,用于:
如果所述作弊加权值小于预设阈值,则判定所述第一展示信息不是排行榜作弊的展示信息;
如果所述作弊加权值大于或等于预设阈值,则判定所述第一展示信息是排行榜作弊的展示信息。
可选的,所述装置还包括:
删除模块450,用于如果所述第一展示信息为排行榜作弊的展示信息,则将所述第一展示信息,从所述展示信息排行榜中删除。
本发明实施例中,获取展示信息排行榜中的第一展示信息的各评论信息,在第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例,根据该比例,识别第一展示信息是否为排行榜作弊的展示信息。因为作弊的展示信息的内容一般较为劣质,所以用户的评论中差评会比较多,进而,基于上述处理,可以自动识别排行榜作弊的网络视频,从而,可以提高识别排行榜作弊的效率。
需要说明的是:上述实施例提供的获取歌曲信息的装置在获取歌曲信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的获取歌曲信息的装置与获取歌曲信息的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5是本发明实施例提供的服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
服务器1900可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取展示信息排行榜中的第一展示信息的各评论信息;
在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息;
确定所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;
根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述获取展示信息排行榜中的第一展示信息的各评论信息,包括:
当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息;
当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的所述第一展示信息的各评论信息。
可选的,所述在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,包括:
基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
可选的,所述根据所述比例,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目;
根据所述比例,以及所述被判定为排行榜作弊的展示信息的数目,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述根据所述比例,以及所述被判定为排行榜作弊的展示信息的数目,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
根据所述比例,所述比例对应的第一预设加权系数,所述被判定为排行榜作弊的展示信息的数目,以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定所述第一展示信息的作弊加权值;
根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息。
可选的,所述根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
如果所述作弊加权值小于预设阈值,则判定所述第一展示信息不是排行榜作弊的展示信息;
如果所述作弊加权值大于或等于预设阈值,则判定所述第一展示信息是排行榜作弊的展示信息。
可选的,所述方法还包括:
如果所述第一展示信息为排行榜作弊的展示信息,则将所述第一展示信息,从所述展示信息排行榜中删除。
本发明实施例中,获取展示信息排行榜中的第一展示信息的各评论信息,在第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例,根据该比例,识别第一展示信息是否为排行榜作弊的展示信息。因为作弊的展示信息的内容一般较为劣质,所以用户的评论中差评会比较多,进而,基于上述处理,可以自动识别排行榜作弊的网络视频,从而,可以提高识别排行榜作弊的效率。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种识别排行榜作弊的方法,其特征在于,所述方法包括:
获取展示信息排行榜中的第一展示信息的各评论信息;
在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,所述差评相关词为用于判定所述评论信息为差评信息的词语;
确定所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;
确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目;
根据所述比例,所述比例对应的第一预设加权系数,所述被判定为排行榜作弊的展示信息的数目,以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定所述第一展示信息的作弊加权值;
根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息。
2.根据权利要求1所述的方法,其特征在于,所述获取展示信息排行榜中的第一展示信息的各评论信息,包括:
当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的所述第一展示信息的各评论信息。
3.根据权利要求1所述的方法,其特征在于,所述在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,包括:
基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息,包括:
如果所述作弊加权值小于预设阈值,则判定所述第一展示信息不是排行榜作弊的展示信息;
如果所述作弊加权值大于或等于预设阈值,则判定所述第一展示信息是排行榜作弊的展示信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述第一展示信息为排行榜作弊的展示信息,则将所述第一展示信息,从所述展示信息排行榜中删除。
6.一种识别排行榜作弊的装置,其特征在于,所述装置包括:
获取模块,用于获取展示信息排行榜中的第一展示信息的各评论信息;
差评确定模块,用于在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息,所述差评相关词为用于判定所述评论信息为差评信息的词语;
比例确定模块,用于所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例;
识别模块,用于确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目;根据所述比例,所述比例对应的第一预设加权系数,所述被判定为排行榜作弊的展示信息的数目,以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数,确定所述第一展示信息的作弊加权值;根据所述第一展示信息的作弊加权值,识别所述第一展示信息是否为排行榜作弊的展示信息。
7.根据权利要求6所述的装置,其特征在于,所述获取模块,用于:
当达到预设的作弊检测周期时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当接收到作弊检测指令时,获取展示信息排行榜中的第一展示信息的各评论信息;或者,
当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值,与上一个单位时长内的数值的差值超过预设阈值时,获取展示信息排行榜中的所述第一展示信息的各评论信息。
8.根据权利要求6所述的装置,其特征在于,所述差评确定模块,用于:
基于模糊匹配和/或分词匹配,在所述第一展示信息的各评论信息中,确定包含至少一个预设的差评相关词的评论信息。
9.根据权利要求6所述的装置,其特征在于,所述识别模块,用于:
如果所述作弊加权值小于预设阈值,则判定所述第一展示信息不是排行榜作弊的展示信息;
如果所述作弊加权值大于或等于预设阈值,则判定所述第一展示信息是排行榜作弊的展示信息。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
删除模块,用于如果所述第一展示信息为排行榜作弊的展示信息,则将所述第一展示信息,从所述展示信息排行榜中删除。
CN201610873224.2A 2016-09-30 2016-09-30 一种识别排行榜作弊的方法和装置 Active CN106528525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610873224.2A CN106528525B (zh) 2016-09-30 2016-09-30 一种识别排行榜作弊的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610873224.2A CN106528525B (zh) 2016-09-30 2016-09-30 一种识别排行榜作弊的方法和装置

Publications (2)

Publication Number Publication Date
CN106528525A CN106528525A (zh) 2017-03-22
CN106528525B true CN106528525B (zh) 2021-02-12

Family

ID=58331429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610873224.2A Active CN106528525B (zh) 2016-09-30 2016-09-30 一种识别排行榜作弊的方法和装置

Country Status (1)

Country Link
CN (1) CN106528525B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304452B (zh) * 2017-12-14 2021-03-26 腾讯科技(深圳)有限公司 文章处理方法及装置、存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090094669A1 (en) * 2007-10-05 2009-04-09 Subex Azure Limited Detecting fraud in a communications network
CN102740143B (zh) * 2012-07-03 2014-08-20 合一网络技术(北京)有限公司 一种基于用户行为的网络视频榜单生成系统及其方法
CN103577541B (zh) * 2013-10-10 2017-10-10 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103559208B (zh) * 2013-10-10 2017-03-01 北京智谷睿拓技术服务有限公司 应用程序的排名欺诈检测方法和排名欺诈检测系统
CN103761228B (zh) * 2013-10-10 2017-10-13 北京智谷睿拓技术服务有限公司 应用程序的排名阈值确定方法和排名阈值确定系统

Also Published As

Publication number Publication date
CN106528525A (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
US9849381B2 (en) Methods and systems of automatic management online fantasy sports rosters
US20190373331A1 (en) Multi-content recommendation system combining user model, item model and real time signals
CN106454536B (zh) 信息推荐度的确定方法及装置
CN110047513B (zh) 一种视频监测方法、装置、电子设备和存储介质
CN109344292B (zh) 赛事得分片段的生成方法、装置、服务器和存储介质
KR20180094833A (ko) 게임 친구 추천 장치 및 게임 친구 추천 방법
CN110362458B (zh) 应用程序评价提示方法、装置、电子设备及可读存储介质
CN110833696A (zh) 玩家排名方法与装置、存储介质、电子设备
WO2020242596A1 (en) Providing responses in an event-related session
CN106075913A (zh) 一种信息处理方法及终端
CN112237742B (zh) 游戏推荐方法、装置、可读存储介质及计算机设备
CN105991583A (zh) 一种游戏应用推荐方法、应用服务器、终端及系统
CN106528525B (zh) 一种识别排行榜作弊的方法和装置
CN114036395A (zh) 内容推荐方法、装置、计算机设备及计算机可读存储介质
US11040280B2 (en) Game processing method and information processing device
CN110929285B (zh) 一种隐私数据的处理方法及装置
CA3144693A1 (en) Information provision device, method, and program for providing quiz information corresponding to an event
CN110574066B (zh) 服务器装置以及记录介质
CN114466214B (zh) 直播间人数统计方法及装置
CN113244626B (zh) 信息推送方法、装置、设备及存储介质
CN113780415B (zh) 基于小程序游戏的用户画像生成方法、装置、设备及介质
CN112507214B (zh) 基于用户名的数据处理方法、装置、设备及介质
CN110557660B (zh) 一种直播视频处理方法及装置
CN110297982B (zh) 一种推荐方法、装置、设备及介质
CN109726267B (zh) 用于故事机的故事推荐方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 510660 Guangzhou City, Guangzhou, Guangdong, Whampoa Avenue, No. 315, self - made 1-17

Applicant after: Guangzhou KuGou Networks Co., Ltd.

Address before: 510000 B1, building, No. 16, rhyme Road, Guangzhou, Guangdong, China 13F

Applicant before: Guangzhou KuGou Networks Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant