CN110602184B - 一种对网站中作弊行为的监测处理方法及装置 - Google Patents
一种对网站中作弊行为的监测处理方法及装置 Download PDFInfo
- Publication number
- CN110602184B CN110602184B CN201910805491.XA CN201910805491A CN110602184B CN 110602184 B CN110602184 B CN 110602184B CN 201910805491 A CN201910805491 A CN 201910805491A CN 110602184 B CN110602184 B CN 110602184B
- Authority
- CN
- China
- Prior art keywords
- information
- preheating point
- voter
- website
- preheating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供一种对网站中作弊行为的监测处理方法及装置,所述方法包括:根据网站中的信息的阅读量确定预热点信息;在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分;收集选民用户对所述预热点信息的反馈数据;若所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为。本技术方案根据信息的热点情况,实时追踪具有热点特征的信息的互动请求,来监测信息热点的真实性并使得网站作弊行为可追踪。
Description
技术领域
本发明属于网络安全领域,具体涉及一种对网站中作弊行为的监测处理方法及装置。
背景技术
现有技术中,基于IP维度的识别技术。当一个IP短时间有大量的阅读、评论、转发请求操作时,网站系统会设置一个阈值,当统计到对应IP产生相关行为操作的频率超过设置的阈值,则认为相关操作对应的热门信息存在作弊行为。从而对IP进行封禁,禁止相关的IP的继续产生请求操作;在技术处理下,因为IP资源的有限和短缺,如一个公司、学校、小区的大量用户会共同使用一个公网IP,那么这个时候,仅仅依靠请求频率的大小来进行判断,必然产生非常多的误伤情况。
现有技术中,基于网站账号黑名单的判断。通过网站历史数据的积累,某一类账号满足固定的特征规则,则判断对应的账号存在作弊行为。对这类账号进行禁止相关的操作,如阅读、评论转发。这类基于历史数据挖掘的规则引擎方案,只能依靠对账号历史数据积累和人为经验的归纳总结。一方面需要对应的网站账号已经在网站使用了较长时间,才可以搜集足够的历史数据,对于结果的判断存在比较大的滞后性;另外一方面这是一个十分耗费人力物力的过程,甚至还会出现经验错误而导致误判的状况。
当社交媒体网站上的一条信息的阅读、评论、转发增加到一定数量,满足网站运营规则,可以成为热门信息时。但是因为网络水军等问题的存在,他们会通过掌握的账号制造了相关的虚假流量。如果网站不能很好识别作弊行为,而将水军制造的这类热门信息进行分发推广,那么会严重干扰社交网站的正常运营秩序,出现大量的虚假热点信息等问题。
发明内容
本发明实施例提供一种对网站中作弊行为的监测处理方法及装置,根据信息的热点情况,实时追踪具有热点特征的信息的互动请求,来监测信息热点的真实性并使得网站作弊行为可追踪。
为实现上述目的,一方面,本发明实施例提供了一种对网站中作弊行为的监测处理方法,所述方法包括:
根据网站中的信息的阅读量确定预热点信息;
在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分;
收集选民用户对所述预热点信息的反馈数据;
若所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为。
另一方面,本发明实施例提供了一种对网站中作弊行为的监测处理装置,所述装置包括:
预热点信息获取单元,用于根据网站中的信息的阅读量确定预热点信息;
预热点信息处理单元,用于判定在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分;
数据反馈单元,用于收集选民用户对所述预热点信息的反馈数据;
行为判定单元,用于当所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为。
上述技术方案具有如下有益效果:
本发明技术方案的整个实现的流程和逻辑可以借助程序自动化处理,以及引入用户的判断数据,减少网站安排人工繁琐的核实处置,节约公司的客服和运营成本。同时,一定程度上克服了传统的基于历史数据挖掘的规则引擎方案,以及只能依靠对账号历史数据积累和人为经验的归纳总结方案的弊端:一方面减少了前一种方案因为IP公用导致的误伤,提高了网站的用户体验,另外一方面针对一些无历史数据积累的新账号等场景,也能进行覆盖进行有效的监测和处理。
通过有效识别热门信息的作弊行为,提高了网站信息的有效性,一定程度上保护了网站的公信力、社会正常的舆论环境。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一种对网站中作弊行为的监测处理方法的流程图;
图2是本发明实施例一种对网站中作弊行为的监测处理装置的结构示意图;
图3是本发明实施例一种对网站中作弊行为的监测方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明涉及部分缩略语和关键术语定义如下:
1、社交媒体网站:典型的代表为微博,是基于用户关系的社交媒体平台,用户可以通过PC、手机等多种移动终端接入,以文字、图片、视频等多媒体形式,实现信息的即时分享、传播互动。
2、热门信息:是指一定时间、一定范围内,公众最为关心的热点问题。如当前社会的热门话题应该就是人民群众最关心、最直接、最现实的教育、社保、医疗、楼市、股市、劳动就业问题等等,这些热点问题近年来很多都是通过互联网而引起公众强烈关注。在社交媒体网站上,某一类事件的信息通常因为阅读量、评论、赞的数量增加到一定的阈值,而被网站判断为热门信息,并在信息分发时进行重点推荐。每次阅读、评论、赞操作,都对应一次用户使用网站账号向网站服务器请求。
3、网站帐号:俗称的网络身份证,是数字时代的代表,它是一种互联网身份认证协议,其具有唯一性和信息不可否认性。通常用户使用网站账号借助手机、电脑等终端设备向网站服务器发起请求,完成社交媒体网站上的阅读、评论、赞行为操作。
4、作弊:对于社交媒体网站而言,通常的作弊行为指的是,利用大量的网站账号,借助一些软件工具,对于社交媒体网站的特定内容进行批量的阅读、评论、转发操作,从而让特定的信息短时间获得大量的不真实的流量(阅读、评论、转发),最终让网站判断相关的内容信息为热门信息。而向更多的用户进行分发推荐。
5、UA:User Agent中文名为用户代理,简称UA,它是一个特殊字符串头,使得服务器能够识别用户访问网站服务使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。网站账号每次向网站服务器发起请求,均带有一次UA信息。
6、IPv4,日常中简称IP,网际协议版本4(英语:Internet Protocol version 4,IPv4),又称互联网通信协议第四版,是网际协议开发过程中的第四个修订版本,也是此协议第一个被广泛部署的版本。IPv4是互联网的核心,也是使用最广泛的网际协议版本。为了方便人类阅读和分析,它通常被写作点分十进制的形式,即四个字节被分开用十进制写出,中间用点分隔成为四段,如61.135.152.135。
如图1所示,是本发明实施例一种对网站中作弊行为的监测处理方法的流程图,所述方法包括:
S101、根据网站中的信息的阅读量确定预热点信息。
对于预热点信息的定义为:社交媒体网站一条信息最终满足热点信息,其前提是该条信息在0.5小时内的阅读数量a、评论数量b、赞数量c用户与该信息的互动操作次数均达到一定的阈值d,热点信息阈值d是网站在该时段阅读量a最高的前N条,例如前100条的最小值。那么预热点的阈值e则为d/2。
优选地,所述根据网站中的信息的阅读量确定预热点信息,包括:
将设定时间段内阅读量大于或者等于设定预热点阈值e的信息判定为预热点信息,所述预热点阈值e通过下式计算:
e=d/2,
其中,d为设定时间内阅读量最高的前N条,例如前100条信息中阅读量最小的信息的阅读量值。
S102、在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分。
其中,选民用户为从社交媒体网站海量的活跃用户随机方式选取一定数量例如1000个账号,这些账号对应的用户为选民用户。
满足预热点的信息,运用聚类方式,检查和判断这条信息,对应的阅读、评论、赞操作行为带有的IP信息和终端特征用户代理UA信息的数据点间的信息相似度参数m小于3,则判断该预热点信息存在较大疑似作弊的可能。
优选地,所述互动请求包括对所述预热点信息进行的阅读、评论、点赞的操作行为;所述IP信息包括互联网通信协议第四版IPv4地址;所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数m,通过以下方法确定:
在所记录的设定时间段内所述预热点信息对应的互动请求所带有的IP信息和UA信息中,
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于90%,UA信息相同的比例m2大于等于90%,则m=1;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于80%且小于90%,UA信息相同的比例m2大于等于60%且小于90%,则m=2;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于50%且小于60%,UA信息相同的比例m2大于等于50%且小于60%,则m=3;
当IPv4地址,前3段数字相同的互动请求数量的比例m1大于等于40%且小于60%,UA信息相同的比例m2大于等于40%且小于50%,则m=4;
其它情况m=5。
S103、收集选民用户对所述预热点信息的反馈数据。
优选地,所述选民用户对所述预热点信息的反馈数据包括对所述预热点信息进行打分的选民用户数量y以及所述打分的选民用户的打分值。
S104、若所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为。
优选地,所述收集到的反馈数据满足预设条件,包括:
所述打分的选民用户的数量y不超过所有选民用户数量的5%;或者,
所述打分的选民用户的数量y超过所有选民用户数量的5%,如50个,且打分的选民用户的打分值为低评分的选民用户数量p大于0.3y,其中,低评分是指针对设定给选民用户的五个分值选择1至5中,评分值为1或2的情况。
进一步地,对于判定为存在作弊行为的预热点信息,将该预热点信息在设定时间段内的所有互动请求所带有的IP信息和UA信息中,IPv4地址中的前3段数字相同的互动请求对应的网站账号、以及UA信息相同的互动请求对应的网站账号,进行去重后全部列为黑名单账号。
对于黑名单账号,后续这部分账号产生的阅读、评论、点赞数据视为网站的无效数据,不再进行计算。
如图2所示,是本发明实施例一种对网站中作弊行为的监测处理装置的结构示意图,所述装置包括:
预热点信息获取单元21,用于根据网站中的信息的阅读量确定预热点信息;
预热点信息处理单元22,用于在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分;
数据反馈单元23,用于收集选民用户对所述预热点信息的反馈数据;
行为判定单元24,用于当所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为。
进一步地,所述预热点信息获取单元,具体用于:
将设定时间段内阅读量大于或者等于设定预热点阈值e的信息判定为预热点信息,所述预热点阈值e通过下式计算:
e=d/2,
其中,d为设定时间内阅读量最高的前N条,例如前100条信息中阅读量最小的信息的阅读量值。
进一步地,所述互动请求包括对所述预热点信息进行的阅读、评论、点赞的操作行为;所述IP信息包括互联网通信协议第四版IPv4地址;所述预热点信息处理单元包括信息相似度参数计算模块,用于通过以下方法确定所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的的信息相似度参数m:
在所记录的设定时间段内所述预热点信息对应的互动请求所带有的IP信息和UA信息中,
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于90%,UA信息相同的比例m2大于等于90%,则m=1;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于80%且小于90%,UA信息相同的比例m2大于等于60%且小于90%,则m=2;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于50%且小于60%,UA信息相同的比例m2大于等于50%且小于60%,则m=3;
当IPv4地址,前3段数字相同的互动请求数量的比例m1大于等于40%且小于60%,UA信息相同的比例m2大于等于40%且小于50%,则m=4;
其它情况m=5。
进一步地,所述选民用户对所述预热点信息的反馈数据包括对所述预热点信息进行打分的选民用户数量y以及所述打分的选民用户的打分值;以及,
所述收集到的反馈数据满足预设条件,包括:
所述打分的选民用户的数量y不超过所有选民用户数量的5%;或者,
所述打分的选民用户的数量y超过所有选民用户数量的5%,且打分的选民用户的打分值为低评分的选民用户数量p大于0.3y,其中,低评分是指针对设定给选民用户的五个分值选择1至5中,评分值为1或2的情况。
进一步地,所示装置还包括处理单元,用于:
对于判定为存在作弊行为的预热点信息,将该预热点信息在设定时间段内的所有互动请求所带有的IP信息和UA信息中,IPv4地址中的前3段数字相同的互动请求对应的网站账号、以及UA信息相同的互动请求对应的网站账号,进行去重后全部列为黑名单账号。
具体地,如图3所示,以社交媒体网站上一条信息z为例:
a.在9:00~9:30,z信息被阅读的次数a=25000,评论数量;30000,赞数量28000。对应上述操作行为的网站账号、网站账号向网站服务器发起请求数量为1000个账号,产生了25000+30000+28000=83000次请求。
b.系统统计在对应时间,网站上在该时段阅读量最高的前100条信息的最小值为40000,则热点信息阈值d=40000,预热点阈值e=1/2d=20000。
c.a>e,则运用聚类方式,检查信息z对应的阅读、评论、赞操作行为带有的IP和终端特征(UA)信息。83000次请求,IP v4地址,前3段数字相同有70500次(对应发起请求的账号有500个),比例m1=85%,终端特征(UA)信息相同有58100次(对应发起请求的账号有200个),比例m2=70%。对应发起请求的账号500、200个账号去重处理后有600个账号。
则,信息相似度参数m=2,小于算法定义的数值4,则信息z认为疑似作弊。
d.信息z被分发给1000个选民用户,共计有100个用户做了打分,其中25个用户打1分,45个用户打2分,20个用户打3分,6个用户打4分,4个用户打5分。
则,打分用户数y=100>50,已打分用户中打分质量1和2分的用户数p=25+45=70。
p>0.3y=30.
e.最终,则判断信息z为作弊信息。同时,把c步骤的前3段数字相同且、终端特征(UA)信息相同对应发起请求的去重的600个网站账号加入黑名单账号。后续这部分账号产生的阅读、评论、点赞数据视为网站的无效数据,不再在热门信息业务中进行计算。
对于社交媒体网站,热门信息是其吸引用户流量的核心服务,其信息的有效性,对于外界评判其价值是最为基础的一部分。同时,因为利益驱使,社交媒体网站的热门信息也常常被黑产、营销公司的作弊行为干扰,给网站的正常运营秩序、甚至整个社会的舆论环境带来非常大的伤害。
本发明在热点信息作弊行为的监测和处理,一方面引入了聚类分析方法对社交媒体进行传统方式的数据分析,另外一方面进入了选民用户的打分机制,借助网民的力量进行作弊信息的筛选,节约了网站人员审核的工作量。形成了一套机器规则+人工的综合信息监测模式。
同时,将识别后的作弊信息,再进行账号信息的回查,建立黑名单账号后续处置机制,也有效消耗作弊团伙的的成本。也避免后续对数据的重复识别,一定程度上节约了网站服务器的系统资源。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种对网站中作弊行为的监测处理方法,其特征在于,所述方法包括:
根据网站中的信息的阅读量确定预热点信息;
在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分;
收集选民用户对所述预热点信息的反馈数据;
若所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为;
其中,所述选民用户为从社交媒体网站海量的活跃用户中随机方式选取的选定个数的账号对应的用户。
2.如权利要求1所述的对网站中作弊行为的监测处理方法,其特征在于,所述根据网站中的信息的阅读量确定预热点信息,包括:
将设定时间段内阅读量大于或者等于设定预热点阈值e的信息判定为预热点信息,所述预热点阈值e通过下式计算:
e=d/2,
其中,d为设定时间段内阅读量最高的前N条信息中阅读量最小的信息的阅读量值。
3.如权利要求1所述的对网站中作弊行为的监测处理方法,其特征在于,所述互动请求包括对所述预热点信息进行的阅读、评论、点赞的操作行为;所述IP信息包括互联网通信协议第四版IPv4地址;所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数m,通过以下方法确定:
在所记录的设定时间段内所述预热点信息对应的互动请求所带有的IP信息和UA信息中,
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于90%,UA信息相同的比例m2大于等于90%,则m=1;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于80%且小于90%,UA信息相同的比例m2大于等于60%且小于90%,则m=2;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于50%且小于60%,UA信息相同的比例m2大于等于50%且小于60%,则m=3;
当IPv4地址,前3段数字相同的互动请求数量的比例m1大于等于40%且小于60%,UA信息相同的比例m2大于等于40%且小于50%,则m=4;
其它情况m=5。
4.如权利要求1所述的对网站中作弊行为的监测处理方法,其特征在于,所述选民用户对所述预热点信息的反馈数据包括:对所述预热点信息进行打分的选民用户数量y以及所述打分的选民用户的打分值;以及,
所述收集到的反馈数据满足预设条件,包括:
所述打分的选民用户的数量y不超过所有选民用户数量的5%;或者,
所述打分的选民用户的数量y超过所有选民用户数量的5%,且打分的选民用户的打分值为低评分的选民用户数量p大于0.3y,其中,低评分是指针对设定给选民用户的五个分值选择1至5中,评分值为1或2的情况。
5.如权利要求1-4任一所述的对网站中作弊行为的监测处理方法,其特征在于,还包括:
对于判定为存在作弊行为的预热点信息,将该预热点信息在设定时间段内的所有互动请求所带有的IP信息和UA信息中,IPv4地址的前3段数字相同的互动请求对应的网站账号、以及UA信息相同的互动请求对应的网站账号,进行去重后全部列为黑名单账号。
6.一种对网站中作弊行为的监测处理装置,其特征在于,所述装置包括:
预热点信息获取单元,用于根据网站中的信息的阅读量确定预热点信息;
预热点信息处理单元,用于在设定时间段内,当所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数小于设定参数阈值时,将所述预热点信息发送给选定个数的选民用户,并引导所述选民用户对所述预热点信息进行内容质量打分;
数据反馈单元,用于收集选民用户对所述预热点信息的反馈数据;
行为判定单元,用于当所述收集到的反馈数据满足预设条件时,判定所述预热点信息存在作弊行为;
其中,所述选民用户为从社交媒体网站海量的活跃用户中随机方式选取的选定个数的账号对应的用户。
7.如权利要求6所述的对网站中作弊行为的监测处理装置,其特征在于,所述预热点信息获取单元,具体用于:
将设定时间段内阅读量大于或者等于设定预热点阈值e的信息判定为预热点信息,所述预热点阈值e通过下式计算:
e=d/2,
其中,d为设定时间段内阅读量最高的前N条信息中阅读量最小的信息的阅读量值。
8.如权利要求6所述的对网站中作弊行为的监测处理装置,其特征在于,所述互动请求包括对所述预热点信息进行的阅读、评论、点赞的操作行为;所述IP信息包括互联网通信协议第四版IPv4地址;所述预热点信息处理单元包括信息相似度参数计算模块,用于通过以下方法确定所述预热点信息对应的互动请求所带有的IP信息和用户代理UA信息对应的信息相似度参数m:
在所记录的设定时间段内所述预热点信息对应的互动请求所带有的IP信息和UA信息中,
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于90%,UA信息相同的比例m2大于等于90%,则m=1;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于80%且小于90%,UA信息相同的比例m2大于等于60%且小于90%,则m=2;
当IPv4地址的前3段数字相同的互动请求数量的比例m1大于等于50%且小于60%,UA信息相同的比例m2大于等于50%且小于60%,则m=3;
当IPv4地址,前3段数字相同的互动请求数量的比例m1大于等于40%且小于60%,UA信息相同的比例m2大于等于40%且小于50%,则m=4;
其它情况m=5。
9.如权利要求6所述的对网站中作弊行为的监测处理装置,其特征在于,所述选民用户对所述预热点信息的反馈数据包括:对所述预热点信息进行打分的选民用户数量y以及所述打分的选民用户的打分值;以及,
所述收集到的反馈数据满足预设条件,包括:
所述打分的选民用户的数量y不超过所有选民用户数量的5%;或者,
所述打分的选民用户的数量y超过所有选民用户数量的5%,且打分的选民用户的打分值为低评分的选民用户数量p大于0.3y,其中,低评分是指针对设定给选民用户的五个分值选择1至5中,评分值为1或2的情况。
10.如权利要求6-9任一所述的对网站中作弊行为的监测处理装置,其特征在于,还包括处理单元,用于:
对于判定为存为在作弊行为的预热点信息,将该预热点信息在设定时间段内的所有互动请求所带有的IP信息和UA信息中,IPv4地址中的前3段数字相同的互动请求对应的网站账号、以及UA信息相同的互动请求对应的网站账号,进行去重后全部列为黑名单账号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910805491.XA CN110602184B (zh) | 2019-08-29 | 2019-08-29 | 一种对网站中作弊行为的监测处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910805491.XA CN110602184B (zh) | 2019-08-29 | 2019-08-29 | 一种对网站中作弊行为的监测处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110602184A CN110602184A (zh) | 2019-12-20 |
CN110602184B true CN110602184B (zh) | 2022-03-25 |
Family
ID=68856184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910805491.XA Active CN110602184B (zh) | 2019-08-29 | 2019-08-29 | 一种对网站中作弊行为的监测处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110602184B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488754A (zh) * | 2020-11-30 | 2021-03-12 | 上海酷量信息技术有限公司 | 一种广告点击的反作弊系统和方法 |
CN112737851A (zh) * | 2020-12-30 | 2021-04-30 | 刘一方 | 一种互联网反作弊识别方法和平台 |
CN113360356B (zh) * | 2021-06-01 | 2022-03-11 | 掌阅科技股份有限公司 | 阅读作弊行为的识别方法、计算设备及计算机存储介质 |
CN116385029B (zh) * | 2023-04-20 | 2024-01-30 | 深圳市天下房仓科技有限公司 | 酒店刷单检测方法、系统、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001198320A (ja) * | 2000-02-10 | 2001-07-24 | Toyomaru Industry Co Ltd | 遊技機 |
CN101777053A (zh) * | 2009-01-08 | 2010-07-14 | 北京搜狗科技发展有限公司 | 一种识别作弊网页的方法及系统 |
CN105069652A (zh) * | 2015-08-03 | 2015-11-18 | 上海碧虎网络科技有限公司 | 一种智能广告终端防作弊方法 |
CN107026845A (zh) * | 2017-01-03 | 2017-08-08 | 阿里巴巴集团控股有限公司 | 任务作弊行为识别方法及装置 |
CN108009844A (zh) * | 2017-11-20 | 2018-05-08 | 北京智钥科技有限公司 | 确定广告作弊行为的方法、装置及云服务器 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7377430B2 (en) * | 2005-06-01 | 2008-05-27 | International Business Machines Corporation | System for secure and accurate electronic voting |
-
2019
- 2019-08-29 CN CN201910805491.XA patent/CN110602184B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001198320A (ja) * | 2000-02-10 | 2001-07-24 | Toyomaru Industry Co Ltd | 遊技機 |
CN101777053A (zh) * | 2009-01-08 | 2010-07-14 | 北京搜狗科技发展有限公司 | 一种识别作弊网页的方法及系统 |
CN105069652A (zh) * | 2015-08-03 | 2015-11-18 | 上海碧虎网络科技有限公司 | 一种智能广告终端防作弊方法 |
CN107026845A (zh) * | 2017-01-03 | 2017-08-08 | 阿里巴巴集团控股有限公司 | 任务作弊行为识别方法及装置 |
CN108009844A (zh) * | 2017-11-20 | 2018-05-08 | 北京智钥科技有限公司 | 确定广告作弊行为的方法、装置及云服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN110602184A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110602184B (zh) | 一种对网站中作弊行为的监测处理方法及装置 | |
US10735401B2 (en) | Online identity reputation | |
Edelson et al. | A security analysis of the facebook ad library | |
US20170195125A1 (en) | Promoting learned discourse in online media with consideration of sources and provenance | |
US10270785B2 (en) | Method and apparatus for identifying malicious account | |
CN107690640A (zh) | 管理装置上的不想要的跟踪 | |
CN106302534B (zh) | 一种检测和处理非法用户的方法及系统 | |
KR102157767B1 (ko) | 사용자 이력 분석에 기반한 사용자 등급평가 시스템 | |
CN105516133A (zh) | 用户身份的验证方法、服务器及客户端 | |
CN112581259B (zh) | 账户风险识别方法及装置、存储介质、电子设备 | |
CN110351248B (zh) | 一种基于智能分析和智能限流的安全防护方法及装置 | |
Ikram et al. | Measuring, characterizing, and detecting Facebook like farms | |
WO2021004123A1 (zh) | 基于区块链的信息处理装置、方法及存储介质 | |
CN112422574A (zh) | 风险账号的识别方法、装置、介质及电子设备 | |
Coscia et al. | Distortions of political bias in crowdsourced misinformation flagging | |
CN104852916A (zh) | 一种基于社会工程学的网页验证码识别方法及系统 | |
Yang et al. | How Twitter data sampling biases US voter behavior characterizations | |
Cardoso et al. | Social Media disinformation in the pre-electoral period in Portugal | |
Wu et al. | Statistical analysis of dispelling rumors on Sina Weibo | |
Niverthi et al. | Characterizing, detecting, and predicting online ban evasion | |
CN107172033B (zh) | 一种waf误判识别方法以及装置 | |
CN110943989B (zh) | 一种设备鉴别方法、装置、电子设备及可读存储介质 | |
Li et al. | Detecting Promotion Campaigns in Community Question Answering. | |
CN110460593B (zh) | 一种移动流量网关的网络地址识别方法、装置及介质 | |
Seng et al. | A look into user privacy andthird-party applications in Facebook |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |