CN106330837A - 一种可疑网络用户的识别方法和装置 - Google Patents

一种可疑网络用户的识别方法和装置 Download PDF

Info

Publication number
CN106330837A
CN106330837A CN201510377706.4A CN201510377706A CN106330837A CN 106330837 A CN106330837 A CN 106330837A CN 201510377706 A CN201510377706 A CN 201510377706A CN 106330837 A CN106330837 A CN 106330837A
Authority
CN
China
Prior art keywords
network
assessed
network user
user
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510377706.4A
Other languages
English (en)
Inventor
沈雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510377706.4A priority Critical patent/CN106330837A/zh
Publication of CN106330837A publication Critical patent/CN106330837A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种可疑网络用户的识别方法和装置,所述可疑网络用户的识别方法包括:接收客户端发送的针对待评估网络用户的身份信息验证请求;解析所述验证请求,获取所述待评估网络用户的账户信息;依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息;利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度;根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。本申请的可疑网络用户的识别方法和装置能够提高识别网络可疑用户的准确度。

Description

一种可疑网络用户的识别方法和装置
技术领域
本申请涉及一种可疑网络用户的识别方法和装置。
背景技术
在互联网领域,用户通过注册为网站或企业的网络用户来使用网站或企业所提供的网络的服务。随着网络技术的发展,一些团体或个人采用自动注册软件注册为网站的网络用户的情况越来越多。相对于人工操作注册的真实用户,通过自动注册软件注册的用户被称为机器人用户或机器人账户。
这些团体或个人甚至会利用自动注册软件批量注册大量的机器人用户,并通过这些机器人用户比其他人工操作的真实用户更快更方便地执行一些网络操作。例如进行紧俏商品如火车票或优惠促销商品的抢购;抢夺网站发放的现金或福利红包;炒作信誉、伪造交易记录以便于诱骗其他真实用户;大量发布有倾向性的消息、投票等等。这些行为可干扰其他真实用户的网络操作行为,侵犯真实用户的权益,破坏网络商业环境的公平,误导网站和其所有者的判断,并占用大量的网络资源,甚至会危害网络安全。
甄别,管控这些机器人用户的行为,减少或避免机器人用户对其他真实用户的影响和干扰成为互联网领域不得不亟待解决的问题。解决这一问题的前提就是要识别网络用户的身份,哪些可能是自动注册软件自动注册的机器人用户,哪些可能是人工注册的真实用户。对于被怀疑可能是机器人用户的那些可疑的网络用户可以实施更加严格的管理措施,从而尽可能减少其中的机器人用户对真实用户的影响和危害。
现有的识别可疑网络用户的方式通常为根据网络用户的电子邮件(英文名称:email)地址的前缀来判断网络用户身份的真实性的。用户在网络上进行网络用户注册时,会按照所要注册的网站的要求提供一些信息,其中用户所使用的电子邮件地址是绝大多数网站在接受用户注册时要求用户提供并进行验证的信息。通过对电子邮件地址的验证,可以确认该电子邮件地址为该网络用户所有,进而可以确定在不同的网站拥有相同电子邮件地址的用户为同一网络用户。所述根据网络用户的电子邮件(英文名称:email)地址的前缀判断网络用户身份的方法是根据网络用户的电子邮件(英文名称:email)地址的前缀即字符“@”前面的所有字符组合是否符合一些简单的规则来判断,例如,如果一些用户的电子邮件地址前缀均为字母加数字的组合,且符合字母相同,数字递增或递减的规律,如:abc200910,abc200911,abc200912,abc20091,……,则认为这些网络用户为疑似通过自动注册软件注册的机器人用户。
但是,这一方法仅能将符合这一规则的机器人用户限定在可疑网络用户的范围内,而符合这一规则的机器人用户仅是网络上大量的机器人用户中很小的一部分,对于其email地址前缀字母不同,数字非简单递增递减规律或其email地址前缀无规则可循的机器人用户无法被识别为可疑用户,使得大量其他的机器人用户处在更加严格的监管措施之外,对其他真实用户造成危害。若对于包括机器人用户和真实用户的所有网络用户都采取更加严格的监管措施,虽然可以达到减少机器人用户对真实用户的危害的作用,但由于网络用户中的机器人用户数量相对于真实用户数量还是少数,对所有网络用户都采用更加严格的管控措施无疑会耗费巨大的网络资源,增加所提的服务的成本,降低服务的效率。
发明内容
本申请提供一种可疑网络用户识别的方法,以解决现有的可疑网络用户识别方法的上述的问题。此外,本申请还提供一种可疑网络用户的识别装置,可有效识别可疑网络用户,减少网络资源的非正常占用,维护网络安全。
本申请提供的一种可疑网络用户的识别方法,其特征在于,包括:
接收客户端发送的针对待评估网络用户的身份信息验证请求;
解析所述验证请求,获取所述待评估网络用户的账户信息;
依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息;
利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度;
根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。
可选地,所述网络行为信息包括待评估网络用户参与的网络行为信息参量及其参量值;
所述利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度的方法,具体包括:
按照设定的维度对所述获取的行为信息参量进行归类,并设定每一类别的加权权重值;
利用所述行为信息参量的参量值及不同类别的加权权重值,加权计算所述待评估网络用户的网络行为活跃度。
可选地,依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与网络行为信息参量及其参量值包括:
依据所述待评估网络用户的账户信息,在本地服务器中的数据库中查询并获取预存的所述待评估网络用户参与网络的信息参量及参量值。
可选地,依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与网络行为信息参量及其参量值包括:
依据所述待评估网络用户的账户信息,向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求;
接收各个目标网站针对所述抓取请求反馈的所述网络用户参与相应网络的信息参量及参量值。
可选地,所述向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求包括:
通过分布式数据抓取集群的目标网站接口单元向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求;或者
使用浏览器,以预先注册的账户登陆网站,通过网站的搜索网络用户功能以待评估网络用户的电子邮件地址为关键字对指定网络用户查找其参与网络行为信息参量及其参量值。
可选地,所述行为信息参量包括:用户参与网络单向行为参量和参与网络互动行为参量。
可选地,所述单向行为参量包括:注册时间与设定时间的时间差,最早发布信息的时间与设定时间的时间差,登录停留时间,登录次数,以及发布信息的次数。
可选地,所述互动行为参量包括:网络关联用户数量以及与网络关联用户互动的次数。
可选地,所述按照设定的维度对所述获取的信息参量进行归类中的设定的维度包括:
用户参与网络行为的时间维度,用户参与网络行为的频率维度,用户参与网络的单向行为或互动行为维度,网络关联用户量维度,以及用户参与网络的行为规律性评估维度。
可选地,所述获取所述待评估网络用户参与网络行为信息参量及其参量值具体为:获取待评估网络用户参与至少两个网站的行为信息参量及其参量值;
相应的,所述利用所述网络行为信息的参量值及不同类别的加权权重值加权计算待评估网络用户的网络行为活跃度具体为:
利用待评估网络用户参与每一网站行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户针对该网站的网络行为活跃度,并对用户参与的所有网站的网络行为活跃度求和。
可选地,所述获取所述待评估网络用户参与网络行为信息参量及其参量值具体为:获取待评估网络用户参与至少两个网站的行为信息参量及其参量值;
相应的,所述利用所述网络行为信息的参量值及不同类别的加权权重值加权计算待评估网络用户的网络行为活跃度具体为:
利用待评估网络用户参与所有网站行为信息参量的参量值及不同类别的加权权重值分别加权计算各个类别的加权值,并对所述所有类别的加权值求和。
可选地,所述根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户的方法,具体为:
依据所述网络行为活跃度是否超出设定的阈值条件,给出所述待评估网络用户是否为可疑或非安全网络用户的提示。
本申请的一种可疑网络用户的识别装置,包括:
接收单元,用于接收客户端发送的针对待评估网络用户的身份信息验证请求;
解析单元,用于解析所述验证请求,获取所述待评估网络用户的账户信息;
获取单元,用于依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息;
计算单元,用于利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度;
识别单元,用于根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。
可选地,所述获取单元,具体用于依据所述待评估网络用户的账户信息,获取待评估网络用户参与至少两个网站的行为信息参量及其参量值。
相应的,所述计算单元,具体用于
利用待评估网络用户参与每一网站行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户针对该网站的网络行为活跃度,并对用户参与的所有网站的网络行为活跃度求和。
可选地,所述获取单元,具体用于依据所述待评估网络用户的账户信息,获取待评估网络用户参与至少两个网站的行为信息参量及其参量值。
相应的,所述计算单元,具体用于
利用待评估网络用户参与所有网站行为信息参量的参量值及不同类别的加权权重值分别加权计算各个类别的加权值,并对所述所有类别的加权值求和。
可选地,所述获取单元包括:获取第一子单元,用于
依据所述待评估网络用户的账户信息,向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求;
获取第二子单元,用于接收各个目标网站针对所述抓取请求反馈的所述网络用户参与相应网络的信息参量及参量值。
可选地,所述获取第一子单元,具体用于:使用浏览器,以预先注册的账户登陆网站,通过网站的搜索网络用户功能以待评估网络用户的电子邮件地址为关键字对指定网络用户查找其参与网络行为信息参量及其参量值。
可选地,所述获取第一子单元,包括:分布式数据抓取集群和各目标网站接口单元,分布式数据抓取集群通过目标网站接口单元向各目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求。
与现有技术相比,本申请具有以下优点:利用网络用户参与网络行为信息参量进行计算得出网络用户的网络行为活跃度来识别可疑网络用户,识别的准确性高。真实用户相比机器人用户,除了注册,交易,发布信息或参与活动等单向的网络行为以外,其网络互动行为数量会更多,利用真实用户的网络行为信息特别是与机器人用户表现不同的网络行为信息作为参量加权统计计算网络用户的网络行为活跃度来评估网络用户身份相比现有的单一的根据用户电子邮件前缀的组合规律来评估网络用户身份的方式,适用范围更加广泛,能够将尽可能多的机器人用户识别为可疑用户,提高评估可用性和准确性。进而能够仅仅针对被识别为可疑网络用户的网络用户实施更加严格的管控措施,起到减少机器人用户对真实用户的影响和危害的作用,达到节约网络资源,降低服务成本,提高服务效率的效果。
附图说明
图1是本申请的可疑网络用户的识别方法的实施例的流程示意图;
图2是本申请的可疑网络用户的识别装置的实施例的结构框图;
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请的可疑网络用户的识别方法的实施例,如图1所示,利用网络用户参与网络的行为信息统计计算该网络用户的网络行为活跃度,根据网络行为活跃度和预先设定的值比较,确定该网络用户是否为可信真实用户或疑似机器人用户以便后续的管理控制。
步骤S101:接收客户端发送的针对待评估网络用户的身份信息验证请求。
接收客户端发送的的验证待评估网络用户的身份的请求。
步骤S102:解析所述验证请求,获取所述待评估网络用户的账户信息。
从接收到的验证待评估网络用户的身份的请求中提取所述待评估网络用户的账户信息,所述待评估网络用户的账户信息包括待评估网络用户的用户名称,用户昵称,用户注册的电子邮件地址,电话号码等。
步骤S103:依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息。
以待评估网络用户的账户信息作为标识,获取该待评估网络用户参与的网络行为信息,包括参与的网络行为信息参量及其参量值。
获取所述待评估网络用户参与网络行为信息参量及其参量值可以有多种方法,本实施例提供如下所述两种方法:
方法一,启动分布式数据抓取集群,通过集群内每台服务器上对目标网站的接口,以预先注册的账户登录到目标网站,利用网站的搜索网络用户功能以待评估网络用户的账户信息,如电子邮件地址为关键字对指定网络用户查找其参与网络行为信息参量及其参量值,该待评估网络用户参与网络行为信息参量可以分为参与网络单向行为参量和参与网络互动行为参量。
所述评估网络用户参与网络单向行为参量指该待评估网络用户自行操作针对非特定网络用户的网络行为参量,如最早发布信息的时间,发布信息的时间,发布信息的次数(包括发布文本信息和图片信息的次数),登录网站的次数,登录网站停留的时间,注册的时间等。
所述评估网络用户参与网络互动行为参量是指该待评估网络用户与其网络关联用户之间的行为参量,包括其网络关联用户的数量以及与网络关联用户之间互动行为的次数。网络关联用户包括该待评估网络用户关注/收听或加入到其他特定分组中的其他网络用户以及关注/收听该待评估网络用户或将该待评估网络用户加入到其其他特定分组中的其他网络用户;待评估网络用户与网络关联用户之间互动的次数包括相互间关注/收听,提醒或送礼等网络行为的次数。
具体地,本实施例中获取的待评估网络用户参与网络行为信息参量包括:最早发布信息的时间,发布信息的次数(包括发布文本信息和图片信息的次数),网络关联用户(包括关注/收听的其他网络用户,关注/收听该待评估网络用户的其他网络用户或该待评估网络用户的好友)数量和与网络关联用户(包括关注/收听的其他网络用户,关注/收听该待评估网络用户的其他网络用户或该待评估网络用户的好友)互动的次数。
如果目标网站提供所查询的行为信息参量及其值,则将目标网站返回的这些该用户参与网络行为信息参量和值保存到本地数据库中。如果目标网站不提供所查询的行为信息参量或其值,则不将该待评估网络用户在该网站相应的行为信息参量值保存到本地或将该待评估网络用户在该网站相应的行为信息参量值设置为0保存到本地数据库中。此方法同样可以用于从多个目标网站获取网络用户参与网络行为信息参量及其参量值的情况。
方法二,对于待评估网络用户为本网站网络用户的情况,可以以任一该网络用户的账户信息如用户名称,用户昵称,用户注册的电子邮件地址,电话号码等为关键字直接向本网站数据库发送查询请求并将数据库返回的该网络用户参与网络行为信息参量如方法一中所述的最早发布信息的时间,发布信息的次数(包括发布文本信息和图片信息的次数),网络关联用户(包括关注/收听的其他网络用户,关注/收听该待评估网络用户的其他网络用户或该待评估网络用户的好友)数量和与网络关联用户(包括关注/收听的其他网络用户,关注/收听该待评估网络用户的其他网络用户或该待评估网络用户的好友)互动的次数保存到本地数据库中以便于后续的计算处理。
与方法一类似,如果本网站不提供所查询的行为信息参量或其值,则不将该待评估网络用户在本网站相应的行为信息参量值保存到本地或将该待评估网络用户在本网站相应的行为信息参量值设置为0保存到本地数据库中。
步骤S104:利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度。
利用在上一步骤中获得的待评估网络用户的网络行为信息参量及其参量值计算该网络用户的网络行为活跃度。首先,按照设定的维度对所述获取的行为信息参量进行归类,并设定每一类别的加权权重值,所述按照设定的维度对所述获取的行为信息参量进行归类,并设定每一类别的加权权重值可以有多种方法,例如可以将在前一步骤S103中获取的网络用户参与网络行为信息参量按照时间维度,用户参与网络行为的频率维度,用于参与网络的单向行为或互动行为维度,网络关联用户量维度,以及用户参与网络的行为规律性评估维度进行归类。
例如可以将不同天/次发布信息的时间差值的绝对值加一后的倒数归为用户参与网络的行为规律性评估维度类参量(例如不同天/次发布信息的时间固定为某一时刻,则该网络用户不同天/次发布信息的时间差值为0,其绝对值加一后倒数为“1”);将登录网站停留的时间与登录网站的次数的比值归为用户参与网络行为的频率维度类参量,或者将注册的时间与设定的时间(如当前时间)的差值与登录网站的次数的比值归为频率维度类参量;将注册的时间,最早发布信息的时间,发布信息的时间距离设定的时间(如当前时间)的时间差值归为时间维度类参量;将发布信息的次数(包括发布文本信息和图片信息的次数)归为参与网络单向行为维度类参量;将网络关联用户(包括关注/收听的其他网络用户,其他网络用户关注/收听该待评估网络用户或该待评估网络用户的好友)的数量归为网络关联用户量维度类参量,将与网络关联用户(包括关注/收听的其他网络用户,其他网络用户关注/收听该待评估网络用户或该待评估网络用户的好友)之间互动的次数归为参与网络互动行为维度类参量等。
具体地,在本实施例中,将最早发布信息的时间距离当前时间的时间差值归为时间维度类参量;将发布信息的次数(包括发布文本信息和图片信息的次数)归为参与网络单向行为维度类参量;将网络关联用户(包括关注/收听的其他网络用户,其他网络用户关注/收听该待评估网络用户或该待评估网络用户的好友)的数量归为网络关联用户量维度类参量,与网络关联用户(包括关注/收听的其他网络用户,其他网络用户关注/收听该待评估网络用户或该待评估网络用户的好友)之间互动的次数归为参与网络互动行为维度类参量。
相应的,设定时间维度类参量的加权权重值为时间权重;设定参与网络单向行为维度类参量的加权权重值为单向行为权重;设定网络关联用户量维度类参量的加权权重值为关联用户量权重,设定参与网络互动行为类参量的加权权重值为互动行为权重。
接下来利用所述行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户的网络行为活跃度;所述利用所述行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户的网络行为活跃度可以有多种方法,本实施例提供如下所述两种方法:
方法一,对于待评估网络用户参与网络行为信息参量及其值取自一个或多个目标网站的情况,待评估网络用户的网络行为活跃度的计算方法如公式1所述:
公式1:
V = W t × ( T c - T 0 ) + W 1 × Σ i = 1 n Q 1 i + W 2 × Σ i = 1 n Q 2 i + W 3 × Σ i = 1 n Q 3 i
其中∑为求和函数,n为目标网站的数量。
V:待评估网络用户的网络行为活跃度;Wt:时间权重;Tc:当前时间;T0:最早发布信息的时间;W1:关联用户量权重;W2:互动行为权重;W3:单向行为权重;Q1i:待评估网络用户在第i个目标网站网络关联用户数量;Q2i:待评估网络用户在第i个目标网站与网络关联用户互动的次数;Q3i:待评估网络用户在第i个目标网站发布信息的次数。
方法二,对于待评估网络用户参与网络行为信息参量及其值取自多于2个目标网站的情况,评估网络用户网络行为活跃度的计算方法还可以如公式2所述:
公式2:
V = Σ i = 1 n ( W t × ( T c - T 0 i ) + W 1 × Q 1 i + W 2 × Q 2 i + W 3 × Q 3 i )
其中∑为求和函数,n为目标网站的数量。
V:待评估网络用户的网络行为活跃度;Wt:时间权重;Tc:当前时间;T0i:待评估网络用户在第i个目标网站最早发布信息的时间;W1:关联用户量权重;W2:互动行为权重;W3:单向行为权重;Q1i:待评估网络用户在第i个目标网站网络关联用户数量;Q2i:待评估网络用户在第i个目标网站与网络关联用户互动的次数;Q3i:待评估网络用户在第i个目标网站发布信息的次数。
步骤S105:根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。
将在前一步骤中计算得出的待评估网络用户的网络行为活跃度与设定的阈值相比较,若低于阈值则认为该网络用户为可疑或非安全网络用户,给出提示信息以便于后续相应的管理控制。
上述的实施例中,利用获取到的网络用户参与网络行为信息参量进行计算得出网络用户的网络行为活跃度来评估网络用户身份真实程度。评估的准确性高。真实用户相比机器人用户,除了注册,交易,发布信息或参与活动等单向的网络行为以外,其网络互动行为数量会更多,利用真实用户的网络行为信息特别是与机器人用户表现不同的网络行为信息作为参量加权统计计算网络用户的网络行为活跃度来评估网络用户身份相比现有的单一的根据用户电子邮件前缀的组合规律来评估网络用户身份的方式,适用范围更加广泛,能够将尽可能多的机器人用户评估为可疑用户,提高评估可用性和准确性。进而能够仅仅针对被识别为可疑网络用户的网络用户实施更加严格的管控措施,起到减少机器人用户对真实用户的影响和危害的作用,达到节约网络资源,降低服务成本,提高服务效率的效果。
在上述的实施例中,提供了一种用于网络用户身份评估的方法,与之相对应的,本申请还提供一种可疑网络用户的识别装置。请参看图2,其为本申请的一种可疑网络用户的识别装置的实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
请参考图2,所述装置包括接收单元U201,解析单元U202,获取单元U203,计算单元U204和识别单元U205。
所述接收单元U201,用于接收客户端发送的针对待评估网络用户的身份信息验证请求。
所述解析单元U202,用于解析所述验证请求,获取所述待评估网络用户的账户信息。所述获取单元U203,用于依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息。
所述计算单元U204,用于利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度。
所述识别单元U205,用于根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。
可选的,所述获取单元U203,具体用于获取待评估网络用户参与至少两个网站的行为信息参量及其参量值。
相应的,所述计算单元U204,具体用于:利用待评估网络用户参与每一网站行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户针对该网站的网络行为活跃度,并对用户参与的所有网站的网络行为活跃度求和。
可选的,所述获取单元U203,具体用于获取待评估网络用户参与至少两个网站的行为信息参量及其参量值。相应的,所述计算单元U204,具体用于:利用待评估网络用户参与所有网站行为信息参量的参量值及不同类别的加权权重值分别加权计算各个类别的加权值,并对所述所有类别的加权值求和。
可选地,所述获取单元U203包括:获取第一子单元,用于向目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求。
获取第二子单元,用于将目标网站返回的相应的待评估网络用户参与网络行为信息参量及其参量值数据存储到本地数据库。
可选地,所述获取第一子单元,具体用于:使用浏览器,以预先注册的账户登陆网站,通过网站的搜索网络用户功能以待评估网络用户的电子邮件地址为关键字对指定网络用户查找其参与网络行为信息参量及其参量值。
可选地,所述获取第一子单元,包括:分布式数据抓取集群和各目标网站接口单元,分布式数据抓取集群通过目标网站接口单元向各目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (18)

1.一种可疑网络用户的识别方法,其特征在于,包括:
接收客户端发送的针对待评估网络用户的身份信息验证请求;
解析所述验证请求,获取所述待评估网络用户的账户信息;
依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息;
利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度;
根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。
2.根据权利要求1所述的可疑网络用户的识别方法,其特征在于,所述网络行为信息包括待评估网络用户参与的网络行为信息参量及其参量值;
所述利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度的方法,具体包括:
按照设定的维度对所述获取的行为信息参量进行归类,并设定每一类别的加权权重值;
利用所述行为信息参量的参量值及不同类别的加权权重值,加权计算所述待评估网络用户的网络行为活跃度。
3.根据权利要求2所述的可疑网络用户的识别方法,其特征在于,依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与网络行为信息参量及其参量值包括:
依据所述待评估网络用户的账户信息,在本地服务器中的数据库中查询并获取预存的所述待评估网络用户参与网络的信息参量及参量值。
4.根据权利要求2所述的可疑网络用户的识别方法,其特征在于,依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与网络行为信息参量及其参量值包括:
依据所述待评估网络用户的账户信息,向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求;
接收各个目标网站针对所述抓取请求反馈的所述网络用户参与相应网络的信息参量及参量值。
5.根据权利要求4所述的可疑网络用户的识别方法,其特征在于,所述向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求包括:
通过分布式数据抓取集群的目标网站接口单元向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求;或者
使用浏览器,以预先注册的账户登陆网站,通过网站的搜索网络用户功能以待评估网络用户的电子邮件地址为关键字对指定网络用户查找其参与网络行为信息参量及其参量值。
6.根据权利要求2至4任一所述的可疑网络用户的识别方法,其特征在于,所述行为信息参量包括:用户参与网络单向行为参量和参与网络互动行为参量。
7.根据权利要求6所述的可疑网络用户的识别方法,其特征在于:所述单向行为参量包括:注册时间与设定时间的时间差,最早发布信息的时间与设定时间的时间差,登录停留时间,登录次数,以及发布信息的次数。
8.根据权利要求6所述的可疑网络用户的识别方法,其特征在于,所述互动行为参量包括:网络关联用户数量以及与网络关联用户互动的次数。
9.根据权利要求2至4任一所述的可疑网络用户的识别方法,其特征在于,所述按照设定的维度对所述获取的信息参量进行归类中的设定的维度包括:
用户参与网络行为的时间维度,用户参与网络行为的频率维度,用户参与网络的单向行为或互动行为维度,网络关联用户量维度,以及用户参与网络的行为规律性评估维度。
10.根据权利要求2至4任一所述的可疑网络用户的识别方法,其特征在于,
所述获取所述待评估网络用户参与网络行为信息参量及其参量值具体为:获取待评估网络用户参与至少两个网站的行为信息参量及其参量值;
相应的,所述利用所述网络行为信息的参量值及不同类别的加权权重值加权计算待评估网络用户的网络行为活跃度具体为:
利用待评估网络用户参与每一网站行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户针对该网站的网络行为活跃度,并对用户参与的所有网站的网络行为活跃度求和。
11.根据权利要求2至4任一所述的可疑网络用户的识别方法,其特征在于,
所述获取所述待评估网络用户参与网络行为信息参量及其参量值具体为:获取待评估网络用户参与至少两个网站的行为信息参量及其参量值;
相应的,所述利用所述网络行为信息的参量值及不同类别的加权权重值加权计算待评估网络用户的网络行为活跃度具体为:
利用待评估网络用户参与所有网站行为信息参量的参量值及不同类别的加权权重值分别加权计算各个类别的加权值,并对所述所有类别的加权值求和。
12.根据权利要求1所述的可疑网络用户的识别方法,其特征在于,所述根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户的方法,具体为:
依据所述网络行为活跃度是否超出设定的阈值条件,给出所述待评估网络用户是否为可疑或非安全网络用户的提示。
13.一种可疑网络用户的识别装置,包括:
接收单元,用于接收客户端发送的针对待评估网络用户的身份信息验证请求;
解析单元,用于解析所述验证请求,获取所述待评估网络用户的账户信息;
获取单元,用于依据所述待评估网络用户的账户信息,获取所述待评估网络用户参与的网络行为信息;
计算单元,用于利用所述网络行为信息,计算所述待评估网络用户的网络行为活跃度;
识别单元,用于根据所述待评估网络用户的网络行为活跃度,识别所述待评估网络用户是否为可疑网络用户。
14.根据权利要求13所述的可疑网络用户的识别装置,其特征在于,
所述获取单元,具体用于依据所述待评估网络用户的账户信息,获取待评估网络用户参与至少两个网站的行为信息参量及其参量值;
相应的,所述计算单元,具体用于
利用待评估网络用户参与每一网站行为信息参量的参量值及不同类别的加权权重值加权计算待评估网络用户针对该网站的网络行为活跃度,并对用户参与的所有网站的网络行为活跃度求和。
15.根据权利要求13所述的可疑网络用户的识别装置,其特征在于,
所述获取单元,具体用于依据所述待评估网络用户的账户信息,获取待评估网络用户参与至少两个网站的行为信息参量及其参量值;
相应的,所述计算单元,具体用于
利用待评估网络用户参与所有网站行为信息参量的参量值及不同类别的加权权重值分别加权计算各个类别的加权值,并对所述所有类别的加权值求和。
16.根据权利要求13至15任一权利要求所述的可疑网络用户的识别装置,其特征在于,所述获取单元包括:获取第一子单元,用于
依据所述待评估网络用户的账户信息,向预设目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求;
获取第二子单元,用于接收各个目标网站针对所述抓取请求反馈的所述网络用户参与相应网络的信息参量及参量值。
17.根据权利要求16所述的可疑网络用户的识别装置,其特征在于,所述获取第一子单元,具体用于:使用浏览器,以预先注册的账户登陆网站,通过网站的搜索网络用户功能以待评估网络用户的电子邮件地址为关键字对指定网络用户查找其参与网络行为信息参量及其参量值。
18.根据权利要求16所述的可疑网络用户的识别装置,其特征在于,所述获取第一子单元,包括:分布式数据抓取集群和各目标网站接口单元,分布式数据抓取集群通过目标网站接口单元向各目标网站提交待评估网络用户参与网络行为信息参量及其参量值数据抓取请求。
CN201510377706.4A 2015-06-30 2015-06-30 一种可疑网络用户的识别方法和装置 Pending CN106330837A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510377706.4A CN106330837A (zh) 2015-06-30 2015-06-30 一种可疑网络用户的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510377706.4A CN106330837A (zh) 2015-06-30 2015-06-30 一种可疑网络用户的识别方法和装置

Publications (1)

Publication Number Publication Date
CN106330837A true CN106330837A (zh) 2017-01-11

Family

ID=57726739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510377706.4A Pending CN106330837A (zh) 2015-06-30 2015-06-30 一种可疑网络用户的识别方法和装置

Country Status (1)

Country Link
CN (1) CN106330837A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194215A (zh) * 2017-05-05 2017-09-22 北京神州新桥科技有限公司 用户行为分析方法、装置、系统及机器可读存储介质
CN107622443A (zh) * 2017-08-16 2018-01-23 深信服科技股份有限公司 数据处理方法、数据处理装置及计算机可读存储介质
CN107679069A (zh) * 2017-08-18 2018-02-09 国家计算机网络与信息安全管理中心 基于新闻数据及相关评论信息的一种特定群体发现方法
CN108595395A (zh) * 2018-03-21 2018-09-28 阿里巴巴集团控股有限公司 一种昵称的生成方法、装置及设备
CN108734366A (zh) * 2017-04-24 2018-11-02 北京京东尚科信息技术有限公司 用户识别方法及其系统
CN109003181A (zh) * 2018-08-17 2018-12-14 腾讯科技(深圳)有限公司 可疑用户确定方法、装置、设备和计算机可读存储介质
CN109636433A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 基于大数据分析的养卡识别方法、装置、设备和存储介质
CN111314496A (zh) * 2020-05-15 2020-06-19 太平金融科技服务(上海)有限公司 注册请求拦截方法、装置、计算机设备和存储介质
CN111552717A (zh) * 2020-04-23 2020-08-18 广州市百果园信息技术有限公司 一种伪装对象的识别方法、装置、服务器和存储介质
US10853678B2 (en) 2017-12-15 2020-12-01 Samsung Electronics Co., Ltd. Object recognition method and apparatus
CN112636980A (zh) * 2020-12-25 2021-04-09 平安科技(深圳)有限公司 资源数量确定方法、装置、电子设备及相关产品
CN116319099A (zh) * 2023-05-22 2023-06-23 威海海洋职业学院 一种多终端的财务数据管理方法和系统
CN117896184A (zh) * 2024-03-14 2024-04-16 山西金冠同力信息技术有限公司 一种基于大数据的网络安全监测方法、装置以及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984191A (zh) * 2011-09-07 2013-03-20 百度在线网络技术(北京)有限公司 用于确定行为相关质量信息的方法、装置和设备
CN103617235A (zh) * 2013-11-26 2014-03-05 中国科学院信息工程研究所 一种基于粒子群算法的网络水军账号识别方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984191A (zh) * 2011-09-07 2013-03-20 百度在线网络技术(北京)有限公司 用于确定行为相关质量信息的方法、装置和设备
CN103617235A (zh) * 2013-11-26 2014-03-05 中国科学院信息工程研究所 一种基于粒子群算法的网络水军账号识别方法及系统

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108734366B (zh) * 2017-04-24 2022-09-30 北京京东尚科信息技术有限公司 用户识别方法及其系统、非易失性存储介质和计算机系统
CN108734366A (zh) * 2017-04-24 2018-11-02 北京京东尚科信息技术有限公司 用户识别方法及其系统
CN107194215B (zh) * 2017-05-05 2020-06-26 北京神州新桥科技有限公司 用户行为分析方法、装置、系统及机器可读存储介质
CN107194215A (zh) * 2017-05-05 2017-09-22 北京神州新桥科技有限公司 用户行为分析方法、装置、系统及机器可读存储介质
CN107622443A (zh) * 2017-08-16 2018-01-23 深信服科技股份有限公司 数据处理方法、数据处理装置及计算机可读存储介质
CN107622443B (zh) * 2017-08-16 2021-09-17 深信服科技股份有限公司 数据处理方法、数据处理装置及计算机可读存储介质
CN107679069A (zh) * 2017-08-18 2018-02-09 国家计算机网络与信息安全管理中心 基于新闻数据及相关评论信息的一种特定群体发现方法
US11423702B2 (en) 2017-12-15 2022-08-23 Samsung Electronics Co., Ltd. Object recognition method and apparatus
US10853678B2 (en) 2017-12-15 2020-12-01 Samsung Electronics Co., Ltd. Object recognition method and apparatus
CN108595395A (zh) * 2018-03-21 2018-09-28 阿里巴巴集团控股有限公司 一种昵称的生成方法、装置及设备
CN108595395B (zh) * 2018-03-21 2022-02-25 创新先进技术有限公司 一种昵称的生成方法、装置及设备
CN109003181B (zh) * 2018-08-17 2022-05-13 腾讯科技(深圳)有限公司 可疑用户确定方法、装置、设备和计算机可读存储介质
CN109003181A (zh) * 2018-08-17 2018-12-14 腾讯科技(深圳)有限公司 可疑用户确定方法、装置、设备和计算机可读存储介质
CN109636433A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 基于大数据分析的养卡识别方法、装置、设备和存储介质
CN111552717B (zh) * 2020-04-23 2023-04-18 广州市百果园信息技术有限公司 一种伪装对象的识别方法、装置、服务器和存储介质
CN111552717A (zh) * 2020-04-23 2020-08-18 广州市百果园信息技术有限公司 一种伪装对象的识别方法、装置、服务器和存储介质
CN111314496A (zh) * 2020-05-15 2020-06-19 太平金融科技服务(上海)有限公司 注册请求拦截方法、装置、计算机设备和存储介质
CN112636980A (zh) * 2020-12-25 2021-04-09 平安科技(深圳)有限公司 资源数量确定方法、装置、电子设备及相关产品
CN116319099A (zh) * 2023-05-22 2023-06-23 威海海洋职业学院 一种多终端的财务数据管理方法和系统
CN117896184A (zh) * 2024-03-14 2024-04-16 山西金冠同力信息技术有限公司 一种基于大数据的网络安全监测方法、装置以及设备
CN117896184B (zh) * 2024-03-14 2024-05-28 山西金冠同力信息技术有限公司 一种基于大数据的网络安全监测方法、装置以及设备

Similar Documents

Publication Publication Date Title
CN106330837A (zh) 一种可疑网络用户的识别方法和装置
EP2748781B1 (en) Multi-factor identity fingerprinting with user behavior
CN108074095B (zh) 一种票务处理方法和装置
CN111435507A (zh) 广告反作弊方法、装置、电子设备及可读存储介质
US20180196875A1 (en) Determining repeat website users via browser uniqueness tracking
US8370929B1 (en) Automatic response culling for web application security scan spidering process
WO2021098274A1 (zh) 针对隐私数据泄漏的风险评估方法及装置
CN104202339B (zh) 一种基于用户行为的跨云认证服务方法
CN105930727A (zh) 基于Web的爬虫识别算法
CN111291015B (zh) 一种用户行为异常检测方法及装置
CN105590055A (zh) 用于在网络交互系统中识别用户可信行为的方法及装置
CN105827706A (zh) 消息推送装置及方法
CN103745156B (zh) 一种在搜索引擎中提示风险信息的方法和装置
CN102710770A (zh) 一种上网设备识别方法及其实现系统
Pastrana et al. Measuring ewhoring
CN109831459B (zh) 安全访问的方法、装置、存储介质和终端设备
CN109241733A (zh) 基于Web访问日志的爬虫行为识别方法及装置
CN107241292B (zh) 漏洞检测方法及装置
CN110830445A (zh) 一种异常访问对象的识别方法及设备
CN111680167A (zh) 一种服务请求的响应方法及服务器
CN107679383B (zh) 一种基于地理位置和触压面积的身份验证方法及装置
CN113886817A (zh) 主机入侵检测方法及装置、电子设备、存储介质
Sun et al. Gambling domain name recognition via certificate and textual analysis
CN111385272A (zh) 弱口令的检测方法及装置
CN107679865B (zh) 一种基于触压面积的身份验证方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111

RJ01 Rejection of invention patent application after publication