CN103927307A

CN103927307A - 一种识别网站用户的方法和装置

Info

Publication number: CN103927307A
Application number: CN201310011312.8A
Authority: CN
Inventors: 林古立; 陈德品; 陈智强
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2013-01-11
Filing date: 2013-01-11
Publication date: 2014-07-16
Anticipated expiration: 2033-01-11
Also published as: CN103927307B; US20140201048A1; WO2014110370A3; JP6321681B2; EP2943925A2; WO2014110370A2; TW201428528A; JP2016509300A; TWI591508B; US9639844B2; EP2943925A4

Abstract

本发明实施例公开了一种识别网站用户的方法和装置。其中，从数据库中获取账号和用户标识；通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；在所述连通图中查找连通分量，所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体；计算所述账号群体的账号密度和账号欺诈关闭率；判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内；如果是，将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，否则，将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户。根据本发明实施例，以有效地识别网站用户，提高识别的准确率，并且可以实现提前预防欺诈事件发生的目的。

Description

一种识别网站用户的方法和装置

技术领域

本发明涉及计算机应用领域，特别是涉及一种识别网站用户的方法和装置。

背景技术

各类网站通常都拥有大量的网站用户，在这些网站用户中，有些网站用户在登录网站后会凭借网站这个平台对其它的网站用户实施某种欺诈行为。例如，一些卖家(淘宝网的网站用户)在淘宝网上发布虚假商品信息，并且只收钱而不发货，诈骗买家的钱财。对于网站系统而言，这些实施欺诈行为的网站用户就属于危险的网站用户。

为了防控危险的网站用户的欺诈行为，必须要先从海量的网站用户中准确地识别出哪些为危险的网站用户。通常，网站用户是通过账号来登录网站的，不同的网站用户绑定的账号也不同，因此，可以直接利用账号来识别一个网站用户。并且，通过判断某个账号是否发生欺诈事实，进一步确定与该账号绑定的网站用户是否属于危险的网站用户。对于那些被确定为危险的网站用户，服务器可以进一步采取一些防控措施，如，对该账号进行重点监视，必要时还可以关闭该账号。然而，这些危险的网站用户往往会通过各种手段在同一个网站上注册多个账号，一个账号被关闭后，还可以利用其它未关闭的账号继续实施欺诈行为。

网站用户在利用账号登录网站时，服务器通常会记录一些反映用户基本信息的用户标识，如，IP地址、Agent、cookie、用户ID(如，用户的邮箱或手机号)或MAC(Medium/Media Access Control，介质访问控制)地址等。即使网站用户在同一个网站上注册了多个账号，但所有账号很有可能会关联同一个用户标识，如，当网站用户利用同一台电脑在网站上注册多个账号时，所有的账号都会关联同一个IP地址。如果多个账号关联同一个用户标识，由这些账号构成的账号集合可能是与同一个网站用户绑定的。因此，除了账号之外，也可以利用与同一个用户标识关联的账号集合来识别一个网站用户。并且，通过判断某个账号集合中是否有一个账号发生欺诈事实，进一步确定与该账号集合绑定的网站用户是否属于危险的网站用户。例如，服务器会把该账号所关联的所有用户标识列入黑名单中，与任何一个使用黑名单中的用户标识的账号绑定的网站用户都属于危险的网站用户。

但是，在实现本发明的过程中，本发明的发明人发现现有技术中至少存在如下问题：虽然利用与同一个用户标识关联的账号集合识别网站用户要比利用账号识别网站用户的识别范围广，准确率高，然而，由于危险的网站用户的警惕性较高，其使用的所有账号有时也未必会共用同一个用户标识，例如，当网站用户利用不同的电脑在网站上注册多个账号时，这些账号就会关联不同的IP地址。因此，利用与欺诈事实成立的账号关联的用户标识也无法全面地识别出一个危险的网站用户，其识别的准确率也受到了一定的限制。并且，在利用上述关联关系确定账号群体时，需要在所有的账号和用户标识中查找与同一个用户标识关联的账号集合，由于帐号和用户标识的数量都非常大，服务器在进行上述查找时的工作量也非常巨大，因此，服务器的处理速度就会非常慢。

发明内容

为了解决上述技术问题，本发明实施例提供了一种识别网站用户的方法和装置，以有效地识别网站用户，提高识别的准确率，提高服务器的处理速度，并且可以实现提前预防欺诈事件发生的目的。

本发明实施例公开如下技术方案：

一种识别网站用户的方法，包括：

从数据库中获取账号和用户标识；

通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；

在所述连通图中查找连通分量，所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体；

计算所述账号群体的账号密度和账号欺诈关闭率；

判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内；

如果是，将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，否则，将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户。

一种识别网站用户的方法，包括：

从数据库中获取账号和用户标识；

判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号；

一种识别网站用户的装置，包括：

获取模块，用于从数据库中获取账号和用户标识；

建立模块，用于通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；

查找模块，用于在所述连通图中查找连通分量，所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体；

第一参数计算模块，用于计算所述账号群体的账号密度和账号欺诈关闭率；

第一参数判断模块，用于判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内；

第一网站用户识别模块，用于当第一参数判断模块的判断结果为是时，将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，否则，将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户。

一种识别网站用户的装置，包括：

获取模块，用于从数据库中获取账号和用户标识；

判断模块，用于判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号；

第二网站用户识别模块，用于当判断模块的判断结果为是时，将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，否则，将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户。

由上述实施例可以看出，对于数据库中存在的海量账号和用户标识，利用图论原理，从中找到直接关联和间接关联的账号，而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的，这样识别出的网站用户更加全面更加准确。并且，当服务器利用图论原理查找上述账号群体时，并不需要在所有的账号和用户标识中一一进行查找，节省了服务器的工作量，也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户，可以通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户。也可以通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号，而识别出这个网站用户是否为一个危险的网站用户。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种识别网站用户的方法一个实施例流程图；

图2为图论中的连通图示意图；

图3为本发明中一种利用标记扩散法查找连通图中连通分量的方法示意图；

图4为本发明中连通分量的查找示意图；

图5为本发明一种识别网站用户的方法的另一个实施例流程图；

图6为本发明一种标识网站用户的方法的另一个实施例流程图；

图7为本发明一种标识网站用户的装置的一个实施例结构图；

图8为本发明中查找模块的结构示意图；

图9为本发明一种标识网站用户的装置的另一个实施例结构图；

图10为本发明一种标识网站用户的装置的另一个实施例结构图。

具体实施方式

本发明实施例提供了识别网站用户的方法和装置。对于数据库中存在的海量账号和用户标识，利用图论原理，从中找到直接关联和间接关联的账号，而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的，这样识别出的网站用户更加全面更加准确。对于拥有一个账号群体的网站用户，可以通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户。也可以通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号，而识别出这个网站用户是否为一个危险的网站用户。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例进行详细描述。

实施例一

请参阅图1，其为本发明一种识别网站用户的方法一个实施例流程图，该方法包括以下步骤：

步骤101：从数据库中获取账号和用户标识；

当网站用户登录网站时，服务器会记录每个网站用户登录网站时的账号以及一些用户标识，并保存到数据库中。在具体实施时，可定期从数据库中获取某一段时间内(如，最近3个月内)保存的账号和用户标识。

例如，从数据库中获取的账号和用户标识可包括以下数据：(1)每一个账号关联的所有用户标识的列表；(2)每一个用户标识关联的所有账号的列表。这些数据可以作为图论中的用于表示一个连通图的邻接表，并根据该链接表构建一个连通图。

步骤102：通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户节点的方式，建立连通图；

如图2所示，其为图论中的连通图示意图。图2中的连通图由3个连通分量构成。在图论中，如果其中的任何两个节点之间都存在一条路径，并且它们都不和子图之外的节点相连，这样的子图被称为连通分量。图2中的圆点表示连通分量中的节点，在本发明中，将账号和用户标识作为节点，图2中的连接线表示连通分量中的路径，在本发明中，当一个账号和一个用户标识具有关联关系时，在该账号对应的账号节点和该用户标识对应的用户标识节点之间可建立一条路径。

步骤103：在所述连通图中查找连通分量，所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体；

在利用账号和用户标识构建了图2所示的连通图后，可利用图论中的标记扩散方法来寻找连通图中的连通分量。当然，也可以采用图论中的其它方法来寻找连通图中的连通分量，本发明对此不做限定。

优选的，如图3所示，其为本发明中一种利用标记扩散法查找连通图中连通分量的方法示意图，所述在连通图中查找连通分量包括：

步骤301、比较连通图中的各节点的当前标记值与和与所述各节点具有连接关系的其它节点的当前标记值的大小；

步骤302：选择最小的标记值作为所述各节点的当前标记值；

步骤303、判断是否至少有一个节点的当前标记值发生了变化，如果是，返回步骤301，否则，进入步骤304；

步骤304、从连通图中提取拥有相同标记值的节点为一个连通分量。

例如，如图4-1所示，假设连通图中有5个节点：A、B、C、D和E，并对这5个节点进行标记，每个节点就会拥有一个标记值。如，可以使用任意5个数字对这5个节点进行标记，当然，一种更简单的方式是：按照节点自上而下的顺序依次对各节点进行标记，假设，经过标记后，这5个节点的当前标记值分别为0、1、3、2和4。将A节点的当前标记值发送给B节点，将B节点的当前标记值发送给A节点和C节点，将C节点的当前标记值发送给B节点、D节点和E节点，将D节点的当前标记值发送给C节点，将E节点的当前标记值发送给C节点。对于A节点而言，由于其自身的当前标记值为0，而接收的B节点的当前标记值为1，因此，A节点的当前标记值仍然为0。对于B节点而言，由于其自身的当前标记值为1，而接收的A节点的当前标记值为0，因此，B节点的当前标记值由1变为0，以此类推，如图4-2所示，经过第一次更新后，B节点的当前标记值由1变为0，C节点的当前标记值由3变为1，D节点的当前标记值仍然为2，E节点的当前标记值由4变为3。

由于B节点、C节点和E节点的当前标记值发生了变化，继续将各节点的当前标记值发送给具有连接关系的其它节点，并第二次更新各节点的当前标记值，如图4-3所示，经过第二次更新后，C节点的当前标记值由1变为0，D节点的当前标记值由2变为1，E节点的当前标记值由3变为1，A节点和B节点的当前标记值没有发生改变，仍然为0。

由于C节点、D节点和E节点的当前标记值发生了变化，继续将各节点的当前标记值发送给具有连接关系的其它节点，并第三次更新各节点的当前标记值。如图4-4所示，经过第三次更新后，D节点的当前标记值由1变为0，E节点的当前标记值由1变为0，其它节点的当前标记值没有发生改变，仍然为0。

由于D节点和E节点的当前标记值发生了变化，继续将各节点的当前标记值发送给具有连接关系的其它节点，并第四次更新各节点的当前标记值。经过第四次更新后，所有节点的当前标记值均没有发生改变，仍然为0，结束更新过程。此时，A-E节点为拥有相同标记值的节点，其构成一个连通分量。，以上采用的是图论中的标记扩散方法来寻找具有相同标记值的节点，在图论中，这些具有相同标记值的节点就是连通图中的一个连通分量。该连通分量中由所有账号节点对应的账号构成与同一个网站用户绑定的账号群体。例如，假设图4中的A节点和C节点为用户标识节点，B节点、D节点和E节点为账号节点，那么，B节点、D节点和E节点对应的账号构成一个账号群体，该账号群体与同一个网站用户绑定，也就是说，该账号群体标识了同一个网站用户。并且，通过图论的理论得到的账号群体中可能不仅包括直接关联的账号，还包括间接关联的账号。所谓直接关联的账号为关联相同的用户标识的一组账号，所谓间接关联的账号为对于帐号A和帐号B来说，如果能找到一系列帐号X₁，X₂，..X_m(m≥1)，使得A与X₁直接关联，X_i与X_i+1(1≤i≤n-1)直接关联，X_m与B直接关联，则A与B是间接关联帐号。

步骤104：计算所述账号群体的账号密度和账号欺诈关闭率；

其中，通过如下方式计算一个账号群体的账号密度：

统计在所述账号群体中所有账号的总个数，以及所有账号对应的账号节点的节点度数之和；

按照公式计算所述账号密度，n为在所述账号群体中所有账号的总个数。

在图论中，一个节点的节点度数即为与该节点相连接的节点个数。例如，在图4中，与A节点相连接的只有B节点，也就是说，与A节点相连接的节点个数为1，A节点的节点度数就为1。与B节点相连接的有A节点和C节点，也就是说，与A节点相连接的节点个数为2，B节点的节点度数就为2。

通过如下方式计算一个账号群体的账号欺诈关闭率：

统计在所述账号群体中所有账号的总个数，以及因欺诈和/或疑似欺诈而关闭的账号个数；

计算在所述账号群体中因欺诈和/或疑似欺诈而关闭的账号个数与所有账号的总个数的比值，所述比值为所述账号群体的账号欺诈关闭率。

在网站的监控系统中，会对所有账号的行为进行监控，如果发现某个账号实施了欺诈行为，会将该账号作为欺诈账号而关闭。如果通过行为分析发现某个账号的行为异常，会将该账号作为疑似欺诈账号而关闭。并且，系统会将这些因欺诈和疑似欺诈而关闭的账号进行标记。在本发明中，可通过标记直接识别出在一个账号群体中有哪些账号是因欺诈和疑似欺诈而关闭的账号，并统计其数量。

步骤105：判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内，如果是，进入步骤106，否则，进入步骤107；

步骤106：将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，结束流程。

步骤107：将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户，结束流程。

这里，可以预先通过试验，计算在与已知为一个危险的网站用户绑定的所有账号的账号密度。并利用样本统计方法确定一个平均值，将该平均值作为账号密度的正常数值范围。同理，也可确定账号欺诈关闭率的正常数值范围。

在实际应用中，可根据账号群体中所有账号的总个数，设置不同的正常数值范围。例如，当账号群体中所有账号的总个数在闭区间[5，2000]的范围内时，可将账号密度的正常数值范围设定为闭区间[05，1]，将账号欺诈关闭率的正常值范围设定为左闭右开区间[0.1，1)。当然，当账号群体中所有账号的总个数在其它范围内时，还可以将账号密度的正常数值范围以及账号欺诈关闭率的正常数值范围设定为其它区间值。本发明对账号密度的正常数值范围和账号欺诈关闭率的正常数值范围的具体区间值不进行限定。

在确定某个账号群体为危险账号群体时，可以认为该危险账号群体中的所有账号都具有欺诈性。而该危险账号群体中的所有账号与同一个网站用户绑定，该网站用户是危险的网站用户。系统可以对危险账号群体中的所有账号进行重点监视，必要时还可以关闭该账号。

由上述实施例可以看出，对于数据库中存在的海量账号和用户标识，利用图论原理，从中找到直接关联和间接关联的账号，而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的，从而全面并准确地识别出一个网站用户。并且，当服务器利用图论原理查找上述账号群体时，并不需要在所有的账号和用户标识中一一进行查找，节省了服务器的工作量，也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户，通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户，可以实现提前预防欺诈事件发生的目的。

实施例二

当确定某一个账号群体为危险网站账号群体，在该危险账号群体中，有可能某些账号是被盗的账号，而这些账号并不具有欺诈性。为了能在危险账号群体中更好地区分哪些账号是更具有欺诈性的，本实施例在实施例一的基础上，进一步从连通分量中识别出危险用户标识，与该危险用户标识关联的账号被最终确定为危险账号。请参阅图5，其为本发明一种识别网站用户的方法的另一个实施例流程图，该方法包括以下步骤：

步骤501：从数据库中获取账号和用户标识；

步骤502：通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；

步骤503：在所述连通图中查找连通分量，所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体；

步骤504：计算所述账号群体的账号密度和账号欺诈关闭率；

步骤505：判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内，如果是，进入步骤506，否则，进入步骤507；

步骤506：将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，执行步骤508；

步骤507：将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户，结束流程。

上述步骤501-步骤507的执行过程可以参见实施例一中的步骤101-107，由于该执行过程已经在实施例一中进行了详细地描述，故此处不摘赘述。

步骤508：计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率；

例如，在图4所示的连通分量中，当由所有账号节点对应的账号构成的账号群体被确定为危险账号群体时，计算图4所示的连通分量中用户标识节点对应的用户标识的标识欺诈关闭率。

其中，通过以下方式计算标识欺诈关闭率：

统计在所述账号群体中与所述用户标识关联的账号总个数，以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数；

计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识关联的账号总个数的比值，所述比值为用户标识的标识欺诈关闭率。

步骤509：判断所述标识欺诈关闭率是否在预设的正常数据范围内，如果是，进入步骤510，否则，进入步骤511；

步骤510：将所述用户标识确定为危险用户标识，与所述危险用户标识关联的账号为危险账号，结束流程。

步骤511：将所述用户标识确定为正常用户标识，与所述正常用户标识关联的账号为正常账号，结束流程。

这里，可以预先通过试验，在与已知为一个危险的网站用户绑定的账号中，计算与这些账号关联的用户标识的标识欺诈关闭率。并利用样本统计方法确定一个平均值，将该平均值作为标识欺诈关闭率的正常数值范围。

在实际应用中，可根据账号群体的账号欺诈关闭率和在该账号群体中与用户标识关联的账号总个数，设置不同的正常数值范围。例如，当账号群体的账号关闭率大于0.2时，如果在该账号群体中与用户标识关联的账号总个数大于100，可将标识欺诈关闭率的正常数值范围设置为大于0.2的值，如果在该账号群体中与用户标识关联的账号总个数在闭区间[5，100]范围内，可将标识欺诈关闭率的正常数据范围设置为大于0.5的值。当然，当账号群体的账号欺诈关闭率以及在该账号群体中与用户标识关联的账号总个数在其它范围内时，还可以将标识欺诈关闭率的正常数值范围设定为其它值。本发明对标识欺诈关闭率的正常数值范围的具体区间值不进行限定。

而且，还能在危险账号群体中更好地区分哪些账号是更具有欺诈性的。

实施例三

除了利用实施例一中账号密度和账号欺诈关闭率来确定一个账号群体是否为一个危险的账号群体之外，也可以通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号来确定其是否为一个危险的账号群体。请参阅图6，其为本发明一种标识网站用户的方法的另一个实施例流程图，包括以下步骤：

步骤601：从数据库中获取账号和用户标识；

不厚602：通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；

步骤603：在所述连通图中查找连通分量，所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体；

上述步骤601-603的执行过程可以参见实施例一中的步骤101-103，由于该执行过程已经在实施例一中进行了详细地描述，故此处不摘赘述。

步骤604：判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号，如果是，进入步骤605，否则，进入步骤606；

在网站的监控系统中，会对所有账号的行为进行监控，如果发现某个账号实施了欺诈行为，会将该账号作为欺诈账号而关闭。如果通过行为分析发现某个账号的行为异常，会将该账号作为疑似欺诈账号而关闭。并且，系统会将这些因欺诈和疑似欺诈而关闭的账号进行标记。在本发明中，可通过标记直接识别出在一个账号群体中有哪些账号是因欺诈和疑似欺诈而关闭的账号。

步骤605：将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，结束流程。

步骤606：将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户，结束流程。

由上述实施例可以看出，对于数据库中存在的海量账号和用户标识，利用图论原理，从中找到直接关联和间接关联的账号，而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的，从而全面并准确地识别出一个网站用户。并且，当服务器利用图论原理查找上述账号群体时，并不需要在所有的账号和用户标识中一一进行查找，节省了服务器的工作量，也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户，通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号，而识别出这个网站用户是否为一个危险的网站用户。

实施例四

与上述实施例一中的一种标识网站用户的方法相对应，本发明实施例还提供了一种标识网站用户装置。请参阅图7，其为本发明一种标识网站用户的装置的一个实施例结构图，该装置包括获取模块701、建立模块702、查找模块703、第一参数计算模块704、第一参数判断模块705和第一网站用户识别模块706。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。

获取模块701，用于从数据库中获取账号和用户标识；

建立模块702，用于通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；

查找模块703，用于在所述连通图中查找连通分量，所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体；

第一参数计算模块704，用于计算所述账号群体的账号密度和账号欺诈关闭率；

第一参数判断模块705，用于判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内；

第一网站用户识别模块706，用于当第一参数判断模块的判断结果为是时，将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，否则，将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户。

优选的，如图8所示，查找模块703包括：

比较子模块7032，用于比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小；

选取子模块，用于选取最小的标记值作为所述各节点的当前标记值；

第一判断子模块7033，用于判断是否至少有一个节点的当前标记值发生了变化；

重复子模块7034，用于当所述第一判断子模块的判断结果为是时，触发比较子模块继续比较连通图中的各节点的当前标记值和具有连接关系的其它节点的当前标记值大小；

提取子模块7035，用于当所述第一判断子模块的判断结果为否时，从连通图中提取拥有相同标记值的节点为一个连通分量。

优选的，第一参数计算模块704包括：

第一统计子模块，用于统计在所述账号群体中所有账号的总个数，以及所有账号对应的账号节点的节点度数之和；

密度计算子模块，用于按照公式计算所述账号密度，n为在所述账号群体中所有账号的总个数。

优选的，第一参数计算模块704包括：

第二统计子模块，用于统计在所述账号群体中所有账号的总个数、以及因欺诈和/或疑似欺诈而关闭的账号个数；

账号欺诈关闭率计算子模块，用于计算在所述账号群体中因欺诈和/或疑似欺诈而关闭的账号个数与所有账号的总个数的比值，所述比值为所述账号群体的账号欺诈关闭率。

进一步优选的，如图9所示，在图8所示的结构基础上，该装置还包括：

第二参数计算模块707，用于计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率；

第二参数判断模块708，用于判断所述标识欺诈关闭率是否在预设的正常数据范围内；

用户标识识别模块709，用于当所述第二参数判断模块的判断结果为是时，将所述用户标识确定为危险用户标识，与所述危险用户标识关联的账号为危险账号，否则，将所述用户标识确定为正常用户标识，与所述正常用户标识关联的账号为正常账号。

其中，优选的，第二参数计算模块707包括：

第三统计子模块，用于统计在所述账号群体中与所述用户标识关联的账号总个数，以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数；

标识欺诈关闭率计算子模块，用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识关联的账号总个数的比值，所述比值为用户标识的标识欺诈关闭率。

实施例五

与上述实施例三中的一种标识网站用户的方法相对应，本发明实施例还提供了一种标识网站用户装置。请参阅图10，其为本发明一种标识网站用户的装置的另一个实施例结构图，该装置包括获取模块1001、建立模块1002、查找模块1003、判断模块1004、第二网站用户识别模块1005。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。

获取模块1001，用于从数据库中获取账号和用户标识；

建立模块1002，用于通过将所述账号和用户标识作为节点，并连接具有关联关系的账号节点和用户标识节点的方式，建立连通图；

查找模块1003，用于在所述连通图中查找连通分量，所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体；

判断模块1004，用于判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号；

第二网站用户识别模块1005，用于当判断模块的判断结果为是时，将所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户，否则，将所述账号群体确定为正常账号群体，与所述正常账号群体绑定的网站用户为正常的网站用户。

优选的，查找模块1003包括：

比较子模块，用于比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小；

第一判断子模块，用于判断是否至少有一个节点的当前标记值发生了变化；

重复子模块，用于当所述第一判断子模块的判断结果为是时，触发比较子模块继续比较连通图中的各节点的当前标记值和具有连接关系的其它节点的当前标记值大小；

提取子模块，用于当所述第一判断子模块的判断结果为否时，从连通图中提取拥有相同标记值的节点为一个连通分量。

进一步优选的，在图10所示的结构基础上，该装置还包括：

第二参数计算模块，用于计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率；

第二参数判断模块，用于判断所述标识欺诈关闭率是否在预设的正常数据范围内；

用户标识识别模块，用于当所述第二参数判断模块的判断结果为是时，将所述用户标识确定为危险用户标识，与所述危险用户标识关联的账号为危险账号，否则，将所述用户标识确定为正常用户标识，与所述正常用户标识关联的账号为正常账号。

其中，优选的，第二参数计算模块包括：第三统计子模块，用于统计在所述账号群体中与所述用户标识关联的账号总个数，以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数；标识欺诈关闭率计算子模块，用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识节点关联的账号总个数的比值，所述比值为用户标识的标识欺诈关闭率。

需要说明的是，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上对本发明所提供的一种识别网站用户的方法和装置进行了详细介绍，本文中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种识别网站用户的方法，其特征在于，包括：

从数据库中获取账号和用户标识；

计算所述账号群体的账号密度和账号欺诈关闭率；

2.根据权利要求1所述的方法，其特征在于，所述在所述连通图中查找连通分量包括：

比较连通图中各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小；

选取最小的标记值作为所述各节点的当前标记值；

判断是否至少有一个节点的当前标记值发生了变化；

如果是，继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小；

否则，从连通图中提取拥有相同标记值的节点为一个连通分量。

3.根据权利要求1所述的方法，其特征在于，所述计算所述账号群体的账号密度包括：

4.根据权利要求1所述的方法，其特征在于，所述计算所述账号群体的账号欺诈关闭率包括：

统计在所述账号群体中所有账号的总个数、以及因欺诈和/或疑似欺诈而关闭的账号个数；

5.根据权利要求1-4中任意一项所述的方法，其特征在于，当所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户后，所述方法还包括：

计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率；

判断所述标识欺诈关闭率是否在预设的正常数据范围内；

如果是，将所述用户标识确定为危险用户标识，与所述危险用户标识关联的账号为危险账号；

否则，将所述用户标识确定为正常用户标识，与所述正常用户标识关联的账号为正常账号。

6.根据权利要求5所述的方法，其特征在于，所述计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率包括：

7.一种识别网站用户的方法，其特征在于，包括：

从数据库中获取账号和用户标识；

8.根据权利要求7所述的方法，其特征在于，所述在所述连通图中查找连通分量包括：

比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小；

选取最小的标记值作为所述各节点的当前标记值；

判断是否至少有一个节点的当前标记值发生了变化，如果是，继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小；

9.根据权利要求7或8所述的方法，其特征在于，当所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户后，所述方法还包括：

判断所述标识欺诈关闭率是否在预设的正常数据范围内；

10.根据权利要求9所述的方法，其特征在于，所述计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率包括：

统计在所述账号群体中与所述用户标识节点关联的账号总个数，以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数；

计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识节点关联的账号总个数的比值，所述比值为用户标识的标识欺诈关闭率。

11.一种识别网站用户的装置，其特征在于，包括：

获取模块，用于从数据库中获取账号和用户标识；

12.根据权利要求11所述的装置，其特征在于，所述查找模块包括：

重复子模块，用于当所述第一判断子模块的判断结果为是时，触发比较子模块继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小；

13.根据权利要求11所述的装置，其特征在于，所述第一参数计算模块包括：

14.根据权利要求11所述的装置，其特征在于，所述第一参数计算模块包括：

15.根据权利要求11-14中任意一项所述的装置，其特征在于，当所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户后，所述装置还包括：

16.根据权利要求15所述的装置，其特征在于，所述第二参数计算模块包括：

17.一种识别网站用户的装置，其特征在于，包括：

获取模块，用于从数据库中获取账号和用户标识；

18.根据权利要求17所述的方法，其特征在于，所述查找模块包括：

19.根据权利要求17或18所述的装置，其特征在于，当所述账号群体确定为危险账号群体，与所述危险账号群体绑定的网站用户为危险的网站用户后，所述装置还包括：

20.根据权利要求19所述的装置，其特征在于，所述第二参数计算模块包括：

标识欺诈关闭率计算子模块，用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识节点关联的账号总个数的比值，所述比值为用户标识的标识欺诈关闭率。