CN103927307A - 一种识别网站用户的方法和装置 - Google Patents

一种识别网站用户的方法和装置 Download PDF

Info

Publication number
CN103927307A
CN103927307A CN201310011312.8A CN201310011312A CN103927307A CN 103927307 A CN103927307 A CN 103927307A CN 201310011312 A CN201310011312 A CN 201310011312A CN 103927307 A CN103927307 A CN 103927307A
Authority
CN
China
Prior art keywords
account
user
node
colony
swindle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310011312.8A
Other languages
English (en)
Other versions
CN103927307B (zh
Inventor
林古立
陈德品
陈智强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201310011312.8A priority Critical patent/CN103927307B/zh
Priority to TW102122363A priority patent/TWI591508B/zh
Priority to EP14701880.8A priority patent/EP2943925A4/en
Priority to PCT/US2014/011045 priority patent/WO2014110370A2/en
Priority to US14/152,463 priority patent/US9639844B2/en
Priority to JP2015552803A priority patent/JP6321681B2/ja
Publication of CN103927307A publication Critical patent/CN103927307A/zh
Application granted granted Critical
Publication of CN103927307B publication Critical patent/CN103927307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Technology Law (AREA)

Abstract

本发明实施例公开了一种识别网站用户的方法和装置。其中,从数据库中获取账号和用户标识;通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;计算所述账号群体的账号密度和账号欺诈关闭率;判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内;如果是,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。根据本发明实施例,以有效地识别网站用户,提高识别的准确率,并且可以实现提前预防欺诈事件发生的目的。

Description

一种识别网站用户的方法和装置
技术领域
本发明涉及计算机应用领域,特别是涉及一种识别网站用户的方法和装置。
背景技术
各类网站通常都拥有大量的网站用户,在这些网站用户中,有些网站用户在登录网站后会凭借网站这个平台对其它的网站用户实施某种欺诈行为。例如,一些卖家(淘宝网的网站用户)在淘宝网上发布虚假商品信息,并且只收钱而不发货,诈骗买家的钱财。对于网站系统而言,这些实施欺诈行为的网站用户就属于危险的网站用户。
为了防控危险的网站用户的欺诈行为,必须要先从海量的网站用户中准确地识别出哪些为危险的网站用户。通常,网站用户是通过账号来登录网站的,不同的网站用户绑定的账号也不同,因此,可以直接利用账号来识别一个网站用户。并且,通过判断某个账号是否发生欺诈事实,进一步确定与该账号绑定的网站用户是否属于危险的网站用户。对于那些被确定为危险的网站用户,服务器可以进一步采取一些防控措施,如,对该账号进行重点监视,必要时还可以关闭该账号。然而,这些危险的网站用户往往会通过各种手段在同一个网站上注册多个账号,一个账号被关闭后,还可以利用其它未关闭的账号继续实施欺诈行为。
网站用户在利用账号登录网站时,服务器通常会记录一些反映用户基本信息的用户标识,如,IP地址、Agent、cookie、用户ID(如,用户的邮箱或手机号)或MAC(Medium/Media Access Control,介质访问控制)地址等。即使网站用户在同一个网站上注册了多个账号,但所有账号很有可能会关联同一个用户标识,如,当网站用户利用同一台电脑在网站上注册多个账号时,所有的账号都会关联同一个IP地址。如果多个账号关联同一个用户标识,由这些账号构成的账号集合可能是与同一个网站用户绑定的。因此,除了账号之外,也可以利用与同一个用户标识关联的账号集合来识别一个网站用户。并且,通过判断某个账号集合中是否有一个账号发生欺诈事实,进一步确定与该账号集合绑定的网站用户是否属于危险的网站用户。例如,服务器会把该账号所关联的所有用户标识列入黑名单中,与任何一个使用黑名单中的用户标识的账号绑定的网站用户都属于危险的网站用户。
但是,在实现本发明的过程中,本发明的发明人发现现有技术中至少存在如下问题:虽然利用与同一个用户标识关联的账号集合识别网站用户要比利用账号识别网站用户的识别范围广,准确率高,然而,由于危险的网站用户的警惕性较高,其使用的所有账号有时也未必会共用同一个用户标识,例如,当网站用户利用不同的电脑在网站上注册多个账号时,这些账号就会关联不同的IP地址。因此,利用与欺诈事实成立的账号关联的用户标识也无法全面地识别出一个危险的网站用户,其识别的准确率也受到了一定的限制。并且,在利用上述关联关系确定账号群体时,需要在所有的账号和用户标识中查找与同一个用户标识关联的账号集合,由于帐号和用户标识的数量都非常大,服务器在进行上述查找时的工作量也非常巨大,因此,服务器的处理速度就会非常慢。
发明内容
为了解决上述技术问题,本发明实施例提供了一种识别网站用户的方法和装置,以有效地识别网站用户,提高识别的准确率,提高服务器的处理速度,并且可以实现提前预防欺诈事件发生的目的。
本发明实施例公开如下技术方案:
一种识别网站用户的方法,包括:
从数据库中获取账号和用户标识;
通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
计算所述账号群体的账号密度和账号欺诈关闭率;
判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内;
如果是,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
一种识别网站用户的方法,包括:
从数据库中获取账号和用户标识;
通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号;
如果是,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
一种识别网站用户的装置,包括:
获取模块,用于从数据库中获取账号和用户标识;
建立模块,用于通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
查找模块,用于在所述连通图中查找连通分量,所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体;
第一参数计算模块,用于计算所述账号群体的账号密度和账号欺诈关闭率;
第一参数判断模块,用于判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内;
第一网站用户识别模块,用于当第一参数判断模块的判断结果为是时,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
一种识别网站用户的装置,包括:
获取模块,用于从数据库中获取账号和用户标识;
建立模块,用于通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
查找模块,用于在所述连通图中查找连通分量,所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体;
判断模块,用于判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号;
第二网站用户识别模块,用于当判断模块的判断结果为是时,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
由上述实施例可以看出,对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,这样识别出的网站用户更加全面更加准确。并且,当服务器利用图论原理查找上述账号群体时,并不需要在所有的账号和用户标识中一一进行查找,节省了服务器的工作量,也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户,可以通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户。也可以通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号,而识别出这个网站用户是否为一个危险的网站用户。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种识别网站用户的方法一个实施例流程图;
图2为图论中的连通图示意图;
图3为本发明中一种利用标记扩散法查找连通图中连通分量的方法示意图;
图4为本发明中连通分量的查找示意图;
图5为本发明一种识别网站用户的方法的另一个实施例流程图;
图6为本发明一种标识网站用户的方法的另一个实施例流程图;
图7为本发明一种标识网站用户的装置的一个实施例结构图;
图8为本发明中查找模块的结构示意图;
图9为本发明一种标识网站用户的装置的另一个实施例结构图;
图10为本发明一种标识网站用户的装置的另一个实施例结构图。
具体实施方式
本发明实施例提供了识别网站用户的方法和装置。对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,这样识别出的网站用户更加全面更加准确。对于拥有一个账号群体的网站用户,可以通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户。也可以通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号,而识别出这个网站用户是否为一个危险的网站用户。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例进行详细描述。
实施例一
请参阅图1,其为本发明一种识别网站用户的方法一个实施例流程图,该方法包括以下步骤:
步骤101:从数据库中获取账号和用户标识;
当网站用户登录网站时,服务器会记录每个网站用户登录网站时的账号以及一些用户标识,并保存到数据库中。在具体实施时,可定期从数据库中获取某一段时间内(如,最近3个月内)保存的账号和用户标识。
例如,从数据库中获取的账号和用户标识可包括以下数据:(1)每一个账号关联的所有用户标识的列表;(2)每一个用户标识关联的所有账号的列表。这些数据可以作为图论中的用于表示一个连通图的邻接表,并根据该链接表构建一个连通图。
步骤102:通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户节点的方式,建立连通图;
如图2所示,其为图论中的连通图示意图。图2中的连通图由3个连通分量构成。在图论中,如果其中的任何两个节点之间都存在一条路径,并且它们都不和子图之外的节点相连,这样的子图被称为连通分量。图2中的圆点表示连通分量中的节点,在本发明中,将账号和用户标识作为节点,图2中的连接线表示连通分量中的路径,在本发明中,当一个账号和一个用户标识具有关联关系时,在该账号对应的账号节点和该用户标识对应的用户标识节点之间可建立一条路径。
步骤103:在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
在利用账号和用户标识构建了图2所示的连通图后,可利用图论中的标记扩散方法来寻找连通图中的连通分量。当然,也可以采用图论中的其它方法来寻找连通图中的连通分量,本发明对此不做限定。
优选的,如图3所示,其为本发明中一种利用标记扩散法查找连通图中连通分量的方法示意图,所述在连通图中查找连通分量包括:
步骤301、比较连通图中的各节点的当前标记值与和与所述各节点具有连接关系的其它节点的当前标记值的大小;
步骤302:选择最小的标记值作为所述各节点的当前标记值;
步骤303、判断是否至少有一个节点的当前标记值发生了变化,如果是,返回步骤301,否则,进入步骤304;
步骤304、从连通图中提取拥有相同标记值的节点为一个连通分量。
例如,如图4-1所示,假设连通图中有5个节点:A、B、C、D和E,并对这5个节点进行标记,每个节点就会拥有一个标记值。如,可以使用任意5个数字对这5个节点进行标记,当然,一种更简单的方式是:按照节点自上而下的顺序依次对各节点进行标记,假设,经过标记后,这5个节点的当前标记值分别为0、1、3、2和4。将A节点的当前标记值发送给B节点,将B节点的当前标记值发送给A节点和C节点,将C节点的当前标记值发送给B节点、D节点和E节点,将D节点的当前标记值发送给C节点,将E节点的当前标记值发送给C节点。对于A节点而言,由于其自身的当前标记值为0,而接收的B节点的当前标记值为1,因此,A节点的当前标记值仍然为0。对于B节点而言,由于其自身的当前标记值为1,而接收的A节点的当前标记值为0,因此,B节点的当前标记值由1变为0,以此类推,如图4-2所示,经过第一次更新后,B节点的当前标记值由1变为0,C节点的当前标记值由3变为1,D节点的当前标记值仍然为2,E节点的当前标记值由4变为3。
由于B节点、C节点和E节点的当前标记值发生了变化,继续将各节点的当前标记值发送给具有连接关系的其它节点,并第二次更新各节点的当前标记值,如图4-3所示,经过第二次更新后,C节点的当前标记值由1变为0,D节点的当前标记值由2变为1,E节点的当前标记值由3变为1,A节点和B节点的当前标记值没有发生改变,仍然为0。
由于C节点、D节点和E节点的当前标记值发生了变化,继续将各节点的当前标记值发送给具有连接关系的其它节点,并第三次更新各节点的当前标记值。如图4-4所示,经过第三次更新后,D节点的当前标记值由1变为0,E节点的当前标记值由1变为0,其它节点的当前标记值没有发生改变,仍然为0。
由于D节点和E节点的当前标记值发生了变化,继续将各节点的当前标记值发送给具有连接关系的其它节点,并第四次更新各节点的当前标记值。经过第四次更新后,所有节点的当前标记值均没有发生改变,仍然为0,结束更新过程。此时,A-E节点为拥有相同标记值的节点,其构成一个连通分量。,以上采用的是图论中的标记扩散方法来寻找具有相同标记值的节点,在图论中,这些具有相同标记值的节点就是连通图中的一个连通分量。该连通分量中由所有账号节点对应的账号构成与同一个网站用户绑定的账号群体。例如,假设图4中的A节点和C节点为用户标识节点,B节点、D节点和E节点为账号节点,那么,B节点、D节点和E节点对应的账号构成一个账号群体,该账号群体与同一个网站用户绑定,也就是说,该账号群体标识了同一个网站用户。并且,通过图论的理论得到的账号群体中可能不仅包括直接关联的账号,还包括间接关联的账号。所谓直接关联的账号为关联相同的用户标识的一组账号,所谓间接关联的账号为对于帐号A和帐号B来说,如果能找到一系列帐号X1,X2,..Xm(m≥1),使得A与X1直接关联,Xi与Xi+1(1≤i≤n-1)直接关联,Xm与B直接关联,则A与B是间接关联帐号。
步骤104:计算所述账号群体的账号密度和账号欺诈关闭率;
其中,通过如下方式计算一个账号群体的账号密度:
统计在所述账号群体中所有账号的总个数,以及所有账号对应的账号节点的节点度数之和;
按照公式计算所述账号密度,n为在所述账号群体中所有账号的总个数。
在图论中,一个节点的节点度数即为与该节点相连接的节点个数。例如,在图4中,与A节点相连接的只有B节点,也就是说,与A节点相连接的节点个数为1,A节点的节点度数就为1。与B节点相连接的有A节点和C节点,也就是说,与A节点相连接的节点个数为2,B节点的节点度数就为2。
通过如下方式计算一个账号群体的账号欺诈关闭率:
统计在所述账号群体中所有账号的总个数,以及因欺诈和/或疑似欺诈而关闭的账号个数;
计算在所述账号群体中因欺诈和/或疑似欺诈而关闭的账号个数与所有账号的总个数的比值,所述比值为所述账号群体的账号欺诈关闭率。
在网站的监控系统中,会对所有账号的行为进行监控,如果发现某个账号实施了欺诈行为,会将该账号作为欺诈账号而关闭。如果通过行为分析发现某个账号的行为异常,会将该账号作为疑似欺诈账号而关闭。并且,系统会将这些因欺诈和疑似欺诈而关闭的账号进行标记。在本发明中,可通过标记直接识别出在一个账号群体中有哪些账号是因欺诈和疑似欺诈而关闭的账号,并统计其数量。
步骤105:判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内,如果是,进入步骤106,否则,进入步骤107;
步骤106:将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,结束流程。
步骤107:将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户,结束流程。
这里,可以预先通过试验,计算在与已知为一个危险的网站用户绑定的所有账号的账号密度。并利用样本统计方法确定一个平均值,将该平均值作为账号密度的正常数值范围。同理,也可确定账号欺诈关闭率的正常数值范围。
在实际应用中,可根据账号群体中所有账号的总个数,设置不同的正常数值范围。例如,当账号群体中所有账号的总个数在闭区间[5,2000]的范围内时,可将账号密度的正常数值范围设定为闭区间[05,1],将账号欺诈关闭率的正常值范围设定为左闭右开区间[0.1,1)。当然,当账号群体中所有账号的总个数在其它范围内时,还可以将账号密度的正常数值范围以及账号欺诈关闭率的正常数值范围设定为其它区间值。本发明对账号密度的正常数值范围和账号欺诈关闭率的正常数值范围的具体区间值不进行限定。
在确定某个账号群体为危险账号群体时,可以认为该危险账号群体中的所有账号都具有欺诈性。而该危险账号群体中的所有账号与同一个网站用户绑定,该网站用户是危险的网站用户。系统可以对危险账号群体中的所有账号进行重点监视,必要时还可以关闭该账号。
由上述实施例可以看出,对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,从而全面并准确地识别出一个网站用户。并且,当服务器利用图论原理查找上述账号群体时,并不需要在所有的账号和用户标识中一一进行查找,节省了服务器的工作量,也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户,通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户,可以实现提前预防欺诈事件发生的目的。
实施例二
当确定某一个账号群体为危险网站账号群体,在该危险账号群体中,有可能某些账号是被盗的账号,而这些账号并不具有欺诈性。为了能在危险账号群体中更好地区分哪些账号是更具有欺诈性的,本实施例在实施例一的基础上,进一步从连通分量中识别出危险用户标识,与该危险用户标识关联的账号被最终确定为危险账号。请参阅图5,其为本发明一种识别网站用户的方法的另一个实施例流程图,该方法包括以下步骤:
步骤501:从数据库中获取账号和用户标识;
步骤502:通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
步骤503:在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
步骤504:计算所述账号群体的账号密度和账号欺诈关闭率;
步骤505:判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内,如果是,进入步骤506,否则,进入步骤507;
步骤506:将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,执行步骤508;
步骤507:将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户,结束流程。
上述步骤501-步骤507的执行过程可以参见实施例一中的步骤101-107,由于该执行过程已经在实施例一中进行了详细地描述,故此处不摘赘述。
步骤508:计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
例如,在图4所示的连通分量中,当由所有账号节点对应的账号构成的账号群体被确定为危险账号群体时,计算图4所示的连通分量中用户标识节点对应的用户标识的标识欺诈关闭率。
其中,通过以下方式计算标识欺诈关闭率:
统计在所述账号群体中与所述用户标识关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;
计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
步骤509:判断所述标识欺诈关闭率是否在预设的正常数据范围内,如果是,进入步骤510,否则,进入步骤511;
步骤510:将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号,结束流程。
步骤511:将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号,结束流程。
这里,可以预先通过试验,在与已知为一个危险的网站用户绑定的账号中,计算与这些账号关联的用户标识的标识欺诈关闭率。并利用样本统计方法确定一个平均值,将该平均值作为标识欺诈关闭率的正常数值范围。
在实际应用中,可根据账号群体的账号欺诈关闭率和在该账号群体中与用户标识关联的账号总个数,设置不同的正常数值范围。例如,当账号群体的账号关闭率大于0.2时,如果在该账号群体中与用户标识关联的账号总个数大于100,可将标识欺诈关闭率的正常数值范围设置为大于0.2的值,如果在该账号群体中与用户标识关联的账号总个数在闭区间[5,100]范围内,可将标识欺诈关闭率的正常数据范围设置为大于0.5的值。当然,当账号群体的账号欺诈关闭率以及在该账号群体中与用户标识关联的账号总个数在其它范围内时,还可以将标识欺诈关闭率的正常数值范围设定为其它值。本发明对标识欺诈关闭率的正常数值范围的具体区间值不进行限定。
由上述实施例可以看出,对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,从而全面并准确地识别出一个网站用户。并且,当服务器利用图论原理查找上述账号群体时,并不需要在所有的账号和用户标识中一一进行查找,节省了服务器的工作量,也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户,通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户,可以实现提前预防欺诈事件发生的目的。
而且,还能在危险账号群体中更好地区分哪些账号是更具有欺诈性的。
实施例三
除了利用实施例一中账号密度和账号欺诈关闭率来确定一个账号群体是否为一个危险的账号群体之外,也可以通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号来确定其是否为一个危险的账号群体。请参阅图6,其为本发明一种标识网站用户的方法的另一个实施例流程图,包括以下步骤:
步骤601:从数据库中获取账号和用户标识;
不厚602:通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
步骤603:在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
上述步骤601-603的执行过程可以参见实施例一中的步骤101-103,由于该执行过程已经在实施例一中进行了详细地描述,故此处不摘赘述。
步骤604:判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号,如果是,进入步骤605,否则,进入步骤606;
在网站的监控系统中,会对所有账号的行为进行监控,如果发现某个账号实施了欺诈行为,会将该账号作为欺诈账号而关闭。如果通过行为分析发现某个账号的行为异常,会将该账号作为疑似欺诈账号而关闭。并且,系统会将这些因欺诈和疑似欺诈而关闭的账号进行标记。在本发明中,可通过标记直接识别出在一个账号群体中有哪些账号是因欺诈和疑似欺诈而关闭的账号。
步骤605:将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,结束流程。
步骤606:将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户,结束流程。
由上述实施例可以看出,对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,从而全面并准确地识别出一个网站用户。并且,当服务器利用图论原理查找上述账号群体时,并不需要在所有的账号和用户标识中一一进行查找,节省了服务器的工作量,也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户,通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号,而识别出这个网站用户是否为一个危险的网站用户。
实施例四
与上述实施例一中的一种标识网站用户的方法相对应,本发明实施例还提供了一种标识网站用户装置。请参阅图7,其为本发明一种标识网站用户的装置的一个实施例结构图,该装置包括获取模块701、建立模块702、查找模块703、第一参数计算模块704、第一参数判断模块705和第一网站用户识别模块706。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
获取模块701,用于从数据库中获取账号和用户标识;
建立模块702,用于通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
查找模块703,用于在所述连通图中查找连通分量,所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体;
第一参数计算模块704,用于计算所述账号群体的账号密度和账号欺诈关闭率;
第一参数判断模块705,用于判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内;
第一网站用户识别模块706,用于当第一参数判断模块的判断结果为是时,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
优选的,如图8所示,查找模块703包括:
比较子模块7032,用于比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小;
选取子模块,用于选取最小的标记值作为所述各节点的当前标记值;
第一判断子模块7033,用于判断是否至少有一个节点的当前标记值发生了变化;
重复子模块7034,用于当所述第一判断子模块的判断结果为是时,触发比较子模块继续比较连通图中的各节点的当前标记值和具有连接关系的其它节点的当前标记值大小;
提取子模块7035,用于当所述第一判断子模块的判断结果为否时,从连通图中提取拥有相同标记值的节点为一个连通分量。
优选的,第一参数计算模块704包括:
第一统计子模块,用于统计在所述账号群体中所有账号的总个数,以及所有账号对应的账号节点的节点度数之和;
密度计算子模块,用于按照公式计算所述账号密度,n为在所述账号群体中所有账号的总个数。
优选的,第一参数计算模块704包括:
第二统计子模块,用于统计在所述账号群体中所有账号的总个数、以及因欺诈和/或疑似欺诈而关闭的账号个数;
账号欺诈关闭率计算子模块,用于计算在所述账号群体中因欺诈和/或疑似欺诈而关闭的账号个数与所有账号的总个数的比值,所述比值为所述账号群体的账号欺诈关闭率。
进一步优选的,如图9所示,在图8所示的结构基础上,该装置还包括:
第二参数计算模块707,用于计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
第二参数判断模块708,用于判断所述标识欺诈关闭率是否在预设的正常数据范围内;
用户标识识别模块709,用于当所述第二参数判断模块的判断结果为是时,将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号,否则,将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号。
其中,优选的,第二参数计算模块707包括:
第三统计子模块,用于统计在所述账号群体中与所述用户标识关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;
标识欺诈关闭率计算子模块,用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
由上述实施例可以看出,对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,从而全面并准确地识别出一个网站用户。并且,当服务器利用图论原理查找上述账号群体时,并不需要在所有的账号和用户标识中一一进行查找,节省了服务器的工作量,也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户,通过计算这个账号群体的账号密度和账号欺诈关闭率预先识别出这个网站用户是否为一个危险的网站用户,可以实现提前预防欺诈事件发生的目的。
而且,还能在危险账号群体中更好地区分哪些账号是更具有欺诈性的。
实施例五
与上述实施例三中的一种标识网站用户的方法相对应,本发明实施例还提供了一种标识网站用户装置。请参阅图10,其为本发明一种标识网站用户的装置的另一个实施例结构图,该装置包括获取模块1001、建立模块1002、查找模块1003、判断模块1004、第二网站用户识别模块1005。下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
获取模块1001,用于从数据库中获取账号和用户标识;
建立模块1002,用于通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
查找模块1003,用于在所述连通图中查找连通分量,所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体;
判断模块1004,用于判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号;
第二网站用户识别模块1005,用于当判断模块的判断结果为是时,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
优选的,查找模块1003包括:
比较子模块,用于比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小;
选取子模块,用于选取最小的标记值作为所述各节点的当前标记值;
第一判断子模块,用于判断是否至少有一个节点的当前标记值发生了变化;
重复子模块,用于当所述第一判断子模块的判断结果为是时,触发比较子模块继续比较连通图中的各节点的当前标记值和具有连接关系的其它节点的当前标记值大小;
提取子模块,用于当所述第一判断子模块的判断结果为否时,从连通图中提取拥有相同标记值的节点为一个连通分量。
进一步优选的,在图10所示的结构基础上,该装置还包括:
第二参数计算模块,用于计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
第二参数判断模块,用于判断所述标识欺诈关闭率是否在预设的正常数据范围内;
用户标识识别模块,用于当所述第二参数判断模块的判断结果为是时,将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号,否则,将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号。
其中,优选的,第二参数计算模块包括:第三统计子模块,用于统计在所述账号群体中与所述用户标识关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;标识欺诈关闭率计算子模块,用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识节点关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
由上述实施例可以看出,对于数据库中存在的海量账号和用户标识,利用图论原理,从中找到直接关联和间接关联的账号,而由这些账号以及与这些账号关联的用户标识所构成的账号群体是属于一个网站用户的,从而全面并准确地识别出一个网站用户。并且,当服务器利用图论原理查找上述账号群体时,并不需要在所有的账号和用户标识中一一进行查找,节省了服务器的工作量,也就提高了服务器的处理速度。对于拥有一个账号群体的网站用户,通过判断该账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号,而识别出这个网站用户是否为一个危险的网站用户。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上对本发明所提供的一种识别网站用户的方法和装置进行了详细介绍,本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (20)

1.一种识别网站用户的方法,其特征在于,包括:
从数据库中获取账号和用户标识;
通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
计算所述账号群体的账号密度和账号欺诈关闭率;
判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内;
如果是,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
2.根据权利要求1所述的方法,其特征在于,所述在所述连通图中查找连通分量包括:
比较连通图中各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小;
选取最小的标记值作为所述各节点的当前标记值;
判断是否至少有一个节点的当前标记值发生了变化;
如果是,继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小;
否则,从连通图中提取拥有相同标记值的节点为一个连通分量。
3.根据权利要求1所述的方法,其特征在于,所述计算所述账号群体的账号密度包括:
统计在所述账号群体中所有账号的总个数,以及所有账号对应的账号节点的节点度数之和;
按照公式计算所述账号密度,n为在所述账号群体中所有账号的总个数。
4.根据权利要求1所述的方法,其特征在于,所述计算所述账号群体的账号欺诈关闭率包括:
统计在所述账号群体中所有账号的总个数、以及因欺诈和/或疑似欺诈而关闭的账号个数;
计算在所述账号群体中因欺诈和/或疑似欺诈而关闭的账号个数与所有账号的总个数的比值,所述比值为所述账号群体的账号欺诈关闭率。
5.根据权利要求1-4中任意一项所述的方法,其特征在于,当所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户后,所述方法还包括:
计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
判断所述标识欺诈关闭率是否在预设的正常数据范围内;
如果是,将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号;
否则,将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号。
6.根据权利要求5所述的方法,其特征在于,所述计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率包括:
统计在所述账号群体中与所述用户标识关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;
计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
7.一种识别网站用户的方法,其特征在于,包括:
从数据库中获取账号和用户标识;
通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
在所述连通图中查找连通分量,所述连通分量中所有账号节点对应的账号构成与同一个网站用户绑定的账号群体;
判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号;
如果是,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
8.根据权利要求7所述的方法,其特征在于,所述在所述连通图中查找连通分量包括:
比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小;
选取最小的标记值作为所述各节点的当前标记值;
判断是否至少有一个节点的当前标记值发生了变化,如果是,继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小;
否则,从连通图中提取拥有相同标记值的节点为一个连通分量。
9.根据权利要求7或8所述的方法,其特征在于,当所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户后,所述方法还包括:
计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
判断所述标识欺诈关闭率是否在预设的正常数据范围内;
如果是,将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号;
否则,将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号。
10.根据权利要求9所述的方法,其特征在于,所述计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率包括:
统计在所述账号群体中与所述用户标识节点关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;
计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识节点关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
11.一种识别网站用户的装置,其特征在于,包括:
获取模块,用于从数据库中获取账号和用户标识;
建立模块,用于通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
查找模块,用于在所述连通图中查找连通分量,所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体;
第一参数计算模块,用于计算所述账号群体的账号密度和账号欺诈关闭率;
第一参数判断模块,用于判断所述账号密度和账号欺诈关闭率是否在预设的正常数值范围内;
第一网站用户识别模块,用于当第一参数判断模块的判断结果为是时,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
12.根据权利要求11所述的装置,其特征在于,所述查找模块包括:
比较子模块,用于比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小;
选取子模块,用于选取最小的标记值作为所述各节点的当前标记值;
第一判断子模块,用于判断是否至少有一个节点的当前标记值发生了变化;
重复子模块,用于当所述第一判断子模块的判断结果为是时,触发比较子模块继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小;
提取子模块,用于当所述第一判断子模块的判断结果为否时,从连通图中提取拥有相同标记值的节点为一个连通分量。
13.根据权利要求11所述的装置,其特征在于,所述第一参数计算模块包括:
第一统计子模块,用于统计在所述账号群体中所有账号的总个数,以及所有账号对应的账号节点的节点度数之和;
密度计算子模块,用于按照公式计算所述账号密度,n为在所述账号群体中所有账号的总个数。
14.根据权利要求11所述的装置,其特征在于,所述第一参数计算模块包括:
第二统计子模块,用于统计在所述账号群体中所有账号的总个数、以及因欺诈和/或疑似欺诈而关闭的账号个数;
账号欺诈关闭率计算子模块,用于计算在所述账号群体中因欺诈和/或疑似欺诈而关闭的账号个数与所有账号的总个数的比值,所述比值为所述账号群体的账号欺诈关闭率。
15.根据权利要求11-14中任意一项所述的装置,其特征在于,当所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户后,所述装置还包括:
第二参数计算模块,用于计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
第二参数判断模块,用于判断所述标识欺诈关闭率是否在预设的正常数据范围内;
用户标识识别模块,用于当所述第二参数判断模块的判断结果为是时,将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号,否则,将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号。
16.根据权利要求15所述的装置,其特征在于,所述第二参数计算模块包括:
第三统计子模块,用于统计在所述账号群体中与所述用户标识关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;
标识欺诈关闭率计算子模块,用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
17.一种识别网站用户的装置,其特征在于,包括:
获取模块,用于从数据库中获取账号和用户标识;
建立模块,用于通过将所述账号和用户标识作为节点,并连接具有关联关系的账号节点和用户标识节点的方式,建立连通图;
查找模块,用于在所述连通图中查找连通分量,所述连通分量中的所有节点对应的账号和用户标识构成与同一个网站用户绑定的账号群体;
判断模块,用于判断所述账号群体中是否存在因欺诈和/或疑似欺诈而关闭的账号;
第二网站用户识别模块,用于当判断模块的判断结果为是时,将所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户,否则,将所述账号群体确定为正常账号群体,与所述正常账号群体绑定的网站用户为正常的网站用户。
18.根据权利要求17所述的方法,其特征在于,所述查找模块包括:
比较子模块,用于比较连通图中的各节点的当前标记值和与所述各节点具有连接关系的其它节点的当前标记值的大小;
选取子模块,用于选取最小的标记值作为所述各节点的当前标记值;
第一判断子模块,用于判断是否至少有一个节点的当前标记值发生了变化;
重复子模块,用于当所述第一判断子模块的判断结果为是时,触发比较子模块继续比较连通图中各节点的当前标记值和具有连接关系的其它节点的当前标记值大小;
提取子模块,用于当所述第一判断子模块的判断结果为否时,从连通图中提取拥有相同标记值的节点为一个连通分量。
19.根据权利要求17或18所述的装置,其特征在于,当所述账号群体确定为危险账号群体,与所述危险账号群体绑定的网站用户为危险的网站用户后,所述装置还包括:
第二参数计算模块,用于计算所述连通分量中用户标识节点对应的用户标识的标识欺诈关闭率;
第二参数判断模块,用于判断所述标识欺诈关闭率是否在预设的正常数据范围内;
用户标识识别模块,用于当所述第二参数判断模块的判断结果为是时,将所述用户标识确定为危险用户标识,与所述危险用户标识关联的账号为危险账号,否则,将所述用户标识确定为正常用户标识,与所述正常用户标识关联的账号为正常账号。
20.根据权利要求19所述的装置,其特征在于,所述第二参数计算模块包括:
第三统计子模块,用于统计在所述账号群体中与所述用户标识关联的账号总个数,以及在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数;
标识欺诈关闭率计算子模块,用于计算在所述与用户标识关联的账号总个数中因欺诈和/或疑似欺诈而关闭的账号个数与在所述账号群体中与所述用户标识节点关联的账号总个数的比值,所述比值为用户标识的标识欺诈关闭率。
CN201310011312.8A 2013-01-11 2013-01-11 一种识别网站用户的方法和装置 Active CN103927307B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201310011312.8A CN103927307B (zh) 2013-01-11 2013-01-11 一种识别网站用户的方法和装置
TW102122363A TWI591508B (zh) 2013-01-11 2013-06-24 Methods and devices for identifying website users
EP14701880.8A EP2943925A4 (en) 2013-01-11 2014-01-10 METHOD AND APPARATUS FOR IDENTIFYING A WEBSITE USER
PCT/US2014/011045 WO2014110370A2 (en) 2013-01-11 2014-01-10 Method and apparatus of identifying a website user
US14/152,463 US9639844B2 (en) 2013-01-11 2014-01-10 Method and apparatus of identifying a website user
JP2015552803A JP6321681B2 (ja) 2013-01-11 2014-01-10 ウェブサイトユーザを識別する方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310011312.8A CN103927307B (zh) 2013-01-11 2013-01-11 一种识别网站用户的方法和装置

Publications (2)

Publication Number Publication Date
CN103927307A true CN103927307A (zh) 2014-07-16
CN103927307B CN103927307B (zh) 2017-03-01

Family

ID=50029279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310011312.8A Active CN103927307B (zh) 2013-01-11 2013-01-11 一种识别网站用户的方法和装置

Country Status (6)

Country Link
US (1) US9639844B2 (zh)
EP (1) EP2943925A4 (zh)
JP (1) JP6321681B2 (zh)
CN (1) CN103927307B (zh)
TW (1) TWI591508B (zh)
WO (1) WO2014110370A2 (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224606A (zh) * 2015-09-02 2016-01-06 新浪网技术(中国)有限公司 一种用户标识的处理方法及装置
CN105227352A (zh) * 2015-09-02 2016-01-06 新浪网技术(中国)有限公司 一种用户标识集的更新方法及装置
CN105391594A (zh) * 2014-09-03 2016-03-09 阿里巴巴集团控股有限公司 识别特征账号的方法及装置
CN105447028A (zh) * 2014-08-27 2016-03-30 阿里巴巴集团控股有限公司 识别特征账号的方法及装置
CN105550307A (zh) * 2015-12-14 2016-05-04 北京锐安科技有限公司 一种网民身份关系网络图的生成方法
WO2016090748A1 (zh) * 2014-12-08 2016-06-16 深圳市华傲数据技术有限公司 虚拟人建立方法及装置
CN105719033A (zh) * 2014-12-02 2016-06-29 阿里巴巴集团控股有限公司 用于识别客体风险的方法及装置
CN105812195A (zh) * 2014-12-30 2016-07-27 阿里巴巴集团控股有限公司 计算机识别批量账户的方法和装置
CN105991621A (zh) * 2015-03-04 2016-10-05 深圳市腾讯计算机系统有限公司 一种安全检测方法及服务器
CN106055561A (zh) * 2016-05-18 2016-10-26 微梦创科网络科技(中国)有限公司 一种防止网络用户恶意操作的方法及装置
CN106302331A (zh) * 2015-05-22 2017-01-04 阿里巴巴集团控股有限公司 一种名单扩展方法和设备
CN106548376A (zh) * 2016-10-27 2017-03-29 北京锐安科技有限公司 一种数据分析方法和装置
CN106682906A (zh) * 2015-11-10 2017-05-17 阿里巴巴集团控股有限公司 一种风险识别、业务处理方法和设备
CN106844752A (zh) * 2017-02-16 2017-06-13 中电海康集团有限公司 一种基于数据关联网络模型的实体关系搜索方法及装置
CN107018115A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 账户处理方法和装置
CN107194623A (zh) * 2017-07-20 2017-09-22 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
CN107193894A (zh) * 2017-05-05 2017-09-22 北京小度信息科技有限公司 数据处理方法、个体识别方法及相关装置
CN107896220A (zh) * 2017-11-30 2018-04-10 成都航天科工大数据研究院有限公司 一种基于多租户的云平台租户管理方法及实现该方法的工业物联云平台
CN107992738A (zh) * 2017-11-16 2018-05-04 北京奇艺世纪科技有限公司 一种账号登录异常检测方法、装置及电子设备
CN108171519A (zh) * 2016-12-07 2018-06-15 阿里巴巴集团控股有限公司 业务数据的处理、账户识别方法及装置、计算机终端
CN108295476A (zh) * 2018-03-06 2018-07-20 网易(杭州)网络有限公司 确定异常交互账户的方法和装置
CN108536831A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于多参数的用户识别系统及方法
CN109091871A (zh) * 2018-09-17 2018-12-28 网易(杭州)网络有限公司 游戏外挂玩家检测方法和装置
CN110677309A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 人群聚类方法及系统、终端以及计算机可读存储介质
CN111701247A (zh) * 2020-07-13 2020-09-25 腾讯科技(深圳)有限公司 用于确定统一账号的方法和设备
CN112491819A (zh) * 2017-06-26 2021-03-12 创新先进技术有限公司 识别目标团伙的方法和装置
CN113591088A (zh) * 2021-07-30 2021-11-02 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10033737B2 (en) * 2013-10-10 2018-07-24 Harmon.Ie R&D Ltd. System and method for cross-cloud identity matching
CN106301978A (zh) * 2015-05-26 2017-01-04 阿里巴巴集团控股有限公司 团伙成员账号的识别方法、装置及设备
CN106372977B (zh) * 2015-07-23 2019-06-07 阿里巴巴集团控股有限公司 一种虚拟账户的处理方法和设备
US11587100B2 (en) 2018-07-25 2023-02-21 Ebay Inc. User interface for fraud detection system
CN109347787B (zh) * 2018-08-15 2020-08-04 阿里巴巴集团控股有限公司 一种身份信息的识别方法及装置
US20210334811A1 (en) * 2018-12-21 2021-10-28 Paypal, Inc. System and Method for Fraudulent Scheme Detection using Time-Evolving Graphs
CN111932131B (zh) * 2020-08-12 2024-03-15 上海冰鉴信息科技有限公司 业务数据处理方法及装置
CN112463065A (zh) * 2020-12-10 2021-03-09 恩亿科(北京)数据科技有限公司 一种账号打通的计算方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7458508B1 (en) * 2003-05-12 2008-12-02 Id Analytics, Inc. System and method for identity-based fraud detection
WO2011041610A1 (en) * 2009-09-30 2011-04-07 Zynga Game Network Inc. Apparatuses, methods and systems for a trackable virtual currencies platform
CN102056189A (zh) * 2009-10-28 2011-05-11 中国移动通信集团广东有限公司 一种客户网络行为数据重构方法及装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136595A1 (en) * 1998-12-08 2006-06-22 Ramakrishna Satyavolu Network-based verification and fraud-prevention system
US7610216B1 (en) 2000-07-13 2009-10-27 Ebay Inc. Method and system for detecting fraud
JP4071023B2 (ja) 2002-03-26 2008-04-02 日立オムロンターミナルソリューションズ株式会社 自動取引装置
US20040078325A1 (en) * 2002-10-21 2004-04-22 International Business Machines Corporation Managing activation/deactivation of transaction accounts enabling temporary use of those accounts
US7562814B1 (en) * 2003-05-12 2009-07-21 Id Analytics, Inc. System and method for identity-based fraud detection through graph anomaly detection
US10999298B2 (en) 2004-03-02 2021-05-04 The 41St Parameter, Inc. Method and system for identifying users and detecting fraud by use of the internet
US7853533B2 (en) * 2004-03-02 2010-12-14 The 41St Parameter, Inc. Method and system for identifying users and detecting fraud by use of the internet
US20060149674A1 (en) * 2004-12-30 2006-07-06 Mike Cook System and method for identity-based fraud detection for transactions using a plurality of historical identity records
JP4954979B2 (ja) 2005-04-29 2012-06-20 オラクル・インターナショナル・コーポレイション 詐欺監視、検出、および階層状ユーザ認証のためのシステムおよび方法
US20070112667A1 (en) 2005-10-31 2007-05-17 Dun And Bradstreet System and method for providing a fraud risk score
US8069084B2 (en) * 2006-07-14 2011-11-29 Wells Fargo Bank, N.A. Customer controlled account, system, and process
US8359278B2 (en) * 2006-10-25 2013-01-22 IndentityTruth, Inc. Identity protection
US20090192810A1 (en) 2008-01-28 2009-07-30 Parascript, Llc Fraud detection system & method
US8489476B1 (en) * 2008-06-30 2013-07-16 United States Automobile Association (USAA) Data manager for suspicious activity monitor
US8069210B2 (en) * 2008-10-10 2011-11-29 Microsoft Corporation Graph based bot-user detection
US20100169137A1 (en) 2008-12-31 2010-07-01 Ebay Inc. Methods and systems to analyze data using a graph
US8386381B1 (en) * 2009-12-16 2013-02-26 Jpmorgan Chase Bank, N.A. Method and system for detecting, monitoring and addressing data compromises
US9785943B2 (en) * 2010-03-25 2017-10-10 Mastercard International Incorporated Methods for risk management in payment device system
US8306889B2 (en) 2010-10-20 2012-11-06 Fis Financial Compliance Solutions, Llc System and method for presenting fraud detection information
US9785988B2 (en) 2010-11-24 2017-10-10 Digital River, Inc. In-application commerce system and method with fraud prevention, management and control
US20120197802A1 (en) * 2011-01-28 2012-08-02 Janet Smith Method and system for determining fraud in a card-not-present transaction
US20120239541A1 (en) * 2011-03-18 2012-09-20 Clairmail, Inc. Actionable alerting
US9129321B2 (en) 2011-04-29 2015-09-08 Visa International Service Association Fraud detection system audit capability
US8856922B2 (en) 2011-11-30 2014-10-07 Facebook, Inc. Imposter account report management in a social networking system
US20130332358A1 (en) 2012-06-12 2013-12-12 Ebay, Inc. Fraud detection system
US8725636B1 (en) * 2012-10-22 2014-05-13 Trusteer Ltd. Method for detecting fraudulent money transfer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7458508B1 (en) * 2003-05-12 2008-12-02 Id Analytics, Inc. System and method for identity-based fraud detection
WO2011041610A1 (en) * 2009-09-30 2011-04-07 Zynga Game Network Inc. Apparatuses, methods and systems for a trackable virtual currencies platform
CN102056189A (zh) * 2009-10-28 2011-05-11 中国移动通信集团广东有限公司 一种客户网络行为数据重构方法及装置

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447028A (zh) * 2014-08-27 2016-03-30 阿里巴巴集团控股有限公司 识别特征账号的方法及装置
CN105447028B (zh) * 2014-08-27 2019-06-28 阿里巴巴集团控股有限公司 识别特征账号的方法及装置
CN105391594A (zh) * 2014-09-03 2016-03-09 阿里巴巴集团控股有限公司 识别特征账号的方法及装置
CN105391594B (zh) * 2014-09-03 2018-11-02 阿里巴巴集团控股有限公司 识别特征账号的方法及装置
CN105719033A (zh) * 2014-12-02 2016-06-29 阿里巴巴集团控股有限公司 用于识别客体风险的方法及装置
CN105719033B (zh) * 2014-12-02 2019-12-13 阿里巴巴集团控股有限公司 用于识别客体风险的方法及装置
WO2016090748A1 (zh) * 2014-12-08 2016-06-16 深圳市华傲数据技术有限公司 虚拟人建立方法及装置
CN105812195B (zh) * 2014-12-30 2019-05-07 阿里巴巴集团控股有限公司 计算机识别批量账户的方法和装置
CN105812195A (zh) * 2014-12-30 2016-07-27 阿里巴巴集团控股有限公司 计算机识别批量账户的方法和装置
CN105991621B (zh) * 2015-03-04 2019-12-13 深圳市腾讯计算机系统有限公司 一种安全检测方法及服务器
CN105991621A (zh) * 2015-03-04 2016-10-05 深圳市腾讯计算机系统有限公司 一种安全检测方法及服务器
CN106302331A (zh) * 2015-05-22 2017-01-04 阿里巴巴集团控股有限公司 一种名单扩展方法和设备
CN105224606A (zh) * 2015-09-02 2016-01-06 新浪网技术(中国)有限公司 一种用户标识的处理方法及装置
CN105227352A (zh) * 2015-09-02 2016-01-06 新浪网技术(中国)有限公司 一种用户标识集的更新方法及装置
CN105224606B (zh) * 2015-09-02 2019-04-02 新浪网技术(中国)有限公司 一种用户标识的处理方法及装置
CN105227352B (zh) * 2015-09-02 2019-03-19 新浪网技术(中国)有限公司 一种用户标识集的更新方法及装置
CN106682906A (zh) * 2015-11-10 2017-05-17 阿里巴巴集团控股有限公司 一种风险识别、业务处理方法和设备
CN106682906B (zh) * 2015-11-10 2021-03-19 创新先进技术有限公司 一种风险识别、业务处理方法和设备
CN105550307B (zh) * 2015-12-14 2019-07-30 北京锐安科技有限公司 一种网民身份关系网络图的生成方法
CN105550307A (zh) * 2015-12-14 2016-05-04 北京锐安科技有限公司 一种网民身份关系网络图的生成方法
CN107018115B (zh) * 2016-01-27 2020-02-18 阿里巴巴集团控股有限公司 账户处理方法和装置
CN107018115A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 账户处理方法和装置
CN106055561B (zh) * 2016-05-18 2019-11-29 微梦创科网络科技(中国)有限公司 一种防止网络用户恶意操作的方法及装置
CN106055561A (zh) * 2016-05-18 2016-10-26 微梦创科网络科技(中国)有限公司 一种防止网络用户恶意操作的方法及装置
CN106548376A (zh) * 2016-10-27 2017-03-29 北京锐安科技有限公司 一种数据分析方法和装置
CN108171519A (zh) * 2016-12-07 2018-06-15 阿里巴巴集团控股有限公司 业务数据的处理、账户识别方法及装置、计算机终端
CN106844752A (zh) * 2017-02-16 2017-06-13 中电海康集团有限公司 一种基于数据关联网络模型的实体关系搜索方法及装置
CN107193894A (zh) * 2017-05-05 2017-09-22 北京小度信息科技有限公司 数据处理方法、个体识别方法及相关装置
CN107193894B (zh) * 2017-05-05 2020-06-16 北京星选科技有限公司 数据处理方法、个体识别方法及相关装置
CN112491819B (zh) * 2017-06-26 2022-09-20 创新先进技术有限公司 识别目标团伙的方法和装置
CN112491819A (zh) * 2017-06-26 2021-03-12 创新先进技术有限公司 识别目标团伙的方法和装置
CN107194623B (zh) * 2017-07-20 2021-01-05 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
CN107194623A (zh) * 2017-07-20 2017-09-22 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
CN107992738A (zh) * 2017-11-16 2018-05-04 北京奇艺世纪科技有限公司 一种账号登录异常检测方法、装置及电子设备
CN107992738B (zh) * 2017-11-16 2020-11-27 北京奇艺世纪科技有限公司 一种账号登录异常检测方法、装置及电子设备
CN107896220A (zh) * 2017-11-30 2018-04-10 成都航天科工大数据研究院有限公司 一种基于多租户的云平台租户管理方法及实现该方法的工业物联云平台
CN108295476B (zh) * 2018-03-06 2021-12-28 网易(杭州)网络有限公司 确定异常交互账户的方法和装置
CN108295476A (zh) * 2018-03-06 2018-07-20 网易(杭州)网络有限公司 确定异常交互账户的方法和装置
CN108536831A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于多参数的用户识别系统及方法
CN110677309A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 人群聚类方法及系统、终端以及计算机可读存储介质
CN110677309B (zh) * 2018-07-03 2021-12-14 百度在线网络技术(北京)有限公司 人群聚类方法及系统、终端以及计算机可读存储介质
CN109091871A (zh) * 2018-09-17 2018-12-28 网易(杭州)网络有限公司 游戏外挂玩家检测方法和装置
CN111701247A (zh) * 2020-07-13 2020-09-25 腾讯科技(深圳)有限公司 用于确定统一账号的方法和设备
CN113591088A (zh) * 2021-07-30 2021-11-02 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备
CN113591088B (zh) * 2021-07-30 2023-08-29 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备

Also Published As

Publication number Publication date
CN103927307B (zh) 2017-03-01
US20140201048A1 (en) 2014-07-17
WO2014110370A3 (en) 2014-10-23
JP6321681B2 (ja) 2018-05-09
EP2943925A2 (en) 2015-11-18
WO2014110370A2 (en) 2014-07-17
TW201428528A (zh) 2014-07-16
JP2016509300A (ja) 2016-03-24
TWI591508B (zh) 2017-07-11
US9639844B2 (en) 2017-05-02
EP2943925A4 (en) 2016-08-10

Similar Documents

Publication Publication Date Title
CN103927307A (zh) 一种识别网站用户的方法和装置
CN110198310B (zh) 一种网络行为反作弊方法、装置及存储介质
US20240111818A1 (en) Method for training isolation forest, and method for recognizing web crawler
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN112866023B (zh) 网络检测、模型训练方法、装置、设备及存储介质
CN109165691B (zh) 用于识别作弊用户的模型的训练方法、装置及电子设备
CN105550175A (zh) 恶意账户识别方法及装置
CN104750826B (zh) 一种结构化数据资源元数据自动甄别与动态注册方法
CN107679626A (zh) 机器学习方法、装置、系统、存储介质及设备
CN109726737B (zh) 基于轨迹的异常行为检测方法及装置
CN107483381A (zh) 关联账户的监控方法及装置
CN106789837A (zh) 网络异常行为检测方法及检测装置
CN113326991A (zh) 自动授权方法、装置、计算机设备及存储介质
CN106301979B (zh) 检测异常渠道的方法和系统
CN106998336B (zh) 渠道中的用户检测方法和装置
CN106651183A (zh) 工控系统的通信数据安全审计方法及装置
CN116662954A (zh) 统一安全管理平台的异常用户的检测方法和计算机设备
CN115643044A (zh) 数据处理方法、装置、服务器及存储介质
CN111683102B (zh) Ftp行为数据处理方法、识别异常ftp行为的方法及装置
CN113076451B (zh) 异常行为识别和风险模型库的建立方法、装置及电子设备
CN112488562A (zh) 一种业务实现方法及装置
CN113032774A (zh) 异常检测模型的训练方法、装置、设备及计算机存储介质
CN110059480A (zh) 网络攻击行为监控方法、装置、计算机设备及存储介质
CN110580625A (zh) 流通数据监管方法及装置、存储介质、终端
CN112449062B (zh) 恶意扣费的识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1197473

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1197473

Country of ref document: HK