风险团伙的识别方法和装置
技术领域
本说明书涉及人工智能技术领域,尤其涉及一种风险团伙的识别方法和装置。
背景技术
随着互联网金融的快速发展,网络诈骗逐渐兴起,黑产、黑中介等存在安全风险的团伙通过非法手段控制大量用户账号,并利用这些用户账号进行套利,扰乱互联网金融安全。
发明内容
有鉴于此,本说明书提供一种风险团伙的识别方法和装置。
具体地,本说明书是通过如下技术方案实现的:
一种风险团伙的识别方法,包括:
基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数;
从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种;
针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛;
当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
一种风险团伙的识别装置,包括:
图谱构建单元,基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数;
风险提取单元,从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种;
标签迭代单元,针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛;
团伙识别单元,当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
一种风险团伙的识别装置,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,通过读取并执行所述存储器存储的与风险团伙的识别逻辑对应的机器可执行指令,所述处理器被促使:
基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数;
从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种;
针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛;
当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
由以上描述可以看出,本说明书构建包括有用户节点和非用户节点的风险知识图谱,将原本疏离的个人数据进行关联,然后从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,形成失信用户在网络上的风险图。风险图中的各节点可根据邻居节点在度数和关联时间这两个维度上的信息选择一个邻居节点的标签对自身标签进行迭代,并可在带时间聚集性的模块度函数收敛时,根据迭代结果识别出风险团伙,从而实现对风险团伙的识别。
附图说明
图1是本说明书一示例性实施例示出的一种风险团伙的识别方法的流程示意图。
图2是本说明书一示例性实施例示出的一种风险知识图谱示意图。
图3是本说明书一示例性实施例示出的另一种风险知识图谱示意图。
图4是本说明书一示例性实施例示出的一种风险图示意图。
图5是本说明书一示例性实施例示出的另一种风险图示意图。
图6是本说明书一示例性实施例示出的一种标签迭代示意图。
图7是本说明书一示例性实施例示出的一种团伙发展演变过程示意图。
图8是本说明书一示例性实施例示出的一种用于风险团伙的识别装置的一结构示意图。
图9是本说明书一示例性实施例示出的一种风险团伙的识别装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本说明书提供一种风险团伙的识别方案,可根据失信用户的历史行为构建风险知识图谱,然后从该风险知识图谱中提取出匹配预定风险模板的风险图,风险图中的各节点可根据其邻居节点在度数和时间维度上的特征选择一个邻居节点的标签对自身标签进行更新,并可在带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙,从而实现风险团伙的识别。
图1是本说明书一示例性实施例示出的一种风险团伙的识别方法的流程示意图。
所述风险团伙的识别方法可以应用于识别平台,所述识别平台通常由具有识别功能的服务器或服务器集群组成。
请参考图1,所述风险团伙的识别方法可包括以下步骤:
步骤102,基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数。
在本实施例中,所述历史行为可包括支付行为,例如,线上转账、线上代付等。所述历史行为还可包括交互行为,例如,收发即时通信消息、发表评论等。当然,所述历史行为还可包括其他类型的行为,本说明书对此不作特殊限制。
在本实施例中,所述非用户节点可包括:设备节点、地域节点、网络环境节点等。其中,所述设备节点可以是设备ID、设备MAC地址等设备的唯一标识;所述地域节点可以是经纬度坐标、行政区域名称等;所述网络环境节点可以是所处Wi-Fi网络的SSID(Service SetIdentifier,服务集标识)、所使用的IP地址等。
所述非用户节点可代表用户的属性特征,例如设备节点可代表用户使用的设备、地域节点可代表用户所处的地域、网络环境节点可代表用户接入网络时所处的网络环境等。
在本实施例中,风险知识图谱中的每个节点都具有唯一标签。对于用户节点而言,所述标签可以是用户身份证号等与用户唯一对应的标识;对于设备节点而言,所述标签可以是设备的唯一标识;对于地域节点而言,所述标签可以是地域名称等。
当然,在其他例子中,也可以采用其他方式为风险知识图谱中的每个节点指定唯一标签,例如可从1开始顺序为风险知识图谱中的每个节点指定唯一的数字标签:1、2、3…,依次类推。
在本实施例中,当两个节点之间具有关联关系时,可在这两个节点之间构建连边。
例如,用户A给用户B转账,那么可在代表用户A的节点和代表用户B的节点之间构建连通连边。
再例如,用户A接入SSID为123的Wi-Fi网络,那么可在代表用户A的节点和代表SSID为123的节点之间构建连边。
在本实施例中,可为连边增加时间属性,例如可将所述连边表示的关联关系发生时间的时间参数作为所述连边的属性。
其中,所述时间参数可以是最近一次关联关系的发生时间点,例如2018年10月10日;所述时间参数还可以是最近一次关联关系的发生时间点距今的时长,例如1天、5天等。在其他例子中,所述时间参数可以有多个,例如最近三次关联关系的发生时间点等,本说明书对此不作特殊限制。
步骤104,从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种。
在本实施例中,所述风险模板可预先设置。例如,可对历史上的欺诈行为、失信行为等存在风险的行为中用户与用户、用户与设备、用户与网络环境之间的关联关系进行归纳提取,以得到所述风险模板。
例如,所述风险模板可以是失信用户A-失信用户B,表示两个失信用户之间具有关联关系。
再例如,所述风险模板可以是失信用户A-操作设备1-用户B,表示失信用户和普通用户都和操作设备1具有关联关系。
步骤106,针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛。
步骤108,当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
在本实施例中,风险图中各节点可根据其邻居节点的标签对自身标签进行迭代,并可在每轮迭代后,判断带时间聚集性的模块度函数是否收敛,若收敛,则可将风险图中标签相同的节点识别为同一个风险团伙。
上述邻居节点通常是与节点存在连边的节点,即一条连边相连的两个节点互为对方的邻居节点。
在对自身标签进行迭代时,可选择邻居节点度数高、关联关系发生时间近的邻居节点的标签作为目标标签,然后将自身标签更新为所述目标标签,以完成本轮迭代。
上述带时间聚集性的模块度函数在模块度函数的基础上增加时间聚集性信息。一般而言,同一个风险团伙会呈现集中作案的特点,在模块度函数的基础上增加时间聚集性信息,可有效提高风险团伙识别的准确度。
由以上描述可以看出,本说明书构建包括有用户节点和非用户节点的风险知识图谱,将原本疏离的个人数据进行关联,然后从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,形成失信用户在网络上的风险图。风险图中的各节点可根据邻居节点在度数和关联时间这两个维度上的信息选择一个邻居节点的标签对自身标签进行迭代,并可在带时间聚集性的模块度函数收敛时,根据迭代结果识别出风险团伙,从而实现对风险团伙的识别。
下面分别从风险知识图谱的构建、风险图的提取、风险团伙的识别三个方面来描述本说明书的实现过程。
一、风险知识图谱的构建
在本实施例中,可先获取已识别出的失信用户的历史行为。所述失信用户可基于相关技术中的识别方式进行识别,本说明书在此不再一一赘述,所述失信用户可包括诈骗用户、黑产用户等。
在一个例子中,可获取近半年或近1年各个失信用户的历史行为。然后可将所述历史行为中涉及到的用户、设备、网络环境、地域等抽象成风险知识图谱中的节点。
例如,每个用户都是一个节点,可对用户的身份证号、手机号、账号等信息进行加密等处理,并用处理结果作为对应用户节点的标签。
再例如,用户使用的手机、电脑等终端设备也是一个节点,可对终端设备的MAC地址等信息进行加密等处理,并用处理结果作为对应终端设备节点的标签。
又例如,用户接入的Wi-Fi网络也是一个节点,可对该Wi-Fi网络的SSID进行加密等处理,并用处理结果作为对应Wi-Fi网络节点的标签。
在本实施例中,可基于失信用户在历史上的支付行为、交互行为等行为构建风险知识图谱,所述风险知识图谱中节点之间的连边代表相连节点之间具有关联关系,例如:转账关系、好友关系等,所述连边的属性包括对应关联关系的最近一次发生时间点。
举例来说,假设失信用户A在2018年10月10日使用手机a给用户B转账50元,失信用户A最后一次使用手机a是在2018年10月20日,用户B最后一次使用手机b是在2018年10月18日,并且当时手机b接入Wi-Fi网络123,失信用户A和用户B被确认最近一次处在北京市是在2018年10月21日,则根据这些信息可以构建图2所示的风险知识图谱。图2所示的风险知识图谱是有向图,在实际应用中也可以构建无向图,本说明书对此不作特殊限制。
在本实施例中,风险知识图谱中的用户节点分为两类,一类是上述已识别出的失信用户对应的失信用户节点,例如图2所示的用户节点A;另一类与所述失信用户存在关联关系的普通用户对应的普通用户节点,例如图2所示的用户节点B。所述普通用户可能是正常用户,也可能是尚未被识别出的失信用户。
二、风险图的提取
在本实施例中,可汇总历史上已识别出的欺诈行为、失信行为等存在风险的行为,并总结这些行为中用户与用户、用户与设备、用户与网络环境等之间的关联关系,从而提取出风险模板。
所述风险模板通常有多个,每个风险模板都可包括若干模板节点和所述模板节点之间的连边,其中,所述模板节点包括失信用户节点、普通用户节点和非用户节点中的一种或多种。
在一个例子中,所述风险模板可以包括以下三种:
1.失信用户A-用户C
2.失信用户A-失信用户B
3.失信用户A-非用户D-用户C
上述风险模板中的“-”表示两个模板节点之间具有连边,但不限定连边方向,即两个模板节点之间具有关联关系。
以第1个风险模板为例,该风险模板表示失信用户A和用户C之间具有关联关系。
上述失信用户A和失信用户B可以泛指所有失信用户。
上述用户C可以泛指风险知识图谱中的任一用户,可包括失信用户,也可包括普通用户。
上述非用户D可以泛指一类设备,例如移动终端设备、PC设备,也可以泛指Wi-Fi网络等。
上述风险模板仅为示例性的说明,在实际应用中,还可提取其他类型的风险模板,本说明书对此不作特殊限制。
在本实施例中,可提取风险知识图谱中匹配所述风险模板的节点和节点之间的连边,以形成风险图。
例如,可从风险知识图谱中的各个失信用户节点出发,遍历每条连通分支,以判断该连通分支上的节点和节点之间的连边是否匹配所述风险模板。
请参考图3所示的无向风险知识图谱,根据上述三类风险模板,通过提取可得到图4所示的风险图。
三、风险团伙的识别
在本实施例中,风险图中的各个节点可根据其邻居节点的标签对自身标签进行迭代,并可在带时间聚集性的模块度函数收敛时,确定迭代结束,进而可将风险图中标签相同的节点识别为同一个风险团伙。其中用户节点代表风险团伙中的团伙成员,非用户节点代表风险团伙使用的终端设备、Wi-Fi网络、所在地理位置等信息,所述非用户节点也可看作是一种团伙成员。
在进行标签迭代时,可选择邻居节点度数高、关联关系发生时间近的邻居节点的标签作为目标标签,然后将自身标签更新为所述目标标签,以完成本轮迭代。其中,邻居节点度数越高,通常说明该邻居节点越重要;关联关系发生时间越近,通常说明与该邻居节点的联系越紧密。
在一个例子中,当风险图的连边属性是对应关联关系最近一次发生时间的时间点时,可先根据该时间点计算所述关联关系发生时间距今的时长。所述时长的单位可基于应用场景预先指定,例如天、小时等。
根据所述时长和对应邻居节点的度数可计算该邻居节点标签的属性值,并可将属性值满足预定条件的邻居节点标签确定为目标标签,然后将本节点的标签更新为所述目标标签。
请参考图5的风险图示例,该风险图包括6个节点,假设这6个节点的标签分别为1至6。以对节点1的标签进行迭代为例,节点2至节点5是节点1的邻居节点。
邻居节点 |
邻居节点度数 |
关联关系距今的时长 |
节点2 |
1 |
5 |
节点3 |
3 |
2 |
节点4 |
4 |
2 |
节点5 |
2 |
8 |
表1
请参考表1的示例,节点1的各个邻居节点的度数和对应关联关系发生时间距今的时长。在本例中,可构建上述度数和时长的函数来计算邻居节点标签的属性值,例如线性函数等。
举例来说,假设采用x来表示邻居节点的度数,采用y来表示关联关系距今的时长,采用f(x,y)来表示属性值,在一个例子中,f(x,y)=ax+by,其中a和b都是常数。
当a为大于0的常数时,可将b设置为小于0的常数,并可选取f(x,y)最大的邻居节点标签作为目标标签;
当a为小于0的常数时,可将b设置为大于0的常数,并可选取f(x,y)最小的邻居节点标签作为目标标签。
当f(x,y)最大或最小的邻居节点标签有多个时,可在其中随机选择一个作为目标标签。
仍以表1为例,假设节点4的标签的属性值最大,则可将节点1的标签由1更新为4,得到图6所示的风险图。
在本实施例中,在完成一轮迭代后,可判断带时间聚集性的模块度函数是否收敛。
所述带时间聚集性的模块度函数等于同一社区内的连边数量占所有连边数量的比例与对所述连边进行随机分配所得到的概率期望的差值,再减去同一社区内连边的时间聚集性参数。
在一个例子中,可采用如下公式计算带时间聚集性的模块度函数Q:
上述公式中,m表示风险图的连边总数,v和w表示风险图中的节点,α是常数。
A表示风险图的邻接矩阵。当节点v和节点w之间有连边时,Avw=1;当节点v和节点w之间没有连边时,Avw=0。
表示对连边进行随机分配后,节点v和节点w连边数的期望。
当节点v和节点w在同一个社区时,δ(cv,cw)=1;当节点v和节点不在同一个社区时,δ(cv,cw)=0。
T用于表示同一社区内连边的时间聚集性。Tvw可等于节点v和节点w连边的时间参数与社区内部所有连边的时间参数中位数的差值。
以连边的时间参数是对应关联关系最近一次发生时间距今的时长为例,可先将节点v和节点w所属社区内所有连边对应的时长进行排序,然后选取中位数,再使用节点v和节点w连边对应的时长减去所述中位数,得到所述差值。
当然,在其他例子中,也可以采用平均数代替所述中位数,本说明书对此不作特殊限制。
在本实施例中,Tvw越小,说明节点v和节点w所属社区内节点的时间聚集性越高,进而说明当前的社区划分结果越准确。
在本实施例中,可在上述带时间聚集性的模块度函数收敛时,确定迭代结束,进而可以将标签相同的节点识别为同一个风险团伙。
可选的,在其他例子中,当上述带时间聚集性的模块度函数收敛时,还可进一步判断风险图中各节点的标签与上一轮迭代结果是否相同,若相同,则可确定迭代结束,进而可以将标签相同的节点识别为同一个风险团伙;若不相同,则可继续进行迭代,直至风险图中各节点的标签与上一轮迭代结果相同。
本说明书提供的风险团伙识别方案还可支持对风险团伙发展演变过程的识别。
在一个例子中,可根据预定的识别周期采用上述方案进行风险团伙的识别,所述识别周期可预先设置,例如:每天、每3天、每周等,可根据应用场景的特点进行设置。
以识别周期是每天为例,可每天执行一次上述风险团伙的识别方案,针对不同日期识别出的风险团伙,可根据团伙成员的重合情况判断是否为同一个风险团伙。例如,当不同日期识别出的风险团伙具有部分相同节点时,可将这些风险团伙确定为同一个风险团伙,所述部分相同节点是该风险团伙的核心成员。上述团伙成员包括用户节点,也包括非用户节点。
识别日期 |
团伙成员 |
9月1日 |
节点1-节点12,节点25,节点36 |
9月15日 |
节点1-节点20,节点25,节点40-节点60 |
9月30日 |
节点1-节点8,节点25,节点80-节点85 |
表2
请参考表2的示例,表2所示的三个识别周期识别出的风险团伙具有相同的节点:节点1-节点8、节点25,则可确定这三个风险团伙是同一个风险团伙,其核心成员是节点1-节点8以及节点25。
值得注意的是,表2所示的节点标识是能够唯一定位到一个用户或设备的标志信息,例如用户身份证号、设备MAC地址等,不同于前述实施例中可在不同识别周期重复使用的自然数节点标签。
在本实施例中,针对不同识别周期识别出的同一个风险团伙,可分别从对应风险知识图谱中提取所述风险团伙的网络结构图,例如可提取所述风险团伙中各个节点和所述节点之间的连边结构,得到所述网络结构图。
仍以表2的示例为例,可以从9月1日的风险知识图谱中提取节点1-节点12,节点25、节点36和这些节点之间的连边结构,得到对应的网络结构图。还可从9月15日的风险知识图谱中提取节点1-节点20,节点25、节点40-节点60和这些节点之间的连边结构,得到对应的网络结构图。还可从9月30日的风险知识图谱中提取节点1-节点8,节点25、节点80-节点85和这些节点之间的连边结构,得到对应的网络结构图。
在本实施例中,可将不同识别周期识别出的同一个风险团伙的网络结构图通过可视化界面进行对比展示,从而直观展示出该风险团伙的发展演化过程,例如团伙初期、团伙扩张时期、团伙衰落时期等。
可选的,为标注该风险团伙的核心成员,还可为上述风险团伙中相同的节点设置相同的展示属性,所述展示属性可包括:颜色、线条阴影样式等。
请参考图7的示例,图7展示了同一个风险团伙的三个不同时期的成员变化,其中黑色节点是该风险团伙的核心成员,灰色节点不是该风险团伙核心成员。
本实施例对风险团伙进行周期性识别,并可根据共同节点对不同识别周期下的同一个风险团伙进行识别,从而识别出风险团伙的发展变化过程,便于风控人员对不同时期的风险团伙进行区别防控,例如可对发展初期的风险团伙进行重点监督,对处于衰落时期的风险团伙进行持续跟踪等,进一步提高风险团伙的防控效果。
与前述风险团伙的识别方法的实施例相对应,本说明书还提供了风险团伙的识别装置的实施例。
本说明书风险团伙的识别装置的实施例可以应用在服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在服务器的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图8所示,为本说明书风险团伙的识别装置所在服务器的一种硬件结构图,除了图8所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的服务器通常根据该服务器的实际功能,还可以包括其他硬件,对此不再赘述。
图9是本说明书一示例性实施例示出的一种风险团伙的识别装置的框图。
请参考图9,所述风险团伙的识别装置800可以应用在前述图8所示的服务器中,包括有:图谱构建单元801、风险提取单元802、标签迭代单元803、团伙识别单元804和结构展示单元805。
其中,图谱构建单元801,基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数;
风险提取单元802,从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种;
标签迭代单元803,针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛;
团伙识别单元804,当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
可选的,所述风险提取单元802:
遍历从所述风险知识图谱中失信用户节点出发的每条连通分支,判断所述连通分支上的节点及节点之间的连边是否匹配所述风险模板。
可选的,所述标签迭代单元803:
针对所述节点的每个邻居节点,根据所述时间参数确定所述节点与其邻居节点最近一次关联关系的发生时间距今的时长;
根据所述时长和所述度数计算所述邻居节点标签的属性值;
将属性值满足预定条件的邻居节点标签确定为目标标签;
将所述节点的标签更新为所述目标标签。
可选的,所述标签迭代单元803:
将所述时长和所述度数乘以对应的常数后求和,得到所述属性值;
当所述时长对应的常数是负数、所述度数对应的常数是正数时,所述预定条件是属性值最大。
可选的,所述带时间聚集性的模块度函数等于同一社区内的连边数量占所有连边数量的比例与对所述连边进行随机分配所得到的概率期望的差值,再减去同一社区内连边的时间聚集性参数。
可选的,所述同一社区内连边的时间聚集性参数等于所述连边的时间参数与社区内部所有连边的时间参数中位数的差值。
可选的,所述团伙识别单元804:
在当所述带时间聚集性的模块度函数收敛时,判断所述风险图中各节点的标签与上一轮迭代结果是否相同;若相同,则将标签相同的节点识别为同一个风险团伙。
可选的,所述团伙识别单元804:根据预定的识别周期进行风险团伙的识别;当若干不同识别周期识别出的风险团伙具有部分相同节点时,将所述具有部分相同节点的风险团伙识别为同一个风险团伙,将所述部分相同节点识别为所述风险团伙的核心成员。
结构展示单元805,从对应风险知识图谱中提取出所述具有部分相同节点的风险团伙的网络结构图;通过可视化界面对所述网络结构图进行展示。
可选的,每张网络结构图中的所述部分相同节点具有相同的展示属性。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
与前述风险团伙的识别方法的实施例相对应,本说明书还提供一种风险团伙的识别装置,该装置包括:处理器以及用于存储机器可执行指令的存储器。其中,处理器和存储器通常借由内部总线相互连接。在其他可能的实现方式中,所述设备还可能包括外部接口,以能够与其他设备或者部件进行通信。
在本实施例中,通过读取并执行所述存储器存储的与风险团伙的识别逻辑对应的机器可执行指令,所述处理器被促使:
基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数;
从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种;
针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛;
当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
可选的,在从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边时,所述处理器被促使:
遍历从所述风险知识图谱中失信用户节点出发的每条连通分支,判断所述连通分支上的节点及节点之间的连边是否匹配所述风险模板。
可选的,在根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代时,所述处理器被促使:
针对所述节点的每个邻居节点,根据所述时间参数确定所述节点与其邻居节点最近一次关联关系的发生时间距今的时长;
根据所述时长和所述度数计算所述邻居节点标签的属性值;
将属性值满足预定条件的邻居节点标签确定为目标标签;
将所述节点的标签更新为所述目标标签。
可选的,在根据所述时长和所述度数计算所述邻居节点标签的属性值时,所述处理器被促使:
将所述时长和所述度数乘以对应的常数后求和,得到所述属性值;
当所述时长对应的常数是负数、所述度数对应的常数是正数时,所述预定条件是属性值最大。
可选的,所述带时间聚集性的模块度函数等于同一社区内的连边数量占所有连边数量的比例与对所述连边进行随机分配所得到的概率期望的差值,再减去同一社区内连边的时间聚集性参数。
可选的,所述同一社区内连边的时间聚集性参数等于所述连边的时间参数与社区内部所有连边的时间参数中位数的差值。
可选的,当所述带时间聚集性的模块度函数收敛时,所述处理器被促使:
判断所述风险图中各节点的标签与上一轮迭代结果是否相同;
若相同,则将标签相同的节点识别为同一个风险团伙。
可选的,所述处理器还被促使:
根据预定的识别周期进行风险团伙的识别;
当若干不同识别周期识别出的风险团伙具有部分相同节点时,将所述具有部分相同节点的风险团伙识别为同一个风险团伙,将所述部分相同节点识别为所述风险团伙的核心成员。
可选的,所述处理器还被促使:从对应风险知识图谱中提取出所述具有部分相同节点的风险团伙的网络结构图;
通过可视化界面对所述网络结构图进行展示。
可选的,每张网络结构图中的所述部分相同节点具有相同的展示属性。
与前述风险团伙的识别方法的实施例相对应,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:
基于失信用户的历史行为构建风险知识图谱,所述风险知识图谱包括:非用户节点、失信用户节点和与失信用户存在关联关系的普通用户节点,所述非用户节点代表用户的属性特征,所述风险知识图谱中的每个节点都具有唯一标签,节点连边用于表示相连节点之间具有关联关系,所述连边的属性包括用于表示所述关联关系发生时间的时间参数;
从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,以形成风险图,所述风险模板包括若干模板节点和所述模板节点之间的连边,所述模板节点包括非用户节点、失信用户节点和普通用户节点中的一种或多种;
针对所述风险图中的每个节点,根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,并在完成一轮迭代后,判断带时间聚集性的模块度函数是否收敛;
当所述带时间聚集性的模块度函数收敛时,将标签相同的节点识别为同一个风险团伙。
可选的,所述从所述风险知识图谱中提取出匹配风险模板的节点和所述节点之间的连边,包括:
遍历从所述风险知识图谱中失信用户节点出发的每条连通分支,判断所述连通分支上的节点及节点之间的连边是否匹配所述风险模板。
可选的,所述根据其与邻居节点关联关系发生时间的时间参数和所述邻居节点的度数对所述节点的标签进行迭代,包括:
针对所述节点的每个邻居节点,根据所述时间参数确定所述节点与其邻居节点最近一次关联关系的发生时间距今的时长;
根据所述时长和所述度数计算所述邻居节点标签的属性值;
将属性值满足预定条件的邻居节点标签确定为目标标签;
将所述节点的标签更新为所述目标标签。
可选的,所述根据所述时长和所述度数计算所述邻居节点标签的属性值,包括:
将所述时长和所述度数乘以对应的常数后求和,得到所述属性值;
当所述时长对应的常数是负数、所述度数对应的常数是正数时,所述预定条件是属性值最大。
可选的,所述带时间聚集性的模块度函数等于同一社区内的连边数量占所有连边数量的比例与对所述连边进行随机分配所得到的概率期望的差值,再减去同一社区内连边的时间聚集性参数。
可选的,所述同一社区内连边的时间聚集性参数等于所述连边的时间参数与社区内部所有连边的时间参数中位数的差值。
可选的,当所述带时间聚集性的模块度函数收敛时,还包括:
判断所述风险图中各节点的标签与上一轮迭代结果是否相同;
若相同,则将标签相同的节点识别为同一个风险团伙。
可选的,还包括:
根据预定的识别周期进行风险团伙的识别;
当若干不同识别周期识别出的风险团伙具有部分相同节点时,将所述具有部分相同节点的风险团伙识别为同一个风险团伙,将所述部分相同节点识别为所述风险团伙的核心成员。
可选的,还包括:
从对应风险知识图谱中提取出所述具有部分相同节点的风险团伙的网络结构图;
通过可视化界面对所述网络结构图进行展示。
可选的,每张网络结构图中的所述部分相同节点具有相同的展示属性。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。