CN111401959B

CN111401959B - 风险群体的预测方法、装置、计算机设备及存储介质

Info

Publication number: CN111401959B
Application number: CN202010189680.1A
Authority: CN
Inventors: 周家林; 王冬羽; 邵强; 徐克勤; 徐峰; 徐艳飞; 张素华; 杨凯
Original assignee: Multipoint Shenzhen Digital Technology Co ltd
Current assignee: Multipoint Shenzhen Digital Technology Co ltd
Priority date: 2020-03-18
Filing date: 2020-03-18
Publication date: 2023-09-29
Anticipated expiration: 2040-03-18
Also published as: CN111401959A

Abstract

本发明实施例涉及互联网技术领域，提供一种风险群体的预测方法、装置、计算机设备及存储介质，所述方法包括：获取当前交易的第二用户的用户特征序列，其中，第二用户的用户特征序列用于表征第二用户进行当前交易的交易特征；依据第二用户的用户特征序列及每一第一用户的用户特征序列更新关联关系图；从更新后的关联关系图中，以第二用户为起点确定满足预设连通关系的风险群体，本发明实施例能够预测具有关联关系的风险群体。

Description

风险群体的预测方法、装置、计算机设备及存储介质

技术领域

本发明涉及互联网技术领域，具体而言，涉及一种风险群体的预测方法、装置、计算机设备及存储介质。

背景技术

促销和优惠活动是电商吸引用户的有效手段，也是恶意交易用户的主要攻击目标。为了及时识别出进行恶意交易的风险用户，现有技术主要基于各种风险规则及规则的相互组合对风险用户进行识别。

基于风险规则的识别方法难以识别包括相互关联的用户的风险群体。

发明内容

本发明的目的在于提供了一种风险群体的预测方法、装置、计算机设备及存储介质，其能够预测具有关联关系的风险群体。

本发明的实施例可以这样实现：

第一方面，本实施例提供一种风险群体的预测方法，应用于计算机设备，计算机设备存储有表征多个第一用户之间的相似关系的关联关系图，每一第一用户对应一个用于表征该第一用户的交易特征的用户特征序列，所述方法包括：获取当前交易的第二用户的用户特征序列，其中，第二用户的用户特征序列用于表征第二用户进行当前交易的交易特征；依据第二用户的用户特征序列及每一第一用户的用户特征序列更新关联关系图；从更新后的关联关系图中，以第二用户为起点确定满足预设连通关系的风险群体。

第二方面，本实施例提供一种风险群体的预测装置，应用于计算机设备，计算机设备存储有表征多个第一用户之间的相似关系的关联关系图，每一第一用户对应一个用于表征该第一用户的交易特征的用户特征序列，所述装置包括获取模块、更新模块及确定模块，其中，获取模块，用于获取当前交易的第二用户的用户特征序列，其中，第二用户的用户特征序列用于表征第二用户进行当前交易的交易特征；更新模块，用于依据第二用户的用户特征序列及每一第一用户的用户特征序列更新关联关系图；确定模块，用于从更新后的关联关系图中，以第二用户为起点确定满足预设连通关系的风险群体。

第三方面，本实施例提供一种计算机设备，所述计算机设备包括：一个或多个处理器；存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如前述实施方式中任一项所述的风险群体的预测方法。

第四方面，本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如前述实施方式中任一项所述的风险群体的预测方法。

相对于现有技术，本发明实施例提供了一种风险群体的预测方法、装置、计算机设备及存储介质，其能够依据用户的用户特征序列对表征多个用户之间的相似关系的关联关系图进行更新，然后再从更新后的关联关系图中确定风险群体，由此达到识别具有关联关系的风险群体的目的。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例所提供的一种风险群体的预测方法的流程图。

图2示出了本发明实施例所提供的关联关系图的示例图。

图3示出了本发明实施例所提供的另一种风险群体的预测方法的流程图。

图4示出了本发明实施例所提供的一种关联关系图更新示意图。

图5示出了本发明实施例所提供的另一种关联关系图更新示意图。

图6示出了本发明实施例所提供的目标子图的示意图。

图7示出了本发明实施例所提供的另一种风险群体的预测方法的流程图。

图8示出了本发明实施例所提供的一种风险群体的预测装置的结构示意图。

图9示出了本发明实施例所提供的计算机设备的结构示意图。

图标：10-计算机设备；11-存储器；12-通信接口；13-处理器；14-总线；100-风险群体的预测装置；110-获取模块；120-更新模块；130-确定模块；140-统计模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中，需要说明的是，若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，若出现术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

需要说明的是，在不冲突的情况下，本发明的实施例中的特征可以相互结合。

请参照图1，图1示出了本发明实施例所提供的一种风险群体的预测方法的流程图，该方法包括以下步骤：

步骤S101，获取当前交易的第二用户的用户特征序列，其中，第二用户的用户特征序列用于表征第二用户进行当前交易的交易特征。

在本实施例中，用户特征序列用于表征用户进行交易的交易特征，例如，交易特征可以、但不限于下单时间、下单时用的设备标识，下单时的定位位置、下单的数量等。用户特征序列包括一个或者多个交易特征。

作为一种具体实施方式，可以基于spring框架搭建实现风险群体预测的系统，用户特征序列中的交易特征可以通过Kafka平台获取，Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据，这种动作包括网页浏览、搜索及其他用户的行为。根据每一用户的交易特征生成每个用户的风险特征序列后，可以以预设交易特征、例如商家和门店为主键，采用Redis存储每个用户的特征序列信息，便于后续读取。

步骤S102，依据第二用户的用户特征序列及每一第一用户的用户特征序列更新关联关系图。

在本实施例中，计算机设备存储有表征多个第一用户之间的相似关系的关联关系图，图2示出了本发明实施例所提供的关联关系图的示例图，图2中每个顶点代表一个第一用户，图2中包括4个第一用户：A、B、C、D，其中，A和B之间存在一条边，表明A和B之间存在相似关系，A和B之间的边上的数字1代表A和B的相似度为1，A和C之间不存在边，表明A和C没有相似关系或者A和C的相似关系没有达到预设值，其他用户及对应的边与之类似。

在本实施例中，每一第一用户对应一个用于表征该第一用户的交易特征的用户特征序列。第二用户是当前交易的用户，根据第二用户的用户特征序列及每一第一用户的用户特征序列可以得到第二用户与每一第一用户的关联关系，然后再将该关联关系更新至关联关系图中。

在本实施例中，第一用户为过去预设周期内进行过交易的用户，该预设周期可以根据实际场景进行配置，例如预设周期为一小时、一天、一个月等。

步骤S103，从更新后的关联关系图中，以第二用户为起点确定满足预设连通关系的风险群体。

在本实施例中，更新后的关联关系图中包括了第一用户之间的关联关系及第二用户与第一用户之间的关联关系，预设连通关系可以、但不限于三角形连通关系、四边形连通关系等。

在本实施例中，风险群体中的用户可能是联合起来进行恶意交易的用户。

本发明实施例提供的上述风险群体的预测方法，依据用户的用户特征序列对表征多个用户之间的相似关系的关联关系图进行更新，然后再从更新后的关联关系图中确定风险群体，由此达到识别具有关联关系的风险群体的目的，一方面，避免了规则挖掘耗费的人力成本。

在图1的基础上，本发明实施例还提供了一种风险群体的预测方法，请参照图3，图3示出了本发明实施例所提供的另一种风险群体的预测方法的流程图，步骤S102包括以下子步骤：

子步骤S1021，依据第二用户的用户特征序列及每一第一用户的用户特征序列计算第二用户与每一所述第一用户之间的相似度。

在本实施例中，第二用户与每一第一用户之间的相似度可以通过两者的用户特征序列之间的相似度得到，在计算第二用户与任一第一用户之间的相似度时，需要将第二用户的用户特征序列中的特征与任一第一用户之间的用户特征序列中的相应的特征进行相似度的计算，再根据两者每一特征的相似度，最后得到两者的相似度。例如，用户特征序列包括(下单时间、下单使用的设备标识)，首先，将第二用户的下单时间与该第一用户的下单时间进行相似度的计算，得到两者的下单时间这一特征的相似度，其次，再讲第二用户的下单使用的设备标识与该第一用户的下单使用的设备标识进行相似度的计算，得到两者的下单使用的设备标识的相似度，根据两者的下单时间的相似度和下单使用的设备标识的相似度，最终得到两者的相似度。

需要说明的是，用户特征序列中的特征可以根据需要、按照预设规则分成多种类型，这些类型可以是：(1)必须满足条件的比对特征，例如，必须是在某个商家下单的用户；(2)单维度强特征，下单使用的某个设备标识；(3)两个或两个以上弱特征组合而成的强特征，例如，下单时间和下单地点组合而成的特征。

在本实施例中，作为一种具体实施方式，用户特征序列可以包括多个特征，每一特征对应一个特征权重，计算第二用户与每一第一用户之间的相似度的方法可以是：

首先，计算第二用户的每一特征与每一第一用户对应特征之间的海明距离。

在本实施例中，海明距离又称码距，海明距离在信息编码中，用于表征两个合法代码对应位上编码不同的位数，例如10101和00110从第一位开始依次有第1位、第4、第5位不同，则两者之间的海明距离为3。

需要说明的是，海明距离也可以用欧式距离代替。

还需要说明的是，两个特征的相似度也可以通过相似条件进行判断，例如，对于交易设备的标识，如果两个用户使用的交易设备的标识一致，则判定为两个特征的相似度为1，表示两个特征完全相同，否则，判定两个特征的相似度为0，表示两个特征完全不同。

其次，依据第二用户的每一特征与每一第一用户对应特征之间的海明距离及每一特征对应的特征权重，得到第二用户与每一第一用户之间的相似度。

在本实施例中，特征权重用于表征特征在相似度计算中占据的比重，应用场景不同，同一个特征的特征权重可以不同，例如，在一种场景中，交易时间的特征权重比较大，意味着，两个用户交易时间越接近，则计算出的两个用户之间的相似度越高，在另一种场景中，交易地点的特征权重比较大，意味着，两个用户交易地点越接近，则计算出的两个用户之间的相似度越高。

需要说明的是，用户也可以根据实际场景的需要，设置用户特征序列中的特征的有效性，以便在进行相似度计算时只对有效的特征之间的相似度进行计算，例如，用户特征序列包括4个特征：特征1～特征4，其中，将特征3的有效性设置为无效，则进行相似度计算时，只计算特征1、特征2和特征4之间的相似度，最终根据特征1、特征2和特征4的相似度及对应的权重得到两个用户的相似度。

需要说明的是，第二用户与任一第一用户之间的相似度还可以通过以下方式确定：首先，计算第二用户的用户特征序列中的每一特征与该第一用户的用户特征序列中相应特征之间的相似度，当相似度大于预设值时，判定这两个特征相似，对相似特征进行统计，当第二用户与该第一用户的相似特征的统计计数满足预设统计值时，将该统计计数作为两者之间的相似度。

还需要说明的是，作为一种具体实施方式，为了提高第二用户与第一用户之间的相似度计算的效率，可以采用如下方式：

首先，将第一用户组成的集合进行分割得到多个第一用户子集，其中，每一用户子集中的第一用户均不相同，第二用户分别与每个第一用户子集中的用户并行进行相似度地计算，最终完成第二用户与每一第一用户子集中的每一第一用户的相似度的计算。

其次，在对第二用户与每一第一用户子集中的用户进行相似度计算时，将用户特征序列进行分割得到用户特征序列子集，将分割后的每一用户特征序列子集依次进行相似度的计算，最终完成第二用户与每一第一用户子集中的用户的相似度的计算。

子步骤S1022，依据目标相似度更新关联关系图，其中，目标相似度为第二用户与第一用户之间大于第一阈值的相似度。

在本实施例中，为了使关联关系图不至于过度膨胀，影响风险群体的预测效率，同时为了使找到的风险群体更准确，关联关系图中只记录相似度大于第一阈值的相互关联的用户，即只有第二用户与第一用户之间的相似度大于第一阈值时，该相似度才作为目标相似度，此时，第二用户与该第一用户之间的相似关系才被更新至关联关系图中。

需要说明的是，第一阈值可以根据实际场景进行设置，例如，通过设定该第一阈值调节姓名、备注、地址等文本字段的相似度达到目标相似度的条件。

在本实施例中，关联关系图中每一边均对应一个边属性，每一边属性均包括相似度，每一边的边属性的相似度为与该边关联的两个顶点之间的相似度，作为一种具体实施方式，更新关联关系图的方法可以是：

首先，将目标相似度关联的第一用户作为目标用户。

在本实施例中，第一用户包括A、B、C，第二用户与A、B、C之间的相似度分别为4、7、2，第一阈值为5，则第二用户与B之间的相似度为目标相似度，B为目标用户。

第二，若第二用户对应的顶点存在于关联关系图中，则用目标相似度更新关联关系图中、第二用户对应的顶点与目标用户对应的顶点之间的目标边的相似度。

在本实施例中，第二用户可以是第一用户中其中一个用户，也可以是一个新的用户，当第二用户是第一用户中其中一个用户时，第二用户对应的顶点存在于关联关系图中。请参照图4，图4示出了本发明实施例所提供的一种关联关系图更新示意图，图4(a)为更新前的关联关系图，图4(a)中第一用户为A、B、C和D，其中，A和B、B和C、C和D、B和D、A和D之间的相似度分别为1、1、1、2、3，第二用户为A，利用A此时的用户特征序列重新计算A与B、A与C、和A与D之间的相似度，分别为：2、3、4，第一阈值为1，则更新后的关联关系图如图4(b)所示。

第三，若第二用户对应的顶点不存在于关联关系图中，则将第二用户加入至关联关系图中，并将目标相似度作为第二用户对应的顶点与目标用户对应的顶点之间的目标边的相似度。

在本实施例中，当第二用户是一个新的用户时，第二用户不存在与关联关系图中。请参照图5，图5示出了本发明实施例所提供的另一种关联关系图更新示意图，图5(a)为更新前的关联关系图，图5(a)中第一用户为A、B、C和D，第二用户为E，计算E与A、B、C和D之间的相似度，分别为：1、4、4、1，第一阈值为2，则更新后的关联关系图如图5(b)所示。

请继续参照图3，步骤S103包括以下子步骤：

子步骤S1031，在更新后的关联关系图中，查找以第二用户为起点且满足预设连通关系的目标子图。

在本实施例中，目标子图是关联关系图中包括第二用户且满足预设连通关系的子图。例如，图6示出了本发明实施例所提供的目标子图的示意图，图6中，若第二用户为F，若预设连通关系为三角形连通关系，则以用户F为起点且满足三角形连通关系的目标子图为图6中由用户F、A、E及他们之间的边组成的子图。若第二用户为E，若预设连通关系为四边形连通关系，则以用户E为起点且满足四边形连通关系的目标子图为图6中由用户E、A、B、C、D、E及他们之间的边组成的子图。

需要说明的是，预设连通关系也可以根据实际使用环境进行设置。

还需要说明的是，关联关系图是可以不断更新的，下一次有新的交易时，可以在本次更新后的关联关系图的基础上继续更新，本次的第二用户对于新的交易来说成为了第一用户。

子步骤S1032，当目标子图中包括的节点个数大于第二阈值时，将目标子图的节点对应的用户组成的群体确定为风险群体。

在本实施例中，只有节点个数大于第二阈值的目标子图中的节点对应的用户组成的群体才能确定为风险群体，第二阈值可以根据实际场景进行设置，例如，第二阈值设置为10。

需要说明的是，作为一种具体实施方式，关联关系图的更新及目标子图的查询可以、但不限于采用Neo4j、FlockDB、AllegroGrap等图数据库技术。

本发明实施例提供的上述风险群体的预测方法，第一，通过计算两个用户的用户特征序列中的特征之间的相似度，最终得到反映用户相似关系的关联关系图，使得最终识别出风险群体中的用户之间存在相似关系；第二，不断地更新关联关系图，使关联关系图可以反应用户之间最新的关联关系，提高了风险群体的预测的准确性；第三，关联关系图中只记录相似度大于第一阈值的用户之间的相似关系，可以减少关联关系图占用的存储空间，减少了搜索目标子图的搜索数据量，提高了风险群体的预测的效率；第四，从更新后的关联关系图中查找以第二用户为起点、且符合预设连通关系、且节点个数大于第二阈值的目标子图，进而确定风险群体，避免了将正常交易的用户误判为风险群体，降低了风险群体预测的误判率；第五，可以对第一阈值、第二阈值、预设连通关系及用户特征序列中的有效特征进行设置，以便在预测的准确性和效率之间找到满足需求的平衡点，由此适配了多种场景的需要；第六，第一阈值、第二阈值、预设连通关系及用户特征序列中的有效特征可以针对全部的商家进行设置，也可以针对某一个确定的商家进行设置，以适应各个场景和时段的运营需要。

在本实施例中，为了更好地对预测的风险群体进一步地解释，从而可以针对性地对风险群体进行监控和拦截，本发明实施例在图1的基础上还提供了另一种风险群体的预测方法，请参照图7，图7示出了本发明实施例所提供的另一种风险群体的预测方法的流程图，该方法还包括以下步骤：

步骤S104，对风险群体对应的关联关系图的目标子图中的相似特征进行统计，得到相似特征的统计结果。

在本实施例中，关联关系图中每一边的属性除了包括相似度，还包括相似特征，每一边的边属性的相似特征为该边关联的两个顶点对应的第一用户的用户特征序列中满足预设相似条件的特征。

在本实施例中，预设相似条件可以是两个特征完全相同，也可以是两个特征的相似度高于预设的风险阈值。例如，用户特征序列中包括下单时间及下单时使用的设备标识，两个用户的下单时使用的设备标识完全相同，则下单时使用的设备标识作为连接该用户对应的两个顶点的边的相似特征。

在本实施例中，对风险群体对应的目标子图中的所有边的相似特征进行统计，可以从一定程度上反映出风险群体进行恶意交易的特点，例如，若下单时使用的设备标识这一相似特征的统计值很高，意味着风险群体中的用户集中使用了若干台设备进行恶意交易。

本发明实施例提供的上述风险群体的预测方法，通过对目标子图中的边的相似特征进行统计，可以有助于对风险群体使用的手段进行分析，以便于进一步对风险群体进行监控和拦截。

还需要说明的是，步骤S1021～S1022可以替换图1或者图7中的步骤S102，步骤S1031～S1032可以替换图1或者图7中的步骤S103，步骤S104可以和图1或者图3中的步骤组合使用。

为了执行上述实施例及各个可能的实施方式中的相应步骤，下面给出一种风险群体的预测装置的实现方式，请参看图8，图8示出了本发明实施例提供的风险群体的预测装置100的结构示意图。需要说明的是，本实施例所提供的风险群体的预测装置100，其基本原理及产生的技术效果和上述实施例相同，为简要描述，本实施例部分未提及指出，可参考上述实施例中的相应内容。

风险群体的预测装置包括获取模块110、更新模块120、确定模块130及统计模块140。

获取模块110，用于获取当前交易的第二用户的用户特征序列，其中，第二用户的用户特征序列用于表征第二用户进行当前交易的交易特征。

更新模块120，用于依据第二用户的用户特征序列及每一第一用户的用户特征序列更新关联关系图。

具体地，关联关系图包括多个顶点及至少一个边，每一顶点代表一个第一用户，每一条边代表该边关联的两个顶点对应的第一用户之间的相似度，更新模块120具体用于：依据第二用户的用户特征序列及每一第一用户的用户特征序列计算第二用户与每一第一用户之间的相似度；依据目标相似度更新关联关系图，其中，目标相似度为第二用户与第一用户之间大于第一阈值的相似度。

具体地，用户特征序列包括多个特征，每一特征对应一个特征权重，更新模块120在依据第二用户的用户特征序列及每一所述第一用户的用户特征序列计算所述第二用户与每一所述第一用户之间的相似度时，具体用于：计算第二用户的每一特征与每一第一用户对应特征之间的海明距离；依据第二用户的每一特征与每一第一用户对应特征之间的海明距离及每一特征对应的特征权重，得到第二用户与每一第一用户之间的相似度。

具体地，关联关系图中每一边均对应一个边属性，每一边属性均包括相似度，每一边的边属性的相似度为与该边关联的两个顶点之间的相似度，更新模块120在依据目标相似度更新关联关系图时具体用于：将目标相似度关联的第一用户作为目标用户；若第二用户对应的顶点存在于关联关系图中，则用目标相似度更新关联关系图中、第二用户对应的顶点与目标用户对应的顶点之间的目标边的相似度；若第二用户对应的顶点不存在于关联关系图中，则将第二用户加入至关联关系图中，并将目标相似度作为第二用户对应的顶点与目标用户对应的顶点之间的目标边的相似度。

确定模块130，用于从更新后的关联关系图中，以第二用户为起点确定满足预设连通关系的风险群体。

具体地，确定模块130用于：在更新后的关联关系图中，查找以第二用户为起点且满足预设连通关系的目标子图；当目标子图中包括的节点个数大于第二阈值时，将目标子图的节点对应的用户组成的群体确定为风险群体。

统计模块140，用于对风险群体对应的关联关系图的目标子图中的相似特征进行统计，得到相似特征的统计结果，其中，关联关系图中每一边的属性还包括相似特征，所述每一边的边属性的相似特征为该边关联的两个顶点对应的第一用户的用户特征序列中满足预设相似条件的特征。

本发明实施例给出了一种计算机设备的结构示意图，请参照图9，图9示出了本发明实施例所提供的计算机设备10的结构示意图，计算机设备10可以是实体的主机或者主机组、也可以是实体的服务器或者服务器组、还可以是可以实现与实体主机或者服务器相同功能的虚拟机。计算机设备10包括存储器11、通信接口12、处理器13、总线14。存储器11、通信接口12和处理器13通过总线14连接，处理器13用于执行存储器11中存储的可执行模块，例如计算机程序。

计算机设备10通过通信接口12以实现与其他计算机设备之间的通信。

其中，存储器11可能包含高速随机存取存储器(RAM：Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。

总线14可以是ISA总线、PCI总线或EISA总线等。图9中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器11用于存储程序，例如图8中的风险群体的预测装置，处理器13在接收到执行指令后，执行程序以实现本发明上述实施例揭示的风险群体的预测方法。

处理器13可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器13中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器13可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如前述实施方式中任一项所述的风险群体的预测方法。

综上所述，本发明实施例提供了一种风险群体的预测方法、装置、计算机设备及存储介质，计算机设备存储有表征多个第一用户之间的相似关系的关联关系图，每一第一用户对应一个用于表征该第一用户的交易特征的用户特征序列，所述方法包括：获取当前交易的第二用户的用户特征序列，其中，第二用户的用户特征序列用于表征第二用户进行当前交易的交易特征；依据第二用户的用户特征序列及每一第一用户的用户特征序列更新关联关系图；从更新后的关联关系图中，以第二用户为起点确定满足预设连通关系的风险群体。与现有技术相比，本发明实施例能够依据用户的用户特征序列对表征多个用户之间的相似关系的关联关系图进行更新，然后再从更新后的关联关系图中确定风险群体，由此达到识别具有关联关系的风险群体的目的。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种风险群体的预测方法，其特征在于，应用于计算机设备，所述计算机设备存储有表征多个第一用户之间的相似关系的关联关系图，每一所述第一用户对应一个用于表征该第一用户的交易特征的用户特征序列，所述方法包括：

获取当前交易的第二用户的用户特征序列，其中，所述第二用户的用户特征序列用于表征所述第二用户进行所述当前交易的交易特征；

依据所述第二用户的用户特征序列及每一所述第一用户的用户特征序列更新所述关联关系图，所述关联关系图包括多个顶点及至少一个边，每一所述顶点代表一个所述第一用户，每一条边代表该边关联的两个顶点对应的所述第一用户之间的相似度；

从更新后的所述关联关系图中，以所述第二用户为起点确定满足预设连通关系的风险群体；

所述依据所述第二用户的用户特征序列及每一所述第一用户的用户特征序列更新所述关联关系图的步骤包括：

依据所述第二用户的用户特征序列及每一所述第一用户的用户特征序列计算所述第二用户与每一所述第一用户之间的相似度；

依据目标相似度更新所述关联关系图，其中，所述目标相似度为所述第二用户与所述第一用户之间大于第一阈值的相似度；

所述从更新后的所述关联关系图中，以所述第二用户为起点确定满足预设连通关系的风险群体的步骤包括：

在更新后的所述关联关系图中，查找以所述第二用户为起点且满足预设连通关系的目标子图；

当所述目标子图中包括的节点个数大于第二阈值时，将所述目标子图的节点对应的用户组成的群体确定为风险群体。

2.如权利要求1所述的风险群体的预测方法，其特征在于，所述用户特征序列包括多个特征，每一所述特征对应一个特征权重，所述依据第二用户的用户特征序列及每一所述第一用户的用户特征序列计算所述第二用户与每一所述第一用户之间的相似度的步骤包括：

计算所述第二用户的每一特征与每一所述第一用户对应特征之间的海明距离；

依据所述第二用户的每一特征与每一所述第一用户对应特征之间的海明距离及每一特征对应的特征权重，得到所述第二用户与每一所述第一用户之间的相似度。

3.如权利要求1所述的风险群体的预测方法，其特征在于，所述关联关系图中每一边均对应一个边属性，每一边属性均包括相似度，所述每一边的边属性的相似度为与该边关联的两个顶点之间的相似度，所述依据目标相似度更新所述关联关系图的步骤包括：

将所述目标相似度关联的第一用户作为目标用户；

若所述第二用户对应的顶点存在于所述关联关系图中，则用所述目标相似度更新所述关联关系图中、所述第二用户对应的顶点与所述目标用户对应的顶点之间的目标边的相似度；

若所述第二用户对应的顶点不存在于所述关联关系图中，则将所述第二用户加入至所述关联关系图中，并将所述目标相似度作为所述第二用户对应的顶点与所述目标用户对应的顶点之间的目标边的相似度。

4.如权利要求3所述的风险群体的预测方法，其特征在于，所述关联关系图中每一边的属性还包括相似特征，所述每一边的边属性的相似特征为该边关联的两个顶点对应的第一用户的用户特征序列中满足预设相似条件的特征，所述方法还包括：

对所述风险群体对应的所述关联关系图的目标子图中的相似特征进行统计，得到所述相似特征的统计结果。

5.一种风险群体的预测装置，其特征在于，应用于计算机设备，所述计算机设备存储有表征多个第一用户之间的相似关系的关联关系图，每一所述第一用户对应一个用于表征该第一用户的交易特征的用户特征序列，所述装置包括：

获取模块，用于获取当前交易的第二用户的用户特征序列，其中，所述第二用户的用户特征序列用于表征所述第二用户进行所述当前交易的交易特征；

更新模块，用于依据所述第二用户的用户特征序列及每一所述第一用户的用户特征序列更新所述关联关系图，所述关联关系图包括多个顶点及至少一个边，每一所述顶点代表一个所述第一用户，每一条边代表该边关联的两个顶点对应的所述第一用户之间的相似度；

确定模块，用于从更新后的所述关联关系图中，以所述第二用户为起点确定满足预设连通关系的风险群体；

所述更新模块具体用于：

所述确定模块具体用于：在更新后的所述关联关系图中，查找以所述第二用户为起点且满足预设连通关系的目标子图；当所述目标子图中包括的节点个数大于第二阈值时，将所述目标子图的节点对应的用户组成的群体确定为风险群体。

6.一种计算机设备，其特征在于，所述计算机设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-4中任一项所述的风险群体的预测方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-4中任一项所述的风险群体的预测方法。