CN112435137B

CN112435137B - 一种基于社团挖掘的欺诈信息检测方法及系统

Info

Publication number: CN112435137B
Application number: CN202011629022.6A
Authority: CN
Inventors: 唐海定; 邢祎哲; 周其进; 沈培强
Original assignee: Hangyin Consumer Finance Co ltd
Current assignee: Hangyin Consumer Finance Co ltd
Priority date: 2020-12-31
Filing date: 2020-12-31
Publication date: 2021-05-07
Anticipated expiration: 2040-12-31
Also published as: CN112435137A

Abstract

本发明实施例提供一种基于社团挖掘的欺诈信息检测方法及系统，通过获取多个主体集群社团和多个行为信息集群社团；然后，根据目标主体对象对应的主体对象行为标签，得到所述目标主体对象对应的参考主体对象，并根据所述目标行为信息对应的信息类别标签，得到所述目标行为信息对应的参考行为信息；最后，分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息。如此，基于主体集群社团以及信息集群社团的数据挖掘方式进行疑似欺诈信息的检测，可以有效的检测出目标主体对象对应的行为信息是否存在疑似欺诈信息。

Description

一种基于社团挖掘的欺诈信息检测方法及系统

技术领域

本发明涉及数据安全技术领域，具体而言，涉及一种基于社团挖掘的欺诈信息检测方法及系统。

背景技术

社交网络服务（Social Networking Services，SNS）通过促进人们之间的线上交流和信息共享，具有非常庞大的用户群数量。为了提供良好的用户体验，社交网络自身的功能也变得越来越趋于复杂，这对社交网络的安全与隐私保护提出了新的挑战。例如，一些不法分子利用社交网络的开放性和用户使用过程中暴露的信息，如照片、与朋友的交互信息等，通过有针对性地传播欺诈信息，对网络用户的安全造成了严重威胁。此外，随着网络金融的普及，设计网银等欺诈类信息也日益猖獗，进一步威胁到用户的资金安全，可能给用户造成直接的经济损失。因此，如何有效的对欺诈信息进行检测是本领域极为重要的技术问题。

发明内容

基于现有设计的不足，本发明实施例提供一种基于社团挖掘的欺诈信息检测方法，应用于与多个主体对象设备通信连接的所述数据挖掘服务器，所述方法包括：

获取多个主体集群社团和多个行为信息集群社团；所述主体集群社团是通过对预先采集的主体样本中每个主体对象对应的主体对象行为标签进行集群分析得到，所述行为信息集群社团是通过对预先采集的行为信息样本中每个行为信息对应的信息类别标签进行集群分析得到；

根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象；

将所述目标主体对象历史产生的行为信息和所述参考主体对象历史产生的行为信息确定为目标行为信息，并根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息并写入一行为信息序列中；

分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，并将检测到的疑似欺诈信息添加到对应的疑似欺诈信息序列中。

优选地，上述方法还包括：

根据所述目标主体对象历史产生的行为信息，建立所述目标主体对象对应的标签分布拓扑图；

所述标签分布拓扑图包括所述目标主体对象历史产生的每个行为信息的标签信息；

通过预设的标签融合曲线分别对所述标签分布拓扑图中每个行为信息的标签信息进行融合处理，得到融合标签热度序列；所述预设的标签融合曲线包括与待融合的行为信息相关联的融合参数；

在所述预先采集的行为信息样本对应的行为信息特征序列中，获取所述目标主体对象历史产生的行为信息对应的目标行为信息特征序列，并根据所述目标行为信息特征序列和所述融合标签热度序列，生成主体对象向量分布，并将所述主体对象向量分布转换为所述目标主体对象对应的主体对象行为标签。

优选地，所述方法还包括：

在所述预先采集的行为信息样本对应的行为信息特征序列中提取与所述目标行为信息相关联的属性特征，并根据所述目标行为信息相关联的属性特征得到所述目标行为信息对应的信息类别标签。

优选地，所述方法还包括：

根据多个预设的第一集群分析参考矢量，分别计算所述预先采集的主体样本中每个主体对象对应的主体对象行为标签与所述多个第一集群分析参考矢量之间的第一矢量差异；

根据所述第一矢量差异，确定各主体对象行为标签与各第一集群分析参考矢量之间的关联关系，并将与相同的第一集群分析参考矢量关联的主体对象行为标签所对应的主体对象划分至相同的主体集群社团中；其中，所述主体集群社团的数量与所述第一集群分析参考矢量的数量相同。

优选地，所述方法还包括：

根据多个第二集群分析参考矢量，分别计算所述预先采集的行为信息样本中每个行为信息对应的信息类别标签与所述多个第二集群分析参考矢量之间的第二矢量差异；

根据所述第二矢量差异，确定各信息类别标签与各第二集群分析参考矢量之间的关联关系，并将与相同的第二集群分析参考矢量关联的信息类别标签所对应的行为信息划分至相同的行为信息集群社团中；其中，所述行为信息集群社团的数量与所述第二集群分析参考矢量的数量相同。

优选地，所述根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象，包括：

将目标主体对象匹配的主体集群社团中所述目标主体对象以外的主体对象，确定为待处理主体对象，并获取所述目标主体对象与所述待处理主体对象分别对应的主体对象行为标签；

获取所述目标主体对象与所述待处理主体对象之间的行为信息交叉特征，并根据所述目标主体对象与所述待处理主体对象分别对应的主体对象行为标签中与所述行为信息交叉特征相关联的属性特征、所述目标主体对象与所述待处理主体对象分别对应的主体对象行为标签中多个属性特征的特征均值，计算所述目标主体对象与所述待处理主体对象之间的主体对象匹配度；

所述行为信息交叉特征是指所述目标主体对象历史产生的行为信息对应的行为信息特征与所述待处理主体对象历史产生的行为信息对应的行为信息特征之间的相同特征；

按照所述主体对象匹配度从大到小的顺序对多个所述待处理主体对象进行排列，将排列序号大于第一预设值的所述待处理主体对象确定为满足主体匹配条件的主体对象，并将满足主体匹配条件的主体对象确定为所述目标主体对象对应的参考主体对象。

优选地，所述根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息，包括：

将所述目标行为信息匹配的行为信息集群社团中所述目标行为信息以外的行为信息，确定为待匹配行为信息，并获取所述目标行为信息与所述待匹配行为信息分别对应的信息类别标签；

获取所述目标行为信息与所述待匹配行为信息之间的行为信息特征组合，并根据所述目标行为信息与所述待匹配行为信息分别对应的信息类别标签中与所述行为信息特征组合相关联的属性特征，计算所述目标行为信息与所述待匹配行为信息之间的行为信息匹配度；

所述行为信息特征组合是指将所述目标行为信息对应的行为信息特征与所述待匹配行为信息对应的行为信息特征进行组合而得到的并集；

按照所述行为信息匹配度从大到小的顺序对多个所述待匹配行为信息进行排列，将排列序号大于第二预设值的所述待匹配行为信息确定为满足信息匹配条件的行为信息，并将满足信息匹配条件的行为信息确定为所述目标行为信息对应的参考行为信息。

优选地，所述分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，包括：

将所述行为信息序列中的每个行为信息作为候选信息；

计算所述目标主体对象与每个所述候选信息之间的关联参数；

按照所述关联参数从大到小的顺序对多个所述候选信息进行排列，将排列序号大于第三预设值的所述候选信息确定为所述目标主体对象对应的行为信息。

优选地，所述计算所述目标主体对象与每个所述候选信息之间的关联参数，包括：

若所述候选信息为携带有关联参数的行为信息，则根据所述目标主体对象分别与每个所述参考主体对象之间的主体对象匹配度、所述目标主体对象和每个所述参考主体对象分别对应的主体对象关联参数均值、每个所述参考主体对象分别针对所述候选信息的关联参数，计算所述目标主体对象与所述候选信息之间的关联参数；所述主体对象关联参数均值是指一个主体对象对历史产生的行为信息的关联参数的特征均值；

若所述候选信息为未携带有关联参数的行为信息，则根据所述候选信息对应的每个参考行为信息分别与所述候选信息之间的行为信息匹配度、所述候选信息对应的每个参考行为信息分别对应的行为信息关联参数均值、所述目标主体对象对应的主体对象关联参数均值、多个所述行为信息关联参数的均值，计算所述目标主体对象与所述候选信息之间的关联参数；所述行为信息关联参数均值是指一个行为信息所具有的多个关联参数的特征均值。

本发明实施例还提供一种基于社团挖掘的欺诈信息检测系统，应用于与多个主体对象设备通信连接的所述数据挖掘服务器，所述系统包括：

集群社团获取模块，用于获取多个主体集群社团和多个行为信息集群社团；所述主体集群社团是通过对预先采集的主体样本中每个主体对象对应的主体对象行为标签进行集群分析得到，所述行为信息集群社团是通过对预先采集的行为信息样本中每个行为信息对应的信息类别标签进行集群分析得到；

参考对象确定模块，用于根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象；

参考信息确定模块，用于将所述目标主体对象历史产生的行为信息和所述参考主体对象历史产生的行为信息确定为目标行为信息，并根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息并写入一行为信息序列中；

欺诈信息检测模块，用于分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，并将检测到的疑似欺诈信息添加到对应的疑似欺诈信息序列中。

相较于现有技术，本发明实施例提供的基于社团挖掘的欺诈信息检测方法及系统，针对目标主体对象以及相对应的历史行为信息通过基于主体集群社团以及信息集群社团的数据挖掘方式进行疑似欺诈信息的检测，可以有效的检测出目标主体对象对应的行为信息是否存在疑似欺诈信息。

此外，本发明根据目标主体对象对应的主体对象行为标签，在目标主体对象匹配的主体集群社团中获取与目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为目标主体对象对应的参考主体对象，这些参考主体对象即为与目标主体对象相似的主体对象。同时，由于是在目标主体对象所在的主体集群社团中查找参考主体对象，使得基于主体集群社团的分析方法还大大缩小了查找范围，从而减少信息挖掘过程的计算量，进而可以降低系统功耗。

更进一步地，本发明实施例进一步将目标主体对象历史产生的行为信息和参考主体对象历史产生的行为信息均确定为目标行为信息，并根据目标行为信息对应的信息类别标签，在目标行为信息匹配的行为信息集群社团中获取与目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为目标行为信息对应的参考行为信息，得到行为信息序列，分别计算目标主体对象与行为信息序列中每个行为信息之间的关联参数，并根据关联参数在行为信息序列中检测疑似欺诈信息。由此可见，行为信息序列不仅可以包括参考主体对象历史产生的行为信息，还可以包括目标行为信息对应的参考行为信息。因此，尽管在主体对象历史产生的行为信息的数量过少的情况下，也可以通过目标行为信息对应的参考行为信息扩充行为信息序列中的行为信息数量，进而可以提高信息挖掘和检测的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，针对本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是是本发明实施例的运行环境示意图。

图2是应用于图1所示的数据挖掘服务器的基于社团挖掘的欺诈信息检测方法的流程图。

图3是获得图2所示的主体对象行为标签的流程示意图。

图4是图2中步骤S22的子步骤流程示意图。

图5是图2中步骤S23的子步骤流程示意图。

图6是本发明实施例提供的用于实现上述的基于社团挖掘的欺诈信息检测方法的数据挖掘服务器的示意图。

具体实施方式

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本文使用的“系统”、“装置”、“单元”和/或“模块”等是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。如本说明书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和属性特征，而这些步骤和属性特征不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或属性特征。

此外，本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或多步操作。

为解决前述背景技术所描述的问题，本发明实施例创新性地提供一种基于社团挖掘的欺诈信息检测方法及系统，下面结合附图对本发明的可替代实施例进行具体介绍。

请参见图1，是本发明实施例的运行环境示意图。如图1所示，该运行环境可以包括数据挖掘服务器100和多个主体对象设备200，本发明实施例不对主体对象设备的数量进行限定。数据挖掘服务器100可以分别与每个主体对象设备200进行网络连接。数据挖掘服务器100可用于对多个主体对象设备200产生的海量行为信息进行数据挖掘与分析，以对行为信息中可能存在的欺诈信息进行检测。

本实施例所述的数据挖掘服务器100可以是任何具有数据处理分析能力以实现数据挖掘的计算机设备，例如可以是分布式集群服务器、数据中心、个人计算机等，本实施例对此不做限定。

请参见图2，是应用于图1所示的数据挖掘服务器100的基于社团挖掘的欺诈信息检测方法的流程图。下面将结合附图，对该方法的各步骤进行详细的描述。

步骤S21，获取多个主体集群社团和多个行为信息集群社团。

详细地，本实施例中所述主体集群社团可以是通过对预先采集的主体样本中每个主体对象对应的主体对象行为标签进行集群分析得到，所述行为信息集群社团是通过对预先采集的行为信息样本中每个行为信息对应的信息类别标签进行集群分析得到。所谓“社团”可以是一种对象的聚类，例如是对预先采集的大量主体样本中的主体对象进行谱聚类而得到，谱聚类是一种基于图论的聚类方法，可以通过对样本数据的拉普拉斯矩阵的特征向量进行聚类，从而达到对样本数据聚类的目的。谱聚类可以理解为将高维空间的数据映射到低维，然后在低维空间利用如k-means等的聚类算法进行集群分析或聚类分析。关于集群社团的形成方式可以参照现有技术中的任意一种方式来形成，此处不再赘述。

步骤S22，根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象。

本实施例中，所述目标主体对象可以指代上述任意一个主体对象设备200，也可以指代使用任意一个所述主体对象设备200的用户，此处不做具体限定。

步骤S23，将所述目标主体对象历史产生的行为信息和所述参考主体对象历史产生的行为信息确定为目标行为信息，并根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息并写入一行为信息序列中。

步骤S24，分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，并将检测到的疑似欺诈信息添加到对应的疑似欺诈信息序列中。

综上所述，本发明实施例针对目标主体对象以及相对应的历史行为信息通过基于主体集群社团以及信息集群社团的数据挖掘方式进行疑似欺诈信息的检测，可以有效的检测出目标主体对象对应的行为信息是否存在疑似欺诈信息。下面将结合附图对上述各步骤的具体实现方式进行进一步的详细介绍。

进一步地，参阅图3所示，上述提及的主体对象行为标签可以通过图3所示的步骤预先获得，具体描述如下。

步骤S31，根据所述目标主体对象历史产生的行为信息，建立所述目标主体对象对应的标签分布拓扑图。

本实施例中，所述标签分布拓扑图包括所述目标主体对象历史产生的每个行为信息的标签信息。可以将每个行为信息作为一个节点，各节点上的标签信息分布则形成所述标签分布拓扑图。例如，可以通过谱聚类将初始的多个行为信息分别作为节点划分为多个区域形成多个子图，然后将每个子图进行织网，连接边的权重值即是连接边两端节点之间的关联权重，进而得到标签分布拓扑图。例如，每一子图中所包括的多个节点根据标签信息之间的关联权重通过连接边连接起来形成所述标签分布拓扑图。

步骤S32，通过预设的标签融合曲线分别对所述标签分布拓扑图中每个行为信息的标签信息进行融合处理，得到融合标签热度序列。所述预设的标签融合曲线包括与待融合的行为信息相关联的融合参数。

详细地，本实施例中，所述标签融合曲线可以是一种时间衰减函数，所述融合参数可以是时间衰减函数的时间常量。具体的融合方式可以是将所述标签融合曲线分别与所述标签分布拓扑图中的每个行为信息的标签信息的权重系数进行相乘的方式进行融合处理，进而得到标签热度序列。如此，利用时间衰减函数作为时间衰减因子，可以模拟标签热度随时间逐渐冷却的过程，进而得到的标签热度序列用于后续生成目标主体对象对应的主体对象行为标签，使得主体对象行为标签能够更准确的表示目标主体对象的行为。

步骤S33，在所述预先采集的行为信息样本对应的行为信息特征序列中，获取所述目标主体对象历史产生的行为信息对应的目标行为信息特征序列，并根据所述目标行为信息特征序列和所述融合标签热度序列，生成主体对象向量分布，并将所述主体对象向量分布转换为所述目标主体对象对应的主体对象行为标签。

示例性地，本实施例中，所述向量分布可以是主体对象的特征向量矩阵，特征向量矩阵中分别包含了所述融合标签热度序列以及所述信息特征序列中的参数，最后可通过所述向量分布输入设定的网络模型中进行计算，即可得到所述目标主体对象对应的主体对象行为标签。

进一步地，上述步骤S21中所述的信息类别标签可以通过以下方式得到。首先，可在所述预先采集的行为信息样本对应的行为信息特征序列中提取与所述目标行为信息相关联的属性特征，并根据所述目标行为信息相关联的属性特征得到所述目标行为信息对应的信息类别标签。所述属性特征可以是用于表示所述目标行为信息具体的操作行为的特征表示，例如可以通过预先定义的代码规则针对各种不同的目标行为通过不同的代码来进行表示，而相应的代码即为对应的属性特征。此外，可以对采集得到的属性特征进行组合得到行为标签，例如采集得到a、b、c三个属性特征，组合得到的信息类别标签则可以是{abc}。

进一步地，在步骤S21中的主体集群社团可以通过以下方式进行集群分析得到。

首先，根据多个预设的第一集群分析参考矢量，分别计算所述预先采集的主体样本中每个主体对象对应的主体对象行为标签与所述多个第一集群分析参考矢量之间的第一矢量差异。所述第一集群分析参考矢量可以是预先设置的用于对各主体样本进行分析的特征向量，例如可以是一种中心向量。此外，本实施例中，各主体对象行为标签可以通过特征向量进行表示，可以通过各主体对象行为标签所述第一集群分析参考矢量之间的向量距离、欧式距离、曼哈顿距离等进行表示所述第一矢量差异。

然后，根据所述第一矢量差异，确定各主体对象行为标签与各第一集群分析参考矢量之间的关联关系，并将与相同的第一集群分析参考矢量对应的主体对象行为标签与所对应的主体对象划分至相同的主体集群社团中。其中，所述主体集群社团的数量与所述第一集群分析参考矢量的数量相同。

进一步地，在步骤S21中的信息集群社团可以通过以下方式进行集群分析得到。

首先，根据多个第二集群分析参考矢量，分别计算所述预先采集的行为信息样本中每个行为信息对应的信息类别标签与所述多个第二集群分析参考矢量之间的第二矢量差异。相对应地，所述第二集群分析参考矢量可以是预先设置的用于对各行为信息样本进行分析的特征向量，例如也可以是一种中心向量。此外，本实施例中，各信息类别标签也可以通过特征向量进行表示，可以通过各信息类别标签与所述第二集群分析参考矢量之间的向量距离、欧式距离、曼哈顿距离等进行表示所述第二矢量差异。

根据所述第二矢量差异，确定各信息类别标签与各第二集群分析参考矢量之间的关联关系，并将与相同的第二集群分析参考矢量关联的信息类别标签所对应的行为信息划分至相同的行为信息集群社团中。其中，所述行为信息集群社团的数量与所述第二集群分析参考矢量的数量相同。

请参阅图4所示，是图2中步骤S22的子步骤流程示意图。在该步骤中，根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象，具体的实现方法描述如下。

子步骤S221，将目标主体对象匹配的主体集群社团中所述目标主体对象以外的主体对象，确定为待处理主体对象，并获取所述目标主体对象与所述待处理主体对象分别对应的主体对象行为标签。

子步骤S222，获取所述目标主体对象与所述待处理主体对象之间的行为信息交叉特征，并根据所述目标主体对象与所述待处理主体对象分别对应的主体对象行为标签中与所述行为信息交叉特征相关联的属性特征、所述目标主体对象与所述待处理主体对象分别对应的主体对象行为标签中多个属性特征的特征均值，计算所述目标主体对象与所述待处理主体对象之间的主体对象匹配度。

本实施例中，所述行为信息交叉特征是指所述目标主体对象历史产生的行为信息对应的行为信息特征与所述待处理主体对象历史产生的行为信息对应的行为信息特征之间的相同特征。详细地，所述目标主体对象与所述待处理主体对象之间的行为信息交叉特征可以用目标主体对象与所述待处理主体对象之间的行为信息的交集进行表示。

子步骤S223，按照所述主体对象匹配度从大到小的顺序对多个所述待处理主体对象进行排列，将排列序号大于第一预设值的所述待处理主体对象确定为满足主体匹配条件的主体对象，并将满足主体匹配条件的主体对象确定为所述目标主体对象对应的参考主体对象。如此，所述主体集群社团中的主体对象可以是预先采集的曾经产生过欺诈信息或疑似欺诈信息的主体，此处通过匹配条件筛选出的参考主体对象可用于后续检测目标主体对象历史产生的行为信息是包含疑似欺诈信息。

综上所述，本发明根据目标主体对象对应的主体对象行为标签，在目标主体对象匹配的主体集群社团中获取与目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为目标主体对象对应的参考主体对象，这些参考主体对象即为与目标主体对象相似的主体对象。同时，由于是在目标主体对象所在的主体集群社团中查找参考主体对象，使得基于主体集群社团的分析方法还大大缩小了查找范围，从而减少信息挖掘过程的计算量，进而可以降低系统功耗。

请参阅图5所示，是图2中步骤S23的子步骤流程示意图。在该步骤中，所述根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息，具体的实现方式可以描述如下。

子步骤S231，将所述目标行为信息匹配的行为信息集群社团中所述目标行为信息以外的行为信息，确定为待匹配行为信息，并获取所述目标行为信息与所述待匹配行为信息分别对应的信息类别标签。

子步骤S232，获取所述目标行为信息与所述待匹配行为信息之间的行为信息特征组合，并根据所述目标行为信息与所述待匹配行为信息分别对应的信息类别标签中与所述行为信息特征组合相关联的属性特征，计算所述目标行为信息与所述待匹配行为信息之间的行为信息匹配度。

本实施例中，所述行为信息特征组合可以是指将所述目标行为信息对应的行为信息特征与所述待匹配行为信息对应的行为信息特征进行组合而得到的并集。

子步骤S233，按照所述行为信息匹配度从大到小的顺序对多个所述待匹配行为信息进行排列，将排列序号大于第二预设值的所述待匹配行为信息确定为满足信息匹配条件的行为信息，并将满足信息匹配条件的行为信息确定为所述目标行为信息对应的参考行为信息。如此，所述信息集群社团中的行为信息样本可以是预先采集的欺诈信息样本或疑似欺诈信息样本，此处通过匹配条件筛选出的参考行为信息可用于后续检测目标主体对象历史产生的行为信息是包含疑似欺诈信息。

进一步地，在上述步骤S24中，所述分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，具体的实现方式可如下所述。

首先，将所述行为信息序列中的每个行为信息作为候选信息；

然后，计算所述目标主体对象与每个所述候选信息之间的关联参数；所述关联参数可以是根据预设的模型计算得到的所述目标主体对象与每个所述候选信息之间的匹配度或相似度。

最后，按照所述关联参数从大到小的顺序对多个所述候选信息进行排列，将排列序号大于第三预设值的所述候选信息确定为疑似欺诈信息并添加到对应的疑似欺诈信息序列中，以备后续对该疑似欺诈信息进行进一步的处理，例如加入相应的样本中，用于完善所述信息集群社团，以加强后续的欺诈信息检测精度及范围。

进一步地，上述计算所述目标主体对象与每个所述候选信息之间的关联参数，的方式具体可以为：

若所述候选信息为未携带有关联参数的行为信息，则根据所述候选信息对应的每个参考行为信息分别与所述候选信息之间的行为信息匹配度、所述候选信息对应的每个参考行为信息分别对应的行为信息关联参数均值、所述目标主体对象对应的主体对象关联参数均值、多个所述行为信息关联参数的均值，计算所述目标主体对象与所述候选信息之间的关联参数；所述行为信息关联参数均值是指一个行为信息所具有的多个关联参数的平均值。

综上所述，本发明实施例将目标主体对象历史产生的行为信息和参考主体对象历史产生的行为信息均确定为目标行为信息，并根据目标行为信息对应的信息类别标签，在目标行为信息匹配的行为信息集群社团中获取与目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为目标行为信息对应的参考行为信息，信息和对应的参考行为信息中过滤掉目标主体对象历史产生的行为信息，得到行为信息序列，分别计算目标主体对象与行为信息序列中每个行为信息之间的关联参数，并根据关联参数在行为信息序列中检测疑似欺诈信息。由此可见，行为信息序列不仅可以包括参考主体对象历史产生的行为信息，还可以包括目标行为信息对应的参考行为信息。因此，尽管在主体对象历史产生的行为信息的数量过少的情况下，也可以通过目标行为信息对应的参考行为信息扩充行为信息序列中的行为信息数量，进而可以提高信息挖掘和欺诈检测的准确性。

请参阅图6所示，图6是本发明实施例提供的用于实现上述的基于社团挖掘的欺诈信息检测方法的数据挖掘服务器100的示意图，如图6所示，数据挖掘服务器100可包括欺诈信息检测系统110、处理器120、以及机器可读存储介质130。

在具体实现过程中，至少一个处理器120执行机器可读存储介质130存储的计算机执行指令，使得处理器120可以执行如上方法实施例的基于社团挖掘的欺诈信息检测方法。

处理器120的具体实现过程可参见上述数据挖掘服务器100执行的各个方法实施例，其实现原理和技术效果类似，本实施例此处不再赘述。

处理器120可以是中央处理器(英文：Central Processing Unit，CPU)，还可以是其它通用处理器、数字信号处理器(英文：Digital Signal Processor，DSP)、专用集成电路(英文：Application SpecificIntegrated Circuit，ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

机器可读存储介质130可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器。

所述欺诈信息检测系统110可以包括集群社团获取模块111、参考对象确定模块112、参考信息确定模块113、以及欺诈信息检测模块114。

详细地，集群社团获取模块111，用于获取多个主体集群社团和多个行为信息集群社团；所述主体集群社团是通过对预先采集的主体样本中每个主体对象对应的主体对象行为标签进行集群分析得到，所述行为信息集群社团是通过对预先采集的行为信息样本中每个行为信息对应的信息类别标签进行集群分析得到。其中，所述集群社团获取模块111可以用于执行图2所示的步骤S21，关于该集群社团获取模块111的详细内容可以参照步骤S21有关的具体内容，此处不再一一赘述。

参考对象确定模块112，用于根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象。其中，所述参考对象确定模块112可以用于执行图2所示的步骤S22，关于该参考对象确定模块112的详细内容可以参照步骤S22有关的具体内容，此处不再一一赘述。

参考信息确定模块113，用于将所述目标主体对象历史产生的行为信息和所述参考主体对象历史产生的行为信息确定为目标行为信息，并根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息并写入一行为信息序列中。其中，所述参考信息确定模块113可以用于执行图2所示的步骤S23，关于该参考信息确定模块113的详细内容可以参照步骤S23有关的具体内容，此处不再一一赘述。

欺诈信息检测模块114，用于分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，并将检测到的疑似欺诈信息添加到对应的疑似欺诈信息序列中。其中，所述欺诈信息检测模块114可以用于执行图2所示的步骤S24，关于该欺诈信息检测模块114的详细内容可以参照步骤S24有关的具体内容，此处不再一一赘述。

综上所述，本发明实施例提供的基于社团挖掘的欺诈信息检测方法及系统，针对目标主体对象以及相对应的历史行为信息通过基于主体集群社团以及信息集群社团的数据挖掘方式进行疑似欺诈信息的检测，可以有效的检测出目标主体对象对应的行为信息是否存在疑似欺诈信息。

更进一步地，本发明实施例再将目标主体对象历史产生的行为信息和参考主体对象历史产生的行为信息均确定为目标行为信息，并根据目标行为信息对应的信息类别标签，在目标行为信息匹配的行为信息集群社团中获取与目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为目标行为信息对应的参考行为信息，得到行为信息序列，分别计算目标主体对象与行为信息序列中每个行为信息之间的关联参数，并根据关联参数在行为信息序列中检测疑似欺诈信息。由此可见，行为信息序列不仅可以包括参考主体对象历史产生的行为信息，还可以包括目标行为信息对应的参考行为信息。因此，尽管在主体对象历史产生的行为信息的数量过少的情况下，也可以通过目标行为信息对应的参考行为信息扩充行为信息序列中的行为信息数量，进而可以提高信息挖掘和检测的准确性。

以上所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。通常在附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，在附图中提供的本发明的实施例的详细描述并非旨在限制本发明的保护范围，而仅仅是表示本发明的选定实施例。因此，本发明的保护范围应以权利要求的保护范围为准。此外，基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下可获得的多个其它实施例，都应属于本发明保护的范围。

Claims

1.一种基于社团挖掘的欺诈信息检测方法，其特征在于，应用于与多个主体对象设备通信连接的数据挖掘服务器，所述方法包括：

2.如权利要求1所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述方法还包括：

3.如权利要求1所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述方法还包括：

4.如权利要求1所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述方法还包括：

5.如权利要求1所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述方法还包括：

6.如权利要求1-5任意一项所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述根据目标主体对象对应的主体对象行为标签，在所述目标主体对象匹配的主体集群社团中获取与所述目标主体对象之间的匹配程度满足主体匹配条件的主体对象，作为所述目标主体对象对应的参考主体对象，包括：

7.如权利要求1-6任意一项所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述根据所述目标行为信息对应的信息类别标签，在所述目标行为信息匹配的行为信息集群社团中获取与所述目标行为信息之间的匹配程度满足信息匹配条件的行为信息，作为所述目标行为信息对应的参考行为信息，包括：

8.如权利要求1所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述分别计算所述目标主体对象与所述行为信息序列中每个行为信息之间的关联参数，并根据所述关联参数在所述行为信息序列中检测所述目标主体对象对应的行为信息是否存在疑似欺诈信息，包括：

将所述行为信息序列中的每个行为信息作为候选信息；

9.如权利要求8所述的基于社团挖掘的欺诈信息检测方法，其特征在于，所述计算所述目标主体对象与每个所述候选信息之间的关联参数，包括：

10.一种基于社团挖掘的欺诈信息检测系统，其特征在于，应用于与多个主体对象设备通信连接的数据挖掘服务器，所述系统包括：