具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
图1是本说明书一示例性实施例示出的一种赌博群组的识别方法的流程示意图。
上述赌博群组的识别方法可以应用在识别平台,所述识别平台通常为赌博群组识别服务提供商部署的服务器或者服务器集群。
请参考图1,所述赌博群组的识别方法可以包括以下步骤:
步骤102,获取目标群组中群组成员之间的资源流转信息。
在本实施例中,要对目标群组进行识别,以确定目标群组是否为赌博群组。
所述目标群组可以是在即时通信软件中组建的群组,例如:QQ群组、微信群组等。
所述目标群组也可以是在网络社区、网络论坛等网站中组建的群组,本说明书对此不作特殊限制。
在本实施例中,可以获取目标群组中群组成员之间的资源流转信息,例如,资金流向等资金流动信息。
举例来说,假设在目标群组中,群组成员A给群组成员B发了一个10元的红包,那么本次发红包的资金流向为成员A到成员B。
在本实施例中,可以获取一段时间内目标群组中群组成员之间的资源流转信息,以进行后续判断。
步骤104,根据所述资源流转信息,采用PageRank算法计算所述目标群组中群组成员的PageRank值。
基于前述步骤102,在获取到目标群组中群组成员之间的资源流转信息后,可以根据该资源流转信息为所述目标群组构建有向图。
在本实施例中,可以将目标群组中的群组成员抽象为有向图中的节点,然后根据资源流转的方向和数量构建有向图。
仍以步骤102中发红包为例,可以将成员A抽象为A点,将成员B抽象为B点,进而构建图2所示的有向图。该有向图的方向为A点到B点。
基于构建的有向图,可以采用PageRank算法,计算所述目标群组中群组成员的PageRank值(也可称之为PR值)。
具体而言,可以将构建的有向图抽象为对应的转移矩阵,然后将该转移矩阵与各节点的初始PageRank矩阵进行迭代,直至各节点的PageRank矩阵收敛。收敛的PageRank矩阵中的元素值是有向图中各节点的PageRank值。
当然,在实际应用中,也可以不进行有向图的构建,直接采用资源流转信息计算群组成员的PageRank值,本说明书对此不作特殊限制。
可选的,在另一个例子中,所述资源流转信息还可以包括流转的资金金额,利用资金金额可以先对所述资源流转信息进行清洗。例如,可以过滤掉资金金额低于阈值的资源流转信息,利用资金金额大于等于该阈值的资源流转信息计算所述目标群组中群组成员的PageRank值。
步骤106,根据所述PageRank值识别所述目标群组是否为赌博群组。
基于前述步骤104,在计算出目标群组中群组成员的PageRank值后,可以判断PageRank值分布特征是否匹配赌博群组对应的非法特征,若匹配,则可以确定目标群组为赌博非法群组。若不匹配,则可以确定目标群组不是赌博群组。
在本实施例中,由于有向图可以直观展现出图中各节点之间的特征,所以可以基于已识别出的赌博群组中群组成员之间的资源流转信息所构建的有向图确定上述赌博群组对应的非法特征。
由以上描述可以看出,本说明书可以根据群组成员的资源流转信息计算目标群组中群组成员的PageRank值,进而根据PageRank值对赌博群组进行识别,有效提高了赌博群组识别的覆盖率和准确率。
下面结合赌博群组的非法特征,对本说明书的上述实现过程进行具体描述。
图3是本说明书一示例性实施例示出的一种赌博群组的识别方法的流程示意图。
请参考图3,所述赌博群组的识别方法可以包括以下步骤:
步骤302,获取目标群组中群组成员之间的资金流动信息。
在本实施例中,所述资金流动信息可以包括:资金流向和资金金额。
根据所述资金金额可以对资金流动信息进行过滤,例如,过滤掉资金金额较小的资金流动信息等。
步骤304,根据所述资金流向,采用PageRank算法计算所述目标群组中群组成员的PageRank值。
在本实施例中,步骤302至步骤304的具体实现过程可以参考前述图1所示实施例中的步骤102至步骤104,本实施例在此不再一一赘述。
步骤306,获取最大PageRank值对应的群组成员的成员数量。
基于前述步骤304,在计算得到各个群组成员的PageRank值后,可以将PageRank值按照大小进行排序,然后获取最大PageRank值对应的群组成员的成员数量。
举例来说,假设目标群组的群组成员的最大PageRank值为X1,若仅存在1个群组成员的PageRank值为X1,则可以确定最大PageRank值对应的群组成员的成员数量为1;若存在2个群组成员的PageRank值为X1,则可以确定最大PageRank值对应的群组成员的成员数量为2。
步骤308,计算最大PageRank值与次大PageRank值的差值,作为第一差值。
基于前述步骤304,在计算得到各个群组成员的PageRank值后,还可以计算最大PageRank值与次大PageRank值的差值,为便于区分,可以将该差值称为第一差值。
步骤310,计算除最大值之外的其他PageRank值两两之间的差值,作为第二差值组,所述第二差值组包括若干第二差值。
基于前述步骤304,在计算得到各个群组成员的PageRank值后,还可以排除最大PageRank值,在剩余的PageRank值中,计算任意两个PageRank值的差值,为了便于区分,可以将该差值称为第二差值,进而得到第二差值组。
步骤312,当所述成员数量为一、所述第一差值大于第一阈值、且所述第二差值组中的第二差值均小于第二阈值时,确定所述目标群组是赌博群组。
在本实施例中,在得到最大PageRank值对应的群组成员的成员数量、第一差值、第二差值组之后,可以判断该成员数量、第一差值以及第二差值组是否匹配赌博群组的特征。
具体而言,在赌博群组中进行一次赌博行为时,通常只有一个庄家,有若干个赌徒,资金流向也较为集中,几乎都是由赌徒流向庄家,而庄家流向赌徒的资金金额相较于赌徒流向庄家的资金金额会少很多。此外,赌徒之间几乎没有资金流转。
而普通的合法群组也会存在资金流转,例如:发红包等。然而,合法群组的资金流转方向较为分散,不会集中在一个群组成员中。此外,合法群组资金流转的金额也不固定,可多可少,不会呈现出赌博群组中流向庄家多、流向赌徒少的情形。
通过赌博群组群组成员之间的资源流转信息所构建的有向图,可以直观总结出上述特点。针对赌博群组的上述特点可以得到赌博群组的最大PageRank值对应的群组成员的成员数量为1(对应资金流向集中)、所述第一差值大于第一阈值(对应庄家流向赌徒的资金金额相较于赌徒流向庄家的资金金额少很多)、且所述第二差值组中的第二差值均小于第二阈值(对应赌徒之间几乎没有资金流转)。
其中,第一阈值和第二阈值的初始值可以由开发人员预先进行设置,例如:开发人员可以根据已识别出的赌博群组的第一差值、第二差值设置上述第一阈值和第二阈值。后续在对赌博群组进行识别的过程中,可以根据识别出的赌博群组的第一差值和第二差值对初始的第一阈值和初始的第二阈值进行调整,以将赌博群组的上述特征调整的更为精准。
由此,在本实施例中,基于前述步骤306至步骤310,可以分别判断最大PageRank值对应的群组成员的成员数量是否为1、第一差值是否大于第一阈值、第二差值是否均小于第二阈值。
若最大PageRank值对应的群组成员的成员数量为1、第一差值大于第一阈值、且第二差值均小于第二阈值这三点均满足,则可以确定目标群组为赌博群组。
若上述三点有任意一点不满足,例如:第一查找小于第一阈值,或最大PageRank值对应的群组成员的成员数量不是1等,则可以确定目标群组不是赌博群组。
可选的,基于本说明书图3所示的实施例,还可以识别出赌博群组中的庄家和赌徒。其中,最大PageRank值对应的群组成员是庄家,除最大值之外的其他PageRank值对应的群组成员是赌徒。
群组成员ID |
PageRank值 |
1 |
0.4657 |
2 |
0.02292 |
3 |
0.02292 |
4 |
0.02292 |
5 |
0.02292 |
6 |
0.02292 |
7 |
0.02292 |
表1
请参考表1所示的赌博群组中群组成员的PageRank表,最大PageRank值为0.4657,最大PageRank值对应的群组成员数量为1;最大PageRank值0.4657与次大PageRank值0.02292的第一差值0.44278,除最大值之外的其他PageRank值之间的第二差值均为0,远小于第一差值0.44278。
基于表1所示的PageRank表,可以确定1号群组成员是庄家,2号至7号群组成员是赌徒。
由以上描述可以看出,本说明书在根据群组成员的资金流向识别出赌博群组的基础上,还可以根据群组成员的PageRank值识别出赌博群组的庄家和赌徒。
与前述赌博群组的识别方法的实施例相对应,本说明书还提供了赌博群组的识别装置的实施例。
本说明书赌博群组的识别装置的实施例可以应用在服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在服务器的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本说明书赌博群组的识别装置所在服务器的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的服务器通常根据该服务器的实际功能,还可以包括其他硬件,对此不再赘述。
图5是本说明书一示例性实施例示出的一种赌博群组的识别装置的框图。
请参考图5,所述赌博群组的识别装置400可以应用在前述图4所示的服务器中,包括有:信息获取单元401、PR值计算单元402以及群组识别单元403。
其中,信息获取单元401,获取目标群组中群组成员之间的资源流转信息;
PR值计算单元402,根据所述资源流转信息,采用PageRank算法计算所述目标群组中群组成员的PageRank值;
群组识别单元403,根据所述PageRank值识别所述目标群组是否为赌博群组。
可选的,所述群组识别单元403:
获取最大PageRank值对应的群组成员的成员数量;
计算PageRank最大值与次大值的差值,作为第一差值;
计算除最大值之外的其他PageRank值两两之间的差值,作为第二差值组,所述第二差值组包括若干第二差值;
当所述成员数量为一、所述第一差值大于第一阈值、且所述第二差值组中的第二差值均小于第二阈值时,确定所述目标群组是赌博群组。
可选的,所述群组识别单元403,还确定最大PageRank值对应的群组成员是赌博庄家;确定除最大值之外的其他PageRank值对应的群组成员是赌徒。
可选的,所述资源流转信息包括:资金流向。
可选的,用于识别赌博群组的所述成员数量为一、所述第一差值大于第一阈值和所述第二差值组中的第二差值均小于第二阈值这三项特征是根据已识别出的赌博群组中群组成员之间的资源流转信息所构建的有向图确定。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
与前述赌博群组的识别方法的实施例相对应,本说明书还提供一种赌博群组的识别装置,该赌博群组的识别装置包括:处理器以及用于存储机器可执行指令的存储器。其中,处理器和存储器通常借由内部总线相互连接。在其他可能的实现方式中,所述设备还可能包括外部接口,以能够与其他设备或者部件进行通信。
在本实施例中,通过读取并执行所述存储器存储的与赌博群组的识别逻辑对应的机器可执行指令,所述处理器被促使:
获取目标群组中群组成员之间的资源流转信息;
根据所述资源流转信息,采用PageRank算法计算所述目标群组中群组成员的PageRank值;
根据所述PageRank值识别所述目标群组是否为赌博群组。
可选的,当根据所述PageRank值识别所述目标群组是否为赌博群组时,所述处理器被促使:
获取最大PageRank值对应的群组成员的成员数量;
计算PageRank最大值与次大值的差值,作为第一差值;
计算除最大值之外的其他PageRank值两两之间的差值,作为第二差值组,所述第二差值组包括若干第二差值;
当所述成员数量为一、所述第一差值大于第一阈值、且所述第二差值组中的第二差值均小于第二阈值时,确定所述目标群组是赌博群组。
可选的,通过读取并执行所述存储器存储的与赌博群组的识别逻辑对应的机器可执行指令,所述处理器还被促使:
确定最大PageRank值对应的群组成员是赌博庄家;
确定除最大值之外的其他PageRank值对应的群组成员是赌徒。
可选的,所述资源流转信息包括:资金流向。
可选的,用于识别赌博群组的所述成员数量为一、所述第一差值大于第一阈值和所述第二差值组中的第二差值均小于第二阈值这三项特征是根据已识别出的赌博群组中群组成员之间的资源流转信息所构建的有向图确定。
与前述赌博群组的识别方法的实施例相对应,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取目标群组中群组成员之间的资源流转信息;
根据所述资源流转信息,采用PageRank算法计算所述目标群组中群组成员的PageRank值;
根据所述PageRank值识别所述目标群组是否为赌博群组。
可选的,所述根据所述PageRank值识别所述目标群组是否为赌博群组,包括:
获取最大PageRank值对应的群组成员的成员数量;
计算PageRank最大值与次大值的差值,作为第一差值;
计算除最大值之外的其他PageRank值两两之间的差值,作为第二差值组,所述第二差值组包括若干第二差值;
当所述成员数量为一、所述第一差值大于第一阈值、且所述第二差值组中的第二差值均小于第二阈值时,确定所述目标群组是赌博群组。
可选的,还包括:
确定最大PageRank值对应的群组成员是赌博庄家;
确定除最大值之外的其他PageRank值对应的群组成员是赌徒。
可选的,所述资源流转信息包括:资金流向。
可选的,用于识别赌博群组的所述成员数量为一、所述第一差值大于第一阈值和所述第二差值组中的第二差值均小于第二阈值这三项特征是根据已识别出的赌博群组中群组成员之间的资源流转信息所构建的有向图确定。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。