具体实施方式
为了实现本申请的目的,本申请实施例提供了一种规则处理方法和设备,获取交易事件信息数据库中包含的多条交易事件信息,每一条所述交易事件信息中包含交易事件和所述交易事件所命中的规则;分别计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值;根据所述距离值,对所述多条交易事件信息中包含的所述交易事件所命中的不同规则执行聚类操作。这样,通过对系统中包含的规则执行聚类操作,将系统中包含的规则进行分级,并根据分级结果,能够有效地识别出冗余规则,进而提升系统内规则的监控效率,提高互联网信息处理平台交易业务的安全性。
需要说明的是,本申请实施例中所涉及到的规则可以是用于识别互联网中产生的交易事件的风险程度,还可以是用于识别互联网中产生的交易事件的其它方面,这里不做具体限定。
下面结合说明书附图对本申请各个实施例作进一步地详细描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种规则处理方法的流程示意图。所述方法可以如下所述。
步骤101:获取交易事件信息数据库中包含的多条交易事件信息。
其中,每一条所述交易事件信息中包含交易事件和所述交易事件所命中的规则。
在步骤101中,规则在产生时被赋予生命周期,也就是说,规则在被赋予的生命周期内是有效的。
系统在接收到用户发送的交易请求时,利用目前系统中有效的规则对接收到的交易请求中包含的交易事件进行审核,并确定该交易事件所命中的规则。
可选地,所述方法还包括:
根据设定的事件类型,为所述交易事件标注事件类型,
其中,设定的事件类型中包含白样本事件类型、黑样本事件类型、盗卡事件类型中的至少一种。
需要说明的是,本申请实施例中涉及到的设定的事件类型可以是根据交易事件的风险等级划分的,例如:交易事件的风险等级属于低级,那么该交易事件的事件类型属于白样本事件类型;交易事件的风险等级属于高级,那么该交易事件的事件类型属于黑样本事件类型和/或盗卡事件类型。其中,属于盗卡事件类型的交易事件的风险等级高于属于黑样本事件类型的交易事件的风险等级。
如表1所示,为交易事件信息数据库中存储的交易事件信息,每一个交易事件信息中包含交易事件的标识、交易事件所命中的规则、交易事件被标注的事件类型。
表1
需要说明的是,“1”表示是,“0”表示否。
从表1中可以看出,交易事件的标识A001,所命中的规则为Rule1和Rule2,对应的事件类型为盗卡事件类型和黑样本事件类型;
交易事件的标识A002,所命中的规则为Rule3和Rule4,对应的事件类型为白样本事件类型。
由此可见,交易事件信息数据库中存储大量的交易事件信息。在规则管理周期到达时,从交易事件信息数据库中获取多条交易事件信息,启动规则处理流程。
需要说明的是,规则管理周期可以根据规则的生命周期确定,也可以根据实际需要确定,这里不做限定。
可选地,获取交易事件信息数据库中包含的多条交易事件信息还可以通过以下方式实现:
从交易事件信息数据库中,根据交易事件被标注的事件类型,抽取出属于同一事件类型的多条交易事件信息。
例如:抽取出事件类型为黑样本事件类型的交易事件信息,即将交易事件信息数据库中“是否属于黑样本事件类型”这一项的内容为“1”的交易事件信息作为被抽取对象。
例如:如表2所示,为抽取到的事件类型为黑样本事件类型的交易事件信息:
表2
交易事件的标识 |
所命中的规则 |
是否属于盗卡事件类型 |
是否属于黑样本事件类型 |
B001 |
Rule1 |
1 |
1 |
B001 |
Rule2 |
1 |
1 |
B002 |
Rule1 |
1 |
1 |
B002 |
Rule2 |
1 |
1 |
B002 |
Rule3 |
1 |
1 |
B003 |
Rule1 |
1 |
1 |
B003 |
Rule2 |
1 |
1 |
B003 |
Rule3 |
1 |
1 |
步骤102:分别计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值。
在步骤102中,以步骤101中表2中所示的交易事件信息为例说明如何计算得到任意两条不同规则之间的距离值。
具体地,首先,提取表2中所述的交易事件信息中交易事件的标识和交易事件所命中的规则。
那么得到的信息为:提取到的交易事件的标识包含:B001、B002、B003和B004;提取到的交易事件所命中的规则包含Rule1、Rule2和Rule3。
假设,将所命中的规则作为自变量,将交易事件的标识作为变量,那么交易事件的标识与所命中的规则之间满足表3所示:
表3
交易事件的标识 |
Rule1 |
Rule2 |
Rule3 |
B001 |
1 |
1 |
0 |
B002 |
1 |
1 |
1 |
B003 |
1 |
1 |
1 |
B004 |
0 |
1 |
0 |
需要说明的是,“1”表示命中,“0”表示未命中。
可选地,在得到交易事件的标识与所命中的规则之间的关系时,可以进行数据转置,得到所命中的规则与交易事件的标识之间的关系,如表4所示:
表4
所命中规则 |
B001 |
B002 |
B003 |
B004 |
Rule1 |
1 |
1 |
1 |
0 |
Rule2 |
1 |
1 |
1 |
1 |
Rule3 |
0 |
1 |
1 |
0 |
需要说明的是,“1”表示命中,“0”表示未命中。
由此可见,所述多条交易事件信息中包含的所述交易事件所命中的规则包含:Rule1、Rule2和Rule3。
其次,分别计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值。
需要说明的是,在本申请实施例中,计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值的方式包括但不限于本申请实施例中所描述的方式,相似度计算方法、重合度计算方法都可以用来计算本申请实施例中所描述的距离值,这里不再详细描述。
方式一:计算两条不同规则的相似度,将计算得到的相似度作为所述两条不同规则之间的距离值。
假设不同规则为规则A和规则B,通过以下方式计算得到规则A和规则B之间的相似度:
其中,d(A,B)表示规则A和规则B之间的相似度;|A∩B|表示同时命中规则A和规则B的交易事件的个数;|A|表示命中规则A的交易事件的个数;|B|表示命中规则B的交易事件的个数;min{|A|,|B|}表示从命中规则A的交易事件的个数和命中规则B的交易事件的个数中取最小值。
需要说明的是,其他相似度计算的方法还包括:闵可夫斯基距离计算方法、马氏距离计算方法、汉明距离计算方法、接卡的相似系数计算方法、夹角余弦相关系数计算方法等等。
方式二:计算两条不同规则的重合度,将计算得到的重合度作为所述两条不同规则之间的距离值。
具体地,针对所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则,分别确定所述两条不同规则中每一条规则所覆盖的交易事件;根据所述每一条规则所覆盖的交易事件,确定所述两条不同规则所覆盖的交易事件的重合度;将所述重合度作为所述两条不同规则之间的距离值。
例如:假设不同规则为规则A和规则B,通过以下方式计算得到规则A和规则B之间的重合度:
其中,d(A,B)表示规则A和规则B之间的重合度,|A∪B|表示至少命中规则A和规则B中一个规则的交易事件的个数,|A∩B|表示同时命中规则A和规则B的交易事件的个数。
在这里仍以表4中所示的所述多条交易事件信息中包含的所述交易事件所命中的规则包含:Rule1、Rule2和Rule3为例,分别需要计算Rule1与Rule2之间的距离值,Rule2与Rule3之间的距离值以及Rule2与Rule3之间的距离值。
那么在得到Rule1与Rule2之间的距离值,Rule2与Rule3之间的距离值以及Rule2与Rule3之间的距离值时,可以得到关于Rule1、Rule2和Rule3距离矩阵。如表5所示,为得到Rule1、Rule2和Rule3距离矩阵的示意表:
表5
|
Rule1 |
Rule2 |
Rule3 |
Rule1 |
0 |
0.25 |
0.3333 |
Rule2 |
0.25 |
0 |
0.5 |
Rule3 |
0.3333 |
0.5 |
0 |
由此可见,从表5中可以清楚看到两条不同规则之间的距离值。
需要说明的是,建立距离矩阵时根据规则的个数,假设规则为N条,那么建立的距离矩阵为N*N矩阵。
步骤103:根据所述距离值,对所述多条交易事件信息中包含的所述交易事件所命中的不同规则执行聚类操作。
在步骤103中,针对计算得到的所述距离值,按照距离值的大小顺序,依次聚合每一个距离值对应的两条规则。
从表5中可以看出,Rule1与Rule2之间的距离值为0.25,Rule2与Rule3之间的距离值为0.5,Rule1与Rule3之间的距离值为0.3333。那么按照距离值的大小顺序,依次聚合每一个距离值对应的两条规则的方式为:
首先,将Rule1与Rule2进行聚合,得到聚合类;
其次,将得到的聚合类与Rule3进行聚合,得到最终的聚合类。
如图2所示,得到Rule1、Rule2和Rule3的聚类图。
需要说明的是,如果执行聚类操作的规则数量比较大时,可以预先确定聚类的次数,这样在达到预先确定的聚类次数时,即可停止本次聚类。
这样,可以在保证对规则进行分级的同时,有效减少系统的计算量,保证系统的运行效率。
可选地,在对不同规则执行聚类操作过程中,所述方法还包括:
针对执行聚类操作的两条规则,从所述多条交易事件信息中包含的所述交易事件中,分别确定每一条规则所覆盖的被标注为白样本事件类型的交易事件个数,以及确定所述两条规则相互覆盖的被标注为黑样本事件类型的交易事件的概率,以及确定所述两条规则对应的相关性矩阵。。
其中,确定所述两条规则(例如:规则A和规则B)相互覆盖的被标注为黑样本事件类型的交易事件的概率可以包含规则A对规则B覆盖的被标注为黑样本事件类型的交易事件的概率,还可以包括规则B对规则A覆盖的被标注为黑样本事件类型的交易事件的概率。
需要说明的是,规则A对规则B覆盖的被标注为黑样本事件类型的交易事件的概率与规则B对规则A覆盖的被标注为黑样本事件类型的交易事件的概率可以相同,也可以不相同。
例如:仍以上述Rule1和Rule2为例进行说明。Rule2对Rule1覆盖的被标注为黑样本事件类型的交易事件的概率为3/3=1;Rule1对Rule2覆盖的被标注为黑样本事件类型的交易事件的概率为3/4=0.75。
根据确定的所述个数、所述概率以及所述相关性矩阵,确定所述两条规则是否属于冗余规则。
通过计算得到的所述个数、所述概率以及所述相关性矩阵,可以确定不同规则之间相关性的强弱。当两个规则的相关性较强、且其中一个规则审核的交易事件已被另一个规则大量覆盖时,那么可以视为这两个规则属于冗余规则,需要删除其中一个规则,以保证监控系统中规则的有效性,这样便于提升监控系统的监控效率。
步骤104:在对不同规则执行聚类操作过程中,将不同规则进行聚合的方式转换成可视化的图形输出显示。
在步骤104中,在对不同规则执行聚类操作过程中,可以将规则的逐步聚合的过程构建成为可视化规则关系网络,输出显示给系统管理者。
如图3所示,为Rule1、Rule2和Rule3的执行聚类操作构建的可视化规则关系网络的示意图。
通过本申请实施例所述的规则处理方法,获取交易事件信息数据库中包含的多条交易事件信息,每一条所述交易事件信息中包含交易事件和所述交易事件所命中的规则;分别计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值;根据所述距离值,对所述多条交易事件信息中包含的所述交易事件所命中的不同规则执行聚类操作。这样,通过对系统中包含的规则执行聚类操作,将系统中包含的规则进行分级,并根据分级结果,能够有效地识别出冗余规则,进而提升系统内规则的监控效率,提高互联网信息处理平台交易业务的安全性。
图4为本申请实施例提供的一种规则处理设备的结构示意图。所述规则处理设备包括:获取单元41、计算单元42和处理单元43,其中:
获取单元41,用于获取交易事件信息数据库中包含的多条交易事件信息,其中,每一条所述交易事件信息中包含交易事件和所述交易事件所命中的规则;
计算单元42,用于分别计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值;
处理单元43,用于根据所述距离值,对所述多条交易事件信息中包含的所述交易事件所命中的不同规则执行聚类操作。
具体地,所述获取单元41获取交易事件信息数据库中包含的多条交易事件信息,具体包括:
从交易事件信息数据库中,根据交易事件被标注的事件类型,抽取出属于同一事件类型的多条交易事件信息,其中,所述事件类型包含白样本事件类型、黑样本事件类型中的至少一种。
可选地,所述规则处理设备还包括:判断单元44,其中:
所述判断单元44,用于在对不同规则执行聚类操作过程中,针对执行聚类操作的两条规则,从所述多条交易事件信息中包含的所述交易事件中,分别确定每一条规则所覆盖的被标注为白样本事件类型的交易事件个数,以及确定所述两条规则相互覆盖的被标注为黑样本事件类型的交易事件的概率,以及确定所述两条规则对应的相关性矩阵;
根据确定的所述个数、所述概率以及所述相关性矩阵,确定所述两条规则是否属于冗余规则。
可选地,所述方法还包括:显示单元45,其中:
所述显示单元45,用于在对不同规则执行聚类操作过程中,将不同规则进行聚合的方式转换成可视化的图形输出显示。
具体地,所述处理单元43根据所述距离值,对所述多条交易事件信息中包含的所述交易事件所命中的不同规则执行聚类操作,具体包括:
针对计算得到的所述距离值,按照距离值的大小顺序,依次聚合每一个距离值对应的两条规则。
具体地,所述计算单元42计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值,具体包括:
针对所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则,分别确定所述两条不同规则中每一条规则所覆盖的交易事件;
根据所述每一条规则所覆盖的交易事件,确定所述两条不同规则所覆盖的交易事件的重合度;
将所述重合度作为所述两条不同规则之间的距离值。
可选地,所述规则处理设备还包括:确定单元46,其中:
所述确定单元46,用于在获取交易事件信息数据库中包含的多条交易事件信息之前,接收用户发送的交易事件;根据设定的规则,确定所述交易事件命中的规则,以及根据设定的事件类型,为所述交易事件标注事件类型。
通过本申请实施例所述的规则处理设备获取交易事件信息数据库中包含的多条交易事件信息,每一条所述交易事件信息中包含交易事件和所述交易事件所命中的规则;分别计算所述多条交易事件信息中包含的所述交易事件所命中的规则中任意两条不同规则之间的距离值;根据所述距离值,对所述多条交易事件信息中包含的所述交易事件所命中的不同规则执行聚类操作。这样,规则处理设备通过对系统中包含的规则执行聚类操作,将系统中包含的规则进行分级,并根据分级结果,能够有效地识别出冗余规则,进而提升系统内规则的监控效率,提高互联网信息处理平台交易业务的安全性。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。