CN109218211B

CN109218211B - 数据流的控制策略中阈值的调整方法、装置和设备

Info

Publication number: CN109218211B
Application number: CN201710546616.2A
Authority: CN
Inventors: 刘震; 章鹏; 阮怀玉; 杨志雄; 张英
Original assignee: Advanced New Technologies Co Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2017-07-06
Filing date: 2017-07-06
Publication date: 2022-04-19
Anticipated expiration: 2037-07-06
Also published as: CN109218211A

Abstract

本申请实施例公开了一种数据流的控制策略中阈值的调整方法、装置和设备，该方法包括：获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，该数据流包括被识别分为第一类数据流和第二类数据流；确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流；根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

Description

数据流的控制策略中阈值的调整方法、装置和设备

技术领域

本申请涉及计算机软件技术领域，尤其涉及一种数据流的控制策略中阈值的调整方法、装置和设备。

背景技术

在互联网金融风险控制领域，风险策略无疑扮演着举足轻重的角色，控制策略更是由于其简洁有效的特征而被广泛使用。随着时间的推移，金融服务请求的数据特征分布也会发生变化，为了维护风险控制系统的性能稳定，相应的风控策略参数也应随金融服务请求的数据流而变化。

例如，服务请求中的客户端IP地址这个数据特征，可包括政府部门的IP地址，高科技公司的IP地址，私人住宅的IP地址，或者是属于公共区域的网吧的IP地址。显然，这几类IP地址中所蕴含的安全风险是不一样的。但是，由于IP地址可能随着时间而变更，例如42.120.75.5现在属于支付宝，当支付宝办公地址迁移至新的办公大楼后，这个IP地址也有可能属于一个公共网吧。公共网吧的安全风险和支付宝的安全风险显然不一样。这就需要当依据IP地址对金融服务请求进行安全风险评估时所需要的估计参数随时间而变更。

当然，除了IP地址外，数据流中还可能包括其它影响安全风险评估的属性。

如何调整数据流对应的策略参数以适应数据流的分布变化，是本申请所要解决的技术问题。

发明内容

本申请实施例的目的是提供一种数据流的控制策略中阈值的调整方法、装置和设备，以根据数据流的分布变化，实现数据流的控制策略中阈值的动态调整。

为解决上述技术问题，本申请实施例是这样实现的：

第一方面，提出了一种数据流的控制策略中阈值的调整方法，该方法包括：

获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑与连接的多个逻辑模块，每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流，第一逻辑模块为该多个逻辑模块的任一个逻辑模块，第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式；

根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

第二方面，提出了一种数据流的控制策略中阈值的调整装置，该装置包括：

获取单元，获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑与连接的多个逻辑模块，每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

确定单元，确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流，第一逻辑模块为该多个逻辑模块的任一个逻辑模块，第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式；

选择单元，根据第二数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

该确定单元，还确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

第三方面，提出了一种电子设备，该电子设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行以下操作：

第四方面，提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序当被包括多个应用程序的电子设备执行时，使得该电子设备执行以下操作：

第五方面，提出了一种数据流的控制策略中阈值的调整方法，包括：

获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，所述数据流包括被识别分为第一类数据流和第二类数据流，所述控制策略包括由逻辑或操作或者逻辑与操作连接的多个基本逻辑表达式，每个基本逻辑表达式包括所述数据流的一种属性参数与所述属性参数对应的阈值的比较逻辑，所述控制策略用于控制所述数据流的分流；

确定预定时间段内的数据流到达所述控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流，每个基本逻辑表达式包括所述数据流的一种属性参数与所述属性参数对应的阈值的比较逻辑，所述控制策略用于控制所述数据流的分流；

根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，第一属性参数为第一基本逻辑表达式中的属性参数，所述基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

确定所述最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

由以上本申请实施例提供的技术方案可见，本申请实施例通过对到达基础逻辑表达式的数据流，按照基尼指数调整数据流的控制策略中数据流的属性参数对应的阈值以得到阈值分割后的基尼指数，并从中选择分流效果最佳的基尼指数对应的阈值作为属性参数调整后的阈值，从而实现数据流的控制策略中阈值的动态调整，以适应数据流的分布变化。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例数据流的控制策略中阈值的调整方法流程图。

图2是本申请的一个实施例风险控制系统的结构示意图。

图3是本申请的一个实施例新增数据经由逻辑判断分支的步骤示意图。

图4是本申请的一个实施例的一个二级逻辑模块对应的决策树。

图5是本申请的另一个实施例数据流的控制策略中阈值的调整方法流程图。

图6是本申请的一个实施例电子设备的结构示意图。

图7是本申请的一个实施例消息数据流控制策略阈值调整装置的结构示意图。

图8是本申请的一个实施例电子设备的结构示意图。

图9是本申请的一个实施例消息数据流控制策略阈值调整装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

图1是本申请一个实施例数据流的控制策略中阈值的调整方法流程图。应理解，在本申请实施例中，该方法可以由数据流控制策略阈值调整装置执行。如图1所示，该方法可包括：

S102，获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布。

其中，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑与连接的多个逻辑模块，每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流。

应理解，当前时刻的控制策略，是指在准备进行阈值调整时的数据流的控制策略。

当前时刻之前预定时间段，是指在准备进行阈值调整的时刻之前的一段时间段，该段时间段可以是与当前时刻在时间上相连，也可以与当前时刻在时间上不相连。例如，当前时刻为8:00，假设该预定时间段的长度为24小时，则该预定时间段可以与当前时刻不连续，例如前一天的数据流，即从前一天的00:00至的前一天23:59；该预定时间段可以与当前时刻连续，即从前一天的08:00至的当日的8:00。

应理解，该控制策略用于控制该数据流的分流，目的是尽可能地将数据流分成第一类数据流和第二类数据流。

应理解，数据流的属性参数与该属性参数对应的阈值的比较逻辑，即数据流中该属性参数对应的值与该属性参数对应的阈值的大小的比较。比较逻辑，可包括大于、小于、大于或等于(不小于)、小于或等于(不大于)。

S104，确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流。

其中，第一逻辑模块为该多个逻辑模块的任一个逻辑模块，第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式。

S106，根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数。

其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果。

S108，确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

本申请实施例中，通过对到达基础逻辑表达式的数据流，按照基尼指数调整数据流的控制策略中数据流的属性参数对应的阈值以得到阈值分割后的基尼指数，并从中选择分流效果最佳的基尼指数对应的阈值作为属性参数调整后的阈值，从而实现数据流的控制策略中阈值的动态调整，以适应数据流的分布变化。

可选地，步骤S104具体可实现为：

确定预定时间段内的数据流到达第一逻辑模块的第二数据流，其中，当所述第一逻辑模块为所述多个逻辑模块中数据流到达的第一个进行逻辑判决的逻辑模块时，所述第二数据流为所述预定时间段内的数据流，当所述第一逻辑模块为所述多个逻辑模块中数据流到达的第N个进行逻辑判决的逻辑模块时，所述第二数据流为第N-1个进行逻辑判决的逻辑模块中各基本逻辑表达式的逻辑判决为是的数据流，N为大于1的正整数，N不大于所述控制策略包含的逻辑模块的个数；

确定第二数据流到达第一基本逻辑表达式的逻辑判决时的第一数据流，其中，当所述第一基本逻辑表达式为第二数据流在第一逻辑模块到达的第一个进行逻辑判决的基本逻辑表达式时，所述第一数据流为所述第二数据流，当所述第一基本逻辑表达式为第二数据流在第一逻辑模块到达的第M个进行逻辑判决的基本逻辑表达式时，所述第一数据流为所述第二数据流中前M-1个逻辑判决都为否的数据流，M为大于1的正整数，M不大于第一逻辑模块包含的基本逻辑表达式的个数。

可选地，步骤S106中，还可根据数据流在第一逻辑模块中部分或全部属性参数中，按照不同阈值划分后的数据流分布情况，确定各属性参数对应的调整后阈值。

可选地，在步骤S106中，还可根据数据在控制策略中的全部或部分逻辑模块中，对各逻辑模块中部分或全部属性参数中，按照不同阈值划分后的数据流分布情况，确定各属性参数对应的调整后阈值。

为便于理解本申请实施例的方案，下面结合图2，对本申请的方案做进一步的描述。

图2是本申请的一个实施例风险控制系统的结构示意图。如图2所示，风险控制系统读取服务数据流和风险控制系统的控制策略，然后在调优系统中根据一级逻辑模块和二级逻辑模块进行阈值调优，然后得到调整后的控制策略。具体的，图2的控制策略，即本申请图1所示实施例中的控制策略，服务数据流即本申请图1所示实施例中的数据流，一级逻辑模块即本申请图1所示实施例中的“由逻辑与连接的多个逻辑模块”，二级逻辑模块即本申请图1所示实施例中的“逻辑模块”，可一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式。

不妨将服务数据流看作一张二维表，表格中的每一行代表一条由客户端发起的服务请求，包含一些服务端的基本维度变量，或者说是数据流的基本属性参数，例如，客户端所在的省份、客户端的IP、客户端的类型、服务的类型等。在一个具体的例子中，服务数据流的具体内容可如表格1中的二维表所示。

表格1

0.1	100	杭州	01.23…	ASD
					0.5	83	北京	01.20…	BER
0.7	103	上海	01.12…	QWE

控制策略是指一条由AND和OR组成的规则逻辑，用于根据规则逻辑的结果，将数据流分成两类，即TRUE还是FALSE。例如，假设一个控制策略用如下表达式表示：

(a>0.5 OR b<0.8)AND(c<4 OR d<7)

其中a，b，c，d是指数据流中的属性参数，0.5，0.8，4，7是属性参数对应的待调优的阈值。

一级逻辑模块，是指对应控制策略中的AND逻辑的数据流操作模块，在这个流程中将二级逻辑即OR逻辑当作黑盒子对待，仅关注数据流在其中的输入输出。

还是以前面所示的控制策略对应的表达式为例。在控制策略(a>0.5 OR b<0.8)AND(c<4 OR d<7)中，按照数据流经过逻辑判断分支的处理步骤，对一级逻辑模块进行说明。

图3是本申请的一个实施例新增数据经由逻辑判断分支的步骤示意图。如图3所示，新增数据0经由二级逻辑0，可分成新增数据1和要删除数据1两部分数据流，……，新增数据i经由二级逻辑i，可分成新增数据i+1和要删除数据i+1两部分数据流。

按照图3的样式，控制策略(a>0.5 OR b<0.8)AND(c<4 OR d<7)即可表示成如下步骤：数据流-->(a>0.5 OR b<0.8)-->(c<4 OR d<7)-->输出数据流。

由于控制策略的阈值是根据数据分布将其分割为TRUE或者FALSE两类，因此，需关注每个属性参数上的数据分布，也就是数据流在控制策略中的流向以及产生当前阈值的原始数据。

如图3所示一级逻辑是由多个二级逻辑模块级联构成的，每个二级逻辑模块的改变均会影响后续二级逻辑模块中的原始数据分布，因此除了新增的数据流需要流向每个后续二级逻辑模块之外，还需要处理由于前面每个二级逻辑模块的改变所导致的后续二级逻辑模块中的原始数据的改变，包括新增的数据和需要移除的原始数据。

在图3中，新增数据i是由通过二级逻辑i-1并判别为TRUE的新增数据i-1和由于二级逻辑i-1改变而通过的原始数据i-1。相似的是要删除的数据i是由因为二级逻辑i-1改变而被判别为FALSE的原始数据i-1构成。

前面讲述了一级逻辑模块中如何根据二级逻辑模块控制数据流的分布。下面，将介绍二级控制模块对数据流分布的影响。

二级逻辑模块，是指对应控制策略中OR逻辑的数据流操作模块，一系列的二级逻辑模块的逻辑与级联构成一级逻辑模块。应理解，控制策略中的每一个阈值是在二级逻辑模块中做优化调整的。

在本申请实施例中，可通过由流经每个属性参数的数据的分布情况，以及控制策略中每个属性参数对应的阈值的基尼指数(gini index)，确定控制策略中每个属性参数对应的阈值。

不妨将二级逻辑模块表示成一颗决策树的形式。在决策树中，通过决策树判别为‘是’的数据会被识别为TRUE，并流向下一个二级逻辑模块；判别为‘否’的数据会被识别为FALSE，并作为要删除的数据流向下一个二级逻辑模块。在决策树的每个节点中会记录两张到达该节点数据表，其中一张表用于存储原来的数据，另一张用于存储新到来的数据，两张表合在一起决定了当前节点属性参数的最优分割阈值，在调整了分割阈值之后原来数据的‘是否’分割也随之发生了变化，上层节点中原始数据分割由‘否’变为‘是’的数据需要传递到下层数据被删除，相似地由‘是’变‘否’的数据被添加；新到来的数据中被判别为‘否’的数据被传递至下一层，被判别为‘是’的数据通过决策树判决。

图4是本申请的一个实施例的一个二级逻辑模块对应的决策树。其所表示的二级逻辑模块为：(a>2 OR b<3 OR c>0.2)。如图4所示，在第一个判决a>2中，数据流被判别为‘是’的数据通过决策树判决，数据流被判别为‘否’的数据通过第二个判决b<3；在第二个判决b<3中，数据流被判别为‘是’的数据通过决策树判决，数据流被判别为‘否’的数据通过第三个判决c>0.2；在第三个判决c>0.2中，数据流被判别为‘是’的数据通过决策树判决。

应理解，对一个特定属性参数，有了原始数据和新到数据之后，采用以基尼指数(gini index)为标准，在该属性参数上搜索最佳阈值分割点。

应理解，在步骤S106中，可通过多种方式确定最优基尼指数。

可选地，作为一个实施例，步骤S106具体可实现为：

确定第一属性参数的阈值的第一最大值和第一最小值，并根据第一最大值、第一最小值和阈值量化分段数确定第一步长值；

计算从第一最小值起的阈值以及每次累加第一步长值后的阈值中各阈值对应的第一基尼指数，直至阈值超过第一最大值，并选择最优的第一基尼指数及对应的第一阈值；

确定第一阈值+第一步长值/2为第二最大值，确定第一阈值-第一步长值/2为第二最小值，并根据第二最大值、第二最小值和阈值量化分段数确定第二步长值；

计算从第二最小值起的阈值以及每次累加第一步长值后的阈值中各阈值对应的第二基尼指数，直至阈值超过第二最大值，并选择最优的第二基尼指数及对应的第二阈值；

如果最优的第一基尼指数与最优的第二基尼指数之差的绝对值小于或等于预定阈值，则确定最优的第二基尼指数为该最优基尼指数。

本申请实施例中，通过对阈值范围进行量化分割，求取最优基尼指数和最优阈值，再在最优阈值的上下预定范围内进行量化分割，求取最优基尼指数和最优阈值，直至最优基尼指数的波动小于或等于预定阈值，从而求得该属性参数对应的最优阈值。

当然，应理解，步骤S106还包括：如果最优的第一基尼指数与最优的第二基尼指数之差的绝对值大于预定阈值，则以第二阈值作为第一阈值，以第二阈值+第二步长值/2作为第二最大值，以第二阈值-第一步长值/2作为第二最小值，并重新根据第二最大值、第二最小值、阈值量化分段数确定第二步长值，以求取第二最大值和第二最小值调整后的最优第二基尼指数，直至最优的第一基尼指数与最优的第二基尼指数之差的绝对值小于或等于预定阈值；

确定最优的第二基尼指数为该最优基尼指数。

可选地，作为一个实施例，步骤S106具体可实现为：

确定第一属性参数的阈值的最大值、第一属性参数的阈值的最小值和循环次数P，并根据最大值、最小值和阈值量化分段数确定步长值；

对p从1至P循环执行以下步骤：计算从最小值起的阈值以及每次累加步长值后的阈值中各阈值对应的第三基尼指数，直至阈值超过最大值，并选择最优的第三基尼指数及对应的第三阈值；在p≠P时确定第三阈值+步长值/2为第一属性参数的阈值的最大值，确定第三阈值-步长值/2为第一属性参数的阈值的最小值，并根据调整后的最大值、调整后的最小值和阈值量化分段数重新确定步长值；

确定第三基尼指数为最优基尼指数。

当然，还可能有其它求取最优基尼指数的方法，在此不再一一列举。

当然，应理解，第一数据流在第一属性参数中按照阈值划分后的基尼指数，可通过如下公式确定：

Gini(f)＝|D1|/|D|Gini_D1(f)+|D2|/|D|Gini_D2(f)；

其中，f表示第一属性参数对应的阈值，Gini(f)表示阈值f对应的基尼指数，D表示第一数据流，D1表示第一数据流在第一属性参数上经过该阈值f划分后的第一集合，D2表示第一数据流在第一属性参数上经过该阈值f划分后的第二集合，绝对值符号||表示集合中数据流的条数，Gini_D1(f)表示第一集合的基尼指数，Gini_D2(f)表示第二集合的基尼指数。

集合的基尼指数可以有多种计算方式。

可选地，作为一个实施例，

Gini_D1(f)和Gini_D2(f)分别用以下公式表示：

Gini_D1(f)＝1-p₀ ²-p₁ ²；

Gini_D2(f)＝1-p₂ ²-p₃ ²；

其中，p₀表示第一类数据流在第一集合中的概率，p₁表示第二类数据流在第一集合中的概率，p₂表示第一类数据流在第二集合中的概率，p₃表示第二类数据流在第二集合中的概率。

当然，Gini_D1(f)和Gini_D2(f)还可能用其它的公式表示，本申请实施例不再一一列举。

可选地，第一类数据流为高风险数据流，第二类数据流为低风险数据流，该控制策略为风险控制策略，用于控制该数据流按风险分类分流。本申请实施例中，可将数据流分为高风险数据流和低风险数据流，并根据数据流的风险属性调整控制策略的阈值，从而使得控制策略能够适应数据流的风险变化。

可选地，在步骤S106之前，该方法还包括：

如果第一基本逻辑表达式为第一逻辑模块中的第一个基本逻辑表达式，则确定该预定时间段内的数据流为第一数据流。

或者，在步骤S106之前，该方法还包括：

如果第一基本逻辑表达式为第一逻辑模块中的第N个基本逻辑表达式，则确定该预定时间段内的数据流中指定比较逻辑都为否的数据流为第一数据流，该指定逻辑判断为第一逻辑模块中前N-1个基本逻辑表达式，N为大于1的整数。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

图5是本申请的另一个实施例数据流的控制策略中阈值的调整方法流程图。应理解，在本申请实施例中，该方法可以由数据流控制策略阈值调整装置执行。如图5所示，该方法可包括：

S502，获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布。

其中，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑或操作或者逻辑与操作连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流。

S504，确定预定时间段内的数据流到达该控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流。

其中，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流。

S505，根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数。

其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

S508，确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

可选地，步骤S504具体可实现为：按照所述控制策略中基本逻辑表达式从左到右的顺序，确定预定时间段内的数据流到达所述控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流。

本申请实施例中，除了到达基本逻辑表达式时的数据流可能与图1所示实施例存在差异外，确定基尼指数和属性参数对应的调整后阈值的具体实现方式可参考图1所示实施例，不再赘述。

图6是本申请的一个实施例电子设备的结构示意图。请参考图6，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成数据流控制策略阈值调整装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

上述如本申请图1所示实施例揭示的数据流控制策略阈值调整装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1的方法，并实现数据流控制策略阈值调整装置在图1所示实施例的功能，本申请实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下操作：

图7是本申请的一个实施例消息数据流控制策略阈值调整装置700的结构示意图。请参考图7，在一种软件实施方式中，数据流控制策略阈值调整装置700可包括：

获取单元701，获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑与连接的多个逻辑模块，每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

确定单元702，确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流，第一逻辑模块为该多个逻辑模块的任一个逻辑模块，第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式；

选择单元703，根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

确定单元702，还确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

数据流控制策略阈值调整装置700还可执行图1的方法，并实现数据流控制策略阈值调整装置在图1所示实施例的功能，本申请实施例在此不再赘述。

图8是本申请的一个实施例电子设备的结构示意图。请参考图8，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，其中，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑或操作或者逻辑与操作连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

确定预定时间段内的数据流到达该控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流，其中，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

上述如本申请图5所示实施例揭示的数据流控制策略阈值调整装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图5的方法，并实现数据流控制策略阈值调整装置在图5所示实施例的功能，本申请实施例在此不再赘述。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图5所示实施例的方法，并具体用于执行以下操作：

图9是本申请的一个实施例消息数据流控制策略阈值调整装置900的结构示意图。请参考图9，在一种软件实施方式中，数据流控制策略阈值调整装置900可包括：

获取单元901，获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，其中，该数据流包括被识别分为第一类数据流和第二类数据流，该控制策略包括由逻辑或操作或者逻辑与操作连接的多个基本逻辑表达式，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

确定单元902，确定预定时间段内的数据流到达该控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流，其中，每个基本逻辑表达式包括该数据流的一种属性参数与该属性参数对应的阈值的比较逻辑，该控制策略用于控制该数据流的分流；

选择单元903，根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，第一属性参数为第一基本逻辑表达式中的属性参数，该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

确定单元902，还确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

数据流控制策略阈值调整装置900还可执行图5的方法，并实现数据流控制策略阈值调整装置在图5所示实施例的功能，本申请实施例在此不再赘述。

总之，以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

1.一种数据流的控制策略中阈值的调整方法，包括：

获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，所述数据流包括被识别分为第一类数据流和第二类数据流，所述控制策略包括由逻辑与连接的多个逻辑模块，每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式，每个基本逻辑表达式包括所述数据流的第一属性参数与所述第一属性参数对应的阈值的比较逻辑，所述控制策略用于控制所述数据流的分流；

确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流，第一逻辑模块为所述多个逻辑模块的任一个逻辑模块，第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式；

根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，所述基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

2.如权利要求1所述的方法，

根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，包括：

如果最优的第一基尼指数与最优的第二基尼指数之差的绝对值小于或等于预定阈值，则确定最优的第二基尼指数为所述最优基尼指数。

3.如权利要求2所述的方法，

根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，还包括：

如果最优的第一基尼指数与最优的第二基尼指数之差大于预定阈值，则以第二阈值作为第一阈值，以第二阈值+第二步长值/2作为第二最大值，以第二阈值-第一步长值/2作为第二最小值，并重新根据第二最大值、第二最小值、阈值量化分段数确定第二步长值，以求取第二最大值和第二最小值调整后的最优第二基尼指数，直至最优的第一基尼指数与最优的第二基尼指数之差的绝对值小于或等于预定阈值；

确定最优的第二基尼指数为所述最优基尼指数。

4.如权利要求1所述的方法，

确定第三基尼指数为最优基尼指数。

5.如权利要求1-4中任一项所述的方法，

第一数据流在第一属性参数中按照阈值划分后的基尼指数，通过如下公式确定：

Gini（f）= |D1|/|D| Gini_D1(f) + |D2|/|D| Gini_D2(f)；

其中，f表示第一属性参数对应的阈值，Gini（f）表示阈值f对应的基尼指数，D表示第一数据流，D1表示第一数据流在第一属性参数上经过所述阈值f划分后的第一集合，D2表示第一数据流在第一属性参数上经过所述阈值f划分后的第二集合，绝对值符号| |表示集合中数据流的条数，Gini_D1(f)表示第一集合的基尼指数，Gini_D2(f)表示第二集合的基尼指数。

6.如权利要求5所述的方法，

Gini_D1(f)和Gini_D2(f)分别用以下公式表示：

Gini_D1(f)=1-p₀ ²-p₁ ²；

Gini_D2(f)=1-p₂ ²-p₃ ²；

其中， p₀表示第一类数据流在第一集合中的概率，p₁表示第二类数据流在第一集合中的概率，p₂表示第一类数据流在第二集合中的概率，p₃表示第二类数据流在第二集合中的概率。

7.如权利要求1所述的方法，

确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流，包括：

确定预定时间段内的数据流为到达第一逻辑模块的第二数据流，其中，当所述第一逻辑模块为所述多个逻辑模块中数据流到达的第一个进行逻辑判决的逻辑模块时，所述第二数据流为所述预定时间段内的数据流，当所述第一逻辑模块为所述多个逻辑模块中数据流到达的第N个进行逻辑判决的逻辑模块时，所述第二数据流为第N-1个进行逻辑判决的逻辑模块中各基本逻辑表达式的逻辑判决为是的数据流，N为大于1的正整数，N不大于所述控制策略包含的逻辑模块的个数；

确定第二数据流为到达第一基本逻辑表达式的逻辑判决时的第一数据流，其中，当所述第一基本逻辑表达式为第二数据流在第一逻辑模块到达的第一个进行逻辑判决的基本逻辑表达式时，所述第一数据流为所述第二数据流，当所述第一基本逻辑表达式为第二数据流在第一逻辑模块到达的第M个进行逻辑判决的基本逻辑表达式时，所述第一数据流为所述第二数据流中在所述第一逻辑模块前M-1个逻辑判决都为否的数据流，M为大于1的正整数，M不大于第一逻辑模块包含的基本逻辑表达式的个数。

8.如权利要求1所述的方法，

第一类数据流为高风险数据流，第二类数据流为低风险数据流。

9.一种数据流的控制策略中阈值的调整方法，包括：

获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，所述数据流包括被识别分为第一类数据流和第二类数据流，所述控制策略包括由逻辑或操作或者逻辑与操作连接的多个基本逻辑表达式，每个基本逻辑表达式包括所述数据流的第一属性参数与所述第一属性参数对应的阈值的比较逻辑，所述控制策略用于控制所述数据流的分流；

确定预定时间段内的数据流到达所述控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流；

10.如权利要求9所述的方法，

确定预定时间段内的数据流到达所述控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流，包括：

按照所述控制策略中基本逻辑表达式从左到右的顺序，确定预定时间段内的数据流到达所述控制策略中第一基本逻辑表达式的逻辑判决时的第一数据流。

11.一种数据流的控制策略中阈值的调整装置，包括：

获取单元，获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布，所述数据流包括被识别分为第一类数据流和第二类数据流，所述控制策略包括由逻辑与连接的多个逻辑模块，每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式，每个基本逻辑表达式包括所述数据流的第一属性参数与所述第一属性参数对应的阈值的比较逻辑，所述控制策略用于控制所述数据流的分流；

确定单元，确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流，第一逻辑模块为所述多个逻辑模块的任一个逻辑模块，第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式；

选择单元，根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数，选择最优基尼指数，其中，所述基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果；

所述确定单元，还确定所述最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

12.一种电子设备，包括：

处理器；以及

13.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：