CN110009167A

CN110009167A - 交易风险策略推荐方法、装置、服务器及存储介质

Info

Publication number: CN110009167A
Application number: CN201810008002.3A
Authority: CN
Inventors: 叶芸; 赵闻飙; 金宏
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2018-01-04
Filing date: 2018-01-04
Publication date: 2019-07-12

Abstract

本发明实施例提供了一种交易风险策略推荐方法，根据新增样本进行决策树训练，并依据决策树的规则路径进行策略推荐，由此，当有新样本输入之后，可自动实现策略推荐，无需靠个人经验进行判断，解放人力的同时，可提高准确性。

Description

交易风险策略推荐方法、装置、服务器及存储介质

技术领域

本说明书实施例涉及互联网技术领域，尤其涉及一种交易风险策略推荐方法、装置、服务器及存储介质。

背景技术

随着互联网的快速发展，各种形式的业务不断涌现，如在线银行、在线支付、在线购物等基于互联网的服务业务。人们已经越来越习惯在网上进行各种生活或商务活动。

由于互联网是一个开放的网络，任何人在任何地方都可以很方便地连接到互联网上。互联网在给人们生活提供便利的同时，也带来了风险。尤其是随着电子商务平台和第三方交易平台的发展，网络金融犯罪以及网上诈骗、信用卡盗刷等不断出现。因此，确定交易是否存在风险越来越重要。

发明内容

本说明书实施例提供及一种交易风险策略推荐方法、装置、服务器及存储介质。

第一方面，本说明书实施例提供一种交易风险策略推荐方法，包括：

获取有关风险交易的样本数据；

将所述样本数据划分为多组不同的预测集和训练集，利用训练集分多次训练出多个决策树；

对于每棵决策树采取该决策树对应的预测集进行预测；

统计各叶子节点被预测集数据击中的次数，选择被击中次数最多的叶子节点的规则路径进行策略推荐。

第二方面，本说明书实施例提供一种交易风险策略推荐装置，包括：

获取单元，用于获取有关风险交易的样本数据；

分组单元，用于将所述样本数据划分为多组不同的预测集和训练集

训练单元，用于利用训练集分多次训练出多个决策树；

预测单元，用于对于每棵决策树采取该决策树对应的预测集进行预测；

推荐单元，用于统计各叶子节点被预测集数据击中的次数，选择被击中次数最多的叶子节点的规则路径进行策略推荐。

第三方面，本说明书实施例提供一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行上述任一项所述方法的步骤。

第四方面，本说明书实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述方法的步骤。

本说明书实施例有益效果如下：

本说明书实施例提供的交易风险策略推荐方法中，根据新增样本进行决策树训练，并依据决策树的规则路径进行策略推荐，由此，当有新样本输入之后，可自动实现策略推荐，无需靠个人经验进行判断，解放人力的同时，可提高准确性。利用决策树算法，可自动选择策略的风险变量，运行速度快、效果高。在一种可选方式中，通过规则策略出现次数与新增策略覆盖率最大化进行结合，可推荐出最优策略。

附图说明

图1为本说明书实施例交易风险策略推荐的场景示意图；

图2为本说明书实施例第一方面提供的交易风险策略推荐方法流程图；

图3为本说明书实施例第一方面提供的交易风险策略推荐方法实例中决策树示意图；

图4为本说明书实施例第一方面提供的交易风险策略推荐方法实例流程图；

图5为本说明书实施例第二方面提供的交易风险策略推荐装置结构示意图；

图6为本说明书实施例第三方面提供的交易风险策略推荐服务器结构示意图。

具体实施方式

为了更好的理解上述技术方案，下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明，应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明，而不是对本说明书技术方案的限定，在不冲突的情况下，本说明书实施例以及实施例中的技术特征可以相互组合。

请参见图1，为本说明书实施例的交易风险策略推荐的场景示意图。终端100位于用户侧，与网络侧的服务器200通信。终端100中的交易处理客户端101可以是基于互联网实现业务的APP或网站，为用户提供交易的界面并将交易数据提供给网络侧进行处理；服务器200中的异常交易识别系统201用于对交易处理客户端101中涉及的异常交易进行识别以及风险控制。

目前网络交易中存在各种各样的风险，例如，在线支付场景中，可能存在欺诈、账号盗用、银行卡盗用等风险。为了应对这些风险，各个网站都运行维护着风险防控基础策略体系，但当新的风险形式出现，策略端需要对新风险进行分析，在短时间内补上新的策略来防控这些风险。对于新风险目前是依靠技术人员设想可能有效的策略，再进行仿真实验，再最终确定上线策略。这种办法消耗人力与时间，且不一定能达到最优效果。

第一方面，本说明书实施例提供一种交易风险策略推荐方法，请参考图2，包括S201-S204。

S201：获取有关风险交易的样本数据。

为了应对新的交易风险，当新的风险出现且目前策略无法防控时，取出包含新的案件的若干天的数据作为样本，包括黑样本数据和白样本数据。

数据需有以下几类变量：事件标识(事件ID)变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量。其中：“事件ID变量”是事件唯一标识；“黑白样本标签变量”为了区别黑白样本，黑样本是风险交易样本，白样本是正常交易样本；“是否为已有策略的稽核事件变量”指目前已有的策略是否已经识别该事件，主要用于区分该事件是被已有策略还是新策略识别，从而确定被新策略识别出的比例；“风险策略变量”是指一些基础风险变量，用于产生策略的变量，风险策略变量是根据经验设定的，例如可以包括“银行卡更换变量”、“设备更换变量”等很多个风险策略变量。

S202：将样本数据划分为多组不同的预测集和训练集，利用训练集分多次训练出多个决策树。

决策树(Decision Tree)是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，代表的是对象属性与对象值之间的一种映射关系。决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。

例如本说明书实施例可以采取CART进行决策树训练。分类回归树(CART，Classification And Regression Tree)属于一种决策树。CART假设决策树是二叉树，内部结点特征的取值为“是”和“否”，左分支是取值为“是”的分支，右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征，将输入空间即特征空间划分为有限个单元，并在这些单元上确定预测的概率分布，也就是在输入给定的条件下输出的条件概率分布。

为了训练决策树需要对样本数据划分为多组的预测集和训练集。例如将样本数据划分为多组不同的预测集和训练集的方式为：将样本数据划分为预置数目的分段；任选一个分段作为预测集，其余分段的数据集合作为训练集，构成多组中的其中一组预测集和训练集。例如预置数目N＝5，因此对数据随机切分成5段，每次取出一段作为预测集(OOT)，其余的做为训练集(INS),循环5次。假设样本数据分为5段分别为段1、段2、段3、段4、段5；那么是分别对段1作为预测集、段2-段5作为训练集；段2作为预测集、段1、段3-段5作为训练集…这样循环5次。

在确定了每组的预测集和训练集之后，即可利用训练集分多次训练出多个决策树。一棵决策树由分支节点(树的结构)和叶节点(树的输出)组成。决策树的训练的目标是通过最小化某种形式的损失函数或者经验风险,来确定每个分支函数的参数，以及叶节点的输出。决策树自上而下的循环分支学习(Recursive Regression)采用了贪心算法。每个分支节点只关心自己的目标函数。具体来说，给定一个分支节点，以及落在该节点上对应样本的观测(包含自变量与目标变量)，选择某个或某些预测变量，也许会经过一步对变量的离散化，经过搜索不同形式的分叉函数且得到一个最优解。这个分支过程,从根节点开始,递归进行,不断产生新的分支,直到满足结束准则时停止。

由于策略规则不能过于复杂，所以例如本说明书实施例中CART层数限定为5层。训练完的一棵决策树如图3所示。从图3中可知，决策树包括5层。第一层包括根节点A；第二层包括节点B、C；第三层包括节点D、E、F、G；第四层包括节点H、I、J、K、L、M、N、O；第五层包括节点P、Q、R、S、T、U。其中没有儿子节点的节点称为叶子节点。图3中，位于第四层的节点I、J、L、M、O以及位于第五层的节点P、Q、R、S、T、U都是叶子节点。

S203：对于每棵决策树采取该决策树对应的预测集进行预测，提取决策树中每个叶子节点的规则路径。

提取每个叶子节点的路径。例如图3中，最左侧的一整条分支就是一条规则策略:“A-B-D-I-P”，落在叶子节点P里的样本表示被该条规则策略击中，“被击中”的含义是表明该条规则策略能够识别出样本中的此类风险。

S204：统计各叶子节点被预测集数据击中的次数，选择被击中次数最多的叶子节点的规则路径进行策略推荐。

如前面的例子，对决策树进行了N(5)次训练，能够得到N个推荐结果。在推荐时，可对决策树的最佳策略F_K进行等权重的投票，找出出现次数最多的策略进行推荐，即统计各叶子节点被预测集数据击中的次数，选择被击中次数最多的叶子节点的规则路径进行策略推荐。

参见图4，为本说明书实施例提供的交易风险策略推荐方法实例流程图。相比于图2的实施例，图4的实施例进一步描述了对数据进行预处理(S402)、根据新增打扰率进行优先推荐的方式(S405-S406)。

S401：获取有关风险交易的样本数据。

数据需有以下几类变量：事件标识(事件ID)变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量。其中：“事件ID变量”是事件唯一标识；“黑白样本标签变量”为了区别黑白样本，黑样本是风险交易样本，白样本是正常交易样本；“是否为已有策略的稽核事件变量”指目前已有的策略中是否已经识别该事件，主要用于计算识别净案件识别增益；“风险策略变量”是指一些基础风险变量，用于产生策略的变量，风险策略变量是根据经验设定的，例如可以包括“银行卡更换变量”、“设备更换变量”等很多个风险策略变量，其目的是为了在训练决策树时确定出策略规则。

S402：对样本数据进行预处理。

对样本数据进行预处理具体可包括：(1)对数据中的缺失值进行补充，例如将数据进行缺失值填补成-99的处理；(2)将字符型变量转换为数值型变量，例如把所有的字符型变量处理成独热编码(one-hot encoding)数值型变量；(3)根据事件标识对数据进行去重处理，例如将事件ID重复的观测值去重；(4)对数据进行平滑处理，例如通过计算数据的IV值(information value,信息量)将不满足IV值阈值的变量去除(例如若IV值小于0.3则变量删除)。

S403：将样本数据划分为多组不同的预测集和训练集，利用训练集分多次训练出多个决策树。

决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。例如本说明书实施例可以采取CART进行决策树训练。分类回归树(CART，Classification And Regression Tree)属于一种决策树。CART假设决策树是二叉树，内部结点特征的取值为“是”和“否”，左分支是取值为“是”的分支，右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征，将输入空间即特征空间划分为有限个单元，并在这些单元上确定预测的概率分布，也就是在输入给定的条件下输出的条件概率分布。

在确定了每组的预测集和训练集之后，即可利用训练集分多次训练出多个决策树。由于策略规则不能过于复杂，所以例如本说明书实施例中CART层数限定为5层。训练完的一棵决策树如图3所示。

从图3中可知，决策树包括5层。第一层包括根节点A；第二层包括节点B、C；第三层包括节点D、E、F、G；第四层包括节点H、I、J、K、L、M、N、O；第五层包括节点P、Q、R、S、T、U。其中没有儿子节点的节点称为叶子节点。图3中，位于第四层的节点I、J、L、M、O以及位于第五层的节点P、Q、R、S、T、U都是叶子节点。

S404：对于每棵决策树采取该决策树对应的预测集进行预测，提取决策树中每个叶子节点的规则路径。

S405：计算每个叶子节点的新增覆盖率和新增打扰率。

计算每个叶子节点的新增覆盖率和新增打扰率目的在于，确定出新增样本被识别出的比例，从而据此进行针对新样本的策略推荐。其中：叶子节点的新增覆盖率是指叶子节点击中的总黑样本数与叶子节点击中的已有策略稽核黑样本数的差值与所有黑样本数的比值；叶子节点的新增打扰率是指叶子节点击中的总白样本数与叶子节点击中的已有策略稽核样本数的差值与所有白样本数的比值。表示如下：

新增覆盖率R＝(叶子节点击中的总黑样本数－叶子节点击中的已有策略稽核黑样本数)/所有黑样本数；

新增打扰率D＝(叶子节点击中的总白样本数－叶子节点击中的已有策略稽核样本数)/所有白样本数。

其中：“叶子节点击中的总白样本数”表示根据所有策略将白样本识别为黑样本的总数量，去除根据已有策略将白样本识别为黑样本的数量，即得到根据新策略将白样本识别为黑样本的数量。

目前线上已有的策略已经识别与打扰了部分样本，因此本说明书实施例关心的是新推荐的策略对样本的新增打扰和新增案件覆盖情况，例如叶子节点P中，本叶子节总样本数为该条策略击中的总数，还需要减去该叶子节点中已经被现有策略击中的数量，才能得到净增加的打扰量。

在具体应用中，可以将问题转化成动态规划的0-1背包问题。背包问题(Knapsackproblem)是一种组合优化的NP完全问题。问题可以描述为：给定一组物品，每种物品都有自己的重量和价格，在限定的总重量内，如何选择，才能使得物品的总价格最高。问题的名称来源于如何选择最合适的物品放置于给定背包中。还有其他代替方式来求最优解，例如蚁群算法等。物品重量可以看做为新增打扰率D，物品价值可以看做是新增覆盖率R。因此要解决最优化目标可转化为：

在给定可接受的最大新增打扰率(disturb rate)后，来寻找最大新增覆盖率的策略。由此可以得到第K棵决策树的最佳策略推荐记做F_K，以及其新增打扰率D_K和新增覆盖率R_K。即在新增打扰率小于预置的最大新增打扰率阈值的条件下，确定具有最大新增覆盖率的叶子节点。

S406：根据叶子节点被击中次数以及新增覆盖率进行策略推荐。

对于被击中次数相同的叶子节点，优先选择具有最大新增覆盖率的叶子节点的规则路径进行策略推荐。即对于被击中次数相同的策略，则对比新增覆盖率R_K，取R_K大的决策树策略进行推荐。

可见，本说明书实施例提供的交易风险策略推荐方法中，根据新增样本进行决策树训练，并依据决策树的规则路径进行策略推荐，由此，当有新样本输入之后，可自动实现策略推荐，无需靠个人经验进行判断，解放人力的同时，可提高准确性。利用决策树算法，可自动选择策略的风险变量，运行速度快、效果高。在一种可选方式中，通过规则策略出现次数与新增策略覆盖率最大化进行结合，可推荐出最优策略。

第二方面，基于同一发明构思，本说明书实施例提供一种交易风险策略推荐装置，请参考图5，包括：

获取单元501，用于获取有关风险交易的样本数据；

分组单元502，用于将所述样本数据划分为多组不同的预测集和训练集

训练单元503，用于利用训练集分多次训练出多个决策树；

预测单元504，用于对于每棵决策树采取该决策树对应的预测集进行预测；

推荐单元505，用于统计各叶子节点被预测集数据击中的次数，选择被击中次数最多的叶子节点的规则路径进行策略推荐。

在一种可选方式中，所述样本数据是新增风险对应的样本数据，且包括黑样本数据和白样本数据；所述样本数据具有事件标识变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量。

在一种可选方式中，还包括：

预处理单元506，用于对样本数据进行预处理；

所述预处理单元具体用于，对数据中的缺失值进行补充、将字符型变量转换为数值型变量、根据事件标识对数据进行去重处理、对数据进行平滑处理中的任一项或任几项组合。

在一种可选方式中，所述分组单元502具体用于：将所述样本数据划分为预置数目的分段；任选一个分段作为预测集，其余分段的数据集合作为训练集，构成所述多组中的其中一组预测集和训练集。

在一种可选方式中，，还包括计算单元507；

所述计算单元507，用于计算每个叶子节点的新增覆盖率和新增打扰率；在新增打扰率满足小于预置的最大新增打扰率阈值的条件下，确定具有最大新增覆盖率的叶子节点；

所述推荐单元505，还用于在策略推荐过程中，对于被击中次数相同的叶子节点，优先选择具有最大新增覆盖率的叶子节点的规则路径进行策略推荐。

在一种可选方式中，所述叶子节点的新增覆盖率是指所述叶子节点击中的总黑样本数与所述叶子节点击中的已有策略稽核黑样本数的差值与所有黑样本数的比值；所述叶子节点的新增打扰率是指所述叶子节点击中的总白样本数与所述叶子节点击中的已有策略稽核白样本数的差值与所有白样本数的比值。

第三方面，基于与前述实施例中交易风险策略推荐方法同样的发明构思，本发明还提供一种服务器，如图6所示，包括存储器604、处理器602及存储在存储器604上并可在处理器602上运行的计算机程序，所述处理器602执行所述程序时实现前文所述交易风险策略推荐方法的任一方法的步骤。

其中，在图6中，总线架构(用总线600来代表)，总线600可以包括任意数量的互联的总线和桥，总线600将包括由处理器602代表的一个或多个处理器和存储器604代表的存储器的各种电路链接在一起。总线600还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口606在总线600和接收器601和发送器603之间提供接口。接收器601和发送器603可以是同一个元件，即收发机，提供用于在传输介质上与各种其他装置通信的单元。处理器602负责管理总线600和通常的处理，而存储器604可以被用于存储处理器602在执行操作时所使用的数据。

第四方面，基于与前述实施例中交易风险策略推荐方法的发明构思，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前文所述交易风险策略推荐方法的任一方法的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品，该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本说明书的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然，本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样，倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内，则本说明书也意图包含这些改动和变型在内。

Claims

1.一种交易风险策略推荐方法，包括：

获取有关风险交易的样本数据；

对于每棵决策树采取该决策树对应的预测集进行预测；

2.根据权利要求1所述的方法，所述样本数据是新增风险对应的样本数据，且包括黑样本数据和白样本数据；所述样本数据具有事件标识变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量中的任一项或任几项组合。

3.根据权利要求2所述的方法，在所述获取有关风险交易的样本数据之后，还包括：对样本数据进行预处理；

所述对样本数据进行预处理包括：对数据中的缺失值进行补充、将字符型变量转换为数值型变量、根据事件标识对数据进行去重处理、对数据进行平滑处理中的任一项或任几项组合。

4.根据权利要求1所述的方法，所述将所述样本数据划分为多组不同的预测集和训练集包括：

将所述样本数据划分为预置数目的分段；

任选一个分段作为预测集，其余分段的数据集合作为训练集，构成所述多组中的其中一组预测集和训练集。

5.根据权利要求1-4任一项所述的方法，还包括：

计算每个叶子节点的新增覆盖率和新增打扰率；

在新增打扰率小于预置的最大新增打扰率阈值的条件下，确定具有最大新增覆盖率的叶子节点；

在进行策略推荐过程中，对于被击中次数相同的叶子节点，优先选择具有最大新增覆盖率的叶子节点的规则路径进行策略推荐。

6.根据权利要求5所述的方法，

所述叶子节点的新增覆盖率是指所述叶子节点击中的总黑样本数与所述叶子节点击中的已有策略稽核黑样本数的差值与所有黑样本数的比值；

所述叶子节点的新增打扰率是指所述叶子节点击中的总白样本数与所述叶子节点击中的已有策略稽核白样本数的差值与所有白样本数的比值。

7.一种交易风险策略推荐装置，包括：

获取单元，用于获取有关风险交易的样本数据；

训练单元，用于利用训练集分多次训练出多个决策树；

8.根据权利要求7所述的装置，所述样本数据是新增风险对应的样本数据，且包括黑样本数据和白样本数据；所述样本数据具有事件标识变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量。

9.根据权利要求8所述的装置，还包括：

预处理单元，用于对样本数据进行预处理；

10.根据权利要求7所述的装置，所述分组单元具体用于：将所述样本数据划分为预置数目的分段；任选一个分段作为预测集，其余分段的数据集合作为训练集，构成所述多组中的其中一组预测集和训练集。

11.根据权利要求7-10任一项所述的装置，还包括计算单元；

所述计算单元，用于计算每个叶子节点的新增覆盖率和新增打扰率；在新增打扰率满足小于预置的最大新增打扰率阈值的条件下，确定具有最大新增覆盖率的叶子节点；

所述推荐单元，还用于在策略推荐过程中，对于被击中次数相同的叶子节点，优先选择具有最大新增覆盖率的叶子节点的规则路径进行策略推荐。

12.根据权利要求13所述的装置，所述叶子节点的新增覆盖率是指所述叶子节点击中的总黑样本数与所述叶子节点击中的已有策略稽核黑样本数的差值与所有黑样本数的比值；所述叶子节点的新增打扰率是指所述叶子节点击中的总白样本数与所述叶子节点击中的已有策略稽核白样本数的差值与所有白样本数的比值。

13.一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。

14.一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。