CN115170313A

CN115170313A - 交易风险的确定方法、装置和服务器

Info

Publication number: CN115170313A
Application number: CN202210800148.8A
Authority: CN
Inventors: 陈晗; 沈丽忠; 谢立东
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2022-07-08
Filing date: 2022-07-08
Publication date: 2022-10-11

Abstract

本说明书提供了交易风险的确定方法、装置和服务器，应用于人工智能技术领域。基于该方法，具体实施前，可以先利用样本数据基于UCB算法通过强化学习训练得到能够自动进行特征工程处理的预设的特征工程模型；再利用预设的特征工程模型处理样本数据，自动得到解释性较好的样本特征数据，进而可以利用该样本特征数据通过机器学习训练得到预设的分类模型；具体实施时，可以先利用预设的特征工程模型自动对目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；再通过利用预设的分类模型处理目标特征数据，以准确地确定出目标用户是否存在交易风险。从而可以自动且高效地完成特征工程处理；并准确地确定出目标用户是否存在交易风险。

Description

交易风险的确定方法、装置和服务器

技术领域

本说明书属于人工智能技术领域，尤其涉及交易风险的确定方法、装置和服务器。

背景技术

在利用人工智能技术确定用户的交易风险时，常常需要先对用户的相关数据进行特征工程，以得到适用于预测风险的且效果较好的特征数据。

通常在具体进行特征工程时，一种方法是依赖技术人员的经验，人工进行特征工程。但这种方法具体实施时，往往处理成本相对较高、处理效率相对较低，且容易引入人为主观因素所带来的误差影响。另一种方法则是依赖神经网络中的卷积层进行特征工程。但是基于这种方法所得到的特征数据，往往解释性相对较差，不适合用于机器学习。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本说明书提供了交易风险的确定方法、装置和服务器，能够自动且高效地完成特征工程处理，得到解释性较好的特征数据；并基于上述特征数据，准确地确定出目标用户是否存在交易风险。

本说明书提供了一种交易风险的确定方法，包括：

获取关于目标用户的目标数据；

利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；

利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；

根据所述目标分类结果，确定目标用户是否存在交易风险。

在一个实施例中，所述目标数据包括目标用户的属性数据和/或目标用户的行为数据。

在一个实施例中，在获取关于目标用户的目标数据之前，所述方法还包括：

获取样本数据；

根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；

根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到符合要求的预设的特征工程模型。

在一个实施例中，所述特征工程算子包括以下至少之一：预设的缺失值中位数处理算子、预设的类别型特征的独热编码算子、预设的数据规范化与转换算子。

在一个实施例中，根据UCB算法，构造用于选择特征工程算子的决策函数，包括：

按照以下算式构建决策函数：

其中，a_t为当前次迭代处理中所选中的特征工程算子，t为当前次迭代处理所对应的迭代次数，A为预设的特征工程算子集，B为上一次迭代处理所更新的特征工程算子，Q_t(a)表示在当前次迭代处理中利用上一次选中的特征工程算子所产生的奖励数据，U_t(a)表示在当前次迭代处理中探索一个特征工程算子所产生的奖励数据，c为权重值，N_t(a)为特征工程算子的被探索次数。

在一个实施例中，根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，包括：

按照以下方式进行多次迭代处理中的当前次迭代处理：

获取上一次选中的特征工程算子所产生的奖励数据，以及上一次的目标特征工程算子集；

利用上一次选中的特征工程算子所产生的奖励数据和样本数据，通过求解决策函数，以使智能体从预设的特征工程算子集中确定出当前次选中的特征工程算子；

根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集；

利用当前次的目标特征工程算子集对样本数据进行特征工程处理，得到当前次的样本特征数据；

根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据。

在一个实施例中，根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据，包括：

利用初始的分类模型处理当前次的样本特征数据，得到当前次的分类结果；

根据当前次的分类结果，通过进行交叉验证，以确定当前次选中的特征工程算子所产生的奖励数据。

在一个实施例中，在根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集之后，所述方法还包括：

检测当前次迭代处理所对应的迭代次数是否等于预设的迭代次数阈值；和/或，检测当前次迭代处理中的决策函数是否收敛；

在确定当前次迭代处理所对应的迭代次数等于预设的迭代次数阈值；和/或，确定当前次迭代处理中的决策函数收敛的情况下，确定得到符合要求的预设的特征工程模型。

在一个实施例中，在确定得到符合要求的预设的特征工程模型之后，所述方法还包括：

获取初始的分类模型；

利用预设的特征工程模型处理样本数据，得到样本特征数据；

利用样本特征数据对初始的分类模型进行机器学习，以得到符合要求的预设的分类模型。

在一个实施例中，所述初始的分类模型包括基于XGboost的结构的模型。

本说明书还提供了一种数据处理方法，包括：

获取与目标应用场景关联的样本数据；

根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到针对目标应用场景且符合要求的预设的特征工程模型。

本说明书还提供了一种交易风险的确定装置，包括：

获取模块，用于获取关于目标用户的目标数据；

第一处理模块，用于利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；

第二处理模块，用于利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；

确定模块，用于根据所述目标分类结果，确定目标用户是否存在交易风险。

本说明书还提供了一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现所述交易风险的确定方法的相关步骤。

本说明书还提供了一种计算机可读存储介质，其上存储有计算机指令，所述指令被处理器执行时实现所述交易风险的确定方法的相关步骤。

本说明书还提供了一种计算机程序产品，包含有计算机程序，所述计算机程序被处理器执行时实现所述交易风险的确定方法的相关步骤。

基于本说明书提供的交易风险的确定方法、装置和服务器，具体实施前，可以先利用样本数据基于UCB算法通过强化学习训练得到能够自动进行特征工程处理的预设的特征工程模型；再利用预设的特征工程模型处理样本数据，自动得到解释性较好且适用于机器学习的样本特征数据；进而可以利用上述样本特征数据通过机器学习训练得到精度较高的预设的分类模型。具体实施时，可以先利用预设的特征工程模型自动对目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；再利用预设的分类模型通过处理目标特征数据，以准确地确定出目标用户是否存在交易风险。这样，一方面由于不需要依赖技术人员的经验来人工进行特征工程，而是直接利用预设的特征工程模型来自动且高效地完成特征工程处理，从而可以有效地降低处理成本，提高处理效率。另一方面又由于通过上述预设的特征工程模型处理得到的目标特征数据相对于通过神经网络得到的特征数据，具有更好的解释性且更适合机器学习，同时也不会引入人为主观因素所带来的误差影响，从而能够利用预设的分类模型基于上述特征数据，较为准确地确定出目标用户是否存在交易风险，减少了确定时的误差。

附图说明

为了更清楚地说明本说明书实施例，下面将对实施例中所需要使用的附图作简单地介绍，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书的一个实施例提供的交易风险的确定方法的流程示意图；

图2是在一个场景示例中，应用本说明书实施例提供的交易风险的确定方法的一种实施例的示意图；

图3是在一个场景示例中，应用本说明书实施例提供的交易风险的确定方法的一种实施例的示意图；

图4是在一个场景示例中，应用本说明书实施例提供的交易风险的确定方法的一种实施例的示意图；

图5是在一个场景示例中，应用本说明书实施例提供的交易风险的确定方法的一种实施例的示意图；

图6是本说明书的一个实施例提供的数据处理方法的流程示意图；

图7是本说明书的一个实施例提供的服务器的结构组成示意图；

图8是本说明书的一个实施例提供的交易风险的确定装置的结构组成示意图；

图9是本说明书的一个实施例提供的数据处理装置的结构组成示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

参阅图1，本说明书实施例提供了一种交易风险的确定方法。其中，该方法具体应用于服务器一侧。具体实施时，该方法可以包括以下内容：

S101：获取关于目标用户的目标数据；

S102：利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；

S103：利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；

S104：根据所述目标分类结果，确定目标用户是否存在交易风险。

在一些实施例中，上述交易风险的确定方法具体可以应用于服务器一侧。其中，上述服务器可以配置有预先训练得到的预设的特征工程模型和预设的分类模型。

其中，参阅图2所示，上述服务器具体可以包括一种应用于网络平台(例如，XX银行的网络平台)一侧，能够实现数据传输、数据处理等功能的后台服务器。具体的，所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者，所述服务器也可以为运行于该电子设备中，为数据处理、存储和网络交互提供支持的软件程序。在本实施例中，并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器，也可以为几个服务器，或者，由若干服务器形成的服务器集群。

当目标用户前往相应的线下网点申请办理相关业务(例如，XX银行针对信用较好不存在交易风险的用户推出的信贷业务等)时，网点的工作人员需要先判断该目标用户是否符合办理该业务的条件，例如，确定该目标用户是否存在交易风险。

具体实施时，参阅图2所示，工作人员可以通过终端向服务器发起针对该目标用户的交易风险确定请求。

其中，上述终端具体可以包括一种应用于工作人员一侧，能够实现数据采集、数据传输等功能的前端。具体的，所述终端例如可以为台式电脑、平板电脑、笔记本电脑、智能手机等电子设备。或者，所述终端也可以为能够运行于上述电子设备中的软件应用。例如，可以是在智能手机上安装并运行的XX电子银行客户端APP等。

其中，上述交易风险确定请求至少可以携带有目标用户的用户标识。上述用户标识具体可以理解为能够用于指示目标用户的标识信息。例如，目标用户的姓名、账户名、用户编号等等。当然，上述所列举的用户标识只是一种示意性说明。具体实施时，根据具体的应用场景和处理需求，上述用户标识还可以包括其他类型的标识信息。对此，本说明书不作限定。

需要说明的是，在本说明书中所涉及到的与用户相关的信息数据均为在用户知晓且同意的前提下获取和使用的。并且对于上述信息数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。

相应的，服务器可以接收并响应该交易风险确定请求，获取目标用户的目标数据；并利用本说明书所提供的交易风险的确定方法，调用预设的特征工程模型和预设的分类模型通过处理目标用户的目标数据，确定出目标用户是否存在交易风险，得到对应的风险确定结果；再将该风险确定结果反馈给终端。

终端向工作人员展示风险确定结果。工作人员根据该风险确定结果，确定目标用户是否存在交易风险，进而确定是否为该目标用户办理相关业务。

在一些实施例中，服务器可以接收并响应上述交易风险确定请求，根据目标用户的用户标识获取目标用户的目标数据。

在一些实施例中，所述目标数据具体可以包括目标用户的属性数据和/或目标用户的行为数据等。

其中，上述目标用户的属性数据具体可以包括：目标用户的年龄、居住城市、学历、职业等等。上述目标用户的行为数据具体可以包括：目标用户预设时间段内(例如，最近一周等)的购物记录、转账记录、信贷偿付记录等。

具体实施时，服务器可以根据目标用户的用户标识查询目标用户的用户数据库，以获取目标用户的属性数据；和/或，根据目标用户的用户标识查询目标用户的历史交易数据记录，以获取目标用户的行为数据。

在一些实施例中，上述预设的特征工程模型具体可以理解为一种能够自动对数据进行特征工程处理，以从中提取出解释性较好、较为准确的用于分类的特征数据的模型。

其中，上述预设的特征工程模型具体可以是预先利用样本数据基于UCB算法通过强化学习训练得到的模型。关于预设的特征工程模型的具体训练方式后续将另做说明。

具体的，上述预设的特征工程模型还配置有目标特征工程算子集。该目标特征工程算子集包含有多个在基于UCB算法进行强化学习的过程中所筛选出适合目标应用场景(例如，交易风险预测场景)的特征工程算子。

上述UCB(Upper Confidence Bound)算法，也可以称为最大置信度上界算法。基于UCB算法能够在某个置信度下，取置合适的信区间的上界作为估计。后续可以利用上述UCB算法来构造针对目标应用场景的决策函数，以便能够通过该决策函数筛选出适合目标应用场景的特征工程算子。

上述强化学习(Reinforcement Learning,，RL)，具体可以一种用于描述和解决智能体(例如，可以记为agent)如何在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题的机器学习方法。

在本实施例中，通过引入并利用强化学习能够使得模型侧重于在线学习，并尝试在训练过程中在探索-利用(exploration-exploitation)之间保持较好的平衡。不同于常规的监督学习和非监督学习，上述强化学习不要求预先给定任何数据，而是可以通过接收并根据环境对动作的奖励数据(反馈或收益等)(例如，可以记为reward)获得学习信息，进而可以基于上述学习信息自动更新模型参数，进行模型训练，以最终找到最适合目标应用场景的特征工程算子的组合，得到最多的奖励数据。

在一些实施例中，参阅图3所示，具体实施时，服务器可以将目标用户的目标数据输入至预设的特征工程模型中。预设的特征工程模型可以利用目标特征工程算子集中的特征工程算子对目标数据进行相应的特征工程处理，以得到对应的目标特征数据，作为预设的特征工程模型的输出。

在一些实施例中，上述预设的分类模型具体可以理解为一种能够基于输入的特征数据确定是否存在交易风险的分类模型。

其中，上述预设的分类模型具体可以是预先利用训练好的预设的特征工程模型，通过机器学习训练得到的。关于预设的分类模型的具体训练方式后续将另做说明。

在一些实施例中，参阅图3所示，具体实施时，服务器可以将目标用户的目标特征数据输入至预设的分类模型中，并运行该预设的分类模型。预设的分类模型通过处理目标用户的目标特征数据，得到关于目标用户存在交易风险的概率值，作为预设的分类模型输出的目标分类结果。

在一些实施例中，上述根据所述目标分类结果，确定目标用户是否存在交易风险，具体实施时，可以包括以下内容：根据目标分类结果获取预设的分类模型输出的概率值；将该概率值与预设的概率阈值进行比较；得到对应的比较结果。根据比较结果，在确定该概率值大于预设的概率阈值的情况下，确定目标用户存在交易风险。相反，根据比较结果，在确定该概率阈值小于等于育德概率阈值的情况下，确定目标用户不存在交易风险。其中，上述预设的概率阈值具体可以是对预先对大量历史数据学习和统计得到的。

在一些实施例中，在根据所述目标分类结果，确定目标用户是否存在交易风险之后，所述方法具体实施时，还可以包括以下内容：在确定目标用户存在交易风险的情况下，对目标用户设置风险标签；根据风险标签，对目标用户进行相应的数据处理。具体的，例如，可以根据风险标签，对目标用户的交易行为进行进一步更加精细且有针对性的风险监测；和/或，向目标用户提供与风险标签相匹配的业务服务等。

在一些实施例中，参阅图4所示，在获取关于目标用户的目标数据之前，所述方法具体实施时，还可以包括以下内容：

S1：获取样本数据；

S2：根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；

S3：根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到符合要求的预设的特征工程模型。

其中，上述样本数据具体可以是与目标应用场景(例如，交易风险预测场景)相关联的数据。例如，历史上用户的属性数据和/或行为数据等。

通过上述实施例，可以根据UCB算法，通过强化学习，自动训练得到能够针对目标应用场景自动进行特征工程处理的预设的特征工程模型。

在一些实施例中，上述预设的特征工程算子集具体可以包含有与目标应用场景相关的多个特征工程算子。具体的，上述预设的特征工程算子集所包含的多个特征工程算子可以按照以下方式确定：获取目标应用场景下的多个特征工程处理记录；对多个特征工程处理记录进行统计汇总，以获取目标应用场景下的特征工程处理会涉及到的特征工程算子，作为预设的特征工程算子集所包含的特征工程算子。

在一些实施例中，所述特征工程算子具体可以包括以下至少之一：预设的缺失值中位数处理算子、预设的类别型特征的独热编码算子、预设的数据规范化与转换算子等。进一步，上述特征工程算子还可以包括：预设的多项式特征处理算子、预设的三角特征处理算子、预设的分组特征处理算子、预设的分箱数字特征处理算子等等。

当然，需要说明的是，上述所列举的特征工程算子只是一种示意性说明。具体实施时，根据具体的应用场景和处理需求，上述预设的特征工程算子集还可以包括其他类型的特征工程算子。对此，本说明书不作限定。

在一些实施例中，上述根据UCB算法，构造用于选择特征工程算子的决策函数，包括：

按照以下算式构建决策函数：

上述决策函数具体可以理解为一种能够通过利用上一次选择特征工程算子得到的奖励数据，并进行当前次的选择特征工程算子的探索，以实现基于探索和利用(Exploration and Exploitation，EE)模式的当前次迭代处理的决策策略函数。

其中，探索(Exploration)具体可以是指在当前次迭代处理过程中选用未使用过的特征工程算子以生成新的特征数据。利用(Exploitation)具体可以是指在当前次迭代处理过程中使用上一次选中的特征工程算子生成特征数据时所得到的最大化收益(或称奖励数据)。

具体的，在上述决策函数中，包含有两项分别为：Q_t(a)和U_t(a)。

其中，Q_t(a)表示利用，具体可以是当前动作-收益的实际分布，这里的动作可以对应于上一次所选中的加入或删除特征工程算子，收益可以对应于上一次在加入或删除该特征工程算子后的AUC值。其中，AUC(Area Under Curve)可以理解为ROC曲线下与坐标轴围成的面积。Q_t(a)的初始值可以设置为0。

U_t(a)表示探索，具体可以是对当前动作的不确定的一种度量，这里的动作可以对应于当前次所选中的加入或删除的特征工程算子。

基于上述决策函数，对于预设的特征工程算子集中的任意一个特征工程算子a如果被探索选中次数N_t(a)不变，而随着迭代次数t的增加，lnt也会相应增大；对应的，U_t(a)的值会变大，特征工程算子a被探索选中的概率也会变大。反之亦然。

通过对上述决策函数进行求解，可以利用UCB算法，通过寻找针对当前次迭代处理的最大化动作的置信度，从预设的特征工程算子集中选中最适合当前次迭代处理的特征工程算子a_t。

在一些实施例中，参阅图5所示，上述根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，具体实施时，可以包括：按照以下方式进行多次迭代处理中的当前次迭代处理：

S1：获取上一次选中的特征工程算子所产生的奖励数据，以及上一次的目标特征工程算子集；

S2：利用上一次选中的特征工程算子所产生的奖励数据和样本数据，通过求解决策函数，以使智能体从预设的特征工程算子集中确定出当前次选中的特征工程算子；

S3：根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集；

S4：利用当前次的目标特征工程算子集对样本数据进行特征工程处理，得到当前次的样本特征数据；

S5：根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据。

在一些实施例中，基于上述决策函数具体进行当前次迭代处理时所选中的特征工程算子为a_t。

在一些实施例中，上述根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，具体可以包括：在上一次的目标特征工程算子集中加入当前次选中的特征工程算子；或，从上一次的目标特征工程算子集中删除当前次选中的特征工程算子。

具体的，例如，可以按照以下方式根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，以得到当前次的目标特征工程算子集。

如果a_t在之前的迭代处理时已经被选中，即，上一次的目标特征工程算子集中已经存在了a_t。这时可以从上一次的目标特征工程算子集中删除与a_t对应的特征工程算子，完成对上一次的目标特征工算子集的更新，得到当前次的目标特征工程算子集。

相反，如果a_t在之前的迭代处理时没有被选中，即，上一次的目标特征工程算子集中不存在a_t。这时可以在上一次的目标特征工程算子集中加入与a_t对应的特征工程算子，完成对上一次的目标特征工算子集的更新，得到当前次的目标特征工程算子集。

此外，在每次进行迭代处理时，还可以根据上一次的奖励数据对当前次迭代处理所要使用的样本数据进行相应的预处理，以便可以更好地进行当前次迭代处理。

按照上述方式，可以根据决策函数和预设的特征工程算子集，控制智能体自动利用样本数据进行基于探索和利用模式的多次迭代处理，直到达到迭代停止条件，得到预设的特征工程模型。

在按照上述方式，进行多次迭代处理时，基于上述决策函数的特性可知：在初始阶段(例如，最开始的几次迭代处理)以探索为主，由于初始化的置信度都为0，基于上述决策函数，智能体相对更偏向于探索。在该初始阶段中，基于决策函数，智能体主要是随机选择一个特征工程算子，并获得相关的收益。然后再次进行动作选择时，由于之前的特征工程算子已经被探索选中过至少一次，不确定性降低，再次被探索选中的概率也相对降低，这时智能体有更大的概率会将会从预设的特征工程算子集中剩下的特征工程算子中进行选择。

在按照上述方式进行多次迭代处理后，会转入稳定阶段。在稳定阶段以利用为主，不同的特征工程算子由于都已经被探索选中过，U_t(a)值相对趋于一致；而不同的特征工程算子的Q_t(a)则会存在差异。这时，基于决策函数，智能体偏向于利用收益(或称奖励数据)相对较高的特征工程算子。但是在该阶段，当执行多次之后，有时也会出现有的特征工程算子被多次选中，其U_t(a)反倒下降，导致其他的特征工程算子会相应被再次选中的现象。

在一些实施例中，可以参阅图4所示，上述根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据，具体实施时，可以包括以下内容：

S1：利用初始的分类模型处理当前次的样本特征数据，得到当前次的分类结果；

S2：根据当前次的分类结果，通过进行交叉验证，以确定当前次选中的特征工程算子所产生的奖励数据。

具体实施时，可以根据当前次的分类结果，通过十折的交叉验证方法来计算得到平均AUC值，作为针对前次选中的特征工程算子所产生的奖励数据(或者收益)，以用于下一下次的迭代处理。

在一些实施例中，其中，上述初始的分类模型具体可以理解为后续用于训练预设的分类模型的初始模型。

在按照上述方式确定奖励数据时，除了使用初始的分类模型外，具体实施时，还可以使用其他已有的固定的分类模型来代替初始的分类模型处理基于预设的特征工程模型所得到的样本特征数据，以确定出相应的奖励数据。

在一些实施例中，在根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集之后，所述方法具体实施时，还可以包括以下内容：

S1：检测当前次迭代处理所对应的迭代次数是否等于预设的迭代次数阈值；和/或，检测当前次迭代处理中的决策函数是否收敛；

S2：在确定当前次迭代处理所对应的迭代次数等于预设的迭代次数阈值；和/或，确定当前次迭代处理中的决策函数收敛的情况下，确定得到符合要求的预设的特征工程模型。

其中，预设的迭代次数阈值可以是预先对与目标应用场景对应的大量历史数据统计汇总得到的。具体的，预设的迭代次数阈值可以设置为5。

基于上述实施例，可以通过检测当前次迭代处理所对应的迭代次数是否等于预设的迭代次数阈值；和/或，检测当前次迭代处理中的决策函数是否收敛来判断是否达到了迭代停止条件。在确定达到了迭代停止条件的情况下，可以停止继续迭代处理；并基于当前次的目标特征工程算子集，得到符合要求的预设的特征工程模型。

在一些实施例中，在确定得到符合要求的预设的特征工程模型之后，所述方法具体实施时，还可以包括以下内容：

S1：获取初始的分类模型；

S2：利用预设的特征工程模型处理样本数据，得到样本特征数据；

S3：利用样本特征数据对初始的分类模型进行机器学习，以得到符合要求的预设的分类模型。

在一些实施例中，所述初始的分类模型具体可以包括基于XGboost的结构的模型。

其中，上述XGboost是一种对梯度提升算法的改进，求解损失函数极值时使用了牛顿法，并将损失函数泰勒展开到二阶，另外还在损失函数中加入了正则化项。上述XGboost能够在Gradient Boosting框架下实现机器学习，具有高效性、便捷性、灵活性等优点。

具体实施时，可以构建基于XGboost的结构的模型作为初始的分类模型。上述分类模型具体可以为一种二分类模型。

基于上述实施例，可以先通过利用训练好的预设的特征工程模型处理样本数据，得到对应的解释性较好、适用于机器学习的样本特征数据；再利用上述样本特征数据，对初始的分类模型进行机器学习，以高效地训练得到精度较高、效果较好的符合要求的预设的分类模型。

由上可见，基于本说明书实施例提供的交易风险的确定方法，具体实施前，可以先利用样本数据基于UCB算法通过强化学习训练得到能够自动进行特征工程处理的预设的特征工程模型；再利用预设的特征工程模型处理样本数据，自动得到解释性较好且适用于机器学习的样本特征数据；并利用上述样本特征数据通过机器学习训练得到精度较高的预设的分类模型。具体实施时，可以先利用预设的特征工程模型自动对目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；再利用预设的分类模型通过处理目标特征数据，以准确地确定出目标用户是否存在交易风险。这样，一方面由于不需要依赖技术人员的经验人工进行特征工程，而是直接利用预设的特征工程模型来自动且高效地完成特征工程处理，从而可以有效地降低处理成本，提高处理效率；另一方面又由于通过上述预设的特征工程模型处理得到的目标特征数据相对于通过神经网络得到的特征数据，具有更好的解释性且更适合机器学习，同时也不会引入人为主观因素所带来的误差影响，从而能够利用预设的分类模型基于上述特征数据，较为准确地确定出目标用户是否存在交易风险，减少了确定时的误差。

参阅图6所示，本说明书实施例还提供了一种数据处理方法。其中，该方法具体实施时，可以包括以下内容：

S601：获取与目标应用场景关联的样本数据；

S602：根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；

S603：根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到针对目标应用场景且符合要求的预设的特征工程模型。

在一些实施例中，上述目标应用场景具体可以包括：交易风险预测场景、用户类型分类场景、信贷违约预测场景，或者潜在客户预测场景等等。当然，上述所列举的应用场景只是一种示意性说明。具体实施时，根据具体情况和处理需求，还可以将上述数据处理方法应用于其他类型的应用场景中。对此，本说明书不作限定。

在一些实施例中，可以根据目标应用场景特征工程处理记录，配置与该目标应用场景相匹配的预设的特征工程算子集。

由上可见，基于本说明书实施例提供的数据处理方法，可以高效地训练得到能够适用于不同的目标应用场景，且能够自动、准确地实现该目标应用场景下相应的特征工程处理的预设的特征工程模型，有效地降低了整体的数据处理成本，提高了整体的数据处理效率。

本说明书实施例还提供一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器具体实施时可以根据指令执行以下步骤：获取关于目标用户的目标数据；利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；根据所述目标分类结果，确定目标用户是否存在交易风险。

为了能够更加准确地完成上述指令，参阅图7所示，本说明书实施例还提供了另一种具体的服务器，其中，所述服务器包括网络通信端口701、处理器702以及存储器703，上述结构通过内部线缆相连，以便各个结构可以进行具体的数据交互。

其中，所述网络通信端口701，具体可以用于获取关于目标用户的目标数据。

所述处理器702，具体可以用于利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；根据所述目标分类结果，确定目标用户是否存在交易风险。

所述存储器703，具体可以用于存储相应的指令程序。

在本实施例中，所述网络通信端口701可以是与不同的通信协议进行绑定，从而可以发送或接收不同数据的虚拟端口。例如，所述网络通信端口可以是负责进行web数据通信的端口，也可以是负责进行FTP数据通信的端口，还可以是负责进行邮件数据通信的端口。此外，所述网络通信端口还可以是实体的通信接口或者通信芯片。例如，其可以为无线移动网络通信芯片，如GSM、CDMA等；其还可以为Wifi芯片；其还可以为蓝牙芯片。

在本实施例中，所述处理器702可以按任何适当的方式实现。例如，处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。

在本实施例中，所述存储器703可以包括多个层次，在数字系统中，只要能保存二进制数据的都可以是存储器；在集成电路中，一个没有实物形式的具有存储功能的电路也叫存储器，如RAM、FIFO等；在系统中，具有实物形式的存储设备也叫存储器，如内存条、TF卡等。

本说明书实施例还提供另一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器具体实施时可以根据指令执行以下步骤：获取与目标应用场景关联的样本数据；根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到针对目标应用场景且符合要求的预设的特征工程模型。

本说明书实施例还提供了一种基于上述交易风险的确定方法的计算机存储介质，所述计算机存储介质存储有计算机程序指令，在所述计算机程序指令被执行时实现：获取关于目标用户的目标数据；利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；根据所述目标分类结果，确定目标用户是否存在交易风险。

本说明书实施例还提供了一种基于上述数据处理方法的计算机存储介质，所述计算机存储介质存储有计算机程序指令，在所述计算机程序指令被执行时实现：获取与目标应用场景关联的样本数据；根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到针对目标应用场景且符合要求的预设的特征工程模型。

在本实施例中，上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的，用于进行网络连接通信的接口。

在本实施例中，该计算机存储介质存储的程序指令具体实现的功能和效果，可以与其它实施方式对照解释，在此不再赘述。

本说明书实施例提供了一种计算机程序产品，包含有计算机程序，所述计算机程序被处理器执行时实现以下步骤：获取关于目标用户的目标数据；利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；根据所述目标分类结果，确定目标用户是否存在交易风险。

本说明书实施例提供了另一种计算机程序产品，包含有计算机程序，所述计算机程序被处理器执行时实现以下步骤：获取与目标应用场景关联的样本数据；根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到针对目标应用场景且符合要求的预设的特征工程模型。

参阅图8所示，在软件层面上，本说明书实施例还提供了一种交易风险的确定装置，该装置具体可以包括以下的结构模块：

获取模块801，具体可以用于获取关于目标用户的目标数据；

第一处理模块802，具体可以用于利用预设的特征工程模型对所述目标用户的目标数据进行特征工程处理，得到对应的目标特征数据；其中，所述预设的特征工程模型为利用样本数据基于UCB算法通过强化学习训练得到的模型；

第二处理模块803，具体可以用于利用预设的分类模型处理所述目标特征数据，得到目标分类结果；其中，所述预设的分类模型为利用样本特征数据通过机器学习训练得到的模型；所述样本特征数据为利用预设的特征工程模型通过对所述样本数据进行特征工程处理得到的；

确定模块804，具体可以用于根据所述目标分类结果，确定目标用户是否存在交易风险。

在一些实施例中，所述装置具体还可以包括第一训练模块。在获取关于目标用户的目标数据之前，第一训练模块具体可以用于获取样本数据；根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到符合要求的预设的特征工程模型。

在一些实施例中，所述特征工程算子具体可以包括以下至少之一：预设的缺失值中位数处理算子、预设的类别型特征的独热编码算子、预设的数据规范化与转换算子等。

在一些实施例中，上述第一训练模块具体实施时，可以按照以下方式根据UCB算法，构造用于选择特征工程算子的决策函数：按照以下算式构建决策函数：

在一些实施例中，上述第一训练模块具体实施时，可以按照以下方式根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理：按照以下方式进行多次迭代处理中的当前次迭代处理：获取上一次选中的特征工程算子所产生的奖励数据，以及上一次的目标特征工程算子集；利用上一次选中的特征工程算子所产生的奖励数据和样本数据，通过求解决策函数，以使智能体从预设的特征工程算子集中确定出当前次选中的特征工程算子；根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集；利用当前次的目标特征工程算子集对样本数据进行特征工程处理，得到当前次的样本特征数据；根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据。

在一些实施例中，上述第一训练模块具体实施时，可以按照以下方式根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据：利用初始的分类模型处理当前次的样本特征数据，得到当前次的分类结果；根据当前次的分类结果，通过进行交叉验证，以确定当前次选中的特征工程算子所产生的奖励数据。

在一些实施例中，上述第一训练模块具体实施时，在根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集之后，还可以用于检测当前次迭代处理所对应的迭代次数是否等于预设的迭代次数阈值；和/或，检测当前次迭代处理中的决策函数是否收敛；在确定当前次迭代处理所对应的迭代次数等于预设的迭代次数阈值；和/或，确定当前次迭代处理中的决策函数收敛的情况下，确定得到符合要求的预设的特征工程模型。

在一些实施例中，所述装置具体还可以包括第二训练模块。上述第二训练模块在确定得到符合要求的预设的特征工程模型之后，具体实施时，可以用于获取初始的分类模型；利用预设的特征工程模型处理样本数据，得到样本特征数据；利用样本特征数据对初始的分类模型进行机器学习，以得到符合要求的预设的分类模型。

在一些实施例中，所述初始的分类模型具体可以包括基于XGboost的结构的模型等。

参阅图9所示，本说明书实施例还提供了一种数据处理装置，具体可以包括以下结构模块：

获取模块901，具体可以用于获取与目标应用场景关联的样本数据；

构造模块902，具体可以用于根据UCB算法，构造用于选择特征工程算子的决策函数；并配置预设的特征工程算子集；其中，所述预设的特征工程算子集包含有多个特征工程算子；

迭代模块903，具体可以用于根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，以得到针对目标应用场景且符合要求的预设的特征工程模型。

需要说明的是，上述实施例阐明的单元、装置或模块等，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

由上可见，基于本说明书实施例提供的交易风险的确定装置，一方面由于不需要依赖技术人员的经验人工进行特征工程，而是直接利用预设的特征工程模型来自动且高效地完成特征工程处理，从而可以有效地降低处理成本，提高处理效率；另一方面又由于通过上述预设的特征工程模型处理得到的目标特征数据相对于通过神经网络得到的特征数据，具有更好的解释性且更适合机器学习，同时也不会引入人为主观因素所带来的误差影响，从而能够利用预设的分类模型基于上述特征数据，较为准确地确定出目标用户是否存在交易风险，减少了确定时的误差。

虽然本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施例的描述可知，本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书的技术方案本质上可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，移动终端，服务器，或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

虽然通过实施例描绘了本说明书，本领域普通技术人员知道，本说明书有许多变形和变化而不脱离本说明书的精神，希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims

1.一种交易风险的确定方法，其特征在于，包括：

获取关于目标用户的目标数据；

根据所述目标分类结果，确定目标用户是否存在交易风险。

2.根据权利要求1所述的方法，其特征在于，所述目标数据包括目标用户的属性数据和/或目标用户的行为数据。

3.根据权利要求1所述的方法，其特征在于，在获取关于目标用户的目标数据之前，所述方法还包括：

获取样本数据；

4.根据权利要求3所述的方法，其特征在于，所述特征工程算子包括以下至少之一：预设的缺失值中位数处理算子、预设的类别型特征的独热编码算子、预设的数据规范化与转换算子。

5.根据权利要求3所述的方法，其特征在于，根据UCB算法，构造用于选择特征工程算子的决策函数，包括：

按照以下算式构建决策函数：

6.根据权利要求5所述的方法，其特征在于，根据所述决策函数和所述预设的特征工程算子集，控制智能体利用所述样本数据进行基于探索和利用模式的多次迭代处理，包括：

按照以下方式进行多次迭代处理中的当前次迭代处理：

7.根据权利要求6所述的方法，其特征在于，根据当前次的样本特征数据，确定当前次选中的特征工程算子所产生的奖励数据，包括：

8.根据权利要求3所述的方法，其特征在于，在根据当前次选中的特征工程算子，更新上一次的目标特征工程算子集，得到当前次的目标特征工程算子集之后，所述方法还包括：

9.根据权利要求3所述的方法，其特征在于，在确定得到符合要求的预设的特征工程模型之后，所述方法还包括：

获取初始的分类模型；

10.根据权利要求9所述的方法，其特征在于，所述初始的分类模型包括基于XGboost的结构的模型。

11.一种数据处理方法，其特征在于，包括：

获取与目标应用场景关联的样本数据；

12.一种交易风险的确定装置，其特征在于，包括：

获取模块，用于获取关于目标用户的目标数据；

13.一种服务器，其特征在于，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现权利要求1至10，或11中任一项所述方法的步骤。

14.一种计算机可读存储介质，其特征在于，其上存储有计算机指令，所述指令被处理器执行时实现权利要求1至10，或11中任一项所述方法的步骤。

15.一种计算机程序产品，其特征在于，包含有计算机程序，所述计算机程序被处理器执行时实现权利要求1至10，或11中任一项所述方法的步骤。