CN110929960A

CN110929960A - 策略选择优化方法以及装置

Info

Publication number: CN110929960A
Application number: CN201911272217.7A
Authority: CN
Inventors: 张震; 金宏; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-12-12
Filing date: 2019-12-12
Publication date: 2020-03-27
Anticipated expiration: 2039-12-12
Also published as: CN110929960B

Abstract

本说明书实施例提供策略选择优化方法以及装置，其中所述策略选择优化方法包括：根据业务中多个业务指标的权重确定目标函数以及约束条件，根据所述业务选择群体优化算法，并根据权重最大的业务指标对应的多个策略初始化策略群，再根据策略群中的多个策略组合构建与所述多个策略组合对应的样本向量；通过将样本向量输入目标函数和约束条件后获取的输出结果筛选策略群的群体最优解，根据所述群体最优解，利用群体优化算法并通过迭代的方式对所述策略群进行优化；在迭代完成的情况下，在迭代完成后获得的目标策略群中筛选所述业务的最优策略组合。

Description

策略选择优化方法以及装置

技术领域

本说明书实施例涉及计算机技术领域，特别涉及一种策略选择优化方法。本说明书一个或者多个实施例同时涉及一种策略选择优化装置，一种计算设备，以及一种计算机可读存储介质。

背景技术

目标优化，即用户为系统达到目标而力图费力最小，路径最短，时间最快，亦即投入最小产出最大，耗费最小效益最大的思维原则和方法。在实际应用中，往往会应用优化算法解决复杂的目标优化问题，优化算法要解决的一般是多目标优化问题，如风控策略阈值优化问题中，待优化目标有案件召回的最大化以及用户打扰的最小化；在风控决策曲线推荐中，除案件召回最大化、用户打扰最小化两个目标之外，还有曲线单调递减、曲线在特定点之上等多个目标。

基于以上情况，有必要提供一种策略选择优化方法，以提升对业务中业务指标进行目标优化的精准性。

发明内容

有鉴于此，本说明书施例提供了一种策略选择优化方法。本说明书一个或者多个实施例同时涉及一种策略选择优化装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种策略选择优化方法，包括：

将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件；

根据所述权重最大的业务指标对应的多个策略初始化策略群；

通过迭代的方式并利用群体优化算法对策略群进行优化；每次迭代过程中将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，并根据输出的业务结果筛选出优化之前的策略群的群体最优解，利用所述群体优化算法对优化之前的策略群进行优化获得下一次迭代的策略群；

在迭代完成的情况下，在迭代完成后获得的目标策略群的策略组合中筛选所述业务的最优策略组合。

可选地，所述通过迭代的方式并利用群体优化算法对策略群进行优化，包括：

将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件并获取输出的与每个样本向量对应的业务结果；

根据所述业务结果在所述每个样本向量对应的策略组合中筛选优化之前的策略群的群体最优解；

利用群体优化算法并根据所述群体最优解对优化之前的策略群进行优化获得下一次迭代的策略群；

获取迭代信息并判断所述迭代信息是否满足预设迭代终止条件；

若是，则迭代完成，执行所述在迭代完成的情况下，在迭代完成后获得的目标策略群的策略组合中筛选所述业务的最优策略组合的步骤；

若否，则将所述下一次迭代的策略群作为优化之前的策略群并返回执行所述将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件并获取输出的与每个样本向量对应的业务结果子步骤。

可选地，所述群体最优解通过以下方式获得：

根据优化之前的策略群包含的多个策略组合中每个策略组合的目标函数值和未通过的约束条件的个数确定所述每个策略组合对应的二元目标函数值；

根据所述每个策略组合对应的二元目标函数值确定通过约束条件最多的策略组合，并将通过约束条件最多的策略组合作为优化之前的策略群的群体最优解。

可选地，所述根据优化之前的策略群包含的多个策略组合中每个策略组合的目标函数值和未通过的约束条件的个数确定所述每个策略组合对应的二元目标函数值步骤执行之前，还包括：

以策略群中任意一个策略组合输入所述目标函数之后输出的目标函数值和所述任意一个策略组合未通过约束条件的个数为变量构建二元目标函数。

可选地，所述将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件步骤执行之前，还包括：

确定所述业务的多个业务指标；

计算各个业务指标对应的权重；

将所述多个业务指标根据权重的大小依次进行排序生成排序结果列表。

可选地，所述将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，包括：

按照所述排序结果列表中所述多个业务指标的排序方式依次将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件。

可选地，所述根据优化之前的策略群包含的多个策略组合中每个策略组合的目标函数值和未通过的约束条件的个数确定所述每个策略组合对应的二元目标函数值，包括：

获取将优化之前的策略群包含的多个策略组合中每个策略组合对应的样本向量输入所述目标函数之后得到的输出结果，并将所述输出结果作为目标函数值；

获取按照所述排序结果列表中所述多个业务指标的排序方式依次将所述优化之前的策略群包含的多个策略组合中每个策略组合对应的样本向量输入与第i个业务指标对应的约束条件得到的约束值，其中，i∈[2,n]，n为业务指标的个数，i和n均为正整数；

判断所述约束值是否满足所述与所述第i个业务指标对应的约束条件；

若是，则i自增1，返回执行所述获取按照所述排序结果列表中所述多个业务指标的排序方式依次将所述优化之前的策略群包含的多个策略组合中每个策略组合对应的样本向量输入与第i个业务指标对应的约束条件得到的约束值的步骤；

若否，则根据所述第i个业务指标对应的约束条件的函数表达式以及所述约束值确定不满足约束条件的策略组合对应的约束违背度；

根据所述i与n的值以及所述约束违背度计算所述不满足约束条件的策略组合对应的二元目标函数值。

可选地，所述群体最优解通过如下方式确定：

若根据所述每个策略组合对应的二元目标函数值确定存在至少两个策略组合未通过约束条件的个数相同且未通过约束条件的个数最少，则将所述至少两个策略组合中约束违背度小的策略组合作为所述群体最优解。

可选地，所述群体最优解通过以下方式确定：

若根据所述每个策略组合对应的二元目标函数值确定不存在未通过所述约束条件的策略组合，则将所述每个策略组合中目标函数值最小的策略组合作为所述群体最优解。

可选地，所述根据所述第i个业务指标对应的约束条件的函数表达式以及所述约束值确定不满足约束条件的策略组合对应的约束违背度，包括：

若所述第i个业务指标对应的约束条件的函数表达式为不等式，则将所述约束值作为所述不满足约束条件的策略组合对应的约束违背度；

若所述第i个业务指标对应的约束条件的函数表达式为等式，则确定所述不满足约束条件的策略组合对应的约束违背度为1。

可选地，所述预设迭代终止条件包括以下项中的任意一项：

迭代次数达到预设阈值、所述群体最优解对应的目标函数值达到预设目标阈值和/或所述目标函数收敛。

根据本说明书实施例的第二方面，提供了一种策略选择优化装置，包括：

目标函数确定模块，被配置为将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件；

初始化模块，被配置为根据所述权重最大的业务指标对应的多个策略初始化策略群；

优化模块，被配置为通过迭代的方式并利用群体优化算法对策略群进行优化；每次迭代过程中将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，并根据输出的业务结果筛选出优化之前的策略群的群体最优解，利用所述群体优化算法对优化之前的策略群进行优化获得下一次迭代的策略群；

策略筛选模块，被配置为在迭代完成的情况下，在迭代完成后获得的目标策略群的策略组合中筛选所述业务的最优策略组合。

根据本说明书实施例的第三方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令：

根据本说明书实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现所述策略选择优化方法的步骤。

本说明书一个实施例通过将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件；根据所述权重最大的业务指标对应的多个策略初始化策略群；通过迭代的方式并利用群体优化算法对策略群进行优化；每次迭代过程中将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，并根据输出的业务结果筛选出优化之前的策略群的群体最优解，利用所述群体优化算法对优化之前的策略群进行优化获得下一次迭代的策略群；在迭代完成的情况下，在迭代完成后获得的目标策略群的策略组合中筛选所述业务的最优策略组合。

本说明书一个实施例实现了通过将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件的方式，实现了将多目标优化问题转换为单目标优化问题，利用群体优化算法并通过迭代的方式对所述策略群进行优化，在迭代完成或获得的目标策略群中筛选最优策略组合，利用所述最优策略组合中的策略对业务中的业务指标进行目标优化，有利于提高目标优化的精准性。

附图说明

图1是本说明书一个实施例提供的一种策略选择优化方法的处理流程图；

图2是本说明书一个实施例提供的一种策略选择优化方法应用于风控场景的处理流程图；

图3是本说明书一个实施例提供的一种策略选择优化装置的示意图；

图4是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在本说明书中，提供了一种策略选择优化方法，本说明书同时涉及一种策略选择优化装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

图1示出了根据本说明书一个实施例提供的一种策略选择优化方法的流程图，包括步骤102至步骤108。

步骤102，将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件。

目标优化，即用户为系统达到目标而力图费力最小，路径最短，时间最快，亦即投入最小产出最大，耗费最小效益最大的思维原则和方法。

实际应用中，往往会应用优化算法解决复杂的目标优化问题，优化算法要解决的一般是多目标优化问题，如风控策略阈值优化问题中，待优化目标有案件召回的最大化以及用户打扰的最小化；在风控决策曲线推荐中，除案件召回最大化、用户打扰最小化两个目标之外，还有曲线单调递减、曲线在特定点之上等多个目标。

目前的目标优化算法可用于解决多目标优化问题，但是这些算法在使用过程中往往要求目标函数连续可导，或者用于目标优化的优化算法中各项权重的确定方式存在一些弊端，导致目前的用于目标优化的算法适用范围较窄，目标优化有效性较低。

本说明书实施例提供的策略选择优化方法，首先确定业务中待优化的多个业务指标，并根据多个业务指标的权重大小将所述待优化的多个业务指标对应的目标算法转换为待优化的单个业务指标对应的目标函数以及所述目标函数的约束条件，并利用群体优化算法，对适用于对所述单个业务指标进行目标优化的不同策略组合组成的策略群进行优化，并在迭代完成后获得的目标策略群中筛选所述业务的最优策略组合。

以所述业务为风控业务，所述风控业务中待优化的风控指标为资损案件发生量、单个案件资损金额和总资损金额为例，确定风控指标后，计算各个风控指标对应的权重，若资损案件发生量、单个案件资损金额和总资损金额对应的权重分别为40％、35％和25％，则将资损案件发生量对应的风险评估算法f(x)确定为目标函数，并将单个案件资损金额对应的风险评估算法g₁(x)和总资损金额对应的风险评估算法g₂(x)转换为所述目标函数的约束条件；其中约束条件可以为等式约束或不等式约束，如：约束条件g₁(x)＜1000即为不等式约束，约束条件g₁(x)＝0即为等式约束，具体的约束条件的函数表达式的形式根据实际需要确定，在此不做任何限制。

本说明书提供的一个实施例中，根据业务中多个业务指标对应的权重确定目标函数和约束条件之前，还需确定所述业务中待优化的多个业务指标，具体可通过以下步骤实现：

确定所述业务的多个业务指标；

计算各个业务指标对应的权重；

具体的，仍以所述业务为风控业务，所述风控业务中待优化的风控指标为资损案件发生量、单个案件资损金额和总资损金额为例，若资损案件发生量、单个案件资损金额和总资损金额对应的权重分别为40％、35％和25％，根据权重大小进行排序生成的排序结果列表中风控指标的排序结果依次为资损案件发生量、单个案件资损金额和总资损金额。

通过将业务的待优化业务指标中权重最大的业务指标对应的目标算法确定为目标函数，将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件，即将多目标优化问题转换为单目标优化问题，有利于将多目标优化问题简化。

步骤104，根据所述权重最大的业务指标对应的多个策略初始化策略群。

具体的，本说明书实施例使用群体优化算法，对由不同策略组合组成的策略群进行优化，并在迭代完成后获得的目标策略群中筛选所述业务的最优策略组合。其中，所述策略群用于对业务中权重最大的业务指标进行目标优化，所述群体优化算法包括但不限于遗传算法、粒子群算法以及人工鱼群算法等。

在上述将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件的步骤执行之后，需根据所述权重最大的业务指标对应的多个策略初始化策略群。

以所述群体优化算法为粒子群算法为例，在利用粒子群算法对用于目标优化的由不同策略组成的策略组合对应的样本向量进行优化之前，需先初始化粒子群体，即若粒子群体中包含50个粒子，则根据业务指标对应的策略随机生成50个由不同策略组成的策略组合，并将所述50个策略组合作为50个粒子以完成所述粒子群体(策略群)的初始化，其中，每个粒子中包含由不同策略组成的策略组合，确定每个粒子包含的策略组合后，根据所述策略组合构建每个粒子对应的样本向量。

具体的，在上述根据业务中权重最大的业务指标对应的多个策略初始化策略群步骤执行之后，需构建策略群中多个策略组合对应的样本向量，所述策略组合由多个不同策略组成。

仍以所述群体优化算法为粒子群算法为例，则根据每个粒子包含的策略组合构建对应的样本向量，其中样本向量中包含的元素的个数与资损案件发生量对应的策略的数目一致，且样本向量中每个元素的值为0或1，0表示该粒子包含的策略组合中的未采用对应的策略，1表示该粒子包含的策略组合中采用了对应的策略；

若资损案件发生量对应的多个策略分别为st1、st2、st3、st4，粒子群中其中一个粒子包含的策略组合对应的样本向量[1 0 0 1]，表示该粒子对应的策略组合中使用st1和st4对资损案件量进行风险防控。

实际应用中，若所述群体优化算法为粒子群算法，则首先需初始化粒子群，假设业务中权重最大的业务指标对应的策略为4条，每次采用其中两条策略对所述权重最大的业务指标进行目标优化，该粒子群中共包含8个粒子，则初始化粒子群即对4条策略中的任意两条进行随机组合生成16种策略组合，任意选择其中8个组合作为粒子群中8个粒子分别包含的策略组合，并按照上述样本向量的构建方式构建8个粒子中策略组合分别对应的样本向量。

步骤106，通过迭代的方式并利用群体优化算法对策略群进行优化。

具体的，每次迭代过程中将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，并根据输出的业务结果筛选出优化之前的策略群的群体最优解，利用所述群体优化算法对优化之前的策略群进行优化获得下一次迭代的策略群；

在上述根据所述策略群中的多个策略组合构建与所述多个策略组合分别对应的样本向量的步骤执行之后，可利用群体优化算法对样本向量进行优化，具体的优化过程可通过以下步骤实现：

具体的，上述步骤的执行过程实际为群体优化算法的迭代过程，由于在确定目标函数和约束条件之前，已经对业务中的多个业务指标按照各自的权重大小进行排序生成排序结果列表，因此，本说明书实施例中，所述将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件具体为：

仍以所述业务为风控业务，所述风控业务中待优化的风控指标为资损案件发生量、单个案件资损金额和总资损金额，所述群体优化算法为粒子群算法，粒子群中包含8个粒子为例，目标函数为f(x)，约束条件为g₁(x)<1000，g₂(x)<100，与权重最大的资损案件发生量对应的风控策略为st1、st2、st3、st4，并且每次采用其中两条风控策略对资损案件发生量进行风险防控，若初始化粒子群后的其中一个粒子包含的策略组合对应的样本向量为X₁＝[1 0 0 1]，则将X₁分别输入目标函数f(x)、约束条件g₁(x)<1000和g₂(x)<100，获取对应的输出结果。

输出粒子群中8个粒子的业务结果后，根据8个粒子的业务结果筛选优化之前的策略群的群体最优解，所述群体最优解通过以下方式获得：

具体的，通过约束条件的个数最多的策略组合为优化之前的策略群中的群体最优解。

例如，优化之前的策略群中包含两个策略组合，分别为sc1和sc2，sc1和sc2对应的样本向量分别为X₁＝[1 0 0 1]、X₂＝[1 1 0 0]，将样本向量X₁输入目标函数f(x)得到的目标函数值为20，即利用st1和st4这两个策略对风控业务中的资损案件量进行风险防控得到的风险防控结果为资损案件发生量为20件，且将样本向量X₁输入约束条件g₁(x)得到的结果为500(约束条件为g₁(x)＜1000)，将样本向量X₁输入约束条件g₂(x)得到的结果为80(约束条件为g₂(x)<100)则样本向量X₁通过的约束条件的个数为2，则策略组合sc1对应的二元目标函数值G(X₁)＝(0，20)；

将样本向量X₂输入目标函数f(x)得到的目标函数值为18，即利用st1和st2这两个风控策略对风控业务中的资损案件量进行风险防控得到的风险防控结果为资损案件发生量为18件，且将样本向量X₂输入约束条件g₁(x)得到的结果为800(约束条件为g₁(x)＜1000)，将样本向量X₂输入约束条件g₂(x)得到的结果为150(约束条件为g₂(x)<100)则样本向量X₂通过的约束条件的个数为1，策略组合sc2对应的二元目标函数值G(X₂)＝(1，18)；

通过约束条件的个数最多的样本向量对应的策略组合为策略群中的群体最优解，因此样本向量X₁对应的策略组合st1和st4为策略群的群体最优解。

本说明书提供的一个实施例中，计算每个策略组合对应的二元目标函数值之前，需先构建二元目标函数，即以策略群中任意一个策略组合输入所述目标函数之后输出的目标函数值和所述任意一个策略组合未通过约束条件的个数为变量构建二元目标函数。

具体的，以所述二元目标函数为G(x)为例，实际应用中，G(x)＝(a，b)，其中a表示策略群中每个样本向量未通过的约束条件的个数，b表示策略群中每个样本向量对应的目标函数值。

通过构建二元目标函数，并计算策略群中每个样本向量对应的二元目标函数值，则群体最优解或最优策略组合的筛选过程中，可直接通过每个策略组合对应的二元目标函数值中的目标函数值以及未通过的约束条件的个数进行比较筛选即可，有利于提高工作效率。

本说明书实施例确定群体最优解后，可利用群体优化算法对策略群进行优化，若所述群体优化算法为粒子群算法，且优化之前的策略群(每次迭代之后对优化之前的策略群进行优化)中包含8个粒子，将8个粒子包含的策略组合对应的样本向量X₁、X₂、……、X₈输入目标函数以及约束条件，获取输出的每个粒子对应的目标函数值以及未通过约束条件的个数，将未通过约束条件的个数最少的粒子包含的策略组合sc4作为粒子群体的群体最优解，并根据所述群体最优解(策略组合sc4)以及为优化之前的策略群中每个粒子包含的策略组合，利用粒子群算法的速度更新公式以及位置更新公式对优化之前的策略群(策略群中每个粒子包含的策略组合)进行优化；若所述群体优化算法为遗传算法，则选择染色体群体中适应度高的两个染色体，并通过交叉、变异的方式对染色体的基因(即策略组合)进行优化。

本说明书提供的一个实施例中，获取优化后的策略群后，需继续计算优化后的策略群中每个策略组合对应的二元目标函数值，即按照所述排序结果列表中所述多个业务指标的排序方式依次将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，并根据输出的目标函数值以及未通过的约束条件个数计算每个策略组合的二元目标函数值，具体可通过以下步骤实现：

具体的，沿用上例，所述业务为风控业务，所述风控业务中待优化的风控指标为资损案件发生量、单个案件资损金额和总资损金额，即n等于3，并且根据权重大小进行排序生成的排序结果列表中风控指标的排序结果由上到下依次为资损案件发生量、单个案件资损金额和总资损金额，若对样本向量X₁＝[1 0 0 1]进行优化获得的样本向量为X₁’＝[1 0 10]，因此，将X₁’＝[1 0 1 0]输入目标函数f(x)(i＝1)，得到的目标函数值为17，将X₁’＝[10 1 0]输入单个案件资损金额对应的约束条件g₁(x)(i＝2)，得到的输出结果为g₁(x)＝500<1000，满足约束条件，则继续将X₁’＝[1 0 1 0]输入总资损金额对应的约束条件g₂(x)(i＝3)，得到的输出结果为g₂(x)＝150>100，即不满足约束条件，则将g₂(x)＝150作为该样本向量的约束违背度(用于表示样本向量输入风控指标对应的风险防控算法后输出的值相对于约束值的偏离程度)，并根据i和n的关系可判断样本向量X₁’＝[1 0 1 0]不满足约束条件的个数为1，约束违背度为150，且目标函数值为17，则根据以上数据计算样本向量X₁’＝[10 1 0]对应的二元目标函数值为G(X₁’)＝(1,17)。

上述实施例中，业务指标对应的约束条件的函数表达式为不等式，因此将约束条件中业务指标对应的目标算法输出的约束值作为不满足所述约束条件的样本向量对应的约束违背度；此外，若业务指标对应的约束条件的函数表达式为等式，则确定不满足约束条件的样本向量对应的约束违背度为1。

另外，若根据所述每个策略组合对应的二元目标函数值确定存在至少两个策略组合未通过约束条件的个数相同且未通过约束条件的个数最少，则将所述至少两个策略组合中约束违背度小的策略组合作为所述策略群的群体最优解。

具体的，沿用上例，在计算获得粒子群中8个粒子的样本向量对应的二元目标函数值后，若对比8个二元目标函数值可得，策略组合sc1和sc2通过约束条件的个数为1个，其他6个策略组合通过约束条件的个数均为0，则对比策略组合sc1和sc2对应的约束违背度，并将约束违背度小的策略组合作为所述策略群的最优策略组合。

除此之外，若根据策略群中每个策略组合对应的二元目标函数值确定不存在未通过所述约束条件的策略组合，则将所述策略群中目标函数值最小的策略组合作为所述群体最优解。

具体的，沿用上例，在计算获得粒子群中8个粒子的策略组合对应的二元目标函数值后，若对比8个二元目标函数值可得，8个粒子的策略组合未通过约束条件的个数均为0，则对比8个策略组合对应的目标函数值，并将目标函数值最小的策略组合作为最优策略组合。

通过群体优化算法筛选策略群的最优策略组合，并利用最优策略组合中的策略对业务中的业务指标进行目标优化，有利于提高目标优化的精准性。

本说明书实施例在将优化后的策略群中每个策略组合输入所述目标函数和所述约束条件，并获取输出的与所述每个策略组合对应的业务结果之后，需获取迭代信息并判断所述迭代信息是否满足预设迭代终止条件，具体的，所述预设迭代终止条件包括迭代次数达到预设阈值、所述群体最优解对应的目标函数值达到预设目标阈值和/或所述目标函数收敛中的任意一项，则所述迭代信息包括迭代次数、所述群体最优解对应的目标函数值和/或所述目标函数是否收敛中的任意一项；如果任意一项迭代信息满足对应的预设迭代终止条件，则迭代完成，可在迭代完成后获得的目标策略群的策略组合中筛选业务的最优策略组合；若不满足以上任意一项预设迭代终止条件，则继续将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件并获取输出的与每个样本向量对应的业务结果。

利用目标优化算法并通过迭代的方式对策略群进行优化，为后续策略的筛选做准备。

步骤108，在迭代完成的情况下，在迭代完成后获得的目标策略群的策略组合中筛选所述业务的最优策略组合。

具体的，在迭代完成的情况下，可在迭代完成后获得的目标策略群的策略组合中筛选最优策略组合，即根据输出的与目标策略群中每个策略组合对应的业务结果进行筛选，具体的筛选方式可参照前述实施例中群体最优解的筛选方式，在此不再赘述。

本说明书一个实施例实现了通过将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件的方式，实现了将多目标优化问题转换为单目标优化问题，利用群体优化算法并通过迭代的方式对策略群进行优化，在迭代完成后获得的目标策略群中筛选最优策略组合，利用所述最优策略组合中的策略对业务中的业务指标进行目标优化，有利于提高目标优化的精准性。另外，由于群体优化算法对目标函数的要求较低，适用范围更广，因此采用群体优化算法进行策略筛选，有利于简化多目标优化问题。

下述结合附图2，以本说明书提供的策略选择优化方法应用于风控场景为例，对所述策略选择优化方法进行进一步说明。其中，图2示出了本说明书一个实施例提供的一种策略选择优化方法应用于风控场景的处理流程图，具体步骤包括步骤202至步骤216。

步骤202，根据风控业务中多个风控指标的权重确定目标函数以及所述目标函数的约束条件。

具体的，将风控业务的多个风控指标中权重最大的风控指标对应的风险评估算法确定为目标函数，并将剩余的风控指标对应的风险评估算法转换为所述目标函数的约束条件。

步骤204，确定群体优化算法。

具体的，可选的群体优化算法包括遗传算法、粒子群算法或人工鱼群算法等。

步骤206，初始化策略群，构建策略群中多个策略组合对应的样本向量。

步骤208，计算二元目标函数值。

具体的，构建策略群中多个策略组合对应的样本向量之后，将样本向量分别输入目标函数以及所述目标函数的约束条件，根据输出的目标函数值以及样本向量未通过约束条件的个数计算与每个策略组合对应的二元目标函数值。

步骤210，判断是否满足迭代终止条件，若是，则执行步骤216；若否，则执行步骤212。

具体的，迭代终止条件包括迭代次数达到预设阈值、所述群体最优解对应的目标函数值达到预设目标阈值和/或所述目标函数收敛中的任意一项，如果满足以上任意一项迭代终止条件则优化完成。

步骤212，利用群体优化算法对策略群进行优化。

在不满足迭代终止条件的情况下，利用群体优化算法对策略群进行优化，即对策略群中的每个策略组合进行优化，若所述群体优化算法为粒子群算法，则根据粒子群中的群体最优解和每个粒子的个体最优解，利用粒子群算法的速度更新公式以及位置更新公式对每个样本向量进行优化；若所述群体优化算法为遗传算法，则选择染色体群体中适应度高的两个染色体，并通过交叉、变异的方式对染色体的基因(即样本向量)进行优化。

步骤214，根据优化结果更新策略群中的群体状态。

利用群体优化算法对策略群中的每个策略组合进行优化，根据优化后的样本向量对策略群中的群体状态进行更新，即将优化后的样本向量作为更新后的策略群中每个个体对应的样本向量，返回执行步骤208。

步骤216，筛选最优策略组合。

具体的，在满足迭代终止条件的情况下，根据每个策略组合对应的二元目标函数值中未通过约束条件的个数以及目标函数值筛选最优策略组合；

具体的最优策略组合可通过以下方式筛选：

1)通过约束条件的个数最多的策略组合为群体最优解；

2)若根据所述每个策略组合对应的二元目标函数值确定存在至少两个策略组合未通过约束条件的个数相同且未通过约束条件的个数最少，则将所述至少两个策略组合中约束违背度小的策略组合作为群体最优解；

3)若根据策略群中每个策略组合对应的二元目标函数值确定不存在未通过所述约束条件的策略组合，则将所述策略群中目标函数值最小的策略组合作为群体最优解。

本说明书一个实施例实现了通过将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件的方式，实现了将多目标优化问题转换为单目标优化问题，利用群体优化算法并通过迭代的方式对策略群进行优化，在迭代完成后获得的目标策略群中筛选最优策略组合，利用所述最优策略组合中的策略对业务中的业务指标进行风险防控，有利于提高风险防控的精准性。另外，由于群体优化算法对目标函数的要求较低，适用范围更广，因此采用群体优化算法进行策略筛选，有利于简化多目标优化问题。

与上述方法实施例相对应，本说明书还提供了策略选择优化装置实施例，图3示出了本说明书一个实施例提供的一种策略选择优化装置的结构示意图。如图3所示，该装置包括：

目标函数确定模块302，被配置为将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件；

初始化模块304，被配置为根据所述权重最大的业务指标对应的多个策略初始化策略群；

优化模块306，被配置为通过迭代的方式并利用群体优化算法对策略群进行优化；每次迭代过程中将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，并根据输出的业务结果筛选出优化之前的策略群的群体最优解，利用所述群体优化算法对优化之前的策略群进行优化获得下一次迭代的策略群；

策略筛选模块308，被配置为在迭代完成的情况下，在迭代完成后获得的目标策略群的策略组合中筛选所述业务的最优策略组合。

可选地，所述优化模块306，包括：

业务结果获取子模块，被配置为将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件并获取输出的与每个样本向量对应的业务结果；

群体最优解筛选子模块，被配置为根据所述业务结果在所述每个样本向量对应的策略组合中筛选优化之前的策略群的群体最优解；

优化子模块，被配置为利用群体优化算法并根据所述群体最优解对优化之前的策略群进行优化获得下一次迭代的策略群；

判断子模块，被配置为获取迭代信息并判断所述迭代信息是否满足预设迭代终止条件；

若所述判断子模块的执行结果为是，则运行所述策略筛选模块308；

若所述判断子模块的执行结果为否，则运行所述业务结果获取子模块。

可选地，所述策略选择优化装置，还包括：

二元目标函数值确定模块，被配置为根据优化之前的策略群包含的多个策略组合中每个策略组合的目标函数值和未通过的约束条件的个数确定所述每个策略组合对应的二元目标函数值；

群体最优解确定模块，被配置为根据所述每个策略组合对应的二元目标函数值确定通过约束条件最多的策略组合，并将通过约束条件最多的策略组合作为优化之前的策略群的群体最优解。

可选地，所述策略选择优化装置，还包括：

二元目标函数构建模块，被配置为以策略群中任意一个策略组合输入所述目标函数之后输出的目标函数值和所述任意一个策略组合未通过约束条件的个数为变量构建二元目标函数。

可选地，所述策略选择优化装置，还包括：

业务指标确定模块，被配置为确定所述业务的多个业务指标；

计算模块，被配置为计算各个业务指标对应的权重；

排序模块，被配置为将所述多个业务指标根据权重的大小依次进行排序生成排序结果列表。

可选地，所述业务结果获取子模块，还被配置为：

可选地，所述二元目标函数值确定模块，包括：

目标函数值确定子模块，被配置为获取将优化之前的策略群包含的多个策略组合中每个策略组合对应的样本向量输入所述目标函数之后得到的输出结果，并将所述输出结果作为目标函数值；

约束值获取子模块，被配置为获取按照所述排序结果列表中所述多个业务指标的排序方式依次将所述优化之前的策略群包含的多个策略组合中每个策略组合对应的样本向量输入与第i个业务指标对应的约束条件得到的约束值，其中，i∈[2,n]，n为业务指标的个数，i和n均为正整数；

约束条件判断子模块，被配置为判断所述约束值是否满足所述与所述第i个业务指标对应的约束条件；

若所述约束条件判断子模块的执行结果为是，则i自增1，并运行所述约束值获取子模块；

若所述约束条件判断子模块的执行结果为否，则运行约束违背度确定子模块；

所述约束违背度确定子模块，被配置为根据所述第i个业务指标对应的约束条件的函数表达式以及所述约束值确定不满足约束条件的策略组合对应的约束违背度；

二元目标函数值计算子模块，被配置为根据所述i与n的值以及所述约束违背度计算所述不满足约束条件的策略组合对应的二元目标函数值。

可选地，所述策略选择优化装置，还包括：

第二群体最优解确定模块，被配置为若根据所述每个策略组合对应的二元目标函数值确定存在至少两个策略组合未通过约束条件的个数相同且未通过约束条件的个数最少，则将所述至少两个策略组合中约束违背度小的策略组合作为所述群体最优解。

可选地，所述策略选择优化装置，还包括：

第三群体最优解确定模块，被配置为若根据所述每个策略组合对应的二元目标函数值确定不存在未通过所述约束条件的策略组合，则将所述每个策略组合中目标函数值最小的策略组合作为所述群体最优解。

可选地，所述约束违背度确定子模块，还被配置为：

可选地，所述预设优化终止条件包括以下项中的任意一项：

上述为本实施例的一种策略选择优化装置的示意性方案。需要说明的是，该策略选择优化装置的技术方案与上述的策略选择优化方法的技术方案属于同一构思，策略选择优化装置的技术方案未详细描述的细节内容，均可以参见上述策略选择优化方法的技术方案的描述。

图4示出了根据本说明书一个实施例提供的一种计算设备400的结构框图。该计算设备400的部件包括但不限于存储器410和处理器420。处理器420与存储器410通过总线430相连接，数据库450用于保存数据。

计算设备400还包括接入设备440，接入设备440使得计算设备400能够经由一个或多个网络460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备440可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC))中的一个或多个，诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口，等等。

在本说明书的一个实施例中，计算设备400的上述部件以及图4中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图4所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备400可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备400还可以是移动式或静止式的服务器。

其中，处理器420用于执行如下计算机可执行指令：

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的策略选择优化方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述策略选择优化方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该指令被处理器执行时以用于实现所述策略选择优化方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的策略选择优化方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述策略选择优化方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种策略选择优化方法，包括：

2.根据权利要求1所述的策略选择优化方法，所述通过迭代的方式并利用群体优化算法对策略群进行优化，包括：

3.根据权利要求1所述的策略选择优化方法，所述群体最优解通过以下方式获得：

4.根据权利要求3所述的策略选择优化方法，所述根据优化之前的策略群包含的多个策略组合中每个策略组合的目标函数值和未通过的约束条件的个数确定所述每个策略组合对应的二元目标函数值步骤执行之前，还包括：

5.根据权利要求3所述的策略选择优化方法，所述将业务的多个业务指标中权重最大的业务指标对应的目标算法确定为目标函数，并将剩余的业务指标对应的目标算法转换为所述目标函数的约束条件步骤执行之前，还包括：

确定所述业务的多个业务指标；

计算各个业务指标对应的权重；

6.根据权利要求5所述的策略选择优化方法，所述将优化之前的策略群中策略组合对应的样本向量输入所述目标函数和所述约束条件，包括：

7.根据权利要求6所述的策略选择优化方法，所述根据优化之前的策略群包含的多个策略组合中每个策略组合的目标函数值和未通过的约束条件的个数确定所述每个策略组合对应的二元目标函数值，包括：

8.根据权利要求7所述的策略选择优化方法，所述群体最优解通过如下方式确定：

9.根据权利要求7所述的策略选择优化方法，所述群体最优解通过以下方式确定：

10.根据权利要求7所述的策略选择优化方法，所述根据所述第i个业务指标对应的约束条件的函数表达式以及所述约束值确定不满足约束条件的策略组合对应的约束违背度，包括：

11.根据权利要求2所述的策略选择优化方法，所述预设迭代终止条件包括以下项中的任意一项：

12.一种策略选择优化装置，包括：

13.一种计算设备，包括：

存储器和处理器；

14.一种计算机可读存储介质，其存储有计算机指令，该指令被处理器执行时实现权利要求1至11任意一项所述策略选择优化方法的步骤。