CN113705818B

CN113705818B - 对支付指标波动进行归因的方法及装置

Info

Publication number: CN113705818B
Application number: CN202111023551.6A
Authority: CN
Inventors: 吴歈; 何建杉; 王太峰; 褚崴
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2024-04-19
Anticipated expiration: 2041-08-31
Also published as: CN113705818A

Abstract

本说明书实施例提供一种对支付指标波动进行归因的方法。该方法包括：首先，获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值；接着，利用所述多个训练样本构建第一贝叶斯网络，以及针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；进一步，基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；然后，基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数。

Description

对支付指标波动进行归因的方法及装置

技术领域

本说明书一个或多个实施例涉及计算机技术领域，尤其涉及一种对支付指标波动进行归因的方法及装置，一种对业务指标波动进行归因的方法及装置。

背景技术

随着科学技术的进步和社会的发展，涌现出大量的业务平台，这些业务平台为用户提供各式各样的业务服务，例如，支付平台为用户提供与电子支付业务相关的服务。为了使用户拥有良好的体验，需要维持业务平台运营的安全性、稳定性，这就涉及到对业务平台中业务指标的数值监测。进一步，当监测发现业务指标的指标值发生波动、发生异常变化时，需要对背后原因进行分析。通常情况下，业务指标受到多个因素的影响，人工查阅比对每个因素造成的波动不仅效率低下，而且缺乏科学统一的评判标准。

因此，需要一种方案，可以实现对业务指标波动的自动化归因，从而辅助维护业务平台的稳定运营，进而为用户提供良好的服务体验。

发明内容

本说明书一个或多个实施例描述了一种对支付指标波动进行归因的方法及装置，通过利用训练样本构建贝叶斯网络及反事实样本，得到与支付相关的因子针对支付指标的影响系数，从而自动、高效地实现指标波动归因。

根据第一方面，提供一种对支付指标波动进行归因的方法，包括：获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值；利用所述多个训练样本构建第一贝叶斯网络；针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数。

在一个实施例中，所述多个因子包括以下中的至少一个：支付客户端的安装系统、支付操作的网络环境、支付渠道、支付金额；所述支付指标为支付成功率。

在一个实施例中，在将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本之前，所述方法还包括：从所述多个训练样本中选取两个训练样本，分别作为所述第一训练样本和第二训练样本，所述第一训练样本包括对应所述支付指标的第一指标值，所述第一指标值与所述第二指标值之间的差异程度大于预设阈值。

在一个实施例中，所述第一贝叶斯网络中的图结构包括多个节点之间存在依赖关系而形成的有向连接边，所述多个节点对应所述多个因子和支付指标；所述第一贝叶斯网络还包括对所述依赖关系进行量化表征的条件概率信息。

在一个具体的实施例中，基于所述第一贝叶斯网络处理所述第一反事实样本，得到针对所述支付指标的第一预测结果，包括：将所述第一反事实样本中包括的多个因子值输入所述第一贝叶斯网络，根据所述条件概率信息，得到所述第一预测结果。

在一个实施例中，基于所述第一贝叶斯网络处理所述第一反事实样本，得到针对所述支付指标的第一预测结果，包括：对所述第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络；利用多个噪声项连接所述第一贝叶斯网络和第二贝叶斯网络，得到双子网络；将所述第一训练样本作为所述双子网络中第一贝叶斯网络的输入，得到所述多个噪声项对应的多个噪声值；将所述多个噪声值赋值给所述双子网络中的多个噪声项，并将所述第一反事实样本中的多个因子值作为所述双子网络中第二贝叶斯网络的输入，得到所述第一预测结果。

在一个实施例中，所述第一预测结果中包括所述支付指标的第一概率分布；其中，基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标支付因子针对该支付指标的影响系数，包括：基于所述第一概率分布，计算所述支付指标的第一期望值；基于所述第一期望值和所述第二指标值之间的第一差异程度，确定所述影响系数。

在一个实施例中，所述支付指标属于离散变量，所述第一预测结果中包括所述支付指标对应其取值空间中各个离散值的取值概率；上述基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标支付因子针对该支付指标的影响系数，包括：基于所述第一预测结果中对应所述第二指标值的取值概率，确定所述影响系数。

在一个实施例中，在确定所述影响系数之前，所述方法还包括：将所述第二训练样本中的第二因子值替换为所述第一因子值，得到第二反事实样本；基于所述第一贝叶斯网络处理所述第二反事实样本，得到针对所述支付指标的第二预测结果；其中，确定所述目标因子针对所述支付指标的影响系数，包括：基于所述第一预测结果和所述第二指标值，以及基于所述第二预测结果和所述第一训练样本中对应所述支付指标的第一指标值，确定所述影响系数。

在一个具体的实施例中，所述第一预测结果中包括所述支付指标的第一概率分布，所述第二预测结果中包括所述支付指标的第二概率分布；其中，确定所述影响系数，包括：基于所述第一概率分布，计算所述支付指标的第一期望值；确定所述第一期望值和所述第二指标值之间的第一差异程度；基于所述第二概率分布，计算所述支付指标的第二期望值；确定所述第二期望值和所述第一指标值之间的第二差异程度；根据所述第一差异程度和第二差异程度，确定所述影响系数。

在一个实施例中，在确定所述目标因子针对该支付指标的影响系数之后，所述方法还包括：获取确定出的所述多个因子对应的多个影响系数；基于所述多个影响系数，对所述多个因子进行排序。

根据第二方面，提供一种对业务指标波动进行归因的方法，包括：获取多个业务样本，其中各个业务样本包括在对应的时间切片下，多个业务因子的多个因子值以及业务指标的指标值；利用所述多个业务样本构建贝叶斯网络；针对所述多个业务因子中任一的目标业务因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；基于该贝叶斯网络处理该第一反事实样本，得到针对所述业务指标的第一预测结果；基于所述第一预测结果和所述第二训练样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对所述业务指标的影响系数。

根据第三方面，提供一种对支付指标波动进行归因的装置，包括：获取单元，配置为获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值；网络构建单元，配置为利用所述多个训练样本构建第一贝叶斯网络；第一样本构建单元，配置为针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；第一预测单元，配置为基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；系数确定单元，配置为基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数。

根据第四方面，提供一种对业务指标波动进行归因的装置，包括：获取单元，配置为获取多个业务样本，其中各个业务样本包括在对应的时间切片下，多个业务因子的多个因子值以及业务指标的指标值；网络构建单元，配置为利用所述多个业务样本构建贝叶斯网络；第一样本构建单元，配置为针对所述多个业务因子中任一的目标业务因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；第一预测单元，配置为基于该贝叶斯网络处理该第一反事实样本，得到针对所述业务指标的第一预测结果；系数确定单元，配置为基于所述第一预测结果和第二训练样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对所述业务指标的影响系数。

根据第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当该计算机程序在计算机中执行时，令计算机执行上述第一方面或第二方面提供的方法。

根据第六方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述第一方面或第二方面提供的方法。

采用本说明书实施例提供的方法和装置，通过利用训练样本构建贝叶斯网络及反事实样本，得到与支付相关的因子针对支付指标的影响系数，从而自动、高效地实现指标波动归因，辅助维护业务平台的稳定运营，进而为用户提供良好的服务体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出根据一个实施例的对支付指标波动进行归因的实施场景示意图；

图2示出根据一个实施例的对支付指标波动进行归因的方法流程示意图；

图3示出根据一个实施例的针对反事实样本进行预测的流程示意图；

图4示出根据一个示例的双子网络的图结构示意图；

图5示出根据一个实施例的对业务指标波动进行归因的方法流程示意图；

图6示出根据一个实施例的对支付指标波动进行归因的装置结构示意图；

图7示出根据一个实施例的对业务指标波动进行归因的装置结构示意图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

承前所述，支付平台可以为用户提供与电子支付相关的业务，当监测到支付平台中的支付指标发生波动时，需要高效、准确地找到背后的原因，从而维护支付平台的稳定运行。

基于此，发明人提出一种对支付指标波动进行归因的方法，可以高效、准确地实现自动化归因。图1示出根据一个实施例的对支付指标波动进行归因的实施场景示意图。如图1所示，首先，利用训练样本集训练贝叶斯网络，其中各个训练样本包括在对应时间切片(例如，某一天)下，与支付相关的多个因子(例如，图1中示意的因子A和因子B)的多个因子值和支付指标的指标值；然后，将某一训练样本中针对某个因子(例如，图1中示意的因子A)的因子值，替换为另一训练样本中针对该某个因子的因子值，从而构造得到针对该某个因子的反事实样本；接着，基于该反事实样本和训练得到的贝叶斯网络，确定该某个因子针对支付指标的影响系数。由此，可以得到多个因子针对支付指标的多个影响系数，进而实现对支付指标的波动归因。

下面结合实施例，对上述方法的实施步骤进行描述。

图2示出根据一个实施例的对支付指标波动进行归因的方法流程示意图，所述方法的执行主体可以为任何具有计算、处理能力的装置、平台、服务器或设备集群等，例如，可以为支付平台。如图2所示，所述方法包括以下步骤：

步骤S210，获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值；步骤S220，利用所述多个训练样本构建第一贝叶斯网络；步骤S230，针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；步骤S240，基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；步骤S250，基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数。

对以上步骤的展开介绍如下：

步骤S210，获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值。

需理解，时间切片可以理解为针对时间轴的切片，切片的颗粒度或者说精准度可以是秒、分、日、周或月等。在一个示例中，某两个训练样本对应的时间切片分别为5月3日和5月4日。在另一个示例中，某两个训练样本对应的时间切片分别为2月份和3月份。

在一个实施例中，与支付相关的多个因子可以包括：支付客户端的安装系统、支付操作的网络环境、支付渠道、支付金额、支付用户使用支付业务的年限等。在一个具体的实施例中，其中支付操作的网络环境可以包括I P地址、以及网络类型(如wifi、5G网络等)。在一个示例中，某个训练样本中的多个因子值包括：安卓系统、IP 223.104.42.60、wifi网络、银行卡支付、1000元、7年。在一个实施例中，上述支付指标可以包括支付成功率、支付笔数等。

在获取上述多个训练样本后，在步骤S220，利用该多个训练样本构建贝叶斯网络，为与后文中其他贝叶斯网络区分描述，将本步骤中构建的贝叶斯网络称为第一贝叶斯网络。

第一贝叶斯网络的构建包括建立有向图，以及对该有向图中节点之间存在的依赖关系进行量化表征。在一种实施方式中，可以先建立有向图，再对依赖关系进行量化标准。具体，对于有向图的建立，可以先基于训练样本涉及的上述多个因子，创建对应的多个节点，然后，人工设定节点之间的依赖关系并建立有向连接边。之后，利用上述多个训练样本，通过统计计数等方式，估计出对上述依赖关系进行量化表征的条件概率信息。在另一种实施方式中，可以先创建于多个因子对应的多个节点，再根据上述多个训练样本自动确定节点之间的依赖关系及对该依赖关系进行量化表征。在一个实施例中，可以先定义一个评分函数(score function)，以此来评估贝叶斯拓展网络与训练数据的契合程度，然后基于这个评分函数来寻找结构最优的贝叶斯网络，包括依赖关系的确定和量化表征。

关于对上述节点间依赖关系进行量化表征得到的条件概率信息，在一个实施例中，某个因子属于离散变量，则条件概率信息可以包括其所对应节点的条件概率表。在另一个实施例中，某个因子属于连续型变量，则条件概率信息可以包括其所对应节点的条件概率密度。在又一个实施例中，上述条件概率信息可以包括有向图中每条有向边对应的依赖系数。

由上，可以根据多个训练样本确定出有向图的图结构，以及确定出相关的条件概率信息，从而得到第一贝叶斯网络。

在执行步骤S220之前、之后或者同时，可以执行步骤S230，针对上述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本。需理解，可以将多个因子中任意一个因子作为目标因子。

对于第一训练样本和第二训练样本的选取，在一种实施情况中，基于上述支付指标，可以从上述多个训练样本中选取对应指标值之间的差异程度(或简称差异度)大于预设阈值的两个训练样本，分别作为上述第一训练样本和第二训练样本。在一个实施例中，其中差异程度可以采用多种计算方式得到，例如，可以计算两个指标值之间差值的绝对值作为差异程度，又例如，可以计算该绝对值与两个指标值中较大值之间的比值，作为差异程度，还例如，可以将该绝对值的平方或立方作为差异程度。如此，第一训练样本和第二训练样本可以反映支付指标的数值波动。

需理解，上述多个训练样本是基于真实世界产生的事实数据而形成的。而对于第一反事实样本，其中对应目标因子的因子值来自第二训练样本，而其他因子值和指标值来自第一训练样本，因此，其并未真实发生，是反事实的。

由此，可以基于选取出的第一训练样本和第二训练样本，构建出反事实世界的第一反事实样本。

在以上构建出第一贝叶斯网络以及第一反事实样本之后，在步骤S240，基于该第一贝叶斯网络处理该第一反事实样本，得到针对上述支付指标的第一预测结果。

在一个实施例中，可以将第一反事实样本中包括的对应上述多个因子的多个因子值输入第一贝叶斯网络，得到针对上述支付指标的第一预测结果。具体地，第一贝叶斯网络利用其包括的图结构和上述条件概率信息对上述多个因子值进行处理，从而得到上述第一预测结果。

在另一个实施例中，考虑到贝叶斯网络中可能没有覆盖到影响支付指标的全部因子，为进一步提高针对支付指标的预测准确度，从而提高归因结果的准确性，发明人提出，可以基于上述第一贝叶斯网络，采用贝叶斯反事实问题算法，计算出上述第一预测结果。具体，图3示出根据一个实施例的针对反事实样本进行预测的流程示意图，其中示出本步骤中可以包括以下子步骤：

步骤S241，对所述第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络。需说明，第一贝叶斯网络对应真实世界，第二贝叶斯网络对应反事实世界，对第一贝叶斯网络进行复制而得到的第二贝叶斯网络具有与第一贝叶斯网络相同的图结构和条件概率信息。

步骤S242，利用多个噪声项连接上述第一贝叶斯网络和第二贝叶斯网络，得到双子网络。需说明，在构建第一贝叶斯网络时已经考虑了上述多个因子，但实际可能还存未观测到的影响支付指标的因子，如天气、用户心情等，据此，用噪声项对这些未被包含在贝叶斯网络中的因子进行模拟。进一步，噪声项的取值在真实世界和反事实世界的取值是一致的，因此可以通过噪声项连接、打通第一贝叶斯网络和第二贝叶斯网络，将源自真实世界的事实样本(如上述训练样本)所包含的信息，从第一贝叶斯网络传播到第二贝叶斯网络。

此外，对于噪声项的数量，以及噪声项如何连接上述两个贝叶斯网络，可以根据实际经验进行设定。在一种实施方式中，可以设定与上述多个因子中各个因子对应的噪声项，进一步，针对各个因子在两个贝叶斯网络中对应的两个因子节点，将其所对应的噪声项的噪声项节点(或简称噪声节点)同时作为该两个因子节点的父节点，也即，建立由该噪声节点指向该两个因子节点的两条有向连接边。进一步，在一个实施例中，还可以设定与上述支付指标对应的噪声项，进一步，针对支付指标在两个贝叶斯网络中对应的两个指标节点，建立由该噪声项对应的节点指向该两个指标节点的两条有向连接边。

为便于直观理解，图4示出根据一个示例的双子网络的图结构示意图，如图4所示，该双子网络中的第一贝叶斯网络包括3个因子节点a、b、c和1个支付指标节点s，第二贝叶斯网络包括3个因子节点a*、b*、c*和1个支付指标节点s*，双子网络中还包括4个噪声节点r_a、r_b、r_c和r_s，噪声节点与其对应的因子节点之间存在有向连接边。

如此，可以得到双子网络。

步骤S243，将第一训练样本作为双子网络中第一贝叶斯网络的输入，得到多个噪声项对应的多个噪声值。在一个实施例中，可以获取预先设定(例如，由工作人员根据实际经验设定)的上述多个因子及多个噪声项的取值，与支付指标的取值之间的映射关系，然后，基于该映射关系，根据第一训练样本中包括的多个因子值和指标值，确定出上述多个噪声项的取值。如此，可以根据第一训练样本确定上述多个噪声项的取值。

步骤S244，将多个噪声值赋值给上述双子网络中的多个噪声项，并将第一反事实样本中的多个因子值作为双子网络中第二贝叶斯网络的输入，得到第一预测结果。如此，双子网络中考虑到了已观测到的变量和所有未观测到的变量，由此得到的第一预测结果具有较高准确度。

由此，通过图3示出的针对本步骤S240的子步骤，可以实现采用贝叶斯反事实问题算法，计算出上述针对支付指标的第一预测结果。

在以上基于第一贝叶斯网络对第一反事实样本进行处理，得到针对支付指标的第一预测结果之后，在步骤S250，基于该第一预测结果和第二训练样本中对应支付指标的第二指标值，确定上述目标因子针对支付指标的影响系数。需理解，在本说明书实施例中，以影响系数越大，表明目标因子对支付指标的影响越大为前提进行描述，实际上反向也可。

在一个实施例中，上述支付指标属于离散变量，上述第一预测结果中包括该支付指标对应其取值空间中各个离散值的取值概率。基于此，本步骤可以包括：基于该第一预测结果中对应上述第二指标值的取值概率，确定上述影响系数。需理解，取值概率越大，影响系数越大。基于此，在一个具体的实施例中，可以直接将取值概率作为影响系数；在另一个具体的实施例中，可以将取值概率输入预先设定的单调递增函数(例如，y＝x²)，并将得到的函数值作为影响系数。

在一个实施例中，第一预测结果中包括支付指标的第一概率分布，相应，本步骤中可以包括：基于该第一概率分布，计算支付指标的第一期望值，然后，基于该第一期望值和第二指标值之间的第一差异程度，确定上述影响系数。在一个具体的实施例中，若支付指标属于离散变量，则上述第一概率分布可以包括支付指标的概率质量函数；若支付指标属于连续型变量，则上述第一概率分布可以包括支付指标的概率密度函数。进一步，可以基于概率质量函数或概率密度函数，计算出上述第一期望值。

第一差异程度能够反映对应两个数值之间的差异，对于其计算方式，在一个具体的实施例中，可以计算第一期望值和第二指标值之间差值的绝对值，作为第一差异程度。在另一个具体的实施例中，可以先计算第一期望值和第二指标值之间的差值，进而计算该差值与第一期望值或第二指标值之间的比值的绝对值，作为第一差异度。在又一个具体的实施例中，可以计算第一期望值和第二指标值之间的差值的平方，作为第一差异度。在还一个具体的实施例中，可以计算第一期望值和第二指标值中的较小者与较大者之间的比值，作为第一差异度。

对于根据第一差异度确定影响系数，需理解，第一差异度越小，影响系数越大。基于此，在一个具体的实施例中，可以将第一差异度输入预先设定的单调递减函数(如y＝1/x)中，并将得到的函数值作为影响系数。在另一个具体的实施例中，可以利用预先设定的差异度区间与影响系数之间的映射关系，确定该第一差异度对应的影响系数，具体，可以先确定第一差异度所在的差异度区间，再确定此差异度区间所对应的影响系数，作为第一差异度对应的影响系数。

以上，可以基于针对支付指标的第一预测结果，以及第二训练样本中的第二指标值，确定出目标因子针对支付指标的影响系数。其中，第一预测结果是对第一反事实样本进行处理而得到，第一反事实样本是通过将第一训练样本中对应目标因子的第一因子值替换为第二训练样本中的第二因子值而得到。相应地，根据另一方面的实施例中，上述方法还可以包括：将第二训练样本中的第二因子值替换为第一训练样本中的第一因子值，得到第二反事实样本，并利用上述第一贝叶斯网络处理该第二反事实样本，得到针对支付指标的第二预测结果，从而，还根据该第二预测结果以及第一训练样本中对应支付指标的第一指标值，确定上述影响系数。

根据一个具体的实施例，第一预测结果和第二预测结果中分别包括支付指标的第一概率分布和第二概率分布，基于此，本步骤可以包括：基于第一概率分布，计算支付指标的第一期望值，并确定该第一期望值和上述第二指标值之间的第一差异程度；基于第二概率分布，计算支付指标的第二期望值，并确定该第二期望值和上述第一指标值之间的第二差异程度；之后，根据第一差异程度和第二差异程度，确定上述影响系数。在一个示例中，可以将第一差异程度和第二差异程度的平均值的倒数，确定为上述影响系数。在另一个示例中，可以将该倒数的平方确定为上述影响系数。

需说明，参见前述实施例中对基于第一预测结果和第二指标值确定出影响系数的描述，同样，可以基于第二预测结果和第一指标值确定出影响系数，之后将确定出的两个影响系数的平均值或和值，作为目标因子针对支付指标的最终影响系数。

由上，可以确定目标因子针对支付指标的影响系数。目标因子可以是上述多个因子中的任意一个因子，据此，可以确定出多个因子针对支付指标的多个影响系数。在一个实施例中，上述方法还可以包括：基于该多个影响系数，对多个因子进行排序。如此，可以得到多个因子对支付指标波动的影响排序，从而辅助指导支付平台的运营、维护。

综上，在本说明书实施例披露的对支付指标波动进行归因的方法中，通过利用训练样本构建贝叶斯网络及反事实样本，得到与支付相关的因子针对支付指标的影响系数，从而自动、高效地实现指标波动归因，辅助维护业务平台的稳定运营，进而为用户提供良好的服务体验。

以上主要介绍支付指标波动归因的方法，实际上，此方法除了可以应用在与支付业务相关的指标，还可以推广应用到与其他业务相关的指标的波动归因。相应，本说明书实施例还披露一种对业务指标波动进行归因的方法。图5示出根据一个实施例的对业务指标波动进行归因的方法流程示意图，所述方法的执行主体可以是任何具有计算、处理能力的服务器、装置、平台或设备集群，例如，业务平台。如图5所示，所述方法包括以下步骤：

步骤S510，获取多个业务样本，其中各个业务样本包括在对应的时间切片下，多个业务因子的多个因子值以及业务指标的指标值；步骤S520，利用所述多个业务样本构建贝叶斯网络；步骤S530，针对所述多个业务因子中任一的目标业务因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；步骤S540，基于该贝叶斯网络处理该第一反事实样本，得到针对所述业务指标的第一预测结果；步骤S550，基于所述第一预测结果和所述第二训练样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对所述业务指标的影响系数。

针对以上步骤，在一个实施例中，对于上述业务指标所涉及的业务，从业务操作角度来看，可以包括登录、注册、访问、交易等；从业务所针对的对象来看，可以包括用户、商品等。在一个实施例中，上述业务指标可以是业务成功率或业务成功次数等。示例性地，业务指标可以是：登录成功率、注册成功率、注册用户数、访问次数、访问成功率、用户流失率、商品热度。在一个实施例中，上述多个因子包括以下中的至少一个：业务客户端的安装系统、业务操作的网络环境。此外需理解，上述多个因子可以根据具体的业务指标进行适应性设定。

在一个实施例中，所述第一业务样本中包括对应所述业务指标的第一指标值，该第一指标值与所述第二指标值之间的差异程度大于预设阈值。

在一个实施例中，所述第一贝叶斯网络中的图结构包括多个节点之间存在依赖关系而形成的有向连接边，所述多个节点对应所述多个因子和业务指标；所述第一贝叶斯网络还包括对所述依赖关系进行量化表征的条件概率信息。

进一步，在一个具体的实施例中，基于所述第一贝叶斯网络处理所述第一反事实样本，得到针对所述业务指标的第一预测结果，包括：将所述第一反事实样本中包括的多个因子值输入所述第一贝叶斯网络，根据所述条件概率信息，得到所述第一预测结果。

在一个实施例中，基于所述第一贝叶斯网络处理所述第一反事实样本，得到针对所述业务指标的第一预测结果，包括：对所述第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络；利用多个噪声项连接所述第一贝叶斯网络和第二贝叶斯网络，得到双子网络；将所述第一业务样本作为所述双子网络中第一贝叶斯网络的输入，得到所述多个噪声项对应的多个噪声值；将所述多个噪声值赋值给所述双子网络中的多个噪声项，并将所述第一反事实样本中的多个因子值作为所述双子网络中第二贝叶斯网络的输入，得到所述第一预测结果。

在一个实施例中，所述第一预测结果中包括所述业务指标的第一概率分布；其中，基于所述第一预测结果和所述第二业务样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对该业务指标的影响系数，包括：基于所述第一概率分布，计算所述业务指标的第一期望值；基于所述第一期望值和所述第二指标值之间的第一差异程度，确定所述影响系数。

在一个实施例中，所述业务指标属于离散变量，所述第一预测结果中包括所述业务指标对应其取值空间中各个离散值的取值概率；其中，基于所述第一预测结果和所述第二业务样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对该业务指标的影响系数，包括：基于该第一预测结果中对应所述第二指标值的取值概率，确定所述影响系数。

在一个实施例中，在确定所述影响系数之前，所述方法还包括：将所述第二业务样本中的第二因子值替换为所述第一因子值，得到第二反事实样本；基于所述第一贝叶斯网络处理所述第二反事实样本，得到针对所述业务指标的第二预测结果；其中，确定所述目标因子针对所述业务指标的影响系数，包括：基于所述第一预测结果和所述第二指标值，以及基于所述第二预测结果和所述第一业务样本中对应所述业务指标的第一指标值，确定所述影响系数。

在一个具体的实施例中，所述第一预测结果中包括所述业务指标的第一概率分布，所述第二预测结果中包括所述业务指标的第二概率分布；其中，确定所述影响系数，包括：基于所述第一概率分布，计算所述业务指标的第一期望值；确定所述第一期望值和所述第二指标值之间的第一差异程度；基于所述第二概率分布，计算所述业务指标的第二期望值；确定所述第二期望值和所述第一指标值之间的第二差异程度；根据所述第一差异程度和第二差异程度，确定所述影响系数。

在一个实施例中，在确定所述目标因子针对该业务指标的影响系数之后，所述方法还包括：获取确定出的所述多个因子对应的多个影响系数；基于所述多个影响系数，对所述多个因子进行排序。

需说明，对图5中所示出的方法步骤的描述，还可以参见前述实施例中的相关描述。

综上，在本说明书实施例披露的对业务指标波动进行归因的方法中，通过利用训练样本构建贝叶斯网络及反事实样本，得到与业务相关的因子针对业务指标的影响系数，从而自动、高效地实现指标波动归因，辅助维护业务平台的稳定运营，进而为用户提供良好的服务体验。

与上述归因方法相对应的，本说明书实施例还披露归因装置。具体地，图6示出根据一个实施例的对支付指标波动进行归因的装置结构示意图，所述装置可以实现为任何具有计算、处理能力的服务器、装置、平台或设备集群，例如，支付平台。如图6所示，所述装置600包括以下单元：

获取单元601，配置为获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值。网络构建单元602，配置为利用所述多个训练样本构建第一贝叶斯网络；第一样本构建单元603，配置为针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；第一预测单元604，配置为基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；系数确定单元605，配置为基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数。

在一个实施例中，所述装置600还包括：样本选取单元606，配置为从所述多个训练样本中选取两个训练样本，分别作为所述第一训练样本和第二训练样本，所述第一训练样本包括对应所述支付指标的第一指标值，所述第一指标值与所述第二指标值之间的差异程度大于预设阈值。

在一个具体的实施例中，所述第一预测单元604具体配置为：将所述第一反事实样本中包括的多个因子值输入所述第一贝叶斯网络，根据所述条件概率信息，得到所述第一预测结果。

在一个实施例中，第一预测单元604具体配置为：对所述第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络；利用多个噪声项连接所述第一贝叶斯网络和第二贝叶斯网络，得到双子网络；将所述第一训练样本作为所述双子网络中第一贝叶斯网络的输入，得到所述多个噪声项对应的多个噪声值；将所述多个噪声值赋值给所述双子网络中的多个噪声项，并将所述第一反事实样本中的多个因子值作为所述双子网络中第二贝叶斯网络的输入，得到所述第一预测结果。

在一个实施例中，所述第一预测结果中包括所述支付指标的第一概率分布；其中，所述系数确定单元605具体配置为：基于所述第一概率分布，计算所述支付指标的第一期望值；基于所述第一期望值和所述第二指标值之间的第一差异程度，确定所述影响系数。

在一个实施例中，所述支付指标属于离散变量，所述第一预测结果中包括所述支付指标对应其取值空间中各个离散值的取值概率；其中，所述系数确定单元605具体配置为：基于所述第一预测结果中对应所述第二指标值的取值概率，确定所述影响系数。

在一个实施例中，所述装置600还包括：第二样本构建单元607，配置为将所述第二训练样本中的第二因子值替换为所述第一因子值，得到第二反事实样本；第二预测单元608，配置为基于所述第一贝叶斯网络处理所述第二反事实样本，得到针对所述支付指标的第二预测结果；所述系数确定单元605具体配置为：基于所述第一预测结果和所述第二指标值，以及基于所述第二预测结果和所述第一训练样本中对应所述支付指标的第一指标值，确定所述影响系数。

在一个具体的实施例中，所述第一预测结果中包括所述支付指标的第一概率分布，所述第二预测结果中包括所述支付指标的第二概率分布；所述系数确定单元605进一步配置为：基于所述第一概率分布，计算所述支付指标的第一期望值；确定所述第一期望值和所述第二指标值之间的第一差异程度；基于所述第二概率分布，计算所述支付指标的第二期望值；确定所述第二期望值和所述第一指标值之间的第二差异程度；根据所述第一差异程度和第二差异程度，确定所述影响系数。

在一个实施例中，所述装置600还包括：系数获取单元609，配置为获取确定出的所述多个因子对应的多个影响系数；因子排序单元610，配置为基于所述多个影响系数，对所述多个因子进行排序。

图7示出根据一个实施例的对业务指标波动进行归因的装置结构示意图，所述装置可以实现为任何具有计算、处理能力的服务器、装置、平台或设备集群，例如，业务平台。如图7所示，所述装置700包括以下单元：

获取单元701，配置为获取多个业务样本，其中各个业务样本包括在对应的时间切片下，与业务相关的多个因子的多个因子值以及业务指标的指标值。网络构建单元702，配置为利用所述多个业务样本构建第一贝叶斯网络；第一样本构建单元703，配置为针对所述多个因子中任一的目标因子，将第一业务样本中对应的第一因子值替换为第二业务样本中对应的第二因子值，得到第一反事实样本；第一预测单元704，配置为基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述业务指标的第一预测结果；系数确定单元705，配置为基于所述第一预测结果和所述第二业务样本中对应所述业务指标的第二指标值，确定所述目标因子针对所述业务指标的影响系数。

在一个实施例中，所述多个因子包括以下中的至少一个：业务客户端的安装系统、业务操作的网络环境；所述业务指标为业务成功率。

在一个实施例中，所述装置700还包括：样本选取单元706，配置为从所述多个业务样本中选取两个业务样本，分别作为所述第一业务样本和第二业务样本，所述第一业务样本包括对应所述业务指标的第一指标值，所述第一指标值与所述第二指标值之间的差异程度大于预设阈值。

在一个具体的实施例中，所述第一预测单元704具体配置为：将所述第一反事实样本中包括的多个因子值输入所述第一贝叶斯网络，根据所述条件概率信息，得到所述第一预测结果。

在一个实施例中，第一预测单元704具体配置为：对所述第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络；利用多个噪声项连接所述第一贝叶斯网络和第二贝叶斯网络，得到双子网络；将所述第一业务样本作为所述双子网络中第一贝叶斯网络的输入，得到所述多个噪声项对应的多个噪声值；将所述多个噪声值赋值给所述双子网络中的多个噪声项，并将所述第一反事实样本中的多个因子值作为所述双子网络中第二贝叶斯网络的输入，得到所述第一预测结果。

在一个实施例中，所述第一预测结果中包括所述业务指标的第一概率分布；其中，所述系数确定单元705具体配置为：基于所述第一概率分布，计算所述业务指标的第一期望值；基于所述第一期望值和所述第二指标值之间的第一差异程度，确定所述影响系数。

在一个实施例中，所述业务指标属于离散变量，所述第一预测结果中包括所述业务指标对应其取值空间中各个离散值的取值概率；其中，所述系数确定单元705具体配置为：基于所述第一预测结果中对应所述第二指标值的取值概率，确定所述影响系数。

在一个实施例中，所述装置700还包括：第二样本构建单元707，配置为将所述第二业务样本中的第二因子值替换为所述第一因子值，得到第二反事实样本；第二预测单元708，配置为基于所述第一贝叶斯网络处理所述第二反事实样本，得到针对所述业务指标的第二预测结果；所述系数确定单元705具体配置为：基于所述第一预测结果和所述第二指标值，以及基于所述第二预测结果和所述第一业务样本中对应所述业务指标的第一指标值，确定所述影响系数。

在一个具体的实施例中，所述第一预测结果中包括所述业务指标的第一概率分布，所述第二预测结果中包括所述业务指标的第二概率分布；所述系数确定单元705进一步配置为：基于所述第一概率分布，计算所述业务指标的第一期望值；确定所述第一期望值和所述第二指标值之间的第一差异程度；基于所述第二概率分布，计算所述业务指标的第二期望值；确定所述第二期望值和所述第一指标值之间的第二差异程度；根据所述第一差异程度和第二差异程度，确定所述影响系数。

在一个实施例中，所述装置700还包括：系数获取单元709，配置为获取确定出的所述多个因子对应的多个影响系数；因子排序单元710，配置为基于所述多个影响系数，对所述多个因子进行排序。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2或图3或图5所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，该存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2或图3或图5所描述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种对支付指标波动进行归因的方法，包括：

获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值；

利用所述多个训练样本构建第一贝叶斯网络；

针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；

基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；

基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数；

其中，得到针对所述支付指标的第一预测结果包括：将所述第一反事实样本中包括的对应所述多个因子的多个因子值输入所述第一贝叶斯网络，得到所述第一预测结果；或者，

对所述第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络；利用多个噪声项连接所述第一贝叶斯网络和第二贝叶斯网络，得到双子网络；将所述第一训练样本作为所述双子网络中第一贝叶斯网络的输入，得到所述多个噪声项对应的多个噪声值；将所述多个噪声值赋值给所述双子网络中的多个噪声项，并将所述第一反事实样本中的多个因子值作为所述双子网络中第二贝叶斯网络的输入，得到所述第一预测结果。

2.根据权利要求1所述的方法，其中，所述多个因子包括以下中的至少一个：支付客户端的安装系统、支付操作的网络环境、支付渠道、支付金额；所述支付指标为支付成功率。

3.根据权利要求1所述的方法，其中，在将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本之前，所述方法还包括：

从所述多个训练样本中选取两个训练样本，分别作为所述第一训练样本和第二训练样本，所述第一训练样本包括对应所述支付指标的第一指标值，所述第一指标值与所述第二指标值之间的差异程度大于预设阈值。

4.根据权利要求1所述的方法，其中，所述第一贝叶斯网络中的图结构包括多个节点之间存在依赖关系而形成的有向连接边，所述多个节点对应所述多个因子和支付指标；所述第一贝叶斯网络还包括对所述依赖关系进行量化表征的条件概率信息。

5.根据权利要求1-4中任一项所述的方法，其中，所述第一预测结果中包括所述支付指标的第一概率分布；其中，基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对该支付指标的影响系数，包括：

基于所述第一概率分布，计算所述支付指标的第一期望值；

基于所述第一期望值和所述第二指标值之间的第一差异程度，确定所述影响系数。

6.根据权利要求1-4中任一项所述的方法，其中，所述支付指标属于离散变量，所述第一预测结果中包括所述支付指标对应其取值空间中各个离散值的取值概率；其中，基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对该支付指标的影响系数，包括：

基于所述第一预测结果中对应所述第二指标值的取值概率，确定所述影响系数。

7.根据权利要求1所述的方法，其中，在确定所述影响系数之前，所述方法还包括：

将所述第二训练样本中的第二因子值替换为所述第一因子值，得到第二反事实样本；

基于所述第一贝叶斯网络处理所述第二反事实样本，得到针对所述支付指标的第二预测结果；

其中，确定所述目标因子针对所述支付指标的影响系数，包括：基于所述第一预测结果和所述第二指标值，以及基于所述第二预测结果和所述第一训练样本中对应所述支付指标的第一指标值，确定所述影响系数。

8.根据权利要求7所述的方法，其中，所述第一预测结果中包括所述支付指标的第一概率分布，所述第二预测结果中包括所述支付指标的第二概率分布；其中，确定所述影响系数，包括：

基于所述第一概率分布，计算所述支付指标的第一期望值；

确定所述第一期望值和所述第二指标值之间的第一差异程度；

基于所述第二概率分布，计算所述支付指标的第二期望值；

确定所述第二期望值和所述第一指标值之间的第二差异程度；

根据所述第一差异程度和第二差异程度，确定所述影响系数。

9.根据权利要求1所述的方法，其中，在确定所述目标因子针对该支付指标的影响系数之后，所述方法还包括：

获取确定出的所述多个因子对应的多个影响系数；

基于所述多个影响系数，对所述多个因子进行排序。

10.一种对业务指标波动进行归因的方法，包括：

获取多个业务样本，其中各个业务样本包括在对应的时间切片下，多个业务因子的多个因子值以及业务指标的指标值；

利用所述多个业务样本构建贝叶斯网络；

针对所述多个业务因子中任一的目标业务因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；

基于该贝叶斯网络处理该第一反事实样本，得到针对所述业务指标的第一预测结果；

基于所述第一预测结果和所述第二训练样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对所述业务指标的影响系数；

其中，得到针对所述业务指标的第一预测结果，包括：将所述第一反事实样本中包括的对应所述多个业务因子的多个因子值输入第一贝叶斯网络，得到所述第一预测结果；或者，

对第一贝叶斯网络进行复制，得到第二贝叶斯网络作为反事实贝叶斯网络；利用多个噪声项连接所述第一贝叶斯网络和第二贝叶斯网络，得到双子网络；将所述第一训练样本作为所述双子网络中第一贝叶斯网络的输入，得到所述多个噪声项对应的多个噪声值；将所述多个噪声值赋值给所述双子网络中的多个噪声项，并将所述第一反事实样本中的多个业务因子值作为所述双子网络中第二贝叶斯网络的输入，得到所述第一预测结果。

11.一种对支付指标波动进行归因的装置，包括：

获取单元，配置为获取多个训练样本，其中各个训练样本包括在对应的时间切片下，与支付相关的多个因子的多个因子值以及支付指标的指标值；

网络构建单元，配置为利用所述多个训练样本构建第一贝叶斯网络；

第一样本构建单元，配置为针对所述多个因子中任一的目标因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；

第一预测单元，配置为基于该第一贝叶斯网络处理该第一反事实样本，得到针对所述支付指标的第一预测结果；

系数确定单元，配置为基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值，确定所述目标因子针对所述支付指标的影响系数；

其中，所述第一预测单元具体配置为：将所述第一反事实样本中包括的对应所述多个因子的多个因子值输入所述第一贝叶斯网络，得到所述第一预测结果；或者，

12.一种对业务指标波动进行归因的装置，包括：

获取单元，配置为获取多个业务样本，其中各个业务样本包括在对应的时间切片下，多个业务因子的多个因子值以及业务指标的指标值；

网络构建单元，配置为利用所述多个业务样本构建贝叶斯网络；

第一样本构建单元，配置为针对所述多个业务因子中任一的目标业务因子，将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值，得到第一反事实样本；

第一预测单元，配置为基于该贝叶斯网络处理该第一反事实样本，得到针对所述业务指标的第一预测结果；

系数确定单元，配置为基于所述第一预测结果和所述第二训练样本中对应所述业务指标的第二指标值，确定所述目标业务因子针对所述业务指标的影响系数；

其中，所述第一预测单元具体配置为：将所述第一反事实样本中包括的对应所述多个业务因子的多个因子值输入第一贝叶斯网络，得到所述第一预测结果；或者，

13.一种计算机可读存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-10中任一项所述的方法。

14.一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-10中任一项所述的方法。