CN114693352A

CN114693352A - 一种客户访问量预测方法及装置

Info

Publication number: CN114693352A
Application number: CN202210322247.XA
Authority: CN
Inventors: 卢健
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2022-07-01

Abstract

本发明提供一种客户访问量预测方法及装置，可用于数据处理技术领域。所述方法包括：根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征；将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。本发明实施例提供的客户访问量预测方法及装置，能够批量预测各网点未来一段时间的客户访问量，不需要对每个网点单独建立各自的模型。

Description

一种客户访问量预测方法及装置

技术领域

本发明涉及数据处理技术领域，具体涉及一种客户访问量预测方法及装置。

背景技术

目前，银行网点设备和人员单纯基于人群的密度进行规划配置，由于不同网点的业务量不同，使得网点业务和设备以及人员的配置并不匹配，部分网点设备和人员超负荷运营，另一部分设备闲置，银行每年都要花费大量的人力和物力对银行网点的设备和人员进行管理，无法实现精准的网点管理。

若能够根据网点的历史访问人数预测未来一段时间的访问量趋势，则业务人员可以根据网点访问人数对客户服务人员的排班做出决策。预测的越精准，其可靠性就越大，人力成本支出就越小。业务人员曾尝试使用传统的ARIMA方法，但ARIMA模型只能预测一个网点未来的客户量。然而每家银行具有上万个网点，那么就要使用上万个ARIMA模型，复杂度太大。

发明内容

针对现有技术中的问题，本发明实施例提供一种客户访问量预测方法及装置，能够至少部分地解决现有技术中存在的问题。

第一方面，本发明提出一种客户访问量预测方法，包括：

根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；

将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。

可选的，所述根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征包括：

根据每个网点的历史客户访问信息，确定所述待预测的时间范围内每天每个网点的时滞性特征、自相关系数特征、中位数特征以及周期性特征；

根据所述每天每个网点的时滞性特征、自相关系数特征、中位数特征以及周期性特征，构建所述待预测的时间范围内所述网点每天的历史访问特征；

根据每个网点的历史客户访问信息，确定所述第一历史时间范围内每天每个网点的客户访问量、时滞性特征、自相关系数特征、中位数特征以及周期性特征；

根据所述每天每个网点的客户访问量、时滞性特征、自相关系数特征、中位数特征以及周期性特征，构建所述第一历史时间范围内所述网点每天的全量访问特征。

可选的，所述待预测的时间范围内所述网点每天的历史访问特征中还包括所述网点的属性特征；

所述第一历史时间范围内所述网点每天的全量访问特征中还包括所述网点的属性特征。

可选的，所述将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量包括：

根据待预测的时间范围内每天每个网点的历史访问特征，按照日期构建m个历史特征向量，其中，m等于待预测的时间范围的时间长度，在每一个所述历史特征向量中，包括待预测的时间范围内的其中一天各所述网点在该天的历史访问特征；

将所述m个历史特征向量按照日期升序进行排序，得到历史特征向量序列；

根据第一历史时间范围内每天每个网点的全量访问特征，按照日期构建n个全量特征向量，其中，n等于第一历史时间范围的时间长度，在每一个所述全量特征向量中，包括第一历史时间范围内的其中一天各所述网点在该天的全量访问特征；

将所述n个全量特征向量按照日期升序进行排序，得到全量特征向量序列；

将所述历史特征向量序列以及所述全量特征向量序列分别输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。

可选的，所述方法还包括：

获取训练集中第二历史时间范围内每天每个网点的历史访问特征和客户访问量、以及所述第二历史时间范围之前的第三历史时间范围内每天每个网点的全量访问特征，其中，所述第二历史时间范围的时间长度与所述待预测的时间范围的时间长度相等，所述第三历史时间范围的时间长度与所述第一历史时间范围的时间长度相等；

以所述第二历史时间范围内每天每个网点的历史访问特征以及所述第三历史时间范围内每天每个网点的全量访问特征作为输入，以所述第二历史时间范围内每天每个网点的客户访问量作为标签，对预先建立的用序列预测序列的深度学习模型进行训练，得到训练好的客户访问量预测模型。

可选的，所述用序列预测序列的深度学习模型包括编码模块和解码模块；其中，

所述编码模块用于接收所述第三历史时间范围内每天每个网点的全量访问特征，输出n个隐含特征向量，其中，n等于第三历史时间范围的时间长度；

所述解码模块用于接收所述第二历史时间范围内每天每个网点的历史访问特征、所述n个隐含特征向量、以及所述第三历史时间范围内的最后一天每个网点的客户访问量，输出所述第二历史时间范围内每天每个网点的客户访问量预测值。

可选的，所述编码模块根据以下隐含特征向量计算公式计算每个隐含特征向量：

式中，

表示编码模块输出的第t个的隐含特征向量；

f_t ^x表示所述第三历史时间范围内的第t天每个网点的全量访问特征所组成的全量访问特征向量；

表示编码模块输出的第t-1个的隐含特征向量，其中，

是随机生成的，1≤t≤n，n等于所述第三历史时间范围的时间长度。

可选的，所述解码模块根据以下客户访问量计算公式计算所述第二历史时间范围内每天每个网点的客户访问量预测值：

式中，

y₁′表示第二历史时间范围内的第一天每个网点的客户访问量预测值所组成的向量；

y′_k为第二历史时间范围内的第k天每个网点的客户访问量预测值所组成的向量；

a₁＝α₁h^x；

W₁、W₂、W₃分别为参数矩阵；

x_n为第三历史时间范围内的最后一天每个网点的客户访问量所构成的向量；

f₁ ^y为第二历史时间范围内的第一天每个网点的历史访问特征所组成的历史访问特征向量；

a_k＝α₂h^x；

为第二历史时间范围内的第k天每个网点的历史访问特征所组成的历史访问特征向量；

m为第二历史时间范围的时间长度；

h^x为编码模块输出的n个隐含特征向量所组成的向量。

可选的，所述用序列预测序列的深度学习模型还包括偏离度计算模块，所述偏离度计算模块用于：

计算所述解码模块输出的所述第二历史时间范围内每天每个网点的客户访问量预测值与所述第二历史时间范围内每天每个网点的客户访问量之间的偏离度；

按照所述偏离度调整所述客户访问量计算公式中的参数矩阵，直至所述解码模块输出的所述第二历史时间范围内每天每个网点的客户访问量预测值与所述第二历史时间范围内每天每个网点的客户访问量之间的偏离度小于预设阈值。

另一方面，本发明提出一种客户访问量预测装置，包括：

构建模块，用于根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；

输入模块，用于将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。

可选的，所述构建模块具体用于：

可选的，所述输入模块具体用于：

可选的，所述装置还包括：

获取模块，用于获取训练集中第二历史时间范围内每天每个网点的历史访问特征和客户访问量、以及所述第二历史时间范围之前的第三历史时间范围内每天每个网点的全量访问特征，其中，所述第二历史时间范围的时间长度与所述待预测的时间范围的时间长度相等，所述第三历史时间范围的时间长度与所述第一历史时间范围的时间长度相等；

训练模块，用于以所述第二历史时间范围内每天每个网点的历史访问特征以及所述第三历史时间范围内每天每个网点的全量访问特征作为输入，以所述第二历史时间范围内每天每个网点的客户访问量作为标签，对预先建立的用序列预测序列的深度学习模型进行训练，得到训练好的客户访问量预测模型。

式中，

表示编码模块输出的第t个的隐含特征向量；

表示编码模块输出的第t-1个的隐含特征向量，其中，

式中，

y′₁′表示第二历史时间范围内的第一天每个网点的客户访问量预测值所组成的向量；

y′′_k为第二历史时间范围内的第k天每个网点的客户访问量预测值所组成的向量；

a₁＝α₁h^x；

W₁、W₂、W₃分别为参数矩阵；

a_k＝α₂h^x；

m为第二历史时间范围的时间长度；

h^x为编码模块输出的n个隐含特征向量所组成的向量。

再一方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一实施例所述的客户访问量预测方法的步骤。

又一方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述任一实施例所述的客户访问量预测方法的步骤。

本发明实施例提供的客户访问量预测方法及装置，根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。这样，能够通过预先训练好的客户访问量预测模型同时拟合不同网点的时序信息，批量预测各个网点未来一段时间每天的客户访问量，不需要对每个网点单独建立各自的模型。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1是本发明一实施例提供的客户访问量预测方法的流程示意图。

图2是本发明一实施例提供的客户访问量预测方法的部分流程示意图。

图3是本发明一实施例提供的客户访问量预测方法的部分流程示意图。

图4是本发明一实施例构建的seq2seq时序模型的结构示意图。

图5是本发明一实施例中构造的存储每个网点每天的特征数据的二维表的示意图。

图6是本发明一实施例提供的客户访问量预测装置的结构示意图。

图7是本发明一实施例提供的部分客户访问量预测装置的结构示意图。

图8是本发明一实施例提供的电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

本发明实施例提供的客户访问量预测方法的执行主体包括但不限于计算机。

图1是本发明一实施例提供的客户访问量预测方法的流程示意图，如图1所示，本发明实施例提供的客户访问量预测方法，包括：

S101、根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；

本步骤，每个网点的历史客户访问信息中可以包括该网点过去每天的客户访问量；所述待预测的时间范围是指未来的某一段时间范围，所述第一历史时间范围是指过去的某一段时间范围，所述第一历史时间范围可以与所述待预测的时间范围相邻；所述待预测的时间范围可以为未来一个周、1个月、3个月或半年等，所述第一历史时间范围可以为过去的1个月、3个月、半年或一年等。举例而言，所述待预测的时间范围为未来一个月，所述第一历史时间范围为过去3个月，则步骤S101具体可以包括：根据每个网点的历史客户访问信息，构建未来1个月内每天每个网点的历史访问特征、以及过去的3个月内每天每个网点的全量访问特征。

每天每个网点的历史访问特征是根据所述网点在该天之前的历史客户访问信息确定的。例如，每天每个网点的历史访问特征中包括该天所在月份之前的一个月和/或6个月与该天所在日期相对应的日期的客户访问量。

S102、将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。

本步骤，所述客户访问量模型可以是包含自回归和卷积注意力机制的seq2seq时序模型(用序列预测序列的深度学习模型)，利用过去一段时间每天每个网点的全量访问特征以及未来一段时间每天每个网点的历史访问特征，预测该未来一段时间每天每个网点的客户访问量。

本发明实施例提供的客户访问量预测方法，根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。这样，能够通过预先训练好的客户访问量预测模型同时拟合不同网点的时序信息，批量预测各个网点未来一段时间每天的客户访问量，不需要对每个网点单独建立各自的模型。

本实施例，每天每个网点的时滞性特征是指该网点在该天所在的日期的历史相应日期的客户访问量，例如网点1在2022年2月23日的时滞性特征可以包括：该网点在2022年1月23日的客户访问量(该日期前一个月的历史相应日期的客户访问量)、该网点在2021年11月23日的客户访问量(该日期前三个月的历史相应日期的客户访问量)、和/或该网点在2021年8月23日的客户访问量(该日期前六个月的历史相应日期的客户访问量)。

每天每个网点的自相关系数特征是根据该网点在该天前的一段时间内每天的客户访问量计算得到的，例如每天每个网点的自相关系数特征包括月度自相关系数、季度自相关系数(ACF)以及年度自相关系数，其中每天每个网点的月度自相关系数根据该网点距离该天最近的一个月内每天的客户访问量计算得到的，每天每个网点的季度自相关系数根据该网点距离该天最近的一个季度内每天的客户访问量计算得到的。

每天每个网点的中位数特征是指该网点在该天前的一段时间内每天的客户访问量中的中位数，例如取每个网点最近半年内每天的客户访问量，然后排序取中位数。

每天每个网点的周期性特征可以包括星期特征和/或节假日特征，每天每个网点的星期特征指该天具体是周几，节假日特征是指该天是否为节假日。

每天每个网点的历史访问特征中包括该网点在该天的时滞性特征、自相关系数特征、中位数特征以及周期性特征；所述网点每天的全量访问特征中包括该网点在该天的客户访问量、时滞性特征、自相关系数特征、中位数特征以及周期性特征。

可选的，在上述实施例中，所述待预测的时间范围内所述网点每天的历史访问特征中还包括所述网点的属性特征；

本实施例，所述网点的属性特征可以包括网点所在的地区、所属的上级机构等；对于银行网点来说，所述网点的属性特征可以包括网点所在的地区、所属的分行等。将网点的属性特征也作为模型的输入，可以使得网点的属性信息作为模型深度学习过程中的一重要考量因素。

如图2所示，可选的，在上述任一实施例中，所述将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量包括：

S1021、根据待预测的时间范围内每天每个网点的历史访问特征，按照日期构建m个历史特征向量，其中，m等于待预测的时间范围的时间长度，在每一个所述历史特征向量中，包括待预测的时间范围内的其中一天各所述网点在该天的历史访问特征；

本步骤，所述待预测的时间范围的时间长度是按照天计算的，也即所述待预测的时间范围包括m天。待预测的时间范围内的第一天所对应的历史特征向量中包括每个网点在该第一天的历史访问特征，待预测的时间范围内的第二天所对应的历史特征向量中包括每个网点在该第二天的历史访问特征，以此类推。

S1022、将所述m个历史特征向量按照日期升序进行排序，得到历史特征向量序列；

本步骤，举例而言，所述待预测的时间范围为未来5天，则步骤S1021构建了5个历史特征向量，则按照日期升序对该5个历史特征向量进行排序后，得到的历史特征向量序列为：未来第一天的历史特征向量、未来第二天的历史特征向量、未来第三天的历史特征向量、未来第四天的历史特征向量、未来第五天的历史特征向量。

S1023、根据第一历史时间范围内每天每个网点的全量访问特征，按照日期构建n个全量特征向量，其中，n等于第一历史时间范围的时间长度，在每一个所述全量特征向量中，包括第一历史时间范围内的其中一天各所述网点在该天的全量访问特征；

本步骤，n个全量特征向量的构建原理与上述步骤S1021中各历史特征向量的构建原理相同，在此不再赘述。

S1024、将所述n个全量特征向量按照日期升序进行排序，得到全量特征向量序列；

本步骤，n个全量特征向量的排序方法与上述步骤S1022中类似，在此不再赘述。

S1025、将所述历史特征向量序列以及所述全量特征向量序列分别输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。

本步骤，所述客户访问量预测模型可以是对seq2seq时序模型训练后得到的，用于根据全量特征向量序列预测历史特征向量序列。

可以理解的是，本发明对上述步骤S1021、S1023之间的执行顺序不做限定，步骤S1022在步骤S1021之后执行、步骤S1024在步骤S1023之后执行、步骤S1025在步骤S1022和步骤S1024之后执行即可。

如图3所示，可选的，在上述步骤S102之前，所述方法还包括：

S103、获取训练集中第二历史时间范围内每天每个网点的历史访问特征和客户访问量、以及所述第二历史时间范围之前的第三历史时间范围内每天每个网点的全量访问特征，其中，所述第二历史时间范围的时间长度与所述待预测的时间范围的时间长度相等，所述第三历史时间范围的时间长度与所述第一历史时间范围的时间长度相等；

本步骤，所述训练集中每天每个网点的历史访问特征以及客户访问量用作模型训练的样本使用，所述训练集中的样本数据的时间跨度应远大于所述第二历史时间范围与所述第三历史时间范围之和，以提供足够的训练样本数据。所述第三历史时间范围可以与所述第二时间范围相邻，例如在所述第二时间范围为2021年5月时，所述第三时间范围为2021年2月至4月。所述历史访问特征以及所述客户访问量可以是从所述全量访问特征中提取出来的。

所述训练集中每天每个网点的历史访问特征、全量访问特征以及客户访问量是预先根据每个网点的历史客户访问信息确定的，根据每个网点的历史客户访问信息确定每天每个网点的历史访问特征、全量访问特征以及客户访问量的方法具体可参见上述实施例的记载。

S104、以所述第二历史时间范围内每天每个网点的历史访问特征以及所述第三历史时间范围内每天每个网点的全量访问特征作为输入，以所述第二历史时间范围内每天每个网点的客户访问量作为标签，对预先建立的用序列预测序列的深度学习模型进行训练，得到训练好的客户访问量预测模型。

本步骤，所述用序列预测序列的深度学习模型为包含自回归和卷积注意力机制的seq2seq时序模型；应当理解的是，对所述模型的训练过程中，需多次获取所述训练集中的样本数据对预先建立的用序列预测序列的深度学习模型进行训练，在每次获取样本数据时，需重新定义所述第二历史时间范围，以使每次获取的第二历史时间范围之间的时间窗口不完全重合，确保每次训练时使用不同的样本数据对模型进行训练。

具体的，在将所述第二历史时间范围内每天每个网点的历史访问特征以及所述第三历史时间范围内每天每个网点的全量访问特征输入seq2seq时序模型之前，可首先按照上述实施例中构建历史特征向量序列以及构建全量特征向量序列的方法，根据第二历史时间范围内每天每个网点的历史访问特征，构建m个历史特征向量，并按照日期排序，形成历史特征向量序列，根据第三历史时间范围内每天每个网点的全量访问特征，构建n个全量特征向量，并按照日期排序，形成全量特征向量序列，然后再将该两个序列分别输入所述seq2seq时序模型。

本实施例，所述用序列预测序列的深度学习模型是一个包含自回归和卷积注意力机制的seq2seq时序模型。如图4所示，模型分为encoder部分(编码模块)和decoder部分(解码模块)，可以分别为两个GRU时序模型(也可以为LSTM，RNN等时序神经网络模型)，encoder部分负责接收第三历史时间范围内每天每个网点的全量访问特征，然后输出隐含特征向量序列。

在decoder阶段发明了对隐含特征向量序列(h_state)的注意力机制：根据隐含特征向量序列确定attention_state的第一个状态向量a₁。将这个attention_state的第一个状态向量a₁、所述第三历史时间范围内的最后一天每个网点的客户访问量向量和所述第二历史时间范围内的第一天每个网点的历史访问特征所组成的历史特征向量f₁ ^y拼接在一起作为decoder的第一个输入，将第三历史时间范围内的最后一天的所对应的隐含特征向量

作为decoder的另一个输入，输出第二历史时间范围内每天每个网点的客户访问量预测值所组成的向量y′₁′和decoder的第一个隐含特征向量

接着根据encoder模块输出的隐含特征向量序列以及decoder的第一个隐含特征向量

确定attention_state的第二个状态向量a₂，将这个attention_state的第二个状态向量a₂、y′₁′以及所述第二历史时间范围内的第二天每个网点的历史访问特征所组成的历史特征向量

拼接在一起作为decoder的第二个输入，将decoder的第一个隐含特征向量

作为decoder的另一个输入，输出第二历史时间范围内的第二天每个网点的客户访问量预测值所组成的向量y′₂和decoder的第二个隐含特征向量

以此类推，递归逐步输出第二历史时间范围内每天每个网点的客户访问量预测值所组成的向量y′₁′,y′₂...y′_m。

可选的，在上述实施例中，所述编码模块根据以下隐含特征向量计算公式计算每个隐含特征向量：

式中，

表示编码模块输出的第t个的隐含特征向量；

表示编码模块输出的第t-1个的隐含特征向量，其中，

本实施例，encoder表示编码模块所使用的编码函数，根据所采用的模型确定；所述第三历史时间范围的时间长度是以天为单位计算的。

式中，

a₁＝α₁h^x；

W₁、W₂、W₃分别为参数矩阵；

a_k＝α₂h^x；

m为第二历史时间范围的时间长度；

h^x为编码模块输出的n个隐含特征向量所组成的向量。

本实施例，

为解码模块计算得到的第一个隐含特征向量；

为解码模块计算得到的第k个隐含特征向量；所述第二历史时间范围的时间长度是以天为单位计算的；h^x为编码模块输出的n个隐含特征向量拼接后所形成的n维向量。

是一个1行d维的向量，h^xW₂是一个n行d维的矩阵，两者在相加时

会被重复n次然后拼成一个n行d维的矩阵与h^xW₂相加，相加结果为n行d维。decoder表示解码模块所使用的解码函数，根据所采用的模型确定。

可选的，在上述实施例中，所述用序列预测序列的深度学习模型还包括偏离度计算模块，所述偏离度计算模块用于：

本实施例，可按照以下损失函数计算所述偏离度：

式中，

y表示每天各网点的实际客户访问量序列；

y′表示解码模块输出的每天各网点的客户访问量预测值序列；

loss表示各网点的客户访问量预测值与各网点的实际客户访问量之间的偏离度。

在所述偏离度大于预设阈值时，可调整上述客户访问量计算公式中的参数矩阵W₁、W₂、W₃，直至所述解码模块输出的所述第二历史时间范围内每天每个网点的客户访问量预测值与所述第二历史时间范围内每天每个网点的客户访问量之间的偏离度小于预设阈值，以完成模型训练。

为更好的理解本发明，下面通过一具体实施例对本发明提供的客户访问量预测方法进行说明。

第1步：进行特征工程构造。

本步骤，构造每个网点的时滞性特征，如过去1个月、3个月、6个月、1年前的客户访问量；构造每个网点的自相关系数特征，如月度、季度、年度的ACF(自相关系数)；构造每个网点的中位数特征，如取每个网点最近半年的客户访问量，然后排序取中位数；构造网点的属性特征，如所在地区，所属分行等；加入周期性特征，如星期特征，是否是节假日特征等。形成如图5所示的二维表数据。

第2步：将二维表数据按网点号、日期升序排序，重置(reshape)为三维张量结构(id，sequence，features)，第一个维度表示网点编号，第二个维度是时序长度(按天计算)，第三个维度表示每天每个网点的各类特征。然后对目标变量(每天客户量)做log1p处理，对数值型特征(如时滞性特征、自相关系数等)做标准化处理，对分类型特征(如所在地区，所属分行等)做整数型编号处理(为在模型中进行embeding处理做准备)。然后将构建的三维张量按时间轴，拆成两个序列X、Y，X表示历史时序特征数据(三个月的时序长度用n表示)，Y表示要预测的序列(一个月的时序长度用m表示)。

第3步：构建一个包含自回归和卷积注意力机制的seq2seq时序模型(参见图4)。用X序列去预测Y序列。模型分为encoder部分和decoder部分，分别为两个GRU时序模型。encoder部分负责接收X序列的特征，然后输出隐含特征向量序列h_state:

从1到n：

的长度和X序列的长度一样，各参量的定义可参见上述实施例。在decoder阶段发明了对h_state的注意力机制：

t从1到m：

a₁＝α₁h^x；

最后将这个attention_state的第一个状态向量a₁、前一步的客户访问量序列x_n(也就是X序列中的最后一个向量中的客户访问量所组成的序列(或者称为向量))和Y序列的第一个历史特征向量f₁ ^y拼接在一起作为decoder的第一个输入，将h_state的最后一步隐含向量

作为decoder的另一个输入。输出Y序列的第一个客户访问量预测值序列y′₁′和decoder的第一个隐含向量

即

接着按如下递归逐步输出Y序列的预测值y′₂,y₃′...y′_m。

k从2到m：

a_k＝α₂h^x；

第4步：用本发明构造的如下的损失函数进行模型训练。

其中y′表示S203输出的预测值序列，y表示真实值序列。

第5步：待模型训练充分后,按第1到第2步将新的数据转换为模型输入的格式，进行网点客户访问量序列预测，输出未来一个月的客户访问量预测值序列。

本实例中各参数的定义参见上述各实施例的记载，本实例使用Pytorch实现了上述模型，对某银行2021年5月各网点ATM机客户访问量的准确率达到96％。此外，该模型也同样可以适用于其他时间序列预测类场景。

本发明也可以使用其他深度学习平台实现如TensorFlow、paddlepaddle、mxnet等。所用GRU时序神经网络模型也可替换为其他如LSTM、RNN等时序神经网络模型。

图6是本发明一实施例提供的客户访问量预测装置的结构示意图，如图6所示，本发明实施例提供的客户访问量预测装置包括：

构建模块21，用于根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；

输入模块22，用于将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。

本发明实施例提供的客户访问量预测装置，根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征，其中，每天每个网点的全量访问特征中包括所述网点在该天的客户访问量以及历史访问特征；将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量。这样，能够通过预先训练好的客户访问量预测模型同时拟合不同网点的时序信息，批量预测各个网点未来一段时间每天的客户访问量，不需要对每个网点单独建立各自的模型。

可选的，所述构建模块具体用于：

可选的，所述输入模块具体用于：

如图7所示，可选的，所述装置还包括：

获取模块23，用于获取训练集中第二历史时间范围内每天每个网点的历史访问特征和客户访问量、以及所述第二历史时间范围之前的第三历史时间范围内每天每个网点的全量访问特征，其中，所述第二历史时间范围的时间长度与所述待预测的时间范围的时间长度相等，所述第三历史时间范围的时间长度与所述第一历史时间范围的时间长度相等；

训练模块24，用于以所述第二历史时间范围内每天每个网点的历史访问特征以及所述第三历史时间范围内每天每个网点的全量访问特征作为输入，以所述第二历史时间范围内每天每个网点的客户访问量作为标签，对预先建立的用序列预测序列的深度学习模型进行训练，得到训练好的客户访问量预测模型。

式中，

表示编码模块输出的第t个的隐含特征向量；

表示编码模块输出的第t-1个的隐含特征向量，其中，

式中，

a₁＝α₁h^x；

W₁、W₂、W₃分别为参数矩阵；

a_k＝α₂h^x；

m为第二历史时间范围的时间长度；

h^x为编码模块输出的n个隐含特征向量所组成的向量。

本发明实施例提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程，其功能在此不再赘述，可以参照上述方法实施例的详细描述。

需要说明的是，本发明实施例提供的客户访问量预测方法及装置可用于金融领域，也可用于除金融领域之外的任意技术领域，本发明实施例对客户访问量预测方法及装置的应用领域不做限定。

图8为本发明一实施例提供的电子设备的实体结构示意图，如图8所示，该电子设备可以包括：处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令，以执行上述任一实施例所述的方法。

此外，上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法。

本实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储计算机程序，所述计算机程序使所述计算机执行上述各方法实施例所提供的方法。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在本说明书的描述中，参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种客户访问量预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据每个网点的历史客户访问信息，构建待预测的时间范围内每天每个网点的历史访问特征、以及所述待预测的时间范围之前的第一历史时间范围内每天每个网点的全量访问特征包括：

3.根据权利要求2所述的方法，其特征在于，所述待预测的时间范围内所述网点每天的历史访问特征中还包括所述网点的属性特征；

4.根据权利要求1至3任一项所述的方法，其特征在于，所述将待预测的时间范围内每天每个网点的历史访问特征、以及所述第一历史时间范围内每天每个网点的全量访问特征输入预先训练好的客户访问量预测模型，得到所述客户访问量预测模型输出的所述待预测的时间范围内每天每个网点的客户访问量包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述用序列预测序列的深度学习模型包括编码模块和解码模块；其中，

7.根据权利要求6所述的方法，其特征在于，所述用序列预测序列的深度学习模型还包括偏离度计算模块，所述偏离度计算模块用于：

8.一种客户访问量预测装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。