CN110400022B

CN110400022B - 自助柜员机现金用量预测方法及装置

Info

Publication number: CN110400022B
Application number: CN201910700363.9A
Authority: CN
Inventors: 杜姗; 蔡为彬; 王亚新; 罗樋
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2019-07-31
Filing date: 2019-07-31
Publication date: 2022-03-04
Anticipated expiration: 2039-07-31
Also published as: CN110400022A

Abstract

本发明提供了一种自助柜员机现金用量预测方法及装置，自助柜员机现金用量预测方法包括：获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据；根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量。本发明提了一种有效提升自助柜员机现金用量管理的精准度和工作效率的现金用量预测方法。

Description

自助柜员机现金用量预测方法及装置

技术领域

本发明涉及人工智能领域技术领域，具体涉及金融行业的大数据分析领域，特别是涉及一种自助柜员机现金用量预测方法及装置。

背景技术

自助柜员机是指ATM、CRM、CDM等自助柜员机用于为客户提供自助存取现金的设备。自助柜员机需根据业务量及其相关管理要求，估算每台设备存放现金额度，为所辖设备制定现金加钞计划，进行备钞和现金调拨。传统自助柜员机现金管理，通常依靠业务专家人工经验为主来估算加钞金额。由于现金需求量影响因素较多且关联复杂性极高，受摆放地点、周边事件、客流量、节假日、天气等多种因素干扰，人工经验判断现金量较困难且误差大，如果加钞高于实际的取款需求，即加钞金额多于实际取款金额，将导致非生息资产过多，造成资金浪费。而且加钞次数的增加也会导致成本的增加。

综上，现有的商业自助柜员机自助柜员机的现金用量预测方法有着对业务经验要求高、人工预估方法复杂及总体预测结果偏差大等缺点。

发明内容

针对现有技术中的问题，本发明提供了一种可以克服现有自助柜员机业务人员制定自助柜员机现金调拨流程中，估计现金用量环节对业务经验要求较高、人工预估方法复杂、预估偏差较大等问题的方法。

为解决上述技术问题，本发明提供以下技术方案：

第一方面，本发明提供一种自助柜员机现金用量预测方法，包括：

获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据；

根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量。

优选地，自助柜员机现金用量预测方法还包括：获取所述自助柜员机的历史清机周期内的交易数据、地理位置及历史清机周期内的天气数据；根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型；

所述机器学习算法包括：支持向量机回归算法、K近邻回归算法、随机森林回归算法、GBDT回归算法、Xgboost回归算法及长短期记忆网络算法。

优选地，自助柜员机现金用量预测方法还包括：对所述历史清机周期内的交易数据、所述当前清机周期内的交易数据、所述地理位置、所述历史清机周期内的天气数据及所述当前清机周期内的天气数据进行数据清洗、数据集成、数据归约及数据变换。

优选地，所述根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型，包括：

根据所述历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据生成初始现金用量预测模型；

利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型；

利用均方根误差方法对所述训练之后多个的初始现金用量预测模型进行评价，根据评价结果选取多个初始现金用量预测模型作为现金用量预测模型。

优选地，当所述评价结果为差时，重新利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型。

优选地，所述根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，包括：

根据所述历史清机周期内的交易数据、地理位置及所述历史清机周期内的天气数据生成每个现金用量预测模型对应的历史现金用量的预测结果；

根据所述历史清机周期内的现金用量的预测结果及自助柜员机的历史清机周期内的现金实际用量生成所述每个现金用量预测模型的权重向量；

根据所述当前清机周期内的的交易数据、所述地理位置、所述目标清机周期内的的天气预报数据、多个现金用量预测模型及每个现金用量预测模型所对应的权重向量，预测自助柜员机目标清机周期内的现金用量。

第二方面，本发明提供一种自助柜员机现金用量预测装置，该装置包括：

当天数据获取单元，用于获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据；

现金用量预测单元，用于根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量。

优选地，自助柜员机现金用量预测装置还包括：

历史数据获取单元，用于获取所述自助柜员机的历史清机周期内的交易数据、地理位置及历史清机周期内的天气数据；

模型生成单元，用于根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型；

优选地，自助柜员机现金用量预测装置还包括：预处理装置，用于对所述历史清机周期内的交易数据、所述当前清机周期内的交易数据、所述地理位置、所述历史清机周期内的天气数据及所述当前清机周期内的天气数据进行数据清洗、数据集成、数据归约及数据变换。

优选地，所述模型生成单元包括：

初始模型生成模块，用于根据所述历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据生成初始现金用量预测模型；

模型训练模块，用于利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型；

模型评价模块，用于利用均方根误差方法对所述训练之后多个的初始现金用量预测模型进行评价，根据评价结果选取多个初始现金用量预测模型作为现金用量预测模型。

优选地，所述模型生成单元还包括：

模型再训练模块，用于当所述评价结果为差时，重新利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型。

优选地，所述现金用量预测单元包括：

预测结果生成模块，用于根据所述历史清机周期内的交易数据、地理位置及所述历史清机周期内的天气数据生成每个现金用量预测模型对应的历史现金用量的预测结果；

权重生成模块，用于根据所述历史清机周期内的现金用量的预测结果及自助柜员机的历史清机周期内的现金实际用量生成所述每个现金用量预测模型的权重向量；

现金用量预测模块，用于根据所述当前清机周期内的的交易数据、所述地理位置、所述目标清机周期内的的天气预报数据、多个现金用量预测模型及每个现金用量预测模型所对应的权重向量，预测自助柜员机目标清机周期内的现金用量。

第三方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现自助柜员机现金用量预测方法的步骤。

第四方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现自助柜员机现金用量预测方法的步骤。

从上述描述可知，本发明提供的自助柜员机现金用量预测方法及装置，通过获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据，并根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，另外，动态的检查现金用量预测模型的准确性，相应的动态的训练现金用量预测模型，以最大程度上保证自助柜员机现金用量预测的准确性。对自助柜员机历史现金用量、自助柜员机业务特性、外部环境因素等数据进行加工处理和模型训练，为自助柜员机申请现金调拨和现金中心制定人行现金调缴计划等工作，实现精准预测自助柜员未来现金使用量，有效提升银行自助柜员机现金加钞的精准度和工作效率，从而降低银行库存现金总量和运维成本，提升自助柜员机现金服务保障率。具体地，本方法具有以下优点：

(1)基于业务特性的模型特征选择：基于业务经验、业务特性分析及数据特征分析，提取有效反映自助柜员机业务特性的特征数据集，并从中动态选择每台设备的特征子集，使预测效果最优。

(2)基于动态计算的多模型加权组合：基于动态权重向量计算，实现多种算法模型预测结果的动态选择和加权组合，使得具有不同业务特性的设备使用最优的预测算法组合进行最终预测，从而使每台设备的模型预测稳定性、精准度和泛化能力最优。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的实施例中自助柜员机现金用量预测方法流程示意图一；

图2为本发明的实施例中自助柜员机现金用量预测方法流程示意图二；

图3为本发明的实施例中自助柜员机现金用量预测方法步骤500的流程示意图；

图4为本发明的实施例中自助柜员机现金用量预测方法步骤200的流程示意图；

图5为本发明的实施例中自助柜员机现金用量预测方法流程示意图三；

图6为本发明的具体应用实例中自助柜员机现金用量预测方法的流程示意图；

图7为本发明的具体应用实例中自助柜员机现金用量预测方法中特征数据组成示意图；

图8为本发明的具体应用实例中自助柜员机现金用量预测装置的结构示意图一；

图9为本发明的具体应用实例中自助柜员机现金用量预测装置的结构示意图二；

图10为本发明的实施例中的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

鉴于现有技术中存在提升当前验证码系统的安全性和易用性的相关需求，本发明的实施例提供一种自助柜员机现金用量预测方法的具体实施方式，参见图1该方法10具体包括如下内容：

步骤100：获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据。

步骤100中的交易数据包括自助柜员机的流水数据、以及相邻分行的发薪日、还款日。

步骤200：根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量。

在建立好现金用量预测模型的基础上，通过自助柜员机当天的交易数据、所述地理位置、目标日期的天气预报数据及法定假日预测自助柜员机目标清机周期内的现金用量。

从上述描述可知，本发明提供的自助柜员机现金用量预测方法，通过获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据，并根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，另外，动态的检查现金用量预测模型的准确性，相应的动态的训练现金用量预测模型，以最大程度上保证自助柜员机现金用量预测的准确性。对自助柜员机历史现金用量、自助柜员机业务特性、外部环境因素等数据进行加工处理和模型训练，为自助柜员机申请现金调拨和现金中心制定人行现金调缴计划等工作，实现精准预测自助柜员未来现金使用量，有效提升银行自助柜员机现金加钞的精准度和工作效率，从而降低银行库存现金总量和运维成本，提升自助柜员机现金服务保障率。

参见图2，自助柜员机现金用量预测方法还包括：

步骤400：获取所述自助柜员机的历史清机周期内的交易数据、地理位置及历史清机周期内的天气数据。

可以理解的是，历史清机周期为除当前清机周期外的已经发生了的清机周期。

步骤500：根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型。

可以理解的是，步骤400中的机器学习算法包括但不限于：支持向量机(SupportVector Machine，SVM)回归算法、K近邻(K-Nearest Neighbor，KNN)回归算法、随机森林(RandomForest)回归算法、GBDT(Gradient Boosting Decision Tree)回归算法、xgboost回归算法、长短期记忆网络(Long Short-Term Memory，LSTM)算法。

参见图3，一实施例中，步骤500包括：

步骤501：根据所述历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据生成初始现金用量预测模型。

具体地，从历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据中挖掘出特征数据。接着，从生成的特征数据中动态的选择出能够比较好的拟合自助柜员机(一个或者多个)用钞周期现金用量变化规律的数据，但同时也需要兼顾系统的效率。

步骤502：利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型。

优选地，将特征数据处理成不同机器学习算法要求的数据结构之后，采用超参数自动调优的方式对机器学习算法进行在线训练模型，以得到预测效果较好的多个模型，即初始现金用量预测模型。

步骤503：利用均方根误差方法对所述训练之后多个的初始现金用量预测模型进行评价，根据评价结果选取多个初始现金用量预测模型作为现金用量预测模型。

均方根误差是预测值与真实值偏差的平方与观测次数n比值的平方根，在实际测量中，观测次数n总是有限的，真值只能用最可信赖(最佳)值来代替。标准误差能够很好地反映出测量的精密度。利用均方根误差方法方法对初始现金用量预测模型效果进行评估，并在特定自助柜员机上挑选出预测效果较好的多个现金用量预测模型。

可以理解的是，当自助柜员机在某个清机周期内的模型预测效果比较差时。步骤500还包括：

步骤504：当所述评价结果为差时，重新利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型。

随着时间的增加，商圈、消费人员组成等等均可能会发生变化，则多个初始现金用量预测模型对自助柜员机现金用量的预测结果可能会发生不准的情况(本申请中将预测结果与实际结果相差为30％以上时，定义为评价结果为差)，所以需要对初始现金用量预测模重新进行训练，以保证预测的准确性。

参见图4，一实施例中，步骤200包括：

步骤201：根据所述历史清机周期内的交易数据、地理位置及所述历史清机周期内的天气数据生成每个现金用量预测模型对应的历史现金用量的预测结果。

步骤202：根据所述历史清机周期内的现金用量的预测结果及自助柜员机的历史清机周期内的现金实际用量生成所述每个现金用量预测模型的权重向量。

在步骤201及步骤202中，使用均方根误差方法方法对每个权重向量下的历史加权平均预测结果进行评价，均方根误差取值最小的即为所求最优权重向量。

步骤203：根据所述当前清机周期内的的交易数据、所述地理位置、所述目标清机周期内的的天气预报数据、多个现金用量预测模型及每个现金用量预测模型所对应的权重向量，预测自助柜员机目标清机周期内的现金用量。

优选地，对每个自助柜员机不同用钞周期的模型预测效果进行评价和反馈，当某自助柜员机一个用钞周期的模型预测效果比较差时，需要重新对该自助柜员机的现金用量预测模型重新进行训练。

参见图5，一实施例中，自助柜员机现金用量预测方法还包括：

步骤600：对所述历史清机周期内的交易数据、所述当前清机周期内的交易数据、所述地理位置、所述历史清机周期内的天气数据及所述当前清机周期内的天气数据进行预处理。

具体地，对所述历史清机周期内的交易数据、所述当前清机周期内的交易数据、所述地理位置、所述历史清机周期内的天气数据及所述当前清机周期内的天气数据进行数据清洗、数据集成、数据归约及数据变换。

通过填充缺失值、光滑噪声和识别离群点等方式，纠正数据中的不一致。在填充缺失值时，采取均值、中位数来填充；在处理噪声数据和离群点时，首先通过箱线图的上下边缘来确定噪声数据，通过聚类算法来检测离群点，然后结合具体业务经验来标注噪声数据和离群点，最后通过计算平均值来对噪声数据和离群点进行修复。另外，由于系统获取的数据来源多样，存在代表同一概念的属性在不同数据源中可能会有不同的名字或单位，会导致不一致性和冗余，故采用相关性分析的方法对数据进行集成。

从上述描述可知，本发明提供的自助柜员机现金用量预测方法，通过获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据，并根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，另外，动态的检查现金用量预测模型的准确性，相应的动态的训练现金用量预测模型，以最大程度上保证自助柜员机现金用量预测的准确性。对自助柜员机历史现金用量、自助柜员机业务特性、外部环境因素等数据进行加工处理和模型训练，为自助柜员机申请现金调拨和现金中心制定人行现金调缴计划等工作，实现精准预测自助柜员未来现金使用量，有效提升银行自助柜员机现金加钞的精准度和工作效率，从而降低银行库存现金总量和运维成本，提升自助柜员机现金服务保障率。具体地，本方法具有以下优点：

为进一步地说明本方案，本发明提供自助柜员机现金用量预测方法的具体应用实例，该具体应用实例具体包括如下内容20，参见图6。

S0：获取历史数据。

通过行内系统获取自助柜员机最近3年的现金业务历史记录、每日增量流水记录。通过行内系统或者网上爬虫获取与自助柜员机相关的特色数据，主要包括：国家法定节假日数据、自助柜员机地理位置数据、自助柜员机所在地区天气信息(包括风力等级、温度、下雨级别等)、每个自助柜员机相邻分行设置的发薪日和还款日数据等等。

S1：对历史数据进行预处理。

对自助柜员机历史流水数据和特色数据进行评估，数据质量很差的自助柜员机不再进行后续步骤。通过填充缺失值、光滑噪声和识别离群点等方式，纠正数据中的不一致。在填充缺失值时，采取均值、中位数来填充；在处理噪声数据和离群点时，首先通过箱线图的上下边缘来确定噪声数据，通过聚类算法来检测离群点，结合具体业务经验来标注噪声数据和离群点，最后通过一定的规则来计算平均值对噪声数据和离群点进行修复。

对数据进行集成。由于系统获取的数据来源多样，存在代表同一概念的属性在不同数据源中可能会有不同的名字或单位，会导致不一致性和冗余，在本具体应用实例中采用相关性分析的方法对数据进行集成。

对数据进行归约，通过归约技术得到数据的简化表示，简化后的数据占用空间会变小，但是能产生近乎相同的分析结果，可以提高整个系统的效率。

对数据进行变换，通过数据变换使得数据更适用于系统进行数据挖掘。比如对地理位置信息的变换，将地理位置信息进行分类，同一类别使用同一个数字表示，这样文本数据就变换成为离散的数值数据。

至此，已经完成了对自助柜员机的数据预处理，基本得到了具备准确性、完整性、一致性、适用于数据挖掘的高质量特征数据，对数据进行统计、环比、同比等数学意义上的特征组合，来扩展特征维度，并将特征数据分为三类：公共属性特征、特色属性特征及衍生数据特征。参见图7。

对每个自助柜员机每个清机周期的特征数据进行转化和动态选择，挑选出让该自助柜员机预测效果较好的特征子集，所以不同自助柜员机、不同清机周期所对应的特征子集均有可能是不同的。特征子集动态选择具体实现：第一，对每个自助柜员机、每个清机周期的所有特征进行数据探索性分析，确定特征的转化方式。

(1)针对离散型特征，绘制特征的条形图看落在不同特征取值上的样本个数，如果条形图分布呈现某些特征取值图形分布类似的特点，可以考虑对该特征进行聚桶等操作。绘制箱线图来查看不同特征取值对应的标签取值分布状况，离群点和异常值一般分布在箱线图上边缘上方和箱线图下边缘下方，需要修复离群点和异常值，针对第T天标签的修复规则为：0.5(T-1到T-7天的平均值)+0.3(T-1到T-30天的平均值)+0.2(去年同期取值)。

(2)针对连续型特征，绘制直方图来判断是否需要对连续特征进行离散化以及确定离散的方法，直方图也可以判断连续特征是否呈现长尾分布，如果呈现长尾分布，可以考虑是否对连续特征取log后做等距离散。第二，对进行探索性分析后的特征进行重要性分析，挑选出使得预测效果较好的特征子集。通过计算连续特征的pearson相关系数来衡量特征的重要性，以及通过GBDT算法来对特征的重要性进行排序。综合两种方法的特征排序，把特征按照最重要到最不重要的顺序依次添加到特征子集中，然后把该特征子集用于模型去拟合现金预测场景，如果拟合效果提升，则将特征留在特征子集中，如果拟合效果比不加入该特征时的效果好，则将特征剔除特征子集，直至验证完毕所有特征。

另外，还需要对自助柜员机进行分类及将业务人员的经验数据化，具体的：通过分析预处理后的自助柜员机历史流水数据在折线图、散点图、直方图等图的分布特点，对自助柜员机进行分类，具体的，先从整体上将自助柜员机分为三类：平衡型、支出型、收入型，然后分析自助柜员机每日轧差变化幅度，再将上述三类自助柜员机细分为：波动型和稳定型；通过一定规则将业务人员现金业务经验转化为数据。

S2：生成初始现金用量预测模型。

具体地，根据所述历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据生成初始现金用量预测模型。

S3：生成训练之后的多个初始现金用量预测模型。

将除当前清机周期内的特征数据以外的特征数据(即历史数据)分别处理为机器学习算法要求的输入格式，分为训练集和验证集，用于后续训练，其中训练集占特征数据的90％，验证集占特征数据的10％，且训练集和验证集没有重叠。

对候选算法(支持向量机(Support Vector Machine，SVM)回归算法、K近邻(K-Nearest Neighbor，KNN)回归算法、随机森林(RandomForest)回归算法、GBDT(GradientBoosting Decision Tree)回归算法、xgboost回归算法、长短期记忆网络(Long Short-Term Memory，LSTM)算法。)预设的参数取值范围和取值变化步长，来动态寻找使模型预测效果最优的超参数。在训练集上对候选算法训练模型，直到找到预测效果全局最优或者局部最优的模型为止，在训练模型的过程中，要关注是否出现过拟合的情况。候选算法使用的超参数搜索方法为：(1)SVM和KNN回归算法中由于超参数数量较少且部分超参数由于算法限制可以选择的值有限，导致超参数组合比较少，所以选择通过全量搜索超参数范围内的所有的点来确定最优超参数取值组合。以KNN为例，可以进行调参的超参数总共有4个，即n_neighbors、weights、algorithm和leaf_size，系统设定n_neighbors取值范围为[5,15)且步长为1，weights取值为['uniform','distance']，algorithm取值为['auto','ball_tree','kd_tree','brute']，leaf_size取值[1,60]且步长为1，要找到使得KNN预测效果最好的neighbors、weights、algorithm和leaf_size取值，调参时搜索次数总计为10×2×4×60＝4800次。(2)随机森林、GBDT和xgboost回归算法中超参数组合较多，采用全量搜索超参数范围内的所有的点的方式来寻找使得模型效果最优的超参数取值显然是比较消耗资源的，所以选择牺牲部分模型预测效果，通过对超参数范围内的所有的点采样固定数量的参数设置的方式来进行超参数调优，如果设定样本点集足够大，也是可以找到全局最优值的。(3)LSTM算法是神经网络算法，通过反向传播的方式来训练模型。

S4：生成现金用量预测模型。

具体地，使用均方根误差来对模型效果进行评估。均方根误差是预测值和真实值偏差的平方与预测次数n比值的平方根，方根误差对一组预测值中的特大或特小误差反应非常敏感，所以均方误差能够很好地反应出预测的精准度。在验证集上计算所有模型的均方根误差，首先对验证集中的每个样本数据计算其在所有模型上的预测结果，并保存该预测结果；然后，当所有验证集样本的预测结果计算完毕后，根据均方根误差的定义分别求每个模型上的均方根误差，取值越小代表效果越好。

选择出一个自助柜员机一个用钞周期的预测效果最好的若干个模型。如果所有模型均方根误差取值差别不大，则所有模型都作为可用模型；如果模型均方根误差取值相差较大，则对均方根误差取值按照从小到大排序后，选择前4个模型作为可用模型。

S5：生成每个现金用量预测模型的权重向量。

首先，根据所述历史清机周期内的交易数据、地理位置及所述历史清机周期内的天气数据生成每个现金用量预测模型对应的历史现金用量的预测结果。接着，根据所述历史现金用量的预测结果及自助柜员机的历史现金实际用量生成所述每个现金用量预测模型的权重向量。从生成的权重向量集合中挑选出最优的权重向量，使得加权平均后的组合模型在历史特征数据上的预测效果最好。

利用排列组合的思想，根据模型个数动态生成权重向量集合。具体实现方法如下：第一步，给定n和H，n代表模型个数，1/H代表权重变化的粒度，集合M＝{1,1,1,1，...,1}，集合M中一共包含H个1，且假设每个1都是不一样的；第二步，使用插空法将集合M中的1分为n组，由排列组合思想可以得到共种分配方式；第三步，分别把每种分配方式中每组的1加起来，并除以H，即可得到共有个均匀分布的权重向量的集合。举例说明如下：第一步，给定n＝2，H＝3，即模型个数为2，权重变化粒度为1/3；第二步，根据排列思想中的插空法，得到3中分配方式为{{零个1,三个1}，{1个1,两个1}，{两个1,一个1}，{三个1,零个1}}；第三步，先将每种分配方式中的1相加得到{{0,3},{1,2},{2,1},{3,0}}，分别除以H＝3得到的权重向量集合为：{{0,1},{1/3,2/3},{2/3,1/3},{1,0}}。

动态计算出使得选择的模型加权平均效果最好的权重向量。首先，获取选择的模型在数据库中存储的历史预测结果；然后，把每一个权重向量分别对每个模型的历史预测结果进行加权平均；最后，使用均方根误差方法对每个权重向量下的历史加权平均预测结果进行评价，均方根误差取值最小的即为所求最优权重向量。

S6：预测自助柜员机目标清机周期内的现金用量。

具体地，根据所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据、多个现金用量预测模型及每个现金用量预测模型所对应的权重向量，预测自助柜员机目标清机周期内的现金用量。

可以理解的是，当预测结果显示为较差时，在第二天系统流程定时启动时，需要对某网自助柜员机点某个用钞周期进行重新训练。

基于同一发明构思，本申请实施例还提供了自助柜员机现金用量预测装置，可以用于实现上述实施例所描述的方法，如下面的实施例。由于自助柜员机现金用量预测装置解决问题的原理与自助柜员机现金用量预测方法相似，因此自助柜员机现金用量预测装置的实施可以参见自助柜员机现金用量预测方法实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

本发明的实施例提供一种能够实现自助柜员机现金用量预测方法的自助柜员机现金用量预测装置的具体实施方式，参见图8，自助柜员机现金用量预测装置具体包括如下内容：

当前数据获取单元10，用于当天数据获取单元，用于获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据。

现金用量预测单元20，用于根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量。

参见图9，优选地，自助柜员机现金用量预测装置还包括：

历史数据获取单元40，用于获取所述自助柜员机历史清机周期内的交易数据、地理位置及所述历史清机周期内的天气数据；

模型生成单元50，用于根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型。

优选地，所述模型生成单元包括：

优选地，所述现金用量预测单元包括：

从上述描述可知，本发明提供的自助柜员机现金用量预测装置，通过获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据，并根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，另外，动态的检查现金用量预测模型的准确性，相应的动态的训练现金用量预测模型，以最大程度上保证自助柜员机现金用量预测的准确性。对自助柜员机历史现金用量、自助柜员机业务特性、外部环境因素等数据进行加工处理和模型训练，为自助柜员机申请现金调拨和现金中心制定人行现金调缴计划等工作，实现精准预测自助柜员未来现金使用量，有效提升银行自助柜员机现金加钞的精准度和工作效率，从而降低银行库存现金总量和运维成本，提升自助柜员机现金服务保障率。具体地，本方法具有以下优点：

本申请的实施例还提供能够实现上述实施例中的自助柜员机现金用量预测方法中全部步骤的一种电子设备的具体实施方式，参见图10，电子设备具体包括如下内容：

处理器(processor)1201、存储器(memory)1202、通信接口(CommunicationsInterface)1203和总线1204；

其中，处理器1201、存储器1202、通信接口1203通过总线1204完成相互间的通信；通信接口1203用于实现服务器端设备、记录设备以及用户端设备等相关设备之间的信息传输。

处理器1201用于调用存储器1202中的计算机程序，处理器执行计算机程序时实现上述实施例中的自助柜员机现金用量预测方法中的全部步骤，例如，处理器执行计算机程序时实现下述步骤：

步骤100：获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据；

步骤200：根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量；

从上述描述可知，本申请实施例中的电子设备，通过获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据，并根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，另外，动态的检查现金用量预测模型的准确性，相应的动态的训练现金用量预测模型，以最大程度上保证自助柜员机现金用量预测的准确性。对自助柜员机历史现金用量、自助柜员机业务特性、外部环境因素等数据进行加工处理和模型训练，为自助柜员机申请现金调拨和现金中心制定人行现金调缴计划等工作，实现精准预测自助柜员未来现金使用量，有效提升银行自助柜员机现金加钞的精准度和工作效率，从而降低银行库存现金总量和运维成本，提升自助柜员机现金服务保障率。具体地，本方法具有以下优点：

本申请的实施例还提供能够实现上述实施例中的自助柜员机现金用量预测方法中全部步骤的一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的自助柜员机现金用量预测方法的全部步骤，例如，处理器执行计算机程序时实现下述步骤：

从上述描述可知，本申请实施例中的计算机可读存储介质，通过获取所述自助柜员机的当前清机周期内的交易数据、地理位置及所述地理位置的天气预报数据，并根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，另外，动态的检查现金用量预测模型的准确性，相应的动态的训练现金用量预测模型，以最大程度上保证自助柜员机现金用量预测的准确性。对自助柜员机历史现金用量、自助柜员机业务特性、外部环境因素等数据进行加工处理和模型训练，为自助柜员机申请现金调拨和现金中心制定人行现金调缴计划等工作，实现精准预测自助柜员未来现金使用量，有效提升银行自助柜员机现金加钞的精准度和工作效率，从而降低银行库存现金总量和运维成本，提升自助柜员机现金服务保障率。具体地，本方法具有以下优点：

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

虽然本申请提供了如实施例或流程图的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种自助柜员机现金用量预测方法，其特征在于，包括：

根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量；

获取所述自助柜员机的历史清机周期内的交易数据、地理位置及历史清机周期内的天气数据；

根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型；

所述机器学习算法包括：支持向量机回归算法、K近邻回归算法、随机森林回归算法、GBDT回归算法、Xgboost回归算法及长短期记忆网络算法；

所述根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量，包括：

根据所述当前清机周期内的的交易数据、所述地理位置、所述目标清机周期内的的天气预报数据、多个现金用量预测模型及每个现金用量预测模型所对应的权重向量，预测自助柜员机目标清机周期内的现金用量；

所述根据所述历史清机周期内的交易数据、地理位置及所述历史清机周期内的天气数据生成每个现金用量预测模型对应的历史现金用量的预测结果，以及所述根据所述历史清机周期内的现金用量的预测结果及自助柜员机的历史清机周期内的现金实际用量生成所述每个现金用量预测模型的权重向量，包括：

对每个权重向量下的历史加权平均预测结果进行评价，均方根误差取值最小的权重向量为所求最优权重向量。

2.根据权利要求1所述的自助柜员机现金用量预测方法，其特征在于，还包括：对所述历史清机周期内的交易数据、所述当前清机周期内的交易数据、所述地理位置、所述历史清机周期内的天气数据及所述当前清机周期内的天气数据进行数据清洗、数据集成、数据归约及数据变换。

3.根据权利要求1所述的自助柜员机现金用量预测方法，其特征在于，所述根据历史清机周期内的法定假日、所述历史清机周期内的交易数据、所述地理位置及所述历史清机周期内的天气数据，利用机器学习算法生成自助柜员机现金用量预测模型，包括：

4.根据权利要求3所述的自助柜员机现金用量预测方法，其特征在于，还包括：

当所述评价结果为差时，重新利用超参数搜索算法及多个机器学习算法对所述初始现金用量预测模型分别进行训练，以生成训练之后的多个初始现金用量预测模型。

5.一种自助柜员机现金用量预测装置，其特征在于，包括：

现金用量预测单元，用于根据自助柜员机目标清机周期内的法定假日、所述当前清机周期内的交易数据、所述地理位置、所述目标清机周期内的天气预报数据及预设的所述自助柜员机现金用量预测模型，预测所述自助柜员机目标清机周期内的现金用量；

6.根据权利要求5所述的自助柜员机现金用量预测装置，其特征在于，还包括：预处理装置，用于对所述历史清机周期内的交易数据、所述当前清机周期内的交易数据、所述地理位置、所述历史清机周期内的天气数据及所述当前清机周期内的天气数据进行数据清洗、数据集成、数据归约及数据变换。

7.根据权利要求5所述的自助柜员机现金用量预测装置，其特征在于，所述模型生成单元包括：

8.根据权利要求7所述的自助柜员机现金用量预测装置，其特征在于，所述模型生成单元还包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至4任一项所述自助柜员机现金用量预测方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至4任一项所述自助柜员机现金用量预测方法的步骤。