CN112862197B - 网点智能放号方法、装置、设备及存储介质 - Google Patents

网点智能放号方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112862197B
CN112862197B CN202110190652.6A CN202110190652A CN112862197B CN 112862197 B CN112862197 B CN 112862197B CN 202110190652 A CN202110190652 A CN 202110190652A CN 112862197 B CN112862197 B CN 112862197B
Authority
CN
China
Prior art keywords
data
time
number allocation
sharing
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110190652.6A
Other languages
English (en)
Other versions
CN112862197A (zh
Inventor
苑建蕊
孙羽辰
李纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Merchants Bank Co Ltd
Original Assignee
China Merchants Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Merchants Bank Co Ltd filed Critical China Merchants Bank Co Ltd
Priority to CN202110190652.6A priority Critical patent/CN112862197B/zh
Publication of CN112862197A publication Critical patent/CN112862197A/zh
Application granted granted Critical
Publication of CN112862197B publication Critical patent/CN112862197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations

Abstract

本申请公开一种网点智能放号方法、装置、设备及存储介质,方法包括:获取网点在预设时间段内的历史放号数据;将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。本申请旨在解决现有网点未考虑到网点整体忙闲,各个时间段采用平均值的方法放号,从而造成忙时客户等待时间加长,降低客户体验度的问题。

Description

网点智能放号方法、装置、设备及存储介质
技术领域
本申请涉及网点放号领域,尤其涉及一种网点智能放号方法、装置、设备及存储介质。
背景技术
随着互联网金融的发展,客户行为和消费习惯的变化给商业银行传统网点带来了全新的挑战。面临变化的行业和市场环境,银行需要不断创新来应对更高的要求和更严峻的挑战,尤其体现在:业务创新和服务创新方面。其中,提升用户体验一直是网点关注的问题。
目前,大量被动式、标准化、信息型的业务被转移到线上办理,然而,由于业务类型限制,部分复杂的零售业务和对公业务还是需要到线下完成办理。在线上渠道预约放号方面,网点放号方案上存在着以下方面的缺陷:
1、网点柜面资源有限,未考虑到网点整体忙闲,各个时间段采用平均值的方法放号,从而造成忙时客户等待时间加长,降低客户体验度。
2、放号数量与客户实际到访量关系不明确,网点线上预约放号数量主要根据主管经验进行预估,无理论数据支撑。
上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
发明内容
本申请实施例通过提供一种网点智能放号方法、装置、设备及存储介质,本申请旨在解决现有网点未考虑到网点整体忙闲,各个时间段采用平均值的方法放号,从而造成忙时客户等待时间加长,降低客户体验度的问题,以及放号数量与客户实际到访量关系不明确,网点线上预约放号数量主要根据主管经验进行预估,无理论数据支撑。
本申请实施例提供了一种网点智能放号方法,包括:
获取网点在预设时间段内的历史放号数据;
将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。
在一些实施例中,所述历史放号数据至少包括放号时间、业务类型、每小时到访量、日到访量以及工作日类型。
在一些实施例中,所述获取网点在预设时间段内的历史放号数据的步骤之后,还包括:
对所述历史放号数据进行预处理。
在一些实施例中,对所述历史放号数据进行预处理包括:
排除所述历史放号数据中的重复放号数据、无效放号数据;所述无效放号数据至少包括属于正常工作日中非工作时间的放号数据、属于国家法定节假日或休息日的的放号数据;
对有缺失的历史放号数据,采用回归插补方法对历史放号数据的缺失值进行预估;
将历史放号数据中的业务类型和工作日类型编码成预设数字类型。
在一些实施例中,所述将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据,包括:
采用基函数为db4的离散小波变换将所述历史放号数据分解为稳定集和残差集;
对所述稳定集采用SARIMAX模型进行训练,得到预测数据集;
对所述残差集采用XGBoost模型进行训练,得到残差数据集;
将所述预测数据集与所述残差数据集进行小波重构,得到日到访量预测数据。
在一些实施例中,所述基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数,包括:
基于所述历史放号数据得到网点在预设时间段内的各个时段的平均分时到访量,并计算所述各个时段的平均分时到访量占日到访量的分时到访量比例,分时时段与分时到访量比例组成的第一集合;
将所述第一集合按照分时到访量比例的大小从小到大排序,按照预设规则将所述第一集合中分时到访量比例进行两两逆序交换,得到逆序集合;
基于所述历史放号数据得到网点在预设时间段内的各个业务类型占总体业务类型总数的业务类型比例,业务类型与业务类型比例组成的第二集合;
基于所述逆序集合和所述第二集合构建概率分布函数。
在一些实施例中,所述基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略,包括:
针对各个时段的业务类型,执行以下确定放号数量步骤:
获取伪随机数,所述伪随机数具有的概率分布函数中的分布律;
根据所述伪随机数和所述概率分布函数组装条件判断语句;
设置放号数量初始值,根据所述放号数量初始值组装放号数量计算语句;
根据时段数量和业务类型数量确定循环次数;
按照所述循环次数循环执行组装完成的放号数量计算语句,直至所述条件判断语句不成立。
本申请还提出一种网点智能放号装置,所述装置包括:
获取模块,用于获取网点在预设时间段内的历史放号数据;
模型训练模块,用于将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
概率分布函数构建模块,基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
放号策略模块,基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。
本申请还提出一种网点智能放号设备,所述设备包括处理器、与所述处理器电连接的存储器及存储在所述存储器上并可在所述处理器上运行的网点智能放号程序;所述网点智能放号程序被所述处理器执行时实现如所述的网点智能放号方法的步骤。
本申请还提出一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述的网点智能放号方法中的步骤。
本申请通过获取网点在预设时间段内的历史放号数据;将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据。从而摈弃网点凭人工经验预估日放号量或者乱放号的策略,引进机器学习算法模型根据网点日到访客户数量进行网点日放号量的精准预测。基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。摈弃原有每个时间段平均放号的策略,提出基于网点各个时段忙闲比重和业务类型比重的概率分布的随机分布放号策略计算方法,减少客户的等待时间,提高客户体验度。
附图说明
图1为本申请的网点智能放号设备的一实施例的硬件框架图;
图2为本申请的网点智能放号方法的一实施例的流程框图;
图3为本申请的网点智能放号方法的另一实施例的流程框图;
图4为图3中步骤500的一实施例的流程框图;
图5为图2中步骤200的一实施例的流程框图;
图6为图2中步骤300的一实施例的流程框图;
图7为本申请的网点智能放号方法的又一实施例的流程框图;
图8为本申请的网点智能放号装置的一实施例的模块示意图;
图9为本申请的步骤200预测2019.1.1-2019.1.14的预测到访量与真实到访量的对比示意图;
图10为本申请的步骤400预测的网点放号策略的一实施例的放号预览示意图。
具体实施方式
为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
随着互联网金融的发展,客户行为和消费习惯的变化给商业银行传统网点带来了全新的挑战。面临变化的行业和市场环境,银行需要不断创新来应对更高的要求和更严峻的挑战,尤其体现在:业务创新和服务创新方面。其中,提升用户体验一直是网点关注的问题。
目前,大量被动式、标准化、信息型的业务被转移到线上办理,然而,由于业务类型限制,部分复杂的零售业务和对公业务还是需要到线下完成办理。在线上渠道预约放号方面,网点放号方案上存在着以下方面的缺陷:
网点柜面资源有限,未考虑到网点整体忙闲,各个时间段采用平均值的方法放号,从而造成忙时客户等待时间加长,降低客户体验度。
因此,当前需要解决现有网点未考虑到网点整体忙闲,各个时间段采用平均值的方法放号,从而造成忙时客户等待时间加长,降低客户体验度的问题,以及放号数量与客户实际到访量关系不明确,网点线上预约放号数量主要根据主管经验进行预估,无理论数据支撑的问题。鉴于此,本申请提出一种网点智能放号方法、装置、设备及存储介质。
请参照图1,下面介绍一种网点智能放号设备,该网点智能放号设备可以包括:处理器1001,例如CPU,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选包括无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中出示的网点智能放号设备结构并不构成对网点智能放号设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及网点智能放号程序。其中,操作系统是管理和控制网点智能放号设备硬件和软件资源的程序,支持网点智能放号程序以及其它软件或程序的运行。
在图1所示的网点智能放号设备中,网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行如上所述的网点智能放号方法的步骤。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
获取网点在预设时间段内的历史放号数据;
将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
所述历史放号数据至少包括放号时间、业务类型、每小时到访量、日到访量以及工作日类型。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
所述工作日类型包括国家法定节假日、休息日以及正常工作日。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
对所述历史放号数据进行预处理。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
排除所述历史放号数据中的重复放号数据、无效放号数据;所述无效放号数据至少包括属于正常工作日中非工作时间的放号数据、属于国家法定节假日或休息日的的放号数据;
对有缺失的历史放号数据,采用回归插补方法对历史放号数据的缺失值进行预估;
将历史放号数据中的业务类型和工作日类型编码成预设数字类型。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
采用基函数为db4的离散小波变换将所述历史放号数据分解为稳定集和残差集;
对所述稳定集采用SARIMAX模型进行训练,得到预测数据集;
对所述残差集采用XGBoost模型进行训练,得到残差数据集;
将所述预测数据集与所述残差数据集进行小波重构,得到日到访量预测数据。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
基于所述历史放号数据得到网点在预设时间段内的各个时段的平均分时到访量,并计算所述各个时段的平均分时到访量占日到访量的分时到访量比例,分时时段与分时到访量比例组成的第一集合;
将所述第一集合按照分时到访量比例的大小从小到大排序,按照预设规则将所述第一集合中分时到访量比例进行两两逆序交换,得到逆序集合;
基于所述历史放号数据得到网点在预设时间段内的各个业务类型占总体业务类型总数的业务类型比例,业务类型与业务类型比例组成的第二集合;
基于所述逆序集合和所述第二集合构建概率分布函数。
在一些实施例中,处理器1001可以用于调用存储器1005中存储的网点智能放号程序,并执行以所述方法包括:
针对各个时段的业务类型,执行以下确定放号数量步骤:
获取伪随机数,所述伪随机数具有的概率分布函数中的分布律;
根据所述伪随机数和所述概率分布函数组装条件判断语句;
设置放号数量初始值,根据所述放号数量初始值组装放号数量计算语句;
根据时段数量和业务类型数量确定循环次数;
按照所述循环次数循环执行组装完成的放号数量计算语句,直至所述条件判断语句不成立。
本申请的网点智能放号通过获取网点在预设时间段内的历史放号数据;将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据。从而摈弃网点凭人工经验预估日放号量或者乱放号的策略,引进机器学习算法模型根据网点日到访客户数量进行网点日放号量的精准预测。基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。摈弃原有每个时间段平均放号的策略,提出基于网点各个时段忙闲比重和业务类型比重的概率分布的随机分布放号策略计算方法,减少客户的等待时间,提高客户体验度。
请参照图2,基于上述网点智能放号设备硬件架构,下面提出本申请的网点智能放号方法的实施例一,所述网点智能放号方法包括以下步骤:
S100、获取网点在预设时间段内的历史放号数据;
具体地,本实施例所述的网点可是各种办事机构的营业网点,例如是政府办事机构网点,银行网点等。在这些网点内,为了提高公民的办事效率,往往会基于公民的请求进行放号,公民根据放号的排序进行有秩序的业务办理。本申请主要以银行网点为例进行说明。
预设时间段可以是各种时间段,例如一周,一个月,一年等。为了采集足够多的样本放号数据进行放号的预测,本实施例将预设时间段设置为一年,选取一年中每个工作日的放号数据作为历史放号数据。
具体地,历史放号数据至少包括放号时间、业务类型、每小时到访量、日到访量以及工作日类型。
放号时间指的是放号事件发生的具体时间点,在一些实施例中,放号时间可以具体到年、月、日、时、分以及秒,在其他的实施例中,可以使用更少的参数来表示时间,只要能表达放号事件发生的时间即可,例如可用年、月、日、时表示放号时间。
业务类型指的是放号事件的类型,在本实施例中,在银行网点业务类型可分为零售业务和对公业务。零售业务可以包括账户开户,转账,存款等业务。对公业务可以是以企业法人、单位领导等客户为主体,围绕公存账户开展的各类支票、汇兑、贷款等业务。
每小时到访量、日到访量即银行网点的每小时、每日客户到访量。
工作日类型可以包括国家法定节假日、休息日以及正常工作日。其中国家法定节假日指中秋,端午,国庆等法定节假日;休息日指周六、周日;正常工作日指周一至周五。
在其他的实施例中,请参照表1,历史放号数据还包括银行网点的隶属分行号、网点机构号、业务类型编码等。应理解,为了区分历史放号数据中的各种数据,对每种数据使用特征名称进行定义,例如表1中的字符串“BLG_ORG_ID”代表隶属分行号等。
Figure BDA0002944895410000101
Figure BDA0002944895410000111
表1
在一些实施例中,请参照图3,获取网点在预设时间段内的历史放号数据的步骤之后还包括:对所述历史放号数据进行预处理。
具体地,请参照图4,S500、对所述历史放号数据进行预处理,包括:
S510、排除所述历史放号数据中的重复放号数据、无效放号数据;所述无效放号数据至少包括属于正常工作日中非工作时间的放号数据、属于国家法定节假日或休息日的的放号数据;
具体地,重复放号数据指的是发生在相同的相同时间点的相同业务类型的放号数据,例如在1月1日9:10同时出现两张零售业务的开户放号,此时需要删除其中一个重复放号数据。
无效放号数据指的是发生在非工作时间的异常放号数据。在一些实施例中,无效放号数据可以包括属于正常工作日中非工作时间的放号数据、属于所述国家法定节假日或所述休息日的的放号数据。正常工作日中非工作时间的放号数据指的是在每天正常工作时间之外的放号数据,例如银行网点是9点至17点营业,而放号事件发生在9点至17点之外,如17:30,则属于非工作时间的放号数据。属于所述国家法定节假日或所述休息日的的放号数据则指的是发生在如春节、端午、中秋、周六日等时间的放号数据。
在其他一些实施例中,还包括异常放号数据的剔除。即剔除业务类型编码与实际业务类型不匹配的数据。例如,放号数据显示是零售业务的编码0,而实际放号的是对公业务,此时出现业务类型编码与实际业务类型不匹配,需要提出此放号数据。
S520、对有缺失的历史放号数据,采用回归插补方法对历史放号数据的缺失值进行预估;
具体地,针对出现缺失的历史放号数据,可以采用回归插补的方法进行缺失值估计。缺失的历史放号数据可以包括缺失日到访量、业务类型、每小时到访量等的历史放号数据。对于这样的缺失的历史放号数据。可以选择设定时间(例如近20日内)的到访量的日特征、周特征、月特征,选取随机森林算法建立回归方程进行缺失值估计,从而完成历史放号数据的缺失值的预估。
S530、将历史放号数据中的业务类型和工作日类型编码成预设数字类型。
具体地,可以将原始数据集中的DW_DAT_DT日期分解为数字特征值,例如,DateDay(日),DateWeek(周几),DateMonth(月),DateYear(年)。
为了便于对历史放号数据进行分析处理,还可以将非数字型数据转化为数字整型表达。例如工作日类型中,例如国家法定节假日、休息日以及正常工作日中,请参照表1,“STATEHOLIDAY”为0时表示国家法定节假日,为1时表示正常工作日。“ORGIDHOLIDAY”为0时表示休息日,为1时表示正常工作日。按照上述思路还可以对业务类型、隶属分行号以及网点机构号进行编码,实现原理相同,在此不赘述。
S200、将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
现有放号数量与客户实际到访量关系不明确,网点线上预约放号数量主要根据主管经验进行预估,无理论数据支撑。本实施例中经过步骤S100得到的有效的历史放号数据,将历史放号数据中的数据以矩阵的形式加入至少两个不同的机器学习模型进行训练,混合两个机器学习模型的结果对日到访量进行预估。
具体地,请参照图5,步骤S200包括以下细分步骤:
S210、采用基函数为db4的离散小波变换将所述历史放号数据分解为稳定集和残差集;
将历史放号数据转换成矩阵数据,采用基函数为db4的离散小波变换将矩阵数据分解为稳定集Lt和残差集Nt。公式表达为Tt=Lt+Nt,Tt表示历史放号数据中转换成的矩阵数据,t为时间。
S220、对所述稳定集采用SARIMAX模型进行训练,得到预测数据集;
具体地,当数据特征具备:系统平稳运行时,系统交易量数据呈现:平稳分布、周期性分布的规律。针对此特点数据,优先选择SARIMAX模型,即多元季节性时间序列模型进行序列预测。
SARIMAX预测模型在考虑内生关系的基础上,通过分析外界变量对预测内容的冲击作用,大幅提高了外界条件变化时的预测精度。
SARIMAX模型计算公式如下所示:
Figure BDA0002944895410000131
其中,Yt为t时刻的因变量;Xk,t为t时刻第k个解释变量;β0,β1,β2,…,βk为标定参数;S为周期差分长度;
Figure BDA0002944895410000132
为P阶季节性自回归算子,Θ(Bs)为季节性移动平均算子,Δd为非季节差分算子,
Figure BDA0002944895410000133
为D阶季节差分算子,et为数据白噪声。差分的目的是为了使得数据从非平稳数据变为平稳数据,以满足时间序列无偏估计的要求。
S230、对所述残差集采用XGBoost模型进行训练,得到残差数据集;
XGBoost是一种基于梯度提升决策树的改进算法,可以有效地构建增强树并且并行运行,优化目标函数的价值是该模型的核心。
该模型函数如下所示:
Figure BDA0002944895410000141
其中,
Figure BDA0002944895410000142
为预测输出,K表示树的数量,fk表示第k棵树模型。每次训练一棵树,目标函数如下:
Figure BDA0002944895410000143
其中,N表示样本数,t表示训练第t棵树,ft表示第t轮所生成的树模型,Ω(fi)表示正则项。树的复杂度如下所示:
Figure BDA0002944895410000144
其中,T表示树中叶子的总数,
Figure BDA0002944895410000145
表示w的L2模平方。此项,降低了模型的方差,使得学习模型避免过拟合。
S240、将所述预测数据集与所述残差数据集进行小波重构,得到日到访量预测数据。
选取某一银行网点进行双模型混合拟合,预测效果如图9所示。可见在2019.1.1-2019.1.14中真实到访量与预测到访量差异较小。通过步骤S200可得到日到访量预测数据。
步骤S200根据历史放号数据,采用基于SARIMAX模型与XGBoost混合模型预测网点的日到放量,从而分别预测网点零售业务和对公业务每日客户到访量。通过采用混合模型的的方法来进行网点日到访量的预测,提高整体预测性能。
S300、基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
银行网点放号数据呈现一定的稳定分布性。网点客户到访时间分布上,上午客户到访时间集中于9-11点,下午客户到访时间集中于14-15点,而在11点-12点,12点-14点,16点-17点之间存在着短暂的闲时状态。网点对公业务类型上,每个网点负责办理的业务类型与业务类型占比均有所不同。譬如,某个银行对公网点,负责的对公外汇业务占比较大,而另外的某个银行对公网点,负责的对公结算业务占比较大。
针对网点分时到访比例概率分布数据,提出基于随机变量分布的策略完成动态放号模型计算。具体地,请参照图6,步骤S300具体包括以下步骤:
S310、基于所述历史放号数据得到网点在预设时间段内的各个时段的平均分时到访量,并计算所述各个时段的平均分时到访量占日到访量的分时到访量比例,分时时段与分时到访量比例组成的第一集合;
获取某网点上一年的分时到访数据,计算各个时段的平均分时到访量H(x),其中x∈S,S={9,10,11,12,13,14,15,16},S表示该银行网点的上班时间。基于各个时段的客户到访量H(x),计算所述各个时段的平均分时到访量占日到访量的分时到访量比例,即
Figure BDA0002944895410000151
并将分时时段与分时到访量比例组成的第一集合。例如,(x1,B(x1)),当x1=9时即代表上午9时的到访比例。
S320、将所述第一集合按照分时到访量比例的大小从小到大排序,按照预设规则将所述第一集合中分时到访量比例进行两两逆序交换,得到逆序集合;
由于在实际放号中,某些时段的客户到访量多,此时再增大放号数量,无疑会给网点带来更大的压力,因此需要将分时到访量比例进行必须交换,从而达到引流客户的目的,将客户从业务办理的高峰时间引流到其他较无人办理业务的时段从而降低网点的压力。例如存在4个时段,上午11点、下午5点、下午3点、上午9点,分别对应的分时到访量比例是15%,20%,30%,35%。将所述第一集合中分时到访量比例以第一集合中心为对称中心进行两两逆序交换,得到逆序集合。逆序集合中,上午11点、下午5点、下午3点、上午9点,分别对应的分时到访量比例是35%,30%,20%,15%。即逆序集合中包括(9点,15%)、(11点,35%)、(3点,20%)、(5点,30%)。此时逆序集合用C(x)表示,x∈S,S={9,10,11,12,13,14,15,16},S表示该银行网点的上班时间。
S330、基于所述历史放号数据得到网点在预设时间段内的各个业务类型占总体业务类型总数的业务类型比例,业务类型与业务类型比例组成的第二集合;
计算在过去一年内各个业务类型的占总体业务类型总数的业务类型比例。业务类型比例用公式表达为
Figure BDA0002944895410000161
其中y表示业务类型。第二集合表示为(y,A(y))。
S340、基于所述逆序集合和所述第二集合构建概率分布函数。
基于C(x)和A(y)得到基于上一年放号数据的概率分布函数F(x,y)=C(x)*A(y)。
S400、基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。
具体地,针对各个时段的业务类型,执行以下确定放号数量步骤:
获取伪随机数,所述伪随机数具有的概率分布函数中的分布律;
根据所述伪随机数和所述概率分布函数组装条件判断语句;
设置放号数量初始值,根据所述放号数量初始值组装放号数量计算语句;
根据时段数量和业务类型数量确定循环次数;
按照所述循环次数循环执行组装完成的放号数量计算语句,直至所述条件判断语句不成立。
由上述步骤得到的F(x,y),满足离散随机变量分布,且∑F(x,y)=1。
基于此,我们将网点预测放号数量的问题归纳为模拟离散型随机变量分布的问题进行求解,该算法的主要计算流程如下:
获取伪随机数u,且u具有F(x,y)的分布律。
初始化每个时段放号数量总和为∑M(xi)=0;
获取总的循环次数n,n由时段数量和业务类型数量确定循环次数确定。接着进行循环:
若u<F(x1,y1),则M(xl)=∑M(xl)+1,跳出循环;
若u<F(x1,y1)+F(x2,y2),则M(x2)=∑M(x2)+1,跳出循环;
若u<F(x1,y1)+F(x2,y2)+F(x3,y3),则M(x3)=∑M(x3)+1,跳出循环。
通过程序表示为:
Figure BDA0002944895410000171
请参照图10,图10表示2020年12月30日、9点到17点的分业务类型的网点放号策略。
本申请通过获取网点在预设时间段内的历史放号数据;将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据。从而摈弃网点凭人工经验预估日放号量或者乱放号的策略,引进机器学习算法模型根据网点日到访客户数量进行网点日放号量的精准预测。基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。摈弃原有每个时间段平均放号的策略,提出基于网点各个时段忙闲比重和业务类型比重的概率分布的随机分布放号策略计算方法,减少客户的等待时间,提高客户体验度。
基于同一发明构思,请参照图7,本申请还提出实施例二,实施例二建立在实施例一的基础之上。
实施例二
本实施例的网点智能放号方法包括:
S100、获取网点在预设时间段内的历史放号数据;
S200、将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
S300、基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
S400、基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略;
S600、将所述网点放号策略进行存储及显示。
网点零售业务需要获取未来14天的放号数据,对公业务需要获取未来7天的放号数据。后台系统每日启动定时任务,进行通过步骤S100-S400进行放号数量的计算,并将各个网点的各个时段不同类型的放号数量存储至ES系统中。每日网点运营管理系统定时读取ES系统中的放号数据,进行放号。此时,客户可以通过手机APP完成各个时段的不同业务类型的线上预约。减少客户的等待时间,提高客户体验度。
请参照图8,本申请还提出一种网点智能放号装置,包括:获取模块101、模型训练模块102、计算模块103以及放号策略模块104。
获取模块101,用于获取网点在预设时间段内的历史放号数据;
模型训练模块102,用于将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
概率分布函数构建模块103,基于所述历史放号数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
放号策略模块104,基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略。
其中,网点智能放号装置的各个功能模块实现的步骤可参照本申请网点智能放号方法的各个实施例,此处不再赘述。
本申请还提出一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述的网点智能放号方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (9)

1.一种网点智能放号方法,其特征在于,包括:
获取网点在预设时间段内的历史放号数据;
将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
基于所述日到访量预测数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略;
所述将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据,包括:
采用基函数为db4的离散小波变换将所述历史放号数据分解为稳定集和残差集;
对所述稳定集采用SARIMAX模型进行训练,得到预测数据集;
对所述残差集采用XGBoost模型进行训练,得到残差数据集;
将所述预测数据集与所述残差数据集进行小波重构,得到日到访量预测数据。
2.根据权利要求1所述的方法,其特征在于,获取网点在预设时间段内的历史放号数据的步骤之后,还包括:
对所述历史放号数据进行预处理。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史放号数据进行预处理,包括:
排除所述历史放号数据中的重复放号数据、无效放号数据;所述无效放号数据至少包括属于正常工作日中非工作时间的放号数据、属于国家法定节假日或休息日的放号数据;
对有缺失的历史放号数据,采用回归插补方法对历史放号数据的缺失值进行预估;
将历史放号数据中的业务类型和工作日类型编码成预设数字类型。
4.根据权利要求1所述的方法,其特征在于,所述基于所述日到访量预测数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数,包括:
基于所述日到访量预测数据得到网点在预设时间段内的各个时段的平均分时到访量,并计算所述各个时段的平均分时到访量占日到访量的分时到访量比例,分时时段与分时到访量比例组成的第一集合;
将所述第一集合按照分时到访量比例的大小从小到大排序,按照预设规则将所述第一集合中分时到访量比例进行两两逆序交换,得到逆序集合;
基于所述日到访量预测数据得到网点在预设时间段内的各个业务类型占总体业务类型总数的业务类型比例,业务类型与业务类型比例组成的第二集合;
基于所述逆序集合和所述第二集合构建概率分布函数。
5.根据权利要求4所述的方法,其特征在于,所述基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略,包括:
针对各个时段的业务类型,执行以下确定放号数量步骤:
获取伪随机数,所述伪随机数具有的概率分布函数中的分布律;
根据所述伪随机数和所述概率分布函数组装条件判断语句;
设置放号数量初始值,根据所述放号数量初始值组装放号数量计算语句;
根据时段数量和业务类型数量确定循环次数;
按照所述循环次数循环执行组装完成的放号数量计算语句,直至所述条件判断语句不成立。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述历史放号数据至少包括放号时间、业务类型、每小时到访量、日到访量以及工作日类型。
7.一种网点智能放号装置,其特征在于,所述装置包括:
获取模块,用于获取网点在预设时间段内的历史放号数据;
模型训练模块,用于将所述历史放号数据输入至少两个不同的机器学习模型进行训练,基于所述至少两个不同的机器学习模型的训练结果得到日到访量预测数据;
概率分布函数构建模块,用于基于所述日到访量预测数据得到分时到访量比例和业务类型比例,根据所述分时到访量比例和所述业务类型比例构建概率分布函数;
放号策略模块,用于基于随机变量分布算法从所述概率分布函数得到不同时段、不同业务类型的网点放号策略;
所述模型训练模块,还用于采用基函数为db4的离散小波变换将所述历史放号数据分解为稳定集和残差集;
对所述稳定集采用SARIMAX模型进行训练,得到预测数据集;
对所述残差集采用XGBoost模型进行训练,得到残差数据集;
将所述预测数据集与所述残差数据集进行小波重构,得到日到访量预测数据。
8.一种网点智能放号设备,其特征在于,所述设备包括处理器、与所述处理器电连接的存储器及存储在所述存储器上并可在所述处理器上运行的网点智能放号程序;所述网点智能放号程序被所述处理器执行时实现如权利要求1至6任一项所述的网点智能放号方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至6中任一项所述的网点智能放号方法中的步骤。
CN202110190652.6A 2021-02-19 2021-02-19 网点智能放号方法、装置、设备及存储介质 Active CN112862197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110190652.6A CN112862197B (zh) 2021-02-19 2021-02-19 网点智能放号方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110190652.6A CN112862197B (zh) 2021-02-19 2021-02-19 网点智能放号方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112862197A CN112862197A (zh) 2021-05-28
CN112862197B true CN112862197B (zh) 2023-04-18

Family

ID=75988185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110190652.6A Active CN112862197B (zh) 2021-02-19 2021-02-19 网点智能放号方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112862197B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807553A (zh) * 2021-09-29 2021-12-17 康键信息技术(深圳)有限公司 预约服务的数量分析方法、装置、设备及存储介质
CN115545553B (zh) * 2022-11-07 2023-04-07 浪潮软件股份有限公司 用于业务办理的限号放号方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837931A (zh) * 2019-11-08 2020-02-25 中国农业银行股份有限公司 客户流失预测方法、装置及存储介质
CN111506575A (zh) * 2020-03-26 2020-08-07 第四范式(北京)技术有限公司 一种网点业务量预测模型的训练方法、装置及系统
CN111754336A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种网点排班方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7587330B1 (en) * 2003-01-31 2009-09-08 Hewlett-Packard Development Company, L.P. Method and system for constructing prediction interval based on historical forecast errors
CN100517394C (zh) * 2007-04-24 2009-07-22 暨南大学 一种智能排队叫号系统
CN101540016A (zh) * 2008-12-31 2009-09-23 深圳市奥拓电子有限公司 一种队列等待时间估算方法
CN109961164B (zh) * 2017-12-25 2022-01-07 比亚迪股份有限公司 客流量预测方法及装置
CN108364091A (zh) * 2018-01-26 2018-08-03 南京航空航天大学 概率性航路扇区交通需求预测流量管理系统
JP6933992B2 (ja) * 2018-03-26 2021-09-08 株式会社日立ソリューションズ 人流予測装置および人流予測プログラム
CN110443657B (zh) * 2019-08-19 2022-03-18 泰康保险集团股份有限公司 客户流量数据处理方法、装置、电子设备及可读介质
CN111709566A (zh) * 2020-06-09 2020-09-25 信雅达系统工程股份有限公司 一种银行网点业务预测及调度方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837931A (zh) * 2019-11-08 2020-02-25 中国农业银行股份有限公司 客户流失预测方法、装置及存储介质
CN111506575A (zh) * 2020-03-26 2020-08-07 第四范式(北京)技术有限公司 一种网点业务量预测模型的训练方法、装置及系统
CN111754336A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种网点排班方法和装置

Also Published As

Publication number Publication date
CN112862197A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
US10896203B2 (en) Digital analytics system
CN109672795B (zh) 呼叫中心资源管理方法及装置、电子设备、存储介质
CN112862197B (zh) 网点智能放号方法、装置、设备及存储介质
CN101620692A (zh) 一种移动通信业务的客户流失分析方法
Hwang et al. Investigation of factors affecting the diffusion of mobile telephone services: An empirical analysis for Vietnam
CN115082102A (zh) 能源消费者的预测性细分
CN111415199A (zh) 一种基于大数据的客户预测更新方法、装置及存储介质
CN108133390A (zh) 用于预测用户行为的方法和装置以及计算设备
CN114118691A (zh) 基于业务量的排班方案处理方法、装置、设备和介质
CN102411757B (zh) 一种大型主机cpu容量预测方法及系统
CN111512326A (zh) 基于负载形状分析的能量计划通信控制系统及方法
CN110796379B (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN116757402A (zh) 服务策略的确定方法及装置、存储介质及电子装置
CN115330219A (zh) 一种资源调度的方法及装置
CN113723663A (zh) 电力工单数据的处理方法、装置、电子设备及存储介质
CN112862597A (zh) 网点分时分类型放号方法、装置、设备及存储介质
CN112862597B (zh) 网点分时分类型放号方法、装置、设备及存储介质
CN114092265B (zh) 提高保单新业务价值确定效率的方法、装置及存储介质
CN116011698B (zh) 机组组合确定方法、装置、计算机设备和存储介质
CN113807597A (zh) 网点排班方法、装置、设备及存储介质
CN114547137A (zh) 用于模型训练的样本的处理方法和装置、电子设备
CN117010541A (zh) 时间序列预测方法、装置及存储介质
Sardenberg Technoeconomic aspects of next-generation telecommunications including the Internet service
CN114140216A (zh) 一种企业信用信息管理方法
CN115239293A (zh) 业务通知方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant