CN112101675A - 基于kl散度衡量资源配置合理度方法、装置、设备及介质 - Google Patents
基于kl散度衡量资源配置合理度方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112101675A CN112101675A CN202011004207.8A CN202011004207A CN112101675A CN 112101675 A CN112101675 A CN 112101675A CN 202011004207 A CN202011004207 A CN 202011004207A CN 112101675 A CN112101675 A CN 112101675A
- Authority
- CN
- China
- Prior art keywords
- service
- data
- window
- historical
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于KL散度衡量资源配置合理度方法、装置、设备及介质,其包括获取目标办税服务厅的历史业务明细原始数据,根据历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数;根据预测时间点,获取目标办税服务厅的历史业务量数据或未来业务量数据;根据历史业务量数据或未来业务量数据,确定目标办税服务厅在衡量时间段内各类业务的难度系数业务量序列;获取目标办税服务厅在衡量时间段内各类业务的相对可办理窗口数量序列;根据各类业务的难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。本发明能够有效衡量办税资源配置合理度,提高办税资源的利用率。
Description
技术领域
本发明涉及办税服务资源配置衡量技术领域,尤其是涉及一种基于KL散度衡量资源配置合理度方法、装置、设备及介质。
背景技术
目前,在办税服务大厅中,由于纳税人对每种业务类型的需要量不尽相同,同时每种业务的办理复杂程度也存在差异,因此需要将办税服务大厅有限的办税资源在各个业务之间进行分配,比如将窗口资源和税务人员资源在业务之间进行优先配置,办税资源的配置方式直接影响办税资源的利用率、纳税人的办税时间等,同时也影响各个窗口税务人员的工作负荷。
本发明人认为现有的办税服务大厅中,由于业务类型繁多,各窗口可办理业务类型及优先级的配置方案也不计其数,存在难以直接观察大厅资源配置合理程度的缺陷。
发明内容
为克服现有技术的不足,本申请现提出一种基于KL散度衡量资源配置合理度方法、装置、设备及介质,能够有效衡量办税资源配置合理程度,提高办税资源的利用率。
本发明的上述发明目的一是通过以下技术方案得以实现的:
一种基于KL散度衡量资源配置合理度方法,包括:
获取目标办税服务厅的请求衡量消息,所述请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点;
根据所述目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据所述历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数;
根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据所述衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据;
将所述历史业务量数据或未来业务量数据作为目标业务量数据,根据所述目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在所述衡量时间段内各类业务的难度系数业务量序列;
获取目标办税服务厅在所述衡量时间段内对各类业务的窗口资源配置方案,根据所述窗口资源配置方案,确定各类业务的相对可办理窗口数量序列;
根据各类业务的所述难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
通过采用上述技术方案,根据任意一个目标办税服务厅的识别号和预测时间点,即可开始对办税服务厅进行资源配置合理度衡量;根据目标办税服务厅的识别号和预测时间点,获取目标办税大厅的历史业务量数据或未来业务量数据,并结合办理各类业务的难度系数,从而计算难度系数业务量序列;通过获取窗口资源配置方案,计算每个业务的相对可办理窗口数量序列;利用KL散度方法计算难度系数业务量序列和相对可办理窗口数量序列的相对熵指标,可以准确地知道目标办税服务厅在预测时间点的资源配置合理度。此外通过历史业务量数据或未来业务量数据来衡量在衡量时间段内的窗口资源配置方案,从而既能够衡量过去的资源配置合理度,也可以辅助办税服务厅进行场景模拟未来使用该资源配置方案的合理度。
可选的,所述根据所述历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数的步骤,包括:
将所述历史业务明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的历史业务明细原始数据作为历史业务明细待分析数据;
根据所述历史业务明细待分析数据,从业务类型和业务办理时间两个维度,统计每种业务的平均办理时间;
将所述每种业务的平均办理时间进行归一化处理,将归一化处理后得到的值作为每种业务的难度系数。
通过采用上述技术方案,通过获取历史业务明细原始数据,并对该历史业务明细原始数据进行数据清洗以删除异常值,从而可以提高后续计算业务难度系数的准确性;通过从业务类型和业务办理时间,统计每种业务的平均办理时间,并将每种业务的平均办理时间进行归一化,将归一化后得到的值作为各类业务的难度系数,从而保证计算难度系数的客观性,避免受特殊情况产生的办理时间对业务难度系数衡量的影响。
可选的,所述请求衡量消息还包括请求衡量资源配置的预测天数,所述根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据所述衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据的步骤,包括:
根据所述预测时间点和预测天数,确定衡量时间段;
若所述衡量时间段为历史时间段,获取目标办税服务厅在所述历史时间段内的历史业务量原始数据,并将所述历史业务量原始数据进行预处理以完善数据特征,将预处理后对应的历史业务量原始数据作为所述历史业务量数据;
若所述衡量时间段为未来时间段,则根据目标办税服务厅的识别号,调用与目标办税服务厅对应的目标业务量预测模型,根据所述未来时间段和目标业务量预测模型,预测目标办税服务厅在未来时间段内的未来业务量数据。
通过采用上述技术方案,通过确定衡量时间段是历史时间段还是未来时间段,则选择不同的业务量数据获取方式,同时也决定了是根据历史业务量数据还是根据未来业务量数据去衡量资源配置方案的合理度,代表了两种应用场景。
可选的,所述目标业务量预测模型为训练完成的预测模型,所述调用与目标办税服务厅对应的目标业务量预测模型的步骤之前,所述方法还包括:
获取目标办税服务厅当前月度期间内的历史业务量月度数据,对所述历史业务量月度数据进行数据预处理,所述数据预处理包括数据清洗、数据特征衍生以及独热编码转换;
将数据预处理后对应的所述历史业务量月度数据划分为训练集和测试集;
建立LightGBM初始模型,将所述训练集输入所述LightGBM初始模型,并利用LightGBM算法进行迭代训练,然后根据所述测试集,并利用网格搜索法进行模型参数调优以使模型达到预设误差范围,将达到预设误差范围对应的LightGBM初始模型作为目标业务量预测模型。
通过采用上述技术方案,通过办税服务厅的历史业务量数据训练模型来获取业务量预测模型,从而可以通过任一个办税服务厅的历史业务量数据训练获得对应的业务量预测模型,方便每个办税服务厅均可实现预测本服务厅的未来业务量数据;通过将历史业务量月度数据进行数据清洗,可以删除异常数据,通过特征衍生,可以增加数据特征,通过独热编码转换方便机器学习,即方便业务预测模型的学习,从而提高模型输出结果的准确性。
可选的,所述获取目标办税服务厅在所述衡量时间段内对各类业务的窗口资源配置方案,根据所述窗口资源配置方案,确定各类业务的相对可办理窗口数量序列的步骤,包括:
若所述衡量时间段为历史时间段,则获取窗口的历史资源配置方案作为所述窗口资源配置方案,若所述衡量时间段为未来时间段,则获取窗口的预设资源配置方案作为所述窗口资源配置方案;
所述窗口资源配置方案包括目标办税服务厅在衡量时间段内每个工作日开设的窗口数量和各窗口的可办理业务设置数据;所述各窗口的可办理业务设置数据包括各窗口可办理业务数量、类型以及业务优先级别;
根据每个工作日开设的窗口数量和各窗口可办理业务数量及类型,统计每个工作日各类业务的可办理窗口数量;
根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列。
通过采用上述技术方案,根据目标办税服务厅的请求衡量需求,确定是获取窗口的历史资源配置方案还是获取窗口的预设资源配置方案,从而既能够衡量过去的资源配置合理度,也可以辅助办税服务厅进行场景模拟未来使用该资源配置方案的合理度;此外,通过根据可办理窗口数量结合各业务优先级别相对窗口的权重系数,综合得出各类业务的相对可办理窗口数量序列,消除了窗口设置业务优先级对窗口在业务呼叫的优先级上的影响,更好地衡量各类业务的可办理窗口数量,从而有助于提高衡量资源配置合理度的准确性。
可选的,所述根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列的步骤之前,所述方法还包括:
获取目标办税服务厅在当前月度期间内每个工作日的票号办理明细原始数据,将所述票号办理明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的票号办理明细原始数据作为票号办理明细数据;
获取目标办税服务厅在当前月度期间内的窗口资源配置方案,根据所述窗口资源配置方案,获取当前月度期间内每个工作日每个窗口对可办理业务的优先级别情况;
将所述票号办理明细数据增加对应办理业务的优先级别序号,统计每个工作日每个窗口每种可办理业务类型的业务量占对应窗口业务总量的比例,并将所述比例作为对应优先级别业务的业务量占比;
统计每种优先级别在所有窗口中相同优先级别的业务量占比平均值,并将所述每种优先级别的业务量占比平均值除以所有优先级别的业务量占比总和,获取每个优先级别相对窗口的权重系数。
通过采用上述技术方案,根据目标办税服务厅当前月度期间内的票号办理明细数据和窗口资源配置方案,可以统计每个工作日每个窗口办理每种可办理业务的业务量占该工作日该窗口该业务类型业务总量的比例,再统计所有优先级别下的业务量优先级占比平均值得出每个优先级别相对窗口的权重系数,能够客观分析业务优先级对窗口办理的影响,有助于提高衡量资源配置合理度的准确性。
可选的,所述根据所述难度系数业务量系列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,涉及计算公式如下:
其中,D k L(p||q)表示目标办税服务厅的办税资源的配置系数;N表示目标办税服务厅可办理的业务类型总数;p(x i )表示目标办税服务厅第i种业务x i 对应的难度系数业务量,p(x i )表示目标办税服务厅第i种业务x i 对应的相对可办理窗口数量。
通过采用上述技术方案,通过KL散度方法的计算公式,按照序列输入难度系数业务量序列和对应业务类型的相对可办理窗口数量序列,得出两个序列的相对熵指标,该相对熵指标即目标办税服务厅在衡量时间段内的资源配置合理度系数,该系数越小,说明目标办税服务厅的办税资源配置情况越合理,从而可以更加准确地知道目标办税服务厅在预测时间点资源配置合理度的结果。
本发明的上述发明目的二是通过以下技术方案得以实现的:
一种基于KL散度衡量资源配置合理度装置,该装置包括:
获取消息模块,用于获取目标办税服务厅的请求衡量消息,所述请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点;
难度系数确定模块,用于根据所述目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据所述历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数;
业务量确定模块,用于根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据所述衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据;
第一序列确定模块,用于将所述历史业务量数据或未来业务量数据作为目标业务量数据,根据所述目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在所述衡量时间段内各类业务的难度系数业务量序列;
第二序列确定模块,用于获取目标办税服务厅在所述衡量时间段内对各类业务的窗口资源配置方案,根据所述窗口资源配置方案,确定各类业务的相对可办理窗口数量序列;
合理度衡量模块,用于根据各类业务的所述难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
通过采用上述技术方案,通过获取消息模块获取请求衡量消息,从而可以知道目标办税服务厅的识别号和想要衡量资源配置合理度的预测时间点;难度系数确定模块通过历史业务明细原始数据,统计各类业务的难度系数,从而客观分析业务办理的复杂程度;业务量确定模块根据预测时间点来确定获取目标业务量数据的获取方式,从而既可以利用历史务量数据衡量历史资源配置合理度,也可以通过未来业务量数据衡量未来资源配置合理度;第一序列确定模块根据历史业务量数据或未来业务量数据,结合各类业务的难度系数,获取难度系数业务量序列,从而更加客观分析不同难度程度业务办理需求量;第二序列确定模块根据当前月度期间内的窗口资源配置方案,可以确定各类业务的相对可办理窗口数量序列,可以分析各类业务的相对可办理窗口数量;合理度衡量模块根据难度系数业务量系列和相对可办理窗口数量序列,计算资源配置系数,资源配置系数越小,说明目标办税服务厅的资源配置越合理,从而能够协助目标办税服务厅对原有的资源配置方案进行修正,提高办税资源的利用率、减少纳税人的等候时间,均衡办税服务厅各窗口税务人员的工作负荷。
本发明的上述发明目的三是通过以下技术方案得以实现的:
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于KL散度衡量资源配置合理度方法的步骤。
本发明的上述发明目的四是通过以下技术方案得以实现的:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于KL散度衡量资源配置合理度方法的步骤。
综上所述,本发明包括以下至少一种有益技术效果:
1、通过KL散度方法,计算各类业务的难度系数业务量序列和相对可办理窗口数量序列之间的相对熵,可以得出该目标办税服务厅在预测时间点资源配置合理程度的结果,从而能够协助目标办税服务厅对原有的资源配置方案进行修正,提高办税资源的利用率、减少纳税人的等候时间、均衡办税服务厅各窗口税务人员的工作负荷。
2、根据历史业务量数据结合LightGBM预测模型可以预测指定工作日目标办税服务厅各类业务的业务量,使该功能不仅使得办税资源配置合理性衡量方法能够用于衡量过去的资源配置合理程度,也可以使目标办税服务厅进行场景模拟,衡量未来该资源配置方案的合理程度,辅助大厅提前优化资源配置方案。
3、通过将历史业务量数据或未来业务量数据,结合各类业务的难度系数,计算难度系数业务量序列,从而可以更加客观分析历史或未来业务的需求量。
4、通过根据可办理窗口数量结合各业务优先级别相对窗口的权重系数,综合得出各类业务的相对可办理窗口数量序列,消除了窗口设置业务优先级对窗口在业务呼叫的优先级上的影响,更好地衡量各类业务的可办理窗口数量,从而有助于提高衡量资源配置合理度的准确性。
附图说明
图1是本申请实施例的基于KL散度衡量资源配置合理度方法的实现流程图;
图2是本申请实施例的基于KL散度衡量资源配置合理度方法步骤S20的实现流程图;
图3是本申请实施例的基于KL散度衡量资源配置合理度方法步骤S30的实现流程图;
图4是本申请实施例的基于KL散度衡量资源配置合理度方法步骤S33的实现流程图;
图5是本申请实施例的基于KL散度衡量资源配置合理度方法步骤S40的实现流程图;
图6是本申请实施例的基于KL散度衡量资源配置合理度方法步骤S50的实现流程图;
图7是本申请实施例的基于KL散度衡量资源配置合理度装置的原理框图;
图8是本申请实施例计算机设备的原理框图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例:
在本实施例中,如图1所示,本申请公开了一种基于KL散度衡量资源配置合理度方法,包括下述步骤:
S10:获取目标办税服务厅的请求衡量消息,请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点。
在本实施例中,目标办税服务厅是指用户向服务器请求衡量资源配置合理度的办税服务厅对象;请求衡量消息是指用户向服务器发送的请求衡量目标办税服务厅资源配置合理度的消息;预测时间点是指衡量目标办税服务厅资源配置合理度的时间点。
具体地,用户向服务器发出衡量请求消息,该衡量请求消息包括衡量资源配置的预测时间点,还包括目标办税服务厅的识别号,该识别号用于区别不同的办税服务厅,并用于调用与识别号对应的办税服务厅历史数据;其中,预测时间点包括历史时间点、当前时间点或未来时间点,可以知道,该预测时间点可以是过去的任何时间点,或者是未来已经做好窗口设置的时间点,比如2020年5月20日的9:00-10:00或未来某个时间点。因此本实施例的资源配置衡量方法既可以针对过去时间点的窗口资源配置合理度进行衡量,也可以对未来时间点已设计好窗口资源配置方案而进行衡量,从而协助修正资源配置不合理度的情况。
进一步地,根据目标办税服务厅的识别号,调用存储有目标办税服务厅历史办税数据的数据库。
S20:根据目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数。
在本实施例中,历史业务明细原始数据是指目标办税服务厅的某一历史时间段内的历史业务流水数据;各类业务难度系数是指反映各业务处理复杂程度的数值。
具体地,获取目标办税服务厅在一个历史期间内的历史业务明细数据,该历史业务明细数据可以记载目标办税服务厅在这个历史期间内每个工作各个业务的办理时间长,比如获取距离当前时间点最近一个月的目标办税服务厅办理各种业务的业务明细数据。
进一步地,可以根据各个业务的总体办理时间水平,统计出各类业务难度系数。
S30:根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据。
在本实施例中,衡量时间段是指与预测时间点相关的一个时间段,衡量时间段包括历史时间段或未来时间段;历史业务量数据是目标办税服务厅在历史时间段的业务需求量;未来业务量数据是目标办税服务厅在未来时间段的业务需求量。
具体地,根据预测时间点,确定衡量目标办税服务厅资源配置的一个相关的时间段,该时间段可以由用户需求确定。
进一步地,根据衡量时间段为历史时间段或未来时间段,获取目标办税服务厅在历史时间段的历史业务量数据,或预测在未来时间段的未来业务量数据。
S40:将历史业务量数据或未来业务量数据作为目标业务量数据,根据目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在衡量时间段内各类业务的难度系数业务量序列。
在本实施例中,目标业务量数据是指历史业务量数据或未来业务量数据,即待转换为难度系数业务量序列的数据;难度系数业务量序列是指将目标业务量数据匹配了对应的难度系数后获取的数据序列。
具体地,目标业务量数据包括每个工作日各类业务的业务量,将每个工作日各类业务的业务量乘以对应业务的难度系数,生成难度系数业务量序列,从而可以更客观考虑不同难度业务的业务需求量。
S50:获取目标办税服务厅在衡量时间段内对各类业务的窗口资源配置方案,根据窗口资源配置方案,确定各类业务的相对可办理窗口数量序列。
在本实施例中,窗口资源配置方案是指目标办税服务厅在衡量时间段内每个工作日对各类业务的开设配置数据;各类业务的相对可办理窗口数量序列是指衡量时间段内每个工作日各个业务之间相对的可办理窗口数量。
具体地,根据衡量时间段,获取目标办税服务厅在衡量时间段内对各类业务的窗口资源配置方案,在本实施例中,窗口资源配置方案可以为历史资源配置方案或已经设计好且待实施的预设资源配置方案。
进一步地,根据窗口资源配置方案中开设的窗口数量,各个窗口的业务配置情况,按照各个窗口对可办理业务的优先级设置,统计每种类型业务的相对可办理窗口数量序列。
S60:根据各类业务的难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
在本实施例中,资源配置系数是指衡量目标办税服务厅的办税资源配置合理度的数值。
具体地,将难度系数业务量系列按照序列的业务类型,获取对应的相对可办理窗口数量序列,然后根据KL散度方法,得出两个序列的相对熵指标,该相对熵指标即目标办税服务厅在衡量时间段内的资源配置合理度系数,资源配置合理度系数越小,说明目标办税服务厅的办税资源配置情况越合理,从而可以更加准确地知道目标办税服务厅在预测时间点资源配置合理度的结果。
如图2所示,步骤S20中,根据历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数的步骤,包括:
S21:将历史业务明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的历史业务明细原始数据作为历史业务明细待分析数据。
在本实施例中,历史业务明细待分析数据是指数据清洗后对应的历史业务明细原始数据。
具体地,将历史业务明细原始数据进行数据清洗以删除异常数据,其中数据清洗包括删除错乱数据以及离群点数据。
S22:根据历史业务明细待分析数据,从业务类型和业务办理时间两个维度,统计每种业务的平均办理时间。
具体地,将历史业务明细待分析数据,按照业务类型进行分类,利用箱线图监测每种业务类型中办理时间的异常值,删除温和异常值以及极端异常点后,统计每种业务类型的办理时间的平均值作为每种业务的平均办理时间。
S23:将每种业务的平均办理时间进行归一化处理,将归一化处理后得到的值作为每种业务的难度系数。
具体地,将每种业务的平均办理时间进行MinMaxScaler归一化处理,并将归一化后得到的值作为每种业务的难度系数,在本实施例中,将难度系数最低值设置为0.01。
如图3所示,步骤S30,即根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据的步骤,包括:
S31:根据预测时间点和预测天数,确定衡量时间段。
在本实施例中,请求衡量消息还包括请求衡量资源配置的预测天数,预测天数是指客户请求衡量资源配置合理度的天数。
具体地,根据预测时间点和预测天数,确定衡量时间段,比如衡量时间段是距离当前时间点的未来一个星期,作为一个未来时间段,或者衡量时间段为距离当前时间点的过去一个星期,作为一个历史时间段。
S32:若衡量时间段为历史时间段,获取目标办税服务厅在历史时间段内的历史业务量原始数据,并将历史业务量原始数据进行预处理以完善数据特征,将预处理后对应的历史业务量原始数据作为历史业务量数据。
在本实施例中,历史业务量原始数据是指目标办税服务厅在历史时间段内的历史业务量流水数据。
具体地,从数据库中获取目标办税服务厅在历史时间段内的历史业务量原始数据,将历史业务量原始数据进行填充缺失值和删除离群点以完成数据清洗;
进一步地,历史业务量原始数据包括目标办税服务厅的识别号和业务类型两个属性,现对数据清洗后对应的历史业务量原始数据进行特征衍生,比如,衍生的特征属性包括工作日是星期几,是否属于节假日前后、距离征期的天数、属于月上旬、属于月中旬、属于月下旬,前一个工作日和业务量、前七个工作日平均业务等,从而有助于丰富数据量和数据特征。将特征衍生后对应的历史业务量原始数据作为历史业务量数据。
S33:若衡量时间段为未来时间段,则根据目标办税服务厅的识别号,调用与目标办税服务厅对应的目标业务量预测模型,根据未来时间段和目标业务量预测模型,预测目标办税服务厅在未来时间段内的未来业务量数据。
具体地,由于预测时间点为未来时间点,根据目标办税服务厅的识别号,调用与目标办税服务厅对应的目标业务量预测模型,在本市实施例中,目标业务量预测模型是提前训练好的模型。
进一步地,将未来时间段的时间信息进行特征衍生以丰富数据特征,其特征衍生与步骤S32中的特征衍生同理。
进一步地,将特征衍生后的时间信息输入到目标业务量预测模型,预测目标办税服务厅在未来时间段内的未来业务量数据,从而可以提前模拟未来业务需求量场景以衡量未来的窗口配置情况。
如图4所示,步骤S33中即调用与目标办税服务厅对应的目标业务量预测模型的步骤之前,本实施例的基于KL散度衡量资源配置合理度方法还包括:
S331:获取目标办税服务厅当前月度期间内的历史业务量月度数据,对历史业务量月度数据进行数据预处理,数据预处理包括数据清洗、数据特征衍生以及独热编码转换。
在本实施例中,当前月度期间是指距离当前时间点一个月的时间段;历史业务量月度数据是当前月度期间内的历史业务量流水数据。
具体地,从数据库中获取目标办税服务厅距离当前时间点一个月内的历史业务量流水数据,将历史业务量流水数据作为历史业务量月度数据。
进一步地,将历史业务量月度数据进行数据清洗,其中数据清洗包括填充缺失值和删除离群点。
进一步地,历史业务量月度数据包括目标办税服务厅的识别号和业务类型两个属性,现对数据清洗后的历史业务量月度数据进行特征衍生,衍生的特征属性包括工作日是星期几,是否属于节假日前后、距离征期的天数、属于月上旬、属于月中旬、属于月下旬,前一个工作日和业务量、前七个工作日平均业务等。
进一步地,对衍生的特征属性进行独热编码转换,其中对该工作日是星期几、是否属于节假日前后、距离征期的天数,属于月上旬、月中旬还是月下旬等这些特征进行独热编码转换,然后统计转换后每一特征属性的梯度,删除梯度较小的实例数据。在本实施例中,独热编码转换有利于预测模型的训练和学习。
S332:将数据预处理后对应的历史业务量月度数据划分为训练集和测试集。
具体地,将将数据预处理后对应的历史业务量月度数据进行随机排序,并按照9:1划分为训练集和测试集,在本实施例中,采用shuffle函数进行随机排序。
S333:建立LightGBM初始模型,将训练集输入LightGBM初始模型,并利用LightGBM算法进行迭代训练,然后根据测试集,并利用网格搜索法进行模型参数调优以使模型达到预设误差范围,将达到预设误差范围对应的LightGBM初始模型作为目标业务量预测模型。
具体地,建立LightGBM初始模型,将训练集输入LightGBM初始模型,基于LightGBM算法进行回归预测的原理,利用测试集和网格参数搜索调优法,将LGBRegressor的参数调整为earning_rate=0.1,n_estimators=20,num_leaves=50,max_depth=5,bagging_fraction=0.8,colsample_bytree=0.8,metric='mse',objective='regression',训练模型达到预设误差范围,得到训练完成的LightGBM预测模型并作为目标业务量预测模型。在本实施例中,预设误差范围在3.3%~9.4%。
如图5所示,步骤S40,即获取目标办税服务厅在衡量时间段内对各类业务的窗口资源配置方案,根据窗口资源配置方案,确定各类业务的相对可办理窗口数量序列的步骤,包括:
S41:若衡量时间段为历史时间段,则获取窗口的历史资源配置方案作为窗口资源配置方案,若衡量时间段为未来时间段,则获取窗口的预设资源配置方案作为窗口资源配置方案。
在本实施例中,历史资源配置方案是指目标办税服务厅在历史时间段内的窗口业务配置方案;预设资源配置方案是指已经设计好且还未实施的窗口业务配置方案;
具体地,若衡量时间段为历史时间段,则从数据库中获取目标办税服务厅在历史时间段内窗口的历史资源配置方案,若衡量时间段为未来时间段,则数据库中获取目标办税服务厅在未来时间段内的预设资源配置方案,并将获取的历史资源配置方案或预设资源配置方案作为窗口资源配置方案。
S42:窗口资源配置方案包括目标办税服务厅在衡量时间段内每个工作日开设的窗口数量和各窗口的可办理业务设置数据;各窗口的可办理业务设置数据包括各窗口可办理业务数量、类型以及业务优先级别。
具体地,窗口资源配置方案包括目标办税服务厅在衡量时间段内每个工作日开设的窗口数量和各窗口的可办理业务设置数据,其中窗口的可办理业务设置数据包括各窗口可办理业务数量、类型以及业务优先级别。
S43:根据每个工作日开设的窗口数量和各窗口可办理业务数量及类型,统计每个工作日各类业务的可办理窗口数量。
具体地,根据每个工作日开设的窗口数量和各窗口可办理业务数量及类型,按照每一类型业务进行统计以获取每个工作日各类业务的可办理窗口数量。
S44:根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列。
在本实施例中,各业务优先级别相对窗口的权重系数是指不同优先级相对窗口的权重占比值。
具体地,将每个工作日各类业务的可办理窗口数量乘以对应业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列。
如图6所示,步骤S50,即根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列的步骤之前,本实施例的基于KL散度衡量资源配置合理度方法还包括:
S51:获取目标办税服务厅在当前月度期间内每个工作日的票号办理明细原始数据,将票号办理明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的票号办理明细原始数据作为票号办理明细数据。
在本实施例中,票号办理明细原始数据是指目标办税服务厅在当前月度期间内的票号办理明细流水数据;票号办理明细数据是指数据清洗后对应的票号办理明细原始数据,且用于优先级别分析。
具体地,从数据库中获取目标办税服务厅距离当前时间点一个月内的票号办理明细原始数据,并将票号办理明细原始数据进行数据清洗,其数据清洗包括删除错乱数据和离群点数据。
进一步,将数据清洗后对应的票号办理明细原始数据作为票号办理明细数据。
S52:获取目标办税服务厅在当前月度期间内的窗口资源配置方案,根据窗口资源配置方案,获取当前月度期间内每个工作日每个窗口对可办理业务的优先级别情况。
具体地,从数据库中获取目标办税服务厅距离当前时间点一个月的窗口资源配置方案,其中窗口资源配置方案包括当前月度期间内每个工作日开设的窗口数量和各窗口的可办理业务设置数据;各窗口的可办理业务设置数据包括各窗口可办理业务数量、类型以及业务优先级别。
S53:将票号办理明细数据增加对应办理业务的优先级别序号,统计每个工作日每个窗口每种可办理业务类型的业务量占对应窗口业务总量的比例,并将比例作为对应优先级别业务的业务量占比。
具体地,根据各窗口可办理业务的业务优先级别,将票号办理明细数据增加对应办理业务的优先级别序号,统计每个工作日每个窗口每种可办理业务类型的业务量占对应窗口业务总量的比例,并将该比例作为对应务业优先级别的业务量占比。
S54:统计每种优先级别在所有窗口中相同优先级别的业务量占比平均值,并将每种优先级别的业务量占比平均值除以所有优先级别的业务量占比总和,获取每个优先级别相对窗口的权重系数。
具体地,根据每种务业优先级别的业务量占比,按照每一种优先级别序号,统计每种优先级别的业务量占比平均值,比如两种相同优先级别的业务,则按照同一种优先级别序号,统计该优先级别序号的两种业务量占比平均值。
进一步地,将每种优先级别的业务量占比平均值除以所有优先级别的业务量占比总和,获取每个优先级别相对窗口的权重系数。
在本实施例中,步骤S60中,即根据难度系数业务量系列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,涉及计算公式如下:
其中,D k L(p||q)表示目标办税服务厅的办税资源的配置系数;N表示目标办税服务厅可办理的业务类型总数;p(x i )表示目标办税服务厅第i种业务x i 对应的难度系数业务量,p(x i )表示目标办税服务厅第i种业务x i 对应的相对可办理窗口数量。
由上述公式计算得出目标办税服务厅在衡量时间段内的配置合理度系数,该系数越小,说明目标办税服务厅的办税资源配置情况越合理。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二:
在一实施例中,提供一种基于KL散度衡量资源配置合理度装置,该基于KL散度衡量资源配置合理度装置与上述实施例中基于KL散度衡量资源配置合理度方法一一对应。如图7所示,该基于KL散度衡量资源配置合理度装置包括获取消息模块10、难度系数确定模块20、业务量确定模块30、第一序列确定模块40、第二序列确定模块50和合理度衡量模块60。各功能模块详细说明如下:
获取消息模块10,用于获取目标办税服务厅的请求衡量消息,请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点;
难度系数确定模块20,用于根据目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数;
业务量确定模块30,用于根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据;
第一序列确定模块40,用于将历史业务量数据或未来业务量数据作为目标业务量数据,根据目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在衡量时间段内各类业务的难度系数业务量序列;
第二序列确定模块50,用于获取目标办税服务厅在衡量时间段内对各类业务的窗口资源配置方案,根据窗口资源配置方案,确定各类业务的相对可办理窗口数量序列;
合理度衡量模块60,用于根据各类业务的难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
可选的,难度系数确定模块20包括:
第一数据获取单元,用于将历史业务明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的历史业务明细原始数据作为历史业务明细待分析数据;
统计单元,用于根据历史业务明细待分析数据,从业务类型和业务办理时间两个维度,统计每种业务的平均办理时间;
归一化单元,用于将每种业务的平均办理时间进行归一化处理,将归一化处理后得到的值作为每种业务的难度系数。
可选的,业务量确定模块30包括:
时间段确定单元,用于根据预测时间点和预测天数,确定衡量时间段;
历史业务量获取单元,用于若衡量时间段为历史时间段,获取目标办税服务厅在历史时间段内的历史业务量原始数据,并将历史业务量原始数据进行预处理以完善数据特征,将预处理后对应的历史业务量原始数据作为历史业务量数据;
未来业务量获取单元,用于若衡量时间段为未来时间段,则根据目标办税服务厅的识别号,调用与目标办税服务厅对应的目标业务量预测模型,根据未来时间段和目标业务量预测模型,预测目标办税服务厅在未来时间段内的未来业务量数据。
可选的,本实施例的基于KL散度衡量资源配置合理度装置还包括:
模型训练数据获取单元,用于获取目标办税服务厅当前月度期间内的历史业务量月度数据,对历史业务量月度数据进行数据预处理,数据预处理包括数据清洗、数据特征衍生以及独热编码转换;
数据划分单元,用于将数据预处理后对应的历史业务量月度数据划分为训练集和测试集;
模型训练及测试单元,用于建立LightGBM初始模型,将训练集输入LightGBM初始模型,并利用LightGBM算法进行迭代训练,然后根据测试集,并利用网格搜索法进行模型参数调优以使模型达到预设误差范围,将达到预设误差范围对应的LightGBM初始模型作为目标业务量预测模型。
可选的,第二序列确定模块50包括:
配置方案获取单元,用于若衡量时间段为历史时间段,则获取窗口的历史资源配置方案作为窗口资源配置方案,若衡量时间段为未来时间段,则获取窗口的预设资源配置方案作为窗口资源配置方案;
配置方案单元,用于窗口资源配置方案包括目标办税服务厅在衡量时间段内每个工作日开设的窗口数量和各窗口的可办理业务设置数据;各窗口的可办理业务设置数据包括各窗口可办理业务数量、类型以及业务优先级别;
窗口数量统计单元,用于根据每个工作日开设的窗口数量和各窗口可办理业务数量及类型,统计每个工作日各类业务的可办理窗口数量;
序列确定单元,用于根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列。
可选的,本实施例的基于KL散度衡量资源配置合理度装置还包括:
票号数据获取单元,用于获取目标办税服务厅在当前月度期间内每个工作日的票号办理明细原始数据,将票号办理明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的票号办理明细原始数据作为票号办理明细数据;
业务优先级获取单元,用于获取目标办税服务厅在当前月度期间内的窗口资源配置方案,根据窗口资源配置方案,获取当前月度期间内每个工作日每个窗口对可办理业务的优先级别情况;
优先级占比计算单元,用于将票号办理明细数据增加对应办理业务的优先级别序号,统计每个工作日每个窗口每种可办理业务类型的业务量占对应窗口业务总量的比例,并将比例作为对应优先级别业务的业务量占比;
窗口权重系数计算单元,用于统计每种优先级别在所有窗口中相同优先级别的业务量占比平均值,并将每种优先级别的业务量占比平均值除以所有优先级别的业务量占比总和,获取每个优先级别相对窗口的权重系数。
可选的,合理度衡量模块60包括:
合理度计算单元,用于根据难度系数业务量系列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,涉及计算公式如下:
其中,D k L(p||q)表示目标办税服务厅的办税资源的配置系数;N表示目标办税服务厅可办理的业务类型总数;p(x i )表示目标办税服务厅第i种业务x i 对应的难度系数业务量,p(x i )表示目标办税服务厅第i种业务x i 对应的相对可办理窗口数量。
关于基于KL散度衡量资源配置合理度装置的具体限定可以参见上文中对于基于KL散度衡量资源配置合理度方法的限定,在此不再赘述。上述基于KL散度衡量资源配置合理度装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例三:
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史业务明细原始数据、历史业务量原始数据、票号办理明细原始数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于KL散度衡量资源配置合理度方法,处理器执行计算机程序时实现以下步骤:
S10:获取目标办税服务厅的请求衡量消息,请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点。
S20:根据目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数。
S30:根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据。
S40:将历史业务量数据或未来业务量数据作为目标业务量数据,根据目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在衡量时间段内各类业务的难度系数业务量序列。
S50:获取目标办税服务厅在衡量时间段内对各类业务的窗口资源配置方案,根据窗口资源配置方案,确定各类业务的相对可办理窗口数量序列。
S60:根据各类业务的难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
实施例四:
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
S10:获取目标办税服务厅的请求衡量消息,请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点。
S20:根据目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数。
S30:根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据。
S40:将历史业务量数据或未来业务量数据作为目标业务量数据,根据目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在衡量时间段内各类业务的难度系数业务量序列。
S50:获取目标办税服务厅在衡量时间段内对各类业务的窗口资源配置方案,根据窗口资源配置方案,确定各类业务的相对可办理窗口数量序列。
S60:根据各类业务的难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于KL散度衡量资源配置合理度方法,其特征在于,所述方法包括:
获取目标办税服务厅的请求衡量消息,所述请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点;
根据所述目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据所述历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数;
根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据所述衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据;
将所述历史业务量数据或未来业务量数据作为目标业务量数据,根据所述目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在所述衡量时间段内各类业务的难度系数业务量序列;
获取目标办税服务厅在所述衡量时间段内对各类业务的窗口资源配置方案,根据所述窗口资源配置方案,确定各类业务的相对可办理窗口数量序列;
根据各类业务的所述难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
2.根据权利要求1所述的基于KL散度衡量资源配置合理度方法,其特征在于,所述根据所述历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数的步骤,包括:
将所述历史业务明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的历史业务明细原始数据作为历史业务明细待分析数据;
根据所述历史业务明细待分析数据,从业务类型和业务办理时间两个维度,统计每种业务的平均办理时间;
将所述每种业务的平均办理时间进行归一化处理,将归一化处理后得到的值作为每种业务的难度系数。
3.根据权利要求1所述的基于KL散度衡量资源配置合理度方法,其特征在于,所述请求衡量消息还包括请求衡量资源配置的预测天数,所述根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据所述衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据的步骤,包括:
根据所述预测时间点和预测天数,确定衡量时间段;
若所述衡量时间段为历史时间段,获取目标办税服务厅在所述历史时间段内的历史业务量原始数据,并将所述历史业务量原始数据进行预处理以完善数据特征,将预处理后对应的历史业务量原始数据作为所述历史业务量数据;
若所述衡量时间段为未来时间段,则根据目标办税服务厅的识别号,调用与目标办税服务厅对应的目标业务量预测模型,根据所述未来时间段和目标业务量预测模型,预测目标办税服务厅在未来时间段内的未来业务量数据。
4.根据权利要求3所述的基于KL散度衡量资源配置合理度方法,其特征在于,所述目标业务量预测模型为训练完成的预测模型,所述调用与目标办税服务厅对应的目标业务量预测模型的步骤之前,所述方法还包括:
获取目标办税服务厅当前月度期间内的历史业务量月度数据,对所述历史业务量月度数据进行数据预处理,所述数据预处理包括数据清洗、数据特征衍生以及独热编码转换;
将数据预处理后对应的所述历史业务量月度数据划分为训练集和测试集;
建立LightGBM初始模型,将所述训练集输入所述LightGBM初始模型,并利用LightGBM算法进行迭代训练,然后根据所述测试集,并利用网格搜索法进行模型参数调优以使模型达到预设误差范围,将达到预设误差范围对应的LightGBM初始模型作为目标业务量预测模型。
5.根据权利要求3所述的基于KL散度衡量资源配置合理度方法,其特征在于,所述获取目标办税服务厅在所述衡量时间段内对各类业务的窗口资源配置方案,根据所述窗口资源配置方案,确定各类业务的相对可办理窗口数量序列的步骤,包括:
若所述衡量时间段为历史时间段,则获取窗口的历史资源配置方案作为所述窗口资源配置方案,若所述衡量时间段为未来时间段,则获取窗口的预设资源配置方案作为所述窗口资源配置方案;
所述窗口资源配置方案包括目标办税服务厅在衡量时间段内每个工作日开设的窗口数量和各窗口的可办理业务设置数据;所述各窗口的可办理业务设置数据包括各窗口可办理业务数量、类型以及业务优先级别;
根据每个工作日开设的窗口数量和各窗口可办理业务数量及类型,统计每个工作日各类业务的可办理窗口数量;
根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列。
6.根据权利要求5所述的基于KL散度衡量资源配置合理度方法,其特征在于,所述根据每个工作日各类业务的可办理窗口数量和预设的各业务优先级别相对窗口的权重系数,生成各类业务的相对可办理窗口数量序列的步骤之前,所述方法还包括:
获取目标办税服务厅在当前月度期间内每个工作日的票号办理明细原始数据,将所述票号办理明细原始数据进行数据清洗以删除异常数据,将数据清洗后对应的票号办理明细原始数据作为票号办理明细数据;
获取目标办税服务厅在当前月度期间内的窗口资源配置方案,根据所述窗口资源配置方案,获取当前月度期间内每个工作日每个窗口对可办理业务的优先级别情况;
将所述票号办理明细数据增加对应办理业务的优先级别序号,统计每个工作日每个窗口每种可办理业务类型的业务量占对应窗口业务总量的比例,并将所述比例作为对应优先级别业务的业务量占比;
统计每种优先级别在所有窗口中相同优先级别的业务量占比平均值,并将所述每种优先级别的业务量占比平均值除以所有优先级别的业务量占比总和,获取每个优先级别相对窗口的权重系数。
8.一种基于KL散度衡量资源配置合理度装置,其特征在于,所述装置包括:
获取消息模块,用于获取目标办税服务厅的请求衡量消息,所述请求衡量消息包括目标办税服务厅的识别号和请求衡量资源配置的预测时间点;
难度系数确定模块,用于根据所述目标办税服务厅的识别号,获取目标办税服务厅的历史业务明细原始数据,根据所述历史业务明细原始数据确定目标办税服务厅办理各类业务的难度系数;
业务量确定模块,用于根据预测时间点,确定衡量目标办税服务厅资源配置的衡量时间段,根据所述衡量时间段,获取目标办税服务厅的历史业务量数据或未来业务量数据;
第一序列确定模块,用于将所述历史业务量数据或未来业务量数据作为目标业务量数据,根据所述目标业务量数据和对应各类业务的难度系数,确定目标办税服务厅在所述衡量时间段内各类业务的难度系数业务量序列;
第二序列确定模块,用于获取目标办税服务厅在所述衡量时间段内对各类业务的窗口资源配置方案,根据所述窗口资源配置方案,确定各类业务的相对可办理窗口数量序列;
合理度衡量模块,用于根据各类业务的所述难度系数业务量序列和相对可办理窗口数量序列,利用KL散度方法计算资源配置系数,以衡量目标办税服务厅的资源配置合理度。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于KL散度衡量资源配置合理度方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于KL散度衡量资源配置合理度方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011004207.8A CN112101675B (zh) | 2020-09-22 | 2020-09-22 | 基于kl散度衡量资源配置合理度方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011004207.8A CN112101675B (zh) | 2020-09-22 | 2020-09-22 | 基于kl散度衡量资源配置合理度方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101675A true CN112101675A (zh) | 2020-12-18 |
CN112101675B CN112101675B (zh) | 2022-05-13 |
Family
ID=73754964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011004207.8A Active CN112101675B (zh) | 2020-09-22 | 2020-09-22 | 基于kl散度衡量资源配置合理度方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101675B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801372A (zh) * | 2021-01-29 | 2021-05-14 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
CN113177747A (zh) * | 2021-06-25 | 2021-07-27 | 南京铉盈网络科技有限公司 | 冷启动的法院诉讼服务大厅单业务窗口调配方法及系统 |
CN113269558A (zh) * | 2021-06-25 | 2021-08-17 | 中国银行股份有限公司 | 分布式系统中交易处理的方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2131212C1 (ru) * | 1998-02-20 | 1999-06-10 | Сараев Игорь Анатольевич | Способ диагностики ишемии миокарда при велоэргометрическом (вэм) исследовании |
CN107093005A (zh) * | 2017-03-24 | 2017-08-25 | 北明软件有限公司 | 基于大数据挖掘算法实现办税服务厅自动分级的方法 |
CN109995656A (zh) * | 2019-02-22 | 2019-07-09 | 国网江苏省电力有限公司 | 面向自动需求响应业务的资源分配方法、装置和存储介质 |
CN110335027A (zh) * | 2019-07-11 | 2019-10-15 | 税友软件集团股份有限公司 | 一种税务事项处理方法、装置、设备及系统 |
US20190370603A1 (en) * | 2018-05-29 | 2019-12-05 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for establishing an application prediction model, storage medium and terminal |
CN111210140A (zh) * | 2020-01-03 | 2020-05-29 | 西安邮电大学 | 税务信用评价方法、设备及可读存储介质 |
-
2020
- 2020-09-22 CN CN202011004207.8A patent/CN112101675B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2131212C1 (ru) * | 1998-02-20 | 1999-06-10 | Сараев Игорь Анатольевич | Способ диагностики ишемии миокарда при велоэргометрическом (вэм) исследовании |
CN107093005A (zh) * | 2017-03-24 | 2017-08-25 | 北明软件有限公司 | 基于大数据挖掘算法实现办税服务厅自动分级的方法 |
US20190370603A1 (en) * | 2018-05-29 | 2019-12-05 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for establishing an application prediction model, storage medium and terminal |
CN109995656A (zh) * | 2019-02-22 | 2019-07-09 | 国网江苏省电力有限公司 | 面向自动需求响应业务的资源分配方法、装置和存储介质 |
CN110335027A (zh) * | 2019-07-11 | 2019-10-15 | 税友软件集团股份有限公司 | 一种税务事项处理方法、装置、设备及系统 |
CN111210140A (zh) * | 2020-01-03 | 2020-05-29 | 西安邮电大学 | 税务信用评价方法、设备及可读存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801372A (zh) * | 2021-01-29 | 2021-05-14 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
CN112801372B (zh) * | 2021-01-29 | 2024-04-19 | 北京嘀嘀无限科技发展有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
CN113177747A (zh) * | 2021-06-25 | 2021-07-27 | 南京铉盈网络科技有限公司 | 冷启动的法院诉讼服务大厅单业务窗口调配方法及系统 |
CN113269558A (zh) * | 2021-06-25 | 2021-08-17 | 中国银行股份有限公司 | 分布式系统中交易处理的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112101675B (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101675B (zh) | 基于kl散度衡量资源配置合理度方法、装置、设备及介质 | |
CN111210093B (zh) | 基于大数据的日用水量预测方法 | |
CN112101674B (zh) | 基于群智能算法资源配置匹配方法、装置、设备及介质 | |
CN106156965B (zh) | 一种物流服务调度方法与设备 | |
CN110147367B (zh) | 一种温度缺失数据填补方法、系统及电子设备 | |
CN111415027A (zh) | 构建件量预测模型的方法和装置 | |
CN109767024B (zh) | 件量预测方法及装置、电子设备和存储介质 | |
CN110245147B (zh) | 区块链数据处理方法、装置、可读存储介质和计算机设备 | |
CN107844496B (zh) | 统计信息输出方法及装置 | |
CN113793057A (zh) | 一种基于回归分析模型的建筑招投标数据生成方法 | |
CN113205230A (zh) | 基于模型集合的数据预测方法、装置、设备及存储介质 | |
Van Dijk | Error bounds and comparison results: the Markov reward approach for queueing networks | |
CN108564237A (zh) | 一种容量评估模型建立方法、容量评估方法及装置 | |
CN110910241A (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN110689177A (zh) | 订单准备时间的预测方法和装置,电子设备及存储介质 | |
CN110992189A (zh) | 资源数据估值方法、装置、计算机设备和存储介质 | |
CN114154697A (zh) | 房屋维修资源的预测方法、装置、计算机设备和存储介质 | |
CN102801581B (zh) | 一种web服务连接成功率的预测方法 | |
WO2022222230A1 (zh) | 基于机器学习的指标预测方法、装置、设备及存储介质 | |
US8595686B2 (en) | Software modification estimate method and software modification estimate system | |
CN113762421A (zh) | 分类模型的训练方法、流量分析方法、装置及设备 | |
CN108804640B (zh) | 基于最大化iv的数据分组方法、装置、储存介质及设备 | |
CN113822455A (zh) | 一种时间预测方法、装置、服务器及存储介质 | |
CN112860763B (zh) | 实时流数据处理方法、装置、计算机设备和存储介质 | |
CN111277445B (zh) | 一种评估在线节点服务器性能的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |