CN115392591A - 任务处理方法、装置、设备及存储介质 - Google Patents

任务处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115392591A
CN115392591A CN202211215013.1A CN202211215013A CN115392591A CN 115392591 A CN115392591 A CN 115392591A CN 202211215013 A CN202211215013 A CN 202211215013A CN 115392591 A CN115392591 A CN 115392591A
Authority
CN
China
Prior art keywords
task
time period
mean
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211215013.1A
Other languages
English (en)
Inventor
陈鹏
陈萍
蔡科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202211215013.1A priority Critical patent/CN115392591A/zh
Publication of CN115392591A publication Critical patent/CN115392591A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种任务处理方法、装置、设备及存储介质。该方法包括:获取第一时间段的历史任务量均值数据和历史任务量极值数据;根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。本发明实施例提高了对任务量的预测准确度,从而提高了对任务处理的稳定性。

Description

任务处理方法、装置、设备及存储介质
技术领域
本发明实施例涉及大数据处理技术领域,尤其涉及一种任务处理方法、装置、设备及存储介质。
背景技术
在企业中,每日的工作任务量变化无规律且波动幅度较大,遇到紧急情况时,突发的任务量过大会导致工作任务无法及时完成,从而导致工作任务压力剧增或造成经济损失。因此,对未来任务工作量进行预测至关重要。
现有技术中,通常基于机器学习模型对未来周期内的任务量预测。然而,现有的任务量预测方案对未来任务量的预测准确度较低,从而降低了对任务处理的稳定性。
发明内容
本发明提供了一种任务处理方法、装置、设备及存储介质,以提高对任务量的预测准确度,从而提高对任务处理的稳定性。
根据本发明的一方面,提供了一种任务处理方法,所述方法包括:
获取第一时间段的历史任务量均值数据和历史任务量极值数据;
根据所述第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;
根据所述第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;
根据所述预测任务量均值数据和所述预测任务量极值数据,确定所述第二时间段的任务调整配置信息。
根据本发明的另一方面,提供了一种任务处理装置,所述装置包括:
历史任务量获取模块,用于获取第一时间段的历史任务量均值数据和历史任务量极值数据;
任务量极值预测模块,用于根据所述第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;
任务量均值预测模块,用于根据所述第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;
任务配置确定模块,用于根据所述预测任务量均值数据和所述预测任务量极值数据,确定所述第二时间段的任务调整配置信息。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的任务处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的任务处理方法。
本发明实施例通过根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。上述方案通过从任务量极值和任务量均值两个维度进行预测,并整合与指示未来时间周期的任务配置策略,可以精准的预测未来任务量的变化情况,辅助用户及时应对未来任务量,减少极端风险和压力,提高任务处理的稳定性,从而有效避免遇到紧急情况难以及时应对而导致的任务压力剧增或资源浪费的情况发生。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种任务处理方法的流程图;
图2是根据本发明实施例二提供的一种任务处理方法的流程图;
图3A是根据本发明实施例三提供的一种任务处理方法的流程图;
图3B是根据本发明实施例三提供的一种任务处理方法的结构示意图;
图4是根据本发明实施例四提供的一种任务处理装置的结构示意图;
图5是实现本发明实施例的任务处理方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种任务处理方法的流程图,本实施例可适用于对未来周期内的工作任务量进行预测的情况,该方法可以由任务处理装置来执行,该任务处理装置可以采用硬件和/或软件的形式实现,该任务处理装置可配置于电子设备中。如图1所示,该方法包括:
S110、获取第一时间段的历史任务量均值数据和历史任务量极值数据。
其中,第一时间段可以是历史时间段。例如,第一时间段可以为自当前月份起的过去30年。其中,任务量用于量化任务多少,具体可以是工作任务件数或工作任务时长。
其中,历史任务量均值数据可以是历史时间段内每个月的日均任务量,即月度日平均任务件数或月度日平均任务时长。例如,若历史时间段为过去360个月,则相应的历史任务量均值数据可以为过去360个月中每个月的日均任务量。针对360个月中任意一个月份X进行举例说明。若月份X包括30天,则月份X的任务量均值为30天分别对应的任务量的平均值。将360个月中每个月对应的任务量平均值作为历史任务量均值数据。
其中,历史任务量极值数据可以是历史时间段内,每个月中执行任务量最多的时间日期,以及该时间日期下执行的任务量,即月度最高单日任务件数或月度最高单日任务时长。例如,若历史时间段为过去360个月,则相应的历史任务量极值数据可以为过去360个月中,每个月对应的执行任务量最多的时间日期,以及该时间日期下执行的任务量大小。针对360个月中任意一个月份Y进行举例说明。若月份Y包括30天,且执行任务量最多的时间日期为Y月a日,执行任务量为1000件,则历史任务量极值数据包括月份Y执行任务量最多的时间日期Y月a日,以及在Y月a日这一天执行的任务量大小:1000件。
需要说明的是,历史任务量均值数据和历史任务量极值数据均具有时间属性,即包括历史任务量均值和历史任务量极值对应的时间日期。例如,历史任务量均值数据的数据表现形式可以为历史时间段下的X月对应的任务量均值、Y月对应任务量均值、…、Z月对应的任务量均值等。历史任务量极值数据的数据表现形式可以为历史时间段下Y月对应的执行任务量最多的时间日期Y月a日,以及Y月a日所执行的任务量大小M1、Z月对应的执行任务量最多的时间日期Z月b日,以及Z月b日所执行的任务量大小M2等,本实施例对此不再进行赘述。
需要说明的是,历史任务量均值数据和历史任务量极值数据的获取、存储、使用和处理等均符合国家法律法规的相关规定。
S120、根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据。
其中,第二时间段可以是未来待进行任务量预测的时间段。例如,第二时间段可以是待进行任务量预测的未来10个月。预测任务量极值数据可以是对第二时间段内每个月的任务量极值进行预测后得到的预测数据。例如,采用第一时间段的历史任务量极值数据,对第二时间段内的X月和Y月的任务量极值进行预测,则对应的预测任务量极值数据可以包括X月和Y中分别预测得到的执行任务量最多的时间日期,以及预测得到的在该时间日期下所执行的任务量大小。
可以理解的是,通过对未来时间段的预测任务量极值数据进行预测,能够用于对未来工作强度和工作压力进行分析,从而能够提前部署应对策略。针对未来时间段的任务量极值的预测,是从极端风险的角度预测分析每个月的最高单日工作任务量,任务量极值指标能够反映企业遇到的单日工作量峰值,能够作为提前应对极端风险情形的评估或指导依据。
在一个可选实施例中,可以采用训练机器学习模型的方式,对第二时间段的预测任务量极值进行预测。具体的,可以通过第一时间段的历史任务量极值数据,预先对预设的机器学习模型进行训练,得到用于进行任务量极值预测的极值预测模型。采用训练好的极值预测模型,预测得到第二时间段的预测任务量极值数据。
在另一个可选实施例中,还可以采用极值理论模型,对第二时间段的任务量极值进行拟合预测,从而得到第二时间段的预测任务量极值数据。例如,极值理论模型可以是Block-Maximum(分块样本极值)模型。更具体的,根据第一时间段的历史任务量极值数据,计算极值分布函数对应的密度函数的数值;以更新后的极值分布函数对应的密度函数取最大值为目标,迭代更新参数的数值,直至更新后的极值分布函数对应的密度函数的数值最大,并将当前时刻下参数的数值,作为极值分布函数中参数的估计值。
S130、根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据。
其中,预测任务量均值数据可以是对第二时间段内每个月的任务量均值进行预测后得到的预测数据。例如,采用第一时间段的历史任务量均值数据,对第二时间段内的X月和Y月的任务量均值进行预测,则对应的预测任务量均值数据可以包括对X月和Y月分别预测得到的每月日均任务量。
可以理解的是,针对未来时间段的任务量均值的预测,是从非极端风险角度进行的一般性预测。对企业每个月的日均任务量进行预测,能够反映企业正常状态下整体每日任务量的波动变化趋势,且能够作为正常工作量变化的分析数据,也同样能够作为配合提前应对极端风险情形的评估或指导依据。
在一个可选实施例中,可以采用训练机器学习模型的方式,对第二时间段的预测任务量均值进行预测。具体的,可以通过第一时间段的历史任务量均值数据,预先对预设的机器学习模型进行训练,得到用于进行任务量均值预测的均值预测模型。采用训练好的均值预测模型,预测得到第二时间段的预测任务量均值数据。
在另一个可选实施例中,还可以采用高斯混合模型(Gaussian Mixture Model,GMM),对第二时间段的任务量均值进行预测。需要说明的是,高斯混合模型的工作原理可以是将不同的正太分布函数,通过加权组合形成一种新型混合的均值分布函数。更具体的,根据第一时间段的历史任务量均值数据,计算均值分布函数对应的密度函数的数值;以更新后的均值分布函数对应的密度函数取最大值为目标,迭代更新参数的数值,直至更新后的均值分布函数对应的密度函数的数值最大,并将当前时刻下参数的数值,作为均值分布函数中参数的估计值。
需要说明的是,本实施例对S120和S130的执行顺序不作限定。具体可以是S120在S130之前执行,也可以是S120在S130之后执行,还可以是S120和S130并行同时执行,本实施例对此不进行限制。
S140、根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。
其中,任务调整配置信息可以是根据预测任务量均值数据和预测任务量极值数据,生成的第二时间段的任务量调整策略所对应的调整配置信息。
示例性的,根据预测任务量均值数据可以确定第二时间段的任务量均值相对于第一时间段的任务量均值是否处于任务量增长的趋势;若是,则可以适应性增加执行相应任务的相关技术人员数量,以适应任务量的增长趋势,避免执行任务人员数量不足导致的任务堆积或停滞的情况发生;若否,则可以适应性减少执行相应任务的相关技术人员,以避免人力资源的浪费。相应的,可以将增加或减少执行任务的相关技术人员的人员数量,作为任务调整配置信息。
示例性的,根据预测任务量极值数据,可以确定第二时间段的月度最高单日任务量和最高单日任务量对应的时间日期。若预测任务量极值数据中的月度最高单日任务量大于预设的任务量阈值,则可以从任务量源头减小任务承接;若预测任务量极值数据中的月度最高单日任务量不大于预设的任务量阈值,则可以根据月度最高单日任务量对应的时间日期,在当日增加相应的任务执行人员的数量,以提高当日的任务执行效率。其中,任务量阈值可以由相关技术人员进行预先设定。例如,任务量阈值可以是100件。相应的,可以将减少任务承接时对应的待减少任务具体数量,以及增加相应任务执行人员的人员数量,作为任务调整配置信息。
本发明实施例通过根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。上述方案通过从任务量极值和任务量均值两个维度进行预测,并整合与指示未来时间周期的任务配置策略,可以精准的预测未来任务量的变化情况,辅助用户及时应对未来任务量,减少极端风险和压力,提高任务处理的稳定性,从而有效避免遇到紧急情况难以及时应对而导致的任务压力剧增或资源浪费的情况发生。
实施例二
图2为本发明实施例二提供的一种任务处理方法的流程图,本实施例在上述各技术方案的基础上,进行了优化改进。
进一步的,将步骤“根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据”,细化为“根据第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到极值分布函数中参数的估计值;根据极值分布函数中参数的估计值,对极值分布函数进行更新;采用更新的极值分布函数,获得第二时间段的预测值数据;根据第二时间段的预测值数据,检测多个分位点值,确定为第二时间段的预测任务量极值数据。”以完善对第二时间段的预测任务量极值数据的获取方式。
如图2所示,该方法包括以下具体步骤:
S210、获取第一时间段的历史任务量均值数据和历史任务量极值数据。
S220、根据第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到极值分布函数中参数的估计值。
其中,极值分布函数用于对第二时间段内的任务量极值进行预测。极值分布函数可以由相关技术人员进行预先设定,例如,极值分布函数可以是Gumbel(耿贝尔)型极值分布函数。
其中,极值分布函数的密度函数用于计算极值分布函数中的极大似然值,极大似然值用于对极值分布函数中参数的估计值进行确定。其中,极值分布函数中参数的估计值的精确度能够表征极值分布函数的预测结果的优劣。对参数的估计值确定精确度越高,极值分布函数的预测结果越优。
示例性的,可以采用极值理论方法,根据第一时间段的历史任务量极值数据,基于极值分布函数对应的密度函数,确定极大似然值达到最大值时极值分布函数中参数的参数值,并将该参数值确定为极值分布函数中参数的估计值。
需要说明的是,在采用极值理论方法进行拟合预测的过程中,对于一列随机变量X1,X2,……,Xk,假设其服从相同分布,采用统计方法很难准确估计出随机变量X1,X2,……,Xk的分布函数F。但对于随机变量X1,X2,……,Xk对应的最大值max{X1,X2,……,Xk},其分布却往往随着k的扩大逐渐收敛到固定的分布函数类型。这种分布函数类型可以包括三种,分别为Frechet(费舍尔)型极值分布函数、Gumbel型极值分布函数和Weibull(韦布尔)型极值分布函数。因此,从三种不同类型的分布函数中准确选择出符合极值收敛特征的极值分布函数至关重要。通过采用选取的极值分布函数,对未来的任务量极值进行预测,能够有效提高对未来的任务量极值的预测准确度。
在一个可选实施例中,在根据第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到极值分布函数中参数的估计值之前,还包括:根据第一时间段的历史任务量极值数据,检测历史任务量极值数据的极值数据频率衰减特征;在多个分布函数中,将各分布函数对应的极大值吸收域与极值数据频率衰减特征进行匹配;根据匹配结果,在多个分布函数中,确定极值分布函数。
用于极值预测的分布函数存在多个,可以根据每个分布函数适配的预测场景,选择与历史任务量极值数据匹配的分布函数,确定为极值分布函数,以预测未来极值。可以根据历史任务量极值数据的分布特征,筛选极值分布函数。分布特征具体可以是极值数据频率衰减特征。实际上,在分布特征满足极大值吸收域(Maximum Domain of Attraction,MDA),则该历史任务量极值数据服从该最大值吸收域对应的分布函数。
其中,多个分布函数分别为Frechet型分布函数、Gumbel型分布函数和Weibull型分布函数。
Frechet型分布函数形式如下:
Figure BDA0003875737680000101
其中,ξ为Frechet型分布函数Hξ(x)的参数。exp函数表示以e为底的指数函数。M为第一时间段的历史任务量极值数据,x为第二时间段的预测值数据。
Gumbel型分布函数形式如下:
P(M≤x)=Hξ(x)=exp(-e-x);
其中,ξ为Gumbel型分布函数Hξ(x)的参数。exp函数表示以e为底的指数函数。M为第一时间段的历史任务量极值数据,x为第二时间段的预测值数据。
Weibull型分布函数形式如下:
Figure BDA0003875737680000111
其中,ξ为Weibull型分布函数Hξ(x)的参数。exp函数表示以e为底的指数函数。M为第一时间段的历史任务量极值数据,x为第二时间段的预测值数据。
ξ作为各类型分布函数Hξ(x)的参数,随着分布函数类型的变化,其会落入三种类型的分布函数中的一种。由于随机变量序列最大值M存在相应的收敛特征,因此,将三种类型的分布函数的收敛现象称为极大值吸收域。相应的,Frechet型分布函数、Gumbel型分布函数和Weibull型分布函数对应的极大值吸收域分别为Frechet极值吸收域、Gumbel极值吸收域、Weibull极值吸收域。
通过检测历史任务量极值数据的极值数据频率衰减特征,确定极值分布函数。其中,数据频率衰减特征可以是数据频率衰减速度,具体可以根据历史任务量极值数据的分布柱状图的极值数据频率随时间变化的斜率确定。示例性的,通过极值数据频率衰减特性,可以确定历史任务量极值数据所属极大值吸收域,例如,可以包括Frechet极值吸收域、Gumbel极值吸收域、Weibull极值吸收域。因此,可以通过确定历史任务量极值数据所属极大值吸收域,确定与极大值吸收域相应的极值分布函数。
具体的,可以将历史任务量极值数据记为{Mi},i为历史任务极值对应的月份。例如,历史360个月的历史任务量极值数据Mi中,i的取值为1,2,……,360。通过观测历史任务量极值数据Mi的分布柱状图的极值数据频率衰减特性,可以准确判断出与之相匹配的极大值吸收域,从而可以确定与极大值吸收域相对应的极值分布函数。
需要说明的是,对于极大值吸收域的判断主要依据历史任务量极值数据对应的经验分布函数,也即频率柱状图,通过观测经验分布函数的极值数据频率衰减特征,可以准确确定出极大值吸收域的所属类型,从而确定与之相对应的极值分布函数。
示例性的,当x→+∞时,若尾部分布函数满足
Figure BDA0003875737680000121
Figure BDA0003875737680000122
则可以确定极值分布函数属于Frechet极值吸收域。需要说明的是,由于无法准确计算出
Figure BDA0003875737680000123
的具体数值大小。因此,可以采用历史任务量极值数据的经验分布函数的数据频率衰减速度进行近似估计。其中,L(x)为缓变化函数,其定义为若x→+∞时,对任意t>0,满足L(tx)/L(x)→1。在确定极大值吸收域的过程中,无需确定
Figure BDA0003875737680000124
的具体数值,仅需观测历史任务量极值数据的经验分布函数的数据频率衰减速度,是否近似符合x的指数次幂乘以缓变化函数的下降趋势即可。
示例性的,若历史任务量极值数据存在上界X,且历史任务量极值数据满足x≤X,并且尾部分布函数满足
Figure BDA0003875737680000125
则可以确定极值分布函数属于Weibull极值吸收域。同样,由于无法准确计算出
Figure BDA0003875737680000126
的具体数值大小,因此,采用历史任务量极值数据的经验分布函数的数据频率衰减速度进行近似估计。仅需观测历史任务量极值数据的经验分布函数的数据频率衰减速度,是否近似符合x的指数次幂乘以缓变化函数L(x)的下降趋势即可。
示例性的,对于既不符合Frechet极值吸收域特性,也不符合Weibull极值吸收域特性的历史任务量极值数据,则可以直接归类为属于Gumbel极值吸收域。
在确定历史任务量极值数据属于的极大值吸收域的基础上,将该属于的极大值吸收域所对应的分布函数,确定为极值分布函数。
本可选实施例方案通过检测历史任务量极值数据的极值数据频率衰减特征,并根据各分布函数对应的极大值吸收域与极值数据频率衰减特征的匹配结果,确定极值分布函数,实现了对极值分布函数的准确确定,从而提高了对后续任务量极值数据的预测准确度,进而提高了对任务调整配置信息的确定准确度。
可以理解的是,为进一步提高对极值分布函数中参数的估计值的确定准确度,可以采用检测极值分布函数中参数的第一局部最优解,并基于第一局部最优解,迭代更新极值分布函数对应的密度函数的数值的方式,对极值分布函数中参数的估计值进行确定。
在一个可选实施例中,根据第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到极值分布函数中参数的估计值,包括:根据第一时间段的历史任务量极值数据和所述极值分布函数,检测极值分布函数中参数的第一局部最优解;根据第一局部最优解更新极值分布函数;根据第一时间段的历史任务量极值数据,计算更新后的极值分布函数对应的密度函数的数值;以更新后的极值分布函数对应的密度函数取最大值为目标,迭代更新参数的数值,直至更新后的极值分布函数对应的密度函数的数值最大,并将当前时刻下参数的数值,确定为参数的第一全局最优解,并作为极值分布函数中参数的估计值。
极值分布函数的参数的估计值可以分为两次检测,第一次检测得到的估计值为第一局部最优解,第二次检测得到的估计值为第一全部最优解。同时,第二次检测得到的估计值是将第一次检测得到的估计值作为初值,迭代更新得到。
在确定极值分布函数后,通过确定并不断更新极值分布函数对应的密度函数的数值的方式,更新极值分布函数中参数的估计值。其中,密度函数的数值可以是极大似然估计值。通过不断更新参数的数值的方式,使得密度函数的极大似然值取到最大值,并将在极大似然值取到最大值时对应的参数的数值,作为参数的第一全局最优解,从而将参数的第一全局最优解作为极值分布函数中参数的估计值。
需要说明的是,通常通过密度函数的极大似然估计的方式确定参数的全局最优解时,由于计算机根据梯度变化寻找最优点的计算机制,往往只能获得局部最优解。这种计算机机制的原理是先对参数的数值赋予初值,然后不断对参数进行微小的数值改变,观察参数改变对极大似然值的影响,也即梯度变化量,根据梯度变化量决定参数变化的趋势,直至最终参数达到局部最优解。因此,可以采用上述计算机制,确定极值分布函数中参数的第一局部最优解。其中,第一局部最优解可以是相对接近全局最优解的初值。可选的,极值分布函数中参数的第一局部最优解还可以由相关技术人员根据实际经验值或实验值进行人为设定。
可以理解的是,不同类型的极值分布含住对应的密度函数不同。针对Frechet型极值分布函数,其对应的密度函数的函数形式可以如下:
Figure BDA0003875737680000141
其中,n表示历史任务量极值数据的数量;例如,历史任务量极值数据为历史时间段下360个月的任务量极值数据,则n的取值为360。ξ为极值分布函数中的参数。Mi为历史任务量极值数据,其中,i为历史任务量极值数据的月份标识。
以确定的极值分布函数为Frechet型极值分布函数为例进行举例说明。根据前述Frechet型极值分布函数的函数公式可知,Frechet型极值分布函数的参数可以为ξ。示例性的,通过确定的第一局部最优解,更新极值分布函数;根据更新后的极值分布函数,输入历史任务量极值数据,计算更新后的极值分布函数对应的密度函数的极大似然值,直到函数密度的极大似然值达到最大。将极大似然值达到最大时对应的参数ξ的数值,作为参数ξ的第一全局最优解,并将第一全局最优解作为Frechet型极值分布函数中参数ξ的估计值。同理,针对其他类型的极值分布函数,可以采用与上述相同的方式对参数的估计值进行确定,本实施例对此不再进行赘述。
本可选实施例方案通过确定极值分布函数中参数的第一局部最优解,更新极值分布函数,计算更新后的极值分布函数对应的密度函数的数值,并根据该数值不断更新参数的数值,直到得到参数的第一全局最优解,上述方案实现了对极值分布函数中参数的估计值的准确确定,从而提高了对极值分布函数的更新准确度,进而提高了对任务量极值的预测准确度。
需要说明的是,通过梯度变化决定参数变化的趋势,确定参数的第一局部最优解的方式,其估计结果受参数初值设定的影响较大,不同参数初值的设定可能得到不同的极大似然估计结果。因此,在进行极大似然估计之前,可以采用精度评估法和信息熵法,对相对接近全局最优解的初值进行准确确定,从而进一步提高第一全局最优解的确定准确度和确定效率。
在一个可选实施例中,根据第一时间段的历史任务量极值数据和极值分布函数,检测极值分布函数中参数的第一局部最优解,包括:根据第一时间段的历史任务量极值数据和极值分布函数,计算极值目标函数的数值,极值目标函数包括信息熵函数或样本差值函数;以极值目标函数取最大值为目标,迭代更新参数的数值,直至极值目标函数的数值最大,并将当前时刻下参数的数值,确定为极值分布函数中参数的第一局部最优解。
需要说明的是,精度评估法和信息熵法对于设定的参数初值并不敏感,在参数更新迭代的过程中更容易收敛到局部最优解。其中,样本差值函数可以为精度评估法对应的极值目标函数;信息熵函数可以为信息熵法对应的极值目标函数。在对第一局部最优解进行确定的过程中,可以从精度评估法和信息熵法中任意选取一种方法确定第一局部最优解。
示例性的,若选取精度评估法确定第一局部最优解,相应的,极值目标函数为样本差值函数。将历史任务量极值数据{Mi}按次序从小到大进行排列,并根据次序排序结果,先后计算得到{Mi}对应的分位点值{Qi}。若对应的极值分布函数为Hξ(x),则根据极值分布函数Hξ(x)和分为点值{Qi},得到历史任务量极值数据的逆数据{Mi′}。其中,
Figure BDA0003875737680000161
样本差值函数的函数形式如下:
Figure BDA0003875737680000162
其中,n表示历史任务量极值数据的数量;Mi为历史任务量极值数据;Mi′为历史任务量极值数据的逆数据;i为历史任务量极值数据的月份标识。
示例性的,通过不断迭代更新极值分布函数的参数ξ的数值,直到样本差值函数R的数值达到最大,并将当前时刻下,R达到最大值时对应的参数ξ的数值ξ0,确定为极值分布函数中参数ξ的第一局部最优解。
示例性的,若选取信息熵法确定第一局部最优解,相应的,极值目标函数为信息熵函数。将历史任务量极值数据{Mi}按次序从小到大进行排列,并根据次序排序结果,先后计算得到{Mi}对应的分位点值{Qi}。若对应的极值分布函数为Hξ(x),则根据极值分布函数Hξ(x)确定历史任务量极值数据{Mi}的极值预测值{Hξ(Mi)}。根据分位点值{Qi}和极值预测值{Hξ(Mi)}构建信息熵函数。构建的信息熵函数形式如下:
Figure BDA0003875737680000163
其中,n表示历史任务量极值数据的数量;Mi为历史任务量极值数据;Qi为Mi对应的分位点值;i为历史任务量极值数据的月份标识。
需要说明的是,在构建的信息熵函数中,对Qi和Hξ(x)取三次方的目的是在现实中的信息量往往不是均匀变化的,而是服从边际效益递减或者边际损益递增的特性,这种特性与立方函数的变化规律更为贴近,可以使函数预测结果与实际结果更加贴合。
示例性的,通过不断迭代更新极值分布函数的参数ξ的数值,直到信息熵函数I的数值达到最大,并将当前时刻下,I达到最大值时对应的参数ξ的数值ξ1,确定为极值分布函数中参数ξ的第一局部最优解。
相应的,可以通过采用上述方式得到的参数的数值ξ0或ξ1,对极值分布函数对应的密度函数的极大似然值进行不断迭代更新,直到密度函数的极大似然值达到最大,得到相应的极值分布函数中参数的估计值。
本可选实施例通过根据第一时间段的历史任务量极值数据和极值分布函数计算极值目标函数的数值,并根据目标函数的数据迭代更新参数的数值的方式,实现了对极值分布函数中参数的第一局部最优解的准确确定,从而提高了对极值分布函数的更新准确度,进而提高了对极值分布函数参数估计值的确定准确度和确定效率。
S230、根据极值分布函数中参数的估计值,对极值分布函数进行更新。
示例性的,可以采用确定的极值分布函数中参数的估计值,对极值分布函数进行更新,得到更新参数后的极值分布函数。
S240、采用更新的极值分布函数,获得第二时间段的预测值数据。
示例性的,通过更新的极值分布函数,对第二时间段的任务量极值进行预测,得到第二时间段的预测值数据。其中,预测值数据的数量可以由相关技术人员根据实际需求进行预先设定。例如,可以通过更新的极值分布函数,获取未来三个月的预测值数据。
需要说明的是,在统计学中,样本数量超过30即可视为大样本,本发明中由于每月可得30个左右的日观测数据,即样本数量不小于30,因此,本发明的历史任务量均值数据和历史任务量极值数据对应的样本数量满足统计大样本性质规定,可以近似认为历史任务量均值数据和历史任务量极值数据服从极限分布函数,采用极值理论模型是合适的。
S250、根据第二时间段的预测值数据,检测多个分位点值,确定为第二时间段的预测任务量极值数据。
其中,预测值数据可以是由极值分布函数预测得到的在第二时间段内的极值预测值。例如,若第二时间段为未来10个月,则相应的预测值数据可以包括未来10个月中,每个月对应的最高单日任务量,以及最高单日任务量对应的时间日期。例如,未来10个月中的X月的最高单日任务量为30件,对应的时间日期为X月y日。
需要说明的是,更新得到的极值分布函数可以用于预测极端风险,具体可以通过极值分布函数预测得到的第二时间段的预测值数据,检测多个分位点下的分位点值,从而根据多个分位点值,确定最高分位点值,根据最高分位点值,生成相应的风险防控线。分位点是指将一个随机变量的概率分布范围分为几个等份的数值点。分位点值是指该数值点的数值。其中,多个分位点可以由相关技术人员进行预先设定。例如,可以设置0.90至0.99区间内的10个点作为分位点,其对应的分位点值可以采用VaRα表示,其中α为置信度,也表示前面的分位点,分位点值表明超过该分位点值的概率是该分位点,即超过VaRα的概率是α。0.90至0.99区间内的10个分位点对应的分位点值可以分别为VaR0.90、VaR0.91、VaR0.92、……、VaR0.98和VaR0.99。例如,VaR0.95即表示0.95分位点处的分位点值,表示是预测值数据中第i个月的任务量极值Mi超过该分位点值的概率为95%。
示例性的,可以根据对多个分位点值的检测结果,生成相应的风险防控线,用于后续的预测风险评估。示例性的,假设预测得到企业某月的VaR0.91=100,表明未来任务量极值超过100的概率为91%,由此,可以依据该情况,企业提前进行风险防控布局,实现基于预测任务量极值数据辅助确定进行风险防控方式。风险防控方式可以由相关技术人员进行预先设定。例如,适当增加相应的任务执行人员数量。此外,还可以根据企业对风险的偏好程度,自由选择自身可承受的风险预警线,例如,预测得到的不同分位点值为VaR0.99=150、VaR0.95=120、VaR0.91=100,如果企业是风险厌恶型,非常害怕出现人力不足生产崩溃的局面,它就可以选择低置信度的风险控制线VaR0.91作为调整工作量增派人手的预警线;如果其为风险厌温和型,风险承受度一般,就可以用VaR0.95作为预警线;若为风险喜好型,对自己团队的工作抗压能力非常有信心,则可以选择VaR0.99作为风险预警线。
可以理解的是,由于分位点值是基于极值分布函数预测的第二时间段的预测值数据进行确定的,导致分位点值对应的风险控制线可能相对于第二时间段的真实值数据存在一定的偏差。因此,可以通过确定分位点值的偏离程度,也即风险控制线的偏离程度,进一步对后续未来时间段的任务调整进行评估和/或指导。
在一个可选实施例中,在根据第二时间段的预测值数据,检测多个分位点值,确定为第二时间段的预测任务量极值数据之后,还包括:获取第二时间段的真实任务量极值数据;针对每个分位点值,在真实任务量极值数据中统计大于分位点值的真实任务量极值的数量;计算数量与真实任务量极值数据的总数的比值;根据比值,计算分位点值的偏离程度;将分位点值的偏离程度,添加到第二时间段的预测任务量极值数据中。
真实任务量极值数据可以是指采集得到的真实的任务量。真实任务量极值数据对应的日期属于第二时间段。需要说明的是,第二时间段的真实任务量极值数据需要与第二时间段的预测任务量极值数据对应的时间日期相对应。例如,预测得到了2022年7月至2022年9月的预测任务极值数据,则相应的真实任务量极值数据可以为在实际到达2022年7月时得到的7月任务量极值、在实际到达2022年8月时得到的8月任务量极值以及在实际到达2022年9月时得到的9月任务量极值。
确定真实任务量极值数据中,大于分位点值的真实任务量极值的数量,以及计算该数量与真实任务量极值数据的总数之间的比值。示例性的,以分位点值VaR0.9为例,将真实任务量极值与分位点值VaR0.9进行对比,确定真实任务量极值中,大于分位点值VaR0.9的真实任务量极值的数量,并确定该数量与真实任务量极值数据的总数的比值。例如,若真实任务量极值的总数为10个,大于分位点值VaR0.9的真实任务量极值的数量为7个,则确定的比值结果为70%。通过比值可以确定分位点值的偏离程度。其中,分位点值的偏离程度可以采用如下方式进行确定:
Figure BDA0003875737680000201
其中,rvar表示分位点值的偏离程度,rover表示真实任务量极值数据中大于分位点值的真实任务量极值的数量,与真实任务量极值数据的总数的比值;α为预设的理论越级比例。其中,α的值可以由相关技术人员根据实际经验值或实验值进行预先设定,例如,α可以为10%。其中,分位点值的偏离程度能够反映分位点值与理论越级比例之间的偏离度。偏离程度可以检测预测值与真实值之间的误差,以确定预测值的准确性,也可以作为极值分布函数的预测准确性,并以此继续调整参数的估计值,更新极值分布函数,以使极值分布函数的预测值更准确。
本可选实施例通过针对每个分位点值,确定真实任务量极值数据中统计大于分位点值的真实任务量极值的数量,与真实任务量极值数据的总数的比值,并根据比值,确定分位点值的偏离程度,实现了对分位点值的偏离程度的准确确定。通过将偏离程度添加至预测任务量极值数据中,能够便于后续更加准确度的对未来时间段的任务量进行调整配置,能够作为任务量调整策略的指导依据。
S260、根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据。
S270、根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。
本实施例方案通过确定极值分布函数中参数的估计值,对极值分布函数进行更新的方式,提高了极值分布函数的准确度。通过采用更新的极值分布函数,获得第二时间段的预测值数据,提高了对第二时间段的预测值数据的预测准确度。通过第二时间段的预测值数据,结合检测多个分位点值,产生相应的风险防控线,能够通过风险防控线达到在风险防控和防控成本之间取得平衡的目的。通过检测多个分位点值,确定预测任务量极值数据,用于后续对风险评估和压力预警,以便能够提前进行铺排工作的准备。
实施例三
图3A为本发明实施例三提供的一种任务处理方法的流程图,本实施例在上述各技术方案的基础上,进行了优化改进。
进一步的,将步骤“根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据”,细化为“根据第一时间段的历史任务量均值数据,和均值分布函数对应的密度函数,得到均值分布函数中参数的估计值;根据均值分布函数中参数的估计值,对均值分布函数进行更新;采用更新的均值分布函数,获得第二时间段内多个单元时间段的预测均值分布置信区间,并作为第二时间段的预测任务量均值数据。”以完善对第二时间段的预测任务量均值数据的获取方式。
如图3A所示,该方法包括以下具体步骤:
S310、获取第一时间段的历史任务量均值数据和历史任务量极值数据。
S320、根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据。
S330、根据第一时间段的历史任务量均值数据,和均值分布函数对应的密度函数,得到均值分布函数中参数的估计值。
其中,均值分布函数用于对第二时间段内的任务量均值进行预测。均值分布函数可以由相关技术人员进行预先设定,例如,均值分布函数可以是高斯混合模型。
其中,均值分布函数的密度函数用于计算均值分布函数中的极大似然值,极大似然值用于对均值分布函数中参数的估计值进行确定。其中,均值分布函数中参数的估计值能够表征均值分布函数的预测结果的优劣。对参数的估计值确定精确度越高,均值分布函数的预测结果越优。
其中,高斯混合模型可以是将不同的正太分布函数通过加权组合形成一种新型的混合分布函数,其函数形式如下:
Figure BDA0003875737680000221
其中,θ1,…,θm表示权重参数;
Figure BDA0003875737680000222
Fj(x)是均值为μj方差为
Figure BDA0003875737680000223
的正态分布函数,其对应的密度函数g(x)的函数形式如下:
Figure BDA0003875737680000224
需要说明的是,采用上述高斯混合模型的原因在于对于每个正态分布的密度函数都是单峰的对称分布,将多个单峰分布加权组合形成多峰密度几乎可以近似拟合任何形状的密度函数,达到无限趋近实际密度的效果。
示例性的,可以采用高斯混合模型,根据第一时间段的历史任务量均值数据,基于均值分布函数对应的密度函数,确定极大似然值达到最大值时均值分布函数中参数的参数值,并将该参数值确定为均值分布函数中参数的估计值。
可以理解的是,为进一步提高对均值分布函数中参数的估计值的确定准确度,可以采用检测均值分布函数中参数的第二局部最优解,并基于第二局部最优解,迭代更新均值分布函数对应的密度函数的数值的方式,对均值分布函数中参数的估计值进行确定。
在一个可选实施例中,根据第一时间段的历史任务量均值数据,和均值分布函数对应的密度函数,得到均值分布函数中参数的估计值,包括:根据第一时间段的历史任务量均值数据和均值分布函数,检测均值分布函数中参数的第二局部最优解;根据第二局部最优解更新均值分布函数;根据第一时间段的历史任务量均值数据,计算更新后的均值分布函数对应的密度函数的数值;以更新后的均值分布函数对应的密度函数取最大值为目标,迭代更新参数的数值,直至更新后的均值分布函数对应的密度函数的数值最大,并将当前时刻下参数的数值,确定为参数的第二全局最优解,并作为均值分布函数中参数的估计值。
均值分布函数的参数的估计值可以分为两次检测,第一次检测得到的估计值为第二局部最优解,第二次检测得到的估计值为第二全部最优解。同时,第二次检测得到的估计值是将第一次检测得到的估计值作为初值,迭代更新得到。
在确定均值分布函数后,通过确定并不断更新均值分布函数对应的密度函数的数值的方式,更新均值分布函数中参数的估计值。其中,密度函数的数值可以是极大似然估计值。通过不断更新参数的数值的方式,使得密度函数的极大似然值取到最大值,并将在极大似然值取到最大值时对应的参数的数值,作为参数的第二全局最优解,从而将参数的第二全局最优解作为均值分布函数中参数的估计值。
其中,第二局部最优解可以采用与上述确定第一局部最优解相同的方式进行准确确定。例如可以采用精度评估法或信息熵法进行第二局部最优解的确定。
示例性的,可以根据第一时间段的历史任务量均值数据和均值分布函数,计算均值目标函数的数值,均值目标函数包括信息熵函数或样本差值函数;以均值目标函数取最大值为目标,迭代更新参数的数值,直至均值目标函数的数值最大,并将当前时刻下参数的数值,确定为均值分布函数中参数的第二局部最优解。其中,样本差值函数可以为精度评估法对应的均值目标函数;信息熵函数可以为信息熵法对应的均值目标函数。在对第二局部最优解进行确定的过程中,可以从精度评估法和信息熵法中任意选取一种方法确定第二局部最优解。
其中,高斯混合模型对应的密度函数的函数形式如下:
Figure BDA0003875737680000241
其中,
Figure BDA0003875737680000242
为历史任务量均值数据;i为历史任务量均值数据的月份标识;n为历史任务均值数据的数据量;θ1,…,θm为权重参数;μi为均值;
Figure BDA0003875737680000243
为方差。
示例性的,在采用第二局部最优解更新得到均值分布函数后,根据第一时间段的历史任务量均值数据,计算更新后的均值分布函数对应的密度函数的数值。其中,密度函数的数值可以是极大似然值,当极大似然值达到最大时,将当前时刻下的参数θ、μ和σ2对应的数值,确定为参数的第二全局最优解,并作为均值分布函数中参数的估计值。
本可选实施例方案通过确定均值分布函数中参数的第二局部最优解,更新均值分布函数,计算更新后的均值分布函数对应的密度函数的数值,并根据该数值不断更新参数的数值,直到得到参数的第二全局最优解,上述方案实现了对均值分布函数中参数的估计值的准确确定,从而提高了对均值分布函数的更新准确度,进而提高了对任务量均值的预测准确度。
S340、根据均值分布函数中参数的估计值,对均值分布函数进行更新。
示例性的,可以采用确定的均值分布函数中参数的估计值,对均值分布函数进行更新,得到更新参数后的均值分布函数。
S350、采用更新的均值分布函数,获得第二时间段内多个单元时间段的预测均值分布置信区间,并作为第二时间段的预测任务量均值数据。
其中,单元时间段可以由相关技术人员预先设定,例如,单元时间段可以是以天为维度的周期时间段,也可以是以月为维度的周期时间段。例如,第二时间段内的多个单元时间段可以是未来三天,也可以是未来三个月。
其中,预测均值分布置信区间可以通过均值分布函数对第二时间段内的任务量均值的预测结果,并结合与预设分位点相应的分位点值确定得到。其中,分位点可以由相关技术人员根据实际需求进行预先设定,例如可以是10%和90%分位点,在10%和90%分位点处的分位点值可以分别记为Q0.1和Q0.9。其中,分位点值Q0.1和Q0.9可以通过均值分布函数对第二时间段内的任务均值的预测结果确定得到。其中,Q0.1为预测均值分布置信区间的下半边界,Q0.9为预测均值分布置信区间的上半边界。
示例性的,若第二时间段为未来3个月,单元时间段为以月为维度的周期时间段,且分别为A月份、B月份和C月份。通过均值分布函数对月份A的任务量均值预测结果可以得到,月份A在分位点10%下的分位点值Qa0.1,以及在分位点90%下分位点值Qa0.9,对应的预测均值分布置信区间为[Qa0.1,Qa0.9]。同理可以得到月份B对应的预测均值分布置信区间为[Qb0.1,Qb0.9],以及月份C对应的预测均值分布置信区间为[Qc0.1,Qc0.9]。可以将[Qa0.1,Qa0.9]、[Qb0.1,Qb0.9]以及[Qc0.1,Qc0.9]作为第二时间段的预测任务量均值数据。
可以理解的是,预测均值分布置信区间可以用于评估工作量均值的波动程度和趋势走向,因此,为进一步确定预测的工作量均值结果的准确性,还可以采用第二时间段内的真实任务量均值数据,对预测结果准确度进行进一步评估。
在一个可选实施例中,在获得第二时间段内多个单元时间段的预测均值分布置信区间之后,还包括:获取第二时间段的真实任务量均值数据;将真实任务量均值数据与各单元时间段的预测置信区间的端点进行比较;根据比较结果,对均值分布函数中参数的数值进行调整;基于调整后的均值分布函数,更新第二时间段的预测任务量均值数据。
其中,预测置信区间为预测均值分布置信区间,其端点可以包括预测均值分布置信区间的上半边界和下半边界。
若接近上半边界的真实任务量均值数据的数量较多,则可以认为对均值分布函数中参数的数值估值较小,可以适应性的增大对参数的数值估值,例如,可以在当前参数的数值基础上增加0.01;若接近下半边界的真实任务量均值数据的数量较多,则可以认为对均值分布函数中参数的数值估值较大,可以适应性的减小对参数的数值估值,例如,可以在当前参数的数值基础上减小0.01。
需要说明的是,相对于采用第二局部最优解对均值分布函数的参数的数值进行调整而言,此处对均值分布函数中参数的数值进行调整的调整幅度相对较小,可以认为是对参数的数值的微调整,从而确保均值分布函数在参数的数值微调基础上的预测准确度更高。
在一个具体实施例中,若单元时间段为以天为维度的周期时间段,第二时间段为未来三天,相应的,若未来三天分别为A日、B日和C日,对应的真实任务量均值分别为12、16和29;A日对应的预测置信区间为[15,19],B日对应的预测置信区间为[14,17],C日对应的预测置信区间为[23,30]。则将A日的真实任务量均值12与A日对应的预测置信区间[15,19]的端点进行比较,可以确定A日的真实任务量均值更接近于预设置信区间的下半边界15;将B日的真实任务量均值16与B日对应的预测置信区间[14,17]的端点进行比较,可以确定B日的真实任务量均值更接近于预设置信区间的上半边界17;将C日的真实任务量均值29与C日对应的预测置信区间[23,30]的端点进行比较,可以确定C日的真实任务量均值更接近于预测置信区间的下半边界30。因此,可以确定3个真实任务量均值中有1个更接近于区间的下半边界,2个更接近于q区间的上半边界,可以确定整体预测结果更偏重于上半边界,表示对均值分布函数中参数的数值估值较小,可以适当的增大参数的数值,例如,在参数当前的数值上增加0.01。
可选的,还可以通过真实任务量均值数据与各单元时间段的预测置信区间的端点进行比较的比较结果,确定真实任务量均值数据落入预测置信区间的数量,从而确定真实任务量均值数据落入预测置信区间的比例。
延续上例,可以确定A日、B日和C日对应的真实任务量均值中,有2个落入相应的预测置信区间,分别为B日和C日;仅有1个A日的真实任务量均值未落入相应的预测置信区间。因此,可以确定真实任务量均值数据落入预测置信区间的比例rin=2/3=66.7%。
本可选实施例方案通过根据真实任务量均值数据与各单元时间段的预测置信区间的端点的比较结果,对均值分布函数中参数的数值进行微调整,实现了对均值分布函数的进一步优化,从而提高了均值分布函数对第二时间段的预测任务量均值数据的预测准确度。
可以理解的是,为进一步对任务量相关业务的景气度进行评判,从而能够对工作任务量进行合理铺排,还可以对单元时间段内的任务均值梯度进行确定。其中,任务均值梯度的变化能够作为景气度强度的评价依据。因此,可以通过确定任务均值梯度的变化,对景气度强度进行评判。
在一个可选实施例中,在获得第二时间段内多个单元时间段的预测均值分布置信区间之后,还包括:获取各单元时间段内的真实单元均值数据;根据各单元时间段内的真实单元均值数据与对应预测均值分布置信区间的端点之间差值和各单元时间段的预测均值分布置信区间的区间长度,计算各单元时间段内的任务均值梯度;将各单元时间段内的任务均值梯度,添加到第二时间段的预测任务量均值数据中。
其中,任务均值梯度能够反映业务景气度;若任务均值梯度变化始终为正,则可以表示业务景气度为上扬趋势;若任务均值梯度变化始终为负,则可以表示业务景气度为下降趋势。通过各单元时间段内的任务均值梯度之间的梯度变化,还可以进一步确定业务景气度的提升速度或下降速度。
其中,任务均值梯度的确定方式可以如下:
Figure BDA0003875737680000271
其中,l表示真实单元均值距离其对应的预测均值分布置信区间的下半边界的距离;w表示预测均值分布置信区间的区间宽度;其中,n表示第n个单元时间段。
示例性的,若存在三个单元时间段分别为A日、B日和C日,A日的真实单元均值为12、B日的真实单元均值为16以及C日的真实单元均值为29。其中,A日对应的预测均值分布置信区间为[15,19]、B日对应的预测均值分布置信区间为[14,17]以及C日对应的预测均值分布置信区间为[23,30]。A日的真实单元均值12距离其区间[15,19]的下半边界15的距离为-3;B日的真实单元均值16距离其区间[14,17]的下半边界14的距离为2;C日的真实单元均值29距离其区间[23,30]的下半边界23的距离为6。根据任务均值梯度Tn的计算公式,可以确定单元时间段A日与单元时间段B日之间的任务均值梯度为T2,以及单元时间段B日与单元时间段C日之间的任务均值梯度为T3,其中,T2和T3的确定方式如下:
Figure BDA0003875737680000281
Figure BDA0003875737680000282
根据确定的T2和T3的值可以看出任务均值梯度的变化始终为正,业务景气度有上扬趋势。但T3<T2,标识景气度的提升速度在放缓,未来增长预期有限。
可选的,相关技术人员可以根据各单元时间段内的任务均值梯度,预先部署相应的任务调整策略。例如,若任务均值梯度的变化趋势增长较快,则可以立刻执行任务调整策略,例如,任务调整策略可以是增派更多工作人员等。若任务均值梯度的变化趋势增长较缓,则可以稍缓执行相应的任务调整策略。
本可选实施例通过根据各单元时间段内的真实单元均值数据与对应预测均值分布置信区间的端点之间差值和各单元时间段的预测均值分布置信区间的区间长度,计算各单元时间段内的任务均值梯度,实现了对业务景气度的评估,能够作为现实业务场景和均值分布函数调节的指导依据。
S360、根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。
对于确定的预测任务量均值数据和预测任务量极值数据,可以相结合后用于对现实业务场景的分析。
在一个可选实施例中,根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息,包括:根据预测任务量均值数据,确定第二时间段的任务量变化趋势,调整作业任务的用户数以适配任务量变化趋势;根据预测任务量极值数据,确定第二时间段的任务量风险防控方式;基于调整后的用户数和任务量风险防控方式,确定第二时间段的任务调整配置信息。
示例性的,针对预测任务量均值数据,其可以作为日常工作量整体强度的基础评估依据。通过对比历史时间段的任务量均值数据和预测任务量均值数据,可以观测到任务量均值的整体变化趋势,即变化趋势是向上增加还是向下降低,从而确定相应的调整策略,通过调整作业任务的用户数以适配任务量变化趋势。例如,当任务量变化处于向上增长的趋势时,增派执行作业任务的用户数量;当任务量变化处于向下降低的趋势时,减少执行作业任务的用户数量。
示例性的,针对预测任务极值数据,可以通过确定的分位点值确定相应的风险控制线。可以根据实际需求,选取自身能够承受的风险控制极限进行风险防控。风险防控的成本较高,对风险防控投入成本越高,面临的风险越小,但无法将风险防控至无。因此,可以选择自身能够承受的风险极限,部署相应的任务量风险防控措施,以及投入相应的防控成本即可。
具体的,将预测任务量均值数据作为一般性正常任务量变化的分析依据,并将预测任务极值数据作为风险控制的分析依据,构成完整的评估预测体系。
调整后的用户数和任务量风险防控方式,可以作为第二时间段的任务调整配置信息。可选的,任务调整配置信息中还可以包括确定的分位点值的偏离程度、任务均值梯度以及真实任务量均值数据落入预测置信区间的比例等。
示例性的,可以将预测任务量极值数据、预测任务量均值数据、调整后的用户数、任务量风险防控方式、分位点值的偏离程度、任务均值梯度以及真实任务量均值数据落入预测置信区间的比例等整合到一起形成预测评估报告,可以用作对现实业务场景的指导依据。
本可选实施例方案通过确定第二时间段的任务量变化趋势,调整作业任务的用户数以适配任务量变化趋势,以及通过预测任务量极值数据,确定第二时间段的任务量风险防控方式,可以对现实业务场景进行任务量调整指导,能够通过对风险评估和压力预警,提前进行铺排任务量工作准备。
在一个具体实施例中,如图3B所示的一种任务处理方法的结构示意图。收集企业客户过去三十年的每日工作任务量数据并进行数据清洗,汇总整理得到每月最高单日工作量(月度最高单日任务件数)和每月平均日工作量(月度日平均任务件数)两个指标数据集。
对每月最高单日工作量数据集分析其尾部分布特性,寻找对应极值吸收域,采用Block-Maximum模型,进行拟合估计,估计方法为精度评估法或信息熵法计算参数初值,然后基于初值计算极大似然估计,对拟合好的Block-Maximum模型,预测其风险控制线VaRα
对每月平均日工作量数据集采用Gaussian-Mixture模型,进行拟合估计,估计方法为两阶段参数估计法,先采用精度评估法或信息熵法计算参数初值,再基于初值计算获得极大似然估计,对拟合好的Gaussian-Mixture模型,预测未来月度日平均工作量的置信区间。
将前两步中预测得到的风险控制线VaRα和未来月度日平均工作量的置信区间结合,应用于现实业务场景分析。风险控制线用于作为未来调整任务量的处理策略的风险预警,配套防控风险措施铺排;未来月度日平均工作量的置信区间用于日常工作量整体强度的基础评估依据,对比过去各个月数据,评估工作量整体的变化趋势。
本实施例方案通过均值分布函数中参数的估计值,对均值分布函数进行更新的方式,提高了均值分布函数的准确度。通过采用更新的均值分布函数,获得第二时间段内多个单元时间段的预测均值分布置信区间,便于后续通过预测均值分布置信区间,对未来时间段的任务量均值进行评估,从而能够提前进行相应的人员部署和调离。此外,后续还可以通过预测均值分布置信区间和真实任务量均值数据,对均值分布函数的参数数值进行调整,从而进一步的提高均值分布函数的预测准确度。
需要说明的是,本发明技术方案中对数据的获取、存储、使用和处理等均符合国家法律法规的相关规定。
实施例四
图4为本发明实施例四提供的一种任务处理装置的结构示意图。本发明实施例所提供的一种任务处理装置,该装置可适用于对未来周期内的工作任务量进行预测的情况,该任务处理装置可以采用硬件和/或软件的形式实现,如图4所示,该装置具体包括:历史任务量获取模块401、任务量极值预测模块402、任务量均值预测模块403和任务配置确定模块404。其中,
历史任务量获取模块401,用于获取第一时间段的历史任务量均值数据和历史任务量极值数据;
任务量极值预测模块402,用于根据所述第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;
任务量均值预测模块403,用于根据所述第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;
任务配置确定模块404,用于根据所述预测任务量均值数据和所述预测任务量极值数据,确定所述第二时间段的任务调整配置信息。
本发明实施例通过根据第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;根据第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;根据预测任务量均值数据和预测任务量极值数据,确定第二时间段的任务调整配置信息。上述方案通过从任务量极值和任务量均值两个维度进行预测,并整合与指示未来时间周期的任务配置策略,可以精准的预测未来任务量的变化情况,辅助用户及时应对未来任务量,减少极端风险和压力,提高任务处理的稳定性,从而有效避免遇到紧急情况难以及时应对而导致的任务压力剧增或资源浪费的情况发生。
可选的,所述任务量极值预测模块402,包括:
第一估计值确定单元,用于根据所述第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到所述极值分布函数中参数的估计值;
极值分布函数更新单元,用于根据所述极值分布函数中参数的估计值,对所述极值分布函数进行更新;
预测值数据确定单元,用于采用更新的极值分布函数,获得第二时间段的预测值数据;
任务量极值预测单元,用于根据所述第二时间段的预测值数据,检测多个分位点值,确定为所述第二时间段的预测任务量极值数据。
可选的,所述任务量极值预测模块402,还包括:
频率衰减特征检测单元,用于在根据所述第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到所述极值分布函数中参数的估计值之前,根据所述第一时间段的历史任务量极值数据,检测所述历史任务量极值数据的极值数据频率衰减特征;
特征匹配单元,用于在多个分布函数中,将各所述分布函数对应的极大值吸收引域与所述极值数据频率衰减特征进行匹配;
极值分布函数确定单元,用于根据匹配结果,在多个分布函数中,确定极值分布函数。
可选的,所述第一估计值确定单元,包括:
第一局部最优解检测子单元,用于根据所述第一时间段的历史任务量极值数据和所述极值分布函数,检测所述极值分布函数中参数的第一局部最优解;
极值分布函数更新子单元,用于根据所述第一局部最优解更新所述极值分布函数;
第一数值更新子单元,用于根据所述第一时间段的历史任务量极值数据,计算更新后的极值分布函数对应的密度函数的数值;
第一估计值确定子单元,用于以所述更新后的极值分布函数对应的密度函数取最大值为目标,迭代更新所述参数的数值,直至所述更新后的极值分布函数对应的密度函数的数值最大,并将当前时刻下所述参数的数值,确定为所述参数的第一全局最优解,并作为所述极值分布函数中参数的估计值。
可选的,所述第一局部最优解检测子单元,具体用于:
根据所述第一时间段的历史任务量极值数据和所述极值分布函数,计算极值目标函数的数值,所述极值目标函数包括信息熵函数或样本差值函数;
以所述极值目标函数取最大值为目标,迭代更新所述参数的数值,直至所述极值目标函数的数值最大,并将当前时刻下所述参数的数值,确定为所述极值分布函数中参数的第一局部最优解。
可选的,所述任务量极值预测模块402,还包括:
真实任务量数据获取单元,用于在根据所述第二时间段的预测值数据,检测多个分位点值,确定为所述第二时间段的预测任务量极值数据之后,获取所述第二时间段的真实任务量极值数据;
数量确定单元,用于针对每个所述分位点值,在所述真实任务量极值数据中统计大于分位点值的真实任务量极值的数量;
比值计算单元,用于计算所述数量与所述真实任务量极值数据的总数的比值;
偏离程度计算单元,用于根据所述比值,计算所述分位点值的偏离程度;
数据添加单元,用于将所述分位点值的偏离程度,添加到所述第二时间段的预测任务量极值数据中。
可选的,所述任务量均值预测模块403,包括:
第二估计值确定单元,用于根据所述第一时间段的历史任务量均值数据,和均值分布函数对应的密度函数,得到所述均值分布函数中参数的估计值;
均值分布函数更新单元,用于根据所述均值分布函数中参数的估计值,对所述均值分布函数进行更新;
置信区间获取单元,用于采用更新的均值分布函数,获得第二时间段内多个单元时间段的预测均值分布置信区间,并作为所述第二时间段的预测任务量均值数据。
可选的,所述第二估计值确定单元,包括:
第二局部最优解检测子单元,用于根据所述第一时间段的历史任务量均值数据和所述均值分布函数,检测所述均值分布函数中参数的第二局部最优解;
均值分布函数更新子单元,用于根据所述第二局部最优解更新所述均值分布函数;
第二数值更新子单元,用于根据所述第一时间段的历史任务量均值数据,计算更新后的均值分布函数对应的密度函数的数值;
第二估计值确定子单元,用于以所述更新后的均值分布函数对应的密度函数取最大值为目标,迭代更新所述参数的数值,直至所述更新后的均值分布函数对应的密度函数的数值最大,并将当前时刻下所述参数的数值,确定为所述参数的第二全局最优解,并作为所述均值分布函数中参数的估计值。
可选的,所述任务量均值预测模块403,还包括:
真实任务量均值获取单元,用于在获得第二时间段内多个单元时间段的预测均值分布置信区间之后,获取所述第二时间段的真实任务量均值数据;
端点比较的单元,用于将所述真实任务量均值数据与各所述单元时间段的预测置信区间的端点进行比较;
数值调整单元,用于根据比较结果,对所述均值分布函数中参数的数值进行调整;
任务量均值数据更新单元,用于基于调整后的均值分布函数,更新所述第二时间段的预测任务量均值数据
可选的,所述任务量均值预测模块403,还包括:
真实单元均值获取单元,用于在获得第二时间段内多个单元时间段的预测均值分布置信区间之后,获取各所述单元时间段内的真实单元均值数据;
任务均值梯度计算单元,用于根据各所述单元时间段内的真实单元均值数据与对应预测均值分布置信区间的端点之间差值和各所述单元时间段的预测均值分布置信区间的区间长度,计算各所述单元时间段内的任务均值梯度;
任务均值梯度添加单元,用于将各所述单元时间段内的任务均值梯度,添加到所述第二时间段的预测任务量均值数据中。
可选的,所述任务配置确定模块404,包括:
变化趋势调整单元,用于根据所述预测任务量均值数据,确定所述第二时间段的任务量变化趋势,调整作业任务的用户数以适配所述任务量变化趋势;
防控方式确定单元,用于根据所述预测任务量极值数据,确定所述第二时间段的任务量风险防控方式;
任务配置确定单元,用于基于调整后的所述用户数和所述任务量风险防控方式,确定所述第二时间段的任务调整配置信息。
本发明实施例所提供的任务处理装置可执行本发明任意实施例所提供的任务处理方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5示出了可以用来实施本发明的实施例的电子设备50的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图5所示,电子设备50包括至少一个处理器51,以及与至少一个处理器51通信连接的存储器,如只读存储器(ROM)52、随机访问存储器(RAM)53等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器51可以根据存储在只读存储器(ROM)52中的计算机程序或者从存储单元58加载到随机访问存储器(RAM)53中的计算机程序,来执行各种适当的动作和处理。在RAM 53中,还可存储电子设备50操作所需的各种程序和数据。处理器51、ROM 52以及RAM 53通过总线54彼此相连。输入/输出(I/O)接口55也连接至总线54。
电子设备50中的多个部件连接至I/O接口55,包括:输入单元56,例如键盘、鼠标等;输出单元57,例如各种类型的显示器、扬声器等;存储单元58,例如磁盘、光盘等;以及通信单元59,例如网卡、调制解调器、无线通信收发机等。通信单元59允许电子设备50通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器51可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器51的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器51执行上文所描述的各个方法和处理,例如任务处理方法。
在一些实施例中,任务处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元58。在一些实施例中,计算机程序的部分或者全部可以经由ROM 52和/或通信单元59而被载入和/或安装到电子设备50上。当计算机程序加载到RAM 53并由处理器51执行时,可以执行上文描述的任务处理方法的一个或多个步骤。备选地,在其他实施例中,处理器51可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行任务处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (15)

1.一种任务处理方法,其特征在于,包括:
获取第一时间段的历史任务量均值数据和历史任务量极值数据;
根据所述第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;
根据所述第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;
根据所述预测任务量均值数据和所述预测任务量极值数据,确定所述第二时间段的任务调整配置信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据,包括:
根据所述第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到所述极值分布函数中参数的估计值;
根据所述极值分布函数中参数的估计值,对所述极值分布函数进行更新;
采用更新的极值分布函数,获得第二时间段的预测值数据;
根据所述第二时间段的预测值数据,检测多个分位点值,确定为所述第二时间段的预测任务量极值数据。
3.根据权利要求2所述的方法,其特征在于,在根据所述第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到所述极值分布函数中参数的估计值之前,还包括:
根据所述第一时间段的历史任务量极值数据,检测所述历史任务量极值数据的极值数据频率衰减特征;
在多个分布函数中,将各所述分布函数对应的极大值吸收域与所述极值数据频率衰减特征进行匹配;
根据匹配结果,在多个分布函数中,确定极值分布函数。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一时间段的历史任务量极值数据,和极值分布函数对应的密度函数,得到所述极值分布函数中参数的估计值,包括:
根据所述第一时间段的历史任务量极值数据和所述极值分布函数,检测所述极值分布函数中参数的第一局部最优解;
根据所述第一局部最优解更新所述极值分布函数;
根据所述第一时间段的历史任务量极值数据,计算更新后的极值分布函数对应的密度函数的数值;
以所述更新后的极值分布函数对应的密度函数取最大值为目标,迭代更新所述参数的数值,直至所述更新后的极值分布函数对应的密度函数的数值最大,并将当前时刻下所述参数的数值,确定为所述参数的第一全局最优解,并作为所述极值分布函数中参数的估计值。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一时间段的历史任务量极值数据和所述极值分布函数,检测所述极值分布函数中参数的第一局部最优解,包括:
根据所述第一时间段的历史任务量极值数据和所述极值分布函数,计算极值目标函数的数值,所述极值目标函数包括信息熵函数或样本差值函数;
以所述极值目标函数取最大值为目标,迭代更新所述参数的数值,直至所述极值目标函数的数值最大,并将当前时刻下所述参数的数值,确定为所述极值分布函数中参数的第一局部最优解。
6.根据权利要求2所述的方法,其特征在于,在根据所述第二时间段的预测值数据,检测多个分位点值,确定为所述第二时间段的预测任务量极值数据之后,还包括:
获取所述第二时间段的真实任务量极值数据;
针对每个所述分位点值,在所述真实任务量极值数据中统计大于分位点值的真实任务量极值的数量;
计算所述数量与所述真实任务量极值数据的总数的比值;
根据所述比值,计算所述分位点值的偏离程度;
将所述分位点值的偏离程度,添加到所述第二时间段的预测任务量极值数据中。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据,包括:
根据所述第一时间段的历史任务量均值数据,和均值分布函数对应的密度函数,得到所述均值分布函数中参数的估计值;
根据所述均值分布函数中参数的估计值,对所述均值分布函数进行更新;
采用更新的均值分布函数,获得第二时间段内多个单元时间段的预测均值分布置信区间,并作为所述第二时间段的预测任务量均值数据。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一时间段的历史任务量均值数据,和均值分布函数对应的密度函数,得到所述均值分布函数中参数的估计值,包括:
根据所述第一时间段的历史任务量均值数据和所述均值分布函数,检测所述均值分布函数中参数的第二局部最优解;
根据所述第二局部最优解更新所述均值分布函数;
根据所述第一时间段的历史任务量均值数据,计算更新后的均值分布函数对应的密度函数的数值;
以所述更新后的均值分布函数对应的密度函数取最大值为目标,迭代更新所述参数的数值,直至所述更新后的均值分布函数对应的密度函数的数值最大,并将当前时刻下所述参数的数值,确定为所述参数的第二全局最优解,并作为所述均值分布函数中参数的估计值。
9.根据权利要求7所述的方法,其特征在于,在获得第二时间段内多个单元时间段的预测均值分布置信区间之后,还包括:
获取所述第二时间段的真实任务量均值数据;
将所述真实任务量均值数据与各所述单元时间段的预测置信区间的端点进行比较;
根据比较结果,对所述均值分布函数中参数的数值进行调整;
基于调整后的均值分布函数,更新所述第二时间段的预测任务量均值数据。
10.根据权利要求7所述的方法,其特征在于,在获得第二时间段内多个单元时间段的预测均值分布置信区间之后,还包括:
获取各所述单元时间段内的真实单元均值数据;
根据各所述单元时间段内的真实单元均值数据与对应预测均值分布置信区间的端点之间差值和各所述单元时间段的预测均值分布置信区间的区间长度,计算各所述单元时间段内的任务均值梯度;
将各所述单元时间段内的任务均值梯度,添加到所述第二时间段的预测任务量均值数据中。
11.根据权利要求1所述的方法,其特征在于,所述根据所述预测任务量均值数据和所述预测任务量极值数据,确定所述第二时间段的任务调整配置信息,包括:
根据所述预测任务量均值数据,确定所述第二时间段的任务量变化趋势,调整作业任务的用户数以适配所述任务量变化趋势;
根据所述预测任务量极值数据,确定所述第二时间段的任务量风险防控方式;
基于调整后的所述用户数和所述任务量风险防控方式,确定所述第二时间段的任务调整配置信息。
12.一种任务处理装置,其特征在于,包括:
历史任务量获取模块,用于获取第一时间段的历史任务量均值数据和历史任务量极值数据;
任务量极值预测模块,用于根据所述第一时间段的历史任务量极值数据,获得第二时间段的预测任务量极值数据;
任务量均值预测模块,用于根据所述第一时间段的历史任务量均值数据,获得第二时间段的预测任务量均值数据;
任务配置确定模块,用于根据所述预测任务量均值数据和所述预测任务量极值数据,确定所述第二时间段的任务调整配置信息。
13.一种电子设备,其特征在于,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-11中任一项所述的任务处理方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一项所述的任务处理方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-11中任一项所述的任务处理方法。
CN202211215013.1A 2022-09-30 2022-09-30 任务处理方法、装置、设备及存储介质 Pending CN115392591A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211215013.1A CN115392591A (zh) 2022-09-30 2022-09-30 任务处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211215013.1A CN115392591A (zh) 2022-09-30 2022-09-30 任务处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115392591A true CN115392591A (zh) 2022-11-25

Family

ID=84127855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211215013.1A Pending CN115392591A (zh) 2022-09-30 2022-09-30 任务处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115392591A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860575A (zh) * 2023-02-13 2023-03-28 湖南尚医康医疗科技有限公司 基于物联网的病房管理方法、系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860575A (zh) * 2023-02-13 2023-03-28 湖南尚医康医疗科技有限公司 基于物联网的病房管理方法、系统、设备及存储介质
CN115860575B (zh) * 2023-02-13 2023-05-12 湖南尚医康医疗科技有限公司 基于物联网的病房管理方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111435463A (zh) 数据处理方法及相关设备、系统
CN116307215A (zh) 一种电力系统的负荷预测方法、装置、设备及存储介质
CN115392591A (zh) 任务处理方法、装置、设备及存储介质
CN114155072B (zh) 基于大数据分析的财务预测模型构建方法及系统
CN114330102A (zh) 基于降雨相似与模型参数智能适配的快速洪水预报方法及装置
CN115453661B (zh) 气象预报方法、装置、设备以及存储介质
CN114882388A (zh) 多任务模型的训练及预测方法、装置、设备和介质
CN115859808A (zh) 一种泵组工作预测方法、装置、电子设备及存储介质
CN114662952A (zh) 一种行为数据的评价方法、装置、设备及存储介质
CN110322063A (zh) 一种耗电功率仿真预测方法及存储介质
CN113411390B (zh) 内容分发网络的调度方法、装置及电子设备
CN117112445B (zh) 一种机器学习模型稳定性检测方法、装置、设备及介质
CN116629620B (zh) 一种风险等级确定方法、装置、电子设备及存储介质
CN116703109A (zh) 一种配电网项目选取方法、装置、设备及存储介质
CN118014018A (zh) 一种楼宇能源消耗预测方法、装置、设备及存储介质
CN102129651A (zh) 一种智能确定离群点和优化显示方式的财务预测方法
CN117333054A (zh) 供水管网测点压力预测方法、装置、设备及介质
CN117235500A (zh) 物资类别的识别方法、装置、电子设备及存储介质
CN116186536A (zh) 风险预测方法、装置、电子设备及存储介质
CN115170329A (zh) 一种科技项目的投资效益评价方法
CN115983445A (zh) Pue预测方法、pue预测模型的训练方法、装置及设备
CN117851208A (zh) 一种芯片评估方法、装置、电子设备及介质
CN113742654A (zh) 企业数据推演计算系统及方法
CN117575679A (zh) 用户留存的预测方法及装置、电子设备和存储介质
CN115238811A (zh) 异常检测模型的训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination