CN118036807A - 确定业务变量值的方法、装置、设备及计算机存储介质 - Google Patents

确定业务变量值的方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN118036807A
CN118036807A CN202410181745.6A CN202410181745A CN118036807A CN 118036807 A CN118036807 A CN 118036807A CN 202410181745 A CN202410181745 A CN 202410181745A CN 118036807 A CN118036807 A CN 118036807A
Authority
CN
China
Prior art keywords
variable value
preset
value
target
service variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410181745.6A
Other languages
English (en)
Inventor
丁泽伟
左金虎
陈理华
张晓民
蔡梓超
林永锋
朱国忠
胡驰明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202410181745.6A priority Critical patent/CN118036807A/zh
Publication of CN118036807A publication Critical patent/CN118036807A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种确定业务变量值的方法、装置、设备及计算机存储介质。该方法包括:获取连续预设数量的周期内第一预设时间段的业务变量值,第一预设时间段包括从t‑k时刻到t+k时刻之间的时间段;对业务变量值进行排序,得到业务变量值序列;确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。考虑业务变量值的季节性,获取历史周期的业务变量值,去掉部分较大或较小的可能异常值,计算从第一预设位数和第二预设位数之间的业务变量值的平均值,得到预测业务变量值。既考虑了预测结果的准确性,又避免了复杂的参数调整,平衡了计算复杂度和预测精度。

Description

确定业务变量值的方法、装置、设备及计算机存储介质
技术领域
本申请属于计算机技术领域,尤其涉及一种确定业务变量值的方法、装置、设备及计算机存储介质。
背景技术
随着业务支撑系统的发展,系统愈发复杂,而对于愈发复杂的业务系统,准确预测业务变量对应的数值,并通过预测出的业务变量对应的数值消除业务中存在的异常,是时间序列异常检测的重要组成部分。想要准确的检测出业务中存在的异常值,就需要准确的预测出业务中业务变量对应的数值。
现有技术中,通常是通过传统的统计方法或者深度学习模型预测业务中的业务变量值。传统的统计方法对数据质量和初始条件选择依赖较强,通常需要对获取的历史数据进行去噪声等预处理操作,才能进行预测;但是一旦处理不当或初始条件选择不当,就会影响预测结果的准确性。而且,对于传统的统计方法能较好捕捉线性趋势,而对于非线性或者复杂模型需要进行额外处理,预测结果会更加不准确。深度学习模型相较于传统的统计方法,虽然能提高预测结果的准确性,但是训练深度学习模型需要大量的计算资源和训练时长,计算的复杂度较高。
因此,现有技术中对于业务变量值的预测方法,预测结果的准确性和计算的复杂度难以两全。
发明内容
本申请实施例提供一种确定业务变量值的方法、装置、设备及计算机存储介质,考虑业务变量值的季节性,获取历史周期的业务变量值,去掉部分较大或较小的可能异常值,计算从第一预设位数和第二预设位数之间的业务变量值的平均值,得到预测业务变量值。既考虑了预测结果的准确性,又避免了复杂的参数调整,平衡了计算复杂度和预测精度。
第一方面,本申请实施例提供一种确定业务变量值的方法,包括:
获取连续预设数量的周期内第一预设时间段的业务变量值,第一预设时间段包括从t-k时刻到t+k时刻之间的时间段;
对业务变量值进行排序,得到业务变量值序列;
确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。
在一个可能实现的实施例中,获取连续预设数量的周期内第一预设时间段的业务变量值,包括:
在连续预设数量的周期中的第一个周期内包括t-q时刻到t+k时刻的业务变量值的情况下,获取第一个周期内t-q时刻到t+k时刻的业务变量值,以及连续预设数量的周期中除第一个周期之外的周期内第一预设时间段的业务变量值,其中0≤q<k。
在一个可能实现的实施例中,在确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值之后,方法还包括:
获取连续预设数量的周期内第二预设时间段的业务变量值,第二预设时间段包括从t+1-k时刻到t+1+k时刻之间的时间段;
对第二预设时间段的业务变量值进行排序,得到第二预设时间段的业务变量值序列;
确定第二预设时间段的业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t+1时刻的第一目标业务变量值;
在确定当前周期内第三预设时间段的第一目标业务变量值的情况下,分别计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值,得到当前周期内第三预设时间段的目标残差,第三预设时间段包括从t时刻到m时刻的时间段;
计算当前周期内第三预设时间段内每个目标残差的第一分数;
在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定第一目标时刻的实际业务变量值为第二目标业务变量值,第三预设时间段包括第一目标时刻。
在一个可能实现的实施例中,在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定第一目标时刻的实际业务变量值为第二目标业务变量值之后,方法还包括:
计算第三预设时间段内确定的第二目标业务变量值的准确率和召回率;
根据准确率和召回率,确定第三预设时间内的第二分数;
调整第一预设值;
在第二分数满足预设条件的情况下,得到调整后的第一预设值;
在第二目标时刻的目标残差的第一分数大于调整后的第一预设值的情况下,确定第二目标时刻的实际业务变量值为第二目标业务变量值,第三预设时间段包括第二目标时刻。
在一个可能实现的实施例中,分别计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值,得到当前周期内第三预设时间段的目标残差,包括:
获取第一预设位数和第二预设位数的第二差值;
计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值;
确定第一差值和第二差值的比值为目标残差。
在一个可能实现的实施例中,确定第一差值和第二差值的比值为目标残差,包括:
获取偶然性常数;
选取第二差值和偶然性常数中较大的值作为归一化常数;
确定第一差值和归一化常数的比值为目标残差。
在一个可能实现的实施例中,在获取偶然性常数之前,方法还包括:
获取业务变量值对应的业务需求信息,业务需求信息包括偶然性常数的确定类型;
在偶然性常数的确定类型为第一确定类型的情况下,确定偶然性常数为预设区间内的任意一个数值;
在偶然性常数的确定类型为第二确定类型的情况下,确定偶然性常数为第二预设值;
在偶然性常数的确定类型为第三确定类型的情况下,计算业务变量值的目标百分位数,将目标百分位数对应的业务变量值作为偶然性常数。
第二方面,本申请实施例提供了一种确定业务变量值的装置,包括:
获取模块,用于获取连续预设数量的周期内第一预设时间段的业务变量值,第一预设时间段包括从t-k时刻到t+k时刻之间的时间段;
排序模块,用于对业务变量值进行排序,得到业务变量值序列;
确定模块,用于确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。
第三方面,本申请实施例提供了一种电子设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现上述任意一项的在确定业务变量值的方法。
第四方面,本申请实施例提供了一种计算机存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述任意一项的确定业务变量值的方法。
第五方面,本申请实施例提供了一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任意一项的确定业务变量值的方法。
本申请实施例的确定业务变量值的方法、装置、设备及计算机存储介质,该方法包括:获取连续预设数量的周期内第一预设时间段的业务变量值,第一预设时间段包括从t-k时刻到t+k时刻之间的时间段;对业务变量值进行排序,得到业务变量值序列;确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。如此,考虑业务变量值的季节性,获取历史周期的业务变量值,去掉部分较大或较小的可能异常值,计算从第一预设位数和第二预设位数之间的业务变量值的平均值,得到预测业务变量值。既考虑了预测结果的准确性,又避免了复杂的参数调整,平衡了计算复杂度和预测精度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的确定业务变量值的方法的流程示意图;
图2是本申请另一个实施例提供的确定业务变量值的方法的流程示意图;
图3是本申请又一个实施例提供的确定业务变量值的方法的流程示意图;
图4是本申请再一个实施例提供的确定业务变量值的方法的流程示意图;
图5是本申请再一个实施例提供的确定业务变量值的装置的结构示意图;
图6是本申请再一个实施例提供的电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着业务支撑系统的发展,系统愈发复杂,而对于愈发复杂的业务系统,准确预测业务变量对应的数值,并通过预测出的业务变量对应的数值消除业务中存在的异常,是时间序列异常检测的重要组成部分。想要准确的检测出业务中存在的异常值,就需要准确的预测出业务中业务变量对应的数值。
现有技术中,通常是通过传统的统计方法或者深度学习模型预测业务中的业务变量值。传统的统计方法对数据质量和初始条件选择依赖较强,通常需要对获取的历史数据进行去噪声等预处理操作,才能进行预测;但是一旦处理不当或初始条件选择不当,就会影响预测结果的准确性。而且,对于传统的统计方法能较好捕捉线性趋势,而对于非线性或者复杂模型需要进行额外处理,预测结果会更加不准确。深度学习模型相较于传统的统计方法,虽然能提高预测结果的准确性,但是训练深度学习模型需要大量的计算资源和训练时长,计算的复杂度较高。
因此,现有技术中对于业务变量值的预测方法,预测结果的准确性和计算的复杂度难以两全。
为了解决现有技术问题,本申请实施例提供了一种确定业务变量值的方法、装置、设备及计算机存储介质。下面首先对本申请实施例所提供的确定业务变量值的方法进行介绍。
图1示出了本申请一个实施例提供的确定业务变量值的方法的流程示意图。
如图1所示,本申请实施例提供的确定业务变量值的方法包括以下步骤。
S110、获取连续预设数量的周期内第一预设时间段的业务变量值,第一预设时间段包括从t-k时刻到t+k时刻之间的时间段。
这里,业务变量值可以但不限于包括关键绩效指标KPI,如业务量、耗时、成功率和饱和度等。
在一些实施例中,在连续预设数量的周期内包括第一预设时间段的业务变量值的情况下,获取连续预设数量的周期内第一预设时间段的业务变量值。第一预设时间段包括从t-k时刻到t+k时刻之间的时间段,对应的通过从t-k时刻到t+k时刻之间的时间段的历史业务变量值,可以预测当前周期内第t时刻的第一目标业务变量值。例如,k为一个小时。第t时刻可以是时间戳t。
作为一个示例,对于给定日期的t时刻,获取过去三周内同一天的从t-k时刻到t+k时刻之间业务变量值,构建上下文子集。上下文子集包括过去三周内同一天的从t-k时刻到t+k时刻之间业务变量值。例如:t时刻为8:00。
S120、对业务变量值进行排序,得到业务变量值序列。
这里,业务变量值序列包括排序后的业务变量值。
在一些实施例中,业务变量值序列可以是通过从小到大排序得到的,也可以是从大到小排序得到的。
S130、确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。
在一些实施例中,第一预设位数和第二预设位数是提前设定好的。
在一些实施例中,第一预设位数为第一四分位数Q1,第二预设位数是第三四分位数Q3。可以理解的是,第一四分位数Q1和第三四分位数Q3分别表示上下文子集中的第25个百分位数和第75个百分位数。作为一个示例,利用公式(1)计算第一四分位数Q1,利用公式(2)计算第三四分位数Q3,公式(1)和公式(2)如下:
Q1=(N+1)*25%-1 (1)
Q3=(N+1)*75%-1 (2)
其中,N表示业务变量值序列中业务变量值的总数量。
在一些实施例中,位于第一四分位数Q1和第三四分位数Q3之间的业务变量值的平均值是t时刻的预测业务变量值。当前周期内第t时刻的第一目标业务变量值为当前周期内第t时刻的预测业务变量值。可以理解的是第一四分位数Q1和第三四分位数Q3之外的业务变量值存在过大或过小的问题,位于第一四分位数Q1和第三四分位数Q3之间的业务变量值的平均值作为当前周期t时刻的预测业务变量值,消除了可能存在异常值的影响。
这样,考虑业务变量值的季节性,获取历史周期的业务变量值,去掉部分较大或较小的可能异常值,计算从第一预设位数和第二预设位数之间的业务变量值的平均值,得到预测业务变量值。既考虑了预测结果的准确性,又避免了复杂的参数调整,平衡了计算复杂度和预测精度。
基于此,在一些实施例中,上述S110具体可以包括:
在连续预设数量的周期中的第一个周期内包括t-q时刻到t+k时刻的业务变量值的情况下,获取第一个周期内t-q时刻到t+k时刻的业务变量值,以及连续预设数量的周期中除第一个周期之外的周期内第一预设时间段的业务变量值,其中0≤q<k。
在一些实施例中,第一个周期为距离当前周期最远的一个周期。第一个周期可能不会存在完整的业务变量值。此时,需要检测第一个周期内是否包括t-q时刻到t+k时刻的业务变量值。若包括,则获取第一个周期内t-q时刻到t+k时刻的业务变量值。而对于第一个周期之后的周期中,包括第一预设时间段的业务变量值。可以理解的是,只有最开始的第一个周期可能缺失t时刻之前的数据。
在一些实施例中,获取第一个周期内t-q时刻到t+k时刻的业务变量值,以及连续预设数量的周期中除第一个周期之外的周期内第一预设时间段的业务变量值。将这些业务变量值进行排序,得到的业务变量值序列,也可以确定当前周期内t时刻的第一目标业务变量值。
这样,即使第一个周期缺少数据,也能获取到第一个周期的业务变量值,进行第一目标业务变量值的预测。
基于此,在一些实施例中,如图2所示,在上述S130之后,该方法还可以包括以下步骤S140至S190。
S140、获取连续预设数量的周期内第二预设时间段的业务变量值,第二预设时间段包括从t+1-k时刻到t+1+k时刻之间的时间段。
在一些实施例中,在连续预设数量的周期内包括第二预设时间段的业务变量值的情况下,获取连续预设数量的周期内第二预设时间段的业务变量值。第二预设时间段包括从(t+1)-k时刻到(t+1)+k时刻之间的时间段,对应的通过从(t+1)-k时刻到(t+1)+k时刻之间的时间段的历史业务变量值,可以预测当前周期内第t+1时刻的第一目标业务变量值。
在一些实施例中,基于滑动窗口,设置滑动窗口的预设步长,每隔预设步长有一个第一目标业务变量值。这里,预设步长是提前设定好的。例如,预设步长为1秒。
S150、对第二预设时间段的业务变量值进行排序,得到第二预设时间段的业务变量值序列。
这里,业务变量值序列包括排序后的第二预设时间段的业务变量值。
在一些实施例中,第二预设时间段的业务变量值序列可以是通过从小到大排序得到的,也可以是从大到小排序得到的。
S160、确定第二预设时间段的业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t+1时刻的第一目标业务变量值。
在一些实施例中,基于滑动窗口,可以确定当前周期内所有时刻的第一目标业务变量值。
S170、在确定当前周期内第三预设时间段的第一目标业务变量值的情况下,分别计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值,得到当前周期内第三预设时间段的目标残差,第三预设时间段包括从t时刻到m时刻的时间段。
这里,m时刻在当前周期内。从t时刻到m时刻的时间段的预设间隔时长可以是提前设定好的。m时刻为t时刻之后,与t时刻间隔的时长为预设间隔时长的时刻。
在一些实施例中,计算当前周期内第三预设时间段中目标时刻的第一目标业务变量值和实际业务变量值的第一差值。目标时刻可以是第三预设时间段内的任意一个时刻,可以得到当前周期内第三预设时间段的目标残差。其中,当前周期内第三预设时间段中目标时刻的第一目标业务变量值和实际业务变量值的第一差值,可以作为目标时刻的目标残差。
S180、计算当前周期内第三预设时间段内每个目标残差的第一分数。
在一些实施例中,第一分数可以是Z分数。残差是的预测值与实际值之间的差值。将Z分数应用于残差以检测潜在的异常值。
作为一个示例,利用公式(3)计算Z分数,公式(3)如下:
其中,x表示目标残差,μ表示第三预设时间段内全部目标残差的均值,σ表示第三预设时间段内全部目标残差的标准差。
S190、在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定第一目标时刻的实际业务变量值为第二目标业务变量值,第三预设时间段包括第一目标时刻。
这里,第二目标业务变量值可以表示异常的目标业务变量值。
在一些实施例中,在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,可以认为第一目标时刻的目标残差显著偏离均值,确定第一目标时刻的实际业务变量值为第二目标业务变量值。
在一些实施例中,可以利用异常检测器检测第二目标业务变量值。将目标残差输入至异常检测器。
这样,可以基于预测值,检测业务中的异常数据,在准确确定预测业务变量值的基础上,准确检测出实际业务变量值中的异常值。
基于此,在一些实施例中,如图3所示,在上述S190之后,该方法还可以包括:
S210、计算第三预设时间段内确定的第二目标业务变量值的准确率和召回率;
S220、根据准确率和召回率,确定第三预设时间内的第二分数;
S230、调整第一预设值;
S240、在第二分数满足预设条件的情况下,得到调整后的第一预设值;
S250、在第二目标时刻的目标残差的第一分数大于调整后的第一预设值的情况下,确定第二目标时刻的实际业务变量值为第二目标业务变量值,第三预设时间段包括第二目标时刻。
在一些实施例中,第二分数可以是F1分数。
作为一个示例,利用公式(4)计算第三预设时间段内确定的第二目标业务变量值的准确率,利用公式(5)计算第三预设时间段内确定的第二目标业务变量值的召回率。公式(4)和公式(5)如下:
其中,TP表示第三预设时间段内确定的第二目标业务变量值的数量;FP表示假正例数,表示实际正常的业务变量值却被预测成第二目标业务变量值的数量;FN表示假负例数,表示实际异常的业务变量值却被预测成正常的业务变量值的数量。
在另一个示例中,利用公式(6)计算F1分数,公式(6)如下:
在一些实施例中,根据F1分数选择合适的第一预设值,可以在检测异常和避免误报之间取得平衡。预设条件可以是提前设定好的,第二分数越接近1表示第一预设值越合适。预设条件可以是第二分数与1之间的差值的绝对值小于一个预设阈值,预设阈值可以是提前设定好的。例如,预设阈值为0.01。
这样,利用第二分数调整后的第一预设值,在判断第二目标业务变量值是会更加准确。
基于此,在一些实施例中,如图4所示,上述S170具体可以包括:
S171、获取第一预设位数和第二预设位数的第二差值;
S172、计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值;
S173、确定第一差值和第二差值的比值为目标残差。
在一些实施例中,对目标残差进行归一化,以消除量级的影响。
作为一个示例,第一预设位数为第一四分位数Q1,第二预设位数是第三四分位数Q3。计算Q3和Q1的差值,得到四分位距IOR。计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值。确定第一差值和IOR的比值为目标残差。
这样,对目标残差进行归一化,消除了不同时间段不同量级的影响。
基于此,在一些实施例中,上述S173具体可以包括:
获取偶然性常数;
选取第二差值和偶然性常数中较大的值作为归一化常数;
确定第一差值和归一化常数的比值为目标残差。
在一些实施例中,偶然性常数可以是用于描述数据的随机性和不确定性的参数,描述数据分布特征。偶然性常数c可以是针对不同业务提前设定好的。
在一些实施例中,选取第二差值和偶然性常数中较大的值作为归一化常数,确定第一差值和归一化常数的比值为目标残差。即,第一差值除以max(IQR,c)。异常检测器输入的目标残差还可以是归一化后的目标残差。
这样,偶然性常数不仅消除了IQR=0时出现除零误差的可能性,而且防止了残差对较低范围的超敏感。
基于此,在一些实施例中,在获取偶然性常数之前,该方法还可以包括:
获取业务变量值对应的业务需求信息,业务需求信息包括偶然性常数的确定类型;
在偶然性常数的确定类型为第一确定类型的情况下,确定偶然性常数为预设区间内的任意一个数值;
在偶然性常数的确定类型为第二确定类型的情况下,确定偶然性常数为第二预设值;
在偶然性常数的确定类型为第三确定类型的情况下,计算业务变量值的目标百分位数,将目标百分位数对应的业务变量值作为偶然性常数。
作为一个示例,对于偶然性常数的确定类型为第一确定类型的业务可能是:在午夜时分,某业务用户数的范围几乎都是0。因此,即使是较小的峰值。比如3,也被认为是统计意义上的显著异常值。然而实际工作范围可能在数千量级,意味着从实际来看这种小幅度不应该被视为异常。因此,偶然性常数c的值可以在10到100之间的任何地方,以避免在较低预期范围内由时间序列数据的名义波动引起的归一化残差中的非自然峰值。这里,预设区间为[10,100]。
在另一个示例,对于偶然性常数的确定类型为第二确定类型的业务可能是:微小统计偏差对相关业务很重要。确定偶然性常数为1。偶然性常数指数据域中的某个特定值,用于描述数据的分布特征和数据的取值范围。这里,第二预设值为1。
在一些实施例中,对于偶然性常数的确定类型为第三确定类型的业务可能是任意的业务。该情况不受业务的限制,只要业务的偶然性常数的确定类型为第三确定类型,都可以计算业务变量值的目标百分位数,将目标百分位数对应的业务变量值作为偶然性常数。
作为一个示例,偶然性常数c可以从业务变量值中取任意小的值。令c=|P1(X)|。例如,X可以取的整个业务变量值序列范围的1个百分位数。因此,在实际使用中,c的值可以通过计算P1(X)来确定,其中P1为确定X对应的业务变量值的函数。P1(X)可以是数据域中的第一个最大概率值,用于描述数据的离散程度和分布特征。
这样,可以针对不同业务获取不同的偶然性常数,目标残差的归一化结果也会不同,考虑了业务的差异性,提高异常检测的精度。
在本申请提供的实施例中,能够综合权衡复杂度和预测精度,通过评估历史模式来处理每日、每周或每年等的季节性,进而实现实时数据的滚动预测。在降低时间和空间复杂性的同时实现了较高的预测精度,支持数据的滚动预测,不需要单独的拟合和预测阶段。同时使用滑动窗口方法,在新数据可用时不断自动更新历史数据,最后通过输入残差进行异常检测。能更好的平衡计算复杂度和预测精度,主要有点表现为:设置功能所需参数少;能够避免复杂的超参数调整;滚动预测模型,不需要额外的再训练。同时在MAE、MSE和RMSE误差指标以及R2系数的预测精度方面具有较大竞争力。
基于上述实施例提供的确定业务变量值的方法,相应地,本申请还提供了确定业务变量值的装置的具体实现方式。请参见以下实施例。
首先参见图5,本申请实施例提供的确定业务变量值的装置300,包括:
获取模块310,用于获取连续预设数量的周期内第一预设时间段的业务变量值,第一预设时间段包括从t-k时刻到t+k时刻之间的时间段;
排序模块320,用于对业务变量值进行排序,得到业务变量值序列;
确定模块330,用于确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。
基于此,在一些实施例中,获取模块310具体可以用于:
在连续预设数量的周期中的第一个周期内包括t-q时刻到t+k时刻的业务变量值的情况下,获取第一个周期内t-q时刻到t+k时刻的业务变量值,以及连续预设数量的周期中除第一个周期之外的周期内第一预设时间段的业务变量值,其中0≤q<k。
基于此,在一些实施例中,装置300还可以包括:
获取模块310,还用于在确定业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值之后,获取连续预设数量的周期内第二预设时间段的业务变量值,第二预设时间段包括从t+1-k时刻到t+1+k时刻之间的时间段;
排序模块320,还用于对第二预设时间段的业务变量值进行排序,得到第二预设时间段的业务变量值序列;
确定模块330,还用于确定第二预设时间段的业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t+1时刻的第一目标业务变量值;
计算模块,用于在确定当前周期内第三预设时间段的第一目标业务变量值的情况下,分别计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值,得到当前周期内第三预设时间段的目标残差,第三预设时间段包括从t时刻到m时刻的时间段;
计算模块,还用于计算当前周期内第三预设时间段内每个目标残差的第一分数;
确定模块330,还用于在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定第一目标时刻的实际业务变量值为第二目标业务变量值,第三预设时间段包括第一目标时刻。
基于此,在一些实施例中,装置300还可以包括:
计算模块,还用于在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定第一目标时刻的实际业务变量值为第二目标业务变量值之后,计算第三预设时间段内确定的第二目标业务变量值的准确率和召回率;
确定模块330,还用于根据准确率和召回率,确定第三预设时间内的第二分数;
调整模块,用于调整第一预设值;
确定模块330,还用于在第二分数满足预设条件的情况下,得到调整后的第一预设值;
确定模块330,还用于在第二目标时刻的目标残差的第一分数大于调整后的第一预设值的情况下,确定第二目标时刻的实际业务变量值为第二目标业务变量值,第三预设时间段包括第二目标时刻。
基于此,在一些实施例中,计算模块具体可以包括:
获取单元,用于获取第一预设位数和第二预设位数的第二差值;
计算单元,用于计算当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值;
确定单元,用于确定第一差值和第二差值的比值为目标残差。
基于此,在一些实施例中,确定单元具体可以用于:
获取偶然性常数;
选取第二差值和偶然性常数中较大的值作为归一化常数;
确定第一差值和归一化常数的比值为目标残差。
基于此,在一些实施例中,确定单元具体可以用于:
在获取偶然性常数之前,获取业务变量值对应的业务需求信息,业务需求信息包括偶然性常数的确定类型;
在偶然性常数的确定类型为第一确定类型的情况下,确定偶然性常数为预设区间内的任意一个数值;
在偶然性常数的确定类型为第二确定类型的情况下,确定偶然性常数为第二预设值;
在偶然性常数的确定类型为第三确定类型的情况下,计算业务变量值的目标百分位数,将目标百分位数对应的业务变量值作为偶然性常数。
本申请实施例提供的确定业务变量值的装置的各个模块,可以实现上述提供的确定业务变量值的方法的各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种电子设备。
图6示出了本申请实施例提供的电子设备的硬件结构示意图。
在电子设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在综合网关容灾设备的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。
存储器可包括只读存储器(Read Only Memory,ROM),随机存取存储器(RandomAccess Memory,RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种确定业务变量值的方法。
在一个示例中,电子设备还可包括通信接口403和总线410。其中,如图6所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(IndustryStandard Architecture,ISA)总线、无限带宽互连、低引脚数(Linear PredictiveCoding,LPC)总线、存储器总线、微信道架构(MicroChannel Architecture,MCA)总线、外围组件互连(Peripheral Component Interconnect,PCI)总线、PCI-Express(PeripheralComponent Interconnect-X,PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,SATA)总线、视频电子标准协会局部(VESA Local Bus,VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。该电子设备可以执行本发明实施例中的确定业务变量值的方法,从而实现上述的确定业务变量值的方法。
另外,结合上述实施例中的确定业务变量值的方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种确定业务变量值的方法。
本申请还提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行实现上述任意一种确定业务变量值的方法实施例的各个过程。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除只读存储器(Erasable ReadOnly Memory,EROM)、软盘、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (11)

1.一种确定业务变量值的方法,其特征在于,包括:
获取连续预设数量的周期内第一预设时间段的业务变量值,所述第一预设时间段包括从t-k时刻到t+k时刻之间的时间段;
对所述业务变量值进行排序,得到业务变量值序列;
确定所述业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。
2.根据权利要求1所述的确定业务变量值的方法,其特征在于,所述获取连续预设数量的周期内第一预设时间段的业务变量值,包括:
在所述连续预设数量的周期中的第一个周期内包括t-q时刻到t+k时刻的业务变量值的情况下,获取所述第一个周期内t-q时刻到t+k时刻的业务变量值,以及所述连续预设数量的周期中除所述第一个周期之外的周期内第一预设时间段的所述业务变量值,其中0≤q<k。
3.根据权利要求1所述的确定业务变量值的方法,其特征在于,在确定所述业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值之后,所述方法还包括:
获取所述连续预设数量的周期内第二预设时间段的业务变量值,所述第二预设时间段包括从t+1-k时刻到t+1+k时刻之间的时间段;
对所述第二预设时间段的业务变量值进行排序,得到所述第二预设时间段的业务变量值序列;
确定所述第二预设时间段的业务变量值序列中从所述第一预设位数和所述第二预设位数之间的业务变量值的平均值为当前周期内第t+1时刻的第一目标业务变量值;
在确定当前周期内第三预设时间段的第一目标业务变量值的情况下,分别计算所述当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值,得到所述当前周期内第三预设时间段的目标残差,所述第三预设时间段包括从t时刻到m时刻的时间段;
计算所述当前周期内第三预设时间段内每个目标残差的第一分数;
在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定所述第一目标时刻的实际业务变量值为第二目标业务变量值,所述第三预设时间段包括所述第一目标时刻。
4.根据权利要求3所述的确定业务变量值的方法,其特征在于,在第一目标时刻的目标残差的第一分数大于第一预设值的情况下,确定所述第一目标时刻的实际业务变量值为第二目标业务变量值之后,所述方法还包括:
计算所述第三预设时间段内确定的第二目标业务变量值的准确率和召回率;
根据所述准确率和所述召回率,确定所述第三预设时间内的第二分数;
调整所述第一预设值;
在所述第二分数满足预设条件的情况下,得到调整后的第一预设值;
在第二目标时刻的目标残差的第一分数大于所述调整后的第一预设值的情况下,确定所述第二目标时刻的实际业务变量值为所述第二目标业务变量值,所述第三预设时间段包括所述第二目标时刻。
5.根据权利要求3所述的确定业务变量值的方法,其特征在于,所述分别计算所述当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值,得到所述当前周期内第三预设时间段的目标残差,包括:
获取所述第一预设位数和所述第二预设位数的第二差值;
计算所述当前周期内第三预设时间段的第一目标业务变量值和实际业务变量值的第一差值;
确定所述第一差值和所述第二差值的比值为目标残差。
6.根据权利要求5所述的确定业务变量值的方法,其特征在于,所述确定所述第一差值和所述第二差值的比值为目标残差,包括:
获取偶然性常数;
选取所述第二差值和所述偶然性常数中较大的值作为归一化常数;
确定所述第一差值和所述归一化常数的比值为目标残差。
7.根据权利要求6所述的确定业务变量值的方法,其特征在于,在获取偶然性常数之前,所述方法还包括:
获取所述业务变量值对应的业务需求信息,所述业务需求信息包括所述偶然性常数的确定类型;
在所述偶然性常数的确定类型为第一确定类型的情况下,确定所述偶然性常数为预设区间内的任意一个数值;
在所述偶然性常数的确定类型为第二确定类型的情况下,确定所述偶然性常数为第二预设值;
在所述偶然性常数的确定类型为第三确定类型的情况下,计算所述业务变量值的目标百分位数,将所述目标百分位数对应的业务变量值作为所述偶然性常数。
8.一种确定业务变量值的装置,其特征在于,包括:
获取模块,用于获取连续预设数量的周期内第一预设时间段的业务变量值,所述第一预设时间段包括从t-k时刻到t+k时刻之间的时间段;
排序模块,用于对所述业务变量值进行排序,得到业务变量值序列;
确定模块,用于确定所述业务变量值序列中从第一预设位数和第二预设位数之间的业务变量值的平均值为当前周期内第t时刻的第一目标业务变量值。
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的确定业务变量值的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的确定业务变量值的方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1-7任意一项所述的确定业务变量值的方法。
CN202410181745.6A 2024-02-18 2024-02-18 确定业务变量值的方法、装置、设备及计算机存储介质 Pending CN118036807A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410181745.6A CN118036807A (zh) 2024-02-18 2024-02-18 确定业务变量值的方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410181745.6A CN118036807A (zh) 2024-02-18 2024-02-18 确定业务变量值的方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN118036807A true CN118036807A (zh) 2024-05-14

Family

ID=90983709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410181745.6A Pending CN118036807A (zh) 2024-02-18 2024-02-18 确定业务变量值的方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN118036807A (zh)

Similar Documents

Publication Publication Date Title
CN108280542B (zh) 一种用户画像模型的优化方法、介质以及设备
CN115952062A (zh) 数据异常检测方法、装置、设备及介质
CN114564370B (zh) 告警阈值的确定方法、装置、设备及计算机存储介质
CN112395179B (zh) 一种模型训练方法、磁盘预测方法、装置及电子设备
CN115705413A (zh) 异常日志的确定方法及装置
CN111159846A (zh) 基于分数levy稳定运动的滚动轴承剩余有效寿命预测方法
CN114662926A (zh) 科技企业评价方法及其装置、设备、介质
CN112487361B (zh) 一种基于arima和小波变换的扇区短时交通流量预测方法
CN118036807A (zh) 确定业务变量值的方法、装置、设备及计算机存储介质
CN116166498A (zh) 故障监测方法、装置、设备及计算机存储介质
CN114417830A (zh) 风险评价方法、装置、设备及计算机可读存储介质
CN116258167A (zh) 一种数据检测方法、装置、电子设备及介质
CN114692987A (zh) 一种时序数据分析方法、装置、设备及存储介质
CN114663097A (zh) 账户识别方法、装置、设备及计算机存储介质
CN114938339A (zh) 一种数据处理方法和相关装置
CN114638159A (zh) 确定耐蚀性的方法、装置、设备及计算机存储介质
CN114741690A (zh) 网络安全监测方法、装置、设备及计算机存储介质
CN117493121A (zh) 异常检测方法、装置、设备、介质及产品
CN117493122A (zh) 应用程序接口的调用异常检测方法和装置
CN116308751A (zh) 期限错配风险评估方法、装置、设备、介质及产品
CN113808755B (zh) 感染人群预测模型训练的方法、预测的方法、装置、设备
CN118802026A (zh) 信道质量的预测方法、装置、设备及存储介质
CN107218964B (zh) 一种试验子样容量性状的判定方法
CN118797339A (zh) 检测规则的修正方法、装置、设备、存储介质和程序产品
CN117291639A (zh) 样本生成方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination