CN116738241B - 基于时间粒度的阈值生成方法、装置、终端及介质 - Google Patents

基于时间粒度的阈值生成方法、装置、终端及介质 Download PDF

Info

Publication number
CN116738241B
CN116738241B CN202311021663.7A CN202311021663A CN116738241B CN 116738241 B CN116738241 B CN 116738241B CN 202311021663 A CN202311021663 A CN 202311021663A CN 116738241 B CN116738241 B CN 116738241B
Authority
CN
China
Prior art keywords
working condition
threshold
time
training
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311021663.7A
Other languages
English (en)
Other versions
CN116738241A (zh
Inventor
龚亮华
唐墨斌
毛哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fengtai Technology Beijing Co ltd
Original Assignee
Fengtai Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fengtai Technology Beijing Co ltd filed Critical Fengtai Technology Beijing Co ltd
Priority to CN202311021663.7A priority Critical patent/CN116738241B/zh
Publication of CN116738241A publication Critical patent/CN116738241A/zh
Application granted granted Critical
Publication of CN116738241B publication Critical patent/CN116738241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请适用于工控技术领域,提供一种基于时间粒度的阈值生成方法、装置、终端及介质,其中方法包括:获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本;基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;获取目标时间粒度下第三时间段的参考工况阈值;将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值。该方案将工况阈值与时间粒度结合起来,生成的预测工况阈值具有更好的数据适配性。

Description

基于时间粒度的阈值生成方法、装置、终端及介质
技术领域
本申请属于工控技术领域,尤其涉及一种基于时间粒度的阈值生成方法、装置、终端及介质。
背景技术
在工控行业中,为了确保工控系统的正常运行,需要对工控系统的运行状态进行实时监测,即设定阈值,将工况数据与阈值进行比较,当工况数据超出阈值时,通过告警模块进行告警,用于提示工作人员工控系统出现故障。最初,人们根据经验人为设定静态阈值,基于静态阈值对工控系统进行监测,但是依靠经验得到的静态阈值存在经验误差,容易出现错误告警。
目前,现有技术中根据工况数据实时生成工况阈值,使得工况阈值的生成与工控系统紧密相关,得到的工况阈值与静态阈值相比,摒弃了静态阈值存在的经验误差,能够为工控系统提供更加准确和稳定的阈值,减少错误告警。
但是在工控系统实际运行过程中,工况数据不会稳定不变,不同时间段内的工况数据的之间存在数据波动,因此在数据波动较大的时候,工况阈值受数据波动影响,基于上一时间段的工况数据生成的工况阈值在当前时间段并不适用,存在较大的误差,即工况阈值的数据适配性差。
发明内容
本申请实施例提供了一种基于时间粒度的阈值生成方法、装置、终端及介质,以解决现有技术中生成的工况阈值受工况数据的数据波动所导致的数据适配性差的问题。
本申请实施例的第一方面提供了一种基于时间粒度的阈值生成方法,包括:
获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;其中,N为正整数;
基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本;
基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值;
获取目标时间粒度下第三时间段的参考工况阈值;
将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值。
本申请实施例的第二方面提供了一种基于时间粒度的阈值生成装置,包括:
第一获取模块,用于获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;其中,N为正整数;
构建模块,用于基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本;
训练模块,用于基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值;
第二获取模块,用于获取目标时间粒度下第三时间段的参考工况阈值;
生成模块,用于将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值。
本申请实施例的第三方面提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述方法的步骤。
本申请的第五方面提供了一种计算机程序产品,当所述计算机程序产品在终端上运行时,使得所述终端执行上述第一方面所述方法的步骤。
由上可见,本申请根据N种时间粒度获取每种时间粒度对应的多组工况阈值,并基于每种时间粒度的多组所述工况阈值,构建出模型训练样本,首先将工况阈值和时间粒度结合起来,建立起工况阈值与时间粒度的初始联系,又因为工况阈值是根据工况数据生成的,所以该步骤建立起工况数据与时间粒度的初始联系,即将工况数据与时间联系起来。然后基于模型训练样本进行模型训练,得到每一时间粒度所对应的阈值预测模型。在模型训练过程中,能够找到样本数据即工况阈值与时间粒度的关联关系,即工况阈值随时间如何变化,也即工况数据随时间的数据波动情况,依据关联关系生成阈值预测模型。根据每一时间粒度的阈值预测模型和在先工况阈值,预测出对应时间粒度下的在后工况阈值。从多个阈值预测模型中确定关联关系更加准确的目标阈值预测模型,将目标时间粒度下第三时间段的参考工况阈值输入到目标时间粒度下的目标阈值预测模型,生成目标时间粒度下的第四时间段的预测工况阈值,该预测工况阈值是基于工况阈值与时间粒度的关联关系,即工况数据随时间的数据波动情况生成的,考虑了数据波动的影响,生成更加准确的预测工况阈值,能够对第四时间段内的工况数据进行更加准确的监测,减少错误告警,提高告警效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于时间粒度的阈值生成方法的流程图一;
图2是本申请实施例提供的一种基于时间粒度的阈值生成方法的流程图二;
图3是本申请实施例提供的一种基于时间粒度的阈值生成装置的结构图;
图4是本申请实施例提供的一种终端的结构图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当…时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本申请实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
应理解,本实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
现有技术中,通常基于工况数据生成工况阈值,并使用该工况阈值对工控系统进行数据监测和异常告警。虽然该方法与以往通过经验设定静态阈值,并根据静态阈值进行异常告警的方法相比,能够减少无效告警。但是正如背景技术中所述,如果上一时间段的工况数据与当前时间段的工况数据相比,产生了较大幅度的波动,那么通过上一时间段的工况数据生成的工况阈值在当前时间段并不适用,即生成的工况阈值的数据适配性比较差。
因此,本申请将基于N种时间粒度获取多组依照工况数据生成的工况阈值,通过训练确定工况阈值与时间的关联关系,即工况数据与时间的关联关系,也即工况数据的数据波动情况,进而训练得到与关联关系相符的阈值预测模型,使得生成的工况阈值具有更好的数据适配性,从而减少错误告警。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
参见图1,图1是本申请实施例提供的一种基于时间粒度的阈值生成方法的流程图一。如图1所示,一种基于时间粒度的阈值生成方法,该方法包括以下步骤:
步骤101,获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;其中,N为正整数。
其中,N为正整数,N种时间粒度是指工作人员设置好的时间粒度。通常将所述时间粒度设置为日、周和月,在实际应用中,工作人员可以根据实际需求设置时间粒度,例如日、周、月、季度或者年,亦或者规定一定时长,如以十天为基本时间单位设定所述时间粒度,等等。所述工况阈值是基于工况数据生成的阈值。所述工况阈值可以为温度阈值、湿度阈值、电流阈值、电压阈值、光照度阈值或者溶氧量阈值等等。
具体地,所述获取N种时间粒度下,每种所述时间粒度的多组工况阈值,包括:基于多个连续时间段的所述工况数据,生成与每一时间段的所述工况数据对应的工况阈值;基于N种所述时间粒度,分别对所述工况阈值进行划分,得到每一所述时间粒度对应的多组所述工况阈值。
具体地,为了找到所述工况阈值与时间的关联关系,在构建所述模型训练样本的时候,首先需要保证其中包含的样本数据存在时间连续性,即将所述样本数据按照时间顺序进行排列,需要保证相邻两个样本数据的时间间隔相同。因此,需要获取多个连续时间段的所述工况数据。在应用中,我们也常常将所述时间段称为时间窗口。每一个所述时间段中都包含多个所述工况数据。
具体地,基于多个连续时间段的所述工况数据,生成与每一所述时间段的所述工况数据对应的工况阈值,得到多个工况阈值。此处,所述工况阈值的个数与所述时间段的个数是相同的。每一所述工况阈值基于不同时间段的工况数据分别产生。然后将这多个工况阈值按照确定好的N种时间粒度分别进行划分,即可获取到每一所述时间粒度对应的多组所述工况阈值。其中,每一所述时间粒度对应的一组所述工况阈值中都包含设定数量个所述工况阈值。不同时间粒度对应的一组所述工况阈值中的所述工况阈值的设定数量可以不同。
具体地,通过设定好的时间段生成所述工况阈值,使得所述工况阈值在时间上具备逻辑性。
具体地,下面提供一种工况阈值生成模型生成所述工况阈值的方法。
(1)获取工控系统在目标时间段内的目标工况数据以及所述目标时间段对应的目标静态阈值。根据所述目标静态阈值,对所述目标工况数据进行分类处理。即判断所述目标工况数据是否超过所述目标静态阈值,将未超过所述目标静态阈值的数据记作第一工况数据,将超过所述目标静态阈值的数据记作第二工况数据,并对所述第二工况数据进行校正处理,得到第三工况数据。
(2)将得到的所述第一工况数据和所述第三工况数据按照从大到小或者从小到大的顺序一同进行排序,得到一组待筛选工况数据。确定一个数据量的基准值K,将所述待筛选工况数据的数据量H与所述基准值K进行比较,若H≥K,则去除所述待筛选工况数据中的最大值和最小值;若2≤H≤K,则保留所述待筛选工况数据中的所述最大值和所述最小值。经过上述的去除或者保留操作得到第四工况数据。特别地,若H为0或者1,则提示数据量过少,不足以生成工况阈值,需要重新获取工况数据。
(3)所述第四工况数据去除峰值后数据量个数为M,计算M×Q并向上取整即可获得分组之后每一组的数据量个数P,其中,0<Q<1,本申请优选Q值为0.8。在所述第四工况数据中随机抽取P个工况数据,重复M-P次,重新排序得到M-P组初始样本数据。
(4)分别计算M-P组初始样本数据的均方差,选择均方差最小的初始样本数据作为目标样本数据,所述目标样本数据用于计算历史工况阈值。计算所述目标样本数据的中位数L,基于不同的工控环境设置不同的容忍度T,其中0<T<1。计算得到所述目标时间段内的历史工况阈值——上容忍值L×(1+T)和下容忍值L×(1-T)。将所述历史工况阈值与所述目标静态阈值进行合并处理,即可得到所述目标时间段对应的目标工况阈值。其中,所述合并处理可为计算均值。
具体地,用于生成所述工况阈值的所述工况阈值生成模型不止以上一种,能够根据所述工况数据生成所述工况阈值的阈值生成模型都能够被称为工况阈值生成模型。现有技术中,采用所述工况阈值判断所述工况数据是否异常。但是在本申请中,生成的所述工况阈值不用于判断工况数据是否存在异常,而用于生成数据适配性更高的预测工况阈值。
可选地,将所述历史阈值生成模型生成的所述历史运行工况阈值数据存放在数据库中,需要使用的时候,从所述数据库中获取即可。所述数据库中的所述历史运行工况阈值数据会按照设定好的更新时间进行更新。
步骤102,基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本。
具体地,在后续的模型训练中使用到所述模型训练样本。所述第一时间段和所述第二时间段都为对应有时间粒度。例如,若时间粒度为周,则所述第一时间段可为第一周,所述第二时间段可为第二周。在模型训练过程中,能够将所述模型训练样本中包含的第一时间段的训练样本先作为模型输入值,将所述第一时间段之后的第二时间段的训练样本作为模型输出值的对照值也即验证值。然后能够将所述第二时间段的训练样本作为又一个模型输入值,以此类推,进行训练。
具体地,介绍一种模型训练样本的构建方法。即所述基于N种所述时间粒度,分别对所述工况阈值进行划分,得到每一所述时间粒度对应的多组所述工况阈值之后,还包括:基于正向时间顺序,将每一所述时间粒度下的多组所述工况阈值分别进行排列,得到每一所述时间粒度对应的多个第一阈值时间序列;基于逆向时间顺序,从每一所述时间粒度对应的多个所述第一阈值时间序列中,为每一所述时间粒度划分目标数量个第二阈值时间序列,得到与每一所述时间粒度对应的包含所述第二阈值时间序列的所述模型训练样本。
具体地,所述正向时间顺序表示时间向未来延伸,所述逆向时间顺序表示时间向过去延伸。所述第一阈值时间序列和所述第二阈值时间序列均为包含所述工况阈值的时间序列。每一所述时间粒度对应的所述第二阈值时间序列的目标数量可由工作人员设置,不同时间粒度的所述目标数量可能相同,也可能不同。
具体地,时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。因此在对每一所述时间粒度下的多组所述工况阈值分别进行排列的时候,需要选择所述正向时间顺序。不同的时间粒度对应的所述第一时间序列也不同。以日、周和月举例,所述时间粒度为日,划分之后会得到多个日第一阈值时间序列,所述时间粒度为周,划分之后会得到多个周第一阈值时间序列,所述时间粒度为月,划分之后会得到多个月第一阈值时间序列。
具体地,后续训练模型进行模型训练时需要足够数量的阈值时间序列,因此,本申请在划分所述第一阈值时间序列的时候,会设定好第二阈值时间序列的数量,从每一所述时间粒度对应的若干个所述第一阈值时间序列中为每一所述时间粒度划分目标数量个第二阈值时间序列,得到所述模型训练样本。
具体地,无论是哪个时间粒度,都优先选择最靠近当前时刻的工况阈值进行排列并划分,这样最终得到的预测工况阈值更具实用意义。因此,在从多个所述第一阈值时间序列中为每一所述时间粒度划分出目标数量个所述第二阈值时间序列的时候,需要遵循所述逆向时间顺序,以使得输入到所述训练模型中的所述阈值时间序列都为日期比较新的时间序列。
具体地,以时间粒度为日进行举例说明。假设当前时间为本月的15号,已获取到本月1号到15号每一天整点时刻的温度阈值,该温度阈值指代上文所述工况阈值。将这15天中每一天的温度阈值都按照时间先后顺序即所述正向时间顺序进行排列,得到每一天对应的时间序列,即得到每一天的所述第一阈值时间序列。若后续训练需要8个阈值时间序列,则以当前日期依次向前选择,从1-15号对应的所述第一阈值时间序列中按照以下顺序依次进行选择,选择15号、14号、13号、12号、11号、10号、9号和8号对应的第一阈值时间序列,此为逆向时间顺序。为了便于区分,将选中的阈值时间序列称为第二阈值时间序列。经过以上操作,划分得到了时间粒度为日对应的所述模型训练样本,该模型训练样本中包含目标数量个第二阈值时间序列。其他时间粒度的阈值时间序列的排序和划分参考该方法。
可选地,先根据所述逆向时间顺序确定距离当前时刻之前最接近当前时刻的工况阈值,根据所述时间粒度和所述正向时间顺序,得到阈值时间序列。时间从后到前,直至每个时间粒度所需要的阈值时间序列的数量达到所述目标数量,停止数据获取。这样,也得到了每一所述时间粒度对应的所述模型训练样本。
步骤103,基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值。
具体地,本申请中进行模型训练的训练模型有循环神经网络(Recurrent NeuralNetworks, RNN)模型、卷积神经网络(Convolutional Neural Networks, CNN)模型、Transformer模型以及Nbeats模型等等。在实际应用时,选择上述任意一个模型作为所述训练模型。将每一时间粒度对应的所述模型训练样本中的样本数据输入到所述训练模型中进行训练,就能够得到对应时间粒度的阈值预测模型。若选定N种时间粒度,会根据每一所述时间粒度对应的所述模型训练样本分别进行训练,生成每一所述时间粒度对应的所述阈值预测模型,即得到N个阈值预测模型。
具体地,上文提到所述模型训练样本中包含目标数量个所述第二阈值时间序列,即所述模型训练样本中包含目标数量个所述阈值时间序列。通过所述训练模型进行模型训练的过程中,还能够得到每一所述时间粒度下所述阈值时间序列的时序规律,即所述工况阈值与时间的关联关系,也即所述工况数据与时间的关联关系。所述时序规律是指所述阈值时间序列之间或者所述阈值时间序列内部的所述工况阈值按照一定的规律不断变化,主要根源在于生成所述工况阈值的所述工况数据在随时间进行变化。例如,在工控系统正常运行的过程中,每天的所述工况数据可能呈现逐次递增、逐次递减、先增后减,或者前后段数据较为稳定,中段数据相较于前后段数据略高,等等规律。进而使得基于所述工况数据生成的所述工况阈值也具备对应的规律。
例如,在某些工控系统中,需要使得工控环境保持一个恒温状态,那么在夏季高温天气中,则需要通过用电来保持该恒温状态。温度为先增后加,那么对应的电量也为先增后减。可以对电量进行监控,以此判断系统是否保持恒温状态,即为每个时间段内的电量设置工况阈值,当电量超出对应的工况阈值时,则进行告警。
但是,只看单个数据是无法得到数据在时间域上的规律,因此需要将数据整合成时间序列,即将所述工况阈值排列划分为所述阈值时间序列,训练找到所述阈值时间序列自身以及所述阈值时间序列之间存在的时序规律。
具体地,根据所述时序规律对模型进行训练调整,得到所述阈值预测模型,因此N个所述阈值预测模型会遵循对应时间粒度下所述阈值时间序列的所述时序规律进行预测。
具体地,所述基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型,包括:根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的训练样本集和验证样本集;分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中,训练得到对应时间粒度的多个初始训练模型;基于每一所述时间粒度对应的所述验证样本集,对每一所述时间粒度的多个所述初始训练模型进行评估,并基于评估结果从多个所述初始训练模型中选取得到每一所述时间粒度对应的所述阈值预测模型。
具体地,在得到每一所述时间粒度对应的所述模型训练样本之后,需要基于所述模型训练样本进行训练。本申请中的所述训练模型优选为所述Transformer模型。所述Transformer模型包括自注意力层、残差连接层、规范化层和全连接层。在正式开始训练之前,需要设置预设划分比例,根据所述预设划分比例将所述模型训练样本划分为不同的样本集,即所述训练样本集和所述验证样本集。所述训练样本集和所述验证样本集都由所述阈值时间序列组成。
具体地,在设置所述预设划分比例的时候,不同时间粒度对应的预设划分比例可以设置为相同的值,也可以设置为不同的值。此处的所述预设划分比例与下文基于预期损失值和预期准确率进行训练的预设划分比例可以为相同的值,也设置为不同的值。所述预设划分比例可为3:1或者4:1等等,无论怎样设置,所述训练样本集所占的比例要高于所述验证样本集。
具体地,根据所述预设划分比例,将每一所述时间粒度对应的所述模型训练样本都划分为每一所述时间粒度所对应的所述训练样本集和所述验证样本集。
具体地,所述Transformer模型进行训练的过程是一个模型逐渐拟合的过程。所述Transformer模型的处理层协同作用,基于每一所述时间粒度对应的所述训练样本集中的所述阈值时间序列,训练得到每一所述时间粒度对应的多个所述初始训练模型。所述初始训练模型为拟合模型。例如,基于日训练样本集、周训练样本集和月训练样本集中的所述阈值时间序列,训练生成每一所述时间粒度下的多个所述初始训练模型。
具体地,将所述训练样本集中的所述阈值时间序列输入到所述训练模型之后,所述训练模型会利用正弦函数和余弦函数位置编码处理所述阈值时间序列,通过将输入向量和位置编码向量按顺序相加,对所述阈值时间序列中的顺序信息进行编码。然后通过所述自注意力层、所述残差连接层、所述规范化层和所述全连接层对所述阈值时序数据进行序列处理和训练,最终生成每一所述时间粒度对应的多个所述初始训练模型。
具体地,在训练得到每一所述时间粒度对应的多个所述初始训练模型之后,根据所述验证样本集以及所述Transformer模型的评估函数,对每一所述时间粒度的多个所述初始训练模型进行评估,得到每一所述初始训练模型的评估结果。基于得到的所述评估结果从每一所述时间粒度对应的多个所述初始训练模型中为每一所述时间粒度筛选出最佳的一个作为所述阈值预测模型。此处的评估过程可参考下文以预期损失值和预期准确率为标准得到所述阈值预测模型的过程。也可将所述初始训练模型进行量化,即对所述初始训练模型的误差情况、准确情况、稳定性和预测速率等数值都赋予分值,根据总分值选取出所述阈值预测模型。
具体地,同样以上述三个时间粒度为例,根据日验证样本集、周验证样本集、日验证样本集以及所述评估函数,经过评估,选取出日阈值预测模型、周阈值预测模型和月阈值预测模型。
可选地,在评估结果不佳时,可以选择继续训练,直至获得符合预期要求的所述阈值预测模型。
具体地,所述分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中,训练得到对应时间粒度的多个初始训练模型,包括:为每一所述时间粒度的模型训练过程设置第一训练迭代次数阈值和第二训练迭代次数阈值;所述第二训练迭代次数阈值为所述第一训练迭代次数阈值的整数倍;将每一所述时间粒度对应的所述训练样本集中的所述阈值时序数据分别输入到所述训练模型中进行训练;对每一所述时间粒度,在所述训练模型的训练迭代次数每达到所述第一训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个所述初始训练模型;对每一所述时间粒度,在所述训练模型的所述训练迭代次数达到所述第二训练迭代次数阈值的情况下,生成对应时间粒度下的多个所述初始训练模型。
具体地,在分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中,训练得到对应时间粒度的多个初始训练模型过程中,需要先设置好每一个时间粒度的所述第一训练迭代次数阈值和所述第二训练迭代次数阈值。其中,所述第一训练迭代次数阈值是指每生成一个初始训练模型需要达到的训练次数,所述第二训练迭代次数阈值是指基于每一所述时间粒度的所述训练样本集训练的总次数,所述第二训练迭代次数阈值为所述第一训练迭代次数阈值的整数倍。不同时间粒度的所述第一训练迭代次数阈值和所述第二训练迭代次数阈值可以根据需要设置。
具体地,将每一所述时间粒度对应的所述训练样本集中的所述阈值时间序列分别输入到所述训练模型中进行训练。因为训练迭代次数是累积的,所以对每一所述时间粒度来说,在所述训练模型的训练迭代次数每达到该时间粒度对应的所述第一训练迭代次数阈值的任意整数倍的情况下,就会生成对应时间粒度的一个所述初始训练模型。在所述训练模型的所述训练迭代次数达到所述第二训练迭代次数阈值的情况下,表示每一时间粒度都完成了设定的训练总次数,此时停止训练,会生成对应时间粒度下的多个所述初始训练模型,也即每一所述时间粒度对应的所有初始训练模型。
具体地,由于设定了N种时间粒度,自然会得到N组初始训练模型,每一组初始训练模型中都包含多个所述初始训练模型。之后,就能够根据所述验证样本集和所述评估函数对每一组所述初始训练模型进行评估。
具体地,每一所述时间粒度都对应有预期损失值、预期准确率以及第三训练迭代次数阈值;所述基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型,包括:根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的训练样本集和验证样本集;分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中;对每一所述时间粒度,在所述训练模型的训练迭代次数每达到所述第三训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个初始训练模型;基于所述初始训练模型预测生成的第三阈值时序数据中的第三动态阈值与所述验证样本集中对应的第四阈值时序数据中的第四动态阈值,计算得到所述初始训练模型的实际损失值和实际准确率;若所述实际损失值达到所述预期损失值,且所述实际准确率达到所述预期准确率,则将所述实际损失值和所述实际准确率对应的所述初始训练模型作为对应时间粒度下的所述阈值预测模型。
具体地,本申请还存在一种模型训练方法。若要实现该方法,需要预先为每一所述时间粒度设置对应的预期损失值、预期准确率以及第三训练迭代次数阈值。所述预期损失值是指能够接受的预测得到的结果和实际值之间的损失值,通常用占比形式体现。所述预期准确率是指模型预测的准确率。所述预期损失值和所述预期准确率可以设置为具体数值,也可以设置为数值范围。所述第三训练迭代次数阈值是指每生成一个初始训练模型需要达到的训练次数。
具体地,同样根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的所述训练样本集和所述验证样本集。然后依照每一所述时间粒度,将对应的所述训练样本集中的所述阈值时间序列输入到所述训练模型中。对每一所述时间粒度,在所述训练模型的所述训练迭代次数每达到所述第三训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个初始训练模型。每得到一个所述初始训练模型,就根据所述初始训练模型预测生成的第三阈值时间序列中的第三工况阈值与所述验证样本集中对应的第四阈值时间序列中的第四工况阈值进行实时计算,得到所述初始训练模型的实际损失值和实际准确率。因为所述验证样本集可能存在多个所述阈值时间序列,因此验证并计算之后得到的损失值和准确率也对应有多个。对这些损失值和准确率分别进行求均值、求中位数或者求众数等等,具体求取方法不做限定,将得到的最终结果作为所述实际损失值和所述实际准确率。
具体地,将所述实际损失值和所述预期损失值进行对比,将所述实际准确率和所述预期准确率进行比对,若所述实际损失值达到所述预期损失值即达到设置的具体数值或者在设置的数值范围内,且所述实际准确率达到所述预期准确率即达到设置的具体数值或者在设置的数值范围内,表示所述实际损失值和所述实际准确率对应的所述初始训练模型符合预期标准,即可停止训练,并将所述实际损失值和所述实际准确率对应的所述初始训练模型作为对应时间粒度下的所述阈值预测模型,此时得到N个所述阈值预测模型。将在先的阈值时间序列输入到所述阈值预测模型中,就会得到在后的阈值时间序列,即依照对应时间粒度下的在先工况阈值预测在后工况阈值。
步骤104,获取目标时间粒度下第三时间段的参考工况阈值。
具体地,在得到N个所述阈值预测模型之后,需要从N个所述阈值模型中选取出至少一个所述阈值预测模型作为所述目标阈值预测模型,用于生成最终的预测工况阈值。
具体地,在选取所述目标阈值预测模型的时候,需要充分考虑工控系统对于阈值的要求。若工控系统的运行环境较为稳定,则可选择时间粒度跨度较大的阈值预测模型作为所述目标阈值预测模型,如月阈值预测模型。若工控系统的运行环境相对不稳定,则可选择时间粒度跨度较小的阈值预测模型作为所述目标阈值预测模型,如日阈值预测模型。所述目标阈值预测模型的数量不做限定。
进一步地,在确定好所述目标阈值预测模型之后,就能够获取所述目标阈值预测模型对应的目标时间粒度下第三时间段的参考工况阈值。所述第三时间段的参考工况阈值为目标时间粒度下的一个阈值时间序列。此处的所述时间段意为单位目标时间粒度。举例来说,若所述目标时间粒度为日、周或者月,则所述第三时间段对应一天、一周或者一月。
步骤105,将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值。其中,所述第四时间段与上述第三时间段所代表的含义相同,所述第四时间段也对应单位目标时间粒度,二者的时间先后顺序不同,所述第四时间段在所述第三时间段之后。同样以日、周、月为例,若所述目标时间粒度为日、周或者月,所述第三时间段为第三天、第三周或者第三月,则所述第四时间段依次为第四天、第四周或者第四月。此处列举出来的第几在时间上存在先后顺序。所述第三时间段的参考工况阈值对应有第三阈值时间序列,所述第四时间段的预测工况阈值对应有第四阈值时间序列。
具体地,在确定好所述目标阈值预测模型并获取所述目标时间粒度下第三时间段的参考工况阈值之后,将所述第三时间段的参考工况阈值对应的第三阈值时间序列输入到所述目标阈值预测模型,则所述目标阈值预测模型预测生成所述第四时间段的预测工况阈值对应的第四阈值时间序列,也即生成的所述第四阈值时间序列中包含所述预测工况阈值。
具体地,第三阈值时间序列中的所述参考工况阈值的数量与所述第四阈值时间序列中的所述预测工况阈值的数量相同。
具体地,同样以日、周、月进行举例,介绍基于所述目标阈值预测模型生成所述预测工况阈值的过程。将第一天的所述阈值时间序列输入到日阈值预测模型中,生成第二天的所述阈值时间序列;和/或,将第一周的所述阈值时间序列输入到周阈值预测模型中,生成第二周的所述阈值时间序列;和/或,将第一个月的所述阈值时间序列输入到月阈值预测模型中,生成第二个月的所述阈值时间序列。之后,能够从所述阈值时间序列中得到相应的预测工况阈值。
本申请实施例中,首先根据N种时间粒度获取每种时间粒度对应的多组工况阈值,并基于每种时间粒度的多组所述工况阈值,构建出模型训练样本,首先将工况阈值和时间粒度结合起来,建立起工况阈值与时间粒度的初始联系,又因为工况阈值是根据工况数据生成的,所以该步骤建立起工况数据与时间粒度的初始联系,即将工况数据与时间联系起来。然后基于模型训练样本进行模型训练,得到每一时间粒度所对应的阈值预测模型。在模型训练过程中,能够找到样本数据即工况阈值与时间粒度的关联关系,即工况阈值随时间如何变化,也即工况数据随时间的数据波动情况,依据关联关系生成阈值预测模型。根据每一时间粒度的阈值预测模型和在先工况阈值,预测出对应时间粒度下的在后工况阈值。从多个阈值预测模型中确定关联关系更加准确的目标阈值预测模型,将目标时间粒度下第三时间段的参考工况阈值输入到目标时间粒度下的目标阈值预测模型,生成目标时间粒度下的第四时间段的预测工况阈值,该预测工况阈值是基于工况阈值与时间粒度的关联关系,即工况数据随时间的数据波动情况生成的,考虑了数据波动的影响,生成更加准确的预测工况阈值,能够对第四时间段内的工况数据进行更加准确的监测,减少错误告警,提高告警效率。
参见图2,图2是本申请实施例提供的一种基于时间粒度的阈值生成方法的流程图二。如图2所示,一种基于时间粒度的阈值生成方法,该方法包括以下步骤:
步骤201,获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;其中,N为正整数。
该步骤的实现过程与前述实施方式中的步骤101的实现过程相同,此处不再赘述。
步骤202,基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本。
该步骤的实现过程与前述实施方式中的步骤102的实现过程相同,此处不再赘述。
步骤203,基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值。
该步骤的实现过程与前述实施方式中的步骤103的实现过程相同,此处不再赘述。
步骤204,获取目标时间粒度下第三时间段的参考工况阈值。
该步骤的实现过程与前述实施方式中的步骤104的实现过程相同,此处不再赘述。
步骤205,将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值。
该步骤的实现过程与前述实施方式中的步骤105的实现过程相同,此处不再赘述。
步骤206,将所述目标时间粒度下的所述第四时间段的工况数据与所述预测工况阈值进行比对。
具体地,在基于所述目标时间粒度下的所述参考工况阈值和所述目标阈值预测模型,预测生成所述目标时间粒度下的第四时间段的预测工况阈值之后,能够在时间到达所述第四时间段的时候,开始使用所述预测工况阈值对工控系统进行监测。
具体地,将所述目标时间粒度下的所述第四时间段的工况数据与所述预测工况阈值进行比对,得到比对结果。
步骤207,若所述第四时间段的工况数据超出所述预测工况阈值,则生成所述第四时间段的工况数据的告警信息。
具体地,若所述比对结果中,所述工况数据超出所述预测工况阈值,则生成所述工况数据的告警信息,提醒工作人员,工控系统出现异常。反之,若所述比对结果中,所述工况数据未超出所述预测工况阈值,则说明工控系统未出现异常,工控系统继续正常运行,同时继续监测工控系统运行过程中的工况数据。
可选地,所述告警信息可通过语音或者蜂鸣器提醒,也可通过可视化平台进行展示,亦或者其他提醒展示方法,本申请不再进行限定。
本申请实施例中,在基于参考工况阈值和目标阈值预测模型得到预测工况阈值之后,根据生成的预测工况阈值监测对应的工况数据是否存在异常,若异常,生成告警信息,进行告警。做到实时监测,实时告警,与以往通过人工进行监测相比,降低了工作人员的工作量,提高了告警效率,减少了告警不及时所导致的损失。
参见图3,图3是本申请实施例提供的一种基于时间粒度的阈值生成装置的结构图,为了便于说明,仅示出了与本申请实施例相关的部分。
所述基于时间粒度的阈值生成装置300包括:第一获取模块301,构建模块302,训练模块303,第二获取模块304,生成模块305。
第一获取模块301,用于获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;其中,N为正整数;
构建模块302,用于基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本;
训练模块303,用于基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值;
第二获取模块304,用于获取目标时间粒度下第三时间段的参考工况阈值;
生成模块305,用于将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值。
具体地,所述第一获取模块用于:
基于多个连续时间段的所述工况数据,生成与每一时间段的所述工况数据对应的工况阈值;基于N种所述时间粒度,分别对所述工况阈值进行划分,得到每一所述时间粒度对应的多组所述工况阈值。
具体地,所述构建模块用于:
基于正向时间顺序,将每一所述时间粒度下的多组所述工况阈值分别进行排列,得到每一所述时间粒度对应的多个第一阈值时间序列;基于逆向时间顺序,从每一所述时间粒度对应的多个所述第一阈值时间序列中,为每一所述时间粒度划分目标数量个第二阈值时间序列,得到与每一所述时间粒度对应的包含所述第二阈值时间序列的所述模型训练样本。
根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的训练样本集和验证样本集;分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中,训练得到对应时间粒度的多个初始训练模型;基于每一所述时间粒度对应的所述验证样本集,对每一所述时间粒度的多个所述初始训练模型进行评估,并基于评估结果从多个所述初始训练模型中选取得到每一所述时间粒度对应的所述阈值预测模型。
为每一所述时间粒度的模型训练过程设置第一训练迭代次数阈值和第二训练迭代次数阈值;所述第二训练迭代次数阈值为所述第一训练迭代次数阈值的整数倍;将每一所述时间粒度对应的所述训练样本集中的所述阈值时序数据分别输入到所述训练模型中进行训练;对每一所述时间粒度,在所述训练模型的训练迭代次数每达到所述第一训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个所述初始训练模型;对每一所述时间粒度,在所述训练模型的所述训练迭代次数达到所述第二训练迭代次数阈值的情况下,生成对应时间粒度下的多个所述初始训练模型。
根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的训练样本集和验证样本集;分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中;对每一所述时间粒度,在所述训练模型的训练迭代次数每达到所述第三训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个初始训练模型;基于所述初始训练模型预测生成的第三阈值时序数据中的第三动态阈值与所述验证样本集中对应的第四阈值时序数据中的第四动态阈值,计算得到所述初始训练模型的实际损失值和实际准确率;若所述实际损失值达到所述预期损失值,且所述实际准确率达到所述预期准确率,则将所述实际损失值和所述实际准确率对应的所述初始训练模型作为对应时间粒度下的所述阈值预测模型。
具体地,所述装置还包括告警模块,用于:
将所述目标时间粒度下的所述第四时间段的工况数据与所述预测工况阈值进行比对;若所述第四时间段的工况数据超出所述预测工况阈值,则生成所述第四时间段的工况数据的告警信息。
本申请实施例提供的基于时间粒度的阈值生成装置能够实现上述基于时间粒度的阈值生成方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
图4是本申请实施例提供的一种终端的结构图。如该图所示,该实施例的终端4包括:至少一个处理器40(图4中仅示出一个)、存储器41以及存储在所述存储器41中并可在所述至少一个处理器40上运行的计算机程序42,所述处理器40执行所述计算机程序42时实现上述任意各个方法实施例中的步骤。
所述终端4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端4可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端4的示例,并不构成对终端4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端4的内部存储单元,例如终端4的硬盘或内存。所述存储器41也可以是所述终端4的外部存储设备,例如所述终端4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序产品来实现,当计算机程序产品在终端上运行时,使得所述终端执行时实现可实现上述各个方法实施例中的步骤。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (9)

1.一种基于时间粒度的阈值生成方法,其特征在于,包括:
获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;所述工况阈值为目标工况阈值,所述目标工况阈值的生成过程为:获取工控系统在目标时间段内的目标工况数据和目标静态阈值,所述目标工况数据中未超过所述目标静态阈值的数据为第一工况数据,超过所述目标静态阈值的数据为第二工况数据;对所述第二工况数据进行校正处理,得到第三工况数据;将所述第一工况数据和所述第三工况数据按照从大到小或者从小到大的顺序进行排序,得到一组待筛选工况数据;确定一个数据量的基准值K,将所述待筛选工况数据的数据量H与所述基准值K进行比较,若H≥K,则去除所述待筛选工况数据中的最大值和最小值,若2≤H≤K,则保留所述待筛选工况数据中的所述最大值和所述最小值,基于去除操作或者保留操作得到第四工况数据,其中,所述第四工况数据去除峰值后的数据量个数为M;计算并向上取整获得分组之后每一组的数据量个数P;在所述第四工况数据中随机抽取P个工况数据,重复/>次,重新排序得到/>组初始样本数据;分别计算/>组初始样本数据的均方差,选择均方差最小的初始样本数据作为目标样本数据;计算所述目标样本数据的中位数L;基于不同的工控环境设置不同的容忍度T,基于所述中位数L和所述容忍度T进行计算,得到所述目标时间段内的历史工况阈值/>和/>;将所述历史工况阈值与所述目标静态阈值进行合并处理,得到所述目标时间段对应的所述目标工况阈值;其中,N为正整数,0<Q<1,0<T<1;
基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本;
基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值;
获取目标时间粒度下第三时间段的参考工况阈值;
将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值;
将所述目标时间粒度下的所述第四时间段的工况数据与所述预测工况阈值进行比对;若所述第四时间段的工况数据超出所述预测工况阈值,则生成所述第四时间段的工况数据的告警信息。
2.根据权利要求1所述的方法,其特征在于,所述获取N种时间粒度下,每种所述时间粒度的多组工况阈值,包括:
基于多个连续时间段的所述工况数据,生成与每一时间段的所述工况数据对应的工况阈值;
基于N种所述时间粒度,分别对所述工况阈值进行划分,得到每一所述时间粒度对应的多组所述工况阈值。
3.根据权利要求2所述的方法,其特征在于,所述基于N种所述时间粒度,分别对所述工况阈值进行划分,得到每一所述时间粒度对应的多组所述工况阈值之后,还包括:
基于正向时间顺序,将每一所述时间粒度下的多组所述工况阈值分别进行排列,得到每一所述时间粒度对应的多个第一阈值时间序列;
基于逆向时间顺序,从每一所述时间粒度对应的多个所述第一阈值时间序列中,为每一所述时间粒度划分目标数量个第二阈值时间序列,得到与每一所述时间粒度对应的包含所述第二阈值时间序列的所述模型训练样本。
4.根据权利要求1所述的方法,其特征在于,所述基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型,包括:
根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的训练样本集和验证样本集;
分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中,训练得到对应时间粒度的多个初始训练模型;
基于每一所述时间粒度对应的所述验证样本集,对每一所述时间粒度的多个所述初始训练模型进行评估,并基于评估结果从多个所述初始训练模型中选取得到每一所述时间粒度对应的所述阈值预测模型。
5.根据权利要求4所述的方法,其特征在于,所述分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中,训练得到对应时间粒度的多个初始训练模型,包括:
为每一所述时间粒度的模型训练过程设置第一训练迭代次数阈值和第二训练迭代次数阈值;所述第二训练迭代次数阈值为所述第一训练迭代次数阈值的整数倍;
将每一所述时间粒度对应的所述训练样本集中的所述阈值时序数据分别输入到所述训练模型中进行训练;
对每一所述时间粒度,在所述训练模型的训练迭代次数每达到所述第一训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个所述初始训练模型;
对每一所述时间粒度,在所述训练模型的所述训练迭代次数达到所述第二训练迭代次数阈值的情况下,生成对应时间粒度下的多个所述初始训练模型。
6.根据权利要求1所述的方法,其特征在于,每一所述时间粒度都对应有预期损失值、预期准确率以及第三训练迭代次数阈值;所述基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型,包括:
根据预设划分比例,对每一所述时间粒度下的所述模型训练样本进行样本集划分,得到对应时间粒度下的训练样本集和验证样本集;
分别依照每一所述时间粒度,将对应的所述训练样本集输入到训练模型中;
对每一所述时间粒度,在所述训练模型的训练迭代次数每达到所述第三训练迭代次数阈值的任意整数倍的情况下,生成对应时间粒度的一个初始训练模型;
基于所述初始训练模型预测生成的第三阈值时序数据中的第三动态阈值与所述验证样本集中对应的第四阈值时序数据中的第四动态阈值,计算得到所述初始训练模型的实际损失值和实际准确率;
若所述实际损失值达到所述预期损失值,且所述实际准确率达到所述预期准确率,则将所述实际损失值和所述实际准确率对应的所述初始训练模型作为对应时间粒度下的所述阈值预测模型。
7.一种基于时间粒度的阈值生成装置,其特征在于,包括:
第一获取模块,用于获取N种时间粒度下,每种所述时间粒度的多组工况阈值,每一所述工况阈值基于不同的工况数据分别产生;所述工况阈值为目标工况阈值,所述目标工况阈值的生成过程为:获取工控系统在目标时间段内的目标工况数据和目标静态阈值,所述目标工况数据中未超过所述目标静态阈值的数据为第一工况数据,超过所述目标静态阈值的数据为第二工况数据;对所述第二工况数据进行校正处理,得到第三工况数据;将所述第一工况数据和所述第三工况数据按照从大到小或者从小到大的顺序进行排序,得到一组待筛选工况数据;确定一个数据量的基准值K,将所述待筛选工况数据的数据量H与所述基准值K进行比较,若H≥K,则去除所述待筛选工况数据中的最大值和最小值,若2≤H≤K,则保留所述待筛选工况数据中的所述最大值和所述最小值,基于去除操作或者保留操作得到第四工况数据,其中,所述第四工况数据去除峰值后的数据量个数为M;计算并向上取整获得分组之后每一组的数据量个数P;在所述第四工况数据中随机抽取P个工况数据,重复/>次,重新排序得到/>组初始样本数据;分别计算/>组初始样本数据的均方差,选择均方差最小的初始样本数据作为目标样本数据;计算所述目标样本数据的中位数L;基于不同的工控环境设置不同的容忍度T,基于所述中位数L和所述容忍度T进行计算,得到所述目标时间段内的历史工况阈值/>和/>;将所述历史工况阈值与所述目标静态阈值进行合并处理,得到所述目标时间段对应的所述目标工况阈值;其中,N为正整数,0<Q<1,0<T<1;
构建模块,用于基于每种所述时间粒度的多组所述工况阈值,构建模型训练样本,所述模型训练样本中包含第一时间段的训练样本及处于所述第一时间段之后的第二时间段的训练样本;
训练模块,用于基于所述模型训练样本进行模型训练,得到与每一所述时间粒度分别对应的阈值预测模型;每一所述阈值预测模型用于依照对应时间粒度下的在先工况阈值预测在后工况阈值;
第二获取模块,用于获取目标时间粒度下第三时间段的参考工况阈值;
生成模块,用于将所述参考工况阈值输入至所述目标时间粒度下的目标阈值预测模型,生成所述目标时间粒度下的第四时间段的预测工况阈值;
告警模块,用于将所述目标时间粒度下的所述第四时间段的工况数据与所述预测工况阈值进行比对;若所述第四时间段的工况数据超出所述预测工况阈值,则生成所述第四时间段的工况数据的告警信息。
8.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。
CN202311021663.7A 2023-08-15 2023-08-15 基于时间粒度的阈值生成方法、装置、终端及介质 Active CN116738241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311021663.7A CN116738241B (zh) 2023-08-15 2023-08-15 基于时间粒度的阈值生成方法、装置、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311021663.7A CN116738241B (zh) 2023-08-15 2023-08-15 基于时间粒度的阈值生成方法、装置、终端及介质

Publications (2)

Publication Number Publication Date
CN116738241A CN116738241A (zh) 2023-09-12
CN116738241B true CN116738241B (zh) 2023-12-01

Family

ID=87911843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311021663.7A Active CN116738241B (zh) 2023-08-15 2023-08-15 基于时间粒度的阈值生成方法、装置、终端及介质

Country Status (1)

Country Link
CN (1) CN116738241B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503841A (zh) * 2016-10-17 2017-03-15 东软集团股份有限公司 指标阈值的确定方法和装置
CN113938992A (zh) * 2020-07-13 2022-01-14 中国联合网络通信集团有限公司 一种阈值确定方法及装置
CN115202802A (zh) * 2021-04-09 2022-10-18 中国移动通信集团辽宁有限公司 告警阈值确定方法、装置、设备及存储介质、告警系统
CN115563180A (zh) * 2022-09-19 2023-01-03 烽台科技(北京)有限公司 动态阈值生成方法、装置、设备及存储介质
CN115630709A (zh) * 2022-11-08 2023-01-20 广西壮族自治区公众信息产业有限公司 一种数据中心ai能耗阈值动态分析及优化的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10205735B2 (en) * 2017-01-30 2019-02-12 Splunk Inc. Graph-based network security threat detection across time and entities

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503841A (zh) * 2016-10-17 2017-03-15 东软集团股份有限公司 指标阈值的确定方法和装置
CN113938992A (zh) * 2020-07-13 2022-01-14 中国联合网络通信集团有限公司 一种阈值确定方法及装置
CN115202802A (zh) * 2021-04-09 2022-10-18 中国移动通信集团辽宁有限公司 告警阈值确定方法、装置、设备及存储介质、告警系统
CN115563180A (zh) * 2022-09-19 2023-01-03 烽台科技(北京)有限公司 动态阈值生成方法、装置、设备及存储介质
CN115630709A (zh) * 2022-11-08 2023-01-20 广西壮族自治区公众信息产业有限公司 一种数据中心ai能耗阈值动态分析及优化的方法

Also Published As

Publication number Publication date
CN116738241A (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN110619423B (zh) 多任务预测方法、装置、电子设备及存储介质
CN109697207B (zh) 时序数据的异常监控方法及系统
WO2021184727A1 (zh) 数据异常检测方法、装置、电子设备及存储介质
CN109684162B (zh) 设备状态预测方法、系统、终端及计算机可读存储介质
CN112508118B (zh) 针对数据偏移的目标对象行为预测方法及其相关设备
CN111950738A (zh) 机器学习模型优化效果评估方法、装置、终端及存储介质
CN108920336A (zh) 一种基于时间序列的服务异常提醒方法及装置
CN111489290A (zh) 一种人脸图像超分辨重建方法、装置及终端设备
CN112182118B (zh) 基于多数据源的目标对象预测方法及其相关设备
CN111400126A (zh) 网络服务异常数据检测方法、装置、设备和介质
US20170004401A1 (en) Artificial intuition
CN108696397B (zh) 一种基于ahp和大数据的电网信息安全评估方法及装置
CN112990583B (zh) 一种数据预测模型的入模特征确定方法及设备
CN112650608B (zh) 异常根因定位方法以及相关装置、设备
CN116738241B (zh) 基于时间粒度的阈值生成方法、装置、终端及介质
CN112365156A (zh) 一种数据处理方法、数据处理装置、终端及存储介质
CN111950623A (zh) 数据稳定性监控方法、装置、计算机设备及介质
CN112948223A (zh) 一种监测运行情况的方法和装置
CN113537631A (zh) 药品需求量的预测方法、装置、电子设备及存储介质
CN114095390A (zh) 区域内对象流量的预测方法、装置、电子设备以及存储介质
CN114298847A (zh) 职工医保基金结余的预测方法、装置、设备及存储介质
CN113780675A (zh) 一种消耗预测方法、装置、存储介质及电子设备
CN113553407B (zh) 事件追溯方法、装置、电子设备及存储介质
CN113743532B (zh) 异常检测方法、装置、设备及计算机存储介质
CN114282143A (zh) 数据处理方法、装置、电子设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant