CN117056847B - 一种流式数据的异常检测方法、系统、设备及存储介质 - Google Patents

一种流式数据的异常检测方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN117056847B
CN117056847B CN202311301731.5A CN202311301731A CN117056847B CN 117056847 B CN117056847 B CN 117056847B CN 202311301731 A CN202311301731 A CN 202311301731A CN 117056847 B CN117056847 B CN 117056847B
Authority
CN
China
Prior art keywords
anomaly detection
streaming data
representing
adaptive
adopting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311301731.5A
Other languages
English (en)
Other versions
CN117056847A (zh
Inventor
郑熠莉
郁松
张金焕
郭佳
姜燕
符雪磊
曾彦菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202311301731.5A priority Critical patent/CN117056847B/zh
Publication of CN117056847A publication Critical patent/CN117056847A/zh
Application granted granted Critical
Publication of CN117056847B publication Critical patent/CN117056847B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种流式数据的异常检测方法、系统、设备及存储介质,本方法通过对流式数据集进行预处理,得到预处理后的流式数据集;通过引入相关系数构建迭代最优的变分模态分解方法,并采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;基于排序配对学习构建排序配对的自适应麻雀搜索算法;采用排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;将最优数量的内禀模态函数分量输入至异常检测模型中进行流式数据的异常检测,得到异常检测结果。本发明能够有效降低数据时变性、非线性和非平稳对异常检测的影响,提高异常检测的准确度。

Description

一种流式数据的异常检测方法、系统、设备及存储介质
技术领域
本发明涉及数据异常检测技术领域,尤其是涉及一种流式数据的异常检测方法、系统、设备及存储介质。
背景技术
在大数据和5G技术普及的背景下,各行业都面临着海量数据和离群现象的挑战。欺诈检测、入侵检测、生态预警、公共健康和工业安全等领域都需要有效的异常检测方法。流式数据在许多情况下同时具有时变性、非线性和非平稳性,这些特性使得处理和分析流式数据变得更加复杂和挑战性。
这些特性的组合使得流式数据异常检测变得更具挑战性,对于流式数据的异常检测,许多研究利用机器学习、集成学习和深度学习的方法去解决,取得了较好的效果。其中GRU网络是使用较广的,效果较好的一种异常检测网络,但是单纯用GRU 网络进行流式数据的异常检测不能解决流式数据本身特征对检测的影响,因为传统的静态方法往往无法有效应对时变性、非线性和非平稳性。因此,现有的流式数据的异常检测方法无法有效降低数据时变性、非线性和非平稳对异常检测的影响,导致检测的准确度低。如何确定最优的GRU网络参数,最大限度提高模型准确度也是需要解决的问题,因此在典型 GRU 网络异常检测的基础上,建立适应流式数据时变性、非线性和非平稳性的检测精度高的自适应参数模型具有十分重要的意义。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种流式数据的异常检测方法、系统、设备及存储介质,能够有效降低数据时变性、非线性和非平稳对异常检测的影响,提高异常检测的准确度。
第一方面,本发明实施例提供了一种流式数据的异常检测方法,所述流式数据的异常检测方法包括:
对流式数据集进行预处理,得到预处理后的流式数据集;
通过引入相关系数构建迭代最优的变分模态分解方法,并采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;
基于排序配对学习构建排序配对的自适应麻雀搜索算法;
采用所述排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;
将所述最优数量的内禀模态函数分量输入至所述异常检测模型中进行流式数据的异常检测,得到异常检测结果。
与现有技术相比,本发明第一方面具有以下有益效果:
本方法通过采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,能够有效降低数据时变性、非线性和非平稳对异常检测的影响,并得到最优数量的内禀模态函数分量;通过基于排序配对学习构建排序配对的自适应麻雀搜索算法,能够使得整个麻雀种群整体成长,实现学习效率的最大化;采用排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型,并将最优数量的内禀模态函数分量输入至异常检测模型中进行流式数据的异常检测,能够提高流式数据的异常检测的准确度。
根据本发明的一些实施例,所述基于排序配对学习构建排序配对的自适应麻雀搜索算法,包括:
采用分段映射方法初始化种群,并初始化所述种群中每个粒子的位置;
引入自适应权重更新所述每个粒子的位置,并计算更新位置后的每个粒子的适应度值;
根据所述适应度值,采用排序配对学习更新种群进行循环迭代,以得到排序配对的自适应麻雀搜索算法。
根据本发明的一些实施例,通过如下方式构建所述分段映射方法:
其中,表示麻雀的数量,/>表示第/>个麻雀的原始位置,/>表示分段映射后的麻雀的初始位置,/>表示用于控制四段式的分段范围无重叠的控制参数。
根据本发明的一些实施例,所述引入自适应权重更新所述每个粒子的位置,包括:
引入自适应权重为:
引入自适应权重后,对发现者的位置进行更新,以得到每个粒子的位置;其中,所述发现者的位置更新为:
其中,表示自适应权重,/>表示初始权值,/>表示常量参数,/>表示最大迭代次数,/>表示第/>个麻雀在第/>维中的位置信息,/>表示当前迭代次数,/>表示服从正态分布的随机数,/>表示1xd的矩阵,/>表示预警值,/>表示安全值,/>表示随机数。
根据本发明的一些实施例,所述根据所述适应度值,采用排序配对学习更新种群,包括:
将每个粒子的适应度值进行排序,得到排序后的适应度值;
将所述排序后的适应度值分成范例组和学习组;
将学习组向范例组进行配对学习,以更新种群。
根据本发明的一些实施例,通过如下方式构建相关系数:
其中,表示第/>个内禀模态函数分量与原始信号的相关系数,/>表示原始信号,/>表示第/>个内禀模态函数分量。
根据本发明的一些实施例,所述通过引入相关系数构建迭代最优的变分模态分解方法,并采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量,包括:
根据所述相关系数构建目标函数;
基于所述目标函数迭代优化变分模态分解方法,直到所述目标函数的结果小于阈值,得到迭代最优的变分模态分解方法;
采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量。
第二方面,本发明实施例还提供了一种流式数据的异常检测系统,所述流式数据的异常检测系统包括:
数据处理单元,用于对流式数据集进行预处理,得到预处理后的流式数据集;
数据分解单元,用于通过引入相关系数构建迭代最优的变分模态分解方法,并采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;
算法优化单元,用于基于排序配对学习构建排序配对的自适应麻雀搜索算法;
模型构建单元,用于采用所述排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;
异常检测单元,用于将所述最优数量的内禀模态函数分量输入至所述异常检测模型中进行流式数据的异常检测,得到异常检测结果。
第三方面,本发明实施例还提供了一种流式数据的异常检测设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上所述的一种流式数据的异常检测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上所述的一种流式数据的异常检测方法。
可以理解的是,上述第二方面至第四方面与相关技术相比存在的有益效果与上述第一方面与相关技术相比存在的有益效果相同,可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例的一种流式数据的异常检测方法的流程图;
图2是本发明另一实施例的流式数据的异常检测模型结构示意图;
图3是本发明一实施例的获取最优模态分解的流程图;
图4是本发明一实施例的排序配对学习示意图;
图5是本发明一实施例的GRU网络模型结构示意图;
图6是本发明一实施例的一种流式数据的异常检测系统的结构图;
图7是本发明一实施例的一种电子设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
本发明的描述中,需要说明的是,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
由于对于流式数据的异常检测,许多研究利用机器学习、集成学习和深度学习的方法去解决,取得了较好的效果。其中GRU网络是使用较广的,效果较好的一种异常检测网络,但是单纯用GRU 网络进行流式数据的异常检测不能解决流式数据本身特征对检测的影响,如何确定最优的GRU模型参数也是需要解决的问题。因此需要在典型GRU网络异常检测的基础上,建立适应流式数据时变性、非线性和非平稳性的自适应参数模型。因为传统的静态方法往往无法有效应对时变性、非线性和非平稳性。因此,现有的流式数据的异常检测方法无法有效降低数据时变性、非线性和非平稳对异常检测的影响,导致检测的准确度低。
为解决上述问题,本发明通过采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,能够有效降低数据时变性、非线性和非平稳对异常检测的影响,并得到最优数量的内禀模态函数分量;通过基于排序配对学习构建排序配对的自适应麻雀搜索算法,能够使得整个麻雀种群整体成长,实现学习效率的最大化;采用排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型,并将最优数量的内禀模态函数分量输入至异常检测模型中进行流式数据的异常检测,能够提高流式数据的异常检测的准确度。
对本公开实施例进行进一步详细说明之前,对本公开实施例中涉及的名词和术语进行说明,本公开实施例中涉及的名词和术语适用于如下的解释:
时变性(Time-Varying):时变性指的是流式数据中的数据分布、模式和关系随着时间的推移而变化。这种变化可以是逐渐的、周期性的,或者是突发的概念漂移。流式数据中的时变性可能导致之前的模型在新的时间段内失效,因此需要能够适应这种变化的算法和模型。
非线性(Nonlinear):流式数据中的关系和模式通常是复杂的非线性关系。传统的线性模型可能无法捕捉到这些非线性特性,因此需要使用更复杂的非线性模型,如神经网络、核方法等,来更好地表示数据中的关系。
非平稳性(Nonstationary):非平稳性是指流式数据的统计特性在时间上发生变化。数据分布、均值、方差等可能随着时间的推移而改变,这可能是由于外部因素、季节性变化、概念漂移等引起的。非平稳性使得基于静态模型的异常检测变得不准确,需要适应数据的变化。
变分模态分解(VMD)原始流式数据:变分模态分解是一种自适应、完全非递归的模态变分和信号处理的方法。VMD的思想认为待分解信号是由不同IMF的子信号组成的。VMD为避免信号分解过程中出现模态混叠,在计算IMF时舍弃了传统信号分解算法所使用的递归求解的思想,与传统信号分解算法相比,VMD拥有非递归求解和自主选择模态个数的优点,他的核心思想就是构建和求解变分问题。
GRU网络:门控循环单元(gatedrecurrentunit,GRU)是LSTM网络的一种效果很好的变体,它较LSTM网络的结构更加简单,而且效果也很好,因此也是当前非常流行的一种网络。GRU既然是LSTM的变体,因此也是可以解决RNN网络中的长依赖问题。在LSTM中,引入了三个门函数:输入门、遗忘门和输出门,而在GRU中,只有两个门:更新门和重置门。GRU模型的结构如图5所示。
参照图1,本发明实施例提供了一种流式数据的异常检测方法,本流式数据的异常检测方法包括但不限于步骤S100至步骤S500,其中:
步骤S100、对流式数据集进行预处理,得到预处理后的流式数据集;
步骤S200、通过引入相关系数构建迭代最优的变分模态分解方法,并采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;
步骤S300、基于排序配对学习构建排序配对的自适应麻雀搜索算法;
步骤S400、采用排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;
步骤S500、将最优数量的内禀模态函数分量输入至异常检测模型中进行流式数据的异常检测,得到异常检测结果。
在本实施例中,为了有效降低数据时变性、非线性和非平稳对异常检测的影响,本实施例通过对流式数据集进行预处理,得到预处理后的流式数据集,通过引入相关系数构建迭代最优的变分模态分解方法,并采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;为了实现学习效率的最大化,本实施例基于排序配对学习构建排序配对的自适应麻雀搜索算法;为了提高流式数据的异常检测的准确度,本实施例通过采用排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型,将最优数量的内禀模态函数分量输入至异常检测模型中进行流式数据的异常检测,得到异常检测结果。
在一些实施例中,基于排序配对学习构建排序配对的自适应麻雀搜索算法,包括:
采用分段映射方法初始化种群,并初始化种群中每个粒子的位置;
引入自适应权重更新每个粒子的位置,并计算更新位置后的每个粒子的适应度值;
根据适应度值,采用排序配对学习更新种群进行循环迭代,以得到排序配对的自适应麻雀搜索算法。
在本实施例中,通过采用分段映射方法、引入自适应权重和排序配对学习优化麻雀搜索算法,能够使得整个麻雀种群都整体成长,从而得到更优解,实现学习效率的最大化。
在一些实施例中,通过如下方式构建分段映射方法:
其中,表示麻雀的数量,/>表示第/>个麻雀的原始位置,/>表示分段映射后的麻雀的初始位置,/>表示用于控制四段式的分段范围无重叠的控制参数。
在本实施例中,使用分段映射后的初始化分布中群体的分散程度更高,且在边界上的个体和重合的个体数量更少,在初始化阶段分布的广度较大能够保证种群的多样性,且减少局部最优的吸引。
在一些实施例中,引入自适应权重更新每个粒子的位置,包括:
引入自适应权重为:
引入自适应权重后,对发现者的位置进行更新,以得到每个粒子的位置;其中,发现者的位置更新为:
其中,表示自适应权重,/>表示初始权值,/>表示常量参数,/>表示最大迭代次数,/>表示第/>个麻雀在第/>维中的位置信息,/>表示当前迭代次数,/>表示服从正态分布的随机数,/>表示1xd的矩阵,/>表示预警值,/>表示安全值,/>表示随机数。
在本实施例中,向生产者引入自适应权值以提高发现者的搜索速度和全局搜索能力。
在一些实施例中,根据适应度值,采用排序配对学习更新种群,包括:
将每个粒子的适应度值进行排序,得到排序后的适应度值;
将排序后的适应度值分成范例组和学习组;
将学习组向范例组进行配对学习,以更新种群。
在本实施例中,采用排序配对学习对麻雀搜索算法中的种群进行不断更新,将位置较差的个体通过配对学习机制往好的方向移动,能够使得整个麻雀种群整体成长,实现学习效率的最大化。
在一些实施例中,通过如下方式构建相关系数:
其中,表示第/>个内禀模态函数分量与原始信号的相关系数,/>表示原始信号,/>表示第/>个内禀模态函数分量。
在一些实施例中,通过引入相关系数构建迭代最优的变分模态分解方法,并采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量,包括:
根据相关系数构建目标函数;
基于目标函数迭代优化变分模态分解方法,直到目标函数的结果小于阈值,得到迭代最优的变分模态分解方法;
采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量。
在本实施例中,通过根据相关系数构建目标函数,并基于目标函数迭代优化变分模态分解,能够快速确定最优数量的内禀模态函数分量,从而得到流式数据的最优分解结果,采用最优分解结果进行检测,能够提高流式数据的异常检测的准确度。
为方便本领域人员理解,以下提供一组最佳实施例:
由于流式数据具有随机性、强非线性和非平稳性的特点,一般的异常检测方法难以有效提高流式数据的异常检测精度。基于变分模态分解方法对非平稳信号的处理和优化后的SSA算法对GRU参数的优化,提出了一种基于VMD和ISSA-GRU的流式数据的异常检测模型。算法流程图参照图2。基于VMD和ISSA-GRU的流式数据异常检测流程如下:
1、预处理流式数据集。
用传感器收集流式数据,采用归一化、特征标准化等操作对流式数据进行预处理,得到预处理后的流式数据集。选取预处理后的流式数据集中前70%的流式数据作为训练数据集,后30%的流式数据作为测试数据集。
2、利用VMD将非线性非平稳的流式数据集分解为K个相对稳定的IMF分量(即IMF1,IMF2,…)。
设多成分信号由K个有限带宽的模态分量组成,每个IMF的中心频率为/>,约束条件是模态和等于输入信号。VMD分解的具体步骤如下:
(1)参照图3,VMD进行信号分解,首先要确定模态分解的数量,一般都是通过经验或者大量实验来决定分解的模块数,而本实施例引入了一个相关系数来帮助快速确定最优的分解模块数(即最优数量的内禀模态函数分量),具体步骤如下:
1)引入相关系数,表示内禀模态函数分量与原始信号的相关程度。当相关系数值低于阈值时,认为模态分解余量不再包含与原始信号相关的信息,原始信号被完全分解。相关系数定义如下:
其中,表示第/>个内禀模态函数分量与原始信号的相关系数,/>表示原始信号,/>表示第/>个内禀模态函数分量。目标函数/>定义如下:
2)采用迭代方法来搜索最优解,设置初始迭代参数为,按/>执行迭代循环,直至/>≤Q(此处阈值Q取0.2)为止才停止迭代。
3)在VMD算法中引入值,能够得到最优模态分解结果(即能够得到最优数量的内禀模态函数分量)。
(2)在VMD算法中引入值后,首先进行Hilbert变换,获得K个模态分量的解析信号,并转换为单边频谱,接着再加一个中心频率指数项/>将模态的频谱转换到相应的基频带上:
其中,Hilbert变换的表达式实际上就是将原始信号和一个信号做卷积的结果,/>的傅里叶变换为/>,由卷积定理得到Hilbert变换后的解析信号为,其中/>,/>,加上中心频率指数项/>后得到
(3)将解调的信号通过高斯平滑对信号的带宽进行估算,获得一个变分约束问题,表达式为:
其中,代表着分解后的IMF组件,/>代表着各组成部分的中心频率,s为原信号,/>表示对/>求偏导。
(4)为了找到约束变分问题的最优解,首先引入拉格朗日乘子和二阶惩罚因子/>,将约束变分问题转化为无约束变分问题。其中二阶惩罚因子/>可以保证高斯噪声环境下信号重构的准确性。拉格朗日乘子/>可以保证保持约束条件的严格性。扩展的拉格朗日表达式如下:
(5)然后利用交替方向乘子法(ADMM)连续更新各分量及其中心频率,最终得到无约束模型的鞍点,即原问题的最佳解,所有的分量都可以根据频域空间由下式得到:
其中,代表着频率,/>分别是对应于/>的傅里叶变换。
3、建立ISSA-GRU异常检测模型。
对于IMFi分量序列,通过优化后的SSA算法(即排序配对的自适应麻雀搜索算法)对GRU网络参数进行优化,利用优化参数后的GRU对IMFi进行预测,得到各IMF分量的检测结果。ISSA-GRU异常检测模型的建立过程包括如下步骤:
1)初始化参数:确定ISSA和GRU的参数,包括种群大小、迭代次数、学习因子等。
2)初始化粒子的位置和速度:使用Piecewisemap初始化种群,为每个粒子初始化ISSA和GRU的参数,这些粒子将代表ISSA-GRU的参数配置。
3)定义适应度函数计算适应度值:适应度函数通常与序列数据的检测误差有关,将均方根误差(RMSE)作为适应度函数,来计算适应度值。使用适应度函数计算每个粒子的适应度值,适应度值反映了其在训练和验证数据上的性能。
4)粒子位置和速度的更新:在每次迭代中,使用ISSA的个体极值和群体极值来更新发现者、加入者的位置和速度,计算适应度值并更新麻雀位置。对当前种群按照适应度值进行排序,并根据排序配对学习来再次更新种群。
5)使用最优粒子训练ISSA-GRU模型:在ISSA的最大迭代次数之后,使用得到的最优粒子作为ISSA-GRU模型的参数配置。然后,使用训练数据训练ISSA-GRU模型。
6)模型评估:使用测试数据集评估ISSA-GRU模型的性能,评估指标有。
7)超参数调整:根据实际情况,可能需要调整ISSA和GRU的超参数,以进一步优化模型的性能。
本实施例的SSA算法优化过程包括如下步骤:
1)为了改善SSA通过后续寻优方式产生的解的质量,一个优良的初始种群分布是整个算法的基础。采用分段映射Piecewisemap来对算法的初始化阶段进行混沌变换。Piecewisemap是分段线性映射的一种,对分布在不同位置的初始值设置了不同的变换公式。具体的数学表达式为:
其中,表示麻雀的数量,/>表示第/>个麻雀的原始位置,/>表示分段映射后的麻雀的初始位置,/>表示用于控制四段式的分段范围无重叠的控制参数,在本实施例中/>取0.3。
使用Piecewisemap映射后的初始化分布中群体的分散程度更高,且在边界上的个体和重合的个体数量更少,在初始化阶段分布的广度较大能够保证种群的多样性,且减少局部最优的吸引。
需要说明的是,本实施例的取值范围可根据实际情况进行更改,本实施例不做具体限定。
2)整个麻雀种群的觅食区域和方向主要取决于发现者,因此需要扩大发现者的探索范围,以提高整个种群的觅食能力。所以向生产者引入自适应权值以提高发现者的搜索速度和全局搜索能力公式为:
其中,表示自适应权重,/>表示初始权重,/>表示常量参数,设置为0.8,表示最大迭代次数。
加入自适应权重之后,发现者的公式更新为:
其中,表示第/>个麻雀在第/>维中的位置信息,/>表示当前迭代次数,/>表示服从正态分布的随机数,/>表示1xd的矩阵,/>表示预警值,/>表示安全值,/>表示随机数。
发现者通常拥有较高的能源储备并且在整个种群中负责搜索到具有丰富食物的区域,为所有的加入者提供觅食的区域和方向。在模型建立中能量储备的高低取决于麻雀个体所对应的适应度值(Fitness Value)的好坏。麻雀按照适应度大小进行排序,如果将最优适应度和最差适应度的麻雀进行配对学习不能够实现个体之间的最佳学习效率。如果将麻雀通过适应度进行排序,分成前半部分和后半部分,再分别由后半部分的麻雀对应向前半部分的同序号麻雀进行学习,这样可以实现学习效率的最大化,这就是排序配对学习(Rankingpairedlearning,RPL)。其基本思想描述如下:将种群中的全部的M个个体按照适应度大小进行排序,平均分成两个自然组,组内个体位置占优的组称为范例组(Groupofexemplars,GE),个体记为,个体位置差的组称为学习组(Groupoflearners,GL),个体称为/>,两组均有/>个个体。图4展示了RPL的核心思想。通过上述描述可知,RPL应满足:
排序完成之后,GL组按照如下方案开始向GE组进行配对学习:
RPL之所以被提出是为了将位置较差的个体通过学习机制往好的方向移动,并在不改变优势群体适应度的前提下使得整个麻雀种群都能够整体成长。
定义参数D表示学习组与被范例组/>之差,D满足以下公式:
当D的值不为0,满足括号内的上述式子;反之,D得到一个(0,1)的随机值。
的学习公式满足:
在跟随者阶段将学习后得到的解和之前的解进行比较,通过贪婪原则保留更优的位置。贪婪选择的数学表达式如下:
4、ISSA-GRU异常检测模型对流式数据的最终异常检测结果为各组分检测结果(即步骤3中得到的各IMF分量的检测结果)之和。
5、将步骤4得到的预测值(即最终异常检测结果)与实际值及其他异常检测模型进行比较,通过误差指标分析验证本实施例方法的准确性。
在本实施例中,使用VMD对非线性和非平稳性的原始流式数据进行平滑处理,将不同尺度的流式数据在时间序列中的波动或趋势逐级分解,得到一系列不同频带的流式数据分量,然后分别进行预测,能够减少原始流式数据的非线性和非平稳性对异常检测模型的影响,提高检测的准确度。使用本实施例优化的SSA算法来优化GRU网络的各参数,解决GRU中学习参数选择困难的问题,可以更快更准确的得到最合适的网络参数,能够提高参数选择的准确度和效率,能更快更准确的选择最合适的网络参数,并提高了流式数据异常检测模型的检测精度。
参照图6,本发明实施例还提供了一种流式数据的异常检测系统,本流式数据的异常检测系统包括数据处理单元100、数据分解单元200、算法优化单元300、模型构建单元400和异常检测单元500,其中:
数据处理单元100,用于对流式数据集进行预处理,得到预处理后的流式数据集;
数据分解单元200,用于通过引入相关系数构建迭代最优的变分模态分解方法,并采用迭代最优的变分模态分解方法对预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;
算法优化单元300,用于基于排序配对学习构建排序配对的自适应麻雀搜索算法;
模型构建单元400,用于采用排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;
异常检测单元500,用于将最优数量的内禀模态函数分量输入至异常检测模型中进行流式数据的异常检测,得到异常检测结果。
需要说明的是,由于本实施例中的一种流式数据的异常检测系统与上述的一种流式数据的异常检测方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本系统实施例,此处不再详述。
参见图7,本申请实施例还提供了一种流式数据的异常检测设备,本流式数据的异常检测设备包括:
至少一个存储器;
至少一个处理器;
至少一个程序;
程序被存储在存储器中,处理器执行至少一个程序以实现本公开实施上述的流式数据的异常检测方法。
该电子设备可以为包括手机、平板电脑、个人数字助理(PersonalDigitalAssistant,PDA)、车载电脑等任意智能终端。
下面对本申请实施例的电子设备进行详细介绍。
处理器1600,可以采用通用的中央处理器(CentralProcessingUnit,CPU)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本公开实施例所提供的技术方案;
存储器1700,可以采用只读存储器(ReadOnlyMemory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(RandomAccessMemory,RAM)等形式实现。存储器1700可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1700中,并由处理器1600来调用执行本公开实施例的流式数据的异常检测方法。
输入/输出接口1800,用于实现信息输入及输出;
通信接口1900,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;
总线2000,在设备的各个组件(例如处理器1600、存储器1700、输入/输出接口1800和通信接口1900)之间传输信息;
其中处理器1600、存储器1700、输入/输出接口1800和通信接口1900通过总线2000实现彼此之间在设备内部的通信连接。
本公开实施例还提供了一种存储介质,该存储介质是计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述流式数据的异常检测方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本公开实施例描述的实施例是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本公开实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序的介质。上面结合附图对本申请实施例作了详细说明,但本申请不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本申请宗旨的前提下作出各种变化。

Claims (6)

1.一种流式数据的异常检测方法,其特征在于,所述流式数据的异常检测方法应用于工业安全领域,所述流式数据的异常检测方法包括:
对流式数据集进行预处理,得到预处理后的流式数据集;
通过引入相关系数构建迭代最优的变分模态分解方法,并采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;其中:
根据所述相关系数构建目标函数;具体为:
通过如下方式构建所述相关系数:
其中,表示第/>个内禀模态函数分量与原始信号的相关系数,/>表示原始信号,/>表示第/>个内禀模态函数分量;
通过如下方式构建目标函数:
其中,表示目标函数,/>表示初始迭代参数;
采用迭代方法,基于所述目标函数迭代优化变分模态分解方法,直到所述目标函数的结果小于阈值,得到迭代最优的变分模态分解方法;
采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;
基于排序配对学习构建排序配对的自适应麻雀搜索算法;具体为:
采用分段映射方法初始化种群,并初始化所述种群中每个粒子的位置;
引入自适应权重更新所述每个粒子的位置,并计算更新位置后的每个粒子的适应度值;其中,引入自适应权重为:
引入自适应权重后,对发现者的位置进行更新,以得到每个粒子的位置;其中,所述发现者的位置更新为:
其中,表示自适应权重,/>表示初始权值,/>表示常量参数,/>表示最大迭代次数,/>表示第/>个麻雀在第/>维中的位置信息,/>表示当前迭代次数,/>表示服从正态分布的随机数,/>表示1xd的矩阵,/>表示预警值,/>表示安全值,/>表示随机数;
根据所述适应度值,采用排序配对学习更新种群进行循环迭代,以得到排序配对的自适应麻雀搜索算法;
采用所述排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;
将所述最优数量的内禀模态函数分量输入至所述异常检测模型中进行流式数据的异常检测,得到异常检测结果。
2.根据权利要求1所述的流式数据的异常检测方法,其特征在于,通过如下方式构建所述分段映射方法:
其中,表示麻雀的数量,/>表示第/>个麻雀的原始位置,/>表示分段映射后的麻雀的初始位置,/>表示用于控制四段式的分段范围无重叠的控制参数。
3.根据权利要求1所述的流式数据的异常检测方法,其特征在于,所述根据所述适应度值,采用排序配对学习更新种群,包括:
将每个粒子的适应度值进行排序,得到排序后的适应度值;
将所述排序后的适应度值分成范例组和学习组;
将学习组向范例组进行配对学习,以更新种群。
4.一种流式数据的异常检测系统,其特征在于,所述流式数据的异常检测系统应用于工业安全领域,所述流式数据的异常检测系统包括:
数据处理单元,用于对流式数据集进行预处理,得到预处理后的流式数据集;
数据分解单元,用于通过引入相关系数构建迭代最优的变分模态分解方法,并采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;其中:
根据所述相关系数构建目标函数;具体为:
通过如下方式构建所述相关系数:
其中,表示第/>个内禀模态函数分量与原始信号的相关系数,/>表示原始信号,/>表示第/>个内禀模态函数分量;
通过如下方式构建目标函数:
其中,表示目标函数,/>表示初始迭代参数;
采用迭代方法,基于所述目标函数迭代优化变分模态分解方法,直到所述目标函数的结果小于阈值,得到迭代最优的变分模态分解方法;
采用所述迭代最优的变分模态分解方法对所述预处理后的流式数据集进行分解,得到最优数量的内禀模态函数分量;
算法优化单元,用于基于排序配对学习构建排序配对的自适应麻雀搜索算法;具体为:
采用分段映射方法初始化种群,并初始化所述种群中每个粒子的位置;
引入自适应权重更新所述每个粒子的位置,并计算更新位置后的每个粒子的适应度值;其中,引入自适应权重为:
引入自适应权重后,对发现者的位置进行更新,以得到每个粒子的位置;其中,所述发现者的位置更新为:
其中,表示自适应权重,/>表示初始权值,/>表示常量参数,/>表示最大迭代次数,/>表示第/>个麻雀在第/>维中的位置信息,/>表示当前迭代次数,/>表示服从正态分布的随机数,/>表示1xd的矩阵,/>表示预警值,/>表示安全值,/>表示随机数;
根据所述适应度值,采用排序配对学习更新种群进行循环迭代,以得到排序配对的自适应麻雀搜索算法;
模型构建单元,用于采用所述排序配对的自适应麻雀搜索算法对GRU网络中的超参数进行优化,构建流式数据的异常检测模型;
异常检测单元,用于将所述最优数量的内禀模态函数分量输入至所述异常检测模型中进行流式数据的异常检测,得到异常检测结果。
5.一种流式数据的异常检测设备,其特征在于,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至3任一项所述的流式数据的异常检测方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至3任一项所述的流式数据的异常检测方法。
CN202311301731.5A 2023-10-10 2023-10-10 一种流式数据的异常检测方法、系统、设备及存储介质 Active CN117056847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311301731.5A CN117056847B (zh) 2023-10-10 2023-10-10 一种流式数据的异常检测方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311301731.5A CN117056847B (zh) 2023-10-10 2023-10-10 一种流式数据的异常检测方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117056847A CN117056847A (zh) 2023-11-14
CN117056847B true CN117056847B (zh) 2024-01-30

Family

ID=88666608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311301731.5A Active CN117056847B (zh) 2023-10-10 2023-10-10 一种流式数据的异常检测方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117056847B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569478A (zh) * 2019-09-12 2019-12-13 北京航空航天大学 用于编码器信号分析的改进变分模态分解方法
WO2021007812A1 (zh) * 2019-07-17 2021-01-21 深圳大学 一种深度神经网络超参数优化方法、电子设备及存储介质
CN112880688A (zh) * 2021-01-27 2021-06-01 广州大学 基于混沌自适应麻雀搜索算法的无人机三维航迹规划方法
CN113238666A (zh) * 2021-05-24 2021-08-10 江苏科技大学 基于麻雀搜索算法优化的gru的船舶运动姿态的预测方法
CN114819267A (zh) * 2022-03-18 2022-07-29 华南师范大学 一种短期负荷的预测方法、装置、电子设备和存储介质
CN115018157A (zh) * 2022-06-06 2022-09-06 中南大学 基于emd-cassa-elm的地表沉降预测方法
CN115185184A (zh) * 2022-07-08 2022-10-14 哈尔滨理工大学 一种电液位置伺服系统多参数辨识方法
CN115545151A (zh) * 2022-08-25 2022-12-30 南京上铁电子工程有限公司 训练用于时间序列数据预测的预测模型的方法及相关设备
CN116402202A (zh) * 2023-03-20 2023-07-07 山东鲁软数字科技有限公司 一种基于超参数优化的母线负荷预测方法及系统
CN116562908A (zh) * 2023-05-05 2023-08-08 佛山科学技术学院 一种基于双层vmd分解和ssa-lstm的电价预测方法
CN116822345A (zh) * 2023-06-15 2023-09-29 桂林电子科技大学 一种基于ssa-vmd-gru的滑坡位移预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190354836A1 (en) * 2018-05-17 2019-11-21 International Business Machines Corporation Dynamic discovery of dependencies among time series data using neural networks

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021007812A1 (zh) * 2019-07-17 2021-01-21 深圳大学 一种深度神经网络超参数优化方法、电子设备及存储介质
CN110569478A (zh) * 2019-09-12 2019-12-13 北京航空航天大学 用于编码器信号分析的改进变分模态分解方法
CN112880688A (zh) * 2021-01-27 2021-06-01 广州大学 基于混沌自适应麻雀搜索算法的无人机三维航迹规划方法
CN113238666A (zh) * 2021-05-24 2021-08-10 江苏科技大学 基于麻雀搜索算法优化的gru的船舶运动姿态的预测方法
CN114819267A (zh) * 2022-03-18 2022-07-29 华南师范大学 一种短期负荷的预测方法、装置、电子设备和存储介质
CN115018157A (zh) * 2022-06-06 2022-09-06 中南大学 基于emd-cassa-elm的地表沉降预测方法
CN115185184A (zh) * 2022-07-08 2022-10-14 哈尔滨理工大学 一种电液位置伺服系统多参数辨识方法
CN115545151A (zh) * 2022-08-25 2022-12-30 南京上铁电子工程有限公司 训练用于时间序列数据预测的预测模型的方法及相关设备
CN116402202A (zh) * 2023-03-20 2023-07-07 山东鲁软数字科技有限公司 一种基于超参数优化的母线负荷预测方法及系统
CN116562908A (zh) * 2023-05-05 2023-08-08 佛山科学技术学院 一种基于双层vmd分解和ssa-lstm的电价预测方法
CN116822345A (zh) * 2023-06-15 2023-09-29 桂林电子科技大学 一种基于ssa-vmd-gru的滑坡位移预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PENGYUN JIA et al..Short-Term Photovoltaic Power Forecasting Based on VMD and ISSA-GRU.IEEE Access.2021,第9卷105939-105950. *
Short-Term Photovoltaic Power Forecasting Based on VMD and ISSA-GRU;PENGYUN JIA et al.;IEEE Access;第9卷;105939-105950 *
基于变分模态分解和LSSVM的风电场短期风速预测;张妍;韩璞;王东风;王少蕊;;太阳能学报(第01期);全文 *
融合边界处理机制的学习型麻雀搜索算法;王子恺 等;北京航空航天大学学报(第8期);1-8 *

Also Published As

Publication number Publication date
CN117056847A (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
Lemhadri et al. Lassonet: Neural networks with feature sparsity
Jin et al. Bayesian symbolic regression
Weber et al. CMARS: a new contribution to nonparametric regression with multivariate adaptive regression splines supported by continuous optimization
Angelov et al. A new type of simplified fuzzy rule-based system
Scornet On the asymptotics of random forests
Liu et al. A hybrid WA–CPSO-LSSVR model for dissolved oxygen content prediction in crab culture
CN112668128A (zh) 联邦学习系统中终端设备节点的选择方法及装置
CN109754078A (zh) 用于优化神经网络的方法
Kpotufe et al. A tree-based regressor that adapts to intrinsic dimension
Ren et al. Correntropy-based robust extreme learning machine for classification
Mall et al. Representative subsets for big data learning using k-NN graphs
McNames et al. Winning entry of the KU Leuven time-series prediction competition
Maat et al. Efficient optimization of echo state networks for time series datasets
CN115034430A (zh) 碳排放量预测方法、装置、终端及存储介质
CN115824261A (zh) 一种控制力矩陀螺仪故障检测方法、装置及相关存储介质
Liang Annealing stochastic approximation Monte Carlo algorithm for neural network training
Liu et al. Glowimp: combining glow and gan for multivariate time series imputation
Liao et al. Migratory logistic regression for learning concept drift between two data sets with application to UXO sensing
Blanquero et al. On optimal regression trees to detect critical intervals for multivariate functional data
CN117056847B (zh) 一种流式数据的异常检测方法、系统、设备及存储介质
CN114239945A (zh) 短期电力负荷预测方法、装置、设备及存储介质
Zhou et al. The automatic model selection and variable kernel width for RBF neural networks
Chen et al. Towards efficient multiobjective hyperparameter optimization: a multiobjective multi-fidelity bayesian optimization and hyperband algorithm
Sharma et al. PULSE: Proactive uncovering of latent severe anomalous events in IIoT using LSTM-RF model
Similä et al. Combined input variable selection and model complexity control for nonlinear regression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant