CN116432132A - 异常数据生成方法、装置、电子设备及存储介质 - Google Patents

异常数据生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116432132A
CN116432132A CN202310327859.2A CN202310327859A CN116432132A CN 116432132 A CN116432132 A CN 116432132A CN 202310327859 A CN202310327859 A CN 202310327859A CN 116432132 A CN116432132 A CN 116432132A
Authority
CN
China
Prior art keywords
data
operation data
abnormal
condition
generation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310327859.2A
Other languages
English (en)
Inventor
吕劲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sungrow Power Supply Co Ltd
Original Assignee
Sungrow Power Supply Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sungrow Power Supply Co Ltd filed Critical Sungrow Power Supply Co Ltd
Priority to CN202310327859.2A priority Critical patent/CN116432132A/zh
Publication of CN116432132A publication Critical patent/CN116432132A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种异常数据生成方法、装置、电子设备及存储介质,属于数据处理技术领域。所述异常数据生成方法包括:获取目标设备在设备运行正常工况下的第一运行数据;基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据;基于所述第二运行数据,模拟数据传输异常工况,得到所述目标设备的异常运行数据。该方法通过模拟生成目标设备在设备运行异常工况下的第二运行数据,并模拟数据传输异常工况传输第二运行数据,得到接近真实场景的异常运行数据,可以有效保证生成异常数据的质量,异常数据的真实性和可靠性高,有助于提高故障监测质量。

Description

异常数据生成方法、装置、电子设备及存储介质
技术领域
本申请属于数据处理技术领域,尤其涉及一种异常数据生成方法、装置、电子设备及存储介质。
背景技术
故障监测需求日益增多,通过故障检测,可以及时发现故障,避免设备硬件损坏,节省资金成本。异常数据是故障监测类算法开发和验证的关键,异常数据的质量决定故障监测的质量。但实际生产中,故障设备有限,异常数据量较少且难以获取,大多采用模拟的方法生成异常数据,进行故障监测类算法的开发工作。
目前,异常数据的模拟生成主要是对原始的故障数据进行学习,通过迁移学习或对抗生成网络等学习手段,进行数据仿真。这类技术生成的异常数据质量普遍较低,与真实场景也有较大差异,用于故障监测类算法的开发工作时,可能会影响模型的准确率、泛化性和鲁棒性表现。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种异常数据生成方法、装置、电子设备及存储介质,可以有效保证生成异常数据的质量,异常数据的真实性和可靠性高,有助于提高故障监测质量。
第一方面,本申请提供了一种异常数据生成方法,该方法包括:
获取目标设备在设备运行正常工况下的第一运行数据;
基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据;
基于所述第二运行数据,模拟数据传输异常工况,得到所述目标设备的异常运行数据。
根据本申请的异常数据生成方法,通过模拟生成目标设备在设备运行异常工况下的第二运行数据,并模拟数据传输异常工况传输第二运行数据,得到接近真实场景的异常运行数据,可以有效保证生成异常数据的质量,异常数据的真实性和可靠性高,有助于提高故障监测质量。
根据本申请的一个实施例,所述基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据,包括:
对所述第一运行数据添加白噪声,得到第三运行数据,所述第三运行数据符合高斯分布;
对所述第三运行数据进行稳定处理,得到所述第二运行数据,所述第二运行数据符合稳定分布。
根据本申请的一个实施例,所述对所述第一运行数据添加白噪声,得到第三运行数据,包括:
为所述第一运行数据添加高斯白噪声,得到高斯白噪声运行数据;
将所述高斯白噪声运行数据输入至带通型滤波器,获得所述带通型滤波器输出的所述第三运行数据,所述带通型滤波器的通频带宽小于所述带通型滤波器的中心频率。
根据本申请的一个实施例,所述对所述第三运行数据进行稳定处理,得到所述第二运行数据,包括:
根据Alpha稳定分布算法,对所述第三运行数据进行处理,得到所述第二运行数据。
根据本申请的一个实施例,所述模拟数据传输异常工况,包括:
使用流量控制工具模拟所述数据传输异常工况,传输所述第二运行数据。
根据本申请的一个实施例,所述数据传输异常工况包括网络延迟工况、网络丢包工况、数据包重复工况和数据包乱序工况中的至少一个。
第二方面,本申请提供了一种异常数据生成装置,该装置包括:
获取模块,用于获取目标设备在设备运行正常工况下的第一运行数据;
第一处理模块,用于基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据;
第二处理模块,用于基于所述第二运行数据,模拟数据传输异常工况,得到所述目标设备的异常运行数据。
根据本申请的异常数据生成装置,通过模拟生成目标设备在设备运行异常工况下的第二运行数据,并模拟数据传输异常工况传输第二运行数据,得到接近真实场景的异常运行数据,可以有效保证生成异常数据的质量,异常数据的真实性和可靠性高,有助于提高故障监测质量。
第三方面,本申请提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的异常数据生成方法。
第四方面,本申请提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的异常数据生成方法。
第五方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的异常数据生成方法。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请实施例提供的异常数据生成方法的流程示意图之一;
图2是本申请实施例提供的异常数据生成方法的流程示意图之二;
图3是本申请实施例提供的异常数据生成装置的结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的异常数据生成方法、异常数据生成装置、电子设备和可读存储介质进行详细地说明。
其中,异常数据生成方法可应用于终端,具体可由,终端中的硬件或软件执行。
该终端包括但不限于具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话或平板电脑等便携式通信设备。还应当理解的是,在某些实施例中,该终端可以不是便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
以下各个实施例中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和控制杆的一个或多个其它物理用户接口设备。
本申请实施例提供的异常数据生成方法,该异常数据生成方法的执行主体可以为电子设备或者电子设备中能够实现该异常数据生成方法的功能模块或功能实体,本申请实施例提及的电子设备包括但不限于手机、平板电脑、电脑、相机和可穿戴设备等,下面以电子设备作为执行主体为例对本申请实施例提供的异常数据生成方法进行说明。
如图1所示,该异常数据生成方法包括:步骤110、步骤120和步骤130。
步骤110、获取目标设备在设备运行正常工况下的第一运行数据。
其中,设备运行正常工况是目标设备正常运行的工况,获取的第一运行数据是正常范围内的设备运行数据。
在该步骤中,可以控制目标设备在设备运行正常工况下运行,获取目标设备的第一运行数据。
步骤120、基于第一运行数据,模拟生成目标设备在设备运行异常工况下的第二运行数据。
其中,设备运行异常工况是目标设备异常运行的工况,第二运行数据是偏离正常范围的设备运行数据。
例如,设备运行异常工况可以是目标设备出现组件故障、损坏、老化或短路等情况时对应的工况,也可以是目标设备出现持续升温、数据骤降等情况时对应的工况。
在该步骤中,根据目标设备正常范围内的第一运行数据,模拟生成目标设备在设备运行异常工况下的偏离正常范围的第二运行数据。
在实际执行中,可以针对第一运行数据添加噪声数据或增加异常值,使得第一运行数据偏离正常范围,模拟生成目标设备在设备运行异常工况下的第二运行数据。
可以理解的是,第二运行数据是模拟目标设备发生内部故障时的异常数据。
步骤130、基于第二运行数据,模拟数据传输异常工况,得到目标设备的异常运行数据。
在该步骤中,可以以模拟目标设备自身内部故障生成的第二运行数据为数据基础,在数据传输异常工况下传输第二运行数据,得到目标设备的异常运行数据。
需要说明的是,设备运行数据通过传输控制协议(TCP)或消息队列传输(MQTT)等协议从设备端采集到服务器,服务器带宽和网络会影响数据的传输速度和传输质量,当网络发生抖动、连接超时或断网等情况,数据数值可能会突变为零值、骤降或骤升,正常范围数据会变成异常数据。
在该实施例中,模拟数据传输异常工况传输第二运行数据,模拟设备运行数据在传输过程中可能出现异常的情况,得到的异常运行数据更加接近真实场景。
需要说明的是,异常数据的产生可分为内外两个方面,外部原因主要是数据传输过程的异常工况造成的,内部原因主要是设备自身故障的异常工况造成的。
本申请实施例从异常数据产生的真实场景出发,内部通过模拟生成目标设备自身内部故障时的第二运行数据,外部通过模拟数据传输异常工况传输第二运行数据,得到最终的异常运行数据,异常运行数据是更加接近真实场景的异常数据,真实性和可靠性大大提高。
从内外两个方面模拟异常数据产生的真实场景,相比相关技术中只考虑设备自身故障的模拟更加全面可靠,且模拟设备运行异常工况和模拟数据传输异常工况适用于各种类型设备的异常数据模拟,通用性强。
在该实施例中,目标设备的异常运行数据可以用于目标设备的故障监测算法的开发工作,异常运行数据是接近真实场景的异常数据,可以帮助故障监测算法获得更好的监测效果,有效提升故障监测算法相关模型的准确率、泛化性和鲁棒性。
根据本申请实施例提供的异常数据生成方法,通过模拟生成目标设备在设备运行异常工况下的第二运行数据,并模拟数据传输异常工况传输第二运行数据,得到接近真实场景的异常运行数据,可以有效保证生成异常数据的质量,异常数据的真实性和可靠性高,有助于提高故障监测质量。
在一些实施例中,步骤120、基于第一运行数据,模拟生成目标设备在设备运行异常工况下的第二运行数据,可以包括:
对第一运行数据添加白噪声,得到第三运行数据,第三运行数据符合高斯分布;
对第三运行数据进行稳定处理,得到第二运行数据,第二运行数据符合稳定分布。
白噪声是指在较宽的频率范围内,各等带宽的频带所含的噪声能量相等的噪声,属于功率频谱密度为常数的随机信号。
在该实施例中,对第一运行数据添加白噪声,得到符合高斯分布的第三运行数据,再对第三运行数据进行稳定处理,使得模拟目标设备自身内部故障生成的第二运行数据符合稳定分布。
通过白噪声对正常范围的第一运行数据进行加工,得到近似高斯分布的第三运行数据这一噪声数据,再对该噪声数据进行稳定处理,保证第二运行数据这一异常数据的正确性和可靠性。
在一些实施例中,对第一运行数据添加白噪声,得到第三运行数据,包括:
为第一运行数据添加高斯白噪声,得到高斯白噪声运行数据;
将高斯白噪声运行数据输入至带通型滤波器,获得带通型滤波器输出的第三运行数据,带通型滤波器的通频带宽小于带通型滤波器的中心频率。
在该实施例中,为第一运行数据添加高斯白噪声,得到的高斯白噪声运行数据符合高斯分布,将高斯白噪声运行数据输入至带通型滤波器进行处理,带通型滤波器的通频带宽小于带通型滤波器的中心频率,得到的第三运行数据属于窄带高斯白噪声数据。
在实际执行中,可以对第一运行数据进行基于窄带高斯白噪声的异常模拟,得到第三运行数据。
下面对窄带高斯白噪声的异常模拟过程进行具体描述。
白噪声的功率谱密度Pn(f)在所有频率f范围内都是常数n0,数学表达式如下:
Figure BDA0004154852510000061
高斯白噪声是指白噪声取值的概率分布服从高斯分布,任意两个不同时刻上的随机变量之间不仅是非相关的还是相互独立的。
窄带高斯白噪声是带通型高斯白噪声的一种特殊形式,当高斯白噪声通过带通型滤波器,而此滤波器的通频带宽B远小于其中心频率f0(即B<<f0)时,带通型滤波器输出端的高斯白噪声就是窄带高斯白噪声,数学表达式如下:
n(t)=nc(t)coswct-ns(t)sinwct
E[n(t)]=E[nc(t)]=E[ns(t)]=0
σn 2=σc 2=σs 2
其中,n(t)表示窄带高斯白噪声平均功率,nc(t)表示窄带高斯白噪声平均功率的同向分量,ns(t)表示窄带高斯白噪声平均功率的正交分量,E[n(t)]表示窄带白噪声幅度均值,σn 2表示窄带高斯白噪声幅度均值方差。
在实际执行中,以第一运行数据的均匀分布样本为基础,通过函数变换得到高斯分布样本,即高斯白噪声运行数据,通过带通型滤波器处理,得到窄带高斯白噪声数据,即点运行数据。
函数变换得到高斯分布样本可以通过如下步骤实现:
第一步:对瑞利分布的概率密度函数积分,计算出概率分布函数F,公式如下:
Figure BDA0004154852510000071
Figure BDA0004154852510000072
其中,σ是瑞利分布概率密度函数中随机变量x的方差。
第二步:求此概率分布函数的反函数F-1,公式如下:
Figure BDA0004154852510000073
第三步:生成两个在[0,1]上服从均匀分布的随机变量x1和x2
Figure BDA0004154852510000074
第四步:将第三步中得到的随机变量x1和x2带入如下公式:
Figure BDA0004154852510000075
其中,Y值服从高斯分布。
在该实施例中,通过窄带高斯白噪声的异常模拟,得到的第三运行数据,使得第一运行数据这一正常范围数据偏离方向依旧服从高斯分布,符合目标设备内部产生异常数据的真实场景,保证模拟的第三运行数据的有效性。
在一些实施例中,对第三运行数据进行稳定处理,得到第二运行数据,包括:
根据Alpha稳定分布算法,对第三运行数据进行处理,得到第二运行数据。
在该实施例中,对第三运行数据进行基于Alpha稳定分布的噪声异常模拟,使其符合Alpha稳定分布,得到内部稳定的第二运行数据。
在实际执行中,通过窄带高斯白噪声的异常模拟,对正常范围的第一运行数据添加白噪声,并计算数据均值,再用Alpha稳定分布算法对第三运行数据进行稳定异常处理,最终得到内部稳定的第二运行数据。
下面对基于Alpha稳定分布的噪声异常模拟的进行具体描述。
稳定分布的定义为:假设X1、X2是随机变量X的独立样本,若对于任何正数A和正数B都存在正数C和实数D满足如下公式:
Figure BDA0004154852510000076
则X服从稳定分布,
Figure BDA0004154852510000081
表示分布相同。
若D=0,上式依然成立,那么X是严格稳定的。
Alpha稳定分布的定义为:针对稳定而非内部的随机变量X,如果存在一个数α∈(0,2],使满足A、B、C满足如下公式:
Aα+Bα=Cα
那么称X符合Alpha稳定分布。
Alpha稳定分布通常没有封闭的概率密度函数解析式,但存在统一的特征函数表达式:
Figure BDA0004154852510000082
Figure BDA0004154852510000083
Figure BDA0004154852510000084
其中,j是常数;
α为特征指数(可称为随机扰动因子),α决定Alpha稳定分布概率密度函数的变化程度,α越小,变化程度越强,大幅值突变出现的概率越高,当α=2时,Alpha稳定分布退化为高斯分布;
β为偏斜指数,取值范围是-1≤β≤1,β决定Alpha稳定分布概率密度函数的偏斜程度,当β=0时,Alpha稳定分布是对称分布;
γ为分散系数,取值范围是0<γ<+∞,γ用以描述随机变量偏离均值或中值的程度;
u为位置参数,用于描述Alpha稳定分布概率密度函数的绝对位置,当1<α≤2时,u与α稳定分布的均值相等,当0<α<1时,u与α稳定分布的中值相等。
当u=0,γ=1时,Alpha稳定分布为标准Alpha稳定分布;
当α=2,β=0,
Figure BDA0004154852510000085
时,Alpha稳定分布退化为高斯分布;
当α=1,β=0时,Alpha稳定分布为柯西分布。
在该实施例中,通过Fourier逆变换法可以获取既定条件下的Alpha稳定分布概率密度分布。
当u=0,γ=1时,对特征函数进行变换,可以得到概率密度表达式为:
Figure BDA0004154852510000091
当u,γ不满足标准Alpha稳定分布时,只有高斯分布、柯西分布和Levy分布存在该概率密度表达式。
以Alpha稳定分布来生成随机数,可以得到稳定的随机数分布,当α≠1时,
Figure BDA0004154852510000092
其中,
Figure BDA0004154852510000093
V是服从
Figure BDA0004154852510000094
的均匀分布,W服从均值为1的指数分布。
u为均值,在u上加上随机扰动因子α,调整随机扰动因子α取值范围,可进一步得到符合稳定分布的异常数据。
例如,近似高斯分布的第三运行数据的均值为u,在u上加上随机扰动因子α,调整随机扰动因子α取值范围,得到符合稳定分布的第二运行数据。
在该实施例中,运用窄带高斯白噪声算法对第一运行数据进行加工,加深高斯白噪声分布正确性,得到近似高斯分布的第三运行数据,通过Alpha稳定分布算法对第三运行数据进行Alpha模拟修正,保证第二运行数据的可靠性。
在一些实施例中,步骤130、模拟数据传输异常工况,可以包括:
使用流量控制工具模拟数据传输异常工况,传输第二运行数据。
其中,流量控制工具(Traffic Control,TC)是操作系统中实现数据流量控制的工具。
在实际执行中,流量控制工具可以在数据传输的输出端口处建立队列,实现相应的流量控制,模拟数据传输异常工况。
在该实施例中,通过使用流量控制工具模拟数据传输异常工况,使得第二运行数据的数据传输过程更加真实,得到接近真实情况的异常运行数据。
其中,数据传输异常工况可以为如下至少一种工况:
其一,网络延迟工况。
网络延迟指数据在网络介质中传输,信息量过大且不加以限制,超额的网络流量会导致设备反应缓慢。
在实际执行中,50毫秒以下延迟相对较为正常,超过100毫秒就较为卡顿,数据延时比较严重;如果网络延时在1秒,采集数据分辨率是1秒,那么当前时刻的数据就会被下个时刻的数据覆盖,导致漏采或少采,如果此刻测点数据丢失,就会出现零值,从而产生异常数据。
在该实施例中,基于第二运行数据,可以使用流量控制工具发送100毫秒或1秒左右的延时命令,模拟出网络延迟工况下的异常运行数据。
其二,网络丢包工况。
网络丢包指数据在网络中被分成数据包传输的,每个数据包中有表示数据信息和提供数据路由的帧。
数据包在一般介质中传播是总有一小部分由于两个终端的距离过大会丢失,而大部分数据包会到达目的终端,当发生网络丢包时,原始数据可能就会出现异常,导致偏离正常值。
在该实施例中,基于第二运行数据,可以使用流量控制工具发送随机丢掉1%、2%等数量的数据包,模拟出网络丢包工况下的异常运行数据。
其三,数据包重复工况。
数据包重复指在网络传输过程中,同一数据包可能会出现传输多次的情况,数据包重复可能会导致数据重复,原本正确的数据被前一个异常数据覆盖,导致异常数据生成。
在该实施例中,基于第二运行数据,可以使用流量控制工具随机产生1%、2%等数量的重复数据包,模拟出数据包重复工况下的异常运行数据。
其四,数据包乱序工况。
数据包乱序是指数据包的失序到达,在数据传输过程中较为常见,IP层并不能保证数据包的有序性,每个数据包的发送都可能会选择当前情况传输速度最快的链路,所以可能出现发送顺序为A->B->C的三个数据包,到达接收端的数据包顺序是C->A->B或者B->C->A的情况,数据包乱序可能会导致数据重组,使得原先的数据出现混乱,导致异常数据生成。
在该实施例中,基于第二运行数据,可以使用流量控制工具随机将一部分的数据包立刻发送,其他数据包延迟一定时间发送,模拟出数据包乱序工况下的异常运行数据。
模拟网络延迟工况、网络丢包工况、数据包重复工况或数据包乱序工况等数据传输异常工况传输第二运行数据,得到的异常运行数据真实性和可靠性更高。
本申请实施例,在外部环境模拟数据传输异常工况的多种情况,有效增加样本的丰富性,使得异常数据种类多,在内部模拟时不断使用窄带高斯白噪声和Alpha稳定分布等算法修正,让异常数据更加稳定可靠,近似真实场景,生成的异常数据可以进行不同程度监测和算法应用。
下面介绍一个异常数据生成的具体实施例。
如图2所示,获取目标设备在设备运行正常工况下的第一运行数据,第一运行数据属于正常范围数据,计算第一运行数据的均值和标准差。
基于第一运行数据,进行窄带高斯白噪声模拟,生成第三运行数据,重新计算第三运行数据这一样本数据的均值,判断其是否近似满足高斯分布。
根据Alpha稳定分布算法,对第三运行数据进行异常模拟,生成随机扰动因子α,结合第三运行数据的均值u,生成内部模拟完成的异常数据,即第二运行数据。
通过流量控制工具模拟外部网络故障,模拟网络延时、网络丢包、数据包重复和数据包乱序等数据传输异常工况,最终生成目标设备的异常运行数据。
在该实施例中,在内部异常模拟时,选用窄带高斯白噪声模拟,提升高斯白噪声分布正确性,对其稳定性进行Alpha稳定分析的模拟修正,从内部保障异常数据的可靠性,再从外部多场景网络异常模拟,更加贴近生产环境,极大的保证了异常数据的真实性,异常数据可用于帮助验证故障监测算法效果,提高故障监测质量。
本申请实施例提供的异常数据生成方法,执行主体可以为异常数据生成装置。本申请实施例中以异常数据生成装置执行异常数据生成方法为例,说明本申请实施例提供的异常数据生成装置。
本申请实施例还提供一种异常数据生成装置。
如图3所示,该异常数据生成装置包括:
获取模块310,用于获取目标设备在设备运行正常工况下的第一运行数据;
第一处理模块320,用于基于第一运行数据,模拟生成目标设备在设备运行异常工况下的第二运行数据;
第二处理模块330,用于基于第二运行数据,模拟数据传输异常工况,得到目标设备的异常运行数据。
根据本申请实施例提供的异常数据生成装置,通过模拟生成目标设备在设备运行异常工况下的第二运行数据,并模拟数据传输异常工况传输第二运行数据,得到接近真实场景的异常运行数据,可以有效保证生成异常数据的质量,异常数据的真实性和可靠性高,有助于提高故障监测质量。
在一些实施例中,第一处理模块320,用于对第一运行数据添加白噪声,得到第三运行数据,第三运行数据符合高斯分布;
对第三运行数据进行稳定处理,得到第二运行数据,第二运行数据符合稳定分布。
在一些实施例中,第一处理模块320,用于为第一运行数据添加高斯白噪声,得到高斯白噪声运行数据;
将高斯白噪声运行数据输入至带通型滤波器,获得带通型滤波器输出的第三运行数据,带通型滤波器的通频带宽小于带通型滤波器的中心频率。
在一些实施例中,第一处理模块320,用于根据Alpha稳定分布算法,对第三运行数据进行处理,得到第二运行数据。
在一些实施例中,第二处理模块330,用于使用流量控制工具模拟数据传输异常工况,传输第二运行数据。
在一些实施例中,数据传输异常工况包括网络延迟工况、网络丢包工况、数据包重复工况和数据包乱序工况中的至少一个。
本申请实施例中的异常数据生成装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的异常数据生成装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为IOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的异常数据生成装置能够实现图1至图2的方法实施例实现的各个过程,为避免重复,这里不再赘述。
在一些实施例中,如图4所示,本申请实施例还提供一种电子设备400,包括处理器401、存储器402及存储在存储器402上并可在处理器401上运行的计算机程序,该程序被处理器401执行时实现上述异常数据生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
本申请实施例还提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述异常数据生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述异常数据生成方法。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述异常数据生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。

Claims (10)

1.一种异常数据生成方法,其特征在于,包括:
获取目标设备在设备运行正常工况下的第一运行数据;
基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据;
基于所述第二运行数据,模拟数据传输异常工况,得到所述目标设备的异常运行数据。
2.根据权利要求1所述的异常数据生成方法,其特征在于,所述基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据,包括:
对所述第一运行数据添加白噪声,得到第三运行数据,所述第三运行数据符合高斯分布;
对所述第三运行数据进行稳定处理,得到所述第二运行数据,所述第二运行数据符合稳定分布。
3.根据权利要求2所述的异常数据生成方法,其特征在于,所述对所述第一运行数据添加白噪声,得到第三运行数据,包括:
为所述第一运行数据添加高斯白噪声,得到高斯白噪声运行数据;
将所述高斯白噪声运行数据输入至带通型滤波器,获得所述带通型滤波器输出的所述第三运行数据,所述带通型滤波器的通频带宽小于所述带通型滤波器的中心频率。
4.根据权利要求2所述的异常数据生成方法,其特征在于,所述对所述第三运行数据进行稳定处理,得到所述第二运行数据,包括:
根据Alpha稳定分布算法,对所述第三运行数据进行处理,得到所述第二运行数据。
5.根据权利要求1所述的异常数据生成方法,其特征在于,所述模拟数据传输异常工况,包括:
使用流量控制工具模拟所述数据传输异常工况,传输所述第二运行数据。
6.根据权利要求1-5任一项所述的异常数据生成方法,其特征在于,所述数据传输异常工况包括网络延迟工况、网络丢包工况、数据包重复工况和数据包乱序工况中的至少一个。
7.一种异常数据生成装置,其特征在于,包括:
获取模块,用于获取目标设备在设备运行正常工况下的第一运行数据;
第一处理模块,用于基于所述第一运行数据,模拟生成所述目标设备在设备运行异常工况下的第二运行数据;
第二处理模块,用于基于所述第二运行数据,模拟数据传输异常工况,得到所述目标设备的异常运行数据。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任一项所述异常数据生成方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6任一项所述的异常数据生成方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述异常数据生成方法。
CN202310327859.2A 2023-03-29 2023-03-29 异常数据生成方法、装置、电子设备及存储介质 Pending CN116432132A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310327859.2A CN116432132A (zh) 2023-03-29 2023-03-29 异常数据生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310327859.2A CN116432132A (zh) 2023-03-29 2023-03-29 异常数据生成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116432132A true CN116432132A (zh) 2023-07-14

Family

ID=87079064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310327859.2A Pending CN116432132A (zh) 2023-03-29 2023-03-29 异常数据生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116432132A (zh)

Similar Documents

Publication Publication Date Title
Ring et al. Flow-based network traffic generation using generative adversarial networks
US11444878B2 (en) Intelligent dataflow-based service discovery and analysis
JP2019061565A (ja) 異常診断方法および異常診断装置
CN113177209B (zh) 基于深度学习的加密流量分类方法及相关设备
CN106850687A (zh) 用于检测网络攻击的方法和装置
US11563654B2 (en) Detection device and detection method
JP6992039B2 (ja) テストデータ作成システムおよびテストデータ作成方法
CN113452676A (zh) 一种检测器分配方法和物联网检测系统
CN114143000B (zh) 基于不经意传输协议与秘密分享的匿踪查询方法及装置
CN114866310A (zh) 一种恶意加密流量检测方法、终端设备及存储介质
CN114363212A (zh) 一种设备检测方法、装置、设备和存储介质
CN112926628B (zh) 动作价值的确定方法、装置、学习框架、介质及设备
Lin et al. Towards oblivious network analysis using generative adversarial networks
CN116432132A (zh) 异常数据生成方法、装置、电子设备及存储介质
CN116843991A (zh) 模型训练方法、信息生成方法、装置、设备和介质
KR101876245B1 (ko) 지능형전자장치 성능검증 장치, 지능형전자장치 성능검증 시스템 및 컴퓨터 판독가능 기록 매체
CN111836297B (zh) 通信链路参数的预测方法、装置及终端设备
CN114826728A (zh) 设备认证方法、物联网终端设备、电子设备以及存储介质
CN113630379A (zh) 一种网络安全态势预测方法、装置、设备及存储介质
CN112003850A (zh) 一种基于云网络的流量监控方法、装置、设备及存储介质
CN114765634B (zh) 网络协议识别方法、装置、电子设备及可读存储介质
CN105827482B (zh) 基于预先随机测试的开放式网络节点信任评估方法
CN115664839B (zh) 隐私计算进程的安全监控方法、装置、设备、介质
CN114513369B (zh) 基于深度报文检测的物联网行为分析方法及系统
LU505014B1 (en) Computer-Implemented method and system for mitigating simulated cyberattacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination