CN111030850B - 一种scada系统数据采集周期控制方法及装置 - Google Patents
一种scada系统数据采集周期控制方法及装置 Download PDFInfo
- Publication number
- CN111030850B CN111030850B CN201911187517.5A CN201911187517A CN111030850B CN 111030850 B CN111030850 B CN 111030850B CN 201911187517 A CN201911187517 A CN 201911187517A CN 111030850 B CN111030850 B CN 111030850B
- Authority
- CN
- China
- Prior art keywords
- period
- data
- cpu
- utilization rate
- acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 47
- 230000003247 decreasing effect Effects 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000012544 monitoring process Methods 0.000 claims description 16
- 230000007423 decrease Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000013480 data collection Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 2
- 238000012706 support-vector machine Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0876—Aspects of the degree of configuration automation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明针对SCADA实时数据采集,提出一种SCADA系统数据采集周期控制方法及装置,通过事先采集与实际采集周期相关的特征样本数据,进行训练后得出SVR回归函数。在采集系统运行过程中,根据实际运行状态预测并自动调整实际采集周期。提高了SCADA系统采集效率和运行过程可控性。
Description
技术领域
本发明涉及一种数据采集周期控制方法及装置,尤其是涉及一种SCADA系统数据采集周期控制方法及装置。
背景技术
统计机器学习是进行样本分析的有效方法,SVM支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(泛化能力)。支持向量机方法主要优点有:1)专门针对有限样本情况,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;2)算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了其它方法中无法避免的局部极值问题。3)算法将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关。
SVM算法常用于分类识别等问题,但也可推广用于回归估计,即SVR支持向量回归算法,算法主要是通过升维后,在高维空间中构造线性决策函数来实现线性回归,用e不敏感函数时,其基础主要是e不敏感函数和核函数算法。若将拟合的数学模型表达多维空间的某一曲线,则根据e不敏感函数所得的结果,就是包括该曲线和训练点的“e管道”。在所有样本点中,只有分布在“管壁”上的那一部分样本点决定管道的位置,这一部分训练样本称为“支持向量”。
数据采集是整个SCADA系统实现业务功能的基础。SCADA系统采集实时数据时,一般都需要先配置好数据点的采集周期,数据采集服务运行时,按照此周期采集实时数据。由于采集单元从向设备发起数据请求,到收到设备返回数据,这个过程涉及通讯协议交互、数据传输和解析,需要一定的时间;因此,程序实际数据采集周期,比配置的采集周期要小,但大多还是按照原周期乘以小于1的系数作为实际采集周期(如:配置周期为T,实际周期T'可为T/2,T/3,...)。由于我们的目标是保证一个周期内至少进行1次数据采集,因此,实际采集周期应该是根据系统运行情况,可以动态调整的。如大规模应用中,数据点数目较多,按照固定周期进行采集,可能导致系统资源(CPU、内存)长期处于高负荷状态而不能满足运行指标要求;当后期增加设备导致增加数据点时,可能需要重新调整采集周期或者修改代码而中断系统运行;当并发访问SCADA系统请求实时数据的客户端数目增加时,会导致系统CPU、内存压力增加、数据传输实时性降低,降低整个SCADA系统的性能。
发明内容
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种SCADA系统数据采集周期控制方法,其特征在于,
实时监控系统的运行状态,包括:采集数据点数量、CPU使用率、内存使用率、网络输出流量;当运行状态发生变化且满足设定条件时,进行采集周期更新,包括:
步骤1、系统初始运行时,选定初始实际采集周期T1=配置周期T/5,按此采集数据;同时,记录当前周期T1下的实际运行参数:采集数据点数量count、CPU使用率cpu、内存使用率mem、网络输出流量flow;
步骤2、当SCADA系统配置单元增加、减少数据点数量时,根据当前数据点数量count2,1)中的cpu、mem、flow,组成特征向量,使用训练产生的回归模型period.mode,计算得到预测周期T2,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前采集数据点数量count=count2,cpu、mem、flow为当前实际运行参数;
步骤3、当向采集单元请求实时数据的SCADA客户端增加、减少导致网络输出流量发生变化时,通过当前的count、cpu、mem,和预估flow3,使用训练产生的回归模型period.mode,计算得到预测周期T3,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数;
步骤4、由于系统运行过程中,CPU使用率、内存使用率可能会产生波动;在这种情况下,当前CPU使用率cpu',或者内存使用率mem'与记录的CPU使用率cpu,内存使用率mem相比,出现5%以上的变化,则通过当前的count、cpu'、mem'、flow,使用训练产生的回归模型period.mode,计算得到预测周期T4,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数。
在上述的一种SCADA系统数据采集周期控制方法,回归模型period.mode具体获取方法包括:
步骤3.1、采集样本数据,具体包括
1)需要采集的样本数据包括:实际数据采集周期T'、数据点数目、CPU使用率、内存使用率、网络输出流量;
2)样本数据以向量格式存储,便于对样本进行训练;
即[目标值][特征1]:[特征值][特征2]:[特征值]...
由于我们的目标是获取实际数据采集周期,具体存储格式如下:
[实际数据采集周期T'][1]:[数据点数目][2]:[CPU使用率][3]:[内存使用率][4]:[网络输出流量];
样本数据文件记为:period.data;
步骤3.2、对采集的样本进行预处理,具体包括
1)样本数据缩放处理:SVR算法为防止某个特征过大或者过小,从而导致后续训练中起的作用不平衡,需要对原始样本数据进行缩放处理;另外,核函数计算中,会用到内积或者exp运算,不平衡的数据会导致计算困难,影响计算速度;缩放区间的大小也会对SVR参数的选取和建立SVR模型的速度产生影响,这里选择缩放范围为[0,1],能加快模型的预测速度;
2)缩放处理结果保存:进行缩放处理后的文件记为period.scale;
步骤3.3、选择SVR参数,包括算法选择、核函数选择以及最佳参数选择
步骤3.4、进行样本训练,具体是使用选取的核函数g和惩罚参数c,对预处理之后的样本period.scale进行训练,可得到训练后的SVR回归模型文件period.model,该文件中保存了经训练生成回归函数的相关信息。
在上述的一种SCADA系统数据采集周期控制方法,步骤3中flow3按以下步骤预估:
步骤1、定义flow3=flow*k'/k;其中,flow为原来的增减前网络流量;k为原来的增减前客户端数目;k'为当前增减后的客户端数目;
步骤2、原来客户端数目为0时,flow3=max_flow*k'/max_client_count;其中,max_flow为系统预设最大网络输出流量;max_client_count为系统支持最大客户端数量;k'为。前增减后的客户端数目。
一种SCADA系统数据采集周期控制装置,其特征在于,
采集运行状态监控模块:实时监控系统的运行状态,包括:采集数据点数量、CPU使用率、内存使用率、网络输出流量;当运行状态发生变化且满足设定条件时,通知实际采集周期预测及更新模块,进行采集周期更新,
实际采集周期预测及更新模块:接收采集运行状态监控模块的采集信息,并根据采集运行状态监控模块的反馈进行确定是否需要采集周期更新。
在上述的一种SCADA系统数据采集周期控制装置,采集运行状态监控模块包括
数据采集单元:系统初始运行时,选定初始实际采集周期T1=配置周期T/5,按此采集数据;同时,记录当前周期T1下的实际运行参数:采集数据点数量count、CPU使用率cpu、内存使用率mem、网络输出流量flow;
SCADA系统配置单元:进行SCADA系统配置;
数据更新单元一:当SCADA系统配置单元增加、减少数据点数量时,根据当前数据点数量count2,1)中的cpu、mem、flow,组成特征向量,数据更新单元使用训练产生的回归模型period.mode,计算得到预测周期T2,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前采集数据点数量count=count2,cpu、mem、flow为当前实际运行参数;
数据更新单元二:当向采集单元请求实时数据的SCADA客户端增加、减少导致网络输出流量发生变化时,通过当前的count、cpu、mem,和预估flow3,使用训练产生的回归模型period.mode,计算得到预测周期T3,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数;
数据更新单元三:由于系统运行过程中,CPU使用率、内存使用率可能会产生波动;在这种情况下,当前CPU使用率cpu',或者内存使用率mem'与记录的CPU使用率cpu,内存使用率mem相比,出现5%以上的变化,则通过当前的count、cpu'、mem'、flow,使用训练产生的回归模型period.mode,计算得到预测周期T4,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数。
在上述的一种SCADA系统数据采集周期控制装置,回归模型period.mode具体获取方法包括:
采集样本数据模块:用于
1)需要采集的样本数据包括:实际数据采集周期T'、数据点数目、CPU使用率、内存使用率、网络输出流量;
2)样本数据以向量格式存储,便于对样本进行训练;
即[目标值][特征1]:[特征值][特征2]:[特征值]...
由于需要获取实际数据采集周期,具体存储格式如下:
[实际数据采集周期T'][1]:[数据点数目][2]:[CPU使用率][3]:[内存使用率][4]:[网络输出流量];
样本数据文件记为:period.data;
样本预处理模块:
1)样本数据缩放处理:SVR算法为防止某个特征过大或者过小,从而导致后续训练中起的作用不平衡,需要对原始样本数据进行缩放处理;另外,核函数计算中,会用到内积或者exp运算,不平衡的数据会导致计算困难,影响计算速度;缩放区间的大小也会对SVR参数的选取和建立SVR模型的速度产生影响,这里选择缩放范围为[0,1],能加快模型的预测速度;
2)缩放处理结果保存:进行缩放处理后的文件记为period.scale;
SVR参数选择模块:包括算法选择、核函数选择以及最佳参数选择
样本训练模块:使用选取的核函数g和惩罚参数c,对预处理之后的样本period.scale进行训练,可得到训练后的SVR回归模型文件period.model,该文件中保存了经训练生成回归函数的相关信息.
在上述的一种SCADA系统数据采集周期控制装置,数据更新单元二中flow3按以下步骤预估:
步骤1、定义flow3=flow*k'/k;其中,flow为原来的增减前网络流量;k为原来的增减前客户端数目;k'为当前增减后的客户端数目;
步骤2、原来客户端数目为0时,flow3=max_flow*k'/max_client_count;其中,max_flow为系统预设最大网络输出流量;max_client_count为系统支持最大客户端数量;k'为当前增减后的客户端数目。
因此,本发明具有如下优点:本发明通过事先采集与实际采集周期相关的特征样本数据,进行训练后得出SVR回归函数。在采集系统运行过程中,根据实际运行状态预测并自动调整实际采集周期。提高了SCADA系统采集效率和运行过程可控性。自适应调控采集周期,能够极大地减少人工配置采集周期的工作量,且不中断系统业务;系统采集数据点有较大增加时,仍能满足实时性要求,从而提高系统的数据采集能力;采集过程中网络、内存、CPU等有波动时,可通过调整采集周期保证系统运行可控性。
附图说明
附图1是本发明的方法流程示意图。
具体实施方式
下面通过实施例,对本发明的技术方案作进一步具体的说明。
实施例:
一、面介绍本发明涉及的装置的具体结构,主要包括
采集样本数据模块:
1)需要采集的样本数据包括:实际数据采集周期T'、数据点数目、CPU使用率、内存使用率、网络输出流量。
2)样本数据以向量格式存储,便于对样本进行训练。
即[目标值][特征1]:[特征值][特征2]:[特征值]...
由于我们的目标是获取实际数据采集周期,具体存储格式如下:
[实际数据采集周期T'][1]:[数据点数目][2]:[CPU使用率][3]:[内存使用率][4]:[网络输出流量]。
样本数据文件记为:period.data。
样本预处理模块:
1)样本数据缩放处理:SVR算法为防止某个特征过大或者过小,从而导致后续训练中起的作用不平衡,需要对原始样本数据进行缩放处理。另外,核函数计算中,会用到内积或者exp运算,不平衡的数据会导致计算困难,影响计算速度。缩放区间的大小也会对SVR参数的选取和建立SVR模型的速度产生影响,这里选择缩放范围为[0,1],能加快模型的预测速度。
2)缩放处理结果保存:进行缩放处理后的文件记为period.scale。
SVR参数选择模块:
1)算法选择:由于本方案基于SVM建立回归模型,因此可选择SVM回归算法类型e-SVR。
2)核函数选择:SVM常用的核函数有这么几种:线性核函数(linear)、多项式核函数(polynomial)、径向基核函数(RBF)、Sigmoid核函数。通常应选取RBF,主要原因是:1)RBF可以将样本映射到一个更高维的空间,处理类别标签和特征之间的关系是非线性时的样本。2)与多项式核函数相比,RBF需要确定的参数较少,核函数参数的数量对模型复杂度有直接影响。3)线性核函数是RBF的一个特例,Sigmoid核函数在某些参数上具有与RBF相似的性能。因此,本方案选用的是径向基核函数(RBF)。
3)最佳参数选择:选取核函数后,还需选取相应的参数。通常比较重要的参数有gamma(-g):核函数中的函数设置,cost(-c):算法类型中的惩罚参数。一般采用交叉验证得到预处理样本period.scale最佳算法参数g和c。
样本训练模块:
使用选取的核函数g和惩罚参数c,对预处理之后的样本period.scale进行训练,可得到训练后的SVR回归模型文件period.model,该文件中保存了经训练生成回归函数的相关信息。
采集运行状态监控模块:
系统运行时,启用一个采集状态监控模块。该模块的作用是实时监控系统的运行状态,包括:采集数据点数量、CPU使用率、内存使用率、网络输出流量。当运行状态发生变化且满足一定条件时,通知“实际采集周期预测及更新模块”,进行采集周期更新。具体如下:
1)系统初始运行时,选定初始实际采集周期T1=配置周期T/5,按此采集数据。同时,记录当前周期T1下的实际运行参数:采集数据点数量count、CPU使用率cpu、内存使用率mem、网络输出流量flow。
2)当SCADA系统配置单元增加、减少数据点数量时,通知“实际采集周期预测及更新模块”,该模块根据当前数据点数量count2,1)中的cpu、mem、flow,组成特征向量,使用训练产生的回归模型period.mode,计算得到预测周期T2,即为当前实际采集周期T',并据此进行数据采集。本模块同时更新并记录当前采集数据点数量count=count2,cpu、mem、flow为当前实际运行参数。
3)当向采集单元请求实时数据的SCADA客户端增加、减少导致网络输出流量发生变化时,通知“实际采集周期预测及更新模块”,该模块通过当前的count、cpu、mem,和预估flow3,使用训练产生的回归模型period.mode,计算得到预测周期T3,即为当前实际采集周期T',并据此进行数据采集。本模块同时更新并记录当前实际cpu、mem、flow为当前实际运行参数。
其中,flow3按以下方式预估:
a)flow3=flow*k'/k。
flow:原来的网络流量(增减前);
k:原来的客户端数目(增减前);
k':当前客户端数目(增减后)。
b)原来客户端数目为0时,flow3=max_flow*k'/max_client_count。
max_flow:系统预设最大网络输出流量;
max_client_count:系统支持最大客户端数量;
k':当前客户端数目(增减后)。
4)由于系统运行过程中,CPU使用率、内存使用率可能会产生一定的波动。在这种情况下,当前CPU使用率cpu',或者内存使用率mem'与记录的CPU使用率cpu,内存使用率mem相比,出现5%以上的变化,则通知“实际采集周期预测及更新模块”,该模块通过当前的count、cpu'、mem'、flow,使用训练产生的回归模型period.mode,计算得到预测周期T4,即为当前实际采集周期T',并据此进行数据采集。本模块同时更新并记录当前实际cpu、mem、flow为当前实际运行参数。
实际采集周期预测及更新模块:
接收“采集运行状态监控模块”发送的更新采集周期的通知,根据训练产生的回归模型
period.mode,和相关特征数据,得到预测采集周期T',并按照此周期进行数据采集。
(三)下面介绍本发明涉及的方法流程。
SCADA系统需要预先设置实时数据采集周期T,而程序实际采集周期T'则应当小于T,且可根据系统实际运行情况动态调整。T'选取要求是:1)保证1个周期T内,数据点至少采集1次;2)系统运行负载(CPU、内存、网络输出流量)在目标上限以下。显然,实际周期T'与采集数据点数目、CPU使用率、内存使用率、网络输出流量有关系。当采集数据点数量增加、CPU使用率增高、内存使用率增高、客户端数增加导致网络输出流量增加时,实际周期T'应该适当增大;反之,当采集数据点数量减少、CPU使用率降低、内存使用率降低、客户端数较少导致网络输出流量减少时,实际周期T'可适当减小或维持不变。可在系统正式运行的调试阶段,采集与实际数据采集周期T'相关的数据样本,进行统计分析,找到数据间的相关性,建立实际数据采集周期T'的数学模型。待系统正式运行时,可根据此模型,预测系统实际数据采集周期T',并适时调整。相比传统方法采用固定值作为实际数据采集周期,本方案能根据系统实际负载情况作出调整,在保证一定的数据采集频率的前提下,提高了SCADA系统采集效率和整个系统运行过程的可控性;不用人工干预,具有较强的自适应性。
SCADA系统包括:配置单元、数据采集单元、客户端等;配置单元设置好数据点的采集周期后,数据采集单元根据配置周期T选取实际采集周期T',然后按照T'定时从设备采集数据,并保存在实时数据库中;当有客户端从采集单元请求实时数据时,采集单元将实时数据推送给客户端。
具体方法流程是:
系统调试阶段,采集系统运行过程中的数据点数目、CPU使用率、内存使用率、网络输出流量、实际采集周期等数据作为样本。样本经过预处理,再通过支持向量回归模型(SVR)训练样本,得出SVR回归函数。设定系统开始运行时实际采集周期Ts为某一定值(如T/5,T为配置采集周期),并记录系统初始运行参数(CPU使用率、内存使用率、网络输出流量、数据点数目)。后续当系统运行情况发生变化时,根据此时系统运行参数(CPU使用率、内存使用率、网络输出流量、当前数据点数目),利用SVR回归函数得到目标采集周期T',即为实际采集周期,采集单元按照该周期进行实时数据采集。
SCADA系统实际数据采集周期T'与数据点数目、CPU使用率、内存使用率、网络输出流量密切相关,要建立SVR回归函数,需要先采集实际数据采集周期T'、CPU使用率、内存使用率、网络输出流量等运行数据,并按照一定的格式生成样本数据,并进行保存。然后对样本进行预处理、选择SVR参数、经样本训练后得到实际数据采集周期回归函数。系统运行后,需要监测系统运行情况,满足一定条件时,利用回归函数预测当前的实际数据采集周期T',并按照该周期进行实时数据采集。
每当系统运行情况发生变化且达到一定条件,就会重新计算1次新的实际数据采集周期T',并按该新T'采集数据。T'的更新由系统实际运行过程决定,并不需要外部干预,且不会导致运行中断。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (5)
1.一种SCADA系统数据采集周期控制方法,其特征在于,
实时监控系统的运行状态,包括:采集数据点数量、CPU使用率、内存使用率、网络输出流量;当运行状态发生变化且满足设定条件时,进行采集周期更新,包括:
步骤1、系统初始运行时,选定初始实际采集周期T1=配置周期T/5,按此采集数据;同时,记录当前周期T1下的实际运行参数:采集数据点数量count、CPU使用率cpu、内存使用率mem、网络输出流量flow;
步骤2、当SCADA系统配置单元增加、减少采集数据点数量时,根据当前采集数据点数量count2,将步骤1中的cpu、mem、flow,组成特征向量,使用训练产生的回归模型period.mode,计算得到预测周期T2,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前采集数据点数量count=count2,cpu、mem、flow为当前实际运行参数;
步骤3、当向采集单元请求实时数据的SCADA客户端增加、减少导致网络输出流量发生变化时,通过当前的count、cpu、mem,和预估flow3,使用训练产生的回归模型period.mode,计算得到预测周期T3,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数;
步骤4、由于系统运行过程中,CPU使用率、内存使用率会产生波动;在这种情况下,当前CPU使用率cpu',或者内存使用率mem'与记录的CPU使用率cpu,内存使用率mem相比,出现5%以上的变化,则通过当前的count、cpu'、mem'、flow,使用训练产生的回归模型period.mode,计算得到预测周期T4,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数;
回归模型period.mode具体获取方法包括:
步骤3.1、采集样本数据,具体包括
1)需要采集的样本数据包括:实际采集周期T'、采集数据点数量、CPU使用率、内存使用率、网络输出流量;
2)样本数据以向量格式存储,便于对样本进行训练;
即 [目标值] [特征1]:[特征值] [特征2]:[特征值] ...
由于目标是获取实际数据采集周期,具体存储格式如下:
[实际采集周期T'] [1]:[采集数据点数量] [2]:[CPU使用率] [3]:[内存使用率][4]:[网络输出流量];
样本数据文件记为:period.data;
步骤3.2、对采集的样本进行预处理,具体包括
1)样本数据缩放处理: SVR算法为防止某个特征过大或者过小,从而导致后续训练中起的作用不平衡,需要对原始样本数据进行缩放处理;另外,核函数计算中,会用到内积或者exp运算,不平衡的数据会导致计算困难,影响计算速度;缩放区间的大小也会对SVR参数的选取和建立SVR模型的速度产生影响,这里选择缩放范围为[0,1],能加快模型的预测速度;
2)缩放处理结果保存:进行缩放处理后的文件记为period.scale;
步骤3.3、选择SVR参数,包括算法选择、核函数选择以及最佳参数选择
步骤3.4、进行样本训练,具体是使用选取的核函数g和惩罚参数c,对预处理之后的样本period.scale进行训练,可得到训练后的SVR回归模型文件period.model,该文件中保存了经训练生成回归函数的相关信息。
2.根据权利要求1所述的一种SCADA系统数据采集周期控制方法,其特征在于,步骤3中flow3按以下步骤预估:
步骤1、定义flow3=flow* k'/k;其中,flow为原来的增减前网络流量;k为原来的增减前客户端数目;k'为当前增减后的客户端数目;
步骤2、原来客户端数目为0时,flow3=max_flow* k'/max_client_count;其中,max_flow为系统预设最大网络输出流量;max_client_count为系统支持最大客户端数量;k'为当前增减后的客户端数目。
3.一种SCADA系统数据采集周期控制装置,适用于权利要求1所述方法,其特征在于,
采集运行状态监控模块:实时监控系统的运行状态,包括:采集数据点数量、CPU使用率、内存使用率、网络输出流量;当运行状态发生变化且满足设定条件时,通知实际采集周期预测及更新模块,进行采集周期更新,
实际采集周期预测及更新模块:接收采集运行状态监控模块的采集信息,并根据采集运行状态监控模块的反馈进行确定是否需要采集周期更新;
采集运行状态监控模块包括
数据采集单元:系统初始运行时,选定初始实际采集周期T1=配置周期T/5,按此采集数据;同时,记录当前周期T1下的实际运行参数:采集数据点数量count、CPU使用率cpu、内存使用率mem、网络输出流量flow;
SCADA系统配置单元:进行SCADA系统配置;
数据更新单元一:当SCADA系统配置单元增加、减少采集数据点数量时,根据当前采集数据点数量count2,数据采集单元记录的cpu、mem、flow,组成特征向量,数据更新单元使用训练产生的回归模型period.mode,计算得到预测周期T2,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前采集数据点数量count=count2,cpu、mem、flow为当前实际运行参数;
数据更新单元二:当向采集单元请求实时数据的SCADA客户端增加、减少导致网络输出流量发生变化时,通过当前的count、cpu、mem,和预估flow3,使用训练产生的回归模型period.mode,计算得到预测周期T3,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数;
数据更新单元三:由于系统运行过程中,CPU使用率、内存使用率可能会产生波动;在这种情况下,当前CPU使用率cpu',或者内存使用率mem'与记录的CPU使用率cpu,内存使用率mem相比,出现5%以上的变化,则通过当前的count、cpu'、mem'、flow,使用训练产生的回归模型period.mode,计算得到预测周期T4,即为当前实际采集周期T',并据此进行数据采集;同时更新并记录当前实际cpu、mem、flow为当前实际运行参数。
4.根据权利要求3所述的一种SCADA系统数据采集周期控制装置,其特征在于,该装置还包括:采集样本数据模块、样本预处理模块、SVR参数选择模块和样本训练模块,其中,回归模型period.mode具体获取方法包括:
采集样本数据模块:用于
1)需要采集的样本数据包括:实际采集周期T'、采集数据点数量、CPU使用率、内存使用率、网络输出流量;
2)样本数据以向量格式存储,便于对样本进行训练;
即 [目标值] [特征1]:[特征值] [特征2]:[特征值] ...
由于需要获取实际数据采集周期,具体存储格式如下:
[实际采集周期T'] [1]:[采集数据点数量] [2]:[CPU使用率] [3]:[内存使用率][4]:[网络输出流量];
样本数据文件记为:period.data;
样本预处理模块:
1)样本数据缩放处理: SVR算法为防止某个特征过大或者过小,从而导致后续训练中起的作用不平衡,需要对原始样本数据进行缩放处理;另外,核函数计算中,会用到内积或者exp运算,不平衡的数据会导致计算困难,影响计算速度;缩放区间的大小也会对SVR参数的选取和建立SVR模型的速度产生影响,这里选择缩放范围为[0,1],能加快模型的预测速度;
2)缩放处理结果保存:进行缩放处理后的文件记为period.scale;
SVR参数选择模块:包括算法选择、核函数选择以及最佳参数选择
样本训练模块:使用选取的核函数g和惩罚参数c,对预处理之后的样本period.scale进行训练,可得到训练后的SVR回归模型文件period.model,该文件中保存了经训练生成回归函数的相关信息。
5.根据权利要求4所述的一种SCADA系统数据采集周期控制装置,其特征在于,数据更新单元二中flow3按以下步骤预估:
步骤1、定义flow3=flow* k'/k;其中,flow为原来的增减前网络流量;k为原来的增减前客户端数目;k'为当前增减后的客户端数目;
步骤2、原来客户端数目为0时,flow3=max_flow* k'/max_client_count;其中,max_flow为系统预设最大网络输出流量;max_client_count为系统支持最大客户端数量;k'为当前增减后的客户端数目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911187517.5A CN111030850B (zh) | 2019-11-28 | 2019-11-28 | 一种scada系统数据采集周期控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911187517.5A CN111030850B (zh) | 2019-11-28 | 2019-11-28 | 一种scada系统数据采集周期控制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111030850A CN111030850A (zh) | 2020-04-17 |
CN111030850B true CN111030850B (zh) | 2022-10-14 |
Family
ID=70202764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911187517.5A Active CN111030850B (zh) | 2019-11-28 | 2019-11-28 | 一种scada系统数据采集周期控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111030850B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114970885A (zh) * | 2021-02-25 | 2022-08-30 | 华为技术有限公司 | 采集周期确定方法、装置、系统、设备以及存储介质 |
CN112905548B (zh) * | 2021-03-25 | 2023-12-08 | 昆仑数智科技有限责任公司 | 一种安全审计系统及方法 |
CN117250928B (zh) * | 2023-10-24 | 2024-04-12 | 河北燃气有限公司 | 一种scada系统数据采集周期控制方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101442561A (zh) * | 2008-12-12 | 2009-05-27 | 南京邮电大学 | 一种基于支持向量机的网格监控方法 |
CN104717439A (zh) * | 2014-01-02 | 2015-06-17 | 杭州海康威视系统技术有限公司 | 视频存储系统中数据流量控制方法及其装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2015276877A1 (en) * | 2014-06-20 | 2017-01-05 | The Regents Of The University Of California | Energy infrastructure sensor data rectification using regression models |
-
2019
- 2019-11-28 CN CN201911187517.5A patent/CN111030850B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101442561A (zh) * | 2008-12-12 | 2009-05-27 | 南京邮电大学 | 一种基于支持向量机的网格监控方法 |
CN104717439A (zh) * | 2014-01-02 | 2015-06-17 | 杭州海康威视系统技术有限公司 | 视频存储系统中数据流量控制方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111030850A (zh) | 2020-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111030850B (zh) | 一种scada系统数据采集周期控制方法及装置 | |
KR101768005B1 (ko) | 신축적 컴퓨팅 시스템 및 환경을 포함하는 컴퓨팅 시스템 및 환경에 대한 실행 할당 비용 평가 | |
CN107404409B (zh) | 面向突变负载的容器云弹性供给容器数量预测方法与系统 | |
CN109150738B (zh) | 工业互联网资源管理方法及系统、可读存储介质和终端 | |
CN105204971A (zh) | 一种基于朴素贝叶斯分类技术的动态监控间隔调整方法 | |
Huang et al. | DeepAdapter: A collaborative deep learning framework for the mobile web using context-aware network pruning | |
CN108021447B (zh) | 一种基于分布式数据确定最优资源策略的方法及系统 | |
CN116244159B (zh) | 一种训练时长预测方法、装置、多元异构计算设备及介质 | |
CN111698335A (zh) | 设备状态查询方法、装置及服务器 | |
CN102929613A (zh) | 操作系统的调优装置和方法 | |
CN114637650B (zh) | 一种基于Kubernetes集群的弹性伸缩方法 | |
CN113687960A (zh) | 一种基于深度强化学习的边缘计算智能缓存方法 | |
CN104507096A (zh) | 无线传感网中模型驱动的数据传输方法及系统 | |
CN115981863A (zh) | 一种结合业务特性的智能云资源弹性伸缩方法和系统 | |
CN112214303A (zh) | Kubernetes集群自动缩放系统 | |
WO2017092255A1 (zh) | 应用的在线调优方法及系统 | |
CN110569170A (zh) | 服务器利用率的评价方法、装置、设备及其存储介质 | |
EP3849140B1 (en) | Data reporting method and related device | |
CN117425158A (zh) | 人工智能请求分析方法、装置及设备 | |
Liu et al. | I-Neat: An intelligent framework for adaptive virtual machine consolidation | |
CN114547093A (zh) | 缓存控制方法、装置、设备和存储介质 | |
CN113793298A (zh) | 肺结节检测模型构建优化方法、设备、存储介质及产品 | |
CN110427523B (zh) | 可适配的基于大数据的营商环境应用系统 | |
Xu et al. | Adaptive anomaly detection strategy based on reinforcement learning | |
CN112486683A (zh) | 处理器控制方法、控制设备以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |