CN113515671A - 继电器时间参数异常值识别方法、服务端及存储介质 - Google Patents
继电器时间参数异常值识别方法、服务端及存储介质 Download PDFInfo
- Publication number
- CN113515671A CN113515671A CN202110750803.9A CN202110750803A CN113515671A CN 113515671 A CN113515671 A CN 113515671A CN 202110750803 A CN202110750803 A CN 202110750803A CN 113515671 A CN113515671 A CN 113515671A
- Authority
- CN
- China
- Prior art keywords
- data
- time parameter
- abnormal value
- value
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012216 screening Methods 0.000 claims abstract description 25
- 238000010801 machine learning Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000012549 training Methods 0.000 claims description 28
- 238000007637 random forest analysis Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000003066 decision tree Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012217 deletion Methods 0.000 abstract description 3
- 230000037430 deletion Effects 0.000 abstract description 3
- 239000013598 vector Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010891 electric arc Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Abstract
本申请提供一种继电器时间参数异常值识别方法、服务端及存储介质,异常值识别方法包括以下步骤:获取继电器的时间参数序列;根据时间参数序列分解出趋势项集合和剩余项集合;利用机器学习的方法,筛选出剩余项集合中的异常值;利用自适应的标准差偏离整体程度的方法,筛选出趋势项集合中的异常值;汇总得到所述继电器的时间参数异常值。本申请提供的异常值识别的方法通过将时间参数序列分解重构得到具有趋势性的趋势项集合和数据相对平稳的剩余项集合,根据两集合数据的不同特点选择不同筛选方式,使得提高了异常值识别的工作效率及识别的准确性,解决了现有技术中人工删除异常值工作量大、主观性强的问题。
Description
技术领域
本公开一般涉及继电器技术领域,具体涉及一种继电器时间参数异常值识别方法、服务端及存储介质。
背景技术
继电器作为轨道交通信号控制技术中的重要部件,其动作的可靠性直接影响信号系统的安全性、可靠性。采集继电器的时间参数,机械参数,运动参数,触头形貌参数并对它们的性能进行分析比较,对于控制整个电路的通断、控制室外信号设备的动作、保证行车安全具有十分重要的意义。
从采集到的继电器的各个参数的原始数据来看,里面掺杂有少量的偏离数据整体分布的数值,且异常值与正常值相差较大,这种现象往往会对采集到的参数的整体分布规律产生较大的影响。而且自动化监测数据中异常值出现的位置、量值具有不确定性,人工删除异常值存在工作量大、主观性强等缺点,会对我们下一步利用继电器的参数进行其性能分析产生较大的影响,对继电器的性能判断产生影响。
因此,如何较准确的从继电器的原始时间参数数据中进行异常值的识别来提高对其性能分析的可靠度,已经成为本领域技术人员亟待解决的问题之一。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种可检测继电器时间参数数据异常值的一种继电器时间参数异常值识别方法、服务端及存储介质。
第一方面本申请提供一种继电器时间参数异常值识别方法,包括以下步骤:
获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
根据本申请实施例提供的技术方案,根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合的方法具体为:
根据所述时间参数序列x={xi|i=1,2,...,n},构建L*K阶轨迹矩阵XL*K:
其中,2≤L≤n/2,K=n-L+1;
计算所述矩阵C的特征值,将所述特征值作为所述轨迹矩阵的特征值λi;
计算所述矩阵C的特征向量,将所述特征向量作为所述轨迹矩阵XL*K的左特征向量Ui;
根据以下公式计算所述轨迹矩阵XL*K的右特征向量Vi:
根据以下公式分解所述轨迹矩阵XL*K;
根据以下公式计算趋势项集合XC:
根据以下公式计算剩余项集合Xs:
Xs=x-XC。
根据本申请实施例提供的技术方案,所述机器学习的方法为决策树算法、人工神经网络算法、贝叶斯学习算法中的任意一种。
根据本申请实施例提供的技术方案,所述机器学习的方法为随机森林算法,筛选出所述剩余项集合中的异常值的方法具体为:
S1:根据第i个训练集构建随机森林模型;
S2:计算所述第i个训练集中每个数据在随机森林模型中的路径长度h(x);
S3:计算所述路径长度h(x)的期望值E(h(x));
S4:根据以下公式计算每个数据的异常值分数s(x,m):
其中,γ为欧拉常数。
S5:将异常值分数s(x,m)→y的数据作为第i个训练集中的异常值,y为设定值;
i+1后递归上述步骤S1-S5直至递归次数达到设定值j;
其中,第1个训练集为所述剩余项集合Xs的绝对值;
i大于等于2时,第i个训练集由第i-1个训练集剔除异常值得到。根据本申请实施例提供的技术方案,根据以下公式计算设定值y:
y=c1+(c2-c1)*(n-1)/n;
其中,n为当前递归次数,c1、c2为设定参数。
根据本申请实施例提供的技术方案,构建所述随机森林模型的方法具体为构建所述随机森林模型的方法具体为构建第1-a棵子树组成所述随机森林模型,其中第k(1≤k≤a)棵子树的构建方法为:
S1:将第n个分割数据集作为子树的第n层根节点;
S2:以设定的切割点p对第n个分割数据集进行分割,得到第n层左数据集和第n层右数据集;
S3:用所述第n层左数据集构建第n层左子树,用所述第n层右数据集构建第n层右子树;
n加1后递归上述步骤S1-S3,直至子树达预定高度;所述n的初始化值为1;
其中第1个分割数据集为子采样集D={dk1,dk2,...dkx,...,dkm};所述子采样集D={dk1,dk2,...dkx,...,dkm}从第i个训练集中抽取m个样点得到;
n大于等于2时,第n层左数据集和第n层右数据集分别作为第n个分割数据集。
根据本申请实施例提供的技术方案,利用自适应标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值具体步骤为:
将所述趋势项集合XC中的数据分为N个数据组{x1,x2,...,xk},每个数据组中具有k个数据;
根据以下公式计算每个数据组中数据的算数平均值x:
根据以下公式计算每个数据组中数据的标准差:
根据以下公式计算每个数据组中每个数据xi的偏差Δdi:
判断数据组中数据的偏差Δdi>aσ时,则该数据为异常值,其中a为设定值。
第二方面,本申请提供一种服务端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述所述继电器时间参数异常值识别方法的步骤。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质有计算机程序,所述计算机程序被处理器执行时实现如上述所述继电器时间参数异常值识别方法的步骤。
本申请的有益效果在于:通过获取继电器的时间参数序列x={xii=1,2,...,n},并将该序列分解、重构,得到具有数据具有趋势性的趋势项集合和数据相对平稳的剩余项集合,通过针对不同集合的特点选取不同的筛选方法,使得提高了异常值识别的工作效率及识别的准确性,即:
由于所述趋势项集合的数据具有相对明显变化的趋势性,因此采用自适应的标准差偏离整体程度的方法,使得可以很精确的把趋势项集合中异常值筛选出来。由于所述剩余项结合的数据较为平稳;而机器学习的方法,例如随机森林算法,其对于气温等平稳变化的连续性数据具有较强的异常值检测识别能力,但对于土石坝沉降等具有时效性的非平稳监测数据则无法准确地检测识别;因此利用机器学习的方法,可以快速且准确的筛选出所述剩余项集合中的异常值。
本申请提供的继电器时间参数异常值识别的方法,不需要除时间参数序列以外的其他特征标签,无需对样本进行训练学习,扩大了其适用范围,降低了工作量,提高了计算效率,提高了计算的准确性,解决了现有技术中人工删除异常值工作量大、主观性强的问题,避免后续对于继电器的性能判断产生影响。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请提供的一种继电器时间参数异常值识别方法流程图。
图2为本申请提供的一种服务端。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
实施例1
请参考图1为本申请提供的继电器时间参数异常值识别方法,包括以下步骤:
S100:获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
S200:根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
S300:利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
S400:利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
S500:汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
具体的,所述时间参数序列x={xi|i=1,2,...,n}可通过温湿度试验箱获取。
所述时间参数可以为吸合时间、释放时间、动断超程时间、动合超程时间、弹跳时间、电弧燃烧时间。例如:所述时间参数可以为动断超程时间,通过温湿度试验箱获取所有动断超程时间数据,并生成时间参数序列x={xi|i=1,2,...,n}。
为了便于说明本申请的方法步骤,选取了8台继电器试品,以检测其动断超程时间为例:
利用温湿度试验箱分别获取8台继电器试品的动断超程时间序列;分别对八个序列进行分解重构分别得到趋势项集合和剩余项集合;利用机器学习的方法,筛选出所述剩余项集合中的异常值,利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值。筛选结果如表-1所示:
试品号 | 剩余项中异常值数(个) | 趋势项中异常值数(个) | 整体异常值数(个) |
1 | 120 | 280 | 400 |
2 | 149 | 250 | 399 |
3 | 152 | 250 | 402 |
4 | 147 | 251 | 398 |
5 | 163 | 236 | 399 |
6 | 150 | 253 | 403 |
7 | 139 | 251 | 400 |
8 | 141 | 260 | 401 |
表-1
工作原理:通过获取继电器的时间参数序列x={xi|i=1,2,...,n},并将该序列分解、重构,得到数据具有趋势性的趋势项集合和数据相对平稳的剩余项集合,使得可针对不同集合特征选取不同的筛选方法,即采用机器学习的方法,筛选出所述剩余项集合中的异常值作为第一异常值;利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值作为第二异常值,汇总所述第一异常值和第一异常值,即为所述继电器的时间参数异常值。
由于所述趋势项集合的数据具有相对明显变化的趋势性,因此采用自适应的标准差偏离整体程度的方法,使得可以很精确的把趋势项集合中异常值筛选出来。
由于所述剩余项结合的数据较为平稳;机器学习的方法,例如随机森林算法,其对于气温等平稳变化的连续性数据具有较强的异常值检测识别能力,但对于土石坝沉降等具有时效性的非平稳监测数据则无法准确地检测识别;因此利用机器学习的方法,可以快速且准确的筛选出所述剩余项集合中的异常值。
本申请提供的继电器时间参数异常值识别方法,不需要除时间参数序列以外的其他特征标签,无需对样本进行训练学习,扩大了其适用范围,降低了工作量,解决了现有技术中人工删除异常值工作量大、主观性强的问题;同时也提高了计算效率,提高了计算的准确性。
其中,在一优选实施方式中,根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合的方法具体为:
S210:根据所述时间参数序列x={xi|i=1,2,...,n},构建L*K阶轨迹矩阵XL*K:
其中,2≤L≤n/2,K=n-L+1;L为嵌入窗口长度。
S230:计算所述矩阵C的特征值,将所述特征值作为所述轨迹矩阵的特征值λi;
需要进一步说明的是,设A为n阶矩阵,如果数λ和n维非零向量X使关系式AX=λX成立,则这样的数λ称为矩阵A的特征值。
进一步的,n阶方阵A的特征值是使齐次线性方程组|A-λE|X=0有非零解的λ值,即满足方程|A-λE|X=0的λ都是矩阵A的特征值。
具体的,将所述特征值λi按降序排列,其中最大的特征值所对应的特征向量即为序列的趋势,一般将较小特征值对应的特征向量当作噪声。
S240:计算所述矩阵C的特征向量,将所述特征向量作为所述轨迹矩阵XL*K的左特征向量Ui;
需要进一步说明的是,设A为n阶矩阵,如果数λ和n维非零向量X使关系式AX=λX成立,非零向量X称为矩阵A的特征向量。其中,特征向量X≠0;
S250:根据以下公式计算所述轨迹矩阵XL*K的右特征向量Vi:
S260:根据以下公式分解所述轨迹矩阵XL*K;
S270:根据以下公式计算趋势项集合XC:
具体的,Uk表示矩阵XL*K中xk的左特征向量,j表示其在该矩阵中的列数。
S280:根据以下公式计算剩余项集合Xs:
Xs=x-XC。
其中,在一优选实施方式中,所述机器学习的方法为决策树算法、人工神经网络算法、贝叶斯学习算法中的任意一种算法。
其中,在一优选实施方式中,所述机器学习的方法为随机森林算法,筛选出所述剩余项集合中的异常值的方法具体为:
S1:根据第i个训练集构建随机森林模型;
S2:计算所述第i个训练集中每个数据在随机森林模型中的路径长度h(x);
S3:计算所述路径长度h(x)的期望值E(h(x));
S4:根据以下公式计算每个数据的异常值分数s(x,m):
H(m-1)=ln(m-1)+γ;
其中,γ为欧拉常数,c(m)为搜索路径长度平均值。
S5:将异常值分数s(x,m)→y的数据作为第i个训练集中的异常值,y为设定值;
i+1后递归上述步骤S1-S5直至递归次数达到设定值j;
其中,第1个训练集为所述剩余项集合Xs的绝对值;
i大于等于2时,第i个训练集由第i-1个训练集剔除异常值得到。
具体的,对于提供含有m个样本数量的子样本集D,由于子树的结构与二叉树等价,因此其搜索路径长度平均值c(m)等价于二叉树中失败查询的路径长度:2H(m-1)-2(m-1)/m。
式中:H(m-1)为调函数,可以被估计为H(m-1)=ln(m-1)+γ,γ为欧拉常数;c(m)用于标准化查询数据x的路径长h(x)。
具体的,路径长度h(x)的计算公式如下:
h(x)=e+c(m);
其中,e表示数据点x从子树的根节点到叶节点过程中经过的边的数目。
具体的,期望值E(h(x))表示数据点x所有路径长度h(x)的平均值。
需要进一步说明的是,当E(h(x))→m-1时,s→0,判断该数据点为正常点;当E(h(x))→c(m)时,s→0.5,则无法判断该数据点是否异常;设定值j以及设定值y可以根据实际情况进行设置,以设定值j为50,设定值y为1为例:
当E(h(x))→0时,s→1,判断该数据点为异常值。为避免在一次筛选过程中,无法识别全部异常数据点,因此通过上述方式进行递归,即:将剔除异常值的训练集再次进行上述步骤S1-S5,直至递归次数达50次。
根据本申请实施例提供的技术方案,根据以下公式计算设定值y:
y=c1+(c2-c1)*(n-1)/n;
其中,n为当前递归次数,c1、c2为设定参数。例如:c1的值可设定为0.6,c2的值设定为1。
例如:利用温湿度试验箱获取该继电器的动断超程时间,共获取了200000个数据;在构建的随机森林模型中,子树样本容量为256,最大层高为8层,共有100颗子树,最大递归次数为50。
因此在第一次迭代时,有n=1,y=0.6;第二次迭代时,有n=2,y=0.8;以此类推,可分别计算出对应迭代次数下的设定值y。
其中,在一优选实施方式中,构建所述随机森林模型方法具体为:
构建第1-a棵子树组成所述随机森林模型,其中第k(1≤k≤a)棵子树的构建方法为:
S1:将第n个分割数据集作为子树的第n层根节点;
S2:以设定的切割点p对第n个分割数据集进行分割,得到第n层左数据集和第n层右数据集;
S3:用所述第n层左数据集构建第n层左子树,用所述第n层右数据集构建第n层右子树;
n加1后递归上述步骤S1-S3,直至子树达预定高度;所述n的初始化值为1;
其中第1个分割数据集为子采样集D={dk1,dk2,...dkx,...,dkm};所述子采样集D={dk1,dk2,...dkx,...,dkm}从第i个训练集中抽取m个样点得到;
n大于等于2时,第n层左数据集和第n层右数据集分别作为第n个分割数据集。
具体的,预定高度是指递归迭代至:树的高度达到限制,或数据空间中只有一个数据或多个相同的数值(即无法再进行数据划分)。
为了便于说明本申请的工作原理,以第1个训练集构建随机森林模型为例:
构建随机森林模型中第1颗子树:
从第1个训练集(所述剩余项集合Xs的绝对值)中随机抽取m个样点得到采样集D={d11,d12,...d1x,...,d1m},将所述采样集D={d11,d12,...d1x,...,d1m}作为第一层根节点,并从中选取一个切割点p,切割点P满足:dmin<p<dmax;
将所述子采样集D={d1,d2,...dx,...,dm}中的所有数据点dx依次与切割点p进行比较,判断当dx<p时,将该点放入至第一层左数据集中,将第一层左数据集构建第一层左子树;判断当dx>p时,将该点放入至第一层右数据集中,将第一层右数据集构建第一层右子树;
递归,直至第n个分割数据集中只有一个数据或多个相同的数据,或树的高度达到限值。
构建随机森林模型中第2颗子树:
从第1个训练集(所述剩余项集合Xs的绝对值)中随机抽取m个样点得到采样集D={d21,d22,...d2x,...,d2m},第2颗子树与上述构建过程相同,此处不再赘述;
直至构建a颗子树,共同形成所述随机森林模型。
其中,在一优选实施方式中,利用自适应标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值具体步骤为:
将所述趋势项集合XC中的数据分为N个数据组,每个数据组中具有k个数据;
根据以下公式计算每个数据组中数据的标准差:
根据以下公式计算每个数据组中每个数据xi的偏差Δdi:
判断数据组中数据的偏差Δdi>aσ时,则该数据为异常值,其中a为设定值。
具体的,a为设定值,例如a的值可取5。
利用上述自适应的标准偏差偏离整体程度的方法,在进行第一组的异常值识别后,可根据下一组的数据分布情况自适应改变判断偏差的阈值,最终得到整体数据的异常值。
需要注意的是,文中在不同应用场景或不同公式中出现的相同字母(i、j、m、n等)不应被认定其数值或含义上相同。
例如:x={xi|i=1,2,...,n}中的i表示的是时间参数序列中第几个数据点。在筛选剩余项集合中的异常值的方法中“根据第i个训练集构建随机森林模型”此处的i表示的第几个训练集。两者不应当认为具有数值上的关联。
实施例2
请参考图2为本申请提供的服务端或服务器的计算机系统600的原理框图,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述继电器时间参数异常值识别方法的步骤。
如图2所示,所述计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明的实施例,上文参考流程图1描述的过程可以被实现为计算机软件程序。例如,本发明的实施例1包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
实施例3
本申请还提供一种计算机可读存储介质,所述计算机程序被处理器执行时实现如上述所述继电器时间参数异常值识别方法的步骤。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、数据处理模块。
其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获取模块还可以被描述为“用于获取时间参数序列x={xi|i=1,2,...,n}的获取模块”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中继电器时间参数异常值识别方法的步骤。
例如,所述电子设备可以实现如图1中所示的:
获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (9)
1.一种继电器时间参数异常值识别方法,其特征在于:包括以下步骤:
获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
2.根据权利要求1所述的继电器时间参数异常值识别方法,其特征在于:根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合的方法具体为:
根据所述时间参数序列x={xi|i=1,2,...,n},构建L*K阶轨迹矩阵XL*K:
其中,2≤L≤n/2,K=n-L+1;
计算所述矩阵C的特征值,将所述特征值作为所述轨迹矩阵的特征值λi;
计算所述矩阵C的特征向量,将所述特征向量作为所述轨迹矩阵XL*K的左特征向量Ui;
根据以下公式计算所述轨迹矩阵XL*K的右特征向量Vi:
根据以下公式分解所述轨迹矩阵XL*K;
根据以下公式计算趋势项集合XC:
根据以下公式计算剩余项集合Xs:
Xs=x-XC。
3.根据权利要求2所述的继电器时间参数异常值识别方法,其特征在于:所述机器学习的方法为决策树算法、人工神经网络算法、贝叶斯学习算法中的任意一种。
4.根据权利要求2所述的继电器时间参数异常值识别方法,其特征在于:所述机器学习的方法为随机森林算法,筛选出所述剩余项集合中的异常值的方法具体为:
S1:根据第i个训练集构建随机森林模型;
S2:计算所述第i个训练集中每个数据在随机森林模型中的路径长度h(x);
S3:计算所述路径长度h(x)的期望值E(h(x));
S4:根据以下公式计算每个数据的异常值分数s(x,m):
H(m-1)=ln(m-1)+γ;
其中,γ为欧拉常数。
S5:将异常值分数s(x,m)→y的数据作为第i个训练集中的异常值,y为设定值;
i+1后递归上述步骤S1-S5直至递归次数达到设定值j;
其中,第1个训练集为所述剩余项集合Xs的绝对值;
i大于等于2时,第i个训练集由第i-1个训练集剔除异常值得到。
5.根据权利要求4所述的继电器时间参数异常值识别方法,其特征在于:
根据以下公式计算设定值y:
y=c1+(c2-c1)*(n-1)/n;
其中,n为当前递归次数,c1、c2为设定参数。
6.根据权利要求4所述的继电器时间参数异常值识别方法,其特征在于:构建所述随机森林模型的方法具体为构建第1-a棵子树组成所述随机森林模型,其中第k(1≤k≤a)棵子树的构建方法为:
S1:将第n个分割数据集作为子树的第n层根节点;
S2:以设定的切割点p对第n个分割数据集进行分割,得到第n层左数据集和第n层右数据集;
S3:用所述第n层左数据集构建第n层左子树,用所述第n层右数据集构建第n层右子树;
n加1后递归上述步骤S1-S3,直至子树达预定高度;所述n的初始化值为1;
其中第1个分割数据集为子采样集D={dk1,dk2,...dkx,...,dkm};所述子采样集D={dk1,dk2,...dkx,...,dkm}从第i个训练集中抽取m个样点得到;
n大于等于2时,第n层左数据集和第n层右数据集分别作为第n个分割数据集。
8.一种服务端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述继电器时间参数异常值识别方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述继电器时间参数异常值识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110750803.9A CN113515671A (zh) | 2021-07-01 | 2021-07-01 | 继电器时间参数异常值识别方法、服务端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110750803.9A CN113515671A (zh) | 2021-07-01 | 2021-07-01 | 继电器时间参数异常值识别方法、服务端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113515671A true CN113515671A (zh) | 2021-10-19 |
Family
ID=78066363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110750803.9A Pending CN113515671A (zh) | 2021-07-01 | 2021-07-01 | 继电器时间参数异常值识别方法、服务端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113515671A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133606A (zh) * | 2017-05-26 | 2017-09-05 | 广东工业大学 | 一种时间序列趋势提取的方法及装置 |
CN107528722A (zh) * | 2017-07-06 | 2017-12-29 | 阿里巴巴集团控股有限公司 | 一种时间序列中异常点检测方法及装置 |
US20190286096A1 (en) * | 2018-03-14 | 2019-09-19 | Omron Corporation | Abnormality detection system, support device, and model generation method |
US20200287497A1 (en) * | 2017-11-28 | 2020-09-10 | Kabushiki Kaisha Yaskawa Denki | Abnormality determination system, motor control apparatus, and abnormality determination apparatus |
CN111964889A (zh) * | 2020-08-20 | 2020-11-20 | 沈阳铁路信号有限责任公司 | 一种用于铁路信号继电器时间参数的有效信息提取方法 |
CN112329194A (zh) * | 2020-07-01 | 2021-02-05 | 河北工业大学 | 一种基于数学模型的铁路信号继电器有效时间参数确定方法 |
-
2021
- 2021-07-01 CN CN202110750803.9A patent/CN113515671A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133606A (zh) * | 2017-05-26 | 2017-09-05 | 广东工业大学 | 一种时间序列趋势提取的方法及装置 |
CN107528722A (zh) * | 2017-07-06 | 2017-12-29 | 阿里巴巴集团控股有限公司 | 一种时间序列中异常点检测方法及装置 |
US20200287497A1 (en) * | 2017-11-28 | 2020-09-10 | Kabushiki Kaisha Yaskawa Denki | Abnormality determination system, motor control apparatus, and abnormality determination apparatus |
US20190286096A1 (en) * | 2018-03-14 | 2019-09-19 | Omron Corporation | Abnormality detection system, support device, and model generation method |
CN112329194A (zh) * | 2020-07-01 | 2021-02-05 | 河北工业大学 | 一种基于数学模型的铁路信号继电器有效时间参数确定方法 |
CN111964889A (zh) * | 2020-08-20 | 2020-11-20 | 沈阳铁路信号有限责任公司 | 一种用于铁路信号继电器时间参数的有效信息提取方法 |
Non-Patent Citations (5)
Title |
---|
倪育才编著: "《国家大地坐标系建立的理论与实践》", 中国质量标准出版传媒有限公司, pages: 147 - 148 * |
张东华等: "奇异谱分析的变形监测序列粗差探测方法", 《测绘科学》, 15 August 2020 (2020-08-15), pages 1 - 2 * |
张东华等: "奇异谱分析的变形监测序列粗差探测方法", 《测绘科学》, no. 2020, pages 1 * |
张海龙等: "孤立森林算法在大坝监测数据异常识别中的应用", 《人民黄河》, no. 08, 10 August 2020 (2020-08-10), pages 2 - 4 * |
赵新华等: "基于数据重构与孤立森林法的大坝自动化监测数据异常检测方法", 《中国农村水利水电》, no. 2021 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cerqueira et al. | Evaluating time series forecasting models: An empirical study on performance estimation methods | |
CN107247989B (zh) | 一种实时的计算机视觉处理方法及装置 | |
US20180240041A1 (en) | Distributed hyperparameter tuning system for machine learning | |
CN109033513B (zh) | 电力变压器故障诊断方法与电力变压器故障诊断装置 | |
CN111667010A (zh) | 基于人工智能的样本评估方法、装置、设备及存储介质 | |
CN108133223B (zh) | 确定卷积神经网络cnn模型的装置和方法 | |
CN108681751B (zh) | 确定事件影响因素的方法及终端设备 | |
EP3620982A1 (en) | Sample processing method and device | |
CN113468796A (zh) | 一种基于改进随机森林算法的电压缺失数据辨识方法 | |
CN112765894B (zh) | 一种基于k-lstm的铝电解槽状态预测方法 | |
CN113515671A (zh) | 继电器时间参数异常值识别方法、服务端及存储介质 | |
CN110032585B (zh) | 一种时间序列双层符号化方法及装置 | |
CN115033893B (zh) | 一种改进型聚类算法的信息漏洞数据分析方法 | |
CN114897047B (zh) | 基于深度字典的多传感器数据漂移检测方法 | |
CN114091021A (zh) | 一种用于电力企业安全防护的恶意代码检测方法 | |
CN110059757B (zh) | 混合信号的分类方法、装置及电子设备 | |
CN110517326B (zh) | 一种基于权重蜻蜓算法的比色传感器阵列优化方法 | |
Chang et al. | Insulation faults diagnosis of power transformer by decision tree with fuzzy logic | |
KR20220061542A (ko) | 신뢰구간에 기반한 제조공정의 최적화 방법 및 시스템 | |
CN113657501A (zh) | 模型自适应训练方法、装置、设备、介质及程序产品 | |
CN112541588A (zh) | 一种基于正交实验的模型调参方法、设备和存储介质 | |
CN112363465A (zh) | 一种专家规则集训练方法、训练器和工业设备预警系统 | |
CA3101842A1 (en) | A method of digital signal feature extraction comprising multiscale analysis | |
CN115840907B (zh) | 场景行为分析方法、装置、电子设备和介质 | |
CN117112871B (zh) | 基于fcm聚类算法模型的数据实时高效融合处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |