CN113515671A - 继电器时间参数异常值识别方法、服务端及存储介质 - Google Patents

继电器时间参数异常值识别方法、服务端及存储介质 Download PDF

Info

Publication number
CN113515671A
CN113515671A CN202110750803.9A CN202110750803A CN113515671A CN 113515671 A CN113515671 A CN 113515671A CN 202110750803 A CN202110750803 A CN 202110750803A CN 113515671 A CN113515671 A CN 113515671A
Authority
CN
China
Prior art keywords
data
time parameter
abnormal value
value
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110750803.9A
Other languages
English (en)
Inventor
李文华
桑海爽
王景芹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN202110750803.9A priority Critical patent/CN113515671A/zh
Publication of CN113515671A publication Critical patent/CN113515671A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本申请提供一种继电器时间参数异常值识别方法、服务端及存储介质,异常值识别方法包括以下步骤:获取继电器的时间参数序列;根据时间参数序列分解出趋势项集合和剩余项集合;利用机器学习的方法,筛选出剩余项集合中的异常值;利用自适应的标准差偏离整体程度的方法,筛选出趋势项集合中的异常值;汇总得到所述继电器的时间参数异常值。本申请提供的异常值识别的方法通过将时间参数序列分解重构得到具有趋势性的趋势项集合和数据相对平稳的剩余项集合,根据两集合数据的不同特点选择不同筛选方式,使得提高了异常值识别的工作效率及识别的准确性,解决了现有技术中人工删除异常值工作量大、主观性强的问题。

Description

继电器时间参数异常值识别方法、服务端及存储介质
技术领域
本公开一般涉及继电器技术领域,具体涉及一种继电器时间参数异常值识别方法、服务端及存储介质。
背景技术
继电器作为轨道交通信号控制技术中的重要部件,其动作的可靠性直接影响信号系统的安全性、可靠性。采集继电器的时间参数,机械参数,运动参数,触头形貌参数并对它们的性能进行分析比较,对于控制整个电路的通断、控制室外信号设备的动作、保证行车安全具有十分重要的意义。
从采集到的继电器的各个参数的原始数据来看,里面掺杂有少量的偏离数据整体分布的数值,且异常值与正常值相差较大,这种现象往往会对采集到的参数的整体分布规律产生较大的影响。而且自动化监测数据中异常值出现的位置、量值具有不确定性,人工删除异常值存在工作量大、主观性强等缺点,会对我们下一步利用继电器的参数进行其性能分析产生较大的影响,对继电器的性能判断产生影响。
因此,如何较准确的从继电器的原始时间参数数据中进行异常值的识别来提高对其性能分析的可靠度,已经成为本领域技术人员亟待解决的问题之一。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种可检测继电器时间参数数据异常值的一种继电器时间参数异常值识别方法、服务端及存储介质。
第一方面本申请提供一种继电器时间参数异常值识别方法,包括以下步骤:
获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
根据本申请实施例提供的技术方案,根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合的方法具体为:
根据所述时间参数序列x={xi|i=1,2,...,n},构建L*K阶轨迹矩阵XL*K
Figure BDA0003144325360000021
其中,2≤L≤n/2,K=n-L+1;
构建矩阵
Figure BDA0003144325360000022
其中
Figure BDA0003144325360000023
为所述轨迹矩阵XL*K的转置;
计算所述矩阵C的特征值,将所述特征值作为所述轨迹矩阵的特征值λi
计算所述矩阵C的特征向量,将所述特征向量作为所述轨迹矩阵XL*K的左特征向量Ui
根据以下公式计算所述轨迹矩阵XL*K的右特征向量Vi
Figure BDA0003144325360000024
根据以下公式分解所述轨迹矩阵XL*K
Figure BDA0003144325360000025
Figure BDA0003144325360000026
根据以下公式计算趋势项集合XC:
Figure BDA0003144325360000027
Figure BDA0003144325360000031
Figure BDA0003144325360000032
根据以下公式计算剩余项集合Xs:
Xs=x-XC
根据本申请实施例提供的技术方案,所述机器学习的方法为决策树算法、人工神经网络算法、贝叶斯学习算法中的任意一种。
根据本申请实施例提供的技术方案,所述机器学习的方法为随机森林算法,筛选出所述剩余项集合中的异常值的方法具体为:
S1:根据第i个训练集构建随机森林模型;
S2:计算所述第i个训练集中每个数据在随机森林模型中的路径长度h(x);
S3:计算所述路径长度h(x)的期望值E(h(x));
S4:根据以下公式计算每个数据的异常值分数s(x,m):
Figure BDA0003144325360000033
其中,γ为欧拉常数。
S5:将异常值分数s(x,m)→y的数据作为第i个训练集中的异常值,y为设定值;
i+1后递归上述步骤S1-S5直至递归次数达到设定值j;
其中,第1个训练集为所述剩余项集合Xs的绝对值;
i大于等于2时,第i个训练集由第i-1个训练集剔除异常值得到。根据本申请实施例提供的技术方案,根据以下公式计算设定值y:
y=c1+(c2-c1)*(n-1)/n;
其中,n为当前递归次数,c1、c2为设定参数。
根据本申请实施例提供的技术方案,构建所述随机森林模型的方法具体为构建所述随机森林模型的方法具体为构建第1-a棵子树组成所述随机森林模型,其中第k(1≤k≤a)棵子树的构建方法为:
S1:将第n个分割数据集作为子树的第n层根节点;
S2:以设定的切割点p对第n个分割数据集进行分割,得到第n层左数据集和第n层右数据集;
S3:用所述第n层左数据集构建第n层左子树,用所述第n层右数据集构建第n层右子树;
n加1后递归上述步骤S1-S3,直至子树达预定高度;所述n的初始化值为1;
其中第1个分割数据集为子采样集D={dk1,dk2,...dkx,...,dkm};所述子采样集D={dk1,dk2,...dkx,...,dkm}从第i个训练集中抽取m个样点得到;
n大于等于2时,第n层左数据集和第n层右数据集分别作为第n个分割数据集。
根据本申请实施例提供的技术方案,利用自适应标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值具体步骤为:
将所述趋势项集合XC中的数据分为N个数据组{x1,x2,...,xk},每个数据组中具有k个数据;
根据以下公式计算每个数据组中数据的算数平均值x:
Figure BDA0003144325360000041
根据以下公式计算每个数据组中数据的标准差:
Figure BDA0003144325360000042
根据以下公式计算每个数据组中每个数据xi的偏差Δdi
Figure BDA0003144325360000043
判断数据组中数据的偏差Δdi>aσ时,则该数据为异常值,其中a为设定值。
第二方面,本申请提供一种服务端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述所述继电器时间参数异常值识别方法的步骤。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质有计算机程序,所述计算机程序被处理器执行时实现如上述所述继电器时间参数异常值识别方法的步骤。
本申请的有益效果在于:通过获取继电器的时间参数序列x={xii=1,2,...,n},并将该序列分解、重构,得到具有数据具有趋势性的趋势项集合和数据相对平稳的剩余项集合,通过针对不同集合的特点选取不同的筛选方法,使得提高了异常值识别的工作效率及识别的准确性,即:
由于所述趋势项集合的数据具有相对明显变化的趋势性,因此采用自适应的标准差偏离整体程度的方法,使得可以很精确的把趋势项集合中异常值筛选出来。由于所述剩余项结合的数据较为平稳;而机器学习的方法,例如随机森林算法,其对于气温等平稳变化的连续性数据具有较强的异常值检测识别能力,但对于土石坝沉降等具有时效性的非平稳监测数据则无法准确地检测识别;因此利用机器学习的方法,可以快速且准确的筛选出所述剩余项集合中的异常值。
本申请提供的继电器时间参数异常值识别的方法,不需要除时间参数序列以外的其他特征标签,无需对样本进行训练学习,扩大了其适用范围,降低了工作量,提高了计算效率,提高了计算的准确性,解决了现有技术中人工删除异常值工作量大、主观性强的问题,避免后续对于继电器的性能判断产生影响。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请提供的一种继电器时间参数异常值识别方法流程图。
图2为本申请提供的一种服务端。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
实施例1
请参考图1为本申请提供的继电器时间参数异常值识别方法,包括以下步骤:
S100:获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
S200:根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
S300:利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
S400:利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
S500:汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
具体的,所述时间参数序列x={xi|i=1,2,...,n}可通过温湿度试验箱获取。
所述时间参数可以为吸合时间、释放时间、动断超程时间、动合超程时间、弹跳时间、电弧燃烧时间。例如:所述时间参数可以为动断超程时间,通过温湿度试验箱获取所有动断超程时间数据,并生成时间参数序列x={xi|i=1,2,...,n}。
为了便于说明本申请的方法步骤,选取了8台继电器试品,以检测其动断超程时间为例:
利用温湿度试验箱分别获取8台继电器试品的动断超程时间序列;分别对八个序列进行分解重构分别得到趋势项集合和剩余项集合;利用机器学习的方法,筛选出所述剩余项集合中的异常值,利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值。筛选结果如表-1所示:
试品号 剩余项中异常值数(个) 趋势项中异常值数(个) 整体异常值数(个)
1 120 280 400
2 149 250 399
3 152 250 402
4 147 251 398
5 163 236 399
6 150 253 403
7 139 251 400
8 141 260 401
表-1
工作原理:通过获取继电器的时间参数序列x={xi|i=1,2,...,n},并将该序列分解、重构,得到数据具有趋势性的趋势项集合和数据相对平稳的剩余项集合,使得可针对不同集合特征选取不同的筛选方法,即采用机器学习的方法,筛选出所述剩余项集合中的异常值作为第一异常值;利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值作为第二异常值,汇总所述第一异常值和第一异常值,即为所述继电器的时间参数异常值。
由于所述趋势项集合的数据具有相对明显变化的趋势性,因此采用自适应的标准差偏离整体程度的方法,使得可以很精确的把趋势项集合中异常值筛选出来。
由于所述剩余项结合的数据较为平稳;机器学习的方法,例如随机森林算法,其对于气温等平稳变化的连续性数据具有较强的异常值检测识别能力,但对于土石坝沉降等具有时效性的非平稳监测数据则无法准确地检测识别;因此利用机器学习的方法,可以快速且准确的筛选出所述剩余项集合中的异常值。
本申请提供的继电器时间参数异常值识别方法,不需要除时间参数序列以外的其他特征标签,无需对样本进行训练学习,扩大了其适用范围,降低了工作量,解决了现有技术中人工删除异常值工作量大、主观性强的问题;同时也提高了计算效率,提高了计算的准确性。
其中,在一优选实施方式中,根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合的方法具体为:
S210:根据所述时间参数序列x={xi|i=1,2,...,n},构建L*K阶轨迹矩阵XL*K
Figure BDA0003144325360000081
其中,2≤L≤n/2,K=n-L+1;L为嵌入窗口长度。
S220:构建矩阵
Figure BDA0003144325360000082
其中
Figure BDA0003144325360000083
为所述轨迹矩阵XL*K的转置;
具体的,所述轨迹矩阵XL*K的转置矩阵
Figure BDA0003144325360000084
为:
Figure BDA0003144325360000085
S230:计算所述矩阵C的特征值,将所述特征值作为所述轨迹矩阵的特征值λi
需要进一步说明的是,设A为n阶矩阵,如果数λ和n维非零向量X使关系式AX=λX成立,则这样的数λ称为矩阵A的特征值。
进一步的,n阶方阵A的特征值是使齐次线性方程组|A-λE|X=0有非零解的λ值,即满足方程|A-λE|X=0的λ都是矩阵A的特征值。
具体的,将所述特征值λi按降序排列,其中最大的特征值所对应的特征向量即为序列的趋势,一般将较小特征值对应的特征向量当作噪声。
S240:计算所述矩阵C的特征向量,将所述特征向量作为所述轨迹矩阵XL*K的左特征向量Ui
需要进一步说明的是,设A为n阶矩阵,如果数λ和n维非零向量X使关系式AX=λX成立,非零向量X称为矩阵A的特征向量。其中,特征向量X≠0;
S250:根据以下公式计算所述轨迹矩阵XL*K的右特征向量Vi
Figure BDA0003144325360000086
其中,
Figure BDA0003144325360000087
称为时间参数序列x={xi|i=1,2,...,n}的异常谱。
S260:根据以下公式分解所述轨迹矩阵XL*K
Figure BDA0003144325360000088
其中,初等矩阵
Figure BDA0003144325360000089
S270:根据以下公式计算趋势项集合XC:
Figure BDA0003144325360000091
Figure BDA0003144325360000092
Figure BDA0003144325360000093
具体的,Uk表示矩阵XL*K中xk的左特征向量,j表示其在该矩阵中的列数。
S280:根据以下公式计算剩余项集合Xs:
Xs=x-XC
其中,在一优选实施方式中,所述机器学习的方法为决策树算法、人工神经网络算法、贝叶斯学习算法中的任意一种算法。
其中,在一优选实施方式中,所述机器学习的方法为随机森林算法,筛选出所述剩余项集合中的异常值的方法具体为:
S1:根据第i个训练集构建随机森林模型;
S2:计算所述第i个训练集中每个数据在随机森林模型中的路径长度h(x);
S3:计算所述路径长度h(x)的期望值E(h(x));
S4:根据以下公式计算每个数据的异常值分数s(x,m):
Figure BDA0003144325360000094
Figure BDA0003144325360000095
H(m-1)=ln(m-1)+γ;
其中,γ为欧拉常数,c(m)为搜索路径长度平均值。
S5:将异常值分数s(x,m)→y的数据作为第i个训练集中的异常值,y为设定值;
i+1后递归上述步骤S1-S5直至递归次数达到设定值j;
其中,第1个训练集为所述剩余项集合Xs的绝对值;
i大于等于2时,第i个训练集由第i-1个训练集剔除异常值得到。
具体的,对于提供含有m个样本数量的子样本集D,由于子树的结构与二叉树等价,因此其搜索路径长度平均值c(m)等价于二叉树中失败查询的路径长度:2H(m-1)-2(m-1)/m。
式中:H(m-1)为调函数,可以被估计为H(m-1)=ln(m-1)+γ,γ为欧拉常数;c(m)用于标准化查询数据x的路径长h(x)。
具体的,路径长度h(x)的计算公式如下:
h(x)=e+c(m);
其中,e表示数据点x从子树的根节点到叶节点过程中经过的边的数目。
具体的,期望值E(h(x))表示数据点x所有路径长度h(x)的平均值。
需要进一步说明的是,当E(h(x))→m-1时,s→0,判断该数据点为正常点;当E(h(x))→c(m)时,s→0.5,则无法判断该数据点是否异常;设定值j以及设定值y可以根据实际情况进行设置,以设定值j为50,设定值y为1为例:
当E(h(x))→0时,s→1,判断该数据点为异常值。为避免在一次筛选过程中,无法识别全部异常数据点,因此通过上述方式进行递归,即:将剔除异常值的训练集再次进行上述步骤S1-S5,直至递归次数达50次。
根据本申请实施例提供的技术方案,根据以下公式计算设定值y:
y=c1+(c2-c1)*(n-1)/n;
其中,n为当前递归次数,c1、c2为设定参数。例如:c1的值可设定为0.6,c2的值设定为1。
例如:利用温湿度试验箱获取该继电器的动断超程时间,共获取了200000个数据;在构建的随机森林模型中,子树样本容量为256,最大层高为8层,共有100颗子树,最大递归次数为50。
因此在第一次迭代时,有n=1,y=0.6;第二次迭代时,有n=2,y=0.8;以此类推,可分别计算出对应迭代次数下的设定值y。
其中,在一优选实施方式中,构建所述随机森林模型方法具体为:
构建第1-a棵子树组成所述随机森林模型,其中第k(1≤k≤a)棵子树的构建方法为:
S1:将第n个分割数据集作为子树的第n层根节点;
S2:以设定的切割点p对第n个分割数据集进行分割,得到第n层左数据集和第n层右数据集;
S3:用所述第n层左数据集构建第n层左子树,用所述第n层右数据集构建第n层右子树;
n加1后递归上述步骤S1-S3,直至子树达预定高度;所述n的初始化值为1;
其中第1个分割数据集为子采样集D={dk1,dk2,...dkx,...,dkm};所述子采样集D={dk1,dk2,...dkx,...,dkm}从第i个训练集中抽取m个样点得到;
n大于等于2时,第n层左数据集和第n层右数据集分别作为第n个分割数据集。
具体的,预定高度是指递归迭代至:树的高度达到限制,或数据空间中只有一个数据或多个相同的数值(即无法再进行数据划分)。
为了便于说明本申请的工作原理,以第1个训练集构建随机森林模型为例:
构建随机森林模型中第1颗子树:
从第1个训练集(所述剩余项集合Xs的绝对值)中随机抽取m个样点得到采样集D={d11,d12,...d1x,...,d1m},将所述采样集D={d11,d12,...d1x,...,d1m}作为第一层根节点,并从中选取一个切割点p,切割点P满足:dmin<p<dmax
将所述子采样集D={d1,d2,...dx,...,dm}中的所有数据点dx依次与切割点p进行比较,判断当dx<p时,将该点放入至第一层左数据集中,将第一层左数据集构建第一层左子树;判断当dx>p时,将该点放入至第一层右数据集中,将第一层右数据集构建第一层右子树;
递归,直至第n个分割数据集中只有一个数据或多个相同的数据,或树的高度达到限值。
构建随机森林模型中第2颗子树:
从第1个训练集(所述剩余项集合Xs的绝对值)中随机抽取m个样点得到采样集D={d21,d22,...d2x,...,d2m},第2颗子树与上述构建过程相同,此处不再赘述;
直至构建a颗子树,共同形成所述随机森林模型。
其中,在一优选实施方式中,利用自适应标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值具体步骤为:
将所述趋势项集合XC中的数据分为N个数据组,每个数据组中具有k个数据;
根据以下公式计算每个数据组中数据的算数平均值
Figure BDA0003144325360000121
Figure BDA0003144325360000122
根据以下公式计算每个数据组中数据的标准差:
Figure BDA0003144325360000123
根据以下公式计算每个数据组中每个数据xi的偏差Δdi
Figure BDA0003144325360000124
判断数据组中数据的偏差Δdi>aσ时,则该数据为异常值,其中a为设定值。
具体的,a为设定值,例如a的值可取5。
利用上述自适应的标准偏差偏离整体程度的方法,在进行第一组的异常值识别后,可根据下一组的数据分布情况自适应改变判断偏差的阈值,最终得到整体数据的异常值。
需要注意的是,文中在不同应用场景或不同公式中出现的相同字母(i、j、m、n等)不应被认定其数值或含义上相同。
例如:x={xi|i=1,2,...,n}中的i表示的是时间参数序列中第几个数据点。在筛选剩余项集合中的异常值的方法中“根据第i个训练集构建随机森林模型”此处的i表示的第几个训练集。两者不应当认为具有数值上的关联。
实施例2
请参考图2为本申请提供的服务端或服务器的计算机系统600的原理框图,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述继电器时间参数异常值识别方法的步骤。
如图2所示,所述计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明的实施例,上文参考流程图1描述的过程可以被实现为计算机软件程序。例如,本发明的实施例1包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
实施例3
本申请还提供一种计算机可读存储介质,所述计算机程序被处理器执行时实现如上述所述继电器时间参数异常值识别方法的步骤。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、数据处理模块。
其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获取模块还可以被描述为“用于获取时间参数序列x={xi|i=1,2,...,n}的获取模块”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中继电器时间参数异常值识别方法的步骤。
例如,所述电子设备可以实现如图1中所示的:
获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (9)

1.一种继电器时间参数异常值识别方法,其特征在于:包括以下步骤:
获取所述继电器的时间参数序列x={xi|i=1,2,...,n};
根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合;
利用机器学习的方法,筛选出所述剩余项集合中的异常值,得到第一异常值;
利用自适应的标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值,得到第二异常值;
汇总所述第一异常值和第一异常值,作为所述继电器的时间参数异常值。
2.根据权利要求1所述的继电器时间参数异常值识别方法,其特征在于:根据所述时间参数序列x={xi|i=1,2,...,n},分解出趋势项集合和剩余项集合的方法具体为:
根据所述时间参数序列x={xi|i=1,2,...,n},构建L*K阶轨迹矩阵XL*K
Figure FDA0003144325350000011
其中,2≤L≤n/2,K=n-L+1;
构建矩阵
Figure FDA0003144325350000012
其中
Figure FDA0003144325350000013
为所述轨迹矩阵XL*K的转置;
计算所述矩阵C的特征值,将所述特征值作为所述轨迹矩阵的特征值λi
计算所述矩阵C的特征向量,将所述特征向量作为所述轨迹矩阵XL*K的左特征向量Ui
根据以下公式计算所述轨迹矩阵XL*K的右特征向量Vi
Figure FDA0003144325350000014
根据以下公式分解所述轨迹矩阵XL*K
Figure FDA0003144325350000021
Figure FDA0003144325350000022
根据以下公式计算趋势项集合XC:
Figure FDA0003144325350000023
Figure FDA0003144325350000024
Figure FDA0003144325350000025
根据以下公式计算剩余项集合Xs:
Xs=x-XC
3.根据权利要求2所述的继电器时间参数异常值识别方法,其特征在于:所述机器学习的方法为决策树算法、人工神经网络算法、贝叶斯学习算法中的任意一种。
4.根据权利要求2所述的继电器时间参数异常值识别方法,其特征在于:所述机器学习的方法为随机森林算法,筛选出所述剩余项集合中的异常值的方法具体为:
S1:根据第i个训练集构建随机森林模型;
S2:计算所述第i个训练集中每个数据在随机森林模型中的路径长度h(x);
S3:计算所述路径长度h(x)的期望值E(h(x));
S4:根据以下公式计算每个数据的异常值分数s(x,m):
Figure FDA0003144325350000026
Figure FDA0003144325350000027
H(m-1)=ln(m-1)+γ;
其中,γ为欧拉常数。
S5:将异常值分数s(x,m)→y的数据作为第i个训练集中的异常值,y为设定值;
i+1后递归上述步骤S1-S5直至递归次数达到设定值j;
其中,第1个训练集为所述剩余项集合Xs的绝对值;
i大于等于2时,第i个训练集由第i-1个训练集剔除异常值得到。
5.根据权利要求4所述的继电器时间参数异常值识别方法,其特征在于:
根据以下公式计算设定值y:
y=c1+(c2-c1)*(n-1)/n;
其中,n为当前递归次数,c1、c2为设定参数。
6.根据权利要求4所述的继电器时间参数异常值识别方法,其特征在于:构建所述随机森林模型的方法具体为构建第1-a棵子树组成所述随机森林模型,其中第k(1≤k≤a)棵子树的构建方法为:
S1:将第n个分割数据集作为子树的第n层根节点;
S2:以设定的切割点p对第n个分割数据集进行分割,得到第n层左数据集和第n层右数据集;
S3:用所述第n层左数据集构建第n层左子树,用所述第n层右数据集构建第n层右子树;
n加1后递归上述步骤S1-S3,直至子树达预定高度;所述n的初始化值为1;
其中第1个分割数据集为子采样集D={dk1,dk2,...dkx,...,dkm};所述子采样集D={dk1,dk2,...dkx,...,dkm}从第i个训练集中抽取m个样点得到;
n大于等于2时,第n层左数据集和第n层右数据集分别作为第n个分割数据集。
7.根据权利要求2所述的继电器时间参数异常值识别方法,其特征在于:利用自适应标准差偏离整体程度的方法,筛选出所述趋势项集合中的异常值具体步骤为:
将所述趋势项集合XC中的数据分为N个数据组{x1,x2,...,xk},每个数据组中具有k个数据;
根据以下公式计算每个数据组中数据的算数平均值
Figure FDA0003144325350000031
Figure FDA0003144325350000032
根据以下公式计算每个数据组中数据的标准差:
Figure FDA0003144325350000041
根据以下公式计算每个数据组中每个数据xi的偏差Δdi
Figure FDA0003144325350000042
判断数据组中数据的偏差Δdi>aσ时,则该数据为异常值,其中a为设定值。
8.一种服务端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述继电器时间参数异常值识别方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述继电器时间参数异常值识别方法的步骤。
CN202110750803.9A 2021-07-01 2021-07-01 继电器时间参数异常值识别方法、服务端及存储介质 Pending CN113515671A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110750803.9A CN113515671A (zh) 2021-07-01 2021-07-01 继电器时间参数异常值识别方法、服务端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110750803.9A CN113515671A (zh) 2021-07-01 2021-07-01 继电器时间参数异常值识别方法、服务端及存储介质

Publications (1)

Publication Number Publication Date
CN113515671A true CN113515671A (zh) 2021-10-19

Family

ID=78066363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110750803.9A Pending CN113515671A (zh) 2021-07-01 2021-07-01 继电器时间参数异常值识别方法、服务端及存储介质

Country Status (1)

Country Link
CN (1) CN113515671A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133606A (zh) * 2017-05-26 2017-09-05 广东工业大学 一种时间序列趋势提取的方法及装置
CN107528722A (zh) * 2017-07-06 2017-12-29 阿里巴巴集团控股有限公司 一种时间序列中异常点检测方法及装置
US20190286096A1 (en) * 2018-03-14 2019-09-19 Omron Corporation Abnormality detection system, support device, and model generation method
US20200287497A1 (en) * 2017-11-28 2020-09-10 Kabushiki Kaisha Yaskawa Denki Abnormality determination system, motor control apparatus, and abnormality determination apparatus
CN111964889A (zh) * 2020-08-20 2020-11-20 沈阳铁路信号有限责任公司 一种用于铁路信号继电器时间参数的有效信息提取方法
CN112329194A (zh) * 2020-07-01 2021-02-05 河北工业大学 一种基于数学模型的铁路信号继电器有效时间参数确定方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133606A (zh) * 2017-05-26 2017-09-05 广东工业大学 一种时间序列趋势提取的方法及装置
CN107528722A (zh) * 2017-07-06 2017-12-29 阿里巴巴集团控股有限公司 一种时间序列中异常点检测方法及装置
US20200287497A1 (en) * 2017-11-28 2020-09-10 Kabushiki Kaisha Yaskawa Denki Abnormality determination system, motor control apparatus, and abnormality determination apparatus
US20190286096A1 (en) * 2018-03-14 2019-09-19 Omron Corporation Abnormality detection system, support device, and model generation method
CN112329194A (zh) * 2020-07-01 2021-02-05 河北工业大学 一种基于数学模型的铁路信号继电器有效时间参数确定方法
CN111964889A (zh) * 2020-08-20 2020-11-20 沈阳铁路信号有限责任公司 一种用于铁路信号继电器时间参数的有效信息提取方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
倪育才编著: "《国家大地坐标系建立的理论与实践》", 中国质量标准出版传媒有限公司, pages: 147 - 148 *
张东华等: "奇异谱分析的变形监测序列粗差探测方法", 《测绘科学》, 15 August 2020 (2020-08-15), pages 1 - 2 *
张东华等: "奇异谱分析的变形监测序列粗差探测方法", 《测绘科学》, no. 2020, pages 1 *
张海龙等: "孤立森林算法在大坝监测数据异常识别中的应用", 《人民黄河》, no. 08, 10 August 2020 (2020-08-10), pages 2 - 4 *
赵新华等: "基于数据重构与孤立森林法的大坝自动化监测数据异常检测方法", 《中国农村水利水电》, no. 2021 *

Similar Documents

Publication Publication Date Title
Cerqueira et al. Evaluating time series forecasting models: An empirical study on performance estimation methods
CN107247989B (zh) 一种实时的计算机视觉处理方法及装置
US20180240041A1 (en) Distributed hyperparameter tuning system for machine learning
CN109033513B (zh) 电力变压器故障诊断方法与电力变压器故障诊断装置
CN111667010A (zh) 基于人工智能的样本评估方法、装置、设备及存储介质
CN108133223B (zh) 确定卷积神经网络cnn模型的装置和方法
CN108681751B (zh) 确定事件影响因素的方法及终端设备
EP3620982A1 (en) Sample processing method and device
CN113468796A (zh) 一种基于改进随机森林算法的电压缺失数据辨识方法
CN112765894B (zh) 一种基于k-lstm的铝电解槽状态预测方法
CN113515671A (zh) 继电器时间参数异常值识别方法、服务端及存储介质
CN110032585B (zh) 一种时间序列双层符号化方法及装置
CN115033893B (zh) 一种改进型聚类算法的信息漏洞数据分析方法
CN114897047B (zh) 基于深度字典的多传感器数据漂移检测方法
CN114091021A (zh) 一种用于电力企业安全防护的恶意代码检测方法
CN110059757B (zh) 混合信号的分类方法、装置及电子设备
CN110517326B (zh) 一种基于权重蜻蜓算法的比色传感器阵列优化方法
Chang et al. Insulation faults diagnosis of power transformer by decision tree with fuzzy logic
KR20220061542A (ko) 신뢰구간에 기반한 제조공정의 최적화 방법 및 시스템
CN113657501A (zh) 模型自适应训练方法、装置、设备、介质及程序产品
CN112541588A (zh) 一种基于正交实验的模型调参方法、设备和存储介质
CN112363465A (zh) 一种专家规则集训练方法、训练器和工业设备预警系统
CA3101842A1 (en) A method of digital signal feature extraction comprising multiscale analysis
CN115840907B (zh) 场景行为分析方法、装置、电子设备和介质
CN117112871B (zh) 基于fcm聚类算法模型的数据实时高效融合处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination