发明内容
针对上述不足,本发明的目的之一在于提供一种基于逻辑回归的高压电器运行质量评估方法,其在全面反映高压电器运行状态的基础上,通过构建逻辑回归模型(Logistic)对该类数据进行分析,从各零散点中,挖掘数据发展规律,为巡检计划的制定和安排提供科学且实用的依据,从而提升巡检工作的合理性和有效性。
为实现以上目的,本发明采取的技术方案是:
一种基于逻辑回归的高压电器运行质量评估方法,其包括以下步骤:
步骤1、收集各厂家生产的高压电器设备的原始缺陷数据;
步骤2、对所述原始缺陷数据进行赋值转换和清理,以获取二次缺陷数据,所述二次缺陷数据包括高压电器设备生产厂家数据集合F1、高压电器设备投运时间T1、高压电器设备缺陷等级C1;
步骤3、根据二次数据构建逻辑回归模型,其包括以下步骤:
步骤31、将高压电器设备生产厂家数据集合F1作为逻辑回归模型中的独立变量向量x′=(x1,x2,…xi,…xn):
x′=F1={f1,f2,…fi,…fn}
其中,xi为独立变量向量x′中的第i个元素,fi为高压电器设备生产厂家数据集合F1中第i个生产厂家;
步骤32、将高压电器设备缺陷等级C1作为逻辑回归模型中的因变量向量y′=(y1,y2,y3):
y′=cj={c1,c2,c3}
其中,cj高压电器设备缺陷等级C1中第j个缺陷等级,j={1,2,3},c1为一般缺陷,c2为重大缺陷,c3为紧急缺陷;
步骤4、根据各高压电器设备生产厂家发生各等级缺陷的概率:
和各高压电器设备生产厂家不发生缺陷的概率:
可得事件的发生比:
又因为:
g(fi)=β0+β1*f1+β2*f2+…+βi*fi+…+βn*fn
所以对事件的发生比取对数,得到线性函数:
其中,cj=1时,表示y′中所代表的缺陷状态为真,反之,cj=0时,表示y′中所 代表的缺陷状态为假,P(cj=1|fi)表示第i个生产厂家中第j个缺陷等级为真的概率,P(cj=0|fi)表示第i个生产厂家中第j个缺陷等级为真的概率为假的概率,π(fi)表示第i个生产厂家存在缺陷的概率;g(fi)表示第i个生产厂家中二次数据项回归而成的系数函数;β0为截距,βi为第i个生产厂家fi与缺陷等级cj之间的关联度系数;
步骤5、依据所述关联度系数对高压电器设备生产厂家生产的高压电器设备运行质量进行评估,当某一高压电器设备生产厂家与某一缺陷等级的关联度系数值大于0且越大时,则该高压电器设备生产厂家生产的高压电器设备发生该缺陷等级的危险可能性越大;反之,当某一高压电器设备生产厂家与某一缺陷等级的关联度系数值小于0且越小时,则该高压电器设备生产厂家生产的高压电器设备发生该缺陷等级的危险可能性越小。
所述原始缺陷数据包括缺陷年份、严重等级、设备名称、部件名称、缺陷描述、缺陷类别和生产厂家。
所述步骤2中,对所述原始缺陷数据进行赋值转换和清理通过ETL工具实现,所述ETL工具为SAS软件。
本发明的目的之一在于提供一种基于逻辑回归的高压电器运行质量评估系统,其在全面反映高压电器运行状态的基础上,通过构建逻辑回归模型(Logistic)对该类数据进行分析,从各零散点中,挖掘数据发展规律,为巡检计划的制定和安排提供科学且实用的依据,从而提升巡检工作的合理性和有效性。
为实现以上目的,本发明采取的技术方案是:
一种基于逻辑回归的高压电器运行质量评估系统,其包括:
数据收集单元,用于收集各厂家生产的高压电器设备的原始缺陷数据;
数据整理单元,用于对所述原始缺陷数据进行赋值转换和清理,以获取二次缺陷数据,所述二次缺陷数据包括高压电器设备生产厂家数据集合F1、高压电器设备投运时间T1、高压电器设备缺陷等级C1;
模型构建单元,用于根据二次数据构建逻辑回归模型,所述模型构建单元包括:
独立变量相邻赋值单元,用于将高压电器设备生产厂家数据集合F1作为逻辑回归模型中的独立变量向量x′=(x1,x2,…xi,…xn):
x′=F1={f1,f2,…fi,…fn}
其中,xi为独立变量向量x′中的第i个元素,fi为高压电器设备生产厂家数据集合F1中第i个生产厂家;
因变量向量赋值单元,用于将高压电器设备缺陷等级C1作为逻辑回归模型中的因变量向量y′=(y1,y2,y3):
y′=cj={c1,c2,c3}
其中,cj高压电器设备缺陷等级C1中第j个缺陷等级,j={1,2,3},c1为一般缺陷,c2为重大缺陷,c3为紧急缺陷;
关联度系数计算单元,用于根据各高压电器设备生产厂家发生各等级缺陷的概率:
和各高压电器设备生产厂家不发生缺陷的概率:
可得事件的发生比:
又因为:
g(fi)=β0+β1*f1+β2*f2+…+βi*fi+…+βn*fn
所以对事件的发生比取对数,得到线性函数:
其中,cj=1时,表示y′中所代表的缺陷状态为真,反之,cj=0时,表示y′中所代表的缺陷状态为假,P(cj=1|fi)表示第i个生产厂家中第j个缺陷等级为真的概率,P(cj=0|fi)表示第i个生产厂家中第j个缺陷等级为真的概率为假的概率,π(fi)表示第i个生产厂家存在缺陷的概率;g(fi)表示第i个生产厂家中二次数据项回归而成的系数函数;β0为截距,βi为第i个生产厂家fi与缺陷等级cj之间的关联度系数;
质量评估单元,用于依据所述关联度系数对高压电器设备生产厂家生产的高压电器设备运行质量进行评估,当某一高压电器设备生产厂家与某一缺陷等级的关联度系数值大于0且越大时,则该高压电器设备生产厂家生产的高压电 器设备发生该缺陷等级的危险可能性越大;反之,当某一高压电器设备生产厂家与某一缺陷等级的关联度系数值小于0且越小时,则该高压电器设备生产厂家生产的高压电器设备发生该缺陷等级的危险可能性越小。
所述原始缺陷数据包括缺陷年份、严重等级、设备名称、部件名称、缺陷描述、缺陷类别和生产厂家。
所述数据整理单元中,对所述原始缺陷数据进行赋值转换和清理通过ETL工具实现,所述ETL工具为SAS软件。
与现有技术相比,本发明的有益效果在于:本发明在全面反映高压电器运行状态的基础上,通过构建逻辑回归模型对该类数据进行分析,从各零散点中挖掘数据发展规律,得到高压电器运行性能评估结果,为巡检计划的制定和安排提供科学且实用的依据,从而提升巡检工作的合理性和有效性。
实施例
本发明以隔离开关为例,对基于逻辑回归的高压电器运行质量评估和巡检计划制定方法进行说明,请参照图1所示,基于逻辑回归技术的隔离开关巡检判定方法主要包括以下五个步骤。
1)数据收集。
为实现全面反映隔离开关运行状态,为巡检计划的制定和安排提供科学且实用的依据,本发明首先通过各类信息系统,如:生产管理信息系统,对下表中所需数据进行统一收集。收集到的各厂家生产的隔离开关的缺陷数据主要包括:缺陷年份、严重等级、设备名称、部件名称、缺陷描述、缺陷类别、生产厂家等数据项。
其中,缺陷类别(或缺陷等级)分为:紧急缺陷、重大缺陷和一般缺陷。严重程度依次为:紧急缺陷>重大缺陷>一般缺陷。
紧急缺陷主要指:生产设备运行维护阶段中发生的,不满足运行维护标准,随时可能导致设备故障,对人身安全、电网安全、设备安全、经济运行造成严重影响,需立即进行处理的设备缺陷。
重大缺陷主要指:生产设备运行维护阶段中发生的,不满足运行维护标准,对人身安全、电网安全、设备安全、经济运行造成重大影响,设备在短时内还能坚持运行,但需尽快进行处理的设备缺陷。
一般缺陷主要指:生产设备运行维护阶段中发生的,基本不对设备安全、经济运行造成影响的设备缺陷。
2)数据整理。
日常生产运行过程中的缺陷数据内容比较庞杂,为在其中找到值得分析的数据,建模前,通过ETL工具(例如SAS软件)对需要得到的原始数据进行赋值转换和清理,得到数据集合、缺陷等级、投运时间等相关数据。转换后的数据如下表所示,其中第一列为隔离开关生产厂家数据集合F1,第二列为隔离开关投运时间T1,第三列为隔离开关缺陷等级C1。
3)模型构建
清洗后的二次数据与初始收集数据相比更具针对性和合理性,故直接用于逻辑回归(logistic)建模。逻辑回归又称逻辑回归分析,是一种用于描述分类型回应变量与一组预测变量之间关系的方法。将生产厂家数据集合F1作为逻辑回归模型中的独立变量向量x′=(x1,x2,…xi,…xn),缺陷等级集合作为逻辑回归中的因变量向量y′=(y1,y2,y3),可得:
x′=F1
={HNCGGYDQ,SYGYKG,AESTGYDQ,XDGYKGC,HNPGJT,MG,BJABBGYKG,PDSGYKGC};
y′=cj={yiban,zhongda,jinji};
再根据各厂家发生各类别缺陷的概率,其中cj=1,表示y′中元素所代表的缺陷状态为真,反之,cj=0时,表示y′中元素所代表的缺陷状态为假;fi表示x′中元素所代表的第i个生产厂家,i={1,2,3…8},g(fi)表示第i个生产厂家中二次数据项回归而成的系数函数。
和不发生缺陷的概率:
可得事件的发生比(the odds of experiencing an event),简称为odds:
又因为
g(fi)=β0+β1*f1+β2*f2+…+β8*f8 (4)
所以,对odds取对数,即得到线性函数,
而β0为截距,β1-β8为各生产厂家fi与缺陷等级cj之间的关联度系数。
4)关联度分析
由上可得各生产厂家的关联度系数表,如表1所示,由表1中可得各缺陷等级cj,j={1,2,3},所对应的八个生产厂家的关联度系数值,即:β1-β8。按 照逻辑回归模型的特性,以0为分割线,关联度系数值为正的属于“危险因素”,关联度系数值为负的属于“安全因素”。如果各个因素的关联度系数值绝对值越大,说明该厂家生产的设备发生某一类缺陷的危险(或安全)可能性也越大。
表1各生产厂家的关联度系数表
5)巡视任务调整
以前两者为例,虽然AEST重大缺陷的关联度系数高于SYGYKGC,但AEST的紧急关联度系数为-14.1374,而SYGYKGC紧急关联度系数为13.6376,根据2013年缺陷统计数据,SYGYKGC出现随时影响电网、人身安全且需立即处理的缺陷多,产品质量运行表现不如AEST。
以同样的方法对其他厂家产品运行数据进行分析,可知:鉴于HNPGJT生产的隔离开关发生紧急缺陷的可能性较高,建议各运维单位加强对HNPGJT生产的隔离开关巡检,缩短停电检修时间,检查隔离开关在运行一段时间后的电气、机械性能是否出现下降趋势,定期记录隔离开关的运行参数,保证及时发现设备存在的问题和缺陷。
其他高压电器如断路器、接地刀闸可以参照以上隔离开关的案例,基于逻辑回归技术,构建模型,进行运行质量评估及巡检计划制定。
以上所述实施例仅表达了本发明的实施方式,但并不能因此而理解为对本发明专利范围的限制。对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。