CN112861973A - 一种基于决策树的通信铁塔故障诊断方法 - Google Patents

一种基于决策树的通信铁塔故障诊断方法 Download PDF

Info

Publication number
CN112861973A
CN112861973A CN202110182996.2A CN202110182996A CN112861973A CN 112861973 A CN112861973 A CN 112861973A CN 202110182996 A CN202110182996 A CN 202110182996A CN 112861973 A CN112861973 A CN 112861973A
Authority
CN
China
Prior art keywords
decision tree
fault diagnosis
fault
iron tower
steps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110182996.2A
Other languages
English (en)
Inventor
符志华
李昇平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shantou University
Original Assignee
Shantou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shantou University filed Critical Shantou University
Priority to CN202110182996.2A priority Critical patent/CN112861973A/zh
Publication of CN112861973A publication Critical patent/CN112861973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种基于决策树的通信铁塔故障诊断方法,包括:选取了通信铁塔相关监测参数和故障类型;基于SPSS软件对监测数据进行筛选和离散化处理;对C4.5决策树算法进行优化;根据优化的C4.5决策树算法建立决策树模型,并通过该决策树模型建立故障诊断规则;利用建立的诊断规则进行通信铁塔故障的诊断和预测。本申请能有效的解决铁塔故障诊断中误差大,数据利用率低和数据量大难以处理的问题,提高了故障诊断准确率。

Description

一种基于决策树的通信铁塔故障诊断方法
技术领域
本发明涉及通信铁塔维护技术领域,尤其涉及一种基于决策树的通信铁塔故障诊断方法。
背景技术
在现有的通信铁塔维护工作中,对通信铁塔的故障诊断方法经常需要人为经验去制定,同时随着物联网监测技术的不断发展,铁塔的监测数据出现了数据量大,属性冗杂等特点,这些因素都给铁塔的故障诊断增加了难度。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于决策树的通信铁塔故障诊断方法。利用大数据处理技术和机器学习算法生成故障诊断规则,能有效的对通信铁塔进行故障诊断与预测。
为了解决上述技术问题,本发明实施例提供了一种基于决策树的通信铁塔故障诊断方法,包括以下步骤:
S1:选取通信铁塔相关监测参数和故障类型;
S2:基于SPSS分析软件对监测数据进行预处理,包括数据筛选和离散化处理,得到离散化数据;
S3:根据C4.5算法建立决策树模型;
S4:使用肯德尔和谐系数对C4.5算法进行优化,并生成优化之后的决策树模型,建立诊断规则;
S5:利用建立的诊断规则进行通信铁塔故障的诊断和预测。
其中,所述步骤S1中监测参数包括风速,倾角,振动幅度,三轴振动加速度。
其中,所述步骤S2中还包括对所述监测数据使用SPSS分析软件进行变量的分类与标准化。
其中,所述步骤S3具体包括步骤:
S31:计算各判断属性的信息熵;
S32:计算信息增益;
S33:使用所述信息增益率来判断最优属性作为决策树根节点;
S34:选取特征增益率最大的特征作为根节点,该特征在不再参与下面的计算,剩下的特征重复以上计算步骤,直到构建出一颗完整的决策树;
S35:进行决策树后剪枝,从下而上对所有的内部节点进行剪枝性能分析,并与未剪枝之前进行性能比较,直至呈现出一棵合适的决策树。
其中,所述步骤S4具体包括步骤:
S41:引入肯德尔和谐系数;
S42:根据等价无穷小原理In(1+x)≈x及换底公式将C4.5算法优化。
其中,所述步骤S5具体包括步骤:
将生成的决策树模型使用Python语言实现之后首先输入训练集进行训练,然后将实时监测的数据输入,获得对应的故障分类结果。
实施本发明实施例,具有如下有益效果:
附图说明
图1为本发明的流程示意图;
图2为本发明的C4.5决策树算法结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明提供一种基于决策树的通信铁塔故障诊断方法,包含步骤:
S1:选取通信铁塔相关监测参数,基于SPSS软件对监测数据进行分析;
随着通信铁塔监测技术的不断完善,如今的监测技术可以监测到铁塔的各类属性。主要监测的性能参数包括:风速、风向、温度、倾角、振动幅度和三轴振动加速度等,要对这些数据进行分析,需要明确相应的故障类型,目前通信铁塔的故障类型主要有:倾斜,裂纹,形变,螺栓松动等。
S2:基于SPSS软件对监测数据进行筛选和离散化处理;
对于监测系统产生的大量数据,在构建算法模型之前需要对数据进行预处理和简单的分析。数据的筛选需要考虑是否和日常维护相关,因此重点选用风速,倾角,振动幅度,三轴振动加速度作为判断属性。同时使用SPSS对数据进行K均值聚类分析,实现连续型数据的离散化,SPSS软件具有内置的聚类分析模型,可以计算变量之间的和谐关系,将类似变量归为一类,展示分类结果,并且对数据本身进行标准化。
连续值处理:采用K均值聚类分析方法,将样本D分为几个子集,计算各个子集之间的距离,将距离相近的子集划分到一起,其定义为:
给定样本集D{x1,x2,…xm},子集划分为C{c1,c2,…ck},最小化平方误差公式为
Figure BDA0002942194710000031
其中μi为ci的均值向量,E越小相似度越高。
S3:根据C4.5决策树算法建立决策树模型;具体包括:
S31:计算各判断属性信息熵;
假设一个随机变量X的取值为X={x1,x2,…,xn},每一种取到的概率分别是{p1,p2,…,pn},那么信息熵定义公式为:
Figure BDA0002942194710000032
H(x)为熵值,pi为变量x发生的概率。
S32:根据S31,计算信息增益;
特征A对训练数据集S的信息增益g(S,A),定义为集合S的信息熵H(S)与特征A给定条件下S的信息条件熵H(S|A)之差,信息增益定义式为g(S,A)=H(S)-H(S|A)。
S33:根据S32,计算信息增益率来判断最优属性作为决策树根节点;
特征A的信息增益率可以用如下公式表示:
Figure BDA0002942194710000033
其中
Figure BDA0002942194710000041
其中n为特征A的取值个数。
S34:根据S33的结果,选取特征增益率最大的特征作为根节点,该特征在不再参与下面的计算,剩下的特征重复以上计算步骤,直到构建出一颗完整的决策树。
S35:在S34的基础上进行决策树后剪枝,需要从下而上对所有的内部节点进行剪枝性能分析,并与未剪枝之前进行性能比较,直至呈现出一棵合适的决策树。
S4:C4.5决策树算法的进一步优化;具体包括:
S41:引入肯德尔和谐系数;
肯德尔和谐系数用来判断多个变量之间的和谐程度,设Z为数据集,由N个特征变量A和S个决策变量B组成,设Ck(s=1,2,3,…,N)为属性A的值,Di(s=1,2,3,…,N)表示Ck每一行的和,肯德尔和谐系数的表达式,
Figure BDA0002942194710000042
当W的值趋向于-1时,表明变量之间存在对立的相关性,当W的值趋向与1时,表明变量之间存在一致的相关性,当W=0时,表明变量之间相互独立。
S42:算法优化;
将W代入S3中公式得:信息增益定义式为g(S,A)=H(S)-H(S|A)×W。
再根据等价无穷小原理In(1+x)≈x及换底公式得:信息熵公式为
Figure BDA0002942194710000043
其中Ck为属于样本中Ck类别的样本个数。
根据特征A将数据集S划分为n个子集:(A1,A2,…,An),Ai为对应的Si中的样本数目,集合Si中属于Ck类的样本集合为Sik,容量为Aik,那么特征A对于数据集S的信息熵为:
Figure BDA0002942194710000051
信息增益
Figure BDA0002942194710000052
其中
Figure BDA0002942194710000053
如图2所示,引入肯德尔和谐系数对上述算法的计算过程进行优化,建立决策树模型,可以使得分类结果更加精确,提高算法的效率。
S5:利用建立的诊断规则进行通信铁塔故障的诊断和预测;
将生成的决策树模型使用Python语言实现之后首先输入训练集进行训练,然后将实时监测的数据输入,即可获得对应的故障分类结果,管理人员即可根据该分类结果作出相应的风险评价。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (6)

1.一种基于决策树的通信铁塔故障诊断方法,其特征在于,包括以下步骤:
S1:选取通信铁塔相关监测参数和故障类型;
S2:基于SPSS分析软件对监测数据进行预处理,包括数据筛选和离散化处理,得到离散化数据;
S3:根据C4.5算法建立决策树模型;
S4:使用肯德尔和谐系数对C4.5算法进行优化,并生成优化之后的决策树模型,建立诊断规则;
S5:利用建立的诊断规则进行通信铁塔故障的诊断和预测。
2.根据权利要求1所述的基于决策树的通信铁塔故障诊断方法,其特征在于,所述步骤S1中监测参数包括风速,倾角,振动幅度,三轴振动加速度。
3.根据权利要求2所述的基于决策树的通信铁塔故障诊断方法,其特征在于,所述步骤S2中还包括对所述监测数据使用SPSS分析软件进行变量的分类与标准化。
4.根据权利要求3所述的基于决策树的通信铁塔故障诊断方法,其特征在于,所述步骤S3具体包括步骤:
S31:计算各判断属性的信息熵;
S32:计算信息增益;
S33:使用所述信息增益率来判断最优属性作为决策树根节点;
S34:选取特征增益率最大的特征作为根节点,该特征在不再参与下面的计算,剩下的特征重复以上计算步骤,直到构建出一颗完整的决策树;
S35:进行决策树后剪枝,从下而上对所有的内部节点进行剪枝性能分析,并与未剪枝之前进行性能比较,直至呈现出一棵合适的决策树。
5.根据权利要求4所述的基于决策树的通信铁塔故障诊断方法,其特征在于,所述步骤S4具体包括步骤:
S41:引入肯德尔和谐系数;
S42:根据等价无穷小原理In(1+x)≈x及换底公式将C4.5算法优化。
6.根据权利要求5所述的基于决策树的通信铁塔故障诊断方法,其特征在于,所述步骤S5具体包括步骤:
将生成的决策树模型使用Python语言实现之后首先输入训练集进行训练,然后将实时监测的数据输入,获得对应的故障分类结果。
CN202110182996.2A 2021-02-08 2021-02-08 一种基于决策树的通信铁塔故障诊断方法 Pending CN112861973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110182996.2A CN112861973A (zh) 2021-02-08 2021-02-08 一种基于决策树的通信铁塔故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110182996.2A CN112861973A (zh) 2021-02-08 2021-02-08 一种基于决策树的通信铁塔故障诊断方法

Publications (1)

Publication Number Publication Date
CN112861973A true CN112861973A (zh) 2021-05-28

Family

ID=75988491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110182996.2A Pending CN112861973A (zh) 2021-02-08 2021-02-08 一种基于决策树的通信铁塔故障诊断方法

Country Status (1)

Country Link
CN (1) CN112861973A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910667A (zh) * 2023-09-08 2023-10-20 中国铁塔股份有限公司吉林省分公司 基于决策算法的通信铁塔异常状态分析方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902816A (zh) * 2014-03-12 2014-07-02 郑州轻工业学院 基于数据挖掘技术的带电检测数据处理方法
CN104392591A (zh) * 2014-11-13 2015-03-04 国家电网公司 输电线杆故障监测专家系统
CN106096748A (zh) * 2016-04-28 2016-11-09 武汉宝钢华中贸易有限公司 基于聚类分析和决策树算法的装车工时预测模型
CN106202886A (zh) * 2016-06-29 2016-12-07 中国铁路总公司 基于模糊粗糙集与决策树的轨道电路红光带故障定位方法
CN108548988A (zh) * 2018-03-27 2018-09-18 南瑞集团有限公司 基于互信息改进决策树的线路故障预测方法
CN109626161A (zh) * 2018-12-19 2019-04-16 暨南大学 一种电梯故障诊断方法
CN111126672A (zh) * 2019-12-02 2020-05-08 国网浙江省电力有限公司电力科学研究院 一种基于分类决策树的高压架空输电线路台风灾害预测方法
US20200200648A1 (en) * 2018-02-12 2020-06-25 Dalian University Of Technology Method for Fault Diagnosis of an Aero-engine Rolling Bearing Based on Random Forest of Power Spectrum Entropy

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902816A (zh) * 2014-03-12 2014-07-02 郑州轻工业学院 基于数据挖掘技术的带电检测数据处理方法
CN104392591A (zh) * 2014-11-13 2015-03-04 国家电网公司 输电线杆故障监测专家系统
CN106096748A (zh) * 2016-04-28 2016-11-09 武汉宝钢华中贸易有限公司 基于聚类分析和决策树算法的装车工时预测模型
CN106202886A (zh) * 2016-06-29 2016-12-07 中国铁路总公司 基于模糊粗糙集与决策树的轨道电路红光带故障定位方法
US20200200648A1 (en) * 2018-02-12 2020-06-25 Dalian University Of Technology Method for Fault Diagnosis of an Aero-engine Rolling Bearing Based on Random Forest of Power Spectrum Entropy
CN108548988A (zh) * 2018-03-27 2018-09-18 南瑞集团有限公司 基于互信息改进决策树的线路故障预测方法
CN109626161A (zh) * 2018-12-19 2019-04-16 暨南大学 一种电梯故障诊断方法
CN111126672A (zh) * 2019-12-02 2020-05-08 国网浙江省电力有限公司电力科学研究院 一种基于分类决策树的高压架空输电线路台风灾害预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DEVASHSISH THAKUR 等: "Re optimization of ID3 and C4.5 decision tree", 2010 INTERNATIONAL CONFERENCE ON COMPUTER AND COMMUNICATION TECHNOLOGY (ICCCT), pages 448 - 450 *
安葳鹏 等: "决策树C4.5算法的改进与分析", 计算机工程与应用, no. 2019, pages 171 *
王继强: "C4.5算法在信号设备故障诊断中的应用研究", 电子世界, no. 2012, pages 107 - 109 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910667A (zh) * 2023-09-08 2023-10-20 中国铁塔股份有限公司吉林省分公司 基于决策算法的通信铁塔异常状态分析方法及系统
CN116910667B (zh) * 2023-09-08 2023-11-21 中国铁塔股份有限公司吉林省分公司 基于决策算法的通信铁塔异常状态分析方法及系统

Similar Documents

Publication Publication Date Title
CN105973594B (zh) 一种基于连续深度置信网络的滚动轴承故障预测方法
CN112784881B (zh) 网络异常流量检测方法、模型及系统
CN107846392B (zh) 一种基于改进协同训练-adbn的入侵检测算法
US7362892B2 (en) Self-optimizing classifier
CN112859822B (zh) 基于人工智能的设备健康分析及故障诊断的方法及系统
CN111666169B (zh) 一种基于改进的孤立森林算法和高斯分布的联合数据异常检测方法
CN109614488B (zh) 基于文本分类和图像识别的配网带电作业条件判别方法
CN112633317A (zh) 基于注意力机制的cnn-lstm风机故障预测方法及系统
Arbin et al. Comparative analysis between k-means and k-medoids for statistical clustering
CN109781411A (zh) 一种结合改进稀疏滤波器与kelm的轴承故障诊断方法
CN111680875B (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN112756759B (zh) 点焊机器人工作站故障判定方法
CN111126820A (zh) 反窃电方法及系统
CN116186594B (zh) 基于决策网络结合大数据实现环境变化趋势智能检测方法
CN110717090A (zh) 一种旅游景点网络口碑评价方法、系统及电子设备
CN115730241A (zh) 一种水轮机空化噪声识别模型的构建方法
CN113468796A (zh) 一种基于改进随机森林算法的电压缺失数据辨识方法
CN112861973A (zh) 一种基于决策树的通信铁塔故障诊断方法
CN113222145A (zh) 一种基于modwt-emd的时间序列混合预测方法
CN111708865A (zh) 一种基于改进XGBoost算法的技术预见及专利预警分析方法
CN113722230B (zh) 针对模糊测试工具漏洞挖掘能力的集成化评估方法及装置
CN116108963A (zh) 一种基于集成学习模块的电力碳排放预测方法及设备
CN114723998A (zh) 基于大边界贝叶斯原型学习的小样本图像分类方法及装置
CN113837266A (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN114519787B (zh) 智能字迹评价系统的深度特征可视化的解释方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination