CN107679292B - 一种基于数据挖掘的输电线路电磁环境参数预测方法 - Google Patents
一种基于数据挖掘的输电线路电磁环境参数预测方法 Download PDFInfo
- Publication number
- CN107679292B CN107679292B CN201710831587.4A CN201710831587A CN107679292B CN 107679292 B CN107679292 B CN 107679292B CN 201710831587 A CN201710831587 A CN 201710831587A CN 107679292 B CN107679292 B CN 107679292B
- Authority
- CN
- China
- Prior art keywords
- parameters
- electromagnetic environment
- electric field
- nfs
- power transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/16—Cables, cable trees or wire harnesses
Abstract
一种基于数据挖掘的输电线路电磁环境参数预测方法,包括以下步骤:(1)收集数据;(2)划分数据;(3)分析电磁环境参数之间的关系;(4)分析空间电场以及离子流参数之间的关系;(5)分析影响电磁环境的主因素;(6)对电磁环境参数和空间电场参数进行预测。通过运用本发明的方法,可在线路设计阶段对导线线型、导线分裂间距、极间距等线路参数进一步优化,实现更为环境友好的电网发展方式。同时尽可能减小输电走廊,降低线路征地及建设成本,具有重大工程实用价值。
Description
技术领域
本发明属于电力系统电磁环境防护技术领域,特别涉及一种基于数据挖掘的输电线路电磁环境参数预测方法。
背景技术
电磁环境是输电线路设计的主要考虑因素,输电线路的电磁环境的根源是线路的电晕放电。电晕放电一方面会造成电能损耗,增加输电成本;另一方面影响导线周边电磁环境,进一步干扰人们的正常生活。随着经济的不断发展和民众环境意识的增强,电磁环境问题愈加引人关注,输电线路其电磁环境问题已成为其系统设计和运行的主要制约因素。输电线路的电磁环境参数主要包括有可听噪声、无线电干扰、地面合成场强、地面离子流密度和电晕损耗。若能在线路设计阶段合理预测电磁环境参数,则可对导线线型、导线分裂间距、极间距等线路参数进一步优化,实现更为环境友好的电网发展方式;或在保证合理的电磁环境水平下,尽可能减小输电走廊,降低线路征地及建设成本。这对在建及规划中的输变电工程具有重大工程实用价值。
电磁环境参数影响因素众多,且具有明显的随机特性。当前电磁环境的模型有两个重要的不足:首先,大多数模型都是通过多元线性回归训练的,线性模型不能描述复杂的非线性模型。其次,这些模型都是针对海平面的电磁环境进行设计的,于是包含了一些潜在设定,比如标准大气压等等。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种基于数据挖掘的输电线路电磁环境参数预测方法,本方法不仅可以考虑非线性关系,还能将不同的环境参数作为模型的参量进行考虑,如海拔等,本模型能更加全面地描述电磁辐射,不仅提高其预测精度,还提高该模型的工程实用价值。为此,本发明采用的技术方案为:
一种基于数据挖掘的输电线路电磁环境参数预测方法,包括以下步骤:
S1:收集数据:所述数据包括线路基本参数、电磁环境参数和空间电场参数以及离子流参数,所述线路基本参数包括分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔,所述电磁环境参数包括电晕放电CL、无线电干扰RI和可听噪声AN,空间电场以及离子流参数包括最大标称场强NFS、最大复合电场强度MCEFI和最大离子流密度MICD;
S2:划分数据:将步骤S1收集到的数据划分为自变量和因变量两部分,其中自变量包括所述的线路基本参数,因变量包括电磁环境参数、空间电场参数和离子流参数,系统模型为:
Y=f(X),
在上式中,X为自变量,Y为因变量;
S3:分析所述电磁环境参数之间的关系,验证RI分别与AN、CL线性相关;
S4:分析所述空间电场以及离子流参数之间的关系,验证NFS分别与MCEFI、MICD线性相关;
S5:分析影响电磁环境的主因素;
S6:对所述电磁环境参数和空间电场参数进行预测。
优选的,所述步骤S3具体为:
S31:假设所述无线电干扰RI分别与可听噪声AN、电晕放电CL不存在线性相关;
S32:假设
S33:对t进行统计,并将统计阈值设定为95%,得出步骤S31的假设均不成立;
S34:得出结论,即RI分别与AN、CL线性相关。
优选的,所述步骤S4具体为:
S41:假设所述最大标称场强NFS分别与最大复合电场强度MCEFI、最大离子流密度MICD不存在线性相关;
S42:假设
S43:对t进行统计,并将统计阈值设定为95%,得出步骤S41的假设均不成立;
S44:得出结论,即NFS分别与MCEFI、MICD线性相关。
优选的,所述步骤S5具体为:
S51:定义信息熵的公式为:
其中H为信息熵,pi是系统成为状态i的概率;
S52:定义信息增益IG的公式为:
IG(T,a)=H(T)-H(T|a),
其中T表示一系列的训练样本,而a代表样本的其中一个参数;
S53:以RI和NFS为因变量,根据步骤S52中的式子分别计算RI和NFS所对应的信息增益,其中T表示一系列的训练样本,每一个训练样本代表一组线路基本参数,a代表训练样本的其中一个参数,具体为分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔中的一个;
S54:统计步骤S53的计算结果,归纳总结出影响无线电干扰RI和最大标称场强NFS的主要因素和次要因素。
优选的,所述步骤S6中的预测采用决策树回归方法。
优选的,所述决策树回归方法具体为:
将整个样本数据分为训练集和测试集两组,训练组占总样本的90%,测试组占总样本的10%,将训练集对决策树模型进行训练后,再利用测试集对决策树模型进行计算,得到均方误差。
优选的,所述决策树模型中每个方框中的百分比表示样本的比例,剩下的数值是相应的预测结果,在每个分割点上,左侧表示条件满足的情况,右侧则表示条件不满足的情况。
本发明的益处在于:
(1)运用本发明的预测方法,可在线路设计阶段对导线线型、导线分裂间距、极间距等线路参数进一步优化,实现更为环境友好的电网发展方式;
(2)运用本发明的预测方法,可在保证合理的电磁环境水平下,尽可能减小输电走廊,降低线路征地及建设成本,具有重大工程实用价值;
(3)本发明的预测方法,不仅可以考虑非线性关系,还能将不同的环境参数作为模型的参量进行考虑,更加全面地描述电磁辐射。从而提高其预测精度以及该模型的工程实用价值。
附图说明
图1为本发明的流程图。
图2为电磁环境参数之间的关系图。
图3为空间电场参数和离子流参数之间的关系图。
图4为无线电干扰RI的决策树模型图。
图5为最大标称场强NFS的决策树模型图。
具体实施方式
一种基于数据挖掘的输电线路电磁环境参数预测方法,如图1所示,包括以下步骤:
S1:收集数据,所述数据包括线路基本参数、电磁环境参数和空间电场参数以及离子流参数。本实施例中,主要收集±800kV直流输电线路的基本参数信息及其所对应的电磁环境参数,空间电场参数以及离子流参数。具体的参数和单位如下所示:
线路基本参数:
分裂导线数、子导线直径(cm)、分裂导线间距(cm)、极间距(m)、导线平均高度(m)、海拔(m);
电磁环境参数:
电晕放电(CL,kW/km)、无线电干扰(RI,dB)、可听噪声(AN,dB);
空间电场以及离子流参数:
最大标称场强(NFS,kV/cm)、最大复合电场强度(MCEFI,kV/cm)、最大离子流密度(MICD,nA/m2)。
S2:划分数据:将步骤S1收集到的数据划分为自变量和因变量两部分,其中自变量包括所述的线路基本参数,因变量包括电磁环境参数、空间电场参数和离子流参数,系统模型为
Y=f(X),
在上式中,X为自变量,Y为因变量;
S3:分析所述电磁环境参数之间的关系,验证RI分别与AN、CL线性相关;
由上述分析可知,尽管有电晕放电CL、无线电干扰RI、可听噪声AN、最大标称场强NFS、最大复合电场强度MCEFI和最大离子流密度MICD等6个不同的因变量需要分析,但它们当中有一些是高度线性相关的。为了分析其线性相关特性,本实施例首先绘制了不同因变量之间的关系,如图2和图3所示。
图2为电磁环境参数之间的关系图。由图2可知,CL,RI和AN都有着明显的线性相关性。为了更加严密地证明这一点,本实施例使用t检测来判断这三个参量间的线性相关。即首先提出两个空假设,即RI和AN没有线性相关性以及RI和CL也没有线性相关性。通过t统计的假设,它的表达式可写为:
最后t统计后就得到线性相关检验假设的结果,如表1所示:
表1
因变量 | 自变量 | p值 |
RI | CL | <2.2e<sup>-2</sup> |
RI | AN | <2.2e<sup>-2</sup> |
NFS | MCEFI | 1.5e<sup>-4</sup> |
MCEFI | MICD | <2.2e<sup>-2</sup> |
由表1可知,通过设定统计阈值为95%,之前提出的两个空假设都会被否定。因此,可以判断RI与AN,RI与CL都存在线性相关。
图3为空间电场参数和离子流参数之间的关系图。由图3可知,MICD和MCEFI是线性相关的,而MCEFI和NFS之间的关系不明显。同上所述,可以采用了t检测对它们之间的关系进行判断。即假设NFS与MCEFI不存在线性相关以及NFS与MICD也不存在线性相关。t检验的结果可以从表1中得到。因此,两个假设都被否定,即NFS与MCEFI、MICD都存在线性相关。
由于显著线性相关的参量,它们理论上有着相近的模型。因此,本实施例只分析了显著线性相关参量的一部分,即只采用RI和NFS进行分析。
S5:分析影响电磁环境的主因素;
本发明采用信息增益IG作为不同因变量主因素分析的度量方法。信息增益IG是信息从一个状态到另一个状态后信息熵的变化。而信息熵H则是表示系统紊乱程度的度量,其定义为:
其中pi是系统成为状态i的概率。比如,一个拥有两个相等概率状态的系统,其信息熵为1,这是两态系统信息熵的最大值,也就是说,这种系统处于完全的无规律状态。
此时,信息增益IG则可以表达为:
IG(T,a)=H(T)-H(T|a) (1)
其中T表示一系列的训练样本,而a代表训练样本的其中一个参数。更大的信息增益代表因素a可以为系统的判断带来更大的信息量,即知道a参量之后可以大大减小系统的无序程度。
根据上述对信息增益的定义,以RI和NFS为因变量,以线路基本参数值作为训练样本,而以分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔中的任一个作为这个训练样本的其中一个参数,代入式(1)进行计算统计,其结果如表2所示。
表2
由表2可知,分裂导线数量是影响无线电干扰RI和最大标称场强NFS的主要因素,而分裂导线间距则是影响无线电干扰RI的次要因素,导线平均高度是影响最大标称场强NFS的次要因素。
S6:采用决策树回归方法对电磁环境参数和空间电场参数进行预测。
由上述分析可知,RI与AN、CL都存在线性相关,而NFS与MCEFI、MICD也存在线性相关。由于线性相关的参量,它们理论上有着相近的模型。因此,本实施例只采用RI和NFS进行分析。
构建决策树模型时,决策树模型的每个方框中的百分比表示样本的比例,剩下的数值是相应的预测结果,在每个分割点上,左侧表示条件满足的情况,右侧则表示条件不满足的情况。
将整个样本数据分为训练集和测试集两组,训练组占总样本的90%,测试组占总样本的10%,将训练集对决策树模型进行训练后,再利用测试集对决策树模型进行计算,得到均方误差(mse),均方误差表示了模型的性能。
无线电干扰RI的决策树模型如图4所示。正如信息增益所表明的,分裂导线数量是影响它的主要因素,即分裂导线数量的增加产生更小的无线电干扰。同时,在分裂导线数量相当的范围之内,较小的海拔将导致较少的无线电干扰。通过测试集在模型上的计算可以得出,该模型实现了2.44的均方误差。
最大标称场强NFS的决策树模型如图5所示。由图5可知,其导体的平均高度越高,分裂导线数量越多,显示的NFS强度越低,而较少的分裂导线数量意味着更大的场强。与无线电干扰决策树模型的结构相似,在一定条件下,子导线直径越小,NFS强度越高。最大标称场强的决策树模型在测试数据上实现了5.46的均方误差。
Claims (6)
1.一种基于数据挖掘的输电线路电磁环境参数预测方法,其特征在于,包括以下步骤:
S1:收集数据:所述数据包括线路基本参数、电磁环境参数和空间电场参数以及离子流参数,所述线路基本参数包括分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔,所述电磁环境参数包括电晕放电CL、无线电干扰RI和可听噪声AN,空间电场以及离子流参数包括最大标称场强NFS、最大复合电场强度MCEFI和最大离子流密度MICD;
S2:划分数据:将步骤S1收集到的数据划分为自变量和因变量两部分,其中自变量包括所述的线路基本参数,因变量包括电磁环境参数、空间电场参数和离子流参数,系统模型为:
Y=f(X),
在上式中,X为自变量,Y为因变量;
S3:采用t统计的方法来分析所述电磁环境参数之间的关系,验证RI分别与AN、CL线性相关;
S4:采用t统计的方法来分析所述空间电场以及离子流参数之间的关系,验证NFS分别与MCEFI、MICD线性相关;
S5:采用信息增益方法来分析影响电磁环境的主因素;
S6:根据S3、S4及S5的分析结果,对所述电磁环境参数和空间电场参数进行预测;
所述步骤S6中的预测采用决策树回归方法。
4.根据权利要求1所述的一种基于数据挖掘的输电线路电磁环境参数预测方法,其特征在于,所述步骤S5具体为:
S51:定义信息熵的公式为:
其中H为信息熵,pi是系统成为状态i的概率;
S52:定义信息增益IG的公式为:
IG(T,a)=H(T)-H(T|a),
其中T表示一系列的训练样本,而a代表样本的其中一个参数;
S53:以RI和NFS为因变量,根据步骤S52中的式子分别计算RI和NFS所对应的信息增益,其中T表示一系列的训练样本,每一个训练样本代表一组线路基本参数,a代表训练样本的其中一个参数,具体为分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔中的一个;
S54:统计步骤S53的计算结果,归纳总结出影响无线电干扰RI和最大标称场强NFS的主要因素和次要因素。
5.根据权利要求1所述的一种基于数据挖掘的输电线路电磁环境参数预测方法,其特征在于,所述决策树回归方法具体为:
将整个样本数据分为训练集和测试集两组,训练组占总样本的90%,测试组占总样本的10%,将训练集对决策树模型进行训练后,再利用测试集对决策树模型进行计算,得到均方误差。
6.根据权利要求5所述的一种基于数据挖掘的输电线路电磁环境参数预测方法,其特征在于,所述决策树模型中每个方框中的百分比表示样本的比例,剩下的数值是相应的预测结果,在每个分割点上,左侧表示条件满足的情况,右侧则表示条件不满足的情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710831587.4A CN107679292B (zh) | 2017-09-15 | 2017-09-15 | 一种基于数据挖掘的输电线路电磁环境参数预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710831587.4A CN107679292B (zh) | 2017-09-15 | 2017-09-15 | 一种基于数据挖掘的输电线路电磁环境参数预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107679292A CN107679292A (zh) | 2018-02-09 |
CN107679292B true CN107679292B (zh) | 2021-01-05 |
Family
ID=61136267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710831587.4A Active CN107679292B (zh) | 2017-09-15 | 2017-09-15 | 一种基于数据挖掘的输电线路电磁环境参数预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107679292B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960639B (zh) * | 2018-07-09 | 2021-09-03 | 武汉瑞莱保能源技术有限公司 | 一种基于数据挖掘的输电线路电磁环境参数预测方法 |
CN110472801B (zh) * | 2019-08-26 | 2023-04-07 | 南方电网科学研究院有限责任公司 | 直流输电线路电磁环境评估方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301698A (ja) * | 2005-04-15 | 2006-11-02 | Yoshinao Ookawa | 建設物構築方法及び建設物構築支援装置 |
CN102508964A (zh) * | 2011-11-03 | 2012-06-20 | 国网电力科学研究院 | 直流输电线路地面合成电场计算方法 |
CN105184421A (zh) * | 2015-09-28 | 2015-12-23 | 南方电网科学研究院有限责任公司 | 基于数据分段及模型校准的电磁环境参数预测方法 |
CN105740502A (zh) * | 2016-01-21 | 2016-07-06 | 西安电子科技大学 | 一种载荷变形下的圆柱共形阵列天线电性能预测方法 |
CN106096748A (zh) * | 2016-04-28 | 2016-11-09 | 武汉宝钢华中贸易有限公司 | 基于聚类分析和决策树算法的装车工时预测模型 |
CN106844968A (zh) * | 2017-01-23 | 2017-06-13 | 国网山东省电力公司电力科学研究院 | 基于环境敏感目标自动识别的输变电工程电磁环境预测方法 |
-
2017
- 2017-09-15 CN CN201710831587.4A patent/CN107679292B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301698A (ja) * | 2005-04-15 | 2006-11-02 | Yoshinao Ookawa | 建設物構築方法及び建設物構築支援装置 |
CN102508964A (zh) * | 2011-11-03 | 2012-06-20 | 国网电力科学研究院 | 直流输电线路地面合成电场计算方法 |
CN105184421A (zh) * | 2015-09-28 | 2015-12-23 | 南方电网科学研究院有限责任公司 | 基于数据分段及模型校准的电磁环境参数预测方法 |
CN105740502A (zh) * | 2016-01-21 | 2016-07-06 | 西安电子科技大学 | 一种载荷变形下的圆柱共形阵列天线电性能预测方法 |
CN106096748A (zh) * | 2016-04-28 | 2016-11-09 | 武汉宝钢华中贸易有限公司 | 基于聚类分析和决策树算法的装车工时预测模型 |
CN106844968A (zh) * | 2017-01-23 | 2017-06-13 | 国网山东省电力公司电力科学研究院 | 基于环境敏感目标自动识别的输变电工程电磁环境预测方法 |
Non-Patent Citations (1)
Title |
---|
多物理因素影响下的高海拔特高压直流输电线路电磁环境预测;刘磊 等;《南方电网技术》;20160930;第43-48页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107679292A (zh) | 2018-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106908674B (zh) | 一种基于多状态量预测的变压器状态评估方法 | |
CN109873501B (zh) | 一种低压配电网拓扑自动识别方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN109103874B (zh) | 考虑负荷特性与分布式电源接入的配电网可靠性评估方法 | |
CN109507535B (zh) | 变电站接地网运行阶段及运行寿命预测方法及装置 | |
CN107918830B (zh) | 一种基于大数据技术的配电网运行状态评估方法 | |
CN106779171B (zh) | 一种输电线路故障强送电智能决策方法 | |
CN103323755A (zh) | Gis特高频局部放电信号识别方法及系统 | |
CN110705873A (zh) | 一种新型的配电网运行状态画像分析方法 | |
CN107679292B (zh) | 一种基于数据挖掘的输电线路电磁环境参数预测方法 | |
CN105205590A (zh) | 一种变压器健康状态分析的方法和系统 | |
CN108614192B (zh) | 一种配电网雷电监测装置布点决策方法 | |
CN108596514A (zh) | 基于模糊遗传算法的电力设备混合威布尔可靠性建模方法 | |
CN107784392A (zh) | 一种基于机器学习的输电线路的缺陷预测方法及装置 | |
Li et al. | Taxonomic description for western Australian distribution medium‐voltage and low‐voltage feeders | |
Wang et al. | Decision-making model based on conditional risks and conditional costs in power system probabilistic planning | |
CN111178690A (zh) | 基于风控评分卡模型的用电客户窃电风险评估方法 | |
CN105277852A (zh) | 配电网线路工况分类识别方法 | |
CN116415724A (zh) | 一种光伏电站运维检修时间的预测方法及装置 | |
CN114298188A (zh) | 一种电力设备故障智能分析方法及系统 | |
CN113298296A (zh) | 一种自下而上的输电变电站日前负荷概率预测方法 | |
CN108761175B (zh) | 一种地电位升检测系统及输电线路雷击情况确定方法 | |
CN112101653A (zh) | 一种新型电气化铁路牵引负荷预测方法 | |
Hu et al. | Guaranteed load prediction for distribution network considering extreme disasters | |
CN110445128B (zh) | 基于灵敏度的地区电网新能源消纳能力实时评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |