CN110188090B - 一种基于数据挖掘的配网拓扑数据质量评估方法及装置 - Google Patents
一种基于数据挖掘的配网拓扑数据质量评估方法及装置 Download PDFInfo
- Publication number
- CN110188090B CN110188090B CN201910522828.6A CN201910522828A CN110188090B CN 110188090 B CN110188090 B CN 110188090B CN 201910522828 A CN201910522828 A CN 201910522828A CN 110188090 B CN110188090 B CN 110188090B
- Authority
- CN
- China
- Prior art keywords
- voltage
- phase
- distribution
- correlation coefficient
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007418 data mining Methods 0.000 title claims abstract description 25
- 238000001303 quality assessment method Methods 0.000 title claims description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000009466 transformation Effects 0.000 claims abstract description 35
- 238000004364 calculation method Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000005315 distribution function Methods 0.000 claims abstract description 14
- 230000009467 reduction Effects 0.000 claims abstract description 14
- 238000011156 evaluation Methods 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims description 49
- 238000010606 normalization Methods 0.000 claims description 14
- 230000010354 integration Effects 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000013441 quality evaluation Methods 0.000 abstract description 9
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000000547 structure data Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R19/00—Arrangements for measuring currents or voltages or for indicating presence or sign thereof
- G01R19/0084—Arrangements for measuring currents or voltages or for indicating presence or sign thereof measuring voltage only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E40/00—Technologies for an efficient electrical power generation, transmission or distribution
- Y02E40/50—Arrangements for eliminating or reducing asymmetry in polyphase networks
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于数据挖掘的配网拓扑数据质量评估方法及装置,所述方法包括:采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理;按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果;本发明的优点在于:利用电压曲线之间的相似性来判断配网拓扑的数据质量,提供一种较为可靠的评估配网数据质量的方法。
Description
技术领域
本发明涉及电网数据质量评估领域,更具体涉及一种基于数据挖掘的配网拓扑数据质量评估方法及装置。
背景技术
为更好的服务用电客户的用电需求,新配电网线路数量不断增长,随之配电网的拓扑数据质量问题也渐进显现。配电网拓扑结构数据是一项基础内在关联数据,营配调贯通、配电网线损计算、配电网故障抢修等业务均依托该基础数据,如何准确把握配电网系统拓扑结构数据的实时动态,打通线上数据与线下数据的一致、静态数据与动态数据的联动、数据治理与业务管理的衔接、数据挖掘与作用发挥的匹配是当今难题,解决该难题首先就要对配网拓扑的数据质量进行有效合理的判断,如果获取的配电网系统拓扑结构数据是有很多干扰的数据,偏离期望值的数据,配变的高压侧中性点发生偏移的数据等,都将对配网拓扑的数据质量的判断有影响。
因此,如何对配电网数据质量进行准确识别是亟待解决的技术问题。
发明内容
本发明所要解决的技术问题在于现有技术如何对配电网数据质量进行准确识别是亟待解决的技术问题。
本发明是通过以下技术方案解决上述技术问题的:一种基于数据挖掘的配网拓扑数据质量评估方法,所述方法包括:
步骤一:采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;
步骤二:采用电压归算的方法对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理,获取三相负荷平衡时配变出口三相电压;
步骤三:完成台区电压曲线噪声处理和配变出口电压归算的处理后,按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;
步骤四:对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
优选的,所述步骤一包括:采用滑窗算法选取待计算的电压采样点数量为N,随机选择k个时间点并将待计算的电压采样点按时间排序,得到时间序列T={t0,t1,...,tk-1},其中,k-1表示第k-1个时间点,在时间序列T上计算任意两个台区之间的相关系数,得到N*N矩阵Pn,n,随机采样N*N矩阵Pn,n中的元素M次,对于M次采样的元素的集合求其标准差,所有标准差小于预设的标准差限值的对应的元素的电压采样点所在的采样时间点记录下来形成一个区段,该区段为电压波形稳定的临界点所在区段,在该区段内对所有标准差求均值,所有标准差与均值比较,超过均值一个预设的范围的标准差对应的电压采样点的电压数据剔除,对台区电压曲线噪声处理。
优选的,所述步骤二包括:
根据公式∠BAN'+∠CAN'=60°,获得AB=AC;
由于AN、BN、CN以及AB均相等,所以根据AB的值获取AN的值、BN的值以及CN的值;
其中,A为点,代表台区电压三相中的A相;B为点,代表台区电压三相中的B相;C为点,代表台区电压三相中的C相;AN'为线段,表示三相负荷不平衡时配变出口三相电压中A相的大小;BN'为线段,表示三相负荷不平衡时配变出口三相电压中B相的大小;CN'为线段,表示三相负荷不平衡时配变出口三相电压中C相的大小;AB为线段,表示配变出口A相与B相之间线电压大小;AC为线段,表示配变出口A相与C相之间线电压大小;BC为线段,表示配变出口C相与B相之间线电压大小;cos()为余弦函数;arccos()为反余弦函数;∠BAN'表示AB与AN'的夹角,∠CAN'表示AC与AN'的夹角,AN为线段,表示三相负荷平衡时配变出口A相电压的大小,BN为线段,表示三相负荷平衡时配变出口B相电压的大小,CN为线段,表示三相负荷平衡时配变出口C相电压的大小。
优选的,所述步骤三包括:
其中X代表某线路下任意两个台区之一的台区的某点的电压值,其中Y代表某线路下任意两个台区另一个的台区的某点的电压值,N代表电压采样点数量,K代表第K个电压采样点,P代表X和Y之间的相关系数,∑为求和符号;
将每个相关系数作为矩阵元素,生成相关系数矩阵[P]。
优选的,所述步骤四包括:选择相关系数矩阵的下三角矩阵为该线路下任意两个台区之间的相关系数,对所有相关系数求概率密布分布,获得概率密度分布函数f(x),其中x表示相关系数值,利用公式对f(x)积分,获取a的值,其中a为积分下限,q为台区占比。
优选的,取a=a0,积分结果表示至多有占比q的台区,它们之间相关系数都大于等于a0。
优选的,所述a的取值范围为-1~1。
本发明还提供一种基于数据挖掘的配网拓扑数据质量评估装置,所述装置包括:
噪声处理模块,所述噪声处理模块用于采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;
三相电压归一模块,所述三相电压归一模块用于采用电压归算的方法对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理,获取三相负荷平衡时配变出口三相电压;
第一获取模块,所述第一获取模块用于完成台区电压曲线噪声处理和配变出口电压归算的处理后,按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;
第二获取模块,所述第二获取模块用于对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
所述噪声处理模块包括:采用滑窗算法选取待计算的电压采样点数量为N,随机选择k个时间点并将待计算的电压采样点按时间排序,得到时间序列T={t0,t1,...,tk-1},其中,k-1表示第k-1个时间点,在时间序列T上计算任意两个台区之间的相关系数,得到N*N矩阵Pn,n,随机采样N*N矩阵Pn,n中的元素M次,对于M次采样的元素的集合求其标准差,所有标准差小于预设的标准差限值的对应的元素的电压采样点所在的采样时间点记录下来形成一个区段,该区段为电压波形稳定的临界点所在区段,在该区段内对所有标准差求均值,所有标准差与均值比较,超过均值一个预设的范围的标准差对应的电压采样点的电压数据剔除,对台区电压曲线噪声处理。
所述三相电压归一模块包括:
根据公式∠BAN'+∠CAN'=60°,获得AB=AC;
由于AN、BN、CN以及AB均相等,所以根据AB的值获取AN的值、BN的值以及CN的值;
其中,A为点,代表台区电压三相中的A相;B为点,代表台区电压三相中的B相;C为点,代表台区电压三相中的C相;AN'为线段,表示三相负荷不平衡时配变出口三相电压中A相的大小;BN'为线段,表示三相负荷不平衡时配变出口三相电压中B相的大小;CN'为线段,表示三相负荷不平衡时配变出口三相电压中C相的大小;AB为线段,表示配变出口A相与B相之间线电压大小;AC为线段,表示配变出口A相与C相之间线电压大小;BC为线段,表示配变出口C相与B相之间线电压大小;cos()为余弦函数;arccos()为反余弦函数;∠BAN'表示AB与AN'的夹角,∠CAN'表示AC与AN'的夹角,AN为线段,表示三相负荷平衡时配变出口A相电压的大小,BN为线段,表示三相负荷平衡时配变出口B相电压的大小,CN为线段,表示三相负荷平衡时配变出口C相电压的大小。
优选的,所述第一获取模块包括:
其中X代表某线路下任意两个台区之一的台区的某点的电压值,其中Y代表某线路下任意两个台区另一个的台区的某点的电压值,N代表电压采样点数量,K代表第K个电压采样点,P代表X和Y之间的相关系数,∑为求和符号;
将每个相关系数作为矩阵元素,生成相关系数矩阵[P]。
优选的,所述第二获取模块包括:选择相关系数矩阵的下三角矩阵为该线路下任意两个台区之间的相关系数,对所有相关系数求概率密布分布,获得概率密度分布函数f(x),其中x表示相关系数值,利用公式对f(x)积分,获取a的值,其中a为积分下限,q为台区占比。
优选的,取a=a0,积分结果表示至多有占比q的台区,它们之间相关系数都大于等于a0。
优选的,所述a的取值范围为-1~1。
本发明相比现有技术具有以下优点:本发明设计了一种对配电网数据质量进行有效合理判断的方法,采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理,解决偏离期望值的数据对数据分析造成的错误识别,台区三相负荷配变出口电压归算,解决配变的高压侧中性点发生偏移对电压波形的干扰,经过对电压曲线噪声处理和配变出口电压归算以后再进行电压曲线相关性系数计算,以判断电压曲线的相似程度,最后对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
附图说明
图1为本发明实施例提供的一种基于数据挖掘的配网拓扑数据质量评估方法的流程图;
图2为本发明实施例提供的一种基于数据挖掘的配网拓扑数据质量评估方法中基于滑窗算法的台区电压标准差分布情况图;
图3为本发明实施例提供的一种基于数据挖掘的配网拓扑数据质量评估方法中三相归一计算的原理图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,为本发明实施例提供的一种基于数据挖掘的配网拓扑数据质量评估方法的流程图,所述方法包括:
步骤S1:采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;
本发明的步骤S1对对台区电压曲线噪声处理,主要是在用户用电信息采集系统中96点电压会出现噪声数据,这些数据可能是未采集、采集异常、用电负荷造成的过电压、低电压等情况等,这些都会影响到台区电压相关性系数计算;同时在计算皮尔逊系数的电压数据的时候,电压点数的多少、电压波形的波动也都直接影响到计算结果的准确性。为解决电压波形数量的变动对台区校验造成的影响,本发明采用了滑窗算法和标准差计算的方法计算出电压波形稳定的临界点所在的区段。以下详细介绍计算过程。
采用滑窗算法选取待计算的电压采样点数量为N,随机选择k个时间点并将待计算的电压采样点按时间排序,得到时间序列T={t0,t1,...,tk-1},其中,k-1表示第k-1个时间点,在时间序列T上计算任意两个台区之间的相关系数,得到N*N矩阵Pn,n,随机采样N*N矩阵Pn,n中的元素M次,对于M次采样的元素的集合求其标准差,所有标准差小于预设的标准差限值的对应的元素的电压采样点所在的采样时间点记录下来形成一个区段,该区段为电压波形稳定的临界点所在区段,在该区段内对所有标准差求均值,所有标准差与均值比较,超过均值一个预设的范围的标准差对应的电压采样点的电压数据剔除,对台区电压曲线噪声处理。如图2所示,本发明实施例提供的一种基于数据挖掘的配网拓扑数据质量评估方法中基于滑窗算法的台区电压标准差分布情况图,其中虚线框中曲线相对平缓,该虚线框对应的区段为电压波形稳定的临界点所在区段,图中还可以看出,电压采样点超过500时,标准差接近0,其中一天的数据为96,5天的数据为480,那么选择时间跨度为5天以上的数据量进行计算,标准差小,偏离期望值的数据对数据分析造成的影响将忽略不计。
步骤S2:采用电压归算的方法对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理,获取三相负荷平衡时配变出口三相电压;
由于部分台区出现三相不平衡的现象会影响配网线台关系校验的结果,影响配网数据质量的评估,为了计算结果的准确性以及数据质量评估的准确性和可靠性,需要对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理。为了便于计算和理解,如图3所示,本发明实施例提供的一种基于数据挖掘的配网拓扑数据质量评估方法中三相归一计算的原理图,图中三角形ABC为等边三角形,具体处理过程为:
根据公式∠BAN'+∠CAN'=60°,获得AB=AC;
由于AN、BN、CN以及AB均相等,所以根据AB的值获取AN的值、BN的值以及CN的值;
其中,A为点,代表台区电压三相中的A相;B为点,代表台区电压三相中的B相;C为点,代表台区电压三相中的C相;AN'为线段,表示三相负荷不平衡时配变出口三相电压中A相的大小;BN'为线段,表示三相负荷不平衡时配变出口三相电压中B相的大小;CN'为线段,表示三相负荷不平衡时配变出口三相电压中C相的大小;AB为线段,表示配变出口A相与B相之间线电压大小;AC为线段,表示配变出口A相与C相之间线电压大小;BC为线段,表示配变出口C相与B相之间线电压大小;cos()为余弦函数;arccos()为反余弦函数;∠BAN'表示AB与AN'的夹角,∠CAN'表示AC与AN'的夹角,AN为线段,表示三相负荷平衡时配变出口A相电压的大小,BN为线段,表示三相负荷平衡时配变出口B相电压的大小,CN为线段,表示三相负荷平衡时配变出口C相电压的大小。
步骤S3:完成台区电压曲线噪声处理和配变出口电压归算的处理后,按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;
完成台区三相负荷配变出口电压归算后,需要按供电单位和线路计算同一线路下任意两个台区之间相关性系数。台区电压曲线之间相关性系数的计算方法主要是将台区按线路进行分类,以线路为基本单位,计算单条线路下任意2个台区之间的关联性,为了衡量电压曲线之间相似程度的大小,采用皮尔逊相关系数,计算电压曲线之间的相关系数,根据相关系数的大小判断电压曲线的相似程度。具体计算过程为:
其中X代表某线路下任意两个台区之一的台区的某点的电压值,其中Y代表某线路下任意两个台区另一个的台区的某点的电压值,N代表电压采样点数量,K代表第K个电压采样点,P代表X和Y之间的相关系数,∑为求和符号;
将每个相关系数作为矩阵元素,生成相关系数矩阵[P]。
相关系数定量地刻画了X和Y的相关程度,即相关系数矩阵越大,相关程度越大,其值介于-1与1之间。
步骤S4:对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
0.8<|P|<1.0时表示数据质量极强相关;0.6<|P|<0.8时表示数据质量强相关;0.4<|P|<0.6时表示数据质量中等程度相关;0.2<|P|<0.4时表示数据质量弱相关;0<|P|<0.2时表示数据质量弱相关或不相关。配网拓扑的数据质量分析基于0<|P|<0.2时的数据弱相关或不相关为基准,分析线路下的变压器数据采集质量。已知步骤S3中求得的电压曲线之间的相关性系数组成相关系数矩阵[P],该矩阵是对称方阵,对角元素为1。选择相关系数矩阵的下三角矩阵为该线路下任意两个台区之间的相关系数,对所有相关系数求概率密布分布,获得概率密度分布函数f(x),其中x表示相关系数值,利用公式对f(x)积分,获取a的值,其中a为积分下限,q为台区占比。取a=a0,积分结果表示至多有占比q的台区,它们之间相关系数都大于等于a0。所述a的取值范围为-1~1。
本发明还提供一种基于数据挖掘的配网拓扑数据质量评估装置,所述装置包括:
噪声处理模块,所述噪声处理模块用于采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;
三相电压归一模块,所述三相电压归一模块用于采用电压归算的方法对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理,获取三相负荷平衡时配变出口三相电压;
第一获取模块,所述第一获取模块用于完成台区电压曲线噪声处理和配变出口电压归算的处理后,按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;
第二获取模块,所述第二获取模块用于对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
所述噪声处理模块包括:采用滑窗算法选取待计算的电压采样点数量为N,随机选择k个时间点并将待计算的电压采样点按时间排序,得到时间序列T={t0,t1,...,tk-1},其中,k-1表示第k-1个时间点,在时间序列T上计算任意两个台区之间的相关系数,得到N*N矩阵Pn,n,随机采样N*N矩阵Pn,n中的元素M次,对于M次采样的元素的集合求其标准差,所有标准差小于预设的标准差限值的对应的元素的电压采样点所在的采样时间点记录下来形成一个区段,该区段为电压波形稳定的临界点所在区段,在该区段内对所有标准差求均值,所有标准差与均值比较,超过均值一个预设的范围的标准差对应的电压采样点的电压数据剔除,对台区电压曲线噪声处理。
所述三相电压归一模块包括:
根据公式∠BAN'+∠CAN'=60°,获得AB=AC;
由于AN、BN、CN以及AB均相等,所以根据AB的值获取AN的值、BN的值以及CN的值;
其中,A为点,代表台区电压三相中的A相;B为点,代表台区电压三相中的B相;C为点,代表台区电压三相中的C相;AN'为线段,表示三相负荷不平衡时配变出口三相电压中A相的大小;BN'为线段,表示三相负荷不平衡时配变出口三相电压中B相的大小;CN'为线段,表示三相负荷不平衡时配变出口三相电压中C相的大小;AB为线段,表示配变出口A相与B相之间线电压大小;AC为线段,表示配变出口A相与C相之间线电压大小;BC为线段,表示配变出口C相与B相之间线电压大小;cos()为余弦函数;arccos()为反余弦函数;∠BAN'表示AB与AN'的夹角,∠CAN'表示AC与AN'的夹角,AN为线段,表示三相负荷平衡时配变出口A相电压的大小,BN为线段,表示三相负荷平衡时配变出口B相电压的大小,CN为线段,表示三相负荷平衡时配变出口C相电压的大小。
具体的,所述第一获取模块包括:
其中X代表某线路下任意两个台区之一的台区的某点的电压值,其中Y代表某线路下任意两个台区另一个的台区的某点的电压值,N代表电压采样点数量,K代表第K个电压采样点,P代表X和Y之间的相关系数,∑为求和符号;
将每个相关系数作为矩阵元素,生成相关系数矩阵[P]。
具体的,所述第二获取模块包括:选择相关系数矩阵的下三角矩阵为该线路下任意两个台区之间的相关系数,对所有相关系数求概率密布分布,获得概率密度分布函数f(x),其中x表示相关系数值,利用公式对f(x)积分,获取a的值,其中a为积分下限,q为台区占比。
具体的,取a=a0,积分结果表示至多有占比q的台区,它们之间相关系数都大于等于a0。
具体的,所述a的取值范围为-1~1。
通过以上技术方案,本发明提供的一种基于数据挖掘的配网拓扑数据质量评估方法,能够有效评估配网数据质量。采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理,解决偏离期望值的数据对数据分析造成的错误识别,台区三相负荷配变出口电压归算,解决配变的高压侧中性点发生偏移对电压波形的干扰,经过对电压曲线噪声处理和配变出口电压归算以后再进行电压曲线相关性系数计算,以判断电压曲线的相似程度,最后对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于数据挖掘的配网拓扑数据质量评估方法,其特征在于,所述方法包括:
步骤一:采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;
步骤二:采用电压归算的方法对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理,获取三相负荷平衡时配变出口三相电压;
步骤三:完成台区电压曲线噪声处理和配变出口电压归算的处理后,按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;
步骤四:对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
2.根据权利要求1所述的一种基于数据挖掘的配网拓扑数据质量评估方法,其特征在于,所述步骤一包括:采用滑窗算法选取待计算的电压采样点数量为N,随机选择k个时间点并将待计算的电压采样点按时间排序,得到时间序列T={t0,t1,…,tk-1},其中,k-1表示第k-1个时间点,在时间序列T上计算任意两个台区之间的相关系数,得到N*N矩阵Pn,n,随机采样N*N矩阵Pn,n中的元素M次,对于M次采样的元素的集合求其标准差,所有标准差小于预设的标准差限值的对应的元素的电压采样点所在的采样时间点记录下来形成一个区段,该区段为电压波形稳定的临界点所在区段,在该区段内对所有标准差求均值,所有标准差与均值比较,超过均值一个预设的范围的标准差对应的电压采样点的电压数据剔除,对台区电压曲线噪声处理。
3.根据权利要求1所述的一种基于数据挖掘的配网拓扑数据质量评估方法,其特征在于,所述步骤二包括:
根据公式∠BAN'+∠CAN'=60°,获得AB=AC;
由于AN、BN、CN以及AB均相等,所以根据AB的值获取AN的值、BN的值以及CN的值;
其中,A为点,代表台区电压三相中的A相;B为点,代表台区电压三相中的B相;C为点,代表台区电压三相中的C相;AN'为线段,表示三相负荷不平衡时配变出口三相电压中A相的大小;BN'为线段,表示三相负荷不平衡时配变出口三相电压中B相的大小;CN'为线段,表示三相负荷不平衡时配变出口三相电压中C相的大小;AB为线段,表示配变出口A相与B相之间线电压大小;AC为线段,表示配变出口A相与C相之间线电压大小;BC为线段,表示配变出口C相与B相之间线电压大小;cos()为余弦函数;arccos()为反余弦函数;∠BAN'表示AB与AN'的夹角,∠CAN'表示AC与AN'的夹角,AN为线段,表示三相负荷平衡时配变出口A相电压的大小,BN为线段,表示三相负荷平衡时配变出口B相电压的大小,CN为线段,表示三相负荷平衡时配变出口C相电压的大小。
6.根据权利要求5所述的一种基于数据挖掘的配网拓扑数据质量评估方法,其特征在于,取a=a0,积分结果表示至多有占比q的台区,它们之间相关系数都大于等于a0。
7.根据权利要求5所述的一种基于数据挖掘的配网拓扑数据质量评估方法,其特征在于,所述a的取值范围为-1~1。
8.一种基于数据挖掘的配网拓扑数据质量评估装置,其特征在于,所述装置包括:
噪声处理模块,所述噪声处理模块用于采用滑窗算法和标准差计算的方法获取电压波形稳定的临界点,对台区电压曲线噪声处理;
三相电压归一模块,所述三相电压归一模块用于采用电压归算的方法对出现三相不平衡现象的台区电压数据做配变出口电压归算的处理,获取三相负荷平衡时配变出口三相电压;
第一获取模块,所述第一获取模块用于完成台区电压曲线噪声处理和配变出口电压归算的处理后,按照供电单位和线路利用皮尔逊相关系数计算同一线路下任意两个台区之间的电压曲线的相关系数,获取电压曲线之间的相关系数矩阵;
第二获取模块,所述第二获取模块用于对相关系数矩阵中的相关系数求概率密度分布,获取概率密度分布函数,对该函数积分并分析,获取评估结果。
9.根据权利要求8所述的一种基于数据挖掘的配网拓扑数据质量评估装置,其特征在于,所述噪声处理模块包括:采用滑窗算法选取待计算的电压采样点数量为N,随机选择k个时间点并将待计算的电压采样点按时间排序,得到时间序列T={t0,t1,...,tk-1},其中,k-1表示第k-1个时间点,在时间序列T上计算任意两个台区之间的相关系数,得到N*N矩阵Pn,n,随机采样N*N矩阵Pn,n中的元素M次,对于M次采样的元素的集合求其标准差,所有标准差小于预设的标准差限值的对应的元素的电压采样点所在的采样时间点记录下来形成一个区段,该区段为电压波形稳定的临界点所在区段,在该区段内对所有标准差求均值,所有标准差与均值比较,超过均值一个预设的范围的标准差对应的电压采样点的电压数据剔除,对台区电压曲线噪声处理。
10.根据权利要求8所述的一种基于数据挖掘的配网拓扑数据质量评估装置,其特征在于,所述三相电压归一模块包括:
根据公式∠BAN'+∠CAN'=60°,获得AB=AC;
由于AN、BN、CN以及AB均相等,所以根据AB的值获取AN的值、BN的值以及CN的值;
其中,A为点,代表台区电压三相中的A相;B为点,代表台区电压三相中的B相;C为点,代表台区电压三相中的C相;AN'为线段,表示三相负荷不平衡时配变出口三相电压中A相的大小;BN'为线段,表示三相负荷不平衡时配变出口三相电压中B相的大小;CN'为线段,表示三相负荷不平衡时配变出口三相电压中C相的大小;AB为线段,表示配变出口A相与B相之间线电压大小;AC为线段,表示配变出口A相与C相之间线电压大小;BC为线段,表示配变出口C相与B相之间线电压大小;cos()为余弦函数;arccos()为反余弦函数;∠BAN'表示AB与AN'的夹角,∠CAN'表示AC与AN'的夹角,AN为线段,表示三相负荷平衡时配变出口A相电压的大小,BN为线段,表示三相负荷平衡时配变出口B相电压的大小,CN为线段,表示三相负荷平衡时配变出口C相电压的大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910522828.6A CN110188090B (zh) | 2019-06-17 | 2019-06-17 | 一种基于数据挖掘的配网拓扑数据质量评估方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910522828.6A CN110188090B (zh) | 2019-06-17 | 2019-06-17 | 一种基于数据挖掘的配网拓扑数据质量评估方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110188090A CN110188090A (zh) | 2019-08-30 |
CN110188090B true CN110188090B (zh) | 2022-12-16 |
Family
ID=67722077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910522828.6A Active CN110188090B (zh) | 2019-06-17 | 2019-06-17 | 一种基于数据挖掘的配网拓扑数据质量评估方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188090B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110718908B (zh) * | 2019-09-29 | 2024-05-03 | 中科合创科技实业(深圳)有限公司 | 基于层次聚类法的配电网拓扑结构识别方法及系统 |
CN110807607A (zh) * | 2019-11-18 | 2020-02-18 | 国网重庆市电力公司电力科学研究院 | 一种基于大数据平台的低电压台区核查方法及相关装置 |
CN111339482B (zh) * | 2020-03-17 | 2023-07-14 | 南昌工程学院 | 一种基于最大互信息的离群配电变压器辨识方法 |
CN111505445B (zh) * | 2020-05-25 | 2022-07-26 | 广州市奔流电力科技有限公司 | 台区相户关系的可信度检测方法、装置和计算机设备 |
CN113675854B (zh) * | 2021-07-15 | 2024-07-23 | 国网浙江乐清市供电有限公司 | 一种考虑台区电压损耗的配网线变校验方法及装置 |
CN114403831B (zh) * | 2022-03-25 | 2022-06-14 | 广东玖智科技有限公司 | 一种ppg波形脉冲提取方法及装置 |
CN114725937B (zh) * | 2022-04-22 | 2024-10-15 | 南方电网科学研究院有限责任公司 | 一种配电台区设备拓扑关系识别方法及装置 |
CN114580982B (zh) * | 2022-05-07 | 2022-08-05 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备的数据质量的评估方法、装置及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016026355A1 (zh) * | 2014-08-18 | 2016-02-25 | 国家电网公司 | 一种有源配电网电压跌落仿真与评估方法 |
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN107508297A (zh) * | 2017-08-10 | 2017-12-22 | 国家电网公司 | 一种配网拓扑结构校验与维护方法 |
CN109596929A (zh) * | 2019-01-31 | 2019-04-09 | 国家电网有限公司 | 一种考虑时钟不同步影响的电压曲线相似性判断方法 |
-
2019
- 2019-06-17 CN CN201910522828.6A patent/CN110188090B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016026355A1 (zh) * | 2014-08-18 | 2016-02-25 | 国家电网公司 | 一种有源配电网电压跌落仿真与评估方法 |
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN107508297A (zh) * | 2017-08-10 | 2017-12-22 | 国家电网公司 | 一种配网拓扑结构校验与维护方法 |
CN109596929A (zh) * | 2019-01-31 | 2019-04-09 | 国家电网有限公司 | 一种考虑时钟不同步影响的电压曲线相似性判断方法 |
Non-Patent Citations (1)
Title |
---|
基于配电网运行数据的线变关系校验方法;唐泽洋等;《高电压技术》;20180416(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110188090A (zh) | 2019-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110188090B (zh) | 一种基于数据挖掘的配网拓扑数据质量评估方法及装置 | |
Bíscaro et al. | Integrated fault location and power-quality analysis in electric power distribution systems | |
Cunha et al. | Automated determination of topology and line parameters in low voltage systems using smart meters measurements | |
Majidi et al. | Fault location in distribution networks by compressive sensing | |
CN110718908B (zh) | 基于层次聚类法的配电网拓扑结构识别方法及系统 | |
Trindade et al. | Fault location in distribution systems based on smart feeder meters | |
Dāsa | Determining the locations of faults in distribution systems | |
Chen et al. | Critical impedance method-a new detecting harmonic sources method in distribution systems | |
CN105553115B (zh) | 用于确定分发变压器的初级侧电压的方法和系统及非瞬态计算机可读介质 | |
CN107328974B (zh) | 一种窃电识别方法及装置 | |
Serfontein et al. | Continuous event-based harmonic impedance assessment using online measurements | |
EP3642636B1 (en) | Method for detecting impedances in an electrical power distribution grid | |
CN110618314B (zh) | 一种配电系统抗短路故障干扰的谐波责任划分方法 | |
CN111008510A (zh) | 一种台区内电表识别方法及判断电表所属台区的方法 | |
CN111614066A (zh) | 一种配电网继电保护定值自动整定方法和系统 | |
Zhang et al. | Detection of the ratio error drift in CVT considering AVC | |
CN111783696A (zh) | 一种基于pv关系的低压分支拓扑实时分析的边缘计算方法 | |
CN111091223B (zh) | 一种基于物联网智能感知技术的配变短期负荷预测方法 | |
Penido et al. | An analytical zero sequence method to locate fault in distribution systems rich in DG | |
Martin et al. | Unbalance and harmonic distortion assessment in an experimental distribution network | |
Chung et al. | Development of a network-based power quality diagnosis system | |
Lima et al. | Hardware and software architecture for power quality analysis | |
Liu et al. | A heuristic meter placement method for load estimation | |
Chang et al. | A new procedure for tracking the source location | |
JP2024535499A (ja) | 物理的配電網の状態を推定するための測定ユニットの最適配置を決定する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |