一种低压台区台户关系识别方法
技术领域
本发明属于数据分析技术领域,涉及智能电能表数字化计量系统在配电网低压台区大数据分析技术领域,特别涉及一种基于智能电能表采集数据的低压台区台户关系识别方法。
背景技术
关口电能表是指安装运行在台区中,与用户电能表连接的计量装置,用于贸易结算和内部经济指标的考核,在整个电网的电能计量中起着重要作用。通过计算分析线损可发现电能损失在电网中分布规律,暴露出管理和技术上的问题,对降损工作提供理论和技术依据,提高节能降损的效益;线损计算出现异常,会严重影响对电网分配电能效率的判断。如果处于关口的电能表与用户电能表匹配缺乏准确性,两方所对应的地址就会出现差异,后期计算台区线损时就会出现线损过高或者线损为负的异常状况。
对于用户与关口不能准确识别的问题,传统方式是现场对比排查,而基于现场操作过程中可能出现因供电环境的复杂性而造成的户表电源归属难以确定的问题,且需要浪费大量人力物力;而现有的利用硬件判断所需的装置较复杂,安装和后期维护成本较高;常规的大数据分析算法直接计算相关系数进行判断或在此基础上进行聚类分析,这些方法需要不断重复计算用户与关口的日相关系数,计算量较大且不能同时识别不同属性台区的台户关系与相位关系。
综上,亟需寻找更合适的算法将用户智能电能表与关口智能电能表匹配,并应用算法判断其准确度,这对减小电能计算误差具有十分重要的意义。
发明内容
本发明的目的在于提供一种基于智能电能表采集数据的低压台区台户关系识别方法,以解决上述存在的技术问题。本发明的识别方法,基于大数据分析方法,计算量相对较小;能够准确识别台户关系与表相关系,并预估其识别正确率。
为达到上述目的,本发明采用以下技术方案:
本发明的一种基于智能电能表采集数据的低压台区台户关系识别方法,包括以下步骤:
步骤100,采集获取待识别低压台区内的预设数量的关口智能电能表及用户智能电能表的预设天数的原始电压数据;按预设阈值对采集获得的每个智能电能表的原始电压数据进行清洗,获得每个智能电能表的有效数据;
步骤300,根据步骤100获得的每个智能电能表的有效数据,求取该智能电能表的电压每日平均值与标准差值;将用户智能电能表与关口智能电能表的平均值数列及标准差值数列分别做相关性分析;若分析结果表明某一用户智能电能表与某一关口智能电能表的平均值及标准差值的相关系数都为最大值,则判定该用户智能电能表与该关口智能电能表相匹配。
本发明的进一步改进在于,步骤100中,按预设阈值对采集获得的每个智能电能表的原始电压数据进行清洗,获得每个智能电能表的有效数据的步骤具体包括:预设电压阈值区间,将超出电压阈值区间的采集数据定义为无效数据并剔除,剩余的采集数据为有效数据。
本发明的进一步改进在于,预设电压阈值区间为[176V,264V]。
本发明的进一步改进在于,在步骤100与步骤300之间还包括:
步骤200,计算智能电能表的有效数据与原始电压数据的比例,若比利低于预设阈值则跳转至步骤100,否则跳转至步骤300。
本发明的进一步改进在于,步骤300中,对于某智能电能表,
平均值采用算数平均值计算函数计算,表达式为:
标准差值采用标准差值函数计算,表达式为:
式中,
为智能电能表当日电压平均值,x
i为智能电能表当日电压采集有效数据,n为智能电能表当日电压采集有效数据个数;
步骤300中,相关性分析采用Pearson相关系数函数计算,表达式为:
用于判断用户智能电能表与关口智能电能表的平均值数列及标准差数列的相关性大小;
式中,
分别为用户与关口智能电能表预设天数的电压平均值或标准差的平均值,X
i、Y
i分别为用户与关口智能电能表当日电压平均值或标准差,n为智能电能表当日电压采集有效数据个数,ρ
X,Y为该用户与关口智能电能表的相关系数大小。
本发明的进一步改进在于,在步骤300后,还包括:
步骤400,累计每月台户关系识别有效结果,当识别结果有两次以上相同时,得出最终的台户关系识别结论。
本发明的进一步改进在于,步骤100中,用户智能电能表每天采集288个时间点,关口智能电能表每天采集96个时间点,并预设有电压点数最低值;
若某用户智能电能表当天采集的电压点数未达到预设的电压点数最低值,则舍弃该用户智能电能表及各关口智能电能表电压当天平均值和标准差值;
若某关口智能电能表当天采集的电压点数未达到预设的电压点数最低值,则舍弃所有用户智能电能表及关口智能电能表电压当天平均值和标准差值。
本发明的进一步改进在于,当智能电能表整体数据缺失不超过5%时,匹配准确率达到95%以上;当智能电能表整体数据缺失不超过60%时,匹配准确率达到85%以上。
本发明的进一步改进在于,步骤100中,所述预设天数大于等于15天。
与现有技术相比,本发明具有以下有益效果:
本发明中,利用算数平均值与标准差的去中心化分析特性,能够精准匹配用户智能电能表与关口智能电能表;由于关口电能表可以分开采集每个相位数据,所以本发明的方法不仅能够匹配台户关系还能识别其中的相位关系;本发明的方法用一个周期内的平均积分和标准差代替原始数据计算相关系数,可以将单一用户与关口原本一个月需要计算的30次相关系数简化为只需要计算1次平均值与标准差的相关系数,计算量降低了近30倍,相比传统方法本发明具有算法简单,计算量小的特点。另外,本发明中将采集电压数据中无效部分提前清洗筛选出来,可避免出现因智能电能表出现信息失准而对准确率造成影响;本发明中由于智能电能表采集的电压数据会不断累积,获得各智能电能表的平均值与标准差数列会随着时间推移而扩展,匹配值增加,匹配成功概率也会随之增加,能够不断提高匹配准确率。对比传统方法需要耗费大量人力物力逐一排查,本发明不需要额外的硬件设施,基于大数据分析,算法简单易行,计算量相对较小,且能够准确识别台户关系与相位关系,并预估其识别正确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例或现有技术描述中所需要使用的附图做简单的介绍;显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是现有方法与本发明的方法的对比示意图;图1(a)为日电压误判趋势示意图;图1(b)为平均值趋势示意图;图1(c)为标准差趋势示意图;
图2是本发明实施例中数据未筛选与筛选后的对比示意图;图2(a)为数据预处理对平均值模型影响示意图;图2(b)为数据预处理对标准差模型影响示意图;
图3是本发明实施例中关口智能电能表匹配成功率累积实验,从10天到25天数据成功率的趋势示意图;
图4是本发明实施例中进行数据随机缺失实验,在不同数据缺失率下匹配100次平均成功率的趋势示意图;
图5是本发明实施例中一种基于智能电能表采集数据的低压台区台户关系识别方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术效果及技术方案更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例是本发明一部分实施例。基于本发明公开的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的其它实施例,都应属于本发明保护的范围。
请参阅图5,本发明实施例的一种基于智能电能表采集数据的台户关系与表相关系识别方法,包括以下步骤:
步骤1,采集获取待识别的低压台区的所有关口智能电能表及用户智能电能表的原始电压数据,并按预设阈值对采集的原始电压数据进行清洗,获得有效数据;其中,经过清洗筛选出有效数据,将超出阈值数据定义为无效数据。
具体的,规定176V~264V区间(即220V±20%)为预设阈值区间,在此区间以外的数据为无效值。
步骤2,判断智能电能表的原始电压数据中,有效数据占总体数据的比例,比例可以预设为60%,根据有效比例预估识别准确度。具体的,计算智能电能表的有效数据与原始电压数据的比例,若比利低于预设比例阈值则跳转至步骤1,否则跳转至步骤3。
步骤3,根据有效数据求取每个智能电能表采集电压的每日的平均值与标准差;将用户智能电能表与各关口智能电能表的平均值数列和标准差数列做相关性分析,若分析结果表明某一关口智能电能表的平均值与标准差与用户智能电能表相关系数都为最大值,则初步判定该关口智能电能表与用户智能电能表相匹配,有实际物理关联。
其中,由于智能电能表采集的电压数据会不断累积,步骤3中获得各电能表的平均值与标准差数列会随着时间推移而扩展,匹配值不断增加,匹配成功概率也会随之增加。
步骤4,累计每月台户关系识别有效结果,当识别结果有两次以上相同时,得出最终的台户关系识别结论。
优选的,由于存在用户的计量表出现了电量信息失准的情况,采集的信息存在缺陷和漏记现象,因此无法获取准确的用电量信息。若存在某用户智能电能表当天采集的电压点数无法达到要求最低值,则无法准确计算平均值与标准差,同时舍弃该用户及各关口智能电能表电压当天平均值和标准差值;若存在某关口智能电能表当天采集的电压点数无法达到要求最低值,则无法计算平均值与标准差,同时舍弃所有用户及关口智能电能表电压当天平均值和标准差值。
具体的,若要求匹配准确率达到95%以上,则智能电能表整体数据缺失不应超过5%;若要求匹配准确率达到90%以上,则智能电能表整体数据缺失不应超过10%;若要求匹配准确率达到85%以上,则智能电能表整体数据缺失不应超过20%;若要求匹配准确率达到85%以上,则智能电能表整体数据缺失不应超过40%;若要求匹配准确率达到85%以上,则智能电能表整体数据缺失不应超过60%。
具体的,平均值采用算数平均值计算函数计算,表达式为:
标准差值采用标准差值函数计算,表达式为:
式中,
为智能电能表当日电压平均值,x
i为智能电能表当日电压采集有效数据,n为智能电能表当日电压采集有效数据个数;
相关性分析采用Pearson相关系数函数计算,表达式为:
用于判断用户智能电能表与关口智能电能表的平均值数列及标准差数列的相关性大小;
式中,
分别为用户与关口智能电能表预设天数的电压平均值或标准差的平均值,X
i、Y
i分别为用户与关口智能电能表当日电压平均值或标准差,n为智能电能表当日电压采集有效数据个数,ρ
X,Y为该用户与关口的相关系数大小。
综上所述,本发明的识别方法,利用算数平均值与标准差的去中心化分析特性,精准匹配用户智能电能表与关口智能电能表,相比传统方法具有算法简单,计算量小的特点;另外,将数据中无效部分提前筛选出来,避免出现因电能表出现信息失准而对准确率造成影响,而数据的不断累积也会帮助该算法不断提高匹配准确率,对比传统方法需要耗费大量人力物力逐一排查,本发明不需要额外的硬件设施,基于大数据分析,算法简单易行,计算量相对较小,且能够准确识别台户关系与相位关系,并预估其识别正确率。
实施例:
请参阅图1至图5,本发明实施例中,利用MATLAB(也可是其他机器语言)编程实现的一种基于智能电能表采集数据的台户关系与表相关系识别方法,包括:
1、由陕西省电力公司提供的某台区55个用户和10个关口25天数据,其中用户智能电能表每天采集288个时间点,关口智能电能表每天采集96个时间点。
2、如图1所示,“用户”表示台区某用户数据,“误判”表示传统利用相关系数法识别错误的关口数据,“真实”表示该用户物理对应的关口数据;如图(a)所示,用传统方法误判的“误判”关口与“用户”的相关系数是0.81,“真实”关口与“用户”的相关系数是0.74,无法识别出真实关口;如图(b)图(c)所示,用平均值和标准差法可以明显识别出“真实”关口;如表1所示对比了传统相关系数法与本发明方法识别准确率。综上,证明了本发明方法可大大提高识别出传统直接利用相关系数的方法难以识别出的台户表相关系。
表1.不同方法识别准确度对比
|
传统方法 |
本专发明方法 |
准确率 |
72.7% |
99% |
3、清洗前后该用户25天平均值与标准差序列分别用MATLAB绘图对比,对比结果如图2所示;对比原始数据用平均值和标准差法识别的准确度与清洗后数据用平均值和标准差法识别的准确度,如表2所示,证明了在识别前将智能电能表采集的原始电压数据按规定阈值进行清洗是非常必要且有效的一个步骤。
表2.清洗数据前后识别准确度对比
4、利用相关系数函数判断用户与哪个关口智能电能表25天平均值和标准差相关性最大,判断平均值和标准差相关性最大的是否为同一关口智能电能表,若为同一关口智能电能表,则判定该用户与该关口智能电能表匹配成功,否则,视为无法匹配,相应电能表的接线等可能有误。
5、累积不同天数计算准确率趋势,用MATLAB绘图,结果如图3所示;可以看出,若想让匹配准确率达到95%以上,则至少需要电能表有15天完整数据,数据过少会影响本方法识别的成功率。
6、在实际操作中往往很难获得15天完整数据,测试在15天内随机丢失智能电能表采集的用户及关口原始电压数据,用MATLAB绘图,匹配失败率结果如图4所示,从图4中可以看出少量数据缺失对识别准确率影响较小,本发明方法具有较好的鲁棒性,在实际应用中具有良好适应性。
综上,本发明提供一种基于智能电能表采集数据的台户关系与表相关系识别方法。利用算数平均值与标准差的去中心化分析特性,精准识别台户关系与表相关系,并预估其识别正确率,这对管理台区数据以及减小电能计算误差具有十分重要的意义。
本发明可应用于电力系统低压配电网智能电能表计量系统,通过采用本发明提出的方法,结合大数据分析手段来解决供电台区的台户关系与表相关系不匹配对电能计量产生的不利影响,这对实现电能的准确计量、推动智能电能表的推广应用、确保电力系统良好的经济效益、构建电力企业和用户之间的信任都具有十分积极的意义。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。