CN115689374A - 一种农业排灌用电的电价执行异常识别方法及装置 - Google Patents
一种农业排灌用电的电价执行异常识别方法及装置 Download PDFInfo
- Publication number
- CN115689374A CN115689374A CN202211419418.7A CN202211419418A CN115689374A CN 115689374 A CN115689374 A CN 115689374A CN 202211419418 A CN202211419418 A CN 202211419418A CN 115689374 A CN115689374 A CN 115689374A
- Authority
- CN
- China
- Prior art keywords
- electricity
- power
- abnormal
- irrigation
- utilization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种农业排灌用电的电价执行异常识别方法及装置,其中,该方法包括以下步骤:获取多个农业排灌电表的历史用电数据;利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合;根据所述异常电表集合匹配用户信息,得到异常用户名单;本申请通过采用电价执行异常识别模型对农业排灌电表进行电价执行异常识别,最终匹配到电价执行异常的异常用户名单,稽查人员可以根据异常用户名单开展现场稽查工作,从而降低了执行电价异常现场稽查工作的难度。
Description
技术领域
本发明涉及电力领域,尤其涉及一种农业排灌用电的电价执行异常识别方法及装置。
背景技术
随着我国的电力系统的建设与社会经济的发展,电力公司会根据不同的用电范围划分出不同的电价类型,其中,有一种电价类型为农业排灌用电,农业排灌用电指的是粮食作物排灌、农业防汛以及抗旱临时用电,相较于其他用电类型,农业排灌用电的电价会更加优惠,有些用户出于对电价政策的认识不足,认为农业排灌用电只需要有养殖、建房、照片、作坊生产等需求即可随便接线和随便使用的,从而导致高价低接的违法用电行为频发,使得电力公司的利益受损。
由于农业排灌用电大量分布在偏远地区,增加了执行电价异常现场稽查工作的成本和难度,因此,亟需一种识别农业排灌用电的电价执行异常的方法,发现异常用电用户,提升执行电价异常稽查工作的准确性和全面性,提高营销稽查自动化和智能化水平,为公司防范营销风险、追回经营损失提供数据支撑。
发明内容
有鉴于此,本申请提供一种农业排灌用电的电价执行异常识别方法及装置,目的在于降低执行电价异常现场稽查工作的难度。
本申请第一方面提供了一种农业排灌用电的电价执行异常识别方法,其特征在于,包括:
获取多个农业排灌电表的历史用电数据;
利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合;
根据所述异常电表集合匹配用户信息,得到异常用户名单。
可选地,所述历史用电数据包括历史日用电量序列和/或历史日发电功率曲线。
可选地,所述历史用电数据包括历史日用电量序列和历史日功率曲线,所述电价执行异常识别模型包括非灌溉季电价执行异常识别模型;
所述利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合,包括:
计算所述历史日用电量序列中日用电量大于零的日期;
从所述日用电量大于零的日期的个数大于第一预设阈值的所述农业排灌电表的所述历史日发电功率曲线中,提取待识别日发电功率曲线,其中,所述待识别日发电功率曲线为所述历史日用电量序列中所述日用电量大于零的日期所对应的日发电功率曲线;
计算所述待识别日发电功率曲线在凌晨时段的平均功率、白天时段的平均功率以及夜晚时段的平均功率;
将所述凌晨时段的平均功率大于三分之一的所述白天时段的平均功率,或所述夜晚时段的平均功率大于二分之一的所述白天时段的平均功率,或所述凌晨时段的平均功率大于所述夜晚时段的平均功率的所述待识别日发电功率曲线所属的所述农业排灌电表加入所述异常电表集合。
可选地,在所述提取待识别日发电功率曲线之后,所述方法还包括:
将各个时间点的发电功率值全部大于零的所述待识别日发电功率曲线所属的所述农业排灌电表加入所述异常电表集合。
可选地,所述历史用电数据包括历史日发电功率曲线,所述电价执行异常识别模型包括灌溉季电价执行异常识别模型;
所述利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合,包括:
为各个农业排灌电表的历史日发电功率曲线构建特征向量,所述特征向量包括:用电连续性指数、完整用电次数、平均完整用电时长、完整用电开始时间序列包括的多个完整用电开始时间的平均值、完整用电开始时间序列包括的多个完整用电开始时间的标准差、完整用电结束时间序列包括的多个完整用电结束时间的平均值、完整用电结束时间序列包括的多个完整用电结束时间的标准差、白天平均功率与夜晚平均功率比值、白天平均功率与凌晨平均功率比值、夜晚平均功率与凌晨平均功率比值;
将所述用电连续性指数大于或等于第二预设阈值的所述农业排灌电表作为连续用电电表,将用电连续性指数小于所述第二预设阈值的所述农业排灌电表作为间断用电电表;
为各个所述连续用电电表分别建立连续用电向量集,为各个所述间断用电电表分别建立间断用电向量集,其中,所述连续用电向量集中的特征向量包括:所述白天平均功率与夜晚平均功率比值、所述白天平均功率与凌晨平均功率比值、所述夜晚平均功率与凌晨平均功率比值,所述间断用电向量集中的特征向量包括:所述完整用电次数、所述平均完整用电时长、所述完整用电开始时间序列包括的多个完整用电开始时间的平均值、所述完整用电开始时间序列包括的多个完整用电开始时间的标准差、所述完整用电结束时间序列包括的多个完整用电结束时间的平均值、所述完整用电结束时间序列包括的多个完整用电结束时间的标准差;
对各个所述连续用电电表的所述连续用电向量集进行第一离群点分析,将属于离群点的特征向量所属的所述连续用电电表加入所述异常电表集合;
对各个所述间断用电电表的所述间断用电向量集进行第二离群点分析,将属于离群点的特征向量所属的所述间断用电电表加入所述异常电表集合。
可选地,所述对各个所述连续用电电表的所述连续用电向量集进行第一离群点分析包括:
根据各个所述连续用电电表的所述连续用电向量集构建第一样本矩阵;
对所述第一样本矩阵进行归一化处理得到第二样本矩阵;
采用聚类算法对所述第二样本矩阵进行聚类得到聚类结果,得到至少一个目标簇,获取各个所述目标簇的质心;
计算各个所述目标簇中的特征向量与各自最近质心的第一距离;
根据所述第一距离计算各个所述目标簇中的特征向量与各自最近质心的第二距离;
将所述第二距离大于第三预设阈值的特征向量作为离群点。
可选地,所述对各个所述间断用电电表的所述间断用电向量集进行第二离群点分析包括:
根据各个所述间断用电电表的所述间断用电向量集构建第三样本矩阵;
对所述第三样本矩阵进行归一化处理后得到第四样本矩阵;
采用聚类算法对所述第四样本矩阵进行聚类,得到至少一个目标簇,获取各个所述目标簇的质心;
计算各个所述目标簇中的特征向量与各自最近质心的第一距离;
根据所述第一距离计算各个所述目标簇中的特征向量与各自最近质心的第二距离;
将所述第二距离大于第四预设阈值的特征向量作为离群点。
可选地,所述对各个所述间断用电电表的所述间断用电向量集进行第二离群点分析还包括:
对所述第三样本矩阵进行归一化处理后,再进行主成分分析,得到第三样本矩阵的主成分;
根据所述第三样本矩阵的主成分构建第四样本矩阵。
可选地,其特征在于,所述聚类算法为K均值聚类算法。
本申请第二方面提供了一种农业排灌用电的电价执行异常识别装置,其特征在于,所述装置包括:
数据获取单元,用于获取多个农业排灌电表的历史用电数据;
异常电表识别单元,用于利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合;
异常用户匹配单元,用于根据所述异常电表集合匹配用户信息,得到异常用户名单。
本申请通过获取多个农业排灌电表的历史用电数据,利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合,其中,所述电价执行异常识别模型包括非灌溉季电价执行异常识别模型以及灌溉季电价执行异常识别模型,根据所述异常电表集合匹配用户信息,得到异常用户名单,本申请通过电价执行异常识别模型对农业排灌电表的历史用电数据进行异常识别,将电价执行异常的农业排灌电表加入异常电表集合,根据异常电表集合得到异常用户名单,稽查人员可以根据异常用户名单开展现场稽查工,从而降低了执行电价异常现场稽查工作的难度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请的实施例提供的一种农业排灌用电的电价执行异常识别方法的方法流程图;
图2为本申请的实施例提供的又一种农业排灌用电的电价执行异常识别方法的方法流程图;
图3为本申请的实施例提供的又一种农业排灌用电的电价执行异常识别方法的方法流程图;
图4为本申请的实施例提供的又一种农业排灌用电的电价执行异常识别方法的方法流程图;
图5为本申请的实施例提供的又一种农业排灌用电的电价执行异常识别方法的方法流程图;
图6为本申请的实施例提供的又一种农业排灌用电的电价执行异常识别方法的方法流程图;
图7为本申请的实施例提供的一种农业排灌用电的电价执行异常识别装置的示意图。
具体实施方式
下面将结合本申请的实施例中的附图,对本申请的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1所示,本申请提供了一种农业排灌用电的电价执行异常识别方法,该方法适用于能够进行数据处理的电子设备,如手机、平板、一体机、计算机、服务器等设备,具体包括以下步骤:
步骤S101:获取多个农业排灌电表的历史用电数据。
在本申请的实施例中,农业排灌电表指的是记录农业排灌用电的电表,农业排灌用电指的是粮食作物排灌、农业防汛以及农业抗旱的临时用电。
作为一种可选的实施方法,获取的历史用电数据可以是历史日用电量序列,也可以是历史日用电量序列以及历史日发电功率曲线,其中,历史日用电量序列包括农业排灌电表某段时间内每日的用电量的信息,历史日发电功率曲线包括农业排灌电表某段时间内每日的日发电功率曲线的信息,日发电功率曲线指的是九十六点发电功率曲线,在该九十六点发电功率曲线中,从每天的零点开始每隔十五分钟对发电功率进行一次记录,得到一天内的九十六个时间点的发电功率值。
步骤S102:利用电价执行异常识别模型对多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合。
在本申请的实施例中,电价执行异常识别模型用于对农业排灌电表的历史用电数据进行异常识别,并输出包含有用电异常的农业排灌电表的异常电表集合,以便根据异常电表集合匹配异常用户。
作为一种可选的实施方式,根据农业排灌电表不同的用电场景,电价执行异常识别模型分为灌溉季电价执行异常识别模型以及非灌溉季电价执行异常识别模型,灌溉季电价执行异常识别模型基于历史用电量序列建立,非灌溉季电价执行异常识别模型基于历史日发电功率曲线和历史日用电量序列建立,需要说明的是,非灌溉季电价执行异常识别模型也适用于处于灌溉季的农业排灌电表,灌溉季电价执行异常识别模型也同样适用于处于非灌溉季的农业排灌电表。
作为一种可选的实施方式,可以同时使用灌溉季电价执行异常识别模型以及非灌溉季电价执行异常识别模型进行识别,最后合并两种电价执行识别模型获得的异常电表,以提高筛查结果的精确度,作为另一种可选的实施方法,可以先使用非灌溉季电价执行异常识别模型进行第一次异常识别,得到第一异常电表集合,再使用灌溉季电价执行异常识别模型对第一异常电表集合中的农业排灌电表的用电数据进行第二次异常识别,得到第二异常电表集合,从而进一步提高筛查结果的精确度。
步骤S103:根据异常电表集合匹配用户信息,得到异常用户名单。
在本申请的实施例中,根据异常电表集合在电力公司的系统中匹配异常的农业排灌电表所属用户的用户信息,用户信息包括但不限于用户名称、地址、所属供电单位等,本申请在此方面不做限定。
参见图2所示,当用电场景为非灌溉季时,采用非灌溉季电价执行异常识别模型是较为优选的选择,步骤S101获取的历史用电数据为历史日用电量序列以及历史日发电功率曲线,此时,步骤S102具体包括以下步骤:
步骤S201:计算历史日用电量序列中日用电量大于零的日期。
作为一种可选的实施方式,例如,农业排灌电表A的历史日用电量序列为{0、45、48、111、0、0、152},历史日用电序列的时间范围为9月1号至9月7号,则日用电量大于零的日期为9月2号、9月3号、9月4号以及9月7号。
步骤S202:从日用电量大于零的日期的个数大于第一预设阈值的农业排灌电表的历史日发电功率曲线中,提取待识别日发电功率曲线,其中,待识别日发电功率曲线为历史日用电量序列中日用电量大于零的日期所对应的日发电功率曲线。
在本申请的实施例中,第一预设阈值的具体参数由技术人员根据实际情况设置或者根据取样的时间范围进行换算,本申请在此方面不做限定。
作为一种可选的实施方式,例如,若设置第一预设阈值为3,则农业排灌电表A的日用电量大于零的日期的个数大于第一预设阈值,根据日电量大于零的日期从农业排灌电表A的历史日发电功率曲线中,提取9月2号、9月3号、9月4号以及9月7号的日发电功率曲线。
作为一种可选的实施方式,在提取待识别日发电功率曲线之后,可以先将各个时间点的发电功率值全部大于零的待识别日发电功率曲线所属的农业排灌电表加入异常电表集合,例如,农业排灌电表A的9月11号的待识别日发电功率曲线的96个点的发电功率值均大于零,则可以判定农业排灌电表A存在电价执行异常的行为,将其加入异常电表集合。
步骤S203:计算待识别日发电功率曲线在凌晨时段的平均功率、白天时段的平均功率以及夜晚时段的平均功率。
在本申请的实施例中,结合各用电类型的用电特征将日发电功率曲线划分为凌晨时段、白天时段以及夜晚时段,其中,凌晨时段为0点到5点、白天时段为5点到17点、夜晚时段为17点到24点。
各用电类型的用电特性如下:
农业生产用电:养殖渔场、营业性垂钓园、养鸡等,白天夜晚可能都有用电;
居民生活用电:照明、排涝站值班人员生活用电等,照明通常在夜晚到凌晨之间用电,冰箱等家用电器待机则24小时用电;
3、商业用电:工厂、小作坊等,白天做工时间用电量大,夜晚机器待机等用电。
在本申请的实施例中,凌晨时段对应的是待识别日发电功率曲线中第1个点至第20个点的发电功率值,凌晨时段的平均功率为第1个点至第20个点的发电功率值的平均值,白天时段对应的是待识别日发电功率曲线中第21个点至第68个点的发电功率值,白天时段的平均功率为第21个点至第68个点的发电功率值的平均值,夜晚时段对应的是待识别日发电功率曲线中第69个点至第96个点的发电功率值,夜晚时段的平均功率为第69个点至第96个点的发电功率值的平均值。
步骤S204:将凌晨时段的平均功率大于三分之一的白天时段的平均功率,或夜晚时段的平均功率大于二分之一的白天时段的平均功率,或凌晨时段的平均功率大于夜晚时段的平均功率的待识别日发电功率曲线所属的农业排灌电表加入异常电表集合。
在本申请实施例中,列出了三种判断农业排灌电表是否存在电价执行异常的条件,作为一种可选的实施方式,可以对加入异常电表集合的农业排灌电表进行异常等级划分,具体地,将同时满足以上三种判断条件的农业排灌电表划分为A级,满足两种判断条件的农业排灌电表划分为B级别,仅满足一种判断条件的农业排灌电表划分为C级,其中,优先级由高到低分别为A级、B级、C级,稽查人员可以根据优先级开展稽查工作,例如,优先开展异常等级为A级的农业排灌电表的现场稽查工作。
参见图3所示,虽然非灌溉季电价执行异常识别模型在灌溉季依然可以使用,但准确率会偏低,因为灌溉季农业排灌电表的用电量大幅增加,有农作物灌溉、防洪排涝、抗旱临时用电等多种应用场景,用电规律更为复杂,为了进一步提高筛查结果的精确度,当用电场景为灌溉季时,采用灌溉季电价执行异常识别模型进行识别是较为优选的选择,步骤S101获取的历史用电数据为历史日发电功率曲线,此时,步骤S102具体包括以下步骤:
步骤S301:为各个农业排灌电表的历史日发电功率曲线构建特征向量,特征向量包括:用电连续性指数、完整用电次数、平均完整用电时长、完整用电开始时间序列包括的多个完整用电开始时间的平均值、完整用电开始时间序列包括的多个完整用电开始时间的标准差、完整用电结束时间序列包括的多个完整用电结束时间的平均值、完整用电结束时间序列包括的多个完整用电结束时间的标准差、白天平均功率与夜晚平均功率比值、白天平均功率与凌晨平均功率比值、夜晚平均功率与凌晨平均功率比值。
在本申请的实施例中,从用电时间、用电时长、用电曲线波动性等方面构建特征向量,以取值的时间范围为一个月为例,各个特征向量的定义如下:
用电连续性指数:一个月内发电功率连续大于0的最大时间长度,除以总周期时长;
完整用电次数:用电从开始到结束为一次完整的用电,统计一个月内完整用电次数,其中,用电的开始指的是日发电功率曲线的发电功率值大于零,用电的结束指的是日发电功率曲线的发电功率值等于零;
平均完整用电时长:统计一个月内完整用电的平均时长;
完整用电开始时间序列包括的多个完整用电开始时间的平均值:一个月内每次完整用电的开始时刻构成的序列,序列中完整用电的开始时间的平均值;
完整用电开始时间序列包括的多个完整用电开始时间的标准差:一个月内每次完整用电的开始时刻构成的序列,序列中完整用电的开始时间的标准差;
完整用电结束时间序列包括的多个完整用电结束时间的平均值:一个月内每次完整用电的结束时刻构成的序列,序列中完整用电的开始时间的平均值;
完整用电结束时间序列包括的多个完整用电结束时间的标准差:一个月内每次完整用电的结束时刻构成的序列,序列中完整用电的开始时间的标准差;
白天平均功率与夜晚平均功率比值:一个月内白天时段的平均功率值与一个月内凌晨时段的平均功率值的比值;
白天平均功率与凌晨平均功率比值:一个月内白天时段的平均功率值与一个月内凌晨时段的平均功率值的比值;
夜晚平均功率与凌晨平均功率比值:一个月内夜晚时段的平均功率值与一个月内凌晨时段的平均功率值的比值。
步骤S302:将用电连续性指数大于或等于第二预设阈值的农业排灌电表作为连续用电电表,将用电连续性指数小于第二预设阈值的农业排灌电表作为间断用电电表。
在本申请的实施例中,根据用电连续性指数将农业排灌电表区分为间断用电电表以及连续用电电表,第二预设阈值的数值一般设置为1,可选地,该第二预设阈值可自行设置或根据历史用电数据的取值的时间范围换算得到,本申请在此方面不做限定。
步骤S303:为各个连续用电电表分别建立连续用电向量集,为各个间断用电电表分别建立连续用电向量集,其中,连续用电向量集中的特征向量包括:白天平均功率与夜晚平均功率比值、白天平均功率与凌晨平均功率比值、夜晚平均功率与凌晨平均功率比值;间断用电向量集的特征向量包括:完整用电次数、平均完整用电时长、完整用电开始时间序列包括的多个完整用电开始时间的平均值、完整用电开始时间序列包括的多个完整用电开始时间的标准差、完整用电结束时间序列包括的多个完整用电结束时间的平均值、完整用电结束时间序列包括的多个完整用电结束时间的标准差。
步骤S304:对各个连续用电电表的连续用电向量集进行第一离群点分析,将属于离群点的特征向量所属的连续用电电表加入异常电表集合。
在本申请的实施例中,离群点指的是偏移大部分特征向量的特征向量,即异常的特征向量,第一离群点分析指的是在各个连续用电向量集中找出异常的特征向量的过程,如果连续用电电表的某个特征向量属于离群点,则可以判定该连续用电电表存在电价执行异常的情况,将其加入异常电表集合。
步骤S305:对各个间断用电电表的间断用电向量集进行第二离群点分析,将属于离群点的特征向量所属的间断用电电表加入异常电表集合。
在本申请的实施例中,第二离群点分析指的是在各个间断用电向量集中找出异常的特征向量的过程,如果间断用电电表的某个特征向量属于离群点,则可以判定该间断用电电表存在电价执行异常的情况,将其加入异常电表集合。
参见图4所示,在步骤S304中,对各个连续用电电表的连续用电向量集进行第一离群点分析,具体包括以下步骤:
步骤S401:根据各个连续用电电表的连续用电向量集构建第一样本矩阵。
在本申请的实施例中,第一样本矩阵包含有所有连续用电向量集的特征向量。
步骤S402:对第一样本矩阵进行归一化处理得到第二样本矩阵。
在本申请的实施例中,对第一样本矩阵进行归一化处理是为了使特征向量之间的数值大小维度趋于一致,从而提高灌溉季电价执行异常识别模型的收敛速度。
步骤S403:采用聚类算法对第二样本矩阵进行聚类,得到至少一个目标簇,获取各个目标簇的质心。
在本申请的实施例中,聚类指的是将样本矩阵中在某些方面相似的特征向量进行分类组织的过程,可选地,聚类算法采用k均值聚类算法(k-means clusteringalgorithm),k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是,预将数据分为k组,其中,k的值可由轮廓系数法确定,然后,随机选取k个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心,聚类中心以及分配给它们的对象就代表一个聚类,每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算,这个过程将不断重复直到满足某个终止条件,其中,终止条件如下:
1、没有(或最小数目)对象被重新分配给不同的聚类;
2、没有(或最小数目)聚类中心再发生变化;
3、误差平方和局部最小。
在本申请的实施例中,通过聚类算法可以获得至少一个目标簇,聚类后的第二样本矩阵中的每个特征向量都有各自归属的目标簇,每个目标簇都对应有一个质心。
步骤S404:计算各个目标簇中的特征向量与各自最近质心的第一距离。
在本申请的实施例中,各自最近质心指的是特征向量所属的目标簇的质心,第一距离指的是欧式距离,此外,第一距离还可以是曼哈顿距离、闵可夫斯基距离等,本申请在此方面不做限定。
步骤S405:根据第一距离计算各个目标簇中的特征向量与各自最近质心的第二距离。
在本申请的实施例中,第二距离指的是相对距离,具体地,指的是该特征向量到各自最近质心的第一距离与该特征向量所属的目标簇中的其他特征向量到各自最近质心的第一距离的中位数的比值。
步骤S406:将第二距离大于第三预设阈值的特征向量作为离群点。
在本申请的实施例中,第三预设阈值的具体数值根据技术人员根据实际情况进行设置,本申请在此方面不做限定,需要说明的是,在一定的范围内,第三预设阈值越小,会使得最终的筛查结果的精确度越高,可选地,可将所属第二距离作为离群点得分,技术人员可基于整体的离群点得分情况,对第三预设阈值进行设置。
参见图5所示,对各个间断用电电表的间断用电向量集进行第二离群点分析具体包括以下步骤:
步骤S501:根据各个间断用电电表的间断用电向量集构建第三样本矩阵。
在本申请的实施例中,第一样本矩阵包含有所有连续用电向量集的特征向量,作为一种可选的实施方式,当间断用电电表的数量过大时,可以根据预设数量的间断用电向量集构建第三样本矩阵,分批次采用灌溉季电价执行异常识别模型进行异常识别。
步骤S502:对第三样本矩阵进行归一化处理后得到第四样本矩阵。
作为一种可选的实施方式,由于间断用电向量集中的特征向量较多,导致了构建完成的第四样本矩阵的空间维度较大,例如,假设有n个间断用电向量集,每个间断用电向量集包括k个指标,则第三样本矩阵的维度为n×k维,并且有些特征向量存在相似度较高的问题,会干扰灌溉季电价执行异常识别模型的识别精度,因此可以进一步采用主成分分析对第四样本矩阵进行降维处理,参见图6所示,步骤S502包括以下步骤:
步骤S601:对第三样本矩阵进行标准化处理后,再进行主成分分析,得到第三样本矩阵的主成分。
在本申请的实施例中,主成分分析用来分析第三样本矩阵中的主要成分,目的在于对第三样本矩阵进行降维处理,它是一种常用的线性降维方法,该方法通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大,以此使用较少的数据维度,同时保留住较多的原数据点的特性。
在本申请的实施例中,该步骤的具体步骤如下:
第一步,假设标准化后的第三样本矩阵为样本矩阵X,其中,样本矩阵X的表达式如下:
其中,其中,n为间断用电向量集的集合数,k为间断用电向量集的指标数。
第二步,根据样本矩阵X计算相关系数矩阵R,其中,相关系数矩阵R的表达式如下:
第三步,求解相关矩阵R的k个特征值λ1,λ2,λ3,……,λk以及对应的特征向量e1,e2,e3,……,ek,其中,λ1>λ2>λ3>……>λk,ei=[e1i,e2i,....,eki]T,通过线性变换得到新的指标变量,其中,各个新的指标变量的表达式如下:
其中,y1指的是第1个主成分,y2指的是第2个主成分,y3是的是的第3个主成分,……,yk指的是第k个主成分,eik为相关系数矩阵R的第i个特征值所对应的k维特征向量,x为第三样本矩阵的k维的初始输入变量。
第四步,根据计算各个主成分的方差贡献率,根据特征值由大到小的顺序累计方差贡献率,需要说明的是,在本申请中累计方差贡献率达到85%即可达到指标信息反映精度的要求,因此,当累计方差贡献率达到85%的时,得到m个主成分y1,y2,y3,……,ym。
其中,方差贡献率指的是一个主成分所能够解释的方差占全部方差的比例,这个值越大,说明主成分综合原始变量的信息的能力越强,其计算公式如下:
累积方差贡献率指的是主成分筛选中所确定的前m个主成分所能解释的全部方差占总方差的比例称为累计方差贡献率,其计算公式如下:
步骤S602:根据第三样本矩阵的主成分构建第四样本矩阵。
在本申请的实施例中,对于第四样本矩阵来说,对第三样本矩阵进行主成分分析,使得第四样本矩阵的维度由n×k维变成了n×m维,其中,k>m,因此达到了降低第四样本矩阵的维度的目的。
步骤S503:采用聚类算法对第四样本矩阵进行聚类,得到至少一个目标簇,获取各个目标簇的质心。
步骤S504:计算各个目标簇中的特征向量与各自最近质心的第一距离。
在本申请的实施例中,步骤S504至步骤S506的具体实施方式如步骤S404至步骤S406一致,此处不再赘述。
步骤S505:根据第一距离计算各个目标簇中的特征向量与各自最近质心的第二距离。
步骤S506:将第二距离大于第四预设阈值的特征向量作为离群点。
在本申请的实施例中,第四预设阈值的具体数值根据技术人员根据实际情况进行设置,本申请在此方面不做限定。
与上述本申请的实施例提供的一种农业排灌用电的电价执行异常识别方法相对应,参见图7,本申请的实施例还提供了一种农业排灌用户的电价执行异常识别装置,该装置包括:数据获取单元701、异常电表识别单元702以及异常用户匹配单元703。
数据获取单元701,用于获取多个农业排灌电表的历史用电数据。
异常电表识别单元702,用于利用电价执行异常识别模型对多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合。
异常用户匹配单元703,用于根据异常电表集合匹配用户信息,得到异常用户名单。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素,在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明,对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现,因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种农业排灌用电的电价执行异常识别方法,其特征在于,包括:
获取多个农业排灌电表的历史用电数据;
利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合;
根据所述异常电表集合匹配用户信息,得到异常用户名单。
2.根据权利要求1所述的方法,其特征在于,所述历史用电数据包括历史日用电量序列和/或历史日发电功率曲线。
3.根据权利要求2所述的方法,其特征在于,所述历史用电数据包括历史日用电量序列和历史日功率曲线,所述电价执行异常识别模型包括非灌溉季电价执行异常识别模型;
所述利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合,包括:
计算所述历史日用电量序列中日用电量大于零的日期;
从所述日用电量大于零的日期的个数大于第一预设阈值的所述农业排灌电表的所述历史日发电功率曲线中,提取待识别日发电功率曲线,其中,所述待识别日发电功率曲线为所述历史日用电量序列中所述日用电量大于零的日期所对应的日发电功率曲线;
计算所述待识别日发电功率曲线在凌晨时段的平均功率、白天时段的平均功率以及夜晚时段的平均功率;
将所述凌晨时段的平均功率大于三分之一的所述白天时段的平均功率,或所述夜晚时段的平均功率大于二分之一的所述白天时段的平均功率,或所述凌晨时段的平均功率大于所述夜晚时段的平均功率的所述待识别日发电功率曲线所属的所述农业排灌电表加入所述异常电表集合。
4.根据权利要求3所述的方法,其特征在于,在所述提取待识别日发电功率曲线之后,所述方法还包括:
将各个时间点的发电功率值全部大于零的所述待识别日发电功率曲线所属的所述农业排灌电表加入所述异常电表集合。
5.根据权利要求2所述的方法,其特征在于,所述历史用电数据包括历史日发电功率曲线,所述电价执行异常识别模型包括灌溉季电价执行异常识别模型;
所述利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合,包括:
为各个农业排灌电表的历史日发电功率曲线构建特征向量,所述特征向量包括:用电连续性指数、完整用电次数、平均完整用电时长、完整用电开始时间序列包括的多个完整用电开始时间的平均值、完整用电开始时间序列包括的多个完整用电开始时间的标准差、完整用电结束时间序列包括的多个完整用电结束时间的平均值、完整用电结束时间序列包括的多个完整用电结束时间的标准差、白天平均功率与夜晚平均功率比值、白天平均功率与凌晨平均功率比值、夜晚平均功率与凌晨平均功率比值;
将所述用电连续性指数大于或等于第二预设阈值的所述农业排灌电表作为连续用电电表,将用电连续性指数小于所述第二预设阈值的所述农业排灌电表作为间断用电电表;
为各个所述连续用电电表分别建立连续用电向量集,为各个所述间断用电电表分别建立间断用电向量集,其中,所述连续用电向量集中的特征向量包括:所述白天平均功率与夜晚平均功率比值、所述白天平均功率与凌晨平均功率比值、所述夜晚平均功率与凌晨平均功率比值,所述间断用电向量集中的特征向量包括:所述完整用电次数、所述平均完整用电时长、所述完整用电开始时间序列包括的多个完整用电开始时间的平均值、所述完整用电开始时间序列包括的多个完整用电开始时间的标准差、所述完整用电结束时间序列包括的多个完整用电结束时间的平均值、所述完整用电结束时间序列包括的多个完整用电结束时间的标准差;
对各个所述连续用电电表的所述连续用电向量集进行第一离群点分析,将属于离群点的特征向量所属的所述连续用电电表加入所述异常电表集合;
对各个所述间断用电电表的所述间断用电向量集进行第二离群点分析,将属于离群点的特征向量所属的所述间断用电电表加入所述异常电表集合。
6.根据权利要求5所述的方法,其特征在于,所述对各个所述连续用电电表的所述连续用电向量集进行第一离群点分析包括:
根据各个所述连续用电电表的所述连续用电向量集构建第一样本矩阵;
对所述第一样本矩阵进行归一化处理得到第二样本矩阵;
采用聚类算法对所述第二样本矩阵进行聚类得到聚类结果,得到至少一个目标簇,获取各个所述目标簇的质心;
计算各个所述目标簇中的特征向量与各自最近质心的第一距离;
根据所述第一距离计算各个所述目标簇中的特征向量与各自最近质心的第二距离;
将所述第二距离大于第三预设阈值的特征向量作为离群点。
7.根据权利要求5所述的方法,其特征在于,所述对各个所述间断用电电表的所述间断用电向量集进行第二离群点分析包括:
根据各个所述间断用电电表的所述间断用电向量集构建第三样本矩阵;
对所述第三样本矩阵进行归一化处理后得到第四样本矩阵;
采用聚类算法对所述第四样本矩阵进行聚类,得到至少一个目标簇,获取各个所述目标簇的质心;
计算各个所述目标簇中的特征向量与各自最近质心的第一距离;
根据所述第一距离计算各个所述目标簇中的特征向量与各自最近质心的第二距离;
将所述第二距离大于第四预设阈值的特征向量作为离群点。
8.根据权利要求7所述的方法,其特征在于,所述对各个所述间断用电电表的所述间断用电向量集进行第二离群点分析还包括:
对所述第三样本矩阵进行归一化处理后,再进行主成分分析,得到第三样本矩阵的主成分;
根据所述第三样本矩阵的主成分构建第四样本矩阵。
9.根据权利要求6至8中任意一项所述的方法,其特征在于,所述聚类算法为K均值聚类算法。
10.一种农业排灌用电的电价执行异常识别装置,其特征在于,所述装置包括:
数据获取单元,用于获取多个农业排灌电表的历史用电数据;
异常电表识别单元,用于利用电价执行异常识别模型对所述多个农业排灌电表的历史用电数据进行异常识别,获取异常电表集合;
异常用户匹配单元,用于根据所述异常电表集合匹配用户信息,得到异常用户名单。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211419418.7A CN115689374A (zh) | 2022-11-14 | 2022-11-14 | 一种农业排灌用电的电价执行异常识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211419418.7A CN115689374A (zh) | 2022-11-14 | 2022-11-14 | 一种农业排灌用电的电价执行异常识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115689374A true CN115689374A (zh) | 2023-02-03 |
Family
ID=85052921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211419418.7A Pending CN115689374A (zh) | 2022-11-14 | 2022-11-14 | 一种农业排灌用电的电价执行异常识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115689374A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117787572A (zh) * | 2024-02-27 | 2024-03-29 | 国网山西省电力公司临汾供电公司 | 一种异常用电用户识别方法、装置、存储介质及电子设备 |
-
2022
- 2022-11-14 CN CN202211419418.7A patent/CN115689374A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117787572A (zh) * | 2024-02-27 | 2024-03-29 | 国网山西省电力公司临汾供电公司 | 一种异常用电用户识别方法、装置、存储介质及电子设备 |
CN117787572B (zh) * | 2024-02-27 | 2024-05-17 | 国网山西省电力公司临汾供电公司 | 一种异常用电用户识别方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rajabi et al. | A comparative study of clustering techniques for electrical load pattern segmentation | |
CN111064614B (zh) | 一种故障根因定位方法、装置、设备及存储介质 | |
Batra et al. | NILMTK: An open source toolkit for non-intrusive load monitoring | |
CN103135009B (zh) | 基于使用者回馈信息的电器侦测方法与系统 | |
Chicco et al. | Emergent electricity customer classification | |
CN111160617B (zh) | 一种电力日负荷预测方法及装置 | |
CN109697548B (zh) | 用电分析服务器及其用电分析方法 | |
CN107248086A (zh) | 基于用户用电行为分析的广告投放辅助分析方法 | |
US9816836B2 (en) | Correlating meter data to detect mismappings | |
CN111784093B (zh) | 一种基于电力大数据分析的企业复工辅助判断方法 | |
CN109118012B (zh) | 一种工业动态多维度能耗成本预测方法、系统、存储介质和终端 | |
CN111160404A (zh) | 配电网线损标杆合理值的分析方法及装置 | |
CN115689374A (zh) | 一种农业排灌用电的电价执行异常识别方法及装置 | |
CN113112099A (zh) | 电网日电量预测模型训练方法和电网日电量预测方法 | |
CN108428055A (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
CN116148753A (zh) | 一种智能电能表运行误差监测系统 | |
CN112614004A (zh) | 用电信息的处理方法及装置 | |
CN109272237A (zh) | 一种用电异常的识别方法、系统及终端设备 | |
CN116385210B (zh) | 一种基于物联网的供电能耗监测系统 | |
CN110288383B (zh) | 基于用户属性标签的群体行为配电网用电异常检测方法 | |
CN112116205A (zh) | 针对台区用电特征的画像方法、装置和存储介质 | |
CN111784379A (zh) | 追缴电费的估算方法、装置和异常案例的筛选方法、装置 | |
CN112579721B (zh) | 构建人群分布图的方法及系统、终端设备、存储介质 | |
Hu et al. | Analysis of user power consumption characteristics and behavior portrait based on KS-rf algorithm | |
CN114048200A (zh) | 一种计及缺失数据补齐的用户用电行为分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |