CN116861348A - 一种基于实际距离建立集群分析的光伏电站异常检测方法 - Google Patents
一种基于实际距离建立集群分析的光伏电站异常检测方法 Download PDFInfo
- Publication number
- CN116861348A CN116861348A CN202310666750.1A CN202310666750A CN116861348A CN 116861348 A CN116861348 A CN 116861348A CN 202310666750 A CN202310666750 A CN 202310666750A CN 116861348 A CN116861348 A CN 116861348A
- Authority
- CN
- China
- Prior art keywords
- power generation
- photovoltaic
- photovoltaic power
- clients
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 238000007621 cluster analysis Methods 0.000 title claims abstract description 16
- 238000010248 power generation Methods 0.000 claims abstract description 219
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims description 72
- 238000000034 method Methods 0.000 claims description 29
- 238000004519 manufacturing process Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 13
- 239000000428 dust Substances 0.000 claims description 6
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 claims description 4
- 230000005945 translocation Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 2
- 230000001932 seasonal effect Effects 0.000 claims description 2
- 206010010947 Coordination abnormal Diseases 0.000 claims 1
- 238000012098 association analyses Methods 0.000 abstract 1
- 238000010276 construction Methods 0.000 abstract 1
- 230000003203 everyday effect Effects 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 9
- 230000005856 abnormality Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 101100182247 Caenorhabditis elegans lat-1 gene Proteins 0.000 description 2
- 101100182248 Caenorhabditis elegans lat-2 gene Proteins 0.000 description 2
- 101150061388 LON1 gene Proteins 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- -1 long2 Proteins 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001931 thermography Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Remote Sensing (AREA)
- Photovoltaic Devices (AREA)
Abstract
本发明公开了一种基于实际距离建立集群分析的光伏电站异常检测方法,属于数据异常检测技术领域,该方法如下:获取分布式光伏发电客户的用户信息和历史发电数据,根据用户信息和历史发电数据进行关联分析,得到每个光伏发电客户每日每时段的发电数据表;将分布式光伏发电客户的地址信息转换为空间经纬度数据,通过构建经纬度坐标转换为实际距离函数,计算每一个光伏发电客户与其他所有光伏发电客户之间的实际距离,设定一个实际距离的阈值半径,在阈值范围内的其他光伏发电客户与该用户视为一个集群,通过对该集群进行发电特性分析,进而分析分布式光伏电站是否异常发电。
Description
技术领域
本发明属于数据异常检测技术领域,涉及一种利用分布式光伏电站间实际距离建立集群分析的光伏异常发电检测方法。
背景技术
在当前的环保压力及能源需求不断增长的背景之下,光伏能源被认为是21世纪最清洁的能源,推动太阳能等其他新能源的发展已然成为促进节能减排的重要措施之一。截止到2022年底,全球累计光伏装机容量已超过1TW,国内累计装机容量已达到392.04GW,在太阳能光伏发电极其迅速的发展以及各地居民高涨的安装并网积极性背景下,对区域内分布式光伏电源的异常状态监测,其结果对当地电力公司进行电力调度规划增加电网运行可靠性,政府部门倡导节能减排,以及能源部门制定能源发展规划具有重要的参考意义。现有的分布式光伏发电异常检测方法更多局限于硬件的更新迭代,比如提高光伏器件性能指标,使用无人机热成像检测等,此类方法检测成本高、普适性不强。此外,还有一种分析方法是将光伏发电客户装机容量的大小分类区分,该类方法空间范围太大以至于忽略了天气因素的影响,在影响光伏板性能的天气参数中,太阳辐照度被认为是最重要的参数,此外诸如云量、气温、空气湿度、风速和风向等因素也被认为是预测光伏电站发电效率的决定因素。上述两类方法操作相对复杂且依赖于特定的条件才能对异常状态进行检测,其运维成本高、操作复杂、普适性低,不适合大面积大幅度的推广使用。
发明内容
本发明要解决的技术问题是提供一种基于实际距离建立集群分析的光伏电站异常检测方法,该方法通过设定一个阈值半径,在阈值范围内的其他光伏发电客户与预先选定的光伏发电客户视为一个集群,通过对该集群进行发电特性分析,进而分析分布式光伏电站是否异常发电,忽视天气因素所带来的发电特性影响,实施本发明,能够检测分布式光伏电站的异常状态,解决发现光伏异常状态滞后性的问题,精准提供异常发电客户地址信息,定点运维,为分布式光伏电站运维提供一种高效率、快速解决的方法。
为了解决上述技术问题,本发明的一种基于实际距离建立集群分析的光伏电站异常检测方法包括:
获取分布式光伏发电客户的数据信息,该数据信息包括客户的户号、户名、地址信息、装机容量、并网时间、并网电压信息、客户所属台区、客户所属线路、上级线路和变压器信息;
获取分布式光伏发电客户的历史发电数据,该数据包括户名、户号、采集点状态、电表资产号、电表通信地址、电表条形码、采集日期、时间点和电表示数;
利用分布式光伏发电客户的数据信息和分布式光伏发电客户的历史发电数据信息根据“户号”字段表关联;根据分布式光伏发电客户的地址信息,将地址信息转换为经纬度,通过构建经纬度坐标转换为实际距离函数,计算每一个光伏发电客户与其他所有光伏发电客户之间的实际距离,设定一个实际距离的阈值半径,在阈值半径范围内的其他光伏发电客户与选定的光伏发电客户视为一个集群,通过对该集群进行发电特性分析,进而分析分布式光伏电站是否异常发电;
根据分布式光伏发电客户的历史发电数据计算选定的光伏发电客户的日发电量、月发电量和年发电量信息。通过发电量数据、装机容量、并网时间的信息,根据光伏日发电量计算公式进行计算并整理,计算集群内发电客户每天的判断因子,进而进行异常值检测,最后根据出现异常的频次,得到异常的发电客户;
所述根据分布式光伏发电客户的地址信息,将地址信息转换为经纬度进而转换为实际距离的方法如下:
在python中定义Trans_location(location_list,key)函数,该函数的作用是将地址信息转换为经纬度,其中参数location_list所传入的变量为所需要变换地址的序列,参数key所传入的变量是基于高德地图所申请的使用该项服务内地理编码接口功能的秘钥。首先,第一步采用for循环将location_list中的地址链接成地理编码接口功能所能识别的格式,即将每个地址地址之间采用“—”符号连接,组成新的字符串变量,命名为New_location;第二步输入地理编码查询所需要的url以及定义地理编码查询模块的参数设置,其中url为高德地图API所提供的‘http://restapi.amap.com/v3/geocode/geo?’,查询返回的形式为json,支持多查询参数batch设置为True;第三步提交请求并接收返回值,运行指令为:response=request.get(),answer=response.json();第四步解析内容,首先定义一个存放结果的序列Resultlist,执行以下命令tmp=answer[‘geocode’]获取所有结果的坐标点,进而得到所有地址信息的经纬度坐标。在python中定义Real_distance(location_1,location_2)函数,该函数的作用是将各个点经纬度进而转换为任意两点间的实际距离,其中参数location_1所传入的变量是上述地址经纬度数据中的一组经纬度数据,参数location_2所传入的变量是上述地址经纬度数据中的另一组经纬度数据。首先,第一步分别提取两个位置的经度和纬度信息,传入参数变量lon1,long2,lat1,lat2,其中lon=long2-long1,lat=lat2-lat1;第二步,采用python中自带函数map(radians,x),将经纬度转换为弧度,采用球面两点计算公式进而计算上述两个点距离,该距离根据下式确定:
其中,dij代表两点之间的距离,r*1000代表地球半径,其值为6371km。
最后,使用python中的pdist函数和squarform函数将上述距离转换为矩阵形式,其中pdist函数是一个计算距离的函数,得到一个对称矩阵,能够成对观测两点之间的欧几里德距离,其对角线为0;squarform函数是对pdist函数返回的矩阵进行上三角处理,将距离向量转换为矩阵。
进一步,本发明通过设定一个阈值半径,将经纬度坐标点视为圆心,以此阈值半径内的圆形范围内的所有发电客户视为一个发电客户集群,在此集群内开展发电特性分析,进而判断异常发电客户。在本发明中,该阈值半径设置为λ,寻找阈值半径范围内的发电客户点的方法如下:
上述已知任意两点间的实际距离,其数据以矩阵的形式存放在数组之中,通过for循环遍历每个点与其他所有点的距离,当距离小于λ时,将该点的索引取出放入新的数组,并且定位至该点的经纬度坐标以及地址信息,形成一个新的Dataframe,该Dataframe的列名索引有:地址信息、经纬度、索引点、最近的索引点和距离;此外,假设在λ的范围之内,集群内的发电客户数量过少,那么会导致检测结果存在误差,因此针对此类误差,本发明设定了最小集群内发电客户数量γ,若集群内发电客户数量小于γ,阈值半径设置λ所检索的发电客户群体不足以精准检测异常发电客户,进而采用距离排序法则进行集群检测,距离排序法则即根据其他所有客户至中心客户的距离进行排序操作,选取该排序数组内小于kλ的所有发电客户点,其中k代表距离系数,1<k≤p,p值代表最大范围的集群特性系数,若该距离系数k超过p,那么范围外的发电客户即不再拥有集群内的共有特征。假如在pλ的有效范围内该集群发电客户数量仍小于γ,那么根据发电客户的历史发电月数据以及年数据,进行统计异常值。若该有效范围内集群客户数量大于等于γ,将该有效范围内的所有发电客户视为一个集群进行异常发电分析。
进一步,进行有效集群内异常发电客户的检测方法如下:
首先,假设在该集群内利用上述寻找阈值半径范围内的发电客户点的方法,确定了该集群内有m个客户,其装机容量分别为V1,V2,V3...Vm,考虑到光伏组件存在发电功率随年限的使用所损耗的问题,本发明添加了一个年限衰减因子η表达光伏器件的损耗,光伏的日发电量计算公式如下:
Ei=Vi*S*C*(1-η)n
其中,Ei代表光伏的日发电量,Vi代表光伏系统的装机容量,S代表当天的有效日照时长,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染等因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表系统的使用年限。
由于在同一集群内的光伏发电客户,其当天的有效日照时长S的差异对于发电量的影响可以忽略不计,因此上述公式可以简化为:
Earea=Vi*C*(1-η)n
进一步,从上述公式可以得出,同一集群内的发电量影响因素与装机容量以及系统使用年限和修正系数有关,进而根据发电客户的装机容量、并网时间、发电数据,进一步的计算该发电客户是否存在异常发电行为。其计算方法如下:首先根据发电客户的装机容量、并网时间、修正系数和年限衰减因子计算理论Earea,将该理论值与实际日发电量Ei相比得到:
Earea/Ei=1/S
其中定义1/S为T,描述为判断因子;即T=1/S。
通过对集群内每天的判断因子进行异常值分析,进而得到每日的异常客户信息表,该异常值分析方法采用3σ异常值检测方法,该方法是假设检测数据只包含随机误差,对其计算后得到标准偏差,按照一定的概率确定一个区间,该区间为(μ-3σ,μ+3σ),其中μ为集群内发电客户判断因子的均值,σ为集群内发电客户判断因子的标准差,但凡超过这个区间的误差就不属于随机误差,而判定为粗大误差。该异常值分析包括两部分,一部分为客户组件故障异常发电分析,另一部分为发电客户疑似增容异常发电分析,若该判断因子相较于其他发电客户的判断因子较小,那么该发电客户存在增容的可能,若该判断因子相较于其他发电客户的判断因子较大,那么该发电客户存在组件故障异常的可能。进而根据信息表进一步通过异常客户出现频次确定存在异常发电的客户,最后将该发电客户点的地理位置信息进行精准定位处理,生成统计信息定点运维。
本发明的有益效果:
现有的分布式光伏发电异常检测方法更多局限于硬件的更新迭代或者忽略天气因素所带来的影响,无法针对特定区域的分布式光伏电站进行精准化分析。当天气因素处于随机变化时无法实时的判别发电客户的异常;当发电客户私自增容时更无法获取相关数据进行判别。本发明所提出的基于实际距离建立集群分析的光伏电站异常检测方法,通过设定一个阈值半径,在阈值半径范围内的其他光伏发电客户与该选定的光伏发电客户视为一个集群,通过对该集群进行发电特性分析,进而分析分布式光伏电站是否异常发电,本发明可以不再关注于集群内部的天气因素变化所带来的影响,更多聚焦于发电特性数据,根据发电数据通过推导得到判断因子以及利用采用3σ异常值检测方法检测异常值,判定发电客户属于何种异常类别。通过深层挖掘光伏发电数据,能够有效节省现场故障监测设备费用以及相对应的人工费用;此外,通过远程开展光伏故障监测工作,可以显著提高分布式光伏电站的运维质量,精准运维,高质量提升分布式光伏的发电效率,进而提高新能源发电量,减少碳排放以及煤炭资源消耗,助力双碳目标的实现。
附图说明
图1为本发明所提供的一种基于实际距离建立集群分析的光伏电站异常检测方法流程图;
图2为本发明所提供的一种申请API秘钥Key,根据客户地址信息转换为经纬度的方法流程图;
图3为本发明中将地址信息转换为经纬度信息的可视化展示效果图。
具体实施方式
为使得本发明技术方案以及优点更加的清晰,下面将结合本发明实例中的附图,对本发明的技术方案进行完整地、清晰地描述。需指出的是,以下若有未特别详细说明之过程或符号,均是本领域技术人员可参照现有技术实现的,本发明的关键在于对分布式光伏电站异常发电检测提出的技术方案,设计软件或编程内容的,均是本领域技术人员可参照现有实现的。
图1为本发明所提供的一种基于实际距离建立集群分析的光伏电站异常检测方法流程图,所述方法包含以下步骤:
步骤一:获取分布式光伏发电客户发电数据;
步骤二:申请API秘钥Key,根据客户地址信息转换为经纬度;
步骤三:计算任意两点的距离,设立阈值半径建立集群;
步骤四:根据判断因子检测异常值判定类型,定位异常发电客户地址。
所述步骤一中的获取分布式光伏发电客户发电数据具体步骤如下:
该分布式光伏发电客户发电数据包括两部分,一部分为获取分布式发电客户的数据信息,该数据信息包括客户的户号、户名、地址信息、装机容量、并网时间、并网电压信息、客户所属台区、客户所属线路、上级线路和变压器信息;另一部分为获取分布式发电客户的历史发电数据,该数据包括户名、户号、采集点状态、电表资产号、电表通信地址、电表条形码、采集日期、时间点和电表示数;可以理解的是,分布式发电客户的数据信息用来确定客户的基本信息,每个发电客户在数据表占据一个观察行多个观察列;分布式发电客户的历史发电数据用来监测客户发电信息以及实时观测客户的发电量,每个客户的数据在数据表中占据多个观察行、列。
所述步骤二中的申请API秘钥Key,根据客户地址信息转换为经纬度具体步骤如下:
图2为本发明所提供的一种申请API秘钥Key,根据客户地址信息转换为经纬度的方法流程图;图3为本发明中将地址信息转换为经纬度信息的可视化展示效果图。首先需要注册一个高德地图API账号,在应用与服务中选择创建新应用并填写相应的应用信息,进而申请Web服务的秘钥Key。需要说明的是,该Key可以支持服务内地理编码接口功能的使用。通过以上步骤,即可获取到转换地址信息为经纬度的秘钥Key。进一步,通过步骤一所获取到的发电客户地址信息,定义Trans_location(location_list,key)函数,该函数的作用是将地址信息转换为经纬度,其中参数location_list所传入的变量为所需要变换地址的序列,参数key所传入的变量是所获取到的秘钥Key。首先,第一步采用for循环将location_list中的地址链接成地理编码接口功能所能识别的格式,即将每个地址地址之间采用“—”符号连接,组成新的字符串变量,命名为New_location;第二步输入地理编码查询所需要的url以及定义地理编码查询模块的参数设置,其中url为高德地图API所提供的‘http://restapi.amap.com/v3/geocode/geo?’,查询返回的形式为json,支持多查询参数batch设置为True;第三步提交请求并接收返回值,运行指令为:response=request.get(),answer=response.json();第四步解析内容,首先定义一个存放结果的序列Resultlist,执行以下命令tmp=answer[‘geocode’]获取所有结果的坐标点,进而得到所有地址信息的经纬度坐标。
所述步骤三中的计算任意两点的距离的具体步骤如下:
为本发明中通过定义使用Real_distance、pdist和squarform函数后,计算得到的任意两个发电客户经纬度点的实际距离矩阵。首先,在python中定义Real_distance(location_1,location_2)函数,该函数的作用是将各个点经纬度进而转换为任意两点间的实际距离,其中参数location_1所传入的变量是上述地址经纬度数据中的一组经纬度数据,参数location_2所传入的变量是上述地址经纬度数据中的另一组经纬度数据。第一步分别提取两个位置的经度和纬度信息,传入参数变量lon1,long2,lat1,lat2,其中lon=long2-long1,lat=lat2-lat1;第二步,采用python中自带函数map(radians,x)函数,将经纬度转换为弧度,采用球面两点计算公式进而计算上述两个点距离,该距离根据下式确定:
其中,dij代表两点之间的距离,r*1000代表地球半径,其值为6371km。
最后,使用python中的pdist和squarform函数将上述距离转换为矩阵形式,其中pdist函数是一个计算距离的函数,得到一个对称矩阵,可以成对观测两点之间的欧几里德距离,其对角线为0;squarform函数是对pdist函数返回的矩阵进行上三角处理,将距离向量转换为矩阵。
所述步骤三中的设立阈值半径建立集群的具体步骤如下:
本发明设定一个阈值半径的具体方法如下,将经纬度坐标点视为圆心,以此阈值半径内的圆形范围内的所有发电客户视为一个发电客户集群,在此集群内开展发电特性分析,进而判断异常发电客户。假设该阈值半径设置为λ,寻找半径范围内的发电客户点的方法如下:
上述已知任意两点间的实际距离,其数据以矩阵的形式存放在数组之中,通过for循环遍历遍历每个点与其他所有点的距离,当距离小于λ时,将该点的索引取出放入新的数组,并且定位至该点的经纬度坐标以及地址信息,形成一个新的Dataframe,该Dataframe的列名索引有:地址信息、经纬度、索引点、最近的索引点和距离;此外,假设在λ的范围之内,集群内的发电客户数量过少,那么会导致检测结果存在误差,因此针对此类误差,本发明设定了最小集群内发电客户数量γ,若集群内发电客户数量小于γ,阈值半径设置λ所检索的发电客户群体不足以精准检测异常发电客户,进而采用距离排序法则进行集群检测,距离排序法则即根据其他所有客户至中心客户的距离进行排序操作,选取该排序数组内小于kλ的所有发电客户点,其中k代表距离系数,1<k≤p,p值代表最大范围的集群特性系数,若该距离系数k超过p,那么范围外的发电客户即不再拥有集群内的共有特征。假如在pλ的有效范围内该集群发电客户数量仍小于γ,那么根据发电客户的历史发电月数据以及年数据,进行统计异常值。若该有效范围内集群客户数量大于等于γ,将该范围内的所有发电客户视为一个集群进行异常发电分析。
需要说明的是,该k值的确立方法是通过设定循环条件,在小于p的范围内,设定循环步长,其循环终止条件为在有效范围区间内,该集群内的发电客户数量大于等于γ;若在循环内无法保证发电客户数量大于等于γ,那么通过设定季节影响因子SE以及地区平均水平日照值ME来计算异常发电客户,其具体实施方式如下:
光伏的发电量是受该地区日照水平强度以及季节特性所影响的,若集群内无足够的客户数量不足以支撑分析异常客户,那么可以根据上述两个条件进行初步确定异常发电客户;首先定义季节影响因子SE,根据以下公式计算月发电量:
Ey=Vy*SE*C*(1-η)n
其中,Ey代表光伏的月发电量,Vy代表客户数量少于γ的集群内光伏系统的装机容量,SE代表当下季节内有效日照时长的参考值,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染等因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表系统的使用年限。
通过以上公式可以计算在当下月份光伏发电的参考值,根据此参考值与实际发电量进行对比比较,如下式所示:
其中,CustomerType代表客户是否为异常状态,1代表客户客户非异常发电,0代表客户客户异常发电,当实际月发电量Em在由SE影响下的月发电量Ey的有效区间(ωEy,δEy)内则代表非异常发电;当实际月发电量Em不在由SE影响下的月发电量Ey的有效区间(ωEy,δEy)内则代表异常发电;此外ω,δ的取值范围为:0<ω<1,δ>1。
其次,定义地区平均水平日照值ME,根据以下公式计算年发电量:
Eu=Vi*ME*C*(1-η)n
其中,Eu代表光伏的年发电量,Vi代表光伏系统的装机容量,ME代表当下地区平均水平日照值,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染等因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表系统的使用年限。
通过以上公式可以计算在当下年份光伏发电的参考值,根据此参考值与实际发电量进行对比比较,如下式所示:
其中,CustomerType代表客户是否为异常状态,1代表客户客户非异常发电,0代表客户客户异常发电,当实际年发电量Et在由ME影响下的年发电量Eu的有效区间(ωEu,δEu)内则代表非异常发电;当实际年发电量Et不在由ME影响下的年发电量Eu的有效区间(ωEu,δEu)内则代表异常发电;此外ω,δ的取值范围为:0<ω<1,δ>1。
所述步骤四中的根据判断因子检测异常值判定类型,定位异常客户地址具体步骤如下:
首先,假设在该集群内利用上述寻找半径范围内的发电客户点的方法,确定了该集群内有m个客户,其装机容量分别为V1,V2,V3...Vm,考虑到光伏组件存在发电功率随年限的使用所损耗的问题,本方法添加了一个年限衰减因子η表达光伏器件的损耗,光伏的日发电量计算公式如下:
Ei=Vi*S*C*(1-η)n
其中,Ei代表光伏的日发电量,Vi代表光伏系统的装机容量,S代表当天的有效日照时长,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染等因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表系统的使用年限。
由于在同一集群内的光伏客户,其有效日照时长S的差异对于发电量的影响可以忽略不计,因此上述公式可以简化为:
Earea=Vi*C*(1-η)n
进一步,从上述公式可以得出,同一集群内的发电量影响因素与装机容量以及系统使用年限和修正系数有关,进而根据发电客户的装机容量、并网时间,发电数据,进一步的计算该发电客户是否存在异常发电行为。其计算方法如下:首先根据发电客户的装机容量、并网时间、修正系数和年限衰减因子计算理论Earea,将该理论值与实际发电Ei相比得到:
Earea/Ei=1/S
其中定义1/S为T,描述为判断因子;即:T=1/S。
正常发电客户的判断因子由于C的浮动特点,其对应的数值相对稳定。异常发电客户由于组件故障或者私自增容等问题的存在其判断因子T会表现异常,具体表现方式为:若由于因组件故障等问题所产生的异常发电,那么在实际日发电量Ei的数值上表现为Ei数值偏低,进而当计算判断因子时,由于分母过小则导致了整体的判断因子偏大;若由于私自增容等问题所产生的异常发电,那么在发电客户安装容量Vi的树枝上表现为Vi数值偏高,进而在计算Ei时实际日发电量Ei的数值上表现为Ei数值偏高,进而当计算判断因子时,由于分母过大则导致了整体的判断因子偏小。
通过对集群内每天的判断因子进行异常值分析,进而得到每日的异常客户信息表,该异常值分析方法采用3σ异常值检测方法,该方法是假设检测数据只包含随机误差,对其计算后得到标准偏差,按照一定的概率确定一个区间,该区间为(μ-3σ,μ+3σ),其中μ为集群内发电客户判断因子的均值,σ为集群内发电客户判断因子的标准差,但凡超过这个区间的误差就不属于随机误差,而判定为粗大误差。该异常值分析包括两部分,一部分为客户组件故障异常发电分析,另一部分为发电客户疑似增容异常发电分析,若该判断因子相较于其他发电客户的判断因子较小,那么该发电客户存在增容的可能,若该判断因子相较于其他发电客户的判断因子较大,那么该发电客户存在组件故障异常的可能。进而根据信息表进一步通过异常客户出现频次确定存在异常发电的客户,最后将该客户点的地理位置信息进行精准定位处理,生成统计信息定点运维。
Claims (7)
1.一种基于实际距离建立集群分析的光伏电站异常检测方法,其特征在于,该方法包括:
获取分布式光伏发电客户发电数据,所述分布式光伏发电客户发电数据包括分布式光伏发电客户的用户信息和历史发电数据;
将分布式光伏发电客户的地址信息转换为空间经纬度数据,通过构建经纬度坐标转换为实际距离函数,计算每一个光伏发电客户与其他所有光伏发电客户之间的实际距离,设定一个实际距离的阈值半径,在阈值半径范围内的其他光伏发电客户与选定的光伏发电客户视为一个集群;
通过设立季节影响因子SE以及地区平均水平日照值ME进行集群内的发电客户异常分析,构建判断因子T检测异常值,分析分布式光伏电站是否异常发电并判定异常类型,定位异常发电客户位置;
所述判断因子T的确定过程如下:
Earea/Ei=1/S
其中,Earea为集群内光伏发电客户发电特性值,Ei为光伏的日发电量,1/S为判断因子,即判断因子T=1/S;
Ei=Vi*S*C*(1-η)n
其中,Ei代表光伏的日发电量,Vi代表光伏系统的装机容量,S代表当天的有效日照时长,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表光伏系统的使用年限。
2.根据权利要求1所述的基于实际距离建立集群分析的光伏电站异常检测方法,其特征在于:所述分布式光伏发电客户的用户信息包括客户的户号、户名、地址信息、装机容量、并网时间、并网电压信息、用户所属台区、用户所述线路、上级线路和变压器信息;所述分布式光伏发电客户历史发电数据包括户名、户号、采集点状态、电表资产号、电表通信地址、电表条形码、采集日期、时间点和电表示数。
3.根据权利要求1所述的基于实际距离建立集群分析的光伏电站异常检测方法,其特征在于:将分布式光伏发电客户的地址信息转换为空间经纬度数据,通过构建经纬度坐标转换为实际距离函数的方法如下:
通过定义Trans_location(location_list,key)函数,在python中定义Real_distance(location_1,location_2)函数,定义Trans_location(location_list,key)函数用于实现将地址信息转换为经纬度,定义Real_distance(location_1,location_2)用于实现将各个点经纬度转换为任意两点间的实际距离,并将距离矩阵存至数组矩阵中。
4.根据权利要求1所述的基于实际距离建立集群分析的光伏电站异常检测方法,其特征在于:设置阈值半径建立集群的过程如下:通过构建经纬度坐标转换为实际距离,即已知任意两点间的实际距离,其数据以矩阵的形式存放在数组矩阵之中,通过循环遍历每个点与其他所有点的距离,λ为阈值半径,当距离小于λ时,将该点的索引取出放入新的数组,并且定位至该点的经纬度坐标以及地址信息,形成一个新的Dataframe,该Dataframe的列名索引有:地址信息、经纬度、索引点、最近的索引点和距离。
5.根据权利要求1或4所述的基于实际距离建立集群分析的光伏电站异常检测方法,其特征在于:当集群内光伏发电客户数量不足以支撑异常检测时,采用距离排序法则进行集群检测,根据其他所有光伏发电客户至中心光伏发电客户的距离进行排序操作,选取排序数组内小于kλ的所有光伏发电客户点,其中k代表距离系数,1<k≤p,p值代表最大范围的集群特性系数,若该距离系数k超过p,则最大范围外的光伏发电客户即不再拥有集群内的共有特征;若在pλ的有效范围内该集群光伏发电客户数量仍小于γ,则根据发电客户的历史发电月数据以及年数据,进行统计异常值,γ为最小集群内发电客户数量;λ为阈值半径。
6.根据权利要求1所述的基于实际距离建立集群分析的光伏电站异常检测方法,其特征在于:其特征在于:定义季节影响因子SE和区平均水平日照值ME,根据以下公式计算月发电量:
Ey=Vy*SE*C*(1-η)n
其中,Ey代表光伏的月发电量,Vy代表光伏发电客户数量少于γ的集群内光伏系统的装机容量,SE代表当下季节内有效日照时长的参考值,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表系统的使用年限;
通过Ey=Vy*SE*C*(1-η)n计算在当下月份光伏发电的参考值,根据此参考值与实际发电量进行对比比较,如下式所示:
其中,CustomerType代表用户是否为异常状态,1代表用户客户非异常发电,0代表用户客户异常发电,当实际月发电量Em在由SE影响下的月发电量Ey的有效区间(ωEy,δEy)内则代表非异常发电;当实际月发电量Em不在由SE影响下的月发电量Ey的有效区间(ωEy,δEy)内则代表异常发电;
根据地区平均水平日照值ME,采用以下公式计算年发电量:
Eu=Vi*ME*C*(1-η)n
其中,Eu代表光伏的年发电量,Vi代表光伏系统的装机容量,ME代表当下地区平均水平日照值,C代表修正系数,该修正系数考虑光伏组件类型、方针倾角、方位角和逆变器效率以及表面灰尘污染因素,表示在一定范围内所能容忍的发电量误差;η代表光伏的年限衰减因子,n代表系统的使用年限。
通过Eu=Vi*ME*C*(1-η)n计算在当下年份光伏发电的参考值,根据此参考值与实际发电量进行对比比较,如下式所示:
其中,CustomerType代表用户是否为异常状态,1代表用户客户非异常发电,0代表用户客户异常发电,当实际年发电量Et在由ME影响下的年发电量Eu的有效区间(ωEu,δEu)内则代表非异常发电;当实际年发电量Et不在由ME影响下的年发电量Eu的有效区间(ωEu,δEu)内则代表异常发电。
7.根据权利要求6所述的基于实际距离建立集群分析的分布式光伏电站异常发电检测方法,其特征在于:
在实际日发电量Ei的数值上,表现为Ei数值偏低,进而当计算判断因子T时,由于分母过小则导致了整体的判断因子偏大;若由于私自增容等问题所产生的异常发电,那么在光伏系统的装机容量Vi的树枝上表现为Vi数值偏高,进而在计算Ei时光伏的实际日发电量Ei的数值上,表现为Ei数值偏高,进而当计算判断因子时,由于分母过大则导致了整体的判断因子偏小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310666750.1A CN116861348A (zh) | 2023-06-07 | 2023-06-07 | 一种基于实际距离建立集群分析的光伏电站异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310666750.1A CN116861348A (zh) | 2023-06-07 | 2023-06-07 | 一种基于实际距离建立集群分析的光伏电站异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116861348A true CN116861348A (zh) | 2023-10-10 |
Family
ID=88225802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310666750.1A Withdrawn CN116861348A (zh) | 2023-06-07 | 2023-06-07 | 一种基于实际距离建立集群分析的光伏电站异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116861348A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117252448A (zh) * | 2023-11-20 | 2023-12-19 | 华东交通大学 | 基于时空特征提取及二次分解聚合的风电功率预测方法 |
CN118071178A (zh) * | 2024-04-18 | 2024-05-24 | 浙江正泰智维能源服务有限公司 | 一种用于评估电站异常状态的方法、装置、电子设备及存储介质 |
CN118137673A (zh) * | 2024-04-30 | 2024-06-04 | 华能澜沧江新能源有限公司 | 一种分布式光伏监测系统及其监测方法 |
-
2023
- 2023-06-07 CN CN202310666750.1A patent/CN116861348A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117252448A (zh) * | 2023-11-20 | 2023-12-19 | 华东交通大学 | 基于时空特征提取及二次分解聚合的风电功率预测方法 |
CN117252448B (zh) * | 2023-11-20 | 2024-02-20 | 华东交通大学 | 基于时空特征提取及二次分解聚合的风电功率预测方法 |
CN118071178A (zh) * | 2024-04-18 | 2024-05-24 | 浙江正泰智维能源服务有限公司 | 一种用于评估电站异常状态的方法、装置、电子设备及存储介质 |
CN118137673A (zh) * | 2024-04-30 | 2024-06-04 | 华能澜沧江新能源有限公司 | 一种分布式光伏监测系统及其监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116861348A (zh) | 一种基于实际距离建立集群分析的光伏电站异常检测方法 | |
CN111614316B (zh) | 光伏系统发电状态监测方法及其装置 | |
CN110097220B (zh) | 一种风力发电月度电量预测方法 | |
CN110264002B (zh) | 基于聚类分析的风电场微观选址方案评价方法 | |
CN110009385B (zh) | 一种基于多因素映射的光伏发电用户群划分方法 | |
Weekes et al. | Long-term wind resource assessment for small and medium-scale turbines using operational forecast data and measure–correlate–predict | |
CN115660367A (zh) | 一种基于gis技术的光伏发电站前期宏观选址方法 | |
Almutairi | Determining the appropriate location for renewable hydrogen development using multi‐criteria decision‐making approaches | |
Satria et al. | Sensitivity of solar panel energy conversion at sunrise and sunset on three weather fluctuations in equatorial climate. | |
CN116800172B (zh) | 一种光电转换方法及储能系统 | |
CN111478374B (zh) | 风光出力特性概率分布与预测的动态评估方法 | |
Ramirez Camargo et al. | Spatiotemporal modeling for assessing complementarity of renewable energy sources in distributed energy systems | |
CN108920790A (zh) | 一种基于历史数据的公共建筑用电模式识别模型建立方法 | |
CN112085350A (zh) | 一种大型光伏电站中光伏阵列状态的评估方法 | |
KR20210115911A (ko) | 태양광 출력 예측 장치 및 그 방법 | |
CN116703210A (zh) | 可再生能源利用方法、装置、设备及存储介质 | |
El-Bshah et al. | Resource assessment of wind energy potential of Mokha in Yemen with Weibull speed | |
Li et al. | Evaluation index system for photovoltaic systems statistical characteristics under hazy weather conditions in central China | |
CN112561181A (zh) | 一种基于Unet网络和地基云图的光伏发电预测系统 | |
CN110752956A (zh) | 一种基于可信节点的分布式光伏采集布点及估计优化方法 | |
Mengen et al. | Solar Irradiance Measuring sites in Bangladesh | |
Chicco et al. | Knowledge Discovery from the Statistical Analysis of On-Site Photovoltaic System Data | |
Baquiran et al. | Mapping of Solar Power Potential Structures Using Geographic Information System | |
KR102513943B1 (ko) | 가로등 장착형 태양광 발전 예측 시스템 및 그 서비스 방법 | |
CN114676893B (zh) | 一种基于最优图结构的光伏电站太阳辐照度短期预测方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20231010 |