CN112465378A - 基于电力大数据挖掘的住房空置自适应研判方法及装置 - Google Patents
基于电力大数据挖掘的住房空置自适应研判方法及装置 Download PDFInfo
- Publication number
- CN112465378A CN112465378A CN202011430067.0A CN202011430067A CN112465378A CN 112465378 A CN112465378 A CN 112465378A CN 202011430067 A CN202011430067 A CN 202011430067A CN 112465378 A CN112465378 A CN 112465378A
- Authority
- CN
- China
- Prior art keywords
- data
- electric quantity
- vacant
- residential
- electricity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000007418 data mining Methods 0.000 title claims abstract description 19
- 230000005611 electricity Effects 0.000 claims abstract description 123
- 238000011156 evaluation Methods 0.000 claims abstract description 19
- 238000004140 cleaning Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 25
- 230000005612 types of electricity Effects 0.000 claims description 16
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000008014 freezing Effects 0.000 claims description 6
- 238000007710 freezing Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims description 2
- 238000003064 k means clustering Methods 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于电力大数据挖掘的住房空置自适应研判方法及装置,该方法包括:步骤1:获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;步骤2:根据居民用户历史用电曲线,计算居民用户的基础电量因子;步骤3:根据步骤2得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民住房空置状况的判据模型;步骤4:根据判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;步骤5:建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民住房空置状况的可信度进行分类评价,进而指导衡量房地产风险。本发明提高了住房空置率的准确度。
Description
技术领域
本发明涉及电力大数据与住房空置分析技术领域,具体涉及基于电力大数据挖掘的住房空置自适应研判方法及装置。
背景技术
住房空置状况(住房空置率)是衡量房地产风险的重要指标,是国家采取宏观调控措施的重要数据支撑。很多国家都会对住房空置情况进行统计,当前各国空置住房统计中,绝大多数采用的是抽样调查,由此就会产生抽样误差和非抽样误差。如美国人口统计局更是对美国每年的住房空置率进行评估,美国利用90%的置信区间和0.1的显著性水平来判断住房空置率数据的可靠性。目前,国际上对住房空置率的统计方法一般有以下几种,一是采取电话访问和现场拜访相结合的方法,这种方法通过抽样调查的形式掌握住房空置情况,工作量大,且受影响的因素较多。二是通过水、电等消费记录进行推算,例如中国台湾地区,在非人口普查年份通过查找用电不足的住宅数目判定住宅空置率,作为参考。
随着国家电网公司泛在物联网的建设,公司建成了以一体化云平台为基础支撑的数据中台,以公司全业务、全量、全类型数据的汇聚为基础,以统一数据模型为标准,通过数据服务和丰富的数据标签,为大数据分析提供敏捷的统一数据服务。大量用电数据和用电档案的汇集,为基于电力大数据实现外部服务提供了重要的基础。然而,基于电力大数据的大数据挖掘技术在住房空置等其他领域的探索尚处于初级阶段,相关的问题分析方法仍有待进一步研究。
带有时序信息的用电数据是用户一系列用电行为的叠加,构成了用户的负荷用电曲线,反映了该时段内用户的生活用电情况。基于该曲线,可以有效挖掘和掌握用户状况、住房空置状况等。当前对用户用电数据的使用主要集中在用户用电行为分析和异常检测,由于缺乏标记样本,目前用户行为分析重点在基于负荷曲线形态聚类,同时通过特征提取及聚类技术对不同形态的负荷曲线进行分析,进而对用户的用电行为进行挖掘。
在基于电力大数据的住宅空置情况分析方面,浙江电力公司杨桥桥等人提出了基于电力大数据的住宅空置情况分析方法,通过监测零电量用户数量计算住房空置率。国网绵阳公司胡洋同样基于零电量(月度)判据对住房空置的变化趋势进行分析。基于电量为零判据判断住房空置的方法简单易实现,可以准确判别出总表关停的空置住房。但上述判据空置阈值的选取过于粗略,缺乏支撑,对于家中未断电的空置住房无法辨识,无法根据居民自身的用电状况对房屋的空置情况进行判别,且结果准确性不高。
发明内容
本发明所要解决的技术问题是现有住房空置判定方法“一刀切”,判据空置阈值的选取过于粗略,缺乏支撑,对于家中未断电的空置住房无法辨识,无法根据居民自身的用电状况对房屋的空置情况进行判别,且结果准确性不高;不能根据用户的用电水平、用电状况自适应给出空置住房的电量阈值,实现空置住房的准确判定。
本发明目的在于提供基于电力大数据挖掘的住房空置自适应研判方法及装置,基于电力大数据挖掘基础电量因子,针对电力数据在住房管控领域的应用场景,提出居民基础电量因子的挖掘方法,建立住房空置监测的准确判据,实现对居民住宅空置状况的准确的精准评估。
本发明通过下述技术方案实现:
一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,该方法包括以下步骤:
步骤1:获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;
步骤2:根据步骤1获取的居民用户历史用电曲线,结合居民用户历史用电曲线的时间尺度,计算居民用户的基础电量因子;
步骤3:根据步骤2得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民住房空置状况的判据模型;
步骤4:根据步骤3建立的居民住房空置状况的判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;
步骤5:建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民住房空置状况的可信度进行分类评价,进而指导衡量房地产风险。
工作原理是:将用户用电数据用于空置监测,为有关政府部门提供管控效果反馈信息和决策支持是对“枢纽型”、“平台型”、“共享型”电网的积极探索。一方面,有效的促进电网数据的经济效益挖掘,有利于国家电网公司战略转型策略的实施;另一方面,可有效提升住房空置监测的效率和准确性,实现跨专业、跨行业的数据共享、技术支撑和互利共赢。然而,由于不同的居民用电习惯存在差异,部分空置住宅并断电,同时存在断电住宅电表跳变等不确定因素,导致空置住房用电特性有所差异。传统的零度判定法存在“一刀切”的情况,无法准确实现空置住房的准确判定。
因此,本发明考虑研究基于电力数据深度挖掘的住房空置状况分析方法,本发明为一种能够根据居民用电状态实现空置阈值自适应判定的方法,本发明充分挖掘居民用户用电信息与住房空置之间的关联关系,实现空置住宅的精确查找。本发明采用上述方案,从居民用户的多维度历史用电数据入手,提出了居民基础电量因子的计算方法,并给出了基于基础电量因子的住房空置分析判据模型,在此基础上,设计了住宅空置状况的可信度评估方法,实现住房空置状况的准确研判,为住建等部门实现住房空置状况精准把控提供技术手段。
本发明方法流程合理,相对于传统的方法,可以根据居民的用电状况更好的掌握住房空置状况,避免一刀切,提高住房空置率的准确度。
进一步地,步骤1包括以下子步骤:
步骤11:从电网公司用电采集系统获取待监测居民用户历史用电曲线;由于大部分居民住宅目前信息采集仅包含日冻结电量、日内峰期电量、日内谷段电量和日内平段电量,少部分采用HPLC装置的居民电表可以获取一天24个点的用电数据。针对非HPLC用户,获取至少一个月用户的冻结电量数据,包括峰段、平段和谷段冻结电量。对于HPLC用户,包括一天多个时间点的电量数据,采集周期一般可为15min,1h,2h等。
步骤12:对步骤11中采集到的数据进行数据清洗,其中数据清洗包括异常数据剔除和缺失数据补齐;包括:
所述异常数据剔除是对明显不符合实际情况的数据进行剔除,例如未配置自用电源的用户量测量出现负值、电量数据异常增大;
所述缺失数据补齐是采用对当日用电曲线采用三次样条插值算法,或者曲线拟合法,或者相邻两点的均值算法对缺失数据进行补齐。
进一步地,采用相邻两点的均值算法对缺失数据进行补齐,记作N时刻数据缺失,则缺失时刻的补齐数据为PN:
式中,PN-1为N时刻的前一时刻的数据,PN+1为N时刻的后一时刻的数据。
特别的,对于一天内数据缺失超过三分之一的历史数据,认为该数据不可信,予以去除。
进一步地,步骤2中所述居民用户的基础电量因子的计算方法如下:
式中:Torg为数据集Amin中电量数据的时间尺度,Tcal为住房空置判定周期时间尺度,Krel为可靠系数,一般取0.95~1.05;Pbase_org为初始基础电量因子,Pbase_org=mean(Amin)+δ(Amin), mean和δ分别为均值函数和标准差函数。
进一步地,步骤2包括以下子步骤:
步骤21:根据步骤1中获取的居民用户历史用电数据,按照其可测得的最大分辨率完成数据整合,并判定用户的用电模式类型;所述的步骤21包括以下子步骤:
步骤211:数据聚合:对于HPLC用户,将所获取的所有时段电量数据整合为一组完整的数据A1,将夜间0:00~6:00时段内测得的电量数据整理为数据集A2;对于非HPLC用户,由于其测量时段的最小颗粒度为峰、平、谷段电量,将所获取的所有时段电量数据整合为一组完整的数据A1,将谷段(夜间)电量数据整理为数据集A2;
步骤212:针对A1和A2两个数据集,分别按照聚类树距离选择最优聚类数目k_cluster1 和k_cluster2;
步骤213:按照给定聚类数k_cluster1和k_cluster2分别对A1和A2两个数据集进行 k-means聚类,其中,考虑到用户的用电一般可以分为高、中、低三类,因此聚类数最高为3 类,可以根据数据情况适当减少;
步骤214:按照聚类结果,计算数据集分类子集均值,分别从A1和A2聚类子集中选取均值最小的子集,记为A1_min和A2_min;
步骤215:比较数据子集A1_min和A2_min的均值,若A2_min均值小于A1_min,则该用户为夜间稳定型用户,夜间电量近似为家庭基础电量;若A1_min均值小于A2_min,则该用户为非夜间稳定型用户;选择A1_min和A2_min中均值较小的一组,记为A_min;
mean(A2_min)>mean(A1_min),夜间平稳型
mean(A2_min)<mean(A1_min),夜间活跃型
式中,mean为均值函数,用于求输入数据集的均值;
步骤22:根据用户的用电模式类型,计算基础电量因子;所述的步骤22包括以下子步骤:
步骤221:针对数据集Amin,计算其标准差,若不满足下式,则去除Amin中的最大值后,再次计算剩余数据集中数据均值和标准差是否满足下式:
0.1*mean(Amin)>δ(Amin)
式中:mean和δ分别为均值函数和标准差函数;
最后,得出满足式(1)的基础电量集合B。
步骤222:基于基础电量集合B的计算初始基础电量因子,计算方法如下:
Pbase_org=mean(Amin)+δ(Amin)
步骤223:根据步骤222中提取的初始基础电量因子,进行相应的时间尺度缩放,获取基础电量因子Pbase,具体计算方法如下:
式中:Torg为Amin中电量数据的时间尺度,Tcal为住房空置判定周期时间尺度,Krel为可靠系数,一般取0.95~1.05。
例如,Amin中电量数据的时间尺度为8小时,则当日住房空置判据的基础电量因子为:
进一步地,步骤3包括以下子步骤:
步骤31:分析居民空置住房的用电指标特征,所述居民空置住房的用电指标特征包括三类用电指标特征,其中,第一类用电指标特征是家庭长期无人居住,处于断电状态,电量持续为零;第二类用电指标特征为家庭长期无人居住,处于断电状态,偶尔临时有人产生用电,或因为表计计量误差、线路漏电等原因导致少数时间电量发生跳变,无人居住期间电量为零,有人或表计跳变时产生电量;第三类为长期无人居住,但并未断电,家中基础性负荷持续存在;
步骤32:针对各用电指标特征建立对应的居民住房空置状况的判据模型;包括:
对于第一类用电指标特征中空置用户用电负荷的判据模型为:
式中:T为空置统计时段;
对于第二类用电指标特征中空置用户,大多数时段电量为0,用电负荷判据模型为:
式中:T为统计时段,T1为统计时段中电量为0的时段,T2为统计时段中电量不为零的时段,Pbase为基础电量因子;在步骤2中会详细计算。
对于第三类用电指标特征中空置用户,大多数时段电量基本不为0,用电负荷判据模型为:
式中:Keq为日内(月内)负荷均衡度,其计算方法为:计峰段8小时(7:00—11:00,19:00—23:00)的总电量为P1,平段8小时(11:00—19:00)的总电量为P2,谷段8小时 (23:00—7:00)的总电量为P3;则:
式中:min为最小值函数。
进一步地,步骤4中按照相应的时间尺度和空间范围计算住房空置率:
式中:Rempty为统计范围内的住房空置率,Nempty为统计范围内的满足步骤3中空置条件的住房数量,Nall为统计范围内所有住房数量。
进一步地,步骤5中对待监测的居民住房空置状况的可信度进行分类评估,包括:
对于第一类用电指标特征的空置用户,判别可信度为100%;
对于第二类用电指标特征的空置用户,判别可信度RT为:
式中:Ns为统计时段中满足空置判据,但电量不为零的时段数量,Ns0为总同时数量,Psmax为Ns所含时段内电量的最大值;
对于第三类用电指标特征的空置用户,判别可信度RT为:
即:均衡度越高,可信度越高。
另一方面,本发明还提供了一种基于电力大数据挖掘基础电量因子的住房空置自适应研判装置,该装置支持所述的一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,该装置包括:
获取单元,获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;
第一计算单元,根据获取的居民用户历史用电曲线,结合居民用户历史用电曲线的时间尺度,计算居民用户的基础电量因子;
第二计算单元,根据得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民空置住房的判据模型;
第三计算单元,根据建立的居民空置住房的判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;
评估单元,建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民空置住房的可信度进行评价;
输出单元,用于输出待监测的居民空置住房的可信度,并通过其指导衡量房地产风险。
进一步地,所述第一计算单元中居民用户的基础电量因子的计算表达式如下:
式中:Torg为数据集Amin中电量数据的时间尺度,Tcal为住房空置判定周期时间尺度,Krel为可靠系数,一般取0.95~1.05;Pbase_org为初始基础电量因子,Pbase_org=mean(Amin)+δ(Amin), mean和δ分别为均值函数和标准差函数。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,从用户的多维度历史用电数据入手,提出空置住房基础电量因子的计算方法,并通过构建用电量与住房空置之间的关系,提出了住房空置可信度的评估方法。相对于传统的方法,可以根据居民的用电状况更好的掌握住房空置状况,避免一刀切,提高住房空置率的准确度。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法流程图。
图2为本发明实施例清洗后按照峰平谷段标记的的典型用户用电曲线(典型用户1)。
图3为本发明实施例清洗后按照峰平谷段标记的的典型用户用电曲线(典型用户2)。
图4为本发明实施例中步骤2案例用户丰、平、谷电量聚类结果(用户1)。
图5为本发明实施例中步骤2案例用户丰、平、谷电量聚类结果(用户2)。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
在以下描述中,为了提供对本发明的透彻理解阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的结构、电路、材料或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
在本发明的描述中,需要理解的是,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
实施例1
如图1至图5所示,本发明一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,如图1所示,该方法包括以下步骤:
步骤1:获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;本实施例中,以某小区300户用户实际用电曲线作为住房空置状况分析的实际案例,取三十天峰、平、谷电量数据进行分析。实际应用此方法时,样本数量不应小于30个。并针对每一户用户,分别开展分析。清洗后按照峰平谷段标记的的典型用户用电曲线如图2和图3所示。
步骤2:根据步骤1获取的居民用户历史用电曲线,结合居民用户历史用电曲线的时间尺度,计算居民用户的基础电量因子;
根据步骤1获取住宅的居民用户历史用电曲线数据,合并所有用户峰段、平段和谷段用电量,记为集合A1,谷段电量构成的集合为A2,分别对A1和A2数据进行聚类。特别的,聚类数量的选择按照步骤212中所述的方法,通过聚类数最大距离进行划分,当最大距离为零时,所有数据自成一类;当最大距离小于0.3时,则按照最大类间距离划分聚类数量;当次大距离大于0.3时,聚类数量取3。
此实施例中,对于用户1,聚类数k_cluster1为3,聚类数k_cluster2为1;,对于用户2:聚类数k_cluster1为2,聚类数k_cluster2为1。不同类别的电量数据用不同符号标记,如图4 和图5所示。
进一步地,计算均值聚类结果中均值最终小数据集。对于用户1,由于谷段电量的均值 (0.25)小于全段电量类别中的最小均值(0.3176),为夜间平稳型用户。因此A_min为谷段电量集合。对于用户2,全段电量类别中最小均值(0.5885)小于谷段电量的均值(0.6076),因此A_min为全段电量中均值最小的一类数据集合。
在此基础上,通过步骤22所述的方法,求取基础电量集合B和初始基础电量因子Pbase_org。
基于Pbase_org,结合实际需求进行时间尺度变换,计算基础电量因子。
例如,Amin中电量数据的时间尺度为8小时,则当日住房空置判据的基础电量因子为:
步骤3:根据步骤2得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民住房空置状况的判据模型;
步骤31:分析居民空置住房的用电指标特征,包括三类,第一类用电指标特征是家庭长期无人居住,处于断电状态,电量持续为零;第二类用电指标特征为家庭长期无人居住,处于断电状态,偶尔临时有人产生用电,或因为表计计量误差、线路漏电等原因导致少数时间电量发生跳变,无人居住期间电量为零,有人或表计跳变时时产生电量;第三类用电指标特征为长期无人居住,但并未断电,家中基础性负荷持续存在;
不同类型空置住房用电特征判据模型如下:
对于第一类用电指标特征的空置用户用电负荷判据模型为:
式中:T为空置统计时段。
对于第二类用电指标特征的空置用户,大多数时段电量为0,用电负荷判据模型为:
式中:T为统计时段,T1为统计时段中电量为0的时段,T2为统计时段中电量不为零的时段,Pbase为基础电量因子,在步骤2中会详细计算。
对于第三类用电指标特征的空置用户,大多数时段电量基本不为0,用电负荷判据模型为:
式中:Keq为日内(月内)负荷均衡度。其计算方法为:计峰段8小时(7:00—11:00,19:00—23:00)的总电量为P1,平段8小时(11:00—19:00)的总电量为P2,谷段8小时 (23:00—7:00)的总电量为P3。则:
本实施案例中,对于用户1,不满足第一类、第二类、第三类空置判据,为非空置住房。对于用户2,不满足第一类、第二类空置判据,满足第三类判据,第4-31天为空置住房。
步骤4:根据步骤3建立的居民住房空置状况的判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;住房空置率公式为:
式中:Rempty为统计范围内的住房空置率,Nempty为统计范围内的满足步骤3中空置条件的住房数量,Nall为统计范围内所有住房数量。
步骤5:建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民住房空置状况的可信度进行分类评价,进而指导衡量房地产风险。
对于第一类用电指标特征的空置用户,判别可信度为100%;
对于第二类用电指标特征的空置用户,判别可信度RT为:
式中:Ns为统计时段中满足空置判据,但电量不为零的时段数量,Ns0为总同时数量,Psmax为Ns所含时段内电量的最大值;
对于第三类用电指标特征的空置用户,判别可信度RT为:
即:均衡度越高,可信度越高。
由此得出,不同日期用户2空置的可信度分别见表1所示:
表1不同日期用户2空置的可信度列表
因此,本发明为一种能够根据居民用电状态实现空置阈值自适应判定的方法,充分挖掘居民用户用电信息与住房空置之间的关联关系,实现空置住宅的精确查找。本发明采用上述方案,从居民用户的多维度历史用电数据入手,提出了居民基础电量因子的计算方法,并给出了基于基础电量因子的住房空置分析判据模型,在此基础上,设计了住宅空置状况的可信度评估方法,实现住房空置状况的准确研判,为住建等部门实现住房空置状况精准把控提供技术手段。本发明方法流程合理,相对于传统的方法,可以根据居民的用电状况更好的掌握住房空置状况,避免一刀切,提高住房空置率的准确度。
实施例2
如图1至图5所示,本实施例与实施例1的区别在于,本实施例提供了一种基于电力大数据挖掘基础电量因子的住房空置自适应研判装置,该装置支持实施例1所述的一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,该装置包括:
获取单元,获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;
第一计算单元,根据获取的居民用户历史用电曲线,结合居民用户历史用电曲线的时间尺度,计算居民用户的基础电量因子;
第二计算单元,根据得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民空置住房的判据模型;
第三计算单元,根据建立的居民空置住房的判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;
评估单元,建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民空置住房的可信度进行评价;
输出单元,用于输出待监测的居民空置住房的可信度,并通过其指导衡量房地产风险。
本实施例中,所述第一计算单元中居民用户的基础电量因子的计算表达式如下:
式中:Torg为数据集Amin中电量数据的时间尺度,Tcal为住房空置判定周期时间尺度,Krel为可靠系数,一般取0.95~1.05;Pbase_org为初始基础电量因子,Pbase_org=mean(Amin)+δ(Amin), mean和δ分别为均值函数和标准差函数。
其中,一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法按照实施例1 中的方法步骤执行。在此不再一一赘述。
本发明一种基于电力大数据挖掘基础电量因子的住房空置自适应研判装置,从用户的多维度历史用电数据入手,提出空置住房基础电量因子的计算方法,并通过构建用电量与住房空置之间的关系,提出了住房空置可信度的评估方法。相对于传统的,可以根据居民的用电状况更好的掌握住房空置状况,避免一刀切,提高住房空置率的准确度。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,其特征在于,该方法包括以下步骤:
步骤1:获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;
步骤2:根据步骤1获取的居民用户历史用电曲线,结合居民用户历史用电曲线的时间尺度,计算居民用户的基础电量因子;
步骤3:根据步骤2得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民住房空置状况的判据模型;
步骤4:根据步骤3建立的居民住房空置状况的判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;
步骤5:建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民住房空置状况的可信度进行分类评价,进而指导衡量房地产风险。
2.根据权利要求1所述的一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,其特征在于,步骤1包括以下子步骤:
步骤11:从电网公司用电采集系统获取待监测居民用户历史用电曲线;针对非HPLC用户,获取至少一个月用户的冻结电量数据,包括峰段、平段和谷段冻结电量;对于HPLC用户,包括一天多个时间点的电量数据,采集周期为15min或者1h或者2h;
步骤12:对步骤11中采集到的数据进行数据清洗,其中数据清洗包括异常数据剔除和缺失数据补齐;包括:
所述异常数据剔除是对明显不符合实际情况的数据进行剔除,包括:未配置自用电源的用户量测量出现负值、电量数据异常增大;
所述缺失数据补齐是采用对当日用电曲线采用三次样条插值算法,或者曲线拟合法,或者相邻两点的均值算法对缺失数据进行补齐。
5.根据权利要求4所述的一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,其特征在于,步骤2包括以下子步骤:
步骤21:根据步骤1中获取的居民用户历史用电数据,按照其可测得的最大分辨率完成数据整合,并判定用户的用电模式类型;
步骤22:根据用户的用电模式类型,计算基础电量因子;
所述的步骤21包括以下子步骤:
步骤211:数据聚合:对于HPLC用户,将所获取的所有时段电量数据整合为一组完整的数据A1,将夜间0:00~6:00时段内测得的电量数据整理为数据集A2;对于非HPLC用户,由于其测量时段的最小颗粒度为峰、平、谷段电量,将所获取的所有时段电量数据整合为一组完整的数据A1,将谷段电量数据整理为数据集A2;
步骤212:针对A1和A2两个数据集,分别按照聚类树距离选择最优聚类数目k_cluster1和k_cluster2;
步骤213:按照给定聚类数k_cluster1和k_cluster2分别对A1和A2两个数据集进行k-means聚类,其中,考虑到用户的用电分为高、中、低三类,因此聚类数最高为3类;
步骤214:按照聚类结果,计算数据集分类子集均值,分别从A1和A2聚类子集中选取均值最小的子集,记为A1_min和A2_min;
步骤215:比较数据子集A1_min和A2_min的均值,若A2_min均值小于A1_min,则该用户为夜间稳定型用户,夜间电量近似为家庭基础电量;若A1_min均值小于A2_min,则该用户为非夜间稳定型用户;选择A1_min和A2_min中均值较小的一组,记为A_min;
mean(A2_min)>mean(A1_min),夜间平稳型
mean(A2_min)<mean(A1_min),夜间活跃型
式中,mean为均值函数,用于求输入数据集的均值;
所述的步骤22包括以下子步骤:
步骤221:针对数据集Amin,计算其标准差,若不满足下式,则去除Amin中的最大值后,再次计算剩余数据集中数据均值和标准差是否满足下式:
0.1*mean(Amin)>δ(Amin)
式中:mean和δ分别为均值函数和标准差函数;
最后,得出满足条件的基础电量集合B;
步骤222:基于基础电量集合B的计算初始基础电量因子,计算方法如下:
Pbase_org=mean(Amin)+δ(Amin)
步骤223:根据步骤222中提取的初始基础电量因子,进行相应的时间尺度缩放,获取基础电量因子Pbase。
6.根据权利要求1所述的一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,其特征在于,步骤3包括以下子步骤:
步骤31:分析居民空置住房的用电指标特征,所述居民空置住房的用电指标特征包括三类用电指标特征,其中,第一类用电指标特征是家庭长期无人居住,处于断电状态,电量持续为零;第二类用电指标特征为家庭长期无人居住,处于断电状态,偶尔临时有人产生用电,或因为表计计量误差、线路漏电原因导致少数时间电量发生跳变,无人居住期间电量为零,有人或表计跳变时产生电量;第三类为长期无人居住,但并未断电,家中基础性负荷持续存在;
步骤32:针对各用电指标特征建立对应的居民住房空置状况的判据模型;包括:
对于第一类用电指标特征中空置用户用电负荷的判据模型为:
式中:T为空置统计时段;
对于第二类用电指标特征中空置用户,大多数时段电量为0,用电负荷判据模型为:
式中:T为统计时段,T1为统计时段中电量为0的时段,T2为统计时段中电量不为零的时段,Pbase为基础电量因子;
对于第三类用电指标特征中空置用户,大多数时段电量基本不为0,用电负荷判据模型为:
式中:Keq为日内(月内)负荷均衡度,其计算方法为:计峰段8小时(7:00—11:00,19:00—23:00)的总电量为P1,平段8小时(11:00—19:00)的总电量为P2,谷段8小时(23:00—7:00)的总电量为P3;则:
式中:min为最小值函数。
9.一种基于电力大数据挖掘基础电量因子的住房空置自适应研判装置,其特征在于,该装置支持如权利要求1至8中任意一项所述的一种基于电力大数据挖掘基础电量因子的住房空置自适应研判方法,该装置包括:
获取单元,获取待监测住宅的居民用户历史用电曲线,并进行数据清洗和标记;
第一计算单元,根据获取的居民用户历史用电曲线,结合居民用户历史用电曲线的时间尺度,计算居民用户的基础电量因子;
第二计算单元,根据得到的居民用户的基础电量因子,分析居民住房空置的用电指标特征,并针对各用电指标特征建立对应的居民空置住房的判据模型;
第三计算单元,根据建立的居民空置住房的判据模型,对居民住宅状况进行研判,并按照不同的空间尺度和空间范围计算住房空置率;
评估单元,建立住宅空置状况可信度的评价指标,并根据实际数据状况对待监测的居民空置住房的可信度进行评价;
输出单元,用于输出待监测的居民空置住房的可信度,并通过其指导衡量房地产风险。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011430067.0A CN112465378B (zh) | 2020-12-09 | 2020-12-09 | 基于电力大数据挖掘的住房空置自适应研判方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011430067.0A CN112465378B (zh) | 2020-12-09 | 2020-12-09 | 基于电力大数据挖掘的住房空置自适应研判方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112465378A true CN112465378A (zh) | 2021-03-09 |
CN112465378B CN112465378B (zh) | 2022-04-29 |
Family
ID=74800457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011430067.0A Active CN112465378B (zh) | 2020-12-09 | 2020-12-09 | 基于电力大数据挖掘的住房空置自适应研判方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112465378B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094448A (zh) * | 2021-04-06 | 2021-07-09 | 国网北京市电力公司 | 住宅空置状态的分析方法及分析装置、电子设备 |
CN113657727A (zh) * | 2021-07-30 | 2021-11-16 | 国网湖北省电力有限公司电力科学研究院 | 一种基于电力大数据的居家人员居家状态判断方法 |
CN113781096A (zh) * | 2021-07-30 | 2021-12-10 | 国网浙江省电力有限公司 | 一种办公楼空置率分析方法 |
CN113780769A (zh) * | 2021-08-26 | 2021-12-10 | 国网湖北省电力有限公司电力科学研究院 | 一种基于电力大数据的人口流动指数计算方法 |
CN114639484A (zh) * | 2021-11-30 | 2022-06-17 | 国网辽宁省电力有限公司电力科学研究院 | 基于电力大数据的小区人口流动情况分析系统及方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096060A (zh) * | 2015-08-26 | 2015-11-25 | 中国电力科学研究院 | 一种基于电能服务管理平台的企业开工率获取方法 |
CN105225026A (zh) * | 2015-08-26 | 2016-01-06 | 中国电力科学研究院 | 一种基于电能服务管理平台的住房空置率评估方法 |
CN105719198A (zh) * | 2016-01-22 | 2016-06-29 | 江苏省电力公司电力经济技术研究院 | 一种基于居民用电行为的房屋空置率计算方法 |
CN105761190A (zh) * | 2016-02-01 | 2016-07-13 | 东南大学 | 一种基于手机定位数据的城市居住区空置率动态监测方法 |
CN109190783A (zh) * | 2018-07-03 | 2019-01-11 | 北京交通大学 | 城市水网渗漏空间聚集性检测及关键影响因素识别方法 |
CN109447404A (zh) * | 2018-09-20 | 2019-03-08 | 深圳供电局有限公司 | 住房空置率的评估方法、装置、计算机设备和存储介质 |
JP2019197252A (ja) * | 2018-05-07 | 2019-11-14 | 株式会社タス | 空室率推計装置及び方法並びにコンピュータプログラム |
CN110930285A (zh) * | 2020-02-05 | 2020-03-27 | 北京交研智慧科技有限公司 | 一种人口分布分析方法及装置 |
CN111210170A (zh) * | 2020-04-21 | 2020-05-29 | 国网四川省电力公司电力科学研究院 | 基于90%用电分布特征指标的环保管控监测及评价方法 |
CN111209534A (zh) * | 2019-12-23 | 2020-05-29 | 广西电网有限责任公司 | 基于居民客户用电量数据划分客户用电入住状态的方法 |
CN111461521A (zh) * | 2020-03-27 | 2020-07-28 | 广东电网有限责任公司 | 一种基于电力大数据的居民住房空置率分析方法 |
CN111539845A (zh) * | 2020-04-21 | 2020-08-14 | 国网四川省电力公司电力科学研究院 | 一种基于用电模式隶属评分的企业环保管控响应研判方法 |
-
2020
- 2020-12-09 CN CN202011430067.0A patent/CN112465378B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096060A (zh) * | 2015-08-26 | 2015-11-25 | 中国电力科学研究院 | 一种基于电能服务管理平台的企业开工率获取方法 |
CN105225026A (zh) * | 2015-08-26 | 2016-01-06 | 中国电力科学研究院 | 一种基于电能服务管理平台的住房空置率评估方法 |
CN105719198A (zh) * | 2016-01-22 | 2016-06-29 | 江苏省电力公司电力经济技术研究院 | 一种基于居民用电行为的房屋空置率计算方法 |
CN105761190A (zh) * | 2016-02-01 | 2016-07-13 | 东南大学 | 一种基于手机定位数据的城市居住区空置率动态监测方法 |
JP2019197252A (ja) * | 2018-05-07 | 2019-11-14 | 株式会社タス | 空室率推計装置及び方法並びにコンピュータプログラム |
CN109190783A (zh) * | 2018-07-03 | 2019-01-11 | 北京交通大学 | 城市水网渗漏空间聚集性检测及关键影响因素识别方法 |
CN109447404A (zh) * | 2018-09-20 | 2019-03-08 | 深圳供电局有限公司 | 住房空置率的评估方法、装置、计算机设备和存储介质 |
CN111209534A (zh) * | 2019-12-23 | 2020-05-29 | 广西电网有限责任公司 | 基于居民客户用电量数据划分客户用电入住状态的方法 |
CN110930285A (zh) * | 2020-02-05 | 2020-03-27 | 北京交研智慧科技有限公司 | 一种人口分布分析方法及装置 |
CN111461521A (zh) * | 2020-03-27 | 2020-07-28 | 广东电网有限责任公司 | 一种基于电力大数据的居民住房空置率分析方法 |
CN111210170A (zh) * | 2020-04-21 | 2020-05-29 | 国网四川省电力公司电力科学研究院 | 基于90%用电分布特征指标的环保管控监测及评价方法 |
CN111539845A (zh) * | 2020-04-21 | 2020-08-14 | 国网四川省电力公司电力科学研究院 | 一种基于用电模式隶属评分的企业环保管控响应研判方法 |
Non-Patent Citations (3)
Title |
---|
刘畅 等: "基于电力数据的居民人口流动情况评估", 《四川电力技术》 * |
刘芳芳 等: "高渗透清洁能源的城市高压配电网转供调度策略", 《电力系统保护与控制》 * |
李斌: "用电大数据的应用研究", 《电力需求侧管理》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094448A (zh) * | 2021-04-06 | 2021-07-09 | 国网北京市电力公司 | 住宅空置状态的分析方法及分析装置、电子设备 |
CN113094448B (zh) * | 2021-04-06 | 2023-10-27 | 国网北京市电力公司 | 住宅空置状态的分析方法及分析装置、电子设备 |
CN113657727A (zh) * | 2021-07-30 | 2021-11-16 | 国网湖北省电力有限公司电力科学研究院 | 一种基于电力大数据的居家人员居家状态判断方法 |
CN113781096A (zh) * | 2021-07-30 | 2021-12-10 | 国网浙江省电力有限公司 | 一种办公楼空置率分析方法 |
CN113781096B (zh) * | 2021-07-30 | 2024-05-28 | 国网浙江省电力有限公司 | 一种办公楼空置率分析方法 |
CN113780769A (zh) * | 2021-08-26 | 2021-12-10 | 国网湖北省电力有限公司电力科学研究院 | 一种基于电力大数据的人口流动指数计算方法 |
CN114639484A (zh) * | 2021-11-30 | 2022-06-17 | 国网辽宁省电力有限公司电力科学研究院 | 基于电力大数据的小区人口流动情况分析系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112465378B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112465378B (zh) | 基于电力大数据挖掘的住房空置自适应研判方法及装置 | |
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN108593990B (zh) | 一种基于电能用户用电行为模式的窃电检测方法和应用 | |
CN106096726B (zh) | 一种非侵入式负荷监测方法及装置 | |
Stephen et al. | Domestic load characterization through smart meter advance stratification | |
CN110189232A (zh) | 基于孤立森林算法的用电信息采集数据异常分析方法 | |
CN108899892A (zh) | 一种基于cnn非侵入式用电负荷分解方法 | |
Gerossier et al. | Probabilistic day-ahead forecasting of household electricity demand | |
Batra et al. | Neighbourhood nilm: A big-data approach to household energy disaggregation | |
CN107578277B (zh) | 用于电力营销的出租房客户定位方法 | |
CN110503570A (zh) | 一种异常用电数据检测方法、系统、设备、存储介质 | |
CN104239963A (zh) | 基于灰色gm(1,1)模型查找异常电能表的方法 | |
CN115079082A (zh) | 一种台区电表监测方法、系统及终端 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN112988717B (zh) | 一种居民智慧用能服务标本库设计与构建方法 | |
CN109146316A (zh) | 电力营销稽查方法、装置及计算机可读存储介质 | |
CN116070162B (zh) | 一种反窃电监测方法及系统 | |
KR20090026029A (ko) | 전기의 충방전을 이용한 전기수요 관리 방법 및 전기수요관리서버 | |
CN115860983A (zh) | 一种基于物联网的智慧城市燃气安全监测运行管理方法及系统 | |
CN111476298A (zh) | 一种居家办公环境下的用电负荷状态识别方法 | |
CN115545240A (zh) | 一种低压配电网台区异常线损诊断方法、系统、设备及介质 | |
CN112732772A (zh) | 一种基于月度居民用电量的住房空置率测算方法 | |
CN117220417B (zh) | 消费端电负荷动态监测方法及系统 | |
CN110751388A (zh) | 一种配电网居民户均配变容量指标计算的方法及系统 | |
Wang | Predicting Airbnb Listing Price with Different models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |