CN116205528A - 基于施工场地电力数据的违规施工辨识方法和系统 - Google Patents

基于施工场地电力数据的违规施工辨识方法和系统 Download PDF

Info

Publication number
CN116205528A
CN116205528A CN202310111517.7A CN202310111517A CN116205528A CN 116205528 A CN116205528 A CN 116205528A CN 202310111517 A CN202310111517 A CN 202310111517A CN 116205528 A CN116205528 A CN 116205528A
Authority
CN
China
Prior art keywords
data
construction
user
load
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310111517.7A
Other languages
English (en)
Inventor
姜磊
杨钊
罗凯
梁立江
王继胜
孙强
唐青霞
曲滨涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brilliant Data Analytics Inc
Original Assignee
Brilliant Data Analytics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brilliant Data Analytics Inc filed Critical Brilliant Data Analytics Inc
Priority to CN202310111517.7A priority Critical patent/CN116205528A/zh
Publication of CN116205528A publication Critical patent/CN116205528A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及电力数据分析领域,为基于施工场地电力数据的违规施工辨识方法和系统,其方法包括:数据准备,将不同施工类型、不同施工阶段的典型用户的负荷数据作为典型样本,建立夜间违规施工分析的场景数据集;构建施工用户负荷聚类模型,对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,划分出不同施工类型、不同施工阶段的多个用电行为数据簇;按照数据簇分类建立施工用户负荷特征指标,筛选异常样本数据;构建分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单。本发明通过电力大数据分析甄别出疑似夜间违规施工用户,辨识结果可有效地支撑环保部门有针对性地开展噪声防治工作。

Description

基于施工场地电力数据的违规施工辨识方法和系统
技术领域
本发明涉及电力数据分析领域,具体为一种基于施工场地电力数据的违规施工辨识方法和系统。
背景技术
让城市安静,不仅是市民生活的需要,也是现代化城市发展的需要。根据相关法律法规的规定,在城市市区噪声敏感建筑物集中区域内,除抢修、抢险作业等特殊需要之外,夜间禁止建筑施工产生环境噪声污染。其中工地夜间施工产生噪声主要来自各种动力机械,如混凝土搅拌机、电锯、吊车、升降机等。这些动力机械很多是以电力为驱动,因此工地夜间施工状态和非施工状态在电力负荷上通常具有明显差异,为电力大数据防治建筑工地夜间施工提供了可行性。但由于工地用电情况复杂,无法通过简单的统计学方法对工地施工用电进行有效识别。
发明内容
本发明的目的在于提供一种基于施工场地电力数据的违规施工辨识方法和系统,通过对电力大数据进行分析,甄别出疑似夜间违规施工用户,大幅缩小了环保部门监督管理聚焦范围,本发明的辨识结果可有效地支撑环保部门有针对性地开展噪声防治工作。
本发明的一个实施例中提供基于施工场地电力数据的违规施工辨识方法,包括以下步骤:
数据准备,根据现场勘察、调研结果,结合用户电量数据、用户状态变更信息,筛选出不同施工类型、不同施工阶段的典型用户,将其用电负荷数据作为典型样本,建立夜间违规施工分析的场景数据集;
构建施工用户负荷聚类模型,对不同施工类型、不同施工阶段用户的用电行为进行归类;利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,划分出不同施工类型、不同施工阶段的多个用电行为数据簇;
按照用电行为数据簇,分类建立施工用户负荷特征指标;对每个数据簇中数据进行随机抽样,计算夜间每个记录点负荷值与白天负荷中位数的变化情况;与相同施工类型、阶段、时刻的用户负荷变化比进行对比,筛选异常样本数据,将异常样本所在数据簇中数据点写入异常施工数据集,得到正常施工数据集和异常施工数据集;
构建分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单;
应用所构建的分类模型,根据疑似违规施工用户清单实时监测各施工用户,对疑似违规施工用户关注等级进行评估。
基于相同的发明构思,本发明的另一实施例提供的是基于施工场地电力数据的违规施工辨识系统,包括以下模块:
数据准备模块,用于根据现场勘察、调研结果,结合用户电量数据、用户状态变更信息,筛选出不同施工类型、不同施工阶段的典型用户,将其用电负荷数据作为典型样本,建立夜间违规施工分析的场景数据集;
数据簇划分模块,用于构建施工用户负荷聚类模型,对不同施工类型、不同施工阶段用户的用电行为进行归类;利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,划分出不同施工类型、不同施工阶段的多个用电行为数据簇;
异常数据筛选模块,按照用电行为数据簇,分类建立施工用户负荷特征指标;对每个数据簇中数据进行随机抽样,计算夜间每个记录点负荷值与白天负荷中位数的变化情况;与相同施工类型、阶段、时刻的用户负荷变化比进行对比,筛选异常样本数据,将异常样本所在数据簇中数据点写入异常施工数据集,得到正常施工数据集和异常施工数据集;
分类模块,用于构建分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单;
关注等级评估模块,应用所构建的分类模型,根据疑似违规施工用户清单实时监测各施工用户,对疑似违规施工用户关注等级进行评估。
与现有技术相比,本发明取得的有益效果包括:
1、借助电力数据为噪声防治赋能:本发明基于电力大数据,创建了主动、实时、常态的夜间施工防治监测模式,甄别出疑似夜间违规施工用户,大幅缩小了环保部门监督管理聚焦范围,支撑环保部门有针对性地开展噪声防治工作;能在一级关注度疑似违规用户中识别出违规施工事件,提前杜绝了违规作业带来的噪声污染,有效提升居民生活幸福指数。
2、夯实数据服务能力:本发明以供电公司电力数据为视角,利用大数据分析技术挖掘电力数据价值潜力,实现数据增值服务的探索,为后续电力数据进一步开放共享、增值服务积累了宝贵经验。
附图说明
图1为本发明实施例中提供的基于施工场地电力数据的违规施工辨识方法的流程图;
图2是本发明实施例中构建聚类模型时发现数据分类簇的示意图;
图3是本发明实施例中用户负荷行为数据聚类模型训练的流程图;
图4是本发明实施例中采用Biased-SVM模型筛选样本集的流程图;
图5是本发明实施例中违规施工用户负荷特征分布情况示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明作进一步详细说明,但本发明的实施方式并不限于此。
实施例1
本实施例提供的是一种基于施工场地电力数据的违规施工辨识方法,涉及到的术语,详细介绍如下:
基于密度的噪声应用空间的贪婪型聚类(Greedy-DBSCAN)算法:Greedy-DBSCAN算法是传统DBSCAN算法的改进型,仅需输入一个最小邻域密度阈值MinPts参数,采用贪心策略自适应的寻找扫描半径Eps参数进行簇发现,利用相对稠密度识别和判定噪声数据,在随机寻找核对象过程中使用邻域查询方式提升算法执行效率,通过簇的合并产生最终的聚类结果。
不平衡支持向量机(Biased-SVM)算法:Biased-SVM算法是传统SVM算法的改进,与传统SVM算法的主要区别是在分类过程中分别赋予错分的小类和大类不同的惩罚因子。该方法等价于对误分代价高的类别使用不同的拉格朗日乘子,从而使分类面远离小类而靠近大类;使得未知样本被划分为小类的概率变大,减少分类中因错分而引起的损失。
本实施例以城区范围内施工用户为分析监测对象,利用建筑施工类的用户信息、用电负荷等内部数据,以及工地施工类型等现场调研外部数据,通过模型构建、模型训练、模型验证、模型应用四个阶段开展夜间疑似违规施工用户辨识及监测分析、关注等级评价工作。
在实施过程中,本实施例选取不同施工类型、施工阶段的用户作为典型模型训练样本,利用Greedy-DBSCAN算法构建施工用户负荷聚类模型,利用负荷比对特征指标进行施工用户负荷特征对比,再利用Biased-SVM算法进行施工用户特征数据集筛选,甄别出各类型施工用户在夜间是否违规施工,并通过实地蹲点的方式对模型输出结果进行验证,进行模型算法调优,提高模型识别准确率,再基于疑似夜间违规施工用户清单,采用RFM用户分类模型,构建疑似违规施工用户关注等级评价模型,将疑似超时违规施工用户划分不同关注等级,支撑环保部门有针对性地对噪声污染用户进行精准核查治理。
如图1所示,在本实施例中,基于施工场地电力数据的违规施工辨识方法具体包括以下步骤:
S1、数据准备
由于不同施工类型、不同施工阶段的用电负荷存在差异,为了便于横向对比,保证模型训练的准确性,本实施例根据现场勘察、调研结果,结合用户电量数据、用户状态变更等信息,筛选出不同施工类型、不同施工阶段的典型用户,将其用电负荷数据作为典型样本,建立夜间违规施工分析的场景数据集。
S11、数据获取
(1)内部数据
基于营销、用电采集系统,以“临时用电”标识、“立户时间大于2020年”、行业类型建筑、施工类等属性标签筛选出目标城区范围内143个建筑施工类用户,并获取其2020年1月1日至2022年10月14日的96点负荷(即每15分钟取一次数据,获得4*24=96点负荷数据)和电量数据。内部数据字段详见表1:
表1内部数据清单
Figure BDA0004076916560000041
(2)外部数据
依照已获取的143个建筑施工类用户清单,通过现场勘察、调研等方式,标注施工类用户所属的工地类别、施工阶段、施工状态、是否曾违规施工被投诉过等信息。外部数据需求详见表2:
表2外部数据清单
Figure BDA0004076916560000042
S12、数据预处理
为了保证模型训练的准确性,需要对施工类用户的负荷数据进行预处理,包括数据清洗、数据整合、数据规整、负荷数据缩放。
数据清洗:对于某个时刻负荷缺失或异常的情况,需要将缺失值和异常值进行平滑处理。
数据整合:由于存在一工地对应多户号的情况,所以需要按照户名、地址进行整合,同时段负荷进行相加。
数据规整:包括数据归一化和负荷数据缩放,其中:
数据归一化:因工地规模、用电设备等因素导致不同用户负荷值差异较大,所以采用max-min归一化方式对数据进行归一化处理。归一化的计算公式为:
Figure BDA0004076916560000051
其中,Xmax为数据最大值,Xmin为数据最小值,Xnom为归一化后的数据值。
负荷数据缩放:96点负荷数据的波动性较大,预处理方法是将96点负荷数据缩放为24点负荷数据,取同小时4个点中的最大负荷值作为该小时的负荷值。
S2、构建施工用户负荷聚类模型
Greedy-DBSCAN算法是一种无监督的机器学习算法,只需指定最小邻域密度阈值(MinPts),算法随机以数据点为圆心,根据MinPts大小,自动调整扫描半径参数(ε)发现数据簇。以MinPts=4时为例,数据分类簇见图2。
通过对施工用户用电负荷的初步分析,发现施工用户用电负荷在不同施工阶段存在多种施工用电行为,无法人工准确定义其簇数。针对这种状况,本实施例需要构建施工用户负荷聚类模型,对不同施工类型、不同施工阶段用户的用电行为进行归类;利用Greedy-DBSCAN算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练。如图3所示,具体的分类训练过程包括:
设置数据簇中的最小数据点数,本实施例将数据簇中最小数据点数设置为4;
随机选择数据点为圆心,调整半径大小生成数据簇;
在生成的数据簇周围进行检查,查看是否有未被包含的数据点;
对已经生成的数据簇进行噪点监测,如果数据簇中数据点差异较大,则拆分数据簇,重复上述步骤,直到数据簇的簇数不再发生变化;
对包含公共点的数据簇进行合并;
生成的数据簇进行结果输出,每个数据簇代表一类用电行为。
由此,本发明基于典型施工用户的用电负荷特征,采用Greedy-DBSCAN算法聚类分析,划分出不同施工类型、不同施工阶段的多个用电行为数据簇。
S3、对比施工用户负荷特征
同类型施工用户在施工状态和非施工状态的用电负荷存在一定偏差度,按照用电行为数据簇,分类建立施工用户负荷特征指标。指标的计算公式详见表3:
表3负荷特征指标计算公式
Figure BDA0004076916560000052
Figure BDA0004076916560000061
本实施例通过对每个数据簇中数据进行随机抽样,计算夜间每个记录点负荷值与白天负荷中位数的变化情况;与相同施工类型、阶段、时刻的用户负荷变化比进行对比,计算均值、标准差、中位数等特征值,筛选异常样本数据,将异常样本所在数据簇中数据点写入异常施工数据集。由此得到正常施工数据集和异常施工数据集。
S4、构建Biased-SVM分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单。
支持向量机(SVM)是一种相对简单的监督机器学习算法,用于解决分类或特征比较的问题。
在本实施例中,实地走访验证数据和未通过实地验证数据并不平衡,故采取Biased-SVM模型,进行数据均衡处理。Biased-SVM模型可以通过对二分类样本数据赋予不同的惩罚因子,以处理上述两类数据的不平衡性。
SVM目标函数为:
Figure BDA0004076916560000062
采取Biased-SVM,赋予不同的惩罚因子后目标函数变为:
Figure BDA0004076916560000063
其中,ω为垂直超平面的向量,m为样本集大小,C+为正类惩罚因子,C-为负类惩罚因子,h表示松弛变量,yi为样本集数据。
首先利用通过实地走访验证的标记样本集(X)训练处理不平衡数据的Biased-SVM模型算法,然后用训练好的Biased-SVM模型为未通过实地验证的样本(U)加上标签,得到新标记样本,再把新标记样本加入标记样本集中,通过不断调整训练样本集相关参数以及扩大标记样本集,以有效提升施工辨识的准确率,算法流程如图4所示。
为剔除天气等因素对分类结果的影响,本实施例构建Biased-SVM模型对所获得的异常施工数据集中不同施工类型用户的不同时刻负荷特征指标(如负荷变化比、标准差、均值等)进行分类,依据分类后的数据集特征值与训练集结果综合识别出疑似违规数据集和非施工数据集。具体实现流程如下:
S41、首先定义三类样本集,标记样本集X:已知该工地是否施工数据;未标记样本集U:未知该工地是否施工数据;测试样本集T:在标记样本集X和未标记样本集U中随机抽取样本,组成测试样本集;
S42、根据专家经验设置初始的正类惩罚因子和负类惩罚因子。
由于在本实施例中,模型处理问题为二分类问题,那么超平面满足等式:0=(ω*x)+b,目标函数为:
Figure BDA0004076916560000071
其中,m为样本集大小,C+为正类惩罚因子,C-为负类惩罚因子,h表示松弛变量,yi为样本集数据。
S43、用标记样本集X训练Biased-SVM模型;
S44、将未标记样本集U作为测试集,用训练好的Biased-SVM模型为未标记样本集U添加标签,形成新标记样本集M;
S45、将标记样本集X与新标记样本集M汇总,并利用汇总后的标记样本集重新训练Biased-SVM模型,根据实际情况修正目标函数中的惩罚因子C+和C-
S46、使用测试样本集T测试训练后的Biased-SVM模型;
S47、根据Biased-SVM模型的输出结果,判定用户是否疑似违规施工。
通过对Biased-SVM模型的训练及实地验证,得到疑似违规施工用户清单。
本实施例发现在同类同阶施工用户同时刻变化均值小于6%、标准差小于3%,用户偏离程度大于10%时违规施工概率较高。违规施工用户负荷特征分布情况如图5所示。
为验证模型的准确性,本实施例将样本对象的施工情况与模型输出清单进行比对,根据比对结果对Biased-SVM算法模型进行迭代,调整正类惩罚因子和负类惩罚因子的大小。模型最终准确率为93.1%,相对于传统的SVM的模型准确率为61.8%有显著的提升。
S5、应用所构建的分类模型,根据疑似违规施工用户清单实时监测各施工用户,对疑似违规施工用户关注等级进行评估。
疑似违规施工用户的违规时间间隔、违规时长、违规频次不同,导致其噪声风险等级不同。本实施例基于RFM模型评价衡量疑似违规施工用户的关注度等级,其中R(最近一次疑似违规施工时间间隔)指用户最近一次疑似违规施工距离当前的时间;F(疑似违规施工频率)指用户一段时间内疑似违规施工了多少次;M(累计疑似违规施工时长)指用户一段时间内的累计疑似违规施工时长。RFM业务规则定义详见表4。
表4RFM业务规则定义
Figure BDA0004076916560000072
Figure BDA0004076916560000081
本实施例借鉴RFM用户价值评级模型,建立疑似违规施工用户关注等级评价模型,将疑似违规用户划分为一级、二级、三级(一级关注度最高,依次降低),辅助环保部门有针对性开展噪声污染监测和治理工作。关注度划分规则详见表5。
表5疑似违规用户关注等级评价规则
Figure BDA0004076916560000082
从以上实施过程可知,本实施例首先是基于施工场地电力数据进行夜间施工是否违规的辨识,首先通过Greedy-DBSCAN算法对用户用电行为进行归类,根据归类后数据簇的数据特征值,使用Biased-SVM算法对是否存在违法施工行为进行辨识归类;然后采用改进后的RFM模型对用户进行登记划分,找出重点关注对象为噪音监管提供指导。
实施例2
与实施例1基于相同的发明构思,本实施例提供的是一种基于施工场地电力数据的违规施工辨识系统,包括以下模块:
数据准备模块,用于根据现场勘察、调研结果,结合用户电量数据、用户状态变更信息,筛选出不同施工类型、不同施工阶段的典型用户,将其用电负荷数据作为典型样本,建立夜间违规施工分析的场景数据集;
数据簇划分模块,用于构建施工用户负荷聚类模型,对不同施工类型、不同施工阶段用户的用电行为进行归类;利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,划分出不同施工类型、不同施工阶段的多个用电行为数据簇;
异常数据筛选模块,按照用电行为数据簇,分类建立施工用户负荷特征指标;对每个数据簇中数据进行随机抽样,计算夜间每个记录点负荷值与白天负荷中位数的变化情况;与相同施工类型、阶段、时刻的用户负荷变化比进行对比,筛选异常样本数据,将异常样本所在数据簇中数据点写入异常施工数据集,得到正常施工数据集和异常施工数据集;
分类模块,用于构建分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单;
关注等级评估模块,应用所构建的分类模型,根据疑似违规施工用户清单实时监测各施工用户,对疑似违规施工用户关注等级进行评估。
本实施例的数据簇划分模块中,利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,包括:
设置数据簇中的最小数据点数;
随机选择数据点为圆心,调整半径大小生成数据簇;
在生成的数据簇周围进行检查,查看是否有未被包含的数据点;
对已经生成的数据簇进行噪点监测,如果数据簇中数据点差异较大,则拆分数据簇,重复上述步骤,直到数据簇的簇数不再发生变化;
对包含公共点的数据簇进行合并;
生成的数据簇进行结果输出,每个数据簇代表一类用电行为。
本实施例分类模块所构建的分类模型为Biased-SVM分类模型;Biased-SVM分类模型通过对二分类样本数据赋予不同的惩罚因子,以处理实地走访验证数据和未通过实地验证数据的不平衡性;
Biased-SVM分类模型对二分类样本数据赋予不同的惩罚因子后,目标函数变为:
Figure BDA0004076916560000101
其中,ω为垂直超平面的向量,m为样本集大小,C+为正类惩罚因子,C-为负类惩罚因子,h表示松弛变量,yi为样本集数据;
疑似违规施工用户清单的获取过程包括:
定义三类样本集,标记样本集X,为已知该工地是否施工数据;未标记样本集U,为未知该工地是否施工数据;在标记样本集X和未标记样本集U中随机抽取样本,组成测试样本集T;
根据专家经验设置初始的正类惩罚因子和负类惩罚因子;
使用标记样本集X训练Biased-SVM模型;
将未标记样本集U作为测试集,用训练好的Biased-SVM模型为未标记样本集U添加标签,形成新标记样本集M;
将标记样本集X与新标记样本集M汇总,并利用汇总后的标记样本集重新训练Biased-SVM模型,根据实际情况修正目标函数中的正类惩罚因子C+和负类惩罚因子C-
使用测试样本集T测试训练后的Biased-SVM模型;
根据Biased-SVM模型的输出结果,判定用户是否疑似违规施工。
本实施例中各模块的更多详细实现过程,请参见实施例1。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于施工场地电力数据的违规施工辨识方法,其特征在于,包括以下步骤:
数据准备,根据现场勘察、调研结果,结合用户电量数据、用户状态变更信息,筛选出不同施工类型、不同施工阶段的典型用户,将其用电负荷数据作为典型样本,建立夜间违规施工分析的场景数据集;
构建施工用户负荷聚类模型,对不同施工类型、不同施工阶段用户的用电行为进行归类;利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,划分出不同施工类型、不同施工阶段的多个用电行为数据簇;
按照用电行为数据簇,分类建立施工用户负荷特征指标;对每个数据簇中数据进行随机抽样,计算夜间每个记录点负荷值与白天负荷中位数的变化情况;与相同施工类型、阶段、时刻的用户负荷变化比进行对比,筛选异常样本数据,将异常样本所在数据簇中数据点写入异常施工数据集,得到正常施工数据集和异常施工数据集;
构建分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单;
应用所构建的分类模型,根据疑似违规施工用户清单实时监测各施工用户,对疑似违规施工用户关注等级进行评估。
2.根据权利要求1所述的违规施工辨识方法,其特征在于,数据准备的过程包括:
获取内部数据和外部数据,基于营销、用电采集系统,以属性标签筛选出目标城区范围内多个建筑施工类用户,并获取其一段时间内的负荷数据和电量数据;依照多个建筑施工类用户清单,通过现场勘察、调研方式,标注施工类用户所属的工地类别、施工阶段、施工状态、是否曾违规施工被投诉过;
对施工类用户的负荷数据进行预处理,所述预处理包括负荷数据缩放。
3.根据权利要求2所述的违规施工辨识方法,其特征在于,施工类用户的负荷数据为96点负荷数据;负荷数据缩放为将96点负荷数据缩放为24点负荷数据,取同小时4个点中的最大负荷值作为该小时的负荷值。
4.根据权利要求1所述的违规施工辨识方法,其特征在于,利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,包括:
设置数据簇中的最小数据点数;
随机选择数据点为圆心,调整半径大小生成数据簇;
在生成的数据簇周围进行检查,查看是否有未被包含的数据点;
对已经生成的数据簇进行噪点监测,如果数据簇中数据点差异较大,则拆分数据簇,重复上述步骤,直到数据簇的簇数不再发生变化;
对包含公共点的数据簇进行合并;
生成的数据簇进行结果输出,每个数据簇代表一类用电行为。
5.根据权利要求1所述的违规施工辨识方法,其特征在于,所构建的分类模型为Biased-SVM分类模型;Biased-SVM分类模型通过对二分类样本数据赋予不同的惩罚因子,以处理实地走访验证数据和未通过实地验证数据的不平衡性。
6.根据权利要求5所述的违规施工辨识方法,其特征在于,Biased-SVM分类模型对二分类样本数据赋予不同的惩罚因子后,目标函数变为:
Figure FDA0004076916540000021
其中,ω为垂直超平面的向量,m为样本集大小,C+为正类惩罚因子,C-为负类惩罚因子,h表示松弛变量,yi为样本集数据。
7.根据权利要求6所述的违规施工辨识方法,其特征在于,疑似违规施工用户清单的获取,包括步骤:
定义三类样本集,标记样本集X,为已知该工地是否施工数据;未标记样本集U,为未知该工地是否施工数据;在标记样本集X和未标记样本集U中随机抽取样本,组成测试样本集T;
根据专家经验设置初始的正类惩罚因子和负类惩罚因子;
使用标记样本集X训练Biased-SVM模型;
将未标记样本集U作为测试集,用训练好的Biased-SVM模型为未标记样本集U添加标签,形成新标记样本集M;
将标记样本集X与新标记样本集M汇总,并利用汇总后的标记样本集重新训练Biased-SVM模型,根据实际情况修正目标函数中的正类惩罚因子C+和负类惩罚因子C-
使用测试样本集T测试训练后的Biased-SVM模型;
根据Biased-SVM模型的输出结果,判定用户是否疑似违规施工。
8.一种基于施工场地电力数据的违规施工辨识系统,其特征在于,包括以下模块:
数据准备模块,用于根据现场勘察、调研结果,结合用户电量数据、用户状态变更信息,筛选出不同施工类型、不同施工阶段的典型用户,将其用电负荷数据作为典型样本,建立夜间违规施工分析的场景数据集;
数据簇划分模块,用于构建施工用户负荷聚类模型,对不同施工类型、不同施工阶段用户的用电行为进行归类;利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,划分出不同施工类型、不同施工阶段的多个用电行为数据簇;
异常数据筛选模块,按照用电行为数据簇,分类建立施工用户负荷特征指标;对每个数据簇中数据进行随机抽样,计算夜间每个记录点负荷值与白天负荷中位数的变化情况;与相同施工类型、阶段、时刻的用户负荷变化比进行对比,筛选异常样本数据,将异常样本所在数据簇中数据点写入异常施工数据集,得到正常施工数据集和异常施工数据集;
分类模块,用于构建分类模型,筛选施工用户特征数据集,再加以实地验证后得到疑似违规施工用户清单;
关注等级评估模块,应用所构建的分类模型,根据疑似违规施工用户清单实时监测各施工用户,对疑似违规施工用户关注等级进行评估。
9.根据权利要求8所述的违规施工辨识系统,其特征在于,数据簇划分模块中,利用基于密度的噪声应用空间的贪婪型聚类算法对施工类型和施工阶段相同的用户用电负荷数据进行分类训练,包括:
设置数据簇中的最小数据点数;
随机选择数据点为圆心,调整半径大小生成数据簇;
在生成的数据簇周围进行检查,查看是否有未被包含的数据点;
对已经生成的数据簇进行噪点监测,如果数据簇中数据点差异较大,则拆分数据簇,重复上述步骤,直到数据簇的簇数不再发生变化;
对包含公共点的数据簇进行合并;
生成的数据簇进行结果输出,每个数据簇代表一类用电行为。
10.根据权利要求8所述的违规施工辨识系统,其特征在于,分类模块所构建的分类模型为Biased-SVM分类模型;Biased-SVM分类模型通过对二分类样本数据赋予不同的惩罚因子,以处理实地走访验证数据和未通过实地验证数据的不平衡性;
Biased-SVM分类模型对二分类样本数据赋予不同的惩罚因子后,目标函数变为:
Figure FDA0004076916540000031
其中,ω为垂直超平面的向量,m为样本集大小,C+为正类惩罚因子,C-为负类惩罚因子,h表示松弛变量,yi为样本集数据;
疑似违规施工用户清单的获取过程包括:
定义三类样本集,标记样本集X,为已知该工地是否施工数据;未标记样本集U,为未知该工地是否施工数据;在标记样本集X和未标记样本集U中随机抽取样本,组成测试样本集T;
根据专家经验设置初始的正类惩罚因子和负类惩罚因子;
使用标记样本集X训练Biased-SVM模型;
将未标记样本集U作为测试集,用训练好的Biased-SVM模型为未标记样本集U添加标签,形成新标记样本集M;
将标记样本集X与新标记样本集M汇总,并利用汇总后的标记样本集重新训练Biased-SVM模型,根据实际情况修正目标函数中的正类惩罚因子C+和负类惩罚因子C-
使用测试样本集T测试训练后的Biased-SVM模型;
根据Biased-SVM模型的输出结果,判定用户是否疑似违规施工。
CN202310111517.7A 2023-02-14 2023-02-14 基于施工场地电力数据的违规施工辨识方法和系统 Pending CN116205528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310111517.7A CN116205528A (zh) 2023-02-14 2023-02-14 基于施工场地电力数据的违规施工辨识方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310111517.7A CN116205528A (zh) 2023-02-14 2023-02-14 基于施工场地电力数据的违规施工辨识方法和系统

Publications (1)

Publication Number Publication Date
CN116205528A true CN116205528A (zh) 2023-06-02

Family

ID=86507319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310111517.7A Pending CN116205528A (zh) 2023-02-14 2023-02-14 基于施工场地电力数据的违规施工辨识方法和系统

Country Status (1)

Country Link
CN (1) CN116205528A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116702304A (zh) * 2023-08-08 2023-09-05 中建五局第三建设有限公司 一种基于无监督学习的基坑设计方案分组方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116702304A (zh) * 2023-08-08 2023-09-05 中建五局第三建设有限公司 一种基于无监督学习的基坑设计方案分组方法和装置
CN116702304B (zh) * 2023-08-08 2023-10-20 中建五局第三建设有限公司 一种基于无监督学习的基坑设计方案分组方法和装置

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
WO2021184630A1 (zh) 基于知识图谱定位排污对象的方法及相关设备
CN111275333B (zh) 污染数据处理方法和装置
CN110705855A (zh) 一种企业环境画像评价方法及系统
CN107292417B (zh) 基于重污染序列案例库的区域重污染判别预报方法及装置
CN114048870A (zh) 一种基于日志特征智能挖掘的电力系统异常监测方法
CN113378899B (zh) 非正常账号识别方法、装置、设备和存储介质
CN113298422A (zh) 一种基于用电数据的污染源企业违规生产监控方法
CN111126820A (zh) 反窃电方法及系统
CN114519524A (zh) 基于知识图谱的企业风险预警方法、装置及存储介质
CN112906790B (zh) 一种基于用电数据的独居老人识别方法和系统
CN112906738A (zh) 一种水质检测及处理方法
CN116205528A (zh) 基于施工场地电力数据的违规施工辨识方法和系统
CN115879915B (zh) 一种用于发电厂的跨平台标准化检修方法
CN111506635A (zh) 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN110807174B (zh) 一种基于统计分布的污水厂厂群出水分析及异常识别方法
CN111949852A (zh) 一种基于互联网大数据的宏观经济分析方法及系统
CN114022053B (zh) 一种基于风险因子的审计系统及设备
CN113705229B (zh) 基于电力大数据的高危企业违规生产识别方法
Mao et al. Interpreting machine learning models for room temperature prediction in non-domestic buildings
CN109447490B (zh) 一种基于用户地址的户变关系异常判别方法
CN110175200A (zh) 一种基于人工智能算法的异常用能分析方法及系统
CN117726053B (zh) 应用于数字化平台系统的碳排放监测方法及系统
CN115270140B (zh) 一种软件安全漏洞管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination