CN110866074A - 基于地域特征的电能表改进型K-means分类方法 - Google Patents
基于地域特征的电能表改进型K-means分类方法 Download PDFInfo
- Publication number
- CN110866074A CN110866074A CN201910588866.1A CN201910588866A CN110866074A CN 110866074 A CN110866074 A CN 110866074A CN 201910588866 A CN201910588866 A CN 201910588866A CN 110866074 A CN110866074 A CN 110866074A
- Authority
- CN
- China
- Prior art keywords
- data
- executing
- electric energy
- energy meter
- intelligent electric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000007613 environmental effect Effects 0.000 claims abstract description 9
- 150000003839 salts Chemical class 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract 1
- 241001494479 Pecora Species 0.000 description 3
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Water Supply & Treatment (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Remote Sensing (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及基于地域特征的电能表改进型K‑means分类方法。本发明能够根据地区环境特征将智能电能表准确分类。首先,根据智能电能表运行的环境数据,提出地区特征的提取原则,提取出能够将智能电能表分类的特征数据。然后,对传统K‑means算法在初值选取、聚类中心的移动规则上进行改进,利用提取的环境特征数据,将电能表分类,提高了分类的准确性。
Description
技术领域
本发明涉及数据挖掘领域,特别涉及批量智能电能表的归类方法。
背景技术
智能电能表运行可靠性、计量准确是电力企业、用户及行业专家所关注的问题。现有的智能电能表可靠性评价是基于实验室实验的结果,很难发现在典型环境下潜在的质量缺陷。在实际运行过程中,环境条件对其可靠性的影响是至关重要的因素。特别是我国幅员辽阔,地理情况和气候条件复杂,诱发故障的因素较多,用定性或定量的单一方法进行研究、控制和管理是不科学的。
为了深入研究复杂环境下智能电能表的运行情况,国网计量中心已在黑龙江漠河、新疆恰特卡勒、西藏羊八井、福建湄洲岛四个地区,分别开展高严寒、高干热、高海拔、高湿热高盐雾环境条件下的智能电能表可靠性的验证工作,为智能电能表在不同地区的差异化配置提供技术指导。四省典型环境下的智能电能表工况数据全部上传至主站,存储于数据库中,要研究典型环境对电能表运行可靠性的影响,首先需要根据这些数据将智能电能表按地域特征区分开来。数据库中包含所有智能电能表不同时刻上传的数据。通过提取四个地区历史天气情况,环境特点如下:
黑龙江漠河县年平均气温在-5.5℃。11月、4月气温在零下20~30度左右。12月、1月、2月在零下25~40度左右;恰特卡勒乡位于吐鲁番市东南17公里处,吐鲁番属独特的暖温带大陆性干旱荒漠气候。全年平均气温为14℃,一年中,以一月份最冷,7月份最热;羊八井,即羊八井镇,位于西藏拉萨市西北91.8公里的当雄县境内。海拔4300米,南北两侧的山峰均在海拔5500~6000米以上,当地年平均气温2.5℃,大气压力年平均为0.06兆帕;湄洲岛坐落于莆田市南部,是一座南北纵向狭长的小岛,距离市区约42公里。年均气温摄氏21度,年均降雨量1000mm左右,6、7月份多雨。
发明内容
根据四省的环境特点,本发明提供一种基于地域特征的应用改进K-means算法的智能电能表的归类方法,该方法包括:
步骤一:获取数据库中数据,将整个大数据集的数据按照智能电能表编号拆分成单只智能电能表的小数据集Ⅰ,执行步骤二;
步骤二:分析地域特征,确定每个智能电能表特征数据的维度。本专利涉及的四个地区的环境分别代表了高严寒、高干热、高湿热、高盐雾和高海拔的四种典型环境。环境特点区别较大,典型地域特征重叠性小。因此,选取三类特征数据即每个智能电能表的特征数据维度为3。执行步骤三
步骤三:差异最大化原则选取特征数据:对每一类特征数据提取一年中差异较大时段的数据。例如2月3日4点温度(温度较低的时间),8月1日14点温度(温度较高的时间),2月3日0点气压(气压较低的时间)。执行步骤四;
步骤四:将步骤三中提取的三个参数组成三维数组X i (a i ,b i ,c i )中i为智能电能表编号,a i 为4时温度数值,b i 为14时温度数值,c i 为4时气压数值,执行步骤五;
步骤五:归一化X i (a i ,b i ,c i )中的数据,令y i 分别为a i 、b i 、c i 时,计算
y i ’=[y i -min(y i )]/[max(y i )-min(y i )],其中max(y i )和min(y i )表示对应元素项中的最大值和最小值,处理后将得到x i (a’ i ,b’ i ,c’ i )存储于数据集Ⅱ={x i |i=1,2,…n},n表示数据集的大小,即有n块智能电能表,执行步骤六;
步骤八:设置一个阈值ε,如果数据点距离任意已选聚类中心的距离小于该阈值,则去掉该数据点,执行步骤九;
步骤九:分别计算余下的各个数据点,即
步骤十:重复步骤七到九,直到4个聚类中心全部被选出,执行步骤十一;
步骤十四:令步骤十二中计算中位数等于新的聚类中心,执行步骤十一;
步骤十五:聚类结束,步骤十一中得到的4个簇就是将数组数据集Ⅱ归好的4类。
数组数据是每只智能电能表的特征数据,依照数据集Ⅱ的分类结果,根据智能电能表编号就可将包含全部数据信息的单只智能电能表的数据集Ⅰ分成四类。
本发明的优点:该方法提取电能表运行的环境数据,根据典型地域特征将电能表归类。并对传统的K-means算法在初值选取、聚类中心的移动规则上进行改进,提高了分类的准确性。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为基于地域特征的智能电能表归类流程图;
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的方法进行详细地描述,然而,本发明可以用许多不同形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。
图1是本发明具有具体实施方式的基于自然环境特征的智能电能表归类流程图,所述的方法包括以下步骤:
步骤一:获取数据库中数据,将整个大数据集的数据按照智能电能表编号拆分成单只智能电能表的小数据集Ⅰ,执行步骤二;
步骤二:分析地域特征,确定每个智能电能表特征数据的维度。本专利涉及的四个地区的环境分别代表了高严寒、高干热、高湿热、高盐雾和高海拔的四种典型环境。环境特点区别较大,典型地域特征重叠性小。因此,选取三类特征数据即每个智能电能表的特征数据维度为3。执行步骤三
步骤三:差异最大化原则选取特征数据:对每一类特征数据提取一年中差异较大时段的数据。例如2月3日4点温度(温度较低的时间),8月1日14点温度(温度较高的时间),2月3日0点气压(气压较低的时间)。执行步骤四;
步骤四:将步骤三中提取的三个参数组成三维数组X i (a i ,b i ,c i )中i为智能电能表编号,a i 为4时温度数值,b i 为14时温度数值,c i 为4时气压数值,执行步骤五;
步骤五:归一化X i (a i ,b i ,c i )中的数据,令y i 分别为a i 、b i 、c i 时,计算
y i ’=[y i -min(y i )]/[max(y i )-min(y i )],其中max(y i )和min(y i )表示对应元素项中的最大值和最小值,处理后将得到x i (a’ i ,b’ i ,c’ i )存储于数据集Ⅱ={x i |i=1,2,…n},n表示数据集的大小,即有n块智能电能表,执行步骤六;
步骤八:设置一个阈值ε,如果数据点距离任意已选聚类中心的距离小于该阈值,则去掉该数据点,执行步骤九;
步骤九:分别计算余下的各个数据点,即
步骤十:重复步骤七到九,直到4个聚类中心全部被选出,执行步骤十一;
步骤十四:令步骤十二中计算中位数等于新的聚类中心,执行步骤十一;
步骤十五:聚类结束,步骤十一中得到的4个簇就是将数组数据集Ⅱ归好的4类。
Claims (3)
1.基于地域特征的电能表改进型K-means分类方法,其特征在于,所述方法包括:
步骤一:获取数据库中数据,将整个大数据集的数据按照智能电能表编号拆分成单只智能电能表的小数据集Ⅰ,执行步骤二;
步骤二:分析地域特征,确定每个智能电能表特征数据的维度;本专利涉及的四个地区的环境分别代表了高严寒、高干热、高湿热、高盐雾和高海拔的四种典型环境;环境特点区别较大,典型地域特征重叠性小;因此,选取三类特征数据即每个智能电能表的特征数据维度为3;执行步骤三;
步骤三:差异最大化原则选取特征数据:对每一类特征数据提取一年中差异较大时段的数据;例如2月3日4点温度(温度较低的时间),8月1日14点温度(温度较高的时间),2月3日0点气压(气压较低的时间);执行步骤四;
步骤四:将步骤三中提取的三个参数组成三维数组X i (a i ,b i ,c i )中i为智能电能表编号,a i 为4时温度数值,b i 为14时温度数值,c i 为4时气压数值,执行步骤五;
步骤五:归一化X i (a i ,b i ,c i )中的数据,令y i 分别为a i 、b i 、c i 时,计算
y i ’=[y i -min(y i )]/[max(y i )-min(y i )],其中max(y i )和min(y i )表示对应元素项中的最大值和最小值,处理后将得到x i (a’ i ,b’ i ,c’ i )存储于数据集Ⅱ={x i |i=1,2,…n},n表示数据集的大小,即有n块智能电能表,执行步骤六;
步骤八:设置一个阈值ε,如果数据点距离任意已选聚类中心的距离小于该阈值,则去掉该数据点,执行步骤九;
步骤九:分别计算余下的各个数据点,即
步骤十:重复步骤七到九,直到4个聚类中心全部被选出,执行步骤十一;
步骤十四:令步骤十二中计算中位数等于新的聚类中心,执行步骤十一;
步骤十五:聚类结束,步骤十一中得到的4个簇就是将数组数据集Ⅱ归好的4类。
2.根据权利要求1所述的方法,其特征在于,在步骤九中,j的取值范围是从1到4。
3.根据权利要求1所述的方法,其特征在于,数据集Ⅱ中的数据来源于数据集Ⅰ,依照数据集Ⅱ的分类结果,就可以将包含全部数据信息的单只智能电能表的小数据集Ⅰ分成A、B、C、D四类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910588866.1A CN110866074B (zh) | 2019-07-02 | 2019-07-02 | 基于地域特征的电能表改进型K-means分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910588866.1A CN110866074B (zh) | 2019-07-02 | 2019-07-02 | 基于地域特征的电能表改进型K-means分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110866074A true CN110866074A (zh) | 2020-03-06 |
CN110866074B CN110866074B (zh) | 2022-11-04 |
Family
ID=69651970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910588866.1A Active CN110866074B (zh) | 2019-07-02 | 2019-07-02 | 基于地域特征的电能表改进型K-means分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866074B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948524A (zh) * | 2021-04-21 | 2021-06-11 | 广东电网有限责任公司计量中心 | 基于环境和地理特征的智能电表运行区域分组方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120185728A1 (en) * | 2010-12-24 | 2012-07-19 | Commonwealth Scientific And Industrial Research Organisation | System and method for detecting and/or diagnosing faults in multi-variable systems |
CN106021452A (zh) * | 2016-05-16 | 2016-10-12 | 南方电网科学研究院有限责任公司 | 一种电磁环境测量数据清洗方法 |
CN108460486A (zh) * | 2018-03-05 | 2018-08-28 | 国网上海市电力公司 | 一种基于改进聚类算法和神经网络的电压偏差预测方法 |
CN108776814A (zh) * | 2018-06-01 | 2018-11-09 | 广东电网有限责任公司 | 一种电力通信数据资源并行化聚类方法 |
CN109376944A (zh) * | 2018-11-13 | 2019-02-22 | 国网宁夏电力有限公司电力科学研究院 | 智能电表预测模型的构建方法及装置 |
CN109635950A (zh) * | 2018-11-30 | 2019-04-16 | 国网上海市电力公司 | 基于遗传算法和社团聚类的电能表运行状态监测方法 |
CN109858667A (zh) * | 2018-12-21 | 2019-06-07 | 国网江苏省电力有限公司苏州供电分公司 | 一种基于雷电气候对负荷影响的短期负荷聚类方法 |
-
2019
- 2019-07-02 CN CN201910588866.1A patent/CN110866074B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120185728A1 (en) * | 2010-12-24 | 2012-07-19 | Commonwealth Scientific And Industrial Research Organisation | System and method for detecting and/or diagnosing faults in multi-variable systems |
CN106021452A (zh) * | 2016-05-16 | 2016-10-12 | 南方电网科学研究院有限责任公司 | 一种电磁环境测量数据清洗方法 |
CN108460486A (zh) * | 2018-03-05 | 2018-08-28 | 国网上海市电力公司 | 一种基于改进聚类算法和神经网络的电压偏差预测方法 |
CN108776814A (zh) * | 2018-06-01 | 2018-11-09 | 广东电网有限责任公司 | 一种电力通信数据资源并行化聚类方法 |
CN109376944A (zh) * | 2018-11-13 | 2019-02-22 | 国网宁夏电力有限公司电力科学研究院 | 智能电表预测模型的构建方法及装置 |
CN109635950A (zh) * | 2018-11-30 | 2019-04-16 | 国网上海市电力公司 | 基于遗传算法和社团聚类的电能表运行状态监测方法 |
CN109858667A (zh) * | 2018-12-21 | 2019-06-07 | 国网江苏省电力有限公司苏州供电分公司 | 一种基于雷电气候对负荷影响的短期负荷聚类方法 |
Non-Patent Citations (4)
Title |
---|
RAMIREZ-ROSADO I J 等: "互联网检索 k-mean electric energy meter temperature air pressure", 《RENEWABLE ENERGY》 * |
任培花等: "不确定域环境下基于DKC值改进的K-means聚类算法", 《计算机科学》 * |
崔立卿 等: "基于K均值聚类算法的大客户用电行为分析", 《浙江电力》 * |
王嘉仪: "面向大数据处理的并行优化聚类K-mean计算方法", 《信息通信》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948524A (zh) * | 2021-04-21 | 2021-06-11 | 广东电网有限责任公司计量中心 | 基于环境和地理特征的智能电表运行区域分组方法和系统 |
CN112948524B (zh) * | 2021-04-21 | 2024-04-26 | 广东电网有限责任公司计量中心 | 基于环境和地理特征的智能电表运行区域分组方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110866074B (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tilinina et al. | Comparing cyclone life cycle characteristics and their interannual variability in different reanalyses | |
CN104462184B (zh) | 一种基于双向抽样组合的大规模数据异常识别方法 | |
CN110728411B (zh) | 一种基于卷积神经网络的高低空区域联合降雨预测方法 | |
Soto et al. | Delineation of natural landscape units for Puerto Rico | |
Fang et al. | Large-scale precipitation variability over northwest China inferred from tree rings | |
CN103617336B (zh) | 一种航空噪声等值线图的绘制方法 | |
CN102693452A (zh) | 基于半监督回归学习的多模型软测量方法 | |
CN104732545A (zh) | 结合稀疏近邻传播和快速谱聚类的纹理图像分割方法 | |
CN114005048A (zh) | 基于多时相数据的土地覆盖变化与热环境影响研究方法 | |
CN113284369B (zh) | 一种基于ads-b实测航路数据的预测方法 | |
CN106919645A (zh) | 复杂地貌大景区的景点气象要素智能精细预测方法 | |
CN105243387A (zh) | 一种基于无人机影像的露天矿典型地物分类方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN109685334A (zh) | 一种新的基于多尺度理论的水文模型模拟评估方法 | |
CN110866074B (zh) | 基于地域特征的电能表改进型K-means分类方法 | |
CN113269825A (zh) | 基于地基激光雷达技术林木胸径值提取的方法 | |
CN113641733B (zh) | 一种河道断面流量实时智能推求方法 | |
Hyde et al. | A fully autonomous data density based clustering technique | |
CN110019167B (zh) | 一种中长期新能源资源资料库构建方法及系统 | |
CN106447072A (zh) | 基于显式遗传算法和奇异谱分析的气象水文要素预报方法 | |
CN103218516A (zh) | 一种聚类再回归的机场噪声单步预测方法 | |
Noor et al. | Prediction map of rainfall classification using random forest and inverse distance weighted (IDW) | |
Saha et al. | Forecast analysis of visibility for airport operations with deep learning techniques | |
CN116340838A (zh) | 基于多特征融合的自注意力机制的内蒙古草原的分类方法 | |
CN113610436B (zh) | 一种承灾体动态脆弱性评估方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |