CN111950620A - 基于DBSCAN和K-means算法的用户筛选方法 - Google Patents
基于DBSCAN和K-means算法的用户筛选方法 Download PDFInfo
- Publication number
- CN111950620A CN111950620A CN202010788081.1A CN202010788081A CN111950620A CN 111950620 A CN111950620 A CN 111950620A CN 202010788081 A CN202010788081 A CN 202010788081A CN 111950620 A CN111950620 A CN 111950620A
- Authority
- CN
- China
- Prior art keywords
- samples
- dbscan
- clustering
- cluster
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012216 screening Methods 0.000 title claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 15
- 230000035945 sensitivity Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000005065 mining Methods 0.000 abstract description 4
- 238000009472 formulation Methods 0.000 abstract description 3
- 239000000203 mixture Substances 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于DBSCAN和K‑means算法的用户筛选方法,包括步骤:获取待分析行业中若干用户负荷曲线样本;通过DBSCAN算法剔除所述样本中的异常样本,获得处理后的样本;通过改进的K‑means方法对所述处理后的样本进行聚类获得聚类结果;根据所述聚类结果,确定并输出典型用户。本发明结合DBSCAN和改进K‑means两种算法的优势,提出聚类用户筛选方法,对待研究的行业的用户负荷曲线的数据样本进行筛选聚类,从而确定典型用户,对各类用户数据挖掘分析,便于电网企业准确把握用户对用电服务的差异化需求的用户筛选,实现制定针对性的分类用户电网调控政策。
Description
技术领域
本发明涉及电力分析技术领域,具体涉及一种基于DBSCAN和K-means算法的用户筛选方法。
背景技术
电力需求侧管理通过需求侧资源优化配置,实现系统安全水平和运行效益的优化提升。随着负荷用电形势日趋多元化、以及配电侧电动汽车、储能及新能源发电等分布式资源的快速发展,电力需求侧管理资源特性各异、高度分散,对系统级的需求侧资源综合协调优化技术提出了越来越高的要求,受技术条件限制,传统的电力需求侧优化管理技术难以实现整体效益最优和分布式资源的精准管理。
随着电动汽车、工业过程负荷、云计算负荷、温控负荷等新型具有柔性调节能力的负荷的大量接入,用户在用电行为特征方面的多元性突显。高度分散的用户需求响应特性各异,需要基于大数据分析技术对数据采集终端采集到的实时负荷数据进行多元用户行为分析。
有鉴于此,亟需提供一种基于对各类用户数据挖掘分析,准确把握用户对用电服务的差异化需求的用户筛选方法。
发明内容
为了解决上述技术问题,本发明所采用的技术方案是提供了一种基于DBSCAN和K-means算法的用户筛选方法,包括以下步骤:
获取待分析行业中若干用户负荷曲线的样本;通过DBSCAN算法剔除所述样本中的异常样本,获得处理后的样本;通过改进的K-means方法对所述处理后的样本进行聚类获得聚类结果;根据所述聚类结果,确定并输出典型用户。
在上述方法中,以日负荷曲线为特征量进行聚类形成聚类样本。
在上述方法中,对负荷曲线进行归一化处理。
在上述方法中,所述通过DBSCAN算法剔除所述数据样本中的异常样本具体包括以下步骤:
设置搜索半径ε和最小对象数目Nminpts,系统将搜索空间中每个对象在搜索半径ε范围内覆盖的其他对象的数量与预先设置的最小对象数目Nminpts进行比较,将数量大于最小对象数目的对象划分为核心点,将数量等于Nminpts的对象划分为边界点,数量小于Nminpts的对象归为噪声点,聚类得到的噪声点即为异常样本,从而剔除这些异常样本,获得处理后的样本。
在上述方法中,所述通过改进的K-means方法对所述处理后的样本进行聚类获得聚类结果具体包括以下步骤:
利用切比雪夫距离对欧氏距离进行处理后的样本的内部加权,用归一化处理来消除欧氏距离对噪声点和离群点敏感,使得数据对象能够更科学地划分到所属的聚类集中。
定义处理后的样本点间的距离函数为:
式中,X={x1,x2,…xn},xi={xi1,xi2,…xim},其中,n为样本数据的个数,m为每个样本的维数。
再通过改进的K-means算法进行聚类,具体流程如下:
A1、随机选择第一个初始簇质心;
A2、计算数据集X中每个点到最近已选出的簇质心的距离;
A3、选择相异度较大的点,作为下一个簇质心;
A4、若已选出k个簇质心,则进行步骤A5,否则,重复步骤A2;
A5、测量剩余样本点其到每个簇质心的距离,并把它归到最近的质心所在的簇;
A6、重新计算已经得到的各个簇的质心;
A7、重复步骤A5—A6,直到k个质心不再发生变化。
本发明结合DBSCAN和改进K-means两种算法的优势,提出聚类用户筛选方法,对待研究的行业的用户负荷曲线的数据样本进行筛选聚类,从而确定典型用户,对各类用户数据挖掘分析,便于电网企业准确把握用户对用电服务的差异化需求的用户筛选,实现制定针对性的分类用户电网调控政策。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的方法流程图。
具体实施方式
下面结合具体实施方式和说明书附图对本发明做出详细的说明。
如图1所示,本发明提供了一种基于DBSCAN和K-means算法的用户筛选方法,包括以下步骤:
S1、获取待分析行业中若干用户负荷曲线的样本;
本实施例,通过选取待研究的行业,从行业中随机选取若干用户,以日负荷曲线为特征量形成样本,从而选取该行业最具代表性的用户进行负荷特性分析。
聚类是按相似程度的高低,依次将数据归并为多个类的过程。同一类中数据相似性较高,不同类中的数据有明显的差异性。现有的聚类算法大体可分为:划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法。
本实施例,为了消除样本幅值差异对聚类结果的影响,在进行聚类前对数据样本进行归一化处理。
S2、通过DBSCAN算法剔除所述数据样本中的异常样本,获得处理后的聚类样本。
本实施例,通过DBSCAN算法剔除所述数据样本中的异常样本具体包括以下步骤:
本算法主要涉及2个参数:搜索半径ε和最小对象数目Nminpts。因此,设置搜索半径ε和最小对象数目Nminpts,系统将搜索空间中每个对象在搜索半径ε范围内覆盖的其他对象的数量与预先设置的最小对象数目Nminpts进行比较,将数量大于最小对象数目的对象划分为核心点,将数量等于Nminpts的对象划分为边界点,数量小于Nminpts的对象归为噪声点。聚类得到的噪声点即为异常样本,从而剔除这些异常样本,获得处理后的样本。
S3、通过改进的K-means方法对所述处理后的样本进行聚类获得聚类结果;具体包括以下步骤:
利用切比雪夫距离对欧氏距离进行处理后的样本的内部加权,用归一化处理来消除欧氏距离对噪声点和离群点敏感,使得数据对象能够更科学地划分到所属的聚类集中。
定义处理后的样本点间的距离函数为:
式中,X={x1,x2,…xn},xi={xi1,xi2,…xim},其中,n为样本数据的个数,m为每个样本的维数。
再通过改进的K-means算法进行聚类,具体流程如下:
A1、随机选择第一个初始簇质心;
A2、计算数据集X中每个点到最近已选出的簇质心的距离;
A3、选择相异度较大的点,作为下一个簇质心;
A4、若已选出k个簇质心,则进行步骤A5,否则,重复步骤A2;
A5、测量剩余样本点其到每个簇质心的距离,并把它归到最近的质心所在的簇;
A6、重新计算已经得到的各个簇的质心;
A7、重复步骤A5—A6,直到k个质心不再发生变化。
S4、根据步骤S3聚类结果,确定并输出典型用户;选择改进的K-means方法进行聚类后的获得的各个簇的质心作为典型用户。
本发明中,在聚类算法中,K-means算法是一种最流行的、应用最广泛的一种聚类算法,因为它易于实现和计算效率高的特点,受到了很多研究者的青睐。
但是,K-means算法对孤立点、离群点极其敏感,并易受噪声影响。典型风光出力场景与噪声在各时段具有较大差异,在向量空间中的分布存在较明显的密度差异,需要从样本集中剔除这些异常样本,提取典型样本曲线。DBSCAN(Density Based SpatialClustering of Applicationswith Noise)是一种典型的基于密度的聚类算法,能够自动滤去偏离较大的噪声点,适用于异常样本的识别。本发明结合DBSCAN和改进K-means两种算法的优势,提出聚类用户筛选方法,对待研究的行业的用户负荷曲线的数据样本进行筛选聚类,从而确定典型用户,对各类用户数据挖掘分析,便于电网企业准确把握用户对用电服务的差异化需求的用户筛选,实现制定针对性的分类用户电网调控政策。
本发明不局限于上述最佳实施方式,任何人应该得知在本发明的启示下作出的结构变化,凡是与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。
Claims (5)
1.一种基于DBSCAN和K-means算法的典型用户筛选方法,其特征在于,包括以下步骤:
获取待分析行业中若干用户负荷曲线的样本;通过DBSCAN算法剔除所述样本中的异常样本,获得处理后的样本;通过改进的K-means方法对所述处理后的样本进行聚类获得聚类结果;根据所述聚类结果,确定并输出典型用户。
2.如权利要求1所述的基于DBSCAN和K-means算法的用户筛选方法,其特征在于,以日负荷曲线为特征量进行聚类形成聚类样本。
3.如权利要求2所述的基于DBSCAN和K-means算法的用户筛选方法,其特征在于,对负荷曲线进行归一化处理。
4.如权利要求1-3任意所述的基于DBSCAN和K-means算法的用户筛选方法,其特征在于,所述通过DBSCAN算法剔除所述数据样本中的异常样本具体包括以下步骤:
设置搜索半径ε和最小对象数目Nminpts,系统将搜索空间中每个对象在搜索半径ε范围内覆盖的其他对象的数量与预先设置的最小对象数目Nminpts进行比较,将数量大于最小对象数目的对象划分为核心点,将数量等于Nminpts的对象划分为边界点,数量小于Nminpts的对象归为噪声点,聚类得到的噪声点即为异常样本,从而剔除这些异常样本,获得处理后的样本。
5.如权利要求1所述的基于DBSCAN和K-means算法的用户筛选方法,其特征在于,所述通过改进的K-means方法对所述处理后的样本进行聚类获得聚类结果具体包括以下步骤:
利用切比雪夫距离对欧氏距离进行处理后的样本的内部加权,用归一化处理来消除欧氏距离对噪声点和离群点敏感,使得数据对象能够更科学地划分到所属的聚类集中。
定义处理后的样本点间的距离为:
式中,X={x1,x2,...xn},xi={xi1,xi2,…xim},其中,n为样本数据的个数,m为每个样本的维数。
再通过改进的K-means算法进行聚类,具体流程如下:
A1、随机选择第一个初始簇质心;
A2、计算数据集X中每个点到最近已选出的簇质心的距离;
A3、选择相异度较大的点,作为下一个簇质心;
A4、若已选出k个簇质心,则进行步骤A5,否则,重复步骤A2;
A5、测量剩余样本点其到每个簇质心的距离,并把它归到最近的质心所在的簇;
A6、重新计算已经得到的各个簇的质心;
A7、重复步骤A5—A6,直到k个质心不再发生变化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010788081.1A CN111950620A (zh) | 2020-08-07 | 2020-08-07 | 基于DBSCAN和K-means算法的用户筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010788081.1A CN111950620A (zh) | 2020-08-07 | 2020-08-07 | 基于DBSCAN和K-means算法的用户筛选方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111950620A true CN111950620A (zh) | 2020-11-17 |
Family
ID=73332558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010788081.1A Pending CN111950620A (zh) | 2020-08-07 | 2020-08-07 | 基于DBSCAN和K-means算法的用户筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950620A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528113A (zh) * | 2020-12-16 | 2021-03-19 | 国网经济技术研究院有限公司 | 基于供电可靠性多维大数据的终端用户划分方法及系统 |
CN112766733A (zh) * | 2021-01-21 | 2021-05-07 | 山东大学 | 利用改进的K-means算法加速优化调度算法收敛的方法及系统 |
CN113411415A (zh) * | 2021-05-13 | 2021-09-17 | 郑州埃文计算机科技有限公司 | 一种基于ip网络特征和地理特征的基准点清洗方法 |
CN113723671A (zh) * | 2021-08-16 | 2021-11-30 | 盛隆电气集团有限公司 | 一种基于用电情况大数据的数据聚类分析方法 |
CN113743519A (zh) * | 2021-09-09 | 2021-12-03 | 中国南方电网有限责任公司 | 电网母线典型负荷曲线识别方法 |
CN116628729B (zh) * | 2023-07-25 | 2023-09-29 | 天津市城市规划设计研究总院有限公司 | 根据数据特性差异化提升数据安全的方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002169613A (ja) * | 2000-12-04 | 2002-06-14 | Hitachi Ltd | 電力ロードカーブの分析方法およびシステム |
KR20110022460A (ko) * | 2009-08-27 | 2011-03-07 | 한국전력공사 | 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법 |
CN104063480A (zh) * | 2014-07-02 | 2014-09-24 | 国家电网公司 | 一种基于电力大数据的负荷曲线并行聚类方法 |
WO2015172374A1 (en) * | 2014-05-16 | 2015-11-19 | Accenture Global Services Limited | System, method and apparatuses for identifying load volatility of a power customer and a tangible computer readable medium |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN109508754A (zh) * | 2015-08-06 | 2019-03-22 | 北京奇虎科技有限公司 | 数据聚类的方法及装置 |
CN109657891A (zh) * | 2018-09-18 | 2019-04-19 | 深圳供电局有限公司 | 一种基于自适应k-means++算法的负荷特性分析方法 |
CN109902953A (zh) * | 2019-02-27 | 2019-06-18 | 华北电力大学 | 一种基于自适应粒子群聚类的电力用户分类方法 |
CN110796173A (zh) * | 2019-09-27 | 2020-02-14 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
CN111046532A (zh) * | 2019-11-22 | 2020-04-21 | 南瑞集团有限公司 | 一种基于肘形判据的同调机群聚类识别方法 |
CN111340065A (zh) * | 2020-02-08 | 2020-06-26 | 南京邮电大学 | 一种基于复杂用户行为分析的用户负荷窃电模型挖掘系统及方法 |
-
2020
- 2020-08-07 CN CN202010788081.1A patent/CN111950620A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002169613A (ja) * | 2000-12-04 | 2002-06-14 | Hitachi Ltd | 電力ロードカーブの分析方法およびシステム |
KR20110022460A (ko) * | 2009-08-27 | 2011-03-07 | 한국전력공사 | 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법 |
WO2015172374A1 (en) * | 2014-05-16 | 2015-11-19 | Accenture Global Services Limited | System, method and apparatuses for identifying load volatility of a power customer and a tangible computer readable medium |
CN104063480A (zh) * | 2014-07-02 | 2014-09-24 | 国家电网公司 | 一种基于电力大数据的负荷曲线并行聚类方法 |
CN109508754A (zh) * | 2015-08-06 | 2019-03-22 | 北京奇虎科技有限公司 | 数据聚类的方法及装置 |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN109657891A (zh) * | 2018-09-18 | 2019-04-19 | 深圳供电局有限公司 | 一种基于自适应k-means++算法的负荷特性分析方法 |
CN109902953A (zh) * | 2019-02-27 | 2019-06-18 | 华北电力大学 | 一种基于自适应粒子群聚类的电力用户分类方法 |
CN110796173A (zh) * | 2019-09-27 | 2020-02-14 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
CN111046532A (zh) * | 2019-11-22 | 2020-04-21 | 南瑞集团有限公司 | 一种基于肘形判据的同调机群聚类识别方法 |
CN111340065A (zh) * | 2020-02-08 | 2020-06-26 | 南京邮电大学 | 一种基于复杂用户行为分析的用户负荷窃电模型挖掘系统及方法 |
Non-Patent Citations (5)
Title |
---|
LIPING ZHANG 等: "Analysis of Power Consumer Behavior Based on the Complementation of K-means and DBSCAN", 《2017 EI2》, pages 1 - 5 * |
宋董飞 等: "DBSCAN算法研究及并行化实现", 《计算机工程与应用》, vol. 54, no. 24, pages 52 - 56 * |
宋阳 等: "基于 MapReduce 框架下的 K-means 聚类算法的改进", 《计算机与现代化》, no. 2019, pages 28 - 32 * |
金之榆 等: "基于 DBSCAN 和改进 K-means 聚类算法的电力负荷聚类研究", 《东北电力技术》, vol. 40, no. 6, pages 10 - 14 * |
黄宇腾: "负荷形态分析与负荷管理优化研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》, no. 2013, pages 042 - 807 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528113A (zh) * | 2020-12-16 | 2021-03-19 | 国网经济技术研究院有限公司 | 基于供电可靠性多维大数据的终端用户划分方法及系统 |
CN112766733A (zh) * | 2021-01-21 | 2021-05-07 | 山东大学 | 利用改进的K-means算法加速优化调度算法收敛的方法及系统 |
CN113411415A (zh) * | 2021-05-13 | 2021-09-17 | 郑州埃文计算机科技有限公司 | 一种基于ip网络特征和地理特征的基准点清洗方法 |
CN113723671A (zh) * | 2021-08-16 | 2021-11-30 | 盛隆电气集团有限公司 | 一种基于用电情况大数据的数据聚类分析方法 |
CN113723671B (zh) * | 2021-08-16 | 2024-03-19 | 盛隆电气集团有限公司 | 一种基于用电情况大数据的数据聚类分析方法 |
CN113743519A (zh) * | 2021-09-09 | 2021-12-03 | 中国南方电网有限责任公司 | 电网母线典型负荷曲线识别方法 |
CN116628729B (zh) * | 2023-07-25 | 2023-09-29 | 天津市城市规划设计研究总院有限公司 | 根据数据特性差异化提升数据安全的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950620A (zh) | 基于DBSCAN和K-means算法的用户筛选方法 | |
CN109978070A (zh) | 一种改进的K-means异常值检测方法以及装置 | |
Fawzy et al. | The evolution of data mining techniques to big data analytics: An extensive study with application to renewable energy data analytics | |
CN112330078B (zh) | 用电量预测方法、装置、计算机设备和存储介质 | |
CN111681132B (zh) | 适用于海量类别不平衡负荷数据的典型用电模式提取方法 | |
CN107832456A (zh) | 一种基于临界值数据划分的并行knn文本分类方法 | |
Tuba et al. | Combined elephant herding optimization algorithm with K-means for data clustering | |
CN113657678A (zh) | 一种基于信息新鲜度的电网电力数据预测方法 | |
Chen et al. | Clustering in big data | |
CN116701979A (zh) | 基于受限k-均值的社交网络数据分析方法及系统 | |
CN115496249A (zh) | 一种基于聚类算法的工业可调负荷潜力分析方法及系统 | |
Ismaeel et al. | An efficient workload clustering framework for large-scale data centers | |
CN111797899B (zh) | 一种低压台区kmeans聚类方法及系统 | |
CN109784354A (zh) | 基于改进分类效用的无参数聚类方法及电子设备 | |
CN102426598A (zh) | 一种用于网络内容安全管理的中文文本聚类的方法 | |
Gavagsaz | Efficient parallel processing of k-nearest neighbor queries by using a centroid-based and hierarchical clustering algorithm | |
CN113723514B (zh) | 一种基于混合采样的安全接入日志数据平衡处理方法 | |
CN114358207A (zh) | 一种改进的k-means异常负荷检测方法及系统 | |
Singh et al. | Multiclass imbalanced big data classification utilizing spark cluster | |
CN115292361A (zh) | 一种分布式能源异常数据的筛选方法及系统 | |
CN114185956A (zh) | 基于canopy、k-means算法的数据挖掘方法 | |
Lu et al. | A k-means clustering optimization algorithm for spatiotemporal trajectory data | |
CN112215297A (zh) | 基于因子分析的生产制造数据分层聚类方法 | |
CN112766356A (zh) | 一种基于动态权重D-XGBoost模型的预测方法及系统 | |
Liu et al. | Accurate grid-based clustering algorithm with diagonal grid searching and merging |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |