CN107358368B - 一种面向电力用户细分的鲁棒k-means聚类方法 - Google Patents
一种面向电力用户细分的鲁棒k-means聚类方法 Download PDFInfo
- Publication number
- CN107358368B CN107358368B CN201710599773.XA CN201710599773A CN107358368B CN 107358368 B CN107358368 B CN 107358368B CN 201710599773 A CN201710599773 A CN 201710599773A CN 107358368 B CN107358368 B CN 107358368B
- Authority
- CN
- China
- Prior art keywords
- cluster
- center
- clusters
- data
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000003064 k means clustering Methods 0.000 title claims abstract description 17
- 238000011423 initialization method Methods 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims 4
- 230000011218 segmentation Effects 0.000 claims 4
- 238000003672 processing method Methods 0.000 claims 1
- 238000002759 z-score normalization Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 abstract description 2
- 238000012217 deletion Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面向电力用户细分的鲁棒k‑means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k‑means聚类方法可以解决这一缺点。
Description
技术领域
本发明涉及一种电力用户细分方法,具体涉及一种面向电力用户细分的鲁棒k-means聚类方法。
背景技术
电力作为最基本的生活、生产能源,用电客户类型非常复杂而丰富。传统模式下,电力部门是通过对用户档案进行主观判断进行归类。该方法由于人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类。
发明内容
本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,目的在于提供一种面向电力用户细分的鲁棒k-means聚类方法,解决电力部门不能实现对用户准确、快速、细致的归类的问题。
本发明通过下述技术方案实现:
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k-means聚类方法可以解决这一缺点。此方法通过对海量用户信息进行关键聚类信息识别以进行自动的聚类处理。所述数据集由多个簇组成,这是为了后续的解释方便,做了一个自定义;聚类分析作为一个广受欢迎的数据分析和数据挖掘技术,旨在将一组数据对象按相似性分成若干簇,使得同一个簇内的数据对象尽可能相似,不同簇内的对象尽可能相异。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。标准化处理可以去除数据中的空缺和冗余,保证所得结果准确有效。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。对数据所有维度进行判断,保证准确。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;如此做可以避免对初始聚类中心的选择敏感,避免选择不同的初始聚类中心将导致不同的聚类结果。
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2}(2)其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;S403:选择具有最大的最小距离的对象作为下一个簇中心,这样选择可以最大程度保证两个簇之间差异最大化,mi=argmax{min_dist(xp)}(3)其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,Nε(mi)={xp:||xp-mi||2≤ε}(4)S405:选择离Nε(mi)的均值最近的对象,更新簇中心,更新簇中心可以最大程度避免簇中心偏移,
所述步骤4中,自动分裂簇包括以下子步骤:S501:计算平均簇间差异:mi和mj表示聚类中心,表示聚类中心对的个数;S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2}计算簇间和簇内差异,为后续簇的合并和分解做准备,(7)mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;S503:当簇内差异簇被分裂成两个簇,为了得到鲁棒的和可靠的聚类结果,两个初始簇中心用改进的MaxMin初始化方法选择,使用MaxMin最大程度保证两个初始簇中心符合原有标准;S504:更新簇中心和簇的数目k;S505:当簇的数目k没改变,停止;否则,返回到第一步。如果最大簇内差异大于最小簇间差异,则簇被分裂成两个簇,这样可以保证簇内差异最小化。
所述步骤4中,自动合并簇包括以下子步骤:S601:计算平均簇间差异mi和mj表示聚类中心,表示聚类中心对的个数;S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2(8)mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;S603:当簇间差异簇被合并;S604:更新簇中心和簇的数目k;S605:当簇的数目k没改变,停止;否则,返回到第一步。如果最小簇间差异小于最大簇内差异,则簇被合并,这样可以保证簇间差异最大化。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明一种面向电力用户细分的鲁棒k-means聚类方法,克服了传统k-means算法对电力用户初始聚类中心选择敏感的问题,使用改进的MaxMin初始化方法更好地选择电力用户初始聚类中心,使得电力用户聚类结果更可靠;克服了传统k-means算法对用户事先指定的聚类数目敏感的问题,新算法可以自动地分裂和合并簇,最终得到合适的簇,使得电力用户聚类结果更可靠;
2、本发明一种面向电力用户细分的鲁棒k-means聚类方法,能够更好地选择电力用户初始聚类中心,对电力用户初始聚类中心的选择不敏感;可以自动地分裂和合并簇;
3、本发明一种面向电力用户细分的鲁棒k-means聚类方法,对聚类数目的设置不再需要依赖用户的经验;聚类结果更可靠,准确率更高;算法对参数值的选择不敏感,算法鲁棒性好。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明算法流程图;
图2为本发明初始聚类中心选择子流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
如图1-2所示:
实施例1
本发明一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动分裂簇包括以下子步骤:
S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2} (7)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;
S505:当簇的数目k没改变,停止;否则,返回到第一步。
实施例2
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动合并簇包括以下子步骤:
S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2 (8)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;
S604:更新簇中心和簇的数目k;
S605:当簇的数目k没改变,停止;否则,返回到第一步。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:包括以下步骤,
步骤1:提取电力公司任意一组用户档案数据,并对所述用户档案数据进行数据归一化处理,所述用户档案数据由多个簇组成;
步骤2:提取步骤1归一化处理后的所述用户档案数据,结合所述用户档案数据的数据属性,进行不同电力用户间的相异度计算;且所述用户档案数据属性为数值型,采用欧氏距离计算用户数据样本间的相异度;当所述用户档案数据属性为混合类型,采用公式(1)计算用户数据样本间的相异度:
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1;
步骤3:提取步骤2中所述用户档案数据中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;
步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇;
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
2.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤1中归一化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710599773.XA CN107358368B (zh) | 2017-07-21 | 2017-07-21 | 一种面向电力用户细分的鲁棒k-means聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710599773.XA CN107358368B (zh) | 2017-07-21 | 2017-07-21 | 一种面向电力用户细分的鲁棒k-means聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107358368A CN107358368A (zh) | 2017-11-17 |
CN107358368B true CN107358368B (zh) | 2021-07-20 |
Family
ID=60284878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710599773.XA Active CN107358368B (zh) | 2017-07-21 | 2017-07-21 | 一种面向电力用户细分的鲁棒k-means聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107358368B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915116A (zh) * | 2019-05-10 | 2020-11-10 | 国网能源研究院有限公司 | 一种基于K-means聚类的电力居民用户分类方法 |
CN111062502B (zh) * | 2019-12-17 | 2023-07-14 | 国网湖南省电力有限公司 | 用户用电行为细分方法及其故障分析方法 |
CN112101611B (zh) * | 2020-07-31 | 2022-11-18 | 重庆锐云科技有限公司 | 房地产客户复购时间的预测方法、服务器及存储介质 |
CN112132217B (zh) * | 2020-09-23 | 2023-08-15 | 广西大学 | 一种基于簇内簇间相异度的分类型数据聚类方法 |
CN113935410B (zh) * | 2021-10-13 | 2024-07-16 | 甘肃同兴智能科技发展有限责任公司 | 一种基于交并比密度聚类的电力客户画像方法 |
CN118133051B (zh) * | 2024-05-08 | 2024-07-16 | 北京国网信通埃森哲信息技术有限公司 | 一种要素评估模型的构建方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814063A (zh) * | 2010-05-24 | 2010-08-25 | 天津大学 | 基于距离权重的全局k-均值聚类算法 |
US20120328193A1 (en) * | 2011-06-24 | 2012-12-27 | Lg Innotek Co., Ltd. | Method for enhancing image edge |
CN104462819A (zh) * | 2014-12-09 | 2015-03-25 | 国网四川省电力公司信息通信公司 | 一种基于密度聚类的局部离群点检测方法 |
CN104731916A (zh) * | 2015-03-24 | 2015-06-24 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度优化初始中心的k均值聚类方法 |
CN104765879A (zh) * | 2015-04-28 | 2015-07-08 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度的k中心点划分聚类方法 |
CN105447521A (zh) * | 2015-11-25 | 2016-03-30 | 大连理工大学 | 一种K-means聚类的初值选择方法 |
-
2017
- 2017-07-21 CN CN201710599773.XA patent/CN107358368B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814063A (zh) * | 2010-05-24 | 2010-08-25 | 天津大学 | 基于距离权重的全局k-均值聚类算法 |
US20120328193A1 (en) * | 2011-06-24 | 2012-12-27 | Lg Innotek Co., Ltd. | Method for enhancing image edge |
CN104462819A (zh) * | 2014-12-09 | 2015-03-25 | 国网四川省电力公司信息通信公司 | 一种基于密度聚类的局部离群点检测方法 |
CN104731916A (zh) * | 2015-03-24 | 2015-06-24 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度优化初始中心的k均值聚类方法 |
CN104765879A (zh) * | 2015-04-28 | 2015-07-08 | 无锡中科泛在信息技术研发中心有限公司 | 数据挖掘中基于密度的k中心点划分聚类方法 |
CN105447521A (zh) * | 2015-11-25 | 2016-03-30 | 大连理工大学 | 一种K-means聚类的初值选择方法 |
Non-Patent Citations (2)
Title |
---|
一种分裂式的k-means聚类算法;楼佳等;《杭州电子科技大学学报》;20090815;第29卷(第4期);第54-57页 * |
基于全局性分裂算子的进化K-means算法;王留正等;《计算机应用》;20121101;第32卷(第11期);第3005-3008页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107358368A (zh) | 2017-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107358368B (zh) | 一种面向电力用户细分的鲁棒k-means聚类方法 | |
CN108763420B (zh) | 数据对象的分类方法、装置、终端和计算机可读存储介质 | |
KR102340258B1 (ko) | 시계열의 데이터를 예측 하는 방법 및 그 장치 | |
CN108154158B (zh) | 一种面向增强现实应用的建筑物图像分割方法 | |
KR101821790B1 (ko) | 사용자 선호도를 고려한 군집화 기반 추천 장치 및 방법 | |
CN106919699A (zh) | 一种面向大规模用户的个性化信息推荐方法 | |
CN114722098B (zh) | 一种基于正态云模型和密度聚类算法的典型负荷曲线辨识方法 | |
CN115115005A (zh) | 一种基于最大密距的Canopy协议识别方法 | |
CN104992050A (zh) | 基于统计信号处理的时间序列特性评价的预测模型选择方法 | |
CN108537249B (zh) | 一种密度峰值聚类的工业过程数据聚类方法 | |
WO2019108246A1 (en) | Geological sediment provenance analysis and display system | |
CN116975672A (zh) | 一种煤矿皮带输送电机温度监测方法及系统 | |
CN107578070A (zh) | 基于邻域信息和平均差异度的K‑means初始聚类中心优选方法 | |
CN111950652A (zh) | 一种基于相似度的半监督学习数据分类算法 | |
Hai-Jun et al. | Fuzzy entropy clustering using possibilistic approach | |
CN114952434A (zh) | 一种高良品率的机床打磨控制方法 | |
CN108961233A (zh) | 一种聚晶金刚石复合片表面缺陷分类识别方法 | |
CN107609348B (zh) | 高通量转录组数据样本分类数目估计方法 | |
CN110807115A (zh) | 人脸检索方法、装置、及存储装置 | |
CN112395475B (zh) | 一种基于快速搜索与密度峰值聚类的服务商聚类方法 | |
CN115393737B (zh) | 一种遥感对象确定方法 | |
TWI416348B (zh) | 實施於電腦之資料叢集方法以及儲存其之電腦可讀取記錄媒體 | |
CN117592562B (zh) | 基于自然语言处理的知识库自动构建方法 | |
CN117075756B (zh) | 用于智能触摸键盘的实时感应数据处理方法 | |
CN110110781B (zh) | 基于优质邻接点的子空间聚类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |