CN107358368B - 一种面向电力用户细分的鲁棒k-means聚类方法 - Google Patents

一种面向电力用户细分的鲁棒k-means聚类方法 Download PDF

Info

Publication number
CN107358368B
CN107358368B CN201710599773.XA CN201710599773A CN107358368B CN 107358368 B CN107358368 B CN 107358368B CN 201710599773 A CN201710599773 A CN 201710599773A CN 107358368 B CN107358368 B CN 107358368B
Authority
CN
China
Prior art keywords
cluster
center
clusters
data
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710599773.XA
Other languages
English (en)
Other versions
CN107358368A (zh
Inventor
杨名
李强
罗海波
刘琪琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Sichuan Electric Power Co Ltd
Original Assignee
State Grid Sichuan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Sichuan Electric Power Co Ltd filed Critical State Grid Sichuan Electric Power Co Ltd
Priority to CN201710599773.XA priority Critical patent/CN107358368B/zh
Publication of CN107358368A publication Critical patent/CN107358368A/zh
Application granted granted Critical
Publication of CN107358368B publication Critical patent/CN107358368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向电力用户细分的鲁棒k‑means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k‑means聚类方法可以解决这一缺点。

Description

一种面向电力用户细分的鲁棒k-means聚类方法
技术领域
本发明涉及一种电力用户细分方法,具体涉及一种面向电力用户细分的鲁棒k-means聚类方法。
背景技术
电力作为最基本的生活、生产能源,用电客户类型非常复杂而丰富。传统模式下,电力部门是通过对用户档案进行主观判断进行归类。该方法由于人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类。
发明内容
本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,目的在于提供一种面向电力用户细分的鲁棒k-means聚类方法,解决电力部门不能实现对用户准确、快速、细致的归类的问题。
本发明通过下述技术方案实现:
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k-means聚类方法可以解决这一缺点。此方法通过对海量用户信息进行关键聚类信息识别以进行自动的聚类处理。所述数据集由多个簇组成,这是为了后续的解释方便,做了一个自定义;聚类分析作为一个广受欢迎的数据分析和数据挖掘技术,旨在将一组数据对象按相似性分成若干簇,使得同一个簇内的数据对象尽可能相似,不同簇内的对象尽可能相异。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。标准化处理可以去除数据中的空缺和冗余,保证所得结果准确有效。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
Figure GDA0001374892310000021
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。对数据所有维度进行判断,保证准确。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;如此做可以避免对初始聚类中心的选择敏感,避免选择不同的初始聚类中心将导致不同的聚类结果。
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2}(2)其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;S403:选择具有最大的最小距离的对象作为下一个簇中心,这样选择可以最大程度保证两个簇之间差异最大化,mi=argmax{min_dist(xp)}(3)其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,Nε(mi)={xp:||xp-mi||2≤ε}(4)S405:选择离Nε(mi)的均值最近的对象,更新簇中心,更新簇中心可以最大程度避免簇中心偏移,
Figure GDA0001374892310000022
当mi没改变,继续第六步;否则,返回到S404;S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动分裂簇包括以下子步骤:S501:计算平均簇间差异:
Figure GDA0001374892310000023
mi和mj表示聚类中心,
Figure GDA0001374892310000025
表示聚类中心对的个数;S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2}计算簇间和簇内差异,为后续簇的合并和分解做准备,(7)mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;S503:当簇内差异
Figure GDA0001374892310000024
簇被分裂成两个簇,为了得到鲁棒的和可靠的聚类结果,两个初始簇中心用改进的MaxMin初始化方法选择,使用MaxMin最大程度保证两个初始簇中心符合原有标准;S504:更新簇中心和簇的数目k;S505:当簇的数目k没改变,停止;否则,返回到第一步。如果最大簇内差异大于最小簇间差异,则簇被分裂成两个簇,这样可以保证簇内差异最小化。
所述步骤4中,自动合并簇包括以下子步骤:S601:计算平均簇间差异
Figure GDA0001374892310000031
mi和mj表示聚类中心,
Figure GDA0001374892310000032
表示聚类中心对的个数;S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2(8)mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;S603:当簇间差异
Figure GDA0001374892310000033
簇被合并;S604:更新簇中心和簇的数目k;S605:当簇的数目k没改变,停止;否则,返回到第一步。如果最小簇间差异小于最大簇内差异,则簇被合并,这样可以保证簇间差异最大化。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明一种面向电力用户细分的鲁棒k-means聚类方法,克服了传统k-means算法对电力用户初始聚类中心选择敏感的问题,使用改进的MaxMin初始化方法更好地选择电力用户初始聚类中心,使得电力用户聚类结果更可靠;克服了传统k-means算法对用户事先指定的聚类数目敏感的问题,新算法可以自动地分裂和合并簇,最终得到合适的簇,使得电力用户聚类结果更可靠;
2、本发明一种面向电力用户细分的鲁棒k-means聚类方法,能够更好地选择电力用户初始聚类中心,对电力用户初始聚类中心的选择不敏感;可以自动地分裂和合并簇;
3、本发明一种面向电力用户细分的鲁棒k-means聚类方法,对聚类数目的设置不再需要依赖用户的经验;聚类结果更可靠,准确率更高;算法对参数值的选择不敏感,算法鲁棒性好。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明算法流程图;
图2为本发明初始聚类中心选择子流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
如图1-2所示:
实施例1
本发明一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
Figure GDA0001374892310000041
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
Figure GDA0001374892310000042
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动分裂簇包括以下子步骤:
S501:计算平均簇间差异:
Figure GDA0001374892310000051
mi和mj表示聚类中心,
Figure GDA0001374892310000052
表示聚类中心对的个数;
S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2} (7)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;
S503:当簇内差异
Figure GDA0001374892310000053
簇被分裂成两个簇,S504:更新簇中心和簇的数目k;
S505:当簇的数目k没改变,停止;否则,返回到第一步。
实施例2
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
Figure GDA0001374892310000054
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
Figure GDA0001374892310000061
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动合并簇包括以下子步骤:
S601:计算平均簇间差异
Figure GDA0001374892310000062
mi和mj表示聚类中心,
Figure GDA0001374892310000063
表示聚类中心对的个数;
S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2 (8)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;
S603:当簇间差异
Figure GDA0001374892310000064
簇被合并;
S604:更新簇中心和簇的数目k;
S605:当簇的数目k没改变,停止;否则,返回到第一步。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:包括以下步骤,
步骤1:提取电力公司任意一组用户档案数据,并对所述用户档案数据进行数据归一化处理,所述用户档案数据由多个簇组成;
步骤2:提取步骤1归一化处理后的所述用户档案数据,结合所述用户档案数据的数据属性,进行不同电力用户间的相异度计算;且所述用户档案数据属性为数值型,采用欧氏距离计算用户数据样本间的相异度;当所述用户档案数据属性为混合类型,采用公式(1)计算用户数据样本间的相异度:
Figure FDA0002848211860000011
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1;
步骤3:提取步骤2中所述用户档案数据中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;
步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇;
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
Figure FDA0002848211860000021
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
2.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤1中归一化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
3.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤4中,自动分裂簇包括以下子步骤:
Figure FDA0002848211860000022
S501:计算平均簇间差异:
mi和mj表示聚类中心,
Figure FDA0002848211860000023
表示聚类中心对的个数;
S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2} (7)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;
S503:当簇内差异
Figure FDA0002848211860000024
簇被分裂成两个簇,S504:更新簇中心和簇的数目k;
S505:当簇的数目k没改变,停止;否则,返回到第一步。
4.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤4中,自动合并簇包括以下子步骤:
S601:计算平均簇间差异
Figure FDA0002848211860000025
mi和mj表示聚类中心,
Figure FDA0002848211860000026
表示聚类中心对的个数;
S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2 (8)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;
S603:当簇间差异
Figure FDA0002848211860000027
簇被合并;
S604:更新簇中心和簇的数目k;
S605:当簇的数目k没改变,停止;否则,返回到第一步。
CN201710599773.XA 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法 Active CN107358368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710599773.XA CN107358368B (zh) 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710599773.XA CN107358368B (zh) 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法

Publications (2)

Publication Number Publication Date
CN107358368A CN107358368A (zh) 2017-11-17
CN107358368B true CN107358368B (zh) 2021-07-20

Family

ID=60284878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710599773.XA Active CN107358368B (zh) 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法

Country Status (1)

Country Link
CN (1) CN107358368B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915116A (zh) * 2019-05-10 2020-11-10 国网能源研究院有限公司 一种基于K-means聚类的电力居民用户分类方法
CN111062502B (zh) * 2019-12-17 2023-07-14 国网湖南省电力有限公司 用户用电行为细分方法及其故障分析方法
CN112101611B (zh) * 2020-07-31 2022-11-18 重庆锐云科技有限公司 房地产客户复购时间的预测方法、服务器及存储介质
CN112132217B (zh) * 2020-09-23 2023-08-15 广西大学 一种基于簇内簇间相异度的分类型数据聚类方法
CN113935410B (zh) * 2021-10-13 2024-07-16 甘肃同兴智能科技发展有限责任公司 一种基于交并比密度聚类的电力客户画像方法
CN118133051B (zh) * 2024-05-08 2024-07-16 北京国网信通埃森哲信息技术有限公司 一种要素评估模型的构建方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814063A (zh) * 2010-05-24 2010-08-25 天津大学 基于距离权重的全局k-均值聚类算法
US20120328193A1 (en) * 2011-06-24 2012-12-27 Lg Innotek Co., Ltd. Method for enhancing image edge
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104731916A (zh) * 2015-03-24 2015-06-24 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度优化初始中心的k均值聚类方法
CN104765879A (zh) * 2015-04-28 2015-07-08 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度的k中心点划分聚类方法
CN105447521A (zh) * 2015-11-25 2016-03-30 大连理工大学 一种K-means聚类的初值选择方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814063A (zh) * 2010-05-24 2010-08-25 天津大学 基于距离权重的全局k-均值聚类算法
US20120328193A1 (en) * 2011-06-24 2012-12-27 Lg Innotek Co., Ltd. Method for enhancing image edge
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104731916A (zh) * 2015-03-24 2015-06-24 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度优化初始中心的k均值聚类方法
CN104765879A (zh) * 2015-04-28 2015-07-08 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度的k中心点划分聚类方法
CN105447521A (zh) * 2015-11-25 2016-03-30 大连理工大学 一种K-means聚类的初值选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种分裂式的k-means聚类算法;楼佳等;《杭州电子科技大学学报》;20090815;第29卷(第4期);第54-57页 *
基于全局性分裂算子的进化K-means算法;王留正等;《计算机应用》;20121101;第32卷(第11期);第3005-3008页 *

Also Published As

Publication number Publication date
CN107358368A (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN107358368B (zh) 一种面向电力用户细分的鲁棒k-means聚类方法
CN108763420B (zh) 数据对象的分类方法、装置、终端和计算机可读存储介质
KR102340258B1 (ko) 시계열의 데이터를 예측 하는 방법 및 그 장치
CN108154158B (zh) 一种面向增强现实应用的建筑物图像分割方法
KR101821790B1 (ko) 사용자 선호도를 고려한 군집화 기반 추천 장치 및 방법
CN106919699A (zh) 一种面向大规模用户的个性化信息推荐方法
CN114722098B (zh) 一种基于正态云模型和密度聚类算法的典型负荷曲线辨识方法
CN115115005A (zh) 一种基于最大密距的Canopy协议识别方法
CN104992050A (zh) 基于统计信号处理的时间序列特性评价的预测模型选择方法
CN108537249B (zh) 一种密度峰值聚类的工业过程数据聚类方法
WO2019108246A1 (en) Geological sediment provenance analysis and display system
CN116975672A (zh) 一种煤矿皮带输送电机温度监测方法及系统
CN107578070A (zh) 基于邻域信息和平均差异度的K‑means初始聚类中心优选方法
CN111950652A (zh) 一种基于相似度的半监督学习数据分类算法
Hai-Jun et al. Fuzzy entropy clustering using possibilistic approach
CN114952434A (zh) 一种高良品率的机床打磨控制方法
CN108961233A (zh) 一种聚晶金刚石复合片表面缺陷分类识别方法
CN107609348B (zh) 高通量转录组数据样本分类数目估计方法
CN110807115A (zh) 人脸检索方法、装置、及存储装置
CN112395475B (zh) 一种基于快速搜索与密度峰值聚类的服务商聚类方法
CN115393737B (zh) 一种遥感对象确定方法
TWI416348B (zh) 實施於電腦之資料叢集方法以及儲存其之電腦可讀取記錄媒體
CN117592562B (zh) 基于自然语言处理的知识库自动构建方法
CN117075756B (zh) 用于智能触摸键盘的实时感应数据处理方法
CN110110781B (zh) 基于优质邻接点的子空间聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant