CN107358368A - 一种面向电力用户细分的鲁棒k‑means聚类方法 - Google Patents

一种面向电力用户细分的鲁棒k‑means聚类方法 Download PDF

Info

Publication number
CN107358368A
CN107358368A CN201710599773.XA CN201710599773A CN107358368A CN 107358368 A CN107358368 A CN 107358368A CN 201710599773 A CN201710599773 A CN 201710599773A CN 107358368 A CN107358368 A CN 107358368A
Authority
CN
China
Prior art keywords
cluster
mrow
msub
data set
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710599773.XA
Other languages
English (en)
Other versions
CN107358368B (zh
Inventor
杨名
李强
罗海波
刘琪琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Sichuan Electric Power Co Ltd
Original Assignee
State Grid Sichuan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Sichuan Electric Power Co Ltd filed Critical State Grid Sichuan Electric Power Co Ltd
Priority to CN201710599773.XA priority Critical patent/CN107358368B/zh
Publication of CN107358368A publication Critical patent/CN107358368A/zh
Application granted granted Critical
Publication of CN107358368B publication Critical patent/CN107358368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向电力用户细分的鲁棒k‑means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k‑means聚类方法可以解决这一缺点。

Description

一种面向电力用户细分的鲁棒k-means聚类方法
技术领域
本发明涉及一种电力用户细分方法,具体涉及一种面向电力用户细分的鲁棒k-means聚类方法。
背景技术
电力作为最基本的生活、生产能源,用电客户类型非常复杂而丰富。传统模式下,电力部门是通过对用户档案进行主观判断进行归类。该方法由于人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类。
发明内容
本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,目的在于提供一种面向电力用户细分的鲁棒k-means聚类方法,解决电力部门不能实现对用户准确、快速、细致的归类的问题。
本发明通过下述技术方案实现:
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。本发明所要解决的技术问题是电力部门通过对用户档案进行主观判断进行归类,但是人力成本和人工理解深度的限制,并不能实现对用户准确、快速、细致的归类,但是本发明所提出的新颖、鲁棒的k-means聚类方法可以解决这一缺点。此方法通过对海量用户信息进行关键聚类信息识别以进行自动的聚类处理。所述数据集由多个簇组成,这是为了后续的解释方便,做了一个自定义;聚类分析作为一个广受欢迎的数据分析和数据挖掘技术,旨在将一组数据对象按相似性分成若干簇,使得同一个簇内的数据对象尽可能相似,不同簇内的对象尽可能相异。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。标准化处理可以去除数据中的空缺和冗余,保证所得结果准确有效。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的 相异度: (1)其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。对数据所有维度进行判断,保证准确。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1;如此做可以避免对初始聚类中心的选择敏感,避免选择不同的初始聚类中心将导致不同的聚类结果。
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,min_dist(xp)=min{||xp-ms||2}(2)其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;S403:选择具有最大的最小距离的对象作为下一个簇中心,这样选择可以最大程度保证两个簇之间差异最大化,mi=arg max{min_dist(xp)}(3)其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,Nε(mi)={xp:||xp-mi||2≤ε}(4)S405:选择离Nε(mi)的均值最近的对象,更新簇中心,更新簇中心可以最大程度避免簇中心偏移, (5)当mi没改变,继续第六步;否则,返回到S404;S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动分裂簇包括以下子步骤:S501:计算平均簇间差异:(6)mi和mj表示聚类中心,表示聚类中心对的个数;S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2}计算簇间和簇内差异,为后续簇的合并和分解做准备,(7)mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;S503:当簇内差异簇被分裂成两个簇,为了得到鲁棒的和可靠的聚类结果,两个初始簇中心用改进的MaxMin初始化方法选择,使用MaxMin最大程度保证两个初始簇中心符合原有标准;S504:更新簇中心和簇的数目k;S505:当簇的数目k没改变,停止;否则,返回到第一步。如果最大簇内差异大于最小簇间差异,则簇被分裂成两 个簇,这样可以保证簇内差异最小化。
所述步骤4中,自动合并簇包括以下子步骤:S601:计算平均簇间差异mi和mj表示聚类中心,表示聚类中心对的个数;S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2(8)mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;S603:当簇间差异簇被合并;S604:更新簇中心和簇的数目k;S605:当簇的数目k没改变,停止;否则,返回到第一步。如果最小簇间差异小于最大簇内差异,则簇被合并,这样可以保证簇间差异最大化。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明一种面向电力用户细分的鲁棒k-means聚类方法,克服了传统k-means算法对电力用户初始聚类中心选择敏感的问题,使用改进的MaxMin初始化方法更好地选择电力用户初始聚类中心,使得电力用户聚类结果更可靠;克服了传统k-means算法对用户事先指定的聚类数目敏感的问题,新算法可以自动地分裂和合并簇,最终得到合适的簇,使得电力用户聚类结果更可靠;
2、本发明一种面向电力用户细分的鲁棒k-means聚类方法,能够更好地选择电力用户初始聚类中心,对电力用户初始聚类中心的选择不敏感;可以自动地分裂和合并簇;
3、本发明一种面向电力用户细分的鲁棒k-means聚类方法,对聚类数目的设置不再需要依赖用户的经验;聚类结果更可靠,准确率更高;算法对参数值的选择不敏感,算法鲁棒性好。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明算法流程图;
图2为本发明初始聚类中心选择子流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
如图1-2所示:
实施例1
本发明一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=arg max{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动分裂簇包括以下子步骤:
S501:计算平均簇间差异:
mi和mj表示聚类中心,表示聚类中心对的个数;
S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2} (7)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;
S503:当簇内差异簇被分裂成两个簇,S504:更新簇中心和簇的数目k;
S505:当簇的数目k没改变,停止;否则,返回到第一步。
实施例2
一种面向电力用户细分的鲁棒k-means聚类方法,包括以下步骤,步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=arg max{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
所述步骤4中,自动合并簇包括以下子步骤:
S601:计算平均簇间差异
mi和mj表示聚类中心,表示聚类中心对的个数;
S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2 (8)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;
S603:当簇间差异簇被合并;
S604:更新簇中心和簇的数目k;
S605:当簇的数目k没改变,停止;否则,返回到第一步。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:包括以下步骤,
步骤1:提取电力公司任意一组数据集,进行数据标准化处理,所述数据集由多个簇组成;
步骤2:提取标准化处理以后的数据集,计算数据集中样本间的相异度;
步骤3:提取步骤2中数据集中样本间的相异度,使用改进的MaxMin初始化方法选择初始聚类中心,确定聚类中心的数量和类型;
步骤4:根据步骤3中聚类中心的数量和类型,自动的分裂或合并簇。
2.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤1中标准化处理的方法包括最大最小规范化、z-score规范化和小数定标规范化。
3.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤2中,计算数据集中样本间的相异度,当数据样本属性为数值型,采用欧氏距离计算数据样本间的相异度;当数据样本属性为混合类型,采用公式(1)计算数据样本间的相异度:
<mrow> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>m</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>&amp;delta;</mi> <mi>m</mi> </msub> <mi>d</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>x</mi> <mrow> <mi>j</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>m</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <msub> <mi>&amp;delta;</mi> <mi>m</mi> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,xi和xj是两个数据样本;k是数据样本的维度,即属性个数;d(xi,m,xj,m)是数据样本xi和xj在第m维上的相异度;δm是第m维的指示项,当xi,m或xj,m缺失,或者xi,m=xj,m=0,且变量m是非对称二元变量,则指示项δm=0,否则,指示项δm=1。
4.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤3中改进的MaxMin初始化方法选择初始聚类中心,包括以下子步骤:
S401:假设一个n个对象的数据集X,选择离所有对象的均值最近的对象作为第一个聚类中心m1
S402:对于其余的对象,计算每个对象和已选定的簇中心之间的最小距离,
min_dist(xp)=min{||xp-ms||2} (2)
其中,xp是未被选作簇中心的对象,ms表示已经被选定的簇中心;
S403:选择具有最大的最小距离的对象作为下一个簇中心,
mi=argmax{min_dist(xp)} (3)
其中,mi表示临时簇中心;
S404:令ε=1/2×min_dist(mi),寻找到mi的距离小于ε的所有对象,
Nε(mi)={xp:||xp-mi||2≤ε} (4)
S405:选择离Nε(mi)的均值最近的对象,更新簇中心,
<mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>=</mo> <mi>arg</mi> <mi> </mi> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mo>{</mo> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>p</mi> </msub> <mo>-</mo> <msub> <mover> <mi>N</mi> <mo>&amp;OverBar;</mo> </mover> <mi>&amp;epsiv;</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>m</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
当mi没改变,继续第六步;否则,返回到S404;
S406:重复S403-S405,直到k个聚类中心被选定。
5.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤4中,自动分裂簇包括以下子步骤:
S501:计算平均簇间差异:
mi和mj表示聚类中心,表示聚类中心对的个数;
S502:对于每个簇,计算簇内差异dintra=max{||mi-xp||2}+min{||mi-xp||2} (7)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心,xp表示簇内的对象;
S503:当簇内差异簇被分裂成两个簇,S504:更新簇中心和簇的数目k;
S505:当簇的数目k没改变,停止;否则,返回到第一步。
6.根据权利要求1所述的一种面向电力用户细分的鲁棒k-means聚类方法,其特征在于:所述步骤4中,自动合并簇包括以下子步骤:
S601:计算平均簇间差异
mi和mj表示聚类中心,表示聚类中心对的个数;
S602:对于每个簇中心,计算簇间差异dinter=||mi-mj||2 (8)
mi和mj分别表示第i个簇的簇中心和第j个簇的簇中心;
S603:当簇间差异簇被合并;
S604:更新簇中心和簇的数目k;
S605:当簇的数目k没改变,停止;否则,返回到第一步。
CN201710599773.XA 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法 Active CN107358368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710599773.XA CN107358368B (zh) 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710599773.XA CN107358368B (zh) 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法

Publications (2)

Publication Number Publication Date
CN107358368A true CN107358368A (zh) 2017-11-17
CN107358368B CN107358368B (zh) 2021-07-20

Family

ID=60284878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710599773.XA Active CN107358368B (zh) 2017-07-21 2017-07-21 一种面向电力用户细分的鲁棒k-means聚类方法

Country Status (1)

Country Link
CN (1) CN107358368B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062502A (zh) * 2019-12-17 2020-04-24 国网湖南省电力有限公司 用户用电行为细分方法及其故障分析方法
CN111915116A (zh) * 2019-05-10 2020-11-10 国网能源研究院有限公司 一种基于K-means聚类的电力居民用户分类方法
CN112101611A (zh) * 2020-07-31 2020-12-18 重庆锐云科技有限公司 房地产客户复购时间的预测方法、服务器及存储介质
CN112132217A (zh) * 2020-09-23 2020-12-25 广西大学 一种基于簇内簇间相异度的分类型数据聚类方法
CN113935410A (zh) * 2021-10-13 2022-01-14 甘肃同兴智能科技发展有限责任公司 一种基于交并比密度聚类的电力客户画像方法
CN113935410B (zh) * 2021-10-13 2024-07-16 甘肃同兴智能科技发展有限责任公司 一种基于交并比密度聚类的电力客户画像方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814063A (zh) * 2010-05-24 2010-08-25 天津大学 基于距离权重的全局k-均值聚类算法
US20120328193A1 (en) * 2011-06-24 2012-12-27 Lg Innotek Co., Ltd. Method for enhancing image edge
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104731916A (zh) * 2015-03-24 2015-06-24 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度优化初始中心的k均值聚类方法
CN104765879A (zh) * 2015-04-28 2015-07-08 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度的k中心点划分聚类方法
CN105447521A (zh) * 2015-11-25 2016-03-30 大连理工大学 一种K-means聚类的初值选择方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814063A (zh) * 2010-05-24 2010-08-25 天津大学 基于距离权重的全局k-均值聚类算法
US20120328193A1 (en) * 2011-06-24 2012-12-27 Lg Innotek Co., Ltd. Method for enhancing image edge
CN104462819A (zh) * 2014-12-09 2015-03-25 国网四川省电力公司信息通信公司 一种基于密度聚类的局部离群点检测方法
CN104731916A (zh) * 2015-03-24 2015-06-24 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度优化初始中心的k均值聚类方法
CN104765879A (zh) * 2015-04-28 2015-07-08 无锡中科泛在信息技术研发中心有限公司 数据挖掘中基于密度的k中心点划分聚类方法
CN105447521A (zh) * 2015-11-25 2016-03-30 大连理工大学 一种K-means聚类的初值选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
楼佳等: "一种分裂式的k-means聚类算法", 《杭州电子科技大学学报》 *
王留正等: "基于全局性分裂算子的进化K-means算法", 《计算机应用》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915116A (zh) * 2019-05-10 2020-11-10 国网能源研究院有限公司 一种基于K-means聚类的电力居民用户分类方法
CN111062502A (zh) * 2019-12-17 2020-04-24 国网湖南省电力有限公司 用户用电行为细分方法及其故障分析方法
CN111062502B (zh) * 2019-12-17 2023-07-14 国网湖南省电力有限公司 用户用电行为细分方法及其故障分析方法
CN112101611A (zh) * 2020-07-31 2020-12-18 重庆锐云科技有限公司 房地产客户复购时间的预测方法、服务器及存储介质
CN112101611B (zh) * 2020-07-31 2022-11-18 重庆锐云科技有限公司 房地产客户复购时间的预测方法、服务器及存储介质
CN112132217A (zh) * 2020-09-23 2020-12-25 广西大学 一种基于簇内簇间相异度的分类型数据聚类方法
CN112132217B (zh) * 2020-09-23 2023-08-15 广西大学 一种基于簇内簇间相异度的分类型数据聚类方法
CN113935410A (zh) * 2021-10-13 2022-01-14 甘肃同兴智能科技发展有限责任公司 一种基于交并比密度聚类的电力客户画像方法
CN113935410B (zh) * 2021-10-13 2024-07-16 甘肃同兴智能科技发展有限责任公司 一种基于交并比密度聚类的电力客户画像方法
CN118133051B (zh) * 2024-05-08 2024-07-16 北京国网信通埃森哲信息技术有限公司 一种要素评估模型的构建方法及装置

Also Published As

Publication number Publication date
CN107358368B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN107358368A (zh) 一种面向电力用户细分的鲁棒k‑means聚类方法
CN105069122B (zh) 一种基于用户行为的个性化推荐方法及其推荐装置
WO2020147488A1 (zh) 异常群体识别方法及装置
CN104462560B (zh) 一种个性化推荐系统的推荐方法
CN106533742B (zh) 基于时间序列模式表征的加权有向复杂网络建网方法
KR102103844B1 (ko) 플레이리스트 리스트 결정 방법 및 디바이스, 전자 장비 및 저장 매체
CN111198942B (zh) 数据分析报告生成方法、装置、移动终端及存储介质
CN102254043A (zh) 一种基于语义映射的服装图像检索方法
CN104462819A (zh) 一种基于密度聚类的局部离群点检测方法
WO2012141934A1 (en) Method and apparatus of determining product category information
CN106919699A (zh) 一种面向大规模用户的个性化信息推荐方法
CN105354578A (zh) 一种多目标物体图像匹配方法
CN104899965A (zh) 一种基于清分机的多国纸币序列号识别方法
CN104620258A (zh) 文件分类辅助设备、方法及程序
CN103631769A (zh) 一种判断文件内容与标题间一致性的方法及装置
CN111242218B (zh) 融合用户多属性信息的跨社交网络用户身份识别方法
CN106933969A (zh) 基于行业上下游关系的个性化推荐系统和推荐方法
CN106599924A (zh) 一种基于三支决策的分类器构建方法
CN104615741A (zh) 一种基于云计算的冷启动项目推荐的方法及装置
CN112948575A (zh) 文本数据处理方法、装置和计算机可读存储介质
Islambekov et al. Unsupervised space–time clustering using persistent homology
CN105574265B (zh) 面向模型检索的装配体模型定量描述方法
CN104933080B (zh) 一种确定异常数据的方法及装置
CN109447746B (zh) 一种电子商务平台的智能推荐管理系统
Meng et al. The linkage between box-counting and geomorphic fractal dimensions in the fractal structure of river networks: the junction angle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant