CN117635203A - 一种电力营销方法、系统及存储介质 - Google Patents
一种电力营销方法、系统及存储介质 Download PDFInfo
- Publication number
- CN117635203A CN117635203A CN202410109191.9A CN202410109191A CN117635203A CN 117635203 A CN117635203 A CN 117635203A CN 202410109191 A CN202410109191 A CN 202410109191A CN 117635203 A CN117635203 A CN 117635203A
- Authority
- CN
- China
- Prior art keywords
- cluster
- data
- minimum
- main body
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000006870 function Effects 0.000 claims description 42
- 235000012571 Ficus glomerata Nutrition 0.000 claims description 12
- 244000153665 Ficus glomerata Species 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000005611 electricity Effects 0.000 abstract description 27
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Complex Calculations (AREA)
Abstract
本发明属于电力营销领域,尤其是一种电力营销方法、系统及存储介质,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在至少一个簇C1中,且存在于噪声点集合S2中,则计算主体距离所在簇C1i的中心的距离D1,以及主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对主体所在簇C1i进行调整;根据对至少一个簇C1的调整结果得到主体的聚类结果,根据聚类结果获取对应的营销策略。本发明提高了对购电主体划分的准确度。
Description
技术领域
本发明涉及电力营销领域,尤其一种电力营销方法、系统及存储介质。
背景技术
电力市场营销又称为电力营销,是指在电力相关企业在市场环境中,以满足人们的电力消费需求为目的,通过一系列与市场有关的经营活动,提供满足消费者需求的电力产品和相应的服务,从而实现电力企业开拓市场、占领市场的目的。电力营销有助于提升电力企业的形象,提高管理水平,而且通过营销服务能够吸引用户用电替代其他能源,逐步实现以电代煤、以电代油等来增加售电量。电力营销参与主体包括发电厂、电网公司、用电企业与售电公司,自从发送电分开,发电厂越来越多,发电厂就需要有针对性的进行营销。
对数据进行分析是电力营销的重要方面,通过对数据进行分析,能够自动识别潜在客户,并进行精准营销;而且电力企业可以根据用户用电情况,提供个性化的用电建议,或提供定制化的营销活动、制定合理的电力价格。但是在电力营销中,需要有针对性的对不同的购电主体采用不同的营销策略,这样才能最大可能的吸引购电主体,但是现在都是根据经验判断购电主体的类型,然后人工选择营销策略,这不仅效率低下,而且完全依靠营销人员的经验。
发明内容
为了解决上述问题,本发明提供了一种电力营销方法,所述方法包括以下步骤:
采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;
基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;
根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。
优选地,所述根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小,具体为:
计算每一种基础数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种基础数据的特征值,将所有种类的基础数据的特征值的平均值作为基础数据的特征值,根据基础数据的特征值确定第一最小簇大小;
计算每一种扩展数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种扩展数据的特征值,将所有种类的扩展数据的特征值的平均值作为扩展数据的特征值,根据扩展数据的特征值确定第二最小簇大小。
优选地,所述基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,具体为:
计算基础数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第一最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C1和噪声点集合S1;
计算扩展数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第二最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C2和噪声点集合S2。
优选地,所述根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整,具体为:
计算主体所在簇C1i的半径,以及所述距离D2与簇C2j半径的比值,若D1大于所述半径的一半,且比值大于阈值,则将主体从簇C1i中删除。
优选地,所述簇C2j半径计算方法为:簇C2j的中心点到簇C2j的最远点的距离;所述阈值为1。
另一方面,本发明提供了一种电力营销系统,所述系统包括以下模块:
数据采集模块,用于采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;
主体聚类模块,用于基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;
营销策略确定模块,用于根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。
优选地,所述根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小,具体为:
计算每一种基础数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种基础数据的特征值,将所有种类的基础数据的特征值的平均值作为基础数据的特征值,根据基础数据的特征值确定第一最小簇大小;
计算每一种扩展数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种扩展数据的特征值,将所有种类的扩展数据的特征值的平均值作为扩展数据的特征值,根据扩展数据的特征值确定第二最小簇大小。
优选地,所述基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,具体为:
计算基础数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第一最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C1和噪声点集合S1;
计算扩展数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第二最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C2和噪声点集合S2。
优选地,所述根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整,具体为:
计算主体所在簇C1i的半径,以及所述距离D2与簇C2j半径的比值,若D1大于所述半径的一半,且比值大于阈值,则将主体从簇C1i中删除。
优选地,所述簇C2j半径计算方法为:簇C2j的中心点到簇C2j的最远点的距离;所述阈值为1。
最后,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
针对现有技术中无法对购电用户准确的确定营销策略的问题,提出了一种电力营销方法,具体地,采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。本发明对主体的基础数据进行分类,分为了基本数据和扩展数据,对基本数据进行簇划分,并对扩展数据进行簇划分,以基本数据为基础,对基本数据的簇划分结果进行调整,提高了簇划分的准确度,进而实现了对主体的准确分类,并结合对应的营销策略,有效的提高了营销方式选择的准确度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为实施例一的流程图;
图2为对直方图拟合的示意图;
图3为疑似噪声点示意图;
图4为实施例二的结构图。
具体实施方式
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一,如图1所示,本发明提供了一种电力营销方法,所述方法包括以下步骤:
S1,采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;
其中,所述主体为购电主体,基础数据包括但不限于年用电量、月用电量、日用电量、用电高峰时段、位置、电压等级、正有功率、失压值、用电性质、所属行业、计量方式、电压允许偏差,然后对基础数据进行分类,分为基本数据和扩展数据,其中,基本数据是和主体聚类密切相关的数据,扩展数据是指除了基本数据外的其他基础数据。在一个具体实施例中,基本数据包括但不限于用电性质、月用电量、所属行业、电压等级、位置,扩展数据包括但不限于谐波异常、收费方式、产权分界、计量方式。本发明对基础数据进行分类得到基本数据和扩展数据不作具体限定,具体的分类方式和能够采集到的基础数据有关,而且和营销策略相关。
当然,主体并不局限于购电方,如果本发明的实施方为发电厂,则主体为购电方,这时,是发电厂寻找对购电方提供销售策略;在另外一个实施例中,实施该方法的为售电公司,则主体为发电厂和购电方,对应的销售策略包括了发电厂和购电方的策略。
然后根据基础数据的分布情况得到第一最小簇大小,并根据扩展数据的分布情况得到第二最小簇大小,在一个具体实施例中,根据基础数据、扩展数据的分布情况分别得到对应的第一最小簇大小和第二最小簇大小采用对基础数据和扩展数据分别计算标准差,根据标准差确定对应得到最小簇大小。其中,对基础数据和扩展数据分别计算标准差,具体为:
对每一种基础数据的取值计算标准差,然后计算所有基础数据的标准差的平均值作为基础数据的标准差;
对每一种扩展数据的取值计算标准差,然后计算所有扩展数据的标准差的平均值作为扩展数据的标准差。
标准差越大,表明数据分布越不集中,更为具体的实施例中,标准差越大,第一和第二最小簇大小越大。在另外一个更为具体的实施例中,标准差越大,第一最小簇大小越大,第二最小簇大小越小。
在另外一个具体实施例中,所述根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小,具体为:
计算每一种基础数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种基础数据的特征值,将所有种类的基础数据的特征值的平均值作为基础数据的特征值,根据基础数据的特征值确定第一最小簇大小;
计算每一种扩展数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种扩展数据的特征值,将所有种类的扩展数据的特征值的平均值作为扩展数据的特征值,根据扩展数据的特征值确定第二最小簇大小。
基础数据包括多种数据,对于每一种数据,得到对应的直方图,然后对直方图进行曲线拟合,得到拟合曲线;其中基础数据的直方图是指基础数据取值的直方图。如图2所示,使用多个高斯函数的总和逼近直方图的曲线,高斯函数包括了三个参数:高度、标准方差、均值(中心坐标),其中,标准方差越大,高斯函数越扁平,数据分布越分散,通过对所有高斯函数的方差求平均可以知晓数据分布情况,通过对所有基础数据中每一种基础数据的数据分布情况可以知晓所有基础数据分布情况,例如是分散还是集中。图2中,x表示取值,y表示频率。
例如基础数据有两种,分别为月购电量和电压等级,对于月购电量这一种基础数据,有100个主体,则会有100个月购电量,对这100个月购电量绘制直方图,然后采用多个高斯函数的总和进行拟合,假设得到5个高斯函数,5个高斯函数的标准方差的平均值为5。同样方式,可以求得电压等级这一种基础数据的标准方差的平均值为1,则所有种类的基础数据的特征值的平均值为3,也即根据3确定第一最小簇大小。同样方式,可以计算得到扩展数据的特征值对应的第二最小簇大小。具体的根据基础数据的特征值确定第一最小簇大小有多种方式,例如对照表或者划分区间等。
S2,基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;
HDBSCAN聚类方法是一种改进的DBSCAN方法,二者都属于密度聚类,在HDBSCAN聚类方法中需要设置最小簇大小,这个参数在压缩聚类树中用到,而且这个参数的大小涉及到噪声点(又称为离群点)的判断,通过S1的数据分布情况得到最小簇大小后,在S2中可以采用HDBSCAN聚类方法得到噪声点集合和至少一个簇C1,同样地,对于拓展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2。
其中,簇C1i属于所述至少一个簇C1,也即簇C1i是至少一个簇C1中的一个簇,i为大于0的正整数,且i小于所述至少一个簇C1的数量。同样地,簇C2j属于所述至少一个簇C2,也即簇C2j是所述至少一个簇C2中的一个簇,j为大于0的正整数,且j小于所述至少一个簇C2的数量。
在一个实施例中,所述基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,具体为:
计算基础数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第一最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C1和噪声点集合S1;
计算扩展数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第二最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C2和噪声点集合S2。
仅仅根据基础数据对主体进行分类会忽略掉扩展数据,虽然扩展数据对主题分类的影响没有基础数据大,但是也是一个重要因素。而同时利用基础数据和扩展数据对主体进行分类不仅会增加计算量,而且扩展数据会对分类结果有较大影响。本发明以基础数据分簇为基础,对分簇结果进行调整,提高计算速度和准确度,在一个实施例中,所述根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整,具体为:
计算主体所在簇C1i的半径,以及所述距离D2与簇C2j半径的比值,若D1大于所述半径的一半,且比值大于阈值,则将主体从簇C1i中删除。
如果一个主体,例如购电方A被分到簇C13中,C13的半径为r1,购电方A距离簇C13的中心距离为D1,而且利用扩展数据购电方A距离簇C27最近,距离为D2,簇C27的半径为r2,如果D1>r1/2,且D2/r2>阈值,则将购电方A从簇C13中删除,也即将购电方A作为噪声点,如图3所示。当然,D1大于所述半径的一半,也可以被替换为D1大于所述半径的2/3。在一个可选的实施例中,所述簇C2j半径计算方法为:簇C2j的中心点到簇C2j的最远点的距离;所述阈值为1。同样地,所述簇C1i半径计算方法为:簇C1i的中心点到簇C1i的最远点的距离。
S3,根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。
采用S2中方式,在对所述至少一个簇C1进行调整后,得到调整结果,也即聚类结果,根据聚类结果获取对应的营销策略,在一个可选实施例中,所述营销策略是提前制定的,例如聚类结果为3个类别,第1个类别对应的营销策略X,第2个类别对应的营销策略为Z,第3个类别对应的营销策略为Y。营销策略包括但不限于提供的维保服务、响应时间等。
实施例二,本发明提供了一种电力营销系统,如图4所示,所述系统包括以下模块:
数据采集模块,用于采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;
主体聚类模块,用于基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;
营销策略确定模块,用于根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。
优选地,所述根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小,具体为:
计算每一种基础数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种基础数据的特征值,将所有种类的基础数据的特征值的平均值作为基础数据的特征值,根据基础数据的特征值确定第一最小簇大小;
计算每一种扩展数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种扩展数据的特征值,将所有种类的扩展数据的特征值的平均值作为扩展数据的特征值,根据扩展数据的特征值确定第二最小簇大小。
优选地,所述基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,具体为:
计算基础数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第一最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C1和噪声点集合S1;
计算扩展数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第二最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C2和噪声点集合S2。
优选地,所述根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整,具体为:
计算主体所在簇C1i的半径,以及所述距离D2与簇C2j半径的比值,若D1大于所述半径的一半,且比值大于阈值,则将主体从簇C1i中删除。
优选地,所述簇C2j半径计算方法为:簇C2j的中心点到簇C2j的最远点的距离;所述阈值为1。
实施例三,本发明还提供了一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时实现如实施例一所述的方法。
实施例四,本发明还提供了一种计算设备,所述计算设备包括存储器、处理器,所述存储器上存储有计算机程序,所述计算机程序在被处理器执行时实现如实施例一所述的方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种电力营销方法,其特征在于,所述方法包括以下步骤:
采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;
基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;
根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。
2.如权利要求1所述的方法,其特征在于,所述根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小,具体为:
计算每一种基础数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种基础数据的特征值,将所有种类的基础数据的特征值的平均值作为基础数据的特征值,根据基础数据的特征值确定第一最小簇大小;
计算每一种扩展数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种扩展数据的特征值,将所有种类的扩展数据的特征值的平均值作为扩展数据的特征值,根据扩展数据的特征值确定第二最小簇大小。
3.如权利要求1所述的方法,其特征在于,所述基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,具体为:
计算基础数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第一最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C1和噪声点集合S1;
计算扩展数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第二最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C2和噪声点集合S2。
4.如权利要求1所述的方法,其特征在于,所述根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整,具体为:
计算主体所在簇C1i的半径,以及所述距离D2与簇C2j半径的比值,若D1大于所述半径的一半,且比值大于阈值,则将主体从簇C1i中删除。
5.如权利要求4所述的方法,其特征在于,所述簇C2j半径计算方法为:簇C2j的中心点到簇C2j的最远点的距离;所述阈值为1。
6.一种电力营销系统,其特征在于,所述系统包括以下模块:
数据采集模块,用于采集主体的基础数据,对所述基础数据进行分类得到基本数据和扩展数据,根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小;
主体聚类模块,用于基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,若同一个主体在所述至少一个簇C1中,而且存在于噪声点集合S2中,则计算所述主体距离所在簇C1i的中心的距离D1,以及所述主体距离最近的簇C2j的中心的距离D2,根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整;
营销策略确定模块,用于根据对所述至少一个簇C1的调整结果得到所述主体的聚类结果,根据聚类结果获取对应的营销策略。
7.如权利要求6所述的系统,其特征在于,所述根据基础数据的分布情况得到第一最小簇大小,根据扩展数据的分布情况得到第二最小簇大小,具体为:
计算每一种基础数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种基础数据的特征值,将所有种类的基础数据的特征值的平均值作为基础数据的特征值,根据基础数据的特征值确定第一最小簇大小;
计算每一种扩展数据的直方图,使用多个高斯函数的总和拟合所述直方图的曲线,得到每个高斯函数对应的标准差,将所有高斯函数对应的标准差的平均值作为每一种扩展数据的特征值,将所有种类的扩展数据的特征值的平均值作为扩展数据的特征值,根据扩展数据的特征值确定第二最小簇大小。
8.如权利要求6所述的系统,其特征在于,所述基于基本数据和预先设置的第一最小簇大小得到主体的噪声点集合S1和至少一个簇C1,基于所述扩展数据和预先设置的第二最小簇大小得到主体的噪声点集合S2和至少一个簇C2,具体为:
计算基础数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第一最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C1和噪声点集合S1;
计算扩展数据的相互可达距离,并根据相互可达距离构建最小生成树,利用所述最小生成树构建簇的层级结构,并在层级结构的基础上根据第二最小簇大小得到压缩聚类树,提取簇后得到至少一个簇C2和噪声点集合S2。
9.如权利要求6所述的系统,其特征在于,所述根据距离D1和距离D2确定是否对所述主体所在簇C1i进行调整,具体为:
计算主体所在簇C1i的半径,以及所述距离D2与簇C2j半径的比值,若D1大于所述半径的一半,且比值大于阈值,则将主体从簇C1i中删除。
10.一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序在被处理器执行时实现如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410109191.9A CN117635203A (zh) | 2024-01-26 | 2024-01-26 | 一种电力营销方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410109191.9A CN117635203A (zh) | 2024-01-26 | 2024-01-26 | 一种电力营销方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117635203A true CN117635203A (zh) | 2024-03-01 |
Family
ID=90025584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410109191.9A Withdrawn CN117635203A (zh) | 2024-01-26 | 2024-01-26 | 一种电力营销方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117635203A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991436A (zh) * | 2017-03-09 | 2017-07-28 | 东软集团股份有限公司 | 噪声点检测方法及装置 |
CN109856337A (zh) * | 2019-02-28 | 2019-06-07 | 北京航空航天大学 | 一种碳纤维复合材料加工表面质量评定方法及装置 |
CN111524084A (zh) * | 2020-05-13 | 2020-08-11 | 曹彬才 | 一种基于多峰高斯拟合的复杂场景光子计数激光雷达点云去噪算法 |
CN113705625A (zh) * | 2021-08-06 | 2021-11-26 | 中科恒运股份有限公司 | 异常生活保障申请家庭的识别方法、装置及电子设备 |
CN114119111A (zh) * | 2022-01-27 | 2022-03-01 | 深圳江行联加智能科技有限公司 | 基于大数据的电力交易用户管理方法、装置、设备及介质 |
US20230245739A1 (en) * | 2022-01-31 | 2023-08-03 | Parkland Center For Clinical Innovation | Patient Cluster Identification System and Method |
CN116910592A (zh) * | 2023-09-13 | 2023-10-20 | 中移(苏州)软件技术有限公司 | 日志检测方法、装置、电子设备及存储介质 |
-
2024
- 2024-01-26 CN CN202410109191.9A patent/CN117635203A/zh not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991436A (zh) * | 2017-03-09 | 2017-07-28 | 东软集团股份有限公司 | 噪声点检测方法及装置 |
CN109856337A (zh) * | 2019-02-28 | 2019-06-07 | 北京航空航天大学 | 一种碳纤维复合材料加工表面质量评定方法及装置 |
CN111524084A (zh) * | 2020-05-13 | 2020-08-11 | 曹彬才 | 一种基于多峰高斯拟合的复杂场景光子计数激光雷达点云去噪算法 |
CN113705625A (zh) * | 2021-08-06 | 2021-11-26 | 中科恒运股份有限公司 | 异常生活保障申请家庭的识别方法、装置及电子设备 |
CN114119111A (zh) * | 2022-01-27 | 2022-03-01 | 深圳江行联加智能科技有限公司 | 基于大数据的电力交易用户管理方法、装置、设备及介质 |
US20230245739A1 (en) * | 2022-01-31 | 2023-08-03 | Parkland Center For Clinical Innovation | Patient Cluster Identification System and Method |
CN116910592A (zh) * | 2023-09-13 | 2023-10-20 | 中移(苏州)软件技术有限公司 | 日志检测方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
王荣荣;傅秀芬;: "一种改进的m_(pts)-HDBSCAN算法", 广东工业大学学报, no. 03, 31 May 2017 (2017-05-31) * |
赵通;王国胤;肖斌;: "基于多峰高斯函数的直方图规定化算法", 计算机科学, no. 12, 15 December 2014 (2014-12-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11043808B2 (en) | Method for identifying pattern of load cycle | |
CN111144468A (zh) | 电力用户信息标签化方法和装置、电子设备以及存储介质 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN112434962B (zh) | 基于电力负荷数据的企业用户状态评估方法和系统 | |
CN108388955A (zh) | 基于随机森林和逻辑回归的客户服务策略制定方法、装置 | |
CN107784518A (zh) | 一种基于多维指标的电力客户细分方法 | |
JP2006011715A (ja) | 資源消費量の推定方法及び装置 | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
CN111612228A (zh) | 一种基于用电信息的用户用电行为分析方法 | |
CN113326654A (zh) | 一种燃气负荷预测模型的构建方法及装置 | |
CN116701965A (zh) | 一种基于birch聚类算法的企业用户全景碳画像方法 | |
CN114398941A (zh) | 一种用户缴费行为分类方法、装置、设备及可读存储介质 | |
CN114021624A (zh) | 用户用电行为分析方法、设备、存储介质及程序产品 | |
CN112529712A (zh) | 用户运营分析rfm的建模方法与系统 | |
CN106651630B (zh) | 关键用电行业识别方法和系统 | |
CN117635203A (zh) | 一种电力营销方法、系统及存储介质 | |
CN117056752A (zh) | 一种基于多源数据的工商业企业画像刻画方法 | |
CN115081893A (zh) | 用户用电数据分析方法、装置、电子设备及可读存储介质 | |
CN110717668A (zh) | 一种旅游景区互联网影响力评估及景区自动管理调度方法 | |
CN113902485B (zh) | 一种专变电力用户行业识别方法、装置及设备 | |
Ikeda et al. | Sparse-coding-based household clustering for demand response services | |
Shen et al. | A Novel AI-based Method for EV Charging Load Profile Clustering | |
CN112819520A (zh) | 一种运营商客户生命周期计算方法及系统 | |
CN117034126B (zh) | 基于知识图谱的绿色电力用户分类与特征提取方法及系统 | |
CN113962509B (zh) | 一种基于负荷聚类的温敏负荷提取及其灵敏度计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20240301 |