CN110928924A - 基于神经网络的电力系统客户满意度分析与预测方法 - Google Patents
基于神经网络的电力系统客户满意度分析与预测方法 Download PDFInfo
- Publication number
- CN110928924A CN110928924A CN201911192134.7A CN201911192134A CN110928924A CN 110928924 A CN110928924 A CN 110928924A CN 201911192134 A CN201911192134 A CN 201911192134A CN 110928924 A CN110928924 A CN 110928924A
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- sample set
- prediction model
- customer satisfaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明公开了一种基于神经网络的电力系统客户满意度分析与预测方法,从特定区域的电力评价系统中收集特定时间内的报修查询结果作为实验样本;对报修查询结果数据集进行数据预处理,并提取影响处理满意度结果的相关属性;建立数据挖掘样本集,并将样本集分为训练样本集和测试样本集;根据样本集和LM神经网络建立预测模型;导出预测模型,进行用户满意度预测。本发明通过分析客户满意度评价结果,能够进一步挖掘客户服务需求,提高国家电网供电客户服务质量。
Description
技术领域
本发明涉及客户满意度分析技术领域,是一种基于神经网络的电力系统客户满意度分析与预测方法。
背景技术
电力是我国国民经济发展的基础,近年来,各地售电公司层出不穷,电力市场化竞争日益激烈,国家电网公司以客户为中心的服务流程和竞争策略亟待优化。同时,国民经济由高速增长阶段转向高质量发展阶段,人民更重视获得感,这就需供电企业提升客户服务能力,并以客户为中心,提高服务水平。但是,随着我国服务业的迅猛发展,国家和社会对服务质量提出了严格要求。服务质量不再仅仅是服务性行业、企业和顾客之间的事情,需要管理学界给予充分的理论研究和指导。
国外对服务质量深入和广泛地研究始于20世纪80年代初,早期研究集中在服务营销领域,后来逐步扩展到服务作业、人力资源管理等相关领域。芬兰学者格朗鲁斯于1982年最早提出顾客感知服务质量的概念,他认为服务质量本质是一种感知,它由顾客的服务期望和实际服务经历的比较确定,服务质量高低取决于顾客的感知,服务质量的最高评价者是顾客而不是企业。1988年,美国学者潘拉索拉曼等人设计了由22个指标组成的服务质量评价方法,较好地解决了服务质量评价的难题。1990年,美国国民经济研究协会、美国质量协会和美国国家质量研究中心等机构在分析的基础上开始进行关于建立美国顾客满意度指数的调查和研究。1995年,新西兰、加拿大和我国台湾地区在为数不多的几个行业建立了顾客满意度指数。1998年,韩国、马来西亚开始实施有关建立顾客满意度指数的计划。欧盟的英国、法国等国家也启动了类似的计划。2000年,欧洲质量组织和欧洲质量管理基金会与阿瑟安达信公司合作,通过对泛欧洲客户满意度指数的可行性研究,开发了欧洲客户满意度指数。
但是,目前对服务质量评价都是完全从顾客的角度来考虑的,而且只关注服务质量产生的最终结果,而较少涉及深入分析形成最终结果的原因所在,即从内部因素开展对服务质量产生的过程和提供服务的能力的分析方面有所欠缺。并且这些分析缺少大数据支撑,难以建立长效的服务质量评价体系。
发明内容
为了解决以上问题,本发明的目的是提供一种基于神经网络的电力系统客户满意度分析与预测方法,该方法充分利用数据挖掘与神经网络的优势,建立了客户满意度分析与预测模型,能够帮助供电企业建立长效的供电服务内部评价指标体系,建立服务质量监督常态机制,及时发现中心服务的薄弱环节,采取有针对性的改进措施,不断促进供电服务水平和运营管理水平持续提升。
本发明的技术方案是通过以下措施来实现的:
一种基于神经网络的电力系统客户满意度分析与预测方法,其特征在于包括以下步骤:
步骤1:从特定区域的电力评价系统中收集特定时间内的报修查询结果作为实验样本;
步骤2:对报修查询结果数据集进行数据预处理,并提取影响处理满意度结果的相关属性;
步骤3:建立数据挖掘样本集,并将样本集分为训练样本集和测试样本集;
步骤4:根据样本集和LM神经网络建立预测模型;
步骤5:导出预测模型,进行用户满意度预测。
所述步骤1中从某市电力评价系统中收集最近五年内的报修查询结果作为此次实验样本,并进行数据预处理。
上述步骤1中从盐城市电力评价系统中收集2015-2019年报修查询结果作为此次实验样本具体步骤如下:
(1)分析各个excel表格的属性是否匹配,剔除不匹配的属性;
(2)按照固定属性将多个excel表格合成一个表格,并去除重复的元组;
上述步骤2中对报修查询结果数据集进行数据预处理,并提取影响处理满意度结果的相关属性具体步骤如下:
(1)数据清理:该过程是对表中的原始数据进行清理,发现数据中的孤立点并对数据噪声进行清除,最后对数据中存在的不一致数据做统一处理;
(2)数据转换:将得到的数据变换成适合我们挖掘分析的数据形式;
(3)数据消减:尽可能的减小挖掘分析过程中数据的数量,同时也不会对挖掘得到的结产生影响;
上述步骤4中根据样本集和LM神经网络建立预测模型具体步骤如下:
(1)建立LM神经网络模型;
(2)通过训练样本集对LM神经网络模型进行训练,得到预测模型;
(3)设定预测模型的准确率限值,通过测试样本集检测预测模型的准确率,判断检测得到的准确率是否小于设定的准确率限值,若小于,则对该预测模型进行优化,并继续执行第(2)步。
本发明有益效果如下:
(1)本发明提取电力系统报修查询结果中的一级分类、二级分类、供电单位等八个影响处理满意度结果的属性,将提取的特征属性作为输入,对LM神经网络模型进行训练,建立预测模型,进一步提高预测模型的准确度。
(2)本发明建立测试特征样本,对建立后预测模型进行测试,估算其准确率,准确率较低时,通过优化算法对关键参数(LM网络层数以及每层神经元数目)进行调整优化,进一步优化预测模型,提高预测模型的识别率。
附图说明
图1为LM神经网络训练过程示意图。
具体实施方式
一种基于神经网络的电力系统客户满意度分析与预测方法,具体实施方式如下;
步骤1:从盐城市电力评价系统中收集2014-2019年报修查询结果作为此次实验样本;
步骤2:对报修查询结果数据集进行数据预处理,并提取影响处理满意度结果的相关属性;
步骤3:建立数据挖掘样本集,并将样本集分为训练样本集和测试样本集;
步骤4:根据样本集和LM神经网络建立预测模型;
步骤5:导出预测模型,进行用户满意度预测。
上述步骤1中从盐城市电力评价系统中收集2015-2019年报修查询结果作为此次实验样本具体步骤如下:
(1)分析各个excel表格的属性是否匹配,经分析发现2014及2015年报修查询结果中有是否催办属性,而后面的年份数据集中没有该属性,并且由于该属性的内容都为否,不影响处理满意度结果,因此可以将2014和2015年中的该属性列删除;
(2)按照2014年中固定属性排序将多个excel表格合成一个表格,并查询是否有重复的元组,若有则删除;
上述步骤2的过程可基于Anaconda平台实现。对报修查询结果数据集进行数据预处理具体步骤如下:
(1)空缺值:是指我们所得到的数据中某些对象的部分属性存在缺失。如果不对其进行处理,经常会对挖掘结果产生许多不可预知的影响。如果缺失值对结果影响不大且数据样本充足,们可以直接删除含有缺失值的样本。对于修复时间等重要属性值的样本,找出指定元组同一类别中的其他样本的属性平均值,用该值来替换。
(2)噪声:噪声在多数情况下是没有用的,因为它是代表数据中一个变量产生了随机错误或偏差,因此,噪声的存在会影响数据的质量和准确度。但是,有时噪声也可能是一种有用信息。因此,我们可以选择平滑技术的方法对噪声进行处理。
(3)数据转换:将得到的数据变换成适合我们挖掘分析的数据形式。由于数据集中的时间属性均是时间点的形式,而影响处理满意度结果的是时间差,所以我们要把报修查询结果中的时间点转换成时间差,但是时间差的连续性会对算法的运作造成许多麻烦,且增大工作时间。因此我们考虑通过k-means聚类的方法将连续的时间差转换成离散的形式,并用标签值代替原来的值。
(4)数据消减:此过程是为了尽可能的减小挖掘分析过程中数据的数量,同时也不会对挖掘得到的结产生影响。保修结果查询数据集共有35个属性,可以将其整合为以下几类:报修用户相关,故障相关,维修相关以及最终的评价信息。首先分析各个属性与处理满意度之间的相关性,留下相关性大的属性,删除相关性小的属性。然后分析属性之间的相关性,删除相似属性。在本次数据处理过程中,我们发现申请编号、单位名称(省)、单位名称(地市)、受理人员、服务语种等与处理满意度结果关系不大,因此我们对上述无关属性进行了清理。
上述步骤3,建立数据挖掘样本集,并将样本集分为训练样本集和测试样本集;本发明的每一个样本均包括8个属性Xi=(xi1,xi2,xi3,xim),(i=1,2,...,N)和对应的处理满意度Yi,其中M为训练样本总数,样本属性Xi=(xi1,xi2,xi3,xim),(i=1,2,...,N)为训练输入;本发明中可采用十折交叉验证方式训练及验证模型,因此可将特征样本中的80%作为训练特征样本,20%作为测试特征样本。
步骤4中根据样本集和LM神经网络建立预测模型的具体步骤如下:
(1)建立LM神经网络模型;
(2)通过训练样本集对LM神经网络模型进行训练,得到预测模型;
(3)设定预测模型的准确率限值,通过测试样本集检测预测模型的准确率,判断检测得到的准确率是否小于设定的准确率限值,若小于,则对该预测模型进行优化,并继续执行第(2)步。
上述第(1)步建立LM神经网络模型步骤如下:
(1)输出层的设计:该模型由每组报修查询结果数据的各项属性作为输入,以处理满意度结果作为输出,所以输入层的节点数为8,输出的节点数为1
(2)隐层设计:有关研究表明,有一个隐层的神经网络,只要隐节点足够多,就可以以任意精度逼近一个非线性函数。因此,本文采用含有一个隐层的三层多输入单输出的LM网络建立预测模型。在网络设计过程中,隐层神经元数的确定十分重要。隐层神经元个数过多,会加大网络计算量并容易产生过度拟合问题;神经元个数过少,则会影响网络性能,达不到预期效果。网络中隐层神经元的数目与实际问题的复杂程度、输入和输出层的神经元数以及对期望误差的设定有着直接的联系。目前,对于隐层中神经元数目的确定并没有明确的公式,只有一些经验公式,神经元个数的最终确定还是需要根据经验和多次实验来确定。本文在选取隐层神经元个数的问题上参照了以下的经验公式:
本文a取5,所以隐层节点数为6
(3)激励函数的选取:LM神经网络通常采用Sigmoid可微函数和线性函数作为网络的激励函数。本文选择S型正切函数tansig作为隐层神经元的激励函数。而由于网络的输出归一到[-1,1]范围内,因此预测模型选取S型对数函数tansig作为输出层神经元的激励函数。
上述第(2)步,通过训练样本集对LM神经网络模型进行训练,即将训练样本的8个属性Xi=(xi1,xi2,xi3,xim),(i=1,2,...,N)作为输入进行LM神经网络模型训练,LM网络训练流程如下所述:
(1)给出训练误差允许值ε,常数μ0和β(0<β<1),并且初始化权值和阈值向量,令k=0,μ=μ0;
(2)计算网络输出及误差指标函数E(wk);
(3)计算Jacobian矩阵J(wk);
(4)计算Δw;
(5)若E(wk)<ε,算法结束;
(6)以wk+1=wk+Δw为权值和阈值向量,计算误差指标函数E(wk+1),若E(wk+1)<E(wk),则令k=k+1,μ=μβ,转到2),否则μ=μ/β,转到4)。
设测试阶段的样本输入为Xi(i=1,2,…,M),Yi(i=1,2,…,M)真实的样本处理满意度结果,为LM网络预测输出,M为测试样本总数。若则表明该预测模型对第i个样本进行了正确预测,反之预测不正确。本发明预测模型预测准确率可表示为:
在测试过程中,若准确率较低,则可通过对LM网络层数以及每层神经元数目进行调整。本发明可采用Lippmann提出的优化方法进行模型优化,即可将LM神经网络层数指定为2,接着对每个隐藏层的神经元个数进行优化。
本发明充分利用数据挖掘与神经网络的优势,建立了客户满意度分析与预测模型,能够帮助供电企业建立长效的供电服务内部评价指标体系,建立服务质量监督常态机制,及时发现中心服务的薄弱环节,采取有针对性的改进措施,不断促进供电服务水平和运营管理水平持续提升。
Claims (4)
1.一种基于神经网络的电力系统客户满意度分析与预测方法,其特征在于包括以下步骤:
步骤 1:从特定区域的电力评价系统中收集特定时间内的报修查询结果作为实验样本;
步骤2: 对报修查询结果数据集进行数据预处理,并提取影响处理满意度结果的相关属性;
步骤3:建立数据挖掘样本集,并将样本集分为训练样本集和测试样本集;
步骤4:根据样本集和LM神经网络建立预测模型;
步骤5:导出预测模型,进行用户满意度预测。
2.根据权利要求1所述的基于神经网络的电力系统客户满意度分析与预测方法,其特征在于:所述步骤 1中从某市电力评价系统中收集最近五年内的报修查询结果作为此次实验样本,并进行数据预处理。
3.根据权利要求1所述的基于神经网络的电力系统客户满意度分析与预测方法,其特征在于:上述步骤2具体步骤如下:
(1)数据清理:对表中的原始数据进行清理,发现数据中的孤立点并对数据噪声进行清除,最后对数据中存在的不一致数据做统一处理;
(2)数据转换:将得到的数据变换成适合挖掘分析的数据形式;
(3)数据消减:尽可能的减小挖掘分析过程中数据的数量,同时也不会对挖掘得到的结产生影响。
4.根据权利要求1所述的基于神经网络的电力系统客户满意度分析与预测方法,其特征在于:步骤4具体如下:
(1)建立LM神经网络模型;
(2)通过训练样本集对LM神经网络模型进行训练,得到预测模型;
(3)设定预测模型的预测准确值,并通过测试样本集检测预测模型的准确率,判断检测得到的准确率是否小于设定的准确率限值,若小于,则对该预测模型进行优化,并继续执行第(2)步。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911192134.7A CN110928924A (zh) | 2019-11-28 | 2019-11-28 | 基于神经网络的电力系统客户满意度分析与预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911192134.7A CN110928924A (zh) | 2019-11-28 | 2019-11-28 | 基于神经网络的电力系统客户满意度分析与预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110928924A true CN110928924A (zh) | 2020-03-27 |
Family
ID=69847467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911192134.7A Pending CN110928924A (zh) | 2019-11-28 | 2019-11-28 | 基于神经网络的电力系统客户满意度分析与预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110928924A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052966A (zh) * | 2020-09-24 | 2020-12-08 | 佰聆数据股份有限公司 | 基于现场抢修工单的电力客户满意度分析系统和方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280535A (zh) * | 2017-12-26 | 2018-07-13 | 江苏仲博敬陈信息科技有限公司 | 一种基于机器学习的库存预测系统 |
CN108288115A (zh) * | 2018-03-15 | 2018-07-17 | 安徽大学 | 一种物流企业日常短期快递业务量预测方法 |
CN109784966A (zh) * | 2018-11-29 | 2019-05-21 | 昆明理工大学 | 一种音乐网站客户流失预测方法 |
-
2019
- 2019-11-28 CN CN201911192134.7A patent/CN110928924A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280535A (zh) * | 2017-12-26 | 2018-07-13 | 江苏仲博敬陈信息科技有限公司 | 一种基于机器学习的库存预测系统 |
CN108288115A (zh) * | 2018-03-15 | 2018-07-17 | 安徽大学 | 一种物流企业日常短期快递业务量预测方法 |
CN109784966A (zh) * | 2018-11-29 | 2019-05-21 | 昆明理工大学 | 一种音乐网站客户流失预测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052966A (zh) * | 2020-09-24 | 2020-12-08 | 佰聆数据股份有限公司 | 基于现场抢修工单的电力客户满意度分析系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Geng et al. | Early warning modeling and analysis based on a deep radial basis function neural network integrating an analytic hierarchy process: A case study for food safety | |
Witlox et al. | The application of rough sets analysis in activity-based modelling. Opportunities and constraints | |
CN112199415A (zh) | 一种数据特征预处理的方法及其实现系统和应用 | |
CN111898839B (zh) | 电力用户的重要程度分类方法及装置 | |
CN109241199B (zh) | 一种面向金融知识图谱发现的方法 | |
CN112906892A (zh) | 一种基于深度学习与知识图谱的设备故障智能诊断方法 | |
CN112488507B (zh) | 一种基于聚类的专家分类画像方法、装置及存储介质 | |
CN113177746A (zh) | 一种针对生命周期评价领域的软件质量综合评估方法 | |
CN113344615A (zh) | 一种基于gbdt和dl融合模型的营销活动预测方法 | |
CN114298834A (zh) | 一种基于自组织映射网络的个人信用评估方法及系统 | |
CN110928924A (zh) | 基于神经网络的电力系统客户满意度分析与预测方法 | |
CN113591947A (zh) | 基于用电行为的电力数据聚类方法、装置和存储介质 | |
CN114764682B (zh) | 一种基于多机器学习算法融合的大米安全风险评估方法 | |
CN115544211A (zh) | 一种对外贸易涉外法律索引与行业风险评估的方法 | |
CN115510740A (zh) | 一种基于深度学习的航空发动机剩余寿命预测方法 | |
CN111221915B (zh) | 基于CWK-means的在线学习资源质量分析方法 | |
Pan et al. | Anomaly data management and big data analytics: an application on disability datasets | |
Tao et al. | Research on the prediction of employee turnover behavior and its interpretability | |
Zadeh | A New Sales Forecasting method for industrial supply chain | |
CN114282875A (zh) | 流程审批确定性规则和语义自学习结合判定方法及装置 | |
de Almeida et al. | A case study on environmental sustainability: A study of the trophic changes in fish species as a result of the damming of rivers through clustering analysis | |
Zhang | Data Sets Modeling and Frequency Prediction via Machine Learning and Neural Network | |
CN115455708B (zh) | 基于向量相识度的多模型局部建模方法 | |
CN112101033B (zh) | 一种汽车口碑的情感分析方法和装置 | |
Pan et al. | Knowledge discovery in sociological databases: An application on general society survey dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |