CN112200692A - 一种基于大数据的电力客户标签体系的构建方法和系统 - Google Patents
一种基于大数据的电力客户标签体系的构建方法和系统 Download PDFInfo
- Publication number
- CN112200692A CN112200692A CN202010878865.3A CN202010878865A CN112200692A CN 112200692 A CN112200692 A CN 112200692A CN 202010878865 A CN202010878865 A CN 202010878865A CN 112200692 A CN112200692 A CN 112200692A
- Authority
- CN
- China
- Prior art keywords
- data
- power
- information
- big data
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims description 10
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000013145 classification model Methods 0.000 claims abstract description 8
- 230000009467 reduction Effects 0.000 claims abstract description 8
- 230000005611 electricity Effects 0.000 claims description 23
- 238000000513 principal component analysis Methods 0.000 claims description 8
- 230000006872 improvement Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于大数据的电力客户标签体系的构建方法和系统,包括以下步骤:S1:数据调取的步骤;接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;S2:样本抽取步骤;从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;S3:训练分类模型的步骤;通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;S4:建立标签库并构建客户标签的步骤;将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
Description
技术领域
本发明属于电力系统服务技术领域,涉及一种电力客户的标签构建方法和系统,尤其是一种基于大数据的电力客户标签体系的构建方法和系统。
背景技术
随着近十多年来对客户服务的持续关注与改进,电网企业的客户服务水平和营销能力已经有了显著提升,但与整个社会群体维权意识提升、以及其他行业的服务体验改善相比,电网行业面对客户的管理能力仍处在落后水平。对各用户的管理基本一致,无针对性,资源得不到有效充分地利用,无法应对不同的需求,服务水平得不到提高。
针对现有技术中存在上述缺陷和问题,公开号为CN106296445A的发明专利公开了一种电力客户标签构建方法;并给出以下技术方案:
一种电力客户标签构建方法,其特征在于包括以下步骤:
1)获取客户数据,包括客户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息及外部数据;
2)建立标签库:
建立客户属性库:根据获取的客户数据,识别客户特征,建立客户属性库,客户属性库存储的数据包括:基础信息、用电行为、触点记录、费用记录;
建立客户标签库:基于客户属性库数据,提炼客户标签,建立客户标签库,客户标签库存储的数据包括客户价值、行为偏好、业务特征、情感特征;
标签管理:以客户标签库为基础,提供标签查询、分析、评估、推送服务;
3)标签的展示应用:根据建立标签库的对客户标签进行展示,展示的内容包括分析报表、推送包、客户群画像、客户画像中的一种或多种,并向原业务系统提供标签应用。
上述技术方案中获取的客户数据并不全面,而且客户数据资源的获取方式狭隘,使得最终获取的客户标签准确性和可信度偏低。此为现有技术的不足之处。
有鉴于此,本发明提供一种基于大数据的电力客户标签体系的构建方法和系统;以解决现有技术中存在的上述缺陷和不足;是非常有必要的。
发明内容
本发明的目的在于,针对上述现有技术存在的缺陷,提供设计一种基于大数据的电力客户标签体系的构建方法和系统,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种基于大数据的电力客户标签体系的构建方法,包括以下步骤:
S1:数据调取的步骤;
接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
S2:样本抽取步骤;
从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
S3:训练分类模型的步骤;
通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
S4:建立标签库并构建客户标签的步骤;
将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
作为优选,所述步骤S1中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。
作为优选,所述步骤S2中,采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
作为优选,所述步骤S1中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
本发明还给出一种基于大数据的电力客户标签体系的构建系统,包括:
数据调取模块,接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
样本抽取模块,从数据调取模块中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
训练分类模型模块,通过PCA算法对样本抽取模块中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
标签库建立模块,将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
作为优选,所述数据调取模块中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。
作为优选,所述样本抽取模块中,采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
作为优选,所述数据调取模块中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
本发明的有益效果在于,通过接入大数据平台获取的数据全面准确,为后续建模分类提供可靠的基础资源;通过对样本数据数据进行降维处理,能够提高整个分类过程的效率,并且在提高分类效率的前提下,得到的分类标准准确度不受影响。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
图1是本发明提供的一种基于大数据的电力客户标签体系的构建方法的流程图。
图2是本发明提供的一种基于大数据的电力客户标签体系的构建系统的原理框图。
其中,1-数据调取模块,2-样本抽取模块,3-训练分类模型模块,4-标签库建立模块。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例1:
如图1所示,本实施例提供的一种基于大数据的电力客户标签体系的构建方法,包括以下步骤:
S1:数据调取的步骤;
接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
S2:样本抽取步骤;
从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
S3:训练分类模型的步骤;
通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
S4:建立标签库并构建客户标签的步骤;
将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
实施例2:
如图2所示,本实施例提供的一种基于大数据的电力客户标签体系的构建系统,包括:
数据调取模块1,接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
样本抽取模块2,从数据调取模块中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
训练分类模型模块3,通过PCA算法对样本抽取模块中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
标签库建立模块4,将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
Claims (8)
1.一种基于大数据的电力客户标签体系的构建方法,其特征在于,包括以下步骤:
S1:数据调取的步骤;
接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
S2:样本抽取步骤;
从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
S3:训练分类模型的步骤;
通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
S4:建立标签库并构建客户标签的步骤;
将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
2.根据权利要求1所述的一种基于大数据的电力客户标签体系的构建方法,其特征在于,所述步骤S1中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息。
3.根据权利要求2所述的一种基于大数据的电力客户标签体系的构建方法,其特征在于,所述步骤S2中,采用随机函数对采集到的全部数据信息进行抽样。
4.根据权利要求3所述的一种基于大数据的电力客户标签体系的构建方法,其特征在于,所述步骤S1中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
5.一种基于大数据的电力客户标签体系的构建系统,其特征在于,包括:
数据调取模块,接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
样本抽取模块,从数据调取模块中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
训练分类模型模块,通过PCA算法对样本抽取模块中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
标签库建立模块,将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
6.根据权利要求5所述的一种基于大数据的电力客户标签体系的构建系统,其特征在于,所述数据调取模块中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。
7.根据权利要求6所述的一种基于大数据的电力客户标签体系的构建系统,其特征在于,所述样本抽取模块中,采用随机函数对采集到的全部数据信息进行抽样。
8.根据权利要求7所述的一种基于大数据的电力客户标签体系的构建系统,其特征在于,所述数据调取模块中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010878865.3A CN112200692A (zh) | 2020-08-27 | 2020-08-27 | 一种基于大数据的电力客户标签体系的构建方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010878865.3A CN112200692A (zh) | 2020-08-27 | 2020-08-27 | 一种基于大数据的电力客户标签体系的构建方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112200692A true CN112200692A (zh) | 2021-01-08 |
Family
ID=74006245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010878865.3A Pending CN112200692A (zh) | 2020-08-27 | 2020-08-27 | 一种基于大数据的电力客户标签体系的构建方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112200692A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140317034A1 (en) * | 2013-04-23 | 2014-10-23 | Dan Kushnir | Data classification |
CN107292513A (zh) * | 2017-06-21 | 2017-10-24 | 国网辽宁省电力有限公司 | 一种基于svm分类算法实现电力客户管理的方法 |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109145031A (zh) * | 2018-08-20 | 2019-01-04 | 国网安徽省电力有限公司合肥供电公司 | 一种面向业务市场接入需求的多源数据多维重构方法 |
CN110458313A (zh) * | 2018-05-07 | 2019-11-15 | 中国科学院沈阳自动化研究所 | 一种基于svm的电力用户信用风险预警方法及系统 |
-
2020
- 2020-08-27 CN CN202010878865.3A patent/CN112200692A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140317034A1 (en) * | 2013-04-23 | 2014-10-23 | Dan Kushnir | Data classification |
CN107292513A (zh) * | 2017-06-21 | 2017-10-24 | 国网辽宁省电力有限公司 | 一种基于svm分类算法实现电力客户管理的方法 |
CN110458313A (zh) * | 2018-05-07 | 2019-11-15 | 中国科学院沈阳自动化研究所 | 一种基于svm的电力用户信用风险预警方法及系统 |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109145031A (zh) * | 2018-08-20 | 2019-01-04 | 国网安徽省电力有限公司合肥供电公司 | 一种面向业务市场接入需求的多源数据多维重构方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113064866B (zh) | 一种电力业务数据整合系统 | |
CN107315810A (zh) | 一种物联网设备行为画像方法 | |
CN108765004A (zh) | 一种基于数据挖掘识别用户窃电行为的方法 | |
CN104636240B (zh) | 一种信息报表的获取方法及终端 | |
CN107292513A (zh) | 一种基于svm分类算法实现电力客户管理的方法 | |
CN116739676A (zh) | 一种基于大数据的智能广告营销系统 | |
CN111461521A (zh) | 一种基于电力大数据的居民住房空置率分析方法 | |
CN105530265A (zh) | 一种基于频繁项集描述的移动互联网恶意应用检测方法 | |
CN111127099A (zh) | 一种基于大数据的电商用户分析系统及其分析方法 | |
CN112507006A (zh) | 基于云端的电网企业运行数据整合系统 | |
CN111092764B (zh) | 一种实时动态亲密度关系分析方法及系统 | |
CN109142830A (zh) | 基于用电信息采集系统大数据的窃电检测方法 | |
CN112102003A (zh) | 基于大数据平台用电客户核心资源管理系统及方法 | |
CN106649765A (zh) | 基于大数据技术的智能电网全景数据分析方法 | |
CN112200692A (zh) | 一种基于大数据的电力客户标签体系的构建方法和系统 | |
Yu et al. | Research on situational perception of power grid business based on user portrait | |
CN102045748A (zh) | 基于数据业务流量的移动网络智能分析方法及系统 | |
CN112527887A (zh) | 一种应用于Gbase数据库的可视化运维方法及装置 | |
CN110597993A (zh) | 一种微博热点话题数据挖掘方法 | |
CN110719445A (zh) | 一种基于图像识别的远程抄表系统及方法 | |
CN106127602A (zh) | 一种基于约简离群点算法的窃电辨识方法及装置 | |
CN105471676A (zh) | 一种端口扫描ip网址活跃度统计系统及方法 | |
CN113553490A (zh) | 一种数据管理平台及数据管理方法 | |
CN114003774A (zh) | 一种用于智慧城市的电力大数据信息采集系统 | |
Jiang et al. | P2P traffic identification research based on the SVM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210108 |