CN112200692A - 一种基于大数据的电力客户标签体系的构建方法和系统 - Google Patents

一种基于大数据的电力客户标签体系的构建方法和系统 Download PDF

Info

Publication number
CN112200692A
CN112200692A CN202010878865.3A CN202010878865A CN112200692A CN 112200692 A CN112200692 A CN 112200692A CN 202010878865 A CN202010878865 A CN 202010878865A CN 112200692 A CN112200692 A CN 112200692A
Authority
CN
China
Prior art keywords
data
power
information
big data
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010878865.3A
Other languages
English (en)
Inventor
陈洋
张旭
徐天赐
李忠玉
吕雨莳
满阳阳
厉运达
卢兴旺
宫池玉
延凯
潘广旭
杜生辉
张祖福
曹洲
王祥法
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Rizhao Power Supply Co of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Rizhao Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Rizhao Power Supply Co of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010878865.3A priority Critical patent/CN112200692A/zh
Publication of CN112200692A publication Critical patent/CN112200692A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于大数据的电力客户标签体系的构建方法和系统,包括以下步骤:S1:数据调取的步骤;接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;S2:样本抽取步骤;从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;S3:训练分类模型的步骤;通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;S4:建立标签库并构建客户标签的步骤;将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。

Description

一种基于大数据的电力客户标签体系的构建方法和系统
技术领域
本发明属于电力系统服务技术领域,涉及一种电力客户的标签构建方法和系统,尤其是一种基于大数据的电力客户标签体系的构建方法和系统。
背景技术
随着近十多年来对客户服务的持续关注与改进,电网企业的客户服务水平和营销能力已经有了显著提升,但与整个社会群体维权意识提升、以及其他行业的服务体验改善相比,电网行业面对客户的管理能力仍处在落后水平。对各用户的管理基本一致,无针对性,资源得不到有效充分地利用,无法应对不同的需求,服务水平得不到提高。
针对现有技术中存在上述缺陷和问题,公开号为CN106296445A的发明专利公开了一种电力客户标签构建方法;并给出以下技术方案:
一种电力客户标签构建方法,其特征在于包括以下步骤:
1)获取客户数据,包括客户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息及外部数据;
2)建立标签库:
建立客户属性库:根据获取的客户数据,识别客户特征,建立客户属性库,客户属性库存储的数据包括:基础信息、用电行为、触点记录、费用记录;
建立客户标签库:基于客户属性库数据,提炼客户标签,建立客户标签库,客户标签库存储的数据包括客户价值、行为偏好、业务特征、情感特征;
标签管理:以客户标签库为基础,提供标签查询、分析、评估、推送服务;
3)标签的展示应用:根据建立标签库的对客户标签进行展示,展示的内容包括分析报表、推送包、客户群画像、客户画像中的一种或多种,并向原业务系统提供标签应用。
上述技术方案中获取的客户数据并不全面,而且客户数据资源的获取方式狭隘,使得最终获取的客户标签准确性和可信度偏低。此为现有技术的不足之处。
有鉴于此,本发明提供一种基于大数据的电力客户标签体系的构建方法和系统;以解决现有技术中存在的上述缺陷和不足;是非常有必要的。
发明内容
本发明的目的在于,针对上述现有技术存在的缺陷,提供设计一种基于大数据的电力客户标签体系的构建方法和系统,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种基于大数据的电力客户标签体系的构建方法,包括以下步骤:
S1:数据调取的步骤;
接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
S2:样本抽取步骤;
从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
S3:训练分类模型的步骤;
通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
S4:建立标签库并构建客户标签的步骤;
将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
作为优选,所述步骤S1中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。
作为优选,所述步骤S2中,采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
作为优选,所述步骤S1中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
本发明还给出一种基于大数据的电力客户标签体系的构建系统,包括:
数据调取模块,接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
样本抽取模块,从数据调取模块中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
训练分类模型模块,通过PCA算法对样本抽取模块中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
标签库建立模块,将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
作为优选,所述数据调取模块中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。
作为优选,所述样本抽取模块中,采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
作为优选,所述数据调取模块中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
本发明的有益效果在于,通过接入大数据平台获取的数据全面准确,为后续建模分类提供可靠的基础资源;通过对样本数据数据进行降维处理,能够提高整个分类过程的效率,并且在提高分类效率的前提下,得到的分类标准准确度不受影响。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
图1是本发明提供的一种基于大数据的电力客户标签体系的构建方法的流程图。
图2是本发明提供的一种基于大数据的电力客户标签体系的构建系统的原理框图。
其中,1-数据调取模块,2-样本抽取模块,3-训练分类模型模块,4-标签库建立模块。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例1:
如图1所示,本实施例提供的一种基于大数据的电力客户标签体系的构建方法,包括以下步骤:
S1:数据调取的步骤;
接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
S2:样本抽取步骤;
从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
S3:训练分类模型的步骤;
通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
S4:建立标签库并构建客户标签的步骤;
将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
实施例2:
如图2所示,本实施例提供的一种基于大数据的电力客户标签体系的构建系统,包括:
数据调取模块1,接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
样本抽取模块2,从数据调取模块中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;采用随机函数对采集到的全部数据信息进行抽样;抽样数据的随机性强,提高后续模型建立的准确定。
训练分类模型模块3,通过PCA算法对样本抽取模块中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
标签库建立模块4,将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (8)

1.一种基于大数据的电力客户标签体系的构建方法,其特征在于,包括以下步骤:
S1:数据调取的步骤;
接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
S2:样本抽取步骤;
从步骤S1中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
S3:训练分类模型的步骤;
通过PCA算法对步骤S2中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
S4:建立标签库并构建客户标签的步骤;
将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
2.根据权利要求1所述的一种基于大数据的电力客户标签体系的构建方法,其特征在于,所述步骤S1中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息。
3.根据权利要求2所述的一种基于大数据的电力客户标签体系的构建方法,其特征在于,所述步骤S2中,采用随机函数对采集到的全部数据信息进行抽样。
4.根据权利要求3所述的一种基于大数据的电力客户标签体系的构建方法,其特征在于,所述步骤S1中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
5.一种基于大数据的电力客户标签体系的构建系统,其特征在于,包括:
数据调取模块,接入电网大数据平台,从电网大数据平台中直接调取电力用户的全部数据信息;
样本抽取模块,从数据调取模块中获取的全部数据中随机抽取一定数量电力用户的数据信息作为样本;
训练分类模型模块,通过PCA算法对样本抽取模块中的样本数据进行降维处理;得到样本特征向量,样本特征向量进行SVM分类训练,得到训练后的类别参数,形成分类器;
标签库建立模块,将全部数据信息输入分类器中,进行分类;根据分类结果对电力用户建立标签。
6.根据权利要求5所述的一种基于大数据的电力客户标签体系的构建系统,其特征在于,所述数据调取模块中,电网大数据平台通过整合各供电供电的数据平台数据,获取全部电力用户数据信息;保证电力用户信息的全面性和准确性。
7.根据权利要求6所述的一种基于大数据的电力客户标签体系的构建系统,其特征在于,所述样本抽取模块中,采用随机函数对采集到的全部数据信息进行抽样。
8.根据权利要求7所述的一种基于大数据的电力客户标签体系的构建系统,其特征在于,所述数据调取模块中,电力用的全部信息包括但不限于户基础数据、业务工单信息、电费记录信息、渠道接触记录、用电采集信息、电费缴纳时间、电费缴纳方式、电费缴纳延迟时间、最大瞬时功率信息。
CN202010878865.3A 2020-08-27 2020-08-27 一种基于大数据的电力客户标签体系的构建方法和系统 Pending CN112200692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010878865.3A CN112200692A (zh) 2020-08-27 2020-08-27 一种基于大数据的电力客户标签体系的构建方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010878865.3A CN112200692A (zh) 2020-08-27 2020-08-27 一种基于大数据的电力客户标签体系的构建方法和系统

Publications (1)

Publication Number Publication Date
CN112200692A true CN112200692A (zh) 2021-01-08

Family

ID=74006245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010878865.3A Pending CN112200692A (zh) 2020-08-27 2020-08-27 一种基于大数据的电力客户标签体系的构建方法和系统

Country Status (1)

Country Link
CN (1) CN112200692A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140317034A1 (en) * 2013-04-23 2014-10-23 Dan Kushnir Data classification
CN107292513A (zh) * 2017-06-21 2017-10-24 国网辽宁省电力有限公司 一种基于svm分类算法实现电力客户管理的方法
CN108764984A (zh) * 2018-05-17 2018-11-06 国网冀北电力有限公司电力科学研究院 一种基于大数据的电力用户画像构建方法及系统
CN109145031A (zh) * 2018-08-20 2019-01-04 国网安徽省电力有限公司合肥供电公司 一种面向业务市场接入需求的多源数据多维重构方法
CN110458313A (zh) * 2018-05-07 2019-11-15 中国科学院沈阳自动化研究所 一种基于svm的电力用户信用风险预警方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140317034A1 (en) * 2013-04-23 2014-10-23 Dan Kushnir Data classification
CN107292513A (zh) * 2017-06-21 2017-10-24 国网辽宁省电力有限公司 一种基于svm分类算法实现电力客户管理的方法
CN110458313A (zh) * 2018-05-07 2019-11-15 中国科学院沈阳自动化研究所 一种基于svm的电力用户信用风险预警方法及系统
CN108764984A (zh) * 2018-05-17 2018-11-06 国网冀北电力有限公司电力科学研究院 一种基于大数据的电力用户画像构建方法及系统
CN109145031A (zh) * 2018-08-20 2019-01-04 国网安徽省电力有限公司合肥供电公司 一种面向业务市场接入需求的多源数据多维重构方法

Similar Documents

Publication Publication Date Title
CN113064866B (zh) 一种电力业务数据整合系统
CN107315810A (zh) 一种物联网设备行为画像方法
CN108765004A (zh) 一种基于数据挖掘识别用户窃电行为的方法
CN104636240B (zh) 一种信息报表的获取方法及终端
CN107292513A (zh) 一种基于svm分类算法实现电力客户管理的方法
CN116739676A (zh) 一种基于大数据的智能广告营销系统
CN111461521A (zh) 一种基于电力大数据的居民住房空置率分析方法
CN105530265A (zh) 一种基于频繁项集描述的移动互联网恶意应用检测方法
CN111127099A (zh) 一种基于大数据的电商用户分析系统及其分析方法
CN112507006A (zh) 基于云端的电网企业运行数据整合系统
CN111092764B (zh) 一种实时动态亲密度关系分析方法及系统
CN109142830A (zh) 基于用电信息采集系统大数据的窃电检测方法
CN112102003A (zh) 基于大数据平台用电客户核心资源管理系统及方法
CN106649765A (zh) 基于大数据技术的智能电网全景数据分析方法
CN112200692A (zh) 一种基于大数据的电力客户标签体系的构建方法和系统
Yu et al. Research on situational perception of power grid business based on user portrait
CN102045748A (zh) 基于数据业务流量的移动网络智能分析方法及系统
CN112527887A (zh) 一种应用于Gbase数据库的可视化运维方法及装置
CN110597993A (zh) 一种微博热点话题数据挖掘方法
CN110719445A (zh) 一种基于图像识别的远程抄表系统及方法
CN106127602A (zh) 一种基于约简离群点算法的窃电辨识方法及装置
CN105471676A (zh) 一种端口扫描ip网址活跃度统计系统及方法
CN113553490A (zh) 一种数据管理平台及数据管理方法
CN114003774A (zh) 一种用于智慧城市的电力大数据信息采集系统
Jiang et al. P2P traffic identification research based on the SVM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210108