CN113723663A - 电力工单数据的处理方法、装置、电子设备及存储介质 - Google Patents
电力工单数据的处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113723663A CN113723663A CN202110783892.7A CN202110783892A CN113723663A CN 113723663 A CN113723663 A CN 113723663A CN 202110783892 A CN202110783892 A CN 202110783892A CN 113723663 A CN113723663 A CN 113723663A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- work order
- processing
- electric power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000003672 processing method Methods 0.000 title description 3
- 238000012545 processing Methods 0.000 claims abstract description 81
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims description 38
- 230000008451 emotion Effects 0.000 claims description 26
- 238000010276 construction Methods 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000007637 random forest analysis Methods 0.000 claims description 9
- 230000002996 emotional effect Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 20
- 238000005065 mining Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005611 electricity Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
Abstract
本发明公开了一种电力工单数据的处理方法、装置、电子设备及存储介质,其中,该方法包括:获取电力工单数据,电力工单数据至少包括:工单编号、用户通话信息、问题处理信息;将电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据;根据满意度预测数据生成相应的回访策略。通过本发明,可以预测用户满意度,从而生成相应的回访策略,可以实现与用户更好地回访沟通,进一步提高用户的满意度。
Description
技术领域
本发明涉及数据处理领域,具体涉及一种电力工单数据的处理方法、装置、电子设备及存储介质。
背景技术
随着社会经济发展,人民物质生活水平不断提高,社会对电力的需求日益增加,对供电能力和服务品质的要求也日益提高。对于电力行业来说,以客户为中心,关注客户的需求和体验,提升客户满意度是电力企业的重点工作内容。对于客户来说,享受到高质量、高效率、个性化的服务是客户较为关注的服务体验。
然而目前,在电力行业有关用户满意度的预测研究还比较少,一是因为不同客户的主观情绪会有差异,二是不同的指标对客户满意度的影响存在差异,也就是说,目前尚未有准确预测电力行业用户满意度的技术。
发明内容
有鉴于此,本发明提供一种电力工单数据的处理方法、装置、电子设备及存储介质,以解决上述提及的至少一个问题。
根据本发明的第一方面,提供一种电力工单数据的处理方法,所述方法包括:获取电力工单数据,所述电力工单数据至少包括:工单编号、用户通话信息、问题处理信息;将所述电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据;根据所述满意度预测数据生成相应的回访策略。
根据本发明的第二方面,提供一种电力工单数据的处理装置,所述装置包括:数据获取单元,用于获取电力工单数据,所述电力工单数据至少包括:工单编号、用户通话信息、问题处理信息;预测单元,用于将所述电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据;策略生成单元,用于根据所述满意度预测数据生成相应的回访策略。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述电力工单数据的处理方法的步骤。
根据本发明的第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述电力工单数据的处理方法的步骤。
由上述技术方案可知,通过将获取的电力工单数据输入至预先训练的预测模型,来预测用户满意度,从而生成相应的回访策略,可以实现与用户更好地回访沟通,进一步提高用户的满意度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的电力工单数据的处理方法的流程图;
图2是根据本发明实施例的用户A的序列位置特征数据构建示意图;
图3是根据本发明实施例的SMOTE算法的流程图;
图4是根据本发明实施例的满意度预测结果示意图;
图5是根据本发明实施例的电力工单数据的处理方法的详细流程图;
图6是根据本发明实施例的电力工单数据的处理装置的结构框图;
图7是根据本发明实施例的电力工单数据的处理装置的详细结构框图;
图8是根据本发明实施例的模型训练单元54的结构框图;
图9是根据根据本发明实施例的情感信息特征数据构建模块571的结构框图;
图10是根据本发明实施例的电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
鉴于目前尚未有准确预测电力行业用户满意度的技术,本发明实施例提供一种电力工单数据的处理方案,通过对现有的电力工单数据进行特征挖掘并建立可行性的模型,对用户满意度进行预测。以下结合附图来详细描述本发明实施例。
本发明实施例提供一种电力工单数据的处理方法,图1是该方法的流程图,如图1所示,该方法包括:
步骤101,获取电力工单数据,所述电力工单数据至少包括:工单编号、用户通话信息、问题处理信息。这里的用户通话信息具体包括:通话号码、通话时长、通话日期、用户在预定周期(例如,30天)内的通话次数等;问题处理信息可以包括:受理内容、处理情况等信息。
步骤102,将所述电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据。
步骤103,根据所述满意度预测数据生成相应的回访策略。
通过将获取的电力工单数据输入至预先训练的预测模型,来预测用户满意度,从而生成相应的回访策略,通过本发明实施例可以预测用户满意度,从而可以根据满意度进行回访,实现与用户更好地回访沟通,进一步提高用户的满意度。
对于步骤102中的预测模型,可以通过如下方式来训练:获取历史电力工单数据,所述历史电力工单数据至少包括:回访信息;根据所述回访信息构建训练集和测试集;之后根据所述训练集和测试集、基于随机森林算法对所述预测模型进行训练。
具体而言,回访信息包括:用户是否满意信息,可以根据用户是否满意信息分别构建上述训练集的正负样本数据、以及上述测试集的正负样本数据。例如,将不满意样本作为正样本数据,满意样本为负样本数据。
在实际操作中,可以根据所述历史电力工单数据获取选定用户(例如,用户A)的多个选定工单数据,所述选定工单数据包括:用户A通话信息,例如,通话日期;之后,根据预定周期(例如,30天)内的用户A通话信息生成各选定工单数据的序列位置信息;随后,基于所述各选定工单数据的序列位置信息和所述多个选定工单数据分别构建多个类别的特征数据,所述类别包括:序列位置信息、情感信息、通话信息、是否满意信息、问题缓急信息。以下分别详细描述这几个特征数据。
(一)序列位置信息特征数据
序列位置信息特征数据表征的是选定工单为用户A在预定周期内的第几次通话工单,即,以一个用户的主叫号码为标准,相同号码的来电认为在一个序列内。
在一个实施例中,以30天为时间窗口,找到用户A在当前日期之前30天内的所有通话记录,这些通话记录的工单在一个序列内。以下结合图2来详细描述用户A的序列位置特征构建流程。
图2是用户A的序列位置特征数据构建示意图,如图2所示,图2直线上的点表示用户A在2017年的所有通话工单(即,上述的选定工单),以7月7日的工单为例,之前30天内存在6月15日、6月25日和7月7日3次通话,则7月7日工单的序列位置设置为3。类似地,以6月25日工单为例,之前30天内存在5月29日、6月16日、6月25日3次来电,则6月25日工单的序列位置设置为3。
需要说明的是,在构建特征数据过程中,由于通话日期缺失较为严重,因此可以利用“工单编号”提取用户的通话日期。序列位置特征描述的是以当前工单作为最后一次的通话向前推30天,该条工单作为这条序列中所占的位置,如图2所示的例子,虽然6月25日是7月7日通话工单的前一工单,但只考虑5月29日到6月25日的轨迹时,6月25日的序列位置特征为3,而不是2。
(二)情感信息特征数据
情感信息特征数据表征的是用户在预定周期内(例如,30天内)通话过程中情绪的波动。
具体地,情感信息包括:问题信息(例如,受理内容)和处理信息(例如,处理情况等信息),可以通过如下方式构建所述情感信息的特征数据:根据上述序列位置信息和问题信息生成问题信息特征数据;根据上述序列位置信息和处理信息生成处理信息特征数据;以及基于预定规则、根据问题信息特征数据和处理信息特征数据生成所述情感信息的特征数据。
在一个实施例中,分别计算问题信息(例如,受理内容)和处理信息(例如,处理情况)的得分,并结合上述序列位置信息特征生成选定工单的情感信息总分,以此来构建选定工单的情感信息特征数据,情感信息总分数主要体现在每条工单的情感得分不仅与该条工单相关,还与其前期工单相关。
在一个实施例中,情感信息总分可以通过如下公式来计算:
其中,score表示基于受理内容或处理情况的情感得分,position代表该条工单在当前序列里的序列位置,Score_route代表当前选定工单的受理内容或处理情况的情感总分。这里position的序列位置与(一)中的序列位置特征数值稍有不同,例如,在(一)中,从6月15到7月7日的序列内,7月7日工单的序列位置特征为3,同理5月29到6月25日序列内,6月25日工单的序列位置特征也为3。但是,在进行Score_route计算时,7月7日的Score_route得分是从6月15到7月7日(前推30天),共通话3次,则6月15日、6月25日、7月7日3次通话的position分别对应为1、2、3;同理,6月25日的Score_route的计算5月29日、6月15日、6月25日这3次工单的得分加和,对应的position为1、2、3。基于Score_route公式分别计算受理内容和处理情况的情感总分后,基于如下规则构建情感信息特征数据,具体规则如下:当受理内容得分为负、处理情况得分为正/0/负时,情感信息特征分别设置0/1/2;
当受理内容得分为0、处理情况得分为正/0/负时,情感信息特征分别赋值3/4/5;
当受理内容得分为正、处理情况得分为正/0/负时,情感信息特征分别赋值6/7/8。
需要说明的是,这里特征赋值并无大小之分,只作为定性特征。
(三)通话信息特征数据
这里的通话信息主要包括:来电间隔信息和通话时长。其中,来电间隔信息特征属于数值型特征,单位为天,表征的是当前工单来电与上次来电之间的时间间隔。如果用户在当前工单前期没有过来电,则通话信息特征设置为365,如上次来电间隔超过365,也设置为365。
通话时长特征属于定量特征,反映了用户来电通话时长,从侧面表征了用户来电的重要程度。如果该特征缺失,则设置为100,如果不缺少,则为原通话时长信息。
(四)是否满意信息特征数据
该特征数据是指之前是否有不满意回访,可以是二值化特征,表征的是用户历史回访是否有过不满意情况。该特征数据的构建方式为:直接追溯到本年或者前几年1月的该用户历史工单,如果出现过不满意,则该特征设置为1,没有过不满意,则设置为0。
(五)问题缓急信息特征数据
该特征表征的是用户对当前需求的迫切程度,也就是对受理内容的迫切程度,属于定量特征。该特征构建规则如下所示:
当受理内容中只包含“中断”时,该问题缓急信息特征设置为0;
当受理内容中只包含“催|尽快|急”时,该问题缓急信息特征设置为2;
当受理内容中只包含“关联|投诉”时,该问题缓急信息特征设置为3;
当受理内容中以上三者都不包含时,该问题缓急信息特征设置为1;
当受理内容中只包含“中断”和“催|尽快|急”时,该问题缓急信息特征设置为4;
当受理内容中只包含“关联|投诉”和“催|尽快|急”时,该问题缓急信息特征设置为5;
当受理内容中只包含“中断”和“关联|投诉”时,该问题缓急信息特征设置为6;
当受理内容中以上三者都包含时,该问题缓急信息特征设置为7。
特别的,含有“关联”二字的受理内容表示用户前期来过电话,有关联工单表示用户较为迫切。
在实际操作中,上述特征数据主要来源于工单数据的轨迹特征和原始工单字段的特征挖掘。其中,序列位置信息、情感信息以及通话信息中的来电间隔信息这3个特征主要来源于工单数据的轨迹特征挖掘,通话信息中的通话时长、是否满意信息和问题缓急信息这3个特征主要来源于原始工单字段的特征挖掘。
在一个实施例中,还可以使用过采样算法(例如,SMOTE过采样算法)对所述训练集的正负样本数据进行样本失衡的均衡处理。也就是说,采用SMOTE过采样技术对训练集中用户满意与不满意两种样本进行样本失衡的均衡处理。
具体的,SMOTE算法步骤流程如图3所示:
步骤301:对于失衡类别样本集中的每一个样本x,以空间欧式距离为度量方式确定x的K近邻;
步骤302:根据样本类别不平衡情况,确定过采样倍率Q,从x的K近邻中随机选择Q个近邻;
步骤303:对于每一个x和xn,根据如下公式线性插值出新样本xnew,
xnew=x+rand(0,1)×(xn-x),n=1,2,...,Q
其中,rand(0,1)表示0到1之间的随机数,xn表示与x比较相似或者具有与x相关特征的几条数据。
之后,基于集成学习中的随机森林模型进行训练和预测。随机森林算法模型具有抗干扰能力强、不容易过拟合、对缺失数据不敏感、可以处理连续和离散数据等优点,利用随机森林模型进行预测,可以得到较好地预测结果。
图4是预测结果示意图,如图4所示,1代表回访不满意情况,0代表回访满意情况,本发明实施例在测试集上对不满意率预测的查准率为92%、查全率为90%。
在具体实施过程中,在模型训练之前,可以先对获取的多条历史电力工单数据进行数据清洗等预处理。
在一个实施例中,获取电力行业单位X的历史工单数据共包括98个字段,240万条数据,经过数据预处理保留下来30个有效字段;再经过特征挖掘,最终模型涉及到的原始字段为8个。
具体而言,对数据可以进行如下的预处理操作:
(1)删除所有字段中缺失值大于70%的字段,部分字段缺失情况统计如下表1所示:
表1
(2)根据专家经验去掉无效字段,如“供电单位”、“用户姓名”等字段,并保留虽然缺失较多,但业务相关较高的字段,如“处理情况”、“受理内容或受理意见”等。
(3)进行缺失值填充,直接填充例如“处理情况”可以直接填充“无”;根据业务逻辑填充,例如原始数据中的“主叫号码”,可以利用TEL(电话)或TEL2进行填充。
经过数据预处理之后,历史工单保留了国网工单编号、主叫号码、请求开始时间、请求结束时间、所属地市、业务类型、一级业务子类、受理内容、处理情况、是否国网一次办结、是否省办结、受理意见、服务请求来源、处理满意度、故障现象、故障危害度等30个字段,但最终用到的原始数据字段包括:工单编号、主叫号码、受理意见、来电时间、来电结束时间、受理内容、处理情况、回访内容。基于这些最终的原始数据字段,就可以进行特征数据的构建。
需要说明的是,由于“工单编号”缺失情况较少,因此利用“工单编号”字段可以提取出用户的来电日期,来电日期为序列位置构建的基础。
图5是根据本发明实施例的电力工单数据的处理方法的详细流程图,如图5所示,该流程包括:
步骤501,采集用户历史工单数据并进行数据预处理形成样本集;
步骤502,构建用户历史工单序列;
步骤503,基于序列进行特征挖掘;
步骤504,进行其他原始字段的特征挖掘;
步骤505,得到建模所需的特征数据;
步骤506,利用SMOTE过采样技术平衡训练集中的类别失衡样本;
步骤507,采用集成学习随机森林算法进行建模和预测。
由以上描述可知,本发明实施例无需收集用户信息,仅基于用户工单轨迹和其他原始字段,并根据机器学习中的监督式集成学习算法模型就可以进行用户满意度预测,进而电力服务人员可以因人而异的对客户提供服务和帮助,减少用户的用电不满意度。
需要说明的是,在实现本发明实施例的过程中,申请人发现客户满意度在很大程度上与其前期来电轨迹相关,从这个角度出发,本发明实施例基于客户来电轨迹构建满意率预测模型,模型在测试集上表现较好。
基于相似的发明构思,本发明实施例还提供一种电力工单数据的处理装置,该装置优选的用于实现上述方法实施例中的步骤。图6是该装置的结构框图,如图6所示,该装置包括:数据获取单元51、预测单元52和策略生成单元53,其中:
数据获取单元51,用于获取电力工单数据,所述电力工单数据至少包括:工单编号、用户通话信息、问题处理信息;
预测单元52,用于将所述电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据;
策略生成单元53,用于根据所述满意度预测数据生成相应的回访策略。
通过预测单元52将数据获取单元51获取的电力工单数据输入至预先训练的预测模型,来预测用户满意度数据,之后策略生成单元53生成相应的回访策略,通过本发明实施例可以预测用户满意度数据,从而可以根据满意度进行回访,实现与用户更好地回访沟通,进一步提高用户的满意度。
在实际操作中,如图7所示,上述装置还包括:模型训练单元54,用于训练所述预测模型。
图8是该模型训练单元54的结构框图,如图8所示,该模型训练单元54包括:历史数据获取模块541、集合构建模块542和训练模块543,其中:
历史数据获取模块541,用于获取历史电力工单数据,所述历史电力工单数据至少包括:回访信息,该回访信息包括用户是否满意信息。
集合构建模块542,用于根据所述回访信息构建训练集和测试集,具体而言,集合构建模块542根据用户是否满意信息分别构建所述训练集的正负样本数据、以及所述测试集的正负样本数据。例如,将不满意样本作为正样本数据,满意样本为负样本数据。
训练模块543,用于根据所述训练集和测试集、基于随机森林算法对所述预测模型进行训练。
继续参见图7,上述装置还包括:选定工单数据获取单元55、序列位置信息生成单元56、特征数据建构单元57,其中:
选定工单数据获取单元55,用于根据所述历史电力工单数据获取选定用户的多个选定工单数据,所述选定工单数据至少包括:选定用户通话信息;
序列位置信息生成单元56,用于根据预定周期内的选定用户通话信息生成各选定工单数据的序列位置信息;
特征数据建构单元57,用于基于所述各选定工单数据的序列位置信息和所述多个选定工单数据分别构建多个类别的特征数据,所述类别包括:序列位置信息、情感信息、通话信息、是否满意信息、问题缓急信息。
其中,情感信息包括:问题信息和处理信息。优选地,特征数据建构单元57包括:情感信息特征数据构建模块,用于构建所述情感信息的特征数据。
如图9所示,情感信息特征数据构建模块571包括:问题信息特征数据生成子模块5711、处理信息特征数据生成子模块5712和情感信息特征数据生成子模块5713,其中:
问题信息特征数据生成子模块5711,用于根据所述序列位置信息和问题信息生成问题信息特征数据;
处理信息特征数据生成子模块5712,用于根据所述序列位置信息和处理信息生成处理信息特征数据;
情感信息特征数据生成子模块5713,用于基于预定规则、根据问题信息特征数据和处理信息特征数据生成所述情感信息的特征数据。
继续参见图7,上述装置还包括:样本失衡处理单元58,用于使用过采样算法(例如,SMOTE过采样算法)对所述训练集的正负样本数据进行样本失衡的均衡处理。
上述各单元、各模块、各子模块的具体执行过程,可以参见上述方法实施例中的描述,此处不再赘述。
在实际操作中,上述各单元、各模块、各子模块可以组合设置、也可以单一设置,本发明不限于此。
图10是根据本发明实施例的电子设备的示意图。图10所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器1001和存储器1002。处理器1001和存储器1002通过总线1003连接。存储器1002适于存储处理器1001可执行的一条或多条指令或程序。该一条或多条指令或程序被处理器1001执行以实现上述电力工单数据的处理方法中的步骤。
上述处理器1001可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器1001通过执行存储器1002所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线1003将上述多个组件连接在一起,同时将上述组件连接到显示控制器1004和显示装置以及输入/输出(I/O)装置1005。输入/输出(I/O)装置1005可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(I/O)装置1005通过输入/输出(I/O)控制器1006与系统相连。
其中,存储器1002可以存储软件组件,例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述电力工单数据的处理方法的步骤。
综上所述,本发明实施例提供了一种基于用户历史工单轨迹的客户用电满意度预测方案,主要是对当前工单在归档时客服人员回访客户之前对客户是否满意的预测,通过采集用户历史工单数据并进行数据预处理形成样本集,挖掘用户历史工单序列,并基于序列进行特征挖掘和其他原始字段的特征挖掘,之后利用SMOTE过采样技术平衡训练集中的类别失衡样本,之后采用集成学习随机森林算法进行建模和预测。本发明实施例能够准确快速的对电力系统的客户满意情况进行预测,进而可以协助电力客服及工作人员在回访过程中未雨绸缪,因人而异的与客户进行回访沟通。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (14)
1.一种电力工单数据的处理方法,其特征在于,所述方法包括:
获取电力工单数据,所述电力工单数据至少包括:工单编号、用户通话信息、问题处理信息;
将所述电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据;
根据所述满意度预测数据生成相应的回访策略。
2.根据权利要求1所述的电力工单数据的处理方法,其特征在于,通过如下方式训练所述预测模型:
获取历史电力工单数据,所述历史电力工单数据至少包括:回访信息;
根据所述回访信息构建训练集和测试集;
根据所述训练集和测试集、基于随机森林算法对所述预测模型进行训练。
3.根据权利要求2所述的电力工单数据的处理方法,其特征在于,所述回访信息包括:用户是否满意信息,根据所述回访信息构建训练集和测试集包括:
根据用户是否满意信息分别构建所述训练集的正负样本数据、以及所述测试集的正负样本数据。
4.根据权利要求3所述的电力工单数据的处理方法,其特征在于,获取历史电力工单数据之后,所述方法还包括:
根据所述历史电力工单数据获取选定用户的多个选定工单数据,所述选定工单数据包括:选定用户通话信息;
根据预定周期内的选定用户通话信息生成各选定工单数据的序列位置信息;
基于所述各选定工单数据的序列位置信息和所述多个选定工单数据分别构建多个类别的特征数据,所述类别包括:序列位置信息、情感信息、通话信息、是否满意信息、问题缓急信息。
5.根据权利要求4所述的电力工单数据的处理方法,其特征在于,所述情感信息包括:问题信息和处理信息,通过如下方式构建所述情感信息的特征数据:
根据所述序列位置信息和问题信息生成问题信息特征数据;
根据所述序列位置信息和处理信息生成处理信息特征数据;
基于预定规则、根据问题信息特征数据和处理信息特征数据生成所述情感信息的特征数据。
6.根据权利要求4所述的电力工单数据的处理方法,其特征在于,构建特征数据之后,所述方法还包括:
使用过采样算法对所述训练集的正负样本数据进行样本失衡的均衡处理。
7.一种电力工单数据的处理装置,其特征在于,所述装置包括:
数据获取单元,用于获取电力工单数据,所述电力工单数据至少包括:工单编号、用户通话信息、问题处理信息;
预测单元,用于将所述电力工单数据输入至预先训练的预测模型,以输出与该电力工单数据对应的满意度预测数据;
策略生成单元,用于根据所述满意度预测数据生成相应的回访策略。
8.根据权利要求7所述的电力工单数据的处理装置,其特征在于,所述装置还包括:模型训练单元,用于训练所述预测模型,
所述模型训练单元包括:
历史数据获取模块,用于获取历史电力工单数据,所述历史电力工单数据至少包括:回访信息;
集合构建模块,用于根据所述回访信息构建训练集和测试集;
训练模块,用于根据所述训练集和测试集、基于随机森林算法对所述预测模型进行训练。
9.根据权利要求8所述的电力工单数据的处理装置,其特征在于,所述回访信息包括:用户是否满意信息,所述集合构建模块具体用于:
根据用户是否满意信息分别构建所述训练集的正负样本数据、以及所述测试集的正负样本数据。
10.根据权利要求9所述的电力工单数据的处理装置,其特征在于,所述装置还包括:
选定工单数据获取单元,用于根据所述历史电力工单数据获取选定用户的多个选定工单数据,所述选定工单数据包括:选定用户通话信息;
序列位置信息生成单元,用于根据预定周期内的选定用户通话信息生成各选定工单数据的序列位置信息;
特征数据建构单元,用于基于所述各选定工单数据的序列位置信息和所述多个选定工单数据分别构建多个类别的特征数据,所述类别包括:序列位置信息、情感信息、通话信息、是否满意信息、问题缓急信息。
11.根据权利要求10所述的电力工单数据的处理装置,其特征在于,所述情感信息包括:问题信息和处理信息,所述特征数据建构单元包括情感信息特征数据构建模块,用于构建所述情感信息的特征数据,
所述情感信息特征数据构建模块包括:
问题信息特征数据生成子模块,用于根据所述序列位置信息和问题信息生成问题信息特征数据;
处理信息特征数据生成子模块,用于根据所述序列位置信息和处理信息生成处理信息特征数据;
情感信息特征数据生成子模块,用于基于预定规则、根据问题信息特征数据和处理信息特征数据生成所述情感信息的特征数据。
12.根据权利要求10所述的电力工单数据的处理装置,其特征在于,所述装置还包括:
样本失衡处理单元,用于使用过采样算法对所述训练集的正负样本数据进行样本失衡的均衡处理。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述电力工单数据的处理方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述电力工单数据的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110783892.7A CN113723663A (zh) | 2021-07-12 | 2021-07-12 | 电力工单数据的处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110783892.7A CN113723663A (zh) | 2021-07-12 | 2021-07-12 | 电力工单数据的处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723663A true CN113723663A (zh) | 2021-11-30 |
Family
ID=78673319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110783892.7A Pending CN113723663A (zh) | 2021-07-12 | 2021-07-12 | 电力工单数据的处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723663A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116307176A (zh) * | 2023-03-17 | 2023-06-23 | 华北电力大学 | 一种客服中心场景下融合情感分析的业务流程预测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105847227A (zh) * | 2016-06-23 | 2016-08-10 | 国家电网公司 | 一种用于移动电力巡检系统的隐私保护方法 |
CN107995370A (zh) * | 2017-12-21 | 2018-05-04 | 广东欧珀移动通信有限公司 | 通话控制方法、装置及存储介质和移动终端 |
CN108108352A (zh) * | 2017-12-18 | 2018-06-01 | 广东广业开元科技有限公司 | 一种基于机器学习文本挖掘技术的企业投诉风险预警方法 |
CN110942326A (zh) * | 2018-09-25 | 2020-03-31 | 北京嘀嘀无限科技发展有限公司 | 一种用户满意度预测方法及装置、服务器 |
US20200302540A1 (en) * | 2019-03-21 | 2020-09-24 | The University Of Chicago | Applying a trained model to predict a future value using contextualized sentiment data |
CN112052966A (zh) * | 2020-09-24 | 2020-12-08 | 佰聆数据股份有限公司 | 基于现场抢修工单的电力客户满意度分析系统和方法 |
CN112053007A (zh) * | 2020-09-18 | 2020-12-08 | 国网浙江兰溪市供电有限公司 | 一种配网故障抢修预测分析系统和方法 |
CN112862172A (zh) * | 2021-01-29 | 2021-05-28 | 国网河南省电力公司漯河供电公司 | 国网95598停电投诉预测方法、装置、计算机设备和存储介质 |
-
2021
- 2021-07-12 CN CN202110783892.7A patent/CN113723663A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105847227A (zh) * | 2016-06-23 | 2016-08-10 | 国家电网公司 | 一种用于移动电力巡检系统的隐私保护方法 |
CN108108352A (zh) * | 2017-12-18 | 2018-06-01 | 广东广业开元科技有限公司 | 一种基于机器学习文本挖掘技术的企业投诉风险预警方法 |
CN107995370A (zh) * | 2017-12-21 | 2018-05-04 | 广东欧珀移动通信有限公司 | 通话控制方法、装置及存储介质和移动终端 |
CN110942326A (zh) * | 2018-09-25 | 2020-03-31 | 北京嘀嘀无限科技发展有限公司 | 一种用户满意度预测方法及装置、服务器 |
US20200302540A1 (en) * | 2019-03-21 | 2020-09-24 | The University Of Chicago | Applying a trained model to predict a future value using contextualized sentiment data |
CN112053007A (zh) * | 2020-09-18 | 2020-12-08 | 国网浙江兰溪市供电有限公司 | 一种配网故障抢修预测分析系统和方法 |
CN112052966A (zh) * | 2020-09-24 | 2020-12-08 | 佰聆数据股份有限公司 | 基于现场抢修工单的电力客户满意度分析系统和方法 |
CN112862172A (zh) * | 2021-01-29 | 2021-05-28 | 国网河南省电力公司漯河供电公司 | 国网95598停电投诉预测方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
朱龙珠,等: ""基于随机森林算法的投诉预警模型优化方法"", 《电力信息与通信技术》, vol. 16, no. 8, 31 December 2018 (2018-12-31), pages 60 - 65 * |
汤宁: ""基于文本挖掘的电力工单分析"", 《计算机工程与应用》, vol. 54, pages 307 - 311 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116307176A (zh) * | 2023-03-17 | 2023-06-23 | 华北电力大学 | 一种客服中心场景下融合情感分析的业务流程预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961248B (zh) | 运单投诉预测方法、装置、设备及其存储介质 | |
CN106875027A (zh) | 资源请求值的预测方法及装置、交易量的预测方法 | |
CN107346502A (zh) | 一种基于大数据的迭代产品销售预测方法 | |
CN110971659A (zh) | 推荐消息的推送方法、装置及存储介质 | |
CN110445939B (zh) | 容量资源的预测方法及装置 | |
CN107423859A (zh) | 一种组合模型建模方法及系统 | |
CN111951050B (zh) | 理财产品推荐方法及装置 | |
CN112925911B (zh) | 基于多模态数据的投诉分类方法及其相关设备 | |
CN111967543A (zh) | 用户资源配额确定方法、装置及电子设备 | |
CN112256550A (zh) | 存储容量预测模型生成方法、存储容量预测方法 | |
CN112862197B (zh) | 网点智能放号方法、装置、设备及存储介质 | |
CN113723663A (zh) | 电力工单数据的处理方法、装置、电子设备及存储介质 | |
CN111325355A (zh) | 企业实际控制人的确定方法、装置、计算机设备及介质 | |
CN117056591B (zh) | 基于动态预测的电力缴费渠道智能推荐方法及系统 | |
WO2019171492A1 (ja) | 予測業務支援装置および予測業務支援方法 | |
CN114722266A (zh) | 问卷推送方法、装置、电子设备及可读存储介质 | |
CN112669073A (zh) | 一种用户留存预测方法、装置、电子设备及存储介质 | |
CN114997879B (zh) | 一种支付路由方法、装置、设备和存储介质 | |
CN111080037A (zh) | 一种基于深度神经网络的短期电力负荷预测方法及装置 | |
CN107203545A (zh) | 一种数据处理方法及装置 | |
CN113283517B (zh) | 一种家政服务匹配方法、系统和计算机设备 | |
CN115330219A (zh) | 一种资源调度的方法及装置 | |
JP7344609B2 (ja) | 確定値及び推定値に基づくデータ定量化方法 | |
CN113890948A (zh) | 基于语音外呼机器人对话数据的资源分配方法及相关设备 | |
CN113159926A (zh) | 贷款业务的还款日期确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |