CN113935536A - 一种用电区域抢修规划方法、装置、设备和介质 - Google Patents
一种用电区域抢修规划方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN113935536A CN113935536A CN202111228680.9A CN202111228680A CN113935536A CN 113935536 A CN113935536 A CN 113935536A CN 202111228680 A CN202111228680 A CN 202111228680A CN 113935536 A CN113935536 A CN 113935536A
- Authority
- CN
- China
- Prior art keywords
- data
- complaint
- predicted
- prediction model
- weather
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013439 planning Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000008439 repair process Effects 0.000 title claims description 69
- 230000005611 electricity Effects 0.000 claims abstract description 86
- 238000012549 training Methods 0.000 claims description 58
- 238000005096 rolling process Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000005612 types of electricity Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100074187 Caenorhabditis elegans lag-1 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用电区域抢修规划方法、装置、设备和介质,方法包括通过获取多个用电区别分别对应的天气预测数据,再分别对所获取到天气预测数据进行数据预处理,以得到各个天气预测数据分别对应的预测天气特征数据,将其输入至预设的目标投诉预测模型,从而确定各个用电区域在不同的天气预测数据下的预测投诉数量,最后按照预测投诉数量对各个用电区域进行抢修优先级排序,得到抢修规划结果。从而解决灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划的技术问题,基于天气预测数据对用电投诉工单的数量进行预测,以快速准确地确定各个用电区域的抢修顺序。
Description
技术领域
本发明涉及抢修规划技术领域,尤其涉及一种用电区域抢修规划方法、装置、设备和介质。
背景技术
随着社会对供电可靠性以及供电服务要求的提高,人们对于日常的停电、低电压等影响日常用电质量的反馈越来越多,如何提高客户满意度,减少投诉,已成为供电企业重要的研究课题之一。为了减少用户的用电投诉工单数量,可以从预测用户投诉行为入手,通过数据挖掘模型实现对用电投诉工单数量趋势进行预测,分析潜在投诉的原因,以便于对各个用电区域的抢修进行高效规划,及时对用电客户的诉求做出应对。
而目前主流的用电投诉工单数量预测技术手段大多基于机器学习算法,例如基于随机森林算法(Random Forest)、支持向量机(Support vector machine,SVM)的投诉预测、人工神经网络(Artificial Neural Network,ANN)的回归预测模型或时间序列预测模型,当前研究的包含数据预处理、特征变量处理、在用电特征与用电投诉工单数量之间建立机器学习模型等步骤。
当上述方法由于用电投诉工单数量与天气条件、低压跳闸故障、用电负荷趋势等多种因素有着密切的关系,随机性较强,传统的预测方法受限于特征变量的选取,主要是集中在短期的用电投诉工单数量确定分析,难以灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划。
发明内容
本发明提供了一种用电区域抢修规划方法、装置、设备和介质,解决了传统的预测方法受限于特征变量的选取,主要是集中在短期的用电投诉工单数量确定分析,难以灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划。
本发明第一方面提供的一种用电区域抢修规划方法,包括:
获取多个预设的用电区域分别对应的天气预测数据;
对所述天气预测数据进行数据预处理,得到预测天气特征数据;
将所述预测天气特征数据输入至预设的目标投诉预测模型,得到各个所述用电区域分别对应的预测投诉数量;
按照所述预测投诉数量对各所述用电区域进行抢修优先级排序,生成抢修规划结果。
可选地,所述方法还包括:
从多个所述用电区域分别获取历史用电数据;
对各个所述历史用电数据分别进行数据筛选,得到多组历史特征数据;
采用多组所述历史特征数据对预设的初始投诉预测模型进行训练,得到目标投诉预测模型。
可选地,所述对所述天气预测数据进行数据预处理,得到预测天气特征数据的步骤,包括:
按照预设的编码转换规则对所述天气预测数据进行编码转换,生成中间天气数据;
采用预设的延迟时间窗对所述中间天气数据进行数据划分,得到对应的延迟特征;
采用预设的滚动时间窗对所述中间天气数据进行数据划分,得到对应的滚动特征;
按时间顺序排列所述延迟特征和所述滚动特征,得到预测天气特征数据。
可选地,所述采用多组所述历史特征数据对预设的初始投诉预测模型进行训练,得到目标投诉预测模型的步骤,包括:
按照时间序列滑窗对多组所述历史特征数据进行划分,得到训练数据和测试数据;
采用所述训练数据训练所述初始投诉预测模型,得到中间投诉预测模型;
将所述测试数据依次输入至所述中间投诉预测模型,得到多个预测数量结果;
根据所述预测数量结果与所述实际数量结果,确定所述中间投诉预测模型的均方根误差;
若所述均方根误差小于或等于预设的误差阈值,将当前时刻的所述中间投诉预测模型确定为目标投诉预测模型;
若所述均方根误差大于所述误差阈值,按照预设的调整梯度调整所述中间投诉预测模型的模型参数,跳转执行所述将所述测试数据依次输入至所述中间投诉预测模型,得到多个预测数量结果的步骤。
可选地,在所述采用所述训练数据训练所述初始投诉预测模型,得到中间投诉预测模型的步骤之后,还包括:
解析所述中间投诉预测模型,确定每个所述训练数据的属性划分次数;
按照所述属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
可选地,所述将所述预测天气特征数据输入至预设的目标投诉预测模型,得到各个所述用电区域分别对应的预测投诉数量的步骤,包括:
将所述预测天气特征数据输入至预设的目标投诉预测模型;所述目标投诉预测模型包括顺序排列的多层决策层;
依次通过各层所述决策层分别对所述预测天气特征数据进行属性划分,直至达到最后一层决策层;
将所述最后一层决策层对应的预测投诉数量确定所述预测天气特征数据对应用电区域的预测投诉数量。
可选地,所述按照所述预测投诉数量对各所述用电区域进行抢修优先级排序,生成抢修规划结果的步骤,包括:
按照所述预测投诉数量分别设置各个所述用电区域对应的抢修优先级;
按照所述抢修优先级从高至低对各个所述用电区域进行排序,得到抢修规划结果。
本发明第二方面提供了一种用电区域抢修规划装置,包括:
数据获取模块,用于获取多个预设的用电区域分别对应的天气预测数据;
数据预处理模块,用于对所述天气预测数据进行数据预处理,得到预测天气特征数据;
投诉数量预测模块,用于将所述预测天气特征数据输入至预设的目标投诉预测模型,得到各个所述用电区域分别对应的预测投诉数量;
抢修优先级排序模块,用于按照所述预测投诉数量对各所述用电区域进行抢修优先级排序,生成抢修规划结果。
本发明第三方面提供了一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如本发明第一方面任一项所述的用电区域抢修规划方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如本发明第一方面任一项所述的用电区域抢修规划方法。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过获取多个用电区别分别对应的天气预测数据,再分别对所获取到天气预测数据进行数据预处理,以得到各个天气预测数据分别对应的预测天气特征数据,将其输入至预设的目标投诉预测模型,从而确定各个用电区域在不同的天气预测数据下的预测投诉数量,最后按照预测投诉数量对各个用电区域进行抢修优先级排序,得到抢修规划结果。从而解决灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划的技术问题,基于天气预测数据对用电投诉工单的数量进行预测,以快速准确地确定各个用电区域的抢修顺序。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例一提供的一种用电区域抢修规划方法的步骤流程图;
图2为本发明实施例二提供的一种用电区域抢修规划方法的步骤流程图;
图3为本发明实施例的一种延迟特征lag和滚动特征rolling计算示意图;
图4为本发明实施例的一种数据限值确定示意图;
图5为本发明实施例中的时间序列滑窗法的示意图;
图6为本发明实施例三提供的一种用电区域抢修规划装置的结构框图。
具体实施方式
本发明实施例提供了一种用电区域抢修规划方法、装置、设备和介质,用于解决传统的预测方法受限于特征变量的选取,主要是集中在短期的用电投诉工单数量确定分析,难以灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例提供的一种用电区域抢修规划方法的步骤流程图。
本发明提供的一种用电区域抢修规划方法,包括以下步骤:
步骤101,获取多个预设的用电区域分别对应的天气预测数据;
天气预测数据指的是通过网络爬虫工具获取到的未来n天内的天气数据,包括但不限于天气类型、日最高温和日最低温等数据,n为正整数。
在本申请实施例中,由于同一城市对各个区域的城市规划、用电线路规划的不同,各个用电区域可能存在不同的用电情况,而为合理对各个用电区域分配应急抢修人员,可以从多个预设的用电区域分别获取到各个区域对应的天气预测数据,以提供后续用电投诉工单的预测数据基础。
步骤102,对天气预测数据进行数据预处理,得到预测天气特征数据;
在获取到天气预测数据后,由于天气预测数据可能包括字符型数据例如天气类型等,此时可以对天气预测数据执行数据预处理操作,以剔除天气预测数据中的各种异常值,保留代表性的数据样本,将各个天气类型等字符型数据转换为模型可识别数据,得到预测天气特征数据。
步骤103,将预测天气特征数据输入至预设的目标投诉预测模型,得到各个用电区域分别对应的预测投诉数量;
在本申请实施例中的目标投诉预测模型指的是Leaf-wise生长策略的决策树作为基分类器所构建的决策树模型。
在本申请实施例中,在提取到预测天气特征数据后,可以将预测天气特征数据输入至预设的目标投诉预测模型,通过其中的各层决策层分别基于预测天气特征数据进行属性划分,从而确定在各个用电区域的天气预测数据下分别对应的预测投诉数量
步骤104,按照预测投诉数量对各用电区域进行抢修优先级排序,生成抢修规划结果。
在具体实现中,在获取到各个用电区域对应的预测投诉数量后,可以按照预测投诉数量进一步确定各个用电区域对应的抢修优先级,并按照抢修优先级对各个用电区域的抢修计划进行排序,从而生成抢修规划结果。
在本申请实施例中,通过获取多个用电区别分别对应的天气预测数据,再分别对所获取到天气预测数据进行数据预处理,以得到各个天气预测数据分别对应的预测天气特征数据,将其输入至预设的目标投诉预测模型,从而确定各个用电区域在不同的天气预测数据下的预测投诉数量,最后按照预测投诉数量对各个用电区域进行抢修优先级排序,得到抢修规划结果。从而解决灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划的技术问题,基于天气预测数据对用电投诉工单的数量进行预测,以快速准确地确定各个用电区域的抢修顺序。
请参阅图2,图2为本发明实施例二提供的一种用电区域抢修规划方法的步骤流程图。
本发明提供的一种用电区域抢修规划方法,包括以下步骤:
步骤201,获取多个预设的用电区域分别对应的天气预测数据;
天气预测数据指的是通过网络爬虫工具获取到的未来n天内的天气数据,包括但不限于天气类型、日最高温和日最低温等数据,n为正整数。
在本申请实施例中,由于同一城市对各个区域的城市规划、用电线路规划的不同,各个用电区域可能存在不同的用电情况,而为合理对各个用电区域分配应急抢修人员,可以从多个预设的用电区域分别获取到各个区域对应的天气预测数据,以提供后续用电投诉工单的预测数据基础。
步骤202,按照预设的编码转换规则对天气预测数据进行编码转换,生成中间天气数据;
在本发明实施例中,在获取到各个正常限值后,也就是最大上限值和最小下限值后,可以采用正常限值对各种待处理用电数据进行筛选,以得到正常的用电数据。但由于数据模型无法识别字符型的数据,此时可以将其中的字符型变量进行编码转换,从而得到多个中间天气数据。
以天气类型为例,具体编码转换的规则可以参见下表1:
序号 | 天气类型 | 编码 |
1 | 阵雨、雷阵雨 | 0 |
2 | 多云、阴天 | 1 |
3 | 小雨、小到中雨、中雨、中到大雨 | 2 |
4 | 大雨、暴雨 | 3 |
5 | 晴 | 4 |
表1
步骤203,采用预设的延迟时间窗对中间天气数据进行数据划分,得到对应的延迟特征;
步骤204,采用预设的滚动时间窗对中间天气数据进行数据划分,得到对应的滚动特征;
在本发明实施例中,可以分别采用预设的延迟时间窗和预设的滚动时间窗对多个中间天气数据进行数据划分,具体地通过延迟时间窗选取在预测目目标日期之前的多个中间天气数据作为延迟特征;同时通过滚动时间窗计算相邻三个中间天气数据之间的平均值,以此作为滚动特征。
请参阅图3,图3示出了本发明实施例的一种延迟特征lag和滚动特征rolling的计算示意图。
在本发明的一个示例中,以设置7月10日用电投诉工单量作为预测目标时,选取历史上过去7天的用电投诉工单数量作为输入特征,即选取7月3日至7月9日用电投诉工单数量作为用电投诉工单数量,命名为Lag-1至Lag-7输入变量。同时对7月9日、8日、7日的用电投诉工单数量进行求平均,得出roll-1变量,以此类推。
步骤205,按时间顺序排列延迟特征和滚动特征,得到预测天气特征数据;
在本发明实施例中,在获取到多个延迟特征和多个滚动特征后,可以从中选取全部或数个例如天气类型、日最高温度和日最低温度,按照时间顺序排列对应的延迟特征和滚动特征,得到预测天气特征数据。
历史特征数据具体可以以下表2的形式表示:
序号 | 变量名称 | 特征描述 |
1 | Weather | 天气类型 |
2 | Temp_max | 日最高温度 |
3 | Temp_min | 日最低温度 |
4 | Complaint_lag_1 | 1天前的用电投诉供电数量 |
5 | Complaint_lag_2 | 2天前的用电投诉供电数量 |
... | ... | ... |
10 | Complaint_lag_7 | 7天前的用电投诉供电数量 |
11 | Complaint_roll_1 | 近3天的投诉平均值 |
... | ... | ... |
16 | Complaint_roll_6 | 6天前的近3天的投诉平均值 |
17 | Trip_lag_1 | 1天前的低压故障次数 |
... | ... | ... |
23 | Trip_lag_7 | 7天前的低压故障次数 |
24 | Trip_roll_1 | 近3天的低压故障平均值 |
... | ... | ... |
39 | Trip_roll_6 | 6天前的近3天的低压故障平均值 |
40 | Overload_lag_1 | 1天前的越限次数 |
... | ... | ... |
46 | Overload_lag_7 | 7天前的越限次数 |
47 | Overload_roll_1 | 近3天的越限次数平均值 |
... | ... | ... |
52 | Overload_roll_6 | 6天前的近3天的越限次数平均值 |
表2
可选地,目标投诉预测模型可以通过以下步骤S11-S13进行训练得到:
S11、从多个用电区域分别获取历史用电数据;
S12、对各个历史用电数据分别进行数据筛选,得到多组历史特征数据;
可选地,历史用电数据包括多种不同类型的待处理用电数据,步骤S12可以包括以下子步骤S21:
S21、遍历各种待处理用电数据,基于各种待处理用电数据分别对应的四分位数,分别确定各种待处理用电数据对应的数据限值;
进一步地,数据限值包括最大上限值和最小下限值,四分位数包括第一四分位数和第二四分位数,步骤S21可以包括以下子步骤:
遍历各种待处理用电数据;
计算各种待处理用电数据分别对应的第一四分位数与第二四分位数之间的间距差值;
计算各个间距差值的绝对值与预设的间距倍数的间距乘值;
计算第一四分位数与间距乘值的和值,采用和值作为最大上限值;
计算第二四分位数与间距乘值的差值,采用差值作为最小下限值。
在本发明实施例中,待处理用电数据可以包括多种,例如天气类型、日最高温、日最低温、每日的用电投诉工单数量、低压故障次数、越限次数等。在获取到不同种类的待处理用电数据后,可以先遍历各种待处理用电数据,计算各种待处理用电数据分别对应的第一四分位数与第二四分位数之间的间距差值;计算各个间距差值的绝对值与预设的间距倍数的间距乘值;计算第一四分位数与间距乘值的和值,采用和值作为最大上限值;计算第二四分位数与间距乘值的差值,采用差值作为最大上限值。
请参阅图4,图4示出了本发明实施例的一种数据限值确定示意图。
在具体实现中,数据限值可以通过箱型图的形式进行表示,待处理用电数据的中位数位于箱形图的中心位置,箱子的长度表示四分位数的间距(IQR),箱两端分别是第一四分位数(Q3)和第二四分位数(Q1),箱两端的须为最大上限值和最小下限值。
需要说明的是,间距倍数可以设置为1.5,此时最大上限值为Q3+1.5IQR,最小下限值为Q1-1.5IQR,也就是异常值为大于Q3+1.5IQR和小于Q1-1.5IQR。
S13、采用多组历史特征数据对预设的初始投诉预测模型进行训练,得到目标投诉预测模型。
进一步地,步骤S13可以包括以下子步骤S131-S136:
S131、按照时间序列滑窗对多组历史特征数据进行划分,得到训练数据和测试数据;
请参阅图5,图5示出了本发明实施例中的时间序列滑窗法的示意图。
在本发明实施例中,为了增强模型的泛化能力,避免数据信息泄露,可以通过时间序列滑窗对多组历史特征数据进行划分,通过划分数据集进行交叉验证,进一步避免模型出现过拟合的问题,从而得到训练数据和测试数据。
如图5所示,其中包括多组历史特征数据Dataset1、Dataset2和Dataset3,按照不同的时间t1、t2和t3分别划分各组历史特征数据,以得到训练数据和测试数据。其中,t1<t2<t3。
S132、采用训练数据训练初始投诉预测模型,得到中间投诉预测模型;
在本申请实施例中,初始投诉预测模型可以为决策树模型。为提高本模型的鲁棒性和精确度,可以采用直接+递归的混合预测策略进行模型创建该策略基本思想是每步预测的模型都学习上一步模型输出的预测结果,再进一步实现下一步长的预测。例如预测目标步长为2时,该策略需要2个模型,如下式1和2所示:
prediction(t+1)=model1(x(t),x(t-1),...,x(t-n)) (1)
prediction(t+2)=model2(prediction(t+1),x(t),...,x(t-n+1)) (2)
直接+递归的混合多步预测策略的稳定性最好,并且相比递归多步预测策略的误差叠加风险更低,相比直接法预测的精确度更高,鲁棒性最好。因此本发明采用直接+递归的多步预测策略。
在本发明实施例中,训练过程可以通过选取LightGBM模型算法进行训练。LightGBM是微软近年提出的一种基于GBDT(Gradient Boosting Decision Tree)模型算法,主要用于解决GDBT在海量数据中遇到的问题,以便其可以更好更快地用于工业实践中,目前在工业界得到广泛应用。该算法采用Leaf-wise生长策略的投诉预测作为基分类器构建高效的集成学习框架,引入直方图算法对原始数据进行离散化以增强对噪声的鲁棒性。
在本发明实施例中,每次通过迭代获得一个弱学习器h(x),使得迭代的损失函数L(y,Ft(x))最小。
L(y,Ft(x))=L(y,Ft-1(x)+ht(x))
式中,x为训练样本,y为训练样本对应的预测目标实际数值,Ft-1(x)和L(y,Ft(x))分别为上一次迭代获得的强学习器和损失函数。
以第i个样本为例,利用下式的负梯度拟合本次迭代残差值rti。
式中,xi为第i个训练样本,yi为第i训练样本对应的预测目标实际数值,Ft-1(x)为上一次迭代获得的强学习器。
使用平方差近似拟合弱学习器ht(x),使得损失函数极小化:
ht(x)=argmin∑(rti-h(x))2
更新本次迭代获得的强学习器Ft(x)如式
Ft(x)=ht(x)+Ft-1(x)
上述式式子中,LightGBM的提升树模型在每次加入新的弱学习器后,保证损失函数不断朝着下降的方向进行优化,即L(y,Ft(x))<L(y,Ft-1(x))。L(y,Ft(x))、L(y,Ft-1(x))分别为第t次和第t-1次迭代的损失函数值。Ft(x)和Ft-1(x)为第t次和第t-1次样本对应的预测值,y为样本对应的实际数值。
S133、将测试数据依次输入至中间投诉预测模型,得到多个预测数量结果;
在本发明实施例中,将测试数据依次输入至各个中间投诉预测模型,得到多个预测数量结果,以得到验证各个中间投诉预测模型的模型性能的数据基础。
在本发明的另一个示例中,在执行步骤S133后,本方法还可以包括以下子步骤:
解析中间投诉预测模型,确定每个训练数据的属性划分次数;
按照属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
在本发明实施例中,在创建初始投诉预测模型后,可以对初始投诉预测模型进行解析,以确定每组训练数据的属性划分次数,再根据属性划分次数从低至高删除预设数量的训练数据,将剩余的训练数据确定为新的训练数据,从而达到精简特征的目的,进一步提升运行速度。
可选地,还可以通过计算各组训练数据在初始投诉预测模型中的划分增益,基于各个划分增益对各组训练数据进行筛选,从而筛选得到特征重要性高的训练数据。
S134、根据预测数量结果与实际数量结果,确定中间投诉预测模型的均方根误差;
S135、若均方根误差小于或等于预设的误差阈值,将当前时刻的中间投诉预测模型确定为目标投诉预测模型;
S136、若均方根误差大于误差阈值,按照预设的调整梯度调整中间投诉预测模型的模型参数,跳转执行将测试数据依次输入至中间投诉预测模型,得到多个预测数量结果的步骤。
在本发明实施例中,得到预测数量结果和各个测试数据对应的实际数量结果后,采用上述结果结合测试数据的数量确定各个中间投诉预测模型对应的均方根误差。
在具体实现中,均方根误差(Root-Mean-Square Error,RMSE)可以通过以下公式进行计算:
在本发明实施例中,在获取到各个中间投诉预测模型对应的均方根误差后,可以通过比较均方根误差和预设的误差阈值,若是若均方根误差小于或等于误差阈值,将当前时刻的中间投诉预测模型确定为目标投诉预测模型;若均方根误差大于误差阈值,按照预设的调整梯度调整中间投诉预测模型的模型参数,跳转执行步骤S133,再次采用训练数据进行模型训练。
其中,模型参数选取可以如表3所示:
表3
步骤206,将预测天气特征数据输入至预设的目标投诉预测模型,得到各个用电区域分别对应的预测投诉数量;
可选地,步骤206可以包括以下子步骤:
将预测天气特征数据输入至预设的目标投诉预测模型;目标投诉预测模型包括顺序排列的多层决策层;
依次通过各层决策层分别对预测天气特征数据进行属性划分,直至达到最后一层决策层;
将最后一层决策层对应的预测投诉数量确定预测天气特征数据对应用电区域的预测投诉数量。
在本申请实施例中,当目标投诉预测模型训练完成后,可以为得知各个用电区域在未来n天内的预测投诉数量,可以将预测天气特征数据输入至目标投诉预测模型,而目标投诉预测模型按照决策树的方式构建,其中包括多层决策层,在最后一层决策层设有对应的预测投诉数量。
通过目标投诉预测模型中的多层决策层按顺序对预测天气特征数据内的各个特征进行属性划分,按决策树的方式不断延伸直至达到最后一层决策层,按照最后一层决策层所对应的预测投诉数量,确定各个用电区域所对应的预测投诉数量。
步骤207,按照预测投诉数量对各用电区域进行抢修优先级排序,生成抢修规划结果。
可选地,步骤207可以包括以下子步骤:
按照预测投诉数量分别设置各个用电区域对应的抢修优先级;
按照抢修优先级从高至低对各个用电区域进行排序,得到抢修规划结果。
在具体实现中,在获取到各个用电区域分别对应的预测投诉数量后,由于不同用电区域还对应存在不同的区域重要性,例如政府机关区域、工厂区域、居民生活区域或医院区域等,可以预先为各个用电区域分别设置不同的权值,再按照预测投诉数量分别与其权值进行相乘,以得到各个用电区域对应的抢修优先级。最后按照抢修优先级从高至低对各个用电区域进行排序,生成抢修规划结果,使得用电抢修人员可以按照上述抢修规划结果进行不同用电区域的抢修,提高抢修效率。
在本申请实施例中,通过获取多个用电区别分别对应的天气预测数据,再分别对所获取到天气预测数据进行数据预处理,以得到各个天气预测数据分别对应的预测天气特征数据,将其输入至预设的目标投诉预测模型,从而确定各个用电区域在不同的天气预测数据下的预测投诉数量,最后按照预测投诉数量对各个用电区域进行抢修优先级排序,得到抢修规划结果。从而解决灵活准确地实现对用电投诉工单数量的多天预测,不便于对各个用电区域的抢修规划的技术问题,基于天气预测数据对用电投诉工单的数量进行预测,以快速准确地确定各个用电区域的抢修顺序。
请参阅图6,图6为本发明实施例三提供的一种用电区域抢修规划装置的结构框图。
本发明实施例提供了一种用电区域抢修规划装置,包括:
数据获取模块601,用于获取多个预设的用电区域分别对应的天气预测数据;
数据预处理模块602,用于对天气预测数据进行数据预处理,得到预测天气特征数据;
投诉数量预测模块603,用于将预测天气特征数据输入至预设的目标投诉预测模型,得到各个用电区域分别对应的预测投诉数量;
抢修优先级排序模块604,用于按照预测投诉数量对各用电区域进行抢修优先级排序,生成抢修规划结果。
可选地,装置还包括:
历史用电数据获取模块,用于从多个用电区域分别获取历史用电数据;
数据筛选模块,用于对各个历史用电数据分别进行数据筛选,得到多组历史特征数据;
模型训练模块,用于采用多组历史特征数据对预设的初始投诉预测模型进行训练,得到目标投诉预测模型。
可选地,数据预处理模块602具体用于:
按照预设的编码转换规则对天气预测数据进行编码转换,生成中间天气数据;
采用预设的延迟时间窗对中间天气数据进行数据划分,得到对应的延迟特征;
采用预设的滚动时间窗对中间天气数据进行数据划分,得到对应的滚动特征;
按时间顺序排列延迟特征和滚动特征,得到预测天气特征数据。
可选地,模型训练模块包括:
按照时间序列滑窗对多组历史特征数据进行划分,得到训练数据和测试数据;
采用训练数据训练初始投诉预测模型,得到中间投诉预测模型;
将测试数据依次输入至中间投诉预测模型,得到多个预测数量结果;
根据预测数量结果与实际数量结果,确定中间投诉预测模型的均方根误差;
若均方根误差小于或等于预设的误差阈值,将当前时刻的中间投诉预测模型确定为目标投诉预测模型;
若均方根误差大于误差阈值,按照预设的调整梯度调整中间投诉预测模型的模型参数,跳转执行将测试数据依次输入至中间投诉预测模型,得到多个预测数量结果的步骤。
可选地,模型训练模块还用于:
解析中间投诉预测模型,确定每个训练数据的属性划分次数;
按照属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
可选地,投诉数量预测模块603具体用于:
将预测天气特征数据输入至预设的目标投诉预测模型;目标投诉预测模型包括顺序排列的多层决策层;
依次通过各层决策层分别对预测天气特征数据进行属性划分,直至达到最后一层决策层;
将最后一层决策层对应的预测投诉数量确定预测天气特征数据对应用电区域的预测投诉数量。
可选地,抢修优先级排序模块604具体用于:
按照预测投诉数量分别设置各个用电区域对应的抢修优先级;
按照抢修优先级从高至低对各个用电区域进行排序,得到抢修规划结果。
本发明实施例提供了一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如本发明任一实施例所述的用电区域抢修规划方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如本发明任一实施例所述的用电区域抢修规划方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、模块和子模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种用电区域抢修规划方法,其特征在于,包括:
获取多个预设的用电区域分别对应的天气预测数据;
对所述天气预测数据进行数据预处理,得到预测天气特征数据;
将所述预测天气特征数据输入至预设的目标投诉预测模型,得到各个所述用电区域分别对应的预测投诉数量;
按照所述预测投诉数量对各所述用电区域进行抢修优先级排序,生成抢修规划结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从多个所述用电区域分别获取历史用电数据;
对各个所述历史用电数据分别进行数据筛选,得到多组历史特征数据;
采用多组所述历史特征数据对预设的初始投诉预测模型进行训练,得到目标投诉预测模型。
3.根据权利要求1所述的方法,其特征在于,所述对所述天气预测数据进行数据预处理,得到预测天气特征数据的步骤,包括:
按照预设的编码转换规则对所述天气预测数据进行编码转换,生成中间天气数据;
采用预设的延迟时间窗对所述中间天气数据进行数据划分,得到对应的延迟特征;
采用预设的滚动时间窗对所述中间天气数据进行数据划分,得到对应的滚动特征;
按时间顺序排列所述延迟特征和所述滚动特征,得到预测天气特征数据。
4.根据权利要求2所述的方法,其特征在于,所述采用多组所述历史特征数据对预设的初始投诉预测模型进行训练,得到目标投诉预测模型的步骤,包括:
按照时间序列滑窗对多组所述历史特征数据进行划分,得到训练数据和测试数据;
采用所述训练数据训练所述初始投诉预测模型,得到中间投诉预测模型;
将所述测试数据依次输入至所述中间投诉预测模型,得到多个预测数量结果;
根据所述预测数量结果与所述实际数量结果,确定所述中间投诉预测模型的均方根误差;
若所述均方根误差小于或等于预设的误差阈值,将当前时刻的所述中间投诉预测模型确定为目标投诉预测模型;
若所述均方根误差大于所述误差阈值,按照预设的调整梯度调整所述中间投诉预测模型的模型参数,跳转执行所述将所述测试数据依次输入至所述中间投诉预测模型,得到多个预测数量结果的步骤。
5.根据权利要求4所述的方法,其特征在于,在所述采用所述训练数据训练所述初始投诉预测模型,得到中间投诉预测模型的步骤之后,还包括:
解析所述中间投诉预测模型,确定每个所述训练数据的属性划分次数;
按照所述属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
6.根据权利要求1所述的方法,其特征在于,所述将所述预测天气特征数据输入至预设的目标投诉预测模型,得到各个所述用电区域分别对应的预测投诉数量的步骤,包括:
将所述预测天气特征数据输入至预设的目标投诉预测模型;所述目标投诉预测模型包括顺序排列的多层决策层;
依次通过各层所述决策层分别对所述预测天气特征数据进行属性划分,直至达到最后一层决策层;
将所述最后一层决策层对应的预测投诉数量确定所述预测天气特征数据对应用电区域的预测投诉数量。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述按照所述预测投诉数量对各所述用电区域进行抢修优先级排序,生成抢修规划结果的步骤,包括:
按照所述预测投诉数量分别设置各个所述用电区域对应的抢修优先级;
按照所述抢修优先级从高至低对各个所述用电区域进行排序,得到抢修规划结果。
8.一种用电区域抢修规划装置,其特征在于,包括:
数据获取模块,用于获取多个预设的用电区域分别对应的天气预测数据;
数据预处理模块,用于对所述天气预测数据进行数据预处理,得到预测天气特征数据;
投诉数量预测模块,用于将所述预测天气特征数据输入至预设的目标投诉预测模型,得到各个所述用电区域分别对应的预测投诉数量;
抢修优先级排序模块,用于按照所述预测投诉数量对各所述用电区域进行抢修优先级排序,生成抢修规划结果。
9.一种电子设备,其特征在于,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-7任一项所述的用电区域抢修规划方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1-7任一项所述的用电区域抢修规划方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228680.9A CN113935536A (zh) | 2021-10-21 | 2021-10-21 | 一种用电区域抢修规划方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228680.9A CN113935536A (zh) | 2021-10-21 | 2021-10-21 | 一种用电区域抢修规划方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113935536A true CN113935536A (zh) | 2022-01-14 |
Family
ID=79281017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111228680.9A Pending CN113935536A (zh) | 2021-10-21 | 2021-10-21 | 一种用电区域抢修规划方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113935536A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876019A (zh) * | 2018-05-31 | 2018-11-23 | 中国电力科学研究院有限公司 | 一种基于大数据的用电负荷预测方法及系统 |
CN109002924A (zh) * | 2018-07-23 | 2018-12-14 | 山东鲁能软件技术有限公司 | 一种配网故障抢修预测分析系统及方法 |
CN111178382A (zh) * | 2019-11-26 | 2020-05-19 | 国网浙江省电力有限公司湖州供电公司 | 一种基于工单数据挖掘的抢修服务预测分析方法 |
-
2021
- 2021-10-21 CN CN202111228680.9A patent/CN113935536A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876019A (zh) * | 2018-05-31 | 2018-11-23 | 中国电力科学研究院有限公司 | 一种基于大数据的用电负荷预测方法及系统 |
CN109002924A (zh) * | 2018-07-23 | 2018-12-14 | 山东鲁能软件技术有限公司 | 一种配网故障抢修预测分析系统及方法 |
CN111178382A (zh) * | 2019-11-26 | 2020-05-19 | 国网浙江省电力有限公司湖州供电公司 | 一种基于工单数据挖掘的抢修服务预测分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106909933B (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
CN110232203B (zh) | 知识蒸馏优化rnn短期停电预测方法、存储介质及设备 | |
Serrano-Guerrero et al. | Statistical methodology to assess changes in the electrical consumption profile of buildings | |
CN110610121B (zh) | 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法 | |
CN111160626B (zh) | 一种基于分解融合的电力负荷时间序列控制方法 | |
CN107506868A (zh) | 一种短时电力负荷预测的方法及装置 | |
CN112381673B (zh) | 一种基于数字孪生的园区用电信息分析方法及装置 | |
Li et al. | A meta-learning based distribution system load forecasting model selection framework | |
CN111815060A (zh) | 一种用电地区短期负荷预测方法及装置 | |
CN115456306A (zh) | 一种母线负荷预测方法、系统、设备及存储介质 | |
CN112035552B (zh) | 一种基于关联规则的电压暂降严重程度预测方法及装置 | |
El Maghraoui et al. | Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building | |
Porteiro et al. | Short term load forecasting of industrial electricity using machine learning | |
CN114037138A (zh) | 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法 | |
CN117150409A (zh) | 一种用电异常检测方法 | |
CN116628534A (zh) | 基于电力大数据的园区用能动态画像划分方法 | |
CN112508254B (zh) | 变电站工程项目投资预测数据的确定方法 | |
Taieb et al. | Probabilistic time series forecasting with boosted additive models: an application to smart meter data | |
CN110740063B (zh) | 基于信号分解和周期特性的网络流量特征指标预测方法 | |
CN113935536A (zh) | 一种用电区域抢修规划方法、装置、设备和介质 | |
Yang et al. | A comparative climate-resilient energy design: Wildfire Resilient Load Forecasting Model using multi-factor deep learning methods | |
CN113837486B (zh) | 一种基于rnn-rbm的配网馈线长期负荷预测方法 | |
CN115964943A (zh) | 离线设备剩余寿命预测方法、装置和计算机设备 | |
CN113487080B (zh) | 一种基于风速分类的风速动态场景生成方法、系统及终端 | |
Daraghmi et al. | Accurate and time‐efficient negative binomial linear model for electric load forecasting in IoE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |