CN113947247A - 一种低压抢修工单数量预测方法、装置、设备和介质 - Google Patents
一种低压抢修工单数量预测方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN113947247A CN113947247A CN202111228676.2A CN202111228676A CN113947247A CN 113947247 A CN113947247 A CN 113947247A CN 202111228676 A CN202111228676 A CN 202111228676A CN 113947247 A CN113947247 A CN 113947247A
- Authority
- CN
- China
- Prior art keywords
- data
- weather
- repair work
- work order
- emergency repair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008439 repair process Effects 0.000 title claims abstract description 141
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000003066 decision tree Methods 0.000 claims description 65
- 238000012549 training Methods 0.000 claims description 64
- 238000005096 rolling process Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 10
- 230000005611 electricity Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000005612 types of electricity Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108700028516 Lan-7 Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013215 result calculation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种低压抢修工单数量预测方法、装置、设备和介质,通过获取天气预测数据,并对天气预测数据执行数据预处理操作后,实现对天气预测数据的字符型数据转换后,得到天气特征数据,最后将天气特征数据输入至预设的抢修工单数量预测模型,以生成低压抢修工单的数量预测结果,从而解决传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排的技术问题,更为灵活准确地实现对低压抢修工单数量的多天预测,利于对抢修人员的工作安排。
Description
技术领域
本发明涉及工单数量预测技术领域,尤其涉及一种低压抢修工单数量预测方法、装置、设备和介质。
背景技术
随着社会对供电可靠性以及供电服务要求的提高,人们对于日常的停电、低电压等影响日常用电质量的反馈越来越多,如何提高客户满意度,减少投诉,已成为供电企业重要的研究课题之一。为了减少用户的低压抢修工单数量,可以从预测用户投诉行为入手,通过数据挖掘模型实现对低压抢修工单数量趋势进行预测,分析潜在投诉的原因,提前预防。了解未来一段时间低压抢修工单数量的发展趋势,可采取调配抢修施工队伍、客服坐席等有效措施减少投诉风险,避免投诉升级等问题,发现服务过程中的薄弱环节,及时对用电客户的诉求做出应对。
而目前主流的低压抢修工单数量预测技术手段大多基于机器学习算法,例如基于随机森林算法(Random Forest)、支持向量机(Support vector machine,SVM)的决策树、人工神经网络(Artificial Neural Network,ANN)的回归预测模型或时间序列预测模型,当前研究的包含数据预处理、特征变量处理、在用电特征与低压抢修工单数量之间建立机器学习模型等步骤。
当上述方法由于低压抢修工单数量与天气条件、低压跳闸故障、用电负荷趋势等多种因素有着密切的关系,随机性较强,传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排。
发明内容
本发明提供了一种低压抢修工单数量预测方法、装置、设备和介质,解决了传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排的技术问题。
本发明第一方面提供的一种低压抢修工单数量预测方法,包括:
获取天气预测数据;
对所述天气预测数据执行数据预处理操作,得到天气特征数据;
将所述天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果。
可选地,所述方法还包括:
获取历史天气数据;
对所述历史天气数据执行所述数据筛选操作,得到多组历史特征数据并构建初始决策树模型;
采用多组所述历史特征数据对所述初始决策树模型进行训练,得到抢修工单数量预测模型。
可选地,所述对所述天气预测数据执行数据预处理操作,得到天气特征数据的步骤,包括:
按照预设的编码转换规则对所述天气预测数据进行编码转换,生成中间天气数据;
采用预设的延迟时间窗对所述中间天气数据进行数据划分,得到对应的延迟特征;
采用预设的滚动时间窗对所述中间天气数据进行数据划分,得到对应的滚动特征;
按照时间顺序排列所述延迟特征和所述滚动特征,得到天气特征数据。
可选地,所述采用多组所述历史特征数据对所述初始决策树模型进行训练,得到抢修工单数量预测模型的步骤,包括:
按照时间序列滑窗对多组所述历史特征数据进行划分,得到训练数据和测试数据;
采用所述训练数据训练所述初始决策树模型,得到中间决策树模型;
将所述测试数据依次输入至所述中间决策树模型,得到多个预测数量结果;
根据所述预测数量结果与所述实际数量结果,确定所述中间决策树模型的均方根误差;
比较所述均方根误差与预设的误差阈值,根据比较结果确定抢修工单数量预测模型。
可选地,在所述采用所述训练数据训练所述初始决策树模型,得到中间决策树模型的步骤之后,还包括:
解析所述中间决策树模型,确定每个所述训练数据的属性划分次数;
按照所述属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
可选地,所述比较所述均方根误差与预设的误差阈值,根据比较结果确定抢修工单数量预测模型的步骤,包括:
比较所述均方根误差与预设的误差阈值;
若所述均方根误差小于或等于所述误差阈值,将当前时刻的所述中间决策树模型确定为抢修工单数量预测模型;
若所述均方根误差大于所述误差阈值,按照预设的调整梯度调整所述中间决策树模型的模型参数,跳转执行所述将所述测试数据依次输入至所述中间决策树模型,得到多个预测数量结果的步骤。
可选地,所述将所述天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果的步骤,包括:
将所述天气特征数据输入至预设的抢修工单数量预测模型;所述抢修工单数量预测模型包括多个决策层;
依次通过各个所述决策层分别对所述天气特征数据进行属性划分,直至达到最后一层决策层;
将所述最后一层决策层对应的数量预测结果确定为低压抢修工单的数量预测结果。
本发明第二方面提供了一种低压抢修工单数量预测装置,包括:
天气预测数据获取模块,用于获取天气预测数据;
天气特征提取模块,用于对所述天气预测数据执行数据预处理操作,得到天气特征数据;
抢修工单数量预测模块,用于将所述天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果。
本发明第三方面提供了一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如本发明第一方面任一项所述的低压抢修工单数量预测方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如本发明第一方面任一项所述的低压抢修工单数量预测方法。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过获取天气预测数据,并对天气预测数据执行数据预处理操作后,实现对天气预测数据的字符型数据转换后,得到天气特征数据,最后将天气特征数据输入至预设的抢修工单数量预测模型,以生成低压抢修工单的数量预测结果,从而解决传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排的技术问题,更为灵活准确地实现对低压抢修工单数量的多天预测,利于对抢修人员的工作安排。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例一提供的一种低压抢修工单数量预测方法的步骤流程图;
图2为本发明实施例二提供的一种低压抢修工单数量预测方法的步骤流程图;
图3为本发明实施例的一种延迟特征lag和滚动特征rolling计算示意图;
图4为本发明实施例的一种数据限值确定示意图;
图5为本发明实施例中的时间序列滑窗法的示意图;
图6为本发明实施例三提供的一种低压抢修工单数量预测装置的结构框图。
具体实施方式
本发明实施例提供了一种低压抢修工单数量预测方法、装置、设备和介质,用于解决传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例一提供的一种低压抢修工单数量预测方法的步骤流程图。
本发明提供的一种低压抢修工单数量预测方法,包括以下步骤:
步骤101,获取天气预测数据;
天气预测数据指的是通过网络爬虫工具获取到的未来n天内的天气数据,包括但不限于天气类型、日最高温和日最低温等数据,n为正整数。
在本申请实施例中,由于同一地区可能存在多个片区,每个片区所对应的重要性、用电质量和用电负荷可能均存在不同,每个片区所面临的天气状况可能会影响到各种代压设备的使用状态,同时不同的抢修人员所能负责的工单量有限。为实现对低压抢修工单的合理分配,进一步减少抢修人员的工作负担,可以获取天气预测数据作为后续低压抢修工单预测的数据基础。
需要说明的是,低压抢修工单指的是对低压设备例如低压变压器等设备所需要完成的维护、修理和操作工作的工作表单。
步骤102,对天气预测数据执行数据预处理操作,得到天气特征数据;
在获取到天气预测数据后,由于天气预测数据可能包括字符型数据例如天气类型等,此时可以对天气预测数据执行数据预处理操作,以对天气预测数据进行综合考量,并对天气预测数据中的各个字符型数据进行编码转换,将各个天气类型等字符型数据转换为模型可识别数据,得到天气特征数据。
步骤103,将天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果。
在本申请实施例中的抢修工单数量预测模型指的是Leaf-wise生长策略的决策树作为基分类器所构建的决策树模型。
在本申请实施例中,在提取到天气特征数据后,可以将天气特征数据输入至预设的抢修工单数量预测模型,通过其中的各层决策层分别基于天气特征数据进行属性划分,从而确定在当前的天气预测数据下出现的低压抢修工单数量,从而方便运维人员根据该低压抢修工单的数量预测结果,对各组抢修人员进行高效合理地工单分发。
在本申请实施例中,通过获取天气预测数据,并对天气预测数据执行数据预处理操作后,实现对天气预测数据的字符型数据转换后,得到天气特征数据,最后将天气特征数据输入至预设的抢修工单数量预测模型,以生成低压抢修工单的数量预测结果,从而解决传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排的技术问题,更为灵活准确地实现对低压抢修工单数量的多天预测,利于对抢修人员的工作安排。
请参阅图2,图2为本发明实施例二提供的一种低压抢修工单数量预测方法的步骤流程图。
本发明提供的一种低压抢修工单数量预测方法,包括以下步骤:
步骤201,获取天气预测数据;
天气预测数据指的是通过网络爬虫工具获取到的未来n天内的天气数据,包括但不限于天气类型、日最高温和日最低温等数据,n为正整数。
在本申请实施例中,由于同一地区可能存在多个片区,每个片区所对应的重要性、用电质量和用电负荷可能均存在不同,每个片区所面临的天气状况可能会影响到各种代压设备的使用状态,同时不同的抢修人员所能负责的工单量有限。为实现对低压抢修工单的合理分配,进一步减少抢修人员的工作负担,可以获取天气预测数据作为后续低压抢修工单预测的数据基础。
需要说明的是,低压抢修工单指的是对低压设备例如低压变压器等设备所需要完成的维护、修理和操作工作的工作表单。
步骤202,对天气预测数据执行数据预处理操作,得到天气特征数据;
可选地,步骤202可以包括以下子步骤:
按照预设的编码转换规则对天气预测数据进行编码转换,生成中间天气数据;
采用预设的延迟时间窗对中间天气数据进行数据划分,得到对应的延迟特征;
采用预设的滚动时间窗对中间天气数据进行数据划分,得到对应的滚动特征;
按照时间顺序排列延迟特征和滚动特征,得到天气特征数据。
在本申请实施例中,由于数据模型无法识别字符型的数据,此时可以将其中的字符型变量进行编码转换,从而得到中间天气数据。
以天气类型为例,具体编码转换的规则可以参见下表1:
序号 | 天气类型 | 编码 |
1 | 阵雨、雷阵雨 | 0 |
2 | 多云、阴天 | 1 |
3 | 小雨、小到中雨、中雨、中到大雨 | 2 |
4 | 大雨、暴雨 | 3 |
5 | 晴 | 4 |
表1
在本发明实施例中,在获取到中间天气数据后,为提高后续低压抢修工单数量预测的准确度,可以分别采用预设的延迟时间窗和预设的滚动时间窗对多个中间用电数据进行数据划分。具体通过延迟时间窗选取在预测目目标日期之前的多个中间天气数据作为延迟特征;同时通过滚动时间窗计算相邻三个中间天气数据之间的平均值,以此作为滚动特征。
请参阅图3,图3示出了本发明实施例的一种延迟特征lag和滚动特征rolling的计算示意图。
在本发明的一个示例中,以设置7月10日低压抢修工单数量作为预测目标时,选取历史上过去7天的低压抢修工单数量作为输入特征,即选取7月3日至7月9日低压抢修工单数量作为低压抢修工单数量数量,命名为Lag-1至Lag-7输入变量。同时对7月9日、8日、7日的低压抢修工单数量数量进行求平均,得出roll-1变量,以此类推。
在本发明实施例中,在获取到多个延迟特征和多个滚动特征后,可以按照时间顺序从中选取全部或数个特征例如天气类型、日最高温度和日最低温度对应的延迟特征和滚动特征进行排序,得到天气特征数据。
历史特征数据具体可以以下表2的形式表示:
表2
步骤203,将天气特征数据输入至预设的抢修工单数量预测模型;抢修工单数量预测模型包括多个决策层;
在本申请实施例中的抢修工单数量预测模型指的是Leaf-wise生长策略的决策树作为基分类器所构建的决策树模型。
在本申请实施例中,在提取到天气特征数据后,可以将天气特征数据输入至预设的抢修工单数量预测模型,通过其中的各层决策层分别基于天气特征数据进行属性划分,从而确定在当前的天气预测数据下出现的低压抢修工单数量,从而方便运维人员根据该低压抢修工单的数量预测结果,对各组抢修人员进行高效合理地工单分发。
可选地,抢修工单数量预测模型可以通过以下步骤S11-S13生成:
S11、获取历史天气数据;
S12、对历史天气数据执行数据筛选操作,得到多组历史特征数据并构建初始决策树模型;
可选地,历史天气数据包括多种不同类型的待处理用电数据,步骤S12可以包括以下子步骤S21:
S21、遍历各种待处理用电数据,基于各种待处理用电数据分别对应的四分位数,分别确定各种待处理用电数据对应的数据限值;
进一步地,数据限值包括最大上限值和最小下限值,四分位数包括第一四分位数和第二四分位数,步骤S21可以包括以下子步骤:
遍历各种待处理用电数据;
计算各种待处理用电数据分别对应的第一四分位数与第二四分位数之间的间距差值;
计算各个间距差值的绝对值与预设的间距倍数的间距乘值;
计算第一四分位数与间距乘值的和值,采用和值作为最大上限值;
计算第二四分位数与间距乘值的差值,采用差值作为最小下限值。
在本发明实施例中,待处理用电数据可以包括多种,例如天气类型、日最高温、日最低温、每日的低压抢修工单数量、低压故障次数、越限次数等。在获取到不同种类的待处理用电数据后,可以先遍历各种待处理用电数据,计算各种待处理用电数据分别对应的第一四分位数与第二四分位数之间的间距差值;计算各个间距差值的绝对值与预设的间距倍数的间距乘值;计算第一四分位数与间距乘值的和值,采用和值作为最大上限值;计算第二四分位数与间距乘值的差值,采用差值作为最大上限值。
请参阅图4,图4示出了本发明实施例的一种数据限值确定示意图。
在具体实现中,数据限值可以通过箱型图的形式进行表示,待处理用电数据的中位数位于箱形图的中心位置,箱子的长度表示四分位数的间距(IQR),箱两端分别是第一四分位数(Q3)和第二四分位数(Q1),箱两端的须为最大上限值和最小下限值。
需要说明的是,间距倍数可以设置为1.5,此时最大上限值为Q3+1.5IQR,最小下限值为Q1-1.5IQR,也就是异常值为大于Q3+1.5IQR和小于Q1-1.5IQR。
S13、采用多组历史特征数据对初始决策树模型进行训练,得到抢修工单数量预测模型。
进一步地,步骤S13可以包括以下子步骤S131-S135:
S131、按照时间序列滑窗对多组历史特征数据进行划分,得到训练数据和测试数据;
请参阅图5,图5示出了本发明实施例中的时间序列滑窗法的示意图。
在本发明实施例中,为了增强模型的泛化能力,避免数据信息泄露,可以通过时间序列滑窗对多组历史特征数据进行划分,通过划分数据集进行交叉验证,进一步避免模型出现过拟合的问题,从而得到训练数据和测试数据。
如图5所示,其中包括多组历史特征数据Dataset1、Dataset2和Dataset3,按照不同的时间t1、t2和t3分别划分各组历史特征数据,以得到训练数据和测试数据。其中,t1<t2<t3。
在本申请的另一个示例中,在步骤S132之前,为进一步筛选训练数据,减少模型训练时间,可以通过以下步骤实现对训练数据的更新:
解析中间决策树模型,确定每个训练数据的属性划分次数;
按照属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
在本发明实施例中,可以对中间决策树模型进行解析,以确定每组训练数据的属性划分次数,再根据属性划分次数从低至高删除预设数量的训练数据,将剩余的训练数据确定为新的训练数据,从而达到精简特征的目的,进一步提升运行速度。
可选地,还可以通过计算各组训练数据在初始决策树模型中的划分增益,基于各个划分增益对各组训练数据进行筛选,从而筛选得到特征重要性高的训练数据。
S132、采用训练数据训练初始决策树模型,得到中间决策树模型;
在本申请实施例中,为提高本模型的鲁棒性和精确度,可以采用递归多步预测策略,把上一步的预测值当特征,本质还是单步预测,不过预测多少步,均只需要1个模型。该策略有误差叠加风险,适用短步长,如下式1和2所示:
prediction(t+1)=model1(x(t),x(t-1),...,x(t-n)) (1)
prediction(t+2)=model1(prediction(t+1),x(t),...,x(t-n+1)) (2)
直接+递归的混合多步预测策略的稳定性最好,并且相比递归多步预测策略的误差叠加风险更低,相比直接法预测的精确度更高,鲁棒性最好。因此本发明采用直接+递归的多步预测策略。
在本发明实施例中,训练过程可以通过选取LightGBM模型算法进行训练。LightGBM是微软近年提出的一种基于GBDT(Gradient Boosting Decision Tree)模型算法,主要用于解决GDBT在海量数据中遇到的问题,以便其可以更好更快地用于工业实践中,目前在工业界得到广泛应用。该算法采用Leaf-wise生长策略的决策树作为基分类器构建高效的集成学习框架,引入直方图算法对原始数据进行离散化以增强对噪声的鲁棒性。
在本发明实施例中,每次通过迭代获得一个弱学习器h(x),使得迭代的损失函数L(y,Ft(x))最小。
L(y,Ft(x))=L(y,Ft-1(x)+ht(x))
式中,x为训练样本,y为训练样本对应的预测目标实际数值,Ft-1(x)和L(y,Ft(x))分别为上一次迭代获得的强学习器和损失函数。
以第i个样本为例,利用下式的负梯度拟合本次迭代残差值rti。
式中,xi为第i个训练样本,yi为第i训练样本对应的预测目标实际数值,Ft-1(x)为上一次迭代获得的强学习器。
使用平方差近似拟合弱学习器ht(x),使得损失函数极小化:
ht(x)=argmin∑(rti-h(x))2
更新本次迭代获得的强学习器Ft(x)如式
Ft(x)=ht(x)+Ft-1(x)
上述式式子中,LightGBM的提升树模型在每次加入新的弱学习器后,保证损失函数不断朝着下降的方向进行优化,即L(y,Ft(x))<L(y,Ft-1(x))。L(y,Ft(x))、L(y,Ft-1(x))分别为第t次和第t-1次迭代的损失函数值。Ft(x)和Ft-1(x)为第t次和第t-1次样本对应的预测值,y为样本对应的实际数值。
S133、将测试数据依次输入至中间决策树模型,得到多个预测数量结果;
在本发明实施例中,将测试数据依次输入至各个中间决策树模型,得到多个预测数量结果,以得到验证各个中间决策树模型的模型性能的数据基础。
S134、根据预测数量结果与实际数量结果,确定中间决策树模型的均方根误差;
在本发明实施例中,得到预测数量结果和各个测试数据对应的实际数量结果后,采用上述结果结合测试数据的数量确定各个中间决策树模型对应的均方根误差。
在具体实现中,均方根误差(Root-Mean-Square Error,RMSE)可以通过以下公式进行计算:
S135、比较均方根误差与预设的误差阈值,根据比较结果确定抢修工单数量预测模型。
进一步地,步骤S135可以包括以下子步骤:
比较均方根误差与预设的误差阈值;
若均方根误差小于或等于误差阈值,将当前时刻的中间决策树模型确定为抢修工单数量预测模型;
若均方根误差大于误差阈值,按照预设的调整梯度调整中间决策树模型的模型参数,跳转执行将测试数据依次输入至中间决策树模型,得到多个预测数量结果的步骤。
在本发明实施例中,在获取到各个中间决策树模型对应的均方根误差后,可以通过比较均方根误差和预设的误差阈值,若是若均方根误差小于或等于误差阈值,将当前时刻的中间决策树模型确定为抢修工单数量预测模型;若均方根误差大于误差阈值,按照预设的调整梯度调整中间决策树模型的模型参数,跳转执行步骤S133,再次采用训练数据进行模型训练。
其中,模型参数选取可以如表3所示:
表3
步骤204,依次通过各个决策层分别对天气特征数据进行属性划分,直至达到最后一层决策层;
步骤205,将最后一层决策层对应的数量预测结果确定为低压抢修工单的数量预测结果。
在本申请实施例中,当抢修工单数量预测模型训练完成后,可以为得知各个用电区域在未来n天内的低压抢修工单数量,可以将预测天气特征数据输入至抢修工单数量预测模型,而抢修工单数量预测模型按照决策树的方式构建,其中包括多层决策层,在最后一层决策层设有对应的低压抢修工单数量。
通过抢修工单数量预测模型中的多层决策层按顺序对预测天气特征数据内的各个特征进行属性划分,按决策树的方式不断延伸直至达到最后一层决策层,按照最后一层决策层所对应的低压抢修工单数量,确定各个用电区域所对应的低压抢修工单数量。
在本申请实施例中,通过获取天气预测数据,并对天气预测数据执行数据预处理操作后,实现对天气预测数据的字符型数据转换后,得到天气特征数据,最后将天气特征数据输入至预设的抢修工单数量预测模型,以生成低压抢修工单的数量预测结果,从而解决传统的预测方法受限于特征变量的选取,主要是集中在短期的低压抢修工单数量确定分析,难以灵活准确地实现对低压抢修工单数量的多天预测,不利于对抢修人员的工作安排的技术问题,更为灵活准确地实现对低压抢修工单数量的多天预测,利于对抢修人员的工作安排。
请参阅图6,图6为本发明实施例三提供的一种低压抢修工单数量预测装置的结构框图。
本发明实施例提供了一种低压抢修工单数量预测装置,包括:
天气预测数据获取模块601,用于获取天气预测数据;
天气特征提取模块602,用于对天气预测数据执行数据预处理操作,得到天气特征数据;
抢修工单数量预测模块603,用于将天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果。
可选地,装置还包括:
历史天气数据获取模块,用于获取历史天气数据;
决策树构建模块,用于对历史天气数据执行数据筛选操作,得到多组历史特征数据并构建初始决策树模型;
模型训练模块,用于采用多组历史特征数据对初始决策树模型进行训练,得到抢修工单数量预测模型。
可选地,天气特征提取模块602,包括:
数据编码转换子模块,用于按照预设的编码转换规则对天气预测数据进行编码转换,生成中间天气数据;
延迟特征生成子模块,用于采用预设的延迟时间窗对中间天气数据进行数据划分,得到对应的延迟特征;
滚动特征生成子模块,用于采用预设的滚动时间窗对中间天气数据进行数据划分,得到对应的滚动特征;
特征排序子模块,用于按照时间顺序排列延迟特征和滚动特征,得到天气特征数据。
可选地,模型训练模块包括:
数据划分子模块,用于按照时间序列滑窗对多组历史特征数据进行划分,得到训练数据和测试数据;
初始决策树训练子模块,用于采用训练数据训练初始决策树模型,得到中间决策树模型;
预测数量结果计算子模块,用于将测试数据依次输入至中间决策树模型,得到多个预测数量结果;
均方根误差计算子模块,用于根据预测数量结果与实际数量结果,确定中间决策树模型的均方根误差;
误差比较子模块,用于比较均方根误差与预设的误差阈值,根据比较结果确定抢修工单数量预测模型。
可选地,模型训练模块还包括:
属性划分次数确定子模块,用于解析中间决策树模型,确定每个训练数据的属性划分次数;
训练数据删减子模块,用于按照属性划分次数从低至高删除预设数量的训练数据;
训练数据更新子模块,用于将剩余的训练数据确定为新的训练数据。
可选地,误差比较子模块具体用于:
比较均方根误差与预设的误差阈值;
若均方根误差小于或等于误差阈值,将当前时刻的中间决策树模型确定为抢修工单数量预测模型;
若均方根误差大于误差阈值,按照预设的调整梯度调整中间决策树模型的模型参数,跳转执行将测试数据依次输入至中间决策树模型,得到多个预测数量结果的步骤。
可选地,抢修工单数量预测模块603包括:
数据输入子模块,用于将天气特征数据输入至预设的抢修工单数量预测模型;抢修工单数量预测模型包括多个决策层;
模型决策子模块,用于依次通过各个决策层分别对天气特征数据进行属性划分,直至达到最后一层决策层;
数据预测结果生成子模块,用于将最后一层决策层对应的数量预测结果确定为低压抢修工单的数量预测结果。
本发明实施例提供了一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如本发明任一实施例所述的低压抢修工单数量预测方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如本发明任一实施例所述的低压抢修工单数量预测方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、模块和子模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种低压抢修工单数量预测方法,其特征在于,包括:
获取天气预测数据;
对所述天气预测数据执行数据预处理操作,得到天气特征数据;
将所述天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取历史天气数据;
对所述历史天气数据执行所述数据筛选操作,得到多组历史特征数据并构建初始决策树模型;
采用多组所述历史特征数据对所述初始决策树模型进行训练,得到抢修工单数量预测模型。
3.根据权利要求1所述的方法,其特征在于,所述对所述天气预测数据执行数据预处理操作,得到天气特征数据的步骤,包括:
按照预设的编码转换规则对所述天气预测数据进行编码转换,生成中间天气数据;
采用预设的延迟时间窗对所述中间天气数据进行数据划分,得到对应的延迟特征;
采用预设的滚动时间窗对所述中间天气数据进行数据划分,得到对应的滚动特征;
按照时间顺序排列所述延迟特征和所述滚动特征,得到天气特征数据。
4.根据权利要求2所述的方法,其特征在于,所述采用多组所述历史特征数据对所述初始决策树模型进行训练,得到抢修工单数量预测模型的步骤,包括:
按照时间序列滑窗对多组所述历史特征数据进行划分,得到训练数据和测试数据;
采用所述训练数据训练所述初始决策树模型,得到中间决策树模型;
将所述测试数据依次输入至所述中间决策树模型,得到多个预测数量结果;
根据所述预测数量结果与所述实际数量结果,确定所述中间决策树模型的均方根误差;
比较所述均方根误差与预设的误差阈值,根据比较结果确定抢修工单数量预测模型。
5.根据权利要求4所述的方法,其特征在于,在所述采用所述训练数据训练所述初始决策树模型,得到中间决策树模型的步骤之后,还包括:
解析所述中间决策树模型,确定每个所述训练数据的属性划分次数;
按照所述属性划分次数从低至高删除预设数量的训练数据;
将剩余的训练数据确定为新的训练数据。
6.根据权利要求4所述的方法,其特征在于,所述比较所述均方根误差与预设的误差阈值,根据比较结果确定抢修工单数量预测模型的步骤,包括:
比较所述均方根误差与预设的误差阈值;
若所述均方根误差小于或等于所述误差阈值,将当前时刻的所述中间决策树模型确定为抢修工单数量预测模型;
若所述均方根误差大于所述误差阈值,按照预设的调整梯度调整所述中间决策树模型的模型参数,跳转执行所述将所述测试数据依次输入至所述中间决策树模型,得到多个预测数量结果的步骤。
7.根据权利要求1所述的方法,其特征在于,所述将所述天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果的步骤,包括:
将所述天气特征数据输入至预设的抢修工单数量预测模型;所述抢修工单数量预测模型包括多个决策层;
依次通过各个所述决策层分别对所述天气特征数据进行属性划分,直至达到最后一层决策层;
将所述最后一层决策层对应的数量预测结果确定为低压抢修工单的数量预测结果。
8.一种低压抢修工单数量预测装置,其特征在于,包括:
天气预测数据获取模块,用于获取天气预测数据;
天气特征提取模块,用于对所述天气预测数据执行数据预处理操作,得到天气特征数据;
抢修工单数量预测模块,用于将所述天气特征数据输入至预设的抢修工单数量预测模型,生成低压抢修工单的数量预测结果。
9.一种电子设备,其特征在于,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-7任一项所述的低压抢修工单数量预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1-7任一项所述的低压抢修工单数量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228676.2A CN113947247A (zh) | 2021-10-21 | 2021-10-21 | 一种低压抢修工单数量预测方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111228676.2A CN113947247A (zh) | 2021-10-21 | 2021-10-21 | 一种低压抢修工单数量预测方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113947247A true CN113947247A (zh) | 2022-01-18 |
Family
ID=79331897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111228676.2A Pending CN113947247A (zh) | 2021-10-21 | 2021-10-21 | 一种低压抢修工单数量预测方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947247A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
CN109063924A (zh) * | 2018-08-22 | 2018-12-21 | 国网湖南省电力有限公司 | 基于气象数据的配电网抢修工单数量预测方法 |
CN110738349A (zh) * | 2019-09-05 | 2020-01-31 | 国网浙江省电力有限公司杭州供电公司 | 基于多模型融合的电网故障抢修时长预测方法 |
CN111178382A (zh) * | 2019-11-26 | 2020-05-19 | 国网浙江省电力有限公司湖州供电公司 | 一种基于工单数据挖掘的抢修服务预测分析方法 |
CN111523560A (zh) * | 2020-03-18 | 2020-08-11 | 第四范式(北京)技术有限公司 | 到港货车数量预测模型训练方法、预测方法、装置及系统 |
-
2021
- 2021-10-21 CN CN202111228676.2A patent/CN113947247A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
CN109063924A (zh) * | 2018-08-22 | 2018-12-21 | 国网湖南省电力有限公司 | 基于气象数据的配电网抢修工单数量预测方法 |
CN110738349A (zh) * | 2019-09-05 | 2020-01-31 | 国网浙江省电力有限公司杭州供电公司 | 基于多模型融合的电网故障抢修时长预测方法 |
CN111178382A (zh) * | 2019-11-26 | 2020-05-19 | 国网浙江省电力有限公司湖州供电公司 | 一种基于工单数据挖掘的抢修服务预测分析方法 |
CN111523560A (zh) * | 2020-03-18 | 2020-08-11 | 第四范式(北京)技术有限公司 | 到港货车数量预测模型训练方法、预测方法、装置及系统 |
Non-Patent Citations (1)
Title |
---|
向昌盛等: "混沌时间序列预测模型参数的联合优化", 《信息与控制》, vol. 40, no. 5, 15 October 2011 (2011-10-15), pages 673 - 679 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106909933B (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
CN108876054B (zh) | 基于改进遗传算法优化极限学习机的短期电力负荷预测方法 | |
CN110232203B (zh) | 知识蒸馏优化rnn短期停电预测方法、存储介质及设备 | |
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN108022014B (zh) | 一种电力系统负荷预测方法及系统 | |
JP6645043B2 (ja) | 誤差幅推定装置、誤差幅推定システム、誤差幅推定方法及びプログラム | |
CN110610121B (zh) | 基于曲线聚类的小时级源荷功率异常数据辨识与修复方法 | |
CN108364187A (zh) | 一种基于停电敏感特性的停电敏感用户确定方法和系统 | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN110717610A (zh) | 一种基于数据挖掘的风电功率预测方法 | |
Kaboli et al. | An expression-driven approach for long-term electric power consumption forecasting | |
El Maghraoui et al. | Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building | |
CN111178690A (zh) | 基于风控评分卡模型的用电客户窃电风险评估方法 | |
CN112508254A (zh) | 变电站工程项目投资预测数据的确定方法 | |
CN117150409A (zh) | 一种用电异常检测方法 | |
CN109635008B (zh) | 一种基于机器学习的设备故障检测方法 | |
CN113947247A (zh) | 一种低压抢修工单数量预测方法、装置、设备和介质 | |
CN113837486B (zh) | 一种基于rnn-rbm的配网馈线长期负荷预测方法 | |
Pham et al. | Predictive analysis of the supply chain management using machine learning approaches: Review and taxonomy | |
CN115526393A (zh) | 一种基于变电工程关键影响因素筛选的造价预测方法 | |
CN110955811B (zh) | 基于朴素贝叶斯算法的电力数据分类方法及系统 | |
CN113935536A (zh) | 一种用电区域抢修规划方法、装置、设备和介质 | |
CN113947023A (zh) | 一种重过载台区数量确定方法、装置、设备和介质 | |
Drechny | The method of consumers identification based on compressed power load profiles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |