CN112329971A - 一种输变电工程投资决策模型的建模方法 - Google Patents
一种输变电工程投资决策模型的建模方法 Download PDFInfo
- Publication number
- CN112329971A CN112329971A CN202010549122.1A CN202010549122A CN112329971A CN 112329971 A CN112329971 A CN 112329971A CN 202010549122 A CN202010549122 A CN 202010549122A CN 112329971 A CN112329971 A CN 112329971A
- Authority
- CN
- China
- Prior art keywords
- power transmission
- transformation project
- investment decision
- investment
- decision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 85
- 230000009466 transformation Effects 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000007637 random forest analysis Methods 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000010276 construction Methods 0.000 claims abstract description 12
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000000926 separation method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000011161 development Methods 0.000 abstract description 3
- 238000007726 management method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005094 fruit set Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及一种输变电工程投资决策模型的建模方法,包括如下步骤:步骤1)建立输变电工程数据库并划分项目类型;步骤2)建立输变电工程建设决策判别的指标体系;步骤3)采集并处理输变电工程建设决策判别指标数据;步骤4)构建基于随机森林算法的输变电工程建设决策判别模型。有益效果:针对提升输变电工程投资效益的目标,设计了输变电工程投资决策的关键指标体系及内容,基于随机森林技术构建投资决策模型,有助于提升输变电工程投资精准度,支撑电网高质量发展。
Description
技术领域
本发明涉及输变电工程投资决策领域,尤其涉及一种基于随机森林算法的输变电工程投资决策模型的建模方法。
背景技术
投资决策是复杂的系统工程,受到宏观政策、产业结构、能源消费结构等多维度影响,若忽视体制改革、行业监管等外部宏观经济与政策变动对电网投资的影响,投资决策的准确性将不能满足精准投资的要求。因此,需要建立全过程全要素的投资决策模型,快速捕捉投资决策关键信息,有效支撑公司投资决策,提升电网投资的精准管控能力。
本发明针对提升输变电工程投资效益的目标,从投资全过程的角度出发,设计了输变电工程投资决策的关键指标体系及内容,基于随机森林技术构建投资决策模型,研究投资决策的优化技术,解决输变电工程投资决策在多层次、多维度上的整合问题,有助于提升输变电工程投资精准度,支撑电网高质量发展。
发明内容
本发明目的在于克服上述现有问题的不足,提供一种输变电工程投资决策模型的建模方法,其首先根据各地市电力基建数据源建立输变电项目储备库并划分项目类型,接着建立输变电项目的投资决策评价指标体系,随后采集并处理输变电工程投资决策指标的相关数据,最后基于随机森林算法,构建输变电工程投资决策模型,并对模型的准确性进行了评估。
具体由以下技术方案实现:
所述输变电工程投资决策模型的建模方法,包括如下步骤:
步骤1)建立输变电工程数据库并划分项目类型;
步骤2)建立输变电工程建设决策判别的指标体系;
步骤3)采集并处理输变电工程建设决策判别指标数据;
步骤4)构建基于随机森林算法的输变电工程建设决策判别模型。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤1) 包括建立输变电工程数据库并划分数据类型具体包括:梳理所有的电力基建项目数据,建立针对输变电项目的储备库,将储备库中的项目划分为重点项目和常规项目。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤2) 包括如下步骤:
步骤2-1)基于全寿命周期视角构建输变电项目投资决策关键指标清单;
步骤2-2)将关键投资决策指标分层,建立决策模块,分析各模块包含的具体内容;
步骤2-3)根据已建立的决策指标体系模块及包含的内容,确定投资决策模块间的相互关系,对已有输变电工程的投资决策流程进行优化改进。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤3) 包括如下步骤:
步骤3-1)特征名处理,将投资决策指标的中文名处理为英文字母的形式,以方便计算机的处理;
步骤3-2)填补空白值,利用均值插补的方法对原始数据进行必要的数据清洗,
步骤3-3)识别与去除异常值,所述异常值为:由于录入错误引起的不合常理的值,
步骤3-4)特征编码,将离散特征变换为数值类型,便于计算机进行运算;
步骤3-5)数据标准化,将样本的属性缩放到某个指定的范围;
步骤3-6)特征选择,从给定的特征集合中选择出相关特征子集。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤3-2) 中数据清洗的具体方法是:如果样本属性的距离是可度量的,则使用该属性有效值的平均值来插补缺失的值;如果的距离是不可度量的,则使用该属性有效值的众数来插补缺失的值。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤3-3) 中异常值的识别方法是:对于连续值,视距所有数据的均值2个标准差之外的数据为异常值;对于离散值,对数据进行聚类,不落在类里面的数据视为异常值。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤3-4) 采用特征二元化的方法:将数值型的属性转换为布尔值的属性,设定一个阈值作为划分属性值为0和1的分隔点。
所述输变电工程投资决策模型的建模方法的进一步设计在于,所述步骤D) 包括如下步骤:
步骤4-1)借助Python中sklearn包对步骤3)得到的数据库进行划分,划分成训练集和测试集,并将两集合的比例设置为7:3;
步骤4-2)基于bagging和随机子空间方法构建随机森林模型;
步骤4-3)设置随机森林模型参数;
步骤4-4)进行随机森林模型评估,评估指标主要是准确性、灵敏度、特异性、反向特异性以及F1。
本发明的优点如下:
传统的投资决策多局限于项目运行效果与简单的财务指标评价。现阶段对于电网企业投资决策过程的分析也多聚焦于企业内部财务状况、运营绩效等视角。作为重要的基础设施,输变电工程投资决策是复杂的系统工程,受到多维度影响,投资决策的准确性与可适用性是实践层面的一大挑战。
本发明针对全过程全要素的输变电工程投资决策管理工作,从环境、技术等多个维度,深度挖掘影响输变电工程精准投资管控的关键要素,基于随机森林算法构建了输变电工程投资决策模型,设计了输变电工程投资多维度、全过程投资评价指标体系及投资管理技术,有助于提升输变电工程投资精准度,支撑电网高质量发展。
附图说明
图1是输变电项目类型划分的示意图。
图2是输变电工程投资决策指标体系建立的流程图。
图3是投资决策指标体系详细结构的示意图。
图4是输变电工程投资决策指标数据处理的流程图。
图5是基于随机森林算法的输变电工程投资决策模型的示意图。
图6是随机森林决策过程的可视化图。
图7是基于随机森林算法的输变电工程投资决策模型的决策过程示意图。
具体实施方式
下面结合附图1-6对本技术方案进行进一步说明。
本实施例的输变电工程投资决策模型的建模方法,要包括以下步骤:
步骤1)建立输变电工程数据库并划分项目类型;
步骤2)建立输变电工程投资决策指标体系。
步骤3)采集并处理输变电工程投资决策指标数据;
步骤4)构建基于随机森林算法的输变电工程投资决策模型。
步骤1)建立输变电工程数据库并划分数据类型。梳理全省各地市的电力基建项目数据,建立针对本发明的输变电项目储备库。在此基础上,根据输变电项目的重要程度,将储备库中的项目划分为重点项目和常规项目。重点项目主要包括:迎峰度夏项目、常规电源及工程新能源项目、安全条例项目、电铁供电项目、农林场圃供电项目、500kV送出项目及其他迫切项目等。常规项目根据电压等级主要分为以下三类:220kV主网项目、110kV及35kV高压配网项目和10kV及以下中低压配网项目。重点项目具有绝对优先权,不参与投资决策;对于常规项目则需要根据本发明进一步进行投资决策,数据类型划分如图1所示。
步骤2)建立输变电工程投资决策指标体系,具体流程如图2所示。具体地,步骤B的实现包括以下步骤:
步骤2-1)结合国家电网公司对输变电项目的投资管理要求,基于全寿命周期视角和精细化投资理论构建输变电项目投资决策关键指标清单;
步骤2-2)结合我省输变电项目投资决策实际情况,将关键投资决策指标分层,建立决策模块,分析各模块包含的具体内容;
精细化投资决策强调树立精益思想和治理理念,运用信息化、专业化和系统化管理技术,明确投资决策所需考虑的全部要素,按照精确、细致、深入的要求实施项目评估,避免大而化之粗放式的投资决策,抓住影响投资决策的重要因素,有针对性地进行改进,不断提高投资决策结论的科学性。输变电工程投资决策是复杂的系统工程,受到宏观政策、产业结构、能源消费结构等多维度影响,若忽视体制改革、行业监管等外部宏观经济与政策变动的影响,投资决策的准确性将不能满足精准投资的要求。据此,本发明从宏观、中观、微观三个层面入手,对影响投资决策的因素进行更全面刻画,投资决策指标体系详细结构如附图3所示。
步骤2-3)根据已建立的决策指标体系模块及包含的内容,确定投资决策模块间的相互关系,对已有输变电工程的投资决策流程进行优化改进。
步骤3)采集并处理输变电工程投资决策指标数据,得出适合进行建模的数据结构,如图4所示。具体地,步骤C的实现包括以下步骤:
步骤3-1)特征名处理。将投资决策指标的中文名处理为英文字母的形式,以方便计算机的处理。
步骤3-2)填补空白值。直接采集到的数据具有不完整、有噪音以及不一致等问题。因此,本步骤利用均值插补的方法对原始数据进行必要的数据清洗,从而有效利用这些数据。具体方法是:如果样本属性的距离是可度量的,则使用该属性有效值的平均值来插补缺失的值;如果的距离是不可度量的,则使用该属性有效值的众数来插补缺失的值。
步骤3-3)识别与去除异常值。异常值指的是一些由于录入错误等原因引起的不合常理的值,异常值的识别方法是:对于连续值,视距均值2个标准差之外的数据为异常值;对于离散值,对数据进行聚类,不落在类里面的数据视为异常值。
步骤3-4)特征编码。特征编码即将离散特征变换为数值类型,便于计算机进行运算。本发明采用特征二元化的方法:将数值型的属性转换为布尔值的属性,设定一个阈值作为划分属性值为0和1的分隔点。
步骤3-5)数据标准化。数据标准化是将样本的属性缩放到某个指定的范围。本发明利用的标准化方法是z-score标准化:基于原始数据的均值(mean)和标准差(standarddeviation)进行数据的标准化。将A的原始值x使用z-score标准化到x',公式如下:
步骤3-6)特征选择。特征选择是从给定的特征集合中选择出相关特征子集的过程。进行特征选择有两个主要的原因:一是特征选择的过程会从大量的特征中选择出最重要的特征进行后续的模型构建,有效降低特征数量,解决现实中维数灾难的问题;二是去除不相关的特,降低模型构建的难度。进行特征选择必须确保不丢失重要特征。本发明采用包裹式选择方法:直接把最终将要使用的投资决策模型的性能要求作为特征子集的评价原则。
步骤4构建基于随机森林算法的输变电工程投资决策模型,如图5所示。具体地,步骤D的实现包括以下步骤:
步骤4-1:划分训练集和测试集。在构建基于随机森林算法的输变电工程投资决策模型前,需要将数据集划分训练集和测试集,并设置比例为7:3,如表2 所示。借助Python中sklearn包对步骤C得到的数据库进行划分。
表2数据集划分
测试集 | 训练集 | 合计 | |
数量 | 195 | 83 | 278 |
比例 | 70% | 30% | 100% |
步骤4-2:随机森林模型构建。随机森林模型主要基于bagging和随机子空间方法构建。本发明利用在Python编程软件,构建基于随机森林算法的输变电工程投资决策模型,下表3给出了Python软件的代码。基于随机森林算法的输变电工程投资决策模型的构建包括四个步骤,如图6所示。
①使用bootstrap方法随机重采样得到与训练数据集大小相同的n个样本;
③基于ID3算法并使用bootstrap样本以及从步骤①和②中选择的属性来构建决策树;
④重复步骤①至③构建k个决策树,并基于投票的方式对决策结果进行划分,最终得到所需的随机森林。
表3基于随机森林算法的输变电工程投资决策模型的Python代码
步骤D-3:随机森林模型参数设置。本步骤设置了基于随机森林算法的输变电项目投资决策模型的参数,参数设置表如表4所示,具体的内容如下:
n_estimators是随机森林中树的个数,数量越多模型性能越好,但当数量到一定程度,模型性能提升有限,反而会拖累算法的速度,因此一般设置为100 个比较合适。
max_features表示单个决策树使用的最大特征数,max_features越大,越能够提高模型的性能,随之也会牺牲算法的速度,本发明设置为auto,让模型选择所有的特征。
max_depth为树的最深深度,设置成none,这样模型会在节点拟合到0的时候停止,此时为了防止过拟合,需要将min_samples_split设成2。
Criterion是每个节点树拆分质量的评价标准。建立随机森林分类模型时,基尼指数“Gini”是分割数据的最好方法。
max_leaf_nodes是最大叶子节点数。通过限制最大叶子节点数,可以防止过拟合。由于本模型中特征数量不是很多,因此将其设置为None,表示不限制最大的叶子节点数。
n_estimators是随机森林中的重要参数,当n_estimators在80到120之间时,max_features取“none”时,OOB得分低于取“log2”,这说明n_estimators的合理区间在80和120之间,于是本发明取100。
通过参数设置,进而构建出的基于随机森林算法的输变电工程投资决策模型的决策过程如图7所示。
表4基于随机森林的输变电工程投资决策模型参数设置
步骤4-4:随机森林模型评估。本模型的第一个评估标准是预测的准确性,其公式如下:
灵敏度描述了当实际结果为正时本发明的模型对正分类指标的预测准确程度,但是灵敏度忽略了对于负分类指标的预测。下面的公式描述了特异性指标 (TPR),该公式是指负分类指标被正确预测的比例。反向特异性(FPR)可以理解为在所有负类中被预测成正类的比例。
表5基于随机森林的输变电工程投资决策模型评估指标
模型评估指标 | 训练集结果 | 测试集结果 |
Accuracy | 80.80% | 75.00% |
Precision | 83.93% | 78.95% |
Sensitivity | 87.04% | 83.33% |
F1 | 85.45% | 81.08% |
Specificity | 69.32% | 60.00% |
FPR | 30.68% | 40.00% |
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下还可以作出若干改进,这些改进也应视为本发明的保护范围。
Claims (8)
1.一种输变电工程投资决策模型的建模方法,其特征在于包括如下步骤:
步骤1)建立输变电工程数据库并划分项目类型;
步骤2)建立输变电工程建设决策判别的指标体系;
步骤3)采集并处理输变电工程建设决策判别指标数据;
步骤4)构建基于随机森林算法的输变电工程建设决策判别模型。
2.根据权利要求1所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤1)包括建立输变电工程数据库并划分数据类型具体包括:梳理所有的电力基建项目数据,建立针对输变电项目的储备库,将储备库中的项目划分为重点项目和常规项目。
3.根据权利要求1所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤2)包括如下步骤:
步骤2-1)基于全寿命周期视角构建输变电项目投资决策关键指标清单;
步骤2-2)将关键投资决策指标分层,建立决策模块,分析各模块包含的具体内容;
步骤2-3)根据已建立的决策指标体系模块及包含的内容,确定投资决策模块间的相互关系,对已有输变电工程的投资决策流程进行优化改进。
4.根据权利要求1所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤3)包括如下步骤:
步骤3-1)特征名处理,将投资决策指标的中文名处理为英文字母的形式,以方便计算机的处理;
步骤3-2)填补空白值,利用均值插补的方法对原始数据进行必要的数据清洗,
步骤3-3)识别与去除异常值,所述异常值为:由于录入错误引起的不合常理的值,
步骤3-4)特征编码,将离散特征变换为数值类型,便于计算机进行运算;
步骤3-5)数据标准化,将样本的属性缩放到某个指定的范围;
步骤3-6)特征选择,从给定的特征集合中选择出相关特征子集。
5.根据权利要求4所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤3-2)中数据清洗的具体方法是:如果样本属性的距离是可度量的,则使用该属性有效值的平均值来插补缺失的值;如果的距离是不可度量的,则使用该属性有效值的众数来插补缺失的值。
6.根据权利要求4所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤3-3)中异常值的识别方法是:对于连续值,视距所有数据的均值2个标准差之外的数据为异常值;对于离散值,对数据进行聚类,不落在类里面的数据视为异常值。
7.根据权利要求1所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤3-4)采用特征二元化的方法:将数值型的属性转换为布尔值的属性,设定一个阈值作为划分属性值为0和1的分隔点。
8.根据权利要求1所述的输变电工程投资决策模型的建模方法,其特征在于所述步骤D)包括如下步骤:
步骤4-1)借助Python中sklearn包对步骤3)得到的数据库进行划分,划分成训练集和测试集,并将两集合的比例设置为7:3;
步骤4-2)基于bagging和随机子空间方法构建随机森林模型;
步骤4-3)设置随机森林模型参数;
步骤4-4)进行随机森林模型评估,评估指标主要是准确性、灵敏度、特异性、反向特异性以及F1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010549122.1A CN112329971A (zh) | 2020-06-16 | 2020-06-16 | 一种输变电工程投资决策模型的建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010549122.1A CN112329971A (zh) | 2020-06-16 | 2020-06-16 | 一种输变电工程投资决策模型的建模方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112329971A true CN112329971A (zh) | 2021-02-05 |
Family
ID=74303522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010549122.1A Withdrawn CN112329971A (zh) | 2020-06-16 | 2020-06-16 | 一种输变电工程投资决策模型的建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112329971A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444381A (zh) * | 2021-12-30 | 2022-05-06 | 南京诺源医疗器械有限公司 | 一种适用于光源的控制方法及系统 |
CN115526393A (zh) * | 2022-09-23 | 2022-12-27 | 国网冀北电力有限公司经济技术研究院 | 一种基于变电工程关键影响因素筛选的造价预测方法 |
-
2020
- 2020-06-16 CN CN202010549122.1A patent/CN112329971A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444381A (zh) * | 2021-12-30 | 2022-05-06 | 南京诺源医疗器械有限公司 | 一种适用于光源的控制方法及系统 |
CN115526393A (zh) * | 2022-09-23 | 2022-12-27 | 国网冀北电力有限公司经济技术研究院 | 一种基于变电工程关键影响因素筛选的造价预测方法 |
CN115526393B (zh) * | 2022-09-23 | 2023-09-29 | 国网冀北电力有限公司经济技术研究院 | 一种基于变电工程关键影响因素筛选的造价预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639237B (zh) | 一种基于聚类和关联规则挖掘的电力通信网风险评估系统 | |
CN106095639A (zh) | 一种集群亚健康预警方法及系统 | |
CN111027615B (zh) | 基于机器学习的中间件故障预警方法和系统 | |
CN110750524A (zh) | 一种有源配电网故障特征的确定方法及系统 | |
CN109657891B (zh) | 一种基于自适应k-means++算法的负荷特性分析方法 | |
CN111090643B (zh) | 一种基于数据分析系统下的海量用电数据挖掘方法 | |
CN112329971A (zh) | 一种输变电工程投资决策模型的建模方法 | |
CN110690701A (zh) | 一种异常线损影响因素的分析方法 | |
CN112800148B (zh) | 一种基于聚类特征树和离群度量化的散乱污企业研判方法 | |
CN103632306A (zh) | 一种基于聚类分析的配电网供电区域划分方法 | |
CN106021386B (zh) | 面向海量分布式数据的非等值连接方法 | |
CN110287237B (zh) | 一种基于社会网络结构分析社团数据挖掘方法 | |
CN116933010A (zh) | 一种基于多源数据融合与深度学习的负载率分析评价方法和系统 | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及系统 | |
CN117609818A (zh) | 基于聚类与信息熵的电网关联关系发现方法 | |
CN115563477B (zh) | 谐波数据识别方法、装置、计算机设备和存储介质 | |
CN112200209A (zh) | 一种基于日差分用电量的贫困用户识别方法 | |
CN110781959A (zh) | 基于birch算法和随机森林算法的电力客户分群方法 | |
CN116522111A (zh) | 远程停复电故障自动诊断方法 | |
CN108123436B (zh) | 基于主成分分析和多元回归算法的电压越限预测模型 | |
CN113283881A (zh) | 一种远动信息源的自动审核方法及系统 | |
CN113298148A (zh) | 一种面向生态环境评价的不平衡数据重采样方法 | |
Ren et al. | Multivariable panel data ordinal clustering and its application in competitive strategy identification of appliance-wiring listed companies | |
CN116365519B (zh) | 一种电力负荷预测方法、系统、存储介质及设备 | |
CN113487080B (zh) | 一种基于风速分类的风速动态场景生成方法、系统及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210205 |
|
WW01 | Invention patent application withdrawn after publication |