CN114677112A - 一种基于大数据的配电网项目规模化评审方法及系统 - Google Patents

一种基于大数据的配电网项目规模化评审方法及系统 Download PDF

Info

Publication number
CN114677112A
CN114677112A CN202210298586.9A CN202210298586A CN114677112A CN 114677112 A CN114677112 A CN 114677112A CN 202210298586 A CN202210298586 A CN 202210298586A CN 114677112 A CN114677112 A CN 114677112A
Authority
CN
China
Prior art keywords
project
review
data
big data
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210298586.9A
Other languages
English (en)
Inventor
戚沁雅
蒙天琪
欧阳文华
戴奇奇
安义
蔡木良
周求宽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202210298586.9A priority Critical patent/CN114677112A/zh
Publication of CN114677112A publication Critical patent/CN114677112A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于配电网技术领域,涉及一种基于大数据的配电网项目规模化评审方法及系统,该方法包括以下步骤:通过数据连接模块从业务系统、数据中台收集配电网基础数据和运行数据;在问题库模块中构建问题库,问题库按配电线路和配变两类设备汇集问题;通过需求库模块生成需求库;数据预处理;基于历史数据建立大数据评审模型,将待评审项目需求清单输入大数据评审模型,通过大数据评审模型自动计算评审结果;申诉流程;专家人工评审。本发明建立了问题库‑需求库‑大数据评审‑专家评审的整套流程,基于大数据评审结果推荐专家评审,可实现配电网项目的规模化评审,大幅提升了评审效率和覆盖率,高效助力配电网精准立项。

Description

一种基于大数据的配电网项目规模化评审方法及系统
技术领域
本发明涉及配电网技术领域,更具体地,涉及一种基于大数据的配电网项目评审方法及系统。
背景技术
配电网作为电力系统的“最后一公里”,延伸到千家万户,其线路长度、设备数量、布点位置都远远高于主网,因此每年配电网新建改造项目的数量远远多于其他项目领域,在配网前期立项、评审中,面临着更多的困难。
配电网立项过程对线下资料依赖度极高,通常为人工线下收集、整理规划区域内的线路、设备资料,调研各个供电所的立项需求,根据需求报送的迫切程度前往现场踏勘。因人工数量有限,往往不能对全量申报项目开展现场踏勘,因此立项的佐证材料极度依赖供电所提报的需求内容。
由于经人工提报的需求未经过统一的校验,资料的完整性和数据的质量往往得不到保障。在更高电压等级的电网项目或是其他大型项目评审中,通常是对一个项目采取多专家、多次评审的方式,层层把关确保立项数据真实性及项目合理性、必要性。但在省级中低压配电网项目评审中,由于项目数量过多,无法逐一评审,只能采取分片区抽查方式,抽审比例往往不足10%。较低的评审覆盖率导致后期建设过程中出现问题比例增大,影响项目实施成效,造成投资浪费。
提高配电网项目立项数据质量和前期评审覆盖率对改善其建设成效具有显著的正面效果,其中主要的难点有两个方面,一是立项数据由人工线下报送,若要一一核查需要耗费极大的人力资源;二是现阶段配电网项目立项完全依赖人工评审,仅通过人力不足以对大量的项目信息进行分析,亟需一种可覆盖全量项目的数据校验、评审方法,通过自动处理立项过程中的数据信息,批量筛查不合规问题,辅助人工开展规模化项目评审。
发明内容
本发明的目的在于提供一种基于大数据的配电网项目规模化评审方法及系统,从配电网项目立项角度考虑,包含了问题库、需求库的构建方法、基于大数据的配电网项目评审体系及全套推送流程,可通过计算机可执行程序完成批量项目储备。在专家评审前,自动审查送审的全量待立项项目资料,从数据真实性、立项必要性、立项合理性等维度评估项目情况,筛选不具备立项条件的项目,避免建设过程中出现不必要问题影响项目实施成效,提高立项精准性,同时大幅减少专家评审工作量,提升评审效率。
本发明通过下述技术方案来实现。
一种基于大数据的配电网项目规模化评审方法,包括以下步骤:
S1、通过数据连接模块从业务系统、数据中台收集配电网基础数据和运行数据;
S2、在问题库模块中构建问题库,按配电线路和配变两类设备汇集问题,每批次项目报送前,由规划、设计人员根据现场踏勘及现状梳理情况,在问题库中填报对应解决方案,即该问题通过运维或立项解决;将通过运维解决的问题推送至智能化供电服务指挥系统预警工单和抢修工单,在预警工单和抢修工单中形成闭环;将通过立项解决的问题推送至需求库;当一个设备上的所有问题推送至下一环节后,该设备的一个问题周期完结,若再发生新的问题则重新计算;
S3、通过需求库模块生成需求库,对需要立项的设备和相应问题,规划、设计人员填报项目需求内容,完成填报的项目需求状态为“待审批”,如需求库积累同一设备的多个需求,完成需求内容填报后按设备自动打捆,形成一个“待审批”项目需求;上级管理员账号具有审批权限,上级管理员账号审批通过的项目需求自动推送至立项评审环节,以项目需求清单形式输入大数据评审;当一个设备上的所有需求推送至下一环节后,该设备的一个需求周期完结,若再发生新的需求则重新计算;
S4、数据预处理;
S5、基于历史数据建立大数据评审模型,将待评审项目需求清单输入大数据评审模型,通过大数据评审模型自动计算评审结果;
S6、申诉流程:对于在步骤S4~步骤S5中不通过大数据评审的项目按照评审步骤可分为“资料不完整”、“无立项必要性”和“立项不合理”,其中“无立项必要性”的项目不提供申诉通道,不建议立项;对“资料不完整”、“立项不合理”的项目提供申诉通道,驳回后项目可从问题库重新发起流程;
S7、专家人工评审:通过大数据评审的项目进入专家人工评审流程,人工评审设置抽查机制,从大数据评审结果为“推荐人工评审”的项目中抽取占需抽查项目g%的数量,从大数据评审结果为“通过”的项目中抽取占需抽查项目(100-g)%的数量,数值g由评审专家确定;确定相应数量后自动生成抽查项目清单,被抽查项目以人工评审结果为准,未被抽查项目采用大数据评审结果。
进一步优选,本发明中,步骤S5包括以下过程:
S5-1、样本数据集选择;
S5-2、文本处理:样本数据集存储的是非结构化数据,为便于后续分析,对其中用来描述项目的字段进行标准化处理;
S5-3、项目特征提取:步骤a.以10kV线路设备和配变设备为主体,建立特征设备库,特征设备库就是基于标准设备名称建立的项目关键词集;步骤b.利用机器学习方法进行关键词提取补充,得到基于实际项目库建立的关键词集;步骤c.关键词分类汇集:把步骤a中基于标准设备名称建立的关键词集与步骤b中基于实际项目库建立的关键词集进行匹配,将能够用于描述立项必要性的关键词归为标准设备名称;步骤d.特征结构化:用项目名称关联到所属主设备,统计在评价时间内设备发生的所有问题,包括类型、时长及次数,同一类问题可分为重复发生、长时发生、暂时性问题,根据对各类问题的立项导向统计特征项;结合项目资料中的项目类型分类,将设备和问题组合成二阶特征;
S5-4、立项必要性评价;
S5-5、立项合理性评价;
S5-6、将待评审项目输入大数据评审模型,经过步骤S5-2~步骤S5-5得到大数据评审结果。
进一步优选,立项必要性评价过程为:
S5-41.构建用于评价立项必要性的决策树模型:统计设备与问题不同特征组合下的立项结果,基于项目类型-设备类型-问题组合规则构建决策树图;
S5-42.对决策树剪枝;
S5-43.各个设备经大数据评审模型输出结果不同时,组合输出结果如下:
①当项目包含的所有设备输出结果都为“通过”时,组合输出结果为“通过评审”;
②当项目包含的各设备输出结果同时具备“通过”和“不通过”时,组合输出结果为“推荐人工评审”;
③当项目包含的所有设备输出结果都为“不通过”时,组合输出结果为“不通过评审”。
S5-44.从历史项目库中抽取项目输入大数据评审模型,结合专业经验对大数据评审模型进行校验及修正。
进一步优选,所述对决策树剪枝为:
当某分支的结果呈现为欠拟合时,应对该分支进行剪枝处理;基于项目样本计算所有设备与问题组合下的立项通过率,当立项通过率低于u1时,说明该分支具备显著无法通过评审的特征,结果标记为不通过;当立项通过率在(u1,u2)区间时,说明该分支对模型不具有泛化性能的提升,即不具有显著区分结果的能力,应用该分支结果会导致模型欠拟合,对该分支进行剪枝处理;当立项通过率超过u2时,说明该分支具备显著可通过评审的特征,结果标记为通过,u1为立项通过率下限、u2为立项通过率上限,u1和u2初始化参数可分别设置为0.25和0.75;
当样本量过少时,若某分支下通过和不通过数量不及项目总数的预设百分比阈值,认为该分支不具有影响评审结果的意义,对该分支进行剪枝。
进一步优选,所述立项合理性评价包括重复立项评价、预期成效不合理评价,把项目造价合理性、实施承载力、投资导向贴合度、总体投资可控四个附加项作为大数据评审模型可选参数,不作为是否通过评审的直接依据,根据待评审项目的整体规划方向配置权重并积分,当项目附加项积分超过阈值时输出结果“推荐人工评审”。
进一步优选,重复立项评价包括以下情况:
项目名称完全重复:对比待评审项目与同单位评审前k年正式下达批复的历史项目库,若存在项目名称完全重复的结果,则该项目评审结果为“不通过”;
项目名称部分重复:对比待评审项目与同单位评审前k年正式下达批复的历史项目库,计算待评审项目r和历史项目l的编辑距离;计算编辑距离在待评审项目r字符串长度中占比η%,字符串相似度为100-η,相似度大于95时匹配成功,即存在疑似重复立项,通过步骤S5-2和步骤S5-3计算待评审项目和匹配历史项目的设备特征,若特征重合度大于50%,则研判存在重复立项,项目评审结果为“不通过”。
进一步地,所述业务系统包括智能化供电服务指挥系统、用电信息采集系统、配电自动化主站系统、PMS2.0系统。
进一步地,所述问题库的问题类别包括配电线路跳闸事件、配电线路支线故障停运事件、配电线路过载事件、配电线路不满足联络要求、配电线路分段不合理、配变过载事件、台区出口低电压事件、配变用户低电压事件、老旧高损变;并设置人工新建问题类别。
进一步地,步骤S4所述数据预处理是:经问题库、需求库推送至立项评审环节的待评审项目需求清单应包含项目名称、项目类型、项目内容、设备名称、问题详情的字段;对于改造项目,规定待评审项目需求清单中的各字段不能为空,若有一个字段为空,则该项目大数据评审结果为“不通过评审”;对于新建项目,规定除设备名称以外的字段不能为空,若有一个字段为空,则该项目大数据评审结果为“不通过评审”;本步骤不通过评审的原因为“资料不完整”,可通过申诉流程在问题库重新提报资料。
本发明还提供一种基于大数据的配电网项目规模化评审系统,包括数据连接模块、问题库模块、需求库模块、大数据评审模块、申诉模块及人工评审模块;数据连接模块用于连接业务系统及数据中台,获取所需数据信息,推送至问题库模块和大数据评审模块;问题库模块基于基础数据和运行数据,计算生成各类问题事件,经过人工填报后推送至需求库模块;需求库模块由规划人员填写需求内容,经上级管理员审核后形成项目需求清单,推送至大数据评审模块;大数据评审模块基于历史数据和评审规则训练评审模型,对输入的项目需求清单形成大数据评审结果;申诉模块对部分不通过评审的项目提供申诉通道,通过申诉通道可退回问题库模块重新提交资料;人工评审模块根据专家自定义的抽查率抽取项目,根据大数据评审结果及专家评审结果自动输出评审意见。
本发明具有以下特点:
一是建立项目资料线上提交流程,包括问题库构建和需求库生成,问题库基于业务系统或数据中台,按照制定的问题生成规则以设备为单位自动收集问题,申报单位规划、设计人员根据问题情况填报相应的立项需求,减少收资过程工作量,确保数据真实性。对部分基层单位有立项需求的、无法在系统中查找到问题的设备可手动在问题库录入,通过问题库填报的需求自动推送至需求库,所有待立项项目通过需求库形成项目需求清单。
二是建立配电网项目大数据评审体系,基于历史数据建立大数据评审模型,将待评审项目输入模型后计算评审结果。样本数据集来源于历史项目库,待评审项目来源于项目需求清单,利用自然语言处理技术对项目内容进行关键信息提取,通过特征项目处理得到项目关键特征,训练样本数据建立决策树模型,抽取部分历史项目作为测试集,对模型修正后计算待评审数据评价结果。大数据评审后生成评审通过、不通过和推荐人工评审的项目明细。
三是建立申诉和人工评审流程,对于不通过大数据评审的项目,按照不通过的原因归纳为可申诉和不可申诉类,可申诉类的项目给予一次从问题库重新提交资料的机会,提交后再次进入大数据评审环节,若评审通过即进入人工审查流程,评审不通过则纳入不可申诉类,不可申诉类项目在该批次评审中不建议立项;对于通过大数据评审的项目,按一定比例抽查进入人工评审,被抽查项目采用人工评审的结果,未被抽查项目采用大数据评审的结果。
本发明具有以下优点:一是建立了问题库-需求库-大数据评审-专家评审的全套实用化流程,立项过程中的数据真实性、资料完整性、评审覆盖率取得了大幅提升;二是设计了针对配电网项目的大数据评审方法,所有数据都是基于已有系统可获取的,算法实用性好、专业性强、评审效率高;三是通过大数据评审结果推荐专家评审,对于确实需要立项的、设计质量高的项目评审环节更少,存在争议项目的抽查率更高,整体提升了抽查效率。
附图说明
图1是本发明的基于大数据的配电网项目规模化评审系统示意图。
图2是决策树示意图。
图中:10-数据连接模块、20-问题库模块、30-需求库模块、40-大数据评审模块、50-申诉模块、60-人工评审模块。
具体实施方式
下面结合附图和实施例进一步详细阐明本发明。
参照图1,一种基于大数据的配电网项目规模化评审方法,包括以下步骤:
S1、通过数据连接模块10从业务系统、数据中台收集配电网基础数据和运行数据;业务系统包括智能化供电服务指挥系统、用电信息采集系统、配电自动化主站系统、PMS2.0系统。
S2、在问题库模块20中构建问题库,问题库按配电线路和配变两类设备汇集问题。所有问题来自于业务系统或数据中台,问题库的问题类别包括配电线路跳闸事件、配电线路支线故障停运事件、配电线路过载事件、配电线路不满足联络要求、配电线路分段不合理、配变过载事件、台区出口低电压事件、配变用户低电压事件、老旧高损变;并设置人工新建问题类别;每批次项目报送前,由规划、设计人员根据现场踏勘及现状梳理情况,在问题库中填报对应解决方案,即该问题通过运维或立项解决;将通过运维解决的问题推送至智能化供电服务指挥系统预警工单和抢修工单,在预警工单和抢修工单中形成闭环;将通过立项解决的问题推送至需求库;当一个设备上的所有问题推送至下一环节后,该设备的一个问题周期完结,若再发生新的问题则重新计算。
S3、通过需求库模块30生成需求库,对需要立项的设备和相应问题,规划、设计人员填报项目需求内容,完成填报的项目需求状态为“待审批”,如需求库积累同一设备的多个需求,完成需求内容填报后按设备自动打捆,形成一个“待审批”项目需求;上级管理员账号具有审批权限,上级管理员账号审批通过的项目需求自动推送至立项评审环节,以项目需求清单形式输入大数据评审;当一个设备上的所有需求推送至下一环节后,该设备的一个需求周期完结,若再发生新的需求则重新计算。
S4、数据预处理:经问题库、需求库推送至立项评审环节的待评审项目需求清单应包含项目名称(工程量)、项目类型、项目内容、设备名称、问题详情(问题类型和数量)的字段;对于改造项目,规定待评审项目需求清单中的各字段不能为空,若有一个字段为空,则该项目大数据评审结果为“不通过评审”;对于新建项目,规定除设备名称以外的字段不能为空,若有一个字段为空,则该项目大数据评审结果为“不通过评审”;本步骤不通过评审的原因为“资料不完整”,可通过申诉流程在问题库重新提报资料。
S5、基于历史数据建立大数据评审模型,将待评审项目需求清单输入大数据评审模型,通过大数据评审模型自动计算评审结果。
S6、申诉流程:对于在步骤S4~步骤S5中不通过大数据评审的项目按照评审步骤可分为“资料不完整”、“无立项必要性”和“立项不合理”,其中“无立项必要性”的项目不提供申诉通道,不建议立项;对“资料不完整”、“立项不合理”的项目提供申诉通道,驳回后项目可从问题库重新发起流程。
S7、专家人工评审:通过大数据评审的项目进入专家人工评审流程,人工评审设置抽查机制,从大数据评审结果为“推荐人工评审”的项目中抽取占待评审项目g%的数量,从大数据评审结果为“通过”的项目中抽取占待评审项目(100-g)%的数量,数值g由评审专家确定。被抽查项目以人工评审结果为准,未被抽查项目采用大数据评审结果。
本实施例中,问题库包含以下问题类别:
q1、配电线路跳闸事件,根据变电站开关变位信息确定是否发生跳闸,在1个周期内配电线路跳闸1次即纳入问题库,按该周期内每条配电线路跳闸次数汇总展示。
q2、配电线路支线故障停运事件,根据配电自动化支线开关SOE信息或线路下停运配变数量确定是否有支线故障停运,在1个周期内1条配电线路所连接的支线故障次数超过阈值即纳入问题库,按该周期内每条配电线路连接的所有支线故障次数汇总展示。
q3、配电线路过载事件,根据配电线路负荷电流是否超过导线安全运行电流确定线路过载事件的发生,在1个周期内配电线路过载1次即纳入问题库,按该周期内每条配电线路过载次数汇总展示。
q4、配电线路不满足联络要求,根据架空线路应满足单联络的要求,确定是否存在单辐射架空线路,在1个周期内动态计算,按最近一次计算结果展示。
q5、配电线路分段不合理,根据配电线路是否有分段、是否存在大分支线路(挂接配变超过30台或支线长度超过10km为大分支)研判,对于无分段或存在大分支线路的馈线研判为分段不合理,在1个周期内动态计算,按最近一次计算结果展示。
q6、配变过载事件,根据配变负荷功率是否超过容量确定配变过载事件的发生,在1个周期内配变过载1次即纳入问题库,按该周期内每台配变过载次数汇总展示。
q7、台区出口低电压事件,根据配变单相出口电压是否小于198V确定事件的发生,在1个周期内配电台区出口(配变低压侧)发生1次低电压即纳入问题库,按该周期内每台配变发生台区出口低电压次数汇总展示。
q8、配变用户低电压事件,根据用户计量点电压是否小于198V确定事件的发生,在1个周期内1台配变连接的所有用户发生低电压次数之和超过阈值即纳入问题库,按该周期内每台配变连接的所有用户低电压次数汇总展示。
q9、老旧高损变,根据配变型号和运行年限确定,对于型号为S9及以下的、或是运行年限超过30年的配变研判为老旧高损变,在1个周期内动态计算,按最近一次计算结果展示。
q10、其他有必要立项、但无法在线上自动取数的问题,设置人工新建问题类别。
本实施例中,步骤S5包括以下过程:
S5-1、样本数据集选择:建立了需求库后,历史项目样本可在需求库中直接获取。在不具有需求库时,所有项目直接录入项目管控系统,正式下达批复的项目推送至PMS2.0系统。因此将PMS2.0系统和项目管控系统的项目样本作为历史项目库,对于“通过评审”的项目样本可在PMS2.0系统中获取;“不通过评审”的项目样本可选择项目管控系统中未批复的项目,或基于项目管控系统和PMS2.0系统的比对,选取不在PMS2.0系统中的项目。
S5-2、文本处理:样本数据集和项目需求存储的是非结构化数据,为便于后续分析,首先需要对其中用来描述项目的字段(项目内容或工程量)进行标准化处理。
1)文本标准化:同一设备由不同人员填写时有多种描述,例如“10kV”“10kv”“10千伏”描述的是同一含义,在填写错误时还会出现“1kV”“0kV”等形式,在文本预处理时需对常见易引起歧义的描述标准化处理,采用正则方法替换为标准描述。
2)分词:选择合适的中文分词工具对项目内容进行分词处理并标注词性,可选用jieba、SnowNLP、THULAC、NLPIR等方法,将设备的常用写法加入词库,对分词之后的结果纠偏,例如“10kV架空线路”“配变”“柱上断路器”“低压线路”等描述主设备的词汇应确保不被分开;引用公开的中文停用词表,对分词结果做去停用词处理。
S5-3、项目特征提取
步骤a.以10kV线路设备和配变设备为主体,建立特征设备库,特征设备库就是基于标准设备名称建立的项目关键词集。特征设备库的建立可参考典型设计中设备清单,应包含配电网项目中涉及的主设备和影响项目解决问题属性的设备,例如“10kV架空线路”“柱上开关”“FTU”“避雷器”“配变”“JP柜”等。
步骤b.利用机器学习方法进行关键词提取补充,得到基于实际项目库建立的关键词集:将以数字为主体的词汇和以中文为主体的词汇分开,例如“100kVA”和“配电变压器”分开统计,将数字部分单独记录,中文词汇部分利用TF-IDF算法分析词频及权重,具体如下:
计算词汇在项目样本中出现的词频TF
Figure 768135DEST_PATH_IMAGE002
式中,TF i 为词汇t i在项目样本中出现的词频,n i 为词汇t i在项目样本中出现的次数, i n i 为项目样本中文词汇部分的总词数。
计算词汇的逆文本频率IDF i
Figure 774662DEST_PATH_IMAGE004
式中,IDF i 为词汇t i的逆文本频率,D为语料库中的文本总数,可引用jieba官方语料库用于计算,Di为包含词汇t i的文本数,计算得到的结果idf i 用于表明词汇是否具有区分能力。
通过TF-IDF=TF*IDF运算过滤掉项目样本中的常见词汇,保留重要的词汇,经过滤后,得到排名前x项名词(设备)为关键词。
步骤c.关键词分类汇集:由于项目内容为人工填报,项目内容中的设备名并不为标准设备名,例如配变的常用写法有“配电变压器”“配电台区”“台区”“变压器”“配变”“箱变”“杆变”等,但实际描述的是同一设备。因此需要把步骤a中基于标准设备名称建立的关键词集与步骤b中基于实际项目库建立的关键词集进行匹配,将能够用于描述立项必要性的关键词归为标准设备名称,属于线路的标准设备可包括10kV线路(包括架空和电缆线路)、开关(包含柱上开关、环网柜、隔离开关等一次设备和DTU、FTU等二次设备)、线路避雷器、绝缘子,属于配变的标准设备可包括配电变压器、10kV线路(配变建设配套线路)、JP柜、低压线路。
步骤d.特征结构化:项目评审结果取决于立项合理性和立项必要性,其中立项合理性为新增指标,历史项目不考虑该指标,立项必要性依赖于项目要解决的问题。由于历史项目分析时还未构建问题库,因此评价立项必要性需要从数据中台或业务系统获取设备台账及历史问题,需要获取的历史问题类别可参考问题库构建内容,涉及时间维度为项目下达年份及前一年。用项目名称关联到所属主设备,即所属10kV线路或配变,统计在评价时间内设备发生的所有问题,包括类型、时长及次数,同一类问题可分为重复发生、长时发生、暂时性问题等类别,根据对各类问题的立项导向统计特征项。
在S5-2中完成了对项目内容的文本处理,基于步骤c的关键词分类汇集,可以把文本处理结果映射到标准设备名称,对每个项目形成关键设备集。结合项目资料中的项目类型(中压线路新建、中压线路改造、配变新建、配变改造)分类,可将设备和问题组合成二阶m×n特征。线路设备可通过降维归类为10kV线路、开关、线路避雷器、绝缘子4类,配变设备可通过降维归类为配电变压器、10kV线路、JP柜、低压线路4类,因此本实施例中m=4;同样地,结合问题库的问题分类,问题特征可做降维处理,线路问题可进一步分为线路故障(配电线路跳闸和配电线路支线故障停运)、配电线路过载、网架问题(配电线路不满足联络、配电线路分段不合理),配变问题可进一步分为配变本体问题(配变过载、老旧高损变)、台区出口低电压问题、用户低电压问题,即线路和配变问题特征降维之后各包含3类问题,根据每个设备存在或不存在某类问题,可形成不同的设备-问题组合。
S5-4、立项必要性评价
1)构建用于评价立项必要性的决策树模型:
考虑到历史项目通常以立项必要性作为是否通过评审的决定性因素,因此评价立项必要性时可直接引用历史项目样本立项结果。统计设备与问题不同特征组合下的立项结果,基于项目类型-设备类型-问题组合规则构建决策树图。决策树构造方法如图2所示。
2)对决策树剪枝:
当某分支的结果呈现为欠拟合时,应对该分支进行剪枝处理。基于项目样本计算所有设备与问题组合下的立项通过率,当立项通过率低于u1时,说明该分支具备显著无法通过评审的特征,结果标记为不通过;当立项通过率在(u1,u2)区间时,说明该分支对模型不具有泛化性能的提升,即不具有显著区分结果的能力,应用该分支结果会导致模型欠拟合,对该分支进行剪枝处理;当立项通过率达到u2时,说明该分支具备显著可通过评审的特征,结果标记为通过。u1为立项通过率下限、u2为立项通过率上限,u1和u2初始化参数可分别设置为0.25和0.75。
当样本量过少时,若某分支下通过和不通过数量不及项目总数的预设百分比阈值,认为该分支不具有影响评审结果的意义,对该分支进行剪枝。预设百分比阈值的初始化参数可设为5%。
3)由于项目涉及的设备并不总是单设备,通常会同时包含两类及以上设备,即[设备1 设备2 设备3 设备4] = [1 1 0 1]或[1 0 0 1]等16种设备组合方式,因此对其中各个设备经大数据评审模型输出结果不同时,组合输出结果如下:
①当项目包含的所有设备输出结果都为“通过”时,组合输出结果为“通过评审”;
②当项目包含的各设备输出结果同时具备“通过”和“不通过”时,组合输出结果为“推荐人工评审”;
③当项目包含的所有设备输出结果都为“不通过”时,组合输出结果为“不通过评审”。
4)从历史项目库中抽取项目输入大数据评审模型,结合专业经验对大数据评审模型进行校验及修正。
S5-5、立项合理性评价
在实际项目建设和投运过程中,因立项不合理而暴露出的问题越来越多,因此在大数据评审模型中加入立项合理性评价。
1)重复立项评价
原则上同一设备在kk≥1)年内不允许重复立项。
①项目名称完全重复。对比待评审项目与同一县公司评审前k年正式下达批复的历史项目库,若存在项目名称完全重复的结果,则该项目评审结果为“不通过”。
②项目名称部分重复。对比待评审项目与同一县公司评审前k年正式下达批复的历史项目库,计算待评审项目r和历史项目l的编辑距离(Levenshtein distance),即两个待匹配字符串之间,由一个转成另一个所需的最少编辑操作次数。计算方法如下:
Figure 964204DEST_PATH_IMAGE006
式中lev r,l (i , j)为最小编辑距离,代表r的前i个字符变化到l的前j个字符的距离;相对于r变化到l来说,lev r,l (i -1, j) +1表示r删除1个字符去匹配llev r,l (i , j -1) +1表示r添加1个字符去匹配llev r,l (i -1, j -1) +1(rilj)表示匹配或不匹配,取决于r i l j 是否成立。
计算lev r,l (i , j)在待评审项目r字符串长度中占比η%,字符串相似度为100-η,相似度大于p时匹配成功,即存在疑似重复立项,推荐p=95,通过步骤S5-2和步骤S5-3计算待评审项目和匹配历史项目的设备特征,若特征重合度大于50%,则研判存在重复立项,项目评审结果为“不通过”。
2)预期成效不合理评价
经投运项目成效研究表明,当配变本体并未发生过载时,项目中单纯更换配变(无配套项目)成效较差。将该“预期成效不合理评价”配置为大数据评审模型可选参数,即“预期成效不合理评价”=0(不计算)或1(计算),初始值默认为1。
3)其他评价
在项目评审中,还存在项目造价合理性、实施承载力、投资导向贴合度、总体投资可控等附加关注点,附加项为大数据评审模型可选参数,不作为是否通过评审的直接依据,可根据待评审项目的整体规划方向配置权重并积分,当项目附加项积分超过阈值时输出结果“推荐人工评审”。
S5-6、将待评审项目输入大数据评审模型,经过步骤S5-2~步骤S5-5得到大数据评审结果。
为了实现上述方法,本发明提供了一种配电网项目规模化评审系统,如图1所示。包括数据连接模块10、问题库模块20、需求库模块30、大数据评审模块40、申诉模块50及人工评审模块60。数据连接模块10用于连接业务系统及数据中台,获取所需数据信息,推送至问题库模块20和大数据评审模块40;问题库模块20基于基础数据和运行数据,计算生成各类问题事件,经过人工填报后推送至需求库模块;需求库模块30由规划人员填写需求内容,经上级管理员审核后形成项目需求清单,推送至大数据评审模块40;大数据评审模块40基于历史数据和评审规则训练评审模型,对输入的项目需求清单形成大数据评审结果;申诉模块50对部分不通过评审的项目提供申诉通道,通过申诉通道退回问题库模块重新提交资料;人工评审模块60根据专家自定义的抽查率抽取项目,根据大数据评审结果及专家评审结果自动输出评审意见。

Claims (10)

1.一种基于大数据的配电网项目规模化评审方法,其特征在于,包括以下步骤:
S1、通过数据连接模块从业务系统、数据中台收集配电网基础数据和运行数据;
S2、在问题库模块中构建问题库,按配电线路和配变两类设备汇集问题;每批次项目报送前,由规划、设计人员根据现场踏勘及现状梳理情况,在问题库中填报对应解决方案,即该问题通过运维或立项解决;将通过运维解决的问题推送至智能化供电服务指挥系统预警工单和抢修工单,在预警工单和抢修工单中形成闭环;将通过立项解决的问题推送至需求库;当一个设备上的所有问题推送至下一环节后,该设备的一个问题周期完结,若再发生新的问题则重新计算;
S3、通过需求库模块生成需求库,对需要立项的设备和相应问题,规划、设计人员填报项目需求内容,完成填报的项目需求状态为“待审批”,如需求库积累同一设备的多个需求,完成需求内容填报后按设备自动打捆,形成一个“待审批”项目需求;上级管理员账号具有审批权限,上级管理员账号审批通过的项目需求自动推送至立项评审环节,以项目需求清单形式输入大数据评审;当一个设备上的所有需求推送至下一环节后,该设备的一个需求周期完结,若再发生新的需求则重新计算;
S4、数据预处理;
S5、基于历史数据建立大数据评审模型,将待评审项目需求清单输入大数据评审模型,通过大数据评审模型自动计算评审结果;
S6、申诉流程:对于在步骤S4~步骤S5中不通过大数据评审的项目按照评审步骤分为“资料不完整”、“无立项必要性”和“立项不合理”,其中“无立项必要性”的项目不提供申诉通道,不建议立项;对“资料不完整”、“立项不合理”的项目提供申诉通道,驳回后项目可从问题库重新发起流程;
S7、专家人工评审:通过大数据评审的项目进入专家人工评审流程,人工评审设置抽查机制,从大数据评审结果为“推荐人工评审”的项目中抽取占需抽查项目g%的数量,从大数据评审结果为“通过”的项目中抽取占需抽查项目(100-g)%的数量,数值g由评审专家确定;确定相应数量后自动生成抽查项目清单,被抽查项目以人工评审结果为准,未被抽查项目采用大数据评审结果。
2.根据权利要求1所述的基于大数据的配电网项目规模化评审方法,其特征在于,步骤S5包括以下过程:
S5-1、样本数据集选择;
S5-2、文本处理:样本数据集存储的是非结构化数据,为便于后续分析,对其中用来描述项目的字段进行标准化处理;
S5-3、项目特征提取:步骤a.以10kV线路设备和配变设备为主体,建立特征设备库,特征设备库就是基于标准设备名称建立的项目关键词集;步骤b.利用机器学习方法进行关键词提取补充,得到基于实际项目库建立的关键词集;步骤c.关键词分类汇集:把步骤a中基于标准设备名称建立的关键词集与步骤b中基于实际项目库建立的关键词集进行匹配,将能够用于描述立项必要性的关键词归为标准设备名称;步骤d.特征结构化:用项目名称关联到所属主设备,统计在评价时间内设备发生的所有问题,包括类型、时长及次数,同一类问题分为重复发生、长时发生、暂时性问题,根据对各类问题的立项导向统计特征项;结合项目资料中的项目类型分类,将设备和问题组合成二阶特征;
S5-4、立项必要性评价;
S5-5、立项合理性评价;
S5-6、将待评审项目输入大数据评审模型,经过步骤S5-2~步骤S5-5得到大数据评审结果。
3.根据权利要求2所述的基于大数据的配电网项目规模化评审方法,其特征在于,立项必要性评价过程为:
S5-41.构建用于评价立项必要性的决策树模型:统计设备与问题不同特征组合下的立项结果,基于项目类型-设备类型-问题组合规则构建决策树图;
S5-42.对决策树剪枝;
S5-43.各个设备经大数据评审模型输出结果不同时,组合输出结果如下:
①当项目包含的所有设备输出结果都为“通过”时,组合输出结果为“通过评审”;
②当项目包含的各设备输出结果同时具备“通过”和“不通过”时,组合输出结果为“推荐人工评审”;
③当项目包含的所有设备输出结果都为“不通过”时,组合输出结果为“不通过评审”;
S5-44.从历史项目库中抽取项目输入大数据评审模型,结合专业经验对大数据评审模型进行校验及修正。
4.根据权利要求3所述的基于大数据的配电网项目规模化评审方法,其特征在于,所述对决策树剪枝为:
当某分支的结果呈现为欠拟合时,应对该分支进行剪枝处理,基于项目样本计算所有设备与问题组合下的立项通过率,当立项通过率低于u1时,说明该分支具备显著无法通过评审的特征,结果标记为不通过;当立项通过率在(u1,u2)区间时,说明该分支对模型不具有泛化性能的提升,即不具有显著区分结果的能力,应用该分支结果会导致模型欠拟合,对该分支进行剪枝处理;当立项通过率达到u2时,说明该分支具备显著可通过评审的特征,结果标记为通过;u1为立项通过率下限、u2为立项通过率上限;
当样本量过少时,若某分支下通过和不通过数量不及项目总数的预设百分比阈值,认为该分支不具有影响评审结果的意义,对该分支进行剪枝。
5.根据权利要求2所述的基于大数据的配电网项目规模化评审方法,其特征在于,所述立项合理性评价包括重复立项评价、预期成效不合理评价,把项目造价合理性、实施承载力、投资导向贴合度、总体投资可控四个附加项作为大数据评审模型可选参数,不作为是否通过评审的直接依据,根据待评审项目的整体规划方向配置权重并积分,当项目附加项积分超过阈值时输出结果“推荐人工评审”。
6.根据权利要求5所述的基于大数据的配电网项目规模化评审方法,其特征在于,重复立项评价包括以下情况:
项目名称完全重复:对比待评审项目与同单位评审前k年正式下达批复的历史项目库,若存在项目名称完全重复的结果,则该项目评审结果为“不通过”;
项目名称部分重复:对比待评审项目与同单位评审前k年正式下达批复的历史项目库,计算待评审项目r和历史项目l的编辑距离;计算编辑距离在待评审项目r字符串长度中占比η%,字符串相似度为100-η,相似度大于95时匹配成功,即存在疑似重复立项,通过步骤S5-2和步骤S5-3计算待评审项目和匹配历史项目的设备特征,若特征重合度大于50%,则研判存在重复立项,项目评审结果为“不通过”。
7.根据权利要求2所述的基于大数据的配电网项目规模化评审方法,其特征在于,所述业务系统包括智能化供电服务指挥系统、用电信息采集系统、配电自动化主站系统、PMS2.0系统。
8.根据权利要求2所述的基于大数据的配电网项目规模化评审方法,其特征在于,所述问题库的问题类别包括配电线路跳闸事件、配电线路支线故障停运事件、配电线路过载事件、配电线路不满足联络要求、配电线路分段不合理、配变过载事件、台区出口低电压事件、配变用户低电压事件、老旧高损变;并设置人工新建问题类别。
9.根据权利要求2所述的基于大数据的配电网项目规模化评审方法,其特征在于,步骤S4所述数据预处理是:经问题库、需求库推送至立项评审环节的待评审项目需求清单应包含项目名称、项目类型、项目内容、设备名称、问题详情的字段;对于改造项目,规定待评审项目需求清单中的各字段不能为空,若有一个字段为空,则该项目大数据评审结果为“不通过评审”;对于新建项目,规定除设备名称以外的字段不能为空,若有一个字段为空,则该项目大数据评审结果为“不通过评审”;如不通过评审的原因为“资料不完整”,通过申诉流程在问题库重新提报资料。
10.一种基于大数据的配电网项目规模化评审系统,其特征在于,包括数据连接模块、问题库模块、需求库模块、大数据评审模块、申诉模块及人工评审模块;数据连接模块用于连接业务系统及数据中台,获取所需数据信息,推送至问题库模块和大数据评审模块;问题库模块基于基础数据和运行数据,计算生成各类问题事件,经过人工填报后推送至需求库模块;需求库模块由规划人员填写需求内容,经上级管理员审核后形成项目需求清单,推送至大数据评审模块;大数据评审模块基于历史数据和评审规则训练评审模型,对输入的项目需求清单形成大数据评审结果;申诉模块对部分不通过评审的项目提供申诉通道,通过申诉通道退回问题库模块重新提交资料;人工评审模块根据专家自定义的抽查率抽取项目,根据大数据评审结果及专家评审结果自动输出评审意见。
CN202210298586.9A 2022-03-25 2022-03-25 一种基于大数据的配电网项目规模化评审方法及系统 Pending CN114677112A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210298586.9A CN114677112A (zh) 2022-03-25 2022-03-25 一种基于大数据的配电网项目规模化评审方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210298586.9A CN114677112A (zh) 2022-03-25 2022-03-25 一种基于大数据的配电网项目规模化评审方法及系统

Publications (1)

Publication Number Publication Date
CN114677112A true CN114677112A (zh) 2022-06-28

Family

ID=82073784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210298586.9A Pending CN114677112A (zh) 2022-03-25 2022-03-25 一种基于大数据的配电网项目规模化评审方法及系统

Country Status (1)

Country Link
CN (1) CN114677112A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150323A (zh) * 2023-04-23 2023-05-23 天津市普迅电力信息技术有限公司 一种基于人工智能的文本语言数据处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150323A (zh) * 2023-04-23 2023-05-23 天津市普迅电力信息技术有限公司 一种基于人工智能的文本语言数据处理方法
CN116150323B (zh) * 2023-04-23 2023-06-23 天津市普迅电力信息技术有限公司 一种基于人工智能的文本语言数据处理方法

Similar Documents

Publication Publication Date Title
CN111768077B (zh) 一种基于知识图谱的电网跳闸事件智能识别方法
CN113159339B (zh) 一种基于大数据的一台区一指标线损管理方法及系统
CN106019084B (zh) 基于配用电数据关联的中压配电网断线故障诊断方法
WO2023115842A1 (zh) 一种数据驱动的离线在线一体化配电网仿真系统及方法
CN101309009A (zh) 基于层次分析法和德尔菲法建立的城市电网综合评价体系
CN110705873A (zh) 一种新型的配电网运行状态画像分析方法
CN109710647B (zh) 一种基于关键字搜索的电网台账数据融合方法及装置
CN109359950A (zh) 一种电网监控信息全过程管控的方法
CN110888973B (zh) 一种监控信息表自动结构化梳理的方法
CN111667108A (zh) 一种配网抢修时长预测方法
CN110826228B (zh) 一种地区电网运行品质极限评估方法
CN109766416A (zh) 一种新能源政策信息抽取方法及系统
CN111339475B (zh) 一种基于主配协同、多维度智能电网规划评价系统
CN114677112A (zh) 一种基于大数据的配电网项目规模化评审方法及系统
CN110782048A (zh) 一种配电设备状态评价及检修建议系统
CN112966385A (zh) 配电网网架拓扑薄弱点辨识方法与系统
CN111832977A (zh) 一种基于自然语言解析的检修申请自动成票方法
CN111105218A (zh) 一种基于全息影像技术的配电网运行监视方法
CN114781662A (zh) 一种基于深度学习的故障线路复电知识推理方法
CN113435759B (zh) 一种基于深度学习的一次设备风险智能评估方法
CN111414583B (zh) 一种用于电网技改检修工程投资估算与造价分析管控方法
CN107292524A (zh) 智能变电站二次安全措施自动生成方法及装置
CN112000708A (zh) 一种基于调控配用数据融合的异常数据处理方法及系统
CN114399150A (zh) 基于ahp-模糊综合评价法的配网设备状态评价方法
CN112016631A (zh) 一种低电压治理相关的改进方案

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 330096 No. 88, Minqiang Road, private science and Technology Park, Qingshanhu District, Nanchang City, Jiangxi Province

Applicant after: STATE GRID JIANGXI ELECTRIC POWER COMPANY LIMITED Research Institute

Applicant after: STATE GRID CORPORATION OF CHINA

Address before: 330096 No.88 Minqiang Road, private science and Technology Park, high tech Zone, Nanchang City, Jiangxi Province

Applicant before: STATE GRID JIANGXI ELECTRIC POWER COMPANY LIMITED Research Institute

Applicant before: STATE GRID CORPORATION OF CHINA

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination