CN111626792A - 一种对配网内综合能源源荷储精准画像技术 - Google Patents
一种对配网内综合能源源荷储精准画像技术 Download PDFInfo
- Publication number
- CN111626792A CN111626792A CN202010486312.3A CN202010486312A CN111626792A CN 111626792 A CN111626792 A CN 111626792A CN 202010486312 A CN202010486312 A CN 202010486312A CN 111626792 A CN111626792 A CN 111626792A
- Authority
- CN
- China
- Prior art keywords
- label
- tree
- storage
- energy source
- distribution network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims description 7
- 240000002853 Nelumbo nucifera Species 0.000 claims 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims 1
- 238000011161 development Methods 0.000 abstract description 4
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 238000010276 construction Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Water Supply & Treatment (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Library & Information Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种对配网内综合能源源荷储精准画像技术,属于电力系统自动化领域,包括以下步骤:首先建立分级标签体系,通过建立配网源荷储标签集合数据库,对原始数据进行预处理,提取其特征信息,确定标签体系中一、二级标签,创建个性化规则,依据个性化规则,建立标签树,形最终成标签体系(标签森林);然后在上述标签体系的基础上,利用利用FP‑growth算法对该事务集D进行两次扫描,创建FP‑tree_1,再将需要画像的源荷储特征信息与标签体系再一次用FP‑growth算法进行两次扫描,得到FP‑tree_2,比较FP‑tree_1与FP‑tree_2,得到频率数不同的节点路径,即为其精准画像。本发明使用于泛在物联网下精准画像发展趋势,对精准画像技术完善有着重要的作用。
Description
技术领域
本发明涉及一种对配网内综合能源源荷储精准画像技术,属于电力系统自动化领域。
背景技术
随着国家电网公司提出推进“三型两网,世界一流”能源互联网企业建设的目标,泛在电力物联网已成为国家电网公司当前重要的建设方向,同时由于泛在物联支撑下的配网大数据用户画像技术日臻成熟,开展面向配网源-荷-储系统精准画像的研究很有必要。
随着源-荷-储系统的日益发展,如何激发综合能源源-荷-储系统在泛在电力物联网支持下的运行灵活性,如何进一步提升电网的能源利用效率,降低综合能源源-荷-储系统的供能成本和用能成本显得尤为迫切。因此,在泛在电力物联网政策建设的成果支撑下,充分利用综合能源源-荷-储运行大数据的基础优势,深度挖掘源-荷-储各环节数据关联规则,进而建立综合能源源-荷-储标签库,实现对泛在电力物联网支持的综合能源源-荷-储各环节进行精准画像,为提升电网可再生新能源消纳水平提供重要的理论与数据支撑。这是本发明的关键所在。
现有电力泛在物联网下配网源荷储精准画像存在的问题:
(1)电力系统物联网建设不够成熟的现实制约,使得调控决策时无法及时准确地获取源-荷-储各环节的运行状态与行为特性。
(2)综合能源源-荷-储环节开展精准画像不够全面,造成配电系统统运行调度中缺乏对源-荷-储互补关系及峰谷时间差异的深入考虑。
(3)投入成本过高。
发明内容
针对现有技术的不足,本发明“一种对配网内综合能源源荷储精准画像技术”,提出一种分级标签的构建方法,其中包括:建立源荷储标签集合数据库;对原始数据进行预处理,提取其特征信息,确定标签体系中一、二级标签;创建个性化规则;依据个性化规则,建立标签树,形成标签森林。基于FP-growth算法实现综合能源源荷储精准画像,实现对综合能源源荷储有效快速精准画像。
本发明采用如下技术方案:一种对配网内综合能源源荷储精准画像技术,该方法包括如下步骤:
步骤1:提出一种分级标签体系的构建方法;
步骤2:基于FP-growth算法实现综合能源源荷储精准画像。
附图说明
图1是分级标签体系构建方法示意图;
图2是利用FP-growth算法对综合能源源荷储精准画像流程图。
具体实施方式
本发明包括以下步骤:
步骤1:提出一种分级标签体系的构建方法
(1)建立源荷储标签集合数据库;
源荷储标签集合数据库是将多个数据源中源荷储原始数据大集合的数据库,其特征在于其无规律、无层次,通过云端大数据平台从多个数据源中将目标对象(源荷储)原始数据抽取出来,将构建源荷储标签体系是所用到的数据整合在一起。
(2)对原始数据进行预处理,提取其特征信息,确定标签体系中一、二级标签;
服务器抽取到各数据源中原始数据后,对各个数据源中的原始数据分别进行预处理,得到各个一级、二级标签的目标特征信息,实现对一级、二级标签特征信息的提取,根据提取到特征信息的共同属性,确定其标签体系中一级、二级标签。
简单的以人文社交标签做个说明,通过预处理,得到目标特征信息字段包括姓名、年龄、体型、体重、婚姻状况、职业、文化程度、民族、户口地址、常驻地址、社保编号等,根据其符合基本信息的共同属性,确定其所属的一级标签为基本信息标签,则该目标特征信息字段为对于二级标签;得到目标信息字段包括房产数量、车辆数量等,根据其符合财产状况的共同属性,确定其所属的一级标签为财产状况标签,则该目标特征信息字段为对于二级标签;得到其目标信息字段包括异常住宿、异常飞机、异常大巴、异常火车等,根据其符合社交状态的共同属性,确定其所属的一级标签为社交状况标签,则该目标特征信息字段为对于二级标签;得到其目标信息字段包括乘坐飞机、高铁、火车、大巴的次数以及出行距离的长短等,根据其符合出行信息的共同属性,确定其所属的一级标签为出行信息标签,则该目标特征信息字段为对于二级标签;其他标签特征信息包括的字段还可以通过其他方式进行确定,本发明不做限制。
通过提取一级、二级标签所包含的目标特征信息来确定一级、二级标签,每个一级、二级标签的目标特征信息可以包括一个或多个字段,每个一级、二级标签的特征信息包括哪些字段可以根据先验知识结合数据探索分析确定。
(3)创建个性化规则;
创建个性化规则,必须符合几个原则:第一,个性化规则需要依据开发商需求创立;第二,个性化规则需要符合配网内源荷储行为特征、社会特征以及用电偏好特征等;第三,个性化规则包括枚举类规则,计算类规则,正则类规则和文本分析类规则等,并且新标签可使用原有标签作为数据来创建规则;第四,当与个性化规则有关联的数据数据量过大时,可以将数据分批进行操作,个性化规矩依据时间、空间、开发需求进行不断完善。
通过个性化规则将配网源荷储个体数据通标签项联系起来,一个个性化规则应用于一组配网内源荷储数据,个性化规则依据以上几个原则,个性化规则在计算引擎中实现。
(4)依据个性化规则,建立标签树,形成标签森林。
标签树是指以一个一级标签形成的标签体系,而每一个一级标签形成的标签体系是为标签森林。
建立标签树,首先确定余下级标签(三、四及以上级标签)的标签信息字段,该标签信息字段需要分析配网内源荷储的运行特征确定,其次分析此标签信息的父子级关系以及同级关系,最后根据个性化规则以及标签信息的父子级关系以及同级关系对标签树进行补充完善,建立标签树,最终形成标签森林。
当通过此个性化规则补充标签时出现标签与标签之间有交叉项,需要对个性化规则进行补充,并对其交叉项重新定义其标签。
步骤2:基于FP-growth算法实现对综合能源源荷储精准画像。
(1)将步骤1所述构建的分级标签体系进行初步处理,每一个一级标签对应的标签树看作一个事务T,事务T中的数据标签数据集合看作为事务集D,则上述标签体系中包含多个事务集D;
(2)对每一个事务集D进行第一次扫描,构建项头表,并对其降序排列;
事务集D中标签数据来源于所述步骤1中标签体系中的数据,数据根据个性化规则与标签父子级关系确定,不需要剔除数据,此处第一次扫描不设置最小支持度阈值或设置最小支持度阈值为0。
构建的项头表按照数据出现的频率进行降序排列,一级标签在该项头表中频率数最大,二级标签次之,以此类推,依据该项头表可判断步骤2(1)中初步处理是否发生错误,若项头表中排列顺序与出现频率和标签体系中一致,则表明正确,若不一致,则需要重新进行(1)操作。
(3)对事务D进行第二次扫描,构建FP-tree;
每读入一个事务T时,创建标记为其标签的节点,然后形成根节点null到标签节点的路径,直到每个事务都映射到FP-tree的一条路径,读入所有事务T后形成FP-tree_1,路径由根节点null和对应的所有标签节点组成,其中标签节点的路径顺序为(2)中的频繁项支持度计数降序排序。
所创建的FP-tree_1所有路径与步骤1搭建标签体系中分级层次是一致的,而每个节点出现的频率数根据所搭建的标签体系标签的不同而不同,但对于已经搭建完成的标签体系来说,节点频率数是固定不变的。
将FP-tree_1与标签体系的层次与标签数量进行比较,依据上述创建的FP-tree_1特点,若层次与频率数一致,则说明搭建的FP-tree_1正确,若不一致,则需要重新回到步骤二进行操作。
(4)利用FP-tree匹配源荷储画像。
分析需要匹配画像的源荷储原始数据(包括其行为特征数据、社会特征数据、用电偏好数据等),提取其特征信息,将该特征信息与步骤1构建的标签体系同时利用FP-growth算法,重复上述三次操作,进行两次扫描,创建FP-tree_2,比较FP-tree_1与FP-tree_2,只需比较节点频率数的变化,FP-tree_2相较于FP-tree_1某些节点频率数会大1,将这些节点路径提取出来,即为该画像。
据此得到一种基于FP-growth算法匹配画像的新方法。
以上实施方案仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的保护范畴。
Claims (3)
1.一种对配网内综合能源源荷储精准画像技术,其特征在于:
(1)一种分级标签体系的构建方法;
(2)基于FP-growth算法实现综合能源源荷储精准画像。
2.根据权利要求1所述的一种对配网内综合能源源荷储精准画像技术,其特征在于,所述步骤1)中提出一种分级标签体系的构建方法:首先建立配网源荷储标签集合数据库,然后对原始数据进行预处理,提取其特征信息,确定标签体系中一、二级标签,接着依据需求开发创建个性化规则,最后依据个性化规则和标签父子级关系创建分级标签体系。
3.根据权利要求1所述的一种对配网内综合能源源荷储精准画像技术,其特征在于,所述步骤2)中基于FP-growth算法实现综合能源源荷储精准画像:首先根据(1)所述方法构建的标签体系创建事务集D,利用FP-growth算法对该事务集D进行两次扫描,创建FP-tree_1,将需要画像的源荷储特征信息与标签体系再一次用FP-growth算法进行两次扫描,得到FP-tree_2,最后比较FP-tree_1与FP-tree_2节点频率数,画像即为FP-tree_2中节点频率数多的节点路径标签组成的画像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010486312.3A CN111626792A (zh) | 2020-06-01 | 2020-06-01 | 一种对配网内综合能源源荷储精准画像技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010486312.3A CN111626792A (zh) | 2020-06-01 | 2020-06-01 | 一种对配网内综合能源源荷储精准画像技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111626792A true CN111626792A (zh) | 2020-09-04 |
Family
ID=72272011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010486312.3A Pending CN111626792A (zh) | 2020-06-01 | 2020-06-01 | 一种对配网内综合能源源荷储精准画像技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111626792A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990647A (zh) * | 2020-12-31 | 2021-06-18 | 国网湖南省电力有限公司 | 配网项目设备画像指标评价系统与评价方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556464A (zh) * | 2009-05-22 | 2009-10-14 | 天津大学 | 基于关联规则的城市电力负荷预测模型自动推荐方法 |
WO2016029570A1 (zh) * | 2014-08-28 | 2016-03-03 | 北京科东电力控制系统有限责任公司 | 一种面向电网调度的智能告警分析方法 |
CN106504116A (zh) * | 2016-10-31 | 2017-03-15 | 山东大学 | 基于电网运行与暂态稳定裕度指标关联的稳定评估方法 |
CN107835087A (zh) * | 2017-09-14 | 2018-03-23 | 北京科东电力控制系统有限责任公司 | 一种基于频繁模式挖掘的安全设备告警规则自动提取方法 |
CN108492057A (zh) * | 2018-04-28 | 2018-09-04 | 国网新疆电力公司电力科学研究院 | 基于FP-growth的跳闸明细数据与气象数据关联分析及预警方法 |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109697455A (zh) * | 2018-11-14 | 2019-04-30 | 清华大学 | 配网开关设备的故障诊断方法及装置 |
CN110632439A (zh) * | 2019-09-29 | 2019-12-31 | 国网河南省电力公司电力科学研究院 | 基于同步波形与关联规则的配电网单相接地故障诊断技术 |
CN110852387A (zh) * | 2019-11-13 | 2020-02-28 | 江苏能来能源互联网研究院有限公司 | 一种能源互联网超实时状态研判算法 |
CN111210326A (zh) * | 2019-12-27 | 2020-05-29 | 大象慧云信息技术有限公司 | 一种用于构建用户画像的方法及系统 |
-
2020
- 2020-06-01 CN CN202010486312.3A patent/CN111626792A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556464A (zh) * | 2009-05-22 | 2009-10-14 | 天津大学 | 基于关联规则的城市电力负荷预测模型自动推荐方法 |
WO2016029570A1 (zh) * | 2014-08-28 | 2016-03-03 | 北京科东电力控制系统有限责任公司 | 一种面向电网调度的智能告警分析方法 |
CN106504116A (zh) * | 2016-10-31 | 2017-03-15 | 山东大学 | 基于电网运行与暂态稳定裕度指标关联的稳定评估方法 |
CN107835087A (zh) * | 2017-09-14 | 2018-03-23 | 北京科东电力控制系统有限责任公司 | 一种基于频繁模式挖掘的安全设备告警规则自动提取方法 |
CN108492057A (zh) * | 2018-04-28 | 2018-09-04 | 国网新疆电力公司电力科学研究院 | 基于FP-growth的跳闸明细数据与气象数据关联分析及预警方法 |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109697455A (zh) * | 2018-11-14 | 2019-04-30 | 清华大学 | 配网开关设备的故障诊断方法及装置 |
CN110632439A (zh) * | 2019-09-29 | 2019-12-31 | 国网河南省电力公司电力科学研究院 | 基于同步波形与关联规则的配电网单相接地故障诊断技术 |
CN110852387A (zh) * | 2019-11-13 | 2020-02-28 | 江苏能来能源互联网研究院有限公司 | 一种能源互联网超实时状态研判算法 |
CN111210326A (zh) * | 2019-12-27 | 2020-05-29 | 大象慧云信息技术有限公司 | 一种用于构建用户画像的方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990647A (zh) * | 2020-12-31 | 2021-06-18 | 国网湖南省电力有限公司 | 配网项目设备画像指标评价系统与评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111552813A (zh) | 一种基于电网全业务数据的电力知识图谱构建方法 | |
CN109102157A (zh) | 一种基于深度学习的银行工单派单方法及系统 | |
Shaheen et al. | Mining sustainability indicators to classify hydrocarbon development | |
CN115564071A (zh) | 一种电力物联网设备数据标签生成方法及系统 | |
CN113806560A (zh) | 一种电力数据知识图生成方法及系统 | |
CN105681052A (zh) | 一种用于数据中心分布式文件存储的节能方法 | |
Li et al. | Artificial Intelligence‐Based Sustainable Development of Smart Heritage Tourism | |
Yang et al. | Multi-source heterogeneous information fusion of power assets based on knowledge graph | |
CN108228787A (zh) | 按照多级类目处理信息的方法和装置 | |
CN111626792A (zh) | 一种对配网内综合能源源荷储精准画像技术 | |
CN111625596B (zh) | 新能源实时消纳调度的多源数据同步共享方法及系统 | |
Feng et al. | The design and implementation of global energy interconnection digital research platform | |
Jiang | Design and implementation of smart community big data dynamic analysis model based on logistic regression model | |
Min et al. | Data mining and economic forecasting in DW-based economical decision support system | |
CN115238099A (zh) | 一种面向能源行业设备的工业互联网数据中台构建方法 | |
CN114238045A (zh) | 一种电网多源量测数据完整性判断及自动修复系统和方法 | |
Li et al. | Design of data standardization cleaning system under multi-source data access | |
CN117934209B (zh) | 一种基于知识图谱的区域电力系统碳排放大数据分析方法 | |
Feifei et al. | Intelligent question and answer analysis model of power ICT based on BI-LSTM-CRF | |
Feng et al. | The core technique and application of knowledge graph in power grid company administrative duty | |
Liu et al. | Bootstrapping operation-level web service ontology: A bottom-up approach | |
Liu et al. | Automotive prospective technology mining method based on big data content analysis | |
An et al. | Intelligent filling method of power grid working ticket based on historical ticket knowledge base | |
Cao et al. | Research on deep mining of MOOC multimodal resources based on improved Eclat algorithm | |
Fan et al. | Research on Fusion of Electric Power Industry and External Data Based on Knowledge Map |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200904 |