CN113609303A - 一种基于知识图谱的国内外电力市场研究热点追踪方法 - Google Patents

一种基于知识图谱的国内外电力市场研究热点追踪方法 Download PDF

Info

Publication number
CN113609303A
CN113609303A CN202110793558.XA CN202110793558A CN113609303A CN 113609303 A CN113609303 A CN 113609303A CN 202110793558 A CN202110793558 A CN 202110793558A CN 113609303 A CN113609303 A CN 113609303A
Authority
CN
China
Prior art keywords
network
electric power
power market
word
domestic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110793558.XA
Other languages
English (en)
Other versions
CN113609303B (zh
Inventor
边晓燕
张璐瑶
尹欣宇
徐波
李东东
林顺富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Electric Power University
Original Assignee
Shanghai Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Electric Power University filed Critical Shanghai Electric Power University
Priority to CN202110793558.XA priority Critical patent/CN113609303B/zh
Priority claimed from CN202110793558.XA external-priority patent/CN113609303B/zh
Publication of CN113609303A publication Critical patent/CN113609303A/zh
Application granted granted Critical
Publication of CN113609303B publication Critical patent/CN113609303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Water Supply & Treatment (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于知识图谱的国内外电力市场研究热点追踪方法,包括以下步骤:1)采用合成图谱处理大量电力市场文献数据,生成共词矩阵;2)通过谱聚类降低共词矩阵的维数后将共词矩阵可视化为共词网络;3)简化共词网络;4)评估简化网络的图谱聚类效果,并选择剪枝后聚类效果最佳的网络图谱;5)分别从时间切片和关键词聚类进行图谱解读,分别获取演进路径和核心前沿,完成热点追踪。与现有技术相比,本发明能够把握电力市场热点与动向,提供一种高效、快速应用的文献分析方法,具有广泛的应用前景。

Description

一种基于知识图谱的国内外电力市场研究热点追踪方法
技术领域
本发明涉及电力信息数据处理技术领域,尤其是涉及一种基于知识图谱的国 内外电力市场研究热点追踪方法。
背景技术
随着国内外针对电力市场相关内容研究的不断深入,逐渐积累了丰富的理论 成果,但总体上来说缺乏系统化的梳理。与此同时,电力市场的相关内容本身又具 有多领域交叉融合且复杂的特点,涌现出的大量新兴研究主题使得动态追踪热点成 为难题,针对这一现象,我国对电力市场研究热点的追踪提出更高的要求。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于知识图 谱的国内外电力市场研究热点追踪方法。
本发明的目的可以通过以下技术方案来实现:
一种基于知识图谱的国内外电力市场研究热点追踪方法,包括以下步骤:
1)采用合成图谱处理大量电力市场文献数据,生成共词矩阵;
2)通过谱聚类降低共词矩阵的维数后将共词矩阵可视化为共词网络;
3)简化共词网络;
4)评估简化网络的图谱聚类效果,并选择剪枝后聚类效果最佳的网络图谱;
5)分别从时间切片和关键词聚类进行图谱解读,分别获取演进路径和核心前 沿,完成热点追踪。
所述的步骤1)中,生成共词矩阵具体为:
从电力市场文献数据中基于共词分析将数据描绘成一个图表,根据图表关系计算相似度,生成共词的相似矩阵,相似矩阵s(i,j)的表达式为:
Figure BDA0003161959700000021
其中,d(i,j)为样本点i和j之间的距离,σ为转换因子。
所述的步骤2)中,通过谱聚类降低共词矩阵维数具体为:
采用奇异值分解对共词矩阵进行特征值分解,获取矩阵的最小特征向量,并对 特征分解后得到的特征向量进行聚类,利用矩阵的谱信息进行特征降维。
所述的步骤3)具体为采用寻径网络算法或最小生成树算法对共词网络进行简化。
所述的步骤4)中,通过聚类模块值和轮廓值评价简化网络的图谱聚类效果。
通过聚类模块值评价简化网络的结构强度,聚类模块值越接近1,表示划分网 络结构的强度越高,通过轮廓值评价简化网络的聚类合理轮廓,轮廓值越接近1, 说明样本聚类合理轮廓越明显。
所述的步骤5)中,对国内外电力市场的研究演进轨迹进行梳理,依据一年时 间间隔内的数据形成每个单独的时间切片网络,并划分集群结构,采用对数似然比 算法提取最具代表性的词作为已划分的各聚类集群的标签,从时间维度获取演进轨 迹,形成时间线图谱。
划分后集群结构的特征量纲包括规模、轮廓值、代表年份以及标签词,选择集 群规模较大的集群对演化路径的时间线进行解读,按年份对应到集群中的节点,依 次递进解读节点。
所述的步骤5)中,采用基于知识图谱的方法动态追踪热点,用以表示国内外 电力市场领域的核心前沿,在剪枝后网络图谱的基础上优化形成关键词网络,识别 出核心关键节点,追踪研究热点,获得电力市场领域的核心前沿,形成关键词聚类 图谱。
在关键词网络中,以突现性以及中介中兴性作为节点权重衡量,识别出核心关 键节点,所述的核心关键节点包括突现节点和中介中心节点。
与现有技术相比,本发明具有以下优点:
本发明立足国内外电力市场相关研究,追踪国内外在市场化进程中的研究成果,以十年为时间尺度刻画研究聚类集群中发展演变轨迹,详细而全面展示各个集群内 部随时间的演进过程;以五年为时间尺度抓取研究热点词,形成关键词网络图谱, 采用中介中心性衡量关键节点以及重要连接,采用突现词挖掘集群中具有潜力的研 究主题,实现专业领域的研究前沿跟踪。
附图说明
图1为知识图谱分析框架
图2为国内电力市场集群结构特征,其中,图(2a)为规模特征,图(2b) 为轮廓值特征。
图3为国内电力市场#1集群演进轨迹。
图4为国外电力市场集群结构特征,其中,图(4a)为规模特征,图(4b) 为轮廓值特征。
图5为国外电力市场#0集群演进轨迹。
图6为国内电力市场关键词网络图谱。
图7为现货市场节点示意图,其中,图(7a)为现货市场节点,图(7b)为 电力现货市场节点。
图8为辅助服务节点,其中,图(8a)为辅助服务节点,图(8b)为需求响 应节点。
图9为主动配电网节点,其中,图(9a)为主动配电网节点,图(9b)为电 动汽车节点。
图10为国外电力市场关键词网络图谱。
图11为随机过程节点。
图12为聚合商节点。
图13为国内电力市场研究演化路径。
图14为国外电力市场研究演化路径。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
本发明提供一种基于知识图谱的国内外电力市场研究热点追踪方法,该方法包括以下内容:
1、知识图谱分析框架
电力市场研究具有多领域交叉融合且复杂的特点,知识图谱是结构化的语义知识库,其从文本数据中以结构化的方式提取知识,通过相互联结的关系,构成可视 化图谱的网状知识结构,针对电力市场研究的图谱分析包括合成图谱和图谱解读, 从而获得演进轨迹和核心前沿,具体步骤如图1所示。
本发明利用合成图谱处理海量的文献数据,从海量文献信息中生成共词矩阵, 通过谱聚类降低矩阵维数,利用可视化技术将共词矩阵可视化为共词网络,基于寻 径网络算法或者最小生成树算法进行网络简化,并以聚类模块值和轮廓值来评估图 谱聚类效果,选择剪枝后聚类效果最佳的网络图谱。
基于文献网络,从时间切片和关键词聚类进行图谱解读,强化图谱的可解读性,在时间线图谱中,划分并提取集群标签词,形成近十年演进路径;关键词聚类方面, 当图谱节点众多、连接复杂时以节点的突现性、中介中心性作为识别关键节点,把 握整个图谱最核心部分,形成近五年核心前沿。
1.1共词网络结构的可视化
共词分析的基本原理是在同一组文献中对一组词所出现的次数进行两两统计,通过这种共现次数来测度它们之间的亲疏关系,具体而言,从文献信息中基于共词 分析将数据描绘成一个图表,根据图表关系计算相似度,生成共词的相似矩阵。
样本点i和j之间的相似度s(i,j)的具体公式如下:
Figure BDA0003161959700000041
式中,d(i,j)表示样本点i和j之间的距离;σ表示转换因子。
谱聚类算法是基于图论的算法,适应共词网络下以连接关系为主的应用场景, 基于共现的关键词相似矩阵一般比较稀疏,可采用奇异值分解进行特征值分解,计 算出相似矩阵的最小特征向量;特征分解后得到的特征向量进行聚类,利用相似矩 阵的谱信息来进行特征降维,将数据聚类到少数几个维度。最后,利用可视化技术, 将矩阵可视化为共词网络。
1.2网络图谱的简化
基于寻径网络算法或者最小生成树算法进行网络剪枝的选择,最大程度简化网络,保留最重要的连接。其中,简化网络的图谱聚类效果是以聚类模块值和轮廓值 来评估。
聚类模块值(Modularity),是衡量网络结构强度的划分质量,最早由Newman 提出,模块值Q(i)的公式为:
Figure BDA0003161959700000051
式中,Eii表示集群i内所有的边数占整个网络所有边数的比值;ai表示经过集 群i内所有节点的边数(包含一点在集群i内一点在集群i外的边)占整个网络的 所有边数的比值。Q(i)值在0到1之间,其值越接近1,表示划分网络结构的强度 越高。
轮廓值(Silhouette),是聚类效果好坏的一种评价方式,其最早由PeterJ.Rousseeuw提出。它结合内聚度和分离度两种因素:
轮廓值S(i)的公式如下:
Figure BDA0003161959700000052
式中,a(i)表示内聚度,即i到同簇其他样本的平均距离;b(i)表示分离度,即 i到其他类簇的所有样本的平均距离。S(i)接近1,则说明样本i聚类合理轮廓越明 显。
1.3图谱解读
时间线图谱中,对划分的各聚类集群采用对数似然比算法,提取最具代表性的 词作为该集群的标签。聚类图谱中,以突现性以及中介中兴性作为节点权重衡量, 反映出核心关键部分。
1.3.1集群标签词抽取
对数似然比算法是一种用于信息检索与勘探的加权聚类技术,用以评估一个词对语料库的相关程度,提取出具有类别区分能力的标签词,具体为:
H1表示元素w1、w2之间是相互独立的;H2表示元素w1、w2之间具有相关性。 H1和H2符合二项式分布,其似然值L(H1)、L(H2)的公式如下:
L(H1)=b(c12;c1;p1)b(c2-c12;N-c1;p1) (4)
L(H2)=b(c12;c1;p2)b(c2-c12;N-c1;p12) (5)
式中,N表示所有元素出现的总次;c1、c2和c12分别表示元素w1、w2和w12在语料库中出现的次数;p1、p2和p12为采用极大似然估计法计算元素w1、w2和 w12出现概率;b(·)表示二项式分布。
H1和H2的差异度表示为LLR,其中似然比λ对数值是以2为底,具体公式如 下:
Figure BDA0003161959700000061
对数似然比算法不会过分放大高频词的领域相关性,通过考虑一个词对领域的正负面贡献,能够比较准确的反映领域的特性,保证抽取结果的稳定性。
1.3.2节点权重计算
1)突现性是指研究点突然爆发。采用突发性检测技术,识别被引次数的突然 变化,根据发生的时间序列来建立一种突发检测模型—Kleinberg状态机模型,其 公式如下:
Figure BDA0003161959700000062
式中,σ(i,rt,dt)表示t时刻状态产生的成本;dt表示总共的序列;rt表示相关 性的序列;pi表示相关序列发生的期望。
在[t1,t2]时段,序列突现的强度Burst定义为:
Figure BDA0003161959700000063
突现节点通常揭示了有潜力的研究主题。在本发明的网络图谱中,突现性采用 引用环表示。
2)中介中心性是指网络中经过某点并连接这两点的最短路径占这两点之间的 最短路径线总数之比,用以测度节点在网络中的重要性,中介中性CB(v)的公式如 下:
Figure BDA0003161959700000064
式中,σst(v)表示节点s到节点t的最短路径中经过节点v的数量;σst表示节点 s到节点t的最短路径数量。
在图谱中具体表现可分为两类。第一类为本领域中高度相连的枢纽节点,第二 类为连接不同集群的转折点。一般而言,跨领域的研究会导致新兴趋势的诞生,因 此更倾向于关注第二类转折点。在本发明的网络图谱中,中介中心性用紫色引用环 表示。这种节点权重计算,可只研究网络中少量的连接点,而不是整个网络,大大 提高了图谱的可解读性。
2、电力市场研究演进轨迹
针对国内近十年1495篇、国外近十年5106篇电力市场的相关研究,采用基于 知识图谱的方法系统化梳理,划分并提取集群标签词,从而提炼出随时间发展的演 进轨迹。
2.1国内电力市场的演进轨迹
本例以“主题SU=(批发+零售+中长期+现货),文献来源:(SCI,EI及北大核 心期刊),时间跨度=2011-2020”等组配索引式,基于中国知网CNKI中电力市场 相关的总共1495篇文章,对国内电力市场的研究演进轨迹进行梳理。依据一年时 间间隔内的数据构成每个单独的时间切片网络,整合这些独立的网络形成随时间推 移的演变轨迹。单个时间切片的网络拓扑结构如表1所示。以2020年的单个切片 网络为例,2020年515篇表征影响力的g-index指数为12以上的代表性文献集合, 组成81个节点、132条连线的单年切片网络。
表1电力市场切片网络结构
时间 g-index 文献数量 引文数量 节点 连线
2011 12 169 517 81 158
2012 9 115 403 66 88
2013 10 110 377 69 110
2014 11 115 419 74 119
2015 9 90 309 63 88
2016 11 140 480 74 110
2017 11 175 456 78 153
2018 11 113 362 71 125
2019 12 212 583 88 198
2020 12 256 515 81 132
整合单个的时间网络形成国内近十年电力市场研究的关键词演化路径。从时间维度表示知识演进的视图,勾画聚类之间的关系和某个聚类的历史跨度,展示着知 识群体之间的更新和相互影响。其中,横轴为研究时间,纵轴为依次排列划分后的 知识集群。每个集群的变化轨迹通过包含时间线的演化路径来显示。本例得出了 17个聚类集群,并采用1.3节提及的对数似然比算法,提取群体的标签词,在集群 序号之后加以显示。选取#0~4进行展示,如图13所示。
知识图谱中,划分后的集群结构的特征量纲包括:规模、轮廓值、代表年份以 及标签词。以集群规模较大的#0~8分析集群结构特征,如图2所示。关键词集群 内成员较多的,表示集群规模较大,比较具备代表性。聚类轮廓值接近于1,说明 聚类相似度高。从图中可以看出,集群的规模超过20个,集群具有代表性;仅有 集群#6轮廓值较低,其余集群轮廓值都接近于1,表明同一关键词集群的同质程度 高,相似度高。
以#1集群(调峰辅助服务)为例对演化路径的时间线进行解读,演进轨迹如图3 所示。按年份对应到集群中的节点,依次递进解读节点。关键词节点中包含着筛选 后最相关的文献数据,以此展现研究轨迹的演变。
应用场景:探索促进新能源消纳的市场机制,例如去中心化的市场机制可充分 反映成员之间的良性竞争;泛在电力物联网下有更多的挑战,例如“边缘-云”计 算架构、区块链去中心化等。
市场主体:参与主体由分布式能源转变到多能源耦合。对于分布式能源的管理 涉及虚拟电厂、微电网等多种主体的管理方式,商业虚拟电厂的运营机制是目前的 研究难点,可考虑其加入辅助服务等交易品种;电储热与风电场联动参与调峰辅助 服务,促进消纳弃风;发展到现今考虑控制因素的交互能源机制,从而实现系统能 源互动,同时利用分布式调度弥补信息不对称的缺陷。此外,调峰辅助服务市场应 发挥火电等传统发电商的深度调峰效益,刺激具备灵活稳定性的市场成员主动参与 调峰。
政策机制:商业模式节点同时连接#1集群内市场机制、分布式能源、泛在电 力物联网等多个节点,推动市场改革归根于商业模式的摸索,例如规模化分布式储 能提供辅助服务的自盈利模式以及协同共赢的共享储能模式等。
2.2国外电力市场的演进轨迹
本步骤以“主题:(electricity NEAR/5market),文献类型:(Article),语种:(English),索引=SCI-EXPANDED,时间跨度=2011-2020”等组配索引式,基于Web ofscience检索电力市场相关的5 106篇文章,对国外电力市场的研究演进轨迹进行 梳理。单个时间切片的网络信息如表2所示,以2020年的网络结构为例,2020年 558篇g-index指数36以上的代表性文献集合,组成253个节点、759条连线的单 年切片网络。
表2电力市场切片网络结构
Figure BDA0003161959700000091
整合单个的时间网络形成的研究演进轨迹如图14所示,呈现了国外近十年电 力市场研究演化路径。基于对数似然比算法抽取网络图谱的标签词,共划分了23 个集群标签。附录中显示聚类标签#0~4。
以集群规模较大的#0~8分析集群结构特征,如图4所示。集群#0有44个成员, 规模最大,是最具有代表性的集群之一。同时集群#0~8的轮廓性均超过0.8,说明 集群内的各成员之间连接紧密。
以集群#0(负荷预测)为例对演化路径的时间线进行解读,路径如图5所示。
应用场景:单个市场支撑电力交易的难度大且风险较高,因此负荷预测的应用 场景需要考虑市场之间的耦合,例如“能源+容量”、“能源+辅助服务”等。由图 5可知,2015纯能源市场引起广泛的讨论,长期而言纯能源市场促进转型低碳,然 而可能出现能源短缺的风险,稀缺电价导致系统成本增加。因此容量市场受到投资 者支持,其发电能力可靠,供应安全稳定,同时需求响应和储能的加入可实现发电 充足性。近些年P2P能源交易平台年率先在瑞士落地实施,去中心化的市场机制 设计是双边能源交易的基础。联合双向能源和辅助服务市场中交互式电网系统的协 同优化,对分布式能源与配电网运营商的经济性、灵活性以及可靠性进行评估。
解决方法:随着市场的转变与发展,负荷预测已成为一个重要的研究领域,是 电力市场运营和规划的关键任务。短期负荷预测常用长短期记忆、回声状态网络等 模型,分布式学习算法对于预测复杂地理分布的用户非常具有潜力。近些年采用相 似日法衡量气候的影响因素,最新的发展轨迹为机器学习模型,用于预测技术的发 展,支撑后续投标策略和估算盈利。
3、电力市场的核心前沿
本步骤中,对国内近五年896篇、国外近五年3238篇电力市场的相关研究, 采用基于知识图谱的方法动态追踪热点,呈现电力市场领域的核心前沿。基于关键 词出现频次进行研究热点的可视化;基于节点权重探测核心前沿,权重以突现性以 及中介中心性进行衡量,提炼出电力市场研究的关键核心。
3.1国内电力市场的核心前沿
本步骤中使用的数据来源于中国知网CNKI中近五年电力市场相关的文献,总 计896篇。结合1.2节提及的图谱剪枝,对生成的单年网络或综合网络选择寻径网 络算法或者最小生成树算法进行裁剪简化,结果如表3所示。对比四种方式的综合 聚类效果可知,采用寻径网络算法裁剪单年网络的效果最佳。
表3国内电力市场不同聚类裁剪算法效果对比
Figure BDA0003161959700000101
3.1.1关键词聚类图谱
图谱剪枝后,优化的关键词网络如图6所示。节点叠加成的树环大小表示每年 的被引频次,出现频次较高的热点关键词有现货市场、辅助服务以及需求响应等。 以现货市场节点为例加以说明,梳理该节点及其连接关系。
现货市场节点以及连接如图7所示,从其连接关系中可以看出,目前现货市场 中存在有不平衡费用、与中长期市场的衔接以及串谋竞价等问题。这些问题归根结 底在于市场机制的不成熟,而市场机制中的重要环节之一是电价的机制设计。其大 致可分为两种思路:一是采用新方法的传统定价模式,如利用多智能体强化学习确 定节点边际电价;二是采用新的定价模式,如凸包定价模式仍处于摸索阶段。此外, 新兴的交易品种有金融输电权,金融产品的衍生能够更加还原电力的商品属性。
由此看来,在知识图谱中可以选择任意感兴趣的节点并加以剖析,这种方式较 为主观,当节点众多、连接复杂时难以把握整个图谱最核心的部分。接下来本节从 节点的权重角度,探测出图谱的关键核心节点,以此捕捉电力市场相关的核心前沿。
3.1.2核心关键节点
结合步骤1.3提及的节点权重计算,以突现性以及中介中兴性作为衡量,探测 出关键节点,并在图谱中反映出关键节点。知识图谱中,突现性表现为节点中心的 红色引用环,中介中心性表现为节点最外围的粉色引用环。
3.1.2.1突现节点
以最小持续时间1年,寻找到12个突现词,如表4所示,面积较大的方块对 应着时间轴2016-2020中的突现年份。
表4关键节点-突现词表
Figure BDA0003161959700000111
由表4可知,能源互联网与电力市场改革属于研究背景的突现。在此背景下, 针对综合能源系统的能源市场的推行,服务商参与市场的行为决策以及多能源耦合 的网络阻塞管理等问题仍在研究。此外,突现性还体现在市场主体、交易品种以及 应用场景等。以辅助服务为代表的交易品种是近五年突现强度最高的关键词,其包 含的交易品种调频与深度调峰持续突现3年,这表明目前电力市场还在探索辅助服 务相关的研究。因此,以此节点为例,回溯至网络图谱并加以解析,图谱如图8 所示。
从网络图谱中辅助服务节点及其连接关系可以看出,分布式电源凭借灵活调节的优势成为辅助服务市场的核心成员,如何整合其灵活性挖掘潜在市场力仍需进一 步探索。交易品种中广泛应用的是深度调峰,在此环节需求响应的参与越来越受到 重视,要加强需求响应主动参与市场,如利用强化学习等算法得出其最优决策。
3.1.2.2中介中心节点
从高到低排列节点的中介中心性,截取前8个中介中心性词,如表5所示。寻 找的中介中心性词中,市场主体相关的最多,研究对象因更多考虑的为主动配电网、 电动汽车等。同时,应用场景中最新颖的是商业模式。主动配电网是中介中心性最 高的关键词,接下来以此节点为例解析。
表5关键节点-中介中心词表
Figure BDA0003161959700000121
主动配电网节点以及连接如图9所示。主动配电网融合了多个领域内的研究, 例如可再生能源、电动汽车等,目前研究借助区块链的存储技术优化交易策略,以 此作为智能合约的基础。其次,与鲁棒优化节点相连接,而鲁棒优化应用场景应考 虑规划与运行的相结合的优化配置。同时,高比例可再生能源的电力市场,应更多 考虑以电动汽车为代表的产消者参与能量交易市场的商业模式。
3.2国外电力市场的核心前沿
本步骤采用的数据来源于Web of science检索3 238篇相关文献。生成关键词 网络图谱,并采取不同的优化算法进行图谱剪枝,结果如表6所示。对比聚类效果 可知,综合聚类效果最佳为0.8 779。
表6国外电力市场不同聚类裁剪算法效果对比
Figure BDA0003161959700000122
Figure BDA0003161959700000131
基于寻径网络算法对综合网络裁剪,聚类效果明显优于单年网络。这是由于文 献数量增加,导致单年裁剪的网络划分模糊,使得其聚类模块值较低,进而影响了 整体的聚类效果。因此,选择对综合网络裁剪,得到关键词的聚类图谱,如图10 所示。关键词网络图谱中出现频次最高的有模型、优化、需求响应、可再生能源、 电价以及不确定性等。完整的图谱展示了全部的信息,但由于数据过多使得图谱节 点众多、连接复杂,从而缺乏可读性。因此,接下来依据节点的权重,提炼出关键 节点,聚焦于局部图谱。
3.2.1关键核心节点
3.2.1.1突现节点
以最小持续时间为一年,寻找16个突现关键词,结果如表7所示。
表7关键节点-突现词表
Figure BDA0003161959700000132
Figure BDA0003161959700000141
从表中可知,突现强度比较高的关键词有随机过程、最优潮流、以及电价预测。 区别于中国的定价机制,国外在电价预测方面发展迅猛。在此领域中,机器学习算 法仍具有研究价值。最新突现的关键词有能量枢纽、区块链,例如考虑信息勾鸿决 策能量枢纽的管理仍需提高其决策灵活性。随机过程节点兼具突现性高以及时间最 新,以此节点为例展示其在网络图谱中的具体连接,如图11所示。从图中可以看 出,随机过程方法,应用于不确定性因素的量化处理,或者计及发电侧经济性的最 优运行策略。
3.2.1.2中介中心节点
从高到低排列节点的中介中心性,截取前8个中介中心性词,如表8所示。应 用场景中最新颖的是能量交易。能量交易中,需求响应的环境效益的是一个相对较 新的话题,碳排放交易是其中不可或缺的环节。通过跟踪需求响应的碳排放量,有 效地指导排放交易计划。从表中可以看出,聚合商是中介中心性最高的节点,接下 来以此节点为例解析。
表8关键节点-中介中心词表
Figure BDA0003161959700000142
聚合商节点以及连接如图12所示。常见的聚合商有虚拟电厂、电动汽车聚合 商。虚拟电厂的灵活运行缓解网络堵塞,提高其集成能源的附加价值;电动汽车聚 合商的管理,需考虑驾驶模式、市场价格的不确定性。此外,电动汽车通过V2G 提供电网辅助服务,提高车网系统灵活性。市场机制对于充分开发产消者的潜力是 非常有必要的,鼓励本地配电网内的发电和消费,同时利用机器学习等算法为聚合 商提供决策支撑。
本发明立足国内外电力市场相关研究,追踪国内外在市场化进程中的研究成果,以十年为时间尺度刻画研究聚类集群中发展演变轨迹,详细而全面展示各个集群内 部随时间的演进过程;以五年为时间尺度抓取研究热点词,形成关键词网络图谱, 采用中介中心性衡量关键节点以及重要连接,采用突现词挖掘集群中具有潜力的研 究主题,实现专业领域的研究前沿跟踪,具体如下:
(1)国内的演进轨迹和核心前沿:商业模式为研究轨迹中连接最多的节点, 商业模式的探索例如规模化分布式储能提供辅助服务的自盈利模式等。辅助服务为 近五年突现强度最高的关键词,其交易品种中广泛应用的有深度调峰,在此环节加 强以需求响应为代表的灵活性资源的主动参与市场。主动配电网是中介中心性最高 的关键词,借助区块链的存储技术优化交易策略;鲁棒优化等算法的应用场景应考 虑规划与运行的相结合的优化配置;高比例可再生能源的电力市场,应更多考虑以 电动汽车为代表的产消者参与能量交易市场的商业模式。
(2)国外的演进轨迹和核心前沿:纯能源市场稀缺电价导致系统成本增加, 容量市场成为热点;同时,去中心化的市场机制设计仍在实行与探索中。在电价预 测方面发展迅猛,在此领域中,机器学习算法仍具有研究价值;聚合商是中介中心 性最高的关键词,以虚拟电厂、电动汽车为代表的聚合商,鼓励其主动为电网提供 灵活性。
(3)针对电力市场领域的发展前沿,本发明提供了一种基于知识图谱的可重 复、系统化方法来刻画研究领域的发展历程,可广泛应用于各个研究领域。可视化 图谱从视觉分析角度呈现领域专业的进化阶段;视觉编码中赋予的节点权重-中介 中心性、突现性,识别专业领域的关键核心。

Claims (10)

1.一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,包括以下步骤:
1)采用合成图谱处理大量电力市场文献数据,生成共词矩阵;
2)通过谱聚类降低共词矩阵的维数后将共词矩阵可视化为共词网络;
3)简化共词网络;
4)评估简化网络的图谱聚类效果,并选择剪枝后聚类效果最佳的网络图谱;
5)分别从时间切片和关键词聚类进行图谱解读,分别获取演进路径和核心前沿,完成热点追踪。
2.根据权利要求1所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,所述的步骤1)中,生成共词矩阵具体为:
从电力市场文献数据中基于共词分析将数据描绘成一个图表,根据图表关系计算相似度,生成共词的相似矩阵,相似矩阵s(i,j)的表达式为:
Figure FDA0003161959690000011
其中,d(i,j)为样本点i和j之间的距离,σ为转换因子。
3.根据权利要求1所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,所述的步骤2)中,通过谱聚类降低共词矩阵维数具体为:
采用奇异值分解对共词矩阵进行特征值分解,获取矩阵的最小特征向量,并对特征分解后得到的特征向量进行聚类,利用矩阵的谱信息进行特征降维。
4.根据权利要求1所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,所述的步骤3)具体为采用寻径网络算法或最小生成树算法对共词网络进行简化。
5.根据权利要求1所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,所述的步骤4)中,通过聚类模块值和轮廓值评价简化网络的图谱聚类效果。
6.根据权利要求5所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,通过聚类模块值评价简化网络的结构强度,聚类模块值越接近1,表示划分网络结构的强度越高,通过轮廓值评价简化网络的聚类合理轮廓,轮廓值越接近1,说明样本聚类合理轮廓越明显。
7.根据权利要求1所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,所述的步骤5)中,对国内外电力市场的研究演进轨迹进行梳理,依据一年时间间隔内的数据形成每个单独的时间切片网络,并划分集群结构,采用对数似然比算法提取最具代表性的词作为已划分的各聚类集群的标签,从时间维度获取演进轨迹,形成时间线图谱。
8.根据权利要求7所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,划分后集群结构的特征量纲包括规模、轮廓值、代表年份以及标签词,选择集群规模较大的集群对演化路径的时间线进行解读,按年份对应到集群中的节点,依次递进解读节点。
9.根据权利要求1所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,所述的步骤5)中,采用基于知识图谱的方法动态追踪热点,用以表示国内外电力市场领域的核心前沿,在剪枝后网络图谱的基础上优化形成关键词网络,识别出核心关键节点,追踪研究热点,获得电力市场领域的核心前沿,形成关键词聚类图谱。
10.根据权利要求9所述的一种基于知识图谱的国内外电力市场研究热点追踪方法,其特征在于,在关键词网络中,以突现性以及中介中兴性作为节点权重衡量,识别出核心关键节点,所述的核心关键节点包括突现节点和中介中心节点。
CN202110793558.XA 2021-07-14 一种基于知识图谱的国内外电力市场研究热点追踪方法 Active CN113609303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110793558.XA CN113609303B (zh) 2021-07-14 一种基于知识图谱的国内外电力市场研究热点追踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110793558.XA CN113609303B (zh) 2021-07-14 一种基于知识图谱的国内外电力市场研究热点追踪方法

Publications (2)

Publication Number Publication Date
CN113609303A true CN113609303A (zh) 2021-11-05
CN113609303B CN113609303B (zh) 2024-06-28

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658765A (zh) * 2022-11-01 2023-01-31 烟台富美特信息科技股份有限公司 一种基于大数据的食品研发系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799637A (zh) * 2012-06-27 2012-11-28 北京邮电大学 一种电视节目内部自动生成主要人物摘要的方法
CN104010311A (zh) * 2014-05-30 2014-08-27 广州中国科学院先进技术研究所 一种基于pam聚类算法的无线传感器网络入侵监测方法
CN106909606A (zh) * 2017-01-05 2017-06-30 南昌大学 一种基于图谱分析制作学科信息动态框架的方法
CN109497996A (zh) * 2018-11-07 2019-03-22 太原理工大学 一种微状态eeg时域特征的复杂网络构建及分析方法
CN112633011A (zh) * 2020-12-30 2021-04-09 清华大学 融合词语义与词共现信息的研究前沿识别方法及设备
CN112925991A (zh) * 2021-03-05 2021-06-08 安徽理工大学 社交网络中基于节点间相似度的社区检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799637A (zh) * 2012-06-27 2012-11-28 北京邮电大学 一种电视节目内部自动生成主要人物摘要的方法
CN104010311A (zh) * 2014-05-30 2014-08-27 广州中国科学院先进技术研究所 一种基于pam聚类算法的无线传感器网络入侵监测方法
CN106909606A (zh) * 2017-01-05 2017-06-30 南昌大学 一种基于图谱分析制作学科信息动态框架的方法
CN109497996A (zh) * 2018-11-07 2019-03-22 太原理工大学 一种微状态eeg时域特征的复杂网络构建及分析方法
CN112633011A (zh) * 2020-12-30 2021-04-09 清华大学 融合词语义与词共现信息的研究前沿识别方法及设备
CN112925991A (zh) * 2021-03-05 2021-06-08 安徽理工大学 社交网络中基于节点间相似度的社区检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658765A (zh) * 2022-11-01 2023-01-31 烟台富美特信息科技股份有限公司 一种基于大数据的食品研发系统及方法

Similar Documents

Publication Publication Date Title
Li et al. Impact factors analysis on the probability characterized effects of time of use demand response tariffs using association rule mining method
Wang et al. Association rule mining based quantitative analysis approach of household characteristics impacts on residential electricity consumption patterns
Kajikawa et al. Sustainability science: the changing landscape of sustainability research
Zangeneh et al. A hierarchical decision making model for the prioritization of distributed generation technologies: A case study for Iran
Wu et al. An investment decision framework for photovoltaic power coupling hydrogen storage project based on a mixed evaluation method under intuitionistic fuzzy environment
CN105868334A (zh) 一种基于特征递增型的电影个性化推荐方法及系统
Shen et al. Mapping renewable energy subsidy policy research published from 1997 to 2018: A scientometric review
Savin et al. Main topics in EIST during its first decade: A computational-linguistic analysis
CN116187640B (zh) 一种基于网格多属性画像体系的配电网规划方法及装置
Huang et al. An assessment of technology forecasting: Revisiting earlier analyses on dye-sensitized solar cells (DSSCs)
He et al. End-to-end probabilistic forecasting of electricity price via convolutional neural network and label distribution learning
Ma et al. A novel hybrid multi-Criteria decision-Making approach for offshore wind turbine selection
Sun et al. How to capture tourists’ search behavior in tourism forecasts? A two-stage feature selection approach
Matenga Assessment of energy market’s progress towards achieving Sustainable Development Goal 7: A clustering approach
Hou et al. An ensemble learning framework for rooftop photovoltaic project site selection
CN113609303A (zh) 一种基于知识图谱的国内外电力市场研究热点追踪方法
CN113609303B (zh) 一种基于知识图谱的国内外电力市场研究热点追踪方法
Tabak et al. The expectation hypothesis of interest rates and network theory: The case of Brazil
Gao et al. A two-stage decision framework for GIS-based site selection of wind-photovoltaic-hybrid energy storage project using LSGDM method
CN115994778A (zh) 多元用户用能行为精细画像方法
Bai Key factor mining method of distribution network equipment operational efficiency based on Apriori and CNN
Gorricha et al. A framework for exploratory analysis of extreme weather events using geostatistical procedures and 3D self-organizing maps
Jiang Support vector machine (SVM) marketing strategy analysis method based on time series
Dehler-Holland et al. The legitimacy of wind power in Germany
Heimo et al. Spectral methods and cluster structure in correlation-based networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant