具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1示出了一种可应用于本发明实施例中的电子设备100的结构框图。如图1所示,电子设备100可以包括存储器102、存储控制器104、一个或多个(图1中仅示出一个)处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116和电网仿真分析数据存储装置。
存储器102、存储控制器104、处理器106、外设接口108、输入输出模块110、音频模块112、显示模块114、射频模块116各元件之间直接或间接地电连接,以实现数据的传输或交互。例如,这些元件之间可以通过一条或多条通讯总线或信号总线实现电连接。电网仿真分析数据存储方法分别包括至少一个可以以软件或固件(firmware)的形式存储于存储器102中的软件功能模块,例如所述电网仿真分析数据存储装置包括的软件功能模块或计算机程序。
存储器102可以存储各种软件程序以及模块,如本申请实施例提供的电网仿真分析数据存储方法及装置对应的程序指令/模块。处理器106通过运行存储在存储器102中的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的电网仿真分析数据存储方法。
存储器102可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器106可以是一种集成电路芯片,具有信号处理能力。上述处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口108将各种输入/输出装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108、处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出模块110用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出模块110可以是,但不限于,鼠标和键盘等。
音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示模块114在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示模块114可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器106进行计算和处理。
射频模块116用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通信网络或者其他设备进行通信。
可以理解,图1所示的结构仅为示意,电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
于本发明实施例中,电子设备100可以作为用户终端,或者作为服务器。用户终端可以为PC(personal computer)电脑、平板电脑、手机、笔记本电脑、智能电视、机顶盒、车载终端等终端设备。
请参阅图2,本发明实施例提供了一种电网仿真分析数据存储方法,应用于一电子设备,所述方法包括:步骤S200、步骤S210和步骤S220。
步骤S200:获取电网仿真分析数据,所述电网仿真分析数据包括原始仿真结果。
在本实施例中,原始仿真结果指电力系统的仿真结果。
步骤S210:对所述原始仿真结果进行表征描述,获得所述原始仿真结果对应的多层次模型表征信息。
可选地,所述原始仿真结果包括多个状态变量和代数变量的时间序列,所述多层次模型表征信息包括符号化表征信息和Bitmap图,步骤S210可以包括:
基于预设的时间序列符号化方法对所述时间序列进行表征,获得所述时间序列对应的符号化表征信息;
基于Bitmap绘制方法对所述符号化表征信息进行绘制,获得所述时间序列对应的Bitmap图。
在本实施例中,所述预设的时间序列符号化方法为SAX(Simple API for XML)方法。电力系统的仿真,通常是对不同运行工况下的电网进行不同故障类型的校验。由于仿真结果由运行工况和故障类型组合而成,所以仿真结果数量较多。每次仿真的结果,也包含了多个状态变量和代数变量的时间序列。以实际系统为例,每次仿真的结果可能会包含几千个状态变量和代数变量的时间序列。如果以0.01s的步长仿真20s,那么时间序列的长度为2000。因此,电力系统的仿真结果实际上是一个高维的矩阵。而在对电力系统的仿真结果进行分析的时候,如果直接对高维矩阵进行处理,数据的规模较大而且较为抽象,不太便于直接分析处理和探索发现不同仿真结果之间的本质区别,因此,为了更好地对电网的特性进行挖掘,需要探索仿真结果的其它表征方法。
电力系统的动态轨迹可分为两类,其中一类为仿真得到的状态变量或者代数变量的动态仿真结果。另外一类为基于同步向量测量装置(PMU,Phasor Measurement Unit)的广域测量系统(WAMS,WideArea Measurement System)系统或者基于工业控制系统(RTU,Remote Terminal Unit)的数据采集及监控(SCADA,SupervisoryControl And DataAcquisition)系统量测得到的实际电力系统的动态波形。其中基于PMU的WAMS系统能够提供的电力系统动态波形是微秒级的,采样间隔在0.01s左右。而基于RTU的SCADA系统的动态波形是秒级的,采样间隔在1s左右。利用SAX方法结合Bitmap的绘制可以得到电力系统单条量测曲线的图片表征。SAX方法是一种很经典的时间序列符号化方法,首先它将一条时间序列曲线的纵轴的取值进行离散化,分成M个部分,其中M被称为alphabetasize,作为SAX方法中表征符号的个数。然后再将时间轴等分为N个部分,然后求取每个时间段内时间序列的平均值将其作为该部分的值。这样,可以得到用N个符号表示的曲线降维,其中每个符号存在M种取值,如下图3所示。
在图3中,利用随机游走的方法绘制了一条包含1200个点的时间序列。在利用SAX方法对曲线进行表征的时候,alphabetasize取为8,也就是说,将时间序列的纵轴分成了8份。在此基础上,将时间序列划分为了60个小段。求取每个小段上时间序列的平均值。在利用SAX方法得到时间序列的表征之后,可利用广泛运用于DNA序列表示的Chao Game定理,对其进行表征,从而绘制出时间序列的Bitmap图像。根据Chao Game定理,在确定了Alphabetasize之后,对一张图片可以进行逐划分,每个小格的精度可以不断提高。根据绘制Bitmap图的基本引理,统计表征时间序列的字符串中子串出现的次数,并将其填写到Bitmap的矩阵中,作为像素点的表征,即可得到时间序列的Bitmap图。
选取原始仿真结果中电力系统10机39节点仿真算例中的曲线进行算例演示。截取其中一条母线故障前0.2s和故障后1s内的电压振荡数据。利用SAX方法对其进行表征,如图4所示。并按照以上方法,绘制出Bitmap图。在图4表征的图像中,Alphabetasize取为8,这意味着纵轴被分成了8份,通过对图3、图4的分析可以发现,当Alphabetasize取为8时,能够较好地对电力系统的动态波形进行表征。在绘制Bitmap图片的时候,精度层级划分到2级,统计利用SAX方法表征得到的时间序列曲线的字串中相邻字母出现的次数,并乘以10,最终绘制出的Bitmap图如图5所示。
对于原始仿真结果中特定工况下的电力系统,在受到扰动之后的动态轨迹实际上为多个变量的时间序列。如果建立一个矩阵,其中每一列代表一条时间序列,每一行代表不同的状态变量,那么这个矩阵即可包含了特定时间窗内电力系统的振荡信息。对此类数据,可以用时序色差图进行描述。在10机39节点中,进行故障后的仿真。以0.01s的方式进行采样,选取故障前0.2s的数据和故障后1s的数据,比较不同的仿真结果,可以得到图6和图7。从图6和图7可以看出,编号为40到78的状态变量在稳定和不稳定的仿真图片中,具有非常显著的区别。经过查找发现,这部分编号的状态变量为母线的角度,也包含了发电机的功角,与实际系统中利用发电机功角对电网的暂态稳定进行区分具有较好的一致性。
步骤S220:将所述多层次模型表征信息分布式存储至预设的数据仓库中。
可选地,步骤S220可以包括:
将所述多层次模型表征信息以元数据的格式分布式存储至预设的数据仓库中。
在本实施例中,原始仿真结果中电力系统的仿真结果主要包含了静态结果和动态结果两大部分。其中,静态的仿真结果来源于潮流计算和稳定计算,典型的文件格式为BPA潮流计算文件(.dat)和BPA稳定计算文件(.swi)。其中,潮流计算文件存储了仿真时间内各节点电压、功角、有功、无功的计算结果,而BPA稳定计算文件则在潮流计算的基础上,通过静态安全分析、小干扰分析和暂态稳定分析等手段,计算出系统的安全稳定状态。
潮流计算文件以数据卡的形式存储计算结果,并通过元件与母线的连接关系将计算结果跟网络拓扑关联起来。这种以表格形式组织的数据虽然便于结构化存储,但对于非结构化数据的支持存在困难,不利于数据的伸缩扩展,线性的存储结构也不利于数据的搜索匹配速度的提升。因此,本申请提出了一种基于元数据的电力系统静态数据存储机制,以实现高效的海量静态数据搜索匹配电力系统的动态仿真结果包含了多个状态变量的时间序列。对于实际电网,单次的仿真结果就包含了上万个状态变量和代数变量的仿真结果。如果仿真的步长为0.01s,对电力系统进行了20秒的仿真,那么单次仿真的结果将是一个高维的矩阵。而电力系统具有多种复杂的运行工况,故障类型也多种多样,数据量通常在TB量级以上,如果利用传统的方法进行存储,不太利于大数据的分析方法。因此,需要利用Hadoop和Spark等专有的大数据存储框架,从而能够更好地进行大数据的分析任何电力的数据源都是数值型和解析数据值的语义字段按照一定的描述语法组成的数据介质,例如CIM XML就是电网参数值和解释参数含义的字段按照XML语法形成的文件。元数据,就是以语义字段为键(Key),以数据值为值(Value),用键值对的映射关系组织起来的数据存储格式。元数据存储最大的优势在于消除了电力数据描述语法的差异,简化了语义字段的描述方式,使得不同结构乃至不同来源的电力系统数据都能在统一的形式下存储和表达。这样可以极大丰富仿真数据的来源,提升数据存储的灵活性和伸缩性。
在本实施例中,预设的数据仓库为Hadoop的分布式文件系统HDFS(HadoopDistributed File System)。将原始仿真结果表征为所述多层次模型表征信息存于Hadoop的分布式文件系统HDFS(Hadoop Distributed File System)中。数据仓库通过数据总线(BUS)、服务(Service)和其他组件交互数据消息及集成。Hadoop HDFS是一个可以在通用硬件(Commodity Hardware)上运行的分布式文件系统,是一个具有高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用,并支持MapReduce算法的分布式实现。在电网仿真数据存储实施中,将多层次模型表述的电网仿真结果文件分布式存储于Hadoop HDFS中。在Hadoop HDFS基础上,定义海量数据仓库的高可用部署方案,包括节点资源配置、网络拓扑和应用服务部署方案等,保障数据存储和应用系统高效性和可靠性。针对电网分析海量数据仓库的监控和调度技术,实施有效的数据管理机制,有效地对平台中的数据存储、访问、迁移、处理等过程进行监控,并对各类硬件和服务资源进行动态监测和优化调度。
步骤S220之后,所述方法还包括:
基于预设的电网仿真分析结果检索方法,在所述数据仓库中进行检索,获得检索结果,以实现电网仿真分析知识挖掘。
可选地,所述预设的电网仿真分析结果检索方法包括根据仿真辅助信息进行检索、根据仿真结果中电网关键指标进行检索或根据特定的元件电气状态改变模式进行检索。
具体地,根据仿真辅助信息进行检索,如根据仿真对象、时间、故障类型、算法、操作者、批注等检索相应的仿真算例和结果;根据仿真结果中电网关键指标进行检索,如根据系统稳定性、电压水平和其他指标检索所有相关的算例和结果;根据特定的元件电气状态改变模式进行检索,如根据多条线路的潮流改变模式、关键潮流断面的平衡变化情况,甚至是特定机群间震荡模式进行仿真算例和结果的检索。基于研发的内存数据网格技术,建立电网仿真分析结果缓存库,以实现仿真分析结果快速检索和获取,结合内存数据网格技术和MapReduce算法开发、实施仿真影像数据快速检索方法。开发适用于电网分析数据仓库的工作流引擎。为了实现电网仿真分析知识挖掘,需要依据所存储的仿真分析数据在仿真知识库中开展大量的数据检索和模式识别的作业。工作流引擎可以减少数据处理的编程代价,提高系统并发处理大量任务的能力。任务调度是工作流管理系统的核心部分。工作流任务调度,主要包括任务的分解、资源的定位、资源选择与优化等。工作流调度方法目前有两类:静态调度算法和动态调度算法。本子课题将实施这两种工作流调度算法,支持针对不同应用场景的工作流形态选择静态或者动态工作流调度算法。
可选地,所述电网仿真分析数据还包括原始仿真结果对应提取的特征量,所述特征量包括具有显式物理概念的特征量,所述方法还包括:
基于具有显式物理概念的特征量,筛选所述原始仿真结果中的关键状态变量。
在本实施例中,电力系统有物理概念的特征量可以包括两种不同的类型,其中一种是,利用了特征选取算法得到的,筛选出的状态变量,例如,基于改进的Relief算法对仿真结果数据进行分析,可在10机39节点的算例中选取10个关键的状态变量,如表1所示,KeyVariable为关键状态变量。
表1筛选出的电网关键状态变量
可选地,所述特征量包括无物理概念的特征量。可以利用数据降维数等方法对原始仿真结果进行特征提取,获得无物理概念的特征量。
此外,本实施例利用语义网络的方法,通过建立知识图谱,对电网的知识语义进行了整理。
本发明实施例提供了一种电网仿真分析数据存储方法,应用于一电子设备,所述方法包括获取电网仿真分析数据,所述电网仿真分析数据包括原始仿真结果后,对所述原始仿真结果进行表征描述,获得所述原始仿真结果对应的多层次模型表征信息,然后将所述多层次模型表征信息分布式存储至预设的数据仓库中。该方法节省存储容量,实现有效的数据管理机制。
请参阅图8,本发明实施例提供了一种电网仿真分析数据存储装置400,运行于一电子设备,所述装置400包括获取单元410、表征单元420和存储单元430。
获取单元410用于获取电网仿真分析数据,所述电网仿真分析数据包括原始仿真结果。
所述电网仿真分析数据还包括原始仿真结果对应提取的特征量,所述特征量包括具有显式物理概念的特征量,获取单元410,还用于基于具有显式物理概念的特征量,筛选所述原始仿真结果中的关键状态变量。
表征单元420用于对所述原始仿真结果进行表征描述,获得所述原始仿真结果对应的多层次模型表征信息。
所述原始仿真结果包括多个状态变量和代数变量的时间序列,所述多层次模型表征信息包括符号化表征信息和Bitmap图,所述表征单元420用于:基于预设的时间序列符号化方法对所述时间序列进行表征,获得所述时间序列对应的符号化表征信息;基于Bitmap绘制方法对所述符号化表征信息进行绘制,获得所述时间序列对应的Bitmap图。
存储单元430用于将所述多层次模型表征信息分布式存储至预设的数据仓库中。
存储单元430用于将所述多层次模型表征信息以元数据的格式分布式存储至预设的数据仓库中。
所述装置400还可以包括:
检索单元440用于基于预设的电网仿真分析结果检索方法,在所述数据仓库中进行检索,获得检索结果,以实现电网仿真分析知识挖掘。
可选地,所述预设的电网仿真分析结果检索方法包括根据仿真辅助信息进行检索、根据仿真结果中电网关键指标进行检索或根据特定的元件电气状态改变模式进行检索。
以上各单元可以是由软件代码实现,此时,上述的各单元可存储于存储器102内。以上各单元同样可以由硬件例如集成电路芯片实现。
本发明实施例提供的电网仿真分析数据存储装置400,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。