一种电力大数据弹性云计算存储平台架构方法
技术领域
本发明涉及一种云计算存储领域,尤其涉及一种电力大数据弹性云计算存储平台架构方法。
背景技术
随着现代计算、通信和网络计算的发展,电力系统的互联程度和远距离输电系统的不断进步,能覆盖一个甚至多个大型区域的大规模电力系统正在不断地出现;伴随着电力系统规模的不断扩大和结构的越趋复杂,对于系统安全的评估、安全与经济运行、系统控制将变得越来越困难;此外,最近2年在世界范围内成为热潮的电力系统“智能化”趋势也给现有的电力系统分析计算和控制工具带来了极大挑战;但是,现有的大数据存储平台对于电力大数据的存储并不适合,导致电力大数据在使用时出现调用慢、计算慢等问题。
发明内容
本发明的目的是提供一种电力大数据弹性云计算存储平台架构方法,为智能电网大数据提供了一种新型的存储技术方法,解决了电力大数据在使用时调用慢、计算慢的问题
为了解决上述问题,本发明采用下述方法方案:
一种电力大数据弹性云计算存储平台架构方法,包括以下步骤:
A:搭建基于云计算存储平台底层架构,包括以下步骤:
A1:在本地物理机器上,创建不少于两台的可长时间运行虚拟机;
A2:将本地存储分别挂载到对应虚拟机;
A3:禁用不同虚拟机之间由于负载均衡引起的数据迁移策略;
A4:为同一台物理机器上运行的所有虚拟机,指定为相同的rack值;
A5:将Hadoop平台安装到虚拟机上;
B:搭建基于云计算存储平台高层架构,包括以下步骤;
B1:使用单个控制节点运行OpenStack的核心服务;
B2:使用多台计算节点运行OpenStack NOVA计算服务,每台计算节点上构建多台虚拟机;
B3:使用OpenStack中根磁盘类型,运行Hadoop架构中的HDFS组件;
B4:通过异步执行的后台任务定期地对根磁盘中的数据进行快照;
C:将基于云存储平台架磁盘分区。
所述的步骤C包括以下步骤:
C1:将基于云计算存储平台架构磁盘分区;
C2:增加一个与OpenStack中libvirt_images_volume_group类似的标志libvirt_localpersistent_volume_group,用来指定计算节点包含local_persistent卷;
C3:创建一个过滤器,以保证管理员能够利用过滤器调度控制仅在包含local_persistent的计算节点上启动长期运行的Hadoop虚拟机;
C4:修改Hadoop虚拟机本身的初始化序列,以避免对其连接的本地local_persistent磁盘进行格式化;
C5:通过常用的OpenStack访问控制机制来对这些卷进行访问。
步骤B2中所述的计算节点都采用了英特尔至强E3-1220 V2 @ 3.10GHz、8MB缓存、16 GB内存和1 TB硬盘的硬件配置;不同的节点之间通过两个不同的1G网络进行连接; 其中,一个1G网络用于OpenStack服务间的彼此通信;而另一个1G网络用于将计算节点连接到公共网络。
步骤B1中所述的OpenStack的核心服务包括Keystone,Glance,Cinder和Quantum;其中Cinder组件提供了卷管理服务,并将控制节点上生成的卷通过iSCSI协议连接到其他的虚拟机节点。
本发明所述的电力大数据弹性云计算存储平台架构方法通过设计基于云计算存储平台架构和磁盘分区方案,提供了一种新型的电力大数据弹性云计算存储平台架构方法,提供了一种易实现、易扩展、功能丰富的云基础架构解决方案;本发明所述的电力大数据弹性云计算存储平台架构方法提供的弹性云计算存储平台架构还能够为智能电网大数据提供了一种新型的存储方法,解决了电力大数据在使用时调用慢、计算慢的问题。
附图说明
图1为本发明所述的电力大数据弹性云计算存储平台架构方法的流程示意图;
图2为本发明所述搭建基于云计算存储平台高层架构的结构示意图;
图3为本发明所述计算节点的结构示意图。
具体实施方式
如图1至图3所示,本发明所述的电力大数据弹性云计算存储平台架构方法,包括以下步骤:
A:搭建基于云计算存储平台底层架构,包括以下步骤:
A1:在本地物理机器上,创建不少于两台的可长时间运行虚拟机;
A2:将本地存储分别挂载到对应虚拟机;
对于云计算系统,数据存储的主要制约因素是存储在本地的数据存储不是永久性的,将本地存储挂载到虚拟机上,并使用长时间运行的虚拟机能够保证本地存储可以提供较长时间的可用性;
A3:禁用不同虚拟机之间由于负载均衡引起的数据迁移策略;
对于云计算系统中常用的虚拟机迁移的负载平衡,由于其并没有将数据存放的位置因素考虑在内,因此不同虚拟机之间由于负载均衡引起的数据迁移策略应该被禁用;
A4:为同一台物理机器上运行的所有虚拟机,指定为相同的rack值;
由于在云计算系统中,包含同一个文件副本的多台虚拟机,有可能被调度在相同的物理机器上,为了保证Hadoop的复制功能不被破坏,我们使用Hadoop的rack awareness属性配置将同一台物理机器上运行的所有Hadoop虚拟机指定为相同的rack值,保证不同的物理机器上存在不同的数据副本。
A5:将Hadoop平台安装到虚拟机上;进入下一步;
B:搭建基于云计算存储平台高层架构,包括以下步骤:
B1:使用单个控制节点运行OpenStack的核心服务;
步骤B1中所述的OpenStack的核心服务包括Keystone,Glance,Cinder和Quantum;其中Cinder组件提供了卷管理服务,并将控制节点上生成的卷通过iSCSI协议连接到其他的虚拟机节点;
B2:使用多台计算节点运行OpenStack NOVA计算服务,每台计算节点上构建多台虚拟机;
每个计算节点都采用了英特尔至强E3-1220 V2 @ 3.10GHz,8MB缓存,16 GB内存和1 TB硬盘的硬件配置;不同的节点之间通过两个不同的1G网络进行连接; 其中,一个1G网络用于OpenStack服务间的彼此通信;而另一个1G网络用于将计算节点连接到公共网络;整个系统用OpenStack生成了大量长期运行的Hadoop虚拟机,这些虚拟机整体构成了与Hadoop集群类似的系统架构,其中每个虚拟机都类似于Hadoop集群的单个节点,与直接硬件构成的Hadoop集群相比,由于空闲的虚拟机并不会占用太多的硬件资源,因而,通过虚拟机的方式生成大于需求数量的Hadoop节点,并不会造成太大的性能影响;
B3:使用OpenStack中根磁盘类型,运行Hadoop架构中的HDFS组件;
在OpenStack架构中一共包含三种类型的存储:根磁盘,短暂磁盘和持久磁盘;其中,一台虚拟机的根磁盘是直接驻留在宿主机器而不附着于网络上,这也意味着其不依赖于网络延迟和带宽的影响;短暂磁盘的数据是非持久化的;持久磁盘是通过网络依附于OpenStack卷服务的持久化存储,其使用和性能都受到网络环境的影响;针对根磁盘,短暂磁盘和持久磁盘存储类型的特点,我们选择使用根磁盘类型来运行Hadoop架构中的HDFS组件,如图2所示,这样在运行实际Hadoop任务时能够避免数据通过网络进行传输带来的延迟影响;
B4:通过异步执行的后台任务定期地对根磁盘中的数据进行快照;
由于根磁盘类型存储不具有持续性,即存储在根磁盘的数据在虚拟机终止之后将会丢失,因此需要定期地对根磁盘中的数据进行快照,如果虚拟机崩溃,存储在根磁盘中的数据并不会立即消失,如果虚拟机能够进行快速重新启动,存储将不会丢失;进入下一步;
C:将基于云存储平台架构的磁盘分区,包括以下步骤:
在OpenStack架构中,无论是根磁盘或者短暂磁盘的具体实现方式均是在本地存储的一个文件;传统的磁盘使用方案是将本地存储磁盘进行分区,并将单个或者多个的分区附着到Hadoop虚拟机;但是,将本地存储磁盘进行分区的方案由于将静态地将磁盘的分区专用于Hadoop虚拟机,当存储数据需求需要对磁盘进行收缩或增长时,将本地存储磁盘进行分区的方案由于灵活性不足,并不能实现,因此提供一种基于云存储平台架构磁盘分区方案,包括以下步骤:
C1:将基于云存储平台的磁盘分区存储方案命名为local_persistent;
C2:增加一个与OpenStack中libvirt_images_volume_group类似的标志libvirt_localpersistent_volume_group,用来指定计算节点包含local_persistent卷;
OpenStack包含一个libvirt_images_volume_group配置标记,libvirt_images_volume_group配置标记用来指定在每个计算节点中包含的短暂磁盘卷组;增加一个类似的标志libvirt_localpersistent_volume_group用来指定包含local_persistent卷,以保证能够通过常用的OpenStack访问控制机制来对local_persistent卷进行访问;
C3:创建一个过滤器,以保证管理员能够利用过滤器调度控制仅在包含local_persistent的计算节点上启动长期运行的Hadoop虚拟机;
C4:修改Hadoop虚拟机本身的初始化序列,以避免对其连接的本地local_persistent磁盘进行格式化;
C5:通过常用的OpenStack访问控制机制来对这些卷进行访问。
本发明所述的电力大数据弹性云计算存储平台架构方法通过设计基于云计算存储平台架构和磁盘分区方案,提供了一种新型的电力大数据弹性云计算存储平台架构方法,提供了一种易实现、易扩展、功能丰富的云基础架构解决方案;本发明所述的电力大数据弹性云计算存储平台架构方法提供的弹性云计算存储平台架构还能够为智能电网大数据提供了一种新型的存储方法,解决了电力大数据在使用时调用慢、计算慢的问题。