CN106844076A - 应用于航空状态监测的双控存储服务器 - Google Patents

应用于航空状态监测的双控存储服务器 Download PDF

Info

Publication number
CN106844076A
CN106844076A CN201611193039.5A CN201611193039A CN106844076A CN 106844076 A CN106844076 A CN 106844076A CN 201611193039 A CN201611193039 A CN 201611193039A CN 106844076 A CN106844076 A CN 106844076A
Authority
CN
China
Prior art keywords
storage
control
array module
storage control
mirror
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611193039.5A
Other languages
English (en)
Inventor
颜爱良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
No32 Research Institute Of China Electronics Technology Group Corp
Original Assignee
No32 Research Institute Of China Electronics Technology Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by No32 Research Institute Of China Electronics Technology Group Corp filed Critical No32 Research Institute Of China Electronics Technology Group Corp
Priority to CN201611193039.5A priority Critical patent/CN106844076A/zh
Publication of CN106844076A publication Critical patent/CN106844076A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • G06F11/0739Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种应用于航空状态监测的双控存储服务器,包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。本发明主要解决存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,保证系统的可靠性。

Description

应用于航空状态监测的双控存储服务器
技术领域
本发明涉及一种双控存储服务器,具体地,涉及一种应用于航空状态监测的双控存储服务器。
背景技术
随着计算机技术的飞速发展,存储技术给航空业带来了巨大的便利,数据的价值越来越高,而承载这些数据的存储系统的重要性日益明显。然而存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,会对航空状态监测造成巨大危害,存储系统为此必须提供一系列保证数据可靠性的机制。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种应用于航空状态监测的双控存储服务器,其主要解决存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,保证系统的可靠性。
根据本发明的一个方面,提供一种应用于航空状态监测的双控存储服务器,其特征在于,包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。
优选地,所述第一存储盘阵列模块、第二存储盘阵列模块都使用多块SATA磁盘。
优选地,所述第一存储控制器、第二存储控制器都包括CPU、SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道,SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道都与CPU连接。
与现有技术相比,本发明具有如下的有益效果:本发明主要解决存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,保证系统的可靠性。本发明能在一个存储控制器失效的情况下,仍能对外提供不间断存储服务,并保证了系统运行的连续性和稳定性。同时由于镜像通道以及心跳通道采用了冗余设置以及无线缆连接,提高了整个系统的抗振动、抗干扰能力。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明应用于航空状态监测的双控存储服务器的结构示意图。
图2为第一存储控制器、第二存储控制器的结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本发明应用于航空状态监测的双控存储服务器包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。
该方案中一台存储控制器作为主控制器对外提供服务,另外一台存储控制器只用作数据备份和故障切换。当用户的写数据到达时,存储控制器一方面将数据写入本地设备上的文件系统,同时利用镜像通道将写数据同步到另一台主机的设备上,本地服务器与另一台服务器的数据确保实时同步。如果一台存储控制器节点出现故障,另一台存储控制器上还会保留有一份相同的数据,从而提高系统的可靠性。
第一存储盘阵列模块、第二存储盘阵列模块都使用多块SATA(Serial ATA,串口硬盘)磁盘。磁盘阵列技术即RAID(Redundant Arrays of Independent Disks,磁盘阵列),使用多个廉价磁盘按照一定方式组合在一起,从而达到能够提供高可靠性、高性能、大容量存储系统的目的。同时也希望通过冗余信息和校验信息,使得发生部分磁盘故障时,避免数据丢失和数据损坏,提高数据可靠性。磁盘阵列系统按照磁盘的组织结构方式,划分为不同级别的RAID,条带化RAID0,镜像存储RAID1,RAID2,RAID3,RAID4,RAID5,RAID10等级别,适应不同场合的需求。
第一存储控制器的结构与第二存储控制器的结构相同,第一存储控制器、第二存储控制器都包括CPU101、SAS存储控制单元102、第一万兆光通道103、第二万兆光通道104、第一万兆镜像通道105、第二万兆镜像通道106、心跳通道107、健康管理单元108、配置管理单元109、显示单元110、USB通道111,SAS存储控制单元102、第一万兆光通道103、第二万兆光通道104、第一万兆镜像通道105、第二万兆镜像通道106、心跳通道107、健康管理单元108、配置管理单元109、显示单元110、USB通道111都与CPU101连接。其中:CPU101作为整个存储控制器的主处理器,完成存储系统的高速数据处理、状态控制、资源调度等功能;对外通过第一万兆光通道103和第二万兆光通道104提供iSCSI接口,为客户机提供高速数据存储服务;二个存储控制器的CPU互为冗余,为系统提供连续、高可靠的存储服务。SAS存储控制单元102处理CPU端接收的客户存储服务,对外提供多路SAS接口,可用于连接SAS接口的SSD盘或SATA接口的SSD盘,并实现硬RAID功能。第一万兆光通道103和第二万兆光通道104作为对外高速数据接口,可以提供iSCSI接口,用于存储控制器与客户机之间的高速互连。提供多路万兆光通道是为了提高存储对外数据通道的冗余性,提高系统的可靠性。第一万兆镜像通道105、第二万兆镜像通道106作为双控存储服务器的镜像缓存通道,可以实时同步二个存储控制器之间的存储数据以及CPU状态信息等,任意一路存储控制器出现故障都可以无缝切换到另一路存储控制器上,保证存储服务的连续以及存储数据不丢失。同时采用多路万兆镜像通道是为了提高镜像缓存通道的冗余性,提高系统的可靠。心跳通道107作为双控存储服务器的脉搏,可以使二个存储控制器实时获取对方的状态信息,一旦有一路存储控制器出现故障,都可以通过心跳通道第一时间获知,从而将存储服务切换到另一路存储控制器上。可以采用网口、串口等作为双控服务器的心跳通道,本发明中采用串口和二路万兆镜像通道作为双控服务器的心跳通道,提高了心跳通道的冗余性,从而提高了系统的可靠性。健康管理单元108主要收集存储控制器上的关键电压、关键芯片温度、万兆通道的link状态等信息,并通过其千兆网口实时上报给系统。同时在情况紧急时,接收系统的硬盘销毁命令,对挂载在SAS接口上的存储盘进行逻辑销毁或物理销毁。配置管理单元109通过千兆网口与客户机相连,提供WEB配置界面方便用户对存储系统进行相关配置。显示单元110提供VGA接口,用于连接显示器,方便用户现场查看存储控制器的状态等。USB通道111提供一路USB接口,用于连接鼠标、键盘等USB设备。
本发明能够容忍一个存储控制器发生故障。通过存储控制器的冗余,在单个存储控制器出现故障的情况下,仍能对外提供不间断服务,并保证了系统运行的连续性和稳定性。同时通过数据镜像备份等技术提高了用户的写数据的可靠性,避免造成用户的重要数据丢失或损坏。两个存储控制器通过背板连接实现数据传输及通讯,用于提供高速缓存同步、心跳信号传输、控制器切换等功能。存储控制器与存储盘阵列模块都采用SAS(SAS(Serial Attached SCSI,即串行SCSI技术,是一种磁盘连接技术)通道通过背板相连,为系统提供数据服务。双控制器及背板之间采用无线缆设计,将大大减少信号间的串扰,以及抗振动能力,从而提高整个系统的可靠性。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (3)

1.一种应用于航空状态监测的双控存储服务器,其特征在于,包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。
2.根据权利要求1所述的应用于航空状态监测的双控存储服务器,其特征在于,所述第一存储盘阵列模块、第二存储盘阵列模块都使用多块SATA磁盘。
3.根据权利要求1所述的应用于航空状态监测的双控存储服务器,其特征在于,所述第一存储控制器、第二存储控制器都包括CPU、SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道,SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道都与CPU连接。
CN201611193039.5A 2016-12-21 2016-12-21 应用于航空状态监测的双控存储服务器 Pending CN106844076A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611193039.5A CN106844076A (zh) 2016-12-21 2016-12-21 应用于航空状态监测的双控存储服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611193039.5A CN106844076A (zh) 2016-12-21 2016-12-21 应用于航空状态监测的双控存储服务器

Publications (1)

Publication Number Publication Date
CN106844076A true CN106844076A (zh) 2017-06-13

Family

ID=59135959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611193039.5A Pending CN106844076A (zh) 2016-12-21 2016-12-21 应用于航空状态监测的双控存储服务器

Country Status (1)

Country Link
CN (1) CN106844076A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419904A (zh) * 2021-06-11 2021-09-21 长沙乐藤信息技术有限公司 高可用双控记录存储服务器
WO2021254290A1 (zh) * 2020-06-19 2021-12-23 华为技术有限公司 一种存储系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045688A (zh) * 2015-08-17 2015-11-11 山东超越数控电子有限公司 一种带管理功能的双活双控存储系统
CN105653213A (zh) * 2016-03-24 2016-06-08 浪潮集团有限公司 一种基于Freescale P3041的双控磁盘阵列

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045688A (zh) * 2015-08-17 2015-11-11 山东超越数控电子有限公司 一种带管理功能的双活双控存储系统
CN105653213A (zh) * 2016-03-24 2016-06-08 浪潮集团有限公司 一种基于Freescale P3041的双控磁盘阵列

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021254290A1 (zh) * 2020-06-19 2021-12-23 华为技术有限公司 一种存储系统
EP4148578A4 (en) * 2020-06-19 2023-11-01 Huawei Technologies Co., Ltd. STORAGE SYSTEM
CN113419904A (zh) * 2021-06-11 2021-09-21 长沙乐藤信息技术有限公司 高可用双控记录存储服务器

Similar Documents

Publication Publication Date Title
US10191669B2 (en) Redundant SAS storage virtualization subsystem and system using the same and method therefor
US9697087B2 (en) Storage controller to perform rebuilding while copying, and storage system, and control method thereof
US8020035B2 (en) Expander circuit for a solid state persistent storage device that provides a plurality of interfaces to corresponding storage controllers
US6202115B1 (en) Fault tolerant redundant bus bridge systems and methods
US8812902B2 (en) Methods and systems for two device failure tolerance in a RAID 5 storage system
US20090271659A1 (en) Raid rebuild using file system and block list
US8943258B2 (en) Server direct attached storage shared through virtual SAS expanders
US9448735B1 (en) Managing storage device rebuild in data storage systems
TWI765129B (zh) 儲存系統
WO2018103533A1 (zh) 一种故障处理的方法、装置和设备
US9223658B2 (en) Managing errors in a raid
US7356728B2 (en) Redundant cluster network
US20070050544A1 (en) System and method for storage rebuild management
US20150370494A1 (en) Redundant storage system
US7082390B2 (en) Advanced storage controller
US9792056B1 (en) Managing system drive integrity in data storage systems
CN105872031B (zh) 存储系统
US7506200B2 (en) Apparatus and method to reconfigure a storage array disposed in a data storage system
US7650463B2 (en) System and method for RAID recovery arbitration in shared disk applications
US8381027B1 (en) Determining alternate paths in faulted systems
CN106844076A (zh) 应用于航空状态监测的双控存储服务器
US20080126850A1 (en) System and Method of Repair Management for RAID Arrays
US7975104B2 (en) Method for preserving data integrity by breaking the redundant array of independent disks level 1(RAID1)
Dell
KR20110030002A (ko) 활성-활성 멀티플렉싱 유닛 또는 포트 선택자 유닛을 가지는 네트워크 직접 연결 저장 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170613

RJ01 Rejection of invention patent application after publication