CN106844076A - 应用于航空状态监测的双控存储服务器 - Google Patents
应用于航空状态监测的双控存储服务器 Download PDFInfo
- Publication number
- CN106844076A CN106844076A CN201611193039.5A CN201611193039A CN106844076A CN 106844076 A CN106844076 A CN 106844076A CN 201611193039 A CN201611193039 A CN 201611193039A CN 106844076 A CN106844076 A CN 106844076A
- Authority
- CN
- China
- Prior art keywords
- storage
- control
- array module
- storage control
- mirror
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 12
- 230000003287 optical effect Effects 0.000 claims description 17
- 230000009977 dual effect Effects 0.000 claims description 15
- 230000036541 health Effects 0.000 claims description 7
- 230000006378 damage Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0736—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
- G06F11/0739—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function in a data processing system embedded in automotive or aircraft systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种应用于航空状态监测的双控存储服务器,包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。本发明主要解决存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,保证系统的可靠性。
Description
技术领域
本发明涉及一种双控存储服务器,具体地,涉及一种应用于航空状态监测的双控存储服务器。
背景技术
随着计算机技术的飞速发展,存储技术给航空业带来了巨大的便利,数据的价值越来越高,而承载这些数据的存储系统的重要性日益明显。然而存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,会对航空状态监测造成巨大危害,存储系统为此必须提供一系列保证数据可靠性的机制。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种应用于航空状态监测的双控存储服务器,其主要解决存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,保证系统的可靠性。
根据本发明的一个方面,提供一种应用于航空状态监测的双控存储服务器,其特征在于,包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。
优选地,所述第一存储盘阵列模块、第二存储盘阵列模块都使用多块SATA磁盘。
优选地,所述第一存储控制器、第二存储控制器都包括CPU、SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道,SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道都与CPU连接。
与现有技术相比,本发明具有如下的有益效果:本发明主要解决存储系统不可预知的服务器故障、系统崩溃、硬盘损坏等突发事故,保证系统的可靠性。本发明能在一个存储控制器失效的情况下,仍能对外提供不间断存储服务,并保证了系统运行的连续性和稳定性。同时由于镜像通道以及心跳通道采用了冗余设置以及无线缆连接,提高了整个系统的抗振动、抗干扰能力。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明应用于航空状态监测的双控存储服务器的结构示意图。
图2为第一存储控制器、第二存储控制器的结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本发明应用于航空状态监测的双控存储服务器包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。
该方案中一台存储控制器作为主控制器对外提供服务,另外一台存储控制器只用作数据备份和故障切换。当用户的写数据到达时,存储控制器一方面将数据写入本地设备上的文件系统,同时利用镜像通道将写数据同步到另一台主机的设备上,本地服务器与另一台服务器的数据确保实时同步。如果一台存储控制器节点出现故障,另一台存储控制器上还会保留有一份相同的数据,从而提高系统的可靠性。
第一存储盘阵列模块、第二存储盘阵列模块都使用多块SATA(Serial ATA,串口硬盘)磁盘。磁盘阵列技术即RAID(Redundant Arrays of Independent Disks,磁盘阵列),使用多个廉价磁盘按照一定方式组合在一起,从而达到能够提供高可靠性、高性能、大容量存储系统的目的。同时也希望通过冗余信息和校验信息,使得发生部分磁盘故障时,避免数据丢失和数据损坏,提高数据可靠性。磁盘阵列系统按照磁盘的组织结构方式,划分为不同级别的RAID,条带化RAID0,镜像存储RAID1,RAID2,RAID3,RAID4,RAID5,RAID10等级别,适应不同场合的需求。
第一存储控制器的结构与第二存储控制器的结构相同,第一存储控制器、第二存储控制器都包括CPU101、SAS存储控制单元102、第一万兆光通道103、第二万兆光通道104、第一万兆镜像通道105、第二万兆镜像通道106、心跳通道107、健康管理单元108、配置管理单元109、显示单元110、USB通道111,SAS存储控制单元102、第一万兆光通道103、第二万兆光通道104、第一万兆镜像通道105、第二万兆镜像通道106、心跳通道107、健康管理单元108、配置管理单元109、显示单元110、USB通道111都与CPU101连接。其中:CPU101作为整个存储控制器的主处理器,完成存储系统的高速数据处理、状态控制、资源调度等功能;对外通过第一万兆光通道103和第二万兆光通道104提供iSCSI接口,为客户机提供高速数据存储服务;二个存储控制器的CPU互为冗余,为系统提供连续、高可靠的存储服务。SAS存储控制单元102处理CPU端接收的客户存储服务,对外提供多路SAS接口,可用于连接SAS接口的SSD盘或SATA接口的SSD盘,并实现硬RAID功能。第一万兆光通道103和第二万兆光通道104作为对外高速数据接口,可以提供iSCSI接口,用于存储控制器与客户机之间的高速互连。提供多路万兆光通道是为了提高存储对外数据通道的冗余性,提高系统的可靠性。第一万兆镜像通道105、第二万兆镜像通道106作为双控存储服务器的镜像缓存通道,可以实时同步二个存储控制器之间的存储数据以及CPU状态信息等,任意一路存储控制器出现故障都可以无缝切换到另一路存储控制器上,保证存储服务的连续以及存储数据不丢失。同时采用多路万兆镜像通道是为了提高镜像缓存通道的冗余性,提高系统的可靠。心跳通道107作为双控存储服务器的脉搏,可以使二个存储控制器实时获取对方的状态信息,一旦有一路存储控制器出现故障,都可以通过心跳通道第一时间获知,从而将存储服务切换到另一路存储控制器上。可以采用网口、串口等作为双控服务器的心跳通道,本发明中采用串口和二路万兆镜像通道作为双控服务器的心跳通道,提高了心跳通道的冗余性,从而提高了系统的可靠性。健康管理单元108主要收集存储控制器上的关键电压、关键芯片温度、万兆通道的link状态等信息,并通过其千兆网口实时上报给系统。同时在情况紧急时,接收系统的硬盘销毁命令,对挂载在SAS接口上的存储盘进行逻辑销毁或物理销毁。配置管理单元109通过千兆网口与客户机相连,提供WEB配置界面方便用户对存储系统进行相关配置。显示单元110提供VGA接口,用于连接显示器,方便用户现场查看存储控制器的状态等。USB通道111提供一路USB接口,用于连接鼠标、键盘等USB设备。
本发明能够容忍一个存储控制器发生故障。通过存储控制器的冗余,在单个存储控制器出现故障的情况下,仍能对外提供不间断服务,并保证了系统运行的连续性和稳定性。同时通过数据镜像备份等技术提高了用户的写数据的可靠性,避免造成用户的重要数据丢失或损坏。两个存储控制器通过背板连接实现数据传输及通讯,用于提供高速缓存同步、心跳信号传输、控制器切换等功能。存储控制器与存储盘阵列模块都采用SAS(SAS(Serial Attached SCSI,即串行SCSI技术,是一种磁盘连接技术)通道通过背板相连,为系统提供数据服务。双控制器及背板之间采用无线缆设计,将大大减少信号间的串扰,以及抗振动能力,从而提高整个系统的可靠性。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (3)
1.一种应用于航空状态监测的双控存储服务器,其特征在于,包括第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块、背板,第一存储控制器和第二存储控制器之间设立数据镜像通道,第一存储控制器、第二存储控制器、第一存储盘阵列模块、第二存储盘阵列模块都与背板连接。
2.根据权利要求1所述的应用于航空状态监测的双控存储服务器,其特征在于,所述第一存储盘阵列模块、第二存储盘阵列模块都使用多块SATA磁盘。
3.根据权利要求1所述的应用于航空状态监测的双控存储服务器,其特征在于,所述第一存储控制器、第二存储控制器都包括CPU、SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道,SAS存储控制单元、第一万兆光通道、第二万兆光通道、第一万兆镜像通道、第二万兆镜像通道、心跳通道、健康管理单元、配置管理单元、显示单元、USB通道都与CPU连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611193039.5A CN106844076A (zh) | 2016-12-21 | 2016-12-21 | 应用于航空状态监测的双控存储服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611193039.5A CN106844076A (zh) | 2016-12-21 | 2016-12-21 | 应用于航空状态监测的双控存储服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106844076A true CN106844076A (zh) | 2017-06-13 |
Family
ID=59135959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611193039.5A Pending CN106844076A (zh) | 2016-12-21 | 2016-12-21 | 应用于航空状态监测的双控存储服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106844076A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113419904A (zh) * | 2021-06-11 | 2021-09-21 | 长沙乐藤信息技术有限公司 | 高可用双控记录存储服务器 |
WO2021254290A1 (zh) * | 2020-06-19 | 2021-12-23 | 华为技术有限公司 | 一种存储系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045688A (zh) * | 2015-08-17 | 2015-11-11 | 山东超越数控电子有限公司 | 一种带管理功能的双活双控存储系统 |
CN105653213A (zh) * | 2016-03-24 | 2016-06-08 | 浪潮集团有限公司 | 一种基于Freescale P3041的双控磁盘阵列 |
-
2016
- 2016-12-21 CN CN201611193039.5A patent/CN106844076A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045688A (zh) * | 2015-08-17 | 2015-11-11 | 山东超越数控电子有限公司 | 一种带管理功能的双活双控存储系统 |
CN105653213A (zh) * | 2016-03-24 | 2016-06-08 | 浪潮集团有限公司 | 一种基于Freescale P3041的双控磁盘阵列 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021254290A1 (zh) * | 2020-06-19 | 2021-12-23 | 华为技术有限公司 | 一种存储系统 |
EP4148578A4 (en) * | 2020-06-19 | 2023-11-01 | Huawei Technologies Co., Ltd. | STORAGE SYSTEM |
CN113419904A (zh) * | 2021-06-11 | 2021-09-21 | 长沙乐藤信息技术有限公司 | 高可用双控记录存储服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10191669B2 (en) | Redundant SAS storage virtualization subsystem and system using the same and method therefor | |
US9697087B2 (en) | Storage controller to perform rebuilding while copying, and storage system, and control method thereof | |
US8020035B2 (en) | Expander circuit for a solid state persistent storage device that provides a plurality of interfaces to corresponding storage controllers | |
US6202115B1 (en) | Fault tolerant redundant bus bridge systems and methods | |
US8812902B2 (en) | Methods and systems for two device failure tolerance in a RAID 5 storage system | |
US20090271659A1 (en) | Raid rebuild using file system and block list | |
US8943258B2 (en) | Server direct attached storage shared through virtual SAS expanders | |
US9448735B1 (en) | Managing storage device rebuild in data storage systems | |
TWI765129B (zh) | 儲存系統 | |
WO2018103533A1 (zh) | 一种故障处理的方法、装置和设备 | |
US9223658B2 (en) | Managing errors in a raid | |
US7356728B2 (en) | Redundant cluster network | |
US20070050544A1 (en) | System and method for storage rebuild management | |
US20150370494A1 (en) | Redundant storage system | |
US7082390B2 (en) | Advanced storage controller | |
US9792056B1 (en) | Managing system drive integrity in data storage systems | |
CN105872031B (zh) | 存储系统 | |
US7506200B2 (en) | Apparatus and method to reconfigure a storage array disposed in a data storage system | |
US7650463B2 (en) | System and method for RAID recovery arbitration in shared disk applications | |
US8381027B1 (en) | Determining alternate paths in faulted systems | |
CN106844076A (zh) | 应用于航空状态监测的双控存储服务器 | |
US20080126850A1 (en) | System and Method of Repair Management for RAID Arrays | |
US7975104B2 (en) | Method for preserving data integrity by breaking the redundant array of independent disks level 1(RAID1) | |
Dell | ||
KR20110030002A (ko) | 활성-활성 멀티플렉싱 유닛 또는 포트 선택자 유닛을 가지는 네트워크 직접 연결 저장 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170613 |
|
RJ01 | Rejection of invention patent application after publication |