CN1296845C - 一种磁盘存储系统 - Google Patents

一种磁盘存储系统 Download PDF

Info

Publication number
CN1296845C
CN1296845C CNB031024637A CN03102463A CN1296845C CN 1296845 C CN1296845 C CN 1296845C CN B031024637 A CNB031024637 A CN B031024637A CN 03102463 A CN03102463 A CN 03102463A CN 1296845 C CN1296845 C CN 1296845C
Authority
CN
China
Prior art keywords
processing unit
passage
disk
protocol processing
high speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB031024637A
Other languages
English (en)
Other versions
CN1519736A (zh
Inventor
郑珉
胡鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB031024637A priority Critical patent/CN1296845C/zh
Publication of CN1519736A publication Critical patent/CN1519736A/zh
Application granted granted Critical
Publication of CN1296845C publication Critical patent/CN1296845C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本发明公开了一种磁盘存储系统,至少包括主机接口模块、高速缓存、磁盘接口和磁盘阵列,其中所述主机接口模块包括具有交换功能的主机接口通道和一个以上的协议处理单元,每个外部主机通过主机接口通道与每个协议处理单元连接;进一步包括用于协议处理单元与磁盘接口间信息传输具有交换功能的内部高速通道;每个协议处理单元通过内部高速通道与每个磁盘接口连接,且每个磁盘接口上挂接有高速缓存;磁盘接口与磁盘阵列相连。该存储系统通过采用分布式结构,分级处理、业务负荷分担工作模式,消除了带宽瓶颈,提高数据传输速度,并增加保护机制,提高系统可靠性。

Description

一种磁盘存储系统
技术领域
本发明涉及计算机存储设备领域,特别是涉及一种高效的磁盘存储系统。
背景技术
随着计算机应用领域的不断拓展,用户对于磁盘存储系统的性能要求也在日益提高。希望其具有更大的容量、更快的速度、以及更高的可靠性和可用性。针对这一挑战,人们找到了用多个磁盘驱动器组成独立冗余磁盘阵列(RAID)来获取高的传输率和大的存储容量的办法。并且现在随着存储数据容量增长和对可靠性的要求越来越高,存储系统已从主机的附属外设,向多主机共享的集中存储方式发展。
现有的大容量RAID磁盘阵列存储系统的结构参见图1所示,主要包括与外部主机相连的主机接口101、高速缓存102和磁盘阵列103三部分。主机接口101、高速缓存102以及用于连接磁盘阵列103的磁盘接口104通过同一根共享总线105连接。
该系统的具体内部结构可参见图2所示。若干个主机接口101、高速缓存102和磁盘接口104挂接在同一条内部共享总线105上。主机接口101通过系统外部的存储交换机201与主机连接。并且每个主机接口101都含有独立的协议处理器,用于处理主机对磁盘的访问请求。其详细结构参见图3所示,主机接口101中主要包括协议处理器301和目标器302,外部主机上的主机适配卡303中含有启动器304,协议处理器301通过目标器302和启动器304实现与外部主机之间的信息交互。
然而这种结构存储系统的缺点是:由于所有系统内部的信息交互都是通过同一根共享总线进行,因此很容易形成带宽瓶颈。要解决高速缓存访问带宽瓶颈问题,需要提供很大的总线带宽和强大的处理能力,则造成系统结构复杂,成本很高。
系统的主机接口需要通过交换机与系统外部的主机连接,否则每个主机接口只能处理与之相连链路上的主机磁盘访问请求,一方面使系统的使用成本增加,而另一方面协议处理器利用率低、故障率高,当一个协议处理器出现故障时,与之相连的主机端口的业务将中断。
高速缓存集中放置,不利于对高速缓存的管理及数据保护,并且所有主机接口及磁盘接口都要能够对高速缓存进行高速访问,容易形成带宽瓶颈,要解决高速缓存访问带宽瓶颈问题,需要提供很大的总线带宽和强大的处理能力,而这会造成系统结构复杂和成本增加。
发明内容
有鉴于此,本发明的目的在于提供一种高效的存储系统,使其能够提高设备利用率,消除带宽瓶颈,提高数据传输速度,并增加保护机制,提高系统可靠性。
一种磁盘存储系统,至少包括主机接口模块、高速缓存、磁盘接口和磁盘阵列,其中所述主机接口模块包括具有交换功能的主机接口通道和一个以上的协议处理单元,每个外部主机通过主机接口通道与每个协议处理单元连接;且进一步包括用于协议处理单元与磁盘接口间信息传输具有交换功能的内部高速通道;每个协议处理单元通过内部高速通道与每个磁盘接口连接,且每个磁盘接口上挂接有高速缓存;磁盘接口与磁盘阵列相连。
该存储系统所述主机接口通道与协议处理单元之间通过双路径连接。
该存储系统所述主机接口模块包括两个互为独立的主机接口通道,每个主机接口通道均与所有协议处理单元连接。
该存储系统所述协议处理单元与内部高速通道之间通过双路径连接,内部高速通道与磁盘接口之间通过双路径连接。
该存储系统所述内部高速通道为两个互为独立的内部高速通道,每个内部高速通道与所有协议处理单元连接,且每个内部高速通道与所有磁盘接口连接。
该存储系统所述磁盘接口两两成对配置,每对磁盘接口上的高速缓存互为镜像,互为镜像的高速缓存互相保存一份镜像数据。
该存储系统所述磁盘接口的对数为4~8对。
该存储系统所述主机接口通道为高速交换网设备。
该存储系统所述内部高速通道为高速交换网设备。
该存储系统所述高速交换网设备为光纤通道交换机。
该存储系统所述协议处理单元包括用于处理主机访问请求的协议处理器,与外部主机进行信息交互的目标器,及与磁盘接口进行信息交互的启动器,目标器和启动器连接在协议处理器上,国标器与主机接口通道连接,启动器与内部高速通道连接。
该存储系统所述协议处理单元含有两个目标器和启动器,两个目标器分别连接在主机接口通道与协议处理单元之间的两条路径上,两个协议处理器分别连接在协议处理单元与内部高速通道之间的两条路径上。
该存储系统所述磁盘接口含有两个与协议处理单元进行信息交互的目标器,两个目标器分别连接在内部高速通道与磁盘接口之间的两条路径上。
由上述方案可以看出,本发明所提供的一种磁盘存储系统采用分布式结构,分级处理、业务负荷分担模式,每个协议处理单元被所有主机访问端口共享,提高了协议处理的效率,扩展主机端口数。分布式高速缓存,降低了高速缓存的管理及数据保护的复杂性,通过磁盘接口单元内部总线对高速缓存进行访问,不占用系统带宽,降低了系统总线带宽的压力,简化了系统结构,提高了性能。
附图说明
图1为现有技术中存储系统的结构示意图;
图2为现有技术中存储系统的详细结构图;
图3为现有技术中主机接口的内部结构图;
图4为本发明的磁盘存储系统结构示意图;
图5为本发明的协议处理单元结构示意图;
图6为本发明的高速缓存分布式结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
本发明的高效存储系统的结构参见图4所示。包括:主机接口模块401、内部高速通道402、磁盘接口模块403和磁盘阵列103。
其中,主机接口模块401中包括主机接口通道404和协议处理单元405。主机接口通道404是高速交换网络设备,可以与多个不同类型主机的接口相连。同时主机接口通道404采用双路径冗余设计,如图4所示,物理上采用两条独立的主机接口通道404,每个主机接口通道404都单独连接所有内部协议处理单元405,即主机接口通道404与每个协议处理单元405之间都通过两条相互独立的路径连接,两条路径之间没有公共部分,采用负荷分担方式工作,同时为确保通道路径的冗余设计,每条路径的带宽可以满足本业务单元的全部业务,当一条路径中断时,业务可全部走另一条路径。
主机对磁盘的访问请求经过主机接口通道分配到各协议处理单元405处理,主机接口模块401中可以配置多个协议处理单元405,协议处理单元405与外部主机的接口卡之间没有一一对应的关系,所有协议处理单元405都可被所有主机共享;采用全冗余负荷分担方式工作,各主机的访问请求由各协议处理单元405分担处理,任何一个业务单元故障,其本身的业务都可以由其它业务单元承担;并可以通过增加协议处理单元405的配置数量,来提高主机访问性能,实现RAID系统性能扩容。
协议处理单元405的内部结构参见图5所示,主要包括:目标器302、启动器304和协议处理器301。由于业务单元间采用双路径的结构,因此本发明中协议处理单元405需要两组目标器302和启动器304,并且将在下文中提到的磁盘接口406上的目标器302也应是两个。主机适配卡303是插在系统外部主机中的接口卡,当主机访问磁盘阵列103的时,主机适配卡303上的启动器304发出访问命令,在协议处理单元405中的目标器302收到命令后,将访问命令发送到协议处理器301,协议处理器301是一个高性能的CPU,由CPU对主机命令协议进行翻译处理后,送到协议处理单元405的启动器304,在经内部高速通道402发送到磁盘接口406的目标器302,通过磁盘接口406对磁盘进行读写操作。
另外,本发明中主机与主机接口通道404之间也可采用双路径连接,其连接关系及工作方式也与上述主机接口通道404和协议处理单元405之间的双路径结构相同,只是在每个主机中需要相应的配备两个主机适配卡303。
参见图4,内部高速通道402是实现主机接口模块401与磁盘接口模块403之间无阻塞通信的冗余通道。它与各业务单元之间的连接方式及内部结构都与主机接口通道404类似。同样采用两个独立的内部高速通道402,每条内部高速通道402都单独与所有主机接口模块401中的协议处理单元405和磁盘接口模块403中的磁盘接口406相连,路径之间相互独立、负荷分担、并可以替换,可实现路径间相互保护。内部高速通道402与主机接口通道404的内部结构也基本相同,均采用高速交换网络设备,如光纤通道交换机等,在本发明中内部高速通道402和主机接口通道404采用自行设计制作的高速交换网板。
磁盘接口模块403用于完成磁盘的IO操作,包括:磁盘接口406和高速缓存407。磁盘接口406成对配置,每个磁盘接口406上挂接一个大容量高速缓存407共同成为磁盘接口单元,且每对磁盘接口406上的两个高速缓存中的数据互为镜像,互相保存一份镜像数据,作为备份,防止因单个磁盘接口单元403故障而造成数据丢失。
磁盘接口406的数量可以根据磁盘数量的多少任意配置,磁盘接口406与主机接口模块401中的协议处理单元405之间没有一一对应的关系,根据磁盘阵列103的规模和主机磁盘访问性能要求,可以增加磁盘接口单元的数量,以实现磁盘阵列103的扩容。图4中只示出了一对磁盘接口406组成的磁盘接口对,含多个磁盘接口对的磁盘接口模块403参见图6所示。图6中画出了三个磁盘接口对601,在具体实施中4~8个磁盘接口对601比较合适。高速缓存407采用分布式结构,分布在每个磁盘接口单元中,用于主机高速访问性能要求和磁盘低速的机械操作之间的缓冲,以实现高速磁盘访问。磁盘接口406对高速缓存的访问通过其内部总线,不占用系统带宽。
当主机发出磁盘阵列103访问命令,通过主机接口通道分配给协议处理单元405,经过协议处理单元405处理后,经内部高速通道402将指令发送给磁盘接口模块403,再由磁盘接口模块403对磁盘阵列103进行读写操作。对于写指令操作,将磁盘接口406接收的数据先保存在该磁盘接口406挂接的高速缓存407,再由磁盘接口406将数据写入磁盘阵列103;对于读指令操作,磁盘接口406先将数据从磁盘阵列103中读出,保存在所挂接的高速缓存407,再将数据传送给外部主机。
在本发明实施例中主机接口通道和内部高速通道采用光纤通道协议工作,协议处理单元和磁盘接口采用SCSI协议。当系统的某个业务单元或连接路径出现故障时,与之相关的业务单元将会收到告警,同时根据告警信息,自动将业务处理转移到正常工作的业务模块或连接路径,以实现故障隔离与业务的自动恢复。
本发明的技术方案采用分布式结构,分级处理、业务负荷分担模式。系统结构包括主机接口、内部高速通道、磁盘接口。可实现体系结构无单点故障,系统故障自动隔离和自动恢复。

Claims (13)

1、一种磁盘存储系统,至少包括主机接口模块、高速缓存、磁盘接口和磁盘阵列,其特征在于:
所述主机接口模块包括具有交换功能的主机接口通道和一个以上的协议处理单元,每个外部主机通过主机接口通道与每个协议处理单元连接;
进一步包括用于协议处理单元与磁盘接口间信息传输具有交换功能的内部高速通道;
每个协议处理单元通过内部高速通道与每个磁盘接口连接,且每个磁盘接口上挂接有高速缓存;
磁盘接口与磁盘阵列相连。
2、根据权利要求1所述的存储系统,其特征在于所述主机接口通道与协议处理单元之间通过双路径连接。
3、根据权利要求2所述的存储系统,其特征在于所述主机接口模块包括两个互为独立的主机接口通道,每个主机接口通道均与所有协议处理单元连接。
4、根据权利要求1所述的存储系统,其特征在于所述协议处理单元与内部高速通道之间通过双路径连接,内部高速通道与磁盘接口之间通过双路径连接。
5、根据权利要求4所述的存储系统,其特征在于所述内部高速通道为两个互为独立的内部高速通道,每个内部高速通道与所有协议处理单元连接,且每个内部高速通道与所有磁盘接口连接。
6、根据权利要求1或4所述的存储系统,其特征在于所述磁盘接口两两成对配置,每对磁盘接口上的高速缓存互为镜像,互为镜像的高速缓存互相保存一份镜像数据。
7、根据权利要求6所述的存储系统,其特征在于所述磁盘接口的对数为4~8对。
8、根据权利要求1所述的存储系统,其特征在于所述主机接口通道为高速交换网设备。
9、根据权利要求1所述的存储系统,其特征在于所述内部高速通道为高速交换网设备。
10、根据权利要求8或9所述的存储系统,其特征在于所述高速交换网设备为光纤通道交换机。
11、根据权利要求1所述的存储系统,其特征在于所述协议处理单元包括用于处理主机访问请求的协议处理器,与外部主机进行信息交互的目标器,及与磁盘接口进行信息交互的启动器,目标器和启动器连接在协议处理器上,目标器与主机接口通道连接,启动器与内部高速通道连接。
12、根据权利要求2所述的存储系统,其特征在于协议处理单元与内部高速通道之间通过双路径连接,协议处理单元含有两个目标器和两个启动器,两个目标器分别连接在主机接口通道与协议处理单元之间的两条路径上,两个启动器分别连接在协议处理单元与内部高速通道之间的两条路径上。
13、根据权利要求12所述的存储系统,其特征在于所述磁盘接口含有两个与协议处理单元进行信息交互的目标器,两个目标器分别连接在内部高速通道与磁盘接口之间的两条路径上。
CNB031024637A 2003-01-24 2003-01-24 一种磁盘存储系统 Expired - Lifetime CN1296845C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB031024637A CN1296845C (zh) 2003-01-24 2003-01-24 一种磁盘存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031024637A CN1296845C (zh) 2003-01-24 2003-01-24 一种磁盘存储系统

Publications (2)

Publication Number Publication Date
CN1519736A CN1519736A (zh) 2004-08-11
CN1296845C true CN1296845C (zh) 2007-01-24

Family

ID=34281736

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031024637A Expired - Lifetime CN1296845C (zh) 2003-01-24 2003-01-24 一种磁盘存储系统

Country Status (1)

Country Link
CN (1) CN1296845C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1306718C (zh) * 2004-12-23 2007-03-21 烽火通信科技股份有限公司 一种接口盘保护方法
JP4390694B2 (ja) 2004-12-24 2009-12-24 富士通株式会社 Dma回路及びこれを用いたディスクアレイ装置
JP2006244123A (ja) * 2005-03-03 2006-09-14 Fujitsu Ltd データストレージシステム及びデータストレージ制御装置
US9774675B2 (en) 2009-08-28 2017-09-26 Entit Software Llc Automatic redundant logical connections
CN102929801B (zh) * 2012-10-25 2016-06-22 华为技术有限公司 一种用于磁盘寻址的方法和装置
EP3757810B1 (en) 2016-12-28 2023-04-05 Huawei Technologies Co., Ltd. Packet forwarding method, device, and system in nvme over fabric

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5634033A (en) * 1994-12-16 1997-05-27 At&T Global Information Solutions Company Disk array storage system architecture for parity operations simultaneous with other data operations
US20020078276A1 (en) * 2000-12-20 2002-06-20 Ming-Li Hung RAID controller with IDE interfaces
EP1274015A2 (en) * 2001-07-04 2003-01-08 Hitachi, Ltd. Disk array control apparatus and control data transfer method using the same
CN1391672A (zh) * 1999-09-22 2003-01-15 网孔公司 具有先进技术嵌入式接口仿真主机接口的廉价磁盘冗余阵列控制器系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5634033A (en) * 1994-12-16 1997-05-27 At&T Global Information Solutions Company Disk array storage system architecture for parity operations simultaneous with other data operations
CN1391672A (zh) * 1999-09-22 2003-01-15 网孔公司 具有先进技术嵌入式接口仿真主机接口的廉价磁盘冗余阵列控制器系统及方法
US20020078276A1 (en) * 2000-12-20 2002-06-20 Ming-Li Hung RAID controller with IDE interfaces
EP1274015A2 (en) * 2001-07-04 2003-01-08 Hitachi, Ltd. Disk array control apparatus and control data transfer method using the same

Also Published As

Publication number Publication date
CN1519736A (zh) 2004-08-11

Similar Documents

Publication Publication Date Title
EP1018686B1 (en) Disk array controller
US6684295B2 (en) Disk array control device with two different internal connection systems
US6985989B2 (en) Storage apparatus having plural controller including interconnected memories
KR100740080B1 (ko) 데이터 기억 시스템 및 데이터 기억 제어 장치
CN100458677C (zh) 配置一个或多个存储阵列的装置与方法
US8032610B2 (en) Scalable high-speed cache system in a storage network
US20040252716A1 (en) Serial advanced technology attachment (SATA) switch
US20130145064A1 (en) Scalable Data Storage Architecture And Methods Of Eliminating I/O Traffic Bottlenecks
US20090177805A1 (en) Dual port serial advanced technology attachment (sata ) disk drive
US7430636B2 (en) Storage system and storage control method comprising router and switch in communication with RAID modules
US20040252672A1 (en) Route aware serial advanced technology attachment (SATA) switch
CN101739220A (zh) 一种多控制器存储阵列的设计方法
US20140223097A1 (en) Data storage system and data storage control device
CN1296845C (zh) 一种磁盘存储系统
US20030061297A1 (en) Storage system, disk control cluster and a method of increasing of disk control cluster
US7426658B2 (en) Data storage system and log data equalization control method for storage control apparatus
CN100351766C (zh) 一种磁盘阵列系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20070124

CX01 Expiry of patent term