CN101571815B - 信息系统及i/o处理方法 - Google Patents
信息系统及i/o处理方法 Download PDFInfo
- Publication number
- CN101571815B CN101571815B CN200910005963.XA CN200910005963A CN101571815B CN 101571815 B CN101571815 B CN 101571815B CN 200910005963 A CN200910005963 A CN 200910005963A CN 101571815 B CN101571815 B CN 101571815B
- Authority
- CN
- China
- Prior art keywords
- volume
- memory storage
- request
- virtual
- principal computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1666—Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
- G06F11/2076—Synchronous techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
本发明涉及信息系统及I/O处理方法。本发明提供一种能够使可用性提高的信息系统。第一以及第二存储装置,分别在内部设定将第一存储装置的第一卷的数据向第二存储装置的第二卷拷贝的远程拷贝的对,并且将第三存储装置的第三卷与远程拷贝的对相关联,主计算机,当向第一卷的I/O请求失败时,将针对第二卷的I/O请求发送至第二存储装置,第一以及第二存储装置,当检测出对方一侧的第一或第二存储装置的故障、或第一以及第二存储装置间的连接故障时,将表示检测出该故障的故障信息标志存储在第三卷中。
Description
技术领域
本发明涉及具有多个存储系统的信息系统。
背景技术
一般,在信息系统中,作为存储设备例如具有使用HDD(硬盘驱动器)的存储装置,包含该存储装置的存储系统经由存储区域网络(SAN:StorageAreaNetwork)被从多个上位装置(例如主机)进行访问。一般在存储装置中,通过采用遵从RAID(Redundant Array of Independent(or Inexpensive)Disks)技术的高可靠化方法,来作为存储装置提供超过HDD单体的可靠性的可靠性。但是,随着近年来的信息化社会的进步,利用上述RAID对可靠性作出贡献的信息系统在可用性(服务持续性)方面存在不足。
作为应对这种状况的高可用化技术,有如下技术:将主机和两个存储系统分别相连,从一方的存储系统向另一方的存储系统远程拷贝数据。
【专利文献1】美国专利第7,058,731号说明书
在上述技术中,当存储系统因故障停止时,可以替换为另一方的存储系统,再次开始业务。但是,在这种情况下,在主机中需要用于替换的特殊的替换路径软件,无法通用。
发明内容
因此,本发明的目的在于,使信息系统的可用性提高,该信息系统包含在两台以上的存储系统间进行远程拷贝的存储系统、和不存在利用该存储系统的特殊的替换路径软件的主机。
为了解决该问题,本发明的信息系统,其特征在于,具有:主计算机;与所述主计算机相连、具有第一卷的第一存储装置;与所述主计算机以及所述第一存储装置相连、具有第二卷的第二存储装置;以及与所述第一存储装置以及所述第二存储装置相连、具有第三卷的第三存储装置。所述第一以及所述第二存储装置,根据来自外部的指示,分别在内部设定将所述第一卷的数据向所述第二卷拷贝的远程拷贝的对,并且将所述第三卷与所述远程拷贝的对相关联;所述主计算机,当向所述第一卷的I/O请求失败时,将针对所述第二卷的I/O请求发送至所述第二存储装置;所述第一以及所述第二存储装置,当检测出对方一侧的所述第一或所述第二存储装置的故障、或所述第一以及所述第二存储装置间的连接故障时,将表示检测出该故障的故障信息标志存储在所述第三卷中。
另外,本发明的信息系统中的I/O处理方法,其特征在于,所述信息系统具有:主计算机;与所述主计算机相连、具有第一卷的第一存储装置;与所述主计算机以及所述第一存储装置相连、具有第二卷的第二存储装置;以及与所述第一存储装置以及所述第二存储装置相连、具有第三卷的第三存储装置,所述I/O处理方法具有以下步骤:第一步骤,所述第一以及所述第二存储装置,根据来自外部的指示,分别在内部设定将所述第一卷的数据向所述第二卷拷贝的远程拷贝的对,并且将所述第三卷与所述远程拷贝的对相关联;第二步骤,所述主计算机,当向所述第一卷的I/O请求失败时,将针对所述第二卷的I/O请求发送至所述第二存储装置;第三步骤,所述第一以及第二存储装置,当检测出对方一侧的所述第一或所述第二存储装置的故障、或所述第一以及所述第二存储装置间的连接故障时,将表示检测出该故障的故障信息标志存储在所述第三卷中。
因此,当向第一卷的I/O请求失败时,向所述第二卷发送I/O请求,由于未进行与第一卷的远程拷贝,所述第二卷的数据不是最新的,因此,通过不是最新的所述第二卷的数据,可以提前并且有效地防止执行与主计算机的I/O请求相对应的处理。
通过本发明,可以使信息系统的可用性提高。
附图说明
图1是表示本实施方式的信息系统的硬件结构的一例的框图。
图2是表示本实施方式的概要的概念图。
图3是表示虚拟化存储装置、存储装置以及故障检测用存储装置上的软件结构的框图。
图4是表示远程拷贝的对状态和对状态的迁移的概念图。
图5是表示I/O请求处理的流程图。
图6是表示I/O请求处理的流程图。
符号说明
100:信息系统;1000:虚拟化存储装置;1010:控制器;1011:处理器;1020:高速缓冲存储器;1030:HDD;1100:主机;1500:存储装置;1700:故障检测用存储装置;1800:故障检测用卷;2010:应用程序;3000:卷。
具体实施方式
以下,参照附图说明本发明的实施方式。
(1)第一实施方式
<1.信息系统的结构>
图1是表示本发明的一个实施方式的信息系统100的硬件结构的一例的图。
信息系统100例如由存储装置1500、主计算机(以后简称为主机)1100、管理主机1200、两台以上的虚拟化存储装置1000构成。存储装置1500、主机1100、管理主机1200的数量分别可以在1个以上。虚拟化存储装置1000和主机1100经由I/O网络1300相互连接。虚拟化存储装置1000、存储装置1500和管理主机1200经由管理网络(未图示)或I/O网络1300相互连接。
在主机1100中存在主机内部网络1104,在该网络1104上连接有处理器(在图中简记为Proc)1101、存储器(在图中简记为Mem)1102、I/O端口(在图中简记为I/O P)1103。管理主机1200也可以具有和主机1100相同的硬件结构。此外,有时将在主机1100上追加I/O端口的扩展卡称为HBA(Host BusAdapter)。
管理主机1200具有显示装置,在该显示装置上可以显示虚拟化存储装置1000和存储装置1500的管理用画面。另外,管理主机1200可以从用户(例如管理主机1200的操作员)接收管理操作请求,将该接收到的管理操作请求发送至虚拟化存储装置1000或存储装置1500。管理操作请求是用于虚拟化存储装置1000或存储装置1500的操作的请求,例如有:校验组生成请求、内部LU(Logical Unit)生成请求、路径定义请求、以及与虚拟化功能相关的操作。
I/O网络1300首先考虑利用光纤通道进行连接,但除此以外,也考虑FICON(FIbre CONnection:注册商标)或Ethernet(注册商标)与TCP/IP(Transmission Control Protocol/Internet Protocol)和iSCSI(internet SCSI(SmallComputer System Interface))的组合、或者Ethernet(注册商标)与NFS(NetworkFile System)或CIFS(Common Internet File System)等网络文件系统的组合等。而且,I/O网络1300只要是可以转发I/O请求的通信装置,则也可以是除此以外的情况。另外,连接虚拟化存储装置1000和存储装置1500的网络也与I/O网络1300相同。
虚拟化存储装置1000具有:控制器(在图中表示为CTL)1010、高速缓冲存储器(在图中表示为CM)1020、多个HDD1030。作为理想的方式,考虑控制器1010及高速缓冲存储器1020分别由多个组件构成。其原因是即便在单个组件中发生故障而闭塞时,也可以使用其余的组件来继续接收以读和写为代表的I/O请求。
控制器1010是控制虚拟化存储装置1000的动作的装置(例如电路基板)。控制器1010中有内部网络1017,在该内部网络1017上连接有:I/O端口1013、高速缓冲存储器端口(在图中表示为CP)1015、管理端口(在图中表示为MP)1016、后端端口(在图中表示为B/E P)1014、处理器(例如CPU(CentralProcessing Unit))1011以及存储器1012。多个控制器1010和高速缓冲存储器1020通过存储内部网络1050相互连接。另外,控制器1010和各HDD1030通过多个后端网络1040相互连接。
存储装置1500的硬件结构由和虚拟化存储装置1000同种的部件构成。此外,当虚拟化存储装置1000是没有HDD的虚拟化专用装置或交换机时,存储装置1500也可以不由和虚拟化存储装置1000同种的部件构成。而且,主机1100及虚拟化存储装置1000的内部网络理想的是具有比I/O端口1013所具有的传输带宽更宽的带宽,另外,也可以通过总线或交换机型网络来代替全部或一部分。另外,图1中,在控制器1010中存在一个I/O端口1013,但实际上在控制器1010中可以存在多个I/O端口1013。
通过以上硬件结构,虚拟化存储装置1000或存储装置1500的HDD上保存的全部或一部分数据可以由主机1100读出或写入。此外,在以后的说明中,将负责数据保存的系统称为存储集群(Storage Cluster)。另外,在通过在存储集群内部包含两个该系统来实现高可用化的子系统中,将包含虚拟化存储装置1000和存储装置1500的一方或双方的子系统称为存储子系统。
<2.本实施方式的概要>
在本实施方式中,为了使包含虚拟化存储装置1000的存储系统的可用型提高,采用又使用了一台虚拟化存储装置1000的二重化结构,所述虚拟化装置1000具有将其它存储装置1500内的卷等存储区域虚拟化的虚拟化功能。图2是表示其概要的图。
在本概要中,在存储系统中包含:虚拟化存储装置1000L、虚拟化存储装置1000R、存储装置1500L、存储装置1500R。此外,以下为了容易说明,使虚拟化存储装置1000L以及存储装置1500L具有正系统(生产系统)的作用;使虚拟化存储装置1000R以及存储装置1500R具有副系统(备份系统)的作用。但是,当各虚拟化存储装置1000L、1000R向主机1100提供的卷在两个以上时,只要确定以卷单位担当正系统的虚拟化存储装置1000L、1000R即可,来代替以虚拟化存储装置单位担当正·副系统。
各个虚拟化存储装置1000L、1000R将以自身具有的HDD1030作为构成要素的校验组(通过RAID技术构成)的一部分或全部区域作为卷3000A(3000LA、3000RA)来提供给主机1100(对应于图中圆柱内记为‘A’的部分)。另外,虚拟化存储装置1000,作为选项可以提供基于虚拟化功能的虚拟卷3000B(3000LB、3000RB)(对应的HDD等非易失性存储区域存在于虚拟化存储装置1000L、1000R外部的卷)(对应于图中圆柱内记为‘B’的部分)。在本概要中,将存储装置1500L、1500R提供的卷3500B(3500LB、3500RB)的一部分或全部用作对应的非易失性存储区域。
此外,在以后的说明中,当记载“卷的数据”时,除了在HDD1030中保存的数据以外还包含在高速缓冲存储器1020中暂时保存的数据。另外,关于后述的“虚拟卷的数据”,除了在存储装置1500L、1500R的卷3500LB、3500RB中保存的数据以外,还包含在虚拟化存储装置1000L、1000R的高速缓冲存储器1020中暂时保存的数据。
另一方面,在主机1100上运行着应用程序(以后,有时简称为应用)2010和OS(Operating System)2020。另外,在对单一卷3000有多条访问路径时,具有将它们汇总为一条来处理的功能的替换路径软件,作为OS2020的一部分而运行。
应用2010利用OS2020提供的接口,访问虚拟化存储装置1000内的数据。OS2020解释来自应用2010的访问请求,为了确定所请求的数据,指定虚拟化存储装置1000提供的卷3000的卷地址(例如,在SCSI标准中通过目标端口地址和LUN的组合来表现)和卷3000内的数据位置(例如同样在SCSI标准中,通过LBA表示),向虚拟化存储装置1000发送I/O请求。
虚拟化存储装置1000访问(例如读或写)在所指定的卷3000的指定的LBA中存储的数据,并向主机1100应答结果。主机1100的OS2020接收从虚拟化存储装置1000返回的结果,并将结果返回给应用2010。
替换路径软件,介入上述的应用2010和OS2020的交换间,具有当单一卷具备多条访问路径时选择所使用的访问路径的功能。在SCSI标准中,当一个卷3000具备多条访问路径时,对各条访问路径分配不同的卷地址(即目标端口地址和LUN的组合)。即,单一卷具有多个卷地址。
替换路径软件委托OS2020选择其中的一个卷地址(即访问路径)来发送I/O请求。OS2020使用由替换路径软件选择的访问路径,向虚拟化存储装置1000发送I/O请求,并从虚拟化存储装置1000取得结果,然后将该结果返回替换路径软件。当结果为I/O成功时,替换路径软件向应用2010返回该结果。当结果为I/O失败时,替换路径软件选择别的访问路径,再次委托OS2020发送I/O请求。当全部访问路径中I/O都失败时,向应用2010应答I/O失败。
替换路径软件为了得知多个卷地址与单一卷相关联,而使用作为卷固有的识别符的卷识别符。替换路径软件,针对多个卷地址,分别向虚拟化存储装置1000询问卷识别符。在SCSI标准中利用Inquiry命令。虚拟化存储装置1000向替换路径软件应答卷固有的识别符。卷识别符是卷固有的识别符,因此,即使卷地址不同,若卷3000相同则返回相同识别符。由此,替换路径软件可以将返回相同卷识别符的卷地址识别为向单一卷的多条访问路径。
另外,替换路径软件还取得访问路径的优先顺序。在SCSI标准中,作为Inquiry命令的应答,与识别符一起向替换路径软件返回优先顺序。一般地,以高低两级程度表示优先顺序。即,替换路径软件可以得到某条访问路径优先顺序高、其它访问路径优先顺序低这样的信息。替换路径软件,在取得优先顺序后,在选择访问路径时,选择优先顺序高的访问路径,委托OS2020使用所选择的访问路径来发送I/O请求。当访问路径在3条以上时,首先从优先顺序高的访问路径中选择使用的访问路径。仅当使用优先顺序高的访问路径的I/O请求全部失败时,选择优先顺序低的访问路径,委托OS2020发送I/O请求。
图2所示的虚拟化存储装置1000L、1000R提供的卷3000LA、3000RA、3000LB、3000RB存在远程拷贝的关系。远程拷贝是虚拟化存储装置1000所具有的、将某虚拟化存储装置1000的卷3000接收到的写数据拷贝到其它虚拟化存储装置1000的卷3000的功能。将拷贝源卷称为主卷,将拷贝目的地卷称为辅助卷。
在本实施方式中,将虚拟化存储装置1000L设为优先度高的虚拟化存储装置1000,将虚拟化存储装置1000R设为优先度高的虚拟化存储装置1000。在图2中,卷3000LA、3000LB是主卷,卷3000RA、3000RB是辅助卷。
本实施方式的远程拷贝,基本功能与通常的远程拷贝相同,但一部分功能与通常的远程拷贝不同。以下,说明本实施方式的特征功能。首先,在本实施方式的远程拷贝中,使主卷和辅助卷的卷识别符相同。即,卷3000LA和卷3000RA,针对SCSI的Inquiry命令应答相同卷识别符。于是,主机1100的替换路径软件,将本来不同的卷、即3000LA和3000RA识别为单一卷,将各个卷识别为针对该单一卷的多条访问路径。
而且,关于访问路径的优先顺序,也在主卷中将访问路径的优先顺序为高,在辅助卷中将访问路径的优先顺序应答为低。于是,替换路径软件使用优先顺序高的访问路径来处理I/O,因此,作为结果,对主卷发送I/O请求。并且,替换路径软件,仅当全部高优先顺序访问路径中I/O失败时(即仅当向主卷的I/O失败时),选择低优先顺序访问路径,即对辅助卷发送I/O请求。
本实施方式的远程拷贝的辅助卷的特征功能是,当从主机1100收到I/O请求时停止远程拷贝,开始I/O处理。根据上述卷识别符和访问路径的优先顺序,对辅助卷发送主机I/O,表示向主卷(即高优先顺序的访问路径)的I/O全部失败。在此,辅助卷以收到I/O请求为契机开始I/O处理,由此,替换路径软件若选择了低优先顺序的访问路径则判断为I/O成功。由此,使用一般的替换路径软件具有的功能,可以实现虚拟化存储装置1000的失效转移(failover)。
这样,在信息系统100中,使替换路径软件不具有特殊功能,符合现状的替换路径软件的功能,虚拟化存储装置1000L以及虚拟化存储装置1000R发送针对I/O请求的应答,由此实现虚拟化存储装置1000L以及虚拟化存储装置1000R的替换。
此外,为了使基于各程序的主机1100的处理器1011的处理内容明确化,以应用2010、OS2020、替换路径软件的各种处理的处理主体作为程序来进行了说明,但实际上,当然是由主机1100的处理器1011根据该程序进行该处理。
<3.虚拟化存储装置1000中执行的程序及信息>
图3是表示在虚拟化存储装置1000(1000L、1000R)和存储装置1500(1500L、1500R)中执行的程序、和通过该程序管理的信息的图。此外,该程序通过存储器1012(图1)、处理器1011(图1)和高速缓冲存储器1020保持和执行,但也可以硬件化地执行其一部分。
<3.1.I/O处理程序6020、校验组信息6060及卷信息6050>
在校验组信息6060中包含每个校验组的与以下结构关联的信息。
(1)构成校验组的HDD1030的识别符。在校验组中有多个HDD1030参加,因此在每个校验组中存在多个该信息。
(2)RAID级别
另外,在卷信息6050中包含每个卷的与以下结构关联的信息。
(1)卷容量
(2)保存与卷对应的数据的校验组的识别符和校验组内的区域(开始地址和结束地址的一方或双方)
I/O处理程序6020参照卷信息6050或校验组信息6060,执行与从主机1100接收到的I/O请求相关的以下处理。
(A)升级:将HDD1030中保存的数据拷贝到高速缓冲存储器1020上。
(B)降级:将高速缓冲存储器1020上保存的数据向HDD1030拷贝。此外,作为此前的处理,可以生成基于RAID技术的冗余数据。
(C)读处理:对于从主机1100接收到的读请求,判定与该请求对应的数据是否存在于高速缓冲存储器1020上。并且,当与该请求对应的数据不存在于高速缓冲存储器1020上时,执行升级处理来将该数据拷贝到高速缓冲存储器1020上后,对主机1100发送该数据。此外,当高速缓冲存储器1020上存在所述数据时,对主机1100发送该数据。
(D)写处理:在高速缓冲存储器1020上保存从主机1100接收到的写数据。此外,在该处理时在高速缓冲存储器1020上没有足够的空区域时,执行降级处理来将适当的数据拷贝到HDD1030上后,利用高速缓冲存储器1020上的对应区域。另外,在写请求中已包含高速缓冲存储器1020上保存的区域时,有时直接向已有的高速缓冲存储器1020上的区域进行覆盖。
(E)高速缓存算法:根据高速缓冲存储器1020上的数据的参照频率或参照时期等,通过LRU等算法决定HDD1030上的应该升级的数据或高速缓冲存储器1020上的应该降级的数据。
<3.2.虚拟化程序6030和虚拟化信息6070>
在虚拟化信息6070中包含每个虚拟化卷的与以下的结构关联的信息。
(1)与存储装置1500内的卷内的区域和该区域作为虚拟卷上的地址空间的哪个区域提供给主机1100相关的以下信息。在构成多个虚拟卷时,以下信息也存在多个。
(1-1)构成虚拟卷的、存储装置1500的识别符(或端口的识别符)、卷的识别符、和卷内的区域(开始地址和结束地址)。
(1-2)虚拟卷中的区域(开始地址和结束地址)
(2)虚拟卷的容量
虚拟化程序6030是用于由虚拟化存储装置1000使用存储装置1500所提供的卷向主机1100提供卷的程序。此外,作为虚拟化程序6030提供的虚拟卷3000B、和与之对应的存储装置1500上的卷3500B的对应关系,存在以下方式。
(A)将存储装置1500上的卷全体作为虚拟卷3000B的存储区域来使用的情况。在这种情况下,虚拟卷的容量成为与所选择的卷3500B大体相同的容量(将控制信息或冗余信息保存在存储装置1500上的卷中的情况。没有该信息等时,为相同容量)。
(B)将存储装置1500上的卷的一部分的区域作为与虚拟化卷3000B对应的保存区域来使用的情况。在这种情况下,虚拟卷3000B的容量与该利用对象的区域容量大体相同。
(C)将多个存储装置1500上的多个卷3500B作为虚拟卷3000B的存储区域来结合使用的情况。在这种情况下,虚拟卷3000B的容量成为与各卷的容量的合计值大体相同的容量。此外,作为该结合方式,有条带化(Striping)和连接(Concatenate)(连接多个卷作为一个卷来处理的方法)等。
(D)伴随(C)方式地保存校验位信息或镜像数据的情况。在这种情况下,虚拟卷3000B的容量,在保存镜像数据时是(C)的一半,在保存校验位时取决于校验位计算方式。在存储装置1500内部,通过与基于RAID的高可靠化组合,针对虚拟卷3000B中保存的数据的可靠性进一步提高。
此外,关于任意一种方式,通过I/O请求指定的存储装置识别符(或端口识别符)和卷识别符(I/O请求中使用的、识别虚拟化存储装置内或端口下属的卷的信息,有LUN(Logical Unit Number)或CKD形式的CU号码和LDEV(Logical DEVice)号码等)都与原来的卷不同。
虚拟化程序6030,当成为升级或降级对象的数据与虚拟卷对应时,通过I/O处理程序6020被调用,使用虚拟化信息6070执行以下的处理。
(A)升级:根据虚拟化卷3000B和存储装置1500的卷3500B的对应关系,决定应该将保存在哪个存储装置1500的卷3500B中的数据拷贝到高速缓冲存储器1020上,然后向高速缓冲存储器1020进行数据拷贝。
(B)降级:根据虚拟化卷3000B和存储装置1500的卷3500B的对应关系,决定应该向哪个存储装置1500的卷3500B拷贝高速缓冲存储器1020上的数据,然后向存储装置1500的卷3500B进行数据拷贝。此外,作为此前的处理,也可以生成基于RAID技术的冗余数据。
<3.3.远程拷贝程序6010和拷贝对信息6040>
拷贝对信息6040,针对远程拷贝的主卷和辅助卷的每个拷贝对(有时简称为对)具有以下信息。此外,在本实施方式中,主卷以及辅助卷被指定了实现高可用性的对象卷。
(1)具有主卷的虚拟化存储装置1000的识别符和卷的识别符
(2)具有辅助卷的虚拟化存储装置1000的识别符和卷的识别符
(3)拷贝对的状态(在后面详细描述)
远程拷贝程序6010是将主卷中保存的数据映射到辅助卷的程序,参照拷贝对信息6040进行处理。以下,对远程拷贝(特别是同步远程拷贝)的处理概要和对状态进行说明。
<3.3.1.同步远程拷贝的拷贝处理动作>
与前述一样,所谓同步远程拷贝是当拷贝源虚拟化存储装置1000从主机1100收到针对主卷的写请求时,在将写数据发送到拷贝目的地的虚拟化存储装置1000后,对主机1100返回写请求完成的远程拷贝方法。
执行同步远程拷贝时,在管理主机1200上显示主卷和辅助卷所构成的对之间的远程拷贝的状况,或者,为了对远程拷贝的状态进行操作,虚拟化存储装置1000的控制器1010管理被称为拷贝对状态(Simplex、Initial-Copying、Duplex、Suspend以及Duplex-Pending)的信息。图4表示与同步远程拷贝的对状态相关的状态迁移图。以下,对各种对状态进行说明。
<3.3.1.1.Simplex状态>
Simplex状态,是在构成对的主卷和辅助卷之间未开始拷贝的状态。
<3.3.1.2.Duplex状态>
Duplex状态,是开始同步远程拷贝,后述的初始化拷贝也完成,构成对的主卷及辅助卷的数据内容成为相同内容的状态。在本状态中,除写入过程中的区域以外,主卷的数据以及辅助卷的数据的内容成为相同内容。此外,在Duplex过程中以及Duplex-Pending及Initial-Copying状态下,拒绝从主机1100向辅助卷的写请求。
<3.3.1.3.Initial-Copying状态>
Initial-Copying状态,是从Simplex状态迁移到Duplex状态前的中间状态,在此期间中,若有必要则进行从主卷向辅助卷的初始化拷贝(将已存储在主卷中的数据向辅助卷拷贝)。在初始化拷贝完成,为了向Duplex状态迁移而需要的处理结束后,对状态成为Duplex。
<3.3.1.4.Suspend状态>
Suspend状态是不使针对主卷的写入内容反映到辅助卷的状态。在该状态下,构成了对的主卷以及辅助卷的数据的内容不相同。以来自用户或主机1100的指示为契机,对状态从其它状态向Suspend状态迁移。除此以外,在由于虚拟化存储装置1000间的网络故障等原因而无法进行同步远程拷贝时,认为对状态会自动迁移到Suspend状态。
在以后的说明中,将后者的情况、即由于故障而产生的Suspend状态称为故障Suspend状态。作为变成故障Suspend状态的代表性原因,除了网络故障以外,还考虑主卷或辅助卷的故障、控制器1010的故障。
在变成了Suspend状态的情况下,当在变成Suspend状态的时刻以后存在针对主卷的写请求时,拷贝源存储装置1000按照写请求接收写数据,并保存在主卷中,但不向拷贝目的地的虚拟化存储装置1000发送写数据。另外,拷贝源虚拟化存储装置1000将写入的写数据在主卷上的写入位置作为差分位图等进行存储。
<3.3.1.5.Duplex-Pending状态>
Duplex-Pending状态,是从Suspend状态迁移到Duplex状态前的中间状态。在该状态下,为使主卷以及辅助卷的数据的内容一致,执行从主卷向辅助卷的数据拷贝。主卷以及辅助卷的数据的内容变得相同后,对状态成为Duplex。
此外,Duplex-Pending状态中的数据拷贝通过差分拷贝来执行,即、在Suspend状态的期间,利用拷贝源虚拟化存储装置1000或拷贝目的地的虚拟化存储装置1000记录的写入位置(例如上述差分位图等),仅拷贝需要更新的部分(即主卷和辅助卷的数据的不一致部分)。
另外,在以上的说明中,Initial-Copying状态和Duplex-Pending状态作为不同的状态,但也可以把它们合并为一个状态来显示在管理主机1200的画面上,或者使状态迁移。
<4.在存储装置1500中执行的程序及信息>
在图3中记载了在存储装置1500中执行的程序及信息,各个程序及信息进行与虚拟化存储装置1000相同的动作。
<5.本实施方式的特征结构>
除了上述结构以外,在本实施方式中,信息系统100的虚拟化存储装置1000L、1000R和故障检测用存储装置1700经由规定的网络相互连接而构成(图1)。此外,故障检测用存储装置1700的硬件结构,由与虚拟化存储装置1000同种的部件构成。
故障检测用存储装置1700把以自身具有的HDD1030为构成要素的校验组的一部分或全部区域作为故障检测用卷1800,提供给虚拟化存储装置1000L、1000R。在这种情况下,虚拟化存储装置1000L、1000R提供同一故障检测用卷1800作为故障检测用虚拟卷3000C。
另外,故障检测用存储装置1700,在故障检测用卷1800中存储在信息系统1000内的构成要素中是否发生了故障的故障信息。
而且,关于在故障检测用存储装置1700中执行的程序及信息,针对后述的故障检测标志,进行与虚拟化存储装置1000同样的动作(图3)。
即,故障检测用存储装置1700的I/O处理程序6220,基于故障检测用存储装置1700的处理器1011的控制,按照来自虚拟存储装置1000L、1000R的命令,执行检测故障检测标志(后述)、或者将故障检测标志写入(存储)到相应的故障检测用卷1800等的处理(图3)。
另一方面,关于虚拟化存储装置1000L、1000R,当形成远程拷贝的主卷和辅助卷的对时,为了将远程拷贝的主卷和辅助卷的拷贝对、与故障检测用卷1800关联起来进行设定,在拷贝对信息6040中还具有以下4种信息。即,本实施方式中的拷贝对信息6040具有以下信息,并且对它们相关联地进行了设定。
(1)具有主卷的虚拟化存储装置1000的识别符和卷的识别符。
(2)具有辅助卷的虚拟化存储装置1000的识别符和卷的识别符。
(3)拷贝对的状态
(4)故障检测用卷(故障检测用虚拟卷3000C)的识别符和存储了故障信息的数据的地址。
此外,关于本实施方式中的虚拟化存储装置1000L、1000R的I/O处理程序6020的特征处理内容,在后面进行描述。
接下来,对本实施方式中的远程拷贝的特征处理、即I/O请求处理进行说明。本实施方式中的远程拷贝的I/O请求处理中,为了在避免故障的同时处理I/O,需要为满足以下要件地进行处理。
在本实施方式中的信息系统100中,第一,需要使:即使在该信息系统100中的一个构成要素中发生了故障(单点故障)时,通过主机1100的I/O请求的再发送来继续I/O处理,不对主机1100应答I/O失败。
即,为了使本实施方式中的信息系统100的可用性比单一虚拟化存储装置高,需要即使在发生单点故障时也可以继续主机1100中的I/O处理。在信息系统100中,例如由于远程拷贝的失败而将I/O请求本身作为I/O失败向主机1100进行应答时,由于虚拟存储装置1000L的单点故障,主机1100中的I/O处理变得无法继续。因此,在信息系统1000中需要避免这样的处理。
另外,在本实施方式中的信息系统100中,第二,需要使:即使在该信息系统100中的多个构成要素中发生了故障(复合故障)时,也能够不对旧数据进行误访问。此外,这种情况下的主机1100的I/O的处理可否继续不成问题。
在此,所谓旧数据,是指与主机1100识别的卷3100内的数据存在不一致的数据,作为典型的例子,相当于在切断虚拟存储装置1000L、1000R间的连接后,单独运用虚拟存储装置1000L(优先度高的虚拟化存储装置1000)时的虚拟存储装置1000R的卷3000RA内的数据。
即,本实施方式中的信息系统100是生产系统以及备份系统的二重系统,因此,在多个构成要素中发生了故障时,根据故障部位,有时也可能无法继续主机1100的I/O的处理。
此时,在信息系统100中,在从单点故障发生后到下一故障发生前有一段时间的情况下,有时,未反映单点故障发生后发送的写请求的数据(旧数据)存在于虚拟存储装置1000L、1000R的某一个中。
因此,在信息系统100中需要防止主机1100误访问旧数据。在信息系统100中,例如当发生虚拟存储装置1000L、1000R间的连接被切断等连接故障所致的单点故障,远程拷贝失败时(发生单点故障),考虑单纯地通过虚拟存储装置1000L处理I/O请求的情况。在这种情况下,在信息系统100中,此后不久在虚拟存储装置1000L中发生了故障时(复合故障),主机1100以向虚拟存储装置1000L的I/O失败为契机,向虚拟存储装置1000R再发送I/O请求,因此会访问虚拟存储装置1000R的旧数据。
因此,本实施方式中的信息系统100中,在虚拟存储装置1000L、1000R上连接可以处理SCSI标准的Reserve命令的故障检测用存储装置1700,从而具有故障检测用卷1800。
虚拟存储装置1000L,当检测出故障时,向在形成远程拷贝的主卷和辅助卷的对时设定的故障检测用卷1800(故障检测用虚拟卷3000C)的子块中,写入表示检测出故障的故障信息标志,然后,继续针对主机1100的I/O处理。
具体而言,虚拟存储装置1000L,当检测出远程拷贝的失败时,在向主机1100进行I/O的应答前,通过Reserve命令保留(使其它装置无法访问故障检测用卷1800地排他性地确保)故障检测用卷1800。
然后,虚拟存储装置1000L读取在形成远程拷贝的主卷和辅助卷的对时设定的故障检测用卷1800的子块,检查是否写入了故障信息标志,当未写入时,在该子块中写入故障信息标志。
然后,虚拟存储装置1000L通过Reserve解除命令解除故障检测用卷1800的保留,迁移到故障Suspend状态,停止远程拷贝,再次开始对主机1100的I/O的处理。与之相对,虚拟存储装置1000L,当未能在一定时间内保留(reserve)故障检测用卷1800时、或者已经通过另一方的虚拟存储装置1000R写入故障信息标志时,对主机1100应答I/O失败。
另一方面,虚拟存储装置1000R,当从主机1100发送I/O请求时,在开始针对主机1100的I/O处理前,检查故障检测用存储装置1700的故障检测用卷1800(故障检测用虚拟卷3000C),仅在未写入故障信息标志时开始I/O的处理。
具体而言,虚拟存储装置1000R,当从主机1100发送I/O请求、并接收到I/O请求时,在对主机1100应答I/O的应答前,通过Reserve命令保留故障检测用卷1800。
接着,虚拟存储装置1000R读取在形成远程拷贝的主卷和辅助卷的对时设定的故障检测用卷1800的子块,检查是否写入了故障信息标志,当未写入时,在该子块中写入故障信息标志。
接着,虚拟存储装置1000R通过Reserve解除命令解除故障检测用卷1800的保留,迁移到故障Suspend状态,停止远程拷贝,通过辅助卷开始针对主机1100的I/O的处理。与之相对,虚拟存储装置1000R,当未能在一定时间内保留故障检测用卷1800时、或者已经通过另一方的虚拟存储装置1000L写入故障信息标志时,不迁移到故障Suspend状态,对主机1100应答I/O失败。
<6.虚拟化存储装置1000的I/O请求处理>
图5表示当虚拟化存储装置1000接收到I/O请求时,通过执行I/O处理程序6020进行的远程拷贝的操作。
(SP1)虚拟化存储装置1000接收I/O请求。
(SP2)虚拟化存储装置1000判断成为I/O请求对象的卷3000A、3000B是否与远程拷贝有关,当无关时执行SP3,当有关时执行SP4。
(SP3)虚拟化存储装置1000进行相应的I/O的处理,向主机1100返回I/O成功或I/O失败的应答后结束。
(SP4)虚拟化存储装置1000,判断成为I/O请求对象的远程拷贝的卷3000A、3000B的属性,当是主卷的属性时执行SP5,当是辅助卷的属性时执行SP13。此外,在这种情况下,具有主卷的虚拟化存储装置1000L是优先顺序高的虚拟化存储装置1000。此外,在向具有辅助卷的虚拟化存储装置1000R发送I/O请求的情况下,是具有主卷的虚拟化存储装置1000L中存在故障的时候,在该情况下,远程拷贝不进行动作。
(SP5)虚拟化存储装置1000判断成为I/O请求对象的I/O的内容,在读请求的情况下执行SP3,在写请求的情况下执行SP6。
(SP6)虚拟化存储装置1000执行同步远程拷贝处理,向虚拟化存储装置1000R转发写数据,等待应答。
(SP7)虚拟化存储装置1000判断同步远程拷贝处理是否已成功,若成功则执行SP11,若失败则执行SP8。
(SP8)虚拟化存储装置1000将对象卷为主卷的远程拷贝的拷贝对的状态迁移到故障Suspend状态,停止远程拷贝。此外,在这种情况下,虚拟化存储装置1000不禁止针对该卷的写入。
(SP9)虚拟化存储装置1000向在形成远程拷贝的主卷和辅助卷的对时设定的故障检测用卷1800的子块中写入故障信息标志。
(SP10)虚拟化存储装置1000判断故障信息标志的写入是否已成功,若成功则执行SP11,若失败则执行SP12。此外,已经在相应的故障检测用卷1800中写入了故障信息标志时,由于另一方的虚拟化存储装置1000写入了故障信息标志,因此写入失败。另外,在另一方的虚拟化存储装置1000未写入故障信息标志时,写入故障信息标志,从而写入成功。
(SP11)虚拟化存储装置1000进行I/O的处理(写处理),向主机1100返回I/O成功的应答后结束。
(SP12)虚拟化存储装置1000向主机1100返回I/O失败的应答后结束。此外,此后,即使主机1100重试I/O仍失败时,对作为优先顺序低的虚拟化存储装置1000的虚拟化存储装置1000R发送I/O请求。
(SP13)虚拟化存储装置1000将对象卷为辅助卷的远程拷贝的拷贝对的状态迁移到故障Suspend状态,停止远程拷贝。此外,在这种情况下,虚拟化存储装置1000不禁止针对该卷的写入。
(SP14)虚拟化存储装置1000向在形成远程拷贝的主卷和辅助卷的对时设定的故障检测用卷1800的子块中写入故障信息标志。
(SP15),虚拟化存储装置1000判断故障信息标志的写入是否已成功,若成功则执行SP11,若失败则执行SP12。此外,在已经在该故障检测用卷1800中写入了故障信息标志时,由于另一方的虚拟化存储装置1000写入了故障信息标志,因此写入失败。另外,当另一方的虚拟化存储装置1000未写入故障信息标志时,写入故障信息标志,从而写入成功。
于是,在信息系统100中,在虚拟存储装置1000L、1000R中,根据来自管理主机1200等外部的指示,将主卷和辅助卷的拷贝对分别设定在拷贝对信息6040中,同时将故障检测用卷1800与该拷贝对相关联,在主机1100中,当向主卷的I/O请求失败时,向虚拟化存储装置1000R发送针对辅助卷的I/O请求,在虚拟化存储装置1000L、1000R中,当检测出对方侧的虚拟化存储装置1000R、1000L的故障、或虚拟化存储装置1000L、1000R间的连接故障时,在故障检测用卷1800中存储故障信息标志。
因此,当向主卷的I/O请求失败时,向辅助卷发送I/O请求,因此,未进行与主卷的远程拷贝,辅助卷的数据不是最新的,因此,通过不是最新的辅助卷的数据,可以提前有效地防止执行针对主机1100的I/O请求的处理。
另外,在信息系统100中,在虚拟化存储装置1000R中,从主机1100接收到I/O请求时,判断在与该I/O请求所对应的拷贝对相关联的故障检测用卷1800中是否写入了故障信息标志,当写入了故障信息标志时,发送I/O请求的失败的应答。
因此,当向主卷的I/O请求失败时,向辅助卷发送I/O请求,因此,未进行与主卷的远程拷贝,辅助卷的数据不是最新的,因此,通过不是最新的辅助卷的数据,可以提前并且有效地防止执行针对主机1100的I/O请求的处理。
另外,在信息系统100中,在虚拟化存储装置1000L中,在检测出向辅助卷的远程拷贝的失败时,判断在故障检测用卷1800中是否写入了故障信息标志,当未写入故障信息标志时,在故障检测用卷1800中写入故障信息标志后,执行与I/O请求相对应的处理。
因此,即使在虚拟化存储装置1000L中发生了故障时,也可以向虚拟化存储装置1000R通知未进行与主卷的远程拷贝、辅助卷的数据不是最新。
另外,在信息系统100中,在虚拟化存储装置1000L中,在写入了所述故障信息标志时,发送I/O请求的失败应答。
因此,在故障检测用卷1800中写入了故障信息标志时,表示由于某种原因已经开始了基于辅助卷的单独运用,因此主卷的数据不是最新的,因此可以通过不是最新的主卷的数据,提前并且有效地防止执行针对主机1100的I/O请求的处理。
此外,在本实施方式中,说明了将同一故障检测用卷1800作为故障检测用虚拟卷3000C来提供给虚拟化存储装置1000L、1000R,对故障检测用卷1800进行了访问的情况,但本发明不限于此,也可以不提供故障检测用虚拟卷3000C,而由虚拟化存储装置1000L、1000R直接访问故障检测用存储装置1700的故障检测用卷1800,可以应用其它各种方法。
Claims (16)
1.一种信息系统,其特征在于,具有:
主计算机;
与所述主计算机相连、具有第一卷的第一存储装置,所述第一卷具有卷识别符;
与所述主计算机相连、具有第二卷的第二存储装置,所述第二卷具有与所述第一卷的卷识别符相同的卷识别符;
其中,所述第一卷和所述第二卷形成远程拷贝对,并将对所述第一卷的写数据拷贝到所述第二卷;
其中,从所述主计算机到所述第一卷的第一访问路径的优先度高于从所述主计算机到所述第二卷的第二访问路径的优先度;
其中,当所述主计算机发送指定卷识别符的I/O请求时,所述I/O请求通过所述第一访问路径发送给所述第一卷;
其中,当通过所述第一访问路径发送给所述第一卷的I/O请求失败时,将所述I/O请求通过所述第二访问路径发送至所述第二卷;以及
其中,当接收到通过所述第二访问路径从所述主计算机到所述第二卷发送的写请求时,所述第二存储装置停止远程拷贝,处理写请求并且基于所述写请求存储在所述第二卷中记录的数据的写位置。
2.根据权利要求1所述的信息系统,还包括,
与所述第一存储装置以及所述第二存储装置相连、具有第三卷的第三存储装置,
其中,如果所述第一以及所述第二存储装置中的一个存储装置检测到所述第一和所述第二存储装置中的另一个存储装置的故障、或者所述第一以及所述第二存储装置间的连接故障,则所述第一存储装置或所述第二存储装置将表示检测出该故障的故障信息标志存储在所述第三卷中,
其中,当通过所述第二访问路径接收到所述I/O请求时,所述第二存储装置判断在所述第三卷中是否存储了所述故障信息标志,当在所述第三卷中存储了所述故障信息标志时,将所述I/O请求的失败应答发送至所述主计算机,
所述故障信息标志用于在形成远程拷贝的主卷和辅助卷的对中防止对不一致的数据进行误访问。
3.根据权利要求2所述的信息系统,其特征在于,
所述第二存储装置,
当从所述主计算机接收到所述I/O请求时,在所述第三卷中未存储所述故障信息标志时,在将所述故障信息标志存储在所述第三卷中后,执行与所述I/O请求对应的处理。
4.根据权利要求2所述的信息系统,其特征在于,
所述第一存储装置,
当检测出向所述第二卷的远程拷贝的失败时,判断在所述第三卷中是否存储了所述故障信息标志,当所述第三卷中未存储所述故障信息标志时,在将所述故障信息标志存储在所述第三卷中后,执行与所述I/O请求对应的处理。
5.根据权利要求4所述的信息系统,其特征在于,
所述第一存储装置,
当从所述主计算机接收到所述I/O请求时,在所述第三卷中存储了所述故障信息标志时,将所述I/O请求的失败应答发送至所述主计算机。
6.根据权利要求2所述的信息系统,其特征在于,
所述第一以及第二存储装置分别具有多个存储设备、控制器、高速缓冲存储器,
所述第一以及所述第二卷分别由所述多个存储设备的一部分区域构成。
7.根据权利要求6所述的信息系统,其特征在于,具有:
第四存储装置,其与所述第一存储装置相连,由多个存储设备、控制器和高速缓冲存储器构成,并具有由所述多个存储设备的一部分区域构成的第四卷;以及
第五存储装置,其与所述第二存储装置相连,由多个存储设备、控制器和高速缓冲存储器构成,并具有由所述多个存储设备的一部分区域构成的第五卷,
所述第一存储装置,
定义实体存在于所述第四存储装置的所述第四卷中的虚拟卷、即第一虚拟卷,
所述第二存储装置,
定义实体存在于所述第五存储装置的所述第五卷中的虚拟卷、即第二虚拟卷,
所述第一以及所述第二存储装置,
分别在内部设定将所述第一虚拟卷的数据向所述第二虚拟卷拷贝的远程拷贝的对,并且将所述第三卷与所述远程拷贝的对相关联,
所述主计算机,
当向所述第一虚拟卷的I/O请求失败时,将针对所述第二虚拟卷的I/O请求发送至所述第二存储装置。
8.根据权利要求2所述的信息系统,其特征在于,
所述第一以及所述第二存储装置,
定义实体存在于所述第三存储装置的所述第三卷中的虚拟卷、即第三虚拟卷,
所述第二存储装置,
当从所述主计算机接收到I/O请求时,判断在所述第三虚拟卷中是否存储了所述故障信息标志,当在所述第三卷中存储了所述故障信息标志时,将所述I/O请求的失败应答发送至所述主计算机。
9.一种信息系统的I/O处理方法,其特征在于,
所述信息系统具有:
主计算机;
与所述主计算机相连、具有第一卷的第一存储装置,所述第一卷具有卷识别符;
与所述主计算机相连、具有第二卷的第二存储装置,所述第二卷具有与所述第一卷的卷识别符相同的卷识别符;
其中,从所述主计算机到所述第一卷的第一访问路径的优先度高于从所述主计算机到所述第二卷的第二访问路径的优先度;
所述方法包括:
所述第一卷和所述第二卷形成远程拷贝对,并将对所述第一卷的写数据拷贝到所述第二卷;
当所述主计算机发送指定卷识别符的I/O请求时,所述I/O请求通过所述第一访问路径发送给所述第一卷;
当通过所述第一访问路径发送给所述第一卷的I/O请求失败时,将所述I/O请求通过所述第二访问路径发送至所述第二卷;以及
当接收到通过所述第二访问路径从所述主计算机到所述第二卷发送的写请求时,所述第二存储装置停止远程拷贝,处理写请求并且基于所述写请求存储在所述第二卷中记录的数据的写位置。
10.根据权利要求9所述的信息系统的I/O处理方法,还包括与所述第一存储装置以及所述第二存储装置相连、具有第三卷的第三存储装置,
其中,如果所述第一以及所述第二存储装置中的一个存储装置检测到所述第一和所述第二存储装置中的另一个存储装置的故障、或者所述第一以及所述第二存储装置间的连接故障,则所述第一存储装置或所述第二存储装置将表示检测出该故障的故障信息标志存储在所述第三卷中,
其中,当通过所述第二访问路径接收到所述I/O请求时,所述第二存储装置判断在所述第三卷中是否存储了所述故障信息标志,当在所述第三卷中存储了所述故障信息标志时,将所述I/O请求的失败应答发送至所述主计算机,
所述故障信息标志用于在形成远程拷贝的主卷和辅助卷的对中防止对不一致的数据进行误访问。
11.根据权利要求10所述的信息系统的I/O处理方法,其特征在于,
所述第二存储装置,当从所述主计算机接收到所述I/O请求时,在所述第三卷中未存储所述故障信息标志时,在将所述故障信息标志存储在所述第三卷中后,执行与所述I/O请求对应的处理。
12.根据权利要求10所述的信息系统的I/O处理方法,其特征在于,
所述第一存储装置,在检测出向所述第二卷的远程拷贝的失败时,判断在所述第三卷中是否存储了所述故障信息标志,当在所述第三卷中未存储所述故障信息标志时,在将所述故障信息标志存储在所述第三卷中后,执行与所述I/O请求对应的处理。
13.根据权利要求12所述的信息系统的I/O处理方法,其特征在于,
所述第一存储装置,当从所述主计算机接收到所述I/O请求时,在所述第三卷中存储了所述故障信息标志时,将所述I/O请求的失败应答发送至所述主计算机。
14.根据权利要求10所述的信息系统的I/O处理方法,其特征在于,
所述第一以及所述第二存储装置分别具有多个存储设备、控制器、高速缓冲存储器,
所述第一以及所述第二卷分别由所述多个存储设备的一部分区域构成。
15.根据权利要求14所述的信息系统的I/O处理方法,其特征在于,
所述信息系统具有:
第四存储装置,其与所述第一存储装置相连,由多个存储设备、控制器和高速缓冲存储器构成,并具有由所述多个存储设备的一部分区域构成的第四卷;以及
第五存储装置,其与所述第二存储装置相连,由多个存储设备、控制器和高速缓冲存储器构成,并具有由所述多个存储设备的一部分区域构成的第五卷,
所述第一存储装置,定义实体存在于所述第四存储装置的所述第四卷中的虚拟卷、即第一虚拟卷,所述第二存储装置,定义实体存在于所述第五存储装置的所述第五卷中的虚拟卷、即第二虚拟卷,所述第一以及所述第二存储装置分别在内部设定将所述第一虚拟卷的数据向所述第二虚拟卷拷贝的远程拷贝的对,并且将所述第三卷与所述远程拷贝的对相关联,
所述主计算机,当向所述第一虚拟卷的I/O请求失败时,将针对所述第二虚拟卷的I/O请求发送至所述第二存储装置。
16.根据权利要求10所述的信息系统的I/O处理方法,其特征在于,
所述第一以及所述第二存储装置,定义实体存在于所述第三存储装置的所述第三卷中的虚拟卷、即第三虚拟卷,
所述第二存储装置,当从所述主计算机接收到I/O请求时,判断在所述第三虚拟卷中是否存储了所述故障信息标志,当在所述第三卷中存储了所述故障信息标志时,将所述I/O请求的失败应答发送至所述主计算机。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008117646 | 2008-04-28 | ||
JP2008-117646 | 2008-04-28 | ||
JP2008117646A JP5222617B2 (ja) | 2008-04-28 | 2008-04-28 | 情報システム及びi/o処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101571815A CN101571815A (zh) | 2009-11-04 |
CN101571815B true CN101571815B (zh) | 2012-07-04 |
Family
ID=40972877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910005963.XA Active CN101571815B (zh) | 2008-04-28 | 2009-01-22 | 信息系统及i/o处理方法 |
Country Status (6)
Country | Link |
---|---|
US (3) | US8060777B2 (zh) |
EP (1) | EP2113843B1 (zh) |
JP (1) | JP5222617B2 (zh) |
CN (1) | CN101571815B (zh) |
AT (1) | ATE496337T1 (zh) |
DE (1) | DE602008004623D1 (zh) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8843783B2 (en) * | 2006-03-31 | 2014-09-23 | Emc Corporation | Failover to backup site in connection with triangular asynchronous replication |
JP2012531654A (ja) * | 2009-10-09 | 2012-12-10 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの通信パス管理方法 |
JP5555260B2 (ja) * | 2009-12-24 | 2014-07-23 | 株式会社日立製作所 | 仮想ボリュームを提供するストレージシステム |
JPWO2011129006A1 (ja) * | 2010-04-15 | 2013-07-11 | 株式会社日立製作所 | ストレージ装置及びストレージ装置の制御方法 |
US8533539B2 (en) * | 2010-09-17 | 2013-09-10 | Symantec Corporation | Fault handling systems and methods |
WO2012127528A1 (en) | 2011-03-23 | 2012-09-27 | Hitachi, Ltd. | Storage system and method of controlling the same |
JP2012208896A (ja) * | 2011-03-30 | 2012-10-25 | Nec Corp | ディスクアレイ装置、接続経路制御方法、及び接続経路制御プログラム |
JP2013012137A (ja) * | 2011-06-30 | 2013-01-17 | Nec System Technologies Ltd | ディスクミラーリングシステム及びその管理方法 |
US9021223B2 (en) * | 2011-07-22 | 2015-04-28 | Xiotech Corporation | Resilient mirroring |
US9237195B2 (en) * | 2012-04-27 | 2016-01-12 | Netapp, Inc. | Virtual storage appliance gateway |
US9218256B1 (en) * | 2012-05-31 | 2015-12-22 | Symantec Corporation | Systems and methods for shipping I/O operations to prevent replication failure |
US9813353B1 (en) * | 2012-06-07 | 2017-11-07 | Open Invention Network Llc | Migration of files contained on virtual storage to a cloud storage infrastructure |
WO2014002136A1 (en) | 2012-06-26 | 2014-01-03 | Hitachi, Ltd. | Storage system and method of controlling the same |
CN102984002B (zh) * | 2012-11-27 | 2015-05-06 | 华为技术有限公司 | 一种处理i/o超时的方法和装置 |
CN104185841B (zh) * | 2013-03-12 | 2018-08-17 | 株式会社东芝 | 数据库系统、管理装置、节点以及数据处理方法 |
JP6136629B2 (ja) * | 2013-06-25 | 2017-05-31 | 富士通株式会社 | ストレージ制御装置,ストレージシステム,および制御プログラム |
US8996908B1 (en) | 2013-09-30 | 2015-03-31 | Hitachi, Ltd. | Information system, host system and access control method |
WO2015104833A1 (ja) | 2014-01-10 | 2015-07-16 | 株式会社日立製作所 | 情報システム及びi/o処理方法 |
JP6199508B2 (ja) | 2014-04-21 | 2017-09-20 | 株式会社日立製作所 | 情報記憶システム |
GB2539829B (en) * | 2014-04-21 | 2021-05-05 | Hitachi Ltd | Storage system |
US9430321B2 (en) | 2014-05-13 | 2016-08-30 | Netapp, Inc. | Reconstructing data stored across archival data storage devices |
US9557938B2 (en) | 2014-05-13 | 2017-01-31 | Netapp, Inc. | Data retrieval based on storage device activation schedules |
WO2015175720A1 (en) * | 2014-05-13 | 2015-11-19 | Netapp, Inc. | Storage operations utilizing a multiple-data-storage-devices cartridge |
US9424156B2 (en) | 2014-05-13 | 2016-08-23 | Netapp, Inc. | Identifying a potential failure event for a data storage device |
US9430149B2 (en) | 2014-05-13 | 2016-08-30 | Netapp, Inc. | Pipeline planning for low latency storage system |
US9436524B2 (en) | 2014-05-13 | 2016-09-06 | Netapp, Inc. | Managing archival storage |
US9766677B2 (en) | 2014-05-13 | 2017-09-19 | Netapp, Inc. | Cascading startup power draws of enclosures across a network |
US9436571B2 (en) | 2014-05-13 | 2016-09-06 | Netapp, Inc. | Estimating data storage device lifespan |
US9430152B2 (en) | 2014-05-13 | 2016-08-30 | Netapp, Inc. | Data device grouping across data storage device enclosures for synchronized data maintenance |
WO2015189925A1 (ja) | 2014-06-11 | 2015-12-17 | 株式会社日立製作所 | ストレージシステム、ストレージ装置及びデータ移行方法 |
JP6230707B2 (ja) * | 2014-06-26 | 2017-11-15 | 株式会社日立製作所 | ストレージシステム |
WO2016024994A1 (en) * | 2014-08-15 | 2016-02-18 | Hitachi, Ltd. | Method and apparatus to virtualize remote copy pair in three data center configuration |
JP2016143248A (ja) | 2015-02-02 | 2016-08-08 | 富士通株式会社 | ストレージ制御装置及びストレージ制御プログラム |
WO2017064770A1 (ja) | 2015-10-14 | 2017-04-20 | 株式会社日立製作所 | ストレージシステムおよびストレージシステムの制御方法 |
WO2019003416A1 (ja) | 2017-06-30 | 2019-01-03 | 株式会社日立製作所 | ストレージシステム及び記憶制御方法 |
US11003372B2 (en) | 2018-05-31 | 2021-05-11 | Portworx, Inc. | Protecting volume namespaces from corruption in a distributed container orchestrator |
JP2020052464A (ja) | 2018-09-21 | 2020-04-02 | 株式会社日立製作所 | リモートレプリケーションを行うストレージシステム |
JP7363413B2 (ja) | 2019-11-27 | 2023-10-18 | 富士通株式会社 | 情報処理装置、情報処理システム及びプログラム |
US11100027B1 (en) * | 2020-02-26 | 2021-08-24 | EMC IP Holding Company LLC | Storage device protocol dual personality |
JP2022124054A (ja) | 2021-02-15 | 2022-08-25 | 株式会社日立製作所 | ストレージシステム、ストレージ装置及びストレージ装置管理方法 |
JP2023084777A (ja) | 2021-12-08 | 2023-06-20 | 株式会社日立製作所 | ディザスタリカバリシステム及びディザスタリカバリ方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6829721B2 (en) * | 2001-02-05 | 2004-12-07 | M-Systems Flash Disk Pioneers Ltd. | Method for recording and storage of system information in multi-board solid-state storage systems |
US7103727B2 (en) * | 2002-07-30 | 2006-09-05 | Hitachi, Ltd. | Storage system for multi-site remote copy |
JP4214832B2 (ja) * | 2002-07-30 | 2009-01-28 | 株式会社日立製作所 | 記憶装置システム |
JP4202709B2 (ja) * | 2002-10-07 | 2008-12-24 | 株式会社日立製作所 | ストレージ装置を有するネットワークにおける、ボリューム及び障害管理方法 |
JP2005062928A (ja) * | 2003-08-11 | 2005-03-10 | Hitachi Ltd | 複数のサイトにリモートコピーを行うシステム |
JP2005165444A (ja) * | 2003-11-28 | 2005-06-23 | Hitachi Ltd | ディスクアレイ装置、及びディスクアレイ装置の制御方法 |
KR100616594B1 (ko) * | 2004-07-02 | 2006-08-28 | 삼성전기주식회사 | 색 혼합성이 향상된 rgb 발광 다이오드 패키지 |
US7131027B2 (en) * | 2004-07-09 | 2006-10-31 | Hitachi, Ltd. | Method and apparatus for disk array based I/O routing and multi-layered external storage linkage |
US7058731B2 (en) * | 2004-08-03 | 2006-06-06 | Hitachi, Ltd. | Failover and data migration using data replication |
JP4648751B2 (ja) * | 2005-05-02 | 2011-03-09 | 株式会社日立製作所 | 記憶制御システム及び記憶制御方法 |
JP2006344090A (ja) * | 2005-06-10 | 2006-12-21 | Hitachi Ltd | Sanディザスタリカバリシステム |
JP2007122531A (ja) | 2005-10-31 | 2007-05-17 | Hitachi Ltd | 負荷分散システム及び方法 |
JP5124103B2 (ja) | 2006-05-16 | 2013-01-23 | 株式会社日立製作所 | 計算機システム |
US7877628B2 (en) * | 2006-06-08 | 2011-01-25 | International Business Machines Corporation | Mirroring data between primary and secondary sites |
JP4861126B2 (ja) | 2006-11-06 | 2012-01-25 | 一雄 岡野 | 空間電荷バランス制御システム |
-
2008
- 2008-04-28 JP JP2008117646A patent/JP5222617B2/ja not_active Expired - Fee Related
- 2008-10-09 US US12/248,138 patent/US8060777B2/en not_active Expired - Fee Related
- 2008-12-10 AT AT08171201T patent/ATE496337T1/de not_active IP Right Cessation
- 2008-12-10 EP EP08171201A patent/EP2113843B1/en active Active
- 2008-12-10 DE DE602008004623T patent/DE602008004623D1/de active Active
-
2009
- 2009-01-22 CN CN200910005963.XA patent/CN101571815B/zh active Active
-
2011
- 2011-11-15 US US13/296,260 patent/US8352783B2/en active Active
-
2012
- 2012-12-21 US US13/724,641 patent/US8595549B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8595549B2 (en) | 2013-11-26 |
US20090271582A1 (en) | 2009-10-29 |
US8060777B2 (en) | 2011-11-15 |
JP5222617B2 (ja) | 2013-06-26 |
ATE496337T1 (de) | 2011-02-15 |
EP2113843A1 (en) | 2009-11-04 |
EP2113843B1 (en) | 2011-01-19 |
US8352783B2 (en) | 2013-01-08 |
JP2009266120A (ja) | 2009-11-12 |
DE602008004623D1 (de) | 2011-03-03 |
US20120060051A1 (en) | 2012-03-08 |
CN101571815A (zh) | 2009-11-04 |
US20130132767A1 (en) | 2013-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101571815B (zh) | 信息系统及i/o处理方法 | |
US7269667B2 (en) | Disk array system and method for migrating from one storage system to another | |
US7660946B2 (en) | Storage control system and storage control method | |
US7467275B2 (en) | Capacity expansion volume migration method | |
US8234467B2 (en) | Storage management device, storage system control device, storage medium storing storage management program, and storage system | |
US7930474B2 (en) | Automated on-line capacity expansion method for storage device | |
US7631157B2 (en) | Offsite management using disk based tape library and vault system | |
JP4949088B2 (ja) | 階層型ストレージシステム間でのリモートミラー方式 | |
CN100407121C (zh) | 信息处理系统和一次存储装置 | |
US20040123068A1 (en) | Computer systems, disk systems, and method for controlling disk cache | |
EP4139803B1 (en) | Methods for handling input-output operations in zoned storage systems and devices thereof | |
JP2005326935A (ja) | 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法 | |
US7984260B2 (en) | Storage system provided with a plurality of controller modules | |
CN102024044A (zh) | 分布式文件系统 | |
US10191685B2 (en) | Storage system, storage device, and data transfer method | |
US20060253674A1 (en) | Automatic disk healing | |
JP2008225616A (ja) | ストレージシステム、リモートコピーシステム、及びデータ復元方法 | |
CN113360082A (zh) | 存储系统及其控制方法 | |
US20090177916A1 (en) | Storage system, controller of storage system, control method of storage system | |
WO2016084156A1 (ja) | ストレージシステム | |
WO2014087465A1 (ja) | ストレージ装置及びストレージ装置移行方法 | |
JP6318769B2 (ja) | ストレージ制御装置、制御プログラム、および制御方法 | |
JP2008305223A (ja) | リストア制御プログラム、リストア制御方法、リストア制御装置、およびリストア制御システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |