CN1805453A - 储存装置数据传输稳定性检测方法及系统 - Google Patents

储存装置数据传输稳定性检测方法及系统 Download PDF

Info

Publication number
CN1805453A
CN1805453A CN200510000376.3A CN200510000376A CN1805453A CN 1805453 A CN1805453 A CN 1805453A CN 200510000376 A CN200510000376 A CN 200510000376A CN 1805453 A CN1805453 A CN 1805453A
Authority
CN
China
Prior art keywords
storage device
data transmission
stability
value
transmission operating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200510000376.3A
Other languages
English (en)
Inventor
林文华
黄建良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN200510000376.3A priority Critical patent/CN1805453A/zh
Publication of CN1805453A publication Critical patent/CN1805453A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

一种储存装置数据传输稳定性检测方法及系统,可搭配至一储存装置,例如独立冗余磁盘阵列,检测该独立冗余磁盘阵列在实际操作时的数据传输稳定性;该系统包括:一传输操作状况监视模块、一计数模块、一加权重统计模块以及一稳定性判别模块;一发明完全依据该独立冗余磁盘阵列的传输操作属性状态判别其稳定性,并依据统计学上的高斯函数判别该独立冗余磁盘阵列的整体传输操作属性状态是否为处于不稳定状况,本发明比现有技术更为精确地判别独立冗余磁盘阵列在实际操作时的数据传输稳定性。

Description

储存装置数据传输稳定性检测方法及系统
技术领域
本发明是关于一种计算机信息技术技术,特别是关于一种储存装置数据传输稳定性检测方法及系统,应用在储存装置,例如是一独立冗余磁盘阵列(Redundant Array of Independent Disks,RAID),检测该储存装置在实际操作时数据传输的稳定性,并可在检测到数据传输稳定性过低时发出信息通知系统管理人员进行必要的维护工作。
背景技术
储存局域网络(Storage Area Network,SAN)是一区域性的网络系统,用来连接到大容量的资料储存装置,例如独立冗余磁盘阵列(Redundant Array of Independent Disks,RAID),储存数量极为庞大的计算机网络资料;且其可通过一数据传输接口,例如光纤信道传输协议(Fibre Channel Protocol,FCP),连接到服务器,让服务器与独立冗余磁盘阵列之间进行数据传输。
在网络应用上,独立冗余磁盘阵列的数据传输稳定性是一项重要的操作属性;也就是高稳定性的独立冗余磁盘阵列可持久地让服务器提供正确的资料服务工作,稳定性过低的独立冗余磁盘阵列则会让资料存取动作发生错误的机率过高。因此网络系统管理一项重要的工作就是持续检测独立冗余磁盘阵列的数据传输的稳定性,并在检测到数据传输稳定性过低时对该独立冗余磁盘阵列进行必要的维护工作。
目前常用的一种独立冗余磁盘阵列稳定性检测方法是采用一轫体程序,监视独立冗余磁盘阵列在实际操作时一些物理性的操作属性,例如操作温度、转速等等,判断独立冗余磁盘阵列是否处于正常的操作状态。然而这种稳定性检测方法检测的操作属性并不是关于数据传输上的操作属性,因此并不能代表独立冗余磁盘阵列在实际操作时的数据传输稳定性。
发明内容
为克服上述现有技术的缺点,本发明的主要目的是在于提供一种储存装置数据传输稳定性检测方法及系统,可检测独立冗余磁盘阵列上关于数据传输上的操作属性,能更为精确地判别独立冗余磁盘阵列在实际操作时数据传输的稳定性。
本发明的储存装置数据传输稳定性检测方法及系统是应用在储存装置,例如是独立冗余磁盘阵列(Redundant Array of Independent Disks,RAID),检测该储存装置在实际操作时的数据传输的稳定性,并可在检测到数据传输稳定性过低时,发出信息通知系统管理人员进行必要的维护工作。
本发明的储存装置数据传输稳定性检测方法包括:周期性地持续监视该储存装置在实际操作时是否发生一组特定的传输操作错误状况;若是,则发出一对应的计数信息;响应每一个计数信息,在一预定周期内统计每一项传输操作错误状况所发生的总次数;将计数得到周期性传输操作错误状况发生总次数分别乘以各项传输操作错误状况所对应的一预定权重值,求出一加权重统计值;预先依据统计学上的高斯函数设定一基准值和一临界值;以及在实际操作时将该加权重统计值减去该预定的基准值,并比较其差值是否大于该预定的临界值;若是则发出一稳定性过低信息。
本发明的储存装置数据传输稳定性检测系统包括:一传输操作状况监视模块,监视该储存装置在实际操作时是否发生一组特定的传输操作错误状况;若是,则发出一对应的统计信息;一计数模块,可其响应该传输操作状况监视模块发出的每一个计数信息,在一预定周期内统计该传输操作状况监视模块监视到的每一项传输操作错误状况所发生的总次数;一加权重统计模块,将该计数模块所统计得到周期性传输操作错误状况发生总次数分别乘以各项传输操作错误状况所对应的一预定权重值,求出一加权重统计值;以及一稳定性判别模块,可预先依据统计学上的高斯函数设定一基准值和一临界值,并可在实际操作时将该加权重统计模块求出的加权重统计值减去该预定的基准值,并比较其差值是否大于该预定的临界值;若是则发出一稳定性过低信息。
本发明的储存装置数据传输稳定性检测方法及系统可周期性地持续监视储存装置在实际操作时是否发生一些传输操作错误状况,例如包括:(1)瞬时错误状况(transient error);(2)定时中断状况(timeout);(3)重置状况(reset);(4)奇偶错误状况(parity error);(5)滋生缺陷状况(grown defect);(6)盘片错误状况(disk error);(7)使用者操控错误状况(user error);(8)智能参数(smart value)错误状况;以及(9)存取操作(inquiry)错误状况;并统计各项传输操作错误状况在一预定期间内发生的总次数,且将这些传输操作错误状况依据其重要程度分别指定一对应的权重值,并将各项传输操作错误状况发生的总次数分别乘以其对应的权重值,再接着依据统计学上的高斯函数判别该储存装置是否处于不稳定状况;若是则发出一稳定性过低信息来令系统管理人员对该储存装置进行必要的维护工作。由于本发明是完全依据储存装置的传输操作属性状态判别其稳定性,因此比现有技术更为精确地判别独立冗余磁盘阵列在实际操作时的数据传输稳定性。
附图说明
图1是本发明的储存装置数据传输稳定性检测系统的应用架构及其对象导向组件模型的基本架构。
具体实施方式
实施例
以下即配合附图,详细说明本发明的储存装置数据传输稳定性检测方法及系统的实施例。
图1显示本发明的储存装置数据传输稳定性检测系统(如标号100所指的虚线框包括的部分)的应用架构及其模块化的对象导向组件模型(object-oriented component model)的基本架构。如图所示,本发明的储存装置数据传输稳定性检测系统100在实际应用上是搭载到储存装置10,例如独立冗余磁盘阵列(Redundant Array of Independent Disks,RAID),检测该储存装置10在实际操作时的数据传输的稳定性,并可在检测到数据传输稳定性过低时,发出信息通知系统管理人员进行必要的维护工作。
在实际操作时,本发明的储存装置数据传输稳定性检测系统100可监视该储存装置10在实际操作时是否有发生一些传输操作错误状况,例如包括以下9项传输操作错误状况:(1)瞬时错误状况(transienterror);(2)定时中断状况(timeout);(3)重置状况(reset);(4)奇偶错误状况(parity error);(5)滋生缺陷状况(grown defect);(6)盘片错误状况(disk error);(7)使用者操控错误状况(user error);(8)智能参数(smartvalue)错误状况;以及(9)存取操作(inquiry)错误状况;且进而统计各项传输操作错误状况在一预定周期内发生的总次数,并将各项传输操作错误状况发生的总次数,依据其重要程度分别乘以一对应的权重值,接着依据统计学上的高斯函数(Gaussian Function)判别该储存装置10是否处于不稳定状况;若是则发出一稳定性过低信息令系统管理人员对该储存装置10进行必要的维护工作。
在具体实施上,上述9项传输操作错误状况的指定权重值如下表所示:
  编号   传输操作错误状况   指定权重值   对应的变量名称
  1   瞬时错误状况(transient error)   1   OP(1)
  2   定时中断状况(timeout)   1   OP(2)
  3   重置状况(reset)   1   OP(3)
  4   奇偶错误状况(parity error)   1   OP(4)
  5   滋生缺陷状况(grown defect)   2   OP(5)
  6   盘片错误状况(disk error)   2   OP(6)
  7   使用者操控错误状况(user error)   2   OP(7)
  8   智能参数(smart value)错误状况   2   OP(8)
  9   存取操作(inquiry)错误状况   4   OP(9)
上述9项传输操作错误状况中,第(1)项至第(4)项所述的瞬时性错误状况、定时中断状况、重置状况和奇偶错误状况均是排线连接不当引起的问题,属于较为轻微的错误状况,将其权重值设为1;第(5)项至第(8)项所述滋生缺陷状况、盘片错误状况、使用者操控错误状况和智能参数错误状况均为信号传输不当引起的问题,属于略为严重的错误状况,将其权重值设为2;第(9)项所述的存取操作错误状况则属于最为严重的错误状况,将其权重值设为4。该外,上表中的变量名称OP(1)-OP(9)则是用来分别储存上述9项传输操作错误状况在一预定周期内发生的总次数。
如图1所示,本发明的储存装置数据传输稳定性检测系统100的模块化的对象导向组件模型(object-oriented component model)的基本架构至少包括:(a)一传输操作状况监视模块110;(b)一计数模块120;(c)一加权重统计模块130;以及(d)一稳定性判别模块140。
传输操作状况监视模块110可监视该储存装置10在实际操作时是否发生一些传输操作错误状况,例如包括以下9项传输操作错误状况:(1)瞬时错误状况;(2)定时中断状况;(3)重置状况;(4)奇偶错误状况;(5)滋生缺陷状况;(6)盘片错误状况;(7)使用者操控错误状况;(8)智能参数错误状况;以及(9)存取操作错误状况;且可在每当监视到该储存装置10发生任何一项传输操作错误状况时,即会发出一对应的计数信息到计数模块120。
计数模块120可响应上述传输操作状况监视模块110发出的每一个计数信息,将该传输操作状况监视模块110监视到的传输操作错误状况所对应的变量加1,统计各项传输操作错误状况在一预定周期内发生的总次数。举例来说,每当传输操作状况监视模块110监视到一次瞬时错误状况,则计数模块120即会响应地将瞬时错误状况对应的变量OP(1)加1;每当传输操作状况监视模块110监视到一次定时中断状况,则计数模块120即会响应地将定时中断状况对应的变量OP(2)加1;依此类推。因变量OP(1)至OP(9)的值即分别代表上述9项传输操作错误状况在一预定周期内发生过的总次数。
加权重统计模块130可将上述计数模块120所计数得到周期性传输操作错误状况发生总次数资料,也就是变量OP(1)-OP(9)的值,分别乘以各项传输操作错误状况所对应的权重值,求得一加权重统计值F,其公式如下所示:
F = 1 2 1 2 4 2 1 2 1 · OP ( 1 ) OP ( 8 ) OP ( 2 ) OP ( 5 ) OP ( 9 ) OP ( 7 ) OP ( 3 ) OP ( 6 ) OP ( 4 )
稳定性判别模块140可依据统计学上的高斯函数(GaussianFunction)预先设定一基准值A和一临界值B,并将上述加权重统计模块130求得的加权重统计值F减去该预定的基准值A,再接着比较其差值是否大于该预定的临界值B(即是否F-A>B?);若否,则表示该储存装置10的整体数据传输状态处于接受的稳定性范围之内;反之若是,则表示该储存装置10的整体数据传输状态处于不稳定的状况,因此发出一稳定性过低信息通知系统管理人员进行必要的维护工作。在具体实施上,该基准值A和临界值B例如是依据统计学上的高斯函数预先求得。
请参阅图1,在实际应用上,本发明的储存装置数据传输稳定性检测方法实现过程是:每当储存装置10开始实际操作时,即可激活本发明的储存装置数据传输稳定性检测系统100,对该储存装置10进行一周期性的稳定性检测程序,其中首先由传输操作状况监视模块110持续监视该储存装置10在实际操作时是否发生一些传输操作错误状况,传输操作错误状况包括以下9项:(1)瞬时错误状况;(2)定时中断状况;(3)重置状况;(4)奇偶错误状况;(5)滋生缺陷状况;(6)盘片错误状况;(7)使用者操控错误状况;(8)智能参数错误状况;以及(9)存取操作错误状况;每当监视到该储存装置10发生任何一项传输操作错误状况时,即会发出一对应的计数信息至计数模块120,令计数模块120响应地将该传输操作状况监视模块110所监视到的传输操作错误状况所对应的变量加1,在一预定周期内统计各项传输操作错误状况发生的总次数,并将统计得到周期性传输操作错误状况发生总次数资料,也就是变量OP(1)-OP(9)的值,传送给加权重统计模块130,令加权重统计模块130将各个传输操作错误状况的发生总次数OP(1)-OP(9)分别乘以对应的权重值,也就是执行下列的公式:
F = 1 2 1 2 4 2 1 2 1 · OP ( 1 ) OP ( 8 ) OP ( 2 ) OP ( 5 ) OP ( 9 ) OP ( 7 ) OP ( 3 ) OP ( 6 ) OP ( 4 )
求出加权重统计值F。接着令稳定性判别模块140将加权重统计模块130求出的加权重统计值F,减去依据统计学的高斯函数预先指定的基准值A,并比较其差值是否大于一预定的临界值B(即是否F-A>B?);若否(即F-A<B),则表示该储存装置10处于可接受的稳定性范围内;反之若是(即F-A>B),则表示该储存装置10处于不稳定的操作状况,因此发出一稳定性过低信息,并将该稳定性过低信息例如以文字形式显示在系统管理人员的工作站(未标出),令系统管理人员对该不稳定的储存装置10进行必要的维护工作。
总而言之,本发明提供了一种新颖的储存装置数据传输稳定性检测方法及系统,可应用在硬盘装置,例如独立冗余磁盘阵列,检测该储存装置在实际操作时的稳定性;本发明可周期性地持续监视储存装置在实际操作时是否发生一些传输操作错误状况,并在一预定期间内统计各项传输操作错误状况发生的总次数,且将这些传输操作错误状况依据其重要程度分别指定一对应的权重值,并将各项传输操作错误状况发生的总次数分别乘以其对应的权重值,再接着依据统计学上的高斯函数判别该储存装置是否处于不稳定状况;若是则发出一稳定性过低信息,令系统管理人员对该储存装置进行维护工作。由于本发明完全依据独立冗余磁盘阵列的传输操作属性状态判别其稳定性,因此比现有技术更精确地判别独立冗余磁盘阵列在实际操作时的数据传输稳定性。

Claims (6)

1.一种储存装置数据传输稳定性检测方法,应用在一数据传输接口、且该数据传输接口耦接于一计算机系统与一储存装置之间,对该计算机系统与该储存装置之间的整体数据传输状态提供一稳定性检测功能,其特征在于,该储存装置数据传输稳定性检测方法至少包括:
周期性地持续监视该储存装置在实际操作时是否发生一组特定的传输操作错误状况;若是,则发出一对应的计数信息;
响应每一个计数信息,在一预定周期内统计每一项传输操作错误状况所发生的总次数;
将计数得到周期性传输操作错误状况发生总次数分别乘以各项传输操作错误状况所对应的一预定权重值,求出一加权重统计值;
预先依据统计学上的高斯函数设定一基准值和一临界值;以及
在实际操作时将该加权重统计值减去该预定的基准值,并比较其差值是否大于该预定的临界值;若是则发出一稳定性过低信息。
2.如权利要求1所述的储存装置数据传输稳定性检测方法,其特征在于,该计算机系统是一服务器。
3.如权利要求1所述的储存装置数据传输稳定性检测方法,其特征在于,该储存装置是独立冗余磁盘阵列。
4.一种储存装置数据传输稳定性检测系统,搭配至一数据传输接口、且该数据传输接口耦接于一计算机系统与一储存装置之间,对该计算机系统与该储存装置之间的整体数据传输状态提供一稳定性检测功能,其特征在于,该储存装置数据传输稳定性检测系统至少包括:
一传输操作状况监视模块,监视该储存装置在实际操作时是否发生一组特定的传输操作错误状况;若是,则发出一对应的统计信息;
一计数模块,可其响应该传输操作状况监视模块发出的每一个计数信息,在一预定周期内统计该传输操作状况监视模块监视到的每一项传输操作错误状况所发生的总次数;
一加权重统计模块,将该计数模块所统计得到周期性传输操作错误状况发生总次数分别乘以各项传输操作错误状况所对应的一预定权重值,求出一加权重统计值;以及
一稳定性判别模块,可预先依据统计学上的高斯函数设定一基准值和一临界值,并可在实际操作时将该加权重统计模块求出的加权重统计值减去该预定的基准值,并比较其差值是否大于该预定的临界值;若是则发出一稳定性过低信息。
5.如权利要求4所述的储存装置数据传输稳定性检测系统,其特征在于,该计算机系统是一服务器。
6.如权利要求4所述的储存装置数据传输稳定性检测系统,其特征在于,该储存装置是独立冗余磁盘阵列。
CN200510000376.3A 2005-01-10 2005-01-10 储存装置数据传输稳定性检测方法及系统 Pending CN1805453A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200510000376.3A CN1805453A (zh) 2005-01-10 2005-01-10 储存装置数据传输稳定性检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200510000376.3A CN1805453A (zh) 2005-01-10 2005-01-10 储存装置数据传输稳定性检测方法及系统

Publications (1)

Publication Number Publication Date
CN1805453A true CN1805453A (zh) 2006-07-19

Family

ID=36867284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200510000376.3A Pending CN1805453A (zh) 2005-01-10 2005-01-10 储存装置数据传输稳定性检测方法及系统

Country Status (1)

Country Link
CN (1) CN1805453A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012847A (zh) * 2010-12-06 2011-04-13 创新科存储技术有限公司 一种改进的磁盘阵列重建方法
CN101641991B (zh) * 2007-03-26 2014-01-22 高通股份有限公司 用于具有各种行为的失去服务处理的方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101641991B (zh) * 2007-03-26 2014-01-22 高通股份有限公司 用于具有各种行为的失去服务处理的方法和装置
CN102012847A (zh) * 2010-12-06 2011-04-13 创新科存储技术有限公司 一种改进的磁盘阵列重建方法
CN102012847B (zh) * 2010-12-06 2013-05-08 创新科存储技术有限公司 一种磁盘阵列重建方法

Similar Documents

Publication Publication Date Title
CN107707376B (zh) 一种监控和告警的方法和系统
WO2019233047A1 (zh) 基于电网调度的运维方法
US6405329B1 (en) Method and apparatus for HDD time stamp benchmark and installation identification
CN201821366U (zh) 一种机房环境温湿度实时监控系统
CN105468765B (zh) 一种多节点web服务异常检测方法和系统
CN102638378B (zh) 一种集成异构存储设备的海量存储系统监控方法
CN105262210A (zh) 一种变电站网络安全性分析预警系统和方法
CN102722431A (zh) 进程监控方法及装置
CN1477509A (zh) 一种进程自动恢复方法
CN102882700A (zh) 一种网管系统中的告警信息管理方法及设备
CN114154035A (zh) 一种动环监控的数据处理系统
CN102981939B (zh) 磁盘监控方法
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及系统
CN113067717A (zh) 网络请求日志链式跟踪方法、全链路调用监控系统和介质
CN104863798A (zh) 基于分布式存储的风电机组状态监测系统及其监测方法
CN1805453A (zh) 储存装置数据传输稳定性检测方法及系统
CN113076229B (zh) 一种通用的企业级信息技术监控系统
CN110445694A (zh) 一种基于Zabbix监控触发通知的方法
CN113553236B (zh) 一种数据中心物理机集中自动化管理系统及方法
CN106649034A (zh) 一种可视化智能运维方法及平台
CN110517174A (zh) 智慧馆库管理平台及其智慧化管理方法
CN102521388B (zh) 一种用于电力信息检索的低耦合高可用装置
CN107395437A (zh) 异地路由数据传输方法及装置
CN114297020A (zh) 企业工控安全大脑平台系统及运行方法
CN103309929A (zh) 存储和检索数据的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication