CN102790695A - 服务器i/o子系统性能瓶颈诊断系统及方法 - Google Patents
服务器i/o子系统性能瓶颈诊断系统及方法 Download PDFInfo
- Publication number
- CN102790695A CN102790695A CN2012102549349A CN201210254934A CN102790695A CN 102790695 A CN102790695 A CN 102790695A CN 2012102549349 A CN2012102549349 A CN 2012102549349A CN 201210254934 A CN201210254934 A CN 201210254934A CN 102790695 A CN102790695 A CN 102790695A
- Authority
- CN
- China
- Prior art keywords
- diagnostic
- rule
- data acquisition
- module
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明实施例提供一种服务器I/O子系统性能瓶颈诊断系统及方法,系统包括数据采集系统,用于根据诊断规则中的数据采集控制参数对性能参数进行采集,获得监控结果,并根据诊断规则中的监控结果输出控制参数发送监控结果给I/O瓶颈诊断规则库;I/O瓶颈诊断规则库,与数据采集系统连接,用于向数据采集系统提供数据采集控制参数和监控结果输出控制参数,并根据诊断规则中的诊断配置参数对接收到的监控结果进行性能诊断,获得诊断结果,并根据诊断规则中的诊断结果输出控制参数发送诊断结果给诊断输出模块;诊断输出模块,与I/O瓶颈诊断规则库连接,用于接收诊断结果,并显示诊断结果。本发明实施例能够提升I/O性能瓶颈的诊断效率。
Description
技术领域
本发明实施例涉及计算机存储技术领域,尤其涉及一种服务器I/O子系统性能瓶颈诊断系统及方法。
背景技术
事务交易性能委员会基准测试C(Transaction Processing PerformanceCouncil-Benchmark C,简称TPC-C)是一个模拟比较复杂并具有代表意义的在线事物处理(Online Transaction Processing,简称OLTP)运用环境的测试。OLTP是传统的关系型数据库的主要应用,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。
在对OLTP进行TPC-C测试时发现,OLTP应用模型是一个输入/输出(IN/OUT,简称I/O)访问密集型的应用场景,I/O子系统的性能直接关系着OLTP应用模型下的数据库系统的应用。I/O子系统的性能瓶颈制约着数据库系统的吞吐量,直接影响数据库系统的整体性能。
现有技术中主要通过经验和手动方式对I/O子系统的性能瓶颈进行定位及优化,这样往往需要进行大量的性能数据监控,同时还需进行大量的性能数据分析工作,而这些都需要较多的调优经验以及对数据库系统足够熟悉才能完成,且需要较多的时间,效率较低。
发明内容
本发明实施例提供一种服务器I/O子系统性能瓶颈诊断系统及方法,用以提升服务器I/O子系统性能瓶颈诊断的效率。
本发明实施例一方面提供了一种服务器I/O子系统性能瓶颈诊断系统;包括:
数据采集系统,用于根据诊断规则中的数据采集控制参数,对性能参数进行采集,获得监控结果;并根据所述诊断规则中的监控结果输出控制参数,发送所述监控结果给I/O瓶颈诊断规则库;
所述I/O瓶颈诊断规则库,与所述数据采集系统连接,用于向所述数据采集系统提供所述数据采集控制参数和所述监控结果输出控制参数,并根据所述诊断规则中的诊断配置参数,对接收到的所述监控结果进行性能诊断,获得诊断结果;并根据所述诊断规则中的诊断结果输出控制参数,发送所述诊断结果给诊断输出模块;
所述诊断输出模块,与所述I/O瓶颈诊断规则库连接,用于接收所述诊断结果,并显示所述诊断结果。
本发明实施例另一方面提供了一种服务器I/O子系统性能瓶颈诊断方法:包括:
数据采集系统从I/O瓶颈诊断规则库获取诊断规则中的数据采集控制参数以及所述诊断规则中的监控结果输出控制参数;
所述数据采集系统根据所述数据采集控制参数,对性能参数进行采集,获得监控结果;
所述数据采集系统根据所述监控结果输出控制参数,发送所述监控结果给所述I/O瓶颈诊断规则库;
所述I/O瓶颈诊断规则库根据所述诊断规则中的诊断配置参数对接收到的所述监控结果进行性能诊断,获得诊断结果;
所述I/O瓶颈诊断规则库根据所述诊断规则中的诊断结果输出控制参数,发送所述诊断结果给诊断输出模块;
所述诊断输出模块接收所述诊断结果,显示所述诊断结果。
本发明实施例提供的服务器I/O子系统性能瓶颈诊断系统及方法,通过建立包括数据采集系统,I/O瓶颈诊断规则库以及诊断输出模块的诊断架构,克服了通过经验和手动方式对I/O子系统的瓶颈进行定位及优化需要大量经验和人力的问题,能够提升服务器I/O子系统性能瓶颈诊断的效率,节省时间和人力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的服务器I/O子系统性能瓶颈诊断系统的结构示意图;
图2为本发明另一实施例提供的服务器I/O子系统性能瓶颈诊断系统的结构示意图;
图3为本发明又一实施例提供的服务器I/O子系统性能瓶颈诊断系统的结构示意图;
图4为本发明实施例提供的数据采集系统结构示意图;
图5为本发明一实施例提供的服务器I/O子系统性能瓶颈诊断方法示意图;
图6为本发明又一实施例提供的服务器I/O子系统性能瓶颈诊断流程示意图;
图7为本发明另一实施例提供的服务器I/O子系统性能瓶颈诊断流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了使本发明实施例能够清楚详细的描述本发明的技术方案,首先将本发明实施例中的诊断规则的各个参数及诊断规则进行详细的说明。
数据采集控制参数:规定了数据采集系统对性能参数的采集内容,从而获得监控结果;例如:
监控范围:主机、存储或光纤交换机;
监控对象:逻辑单元(Logical Unit Number,简称Lun)、分区或者磁盘;
性能维度:访问次数、延时、并发、每秒进行读写操作的次数(Input/OutputOperations Per Second,简称IOPS);
监控频率:10s、30s或60s等。
监控结果输出控制参数:规定了监控结果输出的内容和格式,例如:将监控范围中的监控对象的性能维度按照时间顺序以数据分割的形式输出;
诊断配置参数:进行性能诊断时的具体比对参数,例如:阈值类的特定阈值;性能维度的波动范围。
诊断结果输出控制参数:规定了诊断结果输出的内容,例如:阈值类的输出不符合阈值的数据;性能维度的波动输出对比分析数据,以及优化建议。
本发明实施例主要涉及I/O热点数据诊断规则,I/O异常诊断规则以及I/O堆积诊断规则。但本发明并不限于此,各诊断规则详细如下:
I/O热点数据诊断规则,主要用于分析数据库中的数据文件中是否存在热点以及找到热点数据文件。例如对监控对象Lun的性能维度IOPS进行诊断,当一个Lun的IOPS明显比其他Lun高,即高出值超过了预设值,即该性能维度出现了异常波动,认定该Lun存在I/O热点。在本实施例中,还可对分区或者磁盘进行I/O热点数据诊断,在此不做详细限制。
I/O异常诊断规则,主要用于分析I/O设备性能指标的异常,一般包括两方面的异常:一是性能指标超出阈值,二是性能指标表现出不稳定。前者比如Lun的延时过高,后者比如Lun的延时未超出阈值,但在监控过程中表现出较大或异常的波动。例如对监控对象Lun的性能维度延时进行I/O异常诊断,当一个Lun的延时超过阈值3毫秒,则Lun存在异常。或者,Lun的延时未超出阈值,但在监控过程中表现出很大的波动,即波动范围超出了预设范围,则该Lun表现异常。在本实施例中,还可对分区或者磁盘进行I/O异常诊断,在此不做详细限制。
I/O堆积诊断规则,主要用于分析I/O请求是否正常下发到整个I/O通道,比如光纤交换机、磁阵没有正常下发,即发生了堆积。例如监控对象Lun的性能维度IOPS在主机端监控时处于一个很高的水平,而在光纤交换机端进行监控时则下降到一个较低的水平,两者的差值大于诊断配置参数设定的值,则该Lun在光纤交换机节点处出现了堆积。
需要特别说明的是,下述所提到的参数均为上述所描述的。同时,本领域技术人员可以理解,下述的各系统与模块之间的信息传递是以数据流的方式进行,各系统与模块之间各自有一个发送、接收模块处理彼此间的信息传递。
图1为本发明一实施例提供的服务器I/O子系统性能瓶颈诊断系统的结构示意图。如图1所示,服务器I/O子系统性能瓶颈诊断系统包括数据采集系统10、I/O瓶颈诊断规则库20以及诊断输出模块30。
数据采集系统10用于根据诊断规则中的数据采集控制参数,对性能参数进行采集,获得监控结果;并根据诊断规则中的监控结果输出控制参数,发送监控结果给I/O瓶颈诊断规则库20;
I/O瓶颈诊断规则库20,与数据采集系统10连接,用于向数据采集系统10提供数据采集控制参数和监控结果输出控制参数,并根据诊断规则中的诊断配置参数对接收到的监控结果进行性能诊断,获得诊断结果;并根据诊断规则中的诊断结果输出控制参数,发送诊断结果给诊断输出模块30;
诊断输出模块30,与I/O瓶颈诊断规则库20连接,用于接收I/O瓶颈诊断规则库20输出的诊断结果,并显示诊断结果。
具体地,数据采集系统10用于I/O性能数据的采集,可以使用通用工具或其他适用于数据采集的工具,获得监控结果。诊断规则中的数据采集控制参数定义了数据采集系统10的输入数据。通过对监控范围中监控对象的性能维度的数据进行采集,可以获得监控结果。数据采集系统10获得监控结果后,可以根据诊断规则中的监控结果输出控制参数规定的内容和格式输出。具体地,可以将监控结果中监控对象的性能维度按照时间顺序以数据分割的形式输出。
I/O瓶颈诊断规则库20负责配置、定义、维护和执行瓶颈诊断的诊断规则。具体地,诊断规则可以为I/O热点数据诊断规则、I/O异常诊断规则以及I/O堆积诊断规则等;同时,还可以按照阈值与性能维度波动将诊断规则分为阈值诊断规则以及性能维度波动比较诊断规则。I/O瓶颈诊断规则库20可以根据不同的诊断规则向数据采集系统10提供不同的数据采集控制参数和监控结果输出控制参数。
诊断输出模块30可以将I/O瓶颈诊断结果以不同的方式输出,例如,与阈值诊断规则相关的,可以输出不符合阈值诊断规则的数据,与性能维度波动比较诊断规则相关的,可以输出对比分析数据,输出的方式还可以以优化建议的形式输出,例如改变存储磁盘阵列(Redundant Array of Independent Disks,简称RAID)的级别,热点数据平衡等。
本发明实施例提供的服务器I/O子系统性能瓶颈诊断系统的技术方案,通过建立包括数据采集系统,I/O瓶颈诊断规则库以及诊断输出模块的诊断架构,能够提升服务器I/O子系统性能瓶颈诊断的效率,从而节省时间和人力。
图2为本发明一实施例提供的服务器I/O子系统性能瓶颈诊断系统的结构示意图,如图所示,该诊断系统包括数据采集系统10、I/O瓶颈诊断规则库20以及诊断输出模块30,其中,I/O瓶颈诊断规则库20包括规则输入配置模块201和规则执行模块202。规则输入配置模块201与数据采集系统10连接,可以用于根据用户的选择获取诊断规则,并将诊断规则中的数据采集控制参数和诊断规则中的监控结果输出控制参数,发送给数据采集系统10,将诊断规则中的诊断配置参数和诊断规则中的诊断结果输出控制参数发送给规则执行模块202;
规则执行模块202,与规则输入配置模块201、数据采集系统10和诊断输出模块30连接,用于接收规则输入配置模块201发送的诊断规则中的诊断配置参数和诊断结果输出控制参数,以及接收数据采集系统10发送的监控结果,并根据诊断配置参数对监控结果进行性能诊断,获得诊断结果,根据诊断结果输出控制参数向诊断输出模块30发送诊断结果。
具体地,规则输入配置模块201可将已有的诊断规则呈现出来供用户选择,例如I/O热点数据诊断规则,I/O异常诊断规则以及I/O堆积诊断规则等,当用户选择特定的诊断规则时,规则输入配置模块201可将用户选择的诊断规则对应的数据采集控制参数提供给用户,由用户对数据采集控制参数具体的监控内容作出选择,例如用户可以选择I/O热点数据诊断规则对逻辑单元的IOPS进行监控,或者选择I/O异常诊断规则对逻辑单元的延时进行监控,或者选择I/O堆积诊断规则对逻辑单元在主机端和交换机端的延时进行监控。用户可以根据需要一次选择一条或多条诊断规则。在开始诊断之后,规则输入配置模块201将数据采集控制参数和监控结果输出控制参数传递给数据采集系统10,并将诊断规则对应的诊断配置参数和诊断结果输出控制参数发送给规则执行模块202,启动相应的诊断规则。例如,对于I/O热点数据诊断规则,诊断配置参数可以为阈值,I/O异常诊断规则的配置参数可以为阈值或波动范围,I/O堆积诊断规则的配置参数可以为阈值。
规则执行模块202可以针对I/O子系统进行具体性能瓶颈的诊断,实现依照诊断规则进行自动诊断分析。具体的当用户选择I/O热点数据诊断规则对逻辑单元的IOPS进行监控,对监控结果进行诊断分析,如果一个逻辑单元的IOPS比其它逻辑单元的IOPS高,且高出的范围大于诊断配置参数设定的阈值,则规则执行模块202认定该逻辑单元存在I/O热点;当用户选择I/O异常诊断规则对逻辑单元的延时进行监控,若逻辑单元的延时超过诊断配置参数设定的阈值,则规则执行模块202认定该逻辑单元存在I/O异常,若逻辑单元的延时未超过诊断配置参数设定的阈值,但其波动范围超过了诊断配置参数设定的波动范围,则规则执行模块20同样认定该逻辑单元存在I/O异常;当用户选择I/O堆积诊断规则对逻辑单元在主机端和交换机端的延时进行监控,当逻辑单元在主机端的IOPS处于一个很高的水平,逻辑单元在交换机端的IOPS下降到一个很低的水平,两者的差值大于诊断配置参数设定的值,则规则执行模块202认定在光纤交换机端的逻辑单元存在I/O堆积。规则执行模块202再依据诊断规则中的诊断结果输出控制参数将诊断结果输出。诊断规则中的诊断结果输出控制参数具体定义了规则执行模块202输出的内容。诊断配置参数设定的阈值可以根据瓶颈诊断规则库中的已有数据按照现有公式进行计算。
本实施例的技术方案,通过规则输入配置模块201将已有的诊断规则呈现出来,根据用户的选择能够诊断多种I/O瓶颈;通过规则执行模块202的自动诊断分析,还加快了I/O子系统性能瓶颈诊断的效率,减轻对人员的依赖并提升效率。
图3为本发明又一实施例提供的服务器I/O子系统性能瓶颈诊断系统的结构示意图,如图3所示,该诊断系统包括数据采集系统10、I/O瓶颈诊断规则库20以及诊断输出模块30。其中,诊断输出模块30包括结果呈现模块301和规则更新模块302;I/O瓶颈诊断规则库20在图2中所示的I/O瓶颈诊断规则库20的基础上,还包括:自我修正模块204、规则定义模块203。结果呈现模块301,与规则执行模块202连接,用于接收并显示规则执行模块202发送的诊断结果。规则更新模块302,与结果呈现模块301连接,用于根据诊断结果,向自我修正模块204发送对诊断规则的更新请求。自我修正模块204与规则更新模块302连接,用于根据更新请求对诊断规则进行修正。规则定义模块203,与自我修正模块204和规则输入配置模块201连接,用于存储自我修正模块204修正的诊断规则,并提供给规则输入配置模块201。
具体地,结果呈现模块301,用于将规则执行模块202做出的瓶颈诊断结果进行呈现,上述I/O热点数据诊断规则,I/O异常诊断规则以及I/O堆积诊断规则中,与阈值相关的诊断呈现不符合阈值的数据,与性能维度波动相关的呈现对比分析数据,输出的方式还可以以优化建议的形式输出。具体的呈现方式与用户最初选择的诊断规则相关。
规则更新模块302可以对诊断配置参数设定的阈值进行更新。因为不同的I/O设备进行I/O瓶颈诊断根据实际情况阈值可能不同,例如磁盘阵列和光纤交换机的I/O延时时间不同,则其瓶颈诊断的阈值不同。当瓶颈诊断的阈值不合适时,可通过规则更新模块302对诊断配置参数设定的阈值进行更新。
规则定义模块203,用于存储经过修正的诊断规则,并提供给规则输入配置模块201。规则定义模块203还定义了诊断规则中的数据采集控制参数,监控结果输出控制参数,诊断配置参数以及诊断结果输出控制参数。这些参数将被规则输入配置模块201读取,并由规则输入配置模块201进行配置。
本实施例的技术方案,通过结果呈现模块301对诊断结果的呈现,以及优化建议,可以解决I/O子系统出现的瓶颈问题;通过规则更新模块302向自我修正模块204发送对诊断规则的更新请求,可以更新和完善I/O瓶颈诊断规则库20;通过自我修正模块204对诊断规则的更新,使I/O瓶颈诊断的适用性增强,能够适用多种I/O设备的瓶颈诊断;通过规则定义模块203对各种输入输出参数以及诊断规则的定义,使瓶颈诊断具有统一的标准,诊断结果具有可比性,利于提出优化建议。
图4为本发明实施例提供的数据采集系统结构示意图,如图4所示,上述各实施例中数据采集系统10包括采集模块105和发送模块106,其中采集模块包括105包括主机采集子模块101、存储采集子模块102、交换机采集子模块103中的任一或其组合。其中主机采集子模块101用于根据诊断规则中的数据采集控制参数,对主机端进行性能参数的采集,获得监控结果;存储采集子模块102用于根据诊断规则中的数据采集控制参数,对存储端进行性能参数的采集,获得监控结果;交换机采集子模块103用于根据诊断规则中的数据采集控制参数,对交换机端进行性能参数的采集,获得监控结果。发送模块106用于根据诊断规则中的监控结果输出控制参数,发送采集模块获得的监控结果给I/O瓶颈诊断规则库。本实施例的技术方案,通过对主机端,存储端以及交换机端的性能参数的采集,能够覆盖整个I/O子系统路径上的诊断需求;
上述的采集模块10还包括历史数据采集子模块104,用于向I/O瓶颈诊断规则库提供用于事后分析的历史监控结果,具体可以为向I/O瓶颈诊断规则库中的规则执行模块202提供用于事后分析的历史监控结果。其中,历史监控结果可以是主机采集子模块101、存储采集子模块102和交换机采集子模块103的数据记录或备份。
通过历史数据采集子模块104向规则执行模块202提供历史数据,使规则执行模块202能够在诊断过程结束后,根据用户的需求,对历史数据进行事后分析。本领域技术人员可以理解,进行事后分析,即规则执行模块202根据用户选择的诊断规则,对历史数据进行分析。
图5为本发明一实施例提供的服务器I/O子系统性能瓶颈诊断方法示意图。如图5所示,本发明实施例提供的服务器I/O子系统性能瓶颈诊断方法包括以下步骤:
S501:数据采集系统从I/O瓶颈诊断规则库获取诊断规则中的数据采集控制参数以及诊断规则中的监控结果输出控制参数;
S502:数据采集系统根据数据采集控制参数,对性能参数进行采集,获得监控结果;
S503:数据采集系统根据监控结果输出控制参数,发送监控结果给I/O瓶颈诊断规则库;
S504:I/O瓶颈诊断规则库根据诊断规则中的诊断配置参数对接收到的监控结果进行性能诊断,获得诊断结果;
S505:I/O瓶颈诊断规则库根据诊断规则中的诊断结果输出控制参数,发送诊断结果给诊断输出模块;
S506:诊断输出模块接收诊断结果,显示诊断结果。
本发明实施例提供的服务器I/O子系统性能瓶颈诊断方法,通过数据采集系统对性能参数进行采集获得监控结果,并将监控结果发送给I/O瓶颈诊断规则库,由I/O瓶颈诊断规则库进行性能诊断,获得诊断结果,避免了通过经验和手动方式对I/O子系统的瓶颈进行定位及优化需要大量经验和人力的问题,能够提升服务器I/O子系统性能瓶颈诊断的效率,节省时间和人力。
可选地,在数据采集系统从I/O瓶颈诊断规则库获取诊断规则中的数据采集控制参数以及诊断规则中的监控结果输出控制参数之前,I/O瓶颈诊断规则库还根据用户的选择确定诊断规则。
本发明实施例提供的服务器I/O子系统性能瓶颈诊断方法,通过规则输入配置模块根据用户的选择确定诊断规则,使规则执行模块能够根据用户的选择进行诊断分析,加快了I/O子系统性能瓶颈诊断的效率,减轻了对人员的依赖。
可选地,服务器I/O子系统性能瓶颈诊断方法还包括:诊断输出模块根据诊断结果,向I/O瓶颈诊断规则库发送对诊断规则的更新请求;I/O瓶颈诊断规则库根据更新请求对诊断规则进行修正,并存储修正的诊断规则。
本发明实施例提供的技术方案,通过规则更新模块根据诊断结果向I/O瓶颈诊断规则库发送对诊断规则的更新请求,可以更新和完善I/O瓶颈诊断规则库;通过I/O瓶颈诊断规则库根据更新请求对诊断规则进行修正,并存储修正的诊断规则,使I/O瓶颈诊断的适用性增强,能够适用多种I/O设备的瓶颈诊断。
在上述方法中,数据采集系统根据数据采集控制参数,对性能参数进行采集包括如下方法中的任一或其组合:
数据采集系统根据数据采集控制参数对主机端进行性能参数的采集,数据采集系统根据数据采集控制参数对存储端进行性能参数的采集,数据采集系统根据数据采集控制参数对交换机端进行性能参数的采集。
本实施例的技术方案,通过对主机端,存储端以及交换机端进行性能参数的采集,能够覆盖整个I/O子系统路径上的诊断需求。
可选地,数据采集系统根据数据采集控制参数,对性能参数进行采集还包括数据采集系统对用于事后分析的历史监控结果进行采集,具体的,可以是提供主机采集子模块、存储采集子模块和交换机采集子模块的数据记录或备份。
本发明实施例提供的服务器I/O子系统性能瓶颈诊断方法,与本发明实施例提供的服务器I/O子系统性能瓶颈诊断系统相对应,并可通过本发明实施例提供的服务器I/O子系统性能瓶颈诊断系统实现。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述服务器I/O子系统性能瓶颈诊断方法的具体过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图6为本发明又一实施例提供的服务器I/O子系统性能瓶颈诊断流程示意图。如图6所示,服务器I/O子系统性能瓶颈诊断流程主要包括以下步骤:
S601:I/O瓶颈诊断规则库接收数据采集系统发送的监控结果,该监控结果是数据采集系统对性能参数进行采集所获得的;
S602:I/O瓶颈诊断规则库根据诊断规则中的诊断配置参数对所接收的监控结果进行性能诊断,获得诊断结果;
S603:I/O瓶颈诊断规则库发送诊断结果给诊断输出模块,以便诊断输出模块显示诊断结果。
本发明实施例提供的技术方案,通过数据采集系统,I/O瓶颈诊断规则库以及诊断输出模块之间的相互配合,能够完成一次瓶颈诊断。
在此流程的基础上,将I/O瓶颈诊断规则库的功能进行细分,将其内部划分为规则输入配置模块,规则执行模块,规则定义模块以及自我修正模块,各模块之间相互配合,使I/O瓶颈诊断规则库能够对性能瓶颈进行诊断。
对应地,将诊断输出模块的功能进行细分,将其内部划分为结果呈现模块和规则更新模块,二者之间相互配合,完成诊断输出模块对诊断结果的显示。
图7为本发明另一实施例提供的服务器I/O子系统性能瓶颈诊断流程示意图。
步骤1:规则输入配置模块将诊断规则呈现出来,供用户选择一个或多个已有的诊断规则,从规则定义模块读取相应诊断规则的数据采集控制参数提供给用户配置。开始诊断时,规则输入配置模块将诊断规则中的数据采集控制参数和诊断规则中的监控结果输出控制参数传递给数据采集系统中的主机采集子模块、存储采集子模块以及交换机采集子模块,并发送消息给规则执行模块启动诊断规则。
步骤2:启动系统业务模块,此步骤可将数据库系统业务启动起来,以便对性能数据进行采集,不是必选的。
步骤3:数据采集系统中的采集模块根据规则输入配置模块配置的数据采集控制参数对相应诊断规则的性能数据进行采集,发送模块根据规则输入配置模块配置的监控结果输出控制参数输出对应格式和内容的数据到规则执行模块中。
步骤4:历史数据采集子模块对数据采集系统中的主机采集子模块、存储采集子模块以及交换机采集子模块采集的数据进行记录或备份。
步骤5:规则执行模块根据相应诊断规则进行自动诊断分析,获得诊断结果,并将诊断结果输出到结果呈现模块。
具体地,规则执行模块可以对数据采集系统输入的数据进行统计,分别统计每个监控对象的性能维度(例如IOPS,延时,并发等)的指标。然后根据诊断规则计算每个监控对象在监控时间范围内性能维度的指标是否超过诊断配置参数定义的阈值或者性能维度的指标是否出现较大波动或异常波动。
步骤6:结果呈现模块将诊断结果进行呈现,并建议进行性能优化。
具体地,可将不符合阈值的数据或性能维度出现较大波动或异常波动的数据呈现,并提出优化建议,例如改变RAID级别,数据平衡方案,光纤交换机组网连接,改变光纤交换机参数配置等。
若上述步骤5中的诊断配置参数定义的阈值合适,则瓶颈诊断结束,若诊断配置参数定义的阈值不合适,则还需进行以下步骤。
步骤7:规则更新模块根据结果呈现模块呈现的阈值不合适的结果,向自我修正模块发送对阈值诊断规则进行更新的请求。
步骤8:自我修正模块根据规则更新模块发送的阈值诊断规则更新请求对诊断规则进行修正。
步骤9:规则定义模块存储经过自我修正模块修正的诊断规则,并提供给规则定义模块,以便后续根据修正后的诊断规则重新进行瓶颈诊断。
本发明实施例通过服务器I/O子系统性能瓶颈诊断系统对I/O子系统瓶颈的诊断,能够快速高效的对热点数据,I/O不均衡以及I/O路径阻塞等性能瓶颈定位,并提出优化建议。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的。
Claims (10)
1.一种服务器I/O子系统性能瓶颈诊断系统,其特征在于,包括:
数据采集系统,用于根据诊断规则中的数据采集控制参数,对性能参数进行采集,获得监控结果;并根据所述诊断规则中的监控结果输出控制参数,发送所述监控结果给I/O瓶颈诊断规则库;
所述I/O瓶颈诊断规则库,与所述数据采集系统连接,用于向所述数据采集系统提供所述数据采集控制参数和所述监控结果输出控制参数,并根据所述诊断规则中的诊断配置参数,对接收到的所述监控结果进行性能诊断,获得诊断结果;并根据所述诊断规则中的诊断结果输出控制参数,发送所述诊断结果给诊断输出模块;
所述诊断输出模块,与所述I/O瓶颈诊断规则库连接,用于接收所述诊断结果,并显示所述诊断结果。
2.根据权利要求1所述的服务器I/O子系统性能瓶颈诊断系统,其特征在于,所述I/O瓶颈诊断规则库包括规则输入配置模块和规则执行模块,
所述规则输入配置模块,与所述数据采集系统连接,用于根据用户的选择确定所述诊断规则,并将所述诊断规则中的所述数据采集控制参数和所述诊断规则中的所述监控结果输出控制参数,发送给所述数据采集系统,将所述诊断规则中的所述诊断配置参数和所述诊断规则中的所述诊断结果输出控制参数发送给所述规则执行模块;
所述规则执行模块,与所述规则输入配置模块、所述数据采集系统和所述诊断输出模块连接,用于接收所述规则输入配置模块发送的所述诊断配置参数和所述诊断结果输出控制参数,以及接收所述数据采集系统发送的所述监控结果,并根据所述诊断配置参数对所述监控结果进行性能诊断,获得所述诊断结果,根据所述诊断结果输出控制参数向所述诊断输出模块发送所述诊断结果。
3.根据权利要求2所述的服务器I/O子系统性能瓶颈诊断系统,其特征在于,所述诊断输出模块包括结果呈现模块和规则更新模块;所述I/O瓶颈诊断规则库还包括自我修正模块和规则定义模块;
所述结果呈现模块,与所述规则执行模块连接,用于接收并显示所述规则执行模块发送的所述诊断结果;
所述规则更新模块,与所述结果呈现模块连接,用于根据所述诊断结果,向所述自我修正模块发送对所述诊断规则的更新请求;
所述自我修正模块,与所述规则更新模块连接,用于根据所述更新请求对所述诊断规则进行修正;
所述规则定义模块,与所述自我修正模块和所述规则输入配置模块连接,用于存储所述自我修正模块修正的所述诊断规则,并提供所述诊断规则给所述规则输入配置模块。
4.根据权利要求1-3任一所述的服务器I/O子系统性能瓶颈诊断系统,其特征在于,所述数据采集系统包括采集模块和发送模块,其中:
所述采集模块包括如下子模块中的任一或其组合:
主机采集子模块,用于根据所述诊断规则中的所述数据采集控制参数,对主机端进行所述性能参数的采集,获得监控结果;
存储采集子模块,用于根据所述诊断规则中的所述数据采集控制参数,对存储端进行所述性能参数的采集,获得监控结果;
交换机采集子模块,用于根据所述诊断规则中的所述数据采集控制参数,对交换机端进行所述性能参数的采集,获得监控结果;
所述发送模块,用于根据所述诊断规则中的监控结果输出控制参数,发送所述采集模块获得的监控结果给所述I/O瓶颈诊断规则库。
5.根据权利要求4所述的服务器I/O子系统性能瓶颈诊断系统,其特征在于,所述采集模块还包括:
历史数据采集子模块,用于向所述I/O瓶颈诊断规则库提供用于事后分析的历史监控结果。
6.一种服务器I/O子系统性能瓶颈诊断方法,其特征在于,所述方法包括:
数据采集系统从I/O瓶颈诊断规则库获取诊断规则中的数据采集控制参数以及所述诊断规则中的监控结果输出控制参数;
所述数据采集系统根据所述数据采集控制参数,对性能参数进行采集,获得监控结果;
所述数据采集系统根据所述监控结果输出控制参数,发送所述监控结果给所述I/O瓶颈诊断规则库;
所述I/O瓶颈诊断规则库根据所述诊断规则中的诊断配置参数对接收到的所述监控结果进行性能诊断,获得诊断结果;
所述I/O瓶颈诊断规则库根据所述诊断规则中的诊断结果输出控制参数,发送所述诊断结果给诊断输出模块;
所述诊断输出模块接收所述诊断结果,显示所述诊断结果。
7.根据权利要求6所述的服务器I/O子系统性能瓶颈诊断方法,其特征在于,在数据采集系统从I/O瓶颈诊断规则库获取诊断规则中的数据采集控制参数以及所述诊断规则中的监控结果输出控制参数之前,所述方法还包括:
所述I/O瓶颈诊断规则库根据用户的选择确定所述诊断规则。
8.根据权利要求7所述的服务器I/O子系统性能瓶颈诊断方法,其特征在于,所述方法还包括:
所述诊断输出模块根据所述诊断结果,向所述I/O瓶颈诊断规则库发送对所述诊断规则的更新请求;
所述I/O瓶颈诊断规则库根据所述更新请求对所述诊断规则进行修正,并存储修正的所述诊断规则。
9.根据权利要求6-8任一所述的服务器I/O子系统性能瓶颈诊断方法,其特征在于,所述数据采集系统根据所述数据采集控制参数,对性能参数进行采集包括如下所述方法中的任一或其组合:
所述数据采集系统根据所述数据采集控制参数,对主机端进行所述性能参数的采集;
所述数据采集系统根据所述数据采集控制参数,对存储端进行所述性能参数的采集;
所述数据采集系统根据所述数据采集控制参数,对交换机端进行所述性能参数的采集。
10.根据权利要求9所述的服务器I/O子系统性能瓶颈诊断方法,其特征在于,所述数据采集系统根据所述数据采集控制参数,对性能参数进行采集还包括:
所述数据采集系统对用于事后分析的历史监控结果进行采集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210254934.9A CN102790695B (zh) | 2012-07-23 | 2012-07-23 | 服务器i/o子系统性能瓶颈诊断系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210254934.9A CN102790695B (zh) | 2012-07-23 | 2012-07-23 | 服务器i/o子系统性能瓶颈诊断系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102790695A true CN102790695A (zh) | 2012-11-21 |
CN102790695B CN102790695B (zh) | 2015-03-25 |
Family
ID=47156002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210254934.9A Expired - Fee Related CN102790695B (zh) | 2012-07-23 | 2012-07-23 | 服务器i/o子系统性能瓶颈诊断系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102790695B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145432A (zh) * | 2017-03-30 | 2017-09-08 | 华为技术有限公司 | 一种建立模型数据库的方法以及客户端 |
CN107870843A (zh) * | 2016-12-30 | 2018-04-03 | 平安科技(深圳)有限公司 | Nas服务器性能监控的方法及装置 |
WO2021208920A1 (zh) * | 2020-04-17 | 2021-10-21 | 华为技术有限公司 | 网络性能监控方法、装置及系统 |
WO2022041024A1 (zh) * | 2020-08-27 | 2022-03-03 | 清华大学 | 并行程序可扩展性瓶颈检测方法和计算装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1972210A (zh) * | 2006-11-21 | 2007-05-30 | 华为技术有限公司 | 网络监控方法及其系统 |
CN101158916A (zh) * | 2007-11-19 | 2008-04-09 | 中国移动通信集团浙江有限公司 | 一种数据库性能监控方法 |
CN101765084A (zh) * | 2008-12-24 | 2010-06-30 | 中国移动通信集团天津有限公司 | 一种核心网数据处理方法和装置 |
CN101989283A (zh) * | 2009-08-04 | 2011-03-23 | 中兴通讯股份有限公司 | 一种数据库性能的监控方法和装置 |
-
2012
- 2012-07-23 CN CN201210254934.9A patent/CN102790695B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1972210A (zh) * | 2006-11-21 | 2007-05-30 | 华为技术有限公司 | 网络监控方法及其系统 |
CN101158916A (zh) * | 2007-11-19 | 2008-04-09 | 中国移动通信集团浙江有限公司 | 一种数据库性能监控方法 |
CN101765084A (zh) * | 2008-12-24 | 2010-06-30 | 中国移动通信集团天津有限公司 | 一种核心网数据处理方法和装置 |
CN101989283A (zh) * | 2009-08-04 | 2011-03-23 | 中兴通讯股份有限公司 | 一种数据库性能的监控方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107870843A (zh) * | 2016-12-30 | 2018-04-03 | 平安科技(深圳)有限公司 | Nas服务器性能监控的方法及装置 |
CN107145432A (zh) * | 2017-03-30 | 2017-09-08 | 华为技术有限公司 | 一种建立模型数据库的方法以及客户端 |
CN107145432B (zh) * | 2017-03-30 | 2020-12-22 | 华为技术有限公司 | 一种建立模型数据库的方法以及客户端 |
WO2021208920A1 (zh) * | 2020-04-17 | 2021-10-21 | 华为技术有限公司 | 网络性能监控方法、装置及系统 |
WO2022041024A1 (zh) * | 2020-08-27 | 2022-03-03 | 清华大学 | 并行程序可扩展性瓶颈检测方法和计算装置 |
US11768754B2 (en) | 2020-08-27 | 2023-09-26 | Tsinghua University | Parallel program scalability bottleneck detection method and computing device |
Also Published As
Publication number | Publication date |
---|---|
CN102790695B (zh) | 2015-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6622221B1 (en) | Workload analyzer and optimizer integration | |
US9910707B2 (en) | Interface for orchestration and analysis of a computer environment | |
US7757013B1 (en) | Techniques for controlling data storage system performance | |
JP4896593B2 (ja) | 性能監視方法、計算機及び計算機システム | |
US8849783B2 (en) | Storage tape analytics user interface | |
US20160004475A1 (en) | Management system and method of dynamic storage service level monitoring | |
CN100407123C (zh) | 数据存储设备、重构控制设备、重构控制方法 | |
US20010054133A1 (en) | Data storage system and method of hierarchical control thereof | |
EP2157506A2 (en) | A storage management apparatus, a storage management method and a storage management program | |
US7356452B1 (en) | System and method for simulating performance of one or more data storage systems | |
CN102790695A (zh) | 服务器i/o子系统性能瓶颈诊断系统及方法 | |
US10977082B2 (en) | Resource allocation optimization support system and resource allocation optimization support method | |
CN108388626A (zh) | Sql自动优化方法、装置、计算机设备及存储介质 | |
WO2009059025A2 (en) | Optimizing the efficiency of an organization's technology infrastructure | |
CN113297182A (zh) | 数据迁移方法、设备、存储介质及程序产品 | |
US8261038B2 (en) | Method and system for allocating storage space | |
US20100106749A1 (en) | Reorganizing table-based data objects | |
CN112036751B (zh) | 一种流程关键作业节点的识别方法及装置 | |
US20080222381A1 (en) | Storage optimization method | |
US8438271B2 (en) | Performing services in a network data processing system | |
CN116185677A (zh) | 一种自动故障定位方法、系统及介质 | |
JP2022066799A (ja) | 管理装置、管理方法 | |
JP2021033733A (ja) | リソース構成変更計画立案システムおよびリソース構成変更計画立案方法 | |
WO2012114490A1 (ja) | 情報処理装置,情報取得方法及び情報取得プログラム | |
CN108958654B (zh) | 一种存储系统的管理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150325 Termination date: 20180723 |
|
CF01 | Termination of patent right due to non-payment of annual fee |