CN108027745B - 基于应用特征来管理it基础设施的方法和装置 - Google Patents

基于应用特征来管理it基础设施的方法和装置 Download PDF

Info

Publication number
CN108027745B
CN108027745B CN201580082698.9A CN201580082698A CN108027745B CN 108027745 B CN108027745 B CN 108027745B CN 201580082698 A CN201580082698 A CN 201580082698A CN 108027745 B CN108027745 B CN 108027745B
Authority
CN
China
Prior art keywords
features
resource
thresholds
plan
shows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580082698.9A
Other languages
English (en)
Other versions
CN108027745A (zh
Inventor
河野泰隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN108027745A publication Critical patent/CN108027745A/zh
Application granted granted Critical
Publication of CN108027745B publication Critical patent/CN108027745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3442Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for planning or managing the needed capacity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5054Automatic deployment of services triggered by the service manager, e.g. service implementation by automatic configuration of network components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本文描述的示例性实施方式涉及用于基于应用特征来使用和更新性能阈值的系统和方法。示例性实施方式将监测到的性能指标与具有与所监测的类似的应用特征的阈值进行比较。示例性实施方式还管理补救计划以基于应用特征来解决性能问题。在示例性实施方式中,响应于发出的警报,管理软件检索为类似情况所创建的现有计划。

Description

基于应用特征来管理IT基础设施的方法和装置
技术领域
本公开总体涉及信息技术(IT)系统,并且更具体地涉及基于在IT系统上执行的应用对于IT系统的管理。
背景技术
在相关技术中,部署新IT系统(应用和IT资源)或快速改变现有IT系统以适应业务环境的快速变化的需求日益增长。因此,IT基础设施管理员可能需要灵活有效地管理IT资源,以支持快速频繁部署或改变的应用。
相关技术的解决方案涉及基于知识(诸如基于统计性能数据的阈值设定、过去执行的配置改变的效果等)来自动管理IT资源的方法。这样的解决方案包括用于性能指标的自适应阈值确定的系统和方法,以及用于动态地生成性能指标的报警阈值并且应用这些阈值来生成警报的系统和方法。在这样的相关技术的解决方案中,使用统计方法来生成一个或多个指标阈值,其可能不符合高斯分布或正态分布,或者可能表现出指标的值的循环行为或持续偏移。用于生成阈值的统计方法可以包括统计过程控制(SPC)方法、归一化方法和试探法。在美国专利公开第2003/0079160号中可以发现这种相关技术的实施方式的示例,其全部内容通过引用结合于此以用于所有目的。
在相关技术的解决方案中,存在用于在云计算环境内动态提供资源的技术。这样的相关技术的系统提供了一种工作负载优化方法,其测量跨硬件(平台、网络配置、存储配置等)和操作系统(OS)的组合的工作负载性能,并且在作业可以有效运行的平台上提供工作负载布置。除了诸如吞吐量和响应时间的性能之外,还考虑功耗和可靠性。此外,如果需要,相关技术的解决方案允许执行迁移处理。在美国专利公开第2011/0145932号中可以发现这种相关技术的实施方式的示例,其全部内容通过引用结合于此以用于所有目的。
发明内容
在相关技术中,基础设施管理员可能通常不具有对应用进行修改的可见性。因此,从基础设施管理员的角度来看,应用的工作负载可能会从基础设施的视点突然出现变化。如果基础设施管理员基于先前获得的知识或统计数据来管理IT系统,则可能导致不当和无效的管理。
在示例性实施方式中,存在管理程序,其在考虑应用的特征的情况下使用和更新性能阈值。管理程序将监测到的性能指标与具有与所监测的类似的应用特征的阈值进行比较。
在示例性实施方式中,管理程序管理补救计划以在考虑应用特征的同时解决性能问题。为了响应发出的警报,管理软件检索为类似情况所创建的现有计划。
在示例性实施方式中,存在用于在考虑应用特征的同时管理性能阈值的方法和装置。示例性实施方式涉及用于创建和管理补救计划的方法和装置,以在考虑应用特征的情况下解决性能问题。
在示例性实施方式中,管理程序在考虑应用特征的同时使用和更新性能阈值。管理程序将监测到的性能指标与具有与所监测的类似的应用特征的阈值进行比较。
在示例性实施方式中,管理程序管理补救计划以在考虑应用特征的同时解决性能问题。通过响应发出的警报,管理软件检索为类似情况所创建的现有计划。
本公开的各方面包括配置为在网络上管理系统的管理服务器。该系统可以涉及存储系统和配置为管理存储系统的服务器。管理服务器可以包括内存,该内存配置为存储多个阈值以及在系统上执行的应用的多个特征,所述多个阈值中的每一个与系统的系统资源相关联,其中,多个特征中的一个或多个集合中的每一个都与来自多个阈值的对应阈值集合相关联。管理服务器还可以包括处理器,配置为:监测在系统上执行的一个或多个应用;监测系统的系统资源;根据在系统上执行的一个或多个应用的特征,确定来自多个特征的一个或多个集合的相关联特征集合;以及对于从确定中发现的相关联特征集合,比较系统资源和与来自多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合。
本公开的附加方面包括一种用于在网络上管理系统的方法,该系统具有存储系统和配置为管理存储系统的服务器。该方法可以包括:管理多个阈值以及在系统上执行的应用的多个特征,所述多个阈值中的每一个与系统的系统资源相关联,其中,多个特征中的一个或多个集合中的每一个都与来自多个阈值的对应阈值集合相关联;监测在系统上执行的一个或多个应用;监测系统的系统资源;根据在系统上执行的一个或多个应用的特征,确定来自多个特征的一个或多个集合的相关联特征集合;以及对于从确定中发现的相关联特征集合,比较系统资源和与来自多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合。
本公开的各方面还包括一种用于在网络上管理系统的计算机程序,该系统包括存储系统和配置为管理存储系统的服务器,该计算机程序具有用于执行处理的指令,该处理包括:管理多个阈值以及在系统上执行的应用的多个特征,所述多个阈值中的每一个与系统的系统资源相关联,其中,多个特征中的一个或多个集合中的每一个都与来自多个阈值的对应阈值集合相关联;监测在系统上执行的一个或多个应用;监测系统的系统资源;根据在系统上执行的一个或多个应用的特征,确定来自多个特征的一个或多个集合的相关联特征集合;对于从确定中发现的相关联特征集合,比较系统资源和与来自多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合;以及对于从确定中未发现的相关联特征集合,针对在系统上执行的一个或多个应用的特征生成阈值集合。
附图说明
图1(a)示出根据示例性实施方式的系统的逻辑配置。
图1(b)示出根据示例性实施方式的IT基础设施的逻辑配置。
图1(c)示出根据示例性实施方式的系统的物理配置。
图2示出根据示例性实施方式的管理服务器的配置。
图3示出根据示例性实施方式的图像目录表。
图4示出根据示例性实施方式的VM模板表。
图5示出根据示例性实施方式的存储阵列表。
图6示出根据示例性实施方式的存储卷表。
图7示出根据示例性实施方式的物理服务器表。
图8示出根据示例性实施方式的虚拟服务器表。
图9示出根据示例性实施方式的映射表。
图10示出根据示例性实施方式的存储性能表。
图11示出根据示例性实施方式的服务器性能表。
图12示出根据示例性实施方式的阈值表。
图13示出根据示例性实施方式的警报表。
图14示出根据示例性实施方式的具有应用部署图形用户界面(GUI)的自助服务门户。
图15示出根据示例性实施方式的具有确认GUI的自助服务门户。
图16示出根据示例性实施方式的用于系统部署的序列的管理程序的流程图。
图17示出根据示例性实施方式的用于系统监测子序列的管理程序的流程图。
图18示出根据示例性实施方式的应用日志数据库。
图19示出根据示例性实施方式的管理服务器的配置。
图20示出根据示例性实施方式的补救计划表。
图21示出根据示例性实施方式的用于创建补救计划的管理程序的流程图。
图22(a)和图22(b)分别示出使用和不使用本文描述的示例性实施方式的阈值建模的执行。
具体实施方式
以下详细描述进一步提供了本申请的附图和示例性实施方式的细节。为了清楚起见,省略附图之间的冗余元件的附图标记和描述。在整个说明书中使用的术语是作为示例提供的,并不旨在限制。例如,取决于实施本公开的实施方式的本领域普通技术人员的期望实施方式,术语“自动”的使用可能涉及包括用户或操作者对实施方式的某些方面的控制的完全自动或半自动的实施方式。
由于基础设施管理员一般不能访问对应用的这种修改,所以从基础设施的视点来看,应用的工作负载看起来突然改变。如果基础设施管理员基于先前获得的知识或统计数据来管理IT系统,则可能导致不当和无效的管理。
在本文描述的示例性实施方式中,管理程序在考虑应用特征的同时使用和更新性能阈值。管理程序将监测到的性能指标与具有与所监测的类似的应用特征的阈值进行比较。管理程序管理补救计划以在考虑应用的特征的情况下解决性能问题。响应于发出的警报,管理软件检索为类似情况所创建的现有计划。
在示例性实施方式中,管理程序可以适当地管理性能阈值并且避免基于应用的不同活动来更新它们。管理程序也可以提供与情况匹配的补救计划。
在下面描述的示例性实施方式中,存在管理程序,其配置为在考虑应用特征的情况下管理性能阈值。
图1(a)示出根据示例性实施方式的系统的逻辑配置。具体地,图1(a)示出可以应用示例性实施方式的方法和装置的系统的逻辑配置的示例。IT环境1000可以涉及管理程序1200、应用和虚拟化资源1300、IT基础设施1500、自助服务门户1600和IT基础设施管理用户界面(UI)1800。应用管理员1010可以经由自助服务门户1600来使用IT环境1000。IT基础设施管理员1030可以经由IT基础设施管理UI 1800来使用IT环境1000。
图1(b)示出根据示例性实施方式的IT基础设施的逻辑配置。具体地,图1(b)示出图1(a)的IT基础设施1500的逻辑配置。IT基础设施1500涉及一个或多个系统。在图1(b)的示例中,分别存在系统01和02(1560和1570)。应用1544、操作系统(OS)1543和虚拟机(VM)1542可以在超管理器1541上运行。该超管理器在服务器1540上运行。应用1556和1557、OS1554和1555以及VM 1552和1553可以在超管理器1551上运行。该超管理器在服务器1550上运行。应用1544使用存储系统01(1510)的存储卷1511和1512。应用1556使用存储系统02(1520)的存储卷1521。应用1557使用存储系统02(1520)的存储卷1522。
图1(c)示出根据示例性实施方式的系统的物理配置。具体地,图1(c)示出示例性实施方式中的IT环境的物理配置。IT环境1000可以包括管理服务器2000、服务器3000、存储阵列4000、管理网络5000和数据网络6000。服务器3000和存储阵列4000经由数据网络6000连接。数据网络6000可以是LAN(局域网),但是但不限于此,并且取决于期望的实施方式,其他网络实施方式也是可能的。管理服务器2000、服务器3000和存储阵列4000经由管理网络5000连接。管理网络5000可以是LAN,但是但不限于此,并且取决于期望的实施方式,其他网络实施方式也是可能的。尽管管理网络5000和数据网络6000在本示例性实施方式中是分离的,但是它们也可以被实施为单个聚合网络。
在本示例性实施方式中,管理服务器2000和服务器3000是分离的,但是本公开不限于这样的配置。例如,任何服务器都可以是管理程序的主机。在本示例性实施方式中,服务器3000和存储阵列4000是分离的,但是本公开不限于这种配置。例如,服务器和存储阵列可以组合为一个系统。
图2示出根据示例性实施方式的管理服务器的配置。具体地,图2示出管理服务器2000的配置,其包括可以包括一个或多个存储系统以及通过网络通信地耦合至管理服务器2000的一个或多个服务器的云系统1000。管理接口2100是与管理网络5000的接口。输入和输出设备2300是诸如监视器、键盘和鼠标的用户接口。本地盘2400包含管理程序2410、图像目录表2420、VM模板表2430和应用日志数据库2440。管理程序2410被加载至内存2500并被处理器2200执行。下面公开了管理程序2410的过程。管理程序2410是与图1(a)中的管理程序1200相同的实体。图像目录表2420和VM模板表2430被加载至内存2500并被管理程序2410使用。下面详细描述这些表。内存2500包含存储阵列表2510、存储卷表2520、物理服务器表2530、虚拟服务器表2540、映射表2550、存储性能表2560、服务器性能表2570、阈值表2580和警报表2590。下面详细公开这些表。
内存2500可以配置为存储多个阈值以及在系统上执行的应用的多个特征,其中所述多个阈值中的每一个与图12中进一步详细描述的系统的系统资源相关联,其中,多个特征中的一个或多个集合中的每一个都与来自多个阈值的对应的阈值集合相关联,如关于图12和图17所示。
通过加载管理程序2410,处理器2200可以配置为:监测在系统上执行的一个或多个应用;监测系统的系统资源;根据在系统上执行的一个或多个应用的特征,确定来自多个特征的一个或多个集合的相关联特征集合;以及对于从确定中发现的相关联特征集合,比较系统资源和与来自多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合。处理器2200配置为:对于从确定中未发现的相关联特征集合,针对在系统上执行的一个或多个应用的特征生成阈值集合。处理器2200配置为:根据比较,对于超过来自对应阈值集合的对应阈值的系统资源中的至少一个,发出与对应阈值相关联的警报处理。下面详细描述处理器2200和管理程序2410的执行的进一步的细节。
内存2500可以配置为存储与例如在图13的警报表2590中示出的多个警报处理中的每一个相关联的资源计划,并且其中,处理器2200配置为执行与来自多个警报处理的所发出的警报处理相关联的资源计划。处理器2200配置为在执行资源计划时增加对应的阈值,并且还配置为监测执行的资源计划对系统资源的影响并将该影响与内存2500中的资源计划相关联。
图3示出根据示例性实施方式的图像目录表。具体地,图3示出图像目录表2420。当应用管理员1010通过使用自助服务门户1600部署应用时,参考该目录。图像目录表2420从本地盘2400加载至管理服务器2000的内存2500。列2421示出目录的标识。列2422示出应用的类型。列2423示出运行应用的操作系统的名称。列2424示出运行应用的操作系统的版本。列2425示出应用的名称。列2426示出应用的版本。列2427示出包含应用的存储卷的位置。这些存储卷被称为“黄金图像”。行242A、242B和242C各自示出每个图像目录。例如,行242A示出数据库应用的目录。本示例性目录针对Ubuntu 14.10上的MySQL 5.6,但是本公开不限于这种配置,并且取决于期望的实施方式,其他配置也是可能的。该图像位于存储系统01的卷01上。
图4示出根据示例性实施方式的VM模板表。具体地,图4示出VM模板表2430。该模板描述了几种VM类型的资源配置。该表从本地盘2400加载至管理服务器2000的内存2500。列2431示出模板的标识。列2432示出VM类型。列2433示出处理器类型。列的值可以为正常、高内存、高CPU和高I/O。列2434示出处理器性能。这些值是基于正常CPU的相对值。列2435显示处理器的数量。列2436示出内存的容量。列2437示出最大IOPS。列2438显示单价。行243A、243B、243C和243D各自示出每个VM类型的资源配置。例如,行243A示出正常VM的配置。这种类型的VM包括两个正常处理器和4GB内存。这种类型的VM的单价为10。
图5示出根据示例性实施方式的存储阵列表。具体地,图5示出物理存储表2510。该表由管理程序2410在内存2500中创建。列2511示出存储阵列的标识。列2512示出存储阵列的处理器。列2513示出存储阵列的端口。列2513示出存储阵列的高速缓存资源。列2514示出存储阵列的资源池(通常为容量)。行251A、251B、251C和251D各自示出每个物理存储阵列的配置。例如,行251A和251B示出存储阵列01的配置。存储阵列具有两个处理器(每个处理器都具有8核),8Gbps的端口A、B、C和D,160GB的高速缓存C-01和128GB的高速缓存C-02,300TB的池Pool-01和Pool-02以及500TB的池Pool-03和Pool-04。
图6示出根据示例性实施方式的存储卷表。具体地,图6示出存储卷表2520。该表由管理程序2410在内存2500中创建。列2521示出拥有存储卷的存储阵列的标识。列2522示出存储卷的标识。列2523示出每个存储卷的容量。列2524示出存储卷开始弯曲的池的标识。行252A、252B、252C、252D和252E各自示出每个存储卷的配置。例如,行252A示出存储阵列01的存储卷01的配置。该存储卷具有10TB的容量并且从Pool-01弯曲。
图7示出根据示例性实施方式的物理服务器表。具体地,图7示出物理服务器表2530。该表由管理程序2410在内存2500中创建。列2531示出物理服务器的标识。列2532示出每个物理服务器的CPU的核数和类型。列2533示出每个物理服务器的内存资源的容量。列2534示出每个物理服务器的端口。行253A、253B、253C、253D和253E各自示出每个物理服务器的配置。例如,行253A示出物理服务器01的配置。物理服务器具有12核正常CPU、32GB的内存、4Gbps的端口A和B。
图8示出根据示例性实施方式的虚拟服务器表。具体地,图8示出虚拟服务器表2540。该表由管理程序2410在内存2500中创建。列2541示出虚拟服务器的标识。列2542示出运行虚拟服务器的物理服务器的标识。列2543示出分配给每个虚拟服务器的CPU的核数。列2544示出分配给每个虚拟服务器的内存资源的容量。列2545示出分配给每个虚拟服务器的端口。行254A、254B、254C和254D各自示出每个虚拟服务器的配置。例如,行254A示出虚拟服务器01的配置。该虚拟服务器的主机为物理服务器01,并且具有2核CPU、4GB的内存和4Gbps的端口A。
图9示出根据示例性实施方式的映射表。具体地,图9示出映射表2550。该表由管理程序2410在内存2500中创建。列2551示出应用的标识。列2552示出应用的名称。该名称由应用管理员1010在自助服务门户1600的GUI 1600-B的应用名称字段1620-B中指定。列2553示出图像目录的标识。由应用管理员1010在自助服务门户1600的GUI1600-B的应用类型字段1610-B中选择应用类型。通过匹配图像目录表2420中的信息和类型列2422,可以决定列2553的标识。列2554示出运行应用的虚拟服务器的标识。列2555示出虚拟服务器的名称。在本示例性实施方式中,由管理程序基于应用名称自动创建这些名称,但是取决于期望的实施方式,其他实施方式也是可能的。例如,应用管理员可以指定每个虚拟服务器的名称。列2556示出虚拟服务器的端口的标识。列2557示出存储阵列的标识。列2558示出存储阵列的端口的标识。列2559示出存储卷的标识。
行255A、255B、255C、255D、255E、255F和255G各自示出应用和存储卷之间的端到端映射。例如,行255B示出应用2具有名称“Web-C”,根据图像目录4来创建,并且正在名称为“WebDB”的虚拟服务器03上运行。此外,两个存储卷052和055被分配给应用的虚拟服务器03。存储阵列02的存储卷052通过存储阵列的端口B和虚拟服务器的端口A分配给虚拟服务器03。存储阵列01的存储卷055通过存储阵列的端口A和虚拟服务器的端口A分配给虚拟服务器03。
图10示出根据示例性实施方式的存储性能表。具体地,图10示出存储性能表2560。该表由管理程序2410在内存2500中创建。列2561示出存储阵列的标识。列2562示出存储卷的标识。列2563示出存储卷的历史性能数据的标识。时间戳可以用作历史ID 2563。列2564示出处理器的使用率。列2565示出分配给存储卷的高速缓存资源的使用率。列2566示出存储卷开始弯曲的池的使用率。列2567示出分配给存储卷的端口的使用率。行256A和256B各自示出每个存储卷的历史性能数据。例如,行256A示出具有至少三个历史数据(从0到2)的存储阵列01的存储卷01的性能数据。
图11示出根据示例性实施方式的服务器性能表。具体地,图11示出服务器性能表2570。该表由管理程序2410在内存2500中创建。列2571示出物理和/或虚拟服务器的标识。列2572示出指示服务器是否是物理服务器的标志。如果值为“是”,则服务器是物理服务器。如果值为“否”,则服务器是虚拟服务器。列2573示出服务器的历史性能数据的标识。时间戳可以用作历史ID 2573。列2574示出服务器的CPU的使用率。列2575示出服务器的内存资源的使用率。列2576示出服务器的盘的使用率。列2577示出服务器的端口的使用率。行257A和257B各自示出每个服务器的历史性能数据。例如,行257A示出作为物理服务器并且具有至少三个历史数据(从0到2)的服务器01的性能数据。
图12示出根据示例性实施方式的阈值表。具体地,图12示出阈值表2580。该表由管理程序2410在内存2500中创建。列2581示出阈值的标识。列2582示出阈值的时间范围。列2583示出应用的特征。列2584示出阈值。行258A、258B和258C各自示出阈值。例如,行258A示出从0:00到0:10有效的阈值0。该阈值与在如下时间范围内记录的应用日志的特征相关,在该时间范围中,发出的结构化查询语言(SQL)查询的数量在100和200之间,SELECT查询的百分比在80%和90%之间,INSERT查询的百分比在10%和20%之间,UPDATE查询和DELETE查询的百分比等于0%,SELECT查询的目标表包括Table_A、Table_B、Table_E和Table_G,INSERT查询的目标表包括Table_C和Table_L,SELECT查询的目标列包括Table_A的Col_l、Col_2和Col_3、Table_B的Col_1、Table_E的Col_4和Col_5以及Table_G的Col_6,并且SELECT查询的条件包括Table_A.Col_1=Table_B.Col_1、Table_B.Col_6=Table_E.Col_1和Table_B.Col_7=Table_G.Col_1。阈值的实际值被定义为存储处理器使用率的80%、存储高速缓存使用率的60%、存储池使用率的80%、存储端口使用率的70%、服务器CPU使用率的70%、服务器内存使用率的65%、服务器磁盘使用率的90%和服务器端口使用率的80%。
应用日志的特征不限于图12所示的示例。取决于期望的实施方式,可以使用SELECT、INSERT、UPDATE和DELETE查询或发出的实际查询的类似顺序的其他特征。此外,除了发出SQL查询之外的应用的活动可以用作特征。例如,其他应用的应用程序接口(API)的调用就是一个示例。下面将示出如何使用和更新这些阈值。
图13示出根据示例性实施方式的警报表。具体地,图13示出警报表2590。该表由管理程序2410在内存2500中创建。列2591示出警报的标识。列2592示出发出警报的时间。列2593示出阈值的标识。列2594示出发出警报时的阈值。列2595示出发出警报时的工作负载。列2596示出工作负载的趋势。行259A、259B和259C各自示出由管理程序2410发出的警报。例如,行259A示出在06/18/2015的0:05发出的警报。发出该警报的原因是某些工作负载超过了阈值0。此时的阈值为存储处理器使用率的80%、存储高速缓存使用率的60%、存储池使用率的80%、存储端口使用率的70%、服务器CPU使用率的70%、服务器内存使用率的65%、服务器磁盘使用率的90%和服务器端口使用率的80%。此时的监测的工作负载为存储处理器使用率的81%、存储高速缓存使用率的50%、存储池使用率的50%、存储端口使用率的30%、服务器CPU使用率的30%、服务器内存使用率的50%、服务器磁盘使用率的40%和服务器端口使用率的30%。该记录也表明,这些工作负载的趋势是逐渐增加。
图14示出根据示例性实施方式的具有应用部署图形用户界面(GUI)的自助服务门户。具体地,图14示出自助服务门户1600的GUI 1600-A。当系统管理员1010在IT环境1000上部署应用时,使用该GUI。系统管理员选择应用类型1610-A,例如“Web服务器”。基于图像目录表2420的类型2422、OS名称2423、OS版本2424、应用名称2425和应用版本2426来显示候选。接下来,系统管理员输入应用名称1620-A,例如“Web-A”。接下来,系统管理员选择VM1630-A的数量。如果选择确认按钮1640-A,则管理程序2410显示确认GUI1600-B,如图15所示。如果选择取消按钮1650-A,则管理程序2410取消部署处理。
图15示出根据示例性实施方式的具有确认GUI的自助服务门户。具体地,图15示出自助服务门户1600的确认GUI 1600-B。在应用管理员1010从自助服务门户1600的应用部署GUI 1600-A中选择确认按钮1640-A之后,显示该GUI。
字段1610-B是应用类型。字段1620-B是应用名称。字段1630-B是运行应用的VM的数量。字段1640-B是正提供的VM的信息。列1641-B是VM的名称。该名称由管理程序2410从应用名称1620-B中创建。列1642-B是CPU的数量和类型。列1643-B是内存的容量。列1644-B是存储卷的容量。行164A-B和164B-B各自示出每个VM的配置。例如,行164A-B示出名称为“DB-A-1”的VM的配置。该VM具有16个高CPU、8GB的内存和2TB的存储卷。字段1650-B是应用的总计算成本。根据VM模板表2430的单价2438,一个“高I/O”VM的单位成本为90。为该应用分配的“高I/O”VM的数量为2。因此,该应用的总成本为180。总成本可以包括存储卷的成本。
如果选择OK按钮1660-B,则管理程序2410执行应用部署处理。如果选择取消按钮1670-B,则管理程序2410取消部署处理。如果选择后退按钮1680-B,则管理程序2410重新显示自助服务门户1600的提供GUI 1600-A。
图16示出根据示例性实施方式的用于系统部署的序列的管理程序的流程图。具体地,图16示出用于部署系统的管理程序2410的流程图。流程从10010开始,这是过程的开始。在10020处,管理程序2410从自助服务门户1600接收部署系统的请求。图15中所示的参数(自助服务门户-确认GUI)被传递至管理程序2410。在10030处,管理程序2410提供部署所需的IT资源。例如,管理程序2410创建存储卷、创建VM并将存储卷分配给VM。在10040处,管理程序2410在所提供的IT资源上部署所请求的应用。在10050处,管理程序2410开始检索应用的日志数据并将其存储到应用日志数据库。在10060处,管理程序2410调用监测系统的子序列。下面更详细地公开该子序列的过程。在10070处,管理程序2410结束应用部署处理。
图17示出根据示例性实施方式的用于系统监测子序列的管理程序的流程图。具体地,图17示出用于监测系统的管理程序2410的流程图。在20010处,管理程序2410开始监测系统的过程。在20020处,管理程序2410检索IT资源的性能指标。管理程序2410收集存储处理器、存储高速缓存、存储池、存储端口、服务器CPU、服务器内存、服务器磁盘和服务器端口的使用率以及取决于期望的实施方式的其他指标。在20030处,管理程序2410分析存储在应用日志数据库中的日志数据以提取其特征。在20040处,管理程序2410将提取的特征与阈值表2580中包含的特征进行比较。在20050处,管理程序2410判断是否发现具有相似特征的记录。可以通过对匹配的特征的数量进行计数来计算相似度,或取决于期望的实施方式,可以通过其他方法来计算相似度。管理程序2410选取具有最高相似度的一个记录。如果最高相似度低于预定义的分数,则管理程序2410可以判定没有发现具有相似特征的记录。如果结果为“是”,则过程进行至20070。如果结果为“否”,则过程进行至20060。在20060处,管理程序2410将具有默认阈值和在20030处提取的特征的新记录添加至阈值表2580中。
在20070处,管理程序2410将在20020中检索到的性能指标与在20040和20050处发现的记录的阈值2584或从20060创建的新记录的阈值进行比较。在20080处,管理程序2410判断至少一个性能指标是否超过对应阈值中的一个。如果结果为“是”,则过程进行至20090。如果结果为“否”,则过程进行至20110。
在20090处,管理程序2410向一个或多个应用管理员和一个或多个IT基础设施管理员发送警报消息。在20100处,管理程序2410将警报信息存储至警报表2590中。在20110处,管理程序2410更新阈值,该阈值为从20040和20050处的流程中发现的记录的阈值2584或从20060处的流程中创建的新记录的阈值。在示例性实施方式中,可以通过以下公式计算新阈值:Thnew=Th+(P-Th)×w。在该公式中,Thnew是阈值的新值,Th是当前阈值的值,P是性能指标的值,w是0和1之间的预定义权重的值。取决于期望的实施方式,也可以使用其他方法。
图18示出根据示例性实施方式的应用日志数据库。具体地,图18示出应用日志数据库2440。列2441示出日志的标识。列2442示出应用的标识。该ID与图9中所示的映射表2550中的应用ID 2551相关。列2443示出应用的日志。行244A、244B和244C各自示出应用的日志。例如,行244A示出ID为0的应用的日志。当管理程序2410检索到新日志时,每个应用的日志可以被重写或保持为旧日志。
因此,在以上描述的示例性实施方式中,管理程序在考虑应用特征的情况下使用和更新性能阈值。管理程序将监测到的性能指标与具有与所监测的类似的应用特征的阈值进行比较。通过以上描述的示例性实施方式,管理程序可以管理性能阈值并且避免基于不同应用活动的不必要的更新。
在下面描述的其他示例性实施方式中,管理程序可以配置为创建和管理补救计划以解决性能问题。
图19示出根据示例性实施方式的管理服务器的配置。具体地,图19示出本示例性实施方式中的管理服务器2000B的配置。图2中所示的管理服务器2000的配置与该配置2000B之间的不同之处在于,配置2000B具有补救计划表25A0,如在图20中进一步详细描述的。
图20示出根据示例性实施方式的补救计划表。具体地,图20示出补救计划表25A0。该表由管理程序2410在内存2500中创建。列25A1示出计划的标识。列25A2示出警报的标识。列25A3示出补救计划的描述。列25A4示出计划的最后执行时间。列25A5示出计划的效果。行25AA、25AB和25AC示出补救计划。例如,行25AA示出当发出警报0时由管理程序2410创建的计划0。该计划的内容用于分配一个附加存储处理器来减轻当前存储处理器的负担。该计划最后于06/18/2015在0:05执行,并且计划将存储处理器的使用率从81%降低至40%。行25AC在最后执行时间25A4中具有空值。空值表明计划已经创建但尚未执行。在这种情况下,效果25A5示出估计的效果,而不是实际监测到的效果。
图21示出根据示例性实施方式的用于创建补救计划的管理程序的流程图。具体地,图21示出用于创建补救计划的管理程序2410的流程图。该流程图在管理程序2410在图17的监测系统序列20000的流程20090中向管理员发送警报消息之后,由管理程序2410本身触发。该过程开始于30010。在30020处,管理程序2410从图17中的监测系统序列20000的流程20090获得发送至管理员的警报的ID。在30030处,管理程序2410从警报表2590中搜索具有与发送的警报的阈值ID相同的阈值ID的另一警报。如果发现两个或更多个警报,则管理程序2410选取阈值的值最类似于发送的警报的阈值的值的警报。在30040处,管理程序2410判断是否发现另一警报。如果结果为“是”,则过程进行至30050。如果结果为“否”,则过程进行至30070。在30050处,管理程序2410判断所发现的警报的工作负载趋势2596和发送的警报的工作负载趋势是否相同。如果结果为“是”,则过程进行至30060。如果结果为“否”,则过程进行至30070。在30060处,管理程序2410检索具有与所发现的警报的警报ID相同的警报ID的计划。这意味着管理程序2410检索为类似情况所创建的现有计划(即,应用的类似特征和工作负载的趋势)。
在30070处,管理程序2410创建新计划以解决警报的性能问题、估计效果并将估计的效果存储至补救计划表25A0中。如果从30060处的流程执行流程,则如果一个或多个创建的计划与从30060处的流程检索到的计划相同,那么管理程序2410丢弃所创建的计划。这是因为从30060处的流程检索到的计划可能以前已经执行过,而且这些计划可能实际上已经监测到效果,而不是估计的效果。在30080中,管理程序2410向IT基础设施管理员示出包括从30060处的流程检索到的计划和在30070处的流程中创建的计划的计划。管理程序2410可以分别示出这两种类型的计划(现有计划和新创建的计划)。在30090处,基础设施管理员1030选择计划之一来执行。在30100处,管理程序2410执行所选择的计划。在本示例性实施方式中,计划的选择和执行是手动完成的,但是管理程序2410可以自动选择和执行计划。在30110处,管理程序2410在补救计划表中更新所执行的计划的效果。在30120处,管理程序2410结束该序列。
在本示例性实施方式中,管理程序管理补救计划以在考虑应用特征的情况下解决性能问题。通过响应发出的警报,管理软件检索为类似情况所创建的现有计划。因此,管理程序可以提供与情况匹配的补救计划。
图22(a)和图22(b)分别示出使用和不使用本文描述的示例性实施方式的阈值建模的示例性执行。在图22(a)中,系统的I/O响应时间连同系统的阈值一起在22000、22001和22002处示出。在22000处所示的情况下,全天执行第一应用集合,其中阈值模型准确地反映第一应用集合的预期阈值。在22001处所示的情况下,在上午执行第一应用集合,并且在下午和晚上执行第二应用集合。在22002处所示的情况下,在上午执行第一应用集合,并且在晚上执行第三应用集合。基于在22000、22001和22002处的I/O响应时间的反馈,管理软件计算并更新到如22003处所示的新阈值。然而,由于在不考虑在系统中执行的应用的特征的变化的情况下花费I/O响应时间,所以新阈值可能不准确,特别是在全天执行第一应用集合的情况下。
在图22(b)中,由于监测应用特征,所以示例性实施方式可以基于所执行的应用的特征来动态地改变I/O响应时间的阈值。在22100处,阈值基于全天执行的第一应用集合的特征。在22200处,基于第一应用集合和第二应用集合在执行时的特征,在上午与下午和晚上之间改变阈值。在22300处,基于第一应用集合和第三应用集合在执行时的特征,在上午与下午和晚上之间改变阈值。因此,可以生成基于正在执行的应用准确地反映系统的I/O响应时间阈值。
根据计算机内的操作的算法和符号表示来呈现详细描述的一些部分。这些算法描述和符号表示是数据处理领域的技术人员用来将其创新的本质传达给本领域其他技术人员的手段。算法是导致期望的最终状态或结果的一系列定义的步骤。在示例性实施方式中,所执行的步骤需要对有形数量进行物理操纵以实现有形的结果。
除非特别声明,否则从讨论中显而易见的是,应当理解,在整个说明书中,使用诸如“处理”、“运算”、“计算”、“确定”、“显示”等的术语的讨论可以包括计算机系统或其他信息处理设备的动作和处理,其将在计算机系统的寄存器和内存内表示为物理(电子)量的数据操纵并转换为在计算机系统的内存或寄存器或其他信息存储、传输或显示设备内类似地表示为物理量的其他数据。
示例性实施方式还可以涉及用于执行本文的操作的装置。该装置可以为了所需的目的而专门构造,或者其可以包括由一个或多个计算机程序选择性地激活或重新配置的一个或多个通用计算机。这样的计算机程序可以存储在诸如计算机可读存储介质或计算机可读信号介质的计算机可读介质中。计算机可读存储介质可以涉及有形介质(诸如但不限于光盘、磁盘、只读存储器、随机存取存储器、固态设备和驱动器)或适用于存储电子信息的任何其他类型的有形或非暂时性介质。计算机可读信号介质可以包括诸如载波的介质。本文呈现的算法和显示并不固有地涉及任何特定的计算机或其他装置。计算机程序可以涉及纯软件实施方式,其涉及执行期望的实施方式的操作的指令。
根据本文的示例,各种通用系统可以与程序和模块一起使用,或者可以证明构造更专用的装置以执行期望的方法步骤是方便的。另外,不参考任何特定的编程语言来描述示例性实施方式。应当理解,可以使用各种编程语言来实施本文描述的示例性实施方式的教导。编程语言的指令可以由一个或多个处理设备执行,例如中央处理单元(CPU)、处理器或控制器。
如本领域所知,上述操作可以通过硬件、软件或者软件和硬件的一些组合来执行。示例性实施方式的各个方面可以使用电路和逻辑设备(硬件)来实施,而其他方面可以使用存储在机器可读介质上的指令(软件)来实施,如果由处理器执行,则该指令将使处理器执行用于执行本申请的实施方式的方法。此外,本申请的一些示例性实施方式可以仅以硬件来执行,而其他示例性实施方式可以仅以软件来执行。此外,所描述的各种功能可以在单个单元中执行,或者可以以任意数量的方式分布在多个组件上。当由软件执行时,方法可以基于存储在计算机可读介质上的指令由诸如通用计算机的处理器执行。如果需要,指令可以以压缩和/或加密格式存储在介质上。
此外,考虑到本申请的教导的说明和实践,本申请的其他实施方式对于本领域技术人员将是显而易见的。所描述的示例性实施方式的各个方面和/或组件可以单独使用或以任何组合方式使用。旨在将说明书和示例性实施方式仅视为示例,本申请的真实范围和精神由所附权利要求指示。

Claims (11)

1.一种管理计算机,配置为管理系统,所述管理计算机包括:
内存,配置为存储多个阈值以及在所述系统上执行的应用的多个特征,所述多个阈值中的每一个与所述系统的系统资源相关联,其中,所述多个特征中的一个或多个集合中的每一个都与来自所述多个阈值的对应阈值集合相关联;和
处理器,配置为:
监测在所述系统上执行的一个或多个应用;
监测所述系统的系统资源;
根据在所述系统上执行的所述一个或多个应用的特征,确定来自所述多个特征的一个或多个集合的相关联特征集合;
对于从所述确定中发现的所述相关联特征集合,将所述系统资源与和来自所述多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合进行比较;
判断在所述系统资源和所述对应阈值集合之间是否发现具有相似特征的记录,通过对匹配的特征的数量进行计数来计算相似度,选取具有最高相似度的一个记录,其中,如果最高相似度低于预定义的分数,处理器添加具有默认阈值和提取的特征的新记录;
将系统资源的性能指标与具有相似特征的记录的阈值或所述新记录的阈值进行比较;
判断至少一个性能指标是否超过对应阈值中的一个;并且
对于超过对应阈值中的一个的至少一个性能指标,发出与所述对应阈值相关联的警报处理。
2.根据权利要求1所述的管理计算机,其中,所述内存配置为存储与多个警报处理中的每一个相关联的资源计划,并且其中,所述处理器配置为执行与来自所述多个警报处理的所发出的警报处理相关联的资源计划。
3.根据权利要求2所述的管理计算机,其中,所述处理器配置为在执行所述资源计划时增加所述对应阈值。
4.根据权利要求2所述的管理计算机,其中,所述处理器配置为监测所执行的资源计划对所述系统资源的影响并将所述影响与所述内存中的资源计划相关联。
5.一种用于管理系统的方法,所述方法包括:
管理多个阈值以及在所述系统上执行的应用的多个特征,所述多个阈值中的每一个与所述系统的系统资源相关联,其中,所述多个特征中的一个或多个集合中的每一个都与来自所述多个阈值的对应阈值集合相关联;
监测在所述系统上执行的一个或多个应用;
监测所述系统的系统资源;
根据在所述系统上执行的所述一个或多个应用的特征,确定来自所述多个特征的一个或多个集合的相关联特征集合;
对于从所述确定中发现的所述相关联特征集合,将所述系统资源与和来自所述多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合进行比较;
判断在所述系统资源和所述对应阈值集合之间是否发现具有相似特征的记录,通过对匹配的特征的数量进行计数来计算相似度,选取具有最高相似度的一个记录,其中,如果最高相似度低于预定义的分数,则添加具有默认阈值和提取的特征的新记录;
将系统资源的性能指标与具有相似特征的记录的阈值或所述新记录的阈值进行比较;
判断至少一个性能指标是否超过对应阈值中的一个;并且
对于超过对应阈值中的一个的至少一个性能指标,发出与所述对应阈值相关联的警报处理。
6.根据权利要求5所述的方法,还包括:针对多个警报处理中的每一个管理资源计划,并且执行与来自所述多个警报处理的所发出的警报处理相关联的资源计划。
7.根据权利要求6所述的方法,还包括:在执行所述资源计划时增加所述对应阈值。
8.根据权利要求6所述的方法,还包括:监测所执行的资源计划对所述系统资源的影响,并且将所述影响与内存中的资源计划相关联。
9.一种用于管理系统的计算机程序,所述计算机程序具有用于执行处理的指令,所述处理包括:
管理多个阈值以及在所述系统上执行的应用的多个特征,所述多个阈值中的每一个与所述系统的系统资源相关联,其中,所述多个特征中的一个或多个集合中的每一个都与来自所述多个阈值的对应阈值集合相关联;
监测在所述系统上执行的一个或多个应用;
监测所述系统的系统资源;
根据在所述系统上执行的所述一个或多个应用的特征,确定来自所述多个特征的一个或多个集合的相关联特征集合;
对于从所述确定中发现的所述相关联特征集合,将所述系统资源与和来自所述多个特征的一个或多个集合的相关联特征集合相关联的对应阈值集合进行比较;
对于从所述确定中未发现的相关联特征集合,针对在所述系统上执行的所述一个或多个应用的特征生成阈值集合;
判断在所述系统资源和所述对应阈值集合之间是否发现具有相似特征的记录,通过对匹配的特征的数量进行计数来计算相似度,选取具有最高相似度的一个记录,其中,如果最高相似度低于预定义的分数,处理器添加具有默认阈值和提取的特征的新记录;
将系统资源的性能指标与具有相似特征的记录的阈值或所述新记录的阈值进行比较;
判断至少一个性能指标是否超过对应阈值中的一个;并且
对于超过对应阈值中的一个的至少一个性能指标,发出与所述对应阈值相关联的警报处理。
10.根据权利要求9所述的计算机程序,其中,所述指令还包括:
针对多个警报处理中的每一个管理资源计划;
执行与来自所述多个警报处理的所发出的警报处理相关联的资源计划;
在执行所述资源计划时增加所述对应阈值;
监测所执行的资源计划对所述系统资源的影响;以及
将所述影响与内存中的资源计划相关联。
11.根据权利要求9所述的计算机程序,其中,所述指令还包括:
针对多个警报处理中的每一个管理资源计划;
确定与来自所述多个警报处理的所发出的警报处理相关联的资源计划;
对于从所述确定中发现的相关联资源计划:
在执行所述资源计划时增加所述对应阈值;
监测所执行的资源计划对所述系统资源的影响;并且
将所述影响与内存中的资源计划相关联;
对于从所述确定中未发现的相关联资源计划:
检索具有与所发出的警报相同的阈值集合和工作负载趋势的一个或多个资源计划;
生成对所述对应阈值有影响的一个或多个资源计划;
执行所检索到的一个或多个资源计划和所生成的一个或多个资源计划中的一个。
CN201580082698.9A 2015-08-31 2015-08-31 基于应用特征来管理it基础设施的方法和装置 Active CN108027745B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2015/047807 WO2017039627A1 (en) 2015-08-31 2015-08-31 Method and apparatus to manage it infrastructure based on application characteristics

Publications (2)

Publication Number Publication Date
CN108027745A CN108027745A (zh) 2018-05-11
CN108027745B true CN108027745B (zh) 2022-03-01

Family

ID=58188193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580082698.9A Active CN108027745B (zh) 2015-08-31 2015-08-31 基于应用特征来管理it基础设施的方法和装置

Country Status (3)

Country Link
US (1) US10673730B2 (zh)
CN (1) CN108027745B (zh)
WO (1) WO2017039627A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10255336B2 (en) 2015-05-07 2019-04-09 Datometry, Inc. Method and system for transparent interoperability between applications and data management systems
US10594779B2 (en) 2015-08-27 2020-03-17 Datometry, Inc. Method and system for workload management for data management systems
WO2019070269A1 (en) 2017-10-05 2019-04-11 Hewlett-Packard Development Company, L.P. SELECTING COMPUTER CONFIGURATIONS BASED ON APPLICATION-BASED CONSOLIDATION
US11294869B1 (en) 2018-12-19 2022-04-05 Datometry, Inc. Expressing complexity of migration to a database candidate
US11620291B1 (en) 2018-12-19 2023-04-04 Datometry, Inc. Quantifying complexity of a database application
US11403282B1 (en) 2018-12-20 2022-08-02 Datometry, Inc. Unbatching database queries for migration to a different database

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101088072A (zh) * 2004-12-24 2007-12-12 国际商业机器公司 用于监视基于交易的系统的方法和系统
CN101601014A (zh) * 2006-12-12 2009-12-09 Lsi公司 利用存储负载信息来平衡集群虚拟机
US8738972B1 (en) * 2011-02-04 2014-05-27 Dell Software Inc. Systems and methods for real-time monitoring of virtualized environments
CN104684010A (zh) * 2004-09-01 2015-06-03 英特尔公司 通过同时调整通信参数在不同的协议层上无线网络的性能优化

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7076695B2 (en) 2001-07-20 2006-07-11 Opnet Technologies, Inc. System and methods for adaptive threshold determination for performance metrics
US8984657B2 (en) 2009-09-08 2015-03-17 Appcentral, Inc. System and method for remote management of applications downloaded to a personal portable wireless appliance
US8645529B2 (en) 2010-10-06 2014-02-04 Infosys Limited Automated service level management of applications in cloud computing environment
US9176788B2 (en) * 2011-08-16 2015-11-03 Esds Software Solution Pvt. Ltd. Method and system for real time detection of resource requirement and automatic adjustments
US9305000B1 (en) * 2014-03-27 2016-04-05 Veritas Us Ip Holdings Llc Creating and publishing service level representations of applications from operational representations

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104684010A (zh) * 2004-09-01 2015-06-03 英特尔公司 通过同时调整通信参数在不同的协议层上无线网络的性能优化
CN101088072A (zh) * 2004-12-24 2007-12-12 国际商业机器公司 用于监视基于交易的系统的方法和系统
CN101601014A (zh) * 2006-12-12 2009-12-09 Lsi公司 利用存储负载信息来平衡集群虚拟机
US8738972B1 (en) * 2011-02-04 2014-05-27 Dell Software Inc. Systems and methods for real-time monitoring of virtualized environments

Also Published As

Publication number Publication date
WO2017039627A1 (en) 2017-03-09
US10673730B2 (en) 2020-06-02
CN108027745A (zh) 2018-05-11
US20180234327A1 (en) 2018-08-16

Similar Documents

Publication Publication Date Title
CN108027745B (zh) 基于应用特征来管理it基础设施的方法和装置
US9608933B2 (en) Method and system for managing cloud computing environment
US10489215B1 (en) Long-range distributed resource planning using workload modeling in hyperconverged computing clusters
US9760294B2 (en) Computer system, storage management computer, and storage management method
US11755356B2 (en) Asynchronous queries on secondary data cores in a distributed computing system
US20200026566A1 (en) Workload identification and display of workload-specific metrics
US9146793B2 (en) Management system and management method
US20180139100A1 (en) Storage-aware dynamic placement of virtual machines
EP3330855A1 (en) Managing hardware resources
US10069906B2 (en) Method and apparatus to deploy applications in cloud environments
US9792050B2 (en) Distributed caching systems and methods
US20180267879A1 (en) Management computer, performance monitoring method, and computer system
WO2016024970A1 (en) Method and apparatus for managing it infrastructure in cloud environments
US10838949B2 (en) Shared resource update apparatus and shared resource update method
US20180136958A1 (en) Storage-aware dynamic placement of virtual machines
US20190173770A1 (en) Method and system for placement of virtual machines using a working set computation
US10585620B2 (en) Storage monitoring system for monitoring components in a storage system in a distributed manner
US11095501B2 (en) Provisioning and activating hardware resources
JP6259547B2 (ja) 管理システム、及び、管理方法
US11507431B2 (en) Resource allocation for virtual machines
US10564952B2 (en) Method and apparatus to deploy applications on proper IT resources based on frequency and amount of changes of applications
WO2016178685A1 (en) Method and apparatus to deploy information technology systems
US9158474B2 (en) Dynamic storage device libraries
WO2018061158A1 (ja) 計算機システムおよび計算機システム制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant