CN110717075B - 信息技术基础设施事故的优先化 - Google Patents

信息技术基础设施事故的优先化 Download PDF

Info

Publication number
CN110717075B
CN110717075B CN201910617335.0A CN201910617335A CN110717075B CN 110717075 B CN110717075 B CN 110717075B CN 201910617335 A CN201910617335 A CN 201910617335A CN 110717075 B CN110717075 B CN 110717075B
Authority
CN
China
Prior art keywords
processors
program code
impact
business
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910617335.0A
Other languages
English (en)
Other versions
CN110717075A (zh
Inventor
B·F·德利玛
J·R·杜德雷
P·希拉文格纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qindarui Co
Original Assignee
Qindarui Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qindarui Co filed Critical Qindarui Co
Publication of CN110717075A publication Critical patent/CN110717075A/zh
Application granted granted Critical
Publication of CN110717075B publication Critical patent/CN110717075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5022Ensuring fulfilment of SLA by giving priorities, e.g. assigning classes of service
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Abstract

本公开涉及信息技术基础设施事故的优先化,具体提供了一种方法、计算机程序产品和系统,其中(一个或多个)处理器获得在从共享分布式计算环境分配给实体的计算资源中经历的问题的通知,和对实体的业务性能测量具有可辨别影响的事件的通知。(一个或多个)处理器量化每个问题的技术性能影响以及每个事件的业务性能影响。(一个或多个)处理器认知地分析每个事件的业务性能影响以及每个问题的技术性能影响,以将量化事件的一部分与量化问题的一部分相关联。(一个或多个)处理器按照业务性能影响的严重程度优先化该一部分问题。(一个或多个)处理器按照优先级次序缓解分配给实体的计算资源中经历的该一部分问题。

Description

信息技术基础设施事故的优先化
背景技术
随着计算系统变得更加复杂,并且给定用户使用的资源变得不那么集中,在计算系统内可能发生影响效率的问题,但是难以诊断和解决。鉴于这些分布式系统(包括云计算系统)的复杂性,为了迁移,通过监视系统资源而感知到的问题的优先化可能存在问题。许多现有的监视系统不提供优先化,只是在发现这些问题时触发缓解问题的动作。这些系统缺乏能够自动地将事故优先级与既定标准对准的动态优先化系统,包括但不限于业务需求(即,影响业务利用资源的效率和/或连续性并决定系统对业务的功效的需求)。熟悉组织业务需求的用户很少熟悉业务用于最终满足这些需求的计算资源的影响和潜在影响。因此,熟悉业务需求的个人无法看到与这些需求相关的信息技术基础设施中出现的问题。此外,某些业务需求不是由组织的管理层主动决定,而是受到各种渠道的影响,包括但不限于电子邮件、社交媒体邮资、报纸和/或政府公告。在被组织使用的环境中,在报告、优先化和解决关于计算资源的问题时,计算资源监视方法不会使这些渠道上下文化。
发明内容
通过提供一种用于优先化所分配的资源中的技术问题的缓解的方法,克服了现有技术的缺点并提供了附加的优点。该方法包括,例如:由一个或多个处理器获得在从共享分布式计算环境分配给实体的计算资源中经历的问题的通知;由一个或多个处理器获得对实体的业务性能测量具有可辨别的影响的事件的通知;由一个或多个处理器量化问题中的每个问题对所分配的计算资源的技术性能的技术性能影响;由一个或多个处理器基于一个或多个性能测量来量化事件中的每个事件对实体的业务性能测量的业务性能影响;由一个或多个处理器认知地分析每个事件的业务性能影响和每个问题的技术性能影响,以将量化事件的一部分与量化问题的一部分相关联;基于认知分析,由一个或多个处理器按照业务性能影响的严重程度优先化所述一部分问题,其中所述一部分中对业务性能具有更大可辨别影响的问题被指派较高的优先级;以及由一个或多个处理器按照优先级次序缓解分配给实体的计算资源中经历的所述一部分问题。
通过提供计算机程序产品,克服了现有技术的缺点并且提供了附加的优点,该计算机程序产品用于优先化所分配资源中的技术问题的缓解。该计算机程序产品包括存储介质,该存储介质可由处理电路读取并存储用于由处理电路执行以执行方法的指令。该方法包括,例如:由一个或多个处理器获得在从共享分布式计算环境分配给实体的计算资源中经历的问题的通知;由一个或多个处理器获得对实体的业务性能测量具有可辨别的影响的事件的通知;由一个或多个处理器量化问题中的每个问题对所分配的计算资源的技术性能的技术性能影响;由一个或多个处理器基于一个或多个性能测量来量化事件中的每个事件对实体的业务性能测量的业务性能影响;由一个或多个处理器认知地分析每个事件的业务性能影响和每个问题的技术性能影响,以将量化事件的一部分与量化问题的一部分相关联;基于认知分析,由一个或多个处理器按照业务性能影响的严重程度优先化所述一部分问题,其中所述一部分中对业务性能具有更大可辨别影响的问题被指派较高的优先级;以及由一个或多个处理器按照优先级次序缓解分配给实体的计算资源中经历的所述一部分问题。
本文还描述并要求保护与一个或多个方面有关的方法和系统。另外,还描述了与一个或多个方面有关的服务,并且可以在本文要求保护。
通过本文描述的技术实现了附加特征。在本文详细描述了其它实施例和方面并且这些实施例和方面被认为是所要求保护的各方面的一部分。
附图说明
在说明书结论处的权利要求中作为示例特别指出并清楚地要求保护一个或多个方面。通过以下结合附图的详细描述,一个或多个方面的前述和目的、特征和优点是显而易见的:
图1是图示本发明实施例的某些方面的工作流程;
图2是可以实现本发明实施例的各方面的环境的各个方面的图示;
图3是图示本发明实施例的某些方面的工作流程;
图4是图示本发明实施例的某些方面的工作流程;
图5是图示本发明实施例的某些方面的工作流程;
图6是图示本发明实施例的某些方面的工作流程;
图7是图示本发明实施例的某些方面的业务流程图;
图8是图示本发明实施例的各个方面的上下文图;
图9描绘了可以在云计算环境中使用的计算节点的一个实施例;
图10表示根据本发明一实施例的云计算环境;以及
图11表示根据本发明一实施例的抽象模型层;
具体实施方式
其中相同的标号在各个视图中指代完全相同或功能相似的元件并且结合在说明书中并形成说明书的一部分的附图进一步图示了本发明并且,与本发明的详细描述一起,用于解释本发明的原理。如本领域技术人员所理解的,提供附图是为了便于理解和说明本发明某些实施例的各方面。本发明不限于附图中描绘的实施例。
如本领域技术人员所理解的,如本申请中所提及的,程序代码包括软件和硬件。例如,本发明的某些实施例中的程序代码包括固定功能硬件,而其它实施例利用所描述的功能的基于软件的实现。某些实施例组合了两种类型的程序代码。程序代码的一个示例(也称为一个或多个程序)在图9中被描绘为具有一组(至少一个)程序模块42的程序/实用程序40,可以存储在存储器28中。
本发明的实施例包括计算机实现的方法、计算机程序产品和计算机系统,其包括在至少一个处理电路上执行的程序代码,该程序代码通过以下缓解用户在技术环境中对一个或多个资源所经历的潜在影响:1)基于执行指标根据事故的潜在影响来优先化在环境内经历的技术事故;2)通过识别和执行来自内部和外部通信渠道的上下文数据的认知分析,建立可靠的执行指标(优先化基于此);以及3)基于定义的优先级(例如,由利用技术环境的资源的用户或用户组定义的优先级)动态地优先化事故缓解。本发明的实施例利用不同组的非结构化和结构化数据,以便在用户群的操作(例如,商业)目标和里程碑与实现那些目标不可或缺的计算系统之间创建透明度,从而实现计算系统以符合这些目标和里程碑的方式运作。本发明的一些实施例的各方面表示认知解决方案,其中程序代码通过提供保护业务处理的业务响应IT监视器来将业务与信息技术(IT)基础设施连接。程序代码通过认知分析(其可以包括利用认知代理)机器学习业务执行条件与IT要素的状态之间的关系。基于定义这种关系,程序代码优先化对负面影响要素状态的问题的响应,以避免或缓解这些影响。
本发明的一些实施例提供程序代码,其填补监视IT基础设施和提供业务响应IT基础设施之间的间隙。照此,本发明的一些实施例的各方面提供优于现有方法的优点,以监视和缓解分布式计算系统中的问题。例如,一些监视和缓解系统基于事故在给定时间段内的流行程度确定事故的优先级,将更频繁发生的事故指派给较高优先级的队列,以便更快地解决和纠正。给定事故的频率常常与事故(或事故类型)对业务的影响无关。例如,从用户的角度来看,虽然给定资源的第一个重复问题对用户的生产率影响最小,但是对于另一个资源只发生一次的第二个问题会严重影响用户的效率并且甚至整体上影响计算系统的效率。在本发明的实施例中,由至少一个处理资源执行的程序代码在经历事故时,从用户的角度,在优先化导致要缓解的事故的原因的问题并且调度这些问题以进行缓解时利用与系统功效绑定的性能指标,而不是依赖事故的频率来优先化缓解哪些问题。作为本发明各方面的优点的另一个示例,一些现有的监视和缓解系统基于经历每个问题的客户的重要性来优先化哪些问题(通过系统监视识别)要解决。在这些系统中,客户提交报告,并且程序代码基于客户的优先级排名确定问题缓解的次序。在本发明的实施例中,程序代码不是将单个状态归因于给定实体所经历的所有问题,而是基于性能指标来优先化问题缓解,所述性能指标链接到受问题影响的具体处理和这些处理对客户的优先级。因此,在本发明的实施例中,程序代码提供更细粒度和更结合上下文的方法来优先化缓解分布式计算环境中经历的问题。
本发明实施例的各方面对生产率的优点不仅仅由资源的用户体验。更确切地说,基于本发明实施例的各方面,负责解决问题的个人和系统也更有效和更有产出率。基于感知到的潜在业务影响,程序代码可以确定给定事故具有较高优先级,并且基于这个确定,可以将用于缓解问题的资源集中在这个标识符较高优先级事故上。基于执行认知分析,在本发明的实施例中,程序代码可以向负责问题缓解的处理和个人提供与给定技术环境中的每个要素相关的业务影响指数的百分比风险。
如上所述,本发明的实施例提供远远超过现有系统监视和问题缓解系统,但是,本发明的实施例另外与计算密不可分。例如,本发明的实施例与计算密不可分,至少因为这些实施例中的程序代码利用在分布式计算环境中启用的数字通信渠道和实时通信,并执行认知分析(访问基于计算系统的连接性可用的资源)以促进关键性能因素的生成,以生成用于缓解系统内识别出的问题的最佳次序,以确保计算系统内的效率和功效。此外,经由共享计算环境(例如,云计算系统)将应用用作服务是计算所特有的挑战,并且利用利用计算资源的特征来保护计算系统的容量、效率、性能和功效的方法来解决这个问题。没有本发明实施例中的方面,计算系统的性能将受到损害。如本文将更详细地解释的,在本发明的实施例中,数据和程序代码合成各种数据的能力的多样性使得程序代码能够将信息考虑在(认知)分析中,包括实时合成的时间数据,以便实现问题对用户利用计算系统以满足既定目标的影响。通过这种依赖于计算的功能启用优先化。
本发明的各种实施例的各方面可以跨越不同数量的系统和技术资源来实现,并且可以与各种技术环境资源协调。本发明的实施例是独立于平台的,并且可以与运行业务处理管理(BPM)和/或信息技术服务管理(ITSM)的服务管理解决方案集成。另外,本发明实施例的各方面可以被实现为系统部件和/或软件,作为服务解决方案。本发明的实施例可以用在共享计算环境中,包括云计算系统。这些共享处理环境中的一些可以利用云管理平台,该平台使用基于策略的工具自动配置云服务,包括但不限于CloudOrchestrator。是International Business Machines Corporation,Armonk,New York,US的注册商标。本发明实施例中的程序代码可以与这些云管理平台通信,以提供用于扩展要求的业务和IT维度。如上面所提到的,本发明的实施例包括从各种来源对结构和非结构化数据进行认知分析。程序代码可以利用现有的认知代理来执行这个分析,包括但不限于IBMIBM/>是International Business Machines Corporation,Armonk,New York,US的注册商标。例如,在本发明的一些实施例中,程序代码与作为已知认知代理的一部分的应用编程接口(API)接口,诸如IBM/>应用接口(API),International Business Machines Corporation的产品,以识别技术环境的资源与技术环境的资源的用户的业务优先级之间的关系,以生成关键性能因素,其中程序代码与问题相关联并根据这些关联值对问题进行优先化。在本发明的一些实施例中,为了处理通知关键性能因素的结构化和非结构化数据,由一个或多个程序使用的API可以包括但不限于检索和排名(即,通过IBM/>DeveloperCloud可以获得的服务,其可以使来自文档集的最相关信息浮出表面)、概念/视觉洞察、权衡分析、文档转换和/或关系提取。
图1是图示本发明一些实施例的各个方面的工作流程100。如图1中所示,在本发明的实施例中,程序代码生成在给定实体(例如,组织、组、用户、处理)使用的技术环境(例如,计算系统)内经历的事件和事故(或问题)之间的相关性。为了生成这些相关性,程序代码基于来自各种通信渠道(例如,电子邮件、社交媒体邮资、报纸和/或政府公告)的结构化和非结构化数据来执行认知分析。例如,程序代码基于影响实体的关键性能指标(KPI)在程序代码确定将影响实体的事件发生时实时生成警报。关键执行指标是一个可测量的值,其证明公司实现关键业务目标的有效程度。组织使用多个级别的KPI来评估他们在达到目标方面的成功。高级KPI可以关注企业的整体执行,而低级KPI可以关注销售、营销或呼叫中心等部门的流程。
返回图1,在本发明的实施例中,由一个或多个处理器执行的程序代码从结构化和非结构化数据源获得数据(110)。程序代码认知地分析数据,并且通过这种分析,将实体使用的计算系统的部件所经历的潜在问题与业务警报相关联(120)。通过获得和分析非结构化数据,本发明实施例中的程序代码可以识别意外的业务风险。例如,通过分析来自通信(包括但不限于电子邮件)的数据,程序代码可以识别由于新的应用、策略或系统引起的使用模式的变化,其中业务性能可以受到IT问题或容量限制的影响。而且,从外部信息来源(包括但不限于社交媒体、新闻和政府公告),程序代码可以识别IT或业务问题。通过分析来自这些来源的非结构化数据,程序代码可以识别风险或获得有关现有实体优先级的附加见解。
作为认知分析的一部分,程序代码可以从商业的角度将计算环境内的某些技术资产优先化为对实体而言更重要或者更不重要,和/或识别各种问题对实体的功效(例如,实现业务目标)的影响是未知的盲点。因此,由程序代码生成的某些业务警报可以基于程序代码识别出的盲点与具有未知影响的事故相关联。
返回图1,在本发明的一些实施例中,程序代码基于数据的认知分析和附加优先级(例如,服务级别协议(SLA))对相关业务警报进行排名(130)。在本发明的一些实施例中,程序代码将较高优先级的排名指派给可能导致对实体的更大影响的潜在问题。例如,程序代码可以为指示将立即影响实体的业务连续性的部件故障的问题指派较高的优先级。基于识别计算系统的给定部件的问题,程序代码发出具有与问题的优先级相称的紧急性的业务警报(140)。在本发明的一些实施例中,通知可以包括业务警报消息,其表示单个处理中识别出的问题的单次出现(例如,错误、经过的时间、成本等)。基于问题,程序代码还可以在通知中提供KPI值(在多个处理实例中测量)以指示KPI处于不期望的状态(例如,太低、太高、在错误的范围内),或趋向于有问题的状态。
图2是各种资源的技术概述200,其可以包括可以实现本发明的一些实施例的各方面的环境。如这个非限制性示例中所示,在至少一个处理资源210上执行的程序代码205从各种源获得数据,以便通过将技术问题与问题的业务影响相关联来动态地确定分配给实体的资源220所经历的各种技术问题的优先级。程序代码205获得定义实体优先级和阈值(例如,KPI、阈值和业务影响计算及估计)的电子商务数据230。程序代码205还从分配给实体的资源220外部的源获得数据,包括来自诸如新闻、电子邮件、社交媒体等的通信渠道240。
程序代码205监视资源220以获得技术问题的报告。在本发明的一些实施例中,程序代码205可以从在通信地耦合到处理资源210的资源(未示出)上(包括在一个或多个资源220上)执行的监视系统和分配给该实体的资源220接收关于在资源220内经历的技术问题的数据。例如,程序代码205可以从监视系统获得事故票据,该事件票据向程序代码205提供由监视系统识别和/或由使用资源220的用户和/或实体报告的技术问题。
在本发明的一些实施例中,程序代码205执行认知分析以将业务数据与技术问题相关联,即,程序代码205确定哪些问题与分配的资源220一起将对实体产生最大的负面影响(例如,破坏业务连续性、导致KPI偏离可接受的阈值等)。基于这个确定,程序代码205动态地对技术问题进行优先化。
程序代码205连续地从资源220、业务数据230源和通信渠道240获得数据,并基于新数据确定是否调整问题的优先化。例如,基于程序代码205识别出实体对新应用的实现,以在资源220的资源上执行,其中应用被实现为实体的新项目的一部分,如业务数据230中所指示的,以及项目的原因是由管理机构引入的新的合规性要求,如程序代码205从新闻(例如,通信渠道240)提取的数据所指示的,程序代码205可以将执行该应用的资源的问题优先化在较高级别。
由程序代码205获得的问题通知由程序代码205执行的认知分析(使用或不使用分离的认知代理),以通过连续机器学习来增加相关性的智能,该程序还基于问题和问题的优先级来确定是否应当采取动作。此外,当程序代码205确定在所分配的资源220中已经发生问题时,程序代码205基于相关的优先化确定是否应当采取动作并且,可选地,应当采取什么动作来缓解问题。根据优先级,缓解动作和动作的定时可以不同。例如,在具有服务于多个实体的多个资源的分布式系统中,程序代码205可以基于问题的优先级和可以用于解决这些问题的资源而在其它问题之前解决某些问题。
在本发明的一些实施例中,程序代码205通过电子方式通知利益相关者关于问题来解决该问题。在通知中,程序代码205可以指示问题的优先级。如果问题持续存在,程序代码还可以提供指示问题对KPI的感知影响的数据。
在本发明的一些实施例中,除了通知利益相关者问题之外或代替通知利益相关者,程序代码还可以自动缓解问题。程序代码可以通过对分配的资源220进行改变来修复问题,和/或程序代码可以分配新资源来代替经历问题的资源,以便为实体提供业务连续性。
图3是图示本发明的一些实施例的各方面的工作流程300,特别是除了图2中所示的那些之外的附加因素(诸如服务级别协议)如何也可以影响技术问题和技术问题的业务影响的相关性,以及影响向技术问题指派优先级级别。在本发明的一些实施例中,在分布式计算系统的计算资源的至少一个处理电路上执行的程序代码获得针对分布式计算系统的资源发生的问题的通知。如图3中所描绘的,在本发明的实施例中,在处理中的资源上执行的程序代码获得实体使用的技术环境内的事故(例如,IT事故)的通知以及对实体的业务性能测量具有可辨别影响的事件的通知(310)。在本发明的一些实施例中,程序代码从计算资源监视系统获得作为事故通知的票据。在本发明的一些实施例中,程序代码获得具有KPI和阈值以及业务影响计算/估计的消息,作为对业务性能度量具有可辨别的影响的事件的通知。程序代码基于与实体的服务级别协议,分别利用影响参数对具有对业务性能的可辨别影响的事件进行排名以及按照优先级对技术环境内的事故进行排名(320)。在本发明的实施例中,程序代码可以通过例如按比例对事件和事故进行评级或量化来确定这些事件和事故的影响。程序代码还可以从预定比例(例如,低、中、高等)或数字评级系统来指派评级。通过为事件和事故提供带有数量的评级,可以通过程序代码将这些事件和事故彼此比较。
返回到图3,程序代码执行认知分析以将技术环境内的排名事故与具有对业务性能的可辨别影响的排名事件相关联(330)。程序代码通过为技术环境内的排名事故指派较高优先级来确定技术环境中每个排名事故的优先级,这导致对业务性能的更大可辨别影响(340)。程序代码基于技术环境内较高优先级排名的事故的一部分来确定是否调整技术环境中的资源将缓解较高优先级排名的事故的该一部分(350)。基于确定调整技术环境中的资源将缓解该一部分,程序代码调整分配给实体的资源(360)。
在本发明的一些实施例中,程序代码从一个或多个外部源和/或渠道获得与业务指示符的通信。图4图示了如何在本发明的实施例中利用与业务指示符的这些通信。这些通信渠道和/或源可以被映射到执行程序代码的资源。在本发明的一些实施例中,在处理资源上执行的程序代码识别对业务内部和外部的改变敏感的实体的业务处理和KPI(410)。程序代码识别与这些改变相关的数据源(例如,通信渠道)(420)。例如,程序代码可以确定实体的KPI易受恶劣天气警告的影响。例如,如果实体是联网的游戏竞技场,那么恶劣天气可以表示业务的小幅增长,因此需要更多计算资源来容纳联网系统的用户。程序代码监视识别出的源(430)。为了监视源,在本发明的一些实施例中,程序代码周期性地扫描通信渠道以识别来自与改变相关的数据源的内容(例如,业务风险指示符)(440)。程序代码利用认知分析(例如,图3,330)中的内容将技术环境内的排名事故与对业务性能具有可辨别的影响的排名事件(现在包括业务事件和来自渠道的所识别出的内容)相关联(450)。程序代码从这种增强的认知分析中机器学习,并可以应用这种附加的数据来增强未来的认知分析。
除了可选地使用优先化的事故来完成图3的工作流程300以缓解技术环境内的问题之外,程序代码还可以利用来自渠道的识别出的内容来填充程序代码不能建立业务事件和IT问题之间的关系因此无法基于潜在的业务影响优先化IT问题的缓解的感知盲点。图5图示了本发明实施例中的工作流程500的各个方面,其中由处理电路执行的程序代码将技术环境问题(例如,IT问题)与业务影响相关联。
在本发明的实施例中,程序代码不仅能够将各种技术问题经验与业务影响相关联,程序代码还能够识别给定技术问题的影响未知的位置(即,呈现盲点),以便在经历影响未知的问题时提醒使用系统的实体,从而有机会缓解这个问题。如图5中所示,在本发明的实施例中,程序代码执行认知分析以将所获得的技术环境内的事故与具有对实体的业务性能测量的可辨别影响的事件的通知相关联(510)。基于执行利用对实体的业务性能测量具有可辨别影响的事件的通知的认知分析,程序代码识别技术环境中程序代码无法将事故与实体的业务性能的影响相关联的事故(520)。程序代码执行认知分析以将来自与改变(例如,业务风险指示符)相关的数据源的内容与事故相关联,以生成潜在的业务影响与事故之间的相关性(530)。基于将给定事故与潜在业务影响相关联,程序代码调整事故的优先级排名(540)。基于未能将给定事故与潜在业务影响相关联,程序代码发送关于事故的通知,以指示与事故相关的风险未知(550)。因此,不是向给定事故指派低优先级,本发明的实施例可以向实体警告具有不可预见影响的事故。
如上面所提到的,在本发明的实施例中,程序代码在将技术问题与业务影响相关联的准确性随着系统的使用而增加,因为程序代码是机器学习。图6是图示本发明的一些实施例的机器学习方面的工作流程600。这些机器学习方面有助于使程序代码避免和/或最小化由计算环境中的技术(例如,IT)问题造成的业务影响。这些方面可以与图3-5中所示的各方面协同工作,图3-5图示了本发明的一些实施例中的程序代码如何通过使程序代码首先解决具有实际或潜在较高影响的事故来避免和/或缓解技术问题对业务连续性和实体的其它业务测量的影响。
转到图6,在本发明的实施例中,基于与实体的服务级别协议,由处理电路执行的程序代码分别利用影响参数对具有对业务性能的可辨别影响的事件进行排名和按照优先级对基于监视技术环境的程序代码获得的技术环境中的事故进行排名(610)(例如,图3,320)。程序代码执行认知分析以将技术环境内的排名事故与具有对业务性能的可辨别影响的排名事件相关联(620)(例如,图3,330)。程序代码通过为技术环境内导致对业务性能的更大可辨别影响的排名事故指派较高的优先级来确定技术环境内每个排名事故的优先级(630)(例如,图3,340)。程序代码用相关性和结果排名(例如,业务影响)更新存储资源(640)。基于排名,程序代码按优先级次序缓解事故(650)。在本发明的一些实施例中,程序代码通过向识别出的业务影响中的利益相关者发送电子通知来缓解事故,并向利益相关者提供发送自定义消息以指导问题的缓解的选项。因此,由程序代码缓解问题可以包括程序代码请求和接收来自用户的反馈(以及应用反馈)以确定如何缓解给定问题。例如,通过关闭和重启资源可以缓解一些问题。程序代码可以与利益相关者通信以确定重启的适当窗口。
在本发明的一些实施例中,一旦缓解了给定问题(例如,问题被关闭),程序代码就验证监视受问题影响的一个或多个资源以验证(通过程序代码经由认知分析)预期的业务影响并确定预期的业务影响是否已经被指派由程序代码通过认知分析指派的优先级的阈值(660)。程序代码确定缓解问题对用于生成相关性的业务度量的影响(670)。程序代码基于缓解影响更新问题与其业务影响之间的相关性(680)。通过将缓解问题的影响添加到认知分析中,程序代码可以更准确地衡量IT行为的重要性,同时避免和最小化业务影响。
图7是业务流程700图,其提供了本发明的一些实施例的各个方面的简明视图。由于图3-6集中于本发明的一些实施例的某些方面,图7提供了当组合某些方面时的业务流程的概述。在图7中,可以利用诸如Watson之类的认知分析工具来在图片工作流程700的初始执行期间通过程序代码验证优先化。图7被划分为业务流程600、事件到达710、事件处理720和响应处理730的不同部分。
在事件到达710处,程序代码从外部源713获得业务事件711、IT事件712和非结构化数据。在事件处理720中,在获得业务事件711后,程序代码针对用于业务情况721的相关KPI、SLA评估获得的每个事件,以确定事件是否达到显著性阈值731。如果程序代码确定达到阈值731,那么程序代码发送与业务事件相关的通知741。在获得IT事件712后,程序代码针对用于IT情况722的相关KPI、SLA评估获得的每个事件,以确定事件是否达到显著性阈值732。如果程序代码确定达到阈值732,那么程序代码发送与IT事件相关的通知742。在获得非结构化数据713后,程序代码分析非结构化数据以基于提取和分析的内容723确定潜在影响。如果程序代码确定非结构化数据指示影响733,那么程序代码发送通知743。在本发明的一些实施例中,不是正式的警报消息或通知,而是基于程序代码确定业务事件、IT事件和/或非结构化数据,程序代码继续到业务流程700的响应处理730阶段。可以用于将对实体的业务影响与该实体利用的资源中经历的IT事件相关联。
在所示业务流程700的响应处理730方面中,程序代码获得先前评估的业务事件、IT事件和从非结构化数据的分析获得的结果,并利用这个数据来关联事件并导出用于缓解每个IT事件740的初始优先级。程序代码确定每个IT事件750的财务影响。程序代码确定每个IT事件760的一般业务影响。程序代码更新每个IT事件770的初始优先级。程序代码根据优先级780缓解IT事件。在本发明的一些实施例中,程序代码向利益相关者通知高优先级事件。在本发明的一些实施例中,程序代码利用Watson或另一种认知分析工具来验证所指派的事件的优先级。在本发明的一些实施例中,程序代码通过更新监视工具中的票据来反映所生成的优先级来缓解事件。
图8是系统上下文图800,其图示了有助于本发明实施例的功效的计算环境中的各种系统的相互作用。在这个图800中,本发明的实施例被描绘为解决方案系统810,其从各种系统获得数据并更新这些系统中的数据,以便预期和缓解在技术环境中具有潜在有问题的业务影响的IT问题。在解决方案系统810与之交互的系统当中是:1)配置工具820,解决方案系统810从该配置工具820获得关于应用结构的数据(例如,配置项);2)服务管理系统830,解决方案系统810从该服务管理系统获得动作并且解决方案系统810向其提供通知;3)合同管理系统840,如果合同中的服务对于利用分配的资源的实体不可用,那么解决方案系统810从该合同管理系统获得与罚款相关的财务数据;4)监视和事件工具850,如果事件超过配置的阈值(来自配置工具820),那么解决方案系统810从该工具获得通知,并且解决方案系统810向其发送或更新事故票据以触发事件的缓解;5)业务处理管理工具860,如果超过这些阈值,那么解决方案系统810从该工具管理工具860获得处理和通知的结构;以及6)执行工具870,如果超过配置的阈值,那么解决方案系统810从该执行工具870获得通知。
本发明的实施例包括计算机实现的方法、计算机程序产品和计算系统,其包括在一个或多个处理器上执行的程序代码,以执行包括获得在从共享分布式计算环境分配给实体的计算资源中经历的问题的通知的方法。程序代码获得对实体的业务性能测量具有可辨别影响的事件的通知。程序代码量化问题中的每个问题对分配的计算资源的技术性能的技术性能影响。程序代码基于一个或多个性能测量来量化事件中的每个事件对实体的业务性能测量的业务性能影响。程序代码认知地分析每个事件的业务性能影响以及每个问题的技术性能影响,以将量化事件的一部分与量化问题的一部分相关联。基于认知分析,程序代码按照业务性能影响的严重程度优先化问题的一部分,其中该一部分中对业务性能具有更大可辨别影响的问题被指派较高的优先级。程序代码按照优先级次序缓解分配给实体的计算资源中经历的该一部分问题。
在本发明的一些实施例中,当程序代码缓解包括:程序代码确定调整共享分布式计算系统中的资源分配将缓解该一部分问题当中具有较高优先级的一个或多个部分问题,以及程序代码将来自共享分布式计算系统的附加计算资源添加到分配给实体的计算资源。
在本发明的一些实施例中,程序代码通过确定调整共享分布式计算系统中的资源分配将缓解该一部分问题当中具有较高优先级的一个或多个问题并且重新配置分配给实体的计算资源来进行缓解。
在本发明的一些实施例中,可辨别的影响基于预定义的性能测量。
在本发明的一些实施例中,程序代码通过以下认知地分析每个事件的业务性能影响和每个问题的技术性能影响:识别包括与实体相关的时间数据的非结构化数据的源,从源间歇地获得非结构化数据,分析非结构化数据以识别潜在地与具有可辨别影响的事件相关的内容,并在认知分析中利用识别出的内容将量化事件的部分与量化问题的部分相关联。
在本发明的一些实施例中,程序代码认知地分析还包括:程序代码认知地分析每个事件的业务性能影响和每个问题的技术性能影响,以基于认知分析识别量化问题的与量化事件不相关的第二部分,以及程序代码基于量化问题的第二部分的量化问题的发生而生成通知。
在本发明的一些实施例中,程序代码经由所分配资源中的资源获得将量化问题的第二部分的一个或多个问题与量化事件的第二部分相关联的数据。程序代码基于数据按照业务性能影响的严重程度优先化该一个或多个问题。
在本发明的一些实施例中,程序代码利用由认知分析生成的相关性和该一部分问题的一部分的优先化来更新存储器资源。程序代码监视该一部分问题的缓解,以验证该一部分问题的优先化的准确性。程序代码基于验证更新存储器资源。
在本发明的一些实施例中,程序代码认知地分析包括:程序代码将与问题和事件相关的数据发送到认知分析工具,并且程序代码从认知分析工具获得结果。
在本发明的一些实施例中,程序代码认知地分析每个事件的业务性能影响和每个问题的技术性能影响还包括程序代码利用存储器资源。
在本发明的一些实施例中,程序代码认知地分析每个事件的业务性能影响和每个问题的技术性能影响还包括:程序代码获得管理所分配的资源的一个或多个服务级别协议,以及程序代码在优先化中利用该一个或多个服务级别协议。
在本发明的一些实施例中,业务性能测量包括关键性能指标。
现在参考图9,其中显示了计算节点的一个示例,其可以是云计算节点10。云计算节点10仅仅是适合的云计算节点的一个示例,不应对本发明实施例的功能和使用范围带来任何限制。总之,云计算节点10能够被用来实现和/或执行以上所述的任何功能。在本发明的实施例中,处理资源210(图2)和包括资源220(图2)的计算资源外部的源的计算资源可以各自被理解为云计算节点10(图9),如果不是云计算节点10,则一个或者多个通用计算节点包括了云计算节点10的各个方面。
云计算节点10具有计算机系统/服务器12,其可与众多其它通用或专用计算系统环境或配置一起操作。众所周知,适于与计算机系统/服务器12一起操作的计算系统、环境和/或配置的示例包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任意系统的分布式云计算技术环境,等等。
计算机系统/服务器12在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、部件、逻辑、数据结构等。计算机系统/服务器12在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
如图9所示,可以被用作云计算节点10的计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的部件包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统部件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围部件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质能够被计算机系统/服务器12访问的任意可获得的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12还包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。虽然图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,存储在存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用、其它程序模块以及程序数据,这些示例中的每一个或某种组合中包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12还可以与一个或多个外部设备14通信,诸如键盘、指示设备、显示器24等;一个或多个使用户能够与计算机系统/服务器12交互的设备;和/或使计算机系统/服务器12能够与一个或多个其它计算设备通信的任何设备(例如,网卡、调制解调器等)。这种通信可以经由输入/输出(I/O)接口22发生。还有,计算机系统/服务器12可以经由网络适配器20与诸如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如,互联网)之类的一个或多个网络通信。如图所描绘的,网络适配器20经由总线18与计算机系统/服务器12的其它部件通信。应当理解的是,虽然未示出,但是其它硬件和/或软件部件可以与计算机系统/服务器12结合使用。示例包括但不限于:微代码、设备驱动程序、冗余处理单元、外部磁盘驱动器阵列、RAID系统、磁带驱动器和数据存档存储系统等。
应当理解的是,虽然本公开包括关于云计算的详细描述,但是本文所述的教导的实现不限于云计算环境。更确切地说,本发明的实施例能够结合现在已知或以后开发的任何其它类型的计算环境来实现。如本领域技术人员所理解的,可以利用本发明的各方面的另一个领域是量子计算。例如,本发明的实施例的各方面可以与解决所谓的“晚餐聚会问题”结合使用(即,“在晚餐时必须有多少人以确保存在或者全部是熟人或者全部相互是陌生人的3个人的子集?”)。因为本发明的各方面在IT问题和业务事件之间生成相关性,利用给定计算系统内部和外部的源,因此本发明实施例中的程序代码适用于相关构建以解决其它问题。由于本发明的实施例可以用作具有复杂业务处理的大型IT环境的业务和IT环境之间的相关性的替代/改进解决方案,将该功能应用于“晚餐聚会问题”以及期望建立相关性的其它情况将有利。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。Rapid
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其它基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络部件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图10,其中显示了示例性的云计算环境50。如图所示,云计算环境50包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点10,本地计算设备例如可以是个人数字助理(PDA)或移动电话54A,台式电脑54B、笔记本电脑54C和/或汽车计算机系统54N。云计算节点10之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点10进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境50提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应该理解的是,图10显示的各类计算设备54A-N仅仅是示意性的,云计算节点10以及云计算环境50可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图11,其中显示了云计算环境50(图10)提供的一组功能抽象层。首先应该理解的是,图11所示的部件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图所示,提供下列层和对应功能:
硬件和软件层60包括硬件和软件部件。硬件部件的示例包括:主机61;基于RISC(精简指令集计算机)体系结构的服务器62;服务器63;刀片服务器64;存储设备65;网络和网络部件66。软件部件的示例包括:网络应用服务器软件67以及数据库软件68。
虚拟层70提供一个抽象层,该层可以提供下列虚拟实体的示例:虚拟服务器71、虚拟存储72、虚拟网络73(包括虚拟私有网络)、虚拟应用和操作系统74,以及虚拟客户端75。
在一个示例中,管理层80可以提供下述功能:资源供应功能81:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能82:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个示例中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能83:为消费者和系统管理员提供对云计算环境的访问。服务级别管理功能84:提供云计算资源的分配和管理,以满足必需的服务级别。服务级别协议(SLA)计划和履行功能85:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层90提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航91;软件开发及生命周期管理92;虚拟教室的教学提供93;数据分析处理94;交易处理95;以及在关联业务和技术影响的基础上优先缓解问题96。
在任何可能的技术细节结合层面,本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的示例(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如互联网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用互联网服务提供商来通过互联网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应该理解的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本文使用的术语仅用于描述特定实施例的目的,而不是限制性的。如本文所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文另有明确指示。将进一步理解的是,当在本说明书中使用时,术语“包括”和/或“包含”指定所述特征、整数、步骤、操作、元件和/或部件的存在,但不排除存在或者添加一个或多个其它特征、整数、步骤、操作、元件、部件和/或组。
以下权利要求中的所有装置或步骤加功能元件的相应结构、材料、动作和等同物(如果有的话)旨在包括用于结合具体要求保护的其它要求保护的元件执行功能的任何结构、材料或动作。已经出于说明和描述的目的给出了一个或多个实施例的描述,但是并不旨在是详尽的或限于所公开的形式。许多修改和变化对于本领域普通技术人员来说是显而易见的。选择和描述实施例是为了最好地解释各个方面和实际应用,并且使本领域普通技术人员能够理解具有适合于预期的特定用途的各种修改的各种实施例。

Claims (13)

1.一种计算机实现的方法,包括:
由一个或多个处理器获得在从共享分布式计算环境分配给实体的计算资源中经历的问题的通知;
由所述一个或多个处理器获得对实体的业务性能测量具有可辨别的影响的事件的通知;
由所述一个或多个处理器量化问题中的每个问题对所分配的计算资源的技术性能的技术性能影响;
由所述一个或多个处理器基于一个或多个性能测量来量化事件中的每个事件对实体的业务性能测量的业务性能影响;
由所述一个或多个处理器认知地分析每个事件的业务性能影响和每个问题的技术性能影响,以将量化事件的一部分与量化问题的一部分相关联;
基于认知分析,由所述一个或多个处理器按照业务性能影响的严重程度优先化一部分问题,其中所述一部分问题中对业务性能具有更大可辨别影响的问题被指派更高的优先级;以及
由所述一个或多个处理器按照优先级次序缓解在分配给实体的计算资源中经历的所述一部分问题,
其中,缓解包括:
由所述一个或多个处理器确定调整共享分布式计算环境中的资源的分配将缓解所述一部分问题当中具有更高优先级的所述一部分问题的一个或多个问题;
由所述一个或多个处理器将来自共享分布式计算环境的附加计算资源添加到分配给实体的计算资源;以及
由所述一个或多个处理器向至少一个利益相关者通知以缓解具有更高优先级的所述一部分问题的至少一个问题,并且向所述至少一个利益相关者提供发送自定义消息以指导所述至少一个问题的缓解的选项,其中,所述缓解使得实体的从共享分布式计算环境所分配的计算资源能够符合管理所分配的计算资源的技术性能的至少一个服务级别协议;以及
其中,认知地分析每个事件的业务性能影响和每个问题的技术性能影响还包括:
由所述一个或多个处理器识别包括与实体相关的时间数据的非结构化数据的外部源,其中,所述外部源在分配给实体的计算资源外部;
由所述一个或多个处理器间歇地从所述外部源获得非结构化数据;
由所述一个或多个处理器分析非结构化数据以识别潜在地与具有可辨别影响的事件相关的内容;以及
由所述一个或多个处理器在认知分析中利用识别出的内容以将量化事件的一部分与量化问题的一部分相关联。
2.如权利要求1所述的计算机实现的方法,其中缓解还包括:
由所述一个或多个处理器重新配置分配给实体的计算资源。
3.如权利要求1所述的计算机实现的方法,其中可辨别的影响基于预定义的性能测量。
4.如权利要求1所述的计算机实现的方法,认知地分析还包括:
由所述一个或多个处理器认知地分析每个事件的业务性能影响和每个问题的技术性能影响,以基于认知分析识别量化问题的与量化事件不相关的第二部分;以及
由所述一个或多个处理器基于量化问题的第二部分中的量化问题的发生而生成通知。
5.如权利要求4所述的计算机实现的方法,还包括:
由所述一个或多个处理器经由所分配资源中的资源获得将量化问题的第二部分中的一个或多个问题与量化事件的第二部分相关联的数据;以及
由所述一个或多个处理器基于数据按照业务性能影响的严重程度优先化所述一个或多个问题。
6.如权利要求1所述的计算机实现的方法,还包括:
由所述一个或多个处理器利用由认知分析生成的相关性和所述一部分问题的优先化来更新存储器资源;
由所述一个或多个处理器监视所述一部分问题的缓解,以验证所述一部分问题的优先化的准确性;以及
由所述一个或多个处理器基于验证更新存储器资源。
7.如权利要求6所述的计算机实现的方法,其中认知地分析包括:
由所述一个或多个处理器将与问题和事件相关的数据发送到认知分析工具;以及
由所述一个或多个处理器从认知分析工具获得结果。
8.如权利要求7所述的计算机实现的方法,其中认知地分析每个事件的业务性能影响和每个问题的技术性能影响还包括利用存储器资源。
9.如权利要求8所述的计算机实现的方法,其中认知地分析每个事件的业务性能影响和每个问题的技术性能影响还包括:
由所述一个或多个处理器获得管理所分配的资源的一个或多个服务级别协议,其中,所述一个或多个服务级别协议包括所述至少一个服务级别协议;以及
由所述一个或多个处理器在优先化中利用所述一个或多个服务级别协议。
10.如权利要求1所述的计算机实现的方法,其中业务性能测量包括关键性能指标。
11.一种计算机可读存储介质,可由一个或多个处理器读取并存储用于由所述一个或多个处理器执行的指令,用于执行如权利要求1-10中任一项所述的方法中的步骤。
12.一种系统,包括:
存储器;
一个或多个处理器,与存储器通信;
程序指令,可由所述一个或多个处理器经由存储器执行,以执行如权利要求1-10中任一项所述的方法中的步骤。
13.一种计算机系统,包括被配置为执行如权利要求1-10中任一项所述的方法中的步骤的模块。
CN201910617335.0A 2018-07-11 2019-07-10 信息技术基础设施事故的优先化 Active CN110717075B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/032,833 2018-07-11
US16/032,833 US10892959B2 (en) 2018-07-11 2018-07-11 Prioritization of information technology infrastructure incidents

Publications (2)

Publication Number Publication Date
CN110717075A CN110717075A (zh) 2020-01-21
CN110717075B true CN110717075B (zh) 2024-04-30

Family

ID=69139795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910617335.0A Active CN110717075B (zh) 2018-07-11 2019-07-10 信息技术基础设施事故的优先化

Country Status (2)

Country Link
US (1) US10892959B2 (zh)
CN (1) CN110717075B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694144B2 (en) * 2018-07-19 2023-07-04 Sage Intacct, Inc. Automated identification and notification of performance trends
US20200410420A1 (en) * 2019-06-28 2020-12-31 Atlassian Pty Ltd. Issue rank management in an issue tracking system
US11023511B1 (en) * 2019-07-31 2021-06-01 Splunk Inc. Mobile device composite interface for dual-sourced incident management and monitoring system
US10887157B1 (en) 2019-07-31 2021-01-05 Splunk Inc. Dual-sourced incident management and monitoring system
US11178025B1 (en) 2020-08-17 2021-11-16 International Business Machines Corporation Automated incident prioritization in network monitoring systems
US20220245647A1 (en) * 2021-02-02 2022-08-04 Nice Ltd. Systems and methods to triage contact center issues using an incident grievance score
US20220358162A1 (en) * 2021-05-04 2022-11-10 Jpmorgan Chase Bank, N.A. Method and system for automated feedback monitoring in real-time
US11824794B1 (en) 2022-05-20 2023-11-21 Kyndryl, Inc. Dynamic network management based on predicted usage

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105229626A (zh) * 2013-06-18 2016-01-06 惠普发展公司,有限责任合伙企业 利用过去偏好配对将事件通知按优先级排序
CN106384213A (zh) * 2016-12-10 2017-02-08 福建四创软件有限公司 基于神经网络算法的智能防汛值班管理方法
CN106682746A (zh) * 2016-12-25 2017-05-17 杭州博烁晟斐智能科技有限公司 一种通信铁塔维护作业单的生成方法及系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1410281A2 (en) 2000-07-10 2004-04-21 BMC Software, Inc. System and method of enterprise systems and business impact management
FR2840139B1 (fr) * 2002-05-23 2004-12-17 Cit Alcatel Dispositif et procede de classification de messages d'alarme resultant d'une violation d'accord de niveau de service dans un reseau de communications
EP1652138A4 (en) 2003-07-11 2006-12-06 Computer Ass Think Inc MODELING APPLICATIONS AND COMPANY PROCESS SERVICES THROUGH AN AUTO DISCOVERY ANALYSIS
US8285578B2 (en) 2004-01-21 2012-10-09 Hewlett-Packard Development Company, L.P. Managing information technology (IT) infrastructure of an enterprise using a centralized logistics and management (CLAM) tool
US20090138340A1 (en) * 2007-11-28 2009-05-28 Borr Christopher A Method, apparatus and computer program code for evaluating performance based on projected return and estimated cost
US8161326B2 (en) 2008-09-29 2012-04-17 Infosys Technologies Limited Method and system for managing information technology (IT) infrastructural elements
US9392022B2 (en) * 2013-05-03 2016-07-12 Vmware, Inc. Methods and apparatus to measure compliance of a virtual computing environment
US10447555B2 (en) * 2014-10-09 2019-10-15 Splunk Inc. Aggregate key performance indicator spanning multiple services
US10217067B2 (en) * 2015-03-11 2019-02-26 International Business Machines Corporation System, method and program product for scheduling interventions on allocated resources with minimized client impacts
US9729421B2 (en) * 2015-03-25 2017-08-08 International Business Machines Corporation Outcome-based software-defined infrastructure
US10135913B2 (en) 2015-06-17 2018-11-20 Tata Consultancy Services Limited Impact analysis system and method
US9806955B2 (en) * 2015-08-20 2017-10-31 Accenture Global Services Limited Network service incident prediction
US20170124501A1 (en) 2015-10-28 2017-05-04 Fractal Industries, Inc. System for automated capture and analysis of business information for security and client-facing infrastructure reliability
US10735268B2 (en) * 2017-04-21 2020-08-04 System73 Ltd. Predictive overlay network architecture
US20190073615A1 (en) * 2017-09-05 2019-03-07 PagerDuty, Inc. Operations health management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105229626A (zh) * 2013-06-18 2016-01-06 惠普发展公司,有限责任合伙企业 利用过去偏好配对将事件通知按优先级排序
CN106384213A (zh) * 2016-12-10 2017-02-08 福建四创软件有限公司 基于神经网络算法的智能防汛值班管理方法
CN106682746A (zh) * 2016-12-25 2017-05-17 杭州博烁晟斐智能科技有限公司 一种通信铁塔维护作业单的生成方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于社交网络群智感知信息的非常规突发事件描述方法研究;陈海燕;徐峥;;计算机科学(第05期);全文 *
海涛 等.计算机网路通信技术.重庆大学出版社,2015,全文. *

Also Published As

Publication number Publication date
US10892959B2 (en) 2021-01-12
CN110717075A (zh) 2020-01-21
US20200021503A1 (en) 2020-01-16

Similar Documents

Publication Publication Date Title
CN110717075B (zh) 信息技术基础设施事故的优先化
US11005969B2 (en) Problem solving in a message queuing system in a computer network
US10423457B2 (en) Outcome-based software-defined infrastructure
US9336059B2 (en) Forecasting capacity available for processing workloads in a networked computing environment
US11188984B2 (en) Automation and validation of insurance claims for infrastructure risks and failures in multi-processor computing environments
US20190138964A1 (en) Determining optimal device refresh cycles and device repairs through cognitive analysis of unstructured data and device health scores
US9456004B2 (en) Optimizing risk-based compliance of an information technology (IT) system
US10691516B2 (en) Measurement and visualization of resiliency in a hybrid IT infrastructure environment
US11190421B1 (en) Alerts reduction based on severity level using metric template matching and normalization rule
US10360129B2 (en) Setting software error severity ranking
Lawrence et al. Using service level agreements for optimising cloud infrastructure services
US11601347B2 (en) Identification of incident required resolution time
CN116802614A (zh) 监测大型云计算系统的健康状态
US11175825B1 (en) Configuration-based alert correlation in storage networks
US20220138614A1 (en) Explaining machine learning based time series models
CN114629675B (zh) 做出安全推荐的方法、系统和存储介质
US20220374315A1 (en) Computer backup generator using backup triggers
US11556425B2 (en) Failover management for batch jobs
US20220114508A1 (en) Enriching process models from unstructured data and identify inefficiencies in enriched process models
US11516094B2 (en) Service remediation plan generation
US20230297417A1 (en) Context relevant data migration and job rescheduling
US20220147827A1 (en) Predicting lagging marker values
CN118056187A (zh) 处理事务请求

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220218

Address after: USA New York

Applicant after: Qindarui Co.

Address before: USA New York

Applicant before: International Business Machines Corp.

GR01 Patent grant