CN112154415A

CN112154415A - 大型计算机系统中的高效事件管理

Info

Publication number: CN112154415A
Application number: CN201980034412.8A
Authority: CN
Inventors: N·贾因
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2018-05-25
Filing date: 2019-05-13
Publication date: 2020-12-29
Also published as: WO2019226364A1; US20190362197A1; EP3803580A1; EP3803580B1; US11003960B2

Abstract

本文描述了用于大规模计算机系统中的高效事件管理的计算系统。在一个实施例中，事件管理系统可以被配置为响应于接收到请求未标识的事件管理服务的用户输入，将用户输入的字母数字串转换为具有多个像素的像素化矩阵，所述多个像素单独地对应于字母数字串中的字符或数字。事件管理系统然后可以将所转换的像素化矩阵馈入神经网络，以标识与具有对应概率值的所接收的用户输入相对应的一个或多个事件管理服务。事件管理系统然后可以执行应用编程接口(API)调用以执行计算机应用，以向用户提供所标识的事件管理服务之一。

Description

大型计算机系统中的高效事件管理

背景技术

大型计算机系统，诸如数据中心或其他合适的分布式计算系统，可以具有数百万甚至数千万个单独的组件。例如，在数据中心中，大量路由器、交换机、桥接器、负载平衡器或其他网络设备可以互连服务器、网络存储设备和其他计算设备。单独服务器可以托管一个或多个虚拟机、虚拟交换机、或被配置为向用户提供计算、通信、存储或其他合适类型的计算服务的其他类型的虚拟化功能。

数据中心中的许多硬件和软件组件可以经历各种类型的“事件(incident)”，诸如硬件/软件故障、资源过度使用、配置错误、通信丢失等。数据中心中的传感器或监视器可以监视和报告此类事件。此外，此类事件还可能导致服务中断，其可以触发服务的用户启动警报或服务报告。事件管理系统通常用于接收和处理所有事件报告。例如，事件管理系统可以接收事件报告并将事件报告转发给合适的技术人员或工程师，并跟踪每个事件的诊断、缓解和解决进度。

发明内容

提供本发明内容以简化形式介绍一些概念，这些概念将在下面的具体实施方式中进一步描述。本发明内容既不旨在标识所要求保护的主题的关键特征或必要特征，也不旨在用于限制所要求保护的主题的范围。

在某些实现中，事件管理(IcM)系统可以被配置为管理大型计算机系统(诸如数据中心)中的事件的端到端工作流。例如，一旦接收到事件报告，事件管理系统就可以为所报告的事件创建票证或其他合适类型的标识符。事件管理系统还可以跟踪向技术人员或工程师报告的事件的通知、事件诊断、为解决事件而采取的缓解措施、与客户的后续沟通或其他合适的相关任务。

为了最小化服务停机时间，事件管理系统可以提供广泛的计算机应用和IcM服务，以用于处理(address)所报告事件的各个方面。此类IcM服务的示例可以包括事件分类、针对待命的技术人员或工程师的目录服务、事件通知链、事件的报告和日志记录、以及事件解决管理。此类IcM服务可以允许快速通知、缓解或解决所报告的事件，以使检测时间、参与时间、缓解时间或其他合适类型的事件管理指标最小化，从而改善大型计算机系统中的各种功能性的用户体验。

提供如此广泛的计算机应用和IcM服务的一个挑战是为大量的技术人员、工程师或其他用户提供一种基于在事件管理系统中的各种功能性来发现、搜索、调用、报告和协作的高效机制。针对此挑战的一种解决方案是构建交互式问答(Q&A)服务，该构建交互式问答(Q&A)服务可以提供适当的IcM服务的标识，以用于处理特定事件的某些方面。然而，由于需要大量的努力来覆盖大量不同的场景以及理解自由形式或其他合适类型的用户输入的复杂性，因此构建这样的Q&A服务可能既困难又耗时。

所公开技术的多个实施例涉及事件管理助理(IcM助理)，其被配置为将用户输入与对应的IcM服务或其他合适类型的IcM资源智能地匹配。例如，IcM助理可以被配置为接收用户输入(例如文本)并提供一个或多个应用编程接口(API)调用、内部或外部网站或网页链接、常见问题(FAQ)链接或其他合适的IcM功能性类型。在一些实现中，IcM助理可以为技术人员或工程师提供功能性以查看信息(例如查看事件报告的细节)并对所报告的事件执行动作，诸如搜索和执行对先前检测到的类似事件的查询等。在其他实现中，IcM助理可以被配置为允许用户执行其他合适的动作或参与对话(例如提出澄清问题、收集有关事件和用户的背景信息)。

一方面，IcM助理可以被配置为通过使用经训练的卷积神经网络将用户输入与例如API调用进行匹配。例如，IcM可以首先将用户输入从文本串转换为像素化矩阵或图像，该像素化矩阵或图像中的每个像素对应一个字母(例如“a”至“z”和“A”至“Z”)和一个数字(例如“0”，“1”，…，“9”)。例如，“Ack IcM 123”的用户输入将对应于矩阵，对于与“A”，“c”，“k”，“I”，“c”，“M”，“1”，“2”，“3”相对应的该矩阵的像素或单元，该矩阵的像素或单元的值为1，而其他像素或单元的值均为零。在另一实施例中，例如“位”的三元字符也可以以与各个字符相似的方式进行编码。然后，在训练阶段期间，IcM助理可以使用像素化矩阵上的一个或多个过滤器或内核在神经网络中执行一个或多个卷积。示例过滤器可以包括2X2、3X3、4X4、5X5或具有对应元素值的其他合适大小的矩阵。不同的过滤器的使用可以由管理员或其他合适的实体调谐以用于训练。模型的训练可以周期性地完成，例如每周或按需。

通过将单独的过滤器应用于像素化矩阵，IcM助理可以被配置为得出新矩阵，其中当对于每个位置，过滤器被移动一个像素(或多个像素，称为“步幅”)时，每行表示所应用的过滤器，并且列是所应用的过滤器和底层像素化矩阵的点积。然后，IcM助理可以被配置为在对新矩阵应用池化(例如最大池化、平均池化等)以生成神经网络的池化层之前，应用激活函数(例如Sigmoid、tanh或整流线性单位(ReLU))。然后，可以使用附加的过滤器在所获得的池化层上重复执行上述卷积和池化操作，以在用户输入中对更高级别的模式进行编码。

然后，IcM助理可以被配置为从输出层生成输出，该输出层通常是具有信号丢失(dropout)的完全连接的网络。例如，最后一个池化层的所有输出可以经由例如ReLU的线性变换被连接到输出层中的所有节点。输出层可以产生向量，该向量的长度等于多个目标类别(例如IcM服务、API、知识库项、特征区域、工程师)和表示对应类别概率的各个元素。例如，对于“确认事件报告”类别，输出层可以生成90％的概率。在另一示例中，输出层可以为“改变待命时间表”的类别生成85％的概率。然后，IcM助理可以被配置为执行一个或多个计算机应用/例程/模块，以提供具有最高可能值或由用户选择的IcM服务。

在某些实现中，卷积神经网络可以使用先前的事件管理数据来训练。例如，包含所接收的用户输入和对应的API调用的数据集合可以用于训练神经网络。用户输入可以利用针对该用户输入的权重集合而被馈入神经网络，该权重集合用以生成对应类别的一个或多个概率。然后，这些概率可以与实际的API调用进行比较，并且其误差(基本事实)可以被生成。然后，所生成的误差可以被反向传播到神经网络中，以用于调整神经网络中的一个或多个权重或其他合适的参数。然后，前述操作可以被重复，直到例如表示预测值与实际值之间的所生成的误差的损失函数小于阈值或其他合适的标准为止。然后，经训练的神经网络可以用于预测针对新用户输入的预期API调用，如上所述。

所公开技术的若干实施例可以允许大量用户高效地定位合适的计算机应用或IcM服务，以用于在事件管理系统中执行各种动作。与手动建立Q&A不同，所公开技术的多个实施例可以将用户输入从文本转换为像素化矩阵，然后像素化矩阵可以被馈入经训练的神经网络中，以生成用户预期功能的概率。所公开技术的实施例还可以通过提出后续问题来进一步阐明用户的意图。例如，当两个类别的预测概率相同或相似时，两者都可以被呈现给用户以供选择。在另一示例中，可以向用户提出一系列澄清问题，以提高概率值。在其他示例中，某些类别可以根据用户输入从结果中被排除。这样，用户可以被提供计算机服务或资源的列表，然后用户可以利用这些计算机服务或资源的列表来高效处理处理已报告事件的各个方面。结果，当与其他实现相比时，可以减少大规模计算机系统中的检测时间、参与时间、缓解时间或其他合适类型的事件管理指标。

附图说明

图1是示出了根据所公开技术的实施例的实现高效事件管理的计算框架的示意图。

图2A-图2D是示出了根据所公开的技术的实施例的图1的计算框架的某些硬件/软件组件的局部示意图。

图3-图5是示出了根据所公开技术的实施例的高效事件管理的某些过程的流程图。

图6是适合于图1中的计算框架的某些组件的计算设备。

具体实施方式

下面描述用于高效事件管理的系统、设备、组件、模块、例程、数据结构和过程的某些实施例。在以下描述中，组件的具体细节被包括以提供对所公开技术的某些实施例的透彻理解。相关领域的技术人员还将理解，本文的技术可以具有其他实施例。本文的技术也可以在没有下面参考图1-图6描述的实施例的多个细节的情况下被实践。

如本文所使用的，术语“计算集群”通常是指具有多个网络设备的计算系统，该多个网络设备将多个服务器或节点彼此互连或与外部网络(例如因特网)互连。计算集群的一个示例是一个或多个机架，每个机架在被配置为提供云服务的云计算数据中心(或其部分)中容纳多个服务器。一个或多个计算集群可以被互连以形成“计算结构”，该“计算结构”构成分布式计算系统的至少一部分。术语“网络设备”通常是指网络通信组件。示例网络设备包括路由器、交换机、集线器、桥接器、负载平衡器、安全网关或防火墙。“节点”通常是指被配置为实现一个或多个虚拟机、虚拟路由器、虚拟网关或其他合适的虚拟化计算组件的计算设备。在一个示例中，节点可以包括计算服务器，计算服务器具有被配置为支持一个或多个虚拟机的管理程序。

在此进一步使用的术语“云服务”通常是指通过诸如因特网的计算机网络提供的一个或多个计算资源。云服务的常见示例包括软件即服务(“SaaS”)、平台即服务(“PaaS”)和基础设施即服务(“IaaS”)。SaaS是一种软件分发技术，其中软件应用由云服务提供方托管在例如数据中心中，并由用户通过计算机网络访问。PaaS通常是指通过计算机网络交付操作系统和相关联的服务，而无需下载或安装。IaaS通常是指用于支持存储装置、硬件、服务器、网络设备或其他组件的外包设备，所有这些设备都能通过计算机网络进行访问。

如本文所使用的，术语“事件管理服务”或“IcM服务”通常是指为处理计算机系统、结构或集群中的事件的一个或多个方面而提供的计算服务或资源。示例事件管理服务可以包括用于查看事件信息(例如查看事件报告的详细信息)和对所报告的事件执行动作的计算服务，诸如搜索和执行对先前检测到的类似事件的查询等。事件管理服务可以由诸如以下各项提供：应用编程接口(API)调用、内部或外部网站或网页链接、常见问题(FAQ)链接、其他合适类型的IcM功能性、或可能能够帮助解决问题的工程师或技术人员的标识和/或联系方式。

如本文中所使用的，短语“神经网络”或“人工神经网络”通常是指被配置为通过学习示例来“学习”或逐步提高任务性能的计算系统，通常无需任务特定的编程。例如，在图像识别中，神经网络可以通过分析已被手动标记为“猫”或“无猫”的示例图像并使用结果标识新图像中的猫，从而学习标识包含猫的图像。

在某些实现中，神经网络可以包括通常称为“神经元”或“人工神经元”的多层对象。每个神经元可以被配置为基于经由对应连接的一个或多个输入来执行诸如非线性激活功能的功能。人工神经元和连接的权重通常会随着学习的进行而进行调整。权重增加或减少连接处的输入的强度。通常，人工神经元是分层组织的。不同的层可以对相应的输入执行不同种类的变换。信号通常可能在遍历一个或多个中间层之后从输入层行进到输出层。

在本文中还使用的“卷积”通常是指将图像的每个元素添加到其局部邻居的过程，该过程由过滤器或内核加权。例如，3X3内核和3X3图像的卷积是转置第一矩阵、然后乘以对应条目并求和的过程。输出图像的坐标[2,2]处的元素将是图像矩阵的所有条目的加权组合，其中权重由内核指定。通过将每个内核值乘以对应的输入图像像素值来计算输出图像中给定像素的值。

在本文中进一步使用的“池化(pooling)”通常是指非线性下采样的形式。存在多种实现池化的非线性函数，诸如最大池化。在最大池化中，输入图像被划分为不重叠的矩形集合，并且对于每个此类子区域，在子区域中输出最大值以创建池化层。池化层用于逐渐减小表示的空间大小，以减少神经网络中的参数数量和计算量。

在大型计算机系统中，可能经常会发生各种类型的事件。为了最小化服务停机时间，事件管理系统可以提供广泛的计算机应用和服务，以用于处理所报告事件的各个方面。此类服务的示例可以包括事件分类、针对待命的技术人员或工程师提供的目录服务、事件的通知链、事件的报告和日志记录、以及事件解决的管理。这样的服务可以允许事件的快速缓解和/或解决，以最小化检测时间、参与时间、缓解时间或其他合适类型的事件管理指标。

提供如此广泛的计算机应用和服务的一个挑战是提供一种自动高效的机制，用于使大量用户可以基于事件管理系统中的各种功能性来发现、搜索、调用、报告和协作。针对此挑战的一种解决方案可以包括构建交互式问答(Q&A)服务，该服务提供用于处理事件的某些方面的合适服务的标识。然而，由于需要大量的手动工作来覆盖各种场景和理解自由形式或其他合适类型的用户输入的复杂性，因此构建这样的Q&A服务可能很困难。

所公开技术的多个实施例可以提供事件管理助理(IcM助理)，该事件管理助理被配置为将用户输入与对应的服务或其他合适类型的事件管理资源进行匹配。例如，IcM助理可以被配置为接收用户输入并提供一个或多个应用编程接口(API)调用、内部或外部网站或网页链接、常见问题(FAQ)链接、或其他合适的可用功能性。在一些实现中，IcM助理可以为用户提供功能性，以查看信息(例如查看事件报告的详细信息)并对所报告的事件执行动作，诸如搜索和执行对先前检测到的类似事件的查询等。在其他实现中，IcM助理可以被配置为允许用户执行其他合适的动作。

在一种实现中，IcM助理可以被配置为通过利用经训练的神经网络，在可选的预处理(例如移除某些字符)后，将用户输入与API调用进行匹配。例如，IcM首先可以将包含文本的用户输入转换为像素化矩阵或图像，该像素化矩阵或图像中的每个像素对应一个字母(例如“a”至“z”、“A”至“Z”)或一个数字(例如“0”、“1”、…、“9”)。例如，“Ack IcM 123”的用户输入将对应于矩阵，对于与“A”、“c”、“k”、“I”、“c”、“M”、“1”、“2”、“3”相对应的像素，该像素的值为1，而其他像素的值均为零。在其他示例中，标点符号和其他符号，例如主题标签(hashtag)，也可以用于编码。然后，IcM助理可以使用像素化矩阵上的一个或多个过滤器或内核在经训练的神经网络中执行一个或多个卷积，以得出具有与用户输入匹配的对应概率的API调用的列表。

与手动建立Q&A不同，所公开技术的多个实施例因此可以使用机器学习将用户输入与预期的事件管理资源进行匹配。这样，可以向用户提供计算机服务或资源的列表，然后用户可以利用这些计算机服务或资源的列表来高效处理处理已报告事件的各个方面。结果，可以减少大规模计算机系统中的检测时间、参与时间、缓解时间或其他合适类型的事件管理指标，如下面参考图1-图6更详细地描述的。

图1是根据所公开技术的实施例的被配置用于高效事件管理的计算框架100的示意图。如图1所示，计算框架100可以包括计算机网络108，该计算机网络108经由客户端设备102、计算结构104和事件管理系统110将多个用户101互连。尽管在图1中示出了计算框架100的特定组件，在其他实施例中，计算框架100还可以包括附加的和/或不同的组成部分。例如，计算框架100可以包括附加的计算结构、网络存储设备、实用程序基础设施和/或其他合适的组件。

客户端设备102可以各自包括计算设备，该计算设备支持对应的用户101经由计算机网络108访问由计算架构104提供的云服务。例如，在所示的实施例中，客户端设备102单独地包括台式计算机。在其他实施例中，客户端设备102还可以包括膝上型计算机、平板计算机、智能电话或其他合适的计算设备。即使出于说明目的在图1中示出了两个用户101和对应的客户端设备102，但是在其他实施例中，计算框架100可以支持任何合适数量的用户101访问由计算结构104提供的计算服务。

如图1所示，计算机网络108可以包括将用户101和计算结构104的组件互连的一个或多个网络设备112。网络设备112的示例可以包括路由器、交换机、防火墙、负载平衡器、或其他合适的网络组件。即使出于说明目的在图1中示出了特定的连接方案，但是在其他实施例中，网络设备112可以按分层、平坦、“网状”或其他合适的拓扑结构被操作地耦合。在一个实施例中，计算机网络108包括因特网。在其他实施例中，计算机网络108还可以包括局域网、广域网、虚拟专用网或其他合适类型的计算机网络。

在某些实施例中，节点106可以单独地包括处理器、物理服务器或包含多个物理服务器的刀片服务器。在其他实施例中，节点106还可以包括一个或多个虚拟服务器。节点106可以被组织成机架、可用区、组、集合、计算集群或其他合适的分区。例如，在所示的实施例中，节点106被分组为三个计算集群105(分别单独地被示为第一、第二和第三计算集群105a-105c)，其被操作地耦合到计算机网络108中的对应网络设备112。尽管出于说明的目的在图1中示出了三个计算集群105，但是在其他实施例中，计算结构104可以包括具有相似或不同组件和/或配置的一个、两个、八个、十六个或任何其他合适数量的计算集群105。

事件管理系统110可以被配置为管理计算结构104中的事件的端到端工作流。例如，在经由门户网站107从用户101、或从节点106接收到事件报告109后，事件管理系统110可以为所报告的事件创建票证或其他合适类型的标识符。然后，事件管理系统110可以跟踪所报告的事件向工程师103的通知(例如经由另一事件报告109')、事件的诊断、为解决事件而采取的缓解措施、以及与客户的后续沟通。

事件管理系统110可以包括事件助理(如图2A所示的IcM助理120)，该事件助理被配置为通过以下方式来将用户输入与对应的IcM服务(例如API调用)或其他合适类型的事件管理资源进行智能匹配：首先将用户输入转换为矩阵表示(例如转换为像素化的矩阵或图像)，然后使用经训练的神经网络来对像素化的矩阵执行预测。使用这种技术，可以避免劳动密集的手动问答，如下面参考图2A-图2D更详细地描述的。

图2A-图2D是示出根据所公开的技术的实施例的图1的计算框架100的某些硬件/软件组件的局部示意图。如图2A所示，事件管理系统110可以包括IcM助理120，IcM助理120被配置为将用户输入与对应的IcM服务(例如API调用)或其他合适类型的事件管理资源进行智能匹配。在所示的实施例中，IcM助理120可以是在事件管理系统110中执行的软件组件。在其他实施例中，IcM助理120可以是独立的应用，或具有其他合适的配置。

如图2A所示，IcM助理120可以包括操作地彼此耦合的接口组件121、预处理器122，预测组件124和执行组件126。即使在图2A中仅示出了针对IcM助理120的前述组件，在其他实施例中，IcM助理120可以包括附加的和/或不同的组件。

接口组件121可以被配置为从诸如工程师103的用户接收用户输入115，用于在事件管理系统110中定位IcM资源。用户输入115可以包含自由形式的文本或其他合适类型的字母数字串。接口组件121然后可以将所接收的用户输入115转发到预处理器122以进行进一步处理。

预处理器122可以被配置为基于某些预设规则对所接收的用户输入115执行各种编辑任务。例如，在一个实施例中，预处理器122可以被配置为对用户输入115执行词干提取(stemming)，以将词语缩减为对应的词干(stem)、词基(base)或词根(root)形式。在另一示例中，预处理器122还可以被配置为删除驼峰式大小写，根据该驼峰式大小写，复合短语中间的每个词语或缩写均以大写字母开头。在其他示例中，预处理器122还可以被配置为：移除标点符号、特殊字符、停用词、小写字母、标点符号、提取诸如主题标签的特殊标签、解析base64编码的图像、与命令分开的日志；找到有关用户或正在进行的事件的更多信息；或执行其他合适的编辑任务。

一旦预处理完成，预处理器122就可以将预处理的用户输入115转发到预测组件124，以用于标识事件管理系统100中的一个或多个IcM资源(例如API调用)。如图2A所示，根据所公开技术的实施例，预测组件124可以首先将预处理的用户输入115从测试串转换为像素化矩阵或图像130，其中每个像素对应字母(例如“a”至“z”和“A”至“Z”)和数字(例如“0”、“1”、…、“9”)以及字符或数字在用户输入115中的位置。例如，如图2A所示，示例用户输入115可以包括文本串“ack icm 1”。对应地，预测组件124可以被配置为向像素化矩阵130中的对应像素分配值(例如1)。因此，在像素化矩阵130的位置[1,1]处，像素具有值1，如暗的正方形所示，对应于示例用户输入115中的“a”。在位置[3,2]处，像素的值1对应于示例用户输入115中的“c”，依此类推。在其他示例中，像素化矩阵130的每个像素可以被分配与字母或数字相对应的其他合适值。

预测组件124然后可以被配置为将像素化矩阵130馈送到卷积神经网络中，以用于标识具有对应概率值的一个或多个IcM资源。预测组件124可以从网络存储库112中取回神经网络的一个或多个权重或其他合适的参数(标识为“网络数据113”)。在某些实现中，可以使用先前的事件管理数据来训练卷积神经网络。例如，包含所接收的先前用户输入115和对应的API调用的数据集合可以用于训练神经网络。先前的用户输入115可以利用初始权重集合而被馈入神经网络，以生成对应于用户输入115的类别的一个或多个概率。然后，该概率可以与实际的API调用进行比较，并且可以生成其误差。然后，所生成的误差可以被反向传播到神经网络中，以用于调整神经网络中的一个或多个权重或其他合适的参数。然后可以重复前述操作，直到例如所生成的误差小于阈值或其他合适的标准为止。然后，神经网络的权重或其他合适的参数可以作为网络数据113被存储在网络存储库112中。在其他实现中，可以用表示所接收的用户输入115和对应的IcM资源的附加数据对神经网络进行连续或周期性的重新训练。

使用所取回的网络数据113，预测组件124可以被配置为使用一个或多个过滤器132对像素化矩阵130执行一个或多个卷积。示例过滤器可以包括2X2、3X3、4X4、5X5，或具有对应元素值的其他合适大小的矩阵。管理员或其他合适的实体可以调谐不同过滤器的使用。在示出的示例中，过滤器132包括3X3矩阵，该3X3矩阵可以具有用于检测像素化矩阵130中的各种特征的合适的元素值。例如，过滤器132可以包括对角线具有1的矩阵以用于检测倾斜的边(slanted edge)。在另一示例中，过滤器132还可以包括在过滤器132的中心垂直或水平具有1的矩阵，用于分别检测垂直边或水平边。

如图2B所示，通过将过滤器132应用于像素化矩阵130，预测组件124可以被配置为得出新矩阵134，其中每一行表示所应用的过滤器，列是当过滤器132针对每个位置移动一个像素(或多个像素)时所应用的过滤器132和下面的像素化矩阵130的点积。然后，预测组件124可以被配置为在将池化(例如最大池化、平均池化等)应用于新矩阵以生成神经网络的池化层136之前，应用非线性激活函数(例如Sigmoid、tanh或整流线性单位(ReLU))。然后，可以利用附加的过滤器(未示出)在获得的池化层136上重复上述卷积和池化操作，以对用户输入115中的递增高级模式进行编码。在某些实现中，神经网络可以包括3-7个池化层。在其他实现中，神经网络可以包括任何其他合适数量的池化层。

如图2D所示，预测组件124被配置为从输出层138生成输出，该输出层138通常是具有信号丢失(dropout)的完全连接的网络，根据该网络，仅考虑节点之间的某些连接。例如，最后池化层136的所有输出(未示出)可以经由例如ReLU的线性变换被连接到输出层138中的所有节点。输出层138可以产生向量，该向量的长度表示分类的多个目标类别，并且单独元素可以表示对应类别的概率。例如，在所示的实施例中，输出层138可以针对与第一API调用117相对应的类别“确认事件报告”生成90％的概率，并且针对与第二API调用117'相对应的“改变待命时间表”类别生成5％概率。

基于所生成的概率值，预测组件124可以被配置为向工程师103输出API调用117的排名列表。在某些实施例中，预测组件124还可以被配置为确定针对所输出的API调用117的所有参数(argument)是否从用户输入115中被提取。响应于确定缺少一个或多个参数，预测组件124可以被配置为请求来自工程师103的附加用户输入。响应于确定所有需要的参数均存在，预测组件124可以被配置为将控制转移到执行组件126以进行进一步处理。

在某些实施例中，执行组件126可以被配置为从工程师103接收输出的API调用117中的一个API调用的用户选择。作为响应，执行组件126可以利用所标识的参数来执行所选择的API调用117，以向工程师103提供合适的IcM资源。在其他实施例中，执行组件126可以被配置为经由API调用117中的一个API调用来自动执行计算机应用或例程，而当对应的概率值超过阈值(例如90％)或具有最高值时，无需来自工程师103的进一步输入。在其他实施例中，执行组件126还可以被配置为基于所确定的概率值和/或用户选择，向工程师103提供内部或外部网站或网页、常见问题(FAQ)页面或其他合适类型的IcM功能性。

因此，所公开技术的多个实施例可以允许大量的技术人员、工程师或其他用户高效地定位合适的计算机应用或IcM服务，以用于在事件管理系统中执行各种动作。与手动建立Q&A不同，所公开技术的多个实施例可以将用户输入115从文本转换为像素化矩阵130，其然后可以被馈入经训练的神经网络中，以生成用户预期功能的概率。这样，可以向用户提供IcM服务或资源的列表，然后用户可以利用该列表来高效处理处理已报告事件的各个方面。结果，当与其他实现相比时，可以减少大规模计算机系统中的检测时间、参与时间、缓解时间或其他合适类型的事件管理指标。

图3-图5是图示了根据所公开技术的实施例的高效事件管理的某些过程的流程图。即使下面参考图1中的计算框架100和图2A-图2D中的IcM助理120描述了这些过程，在其他实施例中，这些过程也可以在具有附加和/或不同组件的其他计算框架中被实现。

如图3所示，高效的事件管理的过程200可以包括在阶段202接收用户输入。在一个实施例中，用户输入可以包括自由形式的文本输入。在其他实施例中，用户输入可以包括其他合适类型的字母数字输入。然后，过程200可以包括在阶段204处对所接收的用户输入进行预处理。如以上参考图2A所描述的，在某些实施例中，可以对所接收的用户输入执行各种编辑操作，诸如词干提取和移除标点符号。在其他实施例中，可以省略对所接收的用户输入的预处理。

然后，过程200可以包括在阶段206将预处理的用户输入转换为像素化矩阵。如以上参考图2A更加详细地描述的，用户输入可以被转换为像素化矩阵，其中每一行对应字母(例如“a”至“z”)或数字(例如“0”至“9”)以及包含与用户输入中的字母或数字相对应的值的列。这样，在一种实现中，用户输入可以被转换为36行的像素化矩阵(例如字母为26行，数字为10行)以及与用户输入的长度相对应的适当数量的列。在其他实现中，用户输入可以被转换成其他合适大小的像素化矩阵。下面参考图4更详细地描述将用户输入转换为像素化矩阵的示例操作。

过程200然后可以包括在阶段208执行与用户输入相对应的合适的IcM资源的预测。在某些实现中，如以上参考图2A至图2D更详细地描述的，执行预测可以包括将像素化矩阵馈入卷积神经网络，该卷积神经网络利用表示先前用户输入和对应IcM资源的数据进行训练。然后，过程200可以包括在阶段210基于所执行的预测来向用户提供合适的IcM服务。下面参考图5更详细地描述向用户提供IcM服务的示例操作。如图3所示，在某些实施例中，过程200可以返回到在阶段202处接收附加的用户输入，以便阐明或缩小所提供的IcM服务的数量。

图4图示了将用户输入转换为像素化矩阵的示例操作。如图4所示，该操作可以包括在阶段212标识用户输入中的字符或数字。例如，所标识的字符可以是从“a”到“z”的字母，而数字可以从“0”到“9”。然后，该操作可以包括在阶段214向与像素化矩阵中的所标识的字符或数字相对应的像素分配值(例如1)。然后，该操作可以包括判定阶段216以确定在用户输入中是否存在附加字符或数字。响应于确定在用户输入中存在附加字符或数字，操作在阶段212处恢复为标识下一个字符或数字。否则，该操作包括在阶段218输出具有分配的值的像素化矩阵。

图5图示了用于向用户提供IcM服务的示例操作。如图5所示，该操作可以包括：接收对基于对应的预测概率值进行排序的IcM资源(例如API调用)的输出列表的用户选择。然后，操作可以包括决策阶段224，以确定所选择的IcM资源(例如API调用)是否具有丢失的参数。响应于确定所选择的IcM资源不包括任何丢失的参数，操作例如通过在阶段228处执行API调用来继续提供所选择的IcM服务。响应于确定所选择的IcM资源包括丢失的参数，操作在阶段226向用户提示缺少的参数的输入，然后在阶段228处继续提供所选择的IcM服务。

图6是适合于图1中的计算框架100的某些组件的计算设备300。例如，计算设备300可以适合于图1的客户端设备102或节点106。在非常基本的配置302中，计算设备300可以包括一个或多个处理器304和系统存储器306。存储器总线308可以用于在处理器304和系统存储器306之间进行通信。

取决于期望的配置，处理器304可以是任何类型，包括但不限于微处理器(μP)、微控制器(μC)、数字信号处理器(DSP)或其任何组合。处理器304可以包括一级以上的缓存，诸如一级缓存310和二级缓存312、处理器核心314和寄存器316。示例处理器核心314可以包括算术逻辑单元(ALU)、浮点单元(FPU)、数字信号处理核心(DSP核心)或其任何组合。示例存储器控制器318也可以与处理器304一起使用，或者在一些实现中，存储器控制器318可以是处理器304的内部部分。

取决于期望的配置，系统存储器306可以是任何类型，包括但不限于易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或其任何组合。系统存储器306可以包括操作系统320、一个或多个应用322和程序数据324。在图10中通过内部虚线内的那些组件示出了所描述的基本配置302。

计算设备300可以具有附加的特征或功能性、以及附加的接口，以支持基本配置302与任何其他设备和接口之间的通信。例如，总线/接口控制器330可以用于支持基本配置302与一个或多个数据存储设备332之间经由存储接口总线334的通信。数据存储设备332可以是可移除存储设备336、不可移除存储设备338、或其组合。可移除存储设备和不可移除存储设备的示例包括诸如柔性盘驱动器和硬盘驱动器(HDD)的磁盘设备，诸如压缩光盘(CD)驱动器或数字多功能磁盘(DVD)驱动器的光盘驱动器、固态驱动器(SSD)和磁带驱动器等，仅举几个例子。示例计算机存储介质可以包括以任何用于信息的存储的方法或技术实现的易失性和非易失性介质、可移除和不可移除介质，信息诸如计算机可读指令、数据结构、程序模块或其他数据。术语“计算机可读存储介质”或“计算机可读存储设备”不包括传播的信号和通信介质。

系统存储器306、可移除存储设备336和不可移除存储设备338是计算机可读存储介质的示例。计算机可读存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能磁盘(DVD)或其他光学存储装置、盒式磁带、磁带、磁盘存储装置、或其他磁性存储设备、或者可以用于存储期望信息并且可以由计算设备300访问的任何其他介质。任何此类计算机可读存储介质可以是计算设备300的一部分。术语“计算机可读存储介质”不包括传播的信号和通信介质。

计算设备300还可以包括接口总线340，该接口总线340用于支持从各种接口设备(例如输出设备342、外围接口344和通信设备346)经由总线/接口控制器330到基本配置302的通信。输出设备342包括图形处理单元348和音频处理单元350，其可以被配置为经由一个或多个A/V端口352与诸如显示器或扬声器的各种外部设备进行通信。示例性外围接口344包括串行接口控制器354或并行接口控制器356，其可以被配置为经由一个或多个I/O端口358与诸如输入设备(例如键盘、鼠标、笔、语音输入设备、触摸输入设备等)或其他外围设备(例如打印机、扫描仪等)的外部设备进行通信。示例通信设备346包括网络控制器360，其可以被布置为经由一个或多个通信端口364通过网络通信链路与一个或多个其他计算设备362进行通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以由计算机可读指令、数据结构、程序模块、或诸如载波或其他传输机制的调制数据信号中的其他数据来体现，并且可以包括任何信息递送介质。“调制数据信号”可以是具有以将信息编码在信号中的方式来设置或改变的其一个或多个特性的信号。作为示例而非限制，通信介质可以包括诸如有线网络或直接有线连接的有线介质、以及诸如声学、射频(RF)、微波、红外(IR)和其他无线介质的无线介质。本文所使用的术语计算机可读介质可以包括存储介质和通信介质。

计算设备300可以被实现为小型便携式(或移动)电子设备的一部分，小型便携式(或移动)电子设备诸如手机、个人数据助理(PDA)、个人媒体播放器设备、无线web观看设备、个人耳机设备、专用设备、或包括上述任何功能中的任何功能的混合设备。计算设备300还可以被实现为包括膝上型计算机配置和非膝上型计算机配置两者的个人计算机。

出于说明的目的，以上已经描述了本文的技术的特定实施例。然而，可以在不脱离前述公开的情况下进行各种修改。另外，一个实施例的许多要素可以附加于或代替其他实施例的要素而与其他实施例组合。因此，除所附权利要求书外，本文的技术不受限制。

Claims

1.一种在具有多个服务器的计算机系统中的高效事件管理的方法，所述方法包括：

从用户接收用户输入，所述用户输入请求用于处理与所述计算机系统中的一个或多个服务器有关的事件的未标识的事件管理服务，所述用户输入包含字母数字串；

响应于接收到所述用户输入，

将所述用户输入的所述字母数字串转换为具有多个像素的像素化矩阵，所述多个像素单独地与所述字母数字串中的字符或数字相对应；

在神经网络中处理所转换的所述像素化矩阵，以标识所请求的所述事件管理服务，所述事件管理服务具有与所接收的所述用户输入相对应的最高概率值，所述神经网络基于先前用户输入和对应的事件管理服务的数据而被训练；以及

经由应用编程接口(API)调用在所述计算机系统中执行计算机应用，以向所述用户提供具有所述最高概率值的所标识的所述事件管理服务。

2.根据权利要求1所述的方法，还包括：

响应于接收到所述用户输入，经由词干提取来对所接收的所述用户输入进行预处理，以将所述用户输入中的词语减少为对应的词干、词基或词根形式，移除驼峰式大小写，或移除标点符号或特殊字符；并且

其中转换所述字母数字串包括将经预处理的所述用户输入的所述字母数字串转换为所述像素化矩阵。

3.根据权利要求1所述的方法，其中转换所述字母数字串包括：

标识所述用户输入的所述字母数字串中的字符或数字；以及

响应于标识所述字符或所述数字，将预设值分配给所述像素化矩阵中的像素，所述像素对应于所标识的所述字符、以及所标识的所述字符在所述字母数字串中的位置。

4.根据权利要求1所述的方法，其中转换所述字母数字串包括：

标识所述用户输入的所述字母数字串中的字符或数字；以及

响应于标识所述字符或所述数字，

向所述像素化矩阵中的像素分配预设值，所述像素对应于所标识的所述字符、以及所标识的所述字符在所述字母数字串中的位置；以及

重复所述标识和所述分配，以生成所述像素化矩阵，所述像素化矩阵具有预设数量的行和与所述字母数字串的长度相对应的多个列。

5.根据权利要求1所述的方法，其中转换所述字母数字串包括：

标识所述用户输入的所述字母数字串中的字符或数字；以及

响应于标识所述字符或所述数字，

重复所述标识和所述分配，以生成所述像素化矩阵，所述像素化矩阵具有三十六行和与所述字母数字串的长度相对应的多个列。

6.根据权利要求1所述的方法，其中处理所转换的所述像素化矩阵包括：

重复地将过滤器应用于所述像素化矩阵以生成新矩阵；

将非线性激活函数应用于所述新矩阵；以及

将池化应用于被应用了所述非线性激活函数的所述新矩阵，以生成池化层。

7.根据权利要求1所述的方法，其中处理所转换的所述像素化矩阵包括：

将过滤器应用于所述像素化矩阵以生成新矩阵；

将非线性激活函数应用于所述新矩阵，所述非线性激活函数包括以下中的一项：Sigmoid函数、tanh函数、或整流线性单位函数；以及

将最大池化或平均池化中的一项应用于被应用了所述非线性激活函数的所述新矩阵，以生成池化层。

8.根据权利要求1所述的方法，其中处理所转换的所述像素化矩阵包括：

将过滤器应用于所述像素化矩阵以生成新矩阵；

将非线性激活函数应用于所述新矩阵，所述非线性激活函数包括以下中的一项：Sigmoid函数、tanh函数、或整流线性单位函数；

将最大池化或平均池化中的一项应用于被应用了所述非线性激活函数的所述新矩阵，以生成池化层；以及

重复应用过滤器操作，应用非线性激活函数操作；以及将最大池化操作或平均池化操作中的一项应用于所生成的所述池化层，以生成另一池化层，以对所述用户输入中的递增高级模式进行编码。

9.根据权利要求1所述的方法，其中处理所转换的所述像素化矩阵包括：

将过滤器应用于所述像素化矩阵以生成新矩阵；

将最大池化或平均池化中的一项应用于被应用了所述非线性激活函数的所述新矩阵，以生成池化层；

重复应用过滤器操作，应用非线性激活函数操作；以及将最大池化操作或平均池化操作中的一项应用于所生成的所述池化层，以生成另一池化层，以对所述用户输入中的递增高级模式进行编码；以及

生成向量并且将所述向量输出给所述用户，所述向量的长度表示IcM服务的目标类别的数量，并且单独元素表示对应类别的概率值。

10.一种在具有多个服务器的计算机系统中的事件管理系统，所述事件管理系统包括：

处理器；以及

存储器，被操作地耦合到所述处理器，所述存储器包含指令，所述指令由所述处理器可执行以使所述事件管理系统执行根据权利要求1至9中的一项所述的过程。