CN104823406A - 识别报告以解决网络问题 - Google Patents

识别报告以解决网络问题 Download PDF

Info

Publication number
CN104823406A
CN104823406A CN201280077596.4A CN201280077596A CN104823406A CN 104823406 A CN104823406 A CN 104823406A CN 201280077596 A CN201280077596 A CN 201280077596A CN 104823406 A CN104823406 A CN 104823406A
Authority
CN
China
Prior art keywords
report
network
identified
message
counter value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280077596.4A
Other languages
English (en)
Inventor
N.哈辛
O.维斯
N.盖马赫
A.伊斯雷利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Antite Software Co., Ltd.
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN104823406A publication Critical patent/CN104823406A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

识别报告以解决网络问题包括:根据推荐强度在报告库中识别报告,所述报告被推荐解决与当前网络问题匹配的先前识别的网络问题;发送到所述已识别报告的链接;以及基于所述已识别的报告是否被用于解决所述当前问题而更新推荐强度。

Description

识别报告以解决网络问题
背景技术
网络管理系统帮助管理员检测和解决在数据中心和其它类型的网络中运行的各种应用所面对的问题。这样的系统监视网络的各个方面,诸如应用响应时间、资源利用率和其它问题。管理系统收集监视数据并且使用它来检测问题。
附图说明
附图图示了本文中描述的原理的各种示例并且是说明书的一部分。所图示的示例仅仅是示例并且不限制权利要求的范围。
图1是根据本文描述的原理的网络的示例的图。
图2是根据本文描述的原理的数据收集机构的示例的图。
图3是根据本文描述的原理的推荐系统的示例的图。
图4是根据本文描述的原理的查找表数据库的示例的图。
图5是根据本文描述的原理的数据矩阵的示例的图。
图6是根据本文描述的原理的查找表的示例的图。
图7是根据本文描述的原理的用于识别报告以解决网络问题的方法的示例的图。
图8是根据本文描述的原理的处理器的示例的图。
图9是根据本文描述的原理的用于识别报告以解决网络问题的过程的流程图的示例的图。
具体实施方式
网络问题经常涉及对网络产生多个下游效应的根本原因。在一些情况下,下游效应是严重的并且使整个网络或至少网络的部分陷入停顿。由于网络部件的相互依赖,在没有适当报告的情况下,管理员可能难以区分网络中问题的表象和实际的根本原因的表象。由于由问题的根本原因产生的各种潜在下游效应,没经验的管理员在对问题作出响应时开始可能变得困惑,并且花费宝贵的时间处理下游效应而不是解决问题的根本原因。
观察到问题的管理员通常识别报告以解决这种情况。通常,管理员搜索他希望将帮助他确定问题的根本原因的报告,因为解决该根本原因通常是解决所有问题的效应的最快速的方式。管理员可以搜索由系统生成的适当的报告以识别根本原因。然而,管理员需要知道哪个报告将对诊断问题最有帮助。即使在管理员知道他需要哪个报告的情况下,管理员仍然需要花费时间来定位该报告。这个时间本来能够被花费用于解决问题的根本原因。
因此,本文描述的原理包括用于识别报告以解决网络问题的方法。这种方法可以包括:根据推荐强度识别报告库中的报告,该报告被推荐用于解决与当前网络问题匹配的先前识别的网络问题;把链接发送给已识别的报告;以及基于已识别的报告是否被用于解决当前的问题而更新推荐强度。
在下面的描述中,出于解释的目的,阐述了多个特定细节以便提供对本发明的系统和方法的彻底理解。然而,将显而易见的是,对于本领域技术人员来说,本发明的设备、系统和方法可以在没有这些特定细节的情况下被实践。在说明书中提到的“示例”或类似的语言表示所描述的特定特征、结构或特性被包括在至少那个示例中,但是在其它示例中不一定被包括。
图1是根据本文描述的原理的网络(100)的示例。在该示例中,网络(100)包括彼此通信的网络部件(102、104、106)。例如,各个部件可以具有成为服务器、客户端、节点或网络的其他部件的能力。在一些示例中,网络部件(102、104、106)中的至少一个主控网站同时网络用户可以通过其他部件访问网站的内容。
与本文描述的原理兼容的网络类型的非穷举列表包括局域网、数据中心网络、电信网络、操作中心网络、企业网络、企业内部网、虚拟私人网络、数据存储网络、数据库网络、其他类型的网络或他们的组合。与本文描述的原理兼容的网络部件的非穷举列表包括膝上型计算机、桌面计算机、电子平板、服务器、外围装置、数据库、电话、处理器、其他网络部件、或他们的组合。
网络(100)与推荐系统(108)通信,推荐系统(108)被实施为通过识别合适的报告来协助管理员确定网络问题的根本原因从而协助网络管理员对网络的问题进行检验分类(triage)。基于当前网络问题和先前识别的问题之间状况的类似性以及报告的推荐强度来选择已识别的报告。例如,如果网络在特定的网络区域中经历慢数据传输,则推荐系统(108)寻求先前识别的网络问题,其中数据传输在相同的区域中是慢的。如果没有先前识别的问题包括这些状况,则推荐系统(108)将寻求尽可能与当前网络问题具有接近于相同表象的先前识别的问题。响应于识别与当前网络状况匹配或接近匹配的先前识别的问题,推荐系统(108)识别具有先前已识别的问题的推荐强度的报告。如果存在与先前识别的问题相关的多个报告,则推荐系统(108)识别哪个报告对于当前和/或先前识别的网络问题具有最高的推荐强度。
推荐强度基于包括在推荐策略内的各个因素。推荐策略可以使推荐强度整体或部分地基于哪个报告被网络管理员用来对网络中的当前问题进行检验分类。管理员使用报告以解决网络问题可以利用计数器值来追踪,该计数器值被添加到由管理员用来解决当前网络问题的每个报告。
管理员可以是维护网络的组织的雇员,网络管理者、技术人员、用户或受网络影响的另一个体、或他们的组合。推荐系统(108)可以使得关于网络的信息被搜集和分析以便确定是否存在问题。另外,推荐系统(108)可以使得已识别报告被识别和发送给管理员。在一些示例中,到报告的链接连同概括问题的消息一起被发送给管理员。
图2是根据本文描述的原理的网络的数据收集机构(200)的示例的图。在一些示例中,数据收集机构具有监视工具(202),监视工具(202)收集关于网络应用(204)的数据。监视工具(202)可以记录与网络延时、响应时间、应用失败、应用成功、其他状态信息或它们的组合有关的信息。在一些示例中,监视工具包括安装在客户应用服务器上的部件。在一些示例中,监视工具定位在外部网络中以便观察试图使用网络服务的外部人(诸如顾客)的经历。在一些示例中,监视工具中的至少一些在网络内部。
监视工具(202)把所记录的数据中的至少一些发送到存储信息的数据收集器(206)。在一些示例中,仅被选择的样本被发送给数据收集器(206),而在其他示例中,所有信息被发送。在一些示例中,信息被实时发送给数据收集器(206),而在其他示例中,信息被在周期性的基础上发送。数据收集器(206)可以向监视工具(202)请求信息,或者监视工具(202)可以在没有请求的情况下把信息发送给数据收集器(206)。
存储在数据收集器(206)中的信息中的至少一些被发送给查找表(208),查找表把适当的报告和消息与各种网络状况关联在一起。例如,查找表(208)可以指示:当从仅单个站点的所有试图的登陆事务失败时,该站点存在问题。对于这个特定问题,查找表(208)指示到特定报告和消息的链接应当被发送给网络管理员。例如,查找表(208)可以指示当从所有可能的登陆站点的登陆事务失败时该站点故障。在这些情况下,查找表(208)可以指示不同的报告和消息应当被发送给对当前网络问题进行检验分类的网络管理员。
图3是根据本文描述的原理的推荐系统(300)的示例的图。在这个示例中,推荐系统(300)包括查找表(302),该查找表(302)连接到消息库(304)和报告库(306)。消息库(304)包括多个消息,该多个消息与在查找表中识别的针对各个网络问题的消息关联。在一些示例中,每个消息利用单个语句或多个语句概括网络状况。在替代示例中,消息包括针对如何纠正该情况的推荐指令。
报告库(306)可以包括与每个网络情况关联的多个报告。在一些示例中,多个报告适合于单个问题。另外,特定报告可以被用于多个问题。在一些示例中,每个消息针对在消息中描述的特定类型的问题具有定制的报告。在其他示例中,单个报告适合于与多个消息一起发送。
推荐消息和已识别的报告在查找表(302)中针对每个类型的网络问题被识别。响应于认定在查找表(302)中识别的问题,推荐系统(300)将使得到对应报告的链接和消息被发送给网络管理员。
链接管理者(308)可以创建到已识别报告的链接并且把所述链接嵌入到消息中。链接可以被发送给消息创建器(310),消息创建器把来自消息库(304)的消息拷贝到消息字段中并且嵌入来自链接创建器(308)的链接。
响应于完成该消息,消息可以被发送给管理员登录页面(312)或者发送给可以由管理员访问的另一位置。在一些示例中,消息和链接被发送给管理员的电子邮箱、电话、电子平板、网站、另一位置、或它们的组合。在一些示例中,警告也被发送给处于与消息被发送的位置不同的位置的管理员。这样的警告可以通知管理员消息已被发送到其他位置并且请求管理员查看消息。在一些示例中,警告包含与来自消息库的消息相同或类似的措辞。
在一些示例中,登录页面可以具有受监视应用和紧靠每个应用的状态的列表。在到报告的消息和链接被发送给登录页面的各个示例中,状态可以指示存在消息。链接可以显示为紧靠状态以便使管理员容易访问该报告。
在图3的示例中,推荐系统(300)还包括用户行为分析器(314)。用户行为分析器(314)确定管理员如何对消息做出响应并且推荐报告应发送给他。例如,用户行为分析器(314)可以确定管理员是否已经查看已识别的报告。用户行为分析器(314)还可以确定管理员是否已经查看与当前问题有关的其他报告。响应于用户行为分析器(314)将他的发现发送给查找表(302),查找表(302)基于相关报告的更新的推荐强度改变已识别的报告。例如,如果查找表(302)响应于认定特定网络状况而指示报告A应当被发送给管理员,但是管理员从未查看过报告A,则查找表(302)可以用管理员响应于对该问题进行检验分类而实际使用的另一报告代替报告A。另外,如果用户行为分析器(314)认定管理员偶尔使用已识别的报告,但是管理员更频繁地使用其他报告,则推荐系统(300)可以使得查找表(302)中的信息改变为反映管理员通常使用什么样的一个或多个报告。
在一些示例中,用户行为分析器(314)不仅分析哪些报告被使用,而且分析管理员在处理该情况时提到该报告的频率或者管理员使用这些报告多长时间。在其他示例中,用户行为分析器(314)还确定用户查看的报告是否与网络的当前状况相关或者与已识别的报告共享类似的信息。用户行为分析器(314)还可以计算查看报告和解决问题之间的持续时间。在一些示例中,其他因素对确定哪个报告应当是已识别的报告有贡献。这些和其他因素可以在支配已识别的报告被如何选择的推荐策略中被顾及。用户行为分析器(314)可以包括获知程序,该获知程序考虑用于分析管理员对消息和已识别的报告的响应的这些和其他因素。
图4是根据本文描述的原理的查找表数据库(400)的示例的图。在这个示例中,数据收集器和应用监视程序(402)搜集和存储关于网络状况的数据。这个信息可以被发送给查找表数据库(400)。
至少两个类型的信息被提供给查找表数据库(400)。这里,性能数据(404)包括关于如下各项的信息:网络中位置、网络中的事务、网络中的服务器、网络的其他参数和它们的组合。性能数据(404)可以指示这些网络参数中的每个正在正确地运行,或者性能数据(404)可以指示这些参数中的至少一个具有临界状态。
可用性数据(406)包括关于位置、事务、服务器、网络的其他参数或它们的组合的附加信息。虽然性能数据(404)可以包括关于位置、事务、服务器、和其他参数正如何执行的信息,但是可用性数据可以指示网络的这些参数是否全部在运行。例如,可用性数据(406)可以通过网络部件是否完全在工作或失败来指示网络部件是否有效地可用于网络的其余部分。如果特定类型的事务发生,不过慢速地,那么可用性数据(406)指示该事务可用,但是性能数据可以指示特定事务由于其慢速的性能而具有临界状态。
另外,查找表数据库(400)可以从用户行为分析器(410)接收计数器数据(408)。在一些示例中,计数器数据(408)包括跟踪管理员使用了哪些报告来对在网络中先前已识别的问题进行检验分类。在一些示例中,这些实际上被使用的报告与推荐系统(图1,108)推荐的那些是相同的报告。在其他示例中,报告可以是管理员查看的附加报告或者管理员查看的代替已识别报告的报告。
在一些示例中,每个报告可以接收每次管理员响应于特定情况而查看报告时加一(+1)的计数器值。该计数器值可以是累加的;因此,每次报告响应于特定问题而被查看时,针对该报告的计数器值将增加。因此,针对该特定报告的推荐强度随着计数器值的增加而增加。因此,推荐强度响应于用户的行为被更新。在这样的示例中,每次出现特定情况时,推荐系统可以记住管理员一直使用哪些报告来解决问题并且可以发送到历史上使用的报告(作为已识别的报告)的链接。
计数器值可以被存储在查找表数据库(400)中。当计数器值得数量针对与特定情况相关联的特定报告而增加时,针对关联报告的推荐强度增加。几个报告可以与相同的情况关联。具有最高计数器值的报告可以具有最高推荐强度。然而,当针对特定情况的初始识别的报告被具有更高计数器值得新报告超越时,新报告获得针对该特定情况的更高推荐强度。例如,如果第一报告具有计数器值12,并且第二报告具有计数器值15,则第一报告具有更高的推荐强度。然而,如果管理员释放第二报告并且改为使用第一报告,则最终第一报告的计数器值将超越第二报告的计数器值,从而把更高的推荐强度给予第一报告。
查找表数据库(400)可以分解成几列(412、414、416)。每个列(412、414、416)可以被进一步分解成子列。例如,第一列(412)可以示意地表示受到问题影响的单个位置。第一列(412)的第一子列(418)可以示意地表示与该位置相关联的单个事务受到了影响。第二子列(420)可以示意地表示与该位置相关联的一些事务受到了影响,而第三子列(422)可以表示(422)可以示意地表示处理该位置的所有事务受到了该问题影响。第二列(414)可以示意地表示受问题影响的多个位置,而第三列(416)可以示意地表示所有位置受该问题影响。第二和第三列(420、422)中的每个也可以包括子列,该子列类似于关于第一列(412)描述的那些。
总之,各个问题可以被表征为由网络部件的可用性引起或者由缺少网络部件的性能引起。查找表数据库(400)也可以包括多个行(424、426、428、430)。第一行(424)示意地表示详述网络部件可用性的推荐可用性报告,第二行(426)示意地表示针对发送给管理员的消息的推荐可用性文本,第三行(428)示意地表示推荐性能报告,并且第四行(430)示意地表示针对发送给管理员的消息的推荐性能文本。
在图4的示例中,查找表数据库(400)可以被用于基于网络状况确定哪个消息和报告推荐给管理员。例如,如果所有事务在多个位置受问题的影响,那么查找表数据库(400)可以确定推荐针对消息的文本2给管理员并且在该消息中包括到报告2的链接。报告2和文本2可以被定位在第二列(414)的第三子列(436)和第一和第二行(424、426)的交叉(432、434)处,因为这些行描述由该问题引起的网络状况的特性。
查找表数据库(400)涉及报告库中的报告。报告库可以包含的报告的非穷举列表包括:层分解报告,其帮助来识别在其中存在问题的层;错误记录报告,其帮助找到应用可用性数据;位置随时间报告,其允许管理员查看在特定位置随时间发生的成功事务;其他报告;或它们的组合。
图5是根据本文描述的原理的数据矩阵(500)的示例的图。在这个示例中,列(502、504、506)示意地表示位置,而行(508、510、512)示意地表示事务类型。在图5的示例中,第一列(502)示意地表示纽约市的位置,第二列(504)示意地表示特拉维夫的位置以及第三列(506)示意地表示东京的位置。各个位置可以是其中客户或其他人寻求访问网络服务的城市或其他地理区域。而且,在图5的示例中,第一行(508)示意地表示登陆事务,第二行(510)示意地表示购买事务,并且第三行(512)示意地表示登出事务。在图示的示例中,每个事务类型在所有识别的位置失败。
这个数据矩阵(500)可以与查找表数据库中的信息比较。推荐系统可以把这个信息与查找表数据库中的信息相比较以便确定可能存在什么类型的问题。在这个示例中,查找表数据库可能指示这样的网络状况,该网络状况指示网站故障。因此,该系统可以创建指示网站故障的消息并且进一步在消息中嵌入到已识别报告的链接以便帮助管理员对问题进行检验分类。
图6是根据本文描述的原理的可用性报告的查找表(600)的示例。在这个示例中,列(602、604、606)示意地表示由问题引起的失败的数量,而行(608、610、612)示意地表示受问题影响的事务的数量。在图6的示例中,第一列(602)示意地表示受问题影响的单个位置,第二列(604)示意地表示受问题影响的多个位置,并且第三列(606)示意地表示受问题影响的所有位置。而且在图6的示例中,第一行(608)示意地表示由问题引起的单个失败,第二行(610)示意地表示由问题引起的多个失败,并且第三行(612)示意地表示由于问题所有事务都失败。
查找表(600)在列和行的交叉处包括几个已识别的报告(614、616、618),该已识别的报告表征网络状况。这里,当网络状况在一个位置包括仅一个失败时,查找表推荐错误报告(614)。而且,在这个示例中,当网络状况在多个位置包括多个失败时,查找表推荐关于时间的位置报告(616)。另外,在图6的示例中,当网络状况包括在所有位置处失败的所有事务时,推荐错误记录报告。
图7是根据本文描述的原理的用于识别用于解决问题的报告的方法(700)的示例的图。在这个示例中,方法(700)包括:根据推荐强度在报告库中识别(702)报告,该报告被推荐解决与当前网络问题匹配的先前识别的网络问题;发送(704)到已识别报告的链接;以及基于已识别的报告是否被用于解决当前问题而更新(706)推荐强度。推荐强度对应于已识别的报告和先前识别的网络问题。
如果当前问题和当前网络问题匹配或接近匹配,则已识别的报告与解决与当前问题匹配的网络问题相关。如果当前网络问题和先前网络问题相同或至少相似,则当前网络问题和先前网络问题可以被认为匹配。推荐系统可以具有相似性阈值,该阈值考虑各种因素,诸如问题表象的类型、问题表象的严重性、受影响的网络部件、其他因素或其组合。
在一些示例中,与查找表比较的信息是最近收集的关于网络状况的状态信息。例如,用于确定是否存在问题的状态信息可以是刚刚在预定时间段(诸如过去一个小时或更少的时间)内收集的数据。
在一些示例中,所识别的报告被认为是来自报告库的用于解决该问题的最相关报告。在一些示例中,最相关报告是对减少解决该问题的时间最有效果的报告。在一些示例中,最相关报告仅基于系统确定应当帮助管理员对问题进行最快检验分类的输入。该最相关报告可以包括反馈,该反馈基于当管理员在过去处理相同或类似问题时管理员的历史行为。在一些示例中,管理员具有如下选项:向系统指定针对特定问题管理员想要哪个报告。
发送概括问题的消息可以包括:发送消息和伴随的链接到管理员的登录页面。在一些示例中,消息和链接被发送给分配来管理或维护网络的每个管理员。在其他情况中,消息和链接可以被发送给负责那时发生的类型的问题的特定管理员。在一些示例中,消息和链接被发送给电子邮箱、电话、网站、其他位置或它们的组合,以便迅速到达管理员。消息和链接可以被发送到第一位置而警告被发送到第二位置。例如,记录的语音消息可以被留在用户的语音信箱上以便提醒管理员消息和链接已被发送到第一位置。
在一些示例中,推荐策略包括参考查找表,该查找表描述网络的各种状况到网络的实际状况。如果网络状况与在查找表中指定的参数匹配或接近匹配,则系统可以发送概括该状况的消息以及到针对匹配情况具有最高推荐强度的已识别报告的链接。在一些示例中,推荐策略包括使用关于网络状况的最近数据。最近数据可以包括在预定时间段(诸如过去一个小时或更少的时间)内已被收集的关于网络的数据。
在一些示例中,在问题期间的网络状况不反映在查找表中识别的参数。在这样的示例中,查找表可以推荐针对类似状况会被推荐的报告。然而,当管理员对问题进行检验分类时,系统分析管理员的行为以便基于管理员的行为确定哪个报告最相关。基于管理员的实际行为,在查找表中可以针对当前的网络状况创建新的条目。然后,当这些状况再次发生时,查找表将基于管理员在解决类似状况中的先前行为推荐报告。
在一些示例中,查找表中的信息考虑到计数器值,该计数器值反映报告库中每个报告响应于先前识别的问题被打开的次数。在一些示例中,推荐策略包括整体或部分基于计数器值确定推荐强度。
图8是根据本文描述的原理的推荐系统(800)的示例的图。在这个示例中,推荐系统(800)包括与存储器(803)通信的处理器(802)。存储器(803)通常表示能够存储数据(诸如由推荐系统使用的程序指令或数据结构)的任何存储器。所示出的存储在存储器(803)中的程序指令包括问题认定模块(806)、消息确定模块(810)、报告确定模块(814)/计数器(816)和链接管理器(822)。所示出的存储在存储器(803)中的数据结构包括查找表(808)、推荐策略(812)、消息库(818)和报告库(820)。
存储器(803)是计算机可读存储介质,其包含使任务由处理器(802)执行的计算机可读程序代码。计算机可读存储介质可以是有形的和/或非临时性存储介质。计算机可读存储介质类型的非穷举列表包括非易失性存储器、易失性存储器、随机存取存储器、基于忆阻器的存储器、仅写入存储器、闪存、电可擦除程序只读存储器、或存储器类型、或它们的组合。
问题认定模块(806)表示程序指令,当该程序指令被执行时使得处理器(802)认定问题何时再网络中存在。问题认定模块(806)可以从监视工具接收输入。查找表(808)表示把已识别的报告与先前识别的网络问题相关联的数据结构。当问题认定模块(806)被执行时,它使得处理器(806)通过比较所接收的数据和查找表(808)中的信息来分析来自网络监视工具或其他来源的数据。如果比较结果显示在网络的当前状况和在查找表(808)中识别的参数之间存在匹配或紧密匹配,则问题认定模块(806)使得处理器(802)认定问题。
查找表(808)还可以指示哪些报告和消息应当被发送给网络管理员以便协助管理员对问题进行检验分类。消息确定模块(810)表示如下程序指令,当程序指令被执行时,使得处理器(802)基于网络状况确定哪个消息应当被发送给网络管理员。在一些示例中,消息是简要概括网络中问题的单个语句。在其他示例中,消息包括关于问题的全面细节。
推荐策略(812)表示用于确定推荐强度的加权因素的列表。该因素可以包括网络状况以及管理员响应于先前识别的问题时的过去的行为两者。报告确定模块(814)表示如下程序指令,当程序指令被执行时,使得处理器(802)基于推荐策略和查找表中的数据确定要识别哪个报告。报告确定模块(814)可以参考推荐策略(812)来确定多少权重分派给网络状况和多少权重分派给管理员的行为。
通过计数器(816)追踪用户行为,计数器(816)表示如下程序指令,当程序指令被执行时,使得处理器(802)基于管理员过去的行为或直接输入把计数器值分派给每个问题类型的每个报告。计数器值表示针对每个特定网络问题的每个报告的推荐强度,并且计数器值被记录和存储在查找表中。如果用户响应于推荐系统而打开发送给他的已识别报告,则计数器程序指令使得附加计数器值(+1)与针对该特定问题的已识别报告相关联。推荐策略(812)是包含如下规则的数据结构:指定带有针对每个特定问题的最高计数器值的报告具有最高推荐强度并且因此应当是已识别报告。因此,报告确定模块(814)可以参考查找表以便取回与先前识别的网络问题相关联的报告类型以及取回计数器值。在替代示例中,推荐策略(812)具有如下规则:指定计数器值是在识别报告时要考虑的针对报告确定模块(814)的几个因素之一,并且报告确定模块(814)参考在识别报告时要考虑的针对附加信息的其他位置。
消息确定模块(810)表示程序指令,当该程序指令被执行时,使得处理器(802)确定要与报告一起发送哪个消息。响应于确定哪个消息和报告推荐给管理员,消息确定模块(800)使得处理器(802)从消息库(818)取回所推荐的消息并且从报告库(820)取回已识别的报告。消息库(818)是存储描述网络的潜在问题的消息的数据结构,并且报告库(820)是存储在查找表(808)中参考的报告的另一数据结构。消息和报告可以针对特定管理员被定制。链接管理器(822)表示程序指令,当该程序指令被执行时,使得处理器(802)创建或以其他方式识别到报告的链接。链接管理器(822)还使得处理器(802)当链接管理器的指令被执行时把该链接嵌入到要发送给管理员的消息中。
另外,存储器(803)可以是安装包的部分。响应于安装该安装包,存储器(803)的编程指令可以从安装包的来源(诸如可插入介质、服务器、远程网络位置、另一位置或它们的组合)下载。与本文描述的原理兼容的可插入存储器介质包括DVD、CD、闪存、可插入盘、磁盘、其它形式的可插入存储器或它们的组合。
在一些示例中,处理器(802)和存储器(803)定位在相同物理部件(诸如服务器)内或网络部件内。存储器可以是如下各项的部分:物理部件的主存储器、高速缓存器、寄存器、非易失性存储器或物理部件的存储器层次中的其它地方。替代地,存储器(803)可以通过网络与处理器(802)通信。另外,数据结构(诸如库(818、820)和推荐策略(812))可以通过网络连接从远程位置访问,而编程指令被定位在本地。
图8的推荐系统(800)可以是通用计算机的部分。然而,在替代示例中,推荐系统(800)是专用集成电路的部分。
图9是根据本文描述的原理的用于识别用来解决网络问题的报告的过程的流程图(900)的示例的图。在这个示例中,该过程包括监视(902)网络并且确定(904)网络中是否存在问题。如果不存在问题,则过程包括继续监视(902)网络。
如果在网络中检测到问题,则该过程包括通过参考查找表来确定(906)问题类型,从而创建(908)概括该问题的消息,并且确定(910)哪个报告与解决该问题最相关。该过程还包括创建(912)到已识别报告的链接,并且把所概括的消息与该链接一起发送给管理员以便对问题进行检验分类。
该过程包括确定(916)管理员是否使用过已识别的报告。如果管理员确实使用过该已识别的报告对问题进行检验分类,则该过程包括继续监视(902)网络。如果管理员没有使用过该已识别报告,则该过程包括:识别(918)管理员解决该问题使用过的每个报告以及针对管理员对问题进行检验分类所参考的每个报告把计数器值发送(920)到查找表。
虽然已特定参考查找表信息描述了上面的示例,但是可以使用与本文描述的原理兼容的查找表的行数、查找表的列数、查找表数据库接收的信息的类型、任何查找表特性和/或参数。另外,虽然上面已经描述了特定装置和机构用于收集数据或监视网络,但是用于收集数据和/或监事网络的任何装置或机构及其任何布置可以根据本文描述的原理被使用。
而且,虽然已特定参考推荐系统获知用于修改查找表的推荐以计及管理员的行为的方式描述了上面的示例,但是根据本文描述的原理可以使用任何获知机制。另外,虽然已参考确定计数器值的特定方式描述了上面的示例,但是可以使用用于对已识别的报告进行评级的任何机制。
另外,在一些示例中,系统可以对于每个问题推荐多于一个的报告。这样的示例可以在管理员的行为指示管理员通常依赖于多个报告对该特定问题进行检验分类时发生。另外,针对特定用户可以定制报告和消息。在多于一个管理员管理网络的示例中,系统可以确定哪个管理员正对问题进行检验分类并且可以发送针对该管理员定制的报告。另外,在其它示例中,系统可以发送定制报告给每个用户,以使得无论哪个管理员对问题进行检验分类首先已经具有他们的定制消息和报告。在一些示例中,系统将基于那些管理员的行为针对相同的问题为不同的管理员推荐不同的报告。在管理员对于特定网络来说是新人的示例中,系统可以基于其它网络管理员的行为发送已识别报告给该新管理员。
虽然已参考特定消息描述了上面的示例,但是可以使用与本文描述的原理兼容的任何类型的消息。例如,对于问题的更详细的解释可以发送给用户。另外,代替发送消息,到消息的链接可以被发送给用户。另外,消息可以是单个语句、多个语句、被简要写下、利用符号在视觉上绘制问题、具有其他特性或它们的组合。在一些示例中,消息以多种语言和格式被发送以便协助尽可能多的管理员。
另外,虽然参考关于网络状况的特定类型的数据描述了上面的示例,但是可以使用与本文描述的原理兼容的任何类型的数据。例如,可以使用性能数据、可用性数据、延时数据、信号强度数据、浏览器数据、错误数据、存储器数据、处理数据、其它形式的数据或它们的组合。虽然参考用于收集数据以确定是否存在问题的预定时间段的特定定义描述了上面的示例,该预定时间段可以包括与本文描述的原理兼容的任何持续时间。例如,预定时间段可以具有如下持续时间:几秒、几分钟、几小时、几天、几星期或其它持续时间。
前面的描述仅出于说明和描述所描述原理的示例的目的而被呈现。这个描述不意图是穷举的或把这些原理限制为任何公开的精确形式。根据上面的教导,许多修改和变型是可能的。

Claims (15)

1. 一种计算机程序产品,用于识别报告以解决网络问题,包括:
有形计算机可读存储介质,所述有形计算机可读存储介质包括与其包含在一起的计算机可读程序代码,所述计算机可读程序代码包括在被执行时使处理器进行如下操作的代码:
根据推荐强度在报告库中识别报告,所述报告被推荐解决与当前网络问题匹配的先前识别的网络问题;
发送到所述已识别报告的链接;以及
基于所述已识别的报告是否被用于解决所述当前问题而更新推荐强度。
2. 根据权利要求1的计算机程序产品,其中所述已识别报告被认为是来自所述报告库的用于根据所述推荐强度解决所述当前问题的最相关报告。
3. 根据权利要求1的计算机程序产品,还包括在被执行时使所述处理器把所述链接发送到管理员登录页面的计算机可读程序代码。
4. 根据权利要求1的计算机程序产品,还包括在被执行时使所述处理器确定针对所述链接的用户行为的计算机可读程序代码。
5. 根据权利要求1的计算机程序产品,还包括在被执行时使所述处理器进行如下操作的计算机可读程序代码:基于所收集的数据识别所述推荐报告,所收集的数据与最近预定时间段内的所述网络有关。
6. 根据权利要求1的计算机程序产品,还包括在被执行时使所述处理器进行如下操作的计算机可读程序代码:参考查找表中的数据以便识别所述已识别报告,所述数据表示推荐强度。
7. 根据权利要求6的计算机程序产品,其中所述数据包括计数器值,所述计数器值反映所述报告库中的每个报告响应于先前识别的网络问题而被打开过的次数。
8. 根据权利要求7的计算机程序产品,还包括在被执行时使所述处理器基于所述计数器值推荐所述已识别报告的计算机可读程序代码。
9. 一种用于识别报告以解决网络问题的系统,包括处理器和存储器,其中所述存储器存储在被执行时使处理器进行如下操作的程序指令:
基于推荐强度从多个报告识别报告,所述报告被推荐以解决与网络中的当前问题匹配的先前识别的网络问题,所述推荐强度基于与所述多个报告相关联的计数器值;
发送到所述已识别报告的链接;以及
响应于用户行为而更新与所述已识别报告相关联的计数器值和推荐强度。
10. 根据权利要求9的系统,其中基于推荐策略识别所述报告,所述推荐策略考虑在最近预定时间段内从所述网络收集的、关于所述当前问题的状态信息。
11. 根据权利要求9的系统,其中与所述已识别报告相关联的所述计数器值反映所述已识别报告关于先前识别的网络问题被打开过的次数。
12. 根据权利要求9的系统,其中基于推荐策略识别所述报告,所述推荐策略考虑在查找表中识别的、与先前识别的网络问题相关联的已识别报告。
13. 一种用于识别报告以解决网络问题的方法,包括:
根据推荐强度从报告库识别报告,所述报告被推荐用于解决基于查找表与当前网络问题匹配的网络问题;
发送概括所述当前网络问题的消息以及到所述已识别报告的链接;以及
响应于所述已识别报告而基于用户行为更新所述已识别报告的推荐强度。
14. 根据权利要求13的方法,其中更新所述推荐强度包括更新与所述查找表中的所述已识别报告相关联的计数器值。
15. 根据权利要求14的方法,其中与所述已识别报告相关联的所述计数器值反映所述已识别报告关于先前识别的问题被打开过的次数。
CN201280077596.4A 2012-10-10 2012-10-10 识别报告以解决网络问题 Pending CN104823406A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2012/059544 WO2014058421A1 (en) 2012-10-10 2012-10-10 Identifying reports to address network issues

Publications (1)

Publication Number Publication Date
CN104823406A true CN104823406A (zh) 2015-08-05

Family

ID=50477733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280077596.4A Pending CN104823406A (zh) 2012-10-10 2012-10-10 识别报告以解决网络问题

Country Status (4)

Country Link
US (1) US10389660B2 (zh)
EP (1) EP2907267A4 (zh)
CN (1) CN104823406A (zh)
WO (1) WO2014058421A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2984803A1 (en) * 2013-04-09 2016-02-17 Nokia Solutions and Networks Oy Method and apparatus for generating insight into the customer experience of web based applications
CN110710158B (zh) * 2018-05-07 2022-08-09 谷歌有限责任公司 验证与数字助理应用交接的代理的操作状态
CN111339211B (zh) * 2018-12-19 2023-09-19 中国移动通信集团重庆有限公司 网络问题分析的方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097517A1 (en) * 2003-11-05 2005-05-05 Hewlett-Packard Company Method and system for adjusting the relative value of system configuration recommendations
US20090019314A1 (en) * 2007-07-13 2009-01-15 Purenetworks, Inc. Network advisor
CN101640603A (zh) * 2008-08-01 2010-02-03 上海数讯信息技术有限公司 一种主动式远程网络管理系统
US7694115B1 (en) * 1998-11-09 2010-04-06 Sri International Network-based alert management system
CN101893863A (zh) * 2009-05-18 2010-11-24 中国石化集团南京化学工业有限公司 基于档案的动设备离线采集受控管理系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7051244B2 (en) 2002-10-31 2006-05-23 Hewlett-Packard Development Company, L.P. Method and apparatus for managing incident reports
US7249284B2 (en) * 2003-03-28 2007-07-24 Ge Medical Systems, Inc. Complex system serviceability design evaluation method and apparatus
KR100933991B1 (ko) 2003-06-30 2009-12-28 주식회사 케이티 네트워크 장애 관리 시스템 및 그 방법
US20050114180A1 (en) * 2003-11-26 2005-05-26 Ploetz Lawrence E. System and method for providing potential problem solutions to a service provider
US7558834B2 (en) * 2003-12-29 2009-07-07 Ebay Inc. Method and system to process issue data pertaining to a system
US8954420B1 (en) * 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US7954090B1 (en) 2004-12-21 2011-05-31 Zenprise, Inc. Systems and methods for detecting behavioral features of software application deployments for automated deployment management
US20060190435A1 (en) * 2005-02-24 2006-08-24 International Business Machines Corporation Document retrieval using behavioral attributes
US8433711B2 (en) * 2005-09-09 2013-04-30 Kang Jo Mgmt. Limited Liability Company System and method for networked decision making support
US20080155091A1 (en) 2006-12-22 2008-06-26 Parag Gokhale Remote monitoring in a computer network
US8341650B1 (en) * 2010-02-02 2012-12-25 Cellco Partnership High thread count analyzer for web application server environment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7694115B1 (en) * 1998-11-09 2010-04-06 Sri International Network-based alert management system
US20050097517A1 (en) * 2003-11-05 2005-05-05 Hewlett-Packard Company Method and system for adjusting the relative value of system configuration recommendations
US20090019314A1 (en) * 2007-07-13 2009-01-15 Purenetworks, Inc. Network advisor
CN101640603A (zh) * 2008-08-01 2010-02-03 上海数讯信息技术有限公司 一种主动式远程网络管理系统
CN101893863A (zh) * 2009-05-18 2010-11-24 中国石化集团南京化学工业有限公司 基于档案的动设备离线采集受控管理系统

Also Published As

Publication number Publication date
EP2907267A4 (en) 2016-06-08
US10389660B2 (en) 2019-08-20
US20150281140A1 (en) 2015-10-01
EP2907267A1 (en) 2015-08-19
WO2014058421A1 (en) 2014-04-17

Similar Documents

Publication Publication Date Title
US11449379B2 (en) Root cause and predictive analyses for technical issues of a computing environment
US11269718B1 (en) Root cause detection and corrective action diagnosis system
US10387899B2 (en) Systems and methods for monitoring and analyzing computer and network activity
US7856575B2 (en) Collaborative troubleshooting computer systems using fault tree analysis
US9652318B2 (en) System and method for automatically managing fault events of data center
US20200293946A1 (en) Machine learning based incident classification and resolution
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
US9084937B2 (en) Faults and performance issue prediction
US10922164B2 (en) Fault analysis and prediction using empirical architecture analytics
US8024214B2 (en) System and method of visualization for aggregation of change tracking information
US20110066908A1 (en) Similarity detection for error reports
US20040103121A1 (en) Method, system and computer product for integrating case based reasoning data and failure modes, effects and corrective action data
JP5223413B2 (ja) Itシステムのトラブル対処装置、トラブル対処方法およびそのためのプログラム
US20080301486A1 (en) Customization conflict detection and resolution
US20210406112A1 (en) Anomaly classification in information technology environments
US20210224676A1 (en) Systems and methods for distributed incident classification and routing
US11093319B2 (en) Automated recovery of webpage functionality
US11610136B2 (en) Predicting the disaster recovery invocation response time
US10613525B1 (en) Automated health assessment and outage prediction system
US11165668B2 (en) Quality assessment and decision recommendation for continuous deployment of cloud infrastructure components
US8090994B2 (en) System, method, and computer readable media for identifying a log file record in a log file
US20190354991A1 (en) System and method for managing service requests
CN111209153B (zh) 异常检测处理方法、装置及电子设备
CN103518192B (zh) 大规模服务的实时诊断流水线
CN104823406A (zh) 识别报告以解决网络问题

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20170122

Address after: American Texas

Applicant after: HEWLETT PACKARD ENTERPRISE DEVELOPMENT LP

Address before: American Texas

Applicant before: Hewlett-Packard Development Company, L.P.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180611

Address after: American California

Applicant after: Antite Software Co., Ltd.

Address before: American Texas

Applicant before: HEWLETT PACKARD ENTERPRISE DEVELOPMENT LP

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150805