CN113568772A - 一种中间件排查故障方法、装置、设备及可读存储介质 - Google Patents

一种中间件排查故障方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113568772A
CN113568772A CN202110833542.7A CN202110833542A CN113568772A CN 113568772 A CN113568772 A CN 113568772A CN 202110833542 A CN202110833542 A CN 202110833542A CN 113568772 A CN113568772 A CN 113568772A
Authority
CN
China
Prior art keywords
middleware
operation data
parameters
threshold
servers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110833542.7A
Other languages
English (en)
Inventor
李鑫
陈让宽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202110833542.7A priority Critical patent/CN113568772A/zh
Publication of CN113568772A publication Critical patent/CN113568772A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及中间件故障排查技术领域,具体而言,涉及一种中间件排查故障方法、装置、设备及可读存储介质,包括获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,通过监测用户在软件界面进行操作时产生的第一操作数据所对应的多个服务器的响应时间,进而实现自动排查和修复中间件的一些日常问题,避免了人为地去排查和修复,使中间件问题处理效率得到极大提升。

Description

一种中间件排查故障方法、装置、设备及可读存储介质
技术领域
本发明涉及中间件故障排查技术领域,具体而言,涉及一种中间件排查故障方法、装置、设备及可读存储介质。
背景技术
在处理中间件日常问题时,通常的手段就是通过中间件专业方向运维人员上手亲自处理,该处理方式对人员的技术依赖性较高,存在一定技术壁垒,且人为排查问题,需要手动查看不同日志、信息等内容,处理时间较长效率较低。
发明内容
本发明的目的在于提供一种中间件排查故障方法、装置、设备及可读存储介质,以改善上述问题。
为了实现上述目的,本申请实施例提供了如下技术方案:
一方面,本申请实施例提供了一种中间件排查故障方法,所述方法包括:获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,所述第一操作数据包括多个所述中间件数据请求指令,所述第一阈值为所述第一服务器响应所述中间件数据请求指令的最长时间;检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则调取所述第一操作数据对应的多个第一服务器的地址;根据所述多个所述第一服务器地址找到多个对应的第一服务器;根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,使所述第一操作数据对应的多个所述第一服务器中的中间件的参数的数值均位于所述规范参数的数值范围内,所述规范参数为所述第一服务器对应的中间件的参数的参考阈值。
可选地,所述检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间后,还包括:
若所述中间件数据请求指令对应的所述第一服务器的响应时间小于或等于所述第一阈值,调取所述第一操作数据中所有所述中间件数据请求指令对应的中间件响应成功率和第二阈值,所述第二阈值为所述中间件响应成功率的最小值,所述中间件响应成功率为得到响应的所述中间件数据请求指令在所有所述中间件数据请求指令中的占比;
对比所述第二阈值和所述中间件响应成功率的大小,若所述中间件响应成功率小于所述第二阈值,则调取所述第一操作对应的多个第一服务器的地址,并根据所述多个第一服务器地址找到多个对应的第一服务器;
根据规范参数调整每个所述第一服务器对应的中间件的参数,使所述第一服务器对应的中间件的参数值均位于所述规范参数的数值范围内。
可选地,所述根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数后,还包括:
调取所述第一操作数据,并将其发送至多个对应的第一服务器;
检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述响应时间均小于所述第一阈值,则发送故障已解决指令,所述故障已解决指令为提示维护人员当前故障已解决的指令。
可选地,所述检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间后,还包括:
若任意一个所述中间件数据请求指令对应的所述响应时间大于所述第一阈值,调取异常信息资源池,所述异常信息资源池包括多个异常信息和多个相对应的异常信息处理逻辑;
捕获当前的第一操作数据对应的异常信息;
在所述异常信息资源池中匹配到与所述当前第一操作数据对应的异常信息相匹配的异常信息处理逻辑,所述异常信息处理逻辑为重置多个与所述第一操作数据对应的所述第一服务器的操作代码;
根据所述相匹配的异常信息处理逻辑对所述当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置。
可选地,所述对当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置后,还包括:
调取所述当前第一操作数据,并将其发送至多个对应的第一服务器;
检测所述当前第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述当前第一操作数据对应的多个响应时间均小于所述第一阈值,则发送故障已解决指令,若所述当前第一操作数据对应的任意一个所述响应时间大于或等于所述第一阈值,发送第一警告指令,所述第一警告指令为提示维护人员需要人为干预处理故障的指令。
可选地,所述根据规范参数调整每个所述第一服务器中的中间件的参数中,包括:
调取一个所述第一操作数据对应的第一服务器中的所述中间件的参数和所述规范参数,所述中间件的参数包括多个配置参数,所述规范参数包括多个与所述多个配置参数一一对应的参考阈值;
调取一个配置参数并在所述规范参数中找到与所述配置参数对应的参考阈值;
检测调整:检测被调取的所述配置参数的数值是否在与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围外,则调节所述被调取的所述配置参数的数值,使所述被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,则调取另一个未被调取的所述配置参数,并对所述另一个被调取的所述配置参数进行检测调整,直至所述中间件的参数中的所有配置参数均被调取。
第二方面,本申请实施例提供了一种中间件排查故障系统,所述系统包括第一数据获取模块、第一计算模块、第二计算模块和第三计算模块;第一数据获取模块,用于获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,所述第一操作数据包括多个所述中间件数据请求指令,所述第一阈值为所述第一服务器响应所述中间件数据请求指令的最长时间;第一计算模块,用于检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则调取所述第一操作数据对应的多个第一服务器的地址;第二计算模块,用于根据所述多个所述第一服务器地址找到多个对应的第一服务器;第三计算模块,用于根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,使所述第一操作数据对应的多个所述第一服务器中的中间件的参数的数值均位于所述规范参数的数值范围内,所述规范参数为所述第一服务器对应的中间件的参数的参考阈值。
可选地,所述第一计算模块包括:
第一计算单元,用于若所述中间件数据请求指令对应的所述第一服务器的响应时间小于或等于所述第一阈值,调取所述第一操作数据中所有所述中间件数据请求指令对应的中间件响应成功率和第二阈值,所述第二阈值为所述中间件响应成功率的最小值,所述中间件响应成功率为得到响应的所述中间件数据请求指令在所有所述中间件数据请求指令中的占比;
第二计算单元,用于对比所述第二阈值和所述中间件响应成功率的大小,若所述中间件响应成功率小于所述第二阈值,则调取所述第一操作对应的多个第一服务器的地址,并根据所述多个第一服务器地址找到多个对应的第一服务器;
第三计算单元,用于根据规范参数调整每个所述第一服务器对应的中间件的参数,使所述第一服务器对应的中间件的参数值均位于所述规范参数的数值范围内。
可选地,所述第三计算模块包括:
第一数据调取单元,用于调取所述第一操作数据,并将其发送至多个对应的第一服务器;
第四计算单元,用于检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述响应时间均小于所述第一阈值,则发送故障已解决指令,所述故障已解决指令为提示维护人员当前故障已解决的指令。
可选地,所述第四计算单元包括:
第一计算子单元,用于若任意一个所述中间件数据请求指令对应的所述响应时间大于所述第一阈值,调取异常信息资源池,所述异常信息资源池包括多个异常信息和多个相对应的异常信息处理逻辑;
第二计算子单元,用于捕获当前的第一操作数据对应的异常信息;
第三计算子单元,用于在所述异常信息资源池中匹配到与所述当前第一操作数据对应的异常信息相匹配的异常信息处理逻辑,所述异常信息处理逻辑为重置多个与所述第一操作数据对应的所述第一服务器的操作代码;
第四计算子单元,用于根据所述相匹配的异常信息处理逻辑对所述当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置。
可选地,所述第四计算子单元包括:
第一数据调取子单元,用于调取所述当前第一操作数据,并将其发送至多个对应的第一服务器;
第五计算子单元,用于检测所述当前第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述当前第一操作数据对应的多个响应时间均小于所述第一阈值,则发送故障已解决指令,若所述当前第一操作数据对应的任意一个所述响应时间大于或等于所述第一阈值,发送第一警告指令,所述第一警告指令为提示维护人员需要人为干预处理故障的指令。
可选地,所述第三计算模块包括:
第二数据调取单元,用于调取一个所述第一操作数据对应的第一服务器中的所述中间件的参数和所述规范参数,所述中间件的参数包括多个配置参数,所述规范参数包括多个与所述多个配置参数一一对应的参考阈值;
第三数据调取单元,用于调取一个配置参数并在所述规范参数中找到与所述配置参数对应的参考阈值;
第五计算单元,用于检测调整:检测被调取的所述配置参数的数值是否在与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围外,则调节所述被调取的所述配置参数的数值,使所述被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,则调取另一个未被调取的所述配置参数,并对所述另一个被调取的所述配置参数进行检测调整,直至所述中间件的参数中的所有配置参数均被调取。
第三方面,本申请实施例提供了一种中间件排查故障设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述中间件排查故障方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述中间件排查故障方法的步骤。
本发明的有益效果为:
通过监测用户在软件界面进行操作时产生的第一操作数据所对应的多个服务器的响应时间,进而自动判断设置在每个服务器上的中间件的运行参数即中间件参数是否设置合理,若发现服务器响应时间较长时,系统通过参照所述规范参数自动重新设置服务器上的中间件运行参数即中间件参数,进而实现自动排查和修复中间件的一些日常问题,避免了人为地去排查和修复,使中间件问题处理效率得到极大提升。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例中所述的一种中间件排查故障方法流程示意图;
图2是本发明实施例中所述的一种中间件排查故障系统结构示意图;
图3是本发明实施例中所述的一种中间件排查故障设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号或字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
如图1所示,本实施例提供了一种中间件排查故障方法,该方法包括步骤S1、步骤S2、步骤S3和步骤S4。
步骤S1.获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,所述第一操作数据包括多个所述中间件数据请求指令,所述第一阈值为所述第一服务器响应所述中间件数据请求指令的最长时间;
用户使用手机上或电脑上使用软件时,在软件界面上的相关操作使软件会生成相关的操作数据即本实施例所述的第一操作数据,每个第一操作数据所要请求的数据是多种多样的,且分别存储于用于支撑软件功能的多个不同的服务器中,第一操作数据包括多个数据请求指令即中间件数据请求指令,而安装在服务器上的中间件可以根据所述数据请求指令调取服务器上的相关数据。
步骤S2.检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则调取所述第一操作数据对应的多个第一服务器的地址;
由于一条第一操作数据数据中包括较多条中间件数据请求指令,系统在检测时响应时间时,并不会每个都检测,该方式用于减轻电脑的工作载荷,而是随机抽取几条进行检测,若随机检测出所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则系统判定当前的第一操作数据数据对应的多个所述第一服务器中至少有一个服务器在中间件的设置参数即中间件的参数上存在问题,此时系统将调取当前所述第一操作数据数据对应的所有第一服务器的IP地址,并根据该IP地址找到对应的所述第一服务器,所述中间件的设置参数可以为最大占用第一服务器的内存大小、最大占用第一服务器的CPU性能的百分比等。
步骤S3.根据所述多个所述第一服务器地址找到多个对应的第一服务器;
步骤S4.根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,使所述第一操作数据对应的多个所述第一服务器中的中间件的参数的数值均位于所述规范参数的数值范围内,所述规范参数为所述第一服务器对应的中间件的参数的参考阈值。
依次将每个上述IP地址上的服务器中的中间件设置参数与所述规范参数进行对比,若上述IP地址上的服务器中的中间件设置参数的某一项不在所述规范参数给定的参考范围,则修改该项参数,使其在所述规范参数给定的参考范围内。
在本公开的一种具体实施方式中,所述步骤S2后,还可以包括步骤S21、步骤S22和步骤S23。
步骤S21.若所述中间件数据请求指令对应的所述第一服务器的响应时间小于或等于所述第一阈值,调取所述第一操作数据中所有所述中间件数据请求指令对应的中间件响应成功率和第二阈值,所述第二阈值为所述中间件响应成功率的最小值,所述中间件响应成功率为得到响应的所述中间件数据请求指令在所有所述中间件数据请求指令中的占比;
由于对于响应时间的检测是随机抽取的,不具有全面覆盖性,因此在随机检测响应时间的同时系统通过检测每个所述第一操作数据中所有所述中间件数据请求指令的响应成功率,进而从另一个方向全方面的检测一个第一操作数据的中间件响应情况,且如果一个第一操作数据中的中间件响应成功率低于第二阈值,系统则判定该第一操作数据对应的多个第一服务器存在中间件设置参数的问题,此时系统将调取当前所述第一操作数据数据对应的所有第一服务器的IP地址,并根据该IP地址找到对应的所述第一服务器,所述中间件的设置参数可以为最大占用第一服务器的内存大小、最大占用第一服务器的CPU性能的百分比等。
步骤S22.对比所述第二阈值和所述中间件响应成功率的大小,若所述中间件响应成功率小于所述第二阈值,则调取所述第一操作对应的多个第一服务器的地址,并根据所述多个第一服务器地址找到多个对应的第一服务器;
步骤S23.根据规范参数调整每个所述第一服务器对应的中间件的参数,使所述第一服务器对应的中间件的参数值均位于所述规范参数的数值范围内。
此时依次将每个上述IP地址上的服务器中的中间件设置参数与所述规范参数进行对比,若上述IP地址上的服务器中的中间件设置参数的某一项不在所述规范参数给定的参考范围,则修改该项参数,使其在所述规范参数给定的参考范围内。
在本公开的一种具体实施方式中,所述步骤S4后,还可以包括步骤S41和步骤S42。
步骤S41.调取所述第一操作数据,并将其发送至多个对应的第一服务器;
步骤S42.检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述响应时间均小于所述第一阈值,则发送故障已解决指令,所述故障已解决指令为提示维护人员当前故障已解决的指令。
上述步骤用于检验本次修改中间件设置参数是否已经解决中间件数据请求指令响应超时的问题,且检验是对所述第一操作数据中的每个所述中间件数据请求的响应时间进行检测,防止漏检。
在本公开的一种具体实施方式中,所述步骤S42后,还可以包括步骤S421、步骤S422、步骤S423和步骤S424。
步骤S421.若任意一个所述中间件数据请求指令对应的所述响应时间大于所述第一阈值,调取异常信息资源池,所述异常信息资源池包括多个异常信息和多个相对应的异常信息处理逻辑;
本实施了所述的情况为当通过规范参数调整所述第一服务器中的中间件参数后,所述中间件数据请求指令对应的响应时间依旧超时即大于所述第一阈值的处理措施。
步骤S422.捕获当前的第一操作数据对应的异常信息;
所述捕获当前的第一操作数据对应的异常信息包括查看中间件、操作系统、应用日志信息、查看中间件内部状态信息等;其中
捕获异常状态包括:操作系统CPU、内存异常、中间件内存溢出异常、中间件线程挂起异常、中间件SSL握手异常、中间件进程打开文件数异常、中间件进程socket端口连接处异常、http服务器处理连接数异常、中间件数据源连接池异常、中间件应用响应时间异常等。
步骤S423.在所述异常信息资源池中匹配到与所述当前第一操作数据对应的异常信息相匹配的异常信息处理逻辑,所述异常信息处理逻辑为重置多个与所述第一操作数据对应的所述第一服务器的操作代码;
步骤S424.根据所述相匹配的异常信息处理逻辑对所述当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置。
如发现捕获到异常信息,则根据此异常信息处理逻辑进行第一服务器的问题处理。
在本公开的一种具体实施方式中,所述步骤S424后,还可以包括步骤S4241和步骤S4242。
步骤S4241.调取所述当前第一操作数据,并将其发送至多个对应的第一服务器;
步骤S4242.检测所述当前第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述当前第一操作数据对应的多个响应时间均小于所述第一阈值,则发送故障已解决指令,若所述当前第一操作数据对应的任意一个所述响应时间大于或等于所述第一阈值,发送第一警告指令,所述第一警告指令为提示维护人员需要人为干预处理故障的指令。
本实施了阐述了在发现捕获到异常信息,并根据此异常信息处理逻辑将所述第一服务器的问题处理完后,需要再次对产生该异常信息的所述第一操作数据进行再次运行,并检测该第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,判断是否已经解决异常问题,如果依旧没解决,则发送人工检修需求指令,请求专业人员进行问题排查和维修。
在本公开的一种具体实施方式中,所述步骤S4后,还可以包括步骤S43、步骤S44和步骤S45。
步骤S43.调取一个所述第一操作数据对应的第一服务器中的所述中间件的参数和所述规范参数,所述中间件的参数包括多个配置参数,所述规范参数包括多个与所述多个配置参数一一对应的参考阈值;
步骤S44.调取一个配置参数并在所述规范参数中找到与所述配置参数对应的参考阈值;
步骤S45.检测调整:检测被调取的所述配置参数的数值是否在与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围外,则调节所述被调取的所述配置参数的数值,使所述被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,则调取另一个未被调取的所述配置参数,并对所述另一个被调取的所述配置参数进行检测调整,直至所述中间件的参数中的所有配置参数均被调取。
本实施了公开了一种如何根据配置参数对所述第一操作数据对应的第一服务器中的所述中间件的参数进行检测和修改的方法。
在处理中间件日常问题时,通常的手段就是通过中间件专业方向运维人员上手亲自处理,该处理方式对人员的技术依赖性较高,存在一定技术壁垒,且人为排查问题,需要手动查看不同日志、信息等内容,处理时间较长效率较低,本实施例所公开的方法通过监测用户在软件界面进行操作时产生的第一操作数据所对应的多个服务器的响应时间,进而自动判断设置在每个服务器上的中间件的运行参数即中间件参数是否设置合理,若发现服务器响应时间较长时,系统通过参照所述规范参数自动重新设置服务器上的中间件运行参数即中间件参数,进而实现自动排查和修复中间件的一些日常问题,避免了人为地去排查和修复,使中间件问题处理效率得到极大提升。
实施例2
如图2所示,本实施例提供了一种中间件排查故障系统,所述系统包括第一数据获取模块71、第一计算模块72、第二计算模块73和第三计算模块74;
第一数据获取模块71,用于获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,所述第一操作数据包括多个所述中间件数据请求指令,所述第一阈值为所述第一服务器响应所述中间件数据请求指令的最长时间;
第一计算模块72,用于检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则调取所述第一操作数据对应的多个第一服务器的地址;
第二计算模块73,用于根据所述多个所述第一服务器地址找到多个对应的第一服务器;
第三计算模块74,用于根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,使所述第一操作数据对应的多个所述第一服务器中的中间件的参数的数值均位于所述规范参数的数值范围内,所述规范参数为所述第一服务器对应的中间件的参数的参考阈值。
在本公开的一种具体实施方式中,所述第一计算模块72包括:
第一计算单元721,用于若所述中间件数据请求指令对应的所述第一服务器的响应时间小于或等于所述第一阈值,调取所述第一操作数据中所有所述中间件数据请求指令对应的中间件响应成功率和第二阈值,所述第二阈值为所述中间件响应成功率的最小值,所述中间件响应成功率为得到响应的所述中间件数据请求指令在所有所述中间件数据请求指令中的占比;
第二计算单元722,用于对比所述第二阈值和所述中间件响应成功率的大小,若所述中间件响应成功率小于所述第二阈值,则调取所述第一操作对应的多个第一服务器的地址,并根据所述多个第一服务器地址找到多个对应的第一服务器;
第三计算单元723,用于根据规范参数调整每个所述第一服务器对应的中间件的参数,使所述第一服务器对应的中间件的参数值均位于所述规范参数的数值范围内。
在本公开的一种具体实施方式中,所述第三计算模块74包括:
第一数据调取单元741,用于调取所述第一操作数据,并将其发送至多个对应的第一服务器;
第四计算单元742,用于检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述响应时间均小于所述第一阈值,则发送故障已解决指令,所述故障已解决指令为提示维护人员当前故障已解决的指令。
在本公开的一种具体实施方式中,所述第四计算单元742包括:
第一计算子单元7421,用于若任意一个所述中间件数据请求指令对应的所述响应时间大于所述第一阈值,调取异常信息资源池,所述异常信息资源池包括多个异常信息和多个相对应的异常信息处理逻辑;
第二计算子单元7422,用于捕获当前的第一操作数据对应的异常信息;
第三计算子单元7423,用于在所述异常信息资源池中匹配到与所述当前第一操作数据对应的异常信息相匹配的异常信息处理逻辑,所述异常信息处理逻辑为重置多个与所述第一操作数据对应的所述第一服务器的操作代码;
第四计算子单元7424,用于根据所述相匹配的异常信息处理逻辑对所述当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置。
在本公开的一种具体实施方式中,所述第四计算子单元7424包括:
第一数据调取子单元74241,用于调取所述当前第一操作数据,并将其发送至多个对应的第一服务器;
第五计算子单元74242,用于检测所述当前第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述当前第一操作数据对应的多个响应时间均小于所述第一阈值,则发送故障已解决指令,若所述当前第一操作数据对应的任意一个所述响应时间大于或等于所述第一阈值,发送第一警告指令,所述第一警告指令为提示维护人员需要人为干预处理故障的指令。
在本公开的一种具体实施方式中,所述第三计算模块74包括:
第二数据调取单元743,用于调取一个所述第一操作数据对应的第一服务器中的所述中间件的参数和所述规范参数,所述中间件的参数包括多个配置参数,所述规范参数包括多个与所述多个配置参数一一对应的参考阈值;
第三数据调取单元744,用于调取一个配置参数并在所述规范参数中找到与所述配置参数对应的参考阈值;
第五计算单元745,用于检测调整:检测被调取的所述配置参数的数值是否在与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围外,则调节所述被调取的所述配置参数的数值,使所述被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,则调取另一个未被调取的所述配置参数,并对所述另一个被调取的所述配置参数进行检测调整,直至所述中间件的参数中的所有配置参数均被调取。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3
相应于上面的方法实施例,本公开实施例还提供了一种中间件排查故障设备,下文描述的一种中间件排查故障设备与上文描述的一种中间件排查故障方法可相互对应参照。
图3是根据一示例性实施例示出的一种中间件排查故障设备800的框图。如图3所示,该中间件排查故障设备800可以包括:处理器801,存储器802。该中间件排查故障设备800还可以包括多媒体组件803,输入/输出(I/O)接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该中间件排查故障设备800的整体操作,以完成上述的中间件排查故障方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该中间件排查故障设备800的操作,这些数据例如可以包括用于在该中间件排查故障设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该中间件排查故障设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(NearFieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,中间件排查故障设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的中间件排查故障方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的中间件排查故障方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由中间件排查故障设备800的处理器801执行以完成上述的中间件排查故障方法。
实施例4
相应于上面的方法实施例,本公开实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种中间件排查故障方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的中间件排查故障方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种中间件排查故障方法,其特征在于,包括:
获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,所述第一操作数据包括多个所述中间件数据请求指令,所述第一阈值为所述第一服务器响应所述中间件数据请求指令的最长时间;
检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则调取所述第一操作数据对应的多个第一服务器的地址;
根据所述多个所述第一服务器地址找到多个对应的第一服务器;
根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,使所述第一操作数据对应的多个所述第一服务器中的中间件的参数的数值均位于所述规范参数的数值范围内,所述规范参数为所述第一服务器对应的中间件的参数的参考阈值。
2.根据权利要求1所述的中间件排查故障方法,其特征在于,所述检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间后,还包括:
若所述中间件数据请求指令对应的所述第一服务器的响应时间小于或等于所述第一阈值,调取所述第一操作数据中所有所述中间件数据请求指令对应的中间件响应成功率和第二阈值,所述第二阈值为所述中间件响应成功率的最小值,所述中间件响应成功率为得到响应的所述中间件数据请求指令在所有所述中间件数据请求指令中的占比;
对比所述第二阈值和所述中间件响应成功率的大小,若所述中间件响应成功率小于所述第二阈值,则调取所述第一操作对应的多个第一服务器的地址,并根据所述多个第一服务器地址找到多个对应的第一服务器;
根据规范参数调整每个所述第一服务器对应的中间件的参数,使所述第一服务器对应的中间件的参数值均位于所述规范参数的数值范围内。
3.根据权利要求1所述的中间件排查故障方法,其特征在于,所述根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数后,还包括:
调取所述第一操作数据,并将其发送至多个对应的第一服务器;
检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述响应时间均小于所述第一阈值,则发送故障已解决指令,所述故障已解决指令为提示维护人员当前故障已解决的指令。
4.根据权利要求3所述的中间件排查故障方法,其特征在于,所述检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间后,还包括:
若任意一个所述中间件数据请求指令对应的所述响应时间大于所述第一阈值,调取异常信息资源池,所述异常信息资源池包括多个异常信息和多个相对应的异常信息处理逻辑;
捕获当前的第一操作数据对应的异常信息;
在所述异常信息资源池中匹配到与所述当前第一操作数据对应的异常信息相匹配的异常信息处理逻辑,所述异常信息处理逻辑为重置多个与所述第一操作数据对应的所述第一服务器的操作代码;
根据所述相匹配的异常信息处理逻辑对所述当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置。
5.根据权利要求4所述的中间件排查故障方法,其特征在于,所述对当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置后,还包括:
调取所述当前第一操作数据,并将其发送至多个对应的第一服务器;
检测所述当前第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述当前第一操作数据对应的多个响应时间均小于所述第一阈值,则发送故障已解决指令,若所述当前第一操作数据对应的任意一个所述响应时间大于或等于所述第一阈值,发送第一警告指令,所述第一警告指令为提示维护人员需要人为干预处理故障的指令。
6.根据权利要求1所述的中间件排查故障方法,其特征在于,所述根据规范参数调整每个所述第一服务器中的中间件的参数中,包括:
调取一个所述第一操作数据对应的第一服务器中的所述中间件的参数和所述规范参数,所述中间件的参数包括多个配置参数,所述规范参数包括多个与所述多个配置参数一一对应的参考阈值;
调取一个配置参数并在所述规范参数中找到与所述配置参数对应的参考阈值;
检测调整:检测被调取的所述配置参数的数值是否在与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围外,则调节所述被调取的所述配置参数的数值,使所述被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,则调取另一个未被调取的所述配置参数,并对所述另一个被调取的所述配置参数进行检测调整,直至所述中间件的参数中的所有配置参数均被调取。
7.一种中间件排查故障系统,其特征在于,包括:
第一数据获取模块,用于获取第一操作数据和第一阈值,并将所述第一操作数据中的每个中间数据请求指令发送至对应的第一服务器,所述第一操作数据包括多个所述中间件数据请求指令,所述第一阈值为所述第一服务器响应所述中间件数据请求指令的最长时间;
第一计算模块,用于检测至少一个所述中间件数据请求指令对应的所述第一服务器的响应时间,若所述中间件数据请求指令对应的所述第一服务器的响应时间大于所述第一阈值,则调取所述第一操作数据对应的多个第一服务器的地址;
第二计算模块,用于根据所述多个所述第一服务器地址找到多个对应的第一服务器;
第三计算模块,用于根据规范参数调整每个所述第一操作数据对应的第一服务器中的中间件的参数,使所述第一操作数据对应的多个所述第一服务器中的中间件的参数的数值均位于所述规范参数的数值范围内,所述规范参数为所述第一服务器对应的中间件的参数的参考阈值。
8.根据权利要求7所述的一种中间件排查故障系统,其特征在于,所述第一计算模块包括:
第一计算单元,用于若所述中间件数据请求指令对应的所述第一服务器的响应时间小于或等于所述第一阈值,调取所述第一操作数据中所有所述中间件数据请求指令对应的中间件响应成功率和第二阈值,所述第二阈值为所述中间件响应成功率的最小值,所述中间件响应成功率为得到响应的所述中间件数据请求指令在所有所述中间件数据请求指令中的占比;
第二计算单元,用于对比所述第二阈值和所述中间件响应成功率的大小,若所述中间件响应成功率小于所述第二阈值,则调取所述第一操作对应的多个第一服务器的地址,并根据所述多个第一服务器地址找到多个对应的第一服务器;
第三计算单元,用于根据规范参数调整每个所述第一服务器对应的中间件的参数,使所述第一服务器对应的中间件的参数值均位于所述规范参数的数值范围内。
9.根据权利要求7所述的一种中间件排查故障系统,其特征在于,所述第三计算模块包括:
第一数据调取单元,用于调取所述第一操作数据,并将其发送至多个对应的第一服务器;
第四计算单元,用于检测所述第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述响应时间均小于所述第一阈值,则发送故障已解决指令,所述故障已解决指令为提示维护人员当前故障已解决的指令。
10.根据权利要求9所述的一种中间件排查故障系统,其特征在于,所述第四计算单元包括:
第一计算子单元,用于若任意一个所述中间件数据请求指令对应的所述响应时间大于所述第一阈值,调取异常信息资源池,所述异常信息资源池包括多个异常信息和多个相对应的异常信息处理逻辑;
第二计算子单元,用于捕获当前的第一操作数据对应的异常信息;
第三计算子单元,用于在所述异常信息资源池中匹配到与所述当前第一操作数据对应的异常信息相匹配的异常信息处理逻辑,所述异常信息处理逻辑为重置多个与所述第一操作数据对应的所述第一服务器的操作代码;
第四计算子单元,用于根据所述相匹配的异常信息处理逻辑对所述当前第一操作数据对应的多个所述第一服务器中的参数设置进行重置。
11.根据权利要求10所述的一种中间件排查故障系统,其特征在于,所述第四计算子单元包括:
第一数据调取子单元,用于调取所述当前第一操作数据,并将其发送至多个对应的第一服务器;
第五计算子单元,用于检测所述当前第一操作数据中每个所述中间件数据请求指令对应的所述响应时间,若所述当前第一操作数据对应的多个响应时间均小于所述第一阈值,则发送故障已解决指令,若所述当前第一操作数据对应的任意一个所述响应时间大于或等于所述第一阈值,发送第一警告指令,所述第一警告指令为提示维护人员需要人为干预处理故障的指令。
12.根据权利要求7所述的一种中间件排查故障系统,其特征在于,所述第三计算模块包括:
第二数据调取单元,用于调取一个所述第一操作数据对应的第一服务器中的所述中间件的参数和所述规范参数,所述中间件的参数包括多个配置参数,所述规范参数包括多个与所述多个配置参数一一对应的参考阈值;
第三数据调取单元,用于调取一个配置参数并在所述规范参数中找到与所述配置参数对应的参考阈值;
第五计算单元,用于检测调整:检测被调取的所述配置参数的数值是否在与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围外,则调节所述被调取的所述配置参数的数值,使所述被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,若被调取的所述配置参数的数值位于所述与其对应的参考阈值的范围内,则调取另一个未被调取的所述配置参数,并对所述另一个被调取的所述配置参数进行检测调整,直至所述中间件的参数中的所有配置参数均被调取。
13.一种中间件排查故障设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述中间件排查故障方法的步骤。
14.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述中间件排查故障方法的步骤。
CN202110833542.7A 2021-07-23 2021-07-23 一种中间件排查故障方法、装置、设备及可读存储介质 Pending CN113568772A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110833542.7A CN113568772A (zh) 2021-07-23 2021-07-23 一种中间件排查故障方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110833542.7A CN113568772A (zh) 2021-07-23 2021-07-23 一种中间件排查故障方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN113568772A true CN113568772A (zh) 2021-10-29

Family

ID=78166499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110833542.7A Pending CN113568772A (zh) 2021-07-23 2021-07-23 一种中间件排查故障方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113568772A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581794A (zh) * 2013-10-22 2015-04-29 中国移动通信集团四川有限公司 一种中间件业务故障处理方法及系统
US20200371901A1 (en) * 2019-05-23 2020-11-26 International Business Machines Corporation Cognitive analytics for high-availability application-performance management
WO2021000406A1 (zh) * 2019-07-02 2021-01-07 平安科技(深圳)有限公司 请求处理方法、装置、计算机设备和存储介质
CN113127201A (zh) * 2021-04-23 2021-07-16 中国工商银行股份有限公司 故障应用服务器隔离方法及装置、电子设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581794A (zh) * 2013-10-22 2015-04-29 中国移动通信集团四川有限公司 一种中间件业务故障处理方法及系统
US20200371901A1 (en) * 2019-05-23 2020-11-26 International Business Machines Corporation Cognitive analytics for high-availability application-performance management
WO2021000406A1 (zh) * 2019-07-02 2021-01-07 平安科技(深圳)有限公司 请求处理方法、装置、计算机设备和存储介质
CN113127201A (zh) * 2021-04-23 2021-07-16 中国工商银行股份有限公司 故障应用服务器隔离方法及装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108616404B (zh) 一种客服方法、管理平台、存储介质及系统
CN109726072B (zh) WebLogic服务器的监控告警方法、装置、系统及计算机存储介质
EP3386150B1 (en) Terminal failure processing method, device and system
CN107426022B (zh) 安全事件监测方法及装置、电子设备、存储介质
US20190027018A1 (en) Artificial intelligence based service control and home monitoring
CN102937930A (zh) 应用程序监控系统及方法
CN107800783B (zh) 远程监控服务器的方法及装置
CN103338259B (zh) 一种基于云技术的会议视频设备管理控制方法
CN110505283B (zh) 一种基于云手机的自动维护系统及方法
CN108874825B (zh) 一种异常数据的校验方法和装置
CN111554219A (zh) 一种显示设备的测试方法、装置、电子产品及存储介质
CN111311892A (zh) 基于物联网的银行网点告警处理方法和网点管理中心系统
WO2016202046A1 (zh) 无线路由器设备的修复方法及装置
KR102063455B1 (ko) 라이브 오디오의 이력 아카이브 및 라이브 오디오의 이력 아카이브를 사용하는 방법들
CN111083176B (zh) 一种监控摄像机云端自适应上线方法及装置
CN111190761B (zh) 日志输出方法、装置、存储介质及电子设备
CN107105100B (zh) 移动终端游戏的监控方法和系统
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
CN113568772A (zh) 一种中间件排查故障方法、装置、设备及可读存储介质
CN110399131B (zh) 提高应用程序稳定性的方法、装置、计算机设备
CN111147542A (zh) 一种免密访问的设置方法、装置、设备及介质
CN112181695A (zh) 异常应用处理方法、装置、服务器及存储介质
CN115567618A (zh) 一种多元视频协议的智能化适配方法及装置
CN114374627A (zh) 基板管理控制器重启的方法、装置、系统及服务器
CN112162897A (zh) 一种公用智能设备管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination