CN114647531B - 故障解决方法、故障解决系统、电子设备及存储介质 - Google Patents

故障解决方法、故障解决系统、电子设备及存储介质 Download PDF

Info

Publication number
CN114647531B
CN114647531B CN202210544345.8A CN202210544345A CN114647531B CN 114647531 B CN114647531 B CN 114647531B CN 202210544345 A CN202210544345 A CN 202210544345A CN 114647531 B CN114647531 B CN 114647531B
Authority
CN
China
Prior art keywords
fault
data
server
time points
backup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210544345.8A
Other languages
English (en)
Other versions
CN114647531A (zh
Inventor
陈立军
陈涛
钟楷锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Barda Technology Co.,Ltd.
Original Assignee
Wuhan Sitong Information Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Sitong Information Service Co ltd filed Critical Wuhan Sitong Information Service Co ltd
Priority to CN202210544345.8A priority Critical patent/CN114647531B/zh
Publication of CN114647531A publication Critical patent/CN114647531A/zh
Application granted granted Critical
Publication of CN114647531B publication Critical patent/CN114647531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本申请实施例提供一种故障解决方法、故障解决系统、电子设备及存储介质,该方法首先接收生产服务器发出的故障告警信号,故障告警信号携带故障类型,根据故障类型,确定备份服务器需要回溯的多个时间点,再将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据,再将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,最后将故障修复方案应用于生产服务器。本申请在不影响生产服务器中其他数据库正常工作过的前提下,从备份服务器中得到故障数据,再通过故障修复模型自动得到故障修复方案,用以解决生产服务器中的故障,提高了故障修复的效率和准确率。

Description

故障解决方法、故障解决系统、电子设备及存储介质
技术领域
本申请涉及智慧城市技术领域,具体涉及一种故障解决方法、故障解决系统、电子设备及存储介质。
背景技术
生产服务器在生产环境下工作时难免会出现一些故障,传统的故障解决方法是断开生产服务器中所有数据库的连接,即停止所有数据库对外服务,通过人工排除故障后数据库再继续提供对外服务。但是生产服务器发生故障往往是某一部分功能故障,发生故障的功能无法对外提供服务,其他功能可以继续使用的,传统的故障解决方法停止了生产服务器中所有数据库的对外服务,造成了资源的浪费,且传统的故障解决方法依赖人工进行故障排除,人工进行故障排除的方法不仅费时费力,而且需要专业的技术人员才能实现,由于涉及人工处理,很容易出现误操作,导致故障修复的效率和准确率都不高。
发明内容
本申请实施例提供一种故障解决方法、故障解决系统、电子设备及存储介质,可提高了故障修复的效率和准确率。
一方面,本申请实施例提供了一种故障解决方法,故障解决系统包括管理服务器、生产服务器和生产服务器对应的备份服务器,备份服务器实时备份生产服务器中的数据,故障解决方法应用于故障解决系统中的管理服务器,故障解决方法包括:
接收生产服务器发出的故障告警信号,故障告警信号携带故障类型;
根据故障类型,确定备份服务器需要回溯的多个时间点;
将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据;
将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案;
将故障修复方案应用于生产服务器。
可选地,在本申请一些可能的实现方式中,故障告警信号还携带业务类型,根据故障类型,确定备份服务器需要回溯的多个时间点,包括:
将故障类型和业务类型输入时间点确定模型,得到备份服务器需要回溯的多个时间点。
可选地,在本申请一些可能的实现方式中,在多个时间点的备份服务器中提取目标数据,包括:
对多个时间点的备份服务器中的数据进行数据快照;
基于预定规则,验证数据快照中数据的异常性;
提取数据快照中验证为异常的数据,作为目标数据。
可选地,在本申请一些可能的实现方式中,在多个时间点的备份服务器中提取目标数据,包括:
对多个时间点的备份服务器中的数据进行数据快照;
对数据快照中的数据进行关键词匹配;
将关键词匹配命中的数据提取,作为目标数据。
可选地,在本申请一些可能的实现方式中,在多个时间点的备份服务器中提取目标数据,包括:
对多个时间点的备份服务器中的数据进行数据快照;
对数据快照中的数据与故障类型进行匹配;
将故障类型匹配命中的数据提取,作为目标数据。
可选地,在本申请一些可能的实现方式中,将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,包括:
将多个时间点的备份服务器中提取的目标数据、以及故障类型输入故障修复模型,得到故障修复方案。
可选地,在本申请一些可能的实现方式中,将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,包括:
将多个时间点的备份服务器中提取的目标数据、故障类型和业务类型输入故障修复模型,得到故障修复方案。
一方面,本申请实施例还提供了一种故障解决系统,包括:管理服务器、生产服务器和生产服务器对应的备份服务器,备份服务器实时备份生产服务器中的数据,故障解决系统中的管理服务器执行上述的故障解决方法。
一方面,本申请实施例提供了一种电子设备,电子设备包括存储器,处理器及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述故障解决方法中的步骤。
一方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述故障解决方法中的步骤。
本申请实施例提供一种故障解决方法、故障解决系统、电子设备及存储介质,本申请中在接收到生产服务器发出故障告警信号时,在备份服务中回溯到多个时间点,在多个时间点的备份服务器中提取目标数据,而不需要断开生产服务器中其他数据库正常对外服务,提高了资源的利用率,且通过故障修复模型自动地得到故障修复方案,用于对生产服务器的故障修复,而不需要通过人工来进行故障排除,避免了人工误操作带来的数据损坏风险,提高了故障修复的效率和准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的故障解放方法的应用场景示意图。
图2是本申请实施例提供的故障解决方法的流程示意图。
图3是本申请实施例提供的故障解决系统的结构示意图。
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种故障解决方法、故障解决系统、电子设备及存储介质。本申请实施例提供的任一种解决系统方法,可以集成在故障解决系统的管理服务器中,故障解决系统包括管理服务器、生产服务器和生产服务器对应的备份服务器。生产服务器是指产生数据的服务器。例如人脸识别服务器,其从拍摄的图像中获取人脸数据并存储在其数据库中。备份服务器实时备份生产服务器中的数据。管理服务器是对生产服务器和备份服务器进行管理的服务器。其中,生产服务器处于生产环境、备份服务器处于备份环境,管理服务器、生产服务器和备份服务器可以是独立的服务器个体,还可以是服务器集群。
请参阅图1,是本申请实施例提供的故障解放方法的应用场景示意图。该应用场景中以Oracle数据库为例进行说明。其中,生产环境下的生产服务器中的Oracle数据库为主数据库,备份环境下的备份服务器中的Oracle数据库为备库,备份服务器实时备份生产服务器中的数据,即生产服务器中Oracle数据库的数据,与备份服务器中的Oracle数据库中的数据是同步的。在该应用场景中,只有一个Oracle数据库直接面向用户,为用户提供数据服务,如生产环境下的主数据库,需要注意的是,本申请实施例中是以Oracle数据库为例进行说明,在其他实施例中,还可以是任何数据库。
当生产服务器发生故障后,生产服务器向管理服务器发出故障告警信号,其中,故障告警信号携带故障类型,管理服务器接收到生产服务器发出的故障告警信号,根据故障类型,确定备份服务器需要回溯的多个时间点,再将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据,再将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,最后将故障修复方案应用于生产服务器。
需要说明的是,图1所示的故障解决系统的场景示意图仅仅是一个示例,本申请实施例描述的生产服务器、备份服务器以及管理服务器是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统的演变和新业务局景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
图2是本申请实施例提供的故障解决方法的流程示意图。如图2所示,该故障解决方法应用于故障解决系统的管理服务器中,该故障解决方法包括以下几个步骤:
步骤201、接收生产服务器发出的故障告警信号,故障告警信号携带故障类型。
在实际运行过程中生产服务器可能会发生各种故障,例如:系统无响应、系统通信中断、系统数据逻辑错误等,将生产服务器中可能发生的故障主要分为通信故障和非通信故障,其中,系统无响应、系统数据逻辑错误为非通信故障,系统通信中断为通信故障,当遇到这些故障时,生产服务器会发出故障告警信号,该故障告警信号携带故障的类型,例如当生产服务器的通信突然中断时,生产服务器出发出告警信号,该告警信号携带故障的类型为通信故障。
步骤202、根据故障类型,确定备份服务器需要回溯的多个时间点。
在通常情况下,系统中数据异常时不会立刻导致生产服务器的运行故障,因此,生产服务器不会在系统数据异常的同时发出故障告警信号,通常是系统中数据异常出现后,过一段时间生产服务器才会发出故障告警信号,由于管理服务器只能确认生产服务器发出告警信号的时间点,但是实际数据异常的点在告警信号时间点之前,由于无法判断数据异常的时间点的具体位置,因此,只能取多个时间点的数据进行作为可能的异常数据,从多个可能的异常数据中提取目标数据。
在一般情况下,通信故障事件的数据异常时间点到生产服务器发出故障信号的时间间隔很小,即通信类型的故障延迟时间很短,而非通信故障事件一般数据异常的时间到生产服务器发出告警信号的时间间隔,大于通信类型的故障延迟时间,因此,例如,通信类型的故障可以取告警信号对应的时间点之前n秒的n1个时间点的数据,而非通信类型的故障可以取告警信号对对应的时间点之前m分钟的任意m1个时间点的数据,其中,n、n1、m、m1的取值可以根据实际情况来确定,例如,故障告警信号对应的时间点为2022.4.22.9:05:30,若故障类型为通信故障,则可以取故障告警信号对应的时间点之前的5秒内的4个时间点,可以等间距取时间点,也可以任意间距取时间点,在此不做限定,多个时间点可以为:2022.4.22.9:05:25、2022.4.22.9:05:26、2022.4.22.9:05:27、2022.4.22.9:05:28、2022.4.22.9:05:29;若故障类型为非通信故障,则可以取故障告警信号对应的时间点之前的前5分钟中的4个时间点,可以等间距取时间点,也可以任意间距取时间点,在此不做限定,多个时间点可以为:2022.4.22.9:01:30、2022.4.22.9:02:30、2022.4.22.9:03:30、2022.4.22.9:04:30。
步骤203、将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据。
由于生产服务器产生告警信号可能是系统的某一部分功能故障,而其他的功能是正常的,而从生产服务中获取数据则需要切断生产服务器中所有数据库的对外服务,因此,为了保证生产服务器的其他正常数据库继续提供对外服务,可以在备份服务器的备库中获取多个时间点的数据,从多个时间点对应的数据中,得到目标数据,既不影响生产服务器其他功能,又能拿到生产服务器中的运行数据。
在实际场景中,可以通过闪回技术将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据。目标数据是指用于确定故障修复方案的数据。闪回技术主要作为oracle物理备份和恢复的一个补充,对数据库提供了另一层面的数据保护。可以通过闪回技术查看过去某一时刻数据的状态或者将数据库闪回而不需要还原(restore)数据库或进行时间点恢复。一般来说,闪回技术比介质恢复更加高效且对数据的影响程度更小。
在一种实施例中,可以通过人工从多个时间点数据中确定目标数据。
在一种实施例中,在多个时间点的备份服务器中提取目标数据,包括:对多个时间点的备份服务器中的数据进行数据快照;基于预定规则,验证数据快照中数据的异常性;提取数据快照中验证为异常的数据,作为目标数据。
数据快照是指在某一时间点某一设备中所有数据的信息描述。在实际场景中可以将逻辑错误,或者通信异常断开时的数据作为异常数据,若预定的规则将逻辑错误的数据确定为异常数据,则将通过逻辑样本对训练得到的逻辑识别模型来识别逻辑错误的数据,逻辑样本对包括正样本对和负样本对,其中正样本对是逻辑正常的数据快照,负样本对是逻辑错误的数据快照,若预定的规则将通信异常断开的数据确定为异常的数据,则将通过通信样本对训练得到的通信识别模型来识别通信异常断开错误的数据,通信样本对包括正样本对和负样本对,其中正样本是通信正常的数据快照,而负样本为通信异常断开的数据快照。由于规则验证比较高效,该方式提高了获得故障修改方案的速率。
在一种实施例中,在多个时间点的备份服务器中提取目标数据,包括:对多个时间点的备份服务器中的数据进行数据快照;对数据快照中的数据进行关键词匹配;将关键词匹配命中的数据提取,作为目标数据。
在实际情况中,系统运行异常时,运行数据中会产生警告或者提示,因此可以将警告词和提示词作为关键词,将数据快照中有上述关键词的数据作为目标数据,具体的告警词和提示词在此不做限定,具体实际情况进行选择。利用关键词的方式,能够针对不同修复需求设置不同关键词,提高了故障修改的灵活性。
在一种实施例中,在多个时间点的备份服务器中提取目标数据,包括:对多个时间点的备份服务器中的数据进行数据快照;对数据快照中的数据与故障类型进行匹配;将故障类型匹配命中的数据提取,作为目标数据。故障类型对比的方式,能够针对不同的故障类型得出不同修复方案,提高了修复的准确性。
由于不用类型的故障对应的故障数据不同,例如,通信故障一般对应的数据的异常断开,或者异常接入,而非通信故障中系统无响应,对应数据的逻辑错误,如故障类型为通信故障,则在数据快照中选择通信数据,将通信数据确定为目标数据,若故障类型为非通信故障,则在数据快照中选择非通信类型的数据确定为目标数据。
步骤204、将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案。
提取到目标数据后,可以将目标数据输入到故障修复模型,得到故障修复方案,其中故障修复模型是通过大量的样本对数据训练得到的,可以将大量生产服务器运行的故障数据作为深度神经网络的训练样本,同时获取标注的故障数据对应的修复方案,将训练样本输入到故障修复模型中,得到预测的故障修复方案,根据故障修复方案和标注的故障修复方案,采用深度学习方法进行迭代训练,直至故障修复模型收敛时,得到训练好的故障修复。
由于不同类型的故障对应的故障修复方案不同,因此可以将多个时间点的备份服务器中提取的目标数据和故障类型输入到故障修复模型中,得到故障修复方案,例如,故障类型为通信故障,则直接将目标数据和通信故障类型输入到故障修复模型中,得到故障修复方案;故障类型为非通信故障,则直接将目标数据输入和非通信故障类型输入到故障修复模型中,得到故障修复方案。
在一种实施例中,将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,包括:将多个时间点的备份服务器中提取的目标数据、以及故障类型输入故障修复模型,得到故障修复方案。
其中,故障修复模型是通过大量的样本数据进行训练得到的,可以将大量生产服务器故障时的故障数据和故障数据对应的故障类型,作为深度神经网络的训练样本,同时获取标注的故障数据和故障类型对应的故障修复方案,将训练样本输入到故障修复模型中,得到预测的故障修复方案,根据预测故障修复方案和标注的故障修复方案,采用深度学习方法进行迭代训练,直至故障修复模型收敛时,得到训练好的故障修复模型。
在一种实施例中,将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,包括:将多个时间点的备份服务器中提取的目标数据、故障类型和业务类型输入故障修复模型,得到故障修复方案。
由于实际场景中,不同的业务类型在发生不同的故障时,对故障的处理需要求不同,例如,银行的存取钱业务在进行时,发生了通信故障,这个时候很容易导致较大的经济损失,因此,此时需要断开存取钱业务,并及时处理故障,而当监控大厅的视频录像业务发生通信故障时,由于视频录像设备自身会有一部分的存储空间,因此,通信故障只会导致数据不能及时备份,但不影响视频录像业务的正常进行,因此,此时需要记录一个清除任务,提醒工作人员及时清除故障。
205:将故障修复方案应用于生产服务器。
最后将上述步骤中得到的故障修复方案应用于生产服务器进行故障修复。
本申请实施例提供一种故障解决方法,该方法首先接收生产服务器发出的故障告警信号,故障告警信号携带故障类型,根据故障类型,确定备份服务器需要回溯的多个时间点,再将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据,再将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,最后将故障修复方案应用于生产服务器。本申请在不影响生产服务器正常工作过的前提下,从备份服务器中得到故障数据,再通过故障修复模型自动得到故障修复方案,用以解决生产服务器中的故障,提高了故障修复的效率和准确率。
图3是本申请实施例提供的故障解决系统的结构示意图。该故障解决系统包括管理服务器、生产服务器和生产服务器对应的备份服务器,备份服务器实时备份生产服务器中的数据,生产服务器处于生产环境,备份服务器处于备份环境。
管理服务器用于接收生产服务器发出的故障告警信号,故障告警信号携带故障类型;根据故障类型,确定备份服务器需要回溯的多个时间点;将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据;将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案;将故障修复方案应用于生产服务器。
需要注意的是,上述每个服务器中,可以包括一个或者一个以上处理核心的处理器、一个或一个以上计算机可读存储介质的存储器、电源、射频电路等。在本实施例中,每个服务器中的处理器会按照如下的指令,将一个或一个以上的应用程序的线程对应的可执行文件加载到存储器中,并由处理器来运行存储在存储器中的应用程序,从而实现上述的各服务器所能完成的功能。
各服务器组合所形成的数据备份系统可以实现本申请实施例所提供的数据备份方法任一实施例中的步骤,因此,可以实现本申请实施例所提供的任一数据备份方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
相应的,本申请实施例还提供一种电子设备,如图4所示,该电子设备可以包括射频电路401、包括有一个或一个以上计算机可读存储介质的存储器402、输入单元403、显示单元404、传感器405、音频电路406、WiFi模块407、包括有一个或者一个以上处理核心的处理器408、以及电源409等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
射频电路401可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器408处理;另外,将涉及上行的数据发送给基站。存储器402可用于存储软件程序以及模块,处理器408通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。输入单元403可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
显示单元404可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。
电子设备还可包括至少一种传感器405,比如光传感器、运动传感器以及其他传感器。音频电路406包括扬声器,扬声器可提供用户与电子设备之间的音频接口。
WiFi属于短距离无线传输技术,电子设备通过WiFi模块407可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问,虽然图4示出了WiFi模块407,但是可以理解的是,其并不属于电子设备的必须构成,完全可以根据需要在不改变申请的本质的范围内而省略。
处理器408是电子设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对手机进行整体监控。
电子设备还包括给各个部件供电的电源409(比如电池),优选的,电源可以通过电源管理系统与处理器408逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,电子设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备中的处理器408会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器408来运行存储在存储器402中的应用程序,从而实现以下功能:
接收生产服务器发出的故障告警信号,故障告警信号携带故障类型;
根据故障类型,确定备份服务器需要回溯的多个时间点;
将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据;
将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案;
将故障修复方案应用于生产服务器。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文的详细描述,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以实现以下功能:
接收生产服务器发出的故障告警信号,故障告警信号携带故障类型;
根据故障类型,确定备份服务器需要回溯的多个时间点;
将备份服务器回溯到多个时间点,在多个时间点的备份服务器中提取目标数据;
将多个时间点的备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案;
将故障修复方案应用于生产服务器。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种故障解决方法中的步骤,因此,可以实现本申请实施例所提供的任一种故障解决方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种故障解决方法、故障解决系统、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的技术方案及其核心思想;本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例的技术方案的范围。

Claims (10)

1.一种故障解决方法,其特征在于,所述故障解决方法应用于故障解决系统中的管理服务器,所述故障解决系统包括所述管理服务器、生产服务器和所述生产服务器对应的备份服务器,所述备份服务器实时备份所述生产服务器中的数据,所述故障解决方法包括:
接收所述生产服务器发出的故障告警信号,所述故障告警信号携带故障类型;
根据所述故障类型,确定备份服务器需要回溯的多个时间点;
将所述备份服务器回溯到所述多个时间点,在所述多个时间点的所述备份服务器中提取目标数据;
将所述多个时间点的所述备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案;
将所述故障修复方案应用于所述生产服务器。
2.根据权利要求1所述的故障解决方法,其特征在于,所述故障告警信号还携带业务类型,所述根据所述故障类型,确定备份服务器需要回溯的多个时间点,包括:
将所述故障类型和所述业务类型输入时间点确定模型,得到所述备份服务器需要回溯的多个时间点。
3.根据权利要求1所述的故障解决方法,其特征在于,所述在所述多个时间点的所述备份服务器中提取目标数据,包括:
对所述多个时间点的所述备份服务器中的数据进行数据快照;
基于预定规则,验证所述数据快照中数据的异常性;
提取所述数据快照中验证为异常的数据,作为所述目标数据。
4.根据权利要求1所述的故障解决方法,其特征在于,所述在所述多个时间点的所述备份服务器中提取目标数据,包括:
对所述多个时间点的所述备份服务器中的数据进行数据快照;
对所述数据快照中的数据进行关键词匹配;
将关键词匹配命中的数据提取,作为目标数据。
5.根据权利要求1所述的故障解决方法,其特征在于,所述在所述多个时间点的所述备份服务器中提取目标数据,包括:
对所述多个时间点的所述备份服务器中的数据进行数据快照;
对所述数据快照中的数据与所述故障类型进行匹配;
将故障类型匹配命中的数据提取,作为目标数据。
6.根据权利要求1所述的故障解决方法,其特征在于,所述将所述多个时间点的所述备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,包括:
将所述多个时间点的所述备份服务器中提取的目标数据、以及所述故障类型输入故障修复模型,得到故障修复方案。
7.根据权利要求2所述的故障解决方法,其特征在于,所述将所述多个时间点的所述备份服务器中提取的目标数据输入故障修复模型,得到故障修复方案,包括:
将所述多个时间点的所述备份服务器中提取的目标数据、所述故障类型和所述业务类型输入故障修复模型,得到故障修复方案。
8.一种故障解决系统,其特征在于,所述故障解决系统包括管理服务器、生产服务器和所述生产服务器对应的备份服务器,所述备份服务器实时备份所述生产服务器中的数据,所述故障解决系统中的所述管理服务器执行上述权利要求1至7任一项所述的故障解决方法。
9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的故障解决方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现上述权利要求1至7任一种所述的故障解决方法中的步骤。
CN202210544345.8A 2022-05-19 2022-05-19 故障解决方法、故障解决系统、电子设备及存储介质 Active CN114647531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210544345.8A CN114647531B (zh) 2022-05-19 2022-05-19 故障解决方法、故障解决系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210544345.8A CN114647531B (zh) 2022-05-19 2022-05-19 故障解决方法、故障解决系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114647531A CN114647531A (zh) 2022-06-21
CN114647531B true CN114647531B (zh) 2022-07-29

Family

ID=81997803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210544345.8A Active CN114647531B (zh) 2022-05-19 2022-05-19 故障解决方法、故障解决系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114647531B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116662101B (zh) * 2022-10-28 2024-04-12 荣耀终端有限公司 电子设备的故障修复方法和电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6359625A (ja) * 1986-08-30 1988-03-15 Toshiba Corp 前向き推論システム
WO2006127404A2 (en) * 2005-05-20 2006-11-30 Computer Associates Think, Inc. Method and apparatus for storage backup
CN103778031A (zh) * 2014-01-15 2014-05-07 华中科技大学 一种云环境下的分布式系统多级故障容错方法
CN104935464A (zh) * 2015-06-12 2015-09-23 北京奇虎科技有限公司 一种网站系统的故障预警方法和装置
CN110414591A (zh) * 2019-07-24 2019-11-05 腾讯科技(武汉)有限公司 一种数据处理方法以及设备
CN111478798A (zh) * 2020-03-18 2020-07-31 华为技术有限公司 故障处理方法、故障处理的装置和存储介质
CN112131033A (zh) * 2020-09-18 2020-12-25 苏州浪潮智能科技有限公司 一种服务器故障修复方法、装置、设备及存储介质
CN112711596A (zh) * 2019-10-24 2021-04-27 阿里巴巴集团控股有限公司 多副本数据库系统、数据处理方法、电子设备以及计算机可读存储介质
CN113808299A (zh) * 2021-09-14 2021-12-17 中国第一汽车股份有限公司 基于故障系统的车辆故障快照存储方法、装置及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210034477A1 (en) * 2019-08-01 2021-02-04 Teradata Us, Inc. Transaction recovery from a failure associated with a database server

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6359625A (ja) * 1986-08-30 1988-03-15 Toshiba Corp 前向き推論システム
WO2006127404A2 (en) * 2005-05-20 2006-11-30 Computer Associates Think, Inc. Method and apparatus for storage backup
CN103778031A (zh) * 2014-01-15 2014-05-07 华中科技大学 一种云环境下的分布式系统多级故障容错方法
CN104935464A (zh) * 2015-06-12 2015-09-23 北京奇虎科技有限公司 一种网站系统的故障预警方法和装置
CN110414591A (zh) * 2019-07-24 2019-11-05 腾讯科技(武汉)有限公司 一种数据处理方法以及设备
CN112711596A (zh) * 2019-10-24 2021-04-27 阿里巴巴集团控股有限公司 多副本数据库系统、数据处理方法、电子设备以及计算机可读存储介质
CN111478798A (zh) * 2020-03-18 2020-07-31 华为技术有限公司 故障处理方法、故障处理的装置和存储介质
CN112131033A (zh) * 2020-09-18 2020-12-25 苏州浪潮智能科技有限公司 一种服务器故障修复方法、装置、设备及存储介质
CN113808299A (zh) * 2021-09-14 2021-12-17 中国第一汽车股份有限公司 基于故障系统的车辆故障快照存储方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
商业银行金融信息系统稳定性策略研究;王刚;《河南科技》;20140331(第6期);第19-20页 *

Also Published As

Publication number Publication date
CN114647531A (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN103428333B (zh) 移动终端、服务器和错误修复方法
CN114647531B (zh) 故障解决方法、故障解决系统、电子设备及存储介质
CN110275992A (zh) 应急处理方法、装置、服务器及计算机可读存储介质
CN107679423A (zh) 分区完整性检查方法及装置
CN105224416B (zh) 修复方法及相关电子装置
CN111367934A (zh) 数据一致性的检验方法、装置、服务器和介质
CN115098294B (zh) 异常事件的处理方法、电子设备及管理终端
CN110968456B (zh) 分布式存储系统中故障磁盘的处理方法及装置
CN116089197A (zh) 一种故障设备切换演练方法、装置、设备及存储介质
CN113986618B (zh) 集群脑裂自动修复方法、系统、装置及存储介质
CN113300913B (zh) 一种设备测试方法、装置、测试设备及存储介质
CN114650211A (zh) 故障修复方法、装置、电子设备和计算机可读存储介质
CN115099819A (zh) 数据推送的方法、装置、存储介质及电子设备
CN114116288A (zh) 故障处理方法、装置及计算机程序产品
CN107783852B (zh) 一种dump文件生成方法及终端
CN111835566A (zh) 一种系统故障管理方法、装置及系统
CN117033084B (zh) 虚拟机备份方法、装置、电子设备及存储介质
US11953995B1 (en) Centralized data backup platform supporting multiple data environments
CN109218129A (zh) 一种基于日志的升级检测方法、装置、存储器及设备
CN114401275B (zh) 云手机数据备份及还原方法、装置、电子设备及存储介质
CN115344327B (zh) 应用模块的切换方法、装置、电子设备及可读存储介质
CN112882908B (zh) 用于生成信息的方法和装置
CN106789211A (zh) 一种网络管理系统及管理方法
CN116485363A (zh) 故障处理方法、装置、电子设备及计算机存储介质
CN115840678A (zh) 应用自动巡检方法、装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 430070 No. 1, 2 and 10, floors 1-3, building A7, Rongke Zhigu industrial project phase I, No. 555, Wenhua Avenue, Hongshan District, Wuhan City, Hubei Province

Patentee after: Wuhan Barda Technology Co.,Ltd.

Address before: 430070 No. 1, 2 and 10, floors 1-3, building A7, Rongke Zhigu industrial project phase I, No. 555, Wenhua Avenue, Hongshan District, Wuhan City, Hubei Province

Patentee before: Wuhan Sitong Information Service Co.,Ltd.