CN115629846A - 基于深度学习的虚拟机蓝屏故障控制方法及控制系统 - Google Patents

基于深度学习的虚拟机蓝屏故障控制方法及控制系统 Download PDF

Info

Publication number
CN115629846A
CN115629846A CN202211638298.XA CN202211638298A CN115629846A CN 115629846 A CN115629846 A CN 115629846A CN 202211638298 A CN202211638298 A CN 202211638298A CN 115629846 A CN115629846 A CN 115629846A
Authority
CN
China
Prior art keywords
virtual machine
fault
state
deep learning
running state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211638298.XA
Other languages
English (en)
Inventor
朱历基
梁永堂
韩帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Eflycloud Computing Co Ltd
Original Assignee
Guangdong Eflycloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Eflycloud Computing Co Ltd filed Critical Guangdong Eflycloud Computing Co Ltd
Priority to CN202211638298.XA priority Critical patent/CN115629846A/zh
Publication of CN115629846A publication Critical patent/CN115629846A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及虚拟机蓝屏故障技术领域,涉及一种基于深度学习的虚拟机蓝屏故障控制方法及控制系统,方法包括:在虚拟机在启动时触发虚拟机的运行状态参数的采集,并且对虚拟机的运行状态参数与状态标记输入深度学习模型进行训练,并优化深度学习模型,采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态,在虚拟机运行状态的预测结果为故障时,则确认当前的虚拟机是否处于故障状态,若当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,从而将预存的正常文件替换损坏的系统文件,并消除损坏的系统文件对虚拟机的影响,避免故障时才进行蓝屏检测程序和故障软件的安装。

Description

基于深度学习的虚拟机蓝屏故障控制方法及控制系统
技术领域
本发明涉及虚拟机蓝屏故障技术领域,尤其涉及一种基于深度学习的虚拟机蓝屏故障控制方法及控制系统。
背景技术
随着科技的发展,虚拟机是指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统,虚拟机广泛应用于各计算机或服务器中。
在现有技术中,虚拟机在运行过程中会因为故障而呈现蓝屏现象,在虚拟机发生蓝屏现象时,操作者需要将外置的软件磁盘输入至计算机,并在虚拟机中运行对应的蓝屏检测程序和故障软件的安装,待蓝屏检测程序和故障软件安装完成时,待蓝屏检测程序和故障软件才对计算机的故障文件进行修正,导致现有的虚拟机在发生故障时的没有及时修正。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于深度学习的虚拟机蓝屏故障控制方法及控制系统,在虚拟机在启动时触发虚拟机的运行状态参数的采集,并且对虚拟机的运行状态参数与状态标记输入深度学习模型进行训练,采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态,在虚拟机运行状态的预测结果为故障时,则确认当前的虚拟机是否处于故障状态,若当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件,并消除故障文件对虚拟机的影响,避免在虚拟机发生故障时才进行蓝屏检测程序和故障软件的安装,保证虚拟机在发生故障时的及时修正,以及虚拟机在启动状态时的实时监控和深度学习模型的优化。
为了解决上述技术问题,本发明提供了一种基于深度学习的虚拟机蓝屏故障控制方法,包括:获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集;对所采集的运行状态参数标记对应的正常状态或故障状态;将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型;采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态;若预测的虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态;若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件。
另外,本发明还提供了一种基于深度学习的虚拟机蓝屏故障控制系统,所述基于深度学习的虚拟机蓝屏故障控制系统包括:获取模块:用于获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集;标记模块:用于对所采集的运行状态参数标记对应的正常状态或故障状态;训练模块:用于将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型;预测模块:用于采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态;故障模块:用于若预测的虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态;替换模块:若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件。
在本发明中,通过本发明中的方法,在虚拟机在启动时触发虚拟机的运行状态参数的采集,并且对虚拟机的运行状态参数与状态标记输入深度学习模型进行训练,并优化深度学习模型,采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态,在虚拟机运行状态的预测结果为故障时,则确认当前的虚拟机是否处于故障状态,若当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件,并消除故障文件对虚拟机的影响,避免在虚拟机发生故障时才进行蓝屏检测程序和故障软件的安装,保证虚拟机在发生故障时的及时修正,以及虚拟机在启动状态时的实时监控和深度学习模型的优化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制方法的流程示意图;
图2是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制方法的监控对应的状态的流程示意图;
图3是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制方法的预测虚拟机的运行状态的流程示意图;
图4是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制方法的优化深度学习模型的流程示意图;
图5是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制方法的故障文件的替换的流程示意图;
图6是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制系统的结构组成示意图;
图7是根据一示例性实施例示出的一种电子装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
请参阅图1至图5,一种基于深度学习的虚拟机蓝屏故障控制方法,方法包括:
S11:获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集;
在本发明具体实施过程中,具体的步骤可以为:在虚拟机被启动时,获取虚拟机的启动信号;基于虚拟机的启动信号确定虚拟机处于启动状态;触发虚拟机的运行状态参数的采集,并且在虚拟机处于启动状态时开始虚拟机的运行状态参数的采集;其中,虚拟机的运行状态参数的采集按照预设时间或者频率进行采集。
S12:对所采集的运行状态参数标记对应的正常状态或故障状态;
在本发明具体实施过程中,具体的步骤可以为:
S121:对所采集的运行状态参数监控虚拟机对应的状态,根据所述虚拟机对应的状态对所采集的运行状态参数标记对应的正常状态或故障状态。
比如:当虚拟机正常运行时,按一定频率对该虚拟机运行状态参数进行采样,并将采样数据标记为“正常”状态。当虚拟机发生蓝屏故障,按一定频率对该虚拟机运行状态参数进行采样,并将采样数据标记为“故障”状态。
S13:将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型;
其中,将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型,深度学习模型由以往的运行状态参数和对应的状态标记进行训练而成,并且作为学习模型的一种,以往的运行状态参数和对应的状态标记输入至学习模型进行训练,并且形成深度学习模型。
S14:采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态。
在本发明具体实施过程中,具体的步骤可以为:
S141:采集虚拟机当前的运行状态参数;
S142:将当前的运行状态参数输入至训练后的深度学习模型,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态。
S15:若预测的虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态。
在本发明具体实施过程中,具体的步骤可以为:
S151:若虚拟机运行状态为故障时,则触发故障预警,并确认当前的虚拟机是否处于故障状态;
S152:若核实虚拟机蓝屏故障,则进入S16对蓝屏故障进行处理;若核实虚拟机非蓝屏故障(即预测结果有误),则将本次的运行状态参数与状态标记加入训练集以扩展训练样本再进行训练。
S16:若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件。
在本发明具体实施过程中,具体的步骤可以为:
S161:当前的虚拟机处于故障状态,则根据虚拟机正常运行时的状态参数、蓝屏时的状态参数、虚拟机蓝屏故障代码和虚拟机操作系统日志,定位虚拟机损坏的系统文件;
由于使用虚拟机当前的运行状态参数预测虚拟机运行状态为故障,并且核实当前的虚拟机处于故障状态,因此,步骤S161中蓝屏时的状态参数即为当前的运行状态参数。
S162:根据虚拟机损坏的系统文件从Windows ISO镜像中确定预存的正常文件,并将损坏的系统文件替换为预存的正常文件。
其中,故障文件可以为存在故障的文件或者损坏的系统。
在实际过程中,阶段一:数据采集和深度学习模型训练。
1.1开启虚拟机,使虚拟机处于运行状态中;
1.2当虚拟机正常运行时,按一定频率对虚拟机运行状态参数进行采样,例如10分钟/次,采样30天;并将采样数据和标记正常输入到深度学习模型训练;
1.3当虚拟机发生蓝屏故障,按一定频率对虚拟机运行状态参数进行采样,例如10分钟/次,采样30天;并将采样数据和标记蓝屏输入到深度学习模型训练。
阶段二:模型预测和预测模型持续修正
2.1 对处于运行状态中的虚拟机,按一定频率对虚拟机运行状态参数进行采样,例如10分钟/次。
2.2 将采样数据输入到阶段一的深度学习模型,对虚拟机运行状态进行预测。
2.3 当预测结果为蓝屏时发出告警。若核实虚拟机蓝屏,则进入阶段三对蓝屏故障处理;若核实虚拟机非蓝屏(即预测结果有误),则将本次采样数据标记修改为正常加入到深度学习模型训练集以扩展训练样本再进行训练。
2.4 重复上述2.1到2.3步骤。
2.5 随着时间的增长,采样数据的增加和错误数据的不断修正,模型预测准确率逐步提升。
阶段三:虚拟机蓝屏故障处理
3.1 根据虚拟机正常运行时的状态参数、蓝屏时状态参数、虚拟机蓝屏故障代码和虚拟机系统日志,定位虚拟机损坏的系统文件。
3.2 根据虚拟机损坏的系统文件从Windows ISO镜像中确定预存的正常文件,并将损坏的系统文件替换为预存的正常文件,然后重启虚拟机。
3.3 若重启后虚拟机恢复正常,蓝屏故障处理完成。否则重复上述3.1和3.2步骤。
此时,虚拟机无需安装或运行蓝屏检测程序或agent,适用于虚拟机不能安装蓝屏检测程序或agent的场景;虚拟机无需安装或运行故障检测程序或agent,减少虚拟机性能损耗;使用了深度学习模型对虚拟机蓝屏故障进行预测,能提前预测虚拟机蓝屏发生,提前进行告警和处理--提前预测,及时修正,自动学习;能自动定位虚拟机蓝屏故障文件,并通过对故障文件替换实现虚拟机蓝屏故障自动快速修复。
在本发明实施例中,通过本发明实施例中的方法,在虚拟机在启动时触发虚拟机的运行状态参数的采集,并且对虚拟机的运行状态参数与状态标记输入深度学习模型进行训练,并优化深度学习模型,深度学习模型基于运行状态参数与状态标记预测虚拟机运行状态,在虚拟机运行状态的预测结果为故障时,则确认当前的虚拟机是否处于故障状态,若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件,从而将预存的正常文件替换故障文件,并消除故障文件对虚拟机的影响,避免在虚拟机发生故障时才进行蓝屏检测程序和故障软件的安装,保证虚拟机在发生故障时的及时修正,以及虚拟机在启动状态时的实时监控和深度学习模型的优化。
实施例二
请参阅图6,图6是本发明实施例中的基于深度学习的虚拟机蓝屏故障控制系统的结构组成示意图。
如图6所示,一种基于深度学习的虚拟机蓝屏故障控制系统,所述基于深度学习的虚拟机蓝屏故障控制系统包括:
获取模块21:用于获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集;
标记模块22:用于对所采集的运行状态参数标记对应的正常状态或故障状态;
训练模块23:用于将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型;
预测模块24:用于深度学习模型基于运行状态参数与状态标记预测虚拟机运行状态;
故障模块25:用于若虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态;
替换模块26:用于若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件。
在本发明实施例中,控制系统的各个模块能够实现实施一的控制方法,此处不再一一赘述;通过本发明实施例中的系统,在虚拟机在启动时触发虚拟机的运行状态参数的采集,并且对虚拟机的运行状态参数与状态标记输入深度学习模型进行训练,并优化深度学习模型,深度学习模型基于运行状态参数与状态标记预测虚拟机运行状态,在虚拟机运行状态的预测结果为故障时,则确认当前的虚拟机是否处于故障状态,若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件,从而将预存的正常文件替换故障文件,并消除故障文件对虚拟机的影响,避免在虚拟机发生故障时才进行蓝屏检测程序和故障软件的安装,保证虚拟机在发生故障时的及时修正,以及虚拟机在启动状态时的实时监控和深度学习模型的优化。
实施例三
请参阅图7,下面参照图7来描述根据本发明的这种实施方式的电子设备40。图7显示的电子设备40仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备40以通用计算设备的形式表现。电子设备40的组件可以包括但不限于:上述至少一个处理单元41、上述至少一个存储单元42、连接不同系统组件(包括存储单元42和处理单元41)的总线43。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元41执行,使得所述处理单元41执行本说明书上述实施例中的基于深度学习的虚拟机蓝屏故障控制方法的各种示例性实施方式的步骤部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元42可以包括易失性存储单元形式的可读介质,例如RAM421和/或高速缓存存储单元422,还可以进一步包括ROM423。
存储单元42还可以包括具有一组(至少一个)程序模块425的程序/实用工具424,这样的程序模块425包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线43可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备40也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备40交互的设备通信,和/或与使得该电子设备40能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口44进行。并且,电子设备40还可以通过网络适配器45与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器45通过总线43与电子设备40的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备40使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnly Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。并且,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据上述的方法。
另外,以上对本发明实施例所提供的基于深度学习的虚拟机蓝屏故障控制方法及控制系统进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种基于深度学习的虚拟机蓝屏故障控制方法,其特征在于,包括:
获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集;
对所采集的运行状态参数标记对应的正常状态或故障状态;
将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型;
采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态;
若预测的虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态;
若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件。
2.根据权利要求1所述的基于深度学习的虚拟机蓝屏故障控制方法,其特征在于,所述获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集,包括:
在虚拟机被启动时,获取虚拟机的启动信号;
基于虚拟机的启动信号确定虚拟机处于启动状态;
触发虚拟机的运行状态参数的采集,并且在虚拟机处于启动状态时开始虚拟机的运行状态参数的采集;
其中,虚拟机的运行状态参数的采集按照预设时间或者频率进行采集。
3.根据权利要求2所述的基于深度学习的虚拟机蓝屏故障控制方法,其特征在于,所述对所采集的运行状态参数标记对应的正常状态或故障状态,包括:
对所采集的运行状态参数监控虚拟机对应的状态,根据所述虚拟机对应的状态对所采集的运行状态参数标记对应的正常状态或故障状态。
4.根据权利要求3所述的基于深度学习的虚拟机蓝屏故障控制方法,其特征在于,所述采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态,包括:
采集虚拟机当前的运行状态参数;
将当前的运行状态参数输入至训练后的深度学习模型,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态。
5.根据权利要求4所述的基于深度学习的虚拟机蓝屏故障控制方法,其特征在于,所述若预测的虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态,包括:
若预测的虚拟机运行状态为故障时,则触发故障预警,并确认当前的虚拟机是否处于故障状态;
在当前的虚拟机的工作状态与训练后的深度学习模型的预测结果不一致时,标记所述当前的运行状态参数为正常状态,将所述当前的运行状态参数与其状态标记加入训练集以扩展训练样本再对训练后的深度学习模型进行训练。
6.根据权利要求5所述的基于深度学习的虚拟机蓝屏故障控制方法,其特征在于,所述若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件,包括:
若核实当前的虚拟机处于故障状态,则根据虚拟机正常运行时的状态参数、所述当前的运行状态参数、虚拟机蓝屏故障代码和虚拟机操作系统日志,定位虚拟机损坏的系统文件;根据虚拟机损坏的系统文件从Windows ISO镜像中确定预存的正常文件,并将损坏的系统文件替换为预存的正常文件。
7.一种基于深度学习的虚拟机蓝屏故障控制系统,其特征在于,所述基于深度学习的虚拟机蓝屏故障控制系统包括:
获取模块:用于获取虚拟机的启动信号,并触发虚拟机的运行状态参数的采集;
标记模块:用于对所采集的运行状态参数标记对应的正常状态或故障状态;
训练模块:用于将运行状态参数与状态标记输入至深度学习模型,并进行深度学习模型训练,得到训练后的深度学习模型;
预测模块:用于采集虚拟机当前的运行状态参数,使用训练后的深度学习模型基于当前的运行状态参数预测虚拟机运行状态;
故障模块:用于若预测的虚拟机运行状态为故障时,则确认当前的虚拟机是否处于故障状态;
替换模块:用于若核实当前的虚拟机处于故障状态,则定位虚拟机损坏的系统文件,并将损坏的系统文件替换为预存的正常文件。
CN202211638298.XA 2022-12-20 2022-12-20 基于深度学习的虚拟机蓝屏故障控制方法及控制系统 Pending CN115629846A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211638298.XA CN115629846A (zh) 2022-12-20 2022-12-20 基于深度学习的虚拟机蓝屏故障控制方法及控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211638298.XA CN115629846A (zh) 2022-12-20 2022-12-20 基于深度学习的虚拟机蓝屏故障控制方法及控制系统

Publications (1)

Publication Number Publication Date
CN115629846A true CN115629846A (zh) 2023-01-20

Family

ID=84911232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211638298.XA Pending CN115629846A (zh) 2022-12-20 2022-12-20 基于深度学习的虚拟机蓝屏故障控制方法及控制系统

Country Status (1)

Country Link
CN (1) CN115629846A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309768A (zh) * 2012-03-16 2013-09-18 腾讯科技(深圳)有限公司 系统文件修复方法和装置
CN103885863A (zh) * 2012-12-24 2014-06-25 腾讯科技(深圳)有限公司 系统故障的处理方法及虚拟机
US20190391573A1 (en) * 2018-06-22 2019-12-26 Siemens Industry, Inc. Deep-learning-based fault detection in building automation systems
US20220172100A1 (en) * 2020-11-27 2022-06-02 Amazon Technologies, Inc. Feedback-based training for anomaly detection
US20220255817A1 (en) * 2021-02-09 2022-08-11 POSTECH Research and Business Development Foundation Machine learning-based vnf anomaly detection system and method for virtual network management

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309768A (zh) * 2012-03-16 2013-09-18 腾讯科技(深圳)有限公司 系统文件修复方法和装置
CN103885863A (zh) * 2012-12-24 2014-06-25 腾讯科技(深圳)有限公司 系统故障的处理方法及虚拟机
US20190391573A1 (en) * 2018-06-22 2019-12-26 Siemens Industry, Inc. Deep-learning-based fault detection in building automation systems
US20220172100A1 (en) * 2020-11-27 2022-06-02 Amazon Technologies, Inc. Feedback-based training for anomaly detection
US20220255817A1 (en) * 2021-02-09 2022-08-11 POSTECH Research and Business Development Foundation Machine learning-based vnf anomaly detection system and method for virtual network management

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王开放,等: "云计算环境下虚拟机故障预测" *

Similar Documents

Publication Publication Date Title
EP3121726B1 (en) Fault processing method, related device and computer
CN111694687A (zh) 一种车辆软件故障检测方法、装置、设备及存储介质
CN111459692A (zh) 用于预测驱动器故障的方法、设备和计算机程序产品
CN117909160B (zh) 基于物联网的固件崩溃分析方法及装置
CN110333964B (zh) 异常日志处理方法及装置、电子设备、存储介质
CN118113508A (zh) 网卡故障风险预测方法、装置、设备及介质
CN116089231A (zh) 一种故障告警方法、装置、电子设备及存储介质
CN112231128B (zh) 内存错误处理方法、装置、计算机设备和存储介质
CN115629846A (zh) 基于深度学习的虚拟机蓝屏故障控制方法及控制系统
JP2008176353A (ja) 情報処理装置及びログ取得方法並びにプログラム
CN113626227A (zh) 一种异常日志信息上报方法、智能终端及存储介质
CN115904698A (zh) 使用yaml格式文件对opc ua架构的管理方法
CN115392802A (zh) 工业产品的缺陷检测方法、系统、介质及设备
CN112131090B (zh) 业务系统性能监控方法及装置、设备及介质
CN112799957A (zh) 基于用户行为的故障处理方法、系统、设备和介质
CN113110958A (zh) 一种基于智能电力终端系统文件校验方法
US20220398143A1 (en) Network monitoring apparatus, method, and program
CN118295864B (zh) 一种Linux操作系统硬件错误识别方法及系统
CN109189599B (zh) 一种提高scada系统实时数据转储稳定性的方法和装置
CN113485688B (zh) 代码补全方法、装置、存储介质与电子设备
KR100953695B1 (ko) 컴퓨터 시스템의 네트워크에서 발생하는 오류를 복구하는장치 및 방법
CN117312174B (zh) 一种程序错误路径检测方法、装置、设备及可读存储介质
CN117472474B (zh) 配置空间调试方法、系统、电子设备及存储介质
CN115878362A (zh) 一种操作系统异常定位方法、装置、设备及存储介质
CN116974891A (zh) 控制方法、装置、相关设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20230120