CN116743546A - 云桌面的故障检测方法、装置、服务器和云桌面系统 - Google Patents

云桌面的故障检测方法、装置、服务器和云桌面系统 Download PDF

Info

Publication number
CN116743546A
CN116743546A CN202310845079.7A CN202310845079A CN116743546A CN 116743546 A CN116743546 A CN 116743546A CN 202310845079 A CN202310845079 A CN 202310845079A CN 116743546 A CN116743546 A CN 116743546A
Authority
CN
China
Prior art keywords
fault
cloud desktop
cloud
desktop system
fault detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310845079.7A
Other languages
English (en)
Inventor
戚世雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Leifeng Electronic Technology Co ltd
Original Assignee
Xi'an Leifeng Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Leifeng Electronic Technology Co ltd filed Critical Xi'an Leifeng Electronic Technology Co ltd
Priority to CN202310845079.7A priority Critical patent/CN116743546A/zh
Publication of CN116743546A publication Critical patent/CN116743546A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/08Protocols specially adapted for terminal emulation, e.g. Telnet

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供一种云桌面的故障检测方法、装置、服务器和云桌面系统,获取云桌面系统的性能指标数据,将其输入至训练完成的故障检测模型,得到故障判断结果,从而快速确定当前云桌面系统是否存在故障。在云桌面系统存在故障的情况下,获取故障相关信息,根据获取到的故障相关信息,得到故障类型,可以发送包含该故障类型的告警信息,提醒用户根据故障类型及时处理故障。通过持续的对云桌面系统的监控和数据分析,将云桌面与人工智能相结合,能够自动、及时、快速发现云桌面系统中的故障,并且快速确定出故障类型,提高云桌面系统的稳定性和可靠性,利于用户及时快速排查和解决故障,提高故障检测的准确性和效率,保证云桌面系统的正常运行。

Description

云桌面的故障检测方法、装置、服务器和云桌面系统
技术领域
本公开涉及云桌面技术领域,尤其涉及云桌面的故障检测方法、装置、服务器和云桌面系统。
背景技术
云桌面,例如,智能桌面虚拟化(Intelligent Desktop Virtualization,简称IDV)云桌面,和虚拟桌面基础架构虚拟桌面基础架构(Virtual Desktop Infrastructure,简称VDI)下所有桌面。
云桌面的计算资源高度集中在数据中心,界面发送至的终端设备不同。IDV采取更多的是分布式方法来满足运营技术需求,同时集中简化管理和部署功能。VDI通常带来的显著挑战包括前期成本、存储相关的技术挑战、不确定的TCO以及很多情况下对网络的依赖,使得脱机使用变得困难。此外,由于消耗大量带宽资源的外围设备能暴露出低带宽下出现的问题,因此VDI对各种可用外围设备存有某些限制。
云桌面可能会出现软硬件故障,如果不能及时处理,云桌面将无法正常工作。
发明内容
本公开实施例提供一种云桌面的故障检测方法、装置、服务器和云桌面系统,能够解决云桌面系统出现故障不能及时处理的问题。所述技术方案如下:
根据本公开实施例的第一方面,提供一种云桌面的故障检测方法,该方法包括:
获取云桌面系统的性能指标数据;
将所述云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;所述故障判断结果用于指示云桌面系统是否存在故障;
若所述故障判断结果是云桌面系统存在故障,则获取故障相关信息;
根据所述故障相关信息,得到故障类型;
发送告警信息,所述告警信息包括所述故障类型。
在一个实施例中,所述云桌面系统的性能指标数据包括云终端的CPU利用率、云终端的内存使用量、网络延迟时间、云终端的磁盘空间使用率和日志信息中的至少一种;
所述故障相关信息包括错误代码、异常日志和系统日志中的至少一种;
所述故障类型包括软件错误、硬件故障、网络问题中的至少一种。
在一个实施例中,所述获取故障相关信息之后,还包括:
根据所述故障相关信息,生成故障解决方案,所述故障解决方案中包含解决故障的操作方法和注意事项;所述告警信息中还包括所述故障解决方案。
在一个实施例中,所述故障解决方案包括修复软件错误、更换故障硬件和调整网络设置中的至少一种。
在一个实施例中,所述获取云桌面系统的性能指标数据,包括:
实时采集云桌面系统的性能指标数据;
或者,周期性采集云桌面系统的性能指标数据。
在一个实施例中,所述方法还包括:
获取原始性能指标训练数据;
对所述原始性能指标训练数据依次进行数据清洗操作、特征提取操作和预处理操作,得到训练集和测试集;
使用所述训练集对预先建立的故障检测模型进行训练,直到得到收敛的故障检测模型;
使用测试集对所述收敛的故障检测模型进行效果评估,得到效果评估结果;
若所述效果评估结果指示所述收敛的故障检测模型合格,确定所述收敛的故障检测模型为训练完成的故障检测模型。
根据本公开实施例的第二方面,提供一种云桌面的故障检测装置,包括:
获取模块,用于获取云桌面系统的性能指标数据;
故障检测模块,用于将所述云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;所述故障判断结果用于指示云桌面系统是否存在故障;若所述故障判断结果是云桌面系统存在故障,则获取故障相关信息;根据所述故障相关信息,得到故障类型;发送告警信息,所述告警信息包括所述故障类型。
在一个实施例中,所述云桌面系统的性能指标数据包括云终端的CPU利用率、云终端的内存使用量、网络延迟时间、云终端的磁盘空间使用率和日志信息中的至少一种;
所述故障相关信息包括错误代码、异常日志和系统日志中的至少一种;
所述故障类型包括软件错误、硬件故障、网络问题中的至少一种。
在一个实施例中,所述装置还包括:
解决方案生成模块,用于根据所述故障相关信息,生成故障解决方案,所述故障解决方案中包含解决故障的操作方法和注意事项;所述告警信息中还包括所述故障解决方案。
在一个实施例中,所述故障解决方案包括修复软件错误、更换故障硬件和调整网络设置中的至少一种。
在一个实施例中,所述获取模块具体用于:
实时采集云桌面系统的性能指标数据;
或者,周期性采集云桌面系统的性能指标数据。
在一个实施例中,所述装置还包括:
训练模块,用于获取原始性能指标训练数据;对所述原始性能指标训练数据依次进行数据清洗操作、特征提取操作和预处理操作,得到训练集和测试集;使用所述训练集对预先建立的故障检测模型进行训练,直到得到收敛的故障检测模型;使用测试集对所述收敛的故障检测模型进行效果评估,得到效果评估结果;若所述效果评估结果指示所述收敛的故障检测模型合格,确定所述收敛的故障检测模型为训练完成的故障检测模型。
根据本公开实施例的第三方面,提供一种服务器,包括处理器和存储器,存储器中存储有至少一条计算机指令,指令由处理器加载并执行以实现第一方面以及第一方面的任一实施例所描述的云桌面的故障检测方法中所执行的步骤。
根据本公开实施例的第四方面,提供一种云桌面系统,包括:云终端和服务器;所述云终端和所述服务器通信连接;所述云终端包括第一云桌面管理模块和云桌面运行模块;所述服务器包括:云终端管理模块、第二云桌面管理模块、云用户管理模块、云镜像管理模块和故障检测模块;
所述云桌面管理模块用于完成云桌面到云终端本地的部署,及对本地部署云桌面的远程控制;
云桌面运行模块用于根据服务器指示完成云桌面的启动、运行及管理员对云桌面的实时管控指令执行;
所述云终端管理模块用于完成云终端的初始化部署、接入鉴权控制和远程控制;
所述第二云桌面管理模块用于提供云桌面的创建、部署、接入控制功能;所述云用户管理模块用于创建用户,并进行用户鉴权;
所述故障检测模块用于获取云桌面系统的性能指标数据;将所述云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;所述故障判断结果用于指示云桌面系统是否存在故障;若所述故障判断结果是云桌面系统存在故障,则获取故障相关信息;根据所述故障相关信息,得到故障类型;发送告警信息,所述告警信息包括所述故障类型。
根据本公开实施例的第五方面,提供一种计算机可读存储介质,存储介质中存储有至少一条计算机指令,指令由处理器加载并执行以实现第一方面以及第一方面的任一实施例所描述的云桌面的故障检测方法中所执行的步骤。
本公开实施例提供的云桌面的故障检测方法、装置、服务器和云桌面系统,获取云桌面系统的性能指标数据,将云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果,从而通过训练完成的故障检测模型快速确定当前云桌面系统是否存在故障。在云桌面系统存在故障的情况下,获取故障相关信息,根据获取到的故障相关信息,得到故障类型,可以发送包含该故障类型的告警信息,从而提醒用户根据故障类型及时处理故障。通过持续的对云桌面系统的监控和数据分析,将云桌面与人工智能相结合,能够自动、及时、快速发现云桌面系统中的故障,并且快速确定出故障类型,提高云桌面系统的稳定性和可靠性,利于用户及时快速排查和解决故障,提高了故障检测的准确性和效率,保证云桌面系统的正常运行。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本公开实施例提供的一种云桌面的故障检测方法的流程示意图;
图2为本公开实施例提供的故障检测模型的训练方法的流程示意图;
图3为本公开实施例提供的一种IDV云桌面的智能系统结构示意图;
图4为本公开实施例提供的一种云桌面人工智能下软硬件故障检测的方法;
图5为本公开实施例提供的一种云桌面的故障检测装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例提供的云桌面的故障检测方法,应用于云桌面系统,下面介绍一种云桌面系统。云桌面系统包括:云终端和服务器;云终端和服务器通信连接;云终端包括第一云桌面管理模块和云桌面运行模块;服务器包括:云终端管理模块、第二云桌面管理模块、云用户管理模块、云镜像管理模块和故障检测模块。
云桌面管理模块用于完成云桌面到云终端本地的部署,及对本地部署云桌面的远程控制;
云桌面运行模块用于根据服务器指示完成云桌面的启动、运行及管理员对云桌面的实时管控指令执行;
云终端管理模块用于完成云终端的初始化部署、接入鉴权控制和远程控制;
第二云桌面管理模块用于提供云桌面的创建、部署、接入控制功能;云用户管理模块用于创建用户,并进行用户鉴权;
故障检测模块用于获取云桌面系统的性能指标数据;将云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;故障判断结果用于指示云桌面系统是否存在故障;若故障判断结果是云桌面系统存在故障,则获取故障相关信息;根据故障相关信息,得到故障类型;发送告警信息,告警信息包括故障类型。
服务器通过实时监控和数据分析,能够及时发现云桌面系统中的软硬件故障,具有实时性、准确性高,自动化完成,提高云桌面的稳定性和可靠性。能够广泛应用于各种云桌面系统的故障检测和排查。
下面以具体的实施例进行详细说明本公开提供的技术方案。
请参见图1,图1为本公开实施例提供的一种云桌面的故障检测方法的流程示意图,本实施例提供的云桌面的故障检测方法由服务器执行,该服务器可以是上述云桌面系统中的服务器。本实施例提供的方法可以包括以下步骤。
步骤101、获取云桌面系统的性能指标数据。
其中,云桌面系统的性能指标数据是指云桌面系统中的与云桌面运行性能相关的数据。示例性的,性能指标数据可以包括云终端、网络设备、服务器的状态、性能指标和日志信息等。
可选的,云桌面系统的性能指标数据可以包括但不限于:云终端的CPU利用率、云终端的内存使用量、网络延迟时间、云终端的磁盘空间使用率和日志信息中的至少一种。
其中,云终端的CPU利用率用于指示云终端的CPU使用情况。
其中,云终端的内存使用量是指云终端的内存占用情况。
其中,网络延迟时间用于指示云终端与网络设备之间的延迟情况。
其中,云终端的磁盘空间使用率用于指示云终端的硬盘空间使用情况。
其中,日志信息是指云终端运行和操作相关的日志信息。
步骤102、将云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果。
其中,训练完成的故障检测模型用于对输入的数据进行处理,输出故障判断结果。
其中,故障判断结果用于指示云桌面系统是否存在故障。故障判断结果可以包括存在故障和无故障。
步骤103、判断故障判断结果是否指示云桌面系统存在故障。
若是,则继续执行步骤104;若否,则返回执行步骤101。
步骤104、获取故障相关信息。
其中,故障相关信息是指与检测出的该云桌面系统故障有关的数据。通过分析故障相关信息可以确定出故障类型。故障相关信息可以包括与系统故障有关的提醒信息和日志数据。
可选的,故障相关信息可以包括但不限于:错误代码、异常日志和系统日志中的至少一种。
步骤105、根据故障相关信息,得到故障类型。
其中,故障类型可以反映出当前故障形成的原因和/或故障的影响范围。
可选的,故障类型可以包括但不限于:软件错误、硬件故障、网络问题中的至少一种。
步骤106、发送告警信息。
其中,告警信息包括故障类型。
该告警信息可以发送给设置的接收告警信息的设备,或者设置的接收告警信息的账号所在的设备。例如,可以发送给管理员账号所在设备。
本实施例,获取云桌面系统的性能指标数据,将云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果,从而通过训练完成的故障检测模型快速确定当前云桌面系统是否存在故障。在云桌面系统存在故障的情况下,获取故障相关信息,根据获取到的故障相关信息,得到故障类型,可以发送包含该故障类型的告警信息,从而提醒用户根据故障类型及时处理故障。通过持续的对云桌面系统的监控和数据分析,将云桌面与人工智能相结合,能够自动、及时、快速发现云桌面系统中的故障,并且快速确定出故障类型,提高云桌面系统的稳定性和可靠性,利于用户及时快速排查和解决故障,提高了故障检测的准确性和效率,保证云桌面系统的正常运行。
在上述实施例的基础上,进一步地,在步骤104之前,还可以包括如下步骤1040。
步骤1040、发送故障提醒信息。
其中,故障提醒信息用于指示云桌面系统出现故障。
服务器可以向管理员账号所在设备发送故障提醒信息,从而提醒管理员及时处理故障。
在上述实施例的基础上,进一步地,在步骤104之后还包括如下步骤1041。
步骤1041、根据故障相关信息,生成故障解决方案。
其中,故障解决方案用于提示解决当前故障的方法。故障解决方案中包含解决故障的操作方法和注意事项。故障解决方案可以是文字形式的,也可以是图标形式或者视频形式的。
可选的,故障解决方案可以包括但不限于:修复软件错误、更换故障硬件和调整网络设置中的至少一种。
相应的,步骤106中的告警信息中还包括故障解决方案。
本实施例,通过获取到的故障相关信息,还可以生成故障解决方案,在发送的告警信息中还包含该故障解决方案,为用户提供了便捷的故障处理解决方案,用户可以根据该故障解决方案进行故障排除,从而提高排除故障的效率,使得云桌面系统更加稳定。
在一些实施例中,步骤101可以是通过云桌面管理平台的API接口采集云桌面系统的性能指标数据。采集的方式可以有多种,下面以具体的实施例详细说明其中的两种方式。在上述任一实施例的基础上,进一步地,步骤101可以通过如下步骤1011或步骤101a实现。
步骤1011、实时采集云桌面系统的性能指标数据。
实时采集云桌面系统的性能指标数据后,可以实时输入到训练完成的故障检测模型进行故障判断,也可以周期性的输入到训练完成的故障检测模型进行故障判断。
步骤101a、周期性采集云桌面系统的性能指标数据。
以预设周期,周期性的采集云桌面系统的性能指标数据,可以在每个周期采集到云桌面系统的性能指标数据后,就输入到训练完成的故障检测模型进行故障判断,也可以两个或者多个周期数据同时输入到训练完成的故障检测模型进行故障判断。
在一些实施例中,可以对故障检测模型进行训练,从而得到训练完成的故障检测模型,用于故障的判断。下面以具体的实施例说明本公开提供的一种故障检测模型的训练方法,该故障检测模型的训练方法可以单独实施,也可以结合上述任一实施例,在步骤102之前实施。
请参见图2,图2为本公开实施例提供的故障检测模型的训练方法的流程示意图,本实施例的故障检测模型的训练方法可以由计算机或者服务器执行。本实施例的方法可以包括如下步骤。
步骤201、获取原始性能指标训练数据。
其中,原始性能指标训练数据是指用于训练的云桌面系统的性能指标数据。原始性能指标训练数据可以是采集的真实的云桌面系统的性能指标数据,且该性能指标数据是标记了数据是否对应故障的数据。
步骤202、对原始性能指标训练数据依次进行数据清洗操作、特征提取操作和预处理操作,得到训练集和测试集。
其中,数据清洗操作是指对采集到的数据进行清洗,包括处理缺失值、异常值和重复值等。例如,可以使用数据清洗工具或编写脚本进行清洗操作,确保数据的准确性和一致性。
其中,特征提取操作是指根据故障检测的需求,从原始数据中提取相关的特征。例如,特征提取可以使用常用的特征提取算法或领域专业知识来确定。
其中,预处理操作是指对提取的特征进行预处理,以使其适合模型的训练和测试。
可选的,常见的数据预处理操作包括标准化、归一化、降维等。选择合适的预处理方法取决于特征的类型和模型的需求。
其中,训练集中标记了标签。测试集中也标记了标签。
步骤203、使用训练集对预先建立的故障检测模型进行训练,直到得到收敛的故障检测模型。
其中,预先建立的故障检测模型可以采用机器学习或者深度学习等方式建立。可以通过损失函数来衡量模型的预测结果与标签之间的差异。例如,损失函数可以是交叉熵损失函数或者方误差损失函数等。
将训练集输入到预先建立的故障检测模型进行训练。通过迭代优化模型的参数,使模型逐渐收敛并提高性能。同时,根据训练过程中的验证集表现,进行模型的调参,包括调整学习率、正则化参数、网络结构等,以提高模型的泛化能力。
步骤204、使用测试集对收敛的故障检测模型进行效果评估,得到效果评估结果。
使用相对训练集独立的测试集对收敛的故障检测模型进行评估,计算模型在测试集上的性能指标,例如准确率、精确率、召回率、F1-score等。从而根据评估结果,评估模型的质量和效果。
步骤205、判断效果评估结果是否指示收敛的故障检测模型合格。
若是,则继续执行步骤206;若否,则返回执行步骤203。
步骤206、确定收敛的故障检测模型为训练完成的故障检测模型。
训练完成的故障检测模型可以保存在服务器中。
本实施例,通过对预先建立的故障检测模型进行训练,得到训练完成的故障检测模型,可以用于云桌面系统的故障检测,使得云桌面系统的故障检测快速、准确、自动化完成。
下面以具体的实施例进行详细说明本公开提供的一种云桌面系统和一种云桌面的故障检测方法。
请参见图3,图3为本公开实施例提供的一种IDV云桌面的智能系统结构示意图,并结合图3进一步说明本发明的一种云桌面人工智能下软硬件故障检测的方法。IDV云桌面的智能系统是上述云桌面系统中的一种,包括可以进行网络通讯的IDV云终端和云桌面服务器,IDV云终端上运行多个云桌面。
IDV云终端包括云桌面管理模块、云桌面运行模块、生物特征设备管理模块;云桌面管理模块与云桌面服务器连通,用于完成云桌面到IDV云终端本地的部署,及对本地部署云桌面的远程控制;云桌面运行系统用于根据云桌面服务器指示完成云桌面的启动运行及管理员对云桌面的实时管控指令,为用户提供云桌面服务。
的云桌面是指运行在IDV云终端上的基于容器技术的虚拟计算机,为个人用户提供和传统个人电脑相同的办公、学习、娱乐等功能。
云桌面服务器包括云终端管理模块、云桌面管理模块、云用户管理模块和云镜像管理模块;云终端管理模块用于完成云终端的初始化部署、接入鉴权控制、远程控制;云用户管理模块用于创建使用本系统的用户,提供用户鉴权服务;云桌面管理模块用于提供包括云桌面的创建、部署、接入控制,使合法接入用户可以使用自己的云桌面。
请参见图4,图4为本公开实施例提供的一种云桌面人工智能下软硬件故障检测的方法。云桌面人工智能下软硬件故障检测的方法是上述云桌面的故障检测方法中的一种。本实施例的方法包括如下步骤:
S1、创建镜像。
在云桌面管理模块创建使用用户,为用户创云镜像。
S2、制作镜像。
云镜像类型为docker镜像,用户采用容器技术,安装所需的操作系统以及适用软件,最终将基于容器技术创建的镜像push到云镜像管理中的docker仓库中,完整的云镜像制作完成。
S3、基于云镜像为用户创建所需云桌面。
S4、云终端管理模块缓存镜像。
通过云终端管理模块,采用docker镜像的动态下载机制将云桌面缓存到云终端。
S5、启动云桌面。
缓存完成后,可自动开启并进入用户的智能云桌面。
S6、获取信息。
利用云桌面管理平台的API接口获取云桌面的相关信息,包括终端设备、桌面设备、网络设备等的状态、性能指标和日志信息等,实时采集这些信息并进行存储和处理。
使用云桌面管理平台提供的API接口,获取云桌面的相关信息。这些信息可以包括终端设备、桌面设备、网络设备的状态、性能指标和日志信息等。
可选的,S6可以通过如下步骤S61-S65实现。
S61、确定需要采集的性能指标。性能指标可以包括但不限于以下内容:
CPU利用率:记录桌面设备的CPU使用情况。
内存使用量:监测桌面设备的内存占用情况。
网络延迟:测量桌面设备与网络设备之间的延迟。
硬盘空间:监控桌面设备的硬盘空间使用情况。
日志信息:收集与桌面设备运行和操作相关的日志。
S62、配置数据采集的频率和时间间隔。根据需求和系统性能要求,确定数据采集的频率,可以是实时采集或定期采集。
S63、将采集到的数据进行存储和处理。可以选择使用关系型数据库、时间序列数据库或其他存储方案进行数据存储,并结合适当的数据处理工具进行数据清洗、转换和提取。
S64、制定数据采集策略和权限控制。根据用户需求和安全考虑,确定数据采集的范围和权限。例如,某些敏感数据可能需要被限制访问或加密存储。
S65、配置实时数据监控和告警系统。对采集到的数据进行实时监控,并设置告警机制,以便及时发现异常情况并通知相关人员进行处理。
S7、对采集到的数据进行处理,包括数据清洗、特征提取、数据预处理等,将处理后的数据输入到模型中进行训练和测试。
可选的,S7可以通过如下步骤S71-S74实现。
S71、数据清洗:对采集到的数据进行清洗,包括处理缺失值、异常值和重复值等。可以使用数据清洗工具或编写脚本进行清洗操作,确保数据的准确性和一致性。
S72、特征提取:根据故障检测的需求,从原始数据中提取相关的特征。特征提取可以使用常用的特征提取算法或领域专业知识来确定。
S73、数据预处理:对提取的特征进行预处理,以使其适合模型的训练和测试。常见的数据预处理操作包括标准化、归一化、降维等。选择合适的预处理方法取决于特征的类型和模型的需求。
S74、将处理后的数据集划分为训练集和测试集。通常,将数据集按照一定比例划分,例如,80%的数据用于训练模型,20%的数据用于评估模型性能。
S8、建立故障检测模型.
采用机器学习、深度学习等技术,对处理后的数据进行训练,生成模型。
可选的,S8可以通过如下步骤S81-S86实现。
S81、模型架构设计:根据选定的模型,设计合适的模型架构。这包括定义模型的层次结构、层次的类型和顺序,以及各层的参数设置。例如,对于深度学习模型,可以定义卷积层、池化层、全连接层等。
S82、对模型的参数进行初始化。合适的参数初始化可以帮助模型更快地收敛和学习。可以使用随机初始化、预训练模型初始化或其他启发式方法来初始化模型参数。
损失函数选择:选择适当的损失函数来衡量模型的预测结果与真实标签之间的差异。根据问题的性质和数据的特点,可以选择分类问题常用的交叉熵损失函数、回归问题常用的均方误差损失函数等。
S83、则优算法随机梯度下降(SGD)、Adam、Adagrad等。选择合适的学习率和学习率衰减策略,以提高模型的训练效果。
S84、模型训练与调参:将准备好的数据输入模型进行训练。通过迭代优化模型的参数,使模型逐渐收敛并提高性能。同时,根据训练过程中的验证集表现,进行模型的调参,包括调整学习率、正则化参数、网络结构等,以提高模型的泛化能力。
S85、模型评估与验证:使用独立的测试集对训练好的模型进行评估。计算模型在测试集上的性能指标,例如准确率、精确率、召回率、F1-score等。根据评估结果,评估模型的质量和效果。
S86、模型保存与部署:在训练完成后,将训练好的模型保存下来,以备后续的故障检测和部署使用。可以将模型保存为特定格式,如HDF5、ONNX等。对于部署,可以将模型集成到故障检测系统中,用于实时检测和预测。
S9、将实时采集到的数据输入到模型中,利用模型进行故障检测,判断系统是否出现故障,如果出现故障,将自动发送告警信息给管理员,提醒其及时处理。
S10、在发生故障时,通过分析故障信息和日志信息,排查出故障的原因,并以图表或视频的方式给出解决方案,进行相应的处理。
可选的,S10可以通过如下步骤S101-S105实现。
S101、故障信息和日志分析:收集系统故障的相关信息和日志数据,包括错误代码、异常日志、系统日志等。对这些数据进行分析,以确定故障的具体原因和可能的影响范围。
S102、故障原因识别:通过分析故障信息和日志信息,识别可能导致故障的原因。这可以包括软件错误、硬件故障、网络问题等各种可能的因素。
S103、解决方案生成:根据故障原因的识别结果,生成相应的解决方案。这可能涉及到修复软件错误、更换故障硬件、调整网络设置等一系列操作。解决方案应该详细描述每个步骤的操作方法和注意事项,并提供必要的图表或视频示例以便理解和执行。
S104、处理执行:根据生成的解决方案,进行相应的处理操作。这可能需要管理员或维护人员按照指导进行一系列操作,以修复系统故障并恢复正常运行。
S105、反馈和监控:在处理执行后,进行反馈和监控以确保故障得到解决。管理员应该检查系统的状态和日志信息,确认故障是否已经解决,如果还存在问题,需要进一步排查和处理。
本实施例提供的云桌面人工智能下软硬件故障检测的方法,类似于一个智能的安全团队,通过实时监控和数据分析,能够及时发现云桌面系统中的软硬件故障,提高云桌面的稳定性和可靠性。具体来说,这个团队会不断地从云桌面管理平台的API接口中获取云桌面的各种信息,包括终端设备、桌面设备、网络设备等的状态、性能指标和日志信息等,然后对这些信息进行处理和分析,建立故障检测模型。当系统出现故障时,这个团队会根据模型自动发现故障,并及时发送告警信息给管理员,提醒其及时处理。这个发明的优点在于具有实时性、准确性和自动化等特点,能够广泛应用于各种云桌面系统的故障检测和排查。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
请参见图5,图5为本公开实施例提供的一种云桌面的故障检测装置的结构示意图,该云桌面的故障检测装置可以包括:
获取模块51,用于获取云桌面系统的性能指标数据;
故障检测模块52,用于将云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;故障判断结果用于指示云桌面系统是否存在故障;若故障判断结果是云桌面系统存在故障,则获取故障相关信息;根据故障相关信息,得到故障类型;发送告警信息,告警信息包括故障类型。
本公开实施例提供的装置,其实现原理和有益效果与上述提供的方法实施例类似,此处不再赘述。
本公开提供一种服务器,包括处理器和存储器,存储器中存储有至少一条计算机指令,指令由处理器加载并执行以实现上述任一实施例中的云桌面的故障检测方法中所执行的步骤。
基于上述实施例中所描述的云桌面的故障检测方法,本公开实施例还提供一种计算机可读存储介质,例如,非临时性计算机可读存储介质可以是只读存储器(英文:ReadOnly Memory,ROM)、随机存取存储器(英文:Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储装置等。该存储介质上存储有计算机指令,用于执行上述图1和图4对应的实施例中所描述的云桌面的故障检测方法,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

Claims (10)

1.一种云桌面的故障检测方法,其特征在于,包括:
获取云桌面系统的性能指标数据;
将所述云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;所述故障判断结果用于指示云桌面系统是否存在故障;
若所述故障判断结果是云桌面系统存在故障,则获取故障相关信息;
根据所述故障相关信息,得到故障类型;
发送告警信息,所述告警信息包括所述故障类型。
2.根据权利要求1所述的方法,其特征在于,所述云桌面系统的性能指标数据包括云终端的CPU利用率、云终端的内存使用量、网络延迟时间、云终端的磁盘空间使用率和日志信息中的至少一种;
所述故障相关信息包括错误代码、异常日志和系统日志中的至少一种;
所述故障类型包括软件错误、硬件故障、网络问题中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述获取故障相关信息之后,还包括:
根据所述故障相关信息,生成故障解决方案,所述故障解决方案中包含解决故障的操作方法和注意事项;所述告警信息中还包括所述故障解决方案。
4.根据权利要求3所述的方法,其特征在于,所述故障解决方案包括修复软件错误、更换故障硬件和调整网络设置中的至少一种。
5.根据权利要求1所述的方法,其特征在于,所述获取云桌面系统的性能指标数据,包括:
实时采集云桌面系统的性能指标数据;
或者,周期性采集云桌面系统的性能指标数据。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
获取原始性能指标训练数据;
对所述原始性能指标训练数据依次进行数据清洗操作、特征提取操作和预处理操作,得到训练集和测试集;
使用所述训练集对预先建立的故障检测模型进行训练,直到得到收敛的故障检测模型;
使用测试集对所述收敛的故障检测模型进行效果评估,得到效果评估结果;
若所述效果评估结果指示所述收敛的故障检测模型合格,确定所述收敛的故障检测模型为训练完成的故障检测模型。
7.一种云桌面的故障检测装置,其特征在于,包括:
获取模块,用于获取云桌面系统的性能指标数据;
故障检测模块,用于将所述云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;所述故障判断结果用于指示云桌面系统是否存在故障;若所述故障判断结果是云桌面系统存在故障,则获取故障相关信息;根据所述故障相关信息,得到故障类型;发送告警信息,所述告警信息包括所述故障类型。
8.一种服务器,其特征在于,包括处理器和存储器,所述存储器中存储有至少一条计算机指令,所述指令由所述处理器加载并执行以实现权利要求1至权利要求6任一项所述的云桌面的故障检测方法中所执行的步骤。
9.一种云桌面系统,其特征在于,包括:云终端和服务器;所述云终端和所述服务器通信连接;所述云终端包括第一云桌面管理模块和云桌面运行模块;所述服务器包括:云终端管理模块、第二云桌面管理模块、云用户管理模块、云镜像管理模块和故障检测模块;
所述云桌面管理模块用于完成云桌面到云终端本地的部署,及对本地部署云桌面的远程控制;
云桌面运行模块用于根据服务器指示完成云桌面的启动、运行及管理员对云桌面的实时管控指令执行;
所述云终端管理模块用于完成云终端的初始化部署、接入鉴权控制和远程控制;
所述第二云桌面管理模块用于提供云桌面的创建、部署、接入控制功能;所述云用户管理模块用于创建用户,并进行用户鉴权;
所述故障检测模块用于获取云桌面系统的性能指标数据;将所述云桌面系统的性能指标数据输入至训练完成的故障检测模型,得到故障判断结果;所述故障判断结果用于指示云桌面系统是否存在故障;若所述故障判断结果是云桌面系统存在故障,则获取故障相关信息;根据所述故障相关信息,得到故障类型;发送告警信息,所述告警信息包括所述故障类型。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条计算机指令,所述指令由处理器加载并执行以实现权利要求1至权利要求6任一项所述的云桌面的故障检测方法中所执行的步骤。
CN202310845079.7A 2023-07-11 2023-07-11 云桌面的故障检测方法、装置、服务器和云桌面系统 Pending CN116743546A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310845079.7A CN116743546A (zh) 2023-07-11 2023-07-11 云桌面的故障检测方法、装置、服务器和云桌面系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310845079.7A CN116743546A (zh) 2023-07-11 2023-07-11 云桌面的故障检测方法、装置、服务器和云桌面系统

Publications (1)

Publication Number Publication Date
CN116743546A true CN116743546A (zh) 2023-09-12

Family

ID=87904530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310845079.7A Pending CN116743546A (zh) 2023-07-11 2023-07-11 云桌面的故障检测方法、装置、服务器和云桌面系统

Country Status (1)

Country Link
CN (1) CN116743546A (zh)

Similar Documents

Publication Publication Date Title
CN111209131B (zh) 一种基于机器学习确定异构系统的故障的方法和系统
CN111459700B (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
US7664986B2 (en) System and method for determining fault isolation in an enterprise computing system
US11593562B2 (en) Advanced machine learning interfaces
CN109918313B (zh) 一种基于GBDT决策树的SaaS软件性能故障诊断方法
CN113946499A (zh) 一种微服务链路跟踪及性能分析方法、系统、设备及应用
CN114943321A (zh) 一种针对硬盘的故障预测方法、装置及设备
CN113051180B (zh) 测试任务的监测方法、装置、设备及存储介质
CN114255784A (zh) 一种基于声纹识别的变电站设备故障诊断方法及相关装置
US20230133541A1 (en) Alert correlating using sequence model with topology reinforcement systems and methods
CN115952081A (zh) 一种软件测试方法、装置、存储介质及设备
CN117289085A (zh) 一种多线路故障分析诊断方法及系统
US11263072B2 (en) Recovery of application from error
Raj et al. Cloud infrastructure fault monitoring and prediction system using LSTM based predictive maintenance
CN109889258B (zh) 一种光网络故障校验方法和设备
CN116541198A (zh) 容器修复方法、装置、计算机存储介质及电子设备
WO2023224764A1 (en) Multi-modality root cause localization for cloud computing systems
CN116743546A (zh) 云桌面的故障检测方法、装置、服务器和云桌面系统
CN117539674B (zh) 异常处理方法、装置、设备及存储介质
CN117472474B (zh) 配置空间调试方法、系统、电子设备及存储介质
US20240134626A1 (en) Artificial intelligence (ai) supported graph enabled method to manage upgrades for applications
CN117421231A (zh) 一种软件自动化测试方法、系统和装置
Zhebka et al. Methodology for Predicting Failures in a Smart Home based on Machine Learning Methods
CN116302859A (zh) 应用平台告警方法及装置
CN117033046A (zh) 容器诊断和修复的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination