CN114422850B - 一种服务器故障的视频追踪方法、设备及存储介质 - Google Patents

一种服务器故障的视频追踪方法、设备及存储介质 Download PDF

Info

Publication number
CN114422850B
CN114422850B CN202210076104.5A CN202210076104A CN114422850B CN 114422850 B CN114422850 B CN 114422850B CN 202210076104 A CN202210076104 A CN 202210076104A CN 114422850 B CN114422850 B CN 114422850B
Authority
CN
China
Prior art keywords
server
real time
video
behavior
operating system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210076104.5A
Other languages
English (en)
Other versions
CN114422850A (zh
Inventor
王万强
王兴隆
王奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210076104.5A priority Critical patent/CN114422850B/zh
Publication of CN114422850A publication Critical patent/CN114422850A/zh
Application granted granted Critical
Publication of CN114422850B publication Critical patent/CN114422850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提出一种服务器故障的视频追踪方法、设备及存储介质,其中方法包括:通过BMC以录制视频的方式实时获取服务器的运行状态,并实时检测服务器的故障信号;响应于检测到服务器的故障信号,保存最近的预定时长的以录制视频的方式获取的服务器的运行状态的视频;以及通过保存的所述服务器的运行状态的视频追溯服务器的故障原因。通过本发明提供的一种服务器故障的视频追踪方法,以录制视频的方式实时录制服务器上的用户的进程的执行信息,并实时监测服务器的运行状态,当服务器出现故障时通过录制的一定时长的服务器上的进程的执行信息来追溯服务器出现故障的原因。

Description

一种服务器故障的视频追踪方法、设备及存储介质
技术领域
本发明属于计算机领域,具体涉及一种服务器故障的视频追踪方法、设备及存储介质。
背景技术
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Whitely(Intel推出的计算平台)平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,并在对实时性、可靠性和可用性要求苛刻的领域中应用越来越广泛。同时基于Whitely平台的新一代服务器在机柜内采用集中管理和分级管理的策略,整机柜统一进行故障监控、故障管理和故障记录,故障发生的原因更加复杂,分析也更加困难。
目前服务器对故障的监控并不充分,对故障发生原因的分析并不精准,尤其是在发生系统故障时,很难得到发生故障时的具体信息,因此需要更多的信息来帮助进行故障分析。
发明内容
为解决以上问题,本发明提出了一种服务器故障的视频追踪方法,包括:
通过BMC以录制视频的方式实时获取服务器的运行状态,并实时检测所述服务器的故障信号;
响应于检测到所述服务器的故障信号,保存最近的预定时长的所述以录制视频的方式获取的所述服务器的运行状态的视频;以及
通过所述保存的所述服务器的运行状态的视频追溯所述服务器的故障原因。
在本发明的一些实施方式中,方法还包括:
响应于未检测到述服务器的故障信号,将所述最近的预定时长以外的所述以录制视频的方式获取的所述服务器的运行状态的视频删除。
在本发明的一些实施方式中,通过BMC以录制视频的方式实时获取服务器的运行状态包括:
实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印;
通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息。
在本发明的一些实施方式中,实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印包括:
以所述操作系统输出的显示信号的刷新率为基础,将获取到的所述用户进程的行为在每一次显示信号的刷新时进行打印。
在本发明的一些实施方式中,通实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印还包括:
响应于存在需要打印的所述用户进程的行为,打印所述用户进程的行为并在预定位置植入预定标记。
在本发明的一些实施方式中,通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息包括:
判断从所述操作系统获取的每一帧所述显示信号中的预定位置是否存在预定标记;
响应于不存在所述预定标记,则直接将不存在所述预定标记的对应的每一帧所述显示信号舍弃;以及
响应于存在所述预定标记,则将存在所述预定标记的每一帧所述信号作为视频帧保存。
在本发明的一些实施方式中,方法还包括:
对存在预定标记的每一帧显示信号进行二值化处理,再将二值化处理后的所述显示信号作为视频帧保存。
在本发明的一些实施方式中,实时检测所述服务器的故障信号包括:
通过CPLD的实时监测所述服务器故障信号,并在检测到所述故障信号后将所述故障信号发送到BMC。
本发明的另一方面还提出了一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现上述实施方式中任意一项所述方法的步骤。
本发明的再一方面还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中任意一项所述方法的步骤。
通过本发明提供的一种服务器故障的视频追踪方法,以录制视频的方式实时录制服务器上的用户的进程的执行信息,并实时监测服务器的运行状态,当服务器出现故障时通过录制的一定时长的服务器上的进程的执行信息来追溯服务器出现故障的原因。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种服务器故障的视频追踪方法的方法流程图;
图2为本发明实施例提供的一种计算机设备的结构示意图;
图3为本发明实施例提供的一种计算机存储介质的结构示意图。
图4为本发明实施例提供的一种服务器故障的视频追踪方法实施例的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
如图1所示,本发明提出了一种服务器故障的视频追踪方法,包括:
步骤S1、通过BMC以录制视频的方式实时获取服务器的运行状态,并实时检测所述服务器的故障信号;
步骤S2、响应于检测到所述服务器的故障信号,保存最近的预定时长的所述以录制视频的方式获取的所述服务器的运行状态的视频;以及
步骤S3、通过所述保存的所述服务器的运行状态的视频追溯所述服务器的故障原因。
在本发明的实施例中,在步骤S1中,现有的服务器上的BMC可以接收服务器操作系统上的显示信号,并通过BMC上自身的芯片渲染出可视的桌面图像。因此本实施例中通过将BMC渲染出的桌面图像(显示信号,以用户的角度应为显示器显示的桌面图像,对于BMC来说则是视频信号,即显示信号,下文为方便理解将显示信号描述为桌面图像)加以处理,并将连续渲染出的图像封装成视频数据。同时在服务器上植入获取服务器运行状态的程序,通过该程序实时获取服务器的运行状态并输出到桌面图像中。与此同时通过BMC监控服务器上是否产生故障信号。
在步骤S2中,如果检测到服务器产生故障信号,则将发生故障前1分钟通过步骤S1中以操作系统的桌面的形式录制的含有服务器运行状态的视频保存。
在步骤S3中,通过查看步骤S2中保存的含有服务器运行状态的视频中的内容来追溯服务器出现故障的原因。
在本发明的一些实施例中,在步骤S3中,通过BMC将在步骤S2中保存的含有服务器运行状态的视频通过网络发送到远端可供运维人员观看的计算机中。
在本发明的一些实施方式中,方法还包括:
响应于未检测到述服务器的故障信号,将所述最近的预定时长以外的所述以录制视频的方式获取的所述服务器的运行状态的视频删除。
在本实施例中,在BMC中对通过BMC渲染出来的桌面图像封装成视频数据时,在BMC中只临时保存一定时间的视频数据,例如仅将视频时长为最近1分钟的视频保存,如果BMC未检测到服务器的故障信号,则BMC将超过1分钟的旧的视频数据直接删除掉。以此来减少视频数据对BMC存储的压力。
在本发明的一些实施例中,BMC在保存视频数据时以大小为单位将渲染并处理后的视频以小段视频的形式保存为多个视频文件,每个视频文件具有相同大小的视频播放时长。可根据文件建立的时间进行逆向排序。在服务器为发生故障时,计算每个视频文件的时长,将累计到1分钟之后的视频文件直接删除。具体的,以5秒为时长建立对应的多个视频文件并按照建立的时间逆向排序(最新建立的时间的值最大,因为计算机的时间是累加制,因此顺序从上到下前12个为最新的视频文件),将最新的12个视频文件之后的其他视频文件直接删除即可。
在本发明的一些实施方式中,通过BMC以录制视频的方式实时获取服务器的运行状态包括:
实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印;
通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息。
在本实施例中,通过在服务器的操作系统中植入的监控程序监控服务器操作系统中的应用程序的进程的行为,将服务器上运行在操作系统中的所有的程序的执行动作进行监控,并且通过监控程序的窗口以可视化的方式实时打印,便于在BMC上进行录制打印的可显示相应的信息,如图4所示,图4示出的是一个简易化的监控程序,指包含了进程的进程名、进程ID、任务组ID、动作、路径、参数、结果等信息。在本发明的一些实施例中,所监测的信息还包含每一个进程所占用的CPU资源、内存资源、网络及硬盘的数据传输带宽、以及是否访问系统的敏感资源或调用操作系统的较为危险的API等更详细的信息。
进一步,当一行内容无法完成上述信息的展示时可将某一进程的行为通过多行打印的方式输出到窗口中,以保证对某些关键信息的捕获。当然上述内容可根据客户需要灵活配置,根据具体的需求选择监控的用户进程的行为。
在本发明的一些实施例中,在通过录制服务器上操作系统的桌面图像的方式获取服务器的运行状态信息不单单是上述监控程序打印的进程的行为信息,还包括用户的操作,例如用户通过远程访问操作系统时,通过远程的鼠标以及键盘输入的方式操作服务器同时也将被录制。在用户操作服务器时,上述监控程序可能处于最小化或关掉的状态,因此需要在用户停止操作服务器时,将上述监控程序自动打开到桌面的指定位置,在无用户操作时上述监控程序便自动运行,并将程序打开的桌面图像指定位置。例如以是坐标为(0,0)到(1600,900)所限定的区域,即监控程序创建的窗口大小。然后将监控到的进程的行为实时打印显示在该窗口上。
在BMC对服务器的桌面图像进行录制时,可根据监控程序在桌面的位置对指定范围内的图像进行截取。例如上述实施例中监控程序在桌面的位置为(0,0)到(1600,900)区域,则BMC在录制视频时,仅保留(0,0)到(1600,900)范围的像素内容进行录制,在其外的桌面图像则直接忽略,并且录制的每一帧的大小都1600*900像素。
在本发明的一些实施方式中,实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印包括:
以所述操作系统输出的显示信号的刷新率为基础,将获取到的所述用户进程的行为在每一次显示信号的刷新时进行打印。
在本实施例中,监控程序在打印(指输出到监控程序的窗口显示)所监控的用户的进程的行为信息时,根据操作系统输出到BMC的桌面图像的刷新率进行打印,由于窗口所显示内容有限,在进程的行为突然爆发式增加时,打印的进程的行为的信息被其他进程的信息因滚动打印的方式顶替而导致对应的进程信息无法在BMC端被记录。根据刷新率在每次刷新时打印一批进程的行为信息。假设1600*900大小的空间可展示9条行为信息,若以每秒刷新60帧计算,则每秒最多打印540条进程的行为信息。
在本发明的一些实施例中,当进程的行为信息过多时,则还需对进程对操作系统稳定运行的影响程度进行排序,具体的按照CPU占用、内存占用以及IO占用进行降序排序,将排序靠前的进程的行为进行打印,排序较低的进程的行为信息则忽略。
在本发明的一些实施例中,对进程对操作系统稳定运行的影响程度进行排序,还包括进程的动作这一因素,并且将进程的动作作为主要排序基准,例如,某进程申请提权或者访问系统的某些敏感API等可能影响系统正常运作的接口时,则物理该进程所占用的CPU、内存或IO资源的多少都将该进程的行为信息优先打印。
在本发明的一些实施方式中,通实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印还包括:
响应于存在需要打印的所述用户进程的行为,打印所述用户进程的行为并在预定位置植入预定标记。
在本实施例中,监控程序在每打印一次进程的行为信息时,都需要在监控程序的预定位置输出标记。例如,当监控程序检测到进程的行为,并且打印该进程的行为时,需要将该监控程序的窗口的icon图标进行更改。例如,在一些实施例中规定,如果监控程序打印进程的行为信息,将监控程序的icon图标换成白色,在不需要将进程的行为信息打印时设置为黑色。
在本发明的一些实施方式中,通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息包括:
判断从所述操作系统获取的每一帧所述显示信号中的预定位置是否存在预定标记;
响应于不存在所述预定标记,则直接将不存在所述预定标记的对应的每一帧所述显示信号舍弃;以及
响应于存在所述预定标记,则将存在所述预定标记的每一帧所述信号作为视频帧保存。
在本实施例中,在BMC对从服务器上的操作系统中接收到的每一帧的桌面图像进行渲染后,判断每一帧桌面图像中的预定位置是否存在标记。具体地,例如上述实施例中在监控程序的icon图片位置的颜色。若监控程序的窗口坐标为(0,0)到(1600,900),按照窗口设计规范,以60*60大小的icon图标为例。则监控程序的图标应该在坐标为(100,100)处显示,因此在BMC获取到桌面图像后,则判断图像上坐标为(100,100)处的颜色值便可判断出获取到的桌面图像中是否包含监控程序打印的进程的行为信息。按照上述实施例的规定,如果按照白色为有进程的行为打印,黑色为没有进程的行为信息打印。则BMC在获取到的桌面图像的坐标为(100,100)处的颜色为白色时,则将该桌面图像作为视频文件的一帧进行保存,若该坐标出的颜色为黑色则直接将该桌面图像舍弃。
在本发明的一些实施方式中,方法还包括:
对存在预定标记的每一帧显示信号进行二值化处理,再将二值化处理后的所述显示信号作为视频帧保存。
在本实施例中,BMC在对含有预定标记的图像进行保存时,还需将图片进行二值化处理,即将获取的桌面图像中监控程序打印的部分进程裁切,并按照打印区域字体颜色和背景颜色的差异将原本通过多位数据表示的色彩变为1位表示的色彩。例如按照上述实施例所公开的桌面图像一般采用8位二进制显示色彩,并且采用三通道,例如白色为255,255,255。因此为节省BMC的存储空间,在将获取到桌面图像进行保存时,将每一个像素上由24bit改为1bit的数据大小。0代表黑色,1代表白色。按照上述方式处理后,则桌面图像中的监控程序所打印的进程的行为信息中文字用0表示,背景用1表示,然后再将二值化处理后的桌面图像作为视频帧组成视频文件。
在本发明的一些实施例中,为方便在BMC端的二值化处理,在服务器上的操作系统中的监控程序在创建窗口时,将文字和背景的显示像素设置为0,0,0和255,255,255,避免加载其他颜色。
在本发明的一些实施方式中,实时检测所述服务器的故障信号包括:
通过CPLD的实时监测所述服务器故障信号,并在检测到所述故障信号后将所述故障信号发送到BMC。
在本实施例中,为了准确获取到服务器的运行状态,检测服务器的故障信号,本发明通过CPLD以硬件电路的方式监控服务器的故障信号,并同样通过硬件电路将故障信号发送到BMC。具体地,将CPLD上的闲置引脚与CPU上的CATERR引脚相连,同时通过CPLD上的另一个闲置引脚与CPU上的ERROR[2]引脚相连。进一步,CPLD与BMC通过三根GPIO引脚相连。当检测到CPU上的CATEER引脚电平长时间拉低时,将与BMC相连的第一个GPIO引脚电平拉高,以告知BMC,服务器当前出现IERR Error故障,表示服务器出现宕机,且为致命问题不可修复;当CPLD检测到CPU上的CATEER引脚电平拉低,且维持16个时钟周期时,通过拉高与BCM相连的第二个GPIO引脚的电平的方式告知BMC,服务器出现了MCE Error故障,MCE Error不一定是宕机,可恢复;当CPLD检测到ERROR[2]引脚的电平被长时间拉低后,通过与BMC相连的第三个GPIO引脚向BMC发出ERROR[2]的信号,以告知BMC,服务器出现了ERROR[2]故障。
在本发明的一些实施例中,还可同时通过BMC与操作系统进行通信获取操作系统中的上述故障信号,并可通过上述信号进行触发录制视频保存机制。BMC在接收到上述三个故障信号中任意一个时,便将最近的录制的一分中的视频文件保存,根据需要将视频文件通过网络发送到运维人员的计算机上供运维人员查看视频并排除相关问题。
通过本发明提供的一种服务器故障的视频追踪方法,以录制视频的方式实时录制服务器上的用户的进程的执行信息,并实时监测服务器的运行状态,当服务器出现故障时通过录制的一定时长的服务器上的进程的执行信息来追溯服务器出现故障的原因。并且通过上述实施例中的示例方案,本发明所提出的方法可有效提高服务器故障时运维的问题追踪效率。
如图2所示,本发明的另一方面还提出了一种计算机设备,包括:
至少一个处理器21;以及
存储器22,所述存储器22存储有可在所述处理器21上运行的计算机指令23,所述指令23由所述处理器21执行时实现一种服务器故障的视频追踪方法,包括:
通过BMC以录制视频的方式实时获取服务器的运行状态,并实时检测所述服务器的故障信号;
响应于检测到所述服务器的故障信号,保存最近的预定时长的所述以录制视频的方式获取的所述服务器的运行状态的视频;以及
通过所述保存的所述服务器的运行状态的视频追溯所述服务器的故障原因。
在本发明的一些实施方式中,方法还包括:
响应于未检测到述服务器的故障信号,将所述最近的预定时长以外的所述以录制视频的方式获取的所述服务器的运行状态的视频删除。
在本发明的一些实施方式中,通过BMC以录制视频的方式实时获取服务器的运行状态包括:
实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印;
通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息。
在本发明的一些实施方式中,实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印包括:
以所述操作系统输出的显示信号的刷新率为基础,将获取到的所述用户进程的行为在每一次显示信号的刷新时进行打印。
在本发明的一些实施方式中,通实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印还包括:
响应于存在需要打印的所述用户进程的行为,打印所述用户进程的行为并在预定位置植入预定标记。
在本发明的一些实施方式中,通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息包括:
判断从所述操作系统获取的每一帧所述显示信号中的预定位置是否存在预定标记;
响应于不存在所述预定标记,则直接将不存在所述预定标记的对应的每一帧所述显示信号舍弃;以及
响应于存在所述预定标记,则将存在所述预定标记的每一帧所述信号作为视频帧保存。
在本发明的一些实施方式中,方法还包括:
对存在预定标记的每一帧显示信号进行二值化处理,再将二值化处理后的所述显示信号作为视频帧保存。
在本发明的一些实施方式中,实时检测所述服务器的故障信号包括:
通过CPLD的实时监测所述服务器故障信号,并在检测到所述故障信号后将所述故障信号发送到BMC。
本发明的再一方面还提出了一种计算机可读存储介质401,所述计算机可读存储介质401存储有计算机程序402,所述计算机程序402被处理器执行时实现一种服务器故障的视频追踪方法,包括:
通过BMC以录制视频的方式实时获取服务器的运行状态,并实时检测所述服务器的故障信号;
响应于检测到所述服务器的故障信号,保存最近的预定时长的所述以录制视频的方式获取的所述服务器的运行状态的视频;以及
通过所述保存的所述服务器的运行状态的视频追溯所述服务器的故障原因。
在本发明的一些实施方式中,方法还包括:
响应于未检测到述服务器的故障信号,将所述最近的预定时长以外的所述以录制视频的方式获取的所述服务器的运行状态的视频删除。
在本发明的一些实施方式中,通过BMC以录制视频的方式实时获取服务器的运行状态包括:
实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印;
通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息。
在本发明的一些实施方式中,实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印包括:
以所述操作系统输出的显示信号的刷新率为基础,将获取到的所述用户进程的行为在每一次显示信号的刷新时进行打印。
在本发明的一些实施方式中,通实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印还包括:
响应于存在需要打印的所述用户进程的行为,打印所述用户进程的行为并在预定位置植入预定标记。
在本发明的一些实施方式中,通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息包括:
判断从所述操作系统获取的每一帧所述显示信号中的预定位置是否存在预定标记;
响应于不存在所述预定标记,则直接将不存在所述预定标记的对应的每一帧所述显示信号舍弃;以及
响应于存在所述预定标记,则将存在所述预定标记的每一帧所述信号作为视频帧保存。
在本发明的一些实施方式中,方法还包括:
对存在预定标记的每一帧显示信号进行二值化处理,再将二值化处理后的所述显示信号作为视频帧保存。
在本发明的一些实施方式中,实时检测所述服务器的故障信号包括:
通过CPLD的实时监测所述服务器故障信号,并在检测到所述故障信号后将所述故障信号发送到BMC。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (9)

1.一种服务器故障的视频追踪方法,其特征在于,包括:
通过BMC以录制视频的方式实时获取服务器的运行状态,并实时检测所述服务器的故障信号;
响应于检测到所述服务器的故障信号,保存最近的预定时长的所述以录制视频的方式获取的所述服务器的运行状态的视频;以及
通过所述保存的所述服务器的运行状态的视频追溯所述服务器的故障原因;
所述通过BMC以录制视频的方式实时获取服务器的运行状态包括:
实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印;
通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息。
2.根据权利要求1所述的方法,其特征在于,还包括:
响应于未检测到述服务器的故障信号,将所述最近的预定时长以外的所述以录制视频的方式获取的所述服务器的运行状态的视频删除。
3.根据权利要求1所述的方法,其特征在于,所述实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印包括:
以所述操作系统输出的显示信号的刷新率为基础,将获取到的所述用户进程的行为在每一次显示信号的刷新时进行打印。
4.根据权利要求1所述的方法,其特征在于,所述实时获取操作系统中运行的用户进程的行为,并将所述用户进程的行为实时打印还包括:
响应于存在需要打印的所述用户进程的行为,打印所述用户进程的行为并在预定位置植入预定标记。
5.根据权利要求4所述的方法,其特征在于,所述通过BMC从所述操作系统接收所述操作系统输出的显示信号,并对每一帧显示信号进行处理以获取所述每一帧显示信号中所打印的所述用户进程的行为信息包括:
判断从所述操作系统获取的每一帧所述显示信号中的预定位置是否存在预定标记;
响应于不存在所述预定标记,则直接将不存在所述预定标记的对应的每一帧所述显示信号舍弃;以及
响应于存在所述预定标记,则将存在所述预定标记的每一帧所述信号作为视频帧保存。
6.根据权利要求5所述的方法,其特征在于,还包括:
对存在预定标记的每一帧显示信号进行二值化处理,再将二值化处理后的所述显示信号作为视频帧保存。
7.根据权利要求1所述的方法,其特征在于,所述实时检测所述服务器的故障信号包括:
通过CPLD的实时监测所述服务器故障信号,并在检测到所述故障信号后将所述故障信号发送到BMC。
8. 一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-7任意一项所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。
CN202210076104.5A 2022-01-23 2022-01-23 一种服务器故障的视频追踪方法、设备及存储介质 Active CN114422850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210076104.5A CN114422850B (zh) 2022-01-23 2022-01-23 一种服务器故障的视频追踪方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210076104.5A CN114422850B (zh) 2022-01-23 2022-01-23 一种服务器故障的视频追踪方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114422850A CN114422850A (zh) 2022-04-29
CN114422850B true CN114422850B (zh) 2023-07-21

Family

ID=81276169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210076104.5A Active CN114422850B (zh) 2022-01-23 2022-01-23 一种服务器故障的视频追踪方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114422850B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102082781A (zh) * 2009-11-27 2011-06-01 宏正自动科技股份有限公司 服务器管理系统及其方法
CN110933363A (zh) * 2019-10-25 2020-03-27 苏州浪潮智能科技有限公司 一种服务器故障的录像记录方法、系统及设备
CN113872795A (zh) * 2021-08-20 2021-12-31 苏州浪潮智能科技有限公司 一种分布式服务器智能监控分析及故障处理系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941700B2 (en) * 2009-03-02 2011-05-10 Microsoft Corporation Operating system-based application recovery

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102082781A (zh) * 2009-11-27 2011-06-01 宏正自动科技股份有限公司 服务器管理系统及其方法
CN110933363A (zh) * 2019-10-25 2020-03-27 苏州浪潮智能科技有限公司 一种服务器故障的录像记录方法、系统及设备
CN113872795A (zh) * 2021-08-20 2021-12-31 苏州浪潮智能科技有限公司 一种分布式服务器智能监控分析及故障处理系统及方法

Also Published As

Publication number Publication date
CN114422850A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
US10585731B2 (en) KVM having blue screen of death detection and warning functions
US9860139B2 (en) Passive monitoring of live virtual desktop infrastructure (VDI) deployments
US8667473B2 (en) Analyzing video game performance using non-intrusive capture and storage of run-time game data
US7386807B2 (en) System and method for monitoring application response and providing visual treatment
US20090113251A1 (en) Real-time analysis of performance data of a video game
CN103530218A (zh) 一种基于行为检测的监控触发方法
US10230611B2 (en) Dynamic baseline determination for distributed business transaction
CN108880921A (zh) 网页监测方法
US9311598B1 (en) Automatic capture of detailed analysis information for web application outliers with very low overhead
US10275304B2 (en) Information processing apparatus, information processing system and method for monitoring errors
CN116107819A (zh) 一种服务器启动故障检测系统、方法、装置以及介质
CN106921518A (zh) 监控视图展示方法及装置
CN111726608A (zh) 一种视频的卡顿测试方法、装置、电子设备及存储介质
CN114978883B (zh) 网络唤醒的管理方法、装置、电子设备及存储介质
CN111077763A (zh) 一种车载显示装置冗余控制方法及装置
CN114996103A (zh) 页面异常检测方法、装置、电子设备和存储介质
CN114422850B (zh) 一种服务器故障的视频追踪方法、设备及存储介质
CN110502345A (zh) 一种过载保护方法、装置、计算机设备及存储介质
CN113987393A (zh) 一种网页操作记录器、系统、装置及方法
WO2018205392A1 (zh) 控制响应区域显示控制方法、电子装置及存储介质
CN117156101A (zh) 车载摄像头视频数据处理方法、中央计算单元及设备
CN113806183B (zh) 应用卡顿处理方法、装置、设备、存储介质和程序产品
CN114286082A (zh) 一种电厂摄像头异常检测系统、电子设备及存储介质
CN113360327A (zh) 触控屏故障检测方法、装置及设备
CN113419915A (zh) 云终端桌面静止确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant