CN112799917B - 一种数据处理方法、装置及设备 - Google Patents

一种数据处理方法、装置及设备 Download PDF

Info

Publication number
CN112799917B
CN112799917B CN202110184430.3A CN202110184430A CN112799917B CN 112799917 B CN112799917 B CN 112799917B CN 202110184430 A CN202110184430 A CN 202110184430A CN 112799917 B CN112799917 B CN 112799917B
Authority
CN
China
Prior art keywords
kernel
acquisition
operation data
uefi
operating system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110184430.3A
Other languages
English (en)
Other versions
CN112799917A (zh
Inventor
孙瑞琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202110184430.3A priority Critical patent/CN112799917B/zh
Publication of CN112799917A publication Critical patent/CN112799917A/zh
Application granted granted Critical
Publication of CN112799917B publication Critical patent/CN112799917B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种数据处理方法,所述方法包括:电子设备的统一可扩展固件接口UEFI监测位于基板管理控制器BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据。本申请还公开了一种数据处理装置、设备。

Description

一种数据处理方法、装置及设备
技术领域
本申请涉及计算机技术,尤其涉及一种数据处理方法、装置及设备。
背景技术
在云数据中心,由于服务器系统软硬件异常或某些应用服务运行异常,造成服务器负载过高、性能下降甚至死机,服务器需要进行全面诊断、分析并修复。通常情况下,需要采集服务器完整的运行数据,其中,采集的运行数据包括:底层硬件状态、固件(Firmware)运行状态、操作系统(Operation System,OS)内核状态、应用程序进程状态等。
相关技术中,在操作系统中设置有监控程序,但服务器系统软硬件异常时,操作系统本身处于异常状态。运行在操作系统内的监控程序不能正常工作,无法进行监控数据的采集,OS的运行数据无法及时获取。
发明内容
有鉴于此,本申请实施例提供一种数据处理方法、装置及设备。
本申请实施例的技术方案是这样实现的:
一方面,本申请实施例提供的一种数据处理方法,包括:
电子设备的统一可扩展固件接口(Unified Extensible Firmware Interface,UEFI)监测位于基板管理控制器(Baseboard Management Controller,BMC)内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;
当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据。
一方面,本申请实施例提供的一种数据处理装置,应用于电子设备的UEFI,包括:
监测单元,用于监测位于BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;
采集单元,用于当所述内核采集标识指示进行运行数据的采集,采集位于所述操作系统的内核中的所述运行数据。
一方面,本申请实施例还提供一种电子设备,所述电子设备包括:UEFI、BMC和操作系统;
所述BMC,用于存储内核采集标识;所述内核采集标识用于指示是否进行所述操作系统的运行数据的采集;
所述操作系统,用于在内核中存储所述运行数据;
所述UEFI,用于监测所述内核采集标识,当所述内核采集标识指示进行运行数据的采集,在所述内核采集所述运行数据。
一方面,本申请实施例还提供一种电子设备,所述电子设备包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述数据处理方法的步骤。
一方面,本申请实施例还提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现上述数据处理方法。
本申请实施例中,电子设备的UEFI监测位于BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据,从而在BMC、UEFI和操作系统之间建立一条控制操作系统的数据采集的通路,基于BMC中的内核采集标识的控制,由UEFI在在所述操作系统的内核中采集运行数据,能够完整的采集到操作系统中的运行数据,即使在操作系统异常的情况下,也能够及时的采集到操作系统中的运行数据。
附图说明
图1为本申请实施例电子设备的可选的结构示意图;
图2为本申请实施例电子设备的可选的结构示意图;
图3为本申请实施例电子设备的可选的结构示意图;
图4为本申请实施例数据处理方法的可选的流程示意图;
图5为本申请实施例电子设备的可选的结构示意图;
图6为本申请实施例电子设备的可选的结构示意图;
图7为本申请实施例数据处理方法的可选的流程示意图;
图8为本申请实施例数据处理装置的可选的结构示意图;
图9为本申请实施例电子设备的可选的结构示意图。
具体实施方式
以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本申请,并不用于限定本申请。另外,以下所提供的实施例是用于实施本申请的部分实施例,而非提供实施本申请的全部实施例,在不冲突的情况下,本申请实施例记载的技术方案可以任意组合的方式实施。
在本申请的各种实施例中:电子设备的UEFI监测位于BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据。
本申请实施例提供一种数据处理方法,该方法应用于数据处理装置,数据处理装置中的各功能模块可以由电子设备(如终端设备、服务器或服务器集群)的硬件资源,如处理器等计算资源和通信资源协同实现。
电子设备可以是任何具有信息处理能力的电子设备,在一种实施例中,电子设备可以是智能终端,例如可以是笔记本等具有无线通信能力的移动终端。在另一种实施例中,电子设备还可以是不便移动的具有计算功能的终端设备,比如台式计算机、桌面电脑、服务器等。
本申请实施例中,如图1所示,电子设备100包括:BMC101、UEFI102和OS103。
OS103用于处理管理与配置内存、决定系统资源供需的优先次序、控制输入设备与输出设备、操作网络与管理文件系统等基本事务,还可提供一个让用户与系统交互的操作界面。OS的内核中存储有运行数据。
BMC101是电子设备的基本核心功能子系统,是一个带外系统,即独立于电子设备的操作系统之外的操作系统,不依赖于电子设备上的其他硬件(比如:CPU、内存等),也不依赖于OS,可以与OS进行交互。BMC负责电子设备的硬件状态管理、操作系统管理、健康状态管理、功耗管理等核心功能。
其中,BMC中设置有采集标识位,采集标识为用于指示是否进行操作系统的运行数据的采集。
UEFI102,用于加电自检、联系操作系统以及提供连接操作系统与硬件的接口。
其中,UEFI用于监测位于基板管理控制器BMC内的内核采集标识,当所述内核采集标识指示进行运行数据的采集,采集位于所述操作系统的内核中的所述运行数据。
如图2所示,OS103中包括有内核1031,内核1031负责管理操作系统的进程、内存、设备驱动程序、文件和网络系统,决定着操作系统的性能和稳定性。其中,内核1031中存储有运行数据。
在一示例中,如图3所示,OS103中包括有至少两个内核1031,其中,在至少两个内核中,在一个时刻,仅有一个内核在工作。
当然,本申请实施例不局限于提供为方法和硬件,还可有多种实现方式,例如提供为存储介质(存储有用于执行本申请实施例提供的数据处理方法的指令)。
图4为本申请实施例数据处理方法的实现流程示意图,如图4所示,该数据处理方法包括:
S401、电子设备的UEFI监测位于BMC内的内核采集标识。
本申请实施例中,BMC内设置有内核采集标识,所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集。
本申请实施例中,内核采集标识指示是否进行所述电子设备的操作系统的运行数据的采集的指示方式包括以下之一:
方式一、通过同一内核采集标识不同的取值来指示是否进行所述电子设备的操作系统的运行数据的采集。
方式二、通过不同的内核采集标识来指示是否进行所述电子设备的操作系统的运行数据的采集。
在方式一中,内核采集标识包括第一参考值和第二参考值,当内核采集标识为第一参考值,则指示进行所述电子设备的操作系统的运行数据的采集;当内核采集标识为第二参考值,则指示进行所述电子设备的操作系统的运行数据的采集。在一示例中,第一参考值为1,第二参考值为0。本申请实施例对第一参考值和第二参考值的取值不进行任何限定。
在方式二中,内核采集标识包括:采集标识位和非采集标识位,当采集标识位有效,则指示进行所述电子设备的操作系统的运行数据的采集,当非采集标识位有效,则指示不进行所述电子设备的操作系统的运行数据的采集。本申请实施例中,采集标识位和非采集标识位是否有效可根据其自身的值确定,也可根据其是否对应存在指示其有效的有效标识确定。
在一示例中,内核采集标识包括:采集标识位A1和非采集标识位A2,当采集标识位A1为1,则采集标识位A1有效,当采集标识位A1为0,则采集标识位A1无效;当非采集标识位A2为1,则非采集标识位A2有效,当非采集标识位A2为0,则非采集标识位A2无效。
在一示例中,内核采集标识包括:采集标识位A1和非采集标识位A2,当采集标识位A1对应存在有效标识V1,则采集标识位A1有效,当非采集标识位A2对应存在有效标识V2,则非采集标识位A2有效。
当电子设备启动时,BMC初始化为内核采集标识为第二参考值;当BMC检测到指定事件时,置内核采集标识为第一参考值。其中,指定事件包括以下事件至少之一:接收到用户指示进行运行数据采集的采集命令,操作系统异常,接收到周期性触发的采集指令等。本申请实施例对指定事件不进行任何限定。
电子设备接收用户指示进行运行数据采集的采集命令的情况下,电子设备可通过:界面交互、语音输入、物理按键控制等方式接收用户的输入操作,并基于接收到的输入操作生成采集指令。
本申请实施例中,如图5所示,BMC包括有:交互接口1011,BMC通过交互接口与UEFI、操作系统进行交互。当交互接口检测到指定事件,则调整内核采集标识,使得内核采集标识指示进行运行数据的采集。在一示例中,交互接口为智能平台管理接口(Intelligent Platform Management Interface,IPMI)。
UEFI可周期性的监测BMC中的内核采集标识,也可基于定时器的触发监测BMC中的内核采集标识,也可在接收到操作系统的监测指令的情况下监测BMC中的内核采集标识。
UEFI通过与BMC之间的交互接口获取BMC的内核采集标识,以确定内核采集标识当前用于指示进行操作系统的运行数据的采集还是不进行操作系统的运行数据的采集。
在一些实施例中,UEFI可包括内核采集服务,其中,内核采集服务位于UEFI运行时服务中,UEFI运行时服务是与OS同时运行的后台服务,因此,当OS运行时,内核采集服务运行在后台,以进行内核采集标识的监测。
S402、当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据。
当UEFI监测到内核采集标识指示进行运行数据的采集,则UEFI在OS的内核内进行运行数据的采集。其中,UEFI可从OS的内核中进行运行数据的采集,也可指示OS的内核进行运行数据的采集。此时,UEFI可停止对BMC内的内核采集标识的监控。
这里,操作系统的运行数据存储在OS的内核中,且从内核中进行运行数据的采集。运行数据包括:底层硬件状态、固件运行状态、OS内核状态、应用程序进程状态等,本申请实施例对运行数据的内容不进行任何限定。
位于内核内的运行数据可以内核文件的方式存储在内核中,此时,在内核中进行文件的读取。
本申请实施例提供的数据处理方法可至少应用于以下场景:
场景一、当电子设备的操作系统出现异常,BMC基于操作系统的异常,对内核采集标识进行置位,使得内核采集标识指示进行操作系统的运行数据的采集;UEFI检测到操作系统出现异常,开始监测内核采集标识,当UEFI监测到内核采集标识指示进行操作系统的运行数据的采集,则在操作系统的内核中进行运行数据的采集。
场景二、电子设备提供有管理页面,且管理页面中提供有接收用户指示进行运行数据采集的控件,当用户点击该控件,则电子设备生成采集命令,BMC基于该采集命令,对内核采集标识进行置位,使得内核采集标识指示进行操作系统的运行数据的采集,UEFI周期性的进行内核采集标识的监测,当监测到内核采集标识指示进行运行数据的采集,则在操作系统的内核中进行运行数据的采集。
本申请实施例中,电子设备的UEFI监测位于BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据,从而在BMC、UEFI和操作系统之间建立一条控制操作系统的数据采集的通路,基于BMC中的内核采集标识的控制,由UEFI在在所述操作系统的内核中采集运行数据,能够完整的采集到操作系统中的运行数据,即使在操作系统异常的情况下,也能够及时的采集到操作系统中的运行数据。
在一些实施例中,所述UEFI监测的内核采集标识包括:至少两个内核中各内核对应的内核采集标识;S401的实施包括:当所述至少两个内核采集标识中的目标内核采集标识指示进行运行数据的采集,所述UEFI在所述操作系统中的目标内核中采集所述运行数据;所述目标内核与所述目标采集内核标识对应。
如图3所示,操作系统中包括至少两个内核,BMC中对应各内核设置有对应的内核采集标识。UEFI监测到BMC中某一内核对应的内核采集标识指示进行运行数据的采集,则将该内核作为目标内核,在该目标内核中进行运行数据的采集。
在一示例中,操作系统中包括:内核A和内核B,BMC中对应设置有对应内核A的内核采集标识A,和对应内核B的内核采集标识B,UEFI对BMC中的内核采集标识A和内核采集标识B进行监控,当监测到内核采集标识A指示进行运行数据的采集,则在内核A中进行运行数据的采集。
在一示例中,操作系统中包括:内核A和内核B,BMC中对应设置有对应内核A的内核采集标识A:采集标识位A1和非采集标识位A2,和对应内核B的内核采集标识的内核采集标识B:采集标识位B1和非采集标识位B2,UEFI对BMC中的内核采集标识A和内核采集标识B进行监控,当监测到采集标识位A1有效,则认为内核采集标识A指示进行运行数据的采集,在内核A中进行运行数据的采集。
本申请实施例中,在操作系统包括多个内核的情况下,对BMC中各内核对应的内核采集标识进行监测,并在监测结果所指示的内核中进行运行数据的采集,避免在不具备运行数据的内核中进行运行数据的采集。
在一实施例中,S401的实施包括:
S4011、当所述内核采集标识指示进行运行数据的采集,所述UEFI触发系统中断。
当UEFI监测到内核采集标识指示进行运行数据的采集,或监测到目标内核对应的内核采集标识指示进行运行数据的采集,则触发系统中断。
这里,系统中断的优先级大于其他系统指令的优先级,UEFI优先处理系统中断。
S4012、所述UEFI将所述系统中断发送至所述操作系统的内核。
所述系统中断用于指示所述操作系统的内核复制所述运行数据至指定位置。
UEFI将所触发的系统中断发送至内核或目标内核,以指示将内核中的运行数据复制到指令位置。这里,指定位置可位于操作系统中,也可位于BMC中。
在一示例中,当操作系统中包括一个内核,UEFI101将系统中断发送至操作系统103中的内核1031,指示内核1031将运行数据复制到指定位置。
在一示例中,电子设备的操作系统中包括多个内核:内核1、内核2和内核3,其中,UEFI将系统中断发送至操作系统中处于正在工作的内核2,指示正在工作的内核2将运行数据复制到指定位置。
在一示例中,电子设备的操作系统中包括多个内核:内核1、内核2和内核3,其中,UEFI监测到内核1对应的内核采集标识指示进行运行数据的采集,则将系统中断发送至目标内核:内核1,指示内核1将运行数据复制到指定位置。
本申请实施例中,内核中设置有数据采集服务,当内核接收到UEFI发送的系统中断,则启动数据采集服务,数据采集服务复制内核中的运行数据,并将复制的运行数据发送至指定位置。
本申请实施例中,当UEFI监测到内核采集标识指示进行运行数据的采集的情况下,触发系统中断,并通过与OS之间的通路,将系统中断发送至OS的内核,指示内核进行运行数据的采集,从而在操作系统负载过高或死机的情况下,能够正常进行运行数据的采集,运行数据的采集过程不受操作系统的应用程序的影响。
本申请实施例中,UEFI还设置有采集进度标识,以表征运行数据的采集进度。其中,采集进度标识的值可包括:第一值、第二值和第三值;当采集进度标识为第一值,表征当前未开始所述运行数据的采集,即运行数据采集进度为:未开始采集;当采集进度标识为第二值,表征当已经开始进行运行数据的采集,即运行数据采集进度为:开始采集,此时,电子设备正在进行运行数据的采集;当采集进度标识为第三值,表征当已经完成运行数据的采集,即运行数据采集进度为:采集完成。
这里,第一值、第二值、第三值为不同的值,本申请实施例对第一值、第二值和第三值的取值不进行任何限定。
在一实施例中,所述UEFI初始化采集进度标识为第一值;所述第一值的所述采集进度标识表征当前未开始所述运行数据的采集;其中,当所述采集进度标识为所述第一值,所述UEFI监测所述内核采集标识。
这里,在采集进度标识为第一值的情况下,UEFI确定当前未进行运行数据的采集,则对BMC中的内核采集标识进行监控,否则,不对BMC中的采集内核标识进行监控。
本申请实施例中,UEFI初始化采集进度标识为第一值的时机包括:
时机一、电子设备启动时;
时机二、内核采集标识从指示进行运行数据的状态切换至指示不进行数据采集的状态。
对于时机一,当电子设备启动时,UEFI进行初始化,将采集进度标识初始化为第一值。
对于时机二,当内核采集标识从指示进行运行数据的状态切换至指示不进行数据采集的状态,当内核采集标识指示进行运行数据的状态,则UEFI在内核进行运行数据的采集,且停止对内核采集标识的监控,当UEFI确定完成在内核中进行的运行数据的采集,则内核采集标识进行状态的切换,指示不进行运行数据的采集,此时,UEFI将采集进度标识初始化为第一值,以继续对内核采集标识进行监控,确定是否进行下一次的运行数据的采集。
在一实施例中,所述UEFI采集所述运行数据时,设置采集进度标识为第二值,其中,当所述采集进度标识为所述第二值,所述UEFI停止监测所述内核采集标识。
当UEFI采集运行数据时,将采集进度标识置为第二值,以指示UEFI当前停止对内核采集标识的监测。
在一实施例中,所述UEFI接收所述操作系统的采集完成指令;所述采集完成指令指示完成所述运行数据的采集;所述UEFI基于所述采集完成指令的接收,设置采集进度标识为第三值,所述第三值的所述采集进度标识表征完成所述运行数据的采集。
当操作系统中的内核完成运行数据的复制后,触发采集完成指令,并将采集完成执行发送至UEFI,以指示UEFI完成内核中的运行数据的采集,UEFI接收到操作系统发送的采集完成指令后,设置采集进度标识为第三值,以表征完成本次运行数据的采集。
本申请实施例中,通过采集进度标识和内核采集标识的配合,通过内核采集标识控制运行数据的采集的同时,通过采集进度标识对内核采集标识的监控进行控制,实现运行数据的采集和内核采集标识的监控的有序执行。
在一实施例中,当所述UEFI接收到所述操作系统的采集完成指令,向所述BMC发送清除指令;所述清除指令指示所述BMC调整所述内核采集标识,使得所述内核采集标识指示不进行运行数据的采集。
所述UEFI接收到所述操作系统的采集完成指令,将采集进度标识设置为所述第三值的同时,向BMC发送清除指令,清除指令用于指示清除内核采集标识的指示进行运行数据采集的内核采集标识的状态,使得该内核采集标识指示不进行运行数据的采集,即将内核采集标识从指示进行运行数据的状态切换至指示不进行运行数据的采集的状态。
本申请实施例中,通过内核采集标识对运行数据的采集过程进行控制,并通过运行数据的采集过程对内核采集标识进行控制,从而保证电子设备的数据采集过程的高效执行。
下面,以电子设备为云数据中心的服务器为例,对本申请实施例提供的数据处理方法进行进一步描述。
相关技术中,在云数据中心,服务器底层的硬件和固件状态数据可以通过服务器带外系统,即BMC获取。然而,OS及其内部运行的应用程序的监控数据,无法及时通过BMC获取。尤其是当服务器死机时,运行在服务器内部的监控程序不能正常工作,其采集到的数据也发送不出来;并且也无法通过网络登录到该服务器内部进行查看。另一方面,为了避免侵入OS,减少对OS的影响,通常需要通过BMC采集OS的运行状态及其应用程序的监控数据,从而对服务器系统做全面的分析诊断。
在服务器负载过高或死机的场景中,采集到服务器系统的完整运行监控数据的方案包括:
方案一、在OS中部署数据采集程序
该方案主要依靠OS的运行,在OS中部署监控数据采集程序。如果服务器负载过高或死机,数据采集程序本身可能运行不正常,无法正常采集并传输数据。
方案二、触发OS中内核的切换
该方案中,通过IPMI向OS内核发送不可屏蔽中断(NonMaskable Interrupt,NMI),造成OS内核崩溃(panic),从而触发OS内核的崩溃转储机制:kdump操作,即OS中将当前工作内核的数据转存至捕获内核,并触发当前工作的内核崩溃,重启OS中捕获内核。OS内核的kdump操作实际上是终止了当前OS及其应用服务的运行后,采集系统状态数据,最后需要重启OS才能恢复。如果服务器系统仅仅是负载过高或应用服务异常,然而内核并没有崩溃时,该方法通过特意制造OS内核崩溃,会造成应用服务重启,并且无法保留系统异常的现场,只能用于事后分析。
本申请实施例提供的服务器如图6所示,包括:BMC601、UEFI运行时服务602和OS内核603;BMC601包括:采集标识位6011和标识位接口6012;UEFI运行时服务602包括:内核采集服务6021和采集进度标识位6022;OS内核603包括:采集模块6031。本申请实施例中,UEFI运行时服务602是与OS同时运行的后台服务。其中,
采集标识位6011,即内核采集标识,用于标识是否触发OS内核的运行数据的采集。
标识位接口6012,即交互接口,用于置位或清除采集标识位6011。
内核采集服务6021,用于监测BMC中的采集标识位6011是否置位,一旦监测到置位,则触发系统中断。
采集进度标识位6022,即采集进度标识,用于记录OS内核采集操作的执行进度。采集操作的执行进度包括:采集未开始、采集开始、采集完成等。
采集模块6031,提供有数据采集服务,负责处理UEFI运行时服务OS内核采集服务触发的系统中断,其中,基于系统中断的触发执行OS内核中运行数据的采集操作,并更新采集进度标识位,以更新采集操作的执行进度。其中,采集模块6031位于OS603的内核中。
本申请实施例提供的数据处理方法如图7所示,包括:
S701、BMC初始化采集标识位;
服务器上电,BMC启动时,初始化采集标识位即清除采集标识位,使得内核采集标识用于指示不进行操作系统内核的运行数据的采集
S702、UEFI运行时服务初始化采集进度标识位为第一值;
UEFI运行时服务初始化采集进度标识位为第一值,使得采集进度标识位所表征的采集进度为“采集未开始”。
S703、标识位接口置位采集标识位;
BMC中的标识位接口接收到用户触发的置位指令或操作系统中的应用程序发送的置位指令,对采集标识位进行置位,使得采集标识位用于指示进行操作系统内核的运行数据的采集。
S704、内核采集服务读取BMC中的采集标识位;
UEFI运行时服务中的内核采集服务读取BMC中的采集标识位,且读取结果为指示进行系统内核的运行数据的采集。
S705、内核采集服务触发系统中断。
内核采集服务读取BMC中的采集标识位的读取结果为采集标识位指示进行系统内核的运行数据的采集,内核采集服务触发系统中断。
S706、采集模块基于系统中断修改采集进度标识位为第二值;
OS内核中的采集模块接收到系统中断,则修改UEFI运行时服务的采集进度标识位为第二值,使得采集进度标识位所表征的采集进度为“采集开始”。
S707、采集模块基于系统中断启动内核数据的采集。
OS内核中的采集模块基于系统中断的触发,开始执行OS内核数据采集操作。
S708、采集模块采集内核的运行数据。
采集模块复制并压缩内核数据文件到指定位置。其中,指定位置可位于BMC中。在一示例中,内核数据文件为内核中的文件/proc/vmcore。
S709、当内核的数据采集完成后,采集模块修改采集进度标识位为第三值。
当内核的所有数据采集完毕后,采集模块修改UEFI运行时服务的采集进度标识位,使得采集进度标识位所表征的采集进度为“采集完成”。
S710、内核采集服务指示标识位接口清除采集标识位;
UEFI运行时服务的内核采集服务向标识位接口发送清除指令,标识位接口接收到清除指令,清除BMC中的采集标识位,使得采集标识位指示不进行操作系统的内核的数据的采集。
S711、内核采集服务重置采集进度标识位为第一值。
UEFI运行时服务的内核采集服务重置采集进度标识位为第一值,使得采集进度标识位所表示的采集进度为“采集未开始”。
本申请实施例提供的数据处理方法中,以BMC为入口,通过UEFI运行时服务触发OS内核及其应用程序的监控数据采集操作,从而获取服务器系统的完整运行监控数据。本申请实施例,服务器的处理包括如下几点:
1、在BMC中增加采集标识位,该采集标识位用于标识是否触发OS内核状态的采集操作,该标识位可通过BMC接口置位或清除;其中,BMC接口可为IPMI;
2、在UEFI运行时服务中增加内核采集服务,当内核采集服务检测到BMC中的采集标识位被置位后,触发中断;
3、在OS内核中增加采集模块,用于处理OS内核采集服务产生的中断,并执行系统运行数据采集操作。
本申请实施例提供的数据处理方法具有以下技术优势:
1、通过服务器带外系统触发OS的运行数据采集,不依赖OS本身的负载;
2、及时通过带外系统采集到OS及其应用的监控数据,而不影响当前OS及其用服务的运行;
3、便于系统管理员通过带外系统统一采集服务器的完整监控数据。
本申请实施例提供一种数据处理装置,应用于电子设备的UEFI,如图8所示,装置800包括:
监测单元801,用于监测位于基板管理控制器BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;
采集单元802,用于当所述内核采集标识指示进行运行数据的采集,采集位于所述操作系统的内核中的所述运行数据。
在一些实施例中,采集单元802,还用于:当所监测的内核采集标识中的目标内核采集标识指示进行运行数据的采集,在所述操作系统中的目标内核中采集所述运行数据;所述目标内核与所述目标采集内核标识对应;其中,所述检测的内核采集标识包括:至少两个内核中各内核对应的内核采集标识。
在一些实施例中,采集单元802,还用于:
当所述内核采集标识指示进行运行数据的采集,触发系统中断;
将所述系统中断发送至所述操作系统的内核;所述系统中断用于指示所述操作系统的内核复制所述运行数据至指定位置。
在一些实施例中,装置800还包括:
初始化单元,用于初始化采集进度标识为第一值;所述第一值的所述采集进度标识表征当前未开始所述运行数据的采集;其中,当所述采集进度标识为所述第一值,监测单元801监测所述内核采集标识。
在一些实施例中,装置800还包括:第一调整单元,用于:
当采集单元802采集所述运行数据时,设置采集进度标识为第二值,其中,当所述采集进度标识为所述第二值,监测单元801停止监测所述内核采集标识。
在一些实施例中,装置800还包括:第二调整单元,用于:
接收所述操作系统的采集完成指令;所述采集完成指令指示完成所述运行数据的采集;
基于所述采集完成指令的接收,设置采集进度标识为第三值,所述第三值的所述采集进度标识表征完成所述运行数据的采集。
在一些实施例中,装置800还包括:清除单元,用于:
当接收到所述操作系统的采集完成指令,向所述BMC发送清除指令;所述清除指令指示所述BMC调整所述内核采集标识,使得所述内核采集标识指示不进行运行数据的采集。
需要说明的是,本申请实施例提供的数据处理装置包括所包括的各模块,可以通过电子设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(CPU,Central Processing Unit)、微处理器(MPU,Micro ProcessorUnit)、数字信号处理器(DSP,Digital Signal Processor)或现场可编程门阵列(FPGA,Field-Programmable Gate Array)等。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
本申请实施例还提供一种电子设备,如图2或3所示,包括:BMC101、UEFI102和操作系统103;
BMC101,用于存储内核采集标识;所述内核采集标识用于指示是否进行操作系统103的运行数据的采集;
操作系统103,用于在内核1031中存储所述运行数据;
所述UEFI,用于监测所述内核采集标识,当所述内核采集标识指示进行运行数据的采集,在内核1031采集所述运行数据。
在一些实施例中,UEFI102监测的内核采集标识包括:至少两个内核中各内核对应的内核采集标识;
所述UEFI还用于:当所监测的内核采集标识中的目标内核采集标识指示进行运行数据的采集,在操作系统103中的目标内核中采集所述运行数据;所述目标内核与所述目标采集内核标识对应。
在一些实施例中,UEFI102,还用于当所述内核采集标识指示进行运行数据的采集,触发系统中断,将所述系统中断发送至所述操作系统的内核;
内核1031,用于接收到所述系统中断,复制所述运行数据至指定位置。
在一些实施例中,UEFI102,还用于初始化采集进度标识为第一值;所述第一值的所述采集进度标识表征当前未开始所述运行数据的采集;其中,当所述采集进度标识为所述第一值,UEFI102监测所述内核采集标识。
在一些实施例中,UEFI102,还用于采集所述运行数据时,设置采集进度标识为第二值,其中,当所述采集进度标识为所述第二值,所述UEFI停止监测所述内核采集标识。
在一些实施例中,操作系统103,用于完成所述运行数据的采集,触发采集完成指令;所述采集完成指令指示完成所述运行数据的采集;
UEFI102,还用于接收操作系统103的采集完成指令;
UEFI102,还用于基于所述采集完成指令的接收,设置采集进度标识为第三值,所述第三值的所述采集进度标识表征完成所述运行数据的采集。
在一些实施例中,UEFI102,还用于:
当接收到操作系统103的采集完成指令,向BMC101发送清除指令;
BMC101还用于基于所述清除指令调整所述内核采集标识,使得所述内核采集标识指示不进行运行数据的采集。
本申请实施例提供一种电子设备,图9为本申请实施例电子设备的组成结构示意图,如图9所示,所述设备900包括:一个处理器901、至少一个通信总线902、至少一个外部通信接口904和存储器905。其中,通信总线902配置为实现这些组件之间的连接通信。其中,所述设备900包括还可包括用户接口903,用户接口903可以包括API接口,外部通信接口904可以包括标准的有线接口和无线接口。
其中,所述处理器901,配置为执行存储器中存储的计算机程序,以实现以下步骤:
通过UEFI监测位于基板管理控制器BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;
当所述内核采集标识指示进行运行数据的采集,通过所述UEFI采集位于所述操作系统的内核中的所述运行数据。
相应地,本申请实施例再提供一种存储介质,即计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的数据处理方法的步骤。
以上电子设备、存储系统和计算机可读存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请电子设备、存储系统和计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
本申请实施例中,如果以软件功能模块的形式实现上述的数据处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种数据处理方法,所述方法包括:
电子设备的统一可扩展固件接口UEFI监测位于基板管理控制器BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;
当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据或指示所述操作系统的内核进行所述运行数据的采集;
其中,所述当所述内核采集标识指示进行运行数据的采集,所述UEFI触发系统中断;
所述UEFI将所述系统中断发送至所述操作系统的内核;所述系统中断用于指示所述操作系统的内核复制所述运行数据至指定位置。
2.根据权利要求1所述的方法,所述UEFI监测的内核采集标识包括:至少两个内核中各内核对应的内核采集标识;所述当所述内核采集标识指示进行运行数据的采集,所述UEFI采集位于所述操作系统的内核中的所述运行数据,包括:
当所监测的内核采集标识中的目标内核采集标识指示进行运行数据的采集,所述UEFI在所述操作系统中的目标内核中采集所述运行数据;所述目标内核与所述目标内核采集标识对应。
3.根据权利要求1所述的方法,所述方法还包括:
所述UEFI初始化采集进度标识为第一值;所述第一值的所述采集进度标识表征当前未开始所述运行数据的采集;其中,当所述采集进度标识为所述第一值,所述UEFI监测所述内核采集标识。
4.根据权利要求1或3所述的方法,所述方法还包括:
所述UEFI采集所述运行数据时,设置采集进度标识为第二值,其中,当所述采集进度标识为所述第二值,所述UEFI停止监测所述内核采集标识。
5.根据权利要求1所述的方法,所述方法还包括:
所述UEFI接收所述操作系统的采集完成指令;所述采集完成指令指示完成所述运行数据的采集;
所述UEFI基于所述采集完成指令的接收,设置采集进度标识为第三值,所述第三值的所述采集进度标识表征完成所述运行数据的采集。
6.根据权利要求1或5所述的方法,所述方法还包括:
当所述UEFI接收到所述操作系统的采集完成指令,向所述BMC发送清除指令;所述清除指令指示所述BMC调整所述内核采集标识,使得所述内核采集标识指示不进行运行数据的采集。
7.一种数据处理装置,应用于电子设备的统一可扩展固件接口UEFI,所述装置包括:
监测单元,用于监测位于基板管理控制器BMC内的内核采集标识;所述内核采集标识用于指示是否进行所述电子设备的操作系统的运行数据的采集;
采集单元,用于当所述内核采集标识指示进行运行数据的采集,采集位于所述操作系统的内核中的所述运行数据;
采集单元,还用于当所述内核采集标识指示进行运行数据的采集,触发系统中断;
将所述系统中断发送至所述操作系统的内核;所述系统中断用于指示所述操作系统的内核复制所述运行数据至指定位置。
8.一种电子设备,所述电子设备包括:基板管理控制器BMC、统一可扩展固件接口UEFI和操作系统;
所述BMC,用于存储内核采集标识;所述内核采集标识用于指示是否进行所述操作系统的运行数据的采集;
所述操作系统,用于在内核中存储所述运行数据;
所述UEFI,用于监测所述内核采集标识,当所述内核采集标识指示进行运行数据的采集,在所述内核采集所述运行数据或指示所述操作系统的内核进行所述运行数据的采集;
所述UEFI,还用于当所述内核采集标识指示进行运行数据的采集,触发系统中断,将所述系统中断发送至所述操作系统的内核;
所述内核,用于接收到所述系统中断,复制所述运行数据至指定位置。
CN202110184430.3A 2021-02-08 2021-02-08 一种数据处理方法、装置及设备 Active CN112799917B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110184430.3A CN112799917B (zh) 2021-02-08 2021-02-08 一种数据处理方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110184430.3A CN112799917B (zh) 2021-02-08 2021-02-08 一种数据处理方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112799917A CN112799917A (zh) 2021-05-14
CN112799917B true CN112799917B (zh) 2024-01-23

Family

ID=75815114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110184430.3A Active CN112799917B (zh) 2021-02-08 2021-02-08 一种数据处理方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112799917B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062271A (zh) * 2018-01-04 2018-05-22 联想(北京)有限公司 数据采集方法和系统
CN108108259A (zh) * 2018-01-11 2018-06-01 郑州云海信息技术有限公司 一种内核故障定位方法及装置
CN108153552A (zh) * 2018-01-10 2018-06-12 联想(北京)有限公司 运行过程的数据获取方法和获取系统
CN108182138A (zh) * 2018-01-24 2018-06-19 郑州云海信息技术有限公司 Bmc sel日志的获取方法、系统、装置及存储介质
CN108228298A (zh) * 2018-01-02 2018-06-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN109901957A (zh) * 2017-12-09 2019-06-18 英业达科技有限公司 以可扩展固件接口进行内存测试的计算装置及其方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080046546A1 (en) * 2006-08-18 2008-02-21 Parmar Pankaj N EFI based mechanism to export platform management capabilities to the OS
CN104915280A (zh) * 2015-06-03 2015-09-16 浪潮集团有限公司 一种基于uefi驱动方式获取计算机硬件信息的方法
CN108334413A (zh) * 2017-12-22 2018-07-27 天津麒麟信息技术有限公司 一种基于飞腾平台的固件与操作系统之间信息传递方法
US10761926B2 (en) * 2018-08-13 2020-09-01 Quanta Computer Inc. Server hardware fault analysis and recovery
US11010249B2 (en) * 2019-01-08 2021-05-18 Dell Products L.P. Kernel reset to recover from operating system errors

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109901957A (zh) * 2017-12-09 2019-06-18 英业达科技有限公司 以可扩展固件接口进行内存测试的计算装置及其方法
CN108228298A (zh) * 2018-01-02 2018-06-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN108062271A (zh) * 2018-01-04 2018-05-22 联想(北京)有限公司 数据采集方法和系统
CN108153552A (zh) * 2018-01-10 2018-06-12 联想(北京)有限公司 运行过程的数据获取方法和获取系统
CN108108259A (zh) * 2018-01-11 2018-06-01 郑州云海信息技术有限公司 一种内核故障定位方法及装置
CN108182138A (zh) * 2018-01-24 2018-06-19 郑州云海信息技术有限公司 Bmc sel日志的获取方法、系统、装置及存储介质

Also Published As

Publication number Publication date
CN112799917A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
US9720757B2 (en) Securing crash dump files
TWI584196B (zh) 基本輸入輸出系統回復管理系統、電腦程式產品 以及基本輸入輸出系統回復方法
US7197634B2 (en) System and method for updating device firmware
US6944854B2 (en) Method and apparatus for updating new versions of firmware in the background
US7805630B2 (en) Detection and mitigation of disk failures
EP3646568B1 (en) Determining an optimal timeout value to minimize downtime for nodes in a network-accessible server set
EP3206127B1 (en) Method, computer, and apparatus for migrating memory data
WO2023115999A1 (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN109254783A (zh) 一种服务器系统安装方法、装置、设备及可读存储介质
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
US9148479B1 (en) Systems and methods for efficiently determining the health of nodes within computer clusters
US20020078187A1 (en) Simple liveness protocol using programmable network interface cards
WO2004081920A2 (en) Policy-based response to system errors occuring during os runtime
CN111949320B (zh) 提供系统数据的方法、系统及服务器
US8700572B2 (en) Storage system and method for controlling storage system
US20090271654A1 (en) Control method for information processing system, information processing system, and program
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN112799917B (zh) 一种数据处理方法、装置及设备
JP2003099146A (ja) 計算機システムの起動制御方式
JP2017078998A (ja) 情報処理装置およびログ管理方法、並びにコンピュータ・プログラム
JP6124644B2 (ja) 情報処理装置および情報処理システム
US8074109B1 (en) Third-party voting to select a master processor within a multi-processor computer
US20190250994A1 (en) Backup control method and backup control system
CN117555760B (zh) 服务器监测方法及装置、基板控制器及嵌入式系统
CN117311769B (zh) 服务器日志生成方法和装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant