CN101833494A - 一种硬件健康状态监控方法 - Google Patents

一种硬件健康状态监控方法 Download PDF

Info

Publication number
CN101833494A
CN101833494A CN201010164132A CN201010164132A CN101833494A CN 101833494 A CN101833494 A CN 101833494A CN 201010164132 A CN201010164132 A CN 201010164132A CN 201010164132 A CN201010164132 A CN 201010164132A CN 101833494 A CN101833494 A CN 101833494A
Authority
CN
China
Prior art keywords
interface
abstract
hardware
platform
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010164132A
Other languages
English (en)
Inventor
乔英良
班华堂
黄家明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Langchao Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Langchao Electronic Information Industry Co Ltd filed Critical Langchao Electronic Information Industry Co Ltd
Priority to CN201010164132A priority Critical patent/CN101833494A/zh
Publication of CN101833494A publication Critical patent/CN101833494A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供一种硬件健康状态监控方法,包括运行环境编程接口层、硬件抽象层、调度集成层;将运行环境编程接口和硬件访问机制分别进行抽象,通过调度集成层进行统一访问,结合编译时静态配置机制和运行时动态检测机制,实现多种运行环境、多种硬件平台、多种总线接口和多种传感器芯片的灵活组合。本发明提及的软件架构机制简单,可移植性和可扩展性强,极具实用性。

Description

一种硬件健康状态监控方法
技术领域
本发明涉及一种计算机应用技术领域或一种计算机/工控设备硬件健康状态监控领域,具体涉及一种可移植、可扩展的用于硬件健康状态监控方法。
硬件健康状态监控方法。
背景技术
在科学计算、商用服务、工业控制等领域,各种服务器、存储、工控设备均起着神经枢纽的作用,一旦出现故障,轻则导致服务中断、设备故障,重则危及到国家和人民生命和财产的安全。用户在追求系统高性能、高容量、高密度等指标的同时,更看重的是系统的可靠性和稳定性。但伴随着技术的发展、系统的复杂度也呈几何级数增长,系统管理人员不可能靠人工去监控每台服务器/工控设备的状态,因此能够方便的对硬件健康状态进行监控是衡量系统易用性的一个重要标志。
针对这种情况,业界陆续出现了一些对硬件健康状态进行监控的方法,但归根到底,都是通过对各种传感器芯片进行控制,完成数据采集、设备调控的功能。这些解决方法共分为软件实现和硬件实现两大类。通过软件方式进行实现的主要有:Windows下的everest、cpu-z,Linux下的lm-sensors等,这类方案的共同点是依赖于特定操作系统驱动程序框架进行实现,依赖于操作系统的实现,可扩展性和可移植性较差。通过硬件方式进行实现的主要有各种专用单片机/嵌入式系统及IPMI,其中专用单片机/嵌入式系统往往与被监控目标平台耦合过紧,难于扩展;而IPMI作为开放性管理标准,规范性、可扩展性均较强,且独立于操作系统,与其他解决方案相比具有很大优势,但该解决方案也存在缺点,即需要在目标平台上集成BMC,这个限制使其无法对已设计好的、不遵循IPMI标准的硬件平台进行监控,且会大大增加硬件成本。
因此业界迫切的需要一种可移植、可扩展的软件解决方案,本发明正是针对此而发明设计。
发明内容
本发明的目的是提供一种硬件健康状态监控方法。
本发明的目的是按以下方式实现的,包括:运行环境编程接口层Runtime APILayer,RAL、硬件抽象层Hardware Abstraction Layer,HAL、调度集成层ScheduleIntegration Layer,SIL;其中:
运行环境编程接口层,负责实现对具体运行环境相关API的抽象,提供抽象运行环境编程接口;实现基本数据类型,包括:布尔型、8/16/32位带符号/无符号整型、容器类型:包括链表、队列、集合、映射的定义,及算法库、抽象入口点;寄存器访问,包括:内存映射空间/IO映射空间访问、内存分配、字符串操作、文件操作、输入输出流、网络套接字的接口,在运行时刻只与某个特定具体运行环境相关联,通过编译时静态配置机制实现;
硬件抽象层,包括:平台抽象组件、总线/接口抽象组件、传感器抽象组件,负责实现对不同硬件访问监控机制的抽象;其中:
平台抽象组件,包括:对具体硬件系统平台包括Intel D5400XS、IntelS5000VSA、Supermicro X7DB8、Tyan S2932WG2NR、Atmel AT91CAP9、SamsungSMDK6400特性的实现,还包括该平台支持的监控总线/接口、特定总线/接口的访问方式,内存映射空间/IO映射空间、访问特定总线/接口的寄存器操作基地址及抽象平台特性访问接口,抽象平台特性访问接口在运行时刻只与某个特定具体平台特性相关联,通过编译时静态配置机制实现;
总线/接口抽象组件包括:对具体总线/接口,包括:I2C/SMBUS、LPC、SuperI/O、CAN的访问方式的实现;及抽象总线/接口访问方式接口,抽象总线/接口访问方式接口在运行时刻对应多个具体总线/接口,通过运行时的动态检测机制实现;
传感器抽象组件,通过传感器访问机制,对具体传感器芯片,包括:ADM1026、IT8705F、LM85、LM92、PC87427、MAX6640、W83793G的访问方式实现及抽象传感器访问接口;其中,抽象传感器访问接口在运行时刻对应多个具体传感器芯片,通过运行时的动态检测机制实现;
硬件访问监控机制通过编译时静态配置机制和运行时动态检测机制相结合进行实现。
编译时静态配置机制实质上是通过编译时的配置进行预处理条件编译实现的,其步骤为:
1)配置编译针对的目标运行环境;
2)配置编译针对的目标硬件平台;
3)预处理、交叉编译、汇编、链接;
4)最终生成可执行目标程序。
运行时动态检测机制,其步骤为:
1)循环遍历程序支持的传感器芯片集合,判断目标硬件平台是否存在该传感器芯片;
2)生成支持目标平台的传感器芯片集合;
3)循环遍历支持目标平台的传感器芯片集合,获取所有传感器信息。
传感器访问,其步骤为:
1)调用传感器访问接口;
2)调用总线/接口访问接口;
3)调用寄存器访问接口。
本发明的优异效果是针对现有硬件健康监控方案的不足,提出一种可移植、可扩展的用于硬件健康状态监控的软件架构。本发明将运行环境编程接口和硬件访问机制分别进行抽象,通过调度集成层进行统一访问,结合编译时静态配置机制和运行时动态检测机制,实现多种运行环境、多种硬件平台、多种总线接口和多种传感器芯片的灵活组合。本发明提及的软件架构机制简单,可移植性和可扩展性强,极具实用性。
附图说明
附图1为用于硬件监控的软件架构示意图;
附图2为编译时静态配置机制示意图;
附图3为运行时动态检测机制示意图;
附图4为传感器访问机制示意图。
具体实施方式
参照说明书附图对本发明的硬件健康状态监控方法作以下详细地说明。
本发明的一种硬件健康状态监控方法,其结构是由本发明的核心思想是提供一个软件架构,将运行环境编程接口和硬件访问机制分别进行抽象,通过调度集成层进行统一访问,移植性和可扩展性强。
一种可移植、可扩展的用于硬件健康状态监控的软件架构,其特征在于,包括:运行环境编程接口层(Runtime API Layer,RAL)、硬件抽象层(HardwareAbstraction Layer,HAL)、调度集成层(Schedule Integration Layer,SIL),如附图1所示。
所述运行环境编程接口层负责实现对不同运行环境下的编程接口的抽象;
所述硬件抽象层负责实现对不同硬件访问机制的抽象;
所述调度集成层负责整合其他层提供的接口,实现硬件监控功能。
所述运行环境编程接口层负责实现对具体运行环境(如Windows、Linux、BSD、AIX、Solaris、Vxworks、QNX、EFI等)相关API的抽象,提供抽象运行环境编程接口,实现基本数据类型(如布尔型、8/16/32位带符号/无符号整型等)、容器类型(如链表、队列、集合、映射等)定义,及算法库、抽象入口点、寄存器访问(内存映射空间/IO映射空间访问)、内存分配、字符串操作、文件操作、输入输出流、网络套接字等接口。
所述运行环境编程接口层在运行时刻只与某个特定具体运行环境相关联,通过编译时静态配置机制实现。
所述硬件抽象层包括:平台抽象组件、总线/接口抽象组件、传感器抽象组件。
所述平台抽象组件包括:对具体硬件系统平台(如Intel D5400XS、IntelS5000VSA、Supermicro X7DB8、Tyan S2932WG2NR、Atmel AT91CAP9、SamsungSMDK6400等)特性的实现,如该平台支持何种监控总线/接口、特定总线/接口的访问方式(内存映射空间/IO映射空间)、访问特定总线/接口的寄存器操作基地址等;及抽象平台特性访问接口。
所述抽象平台特性访问接口在运行时刻只与某个特定具体平台特性相关联,通过编译时静态配置机制实现。
所述总线/接口抽象组件包括:对具体总线/接口(如I2C/SMBUS、LPC、SuperI/O、CAN等)访问方式的实现;及抽象总线/接口访问方式接口。
所述抽象总线/接口访问方式接口在运行时刻可对应多个具体总线/接口,通过运行时的动态检测机制实现。
所述传感器抽象组件,通过传感器访问机制对具体传感器芯片(如ADM1026、IT8705F、LM85、LM92、PC87427、MAX6640、W83793G等)访问方式的实现;及抽象传感器访问接口。
所述抽象传感器访问接口在运行时刻可对应多个具体传感器芯片,通过运行时的动态检测机制实现。
所述硬件监控机制通过编译时静态配置机制和运行时动态检测机制相结合进行实现。
所述编译时静态配置机制实质上是通过编译时的配置进行预处理条件编译实现的,其步骤如下,如附图2所示:
1)配置编译针对的目标运行环境;
2)配置编译针对的目标硬件平台;
3)预处理、交叉编译、汇编、链接;
4)最终生成可执行目标程序。
所述运行时动态检测机制,其步骤如下,如附图3所示:
1)循环遍历程序支持的传感器芯片集合,判断目标硬件平台是否存在该传感器芯片;
2)生成支持目标平台的传感器芯片集合;
3)循环遍历支持目标平台的传感器芯片集合,获取所有传感器信息。
所述传感器访问机制,其步骤如下,如附图4所示:
1)调用传感器访问接口;
2)调用总线/接口访问接口;
3)调用寄存器访问接口。

Claims (4)

1.一种硬件健康状态监控方法,其特征在于,包括:运行环境编程接口层Runtime API Layer,RAL、硬件抽象层Hardware Abstraction Layer,HAL、调度集成层Schedule Integration Layer,SIL;其中:
运行环境编程接口层,负责实现对具体运行环境相关API的抽象,提供抽象运行环境编程接口;实现基本数据类型,包括:布尔型、8/16/32位带符号/无符号整型、容器类型:包括链表、队列、集合、映射的定义,及算法库、抽象入口点;寄存器访问,包括:内存映射空间/I0映射空间访问、内存分配、字符串操作、文件操作、输入输出流、网络套接字的接口,在运行时刻只与某个特定具体运行环境相关联,通过编译时静态配置机制实现;
硬件抽象层,包括:平台抽象组件、总线/接口抽象组件、传感器抽象组件,负责实现对不同硬件访问监控机制的抽象;其中:
平台抽象组件,包括:对具体硬件系统平台包括Intel D5400XS、IntelS5000VSA、Supermicro X7DB8、Tyan S2932WG2NR、Atmel AT91CAP9、SamsungSMDK6400特性的实现,还包括该平台支持的监控总线/接口、特定总线/接口的访问方式,内存映射空间/IO映射空间、访问特定总线/接口的寄存器操作基地址及抽象平台特性访问接口,抽象平台特性访问接口在运行时刻只与某个特定具体平台特性相关联,通过编译时静态配置机制实现;
总线/接口抽象组件包括:对具体总线/接口,包括:I2C/SMBUS、LPC、SuperI/O、CAN的访问方式的实现;及抽象总线/接口访问方式接口,抽象总线/接口访问方式接口在运行时刻对应多个具体总线/接口,通过运行时的动态检测机制实现;
传感器抽象组件,通过传感器访问机制,对具体传感器芯片,包括:ADM1026、IT8705F、LM85、LM92、PC87427、MAX6640、W83793G的访问方式实现及抽象传感器访问接口;其中,抽象传感器访问接口在运行时刻对应多个具体传感器芯片,通过运行时的动态检测机制实现;
硬件访问监控机制通过编译时静态配置机制和运行时动态检测机制相结合进行实现。
2.根据权利要求1所述的方法,其特征在于,编译时静态配置机制实质上是通过编译时的配置进行预处理条件编译实现的,其步骤为:
1)配置编译针对的目标运行环境;
2)配置编译针对的目标硬件平台;
3)预处理、交叉编译、汇编、链接;
4)最终生成可执行目标程序。
3.根据权利要求1所述的方法,其特征在于,运行时动态检测机制,其步骤为:
1)循环遍历程序支持的传感器芯片集合,判断目标硬件平台是否存在该传感器芯片;
2)生成支持目标平台的传感器芯片集合;
3)循环遍历支持目标平台的传感器芯片集合,获取所有传感器信息。
4.根据权利要求1所述的软件架构,其特征在于,传感器访问机制,其步骤为:
1)调用传感器访问接口;
2)调用总线/接口访问接口;
3)调用寄存器访问接口。
CN201010164132A 2010-05-06 2010-05-06 一种硬件健康状态监控方法 Pending CN101833494A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010164132A CN101833494A (zh) 2010-05-06 2010-05-06 一种硬件健康状态监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010164132A CN101833494A (zh) 2010-05-06 2010-05-06 一种硬件健康状态监控方法

Publications (1)

Publication Number Publication Date
CN101833494A true CN101833494A (zh) 2010-09-15

Family

ID=42717570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010164132A Pending CN101833494A (zh) 2010-05-06 2010-05-06 一种硬件健康状态监控方法

Country Status (1)

Country Link
CN (1) CN101833494A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708033A (zh) * 2011-01-28 2012-10-03 霍尼韦尔国际公司 优化基于条件的健康维护系统的性能的方法和可重配置系统
CN104375840A (zh) * 2014-12-02 2015-02-25 浪潮电子信息产业股份有限公司 一种可移植、可扩展的用于硬件健康状态监控的软件架构
CN106802852A (zh) * 2017-01-19 2017-06-06 郑州云海信息技术有限公司 一种Linux平台组件统一监控的方法
CN110209495A (zh) * 2019-05-17 2019-09-06 上海新储集成电路有限公司 一种运行环境调整方法及系统
CN117149666A (zh) * 2023-10-31 2023-12-01 中国铁塔股份有限公司 Ai芯片平台及ai芯片平台的测试方法、装置及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708033A (zh) * 2011-01-28 2012-10-03 霍尼韦尔国际公司 优化基于条件的健康维护系统的性能的方法和可重配置系统
CN102708033B (zh) * 2011-01-28 2016-07-06 霍尼韦尔国际公司 优化基于条件的健康维护系统的性能的方法和可重配置系统
CN104375840A (zh) * 2014-12-02 2015-02-25 浪潮电子信息产业股份有限公司 一种可移植、可扩展的用于硬件健康状态监控的软件架构
CN106802852A (zh) * 2017-01-19 2017-06-06 郑州云海信息技术有限公司 一种Linux平台组件统一监控的方法
CN110209495A (zh) * 2019-05-17 2019-09-06 上海新储集成电路有限公司 一种运行环境调整方法及系统
CN110209495B (zh) * 2019-05-17 2023-08-18 上海新储集成电路有限公司 一种运行环境调整方法及系统
CN117149666A (zh) * 2023-10-31 2023-12-01 中国铁塔股份有限公司 Ai芯片平台及ai芯片平台的测试方法、装置及系统

Similar Documents

Publication Publication Date Title
US20210014133A1 (en) Methods and apparatus to coordinate edge platforms
Czarnul et al. Energy-aware high-performance computing: survey of state-of-the-art tools, techniques, and environments
EP3975476A1 (en) Trust-based orchestration of an edge node
EP4033693B1 (en) Trusted computing base evidence binding for a migratable virtual machine
Hill et al. The platforms enabling wireless sensor networks
CN102541619B (zh) 虚拟机管理装置和方法
CN103064784B (zh) 面向Xen环境的运行时内存泄漏检测方法及其实现系统
CN114253793A (zh) 动态追踪控制
CN114365452A (zh) 用于在边缘计算环境中证明对象的方法和装置
US9612930B2 (en) Providing autonomous self-testing of a processor
CN101833494A (zh) 一种硬件健康状态监控方法
US20120271935A1 (en) Coordinating data center compute and thermal load based on environmental data forecasts
US9891685B1 (en) Reconfigurable backup battery unit
CN105184166A (zh) 基于内核的安卓程序实时行为分析方法及系统
CN102819478B (zh) 一种无代理的数据处理系统监控与管理方法
US20210258265A1 (en) Resource management for components of a virtualized execution environment
US20210044646A1 (en) Methods and apparatus for re-use of a container in an edge computing environment
CN114253658A (zh) 边缘计算的持续测试、集成和部署管理
CN104375840A (zh) 一种可移植、可扩展的用于硬件健康状态监控的软件架构
US10248486B2 (en) Memory monitor
CN116615719A (zh) 生成用于在数据中心中电隔离故障域的配置的技术
Strazdins et al. Scientific application performance on hpc, private and public cloud resources: A case study using climate, cardiac model codes and the npb benchmark suite
Abdali-Mohammadi et al. Toward a fault tolerant architecture for vital medical-based wearable computing
CN104462955A (zh) 一种基于虚拟化的主机行为主动检测系统及方法
TW201633125A (zh) 資料備份技術

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100915