CN104571098B - 基于Atom平台的远程自诊断方法 - Google Patents

基于Atom平台的远程自诊断方法 Download PDF

Info

Publication number
CN104571098B
CN104571098B CN201510036789.0A CN201510036789A CN104571098B CN 104571098 B CN104571098 B CN 104571098B CN 201510036789 A CN201510036789 A CN 201510036789A CN 104571098 B CN104571098 B CN 104571098B
Authority
CN
China
Prior art keywords
atom
remote
platforms
self
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510036789.0A
Other languages
English (en)
Other versions
CN104571098A (zh
Inventor
韩德强
张强
王宗侠
何明
杜永萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201510036789.0A priority Critical patent/CN104571098B/zh
Publication of CN104571098A publication Critical patent/CN104571098A/zh
Application granted granted Critical
Publication of CN104571098B publication Critical patent/CN104571098B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0208Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the configuration of the monitoring system
    • G05B23/0213Modular or universal configuration of the monitoring system, e.g. monitoring system having modules that may be combined to build monitoring program; monitoring system that can be applied to legacy systems; adaptable monitoring system; using different communication protocols

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

基于Atom平台的远程自诊断方法,通过先进的UEFI实现目标系统启动初期系统完整性的诊断,并通过网络将诊断结果传输给远端控制中心。目标系统出现故障时,控制中心除了可以立即得到报警之外,还可以对目标系统进行远程启动、远程关机等维护工作。本发明由一种远程自诊断方法和一套自诊断装置组成,远程自诊断方法通过结合UEFI和双通道网络通信等技术,为远程自诊断应用提供了一套安全且可靠的解决方案,远程自诊断装置使用FPGA和PCIe等技术不仅实现了远程自诊断功能,而且还提供了对目标设备进行远程控制的功能。

Description

基于Atom平台的远程自诊断方法
技术领域
本发明涉及计算机远程控制及诊断方法的改进,具体指基于 Atom平台的远程自诊断方法,属于计算机应用领域。
背景技术
随着科技的发展,越来越多的人工作业被高效、精准的自动化设备替代,例如超市用于结算的POS机,汽车制造厂的自动化装配机等等。自动化设备在给人们带来便利的同时也体现出了它的局限性。例如管理人员只有等到设备使用人员主动通知才能得知设备发生了故障,而且即使只是很简单的故障,专业人员也只有到了现场才能对其进行分析和修复。
UEFI是Intel推出的新一代BIOS技术,旨在定义一套操作系统和平台固件之间完整的接口规范,为操作系统的引导提供标准环境。 UEFI是以32或64位CPU保护模式运行,突破了传统16位实模式代码的寻址能力,可达到CPU的最大寻址空间。PCIe总线是实现计算机与外围设备互联的第三代高性能I/O总线,它继承了PCI (Peripheral ComponentInterconnect,外设互联标准)总线结构的优点,并在软件层面上完全兼容PCI总线,从而简化了系统的升级成本。
目前,国内外对远程自诊断的解决方案主要有以下两类:
1)AMT:
Intel的AMT(Active Management Technology,主动管理技术)技术,实质上是一种集成在芯片组中的嵌入式系统,不依赖特定的操作系统,该技术允许维护人员远程管理和修复联网的计算机系统。目前,Intel还没有将其普及到所有处理器都能使用的程度,绝大多数嵌入式处理器都不在AMT技术的支持之列中,例如工业控制中常用的Atom处理器就无法使用AMT技术。
2)BMC:
BMC(Baseboard Management Controller,底板管理控制器),是一个专门的服务处理机,它利用传感器来监视一台计算机、网络服务器或者是其他硬件设备的状态,并且通过独立的连接线路和系统管理员进行通信。由于BMC的实现很复杂,只有少量公司有相关的产品,而且价格不菲,对于规模较小的企业来说,BMC的成本比最终产品获得的利润还要高很多倍。
综上,广大的中小型系统对现有的解决方案只能望而却步,然而中小型系统较大型系统,更贴近我们的日常生活,所以提高中小型系统的易维护性和可管理性,是进一步提高人民生活水平的必要保证。
发明内容
本发明针对现有解决方案的上述不足,利用UEFI等X86平台通用技术,提供一种基于Atom平台的远程自诊断装置及方法,为Atom 等X86平台构建一套安全、稳定、高效的远程自诊断解决方案。
本发明采用的具体技术方案如下:
一种基于Atom平台的远程故障自诊断装置,该装置包括基于 Atom平台的目标主机、计算机远程维护卡和打印机等其它外设。其中,计算机远程维护卡通过PCIe总线与基于Atom平台的目标主机相连,打印机等其它外设通过USB接口或者RS232接口连接到基于Atom平台的目标主机上。PCIe总线安全及稳定的特性,确保了本装置拥有良好的稳定性,除此之外,PCIe总线高带宽的特性也为本装置的后续功能扩展提供了保障。
一种基于Atom平台的远程故障自诊断方法,具体步骤为:
首先,根据基于Atom平台的目标主机运行环境,由运行于UEFI 环境中的UEFI自诊断程序或运行于操作系统环境中的自诊断程序,按照自诊断协议规定的方式与各外设进行通讯,获取各外设诊断信息。
然后,将诊断信息通过高速稳定的总线发送给远程维护装置,远程维护装置利用内部硬件加密模块对诊断信息进行加密后,将一份副本发送回自诊断程序。随后,两份加密后的诊断信息分别由远程维护装置和基于Atom平台的目标主机上的网络通信模块,发送到远端控制中心。
之后,远端控制中心根据两个通道收到诊断信息的情况,诊断基于Atom平台的目标主机是否发生宕机等故障,并进行相应报警。同时,控制中心还可以向远程维护装置发送相应的控制命令。
最后,远程维护装置根据接收到的控制命令,通过目标主机控制模块对宕机的目标主机进行重新启动等操作。
基于Atom平台的目标主机作为所述装置组成部件之一,起着关键作用,作为必备硬件基础,保障了运行于其上的自诊断程序能够正确无误的获取各外设诊断信息。另外,其自身的网络通信模块与计算机远程维护卡的网络通信模块一起,构成了双通道网络,为故障诊断提供了坚实保障。
计算机远程维护卡由PCIe通讯模块、中央处理模块、硬件加密模块、网络通信模块、目标系统主机控制模块和电源管理及时钟模块组成。计算机远程维护卡接收自诊断程序通过PCIe总线发送来的各外设诊断信息,经过硬件加密模块加密后,由网络通信模块发送到远端控制中心,目标系统主机控制模块负责按控制命令对基于 Atom平台的目标主机进行远程开机、关机等操作。
计算机远程维护卡部分功能基于FPGA实现,其中包括 MicroBlaze软核处理器、内存控制器、中断控制器、以太网MAC层控制器、硬件加密电路、时钟电路部分,各部分通过AXI总线互连。中央处理模块是计算机远程维护卡的核心部件,使用FPGA实现具有很大的灵活性,后续可以很轻松的扩展系统。
由于,所述硬件加密模块的加密算法是自行设计的,故,利用 FPGA技术实现硬件化之后的硬件加密电路,具有独一无二的特性。攻击者既不可能通过研究加密算法,对加密数据进行破解,也不可能通过反编译和单步调试加密模块,探索破解方法。
所述PCIe通讯模块包括物理层电路、数据链路层电路、传输层电路和配置空间电路,本装置使用Xilinx FPGA芯片内部实现了上述前三部分电路的PCIe硬核,搭配一个PCIe软核完成了安全、稳定、高速率的PCIe通讯模块。
所述目标系统主机控制模块,通过电子开关芯片控制基于Atom 平台目标主机的启动信号来实现远程开机和关机的操作。
相比现有技术,本发明具有如下有益效果:
1、本发明利用UEFI技术,在目标系统启动初期就可以发现故障,并及时通报控制中心,可大幅缩短故障发现的时间。
2、本发明可避免由于外部存储设备故障,无法正常加载操作系统而带来的不能正常运行基于操作系统的故障诊断。
3、本发明利用FPGA技术实现的硬件加密模块,保证了系统数据在网络通信中的安全性,提高了整体系统的健壮性及可靠性。
4、通过本发明中的计算机远程维护卡,控制中心的管理人员不需要亲自赶到故障现场,就可以处理仅需重新启动目标系统主机的简单故障,提高了管理人员的工作效率。
附图说明
图1为本发明基于Atom平台的远程故障自诊断方法的整体框图。
图2为本发明基于Atom平台的远程故障自诊断方法的计算机远程维护卡框图。
具体实施方式
如图1-2所示,一种基于Atom平台的远程故障自诊断装置整体上分为两大部分:目标系统诊断部分、控制中心部分。目标系统诊断部分是整个系统的核心组成部分,其中的自诊断程序包含基于 UEFI的远程自诊断程序和基于操作系统的远程自诊断程序两部分。当目标系统运行在UEFI阶段时,由基于UEFI的远程自诊断程序负责收集诊断信息并发送给控制中心,目标系统完成UEFI诊断后进入操作系统之后,诊断任务交由基于操作系统的远程自诊断程序负责。
本发明所进行的远程自诊断目标主要分为三类,分别是目标系统宕机诊断、目标系统关键部件健康状况诊断、打印机及读卡器等外设诊断。各部件遵循自诊断协议,相互配合共同实现了上述各类诊断工作。
下面结合附图1及实施实例对本发明中的各类诊断过程进行详细说明。
起初,目标系统在控制中心处显示为未启动状态。计算机远程维护卡启动之后,向控制中心发送信号使目标系统处于待启动状态。此时,远端的管理人员可以通过控制中心向目标系统发送启动命令,计算机远程维护卡收到命令后启动目标系统,除此之外,目标系统也可由本地操作员启动。
目标系统启动后首先进入UEFI环境并加载计算机远程维护卡 UEFI驱动,UEFI自诊断程序向控制中心发送UEFI环境正常信号,使目标系统处于UEFI启动状态。UEFI自诊断程序获取各外设诊断信息后,通过PCIe总线发送给计算机远程维护卡,计算机远程维护卡加密后通过其自身上的网络通信模块,将诊断信息发送到控制中心。控制中心对诊断信息进行分析,如果发现有故障发生,立即报警,若一切正常,就向目标系统发送继续启动命令。
目标系统的操作系统启动之后,自诊断程序使用前同样需要先加载计算机远程维护卡的驱动程序,加载成功后,自诊断程序通过自身网络通信模块和计算机远程维护卡上的网络通信模块组成的双通道网络,向控制中心发送操作系统环境正常信号,使目标系统处于操作系统启动状态。
所有必备条件都就绪后,下面对各类诊断进行详细说明:
1.目标系统宕机诊断
自诊断程序通过PCIe总线将诊断信息发给计算机远程维护卡,由图2中所示的计算机远程维护卡PCIe通讯模块成功接收后,利用内部硬件加密模块进行加密,加密后的诊断信息不仅会通过计算机远程维护卡的网络通信模块发送给控制中心,而且还会通过PCIe总线发送一份加密后的诊断信息副本,自诊断程序接收后,通过目标系统主板上的网络通信模块,发送到控制中心。
如果控制中心没有收到任何一个通道传来的诊断信息,便可以判断目标系统出现了宕机的情况。如果控制中心收到了计算机远程维护卡发送来的诊断信息,却没有收到目标系统主板上的网络通信模块发来的诊断信息,便可以判断目标系统主板上的网络通信模块发生了故障,但是目标系统并没有宕机。
双通道的好处在于,避免了控制中心把目标系统主板上网络通信模块的故障,当作目标系统宕机进行处理的情况,增强了本发明的准确性和可靠性。
2.目标系统关键部件健康状况诊断
自诊断程序获取目标系统CPU和主板的温度、风扇的转速以及可用内存容量,并将结果通过网络发送到控制中心,控制中心对数据进行判断,如果出现CPU或主板温度太高、风扇停止以及无可用内存的情况,立即进行故障报警。
获取关键部件健康状况数据需要直接访问I/O地址,由于操作系统中的应用程序不允许直接访问物理地址,所以需要通过一个特定的驱动程序获得相关数据,然后传给应用层的自诊断程序。
3.打印机及读卡器等外设诊断
自诊断程序以自诊断程序设定的诊断时间,周期性的向各外设发送诊断指令,各外设将相应的诊断信息回复给自诊断程序,如果自诊断程序连续三次没有收到某外设的回复,即断定相应外设没有正确连接。
打印机的诊断信息包括是否正常连接和是否缺纸,客户显示器的诊断信息只包含是否正常连接,读卡器的诊断信息除了是否正常连接外,还包括是否成功读取到卡片信息。
自诊断程序不断的将获取到的外设诊断信息,通过双通道网络发送到控制中心,控制中心对已显示的各数据进行更新之后,若发现有外设故障发生,还会进行相应的报警处理。
如图1中所示,控制中心还可以通过发送维护命令,远程对目标系统进行开机、关机和重新启动操作。如果目标系统运行正常,控制中心发送维护命令给自诊断程序,由自诊断程序完成相应操作。若目标系统已经处于宕机状态,控制中心发送维护命令给计算机远程维护卡,由计算机远程维护卡上的目标主机控制模块完成相应操作。

Claims (5)

1.一种基于Atom平台的远程故障自诊断方法,使用一种基于Atom平台的远程故障自诊断装置,该装置包括基于Atom平台的目标主机、计算机远程维护卡和外设;其中,计算机远程维护卡通过PCIe总线与基于Atom平台的目标主机相连,外设通过USB接口或者RS232接口连接到基于Atom平台的目标主机上;
其特征在于:该方法具体步骤如下,
首先,根据基于Atom平台的目标主机运行环境,由运行于UEFI环境中的UEFI自诊断程序或运行于操作系统环境中的自诊断程序,按照自诊断协议规定的方式与各外设进行通讯,获取各外设诊断信息;
然后,将诊断信息通过高速稳定的PCIe总线发送给计算机远程维护卡,计算机远程维护卡利用内部硬件加密模块对诊断信息进行加密后,将一份副本发送回自诊断程序;随后,两份加密后的诊断信息分别由计算机远程维护卡和基于Atom平台的目标主机上的网络通信模块,发送到远端控制中心;
之后,远端控制中心根据两个通道收到诊断信息的情况,诊断基于Atom平台的目标主机是否发生宕机故障,并进行相应报警;同时,远程控制中心还向计算机远程维护卡发送相应的控制命令;
最后,计算机远程维护卡根据接收到的控制命令,通过目标主机控制模块对宕机的目标主机进行重新启动操作;
基于Atom平台的目标主机自身网络通信模块与计算机远程维护卡的网络通信模块一起,构成了双通道网络。
2.根据权利要求1所述的一种基于Atom平台的远程故障自诊断方法,其特征在于:计算机远程维护卡由PCIe通讯模块、中央处理模块、硬件加密模块、网络通信模块、目标主机控制模块和电源管理及时钟模块组成;计算机远程维护卡接收自诊断程序通过PCIe总线发送来的各外设诊断信息,经过硬件加密模块加密后,由网络通信模块发送到远端控制中心,目标主机控制模块负责按控制命令对基于Atom平台的目标主机进行远程开机、关机操作。
3.根据权利要求1所述的一种基于Atom平台的远程故障自诊断方法,其特征在于:计算机远程维护卡基于FPGA实现,其中包括MicroBlaze软核处理器、内存控制器、中断控制器、以太网MAC层控制器、硬件加密电路、时钟电路部分,各部分通过AXI总线互连。
4.根据权利要求2所述的一种基于Atom平台的远程故障自诊断方法,其特征在于:所述PCIe通讯模块包括物理层电路、数据链路层电路、传输层电路和配置空间电路,使用XilinxFPGA芯片内部实现了物理层电路、数据链路层电路、传输层电路和配置空间电路的PCIe硬核,搭配一个PCIe软核完成了安全、稳定、高速率的PCIe通讯模块。
5.根据权利要求1所述的一种基于Atom平台的远程故障自诊断方法,其特征在于:所述目标主机控制模块,通过电子开关芯片控制基于Atom平台目标主机的启动信号来实现远程开机和关机的操作。
CN201510036789.0A 2015-01-25 2015-01-25 基于Atom平台的远程自诊断方法 Expired - Fee Related CN104571098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510036789.0A CN104571098B (zh) 2015-01-25 2015-01-25 基于Atom平台的远程自诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510036789.0A CN104571098B (zh) 2015-01-25 2015-01-25 基于Atom平台的远程自诊断方法

Publications (2)

Publication Number Publication Date
CN104571098A CN104571098A (zh) 2015-04-29
CN104571098B true CN104571098B (zh) 2017-12-15

Family

ID=53087424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510036789.0A Expired - Fee Related CN104571098B (zh) 2015-01-25 2015-01-25 基于Atom平台的远程自诊断方法

Country Status (1)

Country Link
CN (1) CN104571098B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105955899B (zh) * 2016-04-22 2019-01-11 西安电子科技大学 基于全固态半导体存储器阵列的雷达数字信号处理装置
CN106154906B (zh) * 2016-05-03 2019-11-29 北京光年无限科技有限公司 面向智能操作系统的故障报告方法及机器人操作系统
CN106872907B (zh) * 2017-03-20 2019-08-09 湖南农业大学 基于遥控启动的故障诊断方法及其系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201126570Y (zh) * 2007-10-24 2008-10-01 华南农业大学 一种计算机故障远程诊断装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE520919C2 (sv) * 1999-12-29 2003-09-16 Volvo Technology Corp System och metod för kommunikation mellan en central station och ett på avstånd beläget objekt
CN1508689A (zh) * 2002-12-19 2004-06-30 联想(北京)有限公司 一种远程获取被监控计算机信息的系统和方法
JP5759773B2 (ja) * 2011-04-01 2015-08-05 株式会社日立製作所 モニタリングシステム、通信装置、通信制御方法
CN103618759A (zh) * 2013-10-31 2014-03-05 上海交通大学 一种基于云服务的远程桌面计算机唤醒方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201126570Y (zh) * 2007-10-24 2008-10-01 华南农业大学 一种计算机故障远程诊断装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于Atom 的移动装置远程监控系统设计";李建 等;《计算机系统应用》;20101231;第19卷(第4期);第5-8页 *

Also Published As

Publication number Publication date
CN104571098A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
TWI618380B (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
TWI446161B (zh) 處理一多處理器資訊處理系統之一故障處理器的裝置及方法
US9934187B2 (en) Hot-pluggable computing system
US6889341B2 (en) Method and apparatus for maintaining data integrity using a system management processor
CN100504798C (zh) 处理器故障隔离的方法和装置
US20150106660A1 (en) Controller access to host memory
TWI632462B (zh) 開關裝置及偵測積體電路匯流排之方法
CN100375960C (zh) 用于调试输入/输出故障的方法和系统
CN106155970B (zh) 自动硬件恢复方法及自动硬件恢复系统
US10678623B2 (en) Error reporting and handling using a common error handler
WO2012158765A2 (en) System and method for accessing operating system and hypervisors via a service processor of a server
US20060242453A1 (en) System and method for managing hung cluster nodes
TWI632467B (zh) 運算裝置及用於運算裝置中之方法
US20080270827A1 (en) Recovering diagnostic data after out-of-band data capture failure
CN107111595B (zh) 用于检测早期引导错误的方法、设备及系统
CN104899109A (zh) 一种操作系统下获取cpu温度的方法
CN103136048A (zh) 计算机系统
KR100376939B1 (ko) 통신망을 통한 원격 사후관리 방법 및 이를 이용한전자제품의 사후관리시스템
CN104077203A (zh) 一种可经由usb接口实现计算机硬件诊断的方法及装置
CN104571098B (zh) 基于Atom平台的远程自诊断方法
US7552371B2 (en) Method and system for automatically diagnosing disability of computer peripheral devices
CN102253845A (zh) 服务器系统
TWI791913B (zh) 經由邊帶介面恢復場域可程式閘陣列韌體之系統及方法
TW202343237A (zh) 資料中心安全控制模組及其控制方法
CN103178977A (zh) 计算机系统及计算机系统的开机管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171215

Termination date: 20210125

CF01 Termination of patent right due to non-payment of annual fee