CN113553243A - 远端侦错方法 - Google Patents

远端侦错方法 Download PDF

Info

Publication number
CN113553243A
CN113553243A CN202010332224.8A CN202010332224A CN113553243A CN 113553243 A CN113553243 A CN 113553243A CN 202010332224 A CN202010332224 A CN 202010332224A CN 113553243 A CN113553243 A CN 113553243A
Authority
CN
China
Prior art keywords
remote
host
warning signal
storage unit
debugging method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010332224.8A
Other languages
English (en)
Inventor
张晏晟
梁进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jabil Circuit Shanghai Ltd
Original Assignee
Jabil Circuit Shanghai Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jabil Circuit Shanghai Ltd filed Critical Jabil Circuit Shanghai Ltd
Priority to CN202010332224.8A priority Critical patent/CN113553243A/zh
Priority to US17/233,853 priority patent/US20210334153A1/en
Publication of CN113553243A publication Critical patent/CN113553243A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0778Dumping, i.e. gathering error/state information after a fault for later diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种远端侦错方法包含:通过服务主机的储存单元储存相关于所述服务主机的错误记录收集资讯,所述储存单元对应基板管理控制器;通过所述基板管理控制器判断多个设定触发事件的其中任一者发生时,产生警告信号,并将所述警告信号传送至远端主机;当所述远端主机接收到所述警告信号时,取得并储存所述储存单元的所述错误记录收集资讯;使得工程人员通过所述错误记录收集资讯即能在所述远端主机执行侦错且修正。

Description

远端侦错方法
技术领域
本发明涉及一种侦错方法,特别是指一种提供工程人员在远端执行的远端侦错方法。
背景技术
随着网路技术的发展,设置有大量服务主机的电脑机房以提供各种网路服务的需求也应运而生。举例来说,同一个电脑机房可以设置超过上百台的服务主机。现有的侦错方法是:通过所述电脑机房的所述服务主机的基板管理控制器(Baseboard ManagementController,BMC)事先设定各种触发事件(Event),如风扇转速异常低、风扇停止运转、服务主机被关闭(Shut down)、各种温度感测器的温度过高等等,当任何所述任何一个触发事件发生时,对应的所述基板管理控制器会通过网路连线的方式,将警告讯息传送至远端主机,如另一台服务主机或电脑主机。也就是说,当所述电脑机房的其中一台服务主机发生执行异常的情况时,在所述远端主机的工程人员能够通过所述警告讯息而获悉,进而亲自前往所述电脑机房,以针对对应所述警告讯息的所述服务主机执行侦错。然而,现有的侦错方法仅能达到警告通知的效果,且工程人员在大量的服务主机间搜寻对应的主机位置也相当不便,因此,如何改善电脑机房的多个服务主机的侦错方式便成为一个待解决的问题。
发明内容
本发明的目的在于提供一种提供工程人员在远端执行的远端侦错方法。
于是,本发明提供一种远端侦错方法,适用于服务主机及远端主机,所述服务主机包含基板管理控制器及对应所述基板管理控制器的储存单元,所述远端侦错方法包含步骤(a)~(c)。
于步骤(a),通过所述储存单元储存相关于所述服务主机的错误记录收集资讯。
于步骤(b),通过所述基板管理控制器判断多个设定触发事件的其中任一者发生时,产生警告信号,并将所述警告信号传送至所述远端主机。
于步骤(c),当所述远端主机接收到所述警告信号时,取得并储存所述储存单元的所述错误记录收集资讯。
在一些实施例中,其中,在步骤(a)中,所述错误记录收集资讯包含智慧型平台管理(Intelligent Platform Management Interface,IPMI)协议(Protocol)的输出资料、基本输入输出系统(BIOS)的开机记录(Log)、嵌入式系统(Embedded system)的运行记录(Runtime log)、及所述基板管理控制器的内部记录资讯的其中至少一者。
在一些实施例中,其中,在步骤(b)中,所述触发事件相关于所述服务主机的异常运作情形。
在一些实施例中,其中,在步骤(b)中,所述警告信号对应所述设定触发事件,使得所述远端主机根据接收到的所述警告信号,获得对应的所述设定触发事件。
在一些实施例中,其中,所述远端侦错方法还包含在步骤(a)、(b)间的步骤(d),所述远端主机将触发设定选项传送至所述服务主机,所述服务主机的所述基板管理控制器根据所述触发设定选项,选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件。在步骤(c)中,当所述远端主机接收到所述警告信号时,所述远端主机通过所述基板管理控制器下载所述储存单元所储存的所述错误记录收集资讯。
在另一些实施例中,其中,在步骤(b)中,所述服务主机的所述基板管理控制器是事先选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件。在步骤(c)中,当所述远端主机接收到所述警告信号时,所述远端主机通过所述基板管理控制器下载所述储存单元所储存的所述错误记录收集资讯。
在另一些实施例中,其中,在步骤(b)中,所述警告信号是“BroadcastRsyslog”、“Pre-config IP Rsyslog”、“Redfish Notification”、及“IPMI SELtrap”的其中一种指令。
在另一些实施例中,其中,所述远端侦错方法还包含在步骤(a)、(b)间的步骤(d),所述远端主机将触发设定选项传送至所述服务主机,所述服务主机的所述基板管理控制器根据所述触发设定选项,选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件。在步骤(c)中,当所述远端主机接收到所述警告信号时,所述服务端主机的所述基板管理控制器将所述储存单元所储存的所述错误记录收集资讯上传至所述远端主机。
在另一些实施例中,其中,在步骤(b)中,所述服务主机的所述基板管理控制器是事先选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件。在步骤(c)中,当所述远端主机接收到所述警告信号时,所述服务端主机的所述基板管理控制器将所述储存单元所储存的所述错误记录收集资讯上传至所述远端主机。
在另一些实施例中,其中,在步骤(b)中,所述警告信号是“TFTP server”、“Redfish oem schema”、“SFTP”、及“IPMI oem command”的其中一种指令。
本发明的有益的效果在于:通过所述储存单元先储存相关于所述服务主机的错误记录收集资讯,再通过所述基板管理控制器在判断所述设定触发事件发生时,产生所述警告信号以通知所述远端主机,使得所述远端主机接在收到所述警告信号时,取得并储存所述储存单元的所述错误记录收集资讯,进而使得工程人员通过所述错误记录收集资讯即能在所述远端主机执行侦错且修正。
附图说明
图1是一个示意图,说明本发明远端侦错方法所适用的一个服务主机及一个远端主机;及
图2是一个流程图,说明本发明远端侦错方法的一个第一实施例及第二实施例;及
图3是一个流程图,说明本发明远端侦错方法的一个第三实施例及第四实施例。
具体实施方式
下面结合附图及实施例对本发明进行详细说明。
在本发明被详细描述的前,应当注意在以下的说明内容中,类似的元件是以相同的编号来表示。
参阅图1与图2,本发明远端侦错方法的一个第一实施例,适用于一个服务主机1及一个远端主机2,所述服务主机1包含一个基板管理控制器(Baseboard managementcontroller,BMC)11及对应所述基板管理控制器11的一个储存单元12。所述服务主机1例如是设置于电脑机房的多个服务器(Server)的其中任一个。所述储存单元12例如是快闪记忆体(Flash),并电连接所述基板管理控制器11,以提供所述基板管理控制器11存取使用。所述远端主机2能够与所述服务主机1的所述基板管理控制器11建立连线。
所述远端侦错方法包含步骤S1~S4。
于步骤S1,通过所述储存单元12储存相关于所述服务主机1的一个错误记录收集(Error log collection,ELC)资讯。更详细地说,所述错误记录收集资讯是由所述服务主机1的中央处理器(CPU)及所述基板管理控制器11在执行的过程中而产生,并储存于所述储存单元12。
所述错误记录收集资讯包含一个智慧型平台管理(Intelligent PlatformManagement Interface,IPMI)协议(Protocol)的输出资料、一个基本输入输出系统(BIOS)的开机记录(Log)、一个嵌入式系统(Embedded system)的运行记录(Runtime log)、及所述基板管理控制器11的一个内部记录资讯的其中至少一者。
举例来说,所述智慧型平台管理协议的输出资料包括“channel_cipher_ipmi”、“channel_cipher_sol”、“channel_info”、“chassis_status”、“firewall_info”、“fru”、“mc_getenables”、“mc_guid”、“mc_info”、“mc_wdt”、“pef_info”、“pef_list”、“sdr_elist”、“sdr_info”、“sel_elist”、“sel_info”、“sensors”、“session_active”、“sol_info”、“user_list”、“user_summary”等等,用于提供工程人员了解所述服务主机1的相关状态。所述基本输入输出系统的开机记录包括“SOLHostCapture”、“SOLHostCapture.log.1”等等,用于提供工程人员分析所述基本输入输出系统在开机过程中的任何错误讯息及相关错误的前因后果。所述嵌入式系统的运行记录包括“rt_cpuinfo”、“rt_filesystems”、“rt_ifconfig”、“rt_interrupts”、“rt_iomem”、“rt_locks”、“rt_meminfo”、“rt_mtd”、“rt_pagetypeinfo”、“rt_postcode”、“rt_ps”、“rt_top”、“rt_vmallocinfo”、“rt_vmstat”、“rt_zoneinfo”等等,用于提供工程人员知悉所述基板管理控制器11的状况,进而了解错误或异常发生时是否源自于所述基板管理控制器11的内部系统的问题。所述基板管理控制器11的所述内部记录资讯包括相关网页页面(Webpage)记录、远端登入的权限修改记录、及其他各种相关的记录等等。
于步骤S2,所述储存单元12还预先储存多个候选触发事件。所述远端主机2将一个触发设定选项传送至所述服务主机1,所述服务主机1的所述基板管理控制器11根据所述触发设定选项,选择预先储存的所述候选触发事件的其中部分者作为多个设定触发事件。另外要特别补充说明的是:也可以选择其中一个或全部作为一个或多个设定触发事件。所述候选触发事件及所述设定触发事件是相关于所述服务主机1的异常运作情形,并例如是风扇转速异常低、风扇停止运转、服务主机1被关闭(Shut down)、各种温度感测器的温度过高等等,但不以此为限。
于步骤S3,通过所述基板管理控制器11判断所述设定触发事件的其中任一者发生时产生一个警告信号,并将所述警告信号传送至所述远端主机2。此外,所述警告信号对应所述设定触发事件,使得所述远端主机2根据接收到的所述警告信号,获得对应的所述设定触发事件。举例来说,所述设定触发事件的其中一个是风扇停止运转,当所述基板管理控制器11判断所述服务主机1的其中一个风扇停止运转时,则产生所述警告信号。
于步骤S4,当所述远端主机2接收到所述警告信号时,所述远端主机2通过所述基板管理控制器11下载所述储存单元12所储存的所述错误记录收集资讯。换句话说,不论所述设定触发事件是否发生,步骤S1的所述错误记录收集资讯都会因为所述服务主机1的中央处理器及所述基板管理控制器11在执行过程中因为特定错误发生而持续被收集而产生记录,也就是完整的所有错误记录。但当所述远端主机2接收到所述警告信号时,则所述远端主机2能够下载而获得所有错误记录的所述错误记录收集资讯。
本发明远端侦错方法的第二实施例大致上与所述第一实施例相同,不同的地方在于:省略步骤S2,且在步骤S3中,所述服务主机1的所述基板管理控制器11是事先选择预先储存的所述候选触发事件的其中部分者作为所述设定触发事件。
参阅图1与图3,本发明远端侦错方法的一个第三实施例,大致上与所述第一实施例相同,不同的地方在于:在步骤S4中,当所述远端主机2接收到所述警告信号时,所述服务端主机的所述基板管理控制器11将所述储存单元12所储存的所述错误记录收集资讯上传至所述远端主机2。
本发明远端侦错方法的第四实施例大致上与所述第三实施例相同,不同的地方在于:省略步骤S2,且在步骤S3中,所述服务主机1的所述基板管理控制器11是事先选择预先储存的所述候选触发事件的其中部分者作为所述设定触发事件。。
另外要特别补充说明的是:另外要特别说明的是:在所述第一实施例及所述第二实施例中,在步骤S3中,所述警告信号例如是“Broadcast Rsyslog”、“Pre-config IPRsyslog”、“Redfish Notification”、及“IPMI SEL trap”的其中一种指令。在所述第三实施例及所述第四实施例中,在步骤S3中,所述警告信号例如是“TFTP server”、“Redfishoem schema”、“SFTP”、及“IPMI oem command”的其中一种指令。
综上所述,通过所述储存单元12先储存相关于所述服务主机1的错误记录收集资讯,再通过所述基板管理控制器11在判断所述设定触发事件发生时,产生所述警告信号以通知所述远端主机2,使得所述远端主机2接在收到所述警告信号时,取得并储存所述储存单元12的所述错误记录收集资讯,进而使得工程人员通过所述错误记录收集资讯即能在所述远端主机2获悉所述服务主机1的所有侦错有关资讯以执行侦错且修正,所以确实能达成本发明的目的。
惟以上所述者,仅为本发明的实施例而已,当不能以此限定本发明实施的范围,即大凡依本发明权利要求书及专利说明书内容所作的简单的等效变化与修饰,皆仍属本发明专利涵盖的范围内。

Claims (10)

1.一种远端侦错方法,适用于服务主机及远端主机,所述服务主机包含基板管理控制器及对应所述基板管理控制器的储存单元,其特征在于,所述远端侦错方法包含:
(a)通过所述储存单元储存相关于所述服务主机的错误记录收集资讯;
(b)通过所述基板管理控制器判断多个设定触发事件的其中任一者发生时,产生警告信号,并将所述警告信号传送至所述远端主机;及
(c)当所述远端主机接收到所述警告信号时,取得并储存所述储存单元的所述错误记录收集资讯。
2.根据权利要求1所述的远端侦错方法,其特征在于,在步骤(a)中,所述错误记录收集资讯包含智慧型平台管理协议的输出资料、基本输入输出系统的开机记录、嵌入式系统的运行记录、及所述基板管理控制器的内部记录资讯的其中至少一者。
3.根据权利要求2所述的远端侦错方法,其特征在于,在步骤(b)中,所述触发事件相关于所述服务主机的异常运作情形。
4.根据权利要求3所述的远端侦错方法,其特征在于,在步骤(b)中,所述警告信号对应所述设定触发事件,使得所述远端主机根据接收到的所述警告信号,获得对应的所述设定触发事件。
5.根据权利要求4所述的远端侦错方法,其特征在于,
所述远端侦错方法还包含在步骤(a)、(b)间的步骤(d),所述远端主机将触发设定选项传送至所述服务主机,所述服务主机的所述基板管理控制器根据所述触发设定选项,选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件;及
在步骤(c)中,当所述远端主机接收到所述警告信号时,所述远端主机通过所述基板管理控制器下载所述储存单元所储存的所述错误记录收集资讯。
6.根据权利要求4所述的远端侦错方法,其特征在于,
在步骤(b)中,所述服务主机的所述基板管理控制器是事先选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件;及
在步骤(c)中,当所述远端主机接收到所述警告信号时,所述远端主机通过所述基板管理控制器下载所述储存单元所储存的所述错误记录收集资讯。
7.根据权利要求5或6所述的远端侦错方法,其特征在于,在步骤(b)中,所述警告信号是Broadcast Rsyslog、Pre-config IP Rsyslog、Redfish Notification、及IPMI SELtrap的其中一种指令。
8.根据权利要求4所述的远端侦错方法,其特征在于,
所述远端侦错方法还包含在步骤(a)、(b)间的步骤(d),所述远端主机将触发设定选项传送至所述服务主机,所述服务主机的所述基板管理控制器根据所述触发设定选项,选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件;及
在步骤(c)中,当所述远端主机接收到所述警告信号时,所述服务端主机的所述基板管理控制器将所述储存单元所储存的所述错误记录收集资讯上传至所述远端主机。
9.根据权利要求4所述的远端侦错方法,其特征在于,
在步骤(b)中,所述服务主机的所述基板管理控制器是事先选择预先储存的多个候选触发事件的其中部分者作为所述设定触发事件;及
在步骤(c)中,当所述远端主机接收到所述警告信号时,所述服务端主机的所述基板管理控制器将所述储存单元所储存的所述错误记录收集资讯上传至所述远端主机。
10.根据权利要求8或9所述的远端侦错方法,其特征在于,在步骤(b)中,所述警告信号是TFTP server、Redfish oem schema、SFTP、及IPMI oem command的其中一种指令。
CN202010332224.8A 2020-04-24 2020-04-24 远端侦错方法 Pending CN113553243A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010332224.8A CN113553243A (zh) 2020-04-24 2020-04-24 远端侦错方法
US17/233,853 US20210334153A1 (en) 2020-04-24 2021-04-19 Remote error detection method adapted for a remote computer device to detect errors that occur in a service computer device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010332224.8A CN113553243A (zh) 2020-04-24 2020-04-24 远端侦错方法

Publications (1)

Publication Number Publication Date
CN113553243A true CN113553243A (zh) 2021-10-26

Family

ID=78129603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010332224.8A Pending CN113553243A (zh) 2020-04-24 2020-04-24 远端侦错方法

Country Status (2)

Country Link
US (1) US20210334153A1 (zh)
CN (1) CN113553243A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11403162B2 (en) * 2019-10-17 2022-08-02 Dell Products L.P. System and method for transferring diagnostic data via a framebuffer
CN116225825A (zh) * 2022-12-06 2023-06-06 宁畅信息产业(北京)有限公司 一种传感器故障状态监测方法及监测装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1869949A (zh) * 2005-05-27 2006-11-29 佛山市顺德区顺达电脑厂有限公司 远程系统侦错方法
CN101902355A (zh) * 2009-05-27 2010-12-01 宏正自动科技股份有限公司 服务器、计算机系统及计算机系统的监控方法
CN102055615A (zh) * 2009-10-28 2011-05-11 英业达股份有限公司 服务器监控方法
CN102082781A (zh) * 2009-11-27 2011-06-01 宏正自动科技股份有限公司 服务器管理系统及其方法
JP2012198796A (ja) * 2011-03-22 2012-10-18 Nec Corp ログ収集システム、装置、方法及びプログラム
CN104639380A (zh) * 2013-11-07 2015-05-20 英业达科技有限公司 服务器监控方法
TW201724810A (zh) * 2015-12-16 2017-07-01 Jeh-Chow Information Co Ltd 雲端監控的警示設備
CN109947616A (zh) * 2019-02-11 2019-06-28 北京国电通网络技术有限公司 一种基于OpenStack技术的云操作系统的自动化监控运维系统
CN110008093A (zh) * 2019-04-30 2019-07-12 昆山聚贝机械设计有限公司 计算机远程监控系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7457872B2 (en) * 2003-10-15 2008-11-25 Microsoft Corporation On-line service/application monitoring and reporting system
CA2712002C (en) * 2009-09-09 2016-08-30 Aastra Technologies Limited Diagnostics methods for a communications device
US8655336B1 (en) * 2011-09-29 2014-02-18 Cellco Partnership Remote issue logging and reporting of mobile station issues and diagnostic information to manufacturer
US9954727B2 (en) * 2015-03-06 2018-04-24 Quanta Computer Inc. Automatic debug information collection
JP6957936B2 (ja) * 2017-03-31 2021-11-02 日本電気株式会社 障害解析装置、障害解析方法および障害解析プログラム
US10795750B2 (en) * 2017-06-04 2020-10-06 Apple Inc. Auto bug capture
US11231944B2 (en) * 2018-10-29 2022-01-25 Alexander Permenter Alerting, diagnosing, and transmitting computer issues to a technical resource in response to a dedicated physical button or trigger
CN110096408A (zh) * 2019-03-11 2019-08-06 中国平安人寿保险股份有限公司 告警监测方法、装置、电子设备及计算机可读存储介质
CN110489260B (zh) * 2019-07-31 2023-03-24 新华三技术有限公司成都分公司 故障识别方法、装置及bmc
CN110851320A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种服务器宕机监管方法、系统、终端及存储介质
US11176020B2 (en) * 2019-11-05 2021-11-16 Microsoft Technology Licensing, Llc Server status monitoring system and method using baseboard management controller

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1869949A (zh) * 2005-05-27 2006-11-29 佛山市顺德区顺达电脑厂有限公司 远程系统侦错方法
CN101902355A (zh) * 2009-05-27 2010-12-01 宏正自动科技股份有限公司 服务器、计算机系统及计算机系统的监控方法
CN102055615A (zh) * 2009-10-28 2011-05-11 英业达股份有限公司 服务器监控方法
CN102082781A (zh) * 2009-11-27 2011-06-01 宏正自动科技股份有限公司 服务器管理系统及其方法
JP2012198796A (ja) * 2011-03-22 2012-10-18 Nec Corp ログ収集システム、装置、方法及びプログラム
CN104639380A (zh) * 2013-11-07 2015-05-20 英业达科技有限公司 服务器监控方法
TW201724810A (zh) * 2015-12-16 2017-07-01 Jeh-Chow Information Co Ltd 雲端監控的警示設備
CN109947616A (zh) * 2019-02-11 2019-06-28 北京国电通网络技术有限公司 一种基于OpenStack技术的云操作系统的自动化监控运维系统
CN110008093A (zh) * 2019-04-30 2019-07-12 昆山聚贝机械设计有限公司 计算机远程监控系统

Also Published As

Publication number Publication date
US20210334153A1 (en) 2021-10-28

Similar Documents

Publication Publication Date Title
US9658914B2 (en) Troubleshooting system using device snapshots
US10037238B2 (en) System and method for encoding exception conditions included at a remediation database
US9471474B2 (en) Cloud deployment infrastructure validation engine
US7340649B2 (en) System and method for determining fault isolation in an enterprise computing system
EP2472402B1 (en) Remote management systems and methods for mapping operating system and management controller located in a server
US9176803B2 (en) Collecting data from a system in response to an event based on an identification in a file of the data to collect
US11706080B2 (en) Providing dynamic serviceability for software-defined data centers
US7788520B2 (en) Administering a system dump on a redundant node controller in a computer system
US20140122931A1 (en) Performing diagnostic tests in a data center
US20080294764A1 (en) Storage medium bearing hba information provision program, hba information provision method and hba information provision apparatus
US20060130071A1 (en) Method, system and program product for correlating data between operating environments
US9577903B2 (en) Monitoring activity on a computer
US20120136970A1 (en) Computer system and method for managing computer device
CN113553243A (zh) 远端侦错方法
JP5425720B2 (ja) 仮想化環境監視装置とその監視方法およびプログラム
US8688830B2 (en) Abstracting storage views in a network of computing systems
US20080216057A1 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
US11237892B1 (en) Obtaining data for fault identification
US11144487B1 (en) Method to overload hardware pin for improved system management
US20200137062A1 (en) Remote access controller support registration system
CN112084049B (zh) 用于监控基板管理控制器的常驻程序的方法
US20240283720A1 (en) Abnormal recording system and the method for network gateway
CN118550747A (zh) 一种PCIe致命错误的快速定位方法、系统、电子设备及介质
CN118282860A (zh) 文件采集方法、装置及系统
CN118550604A (zh) 配置文件管理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination